CN101855345A - 用于增强含纤维素材料的降解或转化的组合物和方法 - Google Patents

用于增强含纤维素材料的降解或转化的组合物和方法 Download PDF

Info

Publication number
CN101855345A
CN101855345A CN200880024110A CN200880024110A CN101855345A CN 101855345 A CN101855345 A CN 101855345A CN 200880024110 A CN200880024110 A CN 200880024110A CN 200880024110 A CN200880024110 A CN 200880024110A CN 101855345 A CN101855345 A CN 101855345A
Authority
CN
China
Prior art keywords
seq
polypeptide
sequence
mature polypeptide
amino acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN200880024110A
Other languages
English (en)
Inventor
基思·麦克法兰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Novozymes Inc
Original Assignee
Novozymes Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Novozymes Inc filed Critical Novozymes Inc
Priority to CN201510280545.7A priority Critical patent/CN104962537A/zh
Publication of CN101855345A publication Critical patent/CN101855345A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/06Ethanol, i.e. non-beverage
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P13/00Preparation of nitrogen-containing organic compounds
    • C12P13/04Alpha- or beta- amino acids
    • C12P13/20Aspartic acid; Asparagine
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2434Glucanases acting on beta-1,4-glucosidic bonds
    • C12N9/2437Cellulases (3.2.1.4; 3.2.1.74; 3.2.1.91; 3.2.1.150)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2434Glucanases acting on beta-1,4-glucosidic bonds
    • C12N9/2445Beta-glucosidase (3.2.1.21)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/14Preparation of compounds containing saccharide radicals produced by the action of a carbohydrase (EC 3.2.x), e.g. by alpha-amylase, e.g. by cellulase, hemicellulase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P5/00Preparation of hydrocarbons or halogenated hydrocarbons
    • C12P5/02Preparation of hydrocarbons or halogenated hydrocarbons acyclic
    • C12P5/023Methane
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/06Ethanol, i.e. non-beverage
    • C12P7/08Ethanol, i.e. non-beverage produced as by-product or from waste or cellulosic material substrate
    • C12P7/10Ethanol, i.e. non-beverage produced as by-product or from waste or cellulosic material substrate substrate containing cellulosic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/06Ethanol, i.e. non-beverage
    • C12P7/14Multiple stages of fermentation; Multiple types of microorganisms or re-use of microorganisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/24Preparation of oxygen-containing organic compounds containing a carbonyl group
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/24Preparation of oxygen-containing organic compounds containing a carbonyl group
    • C12P7/26Ketones
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01004Cellulase (3.2.1.4), i.e. endo-1,4-beta-glucanase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01021Beta-glucosidase (3.2.1.21)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01091Cellulose 1,4-beta-cellobiosidase (3.2.1.91)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P2201/00Pretreatment of cellulosic or lignocellulosic material for subsequent enzymatic treatment or hydrolysis
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P2203/00Fermentation products obtained from optionally pretreated or hydrolyzed cellulosic or lignocellulosic material as the carbon source
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E50/00Technologies for the production of fuel of non-fossil origin
    • Y02E50/10Biofuels, e.g. bio-diesel
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E50/00Technologies for the production of fuel of non-fossil origin
    • Y02E50/30Fuel from waste, e.g. synthetic alcohol or diesel
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P20/00Technologies relating to chemical industry
    • Y02P20/50Improvements relating to the production of bulk chemicals
    • Y02P20/52Improvements relating to the production of bulk chemicals using catalysts, e.g. selective catalysts

Abstract

本发明涉及用于降解或转化含纤维素材料的方法,其包括:用有效量的纤维素分解酶组合物处理含纤维素材料,该纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽和选自下组中的一种或多种(几种)组份:具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性和纤维素结合域的CEL7多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。本发明还涉及这类纤维素分解酶组合物。

Description

用于增强含纤维素材料的降解或转化的组合物和方法
序列表参考
本申请包括计算机可读形式的序列表。在此将该序列表引入作为参考。
生物材料保藏参考
本申请包括生物材料保藏参考,并在将其引入作为参考。
发明背景
发明领域
本发明涉及用于降解或转化含纤维素材料和用于从含纤维素材料生产物质的组合物和方法。
相关领域描述
纤维素是简单糖类葡萄糖通过β-1,4-键共价键合的聚合物。许多微生物产生水解β-连接的葡聚糖的酶。这些酶包括内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶。内切葡聚糖酶在随机位置消化纤维素聚合物,将其打开(openingit)以受到纤维二糖水解酶攻击(attack)。纤维二糖水解酶继而从纤维素聚合物的末端释放纤维二糖的分子。纤维二糖是水溶性的β-1,4-连接的葡萄糖二聚体。β-葡糖苷酶将纤维二糖水解成葡萄糖。
将纤维素原料转化为乙醇具有以下优势:大量原料现成可用,避免燃烧或填埋材料的愿望,和乙醇燃料的清洁性。木材、农业残余物、草本作物和城市固体废物已被认为是用于乙醇生产的原料。这些材料主要由纤维素、半纤维素和木质素组成。一旦将纤维素转化成葡萄糖,葡萄糖将容易地由酵母发酵成乙醇。
市售可得多种商品化的纤维素分解酶制剂,但是其在降解和转化含纤维素材料方面具有有限的功效。改进这些商品化的酶制剂降解和转化纤维素原料的能力在本领域中将是有利的。
在WO 2005/074647中披露了来自土生羧孢霉(Thielavia terrestris)的具有增强纤维素分解的活性(celluolytic enhancing activity)的分离的多肽及其多核苷酸。
在WO 2005/074656中披露了来自嗜热子囊菌(Thermoascus auranticaus)的具有增强纤维素分解的活性的分离的多肽及其多核苷酸。
美国公开的申请第2007/0077630号披露了来自里氏木霉(Trichodermareesei)的具有增强纤维素分解的活性的分离的多肽及其多核苷酸。
在WO 1995/024471中披露了具有内切葡聚糖酶活性的CEL7多肽及其多核苷酸。
在WO 2001/79507中披露了具有纤维二糖水解酶活性和纤维素结合域的CEL7多肽及其多核苷酸。
在WO 2003/000941中披露了具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽及其多核苷酸。
在WO 2001/25468中披露了具有内切葡聚糖酶活性的CEL12多肽及其多核苷酸。
在WO 2000/20555中披露了具有内切葡聚糖酶活性的CEL45多肽及其多核苷酸。
本发明涉及用于改进纤维素分解酶组合物降解和转化纤维素原料的能力的方法。
发明简述
本发明涉及用于降解或转化含纤维素材料的方法,其包括:用有效量的纤维素分解酶组合物处理含纤维素材料,该纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽和选自下组中的一种或多种(几)组份:具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性和纤维素结合域的CEL7多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽;
其中所述具有内切葡聚糖酶活性的CEL7多肽选自下组:(a)多肽,其包含与SEQ ID NO:2的成熟多肽具有至少70%序列同一性的氨基酸序列;(b)由多核苷酸编码的多肽,所述多核苷酸在至少中严紧条件下与以下杂交:(i)SEQ ID NO:1的成熟多肽编码序列,(ii)包含SEQ ID NO:1的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;(c)多肽,其由包含与SEQ ID NO:1的成熟多肽编码序列具有至少70%序列同一性的核苷酸序列的多核苷酸编码;和(d)变体,其包含取代、缺失和/或插入一个或多个(几个)氨基酸的SEQ ID NO:2的成熟多肽;
其中所述具有内切葡聚糖酶活性的CEL12多肽选自下组:(a)多肽,其包含与SEQ ID NO:4的成熟多肽具有至少70%序列同一性的氨基酸序列;(b)由多核苷酸编码的多肽,所述多核苷酸在至少中严紧条件下与以下杂交:(i)SEQ ID NO:3的成熟多肽编码序列,(ii)包含SEQ ID NO:3的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;(c)多肽,其由包含与SEQ ID NO:3的成熟多肽编码序列具有至少70%序列同一性的核苷酸序列的多核苷酸编码;和(d)变体,其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQ ID NO:4的成熟多肽;
其中所述具有内切葡聚糖酶活性的CEL45多肽选自下组:(a)多肽,其包含与SEQ ID NO:6的成熟多肽具有至少70%序列同一性的氨基酸序列;(b)由多核苷酸编码的多肽,所述多核苷酸在至少中严紧条件下与以下杂交:(i)SEQ ID NO:5的成熟多肽编码序列,(ii)包含在SEQ ID NO:5的成熟多肽编码序列中的cDNA序列,或者(iii)(i)或(ii)的全长互补链;(c)多肽,其由包含与SEQ ID NO:5的成熟多肽编码序列具有至少70%序列同一性的核苷酸序列的多核苷酸编码;和(d)变体,其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQ ID NO:6的成熟多肽;
其中所述具有纤维二糖水解酶活性和纤维素结合域的CEL7多肽选自下组:(a)多肽,其包含与SEQ ID NO:8的成熟多肽具有至少70%序列同一性的氨基酸序列;(b)由多核苷酸编码的多肽,所述多核苷酸在至少中严紧条件下与以下杂交:(i)SEQ ID NO:7的成熟多肽编码序列,(ii)包含在SEQ ID NO:7的成熟多肽编码序列中的cDNA序列,或者(iii)(i)或(ii)的全长互补链;(c)多肽,其由包含与SEQ ID NO:7的成熟多肽编码序列具有至少70%序列同一性的核苷酸序列的多核苷酸编码;和(d)变体,其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQ ID NO:8的成熟多肽;
其中所述具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽选自下组:(a)多肽,其包含与SEQ ID NO:10的成熟多肽具有至少70%序列同一性的氨基酸序列;(b)由多核苷酸编码的多肽,所述多核苷酸在至少中严紧条件下与以下杂交:(i)SEQ ID NO:9的成熟多肽编码序列,(ii)包含SEQ IDNO:9的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;(c)多肽,其由包含与SEQ ID NO:9的成熟多肽编码序列具有至少70%序列同一性的核苷酸序列的多核苷酸编码;和(d)变体,其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQ ID NO:10的成熟多肽;和
其中与具有增强纤维素分解的活性的多肽不存在的情况相比,具有增强纤维素分解的活性的多肽的存在,使通过纤维素分解酶组合物进行的对含纤维素材料的降解增加。
本发明还涉及用于产生物质的方法,包括:
(A)用有效量的纤维素分解酶组合物将含纤维素材料糖化,该纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽;和一种或多种(几种)选自下组中组分:具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽;
其中所述具有内切葡聚糖酶活性的CEL7多肽选自下组:(a)多肽,其包含与SEQ ID NO:2的成熟多肽具有至少70%序列同一性的氨基酸序列;(b)由多核苷酸编码的多肽,所述多核苷酸在至少中严紧条件下与以下杂交:(i)SEQ ID NO:1的成熟多肽编码序列,(ii)包含SEQ ID NO:1的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;(c)多肽,其由包含与SEQ ID NO:1的成熟多肽编码序列具有至少70%序列同一性的核苷酸序列的多核苷酸编码;和(d)变体,其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQ ID NO:2的成熟多肽;
其中所述具有内切葡聚糖酶活性的CEL12多肽选自下组:(a)多肽,其包含与SEQ ID NO:4的成熟多肽具有至少70%序列同一性的氨基酸序列;(b)由多核苷酸编码的多肽,所述多核苷酸在至少中严紧条件下与以下杂交:(i)SEQ ID NO:3的成熟多肽编码序列,(ii)包含SEQ ID NO:3的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;(c)多肽,其由包含与SEQ ID NO:3的成熟多肽编码序列具有至少70%序列同一性的核苷酸序列的多核苷酸编码;和(d)变体,其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQ ID NO:4的成熟多肽;
其中所述具有内切葡聚糖酶活性的CEL45多肽选自下组:(a)多肽,其包含与SEQ ID NO:6的成熟多肽具有至少70%序列同一性的氨基酸序列;(b)由多核苷酸编码的多肽,所述多核苷酸在至少中严紧条件下与以下杂交:(i)SEQ ID NO:5的成熟多肽编码序列,(ii)包含在SEQ ID NO:5的成熟多肽编码序列中的cDNA序列,或者(iii)(i)或(ii)的全长互补链;(c)多肽,其由包含与SEQ ID NO:5的成熟多肽编码序列具有至少70%序列同一性的核苷酸序列的多核苷酸编码;和(d)变体,其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQ ID NO:6的成熟多肽;
其中所述具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽选自下组:(a)多肽,其包含与SEQ ID NO:8的成熟多肽具有至少70%序列同一性的氨基酸序列;(b)由多核苷酸编码的多肽,所述多核苷酸在至少中严紧条件下与以下杂交:(i)SEQ ID NO:7的成熟多肽编码序列,(ii)包含在SEQ ID NO:7的成熟多肽编码序列中的cDNA序列,或者(iii)(i)或(ii)的全长互补链;(c)多肽,其由包含与SEQ ID NO:7的成熟多肽编码序列具有至少70%序列同一性的核苷酸序列的多核苷酸编码;和(d)变体,其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQ ID NO:8的成熟多肽;
其中所述具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽选自下组:(a)多肽,其包含与SEQ ID NO:10的成熟多肽具有至少70%序列同一性的氨基酸序列;(b)由多核苷酸编码的多肽,所述多核苷酸在至少中严紧条件下与以下杂交:(i)SEQ ID NO:9的成熟多肽编码序列,(ii)包含在SEQID NO:9的成熟多肽编码序列中的cDNA序列或包含SEQ ID NO:9的成熟多肽编码序列的基因组DNA序列,或(iii)(i)或(ii)的全长互补链;(c)多肽,其由包含与SEQ ID NO:9的成熟多肽编码序列具有至少70%序列同一性的核苷酸序列的多核苷酸编码;和(d)变体,其包含取代、缺失、和/或插入一个或多个(几)氨基酸的SEQ ID NO:10的成熟多肽;并且
其中与具有增强纤维素分解的活性的多肽不存在的情况相比,具有增强纤维素分解的活性的多肽的存在,使通过纤维素分解酶组合物进行的对含纤维素材料的降解增加;
(B)用一种或多种(几种)发酵微生物发酵步骤(a)中的糖化的含纤维素材料以产生发酵产物;和
(C)回收发酵产物。
本发明也涉及这样的纤维素分解酶组合物,其包含有效量的具有增强纤维素分解的活性的多肽。
附图简述
图1显示在50℃和pH 5.0下仅用
Figure G2008800241104D00061
LDI;用
Figure G2008800241104D00062
LDI和米曲霉(Aspergillus oryzae)β-葡糖苷酶;以及用
Figure G2008800241104D00063
LDI、米曲霉β-葡糖苷酶和嗜热子囊菌GH61A蛋白消化50g PCS 72小时。连接数据点的曲线仅仅是为了清楚地说明。
定义
增强纤维素分解的活性:术语“增强纤维素分解的活性”在本文定义为增强具有纤维素分解活性的蛋白对含纤维素材料的水解的生物活性。就本发明而言,通过在以下条件下测量来自含纤维素材料通过纤维素分解蛋白的水解的还原糖的增加或总纤维二糖和葡萄糖的增加来测定增强纤维素分解的活性:1-50mg含80-99.5%w/w纤维素分解蛋白的总蛋白/g PCS中的纤维素和0.5-20%w/w增强纤维素分解活性的蛋白,在50℃下持续1-7天,与使用相等总蛋白加样量的不含增强纤维素分解的活性的对照水解比较(1-50mg纤维素分解蛋白/g PCS中的纤维素)。在优选的方面,在纤维素酶蛋白加样量为3%的米曲霉β-葡糖苷酶(根据WO 02/095014在米曲霉中重组产生)或3%的烟曲霉(Aspergilus fumigatus)β-葡糖苷酶(根据WO 02/095014的实施例22在米曲霉中重组产生)的存在下,使用
Figure G2008800241104D00064
1.5L(Novozymes A/S,
Figure G2008800241104D00065
Denmark)的混合物作为纤维素分解活性的标准。
具有增强纤维素分解的活性的多肽具有SEQ ID NO:12、14、16、18、20、22或24的成熟多肽的增强纤维素分解的活性的至少20%,优选至少40%,更优选至少50%,更优选至少60%,更优选至少70%,更优选至少80%,甚至更优选至少90%,最优选至少95%,并且最优选至少100%。
所述具有增强纤维素分解的活性的多肽以下述方式增强由具有纤维素分解活性的蛋白质所进行的含纤维素材料的水解:将为达到同样水解程度所需的纤维素分解酶的量减少优选至少0.1倍,更优选至少0.2倍、更优选至少0.3倍、更优选至少0.4倍、更优选至少0.5倍、更优选至少1倍、更优选至少3倍、更优选至少4倍、更优选至少5倍、更优选至少10倍、更优选至少20倍、进一步更优选至少30倍、最优选至少50倍、进一步最优选至少100倍。
纤维素分解活性:术语“纤维素分解活性”在本文定义为水解含纤维素材料的纤维素酶活性(如内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶或其组合)。纤维素分解蛋白可以水解羧甲基纤维素(CMC),由此降低温育混合物的粘度。可以通过振动粘度计(vibration viscosimeter)(如源于法国Sofraser的MIVI 3000)测定所产生的粘度上的降低。纤维素酶活性的测定按照纤维素酶粘度单位(CEVU)来测量,所述测定通过测量样品降低羧甲基纤维素(CMC)溶液粘度的能力来定量该样品中存在的催化活性的量。本测定是在适合于纤维素分解蛋白和底物的温度和pH值下进行的。
就本发明而言,通过在以下条件下测量纤维素分解组合物对含纤维素材料的水解相对于不加入纤维素分解蛋白的对照水解的增加来测定纤维素分解活性:1-50mg纤维素分解蛋白/g PCS中的纤维素,在50℃持续1-7天。
内切葡聚糖酶:术语“内切葡聚糖酶”在本文中的定义为内切-1,4-(1,3;1,4)-β-D葡聚糖4-葡聚糖水解酶(endo-1,4-β-D-glucan4-glucanohydrolase)(E.C.No.3.2.1.4),其催化纤维素、纤维素衍生物(如羧甲基纤维素和羟乙基纤维素)、地衣淀粉、混合的β-1,3葡聚糖如谷物β-D-葡聚糖或木葡聚糖中的β-1,4键和其它含有纤维素成分的生物材料中1,4-β-D-糖苷键的水解。就本发明而言,根据Ghose,1987,Pure and Appl.Chem.59:257-268中的方法使用羧甲基纤维素(CMC)水解作用测定内切葡聚糖酶的活性。
具有内切葡聚糖酶活性的多肽具有SEQ ID NO:2、4或6的成熟多肽的内切葡聚糖酶的活性的至少20%,优选至少40%,更优选至少50%,更优选至少60%,更优选至少70%,更优选至少80%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少100%的活性。
纤维二糖水解酶:术语“纤维二糖水解酶”在本文中的定义为1,4-β-D-葡聚糖纤维二糖水解酶(E.C.3.2.1.91),其催化纤维素、纤维寡糖或任何包含β-1,4-连接的葡萄糖的聚合物中1,4-β-D葡糖苷键的水解,从链的还原端或非还原端释放的纤维二糖。就本发明而言,根据Lever等人,1972,Anal.Biochem.47:273-279和van Tilbeurgh等人,1982,FEBS Letters 149:152-156;van Tilbeurgh和Claeyssens,1985,FEBS Letters 187:283-288所描述的程序测定纤维二糖水解酶的活性。在本发明中,使用Lever等人方法来评估玉米秸秆中纤维素的水解,同时使用van Tilbeurgh等人的方法来测定对于荧光二糖衍生物的纤维二糖水解酶活性。
具有纤维二糖水解酶的活性的多肽具有SEQ ID NO:8或10的成熟多肽的纤维二糖水解酶的活性的至少20%,优选至少40%,更优选至少50%,更优选至少60%,更优选至少70%,更优选至少80%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少100%的活性。
β-葡糖苷酶:术语“β-葡糖苷酶”在本文定义为β-D-葡糖苷葡糖水解酶(E.C.3.2.1.21),其催化末端非还原性β-D-葡萄糖残基的水解,并且释放β-D-葡萄糖。就本发明而言,根据Venturi等人,2002,J.Basic Microbiol.42:55-66描述的基本程序来测定β-葡糖苷酶活性,但是采用如本文所述的不同的条件。将1单位的β-葡糖苷酶活性定义为在50℃、pH 5,从100mM柠檬酸钠、0.01%
Figure G2008800241104D00081
中作为底物的4mM对硝基苯基-β-D-吡喃型葡糖苷每分钟产生1.0微摩尔对硝基苯酚。
具有β-葡糖苷酶的活性的多肽具有SEQ ID NO:26、28或30的成熟多肽的β-葡糖苷酶的活性的至少20%,优选至少40%,更优选至少50%,更优选至少60%,更优选至少70%,更优选至少80%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少100%的活性。
家族7,12,45或61糖苷水解酶:术语“家族7糖苷水解酶”或“家族GH7”,“家族12糖苷水解酶”或“家族GH12”,“家族45糖苷水解酶”或“家族GH45”,和“家族61糖苷水解酶”或“家族GH61”在本文中定义为根据Henrissat,1991,A classification of glycosyl hydrolases based on amino-acid sequence similarities,Biochem.J.280:309-316,和Henrissat B和Bairoch A.,1996,Updating thesequence-based classification of glycosyl hydrolases,Biochem.J.316:695-696分别归入糖苷水解酶家族7、家族12、家族45、家族61的多肽。目前,Henrissat将GH61家族列为未分类,说明就属于此家族的多肽而言,诸如机制、催化性亲核体/碱、催化性质子供体和3-D结构等性质是未知的。GH7、GH12或GH45蛋白也分别称作CEL7、CEL12或CEL45。
含纤维素材料:生物质的初生细胞壁中的主要多糖是纤维素,第二丰富的多糖是半纤维素,而第三是果胶。在细胞停止生长之后产生的次生细胞壁也含有多糖,并且其通过与半纤维素共价交联的聚合木质素强化。纤维素是无水纤维二糖的均聚物,并且因此是支链的β-(1-4)-D-葡聚糖,而半纤维素包括多种化合物,例如具有带有一系列取代基的复杂分支结构的木聚糖、木葡聚糖、阿拉伯木聚糖和甘露聚糖。尽管通常是多形态的,纤维素在植物组织中主要作为由平行葡聚糖链构成的不溶晶体基质存在。半纤维素通常与纤维素以及与其它半纤维素通过氢键连接,其辅助稳定细胞壁基质。
含纤维素材料可以是任何含纤维素的材料。纤维素通常存在于例如植物的茎、叶、果/种壳(hulls)、果/种皮(husks)、和穗轴(cob)中,或树的叶、枝和木材中。含纤维素材料可以是但不限于草本材料、农业残余物、林业残余物、市政固体废物、废纸和纸浆及造纸厂残余物。含纤维素材料可以是任意类型的生物质包括但不限于木材资源、市政固体废物、废纸、作物和作物残余物(参见,例如,Wiselogel等人,1995,在Handbook on Bioethanol(Charles E.Wyman,editor)中,105-118页,Taylor&Francis,Washington D.C.;Wyman,1994,Bioresource Technology 50:3-16;Lynd,1990,Applied Biochemistry andBiotechnology 24/25:695-719;Mosier等人,1999,Recent Progress inBioconversion of Lignocellulosics,在Advances in BiochemicalEngineering/Biotechnology,T.Scheper,managing editor,Volume 65,23-40页,Springer-Verlag,New York)。在本文中可理解的是含纤维素材料优选为木素纤维素的形式,例如,在混合基质中含有木质素、纤维素和半纤维素的植物细胞壁材料。
在优选的方面,含纤维素材料是玉米秸秆。在另一优选的方面,含纤维素材料是玉米纤维。在另一优选的方面,含纤维素材料是柳枝稷(switch grass)。在另一优选的方面,含纤维素材料是稻草(rice straw)。在另一优选的方面,含纤维素材料是造纸和纸浆加工废料。在另一优选的方面,含纤维素材料是木本或草本植物。在另一优选的方面,纤维素材料是蔗渣。
可以按原样使用含纤维素材料或可使用本领域已知的常规方法对含纤维素材料进行预处理。例如,物理预处理技术可包括多种类型的磨制、照射、蒸煮/蒸汽爆炸和水热分解(hydrothermolysis);化学预处理技术可包括稀酸、碱、有机溶剂、氨、二氧化硫、二氧化碳和pH控制的水热分解;而生物预处理技术可包括应用溶解木质素的微生物(参见,例如,Hsu,T.-A.,1996,Pretreatment of biomass,in Handbook on Bioethanol:Production and Utilization,Wyman,C.E.,ed.,Taylor&Francis,Washington,DC,179-212;Ghosh,P.,和Singh,A.,1993,Physicochemical and biological treatments forenzymatic/microbial conversion of lignocellulosic biomass,Adv.Appl.Microbiol.39:295-333;McMillan,J.D.,1994,Pretreating lignocellulosic biomass:a review,in Enzymatic Conversion of Biomass for Fuels Production,Himmel,M.E.,Baker,J.O.,和Overend,R.P.,eds.,ACS Symposium Series 566,American ChemicalSociety,Washington,DC,chapter 15;Gong,C.S.,Cao,N.J.,Du,J.,和Tsao,G.T.,1999,Ethanol production from renewable resources,in Advances in BiochemicalEngineering/Biotechnology,Scheper,T.,ed.,Springer-Verlag Berlin Heidelberg,Germany,65:207-241;Olsson,L.,和Hahn-Hagerdal,B.,1996,Fermentation oflignocellulosic hydrolysates for ethanol production,Enz.Microb.Tech.18:312-331;以及Vallander,L.,和Eriksson,K.-E.L.,1990,Production of ethanolfrom lignocellulosic materials:State of the art,Adv.Biochem.Eng./Biotechnol.42:63-95)。
预处理的玉米秸秆:术语“PCS”或“预处理的玉米秸秆”在本文中的定义为源自通过加热和稀酸处理的玉米秸秆的含纤维素的材料。就本发明而言,PCS通过实施例1中所述方法,或者改变时间、温度和酸量的该方法的变化形式来制备。
分离的多肽:术语“分离的多肽”用于本文中指的是从来源分离的多肽。在优选的方面,如通过SDS-PAGE测定的,多肽至少1%纯,优选至少5%纯,更优选至少10%纯,更优选至少20%纯,更优选至少40%纯,更优选至少60%纯,甚至更优选至少80%纯,以及最优选至少90%纯。
基本上纯的多肽:术语“基本上纯的多肽”在本文表示多肽制备物,所述多肽制备物按重量计含有至多10%,优选至多8%,更优选至多6%,更优选至多5%,更优选至多4%,更优选至多3%,甚至更优选至多2%,最优选至多1%,并且甚至最优选至多0.5%的与其天然结合的(associated)或重组结合的其它多肽材料。因此,优选所述基本上纯的多肽是按存在于制备物中的全部多肽材料的重量计至少92%纯,优选至少94%纯,更优选至少95%纯,更优选至少96%纯,更优选至少96%纯,更优选至少97%纯,更优选至少98%纯,甚至更优选至少99%纯,最优选至少99.5%纯,并且甚至最优选100%纯。本发明的多肽优选是基本上纯的形式,即,所述多肽制备物基本上(essentially)不含与其天然结合的或重组结合的其它多肽材料。这能够通过以下方法实现,例如,通过公知的重组方法或由经典纯化方法制备多肽。
成熟多肽:术语“成熟多肽”在本文中定义为具有生物活性(如酶活性)的多肽,所述多肽以其在翻译和任何翻译后修饰之后的最终形式存在,所述修饰例如N-末端加工、C-末端截断、糖基化、磷酸化等。
成熟多肽编码序列:术语“成熟多肽编码序列”在本文中定义为编码成熟多肽的核苷酸序列,所述成熟多肽具有生物活性。
同一性:参数“同一性”描述两个氨基酸序列之间或两个核苷酸序列之间的相关性。
就本发明而言,两个氨基酸序列之间的同一性程度使用EMBOSS程序包(EMBOSS:The European Molecular Biology Open Software Suite,Rice等人,2000,Trends in Genetics 16:276-277)的Needle程序中执行的Needleman-Wunsch算法(Needleman and Wunsch,1970,J.Mol.Biol.48:443-453)来测定,优选版本3.0或更新的版本。使用的可选参数是缺口开启罚分(gap open penalty)10,缺口延伸罚分(gap extension penalty)0.5和EBLOSUM62(BLOSUM62的EMBOSS版本)取代矩阵。使用Needle标记的“最长同一性”(使用-nobrief选项得到)的输出作为百分比同一性并且如下计算:
(相同的残基×100)/(比对的长度-比对中的缺口总数)
就本发明而言,两个脱氧核糖核酸序列之间的同一性程度使用EMBOSS程序包(EMBOSS:The European Molecular Biology Open Software Suite,Rice等人,2000,supra)的Needle程序中执行的Needleman-Wunsch算法(Needlemanand Wunsch,1970,见上文)来测定,优选版本3.0或更新的版本。使用的可选参数是缺口开启罚分10,缺口延伸罚分0.5和EDNAFULL(NCBI NUC4.4的EMBOSS版本)取代矩阵。使用Needle标记的“最长同一性”(使用-nobrief选项得到)的输出作为百分比同一性并且如下计算:
(相同的脱氧核糖核苷酸×100)/(比对的长度-比对中的缺口总数)
同源序列:术语“同源序列”在本文定义为使用blastp(用于蛋白质数据库)或tblastn(用于核酸数据库)算法,使用BLOSUM62矩阵、字长(wordsize)3、缺口存在分值(gap existence cost)11、缺口延伸分值(gap extension cost)1、无低复杂性过滤并且使用成熟的GH61、GH7、GH12或GH45蛋白序列作为查询对象时,E值(或预期得分(expectancy score))小于0.001的序列。参见Altschul等人,1997,Nucleic Acids Res.25:3389-3402。
多肽片段:术语“多肽片段”在本文中定义为从SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ IDNO:14、SEQ ID NO:16、SEQ ID NO:18或SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28或SEQ ID NO:30的成熟多肽的氨基和/或羧基末端缺失一个或多个(几个)氨基酸的多肽,或者其同源序列;其中所述片段具有其成熟多肽的活性。优选的,SEQ ID NO:2的成熟多肽的片段含有至少340个氨基酸残基,更优选至少370个氨基酸残基,并且最优选至少400个氨基酸残基。优选的,SEQ ID NO:4的成熟多肽的片段含有至少200个氨基酸残基,更优选至少210个氨基酸残基,并且最优选至少220个氨基酸残基。优选的,SEQ ID NO:6的成熟多肽的片段含有至少175个氨基酸残基,更优选至少185个氨基酸残基,并且最优选至少195个氨基酸残基。优选的,SEQ ID NO:8的成熟多肽的片段含有至少425个氨基酸残基,更优选至少450个氨基酸残基,并且最优选至少475个氨基酸残基。优选的,SEQ ID NO:10的成熟多肽的片段含有至少370个氨基酸残基,更优选至少390个氨基酸残基,并且最优选至少410个氨基酸残基。优选的,SEQ IDNO:12的成熟多肽的片段含有至少277个氨基酸残基,更优选至少287个氨基酸残基,并且最优选至少297个氨基酸残基。优选的,SEQ ID NO:14的成熟多肽的片段含有至少185个氨基酸残基,更优选至少195个氨基酸残基,并且最优选至少205个氨基酸残基。优选的,SEQ ID NO:16的成熟多肽的片段含有至少200个氨基酸残基,更优选至少212个氨基酸残基,并且最优选至少224个氨基酸残基。优选的,SEQ ID NO:18的成熟多肽的片段含有至少175个氨基酸残基,更优选至少185个氨基酸残基,并且最优选至少195个氨基酸残基。优选的,SEQ ID NO:20的成熟多肽的片段含有至少240个氨基酸残基,更优选至少255个氨基酸残基,并且最优选至少270个氨基酸残基。优选的,SEQ ID NO:22的成熟多肽的片段含有至少175个氨基酸残基,更优选至少190个氨基酸残基,并且最优选至少205个氨基酸残基。优选的,SEQID NO:24的成熟多肽的片段含有至少200个氨基酸残基,更优选至少210个氨基酸残基,并且最优选至少220个氨基酸残基。优选的,SEQ ID NO:26的成熟多肽的片段含有至少720个氨基酸残基,更优选至少760个氨基酸残基,并且最优选至少800个氨基酸残基。优选的,SEQ ID NO:28的成熟多肽的片段含有至少720个氨基酸残基,更优选至少760个氨基酸残基,并且最优选至少800个氨基酸残基。优选的,SEQ ID NO:30的成熟多肽的片段含有至少720个氨基酸残基,更优选至少760个氨基酸残基,并且最优选至少800个氨基酸残基。
亚序列:术语“亚序列(subsequence)”在本文中定义为从SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21或SEQ ID NO:23的成熟多肽编码序列的5’和/或3’端缺失一个或多个(几个)核苷酸的核苷酸序列;或其同源序列,其中所述亚序列编码具有其成熟多肽的活性的多肽片段。优选的,SEQ ID NO:1的成熟多肽编码序列的亚序列含有至少1020个核苷酸,更优选至少1110个核苷酸,并且最优选至少1200个核苷酸。优选的,SEQ ID NO:3的成熟多肽编码序列的亚序列含有至少600个核苷酸,更优选至少630个核苷酸,并且最优选至少660个核苷酸。优选的,SEQ ID NO:5的成熟多肽编码序列的亚序列含有至少525个核苷酸,更优选至少555个核苷酸,并且最优选至少585个核苷酸。优选的,SEQ ID NO:7的成熟多肽编码序列的亚序列含有至少1275个核苷酸,更优选至少1350个核苷酸,并且最优选至少1425个核苷酸。优选的,SEQ ID NO:9的成熟多肽编码序列的亚序列含有至少1110个核苷酸,更优选至少1170个核苷酸,并且最优选至少1230个核苷酸。优选的,SEQ ID NO:11的成熟多肽编码序列的亚序列含有至少831个核苷酸,更优选至少861个核苷酸,并且最优选至少891个核苷酸。优选的,SEQ ID NO:13的成熟多肽编码序列的亚序列含有至少555个核苷酸,更优选至少585个核苷酸,并且最优选至少615个核苷酸。优选的,SEQ ID NO:15的成熟多肽编码序列的亚序列含有至少600个核苷酸,更优选至少636个核苷酸,并且最优选至少672个核苷酸。优选的,SEQ ID NO:17的成熟多肽编码序列的亚序列含有至少525个核苷酸,更优选至少555个核苷酸,并且最优选至少585个核苷酸。优选的,SEQ ID NO:19的成熟多肽编码序列的亚序列含有至少720个核苷酸,更优选至少765个核苷酸,并且最优选至少810个核苷酸。优选的,SEQ ID NO:21的核苷酸67至796的成熟多肽编码序列的亚序列含有至少525个核苷酸,更优选至少570个核苷酸,并且最优选至少615个核苷酸。优选的,SEQ ID NO:23的成熟多肽编码序列的亚序列含有至少600个核苷酸,更优选至少630个核苷酸,并且最优选至少660个核苷酸。优选的,SEQ ID NO:25的成熟多肽编码序列的亚序列含有至少2160个核苷酸,更优选至少2280个核苷酸,并且最优选至少2400个核苷酸。优选的,SEQ ID NO:27的成熟多肽编码序列的亚序列含有至少2160个核苷酸,更优选至少2280个核苷酸,并且最优选至少2400个核苷酸。优选的,SEQ ID NO:29的成熟多肽编码序列的亚序列含有至少2160个核苷酸,更优选至少2280个核苷酸,并且最优选至少2400个核苷酸。
等位变体(allelic variant):术语“等位变体”在本文中表示占据相同染色体基因座的基因的任何两种或两种以上可选形式。等位变异通过突变天然地发生,并且可导致种群内的多态性。基因突变可以是沉默的(在编码的多肽中无变化)或可以编码具有改变的氨基酸序列的多肽。多肽的等位变体是由基因的等位变体编码的多肽。
分离的多核苷酸:术语“分离的多核苷酸”用于本文中指与来源分离的多核苷酸。在优选的方面,如通过琼脂糖电泳测定的,所述多核苷酸为至少1%纯,优选至少5%纯,更优选至少10%纯,更优选至少20%纯,更优选至少40%纯,更优选至少60%纯,甚至更优选至少80%纯,以及最优选至少90%纯。
基本上纯的多核苷酸:术语“基本上纯的多核苷酸”用于本文指不含其它外来的或不期望的核苷酸的多核苷酸制备物,并且所述多核苷酸制备物处于适合于在遗传工程的蛋白质生产体系中使用的形式。因此,基本上纯的多核苷酸按重量计含有至多10%,优选至多8%,更优选至多6%,更优选至多5%,更优选至多4%,更优选至多3%,甚至更优选至多2%,最优选至多1%,并且甚至最优选至多0.5%的与其天然结合的或重组结合的其它多核苷酸材料。然而,基本上纯的多核苷酸可以包括天然存在的5’和3’非翻译区,例如启动子和终止子。优选基本上纯的多核苷酸是按重量计至少90%纯,优选至少92%纯,更优选至少94%纯,更优选至少95%纯,更优选至少96%纯,更优选至少97%纯,甚至更优选至少98%纯,最优选至少99%,并且甚至最优选至少99.5%纯的。本发明所述多核苷酸优选为基本上纯的形式,即,所述多核苷酸制备物基本上不含与其天然结合的或重组结合的其它多核苷酸材料。所述多核苷酸可以是基因组、cDNA、RNA、半合成、合成来源的,或它们的任意组合。
编码序列:当用于本文时术语“编码序列”的意思是直接指定其蛋白产物的氨基酸序列的核苷酸序列。编码序列的边界通常由开读框决定,所述开读框通常以ATG起始密码子或可选的起始密码子例如GTG和TTG开始,并且以终止密码子例如TAA、TAG和TGA结束。编码序列可以是DNA、cDNA、合成的或重组的核苷酸序列。
cDNA:术语“cDNA”在本文中定义为能够通过逆转录从得自真核细胞的成熟的、已剪接的mRNA分子制备的DNA分子。cDNA缺少通常存在于相应基因组DNA中的内含子序列。起始的(initial)、初级的RNA转录物是mRNA的前体,其通过一系列的步骤加工然后作为成熟的已剪接的mRNA出现。这些步骤包括通过称为剪接的过程去除内含亚序列。因而源自mRNA的cDNA没有任何内含子序列。
核酸构建体:术语“核酸构建体”用于本文指单链或双链的核酸分子,所述核酸分子分离自天然存在的或者合成的基因,或将所述核酸分子以本来不存在于(not otherwise exist)自然界中的方式修饰以含有核酸的片段。当所述核酸构建体含有表达本发明中的编码序列所需的调控序列时,术语核酸构建体与术语“表达盒”同义。
调控序列(control sequence):术语“调控序列”在本文定义为包括对于本发明中编码多肽的多核苷酸的表达是必需的所有成分。各调控序列对于编码所述多肽的核苷酸序列可以是天然的或外源的,或各调控序列对于彼此可以是天然的或外源的。这些调控序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。最少的情况,调控序列包括启动子和转录和翻译的终止信号。调控序列可以和用于引入特异性限制位点的接头一起提供,所述特异性限制位点促进调控序列与编码多肽的核苷酸序列编码区的连接。
可操作地连接:术语“可操作地连接”在本文表示这样的构型,其中将调控序列置于相对于多核苷酸序列的编码序列的适当位置,使得调控序列指导多肽编码序列的表达。
表达:术语“表达”包括涉及多肽产生的任何步骤,其包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。
表达载体:术语“表达载体”在本文定义为线性的或环状的DNA分子,其包含编码本发明多肽的多核苷酸,并且所述多核苷酸与提供用于其表达的额外核苷酸可操作地连接。
宿主细胞:如本文中所使用的术语“宿主细胞”包括任何细胞类型,所述细胞类型对于用包含本发明中的多核苷酸的核酸构建体或表达载体的转化、转染、转导等是易感的(susceptible)。
修饰:术语“修饰”在本文的意思是,对由SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18或SEQ ID NO:20、SEQ ID NO:22、SEQID NO:24、SEQ ID NO:26、SEQ ID NO:28或SEQ ID NO:30的成熟多肽或其同源序列组成的多肽的任何化学修饰;以及对编码这种多肽的DNA的遗传操作。所述修饰可以是一个或多个(几个)氨基酸的取代、缺失和/或插入,以及一个或多个(几个)氨基酸侧链的取代。
人工变体:当用在本文时,术语“人工变体”的意思是由表达SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQIDNO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27或SEQ ID NO:29的成熟多肽编码序列的修饰的核苷酸序列或其同源序列的生物体产生的多肽。所述修饰的多核苷酸序列通过人为干预(human intervention),通过修饰公开于SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:17,SEQ IDNO:19,SEQ ID NO:21,SEQ ID NO:23,SEQ ID NO:25,SEQ ID NO:27或SEQ ID NO:29的多核苷酸序列或其同源序列的核苷酸序列来获得。
发明详述
本发明涉及用于降解或转化含纤维素材料的方法,其包括:用有效量的纤维素分解酶组合物处理所述含纤维素材料,其中所述纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽,以及一种或多种(几种)选自下组的组分:具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽,其中与缺乏所述具有增强纤维素分解的活性的多肽时相比,具有增强纤维素分解的活性的多肽的存在使通过纤维素分解酶组合物进行的对纤维素材料的降解增加。
本发明进一步包括回收降解或转化的含纤维素材料。可使用本领域熟知的技术例如离心、过滤和重力沉降,将含纤维素材料的降解或转化的可溶产物与不溶的含纤维素材料分离。
本发明还涉及产生物质的方法,包括:(a)用有效量的纤维素分解酶组合物糖化含纤维素材料,该纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽和一种或多种(几种)选自下组的组分:具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽,和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽,其中与缺乏具有增强纤维素分解的活性的多肽时相比,具有增强纤维素分解的活性的多肽的存在使通过纤维素分解酶组合物进行的对含纤维素材料的降解增加;(b)用一种或多种(几种)发酵微生物发酵步骤(a)中的糖化的含纤维素材料以产生发酵产物;和(c)回收发酵产物。
本发明还涉及这些包含有效量的具有增强纤维素分解的活性的多肽的纤维素分解酶组合物。
纤维素分解酶组合物
本发明还涉及纤维素分解酶组合物,其包含具有增强纤维素分解的活性的多肽和一种或多种(几中)选自下组的组分:具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。
第一方面,具有内切葡聚糖酶活性的分离的CEL7多肽包含的氨基酸序列与SEQ ID NO:2的成熟多肽具有优选至少70%的序列同一性程度,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%,97%,98%或99%的序列同一性程度,所述多肽具有内切葡聚糖酶活性(以下称“同源多肽”)。在优选的方面,所述同源多肽包含的氨基酸序列与SEQ ID NO:2的成熟多肽有十个氨基酸,优选五个氨基酸,更优选四个氨基酸,甚至更优选三个氨基酸,最优选两个氨基酸以及甚至最优选一个氨基酸不同。
具有内切葡聚糖酶活性的CEL7多肽优选包含SEQ ID NO:2的氨基酸序列或其等位变体,或者其具有内切葡聚糖酶活性的片段。在优选的方面,多肽包含SEQ ID NO:2的氨基酸序列。在另一优选的方面,多肽包含SEQ ID NO:2的成熟多肽。在另一优选的方面,多肽包含SEQ ID NO:2的氨基酸21至456,或其等位变体;或者其具有内切葡聚糖酶活性的片段。在另一优选的方面,多肽包含SEQ ID NO:2的氨基酸21至456。在另一优选的方面,多肽由SEQ ID NO:2的氨基酸序列或其等位变体,或者其具有内切葡聚糖酶活性的片段组成。在另一优选的方面,多肽由SEQ ID NO:2的氨基酸序列组成。在另一优选的方面,多肽由SEQ ID NO:2的成熟多肽组成。在另一优选的方面,多肽由SEQ ID NO:2的氨基酸21至456或其等位变体,或其具有内切葡聚糖酶活性的片段组成。在另一优选的方面,多肽由SEQ ID NO:2的氨基酸21至456组成。
根据WO 1995/024471可以获得具有内切葡聚糖酶活性的CEL7多肽。
在另一第一方面,具有内切葡聚糖酶活性的分离的CEL12多肽包含的氨基酸序列与SEQ ID NO:4的成熟多肽具有优选至少70%的序列同一性程度,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%、97%、98%或99%的序列同一性程度,所述多肽具有内切葡聚糖酶活性(以下称“同源多肽”)。在优选的方面,所述同源多肽包含的氨基酸序列与SEQ ID NO:4的成熟多肽有十个氨基酸,优选五个氨基酸,更优选四个氨基酸,甚至更优选三个氨基酸,最优选两个氨基酸以及甚至最优选一个氨基酸不同。
具有内切葡聚糖酶活性的CEL12多肽优选包含SEQ ID NO:4的氨基酸序列或其等位变体,或者其具有内切葡聚糖酶活性的片段。在优选的方面,多肽包含SEQ ID NO:4的氨基酸序列。在另一优选的方面,多肽包含SEQ IDNO:4的成熟多肽。在另一优选的方面,多肽包含SEQ ID NO:4的氨基酸16至247,或其等位变体,或者其具有内切葡聚糖酶活性的片段。在另一优选的方面,多肽包含SEQ ID NO:4的氨基酸16至247。在另一优选的方面,多肽由SEQ ID NO:4的氨基酸序列或其等位变体,或者其具有内切葡聚糖酶活性的片段组成。在另一优选的方面,多肽由SEQ ID NO:4的氨基酸序列组成。在另一优选的方面,多肽由SEQ ID NO:4的成熟多肽组成。在另一优选的方面,多肽由SEQ ID NO:4的氨基酸16至247,或其等位变体,或者其具有内切葡聚糖酶活性的片段组成。在另一优选的方面,多肽由SEQ ID NO:4的氨基酸16至247组成。
根据WO 2001/25468可以获得具有内切葡聚糖酶活性的CEL12多肽。
在另一第一方面,具有内切葡聚糖酶活性的分离的CEL45多肽包含的氨基酸序列与SEQ ID NO:6的成熟多肽具有优选至少70%的序列同一性程度,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%、97%、98%或99%的序列同一性程度,所述多肽具有内切葡聚糖酶活性(以下称“同源多肽”)。在优选的方面,所述同源多肽包含的氨基酸序列与SEQ ID NO:6的成熟多肽有十个氨基酸,优选五个氨基酸,更优选四个氨基酸,甚至更优选三个氨基酸,最优选两个氨基酸以及甚至最优选一个氨基酸不同。
具有葡聚糖分解酶活性的CEL45多肽优选包含SEQ ID NO:6的氨基酸序列或其等位变体,或者其具有内切葡聚糖酶活性的片段。在优选的方面,多肽包含SEQ ID NO:6的氨基酸序列。在另一优选的方面,多肽包含SEQ IDNO:6的成熟多肽。在另一优选的方面,多肽包含SEQ ID NO:6的氨基酸19至225,或其等位变体,或者其具有内切葡聚糖酶活性的片段。在另一优选的方面,多肽包含SEQ ID NO:6的氨基酸19至225。在另一优选的方面,多肽由SEQ ID NO:6的氨基酸序列或其等位变体,或者其具有内切葡聚糖酶活性的片段组成。在另一优选的方面,多肽由SEQ ID NO:6的氨基酸序列组成。在另一优选的方面,多肽由SEQ ID NO:6的成熟多肽组成。在另一优选的方面,多肽由SEQ ID NO:6的氨基酸19至225或其等位变体,或者其具有内切葡聚糖酶活性的片段组成。在另一优选的方面,多肽由SEQ ID NO:6的氨基酸19至225组成。
根据WO 2000/20555可以获得具有内切葡聚糖酶活性的CEL45多肽。
在另一第一方面,具有纤维二糖水解酶活性及纤维素结合域的分离的CEL7多肽包含的氨基酸序列与SEQ ID NO:8的成熟多肽具有优选至少70%的序列同一性程度,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%、97%、98%或99%的序列同一性程度,所述多肽具有纤维二糖水解酶活性(以下称“同源多肽”)。在优选的方面,同源多肽包含的氨基酸序列与SEQ ID NO:8的成熟多肽有十个氨基酸,优选五个氨基酸,更优选四个氨基酸,甚至更优选三个氨基酸,最优选两个氨基酸以及甚至最优选一个氨基酸不同。
具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽优选包含SEQ IDNO:8的氨基酸序列或其等位变体,或者其具有纤维二糖水解酶活性的片段。在优选的方面,多肽包含SEQ ID NO:8的氨基酸序列。在另一优选的方面,多肽包含SEQ ID NO:8的成熟多肽。在另一优选的方面,多肽包含SEQ ID NO:8的氨基酸18至526,或其等位变体,或者其具有纤维二糖水解酶活性的片段。在另一优选的方面,多肽包含SEQ ID NO:8的氨基酸18至526。在另一优选的方面,多肽由SEQ ID NO:8的氨基酸序列或其等位变体,或者其具有纤维二糖水解酶活性的片段组成。在另一优选的方面,多肽由SEQ ID NO:8的氨基酸序列组成。在另一优选的方面,多肽由SEQ ID NO:8的成熟多肽组成。在另一优选的方面,多肽由SEQ ID NO:8的氨基酸18至526或其等位变体,或者其具有纤维二糖水解酶活性的片段组成。在另一优选的方面,多肽由SEQ ID NO:8的氨基酸18至526组成。
根据WO 2001/79507可以获得具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。
在另一第一方面,具有纤维二糖水解酶活性及纤维素结合域的分离的CEL7多肽包含的氨基酸序列与SEQ ID NO:10的成熟多肽具有优选至少70%的序列同一性程度,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%、97%、98%或99%的序列同一性程度,所述多肽具有纤维二糖水解酶活性(以下称“同源多肽”)。在优选的方面,所述同源多肽包含的氨基酸序列与SEQ IDNO:10的成熟多肽有十个氨基酸,优选五个氨基酸,更优选四个氨基酸,甚至更优选三个氨基酸,最优选两个氨基酸以及甚至最优选一个氨基酸不同。
具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽优选包含SEQ ID NO:10的氨基酸序列或其等位变体,或者其具有纤维二糖水解酶活性的片段。在优选的方面,多肽包含SEQ ID NO:10的氨基酸序列。在另一优选的方面,多肽包含SEQ ID NO:10的成熟多肽。在另一优选的方面,多肽包含SEQ ID NO:10的氨基酸21至450,或其等位变体,或者其具有纤维二糖水解酶活性的片段。在另一优选的方面,多肽包含SEQ ID NO:10的氨基酸21至450。在另一优选的方面,多肽由SEQ ID NO:10的氨基酸序列或其等位变体,或者其具有纤维二糖水解酶活性的片段组成。在另一优选的方面,多肽由SEQ ID NO:10的氨基酸序列组成。在另一优选的方面,多肽由SEQ IDNO:10的成熟多肽组成。在另一优选的方面,多肽由SEQ ID NO:10的氨基酸21至450或其等位变体,或者其具有纤维二糖水解酶活性的片段组成。在另一优选的方面,多肽由SEQ ID NO:10的氨基酸21至450组成。
根据WO 2003/000941可以获得具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。
在第二方面,具有内切葡聚糖酶活性的分离的CEL7多肽由多核苷酸编码,所述多核苷酸在至少非常低严紧条件下,优选至少低严紧条件下,更优选至少中严紧条件下,更优选至少中-高严紧条件下,甚至更优选至少高严紧条件下,并且最优选至少非常高严紧条件下与以下杂交:(i)SEQ ID NO:1的成熟多肽编码序列,(ii)包含SEQ ID NO:1的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链(J.Sambrook,E.F.Fritsch,and T.Maniatus,1989,Molecular Cloning,A Laboratory Manual,2d edition,ColdSpring Harbor,New York)。在优选的方面,所述成熟多肽编码序列为SEQ IDNO:1的核苷酸61至1368。
在另一第二方面,具有内切葡聚糖酶活性的分离的CEL12多肽由多核苷酸编码,所述多核苷酸在至少非常低严紧条件下,优选至少低严紧条件下,更优选至少中严紧条件下,更优选至少中-高严紧条件下,甚至更优选至少高严紧条件下,以及最优选至少非常高严紧条件下与以下杂交:(i)SEQ ID NO:3的成熟多肽编码序列,(ii)包含SEQ ID NO:3的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链。在优选的方面,所述成熟多肽编码序列为SEQ ID NO:3的核苷酸46至741。
在另一第二方面,具有内切葡聚糖酶活性的分离的CEL45多肽由多核苷酸编码,所述多核苷酸在至少非常低严紧条件下,优选至少低严紧条件下,更优选至少中严紧条件下,更优选至少中-高严紧条件下,甚至更优选至少高严紧条件下,以及最优选至少非常高严紧条件下与以下杂交:(i)SEQ ID NO:5的成熟多肽编码序列,(ii)包含在SEQ ID NO:5的成熟多肽编码序列中的cDNA序列,或(iii)(i)或(ii)的全长互补链。在优选的方面,所述成熟多肽编码序列是SEQ ID NO:5的核苷酸55至675。
在另一第二方面,具有纤维二糖水解酶活性及纤维素结合域的分离的CEL7多肽由多核苷酸编码,所述多核苷酸在至少非常低严紧条件下,优选至少低严紧条件下,更优选至少中严紧条件下,更优选至少中-高严紧条件下,甚至更优选至少高严紧条件下,以及最优选至少非常高严紧条件下与以下杂交:(i)SEQ ID NO:7的成熟多肽编码序列,(ii)包含在SEQ ID NO:7的成熟多肽编码序列中的cDNA序列,或(iii)(i)或(ii)的全长互补链。在优选的方面,成熟多肽编码序列是SEQ ID NO:7的核苷酸52至1645。
在另一第二方面,具有纤维二糖水解酶活性而不具有纤维素结合域的分离的CEL7多肽由多核苷酸编码,所述多核苷酸在至少非常低严紧条件下,优选至少低严紧条件下,更优选至少中严紧条件下,更优选至少中-高严紧条件下,甚至更优选至少高严紧条件下,以及最优选至少非常高严紧条件下与以下杂交:(i)SEQ ID NO:9的成熟多肽编码序列,(ii)包含在SEQ ID NO:9的成熟多肽编码序列中的cDNA序列,或(iii)(i)或(ii)的全长互补链。在优选的方面,成熟多肽编码序列是SEQ ID NO:9的核苷酸61至1350。
SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7或SEQ IDNO:9的核苷酸序列或其亚序列;以及SEQ ID NO:2、SEQ ID NO:4、SEQ IDNO:6、SEQ ID NO:8或SEQ ID NO:10的氨基酸序列或其片段,可以用于设计核酸探针,以根据本领域内公知的方法从不同属和种的菌株鉴定和克隆编码这些多肽的DNA。尤其,这样的探针可用于与目的属或种的基因组或cDNA杂交,接着是标准Southern印迹程序以鉴定和分离其中相应的目的基因。这样的探针可能比整个序列短很多,但是其长度应该是至少14,优选至少25,更优选至少35以及最优选至少70个核苷酸。然而,核酸探针的长度优选为至少100个核苷酸。例如,核酸探针的长度可以至少200个核苷酸,优选至少300个核苷酸,更优选至少400个核苷酸,或最优选至少500个核苷酸。甚至可以用更长的探针,例如,长度为至少600个核苷酸,至少优选至少700个氨基酸,更优选至少800个氨基酸,或最优选至少900个氨基酸的核酸探针。DNA和RNA探针都可以利用。通常将探针加以标记用于检测相应的基因(例如,用32p、3H、35S、生物素或抗生物素蛋白标记)。这样的探针都包含在本发明中。
因而,可从由这些其它生物体制备的基因组DNA或cDNA文库中筛选与上述探针杂交并且编码这些多肽的DNA。可以通过琼脂糖或聚丙烯酰胺凝胶电泳,或通过其它分离技术来分离来自这些其它生物体的基因组或其它DNA。可以将来自文库的DNA或分离的DNA转移并固定在硝酸纤维素(nitrocellulose)或其它合适的载体材料上。为了鉴定与SEQ ID NO:1、SEQ IDNO:3、SEQ ID NO:5、或SEQ ID NO:9、或其亚序列同源的克隆或DNA,优选将所述载体材料用在Southern印迹中。
就本发明而言,杂交表示核苷酸序列在非常低至非常高的严紧条件下与标记的核酸探针杂交,所述核酸探针对应于SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9的成熟多肽编码序列,包含SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9的成熟多肽编码序列的基因组DNA序列或包含在SEQ ID NO:5或SEQ IDNO:7的成熟多肽编码序列中的cDNA序列;它的全长互补链或其亚序列。可使用例如X射线片(X-ray film)检测在这些条件下与所述核酸探针杂交的分子。
在优选的方面,核酸探针是SEQ ID NO:1的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:1的核苷酸61至1368。在另一优选的方面,核酸探针是编码SEQ ID NO:2的多肽的多核苷酸序列,或其亚序列。在另一优选的方面,核酸探针是SEQ ID NO:1。
在另一优选的方面,核酸探针是SEQ ID NO:3的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:3的核苷酸46至741。在另一优选的方面,核酸探针是编码SEQ ID NO:4的多肽的多核苷酸序列,或其亚序列。在另一优选的方面,核酸探针是SEQ ID NO:3。
在另一优选的方面,核酸探针是SEQ ID NO:5的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:5的核苷酸55至675。在另一优选的方面,核酸探针是编码SEQ ID NO:6的多肽的多核苷酸序列,或其亚序列。在另一优选的方面,核酸探针是SEQ ID NO:5。
在另一优选的方面,核酸探针是SEQ ID NO:7的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:7的核苷酸52至1645。在另一优选的方面,核酸探针是编码SEQ ID NO:8的多肽的多核苷酸序列,或其亚序列。在另一优选的方面,核酸探针是SEQ ID NO:7。
在另一优选的方面,核酸探针是SEQ ID NO:9的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:9的核苷酸61至1350。在另一优选的方面,核酸探针是编码SEQ ID NO:10的多肽的多核苷酸序列,或其亚序列。在另一优选的方面,核酸探针是SEQ ID NO:9。
对于长度至少100个核苷酸的长探针,将非常低至非常高的严紧条件定义为在42℃,在5X SSPE、0.3%SDS、200μg/ml已剪切并且变性的鲑精DNA中,并且对于非常低和低严紧性为25%的甲酰胺,对于中和中-高严紧性为35%的甲酰胺,或对于高和非常高严紧性为50%的甲酰胺,根据标准的Southern印迹法进行预杂交和杂交最佳12至24小时。
对于长度为至少100个核苷酸的长探针,使用2X SSC、0.2%SDS优选至少在45℃(非常低严紧性),更优选至少在50℃(低严紧性),更优选至少在55℃(中严紧性),更优选至少在60℃(中-高严紧性),甚至更优选至少在65℃(高严紧性),并且最优选至少在70℃(非常高严紧性)将载体材料最终洗涤三次,每次15分钟。
对于长度大约15个核苷酸至大约70个核苷酸的短探针,将严紧条件定义为在比采用根据Bolton和McCarthy计算法(1962,Proceedings of theNational Academy of Sciences USA 48:1390)得出的Tm低大约5℃至大约10℃,在0.9M NaCl,0.09M Tris-HCl pH 7.6,6mM EDTA,0.5%NP-40,1X Denhardt′s溶液,1mM焦磷酸钠(sodium pyrophosphate),1mM磷酸二氢钠(sodium monobasic phosphate),0.1mM ATP和0.2mg/ml的酵母RNA中,根据标准的Southern印迹程序进行预杂交、杂交和杂交后洗涤最佳12至24小时。
对于长度大约15个核苷酸至大约70个核苷酸的短探针,将所述载体材料在6X SSC加0.1%SDS中洗涤一次15分钟,并用6X SSC在比计算的Tm低5℃至10℃的温度下洗涤两次,每次15分钟。
在第三方面,具有内切葡聚糖酶活性的分离的CEL7多肽由包含如下核苷酸序列或由如下核苷酸序列组成的多核苷酸编码,所述核苷酸序列与SEQID NO:1的成熟多肽编码序列具有优选至少70%的序列同一性程度,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%、97%、98%或99%的序列同一性程度,其编码活性多肽,其编码活性多肽。
在另一第三方面,具有内切葡聚糖酶活性的分离的CEL12多肽由包含如下核苷酸序列或由如下核苷酸序列组成的多核苷酸编码,所述核苷酸序列与SEQ ID NO:3的成熟多肽编码序列具有优选至少70%的序列同一性程度,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%、97%、98%或99%的序列同一性程度,其编码活性多肽,其编码活性多肽。
在另一第三方面,具有内切葡聚糖酶活性的分离的CEL45多肽由包含如下核苷酸序列或由如下核苷酸序列组成的多核苷酸编码,所述核苷酸序列与SEQ ID NO:5的成熟多肽编码序列具有优选至少70%的序列同一性程度,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%、97%、98%或99%的序列同一性程度,其编码活性多肽,其编码活性多肽。
在另一第三方面,具有纤维二糖水解酶活性及纤维素结合域的分离的CEL7多肽由包含如下核苷酸序列或由如下核苷酸序列组成的多核苷酸编码,所述核苷酸序列与SEQ ID NO:7的成熟多肽编码序列具有优选至少70%的序列同一性程度,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%、97%、98%或99%的序列同一性程度,其编码活性多肽,其编码活性多肽。
在另一第三方面,具有纤维二糖水解酶活性而不具有纤维素结合域的分离的CEL7多肽由包含如下核苷酸序列或由如下核苷酸序列组成的多核苷酸编码,所述核苷酸序列与SEQ ID NO:9的成熟多肽编码序列具有优选至少70%的序列同一性程度,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%、97%、98%或99%的序列同一性程度,其编码活性多肽,其编码活性多肽。
在优选的方面,成熟多肽编码序列是SEQ ID NO:1的核苷酸61至1368、SEQ ID NO:3的核苷酸46至741、SEQ ID NO:5的核苷酸55至675,SEQ IDNO:7的核苷酸52至1645,或SEQ ID NO:9的核苷酸61至1350。参见文中多核苷酸部分。
在第四方面,具有内切葡聚糖酶活性的分离的CEL7多肽是人工变体,所述人工变体包含取代、缺失和/或插入一个或多个(几个)氨基酸的SEQ IDNO:2的成熟多肽;或者其同源序列。
在另一第四方面,具有内切葡聚糖酶活性的CEL12多肽是人工变体,所述人工变体包含取代、缺失和/或插入一个或多个(几个)氨基酸的SEQ ID NO:4的成熟多肽;或者其同源序列。
在另一第四方面,具有内切葡聚糖酶活性的分离的CEL45多肽是人工变体,所述人工变体包含取代、缺失和/或插入一个或多个(几个)氨基酸的SEQID NO:6的成熟多肽;或其同源序列。
在另一第四方面,具有纤维二糖水解酶活性及纤维素结合域的分离的CEL7多肽是人工变体,所述人工变体包含取代、缺失和/或插入一个或多个(几个)氨基酸的SEQ ID NO:8的成熟多肽;或其同源序列。
在另一第四方面,具有纤维二糖水解酶活性而不具有纤维素结合域的分离的CEL7多肽是人工变体,所述人工变体包含取代、缺失和/或插入一个或多个(几个)氨基酸的SEQ ID NO:10的成熟多肽;或其同源序列。
优选氨基酸改变对性质是较不重要的(of a minor nature),即保守的氨基酸取代或插入,其不显著影响蛋白质的折叠和/或活性;通常为1至大约30个氨基酸的小缺失;小的氨基或羧基末端延伸,例如氨基末端甲硫氨酸残基;多至大约20-25个残基的小接头肽;或通过改变净电荷或其它功能来促进纯化的小延伸,例如多组氨酸序列(poly histidine tract)、抗原表位(antigenicepitope)或结合域(binding domain))。
保守取代的实例是在以下组之内:碱性氨基酸组(精氨酸、赖氨酸和组氨酸)、酸性氨基酸组(谷氨酸和天冬氨酸)、极性氨基酸组(谷氨酰胺和天冬酰胺)、疏水性氨基酸组(亮氨酸、异亮氨酸和缬氨酸)、芳族氨基酸组(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸组(甘氨酸、丙氨酸、丝氨酸、苏氨酸和甲硫氨酸)。通常不改变比活性(specific activity)的氨基酸取代是本领域已知的,并且由例如H.Neurath and R.L.Hill,1979,In,The Proteins,Academic Press,New York描述。最普遍发生的交换是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly。
除了20个标准氨基酸,可以用非标准的氨基酸(例如4-羟脯氨酸、6-N-甲基赖氨酸、2-氨基异丁酸、异缬氨酸和α-甲基丝氨酸)取代野生型多肽的氨基酸残基。可以用有限数目的非保守氨基酸、不由遗传密码编码的氨基酸和非天然氨基酸取代氨基酸残基。“非天然氨基酸”在蛋白质合成后已经过修饰,和/或在它们的侧链具有不同于标准氨基酸的化学结构。非天然氨基酸能够以化学方法合成,并且优选是商业上能够获得的,包括六氢吡啶羧酸(pipecolicacid)、噻唑烷羧酸(thiazolidine carboxylic acid)、脱氢脯氨酸、3-和4-甲基脯氨酸,和3,3-二甲基脯氨酸。
可供选择的是,氨基酸改变具有这样的性质以使多肽的物理化学性质改变。例如,氨基酸改变可改进多肽的热稳定性,改变底物特异性,改变最适pH等。
能够根据本领域已知的方法,例如定点诱变或丙氨酸分区诱变法(Cunningham and Wells,1989,Science 244:1081-1085)来鉴定亲本多肽中的必需氨基酸。在后一技术中,将单一丙氨酸突变引入到分子中的每个残基,并且测试所得突变分子的生物活性(即,内切葡聚糖酶或纤维二糖水解酶的活性)以鉴定对于所述分子的活性关键的氨基酸残基。同样参见Hilton等人,1996,J.Biol.Chem.271:4699-4708。酶的活性部位或其它的生物相互作用也能够通过结构的物理分析而测定,如通过以下这些技术:如核磁共振、晶体学、电子衍射或光亲和标记,连同推定的接触位点氨基酸的突变来测定。参见例如deVos等人,1992,Science 255:306-312;Smith等人,1992,J.Mol.Biol.224:899-904;Wlodaver等人,1992,FEBS Lett.309:59-64。也可以分析与本发明多肽之亲缘多肽的同一性,据此推测关键氨基酸的身份。
能够使用已知的诱变、重组和/或改组(shuffling)方法,然后是有关的筛选方法,例如那些由Reidhaar-Olson and Sauer,1988,Science 241:53-57;Bowieand Sauer,1989,Proc.Natl.Acad.Sci.USA 86:2152-2156;WO 95/17413;或WO 95/22625公开的那些方法来进行并测试单个或多个氨基酸取代、缺失和/或插入。能够使用的其它方法包括易错PCR、噬菌体展示(例如,Lowman等人,1991,Biochem.30:10832-10837;美国专利No.5,223,409;WO 92/06204)和区域定向的诱变(Derbyshire等人,1986,Gene 46:145;Ner等人,1988,DNA7:127)。
诱变/改组方法能够与高通量、自动化的筛选方法组合以检测由宿主细胞表达的克隆的、诱变的多肽的活性(Ness等人,1999,Nature Biotechnology 17:893-896)。能够从宿主细胞回收编码活性多肽的诱变的DNA分子,并且使用本领域的标准方法快速测序。这些方法允许快速测定感兴趣的多肽中单个氨基酸残基的重要性,并且能够应用于未知结构的多肽。
SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8或SEQ IDNO:10的成熟多肽的氨基酸取代、缺失和/或插入的总数是10,优选9,更优选8,更优选7,更优选至多6,更优选5,更优选4,甚至更优选3,最优选2,并且甚至最优选1。
以优选固体的约0.001%至10.0%重量,更优选固体的约0.01%至5.0%重量,甚至更优选固体的约0.025%至4.0%重量,和最优选固体的约0.005%至2.0%重量的有效量加入纤维素分解酶组物。
如在此所述,本发明中的纤维素分解酶组合物可以由微生物菌株(野生型或重组宿主细胞)的发酵或几种单独的微生物菌株(野生型和/或重组型宿主细胞)的发酵产生,并回收。
如在此所述,纤维素分解酶组合物也可以包含其它与含纤维素材料的降解有关的酶组分。
在优选的方面,组合物还包含一种或多种(几种)具有β-葡糖苷酶活性的多肽。
在优选的方面,从米曲霉中获得具有β-葡糖苷酶活性的多肽。参见WO2002/095014。在另一优选的方面,从烟曲霉中获得具有β-葡糖苷酶活性的多肽。参见WO 2005/047499。在另一优选的方面,从巴西青霉(Penicilliumbrasilianum)例如巴西青霉菌株IBT 20888中获得具有β-葡糖苷酶活性的多肽。参见WO 2007/019442。
根据WO 2002/095014可以获得具有β-葡糖苷酶活性的米曲霉多肽。根据WO 2005/047499可以获得具有β-葡糖苷酶活性的烟曲霉多肽。根据WO2007/019442可获得具有β-葡糖苷酶活性的巴西青霉多肽。
在第一方面,具有β-葡糖苷酶活性的分离的多肽包含的氨基酸序列与SEQ ID NO:26、SEQ ID NO:28或SEQ ID NO:30的成熟多肽具有优选至少70%的序列同一性程度,更优选至少75%,更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%,97%,98%或99%的序列同一性程度,所述多肽具有β-葡糖苷酶活性(以下称“同源多肽”)。在优选的方面,所述同源多肽包含的氨基酸序列与SEQ ID NO:26、SEQ ID NO:28或SEQ ID NO:30的成熟多肽有十个氨基酸,优选五个氨基酸,更优选四个氨基酸,甚至更优选三个氨基酸,最优选两个氨基酸以及甚至最优选一个氨基酸不同。
具有β-葡糖苷酶活性的多肽优选包含或其组成为SEQ ID NO:26、SEQ IDNO:28或SEQ ID NO:30的氨基酸序列或其等位变体,或者其具有β-葡糖苷酶活性的片段。在优选的方面,所述多肽包含或其组成为SEQ ID NO:26、SEQ ID NO:28或SEQ ID NO:30的氨基酸序列。在另一优选的方面,所述多肽包含或者其组成为SEQ ID NO:26、SEQ ID NO:28或SEQ ID NO:30的成熟多肽。在另一优选的方面,所述多肽包含或者其组成为SEQ ID NO:26的氨基酸20至861,或其等位变体;或其具有β-葡糖苷酶活性的片段。在另一优选的方面,所述多肽包含或者其组成为SEQ ID NO:28的氨基酸20至863,或其等位变体;或其具有β-葡糖苷酶活性的片段。在另一优选的方面,所述多肽包含或者其组成为SEQ ID NO:30的氨基酸37至878,或其等位变体;或其具有β-葡糖苷酶活性的片段。在另一优选的方面,所述多肽包含或者其组成为SEQ ID NO:26的氨基酸20至861。在另一优选的方面,多肽包含或者其组成为SEQ ID NO:28的氨基酸20至863。在另一优选的方面,多肽包含或者其组成为SEQ ID NO:30的氨基酸37至878。
在第二方面,具有β-葡糖苷酶活性的分离的多肽由多核苷酸编码,该多核苷酸在至少非常低严紧条件下,优选至少低严紧条件下,更优选至少中严紧条件下,更优选至少中-高严紧条件下,甚至更优选至少高严紧条件下,以及最优选至少非常高严紧条件下与以下杂交:(i)SEQ ID NO:25、SEQ ID NO:27或SEQ ID NO:29的成熟多肽编码序列,(ii)包含在SEQ ID NO:25、SEQ IDNO:27或SEQ ID NO:29的成熟多肽编码序列中的cDNA序列,或(iii)(i)或(ii)的全长互补链。在优选的方面,所述成熟多肽编码序列是SEQ ID NO:25的核苷酸87至2612、SEQ ID NO:27的核苷酸58至2580、SEQ ID NO:29的核苷酸171至2753。
如上所述,SEQ ID NO:25、SEQ ID NO:27或SEQ ID NO:29的核苷酸序列或其亚序列;和SEQ ID NO:25、SEQ ID NO:27或SEQ ID NO:29的氨基酸序列或其片段可以用来设计核酸探针以从不同属和种的菌株鉴定和克隆编码具有β-葡糖苷酶活性的多肽的DNA。
如上所述,就本发明而言,杂交表示核苷酸序列在非常低到非常高严紧条件下与标记的核酸探针杂交,所述核酸探针对应于SEQ ID NO:25、SEQ IDNO:27或SEQ ID NO:29的成熟多肽编码序列、包含在SEQ ID NO:25、SEQID NO:27或SEQ ID NO:29的成熟多肽编码序列中的cDNA序列、它的互补链或其亚序列。
在优选的方面,核酸探针是SEQ ID NO:25、SEQ ID NO:27或SEQ ID NO:29的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:25的核苷酸87至2612、SEQ ID NO:27的核苷酸58至2580、SEQ ID NO:29的核苷酸171至2753。在另一优选的方面,核酸探针是编码SEQ ID NO:26、SEQ ID NO:28或SEQ ID NO:30的多肽的多核苷酸序列或其亚序列。在另一优选的方面,核酸探针是SEQ ID NO:25、SEQ ID NO:27或SEQ ID NO:29。在另一优选的方面,核酸探针是包含在质粒中的多核苷酸序列,该质粒包含在大肠杆菌DSM 14240中,其中它的多核苷酸序列编码具有β-葡糖苷酶活性的多肽。在另一优选的方面,核酸探针是包含在质粒pEJG113中的多核苷酸序列,该质粒包含在大肠杆菌NRRL B-30695中,其中它的多核苷酸序列编码具有β-葡糖苷酶活性的多肽。在另一优选的方面,核酸探针是包含在质粒pKKAB中的多核苷酸序列,该质粒包含在大肠杆菌NRRL B-30860中,其中它的多核苷酸序列编码具有β-葡糖苷酶活性的多肽。在另一优选的方面,核酸探针是包含在质粒中的成熟多肽编码区,该质粒包含在大肠杆菌DSM14240中。在另一优选的方面,核酸探针是包含在质粒pEJG113中的成熟多肽编码区,该质粒包含在大肠杆菌NRRL B-30695中。在另一优选的方面,核酸探针是包含在质粒pKKAB中的成熟多肽编码区,该质粒包含在大肠杆菌NRRL B-30860中。
对于长度至少100个核苷酸的长探针,非常低至非常高严紧性条件如本文所限定。
对于长度至少100个核苷酸的长探针,最终如本文所限定洗涤载体材料。
对于长度大约15个核苷酸至大约70个核苷酸的短探针,严紧性条件如本文所限定。
对于长度大约15个核苷酸至大约70个核苷酸的短探针,最终如本文所限定洗涤载体材料。
在第三方面。具有β-葡糖苷酶活性的多肽由包含如下核苷酸序列或由如下核苷酸序列组成的多核苷酸编码,所述核苷酸序列与SEQ ID NO:25、SEQID NO:27或SEQ ID NO:29的成熟多肽序列具有优选至少70%的序列同一性程度,更优选至少75%,更优选至少80%,甚至更优选至少85%,甚至更优选90%,最优选至少95%,以及甚至最优选至少96%、97%、98%或99%的序列同一性程度,其编码活性多肽。
在优选的方面,所述成熟多肽编码序列是SEQ ID NO:25的核苷酸87至2612、SEQ ID NO:27的核苷酸58至2580或SEQ ID NO:29的核苷酸171至2753。
在第四方面,具有β-葡糖苷酶活性的多肽是人工变体,该人工变体包含取代、缺失和/或插入一个或多个(几个)氨基酸的SEQ ID NO:26、SEQ ID NO:28或SEQ ID NO:30的成熟多肽或其同源序列。制备这样的人工变体的方法如上所述。
SEQ ID NO:26、SEQ ID NO:28或SEQ ID NO:30的成熟多肽的氨基酸取代、缺失和/或插入的总数是10,优选9,更优选8,更优选7,更优选至多6,更优选5,更优选4,甚至更优选3,最优选2,并且甚至最优选1。
在另一优选的方面,纤维素分解酶组合物进一步包含一种或多种选自下组的额外的酶活性:半纤维素酶、酯酶(如脂肪酶、磷脂酶和/或角质酶)、蛋白酶、漆酶和过氧化物酶。在本发明的方法中,可以在发酵之前或过程中,包括发酵的微生物的繁殖过程中或繁殖之后加入所述额外的酶。
所述酶可以源自或获得自任何合适得来源,包括细菌、真菌、酵母、植物或哺乳动物来源,如本文所述。术语“获得”在此表示可能已经将所述酶从天然产生该酶作为天然酶的生物中分离。术语“获得”在此还表示所述酶可能已经采用本文所述的方法在宿主生物中重组产生,其中所述重组产生的酶对于该宿主生物是天然的或外源的,或具有修饰的氨基酸序列,例如缺失、插入和/或取代一个或多个氨基酸,即重组产生的酶是天然氨基酸序列的突变体和/或片段,或通过本领域已知的核酸改组方法产生的酶。天然酶的意思中包含天然变体,而外源酶的意思中包含重组获得的变体,例如通过定点诱变或改组获得的变体。
本发明中使用的酶可以是适合用于本文描述的方法中的任何形式,例如,含有或不含细胞的粗发酵液或基本上纯的多肽。所述酶可以是干粉或颗粒、无尘颗粒、液体、稳定化的液体或受保护的酶(protected enzyme)。例如,颗粒可以如美国专利Nos.4,106,991和4,661,452所公开的来产生,并且可以任选地通过本领域内已知的方法来涂覆。例如,液体酶制备物可以根据已经建立的方法通过添加稳定剂来稳定化,所述稳定剂例如糖、糖醇或其它多元醇,和/或乳酸或其它有机酸。受保护的酶可以根据EP 238,216中公开的方法制备。
在优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽和一种或多种(几种)选自下组的组分:具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性和纤维素结合域的CEL7多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有β-葡糖苷酶活性的多肽和一种或多种(几种)选自下组的组分:具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性和纤维素结合域的CEL7多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性和纤维素结合域的CEL7多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL 12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽和具有内切葡聚糖酶活性的CEL7多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽和具有内切葡聚糖酶活性的CEL12多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽和具有内切葡聚糖酶活性的CEL45多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽和具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。
在另一优选的方面,纤维素水解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素水解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL12多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL45多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽和具有内切葡聚糖酶活性的CEL12多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽和具有内切葡聚糖酶活性的CEL45多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽和具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL12多肽和具有内切葡聚糖酶活性的CEL45多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL12多肽和具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL12多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL45多肽和具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL45多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL45多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL12多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL12多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽和具有内切葡聚糖酶活性的CEL45多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽和具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽和具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有纤维二糖水解酶及纤维素结合域的CEL7多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶及纤维素结合域的CEL7多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL12多肽、具有纤维二糖水解酶及纤维素结合域的CEL7多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL45多肽和具有纤维二糖水解酶及纤维素结合域的CEL7多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL45多肽和具有纤维二糖水解酶而不具有纤维素结合域的CEL7多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL12多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽和具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。
在另一优选的方面,纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。
具有内切葡聚糖酶、纤维二糖水解酶或β-葡糖苷酶活性的多肽的来源
具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽或具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽、以及具有β-葡糖苷酶活性的多肽,可以获得自任何属的微生物。就本发明而言,如用于本文与给定的来源有关的术语“获得自”的意思应为核苷酸序列编码的多肽由所述来源产生,或由其中插入了来自所述来源的核苷酸序列的菌株产生。在优选的方面,获得自给定来源的多肽是细胞外分泌的。
具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽和/或具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽可以从
Figure G2008800241104D00391
LDI,
Figure G2008800241104D00392
LBR或
Figure G2008800241104D00393
150L(Dyadic International,Inc.,Jupiter,FL,USA)中获得。
具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽或具有β-葡糖苷酶活性的多肽可以是细菌多肽。例如,所述多肽可以是革兰氏阳性细菌的多肽如芽孢杆菌属(Bacillus)、链球菌属(Streptococcus)、链霉菌属(Streptomyces)、葡萄球菌(Staphylococcus)、肠球菌属(Enterococcus)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、梭菌属(Clostridium)、地芽孢杆菌属(Geobacillus)或海洋芽孢菌属(Oceanobacillus)多肽,或革兰氏阴性细菌的多肽如大肠杆菌、假单孢菌属(Pseudomonas)、沙门氏菌属(Salmonella)、弯曲杆菌属(Campylobacter)、螺杆菌属(Helicobacter)、黄杆菌属(Flavobacterium)、梭杆菌属(Fusobacterium)、泥杆菌属(Ilyobacter)、奈瑟氏菌属(Neisseria)或脲原体属(Ureaplasma)多肽。
在优选的方面,多肽是嗜碱芽孢杆菌(Bacillus alkalophilus)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、短芽孢杆菌(Bacillus brevis)、环状芽孢杆菌(Bacillus circulans)、克劳氏芽孢杆菌(Bacillus clausii)、凝结芽孢杆菌(Bacilluscoagulans)、坚强芽孢杆菌(Bacillus firmus)、灿烂芽孢杆菌(Bacillus lautus)、迟缓芽孢杆菌(Bacillus lentus)、地衣芽孢杆菌(Bacillus licheniformis)、巨大芽孢杆菌(Bacillus megaterium)、短小芽孢杆菌(Bacillus pumilus)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)、枯草芽孢杆菌(Bacillus subtilis)或苏云金芽孢杆菌(Bacillus thuringiensis)多肽。
在另一优选的方面,多肽是似马链球菌(Streptococcus equisimilis)、酿脓链球菌(Streptococcus pyogenes)、乳房链球菌(Streptococcus uberis)或马链球菌兽瘟亚种(Streptococcus equi subsp.Zooepidemicus)多肽。
在另一优选的方面,多肽是不产色链霉菌(Streptomyces achromogenes)、除虫链霉菌(Streptomyces avermitilis)、天蓝色链霉菌(Streptomyces coelicolor)、灰色链霉菌(Streptomyces griseus)或浅青紫链霉菌(Streptomyces lividans)多肽。
具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽或具有β-葡糖苷酶活性的多肽还可以是真菌多肽,并且更优选是酵母多肽例如念珠菌属(Candida)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)或西洋蓍霉属(Yarrowia)多肽;或更优选是丝状真菌多肽例如枝顶孢霉属(Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、金孢子菌属(Chrysosporium)、隐球菌属(Cryptococcus)、Filibasidium、镰孢属(Fusarium)、腐质霉属(Humicola)、梨孢菌属(Magnaporthe)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、新考玛脂霉属(Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、瘤胃壶菌属(Piromyces)、裂褶菌属(Schizophyllum)、踝节菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)或木霉属(Trichoderma)多肽。
在优选的方面,多肽是卡尔酵母(Saccharomyces carlsbergensis)、酿酒酵母(Saccharomyces cerevisiae)、糖化酵母(Saccharomyces diastaticus)、道格拉氏酵母(Saccharomyces douglasii)、克鲁弗酵母(Saccharomyces kluyveri)、诺地酵母(Saccharomyces norbensis)或卵形酵母(Saccharomyces oviformis)多肽。
在另一优选的方面,多肽是棘孢曲霉(Aspergillus aculeatus)、泡盛曲霉(Aspergillus awamori)、烟曲霉、臭曲霉(Aspergillus foetidus)、日本曲霉(Aspergillus japonicus)、构巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillusniger)、米曲霉、Chrysosporium lucknowense、灰盖鬼伞(Coprinus cinereus)、棉色二孢(Diplodia gossyppina)、杆孢状镰孢(Fusarium bactridioides)、禾谷镰孢(Fusarium cerealis)、库威镰孢(Fusarium crookwellense)、大刀镰孢(Fusariumculmorum)、禾本科镰孢(Fusarium graminearum)、禾赤镰孢(Fusariumgraminum)、异孢镰孢(Fusarium heterosporum)、合欢木镰孢(Fusariumnegundi)、尖镰孢(Fusarium oxysporum)、多枝镰孢(Fusarium reticulatum)、粉红镰孢(Fusarium roseum)、接骨木镰孢(Fusarium sambucinum)、肤色镰孢(Fusarium sarcochroum)、拟分枝孢镰孢(Fusarium sporotrichioides)、硫色镰孢(Fusarium sulphureum)、圆镰孢(Fusarium torulosum)、拟丝孢镰孢(Fusariumtrichothecioides)、镶片镰孢(Fusarium venenatum)、特异腐质霉(Humicolainsolens)、疏棉状腐质霉(Humicola lanuginosa)、灰梨孢菌(Magnaporthegrisea)、米赫毛霉(Mucor miehei)、嗜热毁丝霉(Myceliophthora thermophla)、粗糙脉孢菌(Neurospora crassa)、产紫青霉(Penicillium purpurogenum)、黄孢原毛平革菌(Phanerochaete chrysosporium)、淡黑假黑盘菌(Pseudoplectanianigrella)、橙色嗜热子囊菌(Thermoascus aurantiacus)、土生梭孢霉(Thielaviaterrestris)、哈茨木霉(Trichoderma harzianum)、康宁木霉(Trichoderma koningii)、长枝木霉(Trichoderma longibrachiatum)、里氏木霉(Trichoderma reesei)、绿色木霉(Trichoderma viride)或Trichophaea saccata多肽。
可理解的是对于前述的种,本发明包含完全和不完全阶段(perfect andimperfect states)两种,和其它分类学的等同物(equivalent),例如无性型(anamorph),无论它们已知的种名。本领域熟练技术人员将轻易地识别适合的等同物的身份。
这些种的菌株在许多培养物保藏中心对于公众能够容易地取得,所述保藏中心诸如美国典型培养物保藏中心(the American Type Culture Collection)(ATCC)、德意志微生物和细胞培养物保藏中心(Deutsche Sammiung vonMikroorganismen und Zellkulturen GmbH)(DSM)、真菌菌种保藏中心(Centraalbureau Voor Schimmelcultures)(CBS)和农业研究机构专利培养物保藏中心北区研究中心,北方区研究中心(Agricultural Research Service PatentCulture Collection,Northern Regional Research Center)(NRRL)。
此外,可以使用上述的探针从其它来源,包括从自然界(例如,土壤、堆肥、水等)分离的微生物鉴定和获得这些多肽。用于从天然生境(habitat)分离微生物的技术是本领域内公知的。随后可通过相似地筛选这种微生物的基因组或cDNA文库来获得所述多核苷酸。一旦用所述探针检测到编码多肽的多核苷酸序列,就能够使用本领域普通技术人员熟知的技术来分离或克隆所述多核苷酸(参见,例如,Sambrook等人,1989,见上文)。
多肽还可以包括融合多肽或可切割的融合多肽,其中将另一种多肽融合到所述多肽或其片段的N末端或C末端。通过将编码另一种多肽的核苷酸序列(或其部分)融合于本发明的核苷酸序列(或其部分)来产生融合的多肽。产生融合多肽的技术是本领域已知的,包括连接编码多肽的编码序列以使它们在阅读框中,并且使融合多肽的表达在相同启动子和终止子的控制下。
融合多肽可进一步包含切割位点。通过融合蛋白的分泌,位点被切割以释放来自融合蛋白的有活性的多肽。切割位点的例子包括,而不局限于,编码赖氨酸-精氨酸二肽的Kex2位点(Martin等人,2003,J.Ind.Microbiol.Biotechnol.3:568-76;Svetina等人,2000,J.Biotechnol.76:245-251;Rasmussen-Wilson等人,1997,Appl.Environ.Microbiol.63:3488-3493;Ward等人,1995,Biotechnology 13:498-503和Contreras等人,1991,Biotechnology9:378-381),在精氨酸残基之后被因子Xa蛋白酶切割的异亮氨酸-(谷氨酸或天冬氨酸)-甘氨酸-精氨酸位点(Eaton等人,1986,Biochem.25:505-512);在赖氨酸之后被肠激酶切割的天冬氨酸-天冬氨酸-天冬氨酸-天冬氨酸-赖氨酸位点(Collins-Racie等人,1995,Biotechnology 13:982-987);被Genenase I切割的组氨酸-酪氨酸-谷氨酸或组氨酸-酪氨酸-天冬氨酸位点(Carte等人,1989,Proteins:Structure,Function and Genetics 6:240-248);在精氨酸之后被凝血酶切割的亮氨酸-缬氨酸-脯氨酸-精氨酸-甘氨酸-丝氨酸位点(Stevens,2003,DrugDiscovery World 4:35-48);在谷氨酰胺之后被TEV蛋白酶切割的谷氨酸-天冬酰胺-亮氨酸-酪氨酸-苯丙氨酸-谷氨酰胺-甘氨酸位点(Stevens,2003,见上文);和在谷氨酰胺之后被遗传工程化的来自人鼻病毒的3C蛋白酶切割的亮氨酸-谷氨酸-缬氨酸-亮氨酸-苯丙氨酸-谷氨酰胺-甘氨酸-脯氨酸位点(Stevens,2003,见上文)。
编码具有内切葡聚糖酶或纤维二糖水解酶活性的多肽的多核苷酸
如在本文中所述,包含或其组成为编码具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽或具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽的核苷酸序列的多核苷酸能够被分离和利用以实施本发明的方法。
所述多核苷酸包含如下核苷酸序列或由如下核苷酸序列组成,所述核苷酸序列与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7或SEQID NO:9的成熟多肽编码序列具有优选至少70%的序列同一性程度,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%、97%、98%或99%同一性,其编码具有酶活性的多肽。
在优选的方面,编码具有内切葡聚糖酶活性的CEL7多肽的核酸序列包含SEQ ID NO:1或由SEQ ID NO:1组成。在另一优选的方面,所述核苷酸序列包含SEQ ID NO:1的成熟多肽编码区或由SEQ ID NO:1的成熟多肽编码区组成。本发明还包括核苷酸序列,其编码包含SEQ ID NO:2的氨基酸序列或其成熟多肽或由SEQ ID NO:2的氨基酸序列或其成熟多肽组成的多肽,其由于遗传密码的简并性而与SEQ ID NO:1不同。本发明还涉及SEQ ID NO:1的亚序列,该亚序列编码具有CEL7内切葡聚糖酶活性的SEQ ID NO:2的片段。
在另一优选的方面,编码具有内切葡聚糖酶活性的CEL12多肽的核苷酸序列包含SEQ ID NO:3或由SEQ ID NO:3组成。在另一优选的方面,所述核苷酸序列包含SEQ ID NO:3的成熟多肽编码区或由SEQ ID NO:3的成熟多肽编码区组成。本发明还包括编码包含SEQ ID NO:4的氨基酸序列或其成熟多肽或由SEQ ID NO:4的氨基酸序列或其成熟多肽组成的多肽的核酸序列,其由于遗传密码的简并性而与SEQ ID NO:3不同。本发明还涉及SEQ IDNO:3的亚序列,该亚序列编码具有CEL12内切葡聚糖酶活性的SEQ ID NO:4的片段。
在另一优选的方面,编码具有内切葡聚糖酶活性的CEL45多肽的核苷酸序列包含SEQ ID NO:5或由SEQ ID NO:5组成。在另一优选的方面,所述核苷酸序列是SEQ ID NO:5的成熟多肽编码区。本发明还包括编码包含SEQIDNO:6的氨基酸序列或其成熟多肽或由SEQ ID NO:6的氨基酸序列或其成熟多肽组成的多肽的核酸序列,其由于遗传密码的简并性而与SEQ ID NO:5不同。本发明还涉及SEQ ID NO:5的亚序列,其编码具有CEL45内切葡聚糖酶活性的SEQ ID NO:6的片段。
在另一优选的方面,编码具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽的核苷酸序列包含SEQ ID NO:7或由SEQ ID NO:7组成。在另一优选的方面,所述核苷酸序列包含SEQ ID NO:7的成熟多肽编码区或由SEQIDNO:7的成熟多肽编码区组成。本发明还包括编码包含SEQ ID NO:8的氨基酸序列或其成熟多肽或由SEQ ID NO:8的氨基酸序列或其成熟多肽组成的多肽的核酸序列,其由于遗传密码的简并性而与SEQ ID NO:7不同。本发明还涉及SEQ ID NO:7的亚序列,其编码具有CEL7纤维二糖水解酶活性的SEQ ID NO:16的片段。
在另一优选的方面,编码具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽的核苷酸序列包含SEQ ID NO:9或由SEQ ID NO:9组成。在另一优选的方面,所述核苷酸序列包含SEQ ID NO:9的成熟多肽编码区或由SEQ ID NO:9的成熟多肽编码区组成。本发明还包括编码包含SEQ ID NO:10的氨基酸序列或其成熟多肽或由SEQ ID NO:10的氨基酸序列或其成熟多肽组成的多肽的核苷酸序列,其由于遗传密码的简并性而与SEQ ID NO:9不同。本发明也涉及SEQ ID NO:9的亚序列,其编码具有CEL7纤维二糖水解酶活性的SEQ ID NO:18的片段。
本发明还涉及在SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ IDNO:7或SEQ ID NO:9的成熟多肽编码序列中包含至少一个突变的突变多核苷酸,其中所述突变核苷酸序列编码SEQ ID NO:2、SEQ ID NO:4、SEQ IDNO:6、SEQ ID NO:8或SEQ ID NO:10的成熟多肽。在优选的方面,所述成熟多肽是SEQ ID NO:2的氨基酸21至456、SEQ ID NO:4的氨基酸16至247、SEQ ID NO:6的氨基酸19至225、SEQ ID NO:8的氨基酸18至526、或SEQIDNO:10的氨基酸21至450。在另一优选的方面,所述成熟多肽编码序列是SEQ ID NO:1的核苷酸61至1368、SEQ ID NO:3的核苷酸46至741、SEQIDNO:5的核苷酸55至675、SEQ ID NO:7的核苷酸52至1645、SEQ ID NO:9的核苷酸61至1350。
用于分离或克隆编码这种多肽的多核苷酸的技术是本领域内已知的,包括从基因组DNA分离,从cDNA制备,或其组合。可通过例如使用熟知的聚合酶链式反应(PCR)或表达文库的抗体筛选来检测具有共有结构特性的克隆DNA片段,从而实现从这种基因组DNA克隆多核苷酸。参见,例如,Innis等人,1990,PCR:A Guide to Methods and Application,Academic Press,NewYork。可以使用其它核酸扩增方法,例如连接酶链式反应(LCR)、连接活化转录(ligated activated transcription;LAT)和基于核苷酸序列的扩增(NASBA)。多核苷酸可以是所述核苷酸序列的多肽编码区的等位基因变体或种变体(species variant)。
所述多核苷酸也可以是编码具有内切葡聚糖酶或纤维二糖水解酶活性的多肽的多核苷酸,其在至少非常低严紧条件下,优选至少低严紧条件,更优选至少中严紧条件,更优选至少中-高严紧条件,甚至更优选至少高严紧条件,并且最优选至少非常高严紧条件下,与以下杂交:(i)SEQ ID NO:1、SEQ IDNO:3、SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9的成熟多肽编码序列,(ii)包含SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:9的成熟多肽编码序列的基因组DNA序列或包含在SEQ ID NO:5或SEQ ID NO:7的成熟多肽编码序列中的cDNA序列,或(iii)(i)或(ii)的全长互补链;或它们的等位变体和亚序列(Sambrook等人,1989,见上文),如本文所定义的。
在优选的方面,所述成熟多肽编码序列是SEQ ID NO:1的核苷酸61至1368、SEQ ID NO:3的核苷酸46至741、SEQ ID NO:5的核苷酸55至675、SEQ ID NO:7的核苷酸52至1645或SEQ ID NO:9的核苷酸61至1350。
编码具有β-葡糖苷酶活性的多肽的多核苷酸
多核苷酸包含如下核苷酸序列或由如下核苷酸序列组成,所述核苷酸序列编码具有β-葡糖苷酶活性的多肽,可分离所述多核苷酸并且用于实施本发明的方法,如本文所述。
所述多核苷酸包含如下核苷酸序列或由如下核苷酸序列组成,所述核苷酸序列与SEQ ID NO:25,SEQ ID NO:27或SEQ ID NO:29的成熟多肽编码序列具有优选至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%、97%、98%或99%的序列同一性程度,其编码具有酶活性的多肽。
在优选的方面,编码具有β-葡糖苷酶活性的核苷酸序列包含SEQ ID NO:25、SEQ ID NO:27或SEQ ID NO:29或由SEQ ID NO:25、SEQ ID NO:27或SEQ ID NO:29组成。在另一优选的方面,所述核苷酸序列包含SEQ ID NO:25、SEQ ID NO:27或SEQ ID NO:29的成熟多肽编码区或由SEQ ID NO:25、SEQ ID NO:27或SEQ ID NO:29的成熟多肽编码区组成。本发明也包括编码如下多肽的核苷酸序列,该多肽包含或其组成为SEQ ID NO:26、SEQ ID NO:28或SEQ ID NO:30的氨基酸序列或其成熟多肽,由于遗传密码的简并性,所述核苷酸序列分别不同于SEQ ID NO:25、SEQ ID NO:27或SEQ ID NO:29。本发明也涉及SEQ ID NO:25、SEQ ID NO:27或SEQ ID NO:29的亚序列,其编码具有β-葡糖苷酶活性的SEQ ID NO:26、SEQ ID NO:28或SEQ IDNO:30的片段。
本发明还涉及在SEQ ID NO:25、SEQ ID NO:27或SEQ ID NO:29的成熟多肽编码序列中包含至少一个突变的突变多核苷酸,其中所述突变核苷酸序列编码SEQ ID NO:26、SEQ ID NO:28或SEQ ID NO:30的成熟多肽。在优选的方面,所述成熟多肽是SEQ ID NO:26的氨基酸20至861、SEQ ID NO:28的氨基酸20至863或SEQ ID NO:30的氨基酸37至878。在另一优选的方面,所述成熟多肽编码序列是SEQ ID NO:25的核苷酸87至2612、SEQ IDNO:27的核苷酸58至2580或SEQ ID NO:29的核苷酸171至2753。
用于分离或克隆编码这种多肽的多核苷酸的技术是本领域内已知的,包括从基因组DNA分离,从cDNA制备,或其组合,如上所述。
所述多核苷酸也可以是编码具有β-葡糖苷酶活性的多肽的多核苷酸,其在至少非常低严紧条件下,优选至少低严紧条件,更优选至少中严紧条件,更优选至少中-高严紧条件,甚至更优选至少高严紧条件,并且最优选至少非常高严紧条件下,与以下杂交:(i)SEQ ID NO:25、SEQ ID NO:27或SEQ IDNO:29的成熟多肽编码序列,(ii)包含在SEQ ID NO:25、SEQ ID NO:27或SEQ ID NO:29的成熟多肽编码序列中的cDNA序列,或者(iii)(i)或(ii)的全长互补链;或它们的等位变体和亚序列,如本文所定义的。
在优选的方面,所述成熟多肽编码序列是SEQ ID NO:25的核苷酸87至2612、SEQ ID NO:27的核苷酸58至2580或SEQ ID NO:29的核苷酸171至2753。
具有增强纤维素分解的活性的多肽
在第一方面,具有增强纤维素分解的活性的分离的多肽包含以下基序(motif):
[ILMV]-P-X(4,5)-G-X-Y-[ILMV]-X-R-X-[EQ]-X(4)-[HNQ]和[FW]-[TF]-K-[AIV],
其中X是任何氨基酸,X(4,5)是在4或5个邻接位置上的任何氨基酸并且X(4)是在4个连邻接位置上的任何氨基酸。
包含上述基序的分离的多肽可进一步包含:
H-X(1,2)-G-P-X(3)-[YW]-[AILMV],
[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV],或
H-X(1,2)-G-P-X(3)-[YW]-[AILMV]和
[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV],
其中X是任何氨基酸,X(1,2)是在1个位置或2个邻接位置上的任何氨基酸,X(3)是在3个邻接位置上的任何氨基酸并且X(2)是在2个邻接位置上的任何氨基酸。在以上基序中,采用公认的IUPAC单字母氨基酸缩写。
在优选的方面,具有增强纤维素分解的活性的分离的多肽进一步包含H-X(1,2)-G-P-X(3)-[YW]-[AILMV]。在另一优选的方面,具有增强纤维素分解的活性的分离的多肽还包含[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV]。在另一优选的方面,具有增强纤维素分解的活性的分离的多肽还包含H-X(1,2)-G-P-X(3)-[YW]-[AILMV]和[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV]。
在第二方面,具有增强纤维素分解的活性的分离的多肽包含以下基序:
[ILMV]-P-x(4,5)-G-x-Y-[ILMV]-x-R-x-[EQ]-x(3)-A-[HNQ],
其中x是任何氨基酸,x(4,5)是在4或5个邻接位置上的任何氨基酸以及x(3)是在3个邻接位置上的任何氨基酸。在以上基序中,采用公认的IUPAC单字母氨基酸缩写。
在第三个方面,具有增强纤维素分解的活性的分离的多肽包含的氨基酸序列与SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18或SEQ ID NO:20、SEQ ID NO:22或SEQ ID NO:24的成熟多肽具有优选至少70%,更优选至少75%,更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%、97%、98%或99%的序列同一性程度,所述多肽具有增强纤维素分解的活性(下文中的“同源多肽”)。在优选的方面,所述同源多肽包含的氨基酸序列与SEQ ID NO:12、SEQID NO:14、SEQ ID NO:16、SEQ ID NO:18或SEQ ID NO:20、SEQ ID NO:22或SEQ ID NO:24的成熟多肽有十个氨基酸,优选五个氨基酸,更优选四个氨基酸,甚至更优选三个氨基酸,最优选两个氨基酸以及甚至最优选一个氨基酸的不同。
具有增强纤维素分解的活性的多肽优选包含SEQ ID NO:12的氨基酸序列或其等位变体;或它们的具有增强纤维素分解的活性的片段。在优选的方面,所述多肽包含SEQ ID NO:12的氨基酸序列。在另一优选的方面,所述多肽包含SEQ ID NO:12的成熟多肽。在另一优选的方面,所述多肽包含SEQID NO:12的氨基酸20至326,或其等位变体;或它们的具有增强纤维素分解的活性的片段。在另一优选的方面,所述多肽包含SEQ ID NO:12的氨基酸20至326。在另一优选的方面,所述多肽由SEQ ID NO:12的氨基酸序列或其等位变体组成;或者由它们具有增强纤维素分解的活性的片段组成。在另一优选的方面,所述多肽由SEQ ID NO:12的氨基酸序列组成。在另一优选的方面,所述多肽由SEQ ID NO:12的成熟多肽组成。在另一优选的方面,所述多肽由SEQ ID NO:12的氨基酸20至326或其等位变体组成;或者由它们的具有增强纤维素分解的活性的片段组成。在另一优选的方面,所述多肽由SEQ ID NO:12的氨基酸20至326组成。
具有增强纤维素分解的活性的多肽优选包含SEQ ID NO:14的氨基酸序列或其等位变体;或者它们的具有增强纤维素分解的活性的片段。在优选的方面,所述多肽包含SEQ ID NO:14的氨基酸序列。在另一优选的方面,多肽包含SEQ ID NO:14的成熟多肽。在另一优选的方面,所述多肽包含SEQ IDNO:14的氨基酸18至240,或其等位变体;或它们的具有增强纤维素分解的活性的片段。在另一优选的方面,所述多肽包含SEQ ID NO:14的氨基酸18至240。在另一优选的方面,所述多肽由SEQ ID NO:14的氨基酸序列或其等位变体组成;或由它们的具有增强纤维素分解的活性的片段组成。在另一优选的方面,所述多肽由SEQ ID NO:14的氨基酸序列组成。在另一优选的方面,所述多肽由SEQ ID NO:14的成熟多肽组成。在另一优选的方面,所述多肽由SEQ ID NO:14的氨基酸18至240或其等位变体组成;或由它们的具有增强纤维素分解的活性的片段组成。在另一优选的方面,所述多肽由SEQ IDNO:14的氨基酸18至240组成。
具有增强纤维素分解的活性的多肽优选包含SEQ ID NO:16的氨基酸序列或其等位变体;或它们的具有增强纤维素分解的活性的片段。在优选的方面,所述多肽包含SEQ ID NO:16的氨基酸序列。在另一优选的方面,所述多肽包含SEQ ID NO:16的成熟多肽。在另一优选的方面,所述多肽包含SEQID NO:16的氨基酸20至258,或其等位变体;或它们的具有增强纤维素分解的活性的片段。在另一优选的方面,所述多肽包含SEQ ID NO:16的氨基酸20至258。在另一优选的方面,所述多肽由SEQ ID NO:16的氨基酸序列或其等位变体组成;或由它们的具有增强纤维素分解的活性的片段组成。在另一优选的方面,所述多肽由SEQ ID NO:16的氨基酸序列组成。在另一优选的方面,所述多肽由SEQ ID NO:16的成熟多肽组成。在另一优选的方面,所述多肽由SEQ ID NO:16的氨基酸20至258或其等位变体组成;或由它们的具有增强纤维素分解的活性的片段组成。在另一优选的方面,所述多肽由SEQ ID NO:16的氨基酸20至258组成。
具有增强纤维素分解的活性的多肽优选包含SEQ ID NO:18的氨基酸序列或其等位变体;或它们的具有增强纤维素分解的活性的片段。在优选的方面,所述多肽包含SEQ ID NO:18的氨基酸序列。在另一优选的方面,所述多肽包含SEQ ID NO:18的成熟多肽。在另一优选的方面,所述多肽包含SEQID NO:18的氨基酸19至226,或其等位变体;或它们的具有增强纤维素分解的活性的片段。在另一优选的方面,所述多肽包含SEQ ID NO:18的氨基酸19至226。在另一优选的方面,所述多肽由SEQ ID NO:18的氨基酸序列或其等位变体组成;或由它们的具有增强纤维素分解的活性的片段组成。在另一优选的方面,所述多肽由SEQ ID NO:18的氨基酸序列组成。在另一优选的方面,所述多肽由SEQ ID NO:18的成熟多肽组成。在另一优选的方面,所述多肽由SEQ ID NO:18的氨基酸19至226或其等位变体组成;或由它们的具有增强纤维素分解的活性的片段组成。在另一优选的方面,所述多肽由SEQ ID NO:18的氨基酸19至226组成。
具有增强纤维素分解的活性的多肽优选包含SEQ ID NO:20的氨基酸序列或其等位变体;或它们的具有增强纤维素分解的活性的片段。在优选的方面,所述多肽包含SEQ ID NO:20的氨基酸序列。在另一优选的方面,所述多肽包含SEQ ID NO:20的成熟多肽。在另一优选的方面,所述多肽包含SEQID NO:20的氨基酸20至304,或其等位变体;或它们的具有增强纤维素分解的活性的片段。在另一优选的方面,所述多肽包含SEQ ID NO:20的氨基酸20至304。在另一优选的方面,所述多肽由SEQ ID NO:20的氨基酸序列或其等位变体组成;或由它们的具有增强纤维素分解的活性的片段组成。在另一优选的方面,所述多肽由SEQ ID NO:20的氨基酸序列组成。在另一优选的方面,所述多肽由SEQ ID NO:20的成熟多肽组成。在另一优选的方面,所述多肽由SEQ ID NO:20的氨基酸20至304或其等位变体组成;或由它们的具有增强纤维素分解的活性的片段组成。在另一优选的方面,所述多肽由SEQ ID NO:20的氨基酸20至304组成。
具有增强纤维素分解的活性的多肽优选包含SEQ ID NO:22的氨基酸序列或其等位变体;或它们的具有增强纤维素分解的活性的片段。在优选的方面,所述多肽包含SEQ ID NO:22的氨基酸序列。在另一优选的方面,所述多肽包含SEQ ID NO:22的成熟多肽。在另一优选的方面,所述多肽包含SEQID NO:22的氨基酸23至250,或其等位变体;或它们的具有增强纤维素分解的活性的片段。在另一优选的方面,所述多肽包含SEQ ID NO:22的氨基酸23至250。在另一优选的方面,所述多肽由SEQ ID NO:22的氨基酸序列或其等位变体组成;或由它们的具有增强纤维素分解的活性的片段组成。在另一优选的方面,所述多肽由SEQ ID NO:22的氨基酸序列组成。在另一优选的方面,所述多肽由SEQ ID NO:22的成熟多肽组成。在另一优选的方面,所述多肽由SEQ ID NO:22的氨基酸23至250或其等位变体组成;或由它们的具有增强纤维素分解的活性的片段组成。在另一优选的方面,所述多肽由SEQ ID NO:22的氨基酸23至250组成。
具有增强纤维素分解的活性的多肽优选包含SEQ ID NO:24的氨基酸序列或其等位变体;或它们的具有增强纤维素分解的活性的片段。在优选的方面,所述多肽包含SEQ ID NO:24的氨基酸序列。在另一优选的方面,所述多肽包含SEQ ID NO:24的成熟多肽。在另一优选的方面,所述多肽包含SEQIDNO:24的氨基酸20至249,或其等位变体;或它们的具有增强纤维素分解的活性的片段。在另一优选的方面,所述多肽包含SEQ ID NO:24的氨基酸20至249。在另一优选的方面,所述多肽由SEQ ID NO:24的氨基酸序列或其等位变体组成;或由它们的具有增强纤维素分解的活性的片段组成。在另一优选的方面,所述多肽由SEQ ID NO:24的氨基酸序列组成。在另一优选的方面,所述多肽由SEQ ID NO:24的成熟多肽组成。在另一优选的方面,所述多肽由SEQ ID NO:24的氨基酸20至249或其等位变体组成;或由它们的具有增强纤维素分解的活性的片段组成。在另一优选的方面,所述多肽由SEQ ID NO:24的氨基酸20至249组成。
在第四方面,具有增强纤维素分解的活性的分离的多肽由如下多核苷酸编码,所述多核苷酸在至少非常低严紧条件下,优选至少低严紧条件下,更优选至少中严紧条件下,更优选至少中-高严紧条件下,甚至更优选至少高严紧条件下,并且最优选至少非常高严紧条件下,与以下杂交:(i)SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQIDNO:21或SEQ ID NO:23的成熟多肽编码序列,(ii)包含在SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15或SEQ ID NO:21的成熟多肽编码序列中的cDNA序列,或包含SEQ ID NO:17、SEQ ID NO:19或SEQ ID NO:23的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链。在优选的方面。成熟多肽编码序列是SEQ ID NO:11的核苷酸388至1332、SEQ IDNO:13的核苷酸98至821、SEQ ID NO:15的核苷酸126至978、SEQ ID NO:17的核苷酸55至678、SEQ ID NO:19的核苷酸58至912、SEQ ID NO:21的核苷酸67至796、或SEQ ID NO:23的核苷酸77至766。
SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQID NO:19、SEQ ID NO:21或SEQ ID NO:23的核苷酸序列或其亚序列;以及SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18或SEQID NO:20、SEQ ID NO:22或SEQ ID NO:24的氨基酸序列或其片段,可以用于设计核酸探针,以从不同属和种的菌株鉴定和克隆编码具有增强纤维素分解的活性的多肽的DNA,如上所述。
就本发明而言,杂交表示核苷酸序列在非常低至非常高的严紧条件下与标记的核酸探针杂交,所述核酸探针对应于SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21或SEQ IDNO:23的成熟多肽编码序列、包含在SEQ ID NO:11、SEQ ID NO:13、SEQ IDNO:15或SEQ ID NO:21的成熟多肽编码序列中的cDNA序列、或包含SEQIDNO:17、SEQ ID NO:19或SEQ ID NO:23的成熟多肽编码序列的基因组DNA序列、它的互补链或其亚序列,如上文所述。
在优选的方面,核酸探针是SEQ ID NO:11的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:11的核苷酸388至1332。在另一优选的方面,核酸探针是编码SEQ ID NO:12的多肽的多核苷酸序列,或其亚序列。在另一优选的方面,核酸探针是SEQ ID NO:11。在另一优选的方面,核酸探针是包含在质粒pEJG120中的多核苷酸序列,所述质粒包含在大肠杆菌NRRL B-30699中,其中它的多核苷酸序列编码具有增强纤维素分解的活性的多肽。在另一优选的方面,核酸探针是包含在质粒pEJG120中的成熟多肽编码区,所述质粒包含在大肠杆菌NRRL B-30699中。
在另一优选的方面,核酸探针是SEQ ID NO:13的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:13的核苷酸98至821。在另一优选的方面,核酸探针是编码SEQ ID NO:14的多肽的多核苷酸序列,或其亚序列。在另一优选的方面,核酸探针是SEQ ID NO:13。在另一优选的方面,核酸探针是包含在质粒pTter61C中的多核苷酸序列,所述质粒包含在大肠杆菌NRRL B-30813中,其中它的多核苷酸序列编码具有增强纤维素分解的活性的多肽。在另一优选的方面,核酸探针是包含在质粒pTter61C中的成熟多肽编码区,所述质粒包含在大肠杆菌NRRL B-30813中。
在另一优选的方面,核酸探针是SEQ ID NO:15的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:15的核苷酸126至978。在另一优选的方面,核酸探针是编码SEQ ID NO:16的多肽的多核苷酸序列,或其亚序列。在另一优选的方面,核酸探针是SEQ ID NO:15。在另一优选的方面,核酸探针是包含在质粒pTter61D中的多核苷酸序列,所述质粒包含在大肠杆菌NRRL B-30812中,其中它的多核苷酸序列编码具有增强纤维素分解的活性的多肽。在另一优选的方面,核酸探针是包含在质粒pTter61D中的成熟多肽编码区,所述质粒包含在大肠杆菌NRRL B-30812中。
在另一优选的方面,核酸探针是SEQ ID NO:17的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:17的核苷酸55至678。在另一优选的方面,核酸探针是编码SEQ ID NO:18的多肽的多核苷酸序列,或其亚序列。在另一优选的方面,核酸探针是SEQ ID NO:17。在另一优选的方面,核酸探针是包含在质粒pTter61E中的多核苷酸序列,所述质粒包含在大肠杆菌NRRL B-30814中,其中它的多核苷酸序列编码具有增强纤维素分解的活性的多肽。在另一优选的方面,核酸探针是包含在质粒pTter61E中的成熟多肽编码区,所述质粒包含在大肠杆菌NRRL B-30814中。
在另一优选的方面,核酸探针是SEQ ID NO:19的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:19的核苷酸58至912。在另一优选的方面,核酸探针是编码SEQ ID NO:20的多肽的多核苷酸序列,或其亚序列。在另一优选的方面,核酸探针是SEQ ID NO:19。在另一优选的方面,核酸探针是包含在质粒pTter61G中的多核苷酸序列,所述质粒包含在大肠杆菌NRRL B-30811中,其中它的多核苷酸序列编码具有增强纤维素分解的活性的多肽。在另一优选的方面,核酸探针是包含在质粒pTter61G中的成熟多肽编码区,所述质粒包含在大肠杆菌NRRL B-30811中。
在另一优选的方面,核酸探针是SEQ ID NO:21的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:21的核苷酸67至796。在另一优选的方面,核酸探针是编码SEQ ID NO:22的多肽的多核苷酸序列,或其亚序列。在另一优选的方面,核酸探针是SEQ ID NO:21。在另一优选的方面,核酸探针是包含在质粒pDZA2-7中的多核苷酸序列,所述质粒包含在大肠杆菌NRRL B-30704中,其中它的多核苷酸序列编码具有增强纤维素分解的活性的多肽。在另一优选的方面,核酸探针是包含在质粒pDZA2-7中的成熟多肽编码区,所述质粒包含在大肠杆菌NRRL B-30704中。
在另一优选的方面,核酸探针是SEQ ID NO:23的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:23的核苷酸77至766。在另一优选的方面,核酸探针是编码SEQ ID NO:24的多肽的多核苷酸序列,或其亚序列。在另一优选的方面,核酸探针是SEQ ID NO:23。在另一优选的方面,核酸探针是包含在质粒pTr333中的多核苷酸序列,所述质粒包含在大肠杆菌NRRL B-30878中,其中它的多核苷酸序列编码具有增强纤维素分解的活性的多肽。在另一优选的方面,核酸探针是包含在质粒pTr333中的成熟多肽编码区,所述质粒包含在大肠杆菌NRRL B-30878中。
对于长度至少100个核苷酸的长探针,非常低至非常高的严紧条件如在本文中所定义。
对于长度至少100个核苷酸的长探针,载体材料的最终洗涤如在本文中定义。
对于长度大约15个核苷酸至大约70个核苷酸的短探针,严紧条件如本文所定义。
对于长度大约15个核苷酸至大约70个核苷酸的短探针,载体材料的最终洗涤如在本文中定义。
在第五方面,具有增强纤维素分解的活性的多肽由包含如下核苷酸序列或由如下核苷酸序列组成的多核苷酸编码,所述核苷酸序列与SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQID NO:21或SEQ ID NO:23的成熟多肽编码序列具有优选至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%、97%、98%或99%的序列同一性程度,其编码活性多肽。
在优选的方面,成熟多肽编码序列是SEQ ID NO:11的核苷酸388至1332、SEQ ID NO:13的核苷酸98至821、SEQ ID NO:15的核苷酸126至978、SEQ ID NO:17的核苷酸55至678、SEQ ID NO:19的核苷酸58至912、SEQ ID NO:21的核苷酸67至796、SEQ ID NO:23的核苷酸77至766。参见本文中的多核苷酸部分。
在第六方面,具有增强纤维素分解的活性的多肽是人工变体,所述人工变体包含取代、缺失和/或插入一个或多个(几个)氨基酸的SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18或SEQ ID NO:20、SEQ IDNO:22或SEQ ID NO:24的成熟多肽或其同源序列。制备这样的人工变体的方法如上所述。
SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQIDNO:20、SEQ ID NO:22或SEQ ID NO:24的成熟多肽的氨基酸取代、缺失和/或插入的总数是10,优选9,更优选8,更优选7,更优选至多6,更优选5,更优选4,甚至更优选3,最优选2,并且甚至最优选1。
具有增强纤维素分解的活性的多肽的来源
具有增强纤维素分解的活性的多肽可以获得自任何属的微生物。就本发明而言,用于本文与给定的来源有关的术语“获得自”的意思应为核苷酸序列编码的多肽由所述来源产生,或由其中插入了来自所述来源的核苷酸序列的菌株产生。在优选的方面,获得自给定来源的多肽是胞外分泌的。
具有增强纤维素分解的活性的多肽可以是细菌多肽。例如,所述多肽可以是革兰氏阳性细菌多肽,例如具有增强纤维素分解的活性的芽孢杆菌属、链球菌属、链霉菌属、葡萄球菌属、肠球菌属、乳杆菌属、乳球菌属、梭菌属、地芽孢杆菌属或海洋芽孢杆菌属多肽;或者可以是革兰氏阴性细菌多肽,例如具有增强纤维素分解的活性的大肠杆菌、假单胞菌属、沙门氏菌属、弯曲杆菌属、螺杆菌属、黄杆菌属、梭杆菌属、泥杆菌属、奈瑟氏菌属或脲原体属多肽。
在优选的方面,所述多肽是具有增强纤维素分解的活性的嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌或苏云金芽孢杆菌多肽。
在另一优选的方面,所述多肽是具有增强纤维素分解的活性的似马链球菌、酿脓链球菌、乳房链球菌或马链球菌兽瘟亚种多肽。
在另一优选的方面,所述多肽是具有增强纤维素分解的活性的不产色链霉菌、除虫链霉菌、天蓝色链霉菌、灰色链霉菌或浅青紫链霉菌多肽。
具有增强纤维素分解的活性的多肽还可以是真菌多肽,并且更优选是酵母多肽例如具有增强纤维素分解的活性的念珠菌属、克鲁维酵母属、毕赤酵母属、酵母属、裂殖酵母属或西洋蓍霉属多肽;或更优选是丝状真菌多肽例如具有增强纤维素分解的活性的枝顶孢霉属、蘑菇属(Agaricus)、链格孢属(Alternaria)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、葡萄座腔菌属(Botryospaeria)、拟蜡菌属(Ceriporiopsis)、毛壳菌属(Chaetomidium)、金孢子菌属、麦角属(Claviceps)、旋孢腔菌属(Cochliobolus)、Coprinopsis、Coptotermes、棒囊壳属(Corynascus)、栗疫病菌属(Cryphonectria)、隐球菌属、色二孢属(Diplodia)、黑耳属(Exidia)、Filibasidium、镰孢属、赤霉属(Gibberella)、全鞭毛虫属(Holomastigotoides)、腐质霉属、耙菌属(Irpex)、香菇属(Lentinula)、小球腔菌属(Leptospaeria)、梨孢菌属、Melanocarpus、多孔菌属(Meripilus)、毛霉属、毁丝霉属、新考玛脂霉属、脉孢菌属、拟青霉属、青霉属、平革菌属(Phanerochaete)、瘤胃壶菌属、Poitrasia、假黑盘菌属(Pseudoplectania)、Pseudotrichonympha、根毛霉属(Rhizomucor)、裂褶菌属、柱顶孢属(Scytalidium)、踝节菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属或木霉属、Trichophaea、轮枝孢属(Verticillium)、小包脚菇属(Volvariella)、或炭角菌属(Xylaria)多肽。
在优选的方面,所述多肽是具有增强纤维素分解的活性的卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母或卵形酵母多肽。
在另一个优选的方面,所述多肽是具有增强纤维素分解的活性的解纤维枝顶孢霉(Acremonium cellulolyticus)、棘孢曲霉、泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉黑曲霉、米曲霉、嗜角质金孢子菌(Chrysosporiumkeratinophilum)、Chrysosporium lucknowense、热带金孢子菌(Chrysosporiumtropicum)、Chrysosporium merdarium、Chrysosporium inops、Chrysosporiumpannicola、Chrysosporium queenslandicum、Chrysosporium zonatum、杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、灰腐质霉(Humicolagrisea)、特异腐质霉、疏棉状腐质霉、乳白耙菌(Irpex lacteus)、米赫毛霉、嗜热毁丝霉、粗糙脉孢菌、绳状青霉(Penicillium funiculosum)、产紫青霉、黄孢原毛平革菌、无色梭孢壳(Thielavia achromatica)、Thielavia albomyces、Thielavia albopilosa、澳洲梭孢壳(Thielavia australeinsis)、Thielavia fimeti、小孢子梭孢壳(Thielavia microspora)、Thielavia ovispora、Thielavia peruviana、Thielavia spededonium、毛梭孢壳(Thielavia setosa)、Thielavia subthermophila、土生梭孢霉、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、绿色木霉或Trichophaea saccata多肽。
在更优选的方面,多肽是具有增强纤维素分解的活性的土生梭孢霉多肽。在最优选的方面。多肽是具有增强纤维素分解的活性的土生梭孢霉NRRL8126多肽,例如,SEQ ID NO:12、14、16、18或20的成熟多肽或其具有增强纤维素分解的活性的片段。
在另一更优选的方面,多肽是橙色嗜热子囊菌多肽,例如,SEQ ID NO:22的成熟多肽。
在另一更优选的方面,多肽是具有增强纤维素分解的活性的里氏木酶多肽。在另一最优选的方面,多肽是具有增强纤维素分解的活性的里氏木酶RutC30(ATCC 56765)多肽,例如,SEQ ID NO:24的成熟多肽或其具有增强纤维素分解的活性的片段。
可理解的是对于前述的种,本发明包含完全和不完全阶段两种,和其它分类学的等同物,例如无性型,无论它们已知的种名。本领域熟练技术人员将轻易地识别适合的等同物的身份。
这些种的菌株在许多培养物保藏中心对于公众能够容易地取得,所述保藏中心诸如美国典型培养物保藏中心(the American Type Culture Collection)(ATCC)、德意志微生物和细胞培养物保藏中心(Deutsche Sammiung vonMikroorganismen und Zellkulturen GmbH)(DSM)、真菌菌种保藏中心(Centraalbureau Voor Schimmelcultures)(CBS)和农业研究机构专利培养物保藏中心北区研究中心,北方区研究中心(Agricultural Research Service PatentCulture Collection,Northern Regional Research Center)(NRRL)。
此外,可以使用上述的探针从其它来源,包括从自然界(例如,土壤、堆肥、水等)分离的微生物鉴定和获得这些多肽。用于从天然生境(habitat)分离微生物的技术是本领域内公知的。随后可通过相似地筛选这种微生物的基因组或cDNA文库来获得所述多核苷酸。一旦用所述探针检测到编码多肽的多核苷酸序列,就能够使用本领域普通技术人员熟知的技术来分离或克隆所述多核苷酸(参见,例如,Sambrook等人,1989,见上文)。
具有增强纤维素分解的活性的多肽还包括融合多肽或可切割的融合多肽,其中将另一种多肽融合到所述多肽或其具有增强纤维素分解的活性的片段的N末端或C末端。生产融合多肽的方法如上所述。
关于具有增强纤维素分解的活性的多肽和其多核苷酸的更多细节参见WO 2005/074647、WO 2005/074656或公开的美国申请流水号2007/0077630,将其通过引用并入本文。
编码具有增强纤维素分解的活性的多肽的多核苷酸
多核苷酸包含如下核苷酸序列或由如下核苷酸序列组成,所述核苷酸序列编码具有增强纤维素分解的活性的多肽,可分离所述多核苷酸并且用于实施本发明的方法,如本文所述。
分离的多肽包含如下多核苷酸序列或由如下多核苷酸序列组成,所述多核苷酸序列与SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21或SEQ ID NO:23的成熟多肽编码序列具有优选至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,最优选至少95%,以及甚至最优选至少96%、97%、98%或99%的序列同一性程度,其编码具有增强纤维素分解的活性的多肽。
在优选的方面,所述核苷酸序列包含SEQ ID NO:11或由SEQ ID NO:11组成。在另一个更优选的方面,所述核苷酸序列包含质粒pEJG120中包含的序列,所述质粒包含在大肠杆菌NRRL B-30699中。在另一个优选的方面,所述核苷酸序列包含或其组成为SEQ ID NO:11的成熟多肽编码区。在另一个更优选的方面,所述核苷酸序列包含或其组成为质粒pEJG120中包含的成熟多肽编码区,所述质粒包含在大肠杆菌NRRL B-30699中。本发明还包含如下核苷酸序列,所述核苷酸序列编码包含SEQ ID NO:12的氨基酸序列或其成熟多肽或由SEQ ID NO:12的氨基酸序列或其成熟多肽组成的多肽,由于遗传密码的简并性,所述核苷酸序列不同于SEQ ID NO:11。本发明还涉及SEQ ID NO:11的亚序列,所述亚序列编码具有增强纤维素分解的活性的SEQID NO:12的片段。
在另一优选的方面,所述核苷酸序列包含SEQ ID NO:13或由SEQ ID NO:13组成。在另一个更优选的方面,所述核苷酸序列包含或其组成为质粒pTter61C中包含的序列,所述质粒包含在大肠杆菌NRRL B-30813中。在另一个优选的方面,所述核苷酸序列包含SEQ ID NO:13的成熟多肽编码区或由SEQ ID NO:13的成熟多肽编码区组成。在另一个更优选的方面,所述核苷酸序列包含质粒pTter61C中包含的成熟多肽编码区或由质粒pTter61C中包含的成熟多肽编码区组成,所述质粒包含在大肠杆菌NRRL B-30813中。本发明还包含如下核苷酸序列,所述核苷酸序列编码包含SEQ ID NO:14的氨基酸序列或其成熟多肽或由SEQ ID NO:14的氨基酸序列或其成熟多肽组成的多肽,由于遗传密码的简并性,所述核苷酸序列不同于SEQ ID NO:13。本发明还涉及SEQ ID NO:13的亚序列,所述亚序列编码具有增强纤维素分解的活生的SEQ ID NO:14的片段。
在另一优选的方面,所述核苷酸序列包含SEQ ID NO:15或由SEQ ID NO:15组成。在另一个更优选的方面,所述核苷酸序列包含或其组成为质粒pTter61D中包含的序列,所述质粒包含在大肠杆菌NRRL B-30812中。在另一个优选的方面,所述核苷酸序列包含SEQ ID NO:15的成熟多肽编码区或由SEQ ID NO:15的成熟多肽编码区组成。在另一个更优选的方面,所述核苷酸序列包含质粒pTter61D中包含的成熟多肽编码区或由质粒pTter61D中包含的成熟多肽编码区组成,所述质粒包含在大肠杆菌NRRL B-30812中。本发明还包含如下核苷酸序列,所述核苷酸序列编码包含SEQ ID NO:16的氨基酸序列或其成熟多肽或由SEQ ID NO:16的氨基酸序列或其成熟多肽组成的多肽,由于遗传密码的简并性,所述核苷酸序列不同于SEQ ID NO:15。本发明还涉及SEQ ID NO:15的亚序列,所述亚序列编码具有增强纤维素分解的活性的SEQ ID NO:16的片段。
在另一优选的方面,所述核苷酸序列包含SEQ ID NO:17或由SEQ ID NO:17组成。在另一个更优选的方面,所述核苷酸序列包含或其组成为质粒pTter61E中包含的序列,所述质粒包含在大肠杆菌NRRL B-30814中。在另一个优选的方面,所述核苷酸序列包含SEQ ID NO:17的成熟多肽编码区或由SEQ ID NO:17的成熟多肽编码区组成。在另一个更优选的方面,所述核苷酸序列包含质粒pTter61E中包含的成熟多肽编码区或由质粒pTter61E中包含的成熟多肽编码区组成,所述质粒包含在大肠杆菌NRRL B-30814中。本发明还包含如下核苷酸序列,所述核苷酸序列编码包含SEQ ID NO:18的氨基酸序列或其成熟多肽或由SEQ ID NO:18的氨基酸序列或其成熟多肽组成的多肽,由于遗传密码的简并性,所述核苷酸序列不同于SEQ ID NO:17。本发明还涉及SEQ ID NO:17的亚序列,所述亚序列编码具有增强纤维素分解的活性的SEQ ID NO:18的片段。
在另一优选的方面,所述核苷酸序列包含SEQ ID NO:19或由SEQ ID NO:19组成。在另一个更优选的方面,所述核苷酸序列包含或其组成为质粒pTter61G中包含的序列,所述质粒包含在大肠杆菌NRRL B-30811中。在另一个优选的方面,所述核苷酸序列包含SEQ ID NO:19的成熟多肽编码区或由SEQ ID NO:19的成熟多肽编码区组成。在另一个更优选的方面,所述核苷酸序列包含质粒pTter61G中包含的成熟多肽编码区或由质粒pTter61G中包含的成熟多肽编码区组成,所述质粒包含在大肠杆菌NRRL B-30811中。本发明还包含如下核苷酸序列,所述核苷酸序列编码包含SEQ ID NO:20的氨基酸序列或其成熟多肽或由SEQ ID NO:20的氨基酸序列或其成熟多肽组成的多肽,由于遗传密码的简并性,所述核苷酸序列不同于SEQ ID NO:19。本发明还涉及SEQ ID NO:19的亚序列,所述亚序列编码具有增强纤维素分解的活性的SEQ ID NO:20的片段。
在另一优选的方面,所述核苷酸序列包含SEQ ID NO:21或由SEQ ID NO:21组成。在另一个更优选的方面,所述核苷酸序列包含或其组成为质粒pDZA2-7中包含的序列,所述质粒包含在大肠杆菌NRRL B-30704中。在另一个优选的方面,所述核苷酸序列包含SEQ ID NO:21的成熟多肽编码区或由SEQ ID NO:21的成熟多肽编码区组成。在另一个更优选的方面,所述核苷酸序列包含质粒pDZA2-7中包含的成熟多肽编码区或由质粒pDZA2-7中包含的成熟多肽编码区组成,所述质粒包含在大肠杆菌NRRL B-30704中。本发明还包含如下核苷酸序列,所述核苷酸序列编码包含SEQ ID NO:22的氨基酸序列或其成熟多肽或由SEQ ID NO:22的氨基酸序列或其成熟多肽组成,由于遗传密码的简并性,所述核苷酸序列不同于SEQ ID NO:21。本发明还涉及SEQ ID NO:21的亚序列,所述亚序列编码具有增强纤维素分解的活性的SEQ ID NO:22的片段。
在另一优选的方面,所述核苷酸序列包含SEQ ID NO:23或由SEQ ID NO:23组成。在另一个更优选的方面,所述核苷酸序列包含或其组成为质粒pTr3337中包含的序列,所述质粒包含在大肠杆菌NRRL B-30878中。在另一个优选的方面,所述核苷酸序列包含SEQ ID NO:23的成熟多肽编码区或由SEQ ID NO:23的成熟多肽编码区组成。在另一个更优选的方面,所述核苷酸序列包含质粒pTr3337中包含的成熟多肽编码区或由质粒pTr3337中包含的成熟多肽编码区组成,所述质粒包含在大肠杆菌NRRL B-30878中。本发明还包含如下核苷酸序列,所述核苷酸序列编码包含SEQ ID NO:24的氨基酸序列或其成熟多肽或由SEQ ID NO:24的氨基酸序列或其成熟多肽组成的多肽,由于遗传密码的简并性,所述核苷酸序列不同于SEQ ID NO:23或其成熟多肽编码序列。本发明还涉及SEQ ID NO:23的亚序列,所述亚序列编码具有增强纤维素分解的活性的SEQ ID NO:24的片段。
本发明还涉及在SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQIDNO:17、SEQ ID NO:19、SEQ ID NO:21或SEQ ID NO:23的成熟多肽编码序列中包含至少一个突变的突变多核苷酸,其中所述突变核苷酸序列编码SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18或SEQ IDNO:20、SEQ ID NO:22或SEQ ID NO:24的成熟多肽。在优选的方面,所述成熟多肽是SEQ ID NO:12的氨基酸20至326,SEQ ID NO:14的氨基酸18至240,SEQ ID NO:16的氨基酸20至258,SEQ ID NO:18的氨基酸19至226或SEQ ID NO:20的氨基酸20至304,SEQ ID NO:22的氨基酸23至250或SEQ ID NO:24的氨基酸20至249。在另一优选的方面,所述成熟多肽编码序列是SEQ ID NO:11的核苷酸388至1332,SEQ ID NO:13的核苷酸98至821,SEQ ID NO:15的核苷酸126至978,SEQ ID NO:17的核苷酸55至678,SEQ ID NO:19的核苷酸58至912,SEQ ID NO:21的核苷酸67至796,SEQ ID NO:23的核苷酸77至766。
如早前所述,用于分离或克隆编码多肽的多核苷酸的技术是本领域内已知的,包括从基因组DNA分离,从cDNA制备,或其组合。
所述分离的多核苷酸也可以是编码具有增强纤维素分解的活性的多肽的多核苷酸,所述多核苷酸在至少极低严紧条件下,优选至少低严紧条件下,更优选至少中严紧条件下,更优选至少中-高严紧条件下,甚至更优选至少高严紧条件下,并且最优选至少非常高严紧条件下,与以下杂交:(i)SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQID NO:21或SEQ ID NO:23的成熟多肽编码序列,(ii)包含在SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15或SEQ ID NO:21的成熟多肽编码序列中的cDNA序列或包含SEQ ID NO:17、SEQ ID NO:19或SEQ ID NO:23的成熟多肽编码序列的基因组DNA序列,或(iii)(i)或(ii)的全长互补链;或其等位变体和亚序列,如本文所定义。在优选的方面,成熟多肽编码序列是SEQ ID NO:11的核苷酸388至1332,SEQ ID NO:13的核苷酸98至821,SEQ ID NO:15的核苷酸126至978,SEQ ID NO:17的核苷酸55至678,SEQ ID NO:19的核苷酸58至912,SEQ ID NO:21的核苷酸67至796,或SEQ ID NO:23的核苷酸77至766。
核酸构建体
分离的多核苷酸,其编码具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽,和/或具有β-葡糖苷酶活性的多肽,可以用许多方式操作所述分离的多核苷酸,从而通过构建核酸构建体来提供所述多肽的表达,所述核酸构建体包含一个或多个(几)所述分离的多核苷酸,其与一个或多个(几)调控序列可操作地连接,所述调控序列在合适的宿主细胞中在与该调控序列相容的条件下指导编码序列表达。依赖于表达载体,在将多核苷酸的序列插入载体之前对其进行操作可能是理想的或必需的。使用重组DNA方法修饰多核苷酸序列的技术是本领域熟知的。
调控序列可以是合适的启动子序列,其是由宿主细胞识别用于表达编码这种多肽的多核苷酸的核苷酸序列。启动子序列含有介导所述多肽表达的转录调控序列。启动子可以是在所选的宿主细胞中显示转录活性的任何核苷酸序列,包括突变的、截断的和杂合的启动子,并且可以从编码与宿主细胞同源或异源的胞外或胞内多肽的基因获得。
用于指导所述核酸构建体的转录,特别是在细菌宿主细胞中的转录的合适启动子的实例是从下述获得的启动子:大肠杆菌lac操纵子、天蓝色链霉菌琼脂糖酶基因(dagA)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌α-淀粉酶基因(amyL)、嗜热脂肪芽孢杆菌产麦芽淀粉酶基因(amyM)、解淀粉芽孢杆菌α-淀粉酶基因(amyQ)、地衣芽孢杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因和原核β-内酰胺酶基因(Villa-Kamaroff等人,1978,Proceedings of the National Academy of Sciences USA 75:3727-3731),以及tac启动子(DeBoer等人,1983,Proceedings of the National Academy of SciencesUSA 80:21-25)。另外的启动子在″Useful proteins from recombinant bacteria″inScientific American,1980,242:74-94中;和在Sambrook等人,1989,见上文中有所描述。
用于指导所述核酸构建体在丝状真菌宿主细胞中转录的合适启动子的实例是从下述酶的基因获得的启动子:米曲霉TAKA淀粉酶、曼赫根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、曼赫根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、构巢曲霉乙酰胺酶、镶片镰孢淀粉葡糖苷酶(WO 00/56900)、镶片镰孢Daria(WO 00/56900)、镶片镰孢Quinn(WO00/56900)、尖镰孢胰蛋白酶样蛋白酶(WO 96/00787)、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶IV、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉β-木糖苷酶,以及NA2-tpi启动子(来自黑曲霉中性α-淀粉酶基因和米曲霉丙糖磷酸异构酶基因的启动子的杂合体);和它们的突变的、截断的和杂合的启动子。
在酵母宿主中,有用的启动子从下述蛋白的基因获得:酿酒酵母烯醇化酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH1,ADH2/GAP)、酿酒酵母丙糖磷酸异构酶(TPI)、酿酒酵母金属硫蛋白(CUP1)和酿酒酵母3-磷酸甘油酸激酶。对于酵母宿主细胞其它有用的启动子由Romanos等人,1992,Yeast 8:423-488描述。
调控序列也可以是合适的转录终止子序列,其是由宿主细胞识别以终止转录的序列。所述终止子序列与编码所述多肽的核苷酸序列的3’末端可操作地连接。可以将在所选宿主细胞中有功能的任何终止子用在本发明中。
对于丝状真菌宿主细胞优选的终止子从如下蛋白的基因获得:米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉α-葡糖苷酶和尖镰孢胰蛋白酶样蛋白酶。
对于酵母宿主细胞优选的终止子从如下蛋白的基因获得:酿酒酵母烯醇化酶、酿酒酵母细胞色素C(CYC1)和酿酒酵母甘油醛-3-磷酸脱氢酶。对于酵母宿主细胞其它有用的终止子由Romanos等人,1992,见上文描述。
调控序列还可以是合适的前导序列,其是对于宿主细胞的翻译重要的mRNA非翻译区。前导序列可操作地连接于编码多肽的核苷酸序列的5’末端。可以将在所选宿主细胞中有功能的任何前导序列用在本发明中。
对于丝状真菌宿主细胞优选的前导序列从米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶的基因获得。
对于酵母宿主细胞合适的前导序列从如下蛋白的基因获得:酿酒酵母烯醇化酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α因子和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。
调控序列也可以是聚腺苷酸化序列,其是与核苷酸序列的3’末端可操作地连接的序列,并且在转录时,宿主细胞将其识别为将聚腺苷残基添加至转录的mRNA的信号。可以将在所选宿主细胞中有功能的任何聚腺苷酸化序列在本发明中使用。
对于丝状真菌宿主细胞优选的聚腺苷酸化序列从如下蛋白的基因获得:米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖镰孢胰蛋白酶样蛋白酶和黑曲霉α-葡糖苷酶。
对于酵母宿主细胞有用的聚腺苷酸化序列由Guo and Sherman,1995,Molecular Cellular Biology 15:5983-5990描述。
调控序列还可以是信号肽编码区,其编码与多肽的氨基末端连接的氨基酸序列,并且指导编码的多肽进入细胞分泌途径。核苷酸序列的编码序列5’端可固有地包含信号肽编码区,其与编码分泌多肽的编码区片段一起天然地连接在翻译阅读框中。可供选择的是,编码序列5’端可含有对于所述编码序列是外源的信号肽编码区。外源信号肽编码区在编码序列不天然地含有信号肽编码区时可能是需要的。或者,外源信号肽编码区可以简单地取代天然信号肽编码区以增强多肽的分泌。然而,指导表达的多肽进入所选宿主细胞的分泌途径(即,分泌至培养基中)的任何信号肽编码区可在本发明中使用。
对于细菌宿主细胞有效的信号肽编码区是从如下蛋白的基因获得的信号肽编码区:芽孢杆菌属NCIB 11837产麦芽糖淀粉酶、嗜热脂肪芽孢杆菌α-淀粉酶、地衣芽孢杆菌枯草蛋白酶(subtilisin)、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT、nprS、nprM)和枯草芽孢杆菌prsA。另外的信号肽由Simonen and Palva,1993,Microbiological Reviews 57:109-137描述。
对于丝状真菌宿主细胞有效的信号肽编码区是从如下蛋白的基因获得的信号肽编码区:米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、曼赫根毛霉天冬氨酸蛋白酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶V和疏棉状腐质霉脂肪酶。
在优选的方面,信号肽包含SEQ ID NO:2的氨基酸1至20或由SEQ IDNO:2的氨基酸1至20组成。在另一个优选的方面,信号肽编码区包含SEQID NO:1的核苷酸1至60或由SEQ ID NO:1的核苷酸1至60组成。
在另一优选的方面,信号肽包含SEQ ID NO:4的氨基酸1至15或由SEQID NO:4的氨基酸1至15组成。在另一个优选的方面,信号肽编码区包含SEQ ID NO:3的核苷酸1至45或由SEQ ID NO:3的核苷酸1至45组成。
在另一优选的方面,信号肽包含SEQ ID NO:6的氨基酸1至18或由SEQID NO:6的氨基酸1至18组成。在另一个优选的方面,信号肽编码区包含SEQ ID NO:5的核苷酸1至54或由SEQ ID NO:5的核苷酸1至54组成。
在另一优选的方面,信号肽包含SEQ ID NO:8的氨基酸1至17或由SEQID NO:8的氨基酸1至17组成。在另一个优选的方面,信号肽编码区包含SEQ ID NO:7的核苷酸1至51或由SEQ ID NO:7的核苷酸1至51组成。
在另一优选的方面,信号肽包含SEQ ID NO:10的氨基酸1至20或由SEQID NO:10的氨基酸1至20组成。在另一个优选的方面,信号肽编码区包含SEQ ID NO:9的核苷酸1至60或由SEQ ID NO:9的核苷酸1至60组成。
在另一优选的方面,信号肽包含SEQ ID NO:12的氨基酸1至19或由SEQ ID NO:12的氨基酸1至19组成。在另一个优选的方面,信号肽编码区包含SEQ ID NO:11的核苷酸330至387或由SEQ ID NO:7的核苷酸330至387组成。
在另一优选的方面,信号肽包含SEQ ID NO:14的氨基酸1至17或由SEQ ID NO:14的氨基酸1至17组成。在另一个优选的方面,信号肽编码区包含SEQ ID NO:13的核苷酸47至97或由SEQ ID NO:13的核苷酸47至97组成。
在另一优选的方面,信号肽包含核苷酸编码区或由氨基酸编码区组成,所述氨基酸编码区是SEQ ID NO:16的氨基酸1至19。在另一个优选的方面,信号肽编码区包含SEQ ID NO:15的核苷酸69至125或由SEQ ID NO:15的核苷酸69至125组成。
在另一优选的方面,信号肽包含SEQ ID NO:18的氨基酸1至18或由SEQ ID NO:18的氨基酸1至18组成。在另一个优选的方面,信号肽编码区包含SEQ ID NO:17的核苷酸1至54或由SEQ ID NO:17的核苷酸1至54组成。
在另一优选的方面,信号肽包含SEQ ID NO:20的氨基酸1至19或由SEQ ID NO:20的氨基酸1至19组成。在另一个优选的方面,信号肽编码区包含SEQ ID NO:19的核苷酸1至57或由SEQ ID NO:19的核苷酸1至57组成。
在另一优选的方面,信号肽包含SEQ ID NO:22的氨基酸1至22或由SEQ ID NO:22的氨基酸1至22组成。在另一个优选的方面,信号肽编码区包含SEQ ID NO:21的核苷酸1至66或由SEQ ID NO:21的核苷酸1至66组成。
在另一优选的方面,信号肽包含SEQ ID NO:24的氨基酸1至19或由SEQ ID NO:24的氨基酸1至19组成。在另一个优选的方面,信号肽编码区包含SEQ ID NO:23的核苷酸20至76或由SEQ ID NO:23的核苷酸20至76组成。
在另一优选的方面,信号肽包含SEQ ID NO:26的氨基酸1至19或由SEQ ID NO:26的氨基酸1至19组成。在另一个优选的方面,信号肽编码区包含SEQ ID NO:25的核苷酸31至86或由SEQ ID NO:25的核苷酸31至86组成。
在另一优选的方面,信号肽包含SEQ ID NO:26的氨基酸1至19或由SEQ ID NO:26的氨基酸1至19组成。在另一个优选的方面,信号肽编码区包含SEQ ID NO:27的核苷酸1至57或由SEQ ID NO:27的核苷酸1至57组成。
在另一优选的方面,信号肽包含SEQ ID NO:28的氨基酸1至19或由SEQ ID NO:28的氨基酸1至19组成。在另一个优选的方面,信号肽编码区包含SEQ ID NO:29的核苷酸6至62或由SEQ ID NO:29的核苷酸6至62组成。
对于酵母宿主细胞有用的信号肽从酿酒酵母α因子和酿酒酵母转化酶的基因获得。其它有用的信号肽编码区由Romanos等人,1992,见上文,描述。
调控序列还可以是前肽编码区,其编码位于多肽氨基末端的氨基酸序列。所得多肽称为酶原(proenzyme)或前多肽(propolypeptide)(或在某些情况下称为酶原(zymogen))。前多肽通常是无活性的并且能够通过前肽的催化或自催化切割从前多肽转化成成熟活性多肽。可以从枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、酿酒酵母α因子、曼赫根毛霉天冬氨酸蛋白酶和嗜热毁丝霉漆酶(WO 95/33836)的基因获得前肽编码区。
当信号肽和前肽区二者均出现在多肽的氨基末端时,将前肽区置于紧接着(next to)多肽氨基末端,并且将信号肽区置于紧接着前肽区的氨基末端。
同样理想的是添加调节序列,其允许相对于宿主细胞的生长来调节多肽的表达。调节系统的实例是引起基因表达响应化学或物理刺激物,包括调节化合物的存在而开启或关闭的那些系统。原核系统中的调节系统包括lac、tac和trp操纵基因系统。在酵母中,可以使用ADH2系统或GAL1系统。在丝状真菌中,可以使用TAKAα-淀粉酶启动子、黑曲霉葡糖淀粉酶启动子和米曲霉葡糖淀粉酶启动子作为调节序列。调节序列的其它实例是那些允许基因扩增的序列。在真核系统中,这些序列包括在氨甲蝶呤(methotrexate)存在下扩增的二氢叶酸还原酶基因,和以重金属(with heavy metal)扩增的金属硫蛋白基因。在这些情况下,编码多肽的核苷酸序列将与调节序列可操作地连接。
表达载体
可以将本文描述的多种核酸和调控序列结合在一起以产生重组表达载体,其包含编码具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽和/或具有β-葡糖苷酶活性的多肽的多核苷酸、启动子和转录和翻译的终止信号。所述表达载体可以包括一种或多种(几)方便的限制位点以允许在这些位点插入或取代编码所述多肽的核苷酸序列。可供选择的是,可以通过将所述核苷酸序列或包含该序列的核酸构建体插入用于表达的适当载体中来表达编码这样的多肽的多核苷酸。在制备表达载体的过程中,将编码序列置于载体中,从而将该编码序列与适当的用于表达的调控序列可操作地连接。
重组表达载体可以是任何载体(例如,质粒或病毒),其能够方便地进行重组DNA步骤,并且能够产生核苷酸序列的表达。载体的选择将通常依赖于载体与将引入该载体的宿主细胞的相容性。载体可以是线状或闭合环状质粒。
载体可以是自主复制载体,即,作为染色体外实体(entity)存在的载体,其复制独立于染色体复制,例如,质粒、染色体外元件、微型染色体(minichromosome)或人工染色体。载体可以含有任何用于确保自复制的手段(means)。或者,载体可以是一种当被引入宿主细胞中时,整合到基因组中并且与整合了该载体的染色体一起复制的载体。此外,可以使用单独的载体或质粒或两个或更多个载体或质粒,其共同含有待引入宿主细胞基因组的完整DNA(total DNA),或可以使用转座子(transposon)。
所述载体优选地含有一个或多个(几)选择性标记,其允许简单选择经转化、转染、转导等的细胞。选择性标记是基因,其产物提供杀生物剂或病毒抗性、对重金属的抗性、对营养缺陷型的原养性(prototrophy to auxotrophs)等。
细菌选择性标记的实例是来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因,或赋予抗生素抗性的标记,所述抗生素抗性例如氨苄青霉素、卡那霉素、氯霉素或四环素抗性。对于酵母宿主细胞合适的标记是ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于丝状真菌宿主细胞的选择性标记包括但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草铵膦(phosphinothricin)乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)(nitrate reductase)、pyrG(乳清酸核苷-5’-磷酸脱羧酶)(orotidine-5’-phosphatedecarboxylase)、sC(硫酸腺苷酰转移酶)和trpC(邻氨基苯甲酸合酶(anthranilatesynthase))以及它们的等价物。优选用在曲霉属细胞中的是构巢曲霉或米曲霉的amdS和pyrG基因和吸水链霉菌(Streptomyces hygroscopicus)的bar基因。
所述载体优选含有元件,其允许载体整合入宿主细胞基因组或载体在细胞中独立于基因组的自主复制。
为了整合入宿主细胞基因组,载体可依赖编码多肽的多核苷酸的序列或用于通过同源或非同源重组整合入基因组的任何其它载体元件。或者,载体可以含有额外的核苷酸序列,用于指导通过同源重组整合入宿主细胞基因组染色体中的精确位置。为了增加在精确位置整合的可能性,整合元件应该优选含有足够数目的核酸,如100至10,000碱基对,优选400至10,000碱基对,并且最优选800至10,000碱基对,其与相应的靶序列具有高度序列同一性以增强同源重组的概率。整合元件可以是与宿主细胞基因组中的靶序列同源的任何序列。此外,整合元件可以是非编码或编码的核苷酸序列。另一方面,可以通过非同源重组将载体整合到宿主细胞基因组中。
为了自主复制,载体可以进一步包含复制起点,其使载体能够在所述的宿主细胞中自主地复制。复制起点可以是介导自主复制的任何质粒复制子(replicator),其在细胞中发挥功能。术语“复制起点”或“质粒复制子”在本文定义为能够使质粒或载体在体内复制的核苷酸序列。
细菌复制起点的实例是允许在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177和pACYC184的复制起点,和允许在芽孢杆菌属中复制的质粒pUB110、pE194、pTA1060和pAMβ1的复制起点。
用于酵母宿主细胞中的复制起点的实例是2微米复制起点,ARS1,ARS4,ARS1和CEN3的组合,和ARS4和CEN6的组合。
在丝状真菌细胞中有用的复制起点的实例是AMA1和ANS1(Gems等人,1991,Gene 98:61-67;Cullen等人,1987,Nucleic Acids Research 15:9163-9175;WO 00/24883)。分离AMA1基因和构建包含该基因的质粒或载体能够根据公开于WO 00/24883中的方法完成。
可以将多于一个拷贝的编码这样的多肽的多核苷酸插入宿主细胞以增加该多肽的产生,所述多核苷酸编码这样的多肽。多核苷酸拷贝数的增加可通过如下方法获得:将至少一个额外拷贝的序列整合入宿主细胞基因组,或使所述多核苷酸包括可扩增选择性标记基因,其中可通过在合适的选择剂(selectable agent)存在下培养细胞来选择含有选择性标记基因的扩增拷贝并且由此含有多核苷酸的额外拷贝的细胞。
用于连接上述元件以构建所述重组表达载体的方法是本领域技术人员熟知的(参见,例如,Sambrook等人,1989,见上文)。
宿主细胞
重组宿主细胞,其包含多核苷酸,所述多核苷酸编码具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽和/或具有β-葡糖苷酶活性的多肽,可将所述重组宿主细胞有利地使用在所述多肽的重组产生中。将包含这种多核苷酸的载体引入宿主细胞中,从而将该载体保留作为染色体整合体(chromosomalintegrant)或作为前述的自复制的染色体外载体。术语“宿主细胞”包含亲本细胞的任何子代,其由于复制过程中发生的突变而与亲本细胞不相同。宿主细胞的选择将很大程度依赖于编码多肽的基因和它的来源。
宿主细胞可以是单细胞微生物,例如,原核生物,或非单细胞微生物,例如,真核生物。
细菌宿主可以是任何革兰氏阳性细菌或革兰氏阴性细菌。革兰氏阳性细菌包括但不限于芽孢杆菌属、链球菌属、链霉菌属、葡萄球菌属、肠球菌属、乳杆菌属、乳球菌属、梭菌属、地芽孢杆菌属或海洋芽孢杆菌属。革兰氏阴性细菌包括但不限于大肠杆菌、假单胞菌属、沙门氏菌属、弯曲杆菌属、螺杆菌属、黄杆菌属、梭杆菌属、泥杆菌属、奈瑟氏菌属或脲原体属。
细菌宿主细胞可以是任何芽孢杆菌属细胞。在本发明的实施中有用的芽孢杆菌属细胞包括但不限于嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌和苏云金芽孢杆菌细胞。
在优选的方面,细菌宿主细胞是解淀粉芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、嗜热脂肪芽孢杆菌或枯草芽孢杆菌细胞。在更优选的方面,细菌宿主细胞是解淀粉芽孢杆菌细胞。在另一个更优选的方面,细菌宿主细胞是克劳氏芽孢杆菌细胞。在另一个更优选的方面,细菌宿主细胞是地衣芽孢杆菌细胞。在另一个更优选的方面,细菌宿主细胞是枯草芽孢杆菌细胞。
细菌宿主细胞还可以是任何链球菌属细胞。在本发明的实施中有用的链球菌属细胞包括但不限于似马链球菌、酿脓链球菌、乳房链球菌和马链球菌兽瘟亚种。
在优选的方面,细菌宿主细胞是似马链球菌细胞。在另一个优选的方面,细菌宿主细胞是酿脓链球菌细胞。在另一个优选的方面,细菌宿主细胞是乳房链球菌细胞。在另一个优选的方面,细菌宿主细胞是马链球菌兽瘟亚种细胞。
细菌宿主细胞还可以是任何链霉菌属细胞。在本发明的实施中有用的链霉菌属细胞包括但不限于不产色链霉菌、除虫链霉菌、天蓝色链霉菌、灰色链霉菌和浅青紫链霉菌。
在优选的方面,细菌宿主细胞是不产色链霉菌细胞。在另一个优选的方面,细菌宿主细胞是除虫链霉菌细胞。在另一个优选的方面,细菌宿主细胞是天蓝色链霉菌细胞。在另一个优选的方面,细菌宿主细胞是灰色链霉菌细胞。在另一个优选的方面,细菌宿主细胞是浅青紫链霉菌细胞。
可通过如下方法实现将DNA引入芽孢杆菌属细胞:例如通过原生质体转化(参见,例如,Chang and Cohen,1979,Molecular General Genetics 168:111-115),通过使用感受态细胞(参见,例如,Young and Spizizen,1961,Journalof Bacteriology 81:823-829或Dubnau and Davidoff-Abelson,1971,Journal ofMolecular Biology 56:209-221),通过电穿孔(参见,例如,Shigekawa and Dower,1988,Biotechniques 6:742-751)或通过接合(参见,例如,Koehler and Thorne,1987,Journal of Bacteriology 169:5771-5278)。可通过如下方法实现将DNA引入大肠杆菌细胞:例如通过原生质体转化(参见,例如,Hanahan,1983,J.Mol.Biol.166:557-580)或通过电穿孔(参见,例如,Dower等人,1988,Nucleic AcidsRes.16:6127-6145)。可通过如下方法实现将DNA引入链霉菌属细胞:例如通过原生质体转化和电穿孔(参见,例如,Gong等人,2004,Folia Microbiol.(Praha)49:399-405),通过接合(参见,例如,Mazodier等人,1989,J.Bacteriol.171:3583-3585),或通过转导(参见,例如,Burke等人,2001,Proc.Natl.Acad.Sci.USA 98:6289-6294)。可通过如下方法实现将DNA引入假单胞菌属细胞:例如通过电穿孔(参见,例如,Choi等人,2006,J.Microbiol.Methods 64:391-397)或通过接合(参见,例如,Pinedo and Smets,2005,Appl.Environ.Microbiol.71:51-57)。可通过如下方法实现将DNA引入链球菌属细胞:例如通过天然感受态(参见,例如,Perry and Kuramitsu,1981,Infect.Immun.32:1295-1297),通过原生质体转化(参见,例如,Catt and Jollick,1991,Microbios.68:189-2070),通过电穿孔(参见,例如,Buckley等人,1999,Appl.Environ.Microbiol.65:3800-3804)或通过接合(参见,例如,Clewell,1981,Microbiol.Rev.45:409-436)。然而,可以使用任何将DNA引入宿主细胞的本领域已知方法。
宿主细胞还可以是真核细胞,例如哺乳动物、昆虫、植物或真菌细胞。
在优选的方面,宿主细胞是真菌细胞。“真菌”用在本文包括以下门:子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)和接合菌门(Zygomycota)(如由Hawksworth等人,In,Ainsworth and Bisby’sDictionary of The Fungi,8th edition,1995,CAB International,University Press,Cambridge,UK所定义)以及卵菌门(Oomycota)(如Hawksworth等人,1995,见上,171页中所引用),和所有有丝分裂孢子真菌(mitosporic fungi)(Hawksworth等人,1995,见上)。
在更优选的方面,真菌宿主细胞是酵母细胞。“酵母”用在本文包括产子囊酵母(ascosporogenous yeast)(内孢霉目(Endomycetales))、产担子酵母(basidiosporogenous yeast)和属于半知菌类(Fungi Imperfecti)(芽孢纲(Blastomycetes))的酵母。由于酵母的分类在未来可能改变,就本发明而言,应将酵母定义为如Biology and Activities of Yeast(Skinner,F.A.,Passmore,S.M.,and Davenport,R.R.,eds,Soc.App.Bacteriol.Symposium Series No.9,1980)中所述。
在更加优选的方面,酵母宿主细胞是念珠菌属、汉逊酵母属(Hansenula)、克鲁维酵母属、毕赤酵母属、酵母属、裂殖酵母属或西洋蓍霉属细胞。
在最优选的方面,酵母宿主细胞是卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母或卵形酵母细胞。在另外最优选的方面,酵母宿主细胞是乳酸克鲁维酵母(Kluyveromyces lactis)细胞。在另外最优选的方面,酵母宿主细胞是解脂西洋蓍霉(Yarrowia lipolytica)细胞。
在另外更优选的方面,真菌宿主细胞是丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门的亚门(如由Hawksworth等人,1995,见上文,所定义)的所有丝状形式。丝状真菌通常的特征在于由壳多糖(chitin)、纤维素、葡聚糖、壳聚糖(chitosan)、甘露聚糖和其它复杂多糖组成的菌丝体壁。通过菌丝延伸进行营养生长,而碳分解代谢是专性需氧的。相反,酵母例如酿酒酵母的营养生长通过单细胞菌体的出芽生殖(budding)进行,而碳分解代谢可以是发酵的。
在甚至更优选的方面,丝状真菌宿主细胞是枝顶孢霉属、曲霉属、短梗霉属、烟管霉属(Bjerkandera)、拟蜡菌属、金孢子菌属、鬼伞属(Coprinus)、革盖菌属(Coriolus)、隐球菌属、Filibasidium、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新考玛脂霉属、脉孢菌属、拟青霉属、青霉属、平革菌属、射脉菌属(Phlebia)、瘤胃壶菌属、侧耳属(Pleurotus)、裂褶菌属、踝节菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属(Trametes)或木霉属细胞。
在最优选的方面,丝状真菌宿主细胞是泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉或米曲霉细胞。在另一个的最优选的方面,丝状真菌宿主细胞是杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢或镶片镰孢细胞。在另外最优选的方面,丝状真菌宿主细胞是黑刺烟管菌(Bjerkanderaadusta)、干拟蜡菌(Ceriporiopsis aneirina)、干拟蜡菌、Ceriporiopsis caregiea、Ceriporiopsis gilvescens、Ceriporiopsis pannocinta、Ceriporiopsis rivulosa、Ceriporiopsis subrufa、虫拟蜡菌(Ceriporiopsis subvermispora)、嗜角质金孢子菌(Chrysosporium keratinophilum)、Chrysosporium lucknowense、热带金孢子菌(Chrysosporium tropicum)、Chrysosporium merdarium、Chrysosporium inops、Chrysosporium pannicola、Chrysosporium queenslandicum、Chrysosporiumzonatum、灰盖鬼伞、毛革盖菌(Coriolus hirsutus)、特异腐质霉、疏棉状腐质霉、米赫毛霉、嗜热毁丝霉、粗糙脉孢菌、产紫青霉、黄孢平革菌、辐射射脉菌(Phlebia radiata)、刺芹侧耳(Pleurotus eryngii)、土生梭孢霉、长绒毛栓菌(Trametes villosa)、杂色栓菌(Trametes versicolor)、哈茨木霉、康宁木霉、长枝木霉、里氏木霉或绿色木霉细胞。
可以将真菌细胞通过涉及原生质体形成、原生质体转化和细胞壁重建的方法以本身公知的方式转化。用于转化曲霉属和木霉属宿主细胞的合适方法在EP 238 023和Yelton等人,1984,Proceedings of the National Academy ofSciences USA 81:1470-1474中描述。用于转化镰孢属菌种的合适方法由Malardier等人,1989,Gene 78:147-156和WO 96/00787描述。可以使用由如下文献描述的方法转化酵母:Becker and Guarente,In Abelson,J.N.and Simon,M.I.,editors,Guide to Yeast Genetics and Molecular Biology,Methods inEnzymology,Volume 194,pp 182-187,Academic Press,Inc.,New York;Ito等人,1983,Journal of Bacteriology 153:163;和Hinnen等人,1978,Proceedings of theNational Academy of Sciences USA75:1920。
产生方法
本发明的纤维素分解酶组合物可以通过微生物菌株(野生型或重组宿主细胞)或若干个体微生物菌株(野生型或重组宿主细胞)的发酵而产生。
用于产生具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽和/或具有β-葡糖苷酶活性的多肽的方法包括:(a)在有益于产生多肽的条件下培养细胞,所述细胞以其野生型形式能够产生所述多肽;和(b)回收所述多肽。
或者,用于产生具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽的方法包括:(a)在有益于产生所述多肽的条件下培养重组宿主细胞;和(b)回收所述多肽。
此外,用于产生具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽和/或具有β-葡糖苷酶活性的多肽的方法包括:(a)在有益于产生所述多肽的条件下培养宿主细胞,其中所述宿主细胞包含突变核苷酸序列,其在SEQ ID NO:1、SEQID NO:3、SEQ ID NO:5、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27或SEQ ID NO:29的成熟多肽编码区中具有至少一个突变,其中所述突变核苷酸序列编码由SEQ IDNO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:12、SEQID NO:14、SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26、SEQ ID NO:28或SEQ ID NO:30的成熟多肽组成的多肽,和(b)回收所述多肽。
在所述产生方法中,使用本领域熟知的方法在适合于产生所述多肽的营养培养基中培养细胞。例如,可以通过在合适培养基中和允许表达和/或分离所述多肽的条件下进行的摇瓶培养,和实验室或工业发酵罐中的小规模或大规模发酵(包括连续、分批、补料分批或固态发酵)来培养细胞。使用本领域已知的方法在合适的营养培养基中进行培养,所述营养培养基包含碳源和氮源和无机盐。合适的培养基能够从商业供应商获得或可以根据公布的组成制备(例如,在美国典型培养物保藏中心的目录中)。如果多肽分泌到营养培养基中,则能够从所述培养基中直接回收该多肽。如果多肽不分泌到培养基中,其能够从细胞裂解物(lysate)回收。
使用本文描述的方法来检测具有增强纤维素分解的活性、内切葡聚糖酶活性、纤维二糖水解酶活性或β-葡聚糖活性的多肽。
可以使用本领域已知的方法回收所得多肽。例如,可以通过常规方法从营养培养基中回收多肽,所述常规方法包括但不限于离心、过滤、提取、喷雾干燥、蒸发或沉淀。
可以通过多种本领域已知的方法纯化所述多肽以获得基本上纯的多肽,所述方法包括但不限于层析(例如,离子交换、亲和、疏水、层析聚焦和大小排阻)、电泳方法(例如,制备型(preparative)等电聚焦)、差示溶解度(例如,硫酸铵沉淀)、SDS-PAGE或提取(参见,例如,Protein Purification,J.-C.Janson andLars Ryden,editors,VCH Publishers,New York,1989)。
含纤维素材料的加工
本发明中的组合物和方法可以用于将含纤维素材料例如,木素纤维素,水解(糖化)成可发酵糖并将可发酵糖转换成许多有用的物质,例如化学品和燃料。来自含纤维素材料的期望的发酵产物的生产过程通常包括预处理、酶水解作用(糖化作用)和发酵。
依照本发明,含纤维素材料的加工可以利用本领域已知的方法来完成。而且,可以使用设置为按照本发明来操作的任何生物质加工设备实施本发明的方法。
水解(糖化)和发酵,分别或同时包括但不限于分别水解和发酵(SHF)、同时糖化和发酵(SSF)、同时糖化和共发酵(SSCF)、混合水解和发酵(HHF)、SHCF(分别水解和共发酵)、HHCF(混合水解和发酵)和直接微生物转化(DMC)。在此所理解的本领域已知任何方法包括预处理、酶水解作用(糖化作用)、发酵或其组合可以用在本发明的方法实施中。
常规设备可以包括补料分批搅拌反应器(fed-batch stirred reactor)、分批搅拌反应器(batch-stirred reactor)、带有超滤的连续流搅拌反应器(continuous flowstirred reactor with ultrafiltration)和/或连续活塞流柱式反应器(continuousplug-flow column reactor)(Femanda de Castilhos Corazza,Flávio Faria deMoraes,Gisella Maria Zanin and Ivo Neitzel,2003,Optimal control in fed-batchreactor for the cellobiose hydrolysis,Acta Scientiarum.Technology 25:33-38;Gusakov,A.V.,and Sinitsyn,A.P.,1985,Kinetics of the enzymatic hydrolysis ofcellulose:1.A mathematical model for a batch reactor process,Enz.Microb.Technol.7:346-352)、研磨反应器(attrition reactor)(Ryu,S.K.,and Lee,J.M.,1983,Bioconversion of waste cellulose by using an attrition bioreactor,Biotechnol.Bioeng.25:53-65)或带有电磁场引起的强力搅拌的反应器(Gusakov,A.V.,Sinitsyn,A.P.,Davydkin,I.Y.,Davydkin,V.Y.,Protas,O.V.,1996,Enhancementof enzymatic cellulose hydrolysis using a novel type of bioreactor with intensivestirring induced by electromagnetic field,Appl.Biochem.Biotechnol.56:141-153)。用于水解和/或发酵作用的附加式反应器类型包括,例如,流化床(fluidized bed)、上流式床(upflow blanket)、固定化的、和挤压机型反应器。
预处理:在实施本发明的方法中,本领域已知的任何预处理方法都可以用于瓦解含纤维素材料的植物细胞壁组分。在预处理之前,也可以用本领域已知的方法对含纤维素材料进行预浸泡、湿润或调节(conditioning)。常规的预处理包括而不限于蒸汽预处理(伴随或不伴随爆炸)、稀酸预处理、热水预处理、石灰预处理、湿氧化、湿式爆炸(wet explosion)、氨纤维爆炸、有机溶剂预处理和生物学预处理。另外的预处理包括超声、电穿孔、微波、超临界CO2、超临界H2O和氨渗滤法。
在水解和/或发酵作用之前可以预先处理含纤维素材料。预处理优选在水解之前进行。或者,预处理可以与水解同时进行,例如与用一种或多种纤维素分解酶或其他酶活力处理含纤维素材料同时进行,以释放可发酵糖,如葡萄糖和/或麦芽糖。在大多数情况下预处理步骤本身导致生物质转化成可发酵糖(甚至在酶不存在的情况下)。
蒸汽预处理:在蒸汽预处理中,加热含纤维素材料以瓦解植物细胞壁组分(包括木质素、半纤维素和纤维素),从而使纤维素和其它级分(如半纤维素)更易于让酶接近。将纤维素材料传送至或穿过反应容器,在所述反应容器中注入蒸汽将温度升高到所需的温度和压强,并且在预期的反应时间里将其保持在其中。蒸汽预处理优选在140-230℃,更优选160-200℃,并且最优选170-190℃下完成,其中最适温度范围取决于化学催化剂的加入。蒸汽预处理的驻留时间(residence time)优选1-15分钟,更优选3-12分钟,并且最优选4-10分钟,其中最适驻留时间取决于温度范围和化学催化剂的加入。蒸汽预处理允许相对高的固体加样,从而使得含纤维素材料一般仅在预处理时湿润。在预处理后,所述蒸汽预处理经常与材料的爆炸性放电相结合,其称作蒸汽爆炸,也就是说,材料向大气压快速运动(rapid flashing)并快速流动以通过断裂增加可接近表面积。(Duff and Murray,1996,Bioresource Technology 855:1-33;Galbe and Zacchi,2002,Appl.Microbiol.Biotechnol.59:618-628;U.S.PatentApplication No.20020164730)。
在蒸汽预处理之前常常加入催化剂如H2SO4或SO2(通常0.3至3%w/w),其能减少时间和降低温度,增加回收率以及改善酶水解作用(Ballesteros等人,2006,Appl.Biochem.Biotechnol.129-132:496-508;Varga等人,2004,Appl.Biochem.Biotechnol.113-116:509-523;Sassner等人,2006,Enzyme Microb.Technol.39:756-762)。
化学预处理:术语“化学处理”指的是促进纤维素、半纤维素和/或木质素的分离和/或释放的任何化学预处理。适当的化学预处理方法的实例包括,例如,稀酸预处理、石灰预处理、湿氧化、氨纤维/冷冻爆炸(ammonia fiber/freezeexplosion)(AFEX)、氨渗透(ammonia percolation)(APR)或有机溶剂预处理。
在稀酸预处理中,将含纤维素材料与稀酸(通常为H2SO4)、水混合以形成浆料,通过蒸汽加热到所需的温度,并在一段驻留时间后,快速进入大气压。可以在多个反应器设计中进行稀酸预处理,例如,活塞流反应器、逆流反应器或连续逆流收缩床反应器(counter-current shrinking bed reactors)(Duff andMurray,1996,见上文;Schell等人,2004,Bioresource Technol.91:179-188;Lee等人,1999,Adv.Biochem.Eng.Biotechnol.65:93-115)。
也可以使用在碱性条件下的集中预处理方法。这些碱性预处理包括,但并不限于,石灰预处理、湿氧化、氨渗透(APR)和氨纤维/冷冻爆炸(AFEX)。
在85-150℃的低温下用碳酸钙、氢氧化钠或氨进行石灰预处理,并且驻留时间为1小时至几天(Wyman等人,2005,Bioresource Technol.96:1959-1966;Mosier等人,2005,Bioresource Technol.96:673-686)。WO 2006/110891、WO2006/11899、WO 2006/11900和WO 2006/110901披露了使用氨的预处理方法。
湿氧化为通常在加入氧化剂(例如过氧化氢或超压氧)的条件下在180-200℃下进行5-15分钟的热预处理(Schmidt and Thomsen,1998,Bioresource Technol.64:139-151;Palonen等人,2004,Appl.Biochem.Biotechnol.117:1-17;Varga等人,2004,Biotechnol.Bioeng.88:567-574;Martin等人,2006,J.Chem.Technol.Biotechnol.81:1669-1677)。以优选1-40%的干物质,更优选2-30%的干物质,并且最优选5-20%的干物质进行预处理,并且通常初始pH值随着碱(例如碳酸钠)的加入而增加。
已知的湿氧化预处理方法的改进方法为湿爆炸(湿氧化和蒸汽爆炸的结合),其可以处理干物质高达30%。在湿爆炸中,在经过一段特定的驻留时间后在预处理过程中引入氧化剂。然后,通过快速进入大气压来结束预处理(WO2006/032282)。
氨纤维爆炸(AFEX)包括在合适的温度下(例如90-100℃)和高压(例如17-20bar)下用液态或气态氨水处理含纤维素材料5-10分钟,其中干物质含量可以高达60%(Gollapalli等人,2002,Appl.Biochem.Biotechnol.98:23-35;Chundawat等人,2007,Biotechnol.Bioeng.96:219-231;Alizadeh等人,2005,Appl.Biochem.Biotechnol.121:1133-1141;Teymouri等人,2005,BioresourceTechnol.96:2014-2018)。
通过在160-200℃下使用乙醇水溶液(40-60%乙醇)萃取30-60分钟,有机溶剂预处理使含纤维素材料脱木素(Pan等人,2005,Biotechnol.Bioeng.90:473-481;Pan等人,2006,Biotechnol.Bioeng.94:851-861;Kurabi等人,2005,Appl.Biochem.Biotechnol.121:219-230)。通常加入硫酸作为催化剂。在有机溶剂预处理中,大部分的半纤维素被除去。
Schell等人,2003,Appl.Biochem.and Biotechnol.Vol.105-108,p.69-85和Mosier等人,2005,Bioresource Technology 96:673-686和公开的美国申请2002/0164730描述了合适的预处理方法的其它实例。
在一个方面,优选以酸处理,并且更优选以连续稀酸和/或弱酸处理进行所述的化学预处理。所述酸优选为硫酸,但是也可以使用其它酸,例如醋酸、柠檬酸、硝酸、磷酸、酒石酸、丁二酸、氯化氢或其混合物。在优选1-5,更优选1-4,并且最优选1-3的pH范围下实施弱酸处理。在一个方面,所述酸浓度在优选0.01至20wt%酸,更优选0.05至10wt%酸,甚至更优选0.1至5wt%酸,并且最优选0.2至2.0wt%酸的范围内。使所述酸与含纤维素材料接触,并在一定的温度(例如在160-220℃,优选165-195℃的范围)下保持数秒至数分钟(例如1秒至60分钟)。
在另一方面,以氨纤维爆炸步骤(AFEX预处理步骤)进行预处理。
在另一方面,在浆料水溶液中进行预处理。在优选的方面,在预处理过程中,含纤维素材料以优选10-80wt%之间,更优选20-70wt%之间,并且最优选30-60wt%之间,例如大约50wt%的量存在。所述预处理的含纤维素材料可以是未经洗涤的,或者是使用本领域内已知的任何方法洗涤的,例如用水洗涤。
机械预处理:术语“机械预处理”指的是各种类型的研磨或磨制(例如干磨、湿磨或振动球磨)。
物理预处理:术语“物理预处理”指的是促进纤维素、半纤维素和/或木质素从含纤维素材料中分离和/或释放出来的任何预处理。例如,物理预处理可以涉及辐照(例如,微波辐照)、蒸煮/蒸汽爆炸、水热分解(hydro thermolysis)及其组合。
物理预处理可以包括高压和/或高温(蒸汽爆炸)。在一个方面,高压指的是范围在优选大约300至大约600psi,更优选为大约350至大约550psi,并且最优选为大约400至大约500psi,例如大约450psi的压力。在另一方面,高温指的是范围在大约100至大约300℃,优选大约140至大约235℃的温度。在优选的方面,在使用如上所限定的高压和高温的蒸汽枪水解仪系统(例如,Sunds Hydrolyzer,购自Sunds Defibrator AB,Sweden)中以分批法进行机械预处理。
物理和化学预处理的组合:含纤维素材料可以同时进行物理和化学预处理。例如,预处理步骤可以包括稀酸或弱酸处理和高温和/或高压处理。可以根据需要依次或同时进行物理和化学预处理。也可以包括机械预处理。
因此,在优选的方面,使含纤维素材料经历机械、化学或物理预处理或者其任意组合的预处理以促进纤维素、半纤维素和/或木质素的分离和/或释放。
生物预处理:术语“生物预处理”指的是促进促进纤维素、半纤维素和/或木质素从含纤维素材料中分离和/或释放出来的任何生物学预处理方法。生物预处理技术可包括应用溶解木质素的微生物(参见,例如,Hsu,T.-A.,1996,Pretreatment of biomass,in Handbook on Bioethanol:Production and Utilization,Wyman,C.E.,ed.,Taylor&Francis,Washington,DC,179-212;Ghosh and Singh,1993,Physicochemical and biological treatments for enzymatic/microbialconversion of lignocellulosic biomass,Adv.Appl.Microbiol.39:295-333;McMillan,J.D.,1994,Pretreating lignocellulosic biomass:a review,in EnzymaticConversion of Biomass for Fuels Production,Himmel,M.E.,Baker,J.O.,andOverend,R.P.,eds.,ACS Symposium Series 566,American Chemical Society,Washington,DC,chapter 15;Gong,C.S.,Cao,N.J.,Du,J.,and Tsao,G.T.,1999,Ethanol production from renewable resources,in Advances in BiochemicalEngineering/Biotechnology,Scheper,T.,ed.,Springer-Verlag Berlin Heidelberg,Germany,65:207-241;Olsson and Hahn-Hagerdal,1996,Fermentation oflignocellulosic hydrolysates for ethanol production,Enz.Microb.Tech.18:312-331;and Vallander and Eriksson,1990,Production of ethanol fromlignocellulosic materials:State of the art,Adv.Biochem.Eng./Biotechnol.42:63-95)。
糖化:在也称为糖化的水解步骤中,将经预处理的含纤维素材料水解以将纤维素以及可选地还有半纤维素分解成可发酵的糖,例如葡萄糖、木糖、木酮糖、阿拉伯糖、麦芽糖、甘露糖、半乳糖和/或可溶的寡糖。使用本发明的纤维素分解酶组合物进行酶水解,所述纤维素分解酶组合物包含有效量的具有增强纤维素分解的活性的多肽。也可以依次加入组合物的酶组分。
优选在本领域的技术人员能够容易地确定的条件下,在合适的含水环境中进行酶水解。在优选的方面,在适于酶活性的条件(即,对酶最佳的条件)下进行水解。可以以补料分批或连续方法进行水解,在连续方法中将经预处理的含纤维素材料(底物)逐渐加入到例如包含酶的水解溶液中。
糖化通常在受控的pH、温度和混合条件下,在搅拌釜式反应器或发酵罐中进行。合适的过程时间、温度和pH条件能够由本领域技术人员容易地决定。例如,糖化可以持续多至200小时,但是通常进行优选大约12至大约96小时,更优选大约16至大约72小时,并且最优选大约24至大约48小时。所述温度在优选大约25℃至大约70℃,更优选大约30℃至大约65℃,并且更优选大约40℃至60℃的温度范围内,特别地为大约50℃。所述pH在优选大约3至大约8,更优选大约3.5至大约7,并且最优选大约4至大约6的范围内,特别地为大约pH 5。干固体的含量在优选大约5至大约50wt%,更优选大约10至大约40wt%并且最优选大约20至大约30wt%的范围内。
酶的最优量和具有增强纤维素分解的活性的多肽的最优量依赖于几个因素,所述因素包括但不限于成分纤维素分解蛋白的混合物、纤维素底物、纤维素底物浓度、纤维素底物的预处理、温度、时间、pH和发酵微生物(例如,用于同时糖化和发酵的酵母)的内含物(inclusion)。
在优选的方面,纤维素分解蛋白对于含纤维素材料的有效量是每克含纤维素材料大约0.5至大约50mg,优选大约0.5至大约40mg,更优选大约0.5至大约25mg,更优选大约0.75至大约20mg,更优选大约0.75至大约15mg,甚至更优选大约0.5至大约10mg,并且最优选大约2.5至大约10mg。
在另一优选的方面,具有增强纤维素分解的活性的多肽对于含纤维素材料的有效量是每克含纤维素材料大约0.5至大约50mg,优选大约0.5至大约40mg,更优选大约0.5至大约25mg,更优选大约0.75至大约20mg,更优选大约0.75至大约15mg,甚至更优选大约0.5至大约10mg,并且最优选大约2.5至大约10mg。
在另一优选的方面,具有增强纤维素分解的活性的多肽对于含纤维素材料的有效量是每克含纤维素材料大约0.01至大约50.0mg,优选大约0.01至大约40mg,更优选大约0.01至大约30mg,更优选大约0.01至大约20mg,更优选大约0.01至大约10mg,更优选大约0.01至大约5mg,更优选大约0.025至大约1.5mg,更优选大约0.05至大约1.25mg,更优选大约0.075至大约1.25mg,更优选大约0.1至大约1.25mg,甚至更优选大约0.15至大约1.25mg,并且最优选大约0.25至大约1.0mg。
在另一优选的方面,具有增强纤维素分解的活性的多肽对于纤维素分解蛋白的有效量是每克纤维素分解蛋白大约0.005至大约1.0g,优选大约0.01至大约1.0g,更优选大约0.15至大约0.75g,更优选大约0.15至大约0.5g,更优选大约0.1至大约0.5g,甚至更优选大约0.1至大约0.5g,并且最优选大约0.05至大约0.2g。
发酵.通过一种或多种能够直接或间接将糖发酵成期望的发酵产物的发酵微生物可以发酵从经预处理和水解的含纤维素材料得到的可发酵的糖。“发酵”或“发酵方法”指任何发酵方法或任何包括发酵步骤的方法。发酵方法还包括在生物燃料工业、可消费醇工业(例如,啤酒和葡萄酒(wine))、乳品工业(例如,发酵乳制品)、皮革工业和烟草工业中使用的发酵方法。发酵的条件依赖于期望的发酵产物和发酵生物,并且本领域的技术人员可以容易地确定。
在发酵步骤中,将作为预处理和酶水解步骤的结果从含纤维素材料释放的糖通过发酵生物例如酵母发酵成产物,例如乙醇。水解(糖化)和发酵可以是分别的或同时的。这些方法包括,但不限于,分别水解和发酵(SHF)、同时糖化和发酵(SSF)、同时糖化和共发酵(SSCF)、混合水解和发酵(HHF)、SHCF(分别水解和共发酵)、HHCF(混合水解和共发酵)和直接微生物转化(DMC)。
在实施本发明时,任何合适的经水解的含纤维素材料可以用于发酵步骤中。所述材料通常基于期望的发酵产物来选择,即,基于将要由发酵获得的物质来选择,还基于使用的方法来选择,如本领域内所熟知的。
术语“发酵培养基”在本文中应理解为指在加入发酵微生物之前的培养基,例如,糖化处理产生的培养基,以及例如在同时糖化和发酵方法(SSF)中使用的培养基。
“发酵微生物”指适用于期望的发酵方法中以生产发酵产物的任何微生物,其包括细菌生物和真菌生物。发酵生物可以为C6和/或C5发酵生物,或者其组合。C6和C5发酵生物都是本领域内熟知的。合适的发酵生物能够发酵,即,能够直接或间接地将糖,例如葡萄糖、木糖、木酮糖、阿拉伯糖、麦芽糖、甘露糖、半乳糖或寡糖转化成期望的发酵产物。
Lin等人,2006,Appl.Microbiol.Biotechnol.69:627-642描述了生产乙醇的细菌和真菌发酵生物的实例。
可以发酵C6糖的发酵微生物的实例包括细菌和真菌生物,例如酵母。优选的酵母包括酵母属菌种,优选为酿酒酵母。
可以发酵C5糖的发酵生物的实例包括细菌和真菌生物,例如酵母。优选的发酵C5的酵母包括毕赤酵母属(Pichia)菌株、优选为树干毕赤酵母(Pichiastipitis),例如树干毕赤酵母CBS 5773;念珠菌属的菌株,优选博伊丁念珠菌(Candida boidinii)、芸苔念珠菌(Candida brassicae)、休哈塔念珠菌(Candidasheatae)、迪丹斯念珠菌(Candida diddensii)、假热带念珠菌(Candidapseudotropicalis)、产朊假丝酵母(Candida utilis)。
其它发酵生物包括发酵单孢菌(Zymomonas)的菌株,例如运动发酵单孢菌(Zymomonas mobilis);克鲁维酵母属(Klyveromyces)的菌株,例如脆壁克鲁维酵母(K.fragilis);裂殖酵母属(Schizosaccharomyces)的菌株,例如粟酒裂殖酵母(S.Pombe);和大肠杆菌,特别是已经进行了遗传修饰以提高乙醇产率的大肠杆菌菌株。
在优选的方面,酵母是酵母属菌种(Saccharomyces spp.)。在优选的方面,酵母是酿酒酵母。在另一优选的方面,酵母是糖化酵母(Saccharomycesdistaticus)。在另一更优选的方面,酵母是葡萄汁酵母(Saccharomyces uvarum)。在另一个优选的方面,酵母是克鲁维酵母属。在另一个更优选的方面,酵母是马克斯克鲁维酵母(Kluyveromyces marxianus)。在另一个更优选的方面,酵母是脆壁克鲁维酵母(Kluyveromyces fragilis)。在另一优选的方面,酵母是念珠菌属。在另一更优选的方面,酵母是博伊丁念珠菌。在另一更优选的方面,酵母是芸苔念珠菌。在另一更优选的方面,酵母是迪丹斯念珠菌。在另一更优选的方面,酵母是假热带念珠菌。在另一更优选的方面,酵母是产朊假丝酵母。在另一优选的方面,酵母是棍孢属(Clavispora)。在另一更优选的方面,酵母是葡萄牙棍孢(Clavispora lusitaniae)。在另一更优选的方面,酵母是仙人掌棍孢(Clavispora opuntiae)。在另一优选的方面,酵母是管囊酵母属(Pachysolen)。在另一更优选的方面,酵母是嗜鞣管囊酵母(Pachysolentannophilus)。在另一优选的方面,酵母是毕赤酵母属(Pichia)。在另一更优选的方面,酵母是树干毕赤酵母(Pichia stipitis)。在另一优选的方面,酵母是酒香酵母属(Bretannomyces)。在另一更优选的方面,酵母是克劳森酒香酵母(Bretannomyces clausenii)(Philippidis,G.P.,1996,Cellulose bioconversiontechnology,in Handbook on Bioethanol:Production and Utilization,Wyman,C.E.,ed.,Taylor&Francis,Washington,DC,179-212)。
能够有效地将己糖和戊糖发酵成乙醇的细菌包括例如运动发酵单孢菌和热纤维梭菌(Clostridium thermocellum)(Philippidis,1996,见上文)。
在优选的方面,细菌是发酵单孢菌。在更优选的方面,细菌是运动发酵单孢菌。在另一优选的方面,细菌是梭菌属。在另一优选的方面,细菌是热纤维梭菌。
市售可得的适合于乙醇生产的酵母包括,例如,ETHANOL REDTM酵母(可得自Fermentis/Lesaffre,USA)、FALITM(可得自Fleischmann’s Yeast,USA)、SUPERSTARTTM和THERMOSACCTM新鲜酵母(可得自Ethanol Technology,WI,USA)、BIOFERMTM AFT和XR(可得自NABC-North American BioproductsCorporation,GA,USA)、GERT STRANDTM(可得自Gert Strand AB,Sweden)和FERMIOLTM(购自DSM Specialties)。
在优选的方面,发酵微生物已经遗传修饰以提供发酵戊糖的能力,例如,利用木糖、利用阿拉伯糖和共同利用木糖和阿拉伯糖的微生物(xylose andarabinose co-utilizing microorganism)。
将异源基因克隆至多种发酵微生物中已经导致构建了能够将己糖和戊糖转化为乙醇的生物(共发酵)(Chen and Ho,1993,Cloning and improving theexpression of Pichia stipitis xylose reductase gene in Saccharomyces cerevisiae,Appl.Biochem.Biotechnol.39-40:135-147;Ho等人,1998,Geneticallyengineered Saccharomyces yeast capable of effectively cofermenting glucose andxylose,Appl.Environ.Microbiol.64:1852-1859;Kotter and Ciriacy,1993,Xylose fermentation by Saccharomyces cerevisiae,Appl.Microbiol.Biotechnol.38:776-783;Walfridsson等人,1995,Xylose-metabolizing Saccharomycescerevisiae strains overexpressing the TKL1 and TAL1 genes encoding the pentosephosphate pathway enzymes transketolase and transaldolase,Appl.Environ.Microbiol.61:4184-4190;Kuyper等人,2004,Minimal metabolic engineering ofSaccharomyces cerevisiae for efficient anaerobic xylose fermentation:a proof ofprinciple,FEMS Yeast Research 4:655-664;Beall等人,1991,Parametric studiesof ethanol production from xylose and other sugars by recombinant Escherichiacoli,Biotech.Bioeng.38:296-303;Ingram等人,1998,Metabolic engineering ofbacteria for ethanol production,Biotechnol.Bioeng.58:204-214;Zhang等人,1995,Metabolic engineering of a pentose metabolism pathway in ethanologenicZymomonas mobilis,Science 267:240-243;Deanda等人,1996,Development ofan arabinose-fermenting Zymomonas mobilis strain by metabolic pathwayengineering,Appl.Environ.Microbiol.62:4465-4470)。
在优选的方面,经遗传修饰的发酵微生物是酿酒酵母。在另一优选的方面,经遗传修饰的发酵微生物是运动发酵单孢菌。在另一优选的方面,经遗传修饰的发酵微生物是大肠杆菌。在另一优选的实施方式中,经遗传修饰的发酵微生物是产酸克雷伯氏菌(Klebsiella oxytoca)。
通常加入发酵微生物以降解纤维素或水解产物,并且发酵进行大约8到大约96小时,例如大约24至大约60小时。温度通常为大约26℃至大约60℃之间,特别是大约32℃或50℃,并且在大约pH3至大约pH8,例如大约pH4-5,6或7。
在优选的方面,将发酵微生物应用于降解的纤维素或水解产物,并且进行发酵大约12至大约96小时,例如通常为24-60小时。在优选的方面,温度优选在大约20℃至大约60℃之间,更优选大约25℃至大约50℃,并且最优选大约32℃至大约50℃,特别是大约32℃或50℃,并且pH通常从大约pH3至大约pH7,优选大约pH 4-7。然而,例如,一些发酵生物具有更高的最佳发酵温度。发酵微生物优选以每毫升的发酵液大约105至1012,优选大约107至1010,特别是大约2×108的活细胞计数的量应用。有关使用酵母发酵的其它指导可参见例如“The Alcohol Textbook”(Editors K.Jacques,T.P.Lyonsand D.R.Kelsall,Nottingham University Press,United Kingdom 1999),将其通过引用并入本文。
对于乙醇产生,在发酵之后蒸馏发酵浆料以提取乙醇。根据本发明的方法获得的乙醇可以用作例如燃料乙醇、饮用乙醇,即,可饮用中性酒精(potableneutral spirits);或工业乙醇。
可以将发酵刺激物(fermentation stimulator)与本文描述的任何酶方法组合使用以进一步改进发酵方法,特别是改进发酵微生物的性能,例如,速率提高和乙醇产率。“发酵刺激物”指用于培养发酵微生物,特别是酵母的生长的刺激物。优选的用于生长的发酵刺激物包括维生素和矿物。维生素的实例包括多种维生素、生物素、泛酸、烟酸、内消旋肌醇、硫胺素、吡哆醇、对氨基苯甲酸、叶酸、核黄素和维生素A、B、C、D和E。参见,例如,Alfenore等人,Improving ethanol production and viability of Saccharomyces cerevisiae bya vitamin feeding strategy during fed-batch process,Springer-Verlag(2002),将其通过引用并入本文。矿物的实例包括能够提供营养物的矿物和矿物盐,所述营养物包括P、K、Mg、S、Ca、Fe、Zn、Mn和Cu。
发酵产物:发酵产物可以为源自发酵的任何物质。所述发酵产物可以是,但不限于,醇(例如,阿拉伯糖醇、丁醇、乙醇、甘油、甲醇、1,3-丙二醇、山梨糖醇和木糖醇);有机酸(例如,乙酸、醋酮酸、己二酸、抗坏血酸、柠檬酸、2,5-二酮-D-葡糖酸、甲酸、延胡索酸、葡糖二酸、葡糖酸、葡糖醛酸、戊二酸、3-羟基丙酸、衣康酸、乳酸、苹果酸、丙二酸、草酸、丙酸、琥珀酸和木糖酸);酮类(例如,丙酮);醛类(例如,甲醛);氨基酸(例如,天冬氨酸、谷氨酸、甘氨酸、赖氨酸、丝氨酸和苏氨酸);气体(例如,甲烷、氢气(H2)、二氧化碳(CO2)和一氧化碳(CO))。发酵产物还可以为作为有高价值产物的蛋白质。
在优选的方面,所述发酵产物是醇。应该理解术语“醇”包含含有一个或多个羟基的物质。在更优选的方面,所述醇是阿拉伯糖醇。在另一更优选的方面,所述醇是丁醇。在另一更优选的方面,所述醇是乙醇。在另一更优选的方面,所述醇是甘油。在另一更优选的方面,所述醇是甲醇。在另一更优选的方面,所述醇是1,3-丙二醇。在另一更优选的方面,所述醇是山梨糖醇。在另一个更优选的方面,所述醇是木糖醇。参见,例如,Gong,C.S.,Cao,N.J.,Du,J.,and Tsao,G.T.,1999,Ethanol production from renewable resources,inAdvances in Biochemical Engineering/Biotechnology,Scheper,T.,ed.,Springer-Verlag Berlin Heidelberg,Germany,65:207-241;Silveira,M.M.,andJonas,R.,2002,The biotechnological production of sorbitol,Appl.Microbiol.Biotechnol.59:400-408;Nigam,P.,and Singh,D.,1995,Processes forfermentative production of xylitol-a sugar substitute,Process Biochemistry 30(2):117-124;Ezeji,T.C.,Qureshi,N.and Blaschek,H.P.,2003,Production ofacetone,butanol and ethanol by Clostridium beijerinckii BA101 and in siturecovery by gas stripping,World Journal of Microbiology and Biotechnology 19(6):595-603。
另一个优选的方面,所述发酵产物是有机酸。在另一更优选的方面,所述有机酸是乙酸。在另一更优选的方面,所述有机酸是醋酮酸。在另一更优选的方面,所述有机酸是己二酸。在另一更优选的方面,所述有机酸是抗坏血酸。在另一更优选的方面,所述有机酸是柠檬酸。在另一更优选的方面,所述有机酸是2,5-二酮-D-葡糖酸。在另一更优选的方面,所述有机酸是甲酸。在另一更优选的方面,所述有机酸是延胡索酸。在另一更优选的方面,所述有机酸是葡糖二酸。在另一更优选的方面,所述有机酸是葡糖酸。在另一更优选的方面,所述有机酸是葡糖醛酸。在另一更优选的方面,所述有机酸是戊二酸。在另一优选的方面,所述有机酸是3-羟基丙酸。在另一更优选的方面,所述有机酸是衣康酸。在另一更优选的方面,所述有机酸是乳酸。在另一更优选的方面,所述有机酸是苹果酸。在另一更优选的方面,所述有机酸是丙二酸。在另一更优选的方面,所述有机酸是草酸。在另一更优选的方面,所述有机酸是丙酸。在另一更优选的方面,所述有机酸是琥珀酸。在另一更优选的方面,所述有机酸是木糖酸。参见,例如,Chen,R.,and Lee,Y.Y.,1997,Membrane-mediated extractive fermentation for lactic acid production fromcellulosic biomass,Appl.Biochem.Biotechnol.63-65:435-448。
在另一优选的方面,所述发酵产物是酮。应该理解的是术语“酮”涵盖含有一个或多个酮基的物质。在另一更优选的方面,所述酮是丙酮。参见,例如,Qureshi and Blaschek,2003,见上文。
在另一优选的方面,所述发酵产物是醛。在另一更优选的方面,所述醛为甲醛。
在另一优选的方面,所述发酵产物是氨基酸。在另一更优选的方面,所述有机酸是天冬氨酸。在另一更优选的方面,所述氨基酸是谷氨酸。在另一更优选的方面,所述氨基酸是甘氨酸。在另一更优选的方面,所述氨基酸是赖氨酸。在另一更优选的方面,所述氨基酸是丝氨酸。在另一更优选的方面,所述氨基酸是苏氨酸。参见,例如,Richard,A.,and Margaritis,A.,2004,Empirical modeling of batch fermentation kinetics for poly(glutamic acid)production and other microbial biopolymers,Biotechnology and Bioengineering87(4):501-515。
在另一优选的方面,所述发酵产物是气体。在另一更优选的方面,所述气体是甲烷。在另一更优选的方面,所述气体是H2。在另一更优选的方面,所述气体是CO2。在另一更优选的方面,所述气体是CO。参见,例如,Kataoka,N.,A.Miya,and K.Kiriyama,1997,Studies on hydrogen production bycontinuous culture system of hydrogen-producing anaerobic bacteria,WaterScience and Technology 36(6-7):41-47;和Gunaseelan V.N.in Biomass andBioenergy,Vol.13(1-2),pp.83-114,1997,Anaerobic digestion of biomass formethane production:A review。
回收:使用本领域已知的方法可以从发酵培养基中任选地回收发酵产物,所述方法包括,但不限于,层析(例如,离子交换、亲和、疏水、层析聚焦和大小排阻)、电泳方法(例如,制备型等电聚焦)、差示溶解度(例如,硫酸铵沉淀)、蒸馏或提取。例如,从发酵的含纤维素材料中分离乙醇,并通过常规的蒸馏方法纯化。可以获得纯度高至大约96vol.%的乙醇,其可以用作,例如燃料乙醇、饮用乙醇,即,可饮用中性酒精(potable neutral spirits);或工业乙醇。
通过以下实施例进一步对本发明进行描述,但不应将其理解为对本发明范围的限制。
实施例
材料
用作缓冲剂和底物的化学药品为至少为试剂级的市售产品。
培养基
NNCYP培养基由如下物质组成:每升5.0g NH4NO3、0.5g MgSO4·7H2O、0.3gCaCl2、2.5g柠檬酸、1.0g细菌用蛋白胨、5.0g酵母提取物、1ml COVE痕量金属溶液和足量的K2HPO4以实现最终的pH为大约5.4。
COVE痕量金属溶液由如下物质组成:每升0.04g Na2B4O7·10H2O、0.4gCuSO4·5H2O、1.2g FeSO4·7H2O、0.7g MnSO4·H2O、0.8g Na2MoO2·2H2O和10g ZnSO4·7H2O。
实施例1:米曲霉β-葡糖苷酶和具有增强纤维素分解的活性的橙色嗜热子囊菌多肽GH61A的制备
通过在米曲霉中过表达来制备米曲霉β-葡糖苷酶和具有增强纤维素分解的活性的橙色嗜热子囊菌多肽GH61A。根据WO 2005/074656在米曲霉JaL250中重组产生具有增强纤维素分解的活性的橙色嗜热子囊菌多肽GH61A。根据WO 02/095014,在米曲霉JaL250中重组产生米曲霉β-葡糖苷酶。
通过在补充有每升52g的纤维素的NNCYP培养基上培养米曲霉培养物使发酵罐培养物生长,并在发酵过程中(无额外碳源)在42℃将所述培养基分批加入并保持在pH 5.0下。使发酵能够进行直至该批次的纤维素已经消耗完(通常大约40小时),此时采集培养液,并离心分离以除去菌丝。通过在9500xg下离心培养物大约20分钟来清除粗制培养液样品的细胞碎片。然后,过滤澄清的培养液样品(
Figure G2008800241104D00871
GP ExpressTM membrane,polyethersulfone,0.22μm,Millipore,Bedford,MA,USA)。使用BCATM蛋白测定试剂盒(Pierce,Rockford,IL,USA)测定脱盐材料(HIPREPTM 26/10 Desalting Column,AKTATM,GE Healthcare,Piscataway,NJ,USA)的蛋白浓度,在所述蛋白测定试剂盒中,将牛血清白蛋白用作蛋白标准品。通常在8-16%CRITERIONTM SDS-PAGE凝胶(Bio-Rad,Hercules,CA;200V,1小时)上检验等分试样,在所述凝胶中包括PRECISION PLUS PROTEINTM分子量标准品(Bio-Rad,Hercules,CA,USA)。使用BIO-SAFETM Coomassie Stain(Bio-Rad,Hercules,CA,USA)染色凝胶中的蛋白,并使用去离子水脱染色。
Figure G2008800241104D00881
LDI(Dyadic International,Inc.,Jupiter,FL,USA)如获得时那样使用。如上测定蛋白。
实施例2:玉米秸秆的预处理
在U.S.Department of Energy National Renewable Energy Laboratory(NREL)使用稀硫酸预处理玉米秸秆。使用下列条件进行预处理:在195℃在1.4wt%硫酸预处理4.5分钟。根据使用过量的纤维素酶消化的极限,在经预处理的玉米秸秆(PCS)中的不溶于水的固体包含59.5%的纤维素。在酶水解之前,用大量的去离子水洗涤PCS直至除去可溶酸和糖。发现经水洗涤的PCS的干重为19.16%。
实施例3:当与米曲霉β-葡糖苷酶和
Figure G2008800241104D00882
LDI纤维素酶组合时橙色嗜热子囊菌多肽GH61A的增强纤维素分解的活性
根据NREL实验分析规程第8条(Laboratory Analytical Protocol#008)使用50g的总反应量、使用125ml的带螺旋盖的锥形烧瓶(VWR,West Chester,PA,USA)进行PCS的水解。在该规程中,在占纤维素酶蛋白加样量6%的米曲霉β-葡糖苷酶存在或不存在,以及在加入和没有加入11%橙色嗜热子囊菌多肽GH61A的情况下,使用不同蛋白加样量(用mg酶/g纤维素表示)的
Figure G2008800241104D00883
LDI样品(Dyadic International,Inc.,Jupiter,FL,USA)进行PCS(在pH 5.0的50mM的醋酸钠缓冲水溶液中大约11.4%的PCS和6.8%纤维素)的水解。用轨道振荡(
Figure G2008800241104D00884
4080 Incubator,New Brunswick Scientific,Edison,NJ,USA)以150rpm在50℃进行对PCS水解能力的测试。在水解过程的72、120和172小时采集等分试样。离心等分试样,并将上清液使用板式离心机(
Figure G2008800241104D00885
RT7,Thermo Fisher Scientific,Waltham,MA,USA)通过在2000rpm离心(
Figure G2008800241104D00891
HV 0.45μm,Millipore,Billerica,MA,USA)15分钟来过滤。当不立即使用时,将经过滤的含有糖的等分试样在-20℃下冷冻。在用0.005M H2SO4以0.4ml/min的流速从4.6×250mm的
Figure G2008800241104D00892
HPX-87H柱(Bio-Rad,Hercules,CA,USA)洗脱之后,在65℃下用来自经纯糖样品校准过的折射率检测器(
Figure G2008800241104D00893
Figure G2008800241104D00894
1100HPLC,Agilent Technologies,Santa Clara,CA,USA)的葡萄糖和纤维二糖信号的积分定量来测量稀释在0.005M H2SO4中的样品的糖浓度。所得的当量用于计算各反应的纤维素转化率百分数。
使用以下等式计算纤维素转化成葡萄糖和纤维二糖的程度(转化率,%):
转化率(%)=(葡萄糖+纤维二糖×1.053)(mg/ml)×100×162/(纤维素(mg/ml)×180)=(葡萄糖+纤维二糖×1.053)(mg/ml)×100/(纤维素(mg/ml)×1.111)
在该等式中,因子1.111反映在纤维素转化成葡萄糖时的重量增加,而因子1.053反映纤维二糖转化成葡萄糖时的重量增加。通过消化PCS以释放葡萄糖和纤维二糖的范围测定PCS中的纤维素。
在各实验之前,从贮藏在4℃的酶母液制备新鲜的酶稀释液。
表1所示的结果表明:向
Figure G2008800241104D00895
LDI中加入米曲霉β-葡糖苷酶产生的大约94%
Figure G2008800241104D00896
LDI和大约6%β-葡糖苷酶的混合物,其在7.1至43.3mg/g纤维素的蛋白质水平下,与单独使用等量的
Figure G2008800241104D00897
LDI的蛋白质得到的葡萄糖转化率相比,其提高了葡萄糖转化率。表1的结果表明:向
Figure G2008800241104D00898
LDI中加入米曲霉β-葡糖苷酶和橙色嗜热子囊菌GH61A产生的大约83%
Figure G2008800241104D00899
LDI与大约6%β-葡糖苷酶和大约11%GH61A蛋白质的混合物,与单独使用等量的
Figure G2008800241104D008910
LDI的蛋白质或FIBREZYMETM LDI与β-葡糖苷酶的混合物得到的葡萄糖转化率相比,其提高了葡萄糖转化率。将水解72小时的结果描绘在图1中。
因此,向包含LDI的溶液中加入橙色嗜热子囊菌GH61A蛋白提高了经酸预处理的玉米秸秆(PCS)水解的葡萄糖和纤维二塘的产率。产率的提高高于通过加入等量或更少量的
Figure G2008800241104D008912
LDI或者等量或更少量的与β-葡糖苷酶混合的
Figure G2008800241104D008913
LDI实现的产率提高,导致酶加样需求的减少和酶效率的提高。
Figure G2008800241104D00901
生物材料的保藏
依据布达佩斯条约的条款,下述的生物材料已经保藏于农业研究机构专利培养物保藏中心,北区研究中心,1815 University Street,Peoria,Illinois,61604,并给出了下述的登录号:
保藏物                  登录号               保藏日期
大肠杆菌菌株pEJG120     NRRL B-30699         2003年12月19日
大肠杆菌菌株pTter61C    NRRL B-30813    2005年1月21日
大肠杆菌菌株pTter61D    NRRL B-30812         2005年1月21日
大肠杆菌菌株pTter61E    NRRL B-30814         2005年1月21日
大肠杆菌菌株pTter61G    NRRL B-30811         2005年1月21日
大肠杆菌菌株pDZA2-7     NRRL B-30704         2004年1月30日
大肠杆菌菌株pTr3337     NRRL B-30878         2005年9月20日
大肠杆菌TOP10(pEJG113)  NRRL B-30695         2003年10月17日
大肠杆菌TOP10pKKAB      NRRL B-30860         2005年7月8日
NN049573                DSM 14240            2001年4月19日
所述菌株已经于下述条件下保藏:确保在本专利申请未决期间,由专利与商标委员依据37C.F.R.§1.14和35U.S.C.§122授权的人能够获得该培养物。该保藏物为所保藏菌株的基本上纯的培养物。在提交了该申请的副本,或其后续文本的国家,依据该外国专利法律的要求,可以获得该保藏物。然而,应当理解,保藏物的获得并不构成对实施本发明的许可,实施本发明是对政府行为所授予的专利权的侵犯。
此处,本文中所描述和要求保护的本发明在范围上并非限定于本文所公开的具体方面,因为这些方面意欲作为本发明几个方面的说明。任何等价的方面意欲在本发明的范围之内。事实上,从前面的说明中,对于本领域技术人员来说,除本文所显示和描述的之外,本发明的多种修改将是显而易见的。这些修改也意欲落入所附的权利要求的范围内。在冲突的情况下,将以包括定义部分的本公开为准。本文引用了多篇参考文献,将其公开的全部内容并入作为参考。
序列表
<110>诺维信股份有限公司(Novozymes,Inc.)
McFarland,Keith
 
<120>用于增强含纤维素材料的降解或转化的组合物和方法
 
<130>11233.204-WO
 
<150>US 60/917,208
<151>2007-05-10
 
<160>30
 
<170>PatentIn version 3.5
 
<210>1
<211>1371
<212>DNA
<213>嗜热毁丝霉(Myceliophthora thermophila)
 
<400>1
atgggtcgcg gcgctgcttt cctaggcctc gcctcgctcc tcgtgggcgc ggccaaggcc    60
cagacgcccg gcgagggcga ggaggtgcac ccgcagatca cgacgtaccg ctgcaccaag    120
gcggacgggt gcgaggagaa gaccaactac atcgtgctgg acgccctatc gcacccggtc    180
caccaggtcg acaacccgta caactgcggc gactggggcc agaagcccaa cgagacggcc    240
tgcccggacc tcgagtcgtg cgccaggaac tgcatcatgg acccggtctc ggactacggc    300
cggcacggtg tctcgaccga cggcacctcg ctgcgcctca agcagctagt cggcggcaac    360
gtcgtcagcc cgcgcgtcta cctgctcgac gagaccaagg agcgctacga gatgctcaag    420
ctgaccggca acgagttcac ctttgacgtc gacgccacca agctgccctg cggcatgaac    480
agcgccctct acctctccga gatggacgcc accggcgccc ggagcgagct caacccgggc    540
ggcgccacct ttggcaccgg ctactgcgac gcccagtgct acgtcacccc cttcatcaac    600
ggcctcggca acatcgaggg caagggcgcg tgctgcaacg agatggatat ctgggaggcc    660
aacgcgcggg cgcagcacat cgcgccgcac ccgtgcagca aggcggggcc gtacctgtgc    720
gagggcgccg agtgcgagtt cgacggcgtg tgcgacaaga acggctgcgc ctggaacccg    780
taccgggtca acgtgacgga ctactacggc gagggcgccg agttcagggt ggacacgacc    840
cggcccttct cggtcgtcac gcagttccgc gccggcggcg acgcgggggg cggcaagctc    900
gagagcatct accggctctt cgtccaggac ggcagggtga ttgagtcgta cgtcgtcgac    960
aagcccggcc tgcccccgac ggaccgcatg acggacgagt tctgcgccgc caccggcgcc    1020
gcccgcttca cggagctcgg cgccatggag gccatgggcg acgccctgac gcgcggcatg    1080
gtcctcgccc tcagcatctg gtggagcgag ggcgacaaca tgaactggct cgactcgggc    1140
gaggccggcc cctgcgaccc ggacgagggc aacccgtcca acatcatccg cgtccagccc    1200
gacccggagg tcgtcttcag caacctgcgc tggggcgaga tcggctcaac ctacgagtcc    1260
gccgtcgacg ggcccgtcgg caagggcaag ggcaagggca agggcaaggc tcccgccggc    1320
gacggcaacg ggaaggagaa gagcaatggc aagcgcttca ggaggttctg a             1371
 
<210>2
<211>456
<212>PRT
<213>嗜热毁丝霉
<400>2
 
Met Gly Arg Gly Ala Ala Phe Leu Gly Leu Ala Ser Leu Leu Val Gly
1               5                   10                  15
Ala Ala Lys Ala Gln Thr Pro Gly Glu Gly Glu Glu Val His Pro Gln
            20                  25                  30
Ile Thr Thr Tyr Arg Cys Thr Lys Ala Asp Gly Cys Glu Glu Lys Thr
        35                  40                  45
Asn Tyr Ile Val Leu Asp Ala Leu Ser His Pro Val His Gln Val Asp
    50                  55                  60
Asn Pro TyrAs n Cys Gly Asp Trp Gly Gln Lys Pro Asn Glu Thr Ala
65                  70                  75                  80
Cys Pro Asp Leu Glu Ser Cys Ala Arg Asn Cys Ile Met Asp Pro Val
                85                  90                  95
Ser Asp Tyr Gly Arg His Gly Val Ser Thr Asp Gly Thr Ser Leu Arg
            100                 105                 110
Leu Lys Gln Leu Val Gly Gly Asn Val Val Ser Pro Arg Val Tyr Leu
        115                 120                 125
Leu Asp Glu Thr Lys Glu Arg Tyr Glu Met Leu Lys Leu Thr Gly Asn
    130                 135                 140
Glu Phe Thr Phe Asp Val Asp Ala Thr Lys Leu Pro Cys Gly Met Asn
145                 150                 155                 160
Ser Ala Leu Tyr Leu Ser Glu Met Asp Ala Thr Gly Ala Arg Ser Glu
                165                 170                 175
Leu Asn Pro Gly Gly Ala Thr Phe Gly Thr Gly Tyr Cys Asp Ala Gln
            180                 185                 190
Cys Tyr Val Thr Pro Phe Ile Asn Gly Leu Gly Asn Ile Glu Gly Lys
        195                 200                 205
Gly Ala Cys Cys Asn Glu Met Asp Ile Trp Glu Ala Asn Ala Arg Ala
    210                 215                 220
Gln His Ile Ala Pro His Pro Cys Ser Lys Ala Gly Pro Tyr Leu Cys
225                 230                 235                 240
Glu Gly Ala Glu Cys Glu Phe Asp Gly Val Cys Asp Lys Asn Gly Cys
                245                 250                 255
Ala Trp Asn Pro Tyr Arg Val Asn Val Thr Asp Tyr Tyr Gly Glu Gly
            260                 265                 270
Ala Glu Phe Arg Val Asp Thr Thr Arg Pro Phe Ser Val Val Thr Gln
        275                 280                 285
Phe Arg Ala Gly Gly Asp Ala Gly Gly Gly Lys Leu Glu Ser Ile Tyr
    290                 295                 300
Arg Leu Phe Val Gln Asp Gly Arg Val Ile Glu Ser Tyr Val Val Asp
305                 310                 315                 320
Lys Pro Gly Leu Pro Pro Thr Asp Arg Met Thr Asp Glu Phe Cys Ala
                325                 330                 335
Ala Thr Gly Ala Ala Arg Phe Thr Glu Leu Gly Ala Met Glu Ala Met
            340                 345                 350
Gly Asp Ala Leu Thr Arg Gly Met Val Leu Ala Leu Ser Ile Trp Trp
        355                 360                 365
Ser Glu Gly Asp Asn Met Asn Trp Leu Asp Ser Gly Glu Ala Gly Pro
    370                 375                 380
Cys Asp Pro Asp Glu Gly Asn Pro Ser Asn Ile Ile Arg Val Gln Pro
385                 390                 395                 400
Asp Pro Glu Val Val Phe Ser Asn Leu Arg Trp Gly Glu Ile Gly Ser
                405                 410                 415
Thr Tyr Glu Ser Ala Val Asp Gly Pro Val Gly Lys Gly Lys Gly Lys
            420                 425                 430
Gly Lys Gly Lys Ala Pro Ala Gly Asp Gly Asn Gly Lys Glu Lys Ser
        435                 440                 445
Asn Gly Lys Arg Phe Arg Arg Phe
    450                 455
 
<210>3
<211>744
<212>DNA
<213>Chrysosoporium lucknowense
 
<400>3
atgcagccgt ttctgctctt gttcctctcg tcggtcacgg cggcgagccc cctgacggcg    60
ctcgacaagc ggcagcaggc gacgttgtgc gagcagtacg gctactggtc gggcaacggt    120
tacgaggtca acaacaacaa ctggggcaag gattcggcct cgggcggcca tcagtgcacc    180
tacgtcgaca gcagcagctc cagcggcgtc gcctggcaca cgacctggca gtgggaagga    240
ggccagaacc aggtcaagag cttcgccaac tgcggcctgc aggtgcccaa gggcaggacc    300
atctcgtcca tcagcaacct gcagacctcc atctcgtggt cctacagcaa caccaacatc    360
cgcgccaacg tggcctacga cctcttcacc gcggcagacc cgaaccacgc gaccagcagc    420
ggcgactacg agctcatgat ctggctggcg agattcggcg acgtctaccc catcggctcg    480
tcccagggcc acgtcaacgt ggccggccag gactgggagc tgtggacggg cttcaacggc    540
aacatgcggg tctacagctt cgtagcgccc agcccccgca acagcttcag cgccaacgtc    600
aaggacTTct tcaactatct ccagtccaac cagggcttcc cggccagcag ccaatacctt    660
ctcatcttcc aggcgggcac cgagcccttc accggcggcg agaccaccct taccgtcaac    720
aactactctg caagggttgc ttaa                                           744
 
<210>4
<211>247
<212>PRT
<213>Chrysosoporium lucknowense
 
<400>4
 
Met Gln Pro Phe Leu Leu Leu Phe Leu Ser Ser Val Thr Ala Ala Ser
1               5                   10                  15
Pro Leu Thr Ala Leu Asp Lys Arg Gln Gln Ala Thr Leu Cys Glu Gln
            20                  25                  30
Tyr Gly Tyr Trp Ser Gly Asn Gly Tyr Glu Val Asn Asn Asn Asn Trp
        35                  40                  45
Gly Lys Asp Ser Ala Ser Gly Gly His Gln Cys Thr Tyr Val Asp Ser
    50                  55                  60
Ser Ser Ser Ser Gly Val Ala Trp His Thr Thr Trp Gln Trp Glu Gly
65                  70                  75                  80
Gly Gln Asn Gln Val Lys Ser Phe Ala Asn Cys Gly Leu Gln Val Pro
                85                  90                  95
Lys Gly Arg Thr Ile Ser Ser Ile Ser Asn Leu Gln Thr Ser Ile Ser
            100                 105                 110
Trp Ser Tyr Ser Asn Thr Asn Ile Arg Ala Asn Val Ala Tyr Asp Leu
        115                 120                 125
Phe Thr Ala Ala Asp Pro Asn His Ala Thr Ser Ser Gly Asp Tyr Glu
    130                 135                 140
Leu Met Ile Trp Leu Ala Arg Phe Gly Asp Val Tyr Pro Ile Gly Ser
145                 150                 155                 160
Ser Gln Gly His Val Asn Val Ala Gly Gln Asp Trp Glu Leu Trp Thr
                165                 170                 175
Gly Phe Asn Gly Asn Met Arg Val Tyr Ser Phe Val Ala Pro Ser Pro
            180                 185                 190
Arg Asn Ser Phe Ser Ala Asn Val Lys Asp Phe Phe Asn Tyr Leu Gln
        195                 200                 205
Ser Asn Gln Gly Phe Pro Ala Ser Ser Gln Tyr Leu Leu Ile Phe Gln
    210                 215                 220
Ala Gly Thr Glu Pro Phe Thr Gly Gly Glu Thr Thr Leu Thr Val Asn
225                 230                 235                 240
Asn Tyr Ser Ala Arg Val Ala
                245
 
<210>5
<211>678
<212>DNA
<213>Chrysosoporium lucknowense
 
<400>5
atgcatctct ccgccaccac cgggttcctc gccctcccgg ccctggccct ggcccagctc    60
tcgggcagcg gccagacgac ccggtactgg gactgctgca agccgagctg cgcctggccc    120
ggcaagggcc cctcgtctcc ggtgcaggcc tgcgacaaga acgacaaccc gctcaacgac    180
ggcggctcca cccggtccgg ctgcgacgcg ggcggcagcg cctacatgtg ctcctcccag    240
agcccctggg ccgtcagcga cgagctgtcg tacggctggg cggccgtcaa gctcgccggc    300
agctccgagt cgcagtggtg ctgcgcctgc tacgagctga ccttcaccag cgggccggtc    360
gcgggcaaga agatgattgt gcaggcgacc aacaccggtg gcgacctggg cgacaaccac    420
tttgacctgg ccatccccgg tggcggtgtc ggtattttca acgcctgcac cgaccagtac    480
ggcgctcccc cgaacggctg gggcgaccgc tacggcggca tccattccaa ggaagagtgc    540
gaatccttcc cggaggccct caagcccggc tgcaactggc gcttcgactg gttccaaaac    600
gccgacaacc cgtcggtcac cttccaggag gtggcctgcc cgtcggagct cacgtccaag    660
agcggctgct cccgttaa                                                  678
 
<210>6
<211>225
<212>PRT
<213>Chrysosoporium lucknowense
 
<400>6
 
Met His Leu Ser Ala Thr Thr Gly Phe Leu Ala Leu Pro Ala Leu Ala
1               5                   10                  15
Leu Ala Gln Leu Ser Gly Ser Gly Gln Thr Thr Arg Tyr Trp Asp Cys
            20                  25                  30
Cys Lys Pro Ser Cys Ala Trp Pro Gly Lys Gly Pro Ser Ser Pro Val
        35                  40                  45
Gln Ala Cys Asp Lys Asn Asp Asn Pro Leu Asn Asp Gly Gly Ser Thr
    50                  55                  60
Arg Ser Gly Cys Asp Ala Gly Gly Ser Ala Tyr Met Cys Ser Ser Gln
65                  70                  75                  80
Ser Pro Trp Ala Val Ser Asp Glu Leu Ser Tyr Gly Trp Ala Ala Val
                85                  90                  95
Lys Leu Ala Gly Ser Ser Glu Ser Gln Trp Cys Cys Ala Cys Tyr Glu
            100                 105                 110
Leu Thr Phe Thr Ser Gly Pro Val Ala Gly Lys Lys Met Ile Val Gln
        115                 120                 125
Ala Thr Asn Thr Gly Gly Asp Leu Gly Asp Asn His Phe Asp Leu Ala
    130                 135                 140
Ile Pro Gly Gly Gly Val Gly Ile Phe Asn Ala Cys Thr Asp Gln Tyr
145                 150                 155                 160
Gly Ala Pro Pro Asn Gly Trp Gly Asp Arg Tyr Gly Gly Ile His Ser
                165                 170                 175
Lys Glu Glu Cys Glu Ser Phe Pro Glu Ala Leu Lys Pro Gly Cys Asn
            180                 185                 190
Trp Arg Phe Asp Trp Phe Gln Asn Ala Asp Asn Pro Ser Val Thr Phe
        195                 200                 205
Gln Glu Val Ala Cys Pro Ser Glu Leu Thr Ser Lys Ser Gly Cys Ser
    210                 215                 220
Arg
225
 
<210>7
<211>1648
<212>DNA
<213>Chrysosoporium lucknowense
 
<220>
<221>misc_feature
<222>(1162)..(1162)
<223>NA、C、G或T
 
<400>7
atgtacgcca agttcgcgac cctcgccgcc cttgtggctg gcgccgctgc tcagaacgcc    60
tgcactctga ccgctgagaa ccacccctcg ctgacgtggt ccaagtgcac gtctggcggc    120
agctgcacca gcgtccaggg ttccatcacc atcgacgcca actggcggtg gactcaccgg    180
accgatagcg ccaccaactg ctacgagggc aacaagtggg atacttcgta ctgcagcgat    240
ggtccttctt gcgcctccaa gtgctgcatc gacggcgctg actactcgag cacctatggc    300
atcaccacga gcggtaactc cctgaacctc aagttcgtca ccaagggcca gtactcgacc    360
aacatcggct cgcgtaccta cctgatggag agcgacacca agtaceagag taagttcctc    420
tcgcacccgg ccgccgggag atgatggcgc ccagcccgct gacgcgaatg acacagtgtt    480
ccagctcctc ggcaacgagt tcaccttcga tgtcgacgtc tccaacctcg gctgcggcct    540
caatggcgcc ctctacttcg tgtccatgga tgccgatggt ggcatgtcca agtactcggg    600
caacaaggca ggtgccaagt acggtaccgg ctactgtgat tctcagtgcc cccgcgacct    660
caagttcatc aacggcgagg ccaacgtaga gaactggcag agctcgacca acgatgccaa    720
cgccggcacg ggcaagtacg gcagctgctg ctccgagatg gacgtctggg aggccaacaa    780
catggccgcc gccttcactc cccacccttg caccgtgatc ggccagtcgc gctgcgaggg    840
cgactcgtgc ggcggtacct acagcaccga ccgctatgcc ggcatctgcg accccgacgg    900
atgcgacttc aactcgtacc gccagggcaa caagaccttc tacggcaagg gcatgacggt    960
cgacacgacc aagaagatca cggtcgtcac ccagttcctc aagaactcgg ccggcgagct    1020
ctccgagatc aagcggttct acgtccagaa cggcaaggtc atccccaact ccgagtccac    1080
catcccgggc gtcgagggca actccatcac ccaggactgg tgcgaccgcc agaaggccgc    1140
cttcggcgac gtgaccgact tncaggacaa gggcggcatg gtccagatgg gcaaggccct    1200
cgcggggccc atggtcctcg tcatgtccat ctgggacgac cacgccgtca acatgctctg    1260
gctcgactcc acctggccca tcgacggcgc cggcaagccg ggcgccgagc gcggtgcctg    1320
ccccaccacc tcgggcgtcc ccgctgaggt cgaggccgag gcccccaact ccaacgtcat    1380
cttctccaac atccgcttcg gccccatcgg ctccaccgtc tccggcctgc ccgacggcgg    1440
cagcggcaac cccaacccgc ccgtcagctc gtccaccccg gtcccctcct cgtccaccac    1500
atcctccggt tcctccggcc cgactggcgg cacgggtgtc gctaagcact atgagcaatg    1560
cggaggaatc gggttcactg gccctaccca gtgcgagagc ccctacactt gcaccaagct    1620
gaatgactgg tactcgcagt gcctgtaa                                       1648
 
<210>8
<211>526
<212>PRT
<213>Chrysosoporium lucknowense
 
<220>
<221>MISC_FEATURE
<222>(365)..(365)
<223>X=任何氨基酸
 
<400>8
 
Met Tyr Ala Lys Phe Ala Thr Leu Ala Ala Leu Val Ala Gly Ala Ala
1               5                   10                  15
Ala Gln Asn Ala Cys Thr Leu Thr Ala Glu Asn His Pro Ser Leu Thr
            20                  25                  30
Trp Ser Lys Cys Thr Ser Gly Gly Ser Cys Thr Ser Val Gln Gly Ser
        35                  40                  45
Ile Thr Ile Asp Ala Asn Trp Arg Trp Thr His Arg Thr Asp Ser Ala
    50                  55                  60
Thr Asn Cys Tyr Glu Gly Asn Lys Trp Asp Thr Ser Tyr Cys Ser Asp
65                  70                  75                  80
Gly Pro Ser Cys Ala Ser Lys Cys Cys Ile Asp Gly Ala Asp Tyr Ser
                85                  90                  95
Ser Thr Tyr Gly Ile Thr Thr Ser Gly Asn Ser Leu Ash Leu Lys Phe
            100                 105                 110
Val Thr Lys Gly Gln Tyr Ser Thr Asn Ile Gly Ser Arg Thr Tyr Leu
        115                 120                 125
Met Glu Ser Asp Thr Lys Tyr Gln Met Phe Gln Leu Leu Gly Asn Glu
    130                 135                 140
Phe Thr Phe Asp Val Asp Val Ser Asn Leu Gly Cys Gly Leu Asn Gly
145                 150                 155                 160
Ala Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Met Ser Lys Tyr
                165                 170                 175
Ser Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser
            180                 185                 190
Gln Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Glu Ala Asn Val Glu
        195                 200                 205
Asn Trp Gln Ser Ser Thr Asn Asp Ala Asn Ala Gly Thr Gly Lys Tyr
    210                 215                 220
Gly Ser Cys Cys Ser Glu Met Asp Val Trp Glu Ala Asn Asn Met Ala
225                 230                 235                 240
Ala Ala Phe Thr Pro His Pro Cys Trp Val Ile Gly Gln Ser Arg Cys
                245                 250                 255
Glu Gly Asp Ser Cys Gly Gly Thr Tyr Ser Thr Asp Arg Tyr Ala Gly
            260                 265                 270
Ile Cys Asp Pro Asp Gly Cys Asp Phe Asn Ser Tyr Arg Gln Gly Asn
        275                 280                 285
Lys Thr Phe Tyr Gly Lys Gly Met Thr Val Asp Thr Thr Lys Lys Ile
    290                 295                 300
Thr Val Val Thr Gln Phe Leu Lys Asn Ser Ala Gly Glu Leu Ser Glu
305                 310                 315                 320
Ile Lys Arg Phe Tyr Val Gln Asn Gly Lys Val Ile Pro Asn Ser Glu
                325                 330                 335
Ser Thr Ile Pro Gly Val Glu Gly Asn Ser Ile Thr Gln Asp Trp Cys
            340                 345                 350
Asp Arg Gln Lys Ala Ala Phe Gly Asp Val Thr Asp Xaa Gln Asp Lys
        355                 360                 365
Gly Gly Met Val Gln Met Gly Lys Ala Leu Ala Gly Pro Met Val Leu
    370                 375                 380
Val Met Ser Ile Trp Asp Asp His Ala Val Asn Met Leu Trp Leu Asp
385                 390                 395                 400
Ser Thr Trp Pro Ile Asp Gly Ala Gly Lys Pro Gly Ala Glu Arg Gly
                405                 410                 415
Ala Cys Pro Thr Thr Ser Gly Val Pro Ala Glu Val Glu Ala Glu Ala
            420                 425                 430
Pro Asn Ser Asn Val Ile Phe Ser Asn Ile Arg Phe Gly Pro Ile Gly
        435                 440                 445
Ser Thr Val Ser Gly Leu Pro Asp Gly Gly Ser Gly Asn Pro Asn Pro
    450                 455                 460
Pro Val Ser Ser Ser Thr Pro Val Pro Ser Ser Ser Thr Thr Ser Ser
465                 470                 475                 480
Gly Ser Ser Gly Pro Thr Gly Gly Thr Gly Val Ala Lys His Tyr Glu
                485                 490                 495
Gln Cys Gly Gly Ile Gly Phe Thr Gly Pro Thr Gln Cys Glu Ser Pro
            500                 505                 510
Tyr Thr Cys Thr Lys Leu Asn Asp Trp Tyr Ser Gln Cys Leu
        515                 520                 525
 
<210>9
<211>1353
<212>DNA
<213>嗜热毁丝霉
 
<400>9
atgaagcagt acctccagta cctcgcggcg accctgcccc tggtgggcct ggccacggcc    60
cagcaggcgg gtaacctgca gaccgagact caccccaggc tcacttggtc caagtgcacg    120
gccccgggat cctgccaaca ggtcaacggc gaggtcgtca tcgactccaa ctggcgctgg    180
gtgcacgacg agaacgcgca gaactgctac gacggcaacc agtggaccaa cgcttgcagc    240
tctgccaccg actgcgccga gaattgcgcg ctcgagggtg ccgactacca gggcacctat    300
ggcgcctcga ccagcggcaa tgccctgacg ctcaccttcg tcactaagca cgagtacggc    360
accaacattg gctcgcgcct ctacctcatg aacggcgcga acaagtacca gatgttcacc    420
ctcaagggca acgagctggc cttcgacgtc gacctctcgg ccgtcgagtg cggcctcaac    480
agcgccctct acttcgtggc catggaggag gatggcggtg tgtcgagcta cccgaccaac    540
acggccggtg ctaagttcgg cactgggtac tgcgacgccc aatgcgcacg cgacctcaag    600
ttcgtcggcg gcaagggcaa catcgagggc tggaagccgt ccaccaacga tgccaatgcc    660
ggtgtcggtc cttatggcgg gtgctgcgct gagatcgacg tctgggagtc gaacaagtat    720
gctttcgctt tcaceccgca cggttgcgag aaccctaaat accacgtctg cgagaccacc    780
aactgcggtg gcacctactc cgaggaccgc ttcgctggtg actgcgatgc caacggctgc    840
gactacaacc cctaccgcat gggcaaccag gacttctacg gtcccggctt gacggtcgat    900
accagcaaga agttcaccgt cgtcagccag ttcgaggaga acaagctcac ccagttcttc    960
gtccaggacg gcaagaagat tgagatcccc ggccccaagg tcgagggcat cgatgcggac    1020
agcgccgcta tcacccctga gctgtgcagt gccctgttca aggccttcga tgaccgtgac    1080
cgcttctcgg aggttggcgg cttcgatgcc atcaacacgg ccctcagcac tcccatggtc    1140
ctcgtcatgt ccatctggga tgatcactac gccaatatgc tctggctcga ctcgagctac    1200
ccccctgaga aggctggcca gcctggcggt gaccgtggcc cgtgtcctca ggactctggc    1260
gtcccggccg acgttgaggc tcagtaccct aatgccaagg tcatctggtc caacatccgc    1320
ttcggcccca tcggctcgactgt caacgtc taa                       1353
 
<210>10
<211>450
<212>PRT
<213>嗜热毁丝霉
 
<400>10
 
Met Lys Gln Tyr Leu Gln Tyr Leu Ala Ala Thr Leu Pro Leu Val Gly
1               5                   10                  15
Leu Ala Thr Ala Gln Gln Ala Gly Asn Leu Gln Thr Glu Thr His Pro
            20                  25                  30
Arg Leu Thr Trp Ser Lys Cys Thr Ala Pro Gly Ser Cys Gln Gln Val
        35                  40                  45
Asn Gly Glu Val Val Ile Asp Ser Asn Trp Arg Trp Val His Asp Glu
    50                  55                  60
Asn Ala Gln Asn Cys Tyr Asp Gly Asn Gln Trp Thr Asn Ala Cys Ser
65                  70                  75                  80
Ser Ala Thr Asp Cys Ala Glu Asn Cys Ala Leu Glu Gly Ala Asp Tyr
                85                  90                  95
Gln Gly Thr Tyr Gly Ala Ser Thr Ser Gly Asn Ala Leu Thr Leu Thr
            100                 105                 110
Phe Val Thr Lys His Glu Tyr Gly Thr Asn Ile Gly Ser Arg Leu Tyr
        115                 120                 125
Leu Met Asn Gly Ala Asn Lys Tyr Gln Met Phe Thr Leu Lys Gly Asn
    130                 135                 140
Glu Leu Ala Phe Asp Val Asp Leu Ser Ala Val Glu Cys Gly Leu Asn
145                 150                 155                 160
Ser Ala Leu Tyr Phe Val Ala Met Glu Glu Asp Gly Gly Val Ser Ser
                165                 170                 175
Tyr Pro Thr Asn Thr Ala Gly Ala Lys Phe Gly Thr Gly Tyr Cys Asp
            180                 185                 190
Ala Gln Cys Ala Arg Asp Leu Lys Phe Val Gly Gly Lys Gly Asn Ile
        195                 200                 205
Glu Gly Trp Lys Pro Ser Thr Asn Asp Ala Asn Ala Gly Val Gly Pro
    210                 215                 220
Tyr Gly Gly Cys Cys Ala Glu Ile Asp Val Trp Glu Ser Asn Lys Tyr
225                 230                 235                 240
Ala Phe Ala Phe Thr Pro His Gly Cys Glu Asn Pro Lys Tyr His Val
                245                 250                 255
Cys Glu Thr Thr Asn Cys Gly Gly Thr Tyr Ser Glu Asp Arg Phe Ala
            260                 265                 270
Gly Asp Cys Asp Ala Asn Gly Cys Asp Tyr Asn Pro Tyr Arg Met Gly
        275                 280                 285
Asn Gln Asp Phe Tyr Gly Pro Gly Leu Thr Val Asp Thr Ser Lys Lys
    290                 295                 300
Phe Thr Val Val Ser Gln Phe Glu Glu Asn Lys Leu Thr Gln Phe Phe
305                 310                 315                 320
Val Gln Asp Gly Lys Lys Ile Glu Ile Pro Gly Pro Lys Val Glu Gly
                325                 330                 335
Ile Asp Ala Asp Ser Ala Ala Ile Thr Pro Glu Leu Cys Ser Ala Leu
            340                 345                 350
Phe Lys Ala Phe Asp Asp Arg Asp Arg Phe Ser Glu Val Gly Gly Phe
        355                 360                 365
Asp Ala Ile Asn Thr Ala Leu Ser Thr Pro Met Val Leu Val Met Ser
    370                 375                 380
Ile Trp Asp Asp His Tyr Ala Asn Met Leu Trp Leu Asp Ser Ser Tyr
385                 390                 395                 400
Pro Pro Glu Lys Ala Gly Gln Pro Gly Gly Asp Arg Gly Pro Cys Pro
                405                 410                 415
Gln Asp Ser Gly Val Pro Ala Asp Val Glu Ala Gln Tyr Pro Asn Ala
            420                 425                 430
Lys Val Ile Trp Ser Asn Ile Arg Phe Gly Pro Ile Gly Ser Thr Val
        435                 440                 445
Asn Val
    450
 
<210>11
<211>1800
<212>DNA
<213>土生羧孢霉(Thielavia terrestris)
 
<400>11
aattgaagga gggagtggcg gagtggccac caagtcaggc ggctgtcaac taaccaagga    60
tgggaacagt tcggctcgcc ttgcccgagg gcagcgttcc ctgatgggga cgaaccatgg    120
gactggggtc agctgctgta taaaagttca aatcgatgat ctctcagatg gcgctgctgg    180
ggtgttctgc gcttttccat cctcgcaacc tggtatccca ctagtccagc gttcggcacc    240
atgaagtcgt tcaccattgc cgccttggca gccctatggg cccaggaggc cgccgcccac    300
gcgaccttcc aggacctctg gattgatgga gtcgactacg gctcgcaatg tgtccgcctc    360
ccggcgtcca actcccccgt caccaatgtt gcgtccgacg atatccgatg caatgtcggc    420
acctcgaggc ccaccgtcaa gtgcccggtc aaggccggct ccacggtcac gatcgagatg    480
caccaggttc gcacgcctct ctgcgtaggc cccccagcta ctatatggca ctaacacgac    540
ctccagcaac ctggcgaccg gtcttgcgcc aacgaggcta tcggcggcga ccactacggc    600
cccgtaatgg tgtacatgtc caaggtcgat gacgcggtga cagccgacgg ttcatcgggc    660
tggttcaagg tgttccagga cagctgggcc aagaacccgt cgggttcgac gggcgacgac    720
gactactggg gcaccaagga cctcaactcg tgctgcggca agatgaacgt caagatcccc    780
gaagacatcg agccgggcga ctacctgctc cgcgccgagg ttatcgcgct gcacgtggcc    840
gccagctcgg gcggcgcgca gttctacatg tcctgctacc agctgaccgt gacgggctcc    900
ggcagcgcca ccccctcgac cgtgaatttc ccgggcgcct actcggccag cgacccgggc    960
atcctgatca acatccacgc gcccatgtcg acctacgtcg tcccgggccc gaccgtgtac    1020
gcgggcggct cgaccaagtc ggctggcagc tcctgctccg gctgcgaggc gacctgcacg    1080
gttggttccg gccccagcgc gacactgacg cagcccacct ccaccgcgac cgcgacctcc    1140
gcccctggcg gcggcggctc cggctgcacg gcggccaagt accagcagtg cggcggcacc    1200
ggctacactg ggtgcaccac ctgcgctgta agttccctcg tgatatgcag cggaacaccg    1260
tctggactgt tttgctaact cgcgtcgtag tccgggtcta cctgcagcgc cgtctcgcct    1320
ccgtactact cgcagtgcct ctaagccggg agcgcttgct cagcgggctg ctgtgaagga    1380
gctccatgtc cccatgccgc catggccgga gtaccgggct gagcgcccaa ttcttgtata    1440
tagttgagtt ttcccaatca tgaatacata tgcatctgca tggactgttg cgtcgtcagt    1500
ctacatcctt tgctccactg aactgtgaga ccccatgtca tccggaccat tcgatcggtg    1560
ctcgctctac catctcggtt gatgggtctg ggcttgagag tcactggcac gtcctcggcg    1620
gtaatgaaat gtggaggaaa gtgtgagctg tctgacgcac tcggcgctga tgagacgttg    1680
agcgcggccc acactggtgt tctgtaagcc agcacacaaa agaatactcc aggatggccc    1740
atagcggcaa atatacagta tcagggatgc aaaaagtgca aaagtaaggg gctcaatcgg    1800
 
<210>12
<211>326
<212>PRT
<213>土生羧孢霉
 
<400>12
 
Met Lys Ser Phe Thr Ile Ala Ala Leu Ala Ala Leu Trp Ala Gln Glu
1               5                   10                  15
Ala Ala Ala His Ala Thr Phe Gln Asp Leu Trp Ile Asp Gly Val Asp
            20                  25                  30
Tyr Gly Ser Gln Cys Val Arg Leu Pro Ala Ser Asn Ser Pro Val Thr
        35                  40                  45
Asn Val Ala Ser Asp Asp Ile Arg Cys Asn Val Gly Thr Ser Arg Pro
    50                  55                  60
Thr Val Lys Cys Pro Val Lys Ala Gly Ser Thr Val Thr Ile Glu Met
65                  70                  75                  80
His Gln Gln Pro Gly Asp Arg Ser Cys Ala Asn Glu Ala Ile Gly Gly
                85                  90                  95
Asp His Tyr Gly Pro Val Met Val Tyr Met Ser Lys Val Asp Asp Ala
            100                 105                 110
Val Thr Ala Asp Gly Ser Ser Gly Trp Phe Lys Val Phe Gln Asp Ser
        115                 120                 125
Trp Ala Lys Asn Pro Ser Gly Ser Thr Gly Asp Asp Asp Tyr Trp Gly
    130                 135                 140
Thr Lys Asp Leu Asn Ser Cys Cys Gly Lys Met Asn Val Lys Ile Pro
145                 150                 155                 160
Glu Asp Ile Glu Pro Gly Asp Tyr Leu Leu Arg Ala Glu Val Ile Ala
                165                 170                 175
Leu His Val Ala Ala Ser Ser Gly Gly Ala Gln Phe Tyr Met Ser Cys
            180                 185                 190
Tyr Gln Leu Thr Val Thr Gly Ser Gly Ser Ala Thr Pro Ser Thr Val
        195                 200                 205
Asn Phc Pro Gly Ala Tyr Ser Ala Ser Asp Pro Gly Ile Leu Ile Asn
    210                 215                 220
Ile His Ala Pro Met Ser Thr Tyr Val Val Pro Gly Pro Thr Val Tyr
225                 230                 235                 240
Ala Gly Gly Ser Thr Lys Ser Ala Gly Ser Ser Cys Ser Gly Cys Glu
                245                 250                 255
Ala Thr Cys Thr Val Gly Ser Gly Pro Ser Ala Thr Leu Thr Gln Pro
            260                 265                 270
Thr Ser Thr Ala Thr Ala Thr Ser Ala Pro Gly Gly Gly Gly Ser Gly
        275                 280                 285
Cys Thr Ala Ala Lys Tyr Gln Gln Cys Gly Gly Thr Gly Tyr Thr Gly
    290                 295                 300
Cys Thr Thr Cys Ala Ser Gly Ser Thr Cys Ser Ala Val Ser Pro Pro
305                 310                 315                 320
Tyr Tyr Ser Gln Cys Leu
                325
 
<210>13
<211>880
<212>DNA
<213>土生羧孢霉
 
<400>13
accccgggat cactgcccct aggaaccagc acacctcggt ccaatcatgc ggttcgacgc    60
cctctccgcc ctcgctcttg cgccgcttgt ggctggccac ggcgccgtga ccagctacat    120
catcggcggc aaaacctatc ccggctacga gggcttctcg cctgcctcga gcccgccgac    180
gatccagtac cagtggcccg actacaaccc gaccctgagc gtgaccgacc cgaagatgcg    240
ctgcaacggc ggcacctcgg cagagctcag cgcgcccgtc caggccggcg agaacgtgac    300
ggccgtctgg aagcagtgga cccaccagca aggccccgtc atggtctgga tgttcaagtg    360
ccccggcgac ttctcgtcgt gccacggcga cggcaagggc tggttcaaga tcgaccagct    420
gggcctgtgg ggcaacaacc tcaactcgaa caactggggc accgcgatcg tctacaagac    480
cctccagtgg agcaacccga tccccaagaa cctcgcgccg ggcaactacc tcatccgcca    540
cgagctgctc gccctgcacc aggccaacac gccgcagttc tacgccgagt gcgcccagct    600
ggtcgtctcc ggcagcggct ccgccctgcc cccgtccgac tacctctaca gcatccccgt    660
ctacgcgccc cagaacgacc ccggcatcac cgtgagtggg cttccgttcc gcggcgagct    720
ctgtggaaat cttgctgacg atgggctagg ttgacatcta caacggcggg cttacctcct    780
acaccccgcc cggcggcccc gtctggtctg gcttcgagtt ttaggcgcat tgagtcgggg    840
gctacgaggg gaaggcatct gttcgcatga gcgtgggtac                          880
 
<210>14
<211>478
<212>PRT
<213>土生羧孢霉
 
<400>14
 
Met Arg Phe Asp Ala Leu Ser Ala Leu Ala Leu Ala Pro Leu Val Ala
1               5                   10                  15
Gly His Gly Ala Val Thr Ser Tyr Ile Ile Gly Gly Lys Thr Tyr Pro
            20                  25                  30
Gly Tyr Glu Gly Phe Ser Pro Ala Ser Ser Pro Pro Thr Ile Gln Tyr
        35                  40                  45
Gln Trp Pro Asp Tyr Asn Pro Thr Leu Ser Val Thr Asp Pro Lys Met
    50                  55                  60
Arg Cys Asn Gly Gly Thr Ser Ala Glu Leu Ser Ala Pro Val Gln Ala
65                  70                  75                  80
Gly Glu Asn Val Thr Ala Val Trp Lys Gln Trp Thr His Gln Gln Gly
                85                  90                  95
Pro Val Met Val Trp Met Phe Lys Cys Pro Gly Asp Phe Ser Ser Ser
            100                 105                 110
His Gly Asp Gly Lys Gly Trp Phe Lys Ile Asp Gln Leu Gly Leu Trp
        115                 120                 125
Gly Asn Asn Leu Asn Ser Asn Asn Trp Gly Thr Ala Ile Val Tyr Lys
    130                 135                 140
Thr Leu Gln Trp Ser Asn Pro Ile Pro Lys Asn Leu Ala Pro Gly Asn
145                 150                 155                 160
Tyr Leu Ile Arg His Glu Leu Leu Ala Leu His Gln Ala Asn Thr Pro
                165                 170                 175
Gln Phe Tyr Ala Glu Cys Ala Gln Leu Val Val Ser Gly Ser Gly Ser
            180                 185                 190
Ala Leu Pro Pro Ser Asp Tyr Leu Tyr Ser Ile Pro Val Tyr Ala Pro
        195                 200                 205
Gln Asn Asp Pro Gly Ile Thr Val Asp Ile Tyr Asn Gly Gly Leu Thr
    210                 215                 220
Ser Tyr Thr Pro Pro Gly Gly Pro Val Trp Ser Gly Phe Glu Phe Met
225                 230                 235                 240
Arg Phe Asp Ala Leu Ser Ala Leu Ala Leu Ala Pro Leu Val Ala Gly
                245                 250                 255
His Gly Ala Val Thr Ser Tyr Ile Ile Gly Gly Lys Thr Tyr Pro Gly
            260                 265                 270
Tyr Glu Gly Phe Ser Pro Ala Ser Ser Pro Pro Thr Ile Gln Tyr Gln
        275                 280                 285
Trp Pro Asp Tyr Asn Pro Thr Leu Ser Val Thr Asp Pro Lys Met Arg
    290                 295                 300
Cys Asn Gly Gly Thr Ser Ala Glu Leu Ser Ala Pro Val Gln Ala Gly
305                 310                 315                 320
Glu Asn Val Thr Ala Val Trp Lys Gln Trp Thr His Gln Gln Gly Pro
                325                 330                 335
Val Met Val Trp Met Phe Lys Cys Pro Gly Asp Phe Ser Ser Ser His
            340                 345                 350
Gly Asp Gly Lys Gly Trp Phe Lys Ile Asp Gln Leu Gly Leu Trp Gly
        355                 360                 365
Asn Asn Leu Asn Ser Asn Asn Trp Gly Thr Ala Ile Val Tyr Lys Thr
    370                 375                 380
Leu Gln Trp Ser Asn Pro Ile Pro Lys Asn Leu Ala Pro Gly Asn Tyr
385                 390                 395                 400
Leu Ile Arg His Glu Leu Leu Ala Leu His Gln Ala Asn Thr Pro Gln
                405                 410                 415
Phe Tyr Ala Glu Cys Ala Gln Leu Val Val Ser Gly Ser Gly Ser Ala
            420                 425                 430
Leu Pro Pro Ser Asp Tyr Leu Tyr Ser Ile Pro Val Tyr Ala Pro Gln
        435                 440                 445
Asn Asp Pro Gly Ile Thr Val Asp Ile Tyr Asn Gly Gly Leu Thr Ser
    450                 455                 460
Tyr Thr Pro Pro Gly Gly Pro Val Trp Ser Gly Phe Glu Phe
465                 470                 475
 
<210>15
<211>1000
<212>DNA
<213>土生羧孢霉
 
<400>15
ctcctgttcc tgggccaccg cttgttgcct gcactattgg tagagttggt ctattgctag    60
agttggccat gcttctcaca tcagtcctcg gctcggctgc cctgcttgct agcggcgctg    120
cggcacacgg cgccgtgacc agctacatca tcgccggcaa gaattacccg gggtgggtag    180
ctgattattg agggcgcatt caaggttcat accggtgtgc atggctgaca accggctggc    240
agataccaag gcttttctcc tgcgaactcg ccgaacgtca tccaatggca atggcatgac    300
tacaaccccg tcttgtcgtg cagcgactcg aagcttcgct gcaacggcgg cacgtcggcc    360
accctgaacg ccacggccgc accgggcgac accatcaccg ccatctgggc gcagtggacg    420
cacagccagg gccccatcct ggtgtggatg tacaagtgcc cgggctcctt cagctcctgt    480
gacggctccg gcgctggctg gttcaagatc gacgaggccg gcttccacgg cgacggcgtc    540
aaggtcttcc tcgacaccga gaacccgtcc ggctgggaca tcgccaagct cgtcggcggc    600
aacaagcagt ggagcagcaa ggtccccgag ggcctcgccc ccggcaacta cctcgtccgc    660
cacgagttga tcgccctgca ccaggccaac aacccgcagt tctacccgga gtgcgcccag    720
gtcgtcatca ccggctccgg caccgcgcag ccggatgcct catacaaggc ggctatcccc    780
ggctactgca accagaatga cccgaacatc aaggtgagat ccaggcgtaa tgcagtctac    840
tgctggaaag aaagtggtcc aagctaaacc gcgctccagg tgcccatcaa cgaccactcc    900
atccctcaga cctacaagat tcccggccct cccgtcttca agggcaccgc cagcaagaag    960
gcccgggact tcaccgcctg aagttgttga atcgatggag                          1000
 
<210>16
<211>516
<212>PRT
<213>土生羧孢霉
 
<400>16
 
Met Leu Leu Thr Ser Val Leu Gly Ser Ala Ala Leu Leu Ala Ser Gly
1               5                   10                  15
Ala Ala Ala His Gly Ala Val Thr Ser Tyr Ile Ile Ala Gly Lys Asn
            20                  25                  30
Tyr Pro Gly Tyr Gln Gly Phe Ser Pro Ala Asn Ser Pro Asn Val Ile
        35                  40                  45
Gln Trp Gln Trp His Asp Tyr Asn Pro Val Leu Ser Cys Ser Asp Ser
    50                  55                  60
Lys Leu Arg Cys Asn Gly Gly Thr Ser Ala Thr Leu Asn Ala Thr Ala
65                  70                  75                  80
Ala Pro Gly Asp Thr Ile Thr Ala Ile Trp Ala Gln Trp Thr His Ser
                85                  90                  95
Gln Gly Pro Ile Leu Val Trp Met Tyr Lys Cys Pro Gly Ser Phe Ser
            100                 105                 110
Ser Cys Asp Gly Ser Gly Ala Gly Trp Phe Lys Ile Asp Glu Ala Gly
        115                 120                 125
Phe His Gly Asp Gly Val Lys Val Phe Leu Asp Thr Glu Asn Pro Ser
    130                 135                 140
Gly Trp Asp Ile Ala Lys Leu Val Gly Gly Asn Lys Gln Trp Ser Ser
145                 150                 155                 160
Lys Val Pro Glu Gly Leu Ala Pro Gly Asn Tyr Leu Val Arg His Glu
                165                 170                 175
Leu Ile Ala Leu His Gln Ala Asn Asn Pro Gln Phe Tyr Pro Glu Cys
            180                 185                 190
Ala Gln Val Val Ile Thr Gly Ser Gly Thr Ala Gln Pro Asp Ala Ser
        195                 200                 205
Tyr Lys Ala Ala Ile Pro Gly Tyr Cys Asn Gln Asn Asp Pro Asn Ile
    210                 215                 220
Lys Val Pro Ile Asn Asp His Ser Ile Pro Gln Thr Tyr Lys Ile Pro
225                 230                 235                 240
Gly Pro Pro Val Phe Lys Gly Thr Ala Ser Lys Lys Ala Arg Asp Phe
                245                 250                 255
Thr Ala Met Leu Leu Thr Ser Val Leu Gly Ser Ala Ala Leu Leu Ala
            260                 265                 270
Ser Gly Ala Ala Ala His Gly Ala Val Thr Ser Tyr Ile Ile Ala Gly
        275                 280                 285
Lys Asn Tyr Pro Gly Tyr Gln Gly Phe Ser Pro Ala Asn Ser Pro Asn
    290                 295                 300
Val Ile Gln Trp Gln Trp His Asp Tyr Asn Pro Val Leu Ser Cys Ser
305                 310                 315                 320
Asp Ser Lys Leu Arg Cys Asn Gly Gly Thr Ser Ala Thr Leu Asn Ala
                325                 330                 335
Thr Ala Ala Pro Gly Asp Thr Ile Thr Ala Ile Trp Ala Gln Trp Thr
            340                 345                 350
His Ser Gln Gly Pro Ile Leu Val Trp Met Tyr Lys Cys Pro Gly Ser
        355                 360                 365
Phe Ser Ser Cys Asp Gly Ser Gly Ala Gly Trp Phe Lys Ile Asp Glu
    370                 375                 380
Ala Gly Phe His Gly Asp Gly Val Lys Val Phe Leu Asp Thr Glu Asn
385                 390                 395                 400
Pro Ser Gly Trp Asp Ile Ala Lys Leu Val Gly Gly Asn Lys Gln Trp
                405                 410                 415
Ser Ser Lys Val Pro Glu Gly Leu Ala Pro Gly Asn Tyr Leu Val Arg
            420                 425                 430
His Glu Leu Ile Ala Leu His Gln Ala Asn Asn Pro Gln Phe Tyr Pro
        435                 440                 445
Glu Cys Ala Gln Val Val Ile Thr Gly Ser Gly Thr Ala Gln Pro Asp
    450                 455                 460
Ala Ser Tyr Lys Ala Ala Ile Pro Gly Tyr Cys Asn Gln Asn Asp Pro
465                 470                 475                 480
Asn Ile Lys Val Pro Ile Asn Asp His Ser Ile Pro Gln Thr Tyr Lys
                485                 490                 495
Ile Pro Gly Pro Pro Val Phe Lys Gly Thr Ala Ser Lys Lys Ala Arg
            500                 505                 510
Asp Phe Thr Ala
        515
 
<210>17
<211>681
<212>DNA
<213>土生羧孢霉
 
<400>17
atgctcgcaa acggtgccat cgtcttcctg gccgccgccc tcggcgtcag tggccactac    60
acctggccac gggttaacga cggcgccgac tggcaacagg tccgtaaggc ggacaactgg    120
caggacaacg gctacgtcgg ggatgtcacg tcgccacaga tccgctgttt ccaggcgacc    180
ccgtccccgg ccccatccgt cctcaacacc acggccggct cgaccgtgac ctactgggcc    240
aaccccgacg tctaccaccc cgggcctgtg cagttttaca tggcccgcgt gcccgatggc    300
gaggacatca actcgtggaa cggcgacggc gccgtgtggt tcaaggtgta cgaggaccat    360
cctacctttg gcgctcagct cacatggccc agcacgggca agagctcgtt cgcggttccc    420
atccccccgt gcatcaagtc cggctactac ctcctccggg cggagcaaat cggcctgcac    480
gtcgcccaga gcgtaggcgg agcgcagttc tacatctcat gcgcccagct cagcgtcacc    540
ggcggcggca gcaccgagcc gccgaacaag gtggccttcc ccggcgctta cagtgcgacg    600
gacccgggca ttctgatcaa catctactac cctgttccca cgtcctacca gaaccccggc    660
ccggccgtct tcagctgctg a                                      681
 
<210>18
<211>452
<212>PRT
<213>土生羧孢霉
 
<400>18
 
Met Leu Ala Asn Gly Ala Ile Val Phe Leu Ala Ala Ala Leu Gly Val
1               5                   10                  15
Ser Gly His Tyr Thr Trp Pro Arg Val Asn Asp Gly Ala Asp Trp Gln
            20                  25                  30
Gln Val Arg Lys Ala Asp Asn Trp Gln Asp Asn Gly Tyr Val Gly Asp
        35                  40                  45
Val Thr Ser Pro Gln Ile Arg Cys Phe Gln Ala Thr Pro Ser Pro Ala
    50                  55                  60
Pro Ser Val Leu Asn Thr Thr Ala Gly Ser Thr Val Thr Tyr Trp Ala
65                  70                  75                  80
Asn Pro Asp Val Tyr His Pro Gly Pro Val Gln Phe Tyr Met Ala Arg
                85                  90                  95
Val Pro Asp Gly Glu Asp Ile Asn Ser Trp Asn Gly Asp Gly Ala Val
            100                 105                 110
Trp Phe Lys Val Tyr Glu Asp His Pro Thr Phe Gly Ala Gln Leu Thr
        115                 120                 125
Trp Pro Ser Thr Gly Lys Ser Ser Phe Ala Val Pro Ile Pro Pro Cys
    130                 135                 140
Ile Lys Ser Gly Tyr Tyr Leu Leu Arg Ala Glu Gln Ile Gly Leu His
145                 150                 155                 160
Val Ala Gln Ser Val Gly Gly Ala Gln Phe Tyr Ile Ser Cys Ala Gln
                165                 170                 175
Leu Ser Val Thr Gly Gly Gly Ser Thr Glu Pro Pro Asn Lys Val Ala
            180                 185                 190
Phe Pro Gly Ala Tyr Ser Ala Thr Asp Pro Gly Ile Leu Ile Asn Ile
        195                 200                 205
Tyr Tyr Pro Val Pro Thr Ser Tyr Gln Asn Pro Gly Pro Ala Val Phe
    210                 215                 220
Ser Cys Met Leu Ala Asn Gly Ala Ile Val Phe Leu Ala Ala Ala Leu
225                 230                 235                 240
Gly Val Ser Gly His Tyr Thr Trp Pro Arg Val Asn Asp Gly Ala Asp
                245                 250                 255
Trp Gln Gln Val Arg Lys Ala Asp Asn Trp Gln Asp Asn Gly Tyr Val
            260                 265                 270
Gly Asp Val Thr Ser Pro Gln Ile Arg Cys Phe Gln Ala Thr Pro Ser
        275                 280                 285
Pro Ala Pro Ser Val Leu Asn Thr Thr Ala Gly Ser Thr Val Thr Tyr
    290                 295                 300
Trp Ala Asn Pro Asp Val Tyr His Pro Gly Pro Val Gln Phe Tyr Met
305                 310                 315                 320
Ala Arg Val Pro Asp Gly Glu Asp Ile Asn Ser Trp Asn Gly Asp Gly
                325                 330                 335
Ala Val Trp Phe Lys ValTyr Glu Asp Hi s Pro Thr Phe Gly Ala Gln
            340                 345                 350
Leu Thr Trp Pro SerThr Gl y Lys Ser Ser Phe Ala Val Pro Ile Pro
        355                 360                 365
Pro Cys Ile Lys Ser Gly Tyr Tyr Leu Leu Arg Ala Glu Gln Ile Gly
    370                 375                 380
Leu His Val Ala Gln Ser Val Gly Gly Ala Gln Phe Tyr Ile Ser Cys
385                 390                 395                 400
Ala Gln Leu Ser Val Thr Gly Gly Gly Ser Thr Glu Pro Pro Asn Lys
                405                 410                 415
Val Ala Phe Pro Gly Ala Tyr Ser Ala Thr Asp Pro Gly Ile Leu Ile
            420                 425                 430
Asn Ile Tyr Tyr Pro Val Pro Thr Ser Tyr Gln Asn Pro Gly Pro Ala
        435                 440                 445
Val Phe Ser Cys
    450
 
<210>19
<211>960
<212>DNA
<213>土生羧孢霉
 
<400>19
atgaagggac ttttcagtgc cgccgccctc tccctggccg tcggccaggc ttcggcccat    60
tacatcttcc agcaactctc catcaacggg aaccagtttc cggtgtacca atatattcgc    120
aagaacacca attataacag tcccgttacc gatctcacgt ccgacgatct tcggtgcaat    180
gtcggcgccc agggtgctgg gacagacacc gtcacggtga aggccggcga ccagttcacc    240
ttcacccttg acacccctgt ttaccaccag gggcccatct ccatctacat gtccaaggcc    300
ccgggcgcgg cgtcagacta cgatggcagc ggcggctggt tcaagatcaa ggactggggc    360
ccgactttca acgccgacgg cacggccacc tgggacatgg ccggctcata cacctacaac    420
atcccgacct gcattcccga cggcgactat ctgctccgca tccagtcgct ggccatccac    480
aacccctggc cggcgggcat cccgcagttc tacatctcct gcgcccagat caccgtgacc    540
ggcggcggca acggcaaccc tggcccgacg gccctcatcc ccggcgcctt caaggacacc    600
gacccgggct acacggtgaa catctacacg aacttccaca actacacggt tcccggcccg    660
gaggtcttca gctgcaacgg cggcggctcg aacccgcccc cgccggtgag tagcagcacg    720
cccgcgacca cgacgctggt cacgtcgacg cgcaccacgt cctccacgtc ctccgcctcg    780
acgccggcct cgaccggcgg ctgcaccgtc gccaagtggg gccagtgcgg cggcaacggg    840
tacaccggct gcacgacctg cgcggccggg tccacctgca gcaagcagaa cgactactac    900
tcgcagtgct tgtaagggag gccgcaaagc atgaggtgtt tgaagaggag gagaggggtc    960
 
<210>20
<211>608
<212>PRT
<213>土生羧孢霉
 
<400>20
 
Met Lys Gly Leu Phe Ser Ala Ala Ala Leu Ser Leu Ala Val Gly Gln
1               5                   10                  15
Ala Ser Ala His Tyr Ile Phe Gln Gln Leu Ser Ile Asn Gly Asn Gln
            20                  25                  30
Phe Pro Val Tyr Gln Tyr Ile Arg Lys Asn Thr Asn Tyr Asn Ser Pro
        35                  40                  45
Val Thr Asp Leu Thr Ser Asp Asp Leu Arg Cys Asn Val Gly Ala Gln
    50                  55                  60
Gly Ala Gly Thr Asp Thr Val Thr Val Lys Ala Gly Asp Gln Phe Thr
65                  70                  75                  80
Phe Thr Leu Asp Thr Pro Val Tyr His Gln Gly Pro Ile Ser Ile Tyr
                85                  90                  95
Met Ser Lys Ala Pro Gly Ala Ala Ser Asp Tyr Asp Gly Ser Gly Gly
            100                 105                 110
Trp Phe Lys Ile Lys Asp Trp Gly Pro Thr Phe Asn Ala Asp Gly Thr
        115                 120                 125
Ala Thr Trp Asp Met Ala Gly Ser Tyr Thr Tyr Asn Ile Pro Thr Cys
    130                 135                 140
Ile Pro Asp Gly Asp Tyr Leu Leu Arg Ile Gln Ser Leu Ala Ile His
145                 150                 155                 160
Asn Pro Trp Pro Ala Gly Ile Pro Gln Phe Tyr Ile Ser Cys Ala Gln
                165                 170                 175
Ile Thr Val Thr Gly Gly Gly Asn Gly Asn Pro Gly Pro Thr Ala Leu
            180                 185                 190
Ile Pro Gly Ala Phe Lys Asp Thr Asp Pro Gly Tyr Thr Val Asn Ile
        195                 200                 205
Tyr Thr Asn Phe His Asn Tyr Thr Val Pro Gly Pro Glu Val Phe Ser
    210                 215                 220
Cys Asn Gly Gly Gly Ser Asn Pro Pro Pro Pro Val Ser Ser Ser Thr
225                 230                 235                 240
Pro Ala Thr Thr Thr Leu Val Thr Ser Thr Arg Thr Thr Ser Ser Thr
                245                 250                 255
Ser Ser Ala Ser Thr Pro Ala Ser Thr Gly Gly Cys Thr Val Ala Lys
            260                 265                 270
Trp Gly Gln Cys Gly Gly Asn Gly Tyr Thr Gly Cys Thr Thr Cys Ala
        275                 280                 285
Ala Gly Ser Thr Cys Ser Lys Gln Asn Asp Tyr Tyr Ser Gln Cys Leu
    290                 295                 300
Met Lys Gly Leu Phe Ser Ala Ala Ala Leu Ser Leu Ala Val Gly Gln
305                 310                 315                 320
Ala Ser Ala His Tyr Ile Phe Gln Gln Leu Ser Ile Asn Gly Asn Gln
                325                 330                 335
Phe Pro Val Tyr Gln Tyr Ile Arg Lys Asn Thr Asn Tyr Asn Ser Pro
            340                 345                 350
Val Thr Asp Leu Thr Ser Asp Asp Leu Arg Cys Asn Val Gly Ala Gln
        355                 360                 365
Gly Ala Gly Thr Asp Thr Val Thr Val Lys Ala Gly Asp Gln Phe Thr
    370                 375                 380
Phe Thr Leu Asp Thr Pro Val Tyr His Gln Gly Pro Ile Ser Ile Tyr
385                 390                 395                 400
Met Ser Lys Ala Pro Gly Ala Ala Ser Asp Tyr Asp Gly Ser Gly Gly
                405                 410                 415
Trp Phe Lys Ile Lys Asp Trp Gly Pro Thr Phe Asn Ala Asp Gly Thr
            420                 425                 430
Ala Thr Trp Asp Met Ala Gly Ser Tyr Thr Tyr Asn Ile Pro Thr Cys
        435                 440                 445
Ile Pro Asp Gly Asp Tyr Leu Leu Arg Ile Gln Ser Leu Ala Ile His
    450                 455                 460
Asn Pro Trp Pro Ala Gly Ile Pro Gln Phe Tyr Ile Ser Cys Ala Gln
465                 470                 475                 480
Ile Thr Val Thr Gly Gly Gly Asn Gly Asn Pro Gly Pro Thr Ala Leu
                485                 490                 495
Ile Pro Gly Ala Phe Lys Asp Thr Asp Pro Gly Tyr Thr Val Asn Ile
            500                 505                 510
Tyr Thr Asn Phe His Asn Tyr Thr Val Pro Gly Pro Glu Val Phe Ser
        515                 520                 525
Cys Asn Gly Gly Gly Ser Asn Pro Pro Pro Pro Val Ser Ser Ser Thr
    530                 535                 540
Pro Ala Thr Thr Thr Leu Val Thr Ser Thr Arg Thr Thr Ser Ser Thr
545                 550                 555                 560
Ser Ser Ala Ser Thr Pro Ala Ser Thr Gly Gly Cys Thr Val Ala Lys
                565                 570                 575
Trp Gly Gln Cys Gly Gly Asn Gly Tyr Thr Gly Cys Thr Thr Cys Ala
            580                 585                 590
Ala Gly Ser Thr Cys Ser Lys Gln Asn Asp Tyr Tyr Ser Gln Cys Leu
        595                 600                 605
 
<210>21
<211>799
<212>DNA
<213>橙色嗜热子囊菌(Thermoascus aurantiacus)
 
<400>21
atgtcctttt ccaagataat tgctactgcc ggcgttcttg cctctgcttc tctagtggct    60
ggccatggct tcgttcagaa catcgtgatt gatggtaaaa agtatgtcat tgcaagacgc    120
acataagcgg caacagctga caatcgacag ttatggcggg tatctagtga accagtatcc    180
atacatgtcc aatcctccag aggtcatcgc ctggtctact acggcaactg atcttggatt    240
tgtggacggt actggatacc aaaccccaga tatcatctgc cataggggcg ccaagcctgg    300
agccctgact gctccagtct ctccaggagg aactgttgag cttcaatgga ctccatggcc    360
tgattctcac catggcccag ttatcaacta ccttgctccg tgcaatggtg attgttccac    420
tgtggataag acccaattag aattcttcaa aattgccgag agcggtctca tcaatgatga    480
caatcctcct gggatctggg cttcagacaa tctgatagca gccaacaaca gctggactgt    540
caccattcca accacaattg cacctggaaa ctatgttctg aggcatgaga ttattgctct    600
tcactcagct cagaaccagg atggtgccca gaactatccc cagtgcatca atctgcaggt    660
cactggaggt ggttctgata accctgctgg aactcttgga acggcactct accacgatac    720
cgatcctgga attctgatca acatctatca gaaactttcc agctatatca tccctggtcc    780
tcctctgtat actggtt aa                                                799
 
<210>22
<211>250
<212>PRT
<213>橙色嗜热子囊菌
 
<400>22
Met Ser Phe Ser Lys Ile Ile Ala Thr Ala Gly Val Leu Ala Ser Ala
1               5                   10                  15
Ser Leu Val Ala Gly His Gly Phe Val Gln Asn Ile Val Ile Asp Gly
            20                  25                  30
Lys Lys Tyr Tyr Gly Gly Tyr Leu Val Asn Gln Tyr Pro Tyr Met Ser
        35                  40                  45
Asn Pro Pro Glu Val Ile Ala Trp Ser Thr Thr Ala Thr Asp Leu Gly
    50                  55                  60
Phe Val Asp Gly Thr Gly Tyr Gln Thr Pro Asp Ile Ile Cys His Arg
65                  70                  75                  80
Gly Ala Lys Pro Gly Ala Leu Thr Ala Pro Val Ser Pro Gly Gly Thr
                85                  90                  95
Val Glu Leu Gln Trp Thr Pro Trp Pro Asp Ser His His Gly Pro Val
            100                 105                 110
Ile Asn Tyr Leu Ala Pro Cys Asn Gly Asp Cys Ser Thr Val Asp Lys
        115                 120                 125
Thr Gln Leu Glu Phe Phe Lys Ile Ala Glu Ser Gly Leu Ile Asn Asp
    130                 135                 140
Asp Asn Pro Pro Gly Ile Trp Ala Ser Asp Asn Leu Ile Ala Ala Asn
145                 150                 155                 160
Asn Ser Trp Thr Val Thr Ile Pro Thr Thr Ile Ala Pro Gly Asn Tyr
                165                 170                 175
Val Leu Arg His Glu Ile Ile Ala Leu His Ser Ala Gln Asn Gln Asp
            180                 185                 190
Gly Ala Gln Asn Tyr Pro Gln Cys Ile Asn Leu Gln Val Thr Gly Gly
        195                 200                 205
Gly Ser Asp Asn Pro Ala Gly Thr Leu Gly Thr Ala Leu Tyr His Asp
    210                 215                 220
Thr Asp Pro Gly Ile Leu Ile Asn Ile Tyr Gln Lys Leu Ser Ser Tyr
225                 230                 235                 240
Ile Ile Pro Gly Pro Pro Leu Tyr Thr Gly
                245                 250
 
<210>23
<211>1172
<212>DNA
<213>里氏木霉(Trichoderma reesei)
 
<400>23
ggatctaagc cccatcgata tgaagtcctg cgccattctt gcagcccttg gctgtcttgc    60
cgggagcgtt ctcggccatg gacaagtcca aaacttcacg atcaatggac aatacaatca    120
gggtttcatt ctcgattact actatcagaa gcagaatact ggtcacttcc ccaacgttgc    180
tggctggtac gccgaggacc tagacctggg cttcatctcc cctgaccaat acaccacgcc    240
cgacattgtc tgtcacaaga acgcggcccc aggtgccatt tctgccactg cagcggccgg    300
cagcaacatc gtcttccaat ggggccctgg cgtctggcct cacccctacg gtcccatcgt    360
tacctacgtg gctgagtgca gcggatcgtg cacgaccgtg aacaagaaca acctgcgctg    420
ggtcaagatt caggaggccg gcatcaacta taacacccaa gtctgggcgc agcaggatct    480
gatcaaccag ggcaacaagt ggactgtgaa gatcccgtcg agcctcaggc ccggaaacta    540
tgtcttccgc catgaacttc ttgctgccca tggtgcctct agtgcgaacg gcatgcagaa    600
ctatcctcag tgcgtgaaca tcgccgtcac aggctcgggc acgaaagcgc tccctgccgg    660
aactcctgca actcagctct acaagcccac tgaccctggc atcttgttca acccttacac    720
aacaatcacg agctacacca tccctggccc agccctgtgg caaggctaga tccaggggta    780
cggtgttggc gttcgtgaag tcggagctgt tgacaaggat atctgatgat gaacggagag    840
gactgatggg cgtgactgag tgtatatatt tttgatgacc aaattgtata cgaaatccga    900
acgcatggtg atcattgttt atccctgtag tatattgtct ccaggctgct aagagcccac    960
cgggtgtatt acggcaacaa agtcaggaat ttgggtggca atgaacgcag gtctccatga    1020
atgtatatgt gaagaggcat cggctggcat gggcattacc agatataggc cctgtgaaac    1080
atatagtact tgaacgtgct actggaacgg atcataagca agtcatcaac atgtgaaaaa    1140
acactacatg taaaaaaaaa aaaaaaaaaa aa                                  1172
 
<210>24
<211>249
<212>PRT
<213>里氏木霉
 
<400>24
 
Met Lys Ser Cys Ala Ile Leu Ala Ala Leu Gly Cys Leu Ala Gly Ser
1               5                   10                  15
Val Leu Gly His Gly Gln Val Gln Asn Phe Thr Ile Asn Gly Gln Tyr
            20                  25                  30
Asn Gln Gly Phe Ile Leu Asp Tyr Tyr Tyr Gln Lys Gln Asn Thr Gly
        35                  40                  45
His Phe Pro Asn Val Ala Gly Trp Tyr Ala Glu Asp Leu Asp Leu Gly
    50                  55                  60
Phe Ile Ser Pro Asp Gln Tyr Thr Thr Pro Asp Ile Val Cys His Lys
65                  70                  75                  80
Asn Ala Ala Pro Gly Ala Ile Ser Ala Thr Ala Ala Ala Gly Ser Asn
                85                  90                  95
Ile Val Phe Gln Trp Gly Pro Gly Val Trp Pro His Pro Tyr Gly Pro
            100                 105                 110
Ile Val Thr Tyr Val Val Glu Cys Ser Gly Ser Cys Thr Thr Val Asn
        115                 120                 125
Lys Asn Asn Leu Arg Trp Val Lys Ile Gln Glu Ala Gly Ile Asn Tyr
    130                 135                 140
Asn Thr Gln Val Trp Ala Gln Gln Asp Leu Ile Asn Gln Gly Asn Lys
145                 150                 155                 160
Trp Thr Val Lys Ile Pro Ser Ser Leu Arg Pro Gly Asn Tyr Val Phe
                165                 170                 175
Arg His Glu Leu Leu Ala Ala His Gly Ala Ser Ser Ala Asn Gly Met
            180                 185                 190
Gln Asn Tyr Pro Gln Cys Val Asn Ile Ala Val Thr Gly Ser Gly Thr
        195                 200                 205
Lys Ala Leu Pro Ala Gly Thr Pro Ala Thr Gln Leu Tyr Lys Pro Thr
    210                 215                 220
Asp Pro Gly Ile Leu Phe Asn Pro Tyr Thr Thr Ile Thr Ser Tyr Thr
225                 230                 235                 240
Ile Pro Gly Pro Ala Leu Trp Gln Gly
                245
 
<210>25
<211>2771
<212>DNA
<213>米曲霉(Aspergillus oryzae)
 
<400>25
ctgttctgct ggttacctgc cacgttatca tgaagcttgg ttggatcgag gtggccgcat       60
tggcggctgc ctcagtagtc agtgccaagg atgatctcgc gtactcccct cctttctacc       120
cttccccatg ggcagatggt cagggtgaat gggcggaagt atacaaacgc gctgtagaca       180
tagtttccca gatgacgttg acagagaaag tcaacttaac gactggaaca ggatggcaac       240
tagagaggtg tgttggacaa actggcagtg ttcccagact caacatcccc agcttgtgtt       300
tgcaggatag tcctcttggt attcgtttct cggactacaa ttcagctttc cctgcgggtg       360
ttaatgtcgc tgccacctgg gacaagacgc tcgcctacct tcgtggtcag gcaatgggtg       420
aggagttcag tgataagggt attgacgttc agctgggtcc tgctgctggc cctctcggtg       480
ctcatccgga tggcggtaga aactgggaag gtttctcacc agatccagcc ctcaccggtg       540
tactttttgc ggagacgatt aagggtattc aagatgctgg tgtcattgcg acagctaagc       600
attatatcat gaacgaacaa gagcatttcc gccaacaacc cgaggctgcg ggttacggat       660
tcaacgtaag cgacagtttg agttccaacg ttgatgacaa gactatgcat gaattgtacc       720
tctggccctt cgcggatgca gtacgcgctg gagtcggtgc tgtcatgtgc tcttacaacc       780
aaatcaacaa cagctacggt tgcgagaata gcgaaactct gaacaagctt ttgaaggcgg       840
agcttggttt ccaaggcttc gtcatgagtg attggaccgc tcatcacagc ggcgtaggcg       900
ctgctttagc aggtctggat atgtcgatgc ccggtgatgt taccttcgat agtggtacgt    960
ctttctgggg tgcaaacttg acggtcggtg tccttaacgg tacaatcccc caatggcgtg    1020
ttgatgacat ggctgtccgt atcatggccg cttattacaa ggttggccgc gacaccaaat    1080
acacccctcc caacttcagc tcgtggacca gggacgaata tggtttcgcg cataaccatg    1140
tttcggaagg tgcttacgag agggtcaacg aattcgtgga cgtgcaacgc gatcatgccg    1200
acctaatccg tcgcatcggc gcgcagagca ctgttctgct gaagaacaag ggtgccttgc    1260
ccttgagccg caaggaaaag ctggtcgccc ttctgggaga ggatgcgggt tccaactcgt    1320
ggggcgctaa cggctgtgat gaccgtggtt gcgataacgg tacccttgcc atggcctggg    1380
gtagcggtac tgcgaatttc ccatacctcg tgacaccaga gcaggcgatt cagaacgaag    1440
ttcttcaggg ccgtggtaat gtcttcgccg tgaccgacag ttgggcgctc gacaagatcg    1500
ctgcggctgc ccgccaggcc agcgtatctc tcgtgttcgt caactccgac tcaggagaaa    1560
gctatcttag tgtggatgga aatgagggcg atcgtaacaa catcactctg tggaagaacg    1620
gcgacaatgt ggtcaagacc gcagcgaata actgtaacaa caccgtggtc atcatccact    1680
ccgtcggacc agttttgatc gatgaatggt atgaccaccc caatgtcact ggtattctct    1740
gggctggtct gccaggccag gagtctggta actccatcgc cgatgtgctg tacggtcgtg    1800
tcaaccctgg cgccaagtct cctttcactt ggggcaagac ccgggagtcg tatggttctc    1860
ccttggtcaa ggatgccaac aatggcaacg gagcgcccca gtctgatttc acccagggtg    1920
ttttcatcga ttaccgccat ttcgataagt tcaatgagac ccctatctac gagtttggct    1980
acggcttgag ctacaccacc ttcgagctct ccgacctcca tgttcagccc ctgaacgcgt    2040
cccgatacac tcccaccagt ggcatgactg aagctgcaaa gaactttggt gaaattggcg    2100
atgcgtcgga gtacgtgtat ccggaggggc tggaaaggat ccatgagttt atctatccct    2160
ggatcaactc taccgacctg aaggcatcgt ctgacgattc taactacggc tgggaagact    2220
ccaagtatat tcccgaaggc gccacggatg ggtctgccca gccccgtttg cccgctagtg    2280
gtggtgccgg aggaaacccc ggtctgtacg aggatctttt ccgcgtctct gtgaaggtca    2340
agaacacggg caatgtcgcc ggtgatgaag ttcctcagct gtacgtttcc ctaggcggcc    2400
cgaatgagcc caaggtggta ctgcgcaagt ttgagcgtat tcacttggcc ccttcgcagg    2460
aggccgtgtg gacaacgacc cttacccgtc gtgaccttgc aaactgggac gtttcggctc    2520
aggactggac cgtcactcct taccccaaga cgatctacgt tggaaactcc tcacggaaac    2580
tgccgctcca ggcctcgctg cctaaggccc agtaaggggc aagtcctgat tgtacagagc    2640
atttcgagat ttatgatgta catgtttatg aatgacctag ggtagggtaa tacttagtag    2700
ggttagttct aattcttgga gtcaagtatt gactcactgg gccgataaaa aaaaaaaaaa    2760
aaaaaaaaaa a                                                         2771
 
<210>26
<211>861
<212>PRT
<213>米曲霉
 
<400>26
 
Met Lys Leu Gly Trp Ile Glu Val Ala Ala Leu Ala Ala Ala Ser Val
1               5                   10                  15
Val Ser Ala Lys Asp Asp Leu Ala Tyr Ser Pro Pro Phe Tyr Pro Ser
            20                  25                  30
Pro Trp Ala Asp Gly Gln Gly Glu Trp Ala Glu Val Tyr Lys Arg Ala
        35                  40                  45
Val Asp Ile Val Ser Gln Met Thr Leu Thr Glu Lys Val Asn Leu Thr
    50                  55                  60
Thr Gly Thr Gly Trp Gln Leu Glu Arg Cys Val Gly Gln Thr Gly Ser
65                  70                  75                  80
Val Pro Arg Leu Asn Ile Pro Ser Leu Cys Leu Gln Asp Ser Pro Leu
                85                  90                  95
Gly Ile Arg Phe Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Val Asn
            100                 105                 110
Val Ala Ala Thr Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Gln Ala
        115                 120                 125
Met Gly Glu Glu Phe Ser Asp Lys Gly Ile Asp Val Gln Leu Gly Pro
    130                 135                 140
Ala Ala Gly Pro Leu Gly Ala His Pro Asp Gly Gly Arg Asn Trp Glu
145                 150                 155                 160
Gly Phe Ser Pro Asp Pro Ala Leu Thr Gly Val Leu Phe Ala Glu Thr
                165                 170                 175
Ile Lys Gly Ile Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr
            180                 185                 190
Ile Met Asn Glu Gln Glu His Phe Arg Gln Gln Pro Glu Ala Ala Gly
        195                 200                 205
Tyr Gly Phe Asn Val Ser Asp Ser Leu Ser Ser Asn Val Asp Asp Lys
    210                 215                 220
Thr Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala
225                 230                 235                 240
Gly Val Gly Ala Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr
                245                 250                 255
Gly Cys Glu Asn Ser Glu Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu
            260                 265                 270
Gly Phe Gln Gly Phe Val Met Ser Asp Trp Thr Ala His His Ser Gly
        275                 280                 285
Val Gly Ala Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Val
290                 295                 300
Thr Phe Asp Ser Gly Thr Ser Phe Trp Gly Ala Asn Leu Thr Val Gly
305                 310                 315                 320
Val Leu Asn Gly Thr Ile Pro Gln Trp Arg Val Asp Asp Met Ala Val
                325                 330                 335
Arg Ile Met Ala Ala Tyr Tyr Lys Val Gly Arg Asp Thr Lys Tyr Thr
            340                 345                 350
Pro Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Phe Ala His
        355                 360                 365
Asn His Val Ser Glu Gly Ala Tyr Glu Arg Val Asn Glu Phe Val Asp
    370                 375                 380
Val Gln Arg Asp His Ala Asp Leu Ile Arg Arg Ile Gly Ala Gln Ser
385                 390                 395                 400
Thr Val Leu Leu Lys Asn Lys Gly Ala Leu Pro Leu Ser Arg Lys Glu
                405                 410                 415
Lys Leu Val Ala Leu Leu Gly Glu Asp Ala Gly Ser Asn Ser Trp Gly
            420                 425                 430
Ala Asn Gly Cys Asp Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met
        435                 440                 445
Ala Trp Gly Ser Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu
    450                 455                 460
Gln Ala Ile Gln Asn Glu Val Leu Gln Gly Arg Gly Asn Val Phe Ala
465                 470                 475                 480
Val Thr Asp Ser Trp Ala Leu Asp Lys Ile Ala Ala Ala Ala Arg Gln
                485                 490                 495
Ala Ser Val Ser Leu Val Phe Val Asn Ser Asp Ser Gly Glu Ser Tyr
            500                 505                 510
Leu Ser Val Asp Gly Asn Glu Gly Asp Arg Asn Asn Ile Thr Leu Trp
        515                 520                 525
Lys Asn Gly Asp Asn Val Val Lys Thr Ala Ala Asn Asn Cys Asn Asn
    530                 535                 540
Thr Val Val Ile Ile His Ser Val Gly Pro Val Leu Ile Asp Glu Trp
545                 550                 555                 560
Tyr Asp His Pro Asn Val Thr Gly Ile Leu Trp Ala Gly Leu Pro Gly
                565                 570                 575
Gln Glu Ser Gly Asn Ser Ile Ala Asp Val Leu Tyr Gly Arg Val Asn
            580                 585                 590
Pro Gly Ala Lys Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr
        595                 600                 605
Gly Ser Pro Leu Val Lys Asp Ala Asn Asn Gly Asn Gly Ala Pro Gln
    610                 615                 620
Ser Asp Phe Thr Gln Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys
625                 630                 635                 640
Phe Asn Glu Thr Pro Ile Tyr Glu Phe Gly Tyr Gly Leu Ser Tyr Thr
                645                 650                 655
Thr Phe Glu Leu Ser Asp Leu His Val Gln Pro Leu Asn Ala Ser Arg
            660                 665                 670
Tyr Thr Pro Thr Ser Gly Met Thr Glu Ala Ala Lys Asn Phe Gly Glu
        675                 680                 685
Ile Gly Asp Ala Ser Glu Tyr Val Tyr Pro Glu Gly Leu Glu Arg Ile
    690                 695                 700
His Glu Phe Ile Tyr Pro Trp Ile Asn Ser Thr Asp Leu Lys Ala Ser
705                 710                 715                 720
Ser Asp Asp Ser Asn Tyr Gly Trp Glu Asp Ser Lys Tyr Ile Pro Glu
                725                 730                 735
Gly Ala Thr Asp Gly Ser Ala Gln Pro Arg Leu Pro Ala Ser Gly Gly
            740                 745                 750
Ala Gly Gly Asn Pro Gly Leu Tyr Glu Asp Leu Phe Arg Val Ser Val
        755                 760                 765
Lrs Val Lys Asn Thr Gly Asn Val Ala Gly Asp Glu Val Pro Gln Leu
    770                 775                 780
Tyr Val Ser Leu Gly Gly Pro Asn Glu Pro Lys Val Val Leu Arg Lys
785                 790                 795                 800
Phe Glu Arg Ile His Leu Ala Pro Ser Gln Glu Ala Val Trp Thr Thr
                805                 810                 815
Th rLeu Thr Arg Arg Asp Leu Ala Asn Trp Asp Val Ser Ala Gln Asp
            820                 825                 830
Trp Thr Val Thr Pro Tyr Pro Lys Thr Ile Tyr Val Gly Asn Ser Ser
        835                 840                 845
Arg Lys Leu Pro Leu Gln Ala Ser Leu Pro Lys Ala Gln
    850                 855                 860
 
<210>27
<211>3060
<212>DNA
<213>烟曲霉(Aspergillus fumigatus)
<400>27
atgagattcg gttggctcga ggtggccgct ctgacggccg cttctgtagc caatgcccag    60
gtttgtgatg ctttcccgtc attgtttcgg atatagttga caatagtcat ggaaataatc    120
aggaattggc tttctctcca ccattctacc cttcgccttg ggctgatggc cagggagagt    180
gggcagatgc ccatcgacgc gccgtcgaga tcgtttctca gatgacactg gcggagaagg    240
ttaaccttac aacgggtact gggtgggttg cgactttttt gttgacagtg agctttcttc    300
actgaccatc tacacagatg ggaaatggac cgatgcgtcg gtcaaaccgg cagcgttccc    360
aggtaagctt gcaattctgc aacaacgtgc aagtgtagtt gctaaaacgc ggtggtgcag    420
acttggtatc aactggggtc tttgtggcca ggattcccct ttgggtatcc gtttctgtga    480
gctatacccg cggagtcttt cagtccttgt attatgtgct gatgattgtc tctgtatagc    540
tgacctcaac tccgccttcc ctgctggtac taatgtcgcc gcgacatggg acaagacact    600
cgcctacctt cgtggcaagg ccatgggtga ggaattcaac gacaagggcg tggacatttt    660
gctggggcct gctgctggtc ctctcggcaa atacccggac ggcggcagaa tctgggaagg    720
cttctctcct gatccggttc tcactggtgt acttttcgcc gaaactatca agggtatcca    780
agacgcgggt gtgattgcta ctgccaagca ttacattctg aatgaacagg agcatttccg    840
acaggttggc gaggcccagg gatatggtta caacatcacg gagacgatca gctccaacgt    900
ggatgacaag accatgcacg agttgtacct ttggtgagta gttgacactg caaatgagga    960
ccttgattga tttgactgac ctggaatgca ggccctttgc agatgctgtg cgcggtaaga    1020
ttttccgtag acttgacctc gcgacgaaga aatcgctgac gaaccatcgt agctggcgtt    1080
ggcgctgtca tgtgttccta caatcaaatc aacaacagct acggttgtca aaacagtcaa    1140
actctcaaca agctcctcaa ggctgagctg ggcttccaag gcttcgtcat gagtgactgg    1200
agcgctcacc acagcggtgt cggcgctgcc ctcgctgggt tggatatgtc gatgcctgga    1260
gacatttcct tcgacgacgg actctccttc tggggcacga acctaactgt cagtgttctt    1320
aacggcaccg ttccagcctg gcgtgtcgat gacatggctg ttcgtatcat gaccgcgtac    1380
tacaaggttg gtcgtgaccg tcttcgtatt ccccctaact tcagctcctg gacccgggat    1440
gagtacggct gggagcattc tgctgtctcc gagggagcct ggaccaaggt gaacgacttc    1500
gtcaatgtgc agcgcagtca ctctcagatc atccgtgaga ttggtgccgc tagtacagtg    1560
ctcttgaaga acacgggtgc tcttcctttg accggcaagg aggttaaagt gggtgttctc    1620
ggtgaagacg ctggttccaa cccgtggggt gctaacggct gccccgaccg cggctgtgat    1680
aacggcactc ttgctatggc ctggggtagt ggtactgcca acttccctta ccttgtcacc    1740
cccgagcagg ctatccagcg agaggtcatc agcaacggcg gcaatgtctt tgctgtgact    1800
gataacgggg ctctcagcca gatggcagat gttgcatctc aatccaggtg agtgcgggct    1860
cttagaaaaa gaacgttctc tgaatgaagt tttttaacca ttgcgaacag cgtgtctttg    1920
gtgtttgtca acgccgactc tggagagggt ttcatcagtg tcgacggcaa cgagggtgac    1980
cgcaaaaatc tcactctgtg gaagaacggc gaggccgtca ttgacactgt tgtcagccac    2040
tgcaacaaca cgattgtggt tattcacagt gttgggcccg tcttgatcga ccggtggtat    2100
gataacccca acgtcactgc catcatctgg gccggcttgc ccggtcagga gagtggcaac    2160
tccctggtcg acgtgctcta tggccgcgtc aaccccagcg ccaagacccc gttcacctgg    2220
ggcaagactc gggagtctta cggggctccc ttgctcaccg agcctaacaa tggcaatggt    2280
gctccccagg atgatttcaa cgagggcgtc ttcattgact accgtcactt tgacaagcgc    2340
aatgagaccc ccatttatga gtttggccat ggcttgagct acaccacctt tggttactct    2400
caccttcggg ttcaggccct caatagttcg agttcggcat atgtcccgac tagcggagag    2460
accaagcctg cgccaaccta tggtgagatc ggtagtgccg ccgactacct gtatcccgag    2520
ggtctcaaaa gaattaccaa gtttatttac ccttggctca actcgaccga cctcgaggat    2580
tcttctgacg acccgaacta cggctgggag gactcggagt acattcccga aggcgctagg    2640
gatgggtctc ctcaacccct cctgaaggct ggcggcgctc ctggtggtaa ccctaccctt    2700
tatcaggatc ttgttagggt gtcggccacc ataaccaaca ctggtaacgt cgccggttat    2760
gaagtccctc aattggtgag tgacccgcat gttccttgcg ttgcaatttg gctaactcgc    2820
ttctagtatg tttcactggg cggaccgaac gagcctcggg tcgttctgcg caagttcgac    2880
cgaatcttcc tggctcctgg ggagcaaaag gtttggacca cgactcttaa ccgtcgtgat    2940
ctcgccaatt gggatgtgga ggctcaggac tgggtcatca caaagtaccc caagaaagtg    3000
cacgtcggca gctcctcgcg taagctgcct ctgagagcgc ctctgccccg tgtctactag    3060
 
<210>28
<211>863
<212>PRT
<213>烟曲霉
 
<400>28
 
Met Arg Phe Gly Trp Leu Glu Val Ala Ala Leu Thr Ala Ala Ser Val
1               5                   10                  15
Ala Asn Ala Gln Glu Leu Ala Phe Ser Pro Pro Phe Tyr Pro Ser Pro
            20                  25                  30
Trp Ala Asp Gly Gln Gly Glu Trp Ala Asp Ala His Arg Arg Ala Val
        35                  40                  45
Glu Ile Val Ser Gln Met Thr Leu Ala Glu Lys Val Asn Leu Thr Thr
    50                  55                  60
Gly Thr Gly Trp Glu Met Asp Arg Cys Val Gly Gln Thr Gly Ser Val
65                  70                  75                  80
Pro Arg Leu Gly Ile Asn Trp Gly Leu Cys Gly Gln Asp Ser Pro Leu
                85                  90                  95
Gly Ile Arg Phe Ser Asp Leu Asn Ser Ala Phe Pro Ala Gly Thr Asn
            100                 105                 110
Val Ala Ala Thr Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Lys Ala
        115                 120                 125
Met Gly Glu Glu Phe Asn Asp Lys Gly Val Asp Ile Leu Leu Gly Pro
    130                 135                 140
Ala Ala Gly Pro Leu Gly Lys Tyr Pro Asp Gly Gly Arg Ile Trp Glu
145                 150                 155                 160
Gly Phe Ser Pro Asp Pro Val Leu Thr Gly Val Leu Phe Ala Glu Thr
                165                 170                 175
Ile Lys Gly Ile Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr
            180                 185                 190
Ile Leu Asn Glu Gln Glu His Phe Arg Gln Val Gly Glu Ala Gln Gly
        195                 200                 205
Tyr Gly Tyr Asn Ile Thr Glu Thr Ile Ser Ser Asn Val Asp Asp Lys
    210                 215                 220
Thr Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala
225                 230                 235                 240
Gly Val Gly Ala Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr
                245                 250                 255
Gly Cys Gln Asn Ser Gln Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu
            260                 265                 270
Gly Phe Gln Gly Phe Val Met Ser Asp Trp Ser Ala His His Ser Gly
        275                 280                 285
Val Gly Ala Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Ile
    290                 295                 300
Ser Phe Asp Asp Gly Leu Ser Phe Trp Gly Thr Asn Leu Thr Val Ser
305                 310                 315                 320
Val Leu Asn Gly Thr Val Pro Ala Trp Arg Val Asp Asp Met Ala Val
                325                 330                 335
Arg Ile Met Thr Ala Tyr Tyr Lys Val Gly Arg Asp Arg Leu Arg Ile
            340                 345                 350
Pro Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Trp Glu His
        355                 360                 365
Ser Ala Val Se rGlu Gly Ala Trp Thr Lys Val Asn Asp Phe Val Asn
    370                 375                 380
Val Gln Arg Ser His Ser Gln Ile Ile Arg Glu Ile Gly Ala Ala Ser
385                 390                 395                 400
Thr Val Leu Leu Lys Asn Thr Gly Ala Leu Pro Leu Thr Gly Lys Glu
                405                 410                 415
Val Lys Val Gly Val Leu Gly Glu Asp Ala Gly Ser Asn Pro Trp Gly
            420                 425                 430
Ala Asn Gly Cys Pro Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met
        435                 440                 445
Ala Trp Gly Ser Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu
    450                 455                 460
Gln Ala Ile Gln Arg Glu Val Ile Ser Asn Gly Gly Asn Val Phe Ala
4654                 70                 475                 480
Val Thr Asp Asn Gly Ala Leu Ser Gln Met Ala Asp Val Ala Ser Gln
                485                 490                 495
Ser Ser Val Ser Leu Val Phe Val Asn Ala Asp Ser Gly Glu Gly Phe
            500                 505                 510
Ile Ser Val Asp Gly Asn Glu Gly Asp Arg Lys Asn Leu Thr Leu Trp
        515                 520                 525
Lys Asn Gly Glu Ala Val Ile Asp Thr Val Val Ser His Cys Asn Asn
    530                 535                 540
Thr Ile Val Val Ile His Ser Val Gly Pro Val Leu Ile Asp Arg Trp
545                 550                 555                 560
Tyr Asp Asn Pro Asn Val Thr Ala Ile Ile Trp Ala Gly Leu Pro Gly
                565                 570                 575
Gln Glu Ser Gly Asn Ser Leu Val Asp Val Leu Tyr Gly Arg Val Asn
            580                 585                 590
Pro Ser Ala Lys Thr Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr
        595                 600                 605
Gly Ala Pro Leu Leu Thr Glu Pro Asn Asn Gly Asn Gly Ala Pro Gln
    610                 615                 620
Asp Asp Phe Asn Glu Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys
625                 630                 635                 640
Arg Asn Glu Thr Pro Ile Tyr Glu Phe Gly His Gly Leu Ser Tyr Thr
                645                 650                 655
Thr Phe Gly Tyr Ser His Leu Arg Val Gln Ala Leu Asn Ser Ser Ser
            660                 665                 670
Ser Ala Tyr Val Pro Thr Ser Gly Glu Thr Lys Pro Ala Pro Thr Tyr
        675                 680                 685
Gly Glu Tle Gly Ser Ala Ala Asp Tyr Leu Tyr Pro Glu Gly Leu Lys
    690                 695                 700
Arg Ile Thr Lys Phe Ile Tyr Pro Trp Leu Asn Ser Thr Asp Leu Glu
705                 710                 715                 720
Asp Ser Ser Asp Asp Pro Asn Tyr Gly Trp Glu Asp Ser Glu Tyr Ile
                725                 730                 735
Pro Glu Gly Ala Arg Asp Gly Ser Pro Gln Pro Leu Leu Lys Ala Gly
            740                 745                 750
Gly Ala Pro Gly Gly Asn Pro Thr Leu Tyr Gln Asp Leu Val Arg Val
        755                 760                 765
Ser Ala Thr Ile Thr Asn Thr Gly Asn Val Ala Gly Tyr Glu Val Pro
    770                 775                 780
Gln Leu Tyr Val Ser Leu Gly Gly Pro Asn Glu Pro Arg Val Val Leu
785                 790                 795                 800
Arg Lys Phe Asp Arg Ile Phe Leu Ala Pro Gly Glu Gln Lys Val Trp
                805                 810                 815
Thr Thr Thr Leu Asn Arg Arg Asp Leu Ala Asn Trp Asp Val Glu Ala
            820                 825                 830
Gln Asp Trp Val Ile Thr Lys Tyr Pro Lys Lys Val His Val Gly Ser
        835                 840                 845
Ser Ser Arg Lys Leu Pro Leu Arg Ala Pro Leu Pro Arg Val Tyr
    850                 855                 860
 
<210>29
<211>2800
<212>DNA
<213>巴西青霉(Penieillium brasilianum)
 
<400>29
tgaaaatgca gggttctaca atctttctgg ctttcgcctc atgggcgagc caggttgctg    60
ccattgcgca gcccatacag aagcacgagg tttgttttat cttgctcatg gacgtgcttt    120
gacttgacta attgttttac atacagcccg gatttctgca cgggccccaa gccatagaat    180
cgttctcaga accgttctac ccgtcgccct ggatgaatcc tcacgccgag ggctgggagg    240
ccgcatatca gaaagctcaa gattttgtct cgcaactcac tatcttggag aaaataaatc    300
tgaccaccgg tgttgggtaa gtctctccga ctgcttctgg gtcacggtgc gacgagccac    360
tgactttttg aagctgggaa aatgggccgt gtgtaggaaa cactggatca attcctcgtc    420
tcggattcaa aggattttgt acccaggatt caccacaggg tgttcggttc gcagattatt    480
cctccgcttt cacatctagc caaatggccg ccgcaacatt tgaccgctca attctttatc    540
aacgaggcca agccatggca caggaacaca aggctaaggg tatcacaatt caattgggcc    600
ctgttgccgg ccctctcggt cgcatccccg agggcggccg caactgggaa ggattctccc    660
ctgatcctgt cttgactggt atagccatgg ctgagacaat taagggcatg caggatactg    720
gagtgattgc ttgcgctaaa cattatattg gaaacgagca ggagcacttc cgtcaagtgg    780
gtgaagctgc gggtcacgga tacactattt ccgatactat ttcatctaat attgacgacc    840
gtgctatgca tgagctatac ttgtggccat ttgctgatgc cgttcgcgct ggtgtgggtt    900
ctttcatgtg ctcatactct cagatcaaca actcctacgg atgccaaaac agtcagaccc    960
tcaacaagct cctcaagagc gaattgggct tccaaggctt tgtcatgagc gattggggtg    1020
cccatcactc tggagtgtca tcggcgctag ctggacttga tatgagcatg ccgggtgata    1080
ccgaatttga ttctggcttg agcttctggg gctctaacct caccattgca attctgaacg    1140
gcacggttcc cgaatggcgc ctggatgaca tggcgatgcg aattatggct gcatacttca    1200
aagttggcct tactattgag gatcaaccag atgtcaactt caatgcctgg acccatgaca    1260
cctacggata taaatacgct tatagcaagg aagattacga gcaggtcaac tggcatgtcg    1320
atgttcgcag cgaccacaat aagctcattc gcgagactgc cgcgaagggt acagttctgc    1380
tgaagaacaa ctttcatgct ctccctctga agcagcccag gttcgtggcc gtcgttggtc    1440
aggatgccgg gccaaacccc aagggcccta acggctgcgc agaccgagga tgcgaccaag    1500
gcactctcgc aatgggatgg ggctcagggt ctaccgaatt cccttacctg gtcactcctg    1560
acactgctat tcagtcaaag gtcctcgaat acgggggtcg atacgagagt atttttgata    1620
actatgacga caatgctatc ttgtcgcttg tctcacagcc tgatgcaacc tgtatcgttt    1680
ttgcaaatgc cgattccggt gaaggctaca tcactgtcga caacaactgg ggtgaccgca    1740
acaatctgac cctctggcaa aatgccgatc aagtgattag cactgtcagc tcgcgatgca    1800
acaacacaat cgttgttctc cactctgtcg gaccagtgtt gctaaatggt atatatgagc    1860
acccgaacat cacagctatt gtctgggcag ggatgccagg cgaagaatct ggcaatgctc    1920
tcgtggatat tctttggggc aatgttaacc ctgccggtcg cactccgttc acctgggcca    1980
aaagtcgaga ggactatggc actgatataa tgtacgagcc caacaacggc cagcgtgcgc    2040
ctcagcagga tttcaccgag agcatctacc tcgactaccg ccatttcgac aaagctggta    2100
tcgagccaat ttacgagttt ggattcggcc tctcctatac caccttcgaa tactctgacc    2160
tccgtgttgt gaagaagtat gttcaaccat acagtcccac gaccggcacc ggtgctcaag    2220
caccttccat cggacagcca cctagccaga acctggatac ctacaagttc cctgctacat    2280
acaagtacat caaaaccttc atttatccct acctgaacag cactgtctcc ctccgcgctg    2340
cttccaagga tcccgaatac ggtcgtacag actttatccc accccacgcg cgtgatggct    2400
cccctcaacc tctcaacccc gctggagacc cagtggccag tggtggaaac aacatgctct    2460
acgacgaact ttacgaggtc actgcacaga tcaaaaacac tggcgacgtg gccggcgacg    2520
aagtcgtcca gctttacgta gatctcgggg gtgacaaccc gcctcgtcag ttgagaaact    2580
ttgacaggtt ttatctgctg cccggtcaga gctcaacatt ccgggctaca ttgacgcgcc    2640
gtgatttgag caactgggat attgaggcgc agaactggcg agttacggaa tcgcctaaga    2700
gagtgtatgt tggacggtcg agtcgggatt tgccgctgag ctcacaattg gagtaatgat    2760
catgtctacc aatagatgtt gaatgtctgg tgtggatatt                          2800
 
<210>30
<211>878
<212>PRT
<213>巴西青霉
 
<400>30
 
Met Gln Gly Ser Thr Ile Phe Leu Ala Phe Ala Ser Trp Ala Ser Gln
1               5                   10                  15
Val Ala Ala Ile Ala Gln Pro Ile Gln Lys His Glu Pro Gly Phe Leu
            20                  25                  30
His Gly Pro Gln Ala Ile Glu Ser Phe Ser Glu Pro Phe Tyr Pro Ser
        35                  40                  45
Pro Trp Met Asn Pro His Ala Glu Gly Trp Glu Ala Ala Tyr Gln Lys
    50                  55                  60
Ala Gln Asp Phe Val Ser Gln Leu Thr Ile Leu Glu Lys Ile Asn Leu
65                  70                  75                  80
Thr Thr Gly Val Gly Trp Glu Asn Gly Pro Cys Val Gly Asn Thr Gly
                85                  90                  95
Ser Ile Pro Arg Leu Gly Phe Lys Gly Phe Cys Thr Gln Asp Ser Pro
            100                 105                 110
Gln Gly Val Arg Phe Ala Asp Tyr Ser Ser Ala Phe Thr Ser Ser Gln
        115                 120                 125
Met Ala Ala Ala Thr Phe Asp Arg Ser Ile Leu Tyr Gln Arg Gly Gln
    130                 135                 140
Ala Met Ala Gln Glu His Lys Ala Lys Gly Ile Thr Ile Gln Leu Gly
145                 150                 155                 160
Pro Val Ala Gly Pro Leu Gly Arg Ile Pro Glu Gly Gly Arg Asn Trp
                165                 170                 175
Glu Gly Phe Ser Pro Asp Pro Val Leu Thr Gly Ile Ala Met Ala Glu
            180                 185                 190
Thr Ile Lys Gly Met Gln Asp Thr Gly Val Ile Ala Cys Ala Lys His
        195                 200                 205
Tyr Ile Gly Asn Glu Gln Glu His Phe Arg Gln Val Gly Glu Ala Ala
    210                 215                 220
Gl y Hi s Gly TyrThr Ile Ser Asp ThrIle Ser Ser Asn Ile Asp Asp
225                 230                 235                 240
Arg Ala Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg
                245                 250                 255
Ala Gly Val Gly Ser Phe Met Cys Ser Tyr Ser Gln Ile Asn Asn Ser
            260                 265                 270
Tyr Gly Cys Gln Asn Ser Gln Thr Leu Asn Lys Leu Leu Lys Ser Glu
        275                 280                 285
Leu Gly Phe Gln Gly Phe Val Met Ser Asp Trp Gly Ala His His Ser
    290                 295                 300
Gly Val Ser Ser Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp
305                 310                 315                 320
Thr Glu Phe Asp Ser Gly Leu Ser Phe Trp Gly Ser Asn Leu Thr Ile
                325                 330                 335
Ala Ile Leu Asn Gly Thr Val Pro Glu Trp Arg Leu Asp Asp Met Ala
            340                 345                 350
Met Arg Ile Met Ala Ala Tyr Phe Lys Val Gly Leu Thr Ile Glu Asp
        355                 360                 365
Gln Pro Asp Val Asn Phe Asn Ala Trp Thr His Asp Thr Tyr Gly Tyr
    370                 375                 380
Lys Tyr Ala Tyr Ser Lys Glu Asp Tyr Glu Gln Val Asn Trp His Val
385                 390                 395                 400
Asp Val Arg Ser Asp His Asn Lys Leu Ile Arg Glu Thr Ala Ala Lys
                405                 410                 415
Gly Thr Val Leu Leu Lys Asn Asn Phe His Ala Leu Pro Leu Lys Gln
            420                 425                 430
Pro Arg Phe Val Ala Val Val Gly Gln Asp Ala Gly Pro Asn Pro Lys
        435                 440                 445
Gly Pro Asn Gly Cys Ala Asp Arg Gly Cys Asp Gln Gly Thr Leu Ala
    450                 455                 460
Met Gly Trp Gly Ser Gly Ser Thr Glu Phe Pro Tyr Leu Val Thr Pro
465                 470                 475                 480
Asp Thr Ala Ile Gln Ser Lys Val Leu Glu Tyr Gly Gly Arg Tyr Glu
                485                 490                 495
Ser Ile Phe Asp Asn Tyr Asp Asp Asn Ala Ile Leu Ser Leu Val Ser
            500                 505                 510
Gln Pro Asp Ala Thr Cys Ile Val Phe Ala Asn Ala Asp Ser Gly Glu
        515                 520                 525
Gly Tyr Ile Thr Val Asp Asn Asn Trp Gly Asp Arg Asn Asn Leu Thr
    530                 535                 540
Leu Trp Gln Asn Ala Asp Gln Val Ile Ser Thr Val Ser Ser Arg Cys
545                 550                 555                 560
Asn Asn Thr Ile Val Val Leu His Ser Val Gly Pro Val Leu Leu Asn
                565                 570                 575
Gly Ile Tyr Glu His Pro Asn Ile Thr Ala Ile Val Trp Ala Gly Met
            580                 585                 590
Pro Gly Glu Glu Ser Gly Asn Ala Leu Val Asp Ile Leu Trp Gly Asn
        595                 600                 605
Val Asn Pro Ala Gly Arg Thr Pro Phe Thr Trp Ala Lys Ser Arg Glu
    610                 615                 620
Asp Tyr Gly Thr Asp Ile Met Tyr Glu Pro Asn Asn Gly Gln Arg Ala
625                 630                 635                 640
Pro Gln Gln Asp Phe Thr Glu Ser Ile Tyr Leu Asp Tyr Arg His Phe
                645                 650                 655
Asp Lys Ala Gly Ile Glu Pro Ile Tyr Glu Phe Gly Phe Gly Leu Ser
            660                 665                 670
Tyr Thr Thr Phe Glu Tyr Ser Asp Leu Arg Val Val Lys Lys Tyr Val
        675                 680                 685
Gln Pro Tyr Ser Pro Thr Thr Gly Thr Gly Ala Gln Ala Pro Ser Ile
    690                 695                 700
Gly Gln Pro Pro Ser Gln Asn Leu Asp Thr Tyr Lys Phe Pro Ala Thr
705                 710                 715                 720
Tyr Lys Tyr Ile Lys Thr Phe Ile Tyr Pro Tyr Leu Asn Ser Thr Val
                725                 730                 735
Ser Leu Arg Ala Ala Ser Lys Asp Pro Glu Tyr Gly Arg Thr Asp Phe
            740                 745                 750
Ile Pro Pro His Ala Arg Asp Gly Ser Pro Gln Pro Leu Asn Pro Ala
        755                 760                 765
Gly Asp Pro Val Ala Ser Gly Gly Asn Asn Met Leu Tyr Asp Glu Leu
    770                 775                 780
Tyr Glu Val Thr Ala Gln Ile Lys Asn Thr Gly Asp Val Ala Gly Asp
785                 790                 795                 800
Glu Val Val Gln Leu Tyr Val Asp Leu Gly Gly Asp Asn Pro Pro Arg
                805                 810                 815
Gln Leu Arg Asn Phe Asp Arg Phe Tyr Leu Leu Pro Gly Gln Ser Ser
            820                 825                 830
Thr Phe Arg Ala Thr Leu Thr Arg Arg Asp Leu Ser Asn Trp Asp Ile
        835                 840                 845
Glu Ala Gln Asn Trp Arg Val Thr Glu Ser Pro Lys Arg Val Tyr Val
    850                 855                 860
Gly Arg Ser Ser Arg Asp Leu Pro Leu Ser Ser Gln Leu Glu
865                 870                 875
49

Claims (29)

1.用于降解或转化含纤维素材料的方法,其包括:用有效量的纤维素分解酶组合物处理含纤维素材料,该纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽和选自下组中的一种或多种(几种)组份:具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性和纤维素结合域的CEL7多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽;
其中所述具有内切葡聚糖酶活性的CEL7多肽选自下组:(a)多肽,其包含与SEQ ID NO:2的成熟多肽具有优选至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的氨基酸序列;(b)由多核苷酸编码的多肽,所述多核苷酸在优选至少中严紧条件,更优选至少中-高严紧条件,并且最优选至少高严紧条件下与以下杂交:(i)SEQ ID NO:1的成熟多肽编码序列,(ii)包含SEQ ID NO:1的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;(c)多肽,其由包含与SEQ ID NO:1的成熟多肽编码序列具有优选至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的核苷酸序列的多核苷酸编码;和(d)变体,其包含取代、缺失和/或插入一个或多个(几个)氨基酸的SEQ ID NO:2的成熟多肽;
其中所述具有内切葡聚糖酶活性的CEL12多肽选自下组:(a)多肽,其包含与SEQ ID NO:4的成熟多肽具有优选至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的氨基酸序列;(b)由多核苷酸编码的多肽,所述多核苷酸在优选至少中严紧条件,更优选至少中-高严紧条件,并且最优选至少高严紧条件下与以下杂交:(i)SEQ ID NO:3的成熟多肽编码序列,(ii)包含SEQ ID NO:3的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;(c)多肽,其由包含与SEQ ID NO:3的成熟多肽编码序列具有优选至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的核苷酸序列的多核苷酸编码;和(d)变体,其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQ ID NO:4的成熟多肽;
其中所述具有内切葡聚糖酶活性的CEL45多肽选自下组:(a)多肽,其包含与SEQ ID NO:6的成熟多肽具有优选至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的氨基酸序列;(b)由多核苷酸编码的多肽,所述多核苷酸在优选至少中严紧条件,更优选至少中-高严紧条件,并且最优选至少高严紧条件下与以下杂交:(i)SEQ ID NO:5的成熟多肽编码序列,(ii)包含在SEQ ID NO:5的成熟多肽编码序列中的cDNA序列,或者(iii)(i)或(ii)的全长互补链;(c)多肽,其由包含与SEQ ID NO:5的成熟多肽编码序列具有优选至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的核苷酸序列的多核苷酸编码;和(d)变体,其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQ ID NO:6的成熟多肽;
其中所述具有纤维二糖水解酶活性和纤维素结合域的CEL7多肽选自下组:(a)多肽,其包含与SEQ ID NO:8的成熟多肽具有优选至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的氨基酸序列;(b)由多核苷酸编码的多肽,所述多核苷酸在优选至少中严紧条件,更优选至少中-高严紧条件,并且最优选至少高严紧条件下与以下杂交:(i)SEQ ID NO:7的成熟多肽编码序列,(ii)包含在SEQ ID NO:7的成熟多肽编码序列中的cDNA序列,或者(iii)(i)或(ii)的全长互补链;(c)多肽,其由包含与SEQ ID NO:7的成熟多肽编码序列具有优选至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的核苷酸序列的多核苷酸编码;和(d)变体,其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQ ID NO:8的成熟多肽;
其中所述具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽选自下组:(a)多肽,其包含与SEQ ID NO:10的成熟多肽具有优选至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的氨基酸序列;(b)由多核苷酸编码的多肽,所述多核苷酸在优选至少中严紧条件,更优选至少中-高严紧条件,并且最优选至少高严紧条件下与以下杂交:(i)SEQ ID NO:9的成熟多肽编码序列,(ii)包含在SEQ ID NO:9的成熟多肽编码序列中的cDNA序列或包含SEQ ID NO:9的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;(c)多肽,其由包含与SEQ ID NO:9的成熟多肽编码序列具有优选至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的核苷酸序列的多核苷酸编码;和(d)变体,其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQ ID NO:10的成熟多肽;并且
其中与具有增强纤维素分解的活性的多肽不存在的情况相比,具有增强纤维素分解的活性的多肽的存在,使通过纤维素分解酶组合物进行的对含纤维素材料的降解增加。
2.权利要求1的方法,其中所述具有内切葡聚糖酶活性的CEL7多肽包含或者其组成为SEQ ID NO:2的成熟多肽或其具有内切葡聚糖酶活性的片段,所述具有内切葡聚糖酶活性的CEL12多肽包含或者其组成为SEQ ID NO:4的成熟多肽或其具有内切葡聚糖酶活性的片段,所述具有内切葡聚糖酶活性的CEL45多肽包含或者其组成为SEQ ID NO:6的成熟多肽或其具有内切葡聚糖酶活性的片段,所述具有纤维二糖水解酶活性和纤维素结合域的CEL7多肽包含或者其组成为SEQ ID NO:8的成熟多肽或其具有纤维二糖水解酶活性的片段,以及具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽包含或其组成为SEQ ID NO:10的成熟多肽或其具有纤维二糖水解酶活性的片段。
3.权利要求1的方法,其中所述具有增强纤维素分解的活性的多肽选自下组:
(a)包含[ILMV]-P-X(4,5)-G-X-Y-[ILMV]-X-R-X-[EQ]-X(4)-[HNQ]和[FW]-[TF]-K-[AIV]的具有增强纤维素分解的活性的多肽,其中X是任何氨基酸,X(4,5)是在4或5个邻接位置上的任何氨基酸,并且X(4)是在4个邻接位置上的任何氨基酸;和
(b)包含[ILMV]-P-x(4,5)-G-x-Y-[ILMV]-x-R-x-[EQ]-x(3)-A-[HNQ]的具有增强纤维素分解的活性的多肽,其中x是任何氨基酸,x(4,5)是在4或5个邻接位置上的任何氨基酸,并且x(3)是在3个邻接位置上的任何氨基酸。
4.权利要求3的方法,其中所述包含[ILMV]-P-X(4,5)-G-X-Y-[ILMV]-X-R-X-[EQ]-X(4)-[HNQ]和[FW]-[TF]-K-[AIV]的具有增强纤维素分解的活性的多肽进一步包含:
H-X(1,2)-G-P-X(3)-[YW]-[AILMV],
[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV],或
H-X(1,2)-G-P-X(3)-[YW]-[AILMV]和
[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV],
其中X是任何氨基酸,X(1,2)是在1个位置或2个邻接位置上的任何氨基酸,X(3)是在3个邻接位置上的任何氨基酸,并且X(2)是在2个邻接位置上的任何氨基酸。
5.权利要求1的方法,其中所述具有增强纤维素分解的活性的多肽选自下组:
(a)多肽,其包含与SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18或SEQ ID NO:20、SEQ ID NO:22或SEQ ID NO:24的成熟多肽具有优选至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的氨基酸序列;
(b)由多核苷酸编码的多肽,所述多核苷酸在优选至少中严紧条件,更优选至少中-高严紧条件,并且最优选至少高严紧条件下与以下杂交:(i)SEQIDNO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21或SEQ ID NO:23的成熟多肽编码序列,(ii)包含在SEQ IDNO:11、SEQ ID NO:13、SEQ ID NO:15或SEQ ID NO:21的成熟多肽编码序列中的cDNA序列,或者包含SEQ ID NO:17、SEQ ID NO:19或SEQ IDNO:23的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;
(c)多肽,其由包含与SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21或SEQ ID NO:23的成熟多肽编码序列具有优选至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的核苷酸序列的多核苷酸编码;和
(d)变体,其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18或SEQ ID NO:20、SEQ ID NO:22或SEQ ID NO:24的成熟多肽。
6.权利要求1的方法,其中所述具有增强纤维素分解的活性的多肽包含或其组成为SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18或SEQ ID NO:20、SEQ ID NO:22或SEQ ID NO:24的成熟多肽;或者其具有增强纤维素分解的活性的片段。
7.权利要求1的方法,其中所述具有增强纤维素分解的活性的多肽由多核苷酸编码,该多核苷酸包含在大肠杆菌NRRL B-30699中所含的质粒pEJG120中,在大肠杆菌NRRL B-30813中所含的质粒pTter61C中,在大肠杆菌NRRL B-30812中所含的质粒pTter61D中,在大肠杆菌NRRL B-30814中所含的质粒pTter61E中,在大肠杆菌NRRL B-30811中所含的质粒pTter61G中,在大肠杆菌NRRL B-30704中所含的质粒pDZA2-7中或者在大肠杆菌NRRL B-30878中所含的质粒pTr3337中。
8.权利要求1-7中任一项的方法,其中所述组合物进一步包含一种或多种(几种)具有β-葡糖苷酶活性的多肽。
9.权利要求1-8中任一项的方法,其中所述组合物进一步包含有效量的选自下组中的一种或多种(几种)酶:半纤维素酶、酯酶、蛋白酶、漆酶和过氧化物酶。
10.权利要求1-9中任一项的方法,其进一步包括回收降解或转化的含纤维素材料。
11.用于生产物质的方法,其包括:
(A)用有效量的纤维素分解酶组合物将含纤维素材料糖化,该纤维素分解酶组合物包含具有增强纤维素分解活性的多肽,和选自下组中一种或多种(几种)组分:具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽;
其中所述具有内切葡聚糖酶活性的CEL7多肽选自下组:(a)多肽,其包含与SEQ ID NO:2的成熟多肽具有优选至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的氨基酸序列;(b)由多核苷酸编码的多肽,所述多核苷酸在优选至少中严紧条件,更优选至少中-高严紧条件,并且最优选至少高严紧条件下与以下杂交:(i)SEQ ID NO:1的成熟多肽编码序列,(ii)包含SEQ ID NO:1的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;(c)多肽,其由包含与SEQ ID NO:1的成熟多肽编码序列具有优选至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的核苷酸序列的多核苷酸编码;和(d)变体,其包含取代、缺失和/或插入一个或多个(几个)氨基酸的SEQ ID NO:2的成熟多肽;
其中所述具有内切葡聚糖酶活性的CEL12多肽选自下组:(a)多肽,其包含与SEQ ID NO:4的成熟多肽具有优选至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的氨基酸序列;(b)由多核苷酸编码的多肽,所述多核苷酸在优选至少中严紧条件,更优选至少中-高严紧条件,并且最优选至少高严紧条件下与以下杂交:(i)SEQ ID NO:3的成熟多肽编码序列,(ii)包含SEQ ID NO:3的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;(c)多肽,其由包含与SEQ ID NO:3的成熟多肽编码序列具有优选至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的核苷酸序列的多核苷酸编码;和(d)变体,其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQ ID NO:4的成熟多肽;
其中所述具有内切葡聚糖酶活性的CEL45多肽选自下组:(a)多肽,其包含与SEQ ID NO:6的成熟多肽具有优选至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的氨基酸序列;(b)由多核苷酸编码的多肽,所述多核苷酸在优选至少中严紧条件,更优选至少中-高严紧条件,并且最优选至少高严紧条件下与以下杂交:(i)SEQ ID NO:5的成熟多肽编码序列,(ii)包含在SEQ ID NO:5的成熟多肽编码序列中的cDNA序列,或者(iii)(i)或(ii)的全长互补链;(c)多肽,其由包含与SEQ ID NO:5的成熟多肽编码序列具有优选至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的核苷酸序列的多核苷酸编码;和(d)变体,其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQ ID NO:6的成熟多肽;
其中所述具有纤维二糖水解酶活性和纤维素结合域的CEL7多肽选自下组:(a)多肽,其包含与SEQ ID NO:8的成熟多肽具有优选至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的氨基酸序列;(b)由多核苷酸编码的多肽,所述多核苷酸在优选至少中严紧条件,更优选至少中-高严紧条件,并且最优选至少高严紧条件下与以下杂交:(i)SEQ ID NO:7的成熟多肽编码序列,(ii)包含在SEQ ID NO:7的成熟多肽编码序列中的cDNA序列,或者(iii)(i)或(ii)的全长互补链;(c)多肽,其由包含与SEQ ID NO:7的成熟多肽编码序列具有优选至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的核苷酸序列的多核苷酸编码;和(d)变体,其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQ ID NO:8的成熟多肽;
其中所述具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽选自下组:(a)多肽,其包含与SEQ ID NO:10的成熟多肽具有优选至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的氨基酸序列;(b)由多核苷酸编码的多肽,所述多核苷酸在优选至少中严紧条件,更优选至少中-高严紧条件,并且最优选至少高严紧条件下与以下杂交:(i)SEQ ID NO:9的成熟多肽编码序列,(ii)包含在SEQ ID NO:9的成熟多肽编码序列中的cDNA序列或包含SEQ ID NO:9的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;(c)多肽,其由包含与SEQ ID NO:9的成熟多肽编码序列具有优选至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的核苷酸序列的多核苷酸编码;和(d)变体,其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQ ID NO:10的成熟多肽;并且
其中与具有增强纤维素分解的活性的多肽不存在的情况相比,具有增强纤维素分解的活性的多肽的存在,使通过纤维素分解酶组合物进行的对含纤维素材料的降解增加;
(B)用一种或多种(几种)发酵微生物发酵步骤(a)中的糖化的含纤维素材料以产生发酵产物;和
(C)回收发酵产物。
12.权利要求11的方法,其中所述具有内切葡聚糖酶活性的CEL7多肽包含或者其组成为SEQ ID NO:2的成熟多肽或其具有内切葡聚糖酶活性的片段,所述具有内切葡聚糖酶活性的CEL12多肽包含或者其组成为SEQ IDNO:4的成熟多肽或其具有内切葡聚糖酶活性的片段,所述具有内切葡聚糖酶活性的CEL45多肽包含或者其组成为SEQ ID NO:6的成熟多肽或其具有内切葡聚糖酶活性的片段,所述具有纤维二糖水解酶活性和纤维素结合域的CEL7多肽包含或者其组成为SEQ ID NO:8的成熟多肽或其具有纤维二糖水解酶活性的片段,以及具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽包含或其组成为SEQ ID NO:10的成熟多肽或其具有纤维二糖水解酶活性的片段。
13.权利要求11的方法,其中所述具有增强纤维素分解的活性的多肽选自下组:
(a)包含[ILMV]-P-X(4,5)-G-X-Y-[ILMV]-X-R-X-[EQ]-X(4)-[HNQ]和[FW]-[TF]-K-[AIV]的具有增强纤维素分解的活性的多肽,其中X是任何氨基酸,X(4,5)是在4或5个邻接位置上的任何氨基酸,并且X(4)是在4个邻接位置上的任何氨基酸;和
(b)包含[ILMV]-P-x(4,5)-G-x-Y-[ILMV]-x-R-x-[EQ]-x(3)-A-[HNQ],其中x是任何氨基酸,x(4,5)是在4或5个邻接位置上的任何氨基酸,并且x(3)是在3个邻接位置上的任何氨基酸。
14.权利要求13的方法,其中所述包含[ILMV]-P-X(4,5)-G-X-Y-[ILMV]-X-R-X-[EQ]-X(4)-[HNQ]和[FW]-[TF]-K-[AIV]的具有增强纤维素分解的活性的多肽进一步包含:
H-X(1,2)-G-P-X(3)-[YW]-[AILMV],
[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV],或
H-X(1,2)-G-P-X(3)-[YW]-[AILMV]和
[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV],
其中X是任何氨基酸,X(1,2)是在1个位置或2个邻接位置上的任何氨基酸,X(3)是在3个邻接位置上的任何氨基酸,并且X(2)是在2个邻接位置上的任何氨基酸。
15.权利要求11的方法,其中所述具有增强纤维素分解的活性的多肽选自下组:
(a)多肽,其包含与SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18或SEQ ID NO:20、SEQ ID NO:22或SEQ ID NO:24的成熟多肽具有优选至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的氨基酸序列;
(b)由多核苷酸编码的多肽,所述多核苷酸在优选至少中严紧条件,更优选至少中-高严紧条件,并且最优选至少高严紧条件下与以下杂交:(i)SEQID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21或SEQ ID NO:23的成熟多肽编码序列,(ii)包含在SEQ IDNO:11、SEQ ID NO:13、SEQ ID NO:15或SEQ ID NO:21的成熟多肽编码序列中的cDNA序列,或者包含SEQ ID NO:17、SEQ ID NO:19或SEQ IDNO:23的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;
(c)多肽,其由包含与SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21或SEQ ID NO:23的成熟多肽编码序列具有优选至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的核苷酸序列的多核苷酸编码;和
(d)变体,其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18或SEQ ID NO:20、SEQ ID NO:22或SEQ ID NO:24的成熟多肽。
16.权利要求11的方法,其中所述具有增强纤维素分解的活性的多肽包含或其组成为SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18或SEQ ID NO:20、SEQ ID NO:22或SEQ ID NO:24的成熟多肽;或者其具有增强纤维素分解的活性的片段。
17.权利要求11的方法,其中所述具有增强纤维素分解的活性的多肽由多核苷酸编码,该多核苷酸包含在大肠杆菌NRRL B-30699中所含的质粒pEJG120中,在大肠杆菌NRRL B-30813中所含的质粒pTter61C中,在大肠杆菌NRRL B-30812中所含的质粒pTter61D中,在大肠杆菌NRRL B-30814中所含的质粒pTter61E中,在大肠杆菌NRRLB-30811中所含的质粒pTter61G中,在大肠杆菌NRRLB-30704中所含的质粒pDZA2-7中或者在大肠杆菌NRRL B-30878中所含的质粒pTr3337中。
18.权利要求11-17中任一项的方法,其中所述组合物进一步包含一种或多种(几种)具有β-葡糖苷酶活性的多肽。
19.权利要求11-18中任一项的方法,其中所述组合物进一步包含有效量的选自下组中的一种或多种(几种)酶:半纤维素酶、酯酶、蛋白酶、漆酶和过氧化物酶。
20.权利要求11-19中任一项的方法,其中所述发酵产物为醇、有机酸、酮、醛、氨基酸或气体。
21.纤维素分解酶组合物,其包含有效量的具有增强纤维素分解的活性的多肽和选自下组中的一种或多种(几种)组分:具有内切葡聚糖酶活性的CEL7多肽、具有具有内切葡聚糖酶活性的CEL12多肽、具有具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽;
其中所述具有内切葡聚糖酶活性的CEL7多肽选自下组:(a)多肽,其包含与SEQ ID NO:2的成熟多肽具有至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的氨基酸序列;(b)由多核苷酸编码的多肽,所述多核苷酸在优选至少中严紧条件,更优选至少中-高严紧条件,并且最优选至少高严紧条件下与以下杂交:(i)SEQ ID NO:1的成熟多肽编码序列,(ii)包含SEQ ID NO:1的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;(c)多肽,其由包含与SEQ ID NO:1的成熟多肽编码序列具有至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的核苷酸序列的多核苷酸编码;和(d)变体,其包含取代、缺失和/或插入一个或多个(几个)氨基酸的SEQ ID NO:2的成熟多肽;
其中所述具有内切葡聚糖酶活性的CEL12多肽选自下组:(a)多肽,其包含与SEQ ID NO:4的成熟多肽具有至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的氨基酸序列;(b)由多核苷酸编码的多肽,所述多核苷酸在优选至少中严紧条件,更优选至少中-高严紧条件,并且最优选至少高严紧条件下与以下杂交:(i)SEQ ID NO:3的成熟多肽编码序列,(ii)包含SEQID NO:3的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;(c)多肽,其由包含与SEQ ID NO:3的成熟多肽编码序列具有至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的核苷酸序列的多核苷酸编码;和(d)变体,其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQ ID NO:4的成熟多肽;
其中所述具有内切葡聚糖酶活性的CEL45多肽选自下组:(a)多肽,其包含与SEQ ID NO:6的成熟多肽具有至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的氨基酸序列;(b)由多核苷酸编码的多肽,所述多核苷酸在优选至少中严紧条件,更优选至少中-高严紧条件,并且最优选至少高严紧条件下与以下杂交:(i)SEQ ID NO:5的成熟多肽编码序列,(ii)包含在SEQ ID NO:5的成熟多肽编码序列中的cDNA序列,或者(iii)(i)或(ii)的全长互补链;(c)多肽,其由包含与SEQ ID NO:5的成熟多肽编码序列具有至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的核苷酸序列的多核苷酸编码;和(d)变体,其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQ ID NO:6的成熟多肽;
其中所述具有纤维二糖水解酶活性和纤维素结合域的CEL7多肽选自下组:(a)多肽,其包含与SEQ ID NO:8的成熟多肽具有至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的氨基酸序列;(b)由多核苷酸编码的多肽,所述多核苷酸在优选至少中严紧条件,更优选至少中-高严紧条件,并且最优选至少高严紧条件下与以下杂交:(i)SEQ ID NO:7的成熟多肽编码序列,(ii)包含在SEQ ID NO:7的成熟多肽编码序列中的cDNA序列,或者(iii)(i)或(ii)的全长互补链;(c)多肽,其由包含与SEQ ID NO:7的成熟多肽编码序列具有至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的核苷酸序列的多核苷酸编码;和(d)变体,其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQ ID NO:8的成熟多肽;
其中所述具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽选自下组:(a)多肽,其包含与SEQ ID NO:10的成熟多肽具有至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的氨基酸序列;(b)由多核苷酸编码的多肽,所述多核苷酸在优选至少中严紧条件,更优选至少中-高严紧条件,并且最优选至少高严紧条件下与以下杂交:(i)SEQ ID NO:9的成熟多肽编码序列,(ii)包含在SEQ ID NO:9的成熟多肽编码序列中的cDNA序列或包含SEQ ID NO:9的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;(c)多肽,其由包含与SEQ ID NO:9的成熟多肽编码序列具有至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的核苷酸序列的多核苷酸编码;和(d)变体,其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQ ID NO:10的成熟多肽;以及
其中与具有增强纤维素分解的活性的多肽不存在的情况相比,具有增强纤维素分解的活性的多肽的存在,使通过纤维素分解酶组合物进行的对含纤维素材料的降解增加。
22.权利要求21的纤维素酶组合物,其中所述具有内切葡聚糖酶活性的CEL7多肽包含或者其组成为SEQ ID NO:2的成熟多肽或其具有内切葡聚糖酶活性的片段,所述具有内切葡聚糖酶活性的CEL12多肽包含或者其组成为SEQ ID NO:4的成熟多肽或其具有内切葡聚糖酶活性的片段,所述具有内切葡聚糖酶活性的CEL45多肽包含或者其组成为SEQ ID NO:6的成熟多肽或其具有内切葡聚糖酶活性的片段,所述具有纤维二糖水解酶活性和纤维素结合域的CEL7多肽包含或者其组成为SEQ ID NO:8的成熟多肽或其具有纤维二糖水解酶活性的片段,以及具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽包含或其组成为SEQ ID NO:10的成熟多肽或其具有纤维二糖水解酶活性的片段。
23.权利要求21的纤维素分解酶组合物,其中所述具有增强纤维素分解的活性的多肽选自下组:
(a)包含[ILMV]-P-X(4,5)-G-X-Y-[ILMV]-X-R-X-[EQ]-X(4)-[HNQ]和[FW]-[TF]-K-[AIV]的具有增强纤维素分解的活性的多肽,其中X是任何氨基酸,X(4,5)是在4或5个邻接位置上的任何氨基酸,并且X(4)是在4个邻接位置上的任何氨基酸;和
(b)包含[ILMV]-P-x(4,5)-G-x-Y-[ILMV]-x-R-x-[EQ]-x(3)-A-[HNQ],其中x是任何氨基酸,x(4,5)是在4或5个邻接位置上的任何氨基酸,并且x(3)是在3个邻接位置上的任何氨基酸。
24.权利要求23的纤维素分解酶组合物,其中所述包含[ILMV]-P-X(4,5)-G-X-Y-[ILMV]-X-R-X-[EQ]-X(4)-[HNQ]和[FW]-[TF]-K-[AIV]的具有增强纤维素分解的活性的多肽进一步包含:
H-X(1,2)-G-P-X(3)-[YW]-[AILMV],
[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV],或
H-X(1,2)-G-P-X(3)-[YW]-[AILMV]和[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV],
其中X是任何氨基酸,X(1,2)是在1个位置或2个邻接位置上的任何氨基酸,X(3)是在3个邻接位置上的任何氨基酸,并且X(2)是在2个邻接位置上的任何氨基酸。
25.权利要求21的纤维素分解酶组合物,其中所述具有增强纤维素分解活性的多肽选自下组:
(a)多肽,其包含与SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18或SEQ ID NO:20、SEQ ID NO:22或SEQ ID NO:24的成熟多肽具有优选至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的氨基酸序列;
(b)由多核苷酸编码的多肽,所述多核苷酸在优选至少中严紧条件,更优选至少中-高严紧条件,并且最优选至少高严紧条件下与以下杂交:(i)SEQIINO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21或SEQ ID NO:23的成熟多肽编码序列,(ii)包含在SEQ IDNO:11、SEQ ID NO:13、SEQ ID NO:15或SEQ ID NO:21的成熟多肽编码序列中的cDNA序列,或者包含SEQ ID NO:17、SEQ ID NO:19或SEQ IDNO:23的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;
(c)多肽,其由包含与SEQ ID NO:11、SEQ ID NO:13、SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21或SEQ ID NO:23的成熟多肽编码序列具有优选至少70%,更优选至少75%,甚至更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,并且最优选至少95%序列同一性的核苷酸序列的多核苷酸编码;和
(d)变体,其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQIDNO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18或SEQ ID NO:20、SEQ ID NO:22或SEQ ID NO:24的成熟多肽。
26.权利要求21的纤维素分解酶组合物,其中所述具有增强纤维素分解的活性的多肽包含或其组成为SEQ ID NO:12、SEQ ID NO:14、SEQ ID NO:16、SEQ ID NO:18或SEQ ID NO:20、SEQ ID NO:22或SEQ ID NO:24的成熟多肽;或者其具有增强纤维素分解的活性的片段。
27.权利要求21的纤维素分解酶组合物,其中所述具有增强纤维素分解的活性的多肽由多核苷酸编码,该多核苷酸包含在大肠杆菌NRRL B-30699中所含的质粒pEJG120中,在大肠杆菌NRRL B-30813中所含的质粒pTter61C中,在大肠杆菌NRRL B-30812中所含的质粒pTter61D中,在大肠杆菌NRRL B-30814中所含的质粒pTter61E中,在大肠杆菌NRRL B-30811中所含的质粒pTter61G中,在大肠杆菌NRRL B-30704中所含的质粒pDZA2-7中或者在大肠杆菌NRRL B-30878中所含的质粒pTr3337中。
28.权利要求21-27中任一项的纤维素分解酶组合物,其进一步包含有效量的一种或多种(几种)具有β-葡糖苷酶活性的多肽。
29.权利要求21-28中任一项的纤维素分解酶组合物,进一步包含有效量的选自下组中的一种或多种(几种)酶:半纤维素酶、酯酶、蛋白酶、漆酶和过氧化物酶或者其混合物。
CN200880024110A 2007-05-10 2008-05-09 用于增强含纤维素材料的降解或转化的组合物和方法 Pending CN101855345A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510280545.7A CN104962537A (zh) 2007-05-10 2008-05-09 用于增强含纤维素材料的降解或转化的组合物和方法

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US91720807P 2007-05-10 2007-05-10
US60/917,208 2007-05-10
PCT/US2008/005927 WO2008140749A2 (en) 2007-05-10 2008-05-09 Compositions and methods for enhancing the degradation or conversion of cellulose-containing material

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN201510280545.7A Division CN104962537A (zh) 2007-05-10 2008-05-09 用于增强含纤维素材料的降解或转化的组合物和方法

Publications (1)

Publication Number Publication Date
CN101855345A true CN101855345A (zh) 2010-10-06

Family

ID=39672097

Family Applications (2)

Application Number Title Priority Date Filing Date
CN200880024110A Pending CN101855345A (zh) 2007-05-10 2008-05-09 用于增强含纤维素材料的降解或转化的组合物和方法
CN201510280545.7A Pending CN104962537A (zh) 2007-05-10 2008-05-09 用于增强含纤维素材料的降解或转化的组合物和方法

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201510280545.7A Pending CN104962537A (zh) 2007-05-10 2008-05-09 用于增强含纤维素材料的降解或转化的组合物和方法

Country Status (6)

Country Link
US (3) US8999696B2 (zh)
EP (1) EP2069491B1 (zh)
CN (2) CN101855345A (zh)
BR (1) BRPI0811465A2 (zh)
DK (1) DK2069491T3 (zh)
WO (1) WO2008140749A2 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103261430A (zh) * 2010-12-20 2013-08-21 纳幕尔杜邦公司 靶向过水解酶
CN103502444A (zh) * 2011-03-17 2014-01-08 丹尼斯科美国公司 糖基水解酶及其在生物质水解方面的用途
CN112272701A (zh) * 2018-04-19 2021-01-26 诺维信公司 稳定化的纤维素酶变体
CN113215135A (zh) * 2021-06-17 2021-08-06 福建中烟工业有限责任公司 一种内切葡聚糖酶在卷烟原料改良中的应用

Families Citing this family (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1980953B (zh) * 2004-01-30 2014-12-24 诺维信股份有限公司 具有分解纤维增强活性的多肽及其编码多核苷酸
US9012186B2 (en) 2009-04-27 2015-04-21 The Board Of Trustees Of The University Of Illinois Hemicellulose-degrading enzymes
AU2010253848C1 (en) * 2009-05-29 2015-02-19 Novozymes, Inc. Methods for enhancing the degradation or conversion of cellulosic material
JP5745404B2 (ja) 2009-07-03 2015-07-08 Meiji Seikaファルマ株式会社 2種類の異なる微生物に由来するエンドグルカナーゼを含んでなるセルラーゼ調製物
CA2767169A1 (en) 2009-07-07 2011-01-13 Novozymes, Inc. Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
DK3296394T3 (da) 2009-09-23 2020-12-21 Danisco Us Inc Hidtil ukendte glycosylhydrolaseenzymer og anvendelser heraf
EP2977382A3 (en) * 2009-09-30 2016-05-11 Novozymes Inc. Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
CN102041252B (zh) * 2009-10-26 2015-12-02 复旦大学 高效内切葡聚糖酶RuCelB,其编码基因、制备方法与应用
DK2496694T3 (en) * 2009-11-06 2017-06-06 Novozymes Inc COMPOSITIONS FOR SACCHARIFYING CELLULOS MATERIAL
AU2010333801B2 (en) 2009-12-23 2015-12-17 Danisco Us Inc. Methods for improving the efficiency of simultaneous saccharification and fermentation reactions
CN102939376B (zh) * 2010-03-31 2016-07-06 明治制果药业株式会社 新纤维素酶基因
US9598700B2 (en) 2010-06-25 2017-03-21 Agrivida, Inc. Methods and compositions for processing biomass with elevated levels of starch
US10443068B2 (en) 2010-06-25 2019-10-15 Agrivida, Inc. Plants with engineered endogenous genes
ES2628345T3 (es) * 2010-06-29 2017-08-02 Dsm Ip Assets B.V. Polipéptido que tiene o que ayuda en la actividad de degradación de materiales glucídicos y usos del mismo
EP2405008A1 (en) * 2010-07-06 2012-01-11 LanthioPep B.V. Bacterial surface display of thioether-bridge-containing peptides
MX2013007048A (es) * 2010-12-30 2013-07-29 Novozymes As Metodo para el tratamiento de textiles con endoglucanasa.
CN106244622B (zh) 2011-03-07 2020-06-12 谷万达公司 在工程植物中表达多种蛋白的表达盒和表达载体及制备工程植物和生产可溶性糖的方法
RU2013146245A (ru) 2011-03-17 2015-04-27 ДАНИСКО ЮЭс ИНК. Способ уменьшения вязкости в процессе осахаривания
EP2780450A4 (en) * 2011-11-15 2015-09-09 Novozymes Inc POLYPEPTIDES HAVING CELLOBIOHYDROLASE ACTIVITY AND POLYNUCLEOTIDES ENCODING SAME
US9738874B2 (en) * 2011-12-16 2017-08-22 Novozymes Inc. Polypeptides having laccase activity and polynucleotides encoding same
JP5844823B2 (ja) 2012-01-06 2016-01-20 本田技研工業株式会社 糖化酵素組成物及びそれを用いる糖化溶液の製造方法
FI124477B (en) 2012-06-07 2014-09-15 Roal Oy New proteins for the treatment of cellulose materials
US9458440B2 (en) 2012-06-07 2016-10-04 Roal Oy Proteins for the treatment of cellulosic material
US8759040B1 (en) * 2013-02-12 2014-06-24 Novozymes Inc. Polypeptides having cellobiohydrolase activity and polynucleotides encoding same

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU1890095A (en) 1994-03-08 1995-09-25 Novo Nordisk A/S Novel alkaline cellulases
US7883872B2 (en) * 1996-10-10 2011-02-08 Dyadic International (Usa), Inc. Construction of highly efficient cellulase compositions for enzymatic hydrolysis of cellulose
DK1117808T3 (da) 1998-10-06 2005-04-25 Mark Aaron Emalfarb Transformaationssystem inden jfjor området filamentöse svampeværter: I chrysosporium
WO2001025468A1 (en) 1999-10-06 2001-04-12 Mark Aaron Emalfarb High-throughput screening of expressed dna libraries in filamentous fungi
CA2405954C (en) 2000-04-13 2015-06-30 Mark Aaron Emalfarb Novel expression-regulating sequences and expression products in the field of filamentous fungi
WO2003000941A2 (en) 2001-06-26 2003-01-03 Novozymes A/S Polypeptides having cellobiohydrolase i activity and polynucleotides encoding same
CN1980953B (zh) 2004-01-30 2014-12-24 诺维信股份有限公司 具有分解纤维增强活性的多肽及其编码多核苷酸
EP1733033B1 (en) 2004-02-06 2012-06-20 Novozymes Inc. Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
BRPI0616721A2 (pt) * 2005-09-30 2011-06-28 Novozymes Inc métodos para degradar ou converter um material celulósico e para produzir uma substáncia, e, composição detergente

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103261430A (zh) * 2010-12-20 2013-08-21 纳幕尔杜邦公司 靶向过水解酶
CN103502444A (zh) * 2011-03-17 2014-01-08 丹尼斯科美国公司 糖基水解酶及其在生物质水解方面的用途
CN112272701A (zh) * 2018-04-19 2021-01-26 诺维信公司 稳定化的纤维素酶变体
CN113215135A (zh) * 2021-06-17 2021-08-06 福建中烟工业有限责任公司 一种内切葡聚糖酶在卷烟原料改良中的应用

Also Published As

Publication number Publication date
WO2008140749A2 (en) 2008-11-20
US8999696B2 (en) 2015-04-07
US9914946B2 (en) 2018-03-13
EP2069491A2 (en) 2009-06-17
US20170218413A1 (en) 2017-08-03
US9631213B2 (en) 2017-04-25
WO2008140749A3 (en) 2009-01-15
US20100143967A1 (en) 2010-06-10
EP2069491B1 (en) 2018-01-03
CN104962537A (zh) 2015-10-07
US20150197781A1 (en) 2015-07-16
BRPI0811465A2 (pt) 2014-10-14
DK2069491T3 (en) 2018-04-09

Similar Documents

Publication Publication Date Title
US9914946B2 (en) Polypeptides having xylanase activity and polynucleotides encoding same
CN101809150B (zh) 提高多肽的纤维素分解增强活性的方法
CN105886485B (zh) β-葡糖苷酶变体及其编码多核苷酸
CN103534348B (zh) 具有纤维二糖水解酶活性的多肽和编码该多肽的多核苷酸
CN102459582B (zh) 用于增强纤维素材料降解或转化的方法
CN102112604B (zh) 具有乙酰木聚糖酯酶活性的多肽和编码该多肽的多核苷酸
CN102482680B (zh) 具有木聚糖酶活性的多肽和编码该多肽的多核苷酸
CN101952421A (zh) 具有内切葡聚糖酶活性的多肽和编码所述多肽的多核苷酸
CN101970471A (zh) 具有纤维素分解增强活性的多肽和编码该多肽的多核苷酸
CN101952304A (zh) 具有纤维素分解增强活性的多肽和编码该多肽的多核苷酸
CN102365360A (zh) 具有乙酰木聚糖酯酶活性的多肽和编码该多肽的多核苷酸
CN101945889A (zh) 具有纤维素分解增强活性的多肽和编码该多肽的多核苷酸
CN102918151B (zh) 纤维二糖水解酶变体及编码其的多核苷酸
CN101784659A (zh) 具有纤维素分解增强活性的多肽和编码它的多核苷酸
CN102388134A (zh) 具有β-葡糖苷酶活性的多肽和编码该多肽的多核苷酸
CN107338233A (zh) 具有木聚糖酶活性的多肽和编码该多肽的多核苷酸
CN103270165A (zh) 包含具有纤维素分解增强活性的多肽和醌化合物的组合物及其用途
CN101952420A (zh) 具有纤维素分解增强活性的多肽和编码该多肽的多核苷酸
CN104480088A (zh) 具有纤维二糖水解酶活性的多肽和编码该多肽的多核苷酸
CN102597228A (zh) 纤维二糖水解酶变体及编码其的多核苷酸
CN101910405A (zh) 降低鞣质对酶促水解纤维素材料的抑制作用的方法
CN101910406A (zh) 减少氧化还原活性金属离子对纤维素材料酶水解抑制作用的方法
CN102016016A (zh) 具有β-葡糖苷酶活性的多肽和编码该多肽的多核苷酸
US8609932B2 (en) Polypeptides having endoglucanase activity and polynucleotides encoding same

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20101006