CN101970651B - 用于降解纤维素材料的组合物 - Google Patents

用于降解纤维素材料的组合物 Download PDF

Info

Publication number
CN101970651B
CN101970651B CN2008801013711A CN200880101371A CN101970651B CN 101970651 B CN101970651 B CN 101970651B CN 2008801013711 A CN2008801013711 A CN 2008801013711A CN 200880101371 A CN200880101371 A CN 200880101371A CN 101970651 B CN101970651 B CN 101970651B
Authority
CN
China
Prior art keywords
seq
mature polypeptide
polypeptide
sequence
polypeptide encoded
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2008801013711A
Other languages
English (en)
Other versions
CN101970651A (zh
Inventor
桑德拉·梅里诺
基思·麦克法兰
乔尔·彻里
萨拉·泰特
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Novozymes Inc
Original Assignee
Novozymes Biotech Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Novozymes Biotech Inc filed Critical Novozymes Biotech Inc
Priority claimed from PCT/US2008/065417 external-priority patent/WO2008151079A2/en
Publication of CN101970651A publication Critical patent/CN101970651A/zh
Application granted granted Critical
Publication of CN101970651B publication Critical patent/CN101970651B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N1/00Microorganisms, e.g. protozoa; Compositions thereof; Processes of propagating, maintaining or preserving microorganisms or compositions thereof; Processes of preparing or isolating a composition containing a microorganism; Culture media therefor
    • C12N1/14Fungi; Culture media therefor
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2434Glucanases acting on beta-1,4-glucosidic bonds
    • C12N9/2437Cellulases (3.2.1.4; 3.2.1.74; 3.2.1.91; 3.2.1.150)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/37Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/52Genes encoding for enzymes or proenzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2434Glucanases acting on beta-1,4-glucosidic bonds
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2434Glucanases acting on beta-1,4-glucosidic bonds
    • C12N9/2445Beta-glucosidase (3.2.1.21)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/14Preparation of compounds containing saccharide radicals produced by the action of a carbohydrase (EC 3.2.x), e.g. by alpha-amylase, e.g. by cellulase, hemicellulase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/16Preparation of compounds containing saccharide radicals produced by the action of an alpha-1, 6-glucosidase, e.g. amylose, debranched amylopectin
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/06Ethanol, i.e. non-beverage
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/06Ethanol, i.e. non-beverage
    • C12P7/08Ethanol, i.e. non-beverage produced as by-product or from waste or cellulosic material substrate
    • C12P7/10Ethanol, i.e. non-beverage produced as by-product or from waste or cellulosic material substrate substrate containing cellulosic material
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01004Cellulase (3.2.1.4), i.e. endo-1,4-beta-glucanase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01021Beta-glucosidase (3.2.1.21)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01091Cellulose 1,4-beta-cellobiosidase (3.2.1.91)
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E50/00Technologies for the production of fuel of non-fossil origin
    • Y02E50/10Biofuels, e.g. bio-diesel

Abstract

本发明涉及用于降解或转化含纤维素材料的纤维素分解组合物,和产生与使用所述组合物的方法。所述组合物包含(a)具有增强纤维素分解的活性的多肽,(b)β-葡糖苷酶和(c)选自下组的一个或多个纤维素分解酶:里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II和里氏木霉内切葡聚糖酶I,和它们的变体。

Description

用于降解纤维素材料的组合物
对于在联邦赞助的研究与开发下进行发明的权利声明 
本发明在能源部授予的主合同DE-AC36-98GO10337、NREL分合同No.ZCO-30017-02下得到政府支持。政府对于本发明拥有一定的权利。 
对序列表的引用 
本申请包含计算机可读格式的序列表。在此通过提述将该序列表并入。 
对生物材料的保藏物的引用 
本申请包含对生物材料的保藏物的引用,在此通过提述将所述保藏物并入。 
发明背景 
发明领域
本发明涉及用于降解或转化含纤维素材料的纤维素分解蛋白质组合物和产生与使用所述组合物的方法。 
相关领域描述 
纤维素是简单糖类葡萄糖通过β-1,4-键共价键合的聚合物。许多微生物产生水解β-连接的葡聚糖的酶。这些酶包括内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶。内切葡聚糖酶在随机位置消化纤维素聚合物,将其打开(openingit)以受到纤维二糖水解酶攻击(attack)。纤维二糖水解酶继而从纤维素聚合物的末端释放纤维二糖的分子。纤维二糖是水溶性的β-1,4-连接的葡萄糖二聚体。β-葡糖苷酶将纤维二糖水解成葡萄糖。 
将纤维素原料转化为乙醇具有以下优势:大量原料现成可用,避免燃烧或填埋材料的合意性,和乙醇燃料的清洁性。木材、农业残余物、草本作物和城市固体废物已被认为是用于乙醇生产的原料。这些材料主要由纤维素、半纤维素和木质素组成。一旦将纤维素转化成葡萄糖,葡萄糖将容易地由酵母发酵成乙醇。 
WO 2005/074647披露了来自土生梭孢霉(Thielavia terrestris)的具有增强纤维素分解的活性(celluolytic enhancing activity)的分离的多肽及其多核苷酸。WO 2005/074656披露了来自桔橙嗜热霉(Thermoascus auranticaus)的具有增强纤维素分解的活性的分离的多肽及其多核苷酸。美国公开的申请系列号2007/0077630披露了来自里氏木霉(Trichoderma reesei)的具有增强纤维素分解的活性的分离的多肽及其多核苷酸。 
本领域中的一个优势是提高纤维素分解蛋白质组合物降解或转化纤维素材料的能力。 
本发明涉及降解或转化纤维素材料的能力改进的纤维素分解蛋白质组合物。 
发明简述 
本发明涉及丝状真菌宿主细胞,其包含:(a)编码具有增强纤维素分解的活性的天然或异源多肽的第一多核苷酸;(b)编码天然或异源β-葡糖苷酶的第二多核苷酸;和(c)编码选自下组的天然或异源纤维素分解酶的一个或多个(几个)第三多核苷酸:里氏木霉纤维二糖水解酶I(CEL7A)、里氏木霉纤维二糖水解酶II(CEL6A),和里氏木霉内切葡聚糖酶I(CEL7B),和它们的直向同源物或变体。 
本发明还涉及产生纤维素分解蛋白质组合物的方法,其包括:(a)在有益于产生该纤维素分解组合物的条件下培养这些丝状真菌宿主细胞;和(b)回收所述纤维素分解蛋白质组合物。本发明还涉及由这种方法获得的纤维素分解蛋白质组合物。 
本发明还涉及纤维素分解蛋白质组合物,其包含:(a)具有增强纤维素分解的活性的多肽;(b)β-葡糖苷酶;和(c)选自下组的一种或多种(几种)纤维素分解酶:里氏木霉纤维二糖水解酶I(CEL7A)、里氏木霉纤维二糖水解酶II(CEL6A),和里氏木霉内切葡聚糖酶I(CEL7B),和它们的直向同源物或变体。 
本发明还涉及用于降解或转化纤维素材料的方法,其包括:用有效量的这种纤维素分解蛋白质组合物处理纤维素材料。 
本发明进一步涉及产生发酵产物的方法,其包括:(a)用有效量的这种纤维素分解蛋白质组合物糖化纤维素材料;(b)用一种或多种(几种)发酵微生物发酵步骤(a)中经糖化的纤维素材料,以产生发酵产物;和(c)从发酵液回收所述发酵产物。 
附图简述 
图1显示pMJ04的限制图谱。 
图2显示pCaHj527的限制图谱。 
图3显示pMT2188的限制图谱。 
图4显示pCaHj568的限制图谱。 
图5显示pMJ05的限制图谱。 
图6显示pSMai130的限制图谱。 
图7显示米曲霉(Aspergillus oryzae)β-葡糖苷酶天然信号序列的DNA序列和氨基酸序列(SEQ ID NO:91和92)。 
图8显示特异腐质霉(Humicola insolens)内切葡聚糖酶V信号序列的DNA序列和氨基酸序列(SEQ ID NO:95和96)。 
图9显示pSMai135的限制图谱。 
图10显示pSMai140的限制图谱。 
图11显示pSaMe-F1的限制图谱。 
图12显示pSaMe-FX的限制图谱。 
图13显示pAlLo47的限制图谱。 
图14显示pSaMe-FH的限制图谱。 
定义 
增强纤维素分解的活性:术语“增强纤维素分解的活性”在本文定义为增强具有纤维素分解活性的蛋白对含纤维素材料的水解的生物活性。就本发明而言,通过测量与使用相等总蛋白加样量但不含增强纤维素分解的活性的对照水解(1-50mg的纤维素分解蛋白/g PCS(经预处理的玉米秸秆)中的纤维素)相比,来自在如下条件下纤维素分解蛋白对含纤维素材料的水解的还原糖增加或总的纤维二糖和葡萄糖的增加来确定增强纤维素分解的活性:1-50mg的总蛋白/g PCS中的纤维素,其包含80-99.5%w/w纤维素分解蛋白和0.5-20%w/w增强纤维素分解活性的蛋白,在50℃进行1-7天。在一个优选的方面,在3%米曲霉β-葡糖苷酶(根据WO 02/095014在米曲霉中重组产生)或3%烟曲霉β-葡糖苷酶(根据WO 02/095014的实施例22在米曲霉中重组产生)的存在下 
Figure GPA00001010787100031
1.5L(Novozymes A/S,Bagsvaerd,Denmark)的混合物的纤 维素酶蛋白质加样量用作纤维素分解活性的标准物。 
具有增强纤维素分解的活性的多肽具有SEQ ID NO:2、4、6、8、10、12或14的成熟多肽的增强纤维素分解的活性的至少20%,优选至少40%,更优选至少50%,更优选至少60%,更优选至少70%,更优选至少80%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少100%。 
所述具有增强纤维素分解的活性的多肽通过下述方式增强由具有纤维素分解活性的蛋白质所催化的含纤维素材料的水解:将达到相同水解程度所需要的纤维素分解酶量降低优选至少0.1倍,更优选至少0.2倍、更优选至少0.3倍、更优选至少0.4倍、更优选至少0.5倍、更优选至少1倍、更优选至少3倍、更优选至少4倍、更优选至少5倍、更优选至少10倍、更优选至少20倍、甚至更优选至少30倍、最优选至少50倍、并且甚至最优选至少100倍。 
纤维素分解活性:术语“纤维素分解活性”在本文定义为水解含纤维素材料的纤维素酶活性(如内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶或其组合)。纤维素分解蛋白可水解或水解羧甲基纤维素(CMC),由此降低温育混合物的粘度。可以通过振动粘度计(vibration viscosimeter)(如来自法国Sofraser的MIVI 3000)测定所产生的粘度降低。纤维素酶活性的测定按照纤维素酶粘度单位(CEVU)来测量,所述测定通过测量样品降低羧甲基纤维素(CMC)溶液粘度的能力来定量该样品中存在的催化活性的量。该测定法在适于纤维素分解蛋白质和底物的温度和pH进行。 
就本发明而言,通过测量与不加入纤维素分解蛋白的对照水解相比,在以下条件下纤维素分解组合物对含纤维素材料的水解的增加来测定纤维素分解活性:1-50mg纤维素分解蛋白/g PCS中的纤维素,在50℃进行1-7天。 
内切葡聚糖酶:术语“内切葡聚糖酶”在本文中的定义为内切-1,4-(1,3;1,4)-β-D-葡聚糖4-葡聚糖水解酶(endo-1,4-(1,3;1,4)-β-D-glucan4-glucanohydrolase)(E.C.No.3.2.1.4),其催化纤维素、纤维素衍生物(如羧甲基纤维素和羟乙基纤维素)、地衣淀粉、混合的β-1,3葡聚糖如谷类β-D-葡聚糖或木葡聚糖中的β-1,4键和其它含有纤维素成分的植物材料中1,4-β-D-糖苷键的内水解。就本发明而言,根据Ghose,1987,Pure and Appl.Chem.59:257-268中的方法使用羧甲基纤维素(CMC)水解测定内切葡聚糖酶的活性。 
纤维二糖水解酶:术语“纤维二糖水解酶”在本文中的定义为1,4-β-D-葡聚糖纤维二糖水解酶(E.C.3.2.1.91),其催化纤维素、纤维寡糖或任何包含β-1,4- 连接的葡萄糖的聚合物中1,4-β-D葡糖苷键的水解,从链的还原端或非还原端释放纤维二糖。就本发明而言,根据Lever等,1972,Anal.Biochem.47:273-279和van Tilbeurgh等,1982,FEBS Letters 149:152-156;van Tilbeurgh和Claeyssens,1985,FEBS Letters 187:283-288所描述的方法测定纤维二糖水解酶的活性。在本发明中,使用Lever等方法来评估玉米秸秆中纤维素的水解,同时使用van Tilbeurgh等的方法来测定对于荧光二糖衍生物的纤维二糖水解酶活性。 
β-葡糖苷酶:术语“β-葡糖苷酶”在本文定义为β-D-葡糖苷葡糖水解酶(E.C.3.2.1.21),其催化末端非还原性β-D-葡萄糖残基的水解,并且释放β-D-葡萄糖。就本发明而言,根据Venturi等,2002,J.Basic Microbiol.42:55-66描述的基本方法来测定β-葡糖苷酶活性,只是采用如本文所述的不同的条件。将1单位的β-葡糖苷酶活性定义为在50℃、pH 5,从100mM柠檬酸钠、0.01% 20中作为底物的4mM对硝基苯基-β-D-葡萄吡喃糖苷每分钟产生1.0微摩尔对硝基苯酚。 
家族1、家族3、家族5、家族6、家族7、家族9、家族12、家族45、家族61,或家族74糖苷水解酶:术语“家族1、家族3、家族5、家族6、家族7、家族9、家族12、家族45、家族61,或家族74糖苷水解酶”或“家族GH1、家族GH3、家族GH5、家族GH6、家族GH7、家族GH9、家族GH12、家族GH45、家族GH61,或家族GH74”在本文中定义为根据Henrissat B.,1991,A classification of glycosyl hydrolases based on amino-acid sequence similarities,Biochem.J.280:309-316,和Henrissat B.,和Bairoch A.,1996,Updating thesequence-based classification of glycosyl hydrolases,Biochem.J.316:695-696分别归入糖苷水解酶家族1、家族3、家族5、家族6、家族7、家族9、家族12、家族45、家族61,或家族74的多肽。目前,Henrissat将GH61家族列为未分类,说明对于属于此家族的多肽而言,诸如机制、催化亲核体/碱、催化质子供体和3-D结构等性质是未知的。 
含纤维素材料:生物质的初生细胞壁中的主要多糖是纤维素,第二丰富的多糖是半纤维素,而第三是果胶。在细胞停止生长之后产生的次生细胞壁也含有多糖,并且其通过与半纤维素共价交联的聚合木质素强化。纤维素是无水纤维二糖的均聚物,并且因此是线性的β-(1-4)-D-葡聚糖,而半纤维素在具有一系列取代基的复杂分支结构中包括多种化合物,例如木聚糖、木葡聚 糖、阿拉伯木聚糖和甘露聚糖。尽管通常是多形态的,纤维素在植物组织中主要作为平行葡聚糖链的不溶晶体基质存在。半纤维素通常与纤维素以及与其它半纤维素通过氢键连接,其帮助稳定细胞壁基质。 
含纤维素材料可以是任何含纤维素的材料。纤维素通常存在于例如植物的茎、叶、果/种壳(hulls)、果/种皮(husks)、和穗轴(cob)中,或树的叶、枝和木材中。含纤维素材料可以是但不限于草本材料、农业残余物、林业残余物、市政固体废物、废纸和纸浆及造纸厂残余物。含纤维素材料可以是任意类型的生物质,其包括但不限于木材资源、市政固体废物、废纸、作物和作物残余物(参见,例如,Wiselogel等,1995,于Handbook on Bioethanol(Charles E.Wyman编)中,105-118页,Taylor & Francis,Washington D.C.;Wyman,1994,Bioresource Technology 50:3-16;Lynd,1990,Applied Biochemistry andBiotechnology 24/25:695-719;Mosier等,1999,Recent Progress in Bioconversionof Lignocellulosics,于Advances in Biochemical Engineering/Biotechnology,T.Scheper,managing编,Volume 65,23-40页,Springer-Verlag,New York)。在本文中可理解的是含纤维素材料优选为木素纤维素的形式,例如,在混合基质中含有木质素、纤维素和半纤维素的植物细胞壁材料。 
在优选的方面,含纤维素材料是玉米秸秆。在另一个优选的方面,含纤维素材料是玉米纤维。在另一个优选的方面,含纤维素材料是玉米穗轴。在另一个优选的方面,含纤维素材料是柳枝稷(switch grass)。在另一个优选的方面,含纤维素材料是稻草(rice straw)。在另一优选的方面,含纤维素材料是纸和纸浆加工废料。在另一优选的方面,含纤维素材料是木本或草本植物。在另一优选的方面,纤维素材料是蔗渣。 
可以按原样使用含纤维素材料或可使用本领域已知的常规方法对含纤维素材料进行预处理。例如,物理预处理技术可包括多种类型的磨制、照射、汽蒸/蒸汽爆炸和水热解(hydrothermolysis);化学预处理技术可包括稀酸、碱、有机溶剂、氨、二氧化硫、二氧化碳和pH控制的水热解;而生物预处理技术可包括应用溶解木质素的微生物(参见,例如,Hsu,T.-A.,1996,Pretreatmentof biomass,于Handbook on Bioethanol:Production and Utilization,Wyman,C.E.编,Taylor & Francis,Washington,DC,179-212;Ghosh,P.,和Singh,A.,1993,Physicochemical and biological treatments for enzymatic/microbial conversion oflignocellulosic biomass,Adv.Appl.Microbiol.39:295-333;McMillan,J.D.,1994, Pretreating lignocellulosic biomass:a review,in Enzymatic Conversion of Biomassfor Fuels Production,Himmel,M.E.,Baker,J.O.,和Overend,R.P.编,ACSSymposium Series 566,American Chemical Society,Washington,DC,chapter 15;Gong,C.S.,Cao,N.J.,Du,J.,和Tsao,G.T.,1999,Ethanol production fromrenewable resources,于Advances in Biochemical Engineering/Biotechnology,Scheper,T.编,Springer-Verlag Berlin Heidelberg,Germany,65:207-241;Olsson,L.,和Hahn-Hagerdal,B.,1996,Fermentation of lignocellulosic hydrolysates forethanol production,Enz.Microb.Tech.18:312-331;以及Vallander,L.,和Eriksson,K.-E.L.,1990,Production of ethanol from lignocellulosic materials:State of theart,Adv.Biochem.Eng./Biotechnol.42:63-95)。 
预处理的玉米秸秆:术语“PCS”或“预处理的玉米秸秆”在本文中的定义为源自通过热和稀酸处理的玉米秸秆的含纤维素的材料。就本发明而言,PCS由本文所述方法产生。 
全长多肽:术语“全长多肽”在本文定义为具有生物活性的多肽的前体形式,其中所述前体包含信号肽区域,或者还包含前肽区,其中一旦从细胞分泌,信号肽即被切割,或者前肽也被切割,得到具有生物活性的多肽。 
信号肽:术语“信号肽”在本文定义为以符合读框的方式连接至多肽的氨基末端并指导编码的多肽进入细胞的分泌途径的肽。 
信号肽编码序列:术语“信号肽编码序列”在本文定义为肽编码区,其编码以符合读框的方式连接至多肽的氨基末端并指导编码的多肽进入细胞的分泌途径的氨基酸序列。 
前肽:术语“前肽”在本文定义为以符合读框的方式连接至多肽的氨基末端的肽。得到的多肽称作前酶或前多肽(或者在一些情况中为酶原)。前多肽通常没有活性,并且可以通过前肽的催化或自催化裂解由前多肽转化为成熟活性多肽。当多肽的氨基末端同时存在信号肽和前肽区时,前肽区以符合读框的方式连接至多肽的氨基末端,并且信号肽以符合读框的方式连接至前肽区的氨基末端。 
前肽编码序列:术语“前肽编码序列”在本文定义为肽编码区,其编码以符合读框的方式连接至多肽的氨基末端的氨基酸序列,形成前酶或前多肽(或者在一些情况中为酶原)。 
催化域:术语“催化域”在本文定义为β-葡糖苷酶或内切葡聚糖酶的氨 基序列的结构部分或区域,其具有β-葡糖苷酶或内切葡聚糖酶的催化活性。 
β-葡糖苷酶融合蛋白:术语“β-葡糖苷酶融合蛋白”在本文定义为表现出β-葡糖苷酶活性并至少包含β-葡糖苷酶催化域和内切葡聚糖酶催化域的多肽。 
β-葡糖苷酶融合蛋白的组件:术语“β-葡糖苷酶融合蛋白的组件”在本文定义为β-葡糖苷酶融合蛋白的个体(切割的)片段,其中每个片段都具有β-葡糖苷酶活性,并且包括内切葡聚糖酶和β-葡糖苷酶催化域或者融合蛋白的β-葡糖苷酶催化域。例如,在融合蛋白的内切葡聚糖酶和β-葡糖苷酶组件之间存在裂解位点,例如,Kex2位点,能够导致产生具有内切葡聚糖酶活性的多肽和另一个具有β-葡糖苷酶活性的多肽。 
纤维素结合域:术语“纤维素结合域(CBD)”在本文定义为内切葡聚糖酶(纤维素酶)的部分氨基酸序列,其与内切葡聚糖酶的纤维素结合活性有关。纤维素结合域通常通过将内切葡聚糖酶非共价连接至纤维素、纤维素衍生物,或其多糖等同物而发挥作用。CBD通常独立于催化域发挥作用。 
β-葡糖苷酶融合构建体:“术语β-葡糖苷酶融合构建体”指由可操作连接的不同基因或其部分组成的核酸构建体。组件从5’末端开始包括至少包含内切葡聚糖酶催化域的DNA分子,和至少包含β-葡糖苷酶催化域的DNA分子。 
分离的多肽:术语“分离的多肽”用于本文中指的是从来源分离的多肽。在优选的方面,如通过SDS-PAGE测定的,多肽至少1%纯,优选至少5%纯,更优选至少10%纯,更优选至少20%纯,更优选至少40%纯,更优选至少60%纯,甚至更优选至少80%纯,以及最优选至少90%纯。 
基本上纯的多肽:术语“基本上纯的多肽”在本文表示多肽制备物,所述多肽制备物按重量计含有至多10%,优选至多8%,更优选至多6%,更优选至多5%,更优选至多4%,更优选至多3%,甚至更优选至多2%,最优选至多1%,并且甚至最优选至多0.5%的与其天然结合的(associated)或重组结合的其它多肽材料。因此,优选所述基本上纯的多肽是按存在于制备物中的全部多肽材料的重量计至少92%纯,优选至少94%纯,更优选至少95%纯,更优选至少96%纯,更优选至少96%纯,更优选至少97%纯,更优选至少98%纯,甚至更优选至少99%纯,最优选至少99.5%纯,并且甚至最优选100%纯。本发明的多肽优选是基本上纯的形式,即,所述多肽制备物基本上(essentially)不含与其天然结合的或重组结合的其它多肽材料。这能够通过以下方法实现, 例如,通过公知的重组方法或由经典纯化方法制备多肽。 
成熟多肽:术语“成熟多肽”在本文中定义为具有生物活性(如酶活性)的多肽,所述多肽以其在翻译和任何翻译后修饰之后的最终形式存在,所述修饰例如N-末端加工、C-末端截短、糖基化、磷酸化等。 
成熟多肽编码序列:术语“成熟多肽编码序列”在本文中定义为编码具有生物活性的成熟多肽的核苷酸序列。 
同一性:参数“同一性”描述两个氨基酸序列之间或两个核苷酸序列之间的相关性。 
就本发明而言,两个氨基酸序列之间的同一性程度使用EMBOSS程序包(EMBOSS:The European Molecular Biology Open Software Suite,Rice等,2000,Trends in Genetics 16:276-277)的Needle程序中执行的Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48:443-453)来测定,优选版本3.0或更新的版本。使用的可选参数是缺口开启罚分(gap open penalty)10,缺口延伸罚分(gap extension penalty)0.5和EBLOSUM62(BLOSUM62的EMBOSS版本)取代矩阵。使用Needle标记为“最长同一性”(使用-nobrief选项得到)的输出作为百分比同一性并且计算如下: 
(相同的残基×100)/(比对的长度-比对中的缺口总数) 
就本发明而言,两个脱氧核糖核酸序列之间的同一性程度使用EMBOSS程序包(EMBOSS:The European Molecular Biology Open Software Suite,Rice等,2000,见上文)的Needle程序中执行的Needleman-Wunsch算法(Needleman和Wunsch,1970,见上文)来测定,优选版本3.0或更新的版本。使用的可选参数是缺口开启罚分10,缺口延伸罚分0.5和EDNAFULL(NCBI NUC4.4的EMBOSS版本)取代矩阵。使用Needle标记为“最长同一性”(使用-nobrief选项得到)的输出作为百分比同一性并且如下计算: 
(相同的脱氧核糖核苷酸×100)/(比对的长度-比对中的缺口总数) 
同源序列:术语“同源序列”在本文定义为使用blastp(用于蛋白质数据库)或tblastn(用于核酸数据库)算法,及BLOSUM62矩阵、字长(wordsize)3、缺口存在分值(gap existence cost)11、缺口延伸分值(gap extension cost)1、无低复杂性过滤并且使用成熟蛋白序列作为查询对象时,E值(或期望得分(expectancy score))小于0.001的序列。参见Altschul等,1997,Nucleic Acids Res.25:3389-3402。 
多肽片段:术语“多肽片段”在本文中定义为从成熟多肽的氨基和/或羧基末端缺失一个或多个(几个)氨基酸的多肽,或者其同源序列;其中所述片段具有其成熟多肽的活性。 
亚序列:术语“亚序列(subsequence)”在本文中定义为从成熟多肽编码序列的5’和/或3’端缺失一个或多个(几个)核苷酸的核苷酸序列,或其同源序列;其中所述亚序列编码具有其成熟多肽的活性的多肽片段。 
等位变体(allelic variant):术语“等位变体”在本文中表示占据相同染色体基因座的基因的任何两种或两种以上可选形式。等位变异通过突变天然地发生,并且可导致种群内的多态性。基因突变可以是沉默的(在编码的多肽中无变化)或可以编码具有改变的氨基酸序列的多肽。多肽的等位变体是由基因的等位变体编码的多肽。 
分离的多核苷酸:术语“分离的多核苷酸”用于本文中指与来源分离的多核苷酸。在优选的方面,如通过琼脂糖电泳测定的,所述多核苷酸为至少1%纯,优选至少5%纯,更优选至少10%纯,更优选至少20%纯,更优选至少40%纯,更优选至少60%纯,甚至更优选至少80%纯,以及最优选至少90%纯。 
基本上纯的多核苷酸:术语“基本上纯的多核苷酸”用于本文指不含其它外来的或不期望的核苷酸的多核苷酸制备物,并且所述多核苷酸制备物处于适合于在遗传工程的蛋白质生产体系中使用的形式。因此,基本上纯的多核苷酸含有按重量计至多10%,优选至多8%,更优选至多6%,更优选至多5%,更优选至多4%,更优选至多3%,甚至更优选至多2%,最优选至多1%,并且甚至最优选至多0.5%的与其天然结合的或重组结合的其它多核苷酸材料。然而,基本上纯的多核苷酸可以包括天然存在的5’和3’非翻译区,例如启动子和终止子。优选基本上纯的多核苷酸是按重量计至少90%纯,优选至少92%纯,更优选至少94%纯,更优选至少95%纯,更优选至少96%纯,更优选至少97%纯,甚至更优选至少98%纯,最优选至少99%,并且甚至最优选至少99.5%纯的。本发明所述多核苷酸优选为基本上纯的形式,即,所述多核苷酸制备物基本上不含与其天然结合的或重组结合的其它多核苷酸材料。所述多核苷酸可以是基因组、cDNA、RNA、半合成、合成来源的,或它们的任意组合。 
cDNA:术语“cDNA”在本文中定义为能够通过逆转录从得自真核细胞的成熟的、已剪接的mRNA分子制备的DNA分子。cDNA缺少通常存在于相应基因组DNA中的内含子序列。起始的(initial)、初级的RNA转录物是mRNA 的前体,其通过一系列的步骤加工然后作为成熟的已剪接的mRNA出现。这些步骤包括通过称为剪接的过程去除内含子序列。因而源自mRNA的cDNA没有任何内含子序列。 
核酸构建体:术语“核酸构建体”用于本文指单链或双链的核酸分子,所述核酸分子分离自天然存在的或者合成的基因,或所述核酸分子以本来不存在于(not otherwise exist)自然界中的方式被修饰以含有核酸的片段,或所述核酸分子是合成的。当所述核酸构建体含有表达本发明中的编码序列所需的调控序列时,术语核酸构建体与术语“表达盒”同义。 
调控序列(control sequence):术语“调控序列”在本文定义为包括对于本发明中编码多肽的多核苷酸的表达是必需的所有组分。各调控序列对于编码所述多肽的核苷酸序列可以是天然的或外源的,或各调控序列对于彼此可以是天然的或外源的。这些调控序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。最少的情况,调控序列包括启动子和转录和翻译的终止信号。调控序列可以和用于引入特异性限制位点的接头一起提供,所述特异性限制位点促进调控序列与编码多肽的核苷酸序列编码区的连接。 
可操作地连接:术语“可操作地连接”在本文表示这样的构型,其中将调控序列置于相对于多核苷酸序列的编码序列的合适位置,使得调控序列指导多肽的编码序列的表达。 
编码序列:当用于本文时术语“编码序列”的意思是直接指定其蛋白产物的氨基酸序列的核苷酸序列。编码序列的边界通常由开读框确定,所述开读框通常以ATG起始密码子或可选的起始密码子例如GTG和TTG开始,并且以终止密码子如TAA、TAG和TGA结束。编码序列可以是DNA、cDNA、合成的或重组的核苷酸序列。 
表达:术语“表达”包括涉及多肽产生的任何步骤,其包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。 
表达载体:术语“表达载体”在本文定义为线性的或环状的DNA分子,其包含编码本发明多肽的多核苷酸,并且所述多核苷酸与提供用于其表达的额外核苷酸可操作地连接。 
宿主细胞:如本文中所使用的术语“宿主细胞”包括任何细胞类型,所述细胞类型对于用包含多核苷酸的核酸构建体或表达载体的转化、转染、转 导等是易感的(susceptible)。 
修饰:术语“修饰”在本文的意思是,对成熟多肽或其同源序列的任何化学修饰,以及对编码这种多肽的DNA的遗传操作。所述修饰可以是一个或多个(几个)氨基酸的取代、缺失和/或插入,以及一个或多个(几个)氨基酸侧链的取代。 
人工变体:当用在本文时,术语“人工变体”的意思是由表达成熟多肽编码序列的修饰的核苷酸序列或其同源序列的生物体产生的多肽。所述修饰的核苷酸序列通过人为干预(human intervention),通过修饰多核苷酸序列或其同源序列来获得。 
发明详述 
本发明涉及丝状真菌宿主细胞,其包含:(a)编码具有增强纤维素分解的活性的天然或异源多肽的第一多核苷酸;(b)编码天然或异源β-葡糖苷酶的第二多核苷酸;和(c)编码选自下组的天然或异源的一个或多个(几个)纤维素分解酶的一个或多个(几个)第三多核苷酸:里氏木霉纤维二糖水解酶I(CEL7A),里氏木霉纤维二糖水解酶II(CEL6A),和里氏木霉内切葡聚糖酶I(CEL7B),和它们的直向同源物或变体。 
本发明还涉及产生纤维素分解蛋白质组合物的方法,其包括:(a)有益于产生所述纤维素分解蛋白质组合物的条件下培养这样的丝状真菌宿主细胞;和(b)回收所述纤维素分解蛋白质组合物。本发明还涉及由这种方法获得的纤维素分解蛋白质组合物。 
本发明还涉及纤维素分解蛋白质组合物,其包含:(a)具有增强纤维素分解的活性的多肽;(b)β-葡糖苷酶;和(c)选自下组的一个或多个(几个)纤维素分解酶:里氏木霉纤维二糖水解酶I(CEL7A),里氏木霉纤维二糖水解酶II(CEL6A),和里氏木霉内切葡聚糖酶I(CEL7B),和它们的直向同源物或变体。 
在优选的方面,丝状真菌宿主细胞产生包含下述的纤维素分解蛋白质组合物:SEQ ID NO:8的成熟多肽的具有增强纤维素分解的活性的多肽;SEQID NO:106的β-葡糖苷酶融合蛋白;SEQ ID NO:52的成熟多肽的里氏木霉纤维二糖水解酶I(CEL7A),SEQ ID NO:54的成熟多肽的里氏木霉纤维二糖水解酶II(CEL6A),和SEQ ID NO:56的成熟多肽的里氏木霉内切葡聚糖酶I(CEL7B)。在优选的方面,丝状真菌宿主细胞是里氏木霉,特别是里氏木霉 RutC30。 
在另一个优选的方面,丝状真菌宿主细胞产生包含下述的纤维素分解蛋白质组合物:SEQ ID NO:8的成熟多肽的具有增强纤维素分解的活性的多肽;SEQ ID NO:106的β-葡糖苷酶融合蛋白;SEQ ID NO:52的成熟多肽的里氏木霉纤维二糖水解酶I(CEL7A),SEQ ID NO:54的成熟多肽的里氏木霉纤维二糖水解酶II(CEL6A),和SEQ ID NO:56的成熟多肽的里氏木霉内切葡聚糖酶I(CEL7B),并且进一步产生选自下组的一个或多个(几个)酶:SEQ ID NO:58的成熟多肽的里氏木霉内切葡聚糖酶II(CEL5A),SEQ ID NO:62的成熟多肽的里氏木霉内切葡聚糖酶V(CEL45A),和SEQ ID NO:60的成熟多肽的里氏木霉内切葡聚糖酶III(CEL12A)。在另一个优选的方面,丝状真菌宿主细胞是里氏木霉,特别是里氏木霉RutC30。 
在另一个优选的方面,丝状真菌宿主细胞产生包含下述的纤维素分解蛋白质组合物:SEQ ID NO:8的成熟多肽的具有增强纤维素分解的活性的多肽;SEQ ID NO:106的β-葡糖苷酶融合蛋白;SEQ ID NO:52的成熟多肽的里氏木霉纤维二糖水解酶I(CEL7A),SEQ ID NO:54的成熟多肽的里氏木霉纤维二糖水解酶II(CEL6A),和SEQ ID NO:56的成熟多肽的里氏木霉内切葡聚糖酶I(CEL7B),并且还产生SEQ ID NO:64的成熟多肽的土生梭孢霉纤维二糖水解酶。在另一个优选的方面,丝状真菌宿主细胞是里氏木霉,特别是里氏木霉RutC30。 
在另一个优选的方面,丝状真菌宿主细胞产生包含下述的纤维素分解蛋白质组合物:SEQ ID NO:8的成熟多肽的具有增强纤维素分解的活性的多肽;SEQ ID NO:106的β-葡糖苷酶融合蛋白;SEQ ID NO:52的成熟多肽的里氏木霉纤维二糖水解酶I(CEL7A),SEQ ID NO:54的成熟多肽的里氏木霉纤维二糖水解酶II(CEL6A),和SEQ ID NO:56的成熟多肽的里氏木霉内切葡聚糖酶I(CEL7B),并且进一步产生(1)选自下组的一个或多个(几个)酶:SEQ IDNO:58的成熟多肽的里氏木霉内切葡聚糖酶II(CEL5A),SEQ ID NO:62的成熟多肽的里氏木霉内切葡聚糖酶V(CEL45A),和SEQ ID NO:60的成熟多肽的里氏木霉内切葡聚糖酶III(CEL12A),和/或(2)还产生SEQ ID NO:64的成熟多肽的土生梭孢霉纤维二糖水解酶。在另一个优选的方面,丝状真菌宿主细胞是里氏木霉,特别是里氏木霉RutC30。 
在另一个优选的方面,纤维素分解蛋白质组合物包含:SEQ ID NO:8的 成熟多肽的具有增强纤维素分解的活性的多肽;SEQ ID NO:106的β-葡糖苷酶融合蛋白;SEQ ID NO:52的成熟多肽的里氏木霉纤维二糖水解酶I(CEL7A),SEQ ID NO:54的成熟多肽的里氏木霉纤维二糖水解酶II(CEL6A),和SEQ ID NO:56的成熟多肽的里氏木霉内切葡聚糖酶I(CEL7B)。 
在另一个优选的方面,纤维素分解蛋白质组合物包含:SEQ ID NO:8的成熟多肽的具有增强纤维素分解的活性的多肽;SEQ ID NO:106的β-葡糖苷酶融合蛋白;SEQ ID NO:52的成熟多肽的里氏木霉纤维二糖水解酶I(CEL7A),SEQ ID NO:54的成熟多肽的里氏木霉纤维二糖水解酶II(CEL6A),和SEQ ID NO:56的成熟多肽的里氏木霉内切葡聚糖酶I(CEL7B),并且进一步包含选自下组的一个或多个(几个)酶:SEQ ID NO:58的成熟多肽的里氏木霉内切葡聚糖酶II(CEL5A),SEQ ID NO:62的成熟多肽的里氏木霉内切葡聚糖酶V(CEL45A),和SEQ ID NO:60的成熟多肽的里氏木霉内切葡聚糖酶III(CEL12A)。 
在另一个优选的方面,纤维素分解蛋白质组合物包含:SEQ ID NO:8的成熟多肽的具有增强纤维素分解的活性的多肽;SEQ ID NO:106的β-葡糖苷酶融合蛋白;SEQ ID NO:52的成熟多肽的里氏木霉纤维二糖水解酶I(CEL7A),SEQ ID NO:54的成熟多肽的里氏木霉纤维二糖水解酶II(CEL6A),和SEQ ID NO:56的成熟多肽的里氏木霉内切葡聚糖酶I(CEL7B),并且进一步包含SEQ ID NO:64的成熟多肽的土生梭孢霉纤维二糖水解酶。 
在另一个优选的方面,纤维素分解蛋白质组合物包含:SEQ ID NO:8的成熟多肽的具有增强纤维素分解的活性的多肽;SEQ ID NO:106的β-葡糖苷酶融合蛋白;SEQ ID NO:52的成熟多肽的里氏木霉纤维二糖水解酶I(CEL7A),SEQ ID NO:54的成熟多肽的里氏木霉纤维二糖水解酶II(CEL6A),和SEQ ID NO:56的成熟多肽的里氏木霉内切葡聚糖酶I(CEL7B),并且进一步包含(1)选自下组的一个或多个(几个)酶:SEQ ID NO:58的成熟多肽的里氏木霉内切葡聚糖酶II(CEL5A),SEQ ID NO:62的成熟多肽的里氏木霉内切葡聚糖酶V(CEL45A),和SEQ ID NO:60的成熟多肽的里氏木霉内切葡聚糖酶III(CEL12A),和/或(2)还包含SEQ ID NO:64的成熟多肽的土生梭孢霉纤维二糖水解酶。 
具有增强纤维素分解的活性的多肽及其多核苷酸 
用于处理含纤维素材料的具有增强纤维素分解的活性的任何多肽可以在 本发明的组合物中使用。编码具有增强纤维素分解的活性的这种多肽的多核苷酸能用于产生组合物。 
在第一方面,具有增强纤维素分解的活性的分离的多肽包含以下基序(motif): 
[ILMV]-P-X(4,5)-G-X-Y-[ILMV]-X-R-X-[EQ]-X(4)-[HNQ]和[FW]-[TF]-K-[AIV], 
其中X是任何氨基酸,X(4,5)是在4或5个邻接位置上的任何氨基酸,并且X(4)是在4个邻接位置上的任何氨基酸。 
包含上述基序的分离的多肽可进一步包含: 
H-X(1,2)-G-P-X(3)-[YW]-[AILMV], 
[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV],或 
H-X(1,2)-G-P-X(3)-[YW]-[AILMV]和 
[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV], 
其中X是任何氨基酸,X(1,2)是在1个位置或2个邻接位置上的任何氨基酸,X(3)是在3个邻接位置上的任何氨基酸,并且X(2)是在2个邻接位置上的任何氨基酸。在上述基序中,采用公认的IUPAC单字母氨基酸缩写。 
在优选的实施方案中,具有增强纤维素分解的活性的分离的多肽进一步包含H-X(1,2)-G-P-X(3)-[YW]-[AILMV]。在另一个优选的实施方案中,具有增强纤维素分解的活性的分离的多肽还包含[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV]。在另一个优选的实施方案中,具有增强纤维素分解的活性的分离的多肽还包含H-X(1,2)-G-P-X(3)-[YW]-[AILMV]和[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV]。 
在第二方面,具有增强纤维素分解的活性的分离的多肽包含以下基序: 
[ILMV]-P-x(4,5)-G-x-Y-[ILMV]-x-R-x-[EQ]-x(3)-A-[HNQ], 
其中x是任何氨基酸,x(4,5)是在4或5个邻接位置上的任何氨基酸,并且x(3)是在3个邻接位置上的任何氨基酸。在以上基序中,采用公认的IUPAC单字母氨基酸缩写。 
在第三个方面,具有增强纤维素分解的活性的分离的多肽包含或组成为与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8,或SEQ IDNO:10,SEQ ID NO:12,或SEQ ID NO:14的成熟多肽具有优选至少60%, 更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%,97%,98%,或99%的同一性程度的氨基酸序列,其具有增强纤维素分解的活性(下文中的“同源多肽”)。在优选的方面,所述同源多肽包含或组成为与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8,或SEQ ID NO:10,SEQ ID NO:12,或SEQ ID NO:14的成熟多肽相差十个氨基酸,优选五个氨基酸,更优选四个氨基酸,甚至更优选三个氨基酸,最优选两个氨基酸,并且甚至最优选一个氨基酸的氨基酸序列。 
具有增强纤维素分解的活性的多肽优选包含SEQ ID NO:2的氨基酸序列或其等位变体;或它们的具有增强纤维素分解的活性的片段。在优选的方面,所述多肽包含SEQ ID NO:2的氨基酸序列。在另一个优选的方面,所述多肽包含SEQ ID NO:2的成熟多肽。在另一个优选的方面,所述多肽包含SEQ IDNO:2的氨基酸20至326,或其等位变体;或它们的具有增强纤维素分解的活性的片段。在另一个优选的方面,所述多肽包含SEQ ID NO:2的氨基酸20至326。在另一个优选的方面,所述多肽由SEQ ID NO:2的氨基酸序列或其等位变体;或者由它们具有增强纤维素分解的活性的片段组成。在另一个优选的方面,所述多肽由SEQ ID NO:2的氨基酸序列组成。在另一个优选的方面,所述多肽由SEQ ID NO:2的成熟多肽组成。在另一个优选的方面,所述多肽由SEQ ID NO:2的氨基酸20至326或其等位变体;或它们的具有增强纤维素分解的活性的片段组成。在另一个优选的方面,所述多肽由SEQ ID NO:2的氨基酸20至326组成。 
具有增强纤维素分解的活性的多肽优选包含SEQ ID NO:4的氨基酸序列或其等位变体;或者它们的具有增强纤维素分解的活性的片段。在优选的方面,所述多肽包含SEQ ID NO:4的氨基酸序列。在另一个优选的方面,所述多肽包含SEQ ID NO:4的成熟多肽。在另一个优选的方面,所述多肽包含SEQ ID NO:4的氨基酸18至240,或其等位变体;或者它们的具有增强纤维素分解的活性的片段。在另一个优选的方面,所述多肽包含SEQ ID NO:4的氨基酸18至240。在另一个优选的方面,所述多肽由SEQ ID NO:4的氨基酸序列或其等位变体;或者它们的具有增强纤维素分解的活性的片段组成。在另一个优选的方面,所述多肽由SEQ ID NO:4的氨基酸序列组成。在另一个优选的方面,所述多肽由SEQ ID NO:4的成熟多肽组成。在另一个优选的方 面,所述多肽由SEQ ID NO:4的氨基酸18至240或其等位变体;或者它们的具有增强纤维素分解的活性的片段组成。在另一个优选的方面,所述多肽由SEQ ID NO:4的氨基酸18至240组成。 
具有增强纤维素分解的活性的多肽优选包含SEQ ID NO:6的氨基酸序列或其等位变体;或者它们的具有增强纤维素分解的活性的片段。在优选的方面,所述多肽包含SEQ ID NO:6的氨基酸序列。在另一个优选的方面,所述多肽包含SEQ ID NO:6的成熟多肽。在另一个优选的方面,所述多肽包含SEQ ID NO:6的氨基酸20至258,或其等位变体;或者它们的具有增强纤维素分解的活性的片段。在另一个优选的方面,所述多肽包含SEQ ID NO:6的氨基酸20至258。在另一个优选的方面,所述多肽由SEQ ID NO:6的氨基酸序列或其等位变体;或者它们的具有增强纤维素分解的活性的片段组成。在另一个优选的方面,所述多肽由SEQ ID NO:6的氨基酸序列组成。在另一个优选的方面,所述多肽由SEQ ID NO:6的成熟多肽组成。在另一个优选的方面,所述多肽由SEQ ID NO:6的氨基酸20至258或其等位变体;或者它们的具有增强纤维素分解的活性的片段组成。在另一个优选的方面,所述多肽由SEQ ID NO:6的氨基酸20至258组成。 
具有增强纤维素分解的活性的多肽优选包含SEQ ID NO:8的氨基酸序列或其等位变体;或者它们的具有增强纤维素分解的活性的片段。在优选的方面,所述多肽包含SEQ ID NO:8的氨基酸序列。在另一个优选的方面,所述多肽包含SEQ ID NO:8的成熟多肽。在另一个优选的方面,所述多肽包含SEQ ID NO:8的氨基酸19至226,或其等位变体;或者它们的具有增强纤维素分解的活性的片段。在另一个优选的方面,所述多肽包含SEQ ID NO:8的氨基酸19至226。在另一个优选的方面,所述多肽由SEQ ID NO:8的氨基酸序列或其等位变体;或者它们的具有增强纤维素分解的活性的片段组成。在另一个优选的方面,所述多肽由SEQ ID NO:8的氨基酸序列组成。在另一个优选的方面,所述多肽由SEQ ID NO:8的成熟多肽组成。在另一个优选的方面,所述多肽由SEQ ID NO:8的氨基酸19至226或其等位变体;或者它们的具有增强纤维素分解的活性的片段组成。在另一个优选的方面,所述多肽由SEQ ID NO:8的氨基酸19至226组成。 
具有增强纤维素分解的活性的多肽优选包含SEQ ID NO:10的氨基酸序列或其等位变体;或者它们的具有增强纤维素分解的活性的片段。在优选的 方面,所述多肽包含SEQ ID NO:10的氨基酸序列。在另一个优选的方面,所述多肽包含SEQ ID NO:10的成熟多肽。在另一个优选的方面,所述多肽包含SEQ ID NO:10的氨基酸20至304,或其等位变体;或者它们的具有增强纤维素分解的活性的片段。在另一个优选的方面,所述多肽包含SEQ ID NO:10的氨基酸20至304。在另一个优选的方面,所述多肽由SEQ ID NO:10的氨基酸序列或其等位变体;或者它们的具有增强纤维素分解的活性的片段组成。在另一个优选的方面,所述多肽由SEQ ID NO:10的氨基酸序列组成。在另一个优选的方面,所述多肽由SEQ ID NO:10的成熟多肽组成。在另一个优选的方面,所述多肽由SEQ ID NO:10的氨基酸20至304或其等位变体;或者它们的具有增强纤维素分解的活性的片段组成。在另一个优选的方面,所述多肽由SEQ ID NO:10的氨基酸20至304组成。 
具有增强纤维素分解的活性的多肽优选包含SEQ ID NO:12的氨基酸序列或其等位变体;或者它们的具有增强纤维素分解的活性的片段。在优选的方面,所述多肽包含SEQ ID NO:12的氨基酸序列。在另一个优选的方面,所述多肽包含SEQ ID NO:12的成熟多肽。在另一个优选的方面,所述多肽包含SEQ ID NO:12的氨基酸23至250,或其等位变体;或者它们的具有增强纤维素分解的活性的片段。在另一个优选的方面,所述多肽包含SEQ ID NO:12的氨基酸23至250。在另一个优选的方面,所述多肽由SEQ ID NO:12的氨基酸序列或其等位变体;或者它们的具有增强纤维素分解的活性的片段组成。在另一个优选的方面,所述多肽由SEQ ID NO:12的氨基酸序列组成。在另一个优选的方面,所述多肽由SEQ ID NO:12的成熟多肽组成。在另一个优选的方面,所述多肽由SEQ ID NO:12的氨基酸23至250或其等位变体;或者它们的具有增强纤维素分解的活性的片段组成。在另一个优选的方面,所述多肽由SEQ ID NO:12的氨基酸23至250组成。 
具有增强纤维素分解的活性的多肽优选包含SEQ ID NO:14的氨基酸序列或其等位变体;或者它们的具有增强纤维素分解的活性的片段。在优选的方面,所述多肽包含SEQ ID NO:14的氨基酸序列。在另一个优选的方面,所述多肽包含SEQ ID NO:14的成熟多肽。在另一个优选的方面,所述多肽包含SEQ ID NO:14的氨基酸20至249,或其等位变体;或者它们的具有增强纤维素分解的活性的片段。在另一个优选的方面,所述多肽包含SEQ ID NO:14的氨基酸20至249。在另一个优选的方面,所述多肽由SEQ ID NO:14的 氨基酸序列或其等位变体;或者它们的具有增强纤维素分解的活性的片段组成。在另一个优选的方面,所述多肽由SEQ ID NO:14的氨基酸序列组成。在另一个优选的方面,所述多肽由SEQ ID NO:14的成熟多肽组成。在另一个优选的方面,所述多肽由SEQ ID NO:14的氨基酸20至249或其等位变体;或者它们的具有增强纤维素分解的活性的片段组成。在另一个优选的方面,所述多肽由SEQ ID NO:14的氨基酸20至249组成。 
优选地,SEQ ID NO:2的成熟多肽的片段包含至少277个氨基酸残基,更优选地至少287个氨基酸残基,并且最优选至少297个氨基酸残基。优选地,SEQ ID NO:4的成熟多肽的片段包含至少185个氨基酸残基,更优选地至少195个氨基酸残基,并且最优选至少205个氨基酸残基。优选地,SEQ IDNO:6的成熟多肽的片段包含至少200个氨基酸残基,并且优选地至少212个氨基酸残基,并且最优选至少224个氨基酸残基。优选地,SEQ ID NO:8的成熟多肽的片段包含至少175个氨基酸残基,更优选地至少185个氨基酸残基,并且最优选至少195个氨基酸残基。优选地,SEQ ID NO:10的成熟多肽的片段包含至少240个氨基酸残基,更优选地至少255个氨基酸残基,并且最优选至少270个氨基酸残基。优选地,SEQ ID NO:12的成熟多肽的片段包含至少175个氨基酸残基,更优选地至少190个氨基酸残基,并且最优选至少205个氨基酸残基。优选地,SEQ ID NO:14的成熟多肽的片段包含至少200个氨基酸残基,更优选地至少210个氨基酸残基,并且最优选至少220个氨基酸残基。 
优选地,SEQ ID NO:1的成熟多肽编码序列的亚序列包含至少831个核苷酸,更优选地至少861个核苷酸,并且最优选至少891个核苷酸。优选地,SEQ ID NO:3的成熟多肽编码序列的亚序列包含至少555个核苷酸,更优选地至少585个核苷酸,并且最优选至少615个核苷酸。优选地,SEQ ID NO:5的成熟多肽编码序列的亚序列包含至少600个核苷酸,更优选地至少636个核苷酸,并且最优选至少672个核苷酸。优选地,SEQ ID NO:7的成熟多肽编码序列的亚序列包含至少525个核苷酸,更优选地至少555个核苷酸,并且最优选至少585个核苷酸。优选地,SEQ ID NO:9的成熟多肽编码序列的亚序列包含至少720个核苷酸,更优选地至少765个核苷酸,并且最优选至少810个核苷酸。优选地,SEQ ID NO:11的成熟多肽编码序列的亚序列包含至少525个核苷酸,更优选地至少570个核苷酸,并且最优选至少615个核 苷酸。优选地,SEQ ID NO:13的成熟多肽编码序列的亚序列包含至少600个核苷酸,更优选地至少630个核苷酸,并且最优选至少660个核苷酸。 
在第四方面,具有增强纤维素分解的活性的分离的多肽由包含下述核苷酸序列的多核苷酸编码,所述核苷酸序列在至少非常低严紧条件下,优选至少低严紧条件下,更优选至少中严紧条件下,更优选至少中-高严紧条件下,甚至更优选至少高严紧条件下,并且最优选至少非常高严紧条件下与以下杂交:(i)SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ IDNO:9、SEQ ID NO:11,或SEQ ID NO:13的成熟多肽编码序列,(ii)包含在SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5或SEQ ID NO:11的成熟多肽编码序列中的cDNA序列,或包含SEQ ID NO:7、SEQ ID NO:9或SEQ ID NO:13的成熟多肽编码序列的基因组DNA序列,(iii)(i)或(ii)的亚序列,或者(iv)(i)、(ii)或(iii)的全长互补链(J J.Sambrook,E.F.Fritsch和T.Maniatis,1989,Molecular Cloning,A Laboratory Manual,第2版,Cold Spring Harbor,NewYork)。SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ IDNO:9、SEQ ID NO:11,或SEQ ID NO:13的成熟多肽编码序列的亚序列含有至少100个连续的核苷酸或优选至少200个连续的核苷酸。此外,所述亚序列可编码具有增强纤维素分解的活性的多肽片段。在优选的方面,所述成熟多肽编码序列是SEQ ID NO:1的核苷酸388至1332、SEQ ID NO:3的核苷酸98至821、SEQ ID NO:5的核苷酸126至978、SEQ ID NO:7的核苷酸55至678、SEQ ID NO:9的核苷酸58至912、SEQ ID NO:11的核苷酸67至796,或SEQ ID NO:13的核苷酸77至766。 
SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11,或SEQ ID NO:13的核苷酸序列或其亚序列,以及SEQ IDNO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8,或SEQ ID NO:10、SEQ ID NO:12,或SEQ ID NO:14的氨基酸序列或其片段,可以用于设计核酸探针,以从不同属和种的菌株鉴定和克隆编码具有增强纤维素分解的活性的多肽的DNA。尤其,这样的探针可用于根据标准Southern印迹程序与感兴趣的属或种的基因组或cDNA杂交,以鉴定和分离其中相应的目的基因。这样的探针可能比整个序列短很多,但是其长度应该是至少14,优选至少25,更优选至少35,并且最优选至少70个核苷酸。然而,优选所述核酸探针的长度为至少100个核苷酸。例如,核酸探针的长度可为至少200个核苷酸, 优选至少300个核苷酸,更优选至少400个核苷酸,或最优选至少500个核苷酸。甚至可以用更长的探针,例如,长度为至少600个核苷酸,至少优选至少700个核苷酸,更优选至少800个核苷酸,或最优选至少900个核苷酸的核酸探针。DNA和RNA探针都可以使用。通常将探针加以标记用于检测相应的基因(例如,用32P、3H、35S、生物素或抗生物素蛋白(avidin)标记)。这些探针都包含在本发明中。 
因而,可从由这些其它菌株制备的基因组DNA或cDNA文库中筛选DNA,所述DNA与上述探针杂交并且编码具有增强纤维素分解的活性的多肽。可以通过琼脂糖或聚丙烯酰胺凝胶电泳,或通过其它分离技术来分离来自这些其它菌株的基因组或其它DNA。可以将来自文库的DNA或分离的DNA转移至并固定在硝化纤维素(nitrocellulose)或其它合适的载体材料上。为了鉴定与SEQ ID NO:1或其亚序列同源的克隆或DNA,优选将所述载体材料用在Sounthern印迹中。 
就本发明而言,杂交表示核苷酸序列在非常低至非常高的严紧条件下与标记的核酸探针杂交,所述核酸探针对应于SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11,或SEQ ID NO:13的成熟多肽编码序列,包含在SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5或SEQ ID NO:11的成熟多肽编码序列中的cDNA序列,或包含SEQ ID NO:7、SEQ ID NO:9或SEQ ID NO:13的成熟多肽编码序列的基因组DNA序列,它的全长互补链或其亚序列。可使用例如X射线片(X-ray film)检测在这些条件下与所述核酸探针杂交的分子。 
在优选的方面,核酸探针是SEQ ID NO:1的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:1的核苷酸388至1332。在另一优选的方面,核酸探针是编码SEQ ID NO:2的多肽的多核苷酸序列,或其亚序列。在另一优选的方面,核酸探针是SEQ ID NO:1。在另一优选的方面,核酸探针是包含于大肠杆菌(E.coli)NRRL B-30699中的质粒pEJG120所包含的多核苷酸序列,其中它的多核苷酸序列编码具有增强纤维素分解的活性的多肽。在另一优选的方面,核酸探针是包含于大肠杆菌NRRL B-30699中的质粒pEJG120所包含的成熟多肽编码区。 
在另一优选的方面,核酸探针是SEQ ID NO:3的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:3的核苷酸98至821。在另一优选 的方面,核酸探针是编码SEQ ID NO:4的多肽的多核苷酸序列,或其亚序列。在另一优选的方面,核酸探针是SEQ ID NO:3。在另一优选的方面,核酸探针是包含于大肠杆菌NRRL B-30813中的质粒pTter61C所包含的多核苷酸序列,其中它的多核苷酸序列编码具有增强纤维素分解的活性的多肽。在另一优选的方面,核酸探针是包含于大肠杆菌NRRL B-30813中的质粒pTter61C所包含的成熟多肽编码区。 
在另一优选的方面,核酸探针是SEQ ID NO:5的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:5的核苷酸126至978。在另一优选的方面,核酸探针是编码SEQ ID NO:6的多肽的多核苷酸序列,或其亚序列。在另一优选的方面,核酸探针是SEQ ID NO:5。在另一优选的方面,核酸探针是包含于大肠杆菌NRRL B-30812中的质粒pTter61D所包含的多核苷酸序列,其中它的多核苷酸序列编码具有增强纤维素分解的活性的多肽。在另一优选的方面,核酸探针是包含于大肠杆菌NRRL B-30812中的质粒pTter61D所包含的成熟多肽编码区。 
在另一优选的方面,核酸探针是SEQ ID NO:7的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:7的核苷酸55至678。在另一个、优选的方面,核酸探针是编码SEQ ID NO:8的多肽的多核苷酸序列,或其亚序列。在另一优选的方面,核酸探针是SEQ ID NO:7。在另一优选的方面,核酸探针是包含于大肠杆菌NRRL B-30814中的质粒pTter61E所包含的多核苷酸序列,其中它的多核苷酸序列编码具有增强纤维素分解的活性的多肽。在另一优选的方面,核酸探针是包含于大肠杆菌NRRL B-30814中的质粒pTter61E所包含的成熟多肽编码区。 
在另一优选的方面,核酸探针是SEQ ID NO:9的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:9的核苷酸58至912。在另一优选的方面,核酸探针是编码SEQ ID NO:10的多肽的多核苷酸序列,或其亚序列。在另一优选的方面,核酸探针是SEQ ID NO:9。在另一优选的方面,核酸探针是包含于大肠杆菌NRRL B-30811中的质粒pTter61G所包含的多核苷酸序列,其中它的多核苷酸序列编码具有增强纤维素分解的活性的多肽。在另一优选的方面,核酸探针是包含于大肠杆菌NRRL B-30811中的质粒pTter61G所包含的成熟多肽编码区。 
在另一优选的方面,核酸探针是SEQ ID NO:11的成熟多肽编码序列。 在另一优选的方面,核酸探针是SEQ ID NO:11的核苷酸67至796。在另一优选的方面,核酸探针是编码SEQ ID NO:12的多肽的多核苷酸序列,或其亚序列。在另一优选的方面,核酸探针是SEQ ID NO:11。在另一优选的方面,核酸探针是包含于大肠杆菌NRRL B-30704中的质粒pDZA2-7所包含的多核苷酸序列,其中它的多核苷酸序列编码具有增强纤维素分解的活性的多肽。在另一优选方面,核酸探针是包含于大肠杆菌NRRL B-30704中的质粒pDZA2-7所包含的成熟多肽编码区。 
在另一优选的方面,核酸探针是SEQ ID NO:13的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:13的核苷酸77至766。在另一优选的方面,核酸探针是编码SEQ ID NO:14的多肽的多核苷酸序列,或其亚序列。在另一优选的方面,核酸探针是SEQ ID NO:13。在另一优选的方面,核酸探针是包含于大肠杆菌NRRL B-30878中的质粒pTr333所包含的多核苷酸序列,其中它的多核苷酸序列编码具有增强纤维素分解的活性的多肽。在另一优选的方面,核酸探针是包含于大肠杆菌NRRL B-30878中的质粒pTr333所包含的成熟多肽编码区。 
对于长度至少100个核苷酸的长探针,将非常低至非常高的严紧条件定义为在42℃,在5X SSPE、0.3% SDS、200μg/ml已剪切并且变性的鲑精DNA中,并且对于非常低和低严紧性为25%的甲酰胺、对于中和中-高严紧性为35%的甲酰胺、或对于高和非常高严紧性为50%的甲酰胺,根据标准的Southern印迹法进行预杂交和杂交最佳12至24小时。 
对于长度为至少100个核苷酸的长探针,使用2X SSC、0.2% SDS优选至少在45℃(非常低严紧性),更优选至少在50℃(低严紧性),更优选至少在55℃(中严紧性),更优选至少在60℃(中-高严紧性),甚至更优选至少在65℃(高严紧性),并且最优选至少在70℃(非常高严紧性)将载体材料最终洗涤三次,每次15分钟。 
对于长度大约15个核苷酸至大约70个核苷酸的短探针,将严紧条件定义为在比根据Bolton和McCarthy计算法(1962,Proceedings of the NationalAcademy of Sciences USA 48:1390)得出的Tm低大约5℃至大约10℃,在0.9MNaCl,0.09M Tris-HCl pH 7.6,6mM EDTA,0.5% NP-40,1×Denhardt溶液,1mM焦磷酸钠(sodium pyrophosphate),1mM磷酸二氢钠(sodium monobasicphosphate),0.1mM ATP和0.2mg每ml的酵母RNA中,根据标准的Southern 印迹步骤进行预杂交、杂交和杂交后洗涤最佳12至24小时。 
对于长度大约15个核苷酸至大约70个核苷酸的短探针,将所述载体材料在比计算的Tm低5℃至10℃的温度下在6×SSC加0.1% SDS中洗涤一次15分钟,并用6×SSC洗涤两次,每次15分钟。 
在第五方面,具有增强纤维素分解的活性的分离的多肽由包含或组成为如下核苷酸序列的多核苷酸编码,所述核苷酸序列与SEQ ID NO:1、SEQ IDNO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11或SEQID NO:13的成熟多肽编码序列具有优选至少60%的序列同一性程度,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%,97%,98%,或99%的同一性程度,其编码具有增强纤维素分解的活性的活性多肽。 
在优选的方面,成熟多肽编码序列是SEQ ID NO:1的核苷酸388至1332,SEQ ID NO:3的核苷酸98至821,SEQ ID NO:5的核苷酸126至978,SEQID NO:7的核苷酸55至678,SEQ ID NO:9的核苷酸58至912,SEQ ID NO:11的核苷酸67至796,或SEQ ID NO:13的核苷酸77至766。参见本文中多核苷酸部分。 
在第六方面,具有增强纤维素分解的活性的分离的多肽是人工变体,所述人工变体在SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8,或SEQ ID NO:10、SEQ ID NO:12,或SEQ ID NO:14的成熟多肽,或其同源序列中包含一个或多个(几个)氨基酸的取代、缺失和/或插入。优选氨基酸改变对性质是较不重要的(of a minor nature),即保守的氨基酸取代或插入,其不显著影响蛋白质的折叠和/或活性;通常为1至大约30个氨基酸的小缺失;小的氨基或羧基末端延伸,例如氨基末端甲硫氨酸残基;多至大约20-25个残基的小接头肽;或通过改变净电荷或其它功能来促进纯化的小延伸(如多组氨酸区(poly histidine tract)、抗原表位(antigenic epitope)或结合域(bindingdomain))。 
保守取代的实例是在以下组之内:碱性氨基酸组(精氨酸、赖氨酸和组氨酸)、酸性氨基酸组(谷氨酸和天冬氨酸)、极性氨基酸组(谷氨酰胺和天冬酰胺)、疏水性氨基酸组(亮氨酸、异亮氨酸和缬氨酸)、芳族氨基酸组(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸组(甘氨酸、丙氨酸、丝氨酸、苏氨酸和甲硫氨酸)。 通常不改变比活性(specific activity)的氨基酸取代是本领域已知的,并且由例如H.Neurath和R.L.Hill,1979,于The Proteins,Academic Press,New York描述。最普遍发生的交换是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly。 
除了20个标准氨基酸,可以以非标准的氨基酸(例如4-羟脯氨酸、6-N-甲基赖氨酸、2-氨基异丁酸、异缬氨酸和α-甲基丝氨酸)取代野生型多肽的氨基酸残基。可以用有限数目的非保守氨基酸、不由遗传密码编码的氨基酸和非天然氨基酸取代氨基酸残基。“非天然氨基酸”在蛋白质合成后已经过修饰,和/或在它们的侧链具有不同于基本氨基酸的化学结构。非天然氨基酸能够以化学方法合成,并且优选是商业上能够获得的,包括六氢吡啶羧酸(pipecolic acid)、噻唑烷羧酸(thiazolidine carboxylic acid)、脱氢脯氨酸、3-和4-甲基脯氨酸,和3,3-二甲基脯氨酸。 
可供选择的是,氨基酸改变具有这样的性质以使多肽的物理化学性质改变。例如,氨基酸改变可改进多肽的热稳定性,改变底物特异性,改变最适pH等。 
能够根据本领域已知的方法,例如定位诱变或丙氨酸分区诱变法(Cunningham和Wells,1989,Science 244:1081-1085)来鉴定亲本多肽中的必需氨基酸。在后一技术中,将单一丙氨酸突变导入到分子中的每个残基,并且测试所得突变分子的生物活性以鉴定对于所述分子的活性关键的氨基酸残基。同样参见Hilton等,1996,J.Biol.Chem.271:4699-4708。酶的活性部位或其它的生物相互作用也能够通过结构的物理分析而测定,如通过以下这些技术:如核磁共振、晶体学、电子衍射或光亲和标记,连同推定的接触位点氨基酸的突变来测定。参见例如de Vos等,1992,Science 255:306-312;Smith等,1992,J.Mol.Biol.224:899-904;Wlodaver等,1992,FEBS Lett.309:59-64。也可通过分析与本发明多肽的相关多肽的同一性来推断必需氨基酸的身份。 
能够使用已知的诱变、重组和/或改组(shuffling)方法,然后是有关的筛选方法,例如那些由Reidhaar-Olson和Sauer,1988,Science 241:53-57;Bowie和Sauer,1989,Proc.Natl.Acad.Sci.USA 86:2152-2156;WO 95/17413;或WO95/22625公开的那些方法来进行并测试单个或多个氨基酸取代、缺失和/或插入。能够使用的其它方法包括易错PCR、噬菌体展示(例如,Lowman等,1991, Biochem.30:10832-10837;美国专利No.5,223,409;WO 92/06204)和区域定向的诱变(Derbyshire等,1986,Gene 46:145;Ner等,1988,DNA 7:127)。 
诱变/改组方法能够与高通量、自动化的筛选方法组合以检测由宿主细胞表达的克隆的、诱变的多肽的活性(Ness等,1999,Nature Biotechnology 17:893-896)。能够从宿主细胞回收编码活性多肽的诱变的DNA分子,并且使用本领域内标准方法快速测序。这些方法允许快速确定感兴趣的多肽中单个氨基酸残基的重要性,并且能够应用于未知结构的多肽。 
SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8、SEQ ID NO:10、SEQ ID NO:12,或SEQ ID NO:14的成熟多肽的氨基酸取代、缺失和/或插入的总数是10,优选9,更优选8,更优选7,更优选至多6,更优选5,更优选4,甚至更优选3,最优选2,并且甚至最优选1。 
具有增强纤维素分解的活性的多肽可以获得自任何属的微生物。就本发明而言,用于本文与给定的来源有关的术语“获得自”,意思是由核苷酸序列编码的多肽由所述来源产生,或由其中插入了来自所述来源的核苷酸序列的菌株产生。在优选的方面,获得自给定来源的多肽是胞外分泌的。 
具有增强纤维素分解的活性的多肽可以是细菌多肽。例如,多肽可以是革兰氏阳性细菌的多肽,如具有增强纤维素分解的活性的芽孢杆菌属(Bacillus)、链球菌属(Streptococcus)、链霉菌属(Streptomyces)、葡萄球菌属(Staphylococcus)、肠球菌属(Enterococcus)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、梭菌属(Clostridium)、地芽孢杆菌属(Geobacillus),或海洋芽孢菌属(Oceanobacillus)多肽,或革兰氏阴性细菌的多肽,如具有增强纤维素分解的活性的大肠杆菌、假单胞菌属(Pseudomonas)、沙门氏菌属(Salmonella)、弯曲杆菌属(Campylobacter)、螺杆菌属(Helicobacter)、黄杆菌属(Flavobacterium)、梭杆菌属(Fusobacterium)、泥杆菌属(Ilyobacter)、奈瑟氏菌属(Neisseria)或脲原体属(Ureaplasma)多肽。 
在优选的方面,多肽是具有增强纤维素分解的活性的嗜碱芽孢杆菌(Bacillus alkalophilus)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、短芽孢杆菌(Bacillus brevis)、环状芽孢杆菌(Bacillus circulans)、克劳氏芽孢杆菌(Bacillusclausii)、凝结芽孢杆菌(Bacillus coagulans)、坚强芽孢杆菌(Bacillus firmus)、灿烂芽孢杆菌(Bacillus lautus)、迟缓芽孢杆菌(Bacillus lentus)、地衣芽孢杆菌(Bacillus licheniformis)、巨大芽孢杆菌(Bacillus megaterium)、短小芽孢杆菌 (Bacillus pumilus)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)、枯草芽孢杆菌(Bacillus subtilis),或苏云金芽孢杆菌(Bacillus thuringiensis)多肽。 
在另一个优选的方面,多肽是具有增强纤维素分解的活性的似马链球菌(Streptococcus equisimilis)、酿脓链球菌(Streptococcus pyogenes)、乳房链球菌(Streptococcus uberis)或马链球菌兽瘟亚种(Streptococcus equi subsp.Zooepidemicus)多肽。 
在另一个优选的方面,多肽是具有增强纤维素分解的活性的不产色链霉菌(Streptomyces achromogenes)、除虫链霉菌(Streptomyces avermitilis)、天蓝色链霉菌(Streptomyces coelicolor)、灰色链霉菌(Streptomyces griseus),或浅青紫链霉菌(Streptomyces lividans)多肽。 
具有增强纤维素分解的活性的多肽还可以是具有增强纤维素分解的活性的真菌多肽,并且更优选是酵母多肽,如念珠菌属(Candida)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)或西洋蓍霉属(Yarrowia)多肽;或更优选是具有增强纤维素分解的活性的丝状真菌多肽,如枝顶孢霉属(Acremonium)、伞菌属(Agaricus)、链格孢属(Alternaria)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、Botryospaeria、拟蜡菌属(Ceriporiopsis)、毛喙壳属(Chaetomidium)、金孢子菌属(Chrysosporium)、麦角菌属(Claviceps)、旋孢腔菌属(Cochliobolus)、鬼伞属(Coprinopsis)、Coptotermes、棒囊壳属(Corynascus)、隐丛赤壳菌属(Cryphonectria)、隐球菌属(Cryptococcus)、色二孢属(Diplodia)、黑胶菌属(Exidia)、Filibasidium、镰孢属(Fusarium)、全鞭毛虫属(Holomastigotorides)、腐质霉属(Humicola)、耙菌属(Irpex)、香菇属(Lentinula)、Leptospaeria、梨孢菌属(Magnaporthe)、Melanocarpus、亚灰树花菌属(Meripilus)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、新考玛脂霉属(Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、平革菌属(Phanerochaete)、瘤胃壶菌属(Piromyces)、Poitrasia、假黑盘菌属(Pseudoplectania)、假披发虫属(Pseudotrichonympha)、根毛霉属(Rhizomucor)、裂褶菌属(Schizophyllum)、柱霉属(Scytalidium)、踝节菌属(Talaromyces)、嗜热霉属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、木霉属(Trichoderma)、长毛盘菌属(Trichophaea)、轮枝孢属(Verticillium)、草菇属(Volvariella)或炭角菌属(Xylaria)多肽。 
在优选的方面,多肽是具有增强纤维素分解的活性的卡尔酵母(Saccharomyces carlsbergensis)、酿酒酵母、糖化酵母(Saccharomycesdiastaticus)、道格拉氏酵母(Saccharomyces douglasii)、克鲁弗酵母(Saccharomyces kluyveri)、诺地酵母(Saccharomyces norbensis)或卵形酵母(Saccharomyces oviformis)多肽。 
在另一优选的方面,多肽是具有增强纤维素分解的活性的解纤维枝顶孢霉(Acremonium cellulolyticus)、棘孢曲霉(Aspergillus aculeatus)、泡盛曲霉(Aspergillus awamori)、烟曲霉(Aspergillus fumigatus)、臭曲霉(Aspergillusfoetidus)、日本曲霉(Aspergillus japonicus)、构巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillus niger)、米曲霉(Aspergillus oryzae)、嗜角质金孢子菌(Chrysosporium keratinophilum)、Chrysosporium lucknowense、热带金孢子菌(Chrysosporium tropicum)、粪状金孢子菌(Chrysosporium merdarium)、Chrysosporium inops、Chrysosporium pannicola、昆士兰金孢子菌(Chrysosporium queenslandicum)、Chrysosporium zonatum、杆孢状镰孢(Fusarium bactridioides)、禾谷镰孢(Fusarium cerealis)、库威镰孢(Fusariumcrookwellense)、大刀镰孢(Fusarium culmorum)、禾本科镰孢(Fusariumgraminearum)、禾赤镰孢(Fusarium graminum)、异孢镰孢(Fusariumheterosporum)、合欢木镰孢(Fusarium negundi)、尖镰孢(Fusarium oxysporum)、多枝镰孢(Fusarium reticulatum)、粉红镰孢(Fusarium roseum)、接骨木镰孢(Fusarium sambucinum)、肤色镰孢(Fusarium sarcochroum)、拟分枝孢镰孢(Fusarium sporotrichioides)、硫色镰孢(Fusarium sulphureum)、圆镰孢(Fusariumtorulosum)、拟丝孢镰孢(Fusarium trichothecioides)、镶片镰孢(Fusariumvenenatum)、灰腐质霉(Humicola grisea)、特异腐质霉(Humicola insolens)、疏棉状腐质霉(Humicola lanuginosa)、乳白耙菌(Irpex lacteus)、米赫毛霉(Mucormiehie)、嗜热毁丝霉(Myceliophthora thermophila)、粗糙脉孢菌(Neurosporacrassa)、绳状青霉(Penicillium funiculosum)、产紫青霉(Penicilliumpurpurogenum)、黄孢平革菌(Phanerochaete chrysosporium)、无色梭孢壳(Thielavia achromatica)、Thielavia albomyces、Thielavia albopilosa、澳洲梭孢壳(Thielavia australeinsis)、Thielavia fimeti、微孢梭孢壳(Thielavia microspora)、卵孢梭孢壳(Thielavia ovispora)、Thielavia peruviana、Thielavia spededonium、毛梭孢壳(Thielavia setosa)、Thielavia subthermophila、土生梭孢霉、哈茨木霉 (Trichoderma harzianum)、康宁木霉(Trichoderma koningji)、长枝木霉(Trichoderma longibrachiatum)、里氏木霉、绿色木霉(Trichoderma viride)或Trichophaea saccata多肽。 
在更优选的方面,多肽是具有增强纤维素分解的活性的土生梭孢霉多肽。在最优选的实施方案中,多肽是具有增强纤维素分解的活性的土生梭孢霉NRRL 8126多肽,例如,SEQ ID NO:2、4、6、8或10的成熟多肽,或其具有增强纤维素分解的活性的片段。 
在另一更优选的方面,多肽是具有增强纤维素分解的活性的桔橙嗜热霉(Thermoascus aurantiacus)多肽,例如,SEQ ID NO:12的成熟多肽。 
在另一更优选的方面,多肽是具有增强纤维素分解的活性的里氏木霉多肽。在另一最优选的方面,多肽是具有增强纤维素分解的活性的里氏木霉RutC30(ATCC 56765)多肽,例如,SEQ ID NO:14的成熟多肽,或其具有增强纤维素分解的活性的片段。 
可理解的是对于前述的物种,本发明包含完全和不完全阶段(perfect andimperfect states)两者,和其它分类学的等同物(equivalent),例如无性型(anamorph),而无论它们已知的种名。本领域技术人员将轻易地识别适合的等同物的身份。 
这些物种的菌株在许多培养物保藏中心对于公众能够轻易地取得,所述保藏中心诸如美国典型培养物保藏中心(the American Type Culture Collection)(ATCC)、德意志微生物和细胞培养物保藏中心(Deutsche Sammiung vonMikroorganismen und Zellkulturen GmbH)(DSM)、真菌菌种保藏中心(Centraalbureau Voor Schimmelcultures)(CBS)和农业研究机构专利培养物保藏中心,北区研究中心(Agricultural Research Service Patent Culture Collection,Northern Regional Research Center)(NRRL)。 
此外,可以使用上述的探针从其它来源,包括从自然界(例如,土壤、堆肥、水等)分离的微生物鉴定和获得这些多肽。用于从天然生境(habitat)分离微生物的技术是本领域公知的。然后可通过相似地筛选这种微生物的基因组或cDNA文库来获得所述多核苷酸。一旦用所述探针检测到编码多肽的多核苷酸序列,就能够使用本领域普通技术人员熟知的技术来分离或克隆所述多核苷酸(参见,例如,Sambrook等,1989,见上文)。 
具有增强纤维素分解的活性的多肽还可以包括融合多肽或可切割的融合多 肽,其中将另一种多肽融合到所述具有增强纤维素分解的活性的多肽或其片段的N末端或C末端。通过将编码另一种多肽的核苷酸序列(或其部分)融合于编码具有增强纤维素分解的活性的多肽的核苷酸序列(或其部分)来产生融合的多肽。产生融合多肽的技术是本领域已知的,并包括连接编码多肽的编码序列以使它们在阅读框中,并且使融合多肽的表达在相同启动子和终止子的控制下。 
关于具有增强纤维素分解的活性的多肽及其多核苷酸的详细信息,参见WO 2005/074647、WO 2005/074656,和美国公开申请系列号2007/0077630,所述文献通过提述并入本文。 
可以分离包含核苷酸序列(其编码具有增强纤维素分解的活性的多肽)的多核苷酸并用于实施本发明的方法,如本文所述。 
多核苷酸包含或组成为如下核苷酸序列,所述核苷酸序列与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11,或SEQ ID NO:13的成熟多肽编码序列具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%,97%,98%或99%的同一性程度,其编码具有增强纤维素分解的活性的多肽。 
在优选的方面,核苷酸序列包含或组成为SEQ ID NO:1。在另一更优选的方面,核苷酸序列包含或组成为包含在大肠杆菌NRRL B-30699中的质粒pEJG120所包含的序列。在另一优选的方面,核苷酸序列包含或组成为SEQ IDNO:1的成熟多肽编码区。在另一更优选的方面,核苷酸序列包含或组成为包含在大肠杆菌NRRL B-30699中的质粒pEJG120所包含的成熟多肽编码区。本发明还包括编码多肽的核苷酸序列,所述多肽包含或组成为SEQ ID NO:2的氨基酸序列或其成熟多肽,所述氨基酸序列由于遗传密码的简并性而不同于SEQ ID NO:1。本发明还涉及SEQ ID NO:1的亚序列,其编码SEQ ID NO:2的具有增强纤维素分解的活性的片段。 
在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:3。在另一更优选的方面,核苷酸序列包含或组成为包含在大肠杆菌NRRL B-30813中的质粒pTter61C所包含的序列。在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:3的成熟多肽编码区。在另一更优选的方面,核苷酸序列包含或组成为包含在大肠杆菌NRRL B-30813中的质粒pTter61C所包含的成熟多肽编码区。本发明还包括编码多肽的核苷酸序列,所述多肽包含或组成为SEQ ID NO:4的氨基酸序列或其成熟多肽,所述氨基酸序列由于遗传密码的简并性而不同于SEQ ID NO:3。本发明还涉及SEQ ID NO:3的亚序列,其编码SEQ ID NO:4的具有增强纤维素分解的活性的片段。 
在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:5。在另一更优选的方面,核苷酸序列包含或组成为包含在大肠杆菌NRRL B-30812中的质粒pTter61D所包含的序列。在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:5的成熟多肽编码区。在另一更优选的方面,核苷酸序列包含或组成为包含在大肠杆菌NRRL B-30812中的质粒pTter61D所包含的成熟多肽编码区。本发明还包括编码多肽的核苷酸序列,所述多肽包含或组成为SEQID NO:6的氨基酸序列或其成熟多肽,所述氨基酸序列由于遗传密码的简并性而不同于SEQ ID NO:5。本发明还涉及SEQ ID NO:5的亚序列,其编码SEQ ID NO:6的具有增强纤维素分解的活性的片段。 
在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:7。在另一更优选的方面,核苷酸序列包含或组成为包含在大肠杆菌NRRL B-30814中的质粒pTter61E所包含的序列。在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:7的成熟多肽编码区。在另一更优选的方面,核苷酸序列包含或组成为包含在大肠杆菌NRRL B-30814中的质粒pTter61E所包含的成熟多肽编码区。本发明还包括编码多肽的核苷酸序列,所述多肽包含或组成为SEQID NO:8的氨基酸序列或其成熟多肽,所述氨基酸序列由于遗传密码的简并性而不同于SEQ ID NO:7。本发明还涉及SEQ ID NO:7的亚序列,其编码SEQ ID NO:8的具有增强纤维素分解的活性的片段。 
在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:9。在另一更优选的方面,核苷酸序列包含或组成为包含在大肠杆菌NRRL B-30811中的质粒pTter61G所包含的序列。在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:9的成熟多肽编码区。在另一更优选的方面,核苷酸序列包含或组成为包含在大肠杆菌NRRL B-30811中的质粒pTter61G所包含的成熟多肽编码区。本发明还包括编码多肽的核苷酸序列,所述多肽包含或组成为SEQID NO:10的氨基酸序列或其成熟多肽,所述氨基酸序列由于遗传密码的简并性而不同于SEQ ID NO:9。本发明还涉及SEQ ID NO:9的亚序列,其编码SEQ ID NO:10的具有增强纤维素分解的活性的片段。 
在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:11。在另一更 优选的方面,核苷酸序列包含或组成为包含在大肠杆菌NRRL B-30704中的质粒pDZA2-7所包含的序列。在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:11的成熟多肽编码区。在另一更优选的方面,核苷酸序列包含或组成为包含在大肠杆菌NRRL B-30704中的质粒pDZA2-7所包含的成熟多肽编码区。本发明还包括编码多肽的核苷酸序列,所述多肽包含或组成为SEQID NO:12的氨基酸序列或其成熟多肽,所述氨基酸序列由于遗传密码的简并性而不同于SEQ ID NO:11。本发明还涉及SEQ ID NO:11的亚序列,其编码SEQ ID NO:12的具有增强纤维素分解的活性的片段。 
在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:13。在另一更优选的方面,核苷酸序列包含或组成为包含在大肠杆菌NRRL B-30878中的质粒pTr3337所包含的序列。在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:13的成熟多肽编码区。在另一更优选的方面,核苷酸序列包含或组成为包含在大肠杆菌NRRL B-30878中的质粒pTr3337所包含的成熟多肽编码区。本发明还包括编码多肽的核苷酸序列,所述多肽包含或组成为SEQID NO:14的氨基酸序列或其成熟多肽,所述氨基酸序列由于遗传密码的简并性而不同于SEQ ID NO:13。本发明还涉及SEQ ID NO:13的亚序列,其编码SEQ ID NO:14的具有增强纤维素分解的活性的片段。 
本发明还涉及在SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ IDNO:7、SEQ ID NO:9、SEQ ID NO:11,或SEQ ID NO:13的成熟多肽编码序列中包含至少一个突变的突变多核苷酸,其中所述突变核苷酸序列编码SEQID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8,或SEQ ID NO:10、SEQ ID NO:12,或SEQ ID NO:14的成熟多肽。在优选的方面,所述成熟多肽是SEQ ID NO:2的氨基酸20至326,SEQ ID NO:4的氨基酸18至240,SEQ ID NO:6的氨基酸20至258,SEQ ID NO:8的氨基酸19至226,或SEQID NO:10的氨基酸20至304,SEQ ID NO:12的氨基酸23至250,或SEQ IDNO:14的氨基酸20至249。在另一优选的方面,所述成熟多肽编码序列是SEQ ID NO:1的核苷酸388至1332、SEQ ID NO:3的核苷酸98至821、SEQID NO:5的核苷酸126至978、SEQ ID NO:7的核苷酸55至678、SEQ ID NO:9的核苷酸58至912、SEQ ID NO:11的核苷酸67至796,或SEQ ID NO:13的核苷酸77至766。 
如前所述,用于分离或克隆编码多肽的多核苷酸的技术是本领域内已知 的,并包括从基因组DNA分离,从cDNA制备,或其组合。 
多肽还可以包含多核苷酸,所述多核苷酸包含或组成为核苷酸序列,所述核苷酸序列编码具有增强纤维素分解的活性的多肽,所述多核苷酸在至少非常低严紧条件下,优选至少低严紧条件,更优选至少中等严紧条件,更优选至少中-高严紧条件,甚至更优选至少高严紧条件,并且最优选至少非常高的严紧条件下,与以下杂交:(i)SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQID NO:7、SEQ ID NO:9、SEQ ID NO:11,或SEQ ID NO:13的成熟多肽编码序列,(ii)包含在SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5或SEQ ID NO:11的成熟多肽编码序列中的cDNA序列或包含SEQ ID NO:7、SEQ ID NO:9或SEQ ID NO:13的成熟多肽编码序列的基因组DNA序列,或(iii)(i)或(ii)的全长互补链;或它们的等位变体和亚序列(Sambrook等,1989,见上文),如本文所定义的。在优选的方面,所述成熟多肽编码序列是SEQ ID NO:1的核苷酸388至1332,SEQ ID NO:3的核苷酸98至821,SEQ ID NO:5的核苷酸126至978,SEQ ID NO:7的核苷酸55至678,SEQ ID NO:9的核苷酸58至912,SEQ ID NO:11的核苷酸67至796,或SEQ ID NO:13的核苷酸77至766。 
β-葡糖苷酶及其多核苷酸 
用于处理含纤维素材料的具有β-葡糖苷酶活性的任何多肽可以是本发明的组合物的组件。编码这种具有β-葡糖苷酶活性的多肽的多核苷酸可以用于产生所述组合物。 
在第一方面,具有β-葡糖苷酶活性的分离的多肽包含或组成为如下氨基酸序列,所述氨基酸序列与SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26,或SEQ ID NO:28的成熟多肽具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%,97%,98%,或99%同一性程度,其具有β-葡糖苷酶活性(下文称作“同源多肽”)。在优选的方面,所述同源多肽包含或组成为如下氨基酸序列,所述氨基酸序列与SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26,或SEQ IDNO:28的成熟多肽相差十个氨基酸,优选相差五个氨基酸,更优选相差四个氨基酸,甚至更优选相差三个氨基酸,最优选相差两个氨基酸,并且甚至最优 选相差一个氨基酸。 
具有β-葡糖苷酶活性的多肽优选包含SEQ ID NO:16的氨基酸序列或其等位变体;或它们的具有β-葡糖苷酶活性的片段。在优选的方面,所述多肽包含SEQ ID NO:16的氨基酸序列。在另一优选的方面,所述多肽包含SEQ ID NO:16的成熟多肽。在另一优选的方面,所述多肽包含SEQ ID NO:16的氨基酸20至861,或其等位变体;或它们的具有β-葡糖苷酶活性的片段。在另一优选的方面,所述多肽包含SEQ ID NO:16的氨基酸20至861。在另一优选的方面,所述多肽由SEQ ID NO:16的氨基酸序列或其等位变体组成;或由它们的具有β-葡糖苷酶活性的片段组成。在另一优选的方面,所述多肽由SEQ ID NO:16的氨基酸序列组成。在另一优选的方面,所述多肽由SEQ ID NO:16的成熟多肽组成。在另一优选的方面,所述多肽由SEQ ID NO:16的氨基酸20至861或其等位变体组成;或由它们的具有β-葡糖苷酶活性的片段组成。在另一优选的方面,所述多肽由SEQ ID NO:16的氨基酸20至861组成。 
具有β-葡糖苷酶活性的多肽优选包含SEQ ID NO:18的氨基酸序列或其等位变体;或它们的具有β-葡糖苷酶活性的片段。在优选的方面,所述多肽包含SEQ ID NO:18的氨基酸序列。在另一优选的方面,所述多肽包含SEQ ID NO:18的成熟多肽。在另一优选的方面,所述多肽包含SEQ ID NO:18的氨基酸20至861,或其等位变体;或它们的具有β-葡糖苷酶活性的片段。在另一优选的方面,所述多肽包含SEQ ID NO:18的氨基酸20至861。在另一优选的方面,所述多肽由SEQ ID NO:18的氨基酸序列或其等位变体组成;或由它们的具有β-葡糖苷酶活性的片段组成。在另一优选的方面,所述多肽由SEQ ID NO:18的氨基酸序列组成。在另一优选的方面,所述多肽由SEQ ID NO:18的成熟多肽组成。在另一优选的方面,所述多肽由SEQ ID NO:18的氨基酸20至861或其等位变体组成;或由它们的具有β-葡糖苷酶活性的片段组成。在另一优选的方面,所述多肽由SEQ ID NO:18的氨基酸20至861组成。 
具有β-葡糖苷酶活性的多肽优选包含SEQ ID NO:20的氨基酸序列或其等位变体;或它们的具有β-葡糖苷酶活性的片段。在优选的方面,所述多肽包含SEQ ID NO:20的氨基酸序列。在另一优选的方面,所述多肽包含SEQ ID NO:20的成熟多肽。在另一优选的方面,所述多肽包含SEQ ID NO:20的氨基酸20至863,或其等位变体;或它们的具有β-葡糖苷酶活性的片段。在另一优选的方面,所述多肽包含SEQ ID NO:20的氨基酸20至863。在另一优选的方面, 所述多肽由SEQ ID NO:20的氨基酸序列或其等位变体组成;或由它们的具有β-葡糖苷酶活性的片段组成。在另一优选的方面,所述多肽由SEQ ID NO:20的氨基酸序列组成。在另一优选的方面,所述多肽由SEQ ID NO:20的成熟多肽组成。在另一优选的方面,所述多肽由SEQ ID NO:20的氨基酸20至863或其等位变体组成;或由它们的具有β-葡糖苷酶活性的片段组成。在另一优选的方面,所述多肽由SEQ ID NO:20的氨基酸20至863组成。 
具有β-葡糖苷酶活性的多肽优选包含SEQ ID NO:22的氨基酸序列或其等位变体;或它们的具有β-葡糖苷酶活性的片段。在优选的方面,所述多肽包含SEQ ID NO:22的氨基酸序列。在另一优选的方面,所述多肽包含SEQ ID NO:22的成熟多肽。在另一优选的方面,所述多肽包含SEQ ID NO:22的氨基酸37至878,或其等位变体;或它们的具有β-葡糖苷酶活性的片段。在另一优选的方面,所述多肽包含SEQ ID NO:22的氨基酸37至878。在另一优选的方面,所述多肽由SEQ ID NO:22的氨基酸序列或其等位变体组成;或由它们的其具有β-葡糖苷酶活性的片段组成。在另一优选的方面,所述多肽由SEQ ID NO:22的氨基酸序列组成。在另一优选的方面,所述多肽由SEQ ID NO:22的成熟多肽组成。在另一优选的方面,所述多肽由SEQ ID NO:22的氨基酸37至878或其等位变体组成;或由它们的具有β-葡糖苷酶活性的片段组成。在另一优选的方面,所述多肽由SEQ ID NO:22的氨基酸37至878组成。 
具有β-葡糖苷酶活性的多肽优选包含SEQ ID NO:24的氨基酸序列或其等位变体;或它们的具有β-葡糖苷酶活性的片段。在优选的方面,所述多肽包含SEQ ID NO:24的氨基酸序列。在另一优选的方面,所述多肽包含SEQ ID NO:24的成熟多肽。在另一优选的方面,所述多肽包含SEQ ID NO:24的氨基酸32至744,或其等位变体;或它们的具有β-葡糖苷酶活性的片段。在另一优选的方面,所述多肽包含SEQ ID NO:24的氨基酸32至744。在另一优选的方面,所述多肽由SEQ ID NO:24的氨基酸序列或其等位变体组成;或由它们的具有β-葡糖苷酶活性的片段组成。在另一优选的方面,所述多肽由SEQ ID NO:24的氨基酸序列组成。在另一优选的方面,所述多肽由SEQ ID NO:24的成熟多肽组成。在另一优选的方面,所述多肽由SEQ ID NO:24的氨基酸32至744或其等位变体组成;或由它们的具有β-葡糖苷酶活性的片段组成。在另一优选的方面,所述多肽由SEQ ID NO:24的氨基酸32至744组成。 
具有β-葡糖苷酶活性的多肽优选包含SEQ ID NO:26的氨基酸序列或其等 位变体;或它们的具有β-葡糖苷酶活性的片段。在优选的方面,所述多肽包含SEQ ID NO:26的氨基酸序列。在另一优选的方面,所述多肽包含SEQ ID NO:26的成熟多肽。在另一优选的方面,所述多肽包含SEQ ID NO:26的氨基酸20至860,或其等位变体;或它们的具有β-葡糖苷酶活性的片段。在另一优选的方面,所述多肽包含SEQ ID NO:26的氨基酸20至860。在另一优选的方面,所述多肽由SEQ ID NO:26的氨基酸序列或其等位变体组成;或由它们的具有β-葡糖苷酶活性的片段组成。在另一优选的方面,所述多肽由SEQ ID NO:26的氨基酸序列组成。在另一优选的方面,所述多肽由SEQ ID NO:26的成熟多肽组成。在另一优选的方面,所述多肽由SEQ ID NO:26的氨基酸20至860或其等位变体组成;或由它们的具有β-葡糖苷酶活性的片段组成。在另一优选的方面,所述多肽由SEQ ID NO:26的氨基酸20至860组成。 
具有β-葡糖苷酶活性的多肽优选包含SEQ ID NO:28的氨基酸序列或其等位变体;或它们的具有β-葡糖苷酶活性的片段。在优选的方面,所述多肽包含SEQ ID NO:28的氨基酸序列。在另一优选的方面,所述多肽包含SEQ ID NO:28的成熟多肽。在另一优选的方面,所述多肽包含SEQ ID NO:28的氨基酸20至860,或其等位变体;或它们的具有β-葡糖苷酶活性的片段。在另一优选的方面,所述多肽包含SEQ ID NO:28的氨基酸20至860。在另一优选的方面,所述多肽由SEQ ID NO:28的氨基酸序列或其等位变体组成;或由它们的具有β-葡糖苷酶活性的片段组成。在另一优选的方面,所述多肽由SEQ ID NO:28的氨基酸序列组成。在另一优选的方面,所述多肽由SEQ ID NO:28的成熟多肽组成。在另一优选的方面,所述多肽由SEQ ID NO:28的氨基酸20至860或其等位变体组成;或由它们的具有β-葡糖苷酶活性的片段组成。在另一优选的方面,所述多肽由SEQ ID NO:28的氨基酸20至860组成。 
优选地,SEQ ID NO:16的成熟多肽的片段包含至少720个氨基酸残基,更优选地至少760个氨基酸残基,并且最优选至少800个氨基酸残基。优选地,SEQ ID NO:18的成熟多肽的片段包含至少720个氨基酸残基,更优选地至少760个氨基酸残基,并且最优选至少800个氨基酸残基。优选地,SEQ ID NO:20的成熟多肽的片段包含至少770个氨基酸残基,更优选地至少800个氨基酸残基,并且最优选至少830个氨基酸残基。优选地,SEQ ID NO:22的成熟多肽的片段包含至少720个氨基酸残基,更优选地至少760个氨基酸残基,并且最优选至少800个氨基酸残基。优选地,SEQ ID NO:24的成熟多肽的片段 包含至少620个氨基酸残基,更优选地至少650个氨基酸残基,并且最优选至少680个氨基酸残基。优选地,SEQ ID NO:26的成熟多肽的片段包含至少720个氨基酸残基,更优选地至少760个氨基酸残基,并且最优选至少800个氨基酸残基。优选地,SEQ ID NO:28的成熟多肽的片段包含至少720个氨基酸残基,更优选地至少760个氨基酸残基,并且最优选至少800个氨基酸残基。 
优选地,SEQ ID NO:15的成熟多肽编码序列的亚序列包含至少2160个核苷酸,更优选地至少2280个核苷酸,并且最优选至少2400个核苷酸。优选地,SEQ ID NO:17的成熟多肽编码序列的亚序列包含至少2160个核苷酸,更优选地至少2280个核苷酸,并且最优选至少2400个核苷酸。优选地,SEQID NO:19的成熟多肽编码序列的亚序列包含至少2310个核苷酸,更优选地至少2400个核苷酸,并且最优选至少2490个核苷酸。优选地,SEQ ID NO:21的成熟多肽编码序列的亚序列包含至少2160个核苷酸,更优选地至少2280个核苷酸,并且最优选至少2400个核苷酸。优选地,SEQ ID NO:23的成熟多肽编码序列的亚序列包含至少1860个核苷酸,更优选地至少1950个核苷酸,并且最优选至少2040个核苷酸。优选地,SEQ ID NO:25的成熟多肽编码序列的亚序列包含至少2160个核苷酸,更优选地至少2280个核苷酸,并且最优选至少2400个核苷酸。优选地,SEQ ID NO:27的成熟多肽编码序列的亚序列包含至少2160个核苷酸,更优选地至少2280个核苷酸,并且最优选至少2400个核苷酸。 
在优选的方面,具有β-葡糖苷酶活性的多肽由获得自米曲霉β-葡糖苷酶基因的多核苷酸编码。在最优选的实施方案中,具有β-葡糖苷酶活性的多肽由获得自米曲霉β-葡糖苷酶基因的多核苷酸编码,所述基因包含SEQ ID NO:15的成熟多肽编码序列,其编码SEQ ID NO:16的成熟多肽。 
在另一优选的方面,具有β-葡糖苷酶活性的多肽由获得自米曲霉β-葡糖苷酶突变体基因的多核苷酸编码。在最优选的实施方案中,具有β-葡糖苷酶活性的多肽由获得自米曲霉β-葡糖苷酶基因的多核苷酸编码,所述基因包含SEQ ID NO:17的成熟多肽编码序列,其编码SEQ ID NO:18的成熟多肽。 
在另一优选的方面,具有β-葡糖苷酶活性的多肽由获得自烟曲霉β-葡糖苷酶基因的多核苷酸编码。在最优选的实施方案中,具有β-葡糖苷酶活性的多肽由获得自烟曲霉β-葡糖苷酶基因的多核苷酸编码,所述基因包含SEQ IDNO:19的成熟多肽编码序列,其编码SEQ ID NO:20的成熟多肽。 
在另一优选的方面,具有β-葡糖苷酶活性的多肽由获得自巴西青霉(Penicillium brasilianum)菌株IBT 20888β-葡糖苷酶基因的多核苷酸编码。在最优选的实施方案中,具有β-葡糖苷酶活性的多肽由获得自巴西青霉菌株IBT20888β-葡糖苷酶基因的多核苷酸编码,所述基因包含SEQ ID NO:21的成熟多肽编码序列,其编码SEQ ID NO:22的成熟多肽。 
在另一优选的方面,具有β-葡糖苷酶活性的多肽由获得里氏木霉菌株QM9414 β-葡糖苷酶基因的多核苷酸编码。在最优选的实施方案中,具有β-葡糖苷酶活性的多肽由获得自里氏木霉菌株QM9414 β-葡糖苷酶基因的多核苷酸编码,所述基因包含SEQ ID NO:23的成熟多肽编码序列,其编码SEQ IDNO:24的成熟多肽(GenBankTM登录号U09580)。 
在另一优选的方面,具有β-葡糖苷酶活性的多肽由获得黑曲霉β-葡糖苷酶基因的多核苷酸编码。在最优选的实施方案中,具有β-葡糖苷酶活性的多肽由获得自黑曲霉β-葡糖苷酶基因的多核苷酸编码,所述基因包含SEQ IDNO:25的成熟多肽编码序列,其编码SEQ ID NO:26的成熟多肽(GenBankTM登录号AJ132386)。 
在另一优选的方面,具有β-葡糖苷酶活性的多肽由获得棘孢曲霉β-葡糖苷酶基因的多核苷酸编码。在最优选的实施方案中,具有β-葡糖苷酶活性的多肽由获得自棘孢曲霉β-葡糖苷酶基因的多核苷酸编码,所述基因包含SEQID NO:27的成熟多肽编码序列,其编码SEQ ID NO:28的成熟多肽(GenBankTM登录号D64088)。 
具有β-葡糖苷酶活性的米曲霉多肽可以根据WO 2002/095014获得。具有β-葡糖苷酶活性的米曲霉多肽变体可以根据WO 2004/099228获得。具有β-葡糖苷酶活性的烟曲霉多肽可以根据WO 2005/047499获得。具有β-葡糖苷酶活性的巴西青霉多肽可以根据WO 2007/019442获得。具有β-葡糖苷酶活性的里氏木霉菌株QM9414可以根据美国专利6,022,725获得。具有β-葡糖苷酶活性的黑曲霉多肽可以根据Dan等,2000,J.Biol.Chem.275:4973-4980获得。具有β-葡糖苷酶活性的棘孢曲霉多肽可以根据Kawaguchi等,1996,Gene173:287-288获得。 
在优选的方面,SEQ ID NO:16的成熟多肽由包含在大肠杆菌DSM 14240的质粒中所包含的多核苷酸编码。在另一优选的方面,SEQ ID NO:20的成熟多肽由包含在大肠杆菌NRRL B-30695的质粒pEJG113中所包含的多核苷酸编码。在另一优选的方面,SEQ ID NO:22的成熟多肽由包含在大肠杆菌NRRLB-30860的质粒pPbGH3A中所包含的多核苷酸编码。
在第二方面,具有β-葡糖苷酶活性的分离的多肽由多核苷酸编码,所述多核苷酸包含或组成为以下核苷酸序列,所述核苷酸序列在至少非常低严紧条件下,优选至少低严紧条件下,更优选至少中严紧条件下,更优选至少中-高严紧条件下,甚至更优选至少高严紧条件下,并且最优选至少非常高严紧条件下,与以下杂交:(i)SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27的成熟多肽编码序列,(ii)包含在SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27的成熟多肽编码序列中的cDNA序列,或包含SEQ ID NO:15、SEQ ID NO:17、SEQID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27的成熟多肽编码序列的基因组DNA序列,(iii)(i)或(ii)的亚序列,或者(iv)(i)、(ii)或(iii)的全长互补链(J.Sambrook,E.F.Fritsch和T.Maniatis,1989见上文)。SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27的成熟多肽编码序列的亚序列含有至少100个连续的核苷酸或优选至少200个连续的核苷酸。此外,所述亚序列可编码具有β-葡糖苷酶活性的多肽片段。 
SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQID NO:23、SEQ ID NO:25、SEQ ID NO:27的核苷酸序列或其亚序列,以及SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22,或SEQ IDNO:24、SEQ ID NO:26,或SEQ ID NO:28的氨基酸序列或其片段,可以用于设计核酸探针,以从不同属和种的菌株鉴定和克隆编码具有β-葡糖苷酶活性的多肽的DNA,如上所述。 
就本发明而言,杂交表示核苷酸序列在非常低至非常高的严紧条件下与标记的核酸探针杂交,所述核酸探针对应于SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27的成熟多肽编码序列,包含在SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27的成熟多肽编码序列中的cDNA序列,或包含SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO: 27的成熟多肽编码序列的基因组DNA序列,它的全长互补链或其亚序列。如上文所述。 
在优选的方面,核酸探针是SEQ ID NO:15的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:15的核苷酸58至2584。在另一优选的方面,核酸探针是编码SEQ ID NO:16的多肽的多核苷酸序列,或其亚序列。在另一优选方面,核酸探针是SEQ ID NO:15。在另一优选的方面,核酸探针是包含于大肠杆菌DSM 14240中的多核苷酸序列,其中它的多核苷酸序列编码具有β-葡糖苷酶活性的多肽。在另一优选的方面,核酸探针是包含于大肠杆菌DSM 14240中的成熟多肽编码区。 
在另一优选的方面,核酸探针是SEQ ID NO:17的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:17的核苷酸58至2584。在另一优选的方面,核酸探针是编码SEQ ID NO:18的多肽的多核苷酸序列,或其亚序列。在另一优选的方面,核酸探针是SEQ ID NO:17。 
在另一优选的方面,核酸探针是SEQ ID NO:19的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:19的核苷酸73至1413。在另一优选的方面,核酸探针是编码SEQ ID NO:20的多肽的多核苷酸序列,或其亚序列。在另一优选的方面,核酸探针是SEQ ID NO:19。在另一优选的方面,核酸探针是包含在质粒pEJG113中的多核苷酸序列,所述质粒包含在大肠杆菌NRRL B-30695中,其中它的多核苷酸序列编码具有β-葡糖苷酶活性的多肽。在另一优选的方面,核酸探针是包含在质粒pEJG113中的成熟多肽编码区,所述质粒包含在大肠杆菌NRRL B-30695中。 
在另一优选的方面,核酸探针是SEQ ID NO:21的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:21的核苷酸67至1377。在另一优选的方面,核酸探针是编码SEQ ID NO:22的多肽的多核苷酸序列,或其亚序列。在另一优选的方面,核酸探针是SEQ ID NO:21。在另一优选的方面,核酸探针是包含在质粒pPbGH3A中的多核苷酸序列,所述质粒包含在大肠杆菌NRRL B-30860中,其中它的多核苷酸序列编码具有β-葡糖苷酶活性的多肽。在另一优选的方面,核酸探针是包含在包含在大肠杆菌NRRL B-30860中的成熟多肽编码区。 
在另一优选的方面,核酸探针是SEQ ID NO:23的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:23的核苷酸88至2232。在另一 优选的方面,核酸探针是编码SEQ ID NO:24的多肽的多核苷酸序列,或其亚序列。在另一优选的方面,核酸探针是SEQ ID NO:23。 
在另一优选的方面,核酸探针是SEQ ID NO:25的成熟多肽编码序列。在另一个优选的方面,核酸探针是SEQ ID NO:25的核苷酸59至2580。在另一优选的方面,核酸探针是编码SEQ ID NO:26的多肽的多核苷酸序列,或其亚序列。在另一优选的方面,核酸探针是SEQ ID NO:25。 
在另一优选的方面,核酸探针是SEQ ID NO:27的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:27的核苷酸59至2580。在另一优选的方面,核酸探针是编码SEQ ID NO:28的多肽的多核苷酸序列,或其亚序列。在另一优选的方面,核酸探针是SEQ ID NO:27。 
对于长度至少100个核苷酸的长探针,非常低至非常高的严紧条件如在本文所定义。 
对于长度为至少100个核苷酸的长探针,将载体材料进行最终洗涤,如在本文中定义。 
对于长度大约15个核苷酸至大约70个核苷酸的短探针,严紧条件如本文所定义。 
对于长度大约15个核苷酸至大约70个核苷酸的短探针,经载体材料进行洗涤,如在本文中定义。 
在第三方面,具有β-葡糖苷酶活性的多肽由包含或组成为如下核苷酸序列的多核苷酸编码,所述核苷酸序列与SEQ ID NO:15、SEQ ID NO:17、SEQID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27的成熟多肽编码序列具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%,97%,98%,或99%的同一性程度,其编码活性多肽。 
在第六方面,具有β-葡糖苷酶活性的多肽是人工变体,所述人工变体包含取代、缺失和/或插入一个或多个(几个)氨基酸的SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26,或SEQID NO:28的成熟多肽或其同源序列。制备这样的人工变体的方法如上所述。 
SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQID NO:24、SEQ ID NO:26,或SEQ ID NO:28的成熟多肽的氨基酸取代、缺 失和/或插入的总数是10,优选9,更优选8,更优选7,更优选至多6,更优选5,更优选4,甚至更优选3,最优选2,并且甚至最优选1。 
在另一优选的方面,具有β-葡糖苷酶活性的多肽由获得自家族1β-葡糖苷酶基因的多核苷酸编码。 
在另一优选的方面,具有β-葡糖苷酶活性的多肽由获得自家族3β-葡糖苷酶基因的多核苷酸编码。 
在另一优选的方面,具有β-葡糖苷酶活性的多肽由获得自家族5β-葡糖苷酶基因的多核苷酸编码。 
可用作本发明的多核苷酸来源的其它β-葡糖苷酶的实例包括,但不限于,米曲霉β-葡糖苷酶(WO 02/095014;WO 04/099228);棘孢曲霉β-葡糖苷酶(Kawaguchi等,1996,Gene 173:287-288);燕麦状曲霉(Aspergillus avenaceus)β-葡糖苷酶(GenBankTM登录号AY943971);烟曲霉β-葡糖苷酶(GenBankTM登录号XM745234);川地曲霉(Aspergillus kawachii)β-葡糖苷酶(GenBankTM登录号AB003470);黑曲霉β-葡糖苷酶(GenBankTM AJ132386);灰梨孢菌(Magnaporthegrisea)β-葡糖苷酶(GenBankTM登录号AY849670);黄孢平革菌β-葡糖苷酶(GenBankTM登录号AB253327);埃默森踝节菌(Talaromyces emersonii)β-葡糖苷酶(GenBankTM登录号AY072918);和里氏木霉β-葡糖苷酶(GenBankTM登录号U09580、AB003110、AY281374、AY281375、AY281377、AY281378,和AY281379)。β-葡糖苷酶的变体也可以用作多核苷酸的来源,如WO 04/099228中所述的那些。 
使用根据Henrissat B.,1991,A classification of glycosyl hydrolases basedon amino-acid sequence similarities,Biochem.J.280:309-316,Henrissat B.和Bairoch A.,1996,Updating the sequence-based classification of glycosylhydrolases,Biochem.J.316:695-696的分类,公开了超过13个糖基水解酶家族的其它β-葡糖苷酶。 
具有β-葡糖苷酶活性的多肽也可以获得自任何属的微生物。就本发明而言,术语“获得自”如本文所定义。在优选的方面,获得自给定来源的多肽是胞外分泌的。 
具有β-葡糖苷酶活性的多肽可以是细菌多肽。例如,多肽可以是革兰氏阳性细菌的多肽,如具有β-葡糖苷酶活性的芽孢杆菌属、链球菌属、链霉菌属、葡萄球菌属、肠球菌属、乳杆菌属、乳球菌属、梭菌属、地芽孢杆菌属, 或海洋芽孢杆菌属多肽,或者革兰氏阴性细菌的多肽,如具有β-葡糖苷酶活性的大肠杆菌、假单胞菌属、沙门氏菌属、弯曲杆菌属、螺杆菌属、黄杆菌属、梭杆菌属、泥杆菌属、奈瑟氏菌属或脲原体属多肽。 
在优选的方面,多肽是具有β-葡糖苷酶活性的嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌,或苏云金芽孢杆菌多肽。 
在另一优选的方面,多肽是具有β-葡糖苷酶活性的似马链球菌、酿脓链球菌、乳房链球菌,或马链球菌兽疫亚种多肽。 
在另一优选的方面,多肽是具有β-葡糖苷酶活性的不产色链霉菌、除虫链霉菌、天蓝色链霉菌、灰色链霉菌,或浅青紫链霉菌多肽。 
具有β-葡糖苷酶活性的多肽还可以是具有β-葡糖苷酶活性的真菌多肽,并且更优选是酵母多肽,如念珠菌属、克鲁维酵母属、毕赤酵母属、酵母属、裂殖酵母属或西洋蓍霉属多肽;或更优选是具有β-葡糖苷酶活性的丝状真菌多肽,如枝顶孢霉属、伞草属、链格孢属、曲霉属、短梗霉属、葡萄座腔菌属(Botryospaeria)、拟蜡菌属、毛壳菌属(Chaetomidium)、金孢子菌属、麦角属、旋孢腔菌属、鬼伞属、Coptotermes、棒囊壳属(Corynascus)、隐丛赤壳菌、隐球菌属、色二孢属、黑耳属(Exidia)、Filibasidium、镰孢属、赤霉属(Gibberella)、全鞭毛虫属、腐质霉属、耙菌属、香菇属、小球腔菌属(Leptospaeria)、梨孢菌属、Melanocarpus、多孔菌属(Meripilus)、毛霉属、毁丝霉属、新考玛脂霉属、脉孢菌属、拟青霉属、青霉属、平革菌属、瘤胃壶菌属、Poitrasia、假黑盘菌属、假披发虫属、根毛霉属、裂褶菌属、柱顶孢属(Scytalidium)、踝节菌属、嗜热霉属、梭孢壳属、弯颈霉属、木霉属、Trichophaea、轮枝孢属、小包脚菇属(Volvariella)或炭角菌属多肽。 
在优选的方面,多肽是具有β-葡糖苷酶活性的卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母或卵形酵母多肽。 
在另一个优选的方面,多肽是具有β-葡糖苷酶活性的解纤维枝顶孢霉、棘孢曲霉、泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、嗜角质金孢子菌、Chrysosporium lucknowense、热带金孢子菌、粪状金孢子菌、Chrysosporium inops、Chrysosporium pannicola、昆士兰金孢子菌、Chrysosporium zonatum、杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾 本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、灰腐质霉、特异腐质霉、疏棉状腐质霉、乳白耙菌、米赫毛霉、嗜热毁丝霉、粗糙脉孢菌、绳状青霉、产紫青霉、黄孢平革菌、无色梭孢壳、Thielavia albomyces、Thielavia albopilosa、澳洲梭孢壳、Thielavia fimeti、微孢梭孢壳、卵孢梭孢壳、Thielavia peruviana、Thielavia spededonium、毛梭孢壳、Thielavia subthermophila、土生梭孢霉、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、绿色木霉或Trichophaea saccata。 
可理解的是对于前述的物种,本发明包含完全和不完全阶段两种,和其它分类学的等同物,例如无性型,无论它们已知的种名。本领域技术人员将轻易地识别适合的等同物的身份。 
这些物种的菌株在许多培养物保藏中心对于公众能够轻易地取得,所述保藏中心诸如美国典型培养物保藏中心(the American Type Culture Collection)(ATCC)、德意志微生物和细胞培养物保藏中心(Deutsche Sammiung vonMikroorganismen und Zellkulturen GmbH)(DSM)、真菌菌种保藏中心(Centraalbureau Voor Schimmelcultures)(CBS)和农业研究机构专利培养物保藏中心,北区研究中心(Agricultural Research Service Patent Culture Collection,Northern Regional Research Center)(NRRL)。 
此外,可以使用上述的探针从其它来源,包括从自然界(例如,土壤、堆肥、水等)分离的微生物鉴定和获得这些多肽,如本文所述。 
具有β-葡糖苷酶活性的多肽还包括融合多肽或可切割的融合多肽,其中别的多肽融合在具有β-葡糖苷酶活性的多肽或其片段的N-末端或C-末端。如本文所述产生融合多肽。 
可以分离包含核苷酸序列或由其组成的多肽并用于实施本发明的方法,如本文所述,其中所述核苷酸序列编码具有β-葡糖苷酶活性的多肽。 
多核苷酸包含以下核苷酸序列,或者由以下核苷酸序列组成,所述核苷酸序列与SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27的成熟多肽编码序列具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%,97%,98%或99%的同一性程度,所述核苷酸序列编 码具有β-葡糖苷酶活性的多肽。 
在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:15。在另一更优选的方面,核苷酸序列包含或组成为大肠杆菌DSM 14240中包含的核苷酸序列。在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:15的成熟多肽编码序列。在另一更优选的方面,核苷酸序列包含或组成为SEQ ID NO:15的核苷酸58至2584。在另一优选的方面,核苷酸序列包含或组成为大肠杆菌DSM 14240中包含的成熟多肽编码区。本发明还包含如下核苷酸序列,所述核苷酸序列编码包含或组成为SEQ ID NO:16的氨基酸序列的多肽或其成熟多肽,由于遗传密码的简并性,所述核苷酸序列不同于SEQ ID NO:15或者其成熟多肽编码序列。本发明还涉及SEQ ID NO:15的亚序列,其编码SEQ ID NO:16的具有β-葡糖苷酶活性的片段。 
在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:17。在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:17的成熟多肽编码区。在另一更优选的方面,核苷酸序列包含或组成为SEQ ID NO:17的核苷酸58至2584。本发明还包含如下核苷酸序列,所述核苷酸序列编码包含或组成为SEQ ID NO:18的氨基酸序列的多肽或其成熟多肽,由于遗传密码的简并性,所述核苷酸序列不同于SEQ ID NO:17或者其成熟多肽编码序列。本发明还涉及SEQ ID NO:17的亚序列,其编码SEQ ID NO:18的具有β-葡糖苷酶活性的片段。 
在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:19。在另一更优选的方面,核苷酸序列包含或组成为质粒pEJG113中的核苷酸序列,所述质粒包含在大肠杆菌NRRL B-30695中。在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:19的成熟多肽编码区。在另一更优选的方面,核苷酸序列包含或组成为SEQ ID NO:19的核苷酸58至2580。在另一优选的方面,核苷酸序列包含或组成为质粒pEJG113中的成熟多肽编码区,所述质粒包含在大肠杆菌NRRL B-30695中。本发明还包含如下核苷酸序列,所述核苷酸序列编码包含或组成为SEQ ID NO:20的氨基酸序列的多肽或其成熟多肽,由于遗传密码的简并性,所述核苷酸序列不同于SEQ ID NO:19或者其成熟多肽编码序列。本发明还涉及SEQ ID NO:19的亚序列,其编码SEQ ID NO:20的具有β-葡糖苷酶活性的片段。 
在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:21。在另一更优选的方面,核苷酸序列包含或组成为质粒pPbGH3A中的核苷酸序列,所述 质粒包含在大肠杆菌NRRL B-30860中。在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:21的成熟多肽编码区。在另一更优选的方面,核苷酸序列包含或组成为SEQ ID NO:21的核苷酸109至2751。在另一优选的方面,核苷酸序列包含或组成为质粒pPbGH3A中的成熟多肽编码区,所述质粒包含在大肠杆菌NRRL B-30860中。本发明还包含如下核苷酸序列,所述核苷酸序列编码包含或组成为SEQ ID NO:22的氨基酸序列的多肽或其成熟多肽,由于遗传密码的简并性,所述核苷酸序列不同于SEQ ID NO:21或者其成熟多肽编码序列。本发明还涉及SEQ ID NO:21的亚序列,其编码SEQ IDNO:22的具有β-葡糖苷酶活性的片段。 
在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:23。在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:23的成熟多肽编码区。在另一更优选的方面,核苷酸序列包含或组成为SEQ ID NO:23的核苷酸88至2232。本发明还包含如下核苷酸序列,所述核苷酸序列编码包含或组成为SEQ ID NO:24的氨基酸序列的多肽或其成熟多肽,由于遗传密码的简并性,所述核苷酸序列不同于SEQ ID NO:23或者其成熟多肽编码序列。本发明还涉及SEQ ID NO:23的亚序列,其编码SEQ ID NO:24的具有β-葡糖苷酶活性的片段。 
在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:25。在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:25的成熟多肽编码区。在另一更优选的方面,核苷酸序列包含或组成为SEQ ID NO:25的核苷酸88至2232。本发明还包含如下核苷酸序列,所述核苷酸序列编码包含或组成为SEQ ID NO:26的氨基酸序列的多肽或其成熟多肽,由于遗传密码的简并性,所述核苷酸序列不同于SEQ ID NO:25或者其成熟多肽编码序列。本发明还涉及SEQ ID NO:25的亚序列,其编码SEQ ID NO:26的具有β-葡糖苷酶活性的片段。 
在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:27。在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:27的成熟多肽编码区。在另一更优选的方面,核苷酸序列包含或组成为SEQ ID NO:27的核苷酸88至2232。本发明还包含如下核苷酸序列,所述核苷酸序列编码包含或组成为SEQ ID NO:28的氨基酸序列的多肽或其成熟多肽,由于遗传密码的简并性,所述核苷酸序列不同于SEQ ID NO:27或者其成熟多肽编码序列。本发明还涉及SEQ ID NO:27的亚序列,其编码SEQ ID NO:28的具有β-葡糖苷酶活性的片段。 
本发明还涉及在SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27的成熟多肽编码序列中包含至少一个突变的突变多核苷酸,其中所述突变核苷酸序列编码SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26,或SEQ ID NO:28的成熟多肽。 
如早前所述,用于分离或克隆编码多肽的多核苷酸的技术是本领域内已知的,包括从基因组DNA分离,从cDNA制备,或其组合。 
多核苷酸还可为包含或组成为如下核苷酸序列的多核苷酸,所述核苷酸序列编码具有β-葡糖苷酶活性的多肽,其在至少非常低严紧条件下,优选至少低严紧条件,更优选至少中等严紧条件,更优选至少中-高严紧条件,甚至更优选至少高严紧条件,并且最优选至少非常高的严紧条件下,与以下杂交:(i)SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ IDNO:23、SEQ ID NO:25、SEQ ID NO:27的成熟多肽编码序列,(ii)包含在SEQID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27的成熟多肽编码序列中的cDNA序列或包含SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25、SEQ ID NO:27的成熟多肽编码序列的基因组DNA序列,或(iii)(i)或(ii)的全长互补链;或它们的等位变体和亚序列(Sambrook等,1989,见上文),如本文所定义的。 
在上述每一个优选的方面,所述成熟多肽是SEQ ID NO:16的氨基酸20至861,SEQ ID NO:18的氨基酸20至861,SEQ ID NO:22的氨基酸20至863,SEQ ID NO:22的氨基酸37至878,SEQ ID NO:24的氨基酸32至744,SEQ ID NO:26的氨基酸20至860,或SEQ ID NO:28的氨基酸20至860,并且所述成熟多肽编码序列是SEQ ID NO:15的核苷酸58至2584,SEQ IDNO:17的核苷酸58至2584,SEQ ID NO:19的核苷酸58至2580,SEQ ID NO:21的核苷酸109至2751,SEQ ID NO:23的核苷酸88至2232,SEQ ID NO:25的核苷酸59至2580,或SEQ ID NO:27的核苷酸59至2580。 
β-葡糖苷酶融合多肽及其多核苷酸 
β-葡糖苷酶还可以是β-葡糖苷酶融合蛋白的形式。通过将编码具有β-葡糖苷酶活性的多肽的核苷酸序列(或其部分)与编码具有内切葡聚糖酶活性的多肽的核苷酸序列(或其部分),以及编码信号肽的核苷酸融合而产生β-葡糖 苷酶融合多肽,其中所述编码信号肽的核苷酸与编码具有内切葡聚糖酶活性的多肽的核苷酸序列(或其部分)可操作连接。产生融合多肽的技术是本领域已知的,并且包括,例如,连接编码多肽的编码序列以使它们在阅读框中,并且使融合多肽的表达在相同启动子和终止子的控制下。还可以使用内蛋白技术构建融合蛋白,其中在翻译后产生融合蛋白(Cooper等,1993,EMBO J.12:2575-2583;Dawson等,1994,Science 266:776-779)。 
与至少不存在内切葡聚糖酶的催化域的情况相比,具有β-葡糖苷酶活性的融合蛋白增加了融合蛋白的分泌,其中所述融合蛋白至少包含与信号肽以符合读框的方式连接的内切葡聚糖酶的催化域。与至少不存在内切葡聚糖酶的催化域的情况相比,具有β-葡糖苷酶活性的融合蛋白的分泌增加至少25%,优选至少50%,更优选至少100%,甚至更优选至少150%,甚至更优选至少200%,最优选至少500%,并且甚至最优选至少1000%。 
在如下每个优选方面中,β-葡糖苷酶融合蛋白构建体的组件由5’末端可操作地连接至构建体的3’末端。 
在优选的方面,β-葡糖苷酶融合蛋白构建体包含以下多核苷酸:包含编码信号肽的序列的多核苷酸,包含编码内切葡聚糖酶的催化域的序列的多核苷酸;和包含编码β-葡糖苷酶的催化域的序列的多核苷酸。 
在另一优选的方面,β-葡糖苷酶融合蛋白构建体包含以下多核苷酸:包含编码信号肽的序列的多核苷酸,包含编码内切葡聚糖酶的成熟多肽的序列的多核苷酸;和包含编码β-葡糖苷酶的催化域的序列的多核苷酸。 
在另一优选的方面,β-葡糖苷酶融合蛋白构建体包含以下多核苷酸:包含编码信号肽的序列的多核苷酸,包含编码内切葡聚糖酶的催化域的序列的多核苷酸;和包含编码β-葡糖苷酶的成熟多肽的序列的多核苷酸。 
在另一优选的方面,β-葡糖苷酶融合蛋白构建体包含以下多核苷酸:包含编码信号肽的序列的多核苷酸,包含编码内切葡聚糖酶的成熟多肽的序列的多核苷酸;和包含编码β-葡糖苷酶的成熟多肽的序列的多核苷酸。 
在另一优选的方面,β-葡糖苷酶融合蛋白构建体包含以下多核苷酸:包含编码信号肽的序列的多核苷酸,包含编码内切葡聚糖酶的催化域的序列的多核苷酸;和包含编码β-葡糖苷酶的全长多肽的序列的多核苷酸。 
在另一优选的方面,β-葡糖苷酶融合蛋白构建体包含以下多核苷酸:包含编码信号肽的序列的多核苷酸,包含编码内切葡聚糖酶的成熟多肽的序列 的多核苷酸;和包含编码β-葡糖苷酶的全长多肽的序列的多核苷酸。 
在另一优选的方面,β-葡糖苷酶融合蛋白构建体包含以下多核苷酸:包含编码内切葡聚糖酶的全长多肽(信号肽和成熟多肽)的序列的多核苷酸;和包含编码β-葡糖苷酶的全长多肽的序列的多核苷酸。 
在另一优选的方面,β-葡糖苷酶融合蛋白构建体包含以下多核苷酸:包含编码信号肽的序列的多核苷酸,包含编码内切葡聚糖酶的催化域的序列的多核苷酸,和任选的接头和/或纤维素结合域;和包含编码β-葡糖苷酶的催化域的序列的多核苷酸。 
在另一优选的方面,β-葡糖苷酶融合蛋白构建体包含以下多核苷酸:包含编码信号肽的序列的多核苷酸,包含编码内切葡聚糖酶的成熟多肽的序列的多核苷酸,和任选的接头和/或纤维素结合域;和包含编码β-葡糖苷酶的催化域的序列的多核苷酸。 
在另一优选的方面,β-葡糖苷酶融合蛋白构建体包含以下多核苷酸:包含编码信号肽的序列的多核苷酸,包含编码内切葡聚糖酶的催化域的序列的多核苷酸,和任选的接头和/或纤维素结合域;和包含编码β-葡糖苷酶的成熟多肽的序列的多核苷酸。 
在另一优选的方面,β-葡糖苷酶融合蛋白构建体包含以下多核苷酸包含编码信号肽的序列的多核苷酸,包含编码内切葡聚糖酶的成熟多肽的序列的多核苷酸,和任选的接头和/或纤维素结合域;和包含编码β-葡糖苷酶的成熟多肽的序列的多核苷酸。 
在另一优选的方面,β-葡糖苷酶融合蛋白构建体包含以下多核苷酸:包含编码信号肽的序列的多核苷酸,包含编码内切葡聚糖酶的催化域的序列的多核苷酸,和任选的接头和/或纤维素结合域;和包含编码β-葡糖苷酶的全长多肽的序列的多核苷酸。 
在另一优选的方面,β-葡糖苷酶融合蛋白构建体包含以下多核苷酸:包含编码信号肽的序列的多核苷酸,包含编码内切葡聚糖酶的成熟多肽的序列的多核苷酸,和任选的接头和/或纤维素结合域;和包含编码β-葡糖苷酶的全长多肽的序列的多核苷酸。 
在另一优选的方面,β-葡糖苷酶融合蛋白构建体包含以下多核苷酸:包含编码信号肽的序列的多核苷酸;包含编码内切葡聚糖酶的催化域的序列的多核苷酸;包含编码另一个信号肽的序列的多核苷酸;和包含编码β-葡糖苷 酶的催化域的序列的多核苷酸。 
在另一优选的方面,β-葡糖苷酶融合蛋白构建体包含以下多核苷酸:包含编码信号肽的序列的多核苷酸;包含编码内切葡聚糖酶的成熟多肽的序列的多核苷酸;包含编码另一个信号肽的序列的多核苷酸;和包含编码β-葡糖苷酶的催化域的序列的多核苷酸。 
在另一优选的方面,β-葡糖苷酶融合蛋白构建体包含以下多核苷酸:包含编码信号肽的序列的多核苷酸;包含编码内切葡聚糖酶的催化域的序列的多核苷酸;包含编码另一个信号肽的序列的多核苷酸;和包含编码β-葡糖苷酶的成熟多肽的序列的多核苷酸。 
在另一优选的方面,β-葡糖苷酶融合蛋白构建体包含以下多核苷酸:包含编码信号肽的序列的多核苷酸;包含编码内切葡聚糖酶的成熟多肽的序列的多核苷酸;包含编码另一个信号肽的序列的多核苷酸;和包含编码β-葡糖苷酶的成熟多肽的序列的多核苷酸。 
在另一优选的方面,β-葡糖苷酶融合蛋白构建体包含以下多核苷酸:包含编码信号肽的序列的多核苷酸;包含编码内切葡聚糖酶的催化域的序列的多核苷酸;,和任选的接头和/或纤维素结合域;包含编码另一个信号肽的序列的多核苷酸;和包含编码β-葡糖苷酶的催化域的序列的多核苷酸。 
在另一优选的方面,β-葡糖苷酶融合蛋白构建体包含以下多核苷酸:包含编码信号肽的序列的多核苷酸;包含编码内切葡聚糖酶的成熟多肽的序列的多核苷酸;,和任选的接头和/或纤维素结合域;包含编码另一个信号肽的序列的多核苷酸;和包含编码β-葡糖苷酶的催化域的序列的多核苷酸。 
在另一优选的方面,β-葡糖苷酶融合蛋白构建体包含以下多核苷酸:包含编码信号肽的序列的多核苷酸;包含编码内切葡聚糖酶的催化域的序列的多核苷酸;,和任选的接头和/或纤维素结合域;包含编码另一个信号肽的序列的多核苷酸;和包含编码β-葡糖苷酶的成熟多肽的序列的多核苷酸。 
在另一优选的方面,β-葡糖苷酶融合蛋白构建体包含以下多核苷酸:包含编码信号肽的序列的多核苷酸;包含编码内切葡聚糖酶的成熟多肽的序列的多核苷酸;,和任选的接头和/或纤维素结合域;包含编码另一个信号肽的序列的多核苷酸;和包含编码β-葡糖苷酶的成熟多肽的序列的多核苷酸。 
在上述每个优选的方面中,β-葡糖苷酶融合蛋白构建体的组件还包含启动子区域。 
编码催化域、成熟多肽或全长多肽的具有β-葡糖苷酶活性或内切葡聚糖酶活性的多核苷酸可以获得自任何生物体。就本发明而言,术语“多肽”应理解为包括全长多肽、成熟多肽或催化域,或其具有β-葡糖苷酶或内切葡聚糖酶活性的部分。术语“获得自”如本文所定义的使用。 
很多内切葡聚糖酶具有多域结构,所述结构由通过接头肽与纤维素结合域(CBD)分隔开的催化域组成(Suurnakki等,2000,Cellulose 7:189-209)。催化域包含活性位点,而CBD通过将酶与其结合而与纤维素反应(van Tilbeurgh等,1986,FEBS Letters 204:223-227;Tomme等,1988,European Journal ofBiochemistry 170:575-581)。 
编码具有β-葡糖苷酶活性的多肽的多核苷酸如前所述。 
编码具有内切葡聚糖酶活性的多肽的多核苷酸可以获得自编码细菌多肽的基因。例如,多肽可以是革兰氏阳性细菌的多肽,包括但不限于芽孢杆菌属、链球菌属、链霉菌属、葡萄球菌属、肠球菌属、乳杆菌属、乳球菌属、梭菌属、地芽孢杆菌属,或海洋芽孢杆菌属多肽,例如,嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、凝结芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌、苏云金芽孢杆菌、似马链球菌、酿脓链球菌、乳房链球菌,和马链球菌兽疫亚种,浅青紫链霉菌,或鼠灰链霉菌多肽;或者革兰氏阴性细菌的多肽,包括但不限于大肠杆菌、假单胞菌属、沙门氏菌属、弯曲杆菌属、螺杆菌属、黄杆菌属、梭杆菌属、泥杆菌属、奈瑟氏菌属或脲原体属多肽。 
可用作本发明的方法中的多核苷酸来源的细菌内切葡聚糖酶的实例包括,但不限于,解纤维热酸菌(Acidothermus cellulolyticus)内切葡聚糖酶(WO91/05039;WO 93/15186;美国专利5,275,944;WO 96/02551;美国专利5,536,655;WO 00/70031,WO 05/093050);Thermobifida fusca内切葡聚糖酶III(WO 05/093050);和Thermobifida fusca内切葡聚糖酶V(WO 05/093050)。 
编码具有内切葡聚糖酶活性的多肽的多核苷酸还可以获得自编码真菌多肽的基因,并且更优选是酵母多肽,如念珠菌属、克鲁维酵母属、毕赤酵母属、酵母属、裂殖酵母属或西洋蓍霉属多肽;或者更优选是丝状真菌多肽,如枝顶孢霉属、伞草属、链格孢属、曲霉属、短梗霉属、葡萄座腔菌属、拟蜡菌属、毛壳菌属、金孢子菌属、麦角属、旋孢腔菌属、鬼伞属、Coptotermes、棒囊壳属、隐丛赤壳菌属、隐球菌属、色二孢属、黑耳属、Filibasidium、镰孢属、赤 霉属、全鞭毛虫属、腐质霉、耙菌属、香菇属、小球腔菌属、梨孢菌属、Melanocarpus、多孔菌属、毛霉属、毁丝霉属、新考玛脂霉属、脉孢菌属、拟青霉属、青霉属、平革菌属、瘤胃壶菌属、Poitrasia、假黑盘菌属、假披发虫属、根毛霉属、裂褶菌属、柱顶孢属、踝节菌属、嗜热霉属、梭孢壳属、弯颈霉属、木霉属、Trichophaea、轮枝孢属、小包脚菇属或炭角菌属多肽。 
在优选的方面,编码具有内切葡聚糖酶活性的多肽的多核苷酸可以获得自编码下述多肽的基因:卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母或卵形酵母多肽。 
在另一个优选的方面,编码具有内切葡聚糖酶活性的多肽的多核苷酸可以获得自编码下述多肽的基因:解纤维枝顶孢霉、棘孢曲霉、泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、嗜角质金孢子菌、Chrysosporium lucknowense、热带金孢子菌、粪状金孢子菌、Chrysosporiuminops、Chrysosporium pannicola、昆士兰金孢子菌、Chrysosporium zonatum、杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、灰腐质霉、特异腐质霉、疏棉状腐质霉、乳白耙菌、米赫毛霉、嗜热毁丝霉、粗糙脉孢菌、绳状青霉、产紫青霉、黄孢平革菌、无色梭孢壳、Thielavia albomyces、Thielavia albopilosa、澳洲梭孢壳、Thielavia fimeti、微孢梭孢壳、卵孢梭孢壳、Thielavia peruviana、Thielavia spededonium、毛梭孢壳、Thielaviasubthermophila、土生梭孢霉、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、绿色木霉或Trichophaea saccata多肽。 
能用作本发明的方法中多核苷酸的来源的真菌内切葡聚糖酶的实例包括,但不限于,里氏木霉内切葡聚糖酶I(Penttila等,1986,Gene 45:253-263;GenBankTM登录号M15665);里氏木霉内切葡聚糖酶II(Saloheimo等,1988,Gene 63:11-22;GenBankTM登录号M19373);里氏木霉内切葡聚糖酶III(Okada等,1988,Appl.Environ.Microbiol.64:555-563;GenBankTM登录号AB003694);里氏木霉内切葡聚糖IV(Saloheimo等,1997,Eur.J.Biochem.249:584-591;GenBankTM登录号Y11113);和里氏木霉内切葡聚糖酶V(Saloheimo等,1994,Molecular Microbiology 13:219-228;GenBankTM登录号Z33381);棘孢曲霉内切葡聚糖酶(Ooi等,1990,Nucleic Acids Research 18:5884);川地曲霉内切葡聚 糖酶(Sakamoto等,1995,Current Genetics 27:435-439);金孢子菌属菌种C1(美国专利6,573,086;GenPept登录号AAQ38150);Corynascus heterothallicus(美国专利6,855,531;GenPept登录号AAY00844);胡萝卜软腐欧文氏菌(Erwiniacarotovara)内切葡聚糖酶(Saarilahti等,1990,Gene 90:9-14);尖镰孢内切葡聚糖酶(GenBankTM登录号L29381);灰腐质霉高温变种(Humicola grisea var.thermoidea)内切葡聚糖酶(GenBankTM登录号AB003107);Melanocarpusalbomyces内切葡聚糖酶(GenBankTM登录号MAL515703);粗糙脉孢菌内切葡聚糖酶(GenBankTM登录号XM 324477);马瘤胃壶菌(Piromyces equi)(Eberhardt等,2000,Microbiology 146:1999-2008;GenPept登录号CAB92325);米根霉(Rhizopus oryzae)(Moriya等,2003,J.Bacteriology 185:1749-1756;GenBankTM登录号AB047927,AB056667和AB056668);和土生梭孢霉(WO 2004/053039;EMBL登录号CQ827970)。 
使用根据Henrissat B.,1991,A classification of glycosyl hydrolases basedon amino-acid sequence similarities,Biochem.J.280:309-316,Henrissat B.和Bairoch A.,1996,Updating the sequence-based classification of glycosylhydrolases,Biochem.J.316:695-696的分类,在超过13个糖基水解酶家族中公开了其它内切葡聚糖酶。 
用于分离或克隆编码具有内切葡聚糖酶活性的多肽的多核苷酸的技术是本领域内已知的,并且包括从基因组DNA分离,从cDNA制备,或其组合。可通过例如使用熟知的聚合酶链式反应(PCR)或表达文库的抗体筛选以检测具有共有结构特性的克隆DNA片段,从而实现从这种基因组DNA中克隆多核苷酸。参见,例如,Innis等,1990,PCR Protocols:A Guide to Methods andApplication,Academic Press,New York。可以使用其它核酸扩增方法,如连接酶链式反应(LCR),连接活化转录(LAT)和基于核苷酸序列的扩增(NASBA)。 
可理解的是对于前述的物种,本发明包含完全和不完全阶段两种,和其它分类学的等同物,例如无性型,而无论它们已知的种名。本领域技术人员将轻易地识别适合的等同物的身份。 
这些物种的菌株在许多培养物保藏中心对于公众能够轻易地取得,所述保藏中心诸如美国典型培养物保藏中心(the American Type Culture Collection)(ATCC)、德意志微生物和细胞培养物保藏中心(Deutsche Sammiung vonMikroorganismen und Zellkulturen GmbH)(DSM)、真菌菌种保藏中心 (Centraalbureau Voor Schimmelcultures)(CBS)和农业研究机构专利培养物保藏中心,北区研究中心(Agricultural Research Service Patent Culture Collection,Northern Regional Research Center)(NRRL)。 
在优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自内切葡聚糖酶I基因的多核苷酸编码。 
在另一个优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自内切葡聚糖酶II基因的多核苷酸编码。 
在另一个优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自内切葡聚糖酶III基因的多核苷酸编码。 
在另一个优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自内切葡聚糖酶IV基因的多核苷酸编码。 
在另一个优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自内切葡聚糖酶V基因的多核苷酸编码。在更优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自特异腐质霉内切葡聚糖酶V基因的多核苷酸编码。在最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自特异腐质霉内切葡聚糖酶V基因的多核苷酸编码,所述基因包含编码SEQ ID NO:30的多肽的SEQ ID NO:29。 
在另一个优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自内切葡聚糖酶VI基因的多核苷酸编码。 
在另一个优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自家族5内切葡聚糖酶基因的多核苷酸编码。在更优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自嗜热毁丝霉CBS 117.65内切葡聚糖酶基因的多核苷酸编码。在最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自嗜热毁丝霉CBS 117.65内切葡聚糖酶基因的多核苷酸编码,所述基因包含编码SEQ ID NO:32的多肽的SEQ ID NO:31。在另一个更优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自担子菌CBS 495.95内切葡聚糖酶基因的多核苷酸编码。在另一个最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自担子菌CBS 495.95内切葡聚糖酶基因的多核苷酸编码,所述基因包含编码SEQID NO:34的多肽的SEQ ID NO:33。在另一个更优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自担子菌CBS 494.95内切葡聚糖酶 基因的多核苷酸编码。在另一个最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自担子菌CBS 494.95内切葡聚糖酶基因的多核苷酸编码,所述基因包含编码SEQ ID NO:36的多肽的SEQ ID NO:35。 
在另一个优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自家族6内切葡聚糖酶基因的多核苷酸编码。在更优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自土生梭孢霉NRRL 8126CEL6B内切葡聚糖酶基因的多核苷酸编码。在最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自土生梭孢霉NRRL 8126 CEL6B内切葡聚糖酶基因的多核苷酸编码,所述基因包含编码SEQ ID NO:38的多肽的SEQ ID NO:37。在另一个更优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自土生梭孢霉NRRL 8126 CEL6C内切葡聚糖酶基因的多核苷酸编码。在另一个最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自土生梭孢霉NRRL 8126 CEL6C内切葡聚糖酶基因的多核苷酸编码,所述基因包含编码SEQ ID NO:40的多肽的SEQ ID NO:39。 
在另一个优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自家族7内切葡聚糖酶基因的多核苷酸编码。在更优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自土生梭孢霉NRRL 8126CEL7C内切葡聚糖酶基因的多核苷酸编码。在最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自土生梭孢霉NRRL 8126 CEL7C内切葡聚糖酶基因的多核苷酸编码,所述基因包含编码SEQ ID NO:42的多肽的SEQ ID NO:41。在另一个更优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自土生梭孢霉NRRL 8126 CEL7E内切葡聚糖酶基因的多核苷酸编码。在另一个最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自NRRL 8126 CEL7E内切葡聚糖酶基因的多核苷酸编码,所述基因包含编码SEQ ID NO:44的多肽的SEQ ID NO:43。在另一个更优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自土生梭孢霉NRRL 8126 CEL7F内切葡聚糖酶基因的多核苷酸编码。在另一个最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自NRRL8126 CEL7F内切葡聚糖酶基因的多核苷酸编码,所述基因包含编码SEQ IDNO:46的多肽的SEQ ID NO:45。在另一个更优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自Cladorrhinum foecundissimum ATCC 62373 CEL7A内切葡聚糖酶基因的多核苷酸编码。在另一个最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自Cladorrhinumfoecundissimum ATCC 62373 CEL7A内切葡聚糖酶基因的多核苷酸编码,所述基因包含编码SEQ ID NO:48的多肽的SEQ ID NO:47。 
在另一个最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自里氏木霉菌株VTT-D-80133内切葡聚糖酶基因的多核苷酸编码,所述基因包含编码SEQ ID NO:50的多肽的SEQ ID NO:49(GenBankTM登录号M15665)。 
在另一个优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自家族9内切葡聚糖酶基因的多核苷酸编码。 
在另一个优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自家族12内切葡聚糖酶基因的多核苷酸编码。 
在另一个优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自家族45内切葡聚糖酶基因的多核苷酸编码。在更优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自家族45内切葡聚糖酶基因的多核苷酸编码。在最优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自特异腐质霉内切葡聚糖酶V基因的多核苷酸或其直向同源物和变体编码,所述基因包含编码SEQ ID NO:30的多肽的SEQ ID NO:29。其它优选的家族45内切葡聚糖酶及其多核苷酸获得子金孢霉菌种C1(美国专利6,573,086;GenPept登录号AAQ38150);Corynascus heterothallicus(美国专利6,855,531;GenPept登录号AAY00844);马瘤胃壶菌属(Eberhardt等,2000,Microbiology 146:1999-2008;GenPept登录号CAB92325);和米根霉(Moriya等,2003,J.Bacteriology 185:1749-1756;GenBankTM登录号AB047927、AB056667,和AB056668)。 
在另一个优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自家族74内切葡聚糖酶基因的多核苷酸编码。 
在优选的方面,β-葡糖苷酶的全长多肽、成熟多肽,或催化域由获得自家族1β-葡糖苷酶基因的多核苷酸编码。 
在另一个优选的方面,β-葡糖苷酶的全长多肽、成熟多肽,或催化域由获得自家族3β-葡糖苷酶基因的多核苷酸编码。 
在另一个优选的方面,β-葡糖苷酶的全长多肽、成熟多肽,或催化域由 获得自家族5β-葡糖苷酶基因的多核苷酸编码。 
在另一个优选的方面,β-葡糖苷酶的全长多肽、成熟多肽,或催化域由获得自米曲霉β-葡糖苷酶基因的多核苷酸编码。在最优选的实施方案中,β-葡糖苷酶的全长多肽、成熟多肽,或催化域由获得自米曲霉β-葡糖苷酶基因的多核苷酸编码,所述基因包含编码SEQ ID NO:16的多肽的SEQ ID NO:15,或者获得自米曲霉β-葡糖苷酶突变基因,所述基因包含编码SEQ ID NO:18的多肽的SEQ ID NO:17。 
在另一个优选的方面,β-葡糖苷酶的全长多肽、成熟多肽,或催化域由获得自烟曲霉β-葡糖苷酶基因的多核苷酸编码。在最优选的实施方案中,β-葡糖苷酶的全长多肽、成熟多肽,或催化域由获得自烟曲霉β-葡糖苷酶基因的多核苷酸编码,所述基因包含编码SEQ ID NO:20的多肽的SEQ ID NO:19。 
在另一个优选的方面,β-葡糖苷酶的全长多肽、成熟多肽,或催化域由获得自巴西青霉菌株IBT 20888β-葡糖苷酶基因的多核苷酸编码。在最优选的实施方案中,β-葡糖苷酶的全长多肽、成熟多肽,或催化域由获得自巴西青霉菌株IBT 20888β-葡糖苷酶基因的多核苷酸编码,所述基因包含编码SEQID NO:22的多肽的SEQ ID NO:21。 
在另一个优选的方面,β-葡糖苷酶的全长多肽、成熟多肽,或催化域由获得自里氏木霉菌株QM9414 β-葡糖苷酶基因的多核苷酸编码。在最优选的实施方案中,β-葡糖苷酶的全长多肽、成熟多肽,或催化域由获得自里氏木霉菌株QM9414β-葡糖苷酶基因的多核苷酸编码,所述基因包含编码SEQ IDNO:24的多肽的SEQ ID NO:23(GenBankTM登录号U09580)。 
在另一个优选的方面,β-葡糖苷酶的全长多肽、成熟多肽,或催化域由获得自黑曲霉β-葡糖苷酶基因的多核苷酸编码。在最优选的实施方案中,β-葡糖苷酶的全长多肽、成熟多肽,或催化域由获得自黑曲霉β-葡糖苷酶基因的多核苷酸编码,所述基因包含编码SEQ ID NO:26的多肽的SEQ ID NO:25。 
在另一个优选的方面,β-葡糖苷酶的全长多肽、成熟多肽,或催化域由获得自棘孢曲霉β-葡糖苷酶基因的多核苷酸编码。在最优选的实施方案中,β-葡糖苷酶的全长多肽、成熟多肽,或催化域由获得自棘孢曲霉β-葡糖苷酶基因的多核苷酸编码,所述基因包含编码SEQ ID NO:28的多肽的SEQ ID NO:27。 
在另一个优选的方面,β-葡糖苷酶是天然分泌的。在另一个优选的方面,β-葡糖苷酶不是天然分泌的。 
在另一个优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由获得自编码同源多肽的基因的多核苷酸编码,其中所述同源多肽包含以下氨基酸序列或由其组成,所述氨基酸序列与SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48,或SEQ ID NO:50的全长多肽、成熟多肽或催化域的氨基酸序列具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%,97%,98%,或99%的同一性程度,其具有内切葡聚糖酶活性。在优选的方面,同源多肽具有以下氨基酸序列,所述氨基酸序列与SEQ ID NO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48,或SEQ ID NO:50的全长多肽、成熟多肽或催化域相差十个氨基酸,优选相差五个氨基酸,更优选相差四个氨基酸,甚至更优选相差三个氨基酸,最优选相差两个氨基酸,并且甚至最优选相差一个氨基酸。 
在另一个优选的方面,β-葡糖苷酶的全长多肽、成熟多肽,或催化域由获得自编码同源多肽的基因的多核苷酸编码,其中所述同源多肽包含或组成为以下氨基酸序列,所述氨基酸序列与SEQ ID NO:16、SEQ ID NO:18、SEQID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26,或SEQ ID NO:28的全长多肽、成熟多肽或催化域的氨基酸序列具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%,97%,98%,或99%的同一性程度,其具有内切葡聚糖酶活性。在优选的方面,同源多肽包含或组成为以下氨基酸序列,所述氨基酸序列与SEQ ID NO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26,或SEQ ID NO:28的全长多肽、成熟多肽或催化域相差十个氨基酸,优选相差五个氨基酸,更优选相差四个氨基酸,甚至更优选相差三个氨基酸,最优选相差两个氨基酸,并且甚至最优选相差一个氨基酸。 
在另一个优选的方面,内切葡聚糖酶的全长多肽、成熟多肽,或催化域由包含或组成为以下核苷酸序列的多核苷酸编码,所述核苷酸序列在非常低严紧条件下,优选低严紧条件下,更优选中严紧条件下,更优选中-高严紧条 件下,甚至更优选高严紧条件下,并且最优选非常高严紧条件下,与以下序列杂交:(i)SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:47,或SEQ ID NO:49,(ii)包含在SEQ ID NO:29、SEQ IDNO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:47,或SEQ IDNO:49中的cDNA序列,或包含SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQID NO:43、SEQ ID NO:45、SEQ ID NO:47,或SEQ ID NO:49的基因组DNA序列,(iii)(i)或(ii)的亚序列,或(iv)(i)、(ii)或(iii)的全长互补链(JJ.Sambrook,E.F.Fritsch和T.Maniatis,1989,Molecular Cloning,A Laboratory Manual,第2版,Cold Spring Harbor,New York)。SEQ ID NO:29、SEQ ID NO:31、SEQ IDNO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:47,或SEQ ID NO:49的亚序列含有至少100个连续的核苷酸或优选至少200个连续的核苷酸。 
在另一个优选的方面,β-葡糖苷酶的全长多肽、成熟多肽,或催化域由包含或组成为以下核苷酸序列的多核苷酸编码,所述核苷酸序列在非常低严紧条件下,优选低严紧条件下,更优选中严紧条件下,更优选中-高严紧条件下,甚至更优选高严紧条件下,并且最优选非常高严紧条件下,与以下杂交:(i)SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ IDNO:23、SEQ ID NO:25,或SEQ ID NO:27,(ii)包含在SEQ ID NO:17、SEQID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25,或SEQ ID NO:27中的cDNA序列,或包含SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25,或SEQ ID NO:27的基因组DNA序列,(iii)(i)或(ii)的亚序列,或(iv)(i)、(ii)或(iii)的全长互补链(J J.Sambrook,E.F.Fritsch和T.Maniatis,1989,Molecular Cloning,A LaboratoryManual,第2版,Cold Spring Harbor,New York)。SEQ ID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25,或SEQ ID NO:27的亚序列含有至少100个连续的核苷酸或优选至少200个连续的核苷酸。 
SEQ ID NO:29、SEQ ID NO:31、SEQ ID NO:33、SEQ ID NO:35、SEQ ID NO:37、SEQ ID NO:39、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:45、SEQ ID NO:47,或SEQ ID NO:49的核苷酸序列,或其亚序列,以及SEQ IDNO:30、SEQ ID NO:32、SEQ ID NO:34、SEQ ID NO:36、SEQ ID NO:38、SEQ ID NO:40、SEQ ID NO:42、SEQ ID NO:44、SEQ ID NO:46、SEQ ID NO:48,或SEQ ID NO:50的氨基酸序列,或其用于内切葡聚糖酶的片段,和SEQID NO:15、SEQ ID NO:17、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23、SEQ ID NO:25,或SEQ ID NO:27的核苷酸序列,或其亚序列,以及SEQ IDNO:16、SEQ ID NO:18、SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、SEQ ID NO:26,或SEQ ID NO:28的氨基酸序列,或其用于β-葡糖苷酶的片段,可用于设计核酸探针,以从不同属和种的菌株鉴定和克隆编码具有内切葡聚糖酶或β-葡糖苷酶活性的多肽的DNA,如上文所述。 
就本发明而言,杂交表示核苷酸序列在非常低至非常高的严紧条件下与对应于上述核苷酸序列之一的标记的核酸探针杂交,如上文所述。 
对于长度至少100个核苷酸的长探针,非常低至非常高的严紧条件如在本文所定义。 
对于长度为至少100个核苷酸的长探针,将载体材料进行最终洗涤,如在本文中定义。 
对于长度大约15个核苷酸至大约70个核苷酸的短探针,严紧条件如本文所定义。 
对于长度大约15个核苷酸至大约70个核苷酸的短探针,将载体材料进行洗涤,如在本文中定义。 
在另一个优选方面,也可以使用如“具有纤维二糖水解酶或内切葡聚糖酶活性的多肽及其多核苷酸”部分所述的内切葡聚糖酶的全长多肽、成熟多肽,或催化域构建β-葡糖苷酶融合蛋白。 
在优选的方面,β-葡糖苷酶融合蛋白包含或组成为SEQ ID NO:104。在另一优选的方面,β-葡糖苷酶融合蛋白由包含或组成为SEQ ID NO:103的多核苷酸编码。在另一优选的方面,β-葡糖苷酶融合蛋白包含或组成为SEQ IDNO:106。在另一优选的方面,β-葡糖苷酶融合蛋白由包含或组成为SEQ IDNO:105的多核苷酸编码。 
如上所述,很多内切葡聚糖酶具有通过接头肽与纤维素结合域分隔开的催化域组成的多域结构。在本发明的方法中,β-葡糖苷酶融合构建体进一步 包含接头,所述接头位于包含内切葡聚糖酶催化域的序列3’,和包含β-葡糖苷酶催化域的序列5’。 
接头可以获得自与内切葡聚糖酶催化域相同的基因,或者获得自不同的内切葡聚糖酶基因。另一方面,接头可以是合成来源的。 
能用于本发明的方法中的接头的实例包括,但不限于,获得自下述酶的基因的接头:里氏木霉纤维二糖水解酶I(Srisodsuk等,1993,Journal of BiologicalChemistry 268:20765-20761);红褐肉座菌(Hypocrea jecorina)(以前为里氏木霉)Cel7A纤维二糖水解酶(Mulakala等,2005,Proteins 60:598-605);特异腐质霉内切葡聚糖酶V;和土生梭孢霉NRRL 8126 CEL7C内切葡聚糖酶。 
在优选的方面,接头获得自特异腐质霉内切葡聚糖酶基因。在另一优选的方面,接头获得自里氏木霉内切葡聚糖酶基因。在更优选的方面,接头获得自特异腐质霉内切葡聚糖酶V(eg5)基因。 
在另一个优选的方面,接头获得自土生梭孢霉内切葡聚糖酶基因。在另一更优选的方面,接头获得自土生梭孢霉NRRL 8126 CEL7C内切葡聚糖酶基因。 
在优选的方面,接头至少为5个氨基酸残基。在更优选的方面,接头至少为15个氨基酸残基。在最优选的方面,接头至少为25个氨基酸残基。 
在优选的方面,接头在约5至60个氨基酸残基之间。在更优选的方面,接头在约15至50个氨基酸残基之间。在最优选的方面,接头在约25至45个氨基酸残基之间。 
尽管已经描述了很多类型的糖结合域,但是其中大部分通常称作纤维素结合域(CBD)。典型的纤维素结合域出现在纤维素酶中。相似地,CBD的其它亚类可包括,例如,几丁质结合域(通常出现在几丁质酶中的CBD)、甘露聚糖结合域(通常出现在甘露聚糖酶中的CBD)和淀粉结合域。 
CBD作为大的多肽或蛋白质的整合部分存在,其中所述大的多肽或蛋白质由两个或多个多肽氨基酸序列区组成,特别是在水解酶中,其通常包含催化域和糖结合域(CBD),催化域包含用于底物水解的活性位点,而糖结合域用于结合所述的糖底物。这种酶包含多于一个催化域和一个、两个或三个CBD,任选地还包含一个或多个(几个)连接CBD与催化域的多肽氨基酸序列区,后一类型的区域通常称作“接头”。包含CBD的水解酶的实例为纤维素酶、木聚糖酶、甘露聚糖酶、阿拉伯呋喃糖苷酶、乙酰酯酶和几丁质酶(参见P.Tomme等,Cellulose-Binding Domains-Classification and Properties in Enzymatic Degradation of Insoluble Carbohydrates,John N.Saddler和Michael H.Penner(编),ACS Symposium Series,No.618,1996)。大多数已知的CBD源自纤维素酶和木聚糖酶。 
CBD可以位于蛋白质或多肽的N或C末端,或者内部位置。多肽或蛋白质的构成CBD的区域通常由多于约30个并少于约250个氨基酸残基组成。例如依照Tomme等,1996,上文中列出并归类入家族I中的那些CBD,其由33-37个氨基酸残基组成;列出并归类入家族IIa类中的那些CBD,其由95-108个氨基酸残基组成;列出并归类入家族VI类中的那些CBD,其由85-92个氨基酸残基组成;和列出并归类入家族VII类中的一个CBD(源自来自热纤维梭菌(Clostridium thermocellum)的纤维素酶),其由240个氨基酸残基组成。因此,构成CBD的氨基酸序列的分子量通常在约4kDa至约40kDa的范围内,并通常低于约35kDa。 
在本发明的方法中,可以使用任何CBD。CBD可以与内切葡聚糖酶天然相关,或者可以对于内切葡聚糖酶是异源的。 
在优选的方面,CBD获得自里氏木霉内切葡聚糖酶(EG)基因。在更优选的方面,CBD获得自里氏木霉内切葡聚糖酶EGI基因。在另一更优选的方面,CBD获得自里氏木霉内切葡聚糖酶EGII基因。在另一更优选的方面,CBD获得自里氏木霉内切葡聚糖酶EGV。 
在另一个优选的方面,CBD获得自里氏木霉纤维二糖水解酶(CBH)基因。在另一优选的方面,CBD获得自里氏木霉CBHI基因(Terri等,1987,Gene 51:42-52;Linder和Teeri,1996,Biochemistry 93:12251-12255)。在另一优选的方面,CBD获得自里氏木霉内切葡聚糖酶CBHII基因。 
在另一个优选的方面,CBD获得自土生梭孢霉内切葡聚糖酶基因。在另一更优选的方面,CBD获得自土生梭孢霉NRRL 8126 CEL7C内切葡聚糖酶基因。 
β-葡糖苷酶融合构建体可进一步包含切割位点。切割位点优选位于至少包含内切葡聚糖酶催化域的序列之后,并位于至少包含β-葡糖苷酶催化域的序列之前。通过β-葡糖苷酶融合蛋白的分泌,位点被切割以释放来自融合蛋白的有β-葡糖苷酶活性的多肽。 
切割位点的实例包括,但不限于,编码二肽Lys-Arg的Kex2位点(Martin等,2003,J.Ind.Microbiol.Biotechnol.3:568-76;Svetina等,2000,J.Biotechnol. 76:245-251;Rasmussen-Wilson等,1997,Appl.Environ.Microbiol.63:3488-3493;Ward等,1995,Biotechnology 13:498-503;和Contreras等,1991,Biotechnology 9:378-381),在精氨酸残基之后被因子Xa蛋白酶切割的Ile-(Glu或Asp)-Gly-Arg位点(Eaton等,1986,Biochem.25:505-512);在赖氨酸之后被肠激酶切割的Asp-Asp-Asp-Asp-Lys位点(Collins-Racie等,1995,Biotechnology 13:982-987);被Genenase I切割的His-Tyr-Glu或His-Tyr-Asp位点(Carte等,1989,Proteins:Structure,Function and Genetics 6:240-248);在Arg之后被凝血酶切割的Leu-Val-Pro-Arg-Gly-Ser位点(Stevens,2003,Drug Discovery World 4:35-48);在Gln之后被TEV蛋白酶切割的Glu-Asn-Leu-Tyr-Phe-Gln-Gly位点(Stevens,2003,见上文);和在Gln之后被遗传工程化形式的人鼻病毒3C蛋白酶切割的Leu-Glu-Val-Leu-Phe-Gln-Gly-Pro位点(Stevens,2003,见上文)。 
具有纤维二糖水解酶或内切葡聚糖酶活性的多肽及其多核苷酸 
在本发明中,具有纤维二糖水解酶或内切葡聚糖酶活性的多肽及它们的多核苷酸优选选自下组:里氏木霉纤维二糖水解酶I(CEL7A),里氏木霉纤维二糖水解酶II(CEL6A),和里氏木霉内切葡聚糖酶I(CEL7B),及其直向同源物或变体,还选自下组:里氏木霉内切葡聚糖酶II(CEL5A),里氏木霉内切葡聚糖酶III(CEL12A),和里氏木霉内切葡聚糖酶V(CEL45A),及其直向同源物或变体。 
在第一方面,具有纤维二糖水解酶I活性的分离的多肽包含或组成为以下氨基酸序列,所述氨基酸序列与SEQ ID NO:52(里氏木霉纤维二糖水解酶I;CEL7A)的成熟多肽具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%,97%,98%,或99%同一性程度,其具有纤维二糖水解酶I活性(下文称作“同源多肽”)。在优选的方面,同源多肽包含或组成为以下氨基酸序列,所述氨基酸序列与SEQ ID NO:52的成熟多肽相差十个氨基酸,优选相差五个氨基酸,更优选相差四个氨基酸,甚至更优选相差三个氨基酸,最优选相差两个氨基酸,并且甚至最优选相差一个氨基酸。 
具有纤维二糖水解酶I活性的多肽优选包含SEQ ID NO:52的氨基酸序列或其等位变体;或其具有纤维二糖水解酶I活性的片段。在优选的方面, 多肽包含SEQ ID NO:52的氨基酸序列。在另一优选的方面,多肽包含SEQ IDNO:52的成熟多肽。在另一优选的方面,多肽包含SEQ ID NO:52的氨基酸18至514,或其等位变体;或其具有纤维二糖水解酶I活性的片段。在另一优选的方面,多肽包含SEQ ID NO:52的氨基酸18至514。在另一优选的方面,多肽由SEQ ID NO:52的氨基酸序列或其等位变体;或其具有纤维二糖水解酶I活性的片段组成。在另一优选的方面,多肽由SEQ ID NO:52的氨基酸序列组成。在另一优选的方面,多肽由SEQ ID NO:52的成熟多肽组成。在另一优选的方面,多肽由SEQ ID NO:52的氨基酸18至514或其等位变体;或其具有纤维二糖水解酶I活性的片段组成。在另一优选的方面,多肽由SEQID NO:52的氨基酸18至514组成。 
在另一个第一方面,具有纤维二糖水解酶II活性的分离的多肽包含或组成为以下氨基酸序列,所述氨基酸序列与SEQ ID NO:54(里氏木霉纤维二糖水解酶II;CEL6A)的成熟多肽具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%,97%,98%,或99%同一性程度,其具有纤维二糖水解酶I活性(下文称作“同源多肽”)。在优选的方面,同源多肽包含或组成为氨基酸序列,所述氨基酸序列与SEQ IDNO:54的成熟多肽相差十个氨基酸,优选相差五个氨基酸,更优选相差四个氨基酸,甚至更优选相差三个氨基酸,最优选相差两个氨基酸,并且甚至最优选相差一个氨基酸。 
具有纤维二糖水解酶II活性的多肽优选包含SEQ ID NO:54的氨基酸序列或其等位变体;或其具有纤维二糖水解酶II活性的片段。在优选的方面,多肽包含SEQ ID NO:54的氨基酸序列。在另一优选的方面,多肽包含SEQ IDNO:54的成熟多肽。在另一优选的方面,多肽包含SEQ ID NO:54的氨基酸25至471,或其等位变体;或其具有纤维二糖水解酶II活性的片段。在另一优选的方面,多肽包含SEQ ID NO:54的氨基酸25至471。在另一优选的方面,多肽由SEQ ID NO:54的氨基酸序列或其等位变体;或其具有纤维二糖水解酶II活性的片段组成。在另一优选的方面,多肽由SEQ ID NO:54的氨基酸序列组成。在另一优选的方面,多肽由SEQ ID NO:54的成熟多肽组成。在另一优选的方面,多肽由SEQ ID NO:54的氨基酸25至471或其等位变体;或其具有纤维二糖水解酶II活性的片段组成。在另一优选的方面,多肽由SEQ ID NO:54的氨基酸25至471组成。 
在另一个第一方面,具有内切葡聚糖酶I活性的分离的多肽包含或组成为以下氨基酸序列,所述氨基酸序列与SEQ ID NO:56(里氏木霉内切葡聚糖酶I;CEL7B)的成熟多肽具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%,97%,98%,或99%同一性程度,其具有内切葡聚糖酶I活性(下文称作“同源多肽”)。在优选的方面,同源多肽包含或组成为以下氨基酸序列,所述氨基酸序列与SEQ IDNO:56的成熟多肽相差十个氨基酸,优选相差五个氨基酸,更优选相差四个氨基酸,甚至更优选相差三个氨基酸,最优选相差两个氨基酸,并且甚至最优选相差一个氨基酸。 
具有内切葡聚糖酶I活性的多肽优选包含SEQ ID NO:56的氨基酸序列或其等位变体;或其具有内切葡聚糖酶I活性的片段。在优选的方面,多肽包含SEQ ID NO:56的氨基酸序列。在另一优选的方面,多肽包含SEQ ID NO:56的成熟多肽。在另一优选的方面,多肽包含SEQ ID NO:56的氨基酸23至459,或其等位变体;或其具有内切葡聚糖酶I活性的片段。在另一优选的方面,多肽包含SEQ ID NO:56的氨基酸23至459。在另一优选的方面,多肽由SEQ ID NO:56的氨基酸序列或其等位变体;或其具有内切葡聚糖酶I活性的片段组成。在另一优选的方面,多肽由SEQ ID NO:56的氨基酸序列组成。在另一优选的方面,多肽由SEQ ID NO:56的成熟多肽组成。在另一优选的方面,多肽由SEQ ID NO:56的氨基酸23至459或其等位变体;或其具有内切葡聚糖酶I活性的片段组成。在另一优选的方面,多肽由SEQ ID NO:56的氨基酸23至459组成。 
在另一个第一方面,具有内切葡聚糖酶II活性的分离的多肽包含或组成为以下氨基酸序列,所述氨基酸序列与SEQ ID NO:58(里氏木霉内切葡聚糖酶II;CEL5A)的成熟多肽具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%,97%,98%,或99%同一性程度,其具有内切葡聚糖酶II活性(下文称作“同源多肽”)。在优选的方面,同源多肽包含或组成为以下氨基酸序列,所述氨基酸序列与SEQ IDNO:58的成熟多肽相差十个氨基酸,优选相差五个氨基酸,更优选相差四个 氨基酸,甚至更优选相差三个氨基酸,最优选相差两个氨基酸,并且甚至最优选相差一个氨基酸。 
具有内切葡聚糖酶II活性的多肽优选包含SEQ ID NO:58的氨基酸序列或其等位变体;或其具有内切葡聚糖酶II活性的片段。在优选的方面,多肽包含SEQ ID NO:58的氨基酸序列。在另一优选的方面,多肽包含SEQ ID NO:58的成熟多肽。在另一优选的方面,多肽包含SEQ ID NO:58的氨基酸22至418,或其等位变体;或其具有内切葡聚糖酶II活性的片段。在另一优选的方面,多肽包含SEQ ID NO:58的氨基酸22至418。在另一优选的方面,多肽由SEQ ID NO:58的氨基酸序列或其等位变体;或其具有内切葡聚糖酶II活性的片段组成。在另一优选的方面,多肽由SEQ ID NO:58的氨基酸序列组成。在另一优选的方面,多肽由SEQ ID NO:52的成熟多肽组成。在另一优选的方面,多肽由SEQ ID NO:58的氨基酸22至418或其等位变体;或其具有内切葡聚糖酶II活性的片段组成。在另一优选的方面,多肽由SEQ IDNO:58的氨基酸22至418组成。 
在另一个第一方面,具有内切葡聚糖酶III活性的分离的多肽包含或组成为以下氨基酸序列,所述氨基酸序列与SEQ ID NO:60(里氏木霉内切葡聚糖酶III;CEL12A)的成熟多肽具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%,97%,98%,或99%同一性程度,其具有内切葡聚糖酶III活性(下文称作“同源多肽”)。在优选的方面,同源多肽包含或组成为以下氨基酸序列,所述氨基酸序列与SEQ ID NO:60的成熟多肽相差十个氨基酸,优选相差五个氨基酸,更优选相差四个氨基酸,甚至更优选相差三个氨基酸,最优选相差两个氨基酸,并且甚至最优选相差一个氨基酸。 
具有内切葡聚糖酶III活性的多肽优选包含SEQ ID NO:60的氨基酸序列或其等位变体;或其具有内切葡聚糖酶III活性的片段。在优选的方面,多肽包含SEQ ID NO:60的氨基酸序列。在另一优选的方面,多肽包含SEQ ID NO:60的成熟多肽。在另一优选的方面,多肽包含SEQ ID NO:60的氨基酸17至234,或其等位变体;或其具有内切葡聚糖酶III活性的片段。在另一优选的方面,多肽包含SEQ ID NO:60的氨基酸17至234。在另一优选的方面,多肽由SEQ ID NO:60的氨基酸序列或其等位变体;或其具有内切葡聚糖酶 III活性的片段组成。在另一优选的方面,多肽由SEQ ID NO:60的氨基酸序列组成。在另一优选的方面,多肽由SEQ ID NO:60的成熟多肽组成。在另一优选的方面,多肽由SEQ ID NO:60的氨基酸17至234或其等位变体;或其具有内切葡聚糖酶III活性的片段组成。在另一优选的方面,多肽由SEQ IDNO:60的氨基酸17至234组成。 
在另一个第一方面,具有内切葡聚糖酶V活性的分离的多肽包含或组成为以下氨基酸序列,所述氨基酸序列与SEQ ID NO:62(内切葡聚糖酶V;CEL45A)的成熟多肽具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,甚至更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%,97%,98%,或99%同一性程度,其具有内切葡聚糖酶V活性(下文称作“同源多肽”)。在优选的方面,同源多肽包含或组成为以下氨基酸序列,所述氨基酸序列与SEQ ID NO:62的成熟多肽相差十个氨基酸,优选相差五个氨基酸,更优选相差四个氨基酸,甚至更优选相差三个氨基酸,最优选相差两个氨基酸,并且甚至最优选相差一个氨基酸。 
具有内切葡聚糖酶V活性的多肽优选包含SEQ ID NO:62的氨基酸序列或其等位变体;或其具有内切葡聚糖酶V活性的片段。在优选的方面,多肽包含SEQ ID NO:62的氨基酸序列。在另一优选的方面,多肽包含SEQ ID NO:62的成熟多肽。在另一优选的方面,多肽包含SEQ ID NO:62的氨基酸18至242,或其等位变体;或其具有内切葡聚糖酶V活性的片段。在另一优选的方面,多肽包含SEQ ID NO:62的氨基酸18至242。在另一优选的方面,多肽由SEQ ID NO:62的氨基酸序列或其等位变体;或其具有内切葡聚糖酶V活性的片段组成。在另一优选的方面,多肽由SEQ ID NO:62的氨基酸序列组成。在另一优选的方面,多肽由SEQ ID NO:62的成熟多肽组成。在另一优选的方面,多肽由SEQ ID NO:62的氨基酸18至242或其等位变体;或其具有内切葡聚糖酶V活性的片段组成。在另一优选的方面,多肽由SEQ IDNO:62的氨基酸18至242组成。 
在另一个第一方面,具有纤维二糖水解酶II活性的分离的多肽包含或组成为以下氨基酸序列,所述氨基酸序列与SEQ ID NO:64(土生梭孢霉纤维二糖水解酶II;CEL6A)的成熟多肽具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,甚至更优选至少85%,甚 至更优选至少90%,最优选至少95%,并且甚至最优选至少96%,97%,98%,或99%同一性程度,其具有纤维二糖水解酶II活性(下文称作“同源多肽”)。在优选的方面,同源多肽包含或组成为以下氨基酸序列,所述氨基酸序列与SEQ ID NO:64的成熟多肽相差十个氨基酸,优选相差五个氨基酸,更优选相差四个氨基酸,甚至更优选相差三个氨基酸,最优选相差两个氨基酸,并且甚至最优选相差一个氨基酸。 
具有纤维二糖水解酶II活性的多肽优选包含SEQ ID NO:64的氨基酸序列或其等位变体;或其具有纤维二糖水解酶II活性的片段。在优选的方面,多肽包含SEQ ID NO:64的氨基酸序列。在另一优选的方面,多肽包含SEQ IDNO:64的成熟多肽。在另一优选的方面,多肽包含SEQ ID NO:64的氨基酸18至481,或其等位变体;或其具有纤维二糖水解酶II活性的片段。在另一优选的方面,多肽包含SEQ ID NO:64的氨基酸18至481。在另一优选的方面,多肽由SEQ ID NO:64的氨基酸序列或其等位变体;或其具有纤维二糖水解酶II活性的片段组成。在另一优选的方面,多肽由SEQ ID NO:64的氨基酸序列组成。在另一优选的方面,多肽由SEQ ID NO:64的成熟多肽组成。在另一优选的方面,多肽由SEQ ID NO:64的氨基酸18至481或其等位变体;或其具有纤维二糖水解酶II活性的片段组成。在另一优选的方面,多肽由SEQID NO:64的氨基酸18至481组成。 
优选地,SEQ ID NO:52的成熟多肽的片段包含至少425个氨基酸残基,更优选地至少450个氨基酸残基,并且最优选至少475个氨基酸残基。优选地,SEQ ID NO:54的成熟多肽的片段包含至少390个氨基酸残基,更优选地至少410个氨基酸残基,并且最优选至少430个氨基酸残基。优选地,SEQ ID NO:56的成熟多肽的片段包含至少370个氨基酸残基,更优选地至少390个氨基酸残基,并且最优选至少410个氨基酸残基。优选地,SEQ ID NO:58的成熟多肽的片段包含至少340个氨基酸残基,更优选地至少360个氨基酸残基,并且最优选至少380个氨基酸残基。优选地,SEQ ID NO:60的成熟多肽的片段包含至少190个氨基酸残基,更优选地至少200个氨基酸残基,并且最优选至少210个氨基酸残基。优选地,SEQ ID NO:62的成熟多肽的片段包含至少190个氨基酸残基,更优选地至少200个氨基酸残基,并且最优选至少210个氨基酸残基。优选地,SEQ ID NO:64的成熟多肽的片段包含至少400个氨基酸残基,更优选地至少420个氨基酸残基,并且最优选至少440个氨基酸残基。 
优选地,SEQ ID NO:51的成熟多肽编码序列的亚序列包含至少1275个核苷酸,更优选地至少1350个核苷酸,并且最优选至少1425个核苷酸。优选地,SEQ ID NO:53的成熟多肽编码序列的亚序列包含至少1170个核苷酸,更优选地至少1230个核苷酸,并且最优选至少1290个核苷酸。优选地,SEQ ID NO:55的成熟多肽编码序列的亚序列包含至少1110个核苷酸,更优选地至少1170个核苷酸,并且最优选至少1230个核苷酸。优选地,SEQ ID NO:57的成熟多肽编码序列的亚序列包含至少1020个核苷酸,更优选地至少1080个核苷酸,并且最优选至少1140个核苷酸。优选地,SEQ ID NO:59的成熟多肽编码序列的亚序列包含至少570个核苷酸,更优选地至少600个核苷酸,并且最优选至少630个核苷酸。优选地,SEQ ID NO:61的成熟多肽编码序列的亚序列包含至少570个核苷酸,更优选地至少600个核苷酸,并且最优选至少630个核苷酸。优选地,SEQ ID NO:63的成熟多肽编码序列的亚序列包含至少1200个核苷酸,更优选地至少1260个核苷酸,并且最优选至少1320个核苷酸。 
在第二方面,具有纤维二糖水解酶I活性的分离的多肽由包含或组成为以下核苷酸序列的多核苷酸编码,所述核苷酸序列在至少非常低严紧条件下,优选至少低严紧条件下,更优选至少中严紧条件下,更优选至少中-高严紧条件下,甚至更优选至少高严紧条件下,并且最优选至少非常高严紧条件下,与以下杂交:(i)SEQ ID NO:51的成熟多肽编码序列,(ii)包含在SEQ ID NO:51的成熟多肽编码序列中的cDNA序列,或包含SEQ ID NO:51的成熟多肽编码序列的基因组DNA序列,(iii)(i)或(ii)的亚序列,或(iv)(i)、(ii)或(iii)的全长互补链(J.Sambrook,E.F.Fritsch和T.Maniatis,1989,见上文)。SEQ ID NO:51的成熟多肽编码序列的亚序列含有至少100个连续的核苷酸或优选至少200个连续的核苷酸。此外,所述亚序列可编码具有纤维二糖水解酶I活性的多肽片段。 
在另一个第二方面,具有纤维二糖水解酶II活性的分离的多肽由包含或组成为以下核苷酸序列的多核苷酸编码,所述核苷酸序列在至少非常低严紧条件下,优选至少低严紧条件下,更优选至少中严紧条件下,更优选至少中-高严紧条件下,甚至更优选至少高严紧条件下,并且最优选至少非常高严紧条件下,与以下杂交:(i)SEQ ID NO:53的成熟多肽编码序列,(ii)包含在SEQID NO:53的成熟多肽编码序列中的cDNA序列,或包含SEQ ID NO:53的成熟多肽编码序列的基因组DNA序列,(iii)(i)或(ii)的亚序列,或(iv)(i)、(ii)或(iii)的全长互补链(J.Sambrook,E.F.Fritsch和T.Maniatis,1989,见上文)。 SEQ ID NO:53的成熟多肽编码序列的亚序列含有至少100个连续的核苷酸或优选至少200个连续的核苷酸。此外,所述亚序列可编码具有纤维二糖水解酶II活性的多肽片段。 
在另一个第二方面,具有内切葡聚糖酶I活性的分离的多肽由包含或组成为以下核苷酸序列的多核苷酸编码,所述核苷酸序列在至少非常低严紧条件下,优选至少低严紧条件下,更优选至少中严紧条件下,更优选至少中-高严紧条件下,甚至更优选至少高严紧条件下,并且最优选至少非常高严紧条件下,与以下杂交:(i)SEQ ID NO:55的成熟多肽编码序列,(ii)包含在SEQID NO:55的成熟多肽编码序列中的cDNA序列,或包含SEQ ID NO:55的成熟多肽编码序列的基因组DNA序列,(iii)(i)或(ii)的亚序列,或(iv)(i)、(ii)或(iii)的全长互补链(J.Sambrook,E.F.Fritsch和T.Maniatis,1989,见上文)。SEQ ID NO:55的成熟多肽编码序列的亚序列含有至少100个连续的核苷酸或优选至少200个连续的核苷酸。此外,所述亚序列可编码具有纤维二糖水解酶II活性的多肽片段。 
在另一个第二方面,具有内切葡聚糖酶II活性的分离的多肽由包含或组成为以下核苷酸序列的多核苷酸编码,所述核苷酸序列在至少非常低严紧条件下,优选至少低严紧条件下,更优选至少中严紧条件下,更优选至少中-高严紧条件下,甚至更优选至少高严紧条件下,并且最优选至少非常高严紧条件下,与以下杂交:(i)SEQ ID NO:57的成熟多肽编码序列,(ii)包含在SEQID NO:57的成熟多肽编码序列中的cDNA序列,或包含SEQ ID NO:57的成熟多肽编码序列的基因组DNA序列,(iii)(i)或(ii)的亚序列,或(iv)(i)、(ii)或(iii)的全长互补链(J.Sambrook,E.F.Fritsch和T.Maniatis,1989,见上文)。SEQ ID NO:57的成熟多肽编码序列的亚序列含有至少100个连续的核苷酸或优选至少200个连续的核苷酸。此外,所述亚序列可编码具有内切葡聚糖酶II活性的多肽片段。 
在另一个第二方面,具有内切葡聚糖酶III活性的分离的多肽由包含或组成为以下核苷酸序列的多核苷酸编码,所述核苷酸序列在至少非常低严紧条件下,优选至少低严紧条件下,更优选至少中严紧条件下,更优选至少中-高严紧条件下,甚至更优选至少高严紧条件下,并且最优选至少非常高严紧条件下,与以下杂交:(i)SEQ ID NO:59的成熟多肽编码序列,(ii)包含在SEQID NO:59的成熟多肽编码序列中的cDNA序列,或包含SEQ ID NO:59的成 熟多肽编码序列的基因组DNA序列,(iii)(i)或(ii)的亚序列,或(iv)(i)、(ii)或(iii)的全长互补链(J.Sambrook,E.F.Fritsch和T.Maniatis,1989,见上文)。SEQ ID NO:59的成熟多肽编码序列的亚序列含有至少100个连续的核苷酸或优选至少200个连续的核苷酸。此外,所述亚序列可编码具有内切葡聚糖酶III活性的多肽片段。 
在另一个第二方面,具有内切葡聚糖酶V活性的分离的多肽由包含或组成为以下核苷酸序列的多核苷酸编码,所述核苷酸序列在至少非常低严紧条件下,优选至少低严紧条件下,更优选至少中严紧条件下,更优选至少中-高严紧条件下,甚至更优选至少高严紧条件下,并且最优选至少非常高严紧条件下,与以下杂交:(i)SEQ ID NO:61的成熟多肽编码序列,(ii)包含在SEQID NO:61的成熟多肽编码序列中的cDNA序列,或包含SEQ ID NO:61的成熟多肽编码序列的基因组DNA序列,(iii)(i)或(ii)的亚序列,或(iv)(i)、(ii)或(iii)的全长互补链(J.Sambrook,E.F.Fritsch和T.Maniatis,1989,见上文)。SEQ ID NO:61的成熟多肽编码序列的亚序列含有至少100个连续的核苷酸或优选至少200个连续的核苷酸。此外,所述亚序列可编码具有内切葡聚糖酶V活性的多肽片段。 
在另一个第二方面,具有纤维二糖水解酶II活性的分离的多肽由包含或组成为以下核苷酸序列的多核苷酸编码,所述核苷酸序列在至少非常低严紧条件下,优选至少低严紧条件下,更优选至少中严紧条件下,更优选至少中-高严紧条件下,甚至更优选至少高严紧条件下,并且最优选至少非常高严紧条件下,与以下杂交:(i)SEQ ID NO:63的成熟多肽编码序列,(ii)包含在SEQID NO:63的成熟多肽编码序列中的cDNA序列,或包含SEQ ID NO:63的成熟多肽编码序列的基因组DNA序列,(iii)(i)或(ii)的亚序列,或(iv)(i)、(ii)或(iii)的全长互补链(J.Sambrook,E.F.Fritsch和T.Maniatis,1989,见上文)。SEQ ID NO:63的成熟多肽编码序列的亚序列含有至少100个连续的核苷酸或优选至少200个连续的核苷酸。此外,所述亚序列可编码具有纤维二糖水解酶II活性的多肽片段。 
在优选的方面,所述成熟多肽编码序列是SEQ ID NO:51的核苷酸52至1542、SEQ ID NO:53的核苷酸73至1413、SEQ ID NO:55的核苷酸67至1377、SEQ ID NO:57的核苷酸64至1254、SEQ ID NO:59的核苷酸49至702、SEQID NO:61的核苷酸52至726,或SEQ ID NO:63的核苷酸52至1443。 
SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQID NO:59、SEQ ID NO:61,或SEQ ID NO:63的核苷酸序列或其亚序列,以及SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58,或SEQID NO:60、SEQ ID NO:62,或SEQ ID NO:64的氨基酸序列或其片段,可用于设计核酸探针,以从不同属和种的菌株鉴定和克隆编码具有纤维二糖水解酶或内切葡聚糖酶活性的多肽的DNA,如上所述。 
就本发明而言,杂交表示核苷酸序列在非常低至非常高的严紧条件下与标记的核酸探针杂交,所述核酸探针对应于SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61,或SEQ IDNO:63的成熟多肽编码序列,包含在SEQ ID NO:51、SEQ ID NO:53、SEQ IDNO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61,或SEQ ID NO:63的成熟多肽编码序列中的cDNA序列,或包含SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61,或SEQ ID NO:63的成熟多肽编码序列的基因组DNA序列,它的全长互补链,或它们的亚序列,如上文所述。 
在优选的方面,核酸探针是SEQ ID NO:51的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:51的核苷酸52至1542。在另一优选的方面,核酸探针是编码SEQ ID NO:52的多肽的多核苷酸序列,或其亚序列。在另一优选方面,核酸探针是SEQ ID NO:51。 
在另一优选的方面,核酸探针是SEQ ID NO:53的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:53的核苷酸73至1413。在另一优选的方面,核酸探针是编码SEQ ID NO:54的多肽的多核苷酸序列,或其亚序列。在另一优选方面,核酸探针是SEQ ID NO:53。 
在另一优选的方面,核酸探针是SEQ ID NO:55的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:55的核苷酸67至1377。在另一优选的方面,核酸探针是编码SEQ ID NO:56的多肽的多核苷酸序列,或其亚序列。在另一优选方面,核酸探针是SEQ ID NO:55。 
在另一优选的方面,核酸探针是SEQ ID NO:57的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:57的核苷酸64至1254。在另一优选的方面,核酸探针是编码SEQ ID NO:58的多肽的多核苷酸序列,或其亚序列。在另一优选方面,核酸探针是SEQ ID NO:57。 
在另一优选的方面,核酸探针是SEQ ID NO:59的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:59的核苷酸49至702。在另一优选的方面,核酸探针是编码SEQ ID NO:60的多肽的多核苷酸序列,或其亚序列。在另一优选方面,核酸探针是SEQ ID NO:59。 
在另一优选的方面,核酸探针是SEQ ID NO:61的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:61的核苷酸52至726。在另一优选的方面,核酸探针是编码SEQ ID NO:62的多肽的多核苷酸序列,或其亚序列。在另一优选方面,核酸探针是SEQ ID NO:61。 
在另一优选的方面,核酸探针是SEQ ID NO:63的成熟多肽编码序列。在另一优选的方面,核酸探针是SEQ ID NO:63的核苷酸52至1443。在另一优选的方面,核酸探针是编码SEQ ID NO:64的多肽的多核苷酸序列,或其亚序列。在另一优选方面,核酸探针是SEQ ID NO:63。在另一优选的方面,核酸探针是质粒pTter6A中包含的多核苷酸序列,所述质粒包含在大肠杆菌NRRL B-30802中,其中它的多核苷酸序列编码具有纤维二糖水解酶活性的多肽。在另一优选的方面,核酸探针是质粒pTter6A中包含的成熟多肽编码区,所述质粒包含在大肠杆菌NRRL B-30802中。 
对于长度至少100个核苷酸的长探针,非常低至非常高的严紧条件如本文所定义。 
对于长度为至少100个核苷酸的长探针,将载体材料进行最终洗涤,如在本文中定义。 
对于长度大约15个核苷酸至大约70个核苷酸的短探针,严紧条件如本文所定义。 
对于长度大约15个核苷酸至大约70个核苷酸的短探针,将载体材料进行洗涤,如在本文中定义。 
在第三方面,具有纤维二糖水解酶或内切葡聚糖酶活性的分离的多肽由包含或组成为以下核苷酸序列的多核苷酸编码,所述核苷酸序列与SEQ IDNO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57,或SEQ ID NO:59,SEQ ID NO:61,或SEQ ID NO:63的成熟多肽编码序列具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%,97%,98%,或99%的同一性程度,其编码活性多肽。 
在优选的方面,所述成熟多肽编码序列是SEQ ID NO:51的核苷酸52至1542,SEQ ID NO:53的核苷酸73至1413,SEQ ID NO:55的核苷酸67至1377,SEQ ID NO:57的核苷酸64至1254,SEQ ID NO:59的核苷酸49至702,SEQ ID NO:61的核苷酸52至726,或SEQ ID NO:63的核苷酸52至1443。参见本文中的多核苷酸部分。 
在第六方面,具有纤维二糖水解酶或内切葡聚糖酶活性的分离的多肽是人工变体,所述人工变体在SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQ ID NO:60、SEQ ID NO:62,或SEQ ID NO:64的成熟多肽或其同源序列中包含取代、缺失和/或插入一个或多个(或几个)氨基酸。制备这样的人工变体的方法如上文所述。 
SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58、SEQID NO:60、SEQ ID NO:62,或SEQ ID NO:64的成熟多肽中氨基酸取代、缺失和/或插入的总数是10,优选9,更优选8,更优选7,更优选至多6,更优选5,更优选4,甚至更优选3,最优选2,并且甚至最优选1。 
具有纤维二糖水解酶或内切葡聚糖酶活性的多肽可以获得自任何属的微生物。就本发明而言,如本文所定义的使用术语“获得自”。在优选的方面,获得自给定来源的多肽是胞外分泌的。 
具有纤维二糖水解酶或内切葡聚糖酶活性的多肽可以是细菌多肽。例如,多肽可以是具有纤维二糖水解酶或内切葡聚糖酶活性的革兰氏阳性细菌多肽,如芽孢杆菌属、链球菌属、链霉菌属、葡萄球菌属、肠球菌属、乳杆菌属、乳球菌属、梭菌属、地芽孢杆菌属,或海洋芽孢杆菌属多肽,或者具有纤维二糖水解酶或内切葡聚糖酶活性的革兰氏阴性细菌多肽,如大肠杆菌、假单胞菌属、沙门氏菌属、弯曲杆菌属、螺杆菌属、黄杆菌属、梭杆菌属、泥杆菌属、奈瑟氏菌属或脲原体属多肽。 
在优选的方面,多肽是具有纤维二糖水解酶或内切葡聚糖酶活性的嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌,或苏云金芽孢杆菌多肽。 
在另一个优选的方面,多肽是具有纤维二糖水解酶或内切葡聚糖酶活性的似马链球菌、酿脓链球菌、乳房链球菌,或马链球菌兽疫亚种多肽。 
在另一个优选的方面,多肽是具有纤维二糖水解酶或内切葡聚糖酶活性的不产色链霉菌、除虫链霉菌、天蓝色链霉菌、灰色链霉菌,或浅青紫链霉菌多肽。 
具有纤维二糖水解酶或内切葡聚糖酶活性的多肽还可以是具有纤维二糖水解酶或内切葡聚糖酶活性的真菌多肽,并且更优选是酵母多肽,如念珠菌属、克鲁维酵母属、毕赤酵母属、酵母属、裂殖酵母属或西洋蓍霉属多肽;或者更优选是具有纤维二糖水解酶或内切葡聚糖酶活性的丝状真菌多肽,如枝顶孢霉属、曲霉属、短梗霉属、隐球菌属、Filibasidium、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新考玛脂霉属、脉孢菌属、拟青霉属、青霉属、瘤胃壶菌属、裂褶菌属、踝节菌属、嗜热霉属、梭孢壳属、弯颈霉属、木霉属多肽。 
在优选的方面,多肽是具有纤维二糖水解酶或内切葡聚糖酶活性的卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母或卵形酵母多肽。 
在另一个优选的方面,多肽是具有纤维二糖水解酶或内切葡聚糖酶活性的棘孢曲霉、泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、灰盖鬼伞(Coprinus cinereus)、Diplodia gossyppina、杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、特异腐质霉、疏棉状腐质霉、灰梨孢菌、米赫毛霉、嗜热毁丝霉、粗糙脉孢菌、产紫青霉、黄孢平革菌、Pseudoplectania nigrella、桔橙嗜热霉、土生梭孢霉、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、绿色木霉或Trichophaea saccata多肽。 
在更优选的方面,多肽是具有纤维二糖水解酶或内切葡聚糖酶活性的里氏木霉多肽。在另一最优选的实施方案中,多肽是具有纤维二糖水解酶或内切葡聚糖酶活性的里氏木霉RutC30(ATCC 56765)多肽,例如,SEQ ID NO:52或54的成熟多肽,或其具有纤维二糖水解酶活性的片段,和SEQ ID NO:56、58、60或62的成熟多肽,或其具有内切葡聚糖酶活性的片段 
在另一更优选的方面,多肽是具有纤维二糖水解酶活性的土生梭孢霉多肽。在另一最优选的方面,多肽是具有纤维二糖水解酶II活性的土生梭孢霉(NRRL 8126)多肽,例如,SEQ ID NO:64的成熟多肽,或其具有纤维二糖水 解酶活性的片段。 
可理解的是对于前述的物种,本发明包含完全和不完全阶段两种,和其它分类学的等同物,例如无性型,无论它们已知的种名。本领域技术人员将轻易地识别适合的等同物的身份。 
这些物种的菌株在许多培养物保藏中心对于公众能够轻易地取得,所述保藏中心诸如美国典型培养物保藏中心(the American Type Culture Collection)(ATCC)、德意志微生物和细胞培养物保藏中心(Deutsche Sammiung vonMikroorganismen und Zellkulturen GmbH)(DSM)、真菌菌种保藏中心(Centraalbureau Voor Schimmelcultures)(CBS)和农业研究机构专利培养物保藏中心,北区研究中心(Agricultural Research Service Patent Culture Collection,Northern Regional Research Center)(NRRL)。 
此外,可以使用上述的探针从其它来源,包括从自然界(例如,土壤、堆肥、水等)分离的微生物鉴定和获得这些多肽,如本文所述。 
具有纤维二糖水解酶或内切葡聚糖酶活性的多肽还包括融合多肽或可切割的融合多肽,其中将另一种多肽融合到具有纤维二糖水解酶或内切葡聚糖酶活性的多肽或其片段的N末端或C末端。如本文所述产生融合多肽。 
可以分离包含或组成为核苷酸序列(其编码具有纤维二糖水解酶或内切葡聚糖酶活性的多肽)的多核苷酸并将其用于实施本发明的方法,如本文所述。 
多核苷酸包含或组成为以下核苷酸序列,所述核苷酸序列与SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQID NO:61,或SEQ ID NO:63的成熟多肽编码序列具有优选至少60%,更优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%,97%,98%或99%的同一性程度,其编码具有纤维二糖水解酶或内切葡聚糖酶活性的多肽。 
在优选的方面,核苷酸序列包含或组成为SEQ ID NO:51。在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:51的成熟多肽编码区。本发明还包括编码多肽的核苷酸序列,所述多肽包含或组成为SEQ ID NO:52的氨基酸序列或其成熟多肽,所述核苷酸序列由于遗传密码的简并性而不同于SEQ ID NO:51。本发明还涉及SEQ ID NO:51的亚序列,其编码SEQ ID NO:52的具有纤维二糖水解酶I活性的片段。 
在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:53。在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:53的成熟多肽编码区。本发明还包括编码多肽的核苷酸序列,所述多肽包含或组成为SEQ ID NO:54的氨基酸序列或其成熟多肽,所述核苷酸序列由于遗传密码的简并性而不同于SEQ ID NO:53。本发明还涉及SEQ ID NO:53的亚序列,其编码SEQ IDNO:54的具有纤维二糖水解酶II活性的片段。 
在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:55。在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:55的成熟多肽编码区。本发明还包括编码多肽的核苷酸序列,所述多肽包含或组成为SEQ ID NO:56的氨基酸序列或其成熟多肽,所述核苷酸序列由于遗传密码的简并性而不同于SEQ ID NO:55。本发明还涉及SEQ ID NO:55的亚序列,其编码SEQ IDNO:56的具有内切葡聚糖酶I活性的片段。 
在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:57。在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:57的成熟多肽编码区。本发明还包括编码多肽的核苷酸序列,所述多肽包含或组成为SEQ ID NO:58的氨基酸序列或其成熟多肽,所述核苷酸序列由于遗传密码的简并性而不同于SEQ ID NO:57。本发明还涉及SEQ ID NO:57的亚序列,其编码SEQ IDNO:58的具有内切葡聚糖酶II活性的片段。 
在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:59。在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:59的成熟多肽编码区。本发明还包括编码多肽的核苷酸序列,所述多肽包含或组成为SEQ ID NO:60的氨基酸序列或其成熟多肽,所述核苷酸序列由于遗传密码的简并性而不同于SEQ ID NO:59。本发明还涉及SEQ ID NO:59的亚序列,其编码SEQ IDNO:60的具有内切葡聚糖酶III活性的片段。 
在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:61。在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:61的成熟多肽编码区。本发明还包括编码多肽的核苷酸序列,所述多肽包含或组成为SEQ ID NO:62的氨基酸序列或其成熟多肽,所述核苷酸序列由于遗传密码的简并性而不同于SEQ ID NO:61。本发明还涉及SEQ ID NO:61的亚序列,其编码SEQ IDNO:62的具有内切葡聚糖酶V活性的片段。 
在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:63。在另一更 优选的方面,核苷酸序列包含或组成为质粒pTter6A所包含的序列,所述质粒包含在大肠杆菌NRRL B-30802中。在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:63的成熟多肽编码序列。在另一优选的方面,核苷酸序列包含或组成为SEQ ID NO:63的核苷酸52至1443。在另一更优选的方面,核苷酸序列包含或组成为质粒pTter6A所包含的成熟多肽编码区,所述质粒包含在大肠杆菌NRRL B-30802中。本发明还包括编码多肽的核苷酸序列,所述多肽包含或组成为SEQ ID NO:64的氨基酸序列或其成熟多肽,所述核苷酸序列由于遗传密码的简并性而不同于SEQ ID NO:63或其成熟多肽编码序列。本发明还涉及SEQ ID NO:63的亚序列,其编码SEQ ID NO:64的具有纤维二糖水解酶II活性的片段。 
本发明还涉及在SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:55、SEQID NO:57、SEQ ID NO:59、SEQ ID NO:61,或SEQ ID NO:63的成熟多肽编码序列中包含至少一个突变的突变多核苷酸,其中所述突变核苷酸序列编码SEQ ID NO:52、SEQ ID NO:54、SEQ ID NO:56、SEQ ID NO:58,或SEQID NO:60、SEQ ID NO:62,或SEQ ID NO:64的成熟多肽。在优选的方面,所述成熟多肽是SEQ ID NO:52的氨基酸18至541,SEQ ID NO:54的氨基酸25至471,SEQ ID NO:56的氨基酸23至459,SEQ ID NO:58的氨基酸22至418,SEQ ID NO:60的氨基酸17至234,SEQ ID NO:62的氨基酸18至242,或SEQ ID NO:64的氨基酸18至481。在另一优选的方面,所述成熟多肽编码序列是SEQ ID NO:51的核苷酸52至1542、SEQ ID NO:53的核苷酸73至1413、SEQ ID NO:55的核苷酸67至1377、SEQ ID NO:57的核苷酸64至1254、SEQ ID NO:59的核苷酸49至702、SEQ ID NO:61的核苷酸52至726,或SEQ ID NO:63的核苷酸52至1443。 
如前所述,用于分离或克隆编码多肽的多核苷酸的技术是本领域内已知的,包括从基因组DNA分离,从cDNA制备,或其组合。 
多肽还可以包含多核苷酸,所述多核苷酸包含或组成为以下核苷酸序列,所述核苷酸序列编码具有纤维二糖水解酶或内切葡聚糖酶活性的多肽,所述多肽在至少非常低严紧条件下,优选至少低严紧条件,更优选至少中等严紧条件,更优选至少中-高严紧条件,甚至更优选至少高严紧条件,并且最优选至少非常高的严紧条件下,与以下杂交:(i)SEQ ID NO:51、SEQ ID NO:53、SEQ IDNO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61,或SEQ ID NO:63 的成熟多肽编码序列,(ii)包含在SEQ ID NO:51、SEQ ID NO:53、SEQ ID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61,或SEQ ID NO:63的成熟多肽编码序列中的cDNA序列或包含SEQ ID NO:51、SEQ ID NO:53、SEQID NO:55、SEQ ID NO:57、SEQ ID NO:59、SEQ ID NO:61,或SEQ ID NO:63的成熟多肽编码序列的基因组DNA序列,或(iii)(i)或(ii)的全长互补链;或它们的等位变体和亚序列(Sambrook等,1989,见上文),如本文所定义的。在优选的方面,所述成熟多肽编码序列是SEQ ID NO:51的核苷酸52至1542,SEQ ID NO:53的核苷酸73至1413,SEQ ID NO:55的核苷酸67至1377,SEQID NO:57的核苷酸64至1254,SEQ ID NO:59的核苷酸49至702,SEQ ID NO:61的核苷酸52至726,或SEQ ID NO:63的核苷酸52至1443。 
核酸构建体 
分离的多核苷酸,其编码具有增强纤维素分解的活性的多肽、具有β-葡糖苷酶活性的多肽,β-葡糖苷酶融合多肽,具有内切葡聚糖酶活性的多肽,具有纤维二糖水解酶活性的多肽,或具有其它纤维素分解酶活性的多肽,可以用许多方式操作所述分离的多核苷酸,从而通过构建核酸构建体来提供所述多肽的表达,所述核酸构建体包含编码多肽的分离的多核苷酸,其与一个或多个(几个)调控序列可操作地连接,所述调控序列在合适的宿主细胞中在与该调控序列相容的条件下指导编码序列的表达。依赖于表达载体,在将多核苷酸的序列插入载体之前对其进行操作可能是理想的或必需的。使用重组DNA方法修饰多核苷酸序列的技术是本领域熟知的。 
调控序列可以是合适的启动子序列,其是由宿主细胞识别用于表达编码这种多肽的多核苷酸的核苷酸序列。启动子序列含有介导所述多肽表达的转录调控序列。启动子可以是在所选的宿主细胞中显示转录活性的任何核苷酸序列,包括突变的、截短的和杂合的启动子,并且可以从编码与宿主细胞同源或异源的胞外或胞内多肽的基因获得。 
用于指导本发明的核酸构建体在丝状真菌宿主细胞中转录的合适启动子的实例是从编码下述酶的基因获得的启动子:米曲霉TAKA淀粉酶、曼赫根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、曼赫根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、构巢曲霉乙酰胺酶、镶片镰孢淀 粉葡糖苷酶(WO 00/56900)、镶片镰孢Daria(WO 00/56900)、镶片镰孢Quinn(WO 00/56900)、尖镰孢胰蛋白酶样蛋白酶(WO 96/00787)、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶IV、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉β-木糖苷酶,以及NA2-tpi启动子(来自黑曲霉中性α-淀粉酶和米曲霉丙糖磷酸异构酶基因的启动子的杂合体);和它们的突变、截短和杂合的启动子。 
调控序列也可以是合适的转录终止子序列,其是由宿主细胞识别以终止转录的序列。所述终止子序列与编码所述多肽的核苷酸序列的3’末端可操作地连接。可以将在所选宿主细胞中有功能的任何终止子用在本发明中。 
对于丝状真菌宿主细胞优选的终止子获得自下述基因:米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉α-葡糖苷酶和尖镰孢胰蛋白酶样蛋白酶。 
调控序列还可以是合适的前导序列,其是对于宿主细胞的翻译重要的mRNA非翻译区。前导序列可操作地连接于编码多肽的核苷酸序列的5’-末端。可以将在所选宿主细胞中有功能的任何前导序列用在本发明中。 
对于丝状真菌宿主细胞优选的前导序列从米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶的基因获得。 
调控序列也可以是聚腺苷酸化序列,其是与核苷酸序列的3’末端可操作地连接的序列,并且在转录时,宿主细胞将其识别为将聚腺苷残基添加至转录的mRNA的信号。可以将在所选宿主细胞中有功能的任何聚腺苷酸化序列在本发明中使用。 
对于丝状真菌宿主细胞优选的聚腺苷酸化序列获得自下述的基因:米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖镰孢胰蛋白酶样蛋白酶和黑曲霉α-葡糖苷酶。 
调控序列还可以是信号肽编码区,其编码与多肽的氨基末端相连的氨基酸序列,并且指导编码的多肽进入细胞的分泌途径。核苷酸序列的编码序列5’端可固有地包含信号肽编码区,其与编码分泌多肽的编码区片段一起天然地连接在翻译阅读框中。可供选择的是,编码序列5’端可含有对于所述编码序列是外源的信号肽编码区。外源信号肽编码区在编码序列不天然地含有信 号肽编码区时可能是必需的。或者,外源信号肽编码区可以简单地取代天然信号肽编码区以增强多肽的分泌。然而,指导表达的多肽进入所选宿主细胞的分泌途径(即,分泌至培养基中)的任何信号肽编码区可在本发明中使用。 
对于丝状真菌宿主细胞有效的信号肽编码区是从如下的基因获得的信号肽编码区:米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、曼赫根毛霉天冬氨酸蛋白酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶V和疏棉状腐质霉脂肪酶。 
在优选的方面,信号肽包含SEQ ID NO:2的氨基酸1至19,或由SEQ IDNO:2的氨基酸1至19组成。在另一个优选的方面,信号肽编码区包含SEQID NO:1的核苷酸330至387或由SEQ ID NO:1的核苷酸330至387组成。 
在另一优选的方面,信号肽包含SEQ ID NO:4的氨基酸1至17或由SEQID NO:4的氨基酸1至17组成。在另一个优选的方面,信号肽编码区包含SEQ ID NO:3的核苷酸47至97或由SEQ ID NO:3的核苷酸47至97组成。 
在另一优选的方面,信号肽包含SEQ ID NO:6的氨基酸1至19或由SEQID NO:6的氨基酸1至19组成。在另一个优选的方面,信号肽编码区包含SEQ ID NO:5的核苷酸69至125或由SEQ ID NO:5的核苷酸69至125组成。 
在另一优选的方面,信号肽包含SEQ ID NO:8的氨基酸1至18或由SEQID NO:8的氨基酸1至18组成。在另一个优选的方面,信号肽编码区包含SEQ ID NO:7的核苷酸1至54或由SEQ ID NO:7的核苷酸1至54组成。 
在另一优选的方面,信号肽包含SEQ ID NO:10的氨基酸1至19或由SEQID NO:10的氨基酸1至19组成。在另一个优选的方面,信号肽编码区包含SEQ ID NO:9的核苷酸1至57或由SEQ ID NO:9的核苷酸1至57组成。 
在另一优选的方面,信号肽包含SEQ ID NO:12的氨基酸1至22或由SEQID NO:12的氨基酸1至22组成。在另一个优选的方面,信号肽编码区包含SEQ ID NO:11的核苷酸1至66或由SEQ ID NO:11的核苷酸1至66组成。 
在另一优选的方面,信号肽包含SEQ ID NO:14的氨基酸1至19或由SEQID NO:14的氨基酸1至19组成。在另一个优选的方面,信号肽编码区包含SEQ ID NO:13的核苷酸20至76或由SEQ ID NO:13的核苷酸20至76组成。 
调控序列还可以是前肽编码区,其编码位于多肽氨基末端的氨基酸序列。所得多肽称为酶原(proenzyme)或前多肽(propolypeptide)(或在某些情况下称为酶原(zymogen))。前多肽通常是无活性的并且能够通过前肽的催化或自催化 切割从前多肽转化为成熟活性多肽。前肽编码区可以从酿酒酵母α因子、曼赫根毛霉天冬氨酸蛋白酶和嗜热毁丝霉漆酶(WO 95/33836)的基因获得。 
当信号肽和前肽区二者均出现在多肽的氨基末端时,将前肽区置于紧接着(next to)多肽氨基末端,并且将信号肽区置于紧接着前肽区的氨基末端。 
同样理想的是添加调节序列,其允许相对于宿主细胞的生长来调节多肽的表达。调节系统的实例是引起基因表达响应化学或物理刺激物,包括调节化合物的存在而开启或关闭的那些系统。在丝状真菌中,可以使用TAKAα-淀粉酶启动子、黑曲霉葡糖淀粉酶启动子和米曲霉葡糖淀粉酶启动子作为调节序列。调节序列的其它实例是那些允许基因扩增的序列。在真核系统中,这些序列包括在氨甲蝶呤(methotrexate)存在下扩增的二氢叶酸还原酶基因,和以重金属(with heavy metal)扩增的金属硫蛋白基因。在这些情况下,编码多肽的核苷酸序列将与调节序列可操作地连接。 
表达载体 
可以将本文描述的多种核酸和调控序列结合在一起以产生重组表达载体,其包含编码具有增强纤维素分解的活性的多肽、具有β-葡糖苷酶活性的多肽、β-葡糖苷酶融合多肽、具有内切葡聚糖酶活性的多肽、具有纤维二糖水解酶活性的多肽,或具有其它纤维素分解酶活性的多肽的多核苷酸,启动子,和转录和翻译的终止信号。所述表达载体可以包括一个或多个(几个)方便的限制位点以允许在这些位点插入或取代编码所述多肽的核苷酸序列。可供选择的是,可以通过将所述核苷酸序列或包含该序列的核酸构建体插入用于表达的适当载体中从而表达编码这样的多肽的多核苷酸。在制备表达载体的过程中,将编码序列置于载体中,从而将该编码序列与适当的用于表达的调控序列可操作地连接。 
重组表达载体可以是任何载体(例如,质粒或病毒),其能够方便地进行重组DNA步骤,并且能够产生核苷酸序列的表达。载体的选择将通常依赖于载体与将导入该载体的宿主细胞的相容性。载体可以是线状或闭合环状质粒。 
载体可以是自主复制载体,即,作为染色体外实体(entity)存在的载体,其复制独立于染色体复制,例如,质粒、染色体外元件、微型染色体(minichromosome)或人工染色体。载体可以含有用于确保自复制的任何手段(means)。或者,载体可以是一种当被导入宿主细胞中时,整合到基因组中并 且与整合了该载体的染色体一起复制的载体。此外,可以使用单独的载体或质粒或两个或更多的载体或质粒,其共同含有待导入宿主细胞基因组的完整DNA(total DNA),或可以使用转座子(transposon)。 
所述载体优选地含有一个或多个(几个)选择性标记,其允许简单选择经转化、转染、转导等的细胞。选择性标记是基因,其产物提供杀生物剂或病毒抗性、对重金属的抗性、对营养缺陷型的原养性(prototrophy to auxotrophs)等。 
用于丝状真菌宿主细胞的选择性标记包括但不限于amdS(乙酰胺酶),argB(鸟氨酸氨甲酰基转移酶)、bar(草铵膦(phosphinothricin)乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)(nitrate reductase)、pyrG(乳清酸核苷-5’-磷酸脱羧酶)(orotidine-5’-phosphate decarboxylase)、sC(硫酸腺苷酰转移酶)和trpC(邻氨基苯甲酸合酶(anthranilate synthase))以及它们的等价物。优选用在曲霉属细胞中的是构巢曲霉或米曲霉的amdS和pyrG基因和吸水链霉菌(Streptomyces hygroscopicus)的bar基因。 
所述载体优选含有元件,其允许载体整合入宿主细胞基因组或载体在细胞中独立于基因组的自主复制。 
为了整合入宿主细胞基因组,载体可依赖编码多肽的多核苷酸的序列或用于通过同源或非同源重组整合入基因组的任何其它载体元件。或者,载体可以含有额外的核苷酸序列,用于指导通过同源重组整合入宿主细胞基因组染色体中的精确位置。为了增加在精确位置整合的可能性,整合元件应该优选含有足够数目的核酸,如100至10,000碱基对,优选400至10,000碱基对,并且最优选800至10,000碱基对,其与相应的靶序列具有高同一性程度以增强同源重组的概率。整合元件可以是与宿主细胞基因组中的靶序列同源的任何序列。此外,整合元件可以是非编码或编码的核苷酸序列。另一方面,可以通过非同源重组将载体整合到宿主细胞基因组中。 
为了自主复制,载体可以进一步包含复制起点,其使载体能够在所述的宿主细胞中自主地复制。复制起点可以是介导自主复制的任何质粒复制子(replicator),其在细胞中发挥功能。术语“复制起点”或“质粒复制子”在本文定义为能够使质粒或载体在体内复制的核苷酸序列。 
在丝状真菌细胞中有用的复制起点的实例是AMA1和ANS1(Gems等,1991,Gene 98:61-67;Cullen等,1987,Nucleic Acids Research 15:9163-9175;WO 00/24883)。分离AMA1基因和构建包含该基因的质粒或载体能够根据公 开于WO 00/24883中的方法完成。 
可以将多于一个拷贝的编码这样的多肽的多核苷酸插入宿主细胞以增加该多肽的产生。多核苷酸拷贝数的增加可通过如下获得:将至少一个额外拷贝的序列整合入宿主细胞基因组,或使所述多核苷酸包括可扩增选择性标记基因,其中可通过在合适的选择剂(selectable agent)存在下培养细胞来选择含有选择性标记基因的扩增拷贝并且由此含有多核苷酸的额外拷贝的细胞。 
用于连接上述元件以构建所述重组表达载体的方法是本领域技术人员熟知的(参见,例如,Sambrook等,1989,见上文)。 
宿主细胞 
重组丝状真菌宿主细胞,其包含多核苷酸,所述多核苷酸编码具有增强纤维素分解的活性的多肽,具有β-葡糖苷酶活性的多肽,β-葡糖苷酶融合多肽,具有内切葡聚糖酶活性的多肽,具有纤维二糖水解酶活性,或具有其它纤维素分解酶活性的多肽,可将所述重组宿主细胞有利地用于所述多肽的重组产生。将包含这种多核苷酸的载体导入宿主细胞,从而保留该载体作为染色体整合体(chromosomal integrant)或作为自复制的染色体外载体,如前所述。术语“宿主细胞”包含亲本细胞的任何子代,其由于复制过程中发生的突变而与亲本细胞不同。宿主细胞的选择将很大程度依赖于编码多肽的基因和它的来源。 
“丝状真菌”包括真菌门(Eumycota)和卵菌门(Oomycota)的亚门(如Hawksworth等,1995,见上文所定义)的所有丝状形式。丝状真菌通常的特征在于由壳多糖(chitin)、纤维素、葡聚糖、壳聚糖(chitosan)、甘露聚糖和其它复杂多糖组成的菌丝体壁。通过菌丝延伸进行营养生长,而碳分解代谢是专性需氧的。相反,酵母如酿酒酵母的营养生长通过单细胞菌体的出芽生殖(budding)进行,而碳分解代谢可以是发酵的。 
在优选的方面,丝状真菌宿主细胞是枝顶孢霉属、曲霉属、短梗霉属、烟管霉属(Bjerkandera)、拟蜡菌属、金孢子菌属、鬼伞属(Coprinus)、革盖菌属(Coriolus)、隐球菌属、Filibasidium、镰孢属、腐质霉、梨孢菌属、毛霉属、毁丝霉属、新考玛脂霉属、脉孢菌属、拟青霉属、青霉属、平革菌属、射脉菌属(Phlebia)、瘤胃壶菌属、侧耳属(Pleurotus)、裂褶菌属、踝节菌属、嗜热霉属、梭孢壳属、弯颈霉属、栓菌属(Trametes),或木霉属(Trichoderma)细胞。 
在更优选的方面,丝状真菌宿主细胞是泡盛曲霉、烟曲霉、臭曲霉、日 本曲霉、构巢曲霉、黑曲霉或米曲霉,Bjerkandera adusta,干拟蜡菌(Ceriporiopsis aneirina)、干拟蜡菌、Ceriporiopsis caregiea、浅黄拟蜡菌(Ceriporiopsis gilvescens)、Ceriporiopsis pannocinta、Ceriporiopsis rivulosa、Ceriporiopsis subrufa、虫拟蜡菌(Ceriporiopsis subvermispora)、Chrysosporiumlucknowense、灰盖鬼伞、毛革盖菌(Coriolus hirsutus)、杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、特异腐质霉、疏棉状腐质霉、米赫毛霉、嗜热毁丝霉、粗糙脉孢菌、产紫青霉、黄孢平革菌、辐射射脉菌(Phlebiaradiata)、刺芹侧耳(Pleurotus eryngii)、土生梭孢霉、长绒毛栓菌(Trametesvillosa)、杂色栓菌(Trametes versicolor)、哈茨木霉、康宁木霉、长枝木霉、里氏木霉或绿色木霉细胞。 
在最优选的方面,丝状真菌宿主细胞是米曲霉。在另一最优选的方面,丝状真菌宿主细胞是里氏木霉细胞。在另一最优选的方面,丝状真菌宿主细胞是镶片镰孢细胞。在另一最优选的方面,丝状真菌宿主细胞是Chrysosporium lucknowense细胞。 
可以将真菌细胞通过涉及原生质体形成、原生质体转化和细胞壁重建的方法以本身公知的方式转化。用于转化曲霉属和木霉属宿主细胞的合适方法在EP 238 023和Yelton等,1984,Proceedings of the National Academy ofSciences USA 81:1470-1474中描述。用于转化镰孢属菌种的合适方法由Malardier等,1989,Gene 78:147-156和WO 96/00787描述。可以使用由如下文献描述的方法转化酵母:Becker和Guarente,于Abelson,J.N.和Simon,M.I.编,Guide to Yeast Genetics and Molecular Biology,Methods in Enzymology,Volume 194,pp 182-187,Academic Press,Inc.,New York;Ito等,1983,Journalof Bacteriology 153:163;和Hinnen等,1978,Proceedings of the NationalAcademy of Sciences USA 75:1920。 
产生方法 
用于产生本发明的纤维素分解蛋白质组合物的方法,包括(a)在有益于产生所述多肽的条件下培养丝状真菌细胞,所述细胞以其野生型形式能产生所述多肽的;和(b)回收所述多肽。 
或者,用于产生本发明的纤维素分解蛋白质组合物的方法,包括(a)在有益于产生所述多肽的条件下培养重组丝状真菌宿主细胞;和(b)回收所述多肽。 
在所述产生方法中,使用本领域熟知的方法在适合于产生所述多肽的营养培养基中培养丝状真菌细胞。例如,可以通过在合适培养基中和允许表达和/或分离所述多肽的条件下进行的摇瓶培养,和实验室或工业发酵罐中的小规模或大规模发酵(包括连续、分批、补料分批或固态发酵)来培养细胞。使用本领域已知的方法在合适的营养培养基中进行培养,所述营养培养基包含碳源和氮源和无机盐。合适的培养基能够从商业供应商获得或可以根据公布的组成制备(例如,在美国典型培养物保藏中心的目录中)。如果蛋白质组分分泌到营养培养基中,则能够从所述培养基中直接回收该蛋白质组分。如果蛋白质组分不分泌到培养基中,其能够从细胞裂解物(lysate)回收。 
可以使用本文所述或本领域已知的方法来检测所述组合物中的蛋白质组分。 
可以使用本领域已知的方法回收所得纤维素分解蛋白质组合物。例如,可以通过常规方法从营养培养基中回收纤维素分解蛋白质组合物,所述常规方法包括但不限于离心、过滤、提取、喷雾干燥、蒸发或沉淀。 
可以通过多种本领域已知的方法纯化组合物的蛋白质组分,所述方法包括但不限于层析(例如,离子交换、亲和、疏水、层析聚焦和大小排阻)、电泳方法(例如,制备型(preparative)等电聚焦)、差示溶解度(例如,硫酸铵沉淀)、SDS-PAGE或提取(参见,例如,Protein Purification,J.-C.Janson和Lars Ryden编,VCH Publishers,New York,1989),以获得基本上纯的多肽。 
加工含纤维素材料的方法 
本发明还涉及用于降解或转化含纤维素材料的方法,其包括用有效量的本发明的纤维素分解蛋白质组合物处理含纤维素材料。 
本发明还涉及用于产生发酵产物的方法,其包括:(a)用有效量的本发明的纤维素分解蛋白质糖化含纤维素材料;(b)用一种或多种(几种)发酵微生物发酵步骤(a)中糖化的含纤维素材料,以产生发酵产物;和(c)从发酵中回收发酵产物。 
本发明的方法可以用于将含纤维素材料(例如,木素纤维素)水解(糖化)成可发酵糖并将可发酵糖转换成许多有用的物质,例如化学品和燃料。由含纤维素材料生产期望的发酵产物通常包括预处理、酶水解(糖化)和发酵。 
依照本发明,含纤维素材料的加工可以使用本领域已知的方法来完成。而且,可以使用设置为按照本发明来操作的任何生物质加工设备来实施本发明的方法。 
水解(糖化)和发酵,分别或同时包括但不限于分别水解和发酵(SHF)、同时糖化和发酵(SSF)、同时糖化和共发酵(SSCF)、混合水解和发酵(HHF)、SHCF(分别水解和共发酵)、HHCF(混合水解和发酵)和直接微生物转化(DMC)。在本文中可理解的是本领域已知任何方法包括预处理、酶水解(糖化)、发酵或其组合可以用在本发明的方法实施中。 
常规设备可以包括补料分批搅拌反应器(fed-batch stirred reactor)、分批搅拌反应器(batch-stirred reactor)、带有超滤的连续流搅拌反应器(continuous flowstirred reactor with ultrafiltration)和/或连续活塞流柱式反应器(continuousplug-flow column reactor)(Fernanda de Castilhos Corazza,Flávio Faria deMoraes,Gisella Maria Zanin和Ivo Neitzel,2003,Optimal control in fed-batchreactor for the cellobiose hydrolysis,Acta Scientiarum.Technology 25:33-38;Gusakov,A.V.,和Sinitsyn,A.P.,1985,Kinetics of the enzymatic hydrolysis ofcellulose:1.A mathematical model for a batch reactor process,Enz.Microb.Technol.7:346-352)、研磨反应器(attrition reactor)(Ryu,S.K.,和Lee,J.M.,1983,Bioconversion of waste cellulose by using an attrition bioreactor,Biotechnol.Bioeng.25:53-65)或具有由电磁场引起的强力搅拌的反应器(Gusakov,A.V.,Sinitsyn,A.P.,Davydkin,I.Y.,Davydkin,V.Y.,Protas,O.V.,1996,Enhancementof enzymatic cellulose hydrolysis using a novel type of bioreactor with intensivestirring induced by electromagnetic field,Appl.Biochem.Biotechnol.56:141-153)。用于水解和/或发酵的其他反应器类型包括,例如,流化床(fluidizedbed)、上流式床(upflow blanket)、固定化的、和挤出机型反应器。 
预处理:在实施本发明的方法中,本领域已知的任何预处理方法都可以用于破坏含纤维素材料的植物细胞壁组分。在预处理之前,也可以用本领域已知的方法对含纤维素材料进行预浸泡、湿润或调理(conditioning)。常规的预处理包括而不限于蒸汽预处理(带有或不带有爆炸)、稀酸预处理、热水预处理、石灰预处理、湿氧化、湿式爆炸(wet explosion)、氨纤维爆炸、有机溶剂预处理和生物学预处理。另外的预处理包括超声、电穿孔、微波、超临界CO2、超临界H2O和氨渗滤法。 
在水解和/或发酵作用之前可以预处理含纤维素材料。预处理优选在水解之前进行。或者,预处理可以与水解同时进行,例如与用一种或多种纤维素分解酶或其他酶活性处理含纤维素材料同时进行,以释放可发酵糖,如葡萄糖和/或麦芽糖。在大多数情况下预处理步骤本身导致生物质转化成可发酵糖(甚至在酶不存在的情况下)。 
蒸汽预处理:在蒸汽预处理中,加热含纤维素材料以破坏植物细胞壁组分(包括木质素、半纤维素和纤维素),从而使纤维素和其它级分(如半纤维素)更易于让酶接近。将纤维素材料传送至或穿过反应容器,在所述反应容器中注入蒸汽将温度升高到所需的温度和压强,并且将其在预期的反应时间里保持在其中。蒸汽预处理优选在140-230℃,更优选160-200℃,并且最优选170-190℃完成,其中最适温度范围取决于化学催化剂的加入。蒸汽预处理的停留时间(residence time)优选1-15分钟,更优选3-12分钟,并且最优选4-10分钟,其中最适停留时间取决于温度范围和化学催化剂的加入。蒸汽预处理允许相对高的固体加样量(loading),从而使得含纤维素材料一般仅在预处理时湿润。所述蒸汽预处理经常与预处理后材料的爆炸性卸载,其称作蒸汽爆炸,即,快速闪蒸(rapid flashing)至大气压及材料的湍流组合以通过片段化增加可接近表面积(Duff和Murray,1996,Bioresource Technology 855:1-33;Galbe和Zacchi,2002,Appl.Microbiol.Biotechnol.59:618-628;美国专利申请No.20020164730)。 
在蒸汽预处理之前常常加入催化剂如H2SO4或SO2(通常0.3至3%w/w),其能减少时间和降低温度,增加回收率以及改善酶水解(Ballesteros等,2006,Appl.Biochem.Biotechnol.129-132:496-508;Varga等,2004,Appl.Biochem.Biotechnol.113-116:509-523;Sassner等,2006,Enzyme Microb.Technol.39:756-762)。 
化学预处理:术语“化学处理”指的是促进纤维素、半纤维素和/或木质素的分离和/或释放的任何化学预处理。适当的化学预处理方法的实例包括,例如,稀酸预处理、石灰预处理、湿氧化、氨纤维/冷冻爆炸(ammonia fiber/freezeexplosion)(AFEX)、氨渗透(ammonia percolation)(APR)或有机溶剂预处理。 
在稀酸预处理中,将含纤维素材料与稀酸(通常为H2SO4)和水混合以形成浆料,通过蒸汽加热到所需的温度,并在一段停留时间后,闪蒸至大气压。可以在多个反应器设计中进行稀酸预处理,例如,活塞流反应器、逆流反应器或连续逆流收缩床反应器(counter-current shrinking bed reactors)(Duff和 Murray,1996,见上文;Schell等,2004,Bioresource Technol.91:179-188;Lee等,1999,Adv.Biochem.Eng.Biotechnol.65:93-115)。 
也可以使用在碱性条件下的几种预处理方法。这些碱预处理包括,但不限于,石灰预处理、湿氧化、氨渗透(APR),和氨纤维/冷冻爆炸(AFEX)。 
在85-150℃的低温下用碳酸钙、氢氧化钠或氨进行石灰预处理,并且停留时间为1小时至几天(Wyman等,2005,Bioresource Technol.96:1959-1966;Mosier等,2005,Bioresource Technol.96:673-686)。WO 2006/110891、WO 2006/110899、WO 2006/110900和WO 2006/110901披露了使用氨的预处理方法。 
湿氧化为通常在加入氧化剂(例如过氧化氢或超压氧)的条件下在180-200℃进行5-15分钟的热预处理(Schmidt和Thomsen,1998,BioresourceTechnol.64:139-151;Palonen等,2004,Appl.Biochem.Biotechnol.117:1-17;Varga等,2004,Biotechnol.Bioeng.88:567-574;Martin等,2006,J.Chem.Technol.Biotechnol.81:1669-1677)。以优选1-40%的干物质,更优选2-30%的干物质,并且最优选5-20%的干物质进行预处理,并且通常初始pH值随着碱(例如碳酸钠)的加入而增加。 
已知的湿氧化预处理方法的改进方法为湿爆炸(湿氧化和蒸汽爆炸的组合),其可以处理干物质高达30%。在湿爆炸中,在经过一定的驻留时间后在预处理过程中引入氧化剂。然后,通过闪蒸至大气压来结束预处理(WO 2006/032282)。 
氨纤维爆炸(AFEX)包括在合适的温度(例如90-100℃)和高压(例如17-20bar)用液态或气态氨处理含纤维素材料5-10分钟,其中干物质含量可以高达60%(Gollapalli等,2002,Appl.Biochem.Biotechnol.98:23-35;Chundawat等,2007,Biotechnol.Bioeng.96:219-231;Alizadeh等,2005,Appl.Biochem.Biotechnol.121:1133-1141;Teymouri等,2005,Bioresource Technol.96:2014-2018)。 
通过在160-200℃使用乙醇水溶液(40-60%乙醇)萃取30-60分钟,有机溶剂预处理使含纤维素材料脱木素(Pan等,2005,Biotechnol.Bioeng.90:473-481;Pan等,2006,Biotechnol.Bioeng.94:851-861;Kurabi等,2005,Appl.Biochem.Biotechnol.121:219-230)。通常加入硫酸作为催化剂。在有机溶剂预处理中,大部分的半纤维素被除去。 
Schell等,2003,Appl.Biochem.and Biotechnol.Vol.105-108,p.69-85和Mosier等,2005,Bioresource Technology 96:673-686和公开的美国申请2002/0164730描述了合适的预处理方法的其它实例。 
在一个方面,优选以酸处理,并且更优选以连续稀酸和/或弱酸处理进行所述化学预处理。所述酸通常是硫酸,但是也可以使用其它酸,如乙酸、柠檬酸、硝酸、磷酸、酒石酸、琥珀酸、氯化氢或其混合物。在优选1-5,更优选1-4,并且最优选1-3的pH范围进行弱酸处理。在一个方面,所述酸浓度在优选0.01至20wt%酸,更优选0.05至10wt%酸,甚至更优选0.1至5wt%酸,并且最优选0.2至2.0wt%酸的范围内。使所述酸与含纤维素材料接触,并在一定的温度(例如在160-220℃,优选165-195℃的范围)保持数秒至数分钟(例如1秒至60分钟)的时间。 
在另一方面,以氨纤维爆炸步骤(AFEX预处理步骤)进行预处理。 
在另一方面,在含水浆料中进行预处理。在优选的方面,在预处理过程中,含纤维素材料以优选10-80wt%,更优选20-70wt%,并且最优选30-60wt%,如大约50wt%的量存在。所述预处理的含纤维素材料可以是未经洗涤的,或者是使用本领域内已知的任何方法洗涤的,例如用水洗涤。 
机械预处理:术语“机械预处理”指的是各种类型的研磨或磨制(例如干磨、湿磨或振动球磨)。 
物理预处理:术语“物理预处理”指的是促进纤维素、半纤维素和/或木质素从含纤维素材料中分离和/或释放出来的任何预处理。例如,物理预处理可涉及辐照(例如,微波辐照)、汽蒸/蒸汽爆炸、水热解(hydro thermolysis)及其组合。 
物理预处理可涉及高压和/或高温(蒸汽爆炸)。在一个方面,高压指的是范围在优选约300至约600psi,更优选为约350至约550psi,并且最优选为约400至约500psi,例如大约450psi的压力。在另一方面,高温指的是范围在大约100至大约300℃,优选大约140至大约235℃的温度。在优选的方面,在使用如上所限定的高压和高温的蒸汽枪水解仪系统(例如,Sunds Hydrolyzer,可由Sunds Defibrator AB,Sweden获得)中以分批法进行机械预处理。 
组合的物理和化学预处理:含纤维素材料可以同时进行物理和化学预处理。例如,预处理步骤可以涉及稀酸或弱酸处理和高温和/或高压处理。可以根据需要依次或同时进行物理和化学预处理。也可以包括机械预处理。 
因此,在优选的方面,使含纤维素材料进行机械、化学或物理预处理或者其任意组合以促进纤维素、半纤维素和/或木质素的分离和/或释放。 
生物预处理:术语“生物预处理”指的是促进纤维素、半纤维素和/或木质素从含纤维素材料中分离和/或释放出来的任何生物学预处理。生物预处理技术可 涉及应用溶解木质素的微生物(参见,例如,Hsu,T.-A.,1996,Pretreatment ofbiomass,于Handbook on Bioethanol:Production and Utilization,Wyman,C.E.编,Taylor & Francis,Washington,DC,179-212;Ghosh和Singh,1993,Physicochemicaland biological treatments for enzymatic/microbial conversion of lignocellulosicbiomass,Adv.Appl.Microbiol.39:295-333;McMillan,J.D.,1994,Pretreatinglignocellulosic biomass;a review,于Enzymatic Conversion of Biomass for FuelsProduction,Himmel,M.E.,Baker,J.O.和Overend,R.P.编,ACS Symposium Series566,American Chemical Society,Washington,DC,chapter 15;Gong,C.S.,Cao,N.J.,Du,J.和Tsao,G.T.,1999,Ethanol production from renewable resources,于Advances in Biochemical Engineering/Biotechnology,Scheper,T.编,Springer-VerlagBerlin Heidelberg,Germany,65:207-241;Olsson和Hahn-Hagerdal,1996,Fermentation of lignocellulosic hydrolysates for ethanol production,Enz.Microb.Tech.18:312-331;及Vallander和Eriksson,1990,Production of ethanol fromlignocellulosic materials:State of the art,Adv.Biochem.Eng./Biotechnol.42:63-95)。 
糖化:在也称为糖化的水解步骤中,将经预处理的含纤维素材料水解以将纤维素以及可选地还有半纤维素分解成可发酵的糖,例如葡萄糖、木糖、木酮糖、阿拉伯糖、麦芽糖、甘露糖、半乳糖和/或可溶的寡糖。使用本发明的纤维素分解蛋白质组合物进行酶水解。也可以依次加入组合物的酶组分。 
优选在本领域的技术人员能够容易地确定的条件下,在合适的含水环境中进行酶水解。在优选的方面,在适于酶活性的条件(即,对酶最佳的条件)下进行水解。可以以补料分批或连续方法进行水解,在连续方法中将经预处理的含纤维素材料(底物)逐渐加入到例如包含酶的水解溶液中。 
糖化通常在受控的pH、温度和混合条件下,在搅拌釜式反应器或发酵罐中进行。合适的过程时间、温度和pH条件能够由本领域技术人员容易地确定。例如,糖化可以持续多至200小时,但是通常进行优选大约12至大约96小时,更优选大约16至大约72小时,并且最优选大约24至大约48小时。所述温度在优选大约25℃至大约70℃,更优选大约30℃至大约65℃,并且更优选大约40℃至60℃的范围内,特别地为大约50℃。所述pH在优选大约3至大约8,更优选大约3.5至大约7,并且最优选大约4至大约6的范围内,特别地为大约pH 5。干固体的含量在优选大约5至大约50wt%,更优选大约10至大约40wt%并且最优选大约20至大约30wt%的范围内。 
具有增强纤维素分解的活性的多肽和酶的最优量依赖于几个因素,所述因素包括但不限于组分纤维素分解蛋白质的混合物、纤维素底物、纤维素底物浓度、纤维素底物的预处理、温度、时间、pH和发酵微生物(例如,用于同时糖化和发酵的酵母)的内含物(inclusion)。 
在优选的方面,纤维素分解蛋白对于含纤维素材料的有效量是每克含纤维素材料大约0.5至大约50mg,优选大约0.5至大约40mg,更优选大约0.5至大约25mg,更优选大约0.75至大约20mg,更优选大约0.75至大约15mg,甚至更优选大约0.5至大约10mg,并且最优选大约2.5至大约10mg。 
在另一优选的方面,具有增强纤维素分解的活性的多肽对于含纤维素材料的有效量是每克含纤维素材料大约0.5至大约50mg,优选大约0.5至大约40mg,更优选大约0.5至大约25mg,更优选大约0.75至大约20mg,更优选大约0.75至大约15mg,甚至更优选大约0.5至大约10mg,并且最优选大约2.5至大约10mg。 
在另一优选的方面,具有增强纤维素分解的活性的多肽对于含纤维素材料的有效量是每克含纤维素材料大约0.01至大约50.0mg,优选大约0.01至大约40mg,更优选大约0.01至大约30mg,更优选大约0.01至大约20mg,更优选大约0.01至大约10mg,更优选大约0.01至大约5mg,更优选大约0.025至大约1.5mg,更优选大约0.05至大约1.25mg,更优选大约0.075至大约1.25mg,更优选大约0.1至大约1.25mg,甚至更优选大约0.15至大约1.25mg,并且最优选大约0.25至大约1.0mg。 
在另一优选的方面,具有增强纤维素分解的活性的多肽对于纤维素分解蛋白的有效量是每克纤维素分解蛋白大约0.005至大约1.0g,优选大约0.01至大约1.0g,更优选大约0.15至大约0.75g,更优选大约0.15至大约0.5g,更优选大约0.1至大约0.5g,甚至更优选大约0.1至大约0.5g,并且最优选大约0.05至大约0.2g。 
发酵.通过一种或多种能够直接或间接将糖发酵成期望的发酵产物的发酵微生物可以发酵从经预处理和水解的含纤维素材料得到的可发酵的糖。“发酵”或“发酵方法”指任何发酵方法或任何包括发酵步骤的方法。发酵方法还包括在生物燃料工业、可消费醇工业(例如,啤酒和葡萄酒(wine))、乳品工业(例如,发酵乳制品)、皮革工业和烟草工业中使用的发酵方法。发酵的条件依赖于期望的发酵产物和发酵生物,并且可由本领域的技术人员容易地确定。 
在发酵步骤中,将作为预处理和酶水解步骤的结果从含纤维素材料释放的糖通过发酵生物例如酵母发酵成产物,例如乙醇。水解(糖化)和发酵可以是分别的或同时的。这些方法包括,但不限于,分别水解和发酵(SHF)、同时糖化和发酵(SSF)、同时糖化和共发酵(SSCF)、混合水解和发酵(HHF)、SHCF(分别水解和共发酵)、HHCF(混合水解和共发酵)和直接微生物转化(DMC)。 
在实施本发明时,任何合适的经水解的含纤维素材料可以用于发酵步骤中。所述材料通常基于期望的发酵产物(即,要从发酵获得的物质)和采用的方法来进行选择,如本领域内所熟知的。 
术语“发酵培养基”在本文中应理解为指在加入发酵微生物之前的培养基,例如,糖化处理产生的培养基,以及例如在同时糖化和发酵方法(SSF)中使用的培养基。 
“发酵微生物”指适用于期望的发酵方法以产生发酵产物的任何微生物,包括细菌和真菌生物体。发酵生物体可以是C6和/或C5发酵生物体,或者其组合。C6和C5发酵生物都是本领域内熟知的。合适的发酵生物能够发酵,即,能够直接或间接地将糖,例如葡萄糖、木糖、木酮糖、阿拉伯糖、麦芽糖、甘露糖、半乳糖或寡糖转化成期望的发酵产物。 
Lin等,2006,Appl.Microbiol.Biotechnol.69:627-642描述了生产乙醇的细菌和真菌发酵生物的实例。 
可以发酵C6糖的发酵微生物的实例包括细菌和真菌生物,如酵母。优选的酵母包括酵母属(Saccharomyces)菌种,优选为酿酒酵母的菌株。 
可以发酵C5糖的发酵生物的实例包括细菌和真菌生物,如酵母。优选的发酵C5的酵母包括毕赤酵母属,优选为树干毕赤酵母(Pichia stipitis)的菌株,如树干毕赤酵母CBS 5773;念珠菌属,优选博伊丁念珠菌(Candida boidinii)、芸苔念珠菌(Candida brassicae)、休哈塔念珠菌(Candida sheatae)、迪丹斯念珠菌(Candida diddensii)、假热带念珠菌(Candida pseudotropicalis)或产朊念珠菌(Candida utilis)的菌株。 
其它发酵生物包括发酵单孢菌属(Zymomonas),如运动发酵单孢菌(Zymomonas mobilis)的菌株;汉逊酵母属,如异常汉逊酵母(Hansenula anomala)的菌株;克鲁维酵母属,如脆壁克鲁维酵母(K.fragilis)的菌株;裂殖酵母属(Schizosaccharomyces),如粟酒裂殖酵母(S.pombe)的菌株;和大肠杆菌,特别是已经进行了遗传修饰以改进乙醇产率的大肠杆菌菌株。 
在优选的方面,酵母是酵母属菌种。在更优选的方面,酵母是酿酒酵母。在另一更优选的方面,酵母是糖化酵母(Saccharomyces distaticus)。在另一更优选的方面,酵母是葡萄汁酵母(Saccharomyces uvarum)。在另一优选的方面,酵母是克鲁维酵母属。在另一更优选的方面,酵母是马克斯克鲁维酵母(Kluyveromyces marxianus)。在另一更优选的方面,酵母是脆壁克鲁维酵母。在另一优选的方面,酵母是念珠菌属。在另一更优选的方面,酵母是博伊丁念珠菌。在另一更优选的方面,酵母是芸苔念珠菌。在另一更优选的方面,酵母是迪丹斯念珠菌。在另一更优选的方面,酵母是假热带念珠菌。在另一更优选的方面,酵母是产朊念珠菌。在另一优选的方面,酵母是棒孢酵母属(Clavispora)。在另一更优选的方面,酵母是葡萄牙棒孢酵母(Clavisporalusitaniae)。在另一更优选的方面,酵母是仙人掌棒孢酵母(Clavisporaopuntiae)。在另一优选的方面,酵母是管囊酵母属(Pachysolen)。在另一更优选的方面,酵母是嗜鞣管囊酵母(Pachysolen tannophilus)。在另一个更优选的方面,酵母是毕赤酵母属。在另一更优选的方面,酵母是树干毕赤酵母。在另一优选的方面,酵母是酒香酵母属(Bretannomyces)。在另一更优选的方面,酵母是克劳森酒香酵母(Bretannomyces clausenii)(Philippidis,G.P.,1996,Cellulose bioconversion technology,于Handbook on Bioethanol:Production andUtilization,Wyman,C.E.编,Taylor & Francis,Washington,DC,179-212)。 
能够有效地将己糖和戊糖发酵成乙醇的细菌包括例如运动发酵单孢菌和热纤维梭菌(Philippidis,1996,见上文)。 
在优选的方面,细菌是发酵单孢菌属。在更优选的方面,细菌是运动发酵单孢菌。在另一优选的方面,细菌是梭菌属。在另一更优选的方面,细菌是热纤维梭菌。 
商业上可得到的适合于乙醇生产的酵母包括,例如,ETHANOL REDTM酵母(可得自Fermentis/Lesaffre,USA)、FALITM(可得自Fleischmann’s Yeast,USA)、SUPERSTARTTM和THERMOSACCTM新鲜酵母(可得自EthanolTechnology,WI,USA)、BIOFERMTM AFT和XR(可得自NABC-North AmericanBioproducts Corporation,GA,USA)、GERT STRANDTM(可得自Gert Strand AB,Sweden)和FERMIOLTM(购自DSM Specialties)。 
在优选的方面,发酵微生物已被遗传修饰以提供发酵戊糖的能力,例如,利用木糖、利用阿拉伯糖和共同利用木糖和阿拉伯糖的微生物(xylose and arabinose co-utilizing microorganism)。 
将异源基因克隆至多种发酵微生物中已经导致构建了能够将己糖和戊糖转化为乙醇的生物(共发酵)(Chen和Ho,1993,Cloning and improving the expressionof Pichia stipitis xylose reductase gene in Saccharomyces cerevisiae,Appl.Biochem.Biotechnol.39-40:135-147;Ho等,1998,Genetically engineered Saccharomycesyeast capable of effectively cofermenting glucose and xylose,Appl.Environ.Microbiol.64:1852-1859;Kotter和Ciriacy,1993,Xylose fermentation bySaccharomyces cerevisiae,Appl.Microbiol.Biotechnol.38:776-783;Walfridsson等,1995,Xylose-metabolizing Saccharomyces cerevisiae strains overexpressing theTKL1 and TAL1 genes encoding the pentose phosphate pathway enzymestransketolase and transaldolase,Appl.Environ.Microbiol.61:4184-4190;Kuyper等,2004,Minimal metabolic engineering of Saccharomyces cerevisiae for efficientanaerobic xylose fermentation:a proof of principle,FEMS Yeast Research 4:655-664;Beall等,1991,Parametric studies of ethanol production from xylose andother sugars by recombinant Escherichia coli,Biotech.Bioeng.38:296-303;Ingram等,1998,Metabolic engineering of bacteria for ethanol production,Biotechnol.Bioeng.58:204-214;Zhang等,1995,Metabolic engineering of a pentosemetabolism pathway in ethanologenic Zymomonas mobilis,Science 267:240-243;Deanda等,1996,Development of an arabinose-fermenting Zymomonas mobilisstrain by metabolic pathway engineering,Appl.Environ.Microbiol.62:4465-4470)。 
在优选的方面,经遗传修饰的发酵微生物是酿酒酵母。在另一优选的方面,经遗传修饰的发酵微生物是运动发酵单孢菌。在另一优选的方面,经遗传修饰的发酵微生物是大肠杆菌。在另一优选的实施方式中,经遗传修饰的发酵微生物是产酸克雷伯氏菌(Klebsiella oxytoca)。 
通常加入发酵微生物以降解纤维素或水解产物,并且发酵进行大约8到大约96小时,例如大约24至大约60小时。温度通常为大约26℃至大约60℃,特别是大约32℃或50℃,并且在大约pH 3至大约pH 8,如大约pH4-5、6或7。 
在优选的方面,将发酵微生物应用于降解的纤维素或水解产物,并且发酵进行大约12至大约96小时,如通常为24-60小时。在优选的方面,温度优选在大约20℃至大约60℃,更优选大约25℃至大约50℃,并且最优选大约32℃至大约50℃,特别是大约32℃或50℃,并且pH通常从大约pH 3至大约pH 7, 优选大约pH 4-7。然而,例如,一些细菌发酵生物具有更高的最佳发酵温度。发酵微生物优选以每毫升的发酵液大约105至1012,优选大约107至1010,特别是大约2×108的活细胞计数的量应用。有关使用酵母发酵的其它指导可参见例如“The Alcohol Textbook”(K.Jacques,T.P.Lyons和D.R.Kelsall编,Nottingham University Press,United Kingdom 1999),将其通过提述并入本文。 
对于乙醇产生,在发酵之后蒸馏发酵浆料以提取乙醇。根据本发明的方法获得的乙醇可以用作例如燃料乙醇、饮用乙醇,即,可饮用中性酒精(potableneutral spirits);或工业乙醇。 
可以将发酵刺激物(fermentation stimulator)与本文描述的任何酶方法组合使用以进一步改进发酵方法,特别是改进发酵微生物的性能,如,速率增益和乙醇产率。“发酵刺激物”指用于发酵微生物,特别是酵母的生长的刺激物。优选的用于生长的发酵刺激物包括维生素和矿物。维生素的实例包括多种维生素、生物素、泛酸、烟酸、内消旋肌醇、硫胺素、吡哆醇、对氨基苯甲酸、叶酸、核黄素和维生素A、B、C、D和E。参见,例如,Alfenore等,Improvingethanol production and viability of Saccharomyces cerevisiae by a vitamin feedingstrategy during fed-batch process,Springer-Verlag(2002),将其通过提述并入本文。矿物的实例包括能够提供营养物的矿物和矿物盐,所述营养物包括P、K、Mg、S、Ca、Fe、Zn、Mn和Cu。 
发酵产物:发酵产物可以为源自发酵的任何物质。所述发酵产物可以是,但不限于,醇(例如,阿拉伯糖醇、丁醇、乙醇、甘油、甲醇、1,3-丙二醇、山梨糖醇和木糖醇);有机酸(例如,乙酸、醋酮酸、己二酸、抗坏血酸、柠檬酸、2,5-二酮-D-葡糖酸、甲酸、延胡索酸、葡糖二酸、葡糖酸、葡糖醛酸、戊二酸、3-羟基丙酸、衣康酸、乳酸、苹果酸、丙二酸、草酸、丙酸、琥珀酸和木糖酸);酮类(例如,丙酮);醛类(例如,甲醛);氨基酸(例如,天冬氨酸、谷氨酸、甘氨酸、赖氨酸、丝氨酸和苏氨酸);气体(例如,甲烷、氢气(H2)、二氧化碳(CO2)和一氧化碳(CO))。发酵产物还可以为蛋白质作为有高价值产物。 
在优选的方面,所述发酵产物是醇。应该理解术语“醇”包含含有一个或多个羟基的物质。在更优选的方面,所述醇是阿拉伯糖醇。在另一更优选的方面,所述醇是丁醇。在另一更优选的方面,所述醇是乙醇。在另一更优选的方面,所述醇是甘油。在另一更优选的方面,所述醇是甲醇。在另一更优选的方面,所述醇是1,3-丙二醇。在另一更优选的方面,所述醇是山梨糖醇。 在另一个更优选的方面,所述醇是木糖醇。参见,例如,Gong,C.S.,Cao,N.J.,Du,J.,和Tsao,G.T.,1999,Ethanol production from renewable resources,于Advances in Biochemical Engineering/Biotechnology,Scheper,T.编,Springer-Verlag Berlin Heidelberg,Germany,65:207-241;Silveira,M.M.和Jonas,R.,2002,The biotechnological production of sorbitol,Appl.Microbiol.Biotechnol.59:400-408;Nigam,P.和Singh,D.,1995,Processes for fermentativeproduction of xylitol-a sugar substitute,Process Biochemistry 30(2):117-124;Ezeji,T.C.,Qureshi,N.和Blaschek,H.P.,2003,Production of acetone,butanoland ethanol by Clostridium beijerinckii BA101 and in situ recovery by gasstripping,World Journal of Microbiology and Biotechnology 19(6):595-603。 
另一个优选的方面,所述发酵产物是有机酸。在另一更优选的方面,所述有机酸是乙酸。在另一更优选的方面,所述有机酸是醋酮酸。在另一更优选的方面,所述有机酸是己二酸。在另一更优选的方面,所述有机酸是抗坏血酸。在另一更优选的方面,所述有机酸是柠檬酸。在另一更优选的方面,所述有机酸是2,5-二酮-D-葡糖酸。在另一更优选的方面,所述有机酸是甲酸。在另一更优选的方面,所述有机酸是延胡索酸。在另一更优选的方面,所述有机酸是葡糖二酸。在另一更优选的方面,所述有机酸是葡糖酸。在另一更优选的方面,所述有机酸是葡糖醛酸。在另一更优选的方面,所述有机酸是戊二酸。在另一优选的方面,所述有机酸是3-羟基丙酸。在另一更优选的方面,所述有机酸是衣康酸。在另一更优选的方面,所述有机酸是乳酸。在另一更优选的方面,所述有机酸是苹果酸。在另一更优选的方面,所述有机酸是丙二酸。在另一更优选的方面,所述有机酸是草酸。在另一更优选的方面,所述有机酸是丙酸。在另一更优选的方面,所述有机酸是琥珀酸。在另一更优选的方面,所述有机酸是木糖酸。参见,例如,Chen,R.和Lee,Y.Y.,1997,Membrane-mediated extractive fermentation for lactic acid production fromcellulosic biomass,Appl.Biochem.Biotechnol.63-65:435-448。 
在另一优选的方面,所述发酵产物是酮。应该理解的是术语“酮”涵盖含有一个或多个酮基的物质。在另一更优选的方面,所述酮是丙酮。参见,例如,Qureshi和Blaschek,2003,见上文。 
在另一优选的方面,所述发酵产物是醛。在另一更优选的方面,所述醛为甲醛。 
在另一优选的方面,所述发酵产物是氨基酸。在另一更优选的方面,所述有机酸是天冬氨酸。在另一更优选的方面,所述氨基酸是谷氨酸。在另一更优选的方面,所述氨基酸是甘氨酸。在另一更优选的方面,所述氨基酸是赖氨酸。在另一更优选的方面,所述氨基酸是丝氨酸。在另一更优选的方面,所述氨基酸是苏氨酸。参见,例如,Richard,A.和Margaritis,A.,2004,Empiricalmodeling of batch fermentation kinetics for poly(glutamic acid)production andother microbial biopolymers,Biotechnology and Bioengineering 87(4):501-515。 
在另一优选的方面,所述发酵产物是气体。在另一更优选的方面,所述气体是甲烷。在另一更优选的方面,所述气体是H2。在另一更优选的方面,所述气体是CO2。在另一更优选的方面,所述气体是CO。参见,例如,Kataoka,N.,A.Miya和K.Kiriyama,1997,Studies on hydrogen production by continuous culturesystem of hydrogen-producing anaerobic bacteria,Water Science and Technology 36(6-7):41-47;和Gunaseelan V.N.于Biomass and Bioenergy,Vol.13(1-2),pp.83-114,1997,Anaerobic digestion of biomass for methane production:A review。 
回收:使用本领域已知的方法可以从发酵培养基中任选地回收发酵产物,所述方法包括,但不限于,层析(例如,离子交换、亲和、疏水、层析聚焦和大小排阻)、电泳方法(例如,制备型等电聚焦)、差示溶解度(例如,硫酸铵沉淀)、蒸馏或提取。例如,从发酵的含纤维素材料中分离乙醇,并通过常规的蒸馏方法纯化。可以获得纯度高至大约96vol.%的乙醇,其可以用作,例如燃料乙醇、饮用乙醇,即,可饮用中性酒精(potable neutral spirits);或工业乙醇。 
通过以下实施例进一步对本发明进行描述,但不应将其理解为对本发明范围的限制。 
实施例
用作缓冲液和底物的化学品为至少试剂级的商业产品。 
DNA测序 
使用Applied Biosystems Model 3130X Genetic Analyzer(3130X型遗传分析仪)(Applied Biosystems,Foster City,CA,USA),利用染料终止子化学(Giesecke等,1992,Journal of Virol.Methods 38:47-60)进行DNA测序。使用phred/phrap/consed(University of Washington,Seattle,WA,USA)用序列特异性引物组装序列。 
培养基与溶液 
YP培养基由每升10g酵母提取物和20g细菌用胰蛋白胨组成。 
纤维素酶-诱导培养基由每升20g纤维素、10g玉米浆固体、1.45g(NH4)2SO4、2.08g KH2PO4、0.28g CaCl2、0.42g MgSO4·7H2O和0.42ml痕量金属溶液组成。 
痕量金属溶液由每升216g FeCl3·6H2O、58g ZnSO4·7H2O、27gMnSO4·H2O、10g CuSO4·5H2O、2.4g H3BO3和336g柠檬酸组成。 
STC由1M山梨醇、10mM CaCl2和10mM Tris-HCl,pH 7.5组成。 
COVE平板由每升342g蔗糖、10ml COVE盐溶液、10ml 1M乙酰胺、10ml 1.5M CsCl,和25g Noble琼脂组成。 
COVE盐溶液由每升26g KCl、26g MgSO4、76g KH2PO4和50ml COVE痕量金属溶液组成。 
COVE痕量金属溶液由每升0.04g Na2B4O7·10H2O、0.4g CuSO4·5H2O、1.2g FeSO4·7H2O、0.7g MnSO4·H2O、0.8g Na2MoO2·H2O和10g ZnSO4·7H2O组成。 
COVE2平板由每升30g蔗糖、20ml COVE盐溶液、25g Noble琼脂和10ml 1M乙酰胺组成。 
PDA平板由每升39克马铃薯葡萄糖琼脂组成。 
LB培养基由每升10g胰蛋白胨、5g酵母提取物和5gNaCl组成。 
2X YT-Amp平板由每升10g胰蛋白胨、5g酵母提取物、5g氯化钠和15g细菌用琼脂组成,在高压灭菌后加入2ml过滤灭菌的50mg/ml氨苄青霉素溶液。 
MDU2BP培养基由每升45g麦芽糖、1g MgSO4·7H2O、1g NaCl、2gK2HSO4、12g KH2PO4、2g脲和500μl AMG痕量金属溶液,pH调至5.0,然后用0.22μm过滤装置过滤除菌。 
AMG痕量金属溶液由每升14.3g ZnSO4·7H2O、2.5g CuSO4·5H2O、0.5gNiCl2·6H2O、13.8g FeSO4·H2O、8.5g MnSO4·7H2O和3g柠檬酸组成。 
矿物质培养基平板由每升6g NaNO3、0.52g KCl、1.52g KH2PO4、1mlCOVE痕量金属溶液、20g Noble琼脂、20ml 50%葡萄糖、2.5ml 20%MgSO4·7H2O,和20ml生物素保存溶液组成。 
生物素保存溶液由每升0.2g生物素组成。 
SOC培养基由2%胰蛋白胨、0.5%酵母提取物、10mM NaCl、2.5mM KCl、10mM MgCl2和10mM MgSO4组成,然后在高压灭菌后加入过滤除菌的葡萄糖至20mM。 
孟德尔培养基由每升1.4g(NH4)2SO4、2.0g KH2PO4、0.3g脲、0.3gCaCl2、0.3g MgSO4.7H2O、5mg FeSO4.7H2O、1.6mg MnSO4.H2O、1.4mgZnSO4.H2O和2mg CoCl2组成。 
实施例1:pMJ04表达载体的构建 
通过使用下述所示的引物993429(反义)和993428(有义)从里氏木霉RutC30基因组DNAPCR扩增里氏木霉纤维二糖水解酶I基因(cbh1,CEL7A)终止子而构建表达载体pMJ04。工程改造反义引物,使其在5’末端包含Pac I位点,并在有义引物的3’末端包含Spe I位点。 
引物993429(反义): 
5’-AACGTTAATTAAGGAATCGTTTTGTGTTT-3’(SEQ ID NO:65) 
引物993428(有义): 
5’-AGTACTAGTAGCTCCGTGGCGAAAGCCTG-3’(SEQ ID NO:66) 
使用 Plant Maxi Kit(QIAGEN Inc.,Valencia,CA,USA)分离里氏木霉RutC30基因组DNA。 
扩增反应液(50μl)由下述物质组成:1X ThermoPol反应缓冲液(New EnglandBiolabs,Beverly,MA,USA),0.3mM dNTP,100ng里氏木霉RutC30基因组DNA,0.3μM引物993429,0.3μM引物993428和2单位Vent DNA聚合酶(NewEngland Biolabs,Beverly,MA,USA)。在 
Figure GPA00001010787101002
Figure GPA00001010787101003
5333(Eppendorf Scientific,Inc.,Westbury,NY,USA)中温育反应物,程序为94℃30秒,50℃ 30秒,和72℃ 60秒的5个循环,然后进行94℃ 30秒,65℃ 30秒,和72℃ 120秒的25个循环(5分钟的最后延伸)。通过1.0%琼脂糖凝胶电泳,使用40mM Tris碱-20mM乙酸钠-1mM EDTA二钠(TAE)缓冲液分离反应产物,其中从凝胶切下229bp的产物条带,并使用 
Figure GPA00001010787101004
Gel ExtractionKit(QIAGEN Inc.,Valencia,CA,USA),根据生产商的说明纯化。 
用Pac I和Spe I消化得到的PCR片段,并使用快速连接试剂盒(Roche,Indianapolis,IN,USA)连接入用相同的限制性酶消化的pAlLo1(WO05/067531)中,以产生pMJ04(图1)。 
实施例2:pCaHj568的构建 
由pCaHj170(美国专利No.5,763,254)和pMT2188构建质粒pCaHj568。质粒pCaHj170包含特异腐质霉内切葡聚糖酶V(CEL45A)全长编码区(SEQID NO:15,其编码SEQ ID NO:16的氨基酸序列)。pMT2188的构建由使用下述所示引物142779和142780从pCaHj483(WO 98/00529)PCR扩增pUC19的复制起点而开始。引物142780在PCR片段中引入Bbu I位点。 
引物142779: 
5’-TTGAATTGAAAATAGATTGATTTAAAACTTC-3’(SEQ ID NO:67) 
引物142780 
5’-TTGCATGCGTAATCATGGTCATAGC-3’(SEQ ID NO:68) 
使用 
Figure GPA00001010787101011
PCR系统(Roche Molecular Biochemicals,Basel,Switzerland),按照生产商的说明进行此扩增。在琼脂糖凝胶上分离PCR产物,并使用Jetquick Gel Extraction Spin Kit(Genomed,Wielandstr,Germany)分离和纯化1160bp片段。 
使用 
Figure GPA00001010787101012
PCR系统,用下述所示引物140288和142778,从常用的酿酒酵母克隆载体pYES2(Invitrogen,Carlsbad,CA,USA)扩增URA3基因。引物140288在PCR片段中引入Eco RI位点。 
引物 140288: 
5’-TTGAATTCATGGGTAATAACTGATAT-3’(SEQ ID NO:69) 
引物142778: 
5’-AAATCAATCTATTTTCAATTCAATTCATCATT-3’(SEQ ID NO:70) 
在琼脂糖凝胶上分离PCR产物,并使用Jetquick Gel Extraction Spin Kit分离和纯化1126bp片段。 
通过混合将两个PCR片段融合,并通过重叠剪接方法(Horton等,1989,Gene77:61-68)用上述所示引物142780和140288进行扩增。在琼脂糖凝胶上分离PCR产物,并使用Jetquick Gel Extraction Spin Kit分离和纯化2263bp片段。 
用Eco RI和Bbu I消化得到的片段,并使用标准规程连接至用相同的限制性酶消化的pCaHj483的最大片段。将连接混合物转化入由Mandel和Higa,1970,J.Mol.Biol.45:154方法制成感受态的pyrF-阴性大肠杆菌菌株DB6507(ATCC 35673)。在每升补加1g酪蛋白氨基酸、500μg硫胺素和10mg卡那 霉素的固体M9培养基(Sambrook等,1989,Molecular Cloning,A LaboratoryManual,第2版,Cold Spring Harbor Laboratory Press)上筛选转化体。从一个转化体分离质粒并命名为pCaHj527(图2)。 
将pCaHj527上存在的NA2-tpi启动子通过使用 
Figure GPA00001010787101021
PCR系统根据生产商的说明进行定点突变。使用下述所示突变引物141223将核苷酸134-144从GTACTAAAACC(SEQ ID NO:71)转变成CCGTTAAATTT(SEQID NO:72)。 
引物141223: 
5’-GGATGCTGTTGACTCCGGAAATTTAACGGTTTGGTCTTGCATCCC-3’(SEQ ID NO:73) 
使用下述所示突变引物141222将核苷酸423-436从ATGCAATTTAAACT(SEQ ID NO:74)转变成CGGCAATTTAACGG(SEQ ID NO:75)。 
引物141222: 
5’-GGTATTGTCCTGCAGACGGCAATTTAACGGCTTCTGCGAATCGC-3’(SEQ ID NO:76) 
将得到的质粒命名为pMT2188(图3)。 
将特异腐质霉内切葡聚糖酶V编码区从pCaHj170作为Bam HI-Sal I片段转入用Bam HI和Xho I消化的pMT2188,以产生pCaHj568(图4)。质粒pCaHj568包含突变的NA2-tpi启动子,其与特异腐质霉内切葡聚糖酶V全长编码序列可操作连接。 
实施例3:pMJ05的构建 
通过使用下述所示引物HiEGV-F和HiEGV-R,由pCaHj568 PCR扩增915bp特异腐质霉内切葡聚糖酶V全长编码区而构建质粒pMJ05。 
引物HiEGV-F(有义): 
5’-AAGCTTAAGCATGCGTTCCTCCCCCCTCC-3’(SEQ ID NO:77) 
引物HiEGV-R(反义): 
5’-CTGCAGAATTCTACAGGCACTGATGGTACCAG-3’(SEQ ID NO:78) 
扩增反应液(50μl)由下述组成:1X ThermoPol反应缓冲液(New EnglandBiolabs,Beverly,MA,USA),0.3mM dNTP,10ng/μl pCaHj568,0.3μMHiEGV-F引物,0.3μM HiEGV-R引物,和2单位Vent DNA聚合酶(New England Biolabs,Beverly,MA,USA)。在 
Figure GPA00001010787101031
Figure GPA00001010787101032
5333(Eppendorf Scientific,Inc.,Westbury,NY,USA)中温育反应物,程序为94℃ 30秒,50℃ 30秒,和72℃ 60秒的5个循环,然后进行94℃ 30秒,65℃ 30秒,和72℃ 120秒的25个循环(5分钟的最后延伸)。通过1.0%琼脂糖凝胶电泳,使用TAE缓冲液分离反应产物,其中从凝胶切下937bp的产物条带,并使用 凝胶提取试剂盒(QIAGEN Inc.,Valencia,CA,USA),根据生产商的说明纯化。 
将937bp纯化的片段用作使用下述引物的后续扩增的模板DNA: 
引物HiEGV-R(反义): 
5’-CTGCAGAATTCTACAGGCACTGATGGTACCAG-3’(SEQ ID NO:79) 
引物HiEGV-F-重叠(有义): 
5’-ACCGCGGACTGCGCATCATGCGTTCCTCCCCCCTCC-3’(SEQ IDNO:80) 
斜体表示的引物序列与里氏木霉纤维二糖水解酶I基因(cbh1)启动子的17bp同源,并且加下划线的引物序列与特异腐质霉内切葡聚糖酶V编码区的29bp同源。启动子和编码序列之间的36bp重叠允许将包含里氏木霉cbh1启动子的994bp片段精确融合至包含特异腐质霉内切葡聚糖酶V编码区的918bp片段。 
扩增反应液(50μl)由下述物质组成:1X ThermoPol反应缓冲液,0.3mMdNTP,1μl纯化的937bp PCR片段,0.3μM HiEGV-F-重叠引物,0.3μMHiEGV-R引物,和2单位Vent DNA聚合酶。在 
Figure GPA00001010787101035
5333中温育反应物,程序为94℃ 30秒,50℃ 30秒,和72℃ 60秒的5个循环,然后进行94℃ 30秒,65℃ 30秒,和72℃ 120秒的25个循环(5分钟的最后延伸)。通过1.0%琼脂糖凝胶电泳,使用TAE缓冲液分离反应产物,其中从凝胶切下945bp的产物条带,并使用 
Figure GPA00001010787101036
凝胶提取试剂盒,根据生产商的说明纯化。 
使用下述所示引物进行单独的PCR,以从里氏木霉RutC30基因组DNA扩增从基因的ATG起始密码子的994bp上游延伸的里氏木霉cbh1启动子序列(有义引物进行工程改造以在5’末端包含Sal I限制性位点)。使用 
Figure GPA00001010787101037
Plant Maxi Kit分离里氏木霉RutC30基因组DNA。 
引物TrCBHIpro-F(有义): 
5’-AAACGTCGACCGAATGTAGGATTGTTATC-3’(SEQ ID NO:81) 
引物TrCBHIpro-R(反义): 
5’-GATGCGCAGTCCGCGGT-3’(SEQ ID NO:82) 
扩增反应液(50μl)由下述物质组成:1X ThermoPol反应缓冲液,0.3mMdNTP,100ng/μl里氏木霉RutC30基因组DNA,0.3μM TrCBHIpro-F引物,0.3μM TrCBHIpro-R引物,和2单位Vent DNA聚合酶。在 
Figure GPA00001010787101041
Figure GPA00001010787101042
5333中温育反应物,程序为94℃ 30秒,55℃ 30秒,和72℃ 120秒的30个循环(5分钟的最后延伸)。通过1.0%琼脂糖凝胶电泳,使用TAE缓冲液分离反应产物,其中从凝胶切下998bp的产物条带,并使用 
Figure GPA00001010787101043
凝胶提取试剂盒,根据生产商的说明纯化。 
将998bp纯化的片段用作使用下述引物的后续扩增的模板DNA。 
引物TrCBHIpro-F: 
5’-AAACGTCGACCGAATGTAGGATTGTTATC-3’(SEQ ID NO:83) 
引物TrCBHIpro-R-重叠: 
5’-GGAGGGGGGAGGAACGCATGATGCGCAGTCCGCGGT-3’(SEQ IDNO:84) 
斜体表示的引物序列与里氏木霉cbh1启动子的17bp同源,并且加下划线的引物序列与特异腐质霉内切葡聚糖酶V编码区的29bp同源。启动子和编码序列之间36bp的重叠允许将包含里氏木霉cbh1启动子的994bp片段精确融合至包含特异腐质霉内切葡聚糖酶V编码区的918bp片段。 
扩增反应液(50μl)由下述物质组成:1X ThermoPol反应缓冲液,0.3mMdNTP,1μl纯化的998bp PCR片段,0.3μM TrCHB1pro-F引物,0.3μMTrCBH1pro-R-重叠引物,和2单位Vent DNA聚合酶。在 
Figure GPA00001010787101044
Figure GPA00001010787101045
5333中温育反应物,程序为94℃ 30秒,50℃ 30秒,和72℃ 60秒的5个循环,然后进行94℃ 30秒,65℃ 30秒,和72℃ 120秒的25个循环(5分钟的最后延伸)。通过1.0%琼脂糖凝胶电泳,使用TAE缓冲液分离反应产物,其中从凝胶切下1017bp的产物条带,并使用 
Figure GPA00001010787101046
凝胶提取试剂盒,根据生产商的说明纯化。 
使用下述引物,用1017bp里氏木霉cbh1启动子PCR片段和945bp特异腐质霉内切葡聚糖酶V PCR片段作为后续扩增的模板DNA,利用重叠PCR将994bp cbh1启动子精确融合至918bp内切葡聚糖酶V全长编码区。 
引物TrCBHIpro-F: 
5’-AAACGTCGACCGAATGTAGGATTGTTATC-3’(SEQ ID NO:85) 
引物HiEGV-R: 
5’-CTGCAGAATTCTACAGGCACTGATGGTACCAG-3’(SEQ ID NO:86) 
扩增反应液(50μl)由下述物质组成:1X ThermoPol反应缓冲液,0.3mMdNTP,0.3μM TrCHB1pro-F引物,0.3μM HiEGV-R引物,和2单位Vent DNA聚合酶。在 
Figure GPA00001010787101051
Figure GPA00001010787101052
5333中温育反应物,程序为94℃ 30秒,50℃ 30秒,和72℃ 60秒的5个循环,然后进行94℃ 30秒,65℃ 30秒,和72℃ 120秒的25个循环(5分钟的最后延伸)。通过1.0%琼脂糖凝胶电泳,使用TAE缓冲液分离反应产物,其中从凝胶切下1926bp的产物条带,并使用 
Figure GPA00001010787101053
凝胶提取试剂盒,根据生产商的说明纯化。 
使用 
Figure GPA00001010787101055
PCR克隆试剂盒(Invitrogen,Carlsbad,CA,USA),按照生产商的说明,将得到的1926bp片段克隆入 
Figure GPA00001010787101056
-Blunt-II- 
Figure GPA00001010787101057
载体(Invitrogen,Carlsbad,CA,USA)。用Not I和Sal I消化得到的质粒,使用 
Figure GPA00001010787101058
凝胶提取试剂盒将1926bp片段凝胶纯化,并使用T4 DNA连接酶(Roche,Indianapolis,IN,USA)连接入也用相同的两个限制性酶消化的pMJ04,以产生pMJ05(图5)。质粒pMJ05包含里氏木霉纤维二糖水解酶I启动子和终止子,其与特异腐质霉内切葡聚糖酶V全长编码序列可操作连接。 
实施例4:pSMai130表达载体的构建 
用下述所示引物993467(有义)和993456(反义),从作为模板的pJaL660(WO 2002/095014)PCR扩增2586bp DNA片段,所述片段从ATG起始密码子到TAA终止密码子,跨越米曲霉β-葡糖苷酶全长编码序列(cDNA序列为SEQ ID NO:15,而SEQ ID NO:16为推定的氨基酸序列;大肠杆菌DSM14240)。Spe I位点经工程改造位于反义引物的5’末端以促进连接。斜体表示的引物序列与里氏木霉cbh1启动子的24bp同源,并且加下划线的引物序列与米曲霉β-葡糖苷酶编码区的22bp同源。 
引物993467: 
5’-ATAGTCAACCGCGGACTGCGCATCATGAAGCTTGGTTGGATCGAGG-3’(SEQ ID NO:87) 
引物993456 
5’-ACTAGTTTACTGGGCCTTAGGCAGCG-3’(SEQ ID NO:88) 
扩增反应液(50μl)由下述物质组成:Pfx扩增缓冲液(Invitrogen,Carlsbad,CA,USA),0.25mM dNTP,10ng pJaL660,6.4μM引物993467,3.2μM引物993456,1mM MgCl2,和2.5单位Pfx DNA聚合酶(Invitrogen,Carlsbad,CA,USA)。在 
Figure GPA00001010787101061
Figure GPA00001010787101062
5333中温育反应物,程序为94℃ 1分钟,55℃ 1分钟,和72℃ 3分钟的30个循环(15分钟的最后延伸)。通过1.0%琼脂糖凝胶电泳,使用TAE缓冲液分离反应产物,其中从凝胶切下2586bp的产物条带,并使用 
Figure GPA00001010787101063
凝胶提取试剂盒,根据生产商的说明纯化。 
使用如下所示的引物993453(有义)和引物993463(反义)进行单独的PCR,以扩增里氏木霉cbh1启动子序列,所述序列从基因的ATG起始密码子的1000bp上游延伸,从而产生1000bp PCR片段。 
引物993453: 
5’-GTCGACTCGAAGCCCGAATGTAGGAT-3’(SEQ ID NO:89) 
引物993463: 
5’-CCTCGATCCAACCAAGCTTCATGATGCGCAGTCCGCGGTTGACTA-3’(SEQ ID NO:90) 
斜体表示的引物序列与里氏木霉cbh1启动子的24bp同源,并且加下划线的引物序列与米曲霉β-葡糖苷酶全长编码区的22bp同源。启动子和编码序列之间46bp的重叠允许将包含里氏木霉cbh1启动子的1000bp片段精确融合至包含米曲霉β-葡糖苷酶编码区的2586bp片段。 
扩增反应液(50μl)由下述物质组成:Pfx扩增缓冲液,0.25mM dNTP,100ng里氏木霉RutC30基因组DNA,6.4μM引物993453,3.2μM引物993463,1mM MgCl2,和2.5单位Pfx DNA聚合酶。在 
Figure GPA00001010787101064
Figure GPA00001010787101065
5333中温育反应物,程序为94℃ 1分钟,55℃ 1分钟,和72℃ 3分钟的30个循环(15分钟的最后延伸)。通过1.0%琼脂糖凝胶电泳,使用TAE缓冲液分离反应产物,其中从凝胶切下1000bp的产物条带,并使用 
Figure GPA00001010787101066
凝胶提取试剂盒,根据生产商的说明纯化。 
使用上述所示引物993453(有义)和引物993456(反义),通过重叠PCR,将纯化的片段用作后续扩增的模板DNA,将包含里氏木霉cbh1启动子的1000bp片段精确融合至包含米曲霉β-葡糖苷酶全长编码区的2586bp片段。 
扩增反应液(50μl)由下述物质组成:Pfx扩增缓冲液,0.25mM dNTP,6.4μM引物993453,3.2μM引物993456,1mM MgCl2,和2.5单位Pfx DNA聚合酶。在 
Figure GPA00001010787101071
Figure GPA00001010787101072
5333中温育反应物,程序为94℃ 1分钟,60℃ 1分钟,和72℃ 4分钟的30个循环(15分钟的最后延伸)。 
用Sal I和Spe I消化得到的3586bp片段并连接入用相同的两个限制性酶消化的pMJ04,以产生pSMai130(图6)。质粒pSMAi130包含里氏木霉纤维二糖水解酶I基因启动子和终止子,其与米曲霉天然β-葡糖苷酶信号序列和编码序列(即,全长米曲霉β-葡糖苷酶编码序列)可操作连接。 
实施例5:pSMai135的构建 
用下述引物993728(有义)和993727(反义),从作为模板的pJaL660 PCR扩增从Lys-20到TAA终止密码子的米曲霉β-葡糖苷酶成熟编码区(不包含天然信号序列,参见图7;SEQ ID NO:91和92是其信号肽和编码序列)。 
引物993728: 
5’-TGCCGGTGTTGGCCCTTGCCAAGGATGATCTCGCGTACTCCC-3’(SEQ ID NO:93) 
引物993727: 
5’-GACTAGTCTTACTGGGCCTTAGGCAGCG-3’(SEQ ID NO:94) 
斜体表示的序列与特异腐质霉内切葡聚糖酶V信号序列的20bp同源,并且加下划线的序列与米曲霉β-葡糖苷酶编码区的22bp同源。Spe I位点经工程改造入反义引物的5’末端。 
扩增反应液(50μl)由下述物质组成:Pfx扩增缓冲液,0.25mM dNTP,10ng/μl pJaL660,6.4μM引物993728,3.2μM引物993727,1mM MgCl2,和2.5单位Pfx DNA聚合酶。在 
Figure GPA00001010787101073
Figure GPA00001010787101074
5333中温育反应物,程序为94℃ 1分钟,55℃ 1分钟,和72℃ 3分钟的30个循环(15分钟的最后延伸)。通过1.0%琼脂糖凝胶电泳,使用TAE缓冲液分离反应产物,其中从凝胶切下2523bp的产物条带,并使用 
Figure GPA00001010787101075
凝胶提取试剂盒,根据生产商的说明纯化。 
使用如下所示的引物993724(有义)和引物993729(反义),进行单独的PCR扩增,以扩增1000bp里氏木霉cbh1启动子和63bp特异腐质霉内切葡聚糖酶V信号序列(ATG起始密码子到Ala-21,图8,SEQ ID NO:95和96)。 
引物993724: 
5’-ACGCGTCGACCGAATGTAGGATTGTTATCC-3’(SEQ ID NO:97) 
引物993729: 
5’-GGGAGTACGCGAGATCATCCTTGGCAAGGGCCAACACCGGCA-3’(SEQ ID NO:98) 
斜体表示的引物序列与特异腐质霉内切葡聚糖酶V信号序列的20bp同源,并且加下划线的引物序列与米曲霉β-葡糖苷酶编码区的22bp同源。 
使用质粒pMJ05作为模板产生包含里氏木霉cbh1启动子和特异腐质霉内切葡聚糖酶V信号序列片段的1063bp片段,所述质粒pMJ05包含在cbh1启动子控制下的特异腐质霉内切葡聚糖酶V编码区。里氏木霉cbh1启动子和特异腐质霉内切葡聚糖酶V信号序列和米曲霉β-葡糖苷酶成熟编码序列之间共有42bp重叠,从而在2523bp米曲霉β-葡糖苷酶编码区的启动子和ATG起始密码子之间提供完美的连接。 
扩增反应液(50μl)由下述物质组成:Pfx扩增缓冲液,0.25mM dNTP,100ng/μl pMJ05,6.4μM引物993728,3.2μM引物993727,1mM MgCl2,和2.5单位Pfx DNA聚合酶。在 
Figure GPA00001010787101081
Figure GPA00001010787101082
5333中温育反应物,程序为94℃ 1分钟,60℃ 1分钟,和72℃ 4分钟的30个循环(15分钟的最后延伸)。通过1.0%琼脂糖凝胶电泳,使用TAE缓冲液分离反应产物,其中从凝胶切下1063bp的产物条带,并使用 
Figure GPA00001010787101083
凝胶提取试剂盒,根据生产商的说明纯化。 
使用上述引物993724(有义)和引物993727(反义),通过重叠PCR,将纯化的重叠片段用作扩增模板,从而将包含里氏木霉cbh1启动子和特异腐质霉内切葡聚糖酶V信号序列的1063bp片段精确融合至包含米曲霉β-葡糖苷酶成熟编码区框的2523bp片段。 
扩增反应液(50μl)由下述物质组成:Pfx扩增缓冲液,0.25mM dNTP,6.4μM引物993724,3.2μM引物993727,1mM MgCl2,和2.5单位Pfx DNA聚合酶。在 
Figure GPA00001010787101084
Figure GPA00001010787101085
5333中温育反应物,程序为94℃ 1分钟,60℃ 1分钟,和72℃ 4分钟的30个循环(15分钟的最后延伸)。通过1.0%琼脂糖凝胶电泳,使用TAE缓冲液分离反应产物,其中从凝胶切下3591bp的产物条带,并使用 
Figure GPA00001010787101086
凝胶提取试剂盒,根据生产商的说明纯化。 
用Sal I和Spe I消化得到的3591bp片段并连接入用相同的限制性酶消化的pMJ04,以产生pSMai135(图9)。质粒pSMAi135包含里氏木霉纤维二糖水解酶I基因启动子和终止子,其与特异腐质霉内切葡聚糖酶V信号序列和米曲霉β-葡糖苷酶成熟编码序列可操作连接。 
实施例6:米曲霉β-葡糖苷酶与特异腐质霉内切葡聚糖酶V分泌信号的表达 
将编码与特异腐质霉内切葡聚糖酶V分泌信号连接的成熟米曲霉β-葡糖苷酶的质粒pSMai135(图8)通过PEG介导的转化(Penttila等,1987,Gene 61155-164)导入里氏木霉RutC30。该质粒包含构巢曲霉amdS基因,以使转化子能以乙酰胺为唯一氮源生长。 
在27℃和90rpm,在补加2%(w/v)葡萄糖和10mM尿苷的25ml YP培养基中将里氏木霉RutC30培养17小时。使用真空驱动一次性过滤系统(Millipore,Bedford,MA,USA),通过过滤收集菌丝体,并用去离子水洗涤两次,用1.2M山梨醇洗涤两次。通过将已洗涤的菌丝体悬浮于包含15mg 
Figure GPA00001010787101091
(Novozymes A/S, Denmark)每ml和0.36单位壳多糖酶(Sigma ChemicalCo.,St.Louis,MO,USA)每ml的20ml 1.2M山梨醇中,并在34℃以90rpm轻轻震荡温育15-25分钟,以产生原生质体。通过在400xg离心7分钟而收集原生质体,并用冰冷的1.2M山梨醇洗涤两次。使用血球计数器为原生质体计数,并重悬于STC中至终浓度为1X108原生质体每ml。过量的原生质体在-80℃储存在Cryo 1℃ Freezing Container(Nalgene,Rochester,NY,USA)中。 
将约7μg用Pme I消化的pSMai135加入100μl原生质体溶液并轻轻混合,然后加入260μl PEG缓冲液,混合,并在室温温育30分钟。然后加入STC(3ml)并混合,并将转化溶液涂布在使用构巢曲霉amdS筛选的COVE平板上。将平板在28℃温育5-7天。将转化体在COVE2平板上传代培养并在28℃生长。 
将用pSMai135获得的命名为SMA135的六十七个转化体在含乙酰胺的新鲜平板上传代培养,并使其在28℃培养7天形成孢子。 
将67个SMA135里氏木霉转化子在包含25ml纤维素酶诱导培养基的125ml带挡板摇瓶中在pH 6.0培养,接种转化子的孢子,并在28℃和200rpm培养7天。使用里氏木霉RutC30作为对照。在第7天移出培养液样品。在微 型离心机中在15,700xg将一ml每种培养液离心5分钟,并将上清液转移至新管中。样品在进行酶试验前于4℃保存。使用对硝基苯基-β-D-葡萄吡喃糖苷作为底物测试上清液的β-葡糖苷酶活性,如下所述。 
使用在50mM琥珀酸pH 5.0中以1∶10稀释的培养物上清液的25μl等分试样,在溶于50mM琥珀酸pH 5.0中的200μl 0.5mg/ml作为底物的对硝基苯基-β-D-葡萄吡喃糖苷中,在环境温度确定β-葡糖苷酶活性。在15分钟温育后,通过加入100μl 1M Tris-HCl pH 8.0而终止反应,并用分光光度计读取405nm处的吸光度。一单位的β-葡糖苷酶活性对应于在pH 5.0、环境温度,每升每分钟产生1微摩尔对硝基苯(p-nitrophenyl)。使用黑曲霉β-葡糖苷酶(NOVOZYMTM188,Novozymes A/S, 
Figure GPA00001010787101101
Denmark)作为酶标准。 
很多SMA135转化体产生的β-葡糖苷酶活性是由里氏木霉RutC30分泌的酶活性的几倍高。在筛选的SMA135转化体中,转化体SMA135-04产生最高的β-葡糖苷酶活性。 
用 
Figure GPA00001010787101102
系统(Bio-Rad,Hercules,CA,USA),使用 
Figure GPA00001010787101103
Tris-HCl(5%解析)凝胶进行SDS-PAGE。将五微升第7天的上清液(见上文)悬浮于2X浓度的Laemmli样品缓冲液(Bio-Rad,Hercules,CA,USA)中,并在存在5%β-巯基乙醇的情况下煮沸3分钟。将上清液样品上样于聚丙烯酰胺凝胶并用1XTris/甘氨酸/SDS作为电泳缓冲液(Bio-Rad,Hercules,CA,USA)进行电泳。将得到的凝胶用BIO- 
Figure GPA00001010787101104
考马斯染料(Bio-Rad,Hercules,CA,USA)染色。 
在通过SDS-PAGE分析的38个里氏木霉SMA135转化体中,26个产生约110kDa的蛋白质,其在作为对照的里氏木霉RutC30中见不到。转化体里氏木霉SMA135-04产生最高水平的β-葡糖苷酶,如通过由SDS-PAGE所见的110kDa条带的丰度(abundance)所证明的。 
实施例7:表达载体pSMai140的构建 
通过用Nco I消化质粒pSATe111BG41(WO 04/099228),其携带米曲霉β-葡糖苷酶变体BG41全长编码区(SEQ ID NO:17,其编码SEQ ID NO:18的氨基酸序列),构建表达载体pSMai140。通过1.0%琼脂糖凝胶电泳,使用TAE缓冲液分离得到的1243bp片段,并使用 
Figure GPA00001010787101105
凝胶提取试剂盒,根据生产商的说明纯化。 
用Nco I消化表达载体pSMai135,并通过1.0%琼脂糖凝胶电泳,使用TAE 缓冲液分离8286bp片段,并使用 凝胶提取试剂盒,根据生产商的说明纯化。然后使用T4 DNA连接酶(Roche,Indianapolis,IN,USA),根据生产商的规程,将1243bp由Nco I消化的米曲霉β-葡糖苷酶变体BG41片段连接至8286bp载体片段,以产生表达载体pSMai140(图10)。质粒pSMai140包含里氏木霉纤维二糖水解酶I(CEL7A)基因启动子和终止子,其与特异腐质霉内切葡聚糖酶V信号序列和米曲霉β-葡糖苷酶变体成熟编码序列可操作连接。 
实施例8:用pSMai140转化里氏木霉RutC30 
用Pme I将质粒pSMai140线性化,并转化入如实施例6所述的里氏木霉RutC30菌株。从四次独立的转化实验获得共100个转化体,所有转化体在摇瓶中以纤维素酶诱导培养基培养,并如实施例6所述由转化体的培养基测定β-葡糖苷酶活性。很多里氏木霉SMA140转化体显示出的β-葡糖苷酶活性为里氏木霉RutC30的几倍高。 
通过如实施例6所述的SDS-聚丙烯酰胺凝胶电泳和对相同的13份培养物上清液考马斯染色(由此分析酶活),检测培养基中是否存在米曲霉β-葡糖苷酶变体BG41蛋白质。具有高β-葡糖苷酶活性的全部十三个转化体还以不同的产率表达约110KDa米曲霉β-葡糖苷酶变体BG41。 
将如通过β-葡糖苷酶活性试验和SDS-聚丙烯酰胺凝胶电泳评价的,最高β-葡糖苷酶变体表达的转化体,命名为里氏木霉SMA140-43。 
实施例9:表达载体pSaMe-F1的构建 
用pMJ05为模板和下述所示引物,PCR扩增包含里氏木霉纤维二糖水解酶I基因启动子的209bp和特异腐质霉内切葡聚糖酶V基因的核心区(SEQ IDNO:15的核苷酸1至702,其编码SEQ ID NO:16的氨基酸1至234;WO91/17243)的DNA片段。 
引物995103: 
5’-cccaagcttagccaagaaca-3’(SEQ ID NO:99) 
引物995137: 
5’-gggggaggaacgcatgggatctggacggc-3’(SEQ ID NO:100) 
扩增反应液(50μl)由下述物质组成:1X Pfx扩增缓冲液,10mM dNTP,50mM MgSO4,10ng/μl pMJ05,50皮摩尔995103引物,50皮摩尔995137 引物,和2单位Pfx DNA聚合酶。在 
Figure GPA00001010787101121
Figure GPA00001010787101122
5333中温育反应物,程序为94℃ 30秒,55℃ 30秒,和72℃ 60秒的30个循环(3分钟的最后延伸)。 
通过1.0%琼脂糖凝胶电泳,使用TAE缓冲液分离反应产物,其中从凝胶切下911bp的产物条带,并使用 
Figure GPA00001010787101123
凝胶提取试剂盒,根据生产商的说明纯化。 
使用如下所示的引物,以pSMai140为模板,PCR扩增包含米曲霉β-葡糖苷酶变体BG41基因的806bp的DNA片段。 
引物995133: 
5’-gccgtccagatccccatgcgttcctccccc-3’(SEQ ID NO:101) 
引物995111: 
5’-ccaagcttgttcagagtttc-3’(SEQ ID NO:102) 
扩增反应液(50μl)由下述物质组成:1X Pfx扩增缓冲液,10mM dNTP,50mM MgSO4,100ng pSMai140,50皮摩尔995133引物,50皮摩尔995111引物,和2单位Pfx DNA聚合酶。在 
Figure GPA00001010787101124
Figure GPA00001010787101125
5333中温育反应物,程序为94℃ 30秒,55℃ 30秒,和72℃ 120秒的30个循环(3分钟的最后延伸)。 
通过1.0%琼脂糖凝胶电泳,使用TAE缓冲液分离反应产物,其中从凝胶切下806bp的产物条带,并使用 凝胶提取试剂盒,根据生产商的说明纯化。 
然后将上述两个PCR片段进行重叠PCR。使用上述引物995103(有义)和引物995111(反义),将纯化的重叠片段用作扩增模板,通过重叠PCR将包含里氏木霉纤维二糖水解酶I基因启动子的209bp和特异腐质霉内切葡聚糖酶V核心序列的702bp片段精确融合至包含米曲霉β-葡糖苷酶变体BG41编码区部分的806bp片段。 
扩增反应液(50μl)由下述物质组成:1X Pfx扩增缓冲液,10mM dNTP,50mM MgSO4,2.5μl每个片段(20ng/μl),50皮摩尔995103引物,50皮摩尔995111引物,和2单位高保真Pfx DNA聚合酶。在 
Figure GPA00001010787101128
5333中温育反应物,程序为95℃ 3分钟的初始变性,然后是30个循环的1分钟变性,60℃ 1分钟退火,和72℃ 3分钟延伸。 
通过1.0%琼脂糖凝胶电泳,使用TAE缓冲液分离反应产物,其中从凝胶 切下1.7kb的产物条带,并使用 
Figure GPA00001010787101131
凝胶提取试剂盒,根据生产商的说明纯化。 
根据生产商说明,将1.7kb片段连接入 
Figure GPA00001010787101132
4 Blunt载体(Invitrogen,Carlsbad,CA,USA)。然后根据生产商的快速化学转化方法,将构建体转化入ONE 
Figure GPA00001010787101133
TOP10化学感受态大肠杆菌细胞(Invitrogen,Carlsbad,CA,USA)。选择菌落并通过质粒分离进行分析,并用HindIII消化以释放1.7kb重叠PCR片段。 
用Hind III消化质粒pSMai140以使质粒线性化。使用快速DNA连接试剂盒,按照生产商的说明,将两个经消化的片段合并在连接反应物中,以产生pSaMe-F1(图11)。 
用连接产物转化大肠杆菌XL1-Blue亚克隆级感受态细胞(Stratagene,LaJolla,CA,USA)。通过对来自由已转化大肠杆菌纯化的质粒的里氏木霉纤维二糖水解酶I基因启动子、特异腐质霉内切葡聚糖酶V信号序列、特异腐质霉内切葡聚糖酶V核心、特异腐质霉内切葡聚糖酶V信号序列、米曲霉β-葡糖苷酶变体BG41,和里氏木霉纤维二糖水解酶I基因终止子序列进行DNA测序,确认构建体的身份。将包含重组质粒的一个克隆命名为pSaMe-F1。质粒pSaMe-F1包含里氏木霉纤维二糖水解酶I基因启动子和终止子,和与特异腐质霉内切葡聚糖酶V核心多肽直接连接的特异腐质霉内切葡聚糖酶V信号肽序列,它们直接融合至与米曲霉β-葡糖苷酶变体BG41成熟编码序列直接连接的特异腐质霉内切葡聚糖酶V信号肽。米曲霉β-葡糖苷酶变体BG融合蛋白的DNA序列和推定的氨基酸序列分别如SEQ ID NO:103和104所示。 
实施例10:用pSaMe-F1转化里氏木霉RutC30 
用5X107个里氏木霉RutC30孢子接种包含补加2%葡萄糖和10mM尿苷的25mlYP培养基的摇瓶。在27℃和90rpm过夜培养约16小时后,使用真空驱动一次性过滤系统收集菌丝体,将菌丝体在100ml去离子水中和1.2M山梨醇中各洗涤两次。如实施例6中所述产生原生质体。 
将用Pme I线性化的两微克pSaMe-F1 DNA,100μl里氏木霉RutC30原生质体,和50% PEG(4000)混合并在室温温育30分钟。然后加入3m1 STC并将内容物倒在补加10mM尿苷的COVE平板上。然后在28℃温育平板。到第6天开始出现转化体,并将转化体挑取到COVE2平板,28℃生长6天。回收了22个里氏木霉转化体。 
在摇瓶中以纤维素酶诱导培养基培养转化体,并如实施例6所述测定β-葡糖苷酶活性。很多pSaMe-F1转化体产生β-葡糖苷酶活性。一个命名为里氏木霉SaMeF1-9的转化体产生的β-葡糖苷酶量最高,并且活性是表达米曲霉β-葡糖苷酶变体的菌株(实施例9)的两倍。 
根据Beguin,1983,Analytical Biochem.131(2):333-336,使用羧甲基纤维素(CMC)覆盖试验测定内切葡聚糖酶活性。将来自五个培养液样品(具有最高的β-葡糖苷酶活性的那些)的五微克总蛋白质在天然样品缓冲液(Bio-Rad,Hercules,CA,USA)中稀释,并在 
Figure GPA00001010787101141
8-16% Tris-HCl凝胶(Bio-Rad,Hercules,CA,USA)上使用10X Tris/甘氨酸电泳缓冲液(Bio-Rad,Hercules,CA,USA)跑胶,然后将凝胶放在包含1%羧甲基纤维素酶(CMC)的平板顶部。在37℃温育1小时后,用0.1%刚果红将凝胶染色20分钟。然后使用1M NaCl将平板脱色,以鉴定指示内切葡聚糖酶活性的澄清区域。可见两个澄清区,上面的区域约110kDa,下面的区域约25kDa。如果两个蛋白质未剪切并且仍为单一的多肽,特异腐质霉内切葡聚糖酶V和米曲霉β-葡糖苷酶变体BG41融合体的预计蛋白质大小为118kDa,单个内切葡聚糖酶V核心域和β-葡糖苷酶的糖基化会导致每个蛋白质迁移到比由一级序列预计的值更高的mw。如果两个蛋白质被剪切,那么特异腐质霉内切葡聚糖酶V核心域的预计大小为24kDa,而米曲霉β-葡糖苷酶变体BG41的预计大小为94kDa。因为有110kDa的澄清区,这一结果说明内切葡聚糖酶和β-葡糖苷酶融合蛋白的群体作为单个的大蛋白质最低限度地保持完整。下面的澄清区最可能代表内源的内切葡聚糖酶活性,并且可能额外由于特异腐质霉内切葡聚糖酶V核心域从米曲霉β-葡糖苷酶部分剪切而产生。 
结果证明特异腐质霉内切葡聚糖酶V核心即使与米曲霉β-葡糖苷酶连接也是有活性的。此外,β-葡糖苷酶活性的增加看来是由于与非融合β-葡糖苷酶分泌效率相比,蛋白质分泌增加。通过将米曲霉β-葡糖苷酶变体BG41序列连接至有效分泌的特异腐质霉内切葡聚糖酶V核心,分泌了更多的β-葡糖苷酶。 
实施例11:载体pSaMe-FX的构建 
通过修饰pSaMe-F1而构建质粒pSaMe-FX。用Bst Z17和Eco RI消化质粒pSaMe-F1,产生包含β-葡糖苷酶变体BG41变体编码序列的1kb片段和包含质粒剩余部分的9.2kb片段。通过1.0%琼脂糖凝胶电泳,使用TAE缓冲液 分离片段,其中从凝胶切下9.2kb的产物条带,并使用 
Figure GPA00001010787101151
凝胶提取试剂盒,根据生产商的说明纯化。质粒pSMai135也用Bst Z17和Eco RI消化,产生包含与米曲霉β-葡糖苷酶变体BG41编码序列同源的碱基的1kb片段和包含质粒剩余部分的8.5kb片段。如上分离并纯化1kb片段。 
使用快速DNA连接试剂盒,根据生产商的说明将9.2kb和1kb片段合并在连接反应中,产生pSaMe-FX,其除了包含野生型β-葡糖苷酶成熟编码序列而不是变体成熟编码序列之外,与pSaMe-F1相同。 
用连接产物转化大肠杆菌 
Figure GPA00001010787101152
感受态细胞(Stratagene,La Jolla,CA,USA)。通过对来自由已转化大肠杆菌纯化的质粒的里氏木霉纤维二糖水解酶I基因启动子、特异腐质霉内切葡聚糖酶V信号序列、特异腐质霉内切葡聚糖酶V核心序列、特异腐质霉内切葡聚糖酶V信号序列、米曲霉β-葡糖苷酶成熟编码序列,和里氏木霉纤维二糖水解酶I基因终止子序列进行DNA测序,确认构建体的身份。将包含重组质粒的一个克隆命名为pSaMe-FX(图12)。米曲霉β-葡糖苷酶融合蛋白的DNA序列和推定的氨基酸序列分别如SEQ IDNO:105和106所示。 
实施例12:木霉属转化体的转化和表达 
用Pme I将pSaMe-FX线性化并如实施例10所述转化入里氏木霉RutC30菌株。一次转化获得共63个转化体。在摇瓶中以纤维素酶诱导培养基培养转化体,并如实施例6所述测定β-葡糖苷酶活性。很多pSaMe-FX转化体产生β-葡糖苷酶活性。一个命名为SaMe-FX16的转化体产生的β-葡糖苷酶活性的量是里氏木霉SaMeF1-9(实施例10)的两倍。 
实施例13:里氏木霉转化体的分析 
通过将特异腐质霉内切葡聚糖酶V核心(包含其本身的天然信号序列)和与特异腐质霉内切葡聚糖酶V信号序列连接的米曲霉β-葡糖苷酶变体BG41成熟编码序列融合,如实施例9所述构建融合蛋白。这个融合构建体和与特异腐质霉内切葡聚糖酶V信号序列连接的米曲霉β-葡糖苷酶变体BG41成熟编码序列相比,分泌的β-葡糖苷酶活性增加两倍。如实施例11所述制备由如下组成的第二个融合构建体:融合于与特异腐质霉内切葡聚糖酶V信号序列连接的米曲霉野生型β-葡糖苷酶编码序列的特异腐质霉内切葡聚糖酶V核心 (包含其本身的信号序列)组成,这进一步改善β-葡糖苷酶活性。用野生型融合体转化的菌株相对于用β-葡糖苷酶变体BG41融合体转化的菌株,具有两倍的分泌的β-葡糖苷酶活性。 
实施例14:将β-葡糖苷酶融合蛋白编码序列克隆入米曲霉表达载体 
设计两个合成寡核苷酸引物,如下所示,从编码β-葡糖苷酶融合蛋白的pSaMeFX PCR扩增全长开放阅读框。 
PCR正向引物: 
5’-GGACTGCGCAGCATGCGTTC-3’(SEQ ID NO:107) 
PCR反向引物: 
5’-AGTTAATTAATTACTGGGCCTTAGGCAGCG-3’(SEQ ID NO:108) 
黑体字代表编码序列。正向引物中加下划线的“G”代表引入而产生SphI限制性位点的碱基变化。其余序列包含与pSaMeFX的插入位点相比的序列同一性。反向引物中加下划线的序列代表加入以促进克隆入表达载体pAlLo2(WO 04/099228)的Pac I限制性位点。 
在PCR反应中使用上述引物各五十皮摩尔,反应物在50μl终体积中包含50ng pSaMeFX DNA,1X Pfx扩增缓冲液,6μl 10mM dATP、dTTP、dGTP和dCTP的混合物,2.5单位 
Figure GPA00001010787101161
Pfx DNA聚合酶,和1μl 50mMMgSO4。使用 
Figure GPA00001010787101162
Figure GPA00001010787101163
5333扩增片段,程序为98℃ 2分钟的1个循环;和96℃ 30秒,61℃ 30秒,和68℃ 3分钟的35个循环。在35个循环后,在68℃温育反应物10分钟,然后在10℃冷却,直至进一步处理。使用TAE缓冲液和0.1μg溴化乙锭每ml,在0.8% GTG-琼脂糖凝胶(Cambrex Bioproducts One Meadowlands Plaza East Rutherford,NJ,USA)上分离3.3kb PCR反应产物。在DARK READERTM(Clare Chemical Research,Dolores,CO,USA)辅助下显示DNA,以避免UV诱导的突变。用一次性剃刀片剪切3.3kb DNA条带,并用 
Figure GPA00001010787101164
-DA旋转杯(Millipore,Billerica,MA,USA),根据生产商的说明纯化。 
将纯化的3.3kb PCR产物克隆入 4Blunt- 载体(Invitrogen,Carlsbad,CA,USA)。将四微升纯化的PCR产物与1μl 2M氯化钠溶液和1μl 
Figure GPA00001010787101167
载体混合。在室温温育反应物15分钟,然后使用2μl反应物,根据生产商的说明,转化One 
Figure GPA00001010787101168
TOP10化学感受态大肠杆菌细胞。将83μl 各转化反应物的三份等分试样涂布在三个补加100μg氨苄青霉素每ml的150mm 2X YT平板上,并在37℃过夜温育。 
使用八个重组菌落,接种于包含3ml LB培养基的液体培养基中,所述LB培养基补加100μg氨苄青霉素每ml。使用 
Figure GPA00001010787101171
9600(QIAGEN Inc.,Valencia,CA,USA)由这些培养基制备质粒DNA。通过用Pac I限制性酶消化而分析克隆。用Pac I消化来自每个克隆的质粒DNA,并使用TAE缓冲液通过1.0%琼脂糖凝胶电泳进行分析。所有八个克隆都具有期望的限制性消化模式,并且选择克隆5、6、7和8测序,确认克隆的插入物中没有突变。它们5’和3’末端的序列分析表明所有4个克隆都具有正确的序列。选择克隆5和7进行进一步测序。两个克隆测序的Phred Q数值大于40,确保没有PCR诱导的错误。克隆5和7显示出具有期望的序列,并且选择克隆5重新克隆入pAILo2中。 
通过用Sph I消化而将来自克隆5的质粒DNA线性化。然后通过加入1.2μl 10mM dATP、dTTP、dGTP和dCTP的混合物和6单位T4 DNA聚合酶(NewEngland Bioloabs,Inc.,Ipswich,MA,USA)而将线性化的克隆平端化。在12℃温育混合物20分钟,然后通过加入1μl 0.5M EDTA并在75℃加热20分钟使酶失活以终止反应。如上所述通过凝胶电泳和超滤而纯化编码β-葡糖苷酶融合蛋白的3.3kb片段。 
通过用Nco I消化而将载体pAILo2线性化。然后通过加入0.5μl 10mMdATP、dTTP、dGTP和dCTP的混合物和一单位DNA聚合酶I而使线性化的载体平端化。在25℃温育混合物15分钟,然后通过加入1μl 0.5M EDTA并在75℃加热15分钟使酶失活而终止反应。然后用Pac I消化载体。如上所述通过凝胶电泳和超滤而纯化平端化的载体。 
用快速连接试剂盒将编码β-葡糖苷酶融合蛋白的3.3kb片段克隆入线性化并纯化的pAILo2载体。使用1μl反应样品根据生产商的说明转化大肠杆菌XL10 Gold细胞(Stratagene,La Jolla,CA,USA)。在恢复期(recovery period)后,将来自转化反应物的两份100μl等分试样涂布在两个补加100μg氨苄青霉素每ml的150mm 2X YT平板上,并在37℃过夜温育。随机从选择平板上选择一组八个推定的重组克隆,并使用 
Figure GPA00001010787101173
9600由每个克隆制备质粒DNA。选择克隆1-4,用pAILo2-特异性引物测序,以确认接合载体/插入物具有正确的序列。克隆3具有完美的载体/插入物接合,并命名为pAILo47(图13)。 
为了产生无标记物的表达菌株,进行限制性内切酶消化以将blaA基因与表达构建体其余部分分离,所述blaA基因赋予对抗生素氨苄青霉素的抗性。用Pme I消化三十微克pAILo47。然后通过如上所述琼脂糖电泳纯化消化的DNA。用剃刀片切下包含表达构建体但缺乏blaA基因的6.4kb DNA,并用 
Figure GPA00001010787101181
凝胶提取试剂盒纯化。 
实施例15:特异腐质霉/米曲霉cel45Acore-cel3A融合基因在米曲霉JaL355中的表达 
根据Christensen等,1988,Bio/Technology 6:1419-1422的方法制备米曲霉JaL355(WO 00/240694)原生质体。使用十微升纯化的实施例14的表达构建体转化米曲霉JaL355原生质体。米曲霉JaL355的转化得到约90个转化体。将五十个转化体分离到单独的PDA平板,并在34℃温育五天。 
用3ml 0.01% 
Figure GPA00001010787101182
80洗涤四十八块汇合的孢子平板,并使用孢子悬浮液接种125ml玻璃摇瓶中的25ml MDU2BP培养基。在34℃以200rpm恒定震荡温育转化体培养物。5天后,将每个培养物的1ml等分试样以12,000xg离心并收集上清液。将每份上清液的五微升与相等体积的2X上样缓冲液(10%β-巯基乙醇)混合,并载于1.5mm 8%-16% Tris-甘氨酸SDS-PAGE凝胶上,并用BIO- 
Figure GPA00001010787101183
考马斯蓝G250蛋白质染料(Bio-Rad,Hercules,CA,USA)染色。培养液的SDS-PAGE谱表明48个转化体中有33个能表达新蛋白质,所述蛋白质的表观分子量与期望的118kDa非常接近。转化体21产量最大,选择它进行进一步的研究。 
实施例16:米曲霉JaL355转化体21的单孢子分离 
将米曲霉JaL355转化体21孢子涂布在PDA平板上,并在34℃温育5天。用0.5ml 0.01% 
Figure GPA00001010787101184
80洗涤汇合的孢子平板其中一小部分,以重悬孢子。用0.01% 
Figure GPA00001010787101185
80将孢子悬浮液的100μl等分试样稀释至终体积5ml。在血球计数器的帮助下,确定孢子浓度,并稀释至终浓度为0.1孢子每微升。将孢子稀释液的200μl等分试样涂布在150mm基本培养基平板并在34℃温育2-3天。从平板切下出现的菌落并转移至PDA平板,并在34℃温育3天。然后将孢子涂布在平板上,并在34℃再温育5天。 
用3ml 0.01% 80洗涤汇合的孢子平板,并使用孢子悬浮液接 种125ml玻璃摇瓶中的25ml MDU2BP培养基。在34℃以200rpm恒定震荡温育单孢子培养物。5天后,在12,000xg将每种培养物的1ml等分试样离心,并收集它们的上清液。将五微升每份上清液与等体积的2X上样缓冲液(10%β-巯基乙醇)混合,并载于1.5mm 8%-16% Tris-甘氨酸SDS-PAGE凝胶上,并用BIO- 
Figure GPA00001010787101191
考马斯蓝G250蛋白质染料染色。培养液的SDS-PAGE谱显示所有8个转化体都能以非常高的水平表达β-葡糖苷酶融合蛋白,并且一种命名为米曲霉JaL355AILo47的培养物能产生最大的产量。 
实施例17:pCW087的构建 
设计如下所示的两个合成寡核苷酸引物,以从质粒pDZA2-7PCR扩增桔橙嗜热霉GH61A多肽基因(WO 2005/074656)。正向引物具有平端5’末端,并且反向引物在3’末端并入Pac I位点。 
正向引物: 
5’-ATGTCCTTTTCCAAGATAATTGCTACTG-3’(SEQ ID NO:109) 
反向引物: 
5’-GCTTAATTAACCAGTATACAGAGGAG-3’(SEQ ID NO:110) 
在PCR反应中使用上述引物各五十皮摩尔,反应物在50μl终体积中包含50ng pDZA2-7,1μl 10mM dATP、dTTP、dGTP和dCTP的混合物,5μl10X ACCUTAQTM DNA聚合酶缓冲液(Sigma-Aldrich,St.Louis,MO,USA),和5单位ACCUTAQTM DNA聚合酶(Sigma-Aldrich,St.Louis,MO,USA)。使用 
Figure GPA00001010787101192
5333扩增DNA片段,程序为95℃3分钟的1个循环;94℃ 45秒,55℃ 60秒,和72℃ 1分钟的30个循环。在25个循环后,在72℃温育反应物10分钟,然后在4℃冷却,直至进一步处理。使用Pac I消化桔橙嗜热霉GH61APCR片段的3’末端。根据生产商的说明,使用MINELUTETM Reaction Cleanup试剂盒(QIAGEN Inc.,Valencia,CA,USA)纯化消化产物。 
用5’末端的平端Nco I位点和3’末端的Pac I位点,将纯化的GH61A片段直接克隆入pSMai155(WO 2005/074647)。用Nco I和Pac I消化质粒pSMai155。然后使用Klenow酶填充进5’凹陷的Nco I位点而使Nco I位点补平。Klenow反应物由20μl pSma155消化反应混合物加1mM dNTP和1μlKlenow酶组成,一起在室温简单温育。根据生产商的说明,使用MINELUTETM Reaction Cleanup试剂盒纯化刚刚线性化的pSMai155质粒。这些反应导致产生与新产生的GH61A片段相容的5’平末端和3’Pac I位点。然后使用快速DNA连接试剂盒(Roche,Indianapolis,IN,USA),按照生产商的说明,将GH61片段克隆入pSMai155表达载体。用连接产物转化大肠杆菌XL1-Blue亚克隆级感受态细胞(Stratagene,La Jolla,CA,USA)。通过将来自纯化自转化的大肠杆菌的质粒的GH61A编码序列进行DNA测序而确认构建体的身份。将包含重组质粒的一个大肠杆菌克隆命名为pCW087-8。 
实施例18:pSaMe-Ta61A的构建 
通过用Nsi I消化携带amdS选择性标记的质粒pMJ09而构建表达载体pSaMe-Ta61(WO 2005/056772),其释放了2.7kb的amdS片段。然后使用TAE缓冲液,通过1.0%琼脂糖凝胶电泳分离2.7kb amdS片段,并使用 
Figure GPA00001010787101201
凝胶提取试剂盒纯化。 
用Nsi I消化表达载体pCW087,使用TAE缓冲液,通过1.0%琼脂糖凝胶电泳分离4.7kb片段,并使用 
Figure GPA00001010787101202
凝胶提取试剂盒纯化。然后使用T4 DNA连接酶(Roche,Indianapolis,IN,USA),根据生产商的规程,将2.7kb amdS片段连接至4.7kb载体片段,产生表达载体pSaMe-Ta61A。质粒pSaMe-Ta61包含里氏木霉纤维二糖水解酶I(CEL7A)基因启动子和终止子,其与桔橙嗜热霉GH61A成熟编码序列可操作地连接。 
实施例19:里氏木霉菌株SaMe-MF268的构建 
使用共转化将质粒pSaMe-FX和pSaMe-Ta61A导入里氏木霉RutC30。将质粒pSaMe-FX和pSaMe-Ta61A通过PEG介导的转化导入里氏木霉RutC30(Penttila等,1987,见上文)。每个质粒包含构巢曲霉amdS基因,以使转化体能以乙酰胺为唯一氮源而生长。 
在27℃和90rpm,在补加2%(w/v)葡萄糖和10mM尿苷的25ml YP培养基中培养里氏木霉RutC30 17小时。使用真空驱动一次性过滤系统过滤而收集菌丝体,并用去离子水洗涤两次,用1.2M山梨醇洗涤两次。通过将已洗涤的菌丝体悬浮于20ml 1.2M山梨醇中而产生原生质体,所述山梨醇包含15mg (Novozymes A/S, 
Figure GPA00001010787101204
Denmark)每ml和0.36单位壳多糖酶(Sigma Chemical Co.,St.Louis,MO,USA)每ml,并在34℃以90rpm 温和震荡温育15-25分钟。通过在400xg离心7分钟而收集原生质体,并用冷1.2M山梨醇洗涤两次。使用血球计数器为原生质体计数,并将其重悬于STC中至终浓度为1X108原生质体每ml。将过量的原生质体于-80℃保存在Cryo 1℃ Freezing Container(Nalgene,Rochester,NY,USA)中。 
用Pme I消化约各4μg质粒pSaMe-FX和pSaMe-Ta61A,以促进去除抗生素抗性标记ampR。在用Pme I消化后,使用TAE缓冲液在1%琼脂糖凝胶上将线性片段跑胶,以分离各个片段。从凝胶切下来自pSaMe-FX的7.5kb片段和来自pSaMe-Ta61A的4.7kb片段,并根据生产商的说明,使用QIAquick凝胶提取试剂盒纯化。这些纯化的片段包含amdS选择性标记盒,里氏木霉cbh1基因启动子和终止子;此外,片段包括特异腐质霉EGV核心/米曲霉BG融合编码序列或桔橙嗜热霉GH61A编码序列。转化中使用的片段不包含抗生素标记,因为这个凝胶纯化步骤去除了ampR片段。然后向100μl原生质体溶液加入纯化片段,并温和混合,之后加入260μl PEG缓冲液,混合,并在室温温育30分钟。然后加入STC(3ml)并混合,并将转化溶液涂布在使用amdS选择的COVE平板上。在28℃温育平板5-7天。将转化体在COVE2平板上传代培养,并在28℃生长。 
将超过400个转化体在包含乙酰胺的新鲜平板上传代培养,并在28℃ 7天产生孢子。 
在包含25ml纤维素酶诱导培养基的125ml带挡板摇瓶中培养里氏木霉转化体,所述培养基在pH 6.0接种转化体的孢子,并在28℃和200rpm培养5天。将里氏木霉RutC30作为对照。在第5天移出培养液样品。将各一毫升培养液在微型离心机中以15,700xg离心5分钟,并将上清液转移至新管。 
使用 Tris-HCl(5%解析)凝胶,用 
Figure GPA00001010787101212
系统进行SDS-PAGE。将五微升第5天的上清液(见上文)悬浮于2X浓度的Laemmli样品缓冲液(Bio-Rad,Hercules,CA,USA)中,并在存在5%β-巯基乙醇的情况下煮沸3分钟。将上清液样品载于聚丙烯酰胺凝胶上,并用1X Tris/甘氨酸/SDS作为电泳缓冲液(Bio-Rad,Hercules,CA,USA)进行电泳。将得到的凝胶用BIO- 
Figure GPA00001010787101213
考马斯染料染色。然后在PCS水解反应中测试转化体以鉴定产生最佳水解培养液的菌株,所述转化体显示桔橙嗜热霉GH61A多肽和融合蛋白表达,该融合蛋白由与米曲霉β-葡糖苷酶融合的特异腐质霉内切葡聚糖酶V核心(Cel45A)组成,如通过观察SDS-PAGE凝胶上的条带所见。 
实施例20:里氏木霉菌株SaMe-MF268的鉴定 
在包含25ml纤维素酶诱导培养基的125ml带挡板摇瓶中培养显示桔橙嗜热霉GH61A多肽和米曲霉β-葡糖苷酶融合蛋白的表达的转化体,所述培养基在pH 6.0接种转化体的孢子,并在28℃和200rpm温育5天。 
在6000xg离心摇瓶培养液,并使用STERICUPTM EXPRESSTM(Millipore,Bedford,MA,USA)在水解前过滤至0.22μm。通过水解PCS并产生糖的能力来测定培养液的活性,所述糖可通过对其还原末端进行化学测定来检测。 
在美国能源部国家可再生能源实验室(U.S.Department of Energy NationalRenewable Energy Laboratory(NREL),Boulder,CO,USA)使用稀硫酸预处理玉米秸秆。使用下述条件预处理:0.048g硫酸/g干燥生物质,在190℃,重量百分比为25%干燥固体,约1分钟。经预处理的玉米秸秆(PCS)中不溶于水的固体包含59.2%纤维素,如通过有限消化PCS以释放葡萄糖和纤维二糖而确定的。在酶水解前,用大体积双去离子水洗涤PCS;水洗PCS的干重为17.73%。 
将1kg量的PCS悬浮于约20升双去离子水中并且,在PCS沉淀后,将水倾析。重复这个过程直至洗涤水为pH 4.0以上,此时还原糖低于0.06g每升。对于小体积实验(例如,1ml),通过100目筛子筛沉淀的浆料,确保能移取。经洗涤的PCS的百分比干重含量通过将样品在105℃烘箱干燥至少24小时(至恒重)并与湿重相比而确定。 
在由ALPS 300TM自动实验室封板仪(ABgene Inc.,Rochester,NY,USA)加热密封的96孔深孔板中,以1ml体积进行PCS水解。在50mM乙酸钠pH 5.0中的PCS浓度为10g每升。在50℃进行PCS水解,除了在所述取样过程中之外无其它搅拌。每个反应重复进行三次。通过对-羟基苯甲酸酰肼(PHBAH)试剂,如下所述分析释放的还原糖。 
将体积为0.8ml的PCS(12.5g每升水中)移取到96孔深孔板的每个孔中,然后加入0.10ml 0.5M乙酸钠pH 5.0,并且然后加入0.10ml稀释的酶溶液以启动反应,最终反应体积为10ml,PCS浓度为10g每升。将板密封。通过在水解开始时和每次取样时间点前倒置深孔板而使反应混合物混合。在每个取样时间点,将板混合,然后在2000rpm将深孔板离心(Sorvall RT7,配备RTH-250转子)10分钟,然后移出20μl水解物(上清液),并加入96孔微孔板中的180μl 0.4% NaOH中。必要时,可将这个终止溶液进一步稀释至还原糖 的正确范围。通过对-羟基苯甲酸酰肼试剂(PHBAH,Sigma,4-羟基苯甲酰肼)分析释放的还原糖:将50μl PHBAH试剂(1.5%)与100μl样品在V型底96孔THERMOWELLTM板(Costar 6511)中混合,在板加热块上在95℃温育10分钟,然后向每个孔加入50μl双去离子水,混合并将100μl转移至另一块平底96孔板(Costar 9017),并在410nm处读取吸收值。使用葡萄糖校准曲线在相同条件下计算还原糖。纤维素转化成还原糖的百分比转化率计算为: 
%转化率=还原糖(mg/ml)/(加入的纤维素(mg/ml)x1.11) 
因子1.11修正将纤维素水解成葡萄糖中的重量增加。 
在1ml PCS水解测试后,将最好的候选菌株在2升发酵罐中生长,重复两次(in duplicate)。 
摇瓶培养基由每升20g葡萄糖,10g玉米浆固体,1.45g(NH4)2SO4,2.08g KH2PO4,0.36g CaCl2,0.42g MgSO4·7H2O,和0.42ml痕量金属溶液组成。痕量金属溶液由每升216g FeCl3·6H2O,58g ZnSO4·7H2O,27g MnSO4·H2O,10g CuSO4·5H2O,2.4g H3BO3,和336g柠檬酸组成。 
向500ml摇瓶中加入十毫升摇瓶培养基。用来自固体平板培养物的两块琼脂块接种摇瓶,并在28℃在定轨摇床上以200rpm温育48小时。使用五十毫升摇瓶培养液接种3升发酵容器。 
发酵分批培养基由每升30g纤维素,4g葡萄糖,10g玉米浆固体,3.8g(NH4)2SO4,2.8g KH2PO4,2.64g CaCl2,1.63g MgSO4·7H2O,1.8ml消泡剂,和0.66ml痕量金属溶液组成。痕量金属溶液由每升216g FeCl3·6H2O,58gZnSO4·7H2O,27g MnSO4·H2O,10g CuSO4·5H2O,2.4g H3BO3,和336g柠檬酸组成。发酵补料培养基由葡萄糖和纤维素组成。 
向3升发酵罐中加入共1.8升的发酵批式培养基。以0至4g/l/小时的速率在165小时的期间内补加发酵补料培养基。发酵容器保持在28℃的温度,并且pH控制在4.75+/-0.1的设置点。以1vvm的速率向容器加入空气,并通过Ruston叶轮在1100至1300rpm旋转而搅拌培养液。在发酵结束时,从容器收获全部培养液,并以3000rpm xg离心去除生物质。将上清液无菌过滤并在35至40℃保存。 
确定总蛋白质浓度,并如下所述在50g PCS水解反应中重复测试培养液。在每次实验前,由保存于4℃的储备酶溶液新鲜制备酶稀释液。 
根据NREL实验室分析规程#008,使用50g的总反应物质量,使用带螺旋 盖的125ml Erlenmeyer三角瓶(VWR,West Chester,PA,USA)进行PCS的水解。在这个规程中,使用不同蛋白质加载量(用mg蛋白质每克纤维素表示)的2升发酵培养液样品进行PCS(在50mM乙酸钠pH 5.0缓冲水溶液中约11.4的PCS和6.8%的纤维素)的水解。在50℃使用 4080培养箱(New BrunswickScientific,Edison,NJ,USA)以150rpm的定轨振荡进行PCS水解能力的测试。在水解过程中,在72、120和168小时取等分试样并离心,并且使用 
Figure GPA00001010787101242
HV 0.45μm膜(Millipore,Billerica,MA,USA)通过 
Figure GPA00001010787101243
RT7板离心机(Thermo Fisher Scientific,Waltham,MA,USA)在2000rpm离心10分钟过滤上清液。在不立即使用时,将过滤的含糖等分试样在-20℃冷冻。通过0.005M H2SO4以0.4ml每分钟的流速在65℃从4.6x250mm 
Figure GPA00001010787101244
HPX-87H柱(Bio-Rad,Hercules,CA,USA)洗脱,并使用以纯糖样品校准的 
Figure GPA00001010787101245
Figure GPA00001010787101246
1100 HPLC(Agilent Technologies,SantaClara,CA,USA),由折射系数检测通过积分葡萄糖和纤维二糖信号而定量后,测量稀释于0.005M H2SO4的样品的糖浓度。所得的等同物用于计算每个反应的纤维素转化的百分数。 
使用下述等式计算纤维素转化成葡萄糖与纤维二糖的程度(转化率,%): 
转化率(%)=(葡萄糖+纤维二糖x1.053)(mg/ml)x100x162/(纤维素(mg/ml)x180)=(葡萄糖+纤维二糖x1.053)(mg/ml)x100/(纤维素(mg/ml)x1.111) 
在这个等式中,因子1.111反映在将纤维素转化成葡萄糖的过程中的重量增加,而因子1.053反映将纤维二糖转化成葡萄糖的过程中的重量增加。 
在上述50g三角瓶实验中PCS水解反应的结果如表1所示。将产生最佳性能的培养液的一株菌命名为里氏木霉SaMe-MF268。 
表1:在168小时的时间点转化为糖的百分比 
Figure GPA00001010787101247
实施例21:载体pSaMe-FH的构建 
通过用Bsp 120I和Pac I消化质粒pSMai155(WO 2005/074647)和质粒pSaMe-FX(实施例11)而构建表达载体pSaMe-FH(图14)。然后使用TAE缓冲液,通过1.0%琼脂糖凝胶电泳分离来自pSMai155的5.5kb片段和来自pSaMeFX的3.9kb片段,并使用 
Figure GPA00001010787101251
凝胶提取试剂盒纯化。然后使用T4 DNA连接酶,根据生产商的规程连接两个片段。用连接产物转化大肠杆菌 感受态细胞。通过对来自纯化自已转化大肠杆菌的质粒的里氏木霉纤维二糖水解酶I基因启动子、特异腐质霉内切葡聚糖酶V信号序列、特异腐质霉内切葡聚糖酶V核心序列、特异腐质霉内切葡聚糖酶V信号序列、米曲霉β-葡糖苷酶成熟编码序列,和里氏木霉纤维二糖水解酶I基因终止子序列进行DNA测序而确认构建体的身份。将一个包含重组质粒的克隆命名为pSaMe-FH。质粒pSaMe-FH包含里氏木霉纤维二糖水解酶I(CEL7A)基因启动子和终止子,其与特异腐质霉Cel45A核心/米曲霉β-葡糖苷酶的基因融合体可操作地连接。质粒pSaMe-FH与pSaMe-FX相同,除了amdS选择性标记已去除,并用潮霉素抗性选择性标记代替。 
实施例22:纤维素酶产生增加并且降解经预处理的玉米秸秆(PCS)能力增强的里氏木霉SMA135-04的突变体的分离 
使用PCS(实施例20)作为纤维素底物,进行纤维素分解酶实验并用于选择平板。在实验前,用大体积蒸馏去离子水洗涤PCS,直至过滤液pH大于pH 4.0。此外,使用100MF金属过滤器筛PCS以去除颗粒。将已洗涤和过滤的PCS重悬于蒸馏水中,至浓度为60mg/ml的悬浮液,并在4℃保存。 
用N-甲基-N-硝基-N-硝基胍(NTG)(Sigma Chemical Co.,St.Louis,MO,USA)对里氏木霉菌株SMA135-04(实施例6)进行诱变处理,NTG是一种主要诱导碱基取代和某些缺失的化学诱变剂(Rowlands,1984,Enzyme Microb.Technol.6:3-10)。完成了恒定处理时间和不同NTG剂量,及恒定NTG浓度和不同处理时间的存活曲线,得到10%的存活水平。为了获得这个存活率,用0.2mg/ml NTG在37℃及温和旋转下处理分生孢子悬浮液20分钟。每次实验以不用NTG处理分生孢子为对照进行,并且将其作为突变体相对于未诱变培养物的竞争性生长的对照。 
在NTG处理后进行突变体的初选。将诱变后存活的共8x106个分生孢子在包含0.5%胰蛋白胨、0.1% Triton X-100和1.5g琼脂的30ml孟德尔培养基中混合。然后向深板(直径150mm,深25mm;Corning Inc,NY,USA)加入这个悬浮液,而琼脂使其在室温硬化。在硬化琼脂后,加入包含0.5%胰蛋白胨、0.1% Triton X-100、1.5%琼脂和1.0% PCS的200ml孟德尔培养基。在硬化琼脂后在28℃温育板。在温育3-5天后,使用在未处理对照菌株之前渗透过PCS选择层的700个菌落进行二次选择。 
对于二次筛选,向包含25ml纤维素酶诱导培养基的125ml摇瓶加入来自每个分离物的三满环分生孢子,并在28℃和200rpm温育5天,以诱导纤维素酶的表达和分泌。在微型离心机中将每份培养液中的一毫升以400xg离心5分钟,并测试上清液的PCS水解活性和总蛋白质收率。 
通过将摇瓶培养液样品以1∶20在50mM乙酸钠pH 5.0中稀释而进行“机械化(robotic)”PCS水解试验。在稀释前,以400μl样品每g PCS向实验板(96孔平底板)加入稀释样品。使用 
Figure GPA00001010787101261
FX(Beckman Coulter,Fullerton,CA),以10g PCS每升加入PCS,然后加入50mM乙酸钠pH 5.0至总体积180μl。在潮湿的盒子中在30℃温育实验板5天,250rpm震荡。为了增加实验的统计精确性,每个样品进行6次重复。然而,对于1∶20样品稀释液使用2个重复。5天温育后,使用PHBAH实验测定水解PCS样品中还原糖(RS)的浓度,所述方法经修改并适于96孔微孔板形式。使用ORCATM Robot(Beckman Coulter,Fullerton,CA,USA),将生长板传递至 FX,并从实验板移出9μl培养液样品并分装于96孔V型底板(MJ Research,Waltham,MA,USA)中。通过加入135μl 0.533% PHBAH于2%氢氧化钠中的溶液而启动反应。在 
Figure GPA00001010787101263
Thermal Cycler(MJ Research,Waltham,MA,USA)上在95℃将每块实验板加热10分钟,并冷却至室温。温育后,用160μl去离子水稀释40μl反应样品,并转移至96孔平底板中。然后,使用 250(Molecular Devices,Sunnyvale,CA)测定样品在405nm处的吸光度。使用由六个葡萄糖标准物(0.000、0.040、0.800、0.120、0.165和0.200mg/ml去离子水)产生的标准曲线将A405值换算成葡萄糖当量,对所述标准品进行与样品类似的处理。标准曲线的平均关联系数大于0.98。使用实施例20中所述等式计算纤维素转化成还原糖的程度(RS得率,%)。 
使用二金鸡纳酸(bicinchoninic acid,BCA)实验测定总蛋白质产率。用水 1∶8稀释样品,使浓度在合适的范围中。将白蛋白标准(BSA)稀释为不同水平,在水中的浓度由2.0mg/ml浓度开始,到0.25mg/ml结束。使用 
Figure GPA00001010787101271
FX,将包括标准的共20μl每种稀释液转移至96孔平底板中。向每个孔加入两百微升BCA底物溶液(BCA蛋白质实验试剂盒,Pierce,Rockford,IL,USA),然后在37℃温育45分钟。一旦温育完成,使用 
Figure GPA00001010787101272
250获得96孔板的562nm光密度。用Microsoft Excel(Microsoft Corporation,Redmond,WA),通过由产生的标准曲线外推而确定样品浓度。 
在挑选的初步分离物中,二十个产生的培养液与来自菌株SMA135-04的培养液相比,显示PCS的水解活性改善。这些分离物产生的纤维素分解培养液相对于亲本菌株,产生的还原糖水平高5-15%。一些分离物,例如,SMai-M104显示出纤维素PCS每体积培养液的水解性能增加,此外分泌总蛋白质的水平更高。 
通过评价发酵产生的培养液的纤维素酶性能,选择性能最佳的里氏木霉突变体菌株SMai-M104。发酵如实施例20中所述进行7天。在带螺旋盖的125-ml Erlenmeyer三角瓶(VWR,West Chester,PA,USA)中在50g PCS水解中测试发酵样品。反应条件包括:6.7%的纤维素加载;6和12mg/g纤维素的酶加载;总反应物50g;50℃和pH 5.0。开始实验,将每个摇瓶和盖称重,并记录向摇瓶加入的PCS的期望量和总重量。向每个摇瓶加入十毫升蒸馏水,然后将所有摇瓶在121℃高压灭菌30分钟。高压灭菌后,将摇瓶冷却至室温。为了使每个摇瓶的总重量达到50克,加入5ml 0.5M乙酸钠pH 5.0,然后加入纤维素酶培养液,以实现期望的加载,然后加入适量的蒸馏水,以达到理想的最终50g重量。然后将摇瓶放在50℃和130rpm的温育摇床(NewBrunswick Scientific,Edison,NJ,USA)中。在第3、5和7天,从每个摇瓶取1ml样品,并加入到96孔深孔板(总体积2.0ml)中。然后使用 
Figure GPA00001010787101273
RT7板离心机(Thermo Fisher Scientific,Waltham,MA,USA)在3000rpm将96孔板离心15分钟。离心后,将200μl上清液转移至96孔0.45μm孔尺寸过滤板(Millipore,Bedford,MA,USA),并施加真空以收集滤液。然后用0.4% NaOH将滤液稀释至还原糖的正确范围,并使用PHBAH试剂(1.5%)如下测定:向V型底96孔板加入50μl PHBAH试剂和100μl样品,并在95℃温育10分钟。为了完成反应,向每个孔加入50μl蒸馏水,并且在将样品混合后,将100μl混合物转移至另一个平底96孔板中,以获得A410处的分光光度读数。使用 葡萄糖校准曲线计算还原糖量,并如下计算消化百分比: 
%消化=还原糖(mg/ml)/(加入的纤维素(mg/ml)×1.11),其中因子1.11反映将纤维素转化成葡萄糖的过程中的重量增加。 
PCS水解实验结果表明,一个命名为SMai-M104的突变体,性能略优于(增加约5%葡萄糖)亲本菌株SMA135-04,特别是在高加载时(12mg/g纤维素)。 
实施例23:里氏木霉菌株SMai26-30的构建 
使用共转化将质粒pCW085(WO 2006/074435)、pSaMe-FX和pCW087(实施例17)导入里氏木霉SMai-M104。质粒pCW085是土生梭孢霉NRRL 8126纤维二糖水解酶(CEL6A)的表达载体。将所有三个质粒通过PEG介导的转化(Penttila等,1987,见上文)导入里氏木霉SMai-M104。每个质粒包含大肠杆菌潮霉素B磷酸转移酶(hph)基因,使转化体能在潮霉素B上生长。 
在27℃和90rpm,在补加2%(w/v)葡萄糖和10mM尿苷的25ml YP培养基中培养里氏木霉SMai-M104 17小时。使用真空驱动一次性过滤系统过滤而收集菌丝体,并用去离子水洗涤两次,用1.2M山梨醇洗涤两次。通过将已洗涤的菌丝体悬浮于20ml 1.2M山梨醇中而产生原生质体,所述山梨醇包含15mg 
Figure GPA00001010787101281
每ml和0.36单位壳多糖酶每ml,并在34℃以90rpm温和震荡而温育15-25分钟。通过在400xg离心7分钟而收集原生质体,并用冷1.2M山梨醇洗涤两次。使用血球计数器为原生质体计数,并重悬于STC中至终浓度为1X108原生质体每ml。将过量的原生质体于-80℃保存在Cryo1℃ Freezing Container中。 
用Pme I消化约各10μg质粒pCW085、pSaMe-FX和pCW087,并将其加入100μl原生质体溶液并温和混合,然后加入260μl PEG缓冲液,混合,并在室温温育30分钟。然后加入STC(3ml)并混合,并将转化溶液涂布在包含1M蔗糖(sucose)和10mM尿苷的PDA上。在28℃温育平板16小时,然后加入包含潮霉素B(30μg/ml终浓度)的琼脂覆盖物并继续温育4-6天。将八十个转化体在PDA平板上传代培养,并在28℃生长。 
在包含25ml纤维素酶诱导培养基的125ml带挡板摇瓶中培养里氏木霉转化体,所述培养基在pH 6.0接种转化体的孢子,并在28℃和200rpm培养5天。使用里氏木霉SMai-M104作为对照。在第5天移出培养液样品。将各一毫升培养液在微型离心机中以15,700xg离心5分钟,并将上清液转移至新管。 
使用 
Figure GPA00001010787101291
Tris-HCl(5%解析)凝胶,用 
Figure GPA00001010787101292
系统进行SDS-PAGE。将五微升第5天的上清液(见上文)悬浮于2X浓度的Laemmli样品缓冲液中,并在存在5%β-巯基乙醇的情况下煮沸3分钟。将上清液样品加载于聚丙烯酰胺凝胶上,并用1X Tris/甘氨酸/SDS作为电泳缓冲液进行电泳。将得到的凝胶用BIO- 
Figure GPA00001010787101293
考马斯染料染色。然后如实施例20所述在PCS水解反应中测试转化体,以鉴定产生最优水解培养液的菌株,所述转化体显示桔橙嗜热霉GH61A多肽和融合蛋白的表达,所述融合蛋白由与米曲霉β-葡糖苷酶和土生梭孢霉纤维二糖水解酶II融合的特异腐质霉内切葡聚糖酶V核心(Cel45A)组成,如通过观察SDS-PAGE凝胶上的条带所见。 
如实施例20所述及如下修改,进行里氏木霉菌株SMai26-30培养液的PCS水解。这批PCS不同于实施例20中使用的,但是在相似条件下制备。在此规程中,使用里氏木霉菌株SMai26-30发酵培养液的不同蛋白质加载量(用mg蛋白质每克纤维素表示)进行PCS(在50mM乙酸钠pH 5.0缓冲水溶液中约11.3% PCS和6.7%纤维素)的水解。在水解过程中在48、120和168小时取等分试样。在上述50g摇瓶实验中PCS水解反应的结果如表2所示。 
表2:在48、72和168小时时间点的百分比转化率 
Figure GPA00001010787101294
生物材料的保藏 
依据布达佩斯条约的条款,下述的生物材料已经保藏于农业研究机构专利培养物保藏中心(Agricultural Research Service Patent Culture Collection),北区研究中心(Northern Regional Research Center),1815 University Street,Peoria,Illinois,61604,并给出了下述的登录号: 
保藏物                  登录号          保藏日期 
大肠杆菌菌株pEJG120     NRRL B-30699    2003年12月19日 
大肠杆菌菌株pTter61C    NRRL B-30813    2005年1月21日 
大肠杆菌菌株pTter61D    NRRL B-30812    2005年1月21日 
大肠杆菌菌株pTter61E    NRRL B-30814    2005年1月21日 
大肠杆菌菌株pTter61G    NRRL B-30811    2005年1月21日 
大肠杆菌菌株pDZA2-7     NRRL B-30704    2004年1月30日 
大肠杆菌菌株pTr3337     NRRL B-30878    2005年9月20日 
大肠杆菌TOP10(pEJG113)  NRRL B-30695    2003年10月17日 
大肠杆菌TOP10pKKAB      NRRL B-30860    2005年7月8日 
NN049573                DSM 14240       2001年4月19日 
所述菌株于下述条件下保藏:确保在本专利申请未决期间,由专利与商标委员依据37C.F.R.§1.14和35U.S.C.§122授权的人能够获得该培养物。该保藏物为所保藏菌株的基本上纯的培养物。在提交了该申请的副本,或其后续文本的国家,依据该外国专利法律的要求,可以获得该保藏物。然而,应当理解,保藏物的获得并不构成对实施本发明的许可,实施本发明是对政府行为所授予的专利权的侵犯。 
本发明中所描述的和要求的并非是要用本文所公开的具体方面来限定范围,因为这些方面意欲作为本发明几个方面的说明。任何等价的方面意欲在本发明的范围之内。事实上,从前面的说明中,对于本领域技术人员来说,除本文所显示和描述的之外,本发明的多种修改是显而易见的。这些修改也意欲落入所附的权利要求的范围之内。在冲突的情况下,将以包括定义部分的本公开为准。 
本文引用了许多参考文献,将其公开的全部内容通过提述并入。 
序列表
<110>诺维信股份有限公司(Novozymes,Inc.)
<120>用于降解纤维素材料的组合物
<130>11250.204-WO
<150>60/941,251
<151>2007-05-31
<160>110
<170>PatentIn version 3.5
<210>1
<211>1846
<212>DNA
<213>土生梭孢霉(Thielavia terrestris)
<400>1
aattgaagga gggagtggcg gagtggccac caagtcaggc ggctgtcaac taaccaagga      60
tgggaacagt tcggctcgcc ttgcccgagg gcagcgttcc ctgatgggga cgaaccatgg     120
gactggggtc agctgctgta taaaagttca aatcgatgat ctctcagatg gcgctgctgg     180
ggtgttctgc gcttttccat cctcgcaacc tggtatccca ctagtccagc gttcggcacc     240
atgaagtcgt tcaccattgc cgccttggca gccctatggg cccaggaggc cgccgcccac     300
gcgaccttcc aggacctctg gattgatgga gtcgactacg gctcgcaatg tgtccgcctc     360
ccggcgtcca actcccccgt caccaatgtt gcgtccgacg atatccgatg caatgtcggc     420
acctcgaggc ccaccgtcaa gtgcccggtc aaggccggct ccacggtcac gatcgagatg     480
caccaggttc gcacgcctct ctgcgtaggc cccccagcta ctatatggca ctaacacgac     540
ctccagcaac ctggcgaccg gtcttgcgcc aacgaggcta tcggcggcga ccactacggc     600
cccgtaatgg tgtacatgtc caaggtcgat gacgcggtga cagccgacgg ttcatcgggc     660
tggttcaagg tgttccagga cagctgggcc aagaacccgt cgggttcgac gggcgacgac     720
gactactggg gcaccaagga cctcaactcg tgctgcggca agatgaacgt caagatcccc     780
gaagacatcg agccgggcga ctacctgctc cgcgccgagg ttatcgcgct gcacgtggcc     840
gccagctcgg gcggcgcgca gttctacatg tcctgctacc agctgaccgt gacgggctcc     900
ggcagcgcca ccccctcgac cgtgaatttc ccgggcgcct actcggccag cgacccgggc     960
atcctgatca acatccacgc gcccatgtcg acctacgtcg tcccgggccc gaccgtgtac    1020
gcgggcggct cgaccaagtc ggctggcagc tcctgctccg gctgcgaggc gacctgcacg    1080
gttggttccg gccccagcgc gacactgacg cagcccacct ccaccgcgac cgcgacctcc    1140
gcccctggcg gcggcggctc cggctgcacg gcggccaagt accagcagtg cggcggcacc    1200
ggctacactg ggtgcaccac ctgcgctgta agttccctcg tgatatgcag cggaacaccg    1260
tctggactgt tttgctaact cgcgtcgtag tccgggtcta cctgcagcgc cgtctcgcct    1320
ccgtactact cgcagtgcct ctaagccggg agcgcttgct cagcgggctg ctgtgaagga    1380
gctccatgtc cccatgccgc catggccgga gtaccgggct gagcgcccaa ttcttgtata    1440
tagttgagtt ttcccaatca tgaatacata tgcatctgca tggactgttg cgtcgtcagt    1500
ctacatcctt tgctccactg aactgtgaga ccccatgtca tccggaccat tcgatcggtg    1560
ctcgctctac catctcggtt gatgggtctg ggcttgagag tcactggcac gtcctcggcg    1620
gtaatgaaat gtggaggaaa gtgtgagctg tctgacgcac tcggcgctga tgagacgttg    1680
agcgcggccc acactggtgt tctgtaagcc agcacacaaa agaatactcc aggatggccc    1740
atagcggcaa atatacagta tcagggatgc aaaaagtgca aaagtaaggg gctcaatcgg    1800
ggatcgaacc cgagacctcg cacatgactt atttcaagtc aggggt                   1846
<210>2
<211>326
<212>PRT
<213>土生梭孢霉(Thielavia terrestris)
<400>2
Met Lys Ser Phe Thr Ile Ala Ala Leu Ala Ala Leu Trp Ala Gln Glu
1               5                   10                  15
Ala Ala Ala His Ala Thr Phe Gln Asp Leu Trp Ile Asp Gly Val Asp
            20                  25                  30
Tyr Gly Ser Gln Cys Val Arg Leu Pro Ala Ser Asn Ser Pro Val Thr
        35                  40                  45
Asn Val Ala Ser Asp Asp Ile Arg Cys Asn Val Gly Thr Ser Arg Pro
    50                  55                  60
Thr Val Lys Cys Pro Val Lys Ala Gly Ser Thr Val Thr Ile Glu Met
65                  70                  75                  80
His Gln Gln Pro Gly Asp Arg Ser Cys Ala Asn Glu Ala Ile Gly Gly
                85                  90                  95
Asp His Tyr Gly Pro Val Met Val Tyr Met Ser Lys Val Asp Asp Ala
            100                 105                 110
Val Thr Ala Asp Gly Ser Ser Gly Trp Phe Lys Val Phe Gln Asp Ser
        115                 120                 125
Trp Ala Lys Asn Pro Ser Gly Ser Thr Gly Asp Asp Asp Tyr Trp Gly
    130                 135                 140
Thr Lys Asp Leu Asn Ser Cys Cys Gly Lys Met Asn Val Lys Ile Pro
145                 150                 155                 160
Glu Asp Ile Glu Pro Gly Asp Tyr Leu Leu Arg Ala Glu Val Ile Ala
                165                 170                 175
Leu His Val Ala Ala Ser Ser Gly Gly Ala Gln Phe Tyr Met Ser Cys
            180                 185                 190
Tyr Gln Leu Thr Val Thr Gly Ser Gly Ser Ala Thr Pro Ser Thr Val
        195                 200                 205
Asn Phe Pro Gly Ala Tyr Ser Ala Ser Asp Pro Gly Ile Leu Ile Asn
    210                 215                 220
Ile His Ala Pro Met Ser Thr Tyr Val Val Pro Gly Pro Thr Val Tyr
225                 230                 235                 240
Ala Gly Gly Ser Thr Lys Ser Ala Gly Ser Ser Cys Ser Gly Cys Glu
                245                 250                 255
Ala Thr Cys Thr Val Gly Ser Gly Pro Ser Ala Thr Leu Thr Gln Pro
            260                 265                 270
Thr Ser Thr Ala Thr Ala Thr Ser Ala Pro Gly Gly Gly Gly Ser Gly
        275                 280                 285
Cys Thr Ala Ala Lys Tyr Gln Gln Cys Gly Gly Thr Gly Tyr Thr Gly
    290                 295                 300
Cys Thr Thr Cys Ala Ser Gly Ser Thr Cys Ser Ala Val Ser Pro Pro
305                 310                 315                 320
Tyr Tyr Ser Gln Cys Leu
                325
<210>3
<211>880
<212>DNA
<213>土生梭孢霉(Thielavia terrestris)
<400>3
accccgggat cactgcccct aggaaccagc acacctcggt ccaatcatgc ggttcgacgc     60
cctctccgcc ctcgctcttg cgccgcttgt ggctggccac ggcgccgtga ccagctacat    120
catcggcggc aaaacctatc ccggctacga gggcttctcg cctgcctcga gcccgccgac    180
gatccagtac cagtggcccg actacaaccc gaccctgagc gtgaccgacc cgaagatgcg    240
ctgcaacggc ggcacctcgg cagagctcag cgcgcccgtc caggccggcg agaacgtgac    300
ggccgtctgg aagcagtgga cccaccagca aggccccgtc atggtctgga tgttcaagtg    360
ccccggcgac ttctcgtcgt gccacggcga cggcaagggc tggttcaaga tcgaccagct    420
gggcctgtgg ggcaacaacc tcaactcgaa caactggggc accgcgatcg tctacaagac    480
cctccagtgg agcaacccga tccccaagaa cctcgcgccg ggcaactacc tcatccgcca    540
cgagctgctc gccctgcacc aggccaacac gccgcagttc tacgccgagt gcgcccagct    600
ggtcgtctcc ggcagcggct ccgccctgcc cccgtccgac tacctctaca gcatccccgt    660
ctacgcgccc cagaacgacc ccggcatcac cgtgagtggg cttccgttcc gcggcgagct    720
ctgtggaaat cttgctgacg atgggctagg ttgacatcta caacggcggg cttacctcct    780
acaccccgcc cggcggcccc gtctggtctg gcttcgagtt ttaggcgcat tgagtcgggg    840
gctacgaggg gaaggcatct gttcgcatga gcgtgggtac                          880
<210>4
<211>478
<212>PRT
<213>土生梭孢霉(Thielavia terrestris)
<400>4
Met Arg Phe Asp Ala Leu Ser Ala Leu Ala Leu Ala Pro Leu Val Ala
1               5                   10                  15
Gly His Gly Ala Val Thr Ser Tyr Ile Ile Gly Gly Lys Thr Tyr Pro
            20                  25                  30
Gly Tyr Glu Gly Phe Ser Pro Ala Ser Ser Pro Pro Thr Ile Gln Tyr
        35                  40                  45
Gln Trp Pro Asp Tyr Asn Pro Thr Leu Ser Val Thr Asp Pro Lys Met
    50                  55                  60
Arg Cys Asn Gly Gly Thr Ser Ala Glu Leu Ser Ala Pro Val Gln Ala
65                  70                  75                  80
Gly Glu Asn Val Thr Ala Val Trp Lys Gln Trp Thr His Gln Gln Gly
                85                  90                  95
Pro Val Met Val Trp Met Phe Lys Cys Pro Gly Asp Phe Ser Ser Ser
            100                 105                 110
His Gly Asp Gly Lys Gly Trp Phe Lys Ile Asp Gln Leu Gly Leu Trp
        115                 120                 125
Gly Asn Asn Leu Asn Ser Asn Asn Trp Gly Thr Ala Ile Val Tyr Lys
    130                 135                 140
Thr Leu Gln Trp Ser Asn Pro Ile Pro Lys Asn Leu Ala Pro Gly Asn
145                 150                 155                 160
Tyr Leu Ile Arg His Glu Leu Leu Ala Leu His Gln Ala Asn Thr Pro
                165                 170                 175
Gln Phe Tyr Ala Glu Cys Ala Gln Leu Val Val Ser Gly Ser Gly Ser
            180                 185                 190
Ala Leu Pro Pro Ser Asp Tyr Leu Tyr Ser Ile Pro Val Tyr Ala Pro
        195                 200                 205
Gln Asn Asp Pro Gly Ile Thr Val Asp Ile Tyr Asn Gly Gly Leu Thr
    210                 215                 220
Ser Tyr Thr Pro Pro Gly Gly Pro Val Trp Ser Gly Phe Glu Phe Met
225                 230                 235                 240
Arg Phe Asp Ala Leu Ser Ala Leu Ala Leu Ala Pro Leu Val Ala Gly
                245                 250                 255
His Gly Ala Val Thr Ser Tyr Ile Ile Gly Gly Lys Thr Tyr Pro Gly
            260                 265                 270
Tyr Glu Gly Phe Ser Pro Ala Ser Ser Pro Pro Thr Ile Gln Tyr Gln
        275                 280                 285
Trp Pro Asp Tyr Asn Pro Thr Leu Ser Val Thr Asp Pro Lys Met Arg
    290                 295                 300
Cys Asn Gly Gly Thr Ser Ala Glu Leu Ser Ala Pro Val Gln Ala Gly
305                 310                 315                 320
Glu Asn Val Thr Ala Val Trp Lys Gln Trp Thr His Gln Gln Gly Pro
                325                 330                 335
Val Met Val Trp Met Phe Lys Cys Pro Gly Asp Phe Ser Ser Ser His
            340                 345                 350
Gly Asp Gly Lys Gly Trp Phe Lys Ile Asp Gln Leu Gly Leu Trp Gly
        355                 360                 365
Asn Asn Leu Asn Ser Asn Asn Trp Gly Thr Ala Ile Val Tyr Lys Thr
    370                 375                 380
Leu Gln Trp Ser Asn Pro Ile Pro Lys Asn Leu Ala Pro Gly Asn Tyr
385                 390                 395                 400
Leu Ile Arg His Glu Leu Leu Ala Leu His Gln Ala Asn Thr Pro Gln
                405                 410                 415
Phe Tyr Ala Glu Cys Ala Gln Leu Val Val Ser Gly Ser Gly Ser Ala
            420                 425                 430
Leu Pro Pro Ser Asp Tyr Leu Tyr Ser Ile Pro Val Tyr Ala Pro Gln
        435                 440                 445
Asn Asp Pro Gly Ile Thr Val Asp Ile Tyr Asn Gly Gly Leu Thr Ser
    450                 455                 460
Tyr Thr Pro Pro Gly Gly Pro Val Trp Ser Gly Phe Glu Phe
465                 470                 475
<210>5
<211>1000
<212>DNA
<213>土生梭孢霉(Thielavia terrestris)
<400>5
ctcctgttcc tgggccaccg cttgttgcct gcactattgg tagagttggt ctattgctag     60
agttggccat gcttctcaca tcagtcctcg gctcggctgc cctgcttgct agcggcgctg    120
cggcacacgg cgccgtgacc agctacatca tcgccggcaa gaattacccg gggtgggtag    180
ctgattattg agggcgcatt caaggttcat accggtgtgc atggctgaca accggctggc    240
agataccaag gcttttctcc tgcgaactcg ccgaacgtca tccaatggca atggcatgac    300
tacaaccccg tcttgtcgtg cagcgactcg aagcttcgct gcaacggcgg cacgtcggcc    360
accctgaacg ccacggccgc accgggcgac accatcaccg ccatctgggc gcagtggacg    420
cacagccagg gccccatcct ggtgtggatg tacaagtgcc cgggctcctt cagctcctgt    480
gacggctccg gcgctggctg gttcaagatc gacgaggccg gcttccacgg cgacggcgtc    540
aaggtcttcc tcgacaccga gaacccgtcc ggctgggaca tcgccaagct cgtcggcggc    600
aacaagcagt ggagcagcaa ggtccccgag ggcctcgccc ccggcaacta cctcgtccgc    660
cacgagttga tcgccctgca ccaggccaac aacccgcagt tctacccgga gtgcgcccag    720
gtcgtcatca ccggctccgg caccgcgcag ccggatgcct catacaaggc ggctatcccc    780
ggctactgca accagaatga cccgaacatc aaggtgagat ccaggcgtaa tgcagtctac    840
tgctggaaag aaagtggtcc aagctaaacc gcgctccagg tgcccatcaa cgaccactcc    900
atccctcaga cctacaagat tcccggccct cccgtcttca agggcaccgc cagcaagaag    960
gcccgggact tcaccgcctg aagttgttga atcgatggag                         1000
<210>6
<211>516
<212>PRT
<213>土生梭孢霉(Thielavia terrestris)
<400>6
Met Leu Leu Thr Ser Val Leu Gly Ser Ala Ala Leu Leu Ala Ser Gly
1               5                   10                  15
Ala Ala Ala His Gly Ala Val Thr Ser Tyr Ile Ile Ala Gly Lys Asn
            20                  25                  30
Tyr Pro Gly Tyr Gln Gly Phe Ser Pro Ala Asn Ser Pro Asn Val Ile
        35                  40                  45
Gln Trp Gln Trp His Asp Tyr Asn Pro Val Leu Ser Cys Ser Asp Ser
    50                  55                  60
Lys Leu Arg Cys Asn Gly Gly Thr Ser Ala Thr Leu Asn Ala Thr Ala
65                  70                  75                  80
Ala Pro Gly Asp Thr Ile Thr Ala Ile Trp Ala Gln Trp Thr His Ser
                85                  90                  95
Gln Gly Pro Ile Leu Val Trp Met Tyr Lys Cys Pro Gly Ser Phe Ser
            100                 105                 110
Ser Cys Asp Gly Ser Gly Ala Gly Trp Phe Lys Ile Asp Glu Ala Gly
        115                 120                 125
Phe His Gly Asp Gly Val Lys Val Phe Leu Asp Thr Glu Asn Pro Ser
    130                 135                 140
Gly Trp Asp Ile Ala Lys Leu Val Gly Gly Asn Lys Gln Trp Ser Ser
145                 150                 155                 160
Lys Val Pro Glu Gly Leu Ala Pro Gly Asn Tyr Leu Val Arg His Glu
                165                 170                 175
Leu Ile Ala Leu His Gln Ala Asn Asn Pro Gln Phe Tyr Pro Glu Cys
            180                 185                 190
Ala Gln Val Val Ile Thr Gly Ser Gly Thr Ala Gln Pro Asp Ala Ser
        195                 200                 205
Tyr Lys Ala Ala Ile Pro Gly Tyr Cys Asn Gln Asn Asp Pro Asn Ile
    210                 215                 220
Lys Val Pro Ile Asn Asp His Ser Ile Pro Gln Thr Tyr Lys Ile Pro
225                 230                 235                 240
Gly Pro Pro Val Phe Lys Gly Thr Ala Ser Lys Lys Ala Arg Asp Phe
                245                 250                 255
Thr Ala Met Leu Leu Thr Ser Val Leu Gly Ser Ala Ala Leu Leu Ala
            260                 265                 270
Ser Gly Ala Ala Ala His Gly Ala Val Thr Ser Tyr Ile Ile Ala Gly
        275                 280                 285
Lys Asn Tyr Pro Gly Tyr Gln Gly Phe Ser Pro Ala Asn Ser Pro Asn
    290                 295                 300
Val Ile Gln Trp Gln Trp His Asp Tyr Asn Pro Val Leu Ser Cys Ser
305                 310                 315                 320
Asp Ser Lys Leu Arg Cys Asn Gly Gly Thr Ser Ala Thr Leu Asn Ala
                325                 330                 335
Thr Ala Ala Pro Gly Asp Thr Ile Thr Ala Ile Trp Ala Gln Trp Thr
            340                 345                 350
His Ser Gln Gly Pro Ile Leu Val Trp Met Tyr Lys Cys Pro Gly Ser
        355                 360                 365
Phe Ser Ser Cys Asp Gly Ser Gly Ala Gly Trp Phe Lys Ile Asp Glu
    370                 375                 380
Ala Gly Phe His Gly Asp Gly Val Lys Val Phe Leu Asp Thr Glu Asn
385                 390                 395                 400
Pro Ser Gly Trp Asp Ile Ala Lys Leu Val Gly Gly Asn Lys Gln Trp
                405                 410                 415
Ser Ser Lys Val Pro Glu Gly Leu Ala Pro Gly Asn Tyr Leu Val Arg
            420                 425                 430
His Glu Leu Ile Ala Leu His Gln Ala Asn Asn Pro Gln Phe Tyr Pro
        435                 440                 445
Glu Cys Ala Gln Val Val Ile Thr Gly Ser Gly Thr Ala Gln Pro Asp
    450                 455                 460
Ala Ser Tyr Lys Ala Ala Ile Pro Gly Tyr Cys Asn Gln Asn Asp Pro
465                 470                 475                 480
Asn Ile Lys Val Pro Ile Asn Asp His Ser Ile Pro Gln Thr Tyr Lys
                485                 490                 495
Ile Pro Gly Pro Pro Val Phe Lys Gly Thr Ala Ser Lys Lys Ala Arg
            500                 505                 510
Asp Phe Thr Ala
        515
<210>7
<211>681
<212>DNA
<213>土生梭孢霉(Thielavia terrestris)
<400>7
atgctcgcaa acggtgccat cgtcttcctg gccgccgccc tcggcgtcag tggccactac     60
acctggccac gggttaacga cggcgccgac tggcaacagg tccgtaaggc ggacaactgg    120
caggacaacg gctacgtcgg ggatgtcacg tcgccacaga tccgctgttt ccaggcgacc    180
ccgtccccgg ccccatccgt cctcaacacc acggccggct cgaccgtgac ctactgggcc    240
aaccccgacg tctaccaccc cgggcctgtg cagttttaca tggcccgcgt gcccgatggc    300
gaggacatca actcgtggaa cggcgacggc gccgtgtggt tcaaggtgta cgaggaccat    360
cctacctttg gcgctcagct cacatggccc agcacgggca agagctcgtt cgcggttccc    420
atccccccgt gcatcaagtc cggctactac ctcctccggg cggagcaaat cggcctgcac    480
gtcgcccaga gcgtaggcgg agcgcagttc tacatctcat gcgcccagct cagcgtcacc    540
ggcggcggca gcaccgagcc gccgaacaag gtggccttcc ccggcgctta cagtgcgacg    600
gacccgggca ttctgatcaa catctactac cctgttccca cgtcctacca gaaccccggc    660
ccggccgtct tcagctgctg a                                              681
<210>8
<211>452
<212>PRT
<213>土生梭孢霉(Thielavia terrestris)
<400>8
Met Leu Ala Asn Gly Ala Ile Val Phe Leu Ala Ala Ala Leu Gly Val
1               5                   10                  15
Ser Gly His Tyr Thr Trp Pro Arg Val Asn Asp Gly Ala Asp Trp Gln
            20                  25                  30
Gln Val Arg Lys Ala Asp Asn Trp Gln Asp Asn Gly Tyr Val Gly Asp
        35                  40                  45
Val Thr Ser Pro Gln Ile Arg Cys Phe Gln Ala Thr Pro Ser Pro Ala
    50                  55                  60
Pro Ser Val Leu Asn Thr Thr Ala Gly Ser Thr Val Thr Tyr Trp Ala
65                  70                  75                  80
Asn Pro Asp Val Tyr His Pro Gly Pro Val Gln Phe Tyr Met Ala Arg
                85                  90                  95
Val Pro Asp Gly Glu Asp Ile Asn Ser Trp Asn Gly Asp Gly Ala Val
            100                 105                 110
Trp Phe Lys Val Tyr Glu Asp His Pro Thr Phe Gly Ala Gln Leu Thr
        115                 120                 125
Trp Pro Ser Thr Gly Lys Ser Ser Phe Ala Val Pro Ile Pro Pro Cys
    130                 135                 140
Ile Lys Ser Gly Tyr Tyr Leu Leu Arg Ala Glu Gln Ile Gly Leu His
145                 150                 155                 160
Val Ala Gln Ser Val Gly Gly Ala Gln Phe Tyr Ile Ser Cys Ala Gln
                165                 170                 175
Leu Ser Val Thr Gly Gly Gly Ser Thr Glu Pro Pro Asn Lys Val Ala
            180                 185                 190
Phe Pro Gly Ala Tyr Ser Ala Thr Asp Pro Gly Ile Leu Ile Asn Ile
        195                 200                 205
Tyr Tyr Pro Val Pro Thr Ser Tyr Gln Asn Pro Gly Pro Ala Val Phe
    210                 215                 220
Ser Cys Met Leu Ala Asn Gly Ala Ile Val Phe Leu Ala Ala Ala Leu
225                 230                 235                 240
Gly Val Ser Gly His Tyr Thr Trp Pro Arg Val Asn Asp Gly Ala Asp
                245                 250                 255
Trp Gln Gln Val Arg Lys Ala Asp Asn Trp Gln Asp Asn Gly Tyr Val
            260                 265                 270
Gly Asp Val Thr Ser Pro Gln Ile Arg Cys Phe Gln Ala Thr Pro Ser
        275                 280                 285
Pro Ala Pro Ser Val Leu Asn Thr Thr Ala Gly Ser Thr Val Thr Tyr
    290                 295                 300
Trp Ala Asn Pro Asp Val Tyr His Pro Gly Pro Val Gln Phe Tyr Met
305                 310                 315                 320
Ala Arg Val Pro Asp Gly Glu Asp Ile Asn Ser Trp Asn Gly Asp Gly
                325                 330                 335
Ala Val Trp Phe Lys Val Tyr Glu Asp His Pro Thr Phe Gly Ala Gln
            340                 345                 350
Leu Thr Trp Pro Ser Thr Gly Lys Ser Ser Phe Ala Val Pro Ile Pro
        355                 360                 365
Pro Cys Ile Lys Ser Gly Tyr Tyr Leu Leu Arg Ala Glu Gln Ile Gly
    370                 375                 380
Leu His Val Ala Gln Ser Val Gly Gly Ala Gln Phe Tyr Ile Ser Cys
385                 390                 395                 400
Ala Gln Leu Ser Val Thr Gly Gly Gly Ser Thr Glu Pro Pro Asn Lys
                405                 410                 415
Val Ala Phe Pro Gly Ala Tyr Ser Ala Thr Asp Pro Gly Ile Leu Ile
            420                 425                 430
Asn Ile Tyr Tyr Pro Val Pro Thr Ser Tyr Gln Asn Pro Gly Pro Ala
        435                 440                 445
Val Phe Ser Cys
    450
<210>9
<211>960
<212>DNA
<213>土生梭孢霉(Thielavia terrestris)
<400>9
atgaagggac ttttcagtgc cgccgccctc tccctggccg tcggccaggc ttcggcccat     60
tacatcttcc agcaactctc catcaacggg aaccagtttc cggtgtacca atatattcgc    120
aagaacacca attataacag tcccgttacc gatctcacgt ccgacgatct tcggtgcaat    180
gtcggcgccc agggtgctgg gacagacacc gtcacggtga aggccggcga ccagttcacc    240
ttcacccttg acacccctgt ttaccaccag gggcccatct ccatctacat gtccaaggcc    300
ccgggcgcgg cgtcagacta cgatggcagc ggcggctggt tcaagatcaa ggactggggc    360
ccgactttca acgccgacgg cacggccacc tgggacatgg ccggctcata cacctacaac    420
atcccgacct gcattcccga cggcgactat ctgctccgca tccagtcgct ggccatccac    480
aacccctggc cggcgggcat cccgcagttc tacatctcct gcgcccagat caccgtgacc    540
ggcggcggca acggcaaccc tggcccgacg gccctcatcc ccggcgcctt caaggacacc    600
gacccgggct acacggtgaa catctacacg aacttccaca actacacggt tcccggcccg    660
gaggtcttca gctgcaacgg cggcggctcg aacccgcccc cgccggtgag tagcagcacg    720
cccgcgacca cgacgctggt cacgtcgacg cgcaccacgt cctccacgtc ctccgcctcg    780
acgccggcct cgaccggcgg ctgcaccgtc gccaagtggg gccagtgcgg cggcaacggg    840
tacaccggct gcacgacctg cgcggccggg tccacctgca gcaagcagaa cgactactac    900
tcgcagtgct tgtaagggag gccgcaaagc atgaggtgtt tgaagaggag gagaggggtc    960
<210>10
<211>608
<212>PRT
<213>土生梭孢霉(Thielavia terrestris)
<400>10
Met Lys Gly Leu Phe Ser Ala Ala Ala Leu Ser Leu Ala Val Gly Gln
1               5                   10                  15
Ala Ser Ala His Tyr Ile Phe Gln Gln Leu Ser Ile Asn Gly Asn Gln
            20                  25                  30
Phe Pro Val Tyr Gln Tyr Ile Arg Lys Asn Thr Asn Tyr Asn Ser Pro
        35                  40                  45
Val Thr Asp Leu Thr Ser Asp Asp Leu Arg Cys Asn Val Gly Ala Gln
    50                  55                  60
Gly Ala Gly Thr Asp Thr Val Thr Val Lys Ala Gly Asp Gln Phe Thr
65                  70                  75                  80
Phe Thr Leu Asp Thr Pro Val Tyr His Gln Gly Pro Ile Ser Ile Tyr
                85                  90                  95
Met Ser Lys Ala Pro Gly Ala Ala Ser Asp Tyr Asp Gly Ser Gly Gly
            100                 105                 110
Trp Phe Lys Ile Lys Asp Trp Gly Pro Thr Phe Asn Ala Asp Gly Thr
        115                 120                 125
Ala Thr Trp Asp Met Ala Gly Ser Tyr Thr Tyr Asn Ile Pro Thr Cys
    130                 135                 140
Ile Pro Asp Gly Asp Tyr Leu Leu Arg Ile Gln Ser Leu Ala Ile His
145                 150                 155                 160
Asn Pro Trp Pro Ala Gly Ile Pro Gln Phe Tyr Ile Ser Cys Ala Gln
                165                 170                 175
Ile Thr Val Thr Gly Gly Gly Asn Gly Asn Pro Gly Pro Thr Ala Leu
            180                 185                 190
Ile Pro Gly Ala Phe Lys Asp Thr Asp Pro Gly Tyr Thr Val Asn Ile
        195                 200                 205
Tyr Thr Asn Phe His Asn Tyr Thr Val Pro Gly Pro Glu Val Phe Ser
    210                 215                 220
Cys Asn Gly Gly Gly Ser Asn Pro Pro Pro Pro Val Ser Ser Ser Thr
225                 230                 235                 240
Pro Ala Thr Thr Thr Leu Val Thr Ser Thr Arg Thr Thr Ser Ser Thr
                245                 250                 255
Ser Ser Ala Ser Thr Pro Ala Ser Thr Gly Gly Cys Thr Val Ala Lys
            260                 265                 270
Trp Gly Gln Cys Gly Gly Asn Gly Tyr Thr Gly Cys Thr Thr Cys Ala
        275                 280                 285
Ala Gly Ser Thr Cys Ser Lys Gln Asn Asp Tyr Tyr Ser Gln Cys Leu
    290                 295                 300
Met Lys Gly Leu Phe Ser Ala Ala Ala Leu Ser Leu Ala Val Gly Gln
305                 310                 315                 320
Ala Ser Ala His Tyr Ile Phe Gln Gln Leu Ser Ile Asn Gly Asn Gln
                325                 330                 335
Phe Pro Val Tyr Gln Tyr Ile Arg Lys Asn Thr Asn Tyr Asn Ser Pro
            340                 345                 350
Val Thr Asp Leu Thr Ser Asp Asp Leu Arg Cys Asn Val Gly Ala Gln
        355                 360                 365
Gly Ala Gly Thr Asp Thr Val Thr Val Lys Ala Gly Asp Gln Phe Thr
    370                 375                 380
Phe Thr Leu Asp Thr Pro Val Tyr His Gln Gly Pro Ile Ser Ile Tyr
385                 390                 395                 400
Met Ser Lys Ala Pro Gly Ala Ala Ser Asp Tyr Asp Gly Ser Gly Gly
                405                 410                 415
Trp Phe Lys Ile Lys Asp Trp Gly Pro Thr Phe Asn Ala Asp Gly Thr
            420                 425                 430
Ala Thr Trp Asp Met Ala Gly Ser Tyr Thr Tyr Asn Ile Pro Thr Cys
        435                 440                 445
Ile Pro Asp Gly Asp Tyr Leu Leu Arg Ile Gln Ser Leu Ala Ile His
    450                 455                 460
Asn Pro Trp Pro Ala Gly Ile Pro Gln Phe Tyr Ile Ser Cys Ala Gln
465                 470                 475                 480
Ile Thr Val Thr Gly Gly Gly Asn Gly Asn Pro Gly Pro Thr Ala Leu
                485                 490                 495
Ile Pro Gly Ala Phe Lys Asp Thr Asp Pro Gly Tyr Thr Val Asn Ile
            500                 505                 510
Tyr Thr Asn Phe His Asn Tyr Thr Val Pro Gly Pro Glu Val Phe Ser
        515                 520                 525
Cys Asn Gly Gly Gly Ser Asn Pro Pro Pro Pro Val Ser Ser Ser Thr
    530                 535                 540
Pro Ala Thr Thr Thr Leu Val Thr Ser Thr Arg Thr Thr Ser Ser Thr
545                 550                 555                 560
Ser Ser Ala Ser Thr Pro Ala Ser Thr Gly Gly Cys Thr Val Ala Lys
                565                 570                 575
Trp Gly Gln Cys Gly Gly Asn Gly Tyr Thr Gly Cys Thr Thr Cys Ala
            580                 585                 590
Ala Gly Ser Thr Cys Ser Lys Gln Asn Asp Tyr Tyr Ser Gln Cys Leu
        595                 600                 605
<210>11
<211>799
<212>DNA
<213>桔橙嗜热霉(Thermoascus aurantiacus)
<400>11
atgtcctttt ccaagataat tgctactgcc ggcgttcttg cctctgcttc tctagtggct     60
ggccatggct tcgttcagaa catcgtgatt gatggtaaaa agtatgtcat tgcaagacgc    120
acataagcgg caacagctga caatcgacag ttatggcggg tatctagtga accagtatcc    180
atacatgtcc aatcctccag aggtcatcgc ctggtctact acggcaactg atcttggatt    240
tgtggacggt actggatacc aaaccccaga tatcatctgc cataggggcg ccaagcctgg    300
agccctgact gctccagtct ctccaggagg aactgttgag cttcaatgga ctccatggcc    360
tgattctcac catggcccag ttatcaacta ccttgctccg tgcaatggtg attgttccac    420
tgtggataag acccaattag aattcttcaa aattgccgag agcggtctca tcaatgatga    480
caatcctcct gggatctggg cttcagacaa tctgatagca gccaacaaca gctggactgt    540
caccattcca accacaattg cacctggaaa ctatgttctg aggcatgaga ttattgctct    600
tcactcagct cagaaccagg atggtgccca gaactatccc cagtgcatca atctgcaggt    660
cactggaggt ggttctgata accctgctgg aactcttgga acggcactct accacgatac    720
cgatcctgga attctgatca acatctatca gaaactttcc agctatatca tccctggtcc    780
tcctctgtat actggttaa                                                 799
<210>12
<211>250
<212>PRT
<213>桔橙嗜热霉(Thermoascus aurantiacus)
<400>12
Met Ser Phe Ser Lys Ile Ile Ala Thr Ala Gly Val Leu Ala Ser Ala
1               5                   10                  15
Ser Leu Val Ala Gly His Gly Phe Val Gln Asn Ile Val Ile Asp Gly
            20                  25                  30
Lys Lys Tyr Tyr Gly Gly Tyr Leu Val Asn Gln Tyr Pro Tyr Met Ser
        35                  40                  45
Asn Pro Pro Glu Val Ile Ala Trp Ser Thr Thr Ala Thr Asp Leu Gly
    50                  55                  60
Phe Val Asp Gly Thr Gly Tyr Gln Thr Pro Asp Ile Ile Cys His Arg
65                  70                  75                  80
Gly Ala Lys Pro Gly Ala Leu Thr Ala Pro Val Ser Pro Gly Gly Thr
                85                  90                  95
Val Glu Leu Gln Trp Thr Pro Trp Pro Asp Ser His His Gly Pro Val
            100                 105                 110
Ile Asn Tyr Leu Ala Pro Cys Asn Gly Asp Cys Ser Thr Val Asp Lys
        115                 120                 125
Thr Gln Leu Glu Phe Phe Lys Ile Ala Glu Ser Gly Leu Ile Asn Asp
    130                 135                 140
Asp Asn Pro Pro Gly Ile Trp Ala Ser Asp Asn Leu Ile Ala Ala Asn
145                 150                 155                 160
Asn Ser Trp Thr Val Thr Ile Pro Thr Thr Ile Ala Pro Gly Asn Tyr
                165                 170                 175
Val Leu Arg His Glu Ile Ile Ala Leu His Ser Ala Gln Asn Gln Asp
            180                 185                 190
Gly Ala Gln Asn Tyr Pro Gln Cys Ile Asn Leu Gln Val Thr Gly Gly
        195                 200                 205
Gly Ser Asp Asn Pro Ala Gly Thr Leu Gly Thr Ala Leu Tyr His Asp
    210                 215                 220
Thr Asp Pro Gly Ile Leu Ile Asn Ile Tyr Gln Lys Leu Ser Ser Tyr
225                 230                 235                 240
Ile Ile Pro Gly Pro Pro Leu Tyr Thr Gly
                245                 250
<210>13
<211>1172
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>13
ggatctaagc cccatcgata tgaagtcctg cgccattctt gcagcccttg gctgtcttgc     60
cgggagcgtt ctcggccatg gacaagtcca aaacttcacg atcaatggac aatacaatca    120
gggtttcatt ctcgattact actatcagaa gcagaatact ggtcacttcc ccaacgttgc    180
tggctggtac gccgaggacc tagacctggg cttcatctcc cctgaccaat acaccacgcc    240
cgacattgtc tgtcacaaga acgcggcccc aggtgccatt tctgccactg cagcggccgg    300
cagcaacatc gtcttccaat ggggccctgg cgtctggcct cacccctacg gtcccatcgt    360
tacctacgtg gctgagtgca gcggatcgtg cacgaccgtg aacaagaaca acctgcgctg    420
ggtcaagatt caggaggccg gcatcaacta taacacccaa gtctgggcgc agcaggatct    480
gatcaaccag ggcaacaagt ggactgtgaa gatcccgtcg agcctcaggc ccggaaacta    540
tgtcttccgc catgaacttc ttgctgccca tggtgcctct agtgcgaacg gcatgcagaa    600
ctatcctcag tgcgtgaaca tcgccgtcac aggctcgggc acgaaagcgc tccctgccgg    660
aactcctgca actcagctct acaagcccac tgaccctggc atcttgttca acccttacac    720
aacaatcacg agctacacca tccctggccc agccctgtgg caaggctaga tccaggggta    780
cggtgttggc gttcgtgaag tcggagctgt tgacaaggat atctgatgat gaacggagag    840
gactgatggg cgtgactgag tgtatatatt tttgatgacc aaattgtata cgaaatccga    900
acgcatggtg atcattgttt atccctgtag tatattgtct ccaggctgct aagagcccac    960
cgggtgtatt acggcaacaa agtcaggaat ttgggtggca atgaacgcag gtctccatga   1020
atgtatatgt gaagaggcat cggctggcat gggcattacc agatataggc cctgtgaaac   1080
atatagtact tgaacgtgct actggaacgg atcataagca agtcatcaac atgtgaaaaa   1140
acactacatg taaaaaaaaa aaaaaaaaaa aa                                 1172
<210>14
<211>249
<212>PRT
<213>里氏木霉(Trichoderma reesei)
<400>14
Met Lys Ser Cys Ala Ile Leu Ala Ala Leu Gly Cys Leu Ala Gly Ser
1               5                   10                  15
Val Leu Gly His Gly Gln Val Gln Asn Phe Thr Ile Asn Gly Gln Tyr
            20                  25                  30
Asn Gln Gly Phe Ile Leu Asp Tyr Tyr Tyr Gln Lys Gln Asn Thr Gly
        35                  40                  45
His Phe Pro Asn Val Ala Gly Trp Tyr Ala Glu Asp Leu Asp Leu Gly
    50                  55                  60
Phe Ile Ser Pro Asp Gln Tyr Thr Thr Pro Asp Ile Val Cys His Lys
65                  70                  75                  80
Asn Ala Ala Pro Gly Ala Ile Ser Ala Thr Ala Ala Ala Gly Ser Asn
                85                  90                  95
Ile Val Phe Gln Trp Gly Pro Gly Val Trp Pro His Pro Tyr Gly Pro
            100                 105                 110
Ile Val Thr Tyr Val Val Glu Cys Ser Gly Ser Cys Thr Thr Val Asn
        115                 120                 125
Lys Asn Asn Leu Arg Trp Val Lys Ile Gln Glu Ala Gly Ile Asn Tyr
    130                 135                 140
Asn Thr Gln Val Trp Ala Gln Gln Asp Leu Ile Asn Gln Gly Asn Lys
145                 150                 155                 160
Trp Thr Val Lys Ile Pro Ser Ser Leu Arg Pro Gly Asn Tyr Val Phe
                165                 170                 175
Arg His Glu Leu Leu Ala Ala His Gly Ala Ser Ser Ala Asn Gly Met
            180                 185                 190
Gln Asn Tyr Pro Gln Cys Val Asn Ile Ala Val Thr Gly Ser Gly Thr
        195                 200                 205
Lys Ala Leu Pro Ala Gly Thr Pro Ala Thr Gln Leu Tyr Lys Pro Thr
    210                 215                 220
Asp Pro Gly Ile Leu Phe Asn Pro Tyr Thr Thr Ile Thr Ser Tyr Thr
225                 230                 235                 240
Ile Pro Gly Pro Ala Leu Trp Gln Gly
                245
<210>15
<211>2771
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>15
ctgttctgct ggttacctgc cacgttatca tgaagcttgg ttggatcgag gtggccgcat     60
tggcggctgc ctcagtagtc agtgccaagg atgatctcgc gtactcccct cctttctacc    120
cttccccatg ggcagatggt cagggtgaat gggcggaagt atacaaacgc gctgtagaca    180
tagtttccca gatgacgttg acagagaaag tcaacttaac gactggaaca ggatggcaac    240
tagagaggtg tgttggacaa actggcagtg ttcccagact caacatcccc agcttgtgtt    300
tgcaggatag tcctcttggt attcgtttct cggactacaa ttcagctttc cctgcgggtg    360
ttaatgtcgc tgccacctgg gacaagacgc tcgcctacct tcgtggtcag gcaatgggtg    420
aggagttcag tgataagggt attgacgttc agctgggtcc tgctgctggc cctctcggtg    480
ctcatccgga tggcggtaga aactgggaag gtttctcacc agatccagcc ctcaccggtg    540
tactttttgc ggagacgatt aagggtattc aagatgctgg tgtcattgcg acagctaagc    600
attatatcat gaacgaacaa gagcatttcc gccaacaacc cgaggctgcg ggttacggat    660
tcaacgtaag cgacagtttg agttccaacg ttgatgacaa gactatgcat gaattgtacc    720
tctggccctt cgcggatgca gtacgcgctg gagtcggtgc tgtcatgtgc tcttacaacc     780
aaatcaacaa cagctacggt tgcgagaata gcgaaactct gaacaagctt ttgaaggcgg     840
agcttggttt ccaaggcttc gtcatgagtg attggaccgc tcatcacagc ggcgtaggcg     900
ctgctttagc aggtctggat atgtcgatgc ccggtgatgt taccttcgat agtggtacgt     960
ctttctgggg tgcaaacttg acggtcggtg tccttaacgg tacaatcccc caatggcgtg    1020
ttgatgacat ggctgtccgt atcatggccg cttattacaa ggttggccgc gacaccaaat    1080
acacccctcc caacttcagc tcgtggacca gggacgaata tggtttcgcg cataaccatg    1140
tttcggaagg tgcttacgag agggtcaacg aattcgtgga cgtgcaacgc gatcatgccg    1200
acctaatccg tcgcatcggc gcgcagagca ctgttctgct gaagaacaag ggtgccttgc    1260
ccttgagccg caaggaaaag ctggtcgccc ttctgggaga ggatgcgggt tccaactcgt    1320
ggggcgctaa cggctgtgat gaccgtggtt gcgataacgg tacccttgcc atggcctggg    1380
gtagcggtac tgcgaatttc ccatacctcg tgacaccaga gcaggcgatt cagaacgaag    1440
ttcttcaggg ccgtggtaat gtcttcgccg tgaccgacag ttgggcgctc gacaagatcg    1500
ctgcggctgc ccgccaggcc agcgtatctc tcgtgttcgt caactccgac tcaggagaaa    1560
gctatcttag tgtggatgga aatgagggcg atcgtaacaa catcactctg tggaagaacg    1620
gcgacaatgt ggtcaagacc gcagcgaata actgtaacaa caccgtggtc atcatccact    1680
ccgtcggacc agttttgatc gatgaatggt atgaccaccc caatgtcact ggtattctct    1740
gggctggtct gccaggccag gagtctggta actccatcgc cgatgtgctg tacggtcgtg    1800
tcaaccctgg cgccaagtct cctttcactt ggggcaagac ccgggagtcg tatggttctc    1860
ccttggtcaa ggatgccaac aatggcaacg gagcgcccca gtctgatttc acccagggtg    1920
ttttcatcga ttaccgccat ttcgataagt tcaatgagac ccctatctac gagtttggct    1980
acggcttgag ctacaccacc ttcgagctct ccgacctcca tgttcagccc ctgaacgcgt    2040
cccgatacac tcccaccagt ggcatgactg aagctgcaaa gaactttggt gaaattggcg    2100
atgcgtcgga gtacgtgtat ccggaggggc tggaaaggat ccatgagttt atctatccct    2160
ggatcaactc taccgacctg aaggcatcgt ctgacgattc taactacggc tgggaagact    2220
ccaagtatat tcccgaaggc gccacggatg ggtctgccca gccccgtttg cccgctagtg    2280
gtggtgccgg aggaaacccc ggtctgtacg aggatctttt ccgcgtctct gtgaaggtca    2340
agaacacggg caatgtcgcc ggtgatgaag ttcctcagct gtacgtttcc ctaggcggcc    2400
cgaatgagcc caaggtggta ctgcgcaagt ttgagcgtat tcacttggcc ccttcgcagg    2460
aggccgtgtg gacaacgacc cttacccgtc gtgaccttgc aaactgggac gtttcggctc    2520
aggactggac cgtcactcct taccccaaga cgatctacgt tggaaactcc tcacggaaac    2580
tgccgctcca ggcctcgctg cctaaggccc agtaaggggc aagtcctgat tgtacagagc    2640
atttcgagat ttatgatgta catgtttatg aatgacctag ggtagggtaa tacttagtag    2700
ggttagttct aattcttgga gtcaagtatt gactcactgg gccgataaaa aaaaaaaaaa    2760
aaaaaaaaaa a                                                         2771
<210>16
<211>861
<212>PRT
<213>米曲霉(Aspergillus oryzae)
<400>16
Met Lys Leu Gly Trp Ile Glu Val Ala Ala Leu Ala Ala Ala Ser Val
1               5                   10                  15
Val Ser Ala Lys Asp Asp Leu Ala Tyr Ser Pro Pro Phe Tyr Pro Ser
            20                  25                  30
Pro Trp Ala Asp Gly Gln Gly Glu Trp Ala Glu Val Tyr Lys Arg Ala
        35                  40                  45
Val Asp Ile Val Ser Gln Met Thr Leu Thr Glu Lys Val Asn Leu Thr
    50                  55                  60
Thr Gly Thr Gly Trp Gln Leu Glu Arg Cys Val Gly Gln Thr Gly Ser
65                  70                  75                  80
Val Pro Arg Leu Asn Ile Pro Ser Leu Cys Leu Gln Asp Ser Pro Leu
                85                  90                  95
Gly Ile Arg Phe Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Val Asn
            100                 105                 110
Val Ala Ala Thr Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Gln Ala
        115                 120                 125
Met Gly Glu Glu Phe Ser Asp Lys Gly Ile Asp Val Gln Leu Gly Pro
    130                 135                 140
Ala Ala Gly Pro Leu Gly Ala His Pro Asp Gly Gly Arg Asn Trp Glu
145                 150                 155                 160
Gly Phe Ser Pro Asp Pro Ala Leu Thr Gly Val Leu Phe Ala Glu Thr
                165                 170                 175
Ile Lys Gly Ile Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr
            180                 185                 190
Ile Met Asn Glu Gln Glu His Phe Arg Gln Gln Pro Glu Ala Ala Gly
        195                 200                 205
Tyr Gly Phe Asn Val Ser Asp Ser Leu Ser Ser Asn Val Asp Asp Lys
    210                 215                 220
Thr Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala
225                 230                 235                 240
Gly Val Gly Ala Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr
                245                 250                 255
Gly Cys Glu Asn Ser Glu Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu
            260                 265                 270
Gly Phe Gln Gly Phe Val Met Ser Asp Trp Thr Ala His His Ser Gly
        275                 280                 285
Val Gly Ala Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Val
    290                 295                 300
Thr Phe Asp Ser Gly Thr Ser Phe Trp Gly Ala Asn Leu Thr Val Gly
305                 310                 315                 320
Val Leu Asn Gly Thr Ile Pro Gln Trp Arg Val Asp Asp Met Ala Val
                325                 330                 335
Arg Ile Met Ala Ala Tyr Tyr Lys Val Gly Arg Asp Thr Lys Tyr Thr
            340                 345                 350
Pro Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Phe Ala His
        355                 360                 365
Asn His Val Ser Glu Gly Ala Tyr Glu Arg Val Asn Glu Phe Val Asp
    370                 375                 380
Val Gln Arg Asp His Ala Asp Leu Ile Arg Arg Ile Gly Ala Gln Ser
385                 390                 395                 400
Thr Val Leu Leu Lys Asn Lys Gly Ala Leu Pro Leu Ser Arg Lys Glu
                405                 410                 415
Lys Leu Val Ala Leu Leu Gly Glu Asp Ala Gly Ser Asn Ser Trp Gly
            420                 425                 430
Ala Asn Gly Cys Asp Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met
        435                 440                 445
Ala Trp Gly Ser Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu
    450                 455                 460
Gln Ala Ile Gln Asn Glu Val Leu Gln Gly Arg Gly Asn Val Phe Ala
465                 470                 475                 480
Val Thr Asp Ser Trp Ala Leu Asp Lys Ile Ala Ala Ala Ala Arg Gln
                485                 490                 495
Ala Ser Val Ser Leu Val Phe Val Asn Ser Asp Ser Gly Glu Ser Tyr
            500                 505                 510
Leu Ser Val Asp Gly Asn Glu Gly Asp Arg Asn Asn Ile Thr Leu Trp
        515                 520                 525
Lys Asn Gly Asp Asn Val Val Lys Thr Ala Ala Asn Asn Cys Asn Asn
    530                 535                 540
Thr Val Val Ile Ile His Ser Val Gly Pro Val Leu Ile Asp Glu Trp
545                 550                 555                 560
Tyr Asp His Pro Asn Val Thr Gly Ile Leu Trp Ala Gly Leu Pro Gly
                565                 570                 575
Gln Glu Ser Gly Asn Ser Ile Ala Asp Val Leu Tyr Gly Arg Val Asn
            580                 585                 590
Pro Gly Ala Lys Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr
        595                 600                 605
Gly Ser Pro Leu Val Lys Asp Ala Asn Asn Gly Asn Gly Ala Pro Gln
    610                 615                 620
Ser Asp Phe Thr Gln Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys
625                 630                 635                 640
Phe Asn Glu Thr Pro Ile Tyr Glu Phe Gly Tyr Gly Leu Ser Tyr Thr
                645                 650                 655
Thr Phe Glu Leu Ser Asp Leu His Val Gln Pro Leu Asn Ala Ser Arg
            660                 665                 670
Tyr Thr Pro Thr Ser Gly Met Thr Glu Ala Ala Lys Asn Phe Gly Glu
        675                 680                 685
Ile Gly Asp Ala Ser Glu Tyr Val Tyr Pro Glu Gly Leu Glu Arg Ile
    690                 695                 700
His Glu Phe Ile Tyr Pro Trp Ile Asn Ser Thr Asp Leu Lys Ala Ser
705                 710                 715                 720
Ser Asp Asp Ser Asn Tyr Gly Trp Glu Asp Ser Lys Tyr Ile Pro Glu
                725                 730                 735
Gly Ala Thr Asp Gly Ser Ala Gln Pro Arg Leu Pro Ala Ser Gly Gly
            740                 745                 750
Ala Gly Gly Asn Pro Gly Leu Tyr Glu Asp Leu Phe Arg Val Ser Val
        755                 760                 765
Lys Val Lys Asn Thr Gly Asn Val Ala Gly Asp Glu Val Pro Gln Leu
    770                 775                 780
Tyr Val Ser Leu Gly Gly Pro Asn Glu Pro Lys Val Val Leu Arg Lys
785                 790                 795                 800
Phe Glu Arg Ile His Leu Ala Pro Ser Gln Glu Ala Val Trp Thr Thr
                805                 810                 815
Thr Leu Thr Arg Arg Asp Leu Ala Asn Trp Asp Val Ser Ala Gln Asp
            820                 825                 830
Trp Thr Val Thr Pro Tyr Pro Lys Thr Ile Tyr Val Gly Asn Ser Ser
        835                 840                 845
Arg Lys Leu Pro Leu Gln Ala Ser Leu Pro Lys Ala Gln
    850                 855                 860
<210>17
<211>5172
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>17
atgaagcttg gttggatcga ggtggccgca ttggcggctg cctcagtagt cagtgccaag    60
gatgatctcg cgtactcccc tcctttctac ccttccccat tacttcgaac caacctagct    120
ccaccggcgt aaccgccgac ggagtcatca gtcacggttc ctactagagc gcatgagggg    180
aggaaagatg ggaaggggta gggcagatgg tcagggtgaa tgggcggaag tatacaaacg    240
cgctgtagac atagtttccc agatgacgtt gacagagaaa gtcaacttaa cgactggaac    300
cccgtctacc agtcccactt acccgccttc atatgtttgc gcgacatctg tatcaaaggg    360
tctactgcaa ctgtctcttt cagttgaatt gctgaccttg aggatggcaa ctagagaggt    420
gtgttggaca aactggcagt gttcccagac tcaacatccc cagcttgtgt ttgcaggata    480
gtcctcttgg tattcgtttc tcctaccgtt gatctctcca cacaacctgt ttgaccgtca    540
caagggtctg agttgtaggg gtcgaacaca aacgtcctat caggagaacc ataagcaaag    600
tcggactaca attcagcttt ccctgcgggt gttaatgtcg ctgccacctg ggacaagacg    660
ctcgcctacc ttcgtggtca ggcaatgggt gaggagttca agcctgatgt taagtcgaaa    720
gggacgccca caattacagc gacggtggac cctgttctgc gagcggatgg aagcaccagt    780
ccgttaccca ctcctcaagt gtgataaggg tattgacgtt cagctgggtc ctgctgctgg    840
ccctctcggt gctcatccgg atggcggtag aaactgggaa ggtttctcac cagatccagc    900
cactattccc ataactgcaa gtcgacccag gacgacgacc gggagagcca cgagtaggcc    960
taccgccatc tttgaccctt ccaaagagtg gtctaggtcg cctcaccggt gtactttttg    1020
cggagacgat taagggtatt caagatgctg gtgtcattgc gacagctaag cattatatca    1080
tgaacgaaca agagcatttc ggagtggcca catgaaaaac gcctctgcta attcccataa    1140
gttctacgac cacagtaacg ctgtcgattc gtaatatagt acttgcttgt tctcgtaaag    1200
cgccaacaac ccgaggctgc gggttacgga ttcaacgtaa gcgacagttt gagttccaac    1260
gttgatgaca agactatgca tgaattgtac ctctggccct gcggttgttg ggctccgacg    1320
cccaatgcct aagttgcatt cgctgtcaaa ctcaaggttg caactactgt tctgatacgt    1380
acttaacatg gagaccggga tcgcggatgc agtacgcgct ggagtcggtg ctgtcatgtg    1440
ctcttacaac caaatcaaca acagctacgg ttgcgagaat agcgaaactc tgaacaagct    1500
agcgcctacg tcatgcgcga cctcagccac gacagtacac gagaatgttg gtttagttgt    1560
tgtcgatgcc aacgctctta tcgctttgag acttgttcga tttgaaggcg gagcttggtt    1620
tccaaggctt cgtcatgagt gattggaccg ctcatcacag cggcgtaggc gctgctttag    1680
caggtctgga tatgtcgatg aaacttccgc ctcgaaccaa aggttccgaa gcagtactca    1740
ctaacctggc gagtagtgtc gccgcatccg cgacgaaatc gtccagacct atacagctac    1800
cccggtgatg ttaccttcga tagtggtacg tctttctggg gtgcaaactt gacggtcggt    1860
gtccttaacg gtacaatccc ccaatggcgt gttgatgaca gggccactac aatggaagct    1920
atcaccatgc agaaagaccc cacgtttgaa ctgccagcca caggaattgc catgttaggg    1980
ggttaccgca caactactgt tggctgtccg tatcatggcc gcttattaca aggttggccg    2040
cgacaccaaa tacacccctc ccaacttcag ctcgtggacc agggacgaat atggtttcgc    2100
accgacaggc atagtaccgg cgaataatgt tccaaccggc gctgtggttt atgtggggag    2160
ggttgaagtc gagcacctgg tccctgctta taccaaagcg gcataaccat gtttcggaag    2220
gtgcttacga gagggtcaac gaattcgtgg acgtgcaacg cgatcatgcc gacctaatcc    2280
gtcgcatcgg cgcgcagagc cgtattggta caaagccttc cacgaatgct ctcccagttg    2340
cttaagcacc tgcacgttgc gctagtacgg ctggattagg cagcgtagcc gcgcgtctcg    2400
actgttctgc tgaagaacaa gggtgccttg cccttgagcc gcaaggaaaa gctggtcgcc    2460
cttctgggag aggatgcggg ttccaactcg tggggcgcta tgacaagacg acttcttgtt    2520
cccacggaac gggaactcgg cgttcctttt cgaccagcgg gaagaccctc tcctacgccc    2580
aaggttgagc accccgcgat acggctgtga tgaccgtggt tgcgataacg gtacccttgc    2640
catggcctgg ggtagcggta ctgcgaattt cccatacctc gtgacaccag agcaggcgat    2700
tgccgacact actggcacca acgctattgc catgggaacg gtaccggacc ccatcgccat    2760
gacgcttaaa gggtatggag cactgtggtc tcgtccgcta tcagaacgaa gttcttcagg    2820
gccgtggtaa tgtcttcgcc gtgaccgaca gttgggcgct cgacaagatc gctgcggctg    2880
cccgccaggc cagcgtatct agtcttgctt caagaagtcc cggcaccatt acagaagcgg    2940
cactggctgt caacccgcga gctgttctag cgacgccgac gggcggtccg gtcgcataga    3000
ctcgtgttcg tcaactccga ctcaggagaa ggctatctta gtgtggatgg aaatgagggc    3060
gatcgtaaca acatcactct gtggaagaac ggcgacaatg gagcacaagc agttgaggct    3120
gagtcctctt ccgatagaat cacacctacc tttactcccg ctagcattgt tgtagtgaga    3180
caccttcttg ccgctgttac tggtcaagac cgcagcgaat aactgtaaca acaccgttgt    3240
catcatccac tccgtcggac cagttttgat cgatgaatgg tatgaccacc ccaatgtcac    3300
accagttctg gcgtcgctta ttgacattgt tgtggcaaca gtagtaggtg aggcagcctg    3360
gtcaaaacta gctacttacc atactggtgg ggttacagtg tggtattctc tgggctggtc    3420
tgccaggcca ggagtctggt aactccattg ccgatgtgct gtacggtcgt gtcaaccctg    3480
gcgccaagtc tcctttcact accataagag acccgaccag acggtccggt cctcagacca    3540
ttgaggtaac ggctacacga catgccagca cagttgggac cgcggttcag aggaaagtga 3600
tggggcaaga cccgggagtc gtatggttct cccttggtca aggatgccaa caatggcaac 3660
ggagcgcccc agtctgattt cacccagggt gttttcatcg accccgttct gggccctcag 3720
cataccaaga gggaaccagt tcctacggtt gttaccgttg cctcgcgggg tcagactaaa 3780
gtgggtccca caaaagtagc attaccgcca tttcgataag ttcaatgaga cccctatcta 3840
cgagtttggc tacggcttga gctacaccac cttcgagctc tccgacctcc atgttcagcc 3900
taatggcggt aaagctattc aagttactct ggggatagat gctcaaaccg atgccgaact 3960
cgatgtggtg gaagctcgag aggctggagg tacaagtcgg cctgaacgcg tcccgataca 4020
ctcccaccag tggcatgact gaagctgcaa agaactttgg tgaaattggc gatgcgtcgg 4080
agtacgtgta tccggagggg ggacttgcgc agggctatgt gagggtggtc accgtactga 4140
cttcgacgtt tcttgaaacc actttaaccg ctacgcagcc tcatgcacat aggcctcccc 4200
ctggaaagga tccatgagtt tatctatccc tggatcaact ctaccgacct gaaggcatcg 4260
tctgacgatt ctaactacgg ctgggaagac tccaagtata gacctttcct aggtactcaa 4320
atagataggg acctagttga gatggctgga cttccgtagc agactgctaa gattgatgcc 4380
gacccttctg aggttcatat ttcccgaagg cgccacggat gggtctgccc agccccgttt 4440
gcccgctagt ggtggtgccg gaggaaaccc cggtctgtac gaggatcttt tccgcgtctc 4500
aagggcttcc gcggtgccta cccagacggg tcggggcaaa cgggcgatca ccaccacggc 4560
ctcctttggg gccagacatg ctcctagaaa aggcgcagag tgtgaaggtc aagaacacgg 4620
gcaatgtcgc cggtgatgaa gttcctcagc tgtacgtttc cctaggcggc ccgaatgagc 4680
ccaaggtggt actgcgcaag acacttccag ttcttgtgcc cgttacagcg gccactactt 4740
caaggagtcg acatgcaaag ggatccgccg ggcttactcg ggttccacca tgacgcgttc 4800
tttgagcgta ttcacttggc cccttcgcag gaggccgtgt ggacaacgac ccttacccgt 4860
cgtgaccttg caaactggga cgtttcggct caggactgga aaactcgcat aagtgaaccg 4920
gggaagcgtc ctccggcaca cctgttgctg ggaatgggca gcactggaac gtttgaccct 4980
gcaaagccga gtcctgacct ccgtcactcc ttaccccaag acgatctacg ttggaaactc 5040
ctcacggaaa ctgccgctcc aggcctcgct gcctaaggcc cagtaaggca gtgaggaatg 5100
gggttctgct agatgcaacc tttgaggagt gcctttgacg gcgaggtccg gagcgacgga 5160
ttccgggtca tt                                                     5172
<210>18
<211>861
<212>PRT
<213>米曲霉(Aspergillus oryzae)
<400>18
Met Lys Leu Gly Trp Ile Glu Val Ala Ala Leu Ala Ala Ala Ser Val
1               5                   10                  15
Val Ser Ala Lys Asp Asp Leu Ala Tyr Ser Pro Pro Phe Tyr Pro Ser
            20                  25                  30
Pro Trp Ala Asp Gly Gln Gly Glu Trp Ala Glu Val Tyr Lys Arg Ala
        35                  40                  45
Val Asp Ile Val Ser Gln Met Thr Leu Thr Glu Lys Val Asn Leu Thr
    50                  55                  60
Thr Gly Thr Gly Trp Gln Leu Glu Arg Cys Val Gly Gln Thr Gly Ser
65                  70                  75                  80
Val Pro Arg Leu Asn Ile Pro Ser Leu Cys Leu Gln Asp Ser Pro Leu
                85                  90                  95
Gly Ile Arg Phe Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Val Asn
            100                 105                 110
Val Ala Ala Thr Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Gln Ala
        115                 120                 125
Met Gly Glu Glu Phe Ser Asp Lys Gly Ile Asp Val Gln Leu Gly Pro
    130                 135                 140
Ala Ala Gly Pro Leu Gly Ala His Pro Asp Gly Gly Arg Asn Trp Glu
145                 150                 155                 160
Gly Phe Ser Pro Asp Pro Ala Leu Thr Gly Val Leu Phe Ala Glu Thr
                165                 170                 175
Ile Lys Gly Ile Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr
            180                 185                 190
Ile Met Asn Glu Gln Glu His Phe Arg Gln Gln Pro Glu Ala Ala Gly
        195                 200                 205
Tyr Gly Phe Asn Val Ser Asp Ser Leu Ser Ser Asn Val Asp Asp Lys
    210                 215                 220
Thr Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala
225                 230                 235                 240
Gly Val Gly Ala Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr
                245                 250                 255
Gly Cys Glu Asn Ser Glu Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu
            260                 265                 270
Gly Phe Gln Gly Phe Val Met Ser Asp Trp Thr Ala His His Ser Gly
        275                 280                 285
Val Gly Ala Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Val
    290                 295                 300
Thr Phe Asp Ser Gly Thr Ser Phe Trp Gly Ala Asn Leu Thr Val Gly
305                 310                 315                 320
Val Leu Asn Gly Thr Ile Pro Gln Trp Arg Val Asp Asp Met Ala Val
                325                 330                 335
Arg Ile Met Ala Ala Tyr Tyr Lys Val Gly Arg Asp Thr Lys Tyr Thr
            340                 345                 350
Pro Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Phe Ala His
        355                 360                 365
Asn His Val Ser Glu Gly Ala Tyr Glu Arg Val Asn Glu Phe Val Asp
    370                 375                 380
Val Gln Arg Asp His Ala Asp Leu Ile Arg Arg Ile Gly Ala Gln Ser
385                 390                 395                 400
Thr Val Leu Leu Lys Asn Lys Gly Ala Leu Pro Leu Ser Arg Lys Glu
                405                 410                 415
Lys Leu Val Ala Leu Leu Gly Glu Asp Ala Gly Ser Asn Ser Trp Gly
            420                 425                 430
Ala Asn Gly Cys Asp Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met
        435                 440                 445
Ala Trp Gly Ser Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu
    450                 455                 460
Gln Ala Ile Gln Asn Glu Val Leu Gln Gly Arg Gly Asn Val Phe Ala
465                 470                 475                 480
Val Thr Asp Ser Trp Ala Leu Asp Lys Ile Ala Ala Ala Ala Arg Gln
                485                 490                 495
Ala Ser Val Ser Leu Val Phe Val Asn Ser Asp Ser Gly Glu Gly Tyr
            500                 505                 510
Leu Ser Val Asp Gly Asn Glu Gly Asp Arg Asn Asn Ile Thr Leu Trp
        515                 520                 525
Lys Asn Gly Asp Asn Val Val Lys Thr Ala Ala Asn Asn Cys Asn Asn
    530                 535                 540
Thr Val Val Ile Ile His Ser Val Gly Pro Val Leu Ile Asp Glu Trp
545                 550                 555                 560
Tyr Asp His Pro Asn Val Thr Gly Ile Leu Trp Ala Gly Leu Pro Gly
                565                 570                 575
Gln Glu Ser Gly Asn Ser Ile Ala Asp Val Leu Tyr Gly Arg Val Asn
            580                 585                 590
Pro Gly Ala Lys Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr
        595                 600                 605
Gly Ser Pro Leu Val Lys Asp Ala Asn Asn Gly Asn Gly Ala Pro Gln
    610                 615                 620
Ser Asp Phe Thr Gln Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys
625                 630                 635                 640
Phe Asn Glu Thr Pro Ile Tyr Glu Phe Gly Tyr Gly Leu Ser Tyr Thr
                645                 650                 655
Thr Phe Glu Leu Ser Asp Leu His Val Gln Pro Leu Asn Ala Ser Arg
            660                 665                 670
Tyr Thr Pro Thr Ser Gly Met Thr Glu Ala Ala Lys Asn Phe Gly Glu
        675                 680                 685
Ile Gly Asp Ala Ser Glu Tyr Val Tyr Pro Glu Gly Leu Glu Arg Ile
    690                 695                 700
His Glu Phe Ile Tyr Pro Trp Ile Asn Ser Thr Asp Leu Lys Ala Ser
705                 710                 715                 720
Ser Asp Asp Ser Asn Tyr Gly Trp Glu Asp Ser Lys Tyr Ile Pro Glu
                725                 730                 735
Gly Ala Thr Asp Gly Ser Ala Gln Pro Arg Leu Pro Ala Ser Gly Gly
            740                 745                 750
Ala Gly Gly Asn Pro Gly Leu Tyr Glu Asp Leu Phe Arg Val Ser Val
        755                 760                 765
Lys Val Lys Asn Thr Gly Asn Val Ala Gly Asp Glu Val Pro Gln Leu
    770                 775                 780
Tyr Val Ser Leu Gly Gly Pro Asn Glu Pro Lys Val Val Leu Arg Lys
785                 790                 795                 800
Phe Glu Arg Ile His Leu Ala Pro Ser Gln Glu Ala Val Trp Thr Thr
                805                 810                 815
Thr Leu Thr Arg Arg Asp Leu Ala Asn Trp Asp Val Ser Ala Gln Asp
            820                 825                 830
Trp Thr Val Thr Pro Tyr Pro Lys Thr Ile Tyr Val Gly Asn Ser Ser
        835                 840                 845
Arg Lys Leu Pro Leu Gln Ala Ser Leu Pro Lys Ala Gln
    850                 855                 860
<210>19
<211>3060
<212>DNA
<213>烟曲霉(Aspergillus fumigatus)
<400>19
atgagattcg gttggctcga ggtggccgct ctgacggccg cttctgtagc caatgcccag    60
gtttgtgatg ctttcccgtc attgtttcgg atatagttga caatagtcat ggaaataatc    120
aggaattggc tttctctcca ccattctacc cttcgccttg ggctgatggc cagggagagt    180
gggcagatgc ccatcgacgc gccgtcgaga tcgtttctca gatgacactg gcggagaagg    240
ttaaccttac aacgggtact gggtgggttg cgactttttt gttgacagtg agctttcttc    300
actgaccatc tacacagatg ggaaatggac cgatgcgtcg gtcaaaccgg cagcgttccc    360
aggtaagctt gcaattctgc aacaacgtgc aagtgtagtt gctaaaacgc ggtggtgcag    420
acttggtatc aactggggtc tttgtggcca ggattcccct ttgggtatcc gtttctgtga    480
gctatacccg cggagtcttt cagtccttgt attatgtgct gatgattgtc tctgtatagc    540
tgacctcaac tccgccttcc ctgctggtac taatgtcgcc gcgacatggg acaagacact    600
cgcctacctt cgtggcaagg ccatgggtga ggaattcaac gacaagggcg tggacatttt    660
gctggggcct gctgctggtc ctctcggcaa atacccggac ggcggcagaa tctgggaagg    720
cttctctcct gatccggttc tcactggtgt acttttcgcc gaaactatca agggtatcca    780
agacgcgggt gtgattgcta ctgccaagca ttacattctg aatgaacagg agcatttccg    840
acaggttggc gaggcccagg gatatggtta caacatcacg gagacgatca gctccaacgt    900
ggatgacaag accatgcacg agttgtacct ttggtgagta gttgacactg caaatgagga    960
ccttgattga tttgactgac ctggaatgca ggccctttgc agatgctgtg cgcggtaaga    1020
ttttccgtag acttgacctc gcgacgaaga aatcgctgac gaaccatcgt agctggcgtt    1080
ggcgctgtca tgtgttccta caatcaaatc aacaacagct acggttgtca aaacagtcaa    1140
actctcaaca agctcctcaa ggctgagctg ggcttccaag gcttcgtcat gagtgactgg    1200
agcgctcacc acagcggtgt cggcgctgcc ctcgctgggt tggatatgtc gatgcctgga    1260
gacatttcct tcgacgacgg actctccttc tggggcacga acctaactgt cagtgttctt    1320
aacggcaccg ttccagcctg gcgtgtcgat gacatggctg ttcgtatcat gaccgcgtac    1380
tacaaggttg gtcgtgaccg tcttcgtatt ccccctaact tcagctcctg gacccgggat    1440
gagtacggct gggagcattc tgctgtctcc gagggagcct ggaccaaggt gaacgacttc    1500
gtcaatgtgc agcgcagtca ctctcagatc atccgtgaga ttggtgccgc tagtacagtg    1560
ctcttgaaga acacgggtgc tcttcctttg accggcaagg aggttaaagt gggtgttctc    1620
ggtgaagacg ctggttccaa cccgtggggt gctaacggct gccccgaccg cggctgtgat    1680
aacggcactc ttgctatggc ctggggtagt ggtactgcca acttccctta ccttgtcacc    1740
cccgagcagg ctatccagcg agaggtcatc agcaacggcg gcaatgtctt tgctgtgact    1800
gataacgggg ctctcagcca gatggcagat gttgcatctc aatccaggtg agtgcgggct    1860
cttagaaaaa gaacgttctc tgaatgaagt tttttaacca ttgcgaacag cgtgtctttg    1920
gtgtttgtca acgccgactc tggagagggt ttcatcagtg tcgacggcaa cgagggtgac    1980
cgcaaaaatc tcactctgtg gaagaacggc gaggccgtca ttgacactgt tgtcagccac    2040
tgcaacaaca cgattgtggt tattcacagt gttgggcccg tcttgatcga ccggtggtat    2100
gataacccca acgtcactgc catcatctgg gccggcttgc ccggtcagga gagtggcaac    2160
tccctggtcg acgtgctcta tggccgcgtc aaccccagcg ccaagacccc gttcacctgg    2220
ggcaagactc gggagtctta cggggctccc ttgctcaccg agcctaacaa tggcaatggt    2280
gctccccagg atgatttcaa cgagggcgtc ttcattgact accgtcactt tgacaagcgc    2340
aatgagaccc ccatttatga gtttggccat ggcttgagct acaccacctt tggttactct    2400
caccttcggg ttcaggccct caatagttcg agttcggcat atgtcccgac tagcggagag    2460
accaagcctg cgccaaccta tggtgagatc ggtagtgccg ccgactacct gtatcccgag    2520
ggtctcaaaa gaattaccaa gtttatttac ccttggctca actcgaccga cctcgaggat    2580
tcttctgacg acccgaacta cggctgggag gactcggagt acattcccga aggcgctagg    2640
gatgggtctc ctcaacccct cctgaaggct ggcggcgctc ctggtggtaa ccctaccctt    2700
tatcaggatc ttgttagggt gtcggccacc ataaccaaca ctggtaacgt cgccggttat    2760
gaagtccctc aattggtgag tgacccgcat gttccttgcg ttgcaatttg gctaactcgc    2820
ttctagtatg tttcactggg cggaccgaac gagcctcggg tcgttctgcg caagttcgac    2880
cgaatcttcc tggctcctgg ggagcaaaag gtttggacca cgactcttaa ccgtcgtgat    2940
ctcgccaatt gggatgtgga ggctcaggac tgggtcatca caaagtaccc caagaaagtg    3000
cacgtcggca gctcctcgcg taagctgcct ctgagagcgc ctctgccccg tgtctactag    3060
<210>20
<211>863
<212>PRT
<213>烟曲霉(Aspergillus fumigatus)
<400>20
Met Arg Phe Gly Trp Leu Glu Val Ala Ala Leu Thr Ala Ala Ser Val
1               5                   10                  15
Ala Asn Ala Gln Glu Leu Ala Phe Ser Pro Pro Phe Tyr Pro Ser Pro
            20                  25                  30
Trp Ala Asp Gly Gln Gly Glu Trp Ala Asp Ala His Arg Arg Ala Val
        35                  40                  45
Glu Ile Val Ser Gln Met Thr Leu Ala Glu Lys Val Asn Leu Thr Thr
    50                  55                  60
Gly Thr Gly Trp Glu Met Asp Arg Cys Val Gly Gln Thr Gly Ser Val
65                  70                  75                  80
Pro Arg Leu Gly Ile Asn Trp Gly Leu Cys Gly Gln Asp Ser Pro Leu
                85                  90                  95
Gly Ile Arg Phe Ser Asp Leu Asn Ser Ala Phe Pro Ala Gly Thr Asn
            100                 105                 110
Val Ala Ala Thr Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Lys Ala
        115                 120                 125
Met Gly Glu Glu Phe Asn Asp Lys Gly Val Asp Ile Leu Leu Gly Pro
    130                 135                 140
Ala Ala Gly Pro Leu Gly Lys Tyr Pro Asp Gly Gly Arg Ile Trp Glu
145                 150                 155                 160
Gly Phe Ser Pro Asp Pro Val Leu Thr Gly Val Leu Phe Ala Glu Thr
                165                 170                 175
Ile Lys Gly Ile Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr
            180                 185                 190
Ile Leu Asn Glu Gln Glu His Phe Arg Gln Val Gly Glu Ala Gln Gly
        195                 200                 205
Tyr Gly Tyr Asn Ile Thr Glu Thr Ile Ser Ser Asn Val Asp Asp Lys
    210                 215                 220
Thr Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala
225                 230                 235                 240
Gly Val Gly Ala Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr
                245                 250                 255
Gly Cys Gln Asn Ser Gln Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu
            260                 265                 270
Gly Phe Gln Gly Phe Val Met Ser Asp Trp Ser Ala His His Ser Gly
        275                 280                 285
Val Gly Ala Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Ile
    290                 295                 300
Ser Phe Asp Asp Gly Leu Ser Phe Trp Gly Thr Asn Leu Thr Val Ser
305                 310                 315                 320
Val Leu Asn Gly Thr Val Pro Ala Trp Arg Val Asp Asp Met Ala Val
                325                 330                 335
Arg Ile Met Thr Ala Tyr Tyr Lys Val Gly Arg Asp Arg Leu Arg Ile
            340                 345                 350
Pro Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Trp Glu His
        355                 360                 365
Ser Ala Val Ser Glu Gly Ala Trp Thr Lys Val Asn Asp Phe Val Asn
    370                 375                 380
Val Gln Arg Ser His Ser Gln Ile Ile Arg Glu Ile Gly Ala Ala Ser
385                 390                 395                 400
Thr Val Leu Leu Lys Asn Thr Gly Ala Leu Pro Leu Thr Gly Lys Glu
                405                 410                 415
Val Lys Val Gly Val Leu Gly Glu Asp Ala Gly Ser Asn Pro Trp Gly
            420                 425                 430
Ala Asn Gly Cys Pro Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met
        435                 440                 445
Ala Trp Gly Ser Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu
    450                 455                 460
Gln Ala Ile Gln Arg Glu Val Ile Ser Asn Gly Gly Asn Val Phe Ala
465                 470                 475                 480
Val Thr Asp Asn Gly Ala Leu Ser Gln Met Ala Asp Val Ala Ser Gln
                485                 490                 495
Ser Ser Val Ser Leu Val Phe Val Asn Ala Asp Ser Gly Glu Gly Phe
            500                 505                 510
Ile Ser Val Asp Gly Asn Glu Gly Asp Arg Lys Asn Leu Thr Leu Trp
        515                 520                 525
Lys Asn Gly Glu Ala Val Ile Asp Thr Val Val Ser His Cys Asn Asn
    530                 535                 540
Thr Ile Val Val Ile His Ser Val Gly Pro Val Leu Ile Asp Arg Trp
545                 550                 555                 560
Tyr Asp Asn Pro Asn Val Thr Ala Ile Ile Trp Ala Gly Leu Pro Gly
                565                 570                 575
Gln Glu Ser Gly Asn Ser Leu Val Asp Val Leu Tyr Gly Arg Val Asn
            580                 585                 590
Pro Ser Ala Lys Thr Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr
        595                 600                 605
Gly Ala Pro Leu Leu Thr Glu Pro Asn Asn Gly Asn Gly Ala Pro Gln
    610                 615                 620
Asp Asp Phe Asn Glu Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys
625                 630                 635                 640
Arg Asn Glu Thr Pro Ile Tyr Glu Phe Gly His Gly Leu Ser Tyr Thr
                645                 650                 655
Thr Phe Gly Tyr Ser His Leu Arg Val Gln Ala Leu Asn Ser Ser Ser
            660                 665                 670
Ser Ala Tyr Val Pro Thr Ser Gly Glu Thr Lys Pro Ala Pro Thr Tyr
        675                 680                 685
Gly Glu Ile Gly Ser Ala Ala Asp Tyr Leu Tyr Pro Glu Gly Leu Lys
    690                 695                 700
Arg Ile Thr Lys Phe Ile Tyr Pro Trp Leu Asn Ser Thr Asp Leu Glu
705                 710                 715                 720
Asp Ser Ser Asp Asp Pro Asn Tyr Gly Trp Glu Asp Ser Glu Tyr Ile
                725                 730                 735
Pro Glu Gly Ala Arg Asp Gly Ser Pro Gln Pro Leu Leu Lys Ala Gly
            740                 745                 750
Gly Ala Pro Gly Gly Asn Pro Thr Leu Tyr Gln Asp Leu Val Arg Val
        755                 760                 765
Ser Ala Thr Ile Thr Asn Thr Gly Asn Val Ala Gly Tyr Glu Val Pro
    770                 775                 780
Gln Leu Tyr Val Ser Leu Gly Gly Pro Asn Glu Pro Arg Val Val Leu
785                 790                 795                 800
Arg Lys Phe Asp Arg Ile Phe Leu Ala Pro Gly Glu Gln Lys Val Trp
                805                 810                 815
Thr Thr Thr Leu Asn Arg Arg Asp Leu Ala AsnTrp Asp Val Glu Ala
            820                 825                 830
Gln Asp Trp Val Ile Thr Lys Tyr Pro Lys Lys Val His Val Gly Ser
        835                 840                 845
Ser Ser Arg Lys Leu Pro Leu Arg Ala Pro Leu Pro Arg Val Tyr
    850                 855                 860
<210>21
<211>2800
<212>DNA
<213>巴西青霉(Penicillium brasilianum)
<400>21
tgaaaatgca gggttctaca atctttctgg ctttcgcctc atgggcgagc caggttgctg    60
ccattgcgca gcccatacag aagcacgagg tttgttttat cttgctcatg gacgtgcttt    120
gacttgacta attgttttac atacagcccg gatttctgca cgggccccaa gccatagaat    180
cgttctcaga accgttctac ccgtcgccct ggatgaatcc tcacgccgag ggctgggagg    240
ccgcatatca gaaagctcaa gattttgtct cgcaactcac tatcttggag aaaataaatc    300
tgaccaccgg tgttgggtaa gtctctccga ctgcttctgg gtcacggtgc gacgagccac    360
tgactttttg aagctgggaa aatgggccgt gtgtaggaaa cactggatca attcctcgtc    420
tcggattcaa aggattttgt acccaggatt caccacaggg tgttcggttc gcagattatt    480
cctccgcttt cacatctagc caaatggccg ccgcaacatt tgaccgctca attctttatc    540
aacgaggcca agccatggca caggaacaca aggctaaggg tatcacaatt caattgggcc    600
ctgttgccgg ccctctcggt cgcatccccg agggcggccg caactgggaa ggattctccc    660
ctgatcctgt cttgactggt atagccatgg ctgagacaat taagggcatg caggatactg    720
gagtgattgc ttgcgctaaa cattatattg gaaacgagca ggagcacttc cgtcaagtgg    780
gtgaagctgc gggtcacgga tacactattt ccgatactat ttcatctaat attgacgacc    840
gtgctatgca tgagctatac ttgtggccat ttgctgatgc cgttcgcgct ggtgtgggtt    900
ctttcatgtg ctcatactct cagatcaaca actcctacgg atgccaaaac agtcagaccc    960
tcaacaagct cctcaagagc gaattgggct tccaaggctt tgtcatgagc gattggggtg    1020
cccatcactc tggagtgtca tcggcgctag ctggacttga tatgagcatg ccgggtgata    1080
ccgaatttga ttctggcttg agcttctggg gctctaacct caccattgca attctgaacg    1140
gcacggttcc cgaatggcgc ctggatgaca tggcgatgcg aattatggct gcatacttca    1200
aagttggcct tactattgag gatcaaccag atgtcaactt caatgcctgg acccatgaca    1260
cctacggata taaatacgct tatagcaagg aagattacga gcaggtcaac tggcatgtcg    1320
atgttcgcag cgaccacaat aagctcattc gcgagactgc cgcgaagggt acagttctgc    1380
tgaagaacaa ctttcatgct ctccctctga agcagcccag gttcgtggcc gtcgttggtc    1440
aggatgccgg gccaaacccc aagggcccta acggctgcgc agaccgagga tgcgaccaag    1500
gcactctcgc aatgggatgg ggctcagggt ctaccgaatt cccttacctg gtcactcctg    1560
acactgctat tcagtcaaag gtcctcgaat acgggggtcg atacgagagt atttttgata    1620
actatgacga caatgctatc ttgtcgcttg tctcacagcc tgatgcaacc tgtatcgttt    1680
ttgcaaatgc cgattccggt gaaggctaca tcactgtcga caacaactgg ggtgaccgca    1740
acaatctgac cctctggcaa aatgccgatc aagtgattag cactgtcagc tcgcgatgca    1800
acaacacaat cgttgttctc cactctgtcg gaccagtgtt gctaaatggt atatatgagc    1860
acccgaacat cacagctatt gtctgggcag ggatgccagg cgaagaatct ggcaatgctc    1920
tcgtggatat tctttggggc aatgttaacc ctgccggtcg cactccgttc acctgggcca    1980
aaagtcgaga ggactatggc actgatataa tgtacgagcc caacaacggc cagcgtgcgc    2040
ctcagcagga tttcaccgag agcatctacc tcgactaccg ccatttcgac aaagctggta    2100
tcgagccaat ttacgagttt ggattcggcc tctcctatac caccttcgaa tactctgacc    2160
tccgtgttgt gaagaagtat gttcaaccat acagtcccac gaccggcacc ggtgctcaag    2220
caccttccat cggacagcca cctagccaga acctggatac etacaagttc cctgctacat    2280
acaagtacat caaaaccttc atttatccct acctgaacag cactgtctcc ctccgcgctg    2340
cttccaagga tcccgaatac ggtcgtacag actttatccc accccacgcg cgtgatggct    2400
cccctcaacc tctcaacccc gctggagacc cagtggccag tggtggaaac aacatgctct    2460
acgacgaact ttacgaggtc actgcacaga tcaaaaacac tggcgacgtg gccggcgacg    2520
aagtcgtcca gctttacgta gatctcgggg gtgacaaccc gcctcgtcag ttgagaaact    2580
ttgacaggtt ttatctgctg cccggtcaga gctcaacatt ccgggctaca ttgacgcgcc    2640
gtgatttgag caactgggat attgaggcgc agaactggcg agttacggaa tcgcctaaga    2700
gagtgtatgt tggacggtcg agtcgggatt tgccgctgag ctcacaattg gagtaatgat    2760
catgtctacc aatagatgtt gaatgtctgg tgtggatatt                          2800
<210>22
<211>878
<212>PRT
<213>巴西青霉(Penicillium brasilianum)
<400>22
Met Gln Gly Ser Thr Ile Phe Leu Ala Phe Ala Ser Trp Ala Ser Gln
1               5                   10                  15
Val Ala Ala Ile Ala Gln Pro Ile Gln Lys His Glu Pro Gly Phe Leu
            20                  25                  30
His Gly Pro Gln Ala Ile Glu Ser Phe Ser Glu Pro Phe Tyr Pro Ser
        35                  40                  45
Pro Trp Met Asn Pro His Ala Glu Gly Trp Glu Ala Ala Tyr Gln Lys
    50                  55                  60
Ala Gln Asp Phe Val Ser Gln Leu Thr Ile Leu Glu Lys Ile Asn Leu
65                  70                  75                  80
Thr Thr Gly Val Gly Trp Glu Asn Gly Pro Cys Val Gly Asn Thr Gly
                85                  90                  95
Ser Ile Pro Arg Leu Gly Phe Lys Gly Phe Cys Thr Gln Asp Ser Pro
            100                 105                 110
Gln Gly Val Arg Phe Ala Asp Tyr Ser Ser Ala Phe Thr Ser Ser Gln
        115                 120                 125
Met Ala Ala Ala Thr Phe Asp Arg Ser Ile Leu Tyr Gln Arg Gly Gln
    130                 135                 140
Ala Met Ala Gln Glu His Lys Ala Lys Gly Ile Thr Ile Gln Leu Gly
145                 150                 155                 160
Pro Val Ala Gly Pro Leu Gly Arg Ile Pro Glu Gly Gly Arg Asn Trp
                165                 170                 175
Glu Gly Phe Ser Pro Asp Pro Val Leu Thr Gly Ile Ala Met Ala Glu
            180                 185                 190
Thr Ile Lys Gly Met Gln Asp Thr Gly Val Ile Ala Cys Ala Lys His
        195                 200                 205
Tyr Ile Gly Asn Glu Gln Glu His Phe Arg Gln Val Gly Glu Ala Ala
    210                 215                 220
Gly His Gly Tyr Thr Ile Ser Asp Thr Ile Ser Ser Asn Ile Asp Asp
225                 230                 235                 240
Arg Ala Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg
                245                 250                 255
Ala Gly Val Gly Ser Phe Met Cys Ser Tyr Ser Gln Ile Asn Asn Ser
            260                 265                 270
Tyr Gly Cys Gln Asn Ser Gln Thr Leu Asn Lys Leu Leu Lys Ser Glu
        275                 280                 285
Leu Gly Phe Gln Gly Phe Val Met Ser Asp Trp Gly Ala His His Ser
    290                 295                 300
Gly Val Ser Ser Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp
305                 310                 315                 320
Thr Glu Phe Asp Ser Gly Leu Ser Phe Trp Gly Ser Asn Leu Thr Ile
                325                 330                 335
Ala Ile Leu Asn Gly Thr Val Pro Glu Trp Arg Leu Asp Asp Met Ala
            340                 345                 350
Met Arg Ile Met Ala Ala Tyr Phe Lys Val Gly Leu Thr Ile Glu Asp
        355                 360                 365
Gln Pro Asp Val Asn Phe Asn Ala Trp Thr His Asp Thr Tyr Gly Tyr
    370                 375                 380
Lys Tyr Ala Tyr Ser Lys Glu Asp Tyr Glu Gln Val Asn Trp His Val
385                 390                 395                 400
Asp Val Arg Ser Asp His Asn Lys Leu Ile Arg Glu Thr Ala Ala Lys
                405                 410                 415
Gly Thr Val Leu Leu Lys Asn Asn Phe His Ala Leu Pro Leu Lys Gln
            420                 425                 430
Pro Arg Phe Val Ala Val Val Gly Gln Asp Ala Gly Pro Asn Pro Lys
        435                 440                 445
Gly Pro Asn Gly Cys Ala Asp Arg Gly Cys Asp Gln Gly Thr Leu Ala
    450                 455                 460
Met Gly Trp Gly Ser Gly Ser Thr Glu Phe Pro Tyr Leu Val Thr Pro
465                 470                 475                 480
Asp Thr Ala Ile Gln Ser Lys Val Leu Glu Tyr Gly Gly Arg Tyr Glu
                485                 490                 495
Ser Ile Phe Asp Asn Tyr Asp Asp Asn Ala Ile Leu Ser Leu Val Ser
            500                 505                 510
Gln Pro Asp Ala Thr Cys Ile Val Phe Ala Asn Ala Asp Ser Gly Glu
        515                 520                 525
Gly Tyr Ile Thr Val Asp Asn Asn Trp Gly Asp Arg Asn Asn Leu Thr
    530                 535                 540
Leu Trp Gln Asn Ala Asp Gln Val Ile Ser Thr Val Ser Ser Arg Cys
545                 550                 555                 560
Asn Asn Thr Ile Val Val Leu His Ser Val Gly Pro Val Leu Leu Asn
                565                 570                 575
Gly Ile Tyr Glu His Pro Asn Ile Thr Ala Ile Val Trp Ala Gly Met
            580                 585                 590
Pro Gly Glu Glu Ser Gly Asn Ala Leu Val Asp Ile Leu Trp Gly Asn
        595                 600                 605
Val Asn Pro Ala Gly Arg Thr Pro Phe Thr Trp Ala Lys Ser Arg Glu
    610                 615                 620
Asp Tyr Gly Thr Asp Ile Met Tyr Glu Pro Asn Asn Gly Gln Arg Ala
625                 630                 635                 640
Pro Gln Gln Asp Phe Thr Glu Ser Ile Tyr Leu Asp Tyr Arg His Phe
                645                 650                 655
Asp Lys Ala Gly Ile Glu Pro Ile Tyr Glu Phe Gly Phe Gly Leu Ser
            660                 665                 670
Tyr Thr Thr Phe Glu Tyr Ser Asp Leu Arg Val Val Lys Lys Tyr Val
        675                 680                 685
Gln Pro Tyr Ser Pro Thr Thr Gly Thr Gly Ala Gln Ala Pro Ser Ile
    690                 695                 700
Gly Gln Pro Pro Ser Gln Asn Leu Asp Thr Tyr Lys Phe Pro Ala Thr
705                 710                 715                 720
Tyr Lys Tyr Ile Lys Thr Phe Ile Tyr Pro Tyr Leu Asn Ser Thr Val
                725                 730                 735
Ser Leu Arg Ala Ala Ser Lys Asp Pro Glu Tyr Gly Arg Thr Asp Phe
            740                 745                 750
Ile Pro Pro His Ala Arg Asp Gly Ser Pro Gln Pro Leu Asn Pro Ala
        755                 760                 765
Gly Asp Pro Val Ala Ser Gly Gly Asn Asn Met Leu Tyr Asp Glu Leu
    770                 775                 780
Tyr Glu Val Thr Ala Gln Ile Lys Asn Thr Gly Asp Val Ala Gly Asp
785                 790                 795                 800
Glu Val Val Gln Leu Tyr Val Asp Leu Gly Gly Asp Asn Pro Pro Arg
                805                 810                 815
Gln Leu Arg Asn Phe Asp Arg Phe Tyr Leu Leu Pro Gly Gln Ser Ser
            820                 825                 830
Thr Phe Arg Ala Thr Leu Thr Arg Arg Asp Leu Ser Asn Trp Asp Ile
        835                 840                 845
Glu Ala Gln Asn Trp Arg Val Thr Glu Ser Pro Lys Arg Val Tyr Val
    850                 855                 860
Gly Arg Ser Ser Arg Asp Leu Pro Leu Ser Ser Gln Leu Glu
865                 870                 875
<210>23
<211>2235
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>23
atgcgttacc gaacagcagc tgcgctggca cttgccactg ggccctttgc tagggcagac    60
agtcactcaa catcgggggc ctcggctgag gcagttgtac ctcctgcagg gactccatgg    120
ggaaccgcgt acgacaaggc gaaggccgca ttggcaaagc tcaatctcca agataaggtc    180
ggcatcgtga gcggtgtcgg ctggaacggc ggtccttgcg ttggaaacac atctccggcc    240
tccaagatca gctatccatc gctatgcctt caagacggac ccctcggtgt tcgatactcg    300
acaggcagca cagcctttac gccgggcgtt caagcggcct cgacgtggga tgtcaatttg    360
atccgcgaac gtggacagtt catcggtgag gaggtgaagg cctcggggat tcatgtcata    420
cttggtcctg tggctgggcc gctgggaaag actccgcagg gcggtcgcaa ctgggagggc    480
ttcggtgtcg atccatatct cacgggcatt gccatgggtc aaaccatcaa cggcatccag    540
tcggtaggcg tgcaggcgac agcgaagcac tatatcctca acgagcagga gctcaatcga    600
gaaaccattt cgagcaaccc agatgaccga actctccatg agctgtatac ttggccattt    660
gccgacgcgg ttcaggccaa tgtcgcttct gtcatgtgct cgtacaacaa ggtcaatacc    720
acctgggcct gcgaggatca gtacacgctg cagactgtgc tgaaagacca gctggggttc    780
ccaggctatg tcatgacgga ctggaacgca cagcacacga ctgtccaaag cgcgaattct    840
gggcttgaca tgtcaatgcc tggcacagac ttcaacggta acaatcggct ctggggtcca    900
gctctcacca atgcggtaaa tagcaatcag gtccccacga gcagagtcga cgatatggtg    960
actcgtatcc tcgccgcatg gtacttgaca ggccaggacc aggcaggcta tccgtcgttc    1020
aacatcagca gaaatgttca aggaaaccac aagaccaatg tcagggcaat tgccagggac    1080
ggcatcgttc tgctcaagaa tgacgccaac atcctgccgc tcaagaagcc cgctagcatt    1140
gccgtcgttg gatctgccgc aatcattggt aaccacgcca gaaactcgcc ctcgtgcaac    1200
gacaaaggct gcgacgacgg ggccttgggc atgggttggg gttccggcgc cgtcaactat    1260
ccgtacttcg tcgcgcccta cgatgccatc aataccagag cgtcttcgca gggcacccag    1320
gttaccttga gcaacaccga caacacgtcc tcaggcgcat ctgcagcaag aggaaaggac    1380
gtcgccatcg tcttcatcac cgccgactcg ggtgaaggct acatcaccgt ggagggcaac    1440
gcgggcgatc gcaacaacct ggatccgtgg cacaacggca atgccctggt ccaggcggtg    1500
gccggtgcca acagcaacgt cattgttgtt gtccactccg ttggcgccat cattctggag    1560
cagattcttg ctcttccgca ggtcaaggcc gttgtctggg cgggtcttcc ttctcaggag    1620
agcggcaatg cgctcgtcga cgtgctgtgg ggagatgtca gcccttctgg caagctggtg    1680
tacaccattg cgaagagccc caatgactat aacactcgca tcgtttccgg cggcagtgac    1740
agcttcagcg agggactgtt catcgactat aagcacttcg acgacgccaa tatcacgccg    1800
cggtacgagt tcggctatgg actgtcttac accaagttca actactcacg cctctccgtc    1860
ttgtcgaccg ccaagtctgg tcctgcgact ggggccgttg tgccgggagg cccgagtgat    1920
ctgttccaga atgtcgcgac agtcaccgtt gacatcgcaa actctggcca agtgactggt    1980
gccgaggtag cccagctgta catcacctac ccatcttcag cacccaggac ccctccgaag    2040
cagctgcgag gctttgccaa gctgaacctc acgcctggtc agagcggaac agcaacgttc    2100
aacatccgac gacgagatct cagctactgg gacacggctt cgcagaaatg ggtggtgccg    2160
tcggggtcgt ttggcatcag cgtgggagcg agcagccggg atatcaggct gacgagcact    2220
ctgtcggtag cgtag                                                     2235
<210>24
<211>744
<212>PRT
<213>里氏木霉(Trichoderma reesei)
<400>24
Met Arg Tyr Arg Thr Ala Ala Ala Leu Ala Leu Ala Thr Gly Pro Phe
1               5                   10                  15
Ala Arg Ala Asp Ser His Ser Thr Ser Gly Ala Ser Ala Glu Ala Val
            20                  25                  30
Val Pro Pro Ala Gly Thr Pro Trp Gly Thr Ala Tyr Asp Lys Ala Lys
        35                  40                  45
Ala Ala Leu Ala Lys Leu Asn Leu Gln Asp Lys Val Gly Ile Val Ser
    50                  55                  60
Gly Val Gly Trp Asn Gly Gly Pro Cys Val Gly Asn Thr Ser Pro Ala
65                  70                  75                  80
Ser Lys Ile Ser Tyr Pro Ser Leu Cys Leu Gln Asp Gly Pro Leu Gly
                85                  90                  95
Val Arg Tyr Ser Thr Gly Ser Thr Ala Phe Thr Pro Gly Val Gln Ala
            100                 105                 110
Ala Ser Thr Trp Asp Val Asn Leu Ile Arg Glu Arg Gly Gln Phe Ile
        115                 120                 125
Gly Glu Glu Val Lys Ala Ser Gly Ile His Val Ile Leu Gly Pro Val
    130                 135                 140
Ala Gly Pro Leu Gly Lys Thr Pro Gln Gly Gly Arg Asn Trp Glu Gly
145                 150                 155                 160
Phe Gly Val Asp Pro Tyr Leu Thr Gly Ile Ala Met Gly Gln Thr Ile
                165                 170                 175
Asn Gly Ile Gln Ser Val Gly Val Gln Ala Thr Ala Lys His Tyr Ile
            180                 185                 190
Leu Asn Glu Gln Glu Leu Asn Arg Glu Thr Ile Ser Ser Asn Pro Asp
        195                 200                 205
Asp Arg Thr Leu His Glu Leu Tyr Thr Trp Pro Phe Ala Asp Ala Val
    210                 215                 220
Gln Ala Asn Val Ala Ser Val Met Cys Ser Tyr Asn Lys Val Asn Thr
225                 230                 235                 240
Thr Trp Ala Cys Glu Asp Gln Tyr Thr Leu Gln Thr Val Leu Lys Asp
                245                 250                 255
Gln Leu Gly Phe Pro Gly Tyr Val Met Thr Asp Trp Asn Ala Gln His
            260                 265                 270
Thr Thr Val Gln Ser Ala Asn Ser Gly Leu Asp Met Ser Met Pro Gly
         275                 280                 285
Thr Asp Phe Asn Gly Asn Asn Arg Leu Trp Gly Pro Ala Leu Thr Asn
    290                 295                 300
Ala Val Asn Ser Asn Gln Val Pro Thr Ser Arg Val Asp Asp Met Val
305                 310                 315                 320
Thr Arg Ile Leu Ala Ala Trp Tyr Leu Thr Gly Gln Asp Gln Ala Gly
                325                 330                 335
Tyr Pro Ser Phe Asn Ile Ser Arg Asn Val Gln Gly Asn His Lys Thr
            340                 345                 350
Asn Val Arg Ala Ile Ala Arg Asp Gly Ile Val Leu Leu Lys Asn Asp
        355                 360                 365
Ala Asn Ile Leu Pro Leu Lys Lys Pro Ala Ser Ile Ala Val Val Gly
    370                 375                 380
Ser Ala Ala Ile Ile Gly Asn His Ala Arg Asn Ser Pro Ser Cys Asn
385                 390                 395                 400
Asp Lys Gly Cys Asp Asp Gly Ala Leu Gly Met Gly Trp Gly Ser Gly
                405                 410                 415
Ala Val Asn Tyr Pro Tyr Phe Val Ala Pro Tyr Asp Ala Ile Asn Thr
            420                 425                 430
Arg Ala Ser Ser Gln Gly Thr Gln Val Thr Leu Ser Asn Thr Asp Asn
        435                 440                 445
Thr Ser Ser Gly Ala Ser Ala Ala Arg Gly Lys Asp Val Ala Ile Val
    450                 455                 460
Phe Ile Thr Ala Asp Ser Gly Glu Gly Tyr Ile Thr Val Glu Gly Asn
465                 470                 475                 480
Ala Gly Asp Arg Asn Asn Leu Asp Pro Trp His Asn Gly Asn Ala Leu
                485                 490                 495
Val Gln Ala Val Ala Gly Ala Asn Ser Asn Val Ile Val Val Val His
            500                 505                 510
Ser Val Gly Ala Ile Ile Leu Glu Gln Ile Leu Ala Leu Pro Gln Val
        515                 520                 525
Lys Ala Val Val Trp Ala Gly Leu Pro Ser Gln Glu Ser Gly Asn Ala
    530                 535                 540
Leu Val Asp Val Leu Trp Gly Asp Val Ser Pro Ser Gly Lys Leu Val
545                 550                 555                 560
Tyr Thr Ile Ala Lys Ser Pro Asn Asp Tyr Asn Thr Arg Ile Val Ser
                565                 570                 575
Gly Gly Ser Asp Ser Phe Ser Glu Gly Leu Phe Ile Asp Tyr Lys His
            580                 585                 590
Phe Asp Asp Ala Asn Ile Thr Pro Arg Tyr Glu Phe Gly Tyr Gly Leu
        595                 600                 605
Ser Tyr Thr Lys Phe Asn Tyr Ser Arg Leu Ser Val Leu Ser Thr Ala
    610                 615                 620
Lys Ser Gly Pro Ala Thr Gly Ala Val Val Pro Gly Gly Pro Ser Asp
625                 630                 635                 640
Leu Phe Gln Asn Val Ala Thr Val Thr Val Asp Ile Ala Asn Ser Gly
                645                 650                 655
Gln Val Thr Gly Ala Glu Val Ala Gln Leu Tyr Ile Thr Tyr Pro Ser
            660                 665                 670
Ser Ala Pro Arg Thr Pro Pro Lys Gln Leu Arg Gly Phe Ala Lys Leu
        675                 680                 685
Asn Leu Thr Pro Gly Gln Ser Gly Thr Ala Thr Phe Asn Ile Arg Arg
    690                 695                 700
Arg Asp Leu Ser Tyr Trp Asp Thr Ala Ser Gln Lys Trp Val Val Pro
705                 710                 715                 720
Ser Gly Ser Phe Gly Ile Ser Val Gly Ala Ser Ser Arg Asp Ile Arg
                725                 730                 735
Leu Thr Ser Thr Leu Ser Val Ala
            740
<210>25
<211>2583
<212>DNA
<213>黑曲霉(Aspergillus niger)
<400>25
atgaggttca ctttgatcga ggcggtggct ctgactgccg tctcgctggc cagcgctgat    60
gaattggcct actccccacc gtattaccca tccccttggg ccaatggcca gggcgactgg    120
gcgcaggcat accagcgcgc tgttgatatt gtctcgcaaa tgacattgga tgagaaggtc    180
aatctgacca caggaactgg atgggaattg gaactatgtg ttggtcagac tggcggtgtt    240
ccccgattgg gagttccggg aatgtgttta caggatagcc ctctgggcgt tcgcgactcc    300
gactacaact ctgctttccc tgccggcatg aacgtggctg caacctggga caagaatctg    360
gcataccttc gcggcaaggc tatgggtcag gaatttagtg acaagggtgc cgatatccaa    420
ttgggtccag ctgccggccc tctcggtaga agtcccgacg gtggtcgtaa ctgggagggc    480
ttctccccag accctgccct aagtggtgtg ctctttgccg agaccatcaa gggtatccaa    540
gatgctggtg tggttgcgac ggctaagcac tacattgctt acgagcaaga gcatttccgt    600
caggcgcctg aagcccaagg ttttggattt aatatttccg agagtggaag tgcgaacctc    660
gatgataaga ctatgcacga gctgtacctc tggcccttcg cggatgccat ccgtgcaggt    720
gctggcgctg tgatgtgctc ctacaaccag atcaacaaca gttatggctg ccagaacagc    780
tacactctga acaagctgct caaggccgag ctgggcttcc agggctttgt catgagtgat    840
tgggctgctc accatgctgg tgtgagtggt gctttggcag gattggatat gtctatgcca    900
ggagacgtcg actacgacag tggtacgtct tactggggta caaacttgac cattagcgtg    960
ctcaacggaa cggtgcccca atggcgtgtt gatgacatgg ctgtccgcat catggccgcc    1020
tactacaagg tcggccgtga ccgtctgtgg actcctccca acttcagctc atggaccaga    1080
gatgaatacg gctacaagta ctactacgtg tcggagggac cgtacgagaa ggtcaaccag    1140
tacgtgaatg tgcaacgcaa ccacagcgaa ctgattcgcc gcattggagc ggacagcacg    1200
gtgctcctca agaacgacgg cgctctgcct ttgactggta aggagcgcct ggtcgcgctt    1260
atcggagaag atgcgggctc caacccttat ggtgccaacg gctgcagtga ccgtggatgc    1320
gacaatggaa cattggcgat gggctgggga agtggtactg ccaacttccc atacctggtg    1380
acccccgagc aggccatctc aaacgaggtg cttaagcaca agaatggtgt attcaccgcc    1440
accgataact gggctatcga tcagattgag gcgcttgcta agaccgccag tgtctctctt    1500
gtctttgtca acgccgactc tggtgagggt tacatcaatg tggacggaaa cctgggtgac    1560
cgcaggaacc tgaccctgtg gaggaacggc gataatgtga tcaaggctgc tgctagcaac    1620
tgcaacaaca caatcgttgt cattcactct gtcggaccag tcttggttaa cgagtggtac    1680
gacaacccca atgttaccgc tatcctctgg ggtggtttgc ccggtcagga gtctggcaac    1740
tctcttgccg acgtcctcta tggccgtgtc aaccccggtg ccaagtcgcc ctttacctgg    1800
ggcaagactc gtgaggccta ccaagactac ttggtcaccg agcccaacaa cggcaacgga    1860
gcccctcagg aagactttgt cgagggcgtc ttcattgact accgtggatt tgacaagcgc    1920
aacgagaccc cgatctacga gttcggctat ggtctgagct acaccacttt caactactcg    1980
aaccttgagg tgcaggtgct gagcgcccct gcatacgagc ctgcttcggg tgagaccgag    2040
gcagcgccaa ccttcggaga ggttggaaat gcgtcggatt acctctaccc cagcggattg    2100
cagagaatta ccaagttcat ctacccctgg ctcaacggta ccgatctcga ggcatcttcc    2160
ggggatgcta gctacgggca ggactcctcc gactatcttc ccgagggagc caccgatggc    2220
tctgcgcaac cgatcctgcc tgccggtggc ggtcctggcg gcaaccctcg cctgtacgac    2280
gagctcatcc gcgtgtcagt gaccatcaag aacaccggca aggttgctgg tgatgaagtt    2340
ccccaactgt atgtttccct tggcggtccc aatgagccca agatcgtgct gcgtcaattc    2400
gagcgcatca cgctgcagcc gtcggaggag acgaagtgga gcacgactct gacgcgccgt    2460
gaccttgcaa actggaatgt tgagaagcag gactgggaga ttacgtcgta tcccaagatg    2520
gtgtttgtcg gaagctcctc gcggaagctg ccgctccggg cgtctctgcc tactgttcac    2580
taa                                                                  2583
<210>26
<211>860
<212>PRT
<213>黑曲霉(Aspergillus niger)
<400>26
Met Arg Phe Thr Leu Ile Glu Ala Val Ala Leu Thr Ala Val Ser Leu
1               5                   10                  15
Ala Ser Ala Asp Glu Leu Ala Tyr Ser Pro Pro Tyr Tyr Pro Ser Pro
            20                  25                  30
Trp Ala Asn Gly Gln Gly Asp Trp Ala Gln Ala Tyr Gln Arg Ala Val
        35                  40                  45
Asp Ile Val Ser Gln Met Thr Leu Asp Glu Lys Val Asn Leu Thr Thr
    50                  55                  60
Gly Thr Gly Trp Glu Leu Glu Leu Cys Val Gly Gln Thr Gly Gly Val
65                  70                  75                  80
Pro Arg Leu Gly Val Pro Gly Met Cys Leu Gln Asp Ser Pro Leu Gly
                85                  90                  95
Val Arg Asp Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Met Asn Val
            100                 105                 110
Ala Ala Thr Trp Asp Lys Asn Leu Ala Tyr Leu Arg Gly Lys Ala Met
        115                 120                 125
Gly Gln Glu Phe Ser Asp Lys Gly Ala Asp Ile Gln Leu Gly Pro Ala
    130                 135                 140
Ala Gly Pro Leu Gly Arg Ser Pro Asp Gly Gly Arg Asn Trp Glu Gly
145                 150                 155                 160
Phe Ser Pro Asp Pro Ala Leu Ser Gly Val Leu Phe Ala Glu Thr Ile
                165                 170                 175
Lys Gly Ile Gln Asp Ala Gly Val Val Ala Thr Ala Lys His Tyr Ile
            180                 185                 190
Ala Tyr Glu Gln Glu His Phe Arg Gln Ala Pro Glu Ala Gln Gly Phe
        195                 200                 205
Gly Phe Asn Ile Ser Glu Ser Gly Ser Ala Asn Leu Asp Asp Lys Thr
    210                 215                 220
Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Ile Arg Ala Gly
225                 230                 235                 240
Ala Gly Ala Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr Gly
                245                 250                 255
Cys Gln Asn Ser Tyr Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu Gly
            260                 265                 270
Phe Gln Gly Phe Val Met Ser Asp Trp Ala Ala His His Ala Gly Val
        275                 280                 285
Ser Gly Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Val Asp
    290                 295                 300
Tyr Asp Ser Gly Thr Ser Tyr Trp Gly Thr Asn Leu Thr Ile Ser Val
305                 310                 315                 320
Leu Asn Gly Thr Val Pro Gln Trp Arg Val Asp Asp Met Ala Val Arg
                325                 330                 335
Ile Met Ala Ala Tyr Tyr Lys Val Gly Arg Asp Arg Leu Trp Thr Pro
            340                 345                 350
Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Tyr Lys Tyr Tyr
        355                 360                 365
Tyr Val Ser Glu Gly Pro Tyr Glu Lys Val Asn Gln Tyr Val Asn Val
    370                 375                 380
Gln Arg Asn His Ser Glu Leu Ile Arg Arg Ile Gly Ala Asp Ser Thr
385                 390                 395                 400
Val Leu Leu Lys Asn Asp Gly Ala Leu Pro Leu Thr Gly Lys Glu Arg
                405                 410                 415
Leu Val Ala Leu Ile Gly Glu Asp Ala Gly Ser Asn Pro Tyr Gly Ala
            420                 425                 430
Asn Gly Cys Ser Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met Gly
        435                 440                 445
Trp Gly Ser Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu Gln
    450                 455                 460
Ala Ile Ser Asn Glu Val Leu Lys His Lys Asn Gly Val Phe Thr Ala
465                 470                 475                 480
Thr Asp Asn Trp Ala Ile Asp Gln Ile Glu Ala Leu Ala Lys Thr Ala
                485                 490                 495
Ser Val Ser Leu Val Phe Val Asn Ala Asp Ser Gly Glu Gly Tyr Ile
            500                 505                 510
Asn Val Asp Gly Asn Leu Gly Asp Arg Arg Asn Leu Thr Leu Trp Arg
        515                 520                 525
Asn Gly Asp Asn Val Ile Lys Ala Ala Ala Ser Asn Cys Asn Asn Thr
    530                 535                 540
Ile Val Val Ile His Ser Val Gly Pro Val Leu Val Asn Glu Trp Tyr
545                 550                 555                 560
Asp Asn Pro Asn Val Thr Ala Ile Leu Trp Gly Gly Leu Pro Gly Gln
                565                 570                 575
Glu Ser Gly Asn Ser Leu Ala Asp Val Leu Tyr Gly Arg Val Asn Pro
            580                 585                 590
Gly Ala Lys Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ala Tyr Gln
        595                 600                 605
Asp Tyr Leu Val Thr Glu Pro Asn Asn Gly Asn Gly Ala Pro Gln Glu
    610                 615                 620
Asp Phe Val Glu Gly Val Phe Ile Asp Tyr Arg Gly Phe Asp Lys Arg
625                 630                 635                 640
Asn Glu Thr Pro Ile Tyr Glu Phe Gly Tyr Gly Leu Ser Tyr Thr Thr
                645                 650                 655
Phe Asn Tyr Ser Asn Leu Glu Val Gln Val Leu Ser Ala Pro Ala Tyr
            660                 665                 670
Glu Pro Ala Ser Gly Glu Thr Glu Ala Ala Pro Thr Phe Gly Glu Val
        675                 680                 685
Gly Asn Ala Ser Asp Tyr Leu Tyr Pro Ser Gly Leu Gln Arg Ile Thr
    690                 695                 700
Lys Phe Ile Tyr Pro Trp Leu Asn Gly Thr Asp Leu Glu Ala Ser Ser
705                 710                 715                 720
Gly Asp Ala Ser Tyr Gly Gln Asp Ser Ser Asp Tyr Leu Pro Glu Gly
                725                 730                 735
Ala Thr Asp Gly Ser Ala Gln Pro Ile Leu Pro Ala Gly Gly Gly Pro
            740                 745                 750
Gly Gly Asn Pro Arg Leu Tyr Asp Glu Leu Ile Arg Val Ser Val Thr
        755                 760                 765
Ile Lys Asn Thr Gly Lys Val Ala Gly Asp Glu Val Pro Gln Leu Tyr
    770                 775                 780
Val Ser Leu Gly Gly Pro Asn Glu Pro Lys Ile Val Leu Arg Gln Phe
785                 790                 795                 800
Glu Arg Ile Thr Leu Gln Pro Ser Glu Glu Thr Lys Trp Ser Thr Thr
                805                 810                 815
Leu Thr Arg Arg Asp Leu Ala Asn Trp Asn Val Glu Lys Gln Asp Trp
            820                 825                 830
Glu Ile Thr Ser Tyr Pro Lys Met Val Phe Val Gly Ser Ser Ser Arg
        835                 840                 845
Lys Leu Pro Leu Arg Ala Ser Leu Pro Thr Val His
    850                 855                 860
<210>27
<211>2583
<212>DNA
<213>棘孢曲霉(Aspergillus aculeatus)
<400>27
atgaagctca gttggcttga ggcggctgcc ttgacggctg cttcagtcgt cagcgctgat     60
gaactggcgt tctctcctcc tttctacccc tctccgtggg ccaatggcca gggagagtgg    120
gcggaagcct accagcgtgc agtggccatt gtatcccaga tgactctgga tgagaaggtc    180
aacctgacca ccggaactgg atgggagctg gagaagtgcg tcggtcagac tggtggtgtc    240
ccaagactga acatcggtgg catgtgtctt caggacagtc ccttgggaat tcgtgatagt    300
gactacaatt cggctttccc tgctggtgtc aacgttgctg cgacatggga caagaacctt    360
gcttatctac gtggtcaggc tatgggtcaa gagttcagtg acaaaggaat tgatgttcaa    420
ttgggaccgg ccgcgggtcc cctcggcagg agccctgatg gaggtcgcaa ctgggaaggt    480
ttctctccag acccggctct tactggtgtg ctctttgcgg agacgattaa gggtattcaa    540
gacgctggtg tcgtggcgac agccaagcat tacattctca atgagcaaga gcatttccgc    600
caggtcgcag aggctgcggg ctacggattc aatatctccg acacgatcag ctctaacgtt    660
gatgacaaga ccattcatga aatgtacctc tggcccttcg cggatgccgt tcgcgecggc    720
gttggcgcca tcatgtgttc ctacaaccag atcaacaaca gctacggttg ccagaacagt    780
tacactctga acaagcttct gaaggccgag ctcggcttcc agggctttgt gatgtctgac    840
tggggtgctc accacagtgg tgttggctct gctttggccg gcttggatat gtcaatgcct    900
ggcgatatca ccttcgattc tgccactagt ttctggggta ccaacctgac cattgctgtg    960
ctcaacggta ccgtcccgca gtggcgcgtt gacgacatgg ctgtccgtat catggctgcc    1020
tactacaagg ttggccgcga ccgcctgtac cagccgccta acttcagctc ctggactcgc    1080
gatgaatacg gcttcaagta tttctacccc caggaagggc cctatgagaa ggtcaatcac    1140
tttgtcaatg tgcagcgcaa ccacagcgag gttattcgca agttgggagc agacagtact    1200
gttctactga agaacaacaa tgccctgccg ctgaccggaa aggagcgcaa agttgcgatc    1260
ctgggtgaag atgctggatc caactcgtac ggtgccaatg gctgctctga ccgtggctgt    1320
gacaacggta ctcttgctat ggcttggggt agcggcactg ccgaattccc atatctcgtg    1380
acccctgagc aggctattca agccgaggtg ctcaagcata agggcagcgt ctacgccatc    1440
acggacaact gggcgctgag ccaggtggag accctcgcta aacaagccag tgtctctctt    1500
gtatttgtca actcggacgc gggagagggc tatatctccg tggacggaaa cgagggcgac    1560
cgcaacaacc tcaccctctg gaagaacggc gacaacctca tcaaggctgc tgcaaacaac    1620
tgcaacaaca ccatcgttgt catccactcc gttggacctg ttttggttga cgagtggtat    1680
gaccacccca acgttactgc catcctctgg gcgggcttgc ctggccagga gtctggcaac    1740
tccttggctg acgtgctcta cggccgcgtc aacccgggcg ccaaatctcc attcacctgg    1800
ggcaagacga gggaggcgta cggggattac cttgtccgtg agctcaacaa cggcaacgga    1860
gctccccaag atgatttctc ggaaggtgtt ttcattgact accgcggatt cgacaagcgc    1920
aatgagaccc cgatctacga gttcggacat ggtctgagct acaccacttt caactactct    1980
ggccttcaca tccaggttct caacgcttcc tccaacgctc aagtagccac tgagactggc    2040
gccgctccca ccttcggaca agtcggcaat gcctctgact acgtgtaccc tgagggattg    2100
accagaatca gcaagttcat ctatccctgg cttaattcca cagacctgaa ggcctcatct    2160
ggcgacccgt actatggagt cgacaccgcg gagcacgtgc ccgagggtgc tactgatggc    2220
tctccgcagc ccgttctgcc tgccggtggt ggctctggtg gtaacccgcg cctctacgat    2280
gagttgatcc gtgtttcggt gacagtcaag aacactggtc gtgttgccgg tgatgctgtg    2340
cctcaattgt atgtttccct tggtggaccc aatgagccca aggttgtgtt gcgcaaattc    2400
gaccgcctca ccctcaagcc ctccgaggag acggtgtgga cgactaccct gacccgccgc    2460
gatctgtcta actgggacgt tgcggctcag gactgggtca tcacttctta cccgaagaag    2520
gtccatgttg gtagctcttc gcgtcagctg ccccttcacg cggcgctccc gaaggtgcaa    2580
tga                                                                  2583
<210>28
<211>860
<212>PRT
<213>棘孢曲霉(Aspergillus aculeatus)
<400>28
Met Lys Leu Ser Trp Leu Glu Ala Ala Ala Leu Thr Ala Ala Ser Val
1               5                   10                  15
Val Ser Ala Asp Glu Leu Ala Phe Ser Pro Pro Phe Tyr Pro Ser Pro
            20                  25                  30
Trp Ala Asn Gly Gln Gly Glu Trp Ala Glu Ala Tyr Gln Arg Ala Val
        35                  40                  45
Ala Ile Val Ser Gln Met Thr Leu Asp Glu Lys Val Asn Leu Thr Thr
    50                  55                  60
Gly Thr Gly Trp Glu Leu Glu Lys Cys Val Gly Gln Thr Gly Gly Val
65                  70                  75                  80
Pro Arg Leu Asn Ile Gly Gly Met Cys Leu Gln Asp Ser Pro Leu Gly
                85                  90                  95
Ile Arg Asp Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Val Asn Val
            100                 105                 110
Ala Ala Thr Trp Asp Lys Asn Leu Ala Tyr Leu Arg Gly Gln Ala Met
        115                 120                 125
Gly Gln Glu Phe Ser Asp Lys Gly Ile Asp Val Gln Leu Gly Pro Ala
    130                 135                 140
Ala Gly Pro Leu Gly Arg Ser Pro Asp Gly Gly Arg Asn Trp Glu Gly
145                 150                 155                 160
Phe Ser Pro Asp Pro Ala Leu Thr Gly Val Leu Phe Ala Glu Thr Ile
                165                 170                 175
Lys Gly Ile Gln Asp Ala Gly Val Val Ala Thr Ala Lys His Tyr Ile
            180                 185                 190
Leu Asn Glu Gln Glu His Phe Arg Gln Val Ala Glu Ala Ala Gly Tyr
        195                 200                 205
Gly Phe Asn Ile Ser Asp Thr Ile Ser Ser Asn Val Asp Asp Lys Thr
    210                 215                 220
Ile His Glu Met Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala Gly
225                 230                 235                 240
Val Gly Ala Ile Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr Gly
                245                 250                 255
Cys Gln Asn Ser Tyr Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu Gly
            260                 265                 270
Phe Gln Gly Phe Val Met Ser Asp Trp Gly Ala His His Ser Gly Val
        275                 280                 285
Gly Ser Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Ile Thr
    290                 295                 300
Phe Asp Ser Ala Thr Ser Phe Trp Gly Thr Asn Leu Thr Ile Ala Val
305                 310                 315                 320
Leu Asn Gly Thr Val Pro Gln Trp Arg Val AsP Asp Met Ala Val Arg
                325                 330                 335
Ile Met Ala Ala Tyr Tyr Lys Val Gly Arg Asp Arg Leu Tyr Gln Pro
            340                 345                 350
Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Phe Lys Tyr Phe
        355                 360                 365
Tyr Pro Gln Glu Gly Pro Tyr Glu Lys Val Asn His Phe Val Asn Val
    370                 375                 380
Gln Arg Asn His Ser Glu Val Ile Arg Lys Leu Gly Ala Asp Ser Thr
385                 390                 395                 400
Val Leu Leu Lys Asn Asn Asn Ala Leu Pro Leu Thr Gly Lys Glu Arg
                405                 410                 415
Lys Val Ala Ile Leu Gly Glu Asp Ala Gly Ser Asn Ser Tyr Gly Ala
            420                 425                 430
Asn Gly Cys Ser Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met Ala
        435                 440                 445
Trp Gly Ser Gly Thr Ala Glu Phe Pro Tyr Leu Val Thr Pro Glu Gln
    450                 455                 460
Ala Ile Gln Ala Glu Val Leu Lys His Lys Gly Ser Val Tyr Ala Ile
465                 470                 475                 480
Thr Asp Asn Trp Ala Leu Ser Gln Val Glu Thr Leu Ala Lys Gln Ala
                485                 490                 495
Ser Val Ser Leu Val Phe Val Asn Ser Asp Ala Gly Glu Gly Tyr Ile
            500                 505                 510
Ser Val Asp Gly Asn Glu Gly Asp Arg Asn Asn Leu Thr Leu Trp Lys
        515                 520                 525
Asn Gly Asp Asn Leu Ile Lys Ala Ala Ala Asn Asn Cys Asn Asn Thr
    530                 535                 540
Ile Val Val Ile His Ser Val Gly Pro Val Leu Val Asp Glu Trp Tyr
545                 550                 555                 560
Asp His Pro Asn Val Thr Ala Ile Leu Trp Ala Gly Leu Pro Gly Gln
                565                 570                 575
Glu Ser Gly Asn Ser Leu Ala Asp Val Leu Tyr Gly Arg Val Asn Pro
            580                 585                 590
Gly Ala Lys Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ala Tyr Gly
        595                 600                 605
Asp Tyr Leu Val Arg Glu Leu Asn Asn Gly Asn Gly Ala Pro Gln Asp
    610                 615                 620
Asp Phe Ser Glu Gly Val Phe Ile Asp Tyr Arg Gly Phe Asp Lys Arg
625                 630                 635                 640
Asn Glu Thr Pro Ile Tyr Glu Phe Gly His Gly Leu Ser Tyr Thr Thr
                645                 650                 655
Phe Asn Tyr Ser Gly Leu His Ile Gln Val Leu Asn Ala Ser Ser Asn
            660                 665                 670
Ala Gln Val Ala Thr Glu Thr Gly Ala Ala Pro Thr Phe Gly Gln Val
        675                 680                 685
Gly Asn Ala Ser Asp Tyr Val Tyr Pro Glu Gly Leu Thr Arg Ile Ser
    690                 695                 700
Lys Phe Ile Tyr Pro Trp Leu Asn Ser Thr Asp Leu Lys Ala Ser Ser
705                 710                 715                 720
Gly Asp Pro Tyr Tyr Gly Val Asp Thr Ala Glu His Val Pro Glu Gly
                725                 730                 735
Ala Thr Asp Gly Ser Pro Gln Pro Val Leu Pro Ala Gly Gly Gly Ser
            740                 745                 750
Gly Gly Asn Pro Arg Leu Tyr Asp Glu Leu Ile Arg Val Ser Val Thr
        755                 760                 765
Val Lys Asn Thr Gly Arg Val Ala Gly Asp Ala Val Pro Gln Leu Tyr
    770                 775                 780
Val Ser Leu Gly Gly Pro Asn Glu Pro Lys Val Val Leu Arg Lys Phe
785                 790                 795                 800
Asp Arg Leu Thr Leu Lys Pro Ser Glu Glu Thr Val Trp Thr Thr Thr
                805                 810                 815
Leu Thr Arg Arg Asp Leu Ser Asn Trp Asp Val Ala Ala Gln Asp Trp
            820                 825                 830
Val Ile Thr Ser Tyr Pro Lys Lys Val His Val Gly Ser Ser Ser Arg
        835                 840                 845
Gln Leu Pro Leu His Ala Ala Leu Pro Lys Val Gln
    850                 855                 860
<210>29
<211>918
<212>DNA
<213>特异腐质霉(Humicola insolens)
<400>29
atgcgttcct cccccctcct cccgtccgcc gttgtggccg ccctgccggt gttggccctt     60
gccgctgatg gcaggtccac ccgctactgg gactgctgca agccttcgtg cggctgggcc    120
aagaaggctc ccgtgaacca gcctgtcttt tcctgcaacg ccaacttcca gcgtatcacg    180
gacttcgacg ccaagtccgg ctgcgagccg ggcggtgtcg cctactcgtg cgccgaccag    240
accccatggg ctgtgaacga cgacttcgcg ctcggttttg ctgccacctc tattgccggc    300
agcaatgagg cgggctggtg ctgcgcctgc tacgagctca ccttcacatc cggtcctgtt    360
gctggcaaga agatggtcgt ccagtccacc agcactggcg gtgatcttgg cagcaaccac    420
ttcgatctca acatccccgg cggcggcgtc ggcatcttcg acggatgcac tccccagttc    480
ggcggtctgc ccggccagcg ctacggcggc atctcgtccc gcaacgagtg cgatcggttc    540
cccgacgccc tcaagcccgg ctgctactgg cgcttcgact ggttcaagaa cgccgacaat    600
ccgagcttca gcttccgtca ggtccagtgc ccagccgagc tcgtcgctcg caccggatgc    660
cgccgcaacg acgacggcaa cttccctgcc gtccagatcc cctccagcag caccagctct    720
ccggtcaacc agcctaccag caccagcacc acgtccacct ccaccacctc gagcccgcca    780
gtccagccta cgactcccag cggctgcact gctgagaggt gggctcagtg cggcggcaat    840
ggctggagcg gctgcaccac ctgcgtcgct ggcagcactt gcacgaagat taatgactgg    900
taccatcagt gcctgtag                                                  918
<210>30
<211>305
<212>PRT
<213>特异腐质霉(Humicola insolens)
<400>30
Met Arg Ser Ser Pro Leu Leu Arg Ser Ala Val Val Ala Ala Leu Pro
1               5                   10                  15
Val Leu Ala Leu Ala Ala Asp Gly Arg Ser Thr Arg Tyr Trp Asp Cys
            20                  25                  30
Cys Lys Pro Ser Cys Gly Trp Ala Lys Lys Ala Pro Val Asn Gln Pro
        35                  40                  45
Val Phe Ser Cys Asn Ala Asn Phe Gln Arg Ile Thr Asp Phe Asp Ala
    50                  55                  60
Lys Ser Gly Cys Glu Pro Gly Gly Val Ala Tyr Ser Cys Ala Asp Gln
65                  70                  75                  80
Thr Pro Trp Ala Val Asn Asp Asp Phe Ala Leu Gly Phe Ala Ala Thr
                85                  90                  95
Ser Ile Ala Gly Ser Asn Glu Ala Gly Trp Cys Cys Ala Cys Tyr Glu
            100                 105                 110
Leu Thr Phe Thr Ser Gly Pro Val Ala Gly Lys Lys Met Val Val Gln
        115                 120                 125
Ser Thr Ser Thr Gly Gly Asp Leu Gly Ser Asn His Phe Asp Leu Asn
    130                 135                 140
Ile Pro Gly Gly Gly Val Gly Ile Phe Asp Gly Cys Thr Pro Gln Phe
145                 150                 155                 160
Gly Gly Leu Pro Gly Gln Arg Tyr Gly Gly Ile Ser Ser Arg Asn Glu
                165                 170                 175
Cys Asp Arg Phe Pro Asp Ala Leu Lys Pro Gly Cys Tyr Trp Arg Phe
            180                 185                 190
Asp Trp Phe Lys Asn Ala Asp Asn Pro Ser Phe Ser Phe Arg Gln Val
        195                 200                 205
Gln Cys Pro Ala Glu Leu Val Ala Arg Thr Gly Cys Arg Arg Asn Asp
    210                 215                 220
Asp Gly Asn Phe Pro Ala Val Gln Ile Pro Ser Ser Ser Thr Ser Ser
225                 230                 235                 240
Pro Val Asn Gln Pro Thr Ser Thr Ser Thr Thr Ser Thr Ser Thr Thr
                245                 250                 255
Ser Ser Pro Pro Val Gln Pro Thr Thr Pro Ser Gly Cys Thr Ala Glu
            260                 265                 270
Arg Trp Ala Gln Cys Gly Gly Asn Gly Trp Ser Gly Cys Thr Thr Cys
        275                 280                 285
Val Ala Gly Ser Thr Cys Thr Lys Ile Asn Asp Trp Tyr His Gln Cys
    290                 295                 300
Leu
305
<210>31
<211>1188
<212>DNA
<213>嗜热毁丝霉(Myceliophthora thermophila)
<400>31
cgacttgaaa cgccccaaat gaagtcctcc atcctcgcca gcgtcttcgc cacgggcgcc     60
gtggctcaaa gtggtccgtg gcagcaatgt ggtggcatcg gatggcaagg atcgaccgac    120
tgtgtgtcgg gctaccactg cgtctaccag aacgattggt acagccagtg cgtgcctggc    180
gcggcgtcga caacgctgca gacatcgacc acgtccaggc ccaccgccac cagcaccgcc    240
cctccgtcgt ccaccacctc gcctagcaag ggcaagctga agtggctcgg cagcaacgag    300
tcgggcgccg agttcgggga gggcaattac cccggcctct ggggcaagca cttcatcttc    360
ccgtcgactt cggcgattca gacgctcatc aatgatggat acaacatctt ccggatcgac    420
ttctcgatgg agcgtctggt gcccaaccag ttgacgtcgt ccttcgacca gggttacctc    480
cgcaacctga ccgaggtggt caacttcgtg acgaacgcgg gcaagtacgc cgtcctggac    540
ccgcacaact acggccggta ctacggcaac atcatcacgg acacgaacgc gttccggacc    600
ttctggacca acctggccaa gcagttcgcc tccaactcgc tcgtcatctt cgacaccaac    660
aacgagtaca acacgatgga ccagaccctg gtgctcaacc tcaaccaggc cgccatcgac    720
ggcatccggg ccgccggcgc gacctcgcag tacatcttcg tcgagggcaa cgcgtggagc     780
ggggcctgga gctggaacac gaccaacacc aacatggccg ccctgacgga cccgcagaac     840
aagatcgtgt acgagatgca ccagtacctc gactcggaca gctcgggcac ccacgccgag     900
tgcgtcagca gcaccatcgg cgcccagcgc gtcgtcggag ccacccagtg gctccgcgcc     960
aacggcaagc tcggcgtcct cggcgagttc gccggcggcg ccaacgccgt ctgccagcag    1020
gccgtcaccg gcctcctcga ccacctccag gacaacagcg acgtctggct gggtgccctc    1080
tggtgggccg ccggtccctg gtggggcgac tacatgtact cgttcgagcc tccttcgggc    1140
accggctatg tcaactacaa ctcgatcttg aagaagtact tgccgtaa                 1188
<210>32
<211>389
<212>PRT
<213>嗜热毁丝霉(Myceliophthora thermophila)
<400>32
Met Lys Ser Ser Ile Leu Ala Ser Val Phe Ala Thr Gly Ala Val Ala
1               5                   10                  15
Gln Ser Gly Pro Trp Gln Gln Cys Gly Gly Ile Gly Trp Gln Gly Ser
            20                  25                  30
Thr Asp Cys Val Ser Gly Tyr His Cys Val Tyr Gln Asn Asp Trp Tyr
        35                  40                  45
Ser Gln Cys Val Pro Gly Ala Ala Ser Thr Thr Leu Gln Thr Ser Thr
    50                  55                  60
Thr Ser Arg Pro Thr Ala Thr Ser Thr Ala Pro Pro Ser Ser Thr Thr
65                  70                  75                  80
Ser Pro Ser Lys Gly Lys Leu Lys Trp Leu Gly Ser Asn Glu Ser Gly
                85                  90                  95
Ala Glu Phe Gly Glu Gly Asn Tyr Pro Gly Leu Trp Gly Lys His Phe
            100                 105                 110
Ile Phe Pro Ser Thr Ser Ala Ile Gln Thr Leu Ile Asn Asp Gly Tyr
        115                 120                 125
Asn Ile Phe Arg Ile Asp Phe Ser Met Glu Arg Leu Val Pro Asn Gln
    130                 135                 140
Leu Thr Ser Ser Phe Asp Gln Gly Tyr Leu Arg Asn Leu Thr Glu Val
145                 150                 155                 160
Val Asn Phe Val Thr Asn Ala Gly Lys Tyr Ala Val Leu Asp Pro His
                165                 170                 175
Asn Tyr Gly Arg Tyr Tyr Gly Asn Ile Ile Thr Asp Thr Asn Ala Phe
            180                 185                 190
Arg Thr Phe Trp Thr Asn Leu Ala Lys Gln Phe Ala Ser Asn Ser Leu
        195                 200                 205
Val Ile Phe Asp Thr Asn Asn Glu Tyr Asn Thr Met Asp Gln Thr Leu
    210                 215                 220
Val Leu Asn Leu Asn Gln Ala Ala Ile Asp Gly Ile Arg Ala Ala Gly
225                 230                 235                 240
Ala Thr Ser Gln Tyr Ile Phe Val Glu Gly Asn Ala Trp Ser Gly Ala
                245                 250                 255
Trp Ser Trp Asn Thr Thr Asn Thr Asn Met Ala Ala Leu Thr Asp Pro
            260                 265                 270
Gln Asn Lys Ile Val Tyr Glu Met His Gln Tyr Leu Asp Ser Asp Ser
        275                 280                 285
Ser Gly Thr His Ala Glu Cys Val Ser Ser Thr Ile Gly Ala Gln Arg
    290                 295                 300
Val Val Gly Ala Thr Gln Trp Leu Arg Ala Asn Gly Lys Leu Gly Val
305                 310                 315                 320
Leu Gly Glu Phe Ala Gly Gly Ala Asn Ala Val Cys Gln Gln Ala Val
                325                 330                 335
Thr Gly Leu Leu Asp His Leu Gln Asp Asn Ser Asp Val Trp Leu Gly
            340                 345                 350
Ala Leu Trp Trp Ala Ala Gly Pro Trp Trp Gly Asp Tyr Met Tyr Ser
        355                 360                 365
Phe Glu Pro Pro Ser Gly Thr Gly Tyr Val Asn Tyr Asn Ser Ile Leu
    370                 375                 380
Lys Lys Tyr Leu Pro
385
<210>33
<211>1232
<212>DNA
<213>担子菌纲(BASIDIOMYCETE)CBS 495.95
<400>33
ggatccactt agtaacggcc gccagtgtgc tggaaagcat gaagtctctc ttcctgtcac     60
ttgtagcgac cgtcgcgctc agctcgccag tattctctgt cgcagtctgg gggcaatgcg    120
gcggcattgg cttcagcgga agcaccgtct gtgatgcagg cgccggctgt gtgaagctca    180
acgactatta ctctcaatgc caacccggcg ctcccactgc tacatccgcg gcgccaagta    240
gcaacgcacc gtccggcact tcgacggcct cggccccctc ctccagcctt tgctctggca    300
gccgcacgcc gttccagttc ttcggtgtca acgaatccgg cgcggagttc ggcaacctga    360
acatccccgg tgttctgggc accgactaca cctggccgtc gccatccagc attgacttct    420
tcatgggcaa gggaatgaat accttccgta ttccgttcct catggagcgt cttgtccccc    480
ctgccactgg catcacagga cctctcgacc agacgtactt gggcggcctg cagacgattg    540
tcaactacat caccggcaaa ggcggctttg ctctcattga cccgcacaac tttatgatct    600
acaatggcca gacgatctcc agtaccagcg acttccagaa gttctggcag aacctcgcag    660
gagtgtttaa atcgaacagt cacgtcatct tcgatgttat gaacgagcct cacgatattc    720
ccgcccagac cgtgttccaa ctgaaccaag ccgctgtcaa tggcatccgt gcgagcggtg    780
cgacgtcgca gctcattctg gtcgagggca caagctggac tggagcctgg acctggacga    840
cctctggcaa cagcgatgca ttcggtgcca ttaaggatcc caacaacaac gtcgcgatcc    900
agatgcatca gtacctggat agcgatggct ctggcacttc gcagacctgc gtgtctccca    960
ccatcggtgc cgagcggttg caggctgcga ctcaatggtt gaagcagaac aacctcaagg   1020
gcttcctggg cgagatcggc gccggctcta actccgcttg catcagcgct gtgcagggtg   1080
cgttgtgttc gatgcagcaa tctggtgtgt ggctcggcgc tctctggtgg gctgcgggcc   1140
cgtggtgggg cgactactac cagtccatcg agccgccctc tggcccggcg gtgtccgcga   1200
tcctcccgca ggccctgctg ccgttcgcgt aa                       1232
<210>34
<211>397
<212>PRT
<213>担子菌纲(BASIDIOMYCETE)CBS 495.95
<400>34
Met Lys Ser Leu Phe Leu Ser Leu Val Ala Thr Val Ala Leu Ser Ser
1               5                   10                  15
Pro Val Phe Ser Val Ala Val Trp Gly Gln Cys Gly Gly Ile Gly Phe
            20                  25                  30
Ser Gly Ser Thr Val Cys Asp Ala Gly Ala Gly Cys Val Lys Leu Asn
        35                  40                  45
Asp Tyr Tyr Ser Gln Cys Gln Pro Gly Ala Pro Thr Ala Thr Ser Ala
    50                  55                  60
Ala Pro Ser Ser Asn Ala Pro Ser Gly Thr Ser Thr Ala Ser Ala Pro
65                  70                  75                  80
Ser Ser Ser Leu Cys Ser Gly Ser Arg Thr Pro Phe Gln Phe Phe Gly
                85                  90                  95
Val Asn Glu Ser Gly Ala Glu Phe Gly Asn Leu Asn Ile Pro Gly Val
            100                 105                 110
Leu Gly Thr Asp Tyr Thr Trp Pro Ser Pro Ser Ser Ile Asp Phe Phe
        115                 120                 125
Met Gly Lys Gly Met Asn Thr Phe Arg Ile Pro Phe Leu Met Glu Arg
    130                 135                 140
Leu Val Pro Pro Ala Thr Gly Ile Thr Gly Pro Leu Asp Gln Thr Tyr
145                 150                 155                 160
Leu Gly Gly Leu Gln Thr Ile Val Asn Tyr Ile Thr Gly Lys Gly Gly
                165                 170                 175
Phe Ala Leu Ile Asp Pro His Asn Phe Met Ile Tyr Asn Gly Gln Thr
            180                 185                 190
Ile Ser Ser Thr Ser Asp Phe Gln Lys Phe Trp Gln Asn Leu Ala Gly
        195                 200                 205
Val Phe Lys Ser Asn Ser His Val Ile Phe Asp Val Met Asn Glu Pro
    210                 215                 220
His Asp Ile Pro Ala Gln Thr Val Phe Gln Leu Asn Gln Ala Ala Val
225                 230                 235                 240
Asn Gly Ile Arg Ala Ser Gly Ala Thr Ser Gln Leu Ile Leu Val Glu
                245                 250                 255
Gly Thr Ser Trp Thr Gly Ala Trp Thr Trp Thr Thr Ser Gly Asn Ser
            260                 265                 270
Asp Ala Phe Gly Ala Ile Lys Asp Pro Asn Asn Asn Val Ala Ile Gln
        275                 280                 285
Met His Gln Tyr Leu Asp Ser Asp Gly Ser Gly Thr Ser Gln Thr Cys
    290                 295                 300
Val Ser Pro Thr Ile Gly Ala Glu Arg Leu Gln Ala Ala Thr Gln Trp
305                 310                 315                 320
Leu Lys Gln Asn Asn Leu Lys Gly Phe Leu Gly Glu Ile Gly Ala Gly
                325                 330                 335
Ser Asn Ser Ala Cys Ile Ser Ala Val Gln Gly Ala Leu Cys Ser Met
            340                 345                 350
Gln Gln Ser Gly Val Trp Leu Gly Ala Leu Trp Trp Ala Ala Gly Pro
        355                 360                 365
Trp Trp Gly Asp Tyr Tyr Gln Ser Ile Glu Pro Pro Ser Gly Pro Ala
    370                 375                 380
Val Ser Ala Ile Leu Pro Gln Ala Leu Leu Pro Phe Ala
385                 390                 395
<210>35
<211>1303
<212>DNA
<213>担子菌纲(BASIDIOMYCETE)CBS 495.95
<400>35
ggaaagcgtc agtatggtga aatttgcgct tgtggcaact gtcggcgcaa tcttgagcgc     60
ttctgcggcc aatgcggctt ctatctacca gcaatgtgga ggcattggat ggtctgggtc    120
cactgtttgc gacgccggtc tcgcttgcgt tatcctcaat gcgtactact ttcagtgctt    180
gacgcccgcc gcgggccaga caacgacggg ctcgggcgca ccggcgtcaa catcaacctc    240
tcactcaacg gtcactacgg ggagctcaca ctcaacaacc gggacgacgg cgacgaaaac    300
aactaccact ccgtcgacca ccacgaccct acccgccatc tctgtgtctg gtcgcgtctg    360
ctctggctcc aggacgaagt tcaagttctt cggtgtgaat gaaagcggcg ccgaattcgg    420
gaacactgct tggccagggc agctcgggaa agactataca tggccttcgc ctagcagcgt    480
ggactacttc atgggggctg gattcaatac attccgtatc accttcttga tggagcgtat    540
gagccctccg gctaccggac tcactggccc attcaaccag acgtacctgt cgggcctcac    600
caccattgtc gactacatca cgaacaaagg aggatacgct cttattgacc cccacaactt    660
catgcgttac aacaacggca taatcagcag cacatctgac ttcgcgactt ggtggagcaa    720
tttggccact gtattcaaat ccacgaagaa cgccatcttc gacatccaga acgagccgta    780
cggaatcgat gcgcagaccg tatacgaact gaatcaagct gccatcaatt cgatccgcgc    840
cgctggcgct acgtcacagt tgattctggt tgaaggaacg tcatacactg gagcttggac    900
gtgggtctcg tccggaaacg gagctgcttt cgcggccgtt acggatcctt acaacaacac    960
ggcaattgaa atgcaccaat acctcgacag cgacggttct gggacaaacg aagactgtgt   1020
ctcctccacc attgggtcgc aacgtctcca agctgccact gcgtggctgc aacaaacagg   1080
actcaaggga ttcctcggag agacgggtgc tgggtcgaat tcccagtgca tcgacgccgt   1140
gttcgatgaa ctttgctata tgcaacagca aggcggctcc tggatcggtg cactctggtg   1200
ggctgcgggt ccctggtggg gcacgtacatttactcgatt gaacctccga gcggtgccgc    1260
tatcccagaa gtccttcctc agggtctcgc tccattcctc tag                     1303
<210>36
<211>429
<212>PRT
<213>担子菌纲(BASIDIOMYCETE)CBS 495.95
<400>36
Met Val Lys Phe Ala Leu Val Ala Thr Val Gly Ala Ile Leu Ser Ala
1               5                   10                  15
Ser Ala Ala Asn Ala Ala Ser Ile Tyr Gln Gln Cys Gly Gly Ile Gly
            20                  25                  30
Trp Ser Gly Ser Thr Val Cys Asp Ala Gly Leu Ala Cys Val Ile Leu
        35                  40                  45
Asn Ala Tyr Tyr Phe Gln Cys Leu Thr Pro Ala Ala Gly Gln Thr Thr
    50                  55                  60
Thr Gly Ser Gly Ala Pro Ala Ser Thr Ser Thr Ser His Ser Thr Val
65                  70                  75                  80
Thr Thr Gly Ser Ser His Ser Thr Thr Gly Thr Thr Ala Thr Lys Thr
                85                  90                  95
Thr Thr Thr Pro Ser Thr Thr Thr Thr Leu Pro Ala Ile Ser Val Ser
            100                 105                 110
Gly Arg Val Cys Ser Gly Ser Arg Thr Lys Phe Lys Phe Phe Gly Val
        115                 120                 125
Asn Glu Ser Gly Ala Glu Phe Gly Asn Thr Ala Trp Pro Gly Gln Leu
    130                 135                 140
Gly Lys Asp Tyr Thr Trp Pro Ser Pro Ser Ser Val Asp Tyr Phe Met
145                 150                 155                 160
Gly Ala Gly Phe Asn Thr Phe Arg Ile Thr Phe Leu Met Glu Arg Met
                165                 170                 175
Ser Pro Pro Ala Thr Gly Leu Thr Gly Pro Phe Asn Gln Thr Tyr Leu
            180                 185                 190
Ser Gly Leu Thr Thr Ile Val Asp Tyr Ile Thr Asn Lys Gly Gly Tyr
        195                 200                 205
Ala Leu Ile Asp Pro His Asn Phe Met Arg Tyr Asn Asn Gly Ile Ile
    210                 215                 220
Ser Ser Thr Ser Asp Phe Ala Thr Trp Trp Ser Asn Leu Ala Thr Val
225                 230                 235                 240
Phe Lys Ser Thr Lys Asn Ala Ile Phe Asp Ile Gln Asn Glu Pro Tyr
                245                 250                 255
Gly Ile Asp Ala Gln Thr Val Tyr Glu Leu Asn Gln Ala Ala Ile Asn
            260                 265                 270
Ser Ile Arg Ala Ala Gly Ala Thr Ser Gln Leu Ile Leu Val Glu Gly
        275                 280                 285
Thr Ser Tyr Thr Gly Ala Trp Thr Trp Val Ser Ser Gly Asn Gly Ala
    290                 295                 300
Ala Phe Ala Ala Val Thr Asp Pro Tyr Asn Asn Thr Ala Ile Glu Met
305                 310                 315                 320
His Gln Tyr Leu Asp Ser Asp Gly Ser Gly Thr Asn Glu Asp Cys Val
                325                 330                 335
Ser Ser Thr Ile Gly Ser Gln Arg Leu Gln Ala Ala Thr Ala Trp Leu
            340                 345                 350
Gln Gln Thr Gly Leu Lys Gly Phe Leu Gly Glu Thr Gly Ala Gly Ser
        355                 360                 365
Asn Ser Gln Cys Ile Asp Ala Val Phe Asp Glu Leu Cys Tyr Met Gln
    370                 375                 380
Gln Gln Gly Gly Ser Trp Ile Gly Ala Leu Trp Trp Ala Ala Gly Pro
385                 390                 395                 400
Trp Trp Gly Thr Tyr Ile Tyr Ser Ile Glu Pro Pro Ser Gly Ala Ala
                405                 410                 415
Ile Pro Glu Val Leu Pro Gln Gly Leu Ala Pro Phe Leu
            420                 425
<210>37
<211>1580
<212>DNA
<213>土生梭孢霉(Thielavia terrestris)
<400>37
agccccccgt tcaggcacac ttggcatcag atcagcttag cagcgcctgc acagcatgaa     60
gctctcgcag tcggccgcgc tggcggcact caccgcgacg gcgctcgccg ccccctcgcc    120
cacgacgccg caggcgccga ggcaggcttc agccggctgc tcgtctgcgg tcacgctcga    180
cgccagcacc aacgtttgga agaagtacac gctgcacccc aacagctact accgcaagga    240
ggttgaggcc gcggtggcgc agatctcgga cccggacctc gccgccaagg ccaagaaggt    300
ggccgacgtc ggcaccttcc tgtggctcga ctcgatcgag aacatcggca agctggagcc    360
ggcgatccag gacgtgccct gcgagaacat cctgggcctg gtcatctacg acctgccggg    420
ccgcgactgc gcggccaagg cgtccaacgg cgagctcaag gtcggcgaga tcgaccgcta    480
caagaccgag tacatcgaca gtgagtgctg ccccccgggt tcgagaagag cgtgggggaa    540
agggaaaggg ttgactgact gacacggcgc actgcagaga tcgtgtcgat cctcaaggca    600
caccccaaca cggcgttcgc gctggtcatc gagccggact cgctgcccaa cctggtgacc    660
aacagcaact tggacacgtg ctcgagcagc gcgtcgggct accgcgaagg cgtggcttac    720
gccctcaaga acctcaacct gcccaacgtg atcatgtacc tcgacgccgg ccacggcggc    780
tggctcggct gggacgccaa cctgcagccc ggcgcgcagg agctagccaa ggcgtacaag    840
aacgccggct cgcccaagca gctccgcggc ttctcgacca acgtggccgg ctggaactcc    900
tggtgagctt ttttccattc catttcttct tcctcttctc tcttcgctcc cactctgcag    960
ccccccctcc cccaagcacc cactggcgtt ccggcttgct gactcggcct ccctttcccc   1020
gggcaccagg gatcaatcgc ccggcgaatt ctcccaggcg tccgacgcca agtacaacaa   1080
gtgccagaac gagaagatct acgtcagcac cttcggctcc gcgctccagt cggccggcat   1140
gcccaaccac gccatcgtcg acacgggccg caacggcgtc accggcctgc gcaaggagtg   1200
gggtgactgg tgcaacgtca acggtgcagg ttcgttgtct tctttttctc ctcttttgtt   1260
tgcacgtcgt ggtccttttc aagcagccgt gtttggttgg gggagatgga ctccggctga   1320
tgttctgctt cctctctagg cttcggcgtg cgcccgacga gcaacacggg cctcgagctg   1380
gccgacgcgt tcgtgtgggt caagcccggc ggcgagtcgg acggcaccag cgacagctcg   1440
tcgccgcgct acgacagctt ctgcggcaag gacgacgcct tcaagccctc gcccgaggcc   1500
ggcacctgga acgaggccta cttcgagatg ctgctcaaga acgccgtgcc gtcgttctaa   1560
gacggtccag catcatccgg                                               1580
<210>38
<211>396
<212>PRT
<213>土生梭孢霉(Thielavia terrestris)
<400>38
Met Lys Leu Ser Gln Ser Ala Ala Leu Ala Ala Leu Thr Ala Thr Ala
1               5                   10                  15
Leu Ala Ala Pro Ser Pro Thr Thr Pro Gln Ala Pro Arg Gln Ala Ser
            20                  25                  30
Ala Gly Cys Ser Ser Ala Val Thr Leu Asp Ala Ser Thr Asn Val Trp
        35                  40                  45
Lys Lys Tyr Thr Leu His Pro Asn Ser Tyr Tyr Arg Lys Glu Val Glu
    50                  55                  60
Ala Ala Val Ala Gln Ile Ser Asp Pro Asp Leu Ala Ala Lys Ala Lys
65                  70                  75                  80
Lys Val Ala Asp Val Gly Thr Phe Leu Trp Leu Asp Ser Ile Glu Asn
                85                  90                  95
Ile Gly Lys Leu Glu Pro Ala Ile Gln Asp Val Pro Cys Glu Asn Ile
            100                 105                 110
Leu Gly Leu Val Ile Tyr Asp Leu Pro Gly Arg Asp Cys Ala Ala Lys
        115                 120                 125
Ala Ser Asn Gly Glu Leu Lys Val Gly Glu Ile Asp Arg Tyr Lys Thr
    130                 135                 140
Glu Tyr Ile Asp Lys Ile Val Ser Ile Leu Lys Ala His Pro Asn Thr
145                 150                 155                 160
Ala Phe Ala Leu Val Ile Glu Pro Asp Ser Leu Pro Asn Leu Val Thr
                165                 170                 175
Asn Ser Asn Leu Asp Thr Cys Ser Ser Ser Ala Ser Gly Tyr Arg Glu
            180                 185                 190
Gly Val Ala Tyr Ala Leu Lys Asn Leu Asn Leu Pro Asn Val Ile Met
        195                 200                 205
Tyr Leu Asp Ala Gly His Gly Gly Trp Leu Gly Trp Asp Ala Asn Leu
    210                 215                 220
Gln Pro Gly Ala Gln Glu Leu Ala Lys Ala Tyr Lys Asn Ala Gly Ser
225                 230                 235                 240
Pro Lys Gln Leu Arg Gly Phe Ser Thr Asn Val Ala Gly Trp Asn Ser
                245                 250                 255
Trp Asp Gln Ser Pro Gly Glu Phe Ser Gln Ala Ser Asp Ala Lys Tyr
            260                 265                 270
Asn Lys Cys Gln Asn Glu Lys Ile Tyr Val Ser Thr Phe Gly Ser Ala
        275                 280                 285
Leu Gln Ser Ala Gly Met Pro Asn His Ala Ile Val Asp Thr Gly Arg
    290                 295                 300
Asn Gly Val Thr Gly Leu Arg Lys Glu Trp Gly Asp Trp Cys Asn Val
305                 310                 315                 320
Asn Gly Ala Gly Phe Gly Val Arg Pro Thr Ser Asn Thr Gly Leu Glu
                325                 330                 335
Leu Ala Asp Ala Phe Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly
            340                 345                 350
Thr Ser Asp Ser Ser Ser Pro Arg Tyr Asp Ser Phe Cys Gly Lys Asp
        355                 360                 365
Asp Ala Phe Lys Pro Ser Pro Glu Ala Gly Thr Trp Asn Glu Ala Tyr
    370                 375                 380
Phe Glu Met Leu Leu Lys Asn Ala Val Pro Ser Phe
385                 390                 395
<210>39
<211>1203
<212>DNA
<213>土生梭孢霉(Thielavia terrestris)
<400>39
atgaagtacc tcaacctcct cgcagctctc ctcgccgtcg ctcctctctc cctcgctgca     60
cccagcatcg aggccagaca gtcgaacgtc aacccataca tcggcaagag cccgctcgtt    120
attaggtcgt acgcccaaaa gcttgaggag accgtcagga ccttccagca acgtggcgac    180
cagctcaacg ctgcgaggac acggacggtg cagaacgttg cgactttcgc ctggatctcg    240
gataccaatg gtattggagc cattcgacct ctcatccaag atgctctcgc ccagcaggct    300
cgcactggac agaaggtcat cgtccaaatc gtcgtctaca acctcccaga tcgcgactgc    360
tctgccaacg cctcgactgg agagttcacc gtaggaaacg acggtctcaa ccgatacaag    420
aactttgtca acaccatcgc ccgcgagctc tcgactgctg acgctgacaa gctccacttt    480
gccctcctcc tcgaacccga cgcacttgcc aacctcgtca ccaacgcgaa tgcccccagg    540
tgccgaatcg ccgctcccgc ttacaaggag ggtatcgcct acaccctcgc caccttgtcc    600
aagcccaacg tcgacgtcta catcgacgcc gccaacggtg gctggctcgg ctggaacgac    660
aacctccgcc ccttcgccga actcttcaag gaagtctacg acctcgcccg ccgcatcaac    720
cccaacgcca aggtccgcgg cgtccccgtc aacgtctcca actacaacca gtaccgcgct    780
gaagtccgcg agcccttcac cgagtggaag gacgcctggg acgagagccg ctacgtcaac    840
gtcctcaccc cgcacctcaa cgccgtcggc ttctccgcgc acttcatcgt tgaccaggga    900
cgcggtggca agggcggtat caggacggag tggggccagt ggtgcaacgt taggaacgct    960
gggttcggta tcaggcctac tgcggatcag ggcgtgctcc agaacccgaa tgtggatgcg   1020
attgtgtggg ttaagccggg tggagagtcg gatggcacga gtgatttgaa ctcgaacagg   1080
tatgatccta cgtgcaggag tccggtggcg catgttcccg ctcctgaggc tggccagtgg   1140
ttcaacgagt atgttgttaa cctcgttttg aacgctaacc cccctcttga gcctacctgg   1200
taa                                                                 1203
<210>40
<211>400
<212>PRT
<213>土生梭孢霉(Thielavia terrestris)
<400>40
Met Lys Tyr Leu Asn Leu Leu Ala Ala Leu Leu Ala Val Ala Pro Leu
1               5                   10                  15
Ser Leu Ala Ala Pro Ser Ile Glu Ala Arg Gln Ser Asn Val Asn Pro
            20                  25                  30
Tyr Ile Gly Lys Ser Pro Leu Val Ile Arg Ser Tyr Ala Gln Lys Leu
        35                  40                  45
Glu Glu Thr Val Arg Thr Phe Gln Gln Arg Gly Asp Gln Leu Asn Ala
    50                  55                  60
Ala Arg Thr Arg Thr Val Gln Asn Val Ala Thr Phe Ala Trp Ile Ser
65                  70                  75                  80
Asp Thr Asn Gly Ile Gly Ala Ile Arg Pro Leu Ile Gln Asp Ala Leu
                85                  90                  95
Ala Gln Gln Ala Arg Thr Gly Gln Lys Val Ile Val Gln Ile Val Val
            100                 105                 110
Tyr Asn Leu Pro Asp Arg Asp Cys Ser Ala Asn Ala Ser Thr Gly Glu
        115                 120                 125
Phe Thr Val Gly Asn Asp Gly Leu Asn Arg Tyr Lys Asn Phe Val Asn
    130                 135                 140
Thr Ile Ala Arg Glu Leu Ser Thr Ala Asp Ala Asp Lys Leu His Phe
145                 150                 155                 160
Ala Leu Leu Leu Glu Pro Asp Ala Leu Ala Asn Leu Val Thr Asn Ala
                165                 170                 175
Asn Ala Pro Arg Cys Arg Ile Ala Ala Pro Ala Tyr Lys Glu Gly Ile
            180                 185                 190
Ala Tyr Thr Leu Ala Thr Leu Ser Lys Pro Asn Val Asp Val Tyr Ile
        195                 200                 205
Asp Ala Ala Asn Gly Gly Trp Leu Gly Trp Asn Asp Asn Leu Arg Pro
    210                 215                 220
Phe Ala Glu Leu Phe Lys Glu Val Tyr Asp Leu Ala Arg Arg Ile Asn
225                 230                 235                 240
Pro Asn Ala Lys Val Arg Gly Val Pro Val Asn Val Ser Asn Tyr Asn
                245                 250                 255
Gln Tyr Arg Ala Glu Val Arg Glu Pro Phe Thr Glu Trp Lys Asp Ala
            260                 265                 270
Trp Asp Glu Ser Arg Tyr Val Asn Val Leu Thr Pro His Leu Asn Ala
        275                 280                 285
Val Gly Phe Ser Ala His Phe Ile Val Asp Gln Gly Arg Gly Gly Lys
    290                 295                 300
Gly Gly Ile Arg Thr Glu Trp Gly Gln Trp Cys Asn Val Arg Asn Ala
305                 310                 315                 320
Gly Phe Gly Ile Arg Pro Thr Ala Asp Gln Gly Val Leu Gln Asn Pro
                325                 330                 335
Asn Val Asp Ala Ile Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly
            340                 345                 350
Thr Ser Asp Leu Asn Ser Asn Arg Tyr Asp Pro Thr Cys Arg Ser Pro
        355                 360                 365
Val Ala His Val Pro Ala Pro Glu Ala Gly Gln Trp Phe Asn Glu Tyr
    370                 375                 380
Val Val Asn Leu Val Leu Asn Ala Asn Pro Pro Leu Glu Pro Thr Trp
385                 390                 395                 400
<210>41
<211>1501
<212>DNA
<213>土生梭孢霉(Thielavia terrestris)
<400>41
gccgttgtca agatgggcca gaagacgctg cacggattcg ccgccacggc tttggccgtt     60
ctcccctttg tgaaggctca gcagcccggc aacttcacgc cggaggtgca cccgcaactg    120
ccaacgtgga agtgcacgac cgccggcggc tgcgttcagc aggacacttc ggtggtgctc    180
gactggaact accgttggat ccacaatgcc gacggcaccg cctcgtgcac gacgtccagc    240
ggggtcgacc acacgctgtg tccagatgag gcgacctgcg cgaagaactg cttcgtggaa    300
ggcgtcaact acacgagcag cggtgtcacc acatccggca gttcgctgac gatgaggcag    360
tatttcaagg ggagcaacgg gcagaccaac agcgtttcgc ctcgtctcta cctgctcggc    420
tcggatggaa actacgtaat gctcaagctg ctcggccagg agctgagctt cgatgtcgat    480
ctctccacgc tcccctgcgg cgagaacggc gcgctgtacc tgtccgagat ggacgcgacc    540
ggtggcagga accagtacaa caccggcggt gccaactacg gctcgggcta ctgtgacgcc    600
cagtgtcccg tgcagacgtg gatgaacggc acgctgaaca ccaacgggca gggctactgc    660
tgcaacgaga tggacatcct cgaggccaac tcccgcgcca acgcgatgac acctcacccc    720
tgcgccaacg gcagctgcga caagagcggg tgcggactca acccctacgc cgagggctac    780
aagagctact acggaccggg cctcacggtt gacacgtcga agcccttcac catcattacc    840
cgcttcatca ccgacgacgg cacgaccagc ggcaccctca accagatcca gcggatctat    900
gtgcagaatg gcaagacggt cgcgtcggct gcgtccggag gcgacatcat cacggcatcc    960
ggctgcacct cggcccaggc gttcggcggg ctggccaaca tgggcgcggc gcttggacgg   1020
ggcatggtgc tgaccttcag catctggaac gacgctgggg gctacatgaa ctggctcgac   1080
agcggcaaca acggcccgtg cagcagcacc gagggcaacc cgtccaacat cctggccaac   1140
tacccggaca cccacgtggt cttctccaac atccgctggg gagacatcgg ctcgacggtc   1200
caggtctcgg gaggcggcaa cggcggctcg accaccacca cgtcgaccac cacgctgagg   1260
acctcgacca cgaccaccac caccgccccg acggccactg ccacgcactg gggacaatgc   1320
ggcggaatcg gggtacgtca accgcctcct gcattctgtt gaggaagtta actaacgtgg   1380
cctacgcagt ggactggacc gaccgtctgc gaatcgccgt acgcatgcaa ggagctgaac   1440
ccctggtact accagtgcct ctaaagtatt gcagtgaagc catactccgt gctcggcatg   1500
g                                                                   1501
<210>42
<211>464
<212>PRT
<213>土生梭孢霉(Thielavia terrestris)
<400>42
Met Gly Gln Lys Thr Leu His Gly Phe Ala Ala Thr Ala Leu Ala Val
1               5                   10                  15
Leu Pro Phe Val Lys Ala Gln Gln Pro Gly Asn Phe Thr Pro Glu Val
            20                  25                  30
His Pro Gln Leu Pro Thr Trp Lys Cys Thr Thr Ala Gly Gly Cys Val
        35                  40                  45
Gln Gln Asp Thr Ser Val Val Leu Asp Trp Asn Tyr Arg Trp Ile His
    50                  55                  60
Asn Ala Asp Gly Thr Ala Ser Cys Thr Thr Ser Ser Gly Val Asp His
65                  70                  75                  80
Thr Leu Cys Pro Asp Glu Ala Thr Cys Ala Lys Asn Cys Phe Val Glu
                85                  90                  95
Gly Val Asn Tyr Thr Ser Ser Gly Val Thr Thr Ser Gly Ser Ser Leu
            100                 105                 110
Thr Met Arg Gln Tyr Phe Lys Gly Ser Asn Gly Gln Thr Asn Ser Val
        115                 120                 125
Ser Pro Arg Leu Tyr Leu Leu Gly Ser Asp Gly Asn Tyr Val Met Leu
    130                 135                 140
Lys Leu Leu Gly Gln Glu Leu Ser Phe Asp Val Asp Leu Ser Thr Leu
145                 150                 155                 160
Pro Cys Gly Glu Asn Gly Ala Leu Tyr Leu Ser Glu Met Asp Ala Thr
                165                 170                 175
Gly Gly Arg Asn Gln Tyr Asn Thr Gly Gly Ala Asn Tyr Gly Ser Gly
            180                 185                 190
Tyr Cys Asp Ala Gln Cys Pro Val Gln Thr Trp Met Asn Gly Thr Leu
        195                 200                 205
Asn Thr Asn Gly Gln Gly Tyr Cys Cys Asn Glu Met Asp Ile Leu Glu
    210                 215                 220
Ala Asn Ser Arg Ala Asn Ala Met Thr Pro His Pro Cys Ala Asn Gly
225                 230                 235                 240
Ser Cys Asp Lys Ser Gly Cys Gly Leu Asn Pro Tyr Ala Glu Gly Tyr
                245                 250                 255
Lys Ser Tyr Tyr Gly Pro Gly Leu Thr Val Asp Thr Ser Lys Pro Phe
            260                 265                 270
Thr Ile Ile Thr Arg Phe Ile Thr Asp Asp Gly Thr Thr Ser Gly Thr
        275                 280                 285
Leu Asn Gln Ile Gln Arg Ile Tyr Val Gln Asn Gly Lys Thr Val Ala
    290                 295                 300
Ser Ala Ala Ser Gly Gly Asp Ile Ile Thr Ala Ser Gly Cys Thr Ser
305                 310                 315                 320
Ala Gln Ala Phe Gly Gly Leu Ala Asn Met Gly Ala Ala Leu Gly Arg
                325                 330                 335
Gly Met Val Leu Thr Phe Ser Ile Trp Asn Asp Ala Gly Gly Tyr Met
            340                 345                 350
Asn Trp Leu Asp Ser Gly Asn Asn Gly Pro Cys Ser Ser Thr Glu Gly
        355                 360                 365
Asn Pro Ser Asn Ile Leu Ala Asn Tyr Pro Asp Thr His Val Val Phe
    370                 375                 380
Ser Asn Ile Arg Trp Gly Asp Ile Gly Ser Thr Val Gln Val Ser Gly
385                 390                 395                 400
Gly Gly Asn Gly Gly Ser Thr Thr Thr Thr Ser Thr Thr Thr Leu Arg
                405                 410                 415
Thr Ser Thr Thr Thr Thr Thr Thr Ala Pro Thr Ala Thr Ala Thr His
            420                 425                 430
Trp Gly Gln Cys Gly Gly Ile Gly Trp Thr Gly Pro Thr Val Cys Glu
        435                 440                 445
Ser Pro Tyr Ala Cys Lys Glu Leu Asn Pro Trp Tyr Tyr Gln Cys Leu
    450                 455                 460
<210>43
<211>1368
<212>DNA
<213>土生梭孢霉(Thielavia terrestris)
<400>43
accgatccgc tcgaagatgg cgcccaagtc tacagttctg gccgcctggc tgctctcctc     60
gctggccgcg gcccagcaga tcggcaaagc cgtgcccgag gtccacccca aactgacaac    120
gcagaagtgc actctccgcg gcgggtgcaa gcctgtccgc acctcggtcg tgctcgactc    180
gtccgcgcgc tcgctgcaca aggtcgggga ccccaacacc agctgcagcg tcggcggcga    240
cctgtgctcg gacgcgaagt cgtgcggcaa gaactgcgcg ctcgagggcg tcgactacgc    300
ggcccacggc gtggcgacca agggcgacgc cctcacgctg caccagtggc tcaagggggc    360
cgacggcacc tacaggaccg tctcgccgcg cgtatacctc ctgggcgagg acgggaagaa    420
ctacgaggac ttcaagctgc tcaacgccga gctcagcttc gacgtcgacg tgtcccagct    480
cgtctgcggc atgaacggcg ccctgtactt ctccgagatg gagatggacg gcggccgcag    540
cccgctgaac ccggcgggcg ccacgtacgg cacgggctac tgcgacgcgc agtgccccaa    600
gttggacttt atcaacggcg aggtatttct tctctcttct gtttttcttt tccatcgctt    660
tttctgaccg gaatccgccc tcttagctca acaccaacca cacgtacggg gcgtgctgca    720
acgagatgga catctgggag gccaacgcgc tggcgcaggc gctcacgccg cacccgtgca    780
acgcgacgcg ggtgtacaag tgcgacacgg cggacgagtg cgggcagccg gtgggcgtgt    840
gcgacgaatg ggggtgctcg tacaacccgt ccaacttcgg ggtcaaggac tactacgggc    900
gcaacctgac ggtggacacg aaccgcaagt tcacggtgac gacgcagttc gtgacgtcca    960
acgggcgggc ggacggcgag ctgaccgaga tccggcggct gtacgtgcag gacggcgtgg   1020
tgatccagaa ccacgcggtc acggcgggcg gggcgacgta cgacagcatc acggacggct   1080
tctgcaacgc gacggccacc tggacgcagc agcggggcgg gctcgcgcgc atgggcgagg   1140
ccatcggccg cggcatggtg ctcatcttca gcctgtgggt tgacaacggc ggcttcatga   1200
actggctcga cagcggcaac gccgggccct gcaacgccac cgagggcgac ccggccctga   1260
tcctgcagca gcacccggac gccagcgtca ccttctccaa catccgatgg ggcgagatcg   1320
gcagcacgta caagagcgag tgcagccact agagtagagc ttgtaatt                1368
<210>44
<211>423
<212>PRT
<213>土生梭孢霉(Thielavia terrestris)
<400>44
Met Ala Pro Lys Ser Thr Val Leu Ala Ala Trp Leu Leu Ser Ser Leu
1               5                   10                  15
Ala Ala Ala Gln Gln Ile Gly Lys Ala Val Pro Glu Val His Pro Lys
            20                  25                  30
Leu Thr Thr Gln Lys Cys Thr Leu Arg Gly Gly Cys Lys Pro Val Arg
        35                  40                  45
Thr Ser Val Val Leu Asp Ser Ser Ala Arg Ser Leu His Lys Val Gly
    50                  55                  60
Asp Pro Asn Thr Ser Cys Ser Val Gly Gly Asp Leu Cys Ser Asp Ala
65                  70                  75                  80
Lys Ser Cys Gly Lys Asn Cys Ala Leu Glu Gly Val Asp Tyr Ala Ala
                85                  90                  95
His Gly Val Ala Thr Lys Gly Asp Ala Leu Thr Leu His Gln Trp Leu
            100                 105                 110
Lys Gly Ala Asp Gly Thr Tyr Arg Thr Val Ser Pro Arg Val Tyr Leu
        115                 120                 125
Leu Gly Glu Asp Gly Lys Asn Tyr Glu Asp Phe Lys Leu Leu Asn Ala
    130                 135                 140
Glu Leu Ser Phe Asp Val Asp Val Ser Gln Leu Val Cys Gly Met Asn
145                 150                 155                 160
Gly Ala Leu Tyr Phe Ser Glu Met Glu Met Asp Gly Gly Arg Ser Pro
                165                 170                 175
Leu Asn Pro Ala Gly Ala Thr Tyr Gly Thr Gly Tyr Cys Asp Ala Gln
            180                 185                 190
Cys Pro Lys Leu Asp Phe Ile Asn Gly Glu Leu Asn Thr Asn His Thr
        195                 200                 205
Tyr Gly Ala Cys Cys Asn Glu Met Asp Ile Trp Glu Ala Asn Ala Leu
    210                 215                 220
Ala Gln Ala Leu Thr Pro His Pro Cys Asn Ala Thr Arg Val Tyr Lys
225                 230                 235                 240
Cys Asp Thr Ala Asp Glu Cys Gly Gln Pro Val Gly Val Cys Asp Glu
                245                 250                 255
Trp Gly Cys Ser Tyr Asn Pro Ser Asn Phe Gly Val Lys Asp Tyr Tyr
            260                 265                 270
Gly Arg Asn Leu Thr Val Asp Thr Asn Arg Lys Phe Thr Val Thr Thr
        275                 280                 285
Gln Phe Val Thr Ser Asn Gly Arg Ala Asp Gly Glu Leu Thr Glu Ile
    290                 295                 300
Arg Arg Leu Tyr Val Gln Asp Gly Val Val Ile Gln Asn His Ala Val
305                 310                 315                 320
Thr Ala Gly Gly Ala Thr Tyr Asp Ser Ile Thr Asp Gly Phe Cys Asn
                325                 330                 335
Ala Thr Ala Thr Trp Thr Gln Gln Arg Gly Gly Leu Ala Arg Met Gly
            340                 345                 350
Glu Ala Ile Gly Arg Gly Met Val Leu Ile Phe Ser Leu Trp Val Asp
        355                 360                 365
Asn Gly Gly Phe Met Asn Trp Leu Asp Ser Gly Asn Ala Gly Pro Cys
    370                 375                 380
Asn Ala Thr Glu Gly Asp Pro Ala Leu Ile Leu Gln Gln His Pro Asp
385                 390                 395                 400
Ala Ser Val Thr Phe Ser Asn Ile Arg Trp Gly Glu Ile Gly Ser Thr
                405                 410                 415
Tyr Lys Ser Glu Cys Ser His
            420
<210>45
<211>1011
<212>DNA
<213>土生梭孢霉(Thielavia terrestris)
<400>45
atgaccctac ggctccctgt catcagcctg ctggcctcgc tggcagcagg cgccgtcgtc     60
gtcccacggg cggagtttca cccccctctc ccgacttgga aatgcacgac ctccgggggc    120
tgcgtgcagc agaacaccag cgtcgtcctg gaccgtgact cgaagtacgc cgcacacagc    180
gccggctcgc ggacggaatc ggattacgcg gcaatgggag tgtccacttc gggcaatgcc    240
gtgacgctgt accactacgt caagaccaac ggcaccctcg tccccgcttc gccgcgcatc    300
tacctcctgg gcgcggacgg caagtacgtg cttatggacc tcctcaacca ggagctgtcg    360
gtggacgtcg acttctcggc gctgccgtgc ggcgagaacg gggccttcta cctgtccgag    420
atggcggcgg acgggcgggg cgacgcgggg gcgggcgacg ggtactgcga cgcgcagtgc    480
cagggctact gctgcaacga gatggacatc ctcgaggcca actcgatggc gacggccatg    540
acgccgcacc cgtgcaaggg caacaactgc gaccgcagcg gctgcggcta caacccgtac    600
gccagcggcc agcgcggctt ctacgggccc ggcaagacgg tcgacacgag caagcccttc    660
accgtcgtca cgcagttcgc cgccagcggc ggcaagctga cccagatcac ccgcaagtac    720
atccagaacg gccgggagat cggcggcggc ggcaccatct ccagctgcgg ctccgagtct    780
tcgacgggcg gcctgaccgg catgggcgag gcgctggggc gcggaatggt gctggccatg    840
agcatctgga acgacgcggc ccaggagatg gcatggctcg atgccggcaa caacggccct    900
tgcgccagtg gccagggcag cccgtccgtc attcagtcgc agcatcccga cacccacgtc    960
gtcttctcca acatcaggtg gggcgacatc gggtctacca cgaagaacta g            1011
<210>46
<211>336
<212>PRT
<213>土生梭孢霉(Thielavia terrestris)
<400>46
Met Thr Leu Arg Leu Pro Val Ile Ser Leu Leu Ala Ser Leu Ala Ala
1               5                   10                  15
Gly Ala Val Val Val Pro Arg Ala Glu Phe His Pro Pro Leu Pro Thr
            20                  25                  30
Trp Lys Cys Thr Thr Ser Gly Gly Cys Val Gln Gln Asn Thr Ser Val
        35                  40                  45
Val Leu Asp Arg Asp Ser Lys Tyr Ala Ala His Ser Ala Gly Ser Arg
    50                  55                  60
Thr Glu Ser Asp Tyr Ala Ala Met Gly Val Ser Thr Ser Gly Asn Ala
65                  70                  75                  80
Val Thr Leu Tyr His Tyr Val Lys Thr Asn Gly Thr Leu Val Pro Ala
                85                  90                  95
Ser Pro Arg Ile Tyr Leu Leu Gly Ala Asp Gly Lys Tyr Val Leu Met
            100                 105                 110
Asp Leu Leu Asn Gln Glu Leu Ser Val Asp Val Asp Phe Ser Ala Leu
        115                 120                 125
Pro Cys Gly Glu Asn Gly Ala Phe Tyr Leu Ser Glu Met Ala Ala Asp
    130                 135                 140
Gly Arg Gly Asp Ala Gly Ala Gly Asp Gly Tyr Cys Asp Ala Gln Cys
145                 150                 155                 160
Gln Gly Tyr Cys Cys Asn Glu Met Asp Ile Leu Glu Ala Asn Ser Met
                165                 170                 175
Ala Thr Ala Met Thr Pro His Pro Cys Lys Gly Asn Asn Cys Asp Arg
            180                 185                 190
Ser Gly Cys Gly Tyr Asn Pro Tyr Ala Ser Gly Gln Arg Gly Phe Tyr
        195                 200                 205
Gly Pro Gly Lys Thr Val Asp Thr Ser Lys Pro Phe Thr Val Val Thr
    210                 215                 220
Gln Phe Ala Ala Ser Gly Gly Lys Leu Thr Gln Ile Thr Arg Lys Tyr
225                 230                 235                 240
Ile Gln Asn Gly Arg Glu Ile Gly Gly Gly Gly Thr Ile Ser Ser Cys
                245                 250                 255
Gly Ser Glu Ser Ser Thr Gly Gly Leu Thr Gly Met Gly Glu Ala Leu
            260                 265                 270
Gly Arg Gly Met Val Leu Ala Met Ser Ile Trp Asn Asp Ala Ala Gln
        275                 280                 285
Glu Met Ala Trp Leu Asp Ala Gly Asn Asn Gly Pro Cys Ala Ser Gly
    290                 295                 300
Gln Gly Ser Pro Ser Val Ile Gln Ser Gln His Pro Asp Thr His Val
305                 310                 315                 320
Val Phe Ser Asn Ile Arg Trp Gly Asp Ile Gly Ser Thr Thr Lys Asn
                325                 330                 335
<210>47
<211>1480
<212>DNA
<213>Cladorrhinum foecundissimum
<400>47
gatccgaatt cctcctctcg ttctttagtc acagaccaga catctgccca cgatggttca     60
caagttcgcc ctcctcaccg gcctcgccgc ctccctcgca tctgcccagc agatcggcac    120
cgtcgtcccc gagtctcacc ccaagcttcc caccaagcgc tgcactctcg ccggtggctg    180
ccagaccgtc gacacctcca tcgtcatcga cgccttccag cgtcccctcc acaagatcgg    240
cgacccttcc actccttgcg tcgtcggcgg ccctctctgc cccgacgcca agtcctgcgc    300
tgagaactgc gcgctcgagg gtgtcgacta tgcctcctgg ggcatcaaga ccgagggcga    360
cgccctaact ctcaaccagt ggatgcccga cccggcgaac cctggccagt acaagacgac    420
tactccccgt acttaccttg ttgctgagga cggcaagaac tacgaggatg tgaagctcct    480
ggctaaggag atctcgtttg atgccgatgt cagcaacctt ccctgcggca tgaacggtgc    540
tttctacttg tctgagatgt tgatggatgg tggacgtggc gacctcaacc ctgctggtgc    600
cgagtatggt accggttact gtgatgcgca gtgcttcaag ttggatttca tcaacggcga    660
ggccaacatc gaccaaaagc acggcgcctg ctgcaacgaa atggacattt tcgaatccaa    720
ctcgcgcgcc aagaccttcg tcccccaccc ctgcaacatc acgcaggtct acaagtgcga    780
aggcgaagac gagtgcggcc agcccgtcgg cgtgtgcgac aagtgggggt gcggcttcaa    840
cgagtacaaa tggggcgtcg agtccttcta cggccggggc tcgcagttcg ccatcgactc    900
ctccaagaag ttcaccgtca ccacgcagtt cctgaccgac aacggcaagg aggacggcgt    960
cctcgtcgag atccgccgct tgtggcacca ggatggcaag ctgatcaaga acaccgctat   1020
ccaggttgag gagaactaca gcacggactc ggtgagcacc gagttctgcg agaagactgc    1080
ttctttcacc atgcagcgcg gtggtctcaa ggcgatgggc gaggctatcg gtcgtggtat    1140
ggtgctggtt ttcagcatct gggcggatga ttcgggtttt atgaactggt tggatgcgga    1200
gggtaatggc ccttgcagcg cgactgaggg cgatccgaag gagattgtca agaataagcc    1260
ggatgctagg gttacgttct caaacattag gattggtgag gttggtagca cgtatgctcc    1320
gggtgggaag tgcggtgtta agagcagggt tgctaggggg cttactgctt cttaaggggg    1380
gtgtgaagag aggaggaggt gttgttgggg gttggagatg ataattgggc gagatggtgt    1440
agagcgggtt ggttggatat gaatacgttg aattggatgt                          1480
<210>48
<211>440
<212>PRT
<213>Cladorrhinum foecundissimum
<400>48
Met Val His Lys Phe Ala Leu Leu Thr Gly Leu Ala Ala Ser Leu Ala
1               5                   10                  15
Ser Ala Gln Gln Ile Gly Thr Val Val Pro Glu Ser His Pro Lys Leu
            20                  25                  30
Pro Thr Lys Arg Cys Thr Leu Ala Gly Gly Cys Gln Thr Val Asp Thr
        35                  40                  45
Ser Ile Val Ile Asp Ala Phe Gln Arg Pro Leu His Lys Ile Gly Asp
    50                  55                  60
Pro Ser Thr Pro Cys Val Val Gly Gly Pro Leu Cys Pro Asp Ala Lys
65                  70                  75                  80
Ser Cys Ala Glu Asn Cys Ala Leu Glu Gly Val Asp Tyr Ala Ser Trp
                85                  90                  95
Gly Ile Lys Thr Glu Gly Asp Ala Leu Thr Leu Asn Gln Trp Met Pro
            100                 105                 110
Asp Pro Ala Asn Pro Gly Gln Tyr Lys Thr Thr Thr Pro Arg Thr Tyr
        115                 120                 125
Leu Val Ala Glu Asp Gly Lys Asn Tyr Glu Asp Val Lys Leu Leu Ala
    130                 135                 140
Lys Glu Ile Ser Phe Asp Ala Asp Val Ser Asn Leu Pro Cys Gly Met
145                 150                 155                 160
Asn Gly Ala Phe Tyr Leu Ser Glu Met Leu Met Asp Gly Gly Arg Gly
                165                 170                 175
Asp Leu Asn Pro Ala Gly Ala Glu Tyr Gly Thr Gly Tyr Cys Asp Ala
            180                 185                 190
Gln Cys Phe Lys Leu Asp Phe Ile Asn Gly Glu Ala Asn Ile Asp Gln
        195                 200                 205
Lys His Gly Ala Cys Cys Asn Glu Met Asp Ile Phe Glu Ser Asn Ser
    210                 215                 220
Arg Ala Lys Thr Phe Val Pro His Pro Cys Asn Ile Thr Gln Val Tyr
225                 230                 235                 240
Lys Cys Glu Gly Glu Asp Glu Cys Gly Gln Pro Val Gly Val Cys Asp
                245                 250                 255
Lys Trp Gly Cys Gly Phe Asn Glu Tyr Lys Trp Gly Val Glu Ser Phe
            260                 265                 270
Tyr Gly Arg Gly Ser Gln Phe Ala Ile Asp Ser Ser Lys Lys Phe Thr
        275                 280                 285
Val Thr Thr Gln Phe Leu Thr Asp Asn Gly Lys Glu Asp Gly Val Leu
    290                 295                 300
Val Glu Ile Arg Arg Leu Trp His Gln Asp Gly Lys Leu Ile Lys Asn
305                 310                 315                 320
Thr Ala Ile Gln Val Glu Glu Asn Tyr Ser Thr Asp Ser Val Ser Thr
                325                 330                 335
Glu Phe Cys Glu Lys Thr Ala Ser Phe Thr Met Gln Arg Gly Gly Leu
            340                 345                 350
Lys Ala Met Gly Glu Ala Ile Gly Arg Gly Met Val Leu Val Phe Ser
        355                 360                 365
Ile Trp Ala Asp Asp Ser Gly Phe Met Asn Trp Leu Asp Ala Glu Gly
    370                 375                 380
Asn Gly Pro Cys Ser Ala Thr Glu Gly Asp Pro Lys Glu Ile Val Lys
385                 390                 395                 400
Asn Lys Pro Asp Ala Arg Val Thr Phe Ser Asn Ile Arg Ile Gly Glu
                405                 410                 415
Val Gly Ser Thr Tyr Ala Pro Gly Gly Lys Cys Gly Val Lys Ser Arg
            420                 425                 430
Val Ala Arg Gly Leu Thr Ala Ser
        435                 440
<210>49
<211>1380
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>49
atggcgccct cagttacact gccgttgacc acggccatcc tggccattgc ccggctcgtc     60
gccgcccagc aaccgggtac cagcaccccc gaggtccatc ccaagttgac aacctacaag    120
tgtacaaagt ccggggggtg cgtggcccag gacacctcgg tggtccttga ctggaactac    180
cgctggatgc acgacgcaaa ctacaactcg tgcaccgtca acggcggcgt caacaccacg    240
ctctgccctg acgaggcgac ctgtggcaag aactgcttca tcgagggcgt cgactacgcc    300
gcctcgggcg tcacgacctc gggcagcagc ctcaccatga accagtacat gcccagcagc    360
tctggcggct acagcagcgt ctctcctcgg ctgtatctcc tggactctga cggtgagtac    420
gtgatgctga agctcaacgg ccaggagctg agcttcgacg tcgacctctc tgctctgccg    480
tgtggagaga acggctcgct ctacctgtct cagatggacg agaacggggg cgccaaccag    540
tataacacgg ccggtgccaa ctacgggagc ggctactgcg atgctcagtg ccccgtccag    600
acatggagga acggcaccct caacactagc caccagggct tctgctgcaa cgagatggat    660
atcctggagg gcaactcgag ggcgaatgcc ttgacccctc actcttgcac ggccacggcc    720
tgcgactctg ccggttgcgg cttcaacccc tatggcagcg gctacaaaag ctactacggc    780
cccggagata ccgttgacac ctccaagacc ttcaccatca tcacccagtt caacacggac    840
aacggctcgc cctcgggcaa ccttgtgagc atcacccgca agtaccagca aaacggcgtc    900
gacatcccca gcgcccagcc cggcggcgac accatctcgt cctgcccgtc cgcctcagcc     960
tacggcggcc tcgccaccat gggcaaggcc ctgagcagcg gcatggtgct cgtgttcagc    1020
atttggaacg acaacagcca gtacatgaac tggctcgaca gcggcaacgc cggcccctgc    1080
agcagcaccg agggcaaccc atccaacatc ctggccaaca accccaacac gcacgtcgtc    1140
ttctccaaca tccgctgggg agacattggg tctactacga actcgactgc gcccccgccc    1200
ccgcctgcgt ccagcacgac gttttcgact acacggagga gctcgacgac ttcgagcagc    1260
ccgagctgca cgcagactca ctgggggcag tgcggtggca ttgggtacag cgggtgcaag    1320
acgtgcacgt cgggcactac gtgccagtat agcaacgact actactcgca atgcctttag    1380
<210>50
<211>459
<212>PRT
<213>里氏木霉(Trichoderma reesei)
<400>50
Met Ala Pro Ser Val Thr Leu Pro Leu Thr Thr Ala Ile Leu Ala Ile
1               5                   10                  15
Ala Arg Leu Val Ala Ala Gln Gln Pro Gly Thr Ser Thr Pro Glu Val
            20                  25                  30
His Pro Lys Leu Thr Thr Tyr Lys Cys Thr Lys Ser Gly Gly Cys Val
        35                  40                  45
Ala Gln Asp Thr Ser Val Val Leu Asp Trp Asn Tyr Arg Trp Met His
    50                  55                  60
Asp Ala Asn Tyr Asn Ser Cys Thr Val Asn Gly Gly Val Asn Thr Thr
65                  70                  75                  80
Leu Cys Pro Asp Glu Ala Thr Cys Gly Lys Asn Cys Phe Ile Glu Gly
                85                  90                  95
Val Asp Tyr Ala Ala Ser Gly Val Thr Thr Ser Gly Ser Ser Leu Thr
            100                 105                 110
Met Asn Gln Tyr Met Pro Ser Ser Ser Gly Gly Tyr Ser Ser Val Ser
        115                 120                 125
Pro Arg Leu Tyr Leu Leu Asp Ser Asp Gly Glu Tyr Val Met Leu Lys
    130                 135                 140
Leu Asn Gly Gln Glu Leu Ser Phe Asp Val Asp Leu Ser Ala Leu Pro
145                 150                 155                 160
Cys Gly Glu Asn Gly Ser Leu Tyr Leu Ser Gln Met Asp Glu Asn Gly
                165                 170                 175
Gly Ala Asn Gln Tyr Asn Thr Ala Gly Ala Asn Tyr Gly Ser Gly Tyr
            180                 185                 190
Cys Asp Ala Gln Cys Pro Val Gln Thr Trp Arg Asn Gly Thr Leu Asn
        195                 200                 205
Thr Ser His Gln Gly Phe Cys Cys Asn Glu Met Asp Ile Leu Glu Gly
    210                 215                 220
Asn Ser Arg Ala Asn Ala Leu Thr Pro His Ser Cys Thr Ala Thr Ala
225                 230                 235                 240
Cys Asp Ser Ala Gly Cys Gly Phe Asn Pro Tyr Gly Ser Gly Tyr Lys
                245                 250                 255
Ser Tyr Tyr Gly Pro Gly Asp Thr Val Asp Thr Ser Lys Thr Phe Thr
            260                 265                 270
Ile Ile Thr Gln Phe Asn Thr Asp Asn Gly Ser Pro Ser Gly Asn Leu
        275                 280                 285
Val Ser Ile Thr Arg Lys Tyr Gln Gln Asn Gly Val Asp Ile Pro Ser
    290                 295                 300
Ala Gln Pro Gly Gly Asp Thr Ile Ser Ser Cys Pro Ser Ala Ser Ala
305                 310                 315                 320
Tyr Gly Gly Leu Ala Thr Met Gly Lys Ala Leu Ser Ser Gly Met Val
                325                 330                 335
Leu Val Phe Ser Ile Trp Asn Asp Asn Ser Gln Tyr Met Asn Trp Leu
            340                 345                 350
Asp Ser Gly Asn Ala Gly Pro Cys Ser Ser Thr Glu Gly Asn Pro Ser
        355                 360                 365
Asn Ile Leu Ala Asn Asn Pro Asn Thr His Val Val Phe Ser Asn Ile
    370                 375                 380
Arg Trp Gly Asp Ile Gly Ser Thr Thr Asn Ser Thr Ala Pro Pro Pro
385                 390                 395                 400
Pro Pro Ala Ser Ser Thr Thr Phe Ser Thr Thr Arg Arg Ser Ser Thr
                405                 410                 415
Thr Ser Ser Ser Pro Ser Cys Thr Gln Thr His Trp Gly Gln Cys Gly
            420                 425                 430
Gly Ile Gly Tyr Ser Gly Cys Lys Thr Cys Thr Ser Gly Thr Thr Cys
        435                 440                 445
Gln Tyr Ser Asn Asp Tyr Tyr Ser Gln Cys Leu
    450                 455
<210>51
<211>1542
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>51
atgtatcgga agttggccgt catctcggcc ttcttggcca cagctcgtgc tcagtcggcc     60
tgcactctcc aatcggagac tcacccgcct ctgacatggc agaaatgctc gtctggtggc    120
acgtgcactc aacagacagg ctccgtggtc atcgacgcca actggcgctg gactcacgct    180
acgaacagca gcacgaactg ctacgatggc aacacttgga gctcgaccct atgtcctgac    240
aacgagacct gcgcgaagaa ctgctgtctg gacggtgccg cctacgcgtc cacgtacgga    300
gttaccacga gcggtaacag cctctccatt ggctttgtca cccagtctgc gcagaagaac    360
gttggcgctc gcctttacct tatggcgagc gacacgacct accaggaatt caccctgctt    420
ggcaacgagt tctctttcga tgttgatgtt tcgcagctgc cgtgcggctt gaacggagct    480
ctctacttcg tgtccatgga cgcggatggt ggcgtgagca agtatcccac caacaccgct    540
ggcgccaagt acggcacggg gtactgtgac agccagtgtc cccgcgatct gaagttcatc    600
aatggccagg ccaacgttga gggctgggag ccgtcatcca acaacgcgaa cacgggcatt    660
ggaggacacg gaagctgctg ctctgagatg gatatctggg aggccaactc catctccgag    720
gctcttaccc cccacccttg cacgactgtc ggccaggaga tctgcgaggg tgatgggtgc    780
ggcggaactt actccgataa cagatatggc ggcacttgcg atcccgatgg ctgcgactgg    840
aacccatacc gcctgggcaa caccagcttc tacggccctg gctcaagctt taccctcgat     900
accaccaaga aattgaccgt tgtcacccag ttcgagacgt cgggtgccat caaccgatac     960
tatgtccaga atggcgtcac tttccagcag cccaacgccg agcttggtag ttactctggc    1020
aacgagctca acgatgatta ctgcacagct gaggaggcag aattcggcgg atcctctttc    1080
tcagacaagg gcggcctgac tcagttcaag aaggctacct ctggcggcat ggttctggtc    1140
atgagtctgt gggatgatta ctacgccaac atgctgtggc tggactccac ctacccgaca    1200
aacgagacct cctccacacc cggtgccgtg cgcggaagct gctccaccag ctccggtgtc    1260
cctgctcagg tcgaatctca gtctcccaac gccaaggtca ccttctccaa catcaagttc    1320
ggacccattg gcagcaccgg caaccctagc ggcggcaacc ctcccggcgg aaacccgcct    1380
ggcaccacca ccacccgccg cccagccact accactggaa gctctcccgg acctacccag    1440
tctcactacg gccagtgcgg cggtattggc tacagcggcc ccacggtctg cgccagcggc    1500
acaacttgcc aggtcctgaa cccttactac tctcagtgcc tg                       1542
<210>52
<211>514
<212>PRT
<213>里氏木霉(Trichoderma reesei)
<400>52
Met Tyr Arg Lys Leu Ala Val Ile Ser Ala Phe Leu Ala Thr Ala Arg
1               5                   10                  15
Ala Gln Ser Ala Cys Thr Leu Gln Ser Glu Thr His Pro Pro Leu Thr
            20                  25                  30
Trp Gln Lys Cys Ser Ser Gly Gly Thr Cys Thr Gln Gln Thr Gly Ser
        35                  40                  45
Val Val Ile Asp Ala Asn Trp Arg Trp Thr His Ala Thr Asn Ser Ser
    50                  55                  60
Thr Asn Cys Tyr Asp Gly Asn Thr Trp Ser Ser Thr Leu Cys Pro Asp
65                  70                  75                  80
Asn Glu Thr Cys Ala Lys Asn Cys Cys Leu Asp Gly Ala Ala Tyr Ala
                85                  90                  95
Ser Thr Tyr Gly Val Thr Thr Ser Gly Asn Ser Leu Ser Ile Gly Phe
            100                 105                 110
Val Thr Gln Ser Ala Gln Lys Asn Val Gly Ala Arg Leu Tyr Leu Met
        115                 120                 125
Ala Ser Asp Thr Thr Tyr Gln Glu Phe Thr Leu Leu Gly Asn Glu Phe
    130                 135                 140
Ser Phe Asp Val Asp Val Ser Gln Leu Pro Cys Gly Leu Asn Gly Ala
145                 150                 155                 160
Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Val Ser Lys Tyr Pro
                165                 170                 175
Thr Asn Thr Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln
            180                 185                 190
Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Glu Gly
        195                 200                 205
Trp Glu Pro Ser Ser Asn Asn Ala Asn Thr Gly Ile Gly Gly His Gly
    210                 215                 220
Ser Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Ser Ile Ser Glu
225                 230                 235                 240
Ala Leu Thr Pro His Pro Cys Thr Thr Val Gly Gln Glu Ile Cys Glu
                245                 250                 255
Gly Asp Gly Cys Gly Gly Thr Tyr Ser Asp Asn Arg Tyr Gly Gly Thr
            260                 265                 270
Cys Asp Pro Asp Gly Cys Asp Trp Asn Pro Tyr Arg Leu Gly Asn Thr
        275                 280                 285
Ser Phe Tyr Gly Pro Gly Ser Ser Phe Thr Leu Asp Thr Thr Lys Lys
    290                 295                 300
Leu Thr Val Val Thr Gln Phe Glu Thr Ser Gly Ala Ile Asn Arg Tyr
305                 310                 315                 320
Tyr Val Gln Asn Gly Val Thr Phe Gln Gln Pro Asn Ala Glu Leu Gly
                325                 330                 335
Ser Tyr Ser Gly Asn Glu Leu Asn Asp Asp Tyr Cys Thr Ala Glu Glu
            340                 345                 350
Ala Glu Phe Gly Gly Ser Ser Phe Ser Asp Lys Gly Gly Leu Thr Gln
        355                 360                 365
Phe Lys Lys Ala Thr Ser Gly Gly Met Val Leu Val Met Ser Leu Trp
    370                 375                 380
Asp Asp Tyr Tyr Ala Asn Met Leu Trp Leu Asp Ser Thr Tyr Pro Thr
385                 390                 395                 400
Asn Glu Thr Ser Ser Thr Pro Gly Ala Val Arg Gly Ser Cys Ser Thr
                405                 410                 415
Ser Ser Gly Val Pro Ala Gln Val Glu Ser Gln Ser Pro Asn Ala Lys
            420                 425                 430
Val Thr Phe Ser Asn Ile Lys Phe Gly Pro Ile Gly Ser Thr Gly Asn
        435                 440                 445
Pro Ser Gly Gly Asn Pro Pro Gly Gly Asn Pro Pro Gly Thr Thr Thr
    450                 455                 460
Thr Arg Arg Pro Ala Thr Thr Thr Gly Ser Ser Pro Gly Pro Thr Gln
465                 470                 475                 480
Ser His Tyr Gly Gln Cys Gly Gly Ile Gly Tyr Ser Gly Pro Thr Val
                485                 490                 495
Cys Ala Ser Gly Thr Thr Cys Gln Val Leu Asn Pro Tyr Tyr Ser Gln
            500                 505                 510
Cys Leu
<210>53
<211>1413
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>53
atgattgtcg gcattctcac cacgctggct acgctggcca cactcgcagc tagtgtgcct     60
ctagaggagc ggcaagcttg ctcaagcgtc tggggccaat gtggtggcca gaattggtcg    120
ggtccgactt gctgtgcttc cggaagcaca tgcgtctact ccaacgacta ttactcccag    180
tgtcttcccg gcgctgcaag ctcaagctcg tccacgcgcg ccgcgtcgac gacttctcga    240
gtatccccca caacatcccg gtcgagctcc gcgacgcctc cacctggttc tactactacc    300
agagtacctc cagtcggatc gggaaccgct acgtattcag gcaacccttt tgttggggtc    360
actccttggg ccaatgcata ttacgcctct gaagttagca gcctcgctat tcctagcttg    420
actggagcca tggccactgc tgcagcagct gtcgcaaagg ttccctcttt tatgtggcta    480
gatactcttg acaagacccc tctcatggag caaaccttgg ccgacatccg caccgccaac    540
aagaatggcg gtaactatgc cggacagttt gtggtgtatg acttgccgga tcgcgattgc    600
gctgcccttg cctcgaatgg cgaatactct attgccgatg gtggcgtcgc caaatataag    660
aactatatcg acaccattcg tcaaattgtc gtggaatatt ccgatatccg gaccctcctg    720
gttattgagc ctgactctct tgccaacctg gtgaccaacc tcggtactcc aaagtgtgcc    780
aatgctcagt cagcctacct tgagtgcatc aactacgccg tcacacagct gaaccttcca    840
aatgttgcga tgtatttgga cgctggccat gcaggatggc ttggctggcc ggcaaaccaa    900
gacccggccg ctcagctatt tgcaaatgtt tacaagaatg catcgtctcc gagagctctt    960
cgcggattgg caaccaatgt cgccaactac aacgggtgga acattaccag ccccccatcg   1020
tacacgcaag gcaacgctgt ctacaacgag aagctgtaca tccacgctat tggacctctt   1080
cttgccaatc acggctggtc caacgccttc ttcatcactg atcaaggtcg atcgggaaag   1140
cagcctaccg gacagcaaca gtggggagac tggtgcaatg tgatcggcac cggatttggt   1200
attcgcccat ccgcaaacac tggggactcg ttgctggatt cgtttgtctg ggtcaagcca   1260
ggcggcgagt gtgacggcac cagcgacagc agtgcgccac gatttgactc ccactgtgcg   1320
ctcccagatg ccttgcaacc ggcgcctcaa gctggtgctt ggttccaagc ctactttgtg   1380
cagcttctca caaacgcaaa cccatcgttc ctg                                1413
<210>54
<211>471
<212>PRT
<213>里氏木霉(Trichoderma reesei)
<400>54
Met Ile Val Gly Ile Leu Thr Thr Leu Ala Thr Leu Ala Thr Leu Ala
1               5                   10                  15
Ala Ser Val Pro Leu Glu Glu Arg Gln Ala Cys Ser Ser Val Trp Gly
            20                  25                  30
Gln Cys Gly Gly Gln Asn Trp Ser Gly Pro Thr Cys Cys Ala Ser Gly
        35                  40                  45
Ser Thr Cys Val Tyr Ser Asn Asp Tyr Tyr Ser Gln Cys Leu Pro Gly
    50                  55                  60
Ala Ala Ser Ser Ser Ser Ser Thr Arg Ala Ala Ser Thr Thr Ser Arg
65                  70                  75                  80
Val Ser Pro Thr Thr Ser Arg Ser Ser Ser Ala Thr Pro Pro Pro Gly
                85                  90                  95
Ser Thr Thr Thr Arg Val Pro Pro Val Gly Ser Gly Thr Ala Thr Tyr
            100                 105                 110
Ser Gly Asn Pro Phe Val Gly Val Thr Pro Trp Ala Asn Ala Tyr Tyr
        115                 120                 125
Ala Ser Glu Val Ser Ser Leu Ala Ile Pro Ser Leu Thr Gly Ala Met
    130                 135                 140
Ala Thr Ala Ala Ala Ala Val Ala Lys Val Pro Ser Phe Met Trp Leu
145                 150                 155                 160
Asp Thr Leu Asp Lys Thr Pro Leu Met Glu Gln Thr Leu Ala Asp Ile
                165                 170                 175
Arg Thr Ala Asn Lys Asn Gly Gly Asn Tyr Ala Gly Gln Phe Val Val
            180                 185                 190
Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Leu Ala Ser Asn Gly Glu
        195                 200                 205
Tyr Ser Ile Ala Asp Gly Gly Val Ala Lys Tyr Lys Asn Tyr Ile Asp
    210                 215                 220
Thr Ile Arg Gln Ile Val Val Glu Tyr Ser Asp Ile Arg Thr Leu Leu
225                 230                 235                 240
Val Ile Glu Pro Asp Ser Leu Ala Asn Leu Val Thr Asn Leu Gly Thr
                245                 250                 255
Pro Lys Cys Ala Asn Ala Gln Ser Ala Tyr Leu Glu Cys Ile Asn Tyr
            260                 265                 270
Ala Val Thr Gln Leu Asn Leu Pro Asn Val Ala Met Tyr Leu Asp Ala
        275                 280                 285
Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Gln Asp Pro Ala Ala
    290                 295                 300
Gln Leu Phe Ala Asn Val Tyr Lys Asn Ala Ser Ser Pro Arg Ala Leu
305                 310                 315                 320
Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Gly Trp Asn Ile Thr
                325                 330                 335
Ser Pro Pro Ser Tyr Thr Gln Gly Asn Ala Val Tyr Asn Glu Lys Leu
            340                 345                 350
Tyr Ile His Ala Ile Gly Pro Leu Leu Ala Asn His Gly Trp Ser Asn
        355                 360                 365
Ala Phe Phe Ile Thr Asp Gln Gly Arg Ser Gly Lys Gln Pro Thr Gly
    370                 375                 380
Gln Gln Gln Trp Gly Asp Trp Cys Asn Val Ile Gly Thr Gly Phe Gly
385                 390                 395                 400
Ile Arg Pro Ser Ala Asn Thr Gly Asp Ser Leu Leu Asp Ser Phe Val
                405                 410                 415
Trp Val Lys Pro Gly Gly Glu Cys Asp Gly Thr Ser Asp Ser Ser Ala
            420                 425                 430
Pro Arg Phe Asp Ser His Cys Ala Leu Pro Asp Ala Leu Gln Pro Ala
        435                 440                 445
Pro Gln Ala Gly Ala Trp Phe Gln Ala Tyr Phe Val Gln Leu Leu Thr
    450                 455                 460
Asn Ala Asn Pro Ser Phe Leu
465                 470
<210>55
<211>1377
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>55
atggcgccct cagttacact gccgttgacc acggccatcc tggccattgc ccggctcgtc    60
gccgcccagc aaccgggtac cagcaccccc gaggtccatc ccaagttgac aacctacaag    120
tgtacaaagt ccggggggtg cgtggcccag gacacctcgg tggtccttga ctggaactac    180
cgctggatgc acgacgcaaa ctacaactcg tgcaccgtca acggcggcgt caacaccacg    240
ctctgccctg acgaggcgac ctgtggcaag aactgcttca tcgagggcgt cgactacgcc    300
gcctcgggcg tcacgacctc gggcagcagc ctcaccatga accagtacat gcccagcagc    360
tctggcggct acagcagcgt ctctcctcgg ctgtatctcc tggactctga cggtgagtac    420
gtgatgctga agctcaacgg ccaggagctg agcttcgacg tcgacctctc tgctctgccg    480
tgtggagaga acggctcgct ctacctgtct cagatggacg agaacggggg cgccaaccag    540
tataacacgg ccggtgccaa ctacgggagc ggctactgcg atgctcagtg ccccgtccag    600
acatggagga acggcaccct caacactagc caccagggct tctgctgcaa cgagatggat    660
atcctggagg gcaactcgag ggcgaatgcc ttgacccctc actcttgcac ggccacggcc    720
tgcgactctg ccggttgcgg cttcaacccc tatggcagcg gctacaaaag ctactacggc    780
cccggagata ccgttgacac ctccaagacc ttcaccatca tcacccagtt caacacggac    840
aacggctcgc cctcgggcaa ccttgtgagc atcacccgca agtaccagca aaacggcgtc    900
gacatcccca gcgcccagcc cggcggcgac accatctcgt cctgcccgtc cgcctcagcc    960
tacggcggcc tcgccaccat gggcaaggcc ctgagcagcg gcatggtgct cgtgttcagc   1020
atttggaacg acaacagcca gtacatgaac tggctcgaca gcggcaacgc cggcccctgc   1080
agcagcaccg agggcaaccc atccaacatc ctggccaaca accccaacac gcacgtcgtc   1140
ttctccaaca tccgctgggg agacattggg tctactacga actcgactgc gcccccgccc   1200
ccgcctgcgt ccagcacgac gttttcgact acacggagga gctcgacgac ttcgagcagc   1260
ccgagctgca cgcagactca ctgggggcag tgcggtggca ttgggtacag cgggtgcaag   1320
acgtgcacgt cgggcactac gtgccagtat agcaacgact actactcgca atgcctt      1377
<210>56
<211>459
<212>PRT
<213>里氏木霉(Trichoderma reesei)
<400>56
Met Ala Pro Ser Val Thr Leu Pro Leu Thr Thr Ala Ile Leu Ala Ile
1               5                   10                  15
Ala Arg Leu Val Ala Ala Gln Gln Pro Gly Thr Ser Thr Pro Glu Val
            20                  25                  30
His Pro Lys Leu Thr Thr Tyr Lys Cys Thr Lys Ser Gly Gly Cys Val
        35                  40                  45
Ala Gln Asp Thr Ser Val Val Leu Asp Trp Asn Tyr Arg Trp Met His
    50                  55                  60
Asp Ala Asn Tyr Asn Ser Cys Thr Val Asn Gly Gly Val Asn Thr Thr
65                  70                  75                  80
Leu Cys Pro Asp Glu Ala Thr Cys Gly Lys Asn Cys Phe Ile Glu Gly
                85                  90                  95
Val Asp Tyr Ala Ala Ser Gly Val Thr Thr Ser Gly Ser Ser Leu Thr
            100                 105                 110
Met Asn Gln Tyr Met Pro Ser Ser Ser Gly Gly Tyr Ser Ser Val Ser
        115                 120                 125
Pro Arg Leu Tyr Leu Leu Asp Ser Asp Gly Glu Tyr Val Met Leu Lys
    130                 135                 140
Leu Asn Gly Gln Glu Leu Ser Phe Asp Val Asp Leu Ser Ala Leu Pro
145                 150                 155                 160
Cys Gly Glu Asn Gly Ser Leu Tyr Leu Ser Gln Met Asp Glu Asn Gly
                165                 170                 175
Gly Ala Asn Gln Tyr Asn Thr Ala Gly Ala Asn Tyr Gly Ser Gly Tyr
            180                 185                 190
Cys Asp Ala Gln Cys Pro Val Gln Thr Trp Arg Asn Gly Thr Leu Asn
        195                 200                 205
Thr Ser His Gln Gly Phe Cys Cys Asn Glu Met Asp Ile Leu Glu Gly
    210                 215                 220
Asn Ser Arg Ala Asn Ala Leu Thr Pro His Ser Cys Thr Ala Thr Ala
225                 230                 235                 240
Cys Asp Ser Ala Gly Cys Gly Phe Asn Pro Tyr Gly Ser Gly Tyr Lys
                245                 250                 255
Ser Tyr Tyr Gly Pro Gly Asp Thr Val Asp Thr Ser Lys Thr Phe Thr
            260                 265                 270
Ile Ile Thr Gln Phe Asn Thr Asp Asn Gly Ser Pro Ser Gly Asn Leu
        275                 280                 285
Val Ser Ile Thr Arg Lys Tyr Gln Gln Asn Gly Val Asp Ile Pro Ser
    290                 295                 300
Ala Gln Pro Gly Gly Asp Thr Ile Ser Ser Cys Pro Ser Ala Ser Ala
305                 310                 315                 320
Tyr Gly Gly Leu Ala Thr Met Gly Lys Ala Leu Ser Ser Gly Met Val
                325                 330                 335
Leu Val Phe Ser Ile Trp Asn Asp Asn Ser Gln Tyr Met Asn Trp Leu
            340                 345                 350
Asp Ser Gly Asn Ala Gly Pro Cys Ser Ser Thr Glu Gly Asn Pro Ser
        355                 360                 365
Asn Ile Leu Ala Asn Asn Pro Asn Thr His Val Val Phe Ser Asn Ile
    370                 375                 380
Arg Trp Gly Asp Ile Gly Ser Thr Thr Asn Ser Thr Ala Pro Pro Pro
385                 390                 395                 400
Pro Pro Ala Ser Ser Thr Thr Phe Ser Thr Thr Arg Arg Ser Ser Thr
                405                 410                 415
Thr Ser Ser Ser Pro Ser Cys Thr Gln Thr His Trp Gly Gln Cys Gly
            420                 425                 430
Gly Ile Gly Tyr Ser Gly Cys Lys Thr Cys Thr Ser Gly Thr Thr Cys
        435                 440                 445
Gln Tyr Ser Asn Asp Tyr Tyr Ser Gln Cys Leu
    450                 455
<210>57
<211>1254
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>57
atgaacaagt ccgtggctcc attgctgctt gcagcgtcca tactatatgg cggcgccgtc     60
gcacagcaga ctgtctgggg ccagtgtgga ggtattggtt ggagcggacc tacgaattgt    120
gctcctggct cagcttgttc gaccctcaat ccttattatg cgcaatgtat tccgggagcc    180
actactatca ccacttcgac ccggccacca tccggtccaa ccaccaccac cagggctacc    240
tcaacaagct catcaactcc acccacgagc tctggggtcc gatttgccgg cgttaacatc    300
gcgggttttg actttggctg taccacagat ggcacttgcg ttacctcgaa ggtttatcct    360
ccgttgaaga acttcaccgg ctcaaacaac taccccgatg gcatcggcca gatgcagcac    420
ttcgtcaacg aggacgggat gactattttc cgcttacctg tcggatggca gtacctcgtc    480
aacaacaatt tgggcggcaa tcttgattcc acgagcattt ccaagtatga tcagcttgtt    540
caggggtgcc tgtctctggg cgcatactgc atcgtcgaca tccacaatta tgctcgatgg    600
aacggtggga tcattggtca gggcggccct actaatgctc aattcacgag cctttggtcg    660
cagttggcat caaagtacgc atctcagtcg agggtgtggt tcggcatcat gaatgagccc    720
cacgacgtga acatcaacac ctgggctgcc acggtccaag aggttgtaac cgcaatccgc    780
aacgctggtg ctacgtcgca attcatctct ttgcctggaa atgattggca atctgctggg    840
gctttcatat ccgatggcag tgcagccgcc ctgtctcaag tcacgaaccc ggatgggtca    900
acaacgaatc tgatttttga cgtgcacaaa tacttggact cagacaactc cggtactcac    960
gccgaatgta ctacaaataa cattgacggc gccttttctc cgcttgccac ttggctccga   1020
cagaacaatc gccaggctat cctgacagaa accggtggtg gcaacgttca gtcctgcata   1080
caagacatgt gccagcaaat ccaatatctc aaccagaact cagatgtcta tcttggctat   1140
gttggttggg gtgccggatc atttgatagc acgtatgtcc tgacggaaac accgactagc   1200
agtggtaact catggacgga cacatccttg gtcagctcgt gtctcgcaag aaag         1254
<210>58
<211>418
<212>PRT
<213>里氏木霉(Trichoderma reesei)
<400>58
Met Asn Lys Ser Val Ala Pro Leu Leu Leu Ala Ala Ser Ile Leu Tyr
1               5                   10                  15
Gly Gly Ala Val Ala Gln Gln Thr Val Trp Gly Gln Cys Gly Gly Ile
            20                  25                  30
Gly Trp Ser Gly Pro Thr Asn Cys Ala Pro Gly Ser Ala Cys Ser Thr
        35                  40                  45
Leu Asn Pro Tyr Tyr Ala Gln Cys Ile Pro Gly Ala Thr Thr Ile Thr
    50                  55                  60
Thr Ser Thr Arg Pro Pro Ser Gly Pro Thr Thr Thr Thr Arg Ala Thr
65                  70                  75                  80
Ser Thr Ser Ser Ser Thr Pro Pro Thr Ser Ser Gly Val Arg Phe Ala
                85                  90                  95
Gly Val Asn Ile Ala Gly Phe Asp Phe Gly Cys Thr Thr Asp Gly Thr
            100                 105                 110
Cys Val Thr Ser Lys Val Tyr Pro Pro Leu Lys Asn Phe Thr Gly Ser
        115                 120                 125
Asn Asn Tyr Pro Asp Gly Ile Gly Gln Met Gln His Phe Val Asn Glu
    130                 135                 140
Asp Gly Met Thr Ile Phe Arg Leu Pro Val Gly Trp Gln Tyr Leu Val
145                 150                 155                 160
Asn Asn Asn Leu Gly Gly Asn Leu Asp Ser Thr Ser Ile Ser Lys Tyr
                165                 170                 175
Asp Gln Leu Val Gln Gly Cys Leu Ser Leu Gly Ala Tyr Cys Ile Val
            180                 185                 190
Asp Ile His Asn Tyr Ala Arg Trp Asn Gly Gly Ile Ile Gly Gln Gly
        195                 200                 205
Gly Pro Thr Asn Ala Gln Phe Thr Ser Leu Trp Ser Gln Leu Ala Ser
    210                 215                 220
Lys Tyr Ala Ser Gln Ser Arg Val Trp Phe Gly Ile Met Asn Glu Pro
225                 230                 235                 240
His Asp Val Asn Ile Asn Thr Trp Ala Ala Thr Val Gln Glu Val Val
                245                 250                 255
Thr Ala Ile Arg Asn Ala Gly Ala Thr Ser Gln Phe Ile Ser Leu Pro
            260                 265                 270
Gly Asn Asp Trp Gln Ser Ala Gly Ala Phe Ile Ser Asp Gly Ser Ala
        275                 280                 285
Ala Ala Leu Ser Gln Val Thr Asn Pro Asp Gly Ser Thr Thr Asn Leu
    290                 295                 300
Ile Phe Asp Val His Lys Tyr Leu Asp Ser Asp Asn Ser Gly Thr His
305                 310                 315                 320
Ala Glu Cys Thr Thr Asn Asn Ile Asp Gly Ala Phe Ser Pro Leu Ala
                325                 330                 335
Thr Trp Leu Arg Gln Asn Asn Arg Gln Ala Ile Leu Thr Glu Thr Gly
            340                 345                 350
Gly Gly Asn Val Gln Ser Cys Ile Gln Asp Met Cys Gln Gln Ile Gln
        355                 360                 365
Tyr Leu Asn Gln Asn Ser Asp Val Tyr Leu Gly Tyr Val Gly Trp Gly
    370                 375                 380
Ala Gly Ser Phe Asp Ser Thr Tyr Val Leu Thr Glu Thr Pro Thr Ser
385                 390                 395                 400
Ser Gly Asn Ser Trp Thr Asp Thr Ser Leu Val Ser Ser Cys Leu Ala
                405                 410                 415
Arg Lys
<210>59
<211>702
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>59
atgaagttcc ttcaagtcct ccctgccctc ataccggccg ccctggccca aaccagctgt     60
gaccagtggg caaccttcac tggcaacggc tacacagtca gcaacaacct ttggggagca    120
tcagccggct ctggatttgg ctgcgtgacg gcggtatcgc tcagcggcgg ggcctcctgg    180
cacgcagact ggcagtggtc cggcggccag aacaacgtca agtcgtacca gaactctcag    240
attgccattc cccagaagag gaccgtcaac agcatcagca gcatgcccac cactgccagc    300
tggagctaca gcgggagcaa catccgcgct aatgttgcgt atgacttgtt caccgcagcc    360
aacccgaatc atgtcacgta ctcgggagac tacgaactca tgatctggct tggcaaatac    420
ggcgatattg ggccgattgg gtcctcacag ggaacagtca acgtcggtgg ccagagctgg    480
acgctctact atggctacaa cggagccatg caagtctatt cctttgtggc ccagaccaac    540
actaccaact acagcggaga tgtcaagaac ttcttcaatt atctccgaga caataaagga    600
tacaacgctg caggccaata tgttcttagc taccaatttg gtaccgagcc cttcacgggc    660
agtggaactc tgaacgtcgc atcctggacc gcatctatca ac                       702
<210>60
<211>234
<212>PRT
<213>里氏木霉(Trichoderma reesei)
<400>60
Met Lys Phe Leu Gln Val Leu Pro Ala Leu Ile Pro Ala Ala Leu Ala
1               5                   10                  15
Gln Thr Ser Cys Asp Gln Trp Ala Thr Phe Thr Gly Asn Gly Tyr Thr
            20                  25                  30
Val Ser Asn Asn Leu Trp Gly Ala Ser Ala Gly Ser Gly Phe Gly Cys
        35                  40                  45
Val Thr Ala Val Ser Leu Ser Gly Gly Ala Ser Trp His Ala Asp Trp
    50                  55                  60
Gln Trp Ser Gly Gly Gln Asn Asn Val Lys Ser Tyr Gln Asn Ser Gln
65                  70                  75                  80
Ile Ala Ile Pro Gln Lys Arg Thr Val Asn Ser Ile Ser Ser Met Pro
                85                  90                  95
Thr Thr Ala Ser Trp Ser Tyr Ser Gly Ser Asn Ile Arg Ala Asn Val
            100                 105                 110
Ala Tyr Asp Leu Phe Thr Ala Ala Asn Pro Asn His Val Thr Tyr Ser
         115                 120                 125
Gly Asp Tyr Glu Leu Met Ile Trp Leu Gly Lys Tyr Gly Asp Ile Gly
    130                 135                 140
Pro Ile Gly Ser Ser Gln Gly Thr Val Asn Val Gly Gly Gln Ser Trp
145                 150                 155                 160
Thr Leu Tyr Tyr Gly Tyr Asn Gly Ala Met Gln Val Tyr Ser Phe Val
                165                 170                 175
Ala Gln Thr Asn Thr Thr Asn Tyr Ser Gly Asp Val Lys Asn Phe Phe
            180                 185                 190
Asn Tyr Leu Arg Asp Asn Lys Gly Tyr Asn Ala Ala Gly Gln Tyr Val
        195                 200                 205
Leu Ser Tyr Gln Phe Gly Thr Glu Pro Phe Thr Gly Ser Gly Thr Leu
    210                 215                 220
Asn Val Ala Ser Trp Thr Ala Ser Ile Asn
225                 230
<210>61
<211>726
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>61
atgaaggcaa ctctggttct cggctccctc attgtaggcg ccgtttccgc gtacaaggcc     60
accaccacgc gctactacga tgggcaggag ggtgcttgcg gatgcggctc gagctccggc    120
gcattcccgt ggcagctcgg catcggcaac ggagtctaca cggctgccgg ctcccaggct    180
ctcttcgaca cggccggagc ttcatggtgc ggcgccggct gcggtaaatg ctaccagctc    240
acctcgacgg gccaggcgcc ctgctccagc tgcggcacgg gcggtgctgc tggccagagc    300
atcatcgtca tggtgaccaa cctgtgcccg aacaatggga acgcgcagtg gtgcccggtg    360
gtcggcggca ccaaccaata cggctacagc taccatttcg acatcatggc gcagaacgag    420
atctttggag acaatgtcgt cgtcgacttt gagcccattg cttgccccgg gcaggctgcc    480
tctgactggg ggacgtgcct ctgcgtggga cagcaagaga cggatcccac gcccgtcctc    540
ggcaacgaca cgggctcaac tcctcccggg agctcgccgc cagcgacatc gtcgagtccg    600
ccgtctggcg gcggccagca gacgctctat ggccagtgtg gaggtgccgg ctggacggga    660
cctacgacgt gccaggcccc agggacctgc aaggttcaga accagtggta ctcccagtgt    720
cttcct                                                               726
<210>62
<211>242
<212>PRT
<213>里氏木霉(Trichoderma reesei)
<400>62
Met Lys Ala Thr Leu Val Leu Gly Ser Leu Ile Val Gly Ala Val Ser
1               5                   10                  15
Ala Tyr Lys Ala Thr Thr Thr Arg Tyr Tyr Asp Gly Gln Glu Gly Ala
            20                  25                  30
Cys Gly Cys Gly Ser Ser Ser Gly Ala Phe Pro Trp Gln Leu Gly Ile
        35                  40                  45
Gly Asn Gly Val Tyr Thr Ala Ala Gly Ser Gln Ala Leu Phe Asp Thr
    50                  55                  60
Ala Gly Ala Ser Trp Cys Gly Ala Gly Cys Gly Lys Cys Tyr Gln Leu
65                  70                  75                  80
Thr Ser Thr Gly Gln Ala Pro Cys Ser Ser Cys Gly Thr Gly Gly Ala
                85                  90                  95
Ala Gly Gln Ser Ile Ile Val Met Val Thr Asn Leu Cys Pro Asn Asn
            100                 105                 110
Gly Asn Ala Gln Trp Cys Pro Val Val Gly Gly Thr Asn Gln Tyr Gly
        115                 120                 125
Tyr Ser Tyr His Phe Asp Ile Met Ala Gln Asn Glu Ile Phe Gly Asp
    130                 135                 140
Asn Val Val Val Asp Phe Glu Pro Ile Ala Cys Pro Gly Gln Ala Ala
145                 150                 155                 160
Ser Asp Trp Gly Thr Cys Leu Cys Val Gly Gln Gln Glu Thr Asp Pro
                165                 170                 175
Thr Pro Val Leu Gly Asn Asp Thr Gly Ser Thr Pro Pro Gly Ser Ser
            180                 185                 190
Pro Pro Ala Thr Ser Ser Ser Pro Pro Ser Gly Gly Gly Gln Gln Thr
        195                 200                 205
Leu Tyr Gly Gln Cys Gly Gly Ala Gly Trp Thr Gly Pro Thr Thr Cys
    210                 215                 220
Gln Ala Pro Gly Thr Cys Lys Val Gln Asn Gln Trp Tyr Ser Gln Cys
225                 230                 235                 240
Leu Pro
<210>63
<211>1446
<212>DNA
<213>土生梭孢霉(Thielavia terrestris)
<400>63
atggctcaga agctccttct cgccgccgcc cttgcggcca gcgccctcgc tgctcccgtc     60
gtcgaggagc gccagaactg cggttccgtc tggagccaat gcggcggcat tggctggtcc    120
ggcgcgacct gctgcgcttc gggcaatacc tgcgttgagc tgaacccgta ctactcgcag    180
tgcctgccca acagccaggt gactacctcg accagcaaga ccacctccac caccaccagg    240
agcagcacca ccagccacag cagcggtccc accagcacga gcaccaccac caccagcagt    300
cccgtggtca ctaccccgcc gagtacctcc atccccggcg gtgcctcgtc aacggccagc    360
tggtccggca acccgttctc gggcgtgcag atgtgggcca acgactacta cgcctccgag    420
gtctcgtcgc tggccatccc cagcatgacg ggcgccatgg ccaccaaggc ggccgaggtg    480
gccaaggtgc ccagcttcca gtggcttgac cgcaacgtca ccatcgacac gctgttcgcc    540
cacacgctgt cgcagatccg cgcggccaac cagaaaggcg ccaacccgcc ctacgcgggc    600
atcttcgtgg tctacgacct tccggaccgc gactgcgccg ccgccgcgtc caacggcgag    660
ttctccatcg cgaacaacgg ggcggccaac tacaagacgt acatcgacgc gatccggagc    720
ctcgtcatcc agtactcaga catccgcatc atcttcgtca tcgagcccga ctcgctggcc    780
aacatggtga ccaacctgaa cgtggccaag tgcgccaacg ccgagtcgac ctacaaggag    840
ttgaccgtct acgcgctgca gcagctgaac ctgcccaacg tggccatgta cctggacgcc    900
ggccacgccg gctggctcgg ctggcccgcc aacatccagc cggccgccaa cctcttcgcc    960
gagatctaca cgagcgccgg caagccggcc gccgtgcgcg gcctcgccac caacgtggcc   1020
aactacaacg gctggagcct ggccacgccg ccctcgtaca cccagggcga ccccaactac   1080
gacgagagcc actacgtcca ggccctcgcc ccgctgctca ccgccaacgg cttccccgcc   1140
cacttcatca ccgacaccgg ccgcaacggc aagcagccga ccggacaacg gcaatgggga   1200
gactggtgca acgttatcgg aactggcttc ggcgtgcgcc cgacgacaaa caccggcctc   1260
gacatcgagg acgccttcgt ctgggtcaag cccggcggcg agtgcgacgg cacgagcaac   1320
acgacctctc cccgctacga ctaccactgc ggcctgtcgg acgcgctgca gcctgctccg   1380
gaggccggca cttggttcca ggcctacttc gagcagctcc tgaccaacgc caacccgccc   1440
ttttaa                                                              1446
<210>64
<211>481
<212>PRT
<213>土生梭孢霉(Thielavia terrestris)
<400>64
Met Ala Gln Lys Leu Leu Leu Ala Ala Ala Leu Ala Ala Ser Ala Leu
1               5                   10                  15
Ala Ala Pro Val Val Glu Glu Arg Gln Asn Cys Gly Ser Val Trp Ser
            20                  25                  30
Gln Cys Gly Gly Ile Gly Trp Ser Gly Ala Thr Cys Cys Ala Ser Gly
        35                  40                  45
Asn Thr Cys Val Glu Leu Asn Pro Tyr Tyr Ser Gln Cys Leu Pro Asn
    50                  55                  60
Ser Gln Val Thr Thr Ser Thr Ser Lys Thr Thr Ser Thr Thr Thr Arg
65                  70                  75                  80
Ser Ser Thr Thr Ser His Ser Ser Gly Pro Thr Ser Thr Ser Thr Thr
                85                  90                  95
Thr Thr Ser Ser Pro Val Val Thr Thr Pro Pro Ser Thr Ser Ile Pro
            100                 105                 110
Gly Gly Ala Ser Ser Thr Ala Ser Trp Ser Gly Asn Pro Phe Ser Gly
        115                 120                 125
Val Gln Met Trp Ala Asn Asp Tyr Tyr Ala Ser Glu Val Ser Ser Leu
    130                 135                 140
Ala Ile Pro Ser Met Thr Gly Ala Met Ala Thr Lys Ala Ala Glu Val
145                 150                 155                 160
Ala Lys Val Pro Ser Phe Gln Trp Leu Asp Arg Asn Val Thr Ile Asp
                165                 170                 175
Thr Leu Phe Ala His Thr Leu Ser Gln Ile Arg Ala Ala Asn Gln Lys
            180                 185                 190
Gly Ala Asn Pro Pro Tyr Ala Gly Ile Phe Val Val Tyr Asp Leu Pro
        195                 200                 205
Asp Arg Asp Cys Ala Ala Ala Ala Ser Asn Gly Glu Phe Ser Ile Ala
    210                 215                 220
Asn Asn Gly Ala Ala Asn Tyr Lys Thr Tyr Ile Asp Ala Ile Arg Ser
225                 230                 235                 240
Leu Val Ile Gln Tyr Ser Asp Ile Arg Ile Ile Phe Val Ile Glu Pro
                245                 250                 255
Asp Ser Leu Ala Asn Met Val Thr Asn Leu Asn Val Ala Lys Cys Ala
            260                 265                 270
Asn Ala Glu Ser Thr Tyr Lys Glu Leu Thr Val Tyr Ala Leu Gln Gln
        275                 280                 285
Leu Asn Leu Pro Asn Val Ala Met Tyr Leu Asp Ala Gly His Ala Gly
    290                 295                 300
Trp Leu Gly Trp Pro Ala Asn Ile Gln Pro Ala Ala Asn Leu Phe Ala
305                 310                 315                 320
Glu Ile Tyr Thr Ser Ala Gly Lys Pro Ala Ala Val Arg Gly Leu Ala
                325                 330                 335
Thr Asn Val Ala Asn Tyr Asn Gly Trp Ser Leu Ala Thr Pro Pro Ser
            340                 345                 350
Tyr Thr Gln Gly Asp Pro Asn Tyr Asp Glu Ser His Tyr Val Gln Ala
        355                 360                 365
Leu Ala Pro Leu Leu Thr Ala Asn Gly Phe Pro Ala His Phe Ile Thr
    370                 375                 380
Asp Thr Gly Arg Asn Gly Lys Gln Pro Thr Gly Gln Arg Gln Trp Gly
385                 390                 395                 400
Asp Trp Cys Asn Val Ile Gly Thr Gly Phe Gly Val Arg Pro Thr Thr
                405                 410                 415
Asn Thr Gly Leu Asp Ile Glu Asp Ala Phe Val Trp Val Lys Pro Gly
            420                 425                 430
Gly Glu Cys Asp Gly Thr Ser Asn Thr Thr Ser Pro Arg Tyr Asp Tyr
        435                 440                 445
His Cys Gly Leu Ser Asp Ala Leu Gln Pro Ala Pro Glu Ala Gly Thr
    450                 455                 460
Trp Phe Gln Ala Tyr Phe Glu Gln Leu Leu Thr Asn Ala Asn Pro Pro
465                 470                 475                 480
Phe
<210>65
<211>29
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>65
aacgttaatt aaggaatcgt tttgtgttt                                             29
<210>66
<211>29
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>66
agtactagta gctccgtggc gaaagcctg                                             29
<210>67
<211>31
<212>DNA
<213>酿酒酵母(Saccharomyces cerevisiae)
<400>67
ttgaattgaa aatagattga tttaaaactt c                                          31
<210>68
<211>25
<212>DNA
<213>酿酒酵母(Saccharomyces cerevisiae)
<400>68
ttgcatgcgt aatcatggtc atagc                                                 25
<210>69
<211>26
<212>DNA
<213>酿酒酵母(Saccharomyces cerevisiae)
<400>69
ttgaattcat gggtaataac tgatat                                                26
<210>70
<211>32
<212>DNA
<213>酿酒酵母(Saccharomyces cerevisiae)
<400>70
aaatcaatct attttcaatt caattcatca tt                             32
<210>71
<211>11
<212>DNA
<213>黑曲霉(Aspergillus niger)
<400>71
gtactaaaac c                                                    11
<210>72
<211>11
<212>DNA
<213>黑曲霉(Aspergillus niger)
<400>72
ccgttaaatt t                                                    11
<210>73
<211>45
<212>DNA
<213>黑曲霉(Aspergillus niger)
<400>73
ggatgctgtt gactccggaa atttaacggt ttggtcttgc atccc               45
<210>74
<211>14
<212>DNA
<213>黑曲霉(Aspergillus niger)
<400>74
atgcaattta aact                                                 14
<210>75
<211>14
<212>DNA
<213>黑曲霉(Aspergillus niger)
<400>75
cggcaattta acgg                                                 14
<210>76
<211>44
<212>DNA
<213>黑曲霉(Aspergillus niger)
<400>76
ggtattgtcc tgcagacggc aatttaacgg cttctgcgaa tcgc                44
<210>77
<211>29
<212>DNA
<213>特异腐质霉(Humicola insolens)
<400>77
aagcttaagc atgcgttect cccccctcc                                 29
<210>78
<211>32
<212>DNA
<213>特异腐质霉(Humicola insolens)
<400>78
ctgcagaatt ctacaggcac tgatggtacc ag                             32
<210>79
<211>32
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>79
ctgcagaatt ctacaggcac tgatggtacc ag                             32
<210>80
<211>36
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>80
accgcggact gcgcatcatg cgttcctccc ccctcc                         36
<210>81
<211>29
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>81
aaacgtcgac cgaatgtagg attgttatc                                 29
<210>82
<211>17
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>82
gatgcgcagt ccgcggt                                              17
<210>83
<211>29
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>83
aaacgtcgac cgaatgtagg attgttatc                                 29
<210>84
<211>36
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>84
ggagggggga ggaacgcatg atgcgcagtc cgcggt                         36
<210>85
<211>29
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>85
aaacgtcgac cgaatgtagg attgttatc                                 29
<210>86
<211>32
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>86
ctgcagaatt ctacaggcac tgatggtacc ag                             32
<210>87
<211>46
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>87
atagtcaacc gcggactgcg catcatgaag cttggttgga tcgagg              46
<210>88
<211>26
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>88
actagtttac tgggccttag gcagcg                                    26
<210>89
<211>26
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>89
gtcgactcga agcccgaatg taggat                                    26
<210>90
<211>45
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>90
cctcgatcca accaagcttc atgatgcgca gtccgcggtt gacta               45
<210>91
<211>57
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>91
atgaagcttg gttggatcga ggtggccgca ttggcggctg cctcagtagt cagtgcc  57
<210>92
<211>19
<212>PRT
<213>米曲霉(Aspergillus oryzae)
<400>92
Met Lys Leu Gly Trp Ile Glu Val Ala Ala Leu Ala Ala Ala Ser Val
1               5                   10                  15
Val Ser Ala
<210>93
<211>42
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>93
tgccggtgtt ggcccttgcc aaggatgatc tcgcgtactc cc                  42
<210>94
<211>28
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>94
gactagtctt actgggcctt aggcagcg                                                   28
<210>95
<211>63
<212>DNA
<213>特异腐质霉(Humicola insolens)
<400>95
atgcgttcct cccccctcct ccgctccgcc gttgtggccg ccctgccggt gttggccctt                60
gcc                                                                              63
<210>96
<211>21
<212>PRT
<213>特异腐质霉(Humicola insolens)
<400>96
Met Arg Ser Ser Pro Leu Leu Arg Ser Ala Val Val Ala Ala Leu Pro
1               5                   10                  15
Val Leu Ala Leu Ala
            20
<210>97
<211>30
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>97
acgcgtcgac cgaatgtagg attgttatcc                                                 30
<210>98
<211>42
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>98
gggagtacgc gagatcatcc ttggcaaggg ccaacaccgg ca                                   42
<210>99
<211>20
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>99
cccaagctta gccaagaaca                                                            20
<210>100
<211>29
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>100
gggggaggaa cgcatgggat ctggacggc                                                  29
<210>101
<211>30
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>101
gccgtccaga tccccatgcg ttcctccccc                                      30
<210>102
<211>20
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>102
ccaagcttgt tcagagtttc                                                 20
<210>103
<211>3294
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>103
atgcgttcct cccccctcct ccgctccgcc gttgtggccg ccctgccggt gttggccctt     60
gccgctgatg gcaggtccac ccgctactgg gactgctgca agccttcgtg cggctgggcc    120
aagaaggctc ccgtgaacca gcctgtcttt tcctgcaacg ccaacttcca gcgtatcacg    180
gacttcgacg ccaagtccgg ctgcgagccg ggcggtgtcg cctactcgtg cgccgaccag    240
accccatggg ctgtgaacga cgacttcgcg ctcggttttg ctgccacctc tattgccggc    300
agcaatgagg cgggctggtg ctgcgcctgc tacgagctca ccttcacatc cggtcctgtt    360
gctggcaaga agatggtcgt ccagtccacc agcactggcg gtgatcttgg cagcaaccac    420
ttcgatctca acatccccgg cggcggcgtc ggcatcttcg acggatgcac tccccagttc    480
ggtggtctgc ccggccagcg ctacggcggc atctcgtccc gcaacgagtg cgatcggttc    540
cccgacgccc tcaagcccgg ctgctactgg cgcttcgact ggttcaagaa cgccgacaat    600
ccgagcttca gcttccgtca ggtccagtgc ccagccgagc tcgtcgctcg caccggatgc    660
cgccgcaacg acgacggcaa cttccctgcc gtccagatcc ccatgcgttc ctcccccctc    720
ctccgctccg ccgttgtggc cgccctgccg gtgttggccc ttgccaagga tgatctcgcg    780
tactcccctc ctttctaccc ttccccatgg gcagatggtc agggtgaatg ggcggaagta    840
tacaaacgcg ctgtagacat agtttcccag atgacgttga cagagaaagt caacttaacg    900
actggaacag gatggcaact agagaggtgt gttggacaaa ctggcagtgt tcccagactc    960
aacatcccca gcttgtgttt gcaggatagt cctcttggta ttcgtttctc ggactacaat   1020
tcagctttcc ctgcgggtgt taatgtcgct gccacctggg acaagacgct cgcctacctt   1080
cgtggtcagg caatgggtga ggagttcagt gataagggta ttgacgttca gctgggtcct   1140
gctgctggcc ctctcggtgc tcatccggat ggcggtagaa actgggaaag tttctcacca   1200
gatccagccc tcaccggtgt actttttgcg gagacgatta agggtattca agatgctggt   1260
gtcattgcga cagctaagca ttatatcatg aacgaacaag agcatttccg ccaacaaccc   1320
gaggctgcgg gttacggatt caacgtaagc gacagtttga gttccaacgt tgatgacaag   1380
actatgcatg aattgtacct ctggcccttc gcggatgcag tacgcgctgg agtcggtgct   1440
gttatgtgct cttacaacca aatcaacaac agctacggtt gcgagaatag cgaaactctg   1500
aacaagcttt tgaaggcgga gcttggtttc caaggcttcg tcatgagtga ttggaccgct   1560
caacacagcg gcgtaggcgc tgctttagca ggtctggata tgtcgatgcc cggtgatgtt    1620
accttcgata gtggtacgtc tttctggggt gcaaacttga cggtcggtgt ccttaacggt    1680
acaatccccc aatggcgtgt tgatgacatg gctgtccgta tcatggccgc ttattacaag    1740
gttggccgcg acaccaaata cacccctccc aacttcagct cgtggaccag ggacgaatat    1800
ggtttcgcgc ataaccatgt ttcggaaggt gcttacgaga gggtcaacga attcgtggac    1860
gtgcaacgcg atcatgccga cctaatccgt cgcatcggcg cgcagagcac tgttctgctg    1920
aagaacaagg gtgccttgcc cttgagccgc aaggaaaagc tggtcgccct tctgggagag    1980
gatgcgggtt ccaactcgtg gggcgctaac ggctgtgatg accgtggttg cgataacggt    2040
acccttgcca tggcctgggg tagcggtact gcgaatttcc catacctcgt gacaccagag    2100
caggcgattc agaacgaagt tcttcagggc cgtggtaatg tcttcgccgt gaccgacagt    2160
tgggcgctcg acaagatcgc tgcggctgcc cgccaggcca gcgtatctct cgtgttcgtc    2220
aactccgact caggagaagg ctatcttagt gtggatggaa atgagggcga tcgtaacaac    2280
atcactctgt ggaagaacgg cgacaatgtg gtcaagaccg cagcgaataa ctgtaacaac    2340
accgttgtca tcatccactc cgtcggacca gttttgatcg atgaatggta tgaccacccc    2400
aatgtcactg gtattctctg ggctggtctg ccaggccagg agtctggtaa ctccattgcc    2460
gatgtgctgt acggtcgtgt caaccctggc gccaagtctc ctttcacttg gggcaagacc    2520
cgggagtcgt atggttctcc cttggtcaag gatgccaaca atggcaacgg agcgccccag    2580
tctgatttca cccagggtgt tttcatcgat taccgccatt tcgataagtt caatgagacc    2640
cctatctacg agtttggcta cggcttgagc tacaccacct tcgagctctc cgacctccat    2700
gttcagcccc tgaacgcgtc ccgatacact cccaccagtg gcatgactga agctgcaaag    2760
aactttggtg aaattggcga tgcgtcggag tacgtgtatc cggaggggct ggaaaggatc    2820
catgagttta tctatccctg gatcaactct accgacctga aggcatcgtc tgacgattct    2880
aactacggct gggaagactc caagtatatt cccgaaggcg ccacggatgg gtctgcccag    2940
ccccgtttgc ccgctagtgg tggtgccgga ggaaaccccg gtctgtacga ggatcttttc    3000
cgcgtctctg tgaaggtcaa gaacacgggc aatgtcgccg gtgatgaagt tcctcagctg    3060
tacgtttccc taggcggccc gaatgagccc aaggtggtac tgcgcaagtt tgagcgtatt    3120
cacttggccc cttcgcagga ggccgtgtgg acaacgaccc ttacccgtcg tgaccttgca    3180
aactgggacg tttcggctca ggactggacc gtcactcctt accccaagac gatctacgtt    3240
ggaaactcct cacggaaact gccgctccag gcctcgctgc ctaaggccca gtaa          3294
<210>104
<211>1097
<212>PRT
<213>米曲霉(Aspergillus oryzae)
<400>104
Met Arg Ser Ser Pro Leu Leu Arg Ser Ala Val Val Ala Ala Leu Pro
1               5                   10                  15
Val Leu Ala Leu Ala Ala Asp Gly Arg Ser Thr Arg Tyr Trp Asp Cys
            20                  25                  30
Cys Lys Pro Ser Cys Gly Trp Ala Lys Lys Ala Pro Val Asn Gln Pro
         35                  40                  45
Val Phe Ser Cys Asn Ala Asn Phe Gln Arg Ile Thr Asp Phe Asp Ala
    50                  55                  60
Lys Ser Gly Cys Glu Pro Gly Gly Val Ala Tyr Ser Cys Ala Asp Gln
65                  70                  75                  80
Thr Pro Trp Ala Val Asn Asp Asp Phe Ala Leu Gly Phe Ala Ala Thr
                85                  90                  95
Ser Ile Ala Gly Ser Asn Glu Ala Gly Trp Cys Cys Ala Cys Tyr Glu
            100                 105                 110
Leu Thr Phe Thr Ser Gly Pro Val Ala Gly Lys Lys Met Val Val Gln
        115                 120                 125
Ser Thr Ser Thr Gly Gly Asp Leu Gly Ser Asn His Phe Asp Leu Asn
    130                 135                 140
Ile Pro Gly Gly Gly Val Gly Ile Phe Asp Gly Cys Thr Pro Gln Phe
145                 150                 155                 160
Gly Gly Leu Pro Gly Gln Arg Tyr Gly Gly Ile Ser Ser Arg Asn Glu
                165                 170                 175
Cys Asp Arg Phe Pro Asp Ala Leu Lys Pro Gly Cys Tyr Trp Arg Phe
            180                 185                 190
Asp Trp Phe Lys Asn Ala Asp Asn Pro Ser Phe Ser Phe Arg Gln Val
        195                 200                 205
Gln Cys Pro Ala Glu Leu Val Ala Arg Thr Gly Cys Arg Arg Asn Asp
    210                 215                 220
Asp Gly Asn Phe Pro Ala Val Gln Ile Pro Met Arg Ser Ser Pro Leu
225                 230                 235                 240
Leu Arg Ser Ala Val Val Ala Ala Leu Pro Val Leu Ala Leu Ala Lys
                245                 250                 255
Asp Asp Leu Ala Tyr Ser Pro Pro Phe Tyr Pro Ser Pro Trp Ala Asp
            260                 265                 270
Gly Gln Gly Glu Trp Ala Glu Val Tyr Lys Arg Ala Val Asp Ile Val
        275                 280                 285
Ser Gln Met Thr Leu Thr Glu Lys Val Asn Leu Thr Thr Gly Thr Gly
    290                 295                 300
Trp Gln Leu Glu Arg Cys Val Gly Gln Thr Gly Ser Val Pro Arg Leu
305                 310                 315                 320
Asn Ile Pro Ser Leu Cys Leu Gln Asp Ser Pro Leu Gly Ile Arg Phe
                325                 330                 335
Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Val Asn Val Ala Ala Thr
            340                 345                 350
Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Gln Ala Met Gly Glu Glu
        355                 360                 365
Phe Ser Asp Lys Gly Ile Asp Val Gln Leu Gly Pro Ala Ala Gly Pro
    370                 375                 380
Leu Gly Ala His Pro Asp Gly Gly Arg Asn Trp Glu Ser Phe Ser Pro
385                 390                 395                 400
Asp Pro Ala Leu Thr Gly Val Leu Phe Ala Glu Thr Ile Lys Gly Ile
                405                 410                 415
Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr Ile Met Asn Glu
            420                 425                 430
Gln Glu His Phe Arg Gln Gln Pro Glu Ala Ala Gly Tyr Gly Phe Asn
        435                 440                 445
Val Ser Asp Ser Leu Ser Ser Asn Val Asp Asp Lys Thr Met His Glu
    450                 455                 460
Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala Gly Val Gly Ala
465                 470                 475                 480
Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr Gly Cys Glu Asn
                485                 490                 495
Ser Glu Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu Gly Phe Gln Gly
            500                 505                 510
Phe Val Met Ser Asp Trp Thr Ala Gln His Ser Gly Val Gly Ala Ala
        515                 520                 525
Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Val Thr Phe Asp Ser
    530                 535                 540
Gly Thr Ser Phe Trp Gly Ala Asn Leu Thr Val Gly Val Leu Asn Gly
545                 550                 555                 560
Thr Ile Pro Gln Trp Arg Val Asp Asp Met Ala Val Arg Ile Met Ala
                565                 570                 575
Ala Tyr Tyr Lys Val Gly Arg Asp Thr Lys Tyr Thr Pro Pro Asn Phe
            580                 585                 590
Ser Ser Trp Thr Arg Asp Glu Tyr Gly Phe Ala His Asn His Val Ser
        595                 600                 605
Glu Gly Ala Tyr Glu Arg Val Asn Glu Phe Val Asp Val Gln Arg Asp
    610                 615                 620
His Ala Asp Leu Ile Arg Arg Ile Gly Ala Gln Ser Thr Val Leu Leu
625                 630                 635                 640
Lys Asn Lys Gly Ala Leu Pro Leu Ser Arg Lys Glu Lys Leu Val Ala
                645                 650                 655
Leu Leu Gly Glu Asp Ala Gly Ser Asn Ser Trp Gly Ala Asn Gly Cys
            660                 665                 670
Asp Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met Ala Trp Gly Ser
        675                 680                 685
Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu Gln Ala Ile Gln
    690                 695                 700
Asn Glu Val Leu Gln Gly Arg Gly Asn Val Phe Ala Val Thr Asp Ser
705                 710                 715                 720
Trp Ala Leu Asp Lys Ile Ala Ala Ala Ala Arg Gln Ala Ser Val Ser
                725                 730                 735
Leu Val Phe Val Asn Ser Asp Ser Gly Glu Gly Tyr Leu Ser Val Asp
            740                 745                 750
Gly Asn Glu Gly Asp Arg Asn Asn Ile Thr Leu Trp Lys Asn Gly Asp
        755                 760                 765
Asn Val Val Lys Thr Ala Ala Asn Asn Cys Asn Asn Thr Val Val Ile
    770                 775                 780
Ile His Ser Val Gly Pro Val Leu Ile Asp Glu Trp Tyr Asp His Pro
785                 790                 795                 800
Asn Val Thr Gly Ile Leu Trp Ala Gly Leu Pro Gly Gln Glu Ser Gly
                805                 810                 815
Asn Ser Ile Ala Asp Val Leu Tyr Gly Arg Val Asn Pro Gly Ala Lys
            820                 825                 830
Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr Gly Ser Pro Leu
        835                 840                 845
Val Lys Asp Ala Asn Asn Gly Asn Gly Ala Pro Gln Ser Asp Phe Thr
    850                 855                 860
Gln Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys Phe Asn Glu Thr
865                 870                 875                 880
Pro Ile Tyr Glu Phe Gly Tyr Gly Leu Ser Tyr Thr Thr Phe Glu Leu
                885                 890                 895
Ser Asp Leu His Val Gln Pro Leu Asn Ala Ser Arg Tyr Thr Pro Thr
            900                 905                 910
Ser Gly Met Thr Glu Ala Ala Lys Asn Phe Gly Glu Ile Gly Asp Ala
        915                 920                 925
Ser Glu Tyr Val Tyr Pro Glu Gly Leu Glu Arg Ile His Glu Phe Ile
    930                 935                 940
Tyr Pro Trp Ile Asn Ser Thr Asp Leu Lys Ala Ser Ser Asp Asp Ser
945                 950                 955                 960
Asn Tyr Gly Trp Glu Asp Ser Lys Tyr Ile Pro Glu Gly Ala Thr Asp
                965                 970                 975
Gly Ser Ala Gln Pro Arg Leu Pro Ala Ser Gly Gly Ala Gly Gly Asn
            980                 985                 990
Pro Gly Leu Tyr Glu Asp Leu Phe Arg Val Ser Val Lys Val Lys Asn
        995                 1000                1005
Thr Gly Asn Val Ala Gly Asp Glu Val Pro Gln Leu Tyr Val Ser
    1010                1015                1020
Leu Gly Gly Pro Asn Glu Pro Lys Val Val Leu Arg Lys Phe Glu
    1025                1030                1035
Arg Ile His Leu Ala Pro Ser Gln Glu Ala Val Trp Thr Thr Thr
    1040                1045                1050
Leu Thr Arg Arg Asp Leu Ala Asn Trp Asp Val Ser Ala Gln Asp
    1055                1060                1065
Trp Thr Val Thr Pro Tyr Pro Lys Thr Ile Tyr Val Gly Asn Ser
    1070                1075                1080
Ser Arg Lys Leu Pro Leu Gln Ala Ser Leu Pro Lys Ala Gln
    1085                1090                1095
<210>105
<211>3294
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>105
atgcgttcct cccccctcct ccgctccgcc gttgtggccg ccctgccggt gttggccctt     60
gccgctgatg gcaggtccac ccgctactgg gactgctgca agccttcgtg cggctgggcc    120
aagaaggctc ccgtgaacca gcctgtcttt tcctgcaacg ccaacttcca gcgtatcacg    180
gacttcgacg ccaagtccgg ctgcgagccg ggcggtgtcg cctactcgtg cgccgaccag    240
accccatggg ctgtgaacga cgacttcgcg ctcggttttg ctgccacctc tattgccggc    300
agcaatgagg cgggctggtg ctgcgcctgc tacgagctca ccttcacatc cggtcctgtt    360
gctggcaaga agatggtcgt ccagtccacc agcactggcg gtgatcttgg cagcaaccac     420
ttcgatctca acatccccgg cggcggcgtc ggcatcttcg acggatgcac tccccagttc     480
ggtggtctgc ccggccagcg ctacggcggc atctcgtccc gcaacgagtg cgatcggttc     540
cccgacgccc tcaagcccgg ctgctactgg cgcttcgact ggttcaagaa cgccgacaat     600
ccgagcttca gcttccgtca ggtccagtgc ccagccgagc tcgtcgctcg caccggatgc     660
cgccgcaacg acgacggcaa cttccctgcc gtccagatcc ccatgcgttc ctcccccctc     720
ctccgctccg ccgttgtggc cgccctgccg gtgttggccc ttgccaagga tgatctcgcg     780
tactcccctc ctttctaccc ttccccatgg gcagatggtc agggtgaatg ggcggaagta     840
tacaaacgcg ctgtagacat agtttcccag atgacgttga cagagaaagt caacttaacg     900
actggaacag gatggcaact agagaggtgt gttggacaaa ctggcagtgt tcccagactc     960
aacatcccca gcttgtgttt gcaggatagt cctcttggta ttcgtttctc ggactacaat    1020
tcagctttcc ctgcgggtgt taatgtcgct gccacctggg acaagacgct cgcctacctt    1080
cgtggtcagg caatgggtga ggagttcagt gataagggta ttgacgttca gctgggtcct    1140
gctgctggcc ctctcggtgc tcatccggat ggcggtagaa actgggaagg tttctcacca    1200
gatccagccc tcaccggtgt actttttgcg gagacgatta agggtattca agatgctggt    1260
gtcattgcga cagctaagca ttatatcatg aacgaacaag agcatttccg ccaacaaccc    1320
gaggctgcgg gttacggatt caacgtaagc gacagtttga gttccaacgt tgatgacaag    1380
actatgcatg aattgtacct ctggcccttc gcggatgcag tacgcgctgg agtcggtgct    1440
gtcatgtgct cttacaacca aatcaacaac agctacggtt gcgagaatag cgaaactctg    1500
aacaagcttt tgaaggcgga gcttggtttc caaggcttcg tcatgagtga ttggaccgct    1560
catcacagcg gcgtaggcgc tgctttagca ggtctggata tgtcgatgcc cggtgatgtt    1620
accttcgata gtggtacgtc tttctggggt gcaaacttga cggtcggtgt ccttaacggt    1680
acaatccccc aatggcgtgt tgatgacatg gctgtccgta tcatggccgc ttattacaag    1740
gttggccgcg acaccaaata cacccctccc aacttcagct cgtggaccag ggacgaatat    1800
ggtttcgcgc ataaccatgt ttcggaaggt gcttacgaga gggtcaacga attcgtggac    1860
gtgcaacgcg atcatgccga cctaatccgt cgcatcggcg cgcagagcac tgttctgctg    1920
aagaacaagg gtgccttgcc cttgagccgc aaggaaaagc tggtcgccct tctgggagag    1980
gatgcgggtt ccaactcgtg gggcgctaac ggctgtgatg accgtggttg cgataacggt    2040
acccttgcca tggcctgggg tagcggtact gcgaatttcc catacctcgt gacaccagag    2100
caggcgattc agaacgaagt tcttcagggc cgtggtaatg tcttcgccgt gaccgacagt    2160
tgggcgctcg acaagatcgc tgcggctgcc cgccaggcca gcgtatctct cgtgttcgtc    2220
aactccgact caggagaagg ctatcttagt gtggatggaa atgagggcga tcgtaacaac    2280
atcactctgt ggaagaacgg cgacaatgtg gtcaagaccg cagcgaataa ctgtaacaac    2340
accgttgtca tcatccactc cgtcggacca gttttgatcg atgaatggta tgaccacccc    2400
aatgtcactg gtattctctg ggctggtctg ccaggccagg agtctggtaa ctccattgcc    2460
gatgtgctgt acggtcgtgt caaccctggc gccaagtctc ctttcacttg gggcaagacc    2520
cgggagtcgt atggttctcc cttggtcaag gatgccaaca atggcaacgg agcgccccag    2580
tctgatttca cccagggtgt tttcatcgat taccgccatt tcgataagtt caatgagacc    2640
cctatctacg agtttggcta cggcttgagc tacaccacct tcgagctctc cgacctccat    2700
gttcagcccc tgaacgcgtc ccgatacact cccaccagtg gcatgactga agctgcaaag    2760
aactttggtg aaattggcga tgcgtcggag tacgtgtatc cggaggggct ggaaaggatc    2820
catgagttta tctatccctg gatcaactct accgacctga aggcatcgtc tgacgattct    2880
aactacggct gggaagactc caagtatatt cccgaaggcg ccacggatgg gtctgcccag    2940
ccccgtttgc ccgctagtgg tggtgccgga ggaaaccccg gtctgtacga ggatcttttc    3000
cgcgtctctg tgaaggtcaa gaacacgggc aatgtcgccg gtgatgaagt tcctcagctg    3060
tacgtttccc taggcggccc gaatgagccc aaggtggtac tgcgcaagtt tgagcgtatt    3120
cacttggccc cttcgcagga ggccgtgtgg acaacgaccc ttacccgtcg tgaccttgca    3180
aactgggacg tttcggctca ggactggacc gtcactcctt accccaagac gatctacgtt    3240
ggaaactcct cacggaaact gccgctccag gcctcgctgc ctaaggccca gtaa          3294
<210>106
<211>1097
<212>PRT
<213>米曲霉(Aspergillus oryzae)
<400>106
Met Arg Ser Ser Pro Leu Leu Arg Ser Ala Val Val Ala Ala Leu Pro
1               5                   10                  15
Val Leu Ala Leu Ala Ala Asp Gly Arg Ser Thr Arg Tyr Trp Asp Cys
            20                  25                  30
Cys Lys Pro Ser Cys Gly Trp Ala Lys Lys Ala Pro Val Asn Gln Pro
        35                  40                  45
Val Phe Ser Cys Asn Ala Asn Phe Gln Arg Ile Thr Asp Phe Asp Ala
    50                  55                  60
Lys Ser Gly Cys Glu Pro Gly Gly Val Ala Tyr Ser Cys Ala Asp Gln
65                  70                  75                  80
Thr Pro Trp Ala Val Asn Asp Asp Phe Ala Leu Gly Phe Ala Ala Thr
                85                  90                  95
Ser Ile Ala Gly Ser Asn Glu Ala Gly Trp Cys Cys Ala Cys Tyr Glu
            100                 105                 110
Leu Thr Phe Thr Ser Gly Pro Val Ala Gly Lys Lys Met Val Val Gln
        115                 120                 125
Ser Thr Ser Thr Gly Gly Asp Leu Gly Ser Asn His Phe Asp Leu Asn
    130                 135                 140
Ile Pro Gly Gly Gly Val Gly Ile Phe Asp Gly Cys Thr Pro Gln Phe
145                 150                 155                 160
Gly Gly Leu Pro Gly Gln Arg Tyr Gly Gly Ile Ser Ser Arg Asn Glu
                165                 170                 175
Cys Asp Arg Phe Pro Asp Ala Leu Lys Pro Gly Cys Tyr Trp Arg Phe
            180                 185                 190
Asp Trp Phe Lys Asn Ala Asp Asn Pro Ser Phe Ser Phe Arg Gln Val
       195                 200                 205
Gln Cys Pro Ala Glu Leu Val Ala Arg Thr Gly Cys Arg Arg Asn Asp
    210                 215                 220
Asp Gly Asn Phe Pro Ala Val Gln Ile Pro Met Arg Ser Ser Pro Leu
225                 230                 235                 240
Leu Arg Ser Ala Val Val Ala Ala Leu Pro Val Leu Ala Leu Ala Lys
                245                 250                 255
Asp Asp Leu Ala Tyr Ser Pro Pro Phe Tyr Pro Ser Pro Trp Ala Asp
            260                 265                 270
Gly Gln Gly Glu Trp Ala Glu Val Tyr Lys Arg Ala Val Asp Ile Val
        275                 280                 285
Ser Gln Met Thr Leu Thr Glu Lys Val Asn Leu Thr Thr Gly Thr Gly
    290                 295                 300
Trp Gln Leu Glu Arg Cys Val Gly Gln Thr Gly Ser Val Pro Arg Leu
305                 310                 315                 320
Asn Ile Pro Ser Leu Cys Leu Gln Asp Ser Pro Leu Gly Ile Arg Phe
                325                 330                 335
Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Val Asn Val Ala Ala Thr
            340                 345                 350
Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Gln Ala Met Gly Glu Glu
        355                 360                 365
Phe Ser Asp Lys Gly Ile Asp Val Gln Leu Gly Pro Ala Ala Gly Pro
    370                 375                 380
Leu Gly Ala His Pro Asp Gly Gly Arg Asn Trp Glu Gly Phe Ser Pro
385                 390                 395                 400
Asp Pro Ala Leu Thr Gly Val Leu Phe Ala Glu Thr Ile Lys Gly Ile
                405                 410                 415
Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr Ile Met Asn Glu
            420                 425                 430
Gln Glu His Phe Arg Gln Gln Pro Glu Ala Ala Gly Tyr Gly Phe Asn
        435                 440                 445
Val Ser Asp Ser Leu Ser Ser Asn Val Asp Asp Lys Thr Met His Glu
    450                 455                 460
Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala Gly Val Gly Ala
465                 470                 475                 480
Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr Gly Cys Glu Asn
                485                 490                 495
Ser Glu Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu Gly Phe Gln Gly
            500                 505                 510
Phe Val Met Ser Asp Trp Thr Ala His His Ser Gly Val Gly Ala Ala
        515                 520                 525
Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Val Thr Phe Asp Ser
    530                 535                 540
Gly Thr Ser Phe Trp Gly Ala Asn Leu Thr Val Gly Val Leu Asn Gly
545                 550                 555                 560
Thr Ile Pro Gln Trp Arg Val Asp Asp Met Ala Val Arg Ile Met Ala
                565                 570                 575
Ala Tyr Tyr Lys Val Gly Arg Asp Thr Lys Tyr Thr Pro Pro Asn Phe
            580                 585                 590
Ser Ser Trp Thr Arg Asp Glu Tyr Gly Phe Ala His Asn His Val Ser
        595                 600                 605
Glu Gly Ala Tyr Glu Arg Val Asn Glu Phe Val Asp Val Gln Arg Asp
    610                 615                 620
His Ala Asp Leu Ile Arg Arg Ile Gly Ala Gln Ser Thr Val Leu Leu
625                 630                 635                 640
Lys Asn Lys Gly Ala Leu Pro Leu Ser Arg Lys Glu Lys Leu Val Ala
                645                 650                 655
Leu Leu Gly Glu Asp Ala Gly Ser Asn Ser Trp Gly Ala Asn Gly Cys
            660                 665                 670
Asp Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met Ala Trp Gly Ser
        675                 680                 685
Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu Gln Ala Ile Gln
    690                 695                 700
Asn Glu Val Leu Gln Gly Arg Gly Asn Val Phe Ala Val Thr Asp Ser
705                 710                 715                 720
Trp Ala Leu Asp Lys Ile Ala Ala Ala Ala Arg Gln Ala Ser Val Ser
                725                 730                 735
Leu Val Phe Val Asn Ser Asp Ser Gly Glu Gly Tyr Leu Ser Val Asp
            740                 745                 750
Gly Asn Glu Gly Asp Arg Asn Asn Ile Thr Leu Trp Lys Asn Gly Asp
        755                 760                 765
Asn Val Val Lys Thr Ala Ala Asn Asn Cys Asn Asn Thr Val Val Ile
    770                 775                 780
Ile His Ser Val Gly Pro Val Leu Ile Asp Glu Trp Tyr Asp His Pro
785                 790                 795                 800
Asn Val Thr Gly Ile Leu Trp Ala Gly Leu Pro Gly Gln Glu Ser Gly
                805                 810                 815
Asn Ser Ile Ala Asp Val Leu Tyr Gly Arg Val Asn Pro Gly Ala Lys
            820                 825                 830
Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr Gly Ser Pro Leu
        835                 840                 845
Val Lys Asp Ala Asn Asn Gly Asn Gly Ala Pro Gln Ser Asp Phe Thr
    850                 855                 860
Gln Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys Phe Asn Glu Thr
865                 870                 875                 880
Pro Ile Tyr Glu Phe Gly Tyr Gly Leu Ser Tyr Thr Thr Phe Glu Leu
                885                 890                 895
Ser Asp Leu His Val Gln Pro Leu Asn Ala Ser Arg Tyr Thr Pro Thr
            900                 905                 910
Ser Gly Met Thr Glu Ala Ala Lys Asn Phe Gly Glu Ile Gly Asp Ala
        915                 920                 925
Ser Glu Tyr Val Tyr Pro Glu Gly Leu Glu Arg Ile His Glu Phe Ile
    930                 935                 940
Tyr Pro Trp Ile Asn Ser Thr Asp Leu Lys Ala Ser Ser Asp Asp Ser
945                 950                 955                 960
Asn Tyr Gly Trp Glu Asp Ser Lys Tyr Ile Pro Glu Gly Ala Thr Asp
                965                 970                 975
Gly Ser Ala Gln Pro Arg Leu Pro Ala Ser Gly Gly Ala Gly Gly Asn
            980                 985                 990
Pro Gly Leu Tyr Glu Asp Leu Phe Arg Val Ser Val Lys Val Lys Asn
        995                 1000                1005
Thr Gly Asn Val Ala Gly Asp Glu Val Pro Gln Leu Tyr Val Ser
    1010                1015                1020
Leu Gly Gly Pro Asn Glu Pro Lys Val Val Leu Arg Lys Phe Glu
    1025                1030                1035
Arg Ile His Leu Ala Pro Ser Gln Glu Ala Val Trp Thr Thr Thr
    1040                1045                1050
Leu Thr Arg Arg Asp Leu Ala Asn Trp Asp Val Ser Ala Gln Asp
    1055                1060                1065
Trp Thr Val Thr Pro Tyr Pro Lys Thr Ile Tyr Val Gly Asn Ser
    1070                1075                1080
Ser Arg Lys Leu Pro Leu Gln Ala Ser Leu Pro Lys Ala Gln
    1085                1090                1095
<210>107
<211>20
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>107
ggactgcgca gcatgcgttc                                                  20
<210>108
<211>30
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>108
agttaattaa ttactgggcc ttaggcagcg                                       30
<210>109
<211>28
<212>DNA
<213>桔橙嗜热霉(Thermoascus aurantiacus)
<400>109
atgtcctttt ccaagataat tgctactg                                         28
<210>110
<211>26
<212>DNA
<213>桔橙嗜热霉(Thermoascus aurantiacus)
<400>110
gcttaattaa ccagtataca gaggag                                           26

Claims (73)

1.丝状真菌宿主细胞,其包含:(a)编码具有增强纤维素分解的活性的天然或异源多肽的第一多核苷酸;(b)编码β-葡糖苷酶融合蛋白的第二多核苷酸,所述β-葡糖苷酶融合蛋白包含SEQ ID NO:104或SEQ ID NO:106或其组成为SEQ ID NO:104或SEQ ID NO:106;和(c)编码选自下组的天然或异源纤维素分解酶的一个或多个第三多核苷酸:里氏木霉(Trichoderma reesei)纤维二糖水解酶I(CEL7A)、里氏木霉纤维二糖水解酶II(CEL6A),和里氏木霉内切葡聚糖酶I(CEL7B),和它们的直向同源物或变体。
2.权利要求1的丝状真菌宿主细胞,其中具有增强纤维素分解的活性的多肽选自下组:
(a)包含[ILMV]-P-X(4,5)-G-X-Y-[ILMV]-X-R-X-[EQ]-X(4)-[HNQ]和[FW]-[TF]-K-[AIV]的具有增强纤维素分解的活性的多肽,其中X是任何氨基酸,X(4,5)是4或5个邻接位置上的任何氨基酸,并且X(4)是4个邻接位置上的任何氨基酸;
(b)包含[ILMV]-P-x(4,5)-G-x-Y-[ILMV]-x-R-x-[EQ]-x(3)-A-[HNQ]的具有增强纤维素分解的活性的多肽,其中x是任何氨基酸,x(4,5)是4或5个邻接位置上的任何氨基酸,并且x(3)是3个邻接位置上的任何氨基酸;
(c)多肽,其包含与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQID NO:8,或SEQ ID NO:10、SEQ ID NO:12,或SEQ ID NO:14的成熟多肽具有至少90%同一性的氨基酸序列;
(d)由多核苷酸编码的多肽,所述多核苷酸在至少中-高严紧条件下与以下杂交:(i)SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11或SEQ ID NO:13的成熟多肽编码序列,(ii)包含在SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5或SEQ ID NO:11的成熟多肽编码序列中的cDNA序列,或者包含SEQ ID NO:7、SEQ ID NO:9或SEQ ID NO:13的成熟多肽编码序列的基因组DNA序列,或(iii)(i)或(ii)的全长互补链;
(e)多肽,其由包含与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQID NO:7、SEQ ID NO:9、SEQ ID NO:11或SEQ ID NO:13的成熟多肽编码序列具有至少90%同一性的核苷酸序列的多核苷酸编码;
(f)SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8,或SEQID NO:10、SEQ ID NO:12,或SEQ ID NO:14的成熟多肽中包含取代、缺失和/或插入一个或多个氨基酸的变体;和
(g)具有增强纤维素分解的活性的多肽,其包含或其组成为SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8,或SEQ ID NO:10、SEQ IDNO:12,或SEQ ID NO:14的成熟多肽,或者其具有增强纤维素分解的活性的片段。
3.权利要求2的丝状真菌宿主细胞,其中具有增强纤维素分解的活性的多肽选自以下多肽,其包含与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8,或SEQ ID NO:10、SEQ ID NO:12,或SEQ ID NO:14的成熟多肽具有至少95%同一性的氨基酸序列。
4.权利要求2的丝状真菌宿主细胞,其中具有增强纤维素分解的活性的多肽选自由多核苷酸编码的多肽,所述多核苷酸在至少高严紧条件下与以下杂交:(i)SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11或SEQ ID NO:13的成熟多肽编码序列,(ii)包含在SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5或SEQ ID NO:11的成熟多肽编码序列中的cDNA序列,或者包含SEQ ID NO:7、SEQ ID NO:9或SEQ ID NO:13的成熟多肽编码序列的基因组DNA序列,或(iii)(i)或(ii)的全长互补链。
5.权利要求2的丝状真菌宿主细胞,其中具有增强纤维素分解的活性的多肽选自以下多肽,其由包含与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11或SEQ ID NO:13的成熟多肽编码序列具有至少95%同一性的核苷酸序列的多核苷酸编码。
6.权利要求2的丝状真菌宿主细胞,其中包含[ILMV]-P-X(4,5)-G-X-Y-[ILMV]-X-R-X-[EQ]-X(4)-[HNQ]和[FW]-[TF]-K-[AIV]的具有增强纤维素分解的活性的多肽进一步包含:
H-X(1,2)-G-P-X(3)-[YW]-[AILMV],
[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV],或
H-X(1,2)-G-P-X(3)-[YW]-[AILMV]和[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV],
其中X是任何氨基酸,X(1,2)是1个位置或2个邻接位置上的任何氨基酸,X(3)是3个邻接位置上的任何氨基酸,并且X(2)是2个邻接位置上的任何氨基酸。
7.权利要求2的丝状真菌宿主细胞,其中一个或多个氨基酸为取代、缺失和/或插入一个或几个氨基酸。
8.权利要求1的丝状真菌宿主细胞,其中所述里氏木霉纤维二糖水解酶I(CEL7A)包含或组成为SEQ ID NO:52的成熟多肽;所述里氏木霉纤维二糖水解酶II(CEL6A)包含或组成为SEQ ID NO:54的成熟多肽;和所述里氏木霉内切葡聚糖酶I(CEL7B)包含或组成为SEQ ID NO:56的成熟多肽。
9.权利要求1的丝状真菌宿主细胞,其中所述里氏木霉纤维二糖水解酶I(CEL7A)的直向同源物或变体选自下组:
(a)多肽,其包含与SEQ ID NO:52的成熟多肽具有至少90%同一性的氨基酸序列;
(b)由多核苷酸编码的多肽,所述多核苷酸在至少中-高严紧条件下与以下杂交:(i)SEQ ID NO:51的成熟多肽编码序列,(ii)包含在SEQ ID NO:51的成熟多肽编码序列中的cDNA序列,或者包含SEQ ID NO:51的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;
(c)多肽,其由包含与SEQ ID NO:51的成熟多肽编码序列具有至少90%同一性的核苷酸序列的多核苷酸编码;
(d)SEQ ID NO:52的成熟多肽中包含取代、缺失和/或插入一个或几个氨基酸的变体;且
其中所述里氏木霉纤维二糖水解酶II(CEL6A)的直向同源物或变体选自下组:
(a)多肽,其包含与SEQ ID NO:54的成熟多肽具有至少90%同一性的氨基酸序列;
(b)由多核苷酸编码的多肽,所述多核苷酸在至少中-高严紧条件下与以下杂交:(i)SEQ ID NO:53的成熟多肽编码序列,(ii)包含在SEQ ID NO:53的成熟多肽编码序列中的cDNA序列,或者包含SEQ ID NO:53的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;
(c)多肽,其由包含与SEQ ID NO:53的成熟多肽编码序列具有至少90%同一性的核苷酸序列的多核苷酸编码;和
(d)SEQ ID NO:54的成熟多肽中包含取代、缺失和/或插入一个或几个氨基酸的变体;且
其中所述里氏木霉内切葡聚糖酶I(CEL7B)的直向同源物或变体选自下组:
(a)多肽,其包含与SEQ ID NO:56的成熟多肽具有至少90%同一性的氨基酸序列;
(b)由多核苷酸编码的多肽,所述多核苷酸在至少中-高严紧条件下与以下杂交:(i)SEQ ID NO:55的成熟多肽编码序列,(ii)包含在SEQ ID NO:55的成熟多肽编码序列中的cDNA序列,或者包含SEQ ID NO:55的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;
(c)多肽,其由包含与SEQ ID NO:55的成熟多肽编码序列具有至少90%同一性的核苷酸序列的多核苷酸编码;
(d)SEQ ID NO:56的成熟多肽中包含取代、缺失和/或插入一个或几个氨基酸的变体。
10.权利要求9的丝状真菌宿主细胞,其中所述里氏木霉纤维二糖水解酶I(CEL7A)的直向同源物或变体选自
多肽,其包含与SEQ ID NO:52的成熟多肽具有至少95%同一性的氨基酸序列。
11.权利要求9的丝状真菌宿主细胞,其中所述里氏木霉纤维二糖水解酶I(CEL7A)的直向同源物或变体选自由多核苷酸编码的多肽,所述多核苷酸在至少高严紧条件下与以下杂交:(i)SEQ ID NO:51的成熟多肽编码序列,(ii)包含在SEQ ID NO:51的成熟多肽编码序列中的cDNA序列,或者包含SEQID NO:51的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链。
12.权利要求9的丝状真菌宿主细胞,其中所述里氏木霉纤维二糖水解酶I(CEL7A)的直向同源物或变体选自以下多肽,其由包含与SEQ ID NO:51的成熟多肽编码序列具有至少95%同一性的核苷酸序列的多核苷酸编码。
13.权利要求9的丝状真菌宿主细胞,其中所述里氏木霉纤维二糖水解酶II(CEL6A)的直向同源物或变体选自以下多肽,其包含与SEQ ID NO:54的成熟多肽具有至少95%同一性的氨基酸序列。
14.权利要求9的丝状真菌宿主细胞,其中所述里氏木霉纤维二糖水解酶II(CEL6A)的直向同源物或变体选自由多核苷酸编码的多肽,所述多核苷酸在至少高严紧条件下与以下杂交:(i)SEQ ID NO:53的成熟多肽编码序列,(ii)包含在SEQ ID NO:53的成熟多肽编码序列中的cDNA序列,或者包含SEQ ID NO:53的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链。
15.权利要求9的丝状真菌宿主细胞,其中所述里氏木霉纤维二糖水解酶II(CEL6A)的直向同源物或变体选自以下多肽,其由包含与SEQ ID NO:53的成熟多肽编码序列具有至少95%同一性的核苷酸序列的多核苷酸编码。
16.权利要求9的丝状真菌宿主细胞,其中所述里氏木霉内切葡聚糖酶I(CEL7B)的直向同源物或变体选自以下多肽,其包含与SEQ ID NO:56的成熟多肽具有至少95%同一性的氨基酸序列。
17.权利要求9的丝状真菌宿主细胞,其中所述里氏木霉内切葡聚糖酶I(CEL7B)的直向同源物或变体选自由多核苷酸编码的多肽,所述多核苷酸在至少高严紧条件下与以下杂交:(i)SEQ ID NO:55的成熟多肽编码序列,(ii)包含在SEQ ID NO:55的成熟多肽编码序列中的cDNA序列,或者包含SEQID NO:55的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链。
18.权利要求9的丝状真菌宿主细胞,其中所述里氏木霉内切葡聚糖酶I(CEL7B)的直向同源物或变体选自以下多肽,其由包含与SEQ ID NO:55的成熟多肽编码序列具有至少95%同一性的核苷酸序列的多核苷酸编码。
19.权利要求1-18中任一项的丝状真菌宿主细胞,其进一步包含一个或多个第四多核苷酸,其编码选自下组的纤维素分解酶:里氏木霉内切葡聚糖酶II(CEL5A)、里氏木霉内切葡聚糖酶III(CEL12A),和里氏木霉内切葡聚糖酶V(CEL45A),和它们的直向同源物或变体。
20.权利要求19的丝状真菌宿主细胞,其中所述一个或多个第四多核苷酸为一个或几个第四多核苷酸。
21.权利要求19的丝状真菌宿主细胞,其中所述里氏木霉内切葡聚糖酶II(CEL5A)包含或组成为SEQ ID NO:58的成熟多肽;所述里氏木霉内切葡聚糖酶III(CEL12A)是包含或组成为SEQ ID NO:60的成熟多肽,和所述里氏木霉内切葡聚糖酶V(CEL45A)是包含或组成为SEQ ID NO:61的成熟多肽。
22.权利要求19的丝状真菌宿主细胞,其中所述里氏木霉内切葡聚糖酶II(CEL5A)的直向同源物或变体选自下组:
(a)多肽,其包含与SEQ ID NO:58的成熟多肽具有至少90%同一性的氨基酸序列;
(b)由多核苷酸编码的多肽,所述多核苷酸在至少中-高严紧条件下与以下杂交:(i)SEQ ID NO:57的成熟多肽编码序列,(ii)包含在SEQ ID NO:57的成熟多肽编码序列中的cDNA序列,或者包含SEQ ID NO:57的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;
(c)多肽,其由包含与SEQ ID NO:57的成熟多肽编码序列具有至少90%同一性的核苷酸序列的多核苷酸编码;和
(d)SEQ ID NO:58的成熟多肽中包含取代、缺失和/或插入一个或几个氨基酸的变体;
其中所述里氏木霉内切葡聚糖酶III(CEL12A)的直向同源物或变体选自下组:
(a)多肽,其包含与SEQ ID NO:60的成熟多肽具有至少90%同一性的氨基酸序列;
(b)由多核苷酸编码的多肽,所述多核苷酸在至少中-高严紧条件下与以下杂交:(i)SEQ ID NO:59的成熟多肽编码序列,(ii)包含在SEQ ID NO:59的成熟多肽编码序列中的cDNA序列,或者包含SEQ ID NO:59的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;
(c)多肽,其由包含与SEQ ID NO:59的成熟多肽编码序列具有至少90%同一性的核苷酸序列的多核苷酸编码;
(d)SEQ ID NO:60的成熟多肽中包含取代、缺失和/或插入一个或几个氨基酸的变体;且
其中所述里氏木霉内切葡聚糖酶V(CEL45A)的直向同源物或变体选自下组:
(a)多肽,其包含与SEQ ID NO:62的成熟多肽具有至少90%同一性的氨基酸序列;
(b)由多核苷酸编码的多肽,所述多核苷酸在至少中-高严紧条件下与以下杂交:(i)SEQ ID NO:61的成熟多肽编码序列,(ii)包含在SEQ ID NO:61的成熟多肽编码序列中的cDNA序列,或者包含SEQ ID NO:61的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;
(c)多肽,其由包含与SEQ ID NO:61的成熟多肽编码序列具有至少90%同一性的核苷酸序列的多核苷酸编码;和
(d)SEQ ID NO:62的成熟多肽中包含取代、缺失和/或插入一个或几个氨基酸的变体。
23.权利要求22的丝状真菌宿主细胞,其中所述里氏木霉内切葡聚糖酶II(CEL5A)的直向同源物或变体选自以下多肽,其包含与SEQ ID NO:58的成熟多肽具有至少95%同一性的氨基酸序列。
24.权利要求22的丝状真菌宿主细胞,其中所述里氏木霉内切葡聚糖酶II(CEL5A)的直向同源物或变体选自由多核苷酸编码的多肽,所述多核苷酸在至少高严紧条件下与以下杂交:(i)SEQ ID NO:57的成熟多肽编码序列,(ii)包含在SEQ ID NO:57的成熟多肽编码序列中的cDNA序列,或者包含SEQID NO:57的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链。
25.权利要求22的丝状真菌宿主细胞,其中所述里氏木霉内切葡聚糖酶II(CEL5A)的直向同源物或变体选自以下多肽,其由包含与SEQ ID NO:57的成熟多肽编码序列具有至少95%同一性的核苷酸序列的多核苷酸编码。
26.权利要求22的丝状真菌宿主细胞,其中所述里氏木霉内切葡聚糖酶III(CEL12A)的直向同源物或变体选自以下多肽,其包含与SEQ ID NO:60的成熟多肽具有至少95%同一性的氨基酸序列。
27.权利要求22的丝状真菌宿主细胞,其中所述里氏木霉内切葡聚糖酶III(CEL12A)的直向同源物或变体选自由多核苷酸编码的多肽,所述多核苷酸在至少高严紧条件下与以下杂交:(i)SEQ ID NO:59的成熟多肽编码序列,(ii)包含在SEQ ID NO:59的成熟多肽编码序列中的cDNA序列,或者包含SEQ ID NO:59的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;
28.权利要求22的丝状真菌宿主细胞,其中所述里氏木霉内切葡聚糖酶III(CEL12A)的直向同源物或变体选自以下多肽,其由包含与SEQ ID NO:59的成熟多肽编码序列具有至少95%同一性的核苷酸序列的多核苷酸编码。
29.权利要求22的丝状真菌宿主细胞,其中所述里氏木霉内切葡聚糖酶V(CEL45A)的直向同源物或变体选自以下多肽,其包含与SEQ ID NO:62的成熟多肽具有至少95%同一性的氨基酸序列。
30.权利要求22的丝状真菌宿主细胞,其中所述里氏木霉内切葡聚糖酶V(CEL45A)的直向同源物或变体选自由多核苷酸编码的多肽,所述多核苷酸在至少高严紧条件下与以下杂交:(i)SEQ ID NO:61的成熟多肽编码序列,(ii)包含在SEQ ID NO:61的成熟多肽编码序列中的cDNA序列,或者包含SEQ ID NO:61的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;
31.权利要求22的丝状真菌宿主细胞,其中所述里氏木霉内切葡聚糖酶V(CEL45A)的直向同源物或变体选自多肽,其由包含与SEQ ID NO:61的成熟多肽编码序列具有至少95%同一性的核苷酸序列的多核苷酸编码。
32.权利要求1的丝状真菌宿主细胞,其产生纤维素分解蛋白质组合物,所述组合物包含:SEQ ID NO:8的成熟多肽的具有增强纤维素分解的活性的多肽;SEQ ID NO:104或SEQ ID NO:106的β-葡糖苷酶融合蛋白;SEQ IDNO:52的成熟多肽的里氏木霉纤维二糖水解酶I(CEL7A),SEQ ID NO:54的成熟多肽的里氏木霉纤维二糖水解酶II(CEL6A),和SEQ ID NO:56的成熟多肽的里氏木霉内切葡聚糖酶I(CEL7B)。
33.权利要求22的丝状真菌宿主细胞,其还产生选自下组的一个或多个酶:SEQ ID NO:58的里氏木霉内切葡聚糖酶II(CEL5A),SEQ ID NO:62的里氏木霉内切葡聚糖酶V(CEL45A),和SEQ ID NO:60的里氏木霉内切葡聚糖酶III(CEL12A)。
34.权利要求33的丝状真菌宿主细胞,其中所述一个或多个酶为一个或几个酶。
35.权利要求1-34中任一项的丝状真菌宿主细胞,其还产生SEQ ID NO:64的成熟多肽的土生梭孢霉(Thielavia terrestris)纤维二糖水解酶。
36.权利要求1的丝状真菌宿主细胞,其中一个或多个第三多核苷酸为一个或几个第三多核苷酸。
37.产生纤维素分解蛋白质组合物的方法,其包含:(a)在有益于产生所述组合物的条件下培养权利要求1-36中任一项的宿主细胞;和(b)回收所述组合物。
38.纤维素分解蛋白质组合物,其包含:(a)具有增强纤维素分解的活性的多肽;(b)β-葡糖苷酶融合蛋白,其包含SEQ ID NO:104或SEQ ID NO:106或其组成为SEQ ID NO:104或SEQ ID NO:106;和(c)一个或多个选自下组的纤维素分解酶:里氏木霉纤维二糖水解酶I(CEL7A),里氏木霉纤维二糖水解酶II(CEL6A),和里氏木霉内切葡聚糖酶I(CEL7B),和它们的直向同源物或变体。
39.权利要求38的纤维素分解蛋白质组合物,其中具有增强纤维素分解的活性的多肽选自下组:
(a)包含[ILMV]-P-X(4,5)-G-X-Y-[ILMV]-X-R-X-[EQ]-X(4)-[HNQ]和[FW]-[TF]-K-[AIV]的具有增强纤维素分解的活性的多肽,其中X是任何氨基酸,X(4,5)是4或5个邻接位置上的任何氨基酸,并且X(4)是4个邻接位置上的任何氨基酸;
(b)包含[ILMV]-P-x(4,5)-G-x-Y-[ILMV]-x-R-x-[EQ]-x(3)-A-[HNQ]的具有增强纤维素分解的活性的多肽,其中x是任何氨基酸,x(4,5)是4或5个邻接位置上的任何氨基酸,并且x(3)是3个邻接位置上的任何氨基酸;
(c)多肽,其包含与SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQID NO:8,或SEQ ID NO:10,SEQ ID NO:12,或SEQ ID NO:14的成熟多肽具有至少90%同一性的氨基酸序列;
(d)由多核苷酸编码的多肽,所述多核苷酸在至少中-高严紧条件下与以下杂交:(i)SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11,或SEQ ID NO:13的成熟多肽编码序列,(ii)包含在SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5或SEQ ID NO:11的成熟多肽编码序列中的cDNA序列,或者包含SEQ ID NO:7、SEQ ID NO:9,或SEQ ID NO:13的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;
(e)多肽,其由包含与SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQID NO:7、SEQ ID NO:9、SEQ ID NO:11,或SEQ ID NO:13的成熟多肽编码序列具有至少90%同一性的核苷酸序列的多核苷酸编码;
(f)SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8,或SEQID NO:10、SEQ ID NO:12,或SEQ ID NO:14的成熟多肽中包含取代、缺失和/或插入一个或几个氨基酸的变体;和
(g)具有增强纤维素分解的活性的多肽,所述多肽包含或其组成为SEQID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8,或SEQ ID NO:10、SEQ ID NO:12,或SEQ ID NO:14的成熟多肽;或者其具有增强纤维素分解的活性的片段。
40.权利要求39的纤维素分解蛋白质组合物,其中具有增强纤维素分解的活性的多肽选自以下多肽,其包含与SEQ ID NO:2、SEQ ID NO:4、SEQ IDNO:6、SEQ ID NO:8,或SEQ ID NO:10,SEQ ID NO:12,或SEQ ID NO:14的成熟多肽具有至少95%同一性的氨基酸序列。
41.权利要求39的纤维素分解蛋白质组合物,其中具有增强纤维素分解的活性的多肽选自由多核苷酸编码的多肽,所述多核苷酸在至少高严紧条件下与以下杂交:(i)SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11,或SEQ ID NO:13的成熟多肽编码序列,(ii)包含在SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5或SEQ ID NO:11的成熟多肽编码序列中的cDNA序列,或者包含SEQ ID NO:7、SEQ ID NO:9,或SEQ ID NO:13的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链。
42.权利要求39的纤维素分解蛋白质组合物,其中具有增强纤维素分解的活性的多肽选自以下多肽,其由包含与SEQ ID NO:1、SEQ ID NO:3、SEQID NO:5、SEQ ID NO:7、SEQ ID NO:9、SEQ ID NO:11,或SEQ ID NO:13的成熟多肽编码序列具有至少95%同一性的核苷酸序列的多核苷酸编码。
43.权利要求39的纤维素分解蛋白质组合物,其中包含[ILMV]-P-X(4,5)-G-X-Y-[ILMV]-X-R-X-[EQ]-X(4)-[HNQ]和[FW]-[TF]-K-[AIV]的具有增强纤维素分解的活性的多肽还包含:
H-X(1,2)-G-P-X(3)-[YW]-[AILMV],
[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV],或
H-X(1,2)-G-P-X(3)-[YW]-[AILMV]和[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV],
其中X是任何氨基酸,X(1,2)是1个位置或2个邻接位置上的任何氨基酸,X(3)是3个邻接位置上的任何氨基酸,并且X(2)是2个邻接位置上的任何氨基酸。
44.权利要求38的纤维素分解蛋白质组合物,其中所述里氏木霉纤维二糖水解酶I(CEL7A)包含或组成为SEQ ID NO:52的成熟多肽;所述里氏木霉纤维二糖水解酶II(CEL6A)包含或组成为SEQ ID NO:54的成熟多肽,和所述里氏木霉内切葡聚糖酶I(CEL7B)包含或组成为SEQ ID NO:56的成熟多肽。
45.权利要求38的纤维素分解蛋白质组合物,其中所述里氏木霉纤维二糖水解酶I(CEL7A)的直向同源物或变体选自下组:
(a)多肽,其包含与SEQ ID NO:52的成熟多肽具有至少90%同一性的氨基酸序列;
(b)由多核苷酸编码的多肽,所述多核苷酸在至少中-高严紧条件下与以下杂交:(i)SEQ ID NO:51的成熟多肽编码序列,(ii)包含在SEQ ID NO:51的成熟多肽编码序列中的cDNA序列,或者包含SEQ ID NO:51的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;
(c)多肽,其由包含与SEQ ID NO:51的成熟多肽编码序列具有至少90%同一性的核苷酸序列的多核苷酸编码;和
(d)SEQ ID NO:52的成熟多肽中包含取代、缺失和/或插入一个或几个氨基酸的变体;且
其中所述里氏木霉纤维二糖水解酶II(CEL6A)的直向同源物或变体选自下组:
(a)多肽,其包含与SEQ ID NO:54的成熟多肽具有至少90%同一性的氨基酸序列;
(b)由多核苷酸编码的多肽,所述多核苷酸在至少中-高严紧条件下与以下杂交:(i)SEQ ID NO:53的成熟多肽编码序列,(ii)包含在SEQ ID NO:53的成熟多肽编码序列中的cDNA序列,或者包含SEQ ID NO:53的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;
(c)多肽,其由包含与SEQ ID NO:53的成熟多肽编码序列具有至少90%同一性的核苷酸序列的多核苷酸编码;和
(d)SEQ ID NO:54的成熟多肽中包含取代、缺失和/或插入一个或几个氨基酸的变体;且
其中所述里氏木霉内切葡聚糖酶I(CEL7B)的直向同源物或变体选自下组:
(a)多肽,其包含与SEQ ID NO:56的成熟多肽具有至少90%同一性的氨基酸序列;
(b)由多核苷酸编码的多肽,所述多核苷酸在至少中-高严紧条件下与以下杂交:(i)SEQ ID NO:55的成熟多肽编码序列,(ii)包含在SEQ ID NO:55的成熟多肽编码序列中的cDNA序列,或者包含SEQ ID NO:55的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;
(c)多肽,其由包含与SEQ ID NO:55的成熟多肽编码序列具有至少90%同一性的核苷酸序列的多核苷酸编码;和
(d)SEQ ID NO:56的成熟多肽中包含取代、缺失和/或插入一个或几个氨基酸的变体。
46.权利要求45的纤维素分解蛋白质组合物,其中所述里氏木霉纤维二糖水解酶I(CEL7A)的直向同源物或变体选自以下多肽,其包含与SEQ ID NO:52的成熟多肽具有至少95%同一性的氨基酸序列。
47.权利要求45的纤维素分解蛋白质组合物,其中所述里氏木霉纤维二糖水解酶I(CEL7A)的直向同源物或变体选自由多核苷酸编码的多肽,所述多核苷酸在至少高严紧条件下与以下杂交:(i)SEQ ID NO:51的成熟多肽编码序列,(ii)包含在SEQ ID NO:51的成熟多肽编码序列中的cDNA序列,或者包含SEQ ID NO:51的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链。
48.权利要求45的纤维素分解蛋白质组合物,其中所述里氏木霉纤维二糖水解酶I(CEL7A)的直向同源物或变体选自以下多肽,其由包含与SEQ ID NO:51的成熟多肽编码序列具有至少95%同一性的核苷酸序列的多核苷酸编码。
49.权利要求45的纤维素分解蛋白质组合物,其中所述里氏木霉纤维二糖水解酶II(CEL6A)的直向同源物或变体选自以下多肽,其包含与SEQ IDNO:54的成熟多肽具有至少95%同一性的氨基酸序列。
50.权利要求45的纤维素分解蛋白质组合物,其中所述里氏木霉纤维二糖水解酶II(CEL6A)的直向同源物或变体选自由多核苷酸编码的多肽,所述多核苷酸在至少高严紧条件下与以下杂交:(i)SEQ ID NO:53的成熟多肽编码序列,(ii)包含在SEQ ID NO:53的成熟多肽编码序列中的cDNA序列,或者包含SEQ ID NO:53的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链。
51.权利要求45的纤维素分解蛋白质组合物,其中所述里氏木霉纤维二糖水解酶II(CEL6A)的直向同源物或变体选自以下多肽,其由包含与SEQ ID NO:53的成熟多肽编码序列具有至少95%同一性的核苷酸序列的多核苷酸编码。
52.权利要求45的纤维素分解蛋白质组合物,其中所述里氏木霉内切葡聚糖酶I(CEL7B)的直向同源物或变体选自以下多肽,其包含与SEQ ID NO:56的成熟多肽具有至少95%同一性的氨基酸序列。
53.权利要求45的纤维素分解蛋白质组合物,其中所述里氏木霉内切葡聚糖酶I(CEL7B)的直向同源物或变体选自由多核苷酸编码的多肽,所述多核苷酸在至少高严紧条件下与以下杂交:(i)SEQ ID NO:55的成熟多肽编码序列,(ii)包含在SEQ ID NO:55的成熟多肽编码序列中的cDNA序列,或者包含SEQ ID NO:55的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链。
54.权利要求45的纤维素分解蛋白质组合物,其中所述里氏木霉内切葡聚糖酶I(CEL7B)的直向同源物或变体选自以下多肽,其由包含与SEQ ID NO:55的成熟多肽编码序列具有至少95%同一性的核苷酸序列的多核苷酸编码。
55.权利要求38-54中任一项的纤维素分解蛋白质组合物,其进一步包含一个或多个第四多核苷酸,其编码选自下组的纤维素分解酶:里氏木霉内切葡聚糖酶II(CEL5A)、里氏木霉内切葡聚糖酶III(CEL12A),和里氏木霉内切葡聚糖酶V(CEL45A),和它们的直向同源物或变体。
56.权利要求55的纤维素分解蛋白质组合物,其中所述一个或多个第四多核苷酸为一个或几个第四多核苷酸。
57.权利要求55的纤维素分解蛋白质组合物,其中所述里氏木霉内切葡聚糖酶II(CEL5A)包含或组成为SEQ ID NO:58的成熟多肽;所述里氏木霉内切葡聚糖酶III(CEL12A)是包含或组成为SEQ ID NO:60的成熟多肽,和所述里氏木霉内切葡聚糖酶V(CEL45A)是包含或组成为SEQ ID NO:61的成熟多肽。
58.权利要求55的纤维素分解蛋白质组合物,其中所述里氏木霉内切葡聚糖酶II(CEL5A)的直向同源物或变体选自下组:
(a)多肽,其包含与SEQ ID NO:58的成熟多肽具有至少90%同一性的氨基酸序列;
(b)由多核苷酸编码的多肽,所述多核苷酸在至少中-高严紧条件下与以下杂交:(i)SEQ ID NO:57的成熟多肽编码序列,(ii)包含在SEQ ID NO:57的成熟多肽编码序列中的cDNA序列,或者包含SEQ ID NO:57的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;
(c)多肽,其由包含与SEQ ID NO:57的成熟多肽编码序列具有至少90%同一性的核苷酸序列的多核苷酸编码;和
(d)SEQ ID NO:58的成熟多肽中包含取代、缺失和/或插入一个或几个氨基酸的变体;
其中所述里氏木霉内切葡聚糖酶III(CEL12A)的直向同源物或变体选自下组:
(a)多肽,其包含与SEQ ID NO:60的成熟多肽具有至少90%同一性的氨基酸序列;
(b)由多核苷酸编码的多肽,所述多核苷酸在至少中-高严紧条件下与以下杂交:(i)SEQ ID NO:59的成熟多肽编码序列,(ii)包含在SEQ ID NO:59的成熟多肽编码序列中的cDNA序列,或者包含SEQ ID NO:59的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;
(c)多肽,其由包含与SEQ ID NO:59的成熟多肽编码序列具有至少90%同一性的核苷酸序列的多核苷酸编码;
(d)SEQ ID NO:60的成熟多肽中包含取代、缺失和/或插入一个或几个氨基酸的变体;且
其中所述里氏木霉内切葡聚糖酶V(CEL45A)的直向同源物或变体选自下组:
(a)多肽,其包含与SEQ ID NO:62的成熟多肽具有至少90%同一性的氨基酸序列;
(b)由多核苷酸编码的多肽,所述多核苷酸在至少中-高严紧条件下与以下杂交:(i)SEQ ID NO:61的成熟多肽编码序列,(ii)包含在SEQ ID NO:61的成熟多肽编码序列中的cDNA序列,或者包含SEQ ID NO:61的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链;
(c)多肽,其由包含与SEQ ID NO:61的成熟多肽编码序列具有至少90%同一性的核苷酸序列的多核苷酸编码;和
(d)SEQ ID NO:62的成熟多肽中包含取代、缺失和/或插入一个或几个氨基酸的变体。
59.权利要求58的纤维素分解蛋白质组合物,其中所述里氏木霉内切葡聚糖酶II(CEL5A)的直向同源物或变体选自以下多肽,其包含与SEQ ID NO:58的成熟多肽具有至少95%同一性的氨基酸序列。
60.权利要求58的纤维素分解蛋白质组合物,其中所述里氏木霉内切葡聚糖酶II(CEL5A)的直向同源物或变体选自由多核苷酸编码的多肽,所述多核苷酸在至少高严紧条件下与以下杂交:(i)SEQ ID NO:57的成熟多肽编码序列,(ii)包含在SEQ ID NO:57的成熟多肽编码序列中的cDNA序列,或者包含SEQ ID NO:57的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链。
61.权利要求58的纤维素分解蛋白质组合物,其中所述里氏木霉内切葡聚糖酶II(CEL5A)的直向同源物或变体选自以下多肽,其由包含与SEQ ID NO:57的成熟多肽编码序列具有至少95%同一性的核苷酸序列的多核苷酸编码。
62.权利要求58的纤维素分解蛋白质组合物,其中所述里氏木霉内切葡聚糖酶III(CEL12A)的直向同源物或变体选自以下多肽,其包含与SEQ ID NO:60的成熟多肽具有至少95%同一性的氨基酸序列。
63.权利要求58的纤维素分解蛋白质组合物,其中所述里氏木霉内切葡聚糖酶III(CEL12A)的直向同源物或变体选自由多核苷酸编码的多肽,所述多核苷酸在至少高严紧条件下与以下杂交:(i)SEQ ID NO:59的成熟多肽编码序列,(ii)包含在SEQ ID NO:59的成熟多肽编码序列中的cDNA序列,或者包含SEQ ID NO:59的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链。
64.权利要求58的纤维素分解蛋白质组合物,其中所述里氏木霉内切葡聚糖酶III(CEL12A)的直向同源物或变体选自以下多肽,其由包含与SEQ ID NO:59的成熟多肽编码序列具有至少95%同一性的核苷酸序列的多核苷酸编码。
65.权利要求58的纤维素分解蛋白质组合物,其中所述里氏木霉内切葡聚糖酶V(CEL45A)的直向同源物或变体选自以下多肽,其包含与SEQ ID NO:62的成熟多肽具有至少95%同一性的氨基酸序列。
66.权利要求58的纤维素分解蛋白质组合物,其中所述里氏木霉内切葡聚糖酶V(CEL45A)的直向同源物或变体选自由多核苷酸编码的多肽,所述多核苷酸在至少高严紧条件下与以下杂交:(i)SEQ ID NO:61的成熟多肽编码序列,(ii)包含在SEQ ID NO:61的成熟多肽编码序列中的cDNA序列,或者包含SEQ ID NO:61的成熟多肽编码序列的基因组DNA序列,或者(iii)(i)或(ii)的全长互补链。
67.权利要求58的纤维素分解蛋白质组合物,其中所述里氏木霉内切葡聚糖酶V(CEL45A)的直向同源物或变体选自以下多肽,其由包含与SEQ ID NO:61的成熟多肽编码序列具有至少95%同一性的核苷酸序列的多核苷酸编码。
68.权利要求38的纤维素分解蛋白质组合物,其包含:SEQ ID NO:8的成熟多肽的具有增强纤维素分解的活性的多肽;SEQ ID NO:104或SEQ IDNO:106的β-葡糖苷酶融合蛋白;SEQ ID NO:52的成熟多肽的里氏木霉纤维二糖水解酶I(CEL7A),SEQ ID NO:54的成熟多肽的里氏木霉纤维二糖水解酶II(CEL6A),和SEQ ID NO:56的成熟多肽的里氏木霉纤维二糖水解酶I(CEL7B)。
69.权利要求68的纤维素分解蛋白质组合物,其进一步包含选自下组的一个或多个酶:SEQ ID NO:58的里氏木霉内切葡聚糖酶II(CEL5A),SEQ IDNO:62的里氏木霉内切葡聚糖酶V(CEL45A),和SEQ ID NO:60的里氏木霉内切葡聚糖酶III(CEL12A)。
70.权利要求69的纤维素分解蛋白质组合物,其中所述一个或多个酶为一个或几个酶。
71.权利要求38-70中任一项的纤维素分解蛋白质组合物,其进一步包含SEQ ID NO:64的成熟多肽的土生梭孢霉纤维二糖水解酶。
72.用于降解或转化含纤维素材料的方法,其包括用权利要求38-71中任一项的纤维素分解蛋白质组合物处理所述含纤维素材料。
73.用于产生发酵产物的方法,其包括:(a)用权利要求38-71中任一项的纤维素分解蛋白质组合物糖化含纤维素材料;(b)用一种或多种发酵微生物发酵步骤(a)的经糖化的含纤维素材料以产生发酵产物;和(c)从发酵液回收所述发酵产物。
CN2008801013711A 2007-05-31 2008-05-30 用于降解纤维素材料的组合物 Expired - Fee Related CN101970651B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US94125107P 2007-05-31 2007-05-31
US60/941,251 2007-05-31
PCT/US2008/065417 WO2008151079A2 (en) 2007-05-31 2008-05-30 Compositions for degrading cellulosic material

Publications (2)

Publication Number Publication Date
CN101970651A CN101970651A (zh) 2011-02-09
CN101970651B true CN101970651B (zh) 2013-10-09

Family

ID=40088716

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008801013711A Expired - Fee Related CN101970651B (zh) 2007-05-31 2008-05-30 用于降解纤维素材料的组合物

Country Status (8)

Country Link
US (2) US9969993B2 (zh)
JP (1) JP2010528624A (zh)
KR (1) KR20100029088A (zh)
CN (1) CN101970651B (zh)
BR (1) BRPI0812267A2 (zh)
MX (1) MX2009012844A (zh)
NZ (1) NZ581257A (zh)
RU (1) RU2494146C2 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106190874A (zh) * 2015-05-06 2016-12-07 中国科学院天津工业生物技术研究所 一种强化丝状真菌蛋白质生产的方法

Families Citing this family (33)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BRPI0812267A2 (pt) * 2007-05-31 2014-10-14 Novozymes Inc Célula hospedeira fúngica filamentosa, método para produzir uma composição de proteína celulolítica, composição de proteína celulolítica, e, métodos para degradar ou converter um material, contendo celulose e para produzir um produto de fermentação
US20090246844A1 (en) * 2007-10-26 2009-10-01 Arbor Fuel Inc. Methods for the production of ethanol
US8338121B2 (en) * 2008-12-19 2012-12-25 Novozymes, Inc. Methods for determining cellulolytic enhancing activity of a polypeptide
JP5618478B2 (ja) * 2008-12-25 2014-11-05 Meiji Seikaファルマ株式会社 新規セルラーゼ遺伝子
WO2010096488A1 (en) * 2009-02-17 2010-08-26 The Regents Of The University Of California Method of reducing acetylation in plants to improve biofuel production
US20100233775A1 (en) * 2009-03-13 2010-09-16 Tech V, LLC System for the production of methane and other useful products and method of use
WO2010110773A1 (en) * 2009-03-27 2010-09-30 Tech V. Llc Methanogenic reactor
US20100248344A1 (en) * 2009-03-27 2010-09-30 Tech V, LLC Methanogenic reactor
WO2010129287A2 (en) 2009-04-27 2010-11-11 The Board Of Trustees Of The University Of Illinois Hemicellulose-degrading enzymes
EP2478096B1 (en) 2009-09-17 2017-05-24 Novozymes, Inc. Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
RU2012116081A (ru) 2009-09-23 2013-10-27 ДАНИСКО ЮЭс ИНК. Новые гликозилгидролазные ферменты и их применения
MX2012003473A (es) 2009-09-29 2012-05-22 Novozymes Inc Polipeptidos que tienen actividad celulitica mejorada y polinucleotidos que codifican para los mismos.
BR112012013468A2 (pt) * 2009-12-04 2016-05-17 Georgia Tech Res Inst processo para tratar uma carga de alimentação compreendendo holocelulose, e, composição adequada para reduzir a cristalinidade da celulose
EP2516663B1 (en) 2009-12-23 2020-02-12 Danisco US Inc. Methods for improving the efficiency of simultaneous saccharification and fermentation reactions
US20120058534A1 (en) * 2010-03-09 2012-03-08 Stover & Associates, Inc. Optimized biogas (biomethane) production process
CN102939376B (zh) 2010-03-31 2016-07-06 明治制果药业株式会社 新纤维素酶基因
CN107435058A (zh) * 2010-08-06 2017-12-05 诺维信公司 降解或水解多糖的方法
MX2013003102A (es) * 2010-09-29 2013-06-28 Beta Renewables Spa Biomasa pretratada que tiene accesibilidad enzimatica potenciada.
BR112013023737A2 (pt) * 2011-03-17 2016-12-13 Danisco Us Inc enzimas de glicosil hidrolase e utilização das mesmas para a hidrólise de biomassa
CA2830508A1 (en) 2011-03-17 2012-09-20 Danisco Us Inc. Method for reducing viscosity in saccharification process
BR112013023715A2 (pt) * 2011-03-17 2016-09-13 Danisco Us Inc "polipeptídeo, polinucleotídeo, vetor, célula hospedeira, e composição para uso em hidrólise de biomassa, bem como métodos para hidrolisar material de biomassa celulósica e para produzir composição de mistura de cultura ou caldo de fermentação"
CN109136114A (zh) * 2011-08-24 2019-01-04 诺维信股份有限公司 在丝状真菌宿主细胞中产生多种重组多肽的方法
BR112014007651A2 (pt) * 2011-09-30 2017-04-11 Novozymes Inc polipeptídeo quimérico isolado, polinucleotídeo isolado, métodos para produzir um polipeptídeo quimérico e um produto de fermentação, para degradar ou converter um material celulósico, e para fermentar um material celulósico, planta, parte de planta ou célula de planta transgênica, e, formulação de caldo inteiro ou composição de cultura de células
US9611462B2 (en) * 2011-12-20 2017-04-04 Codexis, Inc. Endoglucanase 1B (EG1B) variants
US9938551B2 (en) 2012-12-12 2018-04-10 Danisco Us Inc Variants of cellobiohydrolases
CN107988127B (zh) * 2017-11-02 2021-09-03 南京农业大学 里氏木霉木质纤维素酶基因工程乳酸菌组合在调制优质苜蓿青贮饲料中的应用
EP3488854A1 (en) * 2017-11-22 2019-05-29 Technische Universität München Method for preparing xyloglucan-oligosaccharides
CN108048430B (zh) * 2018-01-08 2021-03-26 中国农业科学院北京畜牧兽医研究所 内切葡聚糖酶NfEG12A突变体及其编码基因和应用
AU2019200694B2 (en) * 2018-02-09 2019-10-10 Department Of Biotechnology Additive composition useful for improved production of fermentable sugars from lignocellulosic biomass
RU2696074C1 (ru) * 2018-11-16 2019-07-30 Федеральное государственное бюджетное учреждение науки Федеральный исследовательский центр питания, биотехнологии и безопасности пищи Штамм мицелиального гриба trichoderma reesei - продуцент комплекса эндоглюканазы, ксиланазы и пектиназ для получения белковых добавок на основе зернового и зернобобового сырья для применения в кормопроизводстве
CN110819582B (zh) * 2019-11-28 2021-04-06 华派生物工程集团有限公司 大肠杆菌表达口蹄疫病毒样颗粒抗原的发酵培养基及培养方法
CN112062616A (zh) * 2020-09-29 2020-12-11 东北农业大学 一种促进农作物秸秆原位还田的腐熟剂及其应用
WO2023225459A2 (en) 2022-05-14 2023-11-23 Novozymes A/S Compositions and methods for preventing, treating, supressing and/or eliminating phytopathogenic infestations and infections

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1505682A (zh) * 2000-06-26 2004-06-16 ��ѧ�о��� 用于同时糖化发酵的方法和组合物

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5275944A (en) * 1989-09-26 1994-01-04 Midwest Research Institute Thermostable purified endoglucanas from acidothermus cellulolyticus ATCC 43068
EP0976838A1 (en) * 1998-05-06 2000-02-02 Rhone-Poulenc Nutrition Animale Enzymes mixture
US7375197B2 (en) 2002-01-14 2008-05-20 Midwest Research Institute Cellobiohydrolase I gene and improved variants
DK2295559T3 (en) * 2002-08-16 2015-12-14 Danisco Us Inc Hitherto UNKNOWN HYPROCREA JECORINA CBH1 CELLULASE VARIETY WITH INCREASED THERMAL STABILITY COMPREHENSIVE SUBSTITUTION OR DELETION AT POSITION T255
US7413888B2 (en) * 2003-05-02 2008-08-19 Novozymes, Inc. Variants of beta-glucosidases
EP1660637A4 (en) * 2003-08-25 2009-10-21 Novozymes Inc VARIANTS OF GLYCOSIDE HYDROLASES
JP4842834B2 (ja) 2003-12-09 2011-12-21 ノボザイムス,インコーポレイティド 糸状菌株における遺伝子の発現を排除するか又は低めるための方法
CN104726431B (zh) 2004-01-30 2018-06-01 诺维信股份有限公司 具有分解纤维增强活性的多肽及其编码多核苷酸
JP5015610B2 (ja) * 2004-02-06 2012-08-29 ノボザイムス,インコーポレイティド セルロース分解増強活性を有するポリペプチド及びそれをコードするポリヌクレオチド
CN101321857A (zh) * 2005-09-30 2008-12-10 诺维信股份有限公司 用于增强纤维素材料降解或转化的方法
BRPI0812267A2 (pt) * 2007-05-31 2014-10-14 Novozymes Inc Célula hospedeira fúngica filamentosa, método para produzir uma composição de proteína celulolítica, composição de proteína celulolítica, e, métodos para degradar ou converter um material, contendo celulose e para produzir um produto de fermentação

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1505682A (zh) * 2000-06-26 2004-06-16 ��ѧ�о��� 用于同时糖化发酵的方法和组合物

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106190874A (zh) * 2015-05-06 2016-12-07 中国科学院天津工业生物技术研究所 一种强化丝状真菌蛋白质生产的方法
CN106190874B (zh) * 2015-05-06 2020-06-26 中国科学院天津工业生物技术研究所 一种强化丝状真菌蛋白质生产的方法

Also Published As

Publication number Publication date
BRPI0812267A2 (pt) 2014-10-14
MX2009012844A (es) 2009-12-15
US20180237759A1 (en) 2018-08-23
JP2010528624A (ja) 2010-08-26
NZ581257A (en) 2012-03-30
US9969993B2 (en) 2018-05-15
RU2009149633A (ru) 2011-07-10
CN101970651A (zh) 2011-02-09
KR20100029088A (ko) 2010-03-15
RU2494146C2 (ru) 2013-09-27
US20080299613A1 (en) 2008-12-04

Similar Documents

Publication Publication Date Title
CN101970651B (zh) 用于降解纤维素材料的组合物
CN101809150B (zh) 提高多肽的纤维素分解增强活性的方法
CN101516906B (zh) 提高具有生物学活性之多肽的分泌的方法
CN101784659A (zh) 具有纤维素分解增强活性的多肽和编码它的多核苷酸
CN103282489B (zh) 具有纤维素分解增强活性的多肽变体及其编码多核苷酸
CN101910405A (zh) 降低鞣质对酶促水解纤维素材料的抑制作用的方法
CN103270165A (zh) 包含具有纤维素分解增强活性的多肽和醌化合物的组合物及其用途
CN103890165A (zh) 纤维素分解酶组合物及其用途
CN101855345A (zh) 用于增强含纤维素材料的降解或转化的组合物和方法
CN107190030A (zh) 在纤维二糖脱氢酶存在下增加纤维素材料水解的方法
CN110079558A (zh) 用家族61多肽预处理纤维素材料的方法
CN101910406A (zh) 减少氧化还原活性金属离子对纤维素材料酶水解抑制作用的方法
CN103339252A (zh) 具有纤维素分解增强活性的嵌合多肽及其编码多核苷酸
US8586828B2 (en) Polypeptides having beta-glucosidase activity and polynucleotides encoding same
CN103930438A (zh) 具有β-葡糖苷酶活性的嵌合多肽和对其进行编码的多核苷酸
AU2012205191B2 (en) Compositions for degrading cellulosic material

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20131009

Termination date: 20190530