CN101855345A

CN101855345A - 用于增强含纤维素材料的降解或转化的组合物和方法

Info

Publication number: CN101855345A
Application number: CN200880024110A
Authority: CN
Inventors: 基思·麦克法兰
Original assignee: Novozymes Inc
Current assignee: Novozymes Inc
Priority date: 2007-05-10
Filing date: 2008-05-09
Publication date: 2010-10-06
Also published as: WO2008140749A2; US8999696B2; US9914946B2; EP2069491A2; US20170218413A1; US9631213B2; WO2008140749A3; US20100143967A1; EP2069491B1; CN104962537A; US20150197781A1; BRPI0811465A2; DK2069491T3

Abstract

本发明涉及用于降解或转化含纤维素材料的方法，其包括：用有效量的纤维素分解酶组合物处理含纤维素材料，该纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽和选自下组中的一种或多种(几种)组份：具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性和纤维素结合域的CEL7多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。本发明还涉及这类纤维素分解酶组合物。

Description

用于增强含纤维素材料的降解或转化的组合物和方法

序列表参考

本申请包括计算机可读形式的序列表。在此将该序列表引入作为参考。

生物材料保藏参考

本申请包括生物材料保藏参考，并在将其引入作为参考。

发明背景

发明领域

本发明涉及用于降解或转化含纤维素材料和用于从含纤维素材料生产物质的组合物和方法。

相关领域描述

纤维素是简单糖类葡萄糖通过β-1，4-键共价键合的聚合物。许多微生物产生水解β-连接的葡聚糖的酶。这些酶包括内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶。内切葡聚糖酶在随机位置消化纤维素聚合物，将其打开(openingit)以受到纤维二糖水解酶攻击(attack)。纤维二糖水解酶继而从纤维素聚合物的末端释放纤维二糖的分子。纤维二糖是水溶性的β-1，4-连接的葡萄糖二聚体。β-葡糖苷酶将纤维二糖水解成葡萄糖。

将纤维素原料转化为乙醇具有以下优势：大量原料现成可用，避免燃烧或填埋材料的愿望，和乙醇燃料的清洁性。木材、农业残余物、草本作物和城市固体废物已被认为是用于乙醇生产的原料。这些材料主要由纤维素、半纤维素和木质素组成。一旦将纤维素转化成葡萄糖，葡萄糖将容易地由酵母发酵成乙醇。

市售可得多种商品化的纤维素分解酶制剂，但是其在降解和转化含纤维素材料方面具有有限的功效。改进这些商品化的酶制剂降解和转化纤维素原料的能力在本领域中将是有利的。

在WO 2005/074647中披露了来自土生羧孢霉(Thielavia terrestris)的具有增强纤维素分解的活性(celluolytic enhancing activity)的分离的多肽及其多核苷酸。

在WO 2005/074656中披露了来自嗜热子囊菌(Thermoascus auranticaus)的具有增强纤维素分解的活性的分离的多肽及其多核苷酸。

美国公开的申请第2007/0077630号披露了来自里氏木霉(Trichodermareesei)的具有增强纤维素分解的活性的分离的多肽及其多核苷酸。

在WO 1995/024471中披露了具有内切葡聚糖酶活性的CEL7多肽及其多核苷酸。

在WO 2001/79507中披露了具有纤维二糖水解酶活性和纤维素结合域的CEL7多肽及其多核苷酸。

在WO 2003/000941中披露了具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽及其多核苷酸。

在WO 2001/25468中披露了具有内切葡聚糖酶活性的CEL12多肽及其多核苷酸。

在WO 2000/20555中披露了具有内切葡聚糖酶活性的CEL45多肽及其多核苷酸。

本发明涉及用于改进纤维素分解酶组合物降解和转化纤维素原料的能力的方法。

发明简述

本发明涉及用于降解或转化含纤维素材料的方法，其包括：用有效量的纤维素分解酶组合物处理含纤维素材料，该纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽和选自下组中的一种或多种(几)组份：具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性和纤维素结合域的CEL7多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽；

其中所述具有内切葡聚糖酶活性的CEL7多肽选自下组：(a)多肽，其包含与SEQ ID NO：2的成熟多肽具有至少70％序列同一性的氨基酸序列；(b)由多核苷酸编码的多肽，所述多核苷酸在至少中严紧条件下与以下杂交：(i)SEQ ID NO：1的成熟多肽编码序列，(ii)包含SEQ ID NO：1的成熟多肽编码序列的基因组DNA序列，或者(iii)(i)或(ii)的全长互补链；(c)多肽，其由包含与SEQ ID NO：1的成熟多肽编码序列具有至少70％序列同一性的核苷酸序列的多核苷酸编码；和(d)变体，其包含取代、缺失和/或插入一个或多个(几个)氨基酸的SEQ ID NO：2的成熟多肽；

其中所述具有内切葡聚糖酶活性的CEL12多肽选自下组：(a)多肽，其包含与SEQ ID NO：4的成熟多肽具有至少70％序列同一性的氨基酸序列；(b)由多核苷酸编码的多肽，所述多核苷酸在至少中严紧条件下与以下杂交：(i)SEQ ID NO：3的成熟多肽编码序列，(ii)包含SEQ ID NO：3的成熟多肽编码序列的基因组DNA序列，或者(iii)(i)或(ii)的全长互补链；(c)多肽，其由包含与SEQ ID NO：3的成熟多肽编码序列具有至少70％序列同一性的核苷酸序列的多核苷酸编码；和(d)变体，其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQ ID NO：4的成熟多肽；

其中所述具有内切葡聚糖酶活性的CEL45多肽选自下组：(a)多肽，其包含与SEQ ID NO：6的成熟多肽具有至少70％序列同一性的氨基酸序列；(b)由多核苷酸编码的多肽，所述多核苷酸在至少中严紧条件下与以下杂交：(i)SEQ ID NO：5的成熟多肽编码序列，(ii)包含在SEQ ID NO：5的成熟多肽编码序列中的cDNA序列，或者(iii)(i)或(ii)的全长互补链；(c)多肽，其由包含与SEQ ID NO：5的成熟多肽编码序列具有至少70％序列同一性的核苷酸序列的多核苷酸编码；和(d)变体，其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQ ID NO：6的成熟多肽；

其中所述具有纤维二糖水解酶活性和纤维素结合域的CEL7多肽选自下组：(a)多肽，其包含与SEQ ID NO：8的成熟多肽具有至少70％序列同一性的氨基酸序列；(b)由多核苷酸编码的多肽，所述多核苷酸在至少中严紧条件下与以下杂交：(i)SEQ ID NO：7的成熟多肽编码序列，(ii)包含在SEQ ID NO：7的成熟多肽编码序列中的cDNA序列，或者(iii)(i)或(ii)的全长互补链；(c)多肽，其由包含与SEQ ID NO：7的成熟多肽编码序列具有至少70％序列同一性的核苷酸序列的多核苷酸编码；和(d)变体，其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQ ID NO：8的成熟多肽；

其中所述具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽选自下组：(a)多肽，其包含与SEQ ID NO：10的成熟多肽具有至少70％序列同一性的氨基酸序列；(b)由多核苷酸编码的多肽，所述多核苷酸在至少中严紧条件下与以下杂交：(i)SEQ ID NO：9的成熟多肽编码序列，(ii)包含SEQ IDNO：9的成熟多肽编码序列的基因组DNA序列，或者(iii)(i)或(ii)的全长互补链；(c)多肽，其由包含与SEQ ID NO：9的成熟多肽编码序列具有至少70％序列同一性的核苷酸序列的多核苷酸编码；和(d)变体，其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQ ID NO：10的成熟多肽；和

其中与具有增强纤维素分解的活性的多肽不存在的情况相比，具有增强纤维素分解的活性的多肽的存在，使通过纤维素分解酶组合物进行的对含纤维素材料的降解增加。

本发明还涉及用于产生物质的方法，包括：

(A)用有效量的纤维素分解酶组合物将含纤维素材料糖化，该纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽；和一种或多种(几种)选自下组中组分：具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽；

其中所述具有内切葡聚糖酶活性的CEL7多肽选自下组：(a)多肽，其包含与SEQ ID NO：2的成熟多肽具有至少70％序列同一性的氨基酸序列；(b)由多核苷酸编码的多肽，所述多核苷酸在至少中严紧条件下与以下杂交：(i)SEQ ID NO：1的成熟多肽编码序列，(ii)包含SEQ ID NO：1的成熟多肽编码序列的基因组DNA序列，或者(iii)(i)或(ii)的全长互补链；(c)多肽，其由包含与SEQ ID NO：1的成熟多肽编码序列具有至少70％序列同一性的核苷酸序列的多核苷酸编码；和(d)变体，其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQ ID NO：2的成熟多肽；

其中所述具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽选自下组：(a)多肽，其包含与SEQ ID NO：8的成熟多肽具有至少70％序列同一性的氨基酸序列；(b)由多核苷酸编码的多肽，所述多核苷酸在至少中严紧条件下与以下杂交：(i)SEQ ID NO：7的成熟多肽编码序列，(ii)包含在SEQ ID NO：7的成熟多肽编码序列中的cDNA序列，或者(iii)(i)或(ii)的全长互补链；(c)多肽，其由包含与SEQ ID NO：7的成熟多肽编码序列具有至少70％序列同一性的核苷酸序列的多核苷酸编码；和(d)变体，其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQ ID NO：8的成熟多肽；

其中所述具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽选自下组：(a)多肽，其包含与SEQ ID NO：10的成熟多肽具有至少70％序列同一性的氨基酸序列；(b)由多核苷酸编码的多肽，所述多核苷酸在至少中严紧条件下与以下杂交：(i)SEQ ID NO：9的成熟多肽编码序列，(ii)包含在SEQID NO：9的成熟多肽编码序列中的cDNA序列或包含SEQ ID NO：9的成熟多肽编码序列的基因组DNA序列，或(iii)(i)或(ii)的全长互补链；(c)多肽，其由包含与SEQ ID NO：9的成熟多肽编码序列具有至少70％序列同一性的核苷酸序列的多核苷酸编码；和(d)变体，其包含取代、缺失、和/或插入一个或多个(几)氨基酸的SEQ ID NO：10的成熟多肽；并且

其中与具有增强纤维素分解的活性的多肽不存在的情况相比，具有增强纤维素分解的活性的多肽的存在，使通过纤维素分解酶组合物进行的对含纤维素材料的降解增加；

(B)用一种或多种(几种)发酵微生物发酵步骤(a)中的糖化的含纤维素材料以产生发酵产物；和

(C)回收发酵产物。

本发明也涉及这样的纤维素分解酶组合物，其包含有效量的具有增强纤维素分解的活性的多肽。

附图简述

图1显示在50℃和pH 5.0下仅用

LDI；用

LDI和米曲霉(Aspergillus oryzae)β-葡糖苷酶；以及用

LDI、米曲霉β-葡糖苷酶和嗜热子囊菌GH61A蛋白消化50g PCS 72小时。连接数据点的曲线仅仅是为了清楚地说明。

定义

增强纤维素分解的活性：术语“增强纤维素分解的活性”在本文定义为增强具有纤维素分解活性的蛋白对含纤维素材料的水解的生物活性。就本发明而言，通过在以下条件下测量来自含纤维素材料通过纤维素分解蛋白的水解的还原糖的增加或总纤维二糖和葡萄糖的增加来测定增强纤维素分解的活性：1-50mg含80-99.5％w/w纤维素分解蛋白的总蛋白/g PCS中的纤维素和0.5-20％w/w增强纤维素分解活性的蛋白，在50℃下持续1-7天，与使用相等总蛋白加样量的不含增强纤维素分解的活性的对照水解比较(1-50mg纤维素分解蛋白/g PCS中的纤维素)。在优选的方面，在纤维素酶蛋白加样量为3％的米曲霉β-葡糖苷酶(根据WO 02/095014在米曲霉中重组产生)或3％的烟曲霉(Aspergilus fumigatus)β-葡糖苷酶(根据WO 02/095014的实施例22在米曲霉中重组产生)的存在下，使用

1.5L(Novozymes A/S，

Denmark)的混合物作为纤维素分解活性的标准。

具有增强纤维素分解的活性的多肽具有SEQ ID NO：12、14、16、18、20、22或24的成熟多肽的增强纤维素分解的活性的至少20％，优选至少40％，更优选至少50％，更优选至少60％，更优选至少70％，更优选至少80％，甚至更优选至少90％，最优选至少95％，并且最优选至少100％。

所述具有增强纤维素分解的活性的多肽以下述方式增强由具有纤维素分解活性的蛋白质所进行的含纤维素材料的水解：将为达到同样水解程度所需的纤维素分解酶的量减少优选至少0.1倍，更优选至少0.2倍、更优选至少0.3倍、更优选至少0.4倍、更优选至少0.5倍、更优选至少1倍、更优选至少3倍、更优选至少4倍、更优选至少5倍、更优选至少10倍、更优选至少20倍、进一步更优选至少30倍、最优选至少50倍、进一步最优选至少100倍。

纤维素分解活性：术语“纤维素分解活性”在本文定义为水解含纤维素材料的纤维素酶活性(如内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶或其组合)。纤维素分解蛋白可以水解羧甲基纤维素(CMC)，由此降低温育混合物的粘度。可以通过振动粘度计(vibration viscosimeter)(如源于法国Sofraser的MIVI 3000)测定所产生的粘度上的降低。纤维素酶活性的测定按照纤维素酶粘度单位(CEVU)来测量，所述测定通过测量样品降低羧甲基纤维素(CMC)溶液粘度的能力来定量该样品中存在的催化活性的量。本测定是在适合于纤维素分解蛋白和底物的温度和pH值下进行的。

就本发明而言，通过在以下条件下测量纤维素分解组合物对含纤维素材料的水解相对于不加入纤维素分解蛋白的对照水解的增加来测定纤维素分解活性：1-50mg纤维素分解蛋白/g PCS中的纤维素，在50℃持续1-7天。

内切葡聚糖酶：术语“内切葡聚糖酶”在本文中的定义为内切-1，4-(1，3；1，4)-β-D葡聚糖4-葡聚糖水解酶(endo-1，4-β-D-glucan4-glucanohydrolase)(E.C.No.3.2.1.4)，其催化纤维素、纤维素衍生物(如羧甲基纤维素和羟乙基纤维素)、地衣淀粉、混合的β-1，3葡聚糖如谷物β-D-葡聚糖或木葡聚糖中的β-1，4键和其它含有纤维素成分的生物材料中1，4-β-D-糖苷键的水解。就本发明而言，根据Ghose，1987，Pure and Appl.Chem.59：257-268中的方法使用羧甲基纤维素(CMC)水解作用测定内切葡聚糖酶的活性。

具有内切葡聚糖酶活性的多肽具有SEQ ID NO：2、4或6的成熟多肽的内切葡聚糖酶的活性的至少20％，优选至少40％，更优选至少50％，更优选至少60％，更优选至少70％，更优选至少80％，甚至更优选至少90％，最优选至少95％，并且甚至最优选至少100％的活性。

纤维二糖水解酶：术语“纤维二糖水解酶”在本文中的定义为1，4-β-D-葡聚糖纤维二糖水解酶(E.C.3.2.1.91)，其催化纤维素、纤维寡糖或任何包含β-1，4-连接的葡萄糖的聚合物中1，4-β-D葡糖苷键的水解，从链的还原端或非还原端释放的纤维二糖。就本发明而言，根据Lever等人，1972，Anal.Biochem.47：273-279和van Tilbeurgh等人，1982，FEBS Letters 149：152-156；van Tilbeurgh和Claeyssens，1985，FEBS Letters 187：283-288所描述的程序测定纤维二糖水解酶的活性。在本发明中，使用Lever等人方法来评估玉米秸秆中纤维素的水解，同时使用van Tilbeurgh等人的方法来测定对于荧光二糖衍生物的纤维二糖水解酶活性。

具有纤维二糖水解酶的活性的多肽具有SEQ ID NO：8或10的成熟多肽的纤维二糖水解酶的活性的至少20％，优选至少40％，更优选至少50％，更优选至少60％，更优选至少70％，更优选至少80％，甚至更优选至少90％，最优选至少95％，并且甚至最优选至少100％的活性。

β-葡糖苷酶：术语“β-葡糖苷酶”在本文定义为β-D-葡糖苷葡糖水解酶(E.C.3.2.1.21)，其催化末端非还原性β-D-葡萄糖残基的水解，并且释放β-D-葡萄糖。就本发明而言，根据Venturi等人，2002，J.Basic Microbiol.42：55-66描述的基本程序来测定β-葡糖苷酶活性，但是采用如本文所述的不同的条件。将1单位的β-葡糖苷酶活性定义为在50℃、pH 5，从100mM柠檬酸钠、0.01％

中作为底物的4mM对硝基苯基-β-D-吡喃型葡糖苷每分钟产生1.0微摩尔对硝基苯酚。

具有β-葡糖苷酶的活性的多肽具有SEQ ID NO：26、28或30的成熟多肽的β-葡糖苷酶的活性的至少20％，优选至少40％，更优选至少50％，更优选至少60％，更优选至少70％，更优选至少80％，甚至更优选至少90％，最优选至少95％，并且甚至最优选至少100％的活性。

家族7，12，45或61糖苷水解酶：术语“家族7糖苷水解酶”或“家族GH7”，“家族12糖苷水解酶”或“家族GH12”，“家族45糖苷水解酶”或“家族GH45”，和“家族61糖苷水解酶”或“家族GH61”在本文中定义为根据Henrissat，1991，A classification of glycosyl hydrolases based on amino-acid sequence similarities，Biochem.J.280：309-316，和Henrissat B和Bairoch A.，1996，Updating thesequence-based classification of glycosyl hydrolases，Biochem.J.316：695-696分别归入糖苷水解酶家族7、家族12、家族45、家族61的多肽。目前，Henrissat将GH61家族列为未分类，说明就属于此家族的多肽而言，诸如机制、催化性亲核体/碱、催化性质子供体和3-D结构等性质是未知的。GH7、GH12或GH45蛋白也分别称作CEL7、CEL12或CEL45。

含纤维素材料：生物质的初生细胞壁中的主要多糖是纤维素，第二丰富的多糖是半纤维素，而第三是果胶。在细胞停止生长之后产生的次生细胞壁也含有多糖，并且其通过与半纤维素共价交联的聚合木质素强化。纤维素是无水纤维二糖的均聚物，并且因此是支链的β-(1-4)-D-葡聚糖，而半纤维素包括多种化合物，例如具有带有一系列取代基的复杂分支结构的木聚糖、木葡聚糖、阿拉伯木聚糖和甘露聚糖。尽管通常是多形态的，纤维素在植物组织中主要作为由平行葡聚糖链构成的不溶晶体基质存在。半纤维素通常与纤维素以及与其它半纤维素通过氢键连接，其辅助稳定细胞壁基质。

含纤维素材料可以是任何含纤维素的材料。纤维素通常存在于例如植物的茎、叶、果/种壳(hulls)、果/种皮(husks)、和穗轴(cob)中，或树的叶、枝和木材中。含纤维素材料可以是但不限于草本材料、农业残余物、林业残余物、市政固体废物、废纸和纸浆及造纸厂残余物。含纤维素材料可以是任意类型的生物质包括但不限于木材资源、市政固体废物、废纸、作物和作物残余物(参见，例如，Wiselogel等人，1995，在Handbook on Bioethanol(Charles E.Wyman，editor)中，105-118页，Taylor&Francis，Washington D.C.；Wyman，1994，Bioresource Technology 50：3-16；Lynd，1990，Applied Biochemistry andBiotechnology 24/25：695-719；Mosier等人，1999，Recent Progress inBioconversion of Lignocellulosics，在Advances in BiochemicalEngineering/Biotechnology，T.Scheper，managing editor，Volume 65，23-40页，Springer-Verlag，New York)。在本文中可理解的是含纤维素材料优选为木素纤维素的形式，例如，在混合基质中含有木质素、纤维素和半纤维素的植物细胞壁材料。

在优选的方面，含纤维素材料是玉米秸秆。在另一优选的方面，含纤维素材料是玉米纤维。在另一优选的方面，含纤维素材料是柳枝稷(switch grass)。在另一优选的方面，含纤维素材料是稻草(rice straw)。在另一优选的方面，含纤维素材料是造纸和纸浆加工废料。在另一优选的方面，含纤维素材料是木本或草本植物。在另一优选的方面，纤维素材料是蔗渣。

可以按原样使用含纤维素材料或可使用本领域已知的常规方法对含纤维素材料进行预处理。例如，物理预处理技术可包括多种类型的磨制、照射、蒸煮/蒸汽爆炸和水热分解(hydrothermolysis)；化学预处理技术可包括稀酸、碱、有机溶剂、氨、二氧化硫、二氧化碳和pH控制的水热分解；而生物预处理技术可包括应用溶解木质素的微生物(参见，例如，Hsu，T.-A.，1996，Pretreatment of biomass，in Handbook on Bioethanol：Production and Utilization，Wyman，C.E.，ed.，Taylor&Francis，Washington，DC，179-212；Ghosh，P.，和Singh，A.，1993，Physicochemical and biological treatments forenzymatic/microbial conversion of lignocellulosic biomass，Adv.Appl.Microbiol.39：295-333；McMillan，J.D.，1994，Pretreating lignocellulosic biomass：a review，in Enzymatic Conversion of Biomass for Fuels Production，Himmel，M.E.，Baker，J.O.，和Overend，R.P.，eds.，ACS Symposium Series 566，American ChemicalSociety，Washington，DC，chapter 15；Gong，C.S.，Cao，N.J.，Du，J.，和Tsao，G.T.，1999，Ethanol production from renewable resources，in Advances in BiochemicalEngineering/Biotechnology，Scheper，T.，ed.，Springer-Verlag Berlin Heidelberg，Germany，65：207-241；Olsson，L.，和Hahn-Hagerdal，B.，1996，Fermentation oflignocellulosic hydrolysates for ethanol production，Enz.Microb.Tech.18：312-331；以及Vallander，L.，和Eriksson，K.-E.L.，1990，Production of ethanolfrom lignocellulosic materials：State of the art，Adv.Biochem.Eng./Biotechnol.42：63-95)。

预处理的玉米秸秆：术语“PCS”或“预处理的玉米秸秆”在本文中的定义为源自通过加热和稀酸处理的玉米秸秆的含纤维素的材料。就本发明而言，PCS通过实施例1中所述方法，或者改变时间、温度和酸量的该方法的变化形式来制备。

分离的多肽：术语“分离的多肽”用于本文中指的是从来源分离的多肽。在优选的方面，如通过SDS-PAGE测定的，多肽至少1％纯，优选至少5％纯，更优选至少10％纯，更优选至少20％纯，更优选至少40％纯，更优选至少60％纯，甚至更优选至少80％纯，以及最优选至少90％纯。

基本上纯的多肽：术语“基本上纯的多肽”在本文表示多肽制备物，所述多肽制备物按重量计含有至多10％，优选至多8％，更优选至多6％，更优选至多5％，更优选至多4％，更优选至多3％，甚至更优选至多2％，最优选至多1％，并且甚至最优选至多0.5％的与其天然结合的(associated)或重组结合的其它多肽材料。因此，优选所述基本上纯的多肽是按存在于制备物中的全部多肽材料的重量计至少92％纯，优选至少94％纯，更优选至少95％纯，更优选至少96％纯，更优选至少96％纯，更优选至少97％纯，更优选至少98％纯，甚至更优选至少99％纯，最优选至少99.5％纯，并且甚至最优选100％纯。本发明的多肽优选是基本上纯的形式，即，所述多肽制备物基本上(essentially)不含与其天然结合的或重组结合的其它多肽材料。这能够通过以下方法实现，例如，通过公知的重组方法或由经典纯化方法制备多肽。

成熟多肽：术语“成熟多肽”在本文中定义为具有生物活性(如酶活性)的多肽，所述多肽以其在翻译和任何翻译后修饰之后的最终形式存在，所述修饰例如N-末端加工、C-末端截断、糖基化、磷酸化等。

成熟多肽编码序列：术语“成熟多肽编码序列”在本文中定义为编码成熟多肽的核苷酸序列，所述成熟多肽具有生物活性。

同一性：参数“同一性”描述两个氨基酸序列之间或两个核苷酸序列之间的相关性。

就本发明而言，两个氨基酸序列之间的同一性程度使用EMBOSS程序包(EMBOSS：The European Molecular Biology Open Software Suite，Rice等人，2000，Trends in Genetics 16：276-277)的Needle程序中执行的Needleman-Wunsch算法(Needleman and Wunsch，1970，J.Mol.Biol.48：443-453)来测定，优选版本3.0或更新的版本。使用的可选参数是缺口开启罚分(gap open penalty)10，缺口延伸罚分(gap extension penalty)0.5和EBLOSUM62(BLOSUM62的EMBOSS版本)取代矩阵。使用Needle标记的“最长同一性”(使用-nobrief选项得到)的输出作为百分比同一性并且如下计算：

(相同的残基×100)/(比对的长度-比对中的缺口总数)

就本发明而言，两个脱氧核糖核酸序列之间的同一性程度使用EMBOSS程序包(EMBOSS：The European Molecular Biology Open Software Suite，Rice等人，2000，supra)的Needle程序中执行的Needleman-Wunsch算法(Needlemanand Wunsch，1970，见上文)来测定，优选版本3.0或更新的版本。使用的可选参数是缺口开启罚分10，缺口延伸罚分0.5和EDNAFULL(NCBI NUC4.4的EMBOSS版本)取代矩阵。使用Needle标记的“最长同一性”(使用-nobrief选项得到)的输出作为百分比同一性并且如下计算：

(相同的脱氧核糖核苷酸×100)/(比对的长度-比对中的缺口总数)

同源序列：术语“同源序列”在本文定义为使用blastp(用于蛋白质数据库)或tblastn(用于核酸数据库)算法，使用BLOSUM62矩阵、字长(wordsize)3、缺口存在分值(gap existence cost)11、缺口延伸分值(gap extension cost)1、无低复杂性过滤并且使用成熟的GH61、GH7、GH12或GH45蛋白序列作为查询对象时，E值(或预期得分(expectancy score))小于0.001的序列。参见Altschul等人，1997，Nucleic Acids Res.25：3389-3402。

多肽片段：术语“多肽片段”在本文中定义为从SEQ ID NO：2、SEQ ID NO：4、SEQ ID NO：6、SEQ ID NO：8、SEQ ID NO：10、SEQ ID NO：12、SEQ IDNO：14、SEQ ID NO：16、SEQ ID NO：18或SEQ ID NO：20、SEQ ID NO：22、SEQ ID NO：24、SEQ ID NO：26、SEQ ID NO：28或SEQ ID NO：30的成熟多肽的氨基和/或羧基末端缺失一个或多个(几个)氨基酸的多肽，或者其同源序列；其中所述片段具有其成熟多肽的活性。优选的，SEQ ID NO：2的成熟多肽的片段含有至少340个氨基酸残基，更优选至少370个氨基酸残基，并且最优选至少400个氨基酸残基。优选的，SEQ ID NO：4的成熟多肽的片段含有至少200个氨基酸残基，更优选至少210个氨基酸残基，并且最优选至少220个氨基酸残基。优选的，SEQ ID NO：6的成熟多肽的片段含有至少175个氨基酸残基，更优选至少185个氨基酸残基，并且最优选至少195个氨基酸残基。优选的，SEQ ID NO：8的成熟多肽的片段含有至少425个氨基酸残基，更优选至少450个氨基酸残基，并且最优选至少475个氨基酸残基。优选的，SEQ ID NO：10的成熟多肽的片段含有至少370个氨基酸残基，更优选至少390个氨基酸残基，并且最优选至少410个氨基酸残基。优选的，SEQ IDNO：12的成熟多肽的片段含有至少277个氨基酸残基，更优选至少287个氨基酸残基，并且最优选至少297个氨基酸残基。优选的，SEQ ID NO：14的成熟多肽的片段含有至少185个氨基酸残基，更优选至少195个氨基酸残基，并且最优选至少205个氨基酸残基。优选的，SEQ ID NO：16的成熟多肽的片段含有至少200个氨基酸残基，更优选至少212个氨基酸残基，并且最优选至少224个氨基酸残基。优选的，SEQ ID NO：18的成熟多肽的片段含有至少175个氨基酸残基，更优选至少185个氨基酸残基，并且最优选至少195个氨基酸残基。优选的，SEQ ID NO：20的成熟多肽的片段含有至少240个氨基酸残基，更优选至少255个氨基酸残基，并且最优选至少270个氨基酸残基。优选的，SEQ ID NO：22的成熟多肽的片段含有至少175个氨基酸残基，更优选至少190个氨基酸残基，并且最优选至少205个氨基酸残基。优选的，SEQID NO：24的成熟多肽的片段含有至少200个氨基酸残基，更优选至少210个氨基酸残基，并且最优选至少220个氨基酸残基。优选的，SEQ ID NO：26的成熟多肽的片段含有至少720个氨基酸残基，更优选至少760个氨基酸残基，并且最优选至少800个氨基酸残基。优选的，SEQ ID NO：28的成熟多肽的片段含有至少720个氨基酸残基，更优选至少760个氨基酸残基，并且最优选至少800个氨基酸残基。优选的，SEQ ID NO：30的成熟多肽的片段含有至少720个氨基酸残基，更优选至少760个氨基酸残基，并且最优选至少800个氨基酸残基。

亚序列：术语“亚序列(subsequence)”在本文中定义为从SEQ ID NO：1、SEQ ID NO：3、SEQ ID NO：5、SEQ ID NO：7、SEQ ID NO：9、SEQ ID NO：11、SEQ ID NO：13、SEQ ID NO：15、SEQ ID NO：17、SEQ ID NO：19、SEQ ID NO：21或SEQ ID NO：23的成熟多肽编码序列的5’和/或3’端缺失一个或多个(几个)核苷酸的核苷酸序列；或其同源序列，其中所述亚序列编码具有其成熟多肽的活性的多肽片段。优选的，SEQ ID NO：1的成熟多肽编码序列的亚序列含有至少1020个核苷酸，更优选至少1110个核苷酸，并且最优选至少1200个核苷酸。优选的，SEQ ID NO：3的成熟多肽编码序列的亚序列含有至少600个核苷酸，更优选至少630个核苷酸，并且最优选至少660个核苷酸。优选的，SEQ ID NO：5的成熟多肽编码序列的亚序列含有至少525个核苷酸，更优选至少555个核苷酸，并且最优选至少585个核苷酸。优选的，SEQ ID NO：7的成熟多肽编码序列的亚序列含有至少1275个核苷酸，更优选至少1350个核苷酸，并且最优选至少1425个核苷酸。优选的，SEQ ID NO：9的成熟多肽编码序列的亚序列含有至少1110个核苷酸，更优选至少1170个核苷酸，并且最优选至少1230个核苷酸。优选的，SEQ ID NO：11的成熟多肽编码序列的亚序列含有至少831个核苷酸，更优选至少861个核苷酸，并且最优选至少891个核苷酸。优选的，SEQ ID NO：13的成熟多肽编码序列的亚序列含有至少555个核苷酸，更优选至少585个核苷酸，并且最优选至少615个核苷酸。优选的，SEQ ID NO：15的成熟多肽编码序列的亚序列含有至少600个核苷酸，更优选至少636个核苷酸，并且最优选至少672个核苷酸。优选的，SEQ ID NO：17的成熟多肽编码序列的亚序列含有至少525个核苷酸，更优选至少555个核苷酸，并且最优选至少585个核苷酸。优选的，SEQ ID NO：19的成熟多肽编码序列的亚序列含有至少720个核苷酸，更优选至少765个核苷酸，并且最优选至少810个核苷酸。优选的，SEQ ID NO：21的核苷酸67至796的成熟多肽编码序列的亚序列含有至少525个核苷酸，更优选至少570个核苷酸，并且最优选至少615个核苷酸。优选的，SEQ ID NO：23的成熟多肽编码序列的亚序列含有至少600个核苷酸，更优选至少630个核苷酸，并且最优选至少660个核苷酸。优选的，SEQ ID NO：25的成熟多肽编码序列的亚序列含有至少2160个核苷酸，更优选至少2280个核苷酸，并且最优选至少2400个核苷酸。优选的，SEQ ID NO：27的成熟多肽编码序列的亚序列含有至少2160个核苷酸，更优选至少2280个核苷酸，并且最优选至少2400个核苷酸。优选的，SEQ ID NO：29的成熟多肽编码序列的亚序列含有至少2160个核苷酸，更优选至少2280个核苷酸，并且最优选至少2400个核苷酸。

等位变体(allelic variant)：术语“等位变体”在本文中表示占据相同染色体基因座的基因的任何两种或两种以上可选形式。等位变异通过突变天然地发生，并且可导致种群内的多态性。基因突变可以是沉默的(在编码的多肽中无变化)或可以编码具有改变的氨基酸序列的多肽。多肽的等位变体是由基因的等位变体编码的多肽。

分离的多核苷酸：术语“分离的多核苷酸”用于本文中指与来源分离的多核苷酸。在优选的方面，如通过琼脂糖电泳测定的，所述多核苷酸为至少1％纯，优选至少5％纯，更优选至少10％纯，更优选至少20％纯，更优选至少40％纯，更优选至少60％纯，甚至更优选至少80％纯，以及最优选至少90％纯。

基本上纯的多核苷酸：术语“基本上纯的多核苷酸”用于本文指不含其它外来的或不期望的核苷酸的多核苷酸制备物，并且所述多核苷酸制备物处于适合于在遗传工程的蛋白质生产体系中使用的形式。因此，基本上纯的多核苷酸按重量计含有至多10％，优选至多8％，更优选至多6％，更优选至多5％，更优选至多4％，更优选至多3％，甚至更优选至多2％，最优选至多1％，并且甚至最优选至多0.5％的与其天然结合的或重组结合的其它多核苷酸材料。然而，基本上纯的多核苷酸可以包括天然存在的5’和3’非翻译区，例如启动子和终止子。优选基本上纯的多核苷酸是按重量计至少90％纯，优选至少92％纯，更优选至少94％纯，更优选至少95％纯，更优选至少96％纯，更优选至少97％纯，甚至更优选至少98％纯，最优选至少99％，并且甚至最优选至少99.5％纯的。本发明所述多核苷酸优选为基本上纯的形式，即，所述多核苷酸制备物基本上不含与其天然结合的或重组结合的其它多核苷酸材料。所述多核苷酸可以是基因组、cDNA、RNA、半合成、合成来源的，或它们的任意组合。

编码序列：当用于本文时术语“编码序列”的意思是直接指定其蛋白产物的氨基酸序列的核苷酸序列。编码序列的边界通常由开读框决定，所述开读框通常以ATG起始密码子或可选的起始密码子例如GTG和TTG开始，并且以终止密码子例如TAA、TAG和TGA结束。编码序列可以是DNA、cDNA、合成的或重组的核苷酸序列。

cDNA：术语“cDNA”在本文中定义为能够通过逆转录从得自真核细胞的成熟的、已剪接的mRNA分子制备的DNA分子。cDNA缺少通常存在于相应基因组DNA中的内含子序列。起始的(initial)、初级的RNA转录物是mRNA的前体，其通过一系列的步骤加工然后作为成熟的已剪接的mRNA出现。这些步骤包括通过称为剪接的过程去除内含亚序列。因而源自mRNA的cDNA没有任何内含子序列。

核酸构建体：术语“核酸构建体”用于本文指单链或双链的核酸分子，所述核酸分子分离自天然存在的或者合成的基因，或将所述核酸分子以本来不存在于(not otherwise exist)自然界中的方式修饰以含有核酸的片段。当所述核酸构建体含有表达本发明中的编码序列所需的调控序列时，术语核酸构建体与术语“表达盒”同义。

调控序列(control sequence)：术语“调控序列”在本文定义为包括对于本发明中编码多肽的多核苷酸的表达是必需的所有成分。各调控序列对于编码所述多肽的核苷酸序列可以是天然的或外源的，或各调控序列对于彼此可以是天然的或外源的。这些调控序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。最少的情况，调控序列包括启动子和转录和翻译的终止信号。调控序列可以和用于引入特异性限制位点的接头一起提供，所述特异性限制位点促进调控序列与编码多肽的核苷酸序列编码区的连接。

可操作地连接：术语“可操作地连接”在本文表示这样的构型，其中将调控序列置于相对于多核苷酸序列的编码序列的适当位置，使得调控序列指导多肽编码序列的表达。

表达：术语“表达”包括涉及多肽产生的任何步骤，其包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。

表达载体：术语“表达载体”在本文定义为线性的或环状的DNA分子，其包含编码本发明多肽的多核苷酸，并且所述多核苷酸与提供用于其表达的额外核苷酸可操作地连接。

宿主细胞：如本文中所使用的术语“宿主细胞”包括任何细胞类型，所述细胞类型对于用包含本发明中的多核苷酸的核酸构建体或表达载体的转化、转染、转导等是易感的(susceptible)。

修饰：术语“修饰”在本文的意思是，对由SEQ ID NO：2、SEQ ID NO：4、SEQ ID NO：6、SEQ ID NO：8、SEQ ID NO：10、SEQ ID NO：12、SEQ ID NO：14、SEQ ID NO：16、SEQ ID NO：18或SEQ ID NO：20、SEQ ID NO：22、SEQID NO：24、SEQ ID NO：26、SEQ ID NO：28或SEQ ID NO：30的成熟多肽或其同源序列组成的多肽的任何化学修饰；以及对编码这种多肽的DNA的遗传操作。所述修饰可以是一个或多个(几个)氨基酸的取代、缺失和/或插入，以及一个或多个(几个)氨基酸侧链的取代。

人工变体：当用在本文时，术语“人工变体”的意思是由表达SEQ ID NO：1、SEQ ID NO：3、SEQ ID NO：5、SEQ ID NO：7、SEQ ID NO：9、SEQ ID NO：11、SEQ ID NO：13、SEQ ID NO：15、SEQ ID NO：17、SEQ ID NO：19、SEQIDNO：21、SEQ ID NO：23、SEQ ID NO：25、SEQ ID NO：27或SEQ ID NO：29的成熟多肽编码序列的修饰的核苷酸序列或其同源序列的生物体产生的多肽。所述修饰的多核苷酸序列通过人为干预(human intervention)，通过修饰公开于SEQ ID NO：1，SEQ ID NO：3，SEQ ID NO：5，SEQ ID NO：7，SEQ ID NO：9，SEQ ID NO：11，SEQ ID NO：13，SEQ ID NO：15，SEQ ID NO：17，SEQ IDNO：19，SEQ ID NO：21，SEQ ID NO：23，SEQ ID NO：25，SEQ ID NO：27或SEQ ID NO：29的多核苷酸序列或其同源序列的核苷酸序列来获得。

发明详述

本发明涉及用于降解或转化含纤维素材料的方法，其包括：用有效量的纤维素分解酶组合物处理所述含纤维素材料，其中所述纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽，以及一种或多种(几种)选自下组的组分：具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽，其中与缺乏所述具有增强纤维素分解的活性的多肽时相比，具有增强纤维素分解的活性的多肽的存在使通过纤维素分解酶组合物进行的对纤维素材料的降解增加。

本发明进一步包括回收降解或转化的含纤维素材料。可使用本领域熟知的技术例如离心、过滤和重力沉降，将含纤维素材料的降解或转化的可溶产物与不溶的含纤维素材料分离。

本发明还涉及产生物质的方法，包括：(a)用有效量的纤维素分解酶组合物糖化含纤维素材料，该纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽和一种或多种(几种)选自下组的组分：具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽，和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽，其中与缺乏具有增强纤维素分解的活性的多肽时相比，具有增强纤维素分解的活性的多肽的存在使通过纤维素分解酶组合物进行的对含纤维素材料的降解增加；(b)用一种或多种(几种)发酵微生物发酵步骤(a)中的糖化的含纤维素材料以产生发酵产物；和(c)回收发酵产物。

本发明还涉及这些包含有效量的具有增强纤维素分解的活性的多肽的纤维素分解酶组合物。

纤维素分解酶组合物

本发明还涉及纤维素分解酶组合物，其包含具有增强纤维素分解的活性的多肽和一种或多种(几中)选自下组的组分：具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。

第一方面，具有内切葡聚糖酶活性的分离的CEL7多肽包含的氨基酸序列与SEQ ID NO：2的成熟多肽具有优选至少70％的序列同一性程度，更优选至少75％，甚至更优选至少80％，甚至更优选至少85％，甚至更优选至少90％，最优选至少95％，并且甚至最优选至少96％，97％，98％或99％的序列同一性程度，所述多肽具有内切葡聚糖酶活性(以下称“同源多肽”)。在优选的方面，所述同源多肽包含的氨基酸序列与SEQ ID NO：2的成熟多肽有十个氨基酸，优选五个氨基酸，更优选四个氨基酸，甚至更优选三个氨基酸，最优选两个氨基酸以及甚至最优选一个氨基酸不同。

具有内切葡聚糖酶活性的CEL7多肽优选包含SEQ ID NO：2的氨基酸序列或其等位变体，或者其具有内切葡聚糖酶活性的片段。在优选的方面，多肽包含SEQ ID NO：2的氨基酸序列。在另一优选的方面，多肽包含SEQ ID NO：2的成熟多肽。在另一优选的方面，多肽包含SEQ ID NO：2的氨基酸21至456，或其等位变体；或者其具有内切葡聚糖酶活性的片段。在另一优选的方面，多肽包含SEQ ID NO：2的氨基酸21至456。在另一优选的方面，多肽由SEQ ID NO：2的氨基酸序列或其等位变体，或者其具有内切葡聚糖酶活性的片段组成。在另一优选的方面，多肽由SEQ ID NO：2的氨基酸序列组成。在另一优选的方面，多肽由SEQ ID NO：2的成熟多肽组成。在另一优选的方面，多肽由SEQ ID NO：2的氨基酸21至456或其等位变体，或其具有内切葡聚糖酶活性的片段组成。在另一优选的方面，多肽由SEQ ID NO：2的氨基酸21至456组成。

根据WO 1995/024471可以获得具有内切葡聚糖酶活性的CEL7多肽。

在另一第一方面，具有内切葡聚糖酶活性的分离的CEL12多肽包含的氨基酸序列与SEQ ID NO：4的成熟多肽具有优选至少70％的序列同一性程度，更优选至少75％，甚至更优选至少80％，甚至更优选至少85％，甚至更优选至少90％，最优选至少95％，并且甚至最优选至少96％、97％、98％或99％的序列同一性程度，所述多肽具有内切葡聚糖酶活性(以下称“同源多肽”)。在优选的方面，所述同源多肽包含的氨基酸序列与SEQ ID NO：4的成熟多肽有十个氨基酸，优选五个氨基酸，更优选四个氨基酸，甚至更优选三个氨基酸，最优选两个氨基酸以及甚至最优选一个氨基酸不同。

具有内切葡聚糖酶活性的CEL12多肽优选包含SEQ ID NO：4的氨基酸序列或其等位变体，或者其具有内切葡聚糖酶活性的片段。在优选的方面，多肽包含SEQ ID NO：4的氨基酸序列。在另一优选的方面，多肽包含SEQ IDNO：4的成熟多肽。在另一优选的方面，多肽包含SEQ ID NO：4的氨基酸16至247，或其等位变体，或者其具有内切葡聚糖酶活性的片段。在另一优选的方面，多肽包含SEQ ID NO：4的氨基酸16至247。在另一优选的方面，多肽由SEQ ID NO：4的氨基酸序列或其等位变体，或者其具有内切葡聚糖酶活性的片段组成。在另一优选的方面，多肽由SEQ ID NO：4的氨基酸序列组成。在另一优选的方面，多肽由SEQ ID NO：4的成熟多肽组成。在另一优选的方面，多肽由SEQ ID NO：4的氨基酸16至247，或其等位变体，或者其具有内切葡聚糖酶活性的片段组成。在另一优选的方面，多肽由SEQ ID NO：4的氨基酸16至247组成。

根据WO 2001/25468可以获得具有内切葡聚糖酶活性的CEL12多肽。

在另一第一方面，具有内切葡聚糖酶活性的分离的CEL45多肽包含的氨基酸序列与SEQ ID NO：6的成熟多肽具有优选至少70％的序列同一性程度，更优选至少75％，甚至更优选至少80％，甚至更优选至少85％，甚至更优选至少90％，最优选至少95％，并且甚至最优选至少96％、97％、98％或99％的序列同一性程度，所述多肽具有内切葡聚糖酶活性(以下称“同源多肽”)。在优选的方面，所述同源多肽包含的氨基酸序列与SEQ ID NO：6的成熟多肽有十个氨基酸，优选五个氨基酸，更优选四个氨基酸，甚至更优选三个氨基酸，最优选两个氨基酸以及甚至最优选一个氨基酸不同。

具有葡聚糖分解酶活性的CEL45多肽优选包含SEQ ID NO：6的氨基酸序列或其等位变体，或者其具有内切葡聚糖酶活性的片段。在优选的方面，多肽包含SEQ ID NO：6的氨基酸序列。在另一优选的方面，多肽包含SEQ IDNO：6的成熟多肽。在另一优选的方面，多肽包含SEQ ID NO：6的氨基酸19至225，或其等位变体，或者其具有内切葡聚糖酶活性的片段。在另一优选的方面，多肽包含SEQ ID NO：6的氨基酸19至225。在另一优选的方面，多肽由SEQ ID NO：6的氨基酸序列或其等位变体，或者其具有内切葡聚糖酶活性的片段组成。在另一优选的方面，多肽由SEQ ID NO：6的氨基酸序列组成。在另一优选的方面，多肽由SEQ ID NO：6的成熟多肽组成。在另一优选的方面，多肽由SEQ ID NO：6的氨基酸19至225或其等位变体，或者其具有内切葡聚糖酶活性的片段组成。在另一优选的方面，多肽由SEQ ID NO：6的氨基酸19至225组成。

根据WO 2000/20555可以获得具有内切葡聚糖酶活性的CEL45多肽。

在另一第一方面，具有纤维二糖水解酶活性及纤维素结合域的分离的CEL7多肽包含的氨基酸序列与SEQ ID NO：8的成熟多肽具有优选至少70％的序列同一性程度，更优选至少75％，甚至更优选至少80％，甚至更优选至少85％，甚至更优选至少90％，最优选至少95％，并且甚至最优选至少96％、97％、98％或99％的序列同一性程度，所述多肽具有纤维二糖水解酶活性(以下称“同源多肽”)。在优选的方面，同源多肽包含的氨基酸序列与SEQ ID NO：8的成熟多肽有十个氨基酸，优选五个氨基酸，更优选四个氨基酸，甚至更优选三个氨基酸，最优选两个氨基酸以及甚至最优选一个氨基酸不同。

具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽优选包含SEQ IDNO：8的氨基酸序列或其等位变体，或者其具有纤维二糖水解酶活性的片段。在优选的方面，多肽包含SEQ ID NO：8的氨基酸序列。在另一优选的方面，多肽包含SEQ ID NO：8的成熟多肽。在另一优选的方面，多肽包含SEQ ID NO：8的氨基酸18至526，或其等位变体，或者其具有纤维二糖水解酶活性的片段。在另一优选的方面，多肽包含SEQ ID NO：8的氨基酸18至526。在另一优选的方面，多肽由SEQ ID NO：8的氨基酸序列或其等位变体，或者其具有纤维二糖水解酶活性的片段组成。在另一优选的方面，多肽由SEQ ID NO：8的氨基酸序列组成。在另一优选的方面，多肽由SEQ ID NO：8的成熟多肽组成。在另一优选的方面，多肽由SEQ ID NO：8的氨基酸18至526或其等位变体，或者其具有纤维二糖水解酶活性的片段组成。在另一优选的方面，多肽由SEQ ID NO：8的氨基酸18至526组成。

根据WO 2001/79507可以获得具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。

在另一第一方面，具有纤维二糖水解酶活性及纤维素结合域的分离的CEL7多肽包含的氨基酸序列与SEQ ID NO：10的成熟多肽具有优选至少70％的序列同一性程度，更优选至少75％，甚至更优选至少80％，甚至更优选至少85％，甚至更优选至少90％，最优选至少95％，并且甚至最优选至少96％、97％、98％或99％的序列同一性程度，所述多肽具有纤维二糖水解酶活性(以下称“同源多肽”)。在优选的方面，所述同源多肽包含的氨基酸序列与SEQ IDNO：10的成熟多肽有十个氨基酸，优选五个氨基酸，更优选四个氨基酸，甚至更优选三个氨基酸，最优选两个氨基酸以及甚至最优选一个氨基酸不同。

具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽优选包含SEQ ID NO：10的氨基酸序列或其等位变体，或者其具有纤维二糖水解酶活性的片段。在优选的方面，多肽包含SEQ ID NO：10的氨基酸序列。在另一优选的方面，多肽包含SEQ ID NO：10的成熟多肽。在另一优选的方面，多肽包含SEQ ID NO：10的氨基酸21至450，或其等位变体，或者其具有纤维二糖水解酶活性的片段。在另一优选的方面，多肽包含SEQ ID NO：10的氨基酸21至450。在另一优选的方面，多肽由SEQ ID NO：10的氨基酸序列或其等位变体，或者其具有纤维二糖水解酶活性的片段组成。在另一优选的方面，多肽由SEQ ID NO：10的氨基酸序列组成。在另一优选的方面，多肽由SEQ IDNO：10的成熟多肽组成。在另一优选的方面，多肽由SEQ ID NO：10的氨基酸21至450或其等位变体，或者其具有纤维二糖水解酶活性的片段组成。在另一优选的方面，多肽由SEQ ID NO：10的氨基酸21至450组成。

根据WO 2003/000941可以获得具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。

在第二方面，具有内切葡聚糖酶活性的分离的CEL7多肽由多核苷酸编码，所述多核苷酸在至少非常低严紧条件下，优选至少低严紧条件下，更优选至少中严紧条件下，更优选至少中-高严紧条件下，甚至更优选至少高严紧条件下，并且最优选至少非常高严紧条件下与以下杂交：(i)SEQ ID NO：1的成熟多肽编码序列，(ii)包含SEQ ID NO：1的成熟多肽编码序列的基因组DNA序列，或者(iii)(i)或(ii)的全长互补链(J.Sambrook，E.F.Fritsch，and T.Maniatus，1989，Molecular Cloning，A Laboratory Manual，2d edition，ColdSpring Harbor，New York)。在优选的方面，所述成熟多肽编码序列为SEQ IDNO：1的核苷酸61至1368。

在另一第二方面，具有内切葡聚糖酶活性的分离的CEL12多肽由多核苷酸编码，所述多核苷酸在至少非常低严紧条件下，优选至少低严紧条件下，更优选至少中严紧条件下，更优选至少中-高严紧条件下，甚至更优选至少高严紧条件下，以及最优选至少非常高严紧条件下与以下杂交：(i)SEQ ID NO：3的成熟多肽编码序列，(ii)包含SEQ ID NO：3的成熟多肽编码序列的基因组DNA序列，或者(iii)(i)或(ii)的全长互补链。在优选的方面，所述成熟多肽编码序列为SEQ ID NO：3的核苷酸46至741。

在另一第二方面，具有内切葡聚糖酶活性的分离的CEL45多肽由多核苷酸编码，所述多核苷酸在至少非常低严紧条件下，优选至少低严紧条件下，更优选至少中严紧条件下，更优选至少中-高严紧条件下，甚至更优选至少高严紧条件下，以及最优选至少非常高严紧条件下与以下杂交：(i)SEQ ID NO：5的成熟多肽编码序列，(ii)包含在SEQ ID NO：5的成熟多肽编码序列中的cDNA序列，或(iii)(i)或(ii)的全长互补链。在优选的方面，所述成熟多肽编码序列是SEQ ID NO：5的核苷酸55至675。

在另一第二方面，具有纤维二糖水解酶活性及纤维素结合域的分离的CEL7多肽由多核苷酸编码，所述多核苷酸在至少非常低严紧条件下，优选至少低严紧条件下，更优选至少中严紧条件下，更优选至少中-高严紧条件下，甚至更优选至少高严紧条件下，以及最优选至少非常高严紧条件下与以下杂交：(i)SEQ ID NO：7的成熟多肽编码序列，(ii)包含在SEQ ID NO：7的成熟多肽编码序列中的cDNA序列，或(iii)(i)或(ii)的全长互补链。在优选的方面，成熟多肽编码序列是SEQ ID NO：7的核苷酸52至1645。

在另一第二方面，具有纤维二糖水解酶活性而不具有纤维素结合域的分离的CEL7多肽由多核苷酸编码，所述多核苷酸在至少非常低严紧条件下，优选至少低严紧条件下，更优选至少中严紧条件下，更优选至少中-高严紧条件下，甚至更优选至少高严紧条件下，以及最优选至少非常高严紧条件下与以下杂交：(i)SEQ ID NO：9的成熟多肽编码序列，(ii)包含在SEQ ID NO：9的成熟多肽编码序列中的cDNA序列，或(iii)(i)或(ii)的全长互补链。在优选的方面，成熟多肽编码序列是SEQ ID NO：9的核苷酸61至1350。

SEQ ID NO：1、SEQ ID NO：3、SEQ ID NO：5、SEQ ID NO：7或SEQ IDNO：9的核苷酸序列或其亚序列；以及SEQ ID NO：2、SEQ ID NO：4、SEQ IDNO：6、SEQ ID NO：8或SEQ ID NO：10的氨基酸序列或其片段，可以用于设计核酸探针，以根据本领域内公知的方法从不同属和种的菌株鉴定和克隆编码这些多肽的DNA。尤其，这样的探针可用于与目的属或种的基因组或cDNA杂交，接着是标准Southern印迹程序以鉴定和分离其中相应的目的基因。这样的探针可能比整个序列短很多，但是其长度应该是至少14，优选至少25，更优选至少35以及最优选至少70个核苷酸。然而，核酸探针的长度优选为至少100个核苷酸。例如，核酸探针的长度可以至少200个核苷酸，优选至少300个核苷酸，更优选至少400个核苷酸，或最优选至少500个核苷酸。甚至可以用更长的探针，例如，长度为至少600个核苷酸，至少优选至少700个氨基酸，更优选至少800个氨基酸，或最优选至少900个氨基酸的核酸探针。DNA和RNA探针都可以利用。通常将探针加以标记用于检测相应的基因(例如，用³²p、³H、³⁵S、生物素或抗生物素蛋白标记)。这样的探针都包含在本发明中。

因而，可从由这些其它生物体制备的基因组DNA或cDNA文库中筛选与上述探针杂交并且编码这些多肽的DNA。可以通过琼脂糖或聚丙烯酰胺凝胶电泳，或通过其它分离技术来分离来自这些其它生物体的基因组或其它DNA。可以将来自文库的DNA或分离的DNA转移并固定在硝酸纤维素(nitrocellulose)或其它合适的载体材料上。为了鉴定与SEQ ID NO：1、SEQ IDNO：3、SEQ ID NO：5、或SEQ ID NO：9、或其亚序列同源的克隆或DNA，优选将所述载体材料用在Southern印迹中。

就本发明而言，杂交表示核苷酸序列在非常低至非常高的严紧条件下与标记的核酸探针杂交，所述核酸探针对应于SEQ ID NO：1、SEQ ID NO：3、SEQ ID NO：5、SEQ ID NO：7或SEQ ID NO：9的成熟多肽编码序列，包含SEQ ID NO：1、SEQ ID NO：3、SEQ ID NO：5、SEQ ID NO：7或SEQ ID NO：9的成熟多肽编码序列的基因组DNA序列或包含在SEQ ID NO：5或SEQ IDNO：7的成熟多肽编码序列中的cDNA序列；它的全长互补链或其亚序列。可使用例如X射线片(X-ray film)检测在这些条件下与所述核酸探针杂交的分子。

在优选的方面，核酸探针是SEQ ID NO：1的成熟多肽编码序列。在另一优选的方面，核酸探针是SEQ ID NO：1的核苷酸61至1368。在另一优选的方面，核酸探针是编码SEQ ID NO：2的多肽的多核苷酸序列，或其亚序列。在另一优选的方面，核酸探针是SEQ ID NO：1。

在另一优选的方面，核酸探针是SEQ ID NO：3的成熟多肽编码序列。在另一优选的方面，核酸探针是SEQ ID NO：3的核苷酸46至741。在另一优选的方面，核酸探针是编码SEQ ID NO：4的多肽的多核苷酸序列，或其亚序列。在另一优选的方面，核酸探针是SEQ ID NO：3。

在另一优选的方面，核酸探针是SEQ ID NO：5的成熟多肽编码序列。在另一优选的方面，核酸探针是SEQ ID NO：5的核苷酸55至675。在另一优选的方面，核酸探针是编码SEQ ID NO：6的多肽的多核苷酸序列，或其亚序列。在另一优选的方面，核酸探针是SEQ ID NO：5。

在另一优选的方面，核酸探针是SEQ ID NO：7的成熟多肽编码序列。在另一优选的方面，核酸探针是SEQ ID NO：7的核苷酸52至1645。在另一优选的方面，核酸探针是编码SEQ ID NO：8的多肽的多核苷酸序列，或其亚序列。在另一优选的方面，核酸探针是SEQ ID NO：7。

在另一优选的方面，核酸探针是SEQ ID NO：9的成熟多肽编码序列。在另一优选的方面，核酸探针是SEQ ID NO：9的核苷酸61至1350。在另一优选的方面，核酸探针是编码SEQ ID NO：10的多肽的多核苷酸序列，或其亚序列。在另一优选的方面，核酸探针是SEQ ID NO：9。

对于长度至少100个核苷酸的长探针，将非常低至非常高的严紧条件定义为在42℃，在5X SSPE、0.3％SDS、200μg/ml已剪切并且变性的鲑精DNA中，并且对于非常低和低严紧性为25％的甲酰胺，对于中和中-高严紧性为35％的甲酰胺，或对于高和非常高严紧性为50％的甲酰胺，根据标准的Southern印迹法进行预杂交和杂交最佳12至24小时。

对于长度为至少100个核苷酸的长探针，使用2X SSC、0.2％SDS优选至少在45℃(非常低严紧性)，更优选至少在50℃(低严紧性)，更优选至少在55℃(中严紧性)，更优选至少在60℃(中-高严紧性)，甚至更优选至少在65℃(高严紧性)，并且最优选至少在70℃(非常高严紧性)将载体材料最终洗涤三次，每次15分钟。

对于长度大约15个核苷酸至大约70个核苷酸的短探针，将严紧条件定义为在比采用根据Bolton和McCarthy计算法(1962，Proceedings of theNational Academy of Sciences USA 48：1390)得出的Tm低大约5℃至大约10℃，在0.9M NaCl，0.09M Tris-HCl pH 7.6，6mM EDTA，0.5％NP-40，1X Denhardt′s溶液，1mM焦磷酸钠(sodium pyrophosphate)，1mM磷酸二氢钠(sodium monobasic phosphate)，0.1mM ATP和0.2mg/ml的酵母RNA中，根据标准的Southern印迹程序进行预杂交、杂交和杂交后洗涤最佳12至24小时。

对于长度大约15个核苷酸至大约70个核苷酸的短探针，将所述载体材料在6X SSC加0.1％SDS中洗涤一次15分钟，并用6X SSC在比计算的Tm低5℃至10℃的温度下洗涤两次，每次15分钟。

在第三方面，具有内切葡聚糖酶活性的分离的CEL7多肽由包含如下核苷酸序列或由如下核苷酸序列组成的多核苷酸编码，所述核苷酸序列与SEQID NO：1的成熟多肽编码序列具有优选至少70％的序列同一性程度，更优选至少75％，甚至更优选至少80％，甚至更优选至少85％，甚至更优选至少90％，最优选至少95％，并且甚至最优选至少96％、97％、98％或99％的序列同一性程度，其编码活性多肽，其编码活性多肽。

在另一第三方面，具有内切葡聚糖酶活性的分离的CEL12多肽由包含如下核苷酸序列或由如下核苷酸序列组成的多核苷酸编码，所述核苷酸序列与SEQ ID NO：3的成熟多肽编码序列具有优选至少70％的序列同一性程度，更优选至少75％，甚至更优选至少80％，甚至更优选至少85％，甚至更优选至少90％，最优选至少95％，并且甚至最优选至少96％、97％、98％或99％的序列同一性程度，其编码活性多肽，其编码活性多肽。

在另一第三方面，具有内切葡聚糖酶活性的分离的CEL45多肽由包含如下核苷酸序列或由如下核苷酸序列组成的多核苷酸编码，所述核苷酸序列与SEQ ID NO：5的成熟多肽编码序列具有优选至少70％的序列同一性程度，更优选至少75％，甚至更优选至少80％，甚至更优选至少85％，甚至更优选至少90％，最优选至少95％，并且甚至最优选至少96％、97％、98％或99％的序列同一性程度，其编码活性多肽，其编码活性多肽。

在另一第三方面，具有纤维二糖水解酶活性及纤维素结合域的分离的CEL7多肽由包含如下核苷酸序列或由如下核苷酸序列组成的多核苷酸编码，所述核苷酸序列与SEQ ID NO：7的成熟多肽编码序列具有优选至少70％的序列同一性程度，更优选至少75％，甚至更优选至少80％，甚至更优选至少85％，甚至更优选至少90％，最优选至少95％，并且甚至最优选至少96％、97％、98％或99％的序列同一性程度，其编码活性多肽，其编码活性多肽。

在另一第三方面，具有纤维二糖水解酶活性而不具有纤维素结合域的分离的CEL7多肽由包含如下核苷酸序列或由如下核苷酸序列组成的多核苷酸编码，所述核苷酸序列与SEQ ID NO：9的成熟多肽编码序列具有优选至少70％的序列同一性程度，更优选至少75％，甚至更优选至少80％，甚至更优选至少85％，甚至更优选至少90％，最优选至少95％，并且甚至最优选至少96％、97％、98％或99％的序列同一性程度，其编码活性多肽，其编码活性多肽。

在优选的方面，成熟多肽编码序列是SEQ ID NO：1的核苷酸61至1368、SEQ ID NO：3的核苷酸46至741、SEQ ID NO：5的核苷酸55至675，SEQ IDNO：7的核苷酸52至1645，或SEQ ID NO：9的核苷酸61至1350。参见文中多核苷酸部分。

在第四方面，具有内切葡聚糖酶活性的分离的CEL7多肽是人工变体，所述人工变体包含取代、缺失和/或插入一个或多个(几个)氨基酸的SEQ IDNO：2的成熟多肽；或者其同源序列。

在另一第四方面，具有内切葡聚糖酶活性的CEL12多肽是人工变体，所述人工变体包含取代、缺失和/或插入一个或多个(几个)氨基酸的SEQ ID NO：4的成熟多肽；或者其同源序列。

在另一第四方面，具有内切葡聚糖酶活性的分离的CEL45多肽是人工变体，所述人工变体包含取代、缺失和/或插入一个或多个(几个)氨基酸的SEQID NO：6的成熟多肽；或其同源序列。

在另一第四方面，具有纤维二糖水解酶活性及纤维素结合域的分离的CEL7多肽是人工变体，所述人工变体包含取代、缺失和/或插入一个或多个(几个)氨基酸的SEQ ID NO：8的成熟多肽；或其同源序列。

在另一第四方面，具有纤维二糖水解酶活性而不具有纤维素结合域的分离的CEL7多肽是人工变体，所述人工变体包含取代、缺失和/或插入一个或多个(几个)氨基酸的SEQ ID NO：10的成熟多肽；或其同源序列。

优选氨基酸改变对性质是较不重要的(of a minor nature)，即保守的氨基酸取代或插入，其不显著影响蛋白质的折叠和/或活性；通常为1至大约30个氨基酸的小缺失；小的氨基或羧基末端延伸，例如氨基末端甲硫氨酸残基；多至大约20-25个残基的小接头肽；或通过改变净电荷或其它功能来促进纯化的小延伸，例如多组氨酸序列(poly histidine tract)、抗原表位(antigenicepitope)或结合域(binding domain))。

保守取代的实例是在以下组之内：碱性氨基酸组(精氨酸、赖氨酸和组氨酸)、酸性氨基酸组(谷氨酸和天冬氨酸)、极性氨基酸组(谷氨酰胺和天冬酰胺)、疏水性氨基酸组(亮氨酸、异亮氨酸和缬氨酸)、芳族氨基酸组(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸组(甘氨酸、丙氨酸、丝氨酸、苏氨酸和甲硫氨酸)。通常不改变比活性(specific activity)的氨基酸取代是本领域已知的，并且由例如H.Neurath and R.L.Hill，1979，In，The Proteins，Academic Press，New York描述。最普遍发生的交换是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly。

除了20个标准氨基酸，可以用非标准的氨基酸(例如4-羟脯氨酸、6-N-甲基赖氨酸、2-氨基异丁酸、异缬氨酸和α-甲基丝氨酸)取代野生型多肽的氨基酸残基。可以用有限数目的非保守氨基酸、不由遗传密码编码的氨基酸和非天然氨基酸取代氨基酸残基。“非天然氨基酸”在蛋白质合成后已经过修饰，和/或在它们的侧链具有不同于标准氨基酸的化学结构。非天然氨基酸能够以化学方法合成，并且优选是商业上能够获得的，包括六氢吡啶羧酸(pipecolicacid)、噻唑烷羧酸(thiazolidine carboxylic acid)、脱氢脯氨酸、3-和4-甲基脯氨酸，和3，3-二甲基脯氨酸。

可供选择的是，氨基酸改变具有这样的性质以使多肽的物理化学性质改变。例如，氨基酸改变可改进多肽的热稳定性，改变底物特异性，改变最适pH等。

能够根据本领域已知的方法，例如定点诱变或丙氨酸分区诱变法(Cunningham and Wells，1989，Science 244：1081-1085)来鉴定亲本多肽中的必需氨基酸。在后一技术中，将单一丙氨酸突变引入到分子中的每个残基，并且测试所得突变分子的生物活性(即，内切葡聚糖酶或纤维二糖水解酶的活性)以鉴定对于所述分子的活性关键的氨基酸残基。同样参见Hilton等人，1996，J.Biol.Chem.271：4699-4708。酶的活性部位或其它的生物相互作用也能够通过结构的物理分析而测定，如通过以下这些技术：如核磁共振、晶体学、电子衍射或光亲和标记，连同推定的接触位点氨基酸的突变来测定。参见例如deVos等人，1992，Science 255：306-312；Smith等人，1992，J.Mol.Biol.224：899-904；Wlodaver等人，1992，FEBS Lett.309：59-64。也可以分析与本发明多肽之亲缘多肽的同一性，据此推测关键氨基酸的身份。

能够使用已知的诱变、重组和/或改组(shuffling)方法，然后是有关的筛选方法，例如那些由Reidhaar-Olson and Sauer，1988，Science 241：53-57；Bowieand Sauer，1989，Proc.Natl.Acad.Sci.USA 86：2152-2156；WO 95/17413；或WO 95/22625公开的那些方法来进行并测试单个或多个氨基酸取代、缺失和/或插入。能够使用的其它方法包括易错PCR、噬菌体展示(例如，Lowman等人，1991，Biochem.30：10832-10837；美国专利No.5,223,409；WO 92/06204)和区域定向的诱变(Derbyshire等人，1986，Gene 46：145；Ner等人，1988，DNA7：127)。

诱变/改组方法能够与高通量、自动化的筛选方法组合以检测由宿主细胞表达的克隆的、诱变的多肽的活性(Ness等人，1999，Nature Biotechnology 17：893-896)。能够从宿主细胞回收编码活性多肽的诱变的DNA分子，并且使用本领域的标准方法快速测序。这些方法允许快速测定感兴趣的多肽中单个氨基酸残基的重要性，并且能够应用于未知结构的多肽。

SEQ ID NO：2、SEQ ID NO：4、SEQ ID NO：6、SEQ ID NO：8或SEQ IDNO：10的成熟多肽的氨基酸取代、缺失和/或插入的总数是10，优选9，更优选8，更优选7，更优选至多6，更优选5，更优选4，甚至更优选3，最优选2，并且甚至最优选1。

以优选固体的约0.001％至10.0％重量，更优选固体的约0.01％至5.0％重量，甚至更优选固体的约0.025％至4.0％重量，和最优选固体的约0.005％至2.0％重量的有效量加入纤维素分解酶组物。

如在此所述，本发明中的纤维素分解酶组合物可以由微生物菌株(野生型或重组宿主细胞)的发酵或几种单独的微生物菌株(野生型和/或重组型宿主细胞)的发酵产生，并回收。

如在此所述，纤维素分解酶组合物也可以包含其它与含纤维素材料的降解有关的酶组分。

在优选的方面，组合物还包含一种或多种(几种)具有β-葡糖苷酶活性的多肽。

在优选的方面，从米曲霉中获得具有β-葡糖苷酶活性的多肽。参见WO2002/095014。在另一优选的方面，从烟曲霉中获得具有β-葡糖苷酶活性的多肽。参见WO 2005/047499。在另一优选的方面，从巴西青霉(Penicilliumbrasilianum)例如巴西青霉菌株IBT 20888中获得具有β-葡糖苷酶活性的多肽。参见WO 2007/019442。

根据WO 2002/095014可以获得具有β-葡糖苷酶活性的米曲霉多肽。根据WO 2005/047499可以获得具有β-葡糖苷酶活性的烟曲霉多肽。根据WO2007/019442可获得具有β-葡糖苷酶活性的巴西青霉多肽。

在第一方面，具有β-葡糖苷酶活性的分离的多肽包含的氨基酸序列与SEQ ID NO：26、SEQ ID NO：28或SEQ ID NO：30的成熟多肽具有优选至少70％的序列同一性程度，更优选至少75％，更优选至少80％，甚至更优选至少85％，甚至更优选至少90％，最优选至少95％，并且甚至最优选至少96％，97％，98％或99％的序列同一性程度，所述多肽具有β-葡糖苷酶活性(以下称“同源多肽”)。在优选的方面，所述同源多肽包含的氨基酸序列与SEQ ID NO：26、SEQ ID NO：28或SEQ ID NO：30的成熟多肽有十个氨基酸，优选五个氨基酸，更优选四个氨基酸，甚至更优选三个氨基酸，最优选两个氨基酸以及甚至最优选一个氨基酸不同。

具有β-葡糖苷酶活性的多肽优选包含或其组成为SEQ ID NO：26、SEQ IDNO：28或SEQ ID NO：30的氨基酸序列或其等位变体，或者其具有β-葡糖苷酶活性的片段。在优选的方面，所述多肽包含或其组成为SEQ ID NO：26、SEQ ID NO：28或SEQ ID NO：30的氨基酸序列。在另一优选的方面，所述多肽包含或者其组成为SEQ ID NO：26、SEQ ID NO：28或SEQ ID NO：30的成熟多肽。在另一优选的方面，所述多肽包含或者其组成为SEQ ID NO：26的氨基酸20至861，或其等位变体；或其具有β-葡糖苷酶活性的片段。在另一优选的方面，所述多肽包含或者其组成为SEQ ID NO：28的氨基酸20至863，或其等位变体；或其具有β-葡糖苷酶活性的片段。在另一优选的方面，所述多肽包含或者其组成为SEQ ID NO：30的氨基酸37至878，或其等位变体；或其具有β-葡糖苷酶活性的片段。在另一优选的方面，所述多肽包含或者其组成为SEQ ID NO：26的氨基酸20至861。在另一优选的方面，多肽包含或者其组成为SEQ ID NO：28的氨基酸20至863。在另一优选的方面，多肽包含或者其组成为SEQ ID NO：30的氨基酸37至878。

在第二方面，具有β-葡糖苷酶活性的分离的多肽由多核苷酸编码，该多核苷酸在至少非常低严紧条件下，优选至少低严紧条件下，更优选至少中严紧条件下，更优选至少中-高严紧条件下，甚至更优选至少高严紧条件下，以及最优选至少非常高严紧条件下与以下杂交：(i)SEQ ID NO：25、SEQ ID NO：27或SEQ ID NO：29的成熟多肽编码序列，(ii)包含在SEQ ID NO：25、SEQ IDNO：27或SEQ ID NO：29的成熟多肽编码序列中的cDNA序列，或(iii)(i)或(ii)的全长互补链。在优选的方面，所述成熟多肽编码序列是SEQ ID NO：25的核苷酸87至2612、SEQ ID NO：27的核苷酸58至2580、SEQ ID NO：29的核苷酸171至2753。

如上所述，SEQ ID NO：25、SEQ ID NO：27或SEQ ID NO：29的核苷酸序列或其亚序列；和SEQ ID NO：25、SEQ ID NO：27或SEQ ID NO：29的氨基酸序列或其片段可以用来设计核酸探针以从不同属和种的菌株鉴定和克隆编码具有β-葡糖苷酶活性的多肽的DNA。

如上所述，就本发明而言，杂交表示核苷酸序列在非常低到非常高严紧条件下与标记的核酸探针杂交，所述核酸探针对应于SEQ ID NO：25、SEQ IDNO：27或SEQ ID NO：29的成熟多肽编码序列、包含在SEQ ID NO：25、SEQID NO：27或SEQ ID NO：29的成熟多肽编码序列中的cDNA序列、它的互补链或其亚序列。

在优选的方面，核酸探针是SEQ ID NO：25、SEQ ID NO：27或SEQ ID NO：29的成熟多肽编码序列。在另一优选的方面，核酸探针是SEQ ID NO：25的核苷酸87至2612、SEQ ID NO：27的核苷酸58至2580、SEQ ID NO：29的核苷酸171至2753。在另一优选的方面，核酸探针是编码SEQ ID NO：26、SEQ ID NO：28或SEQ ID NO：30的多肽的多核苷酸序列或其亚序列。在另一优选的方面，核酸探针是SEQ ID NO：25、SEQ ID NO：27或SEQ ID NO：29。在另一优选的方面，核酸探针是包含在质粒中的多核苷酸序列，该质粒包含在大肠杆菌DSM 14240中，其中它的多核苷酸序列编码具有β-葡糖苷酶活性的多肽。在另一优选的方面，核酸探针是包含在质粒pEJG113中的多核苷酸序列，该质粒包含在大肠杆菌NRRL B-30695中，其中它的多核苷酸序列编码具有β-葡糖苷酶活性的多肽。在另一优选的方面，核酸探针是包含在质粒pKKAB中的多核苷酸序列，该质粒包含在大肠杆菌NRRL B-30860中，其中它的多核苷酸序列编码具有β-葡糖苷酶活性的多肽。在另一优选的方面，核酸探针是包含在质粒中的成熟多肽编码区，该质粒包含在大肠杆菌DSM14240中。在另一优选的方面，核酸探针是包含在质粒pEJG113中的成熟多肽编码区，该质粒包含在大肠杆菌NRRL B-30695中。在另一优选的方面，核酸探针是包含在质粒pKKAB中的成熟多肽编码区，该质粒包含在大肠杆菌NRRL B-30860中。

对于长度至少100个核苷酸的长探针，非常低至非常高严紧性条件如本文所限定。

对于长度至少100个核苷酸的长探针，最终如本文所限定洗涤载体材料。

对于长度大约15个核苷酸至大约70个核苷酸的短探针，严紧性条件如本文所限定。

对于长度大约15个核苷酸至大约70个核苷酸的短探针，最终如本文所限定洗涤载体材料。

在第三方面。具有β-葡糖苷酶活性的多肽由包含如下核苷酸序列或由如下核苷酸序列组成的多核苷酸编码，所述核苷酸序列与SEQ ID NO：25、SEQID NO：27或SEQ ID NO：29的成熟多肽序列具有优选至少70％的序列同一性程度，更优选至少75％，更优选至少80％，甚至更优选至少85％，甚至更优选90％，最优选至少95％，以及甚至最优选至少96％、97％、98％或99％的序列同一性程度，其编码活性多肽。

在优选的方面，所述成熟多肽编码序列是SEQ ID NO：25的核苷酸87至2612、SEQ ID NO：27的核苷酸58至2580或SEQ ID NO：29的核苷酸171至2753。

在第四方面，具有β-葡糖苷酶活性的多肽是人工变体，该人工变体包含取代、缺失和/或插入一个或多个(几个)氨基酸的SEQ ID NO：26、SEQ ID NO：28或SEQ ID NO：30的成熟多肽或其同源序列。制备这样的人工变体的方法如上所述。

SEQ ID NO：26、SEQ ID NO：28或SEQ ID NO：30的成熟多肽的氨基酸取代、缺失和/或插入的总数是10，优选9，更优选8，更优选7，更优选至多6，更优选5，更优选4，甚至更优选3，最优选2，并且甚至最优选1。

在另一优选的方面，纤维素分解酶组合物进一步包含一种或多种选自下组的额外的酶活性：半纤维素酶、酯酶(如脂肪酶、磷脂酶和/或角质酶)、蛋白酶、漆酶和过氧化物酶。在本发明的方法中，可以在发酵之前或过程中，包括发酵的微生物的繁殖过程中或繁殖之后加入所述额外的酶。

所述酶可以源自或获得自任何合适得来源，包括细菌、真菌、酵母、植物或哺乳动物来源，如本文所述。术语“获得”在此表示可能已经将所述酶从天然产生该酶作为天然酶的生物中分离。术语“获得”在此还表示所述酶可能已经采用本文所述的方法在宿主生物中重组产生，其中所述重组产生的酶对于该宿主生物是天然的或外源的，或具有修饰的氨基酸序列，例如缺失、插入和/或取代一个或多个氨基酸，即重组产生的酶是天然氨基酸序列的突变体和/或片段，或通过本领域已知的核酸改组方法产生的酶。天然酶的意思中包含天然变体，而外源酶的意思中包含重组获得的变体，例如通过定点诱变或改组获得的变体。

本发明中使用的酶可以是适合用于本文描述的方法中的任何形式，例如，含有或不含细胞的粗发酵液或基本上纯的多肽。所述酶可以是干粉或颗粒、无尘颗粒、液体、稳定化的液体或受保护的酶(protected enzyme)。例如，颗粒可以如美国专利Nos.4,106,991和4,661,452所公开的来产生，并且可以任选地通过本领域内已知的方法来涂覆。例如，液体酶制备物可以根据已经建立的方法通过添加稳定剂来稳定化，所述稳定剂例如糖、糖醇或其它多元醇，和/或乳酸或其它有机酸。受保护的酶可以根据EP 238,216中公开的方法制备。

在优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽和一种或多种(几种)选自下组的组分：具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性和纤维素结合域的CEL7多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有β-葡糖苷酶活性的多肽和一种或多种(几种)选自下组的组分：具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性和纤维素结合域的CEL7多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性和纤维素结合域的CEL7多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL 12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽和具有内切葡聚糖酶活性的CEL7多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽和具有内切葡聚糖酶活性的CEL12多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽和具有内切葡聚糖酶活性的CEL45多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽和具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。

在另一优选的方面，纤维素水解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽和具有β-葡糖苷酶活性的多肽。

在另一优选的方面，纤维素水解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL12多肽和具有β-葡糖苷酶活性的多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL45多肽和具有β-葡糖苷酶活性的多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽和具有内切葡聚糖酶活性的CEL12多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽和具有内切葡聚糖酶活性的CEL45多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽和具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL12多肽和具有内切葡聚糖酶活性的CEL45多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL12多肽和具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL12多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL45多肽和具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL45多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽和具有β-葡糖苷酶活性的多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL45多肽和具有β-葡糖苷酶活性的多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽和具有β-葡糖苷酶活性的多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL12多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL12多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的多肽和具有β-葡糖苷酶活性的多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽和具有内切葡聚糖酶活性的CEL45多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽和具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽和具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有纤维二糖水解酶及纤维素结合域的CEL7多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶及纤维素结合域的CEL7多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL12多肽、具有纤维二糖水解酶及纤维素结合域的CEL7多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL45多肽和具有纤维二糖水解酶及纤维素结合域的CEL7多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL45多肽和具有纤维二糖水解酶而不具有纤维素结合域的CEL7多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽和具有β-葡糖苷酶活性的多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL12多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽和具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。

在另一优选的方面，纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽和具有β-葡糖苷酶活性的多肽。

具有内切葡聚糖酶、纤维二糖水解酶或β-葡糖苷酶活性的多肽的来源

具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽或具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽、以及具有β-葡糖苷酶活性的多肽，可以获得自任何属的微生物。就本发明而言，如用于本文与给定的来源有关的术语“获得自”的意思应为核苷酸序列编码的多肽由所述来源产生，或由其中插入了来自所述来源的核苷酸序列的菌株产生。在优选的方面，获得自给定来源的多肽是细胞外分泌的。

具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽和/或具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽可以从

LDI，

LBR或

150L(Dyadic International，Inc.，Jupiter，FL，USA)中获得。

具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽或具有β-葡糖苷酶活性的多肽可以是细菌多肽。例如，所述多肽可以是革兰氏阳性细菌的多肽如芽孢杆菌属(Bacillus)、链球菌属(Streptococcus)、链霉菌属(Streptomyces)、葡萄球菌(Staphylococcus)、肠球菌属(Enterococcus)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、梭菌属(Clostridium)、地芽孢杆菌属(Geobacillus)或海洋芽孢菌属(Oceanobacillus)多肽，或革兰氏阴性细菌的多肽如大肠杆菌、假单孢菌属(Pseudomonas)、沙门氏菌属(Salmonella)、弯曲杆菌属(Campylobacter)、螺杆菌属(Helicobacter)、黄杆菌属(Flavobacterium)、梭杆菌属(Fusobacterium)、泥杆菌属(Ilyobacter)、奈瑟氏菌属(Neisseria)或脲原体属(Ureaplasma)多肽。

在优选的方面，多肽是嗜碱芽孢杆菌(Bacillus alkalophilus)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、短芽孢杆菌(Bacillus brevis)、环状芽孢杆菌(Bacillus circulans)、克劳氏芽孢杆菌(Bacillus clausii)、凝结芽孢杆菌(Bacilluscoagulans)、坚强芽孢杆菌(Bacillus firmus)、灿烂芽孢杆菌(Bacillus lautus)、迟缓芽孢杆菌(Bacillus lentus)、地衣芽孢杆菌(Bacillus licheniformis)、巨大芽孢杆菌(Bacillus megaterium)、短小芽孢杆菌(Bacillus pumilus)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)、枯草芽孢杆菌(Bacillus subtilis)或苏云金芽孢杆菌(Bacillus thuringiensis)多肽。

在另一优选的方面，多肽是似马链球菌(Streptococcus equisimilis)、酿脓链球菌(Streptococcus pyogenes)、乳房链球菌(Streptococcus uberis)或马链球菌兽瘟亚种(Streptococcus equi subsp.Zooepidemicus)多肽。

在另一优选的方面，多肽是不产色链霉菌(Streptomyces achromogenes)、除虫链霉菌(Streptomyces avermitilis)、天蓝色链霉菌(Streptomyces coelicolor)、灰色链霉菌(Streptomyces griseus)或浅青紫链霉菌(Streptomyces lividans)多肽。

具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽或具有β-葡糖苷酶活性的多肽还可以是真菌多肽，并且更优选是酵母多肽例如念珠菌属(Candida)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)或西洋蓍霉属(Yarrowia)多肽；或更优选是丝状真菌多肽例如枝顶孢霉属(Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、金孢子菌属(Chrysosporium)、隐球菌属(Cryptococcus)、Filibasidium、镰孢属(Fusarium)、腐质霉属(Humicola)、梨孢菌属(Magnaporthe)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、新考玛脂霉属(Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、瘤胃壶菌属(Piromyces)、裂褶菌属(Schizophyllum)、踝节菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)或木霉属(Trichoderma)多肽。

在优选的方面，多肽是卡尔酵母(Saccharomyces carlsbergensis)、酿酒酵母(Saccharomyces cerevisiae)、糖化酵母(Saccharomyces diastaticus)、道格拉氏酵母(Saccharomyces douglasii)、克鲁弗酵母(Saccharomyces kluyveri)、诺地酵母(Saccharomyces norbensis)或卵形酵母(Saccharomyces oviformis)多肽。

在另一优选的方面，多肽是棘孢曲霉(Aspergillus aculeatus)、泡盛曲霉(Aspergillus awamori)、烟曲霉、臭曲霉(Aspergillus foetidus)、日本曲霉(Aspergillus japonicus)、构巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillusniger)、米曲霉、Chrysosporium lucknowense、灰盖鬼伞(Coprinus cinereus)、棉色二孢(Diplodia gossyppina)、杆孢状镰孢(Fusarium bactridioides)、禾谷镰孢(Fusarium cerealis)、库威镰孢(Fusarium crookwellense)、大刀镰孢(Fusariumculmorum)、禾本科镰孢(Fusarium graminearum)、禾赤镰孢(Fusariumgraminum)、异孢镰孢(Fusarium heterosporum)、合欢木镰孢(Fusariumnegundi)、尖镰孢(Fusarium oxysporum)、多枝镰孢(Fusarium reticulatum)、粉红镰孢(Fusarium roseum)、接骨木镰孢(Fusarium sambucinum)、肤色镰孢(Fusarium sarcochroum)、拟分枝孢镰孢(Fusarium sporotrichioides)、硫色镰孢(Fusarium sulphureum)、圆镰孢(Fusarium torulosum)、拟丝孢镰孢(Fusariumtrichothecioides)、镶片镰孢(Fusarium venenatum)、特异腐质霉(Humicolainsolens)、疏棉状腐质霉(Humicola lanuginosa)、灰梨孢菌(Magnaporthegrisea)、米赫毛霉(Mucor miehei)、嗜热毁丝霉(Myceliophthora thermophla)、粗糙脉孢菌(Neurospora crassa)、产紫青霉(Penicillium purpurogenum)、黄孢原毛平革菌(Phanerochaete chrysosporium)、淡黑假黑盘菌(Pseudoplectanianigrella)、橙色嗜热子囊菌(Thermoascus aurantiacus)、土生梭孢霉(Thielaviaterrestris)、哈茨木霉(Trichoderma harzianum)、康宁木霉(Trichoderma koningii)、长枝木霉(Trichoderma longibrachiatum)、里氏木霉(Trichoderma reesei)、绿色木霉(Trichoderma viride)或Trichophaea saccata多肽。

可理解的是对于前述的种，本发明包含完全和不完全阶段(perfect andimperfect states)两种，和其它分类学的等同物(equivalent)，例如无性型(anamorph)，无论它们已知的种名。本领域熟练技术人员将轻易地识别适合的等同物的身份。

这些种的菌株在许多培养物保藏中心对于公众能够容易地取得，所述保藏中心诸如美国典型培养物保藏中心(the American Type Culture Collection)(ATCC)、德意志微生物和细胞培养物保藏中心(Deutsche Sammiung vonMikroorganismen und Zellkulturen GmbH)(DSM)、真菌菌种保藏中心(Centraalbureau Voor Schimmelcultures)(CBS)和农业研究机构专利培养物保藏中心北区研究中心，北方区研究中心(Agricultural Research Service PatentCulture Collection，Northern Regional Research Center)(NRRL)。

此外，可以使用上述的探针从其它来源，包括从自然界(例如，土壤、堆肥、水等)分离的微生物鉴定和获得这些多肽。用于从天然生境(habitat)分离微生物的技术是本领域内公知的。随后可通过相似地筛选这种微生物的基因组或cDNA文库来获得所述多核苷酸。一旦用所述探针检测到编码多肽的多核苷酸序列，就能够使用本领域普通技术人员熟知的技术来分离或克隆所述多核苷酸(参见，例如，Sambrook等人，1989，见上文)。

多肽还可以包括融合多肽或可切割的融合多肽，其中将另一种多肽融合到所述多肽或其片段的N末端或C末端。通过将编码另一种多肽的核苷酸序列(或其部分)融合于本发明的核苷酸序列(或其部分)来产生融合的多肽。产生融合多肽的技术是本领域已知的，包括连接编码多肽的编码序列以使它们在阅读框中，并且使融合多肽的表达在相同启动子和终止子的控制下。

融合多肽可进一步包含切割位点。通过融合蛋白的分泌，位点被切割以释放来自融合蛋白的有活性的多肽。切割位点的例子包括，而不局限于，编码赖氨酸-精氨酸二肽的Kex2位点(Martin等人，2003，J.Ind.Microbiol.Biotechnol.3：568-76；Svetina等人，2000，J.Biotechnol.76：245-251；Rasmussen-Wilson等人，1997，Appl.Environ.Microbiol.63：3488-3493；Ward等人，1995，Biotechnology 13：498-503和Contreras等人，1991，Biotechnology9：378-381)，在精氨酸残基之后被因子Xa蛋白酶切割的异亮氨酸-(谷氨酸或天冬氨酸)-甘氨酸-精氨酸位点(Eaton等人，1986，Biochem.25：505-512)；在赖氨酸之后被肠激酶切割的天冬氨酸-天冬氨酸-天冬氨酸-天冬氨酸-赖氨酸位点(Collins-Racie等人，1995，Biotechnology 13：982-987)；被Genenase I切割的组氨酸-酪氨酸-谷氨酸或组氨酸-酪氨酸-天冬氨酸位点(Carte等人，1989，Proteins：Structure，Function and Genetics 6：240-248)；在精氨酸之后被凝血酶切割的亮氨酸-缬氨酸-脯氨酸-精氨酸-甘氨酸-丝氨酸位点(Stevens，2003，DrugDiscovery World 4：35-48)；在谷氨酰胺之后被TEV蛋白酶切割的谷氨酸-天冬酰胺-亮氨酸-酪氨酸-苯丙氨酸-谷氨酰胺-甘氨酸位点(Stevens，2003，见上文)；和在谷氨酰胺之后被遗传工程化的来自人鼻病毒的3C蛋白酶切割的亮氨酸-谷氨酸-缬氨酸-亮氨酸-苯丙氨酸-谷氨酰胺-甘氨酸-脯氨酸位点(Stevens，2003，见上文)。

编码具有内切葡聚糖酶或纤维二糖水解酶活性的多肽的多核苷酸

如在本文中所述，包含或其组成为编码具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽或具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽的核苷酸序列的多核苷酸能够被分离和利用以实施本发明的方法。

所述多核苷酸包含如下核苷酸序列或由如下核苷酸序列组成，所述核苷酸序列与SEQ ID NO：1、SEQ ID NO：3、SEQ ID NO：5、SEQ ID NO：7或SEQID NO：9的成熟多肽编码序列具有优选至少70％的序列同一性程度，更优选至少75％，甚至更优选至少80％，甚至更优选至少85％，甚至更优选至少90％，最优选至少95％，并且甚至最优选至少96％、97％、98％或99％同一性，其编码具有酶活性的多肽。

在优选的方面，编码具有内切葡聚糖酶活性的CEL7多肽的核酸序列包含SEQ ID NO：1或由SEQ ID NO：1组成。在另一优选的方面，所述核苷酸序列包含SEQ ID NO：1的成熟多肽编码区或由SEQ ID NO：1的成熟多肽编码区组成。本发明还包括核苷酸序列，其编码包含SEQ ID NO：2的氨基酸序列或其成熟多肽或由SEQ ID NO：2的氨基酸序列或其成熟多肽组成的多肽，其由于遗传密码的简并性而与SEQ ID NO：1不同。本发明还涉及SEQ ID NO：1的亚序列，该亚序列编码具有CEL7内切葡聚糖酶活性的SEQ ID NO：2的片段。

在另一优选的方面，编码具有内切葡聚糖酶活性的CEL12多肽的核苷酸序列包含SEQ ID NO：3或由SEQ ID NO：3组成。在另一优选的方面，所述核苷酸序列包含SEQ ID NO：3的成熟多肽编码区或由SEQ ID NO：3的成熟多肽编码区组成。本发明还包括编码包含SEQ ID NO：4的氨基酸序列或其成熟多肽或由SEQ ID NO：4的氨基酸序列或其成熟多肽组成的多肽的核酸序列，其由于遗传密码的简并性而与SEQ ID NO：3不同。本发明还涉及SEQ IDNO：3的亚序列，该亚序列编码具有CEL12内切葡聚糖酶活性的SEQ ID NO：4的片段。

在另一优选的方面，编码具有内切葡聚糖酶活性的CEL45多肽的核苷酸序列包含SEQ ID NO：5或由SEQ ID NO：5组成。在另一优选的方面，所述核苷酸序列是SEQ ID NO：5的成熟多肽编码区。本发明还包括编码包含SEQIDNO：6的氨基酸序列或其成熟多肽或由SEQ ID NO：6的氨基酸序列或其成熟多肽组成的多肽的核酸序列，其由于遗传密码的简并性而与SEQ ID NO：5不同。本发明还涉及SEQ ID NO：5的亚序列，其编码具有CEL45内切葡聚糖酶活性的SEQ ID NO：6的片段。

在另一优选的方面，编码具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽的核苷酸序列包含SEQ ID NO：7或由SEQ ID NO：7组成。在另一优选的方面，所述核苷酸序列包含SEQ ID NO：7的成熟多肽编码区或由SEQIDNO：7的成熟多肽编码区组成。本发明还包括编码包含SEQ ID NO：8的氨基酸序列或其成熟多肽或由SEQ ID NO：8的氨基酸序列或其成熟多肽组成的多肽的核酸序列，其由于遗传密码的简并性而与SEQ ID NO：7不同。本发明还涉及SEQ ID NO：7的亚序列，其编码具有CEL7纤维二糖水解酶活性的SEQ ID NO：16的片段。

在另一优选的方面，编码具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽的核苷酸序列包含SEQ ID NO：9或由SEQ ID NO：9组成。在另一优选的方面，所述核苷酸序列包含SEQ ID NO：9的成熟多肽编码区或由SEQ ID NO：9的成熟多肽编码区组成。本发明还包括编码包含SEQ ID NO：10的氨基酸序列或其成熟多肽或由SEQ ID NO：10的氨基酸序列或其成熟多肽组成的多肽的核苷酸序列，其由于遗传密码的简并性而与SEQ ID NO：9不同。本发明也涉及SEQ ID NO：9的亚序列，其编码具有CEL7纤维二糖水解酶活性的SEQ ID NO：18的片段。

本发明还涉及在SEQ ID NO：1、SEQ ID NO：3、SEQ ID NO：5、SEQ IDNO：7或SEQ ID NO：9的成熟多肽编码序列中包含至少一个突变的突变多核苷酸，其中所述突变核苷酸序列编码SEQ ID NO：2、SEQ ID NO：4、SEQ IDNO：6、SEQ ID NO：8或SEQ ID NO：10的成熟多肽。在优选的方面，所述成熟多肽是SEQ ID NO：2的氨基酸21至456、SEQ ID NO：4的氨基酸16至247、SEQ ID NO：6的氨基酸19至225、SEQ ID NO：8的氨基酸18至526、或SEQIDNO：10的氨基酸21至450。在另一优选的方面，所述成熟多肽编码序列是SEQ ID NO：1的核苷酸61至1368、SEQ ID NO：3的核苷酸46至741、SEQIDNO：5的核苷酸55至675、SEQ ID NO：7的核苷酸52至1645、SEQ ID NO：9的核苷酸61至1350。

用于分离或克隆编码这种多肽的多核苷酸的技术是本领域内已知的，包括从基因组DNA分离，从cDNA制备，或其组合。可通过例如使用熟知的聚合酶链式反应(PCR)或表达文库的抗体筛选来检测具有共有结构特性的克隆DNA片段，从而实现从这种基因组DNA克隆多核苷酸。参见，例如，Innis等人，1990，PCR：A Guide to Methods and Application，Academic Press，NewYork。可以使用其它核酸扩增方法，例如连接酶链式反应(LCR)、连接活化转录(ligated activated transcription；LAT)和基于核苷酸序列的扩增(NASBA)。多核苷酸可以是所述核苷酸序列的多肽编码区的等位基因变体或种变体(species variant)。

所述多核苷酸也可以是编码具有内切葡聚糖酶或纤维二糖水解酶活性的多肽的多核苷酸，其在至少非常低严紧条件下，优选至少低严紧条件，更优选至少中严紧条件，更优选至少中-高严紧条件，甚至更优选至少高严紧条件，并且最优选至少非常高严紧条件下，与以下杂交：(i)SEQ ID NO：1、SEQ IDNO：3、SEQ ID NO：5、SEQ ID NO：7或SEQ ID NO：9的成熟多肽编码序列，(ii)包含SEQ ID NO：1、SEQ ID NO：3或SEQ ID NO：9的成熟多肽编码序列的基因组DNA序列或包含在SEQ ID NO：5或SEQ ID NO：7的成熟多肽编码序列中的cDNA序列，或(iii)(i)或(ii)的全长互补链；或它们的等位变体和亚序列(Sambrook等人，1989，见上文)，如本文所定义的。

在优选的方面，所述成熟多肽编码序列是SEQ ID NO：1的核苷酸61至1368、SEQ ID NO：3的核苷酸46至741、SEQ ID NO：5的核苷酸55至675、SEQ ID NO：7的核苷酸52至1645或SEQ ID NO：9的核苷酸61至1350。

编码具有β-葡糖苷酶活性的多肽的多核苷酸

多核苷酸包含如下核苷酸序列或由如下核苷酸序列组成，所述核苷酸序列编码具有β-葡糖苷酶活性的多肽，可分离所述多核苷酸并且用于实施本发明的方法，如本文所述。

所述多核苷酸包含如下核苷酸序列或由如下核苷酸序列组成，所述核苷酸序列与SEQ ID NO：25，SEQ ID NO：27或SEQ ID NO：29的成熟多肽编码序列具有优选至少70％，更优选至少75％，甚至更优选至少80％，甚至更优选至少85％，甚至更优选至少90％，最优选至少95％，并且甚至最优选至少96％、97％、98％或99％的序列同一性程度，其编码具有酶活性的多肽。

在优选的方面，编码具有β-葡糖苷酶活性的核苷酸序列包含SEQ ID NO：25、SEQ ID NO：27或SEQ ID NO：29或由SEQ ID NO：25、SEQ ID NO：27或SEQ ID NO：29组成。在另一优选的方面，所述核苷酸序列包含SEQ ID NO：25、SEQ ID NO：27或SEQ ID NO：29的成熟多肽编码区或由SEQ ID NO：25、SEQ ID NO：27或SEQ ID NO：29的成熟多肽编码区组成。本发明也包括编码如下多肽的核苷酸序列，该多肽包含或其组成为SEQ ID NO：26、SEQ ID NO：28或SEQ ID NO：30的氨基酸序列或其成熟多肽，由于遗传密码的简并性，所述核苷酸序列分别不同于SEQ ID NO：25、SEQ ID NO：27或SEQ ID NO：29。本发明也涉及SEQ ID NO：25、SEQ ID NO：27或SEQ ID NO：29的亚序列，其编码具有β-葡糖苷酶活性的SEQ ID NO：26、SEQ ID NO：28或SEQ IDNO：30的片段。

本发明还涉及在SEQ ID NO：25、SEQ ID NO：27或SEQ ID NO：29的成熟多肽编码序列中包含至少一个突变的突变多核苷酸，其中所述突变核苷酸序列编码SEQ ID NO：26、SEQ ID NO：28或SEQ ID NO：30的成熟多肽。在优选的方面，所述成熟多肽是SEQ ID NO：26的氨基酸20至861、SEQ ID NO：28的氨基酸20至863或SEQ ID NO：30的氨基酸37至878。在另一优选的方面，所述成熟多肽编码序列是SEQ ID NO：25的核苷酸87至2612、SEQ IDNO：27的核苷酸58至2580或SEQ ID NO：29的核苷酸171至2753。

用于分离或克隆编码这种多肽的多核苷酸的技术是本领域内已知的，包括从基因组DNA分离，从cDNA制备，或其组合，如上所述。

所述多核苷酸也可以是编码具有β-葡糖苷酶活性的多肽的多核苷酸，其在至少非常低严紧条件下，优选至少低严紧条件，更优选至少中严紧条件，更优选至少中-高严紧条件，甚至更优选至少高严紧条件，并且最优选至少非常高严紧条件下，与以下杂交：(i)SEQ ID NO：25、SEQ ID NO：27或SEQ IDNO：29的成熟多肽编码序列，(ii)包含在SEQ ID NO：25、SEQ ID NO：27或SEQ ID NO：29的成熟多肽编码序列中的cDNA序列，或者(iii)(i)或(ii)的全长互补链；或它们的等位变体和亚序列，如本文所定义的。

具有增强纤维素分解的活性的多肽

在第一方面，具有增强纤维素分解的活性的分离的多肽包含以下基序(motif)：

[ILMV]-P-X(4，5)-G-X-Y-[ILMV]-X-R-X-[EQ]-X(4)-[HNQ]和[FW]-[TF]-K-[AIV]，

其中X是任何氨基酸，X(4，5)是在4或5个邻接位置上的任何氨基酸并且X(4)是在4个连邻接位置上的任何氨基酸。

包含上述基序的分离的多肽可进一步包含：

H-X(1，2)-G-P-X(3)-[YW]-[AILMV]，

[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV]，或

H-X(1，2)-G-P-X(3)-[YW]-[AILMV]和

[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV]，

其中X是任何氨基酸，X(1，2)是在1个位置或2个邻接位置上的任何氨基酸，X(3)是在3个邻接位置上的任何氨基酸并且X(2)是在2个邻接位置上的任何氨基酸。在以上基序中，采用公认的IUPAC单字母氨基酸缩写。

在优选的方面，具有增强纤维素分解的活性的分离的多肽进一步包含H-X(1，2)-G-P-X(3)-[YW]-[AILMV]。在另一优选的方面，具有增强纤维素分解的活性的分离的多肽还包含[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV]。在另一优选的方面，具有增强纤维素分解的活性的分离的多肽还包含H-X(1，2)-G-P-X(3)-[YW]-[AILMV]和[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV]。

在第二方面，具有增强纤维素分解的活性的分离的多肽包含以下基序：

[ILMV]-P-x(4，5)-G-x-Y-[ILMV]-x-R-x-[EQ]-x(3)-A-[HNQ]，

其中x是任何氨基酸，x(4，5)是在4或5个邻接位置上的任何氨基酸以及x(3)是在3个邻接位置上的任何氨基酸。在以上基序中，采用公认的IUPAC单字母氨基酸缩写。

在第三个方面，具有增强纤维素分解的活性的分离的多肽包含的氨基酸序列与SEQ ID NO：12、SEQ ID NO：14、SEQ ID NO：16、SEQ ID NO：18或SEQ ID NO：20、SEQ ID NO：22或SEQ ID NO：24的成熟多肽具有优选至少70％，更优选至少75％，更优选至少80％，甚至更优选至少85％，甚至更优选至少90％，最优选至少95％，并且甚至最优选至少96％、97％、98％或99％的序列同一性程度，所述多肽具有增强纤维素分解的活性(下文中的“同源多肽”)。在优选的方面，所述同源多肽包含的氨基酸序列与SEQ ID NO：12、SEQID NO：14、SEQ ID NO：16、SEQ ID NO：18或SEQ ID NO：20、SEQ ID NO：22或SEQ ID NO：24的成熟多肽有十个氨基酸，优选五个氨基酸，更优选四个氨基酸，甚至更优选三个氨基酸，最优选两个氨基酸以及甚至最优选一个氨基酸的不同。

具有增强纤维素分解的活性的多肽优选包含SEQ ID NO：12的氨基酸序列或其等位变体；或它们的具有增强纤维素分解的活性的片段。在优选的方面，所述多肽包含SEQ ID NO：12的氨基酸序列。在另一优选的方面，所述多肽包含SEQ ID NO：12的成熟多肽。在另一优选的方面，所述多肽包含SEQID NO：12的氨基酸20至326，或其等位变体；或它们的具有增强纤维素分解的活性的片段。在另一优选的方面，所述多肽包含SEQ ID NO：12的氨基酸20至326。在另一优选的方面，所述多肽由SEQ ID NO：12的氨基酸序列或其等位变体组成；或者由它们具有增强纤维素分解的活性的片段组成。在另一优选的方面，所述多肽由SEQ ID NO：12的氨基酸序列组成。在另一优选的方面，所述多肽由SEQ ID NO：12的成熟多肽组成。在另一优选的方面，所述多肽由SEQ ID NO：12的氨基酸20至326或其等位变体组成；或者由它们的具有增强纤维素分解的活性的片段组成。在另一优选的方面，所述多肽由SEQ ID NO：12的氨基酸20至326组成。

具有增强纤维素分解的活性的多肽优选包含SEQ ID NO：14的氨基酸序列或其等位变体；或者它们的具有增强纤维素分解的活性的片段。在优选的方面，所述多肽包含SEQ ID NO：14的氨基酸序列。在另一优选的方面，多肽包含SEQ ID NO：14的成熟多肽。在另一优选的方面，所述多肽包含SEQ IDNO：14的氨基酸18至240，或其等位变体；或它们的具有增强纤维素分解的活性的片段。在另一优选的方面，所述多肽包含SEQ ID NO：14的氨基酸18至240。在另一优选的方面，所述多肽由SEQ ID NO：14的氨基酸序列或其等位变体组成；或由它们的具有增强纤维素分解的活性的片段组成。在另一优选的方面，所述多肽由SEQ ID NO：14的氨基酸序列组成。在另一优选的方面，所述多肽由SEQ ID NO：14的成熟多肽组成。在另一优选的方面，所述多肽由SEQ ID NO：14的氨基酸18至240或其等位变体组成；或由它们的具有增强纤维素分解的活性的片段组成。在另一优选的方面，所述多肽由SEQ IDNO：14的氨基酸18至240组成。

具有增强纤维素分解的活性的多肽优选包含SEQ ID NO：16的氨基酸序列或其等位变体；或它们的具有增强纤维素分解的活性的片段。在优选的方面，所述多肽包含SEQ ID NO：16的氨基酸序列。在另一优选的方面，所述多肽包含SEQ ID NO：16的成熟多肽。在另一优选的方面，所述多肽包含SEQID NO：16的氨基酸20至258，或其等位变体；或它们的具有增强纤维素分解的活性的片段。在另一优选的方面，所述多肽包含SEQ ID NO：16的氨基酸20至258。在另一优选的方面，所述多肽由SEQ ID NO：16的氨基酸序列或其等位变体组成；或由它们的具有增强纤维素分解的活性的片段组成。在另一优选的方面，所述多肽由SEQ ID NO：16的氨基酸序列组成。在另一优选的方面，所述多肽由SEQ ID NO：16的成熟多肽组成。在另一优选的方面，所述多肽由SEQ ID NO：16的氨基酸20至258或其等位变体组成；或由它们的具有增强纤维素分解的活性的片段组成。在另一优选的方面，所述多肽由SEQ ID NO：16的氨基酸20至258组成。

具有增强纤维素分解的活性的多肽优选包含SEQ ID NO：18的氨基酸序列或其等位变体；或它们的具有增强纤维素分解的活性的片段。在优选的方面，所述多肽包含SEQ ID NO：18的氨基酸序列。在另一优选的方面，所述多肽包含SEQ ID NO：18的成熟多肽。在另一优选的方面，所述多肽包含SEQID NO：18的氨基酸19至226，或其等位变体；或它们的具有增强纤维素分解的活性的片段。在另一优选的方面，所述多肽包含SEQ ID NO：18的氨基酸19至226。在另一优选的方面，所述多肽由SEQ ID NO：18的氨基酸序列或其等位变体组成；或由它们的具有增强纤维素分解的活性的片段组成。在另一优选的方面，所述多肽由SEQ ID NO：18的氨基酸序列组成。在另一优选的方面，所述多肽由SEQ ID NO：18的成熟多肽组成。在另一优选的方面，所述多肽由SEQ ID NO：18的氨基酸19至226或其等位变体组成；或由它们的具有增强纤维素分解的活性的片段组成。在另一优选的方面，所述多肽由SEQ ID NO：18的氨基酸19至226组成。

具有增强纤维素分解的活性的多肽优选包含SEQ ID NO：20的氨基酸序列或其等位变体；或它们的具有增强纤维素分解的活性的片段。在优选的方面，所述多肽包含SEQ ID NO：20的氨基酸序列。在另一优选的方面，所述多肽包含SEQ ID NO：20的成熟多肽。在另一优选的方面，所述多肽包含SEQID NO：20的氨基酸20至304，或其等位变体；或它们的具有增强纤维素分解的活性的片段。在另一优选的方面，所述多肽包含SEQ ID NO：20的氨基酸20至304。在另一优选的方面，所述多肽由SEQ ID NO：20的氨基酸序列或其等位变体组成；或由它们的具有增强纤维素分解的活性的片段组成。在另一优选的方面，所述多肽由SEQ ID NO：20的氨基酸序列组成。在另一优选的方面，所述多肽由SEQ ID NO：20的成熟多肽组成。在另一优选的方面，所述多肽由SEQ ID NO：20的氨基酸20至304或其等位变体组成；或由它们的具有增强纤维素分解的活性的片段组成。在另一优选的方面，所述多肽由SEQ ID NO：20的氨基酸20至304组成。

具有增强纤维素分解的活性的多肽优选包含SEQ ID NO：22的氨基酸序列或其等位变体；或它们的具有增强纤维素分解的活性的片段。在优选的方面，所述多肽包含SEQ ID NO：22的氨基酸序列。在另一优选的方面，所述多肽包含SEQ ID NO：22的成熟多肽。在另一优选的方面，所述多肽包含SEQID NO：22的氨基酸23至250，或其等位变体；或它们的具有增强纤维素分解的活性的片段。在另一优选的方面，所述多肽包含SEQ ID NO：22的氨基酸23至250。在另一优选的方面，所述多肽由SEQ ID NO：22的氨基酸序列或其等位变体组成；或由它们的具有增强纤维素分解的活性的片段组成。在另一优选的方面，所述多肽由SEQ ID NO：22的氨基酸序列组成。在另一优选的方面，所述多肽由SEQ ID NO：22的成熟多肽组成。在另一优选的方面，所述多肽由SEQ ID NO：22的氨基酸23至250或其等位变体组成；或由它们的具有增强纤维素分解的活性的片段组成。在另一优选的方面，所述多肽由SEQ ID NO：22的氨基酸23至250组成。

具有增强纤维素分解的活性的多肽优选包含SEQ ID NO：24的氨基酸序列或其等位变体；或它们的具有增强纤维素分解的活性的片段。在优选的方面，所述多肽包含SEQ ID NO：24的氨基酸序列。在另一优选的方面，所述多肽包含SEQ ID NO：24的成熟多肽。在另一优选的方面，所述多肽包含SEQIDNO：24的氨基酸20至249，或其等位变体；或它们的具有增强纤维素分解的活性的片段。在另一优选的方面，所述多肽包含SEQ ID NO：24的氨基酸20至249。在另一优选的方面，所述多肽由SEQ ID NO：24的氨基酸序列或其等位变体组成；或由它们的具有增强纤维素分解的活性的片段组成。在另一优选的方面，所述多肽由SEQ ID NO：24的氨基酸序列组成。在另一优选的方面，所述多肽由SEQ ID NO：24的成熟多肽组成。在另一优选的方面，所述多肽由SEQ ID NO：24的氨基酸20至249或其等位变体组成；或由它们的具有增强纤维素分解的活性的片段组成。在另一优选的方面，所述多肽由SEQ ID NO：24的氨基酸20至249组成。

在第四方面，具有增强纤维素分解的活性的分离的多肽由如下多核苷酸编码，所述多核苷酸在至少非常低严紧条件下，优选至少低严紧条件下，更优选至少中严紧条件下，更优选至少中-高严紧条件下，甚至更优选至少高严紧条件下，并且最优选至少非常高严紧条件下，与以下杂交：(i)SEQ ID NO：11、SEQ ID NO：13、SEQ ID NO：15、SEQ ID NO：17、SEQ ID NO：19、SEQIDNO：21或SEQ ID NO：23的成熟多肽编码序列，(ii)包含在SEQ ID NO：11、SEQ ID NO：13、SEQ ID NO：15或SEQ ID NO：21的成熟多肽编码序列中的cDNA序列，或包含SEQ ID NO：17、SEQ ID NO：19或SEQ ID NO：23的成熟多肽编码序列的基因组DNA序列，或者(iii)(i)或(ii)的全长互补链。在优选的方面。成熟多肽编码序列是SEQ ID NO：11的核苷酸388至1332、SEQ IDNO：13的核苷酸98至821、SEQ ID NO：15的核苷酸126至978、SEQ ID NO：17的核苷酸55至678、SEQ ID NO：19的核苷酸58至912、SEQ ID NO：21的核苷酸67至796、或SEQ ID NO：23的核苷酸77至766。

SEQ ID NO：11、SEQ ID NO：13、SEQ ID NO：15、SEQ ID NO：17、SEQID NO：19、SEQ ID NO：21或SEQ ID NO：23的核苷酸序列或其亚序列；以及SEQ ID NO：12、SEQ ID NO：14、SEQ ID NO：16、SEQ ID NO：18或SEQID NO：20、SEQ ID NO：22或SEQ ID NO：24的氨基酸序列或其片段，可以用于设计核酸探针，以从不同属和种的菌株鉴定和克隆编码具有增强纤维素分解的活性的多肽的DNA，如上所述。

就本发明而言，杂交表示核苷酸序列在非常低至非常高的严紧条件下与标记的核酸探针杂交，所述核酸探针对应于SEQ ID NO：11、SEQ ID NO：13、SEQ ID NO：15、SEQ ID NO：17、SEQ ID NO：19、SEQ ID NO：21或SEQ IDNO：23的成熟多肽编码序列、包含在SEQ ID NO：11、SEQ ID NO：13、SEQ IDNO：15或SEQ ID NO：21的成熟多肽编码序列中的cDNA序列、或包含SEQIDNO：17、SEQ ID NO：19或SEQ ID NO：23的成熟多肽编码序列的基因组DNA序列、它的互补链或其亚序列，如上文所述。

在优选的方面，核酸探针是SEQ ID NO：11的成熟多肽编码序列。在另一优选的方面，核酸探针是SEQ ID NO：11的核苷酸388至1332。在另一优选的方面，核酸探针是编码SEQ ID NO：12的多肽的多核苷酸序列，或其亚序列。在另一优选的方面，核酸探针是SEQ ID NO：11。在另一优选的方面，核酸探针是包含在质粒pEJG120中的多核苷酸序列，所述质粒包含在大肠杆菌NRRL B-30699中，其中它的多核苷酸序列编码具有增强纤维素分解的活性的多肽。在另一优选的方面，核酸探针是包含在质粒pEJG120中的成熟多肽编码区，所述质粒包含在大肠杆菌NRRL B-30699中。

在另一优选的方面，核酸探针是SEQ ID NO：13的成熟多肽编码序列。在另一优选的方面，核酸探针是SEQ ID NO：13的核苷酸98至821。在另一优选的方面，核酸探针是编码SEQ ID NO：14的多肽的多核苷酸序列，或其亚序列。在另一优选的方面，核酸探针是SEQ ID NO：13。在另一优选的方面，核酸探针是包含在质粒pTter61C中的多核苷酸序列，所述质粒包含在大肠杆菌NRRL B-30813中，其中它的多核苷酸序列编码具有增强纤维素分解的活性的多肽。在另一优选的方面，核酸探针是包含在质粒pTter61C中的成熟多肽编码区，所述质粒包含在大肠杆菌NRRL B-30813中。

在另一优选的方面，核酸探针是SEQ ID NO：15的成熟多肽编码序列。在另一优选的方面，核酸探针是SEQ ID NO：15的核苷酸126至978。在另一优选的方面，核酸探针是编码SEQ ID NO：16的多肽的多核苷酸序列，或其亚序列。在另一优选的方面，核酸探针是SEQ ID NO：15。在另一优选的方面，核酸探针是包含在质粒pTter61D中的多核苷酸序列，所述质粒包含在大肠杆菌NRRL B-30812中，其中它的多核苷酸序列编码具有增强纤维素分解的活性的多肽。在另一优选的方面，核酸探针是包含在质粒pTter61D中的成熟多肽编码区，所述质粒包含在大肠杆菌NRRL B-30812中。

在另一优选的方面，核酸探针是SEQ ID NO：17的成熟多肽编码序列。在另一优选的方面，核酸探针是SEQ ID NO：17的核苷酸55至678。在另一优选的方面，核酸探针是编码SEQ ID NO：18的多肽的多核苷酸序列，或其亚序列。在另一优选的方面，核酸探针是SEQ ID NO：17。在另一优选的方面，核酸探针是包含在质粒pTter61E中的多核苷酸序列，所述质粒包含在大肠杆菌NRRL B-30814中，其中它的多核苷酸序列编码具有增强纤维素分解的活性的多肽。在另一优选的方面，核酸探针是包含在质粒pTter61E中的成熟多肽编码区，所述质粒包含在大肠杆菌NRRL B-30814中。

在另一优选的方面，核酸探针是SEQ ID NO：19的成熟多肽编码序列。在另一优选的方面，核酸探针是SEQ ID NO：19的核苷酸58至912。在另一优选的方面，核酸探针是编码SEQ ID NO：20的多肽的多核苷酸序列，或其亚序列。在另一优选的方面，核酸探针是SEQ ID NO：19。在另一优选的方面，核酸探针是包含在质粒pTter61G中的多核苷酸序列，所述质粒包含在大肠杆菌NRRL B-30811中，其中它的多核苷酸序列编码具有增强纤维素分解的活性的多肽。在另一优选的方面，核酸探针是包含在质粒pTter61G中的成熟多肽编码区，所述质粒包含在大肠杆菌NRRL B-30811中。

在另一优选的方面，核酸探针是SEQ ID NO：21的成熟多肽编码序列。在另一优选的方面，核酸探针是SEQ ID NO：21的核苷酸67至796。在另一优选的方面，核酸探针是编码SEQ ID NO：22的多肽的多核苷酸序列，或其亚序列。在另一优选的方面，核酸探针是SEQ ID NO：21。在另一优选的方面，核酸探针是包含在质粒pDZA2-7中的多核苷酸序列，所述质粒包含在大肠杆菌NRRL B-30704中，其中它的多核苷酸序列编码具有增强纤维素分解的活性的多肽。在另一优选的方面，核酸探针是包含在质粒pDZA2-7中的成熟多肽编码区，所述质粒包含在大肠杆菌NRRL B-30704中。

在另一优选的方面，核酸探针是SEQ ID NO：23的成熟多肽编码序列。在另一优选的方面，核酸探针是SEQ ID NO：23的核苷酸77至766。在另一优选的方面，核酸探针是编码SEQ ID NO：24的多肽的多核苷酸序列，或其亚序列。在另一优选的方面，核酸探针是SEQ ID NO：23。在另一优选的方面，核酸探针是包含在质粒pTr333中的多核苷酸序列，所述质粒包含在大肠杆菌NRRL B-30878中，其中它的多核苷酸序列编码具有增强纤维素分解的活性的多肽。在另一优选的方面，核酸探针是包含在质粒pTr333中的成熟多肽编码区，所述质粒包含在大肠杆菌NRRL B-30878中。

对于长度至少100个核苷酸的长探针，非常低至非常高的严紧条件如在本文中所定义。

对于长度至少100个核苷酸的长探针，载体材料的最终洗涤如在本文中定义。

对于长度大约15个核苷酸至大约70个核苷酸的短探针，严紧条件如本文所定义。

对于长度大约15个核苷酸至大约70个核苷酸的短探针，载体材料的最终洗涤如在本文中定义。

在第五方面，具有增强纤维素分解的活性的多肽由包含如下核苷酸序列或由如下核苷酸序列组成的多核苷酸编码，所述核苷酸序列与SEQ ID NO：11、SEQ ID NO：13、SEQ ID NO：15、SEQ ID NO：17、SEQ ID NO：19、SEQID NO：21或SEQ ID NO：23的成熟多肽编码序列具有优选至少70％，更优选至少75％，甚至更优选至少80％，甚至更优选至少85％，甚至更优选至少90％，最优选至少95％，并且甚至最优选至少96％、97％、98％或99％的序列同一性程度，其编码活性多肽。

在优选的方面，成熟多肽编码序列是SEQ ID NO：11的核苷酸388至1332、SEQ ID NO：13的核苷酸98至821、SEQ ID NO：15的核苷酸126至978、SEQ ID NO：17的核苷酸55至678、SEQ ID NO：19的核苷酸58至912、SEQ ID NO：21的核苷酸67至796、SEQ ID NO：23的核苷酸77至766。参见本文中的多核苷酸部分。

在第六方面，具有增强纤维素分解的活性的多肽是人工变体，所述人工变体包含取代、缺失和/或插入一个或多个(几个)氨基酸的SEQ ID NO：12、SEQ ID NO：14、SEQ ID NO：16、SEQ ID NO：18或SEQ ID NO：20、SEQ IDNO：22或SEQ ID NO：24的成熟多肽或其同源序列。制备这样的人工变体的方法如上所述。

SEQ ID NO：12、SEQ ID NO：14、SEQ ID NO：16、SEQ ID NO：18、SEQIDNO：20、SEQ ID NO：22或SEQ ID NO：24的成熟多肽的氨基酸取代、缺失和/或插入的总数是10，优选9，更优选8，更优选7，更优选至多6，更优选5，更优选4，甚至更优选3，最优选2，并且甚至最优选1。

具有增强纤维素分解的活性的多肽的来源

具有增强纤维素分解的活性的多肽可以获得自任何属的微生物。就本发明而言，用于本文与给定的来源有关的术语“获得自”的意思应为核苷酸序列编码的多肽由所述来源产生，或由其中插入了来自所述来源的核苷酸序列的菌株产生。在优选的方面，获得自给定来源的多肽是胞外分泌的。

具有增强纤维素分解的活性的多肽可以是细菌多肽。例如，所述多肽可以是革兰氏阳性细菌多肽，例如具有增强纤维素分解的活性的芽孢杆菌属、链球菌属、链霉菌属、葡萄球菌属、肠球菌属、乳杆菌属、乳球菌属、梭菌属、地芽孢杆菌属或海洋芽孢杆菌属多肽；或者可以是革兰氏阴性细菌多肽，例如具有增强纤维素分解的活性的大肠杆菌、假单胞菌属、沙门氏菌属、弯曲杆菌属、螺杆菌属、黄杆菌属、梭杆菌属、泥杆菌属、奈瑟氏菌属或脲原体属多肽。

在优选的方面，所述多肽是具有增强纤维素分解的活性的嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌或苏云金芽孢杆菌多肽。

在另一优选的方面，所述多肽是具有增强纤维素分解的活性的似马链球菌、酿脓链球菌、乳房链球菌或马链球菌兽瘟亚种多肽。

在另一优选的方面，所述多肽是具有增强纤维素分解的活性的不产色链霉菌、除虫链霉菌、天蓝色链霉菌、灰色链霉菌或浅青紫链霉菌多肽。

具有增强纤维素分解的活性的多肽还可以是真菌多肽，并且更优选是酵母多肽例如具有增强纤维素分解的活性的念珠菌属、克鲁维酵母属、毕赤酵母属、酵母属、裂殖酵母属或西洋蓍霉属多肽；或更优选是丝状真菌多肽例如具有增强纤维素分解的活性的枝顶孢霉属、蘑菇属(Agaricus)、链格孢属(Alternaria)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、葡萄座腔菌属(Botryospaeria)、拟蜡菌属(Ceriporiopsis)、毛壳菌属(Chaetomidium)、金孢子菌属、麦角属(Claviceps)、旋孢腔菌属(Cochliobolus)、Coprinopsis、Coptotermes、棒囊壳属(Corynascus)、栗疫病菌属(Cryphonectria)、隐球菌属、色二孢属(Diplodia)、黑耳属(Exidia)、Filibasidium、镰孢属、赤霉属(Gibberella)、全鞭毛虫属(Holomastigotoides)、腐质霉属、耙菌属(Irpex)、香菇属(Lentinula)、小球腔菌属(Leptospaeria)、梨孢菌属、Melanocarpus、多孔菌属(Meripilus)、毛霉属、毁丝霉属、新考玛脂霉属、脉孢菌属、拟青霉属、青霉属、平革菌属(Phanerochaete)、瘤胃壶菌属、Poitrasia、假黑盘菌属(Pseudoplectania)、Pseudotrichonympha、根毛霉属(Rhizomucor)、裂褶菌属、柱顶孢属(Scytalidium)、踝节菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属或木霉属、Trichophaea、轮枝孢属(Verticillium)、小包脚菇属(Volvariella)、或炭角菌属(Xylaria)多肽。

在优选的方面，所述多肽是具有增强纤维素分解的活性的卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母或卵形酵母多肽。

在另一个优选的方面，所述多肽是具有增强纤维素分解的活性的解纤维枝顶孢霉(Acremonium cellulolyticus)、棘孢曲霉、泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉黑曲霉、米曲霉、嗜角质金孢子菌(Chrysosporiumkeratinophilum)、Chrysosporium lucknowense、热带金孢子菌(Chrysosporiumtropicum)、Chrysosporium merdarium、Chrysosporium inops、Chrysosporiumpannicola、Chrysosporium queenslandicum、Chrysosporium zonatum、杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、灰腐质霉(Humicolagrisea)、特异腐质霉、疏棉状腐质霉、乳白耙菌(Irpex lacteus)、米赫毛霉、嗜热毁丝霉、粗糙脉孢菌、绳状青霉(Penicillium funiculosum)、产紫青霉、黄孢原毛平革菌、无色梭孢壳(Thielavia achromatica)、Thielavia albomyces、Thielavia albopilosa、澳洲梭孢壳(Thielavia australeinsis)、Thielavia fimeti、小孢子梭孢壳(Thielavia microspora)、Thielavia ovispora、Thielavia peruviana、Thielavia spededonium、毛梭孢壳(Thielavia setosa)、Thielavia subthermophila、土生梭孢霉、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、绿色木霉或Trichophaea saccata多肽。

在更优选的方面，多肽是具有增强纤维素分解的活性的土生梭孢霉多肽。在最优选的方面。多肽是具有增强纤维素分解的活性的土生梭孢霉NRRL8126多肽，例如，SEQ ID NO：12、14、16、18或20的成熟多肽或其具有增强纤维素分解的活性的片段。

在另一更优选的方面，多肽是橙色嗜热子囊菌多肽，例如，SEQ ID NO：22的成熟多肽。

在另一更优选的方面，多肽是具有增强纤维素分解的活性的里氏木酶多肽。在另一最优选的方面，多肽是具有增强纤维素分解的活性的里氏木酶RutC30(ATCC 56765)多肽，例如，SEQ ID NO：24的成熟多肽或其具有增强纤维素分解的活性的片段。

可理解的是对于前述的种，本发明包含完全和不完全阶段两种，和其它分类学的等同物，例如无性型，无论它们已知的种名。本领域熟练技术人员将轻易地识别适合的等同物的身份。

具有增强纤维素分解的活性的多肽还包括融合多肽或可切割的融合多肽，其中将另一种多肽融合到所述多肽或其具有增强纤维素分解的活性的片段的N末端或C末端。生产融合多肽的方法如上所述。

关于具有增强纤维素分解的活性的多肽和其多核苷酸的更多细节参见WO 2005/074647、WO 2005/074656或公开的美国申请流水号2007/0077630，将其通过引用并入本文。

编码具有增强纤维素分解的活性的多肽的多核苷酸

多核苷酸包含如下核苷酸序列或由如下核苷酸序列组成，所述核苷酸序列编码具有增强纤维素分解的活性的多肽，可分离所述多核苷酸并且用于实施本发明的方法，如本文所述。

分离的多肽包含如下多核苷酸序列或由如下多核苷酸序列组成，所述多核苷酸序列与SEQ ID NO：11、SEQ ID NO：13、SEQ ID NO：15、SEQ ID NO：17、SEQ ID NO：19、SEQ ID NO：21或SEQ ID NO：23的成熟多肽编码序列具有优选至少70％，更优选至少75％，甚至更优选至少80％，甚至更优选至少85％，甚至更优选至少90％，最优选至少95％，以及甚至最优选至少96％、97％、98％或99％的序列同一性程度，其编码具有增强纤维素分解的活性的多肽。

在优选的方面，所述核苷酸序列包含SEQ ID NO：11或由SEQ ID NO：11组成。在另一个更优选的方面，所述核苷酸序列包含质粒pEJG120中包含的序列，所述质粒包含在大肠杆菌NRRL B-30699中。在另一个优选的方面，所述核苷酸序列包含或其组成为SEQ ID NO：11的成熟多肽编码区。在另一个更优选的方面，所述核苷酸序列包含或其组成为质粒pEJG120中包含的成熟多肽编码区，所述质粒包含在大肠杆菌NRRL B-30699中。本发明还包含如下核苷酸序列，所述核苷酸序列编码包含SEQ ID NO：12的氨基酸序列或其成熟多肽或由SEQ ID NO：12的氨基酸序列或其成熟多肽组成的多肽，由于遗传密码的简并性，所述核苷酸序列不同于SEQ ID NO：11。本发明还涉及SEQ ID NO：11的亚序列，所述亚序列编码具有增强纤维素分解的活性的SEQID NO：12的片段。

在另一优选的方面，所述核苷酸序列包含SEQ ID NO：13或由SEQ ID NO：13组成。在另一个更优选的方面，所述核苷酸序列包含或其组成为质粒pTter61C中包含的序列，所述质粒包含在大肠杆菌NRRL B-30813中。在另一个优选的方面，所述核苷酸序列包含SEQ ID NO：13的成熟多肽编码区或由SEQ ID NO：13的成熟多肽编码区组成。在另一个更优选的方面，所述核苷酸序列包含质粒pTter61C中包含的成熟多肽编码区或由质粒pTter61C中包含的成熟多肽编码区组成，所述质粒包含在大肠杆菌NRRL B-30813中。本发明还包含如下核苷酸序列，所述核苷酸序列编码包含SEQ ID NO：14的氨基酸序列或其成熟多肽或由SEQ ID NO：14的氨基酸序列或其成熟多肽组成的多肽，由于遗传密码的简并性，所述核苷酸序列不同于SEQ ID NO：13。本发明还涉及SEQ ID NO：13的亚序列，所述亚序列编码具有增强纤维素分解的活生的SEQ ID NO：14的片段。

在另一优选的方面，所述核苷酸序列包含SEQ ID NO：15或由SEQ ID NO：15组成。在另一个更优选的方面，所述核苷酸序列包含或其组成为质粒pTter61D中包含的序列，所述质粒包含在大肠杆菌NRRL B-30812中。在另一个优选的方面，所述核苷酸序列包含SEQ ID NO：15的成熟多肽编码区或由SEQ ID NO：15的成熟多肽编码区组成。在另一个更优选的方面，所述核苷酸序列包含质粒pTter61D中包含的成熟多肽编码区或由质粒pTter61D中包含的成熟多肽编码区组成，所述质粒包含在大肠杆菌NRRL B-30812中。本发明还包含如下核苷酸序列，所述核苷酸序列编码包含SEQ ID NO：16的氨基酸序列或其成熟多肽或由SEQ ID NO：16的氨基酸序列或其成熟多肽组成的多肽，由于遗传密码的简并性，所述核苷酸序列不同于SEQ ID NO：15。本发明还涉及SEQ ID NO：15的亚序列，所述亚序列编码具有增强纤维素分解的活性的SEQ ID NO：16的片段。

在另一优选的方面，所述核苷酸序列包含SEQ ID NO：17或由SEQ ID NO：17组成。在另一个更优选的方面，所述核苷酸序列包含或其组成为质粒pTter61E中包含的序列，所述质粒包含在大肠杆菌NRRL B-30814中。在另一个优选的方面，所述核苷酸序列包含SEQ ID NO：17的成熟多肽编码区或由SEQ ID NO：17的成熟多肽编码区组成。在另一个更优选的方面，所述核苷酸序列包含质粒pTter61E中包含的成熟多肽编码区或由质粒pTter61E中包含的成熟多肽编码区组成，所述质粒包含在大肠杆菌NRRL B-30814中。本发明还包含如下核苷酸序列，所述核苷酸序列编码包含SEQ ID NO：18的氨基酸序列或其成熟多肽或由SEQ ID NO：18的氨基酸序列或其成熟多肽组成的多肽，由于遗传密码的简并性，所述核苷酸序列不同于SEQ ID NO：17。本发明还涉及SEQ ID NO：17的亚序列，所述亚序列编码具有增强纤维素分解的活性的SEQ ID NO：18的片段。

在另一优选的方面，所述核苷酸序列包含SEQ ID NO：19或由SEQ ID NO：19组成。在另一个更优选的方面，所述核苷酸序列包含或其组成为质粒pTter61G中包含的序列，所述质粒包含在大肠杆菌NRRL B-30811中。在另一个优选的方面，所述核苷酸序列包含SEQ ID NO：19的成熟多肽编码区或由SEQ ID NO：19的成熟多肽编码区组成。在另一个更优选的方面，所述核苷酸序列包含质粒pTter61G中包含的成熟多肽编码区或由质粒pTter61G中包含的成熟多肽编码区组成，所述质粒包含在大肠杆菌NRRL B-30811中。本发明还包含如下核苷酸序列，所述核苷酸序列编码包含SEQ ID NO：20的氨基酸序列或其成熟多肽或由SEQ ID NO：20的氨基酸序列或其成熟多肽组成的多肽，由于遗传密码的简并性，所述核苷酸序列不同于SEQ ID NO：19。本发明还涉及SEQ ID NO：19的亚序列，所述亚序列编码具有增强纤维素分解的活性的SEQ ID NO：20的片段。

在另一优选的方面，所述核苷酸序列包含SEQ ID NO：21或由SEQ ID NO：21组成。在另一个更优选的方面，所述核苷酸序列包含或其组成为质粒pDZA2-7中包含的序列，所述质粒包含在大肠杆菌NRRL B-30704中。在另一个优选的方面，所述核苷酸序列包含SEQ ID NO：21的成熟多肽编码区或由SEQ ID NO：21的成熟多肽编码区组成。在另一个更优选的方面，所述核苷酸序列包含质粒pDZA2-7中包含的成熟多肽编码区或由质粒pDZA2-7中包含的成熟多肽编码区组成，所述质粒包含在大肠杆菌NRRL B-30704中。本发明还包含如下核苷酸序列，所述核苷酸序列编码包含SEQ ID NO：22的氨基酸序列或其成熟多肽或由SEQ ID NO：22的氨基酸序列或其成熟多肽组成，由于遗传密码的简并性，所述核苷酸序列不同于SEQ ID NO：21。本发明还涉及SEQ ID NO：21的亚序列，所述亚序列编码具有增强纤维素分解的活性的SEQ ID NO：22的片段。

在另一优选的方面，所述核苷酸序列包含SEQ ID NO：23或由SEQ ID NO：23组成。在另一个更优选的方面，所述核苷酸序列包含或其组成为质粒pTr3337中包含的序列，所述质粒包含在大肠杆菌NRRL B-30878中。在另一个优选的方面，所述核苷酸序列包含SEQ ID NO：23的成熟多肽编码区或由SEQ ID NO：23的成熟多肽编码区组成。在另一个更优选的方面，所述核苷酸序列包含质粒pTr3337中包含的成熟多肽编码区或由质粒pTr3337中包含的成熟多肽编码区组成，所述质粒包含在大肠杆菌NRRL B-30878中。本发明还包含如下核苷酸序列，所述核苷酸序列编码包含SEQ ID NO：24的氨基酸序列或其成熟多肽或由SEQ ID NO：24的氨基酸序列或其成熟多肽组成的多肽，由于遗传密码的简并性，所述核苷酸序列不同于SEQ ID NO：23或其成熟多肽编码序列。本发明还涉及SEQ ID NO：23的亚序列，所述亚序列编码具有增强纤维素分解的活性的SEQ ID NO：24的片段。

本发明还涉及在SEQ ID NO：11、SEQ ID NO：13、SEQ ID NO：15、SEQIDNO：17、SEQ ID NO：19、SEQ ID NO：21或SEQ ID NO：23的成熟多肽编码序列中包含至少一个突变的突变多核苷酸，其中所述突变核苷酸序列编码SEQ ID NO：12、SEQ ID NO：14、SEQ ID NO：16、SEQ ID NO：18或SEQ IDNO：20、SEQ ID NO：22或SEQ ID NO：24的成熟多肽。在优选的方面，所述成熟多肽是SEQ ID NO：12的氨基酸20至326，SEQ ID NO：14的氨基酸18至240，SEQ ID NO：16的氨基酸20至258，SEQ ID NO：18的氨基酸19至226或SEQ ID NO：20的氨基酸20至304，SEQ ID NO：22的氨基酸23至250或SEQ ID NO：24的氨基酸20至249。在另一优选的方面，所述成熟多肽编码序列是SEQ ID NO：11的核苷酸388至1332，SEQ ID NO：13的核苷酸98至821，SEQ ID NO：15的核苷酸126至978，SEQ ID NO：17的核苷酸55至678，SEQ ID NO：19的核苷酸58至912，SEQ ID NO：21的核苷酸67至796，SEQ ID NO：23的核苷酸77至766。

如早前所述，用于分离或克隆编码多肽的多核苷酸的技术是本领域内已知的，包括从基因组DNA分离，从cDNA制备，或其组合。

所述分离的多核苷酸也可以是编码具有增强纤维素分解的活性的多肽的多核苷酸，所述多核苷酸在至少极低严紧条件下，优选至少低严紧条件下，更优选至少中严紧条件下，更优选至少中-高严紧条件下，甚至更优选至少高严紧条件下，并且最优选至少非常高严紧条件下，与以下杂交：(i)SEQ ID NO：11、SEQ ID NO：13、SEQ ID NO：15、SEQ ID NO：17、SEQ ID NO：19、SEQID NO：21或SEQ ID NO：23的成熟多肽编码序列，(ii)包含在SEQ ID NO：11、SEQ ID NO：13、SEQ ID NO：15或SEQ ID NO：21的成熟多肽编码序列中的cDNA序列或包含SEQ ID NO：17、SEQ ID NO：19或SEQ ID NO：23的成熟多肽编码序列的基因组DNA序列，或(iii)(i)或(ii)的全长互补链；或其等位变体和亚序列，如本文所定义。在优选的方面，成熟多肽编码序列是SEQ ID NO：11的核苷酸388至1332，SEQ ID NO：13的核苷酸98至821，SEQ ID NO：15的核苷酸126至978，SEQ ID NO：17的核苷酸55至678，SEQ ID NO：19的核苷酸58至912，SEQ ID NO：21的核苷酸67至796，或SEQ ID NO：23的核苷酸77至766。

核酸构建体

分离的多核苷酸，其编码具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽，和/或具有β-葡糖苷酶活性的多肽，可以用许多方式操作所述分离的多核苷酸，从而通过构建核酸构建体来提供所述多肽的表达，所述核酸构建体包含一个或多个(几)所述分离的多核苷酸，其与一个或多个(几)调控序列可操作地连接，所述调控序列在合适的宿主细胞中在与该调控序列相容的条件下指导编码序列表达。依赖于表达载体，在将多核苷酸的序列插入载体之前对其进行操作可能是理想的或必需的。使用重组DNA方法修饰多核苷酸序列的技术是本领域熟知的。

调控序列可以是合适的启动子序列，其是由宿主细胞识别用于表达编码这种多肽的多核苷酸的核苷酸序列。启动子序列含有介导所述多肽表达的转录调控序列。启动子可以是在所选的宿主细胞中显示转录活性的任何核苷酸序列，包括突变的、截断的和杂合的启动子，并且可以从编码与宿主细胞同源或异源的胞外或胞内多肽的基因获得。

用于指导所述核酸构建体的转录，特别是在细菌宿主细胞中的转录的合适启动子的实例是从下述获得的启动子：大肠杆菌lac操纵子、天蓝色链霉菌琼脂糖酶基因(dagA)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌α-淀粉酶基因(amyL)、嗜热脂肪芽孢杆菌产麦芽淀粉酶基因(amyM)、解淀粉芽孢杆菌α-淀粉酶基因(amyQ)、地衣芽孢杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因和原核β-内酰胺酶基因(Villa-Kamaroff等人，1978，Proceedings of the National Academy of Sciences USA 75：3727-3731)，以及tac启动子(DeBoer等人，1983，Proceedings of the National Academy of SciencesUSA 80：21-25)。另外的启动子在″Useful proteins from recombinant bacteria″inScientific American，1980，242：74-94中；和在Sambrook等人，1989，见上文中有所描述。

用于指导所述核酸构建体在丝状真菌宿主细胞中转录的合适启动子的实例是从下述酶的基因获得的启动子：米曲霉TAKA淀粉酶、曼赫根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、曼赫根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、构巢曲霉乙酰胺酶、镶片镰孢淀粉葡糖苷酶(WO 00/56900)、镶片镰孢Daria(WO 00/56900)、镶片镰孢Quinn(WO00/56900)、尖镰孢胰蛋白酶样蛋白酶(WO 96/00787)、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶IV、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉β-木糖苷酶，以及NA2-tpi启动子(来自黑曲霉中性α-淀粉酶基因和米曲霉丙糖磷酸异构酶基因的启动子的杂合体)；和它们的突变的、截断的和杂合的启动子。

在酵母宿主中，有用的启动子从下述蛋白的基因获得：酿酒酵母烯醇化酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH1，ADH2/GAP)、酿酒酵母丙糖磷酸异构酶(TPI)、酿酒酵母金属硫蛋白(CUP1)和酿酒酵母3-磷酸甘油酸激酶。对于酵母宿主细胞其它有用的启动子由Romanos等人，1992，Yeast 8：423-488描述。

调控序列也可以是合适的转录终止子序列，其是由宿主细胞识别以终止转录的序列。所述终止子序列与编码所述多肽的核苷酸序列的3’末端可操作地连接。可以将在所选宿主细胞中有功能的任何终止子用在本发明中。

对于丝状真菌宿主细胞优选的终止子从如下蛋白的基因获得：米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉α-葡糖苷酶和尖镰孢胰蛋白酶样蛋白酶。

对于酵母宿主细胞优选的终止子从如下蛋白的基因获得：酿酒酵母烯醇化酶、酿酒酵母细胞色素C(CYC1)和酿酒酵母甘油醛-3-磷酸脱氢酶。对于酵母宿主细胞其它有用的终止子由Romanos等人，1992，见上文描述。

调控序列还可以是合适的前导序列，其是对于宿主细胞的翻译重要的mRNA非翻译区。前导序列可操作地连接于编码多肽的核苷酸序列的5’末端。可以将在所选宿主细胞中有功能的任何前导序列用在本发明中。

对于丝状真菌宿主细胞优选的前导序列从米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶的基因获得。

对于酵母宿主细胞合适的前导序列从如下蛋白的基因获得：酿酒酵母烯醇化酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α因子和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。

调控序列也可以是聚腺苷酸化序列，其是与核苷酸序列的3’末端可操作地连接的序列，并且在转录时，宿主细胞将其识别为将聚腺苷残基添加至转录的mRNA的信号。可以将在所选宿主细胞中有功能的任何聚腺苷酸化序列在本发明中使用。

对于丝状真菌宿主细胞优选的聚腺苷酸化序列从如下蛋白的基因获得：米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖镰孢胰蛋白酶样蛋白酶和黑曲霉α-葡糖苷酶。

对于酵母宿主细胞有用的聚腺苷酸化序列由Guo and Sherman，1995，Molecular Cellular Biology 15：5983-5990描述。

调控序列还可以是信号肽编码区，其编码与多肽的氨基末端连接的氨基酸序列，并且指导编码的多肽进入细胞分泌途径。核苷酸序列的编码序列5’端可固有地包含信号肽编码区，其与编码分泌多肽的编码区片段一起天然地连接在翻译阅读框中。可供选择的是，编码序列5’端可含有对于所述编码序列是外源的信号肽编码区。外源信号肽编码区在编码序列不天然地含有信号肽编码区时可能是需要的。或者，外源信号肽编码区可以简单地取代天然信号肽编码区以增强多肽的分泌。然而，指导表达的多肽进入所选宿主细胞的分泌途径(即，分泌至培养基中)的任何信号肽编码区可在本发明中使用。

对于细菌宿主细胞有效的信号肽编码区是从如下蛋白的基因获得的信号肽编码区：芽孢杆菌属NCIB 11837产麦芽糖淀粉酶、嗜热脂肪芽孢杆菌α-淀粉酶、地衣芽孢杆菌枯草蛋白酶(subtilisin)、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT、nprS、nprM)和枯草芽孢杆菌prsA。另外的信号肽由Simonen and Palva，1993，Microbiological Reviews 57：109-137描述。

对于丝状真菌宿主细胞有效的信号肽编码区是从如下蛋白的基因获得的信号肽编码区：米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、曼赫根毛霉天冬氨酸蛋白酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶V和疏棉状腐质霉脂肪酶。

在优选的方面，信号肽包含SEQ ID NO：2的氨基酸1至20或由SEQ IDNO：2的氨基酸1至20组成。在另一个优选的方面，信号肽编码区包含SEQID NO：1的核苷酸1至60或由SEQ ID NO：1的核苷酸1至60组成。

在另一优选的方面，信号肽包含SEQ ID NO：4的氨基酸1至15或由SEQID NO：4的氨基酸1至15组成。在另一个优选的方面，信号肽编码区包含SEQ ID NO：3的核苷酸1至45或由SEQ ID NO：3的核苷酸1至45组成。

在另一优选的方面，信号肽包含SEQ ID NO：6的氨基酸1至18或由SEQID NO：6的氨基酸1至18组成。在另一个优选的方面，信号肽编码区包含SEQ ID NO：5的核苷酸1至54或由SEQ ID NO：5的核苷酸1至54组成。

在另一优选的方面，信号肽包含SEQ ID NO：8的氨基酸1至17或由SEQID NO：8的氨基酸1至17组成。在另一个优选的方面，信号肽编码区包含SEQ ID NO：7的核苷酸1至51或由SEQ ID NO：7的核苷酸1至51组成。

在另一优选的方面，信号肽包含SEQ ID NO：10的氨基酸1至20或由SEQID NO：10的氨基酸1至20组成。在另一个优选的方面，信号肽编码区包含SEQ ID NO：9的核苷酸1至60或由SEQ ID NO：9的核苷酸1至60组成。

在另一优选的方面，信号肽包含SEQ ID NO：12的氨基酸1至19或由SEQ ID NO：12的氨基酸1至19组成。在另一个优选的方面，信号肽编码区包含SEQ ID NO：11的核苷酸330至387或由SEQ ID NO：7的核苷酸330至387组成。

在另一优选的方面，信号肽包含SEQ ID NO：14的氨基酸1至17或由SEQ ID NO：14的氨基酸1至17组成。在另一个优选的方面，信号肽编码区包含SEQ ID NO：13的核苷酸47至97或由SEQ ID NO：13的核苷酸47至97组成。

在另一优选的方面，信号肽包含核苷酸编码区或由氨基酸编码区组成，所述氨基酸编码区是SEQ ID NO：16的氨基酸1至19。在另一个优选的方面，信号肽编码区包含SEQ ID NO：15的核苷酸69至125或由SEQ ID NO：15的核苷酸69至125组成。

在另一优选的方面，信号肽包含SEQ ID NO：18的氨基酸1至18或由SEQ ID NO：18的氨基酸1至18组成。在另一个优选的方面，信号肽编码区包含SEQ ID NO：17的核苷酸1至54或由SEQ ID NO：17的核苷酸1至54组成。

在另一优选的方面，信号肽包含SEQ ID NO：20的氨基酸1至19或由SEQ ID NO：20的氨基酸1至19组成。在另一个优选的方面，信号肽编码区包含SEQ ID NO：19的核苷酸1至57或由SEQ ID NO：19的核苷酸1至57组成。

在另一优选的方面，信号肽包含SEQ ID NO：22的氨基酸1至22或由SEQ ID NO：22的氨基酸1至22组成。在另一个优选的方面，信号肽编码区包含SEQ ID NO：21的核苷酸1至66或由SEQ ID NO：21的核苷酸1至66组成。

在另一优选的方面，信号肽包含SEQ ID NO：24的氨基酸1至19或由SEQ ID NO：24的氨基酸1至19组成。在另一个优选的方面，信号肽编码区包含SEQ ID NO：23的核苷酸20至76或由SEQ ID NO：23的核苷酸20至76组成。

在另一优选的方面，信号肽包含SEQ ID NO：26的氨基酸1至19或由SEQ ID NO：26的氨基酸1至19组成。在另一个优选的方面，信号肽编码区包含SEQ ID NO：25的核苷酸31至86或由SEQ ID NO：25的核苷酸31至86组成。

在另一优选的方面，信号肽包含SEQ ID NO：26的氨基酸1至19或由SEQ ID NO：26的氨基酸1至19组成。在另一个优选的方面，信号肽编码区包含SEQ ID NO：27的核苷酸1至57或由SEQ ID NO：27的核苷酸1至57组成。

在另一优选的方面，信号肽包含SEQ ID NO：28的氨基酸1至19或由SEQ ID NO：28的氨基酸1至19组成。在另一个优选的方面，信号肽编码区包含SEQ ID NO：29的核苷酸6至62或由SEQ ID NO：29的核苷酸6至62组成。

对于酵母宿主细胞有用的信号肽从酿酒酵母α因子和酿酒酵母转化酶的基因获得。其它有用的信号肽编码区由Romanos等人，1992，见上文，描述。

调控序列还可以是前肽编码区，其编码位于多肽氨基末端的氨基酸序列。所得多肽称为酶原(proenzyme)或前多肽(propolypeptide)(或在某些情况下称为酶原(zymogen))。前多肽通常是无活性的并且能够通过前肽的催化或自催化切割从前多肽转化成成熟活性多肽。可以从枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、酿酒酵母α因子、曼赫根毛霉天冬氨酸蛋白酶和嗜热毁丝霉漆酶(WO 95/33836)的基因获得前肽编码区。

当信号肽和前肽区二者均出现在多肽的氨基末端时，将前肽区置于紧接着(next to)多肽氨基末端，并且将信号肽区置于紧接着前肽区的氨基末端。

同样理想的是添加调节序列，其允许相对于宿主细胞的生长来调节多肽的表达。调节系统的实例是引起基因表达响应化学或物理刺激物，包括调节化合物的存在而开启或关闭的那些系统。原核系统中的调节系统包括lac、tac和trp操纵基因系统。在酵母中，可以使用ADH2系统或GAL1系统。在丝状真菌中，可以使用TAKAα-淀粉酶启动子、黑曲霉葡糖淀粉酶启动子和米曲霉葡糖淀粉酶启动子作为调节序列。调节序列的其它实例是那些允许基因扩增的序列。在真核系统中，这些序列包括在氨甲蝶呤(methotrexate)存在下扩增的二氢叶酸还原酶基因，和以重金属(with heavy metal)扩增的金属硫蛋白基因。在这些情况下，编码多肽的核苷酸序列将与调节序列可操作地连接。

表达载体

可以将本文描述的多种核酸和调控序列结合在一起以产生重组表达载体，其包含编码具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽和/或具有β-葡糖苷酶活性的多肽的多核苷酸、启动子和转录和翻译的终止信号。所述表达载体可以包括一种或多种(几)方便的限制位点以允许在这些位点插入或取代编码所述多肽的核苷酸序列。可供选择的是，可以通过将所述核苷酸序列或包含该序列的核酸构建体插入用于表达的适当载体中来表达编码这样的多肽的多核苷酸。在制备表达载体的过程中，将编码序列置于载体中，从而将该编码序列与适当的用于表达的调控序列可操作地连接。

重组表达载体可以是任何载体(例如，质粒或病毒)，其能够方便地进行重组DNA步骤，并且能够产生核苷酸序列的表达。载体的选择将通常依赖于载体与将引入该载体的宿主细胞的相容性。载体可以是线状或闭合环状质粒。

载体可以是自主复制载体，即，作为染色体外实体(entity)存在的载体，其复制独立于染色体复制，例如，质粒、染色体外元件、微型染色体(minichromosome)或人工染色体。载体可以含有任何用于确保自复制的手段(means)。或者，载体可以是一种当被引入宿主细胞中时，整合到基因组中并且与整合了该载体的染色体一起复制的载体。此外，可以使用单独的载体或质粒或两个或更多个载体或质粒，其共同含有待引入宿主细胞基因组的完整DNA(total DNA)，或可以使用转座子(transposon)。

所述载体优选地含有一个或多个(几)选择性标记，其允许简单选择经转化、转染、转导等的细胞。选择性标记是基因，其产物提供杀生物剂或病毒抗性、对重金属的抗性、对营养缺陷型的原养性(prototrophy to auxotrophs)等。

细菌选择性标记的实例是来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因，或赋予抗生素抗性的标记，所述抗生素抗性例如氨苄青霉素、卡那霉素、氯霉素或四环素抗性。对于酵母宿主细胞合适的标记是ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于丝状真菌宿主细胞的选择性标记包括但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草铵膦(phosphinothricin)乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)(nitrate reductase)、pyrG(乳清酸核苷-5’-磷酸脱羧酶)(orotidine-5’-phosphatedecarboxylase)、sC(硫酸腺苷酰转移酶)和trpC(邻氨基苯甲酸合酶(anthranilatesynthase))以及它们的等价物。优选用在曲霉属细胞中的是构巢曲霉或米曲霉的amdS和pyrG基因和吸水链霉菌(Streptomyces hygroscopicus)的bar基因。

所述载体优选含有元件，其允许载体整合入宿主细胞基因组或载体在细胞中独立于基因组的自主复制。

为了整合入宿主细胞基因组，载体可依赖编码多肽的多核苷酸的序列或用于通过同源或非同源重组整合入基因组的任何其它载体元件。或者，载体可以含有额外的核苷酸序列，用于指导通过同源重组整合入宿主细胞基因组染色体中的精确位置。为了增加在精确位置整合的可能性，整合元件应该优选含有足够数目的核酸，如100至10,000碱基对，优选400至10,000碱基对，并且最优选800至10,000碱基对，其与相应的靶序列具有高度序列同一性以增强同源重组的概率。整合元件可以是与宿主细胞基因组中的靶序列同源的任何序列。此外，整合元件可以是非编码或编码的核苷酸序列。另一方面，可以通过非同源重组将载体整合到宿主细胞基因组中。

为了自主复制，载体可以进一步包含复制起点，其使载体能够在所述的宿主细胞中自主地复制。复制起点可以是介导自主复制的任何质粒复制子(replicator)，其在细胞中发挥功能。术语“复制起点”或“质粒复制子”在本文定义为能够使质粒或载体在体内复制的核苷酸序列。

细菌复制起点的实例是允许在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177和pACYC184的复制起点，和允许在芽孢杆菌属中复制的质粒pUB110、pE194、pTA1060和pAMβ1的复制起点。

用于酵母宿主细胞中的复制起点的实例是2微米复制起点，ARS1，ARS4，ARS1和CEN3的组合，和ARS4和CEN6的组合。

在丝状真菌细胞中有用的复制起点的实例是AMA1和ANS1(Gems等人，1991，Gene 98：61-67；Cullen等人，1987，Nucleic Acids Research 15：9163-9175；WO 00/24883)。分离AMA1基因和构建包含该基因的质粒或载体能够根据公开于WO 00/24883中的方法完成。

可以将多于一个拷贝的编码这样的多肽的多核苷酸插入宿主细胞以增加该多肽的产生，所述多核苷酸编码这样的多肽。多核苷酸拷贝数的增加可通过如下方法获得：将至少一个额外拷贝的序列整合入宿主细胞基因组，或使所述多核苷酸包括可扩增选择性标记基因，其中可通过在合适的选择剂(selectable agent)存在下培养细胞来选择含有选择性标记基因的扩增拷贝并且由此含有多核苷酸的额外拷贝的细胞。

用于连接上述元件以构建所述重组表达载体的方法是本领域技术人员熟知的(参见，例如，Sambrook等人，1989，见上文)。

宿主细胞

重组宿主细胞，其包含多核苷酸，所述多核苷酸编码具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽和/或具有β-葡糖苷酶活性的多肽，可将所述重组宿主细胞有利地使用在所述多肽的重组产生中。将包含这种多核苷酸的载体引入宿主细胞中，从而将该载体保留作为染色体整合体(chromosomalintegrant)或作为前述的自复制的染色体外载体。术语“宿主细胞”包含亲本细胞的任何子代，其由于复制过程中发生的突变而与亲本细胞不相同。宿主细胞的选择将很大程度依赖于编码多肽的基因和它的来源。

宿主细胞可以是单细胞微生物，例如，原核生物，或非单细胞微生物，例如，真核生物。

细菌宿主可以是任何革兰氏阳性细菌或革兰氏阴性细菌。革兰氏阳性细菌包括但不限于芽孢杆菌属、链球菌属、链霉菌属、葡萄球菌属、肠球菌属、乳杆菌属、乳球菌属、梭菌属、地芽孢杆菌属或海洋芽孢杆菌属。革兰氏阴性细菌包括但不限于大肠杆菌、假单胞菌属、沙门氏菌属、弯曲杆菌属、螺杆菌属、黄杆菌属、梭杆菌属、泥杆菌属、奈瑟氏菌属或脲原体属。

细菌宿主细胞可以是任何芽孢杆菌属细胞。在本发明的实施中有用的芽孢杆菌属细胞包括但不限于嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌和苏云金芽孢杆菌细胞。

在优选的方面，细菌宿主细胞是解淀粉芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、嗜热脂肪芽孢杆菌或枯草芽孢杆菌细胞。在更优选的方面，细菌宿主细胞是解淀粉芽孢杆菌细胞。在另一个更优选的方面，细菌宿主细胞是克劳氏芽孢杆菌细胞。在另一个更优选的方面，细菌宿主细胞是地衣芽孢杆菌细胞。在另一个更优选的方面，细菌宿主细胞是枯草芽孢杆菌细胞。

细菌宿主细胞还可以是任何链球菌属细胞。在本发明的实施中有用的链球菌属细胞包括但不限于似马链球菌、酿脓链球菌、乳房链球菌和马链球菌兽瘟亚种。

在优选的方面，细菌宿主细胞是似马链球菌细胞。在另一个优选的方面，细菌宿主细胞是酿脓链球菌细胞。在另一个优选的方面，细菌宿主细胞是乳房链球菌细胞。在另一个优选的方面，细菌宿主细胞是马链球菌兽瘟亚种细胞。

细菌宿主细胞还可以是任何链霉菌属细胞。在本发明的实施中有用的链霉菌属细胞包括但不限于不产色链霉菌、除虫链霉菌、天蓝色链霉菌、灰色链霉菌和浅青紫链霉菌。

在优选的方面，细菌宿主细胞是不产色链霉菌细胞。在另一个优选的方面，细菌宿主细胞是除虫链霉菌细胞。在另一个优选的方面，细菌宿主细胞是天蓝色链霉菌细胞。在另一个优选的方面，细菌宿主细胞是灰色链霉菌细胞。在另一个优选的方面，细菌宿主细胞是浅青紫链霉菌细胞。

可通过如下方法实现将DNA引入芽孢杆菌属细胞：例如通过原生质体转化(参见，例如，Chang and Cohen，1979，Molecular General Genetics 168：111-115)，通过使用感受态细胞(参见，例如，Young and Spizizen，1961，Journalof Bacteriology 81：823-829或Dubnau and Davidoff-Abelson，1971，Journal ofMolecular Biology 56：209-221)，通过电穿孔(参见，例如，Shigekawa and Dower，1988，Biotechniques 6：742-751)或通过接合(参见，例如，Koehler and Thorne，1987，Journal of Bacteriology 169：5771-5278)。可通过如下方法实现将DNA引入大肠杆菌细胞：例如通过原生质体转化(参见，例如，Hanahan，1983，J.Mol.Biol.166：557-580)或通过电穿孔(参见，例如，Dower等人，1988，Nucleic AcidsRes.16：6127-6145)。可通过如下方法实现将DNA引入链霉菌属细胞：例如通过原生质体转化和电穿孔(参见，例如，Gong等人，2004，Folia Microbiol.(Praha)49：399-405)，通过接合(参见，例如，Mazodier等人，1989，J.Bacteriol.171：3583-3585)，或通过转导(参见，例如，Burke等人，2001，Proc.Natl.Acad.Sci.USA 98：6289-6294)。可通过如下方法实现将DNA引入假单胞菌属细胞：例如通过电穿孔(参见，例如，Choi等人，2006，J.Microbiol.Methods 64：391-397)或通过接合(参见，例如，Pinedo and Smets，2005，Appl.Environ.Microbiol.71：51-57)。可通过如下方法实现将DNA引入链球菌属细胞：例如通过天然感受态(参见，例如，Perry and Kuramitsu，1981，Infect.Immun.32：1295-1297)，通过原生质体转化(参见，例如，Catt and Jollick，1991，Microbios.68：189-2070)，通过电穿孔(参见，例如，Buckley等人，1999，Appl.Environ.Microbiol.65：3800-3804)或通过接合(参见，例如，Clewell，1981，Microbiol.Rev.45：409-436)。然而，可以使用任何将DNA引入宿主细胞的本领域已知方法。

宿主细胞还可以是真核细胞，例如哺乳动物、昆虫、植物或真菌细胞。

在优选的方面，宿主细胞是真菌细胞。“真菌”用在本文包括以下门：子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)和接合菌门(Zygomycota)(如由Hawksworth等人，In，Ainsworth and Bisby’sDictionary of The Fungi，8th edition，1995，CAB International，University Press，Cambridge，UK所定义)以及卵菌门(Oomycota)(如Hawksworth等人，1995，见上，171页中所引用)，和所有有丝分裂孢子真菌(mitosporic fungi)(Hawksworth等人，1995，见上)。

在更优选的方面，真菌宿主细胞是酵母细胞。“酵母”用在本文包括产子囊酵母(ascosporogenous yeast)(内孢霉目(Endomycetales))、产担子酵母(basidiosporogenous yeast)和属于半知菌类(Fungi Imperfecti)(芽孢纲(Blastomycetes))的酵母。由于酵母的分类在未来可能改变，就本发明而言，应将酵母定义为如Biology and Activities of Yeast(Skinner，F.A.，Passmore，S.M.，and Davenport，R.R.，eds，Soc.App.Bacteriol.Symposium Series No.9，1980)中所述。

在更加优选的方面，酵母宿主细胞是念珠菌属、汉逊酵母属(Hansenula)、克鲁维酵母属、毕赤酵母属、酵母属、裂殖酵母属或西洋蓍霉属细胞。

在最优选的方面，酵母宿主细胞是卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母或卵形酵母细胞。在另外最优选的方面，酵母宿主细胞是乳酸克鲁维酵母(Kluyveromyces lactis)细胞。在另外最优选的方面，酵母宿主细胞是解脂西洋蓍霉(Yarrowia lipolytica)细胞。

在另外更优选的方面，真菌宿主细胞是丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门的亚门(如由Hawksworth等人，1995，见上文，所定义)的所有丝状形式。丝状真菌通常的特征在于由壳多糖(chitin)、纤维素、葡聚糖、壳聚糖(chitosan)、甘露聚糖和其它复杂多糖组成的菌丝体壁。通过菌丝延伸进行营养生长，而碳分解代谢是专性需氧的。相反，酵母例如酿酒酵母的营养生长通过单细胞菌体的出芽生殖(budding)进行，而碳分解代谢可以是发酵的。

在甚至更优选的方面，丝状真菌宿主细胞是枝顶孢霉属、曲霉属、短梗霉属、烟管霉属(Bjerkandera)、拟蜡菌属、金孢子菌属、鬼伞属(Coprinus)、革盖菌属(Coriolus)、隐球菌属、Filibasidium、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新考玛脂霉属、脉孢菌属、拟青霉属、青霉属、平革菌属、射脉菌属(Phlebia)、瘤胃壶菌属、侧耳属(Pleurotus)、裂褶菌属、踝节菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属(Trametes)或木霉属细胞。

在最优选的方面，丝状真菌宿主细胞是泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉或米曲霉细胞。在另一个的最优选的方面，丝状真菌宿主细胞是杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢或镶片镰孢细胞。在另外最优选的方面，丝状真菌宿主细胞是黑刺烟管菌(Bjerkanderaadusta)、干拟蜡菌(Ceriporiopsis aneirina)、干拟蜡菌、Ceriporiopsis caregiea、Ceriporiopsis gilvescens、Ceriporiopsis pannocinta、Ceriporiopsis rivulosa、Ceriporiopsis subrufa、虫拟蜡菌(Ceriporiopsis subvermispora)、嗜角质金孢子菌(Chrysosporium keratinophilum)、Chrysosporium lucknowense、热带金孢子菌(Chrysosporium tropicum)、Chrysosporium merdarium、Chrysosporium inops、Chrysosporium pannicola、Chrysosporium queenslandicum、Chrysosporiumzonatum、灰盖鬼伞、毛革盖菌(Coriolus hirsutus)、特异腐质霉、疏棉状腐质霉、米赫毛霉、嗜热毁丝霉、粗糙脉孢菌、产紫青霉、黄孢平革菌、辐射射脉菌(Phlebia radiata)、刺芹侧耳(Pleurotus eryngii)、土生梭孢霉、长绒毛栓菌(Trametes villosa)、杂色栓菌(Trametes versicolor)、哈茨木霉、康宁木霉、长枝木霉、里氏木霉或绿色木霉细胞。

可以将真菌细胞通过涉及原生质体形成、原生质体转化和细胞壁重建的方法以本身公知的方式转化。用于转化曲霉属和木霉属宿主细胞的合适方法在EP 238 023和Yelton等人，1984，Proceedings of the National Academy ofSciences USA 81：1470-1474中描述。用于转化镰孢属菌种的合适方法由Malardier等人，1989，Gene 78：147-156和WO 96/00787描述。可以使用由如下文献描述的方法转化酵母：Becker and Guarente，In Abelson，J.N.and Simon，M.I.，editors，Guide to Yeast Genetics and Molecular Biology，Methods inEnzymology，Volume 194，pp 182-187，Academic Press，Inc.，New York；Ito等人，1983，Journal of Bacteriology 153：163；和Hinnen等人，1978，Proceedings of theNational Academy of Sciences USA75：1920。

产生方法

本发明的纤维素分解酶组合物可以通过微生物菌株(野生型或重组宿主细胞)或若干个体微生物菌株(野生型或重组宿主细胞)的发酵而产生。

用于产生具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽和/或具有β-葡糖苷酶活性的多肽的方法包括：(a)在有益于产生多肽的条件下培养细胞，所述细胞以其野生型形式能够产生所述多肽；和(b)回收所述多肽。

或者，用于产生具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽的方法包括：(a)在有益于产生所述多肽的条件下培养重组宿主细胞；和(b)回收所述多肽。

此外，用于产生具有增强纤维素分解的活性的多肽、具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽、具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽和/或具有β-葡糖苷酶活性的多肽的方法包括：(a)在有益于产生所述多肽的条件下培养宿主细胞，其中所述宿主细胞包含突变核苷酸序列，其在SEQ ID NO：1、SEQID NO：3、SEQ ID NO：5、SEQ ID NO：5、SEQ ID NO：7、SEQ ID NO：11、SEQ ID NO：13、SEQ ID NO：15、SEQ ID NO：17、SEQ ID NO：19、SEQ ID NO：21、SEQ ID NO：23、SEQ ID NO：25、SEQ ID NO：27或SEQ ID NO：29的成熟多肽编码区中具有至少一个突变，其中所述突变核苷酸序列编码由SEQ IDNO：2、SEQ ID NO：4、SEQ ID NO：6、SEQ ID NO：8、SEQ ID NO：12、SEQID NO：14、SEQ ID NO：16、SEQ ID NO：18、SEQ ID NO：20、SEQ ID NO：22、SEQ ID NO：24、SEQ ID NO：26、SEQ ID NO：28或SEQ ID NO：30的成熟多肽组成的多肽，和(b)回收所述多肽。

在所述产生方法中，使用本领域熟知的方法在适合于产生所述多肽的营养培养基中培养细胞。例如，可以通过在合适培养基中和允许表达和/或分离所述多肽的条件下进行的摇瓶培养，和实验室或工业发酵罐中的小规模或大规模发酵(包括连续、分批、补料分批或固态发酵)来培养细胞。使用本领域已知的方法在合适的营养培养基中进行培养，所述营养培养基包含碳源和氮源和无机盐。合适的培养基能够从商业供应商获得或可以根据公布的组成制备(例如，在美国典型培养物保藏中心的目录中)。如果多肽分泌到营养培养基中，则能够从所述培养基中直接回收该多肽。如果多肽不分泌到培养基中，其能够从细胞裂解物(lysate)回收。

使用本文描述的方法来检测具有增强纤维素分解的活性、内切葡聚糖酶活性、纤维二糖水解酶活性或β-葡聚糖活性的多肽。

可以使用本领域已知的方法回收所得多肽。例如，可以通过常规方法从营养培养基中回收多肽，所述常规方法包括但不限于离心、过滤、提取、喷雾干燥、蒸发或沉淀。

可以通过多种本领域已知的方法纯化所述多肽以获得基本上纯的多肽，所述方法包括但不限于层析(例如，离子交换、亲和、疏水、层析聚焦和大小排阻)、电泳方法(例如，制备型(preparative)等电聚焦)、差示溶解度(例如，硫酸铵沉淀)、SDS-PAGE或提取(参见，例如，Protein Purification，J.-C.Janson andLars Ryden，editors，VCH Publishers，New York，1989)。

含纤维素材料的加工

本发明中的组合物和方法可以用于将含纤维素材料例如，木素纤维素，水解(糖化)成可发酵糖并将可发酵糖转换成许多有用的物质，例如化学品和燃料。来自含纤维素材料的期望的发酵产物的生产过程通常包括预处理、酶水解作用(糖化作用)和发酵。

依照本发明，含纤维素材料的加工可以利用本领域已知的方法来完成。而且，可以使用设置为按照本发明来操作的任何生物质加工设备实施本发明的方法。

水解(糖化)和发酵，分别或同时包括但不限于分别水解和发酵(SHF)、同时糖化和发酵(SSF)、同时糖化和共发酵(SSCF)、混合水解和发酵(HHF)、SHCF(分别水解和共发酵)、HHCF(混合水解和发酵)和直接微生物转化(DMC)。在此所理解的本领域已知任何方法包括预处理、酶水解作用(糖化作用)、发酵或其组合可以用在本发明的方法实施中。

常规设备可以包括补料分批搅拌反应器(fed-batch stirred reactor)、分批搅拌反应器(batch-stirred reactor)、带有超滤的连续流搅拌反应器(continuous flowstirred reactor with ultrafiltration)和/或连续活塞流柱式反应器(continuousplug-flow column reactor)(Femanda de Castilhos Corazza，Flávio Faria deMoraes，Gisella Maria Zanin and Ivo Neitzel，2003，Optimal control in fed-batchreactor for the cellobiose hydrolysis，Acta Scientiarum.Technology 25：33-38；Gusakov，A.V.，and Sinitsyn，A.P.，1985，Kinetics of the enzymatic hydrolysis ofcellulose：1.A mathematical model for a batch reactor process，Enz.Microb.Technol.7：346-352)、研磨反应器(attrition reactor)(Ryu，S.K.，and Lee，J.M.，1983，Bioconversion of waste cellulose by using an attrition bioreactor，Biotechnol.Bioeng.25：53-65)或带有电磁场引起的强力搅拌的反应器(Gusakov，A.V.，Sinitsyn，A.P.，Davydkin，I.Y.，Davydkin，V.Y.，Protas，O.V.，1996，Enhancementof enzymatic cellulose hydrolysis using a novel type of bioreactor with intensivestirring induced by electromagnetic field，Appl.Biochem.Biotechnol.56：141-153)。用于水解和/或发酵作用的附加式反应器类型包括，例如，流化床(fluidized bed)、上流式床(upflow blanket)、固定化的、和挤压机型反应器。

预处理：在实施本发明的方法中，本领域已知的任何预处理方法都可以用于瓦解含纤维素材料的植物细胞壁组分。在预处理之前，也可以用本领域已知的方法对含纤维素材料进行预浸泡、湿润或调节(conditioning)。常规的预处理包括而不限于蒸汽预处理(伴随或不伴随爆炸)、稀酸预处理、热水预处理、石灰预处理、湿氧化、湿式爆炸(wet explosion)、氨纤维爆炸、有机溶剂预处理和生物学预处理。另外的预处理包括超声、电穿孔、微波、超临界CO₂、超临界H₂O和氨渗滤法。

在水解和/或发酵作用之前可以预先处理含纤维素材料。预处理优选在水解之前进行。或者，预处理可以与水解同时进行，例如与用一种或多种纤维素分解酶或其他酶活力处理含纤维素材料同时进行，以释放可发酵糖，如葡萄糖和/或麦芽糖。在大多数情况下预处理步骤本身导致生物质转化成可发酵糖(甚至在酶不存在的情况下)。

蒸汽预处理：在蒸汽预处理中，加热含纤维素材料以瓦解植物细胞壁组分(包括木质素、半纤维素和纤维素)，从而使纤维素和其它级分(如半纤维素)更易于让酶接近。将纤维素材料传送至或穿过反应容器，在所述反应容器中注入蒸汽将温度升高到所需的温度和压强，并且在预期的反应时间里将其保持在其中。蒸汽预处理优选在140-230℃，更优选160-200℃，并且最优选170-190℃下完成，其中最适温度范围取决于化学催化剂的加入。蒸汽预处理的驻留时间(residence time)优选1-15分钟，更优选3-12分钟，并且最优选4-10分钟，其中最适驻留时间取决于温度范围和化学催化剂的加入。蒸汽预处理允许相对高的固体加样，从而使得含纤维素材料一般仅在预处理时湿润。在预处理后，所述蒸汽预处理经常与材料的爆炸性放电相结合，其称作蒸汽爆炸，也就是说，材料向大气压快速运动(rapid flashing)并快速流动以通过断裂增加可接近表面积。(Duff and Murray，1996，Bioresource Technology 855：1-33；Galbe and Zacchi，2002，Appl.Microbiol.Biotechnol.59：618-628；U.S.PatentApplication No.20020164730)。

在蒸汽预处理之前常常加入催化剂如H₂SO₄或SO₂(通常0.3至3％w/w)，其能减少时间和降低温度，增加回收率以及改善酶水解作用(Ballesteros等人，2006，Appl.Biochem.Biotechnol.129-132：496-508；Varga等人，2004，Appl.Biochem.Biotechnol.113-116：509-523；Sassner等人，2006，Enzyme Microb.Technol.39：756-762)。

化学预处理：术语“化学处理”指的是促进纤维素、半纤维素和/或木质素的分离和/或释放的任何化学预处理。适当的化学预处理方法的实例包括，例如，稀酸预处理、石灰预处理、湿氧化、氨纤维/冷冻爆炸(ammonia fiber/freezeexplosion)(AFEX)、氨渗透(ammonia percolation)(APR)或有机溶剂预处理。

在稀酸预处理中，将含纤维素材料与稀酸(通常为H₂SO₄)、水混合以形成浆料，通过蒸汽加热到所需的温度，并在一段驻留时间后，快速进入大气压。可以在多个反应器设计中进行稀酸预处理，例如，活塞流反应器、逆流反应器或连续逆流收缩床反应器(counter-current shrinking bed reactors)(Duff andMurray，1996，见上文；Schell等人，2004，Bioresource Technol.91：179-188；Lee等人，1999，Adv.Biochem.Eng.Biotechnol.65：93-115)。

也可以使用在碱性条件下的集中预处理方法。这些碱性预处理包括，但并不限于，石灰预处理、湿氧化、氨渗透(APR)和氨纤维/冷冻爆炸(AFEX)。

在85-150℃的低温下用碳酸钙、氢氧化钠或氨进行石灰预处理，并且驻留时间为1小时至几天(Wyman等人，2005，Bioresource Technol.96：1959-1966；Mosier等人，2005，Bioresource Technol.96：673-686)。WO 2006/110891、WO2006/11899、WO 2006/11900和WO 2006/110901披露了使用氨的预处理方法。

湿氧化为通常在加入氧化剂(例如过氧化氢或超压氧)的条件下在180-200℃下进行5-15分钟的热预处理(Schmidt and Thomsen，1998，Bioresource Technol.64：139-151；Palonen等人，2004，Appl.Biochem.Biotechnol.117：1-17；Varga等人，2004，Biotechnol.Bioeng.88：567-574；Martin等人，2006，J.Chem.Technol.Biotechnol.81：1669-1677)。以优选1-40％的干物质，更优选2-30％的干物质，并且最优选5-20％的干物质进行预处理，并且通常初始pH值随着碱(例如碳酸钠)的加入而增加。

已知的湿氧化预处理方法的改进方法为湿爆炸(湿氧化和蒸汽爆炸的结合)，其可以处理干物质高达30％。在湿爆炸中，在经过一段特定的驻留时间后在预处理过程中引入氧化剂。然后，通过快速进入大气压来结束预处理(WO2006/032282)。

氨纤维爆炸(AFEX)包括在合适的温度下(例如90-100℃)和高压(例如17-20bar)下用液态或气态氨水处理含纤维素材料5-10分钟，其中干物质含量可以高达60％(Gollapalli等人，2002，Appl.Biochem.Biotechnol.98：23-35；Chundawat等人，2007，Biotechnol.Bioeng.96：219-231；Alizadeh等人，2005，Appl.Biochem.Biotechnol.121：1133-1141；Teymouri等人，2005，BioresourceTechnol.96：2014-2018)。

通过在160-200℃下使用乙醇水溶液(40-60％乙醇)萃取30-60分钟，有机溶剂预处理使含纤维素材料脱木素(Pan等人，2005，Biotechnol.Bioeng.90：473-481；Pan等人，2006，Biotechnol.Bioeng.94：851-861；Kurabi等人，2005，Appl.Biochem.Biotechnol.121：219-230)。通常加入硫酸作为催化剂。在有机溶剂预处理中，大部分的半纤维素被除去。

Schell等人，2003，Appl.Biochem.and Biotechnol.Vol.105-108，p.69-85和Mosier等人，2005，Bioresource Technology 96：673-686和公开的美国申请2002/0164730描述了合适的预处理方法的其它实例。

在一个方面，优选以酸处理，并且更优选以连续稀酸和/或弱酸处理进行所述的化学预处理。所述酸优选为硫酸，但是也可以使用其它酸，例如醋酸、柠檬酸、硝酸、磷酸、酒石酸、丁二酸、氯化氢或其混合物。在优选1-5，更优选1-4，并且最优选1-3的pH范围下实施弱酸处理。在一个方面，所述酸浓度在优选0.01至20wt％酸，更优选0.05至10wt％酸，甚至更优选0.1至5wt％酸，并且最优选0.2至2.0wt％酸的范围内。使所述酸与含纤维素材料接触，并在一定的温度(例如在160-220℃，优选165-195℃的范围)下保持数秒至数分钟(例如1秒至60分钟)。

在另一方面，以氨纤维爆炸步骤(AFEX预处理步骤)进行预处理。

在另一方面，在浆料水溶液中进行预处理。在优选的方面，在预处理过程中，含纤维素材料以优选10-80wt％之间，更优选20-70wt％之间，并且最优选30-60wt％之间，例如大约50wt％的量存在。所述预处理的含纤维素材料可以是未经洗涤的，或者是使用本领域内已知的任何方法洗涤的，例如用水洗涤。

机械预处理：术语“机械预处理”指的是各种类型的研磨或磨制(例如干磨、湿磨或振动球磨)。

物理预处理：术语“物理预处理”指的是促进纤维素、半纤维素和/或木质素从含纤维素材料中分离和/或释放出来的任何预处理。例如，物理预处理可以涉及辐照(例如，微波辐照)、蒸煮/蒸汽爆炸、水热分解(hydro thermolysis)及其组合。

物理预处理可以包括高压和/或高温(蒸汽爆炸)。在一个方面，高压指的是范围在优选大约300至大约600psi，更优选为大约350至大约550psi，并且最优选为大约400至大约500psi，例如大约450psi的压力。在另一方面，高温指的是范围在大约100至大约300℃，优选大约140至大约235℃的温度。在优选的方面，在使用如上所限定的高压和高温的蒸汽枪水解仪系统(例如，Sunds Hydrolyzer，购自Sunds Defibrator AB，Sweden)中以分批法进行机械预处理。

物理和化学预处理的组合：含纤维素材料可以同时进行物理和化学预处理。例如，预处理步骤可以包括稀酸或弱酸处理和高温和/或高压处理。可以根据需要依次或同时进行物理和化学预处理。也可以包括机械预处理。

因此，在优选的方面，使含纤维素材料经历机械、化学或物理预处理或者其任意组合的预处理以促进纤维素、半纤维素和/或木质素的分离和/或释放。

生物预处理：术语“生物预处理”指的是促进促进纤维素、半纤维素和/或木质素从含纤维素材料中分离和/或释放出来的任何生物学预处理方法。生物预处理技术可包括应用溶解木质素的微生物(参见，例如，Hsu，T.-A.，1996，Pretreatment of biomass，in Handbook on Bioethanol：Production and Utilization，Wyman，C.E.，ed.，Taylor&Francis，Washington，DC，179-212；Ghosh and Singh，1993，Physicochemical and biological treatments for enzymatic/microbialconversion of lignocellulosic biomass，Adv.Appl.Microbiol.39：295-333；McMillan，J.D.，1994，Pretreating lignocellulosic biomass：a review，in EnzymaticConversion of Biomass for Fuels Production，Himmel，M.E.，Baker，J.O.，andOverend，R.P.，eds.，ACS Symposium Series 566，American Chemical Society，Washington，DC，chapter 15；Gong，C.S.，Cao，N.J.，Du，J.，and Tsao，G.T.，1999，Ethanol production from renewable resources，in Advances in BiochemicalEngineering/Biotechnology，Scheper，T.，ed.，Springer-Verlag Berlin Heidelberg，Germany，65：207-241；Olsson and Hahn-Hagerdal，1996，Fermentation oflignocellulosic hydrolysates for ethanol production，Enz.Microb.Tech.18：312-331；and Vallander and Eriksson，1990，Production of ethanol fromlignocellulosic materials：State of the art，Adv.Biochem.Eng./Biotechnol.42：63-95)。

糖化：在也称为糖化的水解步骤中，将经预处理的含纤维素材料水解以将纤维素以及可选地还有半纤维素分解成可发酵的糖，例如葡萄糖、木糖、木酮糖、阿拉伯糖、麦芽糖、甘露糖、半乳糖和/或可溶的寡糖。使用本发明的纤维素分解酶组合物进行酶水解，所述纤维素分解酶组合物包含有效量的具有增强纤维素分解的活性的多肽。也可以依次加入组合物的酶组分。

优选在本领域的技术人员能够容易地确定的条件下，在合适的含水环境中进行酶水解。在优选的方面，在适于酶活性的条件(即，对酶最佳的条件)下进行水解。可以以补料分批或连续方法进行水解，在连续方法中将经预处理的含纤维素材料(底物)逐渐加入到例如包含酶的水解溶液中。

糖化通常在受控的pH、温度和混合条件下，在搅拌釜式反应器或发酵罐中进行。合适的过程时间、温度和pH条件能够由本领域技术人员容易地决定。例如，糖化可以持续多至200小时，但是通常进行优选大约12至大约96小时，更优选大约16至大约72小时，并且最优选大约24至大约48小时。所述温度在优选大约25℃至大约70℃，更优选大约30℃至大约65℃，并且更优选大约40℃至60℃的温度范围内，特别地为大约50℃。所述pH在优选大约3至大约8，更优选大约3.5至大约7，并且最优选大约4至大约6的范围内，特别地为大约pH 5。干固体的含量在优选大约5至大约50wt％，更优选大约10至大约40wt％并且最优选大约20至大约30wt％的范围内。

酶的最优量和具有增强纤维素分解的活性的多肽的最优量依赖于几个因素，所述因素包括但不限于成分纤维素分解蛋白的混合物、纤维素底物、纤维素底物浓度、纤维素底物的预处理、温度、时间、pH和发酵微生物(例如，用于同时糖化和发酵的酵母)的内含物(inclusion)。

在优选的方面，纤维素分解蛋白对于含纤维素材料的有效量是每克含纤维素材料大约0.5至大约50mg，优选大约0.5至大约40mg，更优选大约0.5至大约25mg，更优选大约0.75至大约20mg，更优选大约0.75至大约15mg，甚至更优选大约0.5至大约10mg，并且最优选大约2.5至大约10mg。

在另一优选的方面，具有增强纤维素分解的活性的多肽对于含纤维素材料的有效量是每克含纤维素材料大约0.5至大约50mg，优选大约0.5至大约40mg，更优选大约0.5至大约25mg，更优选大约0.75至大约20mg，更优选大约0.75至大约15mg，甚至更优选大约0.5至大约10mg，并且最优选大约2.5至大约10mg。

在另一优选的方面，具有增强纤维素分解的活性的多肽对于含纤维素材料的有效量是每克含纤维素材料大约0.01至大约50.0mg，优选大约0.01至大约40mg，更优选大约0.01至大约30mg，更优选大约0.01至大约20mg，更优选大约0.01至大约10mg，更优选大约0.01至大约5mg，更优选大约0.025至大约1.5mg，更优选大约0.05至大约1.25mg，更优选大约0.075至大约1.25mg，更优选大约0.1至大约1.25mg，甚至更优选大约0.15至大约1.25mg，并且最优选大约0.25至大约1.0mg。

在另一优选的方面，具有增强纤维素分解的活性的多肽对于纤维素分解蛋白的有效量是每克纤维素分解蛋白大约0.005至大约1.0g，优选大约0.01至大约1.0g，更优选大约0.15至大约0.75g，更优选大约0.15至大约0.5g，更优选大约0.1至大约0.5g，甚至更优选大约0.1至大约0.5g，并且最优选大约0.05至大约0.2g。

发酵.通过一种或多种能够直接或间接将糖发酵成期望的发酵产物的发酵微生物可以发酵从经预处理和水解的含纤维素材料得到的可发酵的糖。“发酵”或“发酵方法”指任何发酵方法或任何包括发酵步骤的方法。发酵方法还包括在生物燃料工业、可消费醇工业(例如，啤酒和葡萄酒(wine))、乳品工业(例如，发酵乳制品)、皮革工业和烟草工业中使用的发酵方法。发酵的条件依赖于期望的发酵产物和发酵生物，并且本领域的技术人员可以容易地确定。

在发酵步骤中，将作为预处理和酶水解步骤的结果从含纤维素材料释放的糖通过发酵生物例如酵母发酵成产物，例如乙醇。水解(糖化)和发酵可以是分别的或同时的。这些方法包括，但不限于，分别水解和发酵(SHF)、同时糖化和发酵(SSF)、同时糖化和共发酵(SSCF)、混合水解和发酵(HHF)、SHCF(分别水解和共发酵)、HHCF(混合水解和共发酵)和直接微生物转化(DMC)。

在实施本发明时，任何合适的经水解的含纤维素材料可以用于发酵步骤中。所述材料通常基于期望的发酵产物来选择，即，基于将要由发酵获得的物质来选择，还基于使用的方法来选择，如本领域内所熟知的。

术语“发酵培养基”在本文中应理解为指在加入发酵微生物之前的培养基，例如，糖化处理产生的培养基，以及例如在同时糖化和发酵方法(SSF)中使用的培养基。

“发酵微生物”指适用于期望的发酵方法中以生产发酵产物的任何微生物，其包括细菌生物和真菌生物。发酵生物可以为C₆和/或C₅发酵生物，或者其组合。C₆和C₅发酵生物都是本领域内熟知的。合适的发酵生物能够发酵，即，能够直接或间接地将糖，例如葡萄糖、木糖、木酮糖、阿拉伯糖、麦芽糖、甘露糖、半乳糖或寡糖转化成期望的发酵产物。

Lin等人，2006，Appl.Microbiol.Biotechnol.69：627-642描述了生产乙醇的细菌和真菌发酵生物的实例。

可以发酵C6糖的发酵微生物的实例包括细菌和真菌生物，例如酵母。优选的酵母包括酵母属菌种，优选为酿酒酵母。

可以发酵C5糖的发酵生物的实例包括细菌和真菌生物，例如酵母。优选的发酵C5的酵母包括毕赤酵母属(Pichia)菌株、优选为树干毕赤酵母(Pichiastipitis)，例如树干毕赤酵母CBS 5773；念珠菌属的菌株，优选博伊丁念珠菌(Candida boidinii)、芸苔念珠菌(Candida brassicae)、休哈塔念珠菌(Candidasheatae)、迪丹斯念珠菌(Candida diddensii)、假热带念珠菌(Candidapseudotropicalis)、产朊假丝酵母(Candida utilis)。

其它发酵生物包括发酵单孢菌(Zymomonas)的菌株，例如运动发酵单孢菌(Zymomonas mobilis)；克鲁维酵母属(Klyveromyces)的菌株，例如脆壁克鲁维酵母(K.fragilis)；裂殖酵母属(Schizosaccharomyces)的菌株，例如粟酒裂殖酵母(S.Pombe)；和大肠杆菌，特别是已经进行了遗传修饰以提高乙醇产率的大肠杆菌菌株。

在优选的方面，酵母是酵母属菌种(Saccharomyces spp.)。在优选的方面，酵母是酿酒酵母。在另一优选的方面，酵母是糖化酵母(Saccharomycesdistaticus)。在另一更优选的方面，酵母是葡萄汁酵母(Saccharomyces uvarum)。在另一个优选的方面，酵母是克鲁维酵母属。在另一个更优选的方面，酵母是马克斯克鲁维酵母(Kluyveromyces marxianus)。在另一个更优选的方面，酵母是脆壁克鲁维酵母(Kluyveromyces fragilis)。在另一优选的方面，酵母是念珠菌属。在另一更优选的方面，酵母是博伊丁念珠菌。在另一更优选的方面，酵母是芸苔念珠菌。在另一更优选的方面，酵母是迪丹斯念珠菌。在另一更优选的方面，酵母是假热带念珠菌。在另一更优选的方面，酵母是产朊假丝酵母。在另一优选的方面，酵母是棍孢属(Clavispora)。在另一更优选的方面，酵母是葡萄牙棍孢(Clavispora lusitaniae)。在另一更优选的方面，酵母是仙人掌棍孢(Clavispora opuntiae)。在另一优选的方面，酵母是管囊酵母属(Pachysolen)。在另一更优选的方面，酵母是嗜鞣管囊酵母(Pachysolentannophilus)。在另一优选的方面，酵母是毕赤酵母属(Pichia)。在另一更优选的方面，酵母是树干毕赤酵母(Pichia stipitis)。在另一优选的方面，酵母是酒香酵母属(Bretannomyces)。在另一更优选的方面，酵母是克劳森酒香酵母(Bretannomyces clausenii)(Philippidis，G.P.，1996，Cellulose bioconversiontechnology，in Handbook on Bioethanol：Production and Utilization，Wyman，C.E.，ed.，Taylor&Francis，Washington，DC，179-212)。

能够有效地将己糖和戊糖发酵成乙醇的细菌包括例如运动发酵单孢菌和热纤维梭菌(Clostridium thermocellum)(Philippidis，1996，见上文)。

在优选的方面，细菌是发酵单孢菌。在更优选的方面，细菌是运动发酵单孢菌。在另一优选的方面，细菌是梭菌属。在另一优选的方面，细菌是热纤维梭菌。

市售可得的适合于乙醇生产的酵母包括，例如，ETHANOL RED^TM酵母(可得自Fermentis/Lesaffre，USA)、FALI^TM(可得自Fleischmann’s Yeast，USA)、SUPERSTART^TM和THERMOSACC^TM新鲜酵母(可得自Ethanol Technology，WI，USA)、BIOFERM^TM AFT和XR(可得自NABC-North American BioproductsCorporation，GA，USA)、GERT STRAND^TM(可得自Gert Strand AB，Sweden)和FERMIOL^TM(购自DSM Specialties)。

在优选的方面，发酵微生物已经遗传修饰以提供发酵戊糖的能力，例如，利用木糖、利用阿拉伯糖和共同利用木糖和阿拉伯糖的微生物(xylose andarabinose co-utilizing microorganism)。

将异源基因克隆至多种发酵微生物中已经导致构建了能够将己糖和戊糖转化为乙醇的生物(共发酵)(Chen and Ho，1993，Cloning and improving theexpression of Pichia stipitis xylose reductase gene in Saccharomyces cerevisiae，Appl.Biochem.Biotechnol.39-40：135-147；Ho等人，1998，Geneticallyengineered Saccharomyces yeast capable of effectively cofermenting glucose andxylose，Appl.Environ.Microbiol.64：1852-1859；Kotter and Ciriacy，1993，Xylose fermentation by Saccharomyces cerevisiae，Appl.Microbiol.Biotechnol.38：776-783；Walfridsson等人，1995，Xylose-metabolizing Saccharomycescerevisiae strains overexpressing the TKL1 and TAL1 genes encoding the pentosephosphate pathway enzymes transketolase and transaldolase，Appl.Environ.Microbiol.61：4184-4190；Kuyper等人，2004，Minimal metabolic engineering ofSaccharomyces cerevisiae for efficient anaerobic xylose fermentation：a proof ofprinciple，FEMS Yeast Research 4：655-664；Beall等人，1991，Parametric studiesof ethanol production from xylose and other sugars by recombinant Escherichiacoli，Biotech.Bioeng.38：296-303；Ingram等人，1998，Metabolic engineering ofbacteria for ethanol production，Biotechnol.Bioeng.58：204-214；Zhang等人，1995，Metabolic engineering of a pentose metabolism pathway in ethanologenicZymomonas mobilis，Science 267：240-243；Deanda等人，1996，Development ofan arabinose-fermenting Zymomonas mobilis strain by metabolic pathwayengineering，Appl.Environ.Microbiol.62：4465-4470)。

在优选的方面，经遗传修饰的发酵微生物是酿酒酵母。在另一优选的方面，经遗传修饰的发酵微生物是运动发酵单孢菌。在另一优选的方面，经遗传修饰的发酵微生物是大肠杆菌。在另一优选的实施方式中，经遗传修饰的发酵微生物是产酸克雷伯氏菌(Klebsiella oxytoca)。

通常加入发酵微生物以降解纤维素或水解产物，并且发酵进行大约8到大约96小时，例如大约24至大约60小时。温度通常为大约26℃至大约60℃之间，特别是大约32℃或50℃，并且在大约pH3至大约pH8，例如大约pH4-5，6或7。

在优选的方面，将发酵微生物应用于降解的纤维素或水解产物，并且进行发酵大约12至大约96小时，例如通常为24-60小时。在优选的方面，温度优选在大约20℃至大约60℃之间，更优选大约25℃至大约50℃，并且最优选大约32℃至大约50℃，特别是大约32℃或50℃，并且pH通常从大约pH3至大约pH7，优选大约pH 4-7。然而，例如，一些发酵生物具有更高的最佳发酵温度。发酵微生物优选以每毫升的发酵液大约10⁵至10¹²，优选大约10⁷至10¹⁰，特别是大约2×10⁸的活细胞计数的量应用。有关使用酵母发酵的其它指导可参见例如“The Alcohol Textbook”(Editors K.Jacques，T.P.Lyonsand D.R.Kelsall，Nottingham University Press，United Kingdom 1999)，将其通过引用并入本文。

对于乙醇产生，在发酵之后蒸馏发酵浆料以提取乙醇。根据本发明的方法获得的乙醇可以用作例如燃料乙醇、饮用乙醇，即，可饮用中性酒精(potableneutral spirits)；或工业乙醇。

可以将发酵刺激物(fermentation stimulator)与本文描述的任何酶方法组合使用以进一步改进发酵方法，特别是改进发酵微生物的性能，例如，速率提高和乙醇产率。“发酵刺激物”指用于培养发酵微生物，特别是酵母的生长的刺激物。优选的用于生长的发酵刺激物包括维生素和矿物。维生素的实例包括多种维生素、生物素、泛酸、烟酸、内消旋肌醇、硫胺素、吡哆醇、对氨基苯甲酸、叶酸、核黄素和维生素A、B、C、D和E。参见，例如，Alfenore等人，Improving ethanol production and viability of Saccharomyces cerevisiae bya vitamin feeding strategy during fed-batch process，Springer-Verlag(2002)，将其通过引用并入本文。矿物的实例包括能够提供营养物的矿物和矿物盐，所述营养物包括P、K、Mg、S、Ca、Fe、Zn、Mn和Cu。

发酵产物：发酵产物可以为源自发酵的任何物质。所述发酵产物可以是，但不限于，醇(例如，阿拉伯糖醇、丁醇、乙醇、甘油、甲醇、1，3-丙二醇、山梨糖醇和木糖醇)；有机酸(例如，乙酸、醋酮酸、己二酸、抗坏血酸、柠檬酸、2，5-二酮-D-葡糖酸、甲酸、延胡索酸、葡糖二酸、葡糖酸、葡糖醛酸、戊二酸、3-羟基丙酸、衣康酸、乳酸、苹果酸、丙二酸、草酸、丙酸、琥珀酸和木糖酸)；酮类(例如，丙酮)；醛类(例如，甲醛)；氨基酸(例如，天冬氨酸、谷氨酸、甘氨酸、赖氨酸、丝氨酸和苏氨酸)；气体(例如，甲烷、氢气(H₂)、二氧化碳(CO₂)和一氧化碳(CO))。发酵产物还可以为作为有高价值产物的蛋白质。

在优选的方面，所述发酵产物是醇。应该理解术语“醇”包含含有一个或多个羟基的物质。在更优选的方面，所述醇是阿拉伯糖醇。在另一更优选的方面，所述醇是丁醇。在另一更优选的方面，所述醇是乙醇。在另一更优选的方面，所述醇是甘油。在另一更优选的方面，所述醇是甲醇。在另一更优选的方面，所述醇是1，3-丙二醇。在另一更优选的方面，所述醇是山梨糖醇。在另一个更优选的方面，所述醇是木糖醇。参见，例如，Gong，C.S.，Cao，N.J.，Du，J.，and Tsao，G.T.，1999，Ethanol production from renewable resources，inAdvances in Biochemical Engineering/Biotechnology，Scheper，T.，ed.，Springer-Verlag Berlin Heidelberg，Germany，65：207-241；Silveira，M.M.，andJonas，R.，2002，The biotechnological production of sorbitol，Appl.Microbiol.Biotechnol.59：400-408；Nigam，P.，and Singh，D.，1995，Processes forfermentative production of xylitol-a sugar substitute，Process Biochemistry 30(2)：117-124；Ezeji，T.C.，Qureshi，N.and Blaschek，H.P.，2003，Production ofacetone，butanol and ethanol by Clostridium beijerinckii BA101 and in siturecovery by gas stripping，World Journal of Microbiology and Biotechnology 19(6)：595-603。

另一个优选的方面，所述发酵产物是有机酸。在另一更优选的方面，所述有机酸是乙酸。在另一更优选的方面，所述有机酸是醋酮酸。在另一更优选的方面，所述有机酸是己二酸。在另一更优选的方面，所述有机酸是抗坏血酸。在另一更优选的方面，所述有机酸是柠檬酸。在另一更优选的方面，所述有机酸是2，5-二酮-D-葡糖酸。在另一更优选的方面，所述有机酸是甲酸。在另一更优选的方面，所述有机酸是延胡索酸。在另一更优选的方面，所述有机酸是葡糖二酸。在另一更优选的方面，所述有机酸是葡糖酸。在另一更优选的方面，所述有机酸是葡糖醛酸。在另一更优选的方面，所述有机酸是戊二酸。在另一优选的方面，所述有机酸是3-羟基丙酸。在另一更优选的方面，所述有机酸是衣康酸。在另一更优选的方面，所述有机酸是乳酸。在另一更优选的方面，所述有机酸是苹果酸。在另一更优选的方面，所述有机酸是丙二酸。在另一更优选的方面，所述有机酸是草酸。在另一更优选的方面，所述有机酸是丙酸。在另一更优选的方面，所述有机酸是琥珀酸。在另一更优选的方面，所述有机酸是木糖酸。参见，例如，Chen，R.，and Lee，Y.Y.，1997，Membrane-mediated extractive fermentation for lactic acid production fromcellulosic biomass，Appl.Biochem.Biotechnol.63-65：435-448。

在另一优选的方面，所述发酵产物是酮。应该理解的是术语“酮”涵盖含有一个或多个酮基的物质。在另一更优选的方面，所述酮是丙酮。参见，例如，Qureshi and Blaschek，2003，见上文。

在另一优选的方面，所述发酵产物是醛。在另一更优选的方面，所述醛为甲醛。

在另一优选的方面，所述发酵产物是氨基酸。在另一更优选的方面，所述有机酸是天冬氨酸。在另一更优选的方面，所述氨基酸是谷氨酸。在另一更优选的方面，所述氨基酸是甘氨酸。在另一更优选的方面，所述氨基酸是赖氨酸。在另一更优选的方面，所述氨基酸是丝氨酸。在另一更优选的方面，所述氨基酸是苏氨酸。参见，例如，Richard，A.，and Margaritis，A.，2004，Empirical modeling of batch fermentation kinetics for poly(glutamic acid)production and other microbial biopolymers，Biotechnology and Bioengineering87(4)：501-515。

在另一优选的方面，所述发酵产物是气体。在另一更优选的方面，所述气体是甲烷。在另一更优选的方面，所述气体是H₂。在另一更优选的方面，所述气体是CO₂。在另一更优选的方面，所述气体是CO。参见，例如，Kataoka，N.，A.Miya，and K.Kiriyama，1997，Studies on hydrogen production bycontinuous culture system of hydrogen-producing anaerobic bacteria，WaterScience and Technology 36(6-7)：41-47；和Gunaseelan V.N.in Biomass andBioenergy，Vol.13(1-2)，pp.83-114，1997，Anaerobic digestion of biomass formethane production：A review。

回收：使用本领域已知的方法可以从发酵培养基中任选地回收发酵产物，所述方法包括，但不限于，层析(例如，离子交换、亲和、疏水、层析聚焦和大小排阻)、电泳方法(例如，制备型等电聚焦)、差示溶解度(例如，硫酸铵沉淀)、蒸馏或提取。例如，从发酵的含纤维素材料中分离乙醇，并通过常规的蒸馏方法纯化。可以获得纯度高至大约96vol.％的乙醇，其可以用作，例如燃料乙醇、饮用乙醇，即，可饮用中性酒精(potable neutral spirits)；或工业乙醇。

通过以下实施例进一步对本发明进行描述，但不应将其理解为对本发明范围的限制。

实施例

材料

用作缓冲剂和底物的化学药品为至少为试剂级的市售产品。

培养基

NNCYP培养基由如下物质组成：每升5.0g NH₄NO₃、0.5g MgSO₄·7H₂O、0.3gCaCl₂、2.5g柠檬酸、1.0g细菌用蛋白胨、5.0g酵母提取物、1ml COVE痕量金属溶液和足量的K₂HPO₄以实现最终的pH为大约5.4。

COVE痕量金属溶液由如下物质组成：每升0.04g Na₂B₄O₇·10H₂O、0.4gCuSO₄·5H₂O、1.2g FeSO₄·7H₂O、0.7g MnSO₄·H₂O、0.8g Na₂MoO₂·2H₂O和10g ZnSO₄·7H₂O。

实施例1：米曲霉β-葡糖苷酶和具有增强纤维素分解的活性的橙色嗜热子囊菌多肽GH61A的制备

通过在米曲霉中过表达来制备米曲霉β-葡糖苷酶和具有增强纤维素分解的活性的橙色嗜热子囊菌多肽GH61A。根据WO 2005/074656在米曲霉JaL250中重组产生具有增强纤维素分解的活性的橙色嗜热子囊菌多肽GH61A。根据WO 02/095014，在米曲霉JaL250中重组产生米曲霉β-葡糖苷酶。

通过在补充有每升52g的纤维素的NNCYP培养基上培养米曲霉培养物使发酵罐培养物生长，并在发酵过程中(无额外碳源)在42℃将所述培养基分批加入并保持在pH 5.0下。使发酵能够进行直至该批次的纤维素已经消耗完(通常大约40小时)，此时采集培养液，并离心分离以除去菌丝。通过在9500xg下离心培养物大约20分钟来清除粗制培养液样品的细胞碎片。然后，过滤澄清的培养液样品(

GP Express^TM membrane，polyethersulfone，0.22μm，Millipore，Bedford，MA，USA)。使用BCA^TM蛋白测定试剂盒(Pierce，Rockford，IL，USA)测定脱盐材料(HIPREP^TM 26/10 Desalting Column，AKTA^TM，GE Healthcare，Piscataway，NJ，USA)的蛋白浓度，在所述蛋白测定试剂盒中，将牛血清白蛋白用作蛋白标准品。通常在8-16％CRITERION^TM SDS-PAGE凝胶(Bio-Rad，Hercules，CA；200V，1小时)上检验等分试样，在所述凝胶中包括PRECISION PLUS PROTEIN^TM分子量标准品(Bio-Rad，Hercules，CA，USA)。使用BIO-SAFE^TM Coomassie Stain(Bio-Rad，Hercules，CA，USA)染色凝胶中的蛋白，并使用去离子水脱染色。

LDI(Dyadic International，Inc.，Jupiter，FL，USA)如获得时那样使用。如上测定蛋白。

实施例2：玉米秸秆的预处理

在U.S.Department of Energy National Renewable Energy Laboratory(NREL)使用稀硫酸预处理玉米秸秆。使用下列条件进行预处理：在195℃在1.4wt％硫酸预处理4.5分钟。根据使用过量的纤维素酶消化的极限，在经预处理的玉米秸秆(PCS)中的不溶于水的固体包含59.5％的纤维素。在酶水解之前，用大量的去离子水洗涤PCS直至除去可溶酸和糖。发现经水洗涤的PCS的干重为19.16％。

实施例3：当与米曲霉β-葡糖苷酶和

LDI纤维素酶组合时橙色嗜热子囊菌多肽GH61A的增强纤维素分解的活性

根据NREL实验分析规程第8条(Laboratory Analytical Protocol#008)使用50g的总反应量、使用125ml的带螺旋盖的锥形烧瓶(VWR，West Chester，PA，USA)进行PCS的水解。在该规程中，在占纤维素酶蛋白加样量6％的米曲霉β-葡糖苷酶存在或不存在，以及在加入和没有加入11％橙色嗜热子囊菌多肽GH61A的情况下，使用不同蛋白加样量(用mg酶/g纤维素表示)的

LDI样品(Dyadic International，Inc.，Jupiter，FL，USA)进行PCS(在pH 5.0的50mM的醋酸钠缓冲水溶液中大约11.4％的PCS和6.8％纤维素)的水解。用轨道振荡(

4080 Incubator，New Brunswick Scientific，Edison，NJ，USA)以150rpm在50℃进行对PCS水解能力的测试。在水解过程的72、120和172小时采集等分试样。离心等分试样，并将上清液使用板式离心机(

RT7，Thermo Fisher Scientific，Waltham，MA，USA)通过在2000rpm离心(

HV 0.45μm，Millipore，Billerica，MA，USA)15分钟来过滤。当不立即使用时，将经过滤的含有糖的等分试样在-20℃下冷冻。在用0.005M H₂SO₄以0.4ml/min的流速从4.6×250mm的

HPX-87H柱(Bio-Rad，Hercules，CA，USA)洗脱之后，在65℃下用来自经纯糖样品校准过的折射率检测器(

1100HPLC，Agilent Technologies，Santa Clara，CA，USA)的葡萄糖和纤维二糖信号的积分定量来测量稀释在0.005M H₂SO₄中的样品的糖浓度。所得的当量用于计算各反应的纤维素转化率百分数。

使用以下等式计算纤维素转化成葡萄糖和纤维二糖的程度(转化率，％)：

转化率_(％)＝(葡萄糖+纤维二糖×1.053)_(mg/ml)×100×162/(纤维素_(mg/ml)×180)＝(葡萄糖+纤维二糖×1.053)_(mg/ml)×100/(纤维素_(mg/ml)×1.111)

在该等式中，因子1.111反映在纤维素转化成葡萄糖时的重量增加，而因子1.053反映纤维二糖转化成葡萄糖时的重量增加。通过消化PCS以释放葡萄糖和纤维二糖的范围测定PCS中的纤维素。

在各实验之前，从贮藏在4℃的酶母液制备新鲜的酶稀释液。

表1所示的结果表明：向

LDI中加入米曲霉β-葡糖苷酶产生的大约94％

LDI和大约6％β-葡糖苷酶的混合物，其在7.1至43.3mg/g纤维素的蛋白质水平下，与单独使用等量的

LDI的蛋白质得到的葡萄糖转化率相比，其提高了葡萄糖转化率。表1的结果表明：向

LDI中加入米曲霉β-葡糖苷酶和橙色嗜热子囊菌GH61A产生的大约83％

LDI与大约6％β-葡糖苷酶和大约11％GH61A蛋白质的混合物，与单独使用等量的

LDI的蛋白质或FIBREZYME^TM LDI与β-葡糖苷酶的混合物得到的葡萄糖转化率相比，其提高了葡萄糖转化率。将水解72小时的结果描绘在图1中。

因此，向包含LDI的溶液中加入橙色嗜热子囊菌GH61A蛋白提高了经酸预处理的玉米秸秆(PCS)水解的葡萄糖和纤维二塘的产率。产率的提高高于通过加入等量或更少量的

LDI或者等量或更少量的与β-葡糖苷酶混合的

LDI实现的产率提高，导致酶加样需求的减少和酶效率的提高。

生物材料的保藏

依据布达佩斯条约的条款，下述的生物材料已经保藏于农业研究机构专利培养物保藏中心，北区研究中心，1815 University Street，Peoria，Illinois，61604，并给出了下述的登录号：

保藏物登录号保藏日期

大肠杆菌菌株pEJG120 NRRL B-30699 2003年12月19日

大肠杆菌菌株pTter61C NRRL B-30813 2005年1月21日

大肠杆菌菌株pTter61D NRRL B-30812 2005年1月21日

大肠杆菌菌株pTter61E NRRL B-30814 2005年1月21日

大肠杆菌菌株pTter61G NRRL B-30811 2005年1月21日

大肠杆菌菌株pDZA2-7 NRRL B-30704 2004年1月30日

大肠杆菌菌株pTr3337 NRRL B-30878 2005年9月20日

大肠杆菌TOP10(pEJG113) NRRL B-30695 2003年10月17日

大肠杆菌TOP10pKKAB NRRL B-30860 2005年7月8日

NN049573 DSM 14240 2001年4月19日

所述菌株已经于下述条件下保藏：确保在本专利申请未决期间，由专利与商标委员依据37C.F.R.§1.14和35U.S.C.§122授权的人能够获得该培养物。该保藏物为所保藏菌株的基本上纯的培养物。在提交了该申请的副本，或其后续文本的国家，依据该外国专利法律的要求，可以获得该保藏物。然而，应当理解，保藏物的获得并不构成对实施本发明的许可，实施本发明是对政府行为所授予的专利权的侵犯。

此处，本文中所描述和要求保护的本发明在范围上并非限定于本文所公开的具体方面，因为这些方面意欲作为本发明几个方面的说明。任何等价的方面意欲在本发明的范围之内。事实上，从前面的说明中，对于本领域技术人员来说，除本文所显示和描述的之外，本发明的多种修改将是显而易见的。这些修改也意欲落入所附的权利要求的范围内。在冲突的情况下，将以包括定义部分的本公开为准。本文引用了多篇参考文献，将其公开的全部内容并入作为参考。

序列表

<110>诺维信股份有限公司(Novozymes，Inc.)

McFarland，Keith

<120>用于增强含纤维素材料的降解或转化的组合物和方法

<130>11233.204-WO

<150>US 60/917,208

<151>2007-05-10

<160>30

<170>PatentIn version 3.5

<210>1

<211>1371

<212>DNA

<213>嗜热毁丝霉(Myceliophthora thermophila)

<400>1

atgggtcgcg gcgctgcttt cctaggcctc gcctcgctcc tcgtgggcgc ggccaaggcc 60

cagacgcccg gcgagggcga ggaggtgcac ccgcagatca cgacgtaccg ctgcaccaag 120

gcggacgggt gcgaggagaa gaccaactac atcgtgctgg acgccctatc gcacccggtc 180

caccaggtcg acaacccgta caactgcggc gactggggcc agaagcccaa cgagacggcc 240

tgcccggacc tcgagtcgtg cgccaggaac tgcatcatgg acccggtctc ggactacggc 300

cggcacggtg tctcgaccga cggcacctcg ctgcgcctca agcagctagt cggcggcaac 360

gtcgtcagcc cgcgcgtcta cctgctcgac gagaccaagg agcgctacga gatgctcaag 420

ctgaccggca acgagttcac ctttgacgtc gacgccacca agctgccctg cggcatgaac 480

agcgccctct acctctccga gatggacgcc accggcgccc ggagcgagct caacccgggc 540

ggcgccacct ttggcaccgg ctactgcgac gcccagtgct acgtcacccc cttcatcaac 600

ggcctcggca acatcgaggg caagggcgcg tgctgcaacg agatggatat ctgggaggcc 660

aacgcgcggg cgcagcacat cgcgccgcac ccgtgcagca aggcggggcc gtacctgtgc 720

gagggcgccg agtgcgagtt cgacggcgtg tgcgacaaga acggctgcgc ctggaacccg 780

taccgggtca acgtgacgga ctactacggc gagggcgccg agttcagggt ggacacgacc 840

cggcccttct cggtcgtcac gcagttccgc gccggcggcg acgcgggggg cggcaagctc 900

gagagcatct accggctctt cgtccaggac ggcagggtga ttgagtcgta cgtcgtcgac 960

aagcccggcc tgcccccgac ggaccgcatg acggacgagt tctgcgccgc caccggcgcc 1020

gcccgcttca cggagctcgg cgccatggag gccatgggcg acgccctgac gcgcggcatg 1080

gtcctcgccc tcagcatctg gtggagcgag ggcgacaaca tgaactggct cgactcgggc 1140

gaggccggcc cctgcgaccc ggacgagggc aacccgtcca acatcatccg cgtccagccc 1200

gacccggagg tcgtcttcag caacctgcgc tggggcgaga tcggctcaac ctacgagtcc 1260

gccgtcgacg ggcccgtcgg caagggcaag ggcaagggca agggcaaggc tcccgccggc 1320

gacggcaacg ggaaggagaa gagcaatggc aagcgcttca ggaggttctg a 1371

<210>2

<211>456

<212>PRT

<213>嗜热毁丝霉

<400>2

Met Gly Arg Gly Ala Ala Phe Leu Gly Leu Ala Ser Leu Leu Val Gly

1 5 10 15

Ala Ala Lys Ala Gln Thr Pro Gly Glu Gly Glu Glu Val His Pro Gln

20 25 30

Ile Thr Thr Tyr Arg Cys Thr Lys Ala Asp Gly Cys Glu Glu Lys Thr

35 40 45

Asn Tyr Ile Val Leu Asp Ala Leu Ser His Pro Val His Gln Val Asp

50 55 60

Asn Pro TyrAs n Cys Gly Asp Trp Gly Gln Lys Pro Asn Glu Thr Ala

65 70 75 80

Cys Pro Asp Leu Glu Ser Cys Ala Arg Asn Cys Ile Met Asp Pro Val

85 90 95

Ser Asp Tyr Gly Arg His Gly Val Ser Thr Asp Gly Thr Ser Leu Arg

100 105 110

Leu Lys Gln Leu Val Gly Gly Asn Val Val Ser Pro Arg Val Tyr Leu

115 120 125

Leu Asp Glu Thr Lys Glu Arg Tyr Glu Met Leu Lys Leu Thr Gly Asn

130 135 140

Glu Phe Thr Phe Asp Val Asp Ala Thr Lys Leu Pro Cys Gly Met Asn

145 150 155 160

Ser Ala Leu Tyr Leu Ser Glu Met Asp Ala Thr Gly Ala Arg Ser Glu

165 170 175

Leu Asn Pro Gly Gly Ala Thr Phe Gly Thr Gly Tyr Cys Asp Ala Gln

180 185 190

Cys Tyr Val Thr Pro Phe Ile Asn Gly Leu Gly Asn Ile Glu Gly Lys

195 200 205

Gly Ala Cys Cys Asn Glu Met Asp Ile Trp Glu Ala Asn Ala Arg Ala

210 215 220

Gln His Ile Ala Pro His Pro Cys Ser Lys Ala Gly Pro Tyr Leu Cys

225 230 235 240

Glu Gly Ala Glu Cys Glu Phe Asp Gly Val Cys Asp Lys Asn Gly Cys

245 250 255

Ala Trp Asn Pro Tyr Arg Val Asn Val Thr Asp Tyr Tyr Gly Glu Gly

260 265 270

Ala Glu Phe Arg Val Asp Thr Thr Arg Pro Phe Ser Val Val Thr Gln

275 280 285

Phe Arg Ala Gly Gly Asp Ala Gly Gly Gly Lys Leu Glu Ser Ile Tyr

290 295 300

Arg Leu Phe Val Gln Asp Gly Arg Val Ile Glu Ser Tyr Val Val Asp

305 310 315 320

Lys Pro Gly Leu Pro Pro Thr Asp Arg Met Thr Asp Glu Phe Cys Ala

325 330 335

Ala Thr Gly Ala Ala Arg Phe Thr Glu Leu Gly Ala Met Glu Ala Met

340 345 350

Gly Asp Ala Leu Thr Arg Gly Met Val Leu Ala Leu Ser Ile Trp Trp

355 360 365

Ser Glu Gly Asp Asn Met Asn Trp Leu Asp Ser Gly Glu Ala Gly Pro

370 375 380

Cys Asp Pro Asp Glu Gly Asn Pro Ser Asn Ile Ile Arg Val Gln Pro

385 390 395 400

Asp Pro Glu Val Val Phe Ser Asn Leu Arg Trp Gly Glu Ile Gly Ser

405 410 415

Thr Tyr Glu Ser Ala Val Asp Gly Pro Val Gly Lys Gly Lys Gly Lys

420 425 430

Gly Lys Gly Lys Ala Pro Ala Gly Asp Gly Asn Gly Lys Glu Lys Ser

435 440 445

Asn Gly Lys Arg Phe Arg Arg Phe

450 455

<210>3

<211>744

<212>DNA

<213>Chrysosoporium lucknowense

<400>3

atgcagccgt ttctgctctt gttcctctcg tcggtcacgg cggcgagccc cctgacggcg 60

ctcgacaagc ggcagcaggc gacgttgtgc gagcagtacg gctactggtc gggcaacggt 120

tacgaggtca acaacaacaa ctggggcaag gattcggcct cgggcggcca tcagtgcacc 180

tacgtcgaca gcagcagctc cagcggcgtc gcctggcaca cgacctggca gtgggaagga 240

ggccagaacc aggtcaagag cttcgccaac tgcggcctgc aggtgcccaa gggcaggacc 300

atctcgtcca tcagcaacct gcagacctcc atctcgtggt cctacagcaa caccaacatc 360

cgcgccaacg tggcctacga cctcttcacc gcggcagacc cgaaccacgc gaccagcagc 420

ggcgactacg agctcatgat ctggctggcg agattcggcg acgtctaccc catcggctcg 480

tcccagggcc acgtcaacgt ggccggccag gactgggagc tgtggacggg cttcaacggc 540

aacatgcggg tctacagctt cgtagcgccc agcccccgca acagcttcag cgccaacgtc 600

aaggacTTct tcaactatct ccagtccaac cagggcttcc cggccagcag ccaatacctt 660

ctcatcttcc aggcgggcac cgagcccttc accggcggcg agaccaccct taccgtcaac 720

aactactctg caagggttgc ttaa 744

<210>4

<211>247

<212>PRT

<213>Chrysosoporium lucknowense

<400>4

Met Gln Pro Phe Leu Leu Leu Phe Leu Ser Ser Val Thr Ala Ala Ser

1 5 10 15

Pro Leu Thr Ala Leu Asp Lys Arg Gln Gln Ala Thr Leu Cys Glu Gln

20 25 30

Tyr Gly Tyr Trp Ser Gly Asn Gly Tyr Glu Val Asn Asn Asn Asn Trp

35 40 45

Gly Lys Asp Ser Ala Ser Gly Gly His Gln Cys Thr Tyr Val Asp Ser

50 55 60

Ser Ser Ser Ser Gly Val Ala Trp His Thr Thr Trp Gln Trp Glu Gly

65 70 75 80

Gly Gln Asn Gln Val Lys Ser Phe Ala Asn Cys Gly Leu Gln Val Pro

85 90 95

Lys Gly Arg Thr Ile Ser Ser Ile Ser Asn Leu Gln Thr Ser Ile Ser

100 105 110

Trp Ser Tyr Ser Asn Thr Asn Ile Arg Ala Asn Val Ala Tyr Asp Leu

115 120 125

Phe Thr Ala Ala Asp Pro Asn His Ala Thr Ser Ser Gly Asp Tyr Glu

130 135 140

Leu Met Ile Trp Leu Ala Arg Phe Gly Asp Val Tyr Pro Ile Gly Ser

145 150 155 160

Ser Gln Gly His Val Asn Val Ala Gly Gln Asp Trp Glu Leu Trp Thr

165 170 175

Gly Phe Asn Gly Asn Met Arg Val Tyr Ser Phe Val Ala Pro Ser Pro

180 185 190

Arg Asn Ser Phe Ser Ala Asn Val Lys Asp Phe Phe Asn Tyr Leu Gln

195 200 205

Ser Asn Gln Gly Phe Pro Ala Ser Ser Gln Tyr Leu Leu Ile Phe Gln

210 215 220

Ala Gly Thr Glu Pro Phe Thr Gly Gly Glu Thr Thr Leu Thr Val Asn

225 230 235 240

Asn Tyr Ser Ala Arg Val Ala

245

<210>5

<211>678

<212>DNA

<213>Chrysosoporium lucknowense

<400>5

atgcatctct ccgccaccac cgggttcctc gccctcccgg ccctggccct ggcccagctc 60

tcgggcagcg gccagacgac ccggtactgg gactgctgca agccgagctg cgcctggccc 120

ggcaagggcc cctcgtctcc ggtgcaggcc tgcgacaaga acgacaaccc gctcaacgac 180

ggcggctcca cccggtccgg ctgcgacgcg ggcggcagcg cctacatgtg ctcctcccag 240

agcccctggg ccgtcagcga cgagctgtcg tacggctggg cggccgtcaa gctcgccggc 300

agctccgagt cgcagtggtg ctgcgcctgc tacgagctga ccttcaccag cgggccggtc 360

gcgggcaaga agatgattgt gcaggcgacc aacaccggtg gcgacctggg cgacaaccac 420

tttgacctgg ccatccccgg tggcggtgtc ggtattttca acgcctgcac cgaccagtac 480

ggcgctcccc cgaacggctg gggcgaccgc tacggcggca tccattccaa ggaagagtgc 540

gaatccttcc cggaggccct caagcccggc tgcaactggc gcttcgactg gttccaaaac 600

gccgacaacc cgtcggtcac cttccaggag gtggcctgcc cgtcggagct cacgtccaag 660

agcggctgct cccgttaa 678

<210>6

<211>225

<212>PRT

<213>Chrysosoporium lucknowense

<400>6

Met His Leu Ser Ala Thr Thr Gly Phe Leu Ala Leu Pro Ala Leu Ala

1 5 10 15

Leu Ala Gln Leu Ser Gly Ser Gly Gln Thr Thr Arg Tyr Trp Asp Cys

20 25 30

Cys Lys Pro Ser Cys Ala Trp Pro Gly Lys Gly Pro Ser Ser Pro Val

35 40 45

Gln Ala Cys Asp Lys Asn Asp Asn Pro Leu Asn Asp Gly Gly Ser Thr

50 55 60

Arg Ser Gly Cys Asp Ala Gly Gly Ser Ala Tyr Met Cys Ser Ser Gln

65 70 75 80

Ser Pro Trp Ala Val Ser Asp Glu Leu Ser Tyr Gly Trp Ala Ala Val

85 90 95

Lys Leu Ala Gly Ser Ser Glu Ser Gln Trp Cys Cys Ala Cys Tyr Glu

100 105 110

Leu Thr Phe Thr Ser Gly Pro Val Ala Gly Lys Lys Met Ile Val Gln

115 120 125

Ala Thr Asn Thr Gly Gly Asp Leu Gly Asp Asn His Phe Asp Leu Ala

130 135 140

Ile Pro Gly Gly Gly Val Gly Ile Phe Asn Ala Cys Thr Asp Gln Tyr

145 150 155 160

Gly Ala Pro Pro Asn Gly Trp Gly Asp Arg Tyr Gly Gly Ile His Ser

165 170 175

Lys Glu Glu Cys Glu Ser Phe Pro Glu Ala Leu Lys Pro Gly Cys Asn

180 185 190

Trp Arg Phe Asp Trp Phe Gln Asn Ala Asp Asn Pro Ser Val Thr Phe

195 200 205

Gln Glu Val Ala Cys Pro Ser Glu Leu Thr Ser Lys Ser Gly Cys Ser

210 215 220

Arg

225

<210>7

<211>1648

<212>DNA

<213>Chrysosoporium lucknowense

<220>

<221>misc_feature

<222>(1162)..(1162)

<223>NA、C、G或T

<400>7

atgtacgcca agttcgcgac cctcgccgcc cttgtggctg gcgccgctgc tcagaacgcc 60

tgcactctga ccgctgagaa ccacccctcg ctgacgtggt ccaagtgcac gtctggcggc 120

agctgcacca gcgtccaggg ttccatcacc atcgacgcca actggcggtg gactcaccgg 180

accgatagcg ccaccaactg ctacgagggc aacaagtggg atacttcgta ctgcagcgat 240

ggtccttctt gcgcctccaa gtgctgcatc gacggcgctg actactcgag cacctatggc 300

atcaccacga gcggtaactc cctgaacctc aagttcgtca ccaagggcca gtactcgacc 360

aacatcggct cgcgtaccta cctgatggag agcgacacca agtaceagag taagttcctc 420

tcgcacccgg ccgccgggag atgatggcgc ccagcccgct gacgcgaatg acacagtgtt 480

ccagctcctc ggcaacgagt tcaccttcga tgtcgacgtc tccaacctcg gctgcggcct 540

caatggcgcc ctctacttcg tgtccatgga tgccgatggt ggcatgtcca agtactcggg 600

caacaaggca ggtgccaagt acggtaccgg ctactgtgat tctcagtgcc cccgcgacct 660

caagttcatc aacggcgagg ccaacgtaga gaactggcag agctcgacca acgatgccaa 720

cgccggcacg ggcaagtacg gcagctgctg ctccgagatg gacgtctggg aggccaacaa 780

catggccgcc gccttcactc cccacccttg caccgtgatc ggccagtcgc gctgcgaggg 840

cgactcgtgc ggcggtacct acagcaccga ccgctatgcc ggcatctgcg accccgacgg 900

atgcgacttc aactcgtacc gccagggcaa caagaccttc tacggcaagg gcatgacggt 960

cgacacgacc aagaagatca cggtcgtcac ccagttcctc aagaactcgg ccggcgagct 1020

ctccgagatc aagcggttct acgtccagaa cggcaaggtc atccccaact ccgagtccac 1080

catcccgggc gtcgagggca actccatcac ccaggactgg tgcgaccgcc agaaggccgc 1140

cttcggcgac gtgaccgact tncaggacaa gggcggcatg gtccagatgg gcaaggccct 1200

cgcggggccc atggtcctcg tcatgtccat ctgggacgac cacgccgtca acatgctctg 1260

gctcgactcc acctggccca tcgacggcgc cggcaagccg ggcgccgagc gcggtgcctg 1320

ccccaccacc tcgggcgtcc ccgctgaggt cgaggccgag gcccccaact ccaacgtcat 1380

cttctccaac atccgcttcg gccccatcgg ctccaccgtc tccggcctgc ccgacggcgg 1440

cagcggcaac cccaacccgc ccgtcagctc gtccaccccg gtcccctcct cgtccaccac 1500

atcctccggt tcctccggcc cgactggcgg cacgggtgtc gctaagcact atgagcaatg 1560

cggaggaatc gggttcactg gccctaccca gtgcgagagc ccctacactt gcaccaagct 1620

gaatgactgg tactcgcagt gcctgtaa 1648

<210>8

<211>526

<212>PRT

<213>Chrysosoporium lucknowense

<220>

<221>MISC_FEATURE

<222>(365)..(365)

<223>X＝任何氨基酸

<400>8

Met Tyr Ala Lys Phe Ala Thr Leu Ala Ala Leu Val Ala Gly Ala Ala

1 5 10 15

Ala Gln Asn Ala Cys Thr Leu Thr Ala Glu Asn His Pro Ser Leu Thr

20 25 30

Trp Ser Lys Cys Thr Ser Gly Gly Ser Cys Thr Ser Val Gln Gly Ser

35 40 45

Ile Thr Ile Asp Ala Asn Trp Arg Trp Thr His Arg Thr Asp Ser Ala

50 55 60

Thr Asn Cys Tyr Glu Gly Asn Lys Trp Asp Thr Ser Tyr Cys Ser Asp

65 70 75 80

Gly Pro Ser Cys Ala Ser Lys Cys Cys Ile Asp Gly Ala Asp Tyr Ser

85 90 95

Ser Thr Tyr Gly Ile Thr Thr Ser Gly Asn Ser Leu Ash Leu Lys Phe

100 105 110

Val Thr Lys Gly Gln Tyr Ser Thr Asn Ile Gly Ser Arg Thr Tyr Leu

115 120 125

Met Glu Ser Asp Thr Lys Tyr Gln Met Phe Gln Leu Leu Gly Asn Glu

130 135 140

Phe Thr Phe Asp Val Asp Val Ser Asn Leu Gly Cys Gly Leu Asn Gly

145 150 155 160

Ala Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Met Ser Lys Tyr

165 170 175

Ser Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser

180 185 190

Gln Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Glu Ala Asn Val Glu

195 200 205

Asn Trp Gln Ser Ser Thr Asn Asp Ala Asn Ala Gly Thr Gly Lys Tyr

210 215 220

Gly Ser Cys Cys Ser Glu Met Asp Val Trp Glu Ala Asn Asn Met Ala

225 230 235 240

Ala Ala Phe Thr Pro His Pro Cys Trp Val Ile Gly Gln Ser Arg Cys

245 250 255

Glu Gly Asp Ser Cys Gly Gly Thr Tyr Ser Thr Asp Arg Tyr Ala Gly

260 265 270

Ile Cys Asp Pro Asp Gly Cys Asp Phe Asn Ser Tyr Arg Gln Gly Asn

275 280 285

Lys Thr Phe Tyr Gly Lys Gly Met Thr Val Asp Thr Thr Lys Lys Ile

290 295 300

Thr Val Val Thr Gln Phe Leu Lys Asn Ser Ala Gly Glu Leu Ser Glu

305 310 315 320

Ile Lys Arg Phe Tyr Val Gln Asn Gly Lys Val Ile Pro Asn Ser Glu

325 330 335

Ser Thr Ile Pro Gly Val Glu Gly Asn Ser Ile Thr Gln Asp Trp Cys

340 345 350

Asp Arg Gln Lys Ala Ala Phe Gly Asp Val Thr Asp Xaa Gln Asp Lys

355 360 365

Gly Gly Met Val Gln Met Gly Lys Ala Leu Ala Gly Pro Met Val Leu

370 375 380

Val Met Ser Ile Trp Asp Asp His Ala Val Asn Met Leu Trp Leu Asp

385 390 395 400

Ser Thr Trp Pro Ile Asp Gly Ala Gly Lys Pro Gly Ala Glu Arg Gly

405 410 415

Ala Cys Pro Thr Thr Ser Gly Val Pro Ala Glu Val Glu Ala Glu Ala

420 425 430

Pro Asn Ser Asn Val Ile Phe Ser Asn Ile Arg Phe Gly Pro Ile Gly

435 440 445

Ser Thr Val Ser Gly Leu Pro Asp Gly Gly Ser Gly Asn Pro Asn Pro

450 455 460

Pro Val Ser Ser Ser Thr Pro Val Pro Ser Ser Ser Thr Thr Ser Ser

465 470 475 480

Gly Ser Ser Gly Pro Thr Gly Gly Thr Gly Val Ala Lys His Tyr Glu

485 490 495

Gln Cys Gly Gly Ile Gly Phe Thr Gly Pro Thr Gln Cys Glu Ser Pro

500 505 510

Tyr Thr Cys Thr Lys Leu Asn Asp Trp Tyr Ser Gln Cys Leu

515 520 525

<210>9

<211>1353

<212>DNA

<213>嗜热毁丝霉

<400>9

atgaagcagt acctccagta cctcgcggcg accctgcccc tggtgggcct ggccacggcc 60

cagcaggcgg gtaacctgca gaccgagact caccccaggc tcacttggtc caagtgcacg 120

gccccgggat cctgccaaca ggtcaacggc gaggtcgtca tcgactccaa ctggcgctgg 180

gtgcacgacg agaacgcgca gaactgctac gacggcaacc agtggaccaa cgcttgcagc 240

tctgccaccg actgcgccga gaattgcgcg ctcgagggtg ccgactacca gggcacctat 300

ggcgcctcga ccagcggcaa tgccctgacg ctcaccttcg tcactaagca cgagtacggc 360

accaacattg gctcgcgcct ctacctcatg aacggcgcga acaagtacca gatgttcacc 420

ctcaagggca acgagctggc cttcgacgtc gacctctcgg ccgtcgagtg cggcctcaac 480

agcgccctct acttcgtggc catggaggag gatggcggtg tgtcgagcta cccgaccaac 540

acggccggtg ctaagttcgg cactgggtac tgcgacgccc aatgcgcacg cgacctcaag 600

ttcgtcggcg gcaagggcaa catcgagggc tggaagccgt ccaccaacga tgccaatgcc 660

ggtgtcggtc cttatggcgg gtgctgcgct gagatcgacg tctgggagtc gaacaagtat 720

gctttcgctt tcaceccgca cggttgcgag aaccctaaat accacgtctg cgagaccacc 780

aactgcggtg gcacctactc cgaggaccgc ttcgctggtg actgcgatgc caacggctgc 840

gactacaacc cctaccgcat gggcaaccag gacttctacg gtcccggctt gacggtcgat 900

accagcaaga agttcaccgt cgtcagccag ttcgaggaga acaagctcac ccagttcttc 960

gtccaggacg gcaagaagat tgagatcccc ggccccaagg tcgagggcat cgatgcggac 1020

agcgccgcta tcacccctga gctgtgcagt gccctgttca aggccttcga tgaccgtgac 1080

cgcttctcgg aggttggcgg cttcgatgcc atcaacacgg ccctcagcac tcccatggtc 1140

ctcgtcatgt ccatctggga tgatcactac gccaatatgc tctggctcga ctcgagctac 1200

ccccctgaga aggctggcca gcctggcggt gaccgtggcc cgtgtcctca ggactctggc 1260

gtcccggccg acgttgaggc tcagtaccct aatgccaagg tcatctggtc caacatccgc 1320

ttcggcccca tcggctcgactgt caacgtc taa 1353

<210>10

<211>450

<212>PRT

<213>嗜热毁丝霉

<400>10

Met Lys Gln Tyr Leu Gln Tyr Leu Ala Ala Thr Leu Pro Leu Val Gly

1 5 10 15

Leu Ala Thr Ala Gln Gln Ala Gly Asn Leu Gln Thr Glu Thr His Pro

20 25 30

Arg Leu Thr Trp Ser Lys Cys Thr Ala Pro Gly Ser Cys Gln Gln Val

35 40 45

Asn Gly Glu Val Val Ile Asp Ser Asn Trp Arg Trp Val His Asp Glu

50 55 60

Asn Ala Gln Asn Cys Tyr Asp Gly Asn Gln Trp Thr Asn Ala Cys Ser

65 70 75 80

Ser Ala Thr Asp Cys Ala Glu Asn Cys Ala Leu Glu Gly Ala Asp Tyr

85 90 95

Gln Gly Thr Tyr Gly Ala Ser Thr Ser Gly Asn Ala Leu Thr Leu Thr

100 105 110

Phe Val Thr Lys His Glu Tyr Gly Thr Asn Ile Gly Ser Arg Leu Tyr

115 120 125

Leu Met Asn Gly Ala Asn Lys Tyr Gln Met Phe Thr Leu Lys Gly Asn

130 135 140

Glu Leu Ala Phe Asp Val Asp Leu Ser Ala Val Glu Cys Gly Leu Asn

145 150 155 160

Ser Ala Leu Tyr Phe Val Ala Met Glu Glu Asp Gly Gly Val Ser Ser

165 170 175

Tyr Pro Thr Asn Thr Ala Gly Ala Lys Phe Gly Thr Gly Tyr Cys Asp

180 185 190

Ala Gln Cys Ala Arg Asp Leu Lys Phe Val Gly Gly Lys Gly Asn Ile

195 200 205

Glu Gly Trp Lys Pro Ser Thr Asn Asp Ala Asn Ala Gly Val Gly Pro

210 215 220

Tyr Gly Gly Cys Cys Ala Glu Ile Asp Val Trp Glu Ser Asn Lys Tyr

225 230 235 240

Ala Phe Ala Phe Thr Pro His Gly Cys Glu Asn Pro Lys Tyr His Val

245 250 255

Cys Glu Thr Thr Asn Cys Gly Gly Thr Tyr Ser Glu Asp Arg Phe Ala

260 265 270

Gly Asp Cys Asp Ala Asn Gly Cys Asp Tyr Asn Pro Tyr Arg Met Gly

275 280 285

Asn Gln Asp Phe Tyr Gly Pro Gly Leu Thr Val Asp Thr Ser Lys Lys

290 295 300

Phe Thr Val Val Ser Gln Phe Glu Glu Asn Lys Leu Thr Gln Phe Phe

305 310 315 320

Val Gln Asp Gly Lys Lys Ile Glu Ile Pro Gly Pro Lys Val Glu Gly

325 330 335

Ile Asp Ala Asp Ser Ala Ala Ile Thr Pro Glu Leu Cys Ser Ala Leu

340 345 350

Phe Lys Ala Phe Asp Asp Arg Asp Arg Phe Ser Glu Val Gly Gly Phe

355 360 365

Asp Ala Ile Asn Thr Ala Leu Ser Thr Pro Met Val Leu Val Met Ser

370 375 380

Ile Trp Asp Asp His Tyr Ala Asn Met Leu Trp Leu Asp Ser Ser Tyr

385 390 395 400

Pro Pro Glu Lys Ala Gly Gln Pro Gly Gly Asp Arg Gly Pro Cys Pro

405 410 415

Gln Asp Ser Gly Val Pro Ala Asp Val Glu Ala Gln Tyr Pro Asn Ala

420 425 430

Lys Val Ile Trp Ser Asn Ile Arg Phe Gly Pro Ile Gly Ser Thr Val

435 440 445

Asn Val

450

<210>11

<211>1800

<212>DNA

<213>土生羧孢霉(Thielavia terrestris)

<400>11

aattgaagga gggagtggcg gagtggccac caagtcaggc ggctgtcaac taaccaagga 60

tgggaacagt tcggctcgcc ttgcccgagg gcagcgttcc ctgatgggga cgaaccatgg 120

gactggggtc agctgctgta taaaagttca aatcgatgat ctctcagatg gcgctgctgg 180

ggtgttctgc gcttttccat cctcgcaacc tggtatccca ctagtccagc gttcggcacc 240

atgaagtcgt tcaccattgc cgccttggca gccctatggg cccaggaggc cgccgcccac 300

gcgaccttcc aggacctctg gattgatgga gtcgactacg gctcgcaatg tgtccgcctc 360

ccggcgtcca actcccccgt caccaatgtt gcgtccgacg atatccgatg caatgtcggc 420

acctcgaggc ccaccgtcaa gtgcccggtc aaggccggct ccacggtcac gatcgagatg 480

caccaggttc gcacgcctct ctgcgtaggc cccccagcta ctatatggca ctaacacgac 540

ctccagcaac ctggcgaccg gtcttgcgcc aacgaggcta tcggcggcga ccactacggc 600

cccgtaatgg tgtacatgtc caaggtcgat gacgcggtga cagccgacgg ttcatcgggc 660

tggttcaagg tgttccagga cagctgggcc aagaacccgt cgggttcgac gggcgacgac 720

gactactggg gcaccaagga cctcaactcg tgctgcggca agatgaacgt caagatcccc 780

gaagacatcg agccgggcga ctacctgctc cgcgccgagg ttatcgcgct gcacgtggcc 840

gccagctcgg gcggcgcgca gttctacatg tcctgctacc agctgaccgt gacgggctcc 900

ggcagcgcca ccccctcgac cgtgaatttc ccgggcgcct actcggccag cgacccgggc 960

atcctgatca acatccacgc gcccatgtcg acctacgtcg tcccgggccc gaccgtgtac 1020

gcgggcggct cgaccaagtc ggctggcagc tcctgctccg gctgcgaggc gacctgcacg 1080

gttggttccg gccccagcgc gacactgacg cagcccacct ccaccgcgac cgcgacctcc 1140

gcccctggcg gcggcggctc cggctgcacg gcggccaagt accagcagtg cggcggcacc 1200

ggctacactg ggtgcaccac ctgcgctgta agttccctcg tgatatgcag cggaacaccg 1260

tctggactgt tttgctaact cgcgtcgtag tccgggtcta cctgcagcgc cgtctcgcct 1320

ccgtactact cgcagtgcct ctaagccggg agcgcttgct cagcgggctg ctgtgaagga 1380

gctccatgtc cccatgccgc catggccgga gtaccgggct gagcgcccaa ttcttgtata 1440

tagttgagtt ttcccaatca tgaatacata tgcatctgca tggactgttg cgtcgtcagt 1500

ctacatcctt tgctccactg aactgtgaga ccccatgtca tccggaccat tcgatcggtg 1560

ctcgctctac catctcggtt gatgggtctg ggcttgagag tcactggcac gtcctcggcg 1620

gtaatgaaat gtggaggaaa gtgtgagctg tctgacgcac tcggcgctga tgagacgttg 1680

agcgcggccc acactggtgt tctgtaagcc agcacacaaa agaatactcc aggatggccc 1740

atagcggcaa atatacagta tcagggatgc aaaaagtgca aaagtaaggg gctcaatcgg 1800

<210>12

<211>326

<212>PRT

<213>土生羧孢霉

<400>12

Met Lys Ser Phe Thr Ile Ala Ala Leu Ala Ala Leu Trp Ala Gln Glu

1 5 10 15

Ala Ala Ala His Ala Thr Phe Gln Asp Leu Trp Ile Asp Gly Val Asp

20 25 30

Tyr Gly Ser Gln Cys Val Arg Leu Pro Ala Ser Asn Ser Pro Val Thr

35 40 45

Asn Val Ala Ser Asp Asp Ile Arg Cys Asn Val Gly Thr Ser Arg Pro

50 55 60

Thr Val Lys Cys Pro Val Lys Ala Gly Ser Thr Val Thr Ile Glu Met

65 70 75 80

His Gln Gln Pro Gly Asp Arg Ser Cys Ala Asn Glu Ala Ile Gly Gly

85 90 95

Asp His Tyr Gly Pro Val Met Val Tyr Met Ser Lys Val Asp Asp Ala

100 105 110

Val Thr Ala Asp Gly Ser Ser Gly Trp Phe Lys Val Phe Gln Asp Ser

115 120 125

Trp Ala Lys Asn Pro Ser Gly Ser Thr Gly Asp Asp Asp Tyr Trp Gly

130 135 140

Thr Lys Asp Leu Asn Ser Cys Cys Gly Lys Met Asn Val Lys Ile Pro

145 150 155 160

Glu Asp Ile Glu Pro Gly Asp Tyr Leu Leu Arg Ala Glu Val Ile Ala

165 170 175

Leu His Val Ala Ala Ser Ser Gly Gly Ala Gln Phe Tyr Met Ser Cys

180 185 190

Tyr Gln Leu Thr Val Thr Gly Ser Gly Ser Ala Thr Pro Ser Thr Val

195 200 205

Asn Phc Pro Gly Ala Tyr Ser Ala Ser Asp Pro Gly Ile Leu Ile Asn

210 215 220

Ile His Ala Pro Met Ser Thr Tyr Val Val Pro Gly Pro Thr Val Tyr

225 230 235 240

Ala Gly Gly Ser Thr Lys Ser Ala Gly Ser Ser Cys Ser Gly Cys Glu

245 250 255

Ala Thr Cys Thr Val Gly Ser Gly Pro Ser Ala Thr Leu Thr Gln Pro

260 265 270

Thr Ser Thr Ala Thr Ala Thr Ser Ala Pro Gly Gly Gly Gly Ser Gly

275 280 285

Cys Thr Ala Ala Lys Tyr Gln Gln Cys Gly Gly Thr Gly Tyr Thr Gly

290 295 300

Cys Thr Thr Cys Ala Ser Gly Ser Thr Cys Ser Ala Val Ser Pro Pro

305 310 315 320

Tyr Tyr Ser Gln Cys Leu

325

<210>13

<211>880

<212>DNA

<213>土生羧孢霉

<400>13

accccgggat cactgcccct aggaaccagc acacctcggt ccaatcatgc ggttcgacgc 60

cctctccgcc ctcgctcttg cgccgcttgt ggctggccac ggcgccgtga ccagctacat 120

catcggcggc aaaacctatc ccggctacga gggcttctcg cctgcctcga gcccgccgac 180

gatccagtac cagtggcccg actacaaccc gaccctgagc gtgaccgacc cgaagatgcg 240

ctgcaacggc ggcacctcgg cagagctcag cgcgcccgtc caggccggcg agaacgtgac 300

ggccgtctgg aagcagtgga cccaccagca aggccccgtc atggtctgga tgttcaagtg 360

ccccggcgac ttctcgtcgt gccacggcga cggcaagggc tggttcaaga tcgaccagct 420

gggcctgtgg ggcaacaacc tcaactcgaa caactggggc accgcgatcg tctacaagac 480

cctccagtgg agcaacccga tccccaagaa cctcgcgccg ggcaactacc tcatccgcca 540

cgagctgctc gccctgcacc aggccaacac gccgcagttc tacgccgagt gcgcccagct 600

ggtcgtctcc ggcagcggct ccgccctgcc cccgtccgac tacctctaca gcatccccgt 660

ctacgcgccc cagaacgacc ccggcatcac cgtgagtggg cttccgttcc gcggcgagct 720

ctgtggaaat cttgctgacg atgggctagg ttgacatcta caacggcggg cttacctcct 780

acaccccgcc cggcggcccc gtctggtctg gcttcgagtt ttaggcgcat tgagtcgggg 840

gctacgaggg gaaggcatct gttcgcatga gcgtgggtac 880

<210>14

<211>478

<212>PRT

<213>土生羧孢霉

<400>14

Met Arg Phe Asp Ala Leu Ser Ala Leu Ala Leu Ala Pro Leu Val Ala

1 5 10 15

Gly His Gly Ala Val Thr Ser Tyr Ile Ile Gly Gly Lys Thr Tyr Pro

20 25 30

Gly Tyr Glu Gly Phe Ser Pro Ala Ser Ser Pro Pro Thr Ile Gln Tyr

35 40 45

Gln Trp Pro Asp Tyr Asn Pro Thr Leu Ser Val Thr Asp Pro Lys Met

50 55 60

Arg Cys Asn Gly Gly Thr Ser Ala Glu Leu Ser Ala Pro Val Gln Ala

65 70 75 80

Gly Glu Asn Val Thr Ala Val Trp Lys Gln Trp Thr His Gln Gln Gly

85 90 95

Pro Val Met Val Trp Met Phe Lys Cys Pro Gly Asp Phe Ser Ser Ser

100 105 110

His Gly Asp Gly Lys Gly Trp Phe Lys Ile Asp Gln Leu Gly Leu Trp

115 120 125

Gly Asn Asn Leu Asn Ser Asn Asn Trp Gly Thr Ala Ile Val Tyr Lys

130 135 140

Thr Leu Gln Trp Ser Asn Pro Ile Pro Lys Asn Leu Ala Pro Gly Asn

145 150 155 160

Tyr Leu Ile Arg His Glu Leu Leu Ala Leu His Gln Ala Asn Thr Pro

165 170 175

Gln Phe Tyr Ala Glu Cys Ala Gln Leu Val Val Ser Gly Ser Gly Ser

180 185 190

Ala Leu Pro Pro Ser Asp Tyr Leu Tyr Ser Ile Pro Val Tyr Ala Pro

195 200 205

Gln Asn Asp Pro Gly Ile Thr Val Asp Ile Tyr Asn Gly Gly Leu Thr

210 215 220

Ser Tyr Thr Pro Pro Gly Gly Pro Val Trp Ser Gly Phe Glu Phe Met

225 230 235 240

Arg Phe Asp Ala Leu Ser Ala Leu Ala Leu Ala Pro Leu Val Ala Gly

245 250 255

His Gly Ala Val Thr Ser Tyr Ile Ile Gly Gly Lys Thr Tyr Pro Gly

260 265 270

Tyr Glu Gly Phe Ser Pro Ala Ser Ser Pro Pro Thr Ile Gln Tyr Gln

275 280 285

Trp Pro Asp Tyr Asn Pro Thr Leu Ser Val Thr Asp Pro Lys Met Arg

290 295 300

Cys Asn Gly Gly Thr Ser Ala Glu Leu Ser Ala Pro Val Gln Ala Gly

305 310 315 320

Glu Asn Val Thr Ala Val Trp Lys Gln Trp Thr His Gln Gln Gly Pro

325 330 335

Val Met Val Trp Met Phe Lys Cys Pro Gly Asp Phe Ser Ser Ser His

340 345 350

Gly Asp Gly Lys Gly Trp Phe Lys Ile Asp Gln Leu Gly Leu Trp Gly

355 360 365

Asn Asn Leu Asn Ser Asn Asn Trp Gly Thr Ala Ile Val Tyr Lys Thr

370 375 380

Leu Gln Trp Ser Asn Pro Ile Pro Lys Asn Leu Ala Pro Gly Asn Tyr

385 390 395 400

Leu Ile Arg His Glu Leu Leu Ala Leu His Gln Ala Asn Thr Pro Gln

405 410 415

Phe Tyr Ala Glu Cys Ala Gln Leu Val Val Ser Gly Ser Gly Ser Ala

420 425 430

Leu Pro Pro Ser Asp Tyr Leu Tyr Ser Ile Pro Val Tyr Ala Pro Gln

435 440 445

Asn Asp Pro Gly Ile Thr Val Asp Ile Tyr Asn Gly Gly Leu Thr Ser

450 455 460

Tyr Thr Pro Pro Gly Gly Pro Val Trp Ser Gly Phe Glu Phe

465 470 475

<210>15

<211>1000

<212>DNA

<213>土生羧孢霉

<400>15

ctcctgttcc tgggccaccg cttgttgcct gcactattgg tagagttggt ctattgctag 60

agttggccat gcttctcaca tcagtcctcg gctcggctgc cctgcttgct agcggcgctg 120

cggcacacgg cgccgtgacc agctacatca tcgccggcaa gaattacccg gggtgggtag 180

ctgattattg agggcgcatt caaggttcat accggtgtgc atggctgaca accggctggc 240

agataccaag gcttttctcc tgcgaactcg ccgaacgtca tccaatggca atggcatgac 300

tacaaccccg tcttgtcgtg cagcgactcg aagcttcgct gcaacggcgg cacgtcggcc 360

accctgaacg ccacggccgc accgggcgac accatcaccg ccatctgggc gcagtggacg 420

cacagccagg gccccatcct ggtgtggatg tacaagtgcc cgggctcctt cagctcctgt 480

gacggctccg gcgctggctg gttcaagatc gacgaggccg gcttccacgg cgacggcgtc 540

aaggtcttcc tcgacaccga gaacccgtcc ggctgggaca tcgccaagct cgtcggcggc 600

aacaagcagt ggagcagcaa ggtccccgag ggcctcgccc ccggcaacta cctcgtccgc 660

cacgagttga tcgccctgca ccaggccaac aacccgcagt tctacccgga gtgcgcccag 720

gtcgtcatca ccggctccgg caccgcgcag ccggatgcct catacaaggc ggctatcccc 780

ggctactgca accagaatga cccgaacatc aaggtgagat ccaggcgtaa tgcagtctac 840

tgctggaaag aaagtggtcc aagctaaacc gcgctccagg tgcccatcaa cgaccactcc 900

atccctcaga cctacaagat tcccggccct cccgtcttca agggcaccgc cagcaagaag 960

gcccgggact tcaccgcctg aagttgttga atcgatggag 1000

<210>16

<211>516

<212>PRT

<213>土生羧孢霉

<400>16

Met Leu Leu Thr Ser Val Leu Gly Ser Ala Ala Leu Leu Ala Ser Gly

1 5 10 15

Ala Ala Ala His Gly Ala Val Thr Ser Tyr Ile Ile Ala Gly Lys Asn

20 25 30

Tyr Pro Gly Tyr Gln Gly Phe Ser Pro Ala Asn Ser Pro Asn Val Ile

35 40 45

Gln Trp Gln Trp His Asp Tyr Asn Pro Val Leu Ser Cys Ser Asp Ser

50 55 60

Lys Leu Arg Cys Asn Gly Gly Thr Ser Ala Thr Leu Asn Ala Thr Ala

65 70 75 80

Ala Pro Gly Asp Thr Ile Thr Ala Ile Trp Ala Gln Trp Thr His Ser

85 90 95

Gln Gly Pro Ile Leu Val Trp Met Tyr Lys Cys Pro Gly Ser Phe Ser

100 105 110

Ser Cys Asp Gly Ser Gly Ala Gly Trp Phe Lys Ile Asp Glu Ala Gly

115 120 125

Phe His Gly Asp Gly Val Lys Val Phe Leu Asp Thr Glu Asn Pro Ser

130 135 140

Gly Trp Asp Ile Ala Lys Leu Val Gly Gly Asn Lys Gln Trp Ser Ser

145 150 155 160

Lys Val Pro Glu Gly Leu Ala Pro Gly Asn Tyr Leu Val Arg His Glu

165 170 175

Leu Ile Ala Leu His Gln Ala Asn Asn Pro Gln Phe Tyr Pro Glu Cys

180 185 190

Ala Gln Val Val Ile Thr Gly Ser Gly Thr Ala Gln Pro Asp Ala Ser

195 200 205

Tyr Lys Ala Ala Ile Pro Gly Tyr Cys Asn Gln Asn Asp Pro Asn Ile

210 215 220

Lys Val Pro Ile Asn Asp His Ser Ile Pro Gln Thr Tyr Lys Ile Pro

225 230 235 240

Gly Pro Pro Val Phe Lys Gly Thr Ala Ser Lys Lys Ala Arg Asp Phe

245 250 255

Thr Ala Met Leu Leu Thr Ser Val Leu Gly Ser Ala Ala Leu Leu Ala

260 265 270

Ser Gly Ala Ala Ala His Gly Ala Val Thr Ser Tyr Ile Ile Ala Gly

275 280 285

Lys Asn Tyr Pro Gly Tyr Gln Gly Phe Ser Pro Ala Asn Ser Pro Asn

290 295 300

Val Ile Gln Trp Gln Trp His Asp Tyr Asn Pro Val Leu Ser Cys Ser

305 310 315 320

Asp Ser Lys Leu Arg Cys Asn Gly Gly Thr Ser Ala Thr Leu Asn Ala

325 330 335

Thr Ala Ala Pro Gly Asp Thr Ile Thr Ala Ile Trp Ala Gln Trp Thr

340 345 350

His Ser Gln Gly Pro Ile Leu Val Trp Met Tyr Lys Cys Pro Gly Ser

355 360 365

Phe Ser Ser Cys Asp Gly Ser Gly Ala Gly Trp Phe Lys Ile Asp Glu

370 375 380

Ala Gly Phe His Gly Asp Gly Val Lys Val Phe Leu Asp Thr Glu Asn

385 390 395 400

Pro Ser Gly Trp Asp Ile Ala Lys Leu Val Gly Gly Asn Lys Gln Trp

405 410 415

Ser Ser Lys Val Pro Glu Gly Leu Ala Pro Gly Asn Tyr Leu Val Arg

420 425 430

His Glu Leu Ile Ala Leu His Gln Ala Asn Asn Pro Gln Phe Tyr Pro

435 440 445

Glu Cys Ala Gln Val Val Ile Thr Gly Ser Gly Thr Ala Gln Pro Asp

450 455 460

Ala Ser Tyr Lys Ala Ala Ile Pro Gly Tyr Cys Asn Gln Asn Asp Pro

465 470 475 480

Asn Ile Lys Val Pro Ile Asn Asp His Ser Ile Pro Gln Thr Tyr Lys

485 490 495

Ile Pro Gly Pro Pro Val Phe Lys Gly Thr Ala Ser Lys Lys Ala Arg

500 505 510

Asp Phe Thr Ala

515

<210>17

<211>681

<212>DNA

<213>土生羧孢霉

<400>17

atgctcgcaa acggtgccat cgtcttcctg gccgccgccc tcggcgtcag tggccactac 60

acctggccac gggttaacga cggcgccgac tggcaacagg tccgtaaggc ggacaactgg 120

caggacaacg gctacgtcgg ggatgtcacg tcgccacaga tccgctgttt ccaggcgacc 180

ccgtccccgg ccccatccgt cctcaacacc acggccggct cgaccgtgac ctactgggcc 240

aaccccgacg tctaccaccc cgggcctgtg cagttttaca tggcccgcgt gcccgatggc 300

gaggacatca actcgtggaa cggcgacggc gccgtgtggt tcaaggtgta cgaggaccat 360

cctacctttg gcgctcagct cacatggccc agcacgggca agagctcgtt cgcggttccc 420

atccccccgt gcatcaagtc cggctactac ctcctccggg cggagcaaat cggcctgcac 480

gtcgcccaga gcgtaggcgg agcgcagttc tacatctcat gcgcccagct cagcgtcacc 540

ggcggcggca gcaccgagcc gccgaacaag gtggccttcc ccggcgctta cagtgcgacg 600

gacccgggca ttctgatcaa catctactac cctgttccca cgtcctacca gaaccccggc 660

ccggccgtct tcagctgctg a 681

<210>18

<211>452

<212>PRT

<213>土生羧孢霉

<400>18

Met Leu Ala Asn Gly Ala Ile Val Phe Leu Ala Ala Ala Leu Gly Val

1 5 10 15

Ser Gly His Tyr Thr Trp Pro Arg Val Asn Asp Gly Ala Asp Trp Gln

20 25 30

Gln Val Arg Lys Ala Asp Asn Trp Gln Asp Asn Gly Tyr Val Gly Asp

35 40 45

Val Thr Ser Pro Gln Ile Arg Cys Phe Gln Ala Thr Pro Ser Pro Ala

50 55 60

Pro Ser Val Leu Asn Thr Thr Ala Gly Ser Thr Val Thr Tyr Trp Ala

65 70 75 80

Asn Pro Asp Val Tyr His Pro Gly Pro Val Gln Phe Tyr Met Ala Arg

85 90 95

Val Pro Asp Gly Glu Asp Ile Asn Ser Trp Asn Gly Asp Gly Ala Val

100 105 110

Trp Phe Lys Val Tyr Glu Asp His Pro Thr Phe Gly Ala Gln Leu Thr

115 120 125

Trp Pro Ser Thr Gly Lys Ser Ser Phe Ala Val Pro Ile Pro Pro Cys

130 135 140

Ile Lys Ser Gly Tyr Tyr Leu Leu Arg Ala Glu Gln Ile Gly Leu His

145 150 155 160

Val Ala Gln Ser Val Gly Gly Ala Gln Phe Tyr Ile Ser Cys Ala Gln

165 170 175

Leu Ser Val Thr Gly Gly Gly Ser Thr Glu Pro Pro Asn Lys Val Ala

180 185 190

Phe Pro Gly Ala Tyr Ser Ala Thr Asp Pro Gly Ile Leu Ile Asn Ile

195 200 205

Tyr Tyr Pro Val Pro Thr Ser Tyr Gln Asn Pro Gly Pro Ala Val Phe

210 215 220

Ser Cys Met Leu Ala Asn Gly Ala Ile Val Phe Leu Ala Ala Ala Leu

225 230 235 240

Gly Val Ser Gly His Tyr Thr Trp Pro Arg Val Asn Asp Gly Ala Asp

245 250 255

Trp Gln Gln Val Arg Lys Ala Asp Asn Trp Gln Asp Asn Gly Tyr Val

260 265 270

Gly Asp Val Thr Ser Pro Gln Ile Arg Cys Phe Gln Ala Thr Pro Ser

275 280 285

Pro Ala Pro Ser Val Leu Asn Thr Thr Ala Gly Ser Thr Val Thr Tyr

290 295 300

Trp Ala Asn Pro Asp Val Tyr His Pro Gly Pro Val Gln Phe Tyr Met

305 310 315 320

Ala Arg Val Pro Asp Gly Glu Asp Ile Asn Ser Trp Asn Gly Asp Gly

325 330 335

Ala Val Trp Phe Lys ValTyr Glu Asp Hi s Pro Thr Phe Gly Ala Gln

340 345 350

Leu Thr Trp Pro SerThr Gl y Lys Ser Ser Phe Ala Val Pro Ile Pro

355 360 365

Pro Cys Ile Lys Ser Gly Tyr Tyr Leu Leu Arg Ala Glu Gln Ile Gly

370 375 380

Leu His Val Ala Gln Ser Val Gly Gly Ala Gln Phe Tyr Ile Ser Cys

385 390 395 400

Ala Gln Leu Ser Val Thr Gly Gly Gly Ser Thr Glu Pro Pro Asn Lys

405 410 415

Val Ala Phe Pro Gly Ala Tyr Ser Ala Thr Asp Pro Gly Ile Leu Ile

420 425 430

Asn Ile Tyr Tyr Pro Val Pro Thr Ser Tyr Gln Asn Pro Gly Pro Ala

435 440 445

Val Phe Ser Cys

450

<210>19

<211>960

<212>DNA

<213>土生羧孢霉

<400>19

atgaagggac ttttcagtgc cgccgccctc tccctggccg tcggccaggc ttcggcccat 60

tacatcttcc agcaactctc catcaacggg aaccagtttc cggtgtacca atatattcgc 120

aagaacacca attataacag tcccgttacc gatctcacgt ccgacgatct tcggtgcaat 180

gtcggcgccc agggtgctgg gacagacacc gtcacggtga aggccggcga ccagttcacc 240

ttcacccttg acacccctgt ttaccaccag gggcccatct ccatctacat gtccaaggcc 300

ccgggcgcgg cgtcagacta cgatggcagc ggcggctggt tcaagatcaa ggactggggc 360

ccgactttca acgccgacgg cacggccacc tgggacatgg ccggctcata cacctacaac 420

atcccgacct gcattcccga cggcgactat ctgctccgca tccagtcgct ggccatccac 480

aacccctggc cggcgggcat cccgcagttc tacatctcct gcgcccagat caccgtgacc 540

ggcggcggca acggcaaccc tggcccgacg gccctcatcc ccggcgcctt caaggacacc 600

gacccgggct acacggtgaa catctacacg aacttccaca actacacggt tcccggcccg 660

gaggtcttca gctgcaacgg cggcggctcg aacccgcccc cgccggtgag tagcagcacg 720

cccgcgacca cgacgctggt cacgtcgacg cgcaccacgt cctccacgtc ctccgcctcg 780

acgccggcct cgaccggcgg ctgcaccgtc gccaagtggg gccagtgcgg cggcaacggg 840

tacaccggct gcacgacctg cgcggccggg tccacctgca gcaagcagaa cgactactac 900

tcgcagtgct tgtaagggag gccgcaaagc atgaggtgtt tgaagaggag gagaggggtc 960

<210>20

<211>608

<212>PRT

<213>土生羧孢霉

<400>20

Met Lys Gly Leu Phe Ser Ala Ala Ala Leu Ser Leu Ala Val Gly Gln

1 5 10 15

Ala Ser Ala His Tyr Ile Phe Gln Gln Leu Ser Ile Asn Gly Asn Gln

20 25 30

Phe Pro Val Tyr Gln Tyr Ile Arg Lys Asn Thr Asn Tyr Asn Ser Pro

35 40 45

Val Thr Asp Leu Thr Ser Asp Asp Leu Arg Cys Asn Val Gly Ala Gln

50 55 60

Gly Ala Gly Thr Asp Thr Val Thr Val Lys Ala Gly Asp Gln Phe Thr

65 70 75 80

Phe Thr Leu Asp Thr Pro Val Tyr His Gln Gly Pro Ile Ser Ile Tyr

85 90 95

Met Ser Lys Ala Pro Gly Ala Ala Ser Asp Tyr Asp Gly Ser Gly Gly

100 105 110

Trp Phe Lys Ile Lys Asp Trp Gly Pro Thr Phe Asn Ala Asp Gly Thr

115 120 125

Ala Thr Trp Asp Met Ala Gly Ser Tyr Thr Tyr Asn Ile Pro Thr Cys

130 135 140

Ile Pro Asp Gly Asp Tyr Leu Leu Arg Ile Gln Ser Leu Ala Ile His

145 150 155 160

Asn Pro Trp Pro Ala Gly Ile Pro Gln Phe Tyr Ile Ser Cys Ala Gln

165 170 175

Ile Thr Val Thr Gly Gly Gly Asn Gly Asn Pro Gly Pro Thr Ala Leu

180 185 190

Ile Pro Gly Ala Phe Lys Asp Thr Asp Pro Gly Tyr Thr Val Asn Ile

195 200 205

Tyr Thr Asn Phe His Asn Tyr Thr Val Pro Gly Pro Glu Val Phe Ser

210 215 220

Cys Asn Gly Gly Gly Ser Asn Pro Pro Pro Pro Val Ser Ser Ser Thr

225 230 235 240

Pro Ala Thr Thr Thr Leu Val Thr Ser Thr Arg Thr Thr Ser Ser Thr

245 250 255

Ser Ser Ala Ser Thr Pro Ala Ser Thr Gly Gly Cys Thr Val Ala Lys

260 265 270

Trp Gly Gln Cys Gly Gly Asn Gly Tyr Thr Gly Cys Thr Thr Cys Ala

275 280 285

Ala Gly Ser Thr Cys Ser Lys Gln Asn Asp Tyr Tyr Ser Gln Cys Leu

290 295 300

Met Lys Gly Leu Phe Ser Ala Ala Ala Leu Ser Leu Ala Val Gly Gln

305 310 315 320

Ala Ser Ala His Tyr Ile Phe Gln Gln Leu Ser Ile Asn Gly Asn Gln

325 330 335

Phe Pro Val Tyr Gln Tyr Ile Arg Lys Asn Thr Asn Tyr Asn Ser Pro

340 345 350

Val Thr Asp Leu Thr Ser Asp Asp Leu Arg Cys Asn Val Gly Ala Gln

355 360 365

Gly Ala Gly Thr Asp Thr Val Thr Val Lys Ala Gly Asp Gln Phe Thr

370 375 380

Phe Thr Leu Asp Thr Pro Val Tyr His Gln Gly Pro Ile Ser Ile Tyr

385 390 395 400

Met Ser Lys Ala Pro Gly Ala Ala Ser Asp Tyr Asp Gly Ser Gly Gly

405 410 415

Trp Phe Lys Ile Lys Asp Trp Gly Pro Thr Phe Asn Ala Asp Gly Thr

420 425 430

Ala Thr Trp Asp Met Ala Gly Ser Tyr Thr Tyr Asn Ile Pro Thr Cys

435 440 445

Ile Pro Asp Gly Asp Tyr Leu Leu Arg Ile Gln Ser Leu Ala Ile His

450 455 460

Asn Pro Trp Pro Ala Gly Ile Pro Gln Phe Tyr Ile Ser Cys Ala Gln

465 470 475 480

Ile Thr Val Thr Gly Gly Gly Asn Gly Asn Pro Gly Pro Thr Ala Leu

485 490 495

Ile Pro Gly Ala Phe Lys Asp Thr Asp Pro Gly Tyr Thr Val Asn Ile

500 505 510

Tyr Thr Asn Phe His Asn Tyr Thr Val Pro Gly Pro Glu Val Phe Ser

515 520 525

Cys Asn Gly Gly Gly Ser Asn Pro Pro Pro Pro Val Ser Ser Ser Thr

530 535 540

Pro Ala Thr Thr Thr Leu Val Thr Ser Thr Arg Thr Thr Ser Ser Thr

545 550 555 560

Ser Ser Ala Ser Thr Pro Ala Ser Thr Gly Gly Cys Thr Val Ala Lys

565 570 575

Trp Gly Gln Cys Gly Gly Asn Gly Tyr Thr Gly Cys Thr Thr Cys Ala

580 585 590

Ala Gly Ser Thr Cys Ser Lys Gln Asn Asp Tyr Tyr Ser Gln Cys Leu

595 600 605

<210>21

<211>799

<212>DNA

<213>橙色嗜热子囊菌(Thermoascus aurantiacus)

<400>21

atgtcctttt ccaagataat tgctactgcc ggcgttcttg cctctgcttc tctagtggct 60

ggccatggct tcgttcagaa catcgtgatt gatggtaaaa agtatgtcat tgcaagacgc 120

acataagcgg caacagctga caatcgacag ttatggcggg tatctagtga accagtatcc 180

atacatgtcc aatcctccag aggtcatcgc ctggtctact acggcaactg atcttggatt 240

tgtggacggt actggatacc aaaccccaga tatcatctgc cataggggcg ccaagcctgg 300

agccctgact gctccagtct ctccaggagg aactgttgag cttcaatgga ctccatggcc 360

tgattctcac catggcccag ttatcaacta ccttgctccg tgcaatggtg attgttccac 420

tgtggataag acccaattag aattcttcaa aattgccgag agcggtctca tcaatgatga 480

caatcctcct gggatctggg cttcagacaa tctgatagca gccaacaaca gctggactgt 540

caccattcca accacaattg cacctggaaa ctatgttctg aggcatgaga ttattgctct 600

tcactcagct cagaaccagg atggtgccca gaactatccc cagtgcatca atctgcaggt 660

cactggaggt ggttctgata accctgctgg aactcttgga acggcactct accacgatac 720

cgatcctgga attctgatca acatctatca gaaactttcc agctatatca tccctggtcc 780

tcctctgtat actggtt aa 799

<210>22

<211>250

<212>PRT

<213>橙色嗜热子囊菌

<400>22

Met Ser Phe Ser Lys Ile Ile Ala Thr Ala Gly Val Leu Ala Ser Ala

1 5 10 15

Ser Leu Val Ala Gly His Gly Phe Val Gln Asn Ile Val Ile Asp Gly

20 25 30

Lys Lys Tyr Tyr Gly Gly Tyr Leu Val Asn Gln Tyr Pro Tyr Met Ser

35 40 45

Asn Pro Pro Glu Val Ile Ala Trp Ser Thr Thr Ala Thr Asp Leu Gly

50 55 60

Phe Val Asp Gly Thr Gly Tyr Gln Thr Pro Asp Ile Ile Cys His Arg

65 70 75 80

Gly Ala Lys Pro Gly Ala Leu Thr Ala Pro Val Ser Pro Gly Gly Thr

85 90 95

Val Glu Leu Gln Trp Thr Pro Trp Pro Asp Ser His His Gly Pro Val

100 105 110

Ile Asn Tyr Leu Ala Pro Cys Asn Gly Asp Cys Ser Thr Val Asp Lys

115 120 125

Thr Gln Leu Glu Phe Phe Lys Ile Ala Glu Ser Gly Leu Ile Asn Asp

130 135 140

Asp Asn Pro Pro Gly Ile Trp Ala Ser Asp Asn Leu Ile Ala Ala Asn

145 150 155 160

Asn Ser Trp Thr Val Thr Ile Pro Thr Thr Ile Ala Pro Gly Asn Tyr

165 170 175

Val Leu Arg His Glu Ile Ile Ala Leu His Ser Ala Gln Asn Gln Asp

180 185 190

Gly Ala Gln Asn Tyr Pro Gln Cys Ile Asn Leu Gln Val Thr Gly Gly

195 200 205

Gly Ser Asp Asn Pro Ala Gly Thr Leu Gly Thr Ala Leu Tyr His Asp

210 215 220

Thr Asp Pro Gly Ile Leu Ile Asn Ile Tyr Gln Lys Leu Ser Ser Tyr

225 230 235 240

Ile Ile Pro Gly Pro Pro Leu Tyr Thr Gly

245 250

<210>23

<211>1172

<212>DNA

<213>里氏木霉(Trichoderma reesei)

<400>23

ggatctaagc cccatcgata tgaagtcctg cgccattctt gcagcccttg gctgtcttgc 60

cgggagcgtt ctcggccatg gacaagtcca aaacttcacg atcaatggac aatacaatca 120

gggtttcatt ctcgattact actatcagaa gcagaatact ggtcacttcc ccaacgttgc 180

tggctggtac gccgaggacc tagacctggg cttcatctcc cctgaccaat acaccacgcc 240

cgacattgtc tgtcacaaga acgcggcccc aggtgccatt tctgccactg cagcggccgg 300

cagcaacatc gtcttccaat ggggccctgg cgtctggcct cacccctacg gtcccatcgt 360

tacctacgtg gctgagtgca gcggatcgtg cacgaccgtg aacaagaaca acctgcgctg 420

ggtcaagatt caggaggccg gcatcaacta taacacccaa gtctgggcgc agcaggatct 480

gatcaaccag ggcaacaagt ggactgtgaa gatcccgtcg agcctcaggc ccggaaacta 540

tgtcttccgc catgaacttc ttgctgccca tggtgcctct agtgcgaacg gcatgcagaa 600

ctatcctcag tgcgtgaaca tcgccgtcac aggctcgggc acgaaagcgc tccctgccgg 660

aactcctgca actcagctct acaagcccac tgaccctggc atcttgttca acccttacac 720

aacaatcacg agctacacca tccctggccc agccctgtgg caaggctaga tccaggggta 780

cggtgttggc gttcgtgaag tcggagctgt tgacaaggat atctgatgat gaacggagag 840

gactgatggg cgtgactgag tgtatatatt tttgatgacc aaattgtata cgaaatccga 900

acgcatggtg atcattgttt atccctgtag tatattgtct ccaggctgct aagagcccac 960

cgggtgtatt acggcaacaa agtcaggaat ttgggtggca atgaacgcag gtctccatga 1020

atgtatatgt gaagaggcat cggctggcat gggcattacc agatataggc cctgtgaaac 1080

atatagtact tgaacgtgct actggaacgg atcataagca agtcatcaac atgtgaaaaa 1140

acactacatg taaaaaaaaa aaaaaaaaaa aa 1172

<210>24

<211>249

<212>PRT

<213>里氏木霉

<400>24

Met Lys Ser Cys Ala Ile Leu Ala Ala Leu Gly Cys Leu Ala Gly Ser

1 5 10 15

Val Leu Gly His Gly Gln Val Gln Asn Phe Thr Ile Asn Gly Gln Tyr

20 25 30

Asn Gln Gly Phe Ile Leu Asp Tyr Tyr Tyr Gln Lys Gln Asn Thr Gly

35 40 45

His Phe Pro Asn Val Ala Gly Trp Tyr Ala Glu Asp Leu Asp Leu Gly

50 55 60

Phe Ile Ser Pro Asp Gln Tyr Thr Thr Pro Asp Ile Val Cys His Lys

65 70 75 80

Asn Ala Ala Pro Gly Ala Ile Ser Ala Thr Ala Ala Ala Gly Ser Asn

85 90 95

Ile Val Phe Gln Trp Gly Pro Gly Val Trp Pro His Pro Tyr Gly Pro

100 105 110

Ile Val Thr Tyr Val Val Glu Cys Ser Gly Ser Cys Thr Thr Val Asn

115 120 125

Lys Asn Asn Leu Arg Trp Val Lys Ile Gln Glu Ala Gly Ile Asn Tyr

130 135 140

Asn Thr Gln Val Trp Ala Gln Gln Asp Leu Ile Asn Gln Gly Asn Lys

145 150 155 160

Trp Thr Val Lys Ile Pro Ser Ser Leu Arg Pro Gly Asn Tyr Val Phe

165 170 175

Arg His Glu Leu Leu Ala Ala His Gly Ala Ser Ser Ala Asn Gly Met

180 185 190

Gln Asn Tyr Pro Gln Cys Val Asn Ile Ala Val Thr Gly Ser Gly Thr

195 200 205

Lys Ala Leu Pro Ala Gly Thr Pro Ala Thr Gln Leu Tyr Lys Pro Thr

210 215 220

Asp Pro Gly Ile Leu Phe Asn Pro Tyr Thr Thr Ile Thr Ser Tyr Thr

225 230 235 240

Ile Pro Gly Pro Ala Leu Trp Gln Gly

245

<210>25

<211>2771

<212>DNA

<213>米曲霉(Aspergillus oryzae)

<400>25

ctgttctgct ggttacctgc cacgttatca tgaagcttgg ttggatcgag gtggccgcat 60

tggcggctgc ctcagtagtc agtgccaagg atgatctcgc gtactcccct cctttctacc 120

cttccccatg ggcagatggt cagggtgaat gggcggaagt atacaaacgc gctgtagaca 180

tagtttccca gatgacgttg acagagaaag tcaacttaac gactggaaca ggatggcaac 240

tagagaggtg tgttggacaa actggcagtg ttcccagact caacatcccc agcttgtgtt 300

tgcaggatag tcctcttggt attcgtttct cggactacaa ttcagctttc cctgcgggtg 360

ttaatgtcgc tgccacctgg gacaagacgc tcgcctacct tcgtggtcag gcaatgggtg 420

aggagttcag tgataagggt attgacgttc agctgggtcc tgctgctggc cctctcggtg 480

ctcatccgga tggcggtaga aactgggaag gtttctcacc agatccagcc ctcaccggtg 540

tactttttgc ggagacgatt aagggtattc aagatgctgg tgtcattgcg acagctaagc 600

attatatcat gaacgaacaa gagcatttcc gccaacaacc cgaggctgcg ggttacggat 660

tcaacgtaag cgacagtttg agttccaacg ttgatgacaa gactatgcat gaattgtacc 720

tctggccctt cgcggatgca gtacgcgctg gagtcggtgc tgtcatgtgc tcttacaacc 780

aaatcaacaa cagctacggt tgcgagaata gcgaaactct gaacaagctt ttgaaggcgg 840

agcttggttt ccaaggcttc gtcatgagtg attggaccgc tcatcacagc ggcgtaggcg 900

ctgctttagc aggtctggat atgtcgatgc ccggtgatgt taccttcgat agtggtacgt 960

ctttctgggg tgcaaacttg acggtcggtg tccttaacgg tacaatcccc caatggcgtg 1020

ttgatgacat ggctgtccgt atcatggccg cttattacaa ggttggccgc gacaccaaat 1080

acacccctcc caacttcagc tcgtggacca gggacgaata tggtttcgcg cataaccatg 1140

tttcggaagg tgcttacgag agggtcaacg aattcgtgga cgtgcaacgc gatcatgccg 1200

acctaatccg tcgcatcggc gcgcagagca ctgttctgct gaagaacaag ggtgccttgc 1260

ccttgagccg caaggaaaag ctggtcgccc ttctgggaga ggatgcgggt tccaactcgt 1320

ggggcgctaa cggctgtgat gaccgtggtt gcgataacgg tacccttgcc atggcctggg 1380

gtagcggtac tgcgaatttc ccatacctcg tgacaccaga gcaggcgatt cagaacgaag 1440

ttcttcaggg ccgtggtaat gtcttcgccg tgaccgacag ttgggcgctc gacaagatcg 1500

ctgcggctgc ccgccaggcc agcgtatctc tcgtgttcgt caactccgac tcaggagaaa 1560

gctatcttag tgtggatgga aatgagggcg atcgtaacaa catcactctg tggaagaacg 1620

gcgacaatgt ggtcaagacc gcagcgaata actgtaacaa caccgtggtc atcatccact 1680

ccgtcggacc agttttgatc gatgaatggt atgaccaccc caatgtcact ggtattctct 1740

gggctggtct gccaggccag gagtctggta actccatcgc cgatgtgctg tacggtcgtg 1800

tcaaccctgg cgccaagtct cctttcactt ggggcaagac ccgggagtcg tatggttctc 1860

ccttggtcaa ggatgccaac aatggcaacg gagcgcccca gtctgatttc acccagggtg 1920

ttttcatcga ttaccgccat ttcgataagt tcaatgagac ccctatctac gagtttggct 1980

acggcttgag ctacaccacc ttcgagctct ccgacctcca tgttcagccc ctgaacgcgt 2040

cccgatacac tcccaccagt ggcatgactg aagctgcaaa gaactttggt gaaattggcg 2100

atgcgtcgga gtacgtgtat ccggaggggc tggaaaggat ccatgagttt atctatccct 2160

ggatcaactc taccgacctg aaggcatcgt ctgacgattc taactacggc tgggaagact 2220

ccaagtatat tcccgaaggc gccacggatg ggtctgccca gccccgtttg cccgctagtg 2280

gtggtgccgg aggaaacccc ggtctgtacg aggatctttt ccgcgtctct gtgaaggtca 2340

agaacacggg caatgtcgcc ggtgatgaag ttcctcagct gtacgtttcc ctaggcggcc 2400

cgaatgagcc caaggtggta ctgcgcaagt ttgagcgtat tcacttggcc ccttcgcagg 2460

aggccgtgtg gacaacgacc cttacccgtc gtgaccttgc aaactgggac gtttcggctc 2520

aggactggac cgtcactcct taccccaaga cgatctacgt tggaaactcc tcacggaaac 2580

tgccgctcca ggcctcgctg cctaaggccc agtaaggggc aagtcctgat tgtacagagc 2640

atttcgagat ttatgatgta catgtttatg aatgacctag ggtagggtaa tacttagtag 2700

ggttagttct aattcttgga gtcaagtatt gactcactgg gccgataaaa aaaaaaaaaa 2760

aaaaaaaaaa a 2771

<210>26

<211>861

<212>PRT

<213>米曲霉

<400>26

Met Lys Leu Gly Trp Ile Glu Val Ala Ala Leu Ala Ala Ala Ser Val

1 5 10 15

Val Ser Ala Lys Asp Asp Leu Ala Tyr Ser Pro Pro Phe Tyr Pro Ser

20 25 30

Pro Trp Ala Asp Gly Gln Gly Glu Trp Ala Glu Val Tyr Lys Arg Ala

35 40 45

Val Asp Ile Val Ser Gln Met Thr Leu Thr Glu Lys Val Asn Leu Thr

50 55 60

Thr Gly Thr Gly Trp Gln Leu Glu Arg Cys Val Gly Gln Thr Gly Ser

65 70 75 80

Val Pro Arg Leu Asn Ile Pro Ser Leu Cys Leu Gln Asp Ser Pro Leu

85 90 95

Gly Ile Arg Phe Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Val Asn

100 105 110

Val Ala Ala Thr Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Gln Ala

115 120 125

Met Gly Glu Glu Phe Ser Asp Lys Gly Ile Asp Val Gln Leu Gly Pro

130 135 140

Ala Ala Gly Pro Leu Gly Ala His Pro Asp Gly Gly Arg Asn Trp Glu

145 150 155 160

Gly Phe Ser Pro Asp Pro Ala Leu Thr Gly Val Leu Phe Ala Glu Thr

165 170 175

Ile Lys Gly Ile Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr

180 185 190

Ile Met Asn Glu Gln Glu His Phe Arg Gln Gln Pro Glu Ala Ala Gly

195 200 205

Tyr Gly Phe Asn Val Ser Asp Ser Leu Ser Ser Asn Val Asp Asp Lys

210 215 220

Thr Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala

225 230 235 240

Gly Val Gly Ala Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr

245 250 255

Gly Cys Glu Asn Ser Glu Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu

260 265 270

Gly Phe Gln Gly Phe Val Met Ser Asp Trp Thr Ala His His Ser Gly

275 280 285

Val Gly Ala Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Val

290 295 300

Thr Phe Asp Ser Gly Thr Ser Phe Trp Gly Ala Asn Leu Thr Val Gly

305 310 315 320

Val Leu Asn Gly Thr Ile Pro Gln Trp Arg Val Asp Asp Met Ala Val

325 330 335

Arg Ile Met Ala Ala Tyr Tyr Lys Val Gly Arg Asp Thr Lys Tyr Thr

340 345 350

Pro Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Phe Ala His

355 360 365

Asn His Val Ser Glu Gly Ala Tyr Glu Arg Val Asn Glu Phe Val Asp

370 375 380

Val Gln Arg Asp His Ala Asp Leu Ile Arg Arg Ile Gly Ala Gln Ser

385 390 395 400

Thr Val Leu Leu Lys Asn Lys Gly Ala Leu Pro Leu Ser Arg Lys Glu

405 410 415

Lys Leu Val Ala Leu Leu Gly Glu Asp Ala Gly Ser Asn Ser Trp Gly

420 425 430

Ala Asn Gly Cys Asp Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met

435 440 445

Ala Trp Gly Ser Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu

450 455 460

Gln Ala Ile Gln Asn Glu Val Leu Gln Gly Arg Gly Asn Val Phe Ala

465 470 475 480

Val Thr Asp Ser Trp Ala Leu Asp Lys Ile Ala Ala Ala Ala Arg Gln

485 490 495

Ala Ser Val Ser Leu Val Phe Val Asn Ser Asp Ser Gly Glu Ser Tyr

500 505 510

Leu Ser Val Asp Gly Asn Glu Gly Asp Arg Asn Asn Ile Thr Leu Trp

515 520 525

Lys Asn Gly Asp Asn Val Val Lys Thr Ala Ala Asn Asn Cys Asn Asn

530 535 540

Thr Val Val Ile Ile His Ser Val Gly Pro Val Leu Ile Asp Glu Trp

545 550 555 560

Tyr Asp His Pro Asn Val Thr Gly Ile Leu Trp Ala Gly Leu Pro Gly

565 570 575

Gln Glu Ser Gly Asn Ser Ile Ala Asp Val Leu Tyr Gly Arg Val Asn

580 585 590

Pro Gly Ala Lys Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr

595 600 605

Gly Ser Pro Leu Val Lys Asp Ala Asn Asn Gly Asn Gly Ala Pro Gln

610 615 620

Ser Asp Phe Thr Gln Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys

625 630 635 640

Phe Asn Glu Thr Pro Ile Tyr Glu Phe Gly Tyr Gly Leu Ser Tyr Thr

645 650 655

Thr Phe Glu Leu Ser Asp Leu His Val Gln Pro Leu Asn Ala Ser Arg

660 665 670

Tyr Thr Pro Thr Ser Gly Met Thr Glu Ala Ala Lys Asn Phe Gly Glu

675 680 685

Ile Gly Asp Ala Ser Glu Tyr Val Tyr Pro Glu Gly Leu Glu Arg Ile

690 695 700

His Glu Phe Ile Tyr Pro Trp Ile Asn Ser Thr Asp Leu Lys Ala Ser

705 710 715 720

Ser Asp Asp Ser Asn Tyr Gly Trp Glu Asp Ser Lys Tyr Ile Pro Glu

725 730 735

Gly Ala Thr Asp Gly Ser Ala Gln Pro Arg Leu Pro Ala Ser Gly Gly

740 745 750

Ala Gly Gly Asn Pro Gly Leu Tyr Glu Asp Leu Phe Arg Val Ser Val

755 760 765

Lrs Val Lys Asn Thr Gly Asn Val Ala Gly Asp Glu Val Pro Gln Leu

770 775 780

Tyr Val Ser Leu Gly Gly Pro Asn Glu Pro Lys Val Val Leu Arg Lys

785 790 795 800

Phe Glu Arg Ile His Leu Ala Pro Ser Gln Glu Ala Val Trp Thr Thr

805 810 815

Th rLeu Thr Arg Arg Asp Leu Ala Asn Trp Asp Val Ser Ala Gln Asp

820 825 830

Trp Thr Val Thr Pro Tyr Pro Lys Thr Ile Tyr Val Gly Asn Ser Ser

835 840 845

Arg Lys Leu Pro Leu Gln Ala Ser Leu Pro Lys Ala Gln

850 855 860

<210>27

<211>3060

<212>DNA

<213>烟曲霉(Aspergillus fumigatus)

<400>27

atgagattcg gttggctcga ggtggccgct ctgacggccg cttctgtagc caatgcccag 60

gtttgtgatg ctttcccgtc attgtttcgg atatagttga caatagtcat ggaaataatc 120

aggaattggc tttctctcca ccattctacc cttcgccttg ggctgatggc cagggagagt 180

gggcagatgc ccatcgacgc gccgtcgaga tcgtttctca gatgacactg gcggagaagg 240

ttaaccttac aacgggtact gggtgggttg cgactttttt gttgacagtg agctttcttc 300

actgaccatc tacacagatg ggaaatggac cgatgcgtcg gtcaaaccgg cagcgttccc 360

aggtaagctt gcaattctgc aacaacgtgc aagtgtagtt gctaaaacgc ggtggtgcag 420

acttggtatc aactggggtc tttgtggcca ggattcccct ttgggtatcc gtttctgtga 480

gctatacccg cggagtcttt cagtccttgt attatgtgct gatgattgtc tctgtatagc 540

tgacctcaac tccgccttcc ctgctggtac taatgtcgcc gcgacatggg acaagacact 600

cgcctacctt cgtggcaagg ccatgggtga ggaattcaac gacaagggcg tggacatttt 660

gctggggcct gctgctggtc ctctcggcaa atacccggac ggcggcagaa tctgggaagg 720

cttctctcct gatccggttc tcactggtgt acttttcgcc gaaactatca agggtatcca 780

agacgcgggt gtgattgcta ctgccaagca ttacattctg aatgaacagg agcatttccg 840

acaggttggc gaggcccagg gatatggtta caacatcacg gagacgatca gctccaacgt 900

ggatgacaag accatgcacg agttgtacct ttggtgagta gttgacactg caaatgagga 960

ccttgattga tttgactgac ctggaatgca ggccctttgc agatgctgtg cgcggtaaga 1020

ttttccgtag acttgacctc gcgacgaaga aatcgctgac gaaccatcgt agctggcgtt 1080

ggcgctgtca tgtgttccta caatcaaatc aacaacagct acggttgtca aaacagtcaa 1140

actctcaaca agctcctcaa ggctgagctg ggcttccaag gcttcgtcat gagtgactgg 1200

agcgctcacc acagcggtgt cggcgctgcc ctcgctgggt tggatatgtc gatgcctgga 1260

gacatttcct tcgacgacgg actctccttc tggggcacga acctaactgt cagtgttctt 1320

aacggcaccg ttccagcctg gcgtgtcgat gacatggctg ttcgtatcat gaccgcgtac 1380

tacaaggttg gtcgtgaccg tcttcgtatt ccccctaact tcagctcctg gacccgggat 1440

gagtacggct gggagcattc tgctgtctcc gagggagcct ggaccaaggt gaacgacttc 1500

gtcaatgtgc agcgcagtca ctctcagatc atccgtgaga ttggtgccgc tagtacagtg 1560

ctcttgaaga acacgggtgc tcttcctttg accggcaagg aggttaaagt gggtgttctc 1620

ggtgaagacg ctggttccaa cccgtggggt gctaacggct gccccgaccg cggctgtgat 1680

aacggcactc ttgctatggc ctggggtagt ggtactgcca acttccctta ccttgtcacc 1740

cccgagcagg ctatccagcg agaggtcatc agcaacggcg gcaatgtctt tgctgtgact 1800

gataacgggg ctctcagcca gatggcagat gttgcatctc aatccaggtg agtgcgggct 1860

cttagaaaaa gaacgttctc tgaatgaagt tttttaacca ttgcgaacag cgtgtctttg 1920

gtgtttgtca acgccgactc tggagagggt ttcatcagtg tcgacggcaa cgagggtgac 1980

cgcaaaaatc tcactctgtg gaagaacggc gaggccgtca ttgacactgt tgtcagccac 2040

tgcaacaaca cgattgtggt tattcacagt gttgggcccg tcttgatcga ccggtggtat 2100

gataacccca acgtcactgc catcatctgg gccggcttgc ccggtcagga gagtggcaac 2160

tccctggtcg acgtgctcta tggccgcgtc aaccccagcg ccaagacccc gttcacctgg 2220

ggcaagactc gggagtctta cggggctccc ttgctcaccg agcctaacaa tggcaatggt 2280

gctccccagg atgatttcaa cgagggcgtc ttcattgact accgtcactt tgacaagcgc 2340

aatgagaccc ccatttatga gtttggccat ggcttgagct acaccacctt tggttactct 2400

caccttcggg ttcaggccct caatagttcg agttcggcat atgtcccgac tagcggagag 2460

accaagcctg cgccaaccta tggtgagatc ggtagtgccg ccgactacct gtatcccgag 2520

ggtctcaaaa gaattaccaa gtttatttac ccttggctca actcgaccga cctcgaggat 2580

tcttctgacg acccgaacta cggctgggag gactcggagt acattcccga aggcgctagg 2640

gatgggtctc ctcaacccct cctgaaggct ggcggcgctc ctggtggtaa ccctaccctt 2700

tatcaggatc ttgttagggt gtcggccacc ataaccaaca ctggtaacgt cgccggttat 2760

gaagtccctc aattggtgag tgacccgcat gttccttgcg ttgcaatttg gctaactcgc 2820

ttctagtatg tttcactggg cggaccgaac gagcctcggg tcgttctgcg caagttcgac 2880

cgaatcttcc tggctcctgg ggagcaaaag gtttggacca cgactcttaa ccgtcgtgat 2940

ctcgccaatt gggatgtgga ggctcaggac tgggtcatca caaagtaccc caagaaagtg 3000

cacgtcggca gctcctcgcg taagctgcct ctgagagcgc ctctgccccg tgtctactag 3060

<210>28

<211>863

<212>PRT

<213>烟曲霉

<400>28

Met Arg Phe Gly Trp Leu Glu Val Ala Ala Leu Thr Ala Ala Ser Val

1 5 10 15

Ala Asn Ala Gln Glu Leu Ala Phe Ser Pro Pro Phe Tyr Pro Ser Pro

20 25 30

Trp Ala Asp Gly Gln Gly Glu Trp Ala Asp Ala His Arg Arg Ala Val

35 40 45

Glu Ile Val Ser Gln Met Thr Leu Ala Glu Lys Val Asn Leu Thr Thr

50 55 60

Gly Thr Gly Trp Glu Met Asp Arg Cys Val Gly Gln Thr Gly Ser Val

65 70 75 80

Pro Arg Leu Gly Ile Asn Trp Gly Leu Cys Gly Gln Asp Ser Pro Leu

85 90 95

Gly Ile Arg Phe Ser Asp Leu Asn Ser Ala Phe Pro Ala Gly Thr Asn

100 105 110

Val Ala Ala Thr Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Lys Ala

115 120 125

Met Gly Glu Glu Phe Asn Asp Lys Gly Val Asp Ile Leu Leu Gly Pro

130 135 140

Ala Ala Gly Pro Leu Gly Lys Tyr Pro Asp Gly Gly Arg Ile Trp Glu

145 150 155 160

Gly Phe Ser Pro Asp Pro Val Leu Thr Gly Val Leu Phe Ala Glu Thr

165 170 175

Ile Lys Gly Ile Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr

180 185 190

Ile Leu Asn Glu Gln Glu His Phe Arg Gln Val Gly Glu Ala Gln Gly

195 200 205

Tyr Gly Tyr Asn Ile Thr Glu Thr Ile Ser Ser Asn Val Asp Asp Lys

210 215 220

Thr Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala

225 230 235 240

Gly Val Gly Ala Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr

245 250 255

Gly Cys Gln Asn Ser Gln Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu

260 265 270

Gly Phe Gln Gly Phe Val Met Ser Asp Trp Ser Ala His His Ser Gly

275 280 285

Val Gly Ala Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Ile

290 295 300

Ser Phe Asp Asp Gly Leu Ser Phe Trp Gly Thr Asn Leu Thr Val Ser

305 310 315 320

Val Leu Asn Gly Thr Val Pro Ala Trp Arg Val Asp Asp Met Ala Val

325 330 335

Arg Ile Met Thr Ala Tyr Tyr Lys Val Gly Arg Asp Arg Leu Arg Ile

340 345 350

Pro Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Trp Glu His

355 360 365

Ser Ala Val Se rGlu Gly Ala Trp Thr Lys Val Asn Asp Phe Val Asn

370 375 380

Val Gln Arg Ser His Ser Gln Ile Ile Arg Glu Ile Gly Ala Ala Ser

385 390 395 400

Thr Val Leu Leu Lys Asn Thr Gly Ala Leu Pro Leu Thr Gly Lys Glu

405 410 415

Val Lys Val Gly Val Leu Gly Glu Asp Ala Gly Ser Asn Pro Trp Gly

420 425 430

Ala Asn Gly Cys Pro Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met

435 440 445

Ala Trp Gly Ser Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu

450 455 460

Gln Ala Ile Gln Arg Glu Val Ile Ser Asn Gly Gly Asn Val Phe Ala

4654 70 475 480

Val Thr Asp Asn Gly Ala Leu Ser Gln Met Ala Asp Val Ala Ser Gln

485 490 495

Ser Ser Val Ser Leu Val Phe Val Asn Ala Asp Ser Gly Glu Gly Phe

500 505 510

Ile Ser Val Asp Gly Asn Glu Gly Asp Arg Lys Asn Leu Thr Leu Trp

515 520 525

Lys Asn Gly Glu Ala Val Ile Asp Thr Val Val Ser His Cys Asn Asn

530 535 540

Thr Ile Val Val Ile His Ser Val Gly Pro Val Leu Ile Asp Arg Trp

545 550 555 560

Tyr Asp Asn Pro Asn Val Thr Ala Ile Ile Trp Ala Gly Leu Pro Gly

565 570 575

Gln Glu Ser Gly Asn Ser Leu Val Asp Val Leu Tyr Gly Arg Val Asn

580 585 590

Pro Ser Ala Lys Thr Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr

595 600 605

Gly Ala Pro Leu Leu Thr Glu Pro Asn Asn Gly Asn Gly Ala Pro Gln

610 615 620

Asp Asp Phe Asn Glu Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys

625 630 635 640

Arg Asn Glu Thr Pro Ile Tyr Glu Phe Gly His Gly Leu Ser Tyr Thr

645 650 655

Thr Phe Gly Tyr Ser His Leu Arg Val Gln Ala Leu Asn Ser Ser Ser

660 665 670

Ser Ala Tyr Val Pro Thr Ser Gly Glu Thr Lys Pro Ala Pro Thr Tyr

675 680 685

Gly Glu Tle Gly Ser Ala Ala Asp Tyr Leu Tyr Pro Glu Gly Leu Lys

690 695 700

Arg Ile Thr Lys Phe Ile Tyr Pro Trp Leu Asn Ser Thr Asp Leu Glu

705 710 715 720

Asp Ser Ser Asp Asp Pro Asn Tyr Gly Trp Glu Asp Ser Glu Tyr Ile

725 730 735

Pro Glu Gly Ala Arg Asp Gly Ser Pro Gln Pro Leu Leu Lys Ala Gly

740 745 750

Gly Ala Pro Gly Gly Asn Pro Thr Leu Tyr Gln Asp Leu Val Arg Val

755 760 765

Ser Ala Thr Ile Thr Asn Thr Gly Asn Val Ala Gly Tyr Glu Val Pro

770 775 780

Gln Leu Tyr Val Ser Leu Gly Gly Pro Asn Glu Pro Arg Val Val Leu

785 790 795 800

Arg Lys Phe Asp Arg Ile Phe Leu Ala Pro Gly Glu Gln Lys Val Trp

805 810 815

Thr Thr Thr Leu Asn Arg Arg Asp Leu Ala Asn Trp Asp Val Glu Ala

820 825 830

Gln Asp Trp Val Ile Thr Lys Tyr Pro Lys Lys Val His Val Gly Ser

835 840 845

Ser Ser Arg Lys Leu Pro Leu Arg Ala Pro Leu Pro Arg Val Tyr

850 855 860

<210>29

<211>2800

<212>DNA

<213>巴西青霉(Penieillium brasilianum)

<400>29

tgaaaatgca gggttctaca atctttctgg ctttcgcctc atgggcgagc caggttgctg 60

ccattgcgca gcccatacag aagcacgagg tttgttttat cttgctcatg gacgtgcttt 120

gacttgacta attgttttac atacagcccg gatttctgca cgggccccaa gccatagaat 180

cgttctcaga accgttctac ccgtcgccct ggatgaatcc tcacgccgag ggctgggagg 240

ccgcatatca gaaagctcaa gattttgtct cgcaactcac tatcttggag aaaataaatc 300

tgaccaccgg tgttgggtaa gtctctccga ctgcttctgg gtcacggtgc gacgagccac 360

tgactttttg aagctgggaa aatgggccgt gtgtaggaaa cactggatca attcctcgtc 420

tcggattcaa aggattttgt acccaggatt caccacaggg tgttcggttc gcagattatt 480

cctccgcttt cacatctagc caaatggccg ccgcaacatt tgaccgctca attctttatc 540

aacgaggcca agccatggca caggaacaca aggctaaggg tatcacaatt caattgggcc 600

ctgttgccgg ccctctcggt cgcatccccg agggcggccg caactgggaa ggattctccc 660

ctgatcctgt cttgactggt atagccatgg ctgagacaat taagggcatg caggatactg 720

gagtgattgc ttgcgctaaa cattatattg gaaacgagca ggagcacttc cgtcaagtgg 780

gtgaagctgc gggtcacgga tacactattt ccgatactat ttcatctaat attgacgacc 840

gtgctatgca tgagctatac ttgtggccat ttgctgatgc cgttcgcgct ggtgtgggtt 900

ctttcatgtg ctcatactct cagatcaaca actcctacgg atgccaaaac agtcagaccc 960

tcaacaagct cctcaagagc gaattgggct tccaaggctt tgtcatgagc gattggggtg 1020

cccatcactc tggagtgtca tcggcgctag ctggacttga tatgagcatg ccgggtgata 1080

ccgaatttga ttctggcttg agcttctggg gctctaacct caccattgca attctgaacg 1140

gcacggttcc cgaatggcgc ctggatgaca tggcgatgcg aattatggct gcatacttca 1200

aagttggcct tactattgag gatcaaccag atgtcaactt caatgcctgg acccatgaca 1260

cctacggata taaatacgct tatagcaagg aagattacga gcaggtcaac tggcatgtcg 1320

atgttcgcag cgaccacaat aagctcattc gcgagactgc cgcgaagggt acagttctgc 1380

tgaagaacaa ctttcatgct ctccctctga agcagcccag gttcgtggcc gtcgttggtc 1440

aggatgccgg gccaaacccc aagggcccta acggctgcgc agaccgagga tgcgaccaag 1500

gcactctcgc aatgggatgg ggctcagggt ctaccgaatt cccttacctg gtcactcctg 1560

acactgctat tcagtcaaag gtcctcgaat acgggggtcg atacgagagt atttttgata 1620

actatgacga caatgctatc ttgtcgcttg tctcacagcc tgatgcaacc tgtatcgttt 1680

ttgcaaatgc cgattccggt gaaggctaca tcactgtcga caacaactgg ggtgaccgca 1740

acaatctgac cctctggcaa aatgccgatc aagtgattag cactgtcagc tcgcgatgca 1800

acaacacaat cgttgttctc cactctgtcg gaccagtgtt gctaaatggt atatatgagc 1860

acccgaacat cacagctatt gtctgggcag ggatgccagg cgaagaatct ggcaatgctc 1920

tcgtggatat tctttggggc aatgttaacc ctgccggtcg cactccgttc acctgggcca 1980

aaagtcgaga ggactatggc actgatataa tgtacgagcc caacaacggc cagcgtgcgc 2040

ctcagcagga tttcaccgag agcatctacc tcgactaccg ccatttcgac aaagctggta 2100

tcgagccaat ttacgagttt ggattcggcc tctcctatac caccttcgaa tactctgacc 2160

tccgtgttgt gaagaagtat gttcaaccat acagtcccac gaccggcacc ggtgctcaag 2220

caccttccat cggacagcca cctagccaga acctggatac ctacaagttc cctgctacat 2280

acaagtacat caaaaccttc atttatccct acctgaacag cactgtctcc ctccgcgctg 2340

cttccaagga tcccgaatac ggtcgtacag actttatccc accccacgcg cgtgatggct 2400

cccctcaacc tctcaacccc gctggagacc cagtggccag tggtggaaac aacatgctct 2460

acgacgaact ttacgaggtc actgcacaga tcaaaaacac tggcgacgtg gccggcgacg 2520

aagtcgtcca gctttacgta gatctcgggg gtgacaaccc gcctcgtcag ttgagaaact 2580

ttgacaggtt ttatctgctg cccggtcaga gctcaacatt ccgggctaca ttgacgcgcc 2640

gtgatttgag caactgggat attgaggcgc agaactggcg agttacggaa tcgcctaaga 2700

gagtgtatgt tggacggtcg agtcgggatt tgccgctgag ctcacaattg gagtaatgat 2760

catgtctacc aatagatgtt gaatgtctgg tgtggatatt 2800

<210>30

<211>878

<212>PRT

<213>巴西青霉

<400>30

Met Gln Gly Ser Thr Ile Phe Leu Ala Phe Ala Ser Trp Ala Ser Gln

1 5 10 15

Val Ala Ala Ile Ala Gln Pro Ile Gln Lys His Glu Pro Gly Phe Leu

20 25 30

His Gly Pro Gln Ala Ile Glu Ser Phe Ser Glu Pro Phe Tyr Pro Ser

35 40 45

Pro Trp Met Asn Pro His Ala Glu Gly Trp Glu Ala Ala Tyr Gln Lys

50 55 60

Ala Gln Asp Phe Val Ser Gln Leu Thr Ile Leu Glu Lys Ile Asn Leu

65 70 75 80

Thr Thr Gly Val Gly Trp Glu Asn Gly Pro Cys Val Gly Asn Thr Gly

85 90 95

Ser Ile Pro Arg Leu Gly Phe Lys Gly Phe Cys Thr Gln Asp Ser Pro

100 105 110

Gln Gly Val Arg Phe Ala Asp Tyr Ser Ser Ala Phe Thr Ser Ser Gln

115 120 125

Met Ala Ala Ala Thr Phe Asp Arg Ser Ile Leu Tyr Gln Arg Gly Gln

130 135 140

Ala Met Ala Gln Glu His Lys Ala Lys Gly Ile Thr Ile Gln Leu Gly

145 150 155 160

Pro Val Ala Gly Pro Leu Gly Arg Ile Pro Glu Gly Gly Arg Asn Trp

165 170 175

Glu Gly Phe Ser Pro Asp Pro Val Leu Thr Gly Ile Ala Met Ala Glu

180 185 190

Thr Ile Lys Gly Met Gln Asp Thr Gly Val Ile Ala Cys Ala Lys His

195 200 205

Tyr Ile Gly Asn Glu Gln Glu His Phe Arg Gln Val Gly Glu Ala Ala

210 215 220

Gl y Hi s Gly TyrThr Ile Ser Asp ThrIle Ser Ser Asn Ile Asp Asp

225 230 235 240

Arg Ala Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg

245 250 255

Ala Gly Val Gly Ser Phe Met Cys Ser Tyr Ser Gln Ile Asn Asn Ser

260 265 270

Tyr Gly Cys Gln Asn Ser Gln Thr Leu Asn Lys Leu Leu Lys Ser Glu

275 280 285

Leu Gly Phe Gln Gly Phe Val Met Ser Asp Trp Gly Ala His His Ser

290 295 300

Gly Val Ser Ser Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp

305 310 315 320

Thr Glu Phe Asp Ser Gly Leu Ser Phe Trp Gly Ser Asn Leu Thr Ile

325 330 335

Ala Ile Leu Asn Gly Thr Val Pro Glu Trp Arg Leu Asp Asp Met Ala

340 345 350

Met Arg Ile Met Ala Ala Tyr Phe Lys Val Gly Leu Thr Ile Glu Asp

355 360 365

Gln Pro Asp Val Asn Phe Asn Ala Trp Thr His Asp Thr Tyr Gly Tyr

370 375 380

Lys Tyr Ala Tyr Ser Lys Glu Asp Tyr Glu Gln Val Asn Trp His Val

385 390 395 400

Asp Val Arg Ser Asp His Asn Lys Leu Ile Arg Glu Thr Ala Ala Lys

405 410 415

Gly Thr Val Leu Leu Lys Asn Asn Phe His Ala Leu Pro Leu Lys Gln

420 425 430

Pro Arg Phe Val Ala Val Val Gly Gln Asp Ala Gly Pro Asn Pro Lys

435 440 445

Gly Pro Asn Gly Cys Ala Asp Arg Gly Cys Asp Gln Gly Thr Leu Ala

450 455 460

Met Gly Trp Gly Ser Gly Ser Thr Glu Phe Pro Tyr Leu Val Thr Pro

465 470 475 480

Asp Thr Ala Ile Gln Ser Lys Val Leu Glu Tyr Gly Gly Arg Tyr Glu

485 490 495

Ser Ile Phe Asp Asn Tyr Asp Asp Asn Ala Ile Leu Ser Leu Val Ser

500 505 510

Gln Pro Asp Ala Thr Cys Ile Val Phe Ala Asn Ala Asp Ser Gly Glu

515 520 525

Gly Tyr Ile Thr Val Asp Asn Asn Trp Gly Asp Arg Asn Asn Leu Thr

530 535 540

Leu Trp Gln Asn Ala Asp Gln Val Ile Ser Thr Val Ser Ser Arg Cys

545 550 555 560

Asn Asn Thr Ile Val Val Leu His Ser Val Gly Pro Val Leu Leu Asn

565 570 575

Gly Ile Tyr Glu His Pro Asn Ile Thr Ala Ile Val Trp Ala Gly Met

580 585 590

Pro Gly Glu Glu Ser Gly Asn Ala Leu Val Asp Ile Leu Trp Gly Asn

595 600 605

Val Asn Pro Ala Gly Arg Thr Pro Phe Thr Trp Ala Lys Ser Arg Glu

610 615 620

Asp Tyr Gly Thr Asp Ile Met Tyr Glu Pro Asn Asn Gly Gln Arg Ala

625 630 635 640

Pro Gln Gln Asp Phe Thr Glu Ser Ile Tyr Leu Asp Tyr Arg His Phe

645 650 655

Asp Lys Ala Gly Ile Glu Pro Ile Tyr Glu Phe Gly Phe Gly Leu Ser

660 665 670

Tyr Thr Thr Phe Glu Tyr Ser Asp Leu Arg Val Val Lys Lys Tyr Val

675 680 685

Gln Pro Tyr Ser Pro Thr Thr Gly Thr Gly Ala Gln Ala Pro Ser Ile

690 695 700

Gly Gln Pro Pro Ser Gln Asn Leu Asp Thr Tyr Lys Phe Pro Ala Thr

705 710 715 720

Tyr Lys Tyr Ile Lys Thr Phe Ile Tyr Pro Tyr Leu Asn Ser Thr Val

725 730 735

Ser Leu Arg Ala Ala Ser Lys Asp Pro Glu Tyr Gly Arg Thr Asp Phe

740 745 750

Ile Pro Pro His Ala Arg Asp Gly Ser Pro Gln Pro Leu Asn Pro Ala

755 760 765

Gly Asp Pro Val Ala Ser Gly Gly Asn Asn Met Leu Tyr Asp Glu Leu

770 775 780

Tyr Glu Val Thr Ala Gln Ile Lys Asn Thr Gly Asp Val Ala Gly Asp

785 790 795 800

Glu Val Val Gln Leu Tyr Val Asp Leu Gly Gly Asp Asn Pro Pro Arg

805 810 815

Gln Leu Arg Asn Phe Asp Arg Phe Tyr Leu Leu Pro Gly Gln Ser Ser

820 825 830

Thr Phe Arg Ala Thr Leu Thr Arg Arg Asp Leu Ser Asn Trp Asp Ile

835 840 845

Glu Ala Gln Asn Trp Arg Val Thr Glu Ser Pro Lys Arg Val Tyr Val

850 855 860

Gly Arg Ser Ser Arg Asp Leu Pro Leu Ser Ser Gln Leu Glu

865 870 875

49

Claims

1.用于降解或转化含纤维素材料的方法，其包括：用有效量的纤维素分解酶组合物处理含纤维素材料，该纤维素分解酶组合物包含具有增强纤维素分解的活性的多肽和选自下组中的一种或多种(几种)组份：具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性和纤维素结合域的CEL7多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽；

其中所述具有内切葡聚糖酶活性的CEL7多肽选自下组：(a)多肽，其包含与SEQ ID NO：2的成熟多肽具有优选至少70％，更优选至少75％，甚至更优选至少80％，甚至更优选至少85％，甚至更优选至少90％，并且最优选至少95％序列同一性的氨基酸序列；(b)由多核苷酸编码的多肽，所述多核苷酸在优选至少中严紧条件，更优选至少中-高严紧条件，并且最优选至少高严紧条件下与以下杂交：(i)SEQ ID NO：1的成熟多肽编码序列，(ii)包含SEQ ID NO：1的成熟多肽编码序列的基因组DNA序列，或者(iii)(i)或(ii)的全长互补链；(c)多肽，其由包含与SEQ ID NO：1的成熟多肽编码序列具有优选至少70％，更优选至少75％，甚至更优选至少80％，甚至更优选至少85％，甚至更优选至少90％，并且最优选至少95％序列同一性的核苷酸序列的多核苷酸编码；和(d)变体，其包含取代、缺失和/或插入一个或多个(几个)氨基酸的SEQ ID NO：2的成熟多肽；

其中所述具有内切葡聚糖酶活性的CEL12多肽选自下组：(a)多肽，其包含与SEQ ID NO：4的成熟多肽具有优选至少70％，更优选至少75％，甚至更优选至少80％，甚至更优选至少85％，甚至更优选至少90％，并且最优选至少95％序列同一性的氨基酸序列；(b)由多核苷酸编码的多肽，所述多核苷酸在优选至少中严紧条件，更优选至少中-高严紧条件，并且最优选至少高严紧条件下与以下杂交：(i)SEQ ID NO：3的成熟多肽编码序列，(ii)包含SEQ ID NO：3的成熟多肽编码序列的基因组DNA序列，或者(iii)(i)或(ii)的全长互补链；(c)多肽，其由包含与SEQ ID NO：3的成熟多肽编码序列具有优选至少70％，更优选至少75％，甚至更优选至少80％，甚至更优选至少85％，甚至更优选至少90％，并且最优选至少95％序列同一性的核苷酸序列的多核苷酸编码；和(d)变体，其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQ ID NO：4的成熟多肽；

其中所述具有内切葡聚糖酶活性的CEL45多肽选自下组：(a)多肽，其包含与SEQ ID NO：6的成熟多肽具有优选至少70％，更优选至少75％，甚至更优选至少80％，甚至更优选至少85％，甚至更优选至少90％，并且最优选至少95％序列同一性的氨基酸序列；(b)由多核苷酸编码的多肽，所述多核苷酸在优选至少中严紧条件，更优选至少中-高严紧条件，并且最优选至少高严紧条件下与以下杂交：(i)SEQ ID NO：5的成熟多肽编码序列，(ii)包含在SEQ ID NO：5的成熟多肽编码序列中的cDNA序列，或者(iii)(i)或(ii)的全长互补链；(c)多肽，其由包含与SEQ ID NO：5的成熟多肽编码序列具有优选至少70％，更优选至少75％，甚至更优选至少80％，甚至更优选至少85％，甚至更优选至少90％，并且最优选至少95％序列同一性的核苷酸序列的多核苷酸编码；和(d)变体，其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQ ID NO：6的成熟多肽；

其中所述具有纤维二糖水解酶活性和纤维素结合域的CEL7多肽选自下组：(a)多肽，其包含与SEQ ID NO：8的成熟多肽具有优选至少70％，更优选至少75％，甚至更优选至少80％，甚至更优选至少85％，甚至更优选至少90％，并且最优选至少95％序列同一性的氨基酸序列；(b)由多核苷酸编码的多肽，所述多核苷酸在优选至少中严紧条件，更优选至少中-高严紧条件，并且最优选至少高严紧条件下与以下杂交：(i)SEQ ID NO：7的成熟多肽编码序列，(ii)包含在SEQ ID NO：7的成熟多肽编码序列中的cDNA序列，或者(iii)(i)或(ii)的全长互补链；(c)多肽，其由包含与SEQ ID NO：7的成熟多肽编码序列具有优选至少70％，更优选至少75％，甚至更优选至少80％，甚至更优选至少85％，甚至更优选至少90％，并且最优选至少95％序列同一性的核苷酸序列的多核苷酸编码；和(d)变体，其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQ ID NO：8的成熟多肽；

其中所述具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽选自下组：(a)多肽，其包含与SEQ ID NO：10的成熟多肽具有优选至少70％，更优选至少75％，甚至更优选至少80％，甚至更优选至少85％，甚至更优选至少90％，并且最优选至少95％序列同一性的氨基酸序列；(b)由多核苷酸编码的多肽，所述多核苷酸在优选至少中严紧条件，更优选至少中-高严紧条件，并且最优选至少高严紧条件下与以下杂交：(i)SEQ ID NO：9的成熟多肽编码序列，(ii)包含在SEQ ID NO：9的成熟多肽编码序列中的cDNA序列或包含SEQ ID NO：9的成熟多肽编码序列的基因组DNA序列，或者(iii)(i)或(ii)的全长互补链；(c)多肽，其由包含与SEQ ID NO：9的成熟多肽编码序列具有优选至少70％，更优选至少75％，甚至更优选至少80％，甚至更优选至少85％，甚至更优选至少90％，并且最优选至少95％序列同一性的核苷酸序列的多核苷酸编码；和(d)变体，其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQ ID NO：10的成熟多肽；并且

2.权利要求1的方法，其中所述具有内切葡聚糖酶活性的CEL7多肽包含或者其组成为SEQ ID NO：2的成熟多肽或其具有内切葡聚糖酶活性的片段，所述具有内切葡聚糖酶活性的CEL12多肽包含或者其组成为SEQ ID NO：4的成熟多肽或其具有内切葡聚糖酶活性的片段，所述具有内切葡聚糖酶活性的CEL45多肽包含或者其组成为SEQ ID NO：6的成熟多肽或其具有内切葡聚糖酶活性的片段，所述具有纤维二糖水解酶活性和纤维素结合域的CEL7多肽包含或者其组成为SEQ ID NO：8的成熟多肽或其具有纤维二糖水解酶活性的片段，以及具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽包含或其组成为SEQ ID NO：10的成熟多肽或其具有纤维二糖水解酶活性的片段。

3.权利要求1的方法，其中所述具有增强纤维素分解的活性的多肽选自下组：

(a)包含[ILMV]-P-X(4，5)-G-X-Y-[ILMV]-X-R-X-[EQ]-X(4)-[HNQ]和[FW]-[TF]-K-[AIV]的具有增强纤维素分解的活性的多肽，其中X是任何氨基酸，X(4，5)是在4或5个邻接位置上的任何氨基酸，并且X(4)是在4个邻接位置上的任何氨基酸；和

(b)包含[ILMV]-P-x(4，5)-G-x-Y-[ILMV]-x-R-x-[EQ]-x(3)-A-[HNQ]的具有增强纤维素分解的活性的多肽，其中x是任何氨基酸，x(4，5)是在4或5个邻接位置上的任何氨基酸，并且x(3)是在3个邻接位置上的任何氨基酸。

4.权利要求3的方法，其中所述包含[ILMV]-P-X(4，5)-G-X-Y-[ILMV]-X-R-X-[EQ]-X(4)-[HNQ]和[FW]-[TF]-K-[AIV]的具有增强纤维素分解的活性的多肽进一步包含：

H-X(1，2)-G-P-X(3)-[YW]-[AILMV]，

[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV]，或

H-X(1，2)-G-P-X(3)-[YW]-[AILMV]和

[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV]，

其中X是任何氨基酸，X(1，2)是在1个位置或2个邻接位置上的任何氨基酸，X(3)是在3个邻接位置上的任何氨基酸，并且X(2)是在2个邻接位置上的任何氨基酸。

5.权利要求1的方法，其中所述具有增强纤维素分解的活性的多肽选自下组：

(a)多肽，其包含与SEQ ID NO：12、SEQ ID NO：14、SEQ ID NO：16、SEQ ID NO：18或SEQ ID NO：20、SEQ ID NO：22或SEQ ID NO：24的成熟多肽具有优选至少70％，更优选至少75％，甚至更优选至少80％，甚至更优选至少85％，甚至更优选至少90％，并且最优选至少95％序列同一性的氨基酸序列；

(b)由多核苷酸编码的多肽，所述多核苷酸在优选至少中严紧条件，更优选至少中-高严紧条件，并且最优选至少高严紧条件下与以下杂交：(i)SEQIDNO：11、SEQ ID NO：13、SEQ ID NO：15、SEQ ID NO：17、SEQ ID NO：19、SEQ ID NO：21或SEQ ID NO：23的成熟多肽编码序列，(ii)包含在SEQ IDNO：11、SEQ ID NO：13、SEQ ID NO：15或SEQ ID NO：21的成熟多肽编码序列中的cDNA序列，或者包含SEQ ID NO：17、SEQ ID NO：19或SEQ IDNO：23的成熟多肽编码序列的基因组DNA序列，或者(iii)(i)或(ii)的全长互补链；

(c)多肽，其由包含与SEQ ID NO：11、SEQ ID NO：13、SEQ ID NO：15、SEQ ID NO：17、SEQ ID NO：19、SEQ ID NO：21或SEQ ID NO：23的成熟多肽编码序列具有优选至少70％，更优选至少75％，甚至更优选至少80％，甚至更优选至少85％，甚至更优选至少90％，并且最优选至少95％序列同一性的核苷酸序列的多核苷酸编码；和

(d)变体，其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQID NO：12、SEQ ID NO：14、SEQ ID NO：16、SEQ ID NO：18或SEQ ID NO：20、SEQ ID NO：22或SEQ ID NO：24的成熟多肽。

6.权利要求1的方法，其中所述具有增强纤维素分解的活性的多肽包含或其组成为SEQ ID NO：12、SEQ ID NO：14、SEQ ID NO：16、SEQ ID NO：18或SEQ ID NO：20、SEQ ID NO：22或SEQ ID NO：24的成熟多肽；或者其具有增强纤维素分解的活性的片段。

7.权利要求1的方法，其中所述具有增强纤维素分解的活性的多肽由多核苷酸编码，该多核苷酸包含在大肠杆菌NRRL B-30699中所含的质粒pEJG120中，在大肠杆菌NRRL B-30813中所含的质粒pTter61C中，在大肠杆菌NRRL B-30812中所含的质粒pTter61D中，在大肠杆菌NRRL B-30814中所含的质粒pTter61E中，在大肠杆菌NRRL B-30811中所含的质粒pTter61G中，在大肠杆菌NRRL B-30704中所含的质粒pDZA2-7中或者在大肠杆菌NRRL B-30878中所含的质粒pTr3337中。

8.权利要求1-7中任一项的方法，其中所述组合物进一步包含一种或多种(几种)具有β-葡糖苷酶活性的多肽。

9.权利要求1-8中任一项的方法，其中所述组合物进一步包含有效量的选自下组中的一种或多种(几种)酶：半纤维素酶、酯酶、蛋白酶、漆酶和过氧化物酶。

10.权利要求1-9中任一项的方法，其进一步包括回收降解或转化的含纤维素材料。

11.用于生产物质的方法，其包括：

(A)用有效量的纤维素分解酶组合物将含纤维素材料糖化，该纤维素分解酶组合物包含具有增强纤维素分解活性的多肽，和选自下组中一种或多种(几种)组分：具有内切葡聚糖酶活性的CEL7多肽、具有内切葡聚糖酶活性的CEL12多肽、具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽；

(C)回收发酵产物。

12.权利要求11的方法，其中所述具有内切葡聚糖酶活性的CEL7多肽包含或者其组成为SEQ ID NO：2的成熟多肽或其具有内切葡聚糖酶活性的片段，所述具有内切葡聚糖酶活性的CEL12多肽包含或者其组成为SEQ IDNO：4的成熟多肽或其具有内切葡聚糖酶活性的片段，所述具有内切葡聚糖酶活性的CEL45多肽包含或者其组成为SEQ ID NO：6的成熟多肽或其具有内切葡聚糖酶活性的片段，所述具有纤维二糖水解酶活性和纤维素结合域的CEL7多肽包含或者其组成为SEQ ID NO：8的成熟多肽或其具有纤维二糖水解酶活性的片段，以及具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽包含或其组成为SEQ ID NO：10的成熟多肽或其具有纤维二糖水解酶活性的片段。

13.权利要求11的方法，其中所述具有增强纤维素分解的活性的多肽选自下组：

(b)包含[ILMV]-P-x(4，5)-G-x-Y-[ILMV]-x-R-x-[EQ]-x(3)-A-[HNQ]，其中x是任何氨基酸，x(4，5)是在4或5个邻接位置上的任何氨基酸，并且x(3)是在3个邻接位置上的任何氨基酸。

14.权利要求13的方法，其中所述包含[ILMV]-P-X(4，5)-G-X-Y-[ILMV]-X-R-X-[EQ]-X(4)-[HNQ]和[FW]-[TF]-K-[AIV]的具有增强纤维素分解的活性的多肽进一步包含：

H-X(1，2)-G-P-X(3)-[YW]-[AILMV]，

[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV]，或

H-X(1，2)-G-P-X(3)-[YW]-[AILMV]和

[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV]，

15.权利要求11的方法，其中所述具有增强纤维素分解的活性的多肽选自下组：

(b)由多核苷酸编码的多肽，所述多核苷酸在优选至少中严紧条件，更优选至少中-高严紧条件，并且最优选至少高严紧条件下与以下杂交：(i)SEQID NO：11、SEQ ID NO：13、SEQ ID NO：15、SEQ ID NO：17、SEQ ID NO：19、SEQ ID NO：21或SEQ ID NO：23的成熟多肽编码序列，(ii)包含在SEQ IDNO：11、SEQ ID NO：13、SEQ ID NO：15或SEQ ID NO：21的成熟多肽编码序列中的cDNA序列，或者包含SEQ ID NO：17、SEQ ID NO：19或SEQ IDNO：23的成熟多肽编码序列的基因组DNA序列，或者(iii)(i)或(ii)的全长互补链；

16.权利要求11的方法，其中所述具有增强纤维素分解的活性的多肽包含或其组成为SEQ ID NO：12、SEQ ID NO：14、SEQ ID NO：16、SEQ ID NO：18或SEQ ID NO：20、SEQ ID NO：22或SEQ ID NO：24的成熟多肽；或者其具有增强纤维素分解的活性的片段。

17.权利要求11的方法，其中所述具有增强纤维素分解的活性的多肽由多核苷酸编码，该多核苷酸包含在大肠杆菌NRRL B-30699中所含的质粒pEJG120中，在大肠杆菌NRRL B-30813中所含的质粒pTter61C中，在大肠杆菌NRRL B-30812中所含的质粒pTter61D中，在大肠杆菌NRRL B-30814中所含的质粒pTter61E中，在大肠杆菌NRRLB-30811中所含的质粒pTter61G中，在大肠杆菌NRRLB-30704中所含的质粒pDZA2-7中或者在大肠杆菌NRRL B-30878中所含的质粒pTr3337中。

18.权利要求11-17中任一项的方法，其中所述组合物进一步包含一种或多种(几种)具有β-葡糖苷酶活性的多肽。

19.权利要求11-18中任一项的方法，其中所述组合物进一步包含有效量的选自下组中的一种或多种(几种)酶：半纤维素酶、酯酶、蛋白酶、漆酶和过氧化物酶。

20.权利要求11-19中任一项的方法，其中所述发酵产物为醇、有机酸、酮、醛、氨基酸或气体。

21.纤维素分解酶组合物，其包含有效量的具有增强纤维素分解的活性的多肽和选自下组中的一种或多种(几种)组分：具有内切葡聚糖酶活性的CEL7多肽、具有具有内切葡聚糖酶活性的CEL12多肽、具有具有内切葡聚糖酶活性的CEL45多肽、具有纤维二糖水解酶活性及纤维素结合域的CEL7多肽和具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽；

其中所述具有内切葡聚糖酶活性的CEL7多肽选自下组：(a)多肽，其包含与SEQ ID NO：2的成熟多肽具有至少70％，更优选至少75％，甚至更优选至少80％，甚至更优选至少85％，甚至更优选至少90％，并且最优选至少95％序列同一性的氨基酸序列；(b)由多核苷酸编码的多肽，所述多核苷酸在优选至少中严紧条件，更优选至少中-高严紧条件，并且最优选至少高严紧条件下与以下杂交：(i)SEQ ID NO：1的成熟多肽编码序列，(ii)包含SEQ ID NO：1的成熟多肽编码序列的基因组DNA序列，或者(iii)(i)或(ii)的全长互补链；(c)多肽，其由包含与SEQ ID NO：1的成熟多肽编码序列具有至少70％，更优选至少75％，甚至更优选至少80％，甚至更优选至少85％，甚至更优选至少90％，并且最优选至少95％序列同一性的核苷酸序列的多核苷酸编码；和(d)变体，其包含取代、缺失和/或插入一个或多个(几个)氨基酸的SEQ ID NO：2的成熟多肽；

其中所述具有内切葡聚糖酶活性的CEL12多肽选自下组：(a)多肽，其包含与SEQ ID NO：4的成熟多肽具有至少70％，更优选至少75％，甚至更优选至少80％，甚至更优选至少85％，甚至更优选至少90％，并且最优选至少95％序列同一性的氨基酸序列；(b)由多核苷酸编码的多肽，所述多核苷酸在优选至少中严紧条件，更优选至少中-高严紧条件，并且最优选至少高严紧条件下与以下杂交：(i)SEQ ID NO：3的成熟多肽编码序列，(ii)包含SEQID NO：3的成熟多肽编码序列的基因组DNA序列，或者(iii)(i)或(ii)的全长互补链；(c)多肽，其由包含与SEQ ID NO：3的成熟多肽编码序列具有至少70％，更优选至少75％，甚至更优选至少80％，甚至更优选至少85％，甚至更优选至少90％，并且最优选至少95％序列同一性的核苷酸序列的多核苷酸编码；和(d)变体，其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQ ID NO：4的成熟多肽；

其中所述具有内切葡聚糖酶活性的CEL45多肽选自下组：(a)多肽，其包含与SEQ ID NO：6的成熟多肽具有至少70％，更优选至少75％，甚至更优选至少80％，甚至更优选至少85％，甚至更优选至少90％，并且最优选至少95％序列同一性的氨基酸序列；(b)由多核苷酸编码的多肽，所述多核苷酸在优选至少中严紧条件，更优选至少中-高严紧条件，并且最优选至少高严紧条件下与以下杂交：(i)SEQ ID NO：5的成熟多肽编码序列，(ii)包含在SEQ ID NO：5的成熟多肽编码序列中的cDNA序列，或者(iii)(i)或(ii)的全长互补链；(c)多肽，其由包含与SEQ ID NO：5的成熟多肽编码序列具有至少70％，更优选至少75％，甚至更优选至少80％，甚至更优选至少85％，甚至更优选至少90％，并且最优选至少95％序列同一性的核苷酸序列的多核苷酸编码；和(d)变体，其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQ ID NO：6的成熟多肽；

其中所述具有纤维二糖水解酶活性和纤维素结合域的CEL7多肽选自下组：(a)多肽，其包含与SEQ ID NO：8的成熟多肽具有至少70％，更优选至少75％，甚至更优选至少80％，甚至更优选至少85％，甚至更优选至少90％，并且最优选至少95％序列同一性的氨基酸序列；(b)由多核苷酸编码的多肽，所述多核苷酸在优选至少中严紧条件，更优选至少中-高严紧条件，并且最优选至少高严紧条件下与以下杂交：(i)SEQ ID NO：7的成熟多肽编码序列，(ii)包含在SEQ ID NO：7的成熟多肽编码序列中的cDNA序列，或者(iii)(i)或(ii)的全长互补链；(c)多肽，其由包含与SEQ ID NO：7的成熟多肽编码序列具有至少70％，更优选至少75％，甚至更优选至少80％，甚至更优选至少85％，甚至更优选至少90％，并且最优选至少95％序列同一性的核苷酸序列的多核苷酸编码；和(d)变体，其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQ ID NO：8的成熟多肽；

其中所述具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽选自下组：(a)多肽，其包含与SEQ ID NO：10的成熟多肽具有至少70％，更优选至少75％，甚至更优选至少80％，甚至更优选至少85％，甚至更优选至少90％，并且最优选至少95％序列同一性的氨基酸序列；(b)由多核苷酸编码的多肽，所述多核苷酸在优选至少中严紧条件，更优选至少中-高严紧条件，并且最优选至少高严紧条件下与以下杂交：(i)SEQ ID NO：9的成熟多肽编码序列，(ii)包含在SEQ ID NO：9的成熟多肽编码序列中的cDNA序列或包含SEQ ID NO：9的成熟多肽编码序列的基因组DNA序列，或者(iii)(i)或(ii)的全长互补链；(c)多肽，其由包含与SEQ ID NO：9的成熟多肽编码序列具有至少70％，更优选至少75％，甚至更优选至少80％，甚至更优选至少85％，甚至更优选至少90％，并且最优选至少95％序列同一性的核苷酸序列的多核苷酸编码；和(d)变体，其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQ ID NO：10的成熟多肽；以及

22.权利要求21的纤维素酶组合物，其中所述具有内切葡聚糖酶活性的CEL7多肽包含或者其组成为SEQ ID NO：2的成熟多肽或其具有内切葡聚糖酶活性的片段，所述具有内切葡聚糖酶活性的CEL12多肽包含或者其组成为SEQ ID NO：4的成熟多肽或其具有内切葡聚糖酶活性的片段，所述具有内切葡聚糖酶活性的CEL45多肽包含或者其组成为SEQ ID NO：6的成熟多肽或其具有内切葡聚糖酶活性的片段，所述具有纤维二糖水解酶活性和纤维素结合域的CEL7多肽包含或者其组成为SEQ ID NO：8的成熟多肽或其具有纤维二糖水解酶活性的片段，以及具有纤维二糖水解酶活性而不具有纤维素结合域的CEL7多肽包含或其组成为SEQ ID NO：10的成熟多肽或其具有纤维二糖水解酶活性的片段。

23.权利要求21的纤维素分解酶组合物，其中所述具有增强纤维素分解的活性的多肽选自下组：

24.权利要求23的纤维素分解酶组合物，其中所述包含[ILMV]-P-X(4，5)-G-X-Y-[ILMV]-X-R-X-[EQ]-X(4)-[HNQ]和[FW]-[TF]-K-[AIV]的具有增强纤维素分解的活性的多肽进一步包含：

H-X(1，2)-G-P-X(3)-[YW]-[AILMV]，

[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV]，或

H-X(1，2)-G-P-X(3)-[YW]-[AILMV]和[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV]，

25.权利要求21的纤维素分解酶组合物，其中所述具有增强纤维素分解活性的多肽选自下组：

(b)由多核苷酸编码的多肽，所述多核苷酸在优选至少中严紧条件，更优选至少中-高严紧条件，并且最优选至少高严紧条件下与以下杂交：(i)SEQIINO：11、SEQ ID NO：13、SEQ ID NO：15、SEQ ID NO：17、SEQ ID NO：19、SEQ ID NO：21或SEQ ID NO：23的成熟多肽编码序列，(ii)包含在SEQ IDNO：11、SEQ ID NO：13、SEQ ID NO：15或SEQ ID NO：21的成熟多肽编码序列中的cDNA序列，或者包含SEQ ID NO：17、SEQ ID NO：19或SEQ IDNO：23的成熟多肽编码序列的基因组DNA序列，或者(iii)(i)或(ii)的全长互补链；

(d)变体，其包含取代、缺失、和/或插入一个或多个(几个)氨基酸的SEQIDNO：12、SEQ ID NO：14、SEQ ID NO：16、SEQ ID NO：18或SEQ ID NO：20、SEQ ID NO：22或SEQ ID NO：24的成熟多肽。

26.权利要求21的纤维素分解酶组合物，其中所述具有增强纤维素分解的活性的多肽包含或其组成为SEQ ID NO：12、SEQ ID NO：14、SEQ ID NO：16、SEQ ID NO：18或SEQ ID NO：20、SEQ ID NO：22或SEQ ID NO：24的成熟多肽；或者其具有增强纤维素分解的活性的片段。

27.权利要求21的纤维素分解酶组合物，其中所述具有增强纤维素分解的活性的多肽由多核苷酸编码，该多核苷酸包含在大肠杆菌NRRL B-30699中所含的质粒pEJG120中，在大肠杆菌NRRL B-30813中所含的质粒pTter61C中，在大肠杆菌NRRL B-30812中所含的质粒pTter61D中，在大肠杆菌NRRL B-30814中所含的质粒pTter61E中，在大肠杆菌NRRL B-30811中所含的质粒pTter61G中，在大肠杆菌NRRL B-30704中所含的质粒pDZA2-7中或者在大肠杆菌NRRL B-30878中所含的质粒pTr3337中。

28.权利要求21-27中任一项的纤维素分解酶组合物，其进一步包含有效量的一种或多种(几种)具有β-葡糖苷酶活性的多肽。

29.权利要求21-28中任一项的纤维素分解酶组合物，进一步包含有效量的选自下组中的一种或多种(几种)酶：半纤维素酶、酯酶、蛋白酶、漆酶和过氧化物酶或者其混合物。