CN101970651A

CN101970651A - 用于降解纤维素材料的组合物

Info

Publication number: CN101970651A
Application number: CN2008801013711A
Authority: CN
Inventors: 桑德拉·梅里诺; 基思·麦克法兰; 乔尔·彻里; 萨拉·泰特
Original assignee: Novozymes Inc
Current assignee: Novozymes Inc
Priority date: 2007-05-31
Filing date: 2008-05-30
Publication date: 2011-02-09
Anticipated expiration: 2028-05-30
Also published as: BRPI0812267A2; MX2009012844A; US20180237759A1; JP2010528624A; NZ581257A; US9969993B2; RU2009149633A; KR20100029088A; CN101970651B; RU2494146C2; US20080299613A1

Abstract

本发明涉及用于降解或转化含纤维素材料的纤维素分解组合物，和产生与使用所述组合物的方法。所述组合物包含(a)具有增强纤维素分解的活性的多肽(b)β-葡糖苷酶和(c)选自下组的一个或多个纤维素分解酶：里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II和里氏木霉内切葡聚糖酶I，和它们的变体。

Description

用于降解纤维素材料的组合物

对于在联邦赞助的研究与开发下进行发明的权利声明

本发明在能源部授予的主合同DE-AC36-98GO10337、NREL分合同No.ZCO-30017-02下得到政府支持。政府对于本发明拥有一定的权利。

对序列表的引用

本申请包含计算机可读格式的序列表。在此通过提述将该序列表并入。

对生物材料的保藏物的引用

本申请包含对生物材料的保藏物的引用，在此通过提述将所述保藏物并入。

发明背景

发明领域

本发明涉及用于降解或转化含纤维素材料的纤维素分解蛋白质组合物和产生与使用所述组合物的方法。

相关领域描述

纤维素是简单糖类葡萄糖通过β-1，4-键共价键合的聚合物。许多微生物产生水解β-连接的葡聚糖的酶。这些酶包括内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶。内切葡聚糖酶在随机位置消化纤维素聚合物，将其打开(openingit)以受到纤维二糖水解酶攻击(attack)。纤维二糖水解酶继而从纤维素聚合物的末端释放纤维二糖的分子。纤维二糖是水溶性的β-1，4-连接的葡萄糖二聚体。β-葡糖苷酶将纤维二糖水解成葡萄糖。

将纤维素原料转化为乙醇具有以下优势：大量原料现成可用，避免燃烧或填埋材料的合意性，和乙醇燃料的清洁性。木材、农业残余物、草本作物和城市固体废物已被认为是用于乙醇生产的原料。这些材料主要由纤维素、半纤维素和木质素组成。一旦将纤维素转化成葡萄糖，葡萄糖将容易地由酵母发酵成乙醇。

WO 2005/074647披露了来自土生梭孢霉(Thielavia terrestris)的具有增强纤维素分解的活性(celluolytic enhancing activity)的分离的多肽及其多核苷酸。WO 2005/074656披露了来自桔橙嗜热霉(Thermoascus auranticaus)的具有增强纤维素分解的活性的分离的多肽及其多核苷酸。美国公开的申请系列号2007/0077630披露了来自里氏木霉(Trichoderma reesei)的具有增强纤维素分解的活性的分离的多肽及其多核苷酸。

本领域中的一个优势是提高纤维素分解蛋白质组合物降解或转化纤维素材料的能力。

本发明涉及降解或转化纤维素材料的能力改进的纤维素分解蛋白质组合物。

发明简述

本发明涉及丝状真菌宿主细胞，其包含：(a)编码具有增强纤维素分解的活性的天然或异源多肽的第一多核苷酸；(b)编码天然或异源β-葡糖苷酶的第二多核苷酸；和(c)编码选自下组的天然或异源纤维素分解酶的一个或多个(几个)第三多核苷酸：里氏木霉纤维二糖水解酶I(CEL7A)、里氏木霉纤维二糖水解酶II(CEL6A)，和里氏木霉内切葡聚糖酶I(CEL7B)，和它们的直向同源物或变体。

本发明还涉及产生纤维素分解蛋白质组合物的方法，其包括：(a)在有益于产生该纤维素分解组合物的条件下培养这些丝状真菌宿主细胞；和(b)回收所述纤维素分解蛋白质组合物。本发明还涉及由这种方法获得的纤维素分解蛋白质组合物。

本发明还涉及纤维素分解蛋白质组合物，其包含：(a)具有增强纤维素分解的活性的多肽；(b)β-葡糖苷酶；和(c)选自下组的一种或多种(几种)纤维素分解酶：里氏木霉纤维二糖水解酶I(CEL7A)、里氏木霉纤维二糖水解酶II(CEL6A)，和里氏木霉内切葡聚糖酶I(CEL7B)，和它们的直向同源物或变体。

本发明还涉及用于降解或转化纤维素材料的方法，其包括：用有效量的这种纤维素分解蛋白质组合物处理纤维素材料。

本发明进一步涉及产生发酵产物的方法，其包括：(a)用有效量的这种纤维素分解蛋白质组合物糖化纤维素材料；(b)用一种或多种(几种)发酵微生物发酵步骤(a)中经糖化的纤维素材料，以产生发酵产物；和(c)从发酵液回收所述发酵产物。

附图简述

图1显示pMJ04的限制图谱。

图2显示pCaHj527的限制图谱。

图3显示pMT2188的限制图谱。

图4显示pCaHj568的限制图谱。

图5显示pMJ05的限制图谱。

图6显示pSMai130的限制图谱。

图7显示米曲霉(Aspergillus oryzae)β-葡糖苷酶天然信号序列的DNA序列和氨基酸序列(SEQ ID NO：91和92)。

图8显示特异腐质霉(Humicola insolens)内切葡聚糖酶V信号序列的DNA序列和氨基酸序列(SEQ ID NO：95和96)。

图9显示pSMai135的限制图谱。

图10显示pSMai140的限制图谱。

图11显示pSaMe-F1的限制图谱。

图12显示pSaMe-FX的限制图谱。

图13显示pAlLo47的限制图谱。

图14显示pSaMe-FH的限制图谱。

定义

增强纤维素分解的活性：术语“增强纤维素分解的活性”在本文定义为增强具有纤维素分解活性的蛋白对含纤维素材料的水解的生物活性。就本发明而言，通过测量与使用相等总蛋白加样量但不含增强纤维素分解的活性的对照水解(1-50mg的纤维素分解蛋白/g PCS(经预处理的玉米秸秆)中的纤维素)相比，来自在如下条件下纤维素分解蛋白对含纤维素材料的水解的还原糖增加或总的纤维二糖和葡萄糖的增加来确定增强纤维素分解的活性：1-50mg的总蛋白/g PCS中的纤维素，其包含80-99.5％w/w纤维素分解蛋白和0.5-20％w/w增强纤维素分解活性的蛋白，在50℃进行1-7天。在一个优选的方面，在3％米曲霉β-葡糖苷酶(根据WO 02/095014在米曲霉中重组产生)或3％烟曲霉β-葡糖苷酶(根据WO 02/095014的实施例22在米曲霉中重组产生)的存在下

1.5L(Novozymes A/S，Bagsvaerd，Denmark)的混合物的纤维素酶蛋白质加样量用作纤维素分解活性的标准物。

具有增强纤维素分解的活性的多肽具有SEQ ID NO：2、4、6、8、10、12或14的成熟多肽的增强纤维素分解的活性的至少20％，优选至少40％，更优选至少50％，更优选至少60％，更优选至少70％，更优选至少80％，甚至更优选至少90％，最优选至少95％，并且甚至最优选至少100％。

所述具有增强纤维素分解的活性的多肽通过下述方式增强由具有纤维素分解活性的蛋白质所催化的含纤维素材料的水解：将达到相同水解程度所需要的纤维素分解酶量降低优选至少0.1倍，更优选至少0.2倍、更优选至少0.3倍、更优选至少0.4倍、更优选至少0.5倍、更优选至少1倍、更优选至少3倍、更优选至少4倍、更优选至少5倍、更优选至少10倍、更优选至少20倍、甚至更优选至少30倍、最优选至少50倍、并且甚至最优选至少100倍。

纤维素分解活性：术语“纤维素分解活性”在本文定义为水解含纤维素材料的纤维素酶活性(如内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶或其组合)。纤维素分解蛋白可水解或水解羧甲基纤维素(CMC)，由此降低温育混合物的粘度。可以通过振动粘度计(vibration viscosimeter)(如来自法国Sofraser的MIVI 3000)测定所产生的粘度降低。纤维素酶活性的测定按照纤维素酶粘度单位(CEVU)来测量，所述测定通过测量样品降低羧甲基纤维素(CMC)溶液粘度的能力来定量该样品中存在的催化活性的量。该测定法在适于纤维素分解蛋白质和底物的温度和pH进行。

就本发明而言，通过测量与不加入纤维素分解蛋白的对照水解相比，在以下条件下纤维素分解组合物对含纤维素材料的水解的增加来测定纤维素分解活性：1-50mg纤维素分解蛋白/g PCS中的纤维素，在50℃进行1-7天。

内切葡聚糖酶：术语“内切葡聚糖酶”在本文中的定义为内切-1，4-(1，3；1，4)-β-D-葡聚糖4-葡聚糖水解酶(endo-1，4-(1，3；1，4)-β-D-glucan4-glucanohydrolase)(E.C.No.3.2.1.4)，其催化纤维素、纤维素衍生物(如羧甲基纤维素和羟乙基纤维素)、地衣淀粉、混合的β-1，3葡聚糖如谷类β-D-葡聚糖或木葡聚糖中的β-1，4键和其它含有纤维素成分的植物材料中1，4-β-D-糖苷键的内水解。就本发明而言，根据Ghose，1987，Pure and Appl.Chem.59：257-268中的方法使用羧甲基纤维素(CMC)水解测定内切葡聚糖酶的活性。

纤维二糖水解酶：术语“纤维二糖水解酶”在本文中的定义为1，4-β-D-葡聚糖纤维二糖水解酶(E.C.3.2.1.91)，其催化纤维素、纤维寡糖或任何包含β-1，4- 连接的葡萄糖的聚合物中1，4-β-D葡糖苷键的水解，从链的还原端或非还原端释放纤维二糖。就本发明而言，根据Lever等，1972，Anal.Biochem.47：273-279和van Tilbeurgh等，1982，FEBS Letters 149：152-156；van Tilbeurgh和Claeyssens，1985，FEBS Letters 187：283-288所描述的方法测定纤维二糖水解酶的活性。在本发明中，使用Lever等方法来评估玉米秸秆中纤维素的水解，同时使用van Tilbeurgh等的方法来测定对于荧光二糖衍生物的纤维二糖水解酶活性。

β-葡糖苷酶：术语“β-葡糖苷酶”在本文定义为β-D-葡糖苷葡糖水解酶(E.C.3.2.1.21)，其催化末端非还原性β-D-葡萄糖残基的水解，并且释放β-D-葡萄糖。就本发明而言，根据Venturi等，2002，J.Basic Microbiol.42：55-66描述的基本方法来测定β-葡糖苷酶活性，只是采用如本文所述的不同的条件。将1单位的β-葡糖苷酶活性定义为在50℃、pH 5，从100mM柠檬酸钠、0.01％

20中作为底物的4mM对硝基苯基-β-D-葡萄吡喃糖苷每分钟产生1.0微摩尔对硝基苯酚。

家族1、家族3、家族5、家族6、家族7、家族9、家族12、家族45、家族61，或家族74糖苷水解酶：术语“家族1、家族3、家族5、家族6、家族7、家族9、家族12、家族45、家族61，或家族74糖苷水解酶”或“家族GH1、家族GH3、家族GH5、家族GH6、家族GH7、家族GH9、家族GH12、家族GH45、家族GH61，或家族GH74”在本文中定义为根据Henrissat B.，1991，A classification of glycosyl hydrolases based on amino-acid sequence similarities，Biochem.J.280：309-316，和Henrissat B.，和Bairoch A.，1996，Updating thesequence-based classification of glycosyl hydrolases，Biochem.J.316：695-696分别归入糖苷水解酶家族1、家族3、家族5、家族6、家族7、家族9、家族12、家族45、家族61，或家族74的多肽。目前，Henrissat将GH61家族列为未分类，说明对于属于此家族的多肽而言，诸如机制、催化亲核体/碱、催化质子供体和3-D结构等性质是未知的。

含纤维素材料：生物质的初生细胞壁中的主要多糖是纤维素，第二丰富的多糖是半纤维素，而第三是果胶。在细胞停止生长之后产生的次生细胞壁也含有多糖，并且其通过与半纤维素共价交联的聚合木质素强化。纤维素是无水纤维二糖的均聚物，并且因此是线性的β-(1-4)-D-葡聚糖，而半纤维素在具有一系列取代基的复杂分支结构中包括多种化合物，例如木聚糖、木葡聚糖、阿拉伯木聚糖和甘露聚糖。尽管通常是多形态的，纤维素在植物组织中主要作为平行葡聚糖链的不溶晶体基质存在。半纤维素通常与纤维素以及与其它半纤维素通过氢键连接，其帮助稳定细胞壁基质。

含纤维素材料可以是任何含纤维素的材料。纤维素通常存在于例如植物的茎、叶、果/种壳(hulls)、果/种皮(husks)、和穗轴(cob)中，或树的叶、枝和木材中。含纤维素材料可以是但不限于草本材料、农业残余物、林业残余物、市政固体废物、废纸和纸浆及造纸厂残余物。含纤维素材料可以是任意类型的生物质，其包括但不限于木材资源、市政固体废物、废纸、作物和作物残余物(参见，例如，Wiselogel等，1995，于Handbook on Bioethanol(Charles E.Wyman编)中，105-118页，Taylor & Francis，Washington D.C.；Wyman，1994，Bioresource Technology 50：3-16；Lynd，1990，Applied Biochemistry andBiotechnology 24/25：695-719；Mosier等，1999，Recent Progress in Bioconversionof Lignocellulosics，于Advances in Biochemical Engineering/Biotechnology，T.Scheper，managing编，Volume 65，23-40页，Springer-Verlag，New York)。在本文中可理解的是含纤维素材料优选为木素纤维素的形式，例如，在混合基质中含有木质素、纤维素和半纤维素的植物细胞壁材料。

在优选的方面，含纤维素材料是玉米秸秆。在另一个优选的方面，含纤维素材料是玉米纤维。在另一个优选的方面，含纤维素材料是玉米穗轴。在另一个优选的方面，含纤维素材料是柳枝稷(switch grass)。在另一个优选的方面，含纤维素材料是稻草(rice straw)。在另一优选的方面，含纤维素材料是纸和纸浆加工废料。在另一优选的方面，含纤维素材料是木本或草本植物。在另一优选的方面，纤维素材料是蔗渣。

可以按原样使用含纤维素材料或可使用本领域已知的常规方法对含纤维素材料进行预处理。例如，物理预处理技术可包括多种类型的磨制、照射、汽蒸/蒸汽爆炸和水热解(hydrothermolysis)；化学预处理技术可包括稀酸、碱、有机溶剂、氨、二氧化硫、二氧化碳和pH控制的水热解；而生物预处理技术可包括应用溶解木质素的微生物(参见，例如，Hsu，T.-A.，1996，Pretreatmentof biomass，于Handbook on Bioethanol：Production and Utilization，Wyman，C.E.编，Taylor & Francis，Washington，DC，179-212；Ghosh，P.，和Singh，A.，1993，Physicochemical and biological treatments for enzymatic/microbial conversion oflignocellulosic biomass，Adv.Appl.Microbiol.39：295-333；McMillan，J.D.，1994， Pretreating lignocellulosic biomass：a review，in Enzymatic Conversion of Biomassfor Fuels Production，Himmel，M.E.，Baker，J.O.，和Overend，R.P.编，ACSSymposium Series 566，American Chemical Society，Washington，DC，chapter 15；Gong，C.S.，Cao，N.J.，Du，J.，和Tsao，G.T.，1999，Ethanol production fromrenewable resources，于Advances in Biochemical Engineering/Biotechnology，Scheper，T.编，Springer-Verlag Berlin Heidelberg，Germany，65：207-241；Olsson，L.，和Hahn-Hagerdal，B.，1996，Fermentation of lignocellulosic hydrolysates forethanol production，Enz.Microb.Tech.18：312-331；以及Vallander，L.，和Eriksson，K.-E.L.，1990，Production of ethanol from lignocellulosic materials：State of theart，Adv.Biochem.Eng./Biotechnol.42：63-95)。

预处理的玉米秸秆：术语“PCS”或“预处理的玉米秸秆”在本文中的定义为源自通过热和稀酸处理的玉米秸秆的含纤维素的材料。就本发明而言，PCS由本文所述方法产生。

全长多肽：术语“全长多肽”在本文定义为具有生物活性的多肽的前体形式，其中所述前体包含信号肽区域，或者还包含前肽区，其中一旦从细胞分泌，信号肽即被切割，或者前肽也被切割，得到具有生物活性的多肽。

信号肽：术语“信号肽”在本文定义为以符合读框的方式连接至多肽的氨基末端并指导编码的多肽进入细胞的分泌途径的肽。

信号肽编码序列：术语“信号肽编码序列”在本文定义为肽编码区，其编码以符合读框的方式连接至多肽的氨基末端并指导编码的多肽进入细胞的分泌途径的氨基酸序列。

前肽：术语“前肽”在本文定义为以符合读框的方式连接至多肽的氨基末端的肽。得到的多肽称作前酶或前多肽(或者在一些情况中为酶原)。前多肽通常没有活性，并且可以通过前肽的催化或自催化裂解由前多肽转化为成熟活性多肽。当多肽的氨基末端同时存在信号肽和前肽区时，前肽区以符合读框的方式连接至多肽的氨基末端，并且信号肽以符合读框的方式连接至前肽区的氨基末端。

前肽编码序列：术语“前肽编码序列”在本文定义为肽编码区，其编码以符合读框的方式连接至多肽的氨基末端的氨基酸序列，形成前酶或前多肽(或者在一些情况中为酶原)。

催化域：术语“催化域”在本文定义为β-葡糖苷酶或内切葡聚糖酶的氨基序列的结构部分或区域，其具有β-葡糖苷酶或内切葡聚糖酶的催化活性。

β-葡糖苷酶融合蛋白：术语“β-葡糖苷酶融合蛋白”在本文定义为表现出β-葡糖苷酶活性并至少包含β-葡糖苷酶催化域和内切葡聚糖酶催化域的多肽。

β-葡糖苷酶融合蛋白的组件：术语“β-葡糖苷酶融合蛋白的组件”在本文定义为β-葡糖苷酶融合蛋白的个体(切割的)片段，其中每个片段都具有β-葡糖苷酶活性，并且包括内切葡聚糖酶和β-葡糖苷酶催化域或者融合蛋白的β-葡糖苷酶催化域。例如，在融合蛋白的内切葡聚糖酶和β-葡糖苷酶组件之间存在裂解位点，例如，Kex2位点，能够导致产生具有内切葡聚糖酶活性的多肽和另一个具有β-葡糖苷酶活性的多肽。

纤维素结合域：术语“纤维素结合域(CBD)”在本文定义为内切葡聚糖酶(纤维素酶)的部分氨基酸序列，其与内切葡聚糖酶的纤维素结合活性有关。纤维素结合域通常通过将内切葡聚糖酶非共价连接至纤维素、纤维素衍生物，或其多糖等同物而发挥作用。CBD通常独立于催化域发挥作用。

β-葡糖苷酶融合构建体：“术语β-葡糖苷酶融合构建体”指由可操作连接的不同基因或其部分组成的核酸构建体。组件从5’末端开始包括至少包含内切葡聚糖酶催化域的DNA分子，和至少包含β-葡糖苷酶催化域的DNA分子。

分离的多肽：术语“分离的多肽”用于本文中指的是从来源分离的多肽。在优选的方面，如通过SDS-PAGE测定的，多肽至少1％纯，优选至少5％纯，更优选至少10％纯，更优选至少20％纯，更优选至少40％纯，更优选至少60％纯，甚至更优选至少80％纯，以及最优选至少90％纯。

基本上纯的多肽：术语“基本上纯的多肽”在本文表示多肽制备物，所述多肽制备物按重量计含有至多10％，优选至多8％，更优选至多6％，更优选至多5％，更优选至多4％，更优选至多3％，甚至更优选至多2％，最优选至多1％，并且甚至最优选至多0.5％的与其天然结合的(associated)或重组结合的其它多肽材料。因此，优选所述基本上纯的多肽是按存在于制备物中的全部多肽材料的重量计至少92％纯，优选至少94％纯，更优选至少95％纯，更优选至少96％纯，更优选至少96％纯，更优选至少97％纯，更优选至少98％纯，甚至更优选至少99％纯，最优选至少99.5％纯，并且甚至最优选100％纯。本发明的多肽优选是基本上纯的形式，即，所述多肽制备物基本上(essentially)不含与其天然结合的或重组结合的其它多肽材料。这能够通过以下方法实现，例如，通过公知的重组方法或由经典纯化方法制备多肽。

成熟多肽：术语“成熟多肽”在本文中定义为具有生物活性(如酶活性)的多肽，所述多肽以其在翻译和任何翻译后修饰之后的最终形式存在，所述修饰例如N-末端加工、C-末端截短、糖基化、磷酸化等。

成熟多肽编码序列：术语“成熟多肽编码序列”在本文中定义为编码具有生物活性的成熟多肽的核苷酸序列。

同一性：参数“同一性”描述两个氨基酸序列之间或两个核苷酸序列之间的相关性。

就本发明而言，两个氨基酸序列之间的同一性程度使用EMBOSS程序包(EMBOSS：The European Molecular Biology Open Software Suite，Rice等，2000，Trends in Genetics 16：276-277)的Needle程序中执行的Needleman-Wunsch算法(Needleman和Wunsch，1970，J.Mol.Biol.48：443-453)来测定，优选版本3.0或更新的版本。使用的可选参数是缺口开启罚分(gap open penalty)10，缺口延伸罚分(gap extension penalty)0.5和EBLOSUM62(BLOSUM62的EMBOSS版本)取代矩阵。使用Needle标记为“最长同一性”(使用-nobrief选项得到)的输出作为百分比同一性并且计算如下：

(相同的残基×100)/(比对的长度-比对中的缺口总数)

就本发明而言，两个脱氧核糖核酸序列之间的同一性程度使用EMBOSS程序包(EMBOSS：The European Molecular Biology Open Software Suite，Rice等，2000，见上文)的Needle程序中执行的Needleman-Wunsch算法(Needleman和Wunsch，1970，见上文)来测定，优选版本3.0或更新的版本。使用的可选参数是缺口开启罚分10，缺口延伸罚分0.5和EDNAFULL(NCBI NUC4.4的EMBOSS版本)取代矩阵。使用Needle标记为“最长同一性”(使用-nobrief选项得到)的输出作为百分比同一性并且如下计算：

(相同的脱氧核糖核苷酸×100)/(比对的长度-比对中的缺口总数)

同源序列：术语“同源序列”在本文定义为使用blastp(用于蛋白质数据库)或tblastn(用于核酸数据库)算法，及BLOSUM62矩阵、字长(wordsize)3、缺口存在分值(gap existence cost)11、缺口延伸分值(gap extension cost)1、无低复杂性过滤并且使用成熟蛋白序列作为查询对象时，E值(或期望得分(expectancy score))小于0.001的序列。参见Altschul等，1997，Nucleic Acids Res.25：3389-3402。

多肽片段：术语“多肽片段”在本文中定义为从成熟多肽的氨基和/或羧基末端缺失一个或多个(几个)氨基酸的多肽，或者其同源序列；其中所述片段具有其成熟多肽的活性。

亚序列：术语“亚序列(subsequence)”在本文中定义为从成熟多肽编码序列的5’和/或3’端缺失一个或多个(几个)核苷酸的核苷酸序列，或其同源序列；其中所述亚序列编码具有其成熟多肽的活性的多肽片段。

等位变体(allelic variant)：术语“等位变体”在本文中表示占据相同染色体基因座的基因的任何两种或两种以上可选形式。等位变异通过突变天然地发生，并且可导致种群内的多态性。基因突变可以是沉默的(在编码的多肽中无变化)或可以编码具有改变的氨基酸序列的多肽。多肽的等位变体是由基因的等位变体编码的多肽。

分离的多核苷酸：术语“分离的多核苷酸”用于本文中指与来源分离的多核苷酸。在优选的方面，如通过琼脂糖电泳测定的，所述多核苷酸为至少1％纯，优选至少5％纯，更优选至少10％纯，更优选至少20％纯，更优选至少40％纯，更优选至少60％纯，甚至更优选至少80％纯，以及最优选至少90％纯。

基本上纯的多核苷酸：术语“基本上纯的多核苷酸”用于本文指不含其它外来的或不期望的核苷酸的多核苷酸制备物，并且所述多核苷酸制备物处于适合于在遗传工程的蛋白质生产体系中使用的形式。因此，基本上纯的多核苷酸含有按重量计至多10％，优选至多8％，更优选至多6％，更优选至多5％，更优选至多4％，更优选至多3％，甚至更优选至多2％，最优选至多1％，并且甚至最优选至多0.5％的与其天然结合的或重组结合的其它多核苷酸材料。然而，基本上纯的多核苷酸可以包括天然存在的5’和3’非翻译区，例如启动子和终止子。优选基本上纯的多核苷酸是按重量计至少90％纯，优选至少92％纯，更优选至少94％纯，更优选至少95％纯，更优选至少96％纯，更优选至少97％纯，甚至更优选至少98％纯，最优选至少99％，并且甚至最优选至少99.5％纯的。本发明所述多核苷酸优选为基本上纯的形式，即，所述多核苷酸制备物基本上不含与其天然结合的或重组结合的其它多核苷酸材料。所述多核苷酸可以是基因组、cDNA、RNA、半合成、合成来源的，或它们的任意组合。

cDNA：术语“cDNA”在本文中定义为能够通过逆转录从得自真核细胞的成熟的、已剪接的mRNA分子制备的DNA分子。cDNA缺少通常存在于相应基因组DNA中的内含子序列。起始的(initial)、初级的RNA转录物是mRNA 的前体，其通过一系列的步骤加工然后作为成熟的已剪接的mRNA出现。这些步骤包括通过称为剪接的过程去除内含子序列。因而源自mRNA的cDNA没有任何内含子序列。

核酸构建体：术语“核酸构建体”用于本文指单链或双链的核酸分子，所述核酸分子分离自天然存在的或者合成的基因，或所述核酸分子以本来不存在于(not otherwise exist)自然界中的方式被修饰以含有核酸的片段，或所述核酸分子是合成的。当所述核酸构建体含有表达本发明中的编码序列所需的调控序列时，术语核酸构建体与术语“表达盒”同义。

调控序列(control sequence)：术语“调控序列”在本文定义为包括对于本发明中编码多肽的多核苷酸的表达是必需的所有组分。各调控序列对于编码所述多肽的核苷酸序列可以是天然的或外源的，或各调控序列对于彼此可以是天然的或外源的。这些调控序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。最少的情况，调控序列包括启动子和转录和翻译的终止信号。调控序列可以和用于引入特异性限制位点的接头一起提供，所述特异性限制位点促进调控序列与编码多肽的核苷酸序列编码区的连接。

可操作地连接：术语“可操作地连接”在本文表示这样的构型，其中将调控序列置于相对于多核苷酸序列的编码序列的合适位置，使得调控序列指导多肽的编码序列的表达。

编码序列：当用于本文时术语“编码序列”的意思是直接指定其蛋白产物的氨基酸序列的核苷酸序列。编码序列的边界通常由开读框确定，所述开读框通常以ATG起始密码子或可选的起始密码子例如GTG和TTG开始，并且以终止密码子如TAA、TAG和TGA结束。编码序列可以是DNA、cDNA、合成的或重组的核苷酸序列。

表达：术语“表达”包括涉及多肽产生的任何步骤，其包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。

表达载体：术语“表达载体”在本文定义为线性的或环状的DNA分子，其包含编码本发明多肽的多核苷酸，并且所述多核苷酸与提供用于其表达的额外核苷酸可操作地连接。

宿主细胞：如本文中所使用的术语“宿主细胞”包括任何细胞类型，所述细胞类型对于用包含多核苷酸的核酸构建体或表达载体的转化、转染、转导等是易感的(susceptible)。

修饰：术语“修饰”在本文的意思是，对成熟多肽或其同源序列的任何化学修饰，以及对编码这种多肽的DNA的遗传操作。所述修饰可以是一个或多个(几个)氨基酸的取代、缺失和/或插入，以及一个或多个(几个)氨基酸侧链的取代。

人工变体：当用在本文时，术语“人工变体”的意思是由表达成熟多肽编码序列的修饰的核苷酸序列或其同源序列的生物体产生的多肽。所述修饰的核苷酸序列通过人为干预(human intervention)，通过修饰多核苷酸序列或其同源序列来获得。

发明详述

本发明涉及丝状真菌宿主细胞，其包含：(a)编码具有增强纤维素分解的活性的天然或异源多肽的第一多核苷酸；(b)编码天然或异源β-葡糖苷酶的第二多核苷酸；和(c)编码选自下组的天然或异源的一个或多个(几个)纤维素分解酶的一个或多个(几个)第三多核苷酸：里氏木霉纤维二糖水解酶I(CEL7A)，里氏木霉纤维二糖水解酶II(CEL6A)，和里氏木霉内切葡聚糖酶I(CEL7B)，和它们的直向同源物或变体。

本发明还涉及产生纤维素分解蛋白质组合物的方法，其包括：(a)有益于产生所述纤维素分解蛋白质组合物的条件下培养这样的丝状真菌宿主细胞；和(b)回收所述纤维素分解蛋白质组合物。本发明还涉及由这种方法获得的纤维素分解蛋白质组合物。

本发明还涉及纤维素分解蛋白质组合物，其包含：(a)具有增强纤维素分解的活性的多肽；(b)β-葡糖苷酶；和(c)选自下组的一个或多个(几个)纤维素分解酶：里氏木霉纤维二糖水解酶I(CEL7A)，里氏木霉纤维二糖水解酶II(CEL6A)，和里氏木霉内切葡聚糖酶I(CEL7B)，和它们的直向同源物或变体。

在优选的方面，丝状真菌宿主细胞产生包含下述的纤维素分解蛋白质组合物：SEQ ID NO：8的成熟多肽的具有增强纤维素分解的活性的多肽；SEQID NO：106的β-葡糖苷酶融合蛋白；SEQ ID NO：52的成熟多肽的里氏木霉纤维二糖水解酶I(CEL7A)，SEQ ID NO：54的成熟多肽的里氏木霉纤维二糖水解酶II(CEL6A)，和SEQ ID NO：56的成熟多肽的里氏木霉内切葡聚糖酶I(CEL7B)。在优选的方面，丝状真菌宿主细胞是里氏木霉，特别是里氏木霉 RutC30。

在另一个优选的方面，丝状真菌宿主细胞产生包含下述的纤维素分解蛋白质组合物：SEQ ID NO：8的成熟多肽的具有增强纤维素分解的活性的多肽；SEQ ID NO：106的β-葡糖苷酶融合蛋白；SEQ ID NO：52的成熟多肽的里氏木霉纤维二糖水解酶I(CEL7A)，SEQ ID NO：54的成熟多肽的里氏木霉纤维二糖水解酶II(CEL6A)，和SEQ ID NO：56的成熟多肽的里氏木霉内切葡聚糖酶I(CEL7B)，并且进一步产生选自下组的一个或多个(几个)酶：SEQ ID NO：58的成熟多肽的里氏木霉内切葡聚糖酶II(CEL5A)，SEQ ID NO：62的成熟多肽的里氏木霉内切葡聚糖酶V(CEL45A)，和SEQ ID NO：60的成熟多肽的里氏木霉内切葡聚糖酶III(CEL12A)。在另一个优选的方面，丝状真菌宿主细胞是里氏木霉，特别是里氏木霉RutC30。

在另一个优选的方面，丝状真菌宿主细胞产生包含下述的纤维素分解蛋白质组合物：SEQ ID NO：8的成熟多肽的具有增强纤维素分解的活性的多肽；SEQ ID NO：106的β-葡糖苷酶融合蛋白；SEQ ID NO：52的成熟多肽的里氏木霉纤维二糖水解酶I(CEL7A)，SEQ ID NO：54的成熟多肽的里氏木霉纤维二糖水解酶II(CEL6A)，和SEQ ID NO：56的成熟多肽的里氏木霉内切葡聚糖酶I(CEL7B)，并且还产生SEQ ID NO：64的成熟多肽的土生梭孢霉纤维二糖水解酶。在另一个优选的方面，丝状真菌宿主细胞是里氏木霉，特别是里氏木霉RutC30。

在另一个优选的方面，丝状真菌宿主细胞产生包含下述的纤维素分解蛋白质组合物：SEQ ID NO：8的成熟多肽的具有增强纤维素分解的活性的多肽；SEQ ID NO：106的β-葡糖苷酶融合蛋白；SEQ ID NO：52的成熟多肽的里氏木霉纤维二糖水解酶I(CEL7A)，SEQ ID NO：54的成熟多肽的里氏木霉纤维二糖水解酶II(CEL6A)，和SEQ ID NO：56的成熟多肽的里氏木霉内切葡聚糖酶I(CEL7B)，并且进一步产生(1)选自下组的一个或多个(几个)酶：SEQ IDNO：58的成熟多肽的里氏木霉内切葡聚糖酶II(CEL5A)，SEQ ID NO：62的成熟多肽的里氏木霉内切葡聚糖酶V(CEL45A)，和SEQ ID NO：60的成熟多肽的里氏木霉内切葡聚糖酶III(CEL12A)，和/或(2)还产生SEQ ID NO：64的成熟多肽的土生梭孢霉纤维二糖水解酶。在另一个优选的方面，丝状真菌宿主细胞是里氏木霉，特别是里氏木霉RutC30。

在另一个优选的方面，纤维素分解蛋白质组合物包含：SEQ ID NO：8的成熟多肽的具有增强纤维素分解的活性的多肽；SEQ ID NO：106的β-葡糖苷酶融合蛋白；SEQ ID NO：52的成熟多肽的里氏木霉纤维二糖水解酶I(CEL7A)，SEQ ID NO：54的成熟多肽的里氏木霉纤维二糖水解酶II(CEL6A)，和SEQ ID NO：56的成熟多肽的里氏木霉内切葡聚糖酶I(CEL7B)。

在另一个优选的方面，纤维素分解蛋白质组合物包含：SEQ ID NO：8的成熟多肽的具有增强纤维素分解的活性的多肽；SEQ ID NO：106的β-葡糖苷酶融合蛋白；SEQ ID NO：52的成熟多肽的里氏木霉纤维二糖水解酶I(CEL7A)，SEQ ID NO：54的成熟多肽的里氏木霉纤维二糖水解酶II(CEL6A)，和SEQ ID NO：56的成熟多肽的里氏木霉内切葡聚糖酶I(CEL7B)，并且进一步包含选自下组的一个或多个(几个)酶：SEQ ID NO：58的成熟多肽的里氏木霉内切葡聚糖酶II(CEL5A)，SEQ ID NO：62的成熟多肽的里氏木霉内切葡聚糖酶V(CEL45A)，和SEQ ID NO：60的成熟多肽的里氏木霉内切葡聚糖酶III(CEL12A)。

在另一个优选的方面，纤维素分解蛋白质组合物包含：SEQ ID NO：8的成熟多肽的具有增强纤维素分解的活性的多肽；SEQ ID NO：106的β-葡糖苷酶融合蛋白；SEQ ID NO：52的成熟多肽的里氏木霉纤维二糖水解酶I(CEL7A)，SEQ ID NO：54的成熟多肽的里氏木霉纤维二糖水解酶II(CEL6A)，和SEQ ID NO：56的成熟多肽的里氏木霉内切葡聚糖酶I(CEL7B)，并且进一步包含SEQ ID NO：64的成熟多肽的土生梭孢霉纤维二糖水解酶。

在另一个优选的方面，纤维素分解蛋白质组合物包含：SEQ ID NO：8的成熟多肽的具有增强纤维素分解的活性的多肽；SEQ ID NO：106的β-葡糖苷酶融合蛋白；SEQ ID NO：52的成熟多肽的里氏木霉纤维二糖水解酶I(CEL7A)，SEQ ID NO：54的成熟多肽的里氏木霉纤维二糖水解酶II(CEL6A)，和SEQ ID NO：56的成熟多肽的里氏木霉内切葡聚糖酶I(CEL7B)，并且进一步包含(1)选自下组的一个或多个(几个)酶：SEQ ID NO：58的成熟多肽的里氏木霉内切葡聚糖酶II(CEL5A)，SEQ ID NO：62的成熟多肽的里氏木霉内切葡聚糖酶V(CEL45A)，和SEQ ID NO：60的成熟多肽的里氏木霉内切葡聚糖酶III(CEL12A)，和/或(2)还包含SEQ ID NO：64的成熟多肽的土生梭孢霉纤维二糖水解酶。

具有增强纤维素分解的活性的多肽及其多核苷酸

用于处理含纤维素材料的具有增强纤维素分解的活性的任何多肽可以在本发明的组合物中使用。编码具有增强纤维素分解的活性的这种多肽的多核苷酸能用于产生组合物。

在第一方面，具有增强纤维素分解的活性的分离的多肽包含以下基序(motif)：

[ILMV]-P-X(4，5)-G-X-Y-[ILMV]-X-R-X-[EQ]-X(4)-[HNQ]和[FW]-[TF]-K-[AIV]，

其中X是任何氨基酸，X(4，5)是在4或5个邻接位置上的任何氨基酸，并且X(4)是在4个邻接位置上的任何氨基酸。

包含上述基序的分离的多肽可进一步包含：

H-X(1，2)-G-P-X(3)-[YW]-[AILMV]，

[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV]，或

H-X(1，2)-G-P-X(3)-[YW]-[AILMV]和

[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV]，

其中X是任何氨基酸，X(1，2)是在1个位置或2个邻接位置上的任何氨基酸，X(3)是在3个邻接位置上的任何氨基酸，并且X(2)是在2个邻接位置上的任何氨基酸。在上述基序中，采用公认的IUPAC单字母氨基酸缩写。

在优选的实施方案中，具有增强纤维素分解的活性的分离的多肽进一步包含H-X(1，2)-G-P-X(3)-[YW]-[AILMV]。在另一个优选的实施方案中，具有增强纤维素分解的活性的分离的多肽还包含[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV]。在另一个优选的实施方案中，具有增强纤维素分解的活性的分离的多肽还包含H-X(1，2)-G-P-X(3)-[YW]-[AILMV]和[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV]。

在第二方面，具有增强纤维素分解的活性的分离的多肽包含以下基序：

[ILMV]-P-x(4，5)-G-x-Y-[ILMV]-x-R-x-[EQ]-x(3)-A-[HNQ]，

其中x是任何氨基酸，x(4，5)是在4或5个邻接位置上的任何氨基酸，并且x(3)是在3个邻接位置上的任何氨基酸。在以上基序中，采用公认的IUPAC单字母氨基酸缩写。

在第三个方面，具有增强纤维素分解的活性的分离的多肽包含或组成为与SEQ ID NO：2、SEQ ID NO：4、SEQ ID NO：6、SEQ ID NO：8，或SEQ IDNO：10，SEQ ID NO：12，或SEQ ID NO：14的成熟多肽具有优选至少60％，更优选至少65％，更优选至少70％，更优选至少75％，更优选至少80％，更优选至少85％，甚至更优选至少90％，最优选至少95％，并且甚至最优选至少96％，97％，98％，或99％的同一性程度的氨基酸序列，其具有增强纤维素分解的活性(下文中的“同源多肽”)。在优选的方面，所述同源多肽包含或组成为与SEQ ID NO：2、SEQ ID NO：4、SEQ ID NO：6、SEQ ID NO：8，或SEQ ID NO：10，SEQ ID NO：12，或SEQ ID NO：14的成熟多肽相差十个氨基酸，优选五个氨基酸，更优选四个氨基酸，甚至更优选三个氨基酸，最优选两个氨基酸，并且甚至最优选一个氨基酸的氨基酸序列。

具有增强纤维素分解的活性的多肽优选包含SEQ ID NO：2的氨基酸序列或其等位变体；或它们的具有增强纤维素分解的活性的片段。在优选的方面，所述多肽包含SEQ ID NO：2的氨基酸序列。在另一个优选的方面，所述多肽包含SEQ ID NO：2的成熟多肽。在另一个优选的方面，所述多肽包含SEQ IDNO：2的氨基酸20至326，或其等位变体；或它们的具有增强纤维素分解的活性的片段。在另一个优选的方面，所述多肽包含SEQ ID NO：2的氨基酸20至326。在另一个优选的方面，所述多肽由SEQ ID NO：2的氨基酸序列或其等位变体；或者由它们具有增强纤维素分解的活性的片段组成。在另一个优选的方面，所述多肽由SEQ ID NO：2的氨基酸序列组成。在另一个优选的方面，所述多肽由SEQ ID NO：2的成熟多肽组成。在另一个优选的方面，所述多肽由SEQ ID NO：2的氨基酸20至326或其等位变体；或它们的具有增强纤维素分解的活性的片段组成。在另一个优选的方面，所述多肽由SEQ ID NO：2的氨基酸20至326组成。

具有增强纤维素分解的活性的多肽优选包含SEQ ID NO：4的氨基酸序列或其等位变体；或者它们的具有增强纤维素分解的活性的片段。在优选的方面，所述多肽包含SEQ ID NO：4的氨基酸序列。在另一个优选的方面，所述多肽包含SEQ ID NO：4的成熟多肽。在另一个优选的方面，所述多肽包含SEQ ID NO：4的氨基酸18至240，或其等位变体；或者它们的具有增强纤维素分解的活性的片段。在另一个优选的方面，所述多肽包含SEQ ID NO：4的氨基酸18至240。在另一个优选的方面，所述多肽由SEQ ID NO：4的氨基酸序列或其等位变体；或者它们的具有增强纤维素分解的活性的片段组成。在另一个优选的方面，所述多肽由SEQ ID NO：4的氨基酸序列组成。在另一个优选的方面，所述多肽由SEQ ID NO：4的成熟多肽组成。在另一个优选的方面，所述多肽由SEQ ID NO：4的氨基酸18至240或其等位变体；或者它们的具有增强纤维素分解的活性的片段组成。在另一个优选的方面，所述多肽由SEQ ID NO：4的氨基酸18至240组成。

具有增强纤维素分解的活性的多肽优选包含SEQ ID NO：6的氨基酸序列或其等位变体；或者它们的具有增强纤维素分解的活性的片段。在优选的方面，所述多肽包含SEQ ID NO：6的氨基酸序列。在另一个优选的方面，所述多肽包含SEQ ID NO：6的成熟多肽。在另一个优选的方面，所述多肽包含SEQ ID NO：6的氨基酸20至258，或其等位变体；或者它们的具有增强纤维素分解的活性的片段。在另一个优选的方面，所述多肽包含SEQ ID NO：6的氨基酸20至258。在另一个优选的方面，所述多肽由SEQ ID NO：6的氨基酸序列或其等位变体；或者它们的具有增强纤维素分解的活性的片段组成。在另一个优选的方面，所述多肽由SEQ ID NO：6的氨基酸序列组成。在另一个优选的方面，所述多肽由SEQ ID NO：6的成熟多肽组成。在另一个优选的方面，所述多肽由SEQ ID NO：6的氨基酸20至258或其等位变体；或者它们的具有增强纤维素分解的活性的片段组成。在另一个优选的方面，所述多肽由SEQ ID NO：6的氨基酸20至258组成。

具有增强纤维素分解的活性的多肽优选包含SEQ ID NO：8的氨基酸序列或其等位变体；或者它们的具有增强纤维素分解的活性的片段。在优选的方面，所述多肽包含SEQ ID NO：8的氨基酸序列。在另一个优选的方面，所述多肽包含SEQ ID NO：8的成熟多肽。在另一个优选的方面，所述多肽包含SEQ ID NO：8的氨基酸19至226，或其等位变体；或者它们的具有增强纤维素分解的活性的片段。在另一个优选的方面，所述多肽包含SEQ ID NO：8的氨基酸19至226。在另一个优选的方面，所述多肽由SEQ ID NO：8的氨基酸序列或其等位变体；或者它们的具有增强纤维素分解的活性的片段组成。在另一个优选的方面，所述多肽由SEQ ID NO：8的氨基酸序列组成。在另一个优选的方面，所述多肽由SEQ ID NO：8的成熟多肽组成。在另一个优选的方面，所述多肽由SEQ ID NO：8的氨基酸19至226或其等位变体；或者它们的具有增强纤维素分解的活性的片段组成。在另一个优选的方面，所述多肽由SEQ ID NO：8的氨基酸19至226组成。

具有增强纤维素分解的活性的多肽优选包含SEQ ID NO：10的氨基酸序列或其等位变体；或者它们的具有增强纤维素分解的活性的片段。在优选的方面，所述多肽包含SEQ ID NO：10的氨基酸序列。在另一个优选的方面，所述多肽包含SEQ ID NO：10的成熟多肽。在另一个优选的方面，所述多肽包含SEQ ID NO：10的氨基酸20至304，或其等位变体；或者它们的具有增强纤维素分解的活性的片段。在另一个优选的方面，所述多肽包含SEQ ID NO：10的氨基酸20至304。在另一个优选的方面，所述多肽由SEQ ID NO：10的氨基酸序列或其等位变体；或者它们的具有增强纤维素分解的活性的片段组成。在另一个优选的方面，所述多肽由SEQ ID NO：10的氨基酸序列组成。在另一个优选的方面，所述多肽由SEQ ID NO：10的成熟多肽组成。在另一个优选的方面，所述多肽由SEQ ID NO：10的氨基酸20至304或其等位变体；或者它们的具有增强纤维素分解的活性的片段组成。在另一个优选的方面，所述多肽由SEQ ID NO：10的氨基酸20至304组成。

具有增强纤维素分解的活性的多肽优选包含SEQ ID NO：12的氨基酸序列或其等位变体；或者它们的具有增强纤维素分解的活性的片段。在优选的方面，所述多肽包含SEQ ID NO：12的氨基酸序列。在另一个优选的方面，所述多肽包含SEQ ID NO：12的成熟多肽。在另一个优选的方面，所述多肽包含SEQ ID NO：12的氨基酸23至250，或其等位变体；或者它们的具有增强纤维素分解的活性的片段。在另一个优选的方面，所述多肽包含SEQ ID NO：12的氨基酸23至250。在另一个优选的方面，所述多肽由SEQ ID NO：12的氨基酸序列或其等位变体；或者它们的具有增强纤维素分解的活性的片段组成。在另一个优选的方面，所述多肽由SEQ ID NO：12的氨基酸序列组成。在另一个优选的方面，所述多肽由SEQ ID NO：12的成熟多肽组成。在另一个优选的方面，所述多肽由SEQ ID NO：12的氨基酸23至250或其等位变体；或者它们的具有增强纤维素分解的活性的片段组成。在另一个优选的方面，所述多肽由SEQ ID NO：12的氨基酸23至250组成。

具有增强纤维素分解的活性的多肽优选包含SEQ ID NO：14的氨基酸序列或其等位变体；或者它们的具有增强纤维素分解的活性的片段。在优选的方面，所述多肽包含SEQ ID NO：14的氨基酸序列。在另一个优选的方面，所述多肽包含SEQ ID NO：14的成熟多肽。在另一个优选的方面，所述多肽包含SEQ ID NO：14的氨基酸20至249，或其等位变体；或者它们的具有增强纤维素分解的活性的片段。在另一个优选的方面，所述多肽包含SEQ ID NO：14的氨基酸20至249。在另一个优选的方面，所述多肽由SEQ ID NO：14的氨基酸序列或其等位变体；或者它们的具有增强纤维素分解的活性的片段组成。在另一个优选的方面，所述多肽由SEQ ID NO：14的氨基酸序列组成。在另一个优选的方面，所述多肽由SEQ ID NO：14的成熟多肽组成。在另一个优选的方面，所述多肽由SEQ ID NO：14的氨基酸20至249或其等位变体；或者它们的具有增强纤维素分解的活性的片段组成。在另一个优选的方面，所述多肽由SEQ ID NO：14的氨基酸20至249组成。

优选地，SEQ ID NO：2的成熟多肽的片段包含至少277个氨基酸残基，更优选地至少287个氨基酸残基，并且最优选至少297个氨基酸残基。优选地，SEQ ID NO：4的成熟多肽的片段包含至少185个氨基酸残基，更优选地至少195个氨基酸残基，并且最优选至少205个氨基酸残基。优选地，SEQ IDNO：6的成熟多肽的片段包含至少200个氨基酸残基，并且优选地至少212个氨基酸残基，并且最优选至少224个氨基酸残基。优选地，SEQ ID NO：8的成熟多肽的片段包含至少175个氨基酸残基，更优选地至少185个氨基酸残基，并且最优选至少195个氨基酸残基。优选地，SEQ ID NO：10的成熟多肽的片段包含至少240个氨基酸残基，更优选地至少255个氨基酸残基，并且最优选至少270个氨基酸残基。优选地，SEQ ID NO：12的成熟多肽的片段包含至少175个氨基酸残基，更优选地至少190个氨基酸残基，并且最优选至少205个氨基酸残基。优选地，SEQ ID NO：14的成熟多肽的片段包含至少200个氨基酸残基，更优选地至少210个氨基酸残基，并且最优选至少220个氨基酸残基。

优选地，SEQ ID NO：1的成熟多肽编码序列的亚序列包含至少831个核苷酸，更优选地至少861个核苷酸，并且最优选至少891个核苷酸。优选地，SEQ ID NO：3的成熟多肽编码序列的亚序列包含至少555个核苷酸，更优选地至少585个核苷酸，并且最优选至少615个核苷酸。优选地，SEQ ID NO：5的成熟多肽编码序列的亚序列包含至少600个核苷酸，更优选地至少636个核苷酸，并且最优选至少672个核苷酸。优选地，SEQ ID NO：7的成熟多肽编码序列的亚序列包含至少525个核苷酸，更优选地至少555个核苷酸，并且最优选至少585个核苷酸。优选地，SEQ ID NO：9的成熟多肽编码序列的亚序列包含至少720个核苷酸，更优选地至少765个核苷酸，并且最优选至少810个核苷酸。优选地，SEQ ID NO：11的成熟多肽编码序列的亚序列包含至少525个核苷酸，更优选地至少570个核苷酸，并且最优选至少615个核苷酸。优选地，SEQ ID NO：13的成熟多肽编码序列的亚序列包含至少600个核苷酸，更优选地至少630个核苷酸，并且最优选至少660个核苷酸。

在第四方面，具有增强纤维素分解的活性的分离的多肽由包含下述核苷酸序列的多核苷酸编码，所述核苷酸序列在至少非常低严紧条件下，优选至少低严紧条件下，更优选至少中严紧条件下，更优选至少中-高严紧条件下，甚至更优选至少高严紧条件下，并且最优选至少非常高严紧条件下与以下杂交：(i)SEQ ID NO：1、SEQ ID NO：3、SEQ ID NO：5、SEQ ID NO：7、SEQ IDNO：9、SEQ ID NO：11，或SEQ ID NO：13的成熟多肽编码序列，(ii)包含在SEQ ID NO：1、SEQ ID NO：3、SEQ ID NO：5或SEQ ID NO：11的成熟多肽编码序列中的cDNA序列，或包含SEQ ID NO：7、SEQ ID NO：9或SEQ ID NO：13的成熟多肽编码序列的基因组DNA序列，(iii)(i)或(ii)的亚序列，或者(iv)(i)、(ii)或(iii)的全长互补链(J J.Sambrook，E.F.Fritsch和T.Maniatis，1989，Molecular Cloning，A Laboratory Manual，第2版，Cold Spring Harbor，NewYork)。SEQ ID NO：1、SEQ ID NO：3、SEQ ID NO：5、SEQ ID NO：7、SEQ IDNO：9、SEQ ID NO：11，或SEQ ID NO：13的成熟多肽编码序列的亚序列含有至少100个连续的核苷酸或优选至少200个连续的核苷酸。此外，所述亚序列可编码具有增强纤维素分解的活性的多肽片段。在优选的方面，所述成熟多肽编码序列是SEQ ID NO：1的核苷酸388至1332、SEQ ID NO：3的核苷酸98至821、SEQ ID NO：5的核苷酸126至978、SEQ ID NO：7的核苷酸55至678、SEQ ID NO：9的核苷酸58至912、SEQ ID NO：11的核苷酸67至796，或SEQ ID NO：13的核苷酸77至766。

SEQ ID NO：1、SEQ ID NO：3、SEQ ID NO：5、SEQ ID NO：7、SEQ ID NO：9、SEQ ID NO：11，或SEQ ID NO：13的核苷酸序列或其亚序列，以及SEQ IDNO：2、SEQ ID NO：4、SEQ ID NO：6、SEQ ID NO：8，或SEQ ID NO：10、SEQ ID NO：12，或SEQ ID NO：14的氨基酸序列或其片段，可以用于设计核酸探针，以从不同属和种的菌株鉴定和克隆编码具有增强纤维素分解的活性的多肽的DNA。尤其，这样的探针可用于根据标准Southern印迹程序与感兴趣的属或种的基因组或cDNA杂交，以鉴定和分离其中相应的目的基因。这样的探针可能比整个序列短很多，但是其长度应该是至少14，优选至少25，更优选至少35，并且最优选至少70个核苷酸。然而，优选所述核酸探针的长度为至少100个核苷酸。例如，核酸探针的长度可为至少200个核苷酸，优选至少300个核苷酸，更优选至少400个核苷酸，或最优选至少500个核苷酸。甚至可以用更长的探针，例如，长度为至少600个核苷酸，至少优选至少700个核苷酸，更优选至少800个核苷酸，或最优选至少900个核苷酸的核酸探针。DNA和RNA探针都可以使用。通常将探针加以标记用于检测相应的基因(例如，用³²P、³H、³⁵S、生物素或抗生物素蛋白(avidin)标记)。这些探针都包含在本发明中。

因而，可从由这些其它菌株制备的基因组DNA或cDNA文库中筛选DNA，所述DNA与上述探针杂交并且编码具有增强纤维素分解的活性的多肽。可以通过琼脂糖或聚丙烯酰胺凝胶电泳，或通过其它分离技术来分离来自这些其它菌株的基因组或其它DNA。可以将来自文库的DNA或分离的DNA转移至并固定在硝化纤维素(nitrocellulose)或其它合适的载体材料上。为了鉴定与SEQ ID NO：1或其亚序列同源的克隆或DNA，优选将所述载体材料用在Sounthern印迹中。

就本发明而言，杂交表示核苷酸序列在非常低至非常高的严紧条件下与标记的核酸探针杂交，所述核酸探针对应于SEQ ID NO：1、SEQ ID NO：3、SEQ ID NO：5、SEQ ID NO：7、SEQ ID NO：9、SEQ ID NO：11，或SEQ ID NO：13的成熟多肽编码序列，包含在SEQ ID NO：1、SEQ ID NO：3、SEQ ID NO：5或SEQ ID NO：11的成熟多肽编码序列中的cDNA序列，或包含SEQ ID NO：7、SEQ ID NO：9或SEQ ID NO：13的成熟多肽编码序列的基因组DNA序列，它的全长互补链或其亚序列。可使用例如X射线片(X-ray film)检测在这些条件下与所述核酸探针杂交的分子。

在优选的方面，核酸探针是SEQ ID NO：1的成熟多肽编码序列。在另一优选的方面，核酸探针是SEQ ID NO：1的核苷酸388至1332。在另一优选的方面，核酸探针是编码SEQ ID NO：2的多肽的多核苷酸序列，或其亚序列。在另一优选的方面，核酸探针是SEQ ID NO：1。在另一优选的方面，核酸探针是包含于大肠杆菌(E.coli)NRRL B-30699中的质粒pEJG120所包含的多核苷酸序列，其中它的多核苷酸序列编码具有增强纤维素分解的活性的多肽。在另一优选的方面，核酸探针是包含于大肠杆菌NRRL B-30699中的质粒pEJG120所包含的成熟多肽编码区。

在另一优选的方面，核酸探针是SEQ ID NO：3的成熟多肽编码序列。在另一优选的方面，核酸探针是SEQ ID NO：3的核苷酸98至821。在另一优选的方面，核酸探针是编码SEQ ID NO：4的多肽的多核苷酸序列，或其亚序列。在另一优选的方面，核酸探针是SEQ ID NO：3。在另一优选的方面，核酸探针是包含于大肠杆菌NRRL B-30813中的质粒pTter61C所包含的多核苷酸序列，其中它的多核苷酸序列编码具有增强纤维素分解的活性的多肽。在另一优选的方面，核酸探针是包含于大肠杆菌NRRL B-30813中的质粒pTter61C所包含的成熟多肽编码区。

在另一优选的方面，核酸探针是SEQ ID NO：5的成熟多肽编码序列。在另一优选的方面，核酸探针是SEQ ID NO：5的核苷酸126至978。在另一优选的方面，核酸探针是编码SEQ ID NO：6的多肽的多核苷酸序列，或其亚序列。在另一优选的方面，核酸探针是SEQ ID NO：5。在另一优选的方面，核酸探针是包含于大肠杆菌NRRL B-30812中的质粒pTter61D所包含的多核苷酸序列，其中它的多核苷酸序列编码具有增强纤维素分解的活性的多肽。在另一优选的方面，核酸探针是包含于大肠杆菌NRRL B-30812中的质粒pTter61D所包含的成熟多肽编码区。

在另一优选的方面，核酸探针是SEQ ID NO：7的成熟多肽编码序列。在另一优选的方面，核酸探针是SEQ ID NO：7的核苷酸55至678。在另一个、优选的方面，核酸探针是编码SEQ ID NO：8的多肽的多核苷酸序列，或其亚序列。在另一优选的方面，核酸探针是SEQ ID NO：7。在另一优选的方面，核酸探针是包含于大肠杆菌NRRL B-30814中的质粒pTter61E所包含的多核苷酸序列，其中它的多核苷酸序列编码具有增强纤维素分解的活性的多肽。在另一优选的方面，核酸探针是包含于大肠杆菌NRRL B-30814中的质粒pTter61E所包含的成熟多肽编码区。

在另一优选的方面，核酸探针是SEQ ID NO：9的成熟多肽编码序列。在另一优选的方面，核酸探针是SEQ ID NO：9的核苷酸58至912。在另一优选的方面，核酸探针是编码SEQ ID NO：10的多肽的多核苷酸序列，或其亚序列。在另一优选的方面，核酸探针是SEQ ID NO：9。在另一优选的方面，核酸探针是包含于大肠杆菌NRRL B-30811中的质粒pTter61G所包含的多核苷酸序列，其中它的多核苷酸序列编码具有增强纤维素分解的活性的多肽。在另一优选的方面，核酸探针是包含于大肠杆菌NRRL B-30811中的质粒pTter61G所包含的成熟多肽编码区。

在另一优选的方面，核酸探针是SEQ ID NO：11的成熟多肽编码序列。在另一优选的方面，核酸探针是SEQ ID NO：11的核苷酸67至796。在另一优选的方面，核酸探针是编码SEQ ID NO：12的多肽的多核苷酸序列，或其亚序列。在另一优选的方面，核酸探针是SEQ ID NO：11。在另一优选的方面，核酸探针是包含于大肠杆菌NRRL B-30704中的质粒pDZA2-7所包含的多核苷酸序列，其中它的多核苷酸序列编码具有增强纤维素分解的活性的多肽。在另一优选方面，核酸探针是包含于大肠杆菌NRRL B-30704中的质粒pDZA2-7所包含的成熟多肽编码区。

在另一优选的方面，核酸探针是SEQ ID NO：13的成熟多肽编码序列。在另一优选的方面，核酸探针是SEQ ID NO：13的核苷酸77至766。在另一优选的方面，核酸探针是编码SEQ ID NO：14的多肽的多核苷酸序列，或其亚序列。在另一优选的方面，核酸探针是SEQ ID NO：13。在另一优选的方面，核酸探针是包含于大肠杆菌NRRL B-30878中的质粒pTr333所包含的多核苷酸序列，其中它的多核苷酸序列编码具有增强纤维素分解的活性的多肽。在另一优选的方面，核酸探针是包含于大肠杆菌NRRL B-30878中的质粒pTr333所包含的成熟多肽编码区。

对于长度至少100个核苷酸的长探针，将非常低至非常高的严紧条件定义为在42℃，在5X SSPE、0.3％ SDS、200μg/ml已剪切并且变性的鲑精DNA中，并且对于非常低和低严紧性为25％的甲酰胺、对于中和中-高严紧性为35％的甲酰胺、或对于高和非常高严紧性为50％的甲酰胺，根据标准的Southern印迹法进行预杂交和杂交最佳12至24小时。

对于长度为至少100个核苷酸的长探针，使用2X SSC、0.2％ SDS优选至少在45℃(非常低严紧性)，更优选至少在50℃(低严紧性)，更优选至少在55℃(中严紧性)，更优选至少在60℃(中-高严紧性)，甚至更优选至少在65℃(高严紧性)，并且最优选至少在70℃(非常高严紧性)将载体材料最终洗涤三次，每次15分钟。

对于长度大约15个核苷酸至大约70个核苷酸的短探针，将严紧条件定义为在比根据Bolton和McCarthy计算法(1962，Proceedings of the NationalAcademy of Sciences USA 48：1390)得出的T_m低大约5℃至大约10℃，在0.9MNaCl，0.09M Tris-HCl pH 7.6，6mM EDTA，0.5％ NP-40，1×Denhardt溶液，1mM焦磷酸钠(sodium pyrophosphate)，1mM磷酸二氢钠(sodium monobasicphosphate)，0.1mM ATP和0.2mg每ml的酵母RNA中，根据标准的Southern 印迹步骤进行预杂交、杂交和杂交后洗涤最佳12至24小时。

对于长度大约15个核苷酸至大约70个核苷酸的短探针，将所述载体材料在比计算的T_m低5℃至10℃的温度下在6×SSC加0.1％ SDS中洗涤一次15分钟，并用6×SSC洗涤两次，每次15分钟。

在第五方面，具有增强纤维素分解的活性的分离的多肽由包含或组成为如下核苷酸序列的多核苷酸编码，所述核苷酸序列与SEQ ID NO：1、SEQ IDNO：3、SEQ ID NO：5、SEQ ID NO：7、SEQ ID NO：9、SEQ ID NO：11或SEQID NO：13的成熟多肽编码序列具有优选至少60％的序列同一性程度，更优选至少65％，更优选至少70％，更优选至少75％，更优选至少80％，更优选至少85％，甚至更优选至少90％，最优选至少95％，并且甚至最优选至少96％，97％，98％，或99％的同一性程度，其编码具有增强纤维素分解的活性的活性多肽。

在优选的方面，成熟多肽编码序列是SEQ ID NO：1的核苷酸388至1332，SEQ ID NO：3的核苷酸98至821，SEQ ID NO：5的核苷酸126至978，SEQID NO：7的核苷酸55至678，SEQ ID NO：9的核苷酸58至912，SEQ ID NO：11的核苷酸67至796，或SEQ ID NO：13的核苷酸77至766。参见本文中多核苷酸部分。

在第六方面，具有增强纤维素分解的活性的分离的多肽是人工变体，所述人工变体在SEQ ID NO：2、SEQ ID NO：4、SEQ ID NO：6、SEQ ID NO：8，或SEQ ID NO：10、SEQ ID NO：12，或SEQ ID NO：14的成熟多肽，或其同源序列中包含一个或多个(几个)氨基酸的取代、缺失和/或插入。优选氨基酸改变对性质是较不重要的(of a minor nature)，即保守的氨基酸取代或插入，其不显著影响蛋白质的折叠和/或活性；通常为1至大约30个氨基酸的小缺失；小的氨基或羧基末端延伸，例如氨基末端甲硫氨酸残基；多至大约20-25个残基的小接头肽；或通过改变净电荷或其它功能来促进纯化的小延伸(如多组氨酸区(poly histidine tract)、抗原表位(antigenic epitope)或结合域(bindingdomain))。

保守取代的实例是在以下组之内：碱性氨基酸组(精氨酸、赖氨酸和组氨酸)、酸性氨基酸组(谷氨酸和天冬氨酸)、极性氨基酸组(谷氨酰胺和天冬酰胺)、疏水性氨基酸组(亮氨酸、异亮氨酸和缬氨酸)、芳族氨基酸组(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸组(甘氨酸、丙氨酸、丝氨酸、苏氨酸和甲硫氨酸)。通常不改变比活性(specific activity)的氨基酸取代是本领域已知的，并且由例如H.Neurath和R.L.Hill，1979，于The Proteins，Academic Press，New York描述。最普遍发生的交换是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly。

除了20个标准氨基酸，可以以非标准的氨基酸(例如4-羟脯氨酸、6-N-甲基赖氨酸、2-氨基异丁酸、异缬氨酸和α-甲基丝氨酸)取代野生型多肽的氨基酸残基。可以用有限数目的非保守氨基酸、不由遗传密码编码的氨基酸和非天然氨基酸取代氨基酸残基。“非天然氨基酸”在蛋白质合成后已经过修饰，和/或在它们的侧链具有不同于基本氨基酸的化学结构。非天然氨基酸能够以化学方法合成，并且优选是商业上能够获得的，包括六氢吡啶羧酸(pipecolic acid)、噻唑烷羧酸(thiazolidine carboxylic acid)、脱氢脯氨酸、3-和4-甲基脯氨酸，和3，3-二甲基脯氨酸。

可供选择的是，氨基酸改变具有这样的性质以使多肽的物理化学性质改变。例如，氨基酸改变可改进多肽的热稳定性，改变底物特异性，改变最适pH等。

能够根据本领域已知的方法，例如定位诱变或丙氨酸分区诱变法(Cunningham和Wells，1989，Science 244：1081-1085)来鉴定亲本多肽中的必需氨基酸。在后一技术中，将单一丙氨酸突变导入到分子中的每个残基，并且测试所得突变分子的生物活性以鉴定对于所述分子的活性关键的氨基酸残基。同样参见Hilton等，1996，J.Biol.Chem.271：4699-4708。酶的活性部位或其它的生物相互作用也能够通过结构的物理分析而测定，如通过以下这些技术：如核磁共振、晶体学、电子衍射或光亲和标记，连同推定的接触位点氨基酸的突变来测定。参见例如de Vos等，1992，Science 255：306-312；Smith等，1992，J.Mol.Biol.224：899-904；Wlodaver等，1992，FEBS Lett.309：59-64。也可通过分析与本发明多肽的相关多肽的同一性来推断必需氨基酸的身份。

能够使用已知的诱变、重组和/或改组(shuffling)方法，然后是有关的筛选方法，例如那些由Reidhaar-Olson和Sauer，1988，Science 241：53-57；Bowie和Sauer，1989，Proc.Natl.Acad.Sci.USA 86：2152-2156；WO 95/17413；或WO95/22625公开的那些方法来进行并测试单个或多个氨基酸取代、缺失和/或插入。能够使用的其它方法包括易错PCR、噬菌体展示(例如，Lowman等，1991， Biochem.30：10832-10837；美国专利No.5,223,409；WO 92/06204)和区域定向的诱变(Derbyshire等，1986，Gene 46：145；Ner等，1988，DNA 7：127)。

诱变/改组方法能够与高通量、自动化的筛选方法组合以检测由宿主细胞表达的克隆的、诱变的多肽的活性(Ness等，1999，Nature Biotechnology 17：893-896)。能够从宿主细胞回收编码活性多肽的诱变的DNA分子，并且使用本领域内标准方法快速测序。这些方法允许快速确定感兴趣的多肽中单个氨基酸残基的重要性，并且能够应用于未知结构的多肽。

SEQ ID NO：2、SEQ ID NO：4、SEQ ID NO：6、SEQ ID NO：8、SEQ ID NO：10、SEQ ID NO：12，或SEQ ID NO：14的成熟多肽的氨基酸取代、缺失和/或插入的总数是10，优选9，更优选8，更优选7，更优选至多6，更优选5，更优选4，甚至更优选3，最优选2，并且甚至最优选1。

具有增强纤维素分解的活性的多肽可以获得自任何属的微生物。就本发明而言，用于本文与给定的来源有关的术语“获得自”，意思是由核苷酸序列编码的多肽由所述来源产生，或由其中插入了来自所述来源的核苷酸序列的菌株产生。在优选的方面，获得自给定来源的多肽是胞外分泌的。

具有增强纤维素分解的活性的多肽可以是细菌多肽。例如，多肽可以是革兰氏阳性细菌的多肽，如具有增强纤维素分解的活性的芽孢杆菌属(Bacillus)、链球菌属(Streptococcus)、链霉菌属(Streptomyces)、葡萄球菌属(Staphylococcus)、肠球菌属(Enterococcus)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、梭菌属(Clostridium)、地芽孢杆菌属(Geobacillus)，或海洋芽孢菌属(Oceanobacillus)多肽，或革兰氏阴性细菌的多肽，如具有增强纤维素分解的活性的大肠杆菌、假单胞菌属(Pseudomonas)、沙门氏菌属(Salmonella)、弯曲杆菌属(Campylobacter)、螺杆菌属(Helicobacter)、黄杆菌属(Flavobacterium)、梭杆菌属(Fusobacterium)、泥杆菌属(Ilyobacter)、奈瑟氏菌属(Neisseria)或脲原体属(Ureaplasma)多肽。

在优选的方面，多肽是具有增强纤维素分解的活性的嗜碱芽孢杆菌(Bacillus alkalophilus)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、短芽孢杆菌(Bacillus brevis)、环状芽孢杆菌(Bacillus circulans)、克劳氏芽孢杆菌(Bacillusclausii)、凝结芽孢杆菌(Bacillus coagulans)、坚强芽孢杆菌(Bacillus firmus)、灿烂芽孢杆菌(Bacillus lautus)、迟缓芽孢杆菌(Bacillus lentus)、地衣芽孢杆菌(Bacillus licheniformis)、巨大芽孢杆菌(Bacillus megaterium)、短小芽孢杆菌 (Bacillus pumilus)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)、枯草芽孢杆菌(Bacillus subtilis)，或苏云金芽孢杆菌(Bacillus thuringiensis)多肽。

在另一个优选的方面，多肽是具有增强纤维素分解的活性的似马链球菌(Streptococcus equisimilis)、酿脓链球菌(Streptococcus pyogenes)、乳房链球菌(Streptococcus uberis)或马链球菌兽瘟亚种(Streptococcus equi subsp.Zooepidemicus)多肽。

在另一个优选的方面，多肽是具有增强纤维素分解的活性的不产色链霉菌(Streptomyces achromogenes)、除虫链霉菌(Streptomyces avermitilis)、天蓝色链霉菌(Streptomyces coelicolor)、灰色链霉菌(Streptomyces griseus)，或浅青紫链霉菌(Streptomyces lividans)多肽。

具有增强纤维素分解的活性的多肽还可以是具有增强纤维素分解的活性的真菌多肽，并且更优选是酵母多肽，如念珠菌属(Candida)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)或西洋蓍霉属(Yarrowia)多肽；或更优选是具有增强纤维素分解的活性的丝状真菌多肽，如枝顶孢霉属(Acremonium)、伞菌属(Agaricus)、链格孢属(Alternaria)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、Botryospaeria、拟蜡菌属(Ceriporiopsis)、毛喙壳属(Chaetomidium)、金孢子菌属(Chrysosporium)、麦角菌属(Claviceps)、旋孢腔菌属(Cochliobolus)、鬼伞属(Coprinopsis)、Coptotermes、棒囊壳属(Corynascus)、隐丛赤壳菌属(Cryphonectria)、隐球菌属(Cryptococcus)、色二孢属(Diplodia)、黑胶菌属(Exidia)、Filibasidium、镰孢属(Fusarium)、全鞭毛虫属(Holomastigotorides)、腐质霉属(Humicola)、耙菌属(Irpex)、香菇属(Lentinula)、Leptospaeria、梨孢菌属(Magnaporthe)、Melanocarpus、亚灰树花菌属(Meripilus)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、新考玛脂霉属(Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、平革菌属(Phanerochaete)、瘤胃壶菌属(Piromyces)、Poitrasia、假黑盘菌属(Pseudoplectania)、假披发虫属(Pseudotrichonympha)、根毛霉属(Rhizomucor)、裂褶菌属(Schizophyllum)、柱霉属(Scytalidium)、踝节菌属(Talaromyces)、嗜热霉属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、木霉属(Trichoderma)、长毛盘菌属(Trichophaea)、轮枝孢属(Verticillium)、草菇属(Volvariella)或炭角菌属(Xylaria)多肽。

在优选的方面，多肽是具有增强纤维素分解的活性的卡尔酵母(Saccharomyces carlsbergensis)、酿酒酵母、糖化酵母(Saccharomycesdiastaticus)、道格拉氏酵母(Saccharomyces douglasii)、克鲁弗酵母(Saccharomyces kluyveri)、诺地酵母(Saccharomyces norbensis)或卵形酵母(Saccharomyces oviformis)多肽。

在另一优选的方面，多肽是具有增强纤维素分解的活性的解纤维枝顶孢霉(Acremonium cellulolyticus)、棘孢曲霉(Aspergillus aculeatus)、泡盛曲霉(Aspergillus awamori)、烟曲霉(Aspergillus fumigatus)、臭曲霉(Aspergillusfoetidus)、日本曲霉(Aspergillus japonicus)、构巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillus niger)、米曲霉(Aspergillus oryzae)、嗜角质金孢子菌(Chrysosporium keratinophilum)、Chrysosporium lucknowense、热带金孢子菌(Chrysosporium tropicum)、粪状金孢子菌(Chrysosporium merdarium)、Chrysosporium inops、Chrysosporium pannicola、昆士兰金孢子菌(Chrysosporium queenslandicum)、Chrysosporium zonatum、杆孢状镰孢(Fusarium bactridioides)、禾谷镰孢(Fusarium cerealis)、库威镰孢(Fusariumcrookwellense)、大刀镰孢(Fusarium culmorum)、禾本科镰孢(Fusariumgraminearum)、禾赤镰孢(Fusarium graminum)、异孢镰孢(Fusariumheterosporum)、合欢木镰孢(Fusarium negundi)、尖镰孢(Fusarium oxysporum)、多枝镰孢(Fusarium reticulatum)、粉红镰孢(Fusarium roseum)、接骨木镰孢(Fusarium sambucinum)、肤色镰孢(Fusarium sarcochroum)、拟分枝孢镰孢(Fusarium sporotrichioides)、硫色镰孢(Fusarium sulphureum)、圆镰孢(Fusariumtorulosum)、拟丝孢镰孢(Fusarium trichothecioides)、镶片镰孢(Fusariumvenenatum)、灰腐质霉(Humicola grisea)、特异腐质霉(Humicola insolens)、疏棉状腐质霉(Humicola lanuginosa)、乳白耙菌(Irpex lacteus)、米赫毛霉(Mucormiehie)、嗜热毁丝霉(Myceliophthora thermophila)、粗糙脉孢菌(Neurosporacrassa)、绳状青霉(Penicillium funiculosum)、产紫青霉(Penicilliumpurpurogenum)、黄孢平革菌(Phanerochaete chrysosporium)、无色梭孢壳(Thielavia achromatica)、Thielavia albomyces、Thielavia albopilosa、澳洲梭孢壳(Thielavia australeinsis)、Thielavia fimeti、微孢梭孢壳(Thielavia microspora)、卵孢梭孢壳(Thielavia ovispora)、Thielavia peruviana、Thielavia spededonium、毛梭孢壳(Thielavia setosa)、Thielavia subthermophila、土生梭孢霉、哈茨木霉 (Trichoderma harzianum)、康宁木霉(Trichoderma koningji)、长枝木霉(Trichoderma longibrachiatum)、里氏木霉、绿色木霉(Trichoderma viride)或Trichophaea saccata多肽。

在更优选的方面，多肽是具有增强纤维素分解的活性的土生梭孢霉多肽。在最优选的实施方案中，多肽是具有增强纤维素分解的活性的土生梭孢霉NRRL 8126多肽，例如，SEQ ID NO：2、4、6、8或10的成熟多肽，或其具有增强纤维素分解的活性的片段。

在另一更优选的方面，多肽是具有增强纤维素分解的活性的桔橙嗜热霉(Thermoascus aurantiacus)多肽，例如，SEQ ID NO：12的成熟多肽。

在另一更优选的方面，多肽是具有增强纤维素分解的活性的里氏木霉多肽。在另一最优选的方面，多肽是具有增强纤维素分解的活性的里氏木霉RutC30(ATCC 56765)多肽，例如，SEQ ID NO：14的成熟多肽，或其具有增强纤维素分解的活性的片段。

可理解的是对于前述的物种，本发明包含完全和不完全阶段(perfect andimperfect states)两者，和其它分类学的等同物(equivalent)，例如无性型(anamorph)，而无论它们已知的种名。本领域技术人员将轻易地识别适合的等同物的身份。

这些物种的菌株在许多培养物保藏中心对于公众能够轻易地取得，所述保藏中心诸如美国典型培养物保藏中心(the American Type Culture Collection)(ATCC)、德意志微生物和细胞培养物保藏中心(Deutsche Sammiung vonMikroorganismen und Zellkulturen GmbH)(DSM)、真菌菌种保藏中心(Centraalbureau Voor Schimmelcultures)(CBS)和农业研究机构专利培养物保藏中心，北区研究中心(Agricultural Research Service Patent Culture Collection，Northern Regional Research Center)(NRRL)。

此外，可以使用上述的探针从其它来源，包括从自然界(例如，土壤、堆肥、水等)分离的微生物鉴定和获得这些多肽。用于从天然生境(habitat)分离微生物的技术是本领域公知的。然后可通过相似地筛选这种微生物的基因组或cDNA文库来获得所述多核苷酸。一旦用所述探针检测到编码多肽的多核苷酸序列，就能够使用本领域普通技术人员熟知的技术来分离或克隆所述多核苷酸(参见，例如，Sambrook等，1989，见上文)。

具有增强纤维素分解的活性的多肽还可以包括融合多肽或可切割的融合多肽，其中将另一种多肽融合到所述具有增强纤维素分解的活性的多肽或其片段的N末端或C末端。通过将编码另一种多肽的核苷酸序列(或其部分)融合于编码具有增强纤维素分解的活性的多肽的核苷酸序列(或其部分)来产生融合的多肽。产生融合多肽的技术是本领域已知的，并包括连接编码多肽的编码序列以使它们在阅读框中，并且使融合多肽的表达在相同启动子和终止子的控制下。

关于具有增强纤维素分解的活性的多肽及其多核苷酸的详细信息，参见WO 2005/074647、WO 2005/074656，和美国公开申请系列号2007/0077630，所述文献通过提述并入本文。

可以分离包含核苷酸序列(其编码具有增强纤维素分解的活性的多肽)的多核苷酸并用于实施本发明的方法，如本文所述。

多核苷酸包含或组成为如下核苷酸序列，所述核苷酸序列与SEQ ID NO：1、SEQ ID NO：3、SEQ ID NO：5、SEQ ID NO：7、SEQ ID NO：9、SEQ ID NO：11，或SEQ ID NO：13的成熟多肽编码序列具有优选至少60％，更优选至少65％，更优选至少70％，更优选至少75％，更优选至少80％，更优选至少85％，甚至更优选至少90％，最优选至少95％，并且甚至最优选至少96％，97％，98％或99％的同一性程度，其编码具有增强纤维素分解的活性的多肽。

在优选的方面，核苷酸序列包含或组成为SEQ ID NO：1。在另一更优选的方面，核苷酸序列包含或组成为包含在大肠杆菌NRRL B-30699中的质粒pEJG120所包含的序列。在另一优选的方面，核苷酸序列包含或组成为SEQ IDNO：1的成熟多肽编码区。在另一更优选的方面，核苷酸序列包含或组成为包含在大肠杆菌NRRL B-30699中的质粒pEJG120所包含的成熟多肽编码区。本发明还包括编码多肽的核苷酸序列，所述多肽包含或组成为SEQ ID NO：2的氨基酸序列或其成熟多肽，所述氨基酸序列由于遗传密码的简并性而不同于SEQ ID NO：1。本发明还涉及SEQ ID NO：1的亚序列，其编码SEQ ID NO：2的具有增强纤维素分解的活性的片段。

在另一优选的方面，核苷酸序列包含或组成为SEQ ID NO：3。在另一更优选的方面，核苷酸序列包含或组成为包含在大肠杆菌NRRL B-30813中的质粒pTter61C所包含的序列。在另一优选的方面，核苷酸序列包含或组成为SEQ ID NO：3的成熟多肽编码区。在另一更优选的方面，核苷酸序列包含或组成为包含在大肠杆菌NRRL B-30813中的质粒pTter61C所包含的成熟多肽编码区。本发明还包括编码多肽的核苷酸序列，所述多肽包含或组成为SEQ ID NO：4的氨基酸序列或其成熟多肽，所述氨基酸序列由于遗传密码的简并性而不同于SEQ ID NO：3。本发明还涉及SEQ ID NO：3的亚序列，其编码SEQ ID NO：4的具有增强纤维素分解的活性的片段。

在另一优选的方面，核苷酸序列包含或组成为SEQ ID NO：5。在另一更优选的方面，核苷酸序列包含或组成为包含在大肠杆菌NRRL B-30812中的质粒pTter61D所包含的序列。在另一优选的方面，核苷酸序列包含或组成为SEQ ID NO：5的成熟多肽编码区。在另一更优选的方面，核苷酸序列包含或组成为包含在大肠杆菌NRRL B-30812中的质粒pTter61D所包含的成熟多肽编码区。本发明还包括编码多肽的核苷酸序列，所述多肽包含或组成为SEQID NO：6的氨基酸序列或其成熟多肽，所述氨基酸序列由于遗传密码的简并性而不同于SEQ ID NO：5。本发明还涉及SEQ ID NO：5的亚序列，其编码SEQ ID NO：6的具有增强纤维素分解的活性的片段。

在另一优选的方面，核苷酸序列包含或组成为SEQ ID NO：7。在另一更优选的方面，核苷酸序列包含或组成为包含在大肠杆菌NRRL B-30814中的质粒pTter61E所包含的序列。在另一优选的方面，核苷酸序列包含或组成为SEQ ID NO：7的成熟多肽编码区。在另一更优选的方面，核苷酸序列包含或组成为包含在大肠杆菌NRRL B-30814中的质粒pTter61E所包含的成熟多肽编码区。本发明还包括编码多肽的核苷酸序列，所述多肽包含或组成为SEQID NO：8的氨基酸序列或其成熟多肽，所述氨基酸序列由于遗传密码的简并性而不同于SEQ ID NO：7。本发明还涉及SEQ ID NO：7的亚序列，其编码SEQ ID NO：8的具有增强纤维素分解的活性的片段。

在另一优选的方面，核苷酸序列包含或组成为SEQ ID NO：9。在另一更优选的方面，核苷酸序列包含或组成为包含在大肠杆菌NRRL B-30811中的质粒pTter61G所包含的序列。在另一优选的方面，核苷酸序列包含或组成为SEQ ID NO：9的成熟多肽编码区。在另一更优选的方面，核苷酸序列包含或组成为包含在大肠杆菌NRRL B-30811中的质粒pTter61G所包含的成熟多肽编码区。本发明还包括编码多肽的核苷酸序列，所述多肽包含或组成为SEQID NO：10的氨基酸序列或其成熟多肽，所述氨基酸序列由于遗传密码的简并性而不同于SEQ ID NO：9。本发明还涉及SEQ ID NO：9的亚序列，其编码SEQ ID NO：10的具有增强纤维素分解的活性的片段。

在另一优选的方面，核苷酸序列包含或组成为SEQ ID NO：11。在另一更优选的方面，核苷酸序列包含或组成为包含在大肠杆菌NRRL B-30704中的质粒pDZA2-7所包含的序列。在另一优选的方面，核苷酸序列包含或组成为SEQ ID NO：11的成熟多肽编码区。在另一更优选的方面，核苷酸序列包含或组成为包含在大肠杆菌NRRL B-30704中的质粒pDZA2-7所包含的成熟多肽编码区。本发明还包括编码多肽的核苷酸序列，所述多肽包含或组成为SEQID NO：12的氨基酸序列或其成熟多肽，所述氨基酸序列由于遗传密码的简并性而不同于SEQ ID NO：11。本发明还涉及SEQ ID NO：11的亚序列，其编码SEQ ID NO：12的具有增强纤维素分解的活性的片段。

在另一优选的方面，核苷酸序列包含或组成为SEQ ID NO：13。在另一更优选的方面，核苷酸序列包含或组成为包含在大肠杆菌NRRL B-30878中的质粒pTr3337所包含的序列。在另一优选的方面，核苷酸序列包含或组成为SEQ ID NO：13的成熟多肽编码区。在另一更优选的方面，核苷酸序列包含或组成为包含在大肠杆菌NRRL B-30878中的质粒pTr3337所包含的成熟多肽编码区。本发明还包括编码多肽的核苷酸序列，所述多肽包含或组成为SEQID NO：14的氨基酸序列或其成熟多肽，所述氨基酸序列由于遗传密码的简并性而不同于SEQ ID NO：13。本发明还涉及SEQ ID NO：13的亚序列，其编码SEQ ID NO：14的具有增强纤维素分解的活性的片段。

本发明还涉及在SEQ ID NO：1、SEQ ID NO：3、SEQ ID NO：5、SEQ IDNO：7、SEQ ID NO：9、SEQ ID NO：11，或SEQ ID NO：13的成熟多肽编码序列中包含至少一个突变的突变多核苷酸，其中所述突变核苷酸序列编码SEQID NO：2、SEQ ID NO：4、SEQ ID NO：6、SEQ ID NO：8，或SEQ ID NO：10、SEQ ID NO：12，或SEQ ID NO：14的成熟多肽。在优选的方面，所述成熟多肽是SEQ ID NO：2的氨基酸20至326，SEQ ID NO：4的氨基酸18至240，SEQ ID NO：6的氨基酸20至258，SEQ ID NO：8的氨基酸19至226，或SEQID NO：10的氨基酸20至304，SEQ ID NO：12的氨基酸23至250，或SEQ IDNO：14的氨基酸20至249。在另一优选的方面，所述成熟多肽编码序列是SEQ ID NO：1的核苷酸388至1332、SEQ ID NO：3的核苷酸98至821、SEQID NO：5的核苷酸126至978、SEQ ID NO：7的核苷酸55至678、SEQ ID NO：9的核苷酸58至912、SEQ ID NO：11的核苷酸67至796，或SEQ ID NO：13的核苷酸77至766。

如前所述，用于分离或克隆编码多肽的多核苷酸的技术是本领域内已知的，并包括从基因组DNA分离，从cDNA制备，或其组合。

多肽还可以包含多核苷酸，所述多核苷酸包含或组成为核苷酸序列，所述核苷酸序列编码具有增强纤维素分解的活性的多肽，所述多核苷酸在至少非常低严紧条件下，优选至少低严紧条件，更优选至少中等严紧条件，更优选至少中-高严紧条件，甚至更优选至少高严紧条件，并且最优选至少非常高的严紧条件下，与以下杂交：(i)SEQ ID NO：1、SEQ ID NO：3、SEQ ID NO：5、SEQID NO：7、SEQ ID NO：9、SEQ ID NO：11，或SEQ ID NO：13的成熟多肽编码序列，(ii)包含在SEQ ID NO：1、SEQ ID NO：3、SEQ ID NO：5或SEQ ID NO：11的成熟多肽编码序列中的cDNA序列或包含SEQ ID NO：7、SEQ ID NO：9或SEQ ID NO：13的成熟多肽编码序列的基因组DNA序列，或(iii)(i)或(ii)的全长互补链；或它们的等位变体和亚序列(Sambrook等，1989，见上文)，如本文所定义的。在优选的方面，所述成熟多肽编码序列是SEQ ID NO：1的核苷酸388至1332，SEQ ID NO：3的核苷酸98至821，SEQ ID NO：5的核苷酸126至978，SEQ ID NO：7的核苷酸55至678，SEQ ID NO：9的核苷酸58至912，SEQ ID NO：11的核苷酸67至796，或SEQ ID NO：13的核苷酸77至766。

β-葡糖苷酶及其多核苷酸

用于处理含纤维素材料的具有β-葡糖苷酶活性的任何多肽可以是本发明的组合物的组件。编码这种具有β-葡糖苷酶活性的多肽的多核苷酸可以用于产生所述组合物。

在第一方面，具有β-葡糖苷酶活性的分离的多肽包含或组成为如下氨基酸序列，所述氨基酸序列与SEQ ID NO：16、SEQ ID NO：18、SEQ ID NO：20、SEQ ID NO：22、SEQ ID NO：24、SEQ ID NO：26，或SEQ ID NO：28的成熟多肽具有优选至少60％，更优选至少65％，更优选至少70％，更优选至少75％，更优选至少80％，甚至更优选至少85％，甚至更优选至少90％，最优选至少95％，并且甚至最优选至少96％，97％，98％，或99％同一性程度，其具有β-葡糖苷酶活性(下文称作“同源多肽”)。在优选的方面，所述同源多肽包含或组成为如下氨基酸序列，所述氨基酸序列与SEQ ID NO：16、SEQ ID NO：18、SEQ ID NO：20、SEQ ID NO：22、SEQ ID NO：24、SEQ ID NO：26，或SEQ IDNO：28的成熟多肽相差十个氨基酸，优选相差五个氨基酸，更优选相差四个氨基酸，甚至更优选相差三个氨基酸，最优选相差两个氨基酸，并且甚至最优选相差一个氨基酸。

具有β-葡糖苷酶活性的多肽优选包含SEQ ID NO：16的氨基酸序列或其等位变体；或它们的具有β-葡糖苷酶活性的片段。在优选的方面，所述多肽包含SEQ ID NO：16的氨基酸序列。在另一优选的方面，所述多肽包含SEQ ID NO：16的成熟多肽。在另一优选的方面，所述多肽包含SEQ ID NO：16的氨基酸20至861，或其等位变体；或它们的具有β-葡糖苷酶活性的片段。在另一优选的方面，所述多肽包含SEQ ID NO：16的氨基酸20至861。在另一优选的方面，所述多肽由SEQ ID NO：16的氨基酸序列或其等位变体组成；或由它们的具有β-葡糖苷酶活性的片段组成。在另一优选的方面，所述多肽由SEQ ID NO：16的氨基酸序列组成。在另一优选的方面，所述多肽由SEQ ID NO：16的成熟多肽组成。在另一优选的方面，所述多肽由SEQ ID NO：16的氨基酸20至861或其等位变体组成；或由它们的具有β-葡糖苷酶活性的片段组成。在另一优选的方面，所述多肽由SEQ ID NO：16的氨基酸20至861组成。

具有β-葡糖苷酶活性的多肽优选包含SEQ ID NO：18的氨基酸序列或其等位变体；或它们的具有β-葡糖苷酶活性的片段。在优选的方面，所述多肽包含SEQ ID NO：18的氨基酸序列。在另一优选的方面，所述多肽包含SEQ ID NO：18的成熟多肽。在另一优选的方面，所述多肽包含SEQ ID NO：18的氨基酸20至861，或其等位变体；或它们的具有β-葡糖苷酶活性的片段。在另一优选的方面，所述多肽包含SEQ ID NO：18的氨基酸20至861。在另一优选的方面，所述多肽由SEQ ID NO：18的氨基酸序列或其等位变体组成；或由它们的具有β-葡糖苷酶活性的片段组成。在另一优选的方面，所述多肽由SEQ ID NO：18的氨基酸序列组成。在另一优选的方面，所述多肽由SEQ ID NO：18的成熟多肽组成。在另一优选的方面，所述多肽由SEQ ID NO：18的氨基酸20至861或其等位变体组成；或由它们的具有β-葡糖苷酶活性的片段组成。在另一优选的方面，所述多肽由SEQ ID NO：18的氨基酸20至861组成。

具有β-葡糖苷酶活性的多肽优选包含SEQ ID NO：20的氨基酸序列或其等位变体；或它们的具有β-葡糖苷酶活性的片段。在优选的方面，所述多肽包含SEQ ID NO：20的氨基酸序列。在另一优选的方面，所述多肽包含SEQ ID NO：20的成熟多肽。在另一优选的方面，所述多肽包含SEQ ID NO：20的氨基酸20至863，或其等位变体；或它们的具有β-葡糖苷酶活性的片段。在另一优选的方面，所述多肽包含SEQ ID NO：20的氨基酸20至863。在另一优选的方面，所述多肽由SEQ ID NO：20的氨基酸序列或其等位变体组成；或由它们的具有β-葡糖苷酶活性的片段组成。在另一优选的方面，所述多肽由SEQ ID NO：20的氨基酸序列组成。在另一优选的方面，所述多肽由SEQ ID NO：20的成熟多肽组成。在另一优选的方面，所述多肽由SEQ ID NO：20的氨基酸20至863或其等位变体组成；或由它们的具有β-葡糖苷酶活性的片段组成。在另一优选的方面，所述多肽由SEQ ID NO：20的氨基酸20至863组成。

具有β-葡糖苷酶活性的多肽优选包含SEQ ID NO：22的氨基酸序列或其等位变体；或它们的具有β-葡糖苷酶活性的片段。在优选的方面，所述多肽包含SEQ ID NO：22的氨基酸序列。在另一优选的方面，所述多肽包含SEQ ID NO：22的成熟多肽。在另一优选的方面，所述多肽包含SEQ ID NO：22的氨基酸37至878，或其等位变体；或它们的具有β-葡糖苷酶活性的片段。在另一优选的方面，所述多肽包含SEQ ID NO：22的氨基酸37至878。在另一优选的方面，所述多肽由SEQ ID NO：22的氨基酸序列或其等位变体组成；或由它们的其具有β-葡糖苷酶活性的片段组成。在另一优选的方面，所述多肽由SEQ ID NO：22的氨基酸序列组成。在另一优选的方面，所述多肽由SEQ ID NO：22的成熟多肽组成。在另一优选的方面，所述多肽由SEQ ID NO：22的氨基酸37至878或其等位变体组成；或由它们的具有β-葡糖苷酶活性的片段组成。在另一优选的方面，所述多肽由SEQ ID NO：22的氨基酸37至878组成。

具有β-葡糖苷酶活性的多肽优选包含SEQ ID NO：24的氨基酸序列或其等位变体；或它们的具有β-葡糖苷酶活性的片段。在优选的方面，所述多肽包含SEQ ID NO：24的氨基酸序列。在另一优选的方面，所述多肽包含SEQ ID NO：24的成熟多肽。在另一优选的方面，所述多肽包含SEQ ID NO：24的氨基酸32至744，或其等位变体；或它们的具有β-葡糖苷酶活性的片段。在另一优选的方面，所述多肽包含SEQ ID NO：24的氨基酸32至744。在另一优选的方面，所述多肽由SEQ ID NO：24的氨基酸序列或其等位变体组成；或由它们的具有β-葡糖苷酶活性的片段组成。在另一优选的方面，所述多肽由SEQ ID NO：24的氨基酸序列组成。在另一优选的方面，所述多肽由SEQ ID NO：24的成熟多肽组成。在另一优选的方面，所述多肽由SEQ ID NO：24的氨基酸32至744或其等位变体组成；或由它们的具有β-葡糖苷酶活性的片段组成。在另一优选的方面，所述多肽由SEQ ID NO：24的氨基酸32至744组成。

具有β-葡糖苷酶活性的多肽优选包含SEQ ID NO：26的氨基酸序列或其等位变体；或它们的具有β-葡糖苷酶活性的片段。在优选的方面，所述多肽包含SEQ ID NO：26的氨基酸序列。在另一优选的方面，所述多肽包含SEQ ID NO：26的成熟多肽。在另一优选的方面，所述多肽包含SEQ ID NO：26的氨基酸20至860，或其等位变体；或它们的具有β-葡糖苷酶活性的片段。在另一优选的方面，所述多肽包含SEQ ID NO：26的氨基酸20至860。在另一优选的方面，所述多肽由SEQ ID NO：26的氨基酸序列或其等位变体组成；或由它们的具有β-葡糖苷酶活性的片段组成。在另一优选的方面，所述多肽由SEQ ID NO：26的氨基酸序列组成。在另一优选的方面，所述多肽由SEQ ID NO：26的成熟多肽组成。在另一优选的方面，所述多肽由SEQ ID NO：26的氨基酸20至860或其等位变体组成；或由它们的具有β-葡糖苷酶活性的片段组成。在另一优选的方面，所述多肽由SEQ ID NO：26的氨基酸20至860组成。

具有β-葡糖苷酶活性的多肽优选包含SEQ ID NO：28的氨基酸序列或其等位变体；或它们的具有β-葡糖苷酶活性的片段。在优选的方面，所述多肽包含SEQ ID NO：28的氨基酸序列。在另一优选的方面，所述多肽包含SEQ ID NO：28的成熟多肽。在另一优选的方面，所述多肽包含SEQ ID NO：28的氨基酸20至860，或其等位变体；或它们的具有β-葡糖苷酶活性的片段。在另一优选的方面，所述多肽包含SEQ ID NO：28的氨基酸20至860。在另一优选的方面，所述多肽由SEQ ID NO：28的氨基酸序列或其等位变体组成；或由它们的具有β-葡糖苷酶活性的片段组成。在另一优选的方面，所述多肽由SEQ ID NO：28的氨基酸序列组成。在另一优选的方面，所述多肽由SEQ ID NO：28的成熟多肽组成。在另一优选的方面，所述多肽由SEQ ID NO：28的氨基酸20至860或其等位变体组成；或由它们的具有β-葡糖苷酶活性的片段组成。在另一优选的方面，所述多肽由SEQ ID NO：28的氨基酸20至860组成。

优选地，SEQ ID NO：16的成熟多肽的片段包含至少720个氨基酸残基，更优选地至少760个氨基酸残基，并且最优选至少800个氨基酸残基。优选地，SEQ ID NO：18的成熟多肽的片段包含至少720个氨基酸残基，更优选地至少760个氨基酸残基，并且最优选至少800个氨基酸残基。优选地，SEQ ID NO：20的成熟多肽的片段包含至少770个氨基酸残基，更优选地至少800个氨基酸残基，并且最优选至少830个氨基酸残基。优选地，SEQ ID NO：22的成熟多肽的片段包含至少720个氨基酸残基，更优选地至少760个氨基酸残基，并且最优选至少800个氨基酸残基。优选地，SEQ ID NO：24的成熟多肽的片段包含至少620个氨基酸残基，更优选地至少650个氨基酸残基，并且最优选至少680个氨基酸残基。优选地，SEQ ID NO：26的成熟多肽的片段包含至少720个氨基酸残基，更优选地至少760个氨基酸残基，并且最优选至少800个氨基酸残基。优选地，SEQ ID NO：28的成熟多肽的片段包含至少720个氨基酸残基，更优选地至少760个氨基酸残基，并且最优选至少800个氨基酸残基。

优选地，SEQ ID NO：15的成熟多肽编码序列的亚序列包含至少2160个核苷酸，更优选地至少2280个核苷酸，并且最优选至少2400个核苷酸。优选地，SEQ ID NO：17的成熟多肽编码序列的亚序列包含至少2160个核苷酸，更优选地至少2280个核苷酸，并且最优选至少2400个核苷酸。优选地，SEQID NO：19的成熟多肽编码序列的亚序列包含至少2310个核苷酸，更优选地至少2400个核苷酸，并且最优选至少2490个核苷酸。优选地，SEQ ID NO：21的成熟多肽编码序列的亚序列包含至少2160个核苷酸，更优选地至少2280个核苷酸，并且最优选至少2400个核苷酸。优选地，SEQ ID NO：23的成熟多肽编码序列的亚序列包含至少1860个核苷酸，更优选地至少1950个核苷酸，并且最优选至少2040个核苷酸。优选地，SEQ ID NO：25的成熟多肽编码序列的亚序列包含至少2160个核苷酸，更优选地至少2280个核苷酸，并且最优选至少2400个核苷酸。优选地，SEQ ID NO：27的成熟多肽编码序列的亚序列包含至少2160个核苷酸，更优选地至少2280个核苷酸，并且最优选至少2400个核苷酸。

在优选的方面，具有β-葡糖苷酶活性的多肽由获得自米曲霉β-葡糖苷酶基因的多核苷酸编码。在最优选的实施方案中，具有β-葡糖苷酶活性的多肽由获得自米曲霉β-葡糖苷酶基因的多核苷酸编码，所述基因包含SEQ ID NO：15的成熟多肽编码序列，其编码SEQ ID NO：16的成熟多肽。

在另一优选的方面，具有β-葡糖苷酶活性的多肽由获得自米曲霉β-葡糖苷酶突变体基因的多核苷酸编码。在最优选的实施方案中，具有β-葡糖苷酶活性的多肽由获得自米曲霉β-葡糖苷酶基因的多核苷酸编码，所述基因包含SEQ ID NO：17的成熟多肽编码序列，其编码SEQ ID NO：18的成熟多肽。

在另一优选的方面，具有β-葡糖苷酶活性的多肽由获得自烟曲霉β-葡糖苷酶基因的多核苷酸编码。在最优选的实施方案中，具有β-葡糖苷酶活性的多肽由获得自烟曲霉β-葡糖苷酶基因的多核苷酸编码，所述基因包含SEQ IDNO：19的成熟多肽编码序列，其编码SEQ ID NO：20的成熟多肽。

在另一优选的方面，具有β-葡糖苷酶活性的多肽由获得自巴西青霉(Penicillium brasilianum)菌株IBT 20888β-葡糖苷酶基因的多核苷酸编码。在最优选的实施方案中，具有β-葡糖苷酶活性的多肽由获得自巴西青霉菌株IBT20888β-葡糖苷酶基因的多核苷酸编码，所述基因包含SEQ ID NO：21的成熟多肽编码序列，其编码SEQ ID NO：22的成熟多肽。

在另一优选的方面，具有β-葡糖苷酶活性的多肽由获得里氏木霉菌株QM9414 β-葡糖苷酶基因的多核苷酸编码。在最优选的实施方案中，具有β-葡糖苷酶活性的多肽由获得自里氏木霉菌株QM9414 β-葡糖苷酶基因的多核苷酸编码，所述基因包含SEQ ID NO：23的成熟多肽编码序列，其编码SEQ IDNO：24的成熟多肽(GenBank^TM登录号U09580)。

在另一优选的方面，具有β-葡糖苷酶活性的多肽由获得黑曲霉β-葡糖苷酶基因的多核苷酸编码。在最优选的实施方案中，具有β-葡糖苷酶活性的多肽由获得自黑曲霉β-葡糖苷酶基因的多核苷酸编码，所述基因包含SEQ IDNO：25的成熟多肽编码序列，其编码SEQ ID NO：26的成熟多肽(GenBank^TM登录号AJ132386)。

在另一优选的方面，具有β-葡糖苷酶活性的多肽由获得棘孢曲霉β-葡糖苷酶基因的多核苷酸编码。在最优选的实施方案中，具有β-葡糖苷酶活性的多肽由获得自棘孢曲霉β-葡糖苷酶基因的多核苷酸编码，所述基因包含SEQID NO：27的成熟多肽编码序列，其编码SEQ ID NO：28的成熟多肽(GenBank^TM登录号D64088)。

具有β-葡糖苷酶活性的米曲霉多肽可以根据WO 2002/095014获得。具有β-葡糖苷酶活性的米曲霉多肽变体可以根据WO 2004/099228获得。具有β-葡糖苷酶活性的烟曲霉多肽可以根据WO 2005/047499获得。具有β-葡糖苷酶活性的巴西青霉多肽可以根据WO 2007/019442获得。具有β-葡糖苷酶活性的里氏木霉菌株QM9414可以根据美国专利6,022,725获得。具有β-葡糖苷酶活性的黑曲霉多肽可以根据Dan等，2000，J.Biol.Chem.275：4973-4980获得。具有β-葡糖苷酶活性的棘孢曲霉多肽可以根据Kawaguchi等，1996，Gene173：287-288获得。

在优选的方面，SEQ ID NO：16的成熟多肽由包含在大肠杆菌DSM 14240的质粒中所包含的多核苷酸编码。在另一优选的方面，SEQ ID NO：20的成熟多肽由包含在大肠杆菌NRRL B-30695的质粒pEJG113中所包含的多核苷酸编码。在另一优选的方面，SEQ ID NO：22的成熟多肽由包含在大肠杆菌NRRLB-30860的质粒pKKAB中所包含的多核苷酸编码。

在第二方面，具有β-葡糖苷酶活性的分离的多肽由多核苷酸编码，所述多核苷酸包含或组成为以下核苷酸序列，所述核苷酸序列在至少非常低严紧条件下，优选至少低严紧条件下，更优选至少中严紧条件下，更优选至少中-高严紧条件下，甚至更优选至少高严紧条件下，并且最优选至少非常高严紧条件下，与以下杂交：(i)SEQ ID NO：15、SEQ ID NO：17、SEQ ID NO：19、SEQ ID NO：21、SEQ ID NO：23、SEQ ID NO：25、SEQ ID NO：27的成熟多肽编码序列，(ii)包含在SEQ ID NO：15、SEQ ID NO：17、SEQ ID NO：19、SEQ ID NO：21、SEQ ID NO：23、SEQ ID NO：25、SEQ ID NO：27的成熟多肽编码序列中的cDNA序列，或包含SEQ ID NO：15、SEQ ID NO：17、SEQID NO：19、SEQ ID NO：21、SEQ ID NO：23、SEQ ID NO：25、SEQ ID NO：27的成熟多肽编码序列的基因组DNA序列，(iii)(i)或(ii)的亚序列，或者(iv)(i)、(ii)或(iii)的全长互补链(J.Sambrook，E.F.Fritsch和T.Maniatis，1989见上文)。SEQ ID NO：15、SEQ ID NO：17、SEQ ID NO：19、SEQ ID NO：21、SEQ ID NO：23、SEQ ID NO：25、SEQ ID NO：27的成熟多肽编码序列的亚序列含有至少100个连续的核苷酸或优选至少200个连续的核苷酸。此外，所述亚序列可编码具有β-葡糖苷酶活性的多肽片段。

SEQ ID NO：15、SEQ ID NO：17、SEQ ID NO：19、SEQ ID NO：21、SEQID NO：23、SEQ ID NO：25、SEQ ID NO：27的核苷酸序列或其亚序列，以及SEQ ID NO：16、SEQ ID NO：18、SEQ ID NO：20、SEQ ID NO：22，或SEQ IDNO：24、SEQ ID NO：26，或SEQ ID NO：28的氨基酸序列或其片段，可以用于设计核酸探针，以从不同属和种的菌株鉴定和克隆编码具有β-葡糖苷酶活性的多肽的DNA，如上所述。

就本发明而言，杂交表示核苷酸序列在非常低至非常高的严紧条件下与标记的核酸探针杂交，所述核酸探针对应于SEQ ID NO：15、SEQ ID NO：17、SEQ ID NO：19、SEQ ID NO：21、SEQ ID NO：23、SEQ ID NO：25、SEQ ID NO：27的成熟多肽编码序列，包含在SEQ ID NO：15、SEQ ID NO：17、SEQ ID NO：19、SEQ ID NO：21、SEQ ID NO：23、SEQ ID NO：25、SEQ ID NO：27的成熟多肽编码序列中的cDNA序列，或包含SEQ ID NO：15、SEQ ID NO：17、SEQ ID NO：19、SEQ ID NO：21、SEQ ID NO：23、SEQ ID NO：25、SEQ ID NO： 27的成熟多肽编码序列的基因组DNA序列，它的全长互补链或其亚序列。如上文所述。

在优选的方面，核酸探针是SEQ ID NO：15的成熟多肽编码序列。在另一优选的方面，核酸探针是SEQ ID NO：15的核苷酸58至2584。在另一优选的方面，核酸探针是编码SEQ ID NO：16的多肽的多核苷酸序列，或其亚序列。在另一优选方面，核酸探针是SEQ ID NO：15。在另一优选的方面，核酸探针是包含于大肠杆菌DSM 14240中的多核苷酸序列，其中它的多核苷酸序列编码具有β-葡糖苷酶活性的多肽。在另一优选的方面，核酸探针是包含于大肠杆菌DSM 14240中的成熟多肽编码区。

在另一优选的方面，核酸探针是SEQ ID NO：17的成熟多肽编码序列。在另一优选的方面，核酸探针是SEQ ID NO：17的核苷酸58至2584。在另一优选的方面，核酸探针是编码SEQ ID NO：18的多肽的多核苷酸序列，或其亚序列。在另一优选的方面，核酸探针是SEQ ID NO：17。

在另一优选的方面，核酸探针是SEQ ID NO：19的成熟多肽编码序列。在另一优选的方面，核酸探针是SEQ ID NO：19的核苷酸73至1413。在另一优选的方面，核酸探针是编码SEQ ID NO：20的多肽的多核苷酸序列，或其亚序列。在另一优选的方面，核酸探针是SEQ ID NO：19。在另一优选的方面，核酸探针是包含在质粒pEJG113中的多核苷酸序列，所述质粒包含在大肠杆菌NRRL B-30695中，其中它的多核苷酸序列编码具有β-葡糖苷酶活性的多肽。在另一优选的方面，核酸探针是包含在质粒pEJG113中的成熟多肽编码区，所述质粒包含在大肠杆菌NRRL B-30695中。

在另一优选的方面，核酸探针是SEQ ID NO：21的成熟多肽编码序列。在另一优选的方面，核酸探针是SEQ ID NO：21的核苷酸67至1377。在另一优选的方面，核酸探针是编码SEQ ID NO：22的多肽的多核苷酸序列，或其亚序列。在另一优选的方面，核酸探针是SEQ ID NO：21。在另一优选的方面，核酸探针是包含在质粒pKKAB中的多核苷酸序列，所述质粒包含在大肠杆菌NRRL B-30860中，其中它的多核苷酸序列编码具有β-葡糖苷酶活性的多肽。在另一优选的方面，核酸探针是包含在包含在大肠杆菌NRRL B-30860中的成熟多肽编码区。

在另一优选的方面，核酸探针是SEQ ID NO：23的成熟多肽编码序列。在另一优选的方面，核酸探针是SEQ ID NO：23的核苷酸88至2232。在另一优选的方面，核酸探针是编码SEQ ID NO：24的多肽的多核苷酸序列，或其亚序列。在另一优选的方面，核酸探针是SEQ ID NO：23。

在另一优选的方面，核酸探针是SEQ ID NO：25的成熟多肽编码序列。在另一个优选的方面，核酸探针是SEQ ID NO：25的核苷酸59至2580。在另一优选的方面，核酸探针是编码SEQ ID NO：26的多肽的多核苷酸序列，或其亚序列。在另一优选的方面，核酸探针是SEQ ID NO：25。

在另一优选的方面，核酸探针是SEQ ID NO：27的成熟多肽编码序列。在另一优选的方面，核酸探针是SEQ ID NO：27的核苷酸59至2580。在另一优选的方面，核酸探针是编码SEQ ID NO：28的多肽的多核苷酸序列，或其亚序列。在另一优选的方面，核酸探针是SEQ ID NO：27。

对于长度至少100个核苷酸的长探针，非常低至非常高的严紧条件如在本文所定义。

对于长度为至少100个核苷酸的长探针，将载体材料进行最终洗涤，如在本文中定义。

对于长度大约15个核苷酸至大约70个核苷酸的短探针，严紧条件如本文所定义。

对于长度大约15个核苷酸至大约70个核苷酸的短探针，经载体材料进行洗涤，如在本文中定义。

在第三方面，具有β-葡糖苷酶活性的多肽由包含或组成为如下核苷酸序列的多核苷酸编码，所述核苷酸序列与SEQ ID NO：15、SEQ ID NO：17、SEQID NO：19、SEQ ID NO：21、SEQ ID NO：23、SEQ ID NO：25、SEQ ID NO：27的成熟多肽编码序列具有优选至少60％，更优选至少65％，更优选至少70％，更优选至少75％，更优选至少80％，更优选至少85％，甚至更优选至少90％，最优选至少95％，并且甚至最优选至少96％，97％，98％，或99％的同一性程度，其编码活性多肽。

在第六方面，具有β-葡糖苷酶活性的多肽是人工变体，所述人工变体包含取代、缺失和/或插入一个或多个(几个)氨基酸的SEQ ID NO：16、SEQ ID NO：18、SEQ ID NO：20、SEQ ID NO：22、SEQ ID NO：24、SEQ ID NO：26，或SEQID NO：28的成熟多肽或其同源序列。制备这样的人工变体的方法如上所述。

SEQ ID NO：16、SEQ ID NO：18、SEQ ID NO：20、SEQ ID NO：22、SEQID NO：24、SEQ ID NO：26，或SEQ ID NO：28的成熟多肽的氨基酸取代、缺失和/或插入的总数是10，优选9，更优选8，更优选7，更优选至多6，更优选5，更优选4，甚至更优选3，最优选2，并且甚至最优选1。

在另一优选的方面，具有β-葡糖苷酶活性的多肽由获得自家族1β-葡糖苷酶基因的多核苷酸编码。

在另一优选的方面，具有β-葡糖苷酶活性的多肽由获得自家族3β-葡糖苷酶基因的多核苷酸编码。

在另一优选的方面，具有β-葡糖苷酶活性的多肽由获得自家族5β-葡糖苷酶基因的多核苷酸编码。

可用作本发明的多核苷酸来源的其它β-葡糖苷酶的实例包括，但不限于，米曲霉β-葡糖苷酶(WO 02/095014；WO 04/099228)；棘孢曲霉β-葡糖苷酶(Kawaguchi等，1996，Gene 173：287-288)；燕麦状曲霉(Aspergillus avenaceus)β-葡糖苷酶(GenBank^TM登录号AY943971)；烟曲霉β-葡糖苷酶(GenBank^TM登录号XM745234)；川地曲霉(Aspergillus kawachii)β-葡糖苷酶(GenBank^TM登录号AB003470)；黑曲霉β-葡糖苷酶(GenBank^TM AJ132386)；灰梨孢菌(Magnaporthegrisea)β-葡糖苷酶(GenBank^TM登录号AY849670)；黄孢平革菌β-葡糖苷酶(GenBank^TM登录号AB253327)；埃默森踝节菌(Talaromyces emersonii)β-葡糖苷酶(GenBank^TM登录号AY072918)；和里氏木霉β-葡糖苷酶(GenBank^TM登录号U09580、AB003110、AY281374、AY281375、AY281377、AY281378，和AY281379)。β-葡糖苷酶的变体也可以用作多核苷酸的来源，如WO 04/099228中所述的那些。

使用根据Henrissat B.，1991，A classification of glycosyl hydrolases basedon amino-acid sequence similarities，Biochem.J.280：309-316，Henrissat B.和Bairoch A.，1996，Updating the sequence-based classification of glycosylhydrolases，Biochem.J.316：695-696的分类，公开了超过13个糖基水解酶家族的其它β-葡糖苷酶。

具有β-葡糖苷酶活性的多肽也可以获得自任何属的微生物。就本发明而言，术语“获得自”如本文所定义。在优选的方面，获得自给定来源的多肽是胞外分泌的。

具有β-葡糖苷酶活性的多肽可以是细菌多肽。例如，多肽可以是革兰氏阳性细菌的多肽，如具有β-葡糖苷酶活性的芽孢杆菌属、链球菌属、链霉菌属、葡萄球菌属、肠球菌属、乳杆菌属、乳球菌属、梭菌属、地芽孢杆菌属，或海洋芽孢杆菌属多肽，或者革兰氏阴性细菌的多肽，如具有β-葡糖苷酶活性的大肠杆菌、假单胞菌属、沙门氏菌属、弯曲杆菌属、螺杆菌属、黄杆菌属、梭杆菌属、泥杆菌属、奈瑟氏菌属或脲原体属多肽。

在优选的方面，多肽是具有β-葡糖苷酶活性的嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌，或苏云金芽孢杆菌多肽。

在另一优选的方面，多肽是具有β-葡糖苷酶活性的似马链球菌、酿脓链球菌、乳房链球菌，或马链球菌兽疫亚种多肽。

在另一优选的方面，多肽是具有β-葡糖苷酶活性的不产色链霉菌、除虫链霉菌、天蓝色链霉菌、灰色链霉菌，或浅青紫链霉菌多肽。

具有β-葡糖苷酶活性的多肽还可以是具有β-葡糖苷酶活性的真菌多肽，并且更优选是酵母多肽，如念珠菌属、克鲁维酵母属、毕赤酵母属、酵母属、裂殖酵母属或西洋蓍霉属多肽；或更优选是具有β-葡糖苷酶活性的丝状真菌多肽，如枝顶孢霉属、伞草属、链格孢属、曲霉属、短梗霉属、葡萄座腔菌属(Botryospaeria)、拟蜡菌属、毛壳菌属(Chaetomidium)、金孢子菌属、麦角属、旋孢腔菌属、鬼伞属、Coptotermes、棒囊壳属(Corynascus)、隐丛赤壳菌、隐球菌属、色二孢属、黑耳属(Exidia)、Filibasidium、镰孢属、赤霉属(Gibberella)、全鞭毛虫属、腐质霉属、耙菌属、香菇属、小球腔菌属(Leptospaeria)、梨孢菌属、Melanocarpus、多孔菌属(Meripilus)、毛霉属、毁丝霉属、新考玛脂霉属、脉孢菌属、拟青霉属、青霉属、平革菌属、瘤胃壶菌属、Poitrasia、假黑盘菌属、假披发虫属、根毛霉属、裂褶菌属、柱顶孢属(Scytalidium)、踝节菌属、嗜热霉属、梭孢壳属、弯颈霉属、木霉属、Trichophaea、轮枝孢属、小包脚菇属(Volvariella)或炭角菌属多肽。

在优选的方面，多肽是具有β-葡糖苷酶活性的卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母或卵形酵母多肽。

在另一个优选的方面，多肽是具有β-葡糖苷酶活性的解纤维枝顶孢霉、棘孢曲霉、泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、嗜角质金孢子菌、Chrysosporium lucknowense、热带金孢子菌、粪状金孢子菌、Chrysosporium inops、Chrysosporium pannicola、昆士兰金孢子菌、Chrysosporium zonatum、杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、灰腐质霉、特异腐质霉、疏棉状腐质霉、乳白耙菌、米赫毛霉、嗜热毁丝霉、粗糙脉孢菌、绳状青霉、产紫青霉、黄孢平革菌、无色梭孢壳、Thielavia albomyces、Thielavia albopilosa、澳洲梭孢壳、Thielavia fimeti、微孢梭孢壳、卵孢梭孢壳、Thielavia peruviana、Thielavia spededonium、毛梭孢壳、Thielavia subthermophila、土生梭孢霉、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、绿色木霉或Trichophaea saccata。

可理解的是对于前述的物种，本发明包含完全和不完全阶段两种，和其它分类学的等同物，例如无性型，无论它们已知的种名。本领域技术人员将轻易地识别适合的等同物的身份。

此外，可以使用上述的探针从其它来源，包括从自然界(例如，土壤、堆肥、水等)分离的微生物鉴定和获得这些多肽，如本文所述。

具有β-葡糖苷酶活性的多肽还包括融合多肽或可切割的融合多肽，其中别的多肽融合在具有β-葡糖苷酶活性的多肽或其片段的N-末端或C-末端。如本文所述产生融合多肽。

可以分离包含核苷酸序列或由其组成的多肽并用于实施本发明的方法，如本文所述，其中所述核苷酸序列编码具有β-葡糖苷酶活性的多肽。

多核苷酸包含以下核苷酸序列，或者由以下核苷酸序列组成，所述核苷酸序列与SEQ ID NO：15、SEQ ID NO：17、SEQ ID NO：19、SEQ ID NO：21、SEQ ID NO：23、SEQ ID NO：25、SEQ ID NO：27的成熟多肽编码序列具有优选至少60％，更优选至少65％，更优选至少70％，更优选至少75％，更优选至少80％，更优选至少85％，甚至更优选至少90％，最优选至少95％，并且甚至最优选至少96％，97％，98％或99％的同一性程度，所述核苷酸序列编码具有β-葡糖苷酶活性的多肽。

在另一优选的方面，核苷酸序列包含或组成为SEQ ID NO：15。在另一更优选的方面，核苷酸序列包含或组成为大肠杆菌DSM 14240中包含的核苷酸序列。在另一优选的方面，核苷酸序列包含或组成为SEQ ID NO：15的成熟多肽编码序列。在另一更优选的方面，核苷酸序列包含或组成为SEQ ID NO：15的核苷酸58至2584。在另一优选的方面，核苷酸序列包含或组成为大肠杆菌DSM 14240中包含的成熟多肽编码区。本发明还包含如下核苷酸序列，所述核苷酸序列编码包含或组成为SEQ ID NO：16的氨基酸序列的多肽或其成熟多肽，由于遗传密码的简并性，所述核苷酸序列不同于SEQ ID NO：15或者其成熟多肽编码序列。本发明还涉及SEQ ID NO：15的亚序列，其编码SEQ ID NO：16的具有β-葡糖苷酶活性的片段。

在另一优选的方面，核苷酸序列包含或组成为SEQ ID NO：17。在另一优选的方面，核苷酸序列包含或组成为SEQ ID NO：17的成熟多肽编码区。在另一更优选的方面，核苷酸序列包含或组成为SEQ ID NO：17的核苷酸58至2584。本发明还包含如下核苷酸序列，所述核苷酸序列编码包含或组成为SEQ ID NO：18的氨基酸序列的多肽或其成熟多肽，由于遗传密码的简并性，所述核苷酸序列不同于SEQ ID NO：17或者其成熟多肽编码序列。本发明还涉及SEQ ID NO：17的亚序列，其编码SEQ ID NO：18的具有β-葡糖苷酶活性的片段。

在另一优选的方面，核苷酸序列包含或组成为SEQ ID NO：19。在另一更优选的方面，核苷酸序列包含或组成为质粒pEJG113中的核苷酸序列，所述质粒包含在大肠杆菌NRRL B-30695中。在另一优选的方面，核苷酸序列包含或组成为SEQ ID NO：19的成熟多肽编码区。在另一更优选的方面，核苷酸序列包含或组成为SEQ ID NO：19的核苷酸58至2580。在另一优选的方面，核苷酸序列包含或组成为质粒pEJG113中的成熟多肽编码区，所述质粒包含在大肠杆菌NRRL B-30695中。本发明还包含如下核苷酸序列，所述核苷酸序列编码包含或组成为SEQ ID NO：20的氨基酸序列的多肽或其成熟多肽，由于遗传密码的简并性，所述核苷酸序列不同于SEQ ID NO：19或者其成熟多肽编码序列。本发明还涉及SEQ ID NO：19的亚序列，其编码SEQ ID NO：20的具有β-葡糖苷酶活性的片段。

在另一优选的方面，核苷酸序列包含或组成为SEQ ID NO：21。在另一更优选的方面，核苷酸序列包含或组成为质粒pKKAB中的核苷酸序列，所述质粒包含在大肠杆菌NRRL B-30860中。在另一优选的方面，核苷酸序列包含或组成为SEQ ID NO：21的成熟多肽编码区。在另一更优选的方面，核苷酸序列包含或组成为SEQ ID NO：21的核苷酸109至2751。在另一优选的方面，核苷酸序列包含或组成为质粒pKKAB中的成熟多肽编码区，所述质粒包含在大肠杆菌NRRL B-30860中。本发明还包含如下核苷酸序列，所述核苷酸序列编码包含或组成为SEQ ID NO：22的氨基酸序列的多肽或其成熟多肽，由于遗传密码的简并性，所述核苷酸序列不同于SEQ ID NO：21或者其成熟多肽编码序列。本发明还涉及SEQ ID NO：21的亚序列，其编码SEQ IDNO：22的具有β-葡糖苷酶活性的片段。

在另一优选的方面，核苷酸序列包含或组成为SEQ ID NO：23。在另一优选的方面，核苷酸序列包含或组成为SEQ ID NO：23的成熟多肽编码区。在另一更优选的方面，核苷酸序列包含或组成为SEQ ID NO：23的核苷酸88至2232。本发明还包含如下核苷酸序列，所述核苷酸序列编码包含或组成为SEQ ID NO：24的氨基酸序列的多肽或其成熟多肽，由于遗传密码的简并性，所述核苷酸序列不同于SEQ ID NO：23或者其成熟多肽编码序列。本发明还涉及SEQ ID NO：23的亚序列，其编码SEQ ID NO：24的具有β-葡糖苷酶活性的片段。

在另一优选的方面，核苷酸序列包含或组成为SEQ ID NO：25。在另一优选的方面，核苷酸序列包含或组成为SEQ ID NO：25的成熟多肽编码区。在另一更优选的方面，核苷酸序列包含或组成为SEQ ID NO：25的核苷酸88至2232。本发明还包含如下核苷酸序列，所述核苷酸序列编码包含或组成为SEQ ID NO：26的氨基酸序列的多肽或其成熟多肽，由于遗传密码的简并性，所述核苷酸序列不同于SEQ ID NO：25或者其成熟多肽编码序列。本发明还涉及SEQ ID NO：25的亚序列，其编码SEQ ID NO：26的具有β-葡糖苷酶活性的片段。

在另一优选的方面，核苷酸序列包含或组成为SEQ ID NO：27。在另一优选的方面，核苷酸序列包含或组成为SEQ ID NO：27的成熟多肽编码区。在另一更优选的方面，核苷酸序列包含或组成为SEQ ID NO：27的核苷酸88至2232。本发明还包含如下核苷酸序列，所述核苷酸序列编码包含或组成为SEQ ID NO：28的氨基酸序列的多肽或其成熟多肽，由于遗传密码的简并性，所述核苷酸序列不同于SEQ ID NO：27或者其成熟多肽编码序列。本发明还涉及SEQ ID NO：27的亚序列，其编码SEQ ID NO：28的具有β-葡糖苷酶活性的片段。

本发明还涉及在SEQ ID NO：15、SEQ ID NO：17、SEQ ID NO：19、SEQ ID NO：21、SEQ ID NO：23、SEQ ID NO：25、SEQ ID NO：27的成熟多肽编码序列中包含至少一个突变的突变多核苷酸，其中所述突变核苷酸序列编码SEQ ID NO：16、SEQ ID NO：18、SEQ ID NO：20、SEQ ID NO：22、SEQ ID NO：24、SEQ ID NO：26，或SEQ ID NO：28的成熟多肽。

如早前所述，用于分离或克隆编码多肽的多核苷酸的技术是本领域内已知的，包括从基因组DNA分离，从cDNA制备，或其组合。

多核苷酸还可为包含或组成为如下核苷酸序列的多核苷酸，所述核苷酸序列编码具有β-葡糖苷酶活性的多肽，其在至少非常低严紧条件下，优选至少低严紧条件，更优选至少中等严紧条件，更优选至少中-高严紧条件，甚至更优选至少高严紧条件，并且最优选至少非常高的严紧条件下，与以下杂交：(i)SEQ ID NO：15、SEQ ID NO：17、SEQ ID NO：19、SEQ ID NO：21、SEQ IDNO：23、SEQ ID NO：25、SEQ ID NO：27的成熟多肽编码序列，(ii)包含在SEQID NO：15、SEQ ID NO：17、SEQ ID NO：19、SEQ ID NO：21、SEQ ID NO：23、SEQ ID NO：25、SEQ ID NO：27的成熟多肽编码序列中的cDNA序列或包含SEQ ID NO：15、SEQ ID NO：17、SEQ ID NO：19、SEQ ID NO：21、SEQ ID NO：23、SEQ ID NO：25、SEQ ID NO：27的成熟多肽编码序列的基因组DNA序列，或(iii)(i)或(ii)的全长互补链；或它们的等位变体和亚序列(Sambrook等，1989，见上文)，如本文所定义的。

在上述每一个优选的方面，所述成熟多肽是SEQ ID NO：16的氨基酸20至861，SEQ ID NO：18的氨基酸20至861，SEQ ID NO：22的氨基酸20至863，SEQ ID NO：22的氨基酸37至878，SEQ ID NO：24的氨基酸32至744，SEQ ID NO：26的氨基酸20至860，或SEQ ID NO：28的氨基酸20至860，并且所述成熟多肽编码序列是SEQ ID NO：15的核苷酸58至2584，SEQ IDNO：17的核苷酸58至2584，SEQ ID NO：19的核苷酸58至2580，SEQ ID NO：21的核苷酸109至2751，SEQ ID NO：23的核苷酸88至2232，SEQ ID NO：25的核苷酸59至2580，或SEQ ID NO：27的核苷酸59至2580。

β-葡糖苷酶融合多肽及其多核苷酸

β-葡糖苷酶还可以是β-葡糖苷酶融合蛋白的形式。通过将编码具有β-葡糖苷酶活性的多肽的核苷酸序列(或其部分)与编码具有内切葡聚糖酶活性的多肽的核苷酸序列(或其部分)，以及编码信号肽的核苷酸融合而产生β-葡糖苷酶融合多肽，其中所述编码信号肽的核苷酸与编码具有内切葡聚糖酶活性的多肽的核苷酸序列(或其部分)可操作连接。产生融合多肽的技术是本领域已知的，并且包括，例如，连接编码多肽的编码序列以使它们在阅读框中，并且使融合多肽的表达在相同启动子和终止子的控制下。还可以使用内蛋白技术构建融合蛋白，其中在翻译后产生融合蛋白(Cooper等，1993，EMBO J.12：2575-2583；Dawson等，1994，Science 266：776-779)。

与至少不存在内切葡聚糖酶的催化域的情况相比，具有β-葡糖苷酶活性的融合蛋白增加了融合蛋白的分泌，其中所述融合蛋白至少包含与信号肽以符合读框的方式连接的内切葡聚糖酶的催化域。与至少不存在内切葡聚糖酶的催化域的情况相比，具有β-葡糖苷酶活性的融合蛋白的分泌增加至少25％，优选至少50％，更优选至少100％，甚至更优选至少150％，甚至更优选至少200％，最优选至少500％，并且甚至最优选至少1000％。

在如下每个优选方面中，β-葡糖苷酶融合蛋白构建体的组件由5’末端可操作地连接至构建体的3’末端。

在优选的方面，β-葡糖苷酶融合蛋白构建体包含以下多核苷酸：包含编码信号肽的序列的多核苷酸，包含编码内切葡聚糖酶的催化域的序列的多核苷酸；和包含编码β-葡糖苷酶的催化域的序列的多核苷酸。

在另一优选的方面，β-葡糖苷酶融合蛋白构建体包含以下多核苷酸：包含编码信号肽的序列的多核苷酸，包含编码内切葡聚糖酶的成熟多肽的序列的多核苷酸；和包含编码β-葡糖苷酶的催化域的序列的多核苷酸。

在另一优选的方面，β-葡糖苷酶融合蛋白构建体包含以下多核苷酸：包含编码信号肽的序列的多核苷酸，包含编码内切葡聚糖酶的催化域的序列的多核苷酸；和包含编码β-葡糖苷酶的成熟多肽的序列的多核苷酸。

在另一优选的方面，β-葡糖苷酶融合蛋白构建体包含以下多核苷酸：包含编码信号肽的序列的多核苷酸，包含编码内切葡聚糖酶的成熟多肽的序列的多核苷酸；和包含编码β-葡糖苷酶的成熟多肽的序列的多核苷酸。

在另一优选的方面，β-葡糖苷酶融合蛋白构建体包含以下多核苷酸：包含编码信号肽的序列的多核苷酸，包含编码内切葡聚糖酶的催化域的序列的多核苷酸；和包含编码β-葡糖苷酶的全长多肽的序列的多核苷酸。

在另一优选的方面，β-葡糖苷酶融合蛋白构建体包含以下多核苷酸：包含编码信号肽的序列的多核苷酸，包含编码内切葡聚糖酶的成熟多肽的序列的多核苷酸；和包含编码β-葡糖苷酶的全长多肽的序列的多核苷酸。

在另一优选的方面，β-葡糖苷酶融合蛋白构建体包含以下多核苷酸：包含编码内切葡聚糖酶的全长多肽(信号肽和成熟多肽)的序列的多核苷酸；和包含编码β-葡糖苷酶的全长多肽的序列的多核苷酸。

在另一优选的方面，β-葡糖苷酶融合蛋白构建体包含以下多核苷酸：包含编码信号肽的序列的多核苷酸，包含编码内切葡聚糖酶的催化域的序列的多核苷酸，和任选的接头和/或纤维素结合域；和包含编码β-葡糖苷酶的催化域的序列的多核苷酸。

在另一优选的方面，β-葡糖苷酶融合蛋白构建体包含以下多核苷酸：包含编码信号肽的序列的多核苷酸，包含编码内切葡聚糖酶的成熟多肽的序列的多核苷酸，和任选的接头和/或纤维素结合域；和包含编码β-葡糖苷酶的催化域的序列的多核苷酸。

在另一优选的方面，β-葡糖苷酶融合蛋白构建体包含以下多核苷酸：包含编码信号肽的序列的多核苷酸，包含编码内切葡聚糖酶的催化域的序列的多核苷酸，和任选的接头和/或纤维素结合域；和包含编码β-葡糖苷酶的成熟多肽的序列的多核苷酸。

在另一优选的方面，β-葡糖苷酶融合蛋白构建体包含以下多核苷酸包含编码信号肽的序列的多核苷酸，包含编码内切葡聚糖酶的成熟多肽的序列的多核苷酸，和任选的接头和/或纤维素结合域；和包含编码β-葡糖苷酶的成熟多肽的序列的多核苷酸。

在另一优选的方面，β-葡糖苷酶融合蛋白构建体包含以下多核苷酸：包含编码信号肽的序列的多核苷酸，包含编码内切葡聚糖酶的催化域的序列的多核苷酸，和任选的接头和/或纤维素结合域；和包含编码β-葡糖苷酶的全长多肽的序列的多核苷酸。

在另一优选的方面，β-葡糖苷酶融合蛋白构建体包含以下多核苷酸：包含编码信号肽的序列的多核苷酸，包含编码内切葡聚糖酶的成熟多肽的序列的多核苷酸，和任选的接头和/或纤维素结合域；和包含编码β-葡糖苷酶的全长多肽的序列的多核苷酸。

在另一优选的方面，β-葡糖苷酶融合蛋白构建体包含以下多核苷酸：包含编码信号肽的序列的多核苷酸；包含编码内切葡聚糖酶的催化域的序列的多核苷酸；包含编码另一个信号肽的序列的多核苷酸；和包含编码β-葡糖苷酶的催化域的序列的多核苷酸。

在另一优选的方面，β-葡糖苷酶融合蛋白构建体包含以下多核苷酸：包含编码信号肽的序列的多核苷酸；包含编码内切葡聚糖酶的成熟多肽的序列的多核苷酸；包含编码另一个信号肽的序列的多核苷酸；和包含编码β-葡糖苷酶的催化域的序列的多核苷酸。

在另一优选的方面，β-葡糖苷酶融合蛋白构建体包含以下多核苷酸：包含编码信号肽的序列的多核苷酸；包含编码内切葡聚糖酶的催化域的序列的多核苷酸；包含编码另一个信号肽的序列的多核苷酸；和包含编码β-葡糖苷酶的成熟多肽的序列的多核苷酸。

在另一优选的方面，β-葡糖苷酶融合蛋白构建体包含以下多核苷酸：包含编码信号肽的序列的多核苷酸；包含编码内切葡聚糖酶的成熟多肽的序列的多核苷酸；包含编码另一个信号肽的序列的多核苷酸；和包含编码β-葡糖苷酶的成熟多肽的序列的多核苷酸。

在另一优选的方面，β-葡糖苷酶融合蛋白构建体包含以下多核苷酸：包含编码信号肽的序列的多核苷酸；包含编码内切葡聚糖酶的催化域的序列的多核苷酸；，和任选的接头和/或纤维素结合域；包含编码另一个信号肽的序列的多核苷酸；和包含编码β-葡糖苷酶的催化域的序列的多核苷酸。

在另一优选的方面，β-葡糖苷酶融合蛋白构建体包含以下多核苷酸：包含编码信号肽的序列的多核苷酸；包含编码内切葡聚糖酶的成熟多肽的序列的多核苷酸；，和任选的接头和/或纤维素结合域；包含编码另一个信号肽的序列的多核苷酸；和包含编码β-葡糖苷酶的催化域的序列的多核苷酸。

在另一优选的方面，β-葡糖苷酶融合蛋白构建体包含以下多核苷酸：包含编码信号肽的序列的多核苷酸；包含编码内切葡聚糖酶的催化域的序列的多核苷酸；，和任选的接头和/或纤维素结合域；包含编码另一个信号肽的序列的多核苷酸；和包含编码β-葡糖苷酶的成熟多肽的序列的多核苷酸。

在另一优选的方面，β-葡糖苷酶融合蛋白构建体包含以下多核苷酸：包含编码信号肽的序列的多核苷酸；包含编码内切葡聚糖酶的成熟多肽的序列的多核苷酸；，和任选的接头和/或纤维素结合域；包含编码另一个信号肽的序列的多核苷酸；和包含编码β-葡糖苷酶的成熟多肽的序列的多核苷酸。

在上述每个优选的方面中，β-葡糖苷酶融合蛋白构建体的组件还包含启动子区域。

编码催化域、成熟多肽或全长多肽的具有β-葡糖苷酶活性或内切葡聚糖酶活性的多核苷酸可以获得自任何生物体。就本发明而言，术语“多肽”应理解为包括全长多肽、成熟多肽或催化域，或其具有β-葡糖苷酶或内切葡聚糖酶活性的部分。术语“获得自”如本文所定义的使用。

很多内切葡聚糖酶具有多域结构，所述结构由通过接头肽与纤维素结合域(CBD)分隔开的催化域组成(Suurnakki等，2000，Cellulose 7：189-209)。催化域包含活性位点，而CBD通过将酶与其结合而与纤维素反应(van Tilbeurgh等，1986，FEBS Letters 204：223-227；Tomme等，1988，European Journal ofBiochemistry 170：575-581)。

编码具有β-葡糖苷酶活性的多肽的多核苷酸如前所述。

编码具有内切葡聚糖酶活性的多肽的多核苷酸可以获得自编码细菌多肽的基因。例如，多肽可以是革兰氏阳性细菌的多肽，包括但不限于芽孢杆菌属、链球菌属、链霉菌属、葡萄球菌属、肠球菌属、乳杆菌属、乳球菌属、梭菌属、地芽孢杆菌属，或海洋芽孢杆菌属多肽，例如，嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、凝结芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌、苏云金芽孢杆菌、似马链球菌、酿脓链球菌、乳房链球菌，和马链球菌兽疫亚种，浅青紫链霉菌，或鼠灰链霉菌多肽；或者革兰氏阴性细菌的多肽，包括但不限于大肠杆菌、假单胞菌属、沙门氏菌属、弯曲杆菌属、螺杆菌属、黄杆菌属、梭杆菌属、泥杆菌属、奈瑟氏菌属或脲原体属多肽。

可用作本发明的方法中的多核苷酸来源的细菌内切葡聚糖酶的实例包括，但不限于，解纤维热酸菌(Acidothermus cellulolyticus)内切葡聚糖酶(WO91/05039；WO 93/15186；美国专利5,275,944；WO 96/02551；美国专利5,536,655；WO 00/70031，WO 05/093050)；Thermobifida fusca内切葡聚糖酶III(WO 05/093050)；和Thermobifida fusca内切葡聚糖酶V(WO 05/093050)。

编码具有内切葡聚糖酶活性的多肽的多核苷酸还可以获得自编码真菌多肽的基因，并且更优选是酵母多肽，如念珠菌属、克鲁维酵母属、毕赤酵母属、酵母属、裂殖酵母属或西洋蓍霉属多肽；或者更优选是丝状真菌多肽，如枝顶孢霉属、伞草属、链格孢属、曲霉属、短梗霉属、葡萄座腔菌属、拟蜡菌属、毛壳菌属、金孢子菌属、麦角属、旋孢腔菌属、鬼伞属、Coptotermes、棒囊壳属、隐丛赤壳菌属、隐球菌属、色二孢属、黑耳属、Filibasidium、镰孢属、赤霉属、全鞭毛虫属、腐质霉、耙菌属、香菇属、小球腔菌属、梨孢菌属、Melanocarpus、多孔菌属、毛霉属、毁丝霉属、新考玛脂霉属、脉孢菌属、拟青霉属、青霉属、平革菌属、瘤胃壶菌属、Poitrasia、假黑盘菌属、假披发虫属、根毛霉属、裂褶菌属、柱顶孢属、踝节菌属、嗜热霉属、梭孢壳属、弯颈霉属、木霉属、Trichophaea、轮枝孢属、小包脚菇属或炭角菌属多肽。

在优选的方面，编码具有内切葡聚糖酶活性的多肽的多核苷酸可以获得自编码下述多肽的基因：卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母或卵形酵母多肽。

在另一个优选的方面，编码具有内切葡聚糖酶活性的多肽的多核苷酸可以获得自编码下述多肽的基因：解纤维枝顶孢霉、棘孢曲霉、泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、嗜角质金孢子菌、Chrysosporium lucknowense、热带金孢子菌、粪状金孢子菌、Chrysosporiuminops、Chrysosporium pannicola、昆士兰金孢子菌、Chrysosporium zonatum、杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、灰腐质霉、特异腐质霉、疏棉状腐质霉、乳白耙菌、米赫毛霉、嗜热毁丝霉、粗糙脉孢菌、绳状青霉、产紫青霉、黄孢平革菌、无色梭孢壳、Thielavia albomyces、Thielavia albopilosa、澳洲梭孢壳、Thielavia fimeti、微孢梭孢壳、卵孢梭孢壳、Thielavia peruviana、Thielavia spededonium、毛梭孢壳、Thielaviasubthermophila、土生梭孢霉、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、绿色木霉或Trichophaea saccata多肽。

能用作本发明的方法中多核苷酸的来源的真菌内切葡聚糖酶的实例包括，但不限于，里氏木霉内切葡聚糖酶I(Penttila等，1986，Gene 45：253-263；GenBank^TM登录号M15665)；里氏木霉内切葡聚糖酶II(Saloheimo等，1988，Gene 63：11-22；GenBank^TM登录号M19373)；里氏木霉内切葡聚糖酶III(Okada等，1988，Appl.Environ.Microbiol.64：555-563；GenBank^TM登录号AB003694)；里氏木霉内切葡聚糖IV(Saloheimo等，1997，Eur.J.Biochem.249：584-591；GenBank^TM登录号Y11113)；和里氏木霉内切葡聚糖酶V(Saloheimo等，1994，Molecular Microbiology 13：219-228；GenBank^TM登录号Z33381)；棘孢曲霉内切葡聚糖酶(Ooi等，1990，Nucleic Acids Research 18：5884)；川地曲霉内切葡聚糖酶(Sakamoto等，1995，Current Genetics 27：435-439)；金孢子菌属菌种C1(美国专利6,573,086；GenPept登录号AAQ38150)；Corynascus heterothallicus(美国专利6,855,531；GenPept登录号AAY00844)；胡萝卜软腐欧文氏菌(Erwiniacarotovara)内切葡聚糖酶(Saarilahti等，1990，Gene 90：9-14)；尖镰孢内切葡聚糖酶(GenBank^TM登录号L29381)；灰腐质霉高温变种(Humicola grisea var.thermoidea)内切葡聚糖酶(GenBank^TM登录号AB003107)；Melanocarpusalbomyces内切葡聚糖酶(GenBank^TM登录号MAL515703)；粗糙脉孢菌内切葡聚糖酶(GenBank^TM登录号XM 324477)；马瘤胃壶菌(Piromyces equi)(Eberhardt等，2000，Microbiology 146：1999-2008；GenPept登录号CAB92325)；米根霉(Rhizopus oryzae)(Moriya等，2003，J.Bacteriology 185：1749-1756；GenBank^TM登录号AB047927，AB056667和AB056668)；和土生梭孢霉(WO 2004/053039；EMBL登录号CQ827970)。

使用根据Henrissat B.，1991，A classification of glycosyl hydrolases basedon amino-acid sequence similarities，Biochem.J.280：309-316，Henrissat B.和Bairoch A.，1996，Updating the sequence-based classification of glycosylhydrolases，Biochem.J.316：695-696的分类，在超过13个糖基水解酶家族中公开了其它内切葡聚糖酶。

用于分离或克隆编码具有内切葡聚糖酶活性的多肽的多核苷酸的技术是本领域内已知的，并且包括从基因组DNA分离，从cDNA制备，或其组合。可通过例如使用熟知的聚合酶链式反应(PCR)或表达文库的抗体筛选以检测具有共有结构特性的克隆DNA片段，从而实现从这种基因组DNA中克隆多核苷酸。参见，例如，Innis等，1990，PCR Protocols：A Guide to Methods andApplication，Academic Press，New York。可以使用其它核酸扩增方法，如连接酶链式反应(LCR)，连接活化转录(LAT)和基于核苷酸序列的扩增(NASBA)。

可理解的是对于前述的物种，本发明包含完全和不完全阶段两种，和其它分类学的等同物，例如无性型，而无论它们已知的种名。本领域技术人员将轻易地识别适合的等同物的身份。

这些物种的菌株在许多培养物保藏中心对于公众能够轻易地取得，所述保藏中心诸如美国典型培养物保藏中心(the American Type Culture Collection)(ATCC)、德意志微生物和细胞培养物保藏中心(Deutsche Sammiung vonMikroorganismen und Zellkulturen GmbH)(DSM)、真菌菌种保藏中心 (Centraalbureau Voor Schimmelcultures)(CBS)和农业研究机构专利培养物保藏中心，北区研究中心(Agricultural Research Service Patent Culture Collection，Northern Regional Research Center)(NRRL)。

在优选的方面，内切葡聚糖酶的全长多肽、成熟多肽，或催化域由获得自内切葡聚糖酶I基因的多核苷酸编码。

在另一个优选的方面，内切葡聚糖酶的全长多肽、成熟多肽，或催化域由获得自内切葡聚糖酶II基因的多核苷酸编码。

在另一个优选的方面，内切葡聚糖酶的全长多肽、成熟多肽，或催化域由获得自内切葡聚糖酶III基因的多核苷酸编码。

在另一个优选的方面，内切葡聚糖酶的全长多肽、成熟多肽，或催化域由获得自内切葡聚糖酶IV基因的多核苷酸编码。

在另一个优选的方面，内切葡聚糖酶的全长多肽、成熟多肽，或催化域由获得自内切葡聚糖酶V基因的多核苷酸编码。在更优选的方面，内切葡聚糖酶的全长多肽、成熟多肽，或催化域由获得自特异腐质霉内切葡聚糖酶V基因的多核苷酸编码。在最优选的方面，内切葡聚糖酶的全长多肽、成熟多肽，或催化域由获得自特异腐质霉内切葡聚糖酶V基因的多核苷酸编码，所述基因包含编码SEQ ID NO：30的多肽的SEQ ID NO：29。

在另一个优选的方面，内切葡聚糖酶的全长多肽、成熟多肽，或催化域由获得自内切葡聚糖酶VI基因的多核苷酸编码。

在另一个优选的方面，内切葡聚糖酶的全长多肽、成熟多肽，或催化域由获得自家族5内切葡聚糖酶基因的多核苷酸编码。在更优选的方面，内切葡聚糖酶的全长多肽、成熟多肽，或催化域由获得自嗜热毁丝霉CBS 117.65内切葡聚糖酶基因的多核苷酸编码。在最优选的方面，内切葡聚糖酶的全长多肽、成熟多肽，或催化域由获得自嗜热毁丝霉CBS 117.65内切葡聚糖酶基因的多核苷酸编码，所述基因包含编码SEQ ID NO：32的多肽的SEQ ID NO：31。在另一个更优选的方面，内切葡聚糖酶的全长多肽、成熟多肽，或催化域由获得自担子菌CBS 495.95内切葡聚糖酶基因的多核苷酸编码。在另一个最优选的方面，内切葡聚糖酶的全长多肽、成熟多肽，或催化域由获得自担子菌CBS 495.95内切葡聚糖酶基因的多核苷酸编码，所述基因包含编码SEQID NO：34的多肽的SEQ ID NO：33。在另一个更优选的方面，内切葡聚糖酶的全长多肽、成熟多肽，或催化域由获得自担子菌CBS 494.95内切葡聚糖酶基因的多核苷酸编码。在另一个最优选的方面，内切葡聚糖酶的全长多肽、成熟多肽，或催化域由获得自担子菌CBS 494.95内切葡聚糖酶基因的多核苷酸编码，所述基因包含编码SEQ ID NO：36的多肽的SEQ ID NO：35。

在另一个优选的方面，内切葡聚糖酶的全长多肽、成熟多肽，或催化域由获得自家族6内切葡聚糖酶基因的多核苷酸编码。在更优选的方面，内切葡聚糖酶的全长多肽、成熟多肽，或催化域由获得自土生梭孢霉NRRL 8126CEL6B内切葡聚糖酶基因的多核苷酸编码。在最优选的方面，内切葡聚糖酶的全长多肽、成熟多肽，或催化域由获得自土生梭孢霉NRRL 8126 CEL6B内切葡聚糖酶基因的多核苷酸编码，所述基因包含编码SEQ ID NO：38的多肽的SEQ ID NO：37。在另一个更优选的方面，内切葡聚糖酶的全长多肽、成熟多肽，或催化域由获得自土生梭孢霉NRRL 8126 CEL6C内切葡聚糖酶基因的多核苷酸编码。在另一个最优选的方面，内切葡聚糖酶的全长多肽、成熟多肽，或催化域由获得自土生梭孢霉NRRL 8126 CEL6C内切葡聚糖酶基因的多核苷酸编码，所述基因包含编码SEQ ID NO：40的多肽的SEQ ID NO：39。

在另一个优选的方面，内切葡聚糖酶的全长多肽、成熟多肽，或催化域由获得自家族7内切葡聚糖酶基因的多核苷酸编码。在更优选的方面，内切葡聚糖酶的全长多肽、成熟多肽，或催化域由获得自土生梭孢霉NRRL 8126CEL7C内切葡聚糖酶基因的多核苷酸编码。在最优选的方面，内切葡聚糖酶的全长多肽、成熟多肽，或催化域由获得自土生梭孢霉NRRL 8126 CEL7C内切葡聚糖酶基因的多核苷酸编码，所述基因包含编码SEQ ID NO：42的多肽的SEQ ID NO：41。在另一个更优选的方面，内切葡聚糖酶的全长多肽、成熟多肽，或催化域由获得自土生梭孢霉NRRL 8126 CEL7E内切葡聚糖酶基因的多核苷酸编码。在另一个最优选的方面，内切葡聚糖酶的全长多肽、成熟多肽，或催化域由获得自NRRL 8126 CEL7E内切葡聚糖酶基因的多核苷酸编码，所述基因包含编码SEQ ID NO：44的多肽的SEQ ID NO：43。在另一个更优选的方面，内切葡聚糖酶的全长多肽、成熟多肽，或催化域由获得自土生梭孢霉NRRL 8126 CEL7F内切葡聚糖酶基因的多核苷酸编码。在另一个最优选的方面，内切葡聚糖酶的全长多肽、成熟多肽，或催化域由获得自NRRL8126 CEL7F内切葡聚糖酶基因的多核苷酸编码，所述基因包含编码SEQ IDNO：46的多肽的SEQ ID NO：45。在另一个更优选的方面，内切葡聚糖酶的全长多肽、成熟多肽，或催化域由获得自Cladorrhinum foecundissimum ATCC 62373 CEL7A内切葡聚糖酶基因的多核苷酸编码。在另一个最优选的方面，内切葡聚糖酶的全长多肽、成熟多肽，或催化域由获得自Cladorrhinumfoecundissimum ATCC 62373 CEL7A内切葡聚糖酶基因的多核苷酸编码，所述基因包含编码SEQ ID NO：48的多肽的SEQ ID NO：47。

在另一个最优选的方面，内切葡聚糖酶的全长多肽、成熟多肽，或催化域由获得自里氏木霉菌株VTT-D-80133内切葡聚糖酶基因的多核苷酸编码，所述基因包含编码SEQ ID NO：50的多肽的SEQ ID NO：49(GenBank^TM登录号M15665)。

在另一个优选的方面，内切葡聚糖酶的全长多肽、成熟多肽，或催化域由获得自家族9内切葡聚糖酶基因的多核苷酸编码。

在另一个优选的方面，内切葡聚糖酶的全长多肽、成熟多肽，或催化域由获得自家族12内切葡聚糖酶基因的多核苷酸编码。

在另一个优选的方面，内切葡聚糖酶的全长多肽、成熟多肽，或催化域由获得自家族45内切葡聚糖酶基因的多核苷酸编码。在更优选的方面，内切葡聚糖酶的全长多肽、成熟多肽，或催化域由获得自家族45内切葡聚糖酶基因的多核苷酸编码。在最优选的方面，内切葡聚糖酶的全长多肽、成熟多肽，或催化域由获得自特异腐质霉内切葡聚糖酶V基因的多核苷酸或其直向同源物和变体编码，所述基因包含编码SEQ ID NO：30的多肽的SEQ ID NO：29。其它优选的家族45内切葡聚糖酶及其多核苷酸获得子金孢霉菌种C1(美国专利6,573,086；GenPept登录号AAQ38150)；Corynascus heterothallicus(美国专利6,855,531；GenPept登录号AAY00844)；马瘤胃壶菌属(Eberhardt等，2000，Microbiology 146：1999-2008；GenPept登录号CAB92325)；和米根霉(Moriya等，2003，J.Bacteriology 185：1749-1756；GenBank^TM登录号AB047927、AB056667，和AB056668)。

在另一个优选的方面，内切葡聚糖酶的全长多肽、成熟多肽，或催化域由获得自家族74内切葡聚糖酶基因的多核苷酸编码。

在优选的方面，β-葡糖苷酶的全长多肽、成熟多肽，或催化域由获得自家族1β-葡糖苷酶基因的多核苷酸编码。

在另一个优选的方面，β-葡糖苷酶的全长多肽、成熟多肽，或催化域由获得自家族3β-葡糖苷酶基因的多核苷酸编码。

在另一个优选的方面，β-葡糖苷酶的全长多肽、成熟多肽，或催化域由获得自家族5β-葡糖苷酶基因的多核苷酸编码。

在另一个优选的方面，β-葡糖苷酶的全长多肽、成熟多肽，或催化域由获得自米曲霉β-葡糖苷酶基因的多核苷酸编码。在最优选的实施方案中，β-葡糖苷酶的全长多肽、成熟多肽，或催化域由获得自米曲霉β-葡糖苷酶基因的多核苷酸编码，所述基因包含编码SEQ ID NO：16的多肽的SEQ ID NO：15，或者获得自米曲霉β-葡糖苷酶突变基因，所述基因包含编码SEQ ID NO：18的多肽的SEQ ID NO：17。

在另一个优选的方面，β-葡糖苷酶的全长多肽、成熟多肽，或催化域由获得自烟曲霉β-葡糖苷酶基因的多核苷酸编码。在最优选的实施方案中，β-葡糖苷酶的全长多肽、成熟多肽，或催化域由获得自烟曲霉β-葡糖苷酶基因的多核苷酸编码，所述基因包含编码SEQ ID NO：20的多肽的SEQ ID NO：19。

在另一个优选的方面，β-葡糖苷酶的全长多肽、成熟多肽，或催化域由获得自巴西青霉菌株IBT 20888β-葡糖苷酶基因的多核苷酸编码。在最优选的实施方案中，β-葡糖苷酶的全长多肽、成熟多肽，或催化域由获得自巴西青霉菌株IBT 20888β-葡糖苷酶基因的多核苷酸编码，所述基因包含编码SEQID NO：22的多肽的SEQ ID NO：21。

在另一个优选的方面，β-葡糖苷酶的全长多肽、成熟多肽，或催化域由获得自里氏木霉菌株QM9414 β-葡糖苷酶基因的多核苷酸编码。在最优选的实施方案中，β-葡糖苷酶的全长多肽、成熟多肽，或催化域由获得自里氏木霉菌株QM9414β-葡糖苷酶基因的多核苷酸编码，所述基因包含编码SEQ IDNO：24的多肽的SEQ ID NO：23(GenBank^TM登录号U09580)。

在另一个优选的方面，β-葡糖苷酶的全长多肽、成熟多肽，或催化域由获得自黑曲霉β-葡糖苷酶基因的多核苷酸编码。在最优选的实施方案中，β-葡糖苷酶的全长多肽、成熟多肽，或催化域由获得自黑曲霉β-葡糖苷酶基因的多核苷酸编码，所述基因包含编码SEQ ID NO：26的多肽的SEQ ID NO：25。

在另一个优选的方面，β-葡糖苷酶的全长多肽、成熟多肽，或催化域由获得自棘孢曲霉β-葡糖苷酶基因的多核苷酸编码。在最优选的实施方案中，β-葡糖苷酶的全长多肽、成熟多肽，或催化域由获得自棘孢曲霉β-葡糖苷酶基因的多核苷酸编码，所述基因包含编码SEQ ID NO：28的多肽的SEQ ID NO：27。

在另一个优选的方面，β-葡糖苷酶是天然分泌的。在另一个优选的方面，β-葡糖苷酶不是天然分泌的。

在另一个优选的方面，内切葡聚糖酶的全长多肽、成熟多肽，或催化域由获得自编码同源多肽的基因的多核苷酸编码，其中所述同源多肽包含以下氨基酸序列或由其组成，所述氨基酸序列与SEQ ID NO：30、SEQ ID NO：32、SEQ ID NO：34、SEQ ID NO：36、SEQ ID NO：38、SEQ ID NO：40、SEQ ID NO：42、SEQ ID NO：44、SEQ ID NO：46、SEQ ID NO：48，或SEQ ID NO：50的全长多肽、成熟多肽或催化域的氨基酸序列具有优选至少60％，更优选至少65％，更优选至少70％，更优选至少75％，更优选至少80％，更优选至少85％，甚至更优选至少90％，最优选至少95％，并且甚至最优选至少96％，97％，98％，或99％的同一性程度，其具有内切葡聚糖酶活性。在优选的方面，同源多肽具有以下氨基酸序列，所述氨基酸序列与SEQ ID NO：30、SEQ ID NO：32、SEQ ID NO：34、SEQ ID NO：36、SEQ ID NO：38、SEQ ID NO：40、SEQ ID NO：42、SEQ ID NO：44、SEQ ID NO：46、SEQ ID NO：48，或SEQ ID NO：50的全长多肽、成熟多肽或催化域相差十个氨基酸，优选相差五个氨基酸，更优选相差四个氨基酸，甚至更优选相差三个氨基酸，最优选相差两个氨基酸，并且甚至最优选相差一个氨基酸。

在另一个优选的方面，β-葡糖苷酶的全长多肽、成熟多肽，或催化域由获得自编码同源多肽的基因的多核苷酸编码，其中所述同源多肽包含或组成为以下氨基酸序列，所述氨基酸序列与SEQ ID NO：16、SEQ ID NO：18、SEQID NO：20、SEQ ID NO：22、SEQ ID NO：24、SEQ ID NO：26，或SEQ ID NO：28的全长多肽、成熟多肽或催化域的氨基酸序列具有优选至少60％，更优选至少65％，更优选至少70％，更优选至少75％，更优选至少80％，更优选至少85％，甚至更优选至少90％，最优选至少95％，并且甚至最优选至少96％，97％，98％，或99％的同一性程度，其具有内切葡聚糖酶活性。在优选的方面，同源多肽包含或组成为以下氨基酸序列，所述氨基酸序列与SEQ ID NO：16、SEQ ID NO：18、SEQ ID NO：20、SEQ ID NO：22、SEQ ID NO：24、SEQ ID NO：26，或SEQ ID NO：28的全长多肽、成熟多肽或催化域相差十个氨基酸，优选相差五个氨基酸，更优选相差四个氨基酸，甚至更优选相差三个氨基酸，最优选相差两个氨基酸，并且甚至最优选相差一个氨基酸。

在另一个优选的方面，内切葡聚糖酶的全长多肽、成熟多肽，或催化域由包含或组成为以下核苷酸序列的多核苷酸编码，所述核苷酸序列在非常低严紧条件下，优选低严紧条件下，更优选中严紧条件下，更优选中-高严紧条件下，甚至更优选高严紧条件下，并且最优选非常高严紧条件下，与以下序列杂交：(i)SEQ ID NO：29、SEQ ID NO：31、SEQ ID NO：33、SEQ ID NO：35、SEQ ID NO：37、SEQ ID NO：39、SEQ ID NO：41、SEQ ID NO：43、SEQ ID NO：45、SEQ ID NO：47，或SEQ ID NO：49，(ii)包含在SEQ ID NO：29、SEQ IDNO：31、SEQ ID NO：33、SEQ ID NO：35、SEQ ID NO：37、SEQ ID NO：39、SEQ ID NO：41、SEQ ID NO：43、SEQ ID NO：45、SEQ ID NO：47，或SEQ IDNO：49中的cDNA序列，或包含SEQ ID NO：29、SEQ ID NO：31、SEQ ID NO：33、SEQ ID NO：35、SEQ ID NO：37、SEQ ID NO：39、SEQ ID NO：41、SEQID NO：43、SEQ ID NO：45、SEQ ID NO：47，或SEQ ID NO：49的基因组DNA序列，(iii)(i)或(ii)的亚序列，或(iv)(i)、(ii)或(iii)的全长互补链(JJ.Sambrook，E.F.Fritsch和T.Maniatis，1989，Molecular Cloning，A Laboratory Manual，第2版，Cold Spring Harbor，New York)。SEQ ID NO：29、SEQ ID NO：31、SEQ IDNO：33、SEQ ID NO：35、SEQ ID NO：37、SEQ ID NO：39、SEQ ID NO：41、SEQ ID NO：43、SEQ ID NO：45、SEQ ID NO：47，或SEQ ID NO：49的亚序列含有至少100个连续的核苷酸或优选至少200个连续的核苷酸。

在另一个优选的方面，β-葡糖苷酶的全长多肽、成熟多肽，或催化域由包含或组成为以下核苷酸序列的多核苷酸编码，所述核苷酸序列在非常低严紧条件下，优选低严紧条件下，更优选中严紧条件下，更优选中-高严紧条件下，甚至更优选高严紧条件下，并且最优选非常高严紧条件下，与以下杂交：(i)SEQ ID NO：15、SEQ ID NO：17、SEQ ID NO：19、SEQ ID NO：21、SEQ IDNO：23、SEQ ID NO：25，或SEQ ID NO：27，(ii)包含在SEQ ID NO：17、SEQID NO：19、SEQ ID NO：21、SEQ ID NO：23、SEQ ID NO：25，或SEQ ID NO：27中的cDNA序列，或包含SEQ ID NO：15、SEQ ID NO：17、SEQ ID NO：19、SEQ ID NO：21、SEQ ID NO：23、SEQ ID NO：25，或SEQ ID NO：27的基因组DNA序列，(iii)(i)或(ii)的亚序列，或(iv)(i)、(ii)或(iii)的全长互补链(J J.Sambrook，E.F.Fritsch和T.Maniatis，1989，Molecular Cloning，A LaboratoryManual，第2版，Cold Spring Harbor，New York)。SEQ ID NO：15、SEQ ID NO：17、SEQ ID NO：19、SEQ ID NO：21、SEQ ID NO：23、SEQ ID NO：25，或SEQ ID NO：27的亚序列含有至少100个连续的核苷酸或优选至少200个连续的核苷酸。

SEQ ID NO：29、SEQ ID NO：31、SEQ ID NO：33、SEQ ID NO：35、SEQ ID NO：37、SEQ ID NO：39、SEQ ID NO：41、SEQ ID NO：43、SEQ ID NO：45、SEQ ID NO：47，或SEQ ID NO：49的核苷酸序列，或其亚序列，以及SEQ IDNO：30、SEQ ID NO：32、SEQ ID NO：34、SEQ ID NO：36、SEQ ID NO：38、SEQ ID NO：40、SEQ ID NO：42、SEQ ID NO：44、SEQ ID NO：46、SEQ ID NO：48，或SEQ ID NO：50的氨基酸序列，或其用于内切葡聚糖酶的片段，和SEQID NO：15、SEQ ID NO：17、SEQ ID NO：19、SEQ ID NO：21、SEQ ID NO：23、SEQ ID NO：25，或SEQ ID NO：27的核苷酸序列，或其亚序列，以及SEQ IDNO：16、SEQ ID NO：18、SEQ ID NO：20、SEQ ID NO：22、SEQ ID NO：24、SEQ ID NO：26，或SEQ ID NO：28的氨基酸序列，或其用于β-葡糖苷酶的片段，可用于设计核酸探针，以从不同属和种的菌株鉴定和克隆编码具有内切葡聚糖酶或β-葡糖苷酶活性的多肽的DNA，如上文所述。

就本发明而言，杂交表示核苷酸序列在非常低至非常高的严紧条件下与对应于上述核苷酸序列之一的标记的核酸探针杂交，如上文所述。

对于长度大约15个核苷酸至大约70个核苷酸的短探针，将载体材料进行洗涤，如在本文中定义。

在另一个优选方面，也可以使用如“具有纤维二糖水解酶或内切葡聚糖酶活性的多肽及其多核苷酸”部分所述的内切葡聚糖酶的全长多肽、成熟多肽，或催化域构建β-葡糖苷酶融合蛋白。

在优选的方面，β-葡糖苷酶融合蛋白包含或组成为SEQ ID NO：104。在另一优选的方面，β-葡糖苷酶融合蛋白由包含或组成为SEQ ID NO：103的多核苷酸编码。在另一优选的方面，β-葡糖苷酶融合蛋白包含或组成为SEQ IDNO：106。在另一优选的方面，β-葡糖苷酶融合蛋白由包含或组成为SEQ IDNO：105的多核苷酸编码。

如上所述，很多内切葡聚糖酶具有通过接头肽与纤维素结合域分隔开的催化域组成的多域结构。在本发明的方法中，β-葡糖苷酶融合构建体进一步包含接头，所述接头位于包含内切葡聚糖酶催化域的序列3’，和包含β-葡糖苷酶催化域的序列5’。

接头可以获得自与内切葡聚糖酶催化域相同的基因，或者获得自不同的内切葡聚糖酶基因。另一方面，接头可以是合成来源的。

能用于本发明的方法中的接头的实例包括，但不限于，获得自下述酶的基因的接头：里氏木霉纤维二糖水解酶I(Srisodsuk等，1993，Journal of BiologicalChemistry 268：20765-20761)；红褐肉座菌(Hypocrea jecorina)(以前为里氏木霉)Cel7A纤维二糖水解酶(Mulakala等，2005，Proteins 60：598-605)；特异腐质霉内切葡聚糖酶V；和土生梭孢霉NRRL 8126 CEL7C内切葡聚糖酶。

在优选的方面，接头获得自特异腐质霉内切葡聚糖酶基因。在另一优选的方面，接头获得自里氏木霉内切葡聚糖酶基因。在更优选的方面，接头获得自特异腐质霉内切葡聚糖酶V(eg5)基因。

在另一个优选的方面，接头获得自土生梭孢霉内切葡聚糖酶基因。在另一更优选的方面，接头获得自土生梭孢霉NRRL 8126 CEL7C内切葡聚糖酶基因。

在优选的方面，接头至少为5个氨基酸残基。在更优选的方面，接头至少为15个氨基酸残基。在最优选的方面，接头至少为25个氨基酸残基。

在优选的方面，接头在约5至60个氨基酸残基之间。在更优选的方面，接头在约15至50个氨基酸残基之间。在最优选的方面，接头在约25至45个氨基酸残基之间。

尽管已经描述了很多类型的糖结合域，但是其中大部分通常称作纤维素结合域(CBD)。典型的纤维素结合域出现在纤维素酶中。相似地，CBD的其它亚类可包括，例如，几丁质结合域(通常出现在几丁质酶中的CBD)、甘露聚糖结合域(通常出现在甘露聚糖酶中的CBD)和淀粉结合域。

CBD作为大的多肽或蛋白质的整合部分存在，其中所述大的多肽或蛋白质由两个或多个多肽氨基酸序列区组成，特别是在水解酶中，其通常包含催化域和糖结合域(CBD)，催化域包含用于底物水解的活性位点，而糖结合域用于结合所述的糖底物。这种酶包含多于一个催化域和一个、两个或三个CBD，任选地还包含一个或多个(几个)连接CBD与催化域的多肽氨基酸序列区，后一类型的区域通常称作“接头”。包含CBD的水解酶的实例为纤维素酶、木聚糖酶、甘露聚糖酶、阿拉伯呋喃糖苷酶、乙酰酯酶和几丁质酶(参见P.Tomme等，Cellulose-Binding Domains-Classification and Properties in Enzymatic Degradation of Insoluble Carbohydrates，John N.Saddler和Michael H.Penner(编)，ACS Symposium Series，No.618，1996)。大多数已知的CBD源自纤维素酶和木聚糖酶。

CBD可以位于蛋白质或多肽的N或C末端，或者内部位置。多肽或蛋白质的构成CBD的区域通常由多于约30个并少于约250个氨基酸残基组成。例如依照Tomme等，1996，上文中列出并归类入家族I中的那些CBD，其由33-37个氨基酸残基组成；列出并归类入家族IIa类中的那些CBD，其由95-108个氨基酸残基组成；列出并归类入家族VI类中的那些CBD，其由85-92个氨基酸残基组成；和列出并归类入家族VII类中的一个CBD(源自来自热纤维梭菌(Clostridium thermocellum)的纤维素酶)，其由240个氨基酸残基组成。因此，构成CBD的氨基酸序列的分子量通常在约4kDa至约40kDa的范围内，并通常低于约35kDa。

在本发明的方法中，可以使用任何CBD。CBD可以与内切葡聚糖酶天然相关，或者可以对于内切葡聚糖酶是异源的。

在优选的方面，CBD获得自里氏木霉内切葡聚糖酶(EG)基因。在更优选的方面，CBD获得自里氏木霉内切葡聚糖酶EGI基因。在另一更优选的方面，CBD获得自里氏木霉内切葡聚糖酶EGII基因。在另一更优选的方面，CBD获得自里氏木霉内切葡聚糖酶EGV。

在另一个优选的方面，CBD获得自里氏木霉纤维二糖水解酶(CBH)基因。在另一优选的方面，CBD获得自里氏木霉CBHI基因(Terri等，1987，Gene 51：42-52；Linder和Teeri，1996，Biochemistry 93：12251-12255)。在另一优选的方面，CBD获得自里氏木霉内切葡聚糖酶CBHII基因。

在另一个优选的方面，CBD获得自土生梭孢霉内切葡聚糖酶基因。在另一更优选的方面，CBD获得自土生梭孢霉NRRL 8126 CEL7C内切葡聚糖酶基因。

β-葡糖苷酶融合构建体可进一步包含切割位点。切割位点优选位于至少包含内切葡聚糖酶催化域的序列之后，并位于至少包含β-葡糖苷酶催化域的序列之前。通过β-葡糖苷酶融合蛋白的分泌，位点被切割以释放来自融合蛋白的有β-葡糖苷酶活性的多肽。

切割位点的实例包括，但不限于，编码二肽Lys-Arg的Kex2位点(Martin等，2003，J.Ind.Microbiol.Biotechnol.3：568-76；Svetina等，2000，J.Biotechnol. 76：245-251；Rasmussen-Wilson等，1997，Appl.Environ.Microbiol.63：3488-3493；Ward等，1995，Biotechnology 13：498-503；和Contreras等，1991，Biotechnology 9：378-381)，在精氨酸残基之后被因子Xa蛋白酶切割的Ile-(Glu或Asp)-Gly-Arg位点(Eaton等，1986，Biochem.25：505-512)；在赖氨酸之后被肠激酶切割的Asp-Asp-Asp-Asp-Lys位点(Collins-Racie等，1995，Biotechnology 13：982-987)；被Genenase I切割的His-Tyr-Glu或His-Tyr-Asp位点(Carte等，1989，Proteins：Structure，Function and Genetics 6：240-248)；在Arg之后被凝血酶切割的Leu-Val-Pro-Arg-Gly-Ser位点(Stevens，2003，Drug Discovery World 4：35-48)；在Gln之后被TEV蛋白酶切割的Glu-Asn-Leu-Tyr-Phe-Gln-Gly位点(Stevens，2003，见上文)；和在Gln之后被遗传工程化形式的人鼻病毒3C蛋白酶切割的Leu-Glu-Val-Leu-Phe-Gln-Gly-Pro位点(Stevens，2003，见上文)。

具有纤维二糖水解酶或内切葡聚糖酶活性的多肽及其多核苷酸

在本发明中，具有纤维二糖水解酶或内切葡聚糖酶活性的多肽及它们的多核苷酸优选选自下组：里氏木霉纤维二糖水解酶I(CEL7A)，里氏木霉纤维二糖水解酶II(CEL6A)，和里氏木霉内切葡聚糖酶I(CEL7B)，及其直向同源物或变体，还选自下组：里氏木霉内切葡聚糖酶II(CEL5A)，里氏木霉内切葡聚糖酶III(CEL12A)，和里氏木霉内切葡聚糖酶V(CEL45A)，及其直向同源物或变体。

在第一方面，具有纤维二糖水解酶I活性的分离的多肽包含或组成为以下氨基酸序列，所述氨基酸序列与SEQ ID NO：52(里氏木霉纤维二糖水解酶I；CEL7A)的成熟多肽具有优选至少60％，更优选至少65％，更优选至少70％，更优选至少75％，更优选至少80％，甚至更优选至少85％，甚至更优选至少90％，最优选至少95％，并且甚至最优选至少96％，97％，98％，或99％同一性程度，其具有纤维二糖水解酶I活性(下文称作“同源多肽”)。在优选的方面，同源多肽包含或组成为以下氨基酸序列，所述氨基酸序列与SEQ ID NO：52的成熟多肽相差十个氨基酸，优选相差五个氨基酸，更优选相差四个氨基酸，甚至更优选相差三个氨基酸，最优选相差两个氨基酸，并且甚至最优选相差一个氨基酸。

具有纤维二糖水解酶I活性的多肽优选包含SEQ ID NO：52的氨基酸序列或其等位变体；或其具有纤维二糖水解酶I活性的片段。在优选的方面，多肽包含SEQ ID NO：52的氨基酸序列。在另一优选的方面，多肽包含SEQ IDNO：52的成熟多肽。在另一优选的方面，多肽包含SEQ ID NO：52的氨基酸18至514，或其等位变体；或其具有纤维二糖水解酶I活性的片段。在另一优选的方面，多肽包含SEQ ID NO：52的氨基酸18至514。在另一优选的方面，多肽由SEQ ID NO：52的氨基酸序列或其等位变体；或其具有纤维二糖水解酶I活性的片段组成。在另一优选的方面，多肽由SEQ ID NO：52的氨基酸序列组成。在另一优选的方面，多肽由SEQ ID NO：52的成熟多肽组成。在另一优选的方面，多肽由SEQ ID NO：52的氨基酸18至514或其等位变体；或其具有纤维二糖水解酶I活性的片段组成。在另一优选的方面，多肽由SEQID NO：52的氨基酸18至514组成。

在另一个第一方面，具有纤维二糖水解酶II活性的分离的多肽包含或组成为以下氨基酸序列，所述氨基酸序列与SEQ ID NO：54(里氏木霉纤维二糖水解酶II；CEL6A)的成熟多肽具有优选至少60％，更优选至少65％，更优选至少70％，更优选至少75％，更优选至少80％，甚至更优选至少85％，甚至更优选至少90％，最优选至少95％，并且甚至最优选至少96％，97％，98％，或99％同一性程度，其具有纤维二糖水解酶I活性(下文称作“同源多肽”)。在优选的方面，同源多肽包含或组成为氨基酸序列，所述氨基酸序列与SEQ IDNO：54的成熟多肽相差十个氨基酸，优选相差五个氨基酸，更优选相差四个氨基酸，甚至更优选相差三个氨基酸，最优选相差两个氨基酸，并且甚至最优选相差一个氨基酸。

具有纤维二糖水解酶II活性的多肽优选包含SEQ ID NO：54的氨基酸序列或其等位变体；或其具有纤维二糖水解酶II活性的片段。在优选的方面，多肽包含SEQ ID NO：54的氨基酸序列。在另一优选的方面，多肽包含SEQ IDNO：54的成熟多肽。在另一优选的方面，多肽包含SEQ ID NO：54的氨基酸25至471，或其等位变体；或其具有纤维二糖水解酶II活性的片段。在另一优选的方面，多肽包含SEQ ID NO：54的氨基酸25至471。在另一优选的方面，多肽由SEQ ID NO：54的氨基酸序列或其等位变体；或其具有纤维二糖水解酶II活性的片段组成。在另一优选的方面，多肽由SEQ ID NO：54的氨基酸序列组成。在另一优选的方面，多肽由SEQ ID NO：54的成熟多肽组成。在另一优选的方面，多肽由SEQ ID NO：54的氨基酸25至471或其等位变体；或其具有纤维二糖水解酶II活性的片段组成。在另一优选的方面，多肽由SEQ ID NO：54的氨基酸25至471组成。

在另一个第一方面，具有内切葡聚糖酶I活性的分离的多肽包含或组成为以下氨基酸序列，所述氨基酸序列与SEQ ID NO：56(里氏木霉内切葡聚糖酶I；CEL7B)的成熟多肽具有优选至少60％，更优选至少65％，更优选至少70％，更优选至少75％，更优选至少80％，甚至更优选至少85％，甚至更优选至少90％，最优选至少95％，并且甚至最优选至少96％，97％，98％，或99％同一性程度，其具有内切葡聚糖酶I活性(下文称作“同源多肽”)。在优选的方面，同源多肽包含或组成为以下氨基酸序列，所述氨基酸序列与SEQ IDNO：56的成熟多肽相差十个氨基酸，优选相差五个氨基酸，更优选相差四个氨基酸，甚至更优选相差三个氨基酸，最优选相差两个氨基酸，并且甚至最优选相差一个氨基酸。

具有内切葡聚糖酶I活性的多肽优选包含SEQ ID NO：56的氨基酸序列或其等位变体；或其具有内切葡聚糖酶I活性的片段。在优选的方面，多肽包含SEQ ID NO：56的氨基酸序列。在另一优选的方面，多肽包含SEQ ID NO：56的成熟多肽。在另一优选的方面，多肽包含SEQ ID NO：56的氨基酸23至459，或其等位变体；或其具有内切葡聚糖酶I活性的片段。在另一优选的方面，多肽包含SEQ ID NO：56的氨基酸23至459。在另一优选的方面，多肽由SEQ ID NO：56的氨基酸序列或其等位变体；或其具有内切葡聚糖酶I活性的片段组成。在另一优选的方面，多肽由SEQ ID NO：56的氨基酸序列组成。在另一优选的方面，多肽由SEQ ID NO：56的成熟多肽组成。在另一优选的方面，多肽由SEQ ID NO：56的氨基酸23至459或其等位变体；或其具有内切葡聚糖酶I活性的片段组成。在另一优选的方面，多肽由SEQ ID NO：56的氨基酸23至459组成。

在另一个第一方面，具有内切葡聚糖酶II活性的分离的多肽包含或组成为以下氨基酸序列，所述氨基酸序列与SEQ ID NO：58(里氏木霉内切葡聚糖酶II；CEL5A)的成熟多肽具有优选至少60％，更优选至少65％，更优选至少70％，更优选至少75％，更优选至少80％，甚至更优选至少85％，甚至更优选至少90％，最优选至少95％，并且甚至最优选至少96％，97％，98％，或99％同一性程度，其具有内切葡聚糖酶II活性(下文称作“同源多肽”)。在优选的方面，同源多肽包含或组成为以下氨基酸序列，所述氨基酸序列与SEQ IDNO：58的成熟多肽相差十个氨基酸，优选相差五个氨基酸，更优选相差四个氨基酸，甚至更优选相差三个氨基酸，最优选相差两个氨基酸，并且甚至最优选相差一个氨基酸。

具有内切葡聚糖酶II活性的多肽优选包含SEQ ID NO：58的氨基酸序列或其等位变体；或其具有内切葡聚糖酶II活性的片段。在优选的方面，多肽包含SEQ ID NO：58的氨基酸序列。在另一优选的方面，多肽包含SEQ ID NO：58的成熟多肽。在另一优选的方面，多肽包含SEQ ID NO：58的氨基酸22至418，或其等位变体；或其具有内切葡聚糖酶II活性的片段。在另一优选的方面，多肽包含SEQ ID NO：58的氨基酸22至418。在另一优选的方面，多肽由SEQ ID NO：58的氨基酸序列或其等位变体；或其具有内切葡聚糖酶II活性的片段组成。在另一优选的方面，多肽由SEQ ID NO：58的氨基酸序列组成。在另一优选的方面，多肽由SEQ ID NO：52的成熟多肽组成。在另一优选的方面，多肽由SEQ ID NO：58的氨基酸22至418或其等位变体；或其具有内切葡聚糖酶II活性的片段组成。在另一优选的方面，多肽由SEQ IDNO：58的氨基酸22至418组成。

在另一个第一方面，具有内切葡聚糖酶III活性的分离的多肽包含或组成为以下氨基酸序列，所述氨基酸序列与SEQ ID NO：60(里氏木霉内切葡聚糖酶III；CEL12A)的成熟多肽具有优选至少60％，更优选至少65％，更优选至少70％，更优选至少75％，更优选至少80％，甚至更优选至少85％，甚至更优选至少90％，最优选至少95％，并且甚至最优选至少96％，97％，98％，或99％同一性程度，其具有内切葡聚糖酶III活性(下文称作“同源多肽”)。在优选的方面，同源多肽包含或组成为以下氨基酸序列，所述氨基酸序列与SEQ ID NO：60的成熟多肽相差十个氨基酸，优选相差五个氨基酸，更优选相差四个氨基酸，甚至更优选相差三个氨基酸，最优选相差两个氨基酸，并且甚至最优选相差一个氨基酸。

具有内切葡聚糖酶III活性的多肽优选包含SEQ ID NO：60的氨基酸序列或其等位变体；或其具有内切葡聚糖酶III活性的片段。在优选的方面，多肽包含SEQ ID NO：60的氨基酸序列。在另一优选的方面，多肽包含SEQ ID NO：60的成熟多肽。在另一优选的方面，多肽包含SEQ ID NO：60的氨基酸17至234，或其等位变体；或其具有内切葡聚糖酶III活性的片段。在另一优选的方面，多肽包含SEQ ID NO：60的氨基酸17至234。在另一优选的方面，多肽由SEQ ID NO：60的氨基酸序列或其等位变体；或其具有内切葡聚糖酶 III活性的片段组成。在另一优选的方面，多肽由SEQ ID NO：60的氨基酸序列组成。在另一优选的方面，多肽由SEQ ID NO：60的成熟多肽组成。在另一优选的方面，多肽由SEQ ID NO：60的氨基酸17至234或其等位变体；或其具有内切葡聚糖酶III活性的片段组成。在另一优选的方面，多肽由SEQ IDNO：60的氨基酸17至234组成。

在另一个第一方面，具有内切葡聚糖酶V活性的分离的多肽包含或组成为以下氨基酸序列，所述氨基酸序列与SEQ ID NO：62(内切葡聚糖酶V；CEL45A)的成熟多肽具有优选至少60％，更优选至少65％，更优选至少70％，更优选至少75％，更优选至少80％，甚至更优选至少85％，甚至更优选至少90％，最优选至少95％，并且甚至最优选至少96％，97％，98％，或99％同一性程度，其具有内切葡聚糖酶V活性(下文称作“同源多肽”)。在优选的方面，同源多肽包含或组成为以下氨基酸序列，所述氨基酸序列与SEQ ID NO：62的成熟多肽相差十个氨基酸，优选相差五个氨基酸，更优选相差四个氨基酸，甚至更优选相差三个氨基酸，最优选相差两个氨基酸，并且甚至最优选相差一个氨基酸。

具有内切葡聚糖酶V活性的多肽优选包含SEQ ID NO：62的氨基酸序列或其等位变体；或其具有内切葡聚糖酶V活性的片段。在优选的方面，多肽包含SEQ ID NO：62的氨基酸序列。在另一优选的方面，多肽包含SEQ ID NO：62的成熟多肽。在另一优选的方面，多肽包含SEQ ID NO：62的氨基酸18至242，或其等位变体；或其具有内切葡聚糖酶V活性的片段。在另一优选的方面，多肽包含SEQ ID NO：62的氨基酸18至242。在另一优选的方面，多肽由SEQ ID NO：62的氨基酸序列或其等位变体；或其具有内切葡聚糖酶V活性的片段组成。在另一优选的方面，多肽由SEQ ID NO：62的氨基酸序列组成。在另一优选的方面，多肽由SEQ ID NO：62的成熟多肽组成。在另一优选的方面，多肽由SEQ ID NO：62的氨基酸18至242或其等位变体；或其具有内切葡聚糖酶V活性的片段组成。在另一优选的方面，多肽由SEQ IDNO：62的氨基酸18至242组成。

在另一个第一方面，具有纤维二糖水解酶II活性的分离的多肽包含或组成为以下氨基酸序列，所述氨基酸序列与SEQ ID NO：64(土生梭孢霉纤维二糖水解酶II；CEL6A)的成熟多肽具有优选至少60％，更优选至少65％，更优选至少70％，更优选至少75％，更优选至少80％，甚至更优选至少85％，甚至更优选至少90％，最优选至少95％，并且甚至最优选至少96％，97％，98％，或99％同一性程度，其具有纤维二糖水解酶II活性(下文称作“同源多肽”)。在优选的方面，同源多肽包含或组成为以下氨基酸序列，所述氨基酸序列与SEQ ID NO：64的成熟多肽相差十个氨基酸，优选相差五个氨基酸，更优选相差四个氨基酸，甚至更优选相差三个氨基酸，最优选相差两个氨基酸，并且甚至最优选相差一个氨基酸。

具有纤维二糖水解酶II活性的多肽优选包含SEQ ID NO：64的氨基酸序列或其等位变体；或其具有纤维二糖水解酶II活性的片段。在优选的方面，多肽包含SEQ ID NO：64的氨基酸序列。在另一优选的方面，多肽包含SEQ IDNO：64的成熟多肽。在另一优选的方面，多肽包含SEQ ID NO：64的氨基酸18至481，或其等位变体；或其具有纤维二糖水解酶II活性的片段。在另一优选的方面，多肽包含SEQ ID NO：64的氨基酸18至481。在另一优选的方面，多肽由SEQ ID NO：64的氨基酸序列或其等位变体；或其具有纤维二糖水解酶II活性的片段组成。在另一优选的方面，多肽由SEQ ID NO：64的氨基酸序列组成。在另一优选的方面，多肽由SEQ ID NO：64的成熟多肽组成。在另一优选的方面，多肽由SEQ ID NO：64的氨基酸18至481或其等位变体；或其具有纤维二糖水解酶II活性的片段组成。在另一优选的方面，多肽由SEQID NO：64的氨基酸18至481组成。

优选地，SEQ ID NO：52的成熟多肽的片段包含至少425个氨基酸残基，更优选地至少450个氨基酸残基，并且最优选至少475个氨基酸残基。优选地，SEQ ID NO：54的成熟多肽的片段包含至少390个氨基酸残基，更优选地至少410个氨基酸残基，并且最优选至少430个氨基酸残基。优选地，SEQ ID NO：56的成熟多肽的片段包含至少370个氨基酸残基，更优选地至少390个氨基酸残基，并且最优选至少410个氨基酸残基。优选地，SEQ ID NO：58的成熟多肽的片段包含至少340个氨基酸残基，更优选地至少360个氨基酸残基，并且最优选至少380个氨基酸残基。优选地，SEQ ID NO：60的成熟多肽的片段包含至少190个氨基酸残基，更优选地至少200个氨基酸残基，并且最优选至少210个氨基酸残基。优选地，SEQ ID NO：62的成熟多肽的片段包含至少190个氨基酸残基，更优选地至少200个氨基酸残基，并且最优选至少210个氨基酸残基。优选地，SEQ ID NO：64的成熟多肽的片段包含至少400个氨基酸残基，更优选地至少420个氨基酸残基，并且最优选至少440个氨基酸残基。

优选地，SEQ ID NO：51的成熟多肽编码序列的亚序列包含至少1275个核苷酸，更优选地至少1350个核苷酸，并且最优选至少1425个核苷酸。优选地，SEQ ID NO：53的成熟多肽编码序列的亚序列包含至少1170个核苷酸，更优选地至少1230个核苷酸，并且最优选至少1290个核苷酸。优选地，SEQ ID NO：55的成熟多肽编码序列的亚序列包含至少1110个核苷酸，更优选地至少1170个核苷酸，并且最优选至少1230个核苷酸。优选地，SEQ ID NO：57的成熟多肽编码序列的亚序列包含至少1020个核苷酸，更优选地至少1080个核苷酸，并且最优选至少1140个核苷酸。优选地，SEQ ID NO：59的成熟多肽编码序列的亚序列包含至少570个核苷酸，更优选地至少600个核苷酸，并且最优选至少630个核苷酸。优选地，SEQ ID NO：61的成熟多肽编码序列的亚序列包含至少570个核苷酸，更优选地至少600个核苷酸，并且最优选至少630个核苷酸。优选地，SEQ ID NO：63的成熟多肽编码序列的亚序列包含至少1200个核苷酸，更优选地至少1260个核苷酸，并且最优选至少1320个核苷酸。

在第二方面，具有纤维二糖水解酶I活性的分离的多肽由包含或组成为以下核苷酸序列的多核苷酸编码，所述核苷酸序列在至少非常低严紧条件下，优选至少低严紧条件下，更优选至少中严紧条件下，更优选至少中-高严紧条件下，甚至更优选至少高严紧条件下，并且最优选至少非常高严紧条件下，与以下杂交：(i)SEQ ID NO：51的成熟多肽编码序列，(ii)包含在SEQ ID NO：51的成熟多肽编码序列中的cDNA序列，或包含SEQ ID NO：51的成熟多肽编码序列的基因组DNA序列，(iii)(i)或(ii)的亚序列，或(iv)(i)、(ii)或(iii)的全长互补链(J.Sambrook，E.F.Fritsch和T.Maniatis，1989，见上文)。SEQ ID NO：51的成熟多肽编码序列的亚序列含有至少100个连续的核苷酸或优选至少200个连续的核苷酸。此外，所述亚序列可编码具有纤维二糖水解酶I活性的多肽片段。

在另一个第二方面，具有纤维二糖水解酶II活性的分离的多肽由包含或组成为以下核苷酸序列的多核苷酸编码，所述核苷酸序列在至少非常低严紧条件下，优选至少低严紧条件下，更优选至少中严紧条件下，更优选至少中-高严紧条件下，甚至更优选至少高严紧条件下，并且最优选至少非常高严紧条件下，与以下杂交：(i)SEQ ID NO：53的成熟多肽编码序列，(ii)包含在SEQID NO：53的成熟多肽编码序列中的cDNA序列，或包含SEQ ID NO：53的成熟多肽编码序列的基因组DNA序列，(iii)(i)或(ii)的亚序列，或(iv)(i)、(ii)或(iii)的全长互补链(J.Sambrook，E.F.Fritsch和T.Maniatis，1989，见上文)。 SEQ ID NO：53的成熟多肽编码序列的亚序列含有至少100个连续的核苷酸或优选至少200个连续的核苷酸。此外，所述亚序列可编码具有纤维二糖水解酶II活性的多肽片段。

在另一个第二方面，具有内切葡聚糖酶I活性的分离的多肽由包含或组成为以下核苷酸序列的多核苷酸编码，所述核苷酸序列在至少非常低严紧条件下，优选至少低严紧条件下，更优选至少中严紧条件下，更优选至少中-高严紧条件下，甚至更优选至少高严紧条件下，并且最优选至少非常高严紧条件下，与以下杂交：(i)SEQ ID NO：55的成熟多肽编码序列，(ii)包含在SEQID NO：55的成熟多肽编码序列中的cDNA序列，或包含SEQ ID NO：55的成熟多肽编码序列的基因组DNA序列，(iii)(i)或(ii)的亚序列，或(iv)(i)、(ii)或(iii)的全长互补链(J.Sambrook，E.F.Fritsch和T.Maniatis，1989，见上文)。SEQ ID NO：55的成熟多肽编码序列的亚序列含有至少100个连续的核苷酸或优选至少200个连续的核苷酸。此外，所述亚序列可编码具有纤维二糖水解酶II活性的多肽片段。

在另一个第二方面，具有内切葡聚糖酶II活性的分离的多肽由包含或组成为以下核苷酸序列的多核苷酸编码，所述核苷酸序列在至少非常低严紧条件下，优选至少低严紧条件下，更优选至少中严紧条件下，更优选至少中-高严紧条件下，甚至更优选至少高严紧条件下，并且最优选至少非常高严紧条件下，与以下杂交：(i)SEQ ID NO：57的成熟多肽编码序列，(ii)包含在SEQID NO：57的成熟多肽编码序列中的cDNA序列，或包含SEQ ID NO：57的成熟多肽编码序列的基因组DNA序列，(iii)(i)或(ii)的亚序列，或(iv)(i)、(ii)或(iii)的全长互补链(J.Sambrook，E.F.Fritsch和T.Maniatis，1989，见上文)。SEQ ID NO：57的成熟多肽编码序列的亚序列含有至少100个连续的核苷酸或优选至少200个连续的核苷酸。此外，所述亚序列可编码具有内切葡聚糖酶II活性的多肽片段。

在另一个第二方面，具有内切葡聚糖酶III活性的分离的多肽由包含或组成为以下核苷酸序列的多核苷酸编码，所述核苷酸序列在至少非常低严紧条件下，优选至少低严紧条件下，更优选至少中严紧条件下，更优选至少中-高严紧条件下，甚至更优选至少高严紧条件下，并且最优选至少非常高严紧条件下，与以下杂交：(i)SEQ ID NO：59的成熟多肽编码序列，(ii)包含在SEQID NO：59的成熟多肽编码序列中的cDNA序列，或包含SEQ ID NO：59的成熟多肽编码序列的基因组DNA序列，(iii)(i)或(ii)的亚序列，或(iv)(i)、(ii)或(iii)的全长互补链(J.Sambrook，E.F.Fritsch和T.Maniatis，1989，见上文)。SEQ ID NO：59的成熟多肽编码序列的亚序列含有至少100个连续的核苷酸或优选至少200个连续的核苷酸。此外，所述亚序列可编码具有内切葡聚糖酶III活性的多肽片段。

在另一个第二方面，具有内切葡聚糖酶V活性的分离的多肽由包含或组成为以下核苷酸序列的多核苷酸编码，所述核苷酸序列在至少非常低严紧条件下，优选至少低严紧条件下，更优选至少中严紧条件下，更优选至少中-高严紧条件下，甚至更优选至少高严紧条件下，并且最优选至少非常高严紧条件下，与以下杂交：(i)SEQ ID NO：61的成熟多肽编码序列，(ii)包含在SEQID NO：61的成熟多肽编码序列中的cDNA序列，或包含SEQ ID NO：61的成熟多肽编码序列的基因组DNA序列，(iii)(i)或(ii)的亚序列，或(iv)(i)、(ii)或(iii)的全长互补链(J.Sambrook，E.F.Fritsch和T.Maniatis，1989，见上文)。SEQ ID NO：61的成熟多肽编码序列的亚序列含有至少100个连续的核苷酸或优选至少200个连续的核苷酸。此外，所述亚序列可编码具有内切葡聚糖酶V活性的多肽片段。

在另一个第二方面，具有纤维二糖水解酶II活性的分离的多肽由包含或组成为以下核苷酸序列的多核苷酸编码，所述核苷酸序列在至少非常低严紧条件下，优选至少低严紧条件下，更优选至少中严紧条件下，更优选至少中-高严紧条件下，甚至更优选至少高严紧条件下，并且最优选至少非常高严紧条件下，与以下杂交：(i)SEQ ID NO：63的成熟多肽编码序列，(ii)包含在SEQID NO：63的成熟多肽编码序列中的cDNA序列，或包含SEQ ID NO：63的成熟多肽编码序列的基因组DNA序列，(iii)(i)或(ii)的亚序列，或(iv)(i)、(ii)或(iii)的全长互补链(J.Sambrook，E.F.Fritsch和T.Maniatis，1989，见上文)。SEQ ID NO：63的成熟多肽编码序列的亚序列含有至少100个连续的核苷酸或优选至少200个连续的核苷酸。此外，所述亚序列可编码具有纤维二糖水解酶II活性的多肽片段。

在优选的方面，所述成熟多肽编码序列是SEQ ID NO：51的核苷酸52至1542、SEQ ID NO：53的核苷酸73至1413、SEQ ID NO：55的核苷酸67至1377、SEQ ID NO：57的核苷酸64至1254、SEQ ID NO：59的核苷酸49至702、SEQID NO：61的核苷酸52至726，或SEQ ID NO：63的核苷酸52至1443。

SEQ ID NO：51、SEQ ID NO：53、SEQ ID NO：55、SEQ ID NO：57、SEQID NO：59、SEQ ID NO：61，或SEQ ID NO：63的核苷酸序列或其亚序列，以及SEQ ID NO：52、SEQ ID NO：54、SEQ ID NO：56、SEQ ID NO：58，或SEQID NO：60、SEQ ID NO：62，或SEQ ID NO：64的氨基酸序列或其片段，可用于设计核酸探针，以从不同属和种的菌株鉴定和克隆编码具有纤维二糖水解酶或内切葡聚糖酶活性的多肽的DNA，如上所述。

就本发明而言，杂交表示核苷酸序列在非常低至非常高的严紧条件下与标记的核酸探针杂交，所述核酸探针对应于SEQ ID NO：51、SEQ ID NO：53、SEQ ID NO：55、SEQ ID NO：57、SEQ ID NO：59、SEQ ID NO：61，或SEQ IDNO：63的成熟多肽编码序列，包含在SEQ ID NO：51、SEQ ID NO：53、SEQ IDNO：55、SEQ ID NO：57、SEQ ID NO：59、SEQ ID NO：61，或SEQ ID NO：63的成熟多肽编码序列中的cDNA序列，或包含SEQ ID NO：51、SEQ ID NO：53、SEQ ID NO：55、SEQ ID NO：57、SEQ ID NO：59、SEQ ID NO：61，或SEQ ID NO：63的成熟多肽编码序列的基因组DNA序列，它的全长互补链，或它们的亚序列，如上文所述。

在优选的方面，核酸探针是SEQ ID NO：51的成熟多肽编码序列。在另一优选的方面，核酸探针是SEQ ID NO：51的核苷酸52至1542。在另一优选的方面，核酸探针是编码SEQ ID NO：52的多肽的多核苷酸序列，或其亚序列。在另一优选方面，核酸探针是SEQ ID NO：51。

在另一优选的方面，核酸探针是SEQ ID NO：53的成熟多肽编码序列。在另一优选的方面，核酸探针是SEQ ID NO：53的核苷酸73至1413。在另一优选的方面，核酸探针是编码SEQ ID NO：54的多肽的多核苷酸序列，或其亚序列。在另一优选方面，核酸探针是SEQ ID NO：53。

在另一优选的方面，核酸探针是SEQ ID NO：55的成熟多肽编码序列。在另一优选的方面，核酸探针是SEQ ID NO：55的核苷酸67至1377。在另一优选的方面，核酸探针是编码SEQ ID NO：56的多肽的多核苷酸序列，或其亚序列。在另一优选方面，核酸探针是SEQ ID NO：55。

在另一优选的方面，核酸探针是SEQ ID NO：57的成熟多肽编码序列。在另一优选的方面，核酸探针是SEQ ID NO：57的核苷酸64至1254。在另一优选的方面，核酸探针是编码SEQ ID NO：58的多肽的多核苷酸序列，或其亚序列。在另一优选方面，核酸探针是SEQ ID NO：57。

在另一优选的方面，核酸探针是SEQ ID NO：59的成熟多肽编码序列。在另一优选的方面，核酸探针是SEQ ID NO：59的核苷酸49至702。在另一优选的方面，核酸探针是编码SEQ ID NO：60的多肽的多核苷酸序列，或其亚序列。在另一优选方面，核酸探针是SEQ ID NO：59。

在另一优选的方面，核酸探针是SEQ ID NO：61的成熟多肽编码序列。在另一优选的方面，核酸探针是SEQ ID NO：61的核苷酸52至726。在另一优选的方面，核酸探针是编码SEQ ID NO：62的多肽的多核苷酸序列，或其亚序列。在另一优选方面，核酸探针是SEQ ID NO：61。

在另一优选的方面，核酸探针是SEQ ID NO：63的成熟多肽编码序列。在另一优选的方面，核酸探针是SEQ ID NO：63的核苷酸52至1443。在另一优选的方面，核酸探针是编码SEQ ID NO：64的多肽的多核苷酸序列，或其亚序列。在另一优选方面，核酸探针是SEQ ID NO：63。在另一优选的方面，核酸探针是质粒pTter6A中包含的多核苷酸序列，所述质粒包含在大肠杆菌NRRL B-30802中，其中它的多核苷酸序列编码具有纤维二糖水解酶活性的多肽。在另一优选的方面，核酸探针是质粒pTter6A中包含的成熟多肽编码区，所述质粒包含在大肠杆菌NRRL B-30802中。

对于长度至少100个核苷酸的长探针，非常低至非常高的严紧条件如本文所定义。

在第三方面，具有纤维二糖水解酶或内切葡聚糖酶活性的分离的多肽由包含或组成为以下核苷酸序列的多核苷酸编码，所述核苷酸序列与SEQ IDNO：51、SEQ ID NO：53、SEQ ID NO：55、SEQ ID NO：57，或SEQ ID NO：59，SEQ ID NO：61，或SEQ ID NO：63的成熟多肽编码序列具有优选至少60％，更优选至少65％，更优选至少70％，更优选至少75％，更优选至少80％，更优选至少85％，甚至更优选至少90％，最优选至少95％，并且甚至最优选至少96％，97％，98％，或99％的同一性程度，其编码活性多肽。

在优选的方面，所述成熟多肽编码序列是SEQ ID NO：51的核苷酸52至1542，SEQ ID NO：53的核苷酸73至1413，SEQ ID NO：55的核苷酸67至1377，SEQ ID NO：57的核苷酸64至1254，SEQ ID NO：59的核苷酸49至702，SEQ ID NO：61的核苷酸52至726，或SEQ ID NO：63的核苷酸52至1443。参见本文中的多核苷酸部分。

在第六方面，具有纤维二糖水解酶或内切葡聚糖酶活性的分离的多肽是人工变体，所述人工变体在SEQ ID NO：52、SEQ ID NO：54、SEQ ID NO：56、SEQ ID NO：58、SEQ ID NO：60、SEQ ID NO：62，或SEQ ID NO：64的成熟多肽或其同源序列中包含取代、缺失和/或插入一个或多个(或几个)氨基酸。制备这样的人工变体的方法如上文所述。

SEQ ID NO：52、SEQ ID NO：54、SEQ ID NO：56、SEQ ID NO：58、SEQID NO：60、SEQ ID NO：62，或SEQ ID NO：64的成熟多肽中氨基酸取代、缺失和/或插入的总数是10，优选9，更优选8，更优选7，更优选至多6，更优选5，更优选4，甚至更优选3，最优选2，并且甚至最优选1。

具有纤维二糖水解酶或内切葡聚糖酶活性的多肽可以获得自任何属的微生物。就本发明而言，如本文所定义的使用术语“获得自”。在优选的方面，获得自给定来源的多肽是胞外分泌的。

具有纤维二糖水解酶或内切葡聚糖酶活性的多肽可以是细菌多肽。例如，多肽可以是具有纤维二糖水解酶或内切葡聚糖酶活性的革兰氏阳性细菌多肽，如芽孢杆菌属、链球菌属、链霉菌属、葡萄球菌属、肠球菌属、乳杆菌属、乳球菌属、梭菌属、地芽孢杆菌属，或海洋芽孢杆菌属多肽，或者具有纤维二糖水解酶或内切葡聚糖酶活性的革兰氏阴性细菌多肽，如大肠杆菌、假单胞菌属、沙门氏菌属、弯曲杆菌属、螺杆菌属、黄杆菌属、梭杆菌属、泥杆菌属、奈瑟氏菌属或脲原体属多肽。

在优选的方面，多肽是具有纤维二糖水解酶或内切葡聚糖酶活性的嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌，或苏云金芽孢杆菌多肽。

在另一个优选的方面，多肽是具有纤维二糖水解酶或内切葡聚糖酶活性的似马链球菌、酿脓链球菌、乳房链球菌，或马链球菌兽疫亚种多肽。

在另一个优选的方面，多肽是具有纤维二糖水解酶或内切葡聚糖酶活性的不产色链霉菌、除虫链霉菌、天蓝色链霉菌、灰色链霉菌，或浅青紫链霉菌多肽。

具有纤维二糖水解酶或内切葡聚糖酶活性的多肽还可以是具有纤维二糖水解酶或内切葡聚糖酶活性的真菌多肽，并且更优选是酵母多肽，如念珠菌属、克鲁维酵母属、毕赤酵母属、酵母属、裂殖酵母属或西洋蓍霉属多肽；或者更优选是具有纤维二糖水解酶或内切葡聚糖酶活性的丝状真菌多肽，如枝顶孢霉属、曲霉属、短梗霉属、隐球菌属、Filibasidium、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新考玛脂霉属、脉孢菌属、拟青霉属、青霉属、瘤胃壶菌属、裂褶菌属、踝节菌属、嗜热霉属、梭孢壳属、弯颈霉属、木霉属多肽。

在优选的方面，多肽是具有纤维二糖水解酶或内切葡聚糖酶活性的卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母或卵形酵母多肽。

在另一个优选的方面，多肽是具有纤维二糖水解酶或内切葡聚糖酶活性的棘孢曲霉、泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、灰盖鬼伞(Coprinus cinereus)、Diplodia gossyppina、杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、特异腐质霉、疏棉状腐质霉、灰梨孢菌、米赫毛霉、嗜热毁丝霉、粗糙脉孢菌、产紫青霉、黄孢平革菌、Pseudoplectania nigrella、桔橙嗜热霉、土生梭孢霉、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、绿色木霉或Trichophaea saccata多肽。

在更优选的方面，多肽是具有纤维二糖水解酶或内切葡聚糖酶活性的里氏木霉多肽。在另一最优选的实施方案中，多肽是具有纤维二糖水解酶或内切葡聚糖酶活性的里氏木霉RutC30(ATCC 56765)多肽，例如，SEQ ID NO：52或54的成熟多肽，或其具有纤维二糖水解酶活性的片段，和SEQ ID NO：56、58、60或62的成熟多肽，或其具有内切葡聚糖酶活性的片段

在另一更优选的方面，多肽是具有纤维二糖水解酶活性的土生梭孢霉多肽。在另一最优选的方面，多肽是具有纤维二糖水解酶II活性的土生梭孢霉(NRRL 8126)多肽，例如，SEQ ID NO：64的成熟多肽，或其具有纤维二糖水解酶活性的片段。

具有纤维二糖水解酶或内切葡聚糖酶活性的多肽还包括融合多肽或可切割的融合多肽，其中将另一种多肽融合到具有纤维二糖水解酶或内切葡聚糖酶活性的多肽或其片段的N末端或C末端。如本文所述产生融合多肽。

可以分离包含或组成为核苷酸序列(其编码具有纤维二糖水解酶或内切葡聚糖酶活性的多肽)的多核苷酸并将其用于实施本发明的方法，如本文所述。

多核苷酸包含或组成为以下核苷酸序列，所述核苷酸序列与SEQ ID NO：51、SEQ ID NO：53、SEQ ID NO：55、SEQ ID NO：57、SEQ ID NO：59、SEQID NO：61，或SEQ ID NO：63的成熟多肽编码序列具有优选至少60％，更优选至少65％，更优选至少70％，更优选至少75％，更优选至少80％，更优选至少85％，甚至更优选至少90％，最优选至少95％，并且甚至最优选至少96％，97％，98％或99％的同一性程度，其编码具有纤维二糖水解酶或内切葡聚糖酶活性的多肽。

在优选的方面，核苷酸序列包含或组成为SEQ ID NO：51。在另一优选的方面，核苷酸序列包含或组成为SEQ ID NO：51的成熟多肽编码区。本发明还包括编码多肽的核苷酸序列，所述多肽包含或组成为SEQ ID NO：52的氨基酸序列或其成熟多肽，所述核苷酸序列由于遗传密码的简并性而不同于SEQ ID NO：51。本发明还涉及SEQ ID NO：51的亚序列，其编码SEQ ID NO：52的具有纤维二糖水解酶I活性的片段。

在另一优选的方面，核苷酸序列包含或组成为SEQ ID NO：53。在另一优选的方面，核苷酸序列包含或组成为SEQ ID NO：53的成熟多肽编码区。本发明还包括编码多肽的核苷酸序列，所述多肽包含或组成为SEQ ID NO：54的氨基酸序列或其成熟多肽，所述核苷酸序列由于遗传密码的简并性而不同于SEQ ID NO：53。本发明还涉及SEQ ID NO：53的亚序列，其编码SEQ IDNO：54的具有纤维二糖水解酶II活性的片段。

在另一优选的方面，核苷酸序列包含或组成为SEQ ID NO：55。在另一优选的方面，核苷酸序列包含或组成为SEQ ID NO：55的成熟多肽编码区。本发明还包括编码多肽的核苷酸序列，所述多肽包含或组成为SEQ ID NO：56的氨基酸序列或其成熟多肽，所述核苷酸序列由于遗传密码的简并性而不同于SEQ ID NO：55。本发明还涉及SEQ ID NO：55的亚序列，其编码SEQ IDNO：56的具有内切葡聚糖酶I活性的片段。

在另一优选的方面，核苷酸序列包含或组成为SEQ ID NO：57。在另一优选的方面，核苷酸序列包含或组成为SEQ ID NO：57的成熟多肽编码区。本发明还包括编码多肽的核苷酸序列，所述多肽包含或组成为SEQ ID NO：58的氨基酸序列或其成熟多肽，所述核苷酸序列由于遗传密码的简并性而不同于SEQ ID NO：57。本发明还涉及SEQ ID NO：57的亚序列，其编码SEQ IDNO：58的具有内切葡聚糖酶II活性的片段。

在另一优选的方面，核苷酸序列包含或组成为SEQ ID NO：59。在另一优选的方面，核苷酸序列包含或组成为SEQ ID NO：59的成熟多肽编码区。本发明还包括编码多肽的核苷酸序列，所述多肽包含或组成为SEQ ID NO：60的氨基酸序列或其成熟多肽，所述核苷酸序列由于遗传密码的简并性而不同于SEQ ID NO：59。本发明还涉及SEQ ID NO：59的亚序列，其编码SEQ IDNO：60的具有内切葡聚糖酶III活性的片段。

在另一优选的方面，核苷酸序列包含或组成为SEQ ID NO：61。在另一优选的方面，核苷酸序列包含或组成为SEQ ID NO：61的成熟多肽编码区。本发明还包括编码多肽的核苷酸序列，所述多肽包含或组成为SEQ ID NO：62的氨基酸序列或其成熟多肽，所述核苷酸序列由于遗传密码的简并性而不同于SEQ ID NO：61。本发明还涉及SEQ ID NO：61的亚序列，其编码SEQ IDNO：62的具有内切葡聚糖酶V活性的片段。

在另一优选的方面，核苷酸序列包含或组成为SEQ ID NO：63。在另一更优选的方面，核苷酸序列包含或组成为质粒pTter6A所包含的序列，所述质粒包含在大肠杆菌NRRL B-30802中。在另一优选的方面，核苷酸序列包含或组成为SEQ ID NO：63的成熟多肽编码序列。在另一优选的方面，核苷酸序列包含或组成为SEQ ID NO：63的核苷酸52至1443。在另一更优选的方面，核苷酸序列包含或组成为质粒pTter6A所包含的成熟多肽编码区，所述质粒包含在大肠杆菌NRRL B-30802中。本发明还包括编码多肽的核苷酸序列，所述多肽包含或组成为SEQ ID NO：64的氨基酸序列或其成熟多肽，所述核苷酸序列由于遗传密码的简并性而不同于SEQ ID NO：63或其成熟多肽编码序列。本发明还涉及SEQ ID NO：63的亚序列，其编码SEQ ID NO：64的具有纤维二糖水解酶II活性的片段。

本发明还涉及在SEQ ID NO：51、SEQ ID NO：53、SEQ ID NO：55、SEQID NO：57、SEQ ID NO：59、SEQ ID NO：61，或SEQ ID NO：63的成熟多肽编码序列中包含至少一个突变的突变多核苷酸，其中所述突变核苷酸序列编码SEQ ID NO：52、SEQ ID NO：54、SEQ ID NO：56、SEQ ID NO：58，或SEQID NO：60、SEQ ID NO：62，或SEQ ID NO：64的成熟多肽。在优选的方面，所述成熟多肽是SEQ ID NO：52的氨基酸18至541，SEQ ID NO：54的氨基酸25至471，SEQ ID NO：56的氨基酸23至459，SEQ ID NO：58的氨基酸22至418，SEQ ID NO：60的氨基酸17至234，SEQ ID NO：62的氨基酸18至242，或SEQ ID NO：64的氨基酸18至481。在另一优选的方面，所述成熟多肽编码序列是SEQ ID NO：51的核苷酸52至1542、SEQ ID NO：53的核苷酸73至1413、SEQ ID NO：55的核苷酸67至1377、SEQ ID NO：57的核苷酸64至1254、SEQ ID NO：59的核苷酸49至702、SEQ ID NO：61的核苷酸52至726，或SEQ ID NO：63的核苷酸52至1443。

如前所述，用于分离或克隆编码多肽的多核苷酸的技术是本领域内已知的，包括从基因组DNA分离，从cDNA制备，或其组合。

多肽还可以包含多核苷酸，所述多核苷酸包含或组成为以下核苷酸序列，所述核苷酸序列编码具有纤维二糖水解酶或内切葡聚糖酶活性的多肽，所述多肽在至少非常低严紧条件下，优选至少低严紧条件，更优选至少中等严紧条件，更优选至少中-高严紧条件，甚至更优选至少高严紧条件，并且最优选至少非常高的严紧条件下，与以下杂交：(i)SEQ ID NO：51、SEQ ID NO：53、SEQ IDNO：55、SEQ ID NO：57、SEQ ID NO：59、SEQ ID NO：61，或SEQ ID NO：63 的成熟多肽编码序列，(ii)包含在SEQ ID NO：51、SEQ ID NO：53、SEQ ID NO：55、SEQ ID NO：57、SEQ ID NO：59、SEQ ID NO：61，或SEQ ID NO：63的成熟多肽编码序列中的cDNA序列或包含SEQ ID NO：51、SEQ ID NO：53、SEQID NO：55、SEQ ID NO：57、SEQ ID NO：59、SEQ ID NO：61，或SEQ ID NO：63的成熟多肽编码序列的基因组DNA序列，或(iii)(i)或(ii)的全长互补链；或它们的等位变体和亚序列(Sambrook等，1989，见上文)，如本文所定义的。在优选的方面，所述成熟多肽编码序列是SEQ ID NO：51的核苷酸52至1542，SEQ ID NO：53的核苷酸73至1413，SEQ ID NO：55的核苷酸67至1377，SEQID NO：57的核苷酸64至1254，SEQ ID NO：59的核苷酸49至702，SEQ ID NO：61的核苷酸52至726，或SEQ ID NO：63的核苷酸52至1443。

核酸构建体

分离的多核苷酸，其编码具有增强纤维素分解的活性的多肽、具有β-葡糖苷酶活性的多肽，β-葡糖苷酶融合多肽，具有内切葡聚糖酶活性的多肽，具有纤维二糖水解酶活性的多肽，或具有其它纤维素分解酶活性的多肽，可以用许多方式操作所述分离的多核苷酸，从而通过构建核酸构建体来提供所述多肽的表达，所述核酸构建体包含编码多肽的分离的多核苷酸，其与一个或多个(几个)调控序列可操作地连接，所述调控序列在合适的宿主细胞中在与该调控序列相容的条件下指导编码序列的表达。依赖于表达载体，在将多核苷酸的序列插入载体之前对其进行操作可能是理想的或必需的。使用重组DNA方法修饰多核苷酸序列的技术是本领域熟知的。

调控序列可以是合适的启动子序列，其是由宿主细胞识别用于表达编码这种多肽的多核苷酸的核苷酸序列。启动子序列含有介导所述多肽表达的转录调控序列。启动子可以是在所选的宿主细胞中显示转录活性的任何核苷酸序列，包括突变的、截短的和杂合的启动子，并且可以从编码与宿主细胞同源或异源的胞外或胞内多肽的基因获得。

用于指导本发明的核酸构建体在丝状真菌宿主细胞中转录的合适启动子的实例是从编码下述酶的基因获得的启动子：米曲霉TAKA淀粉酶、曼赫根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、曼赫根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、构巢曲霉乙酰胺酶、镶片镰孢淀粉葡糖苷酶(WO 00/56900)、镶片镰孢Daria(WO 00/56900)、镶片镰孢Quinn(WO 00/56900)、尖镰孢胰蛋白酶样蛋白酶(WO 96/00787)、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶IV、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉β-木糖苷酶，以及NA2-tpi启动子(来自黑曲霉中性α-淀粉酶和米曲霉丙糖磷酸异构酶基因的启动子的杂合体)；和它们的突变、截短和杂合的启动子。

调控序列也可以是合适的转录终止子序列，其是由宿主细胞识别以终止转录的序列。所述终止子序列与编码所述多肽的核苷酸序列的3’末端可操作地连接。可以将在所选宿主细胞中有功能的任何终止子用在本发明中。

对于丝状真菌宿主细胞优选的终止子获得自下述基因：米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉α-葡糖苷酶和尖镰孢胰蛋白酶样蛋白酶。

调控序列还可以是合适的前导序列，其是对于宿主细胞的翻译重要的mRNA非翻译区。前导序列可操作地连接于编码多肽的核苷酸序列的5’-末端。可以将在所选宿主细胞中有功能的任何前导序列用在本发明中。

对于丝状真菌宿主细胞优选的前导序列从米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶的基因获得。

调控序列也可以是聚腺苷酸化序列，其是与核苷酸序列的3’末端可操作地连接的序列，并且在转录时，宿主细胞将其识别为将聚腺苷残基添加至转录的mRNA的信号。可以将在所选宿主细胞中有功能的任何聚腺苷酸化序列在本发明中使用。

对于丝状真菌宿主细胞优选的聚腺苷酸化序列获得自下述的基因：米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖镰孢胰蛋白酶样蛋白酶和黑曲霉α-葡糖苷酶。

调控序列还可以是信号肽编码区，其编码与多肽的氨基末端相连的氨基酸序列，并且指导编码的多肽进入细胞的分泌途径。核苷酸序列的编码序列5’端可固有地包含信号肽编码区，其与编码分泌多肽的编码区片段一起天然地连接在翻译阅读框中。可供选择的是，编码序列5’端可含有对于所述编码序列是外源的信号肽编码区。外源信号肽编码区在编码序列不天然地含有信号肽编码区时可能是必需的。或者，外源信号肽编码区可以简单地取代天然信号肽编码区以增强多肽的分泌。然而，指导表达的多肽进入所选宿主细胞的分泌途径(即，分泌至培养基中)的任何信号肽编码区可在本发明中使用。

对于丝状真菌宿主细胞有效的信号肽编码区是从如下的基因获得的信号肽编码区：米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、曼赫根毛霉天冬氨酸蛋白酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶V和疏棉状腐质霉脂肪酶。

在优选的方面，信号肽包含SEQ ID NO：2的氨基酸1至19，或由SEQ IDNO：2的氨基酸1至19组成。在另一个优选的方面，信号肽编码区包含SEQID NO：1的核苷酸330至387或由SEQ ID NO：1的核苷酸330至387组成。

在另一优选的方面，信号肽包含SEQ ID NO：4的氨基酸1至17或由SEQID NO：4的氨基酸1至17组成。在另一个优选的方面，信号肽编码区包含SEQ ID NO：3的核苷酸47至97或由SEQ ID NO：3的核苷酸47至97组成。

在另一优选的方面，信号肽包含SEQ ID NO：6的氨基酸1至19或由SEQID NO：6的氨基酸1至19组成。在另一个优选的方面，信号肽编码区包含SEQ ID NO：5的核苷酸69至125或由SEQ ID NO：5的核苷酸69至125组成。

在另一优选的方面，信号肽包含SEQ ID NO：8的氨基酸1至18或由SEQID NO：8的氨基酸1至18组成。在另一个优选的方面，信号肽编码区包含SEQ ID NO：7的核苷酸1至54或由SEQ ID NO：7的核苷酸1至54组成。

在另一优选的方面，信号肽包含SEQ ID NO：10的氨基酸1至19或由SEQID NO：10的氨基酸1至19组成。在另一个优选的方面，信号肽编码区包含SEQ ID NO：9的核苷酸1至57或由SEQ ID NO：9的核苷酸1至57组成。

在另一优选的方面，信号肽包含SEQ ID NO：12的氨基酸1至22或由SEQID NO：12的氨基酸1至22组成。在另一个优选的方面，信号肽编码区包含SEQ ID NO：11的核苷酸1至66或由SEQ ID NO：11的核苷酸1至66组成。

在另一优选的方面，信号肽包含SEQ ID NO：14的氨基酸1至19或由SEQID NO：14的氨基酸1至19组成。在另一个优选的方面，信号肽编码区包含SEQ ID NO：13的核苷酸20至76或由SEQ ID NO：13的核苷酸20至76组成。

调控序列还可以是前肽编码区，其编码位于多肽氨基末端的氨基酸序列。所得多肽称为酶原(proenzyme)或前多肽(propolypeptide)(或在某些情况下称为酶原(zymogen))。前多肽通常是无活性的并且能够通过前肽的催化或自催化切割从前多肽转化为成熟活性多肽。前肽编码区可以从酿酒酵母α因子、曼赫根毛霉天冬氨酸蛋白酶和嗜热毁丝霉漆酶(WO 95/33836)的基因获得。

当信号肽和前肽区二者均出现在多肽的氨基末端时，将前肽区置于紧接着(next to)多肽氨基末端，并且将信号肽区置于紧接着前肽区的氨基末端。

同样理想的是添加调节序列，其允许相对于宿主细胞的生长来调节多肽的表达。调节系统的实例是引起基因表达响应化学或物理刺激物，包括调节化合物的存在而开启或关闭的那些系统。在丝状真菌中，可以使用TAKAα-淀粉酶启动子、黑曲霉葡糖淀粉酶启动子和米曲霉葡糖淀粉酶启动子作为调节序列。调节序列的其它实例是那些允许基因扩增的序列。在真核系统中，这些序列包括在氨甲蝶呤(methotrexate)存在下扩增的二氢叶酸还原酶基因，和以重金属(with heavy metal)扩增的金属硫蛋白基因。在这些情况下，编码多肽的核苷酸序列将与调节序列可操作地连接。

表达载体

可以将本文描述的多种核酸和调控序列结合在一起以产生重组表达载体，其包含编码具有增强纤维素分解的活性的多肽、具有β-葡糖苷酶活性的多肽、β-葡糖苷酶融合多肽、具有内切葡聚糖酶活性的多肽、具有纤维二糖水解酶活性的多肽，或具有其它纤维素分解酶活性的多肽的多核苷酸，启动子，和转录和翻译的终止信号。所述表达载体可以包括一个或多个(几个)方便的限制位点以允许在这些位点插入或取代编码所述多肽的核苷酸序列。可供选择的是，可以通过将所述核苷酸序列或包含该序列的核酸构建体插入用于表达的适当载体中从而表达编码这样的多肽的多核苷酸。在制备表达载体的过程中，将编码序列置于载体中，从而将该编码序列与适当的用于表达的调控序列可操作地连接。

重组表达载体可以是任何载体(例如，质粒或病毒)，其能够方便地进行重组DNA步骤，并且能够产生核苷酸序列的表达。载体的选择将通常依赖于载体与将导入该载体的宿主细胞的相容性。载体可以是线状或闭合环状质粒。

载体可以是自主复制载体，即，作为染色体外实体(entity)存在的载体，其复制独立于染色体复制，例如，质粒、染色体外元件、微型染色体(minichromosome)或人工染色体。载体可以含有用于确保自复制的任何手段(means)。或者，载体可以是一种当被导入宿主细胞中时，整合到基因组中并且与整合了该载体的染色体一起复制的载体。此外，可以使用单独的载体或质粒或两个或更多的载体或质粒，其共同含有待导入宿主细胞基因组的完整DNA(total DNA)，或可以使用转座子(transposon)。

所述载体优选地含有一个或多个(几个)选择性标记，其允许简单选择经转化、转染、转导等的细胞。选择性标记是基因，其产物提供杀生物剂或病毒抗性、对重金属的抗性、对营养缺陷型的原养性(prototrophy to auxotrophs)等。

用于丝状真菌宿主细胞的选择性标记包括但不限于amdS(乙酰胺酶)，argB(鸟氨酸氨甲酰基转移酶)、bar(草铵膦(phosphinothricin)乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)(nitrate reductase)、pyrG(乳清酸核苷-5’-磷酸脱羧酶)(orotidine-5’-phosphate decarboxylase)、sC(硫酸腺苷酰转移酶)和trpC(邻氨基苯甲酸合酶(anthranilate synthase))以及它们的等价物。优选用在曲霉属细胞中的是构巢曲霉或米曲霉的amdS和pyrG基因和吸水链霉菌(Streptomyces hygroscopicus)的bar基因。

所述载体优选含有元件，其允许载体整合入宿主细胞基因组或载体在细胞中独立于基因组的自主复制。

为了整合入宿主细胞基因组，载体可依赖编码多肽的多核苷酸的序列或用于通过同源或非同源重组整合入基因组的任何其它载体元件。或者，载体可以含有额外的核苷酸序列，用于指导通过同源重组整合入宿主细胞基因组染色体中的精确位置。为了增加在精确位置整合的可能性，整合元件应该优选含有足够数目的核酸，如100至10,000碱基对，优选400至10,000碱基对，并且最优选800至10,000碱基对，其与相应的靶序列具有高同一性程度以增强同源重组的概率。整合元件可以是与宿主细胞基因组中的靶序列同源的任何序列。此外，整合元件可以是非编码或编码的核苷酸序列。另一方面，可以通过非同源重组将载体整合到宿主细胞基因组中。

为了自主复制，载体可以进一步包含复制起点，其使载体能够在所述的宿主细胞中自主地复制。复制起点可以是介导自主复制的任何质粒复制子(replicator)，其在细胞中发挥功能。术语“复制起点”或“质粒复制子”在本文定义为能够使质粒或载体在体内复制的核苷酸序列。

在丝状真菌细胞中有用的复制起点的实例是AMA1和ANS1(Gems等，1991，Gene 98：61-67；Cullen等，1987，Nucleic Acids Research 15：9163-9175；WO 00/24883)。分离AMA1基因和构建包含该基因的质粒或载体能够根据公开于WO 00/24883中的方法完成。

可以将多于一个拷贝的编码这样的多肽的多核苷酸插入宿主细胞以增加该多肽的产生。多核苷酸拷贝数的增加可通过如下获得：将至少一个额外拷贝的序列整合入宿主细胞基因组，或使所述多核苷酸包括可扩增选择性标记基因，其中可通过在合适的选择剂(selectable agent)存在下培养细胞来选择含有选择性标记基因的扩增拷贝并且由此含有多核苷酸的额外拷贝的细胞。

用于连接上述元件以构建所述重组表达载体的方法是本领域技术人员熟知的(参见，例如，Sambrook等，1989，见上文)。

宿主细胞

重组丝状真菌宿主细胞，其包含多核苷酸，所述多核苷酸编码具有增强纤维素分解的活性的多肽，具有β-葡糖苷酶活性的多肽，β-葡糖苷酶融合多肽，具有内切葡聚糖酶活性的多肽，具有纤维二糖水解酶活性，或具有其它纤维素分解酶活性的多肽，可将所述重组宿主细胞有利地用于所述多肽的重组产生。将包含这种多核苷酸的载体导入宿主细胞，从而保留该载体作为染色体整合体(chromosomal integrant)或作为自复制的染色体外载体，如前所述。术语“宿主细胞”包含亲本细胞的任何子代，其由于复制过程中发生的突变而与亲本细胞不同。宿主细胞的选择将很大程度依赖于编码多肽的基因和它的来源。

“丝状真菌”包括真菌门(Eumycota)和卵菌门(Oomycota)的亚门(如Hawksworth等，1995，见上文所定义)的所有丝状形式。丝状真菌通常的特征在于由壳多糖(chitin)、纤维素、葡聚糖、壳聚糖(chitosan)、甘露聚糖和其它复杂多糖组成的菌丝体壁。通过菌丝延伸进行营养生长，而碳分解代谢是专性需氧的。相反，酵母如酿酒酵母的营养生长通过单细胞菌体的出芽生殖(budding)进行，而碳分解代谢可以是发酵的。

在优选的方面，丝状真菌宿主细胞是枝顶孢霉属、曲霉属、短梗霉属、烟管霉属(Bjerkandera)、拟蜡菌属、金孢子菌属、鬼伞属(Coprinus)、革盖菌属(Coriolus)、隐球菌属、Filibasidium、镰孢属、腐质霉、梨孢菌属、毛霉属、毁丝霉属、新考玛脂霉属、脉孢菌属、拟青霉属、青霉属、平革菌属、射脉菌属(Phlebia)、瘤胃壶菌属、侧耳属(Pleurotus)、裂褶菌属、踝节菌属、嗜热霉属、梭孢壳属、弯颈霉属、栓菌属(Trametes)，或木霉属(Trichoderma)细胞。

在更优选的方面，丝状真菌宿主细胞是泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉或米曲霉，Bjerkandera adusta，干拟蜡菌(Ceriporiopsis aneirina)、干拟蜡菌、Ceriporiopsis caregiea、浅黄拟蜡菌(Ceriporiopsis gilvescens)、Ceriporiopsis pannocinta、Ceriporiopsis rivulosa、Ceriporiopsis subrufa、虫拟蜡菌(Ceriporiopsis subvermispora)、Chrysosporiumlucknowense、灰盖鬼伞、毛革盖菌(Coriolus hirsutus)、杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、特异腐质霉、疏棉状腐质霉、米赫毛霉、嗜热毁丝霉、粗糙脉孢菌、产紫青霉、黄孢平革菌、辐射射脉菌(Phlebiaradiata)、刺芹侧耳(Pleurotus eryngii)、土生梭孢霉、长绒毛栓菌(Trametesvillosa)、杂色栓菌(Trametes versicolor)、哈茨木霉、康宁木霉、长枝木霉、里氏木霉或绿色木霉细胞。

在最优选的方面，丝状真菌宿主细胞是米曲霉。在另一最优选的方面，丝状真菌宿主细胞是里氏木霉细胞。在另一最优选的方面，丝状真菌宿主细胞是镶片镰孢细胞。在另一最优选的方面，丝状真菌宿主细胞是Chrysosporium lucknowense细胞。

可以将真菌细胞通过涉及原生质体形成、原生质体转化和细胞壁重建的方法以本身公知的方式转化。用于转化曲霉属和木霉属宿主细胞的合适方法在EP 238 023和Yelton等，1984，Proceedings of the National Academy ofSciences USA 81：1470-1474中描述。用于转化镰孢属菌种的合适方法由Malardier等，1989，Gene 78：147-156和WO 96/00787描述。可以使用由如下文献描述的方法转化酵母：Becker和Guarente，于Abelson，J.N.和Simon，M.I.编，Guide to Yeast Genetics and Molecular Biology，Methods in Enzymology，Volume 194，pp 182-187，Academic Press，Inc.，New York；Ito等，1983，Journalof Bacteriology 153：163；和Hinnen等，1978，Proceedings of the NationalAcademy of Sciences USA 75：1920。

产生方法

用于产生本发明的纤维素分解蛋白质组合物的方法，包括(a)在有益于产生所述多肽的条件下培养丝状真菌细胞，所述细胞以其野生型形式能产生所述多肽的；和(b)回收所述多肽。

或者，用于产生本发明的纤维素分解蛋白质组合物的方法，包括(a)在有益于产生所述多肽的条件下培养重组丝状真菌宿主细胞；和(b)回收所述多肽。

在所述产生方法中，使用本领域熟知的方法在适合于产生所述多肽的营养培养基中培养丝状真菌细胞。例如，可以通过在合适培养基中和允许表达和/或分离所述多肽的条件下进行的摇瓶培养，和实验室或工业发酵罐中的小规模或大规模发酵(包括连续、分批、补料分批或固态发酵)来培养细胞。使用本领域已知的方法在合适的营养培养基中进行培养，所述营养培养基包含碳源和氮源和无机盐。合适的培养基能够从商业供应商获得或可以根据公布的组成制备(例如，在美国典型培养物保藏中心的目录中)。如果蛋白质组分分泌到营养培养基中，则能够从所述培养基中直接回收该蛋白质组分。如果蛋白质组分不分泌到培养基中，其能够从细胞裂解物(lysate)回收。

可以使用本文所述或本领域已知的方法来检测所述组合物中的蛋白质组分。

可以使用本领域已知的方法回收所得纤维素分解蛋白质组合物。例如，可以通过常规方法从营养培养基中回收纤维素分解蛋白质组合物，所述常规方法包括但不限于离心、过滤、提取、喷雾干燥、蒸发或沉淀。

可以通过多种本领域已知的方法纯化组合物的蛋白质组分，所述方法包括但不限于层析(例如，离子交换、亲和、疏水、层析聚焦和大小排阻)、电泳方法(例如，制备型(preparative)等电聚焦)、差示溶解度(例如，硫酸铵沉淀)、SDS-PAGE或提取(参见，例如，Protein Purification，J.-C.Janson和Lars Ryden编，VCH Publishers，New York，1989)，以获得基本上纯的多肽。

加工含纤维素材料的方法

本发明还涉及用于降解或转化含纤维素材料的方法，其包括用有效量的本发明的纤维素分解蛋白质组合物处理含纤维素材料。

本发明还涉及用于产生发酵产物的方法，其包括：(a)用有效量的本发明的纤维素分解蛋白质糖化含纤维素材料；(b)用一种或多种(几种)发酵微生物发酵步骤(a)中糖化的含纤维素材料，以产生发酵产物；和(c)从发酵中回收发酵产物。

本发明的方法可以用于将含纤维素材料(例如，木素纤维素)水解(糖化)成可发酵糖并将可发酵糖转换成许多有用的物质，例如化学品和燃料。由含纤维素材料生产期望的发酵产物通常包括预处理、酶水解(糖化)和发酵。

依照本发明，含纤维素材料的加工可以使用本领域已知的方法来完成。而且，可以使用设置为按照本发明来操作的任何生物质加工设备来实施本发明的方法。

水解(糖化)和发酵，分别或同时包括但不限于分别水解和发酵(SHF)、同时糖化和发酵(SSF)、同时糖化和共发酵(SSCF)、混合水解和发酵(HHF)、SHCF(分别水解和共发酵)、HHCF(混合水解和发酵)和直接微生物转化(DMC)。在本文中可理解的是本领域已知任何方法包括预处理、酶水解(糖化)、发酵或其组合可以用在本发明的方法实施中。

常规设备可以包括补料分批搅拌反应器(fed-batch stirred reactor)、分批搅拌反应器(batch-stirred reactor)、带有超滤的连续流搅拌反应器(continuous flowstirred reactor with ultrafiltration)和/或连续活塞流柱式反应器(continuousplug-flow column reactor)(Fernanda de Castilhos Corazza，Flávio Faria deMoraes，Gisella Maria Zanin和Ivo Neitzel，2003，Optimal control in fed-batchreactor for the cellobiose hydrolysis，Acta Scientiarum.Technology 25：33-38；Gusakov，A.V.，和Sinitsyn，A.P.，1985，Kinetics of the enzymatic hydrolysis ofcellulose：1.A mathematical model for a batch reactor process，Enz.Microb.Technol.7：346-352)、研磨反应器(attrition reactor)(Ryu，S.K.，和Lee，J.M.，1983，Bioconversion of waste cellulose by using an attrition bioreactor，Biotechnol.Bioeng.25：53-65)或具有由电磁场引起的强力搅拌的反应器(Gusakov，A.V.，Sinitsyn，A.P.，Davydkin，I.Y.，Davydkin，V.Y.，Protas，O.V.，1996，Enhancementof enzymatic cellulose hydrolysis using a novel type of bioreactor with intensivestirring induced by electromagnetic field，Appl.Biochem.Biotechnol.56：141-153)。用于水解和/或发酵的其他反应器类型包括，例如，流化床(fluidizedbed)、上流式床(upflow blanket)、固定化的、和挤出机型反应器。

预处理：在实施本发明的方法中，本领域已知的任何预处理方法都可以用于破坏含纤维素材料的植物细胞壁组分。在预处理之前，也可以用本领域已知的方法对含纤维素材料进行预浸泡、湿润或调理(conditioning)。常规的预处理包括而不限于蒸汽预处理(带有或不带有爆炸)、稀酸预处理、热水预处理、石灰预处理、湿氧化、湿式爆炸(wet explosion)、氨纤维爆炸、有机溶剂预处理和生物学预处理。另外的预处理包括超声、电穿孔、微波、超临界CO₂、超临界H₂O和氨渗滤法。

在水解和/或发酵作用之前可以预处理含纤维素材料。预处理优选在水解之前进行。或者，预处理可以与水解同时进行，例如与用一种或多种纤维素分解酶或其他酶活性处理含纤维素材料同时进行，以释放可发酵糖，如葡萄糖和/或麦芽糖。在大多数情况下预处理步骤本身导致生物质转化成可发酵糖(甚至在酶不存在的情况下)。

蒸汽预处理：在蒸汽预处理中，加热含纤维素材料以破坏植物细胞壁组分(包括木质素、半纤维素和纤维素)，从而使纤维素和其它级分(如半纤维素)更易于让酶接近。将纤维素材料传送至或穿过反应容器，在所述反应容器中注入蒸汽将温度升高到所需的温度和压强，并且将其在预期的反应时间里保持在其中。蒸汽预处理优选在140-230℃，更优选160-200℃，并且最优选170-190℃完成，其中最适温度范围取决于化学催化剂的加入。蒸汽预处理的停留时间(residence time)优选1-15分钟，更优选3-12分钟，并且最优选4-10分钟，其中最适停留时间取决于温度范围和化学催化剂的加入。蒸汽预处理允许相对高的固体加样量(loading)，从而使得含纤维素材料一般仅在预处理时湿润。所述蒸汽预处理经常与预处理后材料的爆炸性卸载，其称作蒸汽爆炸，即，快速闪蒸(rapid flashing)至大气压及材料的湍流组合以通过片段化增加可接近表面积(Duff和Murray，1996，Bioresource Technology 855：1-33；Galbe和Zacchi，2002，Appl.Microbiol.Biotechnol.59：618-628；美国专利申请No.20020164730)。

在蒸汽预处理之前常常加入催化剂如H₂SO₄或SO₂(通常0.3至3％w/w)，其能减少时间和降低温度，增加回收率以及改善酶水解(Ballesteros等，2006，Appl.Biochem.Biotechnol.129-132：496-508；Varga等，2004，Appl.Biochem.Biotechnol.113-116：509-523；Sassner等，2006，Enzyme Microb.Technol.39：756-762)。

化学预处理：术语“化学处理”指的是促进纤维素、半纤维素和/或木质素的分离和/或释放的任何化学预处理。适当的化学预处理方法的实例包括，例如，稀酸预处理、石灰预处理、湿氧化、氨纤维/冷冻爆炸(ammonia fiber/freezeexplosion)(AFEX)、氨渗透(ammonia percolation)(APR)或有机溶剂预处理。

在稀酸预处理中，将含纤维素材料与稀酸(通常为H₂SO₄)和水混合以形成浆料，通过蒸汽加热到所需的温度，并在一段停留时间后，闪蒸至大气压。可以在多个反应器设计中进行稀酸预处理，例如，活塞流反应器、逆流反应器或连续逆流收缩床反应器(counter-current shrinking bed reactors)(Duff和 Murray，1996，见上文；Schell等，2004，Bioresource Technol.91：179-188；Lee等，1999，Adv.Biochem.Eng.Biotechnol.65：93-115)。

也可以使用在碱性条件下的几种预处理方法。这些碱预处理包括，但不限于，石灰预处理、湿氧化、氨渗透(APR)，和氨纤维/冷冻爆炸(AFEX)。

在85-150℃的低温下用碳酸钙、氢氧化钠或氨进行石灰预处理，并且停留时间为1小时至几天(Wyman等，2005，Bioresource Technol.96：1959-1966；Mosier等，2005，Bioresource Technol.96：673-686)。WO 2006/110891、WO 2006/110899、WO 2006/110900和WO 2006/110901披露了使用氨的预处理方法。

湿氧化为通常在加入氧化剂(例如过氧化氢或超压氧)的条件下在180-200℃进行5-15分钟的热预处理(Schmidt和Thomsen，1998，BioresourceTechnol.64：139-151；Palonen等，2004，Appl.Biochem.Biotechnol.117：1-17；Varga等，2004，Biotechnol.Bioeng.88：567-574；Martin等，2006，J.Chem.Technol.Biotechnol.81：1669-1677)。以优选1-40％的干物质，更优选2-30％的干物质，并且最优选5-20％的干物质进行预处理，并且通常初始pH值随着碱(例如碳酸钠)的加入而增加。

已知的湿氧化预处理方法的改进方法为湿爆炸(湿氧化和蒸汽爆炸的组合)，其可以处理干物质高达30％。在湿爆炸中，在经过一定的驻留时间后在预处理过程中引入氧化剂。然后，通过闪蒸至大气压来结束预处理(WO 2006/032282)。

氨纤维爆炸(AFEX)包括在合适的温度(例如90-100℃)和高压(例如17-20bar)用液态或气态氨处理含纤维素材料5-10分钟，其中干物质含量可以高达60％(Gollapalli等，2002，Appl.Biochem.Biotechnol.98：23-35；Chundawat等，2007，Biotechnol.Bioeng.96：219-231；Alizadeh等，2005，Appl.Biochem.Biotechnol.121：1133-1141；Teymouri等，2005，Bioresource Technol.96：2014-2018)。

通过在160-200℃使用乙醇水溶液(40-60％乙醇)萃取30-60分钟，有机溶剂预处理使含纤维素材料脱木素(Pan等，2005，Biotechnol.Bioeng.90：473-481；Pan等，2006，Biotechnol.Bioeng.94：851-861；Kurabi等，2005，Appl.Biochem.Biotechnol.121：219-230)。通常加入硫酸作为催化剂。在有机溶剂预处理中，大部分的半纤维素被除去。

Schell等，2003，Appl.Biochem.and Biotechnol.Vol.105-108，p.69-85和Mosier等，2005，Bioresource Technology 96：673-686和公开的美国申请2002/0164730描述了合适的预处理方法的其它实例。

在一个方面，优选以酸处理，并且更优选以连续稀酸和/或弱酸处理进行所述化学预处理。所述酸通常是硫酸，但是也可以使用其它酸，如乙酸、柠檬酸、硝酸、磷酸、酒石酸、琥珀酸、氯化氢或其混合物。在优选1-5，更优选1-4，并且最优选1-3的pH范围进行弱酸处理。在一个方面，所述酸浓度在优选0.01至20wt％酸，更优选0.05至10wt％酸，甚至更优选0.1至5wt％酸，并且最优选0.2至2.0wt％酸的范围内。使所述酸与含纤维素材料接触，并在一定的温度(例如在160-220℃，优选165-195℃的范围)保持数秒至数分钟(例如1秒至60分钟)的时间。

在另一方面，以氨纤维爆炸步骤(AFEX预处理步骤)进行预处理。

在另一方面，在含水浆料中进行预处理。在优选的方面，在预处理过程中，含纤维素材料以优选10-80wt％，更优选20-70wt％，并且最优选30-60wt％，如大约50wt％的量存在。所述预处理的含纤维素材料可以是未经洗涤的，或者是使用本领域内已知的任何方法洗涤的，例如用水洗涤。

机械预处理：术语“机械预处理”指的是各种类型的研磨或磨制(例如干磨、湿磨或振动球磨)。

物理预处理：术语“物理预处理”指的是促进纤维素、半纤维素和/或木质素从含纤维素材料中分离和/或释放出来的任何预处理。例如，物理预处理可涉及辐照(例如，微波辐照)、汽蒸/蒸汽爆炸、水热解(hydro thermolysis)及其组合。

物理预处理可涉及高压和/或高温(蒸汽爆炸)。在一个方面，高压指的是范围在优选约300至约600psi，更优选为约350至约550psi，并且最优选为约400至约500psi，例如大约450psi的压力。在另一方面，高温指的是范围在大约100至大约300℃，优选大约140至大约235℃的温度。在优选的方面，在使用如上所限定的高压和高温的蒸汽枪水解仪系统(例如，Sunds Hydrolyzer，可由Sunds Defibrator AB，Sweden获得)中以分批法进行机械预处理。

组合的物理和化学预处理：含纤维素材料可以同时进行物理和化学预处理。例如，预处理步骤可以涉及稀酸或弱酸处理和高温和/或高压处理。可以根据需要依次或同时进行物理和化学预处理。也可以包括机械预处理。

因此，在优选的方面，使含纤维素材料进行机械、化学或物理预处理或者其任意组合以促进纤维素、半纤维素和/或木质素的分离和/或释放。

生物预处理：术语“生物预处理”指的是促进纤维素、半纤维素和/或木质素从含纤维素材料中分离和/或释放出来的任何生物学预处理。生物预处理技术可涉及应用溶解木质素的微生物(参见，例如，Hsu，T.-A.，1996，Pretreatment ofbiomass，于Handbook on Bioethanol：Production and Utilization，Wyman，C.E.编，Taylor & Francis，Washington，DC，179-212；Ghosh和Singh，1993，Physicochemicaland biological treatments for enzymatic/microbial conversion of lignocellulosicbiomass，Adv.Appl.Microbiol.39：295-333；McMillan，J.D.，1994，Pretreatinglignocellulosic biomass；a review，于Enzymatic Conversion of Biomass for FuelsProduction，Himmel，M.E.，Baker，J.O.和Overend，R.P.编，ACS Symposium Series566，American Chemical Society，Washington，DC，chapter 15；Gong，C.S.，Cao，N.J.，Du，J.和Tsao，G.T.，1999，Ethanol production from renewable resources，于Advances in Biochemical Engineering/Biotechnology，Scheper，T.编，Springer-VerlagBerlin Heidelberg，Germany，65：207-241；Olsson和Hahn-Hagerdal，1996，Fermentation of lignocellulosic hydrolysates for ethanol production，Enz.Microb.Tech.18：312-331；及Vallander和Eriksson，1990，Production of ethanol fromlignocellulosic materials：State of the art，Adv.Biochem.Eng./Biotechnol.42：63-95)。

糖化：在也称为糖化的水解步骤中，将经预处理的含纤维素材料水解以将纤维素以及可选地还有半纤维素分解成可发酵的糖，例如葡萄糖、木糖、木酮糖、阿拉伯糖、麦芽糖、甘露糖、半乳糖和/或可溶的寡糖。使用本发明的纤维素分解蛋白质组合物进行酶水解。也可以依次加入组合物的酶组分。

优选在本领域的技术人员能够容易地确定的条件下，在合适的含水环境中进行酶水解。在优选的方面，在适于酶活性的条件(即，对酶最佳的条件)下进行水解。可以以补料分批或连续方法进行水解，在连续方法中将经预处理的含纤维素材料(底物)逐渐加入到例如包含酶的水解溶液中。

糖化通常在受控的pH、温度和混合条件下，在搅拌釜式反应器或发酵罐中进行。合适的过程时间、温度和pH条件能够由本领域技术人员容易地确定。例如，糖化可以持续多至200小时，但是通常进行优选大约12至大约96小时，更优选大约16至大约72小时，并且最优选大约24至大约48小时。所述温度在优选大约25℃至大约70℃，更优选大约30℃至大约65℃，并且更优选大约40℃至60℃的范围内，特别地为大约50℃。所述pH在优选大约3至大约8，更优选大约3.5至大约7，并且最优选大约4至大约6的范围内，特别地为大约pH 5。干固体的含量在优选大约5至大约50wt％，更优选大约10至大约40wt％并且最优选大约20至大约30wt％的范围内。

具有增强纤维素分解的活性的多肽和酶的最优量依赖于几个因素，所述因素包括但不限于组分纤维素分解蛋白质的混合物、纤维素底物、纤维素底物浓度、纤维素底物的预处理、温度、时间、pH和发酵微生物(例如，用于同时糖化和发酵的酵母)的内含物(inclusion)。

在优选的方面，纤维素分解蛋白对于含纤维素材料的有效量是每克含纤维素材料大约0.5至大约50mg，优选大约0.5至大约40mg，更优选大约0.5至大约25mg，更优选大约0.75至大约20mg，更优选大约0.75至大约15mg，甚至更优选大约0.5至大约10mg，并且最优选大约2.5至大约10mg。

在另一优选的方面，具有增强纤维素分解的活性的多肽对于含纤维素材料的有效量是每克含纤维素材料大约0.5至大约50mg，优选大约0.5至大约40mg，更优选大约0.5至大约25mg，更优选大约0.75至大约20mg，更优选大约0.75至大约15mg，甚至更优选大约0.5至大约10mg，并且最优选大约2.5至大约10mg。

在另一优选的方面，具有增强纤维素分解的活性的多肽对于含纤维素材料的有效量是每克含纤维素材料大约0.01至大约50.0mg，优选大约0.01至大约40mg，更优选大约0.01至大约30mg，更优选大约0.01至大约20mg，更优选大约0.01至大约10mg，更优选大约0.01至大约5mg，更优选大约0.025至大约1.5mg，更优选大约0.05至大约1.25mg，更优选大约0.075至大约1.25mg，更优选大约0.1至大约1.25mg，甚至更优选大约0.15至大约1.25mg，并且最优选大约0.25至大约1.0mg。

在另一优选的方面，具有增强纤维素分解的活性的多肽对于纤维素分解蛋白的有效量是每克纤维素分解蛋白大约0.005至大约1.0g，优选大约0.01至大约1.0g，更优选大约0.15至大约0.75g，更优选大约0.15至大约0.5g，更优选大约0.1至大约0.5g，甚至更优选大约0.1至大约0.5g，并且最优选大约0.05至大约0.2g。

发酵.通过一种或多种能够直接或间接将糖发酵成期望的发酵产物的发酵微生物可以发酵从经预处理和水解的含纤维素材料得到的可发酵的糖。“发酵”或“发酵方法”指任何发酵方法或任何包括发酵步骤的方法。发酵方法还包括在生物燃料工业、可消费醇工业(例如，啤酒和葡萄酒(wine))、乳品工业(例如，发酵乳制品)、皮革工业和烟草工业中使用的发酵方法。发酵的条件依赖于期望的发酵产物和发酵生物，并且可由本领域的技术人员容易地确定。

在发酵步骤中，将作为预处理和酶水解步骤的结果从含纤维素材料释放的糖通过发酵生物例如酵母发酵成产物，例如乙醇。水解(糖化)和发酵可以是分别的或同时的。这些方法包括，但不限于，分别水解和发酵(SHF)、同时糖化和发酵(SSF)、同时糖化和共发酵(SSCF)、混合水解和发酵(HHF)、SHCF(分别水解和共发酵)、HHCF(混合水解和共发酵)和直接微生物转化(DMC)。

在实施本发明时，任何合适的经水解的含纤维素材料可以用于发酵步骤中。所述材料通常基于期望的发酵产物(即，要从发酵获得的物质)和采用的方法来进行选择，如本领域内所熟知的。

术语“发酵培养基”在本文中应理解为指在加入发酵微生物之前的培养基，例如，糖化处理产生的培养基，以及例如在同时糖化和发酵方法(SSF)中使用的培养基。

“发酵微生物”指适用于期望的发酵方法以产生发酵产物的任何微生物，包括细菌和真菌生物体。发酵生物体可以是C₆和/或C₅发酵生物体，或者其组合。C₆和C₅发酵生物都是本领域内熟知的。合适的发酵生物能够发酵，即，能够直接或间接地将糖，例如葡萄糖、木糖、木酮糖、阿拉伯糖、麦芽糖、甘露糖、半乳糖或寡糖转化成期望的发酵产物。

Lin等，2006，Appl.Microbiol.Biotechnol.69：627-642描述了生产乙醇的细菌和真菌发酵生物的实例。

可以发酵C6糖的发酵微生物的实例包括细菌和真菌生物，如酵母。优选的酵母包括酵母属(Saccharomyces)菌种，优选为酿酒酵母的菌株。

可以发酵C5糖的发酵生物的实例包括细菌和真菌生物，如酵母。优选的发酵C5的酵母包括毕赤酵母属，优选为树干毕赤酵母(Pichia stipitis)的菌株，如树干毕赤酵母CBS 5773；念珠菌属，优选博伊丁念珠菌(Candida boidinii)、芸苔念珠菌(Candida brassicae)、休哈塔念珠菌(Candida sheatae)、迪丹斯念珠菌(Candida diddensii)、假热带念珠菌(Candida pseudotropicalis)或产朊念珠菌(Candida utilis)的菌株。

其它发酵生物包括发酵单孢菌属(Zymomonas)，如运动发酵单孢菌(Zymomonas mobilis)的菌株；汉逊酵母属，如异常汉逊酵母(Hansenula anomala)的菌株；克鲁维酵母属，如脆壁克鲁维酵母(K.fragilis)的菌株；裂殖酵母属(Schizosaccharomyces)，如粟酒裂殖酵母(S.pombe)的菌株；和大肠杆菌，特别是已经进行了遗传修饰以改进乙醇产率的大肠杆菌菌株。

在优选的方面，酵母是酵母属菌种。在更优选的方面，酵母是酿酒酵母。在另一更优选的方面，酵母是糖化酵母(Saccharomyces distaticus)。在另一更优选的方面，酵母是葡萄汁酵母(Saccharomyces uvarum)。在另一优选的方面，酵母是克鲁维酵母属。在另一更优选的方面，酵母是马克斯克鲁维酵母(Kluyveromyces marxianus)。在另一更优选的方面，酵母是脆壁克鲁维酵母。在另一优选的方面，酵母是念珠菌属。在另一更优选的方面，酵母是博伊丁念珠菌。在另一更优选的方面，酵母是芸苔念珠菌。在另一更优选的方面，酵母是迪丹斯念珠菌。在另一更优选的方面，酵母是假热带念珠菌。在另一更优选的方面，酵母是产朊念珠菌。在另一优选的方面，酵母是棒孢酵母属(Clavispora)。在另一更优选的方面，酵母是葡萄牙棒孢酵母(Clavisporalusitaniae)。在另一更优选的方面，酵母是仙人掌棒孢酵母(Clavisporaopuntiae)。在另一优选的方面，酵母是管囊酵母属(Pachysolen)。在另一更优选的方面，酵母是嗜鞣管囊酵母(Pachysolen tannophilus)。在另一个更优选的方面，酵母是毕赤酵母属。在另一更优选的方面，酵母是树干毕赤酵母。在另一优选的方面，酵母是酒香酵母属(Bretannomyces)。在另一更优选的方面，酵母是克劳森酒香酵母(Bretannomyces clausenii)(Philippidis，G.P.，1996，Cellulose bioconversion technology，于Handbook on Bioethanol：Production andUtilization，Wyman，C.E.编，Taylor & Francis，Washington，DC，179-212)。

能够有效地将己糖和戊糖发酵成乙醇的细菌包括例如运动发酵单孢菌和热纤维梭菌(Philippidis，1996，见上文)。

在优选的方面，细菌是发酵单孢菌属。在更优选的方面，细菌是运动发酵单孢菌。在另一优选的方面，细菌是梭菌属。在另一更优选的方面，细菌是热纤维梭菌。

商业上可得到的适合于乙醇生产的酵母包括，例如，ETHANOL RED^TM酵母(可得自Fermentis/Lesaffre，USA)、FALI^TM(可得自Fleischmann’s Yeast，USA)、SUPERSTART^TM和THERMOSACC^TM新鲜酵母(可得自EthanolTechnology，WI，USA)、BIOFERM^TM AFT和XR(可得自NABC-North AmericanBioproducts Corporation，GA，USA)、GERT STRAND^TM(可得自Gert Strand AB，Sweden)和FERMIOL^TM(购自DSM Specialties)。

在优选的方面，发酵微生物已被遗传修饰以提供发酵戊糖的能力，例如，利用木糖、利用阿拉伯糖和共同利用木糖和阿拉伯糖的微生物(xylose and arabinose co-utilizing microorganism)。

将异源基因克隆至多种发酵微生物中已经导致构建了能够将己糖和戊糖转化为乙醇的生物(共发酵)(Chen和Ho，1993，Cloning and improving the expressionof Pichia stipitis xylose reductase gene in Saccharomyces cerevisiae，Appl.Biochem.Biotechnol.39-40：135-147；Ho等，1998，Genetically engineered Saccharomycesyeast capable of effectively cofermenting glucose and xylose，Appl.Environ.Microbiol.64：1852-1859；Kotter和Ciriacy，1993，Xylose fermentation bySaccharomyces cerevisiae，Appl.Microbiol.Biotechnol.38：776-783；Walfridsson等，1995，Xylose-metabolizing Saccharomyces cerevisiae strains overexpressing theTKL1 and TAL1 genes encoding the pentose phosphate pathway enzymestransketolase and transaldolase，Appl.Environ.Microbiol.61：4184-4190；Kuyper等，2004，Minimal metabolic engineering of Saccharomyces cerevisiae for efficientanaerobic xylose fermentation：a proof of principle，FEMS Yeast Research 4：655-664；Beall等，1991，Parametric studies of ethanol production from xylose andother sugars by recombinant Escherichia coli，Biotech.Bioeng.38：296-303；Ingram等，1998，Metabolic engineering of bacteria for ethanol production，Biotechnol.Bioeng.58：204-214；Zhang等，1995，Metabolic engineering of a pentosemetabolism pathway in ethanologenic Zymomonas mobilis，Science 267：240-243；Deanda等，1996，Development of an arabinose-fermenting Zymomonas mobilisstrain by metabolic pathway engineering，Appl.Environ.Microbiol.62：4465-4470)。

在优选的方面，经遗传修饰的发酵微生物是酿酒酵母。在另一优选的方面，经遗传修饰的发酵微生物是运动发酵单孢菌。在另一优选的方面，经遗传修饰的发酵微生物是大肠杆菌。在另一优选的实施方式中，经遗传修饰的发酵微生物是产酸克雷伯氏菌(Klebsiella oxytoca)。

通常加入发酵微生物以降解纤维素或水解产物，并且发酵进行大约8到大约96小时，例如大约24至大约60小时。温度通常为大约26℃至大约60℃，特别是大约32℃或50℃，并且在大约pH 3至大约pH 8，如大约pH4-5、6或7。

在优选的方面，将发酵微生物应用于降解的纤维素或水解产物，并且发酵进行大约12至大约96小时，如通常为24-60小时。在优选的方面，温度优选在大约20℃至大约60℃，更优选大约25℃至大约50℃，并且最优选大约32℃至大约50℃，特别是大约32℃或50℃，并且pH通常从大约pH 3至大约pH 7，优选大约pH 4-7。然而，例如，一些细菌发酵生物具有更高的最佳发酵温度。发酵微生物优选以每毫升的发酵液大约10⁵至10¹²，优选大约10⁷至10¹⁰，特别是大约2×10⁸的活细胞计数的量应用。有关使用酵母发酵的其它指导可参见例如“The Alcohol Textbook”(K.Jacques，T.P.Lyons和D.R.Kelsall编，Nottingham University Press，United Kingdom 1999)，将其通过提述并入本文。

对于乙醇产生，在发酵之后蒸馏发酵浆料以提取乙醇。根据本发明的方法获得的乙醇可以用作例如燃料乙醇、饮用乙醇，即，可饮用中性酒精(potableneutral spirits)；或工业乙醇。

可以将发酵刺激物(fermentation stimulator)与本文描述的任何酶方法组合使用以进一步改进发酵方法，特别是改进发酵微生物的性能，如，速率增益和乙醇产率。“发酵刺激物”指用于发酵微生物，特别是酵母的生长的刺激物。优选的用于生长的发酵刺激物包括维生素和矿物。维生素的实例包括多种维生素、生物素、泛酸、烟酸、内消旋肌醇、硫胺素、吡哆醇、对氨基苯甲酸、叶酸、核黄素和维生素A、B、C、D和E。参见，例如，Alfenore等，Improvingethanol production and viability of Saccharomyces cerevisiae by a vitamin feedingstrategy during fed-batch process，Springer-Verlag(2002)，将其通过提述并入本文。矿物的实例包括能够提供营养物的矿物和矿物盐，所述营养物包括P、K、Mg、S、Ca、Fe、Zn、Mn和Cu。

发酵产物：发酵产物可以为源自发酵的任何物质。所述发酵产物可以是，但不限于，醇(例如，阿拉伯糖醇、丁醇、乙醇、甘油、甲醇、1，3-丙二醇、山梨糖醇和木糖醇)；有机酸(例如，乙酸、醋酮酸、己二酸、抗坏血酸、柠檬酸、2，5-二酮-D-葡糖酸、甲酸、延胡索酸、葡糖二酸、葡糖酸、葡糖醛酸、戊二酸、3-羟基丙酸、衣康酸、乳酸、苹果酸、丙二酸、草酸、丙酸、琥珀酸和木糖酸)；酮类(例如，丙酮)；醛类(例如，甲醛)；氨基酸(例如，天冬氨酸、谷氨酸、甘氨酸、赖氨酸、丝氨酸和苏氨酸)；气体(例如，甲烷、氢气(H₂)、二氧化碳(CO₂)和一氧化碳(CO))。发酵产物还可以为蛋白质作为有高价值产物。

在优选的方面，所述发酵产物是醇。应该理解术语“醇”包含含有一个或多个羟基的物质。在更优选的方面，所述醇是阿拉伯糖醇。在另一更优选的方面，所述醇是丁醇。在另一更优选的方面，所述醇是乙醇。在另一更优选的方面，所述醇是甘油。在另一更优选的方面，所述醇是甲醇。在另一更优选的方面，所述醇是1，3-丙二醇。在另一更优选的方面，所述醇是山梨糖醇。在另一个更优选的方面，所述醇是木糖醇。参见，例如，Gong，C.S.，Cao，N.J.，Du，J.，和Tsao，G.T.，1999，Ethanol production from renewable resources，于Advances in Biochemical Engineering/Biotechnology，Scheper，T.编，Springer-Verlag Berlin Heidelberg，Germany，65：207-241；Silveira，M.M.和Jonas，R.，2002，The biotechnological production of sorbitol，Appl.Microbiol.Biotechnol.59：400-408；Nigam，P.和Singh，D.，1995，Processes for fermentativeproduction of xylitol-a sugar substitute，Process Biochemistry 30(2)：117-124；Ezeji，T.C.，Qureshi，N.和Blaschek，H.P.，2003，Production of acetone，butanoland ethanol by Clostridium beijerinckii BA101 and in situ recovery by gasstripping，World Journal of Microbiology and Biotechnology 19(6)：595-603。

另一个优选的方面，所述发酵产物是有机酸。在另一更优选的方面，所述有机酸是乙酸。在另一更优选的方面，所述有机酸是醋酮酸。在另一更优选的方面，所述有机酸是己二酸。在另一更优选的方面，所述有机酸是抗坏血酸。在另一更优选的方面，所述有机酸是柠檬酸。在另一更优选的方面，所述有机酸是2，5-二酮-D-葡糖酸。在另一更优选的方面，所述有机酸是甲酸。在另一更优选的方面，所述有机酸是延胡索酸。在另一更优选的方面，所述有机酸是葡糖二酸。在另一更优选的方面，所述有机酸是葡糖酸。在另一更优选的方面，所述有机酸是葡糖醛酸。在另一更优选的方面，所述有机酸是戊二酸。在另一优选的方面，所述有机酸是3-羟基丙酸。在另一更优选的方面，所述有机酸是衣康酸。在另一更优选的方面，所述有机酸是乳酸。在另一更优选的方面，所述有机酸是苹果酸。在另一更优选的方面，所述有机酸是丙二酸。在另一更优选的方面，所述有机酸是草酸。在另一更优选的方面，所述有机酸是丙酸。在另一更优选的方面，所述有机酸是琥珀酸。在另一更优选的方面，所述有机酸是木糖酸。参见，例如，Chen，R.和Lee，Y.Y.，1997，Membrane-mediated extractive fermentation for lactic acid production fromcellulosic biomass，Appl.Biochem.Biotechnol.63-65：435-448。

在另一优选的方面，所述发酵产物是酮。应该理解的是术语“酮”涵盖含有一个或多个酮基的物质。在另一更优选的方面，所述酮是丙酮。参见，例如，Qureshi和Blaschek，2003，见上文。

在另一优选的方面，所述发酵产物是醛。在另一更优选的方面，所述醛为甲醛。

在另一优选的方面，所述发酵产物是氨基酸。在另一更优选的方面，所述有机酸是天冬氨酸。在另一更优选的方面，所述氨基酸是谷氨酸。在另一更优选的方面，所述氨基酸是甘氨酸。在另一更优选的方面，所述氨基酸是赖氨酸。在另一更优选的方面，所述氨基酸是丝氨酸。在另一更优选的方面，所述氨基酸是苏氨酸。参见，例如，Richard，A.和Margaritis，A.，2004，Empiricalmodeling of batch fermentation kinetics for poly(glutamic acid)production andother microbial biopolymers，Biotechnology and Bioengineering 87(4)：501-515。

在另一优选的方面，所述发酵产物是气体。在另一更优选的方面，所述气体是甲烷。在另一更优选的方面，所述气体是H₂。在另一更优选的方面，所述气体是CO₂。在另一更优选的方面，所述气体是CO。参见，例如，Kataoka，N.，A.Miya和K.Kiriyama，1997，Studies on hydrogen production by continuous culturesystem of hydrogen-producing anaerobic bacteria，Water Science and Technology 36(6-7)：41-47；和Gunaseelan V.N.于Biomass and Bioenergy，Vol.13(1-2)，pp.83-114，1997，Anaerobic digestion of biomass for methane production：A review。

回收：使用本领域已知的方法可以从发酵培养基中任选地回收发酵产物，所述方法包括，但不限于，层析(例如，离子交换、亲和、疏水、层析聚焦和大小排阻)、电泳方法(例如，制备型等电聚焦)、差示溶解度(例如，硫酸铵沉淀)、蒸馏或提取。例如，从发酵的含纤维素材料中分离乙醇，并通过常规的蒸馏方法纯化。可以获得纯度高至大约96vol.％的乙醇，其可以用作，例如燃料乙醇、饮用乙醇，即，可饮用中性酒精(potable neutral spirits)；或工业乙醇。

通过以下实施例进一步对本发明进行描述，但不应将其理解为对本发明范围的限制。

实施例

用作缓冲液和底物的化学品为至少试剂级的商业产品。

DNA测序

使用Applied Biosystems Model 3130X Genetic Analyzer(3130X型遗传分析仪)(Applied Biosystems，Foster City，CA，USA)，利用染料终止子化学(Giesecke等，1992，Journal of Virol.Methods 38：47-60)进行DNA测序。使用phred/phrap/consed(University of Washington，Seattle，WA，USA)用序列特异性引物组装序列。

培养基与溶液

YP培养基由每升10g酵母提取物和20g细菌用胰蛋白胨组成。

纤维素酶-诱导培养基由每升20g纤维素、10g玉米浆固体、1.45g(NH₄)₂SO₄、2.08g KH₂PO₄、0.28g CaCl₂、0.42g MgSO₄·7H₂O和0.42ml痕量金属溶液组成。

痕量金属溶液由每升216g FeCl₃·6H₂O、58g ZnSO₄·7H₂O、27gMnSO₄·H₂O、10g CuSO₄·5H₂O、2.4g H₃BO₃和336g柠檬酸组成。

STC由1M山梨醇、10mM CaCl₂和10mM Tris-HCl，pH 7.5组成。

COVE平板由每升342g蔗糖、10ml COVE盐溶液、10ml 1M乙酰胺、10ml 1.5M CsCl，和25g Noble琼脂组成。

COVE盐溶液由每升26g KCl、26g MgSO₄、76g KH₂PO₄和50ml COVE痕量金属溶液组成。

COVE痕量金属溶液由每升0.04g Na₂B₄O₇·10H₂O、0.4g CuSO₄·5H₂O、1.2g FeSO₄·7H₂O、0.7g MnSO₄·H₂O、0.8g Na₂MoO₂·H₂O和10g ZnSO₄·7H₂O组成。

COVE2平板由每升30g蔗糖、20ml COVE盐溶液、25g Noble琼脂和10ml 1M乙酰胺组成。

PDA平板由每升39克马铃薯葡萄糖琼脂组成。

LB培养基由每升10g胰蛋白胨、5g酵母提取物和5gNaCl组成。

2X YT-Amp平板由每升10g胰蛋白胨、5g酵母提取物、5g氯化钠和15g细菌用琼脂组成，在高压灭菌后加入2ml过滤灭菌的50mg/ml氨苄青霉素溶液。

MDU2BP培养基由每升45g麦芽糖、1g MgSO₄·7H₂O、1g NaCl、2gK₂HSO₄、12g KH₂PO₄、2g脲和500μl AMG痕量金属溶液，pH调至5.0，然后用0.22μm过滤装置过滤除菌。

AMG痕量金属溶液由每升14.3g ZnSO₄·7H₂O、2.5g CuSO₄·5H₂O、0.5gNiCl₂·6H₂O、13.8g FeSO₄·H₂O、8.5g MnSO₄·7H₂O和3g柠檬酸组成。

矿物质培养基平板由每升6g NaNO₃、0.52g KCl、1.52g KH₂PO₄、1mlCOVE痕量金属溶液、20g Noble琼脂、20ml 50％葡萄糖、2.5ml 20％MgSO₄·7H₂O，和20ml生物素保存溶液组成。

生物素保存溶液由每升0.2g生物素组成。

SOC培养基由2％胰蛋白胨、0.5％酵母提取物、10mM NaCl、2.5mM KCl、10mM MgCl₂和10mM MgSO₄组成，然后在高压灭菌后加入过滤除菌的葡萄糖至20mM。

孟德尔培养基由每升1.4g(NH₄)₂SO₄、2.0g KH₂PO₄、0.3g脲、0.3gCaCl₂、0.3g MgSO₄.7H₂O、5mg FeSO₄.7H₂O、1.6mg MnSO₄.H₂O、1.4mgZnSO₄.H₂O和2mg CoCl₂组成。

实施例1：pMJ04表达载体的构建

通过使用下述所示的引物993429(反义)和993428(有义)从里氏木霉RutC30基因组DNAPCR扩增里氏木霉纤维二糖水解酶I基因(cbh1，CEL7A)终止子而构建表达载体pMJ04。工程改造反义引物，使其在5’末端包含Pac I位点，并在有义引物的3’末端包含Spe I位点。

引物993429(反义)：

5’-AACGTTAATTAAGGAATCGTTTTGTGTTT-3’(SEQ ID NO：65)

引物993428(有义)：

5’-AGTACTAGTAGCTCCGTGGCGAAAGCCTG-3’(SEQ ID NO：66)

使用 Plant Maxi Kit(QIAGEN Inc.，Valencia，CA，USA)分离里氏木霉RutC30基因组DNA。

扩增反应液(50μl)由下述物质组成：1X ThermoPol反应缓冲液(New EnglandBiolabs，Beverly，MA，USA)，0.3mM dNTP，100ng里氏木霉RutC30基因组DNA，0.3μM引物993429，0.3μM引物993428和2单位Vent DNA聚合酶(NewEngland Biolabs，Beverly，MA，USA)。在

5333(Eppendorf Scientific，Inc.，Westbury，NY，USA)中温育反应物，程序为94℃30秒，50℃ 30秒，和72℃ 60秒的5个循环，然后进行94℃ 30秒，65℃ 30秒，和72℃ 120秒的25个循环(5分钟的最后延伸)。通过1.0％琼脂糖凝胶电泳，使用40mM Tris碱-20mM乙酸钠-1mM EDTA二钠(TAE)缓冲液分离反应产物，其中从凝胶切下229bp的产物条带，并使用

Gel ExtractionKit(QIAGEN Inc.，Valencia，CA，USA)，根据生产商的说明纯化。

用Pac I和Spe I消化得到的PCR片段，并使用快速连接试剂盒(Roche，Indianapolis，IN，USA)连接入用相同的限制性酶消化的pAlLo1(WO05/067531)中，以产生pMJ04(图1)。

实施例2：pCaHj568的构建

由pCaHj170(美国专利No.5,763,254)和pMT2188构建质粒pCaHj568。质粒pCaHj170包含特异腐质霉内切葡聚糖酶V(CEL45A)全长编码区(SEQID NO：15，其编码SEQ ID NO：16的氨基酸序列)。pMT2188的构建由使用下述所示引物142779和142780从pCaHj483(WO 98/00529)PCR扩增pUC19的复制起点而开始。引物142780在PCR片段中引入Bbu I位点。

引物142779：

5’-TTGAATTGAAAATAGATTGATTTAAAACTTC-3’(SEQ ID NO：67)

引物142780

5’-TTGCATGCGTAATCATGGTCATAGC-3’(SEQ ID NO：68)

使用

PCR系统(Roche Molecular Biochemicals，Basel，Switzerland)，按照生产商的说明进行此扩增。在琼脂糖凝胶上分离PCR产物，并使用Jetquick Gel Extraction Spin Kit(Genomed，Wielandstr，Germany)分离和纯化1160bp片段。

使用 PCR系统，用下述所示引物140288和142778，从常用的酿酒酵母克隆载体pYES2(Invitrogen，Carlsbad，CA，USA)扩增URA3基因。引物140288在PCR片段中引入Eco RI位点。

引物 140288：

5’-TTGAATTCATGGGTAATAACTGATAT-3’(SEQ ID NO：69)

引物142778：

5’-AAATCAATCTATTTTCAATTCAATTCATCATT-3’(SEQ ID NO：70)

在琼脂糖凝胶上分离PCR产物，并使用Jetquick Gel Extraction Spin Kit分离和纯化1126bp片段。

通过混合将两个PCR片段融合，并通过重叠剪接方法(Horton等，1989，Gene77：61-68)用上述所示引物142780和140288进行扩增。在琼脂糖凝胶上分离PCR产物，并使用Jetquick Gel Extraction Spin Kit分离和纯化2263bp片段。

用Eco RI和Bbu I消化得到的片段，并使用标准规程连接至用相同的限制性酶消化的pCaHj483的最大片段。将连接混合物转化入由Mandel和Higa，1970，J.Mol.Biol.45：154方法制成感受态的pyrF-阴性大肠杆菌菌株DB6507(ATCC 35673)。在每升补加1g酪蛋白氨基酸、500μg硫胺素和10mg卡那霉素的固体M9培养基(Sambrook等，1989，Molecular Cloning，A LaboratoryManual，第2版，Cold Spring Harbor Laboratory Press)上筛选转化体。从一个转化体分离质粒并命名为pCaHj527(图2)。

将pCaHj527上存在的NA2-tpi启动子通过使用 PCR系统根据生产商的说明进行定点突变。使用下述所示突变引物141223将核苷酸134-144从GTACTAAAACC(SEQ ID NO：71)转变成CCGTTAAATTT(SEQID NO：72)。

引物141223：

5’-GGATGCTGTTGACTCCGGAAATTTAACGGTTTGGTCTTGCATCCC-3’(SEQ ID NO：73)

使用下述所示突变引物141222将核苷酸423-436从ATGCAATTTAAACT(SEQ ID NO：74)转变成CGGCAATTTAACGG(SEQ ID NO：75)。

引物141222：

5’-GGTATTGTCCTGCAGACGGCAATTTAACGGCTTCTGCGAATCGC-3’(SEQ ID NO：76)

将得到的质粒命名为pMT2188(图3)。

将特异腐质霉内切葡聚糖酶V编码区从pCaHj170作为Bam HI-Sal I片段转入用Bam HI和Xho I消化的pMT2188，以产生pCaHj568(图4)。质粒pCaHj568包含突变的NA2-tpi启动子，其与特异腐质霉内切葡聚糖酶V全长编码序列可操作连接。

实施例3：pMJ05的构建

通过使用下述所示引物HiEGV-F和HiEGV-R，由pCaHj568 PCR扩增915bp特异腐质霉内切葡聚糖酶V全长编码区而构建质粒pMJ05。

引物HiEGV-F(有义)：

5’-AAGCTTAAGCATGCGTTCCTCCCCCCTCC-3’(SEQ ID NO：77)

引物HiEGV-R(反义)：

5’-CTGCAGAATTCTACAGGCACTGATGGTACCAG-3’(SEQ ID NO：78)

扩增反应液(50μl)由下述组成：1X ThermoPol反应缓冲液(New EnglandBiolabs，Beverly，MA，USA)，0.3mM dNTP，10ng/μl pCaHj568，0.3μMHiEGV-F引物，0.3μM HiEGV-R引物，和2单位Vent DNA聚合酶(New England Biolabs，Beverly，MA，USA)。在

5333(Eppendorf Scientific，Inc.，Westbury，NY，USA)中温育反应物，程序为94℃ 30秒，50℃ 30秒，和72℃ 60秒的5个循环，然后进行94℃ 30秒，65℃ 30秒，和72℃ 120秒的25个循环(5分钟的最后延伸)。通过1.0％琼脂糖凝胶电泳，使用TAE缓冲液分离反应产物，其中从凝胶切下937bp的产物条带，并使用

凝胶提取试剂盒(QIAGEN Inc.，Valencia，CA，USA)，根据生产商的说明纯化。

将937bp纯化的片段用作使用下述引物的后续扩增的模板DNA：

引物HiEGV-R(反义)：

5’-CTGCAGAATTCTACAGGCACTGATGGTACCAG-3’(SEQ ID NO：79)

引物HiEGV-F-重叠(有义)：

5’-ACCGCGGACTGCGCATCATGCGTTCCTCCCCCCTCC-3’(SEQ IDNO：80)

斜体表示的引物序列与里氏木霉纤维二糖水解酶I基因(cbh1)启动子的17bp同源，并且加下划线的引物序列与特异腐质霉内切葡聚糖酶V编码区的29bp同源。启动子和编码序列之间的36bp重叠允许将包含里氏木霉cbh1启动子的994bp片段精确融合至包含特异腐质霉内切葡聚糖酶V编码区的918bp片段。

扩增反应液(50μl)由下述物质组成：1X ThermoPol反应缓冲液，0.3mMdNTP，1μl纯化的937bp PCR片段，0.3μM HiEGV-F-重叠引物，0.3μMHiEGV-R引物，和2单位Vent DNA聚合酶。在

5333中温育反应物，程序为94℃ 30秒，50℃ 30秒，和72℃ 60秒的5个循环，然后进行94℃ 30秒，65℃ 30秒，和72℃ 120秒的25个循环(5分钟的最后延伸)。通过1.0％琼脂糖凝胶电泳，使用TAE缓冲液分离反应产物，其中从凝胶切下945bp的产物条带，并使用

凝胶提取试剂盒，根据生产商的说明纯化。

使用下述所示引物进行单独的PCR，以从里氏木霉RutC30基因组DNA扩增从基因的ATG起始密码子的994bp上游延伸的里氏木霉cbh1启动子序列(有义引物进行工程改造以在5’末端包含Sal I限制性位点)。使用

Plant Maxi Kit分离里氏木霉RutC30基因组DNA。

引物TrCBHIpro-F(有义)：

5’-AAACGTCGACCGAATGTAGGATTGTTATC-3’(SEQ ID NO：81)

引物TrCBHIpro-R(反义)：

5’-GATGCGCAGTCCGCGGT-3’(SEQ ID NO：82)

扩增反应液(50μl)由下述物质组成：1X ThermoPol反应缓冲液，0.3mMdNTP，100ng/μl里氏木霉RutC30基因组DNA，0.3μM TrCBHIpro-F引物，0.3μM TrCBHIpro-R引物，和2单位Vent DNA聚合酶。在

5333中温育反应物，程序为94℃ 30秒，55℃ 30秒，和72℃ 120秒的30个循环(5分钟的最后延伸)。通过1.0％琼脂糖凝胶电泳，使用TAE缓冲液分离反应产物，其中从凝胶切下998bp的产物条带，并使用

凝胶提取试剂盒，根据生产商的说明纯化。

将998bp纯化的片段用作使用下述引物的后续扩增的模板DNA。

引物TrCBHIpro-F：

5’-AAACGTCGACCGAATGTAGGATTGTTATC-3’(SEQ ID NO：83)

引物TrCBHIpro-R-重叠：

5’-GGAGGGGGGAGGAACGCATGATGCGCAGTCCGCGGT-3’(SEQ IDNO：84)

斜体表示的引物序列与里氏木霉cbh1启动子的17bp同源，并且加下划线的引物序列与特异腐质霉内切葡聚糖酶V编码区的29bp同源。启动子和编码序列之间36bp的重叠允许将包含里氏木霉cbh1启动子的994bp片段精确融合至包含特异腐质霉内切葡聚糖酶V编码区的918bp片段。

扩增反应液(50μl)由下述物质组成：1X ThermoPol反应缓冲液，0.3mMdNTP，1μl纯化的998bp PCR片段，0.3μM TrCHB1pro-F引物，0.3μMTrCBH1pro-R-重叠引物，和2单位Vent DNA聚合酶。在

5333中温育反应物，程序为94℃ 30秒，50℃ 30秒，和72℃ 60秒的5个循环，然后进行94℃ 30秒，65℃ 30秒，和72℃ 120秒的25个循环(5分钟的最后延伸)。通过1.0％琼脂糖凝胶电泳，使用TAE缓冲液分离反应产物，其中从凝胶切下1017bp的产物条带，并使用

凝胶提取试剂盒，根据生产商的说明纯化。

使用下述引物，用1017bp里氏木霉cbh1启动子PCR片段和945bp特异腐质霉内切葡聚糖酶V PCR片段作为后续扩增的模板DNA，利用重叠PCR将994bp cbh1启动子精确融合至918bp内切葡聚糖酶V全长编码区。

引物TrCBHIpro-F：

5’-AAACGTCGACCGAATGTAGGATTGTTATC-3’(SEQ ID NO：85)

引物HiEGV-R：

5’-CTGCAGAATTCTACAGGCACTGATGGTACCAG-3’(SEQ ID NO：86)

扩增反应液(50μl)由下述物质组成：1X ThermoPol反应缓冲液，0.3mMdNTP，0.3μM TrCHB1pro-F引物，0.3μM HiEGV-R引物，和2单位Vent DNA聚合酶。在

5333中温育反应物，程序为94℃ 30秒，50℃ 30秒，和72℃ 60秒的5个循环，然后进行94℃ 30秒，65℃ 30秒，和72℃ 120秒的25个循环(5分钟的最后延伸)。通过1.0％琼脂糖凝胶电泳，使用TAE缓冲液分离反应产物，其中从凝胶切下1926bp的产物条带，并使用

凝胶提取试剂盒，根据生产商的说明纯化。

使用

PCR克隆试剂盒(Invitrogen，Carlsbad，CA，USA)，按照生产商的说明，将得到的1926bp片段克隆入

-Blunt-II-

载体(Invitrogen，Carlsbad，CA，USA)。用Not I和Sal I消化得到的质粒，使用凝胶提取试剂盒将1926bp片段凝胶纯化，并使用T4 DNA连接酶(Roche，Indianapolis，IN，USA)连接入也用相同的两个限制性酶消化的pMJ04，以产生pMJ05(图5)。质粒pMJ05包含里氏木霉纤维二糖水解酶I启动子和终止子，其与特异腐质霉内切葡聚糖酶V全长编码序列可操作连接。

实施例4：pSMai130表达载体的构建

用下述所示引物993467(有义)和993456(反义)，从作为模板的pJaL660(WO 2002/095014)PCR扩增2586bp DNA片段，所述片段从ATG起始密码子到TAA终止密码子，跨越米曲霉β-葡糖苷酶全长编码序列(cDNA序列为SEQ ID NO：15，而SEQ ID NO：16为推定的氨基酸序列；大肠杆菌DSM14240)。Spe I位点经工程改造位于反义引物的5’末端以促进连接。斜体表示的引物序列与里氏木霉cbh1启动子的24bp同源，并且加下划线的引物序列与米曲霉β-葡糖苷酶编码区的22bp同源。

引物993467：

5’-ATAGTCAACCGCGGACTGCGCATCATGAAGCTTGGTTGGATCGAGG-3’(SEQ ID NO：87)

引物993456

5’-ACTAGTTTACTGGGCCTTAGGCAGCG-3’(SEQ ID NO：88)

扩增反应液(50μl)由下述物质组成：Pfx扩增缓冲液(Invitrogen，Carlsbad，CA，USA)，0.25mM dNTP，10ng pJaL660，6.4μM引物993467，3.2μM引物993456，1mM MgCl₂，和2.5单位Pfx DNA聚合酶(Invitrogen，Carlsbad，CA，USA)。在

5333中温育反应物，程序为94℃ 1分钟，55℃ 1分钟，和72℃ 3分钟的30个循环(15分钟的最后延伸)。通过1.0％琼脂糖凝胶电泳，使用TAE缓冲液分离反应产物，其中从凝胶切下2586bp的产物条带，并使用

凝胶提取试剂盒，根据生产商的说明纯化。

使用如下所示的引物993453(有义)和引物993463(反义)进行单独的PCR，以扩增里氏木霉cbh1启动子序列，所述序列从基因的ATG起始密码子的1000bp上游延伸，从而产生1000bp PCR片段。

引物993453：

5’-GTCGACTCGAAGCCCGAATGTAGGAT-3’(SEQ ID NO：89)

引物993463：

5’-CCTCGATCCAACCAAGCTTCATGATGCGCAGTCCGCGGTTGACTA-3’(SEQ ID NO：90)

斜体表示的引物序列与里氏木霉cbh1启动子的24bp同源，并且加下划线的引物序列与米曲霉β-葡糖苷酶全长编码区的22bp同源。启动子和编码序列之间46bp的重叠允许将包含里氏木霉cbh1启动子的1000bp片段精确融合至包含米曲霉β-葡糖苷酶编码区的2586bp片段。

扩增反应液(50μl)由下述物质组成：Pfx扩增缓冲液，0.25mM dNTP，100ng里氏木霉RutC30基因组DNA，6.4μM引物993453，3.2μM引物993463，1mM MgCl₂，和2.5单位Pfx DNA聚合酶。在

5333中温育反应物，程序为94℃ 1分钟，55℃ 1分钟，和72℃ 3分钟的30个循环(15分钟的最后延伸)。通过1.0％琼脂糖凝胶电泳，使用TAE缓冲液分离反应产物，其中从凝胶切下1000bp的产物条带，并使用凝胶提取试剂盒，根据生产商的说明纯化。

使用上述所示引物993453(有义)和引物993456(反义)，通过重叠PCR，将纯化的片段用作后续扩增的模板DNA，将包含里氏木霉cbh1启动子的1000bp片段精确融合至包含米曲霉β-葡糖苷酶全长编码区的2586bp片段。

扩增反应液(50μl)由下述物质组成：Pfx扩增缓冲液，0.25mM dNTP，6.4μM引物993453，3.2μM引物993456，1mM MgCl₂，和2.5单位Pfx DNA聚合酶。在

5333中温育反应物，程序为94℃ 1分钟，60℃ 1分钟，和72℃ 4分钟的30个循环(15分钟的最后延伸)。

用Sal I和Spe I消化得到的3586bp片段并连接入用相同的两个限制性酶消化的pMJ04，以产生pSMai130(图6)。质粒pSMAi130包含里氏木霉纤维二糖水解酶I基因启动子和终止子，其与米曲霉天然β-葡糖苷酶信号序列和编码序列(即，全长米曲霉β-葡糖苷酶编码序列)可操作连接。

实施例5：pSMai135的构建

用下述引物993728(有义)和993727(反义)，从作为模板的pJaL660 PCR扩增从Lys-20到TAA终止密码子的米曲霉β-葡糖苷酶成熟编码区(不包含天然信号序列，参见图7；SEQ ID NO：91和92是其信号肽和编码序列)。

引物993728：

5’-TGCCGGTGTTGGCCCTTGCCAAGGATGATCTCGCGTACTCCC-3’(SEQ ID NO：93)

引物993727：

5’-GACTAGTCTTACTGGGCCTTAGGCAGCG-3’(SEQ ID NO：94)

斜体表示的序列与特异腐质霉内切葡聚糖酶V信号序列的20bp同源，并且加下划线的序列与米曲霉β-葡糖苷酶编码区的22bp同源。Spe I位点经工程改造入反义引物的5’末端。

扩增反应液(50μl)由下述物质组成：Pfx扩增缓冲液，0.25mM dNTP，10ng/μl pJaL660，6.4μM引物993728，3.2μM引物993727，1mM MgCl₂，和2.5单位Pfx DNA聚合酶。在

5333中温育反应物，程序为94℃ 1分钟，55℃ 1分钟，和72℃ 3分钟的30个循环(15分钟的最后延伸)。通过1.0％琼脂糖凝胶电泳，使用TAE缓冲液分离反应产物，其中从凝胶切下2523bp的产物条带，并使用

凝胶提取试剂盒，根据生产商的说明纯化。

使用如下所示的引物993724(有义)和引物993729(反义)，进行单独的PCR扩增，以扩增1000bp里氏木霉cbh1启动子和63bp特异腐质霉内切葡聚糖酶V信号序列(ATG起始密码子到Ala-21，图8，SEQ ID NO：95和96)。

引物993724：

5’-ACGCGTCGACCGAATGTAGGATTGTTATCC-3’(SEQ ID NO：97)

引物993729：

5’-GGGAGTACGCGAGATCATCCTTGGCAAGGGCCAACACCGGCA-3’(SEQ ID NO：98)

斜体表示的引物序列与特异腐质霉内切葡聚糖酶V信号序列的20bp同源，并且加下划线的引物序列与米曲霉β-葡糖苷酶编码区的22bp同源。

使用质粒pMJ05作为模板产生包含里氏木霉cbh1启动子和特异腐质霉内切葡聚糖酶V信号序列片段的1063bp片段，所述质粒pMJ05包含在cbh1启动子控制下的特异腐质霉内切葡聚糖酶V编码区。里氏木霉cbh1启动子和特异腐质霉内切葡聚糖酶V信号序列和米曲霉β-葡糖苷酶成熟编码序列之间共有42bp重叠，从而在2523bp米曲霉β-葡糖苷酶编码区的启动子和ATG起始密码子之间提供完美的连接。

扩增反应液(50μl)由下述物质组成：Pfx扩增缓冲液，0.25mM dNTP，100ng/μl pMJ05，6.4μM引物993728，3.2μM引物993727，1mM MgCl₂，和2.5单位Pfx DNA聚合酶。在

5333中温育反应物，程序为94℃ 1分钟，60℃ 1分钟，和72℃ 4分钟的30个循环(15分钟的最后延伸)。通过1.0％琼脂糖凝胶电泳，使用TAE缓冲液分离反应产物，其中从凝胶切下1063bp的产物条带，并使用

凝胶提取试剂盒，根据生产商的说明纯化。

使用上述引物993724(有义)和引物993727(反义)，通过重叠PCR，将纯化的重叠片段用作扩增模板，从而将包含里氏木霉cbh1启动子和特异腐质霉内切葡聚糖酶V信号序列的1063bp片段精确融合至包含米曲霉β-葡糖苷酶成熟编码区框的2523bp片段。

扩增反应液(50μl)由下述物质组成：Pfx扩增缓冲液，0.25mM dNTP，6.4μM引物993724，3.2μM引物993727，1mM MgCl₂，和2.5单位Pfx DNA聚合酶。在

5333中温育反应物，程序为94℃ 1分钟，60℃ 1分钟，和72℃ 4分钟的30个循环(15分钟的最后延伸)。通过1.0％琼脂糖凝胶电泳，使用TAE缓冲液分离反应产物，其中从凝胶切下3591bp的产物条带，并使用

凝胶提取试剂盒，根据生产商的说明纯化。

用Sal I和Spe I消化得到的3591bp片段并连接入用相同的限制性酶消化的pMJ04，以产生pSMai135(图9)。质粒pSMAi135包含里氏木霉纤维二糖水解酶I基因启动子和终止子，其与特异腐质霉内切葡聚糖酶V信号序列和米曲霉β-葡糖苷酶成熟编码序列可操作连接。

实施例6：米曲霉β-葡糖苷酶与特异腐质霉内切葡聚糖酶V分泌信号的表达

将编码与特异腐质霉内切葡聚糖酶V分泌信号连接的成熟米曲霉β-葡糖苷酶的质粒pSMai135(图8)通过PEG介导的转化(Penttila等，1987，Gene 61155-164)导入里氏木霉RutC30。该质粒包含构巢曲霉amdS基因，以使转化子能以乙酰胺为唯一氮源生长。

在27℃和90rpm，在补加2％(w/v)葡萄糖和10mM尿苷的25ml YP培养基中将里氏木霉RutC30培养17小时。使用真空驱动一次性过滤系统(Millipore，Bedford，MA，USA)，通过过滤收集菌丝体，并用去离子水洗涤两次，用1.2M山梨醇洗涤两次。通过将已洗涤的菌丝体悬浮于包含15mg (Novozymes A/S，

Denmark)每ml和0.36单位壳多糖酶(Sigma ChemicalCo.，St.Louis，MO，USA)每ml的20ml 1.2M山梨醇中，并在34℃以90rpm轻轻震荡温育15-25分钟，以产生原生质体。通过在400xg离心7分钟而收集原生质体，并用冰冷的1.2M山梨醇洗涤两次。使用血球计数器为原生质体计数，并重悬于STC中至终浓度为1X10⁸原生质体每ml。过量的原生质体在-80℃储存在Cryo 1℃ Freezing Container(Nalgene，Rochester，NY，USA)中。

将约7μg用Pme I消化的pSMai135加入100μl原生质体溶液并轻轻混合，然后加入260μl PEG缓冲液，混合，并在室温温育30分钟。然后加入STC(3ml)并混合，并将转化溶液涂布在使用构巢曲霉amdS筛选的COVE平板上。将平板在28℃温育5-7天。将转化体在COVE2平板上传代培养并在28℃生长。

将用pSMai135获得的命名为SMA135的六十七个转化体在含乙酰胺的新鲜平板上传代培养，并使其在28℃培养7天形成孢子。

将67个SMA135里氏木霉转化子在包含25ml纤维素酶诱导培养基的125ml带挡板摇瓶中在pH 6.0培养，接种转化子的孢子，并在28℃和200rpm培养7天。使用里氏木霉RutC30作为对照。在第7天移出培养液样品。在微型离心机中在15,700xg将一ml每种培养液离心5分钟，并将上清液转移至新管中。样品在进行酶试验前于4℃保存。使用对硝基苯基-β-D-葡萄吡喃糖苷作为底物测试上清液的β-葡糖苷酶活性，如下所述。

使用在50mM琥珀酸pH 5.0中以1∶10稀释的培养物上清液的25μl等分试样，在溶于50mM琥珀酸pH 5.0中的200μl 0.5mg/ml作为底物的对硝基苯基-β-D-葡萄吡喃糖苷中，在环境温度确定β-葡糖苷酶活性。在15分钟温育后，通过加入100μl 1M Tris-HCl pH 8.0而终止反应，并用分光光度计读取405nm处的吸光度。一单位的β-葡糖苷酶活性对应于在pH 5.0、环境温度，每升每分钟产生1微摩尔对硝基苯(p-nitrophenyl)。使用黑曲霉β-葡糖苷酶(NOVOZYM^TM188，Novozymes A/S，

Denmark)作为酶标准。

很多SMA135转化体产生的β-葡糖苷酶活性是由里氏木霉RutC30分泌的酶活性的几倍高。在筛选的SMA135转化体中，转化体SMA135-04产生最高的β-葡糖苷酶活性。

用系统(Bio-Rad，Hercules，CA，USA)，使用 Tris-HCl(5％解析)凝胶进行SDS-PAGE。将五微升第7天的上清液(见上文)悬浮于2X浓度的Laemmli样品缓冲液(Bio-Rad，Hercules，CA，USA)中，并在存在5％β-巯基乙醇的情况下煮沸3分钟。将上清液样品上样于聚丙烯酰胺凝胶并用1XTris/甘氨酸/SDS作为电泳缓冲液(Bio-Rad，Hercules，CA，USA)进行电泳。将得到的凝胶用BIO- 考马斯染料(Bio-Rad，Hercules，CA，USA)染色。

在通过SDS-PAGE分析的38个里氏木霉SMA135转化体中，26个产生约110kDa的蛋白质，其在作为对照的里氏木霉RutC30中见不到。转化体里氏木霉SMA135-04产生最高水平的β-葡糖苷酶，如通过由SDS-PAGE所见的110kDa条带的丰度(abundance)所证明的。

实施例7：表达载体pSMai140的构建

通过用Nco I消化质粒pSATe111BG41(WO 04/099228)，其携带米曲霉β-葡糖苷酶变体BG41全长编码区(SEQ ID NO：17，其编码SEQ ID NO：18的氨基酸序列)，构建表达载体pSMai140。通过1.0％琼脂糖凝胶电泳，使用TAE缓冲液分离得到的1243bp片段，并使用

凝胶提取试剂盒，根据生产商的说明纯化。

用Nco I消化表达载体pSMai135，并通过1.0％琼脂糖凝胶电泳，使用TAE 缓冲液分离8286bp片段，并使用

凝胶提取试剂盒，根据生产商的说明纯化。然后使用T4 DNA连接酶(Roche，Indianapolis，IN，USA)，根据生产商的规程，将1243bp由Nco I消化的米曲霉β-葡糖苷酶变体BG41片段连接至8286bp载体片段，以产生表达载体pSMai140(图10)。质粒pSMai140包含里氏木霉纤维二糖水解酶I(CEL7A)基因启动子和终止子，其与特异腐质霉内切葡聚糖酶V信号序列和米曲霉β-葡糖苷酶变体成熟编码序列可操作连接。

实施例8：用pSMai140转化里氏木霉RutC30

用Pme I将质粒pSMai140线性化，并转化入如实施例6所述的里氏木霉RutC30菌株。从四次独立的转化实验获得共100个转化体，所有转化体在摇瓶中以纤维素酶诱导培养基培养，并如实施例6所述由转化体的培养基测定β-葡糖苷酶活性。很多里氏木霉SMA140转化体显示出的β-葡糖苷酶活性为里氏木霉RutC30的几倍高。

通过如实施例6所述的SDS-聚丙烯酰胺凝胶电泳和对相同的13份培养物上清液考马斯染色(由此分析酶活)，检测培养基中是否存在米曲霉β-葡糖苷酶变体BG41蛋白质。具有高β-葡糖苷酶活性的全部十三个转化体还以不同的产率表达约110KDa米曲霉β-葡糖苷酶变体BG41。

将如通过β-葡糖苷酶活性试验和SDS-聚丙烯酰胺凝胶电泳评价的，最高β-葡糖苷酶变体表达的转化体，命名为里氏木霉SMA140-43。

实施例9：表达载体pSaMe-F1的构建

用pMJ05为模板和下述所示引物，PCR扩增包含里氏木霉纤维二糖水解酶I基因启动子的209bp和特异腐质霉内切葡聚糖酶V基因的核心区(SEQ IDNO：15的核苷酸1至702，其编码SEQ ID NO：16的氨基酸1至234；WO91/17243)的DNA片段。

引物995103：

5’-cccaagcttagccaagaaca-3’(SEQ ID NO：99)

引物995137：

5’-gggggaggaacgcatgggatctggacggc-3’(SEQ ID NO：100)

扩增反应液(50μl)由下述物质组成：1X Pfx扩增缓冲液，10mM dNTP，50mM MgSO₄，10ng/μl pMJ05，50皮摩尔995103引物，50皮摩尔995137 引物，和2单位Pfx DNA聚合酶。在

5333中温育反应物，程序为94℃ 30秒，55℃ 30秒，和72℃ 60秒的30个循环(3分钟的最后延伸)。

通过1.0％琼脂糖凝胶电泳，使用TAE缓冲液分离反应产物，其中从凝胶切下911bp的产物条带，并使用

凝胶提取试剂盒，根据生产商的说明纯化。

使用如下所示的引物，以pSMai140为模板，PCR扩增包含米曲霉β-葡糖苷酶变体BG41基因的806bp的DNA片段。

引物995133：

5’-gccgtccagatccccatgcgttcctccccc-3’(SEQ ID NO：101)

引物995111：

5’-ccaagcttgttcagagtttc-3’(SEQ ID NO：102)

扩增反应液(50μl)由下述物质组成：1X Pfx扩增缓冲液，10mM dNTP，50mM MgSO₄，100ng pSMai140，50皮摩尔995133引物，50皮摩尔995111引物，和2单位Pfx DNA聚合酶。在

5333中温育反应物，程序为94℃ 30秒，55℃ 30秒，和72℃ 120秒的30个循环(3分钟的最后延伸)。

通过1.0％琼脂糖凝胶电泳，使用TAE缓冲液分离反应产物，其中从凝胶切下806bp的产物条带，并使用

凝胶提取试剂盒，根据生产商的说明纯化。

然后将上述两个PCR片段进行重叠PCR。使用上述引物995103(有义)和引物995111(反义)，将纯化的重叠片段用作扩增模板，通过重叠PCR将包含里氏木霉纤维二糖水解酶I基因启动子的209bp和特异腐质霉内切葡聚糖酶V核心序列的702bp片段精确融合至包含米曲霉β-葡糖苷酶变体BG41编码区部分的806bp片段。

扩增反应液(50μl)由下述物质组成：1X Pfx扩增缓冲液，10mM dNTP，50mM MgSO₄，2.5μl每个片段(20ng/μl)，50皮摩尔995103引物，50皮摩尔995111引物，和2单位高保真Pfx DNA聚合酶。在

5333中温育反应物，程序为95℃ 3分钟的初始变性，然后是30个循环的1分钟变性，60℃ 1分钟退火，和72℃ 3分钟延伸。

通过1.0％琼脂糖凝胶电泳，使用TAE缓冲液分离反应产物，其中从凝胶切下1.7kb的产物条带，并使用

凝胶提取试剂盒，根据生产商的说明纯化。

根据生产商说明，将1.7kb片段连接入

4 Blunt载体(Invitrogen，Carlsbad，CA，USA)。然后根据生产商的快速化学转化方法，将构建体转化入ONE

TOP10化学感受态大肠杆菌细胞(Invitrogen，Carlsbad，CA，USA)。选择菌落并通过质粒分离进行分析，并用HindIII消化以释放1.7kb重叠PCR片段。

用Hind III消化质粒pSMai140以使质粒线性化。使用快速DNA连接试剂盒，按照生产商的说明，将两个经消化的片段合并在连接反应物中，以产生pSaMe-F1(图11)。

用连接产物转化大肠杆菌XL1-Blue亚克隆级感受态细胞(Stratagene，LaJolla，CA，USA)。通过对来自由已转化大肠杆菌纯化的质粒的里氏木霉纤维二糖水解酶I基因启动子、特异腐质霉内切葡聚糖酶V信号序列、特异腐质霉内切葡聚糖酶V核心、特异腐质霉内切葡聚糖酶V信号序列、米曲霉β-葡糖苷酶变体BG41，和里氏木霉纤维二糖水解酶I基因终止子序列进行DNA测序，确认构建体的身份。将包含重组质粒的一个克隆命名为pSaMe-F1。质粒pSaMe-F1包含里氏木霉纤维二糖水解酶I基因启动子和终止子，和与特异腐质霉内切葡聚糖酶V核心多肽直接连接的特异腐质霉内切葡聚糖酶V信号肽序列，它们直接融合至与米曲霉β-葡糖苷酶变体BG41成熟编码序列直接连接的特异腐质霉内切葡聚糖酶V信号肽。米曲霉β-葡糖苷酶变体BG融合蛋白的DNA序列和推定的氨基酸序列分别如SEQ ID NO：103和104所示。

实施例10：用pSaMe-F1转化里氏木霉RutC30

用5X10⁷个里氏木霉RutC30孢子接种包含补加2％葡萄糖和10mM尿苷的25mlYP培养基的摇瓶。在27℃和90rpm过夜培养约16小时后，使用真空驱动一次性过滤系统收集菌丝体，将菌丝体在100ml去离子水中和1.2M山梨醇中各洗涤两次。如实施例6中所述产生原生质体。

将用Pme I线性化的两微克pSaMe-F1 DNA，100μl里氏木霉RutC30原生质体，和50％ PEG(4000)混合并在室温温育30分钟。然后加入3m1 STC并将内容物倒在补加10mM尿苷的COVE平板上。然后在28℃温育平板。到第6天开始出现转化体，并将转化体挑取到COVE2平板，28℃生长6天。回收了22个里氏木霉转化体。

在摇瓶中以纤维素酶诱导培养基培养转化体，并如实施例6所述测定β-葡糖苷酶活性。很多pSaMe-F1转化体产生β-葡糖苷酶活性。一个命名为里氏木霉SaMeF1-9的转化体产生的β-葡糖苷酶量最高，并且活性是表达米曲霉β-葡糖苷酶变体的菌株(实施例9)的两倍。

根据Beguin，1983，Analytical Biochem.131(2)：333-336，使用羧甲基纤维素(CMC)覆盖试验测定内切葡聚糖酶活性。将来自五个培养液样品(具有最高的β-葡糖苷酶活性的那些)的五微克总蛋白质在天然样品缓冲液(Bio-Rad，Hercules，CA，USA)中稀释，并在

8-16％ Tris-HCl凝胶(Bio-Rad，Hercules，CA，USA)上使用10X Tris/甘氨酸电泳缓冲液(Bio-Rad，Hercules，CA，USA)跑胶，然后将凝胶放在包含1％羧甲基纤维素酶(CMC)的平板顶部。在37℃温育1小时后，用0.1％刚果红将凝胶染色20分钟。然后使用1M NaCl将平板脱色，以鉴定指示内切葡聚糖酶活性的澄清区域。可见两个澄清区，上面的区域约110kDa，下面的区域约25kDa。如果两个蛋白质未剪切并且仍为单一的多肽，特异腐质霉内切葡聚糖酶V和米曲霉β-葡糖苷酶变体BG41融合体的预计蛋白质大小为118kDa，单个内切葡聚糖酶V核心域和β-葡糖苷酶的糖基化会导致每个蛋白质迁移到比由一级序列预计的值更高的mw。如果两个蛋白质被剪切，那么特异腐质霉内切葡聚糖酶V核心域的预计大小为24kDa，而米曲霉β-葡糖苷酶变体BG41的预计大小为94kDa。因为有110kDa的澄清区，这一结果说明内切葡聚糖酶和β-葡糖苷酶融合蛋白的群体作为单个的大蛋白质最低限度地保持完整。下面的澄清区最可能代表内源的内切葡聚糖酶活性，并且可能额外由于特异腐质霉内切葡聚糖酶V核心域从米曲霉β-葡糖苷酶部分剪切而产生。

结果证明特异腐质霉内切葡聚糖酶V核心即使与米曲霉β-葡糖苷酶连接也是有活性的。此外，β-葡糖苷酶活性的增加看来是由于与非融合β-葡糖苷酶分泌效率相比，蛋白质分泌增加。通过将米曲霉β-葡糖苷酶变体BG41序列连接至有效分泌的特异腐质霉内切葡聚糖酶V核心，分泌了更多的β-葡糖苷酶。

实施例11：载体pSaMe-FX的构建

通过修饰pSaMe-F1而构建质粒pSaMe-FX。用Bst Z17和Eco RI消化质粒pSaMe-F1，产生包含β-葡糖苷酶变体BG41变体编码序列的1kb片段和包含质粒剩余部分的9.2kb片段。通过1.0％琼脂糖凝胶电泳，使用TAE缓冲液分离片段，其中从凝胶切下9.2kb的产物条带，并使用凝胶提取试剂盒，根据生产商的说明纯化。质粒pSMai135也用Bst Z17和Eco RI消化，产生包含与米曲霉β-葡糖苷酶变体BG41编码序列同源的碱基的1kb片段和包含质粒剩余部分的8.5kb片段。如上分离并纯化1kb片段。

使用快速DNA连接试剂盒，根据生产商的说明将9.2kb和1kb片段合并在连接反应中，产生pSaMe-FX，其除了包含野生型β-葡糖苷酶成熟编码序列而不是变体成熟编码序列之外，与pSaMe-F1相同。

用连接产物转化大肠杆菌

感受态细胞(Stratagene，La Jolla，CA，USA)。通过对来自由已转化大肠杆菌纯化的质粒的里氏木霉纤维二糖水解酶I基因启动子、特异腐质霉内切葡聚糖酶V信号序列、特异腐质霉内切葡聚糖酶V核心序列、特异腐质霉内切葡聚糖酶V信号序列、米曲霉β-葡糖苷酶成熟编码序列，和里氏木霉纤维二糖水解酶I基因终止子序列进行DNA测序，确认构建体的身份。将包含重组质粒的一个克隆命名为pSaMe-FX(图12)。米曲霉β-葡糖苷酶融合蛋白的DNA序列和推定的氨基酸序列分别如SEQ IDNO：105和106所示。

实施例12：木霉属转化体的转化和表达

用Pme I将pSaMe-FX线性化并如实施例10所述转化入里氏木霉RutC30菌株。一次转化获得共63个转化体。在摇瓶中以纤维素酶诱导培养基培养转化体，并如实施例6所述测定β-葡糖苷酶活性。很多pSaMe-FX转化体产生β-葡糖苷酶活性。一个命名为SaMe-FX16的转化体产生的β-葡糖苷酶活性的量是里氏木霉SaMeF1-9(实施例10)的两倍。

实施例13：里氏木霉转化体的分析

通过将特异腐质霉内切葡聚糖酶V核心(包含其本身的天然信号序列)和与特异腐质霉内切葡聚糖酶V信号序列连接的米曲霉β-葡糖苷酶变体BG41成熟编码序列融合，如实施例9所述构建融合蛋白。这个融合构建体和与特异腐质霉内切葡聚糖酶V信号序列连接的米曲霉β-葡糖苷酶变体BG41成熟编码序列相比，分泌的β-葡糖苷酶活性增加两倍。如实施例11所述制备由如下组成的第二个融合构建体：融合于与特异腐质霉内切葡聚糖酶V信号序列连接的米曲霉野生型β-葡糖苷酶编码序列的特异腐质霉内切葡聚糖酶V核心 (包含其本身的信号序列)组成，这进一步改善β-葡糖苷酶活性。用野生型融合体转化的菌株相对于用β-葡糖苷酶变体BG41融合体转化的菌株，具有两倍的分泌的β-葡糖苷酶活性。

实施例14：将β-葡糖苷酶融合蛋白编码序列克隆入米曲霉表达载体

设计两个合成寡核苷酸引物，如下所示，从编码β-葡糖苷酶融合蛋白的pSaMeFX PCR扩增全长开放阅读框。

PCR正向引物：

5’-GGACTGCGCAGCATGCGTTC-3’(SEQ ID NO：107)

PCR反向引物：

5’-AGTTAATTAATTACTGGGCCTTAGGCAGCG-3’(SEQ ID NO：108)

黑体字代表编码序列。正向引物中加下划线的“G”代表引入而产生SphI限制性位点的碱基变化。其余序列包含与pSaMeFX的插入位点相比的序列同一性。反向引物中加下划线的序列代表加入以促进克隆入表达载体pAlLo2(WO 04/099228)的Pac I限制性位点。

在PCR反应中使用上述引物各五十皮摩尔，反应物在50μl终体积中包含50ng pSaMeFX DNA，1X Pfx扩增缓冲液，6μl 10mM dATP、dTTP、dGTP和dCTP的混合物，2.5单位

Pfx DNA聚合酶，和1μl 50mMMgSO₄。使用

5333扩增片段，程序为98℃ 2分钟的1个循环；和96℃ 30秒，61℃ 30秒，和68℃ 3分钟的35个循环。在35个循环后，在68℃温育反应物10分钟，然后在10℃冷却，直至进一步处理。使用TAE缓冲液和0.1μg溴化乙锭每ml，在0.8％ GTG-琼脂糖凝胶(Cambrex Bioproducts One Meadowlands Plaza East Rutherford，NJ，USA)上分离3.3kb PCR反应产物。在DARK READER^TM(Clare Chemical Research，Dolores，CO，USA)辅助下显示DNA，以避免UV诱导的突变。用一次性剃刀片剪切3.3kb DNA条带，并用

-DA旋转杯(Millipore，Billerica，MA，USA)，根据生产商的说明纯化。

将纯化的3.3kb PCR产物克隆入

4Blunt- 载体(Invitrogen，Carlsbad，CA，USA)。将四微升纯化的PCR产物与1μl 2M氯化钠溶液和1μl

载体混合。在室温温育反应物15分钟，然后使用2μl反应物，根据生产商的说明，转化One

TOP10化学感受态大肠杆菌细胞。将83μl 各转化反应物的三份等分试样涂布在三个补加100μg氨苄青霉素每ml的150mm 2X YT平板上，并在37℃过夜温育。

使用八个重组菌落，接种于包含3ml LB培养基的液体培养基中，所述LB培养基补加100μg氨苄青霉素每ml。使用

9600(QIAGEN Inc.，Valencia，CA，USA)由这些培养基制备质粒DNA。通过用Pac I限制性酶消化而分析克隆。用Pac I消化来自每个克隆的质粒DNA，并使用TAE缓冲液通过1.0％琼脂糖凝胶电泳进行分析。所有八个克隆都具有期望的限制性消化模式，并且选择克隆5、6、7和8测序，确认克隆的插入物中没有突变。它们5’和3’末端的序列分析表明所有4个克隆都具有正确的序列。选择克隆5和7进行进一步测序。两个克隆测序的Phred Q数值大于40，确保没有PCR诱导的错误。克隆5和7显示出具有期望的序列，并且选择克隆5重新克隆入pAILo2中。

通过用Sph I消化而将来自克隆5的质粒DNA线性化。然后通过加入1.2μl 10mM dATP、dTTP、dGTP和dCTP的混合物和6单位T4 DNA聚合酶(NewEngland Bioloabs，Inc.，Ipswich，MA，USA)而将线性化的克隆平端化。在12℃温育混合物20分钟，然后通过加入1μl 0.5M EDTA并在75℃加热20分钟使酶失活以终止反应。如上所述通过凝胶电泳和超滤而纯化编码β-葡糖苷酶融合蛋白的3.3kb片段。

通过用Nco I消化而将载体pAILo2线性化。然后通过加入0.5μl 10mMdATP、dTTP、dGTP和dCTP的混合物和一单位DNA聚合酶I而使线性化的载体平端化。在25℃温育混合物15分钟，然后通过加入1μl 0.5M EDTA并在75℃加热15分钟使酶失活而终止反应。然后用Pac I消化载体。如上所述通过凝胶电泳和超滤而纯化平端化的载体。

用快速连接试剂盒将编码β-葡糖苷酶融合蛋白的3.3kb片段克隆入线性化并纯化的pAILo2载体。使用1μl反应样品根据生产商的说明转化大肠杆菌XL10

Gold细胞(Stratagene，La Jolla，CA，USA)。在恢复期(recovery period)后，将来自转化反应物的两份100μl等分试样涂布在两个补加100μg氨苄青霉素每ml的150mm 2X YT平板上，并在37℃过夜温育。随机从选择平板上选择一组八个推定的重组克隆，并使用

9600由每个克隆制备质粒DNA。选择克隆1-4，用pAILo2-特异性引物测序，以确认接合载体/插入物具有正确的序列。克隆3具有完美的载体/插入物接合，并命名为pAILo47(图13)。

为了产生无标记物的表达菌株，进行限制性内切酶消化以将blaA基因与表达构建体其余部分分离，所述blaA基因赋予对抗生素氨苄青霉素的抗性。用Pme I消化三十微克pAILo47。然后通过如上所述琼脂糖电泳纯化消化的DNA。用剃刀片切下包含表达构建体但缺乏blaA基因的6.4kb DNA，并用

凝胶提取试剂盒纯化。

实施例15：特异腐质霉/米曲霉cel45Acore-cel3A融合基因在米曲霉JaL355中的表达

根据Christensen等，1988，Bio/Technology 6：1419-1422的方法制备米曲霉JaL355(WO 00/240694)原生质体。使用十微升纯化的实施例14的表达构建体转化米曲霉JaL355原生质体。米曲霉JaL355的转化得到约90个转化体。将五十个转化体分离到单独的PDA平板，并在34℃温育五天。

用3ml 0.01％

80洗涤四十八块汇合的孢子平板，并使用孢子悬浮液接种125ml玻璃摇瓶中的25ml MDU2BP培养基。在34℃以200rpm恒定震荡温育转化体培养物。5天后，将每个培养物的1ml等分试样以12,000xg离心并收集上清液。将每份上清液的五微升与相等体积的2X上样缓冲液(10％β-巯基乙醇)混合，并载于1.5mm 8％-16％ Tris-甘氨酸SDS-PAGE凝胶上，并用BIO-

考马斯蓝G250蛋白质染料(Bio-Rad，Hercules，CA，USA)染色。培养液的SDS-PAGE谱表明48个转化体中有33个能表达新蛋白质，所述蛋白质的表观分子量与期望的118kDa非常接近。转化体21产量最大，选择它进行进一步的研究。

实施例16：米曲霉JaL355转化体21的单孢子分离

将米曲霉JaL355转化体21孢子涂布在PDA平板上，并在34℃温育5天。用0.5ml 0.01％

80洗涤汇合的孢子平板其中一小部分，以重悬孢子。用0.01％

80将孢子悬浮液的100μl等分试样稀释至终体积5ml。在血球计数器的帮助下，确定孢子浓度，并稀释至终浓度为0.1孢子每微升。将孢子稀释液的200μl等分试样涂布在150mm基本培养基平板并在34℃温育2-3天。从平板切下出现的菌落并转移至PDA平板，并在34℃温育3天。然后将孢子涂布在平板上，并在34℃再温育5天。

用3ml 0.01％

80洗涤汇合的孢子平板，并使用孢子悬浮液接种125ml玻璃摇瓶中的25ml MDU2BP培养基。在34℃以200rpm恒定震荡温育单孢子培养物。5天后，在12,000xg将每种培养物的1ml等分试样离心，并收集它们的上清液。将五微升每份上清液与等体积的2X上样缓冲液(10％β-巯基乙醇)混合，并载于1.5mm 8％-16％ Tris-甘氨酸SDS-PAGE凝胶上，并用BIO-

考马斯蓝G250蛋白质染料染色。培养液的SDS-PAGE谱显示所有8个转化体都能以非常高的水平表达β-葡糖苷酶融合蛋白，并且一种命名为米曲霉JaL355AILo47的培养物能产生最大的产量。

实施例17：pCW087的构建

设计如下所示的两个合成寡核苷酸引物，以从质粒pDZA2-7PCR扩增桔橙嗜热霉GH61A多肽基因(WO 2005/074656)。正向引物具有平端5’末端，并且反向引物在3’末端并入Pac I位点。

正向引物：

5’-ATGTCCTTTTCCAAGATAATTGCTACTG-3’(SEQ ID NO：109)

反向引物：

5’-GCTTAATTAACCAGTATACAGAGGAG-3’(SEQ ID NO：110)

在PCR反应中使用上述引物各五十皮摩尔，反应物在50μl终体积中包含50ng pDZA2-7，1μl 10mM dATP、dTTP、dGTP和dCTP的混合物，5μl10X ACCUTAQ^TM DNA聚合酶缓冲液(Sigma-Aldrich，St.Louis，MO，USA)，和5单位ACCUTAQ^TM DNA聚合酶(Sigma-Aldrich，St.Louis，MO，USA)。使用

5333扩增DNA片段，程序为95℃3分钟的1个循环；94℃ 45秒，55℃ 60秒，和72℃ 1分钟的30个循环。在25个循环后，在72℃温育反应物10分钟，然后在4℃冷却，直至进一步处理。使用Pac I消化桔橙嗜热霉GH61APCR片段的3’末端。根据生产商的说明，使用MINELUTE^TM Reaction Cleanup试剂盒(QIAGEN Inc.，Valencia，CA，USA)纯化消化产物。

用5’末端的平端Nco I位点和3’末端的Pac I位点，将纯化的GH61A片段直接克隆入pSMai155(WO 2005/074647)。用Nco I和Pac I消化质粒pSMai155。然后使用Klenow酶填充进5’凹陷的Nco I位点而使Nco I位点补平。Klenow反应物由20μl pSma155消化反应混合物加1mM dNTP和1μlKlenow酶组成，一起在室温简单温育。根据生产商的说明，使用MINELUTE^TM Reaction Cleanup试剂盒纯化刚刚线性化的pSMai155质粒。这些反应导致产生与新产生的GH61A片段相容的5’平末端和3’Pac I位点。然后使用快速DNA连接试剂盒(Roche，Indianapolis，IN，USA)，按照生产商的说明，将GH61片段克隆入pSMai155表达载体。用连接产物转化大肠杆菌XL1-Blue亚克隆级感受态细胞(Stratagene，La Jolla，CA，USA)。通过将来自纯化自转化的大肠杆菌的质粒的GH61A编码序列进行DNA测序而确认构建体的身份。将包含重组质粒的一个大肠杆菌克隆命名为pCW087-8。

实施例18：pSaMe-Ta61A的构建

通过用Nsi I消化携带amdS选择性标记的质粒pMJ09而构建表达载体pSaMe-Ta61(WO 2005/056772)，其释放了2.7kb的amdS片段。然后使用TAE缓冲液，通过1.0％琼脂糖凝胶电泳分离2.7kb amdS片段，并使用

凝胶提取试剂盒纯化。

用Nsi I消化表达载体pCW087，使用TAE缓冲液，通过1.0％琼脂糖凝胶电泳分离4.7kb片段，并使用凝胶提取试剂盒纯化。然后使用T4 DNA连接酶(Roche，Indianapolis，IN，USA)，根据生产商的规程，将2.7kb amdS片段连接至4.7kb载体片段，产生表达载体pSaMe-Ta61A。质粒pSaMe-Ta61包含里氏木霉纤维二糖水解酶I(CEL7A)基因启动子和终止子，其与桔橙嗜热霉GH61A成熟编码序列可操作地连接。

实施例19：里氏木霉菌株SaMe-MF268的构建

使用共转化将质粒pSaMe-FX和pSaMe-Ta61A导入里氏木霉RutC30。将质粒pSaMe-FX和pSaMe-Ta61A通过PEG介导的转化导入里氏木霉RutC30(Penttila等，1987，见上文)。每个质粒包含构巢曲霉amdS基因，以使转化体能以乙酰胺为唯一氮源而生长。

在27℃和90rpm，在补加2％(w/v)葡萄糖和10mM尿苷的25ml YP培养基中培养里氏木霉RutC30 17小时。使用真空驱动一次性过滤系统过滤而收集菌丝体，并用去离子水洗涤两次，用1.2M山梨醇洗涤两次。通过将已洗涤的菌丝体悬浮于20ml 1.2M山梨醇中而产生原生质体，所述山梨醇包含15mg

(Novozymes A/S， Denmark)每ml和0.36单位壳多糖酶(Sigma Chemical Co.，St.Louis，MO，USA)每ml，并在34℃以90rpm 温和震荡温育15-25分钟。通过在400xg离心7分钟而收集原生质体，并用冷1.2M山梨醇洗涤两次。使用血球计数器为原生质体计数，并将其重悬于STC中至终浓度为1X10⁸原生质体每ml。将过量的原生质体于-80℃保存在Cryo 1℃ Freezing Container(Nalgene，Rochester，NY，USA)中。

用Pme I消化约各4μg质粒pSaMe-FX和pSaMe-Ta61A，以促进去除抗生素抗性标记ampR。在用Pme I消化后，使用TAE缓冲液在1％琼脂糖凝胶上将线性片段跑胶，以分离各个片段。从凝胶切下来自pSaMe-FX的7.5kb片段和来自pSaMe-Ta61A的4.7kb片段，并根据生产商的说明，使用QIAquick凝胶提取试剂盒纯化。这些纯化的片段包含amdS选择性标记盒，里氏木霉cbh1基因启动子和终止子；此外，片段包括特异腐质霉EGV核心/米曲霉BG融合编码序列或桔橙嗜热霉GH61A编码序列。转化中使用的片段不包含抗生素标记，因为这个凝胶纯化步骤去除了ampR片段。然后向100μl原生质体溶液加入纯化片段，并温和混合，之后加入260μl PEG缓冲液，混合，并在室温温育30分钟。然后加入STC(3ml)并混合，并将转化溶液涂布在使用amdS选择的COVE平板上。在28℃温育平板5-7天。将转化体在COVE2平板上传代培养，并在28℃生长。

将超过400个转化体在包含乙酰胺的新鲜平板上传代培养，并在28℃ 7天产生孢子。

在包含25ml纤维素酶诱导培养基的125ml带挡板摇瓶中培养里氏木霉转化体，所述培养基在pH 6.0接种转化体的孢子，并在28℃和200rpm培养5天。将里氏木霉RutC30作为对照。在第5天移出培养液样品。将各一毫升培养液在微型离心机中以15,700xg离心5分钟，并将上清液转移至新管。

使用

Tris-HCl(5％解析)凝胶，用系统进行SDS-PAGE。将五微升第5天的上清液(见上文)悬浮于2X浓度的Laemmli样品缓冲液(Bio-Rad，Hercules，CA，USA)中，并在存在5％β-巯基乙醇的情况下煮沸3分钟。将上清液样品载于聚丙烯酰胺凝胶上，并用1X Tris/甘氨酸/SDS作为电泳缓冲液(Bio-Rad，Hercules，CA，USA)进行电泳。将得到的凝胶用BIO-

考马斯染料染色。然后在PCS水解反应中测试转化体以鉴定产生最佳水解培养液的菌株，所述转化体显示桔橙嗜热霉GH61A多肽和融合蛋白表达，该融合蛋白由与米曲霉β-葡糖苷酶融合的特异腐质霉内切葡聚糖酶V核心(Cel45A)组成，如通过观察SDS-PAGE凝胶上的条带所见。

实施例20：里氏木霉菌株SaMe-MF268的鉴定

在包含25ml纤维素酶诱导培养基的125ml带挡板摇瓶中培养显示桔橙嗜热霉GH61A多肽和米曲霉β-葡糖苷酶融合蛋白的表达的转化体，所述培养基在pH 6.0接种转化体的孢子，并在28℃和200rpm温育5天。

在6000xg离心摇瓶培养液，并使用STERICUP^TM EXPRESS^TM(Millipore，Bedford，MA，USA)在水解前过滤至0.22μm。通过水解PCS并产生糖的能力来测定培养液的活性，所述糖可通过对其还原末端进行化学测定来检测。

在美国能源部国家可再生能源实验室(U.S.Department of Energy NationalRenewable Energy Laboratory(NREL)，Boulder，CO，USA)使用稀硫酸预处理玉米秸秆。使用下述条件预处理：0.048g硫酸/g干燥生物质，在190℃，重量百分比为25％干燥固体，约1分钟。经预处理的玉米秸秆(PCS)中不溶于水的固体包含59.2％纤维素，如通过有限消化PCS以释放葡萄糖和纤维二糖而确定的。在酶水解前，用大体积双去离子水洗涤PCS；水洗PCS的干重为17.73％。

将1kg量的PCS悬浮于约20升双去离子水中并且，在PCS沉淀后，将水倾析。重复这个过程直至洗涤水为pH 4.0以上，此时还原糖低于0.06g每升。对于小体积实验(例如，1ml)，通过100目筛子筛沉淀的浆料，确保能移取。经洗涤的PCS的百分比干重含量通过将样品在105℃烘箱干燥至少24小时(至恒重)并与湿重相比而确定。

在由ALPS 300^TM自动实验室封板仪(ABgene Inc.，Rochester，NY，USA)加热密封的96孔深孔板中，以1ml体积进行PCS水解。在50mM乙酸钠pH 5.0中的PCS浓度为10g每升。在50℃进行PCS水解，除了在所述取样过程中之外无其它搅拌。每个反应重复进行三次。通过对-羟基苯甲酸酰肼(PHBAH)试剂，如下所述分析释放的还原糖。

将体积为0.8ml的PCS(12.5g每升水中)移取到96孔深孔板的每个孔中，然后加入0.10ml 0.5M乙酸钠pH 5.0，并且然后加入0.10ml稀释的酶溶液以启动反应，最终反应体积为10ml，PCS浓度为10g每升。将板密封。通过在水解开始时和每次取样时间点前倒置深孔板而使反应混合物混合。在每个取样时间点，将板混合，然后在2000rpm将深孔板离心(Sorvall RT7，配备RTH-250转子)10分钟，然后移出20μl水解物(上清液)，并加入96孔微孔板中的180μl 0.4％ NaOH中。必要时，可将这个终止溶液进一步稀释至还原糖的正确范围。通过对-羟基苯甲酸酰肼试剂(PHBAH，Sigma，4-羟基苯甲酰肼)分析释放的还原糖：将50μl PHBAH试剂(1.5％)与100μl样品在V型底96孔THERMOWELL^TM板(Costar 6511)中混合，在板加热块上在95℃温育10分钟，然后向每个孔加入50μl双去离子水，混合并将100μl转移至另一块平底96孔板(Costar 9017)，并在410nm处读取吸收值。使用葡萄糖校准曲线在相同条件下计算还原糖。纤维素转化成还原糖的百分比转化率计算为：

％转化率＝还原糖(mg/ml)/(加入的纤维素(mg/ml)x1.11)

因子1.11修正将纤维素水解成葡萄糖中的重量增加。

在1ml PCS水解测试后，将最好的候选菌株在2升发酵罐中生长，重复两次(in duplicate)。

摇瓶培养基由每升20g葡萄糖，10g玉米浆固体，1.45g(NH₄)₂SO₄，2.08g KH₂PO₄，0.36g CaCl₂，0.42g MgSO₄·7H₂O，和0.42ml痕量金属溶液组成。痕量金属溶液由每升216g FeCl₃·6H₂O，58g ZnSO₄·7H₂O，27g MnSO₄·H₂O，10g CuSO₄·5H₂O，2.4g H₃BO₃，和336g柠檬酸组成。

向500ml摇瓶中加入十毫升摇瓶培养基。用来自固体平板培养物的两块琼脂块接种摇瓶，并在28℃在定轨摇床上以200rpm温育48小时。使用五十毫升摇瓶培养液接种3升发酵容器。

发酵分批培养基由每升30g纤维素，4g葡萄糖，10g玉米浆固体，3.8g(NH₄)₂SO₄，2.8g KH₂PO₄，2.64g CaCl₂，1.63g MgSO₄·7H₂O，1.8ml消泡剂，和0.66ml痕量金属溶液组成。痕量金属溶液由每升216g FeCl₃·6H₂O，58gZnSO₄·7H₂O，27g MnSO₄·H₂O，10g CuSO₄·5H₂O，2.4g H₃BO₃，和336g柠檬酸组成。发酵补料培养基由葡萄糖和纤维素组成。

向3升发酵罐中加入共1.8升的发酵批式培养基。以0至4g/l/小时的速率在165小时的期间内补加发酵补料培养基。发酵容器保持在28℃的温度，并且pH控制在4.75+/-0.1的设置点。以1vvm的速率向容器加入空气，并通过Ruston叶轮在1100至1300rpm旋转而搅拌培养液。在发酵结束时，从容器收获全部培养液，并以3000rpm xg离心去除生物质。将上清液无菌过滤并在35至40℃保存。

确定总蛋白质浓度，并如下所述在50g PCS水解反应中重复测试培养液。在每次实验前，由保存于4℃的储备酶溶液新鲜制备酶稀释液。

根据NREL实验室分析规程#008，使用50g的总反应物质量，使用带螺旋盖的125ml Erlenmeyer三角瓶(VWR，West Chester，PA，USA)进行PCS的水解。在这个规程中，使用不同蛋白质加载量(用mg蛋白质每克纤维素表示)的2升发酵培养液样品进行PCS(在50mM乙酸钠pH 5.0缓冲水溶液中约11.4的PCS和6.8％的纤维素)的水解。在50℃使用

4080培养箱(New BrunswickScientific，Edison，NJ，USA)以150rpm的定轨振荡进行PCS水解能力的测试。在水解过程中，在72、120和168小时取等分试样并离心，并且使用

HV 0.45μm膜(Millipore，Billerica，MA，USA)通过

RT7板离心机(Thermo Fisher Scientific，Waltham，MA，USA)在2000rpm离心10分钟过滤上清液。在不立即使用时，将过滤的含糖等分试样在-20℃冷冻。通过0.005M H₂SO₄以0.4ml每分钟的流速在65℃从4.6x250mm

HPX-87H柱(Bio-Rad，Hercules，CA，USA)洗脱，并使用以纯糖样品校准的

1100 HPLC(Agilent Technologies，SantaClara，CA，USA)，由折射系数检测通过积分葡萄糖和纤维二糖信号而定量后，测量稀释于0.005M H₂SO₄的样品的糖浓度。所得的等同物用于计算每个反应的纤维素转化的百分数。

使用下述等式计算纤维素转化成葡萄糖与纤维二糖的程度(转化率，％)：

转化率_(％)＝(葡萄糖+纤维二糖x1.053)_(mg/ml)x100x162/(纤维素_(mg/ml)x180)＝(葡萄糖+纤维二糖x1.053)_(mg/ml)x100/(纤维素_(mg/ml)x1.111)

在这个等式中，因子1.111反映在将纤维素转化成葡萄糖的过程中的重量增加，而因子1.053反映将纤维二糖转化成葡萄糖的过程中的重量增加。

在上述50g三角瓶实验中PCS水解反应的结果如表1所示。将产生最佳性能的培养液的一株菌命名为里氏木霉SaMe-MF268。

表1：在168小时的时间点转化为糖的百分比

实施例21：载体pSaMe-FH的构建

通过用Bsp 120I和Pac I消化质粒pSMai155(WO 2005/074647)和质粒pSaMe-FX(实施例11)而构建表达载体pSaMe-FH(图14)。然后使用TAE缓冲液，通过1.0％琼脂糖凝胶电泳分离来自pSMai155的5.5kb片段和来自pSaMeFX的3.9kb片段，并使用

凝胶提取试剂盒纯化。然后使用T4 DNA连接酶，根据生产商的规程连接两个片段。用连接产物转化大肠杆菌

感受态细胞。通过对来自纯化自已转化大肠杆菌的质粒的里氏木霉纤维二糖水解酶I基因启动子、特异腐质霉内切葡聚糖酶V信号序列、特异腐质霉内切葡聚糖酶V核心序列、特异腐质霉内切葡聚糖酶V信号序列、米曲霉β-葡糖苷酶成熟编码序列，和里氏木霉纤维二糖水解酶I基因终止子序列进行DNA测序而确认构建体的身份。将一个包含重组质粒的克隆命名为pSaMe-FH。质粒pSaMe-FH包含里氏木霉纤维二糖水解酶I(CEL7A)基因启动子和终止子，其与特异腐质霉Cel45A核心/米曲霉β-葡糖苷酶的基因融合体可操作地连接。质粒pSaMe-FH与pSaMe-FX相同，除了amdS选择性标记已去除，并用潮霉素抗性选择性标记代替。

实施例22：纤维素酶产生增加并且降解经预处理的玉米秸秆(PCS)能力增强的里氏木霉SMA135-04的突变体的分离

使用PCS(实施例20)作为纤维素底物，进行纤维素分解酶实验并用于选择平板。在实验前，用大体积蒸馏去离子水洗涤PCS，直至过滤液pH大于pH 4.0。此外，使用100MF金属过滤器筛PCS以去除颗粒。将已洗涤和过滤的PCS重悬于蒸馏水中，至浓度为60mg/ml的悬浮液，并在4℃保存。

用N-甲基-N-硝基-N-硝基胍(NTG)(Sigma Chemical Co.，St.Louis，MO，USA)对里氏木霉菌株SMA135-04(实施例6)进行诱变处理，NTG是一种主要诱导碱基取代和某些缺失的化学诱变剂(Rowlands，1984，Enzyme Microb.Technol.6：3-10)。完成了恒定处理时间和不同NTG剂量，及恒定NTG浓度和不同处理时间的存活曲线，得到10％的存活水平。为了获得这个存活率，用0.2mg/ml NTG在37℃及温和旋转下处理分生孢子悬浮液20分钟。每次实验以不用NTG处理分生孢子为对照进行，并且将其作为突变体相对于未诱变培养物的竞争性生长的对照。

在NTG处理后进行突变体的初选。将诱变后存活的共8x10⁶个分生孢子在包含0.5％胰蛋白胨、0.1％ Triton X-100和1.5g琼脂的30ml孟德尔培养基中混合。然后向深板(直径150mm，深25mm；Corning Inc，NY，USA)加入这个悬浮液，而琼脂使其在室温硬化。在硬化琼脂后，加入包含0.5％胰蛋白胨、0.1％ Triton X-100、1.5％琼脂和1.0％ PCS的200ml孟德尔培养基。在硬化琼脂后在28℃温育板。在温育3-5天后，使用在未处理对照菌株之前渗透过PCS选择层的700个菌落进行二次选择。

对于二次筛选，向包含25ml纤维素酶诱导培养基的125ml摇瓶加入来自每个分离物的三满环分生孢子，并在28℃和200rpm温育5天，以诱导纤维素酶的表达和分泌。在微型离心机中将每份培养液中的一毫升以400xg离心5分钟，并测试上清液的PCS水解活性和总蛋白质收率。

通过将摇瓶培养液样品以1∶20在50mM乙酸钠pH 5.0中稀释而进行“机械化(robotic)”PCS水解试验。在稀释前，以400μl样品每g PCS向实验板(96孔平底板)加入稀释样品。使用 FX(Beckman Coulter，Fullerton，CA)，以10g PCS每升加入PCS，然后加入50mM乙酸钠pH 5.0至总体积180μl。在潮湿的盒子中在30℃温育实验板5天，250rpm震荡。为了增加实验的统计精确性，每个样品进行6次重复。然而，对于1∶20样品稀释液使用2个重复。5天温育后，使用PHBAH实验测定水解PCS样品中还原糖(RS)的浓度，所述方法经修改并适于96孔微孔板形式。使用ORCA^TM Robot(Beckman Coulter，Fullerton，CA，USA)，将生长板传递至

FX，并从实验板移出9μl培养液样品并分装于96孔V型底板(MJ Research，Waltham，MA，USA)中。通过加入135μl 0.533％ PHBAH于2％氢氧化钠中的溶液而启动反应。在

Thermal Cycler(MJ Research，Waltham，MA，USA)上在95℃将每块实验板加热10分钟，并冷却至室温。温育后，用160μl去离子水稀释40μl反应样品，并转移至96孔平底板中。然后，使用

250(Molecular Devices，Sunnyvale，CA)测定样品在405nm处的吸光度。使用由六个葡萄糖标准物(0.000、0.040、0.800、0.120、0.165和0.200mg/ml去离子水)产生的标准曲线将A₄₀₅值换算成葡萄糖当量，对所述标准品进行与样品类似的处理。标准曲线的平均关联系数大于0.98。使用实施例20中所述等式计算纤维素转化成还原糖的程度(RS得率，％)。

使用二金鸡纳酸(bicinchoninic acid，BCA)实验测定总蛋白质产率。用水 1∶8稀释样品，使浓度在合适的范围中。将白蛋白标准(BSA)稀释为不同水平，在水中的浓度由2.0mg/ml浓度开始，到0.25mg/ml结束。使用

FX，将包括标准的共20μl每种稀释液转移至96孔平底板中。向每个孔加入两百微升BCA底物溶液(BCA蛋白质实验试剂盒，Pierce，Rockford，IL，USA)，然后在37℃温育45分钟。一旦温育完成，使用 250获得96孔板的562nm光密度。用Microsoft Excel(Microsoft Corporation，Redmond，WA)，通过由产生的标准曲线外推而确定样品浓度。

在挑选的初步分离物中，二十个产生的培养液与来自菌株SMA135-04的培养液相比，显示PCS的水解活性改善。这些分离物产生的纤维素分解培养液相对于亲本菌株，产生的还原糖水平高5-15％。一些分离物，例如，SMai-M104显示出纤维素PCS每体积培养液的水解性能增加，此外分泌总蛋白质的水平更高。

通过评价发酵产生的培养液的纤维素酶性能，选择性能最佳的里氏木霉突变体菌株SMai-M104。发酵如实施例20中所述进行7天。在带螺旋盖的125-ml Erlenmeyer三角瓶(VWR，West Chester，PA，USA)中在50g PCS水解中测试发酵样品。反应条件包括：6.7％的纤维素加载；6和12mg/g纤维素的酶加载；总反应物50g；50℃和pH 5.0。开始实验，将每个摇瓶和盖称重，并记录向摇瓶加入的PCS的期望量和总重量。向每个摇瓶加入十毫升蒸馏水，然后将所有摇瓶在121℃高压灭菌30分钟。高压灭菌后，将摇瓶冷却至室温。为了使每个摇瓶的总重量达到50克，加入5ml 0.5M乙酸钠pH 5.0，然后加入纤维素酶培养液，以实现期望的加载，然后加入适量的蒸馏水，以达到理想的最终50g重量。然后将摇瓶放在50℃和130rpm的温育摇床(NewBrunswick Scientific，Edison，NJ，USA)中。在第3、5和7天，从每个摇瓶取1ml样品，并加入到96孔深孔板(总体积2.0ml)中。然后使用

RT7板离心机(Thermo Fisher Scientific，Waltham，MA，USA)在3000rpm将96孔板离心15分钟。离心后，将200μl上清液转移至96孔0.45μm孔尺寸过滤板(Millipore，Bedford，MA，USA)，并施加真空以收集滤液。然后用0.4％ NaOH将滤液稀释至还原糖的正确范围，并使用PHBAH试剂(1.5％)如下测定：向V型底96孔板加入50μl PHBAH试剂和100μl样品，并在95℃温育10分钟。为了完成反应，向每个孔加入50μl蒸馏水，并且在将样品混合后，将100μl混合物转移至另一个平底96孔板中，以获得A410处的分光光度读数。使用葡萄糖校准曲线计算还原糖量，并如下计算消化百分比：

％消化＝还原糖(mg/ml)/(加入的纤维素(mg/ml)×1.11)，其中因子1.11反映将纤维素转化成葡萄糖的过程中的重量增加。

PCS水解实验结果表明，一个命名为SMai-M104的突变体，性能略优于(增加约5％葡萄糖)亲本菌株SMA135-04，特别是在高加载时(12mg/g纤维素)。

实施例23：里氏木霉菌株SMai26-30的构建

使用共转化将质粒pCW085(WO 2006/074435)、pSaMe-FX和pCW087(实施例17)导入里氏木霉SMai-M104。质粒pCW085是土生梭孢霉NRRL 8126纤维二糖水解酶(CEL6A)的表达载体。将所有三个质粒通过PEG介导的转化(Penttila等，1987，见上文)导入里氏木霉SMai-M104。每个质粒包含大肠杆菌潮霉素B磷酸转移酶(hph)基因，使转化体能在潮霉素B上生长。

在27℃和90rpm，在补加2％(w/v)葡萄糖和10mM尿苷的25ml YP培养基中培养里氏木霉SMai-M104 17小时。使用真空驱动一次性过滤系统过滤而收集菌丝体，并用去离子水洗涤两次，用1.2M山梨醇洗涤两次。通过将已洗涤的菌丝体悬浮于20ml 1.2M山梨醇中而产生原生质体，所述山梨醇包含15mg

每ml和0.36单位壳多糖酶每ml，并在34℃以90rpm温和震荡而温育15-25分钟。通过在400xg离心7分钟而收集原生质体，并用冷1.2M山梨醇洗涤两次。使用血球计数器为原生质体计数，并重悬于STC中至终浓度为1X10⁸原生质体每ml。将过量的原生质体于-80℃保存在Cryo1℃ Freezing Container中。

用Pme I消化约各10μg质粒pCW085、pSaMe-FX和pCW087，并将其加入100μl原生质体溶液并温和混合，然后加入260μl PEG缓冲液，混合，并在室温温育30分钟。然后加入STC(3ml)并混合，并将转化溶液涂布在包含1M蔗糖(sucose)和10mM尿苷的PDA上。在28℃温育平板16小时，然后加入包含潮霉素B(30μg/ml终浓度)的琼脂覆盖物并继续温育4-6天。将八十个转化体在PDA平板上传代培养，并在28℃生长。

在包含25ml纤维素酶诱导培养基的125ml带挡板摇瓶中培养里氏木霉转化体，所述培养基在pH 6.0接种转化体的孢子，并在28℃和200rpm培养5天。使用里氏木霉SMai-M104作为对照。在第5天移出培养液样品。将各一毫升培养液在微型离心机中以15,700xg离心5分钟，并将上清液转移至新管。

使用

Tris-HCl(5％解析)凝胶，用

系统进行SDS-PAGE。将五微升第5天的上清液(见上文)悬浮于2X浓度的Laemmli样品缓冲液中，并在存在5％β-巯基乙醇的情况下煮沸3分钟。将上清液样品加载于聚丙烯酰胺凝胶上，并用1X Tris/甘氨酸/SDS作为电泳缓冲液进行电泳。将得到的凝胶用BIO- 考马斯染料染色。然后如实施例20所述在PCS水解反应中测试转化体，以鉴定产生最优水解培养液的菌株，所述转化体显示桔橙嗜热霉GH61A多肽和融合蛋白的表达，所述融合蛋白由与米曲霉β-葡糖苷酶和土生梭孢霉纤维二糖水解酶II融合的特异腐质霉内切葡聚糖酶V核心(Cel45A)组成，如通过观察SDS-PAGE凝胶上的条带所见。

如实施例20所述及如下修改，进行里氏木霉菌株SMai26-30培养液的PCS水解。这批PCS不同于实施例20中使用的，但是在相似条件下制备。在此规程中，使用里氏木霉菌株SMai26-30发酵培养液的不同蛋白质加载量(用mg蛋白质每克纤维素表示)进行PCS(在50mM乙酸钠pH 5.0缓冲水溶液中约11.3％ PCS和6.7％纤维素)的水解。在水解过程中在48、120和168小时取等分试样。在上述50g摇瓶实验中PCS水解反应的结果如表2所示。

表2：在48、72和168小时时间点的百分比转化率

生物材料的保藏

依据布达佩斯条约的条款，下述的生物材料已经保藏于农业研究机构专利培养物保藏中心(Agricultural Research Service Patent Culture Collection)，北区研究中心(Northern Regional Research Center)，1815 University Street，Peoria，Illinois，61604，并给出了下述的登录号：

保藏物登录号保藏日期

大肠杆菌菌株pEJG120 NRRL B-30699 2003年12月19日

大肠杆菌菌株pTter61C NRRL B-30813 2005年1月21日

大肠杆菌菌株pTter61D NRRL B-30812 2005年1月21日

大肠杆菌菌株pTter61E NRRL B-30814 2005年1月21日

大肠杆菌菌株pTter61G NRRL B-30811 2005年1月21日

大肠杆菌菌株pDZA2-7 NRRL B-30704 2004年1月30日

大肠杆菌菌株pTr3337 NRRL B-30878 2005年9月20日

大肠杆菌TOP10(pEJG113) NRRL B-30695 2003年10月17日

大肠杆菌TOP10 pKKAB NRRL B-30860 2005年7月8日

NN049573 DSM 14240 2001年4月19日

所述菌株于下述条件下保藏：确保在本专利申请未决期间，由专利与商标委员依据37 C.F.R.§1.14和35U.S.C.§122授权的人能够获得该培养物。该保藏物为所保藏菌株的基本上纯的培养物。在提交了该申请的副本，或其后续文本的国家，依据该外国专利法律的要求，可以获得该保藏物。然而，应当理解，保藏物的获得并不构成对实施本发明的许可，实施本发明是对政府行为所授予的专利权的侵犯。

本发明中所描述的和要求的并非是要用本文所公开的具体方面来限定范围，因为这些方面意欲作为本发明几个方面的说明。任何等价的方面意欲在本发明的范围之内。事实上，从前面的说明中，对于本领域技术人员来说，除本文所显示和描述的之外，本发明的多种修改是显而易见的。这些修改也意欲落入所附的权利要求的范围之内。在冲突的情况下，将以包括定义部分的本公开为准。

本文引用了许多参考文献，将其公开的全部内容通过提述并入。

序列表

<110>诺维信股份有限公司(Novozymes，Inc.)

<120>用于降解纤维素材料的组合物

<130>11250.204-WO

<150>60/941,251

<151>2007-05-31

<160>110

<170>PatentIn version 3.5

<210>1

<211>1846

<212>DNA

<213>土生梭孢霉(Thielavia terrestris)

<400>1

aattgaagga gggagtggcg gagtggccac caagtcaggc ggctgtcaac taaccaagga 60

tgggaacagt tcggctcgcc ttgcccgagg gcagcgttcc ctgatgggga cgaaccatgg 120

gactggggtc agctgctgta taaaagttca aatcgatgat ctctcagatg gcgctgctgg 180

ggtgttctgc gcttttccat cctcgcaacc tggtatccca ctagtccagc gttcggcacc 240

atgaagtcgt tcaccattgc cgccttggca gccctatggg cccaggaggc cgccgcccac 300

gcgaccttcc aggacctctg gattgatgga gtcgactacg gctcgcaatg tgtccgcctc 360

ccggcgtcca actcccccgt caccaatgtt gcgtccgacg atatccgatg caatgtcggc 420

acctcgaggc ccaccgtcaa gtgcccggtc aaggccggct ccacggtcac gatcgagatg 480

caccaggttc gcacgcctct ctgcgtaggc cccccagcta ctatatggca ctaacacgac 540

ctccagcaac ctggcgaccg gtcttgcgcc aacgaggcta tcggcggcga ccactacggc 600

cccgtaatgg tgtacatgtc caaggtcgat gacgcggtga cagccgacgg ttcatcgggc 660

tggttcaagg tgttccagga cagctgggcc aagaacccgt cgggttcgac gggcgacgac 720

gactactggg gcaccaagga cctcaactcg tgctgcggca agatgaacgt caagatcccc 780

gaagacatcg agccgggcga ctacctgctc cgcgccgagg ttatcgcgct gcacgtggcc 840

gccagctcgg gcggcgcgca gttctacatg tcctgctacc agctgaccgt gacgggctcc 900

ggcagcgcca ccccctcgac cgtgaatttc ccgggcgcct actcggccag cgacccgggc 960

atcctgatca acatccacgc gcccatgtcg acctacgtcg tcccgggccc gaccgtgtac 1020

gcgggcggct cgaccaagtc ggctggcagc tcctgctccg gctgcgaggc gacctgcacg 1080

gttggttccg gccccagcgc gacactgacg cagcccacct ccaccgcgac cgcgacctcc 1140

gcccctggcg gcggcggctc cggctgcacg gcggccaagt accagcagtg cggcggcacc 1200

ggctacactg ggtgcaccac ctgcgctgta agttccctcg tgatatgcag cggaacaccg 1260

tctggactgt tttgctaact cgcgtcgtag tccgggtcta cctgcagcgc cgtctcgcct 1320

ccgtactact cgcagtgcct ctaagccggg agcgcttgct cagcgggctg ctgtgaagga 1380

gctccatgtc cccatgccgc catggccgga gtaccgggct gagcgcccaa ttcttgtata 1440

tagttgagtt ttcccaatca tgaatacata tgcatctgca tggactgttg cgtcgtcagt 1500

ctacatcctt tgctccactg aactgtgaga ccccatgtca tccggaccat tcgatcggtg 1560

ctcgctctac catctcggtt gatgggtctg ggcttgagag tcactggcac gtcctcggcg 1620

gtaatgaaat gtggaggaaa gtgtgagctg tctgacgcac tcggcgctga tgagacgttg 1680

agcgcggccc acactggtgt tctgtaagcc agcacacaaa agaatactcc aggatggccc 1740

atagcggcaa atatacagta tcagggatgc aaaaagtgca aaagtaaggg gctcaatcgg 1800

ggatcgaacc cgagacctcg cacatgactt atttcaagtc aggggt 1846

<210>2

<211>326

<212>PRT

<213>土生梭孢霉(Thielavia terrestris)

<400>2

Met Lys Ser Phe Thr Ile Ala Ala Leu Ala Ala Leu Trp Ala Gln Glu

1 5 10 15

Ala Ala Ala His Ala Thr Phe Gln Asp Leu Trp Ile Asp Gly Val Asp

20 25 30

Tyr Gly Ser Gln Cys Val Arg Leu Pro Ala Ser Asn Ser Pro Val Thr

35 40 45

Asn Val Ala Ser Asp Asp Ile Arg Cys Asn Val Gly Thr Ser Arg Pro

50 55 60

Thr Val Lys Cys Pro Val Lys Ala Gly Ser Thr Val Thr Ile Glu Met

65 70 75 80

His Gln Gln Pro Gly Asp Arg Ser Cys Ala Asn Glu Ala Ile Gly Gly

85 90 95

Asp His Tyr Gly Pro Val Met Val Tyr Met Ser Lys Val Asp Asp Ala

100 105 110

Val Thr Ala Asp Gly Ser Ser Gly Trp Phe Lys Val Phe Gln Asp Ser

115 120 125

Trp Ala Lys Asn Pro Ser Gly Ser Thr Gly Asp Asp Asp Tyr Trp Gly

130 135 140

Thr Lys Asp Leu Asn Ser Cys Cys Gly Lys Met Asn Val Lys Ile Pro

145 150 155 160

Glu Asp Ile Glu Pro Gly Asp Tyr Leu Leu Arg Ala Glu Val Ile Ala

165 170 175

Leu His Val Ala Ala Ser Ser Gly Gly Ala Gln Phe Tyr Met Ser Cys

180 185 190

Tyr Gln Leu Thr Val Thr Gly Ser Gly Ser Ala Thr Pro Ser Thr Val

195 200 205

Asn Phe Pro Gly Ala Tyr Ser Ala Ser Asp Pro Gly Ile Leu Ile Asn

210 215 220

Ile His Ala Pro Met Ser Thr Tyr Val Val Pro Gly Pro Thr Val Tyr

225 230 235 240

Ala Gly Gly Ser Thr Lys Ser Ala Gly Ser Ser Cys Ser Gly Cys Glu

245 250 255

Ala Thr Cys Thr Val Gly Ser Gly Pro Ser Ala Thr Leu Thr Gln Pro

260 265 270

Thr Ser Thr Ala Thr Ala Thr Ser Ala Pro Gly Gly Gly Gly Ser Gly

275 280 285

Cys Thr Ala Ala Lys Tyr Gln Gln Cys Gly Gly Thr Gly Tyr Thr Gly

290 295 300

Cys Thr Thr Cys Ala Ser Gly Ser Thr Cys Ser Ala Val Ser Pro Pro

305 310 315 320

Tyr Tyr Ser Gln Cys Leu

325

<210>3

<211>880

<212>DNA

<213>土生梭孢霉(Thielavia terrestris)

<400>3

accccgggat cactgcccct aggaaccagc acacctcggt ccaatcatgc ggttcgacgc 60

cctctccgcc ctcgctcttg cgccgcttgt ggctggccac ggcgccgtga ccagctacat 120

catcggcggc aaaacctatc ccggctacga gggcttctcg cctgcctcga gcccgccgac 180

gatccagtac cagtggcccg actacaaccc gaccctgagc gtgaccgacc cgaagatgcg 240

ctgcaacggc ggcacctcgg cagagctcag cgcgcccgtc caggccggcg agaacgtgac 300

ggccgtctgg aagcagtgga cccaccagca aggccccgtc atggtctgga tgttcaagtg 360

ccccggcgac ttctcgtcgt gccacggcga cggcaagggc tggttcaaga tcgaccagct 420

gggcctgtgg ggcaacaacc tcaactcgaa caactggggc accgcgatcg tctacaagac 480

cctccagtgg agcaacccga tccccaagaa cctcgcgccg ggcaactacc tcatccgcca 540

cgagctgctc gccctgcacc aggccaacac gccgcagttc tacgccgagt gcgcccagct 600

ggtcgtctcc ggcagcggct ccgccctgcc cccgtccgac tacctctaca gcatccccgt 660

ctacgcgccc cagaacgacc ccggcatcac cgtgagtggg cttccgttcc gcggcgagct 720

ctgtggaaat cttgctgacg atgggctagg ttgacatcta caacggcggg cttacctcct 780

acaccccgcc cggcggcccc gtctggtctg gcttcgagtt ttaggcgcat tgagtcgggg 840

gctacgaggg gaaggcatct gttcgcatga gcgtgggtac 880

<210>4

<211>478

<212>PRT

<213>土生梭孢霉(Thielavia terrestris)

<400>4

Met Arg Phe Asp Ala Leu Ser Ala Leu Ala Leu Ala Pro Leu Val Ala

1 5 10 15

Gly His Gly Ala Val Thr Ser Tyr Ile Ile Gly Gly Lys Thr Tyr Pro

20 25 30

Gly Tyr Glu Gly Phe Ser Pro Ala Ser Ser Pro Pro Thr Ile Gln Tyr

35 40 45

Gln Trp Pro Asp Tyr Asn Pro Thr Leu Ser Val Thr Asp Pro Lys Met

50 55 60

Arg Cys Asn Gly Gly Thr Ser Ala Glu Leu Ser Ala Pro Val Gln Ala

65 70 75 80

Gly Glu Asn Val Thr Ala Val Trp Lys Gln Trp Thr His Gln Gln Gly

85 90 95

Pro Val Met Val Trp Met Phe Lys Cys Pro Gly Asp Phe Ser Ser Ser

100 105 110

His Gly Asp Gly Lys Gly Trp Phe Lys Ile Asp Gln Leu Gly Leu Trp

115 120 125

Gly Asn Asn Leu Asn Ser Asn Asn Trp Gly Thr Ala Ile Val Tyr Lys

130 135 140

Thr Leu Gln Trp Ser Asn Pro Ile Pro Lys Asn Leu Ala Pro Gly Asn

145 150 155 160

Tyr Leu Ile Arg His Glu Leu Leu Ala Leu His Gln Ala Asn Thr Pro

165 170 175

Gln Phe Tyr Ala Glu Cys Ala Gln Leu Val Val Ser Gly Ser Gly Ser

180 185 190

Ala Leu Pro Pro Ser Asp Tyr Leu Tyr Ser Ile Pro Val Tyr Ala Pro

195 200 205

Gln Asn Asp Pro Gly Ile Thr Val Asp Ile Tyr Asn Gly Gly Leu Thr

210 215 220

Ser Tyr Thr Pro Pro Gly Gly Pro Val Trp Ser Gly Phe Glu Phe Met

225 230 235 240

Arg Phe Asp Ala Leu Ser Ala Leu Ala Leu Ala Pro Leu Val Ala Gly

245 250 255

His Gly Ala Val Thr Ser Tyr Ile Ile Gly Gly Lys Thr Tyr Pro Gly

260 265 270

Tyr Glu Gly Phe Ser Pro Ala Ser Ser Pro Pro Thr Ile Gln Tyr Gln

275 280 285

Trp Pro Asp Tyr Asn Pro Thr Leu Ser Val Thr Asp Pro Lys Met Arg

290 295 300

Cys Asn Gly Gly Thr Ser Ala Glu Leu Ser Ala Pro Val Gln Ala Gly

305 310 315 320

Glu Asn Val Thr Ala Val Trp Lys Gln Trp Thr His Gln Gln Gly Pro

325 330 335

Val Met Val Trp Met Phe Lys Cys Pro Gly Asp Phe Ser Ser Ser His

340 345 350

Gly Asp Gly Lys Gly Trp Phe Lys Ile Asp Gln Leu Gly Leu Trp Gly

355 360 365

Asn Asn Leu Asn Ser Asn Asn Trp Gly Thr Ala Ile Val Tyr Lys Thr

370 375 380

Leu Gln Trp Ser Asn Pro Ile Pro Lys Asn Leu Ala Pro Gly Asn Tyr

385 390 395 400

Leu Ile Arg His Glu Leu Leu Ala Leu His Gln Ala Asn Thr Pro Gln

405 410 415

Phe Tyr Ala Glu Cys Ala Gln Leu Val Val Ser Gly Ser Gly Ser Ala

420 425 430

Leu Pro Pro Ser Asp Tyr Leu Tyr Ser Ile Pro Val Tyr Ala Pro Gln

435 440 445

Asn Asp Pro Gly Ile Thr Val Asp Ile Tyr Asn Gly Gly Leu Thr Ser

450 455 460

Tyr Thr Pro Pro Gly Gly Pro Val Trp Ser Gly Phe Glu Phe

465 470 475

<210>5

<211>1000

<212>DNA

<213>土生梭孢霉(Thielavia terrestris)

<400>5

ctcctgttcc tgggccaccg cttgttgcct gcactattgg tagagttggt ctattgctag 60

agttggccat gcttctcaca tcagtcctcg gctcggctgc cctgcttgct agcggcgctg 120

cggcacacgg cgccgtgacc agctacatca tcgccggcaa gaattacccg gggtgggtag 180

ctgattattg agggcgcatt caaggttcat accggtgtgc atggctgaca accggctggc 240

agataccaag gcttttctcc tgcgaactcg ccgaacgtca tccaatggca atggcatgac 300

tacaaccccg tcttgtcgtg cagcgactcg aagcttcgct gcaacggcgg cacgtcggcc 360

accctgaacg ccacggccgc accgggcgac accatcaccg ccatctgggc gcagtggacg 420

cacagccagg gccccatcct ggtgtggatg tacaagtgcc cgggctcctt cagctcctgt 480

gacggctccg gcgctggctg gttcaagatc gacgaggccg gcttccacgg cgacggcgtc 540

aaggtcttcc tcgacaccga gaacccgtcc ggctgggaca tcgccaagct cgtcggcggc 600

aacaagcagt ggagcagcaa ggtccccgag ggcctcgccc ccggcaacta cctcgtccgc 660

cacgagttga tcgccctgca ccaggccaac aacccgcagt tctacccgga gtgcgcccag 720

gtcgtcatca ccggctccgg caccgcgcag ccggatgcct catacaaggc ggctatcccc 780

ggctactgca accagaatga cccgaacatc aaggtgagat ccaggcgtaa tgcagtctac 840

tgctggaaag aaagtggtcc aagctaaacc gcgctccagg tgcccatcaa cgaccactcc 900

atccctcaga cctacaagat tcccggccct cccgtcttca agggcaccgc cagcaagaag 960

gcccgggact tcaccgcctg aagttgttga atcgatggag 1000

<210>6

<211>516

<212>PRT

<213>土生梭孢霉(Thielavia terrestris)

<400>6

Met Leu Leu Thr Ser Val Leu Gly Ser Ala Ala Leu Leu Ala Ser Gly

1 5 10 15

Ala Ala Ala His Gly Ala Val Thr Ser Tyr Ile Ile Ala Gly Lys Asn

20 25 30

Tyr Pro Gly Tyr Gln Gly Phe Ser Pro Ala Asn Ser Pro Asn Val Ile

35 40 45

Gln Trp Gln Trp His Asp Tyr Asn Pro Val Leu Ser Cys Ser Asp Ser

50 55 60

Lys Leu Arg Cys Asn Gly Gly Thr Ser Ala Thr Leu Asn Ala Thr Ala

65 70 75 80

Ala Pro Gly Asp Thr Ile Thr Ala Ile Trp Ala Gln Trp Thr His Ser

85 90 95

Gln Gly Pro Ile Leu Val Trp Met Tyr Lys Cys Pro Gly Ser Phe Ser

100 105 110

Ser Cys Asp Gly Ser Gly Ala Gly Trp Phe Lys Ile Asp Glu Ala Gly

115 120 125

Phe His Gly Asp Gly Val Lys Val Phe Leu Asp Thr Glu Asn Pro Ser

130 135 140

Gly Trp Asp Ile Ala Lys Leu Val Gly Gly Asn Lys Gln Trp Ser Ser

145 150 155 160

Lys Val Pro Glu Gly Leu Ala Pro Gly Asn Tyr Leu Val Arg His Glu

165 170 175

Leu Ile Ala Leu His Gln Ala Asn Asn Pro Gln Phe Tyr Pro Glu Cys

180 185 190

Ala Gln Val Val Ile Thr Gly Ser Gly Thr Ala Gln Pro Asp Ala Ser

195 200 205

Tyr Lys Ala Ala Ile Pro Gly Tyr Cys Asn Gln Asn Asp Pro Asn Ile

210 215 220

Lys Val Pro Ile Asn Asp His Ser Ile Pro Gln Thr Tyr Lys Ile Pro

225 230 235 240

Gly Pro Pro Val Phe Lys Gly Thr Ala Ser Lys Lys Ala Arg Asp Phe

245 250 255

Thr Ala Met Leu Leu Thr Ser Val Leu Gly Ser Ala Ala Leu Leu Ala

260 265 270

Ser Gly Ala Ala Ala His Gly Ala Val Thr Ser Tyr Ile Ile Ala Gly

275 280 285

Lys Asn Tyr Pro Gly Tyr Gln Gly Phe Ser Pro Ala Asn Ser Pro Asn

290 295 300

Val Ile Gln Trp Gln Trp His Asp Tyr Asn Pro Val Leu Ser Cys Ser

305 310 315 320

Asp Ser Lys Leu Arg Cys Asn Gly Gly Thr Ser Ala Thr Leu Asn Ala

325 330 335

Thr Ala Ala Pro Gly Asp Thr Ile Thr Ala Ile Trp Ala Gln Trp Thr

340 345 350

His Ser Gln Gly Pro Ile Leu Val Trp Met Tyr Lys Cys Pro Gly Ser

355 360 365

Phe Ser Ser Cys Asp Gly Ser Gly Ala Gly Trp Phe Lys Ile Asp Glu

370 375 380

Ala Gly Phe His Gly Asp Gly Val Lys Val Phe Leu Asp Thr Glu Asn

385 390 395 400

Pro Ser Gly Trp Asp Ile Ala Lys Leu Val Gly Gly Asn Lys Gln Trp

405 410 415

Ser Ser Lys Val Pro Glu Gly Leu Ala Pro Gly Asn Tyr Leu Val Arg

420 425 430

His Glu Leu Ile Ala Leu His Gln Ala Asn Asn Pro Gln Phe Tyr Pro

435 440 445

Glu Cys Ala Gln Val Val Ile Thr Gly Ser Gly Thr Ala Gln Pro Asp

450 455 460

Ala Ser Tyr Lys Ala Ala Ile Pro Gly Tyr Cys Asn Gln Asn Asp Pro

465 470 475 480

Asn Ile Lys Val Pro Ile Asn Asp His Ser Ile Pro Gln Thr Tyr Lys

485 490 495

Ile Pro Gly Pro Pro Val Phe Lys Gly Thr Ala Ser Lys Lys Ala Arg

500 505 510

Asp Phe Thr Ala

515

<210>7

<211>681

<212>DNA

<213>土生梭孢霉(Thielavia terrestris)

<400>7

atgctcgcaa acggtgccat cgtcttcctg gccgccgccc tcggcgtcag tggccactac 60

acctggccac gggttaacga cggcgccgac tggcaacagg tccgtaaggc ggacaactgg 120

caggacaacg gctacgtcgg ggatgtcacg tcgccacaga tccgctgttt ccaggcgacc 180

ccgtccccgg ccccatccgt cctcaacacc acggccggct cgaccgtgac ctactgggcc 240

aaccccgacg tctaccaccc cgggcctgtg cagttttaca tggcccgcgt gcccgatggc 300

gaggacatca actcgtggaa cggcgacggc gccgtgtggt tcaaggtgta cgaggaccat 360

cctacctttg gcgctcagct cacatggccc agcacgggca agagctcgtt cgcggttccc 420

atccccccgt gcatcaagtc cggctactac ctcctccggg cggagcaaat cggcctgcac 480

gtcgcccaga gcgtaggcgg agcgcagttc tacatctcat gcgcccagct cagcgtcacc 540

ggcggcggca gcaccgagcc gccgaacaag gtggccttcc ccggcgctta cagtgcgacg 600

gacccgggca ttctgatcaa catctactac cctgttccca cgtcctacca gaaccccggc 660

ccggccgtct tcagctgctg a 681

<210>8

<211>452

<212>PRT

<213>土生梭孢霉(Thielavia terrestris)

<400>8

Met Leu Ala Asn Gly Ala Ile Val Phe Leu Ala Ala Ala Leu Gly Val

1 5 10 15

Ser Gly His Tyr Thr Trp Pro Arg Val Asn Asp Gly Ala Asp Trp Gln

20 25 30

Gln Val Arg Lys Ala Asp Asn Trp Gln Asp Asn Gly Tyr Val Gly Asp

35 40 45

Val Thr Ser Pro Gln Ile Arg Cys Phe Gln Ala Thr Pro Ser Pro Ala

50 55 60

Pro Ser Val Leu Asn Thr Thr Ala Gly Ser Thr Val Thr Tyr Trp Ala

65 70 75 80

Asn Pro Asp Val Tyr His Pro Gly Pro Val Gln Phe Tyr Met Ala Arg

85 90 95

Val Pro Asp Gly Glu Asp Ile Asn Ser Trp Asn Gly Asp Gly Ala Val

100 105 110

Trp Phe Lys Val Tyr Glu Asp His Pro Thr Phe Gly Ala Gln Leu Thr

115 120 125

Trp Pro Ser Thr Gly Lys Ser Ser Phe Ala Val Pro Ile Pro Pro Cys

130 135 140

Ile Lys Ser Gly Tyr Tyr Leu Leu Arg Ala Glu Gln Ile Gly Leu His

145 150 155 160

Val Ala Gln Ser Val Gly Gly Ala Gln Phe Tyr Ile Ser Cys Ala Gln

165 170 175

Leu Ser Val Thr Gly Gly Gly Ser Thr Glu Pro Pro Asn Lys Val Ala

180 185 190

Phe Pro Gly Ala Tyr Ser Ala Thr Asp Pro Gly Ile Leu Ile Asn Ile

195 200 205

Tyr Tyr Pro Val Pro Thr Ser Tyr Gln Asn Pro Gly Pro Ala Val Phe

210 215 220

Ser Cys Met Leu Ala Asn Gly Ala Ile Val Phe Leu Ala Ala Ala Leu

225 230 235 240

Gly Val Ser Gly His Tyr Thr Trp Pro Arg Val Asn Asp Gly Ala Asp

245 250 255

Trp Gln Gln Val Arg Lys Ala Asp Asn Trp Gln Asp Asn Gly Tyr Val

260 265 270

Gly Asp Val Thr Ser Pro Gln Ile Arg Cys Phe Gln Ala Thr Pro Ser

275 280 285

Pro Ala Pro Ser Val Leu Asn Thr Thr Ala Gly Ser Thr Val Thr Tyr

290 295 300

Trp Ala Asn Pro Asp Val Tyr His Pro Gly Pro Val Gln Phe Tyr Met

305 310 315 320

Ala Arg Val Pro Asp Gly Glu Asp Ile Asn Ser Trp Asn Gly Asp Gly

325 330 335

Ala Val Trp Phe Lys Val Tyr Glu Asp His Pro Thr Phe Gly Ala Gln

340 345 350

Leu Thr Trp Pro Ser Thr Gly Lys Ser Ser Phe Ala Val Pro Ile Pro

355 360 365

Pro Cys Ile Lys Ser Gly Tyr Tyr Leu Leu Arg Ala Glu Gln Ile Gly

370 375 380

Leu His Val Ala Gln Ser Val Gly Gly Ala Gln Phe Tyr Ile Ser Cys

385 390 395 400

Ala Gln Leu Ser Val Thr Gly Gly Gly Ser Thr Glu Pro Pro Asn Lys

405 410 415

Val Ala Phe Pro Gly Ala Tyr Ser Ala Thr Asp Pro Gly Ile Leu Ile

420 425 430

Asn Ile Tyr Tyr Pro Val Pro Thr Ser Tyr Gln Asn Pro Gly Pro Ala

435 440 445

Val Phe Ser Cys

450

<210>9

<211>960

<212>DNA

<213>土生梭孢霉(Thielavia terrestris)

<400>9

atgaagggac ttttcagtgc cgccgccctc tccctggccg tcggccaggc ttcggcccat 60

tacatcttcc agcaactctc catcaacggg aaccagtttc cggtgtacca atatattcgc 120

aagaacacca attataacag tcccgttacc gatctcacgt ccgacgatct tcggtgcaat 180

gtcggcgccc agggtgctgg gacagacacc gtcacggtga aggccggcga ccagttcacc 240

ttcacccttg acacccctgt ttaccaccag gggcccatct ccatctacat gtccaaggcc 300

ccgggcgcgg cgtcagacta cgatggcagc ggcggctggt tcaagatcaa ggactggggc 360

ccgactttca acgccgacgg cacggccacc tgggacatgg ccggctcata cacctacaac 420

atcccgacct gcattcccga cggcgactat ctgctccgca tccagtcgct ggccatccac 480

aacccctggc cggcgggcat cccgcagttc tacatctcct gcgcccagat caccgtgacc 540

ggcggcggca acggcaaccc tggcccgacg gccctcatcc ccggcgcctt caaggacacc 600

gacccgggct acacggtgaa catctacacg aacttccaca actacacggt tcccggcccg 660

gaggtcttca gctgcaacgg cggcggctcg aacccgcccc cgccggtgag tagcagcacg 720

cccgcgacca cgacgctggt cacgtcgacg cgcaccacgt cctccacgtc ctccgcctcg 780

acgccggcct cgaccggcgg ctgcaccgtc gccaagtggg gccagtgcgg cggcaacggg 840

tacaccggct gcacgacctg cgcggccggg tccacctgca gcaagcagaa cgactactac 900

tcgcagtgct tgtaagggag gccgcaaagc atgaggtgtt tgaagaggag gagaggggtc 960

<210>10

<211>608

<212>PRT

<213>土生梭孢霉(Thielavia terrestris)

<400>10

Met Lys Gly Leu Phe Ser Ala Ala Ala Leu Ser Leu Ala Val Gly Gln

1 5 10 15

Ala Ser Ala His Tyr Ile Phe Gln Gln Leu Ser Ile Asn Gly Asn Gln

20 25 30

Phe Pro Val Tyr Gln Tyr Ile Arg Lys Asn Thr Asn Tyr Asn Ser Pro

35 40 45

Val Thr Asp Leu Thr Ser Asp Asp Leu Arg Cys Asn Val Gly Ala Gln

50 55 60

Gly Ala Gly Thr Asp Thr Val Thr Val Lys Ala Gly Asp Gln Phe Thr

65 70 75 80

Phe Thr Leu Asp Thr Pro Val Tyr His Gln Gly Pro Ile Ser Ile Tyr

85 90 95

Met Ser Lys Ala Pro Gly Ala Ala Ser Asp Tyr Asp Gly Ser Gly Gly

100 105 110

Trp Phe Lys Ile Lys Asp Trp Gly Pro Thr Phe Asn Ala Asp Gly Thr

115 120 125

Ala Thr Trp Asp Met Ala Gly Ser Tyr Thr Tyr Asn Ile Pro Thr Cys

130 135 140

Ile Pro Asp Gly Asp Tyr Leu Leu Arg Ile Gln Ser Leu Ala Ile His

145 150 155 160

Asn Pro Trp Pro Ala Gly Ile Pro Gln Phe Tyr Ile Ser Cys Ala Gln

165 170 175

Ile Thr Val Thr Gly Gly Gly Asn Gly Asn Pro Gly Pro Thr Ala Leu

180 185 190

Ile Pro Gly Ala Phe Lys Asp Thr Asp Pro Gly Tyr Thr Val Asn Ile

195 200 205

Tyr Thr Asn Phe His Asn Tyr Thr Val Pro Gly Pro Glu Val Phe Ser

210 215 220

Cys Asn Gly Gly Gly Ser Asn Pro Pro Pro Pro Val Ser Ser Ser Thr

225 230 235 240

Pro Ala Thr Thr Thr Leu Val Thr Ser Thr Arg Thr Thr Ser Ser Thr

245 250 255

Ser Ser Ala Ser Thr Pro Ala Ser Thr Gly Gly Cys Thr Val Ala Lys

260 265 270

Trp Gly Gln Cys Gly Gly Asn Gly Tyr Thr Gly Cys Thr Thr Cys Ala

275 280 285

Ala Gly Ser Thr Cys Ser Lys Gln Asn Asp Tyr Tyr Ser Gln Cys Leu

290 295 300

Met Lys Gly Leu Phe Ser Ala Ala Ala Leu Ser Leu Ala Val Gly Gln

305 310 315 320

Ala Ser Ala His Tyr Ile Phe Gln Gln Leu Ser Ile Asn Gly Asn Gln

325 330 335

Phe Pro Val Tyr Gln Tyr Ile Arg Lys Asn Thr Asn Tyr Asn Ser Pro

340 345 350

Val Thr Asp Leu Thr Ser Asp Asp Leu Arg Cys Asn Val Gly Ala Gln

355 360 365

Gly Ala Gly Thr Asp Thr Val Thr Val Lys Ala Gly Asp Gln Phe Thr

370 375 380

Phe Thr Leu Asp Thr Pro Val Tyr His Gln Gly Pro Ile Ser Ile Tyr

385 390 395 400

Met Ser Lys Ala Pro Gly Ala Ala Ser Asp Tyr Asp Gly Ser Gly Gly

405 410 415

Trp Phe Lys Ile Lys Asp Trp Gly Pro Thr Phe Asn Ala Asp Gly Thr

420 425 430

Ala Thr Trp Asp Met Ala Gly Ser Tyr Thr Tyr Asn Ile Pro Thr Cys

435 440 445

Ile Pro Asp Gly Asp Tyr Leu Leu Arg Ile Gln Ser Leu Ala Ile His

450 455 460

Asn Pro Trp Pro Ala Gly Ile Pro Gln Phe Tyr Ile Ser Cys Ala Gln

465 470 475 480

Ile Thr Val Thr Gly Gly Gly Asn Gly Asn Pro Gly Pro Thr Ala Leu

485 490 495

Ile Pro Gly Ala Phe Lys Asp Thr Asp Pro Gly Tyr Thr Val Asn Ile

500 505 510

Tyr Thr Asn Phe His Asn Tyr Thr Val Pro Gly Pro Glu Val Phe Ser

515 520 525

Cys Asn Gly Gly Gly Ser Asn Pro Pro Pro Pro Val Ser Ser Ser Thr

530 535 540

Pro Ala Thr Thr Thr Leu Val Thr Ser Thr Arg Thr Thr Ser Ser Thr

545 550 555 560

Ser Ser Ala Ser Thr Pro Ala Ser Thr Gly Gly Cys Thr Val Ala Lys

565 570 575

Trp Gly Gln Cys Gly Gly Asn Gly Tyr Thr Gly Cys Thr Thr Cys Ala

580 585 590

Ala Gly Ser Thr Cys Ser Lys Gln Asn Asp Tyr Tyr Ser Gln Cys Leu

595 600 605

<210>11

<211>799

<212>DNA

<213>桔橙嗜热霉(Thermoascus aurantiacus)

<400>11

atgtcctttt ccaagataat tgctactgcc ggcgttcttg cctctgcttc tctagtggct 60

ggccatggct tcgttcagaa catcgtgatt gatggtaaaa agtatgtcat tgcaagacgc 120

acataagcgg caacagctga caatcgacag ttatggcggg tatctagtga accagtatcc 180

atacatgtcc aatcctccag aggtcatcgc ctggtctact acggcaactg atcttggatt 240

tgtggacggt actggatacc aaaccccaga tatcatctgc cataggggcg ccaagcctgg 300

agccctgact gctccagtct ctccaggagg aactgttgag cttcaatgga ctccatggcc 360

tgattctcac catggcccag ttatcaacta ccttgctccg tgcaatggtg attgttccac 420

tgtggataag acccaattag aattcttcaa aattgccgag agcggtctca tcaatgatga 480

caatcctcct gggatctggg cttcagacaa tctgatagca gccaacaaca gctggactgt 540

caccattcca accacaattg cacctggaaa ctatgttctg aggcatgaga ttattgctct 600

tcactcagct cagaaccagg atggtgccca gaactatccc cagtgcatca atctgcaggt 660

cactggaggt ggttctgata accctgctgg aactcttgga acggcactct accacgatac 720

cgatcctgga attctgatca acatctatca gaaactttcc agctatatca tccctggtcc 780

tcctctgtat actggttaa 799

<210>12

<211>250

<212>PRT

<213>桔橙嗜热霉(Thermoascus aurantiacus)

<400>12

Met Ser Phe Ser Lys Ile Ile Ala Thr Ala Gly Val Leu Ala Ser Ala

1 5 10 15

Ser Leu Val Ala Gly His Gly Phe Val Gln Asn Ile Val Ile Asp Gly

20 25 30

Lys Lys Tyr Tyr Gly Gly Tyr Leu Val Asn Gln Tyr Pro Tyr Met Ser

35 40 45

Asn Pro Pro Glu Val Ile Ala Trp Ser Thr Thr Ala Thr Asp Leu Gly

50 55 60

Phe Val Asp Gly Thr Gly Tyr Gln Thr Pro Asp Ile Ile Cys His Arg

65 70 75 80

Gly Ala Lys Pro Gly Ala Leu Thr Ala Pro Val Ser Pro Gly Gly Thr

85 90 95

Val Glu Leu Gln Trp Thr Pro Trp Pro Asp Ser His His Gly Pro Val

100 105 110

Ile Asn Tyr Leu Ala Pro Cys Asn Gly Asp Cys Ser Thr Val Asp Lys

115 120 125

Thr Gln Leu Glu Phe Phe Lys Ile Ala Glu Ser Gly Leu Ile Asn Asp

130 135 140

Asp Asn Pro Pro Gly Ile Trp Ala Ser Asp Asn Leu Ile Ala Ala Asn

145 150 155 160

Asn Ser Trp Thr Val Thr Ile Pro Thr Thr Ile Ala Pro Gly Asn Tyr

165 170 175

Val Leu Arg His Glu Ile Ile Ala Leu His Ser Ala Gln Asn Gln Asp

180 185 190

Gly Ala Gln Asn Tyr Pro Gln Cys Ile Asn Leu Gln Val Thr Gly Gly

195 200 205

Gly Ser Asp Asn Pro Ala Gly Thr Leu Gly Thr Ala Leu Tyr His Asp

210 215 220

Thr Asp Pro Gly Ile Leu Ile Asn Ile Tyr Gln Lys Leu Ser Ser Tyr

225 230 235 240

Ile Ile Pro Gly Pro Pro Leu Tyr Thr Gly

245 250

<210>13

<211>1172

<212>DNA

<213>里氏木霉(Trichoderma reesei)

<400>13

ggatctaagc cccatcgata tgaagtcctg cgccattctt gcagcccttg gctgtcttgc 60

cgggagcgtt ctcggccatg gacaagtcca aaacttcacg atcaatggac aatacaatca 120

gggtttcatt ctcgattact actatcagaa gcagaatact ggtcacttcc ccaacgttgc 180

tggctggtac gccgaggacc tagacctggg cttcatctcc cctgaccaat acaccacgcc 240

cgacattgtc tgtcacaaga acgcggcccc aggtgccatt tctgccactg cagcggccgg 300

cagcaacatc gtcttccaat ggggccctgg cgtctggcct cacccctacg gtcccatcgt 360

tacctacgtg gctgagtgca gcggatcgtg cacgaccgtg aacaagaaca acctgcgctg 420

ggtcaagatt caggaggccg gcatcaacta taacacccaa gtctgggcgc agcaggatct 480

gatcaaccag ggcaacaagt ggactgtgaa gatcccgtcg agcctcaggc ccggaaacta 540

tgtcttccgc catgaacttc ttgctgccca tggtgcctct agtgcgaacg gcatgcagaa 600

ctatcctcag tgcgtgaaca tcgccgtcac aggctcgggc acgaaagcgc tccctgccgg 660

aactcctgca actcagctct acaagcccac tgaccctggc atcttgttca acccttacac 720

aacaatcacg agctacacca tccctggccc agccctgtgg caaggctaga tccaggggta 780

cggtgttggc gttcgtgaag tcggagctgt tgacaaggat atctgatgat gaacggagag 840

gactgatggg cgtgactgag tgtatatatt tttgatgacc aaattgtata cgaaatccga 900

acgcatggtg atcattgttt atccctgtag tatattgtct ccaggctgct aagagcccac 960

cgggtgtatt acggcaacaa agtcaggaat ttgggtggca atgaacgcag gtctccatga 1020

atgtatatgt gaagaggcat cggctggcat gggcattacc agatataggc cctgtgaaac 1080

atatagtact tgaacgtgct actggaacgg atcataagca agtcatcaac atgtgaaaaa 1140

acactacatg taaaaaaaaa aaaaaaaaaa aa 1172

<210>14

<211>249

<212>PRT

<213>里氏木霉(Trichoderma reesei)

<400>14

Met Lys Ser Cys Ala Ile Leu Ala Ala Leu Gly Cys Leu Ala Gly Ser

1 5 10 15

Val Leu Gly His Gly Gln Val Gln Asn Phe Thr Ile Asn Gly Gln Tyr

20 25 30

Asn Gln Gly Phe Ile Leu Asp Tyr Tyr Tyr Gln Lys Gln Asn Thr Gly

35 40 45

His Phe Pro Asn Val Ala Gly Trp Tyr Ala Glu Asp Leu Asp Leu Gly

50 55 60

Phe Ile Ser Pro Asp Gln Tyr Thr Thr Pro Asp Ile Val Cys His Lys

65 70 75 80

Asn Ala Ala Pro Gly Ala Ile Ser Ala Thr Ala Ala Ala Gly Ser Asn

85 90 95

Ile Val Phe Gln Trp Gly Pro Gly Val Trp Pro His Pro Tyr Gly Pro

100 105 110

Ile Val Thr Tyr Val Val Glu Cys Ser Gly Ser Cys Thr Thr Val Asn

115 120 125

Lys Asn Asn Leu Arg Trp Val Lys Ile Gln Glu Ala Gly Ile Asn Tyr

130 135 140

Asn Thr Gln Val Trp Ala Gln Gln Asp Leu Ile Asn Gln Gly Asn Lys

145 150 155 160

Trp Thr Val Lys Ile Pro Ser Ser Leu Arg Pro Gly Asn Tyr Val Phe

165 170 175

Arg His Glu Leu Leu Ala Ala His Gly Ala Ser Ser Ala Asn Gly Met

180 185 190

Gln Asn Tyr Pro Gln Cys Val Asn Ile Ala Val Thr Gly Ser Gly Thr

195 200 205

Lys Ala Leu Pro Ala Gly Thr Pro Ala Thr Gln Leu Tyr Lys Pro Thr

210 215 220

Asp Pro Gly Ile Leu Phe Asn Pro Tyr Thr Thr Ile Thr Ser Tyr Thr

225 230 235 240

Ile Pro Gly Pro Ala Leu Trp Gln Gly

245

<210>15

<211>2771

<212>DNA

<213>米曲霉(Aspergillus oryzae)

<400>15

ctgttctgct ggttacctgc cacgttatca tgaagcttgg ttggatcgag gtggccgcat 60

tggcggctgc ctcagtagtc agtgccaagg atgatctcgc gtactcccct cctttctacc 120

cttccccatg ggcagatggt cagggtgaat gggcggaagt atacaaacgc gctgtagaca 180

tagtttccca gatgacgttg acagagaaag tcaacttaac gactggaaca ggatggcaac 240

tagagaggtg tgttggacaa actggcagtg ttcccagact caacatcccc agcttgtgtt 300

tgcaggatag tcctcttggt attcgtttct cggactacaa ttcagctttc cctgcgggtg 360

ttaatgtcgc tgccacctgg gacaagacgc tcgcctacct tcgtggtcag gcaatgggtg 420

aggagttcag tgataagggt attgacgttc agctgggtcc tgctgctggc cctctcggtg 480

ctcatccgga tggcggtaga aactgggaag gtttctcacc agatccagcc ctcaccggtg 540

tactttttgc ggagacgatt aagggtattc aagatgctgg tgtcattgcg acagctaagc 600

attatatcat gaacgaacaa gagcatttcc gccaacaacc cgaggctgcg ggttacggat 660

tcaacgtaag cgacagtttg agttccaacg ttgatgacaa gactatgcat gaattgtacc 720

tctggccctt cgcggatgca gtacgcgctg gagtcggtgc tgtcatgtgc tcttacaacc 780

aaatcaacaa cagctacggt tgcgagaata gcgaaactct gaacaagctt ttgaaggcgg 840

agcttggttt ccaaggcttc gtcatgagtg attggaccgc tcatcacagc ggcgtaggcg 900

ctgctttagc aggtctggat atgtcgatgc ccggtgatgt taccttcgat agtggtacgt 960

ctttctgggg tgcaaacttg acggtcggtg tccttaacgg tacaatcccc caatggcgtg 1020

ttgatgacat ggctgtccgt atcatggccg cttattacaa ggttggccgc gacaccaaat 1080

acacccctcc caacttcagc tcgtggacca gggacgaata tggtttcgcg cataaccatg 1140

tttcggaagg tgcttacgag agggtcaacg aattcgtgga cgtgcaacgc gatcatgccg 1200

acctaatccg tcgcatcggc gcgcagagca ctgttctgct gaagaacaag ggtgccttgc 1260

ccttgagccg caaggaaaag ctggtcgccc ttctgggaga ggatgcgggt tccaactcgt 1320

ggggcgctaa cggctgtgat gaccgtggtt gcgataacgg tacccttgcc atggcctggg 1380

gtagcggtac tgcgaatttc ccatacctcg tgacaccaga gcaggcgatt cagaacgaag 1440

ttcttcaggg ccgtggtaat gtcttcgccg tgaccgacag ttgggcgctc gacaagatcg 1500

ctgcggctgc ccgccaggcc agcgtatctc tcgtgttcgt caactccgac tcaggagaaa 1560

gctatcttag tgtggatgga aatgagggcg atcgtaacaa catcactctg tggaagaacg 1620

gcgacaatgt ggtcaagacc gcagcgaata actgtaacaa caccgtggtc atcatccact 1680

ccgtcggacc agttttgatc gatgaatggt atgaccaccc caatgtcact ggtattctct 1740

gggctggtct gccaggccag gagtctggta actccatcgc cgatgtgctg tacggtcgtg 1800

tcaaccctgg cgccaagtct cctttcactt ggggcaagac ccgggagtcg tatggttctc 1860

ccttggtcaa ggatgccaac aatggcaacg gagcgcccca gtctgatttc acccagggtg 1920

ttttcatcga ttaccgccat ttcgataagt tcaatgagac ccctatctac gagtttggct 1980

acggcttgag ctacaccacc ttcgagctct ccgacctcca tgttcagccc ctgaacgcgt 2040

cccgatacac tcccaccagt ggcatgactg aagctgcaaa gaactttggt gaaattggcg 2100

atgcgtcgga gtacgtgtat ccggaggggc tggaaaggat ccatgagttt atctatccct 2160

ggatcaactc taccgacctg aaggcatcgt ctgacgattc taactacggc tgggaagact 2220

ccaagtatat tcccgaaggc gccacggatg ggtctgccca gccccgtttg cccgctagtg 2280

gtggtgccgg aggaaacccc ggtctgtacg aggatctttt ccgcgtctct gtgaaggtca 2340

agaacacggg caatgtcgcc ggtgatgaag ttcctcagct gtacgtttcc ctaggcggcc 2400

cgaatgagcc caaggtggta ctgcgcaagt ttgagcgtat tcacttggcc ccttcgcagg 2460

aggccgtgtg gacaacgacc cttacccgtc gtgaccttgc aaactgggac gtttcggctc 2520

aggactggac cgtcactcct taccccaaga cgatctacgt tggaaactcc tcacggaaac 2580

tgccgctcca ggcctcgctg cctaaggccc agtaaggggc aagtcctgat tgtacagagc 2640

atttcgagat ttatgatgta catgtttatg aatgacctag ggtagggtaa tacttagtag 2700

ggttagttct aattcttgga gtcaagtatt gactcactgg gccgataaaa aaaaaaaaaa 2760

aaaaaaaaaa a 2771

<210>16

<211>861

<212>PRT

<213>米曲霉(Aspergillus oryzae)

<400>16

Met Lys Leu Gly Trp Ile Glu Val Ala Ala Leu Ala Ala Ala Ser Val

1 5 10 15

Val Ser Ala Lys Asp Asp Leu Ala Tyr Ser Pro Pro Phe Tyr Pro Ser

20 25 30

Pro Trp Ala Asp Gly Gln Gly Glu Trp Ala Glu Val Tyr Lys Arg Ala

35 40 45

Val Asp Ile Val Ser Gln Met Thr Leu Thr Glu Lys Val Asn Leu Thr

50 55 60

Thr Gly Thr Gly Trp Gln Leu Glu Arg Cys Val Gly Gln Thr Gly Ser

65 70 75 80

Val Pro Arg Leu Asn Ile Pro Ser Leu Cys Leu Gln Asp Ser Pro Leu

85 90 95

Gly Ile Arg Phe Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Val Asn

100 105 110

Val Ala Ala Thr Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Gln Ala

115 120 125

Met Gly Glu Glu Phe Ser Asp Lys Gly Ile Asp Val Gln Leu Gly Pro

130 135 140

Ala Ala Gly Pro Leu Gly Ala His Pro Asp Gly Gly Arg Asn Trp Glu

145 150 155 160

Gly Phe Ser Pro Asp Pro Ala Leu Thr Gly Val Leu Phe Ala Glu Thr

165 170 175

Ile Lys Gly Ile Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr

180 185 190

Ile Met Asn Glu Gln Glu His Phe Arg Gln Gln Pro Glu Ala Ala Gly

195 200 205

Tyr Gly Phe Asn Val Ser Asp Ser Leu Ser Ser Asn Val Asp Asp Lys

210 215 220

Thr Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala

225 230 235 240

Gly Val Gly Ala Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr

245 250 255

Gly Cys Glu Asn Ser Glu Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu

260 265 270

Gly Phe Gln Gly Phe Val Met Ser Asp Trp Thr Ala His His Ser Gly

275 280 285

Val Gly Ala Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Val

290 295 300

Thr Phe Asp Ser Gly Thr Ser Phe Trp Gly Ala Asn Leu Thr Val Gly

305 310 315 320

Val Leu Asn Gly Thr Ile Pro Gln Trp Arg Val Asp Asp Met Ala Val

325 330 335

Arg Ile Met Ala Ala Tyr Tyr Lys Val Gly Arg Asp Thr Lys Tyr Thr

340 345 350

Pro Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Phe Ala His

355 360 365

Asn His Val Ser Glu Gly Ala Tyr Glu Arg Val Asn Glu Phe Val Asp

370 375 380

Val Gln Arg Asp His Ala Asp Leu Ile Arg Arg Ile Gly Ala Gln Ser

385 390 395 400

Thr Val Leu Leu Lys Asn Lys Gly Ala Leu Pro Leu Ser Arg Lys Glu

405 410 415

Lys Leu Val Ala Leu Leu Gly Glu Asp Ala Gly Ser Asn Ser Trp Gly

420 425 430

Ala Asn Gly Cys Asp Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met

435 440 445

Ala Trp Gly Ser Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu

450 455 460

Gln Ala Ile Gln Asn Glu Val Leu Gln Gly Arg Gly Asn Val Phe Ala

465 470 475 480

Val Thr Asp Ser Trp Ala Leu Asp Lys Ile Ala Ala Ala Ala Arg Gln

485 490 495

Ala Ser Val Ser Leu Val Phe Val Asn Ser Asp Ser Gly Glu Ser Tyr

500 505 510

Leu Ser Val Asp Gly Asn Glu Gly Asp Arg Asn Asn Ile Thr Leu Trp

515 520 525

Lys Asn Gly Asp Asn Val Val Lys Thr Ala Ala Asn Asn Cys Asn Asn

530 535 540

Thr Val Val Ile Ile His Ser Val Gly Pro Val Leu Ile Asp Glu Trp

545 550 555 560

Tyr Asp His Pro Asn Val Thr Gly Ile Leu Trp Ala Gly Leu Pro Gly

565 570 575

Gln Glu Ser Gly Asn Ser Ile Ala Asp Val Leu Tyr Gly Arg Val Asn

580 585 590

Pro Gly Ala Lys Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr

595 600 605

Gly Ser Pro Leu Val Lys Asp Ala Asn Asn Gly Asn Gly Ala Pro Gln

610 615 620

Ser Asp Phe Thr Gln Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys

625 630 635 640

Phe Asn Glu Thr Pro Ile Tyr Glu Phe Gly Tyr Gly Leu Ser Tyr Thr

645 650 655

Thr Phe Glu Leu Ser Asp Leu His Val Gln Pro Leu Asn Ala Ser Arg

660 665 670

Tyr Thr Pro Thr Ser Gly Met Thr Glu Ala Ala Lys Asn Phe Gly Glu

675 680 685

Ile Gly Asp Ala Ser Glu Tyr Val Tyr Pro Glu Gly Leu Glu Arg Ile

690 695 700

His Glu Phe Ile Tyr Pro Trp Ile Asn Ser Thr Asp Leu Lys Ala Ser

705 710 715 720

Ser Asp Asp Ser Asn Tyr Gly Trp Glu Asp Ser Lys Tyr Ile Pro Glu

725 730 735

Gly Ala Thr Asp Gly Ser Ala Gln Pro Arg Leu Pro Ala Ser Gly Gly

740 745 750

Ala Gly Gly Asn Pro Gly Leu Tyr Glu Asp Leu Phe Arg Val Ser Val

755 760 765

Lys Val Lys Asn Thr Gly Asn Val Ala Gly Asp Glu Val Pro Gln Leu

770 775 780

Tyr Val Ser Leu Gly Gly Pro Asn Glu Pro Lys Val Val Leu Arg Lys

785 790 795 800

Phe Glu Arg Ile His Leu Ala Pro Ser Gln Glu Ala Val Trp Thr Thr

805 810 815

Thr Leu Thr Arg Arg Asp Leu Ala Asn Trp Asp Val Ser Ala Gln Asp

820 825 830

Trp Thr Val Thr Pro Tyr Pro Lys Thr Ile Tyr Val Gly Asn Ser Ser

835 840 845

Arg Lys Leu Pro Leu Gln Ala Ser Leu Pro Lys Ala Gln

850 855 860

<210>17

<211>5172

<212>DNA

<213>米曲霉(Aspergillus oryzae)

<400>17

atgaagcttg gttggatcga ggtggccgca ttggcggctg cctcagtagt cagtgccaag 60

gatgatctcg cgtactcccc tcctttctac ccttccccat tacttcgaac caacctagct 120

ccaccggcgt aaccgccgac ggagtcatca gtcacggttc ctactagagc gcatgagggg 180

aggaaagatg ggaaggggta gggcagatgg tcagggtgaa tgggcggaag tatacaaacg 240

cgctgtagac atagtttccc agatgacgtt gacagagaaa gtcaacttaa cgactggaac 300

cccgtctacc agtcccactt acccgccttc atatgtttgc gcgacatctg tatcaaaggg 360

tctactgcaa ctgtctcttt cagttgaatt gctgaccttg aggatggcaa ctagagaggt 420

gtgttggaca aactggcagt gttcccagac tcaacatccc cagcttgtgt ttgcaggata 480

gtcctcttgg tattcgtttc tcctaccgtt gatctctcca cacaacctgt ttgaccgtca 540

caagggtctg agttgtaggg gtcgaacaca aacgtcctat caggagaacc ataagcaaag 600

tcggactaca attcagcttt ccctgcgggt gttaatgtcg ctgccacctg ggacaagacg 660

ctcgcctacc ttcgtggtca ggcaatgggt gaggagttca agcctgatgt taagtcgaaa 720

gggacgccca caattacagc gacggtggac cctgttctgc gagcggatgg aagcaccagt 780

ccgttaccca ctcctcaagt gtgataaggg tattgacgtt cagctgggtc ctgctgctgg 840

ccctctcggt gctcatccgg atggcggtag aaactgggaa ggtttctcac cagatccagc 900

cactattccc ataactgcaa gtcgacccag gacgacgacc gggagagcca cgagtaggcc 960

taccgccatc tttgaccctt ccaaagagtg gtctaggtcg cctcaccggt gtactttttg 1020

cggagacgat taagggtatt caagatgctg gtgtcattgc gacagctaag cattatatca 1080

tgaacgaaca agagcatttc ggagtggcca catgaaaaac gcctctgcta attcccataa 1140

gttctacgac cacagtaacg ctgtcgattc gtaatatagt acttgcttgt tctcgtaaag 1200

cgccaacaac ccgaggctgc gggttacgga ttcaacgtaa gcgacagttt gagttccaac 1260

gttgatgaca agactatgca tgaattgtac ctctggccct gcggttgttg ggctccgacg 1320

cccaatgcct aagttgcatt cgctgtcaaa ctcaaggttg caactactgt tctgatacgt 1380

acttaacatg gagaccggga tcgcggatgc agtacgcgct ggagtcggtg ctgtcatgtg 1440

ctcttacaac caaatcaaca acagctacgg ttgcgagaat agcgaaactc tgaacaagct 1500

agcgcctacg tcatgcgcga cctcagccac gacagtacac gagaatgttg gtttagttgt 1560

tgtcgatgcc aacgctctta tcgctttgag acttgttcga tttgaaggcg gagcttggtt 1620

tccaaggctt cgtcatgagt gattggaccg ctcatcacag cggcgtaggc gctgctttag 1680

caggtctgga tatgtcgatg aaacttccgc ctcgaaccaa aggttccgaa gcagtactca 1740

ctaacctggc gagtagtgtc gccgcatccg cgacgaaatc gtccagacct atacagctac 1800

cccggtgatg ttaccttcga tagtggtacg tctttctggg gtgcaaactt gacggtcggt 1860

gtccttaacg gtacaatccc ccaatggcgt gttgatgaca gggccactac aatggaagct 1920

atcaccatgc agaaagaccc cacgtttgaa ctgccagcca caggaattgc catgttaggg 1980

ggttaccgca caactactgt tggctgtccg tatcatggcc gcttattaca aggttggccg 2040

cgacaccaaa tacacccctc ccaacttcag ctcgtggacc agggacgaat atggtttcgc 2100

accgacaggc atagtaccgg cgaataatgt tccaaccggc gctgtggttt atgtggggag 2160

ggttgaagtc gagcacctgg tccctgctta taccaaagcg gcataaccat gtttcggaag 2220

gtgcttacga gagggtcaac gaattcgtgg acgtgcaacg cgatcatgcc gacctaatcc 2280

gtcgcatcgg cgcgcagagc cgtattggta caaagccttc cacgaatgct ctcccagttg 2340

cttaagcacc tgcacgttgc gctagtacgg ctggattagg cagcgtagcc gcgcgtctcg 2400

actgttctgc tgaagaacaa gggtgccttg cccttgagcc gcaaggaaaa gctggtcgcc 2460

cttctgggag aggatgcggg ttccaactcg tggggcgcta tgacaagacg acttcttgtt 2520

cccacggaac gggaactcgg cgttcctttt cgaccagcgg gaagaccctc tcctacgccc 2580

aaggttgagc accccgcgat acggctgtga tgaccgtggt tgcgataacg gtacccttgc 2640

catggcctgg ggtagcggta ctgcgaattt cccatacctc gtgacaccag agcaggcgat 2700

tgccgacact actggcacca acgctattgc catgggaacg gtaccggacc ccatcgccat 2760

gacgcttaaa gggtatggag cactgtggtc tcgtccgcta tcagaacgaa gttcttcagg 2820

gccgtggtaa tgtcttcgcc gtgaccgaca gttgggcgct cgacaagatc gctgcggctg 2880

cccgccaggc cagcgtatct agtcttgctt caagaagtcc cggcaccatt acagaagcgg 2940

cactggctgt caacccgcga gctgttctag cgacgccgac gggcggtccg gtcgcataga 3000

ctcgtgttcg tcaactccga ctcaggagaa ggctatctta gtgtggatgg aaatgagggc 3060

gatcgtaaca acatcactct gtggaagaac ggcgacaatg gagcacaagc agttgaggct 3120

gagtcctctt ccgatagaat cacacctacc tttactcccg ctagcattgt tgtagtgaga 3180

caccttcttg ccgctgttac tggtcaagac cgcagcgaat aactgtaaca acaccgttgt 3240

catcatccac tccgtcggac cagttttgat cgatgaatgg tatgaccacc ccaatgtcac 3300

accagttctg gcgtcgctta ttgacattgt tgtggcaaca gtagtaggtg aggcagcctg 3360

gtcaaaacta gctacttacc atactggtgg ggttacagtg tggtattctc tgggctggtc 3420

tgccaggcca ggagtctggt aactccattg ccgatgtgct gtacggtcgt gtcaaccctg 3480

gcgccaagtc tcctttcact accataagag acccgaccag acggtccggt cctcagacca 3540

ttgaggtaac ggctacacga catgccagca cagttgggac cgcggttcag aggaaagtga 3600

tggggcaaga cccgggagtc gtatggttct cccttggtca aggatgccaa caatggcaac 3660

ggagcgcccc agtctgattt cacccagggt gttttcatcg accccgttct gggccctcag 3720

cataccaaga gggaaccagt tcctacggtt gttaccgttg cctcgcgggg tcagactaaa 3780

gtgggtccca caaaagtagc attaccgcca tttcgataag ttcaatgaga cccctatcta 3840

cgagtttggc tacggcttga gctacaccac cttcgagctc tccgacctcc atgttcagcc 3900

taatggcggt aaagctattc aagttactct ggggatagat gctcaaaccg atgccgaact 3960

cgatgtggtg gaagctcgag aggctggagg tacaagtcgg cctgaacgcg tcccgataca 4020

ctcccaccag tggcatgact gaagctgcaa agaactttgg tgaaattggc gatgcgtcgg 4080

agtacgtgta tccggagggg ggacttgcgc agggctatgt gagggtggtc accgtactga 4140

cttcgacgtt tcttgaaacc actttaaccg ctacgcagcc tcatgcacat aggcctcccc 4200

ctggaaagga tccatgagtt tatctatccc tggatcaact ctaccgacct gaaggcatcg 4260

tctgacgatt ctaactacgg ctgggaagac tccaagtata gacctttcct aggtactcaa 4320

atagataggg acctagttga gatggctgga cttccgtagc agactgctaa gattgatgcc 4380

gacccttctg aggttcatat ttcccgaagg cgccacggat gggtctgccc agccccgttt 4440

gcccgctagt ggtggtgccg gaggaaaccc cggtctgtac gaggatcttt tccgcgtctc 4500

aagggcttcc gcggtgccta cccagacggg tcggggcaaa cgggcgatca ccaccacggc 4560

ctcctttggg gccagacatg ctcctagaaa aggcgcagag tgtgaaggtc aagaacacgg 4620

gcaatgtcgc cggtgatgaa gttcctcagc tgtacgtttc cctaggcggc ccgaatgagc 4680

ccaaggtggt actgcgcaag acacttccag ttcttgtgcc cgttacagcg gccactactt 4740

caaggagtcg acatgcaaag ggatccgccg ggcttactcg ggttccacca tgacgcgttc 4800

tttgagcgta ttcacttggc cccttcgcag gaggccgtgt ggacaacgac ccttacccgt 4860

cgtgaccttg caaactggga cgtttcggct caggactgga aaactcgcat aagtgaaccg 4920

gggaagcgtc ctccggcaca cctgttgctg ggaatgggca gcactggaac gtttgaccct 4980

gcaaagccga gtcctgacct ccgtcactcc ttaccccaag acgatctacg ttggaaactc 5040

ctcacggaaa ctgccgctcc aggcctcgct gcctaaggcc cagtaaggca gtgaggaatg 5100

gggttctgct agatgcaacc tttgaggagt gcctttgacg gcgaggtccg gagcgacgga 5160

ttccgggtca tt 5172

<210>18

<211>861

<212>PRT

<213>米曲霉(Aspergillus oryzae)

<400>18

Met Lys Leu Gly Trp Ile Glu Val Ala Ala Leu Ala Ala Ala Ser Val

1 5 10 15

Val Ser Ala Lys Asp Asp Leu Ala Tyr Ser Pro Pro Phe Tyr Pro Ser

20 25 30

Pro Trp Ala Asp Gly Gln Gly Glu Trp Ala Glu Val Tyr Lys Arg Ala

35 40 45

Val Asp Ile Val Ser Gln Met Thr Leu Thr Glu Lys Val Asn Leu Thr

50 55 60

Thr Gly Thr Gly Trp Gln Leu Glu Arg Cys Val Gly Gln Thr Gly Ser

65 70 75 80

Val Pro Arg Leu Asn Ile Pro Ser Leu Cys Leu Gln Asp Ser Pro Leu

85 90 95

Gly Ile Arg Phe Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Val Asn

100 105 110

Val Ala Ala Thr Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Gln Ala

115 120 125

Met Gly Glu Glu Phe Ser Asp Lys Gly Ile Asp Val Gln Leu Gly Pro

130 135 140

Ala Ala Gly Pro Leu Gly Ala His Pro Asp Gly Gly Arg Asn Trp Glu

145 150 155 160

Gly Phe Ser Pro Asp Pro Ala Leu Thr Gly Val Leu Phe Ala Glu Thr

165 170 175

Ile Lys Gly Ile Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr

180 185 190

Ile Met Asn Glu Gln Glu His Phe Arg Gln Gln Pro Glu Ala Ala Gly

195 200 205

Tyr Gly Phe Asn Val Ser Asp Ser Leu Ser Ser Asn Val Asp Asp Lys

210 215 220

Thr Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala

225 230 235 240

Gly Val Gly Ala Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr

245 250 255

Gly Cys Glu Asn Ser Glu Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu

260 265 270

Gly Phe Gln Gly Phe Val Met Ser Asp Trp Thr Ala His His Ser Gly

275 280 285

Val Gly Ala Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Val

290 295 300

Thr Phe Asp Ser Gly Thr Ser Phe Trp Gly Ala Asn Leu Thr Val Gly

305 310 315 320

Val Leu Asn Gly Thr Ile Pro Gln Trp Arg Val Asp Asp Met Ala Val

325 330 335

Arg Ile Met Ala Ala Tyr Tyr Lys Val Gly Arg Asp Thr Lys Tyr Thr

340 345 350

Pro Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Phe Ala His

355 360 365

Asn His Val Ser Glu Gly Ala Tyr Glu Arg Val Asn Glu Phe Val Asp

370 375 380

Val Gln Arg Asp His Ala Asp Leu Ile Arg Arg Ile Gly Ala Gln Ser

385 390 395 400

Thr Val Leu Leu Lys Asn Lys Gly Ala Leu Pro Leu Ser Arg Lys Glu

405 410 415

Lys Leu Val Ala Leu Leu Gly Glu Asp Ala Gly Ser Asn Ser Trp Gly

420 425 430

Ala Asn Gly Cys Asp Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met

435 440 445

Ala Trp Gly Ser Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu

450 455 460

Gln Ala Ile Gln Asn Glu Val Leu Gln Gly Arg Gly Asn Val Phe Ala

465 470 475 480

Val Thr Asp Ser Trp Ala Leu Asp Lys Ile Ala Ala Ala Ala Arg Gln

485 490 495

Ala Ser Val Ser Leu Val Phe Val Asn Ser Asp Ser Gly Glu Gly Tyr

500 505 510

Leu Ser Val Asp Gly Asn Glu Gly Asp Arg Asn Asn Ile Thr Leu Trp

515 520 525

Lys Asn Gly Asp Asn Val Val Lys Thr Ala Ala Asn Asn Cys Asn Asn

530 535 540

Thr Val Val Ile Ile His Ser Val Gly Pro Val Leu Ile Asp Glu Trp

545 550 555 560

Tyr Asp His Pro Asn Val Thr Gly Ile Leu Trp Ala Gly Leu Pro Gly

565 570 575

Gln Glu Ser Gly Asn Ser Ile Ala Asp Val Leu Tyr Gly Arg Val Asn

580 585 590

Pro Gly Ala Lys Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr

595 600 605

Gly Ser Pro Leu Val Lys Asp Ala Asn Asn Gly Asn Gly Ala Pro Gln

610 615 620

Ser Asp Phe Thr Gln Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys

625 630 635 640

Phe Asn Glu Thr Pro Ile Tyr Glu Phe Gly Tyr Gly Leu Ser Tyr Thr

645 650 655

Thr Phe Glu Leu Ser Asp Leu His Val Gln Pro Leu Asn Ala Ser Arg

660 665 670

Tyr Thr Pro Thr Ser Gly Met Thr Glu Ala Ala Lys Asn Phe Gly Glu

675 680 685

Ile Gly Asp Ala Ser Glu Tyr Val Tyr Pro Glu Gly Leu Glu Arg Ile

690 695 700

His Glu Phe Ile Tyr Pro Trp Ile Asn Ser Thr Asp Leu Lys Ala Ser

705 710 715 720

Ser Asp Asp Ser Asn Tyr Gly Trp Glu Asp Ser Lys Tyr Ile Pro Glu

725 730 735

Gly Ala Thr Asp Gly Ser Ala Gln Pro Arg Leu Pro Ala Ser Gly Gly

740 745 750

Ala Gly Gly Asn Pro Gly Leu Tyr Glu Asp Leu Phe Arg Val Ser Val

755 760 765

Lys Val Lys Asn Thr Gly Asn Val Ala Gly Asp Glu Val Pro Gln Leu

770 775 780

Tyr Val Ser Leu Gly Gly Pro Asn Glu Pro Lys Val Val Leu Arg Lys

785 790 795 800

Phe Glu Arg Ile His Leu Ala Pro Ser Gln Glu Ala Val Trp Thr Thr

805 810 815

Thr Leu Thr Arg Arg Asp Leu Ala Asn Trp Asp Val Ser Ala Gln Asp

820 825 830

Trp Thr Val Thr Pro Tyr Pro Lys Thr Ile Tyr Val Gly Asn Ser Ser

835 840 845

Arg Lys Leu Pro Leu Gln Ala Ser Leu Pro Lys Ala Gln

850 855 860

<210>19

<211>3060

<212>DNA

<213>烟曲霉(Aspergillus fumigatus)

<400>19

atgagattcg gttggctcga ggtggccgct ctgacggccg cttctgtagc caatgcccag 60

gtttgtgatg ctttcccgtc attgtttcgg atatagttga caatagtcat ggaaataatc 120

aggaattggc tttctctcca ccattctacc cttcgccttg ggctgatggc cagggagagt 180

gggcagatgc ccatcgacgc gccgtcgaga tcgtttctca gatgacactg gcggagaagg 240

ttaaccttac aacgggtact gggtgggttg cgactttttt gttgacagtg agctttcttc 300

actgaccatc tacacagatg ggaaatggac cgatgcgtcg gtcaaaccgg cagcgttccc 360

aggtaagctt gcaattctgc aacaacgtgc aagtgtagtt gctaaaacgc ggtggtgcag 420

acttggtatc aactggggtc tttgtggcca ggattcccct ttgggtatcc gtttctgtga 480

gctatacccg cggagtcttt cagtccttgt attatgtgct gatgattgtc tctgtatagc 540

tgacctcaac tccgccttcc ctgctggtac taatgtcgcc gcgacatggg acaagacact 600

cgcctacctt cgtggcaagg ccatgggtga ggaattcaac gacaagggcg tggacatttt 660

gctggggcct gctgctggtc ctctcggcaa atacccggac ggcggcagaa tctgggaagg 720

cttctctcct gatccggttc tcactggtgt acttttcgcc gaaactatca agggtatcca 780

agacgcgggt gtgattgcta ctgccaagca ttacattctg aatgaacagg agcatttccg 840

acaggttggc gaggcccagg gatatggtta caacatcacg gagacgatca gctccaacgt 900

ggatgacaag accatgcacg agttgtacct ttggtgagta gttgacactg caaatgagga 960

ccttgattga tttgactgac ctggaatgca ggccctttgc agatgctgtg cgcggtaaga 1020

ttttccgtag acttgacctc gcgacgaaga aatcgctgac gaaccatcgt agctggcgtt 1080

ggcgctgtca tgtgttccta caatcaaatc aacaacagct acggttgtca aaacagtcaa 1140

actctcaaca agctcctcaa ggctgagctg ggcttccaag gcttcgtcat gagtgactgg 1200

agcgctcacc acagcggtgt cggcgctgcc ctcgctgggt tggatatgtc gatgcctgga 1260

gacatttcct tcgacgacgg actctccttc tggggcacga acctaactgt cagtgttctt 1320

aacggcaccg ttccagcctg gcgtgtcgat gacatggctg ttcgtatcat gaccgcgtac 1380

tacaaggttg gtcgtgaccg tcttcgtatt ccccctaact tcagctcctg gacccgggat 1440

gagtacggct gggagcattc tgctgtctcc gagggagcct ggaccaaggt gaacgacttc 1500

gtcaatgtgc agcgcagtca ctctcagatc atccgtgaga ttggtgccgc tagtacagtg 1560

ctcttgaaga acacgggtgc tcttcctttg accggcaagg aggttaaagt gggtgttctc 1620

ggtgaagacg ctggttccaa cccgtggggt gctaacggct gccccgaccg cggctgtgat 1680

aacggcactc ttgctatggc ctggggtagt ggtactgcca acttccctta ccttgtcacc 1740

cccgagcagg ctatccagcg agaggtcatc agcaacggcg gcaatgtctt tgctgtgact 1800

gataacgggg ctctcagcca gatggcagat gttgcatctc aatccaggtg agtgcgggct 1860

cttagaaaaa gaacgttctc tgaatgaagt tttttaacca ttgcgaacag cgtgtctttg 1920

gtgtttgtca acgccgactc tggagagggt ttcatcagtg tcgacggcaa cgagggtgac 1980

cgcaaaaatc tcactctgtg gaagaacggc gaggccgtca ttgacactgt tgtcagccac 2040

tgcaacaaca cgattgtggt tattcacagt gttgggcccg tcttgatcga ccggtggtat 2100

gataacccca acgtcactgc catcatctgg gccggcttgc ccggtcagga gagtggcaac 2160

tccctggtcg acgtgctcta tggccgcgtc aaccccagcg ccaagacccc gttcacctgg 2220

ggcaagactc gggagtctta cggggctccc ttgctcaccg agcctaacaa tggcaatggt 2280

gctccccagg atgatttcaa cgagggcgtc ttcattgact accgtcactt tgacaagcgc 2340

aatgagaccc ccatttatga gtttggccat ggcttgagct acaccacctt tggttactct 2400

caccttcggg ttcaggccct caatagttcg agttcggcat atgtcccgac tagcggagag 2460

accaagcctg cgccaaccta tggtgagatc ggtagtgccg ccgactacct gtatcccgag 2520

ggtctcaaaa gaattaccaa gtttatttac ccttggctca actcgaccga cctcgaggat 2580

tcttctgacg acccgaacta cggctgggag gactcggagt acattcccga aggcgctagg 2640

gatgggtctc ctcaacccct cctgaaggct ggcggcgctc ctggtggtaa ccctaccctt 2700

tatcaggatc ttgttagggt gtcggccacc ataaccaaca ctggtaacgt cgccggttat 2760

gaagtccctc aattggtgag tgacccgcat gttccttgcg ttgcaatttg gctaactcgc 2820

ttctagtatg tttcactggg cggaccgaac gagcctcggg tcgttctgcg caagttcgac 2880

cgaatcttcc tggctcctgg ggagcaaaag gtttggacca cgactcttaa ccgtcgtgat 2940

ctcgccaatt gggatgtgga ggctcaggac tgggtcatca caaagtaccc caagaaagtg 3000

cacgtcggca gctcctcgcg taagctgcct ctgagagcgc ctctgccccg tgtctactag 3060

<210>20

<211>863

<212>PRT

<213>烟曲霉(Aspergillus fumigatus)

<400>20

Met Arg Phe Gly Trp Leu Glu Val Ala Ala Leu Thr Ala Ala Ser Val

1 5 10 15

Ala Asn Ala Gln Glu Leu Ala Phe Ser Pro Pro Phe Tyr Pro Ser Pro

20 25 30

Trp Ala Asp Gly Gln Gly Glu Trp Ala Asp Ala His Arg Arg Ala Val

35 40 45

Glu Ile Val Ser Gln Met Thr Leu Ala Glu Lys Val Asn Leu Thr Thr

50 55 60

Gly Thr Gly Trp Glu Met Asp Arg Cys Val Gly Gln Thr Gly Ser Val

65 70 75 80

Pro Arg Leu Gly Ile Asn Trp Gly Leu Cys Gly Gln Asp Ser Pro Leu

85 90 95

Gly Ile Arg Phe Ser Asp Leu Asn Ser Ala Phe Pro Ala Gly Thr Asn

100 105 110

Val Ala Ala Thr Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Lys Ala

115 120 125

Met Gly Glu Glu Phe Asn Asp Lys Gly Val Asp Ile Leu Leu Gly Pro

130 135 140

Ala Ala Gly Pro Leu Gly Lys Tyr Pro Asp Gly Gly Arg Ile Trp Glu

145 150 155 160

Gly Phe Ser Pro Asp Pro Val Leu Thr Gly Val Leu Phe Ala Glu Thr

165 170 175

Ile Lys Gly Ile Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr

180 185 190

Ile Leu Asn Glu Gln Glu His Phe Arg Gln Val Gly Glu Ala Gln Gly

195 200 205

Tyr Gly Tyr Asn Ile Thr Glu Thr Ile Ser Ser Asn Val Asp Asp Lys

210 215 220

Thr Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala

225 230 235 240

Gly Val Gly Ala Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr

245 250 255

Gly Cys Gln Asn Ser Gln Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu

260 265 270

Gly Phe Gln Gly Phe Val Met Ser Asp Trp Ser Ala His His Ser Gly

275 280 285

Val Gly Ala Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Ile

290 295 300

Ser Phe Asp Asp Gly Leu Ser Phe Trp Gly Thr Asn Leu Thr Val Ser

305 310 315 320

Val Leu Asn Gly Thr Val Pro Ala Trp Arg Val Asp Asp Met Ala Val

325 330 335

Arg Ile Met Thr Ala Tyr Tyr Lys Val Gly Arg Asp Arg Leu Arg Ile

340 345 350

Pro Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Trp Glu His

355 360 365

Ser Ala Val Ser Glu Gly Ala Trp Thr Lys Val Asn Asp Phe Val Asn

370 375 380

Val Gln Arg Ser His Ser Gln Ile Ile Arg Glu Ile Gly Ala Ala Ser

385 390 395 400

Thr Val Leu Leu Lys Asn Thr Gly Ala Leu Pro Leu Thr Gly Lys Glu

405 410 415

Val Lys Val Gly Val Leu Gly Glu Asp Ala Gly Ser Asn Pro Trp Gly

420 425 430

Ala Asn Gly Cys Pro Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met

435 440 445

Ala Trp Gly Ser Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu

450 455 460

Gln Ala Ile Gln Arg Glu Val Ile Ser Asn Gly Gly Asn Val Phe Ala

465 470 475 480

Val Thr Asp Asn Gly Ala Leu Ser Gln Met Ala Asp Val Ala Ser Gln

485 490 495

Ser Ser Val Ser Leu Val Phe Val Asn Ala Asp Ser Gly Glu Gly Phe

500 505 510

Ile Ser Val Asp Gly Asn Glu Gly Asp Arg Lys Asn Leu Thr Leu Trp

515 520 525

Lys Asn Gly Glu Ala Val Ile Asp Thr Val Val Ser His Cys Asn Asn

530 535 540

Thr Ile Val Val Ile His Ser Val Gly Pro Val Leu Ile Asp Arg Trp

545 550 555 560

Tyr Asp Asn Pro Asn Val Thr Ala Ile Ile Trp Ala Gly Leu Pro Gly

565 570 575

Gln Glu Ser Gly Asn Ser Leu Val Asp Val Leu Tyr Gly Arg Val Asn

580 585 590

Pro Ser Ala Lys Thr Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr

595 600 605

Gly Ala Pro Leu Leu Thr Glu Pro Asn Asn Gly Asn Gly Ala Pro Gln

610 615 620

Asp Asp Phe Asn Glu Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys

625 630 635 640

Arg Asn Glu Thr Pro Ile Tyr Glu Phe Gly His Gly Leu Ser Tyr Thr

645 650 655

Thr Phe Gly Tyr Ser His Leu Arg Val Gln Ala Leu Asn Ser Ser Ser

660 665 670

Ser Ala Tyr Val Pro Thr Ser Gly Glu Thr Lys Pro Ala Pro Thr Tyr

675 680 685

Gly Glu Ile Gly Ser Ala Ala Asp Tyr Leu Tyr Pro Glu Gly Leu Lys

690 695 700

Arg Ile Thr Lys Phe Ile Tyr Pro Trp Leu Asn Ser Thr Asp Leu Glu

705 710 715 720

Asp Ser Ser Asp Asp Pro Asn Tyr Gly Trp Glu Asp Ser Glu Tyr Ile

725 730 735

Pro Glu Gly Ala Arg Asp Gly Ser Pro Gln Pro Leu Leu Lys Ala Gly

740 745 750

Gly Ala Pro Gly Gly Asn Pro Thr Leu Tyr Gln Asp Leu Val Arg Val

755 760 765

Ser Ala Thr Ile Thr Asn Thr Gly Asn Val Ala Gly Tyr Glu Val Pro

770 775 780

Gln Leu Tyr Val Ser Leu Gly Gly Pro Asn Glu Pro Arg Val Val Leu

785 790 795 800

Arg Lys Phe Asp Arg Ile Phe Leu Ala Pro Gly Glu Gln Lys Val Trp

805 810 815

Thr Thr Thr Leu Asn Arg Arg Asp Leu Ala AsnTrp Asp Val Glu Ala

820 825 830

Gln Asp Trp Val Ile Thr Lys Tyr Pro Lys Lys Val His Val Gly Ser

835 840 845

Ser Ser Arg Lys Leu Pro Leu Arg Ala Pro Leu Pro Arg Val Tyr

850 855 860

<210>21

<211>2800

<212>DNA

<213>巴西青霉(Penicillium brasilianum)

<400>21

tgaaaatgca gggttctaca atctttctgg ctttcgcctc atgggcgagc caggttgctg 60

ccattgcgca gcccatacag aagcacgagg tttgttttat cttgctcatg gacgtgcttt 120

gacttgacta attgttttac atacagcccg gatttctgca cgggccccaa gccatagaat 180

cgttctcaga accgttctac ccgtcgccct ggatgaatcc tcacgccgag ggctgggagg 240

ccgcatatca gaaagctcaa gattttgtct cgcaactcac tatcttggag aaaataaatc 300

tgaccaccgg tgttgggtaa gtctctccga ctgcttctgg gtcacggtgc gacgagccac 360

tgactttttg aagctgggaa aatgggccgt gtgtaggaaa cactggatca attcctcgtc 420

tcggattcaa aggattttgt acccaggatt caccacaggg tgttcggttc gcagattatt 480

cctccgcttt cacatctagc caaatggccg ccgcaacatt tgaccgctca attctttatc 540

aacgaggcca agccatggca caggaacaca aggctaaggg tatcacaatt caattgggcc 600

ctgttgccgg ccctctcggt cgcatccccg agggcggccg caactgggaa ggattctccc 660

ctgatcctgt cttgactggt atagccatgg ctgagacaat taagggcatg caggatactg 720

gagtgattgc ttgcgctaaa cattatattg gaaacgagca ggagcacttc cgtcaagtgg 780

gtgaagctgc gggtcacgga tacactattt ccgatactat ttcatctaat attgacgacc 840

gtgctatgca tgagctatac ttgtggccat ttgctgatgc cgttcgcgct ggtgtgggtt 900

ctttcatgtg ctcatactct cagatcaaca actcctacgg atgccaaaac agtcagaccc 960

tcaacaagct cctcaagagc gaattgggct tccaaggctt tgtcatgagc gattggggtg 1020

cccatcactc tggagtgtca tcggcgctag ctggacttga tatgagcatg ccgggtgata 1080

ccgaatttga ttctggcttg agcttctggg gctctaacct caccattgca attctgaacg 1140

gcacggttcc cgaatggcgc ctggatgaca tggcgatgcg aattatggct gcatacttca 1200

aagttggcct tactattgag gatcaaccag atgtcaactt caatgcctgg acccatgaca 1260

cctacggata taaatacgct tatagcaagg aagattacga gcaggtcaac tggcatgtcg 1320

atgttcgcag cgaccacaat aagctcattc gcgagactgc cgcgaagggt acagttctgc 1380

tgaagaacaa ctttcatgct ctccctctga agcagcccag gttcgtggcc gtcgttggtc 1440

aggatgccgg gccaaacccc aagggcccta acggctgcgc agaccgagga tgcgaccaag 1500

gcactctcgc aatgggatgg ggctcagggt ctaccgaatt cccttacctg gtcactcctg 1560

acactgctat tcagtcaaag gtcctcgaat acgggggtcg atacgagagt atttttgata 1620

actatgacga caatgctatc ttgtcgcttg tctcacagcc tgatgcaacc tgtatcgttt 1680

ttgcaaatgc cgattccggt gaaggctaca tcactgtcga caacaactgg ggtgaccgca 1740

acaatctgac cctctggcaa aatgccgatc aagtgattag cactgtcagc tcgcgatgca 1800

acaacacaat cgttgttctc cactctgtcg gaccagtgtt gctaaatggt atatatgagc 1860

acccgaacat cacagctatt gtctgggcag ggatgccagg cgaagaatct ggcaatgctc 1920

tcgtggatat tctttggggc aatgttaacc ctgccggtcg cactccgttc acctgggcca 1980

aaagtcgaga ggactatggc actgatataa tgtacgagcc caacaacggc cagcgtgcgc 2040

ctcagcagga tttcaccgag agcatctacc tcgactaccg ccatttcgac aaagctggta 2100

tcgagccaat ttacgagttt ggattcggcc tctcctatac caccttcgaa tactctgacc 2160

tccgtgttgt gaagaagtat gttcaaccat acagtcccac gaccggcacc ggtgctcaag 2220

caccttccat cggacagcca cctagccaga acctggatac etacaagttc cctgctacat 2280

acaagtacat caaaaccttc atttatccct acctgaacag cactgtctcc ctccgcgctg 2340

cttccaagga tcccgaatac ggtcgtacag actttatccc accccacgcg cgtgatggct 2400

cccctcaacc tctcaacccc gctggagacc cagtggccag tggtggaaac aacatgctct 2460

acgacgaact ttacgaggtc actgcacaga tcaaaaacac tggcgacgtg gccggcgacg 2520

aagtcgtcca gctttacgta gatctcgggg gtgacaaccc gcctcgtcag ttgagaaact 2580

ttgacaggtt ttatctgctg cccggtcaga gctcaacatt ccgggctaca ttgacgcgcc 2640

gtgatttgag caactgggat attgaggcgc agaactggcg agttacggaa tcgcctaaga 2700

gagtgtatgt tggacggtcg agtcgggatt tgccgctgag ctcacaattg gagtaatgat 2760

catgtctacc aatagatgtt gaatgtctgg tgtggatatt 2800

<210>22

<211>878

<212>PRT

<213>巴西青霉(Penicillium brasilianum)

<400>22

Met Gln Gly Ser Thr Ile Phe Leu Ala Phe Ala Ser Trp Ala Ser Gln

1 5 10 15

Val Ala Ala Ile Ala Gln Pro Ile Gln Lys His Glu Pro Gly Phe Leu

20 25 30

His Gly Pro Gln Ala Ile Glu Ser Phe Ser Glu Pro Phe Tyr Pro Ser

35 40 45

Pro Trp Met Asn Pro His Ala Glu Gly Trp Glu Ala Ala Tyr Gln Lys

50 55 60

Ala Gln Asp Phe Val Ser Gln Leu Thr Ile Leu Glu Lys Ile Asn Leu

65 70 75 80

Thr Thr Gly Val Gly Trp Glu Asn Gly Pro Cys Val Gly Asn Thr Gly

85 90 95

Ser Ile Pro Arg Leu Gly Phe Lys Gly Phe Cys Thr Gln Asp Ser Pro

100 105 110

Gln Gly Val Arg Phe Ala Asp Tyr Ser Ser Ala Phe Thr Ser Ser Gln

115 120 125

Met Ala Ala Ala Thr Phe Asp Arg Ser Ile Leu Tyr Gln Arg Gly Gln

130 135 140

Ala Met Ala Gln Glu His Lys Ala Lys Gly Ile Thr Ile Gln Leu Gly

145 150 155 160

Pro Val Ala Gly Pro Leu Gly Arg Ile Pro Glu Gly Gly Arg Asn Trp

165 170 175

Glu Gly Phe Ser Pro Asp Pro Val Leu Thr Gly Ile Ala Met Ala Glu

180 185 190

Thr Ile Lys Gly Met Gln Asp Thr Gly Val Ile Ala Cys Ala Lys His

195 200 205

Tyr Ile Gly Asn Glu Gln Glu His Phe Arg Gln Val Gly Glu Ala Ala

210 215 220

Gly His Gly Tyr Thr Ile Ser Asp Thr Ile Ser Ser Asn Ile Asp Asp

225 230 235 240

Arg Ala Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg

245 250 255

Ala Gly Val Gly Ser Phe Met Cys Ser Tyr Ser Gln Ile Asn Asn Ser

260 265 270

Tyr Gly Cys Gln Asn Ser Gln Thr Leu Asn Lys Leu Leu Lys Ser Glu

275 280 285

Leu Gly Phe Gln Gly Phe Val Met Ser Asp Trp Gly Ala His His Ser

290 295 300

Gly Val Ser Ser Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp

305 310 315 320

Thr Glu Phe Asp Ser Gly Leu Ser Phe Trp Gly Ser Asn Leu Thr Ile

325 330 335

Ala Ile Leu Asn Gly Thr Val Pro Glu Trp Arg Leu Asp Asp Met Ala

340 345 350

Met Arg Ile Met Ala Ala Tyr Phe Lys Val Gly Leu Thr Ile Glu Asp

355 360 365

Gln Pro Asp Val Asn Phe Asn Ala Trp Thr His Asp Thr Tyr Gly Tyr

370 375 380

Lys Tyr Ala Tyr Ser Lys Glu Asp Tyr Glu Gln Val Asn Trp His Val

385 390 395 400

Asp Val Arg Ser Asp His Asn Lys Leu Ile Arg Glu Thr Ala Ala Lys

405 410 415

Gly Thr Val Leu Leu Lys Asn Asn Phe His Ala Leu Pro Leu Lys Gln

420 425 430

Pro Arg Phe Val Ala Val Val Gly Gln Asp Ala Gly Pro Asn Pro Lys

435 440 445

Gly Pro Asn Gly Cys Ala Asp Arg Gly Cys Asp Gln Gly Thr Leu Ala

450 455 460

Met Gly Trp Gly Ser Gly Ser Thr Glu Phe Pro Tyr Leu Val Thr Pro

465 470 475 480

Asp Thr Ala Ile Gln Ser Lys Val Leu Glu Tyr Gly Gly Arg Tyr Glu

485 490 495

Ser Ile Phe Asp Asn Tyr Asp Asp Asn Ala Ile Leu Ser Leu Val Ser

500 505 510

Gln Pro Asp Ala Thr Cys Ile Val Phe Ala Asn Ala Asp Ser Gly Glu

515 520 525

Gly Tyr Ile Thr Val Asp Asn Asn Trp Gly Asp Arg Asn Asn Leu Thr

530 535 540

Leu Trp Gln Asn Ala Asp Gln Val Ile Ser Thr Val Ser Ser Arg Cys

545 550 555 560

Asn Asn Thr Ile Val Val Leu His Ser Val Gly Pro Val Leu Leu Asn

565 570 575

Gly Ile Tyr Glu His Pro Asn Ile Thr Ala Ile Val Trp Ala Gly Met

580 585 590

Pro Gly Glu Glu Ser Gly Asn Ala Leu Val Asp Ile Leu Trp Gly Asn

595 600 605

Val Asn Pro Ala Gly Arg Thr Pro Phe Thr Trp Ala Lys Ser Arg Glu

610 615 620

Asp Tyr Gly Thr Asp Ile Met Tyr Glu Pro Asn Asn Gly Gln Arg Ala

625 630 635 640

Pro Gln Gln Asp Phe Thr Glu Ser Ile Tyr Leu Asp Tyr Arg His Phe

645 650 655

Asp Lys Ala Gly Ile Glu Pro Ile Tyr Glu Phe Gly Phe Gly Leu Ser

660 665 670

Tyr Thr Thr Phe Glu Tyr Ser Asp Leu Arg Val Val Lys Lys Tyr Val

675 680 685

Gln Pro Tyr Ser Pro Thr Thr Gly Thr Gly Ala Gln Ala Pro Ser Ile

690 695 700

Gly Gln Pro Pro Ser Gln Asn Leu Asp Thr Tyr Lys Phe Pro Ala Thr

705 710 715 720

Tyr Lys Tyr Ile Lys Thr Phe Ile Tyr Pro Tyr Leu Asn Ser Thr Val

725 730 735

Ser Leu Arg Ala Ala Ser Lys Asp Pro Glu Tyr Gly Arg Thr Asp Phe

740 745 750

Ile Pro Pro His Ala Arg Asp Gly Ser Pro Gln Pro Leu Asn Pro Ala

755 760 765

Gly Asp Pro Val Ala Ser Gly Gly Asn Asn Met Leu Tyr Asp Glu Leu

770 775 780

Tyr Glu Val Thr Ala Gln Ile Lys Asn Thr Gly Asp Val Ala Gly Asp

785 790 795 800

Glu Val Val Gln Leu Tyr Val Asp Leu Gly Gly Asp Asn Pro Pro Arg

805 810 815

Gln Leu Arg Asn Phe Asp Arg Phe Tyr Leu Leu Pro Gly Gln Ser Ser

820 825 830

Thr Phe Arg Ala Thr Leu Thr Arg Arg Asp Leu Ser Asn Trp Asp Ile

835 840 845

Glu Ala Gln Asn Trp Arg Val Thr Glu Ser Pro Lys Arg Val Tyr Val

850 855 860

Gly Arg Ser Ser Arg Asp Leu Pro Leu Ser Ser Gln Leu Glu

865 870 875

<210>23

<211>2235

<212>DNA

<213>里氏木霉(Trichoderma reesei)

<400>23

atgcgttacc gaacagcagc tgcgctggca cttgccactg ggccctttgc tagggcagac 60

agtcactcaa catcgggggc ctcggctgag gcagttgtac ctcctgcagg gactccatgg 120

ggaaccgcgt acgacaaggc gaaggccgca ttggcaaagc tcaatctcca agataaggtc 180

ggcatcgtga gcggtgtcgg ctggaacggc ggtccttgcg ttggaaacac atctccggcc 240

tccaagatca gctatccatc gctatgcctt caagacggac ccctcggtgt tcgatactcg 300

acaggcagca cagcctttac gccgggcgtt caagcggcct cgacgtggga tgtcaatttg 360

atccgcgaac gtggacagtt catcggtgag gaggtgaagg cctcggggat tcatgtcata 420

cttggtcctg tggctgggcc gctgggaaag actccgcagg gcggtcgcaa ctgggagggc 480

ttcggtgtcg atccatatct cacgggcatt gccatgggtc aaaccatcaa cggcatccag 540

tcggtaggcg tgcaggcgac agcgaagcac tatatcctca acgagcagga gctcaatcga 600

gaaaccattt cgagcaaccc agatgaccga actctccatg agctgtatac ttggccattt 660

gccgacgcgg ttcaggccaa tgtcgcttct gtcatgtgct cgtacaacaa ggtcaatacc 720

acctgggcct gcgaggatca gtacacgctg cagactgtgc tgaaagacca gctggggttc 780

ccaggctatg tcatgacgga ctggaacgca cagcacacga ctgtccaaag cgcgaattct 840

gggcttgaca tgtcaatgcc tggcacagac ttcaacggta acaatcggct ctggggtcca 900

gctctcacca atgcggtaaa tagcaatcag gtccccacga gcagagtcga cgatatggtg 960

actcgtatcc tcgccgcatg gtacttgaca ggccaggacc aggcaggcta tccgtcgttc 1020

aacatcagca gaaatgttca aggaaaccac aagaccaatg tcagggcaat tgccagggac 1080

ggcatcgttc tgctcaagaa tgacgccaac atcctgccgc tcaagaagcc cgctagcatt 1140

gccgtcgttg gatctgccgc aatcattggt aaccacgcca gaaactcgcc ctcgtgcaac 1200

gacaaaggct gcgacgacgg ggccttgggc atgggttggg gttccggcgc cgtcaactat 1260

ccgtacttcg tcgcgcccta cgatgccatc aataccagag cgtcttcgca gggcacccag 1320

gttaccttga gcaacaccga caacacgtcc tcaggcgcat ctgcagcaag aggaaaggac 1380

gtcgccatcg tcttcatcac cgccgactcg ggtgaaggct acatcaccgt ggagggcaac 1440

gcgggcgatc gcaacaacct ggatccgtgg cacaacggca atgccctggt ccaggcggtg 1500

gccggtgcca acagcaacgt cattgttgtt gtccactccg ttggcgccat cattctggag 1560

cagattcttg ctcttccgca ggtcaaggcc gttgtctggg cgggtcttcc ttctcaggag 1620

agcggcaatg cgctcgtcga cgtgctgtgg ggagatgtca gcccttctgg caagctggtg 1680

tacaccattg cgaagagccc caatgactat aacactcgca tcgtttccgg cggcagtgac 1740

agcttcagcg agggactgtt catcgactat aagcacttcg acgacgccaa tatcacgccg 1800

cggtacgagt tcggctatgg actgtcttac accaagttca actactcacg cctctccgtc 1860

ttgtcgaccg ccaagtctgg tcctgcgact ggggccgttg tgccgggagg cccgagtgat 1920

ctgttccaga atgtcgcgac agtcaccgtt gacatcgcaa actctggcca agtgactggt 1980

gccgaggtag cccagctgta catcacctac ccatcttcag cacccaggac ccctccgaag 2040

cagctgcgag gctttgccaa gctgaacctc acgcctggtc agagcggaac agcaacgttc 2100

aacatccgac gacgagatct cagctactgg gacacggctt cgcagaaatg ggtggtgccg 2160

tcggggtcgt ttggcatcag cgtgggagcg agcagccggg atatcaggct gacgagcact 2220

ctgtcggtag cgtag 2235

<210>24

<211>744

<212>PRT

<213>里氏木霉(Trichoderma reesei)

<400>24

Met Arg Tyr Arg Thr Ala Ala Ala Leu Ala Leu Ala Thr Gly Pro Phe

1 5 10 15

Ala Arg Ala Asp Ser His Ser Thr Ser Gly Ala Ser Ala Glu Ala Val

20 25 30

Val Pro Pro Ala Gly Thr Pro Trp Gly Thr Ala Tyr Asp Lys Ala Lys

35 40 45

Ala Ala Leu Ala Lys Leu Asn Leu Gln Asp Lys Val Gly Ile Val Ser

50 55 60

Gly Val Gly Trp Asn Gly Gly Pro Cys Val Gly Asn Thr Ser Pro Ala

65 70 75 80

Ser Lys Ile Ser Tyr Pro Ser Leu Cys Leu Gln Asp Gly Pro Leu Gly

85 90 95

Val Arg Tyr Ser Thr Gly Ser Thr Ala Phe Thr Pro Gly Val Gln Ala

100 105 110

Ala Ser Thr Trp Asp Val Asn Leu Ile Arg Glu Arg Gly Gln Phe Ile

115 120 125

Gly Glu Glu Val Lys Ala Ser Gly Ile His Val Ile Leu Gly Pro Val

130 135 140

Ala Gly Pro Leu Gly Lys Thr Pro Gln Gly Gly Arg Asn Trp Glu Gly

145 150 155 160

Phe Gly Val Asp Pro Tyr Leu Thr Gly Ile Ala Met Gly Gln Thr Ile

165 170 175

Asn Gly Ile Gln Ser Val Gly Val Gln Ala Thr Ala Lys His Tyr Ile

180 185 190

Leu Asn Glu Gln Glu Leu Asn Arg Glu Thr Ile Ser Ser Asn Pro Asp

195 200 205

Asp Arg Thr Leu His Glu Leu Tyr Thr Trp Pro Phe Ala Asp Ala Val

210 215 220

Gln Ala Asn Val Ala Ser Val Met Cys Ser Tyr Asn Lys Val Asn Thr

225 230 235 240

Thr Trp Ala Cys Glu Asp Gln Tyr Thr Leu Gln Thr Val Leu Lys Asp

245 250 255

Gln Leu Gly Phe Pro Gly Tyr Val Met Thr Asp Trp Asn Ala Gln His

260 265 270

Thr Thr Val Gln Ser Ala Asn Ser Gly Leu Asp Met Ser Met Pro Gly

275 280 285

Thr Asp Phe Asn Gly Asn Asn Arg Leu Trp Gly Pro Ala Leu Thr Asn

290 295 300

Ala Val Asn Ser Asn Gln Val Pro Thr Ser Arg Val Asp Asp Met Val

305 310 315 320

Thr Arg Ile Leu Ala Ala Trp Tyr Leu Thr Gly Gln Asp Gln Ala Gly

325 330 335

Tyr Pro Ser Phe Asn Ile Ser Arg Asn Val Gln Gly Asn His Lys Thr

340 345 350

Asn Val Arg Ala Ile Ala Arg Asp Gly Ile Val Leu Leu Lys Asn Asp

355 360 365

Ala Asn Ile Leu Pro Leu Lys Lys Pro Ala Ser Ile Ala Val Val Gly

370 375 380

Ser Ala Ala Ile Ile Gly Asn His Ala Arg Asn Ser Pro Ser Cys Asn

385 390 395 400

Asp Lys Gly Cys Asp Asp Gly Ala Leu Gly Met Gly Trp Gly Ser Gly

405 410 415

Ala Val Asn Tyr Pro Tyr Phe Val Ala Pro Tyr Asp Ala Ile Asn Thr

420 425 430

Arg Ala Ser Ser Gln Gly Thr Gln Val Thr Leu Ser Asn Thr Asp Asn

435 440 445

Thr Ser Ser Gly Ala Ser Ala Ala Arg Gly Lys Asp Val Ala Ile Val

450 455 460

Phe Ile Thr Ala Asp Ser Gly Glu Gly Tyr Ile Thr Val Glu Gly Asn

465 470 475 480

Ala Gly Asp Arg Asn Asn Leu Asp Pro Trp His Asn Gly Asn Ala Leu

485 490 495

Val Gln Ala Val Ala Gly Ala Asn Ser Asn Val Ile Val Val Val His

500 505 510

Ser Val Gly Ala Ile Ile Leu Glu Gln Ile Leu Ala Leu Pro Gln Val

515 520 525

Lys Ala Val Val Trp Ala Gly Leu Pro Ser Gln Glu Ser Gly Asn Ala

530 535 540

Leu Val Asp Val Leu Trp Gly Asp Val Ser Pro Ser Gly Lys Leu Val

545 550 555 560

Tyr Thr Ile Ala Lys Ser Pro Asn Asp Tyr Asn Thr Arg Ile Val Ser

565 570 575

Gly Gly Ser Asp Ser Phe Ser Glu Gly Leu Phe Ile Asp Tyr Lys His

580 585 590

Phe Asp Asp Ala Asn Ile Thr Pro Arg Tyr Glu Phe Gly Tyr Gly Leu

595 600 605

Ser Tyr Thr Lys Phe Asn Tyr Ser Arg Leu Ser Val Leu Ser Thr Ala

610 615 620

Lys Ser Gly Pro Ala Thr Gly Ala Val Val Pro Gly Gly Pro Ser Asp

625 630 635 640

Leu Phe Gln Asn Val Ala Thr Val Thr Val Asp Ile Ala Asn Ser Gly

645 650 655

Gln Val Thr Gly Ala Glu Val Ala Gln Leu Tyr Ile Thr Tyr Pro Ser

660 665 670

Ser Ala Pro Arg Thr Pro Pro Lys Gln Leu Arg Gly Phe Ala Lys Leu

675 680 685

Asn Leu Thr Pro Gly Gln Ser Gly Thr Ala Thr Phe Asn Ile Arg Arg

690 695 700

Arg Asp Leu Ser Tyr Trp Asp Thr Ala Ser Gln Lys Trp Val Val Pro

705 710 715 720

Ser Gly Ser Phe Gly Ile Ser Val Gly Ala Ser Ser Arg Asp Ile Arg

725 730 735

Leu Thr Ser Thr Leu Ser Val Ala

740

<210>25

<211>2583

<212>DNA

<213>黑曲霉(Aspergillus niger)

<400>25

atgaggttca ctttgatcga ggcggtggct ctgactgccg tctcgctggc cagcgctgat 60

gaattggcct actccccacc gtattaccca tccccttggg ccaatggcca gggcgactgg 120

gcgcaggcat accagcgcgc tgttgatatt gtctcgcaaa tgacattgga tgagaaggtc 180

aatctgacca caggaactgg atgggaattg gaactatgtg ttggtcagac tggcggtgtt 240

ccccgattgg gagttccggg aatgtgttta caggatagcc ctctgggcgt tcgcgactcc 300

gactacaact ctgctttccc tgccggcatg aacgtggctg caacctggga caagaatctg 360

gcataccttc gcggcaaggc tatgggtcag gaatttagtg acaagggtgc cgatatccaa 420

ttgggtccag ctgccggccc tctcggtaga agtcccgacg gtggtcgtaa ctgggagggc 480

ttctccccag accctgccct aagtggtgtg ctctttgccg agaccatcaa gggtatccaa 540

gatgctggtg tggttgcgac ggctaagcac tacattgctt acgagcaaga gcatttccgt 600

caggcgcctg aagcccaagg ttttggattt aatatttccg agagtggaag tgcgaacctc 660

gatgataaga ctatgcacga gctgtacctc tggcccttcg cggatgccat ccgtgcaggt 720

gctggcgctg tgatgtgctc ctacaaccag atcaacaaca gttatggctg ccagaacagc 780

tacactctga acaagctgct caaggccgag ctgggcttcc agggctttgt catgagtgat 840

tgggctgctc accatgctgg tgtgagtggt gctttggcag gattggatat gtctatgcca 900

ggagacgtcg actacgacag tggtacgtct tactggggta caaacttgac cattagcgtg 960

ctcaacggaa cggtgcccca atggcgtgtt gatgacatgg ctgtccgcat catggccgcc 1020

tactacaagg tcggccgtga ccgtctgtgg actcctccca acttcagctc atggaccaga 1080

gatgaatacg gctacaagta ctactacgtg tcggagggac cgtacgagaa ggtcaaccag 1140

tacgtgaatg tgcaacgcaa ccacagcgaa ctgattcgcc gcattggagc ggacagcacg 1200

gtgctcctca agaacgacgg cgctctgcct ttgactggta aggagcgcct ggtcgcgctt 1260

atcggagaag atgcgggctc caacccttat ggtgccaacg gctgcagtga ccgtggatgc 1320

gacaatggaa cattggcgat gggctgggga agtggtactg ccaacttccc atacctggtg 1380

acccccgagc aggccatctc aaacgaggtg cttaagcaca agaatggtgt attcaccgcc 1440

accgataact gggctatcga tcagattgag gcgcttgcta agaccgccag tgtctctctt 1500

gtctttgtca acgccgactc tggtgagggt tacatcaatg tggacggaaa cctgggtgac 1560

cgcaggaacc tgaccctgtg gaggaacggc gataatgtga tcaaggctgc tgctagcaac 1620

tgcaacaaca caatcgttgt cattcactct gtcggaccag tcttggttaa cgagtggtac 1680

gacaacccca atgttaccgc tatcctctgg ggtggtttgc ccggtcagga gtctggcaac 1740

tctcttgccg acgtcctcta tggccgtgtc aaccccggtg ccaagtcgcc ctttacctgg 1800

ggcaagactc gtgaggccta ccaagactac ttggtcaccg agcccaacaa cggcaacgga 1860

gcccctcagg aagactttgt cgagggcgtc ttcattgact accgtggatt tgacaagcgc 1920

aacgagaccc cgatctacga gttcggctat ggtctgagct acaccacttt caactactcg 1980

aaccttgagg tgcaggtgct gagcgcccct gcatacgagc ctgcttcggg tgagaccgag 2040

gcagcgccaa ccttcggaga ggttggaaat gcgtcggatt acctctaccc cagcggattg 2100

cagagaatta ccaagttcat ctacccctgg ctcaacggta ccgatctcga ggcatcttcc 2160

ggggatgcta gctacgggca ggactcctcc gactatcttc ccgagggagc caccgatggc 2220

tctgcgcaac cgatcctgcc tgccggtggc ggtcctggcg gcaaccctcg cctgtacgac 2280

gagctcatcc gcgtgtcagt gaccatcaag aacaccggca aggttgctgg tgatgaagtt 2340

ccccaactgt atgtttccct tggcggtccc aatgagccca agatcgtgct gcgtcaattc 2400

gagcgcatca cgctgcagcc gtcggaggag acgaagtgga gcacgactct gacgcgccgt 2460

gaccttgcaa actggaatgt tgagaagcag gactgggaga ttacgtcgta tcccaagatg 2520

gtgtttgtcg gaagctcctc gcggaagctg ccgctccggg cgtctctgcc tactgttcac 2580

taa 2583

<210>26

<211>860

<212>PRT

<213>黑曲霉(Aspergillus niger)

<400>26

Met Arg Phe Thr Leu Ile Glu Ala Val Ala Leu Thr Ala Val Ser Leu

1 5 10 15

Ala Ser Ala Asp Glu Leu Ala Tyr Ser Pro Pro Tyr Tyr Pro Ser Pro

20 25 30

Trp Ala Asn Gly Gln Gly Asp Trp Ala Gln Ala Tyr Gln Arg Ala Val

35 40 45

Asp Ile Val Ser Gln Met Thr Leu Asp Glu Lys Val Asn Leu Thr Thr

50 55 60

Gly Thr Gly Trp Glu Leu Glu Leu Cys Val Gly Gln Thr Gly Gly Val

65 70 75 80

Pro Arg Leu Gly Val Pro Gly Met Cys Leu Gln Asp Ser Pro Leu Gly

85 90 95

Val Arg Asp Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Met Asn Val

100 105 110

Ala Ala Thr Trp Asp Lys Asn Leu Ala Tyr Leu Arg Gly Lys Ala Met

115 120 125

Gly Gln Glu Phe Ser Asp Lys Gly Ala Asp Ile Gln Leu Gly Pro Ala

130 135 140

Ala Gly Pro Leu Gly Arg Ser Pro Asp Gly Gly Arg Asn Trp Glu Gly

145 150 155 160

Phe Ser Pro Asp Pro Ala Leu Ser Gly Val Leu Phe Ala Glu Thr Ile

165 170 175

Lys Gly Ile Gln Asp Ala Gly Val Val Ala Thr Ala Lys His Tyr Ile

180 185 190

Ala Tyr Glu Gln Glu His Phe Arg Gln Ala Pro Glu Ala Gln Gly Phe

195 200 205

Gly Phe Asn Ile Ser Glu Ser Gly Ser Ala Asn Leu Asp Asp Lys Thr

210 215 220

Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Ile Arg Ala Gly

225 230 235 240

Ala Gly Ala Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr Gly

245 250 255

Cys Gln Asn Ser Tyr Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu Gly

260 265 270

Phe Gln Gly Phe Val Met Ser Asp Trp Ala Ala His His Ala Gly Val

275 280 285

Ser Gly Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Val Asp

290 295 300

Tyr Asp Ser Gly Thr Ser Tyr Trp Gly Thr Asn Leu Thr Ile Ser Val

305 310 315 320

Leu Asn Gly Thr Val Pro Gln Trp Arg Val Asp Asp Met Ala Val Arg

325 330 335

Ile Met Ala Ala Tyr Tyr Lys Val Gly Arg Asp Arg Leu Trp Thr Pro

340 345 350

Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Tyr Lys Tyr Tyr

355 360 365

Tyr Val Ser Glu Gly Pro Tyr Glu Lys Val Asn Gln Tyr Val Asn Val

370 375 380

Gln Arg Asn His Ser Glu Leu Ile Arg Arg Ile Gly Ala Asp Ser Thr

385 390 395 400

Val Leu Leu Lys Asn Asp Gly Ala Leu Pro Leu Thr Gly Lys Glu Arg

405 410 415

Leu Val Ala Leu Ile Gly Glu Asp Ala Gly Ser Asn Pro Tyr Gly Ala

420 425 430

Asn Gly Cys Ser Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met Gly

435 440 445

Trp Gly Ser Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu Gln

450 455 460

Ala Ile Ser Asn Glu Val Leu Lys His Lys Asn Gly Val Phe Thr Ala

465 470 475 480

Thr Asp Asn Trp Ala Ile Asp Gln Ile Glu Ala Leu Ala Lys Thr Ala

485 490 495

Ser Val Ser Leu Val Phe Val Asn Ala Asp Ser Gly Glu Gly Tyr Ile

500 505 510

Asn Val Asp Gly Asn Leu Gly Asp Arg Arg Asn Leu Thr Leu Trp Arg

515 520 525

Asn Gly Asp Asn Val Ile Lys Ala Ala Ala Ser Asn Cys Asn Asn Thr

530 535 540

Ile Val Val Ile His Ser Val Gly Pro Val Leu Val Asn Glu Trp Tyr

545 550 555 560

Asp Asn Pro Asn Val Thr Ala Ile Leu Trp Gly Gly Leu Pro Gly Gln

565 570 575

Glu Ser Gly Asn Ser Leu Ala Asp Val Leu Tyr Gly Arg Val Asn Pro

580 585 590

Gly Ala Lys Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ala Tyr Gln

595 600 605

Asp Tyr Leu Val Thr Glu Pro Asn Asn Gly Asn Gly Ala Pro Gln Glu

610 615 620

Asp Phe Val Glu Gly Val Phe Ile Asp Tyr Arg Gly Phe Asp Lys Arg

625 630 635 640

Asn Glu Thr Pro Ile Tyr Glu Phe Gly Tyr Gly Leu Ser Tyr Thr Thr

645 650 655

Phe Asn Tyr Ser Asn Leu Glu Val Gln Val Leu Ser Ala Pro Ala Tyr

660 665 670

Glu Pro Ala Ser Gly Glu Thr Glu Ala Ala Pro Thr Phe Gly Glu Val

675 680 685

Gly Asn Ala Ser Asp Tyr Leu Tyr Pro Ser Gly Leu Gln Arg Ile Thr

690 695 700

Lys Phe Ile Tyr Pro Trp Leu Asn Gly Thr Asp Leu Glu Ala Ser Ser

705 710 715 720

Gly Asp Ala Ser Tyr Gly Gln Asp Ser Ser Asp Tyr Leu Pro Glu Gly

725 730 735

Ala Thr Asp Gly Ser Ala Gln Pro Ile Leu Pro Ala Gly Gly Gly Pro

740 745 750

Gly Gly Asn Pro Arg Leu Tyr Asp Glu Leu Ile Arg Val Ser Val Thr

755 760 765

Ile Lys Asn Thr Gly Lys Val Ala Gly Asp Glu Val Pro Gln Leu Tyr

770 775 780

Val Ser Leu Gly Gly Pro Asn Glu Pro Lys Ile Val Leu Arg Gln Phe

785 790 795 800

Glu Arg Ile Thr Leu Gln Pro Ser Glu Glu Thr Lys Trp Ser Thr Thr

805 810 815

Leu Thr Arg Arg Asp Leu Ala Asn Trp Asn Val Glu Lys Gln Asp Trp

820 825 830

Glu Ile Thr Ser Tyr Pro Lys Met Val Phe Val Gly Ser Ser Ser Arg

835 840 845

Lys Leu Pro Leu Arg Ala Ser Leu Pro Thr Val His

850 855 860

<210>27

<211>2583

<212>DNA

<213>棘孢曲霉(Aspergillus aculeatus)

<400>27

atgaagctca gttggcttga ggcggctgcc ttgacggctg cttcagtcgt cagcgctgat 60

gaactggcgt tctctcctcc tttctacccc tctccgtggg ccaatggcca gggagagtgg 120

gcggaagcct accagcgtgc agtggccatt gtatcccaga tgactctgga tgagaaggtc 180

aacctgacca ccggaactgg atgggagctg gagaagtgcg tcggtcagac tggtggtgtc 240

ccaagactga acatcggtgg catgtgtctt caggacagtc ccttgggaat tcgtgatagt 300

gactacaatt cggctttccc tgctggtgtc aacgttgctg cgacatggga caagaacctt 360

gcttatctac gtggtcaggc tatgggtcaa gagttcagtg acaaaggaat tgatgttcaa 420

ttgggaccgg ccgcgggtcc cctcggcagg agccctgatg gaggtcgcaa ctgggaaggt 480

ttctctccag acccggctct tactggtgtg ctctttgcgg agacgattaa gggtattcaa 540

gacgctggtg tcgtggcgac agccaagcat tacattctca atgagcaaga gcatttccgc 600

caggtcgcag aggctgcggg ctacggattc aatatctccg acacgatcag ctctaacgtt 660

gatgacaaga ccattcatga aatgtacctc tggcccttcg cggatgccgt tcgcgecggc 720

gttggcgcca tcatgtgttc ctacaaccag atcaacaaca gctacggttg ccagaacagt 780

tacactctga acaagcttct gaaggccgag ctcggcttcc agggctttgt gatgtctgac 840

tggggtgctc accacagtgg tgttggctct gctttggccg gcttggatat gtcaatgcct 900

ggcgatatca ccttcgattc tgccactagt ttctggggta ccaacctgac cattgctgtg 960

ctcaacggta ccgtcccgca gtggcgcgtt gacgacatgg ctgtccgtat catggctgcc 1020

tactacaagg ttggccgcga ccgcctgtac cagccgccta acttcagctc ctggactcgc 1080

gatgaatacg gcttcaagta tttctacccc caggaagggc cctatgagaa ggtcaatcac 1140

tttgtcaatg tgcagcgcaa ccacagcgag gttattcgca agttgggagc agacagtact 1200

gttctactga agaacaacaa tgccctgccg ctgaccggaa aggagcgcaa agttgcgatc 1260

ctgggtgaag atgctggatc caactcgtac ggtgccaatg gctgctctga ccgtggctgt 1320

gacaacggta ctcttgctat ggcttggggt agcggcactg ccgaattccc atatctcgtg 1380

acccctgagc aggctattca agccgaggtg ctcaagcata agggcagcgt ctacgccatc 1440

acggacaact gggcgctgag ccaggtggag accctcgcta aacaagccag tgtctctctt 1500

gtatttgtca actcggacgc gggagagggc tatatctccg tggacggaaa cgagggcgac 1560

cgcaacaacc tcaccctctg gaagaacggc gacaacctca tcaaggctgc tgcaaacaac 1620

tgcaacaaca ccatcgttgt catccactcc gttggacctg ttttggttga cgagtggtat 1680

gaccacccca acgttactgc catcctctgg gcgggcttgc ctggccagga gtctggcaac 1740

tccttggctg acgtgctcta cggccgcgtc aacccgggcg ccaaatctcc attcacctgg 1800

ggcaagacga gggaggcgta cggggattac cttgtccgtg agctcaacaa cggcaacgga 1860

gctccccaag atgatttctc ggaaggtgtt ttcattgact accgcggatt cgacaagcgc 1920

aatgagaccc cgatctacga gttcggacat ggtctgagct acaccacttt caactactct 1980

ggccttcaca tccaggttct caacgcttcc tccaacgctc aagtagccac tgagactggc 2040

gccgctccca ccttcggaca agtcggcaat gcctctgact acgtgtaccc tgagggattg 2100

accagaatca gcaagttcat ctatccctgg cttaattcca cagacctgaa ggcctcatct 2160

ggcgacccgt actatggagt cgacaccgcg gagcacgtgc ccgagggtgc tactgatggc 2220

tctccgcagc ccgttctgcc tgccggtggt ggctctggtg gtaacccgcg cctctacgat 2280

gagttgatcc gtgtttcggt gacagtcaag aacactggtc gtgttgccgg tgatgctgtg 2340

cctcaattgt atgtttccct tggtggaccc aatgagccca aggttgtgtt gcgcaaattc 2400

gaccgcctca ccctcaagcc ctccgaggag acggtgtgga cgactaccct gacccgccgc 2460

gatctgtcta actgggacgt tgcggctcag gactgggtca tcacttctta cccgaagaag 2520

gtccatgttg gtagctcttc gcgtcagctg ccccttcacg cggcgctccc gaaggtgcaa 2580

tga 2583

<210>28

<211>860

<212>PRT

<213>棘孢曲霉(Aspergillus aculeatus)

<400>28

Met Lys Leu Ser Trp Leu Glu Ala Ala Ala Leu Thr Ala Ala Ser Val

1 5 10 15

Val Ser Ala Asp Glu Leu Ala Phe Ser Pro Pro Phe Tyr Pro Ser Pro

20 25 30

Trp Ala Asn Gly Gln Gly Glu Trp Ala Glu Ala Tyr Gln Arg Ala Val

35 40 45

Ala Ile Val Ser Gln Met Thr Leu Asp Glu Lys Val Asn Leu Thr Thr

50 55 60

Gly Thr Gly Trp Glu Leu Glu Lys Cys Val Gly Gln Thr Gly Gly Val

65 70 75 80

Pro Arg Leu Asn Ile Gly Gly Met Cys Leu Gln Asp Ser Pro Leu Gly

85 90 95

Ile Arg Asp Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Val Asn Val

100 105 110

Ala Ala Thr Trp Asp Lys Asn Leu Ala Tyr Leu Arg Gly Gln Ala Met

115 120 125

Gly Gln Glu Phe Ser Asp Lys Gly Ile Asp Val Gln Leu Gly Pro Ala

130 135 140

Ala Gly Pro Leu Gly Arg Ser Pro Asp Gly Gly Arg Asn Trp Glu Gly

145 150 155 160

Phe Ser Pro Asp Pro Ala Leu Thr Gly Val Leu Phe Ala Glu Thr Ile

165 170 175

Lys Gly Ile Gln Asp Ala Gly Val Val Ala Thr Ala Lys His Tyr Ile

180 185 190

Leu Asn Glu Gln Glu His Phe Arg Gln Val Ala Glu Ala Ala Gly Tyr

195 200 205

Gly Phe Asn Ile Ser Asp Thr Ile Ser Ser Asn Val Asp Asp Lys Thr

210 215 220

Ile His Glu Met Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala Gly

225 230 235 240

Val Gly Ala Ile Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr Gly

245 250 255

Cys Gln Asn Ser Tyr Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu Gly

260 265 270

Phe Gln Gly Phe Val Met Ser Asp Trp Gly Ala His His Ser Gly Val

275 280 285

Gly Ser Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Ile Thr

290 295 300

Phe Asp Ser Ala Thr Ser Phe Trp Gly Thr Asn Leu Thr Ile Ala Val

305 310 315 320

Leu Asn Gly Thr Val Pro Gln Trp Arg Val AsP Asp Met Ala Val Arg

325 330 335

Ile Met Ala Ala Tyr Tyr Lys Val Gly Arg Asp Arg Leu Tyr Gln Pro

340 345 350

Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Phe Lys Tyr Phe

355 360 365

Tyr Pro Gln Glu Gly Pro Tyr Glu Lys Val Asn His Phe Val Asn Val

370 375 380

Gln Arg Asn His Ser Glu Val Ile Arg Lys Leu Gly Ala Asp Ser Thr

385 390 395 400

Val Leu Leu Lys Asn Asn Asn Ala Leu Pro Leu Thr Gly Lys Glu Arg

405 410 415

Lys Val Ala Ile Leu Gly Glu Asp Ala Gly Ser Asn Ser Tyr Gly Ala

420 425 430

Asn Gly Cys Ser Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met Ala

435 440 445

Trp Gly Ser Gly Thr Ala Glu Phe Pro Tyr Leu Val Thr Pro Glu Gln

450 455 460

Ala Ile Gln Ala Glu Val Leu Lys His Lys Gly Ser Val Tyr Ala Ile

465 470 475 480

Thr Asp Asn Trp Ala Leu Ser Gln Val Glu Thr Leu Ala Lys Gln Ala

485 490 495

Ser Val Ser Leu Val Phe Val Asn Ser Asp Ala Gly Glu Gly Tyr Ile

500 505 510

Ser Val Asp Gly Asn Glu Gly Asp Arg Asn Asn Leu Thr Leu Trp Lys

515 520 525

Asn Gly Asp Asn Leu Ile Lys Ala Ala Ala Asn Asn Cys Asn Asn Thr

530 535 540

Ile Val Val Ile His Ser Val Gly Pro Val Leu Val Asp Glu Trp Tyr

545 550 555 560

Asp His Pro Asn Val Thr Ala Ile Leu Trp Ala Gly Leu Pro Gly Gln

565 570 575

Glu Ser Gly Asn Ser Leu Ala Asp Val Leu Tyr Gly Arg Val Asn Pro

580 585 590

Gly Ala Lys Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ala Tyr Gly

595 600 605

Asp Tyr Leu Val Arg Glu Leu Asn Asn Gly Asn Gly Ala Pro Gln Asp

610 615 620

Asp Phe Ser Glu Gly Val Phe Ile Asp Tyr Arg Gly Phe Asp Lys Arg

625 630 635 640

Asn Glu Thr Pro Ile Tyr Glu Phe Gly His Gly Leu Ser Tyr Thr Thr

645 650 655

Phe Asn Tyr Ser Gly Leu His Ile Gln Val Leu Asn Ala Ser Ser Asn

660 665 670

Ala Gln Val Ala Thr Glu Thr Gly Ala Ala Pro Thr Phe Gly Gln Val

675 680 685

Gly Asn Ala Ser Asp Tyr Val Tyr Pro Glu Gly Leu Thr Arg Ile Ser

690 695 700

Lys Phe Ile Tyr Pro Trp Leu Asn Ser Thr Asp Leu Lys Ala Ser Ser

705 710 715 720

Gly Asp Pro Tyr Tyr Gly Val Asp Thr Ala Glu His Val Pro Glu Gly

725 730 735

Ala Thr Asp Gly Ser Pro Gln Pro Val Leu Pro Ala Gly Gly Gly Ser

740 745 750

Gly Gly Asn Pro Arg Leu Tyr Asp Glu Leu Ile Arg Val Ser Val Thr

755 760 765

Val Lys Asn Thr Gly Arg Val Ala Gly Asp Ala Val Pro Gln Leu Tyr

770 775 780

Val Ser Leu Gly Gly Pro Asn Glu Pro Lys Val Val Leu Arg Lys Phe

785 790 795 800

Asp Arg Leu Thr Leu Lys Pro Ser Glu Glu Thr Val Trp Thr Thr Thr

805 810 815

Leu Thr Arg Arg Asp Leu Ser Asn Trp Asp Val Ala Ala Gln Asp Trp

820 825 830

Val Ile Thr Ser Tyr Pro Lys Lys Val His Val Gly Ser Ser Ser Arg

835 840 845

Gln Leu Pro Leu His Ala Ala Leu Pro Lys Val Gln

850 855 860

<210>29

<211>918

<212>DNA

<213>特异腐质霉(Humicola insolens)

<400>29

atgcgttcct cccccctcct cccgtccgcc gttgtggccg ccctgccggt gttggccctt 60

gccgctgatg gcaggtccac ccgctactgg gactgctgca agccttcgtg cggctgggcc 120

aagaaggctc ccgtgaacca gcctgtcttt tcctgcaacg ccaacttcca gcgtatcacg 180

gacttcgacg ccaagtccgg ctgcgagccg ggcggtgtcg cctactcgtg cgccgaccag 240

accccatggg ctgtgaacga cgacttcgcg ctcggttttg ctgccacctc tattgccggc 300

agcaatgagg cgggctggtg ctgcgcctgc tacgagctca ccttcacatc cggtcctgtt 360

gctggcaaga agatggtcgt ccagtccacc agcactggcg gtgatcttgg cagcaaccac 420

ttcgatctca acatccccgg cggcggcgtc ggcatcttcg acggatgcac tccccagttc 480

ggcggtctgc ccggccagcg ctacggcggc atctcgtccc gcaacgagtg cgatcggttc 540

cccgacgccc tcaagcccgg ctgctactgg cgcttcgact ggttcaagaa cgccgacaat 600

ccgagcttca gcttccgtca ggtccagtgc ccagccgagc tcgtcgctcg caccggatgc 660

cgccgcaacg acgacggcaa cttccctgcc gtccagatcc cctccagcag caccagctct 720

ccggtcaacc agcctaccag caccagcacc acgtccacct ccaccacctc gagcccgcca 780

gtccagccta cgactcccag cggctgcact gctgagaggt gggctcagtg cggcggcaat 840

ggctggagcg gctgcaccac ctgcgtcgct ggcagcactt gcacgaagat taatgactgg 900

taccatcagt gcctgtag 918

<210>30

<211>305

<212>PRT

<213>特异腐质霉(Humicola insolens)

<400>30

Met Arg Ser Ser Pro Leu Leu Arg Ser Ala Val Val Ala Ala Leu Pro

1 5 10 15

Val Leu Ala Leu Ala Ala Asp Gly Arg Ser Thr Arg Tyr Trp Asp Cys

20 25 30

Cys Lys Pro Ser Cys Gly Trp Ala Lys Lys Ala Pro Val Asn Gln Pro

35 40 45

Val Phe Ser Cys Asn Ala Asn Phe Gln Arg Ile Thr Asp Phe Asp Ala

50 55 60

Lys Ser Gly Cys Glu Pro Gly Gly Val Ala Tyr Ser Cys Ala Asp Gln

65 70 75 80

Thr Pro Trp Ala Val Asn Asp Asp Phe Ala Leu Gly Phe Ala Ala Thr

85 90 95

Ser Ile Ala Gly Ser Asn Glu Ala Gly Trp Cys Cys Ala Cys Tyr Glu

100 105 110

Leu Thr Phe Thr Ser Gly Pro Val Ala Gly Lys Lys Met Val Val Gln

115 120 125

Ser Thr Ser Thr Gly Gly Asp Leu Gly Ser Asn His Phe Asp Leu Asn

130 135 140

Ile Pro Gly Gly Gly Val Gly Ile Phe Asp Gly Cys Thr Pro Gln Phe

145 150 155 160

Gly Gly Leu Pro Gly Gln Arg Tyr Gly Gly Ile Ser Ser Arg Asn Glu

165 170 175

Cys Asp Arg Phe Pro Asp Ala Leu Lys Pro Gly Cys Tyr Trp Arg Phe

180 185 190

Asp Trp Phe Lys Asn Ala Asp Asn Pro Ser Phe Ser Phe Arg Gln Val

195 200 205

Gln Cys Pro Ala Glu Leu Val Ala Arg Thr Gly Cys Arg Arg Asn Asp

210 215 220

Asp Gly Asn Phe Pro Ala Val Gln Ile Pro Ser Ser Ser Thr Ser Ser

225 230 235 240

Pro Val Asn Gln Pro Thr Ser Thr Ser Thr Thr Ser Thr Ser Thr Thr

245 250 255

Ser Ser Pro Pro Val Gln Pro Thr Thr Pro Ser Gly Cys Thr Ala Glu

260 265 270

Arg Trp Ala Gln Cys Gly Gly Asn Gly Trp Ser Gly Cys Thr Thr Cys

275 280 285

Val Ala Gly Ser Thr Cys Thr Lys Ile Asn Asp Trp Tyr His Gln Cys

290 295 300

Leu

305

<210>31

<211>1188

<212>DNA

<213>嗜热毁丝霉(Myceliophthora thermophila)

<400>31

cgacttgaaa cgccccaaat gaagtcctcc atcctcgcca gcgtcttcgc cacgggcgcc 60

gtggctcaaa gtggtccgtg gcagcaatgt ggtggcatcg gatggcaagg atcgaccgac 120

tgtgtgtcgg gctaccactg cgtctaccag aacgattggt acagccagtg cgtgcctggc 180

gcggcgtcga caacgctgca gacatcgacc acgtccaggc ccaccgccac cagcaccgcc 240

cctccgtcgt ccaccacctc gcctagcaag ggcaagctga agtggctcgg cagcaacgag 300

tcgggcgccg agttcgggga gggcaattac cccggcctct ggggcaagca cttcatcttc 360

ccgtcgactt cggcgattca gacgctcatc aatgatggat acaacatctt ccggatcgac 420

ttctcgatgg agcgtctggt gcccaaccag ttgacgtcgt ccttcgacca gggttacctc 480

cgcaacctga ccgaggtggt caacttcgtg acgaacgcgg gcaagtacgc cgtcctggac 540

ccgcacaact acggccggta ctacggcaac atcatcacgg acacgaacgc gttccggacc 600

ttctggacca acctggccaa gcagttcgcc tccaactcgc tcgtcatctt cgacaccaac 660

aacgagtaca acacgatgga ccagaccctg gtgctcaacc tcaaccaggc cgccatcgac 720

ggcatccggg ccgccggcgc gacctcgcag tacatcttcg tcgagggcaa cgcgtggagc 780

ggggcctgga gctggaacac gaccaacacc aacatggccg ccctgacgga cccgcagaac 840

aagatcgtgt acgagatgca ccagtacctc gactcggaca gctcgggcac ccacgccgag 900

tgcgtcagca gcaccatcgg cgcccagcgc gtcgtcggag ccacccagtg gctccgcgcc 960

aacggcaagc tcggcgtcct cggcgagttc gccggcggcg ccaacgccgt ctgccagcag 1020

gccgtcaccg gcctcctcga ccacctccag gacaacagcg acgtctggct gggtgccctc 1080

tggtgggccg ccggtccctg gtggggcgac tacatgtact cgttcgagcc tccttcgggc 1140

accggctatg tcaactacaa ctcgatcttg aagaagtact tgccgtaa 1188

<210>32

<211>389

<212>PRT

<213>嗜热毁丝霉(Myceliophthora thermophila)

<400>32

Met Lys Ser Ser Ile Leu Ala Ser Val Phe Ala Thr Gly Ala Val Ala

1 5 10 15

Gln Ser Gly Pro Trp Gln Gln Cys Gly Gly Ile Gly Trp Gln Gly Ser

20 25 30

Thr Asp Cys Val Ser Gly Tyr His Cys Val Tyr Gln Asn Asp Trp Tyr

35 40 45

Ser Gln Cys Val Pro Gly Ala Ala Ser Thr Thr Leu Gln Thr Ser Thr

50 55 60

Thr Ser Arg Pro Thr Ala Thr Ser Thr Ala Pro Pro Ser Ser Thr Thr

65 70 75 80

Ser Pro Ser Lys Gly Lys Leu Lys Trp Leu Gly Ser Asn Glu Ser Gly

85 90 95

Ala Glu Phe Gly Glu Gly Asn Tyr Pro Gly Leu Trp Gly Lys His Phe

100 105 110

Ile Phe Pro Ser Thr Ser Ala Ile Gln Thr Leu Ile Asn Asp Gly Tyr

115 120 125

Asn Ile Phe Arg Ile Asp Phe Ser Met Glu Arg Leu Val Pro Asn Gln

130 135 140

Leu Thr Ser Ser Phe Asp Gln Gly Tyr Leu Arg Asn Leu Thr Glu Val

145 150 155 160

Val Asn Phe Val Thr Asn Ala Gly Lys Tyr Ala Val Leu Asp Pro His

165 170 175

Asn Tyr Gly Arg Tyr Tyr Gly Asn Ile Ile Thr Asp Thr Asn Ala Phe

180 185 190

Arg Thr Phe Trp Thr Asn Leu Ala Lys Gln Phe Ala Ser Asn Ser Leu

195 200 205

Val Ile Phe Asp Thr Asn Asn Glu Tyr Asn Thr Met Asp Gln Thr Leu

210 215 220

Val Leu Asn Leu Asn Gln Ala Ala Ile Asp Gly Ile Arg Ala Ala Gly

225 230 235 240

Ala Thr Ser Gln Tyr Ile Phe Val Glu Gly Asn Ala Trp Ser Gly Ala

245 250 255

Trp Ser Trp Asn Thr Thr Asn Thr Asn Met Ala Ala Leu Thr Asp Pro

260 265 270

Gln Asn Lys Ile Val Tyr Glu Met His Gln Tyr Leu Asp Ser Asp Ser

275 280 285

Ser Gly Thr His Ala Glu Cys Val Ser Ser Thr Ile Gly Ala Gln Arg

290 295 300

Val Val Gly Ala Thr Gln Trp Leu Arg Ala Asn Gly Lys Leu Gly Val

305 310 315 320

Leu Gly Glu Phe Ala Gly Gly Ala Asn Ala Val Cys Gln Gln Ala Val

325 330 335

Thr Gly Leu Leu Asp His Leu Gln Asp Asn Ser Asp Val Trp Leu Gly

340 345 350

Ala Leu Trp Trp Ala Ala Gly Pro Trp Trp Gly Asp Tyr Met Tyr Ser

355 360 365

Phe Glu Pro Pro Ser Gly Thr Gly Tyr Val Asn Tyr Asn Ser Ile Leu

370 375 380

Lys Lys Tyr Leu Pro

385

<210>33

<211>1232

<212>DNA

<213>担子菌纲(BASIDIOMYCETE)CBS 495.95

<400>33

ggatccactt agtaacggcc gccagtgtgc tggaaagcat gaagtctctc ttcctgtcac 60

ttgtagcgac cgtcgcgctc agctcgccag tattctctgt cgcagtctgg gggcaatgcg 120

gcggcattgg cttcagcgga agcaccgtct gtgatgcagg cgccggctgt gtgaagctca 180

acgactatta ctctcaatgc caacccggcg ctcccactgc tacatccgcg gcgccaagta 240

gcaacgcacc gtccggcact tcgacggcct cggccccctc ctccagcctt tgctctggca 300

gccgcacgcc gttccagttc ttcggtgtca acgaatccgg cgcggagttc ggcaacctga 360

acatccccgg tgttctgggc accgactaca cctggccgtc gccatccagc attgacttct 420

tcatgggcaa gggaatgaat accttccgta ttccgttcct catggagcgt cttgtccccc 480

ctgccactgg catcacagga cctctcgacc agacgtactt gggcggcctg cagacgattg 540

tcaactacat caccggcaaa ggcggctttg ctctcattga cccgcacaac tttatgatct 600

acaatggcca gacgatctcc agtaccagcg acttccagaa gttctggcag aacctcgcag 660

gagtgtttaa atcgaacagt cacgtcatct tcgatgttat gaacgagcct cacgatattc 720

ccgcccagac cgtgttccaa ctgaaccaag ccgctgtcaa tggcatccgt gcgagcggtg 780

cgacgtcgca gctcattctg gtcgagggca caagctggac tggagcctgg acctggacga 840

cctctggcaa cagcgatgca ttcggtgcca ttaaggatcc caacaacaac gtcgcgatcc 900

agatgcatca gtacctggat agcgatggct ctggcacttc gcagacctgc gtgtctccca 960

ccatcggtgc cgagcggttg caggctgcga ctcaatggtt gaagcagaac aacctcaagg 1020

gcttcctggg cgagatcggc gccggctcta actccgcttg catcagcgct gtgcagggtg 1080

cgttgtgttc gatgcagcaa tctggtgtgt ggctcggcgc tctctggtgg gctgcgggcc 1140

cgtggtgggg cgactactac cagtccatcg agccgccctc tggcccggcg gtgtccgcga 1200

tcctcccgca ggccctgctg ccgttcgcgt aa 1232

<210>34

<211>397

<212>PRT

<213>担子菌纲(BASIDIOMYCETE)CBS 495.95

<400>34

Met Lys Ser Leu Phe Leu Ser Leu Val Ala Thr Val Ala Leu Ser Ser

1 5 10 15

Pro Val Phe Ser Val Ala Val Trp Gly Gln Cys Gly Gly Ile Gly Phe

20 25 30

Ser Gly Ser Thr Val Cys Asp Ala Gly Ala Gly Cys Val Lys Leu Asn

35 40 45

Asp Tyr Tyr Ser Gln Cys Gln Pro Gly Ala Pro Thr Ala Thr Ser Ala

50 55 60

Ala Pro Ser Ser Asn Ala Pro Ser Gly Thr Ser Thr Ala Ser Ala Pro

65 70 75 80

Ser Ser Ser Leu Cys Ser Gly Ser Arg Thr Pro Phe Gln Phe Phe Gly

85 90 95

Val Asn Glu Ser Gly Ala Glu Phe Gly Asn Leu Asn Ile Pro Gly Val

100 105 110

Leu Gly Thr Asp Tyr Thr Trp Pro Ser Pro Ser Ser Ile Asp Phe Phe

115 120 125

Met Gly Lys Gly Met Asn Thr Phe Arg Ile Pro Phe Leu Met Glu Arg

130 135 140

Leu Val Pro Pro Ala Thr Gly Ile Thr Gly Pro Leu Asp Gln Thr Tyr

145 150 155 160

Leu Gly Gly Leu Gln Thr Ile Val Asn Tyr Ile Thr Gly Lys Gly Gly

165 170 175

Phe Ala Leu Ile Asp Pro His Asn Phe Met Ile Tyr Asn Gly Gln Thr

180 185 190

Ile Ser Ser Thr Ser Asp Phe Gln Lys Phe Trp Gln Asn Leu Ala Gly

195 200 205

Val Phe Lys Ser Asn Ser His Val Ile Phe Asp Val Met Asn Glu Pro

210 215 220

His Asp Ile Pro Ala Gln Thr Val Phe Gln Leu Asn Gln Ala Ala Val

225 230 235 240

Asn Gly Ile Arg Ala Ser Gly Ala Thr Ser Gln Leu Ile Leu Val Glu

245 250 255

Gly Thr Ser Trp Thr Gly Ala Trp Thr Trp Thr Thr Ser Gly Asn Ser

260 265 270

Asp Ala Phe Gly Ala Ile Lys Asp Pro Asn Asn Asn Val Ala Ile Gln

275 280 285

Met His Gln Tyr Leu Asp Ser Asp Gly Ser Gly Thr Ser Gln Thr Cys

290 295 300

Val Ser Pro Thr Ile Gly Ala Glu Arg Leu Gln Ala Ala Thr Gln Trp

305 310 315 320

Leu Lys Gln Asn Asn Leu Lys Gly Phe Leu Gly Glu Ile Gly Ala Gly

325 330 335

Ser Asn Ser Ala Cys Ile Ser Ala Val Gln Gly Ala Leu Cys Ser Met

340 345 350

Gln Gln Ser Gly Val Trp Leu Gly Ala Leu Trp Trp Ala Ala Gly Pro

355 360 365

Trp Trp Gly Asp Tyr Tyr Gln Ser Ile Glu Pro Pro Ser Gly Pro Ala

370 375 380

Val Ser Ala Ile Leu Pro Gln Ala Leu Leu Pro Phe Ala

385 390 395

<210>35

<211>1303

<212>DNA

<213>担子菌纲(BASIDIOMYCETE)CBS 495.95

<400>35

ggaaagcgtc agtatggtga aatttgcgct tgtggcaact gtcggcgcaa tcttgagcgc 60

ttctgcggcc aatgcggctt ctatctacca gcaatgtgga ggcattggat ggtctgggtc 120

cactgtttgc gacgccggtc tcgcttgcgt tatcctcaat gcgtactact ttcagtgctt 180

gacgcccgcc gcgggccaga caacgacggg ctcgggcgca ccggcgtcaa catcaacctc 240

tcactcaacg gtcactacgg ggagctcaca ctcaacaacc gggacgacgg cgacgaaaac 300

aactaccact ccgtcgacca ccacgaccct acccgccatc tctgtgtctg gtcgcgtctg 360

ctctggctcc aggacgaagt tcaagttctt cggtgtgaat gaaagcggcg ccgaattcgg 420

gaacactgct tggccagggc agctcgggaa agactataca tggccttcgc ctagcagcgt 480

ggactacttc atgggggctg gattcaatac attccgtatc accttcttga tggagcgtat 540

gagccctccg gctaccggac tcactggccc attcaaccag acgtacctgt cgggcctcac 600

caccattgtc gactacatca cgaacaaagg aggatacgct cttattgacc cccacaactt 660

catgcgttac aacaacggca taatcagcag cacatctgac ttcgcgactt ggtggagcaa 720

tttggccact gtattcaaat ccacgaagaa cgccatcttc gacatccaga acgagccgta 780

cggaatcgat gcgcagaccg tatacgaact gaatcaagct gccatcaatt cgatccgcgc 840

cgctggcgct acgtcacagt tgattctggt tgaaggaacg tcatacactg gagcttggac 900

gtgggtctcg tccggaaacg gagctgcttt cgcggccgtt acggatcctt acaacaacac 960

ggcaattgaa atgcaccaat acctcgacag cgacggttct gggacaaacg aagactgtgt 1020

ctcctccacc attgggtcgc aacgtctcca agctgccact gcgtggctgc aacaaacagg 1080

actcaaggga ttcctcggag agacgggtgc tgggtcgaat tcccagtgca tcgacgccgt 1140

gttcgatgaa ctttgctata tgcaacagca aggcggctcc tggatcggtg cactctggtg 1200

ggctgcgggt ccctggtggg gcacgtacatttactcgatt gaacctccga gcggtgccgc 1260

tatcccagaa gtccttcctc agggtctcgc tccattcctc tag 1303

<210>36

<211>429

<212>PRT

<213>担子菌纲(BASIDIOMYCETE)CBS 495.95

<400>36

Met Val Lys Phe Ala Leu Val Ala Thr Val Gly Ala Ile Leu Ser Ala

1 5 10 15

Ser Ala Ala Asn Ala Ala Ser Ile Tyr Gln Gln Cys Gly Gly Ile Gly

20 25 30

Trp Ser Gly Ser Thr Val Cys Asp Ala Gly Leu Ala Cys Val Ile Leu

35 40 45

Asn Ala Tyr Tyr Phe Gln Cys Leu Thr Pro Ala Ala Gly Gln Thr Thr

50 55 60

Thr Gly Ser Gly Ala Pro Ala Ser Thr Ser Thr Ser His Ser Thr Val

65 70 75 80

Thr Thr Gly Ser Ser His Ser Thr Thr Gly Thr Thr Ala Thr Lys Thr

85 90 95

Thr Thr Thr Pro Ser Thr Thr Thr Thr Leu Pro Ala Ile Ser Val Ser

100 105 110

Gly Arg Val Cys Ser Gly Ser Arg Thr Lys Phe Lys Phe Phe Gly Val

115 120 125

Asn Glu Ser Gly Ala Glu Phe Gly Asn Thr Ala Trp Pro Gly Gln Leu

130 135 140

Gly Lys Asp Tyr Thr Trp Pro Ser Pro Ser Ser Val Asp Tyr Phe Met

145 150 155 160

Gly Ala Gly Phe Asn Thr Phe Arg Ile Thr Phe Leu Met Glu Arg Met

165 170 175

Ser Pro Pro Ala Thr Gly Leu Thr Gly Pro Phe Asn Gln Thr Tyr Leu

180 185 190

Ser Gly Leu Thr Thr Ile Val Asp Tyr Ile Thr Asn Lys Gly Gly Tyr

195 200 205

Ala Leu Ile Asp Pro His Asn Phe Met Arg Tyr Asn Asn Gly Ile Ile

210 215 220

Ser Ser Thr Ser Asp Phe Ala Thr Trp Trp Ser Asn Leu Ala Thr Val

225 230 235 240

Phe Lys Ser Thr Lys Asn Ala Ile Phe Asp Ile Gln Asn Glu Pro Tyr

245 250 255

Gly Ile Asp Ala Gln Thr Val Tyr Glu Leu Asn Gln Ala Ala Ile Asn

260 265 270

Ser Ile Arg Ala Ala Gly Ala Thr Ser Gln Leu Ile Leu Val Glu Gly

275 280 285

Thr Ser Tyr Thr Gly Ala Trp Thr Trp Val Ser Ser Gly Asn Gly Ala

290 295 300

Ala Phe Ala Ala Val Thr Asp Pro Tyr Asn Asn Thr Ala Ile Glu Met

305 310 315 320

His Gln Tyr Leu Asp Ser Asp Gly Ser Gly Thr Asn Glu Asp Cys Val

325 330 335

Ser Ser Thr Ile Gly Ser Gln Arg Leu Gln Ala Ala Thr Ala Trp Leu

340 345 350

Gln Gln Thr Gly Leu Lys Gly Phe Leu Gly Glu Thr Gly Ala Gly Ser

355 360 365

Asn Ser Gln Cys Ile Asp Ala Val Phe Asp Glu Leu Cys Tyr Met Gln

370 375 380

Gln Gln Gly Gly Ser Trp Ile Gly Ala Leu Trp Trp Ala Ala Gly Pro

385 390 395 400

Trp Trp Gly Thr Tyr Ile Tyr Ser Ile Glu Pro Pro Ser Gly Ala Ala

405 410 415

Ile Pro Glu Val Leu Pro Gln Gly Leu Ala Pro Phe Leu

420 425

<210>37

<211>1580

<212>DNA

<213>土生梭孢霉(Thielavia terrestris)

<400>37

agccccccgt tcaggcacac ttggcatcag atcagcttag cagcgcctgc acagcatgaa 60

gctctcgcag tcggccgcgc tggcggcact caccgcgacg gcgctcgccg ccccctcgcc 120

cacgacgccg caggcgccga ggcaggcttc agccggctgc tcgtctgcgg tcacgctcga 180

cgccagcacc aacgtttgga agaagtacac gctgcacccc aacagctact accgcaagga 240

ggttgaggcc gcggtggcgc agatctcgga cccggacctc gccgccaagg ccaagaaggt 300

ggccgacgtc ggcaccttcc tgtggctcga ctcgatcgag aacatcggca agctggagcc 360

ggcgatccag gacgtgccct gcgagaacat cctgggcctg gtcatctacg acctgccggg 420

ccgcgactgc gcggccaagg cgtccaacgg cgagctcaag gtcggcgaga tcgaccgcta 480

caagaccgag tacatcgaca gtgagtgctg ccccccgggt tcgagaagag cgtgggggaa 540

agggaaaggg ttgactgact gacacggcgc actgcagaga tcgtgtcgat cctcaaggca 600

caccccaaca cggcgttcgc gctggtcatc gagccggact cgctgcccaa cctggtgacc 660

aacagcaact tggacacgtg ctcgagcagc gcgtcgggct accgcgaagg cgtggcttac 720

gccctcaaga acctcaacct gcccaacgtg atcatgtacc tcgacgccgg ccacggcggc 780

tggctcggct gggacgccaa cctgcagccc ggcgcgcagg agctagccaa ggcgtacaag 840

aacgccggct cgcccaagca gctccgcggc ttctcgacca acgtggccgg ctggaactcc 900

tggtgagctt ttttccattc catttcttct tcctcttctc tcttcgctcc cactctgcag 960

ccccccctcc cccaagcacc cactggcgtt ccggcttgct gactcggcct ccctttcccc 1020

gggcaccagg gatcaatcgc ccggcgaatt ctcccaggcg tccgacgcca agtacaacaa 1080

gtgccagaac gagaagatct acgtcagcac cttcggctcc gcgctccagt cggccggcat 1140

gcccaaccac gccatcgtcg acacgggccg caacggcgtc accggcctgc gcaaggagtg 1200

gggtgactgg tgcaacgtca acggtgcagg ttcgttgtct tctttttctc ctcttttgtt 1260

tgcacgtcgt ggtccttttc aagcagccgt gtttggttgg gggagatgga ctccggctga 1320

tgttctgctt cctctctagg cttcggcgtg cgcccgacga gcaacacggg cctcgagctg 1380

gccgacgcgt tcgtgtgggt caagcccggc ggcgagtcgg acggcaccag cgacagctcg 1440

tcgccgcgct acgacagctt ctgcggcaag gacgacgcct tcaagccctc gcccgaggcc 1500

ggcacctgga acgaggccta cttcgagatg ctgctcaaga acgccgtgcc gtcgttctaa 1560

gacggtccag catcatccgg 1580

<210>38

<211>396

<212>PRT

<213>土生梭孢霉(Thielavia terrestris)

<400>38

Met Lys Leu Ser Gln Ser Ala Ala Leu Ala Ala Leu Thr Ala Thr Ala

1 5 10 15

Leu Ala Ala Pro Ser Pro Thr Thr Pro Gln Ala Pro Arg Gln Ala Ser

20 25 30

Ala Gly Cys Ser Ser Ala Val Thr Leu Asp Ala Ser Thr Asn Val Trp

35 40 45

Lys Lys Tyr Thr Leu His Pro Asn Ser Tyr Tyr Arg Lys Glu Val Glu

50 55 60

Ala Ala Val Ala Gln Ile Ser Asp Pro Asp Leu Ala Ala Lys Ala Lys

65 70 75 80

Lys Val Ala Asp Val Gly Thr Phe Leu Trp Leu Asp Ser Ile Glu Asn

85 90 95

Ile Gly Lys Leu Glu Pro Ala Ile Gln Asp Val Pro Cys Glu Asn Ile

100 105 110

Leu Gly Leu Val Ile Tyr Asp Leu Pro Gly Arg Asp Cys Ala Ala Lys

115 120 125

Ala Ser Asn Gly Glu Leu Lys Val Gly Glu Ile Asp Arg Tyr Lys Thr

130 135 140

Glu Tyr Ile Asp Lys Ile Val Ser Ile Leu Lys Ala His Pro Asn Thr

145 150 155 160

Ala Phe Ala Leu Val Ile Glu Pro Asp Ser Leu Pro Asn Leu Val Thr

165 170 175

Asn Ser Asn Leu Asp Thr Cys Ser Ser Ser Ala Ser Gly Tyr Arg Glu

180 185 190

Gly Val Ala Tyr Ala Leu Lys Asn Leu Asn Leu Pro Asn Val Ile Met

195 200 205

Tyr Leu Asp Ala Gly His Gly Gly Trp Leu Gly Trp Asp Ala Asn Leu

210 215 220

Gln Pro Gly Ala Gln Glu Leu Ala Lys Ala Tyr Lys Asn Ala Gly Ser

225 230 235 240

Pro Lys Gln Leu Arg Gly Phe Ser Thr Asn Val Ala Gly Trp Asn Ser

245 250 255

Trp Asp Gln Ser Pro Gly Glu Phe Ser Gln Ala Ser Asp Ala Lys Tyr

260 265 270

Asn Lys Cys Gln Asn Glu Lys Ile Tyr Val Ser Thr Phe Gly Ser Ala

275 280 285

Leu Gln Ser Ala Gly Met Pro Asn His Ala Ile Val Asp Thr Gly Arg

290 295 300

Asn Gly Val Thr Gly Leu Arg Lys Glu Trp Gly Asp Trp Cys Asn Val

305 310 315 320

Asn Gly Ala Gly Phe Gly Val Arg Pro Thr Ser Asn Thr Gly Leu Glu

325 330 335

Leu Ala Asp Ala Phe Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly

340 345 350

Thr Ser Asp Ser Ser Ser Pro Arg Tyr Asp Ser Phe Cys Gly Lys Asp

355 360 365

Asp Ala Phe Lys Pro Ser Pro Glu Ala Gly Thr Trp Asn Glu Ala Tyr

370 375 380

Phe Glu Met Leu Leu Lys Asn Ala Val Pro Ser Phe

385 390 395

<210>39

<211>1203

<212>DNA

<213>土生梭孢霉(Thielavia terrestris)

<400>39

atgaagtacc tcaacctcct cgcagctctc ctcgccgtcg ctcctctctc cctcgctgca 60

cccagcatcg aggccagaca gtcgaacgtc aacccataca tcggcaagag cccgctcgtt 120

attaggtcgt acgcccaaaa gcttgaggag accgtcagga ccttccagca acgtggcgac 180

cagctcaacg ctgcgaggac acggacggtg cagaacgttg cgactttcgc ctggatctcg 240

gataccaatg gtattggagc cattcgacct ctcatccaag atgctctcgc ccagcaggct 300

cgcactggac agaaggtcat cgtccaaatc gtcgtctaca acctcccaga tcgcgactgc 360

tctgccaacg cctcgactgg agagttcacc gtaggaaacg acggtctcaa ccgatacaag 420

aactttgtca acaccatcgc ccgcgagctc tcgactgctg acgctgacaa gctccacttt 480

gccctcctcc tcgaacccga cgcacttgcc aacctcgtca ccaacgcgaa tgcccccagg 540

tgccgaatcg ccgctcccgc ttacaaggag ggtatcgcct acaccctcgc caccttgtcc 600

aagcccaacg tcgacgtcta catcgacgcc gccaacggtg gctggctcgg ctggaacgac 660

aacctccgcc ccttcgccga actcttcaag gaagtctacg acctcgcccg ccgcatcaac 720

cccaacgcca aggtccgcgg cgtccccgtc aacgtctcca actacaacca gtaccgcgct 780

gaagtccgcg agcccttcac cgagtggaag gacgcctggg acgagagccg ctacgtcaac 840

gtcctcaccc cgcacctcaa cgccgtcggc ttctccgcgc acttcatcgt tgaccaggga 900

cgcggtggca agggcggtat caggacggag tggggccagt ggtgcaacgt taggaacgct 960

gggttcggta tcaggcctac tgcggatcag ggcgtgctcc agaacccgaa tgtggatgcg 1020

attgtgtggg ttaagccggg tggagagtcg gatggcacga gtgatttgaa ctcgaacagg 1080

tatgatccta cgtgcaggag tccggtggcg catgttcccg ctcctgaggc tggccagtgg 1140

ttcaacgagt atgttgttaa cctcgttttg aacgctaacc cccctcttga gcctacctgg 1200

taa 1203

<210>40

<211>400

<212>PRT

<213>土生梭孢霉(Thielavia terrestris)

<400>40

Met Lys Tyr Leu Asn Leu Leu Ala Ala Leu Leu Ala Val Ala Pro Leu

1 5 10 15

Ser Leu Ala Ala Pro Ser Ile Glu Ala Arg Gln Ser Asn Val Asn Pro

20 25 30

Tyr Ile Gly Lys Ser Pro Leu Val Ile Arg Ser Tyr Ala Gln Lys Leu

35 40 45

Glu Glu Thr Val Arg Thr Phe Gln Gln Arg Gly Asp Gln Leu Asn Ala

50 55 60

Ala Arg Thr Arg Thr Val Gln Asn Val Ala Thr Phe Ala Trp Ile Ser

65 70 75 80

Asp Thr Asn Gly Ile Gly Ala Ile Arg Pro Leu Ile Gln Asp Ala Leu

85 90 95

Ala Gln Gln Ala Arg Thr Gly Gln Lys Val Ile Val Gln Ile Val Val

100 105 110

Tyr Asn Leu Pro Asp Arg Asp Cys Ser Ala Asn Ala Ser Thr Gly Glu

115 120 125

Phe Thr Val Gly Asn Asp Gly Leu Asn Arg Tyr Lys Asn Phe Val Asn

130 135 140

Thr Ile Ala Arg Glu Leu Ser Thr Ala Asp Ala Asp Lys Leu His Phe

145 150 155 160

Ala Leu Leu Leu Glu Pro Asp Ala Leu Ala Asn Leu Val Thr Asn Ala

165 170 175

Asn Ala Pro Arg Cys Arg Ile Ala Ala Pro Ala Tyr Lys Glu Gly Ile

180 185 190

Ala Tyr Thr Leu Ala Thr Leu Ser Lys Pro Asn Val Asp Val Tyr Ile

195 200 205

Asp Ala Ala Asn Gly Gly Trp Leu Gly Trp Asn Asp Asn Leu Arg Pro

210 215 220

Phe Ala Glu Leu Phe Lys Glu Val Tyr Asp Leu Ala Arg Arg Ile Asn

225 230 235 240

Pro Asn Ala Lys Val Arg Gly Val Pro Val Asn Val Ser Asn Tyr Asn

245 250 255

Gln Tyr Arg Ala Glu Val Arg Glu Pro Phe Thr Glu Trp Lys Asp Ala

260 265 270

Trp Asp Glu Ser Arg Tyr Val Asn Val Leu Thr Pro His Leu Asn Ala

275 280 285

Val Gly Phe Ser Ala His Phe Ile Val Asp Gln Gly Arg Gly Gly Lys

290 295 300

Gly Gly Ile Arg Thr Glu Trp Gly Gln Trp Cys Asn Val Arg Asn Ala

305 310 315 320

Gly Phe Gly Ile Arg Pro Thr Ala Asp Gln Gly Val Leu Gln Asn Pro

325 330 335

Asn Val Asp Ala Ile Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly

340 345 350

Thr Ser Asp Leu Asn Ser Asn Arg Tyr Asp Pro Thr Cys Arg Ser Pro

355 360 365

Val Ala His Val Pro Ala Pro Glu Ala Gly Gln Trp Phe Asn Glu Tyr

370 375 380

Val Val Asn Leu Val Leu Asn Ala Asn Pro Pro Leu Glu Pro Thr Trp

385 390 395 400

<210>41

<211>1501

<212>DNA

<213>土生梭孢霉(Thielavia terrestris)

<400>41

gccgttgtca agatgggcca gaagacgctg cacggattcg ccgccacggc tttggccgtt 60

ctcccctttg tgaaggctca gcagcccggc aacttcacgc cggaggtgca cccgcaactg 120

ccaacgtgga agtgcacgac cgccggcggc tgcgttcagc aggacacttc ggtggtgctc 180

gactggaact accgttggat ccacaatgcc gacggcaccg cctcgtgcac gacgtccagc 240

ggggtcgacc acacgctgtg tccagatgag gcgacctgcg cgaagaactg cttcgtggaa 300

ggcgtcaact acacgagcag cggtgtcacc acatccggca gttcgctgac gatgaggcag 360

tatttcaagg ggagcaacgg gcagaccaac agcgtttcgc ctcgtctcta cctgctcggc 420

tcggatggaa actacgtaat gctcaagctg ctcggccagg agctgagctt cgatgtcgat 480

ctctccacgc tcccctgcgg cgagaacggc gcgctgtacc tgtccgagat ggacgcgacc 540

ggtggcagga accagtacaa caccggcggt gccaactacg gctcgggcta ctgtgacgcc 600

cagtgtcccg tgcagacgtg gatgaacggc acgctgaaca ccaacgggca gggctactgc 660

tgcaacgaga tggacatcct cgaggccaac tcccgcgcca acgcgatgac acctcacccc 720

tgcgccaacg gcagctgcga caagagcggg tgcggactca acccctacgc cgagggctac 780

aagagctact acggaccggg cctcacggtt gacacgtcga agcccttcac catcattacc 840

cgcttcatca ccgacgacgg cacgaccagc ggcaccctca accagatcca gcggatctat 900

gtgcagaatg gcaagacggt cgcgtcggct gcgtccggag gcgacatcat cacggcatcc 960

ggctgcacct cggcccaggc gttcggcggg ctggccaaca tgggcgcggc gcttggacgg 1020

ggcatggtgc tgaccttcag catctggaac gacgctgggg gctacatgaa ctggctcgac 1080

agcggcaaca acggcccgtg cagcagcacc gagggcaacc cgtccaacat cctggccaac 1140

tacccggaca cccacgtggt cttctccaac atccgctggg gagacatcgg ctcgacggtc 1200

caggtctcgg gaggcggcaa cggcggctcg accaccacca cgtcgaccac cacgctgagg 1260

acctcgacca cgaccaccac caccgccccg acggccactg ccacgcactg gggacaatgc 1320

ggcggaatcg gggtacgtca accgcctcct gcattctgtt gaggaagtta actaacgtgg 1380

cctacgcagt ggactggacc gaccgtctgc gaatcgccgt acgcatgcaa ggagctgaac 1440

ccctggtact accagtgcct ctaaagtatt gcagtgaagc catactccgt gctcggcatg 1500

g 1501

<210>42

<211>464

<212>PRT

<213>土生梭孢霉(Thielavia terrestris)

<400>42

Met Gly Gln Lys Thr Leu His Gly Phe Ala Ala Thr Ala Leu Ala Val

1 5 10 15

Leu Pro Phe Val Lys Ala Gln Gln Pro Gly Asn Phe Thr Pro Glu Val

20 25 30

His Pro Gln Leu Pro Thr Trp Lys Cys Thr Thr Ala Gly Gly Cys Val

35 40 45

Gln Gln Asp Thr Ser Val Val Leu Asp Trp Asn Tyr Arg Trp Ile His

50 55 60

Asn Ala Asp Gly Thr Ala Ser Cys Thr Thr Ser Ser Gly Val Asp His

65 70 75 80

Thr Leu Cys Pro Asp Glu Ala Thr Cys Ala Lys Asn Cys Phe Val Glu

85 90 95

Gly Val Asn Tyr Thr Ser Ser Gly Val Thr Thr Ser Gly Ser Ser Leu

100 105 110

Thr Met Arg Gln Tyr Phe Lys Gly Ser Asn Gly Gln Thr Asn Ser Val

115 120 125

Ser Pro Arg Leu Tyr Leu Leu Gly Ser Asp Gly Asn Tyr Val Met Leu

130 135 140

Lys Leu Leu Gly Gln Glu Leu Ser Phe Asp Val Asp Leu Ser Thr Leu

145 150 155 160

Pro Cys Gly Glu Asn Gly Ala Leu Tyr Leu Ser Glu Met Asp Ala Thr

165 170 175

Gly Gly Arg Asn Gln Tyr Asn Thr Gly Gly Ala Asn Tyr Gly Ser Gly

180 185 190

Tyr Cys Asp Ala Gln Cys Pro Val Gln Thr Trp Met Asn Gly Thr Leu

195 200 205

Asn Thr Asn Gly Gln Gly Tyr Cys Cys Asn Glu Met Asp Ile Leu Glu

210 215 220

Ala Asn Ser Arg Ala Asn Ala Met Thr Pro His Pro Cys Ala Asn Gly

225 230 235 240

Ser Cys Asp Lys Ser Gly Cys Gly Leu Asn Pro Tyr Ala Glu Gly Tyr

245 250 255

Lys Ser Tyr Tyr Gly Pro Gly Leu Thr Val Asp Thr Ser Lys Pro Phe

260 265 270

Thr Ile Ile Thr Arg Phe Ile Thr Asp Asp Gly Thr Thr Ser Gly Thr

275 280 285

Leu Asn Gln Ile Gln Arg Ile Tyr Val Gln Asn Gly Lys Thr Val Ala

290 295 300

Ser Ala Ala Ser Gly Gly Asp Ile Ile Thr Ala Ser Gly Cys Thr Ser

305 310 315 320

Ala Gln Ala Phe Gly Gly Leu Ala Asn Met Gly Ala Ala Leu Gly Arg

325 330 335

Gly Met Val Leu Thr Phe Ser Ile Trp Asn Asp Ala Gly Gly Tyr Met

340 345 350

Asn Trp Leu Asp Ser Gly Asn Asn Gly Pro Cys Ser Ser Thr Glu Gly

355 360 365

Asn Pro Ser Asn Ile Leu Ala Asn Tyr Pro Asp Thr His Val Val Phe

370 375 380

Ser Asn Ile Arg Trp Gly Asp Ile Gly Ser Thr Val Gln Val Ser Gly

385 390 395 400

Gly Gly Asn Gly Gly Ser Thr Thr Thr Thr Ser Thr Thr Thr Leu Arg

405 410 415

Thr Ser Thr Thr Thr Thr Thr Thr Ala Pro Thr Ala Thr Ala Thr His

420 425 430

Trp Gly Gln Cys Gly Gly Ile Gly Trp Thr Gly Pro Thr Val Cys Glu

435 440 445

Ser Pro Tyr Ala Cys Lys Glu Leu Asn Pro Trp Tyr Tyr Gln Cys Leu

450 455 460

<210>43

<211>1368

<212>DNA

<213>土生梭孢霉(Thielavia terrestris)

<400>43

accgatccgc tcgaagatgg cgcccaagtc tacagttctg gccgcctggc tgctctcctc 60

gctggccgcg gcccagcaga tcggcaaagc cgtgcccgag gtccacccca aactgacaac 120

gcagaagtgc actctccgcg gcgggtgcaa gcctgtccgc acctcggtcg tgctcgactc 180

gtccgcgcgc tcgctgcaca aggtcgggga ccccaacacc agctgcagcg tcggcggcga 240

cctgtgctcg gacgcgaagt cgtgcggcaa gaactgcgcg ctcgagggcg tcgactacgc 300

ggcccacggc gtggcgacca agggcgacgc cctcacgctg caccagtggc tcaagggggc 360

cgacggcacc tacaggaccg tctcgccgcg cgtatacctc ctgggcgagg acgggaagaa 420

ctacgaggac ttcaagctgc tcaacgccga gctcagcttc gacgtcgacg tgtcccagct 480

cgtctgcggc atgaacggcg ccctgtactt ctccgagatg gagatggacg gcggccgcag 540

cccgctgaac ccggcgggcg ccacgtacgg cacgggctac tgcgacgcgc agtgccccaa 600

gttggacttt atcaacggcg aggtatttct tctctcttct gtttttcttt tccatcgctt 660

tttctgaccg gaatccgccc tcttagctca acaccaacca cacgtacggg gcgtgctgca 720

acgagatgga catctgggag gccaacgcgc tggcgcaggc gctcacgccg cacccgtgca 780

acgcgacgcg ggtgtacaag tgcgacacgg cggacgagtg cgggcagccg gtgggcgtgt 840

gcgacgaatg ggggtgctcg tacaacccgt ccaacttcgg ggtcaaggac tactacgggc 900

gcaacctgac ggtggacacg aaccgcaagt tcacggtgac gacgcagttc gtgacgtcca 960

acgggcgggc ggacggcgag ctgaccgaga tccggcggct gtacgtgcag gacggcgtgg 1020

tgatccagaa ccacgcggtc acggcgggcg gggcgacgta cgacagcatc acggacggct 1080

tctgcaacgc gacggccacc tggacgcagc agcggggcgg gctcgcgcgc atgggcgagg 1140

ccatcggccg cggcatggtg ctcatcttca gcctgtgggt tgacaacggc ggcttcatga 1200

actggctcga cagcggcaac gccgggccct gcaacgccac cgagggcgac ccggccctga 1260

tcctgcagca gcacccggac gccagcgtca ccttctccaa catccgatgg ggcgagatcg 1320

gcagcacgta caagagcgag tgcagccact agagtagagc ttgtaatt 1368

<210>44

<211>423

<212>PRT

<213>土生梭孢霉(Thielavia terrestris)

<400>44

Met Ala Pro Lys Ser Thr Val Leu Ala Ala Trp Leu Leu Ser Ser Leu

1 5 10 15

Ala Ala Ala Gln Gln Ile Gly Lys Ala Val Pro Glu Val His Pro Lys

20 25 30

Leu Thr Thr Gln Lys Cys Thr Leu Arg Gly Gly Cys Lys Pro Val Arg

35 40 45

Thr Ser Val Val Leu Asp Ser Ser Ala Arg Ser Leu His Lys Val Gly

50 55 60

Asp Pro Asn Thr Ser Cys Ser Val Gly Gly Asp Leu Cys Ser Asp Ala

65 70 75 80

Lys Ser Cys Gly Lys Asn Cys Ala Leu Glu Gly Val Asp Tyr Ala Ala

85 90 95

His Gly Val Ala Thr Lys Gly Asp Ala Leu Thr Leu His Gln Trp Leu

100 105 110

Lys Gly Ala Asp Gly Thr Tyr Arg Thr Val Ser Pro Arg Val Tyr Leu

115 120 125

Leu Gly Glu Asp Gly Lys Asn Tyr Glu Asp Phe Lys Leu Leu Asn Ala

130 135 140

Glu Leu Ser Phe Asp Val Asp Val Ser Gln Leu Val Cys Gly Met Asn

145 150 155 160

Gly Ala Leu Tyr Phe Ser Glu Met Glu Met Asp Gly Gly Arg Ser Pro

165 170 175

Leu Asn Pro Ala Gly Ala Thr Tyr Gly Thr Gly Tyr Cys Asp Ala Gln

180 185 190

Cys Pro Lys Leu Asp Phe Ile Asn Gly Glu Leu Asn Thr Asn His Thr

195 200 205

Tyr Gly Ala Cys Cys Asn Glu Met Asp Ile Trp Glu Ala Asn Ala Leu

210 215 220

Ala Gln Ala Leu Thr Pro His Pro Cys Asn Ala Thr Arg Val Tyr Lys

225 230 235 240

Cys Asp Thr Ala Asp Glu Cys Gly Gln Pro Val Gly Val Cys Asp Glu

245 250 255

Trp Gly Cys Ser Tyr Asn Pro Ser Asn Phe Gly Val Lys Asp Tyr Tyr

260 265 270

Gly Arg Asn Leu Thr Val Asp Thr Asn Arg Lys Phe Thr Val Thr Thr

275 280 285

Gln Phe Val Thr Ser Asn Gly Arg Ala Asp Gly Glu Leu Thr Glu Ile

290 295 300

Arg Arg Leu Tyr Val Gln Asp Gly Val Val Ile Gln Asn His Ala Val

305 310 315 320

Thr Ala Gly Gly Ala Thr Tyr Asp Ser Ile Thr Asp Gly Phe Cys Asn

325 330 335

Ala Thr Ala Thr Trp Thr Gln Gln Arg Gly Gly Leu Ala Arg Met Gly

340 345 350

Glu Ala Ile Gly Arg Gly Met Val Leu Ile Phe Ser Leu Trp Val Asp

355 360 365

Asn Gly Gly Phe Met Asn Trp Leu Asp Ser Gly Asn Ala Gly Pro Cys

370 375 380

Asn Ala Thr Glu Gly Asp Pro Ala Leu Ile Leu Gln Gln His Pro Asp

385 390 395 400

Ala Ser Val Thr Phe Ser Asn Ile Arg Trp Gly Glu Ile Gly Ser Thr

405 410 415

Tyr Lys Ser Glu Cys Ser His

420

<210>45

<211>1011

<212>DNA

<213>土生梭孢霉(Thielavia terrestris)

<400>45

atgaccctac ggctccctgt catcagcctg ctggcctcgc tggcagcagg cgccgtcgtc 60

gtcccacggg cggagtttca cccccctctc ccgacttgga aatgcacgac ctccgggggc 120

tgcgtgcagc agaacaccag cgtcgtcctg gaccgtgact cgaagtacgc cgcacacagc 180

gccggctcgc ggacggaatc ggattacgcg gcaatgggag tgtccacttc gggcaatgcc 240

gtgacgctgt accactacgt caagaccaac ggcaccctcg tccccgcttc gccgcgcatc 300

tacctcctgg gcgcggacgg caagtacgtg cttatggacc tcctcaacca ggagctgtcg 360

gtggacgtcg acttctcggc gctgccgtgc ggcgagaacg gggccttcta cctgtccgag 420

atggcggcgg acgggcgggg cgacgcgggg gcgggcgacg ggtactgcga cgcgcagtgc 480

cagggctact gctgcaacga gatggacatc ctcgaggcca actcgatggc gacggccatg 540

acgccgcacc cgtgcaaggg caacaactgc gaccgcagcg gctgcggcta caacccgtac 600

gccagcggcc agcgcggctt ctacgggccc ggcaagacgg tcgacacgag caagcccttc 660

accgtcgtca cgcagttcgc cgccagcggc ggcaagctga cccagatcac ccgcaagtac 720

atccagaacg gccgggagat cggcggcggc ggcaccatct ccagctgcgg ctccgagtct 780

tcgacgggcg gcctgaccgg catgggcgag gcgctggggc gcggaatggt gctggccatg 840

agcatctgga acgacgcggc ccaggagatg gcatggctcg atgccggcaa caacggccct 900

tgcgccagtg gccagggcag cccgtccgtc attcagtcgc agcatcccga cacccacgtc 960

gtcttctcca acatcaggtg gggcgacatc gggtctacca cgaagaacta g 1011

<210>46

<211>336

<212>PRT

<213>土生梭孢霉(Thielavia terrestris)

<400>46

Met Thr Leu Arg Leu Pro Val Ile Ser Leu Leu Ala Ser Leu Ala Ala

1 5 10 15

Gly Ala Val Val Val Pro Arg Ala Glu Phe His Pro Pro Leu Pro Thr

20 25 30

Trp Lys Cys Thr Thr Ser Gly Gly Cys Val Gln Gln Asn Thr Ser Val

35 40 45

Val Leu Asp Arg Asp Ser Lys Tyr Ala Ala His Ser Ala Gly Ser Arg

50 55 60

Thr Glu Ser Asp Tyr Ala Ala Met Gly Val Ser Thr Ser Gly Asn Ala

65 70 75 80

Val Thr Leu Tyr His Tyr Val Lys Thr Asn Gly Thr Leu Val Pro Ala

85 90 95

Ser Pro Arg Ile Tyr Leu Leu Gly Ala Asp Gly Lys Tyr Val Leu Met

100 105 110

Asp Leu Leu Asn Gln Glu Leu Ser Val Asp Val Asp Phe Ser Ala Leu

115 120 125

Pro Cys Gly Glu Asn Gly Ala Phe Tyr Leu Ser Glu Met Ala Ala Asp

130 135 140

Gly Arg Gly Asp Ala Gly Ala Gly Asp Gly Tyr Cys Asp Ala Gln Cys

145 150 155 160

Gln Gly Tyr Cys Cys Asn Glu Met Asp Ile Leu Glu Ala Asn Ser Met

165 170 175

Ala Thr Ala Met Thr Pro His Pro Cys Lys Gly Asn Asn Cys Asp Arg

180 185 190

Ser Gly Cys Gly Tyr Asn Pro Tyr Ala Ser Gly Gln Arg Gly Phe Tyr

195 200 205

Gly Pro Gly Lys Thr Val Asp Thr Ser Lys Pro Phe Thr Val Val Thr

210 215 220

Gln Phe Ala Ala Ser Gly Gly Lys Leu Thr Gln Ile Thr Arg Lys Tyr

225 230 235 240

Ile Gln Asn Gly Arg Glu Ile Gly Gly Gly Gly Thr Ile Ser Ser Cys

245 250 255

Gly Ser Glu Ser Ser Thr Gly Gly Leu Thr Gly Met Gly Glu Ala Leu

260 265 270

Gly Arg Gly Met Val Leu Ala Met Ser Ile Trp Asn Asp Ala Ala Gln

275 280 285

Glu Met Ala Trp Leu Asp Ala Gly Asn Asn Gly Pro Cys Ala Ser Gly

290 295 300

Gln Gly Ser Pro Ser Val Ile Gln Ser Gln His Pro Asp Thr His Val

305 310 315 320

Val Phe Ser Asn Ile Arg Trp Gly Asp Ile Gly Ser Thr Thr Lys Asn

325 330 335

<210>47

<211>1480

<212>DNA

<213>Cladorrhinum foecundissimum

<400>47

gatccgaatt cctcctctcg ttctttagtc acagaccaga catctgccca cgatggttca 60

caagttcgcc ctcctcaccg gcctcgccgc ctccctcgca tctgcccagc agatcggcac 120

cgtcgtcccc gagtctcacc ccaagcttcc caccaagcgc tgcactctcg ccggtggctg 180

ccagaccgtc gacacctcca tcgtcatcga cgccttccag cgtcccctcc acaagatcgg 240

cgacccttcc actccttgcg tcgtcggcgg ccctctctgc cccgacgcca agtcctgcgc 300

tgagaactgc gcgctcgagg gtgtcgacta tgcctcctgg ggcatcaaga ccgagggcga 360

cgccctaact ctcaaccagt ggatgcccga cccggcgaac cctggccagt acaagacgac 420

tactccccgt acttaccttg ttgctgagga cggcaagaac tacgaggatg tgaagctcct 480

ggctaaggag atctcgtttg atgccgatgt cagcaacctt ccctgcggca tgaacggtgc 540

tttctacttg tctgagatgt tgatggatgg tggacgtggc gacctcaacc ctgctggtgc 600

cgagtatggt accggttact gtgatgcgca gtgcttcaag ttggatttca tcaacggcga 660

ggccaacatc gaccaaaagc acggcgcctg ctgcaacgaa atggacattt tcgaatccaa 720

ctcgcgcgcc aagaccttcg tcccccaccc ctgcaacatc acgcaggtct acaagtgcga 780

aggcgaagac gagtgcggcc agcccgtcgg cgtgtgcgac aagtgggggt gcggcttcaa 840

cgagtacaaa tggggcgtcg agtccttcta cggccggggc tcgcagttcg ccatcgactc 900

ctccaagaag ttcaccgtca ccacgcagtt cctgaccgac aacggcaagg aggacggcgt 960

cctcgtcgag atccgccgct tgtggcacca ggatggcaag ctgatcaaga acaccgctat 1020

ccaggttgag gagaactaca gcacggactc ggtgagcacc gagttctgcg agaagactgc 1080

ttctttcacc atgcagcgcg gtggtctcaa ggcgatgggc gaggctatcg gtcgtggtat 1140

ggtgctggtt ttcagcatct gggcggatga ttcgggtttt atgaactggt tggatgcgga 1200

gggtaatggc ccttgcagcg cgactgaggg cgatccgaag gagattgtca agaataagcc 1260

ggatgctagg gttacgttct caaacattag gattggtgag gttggtagca cgtatgctcc 1320

gggtgggaag tgcggtgtta agagcagggt tgctaggggg cttactgctt cttaaggggg 1380

gtgtgaagag aggaggaggt gttgttgggg gttggagatg ataattgggc gagatggtgt 1440

agagcgggtt ggttggatat gaatacgttg aattggatgt 1480

<210>48

<211>440

<212>PRT

<213>Cladorrhinum foecundissimum

<400>48

Met Val His Lys Phe Ala Leu Leu Thr Gly Leu Ala Ala Ser Leu Ala

1 5 10 15

Ser Ala Gln Gln Ile Gly Thr Val Val Pro Glu Ser His Pro Lys Leu

20 25 30

Pro Thr Lys Arg Cys Thr Leu Ala Gly Gly Cys Gln Thr Val Asp Thr

35 40 45

Ser Ile Val Ile Asp Ala Phe Gln Arg Pro Leu His Lys Ile Gly Asp

50 55 60

Pro Ser Thr Pro Cys Val Val Gly Gly Pro Leu Cys Pro Asp Ala Lys

65 70 75 80

Ser Cys Ala Glu Asn Cys Ala Leu Glu Gly Val Asp Tyr Ala Ser Trp

85 90 95

Gly Ile Lys Thr Glu Gly Asp Ala Leu Thr Leu Asn Gln Trp Met Pro

100 105 110

Asp Pro Ala Asn Pro Gly Gln Tyr Lys Thr Thr Thr Pro Arg Thr Tyr

115 120 125

Leu Val Ala Glu Asp Gly Lys Asn Tyr Glu Asp Val Lys Leu Leu Ala

130 135 140

Lys Glu Ile Ser Phe Asp Ala Asp Val Ser Asn Leu Pro Cys Gly Met

145 150 155 160

Asn Gly Ala Phe Tyr Leu Ser Glu Met Leu Met Asp Gly Gly Arg Gly

165 170 175

Asp Leu Asn Pro Ala Gly Ala Glu Tyr Gly Thr Gly Tyr Cys Asp Ala

180 185 190

Gln Cys Phe Lys Leu Asp Phe Ile Asn Gly Glu Ala Asn Ile Asp Gln

195 200 205

Lys His Gly Ala Cys Cys Asn Glu Met Asp Ile Phe Glu Ser Asn Ser

210 215 220

Arg Ala Lys Thr Phe Val Pro His Pro Cys Asn Ile Thr Gln Val Tyr

225 230 235 240

Lys Cys Glu Gly Glu Asp Glu Cys Gly Gln Pro Val Gly Val Cys Asp

245 250 255

Lys Trp Gly Cys Gly Phe Asn Glu Tyr Lys Trp Gly Val Glu Ser Phe

260 265 270

Tyr Gly Arg Gly Ser Gln Phe Ala Ile Asp Ser Ser Lys Lys Phe Thr

275 280 285

Val Thr Thr Gln Phe Leu Thr Asp Asn Gly Lys Glu Asp Gly Val Leu

290 295 300

Val Glu Ile Arg Arg Leu Trp His Gln Asp Gly Lys Leu Ile Lys Asn

305 310 315 320

Thr Ala Ile Gln Val Glu Glu Asn Tyr Ser Thr Asp Ser Val Ser Thr

325 330 335

Glu Phe Cys Glu Lys Thr Ala Ser Phe Thr Met Gln Arg Gly Gly Leu

340 345 350

Lys Ala Met Gly Glu Ala Ile Gly Arg Gly Met Val Leu Val Phe Ser

355 360 365

Ile Trp Ala Asp Asp Ser Gly Phe Met Asn Trp Leu Asp Ala Glu Gly

370 375 380

Asn Gly Pro Cys Ser Ala Thr Glu Gly Asp Pro Lys Glu Ile Val Lys

385 390 395 400

Asn Lys Pro Asp Ala Arg Val Thr Phe Ser Asn Ile Arg Ile Gly Glu

405 410 415

Val Gly Ser Thr Tyr Ala Pro Gly Gly Lys Cys Gly Val Lys Ser Arg

420 425 430

Val Ala Arg Gly Leu Thr Ala Ser

435 440

<210>49

<211>1380

<212>DNA

<213>里氏木霉(Trichoderma reesei)

<400>49

atggcgccct cagttacact gccgttgacc acggccatcc tggccattgc ccggctcgtc 60

gccgcccagc aaccgggtac cagcaccccc gaggtccatc ccaagttgac aacctacaag 120

tgtacaaagt ccggggggtg cgtggcccag gacacctcgg tggtccttga ctggaactac 180

cgctggatgc acgacgcaaa ctacaactcg tgcaccgtca acggcggcgt caacaccacg 240

ctctgccctg acgaggcgac ctgtggcaag aactgcttca tcgagggcgt cgactacgcc 300

gcctcgggcg tcacgacctc gggcagcagc ctcaccatga accagtacat gcccagcagc 360

tctggcggct acagcagcgt ctctcctcgg ctgtatctcc tggactctga cggtgagtac 420

gtgatgctga agctcaacgg ccaggagctg agcttcgacg tcgacctctc tgctctgccg 480

tgtggagaga acggctcgct ctacctgtct cagatggacg agaacggggg cgccaaccag 540

tataacacgg ccggtgccaa ctacgggagc ggctactgcg atgctcagtg ccccgtccag 600

acatggagga acggcaccct caacactagc caccagggct tctgctgcaa cgagatggat 660

atcctggagg gcaactcgag ggcgaatgcc ttgacccctc actcttgcac ggccacggcc 720

tgcgactctg ccggttgcgg cttcaacccc tatggcagcg gctacaaaag ctactacggc 780

cccggagata ccgttgacac ctccaagacc ttcaccatca tcacccagtt caacacggac 840

aacggctcgc cctcgggcaa ccttgtgagc atcacccgca agtaccagca aaacggcgtc 900

gacatcccca gcgcccagcc cggcggcgac accatctcgt cctgcccgtc cgcctcagcc 960

tacggcggcc tcgccaccat gggcaaggcc ctgagcagcg gcatggtgct cgtgttcagc 1020

atttggaacg acaacagcca gtacatgaac tggctcgaca gcggcaacgc cggcccctgc 1080

agcagcaccg agggcaaccc atccaacatc ctggccaaca accccaacac gcacgtcgtc 1140

ttctccaaca tccgctgggg agacattggg tctactacga actcgactgc gcccccgccc 1200

ccgcctgcgt ccagcacgac gttttcgact acacggagga gctcgacgac ttcgagcagc 1260

ccgagctgca cgcagactca ctgggggcag tgcggtggca ttgggtacag cgggtgcaag 1320

acgtgcacgt cgggcactac gtgccagtat agcaacgact actactcgca atgcctttag 1380

<210>50

<211>459

<212>PRT

<213>里氏木霉(Trichoderma reesei)

<400>50

Met Ala Pro Ser Val Thr Leu Pro Leu Thr Thr Ala Ile Leu Ala Ile

1 5 10 15

Ala Arg Leu Val Ala Ala Gln Gln Pro Gly Thr Ser Thr Pro Glu Val

20 25 30

His Pro Lys Leu Thr Thr Tyr Lys Cys Thr Lys Ser Gly Gly Cys Val

35 40 45

Ala Gln Asp Thr Ser Val Val Leu Asp Trp Asn Tyr Arg Trp Met His

50 55 60

Asp Ala Asn Tyr Asn Ser Cys Thr Val Asn Gly Gly Val Asn Thr Thr

65 70 75 80

Leu Cys Pro Asp Glu Ala Thr Cys Gly Lys Asn Cys Phe Ile Glu Gly

85 90 95

Val Asp Tyr Ala Ala Ser Gly Val Thr Thr Ser Gly Ser Ser Leu Thr

100 105 110

Met Asn Gln Tyr Met Pro Ser Ser Ser Gly Gly Tyr Ser Ser Val Ser

115 120 125

Pro Arg Leu Tyr Leu Leu Asp Ser Asp Gly Glu Tyr Val Met Leu Lys

130 135 140

Leu Asn Gly Gln Glu Leu Ser Phe Asp Val Asp Leu Ser Ala Leu Pro

145 150 155 160

Cys Gly Glu Asn Gly Ser Leu Tyr Leu Ser Gln Met Asp Glu Asn Gly

165 170 175

Gly Ala Asn Gln Tyr Asn Thr Ala Gly Ala Asn Tyr Gly Ser Gly Tyr

180 185 190

Cys Asp Ala Gln Cys Pro Val Gln Thr Trp Arg Asn Gly Thr Leu Asn

195 200 205

Thr Ser His Gln Gly Phe Cys Cys Asn Glu Met Asp Ile Leu Glu Gly

210 215 220

Asn Ser Arg Ala Asn Ala Leu Thr Pro His Ser Cys Thr Ala Thr Ala

225 230 235 240

Cys Asp Ser Ala Gly Cys Gly Phe Asn Pro Tyr Gly Ser Gly Tyr Lys

245 250 255

Ser Tyr Tyr Gly Pro Gly Asp Thr Val Asp Thr Ser Lys Thr Phe Thr

260 265 270

Ile Ile Thr Gln Phe Asn Thr Asp Asn Gly Ser Pro Ser Gly Asn Leu

275 280 285

Val Ser Ile Thr Arg Lys Tyr Gln Gln Asn Gly Val Asp Ile Pro Ser

290 295 300

Ala Gln Pro Gly Gly Asp Thr Ile Ser Ser Cys Pro Ser Ala Ser Ala

305 310 315 320

Tyr Gly Gly Leu Ala Thr Met Gly Lys Ala Leu Ser Ser Gly Met Val

325 330 335

Leu Val Phe Ser Ile Trp Asn Asp Asn Ser Gln Tyr Met Asn Trp Leu

340 345 350

Asp Ser Gly Asn Ala Gly Pro Cys Ser Ser Thr Glu Gly Asn Pro Ser

355 360 365

Asn Ile Leu Ala Asn Asn Pro Asn Thr His Val Val Phe Ser Asn Ile

370 375 380

Arg Trp Gly Asp Ile Gly Ser Thr Thr Asn Ser Thr Ala Pro Pro Pro

385 390 395 400

Pro Pro Ala Ser Ser Thr Thr Phe Ser Thr Thr Arg Arg Ser Ser Thr

405 410 415

Thr Ser Ser Ser Pro Ser Cys Thr Gln Thr His Trp Gly Gln Cys Gly

420 425 430

Gly Ile Gly Tyr Ser Gly Cys Lys Thr Cys Thr Ser Gly Thr Thr Cys

435 440 445

Gln Tyr Ser Asn Asp Tyr Tyr Ser Gln Cys Leu

450 455

<210>51

<211>1542

<212>DNA

<213>里氏木霉(Trichoderma reesei)

<400>51

atgtatcgga agttggccgt catctcggcc ttcttggcca cagctcgtgc tcagtcggcc 60

tgcactctcc aatcggagac tcacccgcct ctgacatggc agaaatgctc gtctggtggc 120

acgtgcactc aacagacagg ctccgtggtc atcgacgcca actggcgctg gactcacgct 180

acgaacagca gcacgaactg ctacgatggc aacacttgga gctcgaccct atgtcctgac 240

aacgagacct gcgcgaagaa ctgctgtctg gacggtgccg cctacgcgtc cacgtacgga 300

gttaccacga gcggtaacag cctctccatt ggctttgtca cccagtctgc gcagaagaac 360

gttggcgctc gcctttacct tatggcgagc gacacgacct accaggaatt caccctgctt 420

ggcaacgagt tctctttcga tgttgatgtt tcgcagctgc cgtgcggctt gaacggagct 480

ctctacttcg tgtccatgga cgcggatggt ggcgtgagca agtatcccac caacaccgct 540

ggcgccaagt acggcacggg gtactgtgac agccagtgtc cccgcgatct gaagttcatc 600

aatggccagg ccaacgttga gggctgggag ccgtcatcca acaacgcgaa cacgggcatt 660

ggaggacacg gaagctgctg ctctgagatg gatatctggg aggccaactc catctccgag 720

gctcttaccc cccacccttg cacgactgtc ggccaggaga tctgcgaggg tgatgggtgc 780

ggcggaactt actccgataa cagatatggc ggcacttgcg atcccgatgg ctgcgactgg 840

aacccatacc gcctgggcaa caccagcttc tacggccctg gctcaagctt taccctcgat 900

accaccaaga aattgaccgt tgtcacccag ttcgagacgt cgggtgccat caaccgatac 960

tatgtccaga atggcgtcac tttccagcag cccaacgccg agcttggtag ttactctggc 1020

aacgagctca acgatgatta ctgcacagct gaggaggcag aattcggcgg atcctctttc 1080

tcagacaagg gcggcctgac tcagttcaag aaggctacct ctggcggcat ggttctggtc 1140

atgagtctgt gggatgatta ctacgccaac atgctgtggc tggactccac ctacccgaca 1200

aacgagacct cctccacacc cggtgccgtg cgcggaagct gctccaccag ctccggtgtc 1260

cctgctcagg tcgaatctca gtctcccaac gccaaggtca ccttctccaa catcaagttc 1320

ggacccattg gcagcaccgg caaccctagc ggcggcaacc ctcccggcgg aaacccgcct 1380

ggcaccacca ccacccgccg cccagccact accactggaa gctctcccgg acctacccag 1440

tctcactacg gccagtgcgg cggtattggc tacagcggcc ccacggtctg cgccagcggc 1500

acaacttgcc aggtcctgaa cccttactac tctcagtgcc tg 1542

<210>52

<211>514

<212>PRT

<213>里氏木霉(Trichoderma reesei)

<400>52

Met Tyr Arg Lys Leu Ala Val Ile Ser Ala Phe Leu Ala Thr Ala Arg

1 5 10 15

Ala Gln Ser Ala Cys Thr Leu Gln Ser Glu Thr His Pro Pro Leu Thr

20 25 30

Trp Gln Lys Cys Ser Ser Gly Gly Thr Cys Thr Gln Gln Thr Gly Ser

35 40 45

Val Val Ile Asp Ala Asn Trp Arg Trp Thr His Ala Thr Asn Ser Ser

50 55 60

Thr Asn Cys Tyr Asp Gly Asn Thr Trp Ser Ser Thr Leu Cys Pro Asp

65 70 75 80

Asn Glu Thr Cys Ala Lys Asn Cys Cys Leu Asp Gly Ala Ala Tyr Ala

85 90 95

Ser Thr Tyr Gly Val Thr Thr Ser Gly Asn Ser Leu Ser Ile Gly Phe

100 105 110

Val Thr Gln Ser Ala Gln Lys Asn Val Gly Ala Arg Leu Tyr Leu Met

115 120 125

Ala Ser Asp Thr Thr Tyr Gln Glu Phe Thr Leu Leu Gly Asn Glu Phe

130 135 140

Ser Phe Asp Val Asp Val Ser Gln Leu Pro Cys Gly Leu Asn Gly Ala

145 150 155 160

Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Val Ser Lys Tyr Pro

165 170 175

Thr Asn Thr Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln

180 185 190

Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Glu Gly

195 200 205

Trp Glu Pro Ser Ser Asn Asn Ala Asn Thr Gly Ile Gly Gly His Gly

210 215 220

Ser Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Ser Ile Ser Glu

225 230 235 240

Ala Leu Thr Pro His Pro Cys Thr Thr Val Gly Gln Glu Ile Cys Glu

245 250 255

Gly Asp Gly Cys Gly Gly Thr Tyr Ser Asp Asn Arg Tyr Gly Gly Thr

260 265 270

Cys Asp Pro Asp Gly Cys Asp Trp Asn Pro Tyr Arg Leu Gly Asn Thr

275 280 285

Ser Phe Tyr Gly Pro Gly Ser Ser Phe Thr Leu Asp Thr Thr Lys Lys

290 295 300

Leu Thr Val Val Thr Gln Phe Glu Thr Ser Gly Ala Ile Asn Arg Tyr

305 310 315 320

Tyr Val Gln Asn Gly Val Thr Phe Gln Gln Pro Asn Ala Glu Leu Gly

325 330 335

Ser Tyr Ser Gly Asn Glu Leu Asn Asp Asp Tyr Cys Thr Ala Glu Glu

340 345 350

Ala Glu Phe Gly Gly Ser Ser Phe Ser Asp Lys Gly Gly Leu Thr Gln

355 360 365

Phe Lys Lys Ala Thr Ser Gly Gly Met Val Leu Val Met Ser Leu Trp

370 375 380

Asp Asp Tyr Tyr Ala Asn Met Leu Trp Leu Asp Ser Thr Tyr Pro Thr

385 390 395 400

Asn Glu Thr Ser Ser Thr Pro Gly Ala Val Arg Gly Ser Cys Ser Thr

405 410 415

Ser Ser Gly Val Pro Ala Gln Val Glu Ser Gln Ser Pro Asn Ala Lys

420 425 430

Val Thr Phe Ser Asn Ile Lys Phe Gly Pro Ile Gly Ser Thr Gly Asn

435 440 445

Pro Ser Gly Gly Asn Pro Pro Gly Gly Asn Pro Pro Gly Thr Thr Thr

450 455 460

Thr Arg Arg Pro Ala Thr Thr Thr Gly Ser Ser Pro Gly Pro Thr Gln

465 470 475 480

Ser His Tyr Gly Gln Cys Gly Gly Ile Gly Tyr Ser Gly Pro Thr Val

485 490 495

Cys Ala Ser Gly Thr Thr Cys Gln Val Leu Asn Pro Tyr Tyr Ser Gln

500 505 510

Cys Leu

<210>53

<211>1413

<212>DNA

<213>里氏木霉(Trichoderma reesei)

<400>53

atgattgtcg gcattctcac cacgctggct acgctggcca cactcgcagc tagtgtgcct 60

ctagaggagc ggcaagcttg ctcaagcgtc tggggccaat gtggtggcca gaattggtcg 120

ggtccgactt gctgtgcttc cggaagcaca tgcgtctact ccaacgacta ttactcccag 180

tgtcttcccg gcgctgcaag ctcaagctcg tccacgcgcg ccgcgtcgac gacttctcga 240

gtatccccca caacatcccg gtcgagctcc gcgacgcctc cacctggttc tactactacc 300

agagtacctc cagtcggatc gggaaccgct acgtattcag gcaacccttt tgttggggtc 360

actccttggg ccaatgcata ttacgcctct gaagttagca gcctcgctat tcctagcttg 420

actggagcca tggccactgc tgcagcagct gtcgcaaagg ttccctcttt tatgtggcta 480

gatactcttg acaagacccc tctcatggag caaaccttgg ccgacatccg caccgccaac 540

aagaatggcg gtaactatgc cggacagttt gtggtgtatg acttgccgga tcgcgattgc 600

gctgcccttg cctcgaatgg cgaatactct attgccgatg gtggcgtcgc caaatataag 660

aactatatcg acaccattcg tcaaattgtc gtggaatatt ccgatatccg gaccctcctg 720

gttattgagc ctgactctct tgccaacctg gtgaccaacc tcggtactcc aaagtgtgcc 780

aatgctcagt cagcctacct tgagtgcatc aactacgccg tcacacagct gaaccttcca 840

aatgttgcga tgtatttgga cgctggccat gcaggatggc ttggctggcc ggcaaaccaa 900

gacccggccg ctcagctatt tgcaaatgtt tacaagaatg catcgtctcc gagagctctt 960

cgcggattgg caaccaatgt cgccaactac aacgggtgga acattaccag ccccccatcg 1020

tacacgcaag gcaacgctgt ctacaacgag aagctgtaca tccacgctat tggacctctt 1080

cttgccaatc acggctggtc caacgccttc ttcatcactg atcaaggtcg atcgggaaag 1140

cagcctaccg gacagcaaca gtggggagac tggtgcaatg tgatcggcac cggatttggt 1200

attcgcccat ccgcaaacac tggggactcg ttgctggatt cgtttgtctg ggtcaagcca 1260

ggcggcgagt gtgacggcac cagcgacagc agtgcgccac gatttgactc ccactgtgcg 1320

ctcccagatg ccttgcaacc ggcgcctcaa gctggtgctt ggttccaagc ctactttgtg 1380

cagcttctca caaacgcaaa cccatcgttc ctg 1413

<210>54

<211>471

<212>PRT

<213>里氏木霉(Trichoderma reesei)

<400>54

Met Ile Val Gly Ile Leu Thr Thr Leu Ala Thr Leu Ala Thr Leu Ala

1 5 10 15

Ala Ser Val Pro Leu Glu Glu Arg Gln Ala Cys Ser Ser Val Trp Gly

20 25 30

Gln Cys Gly Gly Gln Asn Trp Ser Gly Pro Thr Cys Cys Ala Ser Gly

35 40 45

Ser Thr Cys Val Tyr Ser Asn Asp Tyr Tyr Ser Gln Cys Leu Pro Gly

50 55 60

Ala Ala Ser Ser Ser Ser Ser Thr Arg Ala Ala Ser Thr Thr Ser Arg

65 70 75 80

Val Ser Pro Thr Thr Ser Arg Ser Ser Ser Ala Thr Pro Pro Pro Gly

85 90 95

Ser Thr Thr Thr Arg Val Pro Pro Val Gly Ser Gly Thr Ala Thr Tyr

100 105 110

Ser Gly Asn Pro Phe Val Gly Val Thr Pro Trp Ala Asn Ala Tyr Tyr

115 120 125

Ala Ser Glu Val Ser Ser Leu Ala Ile Pro Ser Leu Thr Gly Ala Met

130 135 140

Ala Thr Ala Ala Ala Ala Val Ala Lys Val Pro Ser Phe Met Trp Leu

145 150 155 160

Asp Thr Leu Asp Lys Thr Pro Leu Met Glu Gln Thr Leu Ala Asp Ile

165 170 175

Arg Thr Ala Asn Lys Asn Gly Gly Asn Tyr Ala Gly Gln Phe Val Val

180 185 190

Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Leu Ala Ser Asn Gly Glu

195 200 205

Tyr Ser Ile Ala Asp Gly Gly Val Ala Lys Tyr Lys Asn Tyr Ile Asp

210 215 220

Thr Ile Arg Gln Ile Val Val Glu Tyr Ser Asp Ile Arg Thr Leu Leu

225 230 235 240

Val Ile Glu Pro Asp Ser Leu Ala Asn Leu Val Thr Asn Leu Gly Thr

245 250 255

Pro Lys Cys Ala Asn Ala Gln Ser Ala Tyr Leu Glu Cys Ile Asn Tyr

260 265 270

Ala Val Thr Gln Leu Asn Leu Pro Asn Val Ala Met Tyr Leu Asp Ala

275 280 285

Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Gln Asp Pro Ala Ala

290 295 300

Gln Leu Phe Ala Asn Val Tyr Lys Asn Ala Ser Ser Pro Arg Ala Leu

305 310 315 320

Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Gly Trp Asn Ile Thr

325 330 335

Ser Pro Pro Ser Tyr Thr Gln Gly Asn Ala Val Tyr Asn Glu Lys Leu

340 345 350

Tyr Ile His Ala Ile Gly Pro Leu Leu Ala Asn His Gly Trp Ser Asn

355 360 365

Ala Phe Phe Ile Thr Asp Gln Gly Arg Ser Gly Lys Gln Pro Thr Gly

370 375 380

Gln Gln Gln Trp Gly Asp Trp Cys Asn Val Ile Gly Thr Gly Phe Gly

385 390 395 400

Ile Arg Pro Ser Ala Asn Thr Gly Asp Ser Leu Leu Asp Ser Phe Val

405 410 415

Trp Val Lys Pro Gly Gly Glu Cys Asp Gly Thr Ser Asp Ser Ser Ala

420 425 430

Pro Arg Phe Asp Ser His Cys Ala Leu Pro Asp Ala Leu Gln Pro Ala

435 440 445

Pro Gln Ala Gly Ala Trp Phe Gln Ala Tyr Phe Val Gln Leu Leu Thr

450 455 460

Asn Ala Asn Pro Ser Phe Leu

465 470

<210>55

<211>1377

<212>DNA

<213>里氏木霉(Trichoderma reesei)

<400>55

atggcgccct cagttacact gccgttgacc acggccatcc tggccattgc ccggctcgtc 60

gccgcccagc aaccgggtac cagcaccccc gaggtccatc ccaagttgac aacctacaag 120

tgtacaaagt ccggggggtg cgtggcccag gacacctcgg tggtccttga ctggaactac 180

cgctggatgc acgacgcaaa ctacaactcg tgcaccgtca acggcggcgt caacaccacg 240

ctctgccctg acgaggcgac ctgtggcaag aactgcttca tcgagggcgt cgactacgcc 300

gcctcgggcg tcacgacctc gggcagcagc ctcaccatga accagtacat gcccagcagc 360

tctggcggct acagcagcgt ctctcctcgg ctgtatctcc tggactctga cggtgagtac 420

gtgatgctga agctcaacgg ccaggagctg agcttcgacg tcgacctctc tgctctgccg 480

tgtggagaga acggctcgct ctacctgtct cagatggacg agaacggggg cgccaaccag 540

tataacacgg ccggtgccaa ctacgggagc ggctactgcg atgctcagtg ccccgtccag 600

acatggagga acggcaccct caacactagc caccagggct tctgctgcaa cgagatggat 660

atcctggagg gcaactcgag ggcgaatgcc ttgacccctc actcttgcac ggccacggcc 720

tgcgactctg ccggttgcgg cttcaacccc tatggcagcg gctacaaaag ctactacggc 780

cccggagata ccgttgacac ctccaagacc ttcaccatca tcacccagtt caacacggac 840

aacggctcgc cctcgggcaa ccttgtgagc atcacccgca agtaccagca aaacggcgtc 900

gacatcccca gcgcccagcc cggcggcgac accatctcgt cctgcccgtc cgcctcagcc 960

tacggcggcc tcgccaccat gggcaaggcc ctgagcagcg gcatggtgct cgtgttcagc 1020

atttggaacg acaacagcca gtacatgaac tggctcgaca gcggcaacgc cggcccctgc 1080

agcagcaccg agggcaaccc atccaacatc ctggccaaca accccaacac gcacgtcgtc 1140

ttctccaaca tccgctgggg agacattggg tctactacga actcgactgc gcccccgccc 1200

ccgcctgcgt ccagcacgac gttttcgact acacggagga gctcgacgac ttcgagcagc 1260

ccgagctgca cgcagactca ctgggggcag tgcggtggca ttgggtacag cgggtgcaag 1320

acgtgcacgt cgggcactac gtgccagtat agcaacgact actactcgca atgcctt 1377

<210>56

<211>459

<212>PRT

<213>里氏木霉(Trichoderma reesei)

<400>56

Met Ala Pro Ser Val Thr Leu Pro Leu Thr Thr Ala Ile Leu Ala Ile

1 5 10 15

Ala Arg Leu Val Ala Ala Gln Gln Pro Gly Thr Ser Thr Pro Glu Val

20 25 30

His Pro Lys Leu Thr Thr Tyr Lys Cys Thr Lys Ser Gly Gly Cys Val

35 40 45

Ala Gln Asp Thr Ser Val Val Leu Asp Trp Asn Tyr Arg Trp Met His

50 55 60

Asp Ala Asn Tyr Asn Ser Cys Thr Val Asn Gly Gly Val Asn Thr Thr

65 70 75 80

Leu Cys Pro Asp Glu Ala Thr Cys Gly Lys Asn Cys Phe Ile Glu Gly

85 90 95

Val Asp Tyr Ala Ala Ser Gly Val Thr Thr Ser Gly Ser Ser Leu Thr

100 105 110

Met Asn Gln Tyr Met Pro Ser Ser Ser Gly Gly Tyr Ser Ser Val Ser

115 120 125

Pro Arg Leu Tyr Leu Leu Asp Ser Asp Gly Glu Tyr Val Met Leu Lys

130 135 140

Leu Asn Gly Gln Glu Leu Ser Phe Asp Val Asp Leu Ser Ala Leu Pro

145 150 155 160

Cys Gly Glu Asn Gly Ser Leu Tyr Leu Ser Gln Met Asp Glu Asn Gly

165 170 175

Gly Ala Asn Gln Tyr Asn Thr Ala Gly Ala Asn Tyr Gly Ser Gly Tyr

180 185 190

Cys Asp Ala Gln Cys Pro Val Gln Thr Trp Arg Asn Gly Thr Leu Asn

195 200 205

Thr Ser His Gln Gly Phe Cys Cys Asn Glu Met Asp Ile Leu Glu Gly

210 215 220

Asn Ser Arg Ala Asn Ala Leu Thr Pro His Ser Cys Thr Ala Thr Ala

225 230 235 240

Cys Asp Ser Ala Gly Cys Gly Phe Asn Pro Tyr Gly Ser Gly Tyr Lys

245 250 255

Ser Tyr Tyr Gly Pro Gly Asp Thr Val Asp Thr Ser Lys Thr Phe Thr

260 265 270

Ile Ile Thr Gln Phe Asn Thr Asp Asn Gly Ser Pro Ser Gly Asn Leu

275 280 285

Val Ser Ile Thr Arg Lys Tyr Gln Gln Asn Gly Val Asp Ile Pro Ser

290 295 300

Ala Gln Pro Gly Gly Asp Thr Ile Ser Ser Cys Pro Ser Ala Ser Ala

305 310 315 320

Tyr Gly Gly Leu Ala Thr Met Gly Lys Ala Leu Ser Ser Gly Met Val

325 330 335

Leu Val Phe Ser Ile Trp Asn Asp Asn Ser Gln Tyr Met Asn Trp Leu

340 345 350

Asp Ser Gly Asn Ala Gly Pro Cys Ser Ser Thr Glu Gly Asn Pro Ser

355 360 365

Asn Ile Leu Ala Asn Asn Pro Asn Thr His Val Val Phe Ser Asn Ile

370 375 380

Arg Trp Gly Asp Ile Gly Ser Thr Thr Asn Ser Thr Ala Pro Pro Pro

385 390 395 400

Pro Pro Ala Ser Ser Thr Thr Phe Ser Thr Thr Arg Arg Ser Ser Thr

405 410 415

Thr Ser Ser Ser Pro Ser Cys Thr Gln Thr His Trp Gly Gln Cys Gly

420 425 430

Gly Ile Gly Tyr Ser Gly Cys Lys Thr Cys Thr Ser Gly Thr Thr Cys

435 440 445

Gln Tyr Ser Asn Asp Tyr Tyr Ser Gln Cys Leu

450 455

<210>57

<211>1254

<212>DNA

<213>里氏木霉(Trichoderma reesei)

<400>57

atgaacaagt ccgtggctcc attgctgctt gcagcgtcca tactatatgg cggcgccgtc 60

gcacagcaga ctgtctgggg ccagtgtgga ggtattggtt ggagcggacc tacgaattgt 120

gctcctggct cagcttgttc gaccctcaat ccttattatg cgcaatgtat tccgggagcc 180

actactatca ccacttcgac ccggccacca tccggtccaa ccaccaccac cagggctacc 240

tcaacaagct catcaactcc acccacgagc tctggggtcc gatttgccgg cgttaacatc 300

gcgggttttg actttggctg taccacagat ggcacttgcg ttacctcgaa ggtttatcct 360

ccgttgaaga acttcaccgg ctcaaacaac taccccgatg gcatcggcca gatgcagcac 420

ttcgtcaacg aggacgggat gactattttc cgcttacctg tcggatggca gtacctcgtc 480

aacaacaatt tgggcggcaa tcttgattcc acgagcattt ccaagtatga tcagcttgtt 540

caggggtgcc tgtctctggg cgcatactgc atcgtcgaca tccacaatta tgctcgatgg 600

aacggtggga tcattggtca gggcggccct actaatgctc aattcacgag cctttggtcg 660

cagttggcat caaagtacgc atctcagtcg agggtgtggt tcggcatcat gaatgagccc 720

cacgacgtga acatcaacac ctgggctgcc acggtccaag aggttgtaac cgcaatccgc 780

aacgctggtg ctacgtcgca attcatctct ttgcctggaa atgattggca atctgctggg 840

gctttcatat ccgatggcag tgcagccgcc ctgtctcaag tcacgaaccc ggatgggtca 900

acaacgaatc tgatttttga cgtgcacaaa tacttggact cagacaactc cggtactcac 960

gccgaatgta ctacaaataa cattgacggc gccttttctc cgcttgccac ttggctccga 1020

cagaacaatc gccaggctat cctgacagaa accggtggtg gcaacgttca gtcctgcata 1080

caagacatgt gccagcaaat ccaatatctc aaccagaact cagatgtcta tcttggctat 1140

gttggttggg gtgccggatc atttgatagc acgtatgtcc tgacggaaac accgactagc 1200

agtggtaact catggacgga cacatccttg gtcagctcgt gtctcgcaag aaag 1254

<210>58

<211>418

<212>PRT

<213>里氏木霉(Trichoderma reesei)

<400>58

Met Asn Lys Ser Val Ala Pro Leu Leu Leu Ala Ala Ser Ile Leu Tyr

1 5 10 15

Gly Gly Ala Val Ala Gln Gln Thr Val Trp Gly Gln Cys Gly Gly Ile

20 25 30

Gly Trp Ser Gly Pro Thr Asn Cys Ala Pro Gly Ser Ala Cys Ser Thr

35 40 45

Leu Asn Pro Tyr Tyr Ala Gln Cys Ile Pro Gly Ala Thr Thr Ile Thr

50 55 60

Thr Ser Thr Arg Pro Pro Ser Gly Pro Thr Thr Thr Thr Arg Ala Thr

65 70 75 80

Ser Thr Ser Ser Ser Thr Pro Pro Thr Ser Ser Gly Val Arg Phe Ala

85 90 95

Gly Val Asn Ile Ala Gly Phe Asp Phe Gly Cys Thr Thr Asp Gly Thr

100 105 110

Cys Val Thr Ser Lys Val Tyr Pro Pro Leu Lys Asn Phe Thr Gly Ser

115 120 125

Asn Asn Tyr Pro Asp Gly Ile Gly Gln Met Gln His Phe Val Asn Glu

130 135 140

Asp Gly Met Thr Ile Phe Arg Leu Pro Val Gly Trp Gln Tyr Leu Val

145 150 155 160

Asn Asn Asn Leu Gly Gly Asn Leu Asp Ser Thr Ser Ile Ser Lys Tyr

165 170 175

Asp Gln Leu Val Gln Gly Cys Leu Ser Leu Gly Ala Tyr Cys Ile Val

180 185 190

Asp Ile His Asn Tyr Ala Arg Trp Asn Gly Gly Ile Ile Gly Gln Gly

195 200 205

Gly Pro Thr Asn Ala Gln Phe Thr Ser Leu Trp Ser Gln Leu Ala Ser

210 215 220

Lys Tyr Ala Ser Gln Ser Arg Val Trp Phe Gly Ile Met Asn Glu Pro

225 230 235 240

His Asp Val Asn Ile Asn Thr Trp Ala Ala Thr Val Gln Glu Val Val

245 250 255

Thr Ala Ile Arg Asn Ala Gly Ala Thr Ser Gln Phe Ile Ser Leu Pro

260 265 270

Gly Asn Asp Trp Gln Ser Ala Gly Ala Phe Ile Ser Asp Gly Ser Ala

275 280 285

Ala Ala Leu Ser Gln Val Thr Asn Pro Asp Gly Ser Thr Thr Asn Leu

290 295 300

Ile Phe Asp Val His Lys Tyr Leu Asp Ser Asp Asn Ser Gly Thr His

305 310 315 320

Ala Glu Cys Thr Thr Asn Asn Ile Asp Gly Ala Phe Ser Pro Leu Ala

325 330 335

Thr Trp Leu Arg Gln Asn Asn Arg Gln Ala Ile Leu Thr Glu Thr Gly

340 345 350

Gly Gly Asn Val Gln Ser Cys Ile Gln Asp Met Cys Gln Gln Ile Gln

355 360 365

Tyr Leu Asn Gln Asn Ser Asp Val Tyr Leu Gly Tyr Val Gly Trp Gly

370 375 380

Ala Gly Ser Phe Asp Ser Thr Tyr Val Leu Thr Glu Thr Pro Thr Ser

385 390 395 400

Ser Gly Asn Ser Trp Thr Asp Thr Ser Leu Val Ser Ser Cys Leu Ala

405 410 415

Arg Lys

<210>59

<211>702

<212>DNA

<213>里氏木霉(Trichoderma reesei)

<400>59

atgaagttcc ttcaagtcct ccctgccctc ataccggccg ccctggccca aaccagctgt 60

gaccagtggg caaccttcac tggcaacggc tacacagtca gcaacaacct ttggggagca 120

tcagccggct ctggatttgg ctgcgtgacg gcggtatcgc tcagcggcgg ggcctcctgg 180

cacgcagact ggcagtggtc cggcggccag aacaacgtca agtcgtacca gaactctcag 240

attgccattc cccagaagag gaccgtcaac agcatcagca gcatgcccac cactgccagc 300

tggagctaca gcgggagcaa catccgcgct aatgttgcgt atgacttgtt caccgcagcc 360

aacccgaatc atgtcacgta ctcgggagac tacgaactca tgatctggct tggcaaatac 420

ggcgatattg ggccgattgg gtcctcacag ggaacagtca acgtcggtgg ccagagctgg 480

acgctctact atggctacaa cggagccatg caagtctatt cctttgtggc ccagaccaac 540

actaccaact acagcggaga tgtcaagaac ttcttcaatt atctccgaga caataaagga 600

tacaacgctg caggccaata tgttcttagc taccaatttg gtaccgagcc cttcacgggc 660

agtggaactc tgaacgtcgc atcctggacc gcatctatca ac 702

<210>60

<211>234

<212>PRT

<213>里氏木霉(Trichoderma reesei)

<400>60

Met Lys Phe Leu Gln Val Leu Pro Ala Leu Ile Pro Ala Ala Leu Ala

1 5 10 15

Gln Thr Ser Cys Asp Gln Trp Ala Thr Phe Thr Gly Asn Gly Tyr Thr

20 25 30

Val Ser Asn Asn Leu Trp Gly Ala Ser Ala Gly Ser Gly Phe Gly Cys

35 40 45

Val Thr Ala Val Ser Leu Ser Gly Gly Ala Ser Trp His Ala Asp Trp

50 55 60

Gln Trp Ser Gly Gly Gln Asn Asn Val Lys Ser Tyr Gln Asn Ser Gln

65 70 75 80

Ile Ala Ile Pro Gln Lys Arg Thr Val Asn Ser Ile Ser Ser Met Pro

85 90 95

Thr Thr Ala Ser Trp Ser Tyr Ser Gly Ser Asn Ile Arg Ala Asn Val

100 105 110

Ala Tyr Asp Leu Phe Thr Ala Ala Asn Pro Asn His Val Thr Tyr Ser

115 120 125

Gly Asp Tyr Glu Leu Met Ile Trp Leu Gly Lys Tyr Gly Asp Ile Gly

130 135 140

Pro Ile Gly Ser Ser Gln Gly Thr Val Asn Val Gly Gly Gln Ser Trp

145 150 155 160

Thr Leu Tyr Tyr Gly Tyr Asn Gly Ala Met Gln Val Tyr Ser Phe Val

165 170 175

Ala Gln Thr Asn Thr Thr Asn Tyr Ser Gly Asp Val Lys Asn Phe Phe

180 185 190

Asn Tyr Leu Arg Asp Asn Lys Gly Tyr Asn Ala Ala Gly Gln Tyr Val

195 200 205

Leu Ser Tyr Gln Phe Gly Thr Glu Pro Phe Thr Gly Ser Gly Thr Leu

210 215 220

Asn Val Ala Ser Trp Thr Ala Ser Ile Asn

225 230

<210>61

<211>726

<212>DNA

<213>里氏木霉(Trichoderma reesei)

<400>61

atgaaggcaa ctctggttct cggctccctc attgtaggcg ccgtttccgc gtacaaggcc 60

accaccacgc gctactacga tgggcaggag ggtgcttgcg gatgcggctc gagctccggc 120

gcattcccgt ggcagctcgg catcggcaac ggagtctaca cggctgccgg ctcccaggct 180

ctcttcgaca cggccggagc ttcatggtgc ggcgccggct gcggtaaatg ctaccagctc 240

acctcgacgg gccaggcgcc ctgctccagc tgcggcacgg gcggtgctgc tggccagagc 300

atcatcgtca tggtgaccaa cctgtgcccg aacaatggga acgcgcagtg gtgcccggtg 360

gtcggcggca ccaaccaata cggctacagc taccatttcg acatcatggc gcagaacgag 420

atctttggag acaatgtcgt cgtcgacttt gagcccattg cttgccccgg gcaggctgcc 480

tctgactggg ggacgtgcct ctgcgtggga cagcaagaga cggatcccac gcccgtcctc 540

ggcaacgaca cgggctcaac tcctcccggg agctcgccgc cagcgacatc gtcgagtccg 600

ccgtctggcg gcggccagca gacgctctat ggccagtgtg gaggtgccgg ctggacggga 660

cctacgacgt gccaggcccc agggacctgc aaggttcaga accagtggta ctcccagtgt 720

cttcct 726

<210>62

<211>242

<212>PRT

<213>里氏木霉(Trichoderma reesei)

<400>62

Met Lys Ala Thr Leu Val Leu Gly Ser Leu Ile Val Gly Ala Val Ser

1 5 10 15

Ala Tyr Lys Ala Thr Thr Thr Arg Tyr Tyr Asp Gly Gln Glu Gly Ala

20 25 30

Cys Gly Cys Gly Ser Ser Ser Gly Ala Phe Pro Trp Gln Leu Gly Ile

35 40 45

Gly Asn Gly Val Tyr Thr Ala Ala Gly Ser Gln Ala Leu Phe Asp Thr

50 55 60

Ala Gly Ala Ser Trp Cys Gly Ala Gly Cys Gly Lys Cys Tyr Gln Leu

65 70 75 80

Thr Ser Thr Gly Gln Ala Pro Cys Ser Ser Cys Gly Thr Gly Gly Ala

85 90 95

Ala Gly Gln Ser Ile Ile Val Met Val Thr Asn Leu Cys Pro Asn Asn

100 105 110

Gly Asn Ala Gln Trp Cys Pro Val Val Gly Gly Thr Asn Gln Tyr Gly

115 120 125

Tyr Ser Tyr His Phe Asp Ile Met Ala Gln Asn Glu Ile Phe Gly Asp

130 135 140

Asn Val Val Val Asp Phe Glu Pro Ile Ala Cys Pro Gly Gln Ala Ala

145 150 155 160

Ser Asp Trp Gly Thr Cys Leu Cys Val Gly Gln Gln Glu Thr Asp Pro

165 170 175

Thr Pro Val Leu Gly Asn Asp Thr Gly Ser Thr Pro Pro Gly Ser Ser

180 185 190

Pro Pro Ala Thr Ser Ser Ser Pro Pro Ser Gly Gly Gly Gln Gln Thr

195 200 205

Leu Tyr Gly Gln Cys Gly Gly Ala Gly Trp Thr Gly Pro Thr Thr Cys

210 215 220

Gln Ala Pro Gly Thr Cys Lys Val Gln Asn Gln Trp Tyr Ser Gln Cys

225 230 235 240

Leu Pro

<210>63

<211>1446

<212>DNA

<213>土生梭孢霉(Thielavia terrestris)

<400>63

atggctcaga agctccttct cgccgccgcc cttgcggcca gcgccctcgc tgctcccgtc 60

gtcgaggagc gccagaactg cggttccgtc tggagccaat gcggcggcat tggctggtcc 120

ggcgcgacct gctgcgcttc gggcaatacc tgcgttgagc tgaacccgta ctactcgcag 180

tgcctgccca acagccaggt gactacctcg accagcaaga ccacctccac caccaccagg 240

agcagcacca ccagccacag cagcggtccc accagcacga gcaccaccac caccagcagt 300

cccgtggtca ctaccccgcc gagtacctcc atccccggcg gtgcctcgtc aacggccagc 360

tggtccggca acccgttctc gggcgtgcag atgtgggcca acgactacta cgcctccgag 420

gtctcgtcgc tggccatccc cagcatgacg ggcgccatgg ccaccaaggc ggccgaggtg 480

gccaaggtgc ccagcttcca gtggcttgac cgcaacgtca ccatcgacac gctgttcgcc 540

cacacgctgt cgcagatccg cgcggccaac cagaaaggcg ccaacccgcc ctacgcgggc 600

atcttcgtgg tctacgacct tccggaccgc gactgcgccg ccgccgcgtc caacggcgag 660

ttctccatcg cgaacaacgg ggcggccaac tacaagacgt acatcgacgc gatccggagc 720

ctcgtcatcc agtactcaga catccgcatc atcttcgtca tcgagcccga ctcgctggcc 780

aacatggtga ccaacctgaa cgtggccaag tgcgccaacg ccgagtcgac ctacaaggag 840

ttgaccgtct acgcgctgca gcagctgaac ctgcccaacg tggccatgta cctggacgcc 900

ggccacgccg gctggctcgg ctggcccgcc aacatccagc cggccgccaa cctcttcgcc 960

gagatctaca cgagcgccgg caagccggcc gccgtgcgcg gcctcgccac caacgtggcc 1020

aactacaacg gctggagcct ggccacgccg ccctcgtaca cccagggcga ccccaactac 1080

gacgagagcc actacgtcca ggccctcgcc ccgctgctca ccgccaacgg cttccccgcc 1140

cacttcatca ccgacaccgg ccgcaacggc aagcagccga ccggacaacg gcaatgggga 1200

gactggtgca acgttatcgg aactggcttc ggcgtgcgcc cgacgacaaa caccggcctc 1260

gacatcgagg acgccttcgt ctgggtcaag cccggcggcg agtgcgacgg cacgagcaac 1320

acgacctctc cccgctacga ctaccactgc ggcctgtcgg acgcgctgca gcctgctccg 1380

gaggccggca cttggttcca ggcctacttc gagcagctcc tgaccaacgc caacccgccc 1440

ttttaa 1446

<210>64

<211>481

<212>PRT

<213>土生梭孢霉(Thielavia terrestris)

<400>64

Met Ala Gln Lys Leu Leu Leu Ala Ala Ala Leu Ala Ala Ser Ala Leu

1 5 10 15

Ala Ala Pro Val Val Glu Glu Arg Gln Asn Cys Gly Ser Val Trp Ser

20 25 30

Gln Cys Gly Gly Ile Gly Trp Ser Gly Ala Thr Cys Cys Ala Ser Gly

35 40 45

Asn Thr Cys Val Glu Leu Asn Pro Tyr Tyr Ser Gln Cys Leu Pro Asn

50 55 60

Ser Gln Val Thr Thr Ser Thr Ser Lys Thr Thr Ser Thr Thr Thr Arg

65 70 75 80

Ser Ser Thr Thr Ser His Ser Ser Gly Pro Thr Ser Thr Ser Thr Thr

85 90 95

Thr Thr Ser Ser Pro Val Val Thr Thr Pro Pro Ser Thr Ser Ile Pro

100 105 110

Gly Gly Ala Ser Ser Thr Ala Ser Trp Ser Gly Asn Pro Phe Ser Gly

115 120 125

Val Gln Met Trp Ala Asn Asp Tyr Tyr Ala Ser Glu Val Ser Ser Leu

130 135 140

Ala Ile Pro Ser Met Thr Gly Ala Met Ala Thr Lys Ala Ala Glu Val

145 150 155 160

Ala Lys Val Pro Ser Phe Gln Trp Leu Asp Arg Asn Val Thr Ile Asp

165 170 175

Thr Leu Phe Ala His Thr Leu Ser Gln Ile Arg Ala Ala Asn Gln Lys

180 185 190

Gly Ala Asn Pro Pro Tyr Ala Gly Ile Phe Val Val Tyr Asp Leu Pro

195 200 205

Asp Arg Asp Cys Ala Ala Ala Ala Ser Asn Gly Glu Phe Ser Ile Ala

210 215 220

Asn Asn Gly Ala Ala Asn Tyr Lys Thr Tyr Ile Asp Ala Ile Arg Ser

225 230 235 240

Leu Val Ile Gln Tyr Ser Asp Ile Arg Ile Ile Phe Val Ile Glu Pro

245 250 255

Asp Ser Leu Ala Asn Met Val Thr Asn Leu Asn Val Ala Lys Cys Ala

260 265 270

Asn Ala Glu Ser Thr Tyr Lys Glu Leu Thr Val Tyr Ala Leu Gln Gln

275 280 285

Leu Asn Leu Pro Asn Val Ala Met Tyr Leu Asp Ala Gly His Ala Gly

290 295 300

Trp Leu Gly Trp Pro Ala Asn Ile Gln Pro Ala Ala Asn Leu Phe Ala

305 310 315 320

Glu Ile Tyr Thr Ser Ala Gly Lys Pro Ala Ala Val Arg Gly Leu Ala

325 330 335

Thr Asn Val Ala Asn Tyr Asn Gly Trp Ser Leu Ala Thr Pro Pro Ser

340 345 350

Tyr Thr Gln Gly Asp Pro Asn Tyr Asp Glu Ser His Tyr Val Gln Ala

355 360 365

Leu Ala Pro Leu Leu Thr Ala Asn Gly Phe Pro Ala His Phe Ile Thr

370 375 380

Asp Thr Gly Arg Asn Gly Lys Gln Pro Thr Gly Gln Arg Gln Trp Gly

385 390 395 400

Asp Trp Cys Asn Val Ile Gly Thr Gly Phe Gly Val Arg Pro Thr Thr

405 410 415

Asn Thr Gly Leu Asp Ile Glu Asp Ala Phe Val Trp Val Lys Pro Gly

420 425 430

Gly Glu Cys Asp Gly Thr Ser Asn Thr Thr Ser Pro Arg Tyr Asp Tyr

435 440 445

His Cys Gly Leu Ser Asp Ala Leu Gln Pro Ala Pro Glu Ala Gly Thr

450 455 460

Trp Phe Gln Ala Tyr Phe Glu Gln Leu Leu Thr Asn Ala Asn Pro Pro

465 470 475 480

Phe

<210>65

<211>29

<212>DNA

<213>里氏木霉(Trichoderma reesei)

<400>65

aacgttaatt aaggaatcgt tttgtgttt 29

<210>66

<211>29

<212>DNA

<213>里氏木霉(Trichoderma reesei)

<400>66

agtactagta gctccgtggc gaaagcctg 29

<210>67

<211>31

<212>DNA

<213>酿酒酵母(Saccharomyces cerevisiae)

<400>67

ttgaattgaa aatagattga tttaaaactt c 31

<210>68

<211>25

<212>DNA

<213>酿酒酵母(Saccharomyces cerevisiae)

<400>68

ttgcatgcgt aatcatggtc atagc 25

<210>69

<211>26

<212>DNA

<213>酿酒酵母(Saccharomyces cerevisiae)

<400>69

ttgaattcat gggtaataac tgatat 26

<210>70

<211>32

<212>DNA

<213>酿酒酵母(Saccharomyces cerevisiae)

<400>70

aaatcaatct attttcaatt caattcatca tt 32

<210>71

<211>11

<212>DNA

<213>黑曲霉(Aspergillus niger)

<400>71

gtactaaaac c 11

<210>72

<211>11

<212>DNA

<213>黑曲霉(Aspergillus niger)

<400>72

ccgttaaatt t 11

<210>73

<211>45

<212>DNA

<213>黑曲霉(Aspergillus niger)

<400>73

ggatgctgtt gactccggaa atttaacggt ttggtcttgc atccc 45

<210>74

<211>14

<212>DNA

<213>黑曲霉(Aspergillus niger)

<400>74

atgcaattta aact 14

<210>75

<211>14

<212>DNA

<213>黑曲霉(Aspergillus niger)

<400>75

cggcaattta acgg 14

<210>76

<211>44

<212>DNA

<213>黑曲霉(Aspergillus niger)

<400>76

ggtattgtcc tgcagacggc aatttaacgg cttctgcgaa tcgc 44

<210>77

<211>29

<212>DNA

<213>特异腐质霉(Humicola insolens)

<400>77

aagcttaagc atgcgttect cccccctcc 29

<210>78

<211>32

<212>DNA

<213>特异腐质霉(Humicola insolens)

<400>78

ctgcagaatt ctacaggcac tgatggtacc ag 32

<210>79

<211>32

<212>DNA

<213>里氏木霉(Trichoderma reesei)

<400>79

ctgcagaatt ctacaggcac tgatggtacc ag 32

<210>80

<211>36

<212>DNA

<213>里氏木霉(Trichoderma reesei)

<400>80

accgcggact gcgcatcatg cgttcctccc ccctcc 36

<210>81

<211>29

<212>DNA

<213>里氏木霉(Trichoderma reesei)

<400>81

aaacgtcgac cgaatgtagg attgttatc 29

<210>82

<211>17

<212>DNA

<213>里氏木霉(Trichoderma reesei)

<400>82

gatgcgcagt ccgcggt 17

<210>83

<211>29

<212>DNA

<213>里氏木霉(Trichoderma reesei)

<400>83

aaacgtcgac cgaatgtagg attgttatc 29

<210>84

<211>36

<212>DNA

<213>里氏木霉(Trichoderma reesei)

<400>84

ggagggggga ggaacgcatg atgcgcagtc cgcggt 36

<210>85

<211>29

<212>DNA

<213>里氏木霉(Trichoderma reesei)

<400>85

aaacgtcgac cgaatgtagg attgttatc 29

<210>86

<211>32

<212>DNA

<213>里氏木霉(Trichoderma reesei)

<400>86

ctgcagaatt ctacaggcac tgatggtacc ag 32

<210>87

<211>46

<212>DNA

<213>米曲霉(Aspergillus oryzae)

<400>87

atagtcaacc gcggactgcg catcatgaag cttggttgga tcgagg 46

<210>88

<211>26

<212>DNA

<213>米曲霉(Aspergillus oryzae)

<400>88

actagtttac tgggccttag gcagcg 26

<210>89

<211>26

<212>DNA

<213>里氏木霉(Trichoderma reesei)

<400>89

gtcgactcga agcccgaatg taggat 26

<210>90

<211>45

<212>DNA

<213>里氏木霉(Trichoderma reesei)

<400>90

cctcgatcca accaagcttc atgatgcgca gtccgcggtt gacta 45

<210>91

<211>57

<212>DNA

<213>米曲霉(Aspergillus oryzae)

<400>91

atgaagcttg gttggatcga ggtggccgca ttggcggctg cctcagtagt cagtgcc 57

<210>92

<211>19

<212>PRT

<213>米曲霉(Aspergillus oryzae)

<400>92

Met Lys Leu Gly Trp Ile Glu Val Ala Ala Leu Ala Ala Ala Ser Val

1 5 10 15

Val Ser Ala

<210>93

<211>42

<212>DNA

<213>米曲霉(Aspergillus oryzae)

<400>93

tgccggtgtt ggcccttgcc aaggatgatc tcgcgtactc cc 42

<210>94

<211>28

<212>DNA

<213>米曲霉(Aspergillus oryzae)

<400>94

gactagtctt actgggcctt aggcagcg 28

<210>95

<211>63

<212>DNA

<213>特异腐质霉(Humicola insolens)

<400>95

atgcgttcct cccccctcct ccgctccgcc gttgtggccg ccctgccggt gttggccctt 60

gcc 63

<210>96

<211>21

<212>PRT

<213>特异腐质霉(Humicola insolens)

<400>96

Met Arg Ser Ser Pro Leu Leu Arg Ser Ala Val Val Ala Ala Leu Pro

1 5 10 15

Val Leu Ala Leu Ala

20

<210>97

<211>30

<212>DNA

<213>里氏木霉(Trichoderma reesei)

<400>97

acgcgtcgac cgaatgtagg attgttatcc 30

<210>98

<211>42

<212>DNA

<213>里氏木霉(Trichoderma reesei)

<400>98

gggagtacgc gagatcatcc ttggcaaggg ccaacaccgg ca 42

<210>99

<211>20

<212>DNA

<213>里氏木霉(Trichoderma reesei)

<400>99

cccaagctta gccaagaaca 20

<210>100

<211>29

<212>DNA

<213>里氏木霉(Trichoderma reesei)

<400>100

gggggaggaa cgcatgggat ctggacggc 29

<210>101

<211>30

<212>DNA

<213>米曲霉(Aspergillus oryzae)

<400>101

gccgtccaga tccccatgcg ttcctccccc 30

<210>102

<211>20

<212>DNA

<213>米曲霉(Aspergillus oryzae)

<400>102

ccaagcttgt tcagagtttc 20

<210>103

<211>3294

<212>DNA

<213>米曲霉(Aspergillus oryzae)

<400>103

atgcgttcct cccccctcct ccgctccgcc gttgtggccg ccctgccggt gttggccctt 60

gccgctgatg gcaggtccac ccgctactgg gactgctgca agccttcgtg cggctgggcc 120

aagaaggctc ccgtgaacca gcctgtcttt tcctgcaacg ccaacttcca gcgtatcacg 180

gacttcgacg ccaagtccgg ctgcgagccg ggcggtgtcg cctactcgtg cgccgaccag 240

accccatggg ctgtgaacga cgacttcgcg ctcggttttg ctgccacctc tattgccggc 300

agcaatgagg cgggctggtg ctgcgcctgc tacgagctca ccttcacatc cggtcctgtt 360

gctggcaaga agatggtcgt ccagtccacc agcactggcg gtgatcttgg cagcaaccac 420

ttcgatctca acatccccgg cggcggcgtc ggcatcttcg acggatgcac tccccagttc 480

ggtggtctgc ccggccagcg ctacggcggc atctcgtccc gcaacgagtg cgatcggttc 540

cccgacgccc tcaagcccgg ctgctactgg cgcttcgact ggttcaagaa cgccgacaat 600

ccgagcttca gcttccgtca ggtccagtgc ccagccgagc tcgtcgctcg caccggatgc 660

cgccgcaacg acgacggcaa cttccctgcc gtccagatcc ccatgcgttc ctcccccctc 720

ctccgctccg ccgttgtggc cgccctgccg gtgttggccc ttgccaagga tgatctcgcg 780

tactcccctc ctttctaccc ttccccatgg gcagatggtc agggtgaatg ggcggaagta 840

tacaaacgcg ctgtagacat agtttcccag atgacgttga cagagaaagt caacttaacg 900

actggaacag gatggcaact agagaggtgt gttggacaaa ctggcagtgt tcccagactc 960

aacatcccca gcttgtgttt gcaggatagt cctcttggta ttcgtttctc ggactacaat 1020

tcagctttcc ctgcgggtgt taatgtcgct gccacctggg acaagacgct cgcctacctt 1080

cgtggtcagg caatgggtga ggagttcagt gataagggta ttgacgttca gctgggtcct 1140

gctgctggcc ctctcggtgc tcatccggat ggcggtagaa actgggaaag tttctcacca 1200

gatccagccc tcaccggtgt actttttgcg gagacgatta agggtattca agatgctggt 1260

gtcattgcga cagctaagca ttatatcatg aacgaacaag agcatttccg ccaacaaccc 1320

gaggctgcgg gttacggatt caacgtaagc gacagtttga gttccaacgt tgatgacaag 1380

actatgcatg aattgtacct ctggcccttc gcggatgcag tacgcgctgg agtcggtgct 1440

gttatgtgct cttacaacca aatcaacaac agctacggtt gcgagaatag cgaaactctg 1500

aacaagcttt tgaaggcgga gcttggtttc caaggcttcg tcatgagtga ttggaccgct 1560

caacacagcg gcgtaggcgc tgctttagca ggtctggata tgtcgatgcc cggtgatgtt 1620

accttcgata gtggtacgtc tttctggggt gcaaacttga cggtcggtgt ccttaacggt 1680

acaatccccc aatggcgtgt tgatgacatg gctgtccgta tcatggccgc ttattacaag 1740

gttggccgcg acaccaaata cacccctccc aacttcagct cgtggaccag ggacgaatat 1800

ggtttcgcgc ataaccatgt ttcggaaggt gcttacgaga gggtcaacga attcgtggac 1860

gtgcaacgcg atcatgccga cctaatccgt cgcatcggcg cgcagagcac tgttctgctg 1920

aagaacaagg gtgccttgcc cttgagccgc aaggaaaagc tggtcgccct tctgggagag 1980

gatgcgggtt ccaactcgtg gggcgctaac ggctgtgatg accgtggttg cgataacggt 2040

acccttgcca tggcctgggg tagcggtact gcgaatttcc catacctcgt gacaccagag 2100

caggcgattc agaacgaagt tcttcagggc cgtggtaatg tcttcgccgt gaccgacagt 2160

tgggcgctcg acaagatcgc tgcggctgcc cgccaggcca gcgtatctct cgtgttcgtc 2220

aactccgact caggagaagg ctatcttagt gtggatggaa atgagggcga tcgtaacaac 2280

atcactctgt ggaagaacgg cgacaatgtg gtcaagaccg cagcgaataa ctgtaacaac 2340

accgttgtca tcatccactc cgtcggacca gttttgatcg atgaatggta tgaccacccc 2400

aatgtcactg gtattctctg ggctggtctg ccaggccagg agtctggtaa ctccattgcc 2460

gatgtgctgt acggtcgtgt caaccctggc gccaagtctc ctttcacttg gggcaagacc 2520

cgggagtcgt atggttctcc cttggtcaag gatgccaaca atggcaacgg agcgccccag 2580

tctgatttca cccagggtgt tttcatcgat taccgccatt tcgataagtt caatgagacc 2640

cctatctacg agtttggcta cggcttgagc tacaccacct tcgagctctc cgacctccat 2700

gttcagcccc tgaacgcgtc ccgatacact cccaccagtg gcatgactga agctgcaaag 2760

aactttggtg aaattggcga tgcgtcggag tacgtgtatc cggaggggct ggaaaggatc 2820

catgagttta tctatccctg gatcaactct accgacctga aggcatcgtc tgacgattct 2880

aactacggct gggaagactc caagtatatt cccgaaggcg ccacggatgg gtctgcccag 2940

ccccgtttgc ccgctagtgg tggtgccgga ggaaaccccg gtctgtacga ggatcttttc 3000

cgcgtctctg tgaaggtcaa gaacacgggc aatgtcgccg gtgatgaagt tcctcagctg 3060

tacgtttccc taggcggccc gaatgagccc aaggtggtac tgcgcaagtt tgagcgtatt 3120

cacttggccc cttcgcagga ggccgtgtgg acaacgaccc ttacccgtcg tgaccttgca 3180

aactgggacg tttcggctca ggactggacc gtcactcctt accccaagac gatctacgtt 3240

ggaaactcct cacggaaact gccgctccag gcctcgctgc ctaaggccca gtaa 3294

<210>104

<211>1097

<212>PRT

<213>米曲霉(Aspergillus oryzae)

<400>104

Met Arg Ser Ser Pro Leu Leu Arg Ser Ala Val Val Ala Ala Leu Pro

1 5 10 15

Val Leu Ala Leu Ala Ala Asp Gly Arg Ser Thr Arg Tyr Trp Asp Cys

20 25 30

Cys Lys Pro Ser Cys Gly Trp Ala Lys Lys Ala Pro Val Asn Gln Pro

35 40 45

Val Phe Ser Cys Asn Ala Asn Phe Gln Arg Ile Thr Asp Phe Asp Ala

50 55 60

Lys Ser Gly Cys Glu Pro Gly Gly Val Ala Tyr Ser Cys Ala Asp Gln

65 70 75 80

Thr Pro Trp Ala Val Asn Asp Asp Phe Ala Leu Gly Phe Ala Ala Thr

85 90 95

Ser Ile Ala Gly Ser Asn Glu Ala Gly Trp Cys Cys Ala Cys Tyr Glu

100 105 110

Leu Thr Phe Thr Ser Gly Pro Val Ala Gly Lys Lys Met Val Val Gln

115 120 125

Ser Thr Ser Thr Gly Gly Asp Leu Gly Ser Asn His Phe Asp Leu Asn

130 135 140

Ile Pro Gly Gly Gly Val Gly Ile Phe Asp Gly Cys Thr Pro Gln Phe

145 150 155 160

Gly Gly Leu Pro Gly Gln Arg Tyr Gly Gly Ile Ser Ser Arg Asn Glu

165 170 175

Cys Asp Arg Phe Pro Asp Ala Leu Lys Pro Gly Cys Tyr Trp Arg Phe

180 185 190

Asp Trp Phe Lys Asn Ala Asp Asn Pro Ser Phe Ser Phe Arg Gln Val

195 200 205

Gln Cys Pro Ala Glu Leu Val Ala Arg Thr Gly Cys Arg Arg Asn Asp

210 215 220

Asp Gly Asn Phe Pro Ala Val Gln Ile Pro Met Arg Ser Ser Pro Leu

225 230 235 240

Leu Arg Ser Ala Val Val Ala Ala Leu Pro Val Leu Ala Leu Ala Lys

245 250 255

Asp Asp Leu Ala Tyr Ser Pro Pro Phe Tyr Pro Ser Pro Trp Ala Asp

260 265 270

Gly Gln Gly Glu Trp Ala Glu Val Tyr Lys Arg Ala Val Asp Ile Val

275 280 285

Ser Gln Met Thr Leu Thr Glu Lys Val Asn Leu Thr Thr Gly Thr Gly

290 295 300

Trp Gln Leu Glu Arg Cys Val Gly Gln Thr Gly Ser Val Pro Arg Leu

305 310 315 320

Asn Ile Pro Ser Leu Cys Leu Gln Asp Ser Pro Leu Gly Ile Arg Phe

325 330 335

Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Val Asn Val Ala Ala Thr

340 345 350

Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Gln Ala Met Gly Glu Glu

355 360 365

Phe Ser Asp Lys Gly Ile Asp Val Gln Leu Gly Pro Ala Ala Gly Pro

370 375 380

Leu Gly Ala His Pro Asp Gly Gly Arg Asn Trp Glu Ser Phe Ser Pro

385 390 395 400

Asp Pro Ala Leu Thr Gly Val Leu Phe Ala Glu Thr Ile Lys Gly Ile

405 410 415

Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr Ile Met Asn Glu

420 425 430

Gln Glu His Phe Arg Gln Gln Pro Glu Ala Ala Gly Tyr Gly Phe Asn

435 440 445

Val Ser Asp Ser Leu Ser Ser Asn Val Asp Asp Lys Thr Met His Glu

450 455 460

Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala Gly Val Gly Ala

465 470 475 480

Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr Gly Cys Glu Asn

485 490 495

Ser Glu Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu Gly Phe Gln Gly

500 505 510

Phe Val Met Ser Asp Trp Thr Ala Gln His Ser Gly Val Gly Ala Ala

515 520 525

Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Val Thr Phe Asp Ser

530 535 540

Gly Thr Ser Phe Trp Gly Ala Asn Leu Thr Val Gly Val Leu Asn Gly

545 550 555 560

Thr Ile Pro Gln Trp Arg Val Asp Asp Met Ala Val Arg Ile Met Ala

565 570 575

Ala Tyr Tyr Lys Val Gly Arg Asp Thr Lys Tyr Thr Pro Pro Asn Phe

580 585 590

Ser Ser Trp Thr Arg Asp Glu Tyr Gly Phe Ala His Asn His Val Ser

595 600 605

Glu Gly Ala Tyr Glu Arg Val Asn Glu Phe Val Asp Val Gln Arg Asp

610 615 620

His Ala Asp Leu Ile Arg Arg Ile Gly Ala Gln Ser Thr Val Leu Leu

625 630 635 640

Lys Asn Lys Gly Ala Leu Pro Leu Ser Arg Lys Glu Lys Leu Val Ala

645 650 655

Leu Leu Gly Glu Asp Ala Gly Ser Asn Ser Trp Gly Ala Asn Gly Cys

660 665 670

Asp Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met Ala Trp Gly Ser

675 680 685

Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu Gln Ala Ile Gln

690 695 700

Asn Glu Val Leu Gln Gly Arg Gly Asn Val Phe Ala Val Thr Asp Ser

705 710 715 720

Trp Ala Leu Asp Lys Ile Ala Ala Ala Ala Arg Gln Ala Ser Val Ser

725 730 735

Leu Val Phe Val Asn Ser Asp Ser Gly Glu Gly Tyr Leu Ser Val Asp

740 745 750

Gly Asn Glu Gly Asp Arg Asn Asn Ile Thr Leu Trp Lys Asn Gly Asp

755 760 765

Asn Val Val Lys Thr Ala Ala Asn Asn Cys Asn Asn Thr Val Val Ile

770 775 780

Ile His Ser Val Gly Pro Val Leu Ile Asp Glu Trp Tyr Asp His Pro

785 790 795 800

Asn Val Thr Gly Ile Leu Trp Ala Gly Leu Pro Gly Gln Glu Ser Gly

805 810 815

Asn Ser Ile Ala Asp Val Leu Tyr Gly Arg Val Asn Pro Gly Ala Lys

820 825 830

Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr Gly Ser Pro Leu

835 840 845

Val Lys Asp Ala Asn Asn Gly Asn Gly Ala Pro Gln Ser Asp Phe Thr

850 855 860

Gln Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys Phe Asn Glu Thr

865 870 875 880

Pro Ile Tyr Glu Phe Gly Tyr Gly Leu Ser Tyr Thr Thr Phe Glu Leu

885 890 895

Ser Asp Leu His Val Gln Pro Leu Asn Ala Ser Arg Tyr Thr Pro Thr

900 905 910

Ser Gly Met Thr Glu Ala Ala Lys Asn Phe Gly Glu Ile Gly Asp Ala

915 920 925

Ser Glu Tyr Val Tyr Pro Glu Gly Leu Glu Arg Ile His Glu Phe Ile

930 935 940

Tyr Pro Trp Ile Asn Ser Thr Asp Leu Lys Ala Ser Ser Asp Asp Ser

945 950 955 960

Asn Tyr Gly Trp Glu Asp Ser Lys Tyr Ile Pro Glu Gly Ala Thr Asp

965 970 975

Gly Ser Ala Gln Pro Arg Leu Pro Ala Ser Gly Gly Ala Gly Gly Asn

980 985 990

Pro Gly Leu Tyr Glu Asp Leu Phe Arg Val Ser Val Lys Val Lys Asn

995 1000 1005

Thr Gly Asn Val Ala Gly Asp Glu Val Pro Gln Leu Tyr Val Ser

1010 1015 1020

Leu Gly Gly Pro Asn Glu Pro Lys Val Val Leu Arg Lys Phe Glu

1025 1030 1035

Arg Ile His Leu Ala Pro Ser Gln Glu Ala Val Trp Thr Thr Thr

1040 1045 1050

Leu Thr Arg Arg Asp Leu Ala Asn Trp Asp Val Ser Ala Gln Asp

1055 1060 1065

Trp Thr Val Thr Pro Tyr Pro Lys Thr Ile Tyr Val Gly Asn Ser

1070 1075 1080

Ser Arg Lys Leu Pro Leu Gln Ala Ser Leu Pro Lys Ala Gln

1085 1090 1095

<210>105

<211>3294

<212>DNA

<213>米曲霉(Aspergillus oryzae)

<400>105

atgcgttcct cccccctcct ccgctccgcc gttgtggccg ccctgccggt gttggccctt 60

gccgctgatg gcaggtccac ccgctactgg gactgctgca agccttcgtg cggctgggcc 120

aagaaggctc ccgtgaacca gcctgtcttt tcctgcaacg ccaacttcca gcgtatcacg 180

gacttcgacg ccaagtccgg ctgcgagccg ggcggtgtcg cctactcgtg cgccgaccag 240

accccatggg ctgtgaacga cgacttcgcg ctcggttttg ctgccacctc tattgccggc 300

agcaatgagg cgggctggtg ctgcgcctgc tacgagctca ccttcacatc cggtcctgtt 360

gctggcaaga agatggtcgt ccagtccacc agcactggcg gtgatcttgg cagcaaccac 420

ttcgatctca acatccccgg cggcggcgtc ggcatcttcg acggatgcac tccccagttc 480

ggtggtctgc ccggccagcg ctacggcggc atctcgtccc gcaacgagtg cgatcggttc 540

cccgacgccc tcaagcccgg ctgctactgg cgcttcgact ggttcaagaa cgccgacaat 600

ccgagcttca gcttccgtca ggtccagtgc ccagccgagc tcgtcgctcg caccggatgc 660

cgccgcaacg acgacggcaa cttccctgcc gtccagatcc ccatgcgttc ctcccccctc 720

ctccgctccg ccgttgtggc cgccctgccg gtgttggccc ttgccaagga tgatctcgcg 780

tactcccctc ctttctaccc ttccccatgg gcagatggtc agggtgaatg ggcggaagta 840

tacaaacgcg ctgtagacat agtttcccag atgacgttga cagagaaagt caacttaacg 900

actggaacag gatggcaact agagaggtgt gttggacaaa ctggcagtgt tcccagactc 960

aacatcccca gcttgtgttt gcaggatagt cctcttggta ttcgtttctc ggactacaat 1020

tcagctttcc ctgcgggtgt taatgtcgct gccacctggg acaagacgct cgcctacctt 1080

cgtggtcagg caatgggtga ggagttcagt gataagggta ttgacgttca gctgggtcct 1140

gctgctggcc ctctcggtgc tcatccggat ggcggtagaa actgggaagg tttctcacca 1200

gatccagccc tcaccggtgt actttttgcg gagacgatta agggtattca agatgctggt 1260

gtcattgcga cagctaagca ttatatcatg aacgaacaag agcatttccg ccaacaaccc 1320

gaggctgcgg gttacggatt caacgtaagc gacagtttga gttccaacgt tgatgacaag 1380

actatgcatg aattgtacct ctggcccttc gcggatgcag tacgcgctgg agtcggtgct 1440

gtcatgtgct cttacaacca aatcaacaac agctacggtt gcgagaatag cgaaactctg 1500

aacaagcttt tgaaggcgga gcttggtttc caaggcttcg tcatgagtga ttggaccgct 1560

catcacagcg gcgtaggcgc tgctttagca ggtctggata tgtcgatgcc cggtgatgtt 1620

accttcgata gtggtacgtc tttctggggt gcaaacttga cggtcggtgt ccttaacggt 1680

acaatccccc aatggcgtgt tgatgacatg gctgtccgta tcatggccgc ttattacaag 1740

gttggccgcg acaccaaata cacccctccc aacttcagct cgtggaccag ggacgaatat 1800

ggtttcgcgc ataaccatgt ttcggaaggt gcttacgaga gggtcaacga attcgtggac 1860

gtgcaacgcg atcatgccga cctaatccgt cgcatcggcg cgcagagcac tgttctgctg 1920

aagaacaagg gtgccttgcc cttgagccgc aaggaaaagc tggtcgccct tctgggagag 1980

gatgcgggtt ccaactcgtg gggcgctaac ggctgtgatg accgtggttg cgataacggt 2040

acccttgcca tggcctgggg tagcggtact gcgaatttcc catacctcgt gacaccagag 2100

caggcgattc agaacgaagt tcttcagggc cgtggtaatg tcttcgccgt gaccgacagt 2160

tgggcgctcg acaagatcgc tgcggctgcc cgccaggcca gcgtatctct cgtgttcgtc 2220

aactccgact caggagaagg ctatcttagt gtggatggaa atgagggcga tcgtaacaac 2280

atcactctgt ggaagaacgg cgacaatgtg gtcaagaccg cagcgaataa ctgtaacaac 2340

accgttgtca tcatccactc cgtcggacca gttttgatcg atgaatggta tgaccacccc 2400

aatgtcactg gtattctctg ggctggtctg ccaggccagg agtctggtaa ctccattgcc 2460

gatgtgctgt acggtcgtgt caaccctggc gccaagtctc ctttcacttg gggcaagacc 2520

cgggagtcgt atggttctcc cttggtcaag gatgccaaca atggcaacgg agcgccccag 2580

tctgatttca cccagggtgt tttcatcgat taccgccatt tcgataagtt caatgagacc 2640

cctatctacg agtttggcta cggcttgagc tacaccacct tcgagctctc cgacctccat 2700

gttcagcccc tgaacgcgtc ccgatacact cccaccagtg gcatgactga agctgcaaag 2760

aactttggtg aaattggcga tgcgtcggag tacgtgtatc cggaggggct ggaaaggatc 2820

catgagttta tctatccctg gatcaactct accgacctga aggcatcgtc tgacgattct 2880

aactacggct gggaagactc caagtatatt cccgaaggcg ccacggatgg gtctgcccag 2940

ccccgtttgc ccgctagtgg tggtgccgga ggaaaccccg gtctgtacga ggatcttttc 3000

cgcgtctctg tgaaggtcaa gaacacgggc aatgtcgccg gtgatgaagt tcctcagctg 3060

tacgtttccc taggcggccc gaatgagccc aaggtggtac tgcgcaagtt tgagcgtatt 3120

cacttggccc cttcgcagga ggccgtgtgg acaacgaccc ttacccgtcg tgaccttgca 3180

aactgggacg tttcggctca ggactggacc gtcactcctt accccaagac gatctacgtt 3240

ggaaactcct cacggaaact gccgctccag gcctcgctgc ctaaggccca gtaa 3294

<210>106

<211>1097

<212>PRT

<213>米曲霉(Aspergillus oryzae)

<400>106

Met Arg Ser Ser Pro Leu Leu Arg Ser Ala Val Val Ala Ala Leu Pro

1 5 10 15

Val Leu Ala Leu Ala Ala Asp Gly Arg Ser Thr Arg Tyr Trp Asp Cys

20 25 30

Cys Lys Pro Ser Cys Gly Trp Ala Lys Lys Ala Pro Val Asn Gln Pro

35 40 45

Val Phe Ser Cys Asn Ala Asn Phe Gln Arg Ile Thr Asp Phe Asp Ala

50 55 60

Lys Ser Gly Cys Glu Pro Gly Gly Val Ala Tyr Ser Cys Ala Asp Gln

65 70 75 80

Thr Pro Trp Ala Val Asn Asp Asp Phe Ala Leu Gly Phe Ala Ala Thr

85 90 95

Ser Ile Ala Gly Ser Asn Glu Ala Gly Trp Cys Cys Ala Cys Tyr Glu

100 105 110

Leu Thr Phe Thr Ser Gly Pro Val Ala Gly Lys Lys Met Val Val Gln

115 120 125

Ser Thr Ser Thr Gly Gly Asp Leu Gly Ser Asn His Phe Asp Leu Asn

130 135 140

Ile Pro Gly Gly Gly Val Gly Ile Phe Asp Gly Cys Thr Pro Gln Phe

145 150 155 160

Gly Gly Leu Pro Gly Gln Arg Tyr Gly Gly Ile Ser Ser Arg Asn Glu

165 170 175

Cys Asp Arg Phe Pro Asp Ala Leu Lys Pro Gly Cys Tyr Trp Arg Phe

180 185 190

Asp Trp Phe Lys Asn Ala Asp Asn Pro Ser Phe Ser Phe Arg Gln Val

195 200 205

Gln Cys Pro Ala Glu Leu Val Ala Arg Thr Gly Cys Arg Arg Asn Asp

210 215 220

Asp Gly Asn Phe Pro Ala Val Gln Ile Pro Met Arg Ser Ser Pro Leu

225 230 235 240

Leu Arg Ser Ala Val Val Ala Ala Leu Pro Val Leu Ala Leu Ala Lys

245 250 255

Asp Asp Leu Ala Tyr Ser Pro Pro Phe Tyr Pro Ser Pro Trp Ala Asp

260 265 270

Gly Gln Gly Glu Trp Ala Glu Val Tyr Lys Arg Ala Val Asp Ile Val

275 280 285

Ser Gln Met Thr Leu Thr Glu Lys Val Asn Leu Thr Thr Gly Thr Gly

290 295 300

Trp Gln Leu Glu Arg Cys Val Gly Gln Thr Gly Ser Val Pro Arg Leu

305 310 315 320

Asn Ile Pro Ser Leu Cys Leu Gln Asp Ser Pro Leu Gly Ile Arg Phe

325 330 335

Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Val Asn Val Ala Ala Thr

340 345 350

Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Gln Ala Met Gly Glu Glu

355 360 365

Phe Ser Asp Lys Gly Ile Asp Val Gln Leu Gly Pro Ala Ala Gly Pro

370 375 380

Leu Gly Ala His Pro Asp Gly Gly Arg Asn Trp Glu Gly Phe Ser Pro

385 390 395 400

Asp Pro Ala Leu Thr Gly Val Leu Phe Ala Glu Thr Ile Lys Gly Ile

405 410 415

Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr Ile Met Asn Glu

420 425 430

Gln Glu His Phe Arg Gln Gln Pro Glu Ala Ala Gly Tyr Gly Phe Asn

435 440 445

Val Ser Asp Ser Leu Ser Ser Asn Val Asp Asp Lys Thr Met His Glu

450 455 460

Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala Gly Val Gly Ala

465 470 475 480

Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr Gly Cys Glu Asn

485 490 495

Ser Glu Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu Gly Phe Gln Gly

500 505 510

Phe Val Met Ser Asp Trp Thr Ala His His Ser Gly Val Gly Ala Ala

515 520 525

Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Val Thr Phe Asp Ser

530 535 540

Gly Thr Ser Phe Trp Gly Ala Asn Leu Thr Val Gly Val Leu Asn Gly

545 550 555 560

Thr Ile Pro Gln Trp Arg Val Asp Asp Met Ala Val Arg Ile Met Ala

565 570 575

Ala Tyr Tyr Lys Val Gly Arg Asp Thr Lys Tyr Thr Pro Pro Asn Phe

580 585 590

Ser Ser Trp Thr Arg Asp Glu Tyr Gly Phe Ala His Asn His Val Ser

595 600 605

Glu Gly Ala Tyr Glu Arg Val Asn Glu Phe Val Asp Val Gln Arg Asp

610 615 620

His Ala Asp Leu Ile Arg Arg Ile Gly Ala Gln Ser Thr Val Leu Leu

625 630 635 640

Lys Asn Lys Gly Ala Leu Pro Leu Ser Arg Lys Glu Lys Leu Val Ala

645 650 655

Leu Leu Gly Glu Asp Ala Gly Ser Asn Ser Trp Gly Ala Asn Gly Cys

660 665 670

Asp Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met Ala Trp Gly Ser

675 680 685

Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu Gln Ala Ile Gln

690 695 700

Asn Glu Val Leu Gln Gly Arg Gly Asn Val Phe Ala Val Thr Asp Ser

705 710 715 720

Trp Ala Leu Asp Lys Ile Ala Ala Ala Ala Arg Gln Ala Ser Val Ser

725 730 735

Leu Val Phe Val Asn Ser Asp Ser Gly Glu Gly Tyr Leu Ser Val Asp

740 745 750

Gly Asn Glu Gly Asp Arg Asn Asn Ile Thr Leu Trp Lys Asn Gly Asp

755 760 765

Asn Val Val Lys Thr Ala Ala Asn Asn Cys Asn Asn Thr Val Val Ile

770 775 780

Ile His Ser Val Gly Pro Val Leu Ile Asp Glu Trp Tyr Asp His Pro

785 790 795 800

Asn Val Thr Gly Ile Leu Trp Ala Gly Leu Pro Gly Gln Glu Ser Gly

805 810 815

Asn Ser Ile Ala Asp Val Leu Tyr Gly Arg Val Asn Pro Gly Ala Lys

820 825 830

Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr Gly Ser Pro Leu

835 840 845

Val Lys Asp Ala Asn Asn Gly Asn Gly Ala Pro Gln Ser Asp Phe Thr

850 855 860

Gln Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys Phe Asn Glu Thr

865 870 875 880

Pro Ile Tyr Glu Phe Gly Tyr Gly Leu Ser Tyr Thr Thr Phe Glu Leu

885 890 895

Ser Asp Leu His Val Gln Pro Leu Asn Ala Ser Arg Tyr Thr Pro Thr

900 905 910

Ser Gly Met Thr Glu Ala Ala Lys Asn Phe Gly Glu Ile Gly Asp Ala

915 920 925

Ser Glu Tyr Val Tyr Pro Glu Gly Leu Glu Arg Ile His Glu Phe Ile

930 935 940

Tyr Pro Trp Ile Asn Ser Thr Asp Leu Lys Ala Ser Ser Asp Asp Ser

945 950 955 960

Asn Tyr Gly Trp Glu Asp Ser Lys Tyr Ile Pro Glu Gly Ala Thr Asp

965 970 975

Gly Ser Ala Gln Pro Arg Leu Pro Ala Ser Gly Gly Ala Gly Gly Asn

980 985 990

Pro Gly Leu Tyr Glu Asp Leu Phe Arg Val Ser Val Lys Val Lys Asn

995 1000 1005

Thr Gly Asn Val Ala Gly Asp Glu Val Pro Gln Leu Tyr Val Ser

1010 1015 1020

Leu Gly Gly Pro Asn Glu Pro Lys Val Val Leu Arg Lys Phe Glu

1025 1030 1035

Arg Ile His Leu Ala Pro Ser Gln Glu Ala Val Trp Thr Thr Thr

1040 1045 1050

Leu Thr Arg Arg Asp Leu Ala Asn Trp Asp Val Ser Ala Gln Asp

1055 1060 1065

Trp Thr Val Thr Pro Tyr Pro Lys Thr Ile Tyr Val Gly Asn Ser

1070 1075 1080

Ser Arg Lys Leu Pro Leu Gln Ala Ser Leu Pro Lys Ala Gln

1085 1090 1095

<210>107

<211>20

<212>DNA

<213>米曲霉(Aspergillus oryzae)

<400>107

ggactgcgca gcatgcgttc 20

<210>108

<211>30

<212>DNA

<213>米曲霉(Aspergillus oryzae)

<400>108

agttaattaa ttactgggcc ttaggcagcg 30

<210>109

<211>28

<212>DNA

<213>桔橙嗜热霉(Thermoascus aurantiacus)

<400>109

atgtcctttt ccaagataat tgctactg 28

<210>110

<211>26

<212>DNA

<213>桔橙嗜热霉(Thermoascus aurantiacus)

<400>110

gcttaattaa ccagtataca gaggag 26

Claims

1.丝状真菌宿主细胞，其包含：(a)编码具有增强纤维素分解的活性的天然或异源多肽的第一多核苷酸；(b)编码天然或异源β-葡糖苷酶的第二多核苷酸；和(c)编码选自下组的天然或异源纤维素分解酶的一个或多个(几个)第三多核苷酸：里氏木霉(Trichoderma reesei)纤维二糖水解酶I(CEL7A)、里氏木霉纤维二糖水解酶II(CEL6A)，和里氏木霉内切葡聚糖酶I(CEL7B)，和它们的直向同源物或变体。

2.权利要求1的丝状真菌宿主细胞，其中具有增强纤维素分解的活性的多肽选自下组：

(a)包含[ILMV]-P-X(4，5)-G-X-Y-[ILMV]-X-R-X-[EQ]-X(4)-[HNQ]和[FW]-[TF]-K-[AIV]的具有增强纤维素分解的活性的多肽，其中X是任何氨基酸，X(4，5)是4或5个邻接位置上的任何氨基酸，并且X(4)是4个邻接位置上的任何氨基酸；和

(b)包含[ILMV]-P-x(4，5)-G-x-Y-[ILMV]-x-R-x-[EQ]-x(3)-A-[HNQ]的具有增强纤维素分解的活性的多肽，其中x是任何氨基酸，x(4，5)是4或5个邻接位置上的任何氨基酸，并且x(3)是3个邻接位置上的任何氨基酸；

其中包含[ILMV]-P-X(4，5)-G-X-Y-[ILMV]-X-R-X-[EQ]-X(4)-[HNQ]和[FW]-[TF]-K-[AIV]的具有增强纤维素分解的活性的多肽可选地进一步包含：

H-X(1，2)-G-P-X(3)-[YW]-[AILMV]，

[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV]，或

H-X(1，2)-G-P-X(3)-[YW]-[AILMV]和[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV]，

其中X是任何氨基酸，X(1，2)是1个位置或2个邻接位置上的任何氨基酸，X(3)是3个邻接位置上的任何氨基酸，并且X(2)是2个邻接位置上的任何氨基酸。

3.权利要求1的丝状真菌宿主细胞，其中具有增强纤维素分解的活性的多肽选自下组：

(a)多肽，其包含与SEQ ID NO：2、SEQ ID NO：4、SEQ ID NO：6、SEQID NO：8，或SEQ ID NO：10、SEQ ID NO：12，或SEQ ID NO：14的成熟多肽具有优选至少60％，更优选至少65％，更优选至少70％，更优选至少75％，更优选至少80％，甚至更优选至少85％，最优选至少90％，和甚至最优选至少95％同一性的氨基酸序列；

(b)由多核苷酸编码的多肽，所述多核苷酸在优选至少中严紧条件下，更优选至少中-高严紧条件下，并且最优选至少高严紧条件下与以下杂交：(i)SEQ ID NO：1、SEQ ID NO：3、SEQ ID NO：5、SEQ ID NO：7、SEQ ID NO：9、SEQ ID NO：11或SEQ ID NO：13的成熟多肽编码序列，(ii)包含在SEQ IDNO：1、SEQ ID NO：3、SEQ ID NO：5或SEQ ID NO：11的成熟多肽编码序列中的cDNA序列，或者包含SEQ ID NO：7、SEQ ID NO：9或SEQ ID NO：13的成熟多肽编码序列的基因组DNA序列，或(iii)(i)或(ii)的全长互补链；

(c)多肽，其由包含与SEQ ID NO：1、SEQ ID NO：3、SEQ ID NO：5、SEQID NO：7、SEQ ID NO：9、SEQ ID NO：11或SEQ ID NO：13的成熟多肽编码序列具有优选至少60％，更优选至少65％，更优选至少70％，更优选至少75％，更优选至少80％，甚至更优选至少85％，最优选至少90％，并且甚至最优选至少95％同一性的核苷酸序列的多核苷酸编码；

(d)SEQ ID NO：2、SEQ ID NO：4、SEQ ID NO：6、SEQ ID NO：8，或SEQID NO：10、SEQ ID NO：12，或SEQ ID NO：14的成熟多肽中包含取代、缺失和/或插入一个或多个(几个)氨基酸的变体；和

(e)具有增强纤维素分解的活性的多肽，其包含或组成为SEQ ID NO：2、SEQ ID NO：4、SEQ ID NO：6、SEQ ID NO：8，或SEQ ID NO：10、SEQ ID NO：12，或SEQ ID NO：14的成熟多肽，或者其具有增强纤维素分解的活性的片段。

4.权利要求1的丝状真菌宿主细胞，其中所述β-葡糖苷酶是β-葡糖苷酶融合蛋白。

5.权利要求4的丝状真菌宿主细胞，其中所述β-葡糖苷酶融合蛋白包含：(a)包含信号肽的第一氨基酸序列；(b)至少包含内切葡聚糖酶的催化域的第二氨基酸序列；和(c)至少包含β-葡糖苷酶的催化域的第三氨基酸序列；其中第一氨基酸序列的C-末端以符合读框的方式连接至第二氨基酸序列的N-末端，并且第二氨基酸序列的C-末端以符合读框的方式连接至第三氨基酸序列的N-末端。

6.权利要求5的丝状真菌宿主细胞，其中所述β-葡糖苷酶融合蛋白包含或组成为SEQ ID NO：103或SEQ ID NO：105。

7.权利要求1的丝状真菌宿主细胞，其中所述里氏木霉纤维二糖水解酶I(CEL7A)的直向同源物或变体选自下组：

(a)多肽，其包含与SEQ ID NO：52的成熟多肽具有优选至少60％，更优选至少65％，更优选至少70％，更优选至少75％，更优选至少80％，甚至更优选至少85％，最优选至少90％，并且甚至最优选至少95％同一性的氨基酸序列；

(b)由多核苷酸编码的多肽，所述多核苷酸在优选至少中严紧条件下，更优选至少中-高严紧条件下，并且最优选至少高严紧条件下与以下杂交：(i)SEQ ID NO：51的成熟多肽编码序列，(ii)包含在SEQ ID NO：51的成熟多肽编码序列中的cDNA序列，或者包含SEQ ID NO：51的成熟多肽编码序列的基因组DNA序列，或者(iii)(i)或(ii)的全长互补链；

(c)多肽，其由包含与SEQ ID NO：51的成熟多肽编码序列具有优选至少60％，更优选至少65％，更优选至少70％，更优选至少75％，更优选至少80％，甚至更优选至少85％，最优选至少90％，并且甚至最优选至少95％同一性的核苷酸序列的多核苷酸编码；

(d)SEQ ID NO：52的成熟多肽中包含取代、缺失和/或插入一个或多个(几个)氨基酸的变体。

8.权利要求1的丝状真菌宿主细胞，其中所述里氏木霉纤维二糖水解酶I(CEL7A)包含或组成为SEQ ID NO：52的成熟多肽。

9.权利要求1的丝状真菌宿主细胞，其中所述里氏木霉纤维二糖水解酶II(CEL6A)的直向同源物或变体选自下组：

(a)多肽，其包含与SEQ ID NO：54的成熟多肽具有优选至少60％，更优选至少65％，更优选至少70％，更优选至少75％，更优选至少80％，甚至更优选至少85％，最优选至少90％，并且甚至最优选至少95％同一性的氨基酸序列；

(b)由多核苷酸编码的多肽，所述多核苷酸在优选至少中严紧条件下，更优选至少中-高严紧条件下，并且最优选至少高严紧条件下与以下杂交：(i)SEQ ID NO：53的成熟多肽编码序列，(ii)包含在SEQ ID NO：53的成熟多肽编码序列中的cDNA序列，或者包含SEQ ID NO：53的成熟多肽编码序列的基因组DNA序列，或者(iii)(i)或(ii)的全长互补链；

(c)多肽，其由包含与SEQ ID NO：53的成熟多肽编码序列具有优选至少60％，更优选至少65％，更优选至少70％，更优选至少75％，更优选至少80％，甚至更优选至少85％，最优选至少90％，并且甚至最优选至少95％同一性的核苷酸序列的多核苷酸编码；和

(d)SEQ ID NO：54的成熟多肽中包含取代、缺失和/或插入一个或多个(几个)氨基酸的变体。

10.权利要求1的丝状真菌宿主细胞，其中所述里氏木霉纤维二糖水解酶II(CEL6A)包含或组成为SEQ ID NO：54的成熟多肽。

11.权利要求1的丝状真菌宿主细胞，其中所述里氏木霉内切葡聚糖酶I(CEL7B)的直向同源物或变体选自下组：

(a)多肽，其包含与SEQ ID NO：56的成熟多肽具有优选至少60％，更优选至少65％，更优选至少70％，更优选至少75％，更优选至少80％，甚至更优选至少85％，最优选至少90％，并且甚至最优选至少95％同一性的氨基酸序列；

(b)由多核苷酸编码的多肽，所述多核苷酸在优选至少中严紧条件下，更优选至少中-高严紧条件下，并且最优选至少高严紧条件下与以下杂交：(i)SEQ ID NO：55的成熟多肽编码序列，(ii)包含在SEQ ID NO：55的成熟多肽编码序列中的cDNA序列，或者包含SEQ ID NO：55的成熟多肽编码序列的基因组DNA序列，或者(iii)(i)或(ii)的全长互补链；

(c)多肽，其由包含与SEQ ID NO：55的成熟多肽编码序列具有优选至少60％，更优选至少65％，更优选至少70％，更优选至少75％，更优选至少80％，甚至更优选至少85％，最优选至少90％，并且甚至最优选至少95％同一性的核苷酸序列的多核苷酸编码；

(d)SEQ ID NO：56的成熟多肽中包含取代、缺失和/或插入一个或多个(几个)氨基酸的变体。

12.权利要求1的丝状真菌宿主细胞，其中所述里氏木霉内切葡聚糖酶I(CEL7B)包含或组成为SEQ ID NO：56的成熟多肽。

13.权利要求1-12中任一项的丝状真菌宿主细胞，其进一步包含一个或多个(几个)第四多核苷酸，其编码选自下组的纤维素分解酶：里氏木霉内切葡聚糖酶II(CEL5A)、里氏木霉内切葡聚糖酶III(CEL12A)，和里氏木霉内切葡聚糖酶V(CEL45A)，和它们的直向同源物或变体。

14.权利要求13的丝状真菌宿主细胞，其中所述里氏木霉内切葡聚糖酶II(CEL5A)的直向同源物或变体选自下组：

(a)多肽，其包含与SEQ ID NO：58的成熟多肽具有优选至少60％，更优选至少65％，更优选至少70％，更优选至少75％，更优选至少80％，甚至更优选至少85％，最优选至少90％，并且甚至最优选至少95％同一性的氨基酸序列；

(b)由多核苷酸编码的多肽，所述多核苷酸在优选至少中严紧条件下，更优选至少中-高严紧条件下，和最优选至少高严紧条件下与以下杂交：(i)SEQID NO：57的成熟多肽编码序列，(ii)包含在SEQ ID NO：57的成熟多肽编码序列中的cDNA序列，或者包含SEQ ID NO：57的成熟多肽编码序列的基因组DNA序列，或者(iii)(i)或(ii)的全长互补链；

(c)多肽，其由包含与SEQ ID NO：57的成熟多肽编码序列具有优选至少60％，更优选至少65％，更优选至少70％，更优选至少75％，更优选至少80％，甚至更优选至少85％，最优选至少90％，并且甚至最优选至少95％同一性的核苷酸序列的多核苷酸编码；和

(d)SEQ ID NO：58的成熟多肽中包含取代、缺失和/或插入一个或多个(几个)氨基酸的变体。

15.权利要求13的丝状真菌宿主细胞，其中所述里氏木霉内切葡聚糖酶II(CEL5A)包含或组成为SEQ ID NO：58的成熟多肽。

16.权利要求13的丝状真菌宿主细胞，其中所述里氏木霉内切葡聚糖酶III(CEL12A)的直向同源物或变体选自下组：

(a)多肽，其包含与SEQ ID NO：60的成熟多肽具有优选至少60％，更优选至少65％，更优选至少70％，更优选至少75％，更优选至少80％，甚至更优选至少85％，最优选至少90％，并且甚至最优选至少95％同一性的氨基酸序列；

(b)由多核苷酸编码的多肽，所述多核苷酸在优选至少中严紧条件下，更优选至少中-高严紧条件下，并且最优选至少高严紧条件下与以下杂交：(i)SEQ ID NO：59的成熟多肽编码序列，(ii)包含在SEQ ID NO：59的成熟多肽编码序列中的cDNA序列，或者包含SEQ ID NO：59的成熟多肽编码序列的基因组DNA序列，或者(iii)(i)或(ii)的全长互补链；

(c)多肽，其由包含与SEQ ID NO：59的成熟多肽编码序列具有优选至少60％，更优选至少65％，更优选至少70％，更优选至少75％，更优选至少80％，甚至更优选至少85％，最优选至少90％，并且甚至最优选至少95％同一性的核苷酸序列的多核苷酸编码；

(d)SEQ ID NO：60的成熟多肽中包含取代、缺失和/或插入一个或多个(几个)氨基酸的变体。

17.权利要求13的丝状真菌宿主细胞，其中所述里氏木霉内切葡聚糖酶III(CEL12A)是包含或组成为SEQ ID NO：60的成熟多肽。

18.权利要求13的丝状真菌宿主细胞，其中所述里氏木霉内切葡聚糖酶V(CEL45A)的直向同源物或变体选自下组：

(a)多肽，其包含与SEQ ID NO：62的成熟多肽具有优选至少60％，更优选至少65％，更优选至少70％，更优选至少75％，更优选至少80％，甚至更优选至少85％，最优选至少90％，并且甚至最优选至少95％同一性的氨基酸序列；

(b)由多核苷酸编码的多肽，所述多核苷酸在优选至少中严紧条件下，更优选至少中-高严紧条件下，并且最优选至少高严紧条件下与以下杂交：(i)SEQ ID NO：61的成熟多肽编码序列，(ii)包含在SEQ ID NO：61的成熟多肽编码序列中的cDNA序列，或者包含SEQ ID NO：61的成熟多肽编码序列的基因组DNA序列，或者(iii)(i)或(ii)的全长互补链；

(c)多肽，其由包含与SEQ ID NO：61的成熟多肽编码序列具有优选至少60％，更优选至少65％，更优选至少70％，更优选至少75％，更优选至少80％，甚至更优选至少85％，最优选至少90％，并且甚至最优选至少95％同一性的核苷酸序列的多核苷酸编码；和

(d)SEQ ID NO：62的成熟多肽中包含取代、缺失和/或插入一个或多个(几个)氨基酸的变体。

19.权利要求13的丝状真菌宿主细胞，其中所述里氏木霉内切葡聚糖酶V (CEL45A)是包含或组成为SEQ ID NO：61的成熟多肽。

20.权利要求1的丝状真菌宿主细胞，其产生纤维素分解蛋白质组合物，所述组合物包含：SEQ ID NO：8的成熟多肽的具有增强纤维素分解的活性的多肽；SEQ ID NO：106的β-葡糖苷酶融合蛋白；SEQ ID NO：52的成熟多肽的里氏木霉纤维二糖水解酶I(CEL7A)，SEQ ID NO：54的成熟多肽的里氏木霉纤维二糖水解酶II(CEL6A)，和SEQ ID NO：56的成熟多肽的里氏木霉内切葡聚糖酶I(CEL7B)。

21.权利要求1-20中任一项的丝状真菌宿主细胞，其还产生选自下组的一个或多个(几个)酶：SEQ ID NO：58的里氏木霉内切葡聚糖酶II(CEL5A)，SEQ ID NO：62的里氏木霉内切葡聚糖酶V(CEL45A)，和SEQ ID NO：60的里氏木霉内切葡聚糖酶III(CEL12A)。

22.权利要求1-21中任一项的丝状真菌宿主细胞，其还产生SEQ ID NO：64的成熟多肽的土生梭孢霉(Thielavia terrestris)纤维二糖水解酶。

23.产生纤维素分解蛋白质组合物的方法，其包含：(a)在有益于产生所述多肽的条件下培养权利要求1-22中任一项的宿主细胞；和(b)回收所述多肽。

24.通过权利要求23的方法获得的纤维素分解蛋白质组合物。

25.纤维素分解蛋白质组合物，其包含：(a)具有增强纤维素分解的活性的多肽；(b)β-葡糖苷酶；和(c)一个或多个(几个)选自下组的纤维素分解酶：里氏木霉纤维二糖水解酶I(CEL7A)，里氏木霉纤维二糖水解酶II(CEL6A)，和里氏木霉内切葡聚糖酶I(CEL7B)，和它们的直向同源物或变体。

26.权利要求25的纤维素分解蛋白质组合物，其中具有增强纤维素分解的活性的多肽选自下组：

其中包含[ILMV]-P-X(4，5)-G-X-Y-[ILMV]-X-R-X-[EQ]-X(4)-[HNQ]和[FW]-[TF]-K-[AIV]的具有增强纤维素分解的活性的多肽还包含：

H-X(1，2)-G-P-X(3)-[YW]-[AILMV]，

[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV]，或

H-X(1，2)-G-P-X(3)-[YW]-[AILMV]和[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV]，

27.权利要求25的纤维素分解蛋白质组合物，其中具有增强纤维素分解的活性的多肽选自下组：

(a)多肽，其包含与SEQ ID NO：2、SEQ ID NO：4、SEQ ID NO：6、SEQID NO：8，或SEQ ID NO：10，SEQ ID NO：12，或SEQ ID NO：14的成熟多肽具有优选至少60％，更优选至少65％，更优选至少70％，更优选至少75％，更优选至少80％，甚至更优选至少85％，最优选至少90％，并且甚至最优选至少95％同一性的氨基酸序列；

(b)由多核苷酸编码的多肽，所述多核苷酸在优选至少中严紧条件下，更优选至少中-高严紧条件下，并且最优选至少高严紧条件下与以下杂交：(i)SEQ ID NO：1、SEQ ID NO：3、SEQ ID NO：5、SEQ ID NO：7、SEQ ID NO：9、SEQ ID NO：11，或SEQ ID NO：13的成熟多肽编码序列，(ii)包含在SEQ IDNO：1、SEQ ID NO：3、SEQ ID NO：5或SEQ ID NO：11的成熟多肽编码序列中的cDNA序列，或者包含SEQ ID NO：7、SEQ ID NO：9，或SEQ ID NO：13的成熟多肽编码序列的基因组DNA序列，或者(iii)(i)或(ii)的全长互补链；

(c)多肽，其由包含与SEQ ID NO：1、SEQ ID NO：3、SEQ ID NO：5、SEQID NO：7、SEQ ID NO：9、SEQ ID NO：11，或SEQ ID NO：13的成熟多肽编码序列具有优选至少60％，更优选至少65％，更优选至少70％，更优选至少75％，更优选至少80％，甚至更优选至少85％，最优选至少90％，并且甚至最优选至少95％同一性的核苷酸序列的多核苷酸编码；

(e)具有增强纤维素分解的活性的多肽，所述多肽包含或组成为SEQ IDNO：2、SEQ ID NO：4、SEQ ID NO：6、SEQ ID NO：8，或SEQ ID NO：10、SEQ ID NO：12，或SEQ ID NO：14的成熟多肽；或者其具有增强纤维素分解的活性的片段。

28.权利要求25的纤维素分解蛋白质组合物，其中所述β-葡糖苷酶是β-葡糖苷酶融合蛋白。

29.权利要求28的纤维素分解蛋白质组合物，其中所述β-葡糖苷酶融合蛋白包含：(a)包含信号肽的第一氨基酸序列；(b)至少包含内切葡聚糖酶的催化域的第二氨基酸序列；和(c)至少包含β-葡糖苷酶的催化域的第三氨基酸序列；其中第一氨基酸序列的C-末端以符合读框的方式连接至第二氨基酸序列的N-末端，并且第二氨基酸序列的C-末端以符合读框的方式连接至第三氨基酸序列的N-末端。

30.权利要求29的纤维素分解蛋白质组合物，其中所述β-葡糖苷酶融合蛋白包含或组成为SEQ ID NO：103或SEQ ID NO：105。

31.权利要求25的纤维素分解蛋白质组合物，其中所述里氏木霉纤维二糖水解酶I(CEL7A)的直向同源物或变体选自下组：

(c)多肽，其由包含与SEQ ID NO：51的成熟多肽编码序列具有优选至少60％，更优选至少65％，更优选至少70％，更优选至少75％，更优选至少80％，甚至更优选至少85％，最优选至少90％，并且甚至最优选至少95％同一性的核苷酸序列的多核苷酸编码；和

32.权利要求25的纤维素分解蛋白质组合物，其中所述里氏木霉纤维二糖水解酶I(CEL7A)包含或组成为SEQ ID NO：52的成熟多肽。

33.权利要求25的纤维素分解蛋白质组合物，其中所述里氏木霉纤维二糖水解酶II(CEL6A)的直向同源物或变体选自下组：

34.权利要求25的纤维素分解蛋白质组合物，其中所述里氏木霉纤维二糖水解酶II(CEL6A)包含或组成为SEQ ID NO：54的成熟多肽。

35.权利要求25的纤维素分解蛋白质组合物，其中所述里氏木霉内切葡聚糖酶I(CEL7B)的直向同源物或变体选自下组：

(c)多肽，其由包含与SEQ ID NO：55的成熟多肽编码序列具有优选至少60％，更优选至少65％，更优选至少70％，更优选至少75％，更优选至少80％，甚至更优选至少85％，最优选至少90％，并且甚至最优选至少95％同一性的核苷酸序列的多核苷酸编码；和

36.权利要求25的纤维素分解蛋白质组合物，其中所述里氏木霉内切葡聚糖酶I(CEL7B)包含或组成为SEQ ID NO：56的成熟多肽。

37.权利要求25-36中任一项的纤维素分解蛋白质组合物，其进一步包含一个或多个(几个)第四多核苷酸，其编码选自下组的纤维素分解酶：里氏木霉内切葡聚糖酶II(CEL5A)、里氏木霉内切葡聚糖酶III(CEL12A)，和里氏木霉内切葡聚糖酶V(CEL45A)，和它们的直向同源物或变体。

38.权利要求37的纤维素分解蛋白质组合物，其中所述里氏木霉内切葡聚糖酶II(CEL5A)的直向同源物或变体选自下组：

(b)由多核苷酸编码的多肽，所述多核苷酸在优选至少中严紧条件下，更优选至少中-高严紧条件下，并且最优选至少高严紧条件下与以下杂交：(i)SEQ ID NO：57的成熟多肽编码序列，(ii)包含在SEQ ID NO：57的成熟多肽编码序列中的cDNA序列，或者包含SEQ ID NO：57的成熟多肽编码序列的基因组DNA序列，或者(iii)(i)或(ii)的全长互补链；

39.权利要求37的纤维素分解蛋白质组合物，其中所述里氏木霉内切葡聚糖酶II(CEL5A)包含或组成为SEQ ID NO：58的成熟多肽。

40.权利要求37的纤维素分解蛋白质组合物，其中所述里氏木霉内切葡聚糖酶III(CEL12A)的直向同源物或变体选自下组：

41.权利要求37的纤维素分解蛋白质组合物，其中所述里氏木霉内切葡聚糖酶III(CEL12A)是包含或组成为SEQ ID NO：60的成熟多肽。

42.权利要求37的纤维素分解蛋白质组合物，其中所述里氏木霉内切葡聚糖酶V(CEL45A)的直向同源物或变体选自下组：

43.权利要求37的纤维素分解蛋白质组合物，其中里氏木霉内切葡聚糖酶V(CEL45A)是包含或组成为SEQ ID NO：61的成熟多肽。

44.权利要求25的纤维素分解蛋白质组合物，其包含：SEQ ID NO：8的成熟多肽的具有增强纤维素分解的活性的多肽；SEQ ID NO：106的β-葡糖苷酶融合蛋白；SEQ ID NO：52的成熟多肽的里氏木霉纤维二糖水解酶I(CEL7A)，SEQ ID NO：54的成熟多肽的里氏木霉纤维二糖水解酶II(CEL6A)，和SEQ ID NO：56的成熟多肽的里氏木霉内切葡聚糖酶I(CEL7B)。

45.权利要求25-44中任一项的纤维素分解蛋白质组合物，其进一步包含选自下组的一个或多个(几个)酶：SEQ ID NO：58的里氏木霉内切葡聚糖酶II(CEL5A)，SEQ ID NO：62的里氏木霉内切葡聚糖酶V(CEL45A)，和SEQ IDNO：60的里氏木霉内切葡聚糖酶III(CEL12A)。

46.权利要求25-45中任一项的纤维素分解蛋白质组合物，其进一步包含SEQ ID NO：64的成熟多肽的土生梭孢霉纤维二糖水解酶。

47.用于降解或转化含纤维素材料的方法，其包括用有效量的权利要求25-46中任一项的纤维素分解蛋白质组合物处理所述含纤维素材料。

48.权利要求47的方法，其进一步包括用有效量的选自下组的一种或多种(几种)酶处理含纤维素材料：半纤维素酶、酯酶、蛋白酶、漆酶、过氧化物酶，或它们的混合物。

49.权利要求47或48的方法，其进一步包括回收降解的含纤维素材料。

50.用于产生发酵产物的方法，其包括：(a)用有效量的权利要求25-46中任一项的纤维素分解蛋白质组合物糖化含纤维素材料；(b)用一种或多种(几种)发酵微生物发酵步骤(a)的经糖化的含纤维素材料以产生发酵产物；和(c)从发酵回收所述发酵产物。

51.权利要求50的方法，其进一步包括用有效量的选自下组的一种或多种(几种)酶处理所述含纤维素材料：半纤维素酶、酯酶、蛋白酶、漆酶、过氧化物酶，或它们的混合物。