CN109072209A

CN109072209A - 纤维二糖水解酶变体和编码其的多核苷酸

Info

Publication number: CN109072209A
Application number: CN201780019250.1A
Authority: CN
Inventors: M·沃古利斯; L·迪马斯; D·奥斯本
Original assignee: Novo Nordisk AS
Current assignee: Novo Nordisk AS
Priority date: 2016-03-24
Filing date: 2017-03-24
Publication date: 2018-12-21
Also published as: WO2017165760A1; BR112018069188A2; DK3433358T3; EP3433358A1; US11965189B2; EP3433358B1; US20200299664A1

Abstract

本发明涉及具有增加的热活性或热稳定性的纤维二糖水解酶变体，编码这些变体的多核苷酸；包含这些多核苷酸的核酸构建体、载体和宿主细胞；以及使用这些变体的方法。

Description

纤维二糖水解酶变体和编码其的多核苷酸

对序列表的引用

本申请包含处于计算机可读形式的序列表，将其通过引用结合在此。

发明背景

技术领域

本发明涉及纤维二糖水解酶变体、编码这些变体的多核苷酸以及产生和使用这些变体的方法。

背景技术

纤维素是单糖葡萄糖通过β-1,4-键共价连接的一种聚合物。许多微生物产生水解β-连接的葡聚糖的酶。这些酶包括内切葡聚糖酶、纤维二糖水解酶、以及β-葡糖苷酶。内切葡聚糖酶在任意位置消化纤维素聚合物，使其打开而被纤维二糖水解酶攻击。纤维二糖水解酶从纤维素聚合物的末端顺序地释放纤维二糖分子。纤维二糖是葡萄糖的水溶性β-1,4-连接的二聚体。β-葡糖苷酶将纤维二糖水解成葡萄糖。

将木质纤维素原料转化成乙醇具有如下优点，即易于获得大量原料、避免燃烧或填埋材料的需要、以及乙醇燃料的清洁性。木材、农业废弃物、草本作物和城市固体废物被认为是用于乙醇生产的原料。这些材料主要由纤维素、半纤维素和木质素组成。一旦将木质纤维素转化成可发酵糖，例如葡萄糖，那么这些可发酵糖就可以容易地被酵母发酵成乙醇。

WO 2011/050037披露了具有改进的热稳定性的土生梭孢壳霉(Thielaviaterrestris)纤维二糖水解酶变体。WO 2011/050037披露了具有改进的热稳定性的烟曲霉(Aspergillus fumigatus)纤维二糖水解酶变体。WO 2005/028636披露了红褐肉座菌(Hypocrea jecorina)Cel7A纤维二糖水解酶I的变体。WO 2005/001065披露了灰腐质霉(Humicola grisea)Cel7A纤维二糖水解酶I、红褐肉座菌(Hypocrea jecorina)纤维二糖水解酶I、和嗜热革节孢(Scytalidium thermophilium)纤维二糖水解酶I的变体。WO 2004/016760披露了红褐肉座菌(Hypocrea jecorina)Cel7A纤维二糖水解酶I的变体。美国专利号7,375,197披露了里氏木霉纤维二糖水解酶I的变体。

本领域需要具有改进的特性的纤维二糖水解酶变体以增加木质纤维素原料的糖化效率。

发明内容

本发明涉及分离的纤维二糖水解酶变体，这些变体包括与SEQ ID NO:1的位置8、17、113、157、159、184、199、240、250、274、318、325、328、347、349、358、360、380、391、393、394、412以及430相对应的一个或多个(例如，若干个)位置处的取代，其中这些变体具有纤维二糖水解酶活性。

本发明还涉及纤维二糖水解酶变体，这些变体包含变体催化结构域，其中变体催化结构域包含在与SEQ ID NO:1的位置8、17、113、157、159、184、199、240、250、274、318、325、328、347、349、358、360、380、391、393、394、412以及430相对应的一个或多个(例如，若干个)位置处的取代，其中纤维二糖水解酶变体具有纤维二糖水解酶活性。

本发明还涉及编码这些变体的分离的多核苷酸；包含这些多核苷酸的核酸构建体、载体和宿主细胞；以及产生这些变体的方法。

本发明还涉及降解纤维素材料的方法，这些方法包括：用包含本发明的纤维二糖水解酶变体的酶组合物处理纤维素材料。在一方面，这些方法进一步包含回收该降解的纤维素材料。

本发明还涉及产生发酵产物的方法，这些方法包括：(a)用包含本发明的纤维二糖水解酶变体的酶组合物糖化纤维素材料；(b)用一种或多种(例如，若干种)发酵微生物发酵这一糖化的纤维素材料，以产生该发酵产物；以及(c)从该发酵中回收该发酵产物。

本发明还涉及发酵纤维素材料的方法，这些方法包括：用一种或多种(例如，若干种)发酵微生物发酵纤维素材料，其中该纤维素材料是用包含本发明的纤维二糖水解酶变体的酶组合物糖化的。在一方面，该纤维素材料的发酵产生发酵产物。在另一方面，这些方法进一步包括从该发酵中回收该发酵产物。

附图说明

图1A和1B示出了Penicillium vasconiae纤维二糖水解酶(SEQ ID NO:1)、里氏木霉(Trichoderma reesei)纤维二糖水解酶(SEQ ID NO:2)、埃默森青霉菌(Penicilliumemersonii)纤维二糖水解酶(SEQ ID NO:3)、奥斯塔尼青霉(Penicillium occitanis)纤维二糖水解酶(SEQ ID NO:4)、雷塞氏篮状菌(Talaromyces leycettanus)纤维二糖水解酶(SEQ ID NO:5)、以及烟曲霉(Aspergillus fumigatus)纤维二糖水解酶(SEQ ID NO:6)。

定义

乙酰木聚糖酯酶：术语“乙酰木聚糖酯酶”意指羧基酯酶(EC 3.1.1.72)，其催化乙酰基基团从聚合木聚糖、乙酰化木糖、乙酰化葡萄糖、乙酸α-萘酯(alpha-napthylacetate)和对硝基苯乙酸酯(p-nitrophenyl acetate)的水解。可以在含有0.01％TWEEN^TM20(聚氧乙烯脱水山梨糖醇单月桂酸酯)的50mM乙酸钠(pH 5.0)中使用0.5mM对硝基苯基乙酸酯作为底物来确定乙酰木聚糖酯酶活性。将一个单位的乙酰木聚糖酯酶定义为在pH 5、25℃下每分钟能够释放1微摩尔对硝基酚根阴离子的酶的量。

α-L-阿拉伯呋喃糖苷酶：术语“α-L-阿拉伯呋喃糖苷酶”意指一种α-L-阿拉伯呋喃糖苷阿拉伯呋喃水解酶(EC 3.2.1.55)，其催化α-L-阿拉伯糖苷中的末端非还原性α-L-阿拉伯呋喃糖苷残基的水解。该酶对α-L-阿拉伯呋喃糖苷、含有(1,3)-和/或(1,5)-键的α-L-阿拉伯聚糖、阿拉伯糖基木聚糖以及阿拉伯半乳聚糖起作用。α-L-阿拉伯呋喃糖苷酶还被称为阿拉伯糖苷酶、α-阿拉伯糖苷酶、α-L-阿拉伯糖苷酶、α-阿拉伯呋喃糖苷酶、多糖α-L-阿拉伯呋喃糖苷酶、α-L-阿拉伯呋喃糖苷水解酶、L-阿拉伯糖苷酶、或α-L-阿拉伯聚糖酶。可以使用每ml的100mM乙酸钠(pH 5)中5mg的中等粘度小麦阿拉伯糖基木聚糖(麦格酶国际爱尔兰股份有限公司(Megazyme International Ireland,Ltd.)、布瑞公司，威克洛郡，爱尔兰)以总体积200μl在40℃处持续30分钟，接着通过HPX-87H柱层析(伯乐实验室有限公司(Bio-Rad Laboratories,Inc.))进行阿拉伯糖分析来确定α-L-阿拉伯呋喃糖苷酶活性。

α-葡糖醛酸糖苷酶：术语“α-葡糖醛酸糖苷酶”意指可催化α-D-葡萄糖苷酸水解成为D-葡萄糖醛酸酯和醇的α-D-葡萄糖苷酸葡萄糖醛酸水解酶(EC 3.2.1.139)。可以根据deVries，1998，J.Bacteriol.[细菌学杂志]180:243-249来测定α-葡糖醛酸糖苷酶活性。一个单位的α-葡糖醛酸糖苷酶等于能够在pH 5、40℃下每分钟释放1微摩尔的葡糖醛酸或4-O-甲基葡糖醛酸的酶的量。

辅助活性9多肽：该术语“辅助活性9多肽”或“AA9多肽”意指分类为溶解性多糖单加氧酶(lytic polysaccharide monooxygenase)(Quinlan等人，2011，Proc.Natl.Acad.Sci.USA[美国科学院院刊]108:15079-15084；Phillips等人，2011，ACSChem.Biol.[ACS化学生物学]6:1399-1406；Li等人，2012，Structure[结构]20:1051-1061)的多肽。根据Henrissat,1991,Biochem.J.[生物化学杂志]280:309-316以及Henrissat和Bairoch,1996,Biochem.J.[生物化学杂志]316:695-696，AA9多肽之前被分类为糖苷水解酶家族61(GH61)。

AA9多肽通过具有纤维素分解活性的酶增强纤维素材料的水解。可以通过测量在以下条件下来自由纤维素分解酶水解纤维素材料的还原糖的增加或纤维二糖与葡萄糖总量的增加来确定纤维素分解增强活性：1mg-50mg总蛋白/g预处理的玉米秸秆(PCS)中的纤维素，其中总蛋白包含50％-99.5％w/w纤维素分解酶蛋白和0.5％-50％w/w AA9多肽蛋白，在适合的温度(如40℃-80℃，例如40℃、45℃、50℃、55℃、60℃、65℃、70℃、75℃、或80℃)和适合的pH(如，4-9，例如4.5、5.0、5.5、6.0、6.5、7.0、7.5、8.0、8.5、或9.0)下持续1-7天，与不具有纤维素分解增强活性的相等的总蛋白负载的对照水解(1mg-50mg纤维素分解蛋白/g PCS中的纤维素)进行比较。

可以使用CELLUCLAST^TM1.5L(诺维信公司(Novozymes A/S)，巴格斯瓦德(Bagsvaerd)，丹麦)和β-葡糖苷酶的混合物作为纤维素分解活性的来源来确定AA9多肽增强活性，其中该β-葡糖苷酶是以纤维素酶蛋白负载的至少2％-5％蛋白的重量存在的。在一方面，该β-葡糖苷酶是米曲霉(Aspergillus oryzae)β-葡糖苷酶(例如，根据WO 02/095014，在米曲霉中重组产生的)。在另一方面，该β-葡糖苷酶是烟曲霉β-葡糖苷酶(例如，如在WO 02/095014中描述的，在米曲霉中重组产生的)。

AA9多肽增强活性还可通过以下来确定：在40℃将AA9多肽与0.5％磷酸溶胀纤维素(PASC)、100mM乙酸钠(pH 5)、1mM MnSO4、0.1％没食子酸、0.025mg/ml的烟曲霉β-葡糖苷酶、以及0.01％X-100(4-(1,1,3,3-四甲基丁基)苯基-聚乙二醇)一起孵育24-96小时，接着测定从PASC释放的葡萄糖。

还可以根据WO 2013/028928测定高温组合物的AA9多肽增强活性。

AA9多肽通过将达到相同的水解程度所需要的纤维素分解酶的量降低优选至少1.01倍，例如，至少1.05倍、至少1.10倍、至少1.25倍、至少1.5倍、至少2倍、至少3倍、至少4倍、至少5倍、至少10倍、或至少20倍，来增强由具有纤维素分解活性的酶催化的纤维素材料的水解。

根据WO 2008/151043或WO 2012/122518，AA9多肽可以在可溶性活化二价金属阳离子(例如锰或铜)的存在下使用。

该AA9多肽还可以在二氧化合物、二环化合物、杂环化合物、含氮化合物、醌化合物、含硫化合物、或从预处理的纤维素材料(例如预处理的玉米秸秆)获得的液体的存在下使用(WO 2012/021394、WO 2012/021395、WO 2012/021396、WO2012/021399、WO 2012/021400、WO 2012/021401、WO 2012/021408、以及WO2012/021410)。

等位基因变体：术语“等位基因变体”意思指占据同一染色体基因座的一个基因的两种或更多种替代形式中的任一种。等位基因变异通过突变天然地产生，并且可能导致群体内的多态性。基因突变可以是沉默的(所编码的多肽没有改变)或可编码具有改变的氨基酸序列的多肽。多肽的等位基因变体是由基因的等位基因变体编码的多肽。

β-葡糖苷酶：术语“β-葡糖苷酶”意指β-D-葡糖苷葡糖水解酶(E.C.3.2.1.21)，其催化末端非还原性β-D-葡萄糖残基的水解，并释放β-D-葡萄糖。可以根据Venturi等人，2002，J.Basic Microbiol.[基础微生物学杂志]42:55-66的程序使用对硝基苯基-β-D-吡喃葡萄糖苷作为底物来测定β-葡糖苷酶活性。一个单位的β-葡糖苷酶定义为在25℃、pH4.8下，在含有0.01％20的50mM柠檬酸钠中从作为底物的1mM对硝基苯基-β-D-吡喃葡萄糖苷每分钟产生1.0微摩尔的对硝基苯酚阴离子。

β-木糖苷酶：术语“β-木糖苷酶”意指催化短β(1→4)-木寡糖的外切水解，以从非还原末端去除连续的D-木糖残基的β-D-木糖苷木糖水解酶(E.C.3.2.1.37)。可以在含有0.01％20的100mM柠檬酸钠中，在pH 5、40℃，使用1mM对硝基苯基-β-D-木糖苷作为底物来测定β-木糖苷酶活性。一个单位的β-木糖苷酶定义为在40℃、pH 5，在含有0.01％20的100mM柠檬酸钠中从1mM对硝基苯基-β-D-木糖苷每分钟产生1.0微摩尔的对硝基酚根阴离子。

碳水化合物结合模块：术语“碳水化合物结合模块”意指提供碳水化合物结合活性的碳水化合物活性酶内的结构域(Boraston等人，2004，Biochem.J.[生物化学杂志]383:769-781)。大多数已知的碳水化合物结合模块(CBM)是具有离散折叠的连续氨基酸序列。碳水化合物结合模块(CBM)典型地发现于酶的N-末端处或C-末端的端点处。已知一些CBM具有针对纤维素的特异性。在一个实施例中，碳水化合物结合模块具有SEQ ID NO:1的氨基酸489-524的序列。在另一个实施例中，碳水化合物结合模块具有SEQ ID NO:2的氨基酸461-497的序列。在另一个实施例中，碳水化合物结合模块具有SEQ ID NO:4的氨基酸469-504的序列。在另一个实施例中，碳水化合物结合模块具有SEQ ID NO:5的氨基酸472-507的序列。在另一个实施例中，碳水化合物结合模块具有SEQ ID NO:6的氨基酸469-506的序列。

过氧化氢酶：术语“过氧化氢酶”意指一种过氧化氢：过氧化氢氧化还原酶(E.C.1.11.1.6或E.C.1.11.1.21)，其催化将两个过氧化氢转化为氧和两个水。

根据美国专利号5,646,025确定过氧化氢酶活性。

还可以基于以下反应通过在240nm下监测过氧化氢的降解而确定过氧化氢酶活性：

2H₂O₂→2H₂O+O₂

在25℃处，在具有10.3mM底物(H₂O₂)的50mM磷酸盐(pH 7)中进行该反应。用分光光度计监测16-24秒内的吸光度，这应该对应于从0.45至0.4的吸光度降低。可以将一个过氧化氢酶活性单位表示为在pH 7.0和25℃处或在测定条件下每分钟降解一微摩尔的H₂O₂。

催化结构域：术语“催化结构域”意思指一种酶的包含该酶的催化机器的区域。在一个实施例中，催化结构域具有SEQ ID NO:1的氨基酸1-443的序列。在另一个实施例中，催化结构域具有SEQ ID NO:2的氨基酸1-441的序列。在另一个实施例中，催化结构域具有SEQID NO:3的氨基酸1-437的序列。在另一个实施例中，催化结构域具有SEQ ID NO:4的氨基酸1-442的序列。在另一个实施例中，催化结构域具有SEQ ID NO:5的氨基酸1-448的序列。在另一个实施例中，催化结构域具有SEQ ID NO:6的氨基酸1-447的序列。

cDNA：术语“cDNA”意指可以通过从获得自真核或原核细胞的成熟的、剪接的mRNA分子进行反转录而制备的DNA分子。cDNA缺乏可以存在于对应基因组DNA中的内含子序列。早先的初始RNA转录物本是mRNA的前体，其在呈现为成熟的剪接的mRNA之前要经一系列步骤进行加工，包括剪接。

纤维二糖水解酶：该术语“纤维二糖水解酶”意指一种1,4-β-D-葡聚糖纤维二糖水解酶(E.C.3.2.1.91和E.C.3.2.1.176)，其催化纤维素、纤维寡糖、或任何含有β-1,4-连接葡萄糖的聚合物中的1,4-β-D-糖苷键的水解，从而从链的还原性末端(纤维二糖水解酶I)或非还原性末端(纤维二糖水解酶II)释放纤维二糖(Teeri，1997，Trends inBiotechnology[生物技术趋势]15:160-167；Teeri等人，1998，Biochem.Soc.Trans.[生物化学学会会刊]26:173-178)。可以根据Lever等人，1972，Anal.Biochem.[分析生物化学]47:273-279；van Tilbeurgh等人,1982,FEBS Letters[欧洲生化学会联合会快报]149:152-156；van Tilbeurgh和Claeyssens,1985,FEBS Letters[欧洲生化学会联合会快报]187:283-288；以及Tomme等人,1988,Eur.J.Biochem.[欧洲生物化学杂志]170:575-581在WO 2011/153276中所描述的程序来测定纤维二糖水解酶活性。

纤维素分解酶或纤维素酶：术语“纤维素分解酶”或“纤维素酶”意指一种或多种(例如，若干种)水解纤维素材料的酶。此类酶包括内切葡聚糖酶，纤维二糖水解酶，β-葡糖苷酶，或其组合。用于测量纤维素分解酶活性的两种基本方法包括：(1)测量总纤维素分解酶活性，以及(2)测量个体纤维素分解酶活性(内切葡聚糖酶、纤维二糖水解酶、和β-葡糖苷酶)，如在Zhang等人，2006，Biotechnology Advances[生物技术进展]24:452-481中所述的。可使用不溶性底物，包括Whatman№1滤纸、微晶纤维素、细菌纤维素、藻类纤维素、棉花、预处理的木质纤维素等，测量总纤维素分解酶活性。最常见的总纤维素分解活性测定是将沃特曼№1滤纸用作底物的滤纸测定。该测定是由国际纯粹与应用化学联合会(IUPAC)建立的(Ghose,1987,Pure Appl.Chem.[纯粹与应用化学]59:257-68)。

可以通过测量在以下条件下，由一种或多种纤维素分解酶进行的纤维素材料水解期间，糖的产生/释放的增加来确定纤维素分解酶活性：1mg-50mg纤维素分解酶蛋白/g预处理的玉米秸秆(PCS)中的纤维素(或其他预处理的纤维素材料),在适合的温度(例如25℃-80℃，例如，25℃、30℃、35℃、40℃、45℃、50℃、55℃、60℃、65℃、70℃、75℃、或80℃)，以及在适合的pH(例如3-9，例如，3.0、3.5、4.0、4.5、5.0、5.5、6.0、6.5、7.0、7.5、8.0、8.5、或9.0)下持续3-7天，与未添加纤维素分解酶蛋白的对照水解相比。典型条件为：1ml反应，洗涤或未洗涤的PCS，5％不溶性固体(干重)，50mM乙酸钠(pH 5)，1mM MnSO₄，50℃、55℃、或60℃，72小时，通过HPX-87H柱层析(伯乐实验室有限公司(Bio-RadLaboratories,Inc.))进行糖分析。

纤维素材料：术语“纤维素材料”意指包含纤维素的任何材料。生物质的初生细胞壁中的主要多糖是纤维素，第二丰富的是半纤维素,而第三丰富的是果胶。细胞停止生长后产生的次生细胞壁也含有多糖，并且它通过与半纤维素共价交联的聚合木质素得到强化。纤维素是脱水纤维二糖的均聚物，因此是线性β-(1-4)-D-葡聚糖，而半纤维素包括多种化合物，例如具有一系列取代基以复杂支链结构存在的木聚糖、木葡聚糖、阿拉伯糖基木聚糖、以及甘露聚糖。尽管纤维素一般为多形态的，但发现其在植物组织中主要作为平行葡聚糖链的不溶性晶体基质存在。半纤维素通常氢键结合至纤维素以及其他半纤维素，这有助于稳定细胞壁基质。

纤维素通常见于例如植物的茎、叶、壳、皮和穗轴或树的叶、枝和木材(wood)中。纤维素材料可为，但不限于：农业残余物、草本材料(包括能量作物)、城市固体废物、纸浆与造纸厂残余物、废纸和木材(包括林业残余物)(参见，例如，Wiselogel等人，1995，于Handbookon Bioethanol[生物乙醇手册](Charles E.Wyman编辑)，第105-118页，Taylor和Francis，华盛顿；Wyman，1994，Bioresource Technology[生物资源技术]50:3-16；Lynd，1990，Applied Biochemistry and Biotechnology[应用生物化学与生物技术]24/25:695-719；Mosier等人，1999，Recent Progress in Bioconversion of Lignocellulosics[木质纤维素的生物转化的最近进展]，Advances in Biochemical Engineering/Biotechnology[生物化学工程/生物技术的进展]，T.Scheper主编，第65卷，第23-40页，纽约斯普林格出版社(Springer-Verlag)，纽约。在本申请中应理解的是，纤维素可为任何形式的木质纤维素，在混合基质中含有木质素、纤维素和半纤维素的植物细胞壁材料。在一方面，该纤维素材料是任何生物质材料。在另一方面，该纤维素材料是木质纤维素，该木质纤维素包含纤维素、半纤维素、以及木质素。

在一个实施例中，该纤维素材料是农业废弃物、草本材料(包括能源作物)、城市固体废物、纸浆和造纸厂废弃物、废纸或木材(包括林业废弃物)。

在另一个实施例中，该纤维素材料是芦竹、甘蔗渣、竹子、玉米芯、玉米纤维、玉米秸秆、芒属、稻秸、甘蔗秸秆、柳枝稷或麦秸。

在另一个实施例中，该纤维素材料是山杨、桉树、冷杉、松树、白杨、云杉或柳树。

在另一个实施例中，该纤维素材料是海藻纤维素、细菌纤维素、棉短绒、滤纸、微晶纤维素(例如，)、或经磷酸处理的纤维素。

在另一个实施例中，该纤维素材料是水生生物质。如在此使用，术语“水生生物质”意指在水生环境中通过光合作用过程产生的生物质。水生生物质可为藻类、挺水植物(emergent plant)、浮叶植物(floating-leaf plant)或沉水植物(submerged plant)。

纤维素材料可以按原样使用或可以使用本领域已知的常规方法进行预处理，如在此所描述。在一个优选方面，对该纤维素材料进行预处理。

编码序列：术语“编码序列”意指一种多核苷酸，该多核苷酸直接规定了变体的氨基酸序列。编码序列的边界一般由开放阅读框架决定，该开放阅读框架从起始密码子(如ATG、GTG或TTG)开始并且以终止密码子(如TAA、TAG或TGA)结束。编码序列可为基因组DNA、cDNA、合成DNA或其组合。

控制序列：术语“控制序列”意指为编码本发明的变体的多核苷酸的表达所需的核酸序列。每个控制序列对于编码该变体的多核苷酸来说可以是天然的(即，来自相同基因)或外源的(即，来自不同基因)，或相对于彼此是天然的或外源的。此类控制序列包括但不限于前导子、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。最少，控制序列包括启动子、以及转录和翻译终止信号。出于引入促进控制序列与编码变体的多核苷酸的编码区域连接的特异性限制位点的目的，控制序列可以提供有接头。

溶解氧饱和度：在标准氧分压(0.21个大气压)下确定氧的饱和度。标准氧分压下的饱和度取决于温度和溶质浓度。在水解或糖化过程中的温度是50℃的实施例中，取决于溶质浓度，饱和度典型地应在5mg-5.5mg氧/kg浆料的范围内。因此，在50℃处0.5％至10％的饱和度的溶解氧浓度对应于从0.025ppm(0.5x 5/100)至0.55ppm(10x 5.5/100)范围内的溶解氧量，例如，如0.05ppm至0.165ppm，并且在50℃处10％-70％的饱和度的溶解氧浓度对应于从0.50ppm(10x 5/100)至3.85ppm(70x5.5/100)的范围内的溶解氧量，例如像1ppm至2ppm。在一个实施例中，按0.5ppm至5ppm的范围内的量添加氧，如0.5ppm至4.5ppm、0.5ppm至4ppm、0.5ppm至3.5ppm、0.5ppm至3ppm、0.5ppm至2.5ppm、或0.5ppm至2ppm。在一方面，其中糖化过程中的溶解氧浓度处于0.5％-10％饱和度范围内，例如0.5％-7％、例如0.5％-5％、例如0.5％-4％、例如0.5％-3％、例如0.5％-2％、例如1％-5％、例如1％-4％、例如1％-3％、例如1％-2％。

内切葡聚糖酶：该术语“内切葡聚糖酶”意指4-(1,3；1,4)-β-D-葡聚糖4-葡聚糖水解酶(E.C.3.2.1.4)，其催化纤维素、纤维素衍生物(例如羧甲基纤维素和羟乙基纤维素)、地衣多糖中的1,4-β-D-糖苷键和混合的β-1,3-1,4葡聚糖例如谷物β-D-葡聚糖或木葡聚糖以及含有纤维素组分的其他植物材料中的β-1,4键的内切水解。可以通过测量底物粘度的降低或通过还原糖测量所确定的还原性末端的增加来确定内切葡聚糖酶活性(Zhang等人，2006，Biotechnology Advances[生物技术进展]24:452-481)。还可以根据Ghose,1987,Pure and Appl.Chem.[纯粹与应用化学]59:257-268的程序，在pH 5、40℃，使用羧甲基纤维素(CMC)作为底物来测确内切葡聚糖酶活性。

表达：术语“表达”包括涉及变体的产生的任何步骤，包括(但不限于)转录、转录后修饰、翻译、翻译后修饰、以及分泌。

表达载体：术语“表达载体”意指一种直链或环状DNA分子，该分子包括编码一种变体的一种多核苷酸并且可操作地连接至提供用于其表达的控制序列。

阿魏酸酯酶：术语“阿魏酸酯酶”意指一种4-羟基-3-甲氧基肉桂酰基-糖水解酶(EC 3.1.1.73)，其催化4-羟基-3-甲氧基肉桂酰基(阿魏酰基)基团从酯化的糖(其在天然生物质底物中通常为阿拉伯糖)的水解，以产生阿魏酸酯(4-羟基-3-甲氧基肉桂酸酯)。阿魏酸酯酶(FAE)也被称为阿魏酸酯酶(ferulic acid esterase)、羟基肉桂酰基酯酶、FAE-III、肉桂酸酯水解酶、FAEA、cinnAE、FAE-I、或FAE-II。可以在50mM乙酸钠(pH 5.0)中，使用0.5mM对硝基苯基阿魏酸酯作为底物确定对阿魏酸酯酶活性。一个单位的阿魏酸酯酶等于，在pH 5、25℃下，每分钟能够释放1μmol的对硝基酚根阴离子的酶的量。

片段：术语“片段”意指具有在成熟多肽的氨基和/或羧基末端不存在的一个或多个(例如，若干个)氨基酸的多肽；其中该片段具有纤维二糖水解酶活性。在一方面，一个片段含有至少380个氨基酸残基、至少400个氨基酸残基或至少420个氨基酸残基。在另一方面，片段含有亲本纤维二糖水解酶的至少85％的氨基酸残基，例如至少90％的氨基酸残基或至少95％的氨基酸残基。

半纤维素分解酶或半纤维素酶：术语“半纤维素分解酶”或“半纤维素酶”是指水解半纤维素材料的一种或多种(例如，若干种)酶。参见例如，Shallom和Shoham，2003，CurrentOpinion In Microbiology[微生物学当前观点]6(3):219-228)。半纤维素酶是植物生物质的降解中的关键组分。半纤维素酶的实例包括但不限于，乙酰基甘露聚糖酯酶、乙酰基木聚糖酯酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、香豆酸酯酶、阿魏酸酯酶、半乳糖苷酶、葡糖醛酸糖苷酶、葡糖醛酸酯酶、甘露聚糖酶、甘露糖苷酶、木聚糖酶以及木糖苷酶。这些酶的底物半纤维素是支链和直链多糖的异质性组，其可以通过氢键与植物细胞壁中的纤维素微纤维相结合，交联成坚固的网络。半纤维素还共价附接至木质素，从而与纤维素一起形成高度复杂的结构。半纤维素的可变结构和组织要求许多酶的协同作用以使其完全降解。半纤维素酶的催化模块是水解糖苷键的糖苷水解酶(GH)，或是水解乙酸或阿魏酸侧基团的酯键的碳水化合物酯酶(CE)。这些催化模块，基于其一级序列的同源性，可以分配到GH和CE家族。一些家族，具有总体上类似的折叠，可以进一步归类为宗族(clan)，以字母标记(例如，GH-A)。在碳水化合物活性酶(CAZy)数据库中可得到这些以及其他碳水化合物活性酶的最翔实和更新的分类。可以根据Ghose和Bisaria，1987，Pure&AppI.Chem.[纯粹与应用化学]59:1739-1752，在适合的温度(例如25℃-80℃，例如，25℃、30℃、35℃、40℃、45℃、50℃、55℃、60℃、65℃、70℃、75℃、或80℃)以及适合的pH(例如3-9，例如，3.0、3.5、4.0、4.5、5.0、5.5、6.0、6.5、7.0、7.5、8.0、8.5、或9.0)下测量半纤维素分解酶活性。

半纤维素材料：该术语“半纤维素材料”意指包含半纤维素的任何材料。半纤维素包括木聚糖、葡糖醛酸木聚糖、阿拉伯糖基木聚糖、葡甘露聚糖、以及木葡聚糖。这些多糖含有许多不同的糖单体。在半纤维素中的糖单体可以包括木糖、甘露糖、半乳糖、鼠李糖、以及阿拉伯糖。半纤维素含有大部分的D-戊糖糖类。在大多数情况下，木糖是以最大的量存在的糖单体，尽管在软木中甘露糖可以是最丰富的糖。木聚糖含有β-(1-4)-连接的木糖残基的主链。陆生植物的木聚糖是具有β-(1-4)-D-吡喃木糖主链的杂聚物，其通过短的碳水化合物链分支。他们包含D-葡糖醛酸或其4-O-甲基醚、L-阿拉伯糖、和/或不同的低聚糖，这些低聚糖由D-木糖、L-阿拉伯糖、D-或L-半乳糖、以及D-葡萄糖构成。可以将木聚糖类型的多糖分成同源木聚糖(homoxylan)和异源木聚糖(heteroxylan)，包括葡糖醛酸木聚糖、(阿拉伯糖)葡糖醛酸木聚糖、(葡糖醛酸)阿拉伯糖基木聚糖、阿拉伯糖基木聚糖、以及复杂的异源木聚糖。参见，例如，Ebringerova等人，2005，Adv.Polym.Sci.[聚合物科学进展]186:1-67。半纤维素材料在此也称为“含木聚糖的材料”。

半纤维素材料的来源基本上与在此描述的用于纤维素材料的那些来源相同。

在本发明的方法中，可以使用任何含有半纤维素的材料。在一个优选方面，该半纤维素材料是木素纤维素。

宿主细胞：术语“宿主细胞”意指易于用包含本发明的多核苷酸的核酸构建体或表达载体转化、转染、转导等的任何细胞类型。术语“宿主细胞”涵盖由于复制过程中发生的突变而与亲本细胞不同的亲本细胞的任何后代。

改进的特性：术语“改进的特性”意指与相对于亲本有所改进一种变体相关的特征。此类改进的性质包括但不限于：葡萄糖耐受性、催化效率、催化速率、化学稳定性、氧化稳定性、pH活性、pH稳定性、比活性、在贮存条件下的稳定性、底物结合、底物裂解、底物特异性、底物稳定性、表面性质、热活性、和热稳定性。具体地，改进的特性是改进的热活性和/或热稳定性。

增加的热活性：术语“增加的热活性”意指一种纤维二糖水解酶变体酶在特定温度下相对于亲本纤维二糖水解酶的温度依赖的活性曲线展示温度依赖的活性曲线的改变。热活性值提供了在一定温度范围内催化水解反应的酶效率的量度。纤维二糖水解酶具有特定的温度范围，其中蛋白质是稳定的并且保持其酶活性，但是随着温度增加而变得不太稳定并且因此活性有所降低。此外，由一种纤维二糖水解酶催化的初始反应速率可以通过增加温度来加速，这通过确定变体的热活性来测量。一种具有较大热活性的纤维二糖水解酶变体将引起水解速率的增加，减少所需的时间和/或降低水解所需的酶浓度。可替代地，具有减小的热活性的一种纤维二糖水解酶将在比由亲本的温度依赖活性曲线定义的亲本酶的最佳温度更低的温度下催化水解反应。

变体相对于亲本的增加的热活性可以通过测量含有变体酶或其亲本在不同温度下降解纤维素的纤维素酶混合物的活性来确定，如在WO 2011/057140的实例34至44中所述的。

增加的热稳定性：术语“增加的热稳定性”意指相对于亲本，在某一温度下孵育一段时期之后纤维二糖水解酶变体的纤维二糖水解酶活性的更高程度的保留。变体相对于亲本的增加的热稳定性可以例如在一个或多个(例如，若干个)温度的条件下进行评估。例如，该一个或多个(例如若干个)温度可以是45℃至95℃范围内的任何一个温度或多个温度，例如，45、50、55、60、65、70、75、80、85、或95℃(或在此之间，例如62℃、68℃、72℃等等)，在一个或多个(例如若干个)pH下，该一个或多个pH在3至9的范围内，例如3.0、3.5、4.0、4.5、5.0、5.5、6.0、6.5、7.0、7.5、8.0、8.5、或9.0(或在此之间)，进行合适时期(时间)的孵育，例如1分钟、5分钟、10分钟、15分钟、20分钟、25分钟、30分钟、45分钟、或60分钟(或在此之间，例如23分钟、37分钟，等等)，这样使得该变体保留残余活性。然而，也可以使用更长时期的孵育。术语“增加的热稳定性”能够与“改进的热稳定性”可互换地使用。

变体相对于亲本的增加的热稳定性可以通过差示扫描量热法(DSC)使用本领域中的标准方法来确定(参见，例如，Sturtevant，1987，Annual Review of PhysicalChemistry[物理化学年评]38:463-488)。变体相对于亲本的增加的热稳定性还可以使用蛋白质热解折叠分析来确定(参见，例如，在此的实例6)。变体相对于亲本的增加的热稳定性还可以使用本领域中已知的针对纤维二糖水解酶的任何酶测定以测量温度处理后的残余活性来确定。例如，如在WO 2011/153276中所述的，可以使用4-甲基伞形酮乳糖苷(MUL)测量残余的酶活性。

分离的：术语“分离的”意思指处于自然界中不存在的形式或环境中的一种物质。分离的物质的非限制性实例包括(1)任何非天然存在的物质，(2)包括但不限于任何酶、变体、核酸、蛋白质、肽或辅因子的任何物质，该物质至少部分地从与其本质相关的一种或多种或所有天然存在的成分中去除；(3)相对于天然发现的物质通过人工修饰的任何物质；或(4)通过相对于与其天然相关的其他组分增加物质的量而修饰的任何物质(例如，宿主细胞中的重组产生；编码该物质的基因的多个拷贝；以及使用比与编码该物质的基因天然相关的启动子更强的启动子)。

漆酶：术语“漆酶”意指催化以下反应的苯二醇：氧气氧化还原酶(E.C.1.10.3.2)：1,2-或1,4-苯二醇+O₂＝1,2-或1,4-苯并半醌+2H₂O。

可以通过由漆酶将丁香醛连氮(4,4′-连氮基双(甲基亚基)双(2,6-二甲氧基苯酚))氧化为对应的醌4,4′-偶氮双(甲基亚基)双(2,6-二甲氧基环已-2,5-二烯-1-酮)来确定漆酶活性。通过在530nm下吸光度的增加来检测所述反应(如下所示)。

在30℃，在具有19μM底物(丁香醛连氮)和1g/L聚乙二醇(PEG)6000的23mM MES(pH5.5)中进行该反应。将样品置于分光光度计中，并且在530nm下每15秒测量吸光度的变化，直至90秒。一个漆酶单位是在指定的分析条件下每分钟催化1微摩尔丁香醛连氮的转化的酶量。

接头：术语“接头”意指连接碳水化合物结合模块和催化结构域的氨基酸序列。在一个实施例中，接头具有SEQ ID NO:1的氨基酸444-488的序列。在一个实施例中，接头具有SEQ ID NO:2的氨基酸442-460的序列。在一个实施例中，接头具有SEQ ID NO:4的氨基酸443-468的序列。在一个实施例中，接头具有SEQ ID NO:5的氨基酸449-471的序列。在一个实施例中，接头具有SEQ ID NO:6的氨基酸448-468的序列。

成熟多肽：术语“成熟多肽”意指在翻译和任何翻译后修饰如N-末端加工、C-末端截短、糖基化作用、磷酸化作用等之后处于其最终形式的多肽。本领域内公知，宿主细胞可以产生由相同多核苷酸表达的两种或更多种不同的成熟多肽(即，具有不同的C-末端和/或N-末端氨基酸)的混合物。本领域还已知，不同的宿主细胞不同地加工多肽，并且因此一个表达多核苷酸的宿主细胞当与另一个表达相同多核苷酸的宿主细胞相比时可以产生一种不同的成熟多肽(例如，具有一个不同的C-末端和/或N-末端氨基酸)。

成熟多肽编码序列：术语“成熟多肽编码序列”意指编码具有纤维二糖水解酶活性的成熟多肽的多核苷酸。

突变体：术语“突变体”意指编码一种变体的多核苷酸。

核酸构建体：术语“核酸构建体”意指单-链或双-链的核酸分子，该核酸分子是从天然存在的基因中分离的，或以本来不存在于自然界中的方式被修饰成包含核酸的区段，或者其是合成的，该核酸分子包括一个或多个控制序列。

可操作地连接：术语“可操作地连接”意思指这样一种配置，在该配置中，一个控制序列被放置在相对于多核苷酸的编码序列适当的位置处，这样使得该控制序列引导该编码序列的表达。

亲本或亲本纤维二糖水解酶：术语“亲本”或“亲本纤维二糖水解酶”意指一种纤维二糖水解酶，在一个或多个(例如，若干个)位置对其进行改变，即，取代、插入和/或缺失，以产生本发明的酶的变体。所述亲本可以是天然存在的(野生型)多肽或其变体或片段。

过氧化物酶：术语“过氧化物酶”意指将过氧化物(例如，过氧化氢)转化为较少氧化的种类(例如，水)的酶。在此应该理解的是，过氧化物酶涵盖过氧化物分解酶。在此将术语“过氧化物分解酶”定义为供体：催化还原底物(2e-)+ROOR'→氧化底物+ROH+R'OH反应的过氧化物氧化还原酶(E.C.编号1.11.1.x，其中x＝1-3、5、7-19、或21)；例如催化苯酚+H₂O₂→醌+H₂O反应的辣根过氧化物酶，和催化H₂O₂+H₂O₂→O₂+2H₂O反应的过氧化氢酶。除过氧化氢之外，其他过氧化物也可以被这些酶分解。

在如以下所示的过氧化氢的存在下，可以通过测量由过氧化物酶氧化2,2’-连氮基-双(3-乙基苯噻唑啉-6-磺酸(ABTS)来确定过氧化物酶活性。反应产物ABTS_氧化形成了在418nm下可以量化的蓝-绿颜色。

H₂O₂+2ABTS_还原+2H+→2H₂O+2ABTS_氧化

在30℃处，在具有1.67mM底物(ABTS)、1.5g/L X-405、0.88mM过氧化氢、和大约0.040个单位的酶/ml的0.1M磷酸盐(pH 7)中进行所述反应。将样品置于分光光度计中，并且在418nm下从15秒直至60秒测量吸光度的变化。一个过氧化物酶单位可以表示为在指定的分析条件下每分钟催化1微摩尔过氧化氢所需要酶的量。

预处理的纤维素材料或半纤维素材料：该术语“预处理的纤维素材料或半纤维素材料”意指通过热处理和稀硫酸处理、碱预处理、中性预处理、或本领域已知的任何预处理从生物质得到的纤维素材料或半纤维素材料。

预处理的玉米秸杆：术语“预处理的玉米秸秆”或“PCS”意指通过热和稀硫酸处理、碱预处理、中性预处理、或本领域已知的任何预处理从玉米秸秆得到的纤维素材料。

序列同一性：两个氨基酸序列之间或两个核苷酸序列之间的相关性是通过参数“序列同一性”进行描述。

出于本发明的目的，使用如在EMBOSS软件包(EMBOSS：欧洲分子生物学开放软件包(EMBOSS:The European Molecular Biology Open Software Suite)，Rice等人,2000,Trends Genet.[遗传学趋势]16:276-277)(优选5.0.0版或更新版)的Needle程序中所实施的Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.[分子生物学杂志]48:443-453)确定两个氨基酸序列之间的序列同一性。使用的参数是空位开放罚分10、空位扩展罚分0.5以及EBLOSUM62(BLOSUM62的EMBOSS版本)取代矩阵。使用Needle标记的“最长同一性”的输出(使用-nobrief选项获得)作为同一性百分比并且计算如下：

(同一的残基×100)/(比对长度-比对中的空位总数)

出于本发明的目的，使用Needleman-Wunsch算法(Needleman和Wunsch，1970，见上文)来确定两个脱氧核苷酸序列之间的序列同一性，该算法如EMBOSS软件包(EMBOSS：欧洲分子生物学开放软件套件，Rice等人，2000，见上文)(优选5.0.0版或更新版本)的Needle程序所实施的。使用的参数是空位开放罚分10、空位扩展罚分0.5,以及EDNAFULL(NCBINUC4.4的EMBOSS版本)取代矩阵。使用Needle标记的“最长同一性”的输出(使用-nobrief选项获得)作为同一性百分比并且计算如下：

(同一的脱氧核糖核苷酸×100)/(比对长度-在比对中的空位总数)

子序列：术语“子序列”意指使一个或多个(例如，若干个)核苷酸从成熟多肽编码序列的5'端和/或3'端缺失的多核苷酸；其中该子序列编码具有纤维二糖水解酶活性的片段。

变体：术语“变体”意指具有纤维二糖水解酶活性的、包含改变(即，在一个或多个(例如，若干个)位置处的取代、插入、和/或缺失)的多肽。取代意指用不同的氨基酸替代占用某一位置的氨基酸；缺失意指去除占用某一位置的氨基酸；并且插入意指在邻接并且紧随占用某一位置的氨基酸之后添加氨基酸。本发明的这些变体具有SEQ ID NO:1的多肽的至少20％，例如，至少40％、至少50％、至少60％、至少70％、至少80％、至少90％、至少95％、或至少100％的纤维二糖水解酶活性。

野生型纤维二糖水解酶：术语“野生型”纤维二糖水解酶意指由见于自然界中的天然存在的微生物(例如细菌、酵母或丝状真菌)产生的纤维二糖水解酶。

包含木聚糖的材料：术语“包含木聚糖的材料”意指包含含有β-(1-4)-连接的木糖残基主链的植物细胞壁多糖的任何材料。陆生植物的木聚糖是具有β-(1-4)-D-吡喃木糖主链的杂聚物，其通过短的碳水化合物链分支。他们包含D-葡糖醛酸或其4-O-甲基醚、L-阿拉伯糖、和/或不同的低聚糖，这些低聚糖由D-木糖、L-阿拉伯糖、D-或L-半乳糖、以及D-葡萄糖构成。可以将木聚糖类型的多糖分成同源木聚糖(homoxylan)和异源木聚糖(heteroxylan)，包括葡糖醛酸木聚糖、(阿拉伯糖)葡糖醛酸木聚糖、(葡糖醛酸)阿拉伯糖基木聚糖、阿拉伯糖基木聚糖、以及复杂的异源木聚糖。参见，例如，Ebringerova等人，2005，Adv.Polym.Sci.[聚合物科学进展]186:1-67。

在本发明的方法中，可以使用包含木聚糖的任何材料。在一个优选方面，包含木聚糖的材料是木质纤维素。

木聚糖降解活性或木聚糖分解活性：术语“木聚糖降解活性”或“木聚糖分解活性”意指水解包含木聚糖的材料的生物活性。用于测量木聚糖分解活性的两种基本方法包括：(1)测量总木聚糖分解活性，和(2)测量单独的木聚糖分解活性(例如内切木聚糖酶、β-木糖苷酶、阿拉伯呋喃糖苷酶、α-葡糖醛酸糖苷酶、乙酰木聚糖酯酶、阿魏酸酯酶、以及α-葡糖醛酸酯酶)。木聚糖分解酶的测定的最近进展总结于若干出版物中，这些出版物包括Biely和Puchard，2006，Journal of the Science of Food and Agriculture[食品与农业科学杂志]86(11):1636-1647；Spanikova和Biely，2006，FEBS Letters[欧洲生化学会联合会快报]580(19):4597-4601；Herrmann等人，1997，Biochemical Journal[生物化学杂志]321:375-381。

可以通过确定由不同类型的木聚糖(包括例如燕麦木聚糖、山毛榉木材木聚糖、和落叶松木材木聚糖)形成的还原糖，或者通过光度确定从不同共价染色的木聚糖释放的染色的木聚糖片段来测量总木聚糖降解活性。常见的总木聚糖分解活性测定是基于由聚合4-O-甲基葡糖醛酸木聚糖产生还原糖，如描述于Bailey等人,1992,Interlaboratorytesting of methods for assay of xylanase activity[用于木聚糖酶活性测定的多个实验室测试方法],Journal of Biotechnology[生物技术杂志]23(3):257-270中。木聚糖酶活性还可以在37℃在0.01％X-100和200mM磷酸钠(pH 6)中用0.2％AZCL-阿拉伯糖基木聚糖作为底物来测定。一个单位的木聚糖酶活性定义为在37℃、pH 6，在200mM磷酸钠(pH 6)中从作为底物的0.2％AZCL-阿拉伯糖基木聚糖每分钟产生1.0微摩尔天青蛋白。

还可以通过测量在以下典型条件下由一种或多种木聚糖降解酶引起的桦木木聚糖(西格玛化学有限公司(Sigma Chemical Co.,Inc.))水解的增加来确定木聚糖降解活性：1ml反应，5mg/ml底物(总固形物)，5mg的木聚糖分解蛋白/g的底物，50mM的乙酸钠(pH5)，50℃，24小时，使用对羟基苯甲酸酰肼(PHBAH)测定法的糖分析，如Lever，1972，Anal.Biochem.[分析生物化学]47:273-279。

木聚糖酶：术语“木聚糖酶”意指1,4-β-D-木聚糖-木糖水解酶(E.C.3.2.1.8)，其催化木聚糖中的1,4-β-D-木糖苷键的内切水解。木聚糖酶活性可以在37℃处在0.01％X-100和200mM磷酸钠(pH 6)中用0.2％AZCL-阿拉伯糖基木聚糖作为底物来确定。一个单位的木聚糖酶活性定义为在37℃、pH 6，在200mM磷酸钠(pH 6)中从作为底物的0.2％AZCL-阿拉伯糖基木聚糖每分钟产生1.0微摩尔天青蛋白。

在此提及“约”一个数值或参数包括指向那个数值或参数本身的方面。例如，提及“约X”的描述包括方面“X”。

如在此和所附权利要求书中使用的，单数形式“一种/个”、“或”以及“该/所述”包括复数指示物，除非上下文以另外的方式清楚表明。应理解的是，在此描述的本发明的这些方面包括“由方面组成”和/或“基本由方面组成”。

除非另外定义或由背景清楚指示，否则本文中所用的全部技术与科学术语具有如本发明所属领域的普通技术人员通常理解的相同含义。

变体命名规则

出于本发明的目的，使用SEQ ID NO:1的纤维二糖水解酶来确定另一种纤维二糖水解酶中的相应的氨基酸残基。将另一种纤维二糖水解酶的氨基酸序列与SEQ ID NO:1的纤维二糖水解酶进行比对，并且基于所述比对，使用如在EMBOSS包(EMBOSS：欧洲分子生物学开放软件套件，Rice等人，2000，Trends Genet.[遗传学趋势]16:276-277)(优选地5.0.0版或更新版本)的Needle程序中所实施的Needleman-Wunsch算法(Needleman和Wunsch，1970，J.Mol.Biol.[分子生物学杂志]48:443-453)来确定与SEQ ID NO:1的多肽中的任何氨基酸残基相对应的氨基酸位置编号。使用的参数是空位开放罚分10、空位扩展罚分0.5以及EBLOSUM62(BLOSUM62的EMBOSS版本)取代矩阵。

可以通过使用若干计算机程序，使用其对应默认参数比对多个多肽序列来确定在另一种纤维二糖水解酶中的对应氨基酸残基的鉴定，这些计算机程序包括但不限于MUSCLE(通过对数预期的多序列比较；版本3.5或更新版本；Edgar，2004，Nucleic Acids Research[核酸研究]32:1792-1797)；MAFFT(版本6.857或更新版本；Katoh和Kuma，2002，NucleicAcids Research[核酸研究]30:3059-3066；Katoh等人，2005，Nucleic Acids Research[核酸研究]33:511-518；Katoh和Toh，2007，Bioinformatics[生物信息学]23:372-374；Katoh等人，2009，Methods in Molecular Biology[分子生物学方法]537:39-64；Katoh和Toh，2010，Bioinformatics[生物信息学]26:1899-1900)，以及采用ClustalW(1.83或更新版本；Thompson等人，1994，Nucleic Acids Research[核酸研究]22:4673-4680)的EMBOSS EMMA。

当另一种纤维二糖水解酶与SEQ ID NO:1的纤维二糖水解酶相背离这样使得传统的基于序列的比较方法不能检测其关系时(Lindahl和Elofsson，2000，J.Mol.Biol.[分子生物学杂志]295:613-615)，可使用其他成对序列比较算法。在基于序列的搜索中较高的敏感度可使用搜索程序来获得，这些搜索程序采用多肽家族的概率表现(谱)来搜索数据库。例如，PSI-BLAST程序通过迭代数据库搜索过程来产生多个谱，并且能够检测远距离同源物(Atschul等人,1997,Nucleic Acids Res.[核酸研究]25:3389-3402)。如果多肽的家族或超家族具有在蛋白结构数据库中的一个或多个代表，甚至可以实现更高的敏感度。程序如GenTHREADER(Jones,1999,J.Mol.Biol.[分子生物学杂志]287:797-815；McGuffin和Jones,2003,Bioinformatics[生物信息学]19:874-881)利用来自多种来源(PSI-BLAST、二级结构预测、结构比对谱和溶剂化势)的信息作为预测查询序列的结构折叠的神经网络的输入。类似地，Gough等人，2000，J.Mol.Biol.[分子生物学杂志]313:903-919的方法可以用于比对未知结构的序列与存在于SCOP数据库中的超家族模型。这些比对进而可以用于产生多肽的同源性模型，并且使用出于该目的而开发的多种工具可以评估此类模型的准确度。对于已知结构的蛋白质，若干工具和资源可用于检索并产生结构比对。例如，蛋白质的SCOP超家族已经在结构上进行比对，并且那些比对是可访问且可下载的。可以使用多种算法如距离比对矩阵(Holm和Sander,1998,Proteins[蛋白质]33:88-96)或组合延伸(Shindyalov和Bourne,1998,Protein Engineering[蛋白质工程]11:739-747)比对两种或更多种蛋白质结构，并且这些算法的实施可以另外用于查询具有感兴趣结构的结构数据库，以便发现可能的结构同源物(例如，Holm和Park,2000,Bioinformatics[生物信息学]16:566-567)。

在描述本发明的变体中，以下所述的命名法适于引用方便。采用了已接受的IUPAC单个字母和三字母的氨基酸缩写。

取代。对于氨基酸取代，使用以下命名法：原始氨基酸、位置、被取代的氨基酸。因此，在位置226处的苏氨酸被丙氨酸取代表示为“Thr226Ala”或者“T226A”。多个突变由加号(“+”)分开，例如“Gly205Arg+Ser411Phe”或“G205R+S411F”表示在位置205和位置411处的甘氨酸(G)和丝氨酸(S)分别被精氨酸(R)和苯丙氨酸(F)取代。

缺失。对于氨基酸缺失，使用以下命名法：原始氨基酸、位置、*。因此，将在位置195处的甘氨酸的缺失表示为“Gly195*”或“G195*”。多个缺失由加号(“+”)分开，例如，“Gly195*+Ser411*”或“G195*+S411*”。

插入。对于氨基酸插入，使用以下命名法：原始氨基酸、位置、原始氨基酸、插入的氨基酸。因此，将在位置195处的甘氨酸之后插入赖氨酸表示为“Gly195GlyLys”或“G195GK”。将多个氨基酸的插入表示为[原始氨基酸、位置、原始氨基酸、插入氨基酸#1、插入氨基酸#2等]。例如，在位置195处的甘氨酸之后插入赖氨酸和丙氨酸被表示为“Gly195GlyLysAla”或“G195GKA”。

在此类情况下，通过将小写字母添加至在所插入的氨基酸残基之前的氨基酸残基的位置编号中来对所插入的氨基酸残基进行编号。在以上实例中，该序列因此将是：

<u>亲本：</u>	<u>变体：</u>
		195	195 195a 195b
G	G-K-A

多种改变。包含多种改变的变体由加号(“+”)分开，例如“Arg170Tyr+Gly195Glu”或“R170Y+G195E”表示在位置170和位置195处的精氨酸和甘氨酸分别被酪氨酸和谷氨酸取代。

不同改变。在可以在某一位置引入不同的改变的情况下，所述不同的改变由逗号分开，例如“Arg170Tyr,Glu”表示在位置170处的精氨酸被酪氨酸或谷氨酸取代。因此，“Tyr167Gly,Ala+Arg170Gly,Ala”表示以下变体：

“Tyr167Gly+Arg170Gly”、“Tyr167Gly+Arg170Ala”、“Tyr167Ala+Arg170Gly”以及“Tyr167Ala+Arg170Ala”。

具体实施方式

变体

在一个实施例中，该变体与亲本纤维二糖水解酶或其成熟多肽的氨基酸序列具有至少60％，例如至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或至少99％，但小于100％的序列同一性。

在另一个实施例中，该变体包含一个催化结构域，该催化结构域与亲本纤维二糖水解酶的催化结构域具有至少60％，例如，至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或至少99％，但小于100％的序列同一性。

在另一个实施例中，该变体与SEQ ID NO:1的多肽具有至少60％，例如，至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或至少99％，但小于100％的序列同一性。

在另一个实施例中，该变体与SEQ ID NO:2的多肽具有至少60％，例如，至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或至少99％，但小于100％的序列同一性。

在另一个实施例中，该变体与SEQ ID NO:3的多肽具有至少60％，例如，至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或至少99％，但小于100％的序列同一性。

在另一个实施例中，该变体与SEQ ID NO:4的多肽具有至少60％，例如，至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或至少99％，但小于100％的序列同一性。

在另一个实施例中，该变体与SEQ ID NO:5的多肽具有至少60％，例如，至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或至少99％，但小于100％的序列同一性。

在另一个实施例中，该变体与SEQ ID NO:6的多肽具有至少60％，例如，至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或至少99％，但小于100％的序列同一性。

在一方面，本发明的变体中的改变的数目是1-23个，例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、或23个改变。

在另一方面，该变体包括与SEQ ID NO:1的位置8、17、113、157、159、184、199、240、250、274、318、325、328、347、349、358、360、380、391、393、394、412以及430相对应的一个或多个(例如，若干个)位置处的取代。在另一方面，变体在对应于任意位置8、17、113、157、159、184、199、240、250、274、318、325、328、347、349、358、360、380、391、393、394、412以及430中的两个位置处包括取代。在另一方面，变体在对应于任意位置8、17、113、157、159、184、199、240、250、274、318、325、328、347、349、358、360、380、391、393、394、412以及430中的三个位置处包括取代。在另一方面，变体在对应于任意位置8、17、113、157、159、184、199、240、250、274、318、325、328、347、349、358、360、380、391、393、394、412以及430中的四个位置处包括取代。在另一方面，变体在对应于任意位置8、17、113、157、159、184、199、240、250、274、318、325、328、347、349、358、360、380、391、393、394、412以及430中的五个位置处包括取代。在另一方面，变体在对应于任意位置8、17、113、157、159、184、199、240、250、274、318、325、328、347、349、358、360、380、391、393、394、412以及430中的六个位置处包括取代。在另一方面，变体在对应于任意位置8、17、113、157、159、184、199、240、250、274、318、325、328、347、349、358、360、380、391、393、394、412以及430中的七个位置处包括取代。在另一方面，变体在对应于任意位置8、17、113、157、159、184、199、240、250、274、318、325、328、347、349、358、360、380、391、393、394、412以及430中的八个位置处包括取代。在另一方面，变体在对应于任意位置8、17、113、157、159、184、199、240、250、274、318、325、328、347、349、358、360、380、391、393、394、412以及430中的九个位置处包括取代。在另一方面，变体在对应于任意位置8、17、113、157、159、184、199、240、250、274、318、325、328、347、349、358、360、380、391、393、394、412以及430中的十个位置处包括取代。在另一方面，变体在对应于任意位置8、17、113、157、159、184、199、240、250、274、318、325、328、347、349、358、360、380、391、393、394、412以及430中的十一个位置处包括取代。在另一方面，变体在对应于任意位置8、17、113、157、159、184、199、240、250、274、318、325、328、347、349、358、360、380、391、393、394、412以及430中的十二个位置处包括取代。在另一方面，变体在对应于任意位置8、17、113、157、159、184、199、240、250、274、318、325、328、347、349、358、360、380、391、393、394、412以及430中的十三个位置处包括取代。在另一方面，变体在对应于任意位置8、17、113、157、159、184、199、240、250、274、318、325、328、347、349、358、360、380、391、393、394、412以及430中的十四个位置处包括取代。在另一方面，变体在对应于任意位置8、17、113、157、159、184、199、240、250、274、318、325、328、347、349、358、360、380、391、393、394、412以及430中的十五个位置处包括取代。在另一方面，变体在对应于任意位置8、17、113、157、159、184、199、240、250、274、318、325、328、347、349、358、360、380、391、393、394、412以及430中的十六个位置处包括取代。在另一方面，变体在对应于任意位置8、17、113、157、159、184、199、240、250、274、318、325、328、347、349、358、360、380、391、393、394、412以及430中的十七个位置处包括取代。在另一方面，变体在对应于任意位置8、17、113、157、159、184、199、240、250、274、318、325、328、347、349、358、360、380、391、393、394、412以及430中的十八个位置处包括取代。在另一方面，变体在对应于任意位置8、17、113、157、159、184、199、240、250、274、318、325、328、347、349、358、360、380、391、393、394、412以及430中的十九个位置处包括取代。在另一方面，变体在对应于任意位置8、17、113、157、159、184、199、240、250、274、318、325、328、347、349、358、360、380、391、393、394、412以及430中的二十个位置处包括取代。在另一方面，变体在对应于任意位置8、17、113、157、159、184、199、240、250、274、318、325、328、347、349、358、360、380、391、393、394、412以及430中的二十一个位置处包括取代。在另一方面，变体在对应于任意位置8、17、113、157、159、184、199、240、250、274、318、325、328、347、349、358、360、380、391、393、394、412以及430中的二十二个位置处包括取代。在另一方面，变体在对应于位置8、17、113、157、159、184、199、240、250、274、318、325、328、347、349、358、360、380、391、393、394、412以及430中的每个位置处包括取代。

在另一方面，该变体在对应于SEQ ID NO:1的位置8的位置处包括取代或由其组成。在另一方面，在对应于位置8的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Trp、Tyr、或Val，例如Ala或Pro取代。在另一方面，该变体在对应于SEQ ID NO:1(例如T8A,P)的位置8的位置处包括Thr→Ala或Pro的取代或由其组成。

在另一方面，该变体在对应于SEQ ID NO:1的位置17的位置处包括取代或由其组成。在另一方面，在对应于位置17的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Thr、Trp、Tyr、或Val，例如Gln取代。在另一方面，该变体在对应于SEQ ID NO:1(例如S17Q)的位置17的位置处包括Ser→Gln的取代或由其组成。

在另一方面，该变体在对应于SEQ ID NO:1的位置113的位置处包括取代或由其组成。在另一方面，在对应于位置113的位置处的氨基酸被Ala、Arg、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val，例如Asp取代。在另一方面，该变体在对应于SEQ ID NO:1(例如N113D)的位置113的位置处包括Asn→Asp的取代或由其组成。

在另一方面，该变体在对应于SEQ ID NO:1的位置157的位置处包括取代或由其组成。在另一方面，在与位置157相对应的位置上的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或者Val，例如Arg取代。在另一方面，该变体在对应于SEQ ID NO:1(例如K157R)的位置157的位置处包括Lys→Arg的取代或由其组成。

在另一方面，该变体在对应于SEQ ID NO:1的位置159的位置处包括取代或由其组成。在另一方面，在对应于位置159的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Thr、Trp、Tyr、或Val，例如Pro取代。在另一方面，该变体在对应于SEQ ID NO:1(例如S159P)的位置159的位置处包括Ser→Pro的取代或由其组成。

在另一方面，该变体在对应于SEQ ID NO:1的位置184的位置处包括取代或由其组成。在另一方面，在对应于位置184的位置处的氨基酸被Ala、Arg、Asn、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val，例如Asn取代。在另一方面，该变体在对应于SEQ ID NO:1(例如D184N)的位置184的位置处包括Asp→Asn的取代或由其组成。

在另一方面，该变体在对应于SEQ ID NO:1的位置199的位置处包括取代或由其组成。在另一方面，在对应于位置199的一个位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、或Tyr，例如Pro取代。在另一方面，该变体在对应于SEQ ID NO:1(例如V199P)的位置199的位置处包括Val→Pro的取代或由其组成。

在另一方面，该变体在对应于SEQ ID NO:1的位置240的位置处包括取代或由其组成。在另一方面，在对应于位置240的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val，例如Gly取代。在另一方面，该变体在对应于SEQ ID NO:1(例如E240G)的位置240的位置处包括Glu→Gly的取代或由其组成。

在另一方面，该变体在对应于SEQ ID NO:1的位置250的位置处包括取代或由其组成。在另一方面，在对应于位置250的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Thr、Trp、Tyr、或Val，例如Asp取代。在另一方面，该变体在对应于SEQ ID NO:1(例如S250D)的位置250的位置处包括Ser→Asp的取代或由其组成。

在另一方面，该变体在对应于SEQ ID NO:1的位置274的位置处包括取代或由其组成。在另一方面，在对应于位置274的一个位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Pro、Ser、Thr、Trp、Tyr或Val，例如Tyr取代。在另一方面，该变体在对应于SEQ ID NO:1(例如F274Y)的位置274的位置处包括Phe→Tyr的取代或由其组成。

在另一方面，该变体在对应于SEQ ID NO:1的位置318的位置处包括取代或由其组成。在另一方面，在对应于位置318的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val，例如Ala、Pro或Ser取代。在另一方面，该变体在对应于SEQ ID NO:1(例如G318A,P,S)的位置318的位置处包括Gly、→Ala、Pro或Ser的取代或由其组成。

在另一方面，该变体在对应于SEQ ID NO:1的位置325的位置处包括取代或由其组成。在另一方面，在对应于位置325的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Trp、Tyr、或Val，例如Pro取代。在另一方面，该变体在对应于SEQ ID NO:1(例如T325P)的位置325的位置处包括Thr→Pro的取代或由其组成。

在另一方面，该变体在对应于SEQ ID NO:1的位置328的位置处包括取代或由其组成。在另一方面，在对应于位置328的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Trp、Tyr、或Val，例如Pro取代。在另一方面，该变体在对应于SEQ ID NO:1(例如T328P)的位置328的位置处包括Thr→Pro的取代或由其组成。

在另一方面，该变体在对应于SEQ ID NO:1的位置347的位置处包括取代或由其组成。在另一方面，在对应于位置347的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Trp、Tyr、或Val，例如Pro取代。在另一方面，该变体在对应于SEQ ID NO:1(例如T347P)的位置347的位置处包括Thr→Pro的取代或由其组成。

在另一方面，该变体在对应于SEQ ID NO:1的位置349的位置处包括取代或由其组成。在另一方面，在对应于位置349的位置处的氨基酸被Ala、Arg、Asn、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val，例如Val取代。在另一方面，该变体在对应于SEQ ID NO:1(例如D349V)的位置349的位置处包括Asp→Val的取代或由其组成。

在另一方面，该变体在对应于SEQ ID NO:1的位置358的位置处包括取代或由其组成。在另一方面，在对应于位置358的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val，例如Ala取代。在另一方面，该变体在对应于SEQ ID NO:1(例如G358A)的位置358的位置处包括Gly→Ala的取代或由其组成。

在另一方面，该变体在对应于SEQ ID NO:1的位置360的位置处包括取代或由其组成。在另一方面，在对应于位置360的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val，例如Ser或Thr取代。在另一方面，该变体在对应于SEQ ID NO:1(例如G360S,T)的位置360的位置处包括Gly→Ser或Thr的取代或由其组成。

在另一方面，该变体在对应于SEQ ID NO:1的位置380的位置处包括取代或由其组成。在另一方面，在对应于位置380的位置处的氨基酸被Ala、Arg、Asn、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val，例如Asn取代。在另一方面，该变体在对应于SEQ ID NO:1(例如D380N)的位置380的位置处包括Asp→Asn的取代或由其组成。

在另一方面，该变体在对应于SEQ ID NO:1的位置391的位置处包括取代或由其组成。在另一方面，在对应于位置391的位置处的氨基酸被Ala、Arg、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val，例如Asp取代。在另一方面，该变体在对应于SEQ ID NO:1(例如N391D)的位置391的位置处包括Asn→Asp的取代或由其组成。

在另一方面，该变体在对应于SEQ ID NO:1的位置393的位置处包括取代或由其组成。在另一方面，在对应于位置393的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Thr、Trp、Tyr、或Val，例如Asp取代。在另一方面，该变体在对应于SEQ ID NO:1(例如S393D)的位置393的位置处包括Ser→Asp的取代或由其组成。

在另一方面，该变体在对应于SEQ ID NO:1的位置394的位置处包括取代或由其组成。在另一方面，在对应于位置394的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Thr、Trp、Tyr、或Val，例如Pro取代。在另一方面，该变体在对应于SEQ ID NO:1(例如S394P)的位置394的位置处包括Ser→Pro的取代或由其组成。

在另一方面，该变体在对应于SEQ ID NO:1的位置412的位置处包括取代或由其组成。在另一方面，在对应于位置412的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Trp、Tyr、或Val，例如Ala取代。在另一方面，该变体在对应于SEQ ID NO:1(例如T412A)的位置412的位置处包括Thr→Ala的取代或由其组成。

在另一方面，该变体在对应于SEQ ID NO:1的位置430的位置处包括取代或由其组成。在另一方面，在对应于位置430的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Trp、Tyr、或Val，例如Val取代。在另一方面，该变体在对应于SEQ ID NO:1(例如T430V)的位置430的位置处包括Thr→Val的取代或由其组成。

在另一方面，该变体包含在其他纤维二糖水解酶中的SEQ ID NO:1相对应的位置处的一个或多个(例如，若干个)选自下组的取代，或由这些取代组成，该组由以下组成：T8A,P；S17Q；N113D；K157R；S159P；D184N；V199P；E240G；S250D；F274Y；G318A,P,S；T325P；T328P；T347P；D349V；G358A；G360S,T；D380N；N391D；S393D；S394P；T412A；以及T430V。

在以下各方面中，该变体包含在其他纤维二糖水解酶，例如SEQ ID NOs:2-6中的SEQ ID NO:1相对应的位置处的一个或多个(例如，若干个)以下所描述的取代或由这些取代组成。

在另一方面，该变体包含SEQ ID NO:1的取代S393D+S394P，或由其组成。在另一方面，该变体包含SEQ ID NO:1的取代N391D+S393D+S394P，或由其组成。在另一方面，该变体包含SEQ ID NO:1的取代T347P+D349V+N391D+S393D+S394P，或由其组成。在另一方面，该变体包含SEQ ID NO:1的取代D349V+F274Y+N391D+S393D+S394P，或由其组成。在另一方面，该变体包含SEQ ID NO:1的取代V199P+E240G+F274Y+T347P+D349V，或由其组成。1.在另一方面，该变体包含SEQ ID NO:1的取代V199P+E240G+F274Y+G318P+T347P+D349V，或由其组成。在另一方面，该变体包含SEQ ID NO:1的取代V199P+E240G+F274Y+T325P+T347P+D349V，或由其组成。在另一方面，该变体包含SEQ ID NO:1的取代V199P+E240G+F274Y+G318P+T347P+D349V+N391D+S393D+S394P，或由其组成。在另一方面，该变体包含SEQ ID NO:1的取代V199P+E240G+F274Y+G318P+T347P+D349V+N391D+S393D+S394P+Y493W，或由其组成。

这些变体可以进一步在一个或多个(例如，若干个)其他位置处包括一个或多个另外的改变，例如，取代、插入或缺失。

这些氨基酸改变可以具有微小性质，即，不会显著地影响蛋白的折叠和/或活性的保守氨基酸取代或插入；典型地为1-30个氨基酸的小缺失；小的氨基或羧基-末端延伸，如氨基末端的甲硫氨酸残基；多至20-25个残基的小接头肽；或小的延伸，其通过改变净电荷或另一功能(例如聚组氨酸段、抗原表位或结合结构域)来促进纯化。

保守取代的实例是在下组之内：碱性氨基酸(精氨酸、赖氨酸及组氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、极性氨基酸(谷氨酰胺和天冬酰胺)、疏水性氨基酸(亮氨酸、异亮氨酸及缬氨酸)、芳香族氨基酸(苯丙氨酸、色氨酸及酪氨酸)及小氨基酸(甘氨酸、丙氨酸、丝氨酸、苏氨酸及甲硫氨酸)。一般不会改变比活性的氨基酸取代是本领域已知的并且例如由H.Neurath和R.L.Hill，1979，于The Proteins[蛋白质]，学术出版社(Academic Press)，纽约中描述。常见取代为Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly。

可替代地，这些氨基酸改变具有这样一种性质使得多肽的物理化学性质发生改变。例如，氨基酸改变可以提高多肽的热稳定性、改变底物特异性、改变最适pH等。

可以根据本领域中已知的程序，如定点诱变或丙氨酸扫描诱变(Cunningham和Wells,1989,Science[科学]244:1081-1085)来鉴定多肽中的必需氨基酸。在后一种技术中，在分子中的每个残基处引入单一丙氨酸突变，并且测试所得突变分子的纤维二糖水解酶活性以鉴定对该分子的活性至关重要的氨基酸残基。还参见，Hilton等人，1996，J.Biol.Chem.[生物化学杂志]271:4699-4708。酶或其他生物学相互作用的活性位点还可以通过对结构的物理分析来确定，如通过这样的技术确定：如核磁共振、晶体学、电子衍射或光亲和标记，连同对推定的接触位点氨基酸进行突变。参见，例如，de Vos等人，1992，Science[科学]255:306-312；Smith等人，1992，J.Mol.Biol.[分子生物学杂志]224:899-904；Wlodaver等人，1992，FEBS Lett.[欧洲生物化学学会联盟通讯]309:59-64。还可以从与相关多肽的比对来推断必需氨基酸的身份。

可以使用公开的Cel7A纤维二糖水解酶家族的三维结构数据来确定另外的有关在此的变体的结构-活性关系的指导(例如，参见，Moroz等人，2015，Acta Cryst.[晶体学报]F71:114-120)。

在一方面，该变体进一步包括与SEQ ID NO:1的位置4、21、26、38、39、44、45、46、51、52、53、54、72、75、87、93、94、95、100、102、108、111、114、129、130、131、137、138、139、144、150、156、157、183、184、187、194、195、196、197、198、199、200、201、205、206、209、211、219、237、241、247、253、260、264、271、280、320、322、330、332、343、345、350、357、358、360、365、371、375、379、380、381、382、385、386、389、390、392、397、400、405、407、413、426、427、430、440、444、445、446、447、450、453、455、456、458、459、462、463、464、492、493、494、496、497、498、502、503、507、510、513、515、516以及517相对应的一个或多个(例如，若干个)位置处的改变，例如，G4C、A21P、S26A、W38A、R39L、T44I、T44M、T44N、T44K、S45D、S45N、G46A、G46I、G46L、G46T、Y51I、T52R、T52W、G53A、G53M、G53R、G53W、N54S、N54I、N54D、A72C、G75S、S87T、L93V、N94S、N94A、N94R、N94Q、F95L、F95Y、S100T、S100V、S100W、S100L、S100G、K102S、K102R、L108I、L111T、D114E、F129S、D130N、D130E、V131A、P137S、C138S、G139E、G139M、G139Q、G139S、G139R、L144A、L144V、D150N、A156G、K157R、I183N、D184S、A187L、P194*、P194Q、S195*、T196*、N197A、N197*、D198A、D198*、V199*、N200A、N200G、N200W、N200F、N200C、N200*、S201*、N205R、H206Y、C209S、A211T、N219S、M237T、D241L、D241R、D241V、Y247C、A253D、A253R、G260D、N264Y、T271I、V280I、P320A、S322V、N330D、I332F、A343V、G345D、F350L、A357S、G358R、G360M、D365S、M371V、D375A、D375G、A379T、D380H、D380Y、M381V、L382A、D385E、S386C、S386E、P389L、P389Q、P389I、T390A、T390S、T390A、A392G、A392I、A392L、P397A、P397G、P397K、P397W、P397C、P397L、K400A、D405P、S407G、T413P、S426F、N427D、T430Y、T440L、T440R、T440G、T444S、T445D、S446T、S447L、T450D、S453D、T455A、T456S、S458E、K459E、K459S、S462I、T463I、T464A、T464A、H492L、Y493S、Y493W、A494D、A494S、C496S、C496Y、G497C、G498D、G498S、T502N、G503D、C507Y、P510V、P510S、C513R、C513W、K515D、Q516P、以及N517D。

这些变体可以由400至525个，例如400至500个、425至490个、450至480个、460至485个氨基酸组成。

在一个实施例中，该变体进一步包括接头，例如外源接头(来自不同亲本的接头)。

在一个实施例中，该变体进一步包括碳水化合物结合模块，例如外源碳水化合物结合模块(来自不同亲本的碳水化合物结合模块)。

在一个实施例中，与亲本酶相比，该变体具有增加的热活性。

在一个实施例中，与亲本酶相比，该变体具有增加的热稳定性。

亲本纤维二糖水解酶

该亲本纤维二糖水解酶可以是任何纤维二糖水解酶I。

在一个实施例中，该亲本纤维二糖水解酶可以是一种与SEQ ID NO:1的多肽具有至少60％序列同一性的多肽或者是SEQ ID NO:1的多肽的片段，其具有纤维二糖水解酶活性。在一方面，该亲本与SEQ ID NO:1的多肽具有至少60％，例如至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％、或100％的序列同一性，该多肽具有纤维二糖水解酶活性。在另一方面，该亲本的氨基酸序列与SEQ ID NO:1的多肽相差多达10个氨基酸，例如，1、2、3、4、5、6、7、8、9或10个。

在另一个实施例中，该亲本纤维二糖水解酶可以是一种与SEQ ID NO:2的多肽具有至少60％序列同一性的多肽或者是SEQ ID NO:2的多肽的片段，其具有纤维二糖水解酶活性。在一方面，该亲本与SEQ ID NO:2的多肽具有至少60％，例如至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％、或100％的序列同一性，该多肽具有纤维二糖水解酶活性。在另一方面，该亲本的氨基酸序列与SEQ ID NO:2的多肽相差多达10个氨基酸，例如，1、2、3、4、5、6、7、8、9或10个。

在另一个实施例中，该亲本纤维二糖水解酶可以是一种与SEQ ID NO:3的多肽具有至少60％序列同一性的多肽或者是SEQ ID NO:3的多肽的片段，其具有纤维二糖水解酶活性。在一方面，该亲本与SEQ ID NO:3的多肽具有至少60％，例如至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％、或100％的序列同一性，该多肽具有纤维二糖水解酶活性。在另一方面，该亲本的氨基酸序列与SEQ ID NO:3的多肽相差多达10个氨基酸，例如，1、2、3、4、5、6、7、8、9或10个。

在另一个实施例中，该亲本纤维二糖水解酶可以是一种与SEQ ID NO:4的多肽具有至少60％序列同一性的多肽或者是SEQ ID NO:4的多肽的片段，其具有纤维二糖水解酶活性。在一方面，该亲本与SEQ ID NO:4的多肽具有至少60％，例如至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％、或100％的序列同一性，该多肽具有纤维二糖水解酶活性。在另一方面，该亲本的氨基酸序列与SEQ ID NO:4的多肽相差多达10个氨基酸，例如，1、2、3、4、5、6、7、8、9、或10个。

在另一个实施例中，该亲本纤维二糖水解酶可以是一种与SEQ ID NO:5的多肽具有至少60％序列同一性的多肽或者是SEQ ID NO:5的多肽的片段，其具有纤维二糖水解酶活性。在一方面，该亲本与SEQ ID NO:5的多肽具有至少60％，例如至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％、或100％的序列同一性，该多肽具有纤维二糖水解酶活性。在另一方面，该亲本的氨基酸序列与SEQ ID NO:5的多肽相差多达10个氨基酸，例如，1、2、3、4、5、6、7、8、9、或10个。

在另一个实施例中，该亲本纤维二糖水解酶可以是一种与SEQ ID NO:6的多肽具有至少60％序列同一性的多肽或者是SEQ ID NO:6的多肽的片段，其具有纤维二糖水解酶活性。在一方面，该亲本与SEQ ID NO:6的多肽具有至少60％，例如至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％、或100％的序列同一性，该多肽具有纤维二糖水解酶活性。在另一方面，该亲本的氨基酸序列与SEQ ID NO:6的多肽相差多达10个氨基酸，例如，1、2、3、4、5、6、7、8、9、或10个。

在另一方面，该亲本包括SEQ ID NO:1的氨基酸序列或者由其组成。在另一方面，该亲本包括具有SEQ ID NO:1的氨基酸1至443的催化结构域。

在另一方面，该亲本包括SEQ ID NO:2的氨基酸序列或者由其组成。在另一方面，该亲本包括具有SEQ ID NO:2的氨基酸1至441的催化结构域。

在另一方面，该亲本包括SEQ ID NO:3的氨基酸序列或者由其组成。

在另一方面，该亲本包括SEQ ID NO:4的氨基酸序列或由其组成。在另一方面，该亲本包括具有SEQ ID NO:4的氨基酸1至442的催化结构域。

在另一方面，该亲本包括SEQ ID NO:5的氨基酸序列或者由其组成。在另一方面，该亲本包括具有SEQ ID NO:5的氨基酸1至448的催化结构域。

在另一方面，该亲本包括SEQ ID NO:6的氨基酸序列或者由其组成。在另一方面，该亲本包括具有SEQ ID NO:6的氨基酸1至447的催化结构域。

在另一个方面中,该亲本是SEQ ID NO:1的多肽的一个片段，该片段含有至少430个氨基酸残基，例如至少455个氨基酸残基或至少480个氨基酸残基。

在另一个方面中，该亲本是SEQ ID NO:2的多肽的一个片段，该片段含有至少420个氨基酸残基，例如至少450个氨基酸残基或至少470个氨基酸残基。

在另一个方面中，该亲本是SEQ ID NO:3的多肽的一个片段，该片段含有至少375个氨基酸残基，例如至少400个氨基酸残基或至少420个氨基酸残基。

在另一个方面中,该亲本是SEQ ID NO:4的多肽的一个片段，该片段含有至少370个氨基酸残基，例如至少390个氨基酸残基或至少415个氨基酸残基。

在另一个方面中,该亲本是SEQ ID NO:5的多肽的一个片段，该片段含有至少370个氨基酸残基，例如至少390个氨基酸残基或至少415个氨基酸残基。

在另一个方面中,该亲本是SEQ ID NO:6的多肽的一个片段，该片段含有至少370个氨基酸残基，例如至少390个氨基酸残基或至少415个氨基酸残基。

可以使用编码SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ IDNO:5、或SEQ ID NO:6的多肽的多核苷酸或其子序列，来设计核酸探针以便根据本领域熟知的方法鉴定并克隆编码来自不同属或物种的菌株的亲本的DNA。具体地，可以遵循标准DNA印迹程序，使用此类探针来与感兴趣的细胞的基因组DNA或cDNA杂交，以便鉴定和分离其中的相应基因。此类探针可明显短于完整序列，但是长度应为至少15，例如至少25、至少35、或至少70个核苷酸。优选地，该核酸探针长度为至少100个核苷酸，例如长度为至少200个核苷酸、至少300个核苷酸、至少400个核苷酸、至少500个核苷酸、至少600个核苷酸、至少700个核苷酸、至少800个核苷酸、或至少900个核苷酸。DNA和RNA探针两者都可使用。典型地将探针进行标记(例如，用³²P、³H、³⁵S、生物素、或抗生物素蛋白)，用于检测相应的基因。这类探针涵盖于本发明中。

可以针对与上文所述的探针杂交并编码亲本的DNA来筛选由这类其他菌株制备的基因组DNA或cDNA文库。来自这类其他菌株的基因组DNA或其他DNA可以通过琼脂糖或聚丙烯酰胺凝胶电泳，或其他分离技术来分离。可以将来自文库的DNA或分离的DNA转移至硝化纤维素(nitrocellulose)或其他适合的载体材料并且固定于其上。

在另一个实施例中，该亲本是SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ IDNO:4、SEQ ID NO:5、或SEQ ID NO:6的多肽的等位基因变体。

该多肽可以是一种杂交多肽，其中一个多肽的一个区域融合在另一个多肽的一个区域的N-末端或C-末端。

该亲本可以是一种融合多肽或可切割的融合多肽，其中另一多肽融合在本发明的多肽的N-末端或C-末端。融合多肽通过将编码另一种多肽的多核苷酸与本发明的多核苷酸融合而产生。用于产生融合多肽的技术在本领域是已知的，并且包括连接编码多肽的编码序列，这样使得它们在框内并且使得融合多肽的表达处于一个或多个相同启动子和终止子的控制下。还可以使用内含肽技术构建融合多肽，其中在翻译后产生融合多肽(Cooper等人，1993，EMBO J.[欧洲分子生物学学会杂志]12:2575-2583；Dawson等人，1994，Science[科学]266:776-779)。

融合多肽可进一步包含两种多肽之间的切割位点。在融合蛋白分泌之时，该位点被切割而释放这两个多肽。切割位点的实例包括但不限于在以下文献中披露的位点：Martin等人，2003，J.Ind.Microbiol.Biotechnol.[工业微生物生物技术杂志]3:568-576；Svetina等人，2000，J.Biotechnol.[生物技术杂志]76:245-251；Rasmussen-Wilson等人，1997，Appl.Environ.Microbiol.[应用与环境微生物学]63:3488-3493；Ward等人，1995，Biotechnology[生物技术]13:498-503；和Contreras等人，1991，Biotechnology[生物技术]9:378-381；Eaton等人，1986,Biochemistry[生物化学]25:505-512；Collins-Racie等人，1995，Biotechnology[生物技术]13:982-987；Carter等人，1989,Proteins[蛋白质]；Structure,Function,and Genetics[结构、功能以及遗传学]6:240-248；以及Stevens，2003，Drug Discovery World[世界药物发现]4:35-48。

该亲本可以是一种真菌性纤维二糖水解酶。例如，该亲本可以是酵母纤维二糖水解酶，如假丝酵母属(Candida)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母属(Saccharomyces)、裂殖酵母(Schizosaccharomyces)或耶氏酵母属(Yarrowia)纤维二糖水解酶；或丝状真菌纤维二糖水解酶，例如枝顶孢霉属(Acremonium)、伞菌属(Agaricus)、链格孢属(Alternaria)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、葡萄座腔菌属(Botryospaeria)、拟蜡菌属(Ceriporiopsis)、毛喙壳属(Chaetomidium)、金孢子菌属(Chrysosporium)、麦角菌属(Claviceps)、旋孢腔菌属(Cochliobolus)、鬼伞属(Coprinopsis)、乳白蚁属(Coptotermes)、棒囊壳属(Corynascus)、隐丛赤壳菌属(Cryphonectria)、隐球菌属(Cryptococcus)、色二孢属(Diplodia)、黑耳属(Exidia)、线黑粉酵母属(Filibasidium)、镰孢属(Fusarium)、赤霉属(Gibberella)、全鞭毛虫属(Holomastigotoides)、腐质霉属(Humicola)、耙齿菌属(Irpex)、香菇属(Lentinula)、小腔球菌属(Leptospaeria)、梨孢菌属(Magnaporthe)、黑果菌属(Melanocarpus)、亚灰树花菌属(Meripilus)、毛霉属(Mucor)、毁丝霉属

(Myceliophthora)、新美鞭菌属(Neocallimastix)、链孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉菌属(Penicillium)、平革菌属(Phanerochaete)、瘤胃壶菌属(Piromyces)、Poitrasia、假黑盘菌属(Pseudoplectania)、假披发虫属

(Pseudotrichonympha)、根毛霉菌属(Rhizomucor)、裂褶菌属(Schizophyllum)、柱顶孢属(Scytalidium)、篮状菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳霉属(Thielavia)、弯颈霉属(Tolypocladium)、木霉属(Trichoderma)、长毛盘菌属(Trichophaea)、轮枝孢属(Verticillium)、小包脚菇属(Volvariella)、或炭角菌属(Xylaria)纤维二糖水解酶。

在另一方面，该亲本是卡尔酵母(Saccharomyces carlsbergensis)、酿酒酵母

(Saccharomyces cerevisiae)、糖化酵母(Saccharomyces diastaticus)、道格拉氏酵母

(Saccharomyces douglasii)、克鲁弗酵母(Saccharomyces kluyveri)、诺地酵母

(Saccharomyces norbensis)、或卵形酵母(Saccharomyces oviformis)纤维二糖水解酶。

在另一方面，该亲本是解纤维枝顶孢霉(Acremonium cellulolyticus)、棘孢曲霉

(Aspergillus aculeatus)、泡盛曲霉(Aspergillus awamori)、臭曲霉(Aspergillus foetidus)、烟曲霉(Aspergillus fumigatus)、日本曲霉(Aspergillusjaponicus)、迟缓曲霉(Aspergillus lentulus)、构巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillus niger)、米曲霉、土曲霉(Aspergillus terreus)、狭边金孢子菌(Chrysosporium inops)、嗜角质金孢子菌(Chrysosporium keratinophilum)、卢克诺文思金孢子菌(Chrysosporium lucknowense)、粪状金孢子菌(Chrysosporium merdarium)、租金孢子菌(Chrysosporium pannicola)、昆士兰金孢子菌(Chrysosporiumqueenslandicum)、热带金孢子菌

(Chrysosporium tropicum)、褐薄金孢子菌(Chrysosporium zonatum)、雪白芬尼菌

(Fennellia nivea)、杆孢状镰孢(Fusarium bactridioides)、谷类镰孢(Fusarium cerealis)、库威镰孢(Fusarium crookwellense)、大刀镰孢(Fusariumculmorum)、禾谷镰孢(Fusarium graminearum)、禾赤镰孢(Fusarium graminum)、异孢镰孢(Fusarium heterosporum)、合欢木镰孢(Fusarium negundi)、尖孢镰孢菌(Fusariumoxysporum)、多枝镰孢(Fusarium reticulatum)、粉红镰孢(Fusarium roseum)、接骨木镰孢(Fusarium sambucinum)、肤色镰孢(Fusarium sarcochroum)、拟分枝孢镰孢(Fusariumsporotrichioides)、硫色镰孢(Fusarium sulphureum)、圆镰孢(Fusarium torulosum)、拟丝孢镰孢(Fusarium trichothecioides)、镶片镰孢(Fusarium venenatum)、灰腐质霉(Humicola grisea)、特异腐质霉(Humicola insolens)、疏棉状腐质霉(Humicolalanuginosa)、白耙齿菌(Irpex lacteus)、米黑毛霉(Mucor miehei)、嗜热毁丝霉(Myceliophthora thermophila)、粗糙链孢菌(Neurospora crassa)、埃默森青霉菌(Penicillium emersonii)、绳状青霉菌(Penicillium funiculosum)、嗜松青霉菌(Penicillium pinophilum)、产紫青霉菌(Penicillium purpurogenum)、Penicilliumvasconiae、黄孢原毛平革菌(Phanerochaete chrysosporium)、埃默森篮状菌(Talaromyces emersonii)、雷塞氏篮状菌(Talaromyces leycettanus)、金黄色嗜热子囊菌(Thermoascus aurantiacus)、无色梭孢壳霉(Thielavia achromatica)、成层梭孢壳菌(Thielavia albomyces)、白毛梭孢壳(Thielavia albopilosa)、澳洲梭孢壳霉(Thielaviaaustraleinsis)、粪梭孢壳(Thielavia fimeti)、小孢梭孢壳霉(Thielavia microspora)、卵孢梭孢壳霉(Thielavia ovispora)、秘鲁梭孢壳(Thielavia peruviana)、毛梭孢壳霉(Thielavia setosa)、瘤孢梭孢壳霉(Thielavia spededonium)、耐热梭孢壳(Thielaviasubthermophila)、土生梭孢壳霉(Thielavia terrestris)、哈茨木霉(Trichodermaharzianum)、康宁木霉(Trichoderma koningii)、长枝木霉(Trichodermalongibrachiatum)、里氏木霉(Trichoderma reesei)、或绿色木霉(Trichoderma viride)纤维二糖水解酶。

在另一方面，所述亲本是Penicillium vasconiae纤维二糖水解酶，例如，SEQ IDNO:1的纤维二糖水解酶。

在另一方面，所述亲本是里氏木霉(Trichoderma reesei)纤维二糖水解酶，例如，SEQ ID NO:2的纤维二糖水解酶。

在另一方面，所述亲本是埃默森青霉(Penicillium emersonii)纤维二糖水解酶，例如，SEQ ID NO:3的纤维二糖水解酶。

在另一方面，所述亲本是奥斯塔尼青霉(Penicillium occitanis)纤维二糖水解酶，例如，SEQ ID NO:4的纤维二糖水解酶。

在另一方面，所述亲本是雷塞氏篮状菌纤维二糖水解酶，例如，SEQ ID NO:5的纤维二糖水解酶。

在另一方面，所述亲本是烟曲霉(Aspergillus fumigatus)纤维二糖水解酶，例如，SEQ ID NO:6的纤维二糖水解酶。

应理解的是对于前述物种，本发明涵盖完全和不完全阶段(perfect andimperfect states)，和其他分类学的等效物(equivalent)，例如，无性型(anamorph)，而与他们已知的种名无关。本领域的技术人员将容易地识别适当等效物的身份。

这些物种的菌株可容易地在许多培养物保藏中心为公众所获得，如美国典型培养物保藏中心(American Type Culture Collection，ATCC)、德国微生物和细胞培养物保藏中心(Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH，DSMZ)、荷兰菌种保藏中心(Centraalbureau Voor Schimmelcultures，CBS)以及美国农业研究服务专利培养物保藏中心北方地区研究中心(Agricultural Research Service Patent CultureCollection,Northern Regional Research Center,NRRL)。

可以使用上文提及的探针从其他来源，包括从自然界(例如，土壤、堆肥、水等)分离的微生物或直接从自然材料(例如，土壤、堆肥、水等)获得的DNA样品鉴定和获得所述亲本。用于直接地从自然生活环境分离微生物和DNA的技术是本领域中熟知的。然后可通过类似地筛选另一种微生物或混合DNA样品的基因组DNA或cDNA文库来获得编码亲本的多核苷酸。一旦用探针已检测出编码亲本的多核苷酸，可以通过利用本领域的普通技术人员已知的技术来分离或克隆所述多核苷酸(参见，例如，Sambrook等人，1989，Molecular Cloning,A Laboratory Manual[分子克隆实验手册]，第2版，冷泉港(Cold Spring Harbor)，纽约)。

变体的制备

本发明还涉及用于获得一种具有纤维二糖水解酶活性的变体的方法，所述方法包括：(a)在亲本纤维二糖水解酶中与SEQ ID NO:1的位置8、17、113、157、159、184、199、240、250、274、318、325、328、347、349、358、360、380、391、393、394、412以及430相对应的一个或多个(例如，若干个)位置处引入取代，其中这些变体具有纤维二糖水解酶活性；和任选地(b)回收所述变体。

在一方面，该方法进一步包括在SEQ ID NO:1的位置4、21、26、38、39、44、45、46、51、52、53、54、72、75、87、93、94、95、100、102、108、111、114、129、130、131、137、138、139、144、150、156、157、183、184、187、194、195、196、197、198、199、200、201、205、206、209、211、219、237、241、247、253、260、264、271、280、320、322、330、332、343、345、350、357、358、360、365、371、375、379、380、381、382、385、386、389、390、392、397、400、405、407、413、426、427、430、440、444、445、446、447、450、453、455、456、458、459、462、463、464、492、493、494、496、497、498、502、503、507、510、513、515、516以及517相对应的一个或多个(例如，若干个)位置处引入取代，例如，G4C、A21P、S26A、W38A、R39L、T44I、T44M、T44N、T44K、S45D、S45N、G46A、G46I、G46L、G46T、Y51I、T52R、T52W、G53A、G53M、G53R、G53W、N54S、N54I、N54D、A72C、G75S、S87T、L93V、N94S、N94A、N94R、N94Q、F95L、F95Y、S100T、S100V、S100W、S100L、S100G、K102S、K102R、L108I、L111T、D114E、F129S、D130N、D130E、V131A、P137S、C138S、G139E、G139M、G139Q、G139S、G139R、L144A、L144V、D150N、A156G、K157R、I183N、D184S、A187L、P194^*、P194Q、S195^*、T196^*、N197A、N197^*、D198A、D198^*、V199^*、N200A、N200G、N200W、N200F、N200C、N200^*、S201^*、N205R、H206Y、C209S、A211T、N219S、M237T、D241L、D241R、D241V、Y247C、A253D、A253R、G260D、N264Y、T271I、V280I、P320A、S322V、N330D、I332F、A343V、G345D、F350L、A357S、G358R、G360M、D365S、M371V、D375A、D375G、A379T、D380H、D380Y、M381V、L382A、D385E、S386C、S386E、P389L、P389Q、P389I、T390A、T390S、T390A、A392G、A392I、A392L、P397A、P397G、P397K、P397W、P397C、P397L、K400A、D405P、S407G、T413P、S426F、N427D、T430Y、T440L、T440R、T440G、T444S、T445D、S446T、S447L、T450D、S453D、T455A、T456S、S458E、K459E、K459S、S462I、T463I、T464A、T464A、H492L、Y493S、Y493W、A494D、A494S、C496S、C496Y、G497C、G498D、G498S、T502N、G503D、C507Y、P510V、P510S、C513R、C513W、K515D、Q516P以及N517D。

可以使用本领域已知的任何诱变程序来制备变体，例如定点诱变、合成基因构建、半合成基因构建、随机诱变、改组等。

定点诱变是在编码该亲本的多核苷酸中的一个或多个限定位点处引入一个或多个(例如，若干个)突变的技术。任何定点诱变程序可用于本发明。存在许多可以用于制备变体的可商购的试剂盒。

通过涉及使用含有所希望的突变的寡核苷酸引物的PCR可以体外实现定点诱变。也可以通过盒式诱变进行体外定点诱变，该盒式诱变涉及由限制酶在包含编码亲本的多核苷酸的质粒中的位点处切割并且随后将含有突变的寡核苷酸连接在多核苷酸中。通常，消化该质粒与该寡核苷酸的限制酶是相同的，从而允许该质粒的粘性末端以及插入片段彼此连接。参见例如，Scherer和Davis，1979，Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]76:4949-4955；和Barton等人，1990，Nucleic Acids Res.[核酸研究]18:7349-4966。

还可以通过本领域已知的方法在体内实现定点诱变。参见，例如，美国专利申请公开号2004/0171154；Storici等人，2001，Nature Biotechnol.[自然生物技术]19:773-776；Kren等人，1998，Nat.Med.[自然医学]4:285-290；以及Calissano和Macino，1996，FungalGenet.Newslett.[真菌遗传学通讯]43:15-16。

位点饱和诱变在一个或多个(例如，若干个)特定位置处将多肽编码序列系统性地替代为编码全部19个氨基酸的序列(Parikh和Matsumura，2005，J.Mol.Biol.[分子生物学杂志]352:621-628)。

合成基因构建需要体外合成设计的多核苷酸分子以编码目的多肽。基因合成可以利用若干种技术来进行，如由Tian等人，2004，Nature[自然]432:1050-1054)所述的基于多路微芯片的技术、以及在光可编程的微流芯片上合成并组装寡核苷酸的类似技术。

使用已知的诱变、重组和/或改组方法、随后进行一个相关的筛选程序可以做出单一或多种氨基酸取代、缺失和/或插入并对其进行测试，这些相关的筛选程序例如由Reidhaar-Olson和Sauer，1988，Science[科学]241:53-57；Bowie和Sauer，1989，Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]86:2152-2156；WO 95/17413；或者WO 95/22625。其他可使用的方法包括易错PCR、噬菌体展示(例如Lowman等，1991，Biochemistry[生物化学])30:10832-10837；美国专利号5,223,409；WO 92/06204)以及区域定向诱变(Derbyshire等人，1986，Gene[基因]46:145；Ner等人，1988，DNA7:127)。

诱变/改组方法可以与高通量自动化筛选方法组合以检测由宿主细胞表达的克隆的诱变多肽的活性(Ness等人，1999，Nature Biotechnology[自然生物技术]17:893-896)。可从宿主细胞回收编码活性多肽的诱变的DNA分子，并使用本领域的标准方法快速测序。这些方法允许迅速确定多肽中个体氨基酸残基的重要性。

通过组合合成基因构建、和/或定点诱变、和/或随机诱变、和/或改组的多方面来实现半合成基因的构建。半合成构建典型地是利用合成的多核苷酸片段的过程结合PCR技术。因此，基因的限定区域可以从头合成，而其他区域可以使用位点特异性诱变引物来扩增，然而还有其他区域可以进行易错PCR或非易错PCR扩增。然后可以对多核苷酸子序列进行改组。

多核苷酸

本发明还涉及编码本发明的变体的分离的多核苷酸。

核酸构建体

本发明还涉及包含编码本发明的变体的、可操作地连接至一个或多个控制序列上的多核苷酸的核酸构建体，所述一个或多个控制序列在与控制序列相容的条件下指导编码序列在适合的宿主细胞中表达。

可以按多种方式来操纵该多核苷酸以提供变体的表达。取决于表达载体，在多核苷酸插入载体之前对其进行操纵可以是令人希望的或必需的。用于利用重组DNA方法修饰多核苷酸的技术在本领域是熟知的。

该控制序列可以是一个启动子，即，被宿主细胞识别以对编码本发明的变体的多核苷酸进行表达的一种多核苷酸。启动子含有介导该变体的表达的转录控制序列。启动子可以是在宿主细胞中显示出转录活性的任何多核苷酸，包括突变型、截短型和杂合型启动子，并且可以是从编码与宿主细胞同源或异源的细胞外或细胞内多肽的基因获得。

用于在细菌宿主细胞中指导本发明核酸构建体的转录的适合启动子的实例是从以下基因中获得的启动子：解淀粉芽孢杆菌α-淀粉酶基因(amyQ)、地衣芽孢杆菌α-淀粉酶基因(amyL)、地衣芽孢杆菌青霉素酶基因(penP)、嗜热脂肪芽孢杆菌产麦芽糖淀粉酶基因(amyM)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、枯草芽孢杆菌xylA和xylB基因、苏云金芽孢杆菌cryIIIA基因(Agaisse和Lereclus，1994，Molecular Microbiology[分子微生物学]13:97-107)、大肠杆菌lac操纵子、大肠杆菌trc启动子(Egon等人，1988，Gene[基因]69:301-315)、天蓝链霉菌琼脂水解酶基因(dagA)和原核β-内酰胺酶基因(Villa-Kamaroff等人，1978，Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]75:3727-3731)以及tac启动子(DeBoer等人，1983，Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]80:21-25)。其他启动子描述在Gilbert等人，1980，Scientific American[科学美国人]242:74-94的“Usefulproteins from recombinant bacteria[来自重组细菌的有用蛋白质]”；和在Sambrook等人，1989，见上文中。串联启动子的实例披露于WO 99/43835中。

在丝状真菌宿主细胞中，用于指导本发明的核酸构建体的转录的适合启动子的实例是从以下的基因获得的启动子：构巢曲霉乙酰胺酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉葡萄糖淀粉酶(glaA)、米曲霉TAKA淀粉酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、尖孢镰孢菌胰蛋白酶-样蛋白酶(WO96/00787)、镶片镰孢菌淀粉葡糖苷酶(WO 00/56900)、镶片镰孢菌Daria(达莉亚)(WO 00/56900)、镶片镰孢菌Quinn(奎恩)(WO 00/56900)、米黑根毛霉脂肪酶、米黑根毛霉天冬氨酸蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶，以及里氏木霉翻译延伸因子，连同NA2-tpi启动子(来自编码中性α-淀粉酶的曲霉属基因的修饰的启动子，其中已经用来自编码丙糖磷酸异构酶的曲霉属基因的未翻译的前导子替换未翻译的前导子；非限制性实例包括来自黑曲霉中性α-淀粉酶的基因的经修饰的启动子，其中未翻译的前导序列已经用来自构巢曲霉或米曲霉丙糖磷酸异构酶基因的未翻译的前导序列替换)；及其突变型、截短型及杂合型启动子。其他启动子在美国专利号6,011,147中描述。

在酵母宿主中，有用的启动子从以下的基因获得：酿酒酵母烯醇酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母醇脱氢酶/甘油醛-3磷酸脱氢酶(ADH1、ADH2/GAP)、酿酒酵母丙糖磷酸异构酶(TPI)、酿酒酵母金属硫蛋白(CUP1)、以及酿酒酵母3磷酸甘油酸激酶。Romanos等人，1992，Yeast[酵母]8:423-488描述了酵母宿主细胞的其他有用的启动子。

控制序列也可为由宿主细胞识别以终止转录的转录终止子。该终止子可操作地连接至编码该变体的多核苷酸的3'末端。在宿主细胞中有功能的任何终止子可以用于本发明中。

细菌宿主细胞的优选终止子从针对以下的基因获得：克劳氏芽孢杆菌碱性蛋白酶(aprH)、地衣芽孢杆菌α-淀粉酶(amyL)、和大肠杆菌核糖体RNA(rrnB)。

用于丝状真菌宿主细胞的优选的终止子是从以下的基因获得：构巢曲霉(Aspergillus nidulans)乙酰胺酶、构巢曲霉(Aspergillus nidulans)邻氨基苯甲酸合酶、黑曲霉(Aspergillus niger)葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶、尖孢镰孢菌(Fusarium oxysporum)胰蛋白酶样蛋白酶、里氏木霉(Trichoderma reesei)β-葡糖苷酶、里氏木霉(Trichoderma reesei)纤维二糖水解酶I、里氏木霉(Trichoderma reesei)纤维二糖水解酶II、里氏木霉(Trichoderma reesei)内切葡聚糖酶I、里氏木霉(Trichoderma reesei)内切葡聚糖酶II、里氏木霉(Trichoderma reesei)内切葡聚糖酶III、里氏木霉(Trichoderma reesei)内切葡聚糖酶V、里氏木霉(Trichoderma reesei)木聚糖酶I、里氏木霉(Trichoderma reesei)木聚糖酶II、里氏木霉(Trichoderma reesei)木聚糖酶III、里氏木霉(Trichoderma reesei)β-木糖苷酶以及里氏木霉(Trichodermareesei)翻译延长因子。

用于酵母宿主细胞的优选终止子从以下的基因获得：酿酒酵母烯醇酶、酿酒酵母细胞色素C(CYC1)、以及酿酒酵母甘油醛-3磷酸脱氢酶。由Romanos等人，1992，见上文描述了酵母宿主细胞的其他有用终止子。

控制序列还可为启动子下游和基因的编码序列上游的mRNA稳定子区域，其增加所述基因的表达。

适合的mRNA稳定子区域的实例是从以下获得的：苏云金芽孢杆菌cryIIIA基因(WO94/25612)和枯草芽孢杆菌SP82基因(Hue等人，1995，Journal of Bacteriology[细菌学杂志]177:3465-3471)。

该控制序列也可以是前导子，即对宿主细胞翻译很重要的mRNA的非翻译区域。该前导子可操作地连接至编码该变体的多核苷酸的5'末端。可以使用在宿主细胞中有功能的任何前导子。

用于丝状真菌宿主细胞的优选前导序列是从米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶的基因获得的。

对于酵母宿主细胞适合的前导序列从以下酶的基因获得：酿酒酵母烯醇化酶(ENO--1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α因子、和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。

该控制序列还可以是一个聚腺苷酸化序列，一种可操作地连接到多核苷酸的3'末端的序列，并且当转录时被宿主细胞识别为将聚腺苷酸残基添加到转录的mRNA的一个信号。可以使用在宿主细胞中起作用的任何多腺苷酸化序列。

用于丝状真菌宿主细胞的优选聚腺苷酸化序列是从以下的基因获得：构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶以及尖孢镰孢菌胰蛋白酶样蛋白酶。

对于酵母宿主细胞有用的多聚腺苷酸化序列由Guo和Sherman，1995，Mol.Cellular Biol.[分子细胞生物学]15:5983-5990描述。

该控制序列还可以是信号肽编码区，编码与变体的N-末端连接的信号肽，并且指导该变体进入细胞的分泌通路。该多核苷酸的编码序列的5’-末端可以固有地包含信号肽编码序列，该信号肽编码序列在翻译阅读框中与编码该变体的编码序列的区段天然地连接在一起。可替代地，该编码序列的5’-末端可以包含对于该编码序列来说是外来的信号肽编码序列。在编码序列天然地不包含信号肽编码序列的情况下，可能需要外源信号肽编码序列。可替代地，外源信号肽编码序列可以简单地替代天然信号肽编码序列，以便增强变体的分泌。然而，可以使用指导表达的变体进入宿主细胞的分泌通路的任何信号肽编码序列。

用于细菌宿主细胞的有效信号肽编码序列是从以下的基因获得的信号肽编码序列：芽孢杆菌属NCIB 11837产麦芽糖淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌α-淀粉酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT、nprS、nprM)和枯草芽孢杆菌prsA。另外的信号肽由Simonen和Palva,1993,MicrobiologicalReviews[微生物评论]57:109-137描述。

用于丝状真菌宿主细胞的有效的信号肽编码序列是从以下酶的基因获得的信号肽编码序列：黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶V、疏棉状腐质霉脂肪酶和米黑根毛霉(Rhizomucormiehei)天冬氨酸蛋白酶。

用于酵母宿主细胞的有用的信号肽从酿酒酵母α-因子和酿酒酵母转化酶的基因获得。其他的有用的信号肽编码序列由Romanos等人，1992，见上文描述。

该控制序列还可以是编码位于变体的N-末端处的前肽的前肽编码序列。生成的多肽被称为前体酶(proenzyme)或多肽原(或在一些情况下被称为酶原(zymogen))。多肽原通常是无活性的并且可以通过从该多肽原上催化切割或自动催化切割前肽而被转化成一种活性变体。前肽编码序列可以从以下酶的基因获得：枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、嗜热毁丝霉漆酶(WO 95/33836)、米黑根毛霉天冬氨酸蛋白酶和酿酒酵母α-因子。

在信号肽和前肽序列两者都在的情况下，将前肽序列紧邻变体的N末端定位并且将信号肽序列紧邻前肽序列的N末端定位。

还令人希望的可以是添加相对于宿主细胞的生长来调节该变体的表达的调节序列。调节序列的实例是引起基因表达以响应于化学或物理刺激(包括调节化合物的存在)而开启或关闭的那些。原核系统中的调节序列包括lac、tac以及trp操纵子系统。在酵母中，可以使用ADH2系统或GAL1系统。在丝状真菌中，可以使用黑曲霉葡糖淀粉酶启动子、米曲霉TAKA α-淀粉酶启动子和米曲霉葡糖淀粉酶启动子、里氏木霉纤维二糖水解酶I启动子以及里氏木霉纤维二糖水解酶II启动子。调节序列的其他实例是那些允许基因扩增的序列。在真核系统中，这些调节序列包括在甲氨蝶呤存在下被扩增的二氢叶酸还原酶基因以及用重金属扩增的金属硫蛋白基因。在这些情况下，编码该变体的多核苷酸将可操作地连接至该调节序列。

表达载体

本发明还涉及包含编码本发明的变体的多核苷酸、启动子以及转录和翻译终止信号的重组表达载体。各种核苷酸和控制序列可以连接在一起以产生重组表达载体，所述重组表达载体可以包括一个或多个合宜的限制位点以允许在这样的位点处插入或取代编码变体的多核苷酸。可替代地，可以通过将多核苷酸或包含该多核苷酸的核酸构建体插入用于表达的适当载体中来表达该多核苷酸。在产生表达载体时，编码序列位于载体中，这样使得编码序列与用于表达的适当控制序列可操作地连接。

重组表达载体可以是可方便地经受重组DNA程序并且可引起多核苷酸表达的任何载体(例如，质粒或病毒)。载体的选择将典型地取决于载体与待引入载体的宿主细胞的相容性。载体可以是线状或闭合的环状质粒。

载体可以是自主复制载体，即作为染色体外实体存在的载体，其复制独立于染色体复制，例如质粒、染色体外元件、微染色体或人工染色体。载体可以包含用于确保自我复制的任何装置。可替代地，载体可以是这样的载体，当它引入宿主细胞中时整合入基因组中并与其中已整合了它的一个或多个染色体一起复制。此外，可以使用单独的载体或质粒或两个或更多个载体或质粒，其共同包含待引入宿主细胞基因组的总DNA，或可以使用转座子。

载体优选地包含一个或多个选择性标记，这些标记容许容易地选择转化细胞、转染细胞、转导细胞等。选择性标记是一种基因，其产物提供了杀生物剂抗性或病毒抗性、对重金属抗性、对营养缺陷型的原养型等。

细菌性选择性标记的实例是地衣芽孢杆菌或枯草芽孢杆菌dal基因，或赋予抗生素抗性(例如氨苄青霉素、氯霉素、卡那霉素、新霉素、大观霉素或四环素抗性)的标记。用于酵母宿主细胞的适合的标记包括但不限于ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于在丝状真菌宿主细胞中使用的选择性标记包括但不限于，adeA(磷酸核糖酰氨基咪唑-琥珀羧胺合酶)、adeB(磷酸核糖酰-氨基咪唑合酶)、amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草丁膦乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清酸核苷-5'-磷酸脱羧酶)、sC(硫酸腺苷基转移酶)、以及trpC(邻氨基苯甲酸合酶)、连同其等效物。优选的用于曲霉属细胞中的是构巢曲霉或米曲霉amdS和pyrG基因和吸水链霉菌bar基因。优选用于木霉属细胞中的是adeA、adeB、amdS、hph和pyrG基因。

选择性标记可为双选择性标记系统，如WO 2010/039889中描述的。在一方面，双选择性标记是hph-tk双选择性标记系统。

载体优选包含允许载体整合到宿主细胞的基因组中或载体在细胞中独立于基因组自主复制的一个或多个元件。

对于整合到该宿主细胞基因组中，该载体可以依靠编码该变体的多核苷酸序列或用于通过同源或非同源重组整合到该基因组中的该载体的任何其他元件。可替代地，该载体可以含有用于指导通过同源重组而整合到宿主细胞基因组中的染色体中的精确位置的另外的多核苷酸。为了增加在精确位置整合的可能性，这些整合的元件应含有足够数量的核酸，如100至10,000个碱基对、400至10,000个碱基对、以及800至10,000个碱基对，这些碱基对与相应的靶序列具有高度的序列同一性以提高同源重组的可能性。这些整合元件可为与宿主细胞基因组中的靶序列同源的任何序列。此外，整合元件可以是非编码多核苷酸或编码多核苷酸。另一方面，载体可以通过非同源重组整合入宿主细胞的基因组中。

对于自主复制，载体可以进一步包含使载体能够在所讨论的宿主细胞中自主地进行复制的复制起点。复制起点可为在细胞中有功能的介导自主复制的任何质粒复制子。术语“复制起点(origin of replication)”或“质粒复制子(plasmid replicator)”意指使得质粒或载体能够在体内复制的多核苷酸。

细菌复制起点的实例是允许在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177、以及pACYC184的复制起点，以及允许在芽孢杆菌属中复制的质粒pUB110、pE194、pTA1060、以及pAMβ1的复制起点。

用于酵母宿主细胞中的复制起点的实例是2微米复制起点、ARS1、ARS4、ARS1与CEN3的组合、及ARS4与CEN6的组合。

用于丝状真菌细胞中的复制起点的实例是AMA1和ANS1(Gems等人，1991，Gene[基因]98：61-67；Cullen等人，1987，Nucleic Acids Res[核酸研究]15:9163-9175；WO 00/24883)。分离AMA1基因和构建包含该基因的质粒或载体能够根据公开于WO00/24883中的方法完成。

可以将多于一个拷贝的本发明的多核苷酸插入宿主细胞中以增加变体的产生。可以通过将序列的至少一个另外的拷贝整合入宿主细胞基因组中或通过包括与该多核苷酸一起的可扩增的选择性标记基因来获得多核苷酸的增加的拷贝数目，其中通过在适当的选择性试剂的存在下培养细胞可以选择含有选择性标记基因的经扩增的拷贝的细胞、以及由此该多核苷酸的另外的拷贝。

用于连接以上所述的元件以构建本发明的重组表达载体的程序是本领域的普通技术人员熟知的(参见例如，Sambrook等人，1989，见上文)。

宿主细胞

本发明还涉及重组宿主细胞，这些重组宿主细胞包含编码本发明的变体的、可操作地连接至一个或多个控制序列的多核苷酸，所述一个或多个控制序列指导本发明的变体的产生。将包含多核苷酸的构建体或载体引入宿主细胞中，这样使得所述构建体或载体被维持作为染色体整合体或作为自主复制的染色体外载体，如早前所述。术语“宿主细胞”涵盖由于复制过程中发生的突变而与亲本细胞不同的亲本细胞的任何后代。宿主细胞的选择在很大程度上将取决于编码变体的基因及其来源。

宿主细胞可以是在变体的重组产生中有用的任何细胞，例如原核细胞或真核细胞。

原核宿主细胞可以是任何革兰氏阳性或革兰氏阴性细菌。革兰氏阳性细菌包括但不限于芽孢杆菌属、梭菌属、肠球菌属、土芽孢杆菌属、乳杆菌属、乳球菌属、大洋芽孢杆菌属(Oceanobacillus)、葡萄球菌属、链球菌属和链霉菌属。革兰氏阴性细菌包括但不限于：弯曲杆菌属、大肠杆菌、黄杆菌属、梭杆菌属、螺杆菌属、泥杆菌属、奈瑟氏菌属、假单胞菌属、沙门氏菌属、以及脲原体属。

细菌宿主细胞可以是任何芽孢杆菌属细胞，包括但不限于嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚硬芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌以及苏云金芽孢杆菌细胞。

细菌宿主细胞还可为任何链球菌属细胞，包括但不限于：似马链球菌(Streptococcus equisimilis)、酿脓链球菌(Streptococcus pyogenes)、乳房链球菌(Streptococcus uberis)和马链球菌(Streptococcus equi)兽瘟(Zooepidemicus)亚种细胞。

细菌宿主细胞还可以是任何链霉菌属细胞，包括但不限于：不产色链霉菌、除虫链霉菌、天蓝链霉菌、灰色链霉菌、以及变铅青链霉菌细胞。

将DNA引入芽孢杆菌属细胞中可以通过以下来实现：原生质体转化(参见例如，Chang和Cohen，1979，Mol.Gen.Genet.[分子遗传学与基因组学]168:111-115)、感受态细胞转化(参见例如，Young和Spizizen，1961，J.Bacteriol.[细菌学杂志]81:823-829，或Dubnau和Davidoff-Abelson，1971，J.Mol.Biol.[分子生物学杂志]56:209-221)、电穿孔(参见例如，Shigekawa和Dower，1988，Biotechniques[生物技术]6:742-751)或接合(参见例如，Koehler和Thorne，1987，J.Bacteriol.[细菌学杂志]169:5271-5278)。将DNA引入大肠杆菌细胞中可以通过以下来实现：原生质体转化(参见例如，Hanahan，1983，J.Mol.Biol.[分子生物学杂志]166:557-580)或电穿孔(参见例如，Dower等人，1988，Nucleic AcidsRes.[核酸研究]16:6127-6145)。将DNA引入链霉菌属细胞中可以通过以下来实现：原生质体转化、电穿孔(参见例如，Gong等人，2004，Folia Microbiol.(Praha)[叶线形微生物学(布拉格)]49:399-405)、接合(参见例如，Mazodier等人，1989，J.Bacteriol.[细菌学杂志]171:3583-3585)或转导(参见例如，Burke等人，2001，Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]98:6289-6294)。将DNA引入假单孢菌属细胞中可以通过以下来实现：电穿孔(参见例如，Choi等人，2006,J.Microbiol.Methods[微生物学方法杂志]64:391-397)或接合(参见例如，Pinedo和Smets,2005,Appl.Environ.Microbiol.[应用与环境微生物学]71:51-57)。可通过如下方法实现将DNA引入到链球菌属细胞：例如天然感受态(naturalcompetence)(参见，例如，Perry和Kuramitsu,1981,Infect.Immun.[感染与免疫]32:1295-1297)、原生质体转化(参见，例如，Catt和Jollick，1991，Microbios[微生物学]68:189-207)、电穿孔(参见，例如，Buckley等人，1999，Appl.Environ.Microbiol.[应用与环境微生物学]65:3800-3804)、或接合(参见，例如，Clewell，1981，Microbiol.Rev.[微生物学评论]45:409-436)。然而，可以使用本领域已知的将DNA引入宿主细胞中的任何方法。

宿主细胞还可以是真核生物，如哺乳动物、昆虫、植物或真菌细胞。

宿主细胞可以是真菌细胞。如在此使用的“真菌”包括子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)和接合菌门(Zygomycota)以及卵菌门(Oomycota)和所有有丝分裂孢子真菌(如由Hawksworth等人所定义的，在：Ainsworth andBisby’s Dictionary of The Fungi[Ainsworth和Bisby的真菌大词典]，第8版，1995，国际CAB，大学出版社，剑桥，英国)。

真菌宿主细胞可为酵母细胞。如在此所使用的“酵母”包括产子囊酵母(酵母目)、产担子酵母及属于不完全真菌的酵母(芽生菌目)。由于酵母的分类可能在将来变化，出于本发明的目的，酵母应当如酵母的生物学与活性(Skinner、Passmore和Davenport编辑，Soc.App.Bacteriol.Symposium Series No.9[应用细菌学学会专题论文集系列9]，1980)所描述那样定义。

酵母宿主细胞可以是假丝酵母属细胞、汉逊酵母属细胞、克鲁维酵母属细胞、毕赤酵母属细胞、酵母菌属细胞、裂殖酵母或耶罗维亚酵母属细胞、如乳酸克鲁弗酵母细胞、卡尔酵母细胞、酿酒酵母细胞、糖化酵母细胞、道格拉氏酵母细胞、克鲁弗酵母细胞、诺地酵母细胞、卵形酵母细胞或解脂耶罗维亚酵母细胞。

真菌宿主细胞可为丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门(Oomycota)的亚门的所有丝状形式(如由Hawksworth等人所定义的，1995，见上文)。丝状真菌通常的特征在于由几丁质、纤维素、葡聚糖、壳多糖、甘露聚糖、以及其他复杂多糖构成的菌丝体壁。营养生长是通过菌丝延长，而碳分解代谢是专性需氧的。相反，酵母(例如酿酒酵母)的营养生长是通过单细胞菌体的出芽(budding)，而碳分解代谢可以是发酵性的。

丝状真菌宿主细胞可以是枝顶孢属、曲霉属、短梗霉属、烟管霉属(Bjerkandera)、拟腊菌属、金孢子菌属、鬼伞属、革盖菌属(Coriolus)、隐球菌属、线黑粉菌科(Filibasidium)、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新美鞭菌属、链孢菌属、拟青霉属、青霉属、平革菌属、射脉菌属(Phlebia)、瘤胃壶菌属、侧耳属(Pleurotus)、裂褶菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属(Trametes)或木霉属细胞。

例如，丝状真菌宿主细胞可以是泡盛曲霉、臭曲霉、烟曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、黑刺烟管菌(Bjerkandera adusta)、干拟蜡菌(Ceriporiopsisaneirina)、卡内基拟蜡菌(Ceriporiopsis caregiea)、浅黄拟蜡孔菌(Ceriporiopsisgilvescens)、潘诺希塔拟蜡菌(Ceriporiopsis pannocinta)、环带拟蜡菌(Ceriporiopsisrivulosa)、微红拟蜡菌(Ceriporiopsis subrufa)、虫拟蜡菌(Ceriporiopsissubvermispora)、狭边金孢子菌(Chrysosporium inops)、嗜角质金孢子菌、卢克诺文思金孢子菌(Chrysosporium lucknowense)、粪状金孢子菌(Chrysosporium merdarium)、租金孢子菌、女王杜香金孢子菌(Chrysosporium queenslandicum)、热带金孢子菌、褐薄金孢子菌(Chrysosporium zonatum)、灰盖鬼伞(Coprinus cinereus)、毛革盖菌(Coriolushirsutus)、杆孢状镰孢、谷类镰孢、库威镰孢、大刀镰孢、禾谷镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖孢镰孢菌、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、特异腐质霉、柔毛腐质霉、米黑毛霉、嗜热毁丝霉、粗糙链孢菌、产紫青霉、黄孢平革菌(Phanerochaete chrysosporium)、射脉菌(Phlebiaradiata)、刺芹侧耳(Pleurotus eryngii)、埃默森篮状菌、土生梭孢霉、长域毛栓菌(Trametes villosa)、变色栓菌(Trametes versicolor)、哈茨木霉、康宁木霉、长枝木霉、里氏木霉或绿色木霉细胞。

真菌细胞能通过涉及原生质体形成、原生质体的转化和细胞壁的再生的过程以本身已知的方式进行转化。用于转化曲霉属和木霉属宿主细胞的适合程序描述于以下文献中：EP 238023，Yelton等人，1984，Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]81:1470-1474以及Christensen等人，1988，Bio/Technology[生物/技术]6:1419-1422。用于转化镰孢菌属物种的适合方法在Malardier等人，1989，Gene[基因]78:147-156和WO 96/00787中描述。可使用由如以下文献描述的程序转化酵母：Becker和Guarente，于Abelson，J.N.和Simon，M.I.编，Guide to Yeast Genetics and Molecular Biology[酵母遗传学与分子生物学指南]，Methods in Enzymology[酶学方法]，第194卷，第182-187页，学术出版社有限公司(Academic Press,Inc.)，纽约；Ito等人，1983，J.Bacteriol.[细菌学杂志]153:163；以及Hinnen等人，1978，Proc.Natl.Acad.Sci.USA[美国科学院院刊]75:1920。

产生方法

本发明还涉及产生变体的方法，这些方法包括(a)在有助于该变体的产生的条件下培养本发明的重组宿主细胞；以及任选地(b)回收该变体。

使用本领域已知的方法在适合于产生变体的营养培养基中培养宿主细胞。例如，可以通过多孔板(例如24、48、或96孔板)、摇瓶培养，或者在适合的培养基中并在允许所述变体表达和/或分离的条件下在实验室或工业发酵罐中进行小规模或大规模发酵(包括连续发酵、分批发酵、分批给料发酵或固态发酵)来培养所述细胞。所述培养是使用本领域中已知的程序，在一种适合的营养培养基中发生，所述培养基包含碳和氮来源及无机盐。适合的培养基可从商业供应商获得或可以根据公开的组成(例如，在美国典型培养物保藏中心的目录中)制备。如果该变体被分泌到该营养培养基中，则该变体可直接从该培养基中回收。如果该变体没有分泌，则它可从细胞裂解液中回收。

可以使用本领域已知的对这些变体特异的方法检测这些变体。这些检测方法包括但不限于，特异性抗体的使用、酶产物的形成或酶底物的消失。例如，可以使用酶测定来确定该变体的活性。

可以使用本领域已知的方法来回收该变体。例如，可以通过多种常规程序从所述营养培养基中回收所述变体，这些常规程序包括但不限于：收集、离心、过滤、提取、喷雾干燥、蒸发、或沉淀。在一方面，回收整个发酵液。

可以通过本领域中已知的多种程序来纯化变体以获得基本上纯的变体，这些程序包括但不限于色谱法(例如，离子交换色谱、亲和色谱、疏水作用色谱、色谱聚焦、以及尺寸排阻色谱)、电泳程序(例如，制备型等电点聚焦)、差别溶解度(例如，硫酸铵沉淀)、SDS-PAGE、或萃取(参见，例如，Protein Purification[蛋白质纯化]，Janson和Ryden编辑，VCH出版社(VCH Publishers)，纽约，1989)。

在可替代的方面，没有回收变体，而是将表达变体的本发明的宿主细胞用作变体的来源。

发酵液配制品或细胞组合物

本发明还涉及包含本发明的变体的一种发酵液配制品或一种细胞组合物。发酵液产物进一步包括在发酵过程中使用的另外的成分，例如像，细胞(包括含有编码本发明的变体的基因的宿主细胞，这些宿主细胞被用于产生该变体)、细胞碎片、生物质、发酵介质和/或发酵产物。在一些实施例中，组合物是含有有机酸、杀灭的细胞和/或细胞碎片以及培养基的细胞杀灭的全培养液。

术语“发酵液”是指由细胞发酵产生、不经历或经历最低限的回收和/或纯化的制品。例如，当微生物培养株在允许蛋白质合成(例如，由宿主细胞的酶表达)并且将蛋白质分泌到细胞培养基中的碳受限的条件下孵育生长到饱和时，产生发酵液。发酵液可以含有在发酵结束时得到的发酵材料的未分级的或分级的内容物。典型地，发酵液是未分级的且包含耗尽的培养基以及，例如，通过离心去除微生物细胞(例如，丝状真菌细胞)之后存在的细胞碎片。在一些实施例中，发酵液含有用过的细胞培养基、胞外酶以及有活力的和/或无活力的微生物细胞。

在一个实施例中，该发酵液配制品和细胞组合物包含第一有机酸组分(包含至少一种1-5碳的有机酸和/或其盐)和第二有机酸组分(包含至少一种6碳或更多碳的有机酸和/或其盐)。在具体实施例中，所述第一有机酸组分是乙酸、甲酸、丙酸、其盐，或前述两种或更多种的混合物；并且所述第二有机酸组分是苯甲酸、环己烷羧酸、4-甲基戊酸、苯乙酸、其盐，或前述两种或更多种的混合物。

在一方面，所述组合物含有有机酸，并且任选地进一步含有杀灭的细胞和/或细胞碎片。在一个实施例中，从细胞杀灭的全培养液中去除这些杀灭的细胞和/或细胞碎片，以提供不含这些组分的组合物。

这些发酵液配制品或细胞组合物可以进一步包含防腐剂和/或抗微生物(例如，抑菌)剂，包括但不限于：山梨醇、氯化钠、山梨酸钾、以及本领域已知的其他试剂。

这些发酵液配制品或细胞组合物可以进一步包括多种酶活性，例如一种或多种(例如，若干种)选自下组的酶，该组由以下组成：纤维素酶、半纤维素酶、纤维素诱导蛋白(CIP)、酯酶、棒曲霉素、漆酶、木质素分解酶、果胶酶、过氧化物酶、蛋白酶以及膨胀蛋白。这些发酵液配制品或细胞组合物还可以包含选自下组的一种或多种(例如，若干种)酶，该组由以下组成：水解酶、异构酶、连接酶、裂解酶、氧化还原酶或转移酶，例如，α-半乳糖苷酶、α-葡糖苷酶、氨肽酶、淀粉酶、β-半乳糖苷酶、β-葡糖苷酶、β-木糖苷酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、壳多糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、葡糖淀粉酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变位酶、氧化酶、果胶分解酶、过氧化物酶、植酸酶、多酚氧化酶、蛋白分解酶、核糖核酸酶、转谷氨酰胺酶或木聚糖酶。

该细胞杀灭的全培养液或组合物可以含有在发酵结束时得到的发酵材料的未分级的内容物。典型地，该细胞杀灭的全培养液或组合物含有用过的培养基以及在微生物细胞(例如，丝状真菌细胞)生长至饱和、在碳限制条件下孵育以允许蛋白质合成(例如，纤维素酶和/或一种或多种葡糖苷酶的表达)之后存在的细胞碎片。在一些实施例中，该细胞杀灭的全培养液或组合物含有用过的细胞培养基、胞外酶和杀灭的丝状真菌细胞。在一些实施例中，可以使用本领域已知的方法来使细胞杀灭的全培养液或组合物中存在的微生物细胞透性化和/或裂解。

如在此所述的，全培养液或细胞组合物典型地是液体，但是可以含有不溶性组分，例如杀灭的细胞、细胞碎片、培养基组分和/或一种或多种不溶性酶。在一些实施例中，可以除去不溶性组分以提供澄清的液体组合物。

可以通过描述于WO 90/15861或WO 2010/096673中的方法产生本发明的全发酵液配制品和细胞组合物。

下面给出了本发明的组合物的用途的实例。该组合物的剂量以及使用该组合物的其他条件可以基于本领域已知的方法来确定。

酶组合物

本发明还涉及包括本发明的一种变体的组合物。优选地，这些组合物富含这种变体。术语“富含”指示该组合物的纤维二糖水解酶活性已经增加，例如，富集因子为至少1.1。

这些组合物可以包含本发明的变体作为主要酶组分，例如，单组分组合物。可替代地，这些组合物可以包括多种酶活性，例如一种或多种(例如，若干种)选自下组的酶，该组由以下组成：纤维素酶、半纤维素酶、AA9多肽、CIP、酯酶、棒曲霉素、漆酶、木质素分解酶、果胶酶、过氧化物酶、蛋白酶以及膨胀蛋白。这些组合物还可以包含一种或多种(例如，若干种)选自下组的酶，该组由以下组成：水解酶、异构酶、连接酶、裂解酶、氧化还原酶、或转移酶，例如α-半乳糖苷酶、α-葡糖苷酶、氨肽酶、淀粉酶、β-半乳糖苷酶、β-葡糖苷酶、β-木糖苷酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、壳多糖酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、葡糖淀粉酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变位酶、氧化酶、果胶分解酶、过氧化物酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、或木聚糖酶。

这些组合物可根据本领域已知的方法制备并且可以是液体或干燥组合物的形式。可以根据本领域中已知的方法稳定这些组合物。

下面给出了本发明的组合物的优选的用途的实例。该组合物的剂量以及使用该组合物的其他条件可以基于本领域已知的方法来确定。

用途

本发明还涉及使用具有纤维二糖水解酶活性的变体或其组合物的以下方法。

本发明还涉及降解纤维素材料的方法，这些方法包括：用包含本发明的具有纤维二糖水解酶活性的变体的酶组合物处理纤维素材料。在一方面，这些方法进一步包含回收该降解的纤维素材料。可以使用本领域已知的方法将来自纤维素材料的降解的可溶性产物与不溶性纤维素材料分开，这些方法例如像离心、过滤、或重力沉降。

本发明还涉及产生发酵产物的方法，这些方法包括：(a)用包含本发明的具有纤维二糖水解酶活性的变体的酶组合物使纤维素材料糖化；(b)用一种或多种(例如，若干种)发酵微生物发酵这一糖化的纤维素材料，以产生该发酵产物；以及(c)从该发酵中回收该发酵产物。

本发明还涉及发酵纤维素材料的方法，这些方法包括：用一种或多种(例如，若干种)发酵微生物发酵纤维素材料，其中所述纤维素材料是用包含本发明的具有纤维二糖水解酶活性的变体的酶组合物糖化的。在一方面，该纤维素材料的发酵产生发酵产物。在另一方面，这些方法进一步包括从该发酵中回收该发酵产物。

本发明的方法可以用于将纤维素材料糖化为可发酵糖，并且将可发酵糖转化为多种有用的发酵产物，例如燃料(乙醇、正丁醇、异丁醇、生物柴油、喷气燃料)和/或平台化合物(例如酸、醇、酮、气体、油等)。由该纤维素材料产生所希望的发酵产物典型地涉及预处理、酶水解(糖化)、以及发酵。

根据本发明的纤维素材料的加工可以使用本领域常规的方法来完成。此外，本发明的方法可以使用被配置成根据本发明来操作的任何常规生物质加工设备来实施。

分开的或同时的水解(糖化)和发酵包括但不限于：分开的水解和发酵(SHF)；同时的糖化和发酵(SSF)；同时的糖化和共发酵(SSCF)；混合的水解和发酵(HHF)；分开的水解和共发酵(SHCF)；混合的水解和共发酵(HHCF)；以及直接的微生物转变(DMC)，有时也被叫做整合生物加工(CBP)。SHF使用分开的处理步骤，以首先将纤维素材料酶促水解为可发酵糖(例如，葡萄糖、纤维二糖、以及戊糖单体)，并且然后将可发酵糖发酵为乙醇。在SSF中，纤维素材料的酶水解和糖发酵成乙醇被组合在一个步骤中(Philippidis，G.P.，1996，纤维素生物转化技术(Cellulose bioconversion technology)，Handbook on Bioethanol:Production and Utilization[生物乙醇手册：生产和利用]，Wyman，C.E.编辑，泰勒-弗朗西斯出版集团(Taylor&Francis)，华盛顿特区(Washington，DC)，179-212))。SSCF涉及多种糖的共发酵(Sheehan和Himmel，1999，Biotechnol.Prog.[生物技术进展]15:817-827)。HHF涉及分开的水解步骤并且另外涉及同时的糖化和水解步骤，其可在同一反应器中进行。HHF过程中的步骤可以在不同的温度下进行，即高温酶糖化，接着在发酵菌株能够耐受的更低温度下进行SSF。DMC在一个或多个(例如，若干个)步骤中合并了所有的三个过程(酶产生、水解、和发酵)，其中使用相同的有机体产生用于将纤维素材料转化为可发酵糖的酶并且用于将可发酵糖转化为终产物的酶(Lynd等人，2002，Microbiol.Mol.Biol.Reviews[微生物学与分子生物学评论]66:506-577)。在此应理解的是，本领域中已知的包括预处理、酶法水解(糖化)、发酵、或其组合的任何方法，可以用于实施本发明的方法。

常规的装置可以包括一个分批补料搅拌反应器、一个批式搅拌反应器、一个具有超滤作用的连续流搅拌反应器、和/或一个连续活塞流柱式反应器(continuous plug-flowcolumn reactor)(de Castilhos Corazza等人，2003，Acta Scientiarum.Technology[技术学报]25:33-38；Gusakov和Sinitsyn，1985，Enz.Microb.Technol.[酶学与微生物学技术]7:346-352)、一个碾磨反应器(Ryu和Lee，1983，Biotechnol.Bioeng.[生物技术与生物工程]25:53-65)。另外的反应器类型包括：用于水解和/或发酵的流化床反应器、升流式(upflow blanket)反应器、固定化反应器、以及挤出机型反应器。

预处理。在实践本发明的工艺中，可以使用本领域中已知的任何预处理工艺来破坏纤维素材料的植物细胞壁组分(Chandra等人，2007，Adv.Biochem.Engin./Biotechnol[生化工程/生物技术进展]108:67-93；Galbe和Zacchi，2007，生化工程/生物技术进展，108:41-65；Hendriks和Zeeman，2009，Bioresource Technology[生物资源技术]100:10-18；Mosier等人，2005，生物资源技术96:673-686；Taherzadeh和Karimi，2008，Int.J.Mol.Sci.[分子科学国际杂志]9:1621-1651；Yang和Wyman，2008，BiofuelsBioproducts and Biorefining-Biofpr.[生物燃料，生物产品和生物精制Biofpr.]2:26-40)。

纤维素材料也可以在预处理之前使用本领域中已知的方法进行粒度减小、筛分、预浸泡、润湿、洗涤和/或调理。

常规预处理包括但不限于：蒸汽预处理(伴随或不伴随爆炸)、稀酸预处理、热水预处理、碱预处理、石灰预处理、湿氧化、湿爆炸、氨纤维爆炸、有机溶剂预处理、以及生物预处理。另外的预处理包括氨渗滤、超声、电穿孔、微波、超临界CO₂、超临界H₂O、臭氧、离子液体以及γ辐射预处理。

可以在水解和/或发酵之前对纤维素材料进行预处理。优选在水解前进行预处理。可替代地，预处理可以与酶水解同时进行，以释放可发酵的糖，如葡萄糖、木糖、和/或纤维二糖。在多数情况下，预处理步骤本身使一些生物质转化为可发酵糖(即使在没有酶的情况下)。

蒸汽预处理。在蒸汽预处理中，加热纤维素材料以破坏植物细胞壁成分，包括木质素、半纤维素、以及纤维素，以使纤维素和其他级分，例如，半纤维素可接近酶。纤维素材料经过或穿过反应容器，将蒸汽注入该反应容器以增加温度至所需温度和压力，并且将蒸汽保持在其中持续希望的反应时间。优选地在140℃-250℃，例如，160℃-200℃或170℃-190℃进行蒸汽预处理，其中最佳温度范围取决于化学催化剂的任选添加。蒸汽预处理的停留时间优选是1-60分钟，例如1-30分钟、1-20分钟、3-12分钟、或4-10分钟，其中最适停留时间取决于温度和化学催化剂的任选添加。蒸汽预处理允许相对较高的固体加载量，这样使得纤维素材料在预处理过程中通常仅变得潮湿。蒸汽预处理经常与预处理后的材料的爆炸放料组合，这被称为蒸汽爆炸，即，快速闪变至大气压和材料湍流，以通过破碎增加可及的表面积(Duff和Murray，1996，Bioresource Technology[生物资源技术]855:1-33；Galbe和Zacchi，2002，Appl.Microbiol.Biotechnol.[应用微生物学与生物技术]59:618-628；美国专利申请号2002/0164730)。在蒸汽预处理过程中，半纤维素乙酰基基团被裂解，并且得到的酸自催化半纤维素部分水解成单糖和寡糖。仅在有限的程度上去除木质素。

化学预处理。术语“化学处理”指能促进纤维素、半纤维素和/或木质素分离和/或释放的任何化学处理。这种预处理可以将结晶纤维素转化为无定形纤维素。适合的化学预处理方法的实例包括例如稀酸预处理、石灰预处理、湿法氧化、氨纤维/冷冻膨胀(AFEX)、氨渗滤(APR)、离子液体、以及有机溶剂预处理。

经常在蒸汽预处理之前添加化学催化剂(如H₂SO₄或SO₂)(典型地是0.3％w/w至5％w/w)，该催化剂减少时间并降低温度、增加回收率、并改进酶水解(Ballesteros等人，2006，Appl.Biochem.Biotechnol.[应用生物化学与生物技术]129-132:496-508；Varga等人，2004，Appl.Biochem.Biotechnol.[应用生物化学与生物技术]113-116:509-523；Sassner等人，2006，Enzyme Microb.Technol.[酶与微生物技术]39:756-762)。在稀酸预处理中，纤维素材料与稀酸(典型地是H₂SO₄)和水混合，以形成浆料，由蒸汽加热至希望的温度，并且在停留时间后闪变至大气压。可采用多种反应器设计来进行稀酸预处理，例如，活塞流反应器、逆流反应器或连续逆流收缩床反应器(Duff和Murray，1996，Bioresource Technology[生物资源技术]855:1-33；Schell等人，2004，Bioresource Technology[生物资源技术]91:179-188；Lee等人，1999，Adv.Biochem.Eng.Biotechnol.[生物化学工程/生物技术进展]65:93-115)。

还可以使用在碱性条件下的若干种预处理方法。这些碱性预处理包括但不限于：氢氧化钠、石灰、湿氧化、氨渗滤(APR)、以及氨纤维/冷冻膨胀(AFEX)预处理。

用氧化钙或氢氧化钙，在85℃-150℃的温度下进行石灰预处理，并且停留时间为从1小时到若干天(Wyman等人，2005，Bioresource Technology[生物资源技术]96:1959-1966；Mosier等人，2005，Bioresource Technology[生物资源技术]96:673-686)。WO 2006/110891、WO 2006/110899、WO 2006/110900、和WO 2006/110901披露了使用氨的预处理方法。

湿氧化是一种热预处理，其典型地在添加氧化剂(例如过氧化氢或过压氧)的情况下在180℃-200℃下持续5分钟-15分钟进行(Schmidt和Thomsen，1998，BioresourceTechnology[生物资源技术]64:139-151；Palonen等人，2004，Appl.Biochem.Biotechnol.[应用生物化学与生物技术]117:1-17；Varga等人，2004，Biotechnol.Bioeng.[生物技术与生物工程]88:567-574；Martin等人，2006，J.Chem.Technol.Biotechnol.[化学技术与生物技术杂志]81:1669-1677)。优选地在1％-40％干物质，例如2％-30％干物质或5％-20％干物质下进行预处理，并且通常通过添加碱，例如碳酸钠提高初始pH。

被称为湿爆炸(湿氧化和蒸汽爆炸的组合)的湿氧化预处理方法的修改方案能够处理高达30％的干物质。在湿爆炸中，在某一停留时间后，在预处理期间引入氧化剂。然后通过急骤蒸发至大气压结束预处理(WO 2006/032282)。

氨纤维爆发(AFEX)涉及在中等温度如90℃-150℃和高压如17巴-20巴下，用液体或气态氨处理纤维素材料5分钟-10分钟，其中干物质含量可以高达60％(Gollapalli等人，2002，Appl.Biochem.Biotechnol.[应用生物化学与生物技术]98:23-35；Chundawat等人，2007，Biotechnol.Bioeng.[生物技术与生物工程]96:219-231；Alizadeh等人，2005，Appl.Biochem.Biotechnol.[应用生物化学与生物技术]121:1133-1141；Teymouri等人，2005，Bioresource Technology[生物资源技术]96:2014-2018)。在AFEX预处理期间，纤维素和半纤维素保持相对完整。木质素-碳水化合物复合物被裂解。

有机溶剂预处理通过使用含水乙醇(40％-60％乙醇)在160℃-200℃下提取30分钟-60分钟而将纤维素材料脱木质素(Pan等人，2005，Biotechnol.Bioeng.[生物技术与生物工程]90:473-481；Pan等人，2006，Biotechnol.Bioeng.[生物技术与生物工程]94:851-861；Kurabi等人，2005，Appl.Biochem.Biotechnol.[应用生物化学与生物技术]121:219-230)。通常添加硫酸作为催化剂。在有机溶剂预处理中，大部分半纤维素和木质素被去除。

适合的预处理方法的其他实例由Schell等人，2003，Appl.Biochem.Biotechnol.[应用生物化学与生物技术]105-108:69-85，和Mosier等人，2005，BioresourceTechnology[生物资源技术]96:673-686，以及美国专利申请2002/0164730进行了描述。

在一方面，化学预处理优选作为稀酸处理，并且更优选作为连续稀酸处理进行。酸典型地是硫酸，但也可以使用其他酸，例如乙酸、柠檬酸、硝酸、磷酸、酒石酸、琥珀酸、氯化氢、或其混合物。弱酸处理优选地在1-5，例如，1-4或1-2.5的pH范围中进行。在一方面，酸浓度优选地在从0.01wt.％至10wt.％酸，例如，0.05wt.％至5wt.％酸或0.1wt.％至2wt.％酸的范围内。使酸与纤维素材料相接触，并且保持在优选地140℃-200℃，例如，165℃-190℃范围内的温度下，持续从1分钟至60分钟范围内的时间。

在另一方面，预处理在水性浆料中进行。在优选方面，在预处理过程中纤维素材料以优选在10wt.％-80wt.％之间，例如20wt.％-70wt.％或30wt.％-60wt.％，如大约40wt.％的量存在。预处理的纤维素材料可以不洗涤或使用本领域已知的任何方法洗涤，例如，用水洗涤。

机械预处理或物理预处理：术语“机械预处理”或“物理预处理”是指促进颗粒粒度减小的任何预处理。例如，这种预处理可以涉及各种类型的研磨或碾磨(例如，干磨、湿磨、或振动球磨)。

纤维素材料可以物理地(机械地)且化学地预处理。机械或物理预处理可以与蒸汽/蒸汽爆炸、水热解(hydrothermolysis)、稀酸或弱酸处理、高温、高压处理、辐射(例如，微波福射)或其组合相结合。在一方面，高压意指在优选约100至约400psi，例如约150至约250psi范围中的压力。在另一方面，高温意指在约100℃至约300℃，例如约140℃至约200℃范围内的温度。在一个优选方面，机械或物理预处理在分批过程中使用蒸汽枪水解器系统，例如从顺智公司(Sunds Defibrator AB)，瑞典可获得的顺智水解器(Sunds Hydrolyzer)来进行，该系统使用如上所定义的高压和高温。这些物理预处理和化学预处理可以根据需要顺序地进行或同时进行。

因此，在一个优选的方面，使纤维素材料经受物理(机械)或化学预处理、或其任何组合，以促进纤维素、半纤维素和/或木质素的分离和/或释放。

生物预处理。术语“生物预处理”是指促进纤维素、半纤维素、和/或木质素从纤维素材料中分离和/或释放的任何生物预处理。生物预处理技术可以涉及应用溶解木质素的微生物和/或酶(参见，例如，Hsu,T.-A.，1996，Pretreatment of biomass[生物质的预处理]，在Handbook on Bioethanol:Production and Utilization[生物乙醇手册：生产和利用]，Wyman,C.E.编辑，泰勒-弗朗西斯出版集团，华盛顿特区，179-212；Ghosh和Singh，1993，Adv.Appl.Microbiol.[应用微生物学进展]39:295-333；McMillan,J.D.，1994，Pretreating lignocellulosic biomass:a review[预处理木质纤维素生物质：综述]，在Enzymatic Conversion of Biomass for Fuels Production[用于燃料生产的生物质的酶转化]，Himmel,M.E.，Baker,J.O.，和Overend,R.P.编辑，ACS Symposium Series566[美国化学学会讨论会系列566]，American Chemical Society[美国化学学会]，华盛顿特区，第15章；Gong,C.S.，Cao,N.J.，Du,J.，和Tsao,G.T.，1999，Ethanol production fromrenewable resources[由可再生资源生产乙醇]，在Advances in BiochemicalEngineering/Biotechnology[生物化学工程/生物技术的进展]，Scheper,T.编辑，施普林格出版社(Springer-Verlag)，柏林，海德堡，德国，65:207-241；Olsson和Hahn-Hagerdal，1996，Enz.Microb.Tech.[酶与微生物技术]18:312-331；以及Vallander和Eriksson，1990，Adv.Biochem.Eng./Biotechnol.[生物化学工程/生物技术的进展]42:63-95)。

糖化。在水解步骤(还称为糖化)中，将(例如预处理的)纤维素材料水解，以将纤维素和/或半纤维素分解成可发酵糖，如葡萄糖、纤维二糖、木糖、木酮糖、阿拉伯糖、甘露糖、半乳糖和/或可溶性寡糖。在一个或多个阶段中，水解是由一种或多种酶组合物酶促进行。水解可以作为分批过程或系列分批过程进行。水解可以作为分批补料或连续过程、或系列分批补料或连续过程进行，其中将该纤维素材料逐渐进料至例如含有酶组合物的水解溶液中。在实施例中，该糖化是连续糖化，其中在整个糖化过程中以不同间隔添加纤维素材料和纤维素分解酶组合物，并且在整个糖化过程中以不同间隔去除水解产物。可以在添加纤维素材料和纤维素分解酶组合物之前、同时或之后进行水解产物的去除。

酶法水解优选在易于由本领域技术人员确定的条件下，在合适的水性环境中进行。在一方面，水解在适合于一种或多种酶的活性，即，对于这种或这些酶来说最佳的条件下进行。

糖化通常在搅拌釜反应器或发酵罐中，在受控的pH、温度、和混合条件下进行。适合的处理时间、温度以及pH条件可以由本领域技术人员容易地确定。例如，总糖化时间可以持续长达200小时，但是典型地进行优选约4至约120小时，例如约12至约96小时或约24至约72小时。温度优选地在约25℃至约80℃，例如，约30℃至约70℃、约40℃至约60℃、或约50℃至55℃的范围内。pH优选在约3至约9，例如约3.5至约8、约4至约7、约4.2至约6、或约4.3至约5.5的范围内。

干固体含量在大约5到大约50wt.％的范围内，例如大约10wt.％至大约40wt.％，或大约20wt.％到大约30wt.％。

在一方面，在至少0.5％饱和度的浓度的溶解氧的存在下，进行该糖化。

在本发明的实施例中，糖化过程中的溶解氧浓度处于至少0.5％上至30％饱和度范围内，例如至少1％上至25％、至少1％上至20％、至少1％上至15％、至少1％上至10％、至少1％上至5％、和至少1％上至3％饱和度。在优选的实施例中，在糖化期的至少25％，例如在糖化期的至少50％或至少75％过程中，将溶解氧的浓度维持在至少0.5％上至30％的饱和度的浓度下，例如至少1％上至25％、至少1％上至20％、至少1％上至15％、至少1％上至10％、至少1％上至5％、至少1％上至3％饱和度。当该酶组合物包括氧化还原酶时，该溶解氧的浓度可以更高，达70％的饱和度。

向容器中添加氧，以在糖化过程中达到所希望的溶解氧浓度。可以通过经由扩散器或喷雾器添加压缩空气或通过其他已知的通气方法给容器、槽等通气而将溶解氧水平维持在所希望的范围内。可以在来自放置于容器/槽中的溶解氧传感器的反馈的基础上控制通气速率或该系统可以在没有反馈控制的情况下以恒定速率运行。在水解行列由多个串联的容器/槽组成的情况下，可以在这些容器/槽中的一个或多个或所有容器/槽中实施通气。通氧系统在本领域是熟知的。根据本发明，可以使用任何适合的通气系统。商业通气系统由例如英格兰德比的凯米尼尔公司(Chemineer)设计并且由例如美国密苏里州的保罗·穆勒公司(Paul Mueller Company)制造。

酶组合物可以包含在降解纤维素材料中有用的任何蛋白。

在一方面，该酶组合物包含或进一步包含选自下组的一种或多种(例如，若干种)蛋白质，该组由以下组成：纤维素酶、AA9多肽、半纤维素酶、酯酶、棒曲霉素、木质素分解酶、氧化还原酶、果胶酶、蛋白酶以及膨胀蛋白。在另一方面，纤维素酶优选是选自下组的一种或多种(例如，若干种)酶，该组由以下组成：内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶。在另一方面，半纤维素酶优选是选自下组的一种或多种(例如，若干种)酶，该组由以下组成：乙酰甘露聚糖酯酶、乙酰木聚糖酯酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、香豆酸酯酶、阿魏酸酯酶、半乳糖苷酶、葡糖醛酸糖苷酶、葡萄糖醛酸酯酶、甘露聚糖酶、甘露糖苷酶、木聚糖酶、以及木糖苷酶。在另一方面，该氧化还原酶优选是选自下组的一种或多种(例如，若干种)酶，该组由以下组成：过氧化氢酶、漆酶以及过氧化物酶。

在另一方面，该酶组合物包括一种或多种(例如，若干种)纤维素分解酶。在另一方面，该酶组合物包括或进一步包括一种或多种(例如，若干种)半纤维素分解酶。在另一方面，该酶组合物包括一种或多种(例如，若干种)纤维素分解酶和一种或多种(例如，若干种)半纤维素分解酶。在另一方面，该酶组合物包括选自纤维素分解酶和半纤维素分解酶的组的一种或多种(例如，若干种)酶。在另一方面，所述酶组合物包含一种内切葡聚糖酶。在另一方面，该酶组合物包括一种纤维二糖水解酶。在另一方面，该酶组合物包括β-葡糖苷酶。在另一方面，该酶组合物包含AA9多肽。在另一方面，该酶组合物包含内切葡聚糖酶和AA9多肽。在另一方面，该酶组合物包含纤维二糖水解酶和AA9多肽。在另一方面，该酶组合物包含β-葡糖苷酶和AA9多肽。在另一方面，该酶组合物包含内切葡聚糖酶和纤维二糖水解酶。在另一方面，该酶组合物包含内切葡聚糖酶I、内切葡聚糖酶II、或内切葡聚糖酶I和内切葡聚糖酶II的组合、以及纤维二糖水解酶I、纤维二糖水解酶II、或纤维二糖水解酶I和纤维二糖水解酶II的组合。在另一方面，该酶组合物包含内切葡聚糖酶和β-葡糖苷酶。在另一方面，该酶组合物包含内切葡聚糖酶I、内切葡聚糖酶II、或内切葡聚糖酶I和内切葡聚糖酶II的组合、以及β-葡糖苷酶。在另一方面，该酶组合物包含β-葡糖苷酶和纤维二糖水解酶。在另一方面，该酶组合物包含β-葡糖苷酶和纤维二糖水解酶I、纤维二糖水解酶II、或纤维二糖水解酶I和纤维二糖水解酶II的组合。在另一方面，该酶组合物包含内切葡聚糖酶、AA9多肽、以及纤维二糖水解酶。在另一方面，该酶组合物包含内切葡聚糖酶I、内切葡聚糖酶II、或内切葡聚糖酶I和内切葡聚糖酶II的组合、AA9多肽、以及纤维二糖水解酶I、纤维二糖水解酶II、或纤维二糖水解酶I和纤维二糖水解酶II的组合。在另一方面，该酶组合物包含内切葡聚糖酶、β-葡糖苷酶、和AA9多肽。在另一方面，该酶组合物包含β-葡糖苷酶、AA9多肽、和纤维二糖水解酶。在另一方面，该酶组合物包含β-葡糖苷酶、AA9多肽、以及纤维二糖水解酶I、纤维二糖水解酶II、或纤维二糖水解酶I和纤维二糖水解酶II的组合。在另一方面，该酶组合物包含内切葡聚糖酶、β-葡糖苷酶和纤维二糖水解酶。在另一方面，该酶组合物包含内切葡聚糖酶I、内切葡聚糖酶II、或内切葡聚糖酶I和内切葡聚糖酶II的组合、β-葡糖苷酶、以及纤维二糖水解酶I、纤维二糖水解酶II、或纤维二糖水解酶I和纤维二糖水解酶II的组合。在另一方面，该酶组合物包含内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、和AA9多肽。在另一方面，该酶组合物包含内切葡聚糖酶I、内切葡聚糖酶II、或内切葡聚糖酶I和内切葡聚糖酶II的组合、β-葡糖苷酶、AA9多肽、以及纤维二糖水解酶I、纤维二糖水解酶II、或纤维二糖水解酶I和纤维二糖水解酶II的组合。

在另一方面，所述酶组合物包含乙酰甘露聚糖酯酶。在另一方面，该酶组合物包含乙酰木聚糖酯酶。在另一方面，该酶组合物包含阿拉伯聚糖酶(例如，α-L-阿拉伯聚糖酶)。在另一方面，该酶组合物包含阿拉伯呋喃糖苷酶(例如，α-L-阿拉伯呋喃糖苷酶)。在另一方面，该酶组合物包含香豆酸酯酶。在另一方面，该酶组合物包含阿魏酸酯酶。在另一方面，该酶组合物包含半乳糖苷酶(例如，α-半乳糖苷酶和/或β-半乳糖苷酶)。在另一方面，该酶组合物包含葡糖醛酸糖苷酶(例如，α-D-葡糖醛酸糖苷酶)。在另一方面，该酶组合物包含葡糖醛酸酯酶。在另一方面，该酶组合物包含甘露聚糖酶。在另一方面，该酶组合物包含甘露糖苷酶(例如，β-甘露糖苷酶)。在另一方面，该酶组合物包含木聚糖酶。在一个实施例中，木聚糖酶是家族10木聚糖酶。在另一个实施例中，木聚糖酶是家族11木聚糖酶。在另一方面，该酶组合物包含木糖苷酶(例如，β-木糖苷酶)。

在另一方面，该酶组合物包含酯酶。在另一方面，该酶组合物包含棒曲霉素。在另一方面，该酶组合物包含木质素分解酶。在一个实施例中，木质素分解酶是锰过氧化物酶。在另一个实施例中，木质素分解酶是木质素过氧化物酶。在另一个实施例中，木质素分解酶是产生H₂O₂的酶。在另一方面，该酶组合物包含果胶酶。在另一方面，该酶组合物包含氧化还原酶。在一个实施例中，氧化还原酶是过氧化氢酶。在另一个实施例中，氧化还原酶是漆酶。在另一个实施例中，氧化还原酶是过氧化物酶。在另一方面，酶组合物包含蛋白酶。在另一方面，酶组合物包含膨胀蛋白。

在本发明的方法中，可以在糖化、糖化和发酵、或发酵之前或期间添加该一种或多种酶。

该酶组合物的一种或多种(例如，若干种)组分可以是天然蛋白、重组蛋白或天然蛋白与重组蛋白的组合。例如，一种或多种(例如，若干种)组分可以是用作宿主细胞以重组表达该酶组合物的一种或多种(例如，若干种)其他组分的细胞的天然蛋白。在此应理解的是，重组蛋白对于宿主细胞可以是异源的(例如，外源的)和/或原生的。可以作为单组分生成酶组合物的一种或多种(例如，若干种)组分，然后将它们组合以形成酶组合物。酶组合物可以是多组分和单组分蛋白制剂的组合。

在本发明的方法中使用的酶可以是以任何适于使用的形式存在的，例如像发酵液配制品或细胞组合物、具有或不具有细胞碎片的细胞裂解物、半纯化或纯化的酶制剂、或作为酶的来源的宿主细胞。该酶组合物可以是干粉或颗粒、非尘颗粒、液体、稳定化的液体或稳定化的受保护的酶。可以根据已建立的方法例如通过添加稳定剂(例如糖、糖醇或其他多元醇)、和/或乳酸或另一种有机酸，对液体酶制剂进行稳定化。

具有纤维二糖水解酶活性的酶和变体的最佳量取决于若干因素，包括但不限于：纤维素分解酶和/或半纤维素分解酶的混合物、纤维素材料、纤维素材料的浓度、纤维素材料的一种或多种预处理、温度、时间、pH、以及发酵生物体(例如，用于同时糖化和发酵)的纳入。

在一方面，纤维素分解酶或半纤维素分解酶对纤维素材料的有效量是约0.5mg至约50mg，例如，约0.5mg至约40mg、约0.5mg至约25mg、约0.75mg至约20mg、约0.75mg至约15mg、约0.5mg至约10mg、或约2.5mg至约10mg/g纤维素材料。

在另一方面，具有纤维二糖水解酶活性的变体对纤维素或半纤维素材料的有效量是约0.01mg至约50.0mg，例如，约0.01mg至约40mg、约0.01mg至约30mg、约0.01mg至约20mg、约0.01mg至约10mg、约0.01mg至约5mg、约0.025mg至约1.5mg、约0.05mg至约1.25mg、约0.075mg至约1.25mg、约0.1mg至约1.25mg、约0.15mg至约1.25mg、或约0.25mg至约1.0mg/g纤维素或半纤维素材料。

在另一方面，对于纤维素分解酶或半纤维素分解酶来说的具有纤维二糖水解酶活性的变体的有效量是约0.005g至约1.0g，例如约0.01g至约1.0g、约0.15g至约0.75g、约0.15g至约0.5g、约0.1g至约0.5g、约0.1g至约0.25g、或约0.05g至约0.2g/g的纤维素分解酶或半纤维素分解酶。

具有纤维素分解酶活性或半纤维素分解酶活性的多肽以及有用于降解纤维素或半纤维素材料的其他蛋白/多肽(例如，AA9多肽)可以从任何合适的来源衍生或获得，包括古细菌、细菌、真菌、酵母、植物或哺乳动物来源。术语“获得的”在此还意指所述酶可能已在宿主生物中采用在此所描的方法重组产生，其中重组产生的酶对于宿主有机体是天然的或外源的，或具有修饰的氨基酸序列，例如，具有一个或多个(例如，若干个)缺失、插入和/或取代的氨基酸，即，重组产生的酶为天然氨基酸序列的突变体和/或片段，或通过本领域已知的核酸改组方法产生的酶。天然酶的含义中涵盖天然变体，而外源酶的含义中涵盖例如，通过定点诱变或改组获得的变体。

每种多肽都可以是细菌多肽。例如，每种多肽可以是具有酶活性的革兰氏阳性细菌多肽，或具有酶活性的革兰氏阴性细菌多肽。

每种多肽还可以是真菌多肽(例如，酵母菌多肽或丝状真菌多肽)。

还可以使用多肽的化学修饰的或蛋白质工程化的突变体。

该酶组合物的一种或多种(例如，若干种)组分可以是重组组分，即，通过克隆编码该单一组分的DNA序列并且随后用该DNA序列转化细胞并且在宿主中表达产生(参见，例如，WO 91/17243和WO 91/17244)。所述宿主可以是异源宿主(酶对于宿主来说是外源的)，但所述宿主在某些条件下也可以是同源宿主(酶对于宿主来说是天然的)。还可以通过纯化来自发酵液的此种蛋白质来制备单组分纤维素分解蛋白。

在一方面，这种或这些(例如，若干种)纤维素分解酶包含商业纤维素分解酶制剂。适用于本发明的商业纤维素分解酶制剂的实例包括例如：CTec(诺维信公司)、CTec2(诺维信公司)、CTec3(诺维信公司)、CTec4(诺维信公司)、CELLUCLAST^TM(诺维信公司)、NOVOZYM^TM188(诺维信公司)、SPEZYME^TMCP(杰能科国际(Genencor Int.))、ACCELLERASE^TMTRIO(杜邦公司(DuPont))、NL(DSM公司)；S/L 100(DSM公司)、ROHAMENT^TM7069W(罗姆公司(GmbH))、或CMAX3^TM(并矢国际有限公司(Dyadic International,Inc.))。以从约0.001wt.％至约5.0wt.％的固体，例如0.025wt.％至约4.0wt.％的固体、或约0.005wt.％至约2.0wt.％的固体的有效量添加纤维素分解酶制剂。

可在本发明的方法中使用的细菌内切葡聚糖酶的实例包括但不限于：解纤维热酸菌(Acidothermus cellulolyticus)内切葡聚糖酶(WO 91/05039；WO 93/15186；美国专利申请号5,275,944；WO 96/02551；美国专利申请号5,536,655，WO 00/70031，WO 05/093050)、胡萝卜软腐欧文氏菌(Erwinia carotovara)内切葡聚糖酶(Saarilahti等人，1990，Gene[基因]90：9-14)、嗜热裂孢菌(Thermobifida fusca)内切葡聚糖酶III(WO 05/093050)、以及嗜热裂孢菌(Thermobifida fusca)内切葡聚糖酶V(WO05/093050)。

可以用于本发明的真菌内切葡聚糖酶的实例包括但不限于：里氏木霉内切葡聚糖酶I(Penttila等人，1986，Gene[基因]45:253-263，里氏木霉Cel7B内切葡聚糖酶I(GenBank:M15665)、里氏木霉内切葡聚糖酶II(Saloheimo等人，1988，Gene[基因]63:11-22)，里氏木霉Cel5A内切葡聚糖酶II(GenBank:M19373)、里氏木霉内切葡聚糖酶III(Okada等人，1988，Appl.Environ.Microbiol.[应用与环境微生物学]64:555-563，GenBank:AB003694)、里氏木霉内切葡聚糖酶V(Saloheimo等人，1994，Molecular Microbiology[分子微生物学]13:219-228，GenBank:Z33381)、棘孢曲霉内切葡聚糖酶(Ooi等人，1990，Nucleic Acids Research[核酸研究]18:5884)、白曲霉内切葡聚糖酶(Sakamoto等人，1995，Current Genetics[当代遗传学]27:435-439)、尖孢镰孢菌内切葡聚糖酶(GenBank:L29381)、灰腐质霉高温变种(Humicola grisea var.thermoidea)内切葡聚糖酶(GenBank:AB003107)、热白丝菌(Melanocarpus albomyces)内切葡聚糖酶(GenBank:MAL515703)、粗糙脉孢菌内切葡聚糖酶(GenBank:XM_324477)、特异腐质霉内切葡聚糖酶V、嗜热毁丝霉CBS117.65内切葡聚糖酶、金黄色嗜热子囊菌内切葡聚糖酶I(GenBank:AF487830)、里氏木霉菌株号VTT-D-80133内切葡聚糖酶(GenBank:M15665)、以及嗜松青霉内切葡聚糖酶(WO2012/062220)。

可用在本发明中的纤维二糖水解酶的实例包括但不限于：棘孢曲霉纤维二糖水解酶II(WO 2011/059740)、烟曲霉纤维二糖水解酶I(WO 2013/028928)、烟曲霉纤维二糖水解酶II(WO 2013/028928)、嗜热毛壳菌纤维二糖水解酶I、嗜热毛壳菌纤维二糖水解酶II、特异腐质霉纤维二糖水解酶I、嗜热毁丝霉纤维二糖水解酶II(WO2009/042871)、奥斯塔尼青霉(Penicillium occitanis)纤维二糖水解酶I(GenBank:AY690482)、埃默森篮状菌纤维二糖水解酶I(GenBank:AF439936)、赫卡尼亚梭孢壳霉(Thielavia hyrcanie)纤维二糖水解酶II(WO 2010/141325)、土生梭孢壳霉纤维二糖水解酶II(CEL6A，WO 2006/074435)、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、以及褐孢长毛盘菌纤维二糖水解酶II(WO2010/057086)。

适用于本发明的β-葡糖苷酶的实例包括但不限于来自以下的β-葡糖苷酶：棘孢曲霉(Aspergillus aculeatus)(Kawaguchi等人，1996，Gene[基因]173:287-288)、烟曲霉(Aspergillus fumigatus)(WO 2005/047499)、黑曲霉(Aspergillus niger)(Dan等人，2000，J.Biol.Chem.[生物化学杂志]275:4973-4980)、米曲霉(WO 02/095014)、巴西青霉菌(Penicillium brasilianum)IBT 20888(WO 2007/019442和WO 2010/088387)、土生梭孢壳霉(Thielavia terrestris)(WO 2011/035029)、以及褐孢长毛盘菌(Trichophaeasaccata)(WO 2007/019442)。

其他有用的内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶在使用根据下述文献的分类的很多糖基水解酶家族中披露：Henrissat，1991，Biochem.J.[生物化学杂志]280:309-316，以及Henrissat和Bairoch，1996，Biochem.J.[生物化学杂志]316:695-696。

在本发明的方法中，任何AA9多肽都可以被用作酶组合物的组分。

在本发明的方法中有用的AA9多肽的实例包括但不限于来自于以下的AA9多肽：土生梭孢壳霉(Thielavia terrestris)(WO 2005/074647、WO 2008/148131、和WO 2011/035027)、橙色嗜热子囊菌(Thermoascus aurantiacus)(WO 2005/074656和WO 2010/065830)、里氏木霉(Trichoderma reesei)(WO 2007/089290和WO 2012/149344)、嗜热毁丝霉(Myceliophthora thermophila)(WO 2009/085935、WO 2009/085859、WO 2009/085864、WO 2009/085868、和WO 2009/033071)、烟曲霉(Aspergillus fumigatus)(WO 2010/138754)、嗜松青霉(Penicillium pinophilum)(WO 2011/005867)、嗜热子囊菌属(Thermoascus)物种(WO 2011/039319)、青霉属(Penicillium)物种(埃默森青霉菌(emersoni)(WO 2011/041397和WO 2012/000892))、甲壳嗜热子囊菌(Thermoascuscrustaceous)(WO 2011/041504)、棘孢曲霉(Aspergillus aculeatus)(WO 2012/030799)、疏棉状嗜热丝孢菌(Thermomyces lanuginosus)(WO 2012/113340、WO 2012/129699、WO2012/130964、和WO 2012/129699)、Aurantiporus alborubescens(WO 2012/122477)、褐孢长毛盘菌(Trichophaea saccata)(WO 2012/122477)、托姆青霉(Penicillium thomii)(WO2012/122477)、柄篮状菌(Talaromyces stipitatus)(WO 2012/135659)、特异腐质霉(Humicola insolens)(WO 2012/146171)、樟绒枝霉(Malbranchea cinnamomea)(WO 2012/101206)、雷塞氏篮状菌(Talaromyces leycettanus)(WO 2012/101206)、嗜热毛壳菌(Chaetomium thermophilum)(WO 2012/101206)、嗜热篮状菌(Talaromycesthermophilus)(WO 2012/129697和WO 2012/130950)、梭孢端梗霉(Acrophialophorafusispora)(WO 2013/043910)、和瘤孢棒囊菌(Corynascus sepedonium)(WO 2013/043910)。

在一方面，AA9多肽在根据WO 2008/151043或WO 2012/122518的可溶性活化二价金属阳离子(例如，锰或铜)的存在下使用。

在另一方面，AA9多肽在二氧化合物、二环化合物、杂环化合物、含氮化合物、醌化合物、含硫化合物、或从预处理的纤维素材料(例如预处理的玉米秸秆)获得的液体的存在下使用(WO 2012/021394、WO 2012/021395、WO 2012/021396、WO 2012/021399、WO 2012/021400、WO 2012/021401、WO 2012/021408、以及WO 2012/021410)。

在一方面，以这样一种化合物对纤维素的葡糖基单元的以下摩尔比添加该化合物：约10^-6至约10、例如约10^-6至约7.5、约10^-6至约5、约10^-6至约2.5、约10^-6至约1、约10^-5至约1、约10^-5至约10^-1、约10^-4至约10^-1、约10^-3至约10^-1、或约10^-3至约10^-2。在另一方面，这样一种化合物的有效量是约0.1μM至约1M，例如约0.5μM至约0.75M、约0.75μM至约0.5M、约1μM至约0.25M、约1μM至约0.1M、约5μM至约50mM、约10μM至约25mM、约50μM至约25mM、约10μM至约10mM、约5μM至约5mM、或约0.1mM至约1mM。

术语“液体(liquor)”意指在如描述于WO 2012/021401中的条件下，由处理浆料中的木质纤维素和/或半纤维素材料、或其单糖(例如，木糖、阿拉伯糖、甘露糖等)所产生的溶液相(水相、有机相或其组合)、及其可溶性内容物。用于AA9多肽的纤维素分解增强的液体可以通过，任选在催化剂(例如酸)的存在下、任选在有机溶剂的存在下、并且任选与物理破坏一种木质纤维素或半纤维素材料(或原料)组合，通过施加热和/或压力来对该材料进行处理，并且然后将溶液与残余固体分离来产生。在由纤维素分解酶制剂对纤维素底物的水解过程中，从液体与AA9多肽的组合中可得到纤维素分解增强的程度是由这类条件确定的。可以使用本领域的标准方法，如过滤、沉淀或离心，而将液体与经过处理的材料进行分离。

在一方面，对于纤维素来说的液体的有效量是约10^-6至约10g/g的纤维素，例如约10^-6至约7.5g、约10^-6至约5g、约10^-6至约2.5g、约10^-6至约1g、约10^-5至约1g、约10^-5至约10^- ¹g、约10^-4至约10^-1g、约10^-3至约10^-1g、或约10^-3至约10^-2g/g的纤维素。

在一方面，该一种或多种(例如，若干种)半纤维素分解酶包括商业半纤维素分解酶制剂。适于在本发明中使用的商业化半纤维素分解酶制剂的实例包括例如SHEARZYME^TM(诺维信公司)、HTec(诺维信公司)、HTec2(诺维信公司)、HTec3(诺维信公司)、(诺维信公司)、(诺维信公司)、HC(诺维信公司)、木聚糖酶(杰能科公司)、XY(杰能科公司)、XC(杰能科公司)、TX-200A(AB酶公司(AB Enzymes))、HSP 6000木聚糖酶(DSM)、DEPOL^TM333P(生物催化剂有限公司(Biocatalysts Limit)，威尔士，英国)、DEPOL^TM740L。(生物催化剂有限公司，威尔士，英国)以及DEPOL^TM762P(生物催化剂有限公司，威尔士，英国)、ALTERNAFUEL 100P(Dyadic公司)和ALTERNAFUEL 200P(Dyadic公司)。

在本发明的方法中有用的木聚糖酶的实例包括但不限于来自以下的木聚糖酶：棘孢曲霉(Aspergillus aculeatus)(GeneSeqP:AAR63790；WO 94/21785)、烟曲霉(Aspergillus fumigatus)(WO 2006/078256)、嗜松青霉(Penicillium pinophilum)(WO2011/041405)、青霉属(Penicillium)物种(WO 2010/126772)、疏棉状嗜热丝孢菌(Thermomyces lanuginosus)(GeneSeqP:BAA22485)、嗜热篮状菌(Talaromycesthermophilus)(GeneSeqP:BAA22834)、土生梭孢霉(Thielavia terrestris)NRRL 8126(WO2009/079210)和褐孢长毛盘菌(Trichophaea saccata)(WO 2011/057083)。

在本发明的方法中有用的β-木糖苷酶的实例包括但不限于来自以下的β-木糖苷酶：粗糙脉孢菌(Neurospora crassa)(SwissProt:Q7SOW4)、里氏木霉(Trichodermareesei)(UniProtKB/TrEMBL:Q92458)、埃默森篮状菌(Talaromyces emersonii)(SwissProt:Q8X212)、和嗜热篮状菌(Talaromyces thermophilus)(GeneSeqP:BAA22816)。

在本发明的方法中有用的乙酰木聚糖酯酶的实例包括但不限于来自以下的乙酰木聚糖酯酶：棘孢曲霉(WO 2010/108918)，球毛壳菌(UniProt:Q2GWX4)，细丽毛壳菌(Chaetomium gracile)(GeneSeqP:AAB82124)，特异腐质霉DSM 1800(WO 2009/073709)，红褐肉座菌(WO 2005/001036)，嗜热毁丝菌(Myceliophtera thermophila)(WO 2010/014880)，粗糙脉孢菌(UniProt:q7s259)，颖枯壳针孢(Phaeosphaeria nodorum)(UniProt:Q0UHJ1)，以及土生梭孢壳霉NRRL 8126(WO 2009/042846)。

在本发明的方法中有用的阿魏酸酯酶(feruloyl esterase，ferulic acidesterase)的实例包括但不限于来自以下的阿魏酸酯酶：特异腐质霉(Humicola insolens)DSM 1800(WO 2009/076122)、费希新萨托菌(Neosartorya fischeri)(UniProt:A1D9T4)、粗糙脉孢菌(Neurospora crassa)(UniProt:Q9HGR3)、黄灰青霉(Penicilliumaurantiogriseum)(WO 2009/127729)、以及土生梭孢壳霉(Thielavia terrestris)(WO2010/053838和WO 2010/065448)。

在本发明的方法中有用的阿拉伯呋喃糖苷酶的实例包括但不限于来自以下的阿拉伯呋喃糖苷酶：黑曲霉(Aspergillus niger)(GeneSeqP:AAR94170)、特异腐质霉(Humicola insolens)DSM 1800(WO 2006/114094和WO 2009/073383)、以及大型亚灰树花菌(M.giganteus)(WO 2006/114094)。

在本发明的方法中有用的α-葡糖醛酸糖苷酶的实例包括但不限于来自以下的α-葡糖醛酸糖苷酶：棒曲霉(Aspergillus clavatus)(UniProt:alcc12)、烟曲霉(Aspergillus fumigatus)(SwissProt:Q4WW45)、黑曲霉(Aspergillus niger)(UniProt:Q96WX9)、土曲霉(Aspergillus terreus)(SwissProt:Q0CJP9)、特异腐质霉(Humicolainsolens)(WO 2010/014706)、黄灰青霉(Penicillium aurantiogriseum)(WO 2009/068565)、埃默森篮状菌Talaromyces emersonii)((UniProt:Q8X211)、以及里氏木霉(Trichoderma reesei)(UniProt:Q99024)。

在本发明的方法中有用的氧化还原酶的实例包括但不限于：Aspergilluslentilus过氧化氢酶、烟曲霉过氧化氢酶、黑曲霉过氧化氢酶、米曲霉过氧化氢酶、特异腐质霉过氧化氢酶、粗糙脉孢菌过氧化氢酶、埃默森青霉过氧化氢酶、嗜热色串孢(Scytalidium thermophilum)过氧化氢酶、柄篮状菌过氧化氢酶、橙色嗜热子囊菌过氧化氢酶、灰盖鬼伞(Coprinus cinereus)漆酶、嗜热毁丝霉漆酶、Polyporus pinsitus漆酶、鲜红密孔菌(Pycnoporus cinnabarinus)漆酶、立枯丝核菌(Rhizoctonia solani)漆酶、天蓝链霉菌(Streptomyces coelicolor)漆酶、灰盖鬼伞过氧化物酶、大豆过氧化物酶、王棕(Royal palm)过氧化物酶。

用于本发明的方法中的具有酶活性的多肽可以通过在含有适合碳源和氮源以及无机盐的营养介质上，使用本领域中已知的程序发酵上述微生物菌株来产生(参见，例如，Bennett,J.W.和LaSure,L.(编辑)，More Gene Manipulations in Fungi[真菌中的更多基因操纵]，学术出版社，加利福尼亚州，1991)。适合的培养基可从商业供应商获得或可以根据公开的组成(例如，在美国典型培养物保藏中心的目录中)制备。适合于生长和酶产生的温度范围和其他条件在本领域中是已知的(参见，例如，Bailey,J.E.和Ollis,D.F.，Biochemical Engineering Fundamentals[生物化学工程基础]，麦格劳-希尔图书公司(McGraw-Hill Book Company)，纽约，1986)。

发酵可以是导致酶或蛋白质的表达或分离的培养细胞的任何方法。所以，可以将发酵理解为包含摇瓶培养，或者在一种适合的培养基中并且在允许表达或分离所述酶的条件下在实验室或工业发酵罐中进行小规模或大规模发酵(包括连续发酵、分批发酵、分批补料发酵或固态发酵)。通过上述方法产生的所得酶可以从发酵培养基回收并且通过常规程序纯化。

发酵。可以通过能够将糖直接或间接发酵成所希望的发酵产物的一种或多种(例如，若干种)发酵微生物发酵从水解的纤维素材料获得的可发酵糖。“发酵”或“发酵过程”指任何发酵过程或包含发酵步骤的任何方法。发酵过程还包括用于消费性醇工业(例如啤酒和葡萄酒)、乳品工业(例如发酵的乳制品)、皮革工业和烟草工业的发酵过程。发酵条件取决于所希望的发酵产物和发酵有机体，并且可以由本领域的普通技术人员容易地确定。

在发酵步骤中，作为预处理和酶水解步骤的结果从纤维素材料释放的糖，通过发酵有机体(如酵母)发酵成为产物，例如，乙醇。水解(糖化)和发酵可以是分开的或同时的。

在实践本发明的发酵步骤中可以使用任何适合的水解的纤维素材料。该材料一般是基于经济学，即，每当量糖势的成本，以及对酶致转变的难降解性而进行选择。

术语“发酵介质”在此可理解为指在添加一种或多种发酵微生物之前的介质，例如，由糖化过程产生的介质，以及在同时糖化和发酵过程(SSF)中使用的介质。

“发酵微生物”是指适用于所希望的发酵过程以产生发酵产物的任何微生物，包括细菌有机体和真菌有机体。发酵生物体可以是己糖和/或戊糖发酵生物体、或其组合。己糖和戊糖发酵有机体二者均是本领域中所熟知的。适合的发酵微生物能够将糖(如葡萄糖、木糖、木酮糖、阿拉伯糖、麦芽糖、甘露糖、半乳糖、和/或寡糖)直接或间接地发酵(即，转化)成合意的发酵产物。由Lin等人，2006，Appl.Microbiol.Biotechnol.[应用微生物学与生物技术]69:627-642描述了产生乙醇的细菌和真菌发酵有机体的实例。

能够发酵己糖的发酵微生物的实例包括细菌有机体和真菌有机体，例如酵母。酵母包括以下的菌株：假丝酵母属、克鲁维酵母属、以及酵母菌属，例如萨纳瑞西斯假丝酵母(Candida sonorensis)、马克斯克鲁维酵母、以及酿酒酵母。

可以发酵处于其天然状态的戊糖的发酵微生物的实例包括细菌有机体和真菌有机体，例如一些酵母。发酵木糖的酵母包括假丝酵母属的菌株，优选地是休哈塔假丝酵母(C.sheatae)或萨纳瑞西斯假丝酵母(C.sonorensis)；以及毕赤酵母属的菌株，例如是树干毕赤酵母，例如树干毕赤酵母CBS 5773。发酵戊糖的酵母包括管囊酵母属的菌株，优选地是嗜鞣管囊酵母(P.tannophilus)。不能发酵戊糖(例如木糖和阿拉伯糖)的生物可以通过本领域已知方法来进行遗传修饰而发酵戊糖。

能够有效地将己糖和戊糖发酵成乙醇的细菌的实例包括，例如，凝结芽孢杆菌(Bacillus coagulans)、丙酮丁醇梭菌(Clostridium acetobutylicum)、热纤维梭菌(Clostridium thermocellum)、发酵植物多糖梭菌(Clostridium phytofermentans)、土芽孢杆菌属(Geobacillus)物种、解糖热厌氧杆菌(Thermoanaerobacter saccharolyticum)、以及运动发酵单胞菌(Zymomonas mobilis)(Philippidis,G.P.，1996，Cellulosebioconversion technology[纤维素生物转化技术]，Handbook on Bioethanol:Production and Utilization[生物乙醇手册：生产和利用]，Wyman,C.E.编辑，泰勒-弗朗西斯出版集团(Taylor&Francis)，华盛顿特区，179-212)。

其他发酵有机体包括以下的菌株：芽孢杆菌属，例如凝结芽孢杆菌；假丝酵母属，例如萨纳瑞西斯假丝酵母(C.sonorensis)、甲醇山梨糖假丝酵母(C.methanosorbosa)、迪丹斯假丝酵母(C.diddensiae)、近平滑假丝酵母(Candida parapsilosis)、C.naedodendra、布朗克假丝酵母(C.blankii)、嗜虫假丝酵母(C.entomophilia)、芸薹假丝酵母(C.brassicae)、假热带假丝酵母(C.pseudotropicalis)、博伊丁假丝酵母(C.boidinii)、产朊假丝酵母(C.utilis)、以及休哈塔假丝酵母(C.scehatae)；梭菌属(Clostridium)，例如丙酮丁醇梭菌(C.acetobutylicum)、热纤维梭菌(C.thermocellum)、以及发酵植物多糖梭菌(C.phytofermentans)；大肠杆菌(E.coli)，尤其是已被遗传修饰以改进乙醇产量的大肠杆菌菌株；土芽孢杆菌属(Geobacillus)物种；汉逊酵母属(Hansenula)，例如异常汉逊酵母(Hansenula anomala)；克雷伯氏菌属(Klebsiella)，例如产酸克雷伯氏菌(K.oxytoca)；克鲁维酵母属(Kluyveromyces)，例如马克斯克鲁维酵母(K.marxianus)、乳酸克鲁维酵母(K.lactis)、耐热克鲁维酵母(K.thermotolerans)、以及脆壁克鲁维酵母(K.fragilis)；裂殖酵母属(Schizosaccharomyces)，例如粟酒裂殖酵母(S.pombe)；热厌氧杆菌属(Thermoanaerobacter)，例如解糖热厌氧杆菌(Thermoanaerobacter saccharolyticum)、以及发酵单胞菌属(Zymomonas)，例如运动发酵单胞菌(Zymomonas mobilis)。

适于乙醇生产的可商购的酵母包括，例如，AFT和XR(拉曼特殊化学公司(Lallemand Specialities,Inc.)，美国)、ETHANOL酵母(乐斯富公司(Lesaffreet Co)，派尼尔(pagnie)，法国)、(AB毛里食品有限公司(AB Mauri Food Inc.)，美国)、(雷姆科国际股份有限公司(Rymco International AG)，丹麦)、GERTSTRAND^TM(格特·斯特兰德公司(Gert Strand AB)，瑞典)、和SUPERSTART^TM和新鲜酵母(拉曼特殊化学公司，美国)。

在一方面，发酵微生物已经经过遗传修饰，以提供发酵戊糖的能力，如利用木糖的微生物、利用阿拉伯糖的微生物、以及共同利用木糖和阿拉伯糖的微生物。

将异源基因克隆到多种发酵微生物中已经构建出能够将己糖和戊糖转化成乙醇(共发酵)的生物(Chen和Ho，1993，Appl.Biochem.Biotechnol.[应用生物化学与生物技术]39-40:135-147；Ho等人，1998，Appl.Environ.Microbiol.[应用与环境微生物学]64:1852-1859；Kotter和Ciriacy，1993，Appl.Microbiol.Biotechnol.[应用微生物学与生物技术]38:776-783；Walfridsson等人，1995，Appl.Environ.Microbiol.[应用与环境微生物学]61:4184-4190；Kuyper等人，2004，FEMS Yeast Research[欧洲微生物学会联合会酵母研究]4:655-664；Beall等人，1991，Biotech.Bioeng.[生物技术与生物工程]38:296-303；Ingram等人，1998，Biotechnol.Bioeng.[生物技术与生物工程]58:204-214；Zhang等人，1995，Science[科学]267:240-243；Deanda等人，1996，Appl.Environ.Microbiol.[应用与环境微生物学]62:4465-4470；WO 03/062430)。

在一方面，该发酵生物体包含一种多核苷酸，该多核苷酸编码本发明的一种具有纤维二糖水解酶活性的多肽。

在另一方面，该发酵生物体包含编码在此描述的一种或多种纤维素分解酶、半纤维素分解酶和辅助酶的一个或多个多核苷酸。

本领域中熟知的是，以上所描述的生物体还可以用于产生其他物质，如在此所描述的。

典型地向降解的纤维素材料或水解物中添加发酵微生物，并且发酵进行约8小时至约96小时，例如，约24小时至约60小时。温度典型地为约26℃至约60℃，例如约32℃或50℃，并且pH为约pH 3至约pH 8，例如pH 4-5、6、或7。

在一方面，将酵母和/或另一种微生物施加至降解的纤维素材料并且发酵进行约12至约96小时，如典型地24小时-60小时。在另一方面，温度优选地为约20℃至约60℃，例如，约25℃至约50℃、约32℃至约50℃、或约32℃至约50℃，并且pH通常为约pH 3至约pH 7，例如，约pH 4至约pH 7。然而，一些发酵有机体(例如细菌)具有更高的最适发酵温度。酵母或另一种微生物优选以每ml发酵液大约10⁵至10¹²，优选从大约10⁷至10¹⁰，特别是大约2×10⁸个活细胞计数的量施用。关于使用酵母进行发酵的进一步指南可以见于例如“TheAlcohol Textbook[醇教材]”(K.Jacques、Lyons以及D.R.Kelsall编辑，诺丁汉大学出版社(Nottingham University Press)，英国1999)，将其通过引用结合在此。

发酵刺激剂可与本申请中所述的任何方法组合使用，以进一步改进发酵工艺，而且特定地，改进发酵微生物的性能，如，速率增加和乙醇产率。“发酵刺激剂”指用于发酵微生物(特别是酵母)生长的刺激剂。优选的用于生长的发酵刺激剂包括维生素和矿物质。维生素的实例包括多种维生素、生物素、泛酸、烟酸、内消旋肌醇、硫胺素、吡哆醇、对氨基苯酸、叶酸、核黄素、以及维生素A、B、C、D和E。例如，参见例如Alfenore等人，Improvingethanol production and viability of Saccharomyces cerevisia by a vitaminfeeding strategy during fed-batch process[通过在进料分批方法过程中的一种维生素进料策略改进乙醇产生和酿酒酵母的存活力]，Springer-Verlag[施普林格出版社](2002)，将其通过引用结合在此。矿物质的实例包括可以供应包含P、K、Mg、S、Ca、Fe、Zn、Mn和Cu营养素的矿物质和矿物盐。

发酵产物：发酵产物可以是由发酵得到的任何物质。发酵产物可以是，不限于：醇(例如，阿拉伯醇、正丁醇、异丁醇、乙醇、甘油、甲醇、乙二醇、1,3-丙二醇[丙二醇]、丁二醇、丙三醇、山梨醇和木糖醇)；烷烃(例如，戊烷、己烷、庚烷、辛烷、壬烷、癸烷、十一烷、以及十二烷)、环烷烃(例如，环戊烷、环己烷、环庚烷、以及环辛烷)、烯烃(例如，戊烯、己烯、庚烯、以及辛烯)；氨基酸(例如，天冬氨酸、谷氨酸、甘氨酸、赖氨酸、丝氨酸、以及苏氨酸)；气体(例如，甲烷、氢气(H₂)、二氧化碳(CO₂)、以及一氧化碳(CO))；异戊二烯；酮(例如，丙酮)；有机酸(例如，乙酸、醋酮酸、己二酸、抗坏血酸、柠檬酸、2,5-二酮-D-葡糖酸、甲酸、反丁烯二酸、葡糖二酸、葡糖酸、葡糖醛酸、戊二酸、3-羟基丙酸、衣康酸、乳酸、苹果酸、丙二酸、草酸、草酰乙酸、丙酸、琥珀酸和木糖酸)；和聚酮化合物。

在一方面，该发酵产物是醇。术语“醇”涵盖含有一个或多个羟基部分的物质。醇可以是而不限于：正丁醇、异丁醇、乙醇、甲醇、阿拉伯糖醇、丁二醇、乙二醇、甘油(glycerin)、丙三醇(glycerol)、1,3-丙二醇、山梨醇、木糖醇。参见例如，Gong等人，1999，Ethanolproduction from renewable resources[由可再生资源生产乙醇]，在Advances inBiochemical Engineering/Biotechnology[生化工程/生物技术进展]中，Scheper,T.编辑，Springer-Verlag[施普林格出版社]，柏林，海德堡，德国，65:207-241；Silveira和Jonas，2002，Appl.Microbiol.Biotechnol.[应用微生物学与生物技术]59：400-408；Nigam和Singh，1995，Process Biochemistry[加工生物化学]30(2):117-124；Ezeji等人，2003，World Journal of Microbiology and Biotechnology[微生物与生物技术世界杂志]19(6):595-603。

在另一方面，该发酵产物是烷烃。该烷烃可以是非支链或支链烷烃。烷烃可以是而不限于：戊烷、己烷、庚烷、辛烷、壬烷、癸烷、十一烷、或十二烷。

在另一方面，该发酵产物是环烷烃。环烷烃可以是而不限于：环戊烷、环己烷、环庚烷或环辛烷。

在另一方面，该发酵产物是烯烃。该烯烃可以是非支链或支链烯烃。烯烃可以是而不限于：戊烯、己烯、庚烯或辛烯。

在另一方面，发酵产物是一种氨基酸。有机酸可以是而不限于：天冬氨酸、谷氨酸、甘氨酸、赖氨酸、丝氨酸、或苏氨酸。参见例如Richard和Margaritis，2004，Biotechnologyand Bioengineering[生物技术和生物工程]87(4):501-515。

在另一方面，该发酵产物是气体。气体可以是而不限于：甲烷、H₂、CO₂、或CO。参见例如，Kataoka等人，1997，Water Science and Technology[水科学与技术]36(6-7):41-47；以及Gunaseelan，1997，Biomass and Bioenergy[生物质与生物能源]13(1-2):83-114。

在另一方面，该发酵产物是异戊二烯。

在另一方面，该发酵产物是酮。术语“酮”涵盖含有一个或多个酮部分的物质。酮可以是而不限于：丙酮。

在另一方面，该发酵产物是有机酸。有机酸可以是而不限于：乙酸、醋酮酸、己二酸、抗坏血酸、柠檬酸、2,5-二酮-D-葡糖酸、甲酸、富马酸、葡糖二酸、葡糖酸、葡糖醛酸、戊二酸、3-羟基丙酸、衣康酸、乳酸、苹果酸、丙二酸、草酸、丙酸、琥珀酸、或木糖酸。参见，例如，Chen和Lee，1997，Appl.Biochem.Biotechnol.[生物化学与生物技术]63-65:435-448。

在另一方面，发酵产品是聚酮化合物。

回收。可以使用本领域中已知的任何方法可任选地从发酵培养基回收一种或多种发酵产物，这些方法包括但不限于，层析法、电泳程序、差别溶解度、蒸馏、或提取。例如，通过常规蒸馏方法从发酵的纤维素材料中分离和纯化醇。可以获得具有高达约96vol.％的纯度的乙醇，这可以用作例如燃料乙醇、饮用乙醇，即可饮用的中性烈酒、或工业乙醇。

植物

本发明还涉及分离的植物，例如，转基因植物、植物部分或植物细胞，其包含本发明的多核苷酸，从而以可回收的量表达和产生所述变体。该变体可以从植物或植物部分回收。可替代地，含有所述变体的植物或植物部分可以按原样用于改进食品或进料的质量，例如，改进营养价值、可口性以及流变特性，或用以破坏抗营养因子。

转基因植物可以是双子叶的(双子叶植物)或单子叶的(单子叶植物)。单子叶植物的实例是草，如草甸草(蓝草，早熟禾属)；饲草，如羊茅属(Festuca)、黑麦草属(Lolium)；温带草，如翦股颖属(Agrostis)；以及谷类，例如小麦、燕麦、黑麦、大麦、稻、高粱、以及玉蜀黍(玉米)。

双子叶植物的实例是烟草、豆类(例如羽扇豆(lupins)、马铃薯、糖甜菜(sugarbeet)、豌豆、豆(bean)和大豆(soybean))、以及十字花科植物(十字花科(familyBrassicaceae))(例如花椰菜、油菜籽、以及紧密相关的模式生物体拟南芥(Arabidopsisthaliana))。

植物部分的实例是茎、愈伤组织、叶、根、果实、种子和块茎、以及包括这些部分的独立组织，例如，表皮、叶肉、薄壁组织(parenchyme)、维管组织、分生组织。特定植物细胞区室，如叶绿体、质外体(apoplast)、线粒体、液泡、过氧化物酶体以及细胞质也被认为是植物部分。此外，任何植物细胞，无论是何种组织来源，都被认为是植物部分。同样地，植物部分，如分离以有助于本发明的利用的特定组织和细胞也被认为是植物部分，例如胚、胚乳、糊粉和种皮。

同样包含于本发明范围内的是此类植物、植物部分以及植物细胞的后代。

表达变体的转基因植物或植物细胞可以根据本领域已知的方法来构建。简而言之，通过如下方法构建该植物或植物细胞：将编码变体的一个或多个表达构建体并入到植物宿主基因组或叶绿体基因组中，并且使所得的修饰植物或植物细胞繁殖为转基因植物或植物细胞。

表达构建体宜为包括编码变体的多核苷酸的核酸构建体，该多核苷酸与在选择的植物或植物部分中表达该多核苷酸所需的适当的调节序列可操作地连接。而且，表达构建体可以包含用于鉴定整合了此表达构建体的植物细胞的选择性标记，和将此构建体引入所讨论的植物所必需的DNA序列(后者取决于所用的引入DNA的方法)。

例如，基于希望在何时、何处、以及如何表达该变体来确定对调节序列如启动子和终止子序列和任选的信号或转运序列的选择(Sticklen，2008，Nature Reviews[自然综述]9:433-443)。例如，编码变体的基因的表达可以是组成型的或诱导型的，或可以是发育、阶段或组织特异性的，并且可以使基因产物靶向特定组织或植物部分，如种子或叶。调节序列由例如Tague等人，1988，Plant Physiology[植物生理学]86:506描述。

对于组成型表达，可以使用35S-CaMV、玉蜀黍泛素1、或稻肌动蛋白1启动子(Franck等人，1980，Cell[细胞]21:285-294；Christensen等人，1992，Plant Mol.Biol.[植物分子生物学]18:675-689；Zhang等人，1991，Plant Cell[植物细胞]3:1155-1165)。器官特异性启动子可以是以下的启动子，例如来自贮藏库组织(例如种子、根、马铃薯块茎、和果实)(Edwards和Coruzzi，1990，Ann.Rev.Genet.[遗传学年鉴]24:275-303)，或来自代谢库组织(例如分生组织)(Ito等人，1994，Plant Mol.Biol.[植物分子生物学]24:863-878)的启动子，种子特异性启动子，例如来自稻的谷蛋白、醇溶谷蛋白、球蛋白或白蛋白启动子(Wu等人，1998，Plant Cell Physiol.[植物与细胞生理学]39:885-889)，来自豆球蛋白B4的蚕豆启动子和来自蚕豆的未知种子蛋白基因(Conrad等人，1998，J.Plant Physiol.[植物生理学杂志]152:708-711)，来自种子油体蛋白的启动子(Chen等人，1998，Plant CellPhysiol.[植物与细胞生理学]39:935-941)，来自欧洲油菜的贮藏蛋白napA启动子，或本领域已知的任何其他种子特异性启动子，例如，如在WO 91/14772中所描述的。此外，启动子可以是叶特异性启动子，例如来自稻或番茄的rbcs启动子(Kyozuka等人，1993，PlantPhysiol.[植物生理学]102:991-1000)、小球藻病毒腺嘌呤甲基转移酶基因启动子(Mitra和Higgins，1994，Plant Mol.Biol.[植物分子生物学]26:85-93)、来自稻的aldP基因启动子(Kagaya等人，1995，Mol.Gen.Genet.[分子遗传学与基因组学]248:668-674)、或伤口诱导型启动子(例如马铃薯pin2启动子)(Xu等人，1993，Plant Mol.Biol.[植物分子生物学]22:573-588)。同样，该启动子可以通过如温度、干旱或盐度变化等非生物处理来诱导，或通过外源地应用使所述启动子活化的物质(例如，乙醇；雌激素；植物激素，例如乙烯、脱落酸及赤霉酸；及重金属)来诱导。

启动子增强子元件也可以用于实现变体在植物中的较高表达。例如，启动子增强子元件可以是置于启动子与编码变体的多核苷酸之间的内含子。例如，Xu等人，1993，见上文，披露了使用稻肌动蛋白1基因的第一内含子以增强表达。

该选择性标志物基因及该表达构建体的任何其他部分可以选自本领域中可用的那些。

可以根据本领域中已知的常规技术将核酸构建体结合到植物基因组中，这些常规技术包括土壤杆菌介导的转化、病毒介导的转化、微注射、粒子轰击、生物射弹转化、以及电穿孔(Gasser等人，1990，Science[科学]244:1293；Potrykus，1990，Bio/Technology[生物/技术]8:535；Shimamoto等人，1989，Nature[自然]338:274)。

目前根癌土壤杆菌介导的基因转移是用于产生转基因双子叶植物(关于综述，请参见Hooykas和Schilperoort，1992，Plant Mol.Biol.[植物分子生物学]19:15-38)并且用于转化单子叶植物的方法，尽管对于这些植物可以使用其他转化方法。用于产生转基因单子叶植物的方法是粒子(涂覆有转化DNA的微观金或钨粒子)轰击胚愈伤组织或发育中的胚(Christou，1992，Plant J.[植物杂志]2:275-281；Shimamoto，1994，Curr.Opin.Biotechnol.[生物技术当前述评]5:158-162；Vasil等人，1992，Bio/Technology[生物/技术]10:667-674)。用于转化单子叶植物的替代方法是基于天然质体转化，如由Omirulleh等人，1993，Plant Mol.Biol.[植物分子生物学]21:415-428所描述。另外的转化方法包括美国专利号6,395,966和7,151,204(两者都通过引用以其全文结合在此)中所描述的那些。

在转化后，根据本领域熟知的方法选出已结合了表达构建体的转化体，并使其再生成为完整植物。通常设计转化方法用于通过如下方法在再生期间或在后续世代中选择性消除选择基因：例如，使用带有两个独立的T-DNA构建体的共转化或通过特异性重组酶位点特异性地切除选择基因。

除用本发明的构建体直接转化具体植物基因型之外，还可以通过使具有构建体的植物与缺乏所述构建体的第二植物杂交来产生转基因植物。例如，可以通过杂交将编码变体的构建体引入特定植物品种中，无需总是直接地转化该给定品种的植物。因此，本发明不仅涵盖了从根据本发明已经转化的细胞直接再生的植物，而且还涵盖了此类植物的后代。如在此所用的，后代可以是指根据本发明制备的亲本植物的任何代的后代。此类后代可以包括根据本发明制备的DNA构建体。杂交导致通过将起始系用供体植物系交叉授粉，将转基因引入植物系。此类步骤的非限制性实例描述于美国专利号7,151,204中。

植物可以通过回交转化工艺生成。例如，植物包括被称为回交转化的基因型、种系、近交体、或杂交体的植物。

可以使用遗传标志物以协助本发明的一种或多种转基因从一个遗传背景渗入到另一个。标志物协助的选择提供了相对于常规育种的优势，在于其可以用于避免由表型变异引起的错误。另外，遗传标志物可以在具体杂交的个别后代中提供有关良种种质相对程度的数据。例如，当具有所希望性状并且另外具有非农艺学所希望的遗传背景的植物与良种亲本杂交时，可以使用遗传标志物来选择不仅具有感兴趣的性状，还具有相对较大比例所希望种质的后代。以此方式，使一种或多种性状渗入特定遗传背景所需的世代数得以最小化。

本发明还涉及产生本发明的变体的方法，这些方法包括：(a)在有益于产生所述变体的条件下培养包含编码所述变体的多核苷酸的转基因植物、植物部分或植物细胞；和任选地(b)回收所述变体。

通过以下实例进一步描述本发明，所述实例不应理解为对本发明的范围进行限制。

实例

培养基和溶液

DOB+CSM-Leu板由3.4g不含氨基酸和硫酸铵的酵母氮基、0.68g CSM-Leu、1ml100mM CuSO₄ 5H₂O、20ml 0.5M K₂HPO₄、20g细菌用琼脂、和950ml去离子水构成。在将高压灭菌的培养基回火至55℃后，添加40ml 50％葡萄糖溶液。

M400培养基由以下构成：每升50g的麦芽糊精、2g的MgS0₄·7H₂0、2g的KH₂P0₄、4g的柠檬酸、8g的酵母提取物、2g的尿素、0.5g的CaCl₂、以及0.5ml的AMG痕量金属溶液。AMG痕量金属溶液由以下组成：每升14.3g的ZnS0₄·7H₂0、2.5g的CuS0₄·5H₂0、0.5g的NiCl₂·6H₂0、13.8g的FeS0₄·7H₂0、8.5g的MnS0₄·H₂0、3g的柠檬酸、以及加至1升的去离子水。

YPD培养基由10g酵母提取物、20g细菌用蛋白胨、40ml 50％的葡萄糖构成，并且添加去离子水至1升。

表1：在以下实例中使用的引物。

实例1：酵母表达质粒pLSBF124的构建

使用如下所示的引物从基因组DNA扩增出Penicillium vasconiaeNN053742 GH7纤维二糖水解酶I(SEQ ID NO:75)的编码序列。

正向引物：

5'-ACACAACTGGGGATCcaccatgaagggatcaatctcctatcaaatctac-3'(SEQ ID NO:77)

反向引物：

5'-CCCTCTAGATCTCGAGcaccacttttctcccaaatttgaag-3'(SEQ ID NO:78)

正向引物中的小写字符表示编码序列的区域并且反向引物中的小写字符表示编码序列的侧翼区域，而粗体字符表示与pCaHj505的插入位置同源的区域(WO 2013/029496)。正向引物中的下划线字符代表5'UTR，其不是pCaHj505载体的一部分。

该PCR由以下组成：正向和反向引物各10pmol，2μl Penicillium vasconiae基因组DNA，10μl 5XHF缓冲液(Finnzymes Oy)，1.5μl DMSO，1.5μl dATP、dTTP、dGTP和dCTP各2.5mM，以及0.6单位的高保真DNA聚合酶(Finnzymes Oy)，最终体积为50μl。该PCR是用热循环仪进行的，该热循环仪被编程为在94℃下变性3分钟；10个循环的在94℃下变性40秒、在69℃下退火30秒(其中每个循环降低1℃)、以及在72℃下伸长2分钟；25个循环的各在94℃下40秒、59℃下40秒、以及72℃下2分钟；以及在72℃下最终延伸7分钟。加热块然后进入15℃浸泡循环。

通过1.0％的琼脂糖凝胶电泳，使用90mM Tris-硼酸盐及1mM EDTA(TBE)缓冲液来分离1.8kb PCR产物，并且然后使用ILLUSTRA^TMGFX^TMPCR DNA和凝胶带纯化试剂盒进行纯化(GE Healthcare)。

将质粒pCaHj505用BamH I和Xho I消化，使用TBE缓冲液通过1.0％琼脂糖凝胶电泳进行分离，并且使用ILLUSTRA^TMGFX^TMPCR DNA和凝胶带纯化试剂盒进行纯化。

使用HD克隆试剂盒(克罗泰克实验有限公司)将纯化的PCR片段和消化载体连接在一起，得到质粒p505-GH7_Peva1，其中P.vasconiae GH7纤维二糖水解酶I编码序列的转录是在米曲霉α-淀粉酶基因启动子的控制下进行。该连接反应物被转化成大肠杆菌TOP10感受态细胞(天根生物科技有限公司(TIANGEN Biotech Co.Ltd.))并且通过菌落PCR检测阳性转化体，方法是将单个菌落转移到预混合的PCR溶液中，该溶液包括缓冲液、dNTPs、Taq DNA聚合酶和产生PCR片段的引物对。在PCR后，将反应通过1.0％琼脂糖凝胶电泳使用TBE缓冲液进行分析。使用Spin Miniprep试剂盒(凯杰公司(QIAGENGmbH))从示出具有预期大小的插入物的菌落之一制备质粒DNA。该质粒命名为p505-GH7_Peva1。

构建质粒pLSBF124用于表达P.vasconiae纤维二糖水解酶I(SEQ ID NO:1)并且产生突变基因文库。使用表1中所示的引物，从源质粒p505-GH7-Peva1扩增P.vasconiae纤维二糖水解酶I编码序列cDNA(SEQ ID NO:75的核苷酸76-1650)。粗体字母代表编码序列。其余的序列与质粒pLSBF101的插入位点同源。通过修饰质粒pDB4081(如在WO 2014/072481中描述的)以去除启动子和终止子之间的序列并插入如下示出的酿酒酵母转化酶前导序列，随后插入Hind III限制性位点来制备质粒pLSBF101。用Hind III消化pLSBF101以将质粒线性化。

ATGCTTTTGCAAGCCTTCCTTTTCCTTTTGGCTGGTTTTGCAGCCAAGATCTCTGCA(SEQ ID NO:79)

使用IN-FUSION^TMAdvantage PCR克隆试剂盒(克罗泰克实验有限公司(ClontechLaboratories,Inc.)将PCR产物的同源末端和消化的pLSBF101连接在一起，并转化到STELLAR^TM感受态大肠杆菌细胞(克罗泰克实验有限公司(Clontech Laboratories,Inc.))中。使用旋转迷你制备型试剂盒(凯杰公司(QIAGEN Inc.))，将质粒DNA从转化的菌落中进行纯化。使用3130XL遗传分析仪(应用生物系统公司(Applied Biosystems,Inc.))的DNA测序确认指定为pLSBF124的最终质粒中存在纤维二糖水解酶I片段。

实例2：Penicillium vasconiae纤维二糖水解酶I变体的构建

使用定向诱变方法构建Penicillium vasconiae纤维二糖水解酶I变体。对每种目的突变合成诱变正向引物和互补反向引物。在酵母装配方法中使用多种PCR产物来构建每种突变体。使用pLSBF124作为DNA模板，使用对每个突变的正向诱变引物和终止子下游的反向引物(SEQ ID NO:66-引物1209355)经由PCR引入突变。所述反应产生PCR产物，其含有包含目的突变的P.vasconiae纤维二糖水解酶I基因的3'片段、酿酒酵母醇脱氢酶(ADH1)终止子、和转化期间酵母组装所必需的少量DNA。使用具有每种突变的非诱变互补反向引物和选择性标记上游的正向引物(SEQ ID NO:65-引物1209353)的pLSBF124作为DNA模板进行第二次PCR。所述反应导致含有转化期间酵母装配所必需的少量DNA、酿酒酵母3-异丙基苹果酸脱氢酶(LEU2)选择性标记基因、酿酒酵母蛋白酶B(PRB1)启动子、酿酒酵母转化酶前导序列、和P.vasconiae纤维二糖水解酶I基因的5'片段的PCR产物。当与线性化的pDB4164共转化时，两个PCR片段组装形成含有P.vasconiae纤维二糖水解酶I基因突变体的完整2微米表达质粒。通过修饰质粒pDB3936(WO 2010/092135)构建质粒pDB4164。它在BamH I位点旁边有两个另外的碱基(GC)以产生Not I限制性位点GCGGCCGC(粗体的另外的碱基)并且在含有安普霉素抗性选择性标记的Acc 65I和BamH I位点之间含有1368bp的序列。

使用类似的方法构建多突变变体。将含有目标突变体的裂解酵母细胞用作第二轮诱变PCR的模板。不同的模板用于3'末端和5'末端PCR。这样，3'末端PCR包含模板菌株中存在的突变以及用诱变正向引物引入的新突变。5'末端PCR包含模板菌株中存在的突变。使用该方法，可以用两个PCR构建含有多个突变的变体。

实例3：酵母宿主菌株中变体的转化和表达

如WO 2015/036579，方法4中所述制备质粒pDB4164DNA用于转化到酿酒酵母中，除了使用来自pDB4164的9723bp Acc 65I-BamH I片段作为缺口载体片段而不是来自pDB3936的9721bp片段，该质粒pDB4164DNA在BamH I位点旁边具有两个另外的碱基GC，以产生Not I限制性位点GCGGCCGC(粗体的另外的碱基)。质粒pDB4164与pDB3936的不同之处还在于在含有安普霉素抗性选择性标记的Acc 65I和BamH I位点之间含有1368bp序列，该安普霉素抗性选择性标记通过Acc 65I和BamH I消化切除，并且不用于缺口修复转化。用编码野生型或突变的Penicillium vasconiae纤维二糖水解酶I的PCR产物共转化消化的pDB4164。使用酿酒酵母菌株(如WO 2014/072481中所述)作为Penicillium vasconiae纤维二糖水解酶I变体的表达宿主。所述菌株从DYB7(Payne等人，2008，Applied and EnvironmentalMicrobiology[应用与环境微生物]74(24):7759-7766)构建，其中四个拷贝的蛋白质二硫键异构酶整合到基因组中。

将转化的细胞铺板到选择性培养基(DOB+CSM-Leu板)上，并允许其在30℃下生长若干天。在生长后，将转化的细胞用于接种96孔微量滴定板，每孔含有150μl的YPD培养基。然后将板在30℃下以250rpm摇动孵育5-7天。

实例4：在米曲霉中具有取代V199P+E240G+F274Y+G318P+T347P+D349V+N391D+S393D+S394P+Y493W的Penicillium vasconiae纤维二糖水解酶I(SEQ ID NO:1)变体的克隆和表达

引物1216764和1216765中的下划线字符表示用于克隆的载体重叠序列。引物1216926的下划线部分表示Y493W取代的序列密码子改变。

如下构建表达质粒pLSBF136。变体R23的成熟多肽序列(具有取代V199P+E240G+F274Y+G318P+T347P+D349V+N391D+S393D+S394P的SEQ ID NO:1)从最初使用引物1216766和1214691产生的酵母菌株进行PCR扩增。将寡核苷酸1216764和1216765退火以产生天然Penicillium vasconiae纤维二糖水解酶I信号序列(SEQ ID NO:75的核苷酸1-75)。然后使用试剂盒将这两个片段克隆到线性化质粒中。通过菌落PCR和桑格测序筛选得到的菌落，以鉴定具有预期序列的菌落。将该质粒指定为pLSB136。

构建质粒pAJ302-2以在pLSBF136的P.vasconiae纤维二糖水解酶I变体的碳水化合物结合模块中添加另外的氨基酸取代Y493W。通过将三个DNA片段产生并亚克隆到表达载体pJyS165(WO 2016/145084)中来构建它。

第一个片段(片段1)由用于亚克隆到pJyS165(下划线下方)的5'上游非翻译同源pJyS165序列的(5'至3')15bp和P.vasconiae信号序列组成，该信号序列是通过将两个单链寡核苷酸退火以形成单个双链DNA片段而产生的。使用的引物是引物1216764和引物1216765。

通过首先将每种寡核苷酸溶解在退火缓冲液(10mM Tris，pH 7.5，50mM NaCl)中以制备100ng/μl储备溶液来退火引物。将每种低聚物的20μl等分试样混合并加热至95℃，然后冷却至20℃持续15分钟。片段1还被设计为含有15bp的5'上游序列，用于亚克隆到pJyS165中。

片段2由同源的P.vasconiae纤维二糖水解酶I信号序列的3'末端的(5'至3')15bp和P.vasconiae纤维二糖水解酶I成熟序列(SEQ ID NO:75)的第一个1476bp组成，该成熟序列是使用PCR引物1216766和引物1216927通过PCR扩增P.vasconiae纤维二糖水解酶I变体pLSBF136而产生的。

片段3由起始于bp 1522的一部分P.vasconiae纤维二糖水解酶I CDS(相对于甲硫氨酸起始密码子)，转录终止(TAG)的序列和用于亚克隆的pJyS165的3'下游同源序列的20bp组成。使用以下PCR引物1216926和1214691扩增片段3。

将片段1和2用80μl DpnI限制性内切核酸酶在37℃消化60分钟。然后根据制造商的方案使用净化试剂盒(Clean-Up Kit)(克罗泰克实验有限公司(Clontech Laboratories,Inc))纯化每种产物。来自NucleoSpin柱的每个片段的最终洗脱使用各50μl水进行。

使用Hd克隆试剂盒(克罗泰克实验有限公司)，将片段1、2和3亚克隆到pJyS165中。

使用Sanger测序验证几种正确转化体的序列保真度，并将一种质粒命名为pAJ302-2。

如下构建米曲霉表达质粒pLSBF140(表达R23变体加Y493W突变)。使用引物1217484和1217485从pAJ302-2PCR扩增Penicillium vasconiae纤维二糖水解酶I变体编码序列(包括天然信号序列)。然后使用试剂盒将扩增的片段克隆到线性化的pALLO2(美国专利号7,354,743)中。使用桑格测序鉴定具有预期序列的菌落。将该质粒指定为pLSBF140。

随后将质粒pLSBF140转化到米曲霉菌株JAL250(EP 1157095)的感受态细胞。使用24孔微量滴定培养物评估转化体，并且然后将转化体在2.8L带挡板的摇瓶中以更大体积在34℃下在M400培养基中生长3天。使用0.22μm过滤器无菌过滤摇瓶培养液。

实例5：在米曲霉中表达的具有取代V199P+E240G+F274Y+G318P+T347P+D349V+N391D+S393D+S394P+Y493W的Penicillium vasconiae纤维二糖水解酶I(SEQ ID NO:1)变体的纯化

将米曲霉培养液调节至pH 7.5，最终浓度为1.0M硫酸铵，20mM Tris。然后使用0.22μm聚醚砜膜(密理博公司(Millipore))过滤该培养液以去除颗粒。将该过滤的样品应用到75mL苯基琼脂糖HP柱(GE医疗集团(GE Healthcare))上，所述柱用在20mM Tris-HClpH 7.5中的1.0M硫酸铵平衡。用减少的盐梯度(10柱体积)1.0M硫酸铵至0M硫酸铵在20mMTris-HCl pH 7.5中洗脱结合的蛋白质，其中收集5mL级分。使用8％-16％的CRITERION^TMTGX无菌株^TMSDS-PAGE凝胶(伯乐实验室有限公司(Bio-Rad Laboratories,Inc.))分析级分。汇集含有纤维二糖水解酶I变体的级分12-30，并且如通过SDS-PAGE所判断的纯度大于90％。使用串联连接的四个HiPrep^TM26/10脱盐柱(GE医疗集团(GE Healthcare))将该汇集的材料缓冲液交换到50mM乙酸钠pH 5、100mM NaCl中。通过测量280nm处的吸光度并使用计算的消光系数1.52(其中1mg/mL蛋白质溶液在280nm处具有1.52的吸光度)来确定蛋白质浓度。

实例6：变体Tm测定的热转变测定

如WO 2013/163590的实例10中所述的进行Penicillium vasconiae变体的蛋白质热解折叠。野生型和变体的测量熔融温度示于表2中。

表2：P.vasconiae野生型和变体的Tm值

结果显示变体具有比野生型纤维二糖水解酶I更高的Tm。

本发明通过以下编号的段落来进一步描述：

[段落1]一种纤维二糖水解酶变体，该变体在对应于SEQ ID NO:1的位置8、17、113、157、159、184、199、240、250、274、318、325、328、347、349、358、360、380、391、393、394、412、以及430的一个或多个位置处包括取代，其中该变体具有纤维二糖水解酶活性并且其中该变体与亲本纤维二糖水解酶具有至少60％，例如至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或至少99％、但小于100％的序列同一性。

[段落2]如段落1所述的纤维二糖水解酶变体，其中该亲本纤维二糖水解酶与SEQID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、或SEQ ID NO:6具有至少60％，例如至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％的序列同一性。

[段落3]如段落1所述的纤维二糖水解酶变体，其中该亲本纤维二糖水解酶包含SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、或SEQ ID NO:6，或由其组成。

[段落4]如段落1所述的纤维二糖水解酶变体，其中该亲本纤维二糖水解酶是SEQID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、或SEQ ID NO:6的片段，其中该片段具有纤维二糖水解酶活性。

[段落5]如段落4所述的纤维二糖水解酶变体，其中该片段由SEQ ID NO:1、SEQ IDNO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、或SEQ ID NO:6的至少85％的氨基酸残基，例如，至少90％的氨基酸残基或至少95％的氨基酸残基组成。

[段落6]如段落1-5中任一项所述的纤维二糖水解酶变体与SEQ ID NO:1、SEQ IDNO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、或SEQ ID NO:6的多肽具有至少60％，例如，至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或至少99％的序列同一性，但小于100％的序列同一性。

[段落7]如段落1-6中任一项所述的纤维二糖水解酶变体与SEQ ID NO:1的多肽具有至少60％，例如，至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或至少99％的序列同一性，但小于100％的序列同一性。

[段落8]如段落1-6中任一项所述的纤维二糖水解酶变体与SEQ ID NO:2的多肽具有至少60％，例如，至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或至少99％的序列同一性，但小于100％的序列同一性。

[段落9]如段落1-6中任一项所述的纤维二糖水解酶变体与SEQ ID NO:3的多肽具有至少60％，例如，至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或至少99％的序列同一性，但小于100％的序列同一性。

[段落10]如段落1-6中任一项所述的纤维二糖水解酶变体与SEQ ID NO:4的多肽具有至少60％，例如，至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或至少99％的序列同一性，但小于100％的序列同一性。

[段落11]如段落1-6中任一项所述的纤维二糖水解酶变体与SEQ ID NO:5的多肽具有至少60％，例如，至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或至少99％的序列同一性，但小于100％的序列同一性。

[段落12]如段落1-6中任一项所述的纤维二糖水解酶变体与SEQ ID NO:6的多肽具有至少60％，例如，至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或至少99％的序列同一性，但小于100％的序列同一性。

[段落13]如段落1-12中任一项所述的纤维二糖水解酶变体，其中该变体由400至525个，例如，400至500个、425至490个、450至480个、460至485个氨基酸组成。

[段落14]一种纤维二糖水解酶变体，该变体包含变体催化结构域，其中该变体催化结构域包含在与SEQ ID NO:1的位置8、17、113、157、159、184、199、240、250、274、318、325、328、347、349、358、360、380、391、393、394、412、以及430相对应的一个或多个位置处的取代，并且该变体催化结构域与亲本纤维二糖水解酶的催化结构域具有至少60％，例如，至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或至少99％但小于100％的序列同一性。

[段落15]如段落14所述的纤维二糖水解酶变体，其中该亲本纤维二糖水解酶的催化结构域与SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、或SEQID NO:6的催化结构域具有至少60％，例如，至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％的序列同一性。

[段落16]如段落14所述的纤维二糖水解酶变体，其中该亲本纤维二糖水解酶的催化结构域包含SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、或SEQID NO:6的催化结构域，或由其组成。

[段落17]如段落14-16中任一项所述的纤维二糖水解酶变体，其中该变体催化结构域与SEQ ID NO:1的催化结构域具有至少60％，例如，至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或至少99％但小于100％的序列同一性。

[段落18]如段落14-16中任一项所述的纤维二糖水解酶变体，其中该变体催化结构域与SEQ ID NO:2的催化结构域具有至少60％，例如，至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或至少99％但小于100％的序列同一性。

[段落19]如段落14-16中任一项所述的纤维二糖水解酶变体，其中该变体催化结构域与SEQ ID NO:3的催化结构域具有至少60％，例如，至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或至少99％但小于100％的序列同一性。

[段落20]如段落14-16中任一项所述的纤维二糖水解酶变体，其中该变体催化结构域与SEQ ID NO:4的催化结构域具有至少60％，例如，至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或至少99％但小于100％的序列同一性。

[段落21]如段落14-16中任一项所述的纤维二糖水解酶变体，其中该变体催化结构域与SEQ ID NO:5的催化结构域具有至少60％，例如，至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或至少99％但小于100％的序列同一性。

[段落22]如段落14-16中任一项所述的纤维二糖水解酶变体，其中该变体催化结构域与SEQ ID NO:6的催化结构域具有至少60％，例如，至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或至少99％但小于100％的序列同一性。

[段落23]如段落14-22中任一项所述的纤维二糖水解酶变体，该纤维二糖水解酶变体进一步包含接头。

[段落24]如段落23所述的纤维二糖水解酶变体，其中该接头是外源接头。

[段落25]如段落14-24中任一项所述的纤维二糖水解酶变体，该纤维二糖水解酶变体进一步包含碳水化合物结合模块。

[段落26]如段落25所述的纤维二糖水解酶变体，其中该碳水化合物结合模块是外源的碳水化合物结合模块。

[段落27]如段落1-26中任一项所述的纤维二糖水解酶变体，其中取代的数目是1-23个，例如1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、或23个取代。

[段落28]如段落1-27中任一项所述的纤维二糖水解酶变体，该纤维二糖水解酶变体包含在与SEQ ID NO:4的位置8相对应的位置处用Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Trp、Tyr、或Val进行的取代。

[段落29]如段落28所述的纤维二糖水解酶变体，其中该取代是用Ala或Pro进行的。

[段落30]如段落29所述的纤维二糖水解酶变体，其中该取代是用Thr至Ala或Pro进行的。

[段落31]如段落1-30中任一项所述的纤维二糖水解酶变体，该纤维二糖水解酶变体包含在与SEQ ID NO:1的位置17相对应的位置处用Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Thr、Trp、Tyr、或Val进行的取代。

[段落32]如段落31所述的纤维二糖水解酶变体，其中该取代是用Gln进行的。

[段落33]如段落32所述的纤维二糖水解酶变体，其中该取代是用Ser至Gln进行的。

[段落34]如段落1-33中任一项所述的纤维二糖水解酶变体，该纤维二糖水解酶变体包含在与SEQ ID NO:1的位置113相对应的位置处用Ala、Arg、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val进行的取代。

[段落35]如段落34所述的纤维二糖水解酶变体，其中该取代是用Asp进行的。

[段落36]如段落35所述的纤维二糖水解酶变体，其中该取代是用Asn至Asp进行的。

[段落37]如段落1-36中任一项所述的纤维二糖水解酶变体，该纤维二糖水解酶变体包含在与SEQ ID NO:1的位置157相对应的位置处用Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val进行的取代。

[段落38]如段落37所述的纤维二糖水解酶变体，其中该取代是用Arg进行的。

[段落39]如段落38所述的纤维二糖水解酶变体，其中该取代是用Lys至Arg进行的。

[段落40]如段落1-39中任一项所述的纤维二糖水解酶变体，该纤维二糖水解酶变体包含在与SEQ ID NO:1的位置159相对应的位置处用Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Thr、Trp、Tyr、或Val进行的取代。

[段落41]如段落40所述的纤维二糖水解酶变体，其中该取代是用Pro进行的。

[段落42]如段落41所述的纤维二糖水解酶变体，其中该取代是用Ser至Pro进行的。

[段落43]如段落1-42中任一项所述的纤维二糖水解酶变体，该纤维二糖水解酶变体包含在与SEQ ID NO:1的位置184相对应的位置处用Ala、Arg、Asn、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val进行的取代。

[段落44]如段落43所述的纤维二糖水解酶变体，其中该取代是用Asn进行的。

[段落45]如段落44所述的纤维二糖水解酶变体，其中该取代是用Asp至Asn进行的。

[段落46]如段落1-45中任一项所述的纤维二糖水解酶变体，该纤维二糖水解酶变体包含在与SEQ ID NO:1的位置199相对应的位置处用Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、或Tyr进行的取代。

[段落47]如段落46所述的纤维二糖水解酶变体，其中该取代是用Pro进行的。

[段落48]如段落47所述的纤维二糖水解酶变体，其中该取代是用Val至Pro进行的。

[段落49]如段落1-48中任一项所述的纤维二糖水解酶变体，该纤维二糖水解酶变体包含在与SEQ ID NO:1的位置240相对应的位置处用Ala、Arg、Asn、Asp、Cys、Gln、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val进行的取代。

[段落50]如段落49所述的纤维二糖水解酶变体，其中该取代是用Gly进行的。

[段落51]如段落50所述的纤维二糖水解酶变体，其中该取代是用Glu至Gly进行的。

[段落52]如段落1-51中任一项所述的纤维二糖水解酶变体，该纤维二糖水解酶变体包含在与SEQ ID NO:1的位置250相对应的位置处用Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Thr、Trp、Tyr、或Val进行的取代。

[段落53]如段落52所述的纤维二糖水解酶变体，其中该取代是用Asp进行的。

[段落54]如段落53所述的纤维二糖水解酶变体，其中该取代是用Ser至Asp进行的。

[段落55]如段落1-54中任一项所述的纤维二糖水解酶变体，该纤维二糖水解酶变体包含在与SEQ ID NO:1的位置274相对应的位置处用Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Pro、Ser、Thr、Trp、Tyr、或Val进行的取代。

[段落56]如段落55所述的纤维二糖水解酶变体，其中该取代是用Tyr进行的。

[段落57]如段落56所述的纤维二糖水解酶变体，其中该取代是用Phe至Tyr进行的。

[段落58]如段落1-57中任一项所述的纤维二糖水解酶变体，该纤维二糖水解酶变体包含在与SEQ ID NO:1的位置318相对应的位置处用Ala、Arg、Asn、Asp、Cys、Gln、Glu、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val进行的取代。

[段落59]如段落58所述的纤维二糖水解酶变体，其中该取代是用Ala、Pro、或Ser进行的。

[段落60]如段落59所述的纤维二糖水解酶变体，其中该取代是用Gly至Ala、Pro、或Ser进行的。

[段落61]如段落1-60中任一项所述的纤维二糖水解酶变体，该纤维二糖水解酶变体包含在与SEQ ID NO:1的位置325相对应的位置处用Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Trp、Tyr、或Val进行的取代。

[段落62]如段落61所述的纤维二糖水解酶变体，其中该取代是用Pro进行的。

[段落63]如段落62所述的纤维二糖水解酶变体，其中该取代是用Thr至Pro进行的。

[段落64]如段落1-63中任一项所述的纤维二糖水解酶变体，该纤维二糖水解酶变体包含在与SEQ ID NO:1的位置328相对应的位置处用Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Trp、Tyr、或Val进行的取代。

[段落65]如段落64所述的纤维二糖水解酶变体，其中该取代是用Pro进行的。

[段落66]如段落65所述的纤维二糖水解酶变体，其中该取代是用Thr至Pro进行的。

[段落67]如段落1-66中任一项所述的纤维二糖水解酶变体，该纤维二糖水解酶变体包含在与SEQ ID NO:1的位置347相对应的位置处用Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Trp、Tyr、或Val进行的取代。

[段落68]如段落67所述的纤维二糖水解酶变体，其中该取代是用Pro进行的。

[段落69]如段落68所述的纤维二糖水解酶变体，其中该取代是用Thr至Pro进行的。

[段落70]如段落1-69中任一项所述的纤维二糖水解酶变体，该纤维二糖水解酶变体包含在与SEQ ID NO:1的位置349相对应的位置处用Ala、Arg、Asn、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val进行的取代。

[段落71]如段落70所述的纤维二糖水解酶变体，其中该取代是用Val进行的。

[段落72]如段落71所述的纤维二糖水解酶变体，其中该取代是用Asp至Val进行的。

[段落73]如段落1-72中任一项所述的纤维二糖水解酶变体，该纤维二糖水解酶变体包含在与SEQ ID NO:1的位置358相对应的位置处用Ala、Arg、Asn、Asp、Cys、Gln、Glu、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val进行的取代。

[段落74]如段落73所述的纤维二糖水解酶变体，其中该取代是用Ala进行的。

[段落75]如段落74所述的纤维二糖水解酶变体，其中该取代是用Gly至Ala进行的。

[段落76]如段落1-75中任一项所述的纤维二糖水解酶变体，该纤维二糖水解酶变体包含在与SEQ ID NO:1的位置360相对应的位置处用Ala、Arg、Asn、Asp、Cys、Gln、Glu、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val进行的取代。

[段落77]如段落76所述的纤维二糖水解酶变体，其中该取代是用Ser或Thr进行的。

[段落78]如段落77所述的纤维二糖水解酶变体，其中该取代是用Gly至Ser或Thr进行的。

[段落79]如段落1-78中任一项所述的纤维二糖水解酶变体，该纤维二糖水解酶变体包含在与SEQ ID NO:1的位置380相对应的位置处用Ala、Arg、Asn、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val进行的取代。

[段落80]如段落79所述的纤维二糖水解酶变体，其中该取代是用Asn进行的。

[段落81]如段落80所述的纤维二糖水解酶变体，其中该取代是用Asp至Asn进行的。

[段落82]如段落1-81中任一项所述的纤维二糖水解酶变体，该纤维二糖水解酶变体包含在与SEQ ID NO:1的位置391相对应的位置处用Ala、Arg、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val进行的取代。

[段落83]如段落82所述的纤维二糖水解酶变体，其中该取代是用Asp进行的。

[段落84]如段落83所述的纤维二糖水解酶变体，其中该取代是用Asn至Asp进行的。

[段落85]如段落1-84中任一项所述的纤维二糖水解酶变体，该纤维二糖水解酶变体包含在与SEQ ID NO:1的位置393相对应的位置处用Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Thr、Trp、Tyr、或Val进行的取代。

[段落86]如段落85所述的纤维二糖水解酶变体，其中该取代是用Asp进行的。

[段落87]如段落86所述的纤维二糖水解酶变体，其中该取代是用Ser至Asp进行的。

[段落88]如段落1-87中任一项所述的纤维二糖水解酶变体，该纤维二糖水解酶变体包含在与SEQ ID NO:1的位置394相对应的位置处用Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Thr、Trp、Tyr、或Val进行的取代。

[段落89]如段落88所述的纤维二糖水解酶变体，其中该取代是用Pro进行的。

[段落90]如段落89所述的纤维二糖水解酶变体，其中该取代是用Ser至Pro进行的。

[段落91]如段落1-90中任一项所述的纤维二糖水解酶变体，该纤维二糖水解酶变体包含在与SEQ ID NO:1的位置412相对应的位置处用Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Trp、Tyr、或Val进行的取代。

[段落92]如段落91所述的纤维二糖水解酶变体，其中该取代是用Ala进行的。

[段落93]如段落92所述的纤维二糖水解酶变体，其中该取代是用Thr至Ala进行的。

[段落94]如段落1-93中任一项所述的纤维二糖水解酶变体，该纤维二糖水解酶变体包含在与SEQ ID NO:1的位置430相对应的位置处用Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Trp、Tyr、或Val进行的取代。

[段落95]如段落94所述的纤维二糖水解酶变体，其中该取代是用Val进行的。

[段落96]如段落95所述的纤维二糖水解酶变体，其中该取代是用Thr至Val进行的。

[段落97]如段落1-96中任一项所述的纤维二糖水解酶变体，该纤维二糖水解酶变体进一步包含在与SEQ ID NO:1的位置4、21、26、38、39、44、45、46、51、52、53、54、72、75、87、93、94、95、100、102、108、111、114、129、130、131、137、138、139、144、150、156、157、183、184、187、194、195、196、197、198、199、200、201、205、206、209、211、219、237、241、247、253、260、264、271、280、320、322、330、332、343、345、350、357、358、360、365、371、375、379、380、381、382、385、386、389、390、392、397、400、405、407、413、426、427、430、440、444、445、446、447、450、453、455、456、458、459、462、463、464、492、493、494、496、497、498、502、503、507、510、513、515、516、以及517相对应的一个或多个位置处的改变，例如，G4C、A21P、S26A、W38A、R39L、T44I、T44M、T44N、T44K、S45D、S45N、G46A、G46I、G46L、G46T、Y51I、T52R、T52W、G53A、G53M、G53R、G53W、N54S、N54I、N54D、A72C、G75S、S87T、L93V、N94S、N94A、N94R、N94Q、F95L、F95Y、S100T、S100V、S100W、S100L、S100G、K102S、K102R、L108I、L111T、D114E、F129S、D130N、D130E、V131A、P137S、C138S、G139E、G139M、G139Q、G139S、G139R、L144A、L144V、D150N、A156G、K157R、I183N、D184S、A187L、P194^*、P194Q、S195^*、T196^*、N197A、N197^*、D198A、D198^*、V199^*、N200A、N200G、N200W、N200F、N200C、N200^*、S201^*、N205R、H206Y、C209S、A211T、N219S、M237T、D241L、D241R、D241V、Y247C、A253D、A253R、G260D、N264Y、T271I、V280I、P320A、S322V、N330D、I332F、A343V、G345D、F350L、A357S、G358R、G360M、D365S、M371V、D375A、D375G、A379T、D380H、D380Y、M381V、L382A、D385E、S386C、S386E、P389L、P389Q、P389I、T390A、T390S、T390A、A392G、A392I、A392L、P397A、P397G、P397K、P397W、P397C、P397L、K400A、D405P、S407G、T413P、S426F、N427D、T430Y、T440L、T440R、T440G、T444S、T445D、S446T、S447L、T450D、S453D、T455A、T456S、S458E、K459E、K459S、S462I、T463I、T464A、T464A、H492L、Y493S、Y493W、A494D、A494S、C496S、C496Y、G497C、G498D、G498S、T502N、G503D、C507Y、P510V、P510S、C513R、C513W、K515D、Q516P、以及N517D。

[段落98]如段落1-97中任一项所述的纤维二糖水解酶变体，该纤维二糖水解酶变体相对于该亲本具有增加的热活性或增加的热稳定性。

[段落99]如段落1-98中任一项所述的纤维二糖水解酶变体，该纤维二糖水解酶变体具有纤维二糖水解酶I活性。

[段落100]一种酶组合物，该酶组合物包含如段落1-99中任一项所述的纤维二糖水解酶变体。

[段落101]如段落100所述的酶组合物，该酶组合物进一步包含选自下组的一种或多种酶，该组由以下组成：纤维素酶、AA9多肽、半纤维素酶、CIP、酯酶、棒曲霉素、木质素分解酶、氧化还原酶、果胶酶、蛋白酶、和膨胀素。

[段落102]如段落101所述的方法，其中该纤维素酶是选自下组的一种或多种酶，该组由以下组成：内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶。

[段落103]如段落101所述的方法，其中该半纤维素酶是选自下组的一种或多种酶，该组由以下组成：木聚糖酶、乙酰木聚糖酯酶、阿魏酸酯酶、阿拉伯呋喃糖苷酶、木糖苷酶、和葡糖醛酸糖苷酶。

[段落104]如段落100-103中任一项所述的酶组合物，该酶组合物进一步包含过氧化氢酶。

[段落105]一种分离的多核苷酸，该分离的多核苷酸编码如段落1-99中任一项所述的纤维二糖水解酶变体，该多核苷酸与一种或多种控制序列可操作地连接，这些控制序列指导多肽在表达宿主中产生。

[段落106]一种核酸构建体，该核酸构建体包含如段落105所述的多核苷酸。

[段落107]一种表达载体，该表达载体包括如段落105所述的多核苷酸。

[段落108]一种重组宿主细胞，该重组宿主细胞包含如段落105所述的多核苷酸。

[段落109]一种产生纤维二糖水解酶变体的方法，该方法包括：

(a)在适合于表达该变体的条件下培养如段落108所述的重组宿主细胞；以及任选地

(b)回收该变体。

[段落110]一种用如段落105所述的多核苷酸转化的转基因植物、植物部分或植物细胞。

[段落111]一种产生纤维二糖水解酶变体的方法，该方法包括：

(a)在有益于产生该变体的条件下，培养如段落110所述的转基因植物、植物部分或植物细胞；以及任选地

(b)回收该变体。

[段落112]一种用于获得纤维二糖水解酶变体的方法，该方法包括：在与SEQ IDNO:1的多肽的位置8、17、113、157、159、184、199、240、250、274、318、325、328、347、349、358、360、380、391、393、394、412、以及430相对应的一个或多个位置处将取代引入亲本纤维二糖水解酶，其中该纤维二糖水解酶变体具有纤维二糖水解酶活性；并且回收该变体。

[段落113]一种全培养液配制品或细胞培养组合物，该全培养液配制品或细胞培养组合物包含如段落1-99中任一项所述的纤维二糖水解酶变体。

[段落114]一种用于降解纤维素材料的方法，该方法包括：用包含如段落1-99中任一项所述的纤维二糖水解酶变体的酶组合物处理纤维素材料。

[段落115]如段落114所述的方法，其中对该纤维素材料进行预处理。

[段落116]如段落114或115所述的方法，其中该酶组合物进一步包含一种或多种选自下组的酶，该组由以下组成：纤维素酶、AA9多肽、半纤维素酶、CIP、酯酶、棒曲霉素、木质素分解酶、氧化还原酶、果胶酶、蛋白酶、以及膨胀蛋白。

[段落117]如段落116所述的方法，其中该纤维素酶是选自下组的一种或多种酶，该组由以下组成：内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶。

[段落118]如段落116所述的方法，其中该半纤维素酶是选自下组的一种或多种酶，该组由以下组成：木聚糖酶、乙酰木聚糖酯酶、阿魏酸酯酶、阿拉伯呋喃糖苷酶、木糖苷酶、和葡糖醛酸糖苷酶。

[段落119]如段落114-118中任一项所述的方法，该方法进一步包括回收该降解的纤维素材料。

[段落120]如段落119所述的方法，其中该降解的纤维素材料是糖。

[段落121]如段落120所述的方法，其中该糖选自下组，该组由以下组成：葡萄糖、木糖、甘露糖、半乳糖、和阿拉伯糖。

[段落122]一种用于产生发酵产物的方法，该方法包括：

(a)用包含如段落1-99中任一项所述的纤维二糖水解酶变体的酶组合物糖化纤维素材料；

(b)用一种或多种发酵微生物对该糖化的纤维素材料进行发酵，以产生该发酵产物；以及

(c)从该发酵中回收该发酵产物。

[段落123]如段落122所述的方法，其中对该纤维素材料进行预处理。

[段落124]如段落122或123所述的方法，其中该酶组合物进一步包含一种或多种选自下组的酶，该组由以下组成：纤维素酶、AA9多肽、半纤维素酶、CIP、酯酶、棒曲霉素、木质素分解酶、氧化还原酶、果胶酶、蛋白酶、以及膨胀蛋白。

[段落125]如段落124所述的方法，其中该纤维素酶是选自下组的一种或多种酶，该组由以下组成：内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶。

[段落126]如段落124所述的方法，其中该半纤维素酶是选自下组的一种或多种酶，该组由以下组成：木聚糖酶、乙酰木聚糖酯酶、阿魏酸酯酶、阿拉伯呋喃糖苷酶、木糖苷酶、和葡糖醛酸糖苷酶。

[段落127]如段落122-126中任一项所述的方法，其中步骤(a)和(b)是在同时糖化和发酵中同时进行。

[段落128]如段落122-127中任一项所述的方法，其中该发酵产物是醇、烷烃、环烷烃、烯烃、氨基酸、气体、异戊二烯、酮、有机酸、或聚酮化合物。

[段落129]一种发酵纤维素材料的方法，该方法包括：用一种或多种发酵微生物发酵该纤维素材料，其中用一种包含如段落1-99中任一项所述的纤维二糖水解酶变体的酶组合物糖化该纤维素材料。

[段落130]如段落129所述的方法，其中发酵该纤维素材料产生发酵产物。

[段落131]如段落130所述的方法，该方法进一步包含从该发酵中回收该发酵产物。

[段落132]如段落130或131所述的方法，其中该发酵产物是醇、烷烃、环烷烃、烯烃、氨基酸、气体、异戊二烯、酮、有机酸、或聚酮化合物。

[段落133]如段落129-132中任一项所述的方法，其中在糖化之前，对该纤维素材料进行预处理。

[段落134]如段落129-133中任一项所述的方法，其中该酶组合物进一步包含一种或多种选自下组的酶，该组由以下组成：纤维素酶、AA9多肽、半纤维素酶、CIP、酯酶、棒曲霉素、木质素分解酶、氧化还原酶、果胶酶、蛋白酶、和膨胀素。

[段落135]如段落134所述的方法，其中该纤维素酶是选自下组的一种或多种酶，该组由以下组成：内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶。

[段落136]如段落134所述的方法，其中该半纤维素酶是选自下组的一种或多种酶，该组由以下组成：木聚糖酶、乙酰木聚糖酯酶、阿魏酸酯酶、阿拉伯呋喃糖苷酶、木糖苷酶、和葡糖醛酸糖苷酶。

[段落137]如段落114-136中任一项所述的方法，其中在糖化过程中添加氧气，以将溶解的氧的浓度维持在至少0.5％的饱和度水平。

[段落138]如段落137所述的方法，其中糖化过程中的溶解的氧浓度处于0.5％-10％饱和度水平范围内，例如0.5％-7％、例如0.5％-5％、例如0.5％-4％、例如0.5％-3％、例如0.5％-2％、例如1％-5％、例如1％-4％、例如1％-3％、例如1％-2％。

[段落139]如段落114-138中任一项所述的方法，其中该酶组合物进一步包含过氧化氢酶。

在此描述和要求保护的本发明不限于在此披露的特定方面的范围，因为这些方面旨在作为本发明若干方面的说明。任何等同方面意欲在本发明的范围之内。实际上，除了在此所示和描述的那些之外，对于本领域的技术人员而言本发明的各种修改将从前述的说明书变得显而易见。这样的修改也旨在落入所附权利要求书的范围内。在冲突的情况下，以包括定义的本披露内容为准。

序列表

<110> 诺维信公司（Novozymes A/S）

Wogulis, Mark David

DeMars, Leslie

Osborn, David

<120> 纤维二糖水解酶变体和编码其的多核苷酸

<130> 13299-WO-PCT

<150> US 62/312,806

<151> 2016-03-24

<160> 79

<170> PatentIn 3.5版本

<210> 1

<211> 524

<212> PRT

<213> Penicillium vasconiae

<400> 1

Gln Gln Val Gly Thr Leu Thr Thr Glu Thr His Pro Ser Leu Thr Trp

1 5 10 15

Ser Gln Cys Thr Ala Gly Gly Ser Cys Ser Thr Val Thr Gly Ser Val

20 25 30

Val Ile Asp Ser Asn Trp Arg Trp Val His Ser Thr Ser Gly Ser Thr

35 40 45

Asn Cys Tyr Thr Gly Asn Thr Trp Asp Ala Thr Leu Cys Pro Asp Asp

50 55 60

Val Thr Cys Ala Ala Asn Cys Ala Leu Asp Gly Ala Ser Tyr Ser Ser

65 70 75 80

Thr Tyr Gly Val Thr Thr Ser Gly Asn Ser Leu Arg Leu Asn Phe Val

85 90 95

Thr Thr Ala Ser Gln Lys Asn Ile Gly Ser Arg Leu Tyr Leu Leu Glu

100 105 110

Asn Asp Thr Thr Tyr Gln Lys Phe Asn Leu Leu Asn Gln Glu Phe Thr

115 120 125

Phe Asp Val Asp Val Ser Asn Leu Pro Cys Gly Leu Asn Gly Ala Leu

130 135 140

Tyr Phe Val Asp Met Asp Ala Asp Gly Gly Met Ala Lys Tyr Ser Thr

145 150 155 160

Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln Cys

165 170 175

Pro Arg Asp Leu Lys Phe Ile Asp Gly Gln Ala Asn Val Glu Gly Trp

180 185 190

Thr Pro Ser Thr Asn Asp Val Asn Ser Gly Ile Gly Asn His Gly Ser

195 200 205

Cys Cys Ala Glu Met Asp Ile Trp Glu Ala Asn Ser Ile Ser Asn Ala

210 215 220

Val Thr Pro His Pro Cys Asp Thr Pro Ser Gln Thr Met Cys Thr Glu

225 230 235 240

Asp Ala Cys Gly Gly Thr Tyr Ser Thr Ser Arg Tyr Ala Gly Thr Cys

245 250 255

Asp Pro Asp Gly Cys Asp Phe Asn Pro Tyr Arg Met Gly Asp Thr Ser

260 265 270

Phe Phe Gly Pro Gly Leu Thr Val Asp Thr Lys Ser Pro Phe Thr Val

275 280 285

Val Thr Gln Phe Ile Thr Asn Asp Gly Thr Ser Ser Gly Thr Leu Ser

290 295 300

Glu Ile Lys Arg Phe Tyr Val Gln Asn Gly Lys Val Ile Gly Gln Pro

305 310 315 320

Gln Ser Thr Ile Thr Gly Val Thr Gly Asn Ser Ile Thr Asp Thr Phe

325 330 335

Cys Asn Ala Gln Lys Thr Ala Phe Gly Asp Thr Asn Asp Phe Thr Lys

340 345 350

His Gly Gly Met Ala Gly Met Gly Ala Gly Leu Ala Asp Gly Met Val

355 360 365

Leu Val Met Ser Leu Trp Asp Asp His Ala Ala Asp Met Leu Trp Leu

370 375 380

Asp Ser Thr Tyr Pro Thr Asn Ala Ser Ser Thr Thr Pro Gly Val Lys

385 390 395 400

Arg Gly Thr Cys Asp Ile Ser Ser Gly Asp Pro Thr Thr Val Glu Ser

405 410 415

Thr Tyr Pro Asn Ala Tyr Val Ile Tyr Ser Asn Ile Lys Thr Gly Pro

420 425 430

Leu Asn Ser Thr Phe Thr Gly Thr Thr Ser Gly Thr Thr Ser Ser Ser

435 440 445

Thr Thr Thr Thr Ser Thr Thr Thr Thr Ser Lys Thr Ser Ser Thr Thr

450 455 460

Thr Thr Thr Thr Ser Lys Thr Ser Ser Thr Ser Ser Thr Ser Thr Thr

465 470 475 480

Thr Ser Thr Gly Ser Ser Thr Thr Gly Ala Ala His Tyr Ala Gln Cys

485 490 495

Gly Gly Ile Gly Trp Thr Gly Ala Thr Thr Cys Val Ser Pro Tyr Thr

500 505 510

Cys Thr Lys Gln Asn Asp Tyr Tyr Ser Gln Cys Leu

515 520

<210> 2

<211> 497

<212> PRT

<213> 里氏木霉

<400> 2

Gln Ser Ala Cys Thr Leu Gln Ser Glu Thr His Pro Pro Leu Thr Trp

1 5 10 15

Gln Lys Cys Ser Ser Gly Gly Thr Cys Thr Gln Gln Thr Gly Ser Val

20 25 30

Val Ile Asp Ala Asn Trp Arg Trp Thr His Ala Thr Asn Ser Ser Thr

35 40 45

Asn Cys Tyr Asp Gly Asn Thr Trp Ser Ser Thr Leu Cys Pro Asp Asn

50 55 60

Glu Thr Cys Ala Lys Asn Cys Cys Leu Asp Gly Ala Ala Tyr Ala Ser

65 70 75 80

Thr Tyr Gly Val Thr Thr Ser Gly Asn Ser Leu Ser Ile Gly Phe Val

85 90 95

Thr Gln Ser Ala Gln Lys Asn Val Gly Ala Arg Leu Tyr Leu Met Ala

100 105 110

Ser Asp Thr Thr Tyr Gln Glu Phe Thr Leu Leu Gly Asn Glu Phe Ser

115 120 125

Phe Asp Val Asp Val Ser Gln Leu Pro Cys Gly Leu Asn Gly Ala Leu

130 135 140

Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Val Ser Lys Tyr Pro Thr

145 150 155 160

Asn Thr Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln Cys

165 170 175

Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Glu Gly Trp

180 185 190

Glu Pro Ser Ser Asn Asn Ala Asn Thr Gly Ile Gly Gly His Gly Ser

195 200 205

Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Ser Ile Ser Glu Ala

210 215 220

Leu Thr Pro His Pro Cys Thr Thr Val Gly Gln Glu Ile Cys Glu Gly

225 230 235 240

Asp Gly Cys Gly Gly Thr Tyr Ser Asp Asn Arg Tyr Gly Gly Thr Cys

245 250 255

Asp Pro Asp Gly Cys Asp Trp Asn Pro Tyr Arg Leu Gly Asn Thr Ser

260 265 270

Phe Tyr Gly Pro Gly Ser Ser Phe Thr Leu Asp Thr Thr Lys Lys Leu

275 280 285

Thr Val Val Thr Gln Phe Glu Thr Ser Gly Ala Ile Asn Arg Tyr Tyr

290 295 300

Val Gln Asn Gly Val Thr Phe Gln Gln Pro Asn Ala Glu Leu Gly Ser

305 310 315 320

Tyr Ser Gly Asn Glu Leu Asn Asp Asp Tyr Cys Thr Ala Glu Glu Ala

325 330 335

Glu Phe Gly Gly Ser Ser Phe Ser Asp Lys Gly Gly Leu Thr Gln Phe

340 345 350

Lys Lys Ala Thr Ser Gly Gly Met Val Leu Val Met Ser Leu Trp Asp

355 360 365

Asp Tyr Tyr Ala Asn Met Leu Trp Leu Asp Ser Thr Tyr Pro Thr Asn

370 375 380

Glu Thr Ser Ser Thr Pro Gly Ala Val Arg Gly Ser Cys Ser Thr Ser

385 390 395 400

Ser Gly Val Pro Ala Gln Val Glu Ser Gln Ser Pro Asn Ala Lys Val

405 410 415

Thr Phe Ser Asn Ile Lys Phe Gly Pro Ile Gly Ser Thr Gly Asn Pro

420 425 430

Ser Gly Gly Asn Pro Pro Gly Gly Asn Pro Pro Gly Thr Thr Thr Thr

435 440 445

Arg Arg Pro Ala Thr Thr Thr Gly Ser Ser Pro Gly Pro Thr Gln Ser

450 455 460

His Tyr Gly Gln Cys Gly Gly Ile Gly Tyr Ser Gly Pro Thr Val Cys

465 470 475 480

Ala Ser Gly Thr Thr Cys Gln Val Leu Asn Pro Tyr Tyr Ser Gln Cys

485 490 495

Leu

<210> 3

<211> 437

<212> PRT

<213> 埃默森青霉

<400> 3

Gln Gln Ala Gly Thr Ala Thr Ala Glu Asn His Pro Pro Leu Thr Trp

1 5 10 15

Gln Glu Cys Thr Ala Pro Gly Ser Cys Thr Thr Gln Asn Gly Ala Val

20 25 30

Val Leu Asp Ala Asn Trp Arg Trp Val His Asp Val Asn Gly Tyr Thr

35 40 45

Asn Cys Tyr Thr Gly Asn Thr Trp Asn Pro Thr Tyr Cys Pro Asp Asp

50 55 60

Glu Thr Cys Ala Gln Asn Cys Ala Leu Asp Gly Ala Asp Tyr Glu Gly

65 70 75 80

Thr Tyr Gly Val Thr Ser Ser Gly Ser Ser Leu Lys Leu Asn Phe Val

85 90 95

Thr Gly Ser Asn Val Gly Ser Arg Leu Tyr Leu Leu Gln Asp Asp Ser

100 105 110

Thr Tyr Gln Ile Phe Lys Leu Leu Asn Arg Glu Phe Thr Phe Asp Val

115 120 125

Asp Val Ser Asn Leu Pro Cys Gly Leu Asn Gly Ala Leu Tyr Phe Val

130 135 140

Ala Met Asp Ala Asp Gly Gly Val Ser Lys Tyr Pro Asn Asn Lys Ala

145 150 155 160

Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln Cys Pro Arg Asp

165 170 175

Leu Lys Phe Ile Asp Gly Glu Ala Asn Val Glu Gly Trp Gln Pro Ser

180 185 190

Ser Asn Asn Ala Asn Thr Gly Ile Gly Asp His Gly Ser Cys Cys Ala

195 200 205

Glu Met Asp Val Trp Glu Ala Asn Ser Ile Ser Asn Ala Val Thr Pro

210 215 220

His Pro Cys Asp Thr Pro Gly Gln Thr Met Cys Ser Gly Asp Asp Cys

225 230 235 240

Gly Gly Thr Tyr Ser Asn Asp Arg Tyr Ala Gly Thr Cys Asp Pro Asp

245 250 255

Gly Cys Asp Phe Asn Pro Tyr Arg Met Gly Asn Thr Ser Phe Tyr Gly

260 265 270

Pro Gly Lys Ile Ile Asp Thr Thr Lys Pro Phe Thr Val Val Thr Gln

275 280 285

Phe Leu Thr Asp Asp Gly Thr Asp Thr Gly Thr Leu Ser Glu Ile Lys

290 295 300

Arg Phe Tyr Val Gln Asn Gly Asn Val Ile Pro Gln Pro Asn Ser Asp

305 310 315 320

Ile Ser Gly Val Thr Gly Asn Ser Ile Thr Thr Glu Phe Cys Thr Ala

325 330 335

Gln Lys Gln Ala Phe Gly Asp Thr Asp Asp Phe Ser Gln His Gly Gly

340 345 350

Leu Ala Lys Met Gly Ala Ala Met Gln Gln Gly Met Val Leu Val Met

355 360 365

Ser Leu Trp Asp Asp Tyr Ala Ala Gln Met Leu Trp Leu Asp Ser Asp

370 375 380

Tyr Pro Thr Asp Ala Asp Pro Thr Thr Pro Gly Ile Ala Arg Gly Thr

385 390 395 400

Cys Pro Thr Asp Ser Gly Val Pro Ser Asp Val Glu Ser Gln Ser Pro

405 410 415

Asn Ser Tyr Val Thr Tyr Ser Asn Ile Lys Phe Gly Pro Ile Asn Ser

420 425 430

Thr Phe Thr Ala Ser

435

<210> 4

<211> 504

<212> PRT

<213> 奥斯塔尼青霉

<400> 4

Gln Gln Ile Gly Thr Tyr Thr Ala Glu Thr His Pro Ser Leu Ser Trp

1 5 10 15

Ser Thr Cys Lys Ser Gly Gly Ser Cys Thr Thr Asn Ser Gly Ala Ile

20 25 30

Thr Leu Asp Ala Asn Trp Arg Trp Val His Gly Val Asn Thr Ser Thr

35 40 45

Asn Cys Tyr Thr Gly Asn Thr Trp Asn Ser Ala Ile Cys Asp Thr Asp

50 55 60

Ala Ser Cys Ala Gln Asp Cys Ala Leu Asp Gly Ala Asp Tyr Ser Gly

65 70 75 80

Thr Tyr Gly Ile Thr Thr Ser Gly Asn Ser Leu Arg Leu Asn Phe Val

85 90 95

Thr Gly Ser Asn Val Gly Ser Arg Thr Tyr Leu Met Ala Asp Asn Thr

100 105 110

His Tyr Gln Ile Phe Asp Leu Leu Asn Gln Glu Phe Thr Phe Thr Val

115 120 125

Asp Val Ser His Leu Pro Cys Gly Leu Asn Gly Ala Leu Tyr Phe Val

130 135 140

Thr Met Asp Ala Asp Gly Gly Val Ser Lys Tyr Pro Asn Asn Lys Ala

145 150 155 160

Gly Ala Gln Tyr Gly Val Gly Tyr Cys Asp Ser Gln Cys Pro Arg Asp

165 170 175

Leu Lys Phe Ile Ala Gly Gln Ala Asn Val Glu Gly Trp Thr Pro Ser

180 185 190

Ala Asn Asn Ala Asn Thr Gly Ile Gly Asn His Gly Ala Cys Cys Ala

195 200 205

Glu Leu Asp Ile Trp Glu Ala Asn Ser Ile Ser Glu Ala Leu Thr Pro

210 215 220

His Pro Cys Asp Thr Pro Gly Leu Ser Val Cys Thr Thr Asp Ala Cys

225 230 235 240

Gly Gly Thr Tyr Ser Ser Asp Arg Tyr Ala Gly Thr Cys Asp Pro Asp

245 250 255

Gly Cys Asp Phe Asn Pro Tyr Arg Leu Gly Val Thr Asp Phe Tyr Gly

260 265 270

Ser Gly Lys Thr Val Asp Thr Thr Lys Pro Phe Thr Val Val Thr Gln

275 280 285

Phe Val Thr Asn Asp Gly Thr Ser Thr Gly Ser Leu Ser Glu Ile Arg

290 295 300

Arg Tyr Tyr Val Gln Asn Gly Val Val Ile Pro Gln Pro Ser Ser Lys

305 310 315 320

Ile Ser Gly Ile Ser Gly Asn Val Ile Asn Ser Asp Tyr Cys Ala Ala

325 330 335

Glu Ile Ser Thr Phe Gly Gly Thr Ala Ser Phe Asn Lys His Gly Gly

340 345 350

Leu Thr Asn Met Ala Ala Gly Met Glu Ala Gly Met Val Leu Val Met

355 360 365

Ser Leu Trp Asp Asp Tyr Ala Val Asn Met Leu Trp Leu Asp Ser Thr

370 375 380

Tyr Pro Thr Asn Ala Thr Gly Thr Pro Gly Ala Ala Arg Gly Thr Cys

385 390 395 400

Ala Thr Thr Ser Gly Asp Pro Lys Thr Val Glu Ser Gln Ser Gly Ser

405 410 415

Ser Tyr Val Thr Phe Ser Asp Ile Arg Val Gly Pro Phe Asn Ser Thr

420 425 430

Phe Ser Gly Gly Ser Ser Thr Gly Gly Ser Thr Thr Thr Thr Ala Ser

435 440 445

Arg Thr Thr Thr Thr Ser Ala Ser Ser Thr Ser Thr Ser Ser Thr Ser

450 455 460

Thr Gly Thr Gly Val Ala Gly His Trp Gly Gln Cys Gly Gly Gln Gly

465 470 475 480

Trp Thr Gly Pro Thr Thr Cys Val Ser Gly Thr Thr Cys Thr Val Val

485 490 495

Asn Pro Tyr Tyr Ser Gln Cys Leu

500

<210> 5

<211> 507

<212> PRT

<213> 雷塞氏篮状菌

<400> 5

Gln Gln Ile Gly Thr Tyr Gln Thr Glu Thr His Pro Pro Leu Thr Trp

1 5 10 15

Gln Thr Cys Thr Ser Gly Gly Ser Cys Thr Thr Asn Gln Gly Ser Ile

20 25 30

Val Leu Asp Ala Asn Trp Arg Trp Val His Glu Val Gly Ser Thr Thr

35 40 45

Asn Cys Tyr Thr Gly Asn Thr Trp Asp Thr Ser Ile Cys Ser Thr Asp

50 55 60

Thr Thr Cys Ala Gln Gln Cys Ala Val Asp Gly Ala Asp Tyr Glu Gly

65 70 75 80

Thr Tyr Gly Ile Thr Thr Ser Gly Ser Gln Val Arg Ile Asn Phe Val

85 90 95

Thr Asn Asn Ser Asn Gly Lys Asn Val Gly Ala Arg Val Tyr Met Met

100 105 110

Ala Asp Asn Thr His Tyr Gln Ile Tyr Gln Leu Leu Asn Gln Glu Phe

115 120 125

Thr Phe Asp Val Asp Val Ser Asn Leu Pro Cys Gly Leu Asn Gly Ala

130 135 140

Leu Tyr Phe Val Val Met Asp Ala Asp Gly Gly Val Ser Lys Tyr Pro

145 150 155 160

Asn Asn Lys Ala Gly Ala Gln Tyr Gly Val Gly Tyr Cys Asp Ser Gln

165 170 175

Cys Pro Arg Asp Leu Lys Phe Ile Gln Gly Gln Ala Asn Val Glu Gly

180 185 190

Trp Gln Pro Ser Ser Asn Asn Ala Asn Thr Gly Leu Gly Asn His Gly

195 200 205

Ser Cys Cys Ala Glu Leu Asp Val Trp Glu Ser Asn Ser Ile Ser Gln

210 215 220

Ala Leu Thr Pro His Pro Cys Asp Thr Pro Thr Asn Thr Leu Cys Thr

225 230 235 240

Gly Asp Ser Cys Gly Gly Thr Tyr Ser Ser Asn Arg Tyr Ala Gly Thr

245 250 255

Cys Asp Pro Asp Gly Cys Asp Phe Asn Pro Tyr Arg Leu Gly Asn Thr

260 265 270

Thr Phe Tyr Gly Pro Gly Lys Thr Ile Asp Thr Thr Lys Pro Phe Thr

275 280 285

Val Val Thr Gln Phe Ile Thr Asp Asp Gly Thr Ser Ser Gly Thr Leu

290 295 300

Ser Glu Ile Arg Arg Phe Tyr Val Gln Asn Gly Val Thr Tyr Ala Gln

305 310 315 320

Pro Asn Ser Asp Val Ser Gly Ile Ser Gly Asn Ala Ile Asn Ser Ala

325 330 335

Tyr Cys Thr Ala Glu Asn Thr Val Phe Asn Gly Ala Gly Thr Phe Ala

340 345 350

Gln His Gly Gly Leu Ala Gly Met Ser Gln Ala Met Ser Thr Gly Met

355 360 365

Val Leu Val Met Ser Leu Trp Asp Asp Tyr Tyr Ala Asp Met Leu Trp

370 375 380

Leu Asp Ser Thr Tyr Pro Thr Asn Asp Thr Ala Ser Thr Pro Gly Ala

385 390 395 400

Val Arg Gly Thr Cys Ser Thr Ser Ser Gly Val Pro Ser Gln Val Glu

405 410 415

Ser Ala Ser Pro Asn Ala Tyr Val Thr Tyr Ser Asn Ile Lys Val Gly

420 425 430

Pro Ile Gly Ser Thr Phe Asn Ser Gly Gly Ser Gly Ser Gly Ser Ser

435 440 445

Ser Ser Thr Thr Thr Thr Thr His Ala Ser Thr Thr Thr Thr Ser Ser

450 455 460

Ala Ser Ser Thr Gly Thr Gly Val Ala Gln His Trp Gly Gln Cys Gly

465 470 475 480

Gly Gln Gly Trp Thr Gly Pro Thr Thr Cys Val Ser Pro Tyr Thr Cys

485 490 495

Gln Glu Leu Asn Pro Tyr Tyr Tyr Gln Cys Leu

500 505

<210> 6

<211> 506

<212> PRT

<213> 烟曲霉

<400> 6

Gln Gln Val Gly Thr Ser Gln Ala Glu Val His Pro Ser Met Thr Trp

1 5 10 15

Gln Ser Cys Thr Ala Gly Gly Ser Cys Thr Thr Asn Asn Gly Lys Val

20 25 30

Val Ile Asp Ala Asn Trp Arg Trp Val His Lys Val Gly Asp Tyr Thr

35 40 45

Asn Cys Tyr Thr Gly Asn Thr Trp Asp Thr Thr Ile Cys Pro Asp Asp

50 55 60

Ala Thr Cys Ala Ser Asn Cys Ala Leu Glu Gly Ala Asn Tyr Glu Ser

65 70 75 80

Thr Tyr Gly Val Thr Ala Ser Gly Asn Ser Leu Arg Leu Asn Phe Val

85 90 95

Thr Thr Ser Gln Gln Lys Asn Ile Gly Ser Arg Leu Tyr Met Met Lys

100 105 110

Asp Asp Ser Thr Tyr Glu Met Phe Lys Leu Leu Asn Gln Glu Phe Thr

115 120 125

Phe Asp Val Asp Val Ser Asn Leu Pro Cys Gly Leu Asn Gly Ala Leu

130 135 140

Tyr Phe Val Ala Met Asp Ala Asp Gly Gly Met Ser Lys Tyr Pro Thr

145 150 155 160

Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln Cys

165 170 175

Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Glu Gly Trp

180 185 190

Gln Pro Ser Ser Asn Asp Ala Asn Ala Gly Thr Gly Asn His Gly Ser

195 200 205

Cys Cys Ala Glu Met Asp Ile Trp Glu Ala Asn Ser Ile Ser Thr Ala

210 215 220

Phe Thr Pro His Pro Cys Asp Thr Pro Gly Gln Val Met Cys Thr Gly

225 230 235 240

Asp Ala Cys Gly Gly Thr Tyr Ser Ser Asp Arg Tyr Gly Gly Thr Cys

245 250 255

Asp Pro Asp Gly Cys Asp Phe Asn Ser Phe Arg Gln Gly Asn Lys Thr

260 265 270

Phe Tyr Gly Pro Gly Met Thr Val Asp Thr Lys Ser Lys Phe Thr Val

275 280 285

Val Thr Gln Phe Ile Thr Asp Asp Gly Thr Ser Ser Gly Thr Leu Lys

290 295 300

Glu Ile Lys Arg Phe Tyr Val Gln Asn Gly Lys Val Ile Pro Asn Ser

305 310 315 320

Glu Ser Thr Trp Thr Gly Val Ser Gly Asn Ser Ile Thr Thr Glu Tyr

325 330 335

Cys Thr Ala Gln Lys Ser Leu Phe Gln Asp Gln Asn Val Phe Glu Lys

340 345 350

His Gly Gly Leu Glu Gly Met Gly Ala Ala Leu Ala Gln Gly Met Val

355 360 365

Leu Val Met Ser Leu Trp Asp Asp His Ser Ala Asn Met Leu Trp Leu

370 375 380

Asp Ser Asn Tyr Pro Thr Thr Ala Ser Ser Thr Thr Pro Gly Val Ala

385 390 395 400

Arg Gly Thr Cys Asp Ile Ser Ser Gly Val Pro Ala Asp Val Glu Ala

405 410 415

Asn His Pro Asp Ala Tyr Val Val Tyr Ser Asn Ile Lys Val Gly Pro

420 425 430

Ile Gly Ser Thr Phe Asn Ser Gly Gly Ser Asn Pro Gly Gly Gly Thr

435 440 445

Thr Thr Thr Thr Thr Thr Gln Pro Thr Thr Thr Thr Thr Thr Ala Gly

450 455 460

Asn Pro Gly Gly Thr Gly Val Ala Gln His Tyr Gly Gln Cys Gly Gly

465 470 475 480

Ile Gly Trp Thr Gly Pro Thr Thr Cys Ala Ser Pro Tyr Thr Cys Gln

485 490 495

Lys Leu Asn Asp Tyr Tyr Ser Gln Cys Leu

500 505

<210> 7

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 7

ttgcagccaa gatctctgca cagcaggtcg gcactttgac 40

<210> 8

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 8

taaatcatat taattaagct ctacaggcac tgggagtaat 40

<210> 9

<211> 48

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 9

atctctgcac agcaggtcgg cactttgacg cccgagaccc atccatcg 48

<210> 10

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 10

cgtcaaagtg ccgacctgct gtgcagagat 30

<210> 11

<211> 48

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 11

atctctgcac agcaggtcgg cactttgacg gccgagaccc atccatcg 48

<210> 12

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 12

cgtcaaagtg ccgacctgct gtgcagagat 30

<210> 13

<211> 48

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 13

acgactgaga cccatccatc gttgacctgg cagcagtgta ccgccggc 48

<210> 14

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 14

ccaggtcaac gatggatggg tctcagtcgt 30

<210> 15

<211> 48

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 15

aacatcggtt cccgtctgta cttgctggag gacgacacca cctaccag 48

<210> 16

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 16

ctccagcaag tacagacggg aaccgatgtt 30

<210> 17

<211> 48

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 17

gtggacatgg acgcagatgg tggcatggcc cgctactcca ccaacaag 48

<210> 18

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 18

ggccatgcca ccatctgcgt ccatgtccac 30

<210> 19

<211> 48

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 19

atggacgcag atggtggcat ggccaaatac cccaccaaca aggccgga 48

<210> 20

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 20

gtatttggcc atgccaccat ctgcgtccat 30

<210> 21

<211> 48

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 21

agtcaatgcc cgcgggatct caagttcatc aacggccagg ccaacgtg 48

<210> 22

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 22

gatgaacttg agatcccgcg ggcattgact 30

<210> 23

<211> 48

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 23

gtggaaggct ggaccccctc caccaatgat cccaactccg gcattggc 48

<210> 24

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 24

atcattggtg gagggggtcc agccttccac 30

<210> 25

<211> 48

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 25

tgcgacaccc cctcgcaaac catgtgcact ggcgatgcct gcggtgga 48

<210> 26

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 26

agtgcacatg gtttgcgagg gggtgtcgca 30

<210> 27

<211> 48

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 27

gaagatgcct gcggtggaac ctacagcact gaccgctatg ccggtact 48

<210> 28

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 28

agtgctgtag gttccaccgc aggcatcttc 30

<210> 29

<211> 48

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 29

aacccctacc gtatgggcga cacttctttc tacggtcctg gcttgacc 48

<210> 30

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 30

gaaagaagtg tcgcccatac ggtaggggtt 30

<210> 31

<211> 48

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 31

cgcttctacg tccagaacgg caaggtcatc gcccagcccc agtctacc 48

<210> 32

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 32

gatgaccttg ccgttctgga cgtagaagcg 30

<210> 33

<211> 48

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 33

cgcttctacg tccagaacgg caaggtcatc ccccagcccc agtctacc 48

<210> 34

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 34

gatgaccttg ccgttctgga cgtagaagcg 30

<210> 35

<211> 48

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 35

cgcttctacg tccagaacgg caaggtcatc agccagcccc agtctacc 48

<210> 36

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 36

gatgaccttg ccgttctgga cgtagaagcg 30

<210> 37

<211> 48

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 37

aaggtcatcg gtcagcccca gtctaccatc cccggcgtca ccggtaac 48

<210> 38

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 38

gatggtagac tggggctgac cgatgacctt 30

<210> 39

<211> 48

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 39

ggtcagcccc agtctaccat cactggcgtc cccggtaact cgatcacc 48

<210> 40

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 40

gacgccagtg atggtagact ggggctgacc 30

<210> 41

<211> 48

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 41

tgcaatgcgc aaaagaccgc attcggcgac cccaatgact tcaccaag 48

<210> 42

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 42

gtcgccgaat gcggtctttt gcgcattgca 30

<210> 43

<211> 48

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 43

gcgcaaaaga ccgcattcgg cgacaccaat gtcttcacca agcacggt 48

<210> 44

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 44

attggtgtcg ccgaatgcgg tcttttgcgc 30

<210> 45

<211> 48

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 45

aatgacttca ccaagcacgg tggcatggca gccatgggtg ccggtctc 48

<210> 46

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 46

tgccatgcca ccgtgcttgg tgaagtcatt 30

<210> 47

<211> 48

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 47

ttcaccaagc acggtggcat ggcaggcatg accgccggtc tcgctgat 48

<210> 48

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 48

catgcctgcc atgccaccgt gcttggtgaa 30

<210> 49

<211> 48

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 49

ttcaccaagc acggtggcat ggcaggcatg agcgccggtc tcgctgat 48

<210> 50

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 50

catgcctgcc atgccaccgt gcttggtgaa 30

<210> 51

<211> 48

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 51

gtcatgagtc tctgggatga ccatgcggcc aacatgctct ggctcgac 48

<210> 52

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 52

ggccgcatgg tcatcccaga gactcatgac 30

<210> 53

<211> 51

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 53

tggctcgaca gcacctaccc taccaacgcc gacccgacca ctcccggtgt c 51

<210> 54

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 54

ggcgttggta gggtaggtgc tgtcgagcca 30

<210> 55

<211> 57

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 55

atgctctggc tcgacagcac ctaccctacc gacgccgacc cgaccactcc cggtgtc 57

<210> 56

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 56

ggtagggtag gtgctgtcga gccagagcat 30

<210> 57

<211> 48

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 57

tggctcgaca gcacctaccc taccaacgcc gactcgacca ctcccggt 48

<210> 58

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 58

ggcgttggta gggtaggtgc tgtcgagcca 30

<210> 59

<211> 48

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 59

ctcgacagca cctaccctac caacgcctcc cccaccactc ccggtgtc 48

<210> 60

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 60

ggaggcgttg gtagggtagg tgctgtcgag 30

<210> 61

<211> 48

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 61

ggtacttgcg atatctcctc tggcgaccca gccaccgtcg agtctacc 48

<210> 62

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 62

tgggtcgcca gaggagatat cgcaagtacc 30

<210> 63

<211> 48

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 63

aacgcctacg tcatctactc gaacatcaag gtcggtcctc tcaactcg 48

<210> 64

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 64

cttgatgttc gagtagatga cgtaggcgtt 30

<210> 65

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 65

gctatttttc taacaaagca tcttagatta 30

<210> 66

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 66

gctgatcccc tcgttttcgg aaacgctttg 30

<210> 67

<211> 33

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 67

acgtctgtcc aggcccagca ggtcggcact ttg 33

<210> 68

<211> 38

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 68

tcgccacgga gcttaattaa ctacaggcac tgggagta 38

<210> 69

<211> 90

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 69

cgcggactgc gcaccatgaa gggatcaatc tcctatcaaa tctacaaagg tgccctgctc 60

ctctcggccc ttttgacgtc tgtccaggcc 90

<210> 70

<211> 90

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 70

ggcctggaca gacgtcaaaa gggccgagag gagcagggca cctttgtaga tttgatagga 60

gattgatccc ttcatggtgc gcagtccgcg 90

<210> 71

<211> 30

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 71

gtgcgcagca ccggtggtgc tcgagccagt 30

<210> 72

<211> 48

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 72

actggctcga gcaccaccgg tgctgcgcac tgggcccagt gtggtgga 48

<210> 73

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 73

atatacacaa ctggatttac atgaagggat caatctccta 40

<210> 74

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 74

gtgtcagtca cctctagtta ctacaggcac tgggagtaat 40

<210> 75

<211> 1650

<212> DNA

<213> Penicillium vasconiae

<220>

<221> CDS

<222> (1)..(1647)

<220>

<221> 信号肽

<222> (1)..(75)

<220>

<221> 成熟肽

<222> (76)..(1647)

<400> 75

atg aag gga tca atc tcc tat caa atc tac aaa ggt gcc ctg ctc ctc 48

Met Lys Gly Ser Ile Ser Tyr Gln Ile Tyr Lys Gly Ala Leu Leu Leu

-25 -20 -15 -10

tcg gcc ctt ttg acg tct gtc cag gcc cag cag gtc ggc act ttg acg 96

Ser Ala Leu Leu Thr Ser Val Gln Ala Gln Gln Val Gly Thr Leu Thr

-5 -1 1 5

act gag acc cat cca tcg ttg acc tgg tcc cag tgt acc gcc ggc ggt 144

Thr Glu Thr His Pro Ser Leu Thr Trp Ser Gln Cys Thr Ala Gly Gly

10 15 20

agc tgc tct acc gtg acc ggc agt gtg gtt atc gat tct aac tgg cgc 192

Ser Cys Ser Thr Val Thr Gly Ser Val Val Ile Asp Ser Asn Trp Arg

25 30 35

tgg gtt cac tcc acc agt ggc tcg acc aac tgc tat acc ggc aac acc 240

Trp Val His Ser Thr Ser Gly Ser Thr Asn Cys Tyr Thr Gly Asn Thr

40 45 50 55

tgg gac gcc acc ctc tgc cct gac gat gtg acc tgc gca gcc aac tgt 288

Trp Asp Ala Thr Leu Cys Pro Asp Asp Val Thr Cys Ala Ala Asn Cys

60 65 70

gct ctg gat ggc gct agc tac tcg agc acc tac ggt gtt acc acc agc 336

Ala Leu Asp Gly Ala Ser Tyr Ser Ser Thr Tyr Gly Val Thr Thr Ser

75 80 85

ggc aat tcc ctg cgt ctg aac ttt gtc act acg gct tcg cag aag aac 384

Gly Asn Ser Leu Arg Leu Asn Phe Val Thr Thr Ala Ser Gln Lys Asn

90 95 100

atc ggt tcc cgt ctg tac ttg ctg gag aat gac acc acc tac cag aag 432

Ile Gly Ser Arg Leu Tyr Leu Leu Glu Asn Asp Thr Thr Tyr Gln Lys

105 110 115

ttc aac ctg ctg aac cag gag ttc act ttc gat gtg gat gtg tcc aac 480

Phe Asn Leu Leu Asn Gln Glu Phe Thr Phe Asp Val Asp Val Ser Asn

120 125 130 135

ctt ccc tgt ggt ctc aac ggt gcc ctc tac ttt gtg gac atg gac gca 528

Leu Pro Cys Gly Leu Asn Gly Ala Leu Tyr Phe Val Asp Met Asp Ala

140 145 150

gat ggt ggc atg gcc aaa tac tcc acc aac aag gcc gga gcc aag tat 576

Asp Gly Gly Met Ala Lys Tyr Ser Thr Asn Lys Ala Gly Ala Lys Tyr

155 160 165

gga act ggt tac tgc gac agt caa tgc ccg cgg gat ctc aag ttc atc 624

Gly Thr Gly Tyr Cys Asp Ser Gln Cys Pro Arg Asp Leu Lys Phe Ile

170 175 180

gat ggc cag gcc aac gtg gaa ggc tgg acc ccc tcc acc aat gat gtc 672

Asp Gly Gln Ala Asn Val Glu Gly Trp Thr Pro Ser Thr Asn Asp Val

185 190 195

aac tcc ggc att ggc aat cac ggc tcc tgc tgt gcg gag atg gat atc 720

Asn Ser Gly Ile Gly Asn His Gly Ser Cys Cys Ala Glu Met Asp Ile

200 205 210 215

tgg gag gcc aac tcg atc tcc aat gcc gtc act cct cat cct tgc gac 768

Trp Glu Ala Asn Ser Ile Ser Asn Ala Val Thr Pro His Pro Cys Asp

220 225 230

acc ccc tcg caa acc atg tgc act gaa gat gcc tgc ggt gga acc tac 816

Thr Pro Ser Gln Thr Met Cys Thr Glu Asp Ala Cys Gly Gly Thr Tyr

235 240 245

agc act tcg cgc tat gcc ggt act tgc gat ccc gat ggc tgt gat ttc 864

Ser Thr Ser Arg Tyr Ala Gly Thr Cys Asp Pro Asp Gly Cys Asp Phe

250 255 260

aac ccc tac cgt atg ggc gac act tct ttc ttc ggt cct ggc ttg acc 912

Asn Pro Tyr Arg Met Gly Asp Thr Ser Phe Phe Gly Pro Gly Leu Thr

265 270 275

gtt gac acc aag tct ccc ttc acc gtg gtg acc caa ttc atc acc aac 960

Val Asp Thr Lys Ser Pro Phe Thr Val Val Thr Gln Phe Ile Thr Asn

280 285 290 295

gat ggc acc tct tca ggc acc ctg tca gag atc aag cgc ttc tac gtc 1008

Asp Gly Thr Ser Ser Gly Thr Leu Ser Glu Ile Lys Arg Phe Tyr Val

300 305 310

cag aac ggc aag gtc atc ggt cag ccc cag tct acc atc act ggc gtc 1056

Gln Asn Gly Lys Val Ile Gly Gln Pro Gln Ser Thr Ile Thr Gly Val

315 320 325

acc ggt aac tcg atc acc gat acc ttc tgc aat gcg caa aag acc gca 1104

Thr Gly Asn Ser Ile Thr Asp Thr Phe Cys Asn Ala Gln Lys Thr Ala

330 335 340

ttc ggc gac acc aat gac ttc acc aag cac ggt ggc atg gca ggc atg 1152

Phe Gly Asp Thr Asn Asp Phe Thr Lys His Gly Gly Met Ala Gly Met

345 350 355

ggt gcc ggt ctc gct gat ggt atg gtt ctg gtc atg agt ctc tgg gat 1200

Gly Ala Gly Leu Ala Asp Gly Met Val Leu Val Met Ser Leu Trp Asp

360 365 370 375

gac cat gcg gcc gat atg ctc tgg ctc gac agc acc tac cct acc aac 1248

Asp His Ala Ala Asp Met Leu Trp Leu Asp Ser Thr Tyr Pro Thr Asn

380 385 390

gcc tcc tcg acc act ccc ggt gtc aag cgc ggt act tgc gat atc tcc 1296

Ala Ser Ser Thr Thr Pro Gly Val Lys Arg Gly Thr Cys Asp Ile Ser

395 400 405

tct ggc gac cca acc acc gtc gag tct acc tac ccc aac gcc tac gtc 1344

Ser Gly Asp Pro Thr Thr Val Glu Ser Thr Tyr Pro Asn Ala Tyr Val

410 415 420

atc tac tcg aac atc aag act ggt cct ctc aac tcg acc ttt acc ggc 1392

Ile Tyr Ser Asn Ile Lys Thr Gly Pro Leu Asn Ser Thr Phe Thr Gly

425 430 435

acc acc tcc ggc acc acc agc tct tct acc act acc act agc act act 1440

Thr Thr Ser Gly Thr Thr Ser Ser Ser Thr Thr Thr Thr Ser Thr Thr

440 445 450 455

act act agc aag acc agc tct acc act acc act act act agc aag acc 1488

Thr Thr Ser Lys Thr Ser Ser Thr Thr Thr Thr Thr Thr Ser Lys Thr

460 465 470

agc tct acc agc tcc acc tcg act acc acc tct act ggc tcg agc acc 1536

Ser Ser Thr Ser Ser Thr Ser Thr Thr Thr Ser Thr Gly Ser Ser Thr

475 480 485

acc ggt gct gcg cac tat gcc cag tgt ggt gga att ggc tgg act ggc 1584

Thr Gly Ala Ala His Tyr Ala Gln Cys Gly Gly Ile Gly Trp Thr Gly

490 495 500

gcc acc acc tgt gtc agc ccg tac act tgc acc aag cag aat gac tat 1632

Ala Thr Thr Cys Val Ser Pro Tyr Thr Cys Thr Lys Gln Asn Asp Tyr

505 510 515

tac tcc cag tgc ctg tag 1650

Tyr Ser Gln Cys Leu

520

<210> 76

<211> 549

<212> PRT

<213> Penicillium vasconiae

<400> 76

Met Lys Gly Ser Ile Ser Tyr Gln Ile Tyr Lys Gly Ala Leu Leu Leu

-25 -20 -15 -10

Ser Ala Leu Leu Thr Ser Val Gln Ala Gln Gln Val Gly Thr Leu Thr

-5 -1 1 5

Thr Glu Thr His Pro Ser Leu Thr Trp Ser Gln Cys Thr Ala Gly Gly

10 15 20

Ser Cys Ser Thr Val Thr Gly Ser Val Val Ile Asp Ser Asn Trp Arg

25 30 35

Trp Val His Ser Thr Ser Gly Ser Thr Asn Cys Tyr Thr Gly Asn Thr

40 45 50 55

Trp Asp Ala Thr Leu Cys Pro Asp Asp Val Thr Cys Ala Ala Asn Cys

60 65 70

Ala Leu Asp Gly Ala Ser Tyr Ser Ser Thr Tyr Gly Val Thr Thr Ser

75 80 85

Gly Asn Ser Leu Arg Leu Asn Phe Val Thr Thr Ala Ser Gln Lys Asn

90 95 100

Ile Gly Ser Arg Leu Tyr Leu Leu Glu Asn Asp Thr Thr Tyr Gln Lys

105 110 115

Phe Asn Leu Leu Asn Gln Glu Phe Thr Phe Asp Val Asp Val Ser Asn

120 125 130 135

Leu Pro Cys Gly Leu Asn Gly Ala Leu Tyr Phe Val Asp Met Asp Ala

140 145 150

Asp Gly Gly Met Ala Lys Tyr Ser Thr Asn Lys Ala Gly Ala Lys Tyr

155 160 165

Gly Thr Gly Tyr Cys Asp Ser Gln Cys Pro Arg Asp Leu Lys Phe Ile

170 175 180

Asp Gly Gln Ala Asn Val Glu Gly Trp Thr Pro Ser Thr Asn Asp Val

185 190 195

Asn Ser Gly Ile Gly Asn His Gly Ser Cys Cys Ala Glu Met Asp Ile

200 205 210 215

Trp Glu Ala Asn Ser Ile Ser Asn Ala Val Thr Pro His Pro Cys Asp

220 225 230

Thr Pro Ser Gln Thr Met Cys Thr Glu Asp Ala Cys Gly Gly Thr Tyr

235 240 245

Ser Thr Ser Arg Tyr Ala Gly Thr Cys Asp Pro Asp Gly Cys Asp Phe

250 255 260

Asn Pro Tyr Arg Met Gly Asp Thr Ser Phe Phe Gly Pro Gly Leu Thr

265 270 275

Val Asp Thr Lys Ser Pro Phe Thr Val Val Thr Gln Phe Ile Thr Asn

280 285 290 295

Asp Gly Thr Ser Ser Gly Thr Leu Ser Glu Ile Lys Arg Phe Tyr Val

300 305 310

Gln Asn Gly Lys Val Ile Gly Gln Pro Gln Ser Thr Ile Thr Gly Val

315 320 325

Thr Gly Asn Ser Ile Thr Asp Thr Phe Cys Asn Ala Gln Lys Thr Ala

330 335 340

Phe Gly Asp Thr Asn Asp Phe Thr Lys His Gly Gly Met Ala Gly Met

345 350 355

Gly Ala Gly Leu Ala Asp Gly Met Val Leu Val Met Ser Leu Trp Asp

360 365 370 375

Asp His Ala Ala Asp Met Leu Trp Leu Asp Ser Thr Tyr Pro Thr Asn

380 385 390

Ala Ser Ser Thr Thr Pro Gly Val Lys Arg Gly Thr Cys Asp Ile Ser

395 400 405

Ser Gly Asp Pro Thr Thr Val Glu Ser Thr Tyr Pro Asn Ala Tyr Val

410 415 420

Ile Tyr Ser Asn Ile Lys Thr Gly Pro Leu Asn Ser Thr Phe Thr Gly

425 430 435

Thr Thr Ser Gly Thr Thr Ser Ser Ser Thr Thr Thr Thr Ser Thr Thr

440 445 450 455

Thr Thr Ser Lys Thr Ser Ser Thr Thr Thr Thr Thr Thr Ser Lys Thr

460 465 470

Ser Ser Thr Ser Ser Thr Ser Thr Thr Thr Ser Thr Gly Ser Ser Thr

475 480 485

Thr Gly Ala Ala His Tyr Ala Gln Cys Gly Gly Ile Gly Trp Thr Gly

490 495 500

Ala Thr Thr Cys Val Ser Pro Tyr Thr Cys Thr Lys Gln Asn Asp Tyr

505 510 515

Tyr Ser Gln Cys Leu

520

<210> 77

<211> 49

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 77

acacaactgg ggatccacca tgaagggatc aatctcctat caaatctac 49

<210> 78

<211> 41

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 78

ccctctagat ctcgagcacc acttttctcc caaatttgaa g 41

<210> 79

<211> 57

<212> DNA

<213> 人工序列

<220>

<223> 合成构建体

<400> 79

atgcttttgc aagccttcct tttccttttg gctggttttg cagccaagat ctctgca 57

Claims

1.一种纤维二糖水解酶变体，该变体在对应于SEQ ID NO:1的位置8、17、113、157、159、184、199、240、250、274、318、325、328、347、349、358、360、380、391、393、394、412、以及430相对应的一个或多个位置处包括取代，其中该变体具有纤维二糖水解酶活性并且其中该变体与亲本纤维二糖水解酶具有至少60％，例如至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％，至少97％、至少98％、或至少99％、但小于100％的序列同一性。

2.如权利要求1所述的纤维二糖水解酶变体，其中该亲本纤维二糖水解酶与SEQ IDNO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、或SEQ ID NO:6具有至少60％，例如至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％的序列同一性。

3.如权利要求1所述的纤维二糖水解酶变体，其中该亲本纤维二糖水解酶是SEQ IDNO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、或SEQ ID NO:6的片段，其中该片段具有纤维二糖水解酶活性。

4.如权利要求1-3中任一项所述的纤维二糖水解酶变体，该变体与SEQ ID NO:1、SEQID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、或SEQ ID NO:6的多肽具有至少60％，例如，至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或至少99％的序列同一性，但小于100％的序列同一性。

5.一种纤维二糖水解酶变体，该变体包含变体催化结构域，其中该变体催化结构域包含在与SEQ ID NO:1的位置8、17、113、157、159、184、199、240、250、274、318、325、328、347、349、358、360、380、391、393、394、412、以及430相对应的一个或多个位置处的取代，并且该变体催化结构域与亲本纤维二糖水解酶的催化结构域具有至少60％，例如，至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、或至少99％但小于100％的序列同一性。

6.如权利要求5所述的纤维二糖水解酶变体，其中该亲本纤维二糖水解酶的催化结构域与SEQ ID NO:1、SEQ ID NO:2、SEQ ID NO:3、SEQ ID NO:4、SEQ ID NO:5、或SEQ ID NO:6的催化结构域具有至少60％，例如，至少65％、至少70％、至少75％、至少80％、至少81％、至少82％、至少83％、至少84％、至少85％、至少86％、至少87％、至少88％、至少89％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％的序列同一性。

7.如权利要求5或6所述的纤维二糖水解酶变体，该变体进一步包含碳水化合物结合模块(例如，外源的碳水化合物结合模块)。

8.如权利要求1-7中任一项所述的纤维二糖水解酶变体，该变体包含选自下组的一个或多个取代，该组由以下组成：T8A,P；S17Q；N113D；K157R；S159P；D184N；V199P；E240G；S250D；F274Y；G318A,P,S；T325P；T328P；T347P；D349V；G358A；G360S,T；D380N；N391D；S393D；S394P；T412A；以及T430V。

9.如权利要求1-8中任一项所述的纤维二糖水解酶变体，该变体进一步包含在与SEQID NO:1的位置4、21、26、38、39、44、45、46、51、52、53、54、72、75、87、93、94、95、100、102、108、111、114、129、130、131、137、138、139、144、150、156、157、183、184、187、194、195、196、197、198、199、200、201、205、206、209、211、219、237、241、247、253、260、264、271、280、320、322、330、332、343、345、350、357、358、360、365、371、375、379、380、381、382、385、386、389、390、392、397、400、405、407、413、426、427、430、440、444、445、446、447、450、453、455、456、458、459、462、463、464、492、493、494、496、497、498、502、503、507、510、513、515、516、以及517相对应的一个或多个位置处的改变，例如，G4C、A21P、S26A、W38A、R39L、T44I、T44M、T44N、T44K、S45D、S45N、G46A、G46I、G46L、G46T、Y51I、T52R、T52W、G53A、G53M、G53R、G53W、N54S、N54I、N54D、A72C、G75S、S87T、L93V、N94S、N94A、N94R、N94Q、F95L、F95Y、S100T、S100V、S100W、S100L、S100G、K102S、K102R、L108I、L111T、D114E、F129S、D130N、D130E、V131A、P137S、C138S、G139E、G139M、G139Q、G139S、G139R、L144A、L144V、D150N、A156G、K157R、I183N、D184S、A187L、P194^*、P194Q、S195^*、T196^*、N197A、N197^*、D198A、D198^*、V199^*、N200A、N200G、N200W、N200F、N200C、N200^*、S201^*、N205R、H206Y、C209S、A211T、N219S、M237T、D241L、D241R、D241V、Y247C、A253D、A253R、G260D、N264Y、T271I、V280I、P320A、S322V、N330D、I332F、A343V、G345D、F350L、A357S、G358R、G360M、D365S、M371V、D375A、D375G、A379T、D380H、D380Y、M381V、L382A、D385E、S386C、S386E、P389L、P389Q、P389I、T390A、T390S、T390A、A392G、A392I、A392L、P397A、P397G、P397K、P397W、P397C、P397L、K400A、D405P、S407G、T413P、S426F、N427D、T430Y、T440L、T440R、T440G、T444S、T445D、S446T、S447L、T450D、S453D、T455A、T456S、S458E、K459E、K459S、S462I、T463I、T464A、T464A、H492L、Y493S、Y493W、A494D、A494S、C496S、C496Y、G497C、G498D、G498S、T502N、G503D、C507Y、P510V、P510S、C513R、C513W、K515D、Q516P、以及N517D。

10.如权利要求1-9中任一项所述的纤维二糖水解酶变体，该变体相对于该亲本具有增加的热活性或增加的热稳定性。

11.一种酶组合物、全培养液配制品或细胞培养组合物，该酶组合物、全培养液配制品或细胞培养组合物包含如权利要求1-10中任一项所述的纤维二糖水解酶变体。

12.一种分离的多核苷酸，该分离的多核苷酸编码如权利要求1-10中任一项所述的纤维二糖水解酶变体，该多核苷酸与一种或多种控制序列可操作地连接，这些控制序列指导多肽在表达宿主中产生。

13.一种重组宿主细胞，该重组宿主细胞包含如权利要求12所述的多核苷酸。

14.一种产生纤维二糖水解酶变体的方法，该方法包括：

(a)在适合于表达该变体的条件下培养如权利要求13所述的重组宿主细胞；以及任选地

(b)回收该变体。

15.一种用如权利要求12所述的多核苷酸转化的转基因植物、植物部分或植物细胞。

16.一种产生纤维二糖水解酶变体的方法，该方法包括：

(a)在有益于产生该变体的条件下，培养如权利要求15所述的转基因植物、植物部分或植物细胞；以及任选地

(b)回收该变体。

17.一种用于获得纤维二糖水解酶变体的方法，该方法包括：在与SEQ ID NO:1的多肽的位置8、17、113、157、159、184、199、240、250、274、318、325、328、347、349、358、360、380、391、393、394、412、以及430相对应的一个或多个位置处将取代引入亲本纤维二糖水解酶，其中该纤维二糖水解酶变体具有纤维二糖水解酶活性；并且回收该变体。

18.一种降解纤维素材料的方法，该方法包括：用包含如权利要求1-10中任一项所述的纤维二糖水解酶变体的酶组合物处理纤维素材料。

19.一种用于产生发酵产物的方法，该方法包括：

(a)用包含如权利要求1-10中任一项所述的纤维二糖水解酶变体的酶组合物糖化纤维素材料；

(c)从该发酵中回收该发酵产物。

20.一种发酵纤维素材料的方法，该方法包括：用一种或多种发酵微生物发酵该纤维素材料，其中用包含如权利要求1-10中任一项所述的纤维二糖水解酶变体的酶组合物对该纤维素材料进行糖化。