CN104640874A

CN104640874A - 具有纤维素分解增强活性的多肽以及对其进行编码的多核苷酸

Info

Publication number: CN104640874A
Application number: CN201380048486.XA
Authority: CN
Inventors: N·斯博思伯吉格
Original assignee: Novo Nordisk AS
Current assignee: Novo Nordisk AS
Priority date: 2012-09-19
Filing date: 2013-09-18
Publication date: 2015-05-20
Also published as: BR112015005985A2; US20150247137A1; EP2897973A1; WO2014044708A1

Abstract

本发明涉及具有纤维素分解增强活性的分离多肽。本发明还涉及核酸构建体、载体以及包括这些多核苷酸的宿主细胞连同产生和使用这些多肽的方法。

Description

具有纤维素分解增强活性的多肽以及对其进行编码的多核苷酸

对序列表的引用

本申请包括一个计算机可读形式的序列表，将其通过引用结合在此。

发明背景

发明领域

本发明涉及具有纤维素分解增强活性的多肽和编码这些多肽的多核苷酸。本发明还涉及核酸构建体、载体以及包括这些多核苷酸的宿主细胞连同产生和使用这些多肽的方法。

相关技术说明

纤维素是单糖葡萄糖通过β-1,4-键共价连接的一种聚合物。许多微生物产生水解β-连接的葡聚糖的酶。这些酶包括内切葡聚糖酶、纤维二糖水解酶、以及β-葡糖苷酶。内切葡聚糖酶在任意位置消化纤维素聚合物，使其打开而被纤维二糖水解酶攻击。纤维二糖水解酶从纤维素聚合物的末端顺序释放纤维二糖分子。纤维二糖是葡萄糖的一种水溶性β-1,4-连接二聚体。β-葡糖苷酶将纤维二糖水解成葡萄糖。

文献中已经描述了另一个类型的酶，即具有纤维分解增强活性的GH61多肽。这些多肽与水解β-连接的葡聚糖的酶一起起作用，结果是，组合的活性结果是纤维素材料的显著更高的转化。

尽管纤维素存在于所有植物中，在修饰和/或降解纤维素上仍存在相当大的意义，并且归因于不同植物材料的结构和组成，也需要用于修饰和/或降解纤维素材料的酶之间存在相当大的多样性。

WO 2005/074647、WO 2008/148131、以及WO 2011/035027披露了来自土生梭孢壳霉(Thielavia terrestris)的具有纤维素分解增强活性的分离的GH61多肽及其多核苷酸。WO 2005/074656和WO2010/065830披露了来自金黄色嗜热子囊菌(Thermoascus aurantiacus)的具有纤维素分解增强活性的分离的GH61多肽及其多核苷酸。WO2007/089290披露了来自里氏木霉的具有纤维素分解增强活性的分离的GH61多肽及其多核苷酸。WO 2009/085935、WO 2009/085859、WO2009/085864、以及WO 2009/085868披露了来自嗜热毁丝霉(Myceliophthora thermophila)的具有纤维素分解增强活性的分离的GH61多肽及其多核苷酸。WO 2010/138754披露了来自烟曲霉(Aspergillus fumigatus)的具有纤维素分解增强活性的分离的GH61多肽及其多核苷酸。WO 2011/005867披露了来自嗜松青霉(Penicilliumpinophilum)的具有纤维素分解增强活性的分离的GH61多肽及其多核苷酸。WO 2011/039319披露了来自嗜热子囊菌属(Thermoascus sp)的具有纤维素分解增强活性的分离的GH61多肽及其多核苷酸。WO2011/041397披露了来自青霉属的具有纤维素分解增强活性的分离的GH61多肽及其多核苷酸。WO 2011/041504披露了来自甲壳嗜热子囊菌的具有纤维素分解增强活性的分离的GH61多肽及其多核苷酸。WO2008/151043披露了通过向包含具有纤维素分解增强活性的GH61多肽的组合物中添加可溶性活化二价金属阳离子来增加该多肽的活性的方法。

本领域需要新的酶以增加效率并且为修饰和/或降解纤维素材料提供成本有效的酶溶液。

本发明提供了具有纤维素分解增强活性的GH61多肽和编码这些多肽的多核苷酸。

发明概述

本发明涉及具有纤维素分解增强活性的分离的多肽，这些多肽选自下组，该组由以下各项组成：

(a)一种多肽，该多肽与SEQ ID NO:2的成熟多肽具有至少70％的序列一致性；与SEQ ID NO:4的成熟多肽具有至少85％的序列一致性；与SEQ ID NO:6的成熟多肽具有至少80％的序列一致性或与SEQID NO:8的成熟多肽具有至少75％的序列一致性；

(b)一种多肽，该多肽由在中严谨度条件下与(i)SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5或SEQ ID NO:7的成熟多肽编码序列、(ii)其cDNA序列、或(iii)(i)或(ii)的全长互补体杂交的一种多核苷酸编码；

(c)一种多肽，该多肽由以下的一种多核苷酸编码，该多核苷酸与SEQ ID NO:1的成熟多肽编码序列或其cDNA序列具有至少70％的序列一致性；与SEQ ID NO:3的成熟多肽编码序列具有至少85％的序列一致性；与SEQ ID NO:5的成熟编码序列具有至少80％的序列一致性；或与SEQ ID NO:7的成熟多肽编码序列具有至少75％的序列一致性；

(d)SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6或SEQ ID NO:8的成熟多肽的一种变体，该变体在一个或多个(例如，若干个)位置处包括取代、缺失、和/或插入；以及

(e)(a)、(b)、(c)或(d)的多肽的一个片段，该片段具有纤维素分解增强活性。

本发明还涉及编码本发明多肽的分离的多核苷酸；核酸构建体；重组表达载体；包括这些多核苷酸的重组宿主细胞；以及产生这些多肽的方法。

本发明还涉及降解纤维素材料的方法，例如在纤维素材料的糖化中。

本发明还涉及编码一种信号肽的一种多核苷酸，该信号肽包括SEQ ID NO:2的氨基酸1至19、SEQ ID NO:4的氨基酸1至23、SEQID NO:6的氨基酸1至19、或SEQ ID NO:8的氨基酸1至18或由其组成，所述多核苷酸的每一种与编码蛋白质的基因可操作地连接；包括这些多核苷酸的核酸构建体、表达载体、以及重组宿主细胞；以及产生一种蛋白质的方法。

本发明还涉及一种包括本发明多肽的组合物以及其用于降解纤维素的用途。

定义

纤维素分解活性：术语“纤维素分解活性”意指水解一种纤维素材料的生物活性。用于测量纤维素分解活性的两种基本方法包括：(1)测量总纤维素分解活性，和(2)测量单独的纤维素分解活性(内切葡聚糖酶、纤维二糖水解酶以及β-葡糖苷酶)，如在张(Zhang)等人，纤维素酶改进的展望：筛选和选择策略(Outlook for cellulaseimprovement:Screening and selection strategies)，2006，生物技术进展(Biotechnology Advances)24:452-481中所综述的。通常使用不溶性底物，包括沃特曼(Whatman)№1滤纸、微晶纤维素、细菌纤维素、藻类纤维素、棉花、预处理的木质纤维素等，测量总纤维素分解活性。最常用的总纤维素分解活性测定是使用沃特曼№1滤纸作为底物的滤纸测定。该测定是由国际纯粹与应用化学联合会(IUPAC)(高斯(Ghose)，1987，纤维素酶活性的测量(Measurement of cellulaseactivities)，纯粹与应用化学(Pure Appl.Chem.)59:257-68)确立的。

出于本发明的目的，通过测量在以下条件下由一种或多种纤维素分解酶进行的纤维素材料水解的增加来测定纤维素分解活性：1-20mg的纤维素分解蛋白/g于PCS中的纤维素，在50℃-65℃下持续3-7天，与未添加纤维素分解蛋白的对照水解相比较。典型条件为：1ml反应，洗涤或未洗涤的PCS，5％不溶性固形物，50mM乙酸钠(pH 5)，1mMMnSO₄，50℃-65℃，72小时，通过HPX-87H柱(伯乐实验室有限公司(Bio-Rad Laboratories,Inc.)，赫拉克勒斯，加州，美国)进行的糖分析。

内切葡聚糖酶：术语“葡聚糖内切酶”是指内切-1,4-(1,3；1,4)-β-D-葡聚糖4-葡聚糖水解酶(E.C.3.2.1.4)，它催化纤维素、纤维素衍生物(例如羧甲基纤维素和羟乙基纤维素)、地衣多糖中的1,4-β-D-糖苷键，混合的β-1,3葡聚糖(例如谷物β-D-葡聚糖或木葡聚糖)中的β-1,4键，以及含有纤维素组分的其他植物材料的内切水解。可以通过测量底物粘度的降低或通过还原糖测定所确定的还原性末端的增加来确定内切葡聚糖酶活性(张(Zhang)等人，2006，生物技术进展(BiotechnologyAdvances)24:452-481)。出于本发明的目的，根据高斯(Ghose)，1987，纯粹与应用化学(Pure and Appl.Chem.)59:257-268的程序，在pH 5、40℃下，使用羧甲基纤维素(CMC)作为底物，确定内切葡聚糖酶活性。

纤维二糖水解酶：术语“纤维二糖水解酶”是指一种1,4-β-D-葡聚糖纤维二糖水解酶(E.C.3.2.1.91)，其催化纤维素、纤维寡糖、或任何含β-1,4-连接的葡萄糖的聚合物中的1,4-β-D-糖苷键水解，从该链的还原端或非还原端释放纤维二糖(泰里(Teeri)，1997，晶态纤维素降解：纤维二糖水解酶功能的新见解(Crystalline cellulose degradation:Newinsight into the function of cellobiohydrolases)，生物技术趋势(Trends inBiotechnology)15:160-167；泰里(Teeri)等人，1998，里氏木霉纤维二糖水解酶：为何对晶态纤维素如此有效？(Trichoderma reeseicellobiohydrolases:why so efficient on crystalline cellulose？)，生物化学学会学报(Biochem.Soc.Trans.)26:173-178。出于本发明的目的，根据范·帝伯赫(van Tilbeurgh)等人，1982，欧洲生化学会联合会快报(FEBSLetters)，149:152-156以及范·帝伯赫和克莱森斯(Claeyssens)，1985，欧洲生化学会联合会快报，187:283-288所述的程序，使用一种荧光二糖衍生物4-甲基伞形酮基-β-D-乳糖在pH 5、40℃下确定纤维二糖水解酶活性。

β-葡糖苷酶：术语“β-葡糖苷酶”意指一种β-D-葡糖苷葡糖水解酶(E.C.3.2.1.21)，其催化末端非还原性β-D-葡萄糖残基的水解，并释放β-D-葡萄糖。出于本发明的目的，根据文丘里(Venturi)等人，2002，来自嗜热毛壳菌嗜粪变种的胞外β-D-葡糖苷酶：产生、纯化以及一些生物化学特性(Extracellular beta-D-glucosidase from Chaetomiumthermophilum var.coprophilum:production,purification and somebiochemical properties)，基础微生物学杂志(J.Basic Microbiol.)42:55-66描述的基本程序确定β-葡糖苷酶活性。一个单位的β-葡糖苷酶定义为在40℃、pH 5下，在含有0.01％20的100mM柠檬酸钠中从作为底物的1mM对硝基苯基-β-D-吡喃葡萄糖苷每分钟产生1.0微摩尔的对硝基苯酚。

纤维素分解增强活性：术语“纤维素分解增强活性”意指由一种GH61多肽催化的生物活性，该GH61多肽增强具有纤维素分解活性的酶对纤维素材料的水解。出于本发明的目的，通过在以下条件下测量来自由纤维素分解酶水解纤维素材料的还原糖的增加或纤维二糖与葡萄糖总量的增加来测定纤维素分解增强活性：1-50mg总蛋白/g于PCS中的纤维素，其中总蛋白由50％-99.5％w/w纤维素分解蛋白和0.5％-50％w/w具有纤维素分解增强活性的GH61多肽的蛋白构成，在50℃-65℃持续1-7天，与不具有纤维素分解增强活性的相等总蛋白装载的对照水解(1-50mg纤维素分解蛋白/g于PCS中的纤维素)相比较。在一个优选方面中，使用在总蛋白质重量的3％的米曲霉β-葡糖苷酶(根据WO 02/095014在米曲霉中重组产生)或总蛋白质重量的3％的烟曲霉β-葡糖苷酶(如WO 2002/095014中所描述在米曲霉中重组产生)的纤维素酶蛋白负载量存在的情况下1.5L(诺维信公司(Novozymes A/S)，丹麦巴格斯瓦尔德(Bagsvaerd,Denmark))的混合物作为纤维素分解活性的来源。

具有纤维素分解增强活性的GH61多肽通过将达到相同的水解程度所需要的纤维素分解酶的量降低优选至少1.01倍、更优选至少1.05倍、更优选至少1.10倍、更优选至少1.25倍、更优选至少1.5倍、更优选至少2倍、更优选至少3倍、更优选至少4倍、更优选至少5倍、甚至更优选至少10倍、以及最优选至少20倍，来增强由具有纤维素分解活性的酶催化的纤维素材料的水解。

家族61糖苷水解酶：术语“家族61糖苷水解酶”或“家族GH61”或“GH61”意指根据亨利萨特(Henrissat)B.，1991，基于氨基酸序列相似性的糖基水解酶的分类(A classification of glycosyl hydrolasesbased on amino-acid sequence similarities)，生物化学杂志(Biochem.J.)280:309-316；和亨利萨特B.和贝洛赫(Bairoch)A.，1996，修正糖基水解酶的基于序列的分类(Updating the sequence-based classification ofglycosyl hydrolases)，生物化学杂志316:695-696属于糖苷水解酶家族61的多肽。

勒瓦瑟(Levasseur)等人，2013，生物燃料的生物科技(Biotechnology for Biofuels)20136:41最近提出了将家族GH61重归类为AA9(辅助活性)。在本说明书和权利要求中，保持了GH61术语，然而，本领域的普通技术人员将理解，本发明不以任何方式受所使用术语的限制，并且将进一步理解，在描述了具有定义GH61和AA9多肽的结构特点的酶的文献中可找到GH61和AA9术语两者。

木聚糖降解活性：术语“木聚糖降解活性”或“木聚糖分解活性”意指水解含有木聚糖的材料的生物活性。用于测量木聚糖分解活性的两种基本方法包括：(1)测量总木聚糖分解活性，并且(2)测量单独的木聚糖分解活性(内切木聚糖酶、β-木糖苷酶、阿拉伯呋喃糖苷酶、α-葡糖醛酸糖苷酶、乙酰木聚糖酯酶、阿魏酸酯酶、以及α-葡萄糖醛酸酯酶)。木聚糖分解酶测定的最近进展总结于若干出版物中，这些出版物包括：别雷(Biely)和普乔尔德(Puchard)，木聚糖分解酶测定的最近进展(Recent progress in the assays of xylanolytic enzymes)，2006，食品与农业科学杂志(Journal of the Science of Food and Agriculture)86(11):1636-1647；斯帕尼科瓦(Spanikova)和别雷，2006，葡萄糖醛酸酯酶-由产生的新型碳水化合物酯酶裂褶菌(Schizophyllumcommune)(Glucuronoyl esterase-Novel carbohydrate esterase producedby Schizophyllum commune)，欧洲生化学会联合会快报580(19):4597-4601；赫尔曼(Herrmann)、沃散斯卡(Vrsanska)、尤日奇科娃(Jurickova)、、赫西(Hirsch)、别雷、以及库比切克(Kubicek)，1997，里氏木霉的β-D-木糖苷酶是一种多功能β-D-木聚糖木糖水解酶(Thebeta-D-xylosidase of Trichoderma reesei is a multifunctional beta-D-xylanxylohydrolase)，生物化学杂志321:375-381。

总木聚糖降解活性可以通过测定由不同类型的木聚糖(包括例如燕麦(oat spelt)木聚糖、山毛榉木木聚糖、以及落叶松木木聚糖)形成的还原糖，或通过光度法测定从不同共价染色的木聚糖释放的染色的木聚糖片段来测量。最常见的总木聚糖分解活性测定基于由聚合4-O-甲基葡糖醛酸木聚糖产生的还原糖，如描述于别雷(Bailey)，别雷，坡泰恩(Poutanen)，1992，用于木聚糖酶活性测定的多个实验室测试方法(Interlaboratory testing of methods for assay of xylanaseactivity)，生物技术杂志(Journal of Biotechnology)23(3):257-270中。

出于本发明的目的，木聚糖降解活性通过测量由木聚糖降解酶在以下典型条件下造成的桦木木聚糖(西格玛化学有限公司(SigmaChemical Co.,Inc.)，美国密苏里州圣路易斯(St.Louis,MO,USA))水解的增加来测定：1ml反应、5mg/ml底物(总固体)，5mg木聚糖分解蛋白质/g底物、50mM乙酸钠(pH 5)、50℃、24小时，如里弗(Lever)，1972，用于碳水化合物的比色测定的新反应(A new reaction forcolorimetric determination of carbohydrates)，分析生物化学(Anal.Biochem)47:273-279所述使用对羟基苯甲酸酰肼(PHBAH)测定进行糖分析。

木聚糖酶：术语“木聚糖酶”意指1,4-β-D-木聚糖-木糖水解酶(E.C.3.2.1.8)，其催化木聚糖中的1,4-β-D-木糖苷键的内切水解。为了本发明的目的，使用桦木木聚糖作为底物确定木聚糖酶活性。一个单位的木聚糖酶定义为在50℃、pH 5下的初始期水解中，在含有0.01％20的50mM乙酸钠中从作为底物的2g桦木木聚糖每公升每分钟产生1.0微摩尔还原糖(以如里弗(Lever)，1972，用于碳水化合物的比色测定的新反应(A new reaction for colorimetric determinationof carbohydrates)，分析生物化学(Anal.Biochem)47:273-279所述的葡萄糖当量测量)。

β-木糖苷酶：术语“β-木糖苷酶”意指一种β-D-木糖苷木糖水解酶(E.C.3.2.1.37)，其催化短β(1→4)-木寡糖的外水解，以从非还原性末端去除连续的D-木糖残基。出于本发明的目的，一个单位的β-木糖苷酶定义为在40℃、pH 5下在含有0.01％20的100mM柠檬酸钠中从作为底物的1mM对硝基苯基-β-D-木糖苷每分钟产生1.0微摩尔的对硝基苯酚。

乙酰木聚糖酯酶：术语“乙酰木聚糖酯酶”的意思是一种羧酸酯酶(EC 3.1.1.72)，其催化乙酰基自聚合木聚糖、乙酰化木糖、乙酰化葡萄糖、α-萘基乙酸酯、和对硝基苯基乙酸酯的水解。为了本发明的目的，用0.5mM对硝基苯基乙酸酯作为底物，在含有0.01％TWEEN^TM20的50mM乙酸钠(pH 5.0)中，对乙酰木聚糖酯酶的活性进行测定。一个单位的乙酰木聚糖酯酶被定义为，在pH 5，25℃，每分钟能够释放1μmol对硝基酚根阴离子的酶的量。

阿魏酸酯酶：术语“阿魏酸酯酶”意指4-羟基-3-甲氧基肉桂酰基-糖水解酶(EC 3.1.1.73)，其催化4-羟基-3-甲氧基肉桂酰基(阿魏酰基)基团从酯化的糖(其在“天然”底物中通常为阿拉伯糖)的水解，以产生阿魏酸酯(4-羟基-3-甲氧基肉桂酸酯)。阿魏酸酯酶(Feruloylesterase)也被称为阿魏酸酯酶(ferulic acid esterase)、羟基肉桂酰基酯酶、FAE-III、肉桂酸酯水解酶、FAEA、cinnAE、FAE-I、或FAE-II。出于本发明的目的，在50mM乙酸钠(pH 5.0)中使用0.5mM阿魏酸对硝基苯酯作为底物来测定阿魏酸酯酶活性。一个单位的阿魏酸酯酶等于，在pH 5，25℃，每分钟能够释放1μmol的对硝基酚根阴离子的酶的量。

α-葡糖醛酸糖苷酶：术语“α-葡糖醛酸糖苷酶”是指可催化α-D-葡萄糖苷酸水解成为D-葡萄糖醛酸酯和醇的一种α-D-葡萄糖苷酸葡萄糖醛酸水解酶(EC 3.2.1.139)。出于本发明的目的，根据德弗里斯(deVries)，1998，细菌学杂志(J.Bacteriol.)180:243-249来测定α-葡萄糖醛酸酶活性。一个单位的α-葡糖醛酸糖苷酶等于能够在pH 5、40℃下每分钟释放1微摩尔的葡糖醛酸或4-O-甲基葡糖醛酸的酶的量。

α-L-阿拉伯呋喃糖苷酶：术语“α-L-阿拉伯呋喃糖苷酶”意指一种α-L-阿拉伯呋喃糖苷阿拉伯呋喃水解酶(EC 3.2.1.55)，其催化α-L-阿拉伯糖苷中的末端非还原性α-L-阿拉伯呋喃糖苷残基的水解。该酶对α-L-阿拉伯呋喃糖苷、含有(1,3)-和/或(1,5)-键的α-L-阿拉伯聚糖、阿拉伯糖基木聚糖、以及阿拉伯半乳聚糖起作用。α-L-阿拉伯呋喃糖苷酶还被称为阿拉伯糖苷酶、α-阿拉伯糖苷酶、α-L-阿拉伯糖苷酶、α-阿拉伯呋喃糖苷酶、多糖α-L-阿拉伯呋喃糖苷酶、α-L-阿拉伯呋喃糖苷水解酶、L-阿拉伯糖苷酶、或α-L-阿拉伯聚糖酶。出于本发明的目的，使用每ml的100mM乙酸钠(pH 5)中5mg的中等粘度小麦阿拉伯糖基木聚糖(麦格酶国际爱尔兰股份有限公司(Megazyme International Ireland,Ltd.)，爱尔兰威克洛郡布瑞公司(Bray,Co.Wicklow,Ireland)以总体积200μl在40℃下持续30分钟，接着通过HPX-87H柱色谱(伯乐实验室有限公司(Bio-Rad Laboratories,Inc.)，赫拉克勒斯，加州，美国)进行阿拉伯糖分析来测定α-L-阿拉伯呋喃糖苷酶活性。

纤维素材料：该纤维素材料可以是包括纤维素的任何材料。生物质的初生细胞壁中的主要多糖是纤维素，第二丰富的是半纤维素，而第三丰富的是果胶。细胞停止生长后产生的次生细胞壁也包含多糖，并且它通过与半纤维素共价交联的聚合木质素得到强化。纤维素是脱水纤维二糖的均聚物，因此是一种线性β-(l-4)-D-葡聚糖，而半纤维素包括多种化合物，如具有一系列取代基以复杂支链结构存在的木聚糖、木葡聚糖、阿拉伯糖基木聚糖、以及甘露聚糖。尽管纤维素一般为多态的，但发现其在植物组织中主要以平行葡聚糖链的不溶性晶体基质存在。半纤维素通常氢键合至纤维素以及其他半纤维素，这有助于稳定细胞壁基质。

纤维素通常见于例如植物的茎、叶、壳、皮、以及穗轴，或树的叶、枝、以及木材中。纤维素材料可以是，但不限于：草本材料、农业残余物、林业残余物、城市固体废物、废纸、以及纸浆和造纸厂残余物(参见，例如，维色洛戈尔(Wiselogel)等人，1995，于生物乙醇手册(Handbook on Bioethanol)(查尔斯·E·怀曼(Charles E.Wyman)编辑)，第105-118页，泰勒弗朗西斯出版集团(Taylor&Francis)，华盛顿特区(Washington D.C.)；怀曼(Wyman)，1994，生物资源技术(Bioresource Technology)50:3-16；林德(Lynd)，1990，应用生物化学与生物技术(Applied Biochemistry and Biotechnology)24/25:695-719；莫思尔(Mosier)等人，1999，木质纤维素的生物转化的最近进展(RecentProgress in Bioconversion of Lignocellulosics)，生物化学工程/生物技术的进展(Advances in Biochemical Engineering/Biotechnology)，T·谢伯(T.Scheper)主编，第65卷，第23-40页，纽约斯普林格出版社(Springer-Verlag,New York)。在此应该理解的是，纤维素可以处于木素纤维素，在混合基质中包含木质素、纤维素、和半纤维素的植物细胞壁材料的形式。在一个优选方面中，该纤维素材料是木质纤维素。

在一个方面中，该纤维素材料是草本材料。在另一个方面中，该纤维素材料是农业废弃物。在另一个方面中，该纤维素材料是林业废弃物。在另一个方面中，该纤维素材料是城市固体废物。在另一个方面中，该纤维素材料是废纸。在另一个方面中，该纤维素材料是纸浆和造纸厂废弃物。

在另一个方面中，该纤维素材料是玉米秸秆。在另一个方面中，该纤维素材料是玉米纤维。在另一个方面中，该纤维素材料是玉米芯。在另一个方面中，该纤维素材料是橙皮。在另一个方面中，该纤维素材料是稻秸。在另一个方面中，该纤维素材料是麦秸。在另一个方面中，该纤维素材料是柳枝稷。在另一个方面中，纤维素材料是芒草。在另一个方面中，纤维素材料是甘蔗渣。

在另一个方面中，纤维素材料是微晶纤维素。在另一个方面中，纤维素材料是细菌纤维素。在另一个方面中，纤维素材料是海藻纤维素。在另一个方面中，纤维素材料是棉短绒。在另一个方面，纤维素材料是无定形磷酸处理的纤维素。在另一个方面中，纤维素材料是滤纸。

纤维素材料可以按原样使用或可以使用本领域已知的常规方法进行预处理，如在此所描述。在一个优选方面，纤维素材料进行了预处理。

预处理的玉米秸杆：术语“PCS”或“预处理的玉米秸秆”是指通过用热和稀硫酸处理源自玉米秸秆的纤维素材料。

含有木聚糖的材料：术语“含有木聚糖的材料”意指包含含有β-(1-4)连接的木糖残基主链的植物细胞壁多糖的任何材料。陆生植物的木聚糖是具有β-(1-4)-D-吡喃木糖主链的杂聚物，其通过短的碳水化合物链分支。它们包括D-葡糖醛酸或其4-O-甲基醚、L-阿拉伯糖、和/或不同的低聚糖，这些低聚糖由D-木糖、L-阿拉伯糖、D-或L-半乳糖、以及D-葡萄糖构成。可以将木聚糖类型的多糖分成同源木聚糖(homoxylan)和异源木聚糖(heteroxylan)，包括葡糖醛酸木聚糖、(阿拉伯糖)葡糖醛酸木聚糖、(葡糖醛酸)阿拉伯糖基木聚糖、阿拉伯糖基木聚糖、以及复杂的异源木聚糖。参见，例如，埃伯林格罗瓦(Ebringerova)等人，2005，聚合物科学进展(Adv.Polym.Sci.)186:1–67。

在本发明的方法中，可以使用任何含有木聚糖的材料。在一个优选方面中，含有木聚糖的材料是木质纤维素。

等位基因变体：术语“等位基因变体”意指占据同一染色体基因座的基因的两种或更多种可替代形式中的任一种。等位基因变异由突变天然产生，并且可以导致群体内的多态性。基因突变可以是沉默的(在所编码的多肽中没有改变)或可编码具有改变的氨基酸序列的多肽。多肽的等位基因变体是由基因的等位基因变体编码的多肽。

碳水化合物结合结构域：术语“碳水化合物结合结构域”意思指一种多肽(例如一种酶)的介导该多肽与碳水化合物底物的结合的区域，其中所述底物对该结合结构域具有亲和力。碳水化合物结合结构域典型地发现于一种多肽的N-末端或C-末端末尾。

催化结构域：术语“催化结构域”意思指一种酶的包含该酶的催化机器的区域。

cDNA：术语“cDNA”是指可以通过得自真核或原核细胞的成熟的、剪接的mRNA分子的反转录而制备的DNA分子。cDNA缺乏可以存在于对应基因组DNA中的内含子序列。早先的初始RNA转录本是mRNA的前体，其在呈现为成熟的剪接的mRNA之前要经一系列的步骤进行加工，包括剪接。

编码序列：术语“编码序列”意指直接指定一个多肽的氨基酸序列的多核苷酸。编码序列的边界一般由一个开放阅读框架决定，该开放阅读框架从一个起始密码子(如ATG、GTG或TTG)开始并且以一个终止密码子(如TAA、TAG或TGA)结束。编码序列可以是一种基因组DNA、cDNA、合成DNA或其组合。

控制序列：术语“控制序列”是指表达编码本发明的成熟多肽的多核苷酸所必需的核酸序列。每个控制序列对于编码该多肽的多核苷酸来说可以是天然的(即，来自相同基因)或外源的(即，来自不同基因)，或相对于彼此是天然的或外源的。此类控制序列包括但不限于前导子、聚腺苷酸化序列、前肽序列、启动子、信号肽序列、以及转录终止子。至少，控制序列包括启动子，以及转录和翻译终止信号。出于引入有利于将这些控制序列与编码一种多肽的多核苷酸的编码区连接的特异性限制酶切位点的目的，这些控制序列可以提供有多个接头。

表达：术语“表达”包括涉及多肽产生的任何步骤，包括但不限于，转录、转录后修饰、翻译、翻译后修饰、以及分泌。

表达载体：术语“表达载体”是指包括编码多肽的多核苷酸并且可操作地与提供了其表达的控制序列相连接的线性或环状DNA分子。

片段：术语“片段”意思指具有不存在于成熟多肽或结构域的氨基和/或羧基末端的一个或多个(例如若干个)氨基酸的一种多肽或一个催化或碳水化合物结合结构域；其中该片段具有纤维素水解增强或碳水化合物结合活性。在一个方面中，一个片段包含至少180个氨基酸残基(例如，SEQ ID NO:2的氨基酸20至200)、至少200个氨基酸残基(例如，SEQ ID NO:2的氨基酸20至220)、或至少250个氨基酸残基(例如，SEQ ID NO:2的氨基酸20至270)；至少230个氨基酸残基(例如，SEQ ID NO:4的氨基酸24至250)、至少250个氨基酸残基(例如，SEQ ID NO:4的氨基酸24至274)、或至少275个氨基酸残基(例如，SEQ ID NO:4的氨基酸24至299)；至少200个氨基酸残基(例如，SEQ ID NO:6的氨基酸20至220)或至少210个氨基酸残基(例如，SEQ ID NO:6的氨基酸19至239)；至少200个氨基酸残基(例如，SEQ ID NO:8的氨基酸25至225)；至少250个氨基酸残基(例如，SEQ ID NO:8的氨基酸25至275)或至少275个氨基酸残基(例如，SEQ ID NO:8的氨基酸25至300)。

高严谨度条件：术语“高严谨度条件”意指对于长度为至少100个核苷酸的探针而言，遵循标准DNA印迹程序，在42℃下在5X SSPE、0.3％SDS、200微克/ml剪切并变性的鲑鱼精子DNA和50％甲酰胺中预杂交和杂交12至24小时。载体材料最终使用2X SSC、0.2％SDS，在65℃下洗涤三次，每次15分钟。

宿主细胞：术语“宿主细胞”意指易于用包括本发明的一种多核苷酸的一种核酸构建体或表达载体进行转化、转染、转导等的任何细胞类型。术语“宿主细胞”涵盖由于复制期间发生的突变而与亲本细胞不同的亲本细胞的任何后代。

分离的：术语“分离的”意思指处于自然界中不存在的形式或环境中的一种物质。分离的物质的非限制性实例包括(1)任何非天然发生的物质，(2)包括但不限于任何酶、变体、核酸、蛋白质、肽或辅因子的任何物质，该物质至少部分地从与其本质相关的一种或多种或所有天然发生的成分中去除；(3)相对于天然发现的物质通过人工修饰的任何物质；或(4)通过增加该物质相对于与其本质相关的其他组分的量而修饰的任何物质(例如，编码该物质的基因的多拷贝；使用比编码该物质的基因本质相关的启动子强的启动子)。一种分离的物质可以存在于发酵液样品中。

低严谨度条件：术语“低严谨度条件”意指对于长度为至少100个核苷酸的探针而言，遵循标准DNA印迹程序，在42℃下在5X SSPE、0.3％SDS、200微克/ml剪切并变性的鲑鱼精子DNA和25％甲酰胺中预杂交和杂交12至24小时。载体材料最终使用2X SSC、0.2％SDS，在50℃下洗涤三次，每次15分钟。

成熟多肽：术语“成熟多肽”意指在翻译和任何翻译后修饰如N-末端加工、C-末端截短、糖基化作用、磷酸化作用等之后处于其最终形式的多肽。在一个方面，基于预测SEQ ID NO:2的氨基酸1至19、SEQ ID NO:4的氨基酸1至23、SEQ ID NO:6的氨基酸1至19或SEQID NO:8的氨基酸1至18是信号肽的信号P(SignalP)程序(尼尔森(Nielsen)等人，1997，蛋白质工程(Protein Engineering)10:1-6)，该成熟多肽是SEQ ID NO:2的氨基酸20至299、SEQ ID NO:4的氨基酸24至321、SEQ ID NO:6的氨基酸20至240或SEQ ID NO:8的氨基酸19至355。本领域中已知的是，一个宿主细胞可以产生由同一多核苷酸表达的两种或更多种不同成熟多肽(即，具有不同C-末端和/或N-末端氨基酸)的混合物。

成熟多肽编码序列：术语“成熟多肽编码序列”意指编码具有纤维素分解增强活性的成熟多肽的多核苷酸。在一个方面，基于预测SEQID NO:1的核苷酸101至157、SEQ ID NO:3的核苷酸101至169、SEQID NO:5的核苷酸279至335或SEQ ID NO:7的核苷酸101至154编码信号肽的信号P(SignalP)程序(尼尔森等人，1997，同上)，该成熟多肽编码序列是SEQ ID NO:1的核苷酸158至1382、SEQ ID NO:3的核苷酸170至1332、SEQ ID NO:5的核苷酸336至1580或SEQ IDNO:7的核苷酸155至1404或其cDNA序列。

中严谨度条件：术语“中严谨度条件”意指对于长度为至少100个核苷酸的探针而言，遵循标准DNA印迹程序，在42℃下在5X SSPE、0.3％SDS、200微克/ml剪切并变性的鲑鱼精子DNA和35％甲酰胺中预杂交和杂交12至24小时。载体材料最终使用2X SSC、0.2％SDS，在55℃下洗涤三次，每次15分钟。

中-高严谨度条件：术语“中-高严谨度条件”意指对于长度为至少100个核苷酸的探针而言，遵循标准DNA印迹程序，在42℃下在5XSSPE、0.3％SDS、200微克/ml剪切并变性的鲑鱼精子DNA以及35％甲酰胺中预杂交和杂交12至24小时。载体材料最终使用2X SSC、0.2％SDS，在60℃下洗涤三次，每次15分钟。

核酸构建体：术语“核酸构建体”意指单链-或双链核酸分子，其分离自天然存在的基因，或其被修饰成以本来在自然界中不存在的方式含有核酸的区段，或其为合成的，其包含一个或多个控制序列。

可操作地连接：术语“可操作地连接”意指如下的构造，其中，控制序列相对于多核苷酸的编码序列安置在适当位置处，从而使得该控制序列指导该编码序列的表达。

序列一致性：两个氨基酸序列之间或者两个核苷酸序列之间的关联度通过参数“序列一致性”来描述。

出于本发明的目的，使用如在EMBOSS包(EMBOSS：欧洲分子生物学开放软件套件(The European Molecular Biology Open SoftwareSuite)，赖斯(Rice)等人，2000，遗传学趋势(Trends Genet.)16:276-277)(优选5.0.0版或更新版本)的尼德尔(Needle)程序中所实施的尼德尔曼-翁施(Needleman-Wunsch)算法(Needleman(尼德尔曼)和Wunsch(翁施)，1970，分子生物学杂志(J.Mol.Biol.)48:443-453)来确定两个氨基酸序列之间的序列一致性。使用的这些参数是空位开放罚分10、空位延伸罚分0.5，以及EBLOSUM62(BLOSUM62的EMBOSS版本)取代矩阵。尼德尔标注的“最长的一致性”的输出(使用-非简化选项获得)被用作百分比一致性，并且如下计算：

(一致的残基X 100)/(比对长度-比对中的空位总数)

出于本发明的目的，使用如在EMBOSS包(EMBOSS：欧洲分子生物学开放软件套件，赖斯等人，2000，同上)(优选5.0.0版或更新版本)的尼德尔程序中所实施的尼德尔曼-翁施算法(尼德尔曼和翁施，1970，同上)来确定两个脱氧核糖核苷酸序列之间的序列一致性。使用的这些参数是空位开放罚分10、空位延伸罚分0.5以及EDNAFULL(NCBI NUC4.4的EMBOSS版本)取代矩阵。尼德尔标注的“最长的一致性”的输出(使用-非简化选项获得)被用作百分比一致性，并且如下计算：

(一致的脱氧核糖核苷酸X 100)/(比对长度-比对中的空位总数)

子序列：术语“子序列”意指使一个或多个(例如，若干个)核苷酸从成熟多肽编码序列的5'端和/或3'端缺少的多核苷酸；其中该子序列编码具有纤维素分解增强活性的一个片段。在一个方面，一个子序列包含至少800个核苷酸(例如，SEQ ID NO:1的核苷酸158至1025)，至少900个核苷酸(例如，SEQ ID NO:1的核苷酸158至1085)，或至少1050个核苷酸(例如，SEQ ID NO:1的核苷酸158至1235)；至少800个核苷酸(例如，SEQ ID NO:3的核苷酸172至1041)，至少900个核苷酸(例如，SEQ ID NO:3的核苷酸172至1113)，或至少1100个核苷酸(例如，SEQ ID NO:3的核苷酸172至1188)；至少1100个核苷酸(例如，SEQ ID NO:5的核苷酸336至1445)，或至少1250个核苷酸(例如，SEQ ID NO:5的核苷酸333至1577)；至少800个核苷酸(例如，SEQ ID NO:7的核苷酸173至1014)，至少900个核苷酸(例如，SEQ ID NO:7的核苷酸173至1164)，或至少1050个核苷酸(例如，SEQ ID NO:7的核苷酸173至1239)。

变体：术语“变体”意指在一个或多个(例如若干个)位置上包含改变，即取代、插入、和/或缺失的具有纤维素分解增强活性的多肽。取代意指用一个不同氨基酸置换占用一个位置的氨基酸；缺失意指去除占据一个位置的氨基酸；并且插入意指邻近于并且紧跟着占据一个位置的氨基酸之后添加一个或多个(例如，若干个)氨基酸(例如，1-5个氨基酸)。

非常高严谨度条件：术语“非常高严谨度条件”是指对于长度为至少100个核苷酸的探针而言，遵循标准DNA印迹程序，在42℃下在5X SSPE、0.3％SDS、200微克/ml剪切并变性的鲑鱼精子DNA和50％甲酰胺中预杂交和杂交12至24小时。载体材料最终使用2X SSC、0.2％SDS，在70℃下洗涤三次，每次15分钟。

非常低严谨度条件：术语“非常低严谨度条件”是指对于长度为至少100个核苷酸的探针而言，遵循标准DNA印迹程序，在42℃下在5X SSPE、0.3％SDS、200微克/ml剪切并变性的鲑鱼精子DNA和25％甲酰胺中预杂交和杂交12至24小时。载体材料最终使用2X SSC、0.2％SDS，在45℃下洗涤三次，每次15分钟。

发明详细说明

具有纤维素分解增强活性的多肽

在一个实施例中，本发明涉及与SEQ ID NO:2的成熟多肽具有至少70％、至少75％、至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％、或100％的序列一致性的分离多肽，这些多肽具有纤维素分解增强活性。在一个方面中，这些多肽与SEQ ID NO:2的成熟多肽相差不超过10个氨基酸，例如1、2、3、4、5、6、7、8或9个。

本发明的多肽优选地包括或由SEQ ID NO:2的氨基酸序列或其等位基因变体组成；或是其具有纤维素分解增强活性的片段。在另一个方面中，该多肽包括SEQ ID NO:2的成熟多肽或由其组成。在另一个方面中，该多肽包括SEQ ID NO:2的氨基酸20至299或由其组成。

在一个实施例中，本发明涉及与SEQ ID NO:4的成熟多肽具有至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％、或100％的序列一致性的分离的多肽，这些分离的多肽具有纤维素分解增强活性。在一个方面中，这些多肽与SEQ ID NO:4的成熟多肽相差不超过10个氨基酸，例如1、2、3、4、5、6、7、8或9个。

本发明的多肽优选地包括或由SEQ ID NO:4的氨基酸序列或其等位基因变体组成；或是其具有纤维素分解增强活性的片段。在另一个方面中，该多肽包括SEQ ID NO:4的成熟多肽或由其组成。在另一个方面中，该多肽包括SEQ ID NO:4的氨基酸24至321或由其组成。

在一个实施例中，本发明涉及与SEQ ID NO:6的成熟多肽具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％、或100％的序列一致性的分离的多肽，这些分离的多肽具有纤维素分解增强活性。在一个方面中，这些多肽与SEQ ID NO:6的成熟多肽相差不超过10个氨基酸，例如1、2、3、4、5、6、7、8或9个。

本发明的多肽优选地包括或由SEQ ID NO:6的氨基酸序列或其等位基因变体组成；或是其具有纤维素分解增强活性的片段。在另一个方面中，该多肽包括SEQ ID NO:6的成熟多肽或由其组成。在另一个方面中，该多肽包括SEQ ID NO:6的氨基酸20至240或由其组成。

在一个实施例中，本发明涉及与SEQ ID NO:8的成熟多肽具有至少75％、至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％、或100％的序列一致性的分离多肽，这些多肽具有纤维素分解增强活性。在一个方面中，这些多肽与SEQ ID NO:8的成熟多肽相差不超过10个氨基酸，例如1、2、3、4、5、6、7、8或9个。

本发明的多肽优选地包括或由SEQ ID NO:8的氨基酸序列或其等位基因变体组成；或是其具有纤维素分解增强活性的片段。在另一个方面中，该多肽包括SEQ ID NO:8的成熟多肽或由其组成。在另一个方面中，该多肽包括SEQ ID NO:8的氨基酸19至355或由其组成。

在另一个实施例中，本发明涉及由在中严谨度条件、中-高严谨度条件、高严谨度条件或非常高严谨度条件下与(i)SEQ ID NO:1、SEQID NO:3、SEQ ID NO:5或SEQ ID NO:7的成熟多肽编码序列，(ii)其cDNA序列，或(iii)(i)或(ii)的全长互补体杂交的一种多核苷酸所编码的具有纤维素分解增强活性的一种分离的多肽(萨姆布鲁克(Sambrook)等人，1989，分子克隆实验指南(Molecular Cloning,ALaboratory Manual)，第二版，冷泉港(Cold Spring Harbor)，纽约)。

可以使用SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5或SEQ IDNO:7或其子序列，以及SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6或SEQ ID NO:8的多肽或其片段来设计核酸探针以便根据本领域熟知的方法鉴定和克隆编码来自不同属或物种的菌株的具有纤维素分解增强活性的多肽的DNA。具体而言，可以根据标准DNA印迹程序，使用这类探针与感兴趣的细胞的基因组DNA或cDNA杂交，以便鉴别和分离其中的对应基因。这类探针可以明显短于完整序列，但是长度应为至少15，例如至少25、至少35、或至少70个核苷酸。优选地，该核酸探针的长度为至少100个核苷酸，例如长度为至少200个核苷酸、至少300个核苷酸、至少400个核苷酸、至少500个核苷酸、至少600个核苷酸、至少700个核苷酸、至少800个核苷酸、或至少900个核苷酸。DNA和RNA探针两者都可使用。典型地将探针进行标记(例如，用³²P、³H、³⁵S、生物素、或抗生物素蛋白)，以检测相应的基因。本发明涵盖此类探针。

可以针对与以上所描述的探针杂交并且编码具有纤维素分解增强活性的多肽的DNA对由这类其他菌株制备的基因组DNA或cDNA文库进行筛选。来自这类其他菌株的基因组DNA或其他DNA可以通过琼脂糖或聚丙烯酰胺凝胶电泳，或其他分离技术来分离。来自文库的DNA或分离的DNA可转移到并固定在硝酸纤维素或其他适合的载体材料上。为了鉴别与SEQ ID NO:1或其子序列杂交的克隆或DNA，将载体材料用于DNA印迹中。

出于本发明的目的，杂交指示该多核苷酸在非常低到非常高严谨度条件下与对应于以下各项的经过标记的核酸探针杂交：(i)SEQ IDNO:1、SEQ ID NO:3、SEQ ID NO:5或SEQ ID NO:7；(ii)SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5或SEQ ID NO:7的成熟多肽编码序列；(iii)其cDNA序列；(iv)其全长互补体；或(v)其子序列。可以使用例如X-射线胶片或本领域已知的任何其他检测手段来检测在这些条件下该核酸探针杂交的分子。

在另一个实施例中，本发明涉及一种具有纤维素分解增强活性的分离的多肽，该分离的多肽由与SEQ ID NO:1的成熟多肽编码序列或其cDNA序列具有至少70％、至少75％、至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％、或100％序列一致性的多核苷酸所编码。

在另一个实施例中，本发明涉及一种具有纤维素分解增强活性的分离的多肽，该分离的多肽由与SEQ ID NO:3的成熟多肽编码序列或其cDNA序列具有至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％、或100％序列一致性的多核苷酸所编码。

在另一个实施例中，本发明涉及一种具有纤维素分解增强活性的分离的多肽，该分离的多肽由与SEQ ID NO:5的成熟多肽编码序列或其cDNA序列具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％、或100％序列一致性的多核苷酸所编码。

在另一个实施例中，本发明涉及一种具有纤维素分解增强活性的分离的多肽，该分离的多肽由与SEQ ID NO:7的成熟多肽编码序列或其cDNA序列具有至少75％、至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％、或100％序列一致性的多核苷酸所编码。

在另一个实施例中，本发明涉及SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6或SEQ ID NO:8的成熟多肽的变体，这些变体在一个或多个(例如若干个)位置处包括取代、缺失和/或插入。在一个实施例中，引入SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6或SEQ ID NO:8的成熟多肽中的氨基酸取代、缺失和/或插入的数目不超过10个，例如1、2、3、4、5、6、7、8或9个。这些氨基酸变化可以具有微小性质，即，不会显著地影响蛋白质的折叠和/或活性的保守氨基酸取代或插入；典型地1-30个氨基酸的小缺失；小的氨基-或羧基-末端延伸，如氨基末端的甲硫氨酸残基；多达20-25个残基的小接头肽；或便于通过改变净电荷或另一种功能来纯化的小延伸，如聚组氨酸段(tract)、抗原表位或结合结构域。

保守取代的实例是在下组的范围内：碱性氨基酸(精氨酸、赖氨酸及组氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、极性氨基酸(谷氨酰胺和天冬酰胺)、疏水性氨基酸(亮氨酸、异亮氨酸及缬氨酸)、芳香族氨基酸(苯丙氨酸、色氨酸及酪氨酸)及小氨基酸(甘氨酸、丙氨酸、丝氨酸、苏氨酸及甲硫氨酸)。一般不会改变特异性活性的氨基酸取代是本领域已知的并且例如由H.诺伊拉特(Neurath)和R.L.希尔(Hill)，1979在蛋白质(The Proteins)，学术出版社(Academic Press)，纽约中描述。常见取代是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu、和Asp/Gly。

可替代地，氨基酸改变具有这样一种性质：改变多肽的物理化学特性。例如，氨基酸改变可以提高多肽的热稳定性、改变底物特异性、改变最适pH，等等。

可以根据本领域中已知的程序，如定点诱变或丙氨酸扫描诱变(坎宁汉(Cunningham)和威尔斯(Wells)，1989，科学(Science)244:1081-1085)来鉴定多肽中的必需氨基酸。在后一项技术中，在该分子中的每个残基处引入单个丙氨酸突变，并且对所得突变体分子的纤维素酶增强活性进行测试以鉴别对于该分子的活性至关重要的氨基酸残基。还参见，希尔顿(Hilton)等人，1996，生物化学杂志(J.Biol.Chem.)271:4699-4708。也可结合假定接触位点氨基酸的突变，如通过以下技术例如核磁共振、结晶学、电子衍射、或光亲和标记进行确定的对结构进行物理学分析，从而确定酶的活性位点或其他生物学相互作用。参见，例如，德弗斯(de Vos)等人，1992，科学255:306-312；史密斯(Smith)等人，1992，分子生物学杂志224:899-904；乌乐达维尔(Wlodaver)等人，1992，FEBS快报309:59-64。还可以从与相关多肽的比对来推断鉴别必需氨基酸。

可以做出单个或多个氨基酸取代、缺失和/或插入并且使用诱变、重组和/或改组的已知方法进行测试，随后进行相关筛选程序，如由里德哈尔-奥尔森(Reidhaar-Olson)和萨奥尔(Sauer)，1988，科学(Science)241:53-57；博维(Bowie)和萨奥尔，1989，美国国家科学院院刊(Proc.Natl.Acad.Sci.USA)86:2152-2156；WO 95/17413；或WO 95/22625披露的那些。可以使用的其他方法包括易错PCR、噬菌体展示(例如，洛曼(Lowman)等人，1991，生物化学(Biochemistry)30:10832-10837；美国专利号5,223,409；WO 92/06204)以及区域定向诱变(德比什尔(Derbyshire)等人，1986，基因(Gene)46:145；内尔(Ner)等人，1988，DNA 7:127)。

可以结合诱变/改组方法与高通量自动化筛选方法来检测由宿主细胞表达的克隆的、诱变的多肽的活性(内斯(Ness)等人，1999，自然生物技术(Nature Biotechnology)17:893-896)。编码活性多肽的诱变的DNA分子可以回收自宿主细胞，并且使用本领域的标准方法对其进行迅速测序。这些方法允许迅速确定多肽中单个氨基酸残基的重要性。

该多肽可以是一种杂合多肽，其中一种多肽的一个区域在另一种多肽的一个区域的N-末端或C-末端处融合。

该多肽可以是融合多肽或可切割的融合多肽，其中另一种多肽在本发明多肽的N-末端或C-末端处融合。通过将编码另一多肽的多核苷酸融合到本发明的多核苷酸而产生融合多肽。用于产生融合多肽的技术在本领域是已知的，并包括连接编码多肽的编码序列，这样使得它们在框内并且使得融合多肽的表达处于相同的一个或多个启动子和终止子的控制下。融合多肽还可以使用内含肽技术来构建，其中融合多肽在翻译后产生(库珀(Cooper)等人，1993，欧洲分子生物学学会杂志(EMBO J.)12:2575-2583；道森(Dawson)等人，1994，科学(Science)266:776-779)。

融合多肽可以在两个多肽之间进一步包括一个切割位点。在融合蛋白分泌之时，该位点被切割，从而释放出这两个多肽。切割位点的实例包括但不限于在以下文献中披露的位点：马丁(Martin)等人，2003，工业微生物与生物技术杂志(J.Ind.Microbiol.Biotechnol.)3:568-576；斯维特娜(Svetina)等人，2000，生物技术杂志(J.Biotechnol.)76:245-251；拉斯穆森-威尔逊(Rasmussen-Wilson)等人，1997，应用与环境微生物学(Appl.Environ.Microbiol.)63:3488-3493；沃德(Ward)等人，1995，生物技术(Biotechnology)13:498-503；以及孔特雷拉斯(Contreras)等人，1991，生物技术9:378-381；伊顿(Eaton)等人，1986，生物化学(Biochemistry)25:505-512；柯林斯-拉西(Collins-Racie)等人，1995，生物技术13:982-987；卡特(Carter)等人，1989，蛋白质：结构、功能以及遗传学(Proteins:Structure，Function，and Genetics)6:240-248；以及史蒂文斯(Stevens)，2003，药物发现世界(DrugDiscovery World)4:35-48。

具有纤维素分解增强活性的多肽的来源

本发明的具有纤维素分解增强活性的多肽可以从任何属的微生物获得。为了本发明的目标，结合给定来源，如在此使用，术语“获得自”应指由该来源或由其中已经插入来自该来源的多核苷酸的菌株产生的多核苷酸编码的多肽。在一方面，获得自给定来源的多肽被分泌到细胞外。

该多肽可以是一种真菌多肽。例如，该多肽可以是酵母多肽，例如假丝酵母属(Candida)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母菌属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)、或耶氏酵母属(Yarrowia)多肽；或丝状真菌多肽，例如枝顶孢霉属(Acremonium)、伞菌属(Agaricus)、链格孢属(Alternaria)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、葡萄座腔菌属(Botryospaeria)、拟蜡菌属(Ceriporiopsis)、毛喙壳属(Chaetomidium)、金孢子菌属(Chrysosporium)、麦角菌属(Claviceps)、旋孢腔菌属(Cochliobolus)、鬼伞属(Coprinopsis)、乳白蚁属(Coptotermes)、棒囊壳属(Corynascus)、隐丛赤壳菌属(Cryphonectria)、隐球菌属(Cryptococcus)、色二孢属(Diplodia)、黑耳属(Exidia)、线黑粉酵母属(Filibasidium)、镰刀菌属(Fusarium)、赤霉属(Gibberella)、全鞭毛虫属(Holomastigotoides)、腐质霉属(Humicola)、耙齿菌属(Irpex)、蘑燕属(Lentinula)、香菇属(Lentinus)、小腔球菌属(Leptospaeria)、梨孢菌属(Magnaporthe)、黑果菌属(Melanocarpus)、多孔菌属(Meripilus)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、新美鞭菌属(Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉菌属(Penicillium)、平革菌属(Phanerochaete)、瘤胃壶菌属(Piromyces)、某真菌属(Poitrasia)、假黑盘菌属(Pseudoplectania)、假披发虫属(Pseudotrichonympha)、根毛霉菌属(Rhizomucor)、裂褶菌属(Schizophyllum)、柱顶孢属(Scytalidium)、踝节菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳霉属(Thielavia)、弯颈霉属(Tolypocladium)、木霉属(Trichoderma)、长毛盘菌属(Trichophaea)、轮枝孢属(Verticillium)、小包脚菇属(Volvariella)或炭角菌属(Xylaria)多肽。

在另一个方面，该多肽是卡氏酵母、酿酒酵母、糖化酵母、道格拉斯酵母、克鲁费酵母、诺地酶母、或卵形酵母多肽。

在另一方面，该多肽是解纤维枝顶孢霉(Acremoniumcellulolyticus)、棘孢曲霉(Aspergillus aculeatus)、泡盛曲霉(Aspergillusawamori)、臭曲霉(Aspergillus foetidus)、烟曲霉(Aspergillus fumigatus)、日本曲霉(Aspergillus japonicus)、构巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillus niger)、米曲霉(Aspergillus oryzae)、狭边金孢子菌(Chrysosporium inops)、嗜角质金孢子菌(Chrysosporiumkeratinophilum)、卢克诺文思金孢子菌(Chrysosporium lucknowense)、莫达瑞姆金孢子菌(Chrysosporium merdarium)、租金孢子菌(Chrysosporium pannicola)、昆士兰金孢子菌(Chrysosporiumqueenslandicum)、热带金孢子菌(Chrysosporium tropicum)、带纹金孢子菌(Chrysosporium zonatum)、杆孢状镰孢(Fusarium bactridioides)、谷类镰孢(Fusarium cerealis)、库威镰孢(Fusarium crookwellense)、大刀镰孢(Fusarium culmorum)、禾谷镰孢(Fusarium graminearum)、禾赤镰孢(Fusarium graminum)、异孢镰孢(Fusarium heterosporum)、合欢木镰孢(Fusarium negundi)、尖镰孢(Fusarium oxysporum)、多枝镰孢(Fusarium reticulatum)、粉红镰孢(Fusarium roseum)、接骨木镰孢(Fusarium sambucinum)、肤色镰孢(Fusarium sarcochroum)、拟分枝孢镰孢(Fusarium sporotrichioides)、硫色镰孢(Fusariumsulphureum)、圆镰孢(Fusarium torulosum)、拟丝孢镰孢(Fusariumtrichothecioides)、镶片镰孢(Fusarium venenatum)、灰腐质霉(Humicolagrisea)、特异腐质霉(Humicola insolens)、疏棉状腐质霉(Humicolalanuginosa)、白耙齿菌(Irpex lacteus)、绒柄香菇(Lentinus similis)、米黑毛霉(Mucor miehei)、嗜热毁丝霉(Myceliophthora thermophila)、粗糙链孢菌(Neurospora crassa)、绳状青霉菌(Penicillium funiculosum)、产紫青霉菌(Penicillium purpurogenum)、黄孢原毛平革菌(Phanerochaete chrysosporium)、无色梭孢壳霉(Thielaviaachromatica)、阿波梭孢壳菌(Thielavia albomyces)、白毛梭孢壳霉(Thielavia albopilosa)、澳洲梭孢壳霉(Thielavia australeinsis)、菲美蒂梭孢壳菌(Thielavia fimeti)、小孢梭孢壳霉(Thielavia microspora)、卵孢梭孢壳霉(Thielavia ovispora)、秘鲁梭孢壳霉(Thielaviaperuviana)、毛梭孢壳霉(Thielavia setosa)、瘤孢梭孢壳霉(Thielaviaspededonium)、耐热梭孢壳(Thielavia subthermophila)、土生梭孢壳霉(Thielavia terrestris)、哈茨木霉(Trichoderma harzianum)、康宁木霉(Trichoderma koningii)、长枝木霉(Trichoderma longibrachiatum)、里氏木霉(Trichoderma reesei)、或绿色木霉(Trichoderma viride)多肽。

在另一个方面中，该多肽是一种绒柄香菇多肽。将理解的是，对于以上提到的物种而言，本发明涵盖完全状态和不完全状态(perfectand imperfect states)二者、以及其他分类学等效物，例如无性型，而不管它们已知的物种名称是什么。本领域的普通技术人员将容易地识别适当等效物的身份。

这些物种的菌株可以容易地在许多培养物保藏中心为公众所获得，如美国典型培养物保藏中心(ATCC)、德国微生物菌种保藏中心(Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH，DSMZ)、荷兰菌种保藏中心(Centraalbureau Voor Schimmelcultures，CBS)、以及美国农业研究菌种保藏中心北方地区研究中心(NRRL)。

可以使用以上提到的探针从其他来源，包括从自然界(例如，土壤、堆肥、水等等)分离的微生物或直接从自然材料(例如，土壤、堆肥、水等等)获得的DNA样品鉴定和获得该多肽。用于从自然生活环境中直接分离微生物和DNA的技术是本领域熟知的。然后可以通过类似地筛选另一微生物的基因组DNA或cDNA文库或混合的DNA样品来获得编码该多肽的多核苷酸。一旦已经用该一个或多个探针检测到编码多肽的多核苷酸，就可以通过利用本领域的普通技术人员已知的技术对该多核苷酸进行分离或克隆(参见，例如，萨姆布鲁克等，1989，同上文)。

多核苷酸

本发明还涉及编码本发明的多肽的分离的多核苷酸，如在此所述。

用于分离或克隆多核苷酸的技术是本领域中已知的并且包括从基因组DNA或cDNA，或其组合进行分离。来自基因组DNA的多核苷酸的克隆可以例如通过使用众所周知的聚合酶链反应(PCR)或用以对具有共有的结构特征的克隆的DNA片段进行检测的表达库抗体筛选来实现。参见例如，伊尼斯(Innis)等人，1990，PCR：方法和应用指南(PCR:A Guide to Methods and Application)，学术出版社(Academic Press)，纽约。可以使用其他核酸扩增程序例如连接酶链式反应(LCR)、连接激活转录(LAT)和基于多核苷酸的扩增(NASBA)。这些多核苷酸可以由绒柄香菇菌株或相关有机体克隆，并且因此，例如可以是该多核苷酸的多肽编码区的等位基因或种类变体。

编码本发明多肽的多核苷酸的修饰对于合成实质上类似于该多肽的多肽可以是必需的。术语“基本上类似于”该多肽是指该多肽的非天然发生的形式。这些多肽可能以某种工程化方式而不同于从其天然来源分离的多肽，例如在比活性、热稳定性、最优pH等方面不同的变体。这些变体可以基于以SEQ ID NO:1的成熟多肽编码序列或其cDNA序列、SEQ ID NO:3的成熟多肽编码序列或其cDNA序列、SEQID NO:5的成熟多肽编码序列或其cDNA序列、SEQ ID NO:7的成熟多肽编码序列或其cDNA序列(例如其子序列)形式呈现的多核苷酸，和/或通过引入不会改变该多肽的氨基酸序列、但对应于预定用于产生该酶的宿主有机体的密码子用法的核苷酸取代，或通过引入可以产生不同氨基酸序列的核苷酸取代来构建。对于核苷酸取代的一般描述，参见例如福德(Ford)等人，1991，蛋白表达与纯化(Protein Expressionand Purification)2:95-107。

核酸构建体

本发明还涉及核酸构建体，这些核酸构建体包括可操作地连接至一个或多个控制序列的本发明的多核苷酸，在与控制序列相容的条件下，这些控制序列指导编码序列在合适的宿主细胞中的表达。

可以按多种方式操纵多核苷酸，以提供多肽的表达。取决于表达载体，在其插入载体以前操纵多核苷酸可以是希望的或必需的。用于利用重组DNA方法修饰多核苷酸的技术是本领域熟知的。

该控制序列可以是一个启动子，即，被宿主细胞识别以对编码本发明多肽的多核苷酸进行表达的一种多核苷酸。该启动子包含转录控制序列，这些序列介导了该多肽的表达。该启动子可以是在宿主细胞中显示出转录活性的任何多核苷酸，包括突变型、截短型及杂合型启动子，并且可以是由编码与该宿主细胞同源或异源的细胞外或细胞内多肽的基因获得。

用于在细菌宿主细胞中指导本发明的核酸构建体的转录的合适启动子的实例是从以下基因中获得的启动子：解淀粉芽孢杆菌α-淀粉酶基因(amyQ)、地衣芽孢杆菌α-淀粉酶基因(amyL)、地衣芽孢杆菌青霉素酶基因(penP)、嗜热脂肪芽孢杆菌麦芽糖淀粉酶基因(amyM)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、枯草芽孢杆菌xylA和xylB基因、苏云金芽孢杆菌cryIIIA基因(阿盖塞(Agaisse)和勒尔克吕(Lereclus)，1994，分子微生物学(Molecular Microbiology)13:97-107)、大肠杆菌lac操纵子、大肠杆菌trc启动子(埃贡(Egon)等人，1988，基因69:301-315)、天蓝色链霉菌琼脂水解酶基因(dagA)、以及原核β-内酰胺酶基因(维拉-卡马洛夫(Villa-Kamaroff)等人，1978，美国国家科学院院刊75:3727-3731)、以及tac启动子(德波尔(DeBoer)等人，1983，美国国家科学院院刊80:21-25)。其他启动子描述在吉尔伯特(Gilbert)等人，1980，科学美国人(Scientific American)242:74-94的“来自重组细菌的有用蛋白质(Useful proteins from recombinantbacteria)”；以及在萨姆布鲁克(Sambrook)等人，1989，见上文。串联启动子的实例披露在WO 99/43835中。

用于指导本发明的核酸构建体在丝状真菌宿主细胞中的转录的合适启动子的实例是从以下各项的基因获得的启动子：构巢曲霉乙酰胺酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、米曲霉TAKA淀粉酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、尖镰孢胰蛋白酶样蛋白酶(WO 96/00787)、镶片镰孢淀粉葡糖苷酶(WO 00/56900)、镶片镰孢Daria(WO00/56900)、镶片镰孢Quinn(WO 00/56900)、米黑根毛霉(Rhizomucormiehei)脂肪酶、米黑根毛霉天冬氨酸蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶IV、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉β-木糖苷酶，以及NA2-tpi启动子(一种修饰的启动子，其来自曲霉属中性α-淀粉酶基因，其中未翻译的前导序列由曲霉属丙糖磷酸异构酶基因的未翻译的前导序列替代；非限制性实例包括修饰的启动子，其来自黑曲霉中性α-淀粉酶的基因，其中未翻译的前导序列由构巢曲霉或米曲霉丙糖磷酸异构酶基因的未翻译的前导序列替代)；以及其突变型启动子、截短型启动子、以及杂合型启动子。

在酵母宿主中，有用的启动子从以下的基因获得：酿酒酵母烯醇酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH1、ADH2/GAP)、酿酒酵母丙糖磷酸异构酶(TPI)、酿酒酵母金属硫蛋白(CUP1)、以及和酿酒酵母3-磷酸甘油酸激酶。罗马诺斯(Romanos)等人，1992，酵母(Yeast)8:423-488描述了酵母宿主细胞的其他有用的启动子。

控制序列还可以是由宿主细胞识别以终止转录的一种转录终止子。该终止子可操作地连接到编码该多肽的多核苷酸的3'-末端。在该宿主细胞中起作用的任何终止子都可以用于本发明中。

用于细菌宿主细胞的优选终止子是从克劳氏芽孢杆菌碱性蛋白酶(aprH)、地衣芽孢杆菌α-淀粉酶(amyL)、以及大肠杆菌核糖体RNA(rrnB)的基因获得。

丝状真菌宿主细胞的优选终止子是从以下各项的基因中获得的：构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡萄糖苷酶、米曲霉TAKA淀粉酶以及尖孢镰刀菌胰蛋白酶样蛋白酶。

用于酵母宿主细胞的优选终止子从以下各项的基因获得：酿酒酵母烯醇酶、酿酒酵母细胞色素C(CYC1)、以及酿酒酵母甘油醛-3-磷酸脱氢酶。用于酵母宿主细胞的其他有用的终止子由罗马努斯等人，1992，见上文描述。

控制序列还可以是启动子下游和基因的编码序列上游的mRNA稳定子区，其增加该基因的表达。

适合的mRNA稳定区的实例是从以下获得的：苏云金芽孢杆菌cryIIIA基因(WO 94/25612)和枯草芽孢杆菌SP82基因(化(Hue)等人，1995，细菌学杂志(Journal of Bacteriology)177:3465-3471)。

该控制序列还可以是一个前导序列，一种对宿主细胞翻译很重要的非翻译mRNA区域。该前导序列可操作地连接到编码该多肽的多核苷酸的5'-末端。可以使用在宿主细胞中具有功能的任何前导序列。

用于丝状真菌宿主细胞的优选前导序列是从米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶的基因获得。

适用于酵母宿主细胞的前导序列从以下各项的基因获得：酿酒酵母烯醇酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α因子、以及酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。

控制序列还可以是一种聚腺苷酸化序列，可操作地连接至该多核苷酸的3’-末端并且当转录时由宿主细胞识别为将聚腺苷酸残基添加至所转录的mRNA的信号的序列。可以使用在宿主细胞中起作用的任何多腺苷酸化序列。

用于丝状真菌宿主细胞的优选聚腺苷酸化序列是从以下各项的基因获得：构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶、以及尖镰孢胰蛋白酶样蛋白酶。

有用于酵母宿主细胞的多腺苷酸化序列在郭(Guo)和谢尔曼(Sherman)，1995，分子细胞生物学(Mol.Cellular Biol.)15:5983-5990中描述。

控制序列也可以是编码与多肽的N-端连接并指导多肽进入细胞的分泌通路的信号肽的信号肽编码区。多核苷酸的编码序列的5’-端可以固有地包括在翻译阅读框架中与编码多肽的编码序列的区段天然地连接的一个信号肽编码序列。可替代地，编码序列5’末端可以包括对于该编码序列是外源的信号肽编码序列。在编码序列不天然地包含信号肽编码序列的情况下，可能需要外源信号肽编码序列。可替代地，外源信号肽编码序列可简单地替换天然的信号肽编码序列以便增强该多肽的分泌。然而，可以使用指导所表达多肽进入宿主细胞的分泌通路的任何信号肽编码序列。

用于细菌宿主细胞的有效信号肽编码序列是从以下各项的基因获得的信号肽编码序列：芽孢杆菌属NCIB 11837产麦芽糖淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌α-淀粉酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT、nprS、nprM)、以及枯草芽孢杆菌prsA。西蒙纳(Simonen)和帕尔瓦(Palva)，1993，微生物学评论(Microbiological Reviews)57:109-137描述了另外的信号肽。

用于丝状真菌宿主细胞的有效信号肽编码序列是获得自以下项的基因的信号肽编码序列：黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶V、疏棉状腐质霉脂肪酶以及米黑根毛霉天冬氨酸蛋白酶。

对于酵母宿主细胞有用的信号肽获得自以下项的基因：酿酒酵母α-因子和酿酒酵母转化酶。见上文，罗马诺斯等人(1992)描述了其他有用的信号肽编码序列。

该控制序列还可以是编码位于多肽的N-末端处的前肽的一个前肽编码序列。生成的多肽被称为前体酶(proenzyme)或多肽原(或者在一些情况下被称为酶原(zymogen))。多肽原通常是无活性的并且可以通过从该多肽原上催化切割或自动催化切割前肽而被转化成一种活性多肽。前肽编码序列可以从以下各项的基因获得：枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、嗜热毁丝霉漆酶(WO 95/33836)、米黑根毛霉天冬氨酸蛋白酶、以及酿酒酵母α因子。

在信号肽序列和前肽序列二者都存在的情况下，该前肽序列定位成紧邻多肽的N-末端并且该信号肽序列定位成紧邻该前肽序列的N-末端。

还可能希望地是添加调控序列，这些调控序列相对于宿主细胞的生长来调节多肽的表达。调控系统的实例是响应于化学或物理刺激而引起基因的表达开启或关闭的那些，包括调控化合物的存在。原核系统中的调控序列包括lac、tac、以及trp操纵子系统。在酵母中，可以使用ADH2系统或GAL1系统。在丝状真菌中，可以使用黑曲霉葡糖淀粉酶启动子、米曲霉TAKAα-淀粉酶启动子、以及米曲霉葡糖淀粉酶启动子。调控序列的其他实例是允许基因扩增的那些。在真核系统中，这些调控序列包括在甲氨蝶呤存在下被扩增的二氢叶酸还原酶基因以及用重金属扩增的金属硫蛋白基因。在这些情况下，编码该多肽的多核苷酸将与调控序列可操作地连接。

表达载体

本发明还涉及包括本发明的多核苷酸、启动子、以及转录和翻译终止信号的重组表达载体。不同的核苷酸和控制序列可以连接在一起以产生一个重组表达载体，这一重组表达载体可以包括一个或多个便利的限制酶切位点以允许在这些位点处插入或取代编码该变体的多核苷酸。可替代地，该多核苷酸可以通过将该多核苷酸或包括该多核苷酸的核酸构建体插入用于表达的适当载体中来表达。在产生该表达载体时，该编码序列是位于该载体中，这样使得该编码序列与该供表达的适当控制序列可操作地连接。

重组表达载体可以是任何载体(例如，质粒或病毒)，其能够方便地进行重组DNA程序，并且能够引起多核苷酸的表达。载体的选择将典型地取决于该载体与有待引入该载体的宿主细胞的相容性。该载体可以是一种线性的或闭合的环状质粒。

载体可以是自主复制载体，即，作为染色体外实体存在的载体，其复制独立于染色体复制，例如，质粒、染色体外元件、微染色体、或人工染色体。该载体可以包含用于确保自我复制的任何装置。可替代地，该载体可以是这样一种载体，当它被引入该宿主细胞中时，被整合到基因组中并且与其中已整合了它的一个或多个染色体一起复制。此外，可以使用单一载体或质粒或两个或更多个载体或质粒(这些载体或质粒共同包含有待引入到宿主细胞的基因组中的总DNA)或转座子。

该载体优选包含允许容易选择转化细胞、转染细胞、转导细胞或类似细胞的一个或多个选择性标记。选择性标记是一种基因，该基因的产物提供了杀生物剂抗性或病毒抗性、重金属抗性、营养缺陷型的原养型、等。

细菌性选择性标记的实例是地衣芽孢杆菌或枯草芽孢杆菌dal基因，或赋予抗生素抗性(例如氨苄青霉素、氯霉素、卡那霉素、新霉素、大观霉素或四环素抗性)的标记。用于酵母宿主细胞的适合的标记包括但不限于ADE2、HIS3、LEU2、LYS2、MET3、TRP1、以及URA3。用于在丝状真菌宿主细胞中使用的选择性标记包含但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草胺膦乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清苷-5’-磷酸脱羧酶)、sC(硫酸腺苷基转移酶)、以及trpC(邻氨基苯甲酸合酶)、连同其等效物。优选在曲霉属细胞中使用的是构巢曲霉或米曲霉amdS和pyrG基因以及吸水链霉菌(Streptomyces hygroscopicus)bar基因。

载体优选含有允许载体整合到宿主细胞的基因组中或载体在细胞中独立于基因组自主复制的一个或多个元件。

用于整合到宿主细胞基因组中，该载体可以依赖于编码多肽的多核苷酸的序列或该载体中通过同源或非同源重组而整合到该基因组中的任何其他元件。可替代地，该载体可以包含用于指导通过同源重组而整合到宿主细胞基因组中的一个或多个染色体中的一个或多个精确位置处的另外的多核苷酸。为了增加在精确位置处整合的可能性，这些整合的元件应包含足够数量的核酸，例如100至10,000个碱基对、400至10,000个碱基对、以及800至10,000个碱基对，这些碱基对与对应的靶序列具有高度的序列一致性以提高同源重组的可能性。这些整合元件可以是与宿主细胞的基因组内的靶序列同源的任何序列。此外，这些整合元件可以是非编码多核苷酸或编码多核苷酸。另一方面，该载体可以通过非同源重组整合到宿主细胞的基因组中。

对于自主复制，载体可以进一步包含使该载体能够在所讨论的宿主细胞中自主复制的复制起点。复制起点可以是在细胞中起作用的介导自主复制的任何质粒复制子。术语“复制起点”或“质粒复制子”意指使质粒或载体能够在体内复制的多核苷酸。

细菌复制起点的实例是允许在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177、以及pACYC184的复制起点，以及允许在芽孢杆菌中复制的质粒pUB110、pE194、pTA1060、以及pAMβ1的复制起点。

用于在酵母宿主细胞中使用的复制起点的实例是2微米复制起点ARS1、ARS4、ARS1与CEN3的组合、以及ARS4与CEN6的组合。

在丝状真菌细胞内有用的复制起点的实例是AMA1和ANS1(格姆斯(Gems)等人，1991，基因98:61-67；卡伦(Cullen)等人，1987，核酸研究(Nucleic Acids Res.)15:9163-9175；WO 00/24883)。AMA1基因的分离和包括该基因的质粒或载体的构建可根据WO 00/24883披露的方法完成。

可以将本发明的多核苷酸的多于一个的拷贝插入到宿主细胞中以增加多肽的产生。通过将序列的至少一个另外的拷贝整合到宿主细胞基因组中或者通过包含一个与该多核苷酸一起的可扩增的选择性标记基因可以获得多核苷酸的增加的拷贝数目，其中通过在适当的选择性试剂的存在下培养细胞可以选择包含选择性标记基因的经扩增的拷贝的细胞、以及由此该多核苷酸的另外的拷贝。

用于连接以上所描述的元件以构建本发明的重组表达载体的程序是本领域的普通技术人员熟知的(参见，例如，萨姆布鲁克(Sambrook)等人，1989，见上文)。

宿主细胞

本发明还涉及重组宿主细胞，这些重组宿主细胞包括本发明的多核苷酸，该多核苷酸可操作地连接至一个或多个控制序列，该一个或多个控制序列指导本发明的多肽的产生。将包含多核苷酸的构建体或载体引入到宿主细胞中，这样使得该构建体或载体被维持作为染色体整合体或作为自主复制的染色体外载体，如早前所描述。术语“宿主细胞”涵盖由于复制期间发生的突变与亲本细胞不同的亲本细胞的任何后代。宿主细胞的选择在很大程度上取决于编码该多肽的基因及其来源。

该宿主细胞可以是有用于重组产生本发明的多肽的任何细胞，例如原核细胞或真核细胞。

原核宿主细胞可以是任何革兰氏阳性或革兰氏阴性细菌。革兰氏阳性细菌包括但不限于：芽孢杆菌属、梭菌属、肠球菌属、土芽孢杆菌属、乳杆菌属、乳球菌属、海洋芽孢杆菌属、葡萄球菌属、链球菌属、以及链霉菌属。革兰氏阴性细菌包括但不限于：弯曲杆菌属、大肠杆菌、黄杆菌菌、梭杆菌菌、螺旋杆菌属、泥杆菌属、奈瑟氏菌属、假单胞菌属、沙门氏菌属、以及脲原体属。

细菌宿主细胞可以是任何芽孢杆菌细胞，包括但不限于：嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌、以及苏云金芽孢杆菌细胞。

细菌宿主细胞还可以是任何链球菌细胞，包括但不限于：似马链球菌、酿脓链球菌、乳房链球菌、以及马链球菌兽瘟亚种细胞。

细菌宿主细胞还可以是任何链霉菌属细胞，包括但不限于：不产色链霉菌、阿维链霉菌、天蓝色链霉菌、灰色链霉菌以及变铅青链霉菌细胞。

将DNA引入芽孢杆菌属细胞中可通过以下来实现：原生质体转化(参见例如，张(Chang)和科恩(Cohen)，1979，分子遗传学与基因组学(Mol.Gen.Genet.)168:111-115)、感受态细胞转化(参见，例如，杨格(Young)和斯皮宰曾(Spizizen)，1961，细菌学杂志(J.Bacteriol.)81:823-829；或杜拜努(Dubnau)以及大卫杜夫-阿贝尔森(Davidoff-Abelson)，1971，分子生物学杂志56:209-221)、电穿孔(参见，例如，茂川(Shigekawa)和道尔(Dower)，1988，生物技术(Biotechniques)6:742-751)、或者接合(参见，例如克勒(Koehler)和索恩(Thorne)，1987，细菌学杂志169:5271-5278)。将DNA引入大肠杆菌细胞中可通过以下来实现：原生质体转化(参见例如，哈纳汗(Hanahan)，1983，分子生物学杂志166:557-580)或电穿孔(参见例如，道尔(Dower)等人，1988，核酸研究16:6127-6145)。将DNA引入链霉菌属细胞中可通过以下来实现：原生质体转化、电穿孔(参见例如，贡(Gong)等人，2004，叶线形微生物学(Folia Microbiol.)(Praha(布拉格))49:399-405)、接合(参见例如，马佐迪耶(Mazodier)等人，1989，细菌学杂志171:3583-3585)、或转导(参见例如，伯克(Burke)等人，2001，美国国家科学院院刊98:6289-6294)。将DNA引入假单孢菌属细胞中可通过以下来实现：电穿孔(参见例如，蔡(Choi)等人，2006，微生物学方法杂志(J.Microbiol.Methods)64:391-397)或接合(参见例如，皮内多(Pinedo)和斯梅茨(Smets)，2005，应用与环境微生物学71:51-57)。将DNA引入链球菌属细胞中可通过以下来实现：天然感受态(参见例如，佩里(Perry)和藏满(Kuramitsu)，1981，感染与免疫(Infect.Immun.)32:1295-1297)、原生质体转化(参见，例如，凯特(Catt)和乔力克(Jollick)，1991，微生物学(Microbios)68:189-207)、电穿孔(参见，例如，巴克利(Buckley)等人，1999，应用与环境微生物学65:3800-3804)、或者接合(参见，例如，克莱威尔(Clewell)，1981，微生物学评论(Microbiol.Rev.)45:409-436)。然而，可以使用本领域已知的用于将DNA引入宿主细胞中的任何方法。

宿主细胞还可以是真核细胞，如哺乳动物、昆虫、植物、或真菌细胞。

宿主细胞可以是真菌细胞。如在此使用的“真菌”包括子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)、以及接合菌门(Zygomycota)、连同卵菌门(Oomycota)和全部有丝分裂孢子真菌(如由霍克斯沃思(Hawksworth)等人在安斯沃思和拜斯比真菌词典(Ainsworth and Bisby’s Dictionary of The Fungi)，第8版，1995，国际应用生物科学中心(CAB International)，大学出版社(University Press)，英国剑桥(Cambridge，UK)中进行定义的)。

该真菌宿主细胞可以是酵母细胞。如在此使用的“酵母”包括产子嚢酵母(内孢霉目)、产担子酵母和属于半知菌类(芽孢纲)的酵母。由于酵母的分类在未来可能改变，因此出于本发明的目的，酵母应如酵母的生物学和活性(Biology and Activities of Yeast)(斯金纳(Skinner)、帕斯莫尔(Passmore)、以及达文波特(Davenport)编辑，应用细菌学学会讨论会系列号9(Soc.App.Bacteriol.Symposium Series No.9)，1980)中所描述来定义。

酵母宿主细胞可以是假丝酵母属、汉逊酵母属、克鲁维酵母属、毕赤酵母属、酵母属、裂殖酵母属、或耶氏酵母属细胞，如乳酸克鲁维酵母(Kluyveromyces lactis)、卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母、卵形酵母、或解脂耶氏酵母(Yarrowia lipolytica)细胞。

真菌宿主细胞可以是丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门的亚门(如由霍克斯沃思等人，1995，见上文所定义)的所有丝状形式。丝状真菌通常的特征在于由壳多糖、纤维素、葡聚糖、壳聚糖、甘露聚糖、以及其他复杂多糖构成的菌丝体壁。营养生长是通过菌丝延长，而碳分解代谢是专性需氧的。相反，酵母(如酿酒酵母)的营养生长是通过单细胞菌体的出芽(budding)，而碳分解代谢可以是发酵的。

丝状真菌宿主细胞可以是枝顶孢霉属、曲霉属、短梗霉属、烟管霉属(Bjerkandera)、拟腊菌属、金孢子菌属、鬼伞属、革盖菌属(Coriolus)、隐球菌属、线黑粉菌科(Filibasidium)、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新美鞭菌属、链孢菌属、拟青霉属、青霉属、平革菌属、射脉菌属(Phlebia)、瘤胃壶菌属、侧耳属(Pleurotus)、裂褶菌属、踝节菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属(Trametes)、或木霉属细胞。

例如，丝状真菌宿主细胞可以是泡盛曲霉、臭曲霉、烟曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、黑刺烟管菌(Bjerkandera adusta)、干拟蜡菌(Ceriporiopsis aneirina)、卡内基拟蜡菌(Ceriporiopsiscaregiea)、浅黄拟蜡孔菌(Ceriporiopsis gilvescens)、潘诺希塔拟蜡菌(Ceriporiopsis pannocinta)、环带拟蜡菌(Ceriporiopsis rivulosa)、微红拟蜡菌(Ceriporiopsis subrufa)、虫拟蜡菌(Ceriporiopsissubvermispora)、狭边金孢子菌(Chrysosporium inops)、嗜角质金孢子菌、拉克淖金孢子菌(Chrysosporium lucknowense)、粪状金孢子菌(Chrysosporium merdarium)、租金孢子菌、女王杜香金孢子菌(Chrysosporium queenslandicum)、热带金孢子菌、褐薄金孢子菌(Chrysosporium zonatum)、灰盖鬼伞(Coprinus cinereus)、毛革盖菌(Coriolus hirsutus)、杆孢状镰孢、谷类镰孢、库威镰孢、大刀镰孢、禾谷镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、特异腐质霉、疏棉状腐质霉、米黑毛霉、嗜热毁丝霉、粗糙链孢菌、产紫青霉、黄孢平革菌(Phanerochaetechrysosporium)、射脉菌(Phlebia radiata)、刺芹侧耳(Pleurotus eryngii)、土生梭孢壳霉、长域毛栓菌(Trametes villosa)、变色栓菌(Trametesversicolor)、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、或绿色木霉细胞。

可以将真菌细胞通过涉及原生质体形成、原生质体转化、以及细胞壁再生的方法以本身已知的方式转化。用于转化曲霉属和木霉属宿主细胞的适合程序在EP 238023和约尔顿(Yelton)等人，1984，美国国家科学院院刊81:1470-1474、以及克里斯滕森(Christensen)等人，1988，生物/技术(Bio/Technology)6:1419-1422中描述。用于转化镰刀菌属物种的适合方法由马拉迪尔(Malardier)等人，1989，基因78:147-156和WO 96/00787描述。可以使用由如以下文献描述的程序转化酵母：贝克尔(Becker)和瓜伦特(Guarente)，在阿贝尔森(Abelson)，J.N.和西蒙(Simon)，M.I.编，酵母遗传学与分子生物学指南，酶学方法(Guide to Yeast Genetics and Molecular Biology,Methods inEnzymology)，第194卷，第182-187页，学术出版社有限公司(AcademicPress,Inc.)，纽约；伊藤(Ito)等人，1983，细菌学杂志153:163；以及哈尼恩(Hinnen)等人，1978，美国国家科学院院刊75:1920。

产生方法

本发明还涉及产生本发明的多肽的方法，包括(a)在有益于产生该多肽的条件下培养细胞，该细胞以其野生型形式产生该多肽；并且(b)回收该多肽。在一个优选方面中，该细胞是香菇属细胞。在一个更优选的方面，该细胞是绒柄香菇细胞。本发明还涉及产生本发明的多肽的方法，包括(a)在有益于产生该多肽的条件下培养一个本发明的重组宿主细胞；并且(b)回收该多肽。

这些宿主细胞是在适合于使用本领域中已知的方法产生该多肽的一种营养培养基中培养的。例如，可以通过在适合的培养基中和在允许表达和/或分离该多肽的条件下，进行摇瓶培养，或者在实验室或工业发酵罐中进行小规模或大规模发酵(包括连续，分批，分批补料，或固态发酵)来培养细胞。该培养是使用本领域中已知的程序，在一种适合营养培养基中发生，该培养基包含碳和氮来源及无机盐。适合的培养基可从商业供应商获得或可以根据公开的组成(例如，在美国典型培养物保藏中心的目录中)制备。如果多肽分泌到该营养培养基中，那么可直接从培养基中直接回收多肽。如果多肽不分泌，那么其可从细胞裂解液中进行回收。

可以使用特异性针对该多肽的本领域已知的方法来检测该多肽。这些检测方法包括但不限于，特异性抗体的使用、酶产物的形成或酶底物的消失。例如，可以使用酶测定来确定该多肽的活性。

可以使用本领域已知的方法来回收多肽。例如，该多肽可以通过常规程序，包括但不限于，收集、离心、过滤、萃取、喷雾干燥、蒸发或沉淀，从该营养培养基回收。

可以通过本领域中已知的多种程序来纯化该多肽以获得基本上纯的多肽，这些程序包括但不限于：色谱法(例如，离子交换色谱、亲和色谱、疏水作用色谱、色谱聚焦、以及尺寸排阻色谱)、电泳程序(例如，制备型等电点聚焦)、差别溶解度(例如，硫酸铵沉淀)、SDS-PAGE、或萃取(参见例如，蛋白质纯化(Protein Purification)，詹森(Janson)和赖登(Ryden)编辑，VCH出版社(VCH Publishers)，纽约，1989)。

在一个替代性方面中，没有回收该多肽，而是将表达该多肽的本发明的宿主细胞用作该多肽的来源。

植物

本发明还涉及分离的植物，例如转基因植物、植物部分或植物细胞，这些植物包括本发明的多肽，从而表达并且产生可回收的量的多肽或结构域。多肽或结构域可从植物或植物部分回收。作为替代方案，包括该多肽或结构域的植物或植物部分可以按原样用于改善食品或饲料的质量，例如改善营养价值、可口性及流变学特性，或破坏抗营养因素。

转基因植物可以是双子叶的(双子叶植物)或单子叶的(单子叶植物)。单子叶植物的实例是草，如草甸草(蓝草，早熟禾属)；饲草，如羊茅属(Festuca)、黑麦草属(Lolium)；温带草，如翦股颖属(Agrostis)；以及谷类，例如小麦、燕麦、黑麦、大麦、稻、高粱、以及玉蜀黍(玉米)。

双子叶植物的实例是烟草、豆类(如羽扇豆(lupins)、马铃薯、糖甜菜(sugar beet)、豌豆、豆(bean)和大豆(soybean))、以及十字花科植物(十字花科(family Brassicaceae))(如花椰菜、油菜籽、以及紧密相关的模式生物拟南芥)。

植物部分的实例是茎、愈伤组织、叶、根、果实、种子、以及块茎、以及包括这些部分的独立组织，例如，表皮、叶肉、薄壁组织(parenchyme)、维管组织、分生组织。特定植物细胞区室，如叶绿体、质外体(apoplast)、线粒体、液泡、过氧化物酶体以及细胞质也被认为是植物部分。此外，任何植物细胞，无论是何种组织来源，都被认为是植物部分。同样地，植物部分，如分离以有助于本发明的利用的特定组织和细胞也被认为是植物部分，例如胚、胚乳、糊粉和种皮。

同样包含于本发明范围内的是这类植物、植物部分以及植物细胞的子代。

可以根据本领域已知方法构建表达该多肽或结构域的转基因植物或植物细胞。简而言之，通过将编码该多肽或结构域的一个或多个表达构建体结合到植物宿主基因组或叶绿体基因组中并且将所得改性植物或植物细胞繁殖成转基因的植物或植物细胞来构建植物或植物细胞。

表达构建体方便地是核酸构建体，它包括编码多肽或结构域的多核苷酸，该多核苷酸可操作地与选择的植物或植物部分中表达该多核苷酸所需的适当调节序列连接。而且，表达构建体可包含用于鉴别整合了此表达构建体的植物细胞的选择性标记，和将此构建体引入所讨论的植物所必需的DNA序列(后者取决于所用的引入DNA的方法)。

例如基于希望在何时、何处、和怎样表达该多肽或结构域来确定调节序列，例如启动子和终止子序列以及任选的信号序列或转运序列的选择。例如编码多肽或结构域的基因的表达可以是组成型的或诱导型的，或者可以是发育、阶段或组织特异性的，并且基因产物可以被靶向至特定组织或植物部分，例如种子或叶。调节序列由例如塔格(Tague)等人，1988，植物生理学(Plant Physiology)86:506描述。

对于组成型表达，可以使用35S-CaMV、玉米泛素1、或稻肌动蛋白1启动子(弗兰克(Franck)等人，1980，细胞(Cell)21:285-294；克里斯滕森(Christensen)等人，1992，植物分子生物学(Plant Mol.Biol.)18:675-689；张(Zhang)等人，1991，植物细胞(Plant Cell)3:1155-1165)。器官特异性启动子可以是以下各项的启动子，例如来自贮藏库组织(例如种子、马铃薯块茎、和果实)(Edwards(爱德华兹)和Coruzzi(科鲁兹)，1990,Ann.Rev.Genet.(遗传学年鉴)24:275-303)，或来自代谢库组织(例如分生组织)(Ito(伊藤)等人，1994,Plant Mol.Biol.(植物分子生物学)24:863-878)，种子特异性启动子，例如来自水稻的谷蛋白、醇溶谷蛋白、球蛋白或白蛋白启动子(Wu(吴)等人，1998,Plant Cell Physiol.(植物与细胞生理学)39:885-889)，来自豆球蛋白B4的蚕豆启动子和来自蚕豆的未知种子蛋白基因(Conrad(康拉德)等人，1998,J.Plant Physiol.(植物生理学杂志)152:708-711)，来自种子油体蛋白的启动子(Chen(陈)等人，1998,Plant Cell Physiol.(植物与细胞生理学)39:935-941)，来自欧洲油菜的贮藏蛋白napA启动子，或本领域已知的任何其他种子特异性启动子，例如，如在WO91/14772中所述的。此外，启动子可以是叶特异性启动子，如来自稻或番茄的rbcs启动子(京冢(Kyozuka)等人，1993，植物生理学(PlantPhysiol.)102:991-1000)、小球藻病毒腺嘌呤甲基转移酶基因启动子(麦卓(Mitra)和希金斯(Higgins)，1994，植物分子生物学26:85-93)、来自稻的aldP基因启动子(加贺屋(Kagaya)等人，1995，分子遗传学与基因组学(Mol.Gen.Genet.)248:668-674)、或伤口诱导型启动子(如马铃薯pin2启动子)(许(Xu)等人，1993，植物分子生物学22:573-588)。同样地，启动子可以通过非生物处理来诱导，如温度、干旱、或盐度变化，或通过外源施加的激活该启动子的物质来诱导，例如乙醇、雌激素、植物激素(如乙烯、脱落酸和赤霉酸)、以及重金属。

还可使用启动子增强子元件，从而在植物中达到多肽或结构域的更高表达。例如，启动子增强子元件可以是位于启动子和编码多肽或结构域的多核苷酸序列之间的内含子。例如，许等人，1993，见上文，披露了使用稻肌动蛋白1基因的第一内含子以增强表达。

该选择性标记基因及该表达构建体的任何其他部分可以选自本领域中可用的那些。

可以根据本领域中已知的常规技术将核酸构建体结合到植物基因组中，这些常规技术包括农杆菌介导的转化、病毒介导的转化、微注射、粒子轰击、生物射弹转化、以及电穿孔(加塞尔(Gasser)等人，1990，科学244:1293；波特里库斯(Potrykus)，1990，生物/技术8:535；岛本(Shimamoto)等人，1989，自然338:274)。

目前根癌农杆菌介导的基因转移是一种用于产生转基因双子叶植物(关于综述，请参见霍伊卡(Hooykas)和施尔伯鲁特(Schilperoort)，1992，植物分子生物学19:15-38)并且用于转化单子叶植物的方法，但对于这些植物还常常使用其他的转化方法。用于产生转基因单子叶植物的方法是粒子(涂覆有转化DNA的微观金或钨粒子)轰击胚愈伤组织或发育中的胚(克里斯托(Christou)，1992，植物杂志(Plant J.)2:275-281；岛本，1994，生物技术当前述评(Curr.Opin.Biotechnol.)5:158-162；瓦西尔(Vasil)等人，1992，生物/技术10:667-674)。用于转化单子叶植物的替代方法是基于原生质体转化，如由奥米儒勒(Omirulleh)等人，1993，植物分子生物学21:415-428所描述。另外的转化方法包括美国专利号6,395,966和7,151,204(两者都通过引用以其全文结合于此)中所描述的那些。

在转化后，根据本领域熟知的方法选出已并入了表达构建体的转化体，并使其再生成为完整植物。通常设计转化程序用于通过如下方法在再生期间或在后续世代中选择性消除选择基因：例如，使用带有两个独立的T-DNA构建体的共转化或利用特异性重组酶位点特异性地切除选择基因。

除用本发明的构建体直接转化特定植物基因型外，还可以通过使具有该构建体的植物与缺乏该构建体的第二植物进行杂交来产生转基因植物。例如，可以通过杂交将编码多肽或结构域的构建体引入特定植物品种中，无需总是直接地转化该给定品种的植物。因此，本发明不仅涵盖了从根据本发明已经转化的细胞直接再生的植物，而且还涵盖了这类植物的后代。如在此使用的，后代可以是指根据本发明制备的亲本植物的任何代的后代。此类后代可以包含根据本发明制备的DNA构建体。杂交导致通过供体植物系与起始系交叉授粉，将转基因引入植物系。此类步骤的非限制性实例描述于美国专利号7,151,204中。

植物可以通过回交转化方法生成。例如，植物包含被称为回交转化的基因型、种系、近交体、或杂交体的植物。

可以使用遗传标记以协助本发明的一种或多种转基因从一个遗传背景渗入到另一个。标记协助的选择提供了相对于常规育种的优势，在于其可以用于避免由表型变异导致的错误。另外，遗传标记可以在具体杂交的个别后代中提供有关良种种质相对程度的数据。例如，当具有所希望性状并且另外具有非农艺学所希望的遗传背景的植物与良种亲本杂交时，可以使用遗传标记来选择不仅具有感兴趣的性状，还具有相对较大比例所希望种质的后代。以此方式，使一种或多种性状渗入特定遗传背景所需的世代数得以最小化。

本发明还涉及产生本发明的多肽或结构域的方法，这些方法包括(a)在有益于产生该多肽或结构域的条件下培养转基因植物或植物细胞，该转基因植物或植物细胞包含编码该多肽或结构域的多核苷酸；并且(b)回收该多肽或结构域。

组合物

本发明还涉及包含本发明的多肽的组合物。优选地，这些组合物富含这种多肽。术语“富集”表明该组合物的纤维素分解增强活性(例如)增加了以至少1.1的富集因子。

该组合物可以包含作为主要酶组分的本发明的一种多肽，例如一种单组分组合物。可替代地，该组合物可以包含多种酶活性，如选自下组的一种或多种(若干种)酶，该组由以下各项组成：纤维素酶、半纤维素酶、苹果菌素、酯酶、漆酶、木质素分解酶、果胶酶、过氧化物酶、蛋白酶、以及膨胀蛋白。

可以根据本领域已知的方法来制备多肽组合物，并且这些多肽组合物可以处于液体或干燥组合物的形式。例如，该多肽组合物可以呈颗粒或微粒的形式。包括在该组合物中的多肽可以根据本领域中已知的方法稳定化。

下面给出了本发明的多肽组合物的优选应用的实例。本发明的多肽组合物的剂量以及使用该组合物的其他条件可以基于本领域中已知的方法进行确定。

用途

本发明还针对使用具有纤维素分解增强活性的多肽、或其组合物的以下方法。

本发明还涉及用于降解纤维素材料的方法，这些方法包括：在本发明的具有纤维素分解增强活性的多肽的存在下，用一种酶组合物处理该纤维素材料。在一个方面，这些方法进一步包括回收降解的或转化的纤维素材料。该纤维素材料的降解或转化的可溶性产物可以使用本领域中已知的方法与不溶性纤维素材料分离，例如像离心、过滤、或重力沉降。

在另一方面，具有纤维素分解增强活性的多肽对纤维素材料的有效量是约0.01至约50.0mg，例如，约0.01至约40mg、约0.01至约30mg、约0.01至约20mg、约0.01至约10mg、约0.01至约5mg、约0.025至约1.5mg、约0.05至约1.25mg、约0.075至约1.25mg、约0.1至约1.25mg、约0.15至约1.25mg、或约0.25至约1.0mg/g纤维素材料。

在另一方面，具有纤维素分解增强活性的多肽对纤维素分解酶或半纤维素分解酶的有效量是约0.005至约1.0g，例如，约0.01至约1.0g、约0.15至约0.75g、约0.15至约0.5g、约0.1至约0.5g、约0.1至约0.25g、或约0.05至约0.2g/g纤维素分解酶或半纤维素分解酶。

具有纤维素分解酶活性或半纤维素分解酶活性的多肽以及有用于降解纤维素材料的其它蛋白/多肽(在下文中统称为“具有酶活性的多肽”)可以从任何合适的来源衍生或获得，包括细菌、真菌、酵母、植物或哺乳动物来源。术语“获得的”在此还意指该酶可能已在宿主生物体中采用在此所描的方法重组产生，其中重组产生的酶对于宿主生物体是原生的或外源的，或具有修饰的氨基酸序列，例如，具有一个或多个(例如，数个)缺失、插入和/或取代的氨基酸，即重组产生的酶为天然氨基酸序列的突变体和/或片段，或通过本领域已知的核酸改组方法产生的酶。原生酶的含义中涵盖天然变体，而外源酶的含义中涵盖重组(如通过定点诱变或改组)获得的变体。

具有酶活性的多肽可以是一种细菌多肽。例如，该多肽可以是具有酶活性的革兰氏阳性细菌多肽，例如芽孢杆菌属、链球菌属、链霉菌属、葡萄球菌属、肠球菌属、乳酸杆菌属、乳球菌属、梭菌属、土芽孢杆菌属、热解纤维素菌属、热酸菌属、热裂菌属(Thermobifidia)、或海洋芽孢杆菌属多肽，或具有酶活性的革兰氏阴性细菌多肽，例如大肠杆菌、假单孢菌属、沙门氏菌属、弯曲杆菌属、螺杆菌属、黄杆菌属、梭杆菌属、泥杆菌属、奈瑟氏菌属、或脲原体属多肽。

在一方面，该多肽是具有酶活性的嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚硬芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌、或苏云金芽孢杆菌多肽。

在另一方面，该多肽是具有酶活性的似马链球菌、酿脓链球菌、乳房链球菌、或马链球菌兽疫亚种多肽。

在另一方面，该多肽是具有酶活性的不产色链霉菌、阿维链霉菌、天蓝色链霉菌、灰色链霉菌、或变铅青链霉菌多肽。

具有酶活性的多肽还可以是真菌多肽，并且更优选地是一种具有酶活性的酵母多肽，如假丝酵母属、克鲁维酵母属、毕赤酵母属、酵母菌属、裂殖酵母属、或耶氏酵母属多肽；或更优选地是一种具有酶活性的丝状真菌多肽，如枝顶孢霉属、伞菌属、链格孢属、曲霉属、短梗霉属、葡萄座腔菌属(Botryospaeria)、拟蜡菌属、毛喙壳属、金孢子菌属、麦角菌属、旋孢腔菌属、鬼伞属、乳白蚁属、棒囊壳属、隐丛赤壳菌属、隐球菌属、色二孢属、黑耳属、线黑粉酵母属、镰刀菌属、赤霉属、全鞭毛虫属、腐质霉属、耙齿菌属、蘑燕属、小腔球菌属、梨孢菌属、黑果菌属(Melanocarpus)、多孔菌属、毛霉属、毁丝霉属、新美鞭菌属、链孢菌属、拟青霉属、青霉菌属、平革菌属、瘤胃壶菌属、Poitrasia、假黑盘菌属、假披发虫属(Pseudotrichonympha)、根毛霉菌属、裂褶菌属、柱顶孢属、踝节菌属、嗜热子囊菌属、梭孢壳霉属、弯颈霉属、木霉属、长毛盘菌属、轮枝孢属、小包脚菇属、或炭角菌属多肽。

在一个方面，多肽是具有酶活性的卡尔斯伯酵母、酿酒酵母、糖化酵母、道格拉斯酵母、克鲁费酵母、诺地酶母、或卵形酵母多肽。

在另一方面，该多肽是具有酶活性的解纤维枝顶孢霉、棘孢曲霉、泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、嗜角质金孢子菌、卢克诺文思金孢子菌、热带金孢子菌、莫达瑞姆金孢子菌、狭边金孢子菌、租金抱子菌、昆士兰金孢子菌、带纹金孢子菌、杆孢状镰孢、谷类镰抱、库威镰孢、大刀镰孢、禾谷镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、灰腐质霉、特异腐质霉、疏棉状腐质霉、白耙齿菌、米黑毛霉、嗜热毁丝霉、粗糙链孢菌、绳状青霉菌、产紫青霉菌、黄孢平革菌、无色梭孢壳霉、阿波梭孢壳菌、白毛梭孢壳霉、澳洲梭孢壳霉、菲美蒂梭孢壳菌、小孢梭孢壳霉、卵孢梭孢壳霉、秘鲁梭孢壳霉、瘤孢梭孢壳霉、毛梭孢壳霉、耐热梭孢壳、土生梭孢壳霉、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、绿色木霉、或褐孢长毛盘菌多肽。

还可以使用具有酶活性的多肽的化学修饰的或蛋白工程化的突变体。

酶组合物的一种或多种(例如，数种)组分可以是重组组分，即，通过克隆编码该单一组分的DNA序列并且随后用该DNA序列转化细胞并且在宿主中表达产生(参见，例如，WO 91/17243和WO 91/17244)。优选宿主是异源宿主(酶对于宿主而言是异源的)，但是在某些条件下，宿主还可以是同源宿主(酶对于宿主而言是原生的)。还可以通过纯化来自发酵液的这样一种蛋白来制备单组分纤维素分解蛋白。

在一方面，该一种或多种(例如，数种)纤维素分解酶包含商业纤维素分解酶制剂。适用于本发明的商业纤维素分解酶制剂的实例包括：(例如)CTec(诺维信A/S公司)、CTec2(诺维信A/S公司)、CTec3(诺维信A/S公司)、CELLUCLAST^TM(诺维信A/S公司)、NOVOZYM^TM188(诺维信A/S公司)、CELLUZYME^TM(诺维信A/S公司)、CEREFLO^TM(诺维信A/S公司)、以及ULTRAFLO^TM(诺维信A/S公司)、ACCELERASE^TM(杰能科国际公司(Genencor Int.))、LAMINEX^TM(杰能科国际)、SPEZYME^TMCP(杰能科国际)、NL(帝斯曼(DSM))；S/L100(帝斯曼)、ROHAMENT^TM7069W(罗姆股份有限公司( ))、LDI(Dyadic国际有限公司(DyadicInternational,Inc.))、LBR(Dyadic国际有限公司)、或150L(Dyadic国际有限公司)。以从约0.001wt％至约5.0wt％的固体，例如0.025wt％至约4.0wt％的固体、或约0.005wt％至约2.0wt％的固体的有效量添加纤维素酶。

在一个方面中，根据WO 2008/151043中所述的，具有纤维素分解增强活性的多肽GH61可在例如硫酸锰等可溶性活化二价金属阳离子的存在下使用。

在另一方面，具有纤维素分解增强活性的GH61多肽在二氧基化合物、双环化合物、杂环化合物、含氮化合物、醌化合物、含硫化合物、或从预处理的纤维素材料(如预处理的玉米秸杆(PCS))获得的液剂的存在下使用。

二氧基化合物可以包括包含两个或更多个氧原子的任何适合化合物。在一些方面，二氧基化合物包含一个如在此所述的被取代的芳基部分。二氧基化合物可以包含一个或多个(例如若干个)羟基和/或羟基衍生物，而且包括缺乏羟基和羟基衍生物的取代的芳基部分。二氧基化合物的非限制性实例包括邻苯二酚或儿茶酚；咖啡酸；3,4-二羟基苯甲酸；4-叔丁基-5-甲氧基-1,2-苯二醇；连苯三酚；没食子酸；3,4,5-三羟基苯甲酸甲酯；2,3,4-三羟基二苯甲酮；2,6-二甲氧基苯酚；芥子酸；3,5-二羟基苯甲酸；4-氯-1,2-苯二醇；4-硝基-1,2-苯二醇；丹宁酸；没食子酸乙酯；羟乙酸甲酯；二羟基富马酸；2-丁炔-1,4-二醇；克酮酸；1,3-丙二醇；酒石酸；2,4-戊二醇；3-乙氧基-1,2-丙二醇；2,4,4'-三羟基二苯甲酮；顺-2-丁烯-1,4-二醇；3,4-二羟基-3-环丁烯-1,2-二酮；二羟基丙酮；丙烯醛缩醛；4-羟基苯甲酸甲酯；4-羟基苯甲酸；以及3,5-二甲氧基-4-羟基苯甲酸甲酯；或其盐或溶剂化物。

双环化合物可以包括如在此所描述的任何适合的取代的稠合环系统。这些化合物可以包含一个或多个(例如，数个)另外的环，并且除非另外说明，否则不限于具体数目的环。在一方面，双环化合物是一种类黄酮。在另一方面，双环化合物是一种任选取代的异类黄酮。在另一方面，双环化合物是一种任选取代的花色离子(flavylium ion)，如一种任选取代的花色素或任选取代的花色素苷、或其衍生物。双环化合物的非限制性实例包括：表儿茶素、槲皮素、杨梅黄酮、紫衫叶素、堪非醇、桑色素、刺槐素、柚皮素、异鼠李素、芹黄素、矢车菊素、矢车菊素苷、黑豆多酚、花青素鼠李葡糖苷、或其盐或溶剂合物。

杂环化合物可以是如在此所描述的任何适合的化合物，如包含一个杂原子的一种任选取代的芳香族或非芳香族环。在一个方面中，杂环是包含一个任选地被取代的杂环烷基部分或一个任选地被取代的杂芳基部分的一种化合物。在另一个方面，任选地被取代的杂环烷基部分或任选地被取代的杂芳基部分是一个任选地被取代的5元杂环烷基或一个任选地被取代的5元杂芳基部分。在另一个方面，任选地被取代的杂环烷基或任选地被取代的杂芳基部分是一个选自以下的任选地被取代的部分：吡唑基、呋喃基、咪唑基、异噁唑基、噁二唑基、噁唑基、吡咯基、吡啶基、嘧啶基、哒嗪基、噻唑基、三唑基、噻吩基、二氢噻吩并吡唑基、硫茚基、咔唑基、苯并咪唑基、苯并噻吩基、苯并呋喃基、吲哚基、喹啉基、苯并三唑基、苯并噻唑基、苯并噁唑基、苯并咪唑基、异喹啉基、异吲哚基、吖啶基、苯并异唑基、二甲基乙内酰脲、吡嗪基、四氢呋喃基、吡咯啉基、吡咯烷基、吗啉基、吲哚基、二氮呯基、氮呯基、噻呯基、哌啶基以及氧呯基。在另一个方面中，任选地被取代的杂环烷基部分或任选地被取代的杂芳基部分是一个任选地被取代的呋喃基。杂环化合物的非限制性实例包括(1,2-二羟基乙基)-3,4-二羟基呋喃-2(5H)-酮；4-羟基-5-甲基-3-呋喃酮；5-羟基-2(5H)-呋喃酮；[1,2-二羟基乙基]呋喃-2,3,4(5H)-三酮；α-羟基-γ-丁内酯；核糖酸γ-内酯；己糖醛酸(aldohexuronicaldohexuronic acid)γ-内酯；葡萄糖酸δ-内酯；4-羟基香豆素；二氢苯并呋喃；5-(羟基甲基)糠醛；联糠醛；2(5H)-呋喃酮；5,6-二氢-2H-吡喃-2-酮；以及5,6-二氢-4-羟基-6-甲基-2H-吡喃-2-酮；或其盐或溶剂化物。

含氮化合物可以是具有一个或多个氮原子的任何适合化合物。在一个方面中，含氮化合物包含一个胺、亚胺、羟胺或氮氧化物部分。含氮化合物的非限制性实例包括丙酮肟；紫尿酸；吡啶-2-醛肟；2-氨基苯酚；1,2-苯二胺；2,2,6,6-四甲基-1-哌啶基氧基；5,6,7,8-四氢生物蝶呤；6,7-二甲基-5,6,7,8-四氢蝶呤；以及顺丁烯酰胺酸；或其盐或溶剂化物。

醌化合物可以是包含一个如在此所述的醌部分的任何适合化合物。醌化合物的非限制性实例包括：1,4-苯醌、1,4-萘醌、2-羟基-1,4-萘醌、2,3-二甲氧基-5-甲基-1,4-苯醌或辅酶Q₀、2,3,5,6-四甲基-1,4-苯醌或杜醌、1,4-二羟基蒽醌、3-羟基-1-甲基-5,6-吲哚啉二酮或肾上腺素红、4-叔丁基-5-甲氧基-1,2-苯醌、吡咯并喹啉醌、或其盐或溶剂化物。

含硫化合物可以是包括一个或多个硫原子的任何适合化合物。在一个方面中，含硫化合物包含一个选自以下的部分：亚硫酰基、硫醚、亚磺酰基、磺酰基、硫酰胺、磺酰胺、磺酸以及磺酸酯。含硫化合物的非限制性实例包括乙硫醇；2-丙硫醇；2-丙烯-1-硫醇；2-巯基乙磺酸；苯硫酚；苯-1,2-二硫醇；半胱氨酸；蛋氨酸；谷胱甘肽；胱氨酸；或其盐或溶剂化物。

在一方面，以上所描述的这种化合物对纤维素材料的有效量，作为与纤维素的葡糖基单元的摩尔比是约10^-6至约10，例如，约10^-6至约7.5、约10^-6至约5、约10^-6至约2.5、约10^-6至约1、约10^-5至约1、约10^-5至约10^-1、约10^-4至约10^-1、约10^-3至约10^-1、或约10^-3至约10^-2。在另一方面，以上所描述的这种化合物的有效量是约0.1μM至约1M，例如，约0.5μM至约0.75M、约0.75μM至约0.5M、约1μM至约0.25M、约1μM至约0.1M、约5μM至约50mM、约10μM至约25mM、约50μM至约25mM、约10μM至约10mM、约5μM至约5mM、或约0.1mM至约1mM。

术语“液剂(liquor)”意指在如在此所描述的条件下，由处理浆料中的木质纤维素和/或半纤维素材料、或其单糖(例如木糖、阿拉伯糖、甘露糖等)所产生的溶液相(水相、有机相抑或其组合)、以及其可溶性内容物。用于GH61多肽的纤维素分解增强的液剂可以通过，任选在催化剂(例如酸)的存在下、任选在有机溶剂的存在下、并且任选与物理破坏一种木质纤维素或半纤维素材料(或原料)组合，通过施加热和/或压力来对该材料进行处理，并且然后将溶液与残余固体分离来产生。在由纤维素酶制剂对纤维素底物的水解过程中，从液体与GH61多肽的组合中可得到纤维素分解增强的程度是由这类条件决定的。可以使用本领域的标准方法，如过滤、沉淀或离心，而将液体与经过处理的材料进行分离。

在一个方面，该液剂对纤维素的有效量为约10^-6至约10g每g纤维素，例如，约10^-6至约7.5g、约10^-6至约5g、约10^-6至约2.5g、约10^-6至约1g、约10^-5至约1g、约10^-5至约10^-1g、约10^-4至约10^-1g、约10^-3至约10^-1g、或约10^-3至约10^-2g每g纤维素。

本发明还可通过以下实施例来说明：

1.一种选自下组的具有纤维素分解增强活性的分离多肽，该组由以下各项组成：

(a)一种多肽，该多肽与SEQ ID NO:2的成熟多肽具有至少70％、至少75％、至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％、或100％的序列一致性；与SEQ ID NO:4的成熟多肽具有至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％、或100％的序列一致性；与SEQ ID NO:6的成熟多肽具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％、或100％的序列一致性；与SEQ ID NO:8的成熟多肽具有至少75％、至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％、或100％的序列一致性；

(b)一种多肽，该多肽由在中-高严谨度条件、高严谨度条件或非常高严谨度条件下与(i)SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5或SEQ ID NO:7的成熟多肽编码序列、(ii)其cDNA序列、或(iii)(i)或(ii)的全长互补体杂交的一种多核苷酸编码；

(c)一种多肽，该多肽由以下的一种多核苷酸编码，该多核苷酸与SEQ ID NO:1的成熟多肽编码序列或其cDNA序列具有至少70％、至少75％、至少80％、至少85％、例如90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％、或100％的序列一致性；与SEQ ID NO:3的成熟多肽编码序列或其cDNA序列具有至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％的序列一致性；与SEQ ID NO:5的成熟多肽编码序列或其cDNA序列具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％的序列一致性；与SEQ ID NO:7的成熟多肽编码序列或其cDNA序列具有至少75％、至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％的序列一致性；

(d)SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6或SEQ ID NO:8的成熟多肽的一种变体，该变体在一个或多个位置处包括取代、缺失、和/或插入；以及

2.如实施例1所述的多肽，该多肽包括SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8，或者SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6或SEQ ID NO:8的成熟多肽或由其组成。

3.如实施例2所述的多肽，其中该成熟多肽是SEQ ID NO:2的氨基酸20至319；SEQ ID NO:4的氨基酸24至347；SEQ ID NO:6的氨基酸20至240或SEQ ID NO:8的氨基酸19至355。

4.如实施例1所述的多肽，该多肽是SEQ ID NO:2的成熟多肽、SEQ ID NO:4的成熟多肽、SEQ ID NO:6的成熟多肽或SEQ ID NO:8的成熟多肽的一种变体，该变体在一个或多个(例如若干个)位置处包括取代、缺失、和/或插入。

5.如实施例1所述的多肽，该多肽是SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6或SEQ ID NO:8的一个片段，其中该片段具有纤维素分解增强活性。

6.一种组合物，该组合物包括如实施例1-5中任一项所述的多肽。

7.如实施例6所述的组合物，该组合物包括选自以下各项的一种或多种另外的酶：纤维素酶、半纤维素酶、苹果菌素、酯酶、漆酶、木质素分解酶、果胶酶、过氧化物酶、蛋白酶、以及膨胀蛋白。

8.如实施例6或7所述的组合物用于降解纤维素的用途。

9.如实施例8所述的用途，其中该纤维素是木质纤维素材料的部分。

10.如实施例9所述的用途，其中该木质纤维素材料选自草本材料，农业残余物例如玉米秸秆、玉米纤维、橙皮、稻秸或麦秸、柳枝稷或甘蔗渣，林业残余物，城市固体废物，废纸，以及纸浆及造纸厂残余物。

11.如实施例10所述的用途，其中该木质纤维素材料是经预处理的。

12.如实施例11所述的用途，其中该预处理的木质纤维素材料是经预处理的玉米秸秆或牛皮纸浆。

13.如实施例8-11所述的用途，其中该多肽是在二氧基化合物、双环化合物、杂环化合物、含氮化合物、醌化合物、含硫化合物、或从预处理的纤维素材料(如预处理的玉米秸杆(PCS))获得的液剂的存在下使用。

14.在用于生产发酵产物的工艺中的如实施例8至13中任一项所述的用途。

15.如实施例14所述的用途，其中该发酵产物是乙醇。

16.一种分离的多核苷酸，该多核苷酸编码如实施例1-5中任一项所述的多肽。

17.一种核酸构建体或表达载体，该核酸构建体或表达载体包括如实施例16所述的多核苷酸，该多核苷酸可操作地连接至指导该多肽在一个表达宿主内的产生的一个或多个控制序列。

18.一种重组宿主细胞，该重组宿主细胞包括如实施例16所述的多核苷酸，该多核苷酸可操作地连接至指导该多肽的产生的一个或多个控制序列。

19.如实施例18所述的重组宿主细胞，选自细菌、真菌、哺乳动物、昆虫或植物细胞。

20.如实施例19所述的重组宿主细胞，其中该宿主细胞是真菌细胞，选自枝顶孢霉属、曲霉属、短梗霉属、烟管霉属(Bjerkandera)、拟腊菌属、金孢子菌属、鬼伞属、革盖菌属(Coriolus)、隐球菌属、线黑粉菌科(Filibasidium)、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新美鞭菌属、链孢菌属、拟青霉属、青霉属、平革菌属、射脉菌属(Phlebia)、瘤胃壶菌属、侧耳属(Pleurotus)、裂褶菌属、踝节菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属(Trametes)、或木霉属细胞。

21.如实施例20所述的重组宿主细胞，选自泡盛曲霉、臭曲霉、烟曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、黑刺烟管菌(Bjerkanderaadusta)、干拟蜡菌(Ceriporiopsis aneirina)、卡内基拟蜡菌(Ceriporiopsiscaregiea)、浅黄拟蜡孔菌(Ceriporiopsis gilvescens)、潘诺希塔拟蜡菌(Ceriporiopsis pannocinta)、环带拟蜡菌(Ceriporiopsis rivulosa)、微红拟蜡菌(Ceriporiopsis subrufa)、虫拟蜡菌(Ceriporiopsissubvermispora)、狭边金孢子菌(Chrysosporium inops)、嗜角质金孢子菌、拉克淖金孢子菌(Chrysosporium lucknowense)、粪状金孢子菌(Chrysosporium merdarium)、租金孢子菌、女王杜香金孢子菌(Chrysosporium queenslandicum)、热带金孢子菌、褐薄金孢子菌(Chrysosporium zonatum)、灰盖鬼伞(Coprinus cinereus)、毛革盖菌(Coriolus hirsutus)、杆孢状镰孢、谷类镰孢、库威镰孢、大刀镰孢、禾谷镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、特异腐质霉、疏棉状腐质霉、米黑毛霉、嗜热毁丝霉、粗糙链孢菌、产紫青霉、黄孢平革菌(Phanerochaetechrysosporium)、射脉菌(Phlebia radiata)、刺芹侧耳(Pleurotus eryngii)、土生梭孢壳霉、长域毛栓菌(Trametes villosa)、变色栓菌(Trametesversicolor)、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、或绿色木霉细胞。

22.一种产生如实施例1-5中任一项所述的多肽的方法，该方法包括：

(a)培养一种细胞，该细胞在其野生型形式中在有益于产生该多肽的条件下产生该多肽；并且

(b)回收该多肽。

23.一种产生具有纤维素分解增强活性的多肽的方法，该方法包括：

(a)在有益于产生该多肽的条件下培养如实施例18-21所述的宿主细胞；并且

(b)回收该多肽。

通过以下实例进一步描述本发明，这些实例不应当解释为限制本发明的范围。

实例

菌株

将真菌绒柄香菇的菌株用作此项目的供体生物。该菌株与在中国分离的环境样品分离。米曲霉MT3568菌株被用于对具纤维素分解增强活性的多肽进行编码的绒柄香菇基因的表达。米曲霉MT3568是米曲霉JaL355的amdS(乙酰胺酶)破坏的基因衍生物(WO 2002/40694)，其中通过破坏米曲霉乙酰胺酶(amdS)基因修复pyrG营养缺陷型。

培养基和溶液

YP+2％葡萄糖培养基由1％酵母提取物、2％蛋白胨以及2％葡萄糖构成。

YP+2％麦芽糊精培养基由1％酵母提取物、2％蛋白胨以及2％麦芽糊精构成。

PDA琼脂板是由马铃薯浸出液(马铃薯浸出液是通过将300g切片的(经过洗涤但未削皮)的马铃薯在水中煮沸30分钟，并且然后将该培养液倾析或滤过粗滤布而制成)构成的。然后添加蒸馏水，直到悬浮液的总体积为一升，随后添加20g的右旋糖和20g的琼脂粉。该培养基通过在15psi下高压杀菌15分钟来进行灭菌(细菌学分析手册，第8版，修订A，1998)。

LB板由10g的细菌用胰蛋白胨(Bacto-Tryptone)、5g的酵母提取物、10g的氯化钠、15g的细菌用琼脂及补足到1升的去离子水构成。

LB培养基是由10g的细菌用胰蛋白胨、5g的酵母提取物及10g的氯化钠，以及补足到1升的去离子水构成的。

COVE蔗糖板由342g的蔗糖、20g的琼脂粉、20ml的COVE盐溶液及补足到1升的去离子水组成。该培养基通过在15psi下高压杀菌15分钟来进行灭菌(细菌学分析手册，第8版，修订A，1998)。将该培养基冷却至60℃并且添加10mM的乙酰胺、15mM的CsCl、曲通X-100(50μl/500ml)。

COVE盐溶液由26g MgSO₄·7H₂O、26g的KCL、26g的KH₂PO₄、50ml的COVE痕量金属溶液、以及加至1升的去离子水组成。

COVE痕量金属溶液由0.04g的Na₂B₄O₇·10H₂O、0.4g的CuSO₄·5H₂O、1.2g的FeSO₄·7H₂O、0.7g的MnSO₄·H₂O、0.8g的Na₂MoO₄·2H₂O、10g的ZnSO₄·7H₂O及补足到1升的去离子水组成。

实例1：绒柄香菇基因组DNA提取

为了获得基因组DNA，将绒柄香菇在PDA琼脂板上通过在26℃培养7天进行增殖。使用从PDA板收获的孢子接种在部分挡板的摇瓶中的25ml的YP+2％葡萄糖培养基里并且在26℃下孵育4天，同时以200rpm搅拌。

根据改进的DNeasy Plant Maxi试剂盒方案(凯杰丹麦公司(QiagenDanmark)，哥本哈根，丹麦)分离基因组DNA。通过在14,000x g下离心2分钟收获来自以上培养物的真菌材料。除去上清液并且将0.5g球粒用石英砂在液氮中冷冻并且将其在预冷的研钵中研磨为细粉。将该粉末转移至15ml离心管中，并添加5ml缓冲液AP1(预热至65℃)和10μl的RNA酶A母液(100mg/ml)，随后进行剧烈涡旋。在用常规反相(regular inverting)的试管在65℃下孵育10分钟后，通过温和混合向裂解液中添加1.8ml缓冲液AP2，随后在冰上孵育10min。然后将裂解液在室温在3000x g下离心5分钟，并且将上清液倾析进放置于50ml收集管中的QIAshredder大核酸纯化柱(maxi spin column)中。随后将其在室温在3000x g下离心5分钟。将贯流(flow-through)转移至一个新的50ml试管中并且添加1.5体积的缓冲液AP3/E，随后进行涡旋。将15ml的样品转移至放置于50ml收集管中的DNeasy大核酸纯化柱中并且在室温在3000x g下离心5分钟。将贯流丢弃并且向放置于50ml收集管中的DNeasy大核酸纯化柱中添加12ml的缓冲液AW，并且在室温在3000x g下离心10分钟。在丢弃贯流后，重复离心以处置剩余的醇。将DNeasy大核酸纯化柱转移至一个新的50ml试管中并且添加0.5ml缓冲液AE(预热至70℃)。在室温下孵育5分钟后，通过在室温在3000x g下离心5分钟对样品进行洗脱。用另外0.5ml的缓冲液AE重复洗脱并且将洗脱物合并。通过UV分光光度计在260nm测量收获的DNA的浓度。

实例2：绒柄香菇的DNA序列信息的来源

.使2ug的如在实例1中所述分离的染色体DNA经受部分鸟枪基因组测序，即一种在瑞士的FASTERIS SA可商购的服务。针对具有GH61糖基水解酶结构域的蛋白质序列分析基因组序列(根据以上的CAZY基因)。从该序列序列信息(SEQ ID NO:1、3、5、及7)鉴定四种基因和相应的蛋白质序列并且针对进一步的调查做出选择。

实例3：包含各自编码一种家族GH61多肽的绒柄香菇基因组序列的米曲霉表达载体的构建

针对这四种GH61鉴定的GH61基因中的每个设计两个合成寡核苷酸引物，从而从实例1中制备的基因组DNA经PCR扩增绒柄香菇GH61基因。使用IN-FUSION^TM克隆试剂盒(BD生物科学公司(BDBiosciences)，帕洛阿尔托(Palo Alto)，加利福尼亚州，美国)将片段直接克隆进表达载体pDau109中(WO 2005/042735)。

使用以下引物用于PCR扩增：

针对SEQ ID NO:1的编码序列的扩增：

引物F-1：

5’-acacaactggggatccaccATGTTGTCTCTCTCCGTCGCTA-3’(SEQID NO.9)

引物R-1：

5’-ccctctagatctcgagCCTTGCGGCAATCGGGATACT-3’(SEQ IDNO:10)

针对SEQ ID NO:3的编码序列的扩增：

引物F-3：

5’-acacaactggggatccaccATGAAGACTTTCTCTGCTATCGTTCTCT-3’(SEQ ID NO:11)

引物R-3：

5’-ccctctagatctcgagGAGGGGAGAGGGGAAGA-3’(SEQ IDNO.12)

针对SEQ ID NO:5的编码序列的扩增：

引物F-5：

5’-acacaactggggatccaccATGAAAACTTGGGCCGTGCTA-3’(SEQID NO.13)

引物R-5：

5’-ccctctagatctcgagATCGCTGGCTCAGGGCAAT-3’(SEQ IDNO.14)

针对SEQ ID NO:7的编码序列的扩增：

引物F-7：

5’-acacaactggggatccaccATGTTTGGCGCACTCTTGGTCT-3’(SEQID NO.15)

引物R-7：

5’-ccctctagatctcgagCTGTCGCACTTCTCTGCTGCA-3’(SEQ IDNO.16)

大写字母代表基因序列。加下划线的序列与pDau109的插入位点是同源的。

将一个MJ研究PTC-200DNA引擎(engine)(MJ研究公司，沃尔瑟姆(Waltham)，马萨诸塞州，美国)用于进行该PCR反应。使用高保真PCR试剂盒(High-Fidelity PCR Kit)(FINNZYMES Oy公司，艾斯堡，芬兰)用于PCR扩增。PCR反应由5μl的5X HF缓冲液(Finnzymes Oy公司，艾斯堡，芬兰)、0.5μl的dNTPs(10mM)、0.5μl的DNA聚合酶(0.2单位/μl)(Finnzymes Oy公司，艾斯堡，芬兰)、5μl的各引物、0.5μl的绒柄香菇基因组DNA(100ng/μl)、以及16.5μl的去离子水组成，总体积为25μl。PCR条件为：1个循环，在95℃持续2分钟。35个循环，每个在98℃持续10秒，60℃持续30秒，以及在72℃持续2分钟；以及1个循环，在72℃持续10分钟。然后将样品保持在12℃，直至从PCR仪中移出。

使用40mM Tris碱、20mM乙酸钠、1mM EDTA二钠(TAE)缓冲液，通过1.0％琼脂糖凝胶电泳分离反应产物，其中从凝胶切下大约1200-1400bp产物条带，并且根据厂商说明书，使用illustraPCRDNA和凝胶带纯化试剂盒(GE医疗集团生命科学部(GE HealthcareLife Sciences)，布隆德比，丹麦)进行纯化。然后使用IN-FUSION^TM克隆试剂盒，将片段克隆到Bam HI和Xho I消化的pDau109中，分别生成质粒pGH61-1、pGH61-3、pGH61-5以及pGH61-7。将这些基因克隆到Bam HI-Xho I消化的pDau109中，导致绒柄香菇GH61基因在NA2-tpi双启动子的控制下进行转录。NA2-tpi是来自编码黑曲霉中性α-淀粉酶的基因的修饰的启动子，其中已经用来自编码构巢曲霉磷酸丙糖异构酶的基因的未翻译的前导子替换了未翻译的前导子。

根据产生四个GH61构建体的IN-FUSION^TM克隆试剂盒说明进行克隆方案。根据厂商的方案将处理的质粒和插入片段转化进OneTOP10F′化学感受态大肠杆菌细胞(英杰公司(Invitrogen)，卡尔斯巴德，加利福尼亚州，美国)中，并且将其铺板在补充有0.1mg的氨比西林/ml的LB板上。在37℃下孵育过夜后，看到菌落在LB氨比西林板上在选择下生长。将每次转化的菌落在补充有0.1mg的氨比西林/ml的LB培养基中进行培养并且根据厂商的方案，用QIAPREP SpinMiniprep试剂盒(凯杰公司，巴伦西亚，加利福尼亚州，美国)分离质粒。

用载体引物和基因特异性引物对分离的质粒进行测序以便确定不含PCR错误的代表性质粒表达克隆，并且将不含错误的质粒针对这些多肽的表达进行选择。

实例4：编码四种GH61多肽的绒柄香菇基因组序列的表征

用应用生物系统公司3700型全自动DNA测序仪(AppliedBiosystems Model 3700Automated DNA Sequencer)，使用版本3.1BIG-DYE^TM终止子化学(应用生物系统公司(Applied Biosystems,Inc.)，福斯特城，加州，美国)和引物步移策略进行绒柄香菇GH61基因组克隆的DNA测序。仔细检查核苷酸序列数据的质量，并且借助PHRED/PHRAP软件(华盛顿大学，西雅图，华盛顿州，美国)将所有序列互相比较。获得的序列与来自基因组测序的序列相同(参见实例2)。

绒柄香菇GH61-1基因的核苷酸序列和推导的氨基酸序列分别在SEQ ID NO:1和SEQ ID NO:2中示出；绒柄香菇GH61-3基因的核苷酸序列和推导的氨基酸序列分别在SEQ ID NO:3和SEQ ID NO:4中示出；绒柄香菇GH61-5基因的核苷酸序列和推导的氨基酸序列分别在SEQ ID NO:5和SEQ ID NO:6中示出；并且绒柄香菇GH61-7基因的核苷酸序列和推导的氨基酸序列分别在SEQ ID NO:7和SEQ ID NO:8中示出。

GH61-1的编码序列是960bp(包括终止密码子)，并且被55bp(核苷酸279至333)、55bp(核苷酸444至499)、49bp(核苷酸510至558)、52bp(核苷酸706至757)、54bp(核苷酸811至864)、以及59bp(核苷酸930至988)的内含子中断。编码的预测蛋白质是319个氨基酸。使用SignalP程序(尼尔森(Nielsen)等人，1997，蛋白质工程学10:1-6)预测出19个残基的信号肽。预测的成熟蛋白包含300个氨基酸。

GH61-3的编码序列是1144bp(包括终止密码子)，并且被53bp(核苷酸240至292)、74bp(核苷酸454至527)、以及64bp(核苷酸676至739)的内含子中断。编码的预测蛋白质是347个氨基酸。使用SignalP程序(尼尔森(Nielsen)等人，1997，蛋白质工程学10:1-6)预测出23个残基的信号肽。预测的成熟蛋白包含324个氨基酸。

GH61-5的编码序列是723bp(包括终止密码子)，并且被63bp(核苷酸351至413)、60bp(核苷酸480至539)、74bp(核苷酸715至788)、68bp(核苷酸808至875)、66bp(核苷酸931至996)、66bp(核苷酸1133至1198)、52bp(核苷酸1240至1291)、58bp(核苷酸1371至1428)、以及75bp(核苷酸1486至1560)的内含子中断。编码的预测蛋白质是240个氨基酸。使用SignalP程序(尼尔森(Nielsen)等人，1997，蛋白质工程学10:1-6)预测出19个残基的信号肽。预测的成熟蛋白包含221个氨基酸。

GH61-7的编码序列是1068bp(包括终止密码子)，并且被54bp(核苷酸225至278)、55bp(核苷酸440至494)、64bp(核苷酸714至777)、以及66bp(核苷酸937至1002)的内含子中断。编码的预测蛋白质是355个氨基酸。使用SignalP程序(尼尔森(Nielsen)等人，1997，蛋白质工程学10:1-6)预测出18个残基的信号肽。预测的成熟蛋白包含337个氨基酸。

实例5：绒柄香菇GH61基因在米曲霉MT3568中的表达

针对进一步的工作，对包括SEQ ID NO:1的GH61-1基因、SEQ IDNO:3的GH61-3基因、SEQ ID NO:5的GH61-5基因和SEQ ID NO:7的GH61-7基因的无错误克隆进行选择。然后如实例3所述分离质粒DNA。将纯化的质粒DNA转化进米曲霉MT3568中。根据欧洲专利EP 0238023，第14-15页的方法来制备米曲霉MT3568原生质体。将源自于米曲霉MT3568用四个质粒进行转化的转化体接种到96微量滴定深孔板(Nunc A/S，罗斯基勒，丹麦)的独立的孔中，每个孔包含750μl的YP+2％葡萄糖培养基或750μl YP+2％麦芽糊精培养基。将该板用Nunc预锉刻痕(pre scored)的乙烯基密封带(赛默飞世尔科技公司(Thermo Fisher Scientific)，罗斯基勒，丹麦)覆盖，并在26℃静置孵育4天。还将这些转化体划到COVE蔗糖(+10mM乙酰胺+15mMCsCl+X-100(50μl/500ml))上。将这些板在37℃孵育，并重复此选择程序以使这些转化体稳定化。

若干米曲霉转化体产生重组的具有SEQ ID NO:2的GH61-1多肽、SEQ ID NO:4的GH61-3多肽、SEQ ID NO:6的GH61-5多肽或SEQ IDNO:8的GH61-7多肽，如通过SDS PAGE分析判断的。

实例6：SEQ ID NO:2的GH61-1多肽的纯化。

将来自实例5的产生SEQ ID NO:2的重组GH61-1多肽的米曲霉转化体接种于2L YP+2％葡萄糖培养基中，并在37℃下孵育2天。将菌丝体通过过滤去除，并收集肉汤用于蛋白的纯化。

向大约1844ml肉汤中添加硫酸铵至1.0M，并将pH调节到7.5。将该混合物aw通过华特门(Whatmann)GF/D过滤器过滤，并装载在50mm直径167ml丁基-ToyoPearl 650(东曹生物科学(TosohBiosciences)，斯图加特(Stuttgart)，德国)柱上，该柱之前已在缓冲液A(25mM Tris.HCl，1.0M硫酸铵，pH 7.5)中平衡。将该柱在缓冲液A中进行洗涤并用0-100％缓冲液B(25mM Tris.HCl pH 7.5)的梯度、随后0-20％乙醇的梯度洗脱，并且收集洗脱物的部分。

根据制造商说明，使所有收集的部分的样品在SDS-PAGE胶(1mm，4％-20％Tris-甘氨酸，英杰公司(Invitrogen))上跑胶，并且将包含预期大小的条带的部分合并，并且使用Vivaspin 20，离心浓缩机(维瓦产品(Vivaproducts)，利特尔顿(Littleton)，美国)浓缩到大约7ml的体积。

将浓缩物用Milli-Q水稀释到低于5的传导率(大约90ml)，并装载到之前在50mM NaOAc，pH 5.0中平衡的SOURCE 15S柱(GE医疗公司(GE Healthcare))上。将该柱以相同的缓冲液洗涤，并用0-50％50mM NaOAc+1M NaCl，pH 5.0的梯度在3ml/min的流动下经60分钟洗脱，并收集6ml部分。根据制造商说明，将该洗涤溶液的样品和所有部分的样品施加到SDS-PAGE胶(1mm，4％-20％Tris-甘氨酸，英杰公司(Invitrogen))上，并且汇集具有预期大小的条带的所有部分。根据制造商说明，使用Vivaspin 20离心浓缩机(维瓦产品，利特尔顿，美国)将体积减少到2ml，并在20mM MES+125M NaCl，pH 6.0中稀释到5.5ml，并且使用HiLoad 26/60Superdex 75柱(GE医疗生物科学公司(GE Healthcare Bio-Sciences AB)，乌普萨拉(Uppsala)，瑞典)施加至尺寸排阻色谱中。

将该柱在20mM MES+125mM NaCl，pH 6.0中和3ml/min的流动下进行洗脱，收集6ml部分。如上所述，通过SDS-PAGE凝胶电泳来分析每个部分的样品。若干部分包含具有预期大小(大约30kDa)的条带，并汇集这些部分。其他部分包含具有大约双倍大小的条带，并也汇集这些部分。

通过EDMAN方法通过蛋白质测序进一步分析这两个合并的制品，并且证实，两个制品都包含具有SEQ ID NO:2序列的多肽。

实例7：SEQ ID NO:4的GH61-3多肽、SEQ ID NO:6的GH61-5多肽和SEQ ID NO:8的GH61-7多肽的纯化。

基本如在实例6中所述，将都来自于实例5的产生SEQ ID NO:4的重组GH61-3多肽、SEQ ID NO:6的重组GH61-5多肽和SEQ ID NO:8的重组GH61-7多肽的米曲霉转化体进行培养，并且基本如实例6中所述对这些重组的多肽进行纯化。

实例8：确定这些纯化的多肽的活性。

使用亚甲基蓝测定确定这些纯化的多肽的活性，已发现该活性对应于纤维分解增强活性。使用来自Spectra Max M2(分子设备(Molecular Devices)，森尼韦尔(Sunnyvale)，加利福尼亚州，美国)的酶标仪在96孔板中进行该活性测定。将该酶标仪的温度设定在37℃。该反应混合物由50mM MOPS/NaOH、20μM CuSO₄、0.1mM亚甲基蓝、4mM连苯三酚pH 7.0缓冲液以及实例6和7的纯化的多肽组成。通过添加连苯三酚起始反应并在400nm进行监测。对照包括所有这些组分，除了该GH61多肽。在15分钟反应之后，在400nm进行吸光度读数并通过减去对照的吸光度来校正。

测量了以下活性：

实例9：特异腐质霉纤维二糖脱氢酶多肽的制备

基本如在徐(Xu)等人(酶和微生物技术(Enzyme and MicrobialTechnology)28(2001)744-753)中所述，重组地制备特异腐质霉纤维二糖脱氢酶(CDH)多肽。

通过超滤作用，使用10kDa膜(GE医疗公司，皮斯卡塔韦，新泽西州，美国)，首先将该重组产生的特异腐质酶CDH多肽从60ml浓缩到7ml，缓冲液更换到20mM Tris-HCl加上150mMNaCl pH 8.0，并且然后使用320ml75柱(GE医疗公司，皮斯卡塔韦，新泽西州，美国)(用20mM Tris-HCl加上150mM NaClpH 8.0以1ml/分钟的流速平衡)进行纯化。收集5ml的部分，并基于SDS-PAGE进行汇集。

使用总氨基酸定量或微板BCA^TM蛋白质测定试剂盒(赛默飞世尔科技公司，罗克福德(Rockford)，伊利诺伊州，美国))来测定蛋白质浓度，其中使用牛血清白蛋白作为蛋白质标准品。

实例10：用GH61多肽修饰纤维素材料的方案

用GH61多肽对纤维素材料进行的修饰是根据下述的方案进行的。

将微晶纤维素(PH101；西格玛-奥瑞奇化学集团(Sigma-Aldrich Chemical Co.)，圣路易斯，密苏里州，美国)和ClO₂-漂白的桉树牛皮纸浆(以～55％水分和～20％半纤维素洗涤和烘干)用作纤维素材料的来源。

对这些纤维素制品的修饰是使用热压处理过的1.7ml塑料的加盖的微量离心管根据以下方案进行的。首先，将这些纤维素制品在1ml的总反应体积(具有20mg的或漂白的纸浆/ml 50mM乙酸钠pH 5.0缓冲液)中悬浮2天。在倾析该溶液之后，将该水合的和缓冲液更换的纤维素制品在1ml的总反应体积(具有或不具有绒柄香菇GH61多肽(用等摩尔的硫酸铜(II)(CuSO₄)在4℃预孵育1天)的50mM乙酸钠pH 5.0缓冲液)中以1mg/g纤维素制品单独或伴随1mM的硫酸锰(II)(MnSO₄)以及5mM抗坏血酸盐或伴随1mg的CDH/g纤维素制品重悬浮。将这些试管加盖，彻底混合，并在50℃在IsotempPlus孵育器(赛默飞世尔科技公司，沃尔瑟姆，马萨诸塞州，美国)中孵育94小时。所有实验一式两份执行。

实例11：通过用GH61多肽处理-二喹啉酸(BCA)测定评价纤维素材料的修饰的方法

通过用GH61多肽处理对纤维素材料进行的修饰是根据下述的程序进行评价的。

对于实例10中所述的1ml方案，将用该GH61多肽处理的纤维素样品冷却至23℃并在20000x g离心2分钟。如上所述，将所得到的球粒或纸浆纤维针对醛糖基(aldosyl)或醛基(还原端)含量进行分析。将这些球粒或纤维进行洗涤并在～1.6ml水中倾析四次，通过Milli-Q装置(密理博(Millipore)，比勒利卡(Billerica)马萨诸塞州，美国)纯化，随后进行离心。然后，将经洗涤的球粒或纤维与0.95ml的BCA(二喹啉酸)蛋白测定工作液(通过混合50:1BCA试剂A和B制备)(赛默飞世尔科技公司，沃尔瑟姆，马萨诸塞州，美国)或0.95ml的BCA溶液加上22μl的水进行混合，并在Isotemp Plus孵育器中在50℃孵育1小时，然后在23℃孵育16小时。将45μl的0至5mM葡萄糖标准品和0.955ml的BCA蛋白测定工作液的混合物平行孵育。在孵育之后，将这些混合物冷却至23℃，在20000x g下离心，并从不溶材料中分离上清液。将这些上清液再次在20000x g下离心以沉积任何残余的材料。将一百μl体积的上清液转移到96孔微板中，并使用340PC 384酶标仪(分子设备公司，森尼韦尔，加利福尼亚州，美国)测量562nm处吸光度，以量化该醛糖基/醛-反应的BCA测定产物。当该吸光度是1.5或更高时，将该上清液用未反应但孵育的BCA蛋白测定工作液对照进行稀释，以使得吸光度近于1。使用来自葡萄糖标准品的数据来量化等效的醛糖基/醛基。

实例12：通过BCA测定进行的微晶纤维素：醛糖基/醛基检测的绒柄香菇GH61-3多肽处理的影响

使用与实例11中所述的相同的实验条件和程序，通过BCA测定确定绒柄香菇GH61-3多肽对的修饰的影响。

在用绒柄香菇GH61-3多肽、抗坏血酸盐、MnSO₄、以及缓冲液孵育之后，从20g/L反应的测量0.66±0.06mM葡萄糖-等效的醛糖基/醛基。在用抗坏血酸盐、MnSO₄、以及缓冲液孵育之后，从20g/L反应的测量0.58±0.04mM葡萄糖-等效的醛糖基/醛基。在用缓冲液孵育之后，从20g/L反应的测量0.48±0.01mM葡萄糖-等效的醛糖基/醛基。因此，与无GH61-3多肽的对照相比，该GH61多肽处理多产生大约15％±12％以上的醛糖基/醛基。与缓冲液孵育的相比，该GH61-3多肽处理和无GH61-3多肽的对照在中分别多产生36％±12％和19％±8％的醛糖基/醛基。

在用绒柄香菇GH61-3多肽、特异腐质霉CDH多肽、以及缓冲液孵育之后，从反应的20g/L测量0.53±0.02mM葡萄糖-等效的醛糖基/醛基。在用特异腐质霉CDH多肽、以及缓冲液孵育之后，从20g/L测量0.62±0.04mM葡萄糖-等效的醛糖基/醛基。在用缓冲液孵育之后，从20g/L测量0.48±0.01mM葡萄糖-等效的醛糖基/醛基。因此，与无GH61-3多肽的对照相比，该GH61-3多肽处理少产生15％±7％的醛糖基/醛基，并且与缓冲液孵育的相比，多产生10％±5％的醛糖基/醛基。

实例13：通过BCA测定进行的漂白的桉树牛皮纸浆：醛糖基/醛基检测的绒柄香菇GH61-3多肽处理的影响

使用与实例11中所述的相同的实验条件和程序，通过BCA测定确定绒柄香菇GH61-3多肽对漂白的牛皮纸浆的修饰的影响。

在用绒柄香菇GH61-3多肽、抗坏血酸盐、MnSO₄、以及缓冲液孵育之后，从20g/L反应的纸浆测量0.240±0.005mM葡萄糖-等效的醛糖基/醛基。在用抗坏血酸盐、MnSO4、以及缓冲液孵育之后，从20g/L反应的纸浆测量0.229±0.008mM葡萄糖-等效的醛糖基/醛基。在用缓冲液孵育之后，从20g/L反应的纸浆测量0.059±0.000mM葡萄糖-等效的醛糖基/醛基。因此，与无GH61-3多肽的对照相比，该GH61多肽处理多产生大约4.9％±4.2％的醛糖基/醛基。与缓冲液孵育的纸浆相比，该GH61-3多肽处理和无GH61-3多肽的对照在纸浆中分别多产生304％±8％和286％±14％的醛糖基/醛基。

在用绒柄香菇GH61-3多肽、特异腐质霉CDH多肽、以及缓冲液孵育之后，从反应的20g/L纸浆测量0.248±0.011mM葡萄糖-等效的醛糖基/醛基。在用特异腐质霉CDH多肽、以及缓冲液孵育之后，从20g/L反应的纸浆测量0.148±0.006mM葡萄糖-等效的醛糖基/醛基。在用缓冲液孵育之后，从20g/L反应的纸浆测量0.059±0.000mM葡萄糖-等效的醛糖基/醛基。因此，与无GH61-3多肽的对照相比，该GH61-3多肽处理多产生68％±9％的醛糖基/醛基，并且与缓冲液孵育的纸浆相比，多产生319％±19％的醛糖基/醛基。

Claims

(c)一种多肽，该多肽由以下的一种多核苷酸编码，该多核苷酸与SEQ ID NO:1的成熟多肽编码序列或其cDNA序列具有至少70％、至少75％、至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％、或100％的序列一致性；与SEQ ID NO:3的成熟多肽编码序列或其cDNA序列具有至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％的序列一致性；与SEQ ID NO:5的成熟多肽编码序列或其cDNA序列具有至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％的序列一致性；与SEQ ID NO:7的成熟多肽编码序列或其cDNA序列具有至少75％、至少80％、至少85％、至少90％、至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％、至少99％或100％的序列一致性；

2.如权利要求1所述的多肽，该多肽包括SEQ ID NO:2、SEQ IDNO:4、SEQ ID NO:6、SEQ ID NO:8，或者SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6或SEQ ID NO:8的成熟多肽或由其组成。

3.如权利要求2所述的多肽，其中该成熟多肽是SEQ ID NO:2的氨基酸20至319；SEQ ID NO:4的氨基酸24至347；SEQ ID NO:6的氨基酸20至240或SEQ ID NO:8的氨基酸19至355。

4.如权利要求1所述的多肽，该多肽是SEQ ID NO:2的成熟多肽、SEQ ID NO:4的成熟多肽、SEQ ID NO:6的成熟多肽或SEQ ID NO:8的成熟多肽的一种变体，该变体在一个或多个(例如若干个)位置处包括取代、缺失、和/或插入。

5.如权利要求1所述的多肽，该多肽是SEQ ID NO:2、SEQ ID NO:4、SEQ ID NO:6或SEQ ID NO:8的一个片段，其中该片段具有纤维素分解增强活性。

6.一种包括如权利要求1-5中任一项所述的多肽的组合物。

7.如权利要求6所述的组合物，该组合物包括选自以下各项的一种或多种另外的酶：纤维素酶、半纤维素酶、苹果菌素、酯酶、漆酶、木质素分解酶、果胶酶、过氧化物酶、蛋白酶、以及膨胀蛋白。

8.如权利要求6或7所述的组合物用于降解纤维素的用途。

9.如权利要求8所述的用途，其中该纤维素是木质纤维素材料的部分。

10.一种分离的多核苷酸，该多核苷酸编码如权利要求1-5中任一项所述的多肽。

11.一种核酸构建体或表达载体，该核酸构建体或表达载体包括如权利要求10所述的多核苷酸，该多核苷酸可操作地连接至指导该多肽在一个表达宿主内的产生的一个或多个控制序列。

12.一种重组宿主细胞，该重组宿主细胞包括如权利要求10所述的多核苷酸，该多核苷酸可操作地连接至指导该多肽的产生的一个或多个控制序列。

13.一种产生如权利要求1-5中任一项所述的多肽的方法，该方法包括：

(b)回收该多肽。

14.一种产生具有纤维素分解增强活性的多肽的方法，该方法包括：

(a)在有益于产生该多肽的条件下培养如权利要求12所述的宿主细胞；并且

(b)回收该多肽。