CN108467877A

CN108467877A - 用于降解或转化纤维素材料的方法

Info

Publication number: CN108467877A
Application number: CN201810257103.4A
Authority: CN
Inventors: 黄鸿志; 任海彧
Original assignee: Novo Nordisk AS
Current assignee: Novo Nordisk AS
Priority date: 2011-03-25
Filing date: 2012-03-26
Publication date: 2018-08-31
Also published as: CN115927509A; CN103562382A

Abstract

本发明涉及用于降解或转化纤维素材料的方法，其包括：在具有过氧化氢酶活性的多肽的存在下用酶组合物处理纤维素材料；和涉及用于降解或转化纤维素材料的酶组合物，其包含一种或多种(例如几种)具有纤维素分解和/或半纤维素分解活性的酶，和具有过氧化氢酶活性的多肽。

Description

用于降解或转化纤维素材料的方法

本申请是基于申请日为2012年3月26日，优先权日为2011年3月25日，申请号为201280025435.0，发明名称为：“用于降解或转化纤维素材料的方法”的专利申请的分案申请。

对序列表的援引

本申请包含计算机可读形式的序列表，所述计算机可读形式通过提述并入本文。

发明背景

技术领域

本发明涉及降解或转化纤维素材料的方法，和用于降解或转化纤维素材料的酶组合物。

背景技术

过氧化氢酶[过氧化氢：过氧化氢氧还酶(EC 1.11.1.6)]是催化过氧化氢(H₂O₂)转化为氧(O₂)和水(H₂O)的酶。这些普遍存在的酶已从多种动物组织、植物和微生物纯化(Chance和Maehly,1955,Methods Enzymol.2:764-791)。

过氧化氢酶制备物在商业上用于诊断用酶试剂盒，从葡萄糖酶法产生葡糖酸钠，中和H₂O₂废物，从纺织品织物去除H₂O₂，和用于在食物和饮料中去除H₂O₂和/或生成O₂。

纤维素是单糖通过β-1,4-键共价连接的聚合物。许多微生物产生水解β-连接的葡聚糖的酶。这些酶包括内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶。内切葡聚糖酶在随机位置消化纤维素聚合物，使其暴露于纤维二糖水解酶攻击(attack)。纤维二糖水解酶从纤维素聚合物的末端顺序地释放纤维二糖的分子。纤维二糖是水溶性的β-1,4-连接的葡萄糖二聚体。β-葡糖苷酶将纤维二糖水解成葡萄糖。

木素纤维素材料的转化具有以下优势：大量原料现成可用，而且可以理想地避免燃烧或填埋材料。木材、农业残余物、草本作物和城市固体废物被认为是原料。这些材料主要由纤维素、半纤维素和木质素组成。一旦将木素纤维素转化成单糖例如葡萄糖，所述单糖可进一步转化为许多有用的物质，例如燃料、饮用乙醇、发酵产物和/或化学品(例如酸、醇、酮、气体等)。

在本领域中改善用于降解或转化纤维素材料的方法会是有利的。

发明内容

本发明涉及用于降解或转化纤维素材料的方法，其包括：在具有过氧化氢酶活性的多肽的存在下用酶组合物处理纤维素材料。

本发明亦涉及用于产生发酵产物的方法，其包括：

(a)在具有过氧化氢酶活性的多肽的存在下用酶组合物糖化纤维素材料；

(b)用一种或多种(例如几种)发酵微生物发酵经糖化的纤维素材料以产生发酵产物；和

(c)从发酵回收发酵产物。

本发明进一步涉及发酵纤维素材料的方法，其包括：用一种或多种(例如几种)发酵微生物发酵所述纤维素材料，其中所述纤维素材料在具有过氧化氢酶活性的多肽的存在下被用酶组合物水解。

本发明还涉及用于降解或转化纤维素材料的酶组合物，其包含具有纤维素分解活性和/或木质素降解活性的酶和具有过氧化氢酶活性的多肽；及该组合物的用途。

附图说明

图1显示一种Talaromyces stipitatus过氧化氢酶基因的基因组DNA序列(SEQ IDNO:3)和和氨基酸序列(SEQ ID NO:4)。

图2显示一种特异腐质霉(Humicola insolens)过氧化氢酶基因的基因组DNA序列(SEQ ID NO:5)和和氨基酸序列(SEQ ID NO:6)。

图3显示一种Penicillium emersonii过氧化氢酶基因的基因组DNA序列(SEQ IDNO:7)和和氨基酸序列(SEQ ID NO:8)。

定义

过氧化氢酶活性：术语“过氧化氢酶活性”在本文中定义为过氧化氢：过氧化氢氧还酶活性(EC 1.11.1.6)，其催化2H₂O₂至O₂+2H₂O的转化。就本发明的目的而言，过氧化氢酶活性根据美国专利号5,646,025测定。一个单位的过氧化氢酶活性等于在测定条件下催化1μmol过氧化氢的氧化的酶量。

在一个方面，用于本发明的过氧化氢酶具有SEQ ID NO:2的成熟多肽，SEQID NO:4的成熟多肽，SEQ ID NO:6的成熟多肽，或SEQ ID NO:8的成熟多肽的过氧化氢酶活性的至少20％，例如至少40％，至少50％，至少60％，至少70％，至少80％，至少90％，至少95％，或至少100％。

乙酰木聚糖酯酶：术语“乙酰木聚糖酯酶”意指催化从聚合木聚糖、乙酰化木糖、乙酰化葡萄糖、乙酸α-萘酯(alpha-napthyl acetate)和乙酸对硝基苯酯(p-nitrophenylacetate)水解乙酰基团的羧基酯酶(EC 3.1.1.72)。就本发明而言，乙酰木聚糖酯酶活性是使用含有0.01％TWEEN^TM 20(聚氧乙烯山梨聚糖单月桂酸酯)的50mM乙酸钠pH 5.0中的0.5mM乙酸对硝基苯酯作为底物确定的。一个单位的乙酰木聚糖酯酶定义为能够在pH 5,25℃每分钟释放1微摩尔对硝基苯酚阴离子(p-nitrophenolate anion)的酶量。

α-L-阿拉伯呋喃糖苷酶：术语“α-L-阿拉伯呋喃糖苷酶”意指α-L-阿拉伯呋喃糖苷阿拉伯呋喃水解酶(EC 3.2.1.55)，其催化对α-L-阿拉伯糖苷中的末端非还原性α-L-阿拉伯呋喃糖苷残基的水解。该酶对α-L-阿拉伯呋喃糖苷、含有(1,3)-和/或(1,5)-连接的α-L-阿拉伯聚糖、阿拉伯木聚糖和阿拉伯半乳聚糖起作用。α-L-阿拉伯呋喃糖苷酶也称为阿拉伯糖苷酶、α-阿拉伯糖苷酶、α-L-阿拉伯糖苷酶、α-阿拉伯呋喃糖苷酶、多糖α-L-阿拉伯呋喃糖苷酶、α-L-阿拉伯呋喃糖苷水解酶、L-阿拉伯糖苷酶或α-L-阿拉伯聚糖酶。就本发明而言，α-L-阿拉伯呋喃糖苷酶活性是使用每ml的100mM乙酸钠pH 5中5mg的中等粘度小麦阿拉伯木聚糖(Megazyme International Ireland,Ltd.,Bray,Co.Wicklow,Ireland)，总体积200μl，在40℃进行30分钟，接着通过HPX-87H柱层析(Bio-RadLaboratories,Inc.,Hercules,CA,USA)进行阿拉伯糖分析来确定的。

α-葡糖醛酸糖苷酶：术语“α-葡糖醛酸糖苷酶”意指α-D-葡糖苷酸葡糖醛酸水解酶(alpha-D-glucosiduronate glucuronohydrolase)(EC 3.2.1.139)，其催化α-D-葡糖醛酸糖苷水解为D-葡糖醛酸和醇。就本发明而言，α-葡糖醛酸糖苷酶活性是根据de Vries,1998,J.Bacteriol.180:243-249确定的。一个单位的α-葡糖醛酸糖苷酶等于能够在pH 5，40℃每分钟释放1微摩尔葡糖醛酸或4-O-甲基葡糖醛酸的酶量。

β-葡糖苷酶：术语“β-葡糖苷酶”意指β-D-葡糖苷葡糖水解酶(beta-D-glucosideglucohydrolase)(E.C.No.3.2.1.21)，其催化末端非还原β-D-葡萄糖残基的水解，并释放β-D-葡萄糖。就本发明而言，β-葡糖苷酶根据Venturi等,2002,Extracellular beta-D-glucosidase from Chaetomium thermophilum var.coprophilum:production,purification and some biochemical properties,J.Basic Microbiol.42:55-66的方法使用对硝基苯基-β-D-葡糖吡喃糖苷作为底物测定。一个单位的β-葡糖苷酶定义为在25℃,pH 4.8，在含有0.01％20的50mM柠檬酸钠中每分钟从作为底物的1mM对硝基苯基-β-D-葡糖吡喃糖苷产生1.0微摩尔对硝基苯酚阴离子。

β-木糖苷酶：术语“β-木糖苷酶”意指β-D-木糖苷木糖水解酶(β-D-xylosidexylohydrolase)(E.C.3.2.1.37)，其催化短β(1→4)木寡糖(xylooligosaccharide)的外水解以从非还原端去除连续的D-木糖残基。就本发明而言，一个单位的β-木糖苷酶定义为在40℃，pH 5在含有0.01％20的100mM柠檬酸钠中每分钟从作为底物的1mM对硝基苯基-β-D-木糖苷产生1.0微摩尔对硝基苯酚阴离子。

cDNA：术语“cDNA”意指可以从得自真核或原核细胞的成熟的、已剪接的mRNA分子通过反转录制备的DNA分子。cDNA缺少在相应的基因组DNA中可能存在的内含子序列。起始的(initial)、初级的RNA转录物是mRNA的前体，其通过包括剪接在内的一系列的步骤被加工，然后作为成熟的已剪接的mRNA出现。

纤维二糖水解酶：术语“纤维二糖水解酶”意指1,4-β-D-葡聚糖纤维二糖水解酶(1,4-beta-D-glucan cellobiohydrolase)(E.C.3.2.1.91和E.C.3.2.1.176)，其催化纤维素、纤维寡糖，或任何包含β-1,4-连接的葡萄糖的聚合物中的1,4-β-D-糖苷连接的水解，从链的还原或非还原末端释放纤维二糖(Teeri,1997,Crystalline cellulosedegradation:New insight into the function of cellobiohydrolases,Trends inBiotechnology 15:160-167；Teeri等,1998,Trichoderma reesei cellobiohydrolases:why so efficient on crystalline cellulose？,Biochem.Soc.Trans.26:173-178)。纤维二糖水解酶活性根据Lever等,1972,Anal.Biochem.47:273-279；van Tilbeurgh等,1982,FEBS Lette rs 149:152-156；van Tilbeurgh和Claeyssens,1985,FEBS Letters 187:283-288；以及Tomme等,1988,Eur.J.Biochem.170:575-581描述的方法确定。在本发明中，Tomme等的方法可用于确定纤维二糖水解酶活性。

纤维素材料：术语“纤维素材料”意指任何包含纤维素的材料。生物质的初生细胞壁(primary cell wall)中的最主要的多糖是纤维素，第二丰富的是半纤维素，第三是果胶。在细胞停止生长后产生的次生细胞壁(secondary cell wall)同样含有多糖，并被共价交联于半纤维素的聚合木质素所加强。纤维素是脱水纤维二糖的均聚物，因此是一种直链β-(1-4)-D-葡聚糖，而半纤维素包括多种化合物，例如木聚糖、木葡聚糖(xyloglucan)、阿拉伯木聚糖和甘露聚糖，形成具有多种多样的取代基的复杂分支结构。尽管纤维素通常是多形的，但植物组织中的纤维素主要以平行葡聚糖链的不溶晶体基质的形式出现。半纤维素通常与纤维素以及其它半纤维素以氢键相连，帮助稳定细胞壁基质。

纤维素通常见于例如植物的茎、叶、壳、皮和穗轴，或树木的叶、枝和木材。纤维素材料可以是，但不限于，农业残余物、草本材料(包括能源作物)、城市固体废物、纸浆与造纸厂残余物、废纸和木材(包括林业残余物)(参见，例如，Wiselogel等,1995,于Handbook onBioethanol(Charles E.Wyman编),pp.105-118,Taylor&Francis,Washington D.C.；Wyman,1994,Bioresource Technology 50:3-16；Lynd,1990,Applied Biochemistry andBiotechnology 24/25:695-719；Mosier等,1999,Recent Progress in Bioconversion ofLignocellulosics,于Advances in Biochemical Engineering/Biotechnology,T.Scheper主编,Volume 65,pp.23-40,Springer-Verlag,New York)。在本文中应理解的是，纤维素可以是以木素纤维素的形式，木素纤维素是一种包含木质素、纤维素和半纤维素的混合基质的植物细胞壁材料。在一个优选的方面，纤维素材料是任何生物质材料。在另一个优选的方面，所述纤维素材料是木素纤维素，其包含纤维素、半纤维素和木质素。

在一个方面，纤维素材料是农业残余物。在另一个方面，纤维素材料是草本材料(包括能源作物)。在另一个方面，纤维素材料是城市固体废物。在另一个方面，纤维素材料是纸浆和造纸厂残余物。在另一个方面，纤维素材料是废纸。在另一个方面，纤维素材料是木材(包括林业残余物)。

在另一个方面，纤维素材料是芦竹(arundo)。在另一个方面，纤维素材料是甘蔗渣(bagasse)。在另一个方面，纤维素材料是竹(bamboo)。在另一个方面，纤维素材料是玉米穗轴(corn cob)。在另一个方面，纤维素材料是玉米纤维。在另一个方面，纤维素材料是玉米秸秆。在另一个方面，纤维素材料是芒草属植物(miscanthus)。在另一个方面，纤维素材料是橙皮。在另一个方面，纤维素材料是稻杆。在另一个方面，纤维素材料是柳枝稷(switchgrass)。在另一个方面，纤维素材料是麦杆。

在另一个方面，纤维素材料是白杨(aspen)。在另一个方面，纤维素材料是桉树。在另一个方面，纤维素材料是枞树(fir)。在另一个方面，纤维素材料是松树。在另一个方面，纤维素材料是杨树。在另一个方面，纤维素材料是云杉。在另一个方面，纤维素材料是柳树。

在另一个方面，纤维素材料是藻类纤维素。在另一个方面，纤维素材料是细菌纤维素。在另一个方面，纤维素材料是棉绒(cotton linter)。在另一个方面，纤维素材料是滤纸。在另一个方面，纤维素材料是微晶纤维素。在另一个方面，纤维素材料是磷酸处理的纤维素。

在另一个方面，纤维素材料是水生生物质。如用于本文中，“水生生物质”意指在水生环境中由光合作用过程产生的生物质。水生生物质可为藻类、挺水植物(emergentplant)、浮叶植物(floating-leaf plant)或沉水植物(submerged plant)。

纤维素材料可以按原样(as is)使用或进行预处理，使用本领域已知的常规方法，如本文所述。在一个优选的方面，预处理纤维素材料。

纤维素分解酶或纤维素酶：术语“纤维素分解酶”或“纤维素酶”意指一种或多种(例如几种)水解纤维素材料的酶。此类酶包括内切葡聚糖酶，纤维二糖水解酶，β-葡糖苷酶，或其组合。测量纤维素分解活性的两种基本方法包括：(1)测量总纤维素分解活性，和(2)测量单独的纤维素分解活性(内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶)，如Zhang等,Outlook for cellulase improvement:Screening and selection strategies,2006,Biotechnology Advances 24:452-481所综述的。总纤维素分解活性通常是使用不溶性底物来测定的，所述底物包括Whatman 1号滤纸、微晶纤维素、细菌纤维素、藻类纤维素、棉花、经预处理的木素纤维素等。最常见的总纤维素分解活性测定法是使用Whatman 1号滤纸作为底物的滤纸测定法。该测定法是由International Union of Pure and AppliedChemistry(IUPAC)(Ghose,1987,Measurement of cellulase activities,PureAppl.Chem.59:257-68)确立的。

就本发明而言，纤维素分解酶活性通过测量在下述条件下由纤维素分解酶进行的纤维素材料水解的增加来确定：1-50mg的纤维素分解酶蛋白/g的PCS中纤维素(或其它经预处理的纤维素材料)在合适的温度，例如50℃、55℃或60℃进行3-7日，与未添加纤维素分解酶蛋白的对照水解相比较。典型条件为：1ml反应液，经洗涤或未洗涤的PCS，5％不溶性固形物，50mM乙酸钠pH 5，1mM MnSO₄，50℃、55℃或60℃，72小时，通过HPX-87H柱(Bio-Rad Laboratories,Inc.,Hercules,CA,USA)进行糖分析。

编码序列：术语“编码序列”意指直接指定多肽的氨基酸序列的多核苷酸。编码序列的边界通常由开放阅读框决定，所述开放阅读框以起始密码子如ATG、GTG或TTG开始，并且以终止密码子如TAA、TAG或TGA结束。编码序列可以是基因组DNA、cDNA、合成DNA或其组合。

调控序列(control sequence)：术语“调控序列”指编码本发明的成熟多肽的多核苷酸表达所必需的核酸序列。每个调控序列对于编码所述成熟多肽的多核苷酸而言都可以是天然的(即，来自同一基因)或外源的(即，来自不同基因)，或各个调控序列对于彼此可以是天然的或外源的。这些调控序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。至少，调控序列包括启动子和转录和翻译的终止信号。调控序列可以具备接头，用于引入特异性限制位点来便于调控序列与编码多肽的多核苷酸编码区的连接。

内切葡聚糖酶：术语“内切葡聚糖酶”意指内切-1,4-(1,3；1,4)-β-D-葡聚糖4-葡聚糖水解酶(endo-1,4-β-D-glucan 4-glucanohydrolase)(E.C.3.2.1.4)，其催化纤维素、纤维素衍生物(例如羧甲基纤维素和羟乙基纤维素)、地衣淀粉(lichenin)中的1,4-β-D-糖苷键、混合的β-1,3葡聚糖例如谷类β-D-葡聚糖或木葡聚糖和含有纤维素组分的其它植物材料中的β-1,4键的内水解(endohydrolysis)。内切葡聚糖酶活性可通过测量底物粘度的减少或由还原糖测定法(Zhang等,2006,Biotechnology Advances 24:452-481)确定的还原端增加来确定。就本发明而言，根据Ghose,1987,Pure and Appl.Chem.59:257-268的方法，在pH 5，40℃使用羧甲基纤维素(CMC)作为底物来确定内切葡聚糖酶活性。

表达：术语“表达”包括多肽产生中涉及的任何步骤，包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。

表达载体：术语“表达载体”意指线性的或环状的DNA分子，其包含编码多肽的多核苷酸，并且所述多核苷酸与提供用于其表达的调控序列可操作地连接。

家族61糖苷水解酶：术语“家族61糖苷水解酶”或“家族GH61”或“GH61”在本文中定义为根据Henrissat B.,1991,A classification of glycosyl hydrolases based onamino-acid sequence similarities,Biochem.J.280:309-316,及Henrissat B.和Bairoch A.,1996,Updating the sequence-based classification ofglycosylhydrolases,Biochem.J.316:695-696属于糖苷水解酶家族61的多肽。该家族中的酶原先基于在一个家族成员测量到的非常弱的内切-1,4-β-D葡聚糖酶活性而被归类为糖苷水解酶家族。这些酶的结构和作用模式是非经典的，且它们无法视为真正的(bona fide)糖苷酶。然而，基于它们当与纤维素酶或纤维素酶的混合物一同使用时增强木素纤维素分解的能力，它们被保留在CAZy分类中。

阿魏酸酯酶：术语“阿魏酸酯酶(feruloyl esterase)”意指4-羟基-3-甲氧基肉桂酰-糖水解酶(EC 3.1.1.73)，其催化4-羟基-3-甲氧基肉桂酰(阿魏酰)基团从酯化的糖(其在“天然”底物中通常为阿拉伯糖)的水解，以产生阿魏酸(4-羟基-3-甲氧基肉桂酸)。阿魏酸酯酶也称作阿魏酸酯酶(ferulic acid esterase)、羟基肉桂酰基酯酶、FAE-III、肉桂酸酯水解酶、FAEA、cinnAE、FAE-I或FAE-II。就本发明而言，阿魏酸酯酶活性是使用50mM乙酸钠pH 5.0中的0.5mM阿魏酸对硝基苯酯作为底物确定的。一个单位的阿魏酸酯酶等于能够在pH 5，25℃每分钟释放1微摩尔对硝基苯酚阴离子的酶量。

片段：术语“片段”意指从成熟多肽主体(main)的氨基和/或羧基末端缺失一个或多个(例如几个)氨基酸的多肽；其中所述片段具有过氧化氢酶活性。在一个方面，所述片段含有SEQ ID NO:2的至少632个氨基酸残基，例如至少670个氨基酸残基，或至少608个氨基酸残基。在另一个方面，所述片段含有SEQ ID NO:4的至少622个氨基酸残基，例如至少659个氨基酸残基，或至少696个氨基酸残基。在另一个方面，所述片段含有SEQ ID NO:6的至少652个氨基酸残基，例如至少689个氨基酸残基，或至少727个氨基酸残基。在另一个方面，所述片段含有SEQ ID NO:8的至少614个氨基酸残基，例如至少650个氨基酸残基，或至少686个氨基酸残基。

半纤维素分解酶或半纤维素酶：术语“半纤维素分解酶”或“半纤维素酶”意指一种或多种(例如几种)水解半纤维素材料的酶。参见，例如Shallom D.和Shoham Y.Microbialhemicellulases.Current Opinion In Microbiology,2003,6(3):219-228)。半纤维素酶是植物生物质降解中的关键成分。半纤维素酶的实例包括但不限于乙酰甘露聚糖酯酶、乙酰木聚糖酯酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、香豆酸酯酶、阿魏酸酯酶、半乳糖苷酶、葡糖醛酸糖苷酶、葡糖醛酸酯酶、甘露聚糖酶、甘露糖苷酶、木聚糖酶和木糖苷酶。这些酶的底物，半纤维素，是支化多糖和直链多糖的异质集团，这些多糖通过氢键键合于植物细胞壁中的纤维素微纤维，将其交联为鲁棒(robust)的网络。半纤维素亦共价地附于木质素，与纤维素一同形成高度复杂的结构。半纤维素的可变的结构和组织形式需要许多酶的协同作用使其完全降解。半纤维素酶的催化模块为水解糖苷键的糖苷水解酶(GH)，或水解乙酸或阿魏酸侧基的酯连接的糖酯酶(CE)。这些催化模块，基于其一级结构的同源性，可指派为GH和CE家族。一些家族具有整体上类似的折叠，可进一步归类为宗族(clan)，以字母标记(例如，GH-A)。这些糖活性酶和其他糖活性酶的最具信息性和最新的分类可在Carbohydrate-ActiveEnzymes(CAZy)数据库获得。半纤维素分解酶活性可根据Ghose和Bisaria,1987,Pure&Appl.Chem.59:1739-1752在合适的温度，例如50℃、55℃或60℃，和pH，例如5.0或5.5进行测量。

高严格条件：术语“高严格条件”意指对于长度至少100个核苷酸的探针，在42℃，在5X SSPE、0.3％SDS、200微克/ml已剪切并且变性的鲑精DNA和50％的甲酰胺中，根据标准的Southern印迹法进行预杂交和杂交12至24小时。使用2X SSC、0.2％SDS在65℃将载体材料最终洗涤三次，每次15分钟。

宿主细胞：术语“宿主细胞”意指任何容许使用包含本发明过氧化氢酶的核酸构建体或表达载体的进行转化、转染、转导等的细胞类型。术语“宿主细胞”涵盖亲本细胞的任何由于在复制中发生的突变而不同于亲本细胞的后代。

低严格条件：术语“低严格条件”意指对于长度至少100个核苷酸的探针，在42℃，在5X SSPE、0.3％SDS、200微克/ml已剪切并且变性的鲑精DNA和25％的甲酰胺中，根据标准的Southern印迹法进行预杂交和杂交12至24小时。使用2X SSC、0.2％SDS在50℃将载体材料最终洗涤三次，每次15分钟。

成熟多肽：术语“成熟多肽”意指以其在翻译和任何翻译后修饰之后的最终形式存在的多肽，所述修饰例如N-末端加工、C-末端截短、糖基化、磷酸化等。在一个实施方案中，成熟多肽是SEQ ID NO:2的氨基酸1至746。在另一个实施方案中，根据SignalP程序预测SEQID NO:4的氨基酸1至19是信号肽，成熟多肽是SEQ ID NO:4的氨基酸20至733。在另一个实施方案中，根据SignalP程序预测SEQ ID NO:6的氨基酸1至19是信号肽，成熟多肽是SEQ IDNO:6的氨基酸20至765。在另一个实施方案中，根据SignalP程序预测SEQ ID NO:8的氨基酸1至19是信号肽，成熟多肽是SEQ ID NO:8的氨基酸20至741。在本领域中已知宿主细胞可产生由相同多核苷酸表达的两种或更多种不同成熟多肽(即具有不同的C端和/或N端氨基酸)的混合物。

成熟多肽编码序列：术语“成熟多肽编码序列”意指编码具有过氧化氢酶活性的成熟多肽的多核苷酸。在一个实施方案中，成熟多肽编码序列是SEQ ID NO:1的核苷酸1至2351或其cDNA序列。在另一个实施方案中，根据SignalP程序预测SEQ ID NO:3的核苷酸1至57编码信号肽，成熟多肽编码序列是SEQ ID NO:3的核苷酸58至2418或其cDNA序列。在另一个实施方案中，根据预测SignalP程序SEQ ID NO:5的核苷酸1至57编码信号肽的，成熟多肽编码序列是SEQ ID NO:5的核苷酸58至3040或其cDNA序列。在另一个实施方案中，根据SignalP程序预测SEQ ID NO:7的核苷酸1至57编码信号肽，成熟多肽编码序列是SEQ IDNO:7的核苷酸58至2476或其cDNA序列。

中等严格条件：术语“中等严格条件”意指对于长度至少100个核苷酸的探针，在42℃，在5X SSPE、0.3％SDS、200微克/ml已剪切并且变性的鲑精DNA和35％的甲酰胺中，根据标准的Southern印迹法进行预杂交和杂交12至24小时。使用2X SSC、0.2％SDS在55℃将载体材料最终洗涤三次，每次15分钟。

中等-高严格条件：术语“中等-高严格条件”意指对于长度至少100个核苷酸的探针，在42℃，在5X SSPE、0.3％SDS、200微克/ml已剪切并且变性的鲑精DNA和35％的甲酰胺中，根据标准的Southern印迹法进行预杂交和杂交12至24小时。使用2X SSC、0.2％SDS在60℃将载体材料最终洗涤三次，每次15分钟。

核酸构建体：术语“核酸构建体”意指这样的单链或双链的核酸分子，其分离自天然存在的基因，或其经修饰以本来不存在于(not otherwise exist)自然界中的方式含有核酸的区段，或其为合成的，其包含一个或多个调控序列。

可操作地连接：术语“可操作地连接”意指这样的构型，其中调控序列被置于相对于多核苷酸的编码序列的适当位置，使得调控序列指导编码序列的表达。

具有纤维素分解增强活性的多肽：术语“具有纤维素分解增强的多肽”意指催化对具有纤维素分解活性的酶对纤维素材料的水解作用的增强的GH61多肽。就本发明而言，通过测量由于纤维素分解酶在下述条件下水解纤维素材料所致的还原糖增加或纤维二糖与葡萄糖的总量增加来确定纤维素分解增强活性：1-50mg总蛋白/g PCS中纤维素，其中总蛋白包含50-99.5％w/w的纤维素分解酶蛋白，及0.5-50％w/w的具有纤维素分解增强活性的GH61多肽的蛋白质，在合适的温度，例如50℃、55℃或60℃和pH，例如5.0或5.5历时1-7天，与用等量的总蛋白加载量而无纤维素分解增强活性(1-50mg纤维素分解蛋白/gPCS中纤维素)所进行的对照水解相比。在一个优选的方面，使用在总蛋白重量的2-3％的米曲霉β-葡糖苷酶(根据WO 02/095014在米曲霉中重组产生)或者总蛋白质量的2-3％的烟曲霉β-葡糖苷酶(如WO 2002/095014所述在米曲霉中重组产生)的纤维素酶蛋白加载量存在下的1.5L(Novozymes A/S,Bagsvaerd,Denmark)的混合物作为纤维素分解活性的来源。

具有纤维素分解增强活性的GH61多肽通过降低达到相同水解水平所需的纤维素分解酶的量而增强由具有纤维素分解活性的酶催化的纤维素材料的水解，优选降低至少1.01倍，例如至少1.05倍，至少1.10倍，至少1.25倍，至少1.5倍，至少2倍，至少3倍，至少4倍，至少5倍，至少10倍，或至少20倍。

预处理的玉米秸秆：术语“PCS”或“预处理的玉米秸秆”意指从玉米秸秆通过用热和稀硫酸处理、碱预处理或中性预处理获得的的纤维素材料。

序列同一性：参数“序列同一性”描述两个氨基酸序列之间或两个核苷酸序列之间的相关性。

就本发明而言，两个氨基酸序列之间的序列同一性程度使用如EMBOSS软件包(EMBOSS:The European Molecular Biology Open Software Suite,Rice等,2000,TrendsGenet.16:276-277)，优选5.0.0版或更高版本的Needle程序中所执行的Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48:443-453)来测定。使用的参数为缺口打开罚分(gap open penalty)10，缺口延伸罚分(gap extension penalty)0.5和EBLOSUM62(BLOSUM62的EMBOSS版)取代矩阵。使用Needle标记为“最高同一性(longest identity)”的输出结果(使用“-nobrief”选项获得)作为同一性百分比，并计算如下：

(相同的残基×100)/(比对长度－比对中缺口的总数)

就本发明而言，两个核苷酸序列之间的序列同一性程度使用如EMBOSS软件包(EMBOSS:The European Molecular Biology Open Software Suite,Rice等,2000,见上文)，优选5.0.0版或更高版本的Needle程序中所执行的Needleman-Wunsch算法(Needleman和Wunsch,1970,见上文)来测定。使用的参数为缺口打开罚分10，缺口延伸罚分0.5和EDNAFULL(NCBI NUC4.4的EMBOSS版)取代矩阵。使用Needle标记为“最高同一性”的输出结果(使用-nobrief选项获得)作为同一性百分比，并计算如下：

(相同的脱氧核糖核苷酸×100)/(比对长度－比对中缺口的总数)

变体：术语“变体”意指在一个或多个(例如几个)位置包含改变，即取代、插入和/或缺失的具有过氧化氢酶活性的多肽。取代意指将占据某位置的氨基酸用不同的氨基酸替代；缺失意指去除占据某位置的氨基酸；而插入意指在邻接并紧接着占据某位置的氨基酸之后添加氨基酸。

非常高严格条件：术语“非常高严格条件”意指对于长度至少100个核苷酸的探针，在42℃，在5X SSPE、0.3％SDS、200微克/ml已剪切并且变性的鲑精DNA和50％的甲酰胺中，根据标准的Southern印迹法进行预杂交和杂交12至24小时。使用2X SSC、0.2％SDS在70℃将载体材料最终洗涤三次，每次15分钟。

非常低严格条件：术语“非常低严格条件”意指对于长度至少100个核苷酸的探针，在42℃，在5X SSPE、0.3％SDS、200微克/ml已剪切并且变性的鲑精DNA和25％的甲酰胺中，根据标准的Southern印迹法进行预杂交和杂交12至24小时。使用2X SSC、0.2％SDS在45℃将载体材料最终洗涤三次，每次15分钟。

含木聚糖材料：术语“含木聚糖材料”意指任何包含含有β-(1-4)连接的木糖残基骨架的植物细胞壁多糖的材料。陆生植物的木聚糖是具有β-(1-4)-吡喃木糖骨架的杂聚物，其由短的糖链分支。它们包含D-葡糖醛酸或其4-O-甲基醚，L-阿拉伯糖和/或多种包含D-木糖、L-阿拉伯糖、D-或L-半乳糖和D-葡萄糖的寡糖。木聚糖类型的多糖可分为均木聚糖(homoxylan)和杂木聚糖(heteroxylan)，后者包括葡糖醛酸木聚糖，(阿拉伯)葡糖醛酸木聚糖，(葡糖醛酸)阿拉伯木聚糖，阿拉伯木聚糖和复合杂木聚糖。参见，例如Ebringerova等,2005,Adv.Polym.Sci.186:1-67。

在本发明的工艺中，可使用任何含有木聚糖的材料。在一个优选的方面，所述含木聚糖材料是木素纤维素。

木聚糖降解活性或木聚糖分解活性：术语“木聚糖降解活性”或“木聚糖分解活性”意指水解含木聚糖材料的生物学活性。两种测定木聚糖分解活性的基础方法包括：(1)测定总木聚糖分解活性，和(2)测定单独的木聚糖分解活性(例如内切木聚糖酶、β-木糖苷酶、阿拉伯呋喃糖苷酶、α-葡糖醛酸糖苷酶、乙酰木聚糖酯酶、阿魏酸酯酶和α-葡糖醛酸酯酶(α-glucuronyl esterase))。最近在木聚糖分解酶测定法的进展总结于几个公开文献中，包括Biely和Puchard,Recent progress in the assays of xylanolytic enzymes,2006,Journal of the Science of Food和Agriculture 86(11):1636-1647；Spanikova和Biely,2006,Glucuronoyl esterase-Novel carbohydrate esterase produced bySchizophyllum commune,FEBS Letters 580(19):4597-4601；Herrmann,Vrsanska,Jurickova,Hirsch,Biely,和Kubicek,1997,The beta-D-xylosidase of Trichodermareesei is a multifunctional beta-D-xylan xylohydrolase,Biochemical Journal321:375-381。

总木聚糖降解活性可通过确定从多种类型的木聚糖形成的还原糖来测量，所述木聚糖包括例如燕麦小麦(oat spelt)、山毛榉木(beechwood)和落叶松木(larchwood)木聚糖，或者可通过光度法确定从多种共价染色的木聚糖释放出的染色的木聚糖片段来测量。最常见的总木聚糖分解活性测定法基于从多聚的4-O-甲基葡糖醛酸木聚糖产生还原糖，如Bailey,Biely,Poutanen,1992,Interlaboratory testing of methods for assay ofxylanase activity,Journal of Biotechnology 23(3):257-270中所述。木聚糖酶活性亦可用0.2％AZCL-阿拉伯木聚糖作为底物在37℃在0.01％X-100(4-(1,1,3,3-四甲基丁基)苯基-聚乙二醇)和200mM磷酸钠缓冲液pH 6中来确定。一个单位的木聚糖酶活性定义为在37℃，pH 6在200mM磷酸钠pH 6缓冲液中从作为底物的0.2％AZCL-阿拉伯木聚糖每分钟产生1.0微摩尔天青蛋白(azurine)。

就本发明而言，木聚糖降解活性是通过测量由木聚糖降解酶在下述通常条件下造成的桦木木聚糖(Sigma Chemical Co.,Inc.,St.Louis,MO,USA)水解的增加来确定的：1ml反应体系，5mg/ml底物(总固形物)，5mg木聚糖分解蛋白质/g底物，50mM乙酸钠，pH 5，50℃，24小时，如Lever,1972,A new reaction for colorimetric determination ofcarbohydrates,Anal.Biochem 47:273-279所述使用对羟基苯甲酸酰肼(PHBAH)测定法进行糖分析。

木聚糖酶：术语“木聚糖酶”意指1,4-β-D-木聚糖-木糖水解酶(1,4-β-D-xylan-xylohydrolase)(E.C.3.2.1.8)，其催化木聚糖中1,4-β-D-木糖苷键的内水解。就本发明而言，木聚糖酶活性是使用0.2％AZCL-阿拉伯木聚糖作为底物在和200mM磷酸钠pH 6缓冲液中37℃确定的。一个单位的木聚糖酶活性定义为在37℃，pH 6在200mM磷酸钠pH 6缓冲液中从作为底物的0.2％AZCL-阿拉伯木聚糖每分钟产生1.0微摩尔天青蛋白。

发明详述

加工纤维素材料的方法

本发明涉及用于降解或转化纤维素材料的方法，其包括：在具有过氧化氢酶活性的多肽的存在下用酶组合物处理纤维素材料。在一个方面，该方法法还包括回收经降解或转化的纤维素材料。

本发明亦涉及用于产生发酵产物的方法，其包括：

(c)从发酵回收发酵产物。

本发明进一步涉及发酵纤维素材料的方法，其包括：用一种或多种(例如几种)发酵微生物发酵所述纤维素材料，其中所述纤维素材料在具有过氧化氢酶活性的多肽的存在下被用酶组合物水解。在一个方面，所述纤维素材料的发酵产生发酵产物。在另一个方面，所述方法进一步包括从发酵回收发酵产物。

在上述方法中，与不存在具有过氧化氢酶活性的多肽相比，具有过氧化氢酶活性的多肽的存在增加所述纤维素材料的水解。

本发明的方法可以用于将纤维素材料糖化成可发酵糖，并且将可发酵糖转化成很多有用的发酵产物，例如燃料、饮用乙醇和/或平台化学品(platform chemical)(例如酸、醇、酮、气体等)。从纤维素材料产生期望的发酵产物通常涉及预处理、酶水解(糖化)和发酵。

根据本发明的纤维素材料的处理可以使用本领域的常规方法完成。此外，本发明的工艺可以使用配置为依照发明操作的任何常规生物质加工设备进行。

水解(糖化)和发酵，分别的或同时的，包括但不限于，分离的水解和发酵(SHF)、同时糖化和发酵(SSF)、同时糖化和共发酵(SSCF)、混合的水解和发酵(HHF)、分离的水解和共发酵(SHCF)、混合的水解和共发酵(HHCF)，和直接微生物转化(DMC)，有时也称为联合生物加工(consolidated bioprocessing，CBP)。SHF使用单独的处理步骤首先将纤维素材料酶水解为可发酵糖，例如，葡萄糖，纤维二糖，纤维三糖和戊糖单体，然后将可发酵糖发酵成为乙醇。在SSF中，纤维素材料的酶水解和糖变为乙醇的发酵在一个步骤中组合(Philippidis,G.P.,1996,Cellulose bioconversion technology,于Handbook onBioethanol:Production and Utilization,Wyman,C.E编,Taylor&Francis,Washington,DC,179-212)。SSCF包括多种糖的共发酵(Sheehan,J.和Himmel,M.,1999,Enzymes,energyand the environment:A strategic perspective on the U.S.Department of Energy’sresearch and development activities for bioethanol,Biotechnol.Prog.15:817-827)。HHF包含单独的水解步骤，还包括同步糖化和水解步骤，所述步骤可以在同一个反应器中进行。HHF过程中的步骤可以在不同的温度进行，即，进行高温酶法糖化，然后在发酵菌株能够耐受的较低温度进行SSF。DMC在一个或多个(例如几个)步骤中组合了所有三个过程(酶产生、水解和发酵)，其中使用相同的生物体产生用于将纤维素材料转化成可发酵糖和将可发酵糖转化成终产物的酶(Lynd,L.R.,Weimer,P.J.,van Zyl,W.H.,和Pretorius,I.S.,2002,Microbial cellulose utilization:Fundamentals and biotechnology,Microbiol.Mol.Biol.Reviews 66:506-577)。在本文可以理解的是，任何本领域中已知的方法，包括预处理、酶水解(糖化)、发酵，或它们的组合，都可用于实施本发明的方法。

常规设备包括补料批式搅拌反应器、分批式搅拌反应器、具有超滤的连续流搅拌反应器和/或连续活塞流柱式反应器(Fernanda de Castilhos Corazza,Flávio Faria deMoraes,Gisella Maria Zanin and Ivo Neitzel,2003,Optimal control in fed-batchreactor for the cellobiose hydrolysis,Acta Scientiarum.Technology 25:33-38；Gusakov,A.V.和Sinitsyn,A.P.,1985,Kinetics of the enzymatic hydrolysis ofcellulose:1.A mathematical model for a batch reactor process,Enz.Microb.Technol.7:346-352)、研磨反应器(Ryu,S.K.和Lee,J.M.,1983,Bioconversion of waste cellulose by using an attrition bioreactor,Biotechnol.Bioeng.25:53-65)，或者具有由电磁场引起的强烈搅拌的反应器(Gusakov,A.V.,Sinitsyn,A.P.,Davydkin,I.Y.,Davydkin,V.Y.,Protas,O.V.,1996,Enhancementof enzymatic cellulose hydrolysis using a novel type of bioreactor withintensive stirring induced by electromagnetic field,Appl.Biochem.Biotechnol.56:141-153)。其它反应器类型包括：流化床、升流层(upflowblanket)、固定化和用于水解和/或发酵的挤出机型的反应器。

预处理。在本发明的方法的实施中，可以使用本领域已知的任何预处理过程破坏植物细胞壁的纤维素材料组分(Chandra等,2007,Substrate pretreatment:The key toeffective enzymatic hydrolysis of lignocellulosics？Adv.Biochem.Engin./Biotechnol.108:67-93；Galbe和Zacchi,2007,Pretreatment of lignocellulosicmaterials for efficient bioethanol production,Adv.Biochem.Engin./Biotechnol.108:41-65；Hendriks和Zeeman,2009,Pretreatments to enhance thedigestibility of lignocellulosic biomass,Bioresource Technol.100:10-18；Mosier等,2005,Features of promising technologies for pretreatment oflignocellulosic biomass,Bioresource Technol.96:673-686；Taherzadeh和Karimi,2008,Pretreatment of lignocellulosic wastes to improve ethanol and biogasproduction:A review,Int.J.of Mol.Sci.9:1621-1651；Yang和Wyman,2008,Pretreatment:the key to unlocking low-cost cellulosic ethanol,BiofuelsBioproducts and Biorefining-Biofpr.2:26-40)。

纤维素材料也可以在预处理之前使用本领域中已知的方法进行粒度减小、预浸泡、润湿、洗涤和/或调理(conditioning)。

常规的预处理包括但不限于，蒸汽预处理(伴随或不伴随爆破)、稀酸预处理、热水预处理、碱性预处理、石灰预处理、湿氧化、湿爆破、氨纤维爆破、有机溶剂预处理和生物预处理。其它预处理包括氨渗滤、超声、电穿孔、微波、超临界CO₂、超临界H₂O、臭氧、离子性液体和γ辐射预处理。

可以在水解和/或发酵之前预处理纤维素材料。预处理优选在水解前进行。或者，预处理可以与酶水解同时进行以释放可发酵糖，如葡萄糖、木糖和/或纤维二糖。在大多数情况下，预处理步骤本身使一些生物质转化成可发酵糖(甚至在不存在酶的情况下)。

蒸汽预处理。在蒸汽预处理中，加热纤维素材料以破坏植物细胞壁成分，包括木质素、半纤维素和纤维素，使酶可接触纤维素和其它级分，例如，半纤维素。将纤维素材料通到或使其通过反应容器，其中注入蒸汽以升温至需要的温度和压力，并且在其中保持期望的反应时间。蒸汽预处理优选在140-230℃，更优选160-200℃，和最优选170-190℃进行，其中最优的温度范围取决于任何化学催化剂的添加。蒸汽预处理的停留时间优选1-30分钟，更优选1-15分钟，甚至更优选3-12分钟，最优选4-10分钟，其中最优的停留时间取决于温度范围和任何化学催化剂的添加。蒸汽预处理允许相对较高的固体加载量，以至于纤维素材料在预处理过程中通常仅仅轻微潮湿。蒸汽预处理经常与预处理后的物质的爆破放料(explosive discharge)相结合，这称为蒸汽爆破，即，物料快速变化到大气压和湍流，以通过破碎增加可接触的表面积(Duff和Murray,1996,Bioresource Technology 855:1-33；Galbe和Zacchi,2002,Appl.Microbiol.Biotechnol.59:618-628；美国专利申请No.20020164730)。在蒸汽预处理过程中，半纤维素乙酰基团被切割，所产生的酸自催化半纤维素部分水解成为单糖和寡糖。木质素去除的程度有限。

经常在蒸汽预处理之前加入催化剂如H₂SO₄或SO₂(通常0.3至5％w/w)，可减少时间，降低温度，增加回收率，并改善酶水解(Ballesteros等,2006,Appl.Biochem.Biotechnol.129-132:496-508；Varga等,2004,Appl.Biochem.Biotechnol.113-116:509-523；Sassner等.,2006,EnzymeMicrob.Technol.39:756-762)。

化学预处理：术语“化学处理”指能促进纤维素、半纤维素和/或木质素分离和/或释放的任何化学处理。合适的化学预处理工艺的实例包括例如稀酸预处理、石灰预处理、湿氧化、氨纤维/冷冻爆破(AFEX)、氨渗滤(APR)、离子性液体和有机溶剂预处理。

在稀酸预处理中，将纤维素材料与稀酸(通常是H₂SO₄)和水混合以形成浆料，由蒸汽加热至期望的温度，并在一段停留时间后迅速改变至大气压。可以用很多反应器类型进行稀酸预处理，例如，活塞流反应器、逆流反应器或连续逆流收缩床反应器(Duff和Murray,1996,supra；Schell等,2004,Bioresource Technol.91:179-188；Lee等,1999,Adv.Biochem.Eng.Biotechnol.65:93-115)。

还可以使用碱性条件下的几种预处理方法。这些碱预处理包括，但不限于，石灰预处理、湿氧化、氨渗滤(APR)和氨纤维/冷冻爆炸(AFEX)。

石灰预处理用碳酸钙、氢氧化钠或氨，在85-150℃的低温进行，停留时间从1小时到几天(Wyman等,2005,Bioresource Technol.96:1959-1966；Mosier等,2005,Bioresource Technol.96:673-686)。WO 2006/110891、WO 2006/110899、WO 2006/110900和WO 2006/110901公开了使用氨的预处理方法。

湿法氧化是热预处理，通常在180-200℃进行5-15分钟，加入氧化剂如过氧化氢或过压氧(Schmidt和Thomsen,1998,Bioresource Technol.64:139-151；Palonen等,2004,Appl.Biochem.Biotechnol.117:1-17；Varga等,2004,Biotechnol.Bioeng.88:567-574；Martin等,2006,J.Chem.Technol.Biotechnol.81:1669-1677)。预处理以优选1-40％干物质，更优选2-30％干物质，和最优选5-20％干物质进行，并且由于加入碱如碳酸钠，初始pH常常会增加。

湿法氧化预处理方法的修改方法，称为湿爆破(湿氧化和蒸汽爆破的组合)，能够处理最高达30％的干物质。在湿爆破中，在预处理过程中，在一定的停留时间后引入氧化剂。然后通过迅速变化到大气压而结束预处理(WO 2006/032282)。

氨纤维爆炸(AFEX)涉及在温和温度如90-100℃和高压如17-20bar，用液态或气态氨将纤维素材料处理5-10分钟，其中干物质含量可以高达60％(Gollapalli等,2002,Appl.Biochem.Biotechnol.98:23-35；Chundawat等,2007,Biotechnol.Bioeng.96:219-231；Alizadeh等,2005,Appl.Biochem.Biotechnol.121:1133-1141；Teymouri等,2005,Bioresource Technol.96:2014-2018)。AFEX预处理导致纤维素的解聚和半纤维素的部分水解。木质素-糖复合物被切割。

有机溶剂预处理通过用含水乙醇(40-60％乙醇)在160-200℃提取30-60分钟而将纤维素材料去木质素化(Pan等,2005,Biotechnol.Bioeng.90:473-481；Pan等,2006,Biotechnol.Bioeng.94:851-861；Kurabi等,2005,Appl.Biochem.Biotechnol.121:219-230)。经常加入硫酸作为催化剂。在有机溶剂预处理中，大部分半纤维素被去除。

合适的预处理方法的其他实例如Schell等,2003,Appl.Biochem andBiotechn.Vol.105-108:69-85,和Mosier等,2005,Bioresource Technology 96:673-686,和美国公开申请2002/0164730所述。

在一个方面，化学预处理优选作为酸处理，并且更优选作为连续稀酸和/或弱酸处理进行。酸通常是硫酸，但也可以使用其它酸，如乙酸、柠檬酸、硝酸、磷酸、酒石酸、琥珀酸、氯化氢或其混合物。弱酸(mild acid)处理在优选1-5，更优选1-4，和最优选1-3的pH范围进行。在一个方面，酸浓度在优选0.01至20wt％酸，更优选0.05至10wt％酸，甚至更优选0.1至5wt％酸，和最优选0.2至2.0wt％酸的范围。将酸与纤维素材料接触，并在优选160-220℃，更优选165-195℃范围的温度保持数秒至数分钟，例如1秒至60分钟的时间。

在另一个方面，预处理作为氨纤维爆破步骤(AFEX预处理步骤)进行。

在另一个方面，预处理发生在含水浆料中。在优选的方面，在预处理过程中纤维素材料以优选10-80wt％，更优选20-70wt％，和最优选30-60wt％，如约50wt％的量存在。预处理的纤维素材料可以不洗涤，或者使用本领域任何已知的方法洗涤，例如，用水洗涤。

机械预处理：术语“机械预处理”指各种类型的磨制(grinding)或粉碎(milling)(例如，干磨、湿磨或振动球磨)。

物理预处理：术语“物理预处理”指任何促进纤维素、半纤维素和/或木质素从纤维素材料的分离和/或释放的预处理。例如，物理预处理可涉及辐射(例如微波辐射)、汽蒸/蒸汽爆破、水热解(hydrothermolysis)，及其组合。

物理预处理可涉及高压和/或高温(蒸汽爆破)。在一个方面，高压指优选约300至约600psi，更优选约350至约550psi，且最优选约400至约500psi的范围，如约450psi的压强。在另一个方面，高温指约100至300℃，优选约140至约235℃范围的温度。在一个优选的方面，机械预处理在使用如上所定义的高温和高压的分批过程式蒸汽枪水解器系统(例如来自Sunds Defibrator AB,Sweden的Sunds Hydrolyzer)中进行。

组合的物理和化学预处理。纤维素材料可既受物理预处理又受化学预处理。例如，预处理步骤可涉及稀酸或弱酸预处理和高温和/或高压预处理。所述物理和化学预处理可视需要顺序进行或同时进行。视需要，亦可包括机械预处理。

因此，在一个优选的方面，对纤维素材料进行机械、化学或物理预处理，或者它们的任何组合，以促进纤维素、半纤维素和/或木质素的分离和/或释放。

生物预处理：术语“生物预处理”指可以促进纤维素、半纤维素和/或木质素从纤维素材料分离和/或释放的任何生物预处理。生物预处理技术可以包括应用溶解木质素的微生物(参见，例如，Hsu,T.-A.,1996,Pretreatment of biomass,于Handbook onBioethanol:Production and Utilization,Wyman,C.E编,Taylor&Francis,Washington,DC,179-212；Ghosh和Singh,1993,Physicochemical and biological treatments forenzymatic/microbial conversion of lignocellulosic biomass,Adv.Appl.Microbiol.39:295-333；McMillan,J.D.,1994,Pretreating lignocellulosicbiomass:a review,于Enzymatic Conversion of Biomass for Fuels Production,Himmel,M.E.,Baker,J.O.,和Overend,R.P.,编,ACS Symposium Series 566,AmericanChemical Society,Washington,DC,第15章；Gong,C.S.,Cao,N.J.,Du,J.,和Tsao,G.T.,1999,Ethanol production from renewable resources,于Advances in BiochemicalEngineering/Biotechnology,Scheper,T.,编,Springer-Verlag Berlin Heidelberg,Germany,65:207-241；Olsson和Hahn-Hagerdal,1996,Fermentation of lignocellulosichydrolysates for ethanol production,Enz.Microb.Tech.18:312-331；和Vallander和Eriksson,1990,Production of ethanol from lignocellulosic materials:State ofthe art,Adv.Biochem.Eng./Biotechnol.42:63-95)。

糖化。在水解步骤(也称作糖化)中，将纤维素材料(例如经预处理的纤维素材料)水解以将纤维素和/或半纤维素分解成糖，如葡萄糖、纤维二糖、木糖、木酮糖、阿拉伯糖、甘露糖、半乳糖和/或可溶的寡糖。所述糖，和/或可溶的寡糖可进一步用于产生醇(例如，阿拉伯醇、正丁醇、异丁醇、乙醇、甘油、甲醇、乙二醇、1,3-丙二醇(丙二醇)、丁二醇、丙三醇、山梨醇和木糖醇)；烷烃(例如戊烷、己烷、庚烷、辛烷、壬烷、癸烷、十一烷和十二烷)；环烷烃(例如环戊烷、环己烷、环庚烷、和环辛烷)；烯烃(例如戊烯、己烯、庚烯和辛烯)；氨基酸(例如，天冬氨酸、谷氨酸、甘氨酸、赖氨酸、丝氨酸和苏氨酸)；气体(例如，甲烷、氢气(H₂)、二氧化碳(CO₂)和一氧化碳(CO))；异戊二烯；酮(例如，丙酮)；有机酸(例如，乙酸、醋酮酸、己二酸、抗坏血酸、柠檬酸、2,5-二酮-D-葡糖酸、甲酸、反丁烯二酸、葡糖二酸、葡糖酸、葡糖醛酸、戊二酸、3-羟基丙酸、衣康酸、乳酸、苹果酸、丙二酸、草酸、草酰乙酸、丙酸、琥珀酸和木糖酸)；和聚酮化合物。

水解用酶组合物在本发明具有过氧化氢酶活性的多肽的存在下酶促进行。组合物的酶和具有过氧化氢酶活性的多肽也可以同时或顺序加入。

酶水解优选在容易由本领域技术人员确定的条件下，在合适的含水环境中进行。在一个方面，水解在适于酶的活性，即对于酶最佳的条件下进行。水解可以作为补料分批过程或连续过程进行，在连续过程中将纤维素材料逐渐补入，例如，逐渐补入含酶的水解溶液中。

糖化通常在搅拌釜反应器或发酵罐中在受控的pH、温度和混合条件下进行。合适的处理时间、温度和pH条件可以由本领域技术人员容易地确定。例如，糖化可持续长达200小时，但是通常进行优选约12至约120小时，例如约16至约72小时，或约24至约48小时。温度在优选约25℃至约70℃，例如约30℃至约65℃，约40℃至约60℃，或约50℃至55℃的范围。pH在优选约3至约8，例如约3.5至约7，约4至约6，或约5.0至约5.5的范围。干固体含量在优选约5至约50wt％，例如约10至约40wt％，或约20至约30wt％的范围。

酶组合物

酶组合物可包含任何可用于降解或转化纤维素材料的蛋白。所述组合物可包含一种酶作为主要的酶组分，例如单组分组合物，或可包含多种酶。所述组合物可根据本领域已知方法制备，并可为液体或干组合物的形式。所述组合物可依照本领域中已知的方法稳定化。

在一个方面，用于降解或转化纤维素材料的酶组合物包含一种或多种(例如几种)具有纤维素分解和/或半纤维素分解活性的酶，和具有过氧化氢酶活性的多肽。

在一个实施方案中，所述酶组合物包含，或还包含一种或多种(例如几种)选自下组的蛋白：纤维素酶、具有纤维素分解增强活性的GH61多肽，半纤维素酶、酯酶、棒曲霉素、漆酶、木质素分解酶、果胶酶、过氧化物酶、蛋白酶和膨胀素。在另一个方面，所述纤维素酶为优选一种或多种(例如几种)选自下组的酶：内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶。在另一个方面，所述半纤维素酶为优选一种或多种(例如几种)选自下组的酶：乙酰甘露聚糖酯酶、乙酰木聚糖酯酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、香豆酸酯酶、阿魏酸酯酶、半乳糖苷酶、葡糖醛酸糖苷酶、葡糖醛酸酯酶、甘露聚糖酶、甘露糖苷酶、木聚糖酶和木糖苷酶。

在另一个实施方案中，所述酶组合物包含一种或多种(例如几种)纤维素分解酶。在另一个方面，所述酶组合物包含或还包含一种或多种(例如几种)半纤维素分解酶。在另一个方面，所述酶组合物包含一种或多种(例如几种)纤维素分解酶和一种或多种(例如几种)半纤维素分解酶。在另一个方面，所述酶组合物包含一种或多种(例如几种)选自下组的酶：纤维素分解酶和半纤维素分解酶。在另一个方面，所述酶组合物包含内切葡聚糖酶。在另一个方面，所述酶组合物包含纤维二糖水解酶。在另一个方面，所述酶组合物包含β-葡糖苷酶。在另一个方面，所述酶组合物包含具有纤维素分解增强活性的多肽。在另一个方面，所述酶组合物包含内切葡聚糖酶和具有纤维素分解增强活性的多肽。在另一个方面，所述酶组合物包含纤维二糖水解酶和具有纤维素分解增强活性的多肽。在另一个方面，所述酶组合物包含β-葡糖苷酶和具有纤维素分解增强活性的多肽。在另一个方面，所述酶组合物包含内切葡聚糖酶和纤维二糖水解酶。在另一个方面，所述酶组合物包含内切葡聚糖酶和β-葡糖苷酶。在另一个方面，所述酶组合物包含纤维二糖水解酶和β-葡糖苷酶。在另一个方面，所述酶组合物包含内切葡聚糖酶、纤维二糖水解酶和具有纤维素分解增强活性的多肽。在另一个方面，所述酶组合物包含内切葡聚糖酶、β-葡糖苷酶和具有纤维素分解增强活性的多肽。在另一个方面，所述酶组合物包含纤维二糖水解酶、β-葡糖苷酶和具有纤维素分解增强活性的多肽。在另一个方面，所述酶组合物包含内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶。在另一个方面，所述酶组合物包含内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶和具有纤维素分解增强活性的多肽。

在另一个实施方案中，所述酶组合物包含乙酰甘露聚糖酯酶。在另一个方面，所述酶组合物包含乙酰木聚糖酯酶。在另一个方面，所述酶组合物包含阿拉伯聚糖酶(例如α-L-阿拉伯聚糖酶)。在另一个方面，所述酶组合物包含阿拉伯呋喃糖苷酶(例如α-L-阿拉伯呋喃糖苷酶)。在另一个方面，所述酶组合物包含香豆酸酯酶。在另一个方面，所述酶组合物包含阿魏酸酯酶。在另一个方面，所述酶组合物包含半乳糖苷酶(例如α-半乳糖苷酶和/或β-半乳糖苷酶)。在另一个方面，所述酶组合物包含葡糖醛酸糖苷酶(例如α-D-葡糖醛酸糖苷酶)。在另一个方面，所述酶组合物包含葡糖醛酸酯酶。在另一个方面，所述酶组合物包含甘露聚糖酶。在另一个方面，所述酶组合物包含甘露糖苷酶(例如β-甘露糖苷酶)。在另一个方面，所述酶组合物包含木聚糖酶。在一个优选的方面，所述木聚糖酶是家族10木聚糖酶。在另一个方面，所述酶组合物包含木糖苷酶(例如β-木糖苷酶)。

在另一个实施方案中，所述酶组合物包含酯酶。在另一个方面，所述酶组合物包含棒曲霉素。在另一个方面，所述酶组合物包含漆酶。在另一个方面，所述酶组合物包含木质素分解酶。在另一个优选的方面，所述木质素分解酶是锰过氧化物酶。在另一个优选的方面，所述木质素分解酶是木质素过氧化物酶。在另一个优选的方面，所述木质素分解酶是产生H₂O₂的酶。在另一个方面，所述酶组合物包含果胶酶。在另一个方面，所述酶组合物包含过氧化物酶。在另一个方面，所述酶组合物包含蛋白酶。在另一个方面，所述酶组合物包含膨胀素。

在本发明的方法中，酶可在糖化，糖化和发酵，或发酵之前或过程中添加。具有纤维素分解和/或半纤维素分解活性的酶和具有过氧化氢酶活性的多肽可同时或顺序添加。

所述酶组合物的一种或多种(例如几种)组分可为野生型蛋白、重组蛋白或野生型蛋白和重组蛋白的组合。举例而言，一种或多种(例如几种)组分可为细胞的天然蛋白，其用作宿主细胞以重组表达酶组合物的一种或多种(例如几种)其他组分。酶组合物的一种或多种(例如几种)组分可作为单组分产生，然后将其组合以形成酶组合物。所述酶组合物可为多组分和单组分蛋白制备物的组合。

用于本发明方法中的酶可为任何适用于作为酶的来源的形式，例如发酵液配制物或细胞组合物，含或不含细胞碎片的细胞裂解物，半纯化或纯化的酶制备物，或宿主细胞。所述酶组合物可为干粉或颗粒，无粉尘的颗粒，液体，稳定化液体或稳定化受保护的酶。液体酶制备物可根据确立的工艺，例如通过添加稳定剂如糖、糖醇或其他多元醇，和/或乳酸或其他有机酸来稳定化。

具有过氧化氢酶活性的酶和多肽的最适量取决于几个因素，包括但不限于，组分纤维素分解酶的混合物、纤维素材料、纤维素材料的浓度、纤维素材料的预处理、温度、时间、pH和包括发酵生物体(例如，用于同时糖化和发酵的酵母)。

在一个优选的方面，纤维素分解酶或半纤维素分解酶对于纤维素材料的有效量是约0.5至约50mg，更优选约0.5至约40mg，更优选约0.5至约25mg，更优选约0.75至约20mg，更优选约0.75至约15mg，甚至更优选约0.5至约10mg，最优选约1.0至约10mg每g纤维素材料。

在另一个优选的方面，具有过氧化氢酶活性的多肽对于纤维素材料的有效量是约0.001至约100.0mg，优选约0.01至约50mg，更优选约0.01至约40mg，更优选约0.01至约30mg，更优选约0.01至约20mg，更优选约0.01至约10mg，更优选约0.025至约8mg，更优选约0.05至约6mg，更优选约0.075至约5mg，更优选约0.1至约4mg，甚至更优选约0.15至约3mg，最优选约0.25至约1.0mg每g纤维素材料。

在另一个优选的方面，具有过氧化氢酶活性的多肽对于纤维素分解酶或半纤维素分解酶的有效量是约0.005至约1.0g，优选约0.01至约1.0g，更优选约0.15至约0.75g，更优选约0.15至约0.5g，更优选约0.1至约0.5g，甚至更优选约0.1至约0.5g，和最优选约0.05至约0.2g每g纤维素分解酶或半纤维素分解酶。

在另一个方面，具有纤维素分解增强活性的GH61多肽对纤维素材料的有效量是约0.01至约50.0mg，优选约0.01至约40mg，更优选约0.01至约30mg，更优选约0.01至约20mg，更优选约0.01至约10mg，更优选约0.01至约5mg，更优选约0.025至约1.5mg，更优选约0.05至约1.25mg，更优选约0.075至约1.25mg，更优选约0.1至约1.25mg，甚至更优选约0.15至约1.25mg，和最优选约0.25至约1.0mg每g的纤维素材料。

在另一个方面，具有纤维素分解增强活性的GH61多肽对纤维素分解酶蛋白的有效量是约0.005至约1.0g，优选约0.01至约1.0g，更优选约0.15至约0.75g，更优选约0.15至约0.5g，更优选约0.1至约0.5g，甚至更优选约0.1至约0.5g，和最优选约0.05至约0.2g每g的纤维素分解酶蛋白。

具有纤维素分解酶活性或半纤维素分解酶活性的多肽，以及其它可用于纤维素材料的降解的蛋白/多肽，例如具有纤维素分解增强活性的多肽(在下文中统称为具有酶活性的多肽)可源自或获得自任何合适的来源，包括细菌、真菌、酵母、植物或哺乳动物来源。术语“获得”在本文中还意指该酶可在宿主生物中使用本文中所述的方法重组产生，其中经重组产生的酶对于宿主生物是天然的或外源的，或具有修饰的氨基酸序列，例如，具有一个或多个(例如几个)缺失、插入和/或取代的氨基酸，即重组产生的酶，其为天然氨基酸序列的片段和/或突变体或通过本领域已知的氨基酸改组方法产生的酶。天然酶的含义中涵盖天然变体，而外来酶的含义中涵盖的是重组(如通过定位诱变或重排)获得的变体。

具有酶活性的多肽可以是细菌多肽。例如，所述多肽可以是革兰氏阳性细菌多肽如芽孢杆菌属(Bacillus)、链球菌属(Streptococcus)、链霉菌属(Streptomyces)、葡萄球菌属(Staphylococcus)、肠球菌属(Enterococcus)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、梭菌属(Clostridium)、地芽孢杆菌属(Geobacillus)、热解纤维素菌属(Caldicellulosiruptor)、热酸菌属(Acidothermus)、Thermobifidia或海洋芽孢杆菌属(Oceanobacillus)多肽，所述多肽具有酶活性；或革兰氏阴性细菌多肽，如大肠杆菌、假单胞菌属(Pseudomonas)、沙门氏菌属(Salmonella)、弯曲杆菌属(Campylobacter)、螺杆菌属(Helicobacter)、黄杆菌属(Flavobacterium)、梭杆菌属(Fusobacterium)、泥杆菌属(Ilyobacter)、奈瑟氏菌属(Neisseria)或脲原体属(Ureaplasma)多肽，所述多肽具有酶活性。

在一个方面，所述多肽是具有酶活性的嗜碱芽孢杆菌(Bacillus alkalophilus)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、短芽孢杆菌(Bacillus brevis)、环状芽孢杆菌(Bacillus circulans)、克劳氏芽孢杆菌(Bacillus clausii)、凝结芽孢杆菌(Bacillus coagulans)、坚强芽孢杆菌(Bacillus firmus)、灿烂芽孢杆菌(Bacilluslautus)、迟缓芽孢杆菌(Bacillus lentus)、地衣芽孢杆菌(Bacillus licheniformis)、巨大芽孢杆菌(Bacillus megaterium)、短小芽孢杆菌(Bacillus pumilus)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)、枯草芽孢杆菌(Bacillus subtilis)或苏云金芽孢杆菌(Bacillus thuringiensis)多肽。

在另一个优选的方面，所述多肽是具有酶活性的似马链球菌(Streptococcusequisimilis)、酿脓链球菌(Streptococcus pyogenes)、乳房链球菌(Streptococcusuberis)或马链球菌兽瘟亚种(Streptococcus equi subsp.Zooepidemicus)多肽。

在另一个优选的方面，所述多肽是具有酶活性的不产色链霉菌(Streptomycesachromogenes)、除虫链霉菌(Streptomyces avermitilis)、天蓝链霉菌(Streptomycescoelicolor)、灰色链霉菌(Streptomyces griseus)或浅青紫链霉菌(Streptomyceslividans)多肽。

具有酶活性的多肽也可以是真菌多肽，并且更优选具有酶活性的酵母多肽如假丝酵母属(Candida)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)或西洋蓍霉属(Yarrowia)多肽；或更优选具有酶活性的丝状真菌多肽如枝顶孢霉属(Acremonium)、伞菌属(Agaricus)、链格孢属(Alternaria)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、Botryospaeria、拟蜡菌属(Ceriporiopsis)、毛喙壳属(Chaetomidium)、金孢子菌属(Chrysosporium)、Claviceps、Cochliobolus、鬼伞属(Coprinopsis)、Coptotermes、棒囊壳属(Corynascus)、隐丛赤壳菌属(Cryphonectria)、隐球菌属(Cryptococcus)、色二孢属(Diplodia)、黑耳属(Exidia)、Filibasidium、镰孢属(Fusarium)、赤霉属(Gibberella)、全鞭毛虫属(Holomastigotoides)、腐质霉属(Humicola)、耙齿菌属(Irpex)、蘑菇属(Lentinula)、Leptospaeria、梨孢菌属(Magnaporthe)、Melanocarpus、多孔菌属(Meripilus)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、新考玛脂霉属(Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、平革菌属(Phanerochaete)、瘤胃壶菌属(Piromyces)、Poitrasia、假黑盘菌属(Pseudoplectania)、Pseudotrichonympha、根毛霉属(Rhizomucor)、裂褶菌属(Schizophyllum)、柱顶孢属(Scytalidium)、踝节菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、木霉属(Trichoderma)、长毛盘菌属(Trichophaea)、轮枝孢属(Verticillium)、包脚菇属(Volvariella)或炭角菌属(Xylaria)多肽其。

在一个方面，所述多肽是具有酶活性的卡尔酵母(Saccharomycescarlsbergensis)、酿酒酵母(Saccharomyces cerevisiae)、糖化酵母(Saccharomycesdiastaticus)、道格拉氏酵母(Saccharomyces douglasii)、克鲁弗酵母(Saccharomyceskluyveri)、诺地酵母(Saccharomyces norbensis)或卵形酵母(Saccharomycesoviformis)多肽。

在一个方面，所述多肽是具有酶活性的解纤维枝顶孢霉(Acremoniumcellulolyticus)、棘孢曲霉(Aspergillus aculeatus)、泡盛曲霉(Aspergillusawamori)、烟曲霉(Aspergillus fumigatus)、臭曲霉(Aspergillus foetidus)、日本曲霉(Aspergillusjaponicus)、构巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillusniger)、米曲霉(Aspergillus oryzae)、嗜角质金孢子菌(Chrysosporiumkeratinophilum)、Chrysosporium lucknowense、热带金孢子菌(Chrysosporiumtropicum)、Chrysosporium merdarium、Chrysosporium inops、毡金孢子菌(Chrysosporium pannicola)、Chrysosporium queenslandicum、Chrysosporium zonatum、杆孢状镰孢(Fusarium bactridioides)、禾谷镰孢(Fusarium cerealis)、库威镰孢(Fusarium crookwellense)、大刀镰孢(Fusarium culmorum)、禾本科镰孢(Fusariumgraminearum)、禾赤镰孢(Fusarium graminum)、异孢镰孢(Fusarium heterosporum)、合欢木镰孢(Fusarium negundi)、尖镰孢(Fusarium oxysporum)、多枝镰孢(Fusariumreticulatum)、粉红镰孢(Fusarium roseum)、接骨木镰孢(Fusarium sambucinum)、肤色镰孢(Fusarium sarcochroum)、拟分枝孢镰孢(Fusarium sporotrichioides)、硫色镰孢(Fusarium sulphureum)、圆镰孢(Fusarium torulosum)、拟丝孢镰孢(Fusariumtrichothecioides)、镶片镰孢(Fusarium venenatum)、灰腐质霉(Humicola grisea)、特异腐质霉(Humicola insolens)、疏棉状腐质霉(Humicola lanuginosa)、白耙齿菌(Irpexlacteus)、米黑毛霉(Mucor miehei)、嗜热毁丝霉(Myceliophthora thermophila)、粗糙脉孢菌(Neurospora crassa)、绳状青霉(Penicillium funiculosum)、产紫青霉(Penicillium purpurogenum)、黄孢平革菌(Phanerochaete chrysosporium)、无色梭孢壳(Thielavia achromatica)、Thielavia albomyces、Thielavia albopilosa、澳洲梭孢壳(Thielavia australeinsis)、Thielavia fimeti、小孢梭孢壳(Thielavia microspora)、卵孢梭孢壳(Thielavia ovispora)、Thielavia peruviana、瘤孢梭孢壳(Thielaviaspededonium)、毛梭孢壳(Thielavia setosa)、Thielavia subthermophila、土生梭孢壳(Thielavia terrestris)、哈茨木霉(Trichoderma harzianum)、康宁木霉(Trichodermakoningii)、长枝木霉(Trichoderma longibrachiatum)、里氏木霉(Trichoderma reesei)、绿色木霉(Trichoderma viride)或褐孢长毛盘菌(Trichophaea saccata)多肽。

还可以使用具有酶活性的多肽的经化学修饰或蛋白质工程改造的突变体。

所述纤维素分解酶组合物的一种或多种(例如几种)组分可以是重组组分，亦即，通过克隆编码所述单独组分的DNA序列并随后用该DNA序列转化细胞并在宿主中表达(参见，例如，WO91/17243和WO91/17244)产生。所述宿主优选是异源宿主(酶对宿主是外源的)，但该宿主在一定条件下也可以是同源宿主(酶对宿主是天然的)。单组分纤维素分解蛋白还可以通过从发酵液中提纯这样的蛋白质来制备。

在一个方面，所述一种或多种(例如几种)纤维素分解酶包含商业性纤维素分解酶制备物。适用于本发明的商业的纤维素分解酶制备物的实例包括，例如，CELLIC^TM CTecCtec3(Novozymes A/S)、CELLIC^TM Ctec CTec2(Novozymes A/S)、CTec(Novozymes A/S)、CELLUCLAST^TM(Novozymes A/S)、NOVOZYM^TM 188(Novozymes A/S)、CELLUZYME^TM(Novozymes A/S)、CEREFLO^TM (Novozymes A/S)和ULTRAFLO^TM (Novozymes A/S)，ACCELERASE^TM(Genencor Int.)、LAMINEX^TM(Genencor Int.)、SPEZYME^TM CP(GenencorInt.)，NL(DSM)、S/L 100(DSM)，ROHAMENT^TM 7069W(GmbH)，LDI(Dyadic International,Inc.)、LBR(DyadicInternational,Inc.)或150L(Dyadic International,Inc.)。所述纤维素酶酶以固体的约0.001至约5.0wt％，例如固体的约0.025至约4.0wt％，或固体的约0.005至约2.0wt％的有效量添加。

可以用于本发明的方法的细菌内切葡聚糖酶的实例包括但不仅限于，解纤维热酸菌(Acidothermus cellulolyticus)内切葡聚糖酶(WO 91/05039；WO 93/15186；美国专利5,275,944；WO 96/02551；美国专利5,536,655，WO 00/70031，WO 05/093050)；Thermobifida fusca内切葡聚糖酶III(WO 05/093050)；和Thermobifida fusca内切葡聚糖酶V(WO 05/093050)。

可以用于本发明的真菌内切葡聚糖酶的实例包括但不仅限于，里氏木霉内切葡聚糖酶I(Penttila等,1986,Gene 45:253-263，里氏木霉Cel7B内切葡聚糖酶I(GENBANK^TM登录号M15665)；里氏木霉内切葡聚糖酶II(Saloheimo等,1988,Gene 63:11-22)，里氏木霉Cel5A内切葡聚糖酶II(GENBANK^TM登录号M19373)；里氏木霉内切葡聚糖酶III(Okada等,1988,Appl.Environ.Microbiol.64:555-563；GENBANK^TM登录号AB003694)；里氏木霉内切葡聚糖酶V(Saloheimo等,1994,Molecular Microbiology 13:219-228；GENBANK^TM登录号Z33381)；棘孢曲霉内切葡聚糖酶(Ooi等,1990,Nucleic Acids Research 18:5884)；川地曲霉(Aspergillus kawachii)内切葡聚糖酶(Sakamoto等,1995,Current Genetics 27:435-439)；胡萝卜软腐欧文氏菌(Erwinia carotovara)内切葡聚糖酶(Saarilahti等,1990,Gene 90:9-14)；尖镰孢内切葡聚糖酶(GENBANK^TM登录号L29381)；灰腐质霉thermoidea变种内切葡聚糖酶(GENBANK^TM登录号AB003107)；Melanocarpus albomyces内切葡聚糖酶(GENBANK^TM登录号MAL515703)；粗糙脉孢菌内切葡聚糖酶(GENBANK^TM登录号XM_324477)；特异腐质霉内切葡聚糖酶V；嗜热毁丝霉CBS 117.65内切葡聚糖酶；担子菌纲(basidiomycete)CBS 495.95内切葡聚糖酶；担子菌纲CBS 494.95内切葡聚糖酶；土生梭孢霉NRRL 8126 CEL6B内切葡聚糖酶；土生梭孢霉NRRL 8126 CEL6C内切葡聚糖酶；土生梭孢霉NRRL 8126 CEL7C内切葡聚糖酶；土生梭孢霉NRRL 8126 CEL7E内切葡聚糖酶；土生梭孢霉NRRL 8126 CEL7F内切葡聚糖酶；Cladorrhinum foecundissimum ATCC 62373 CEL7A内切葡聚糖酶；以及里氏木霉菌株No.VTT-D-80133内切葡聚糖酶(GENBANK^TM登录号M15665)。

可用于本发明的纤维二糖水解酶的实例包括但不仅限于，里氏木霉纤维二糖水解酶I，里氏木霉纤维二糖水解酶II，特异腐质霉纤维二糖水解酶I，嗜热毁丝霉纤维二糖水解酶II，土生梭孢霉纤维二糖水解酶II(CEL6A)，嗜热毛壳菌(Chaetomium thermophilum)纤维二糖水解酶I，和嗜热毛壳菌纤维二糖水解酶II。

可用于本发明的β-葡糖苷酶的实例包括但不仅限于米曲霉β-葡糖苷酶、烟曲霉β-葡糖苷酶、巴西青霉IBT 20888β-葡糖苷酶、黑曲霉β-葡糖苷酶和棘孢曲霉β-葡糖苷酶。

米曲霉β-葡糖苷酶可根据WO 2002/095014获得。烟曲霉β-葡糖苷酶可根据WO2005/047499获得。巴西青霉β-葡糖苷酶可根据WO 2007/019442获得。黑曲霉β-葡糖苷酶可根据Dan等,2000,J.Biol.Chem.275:4973-4980获得。棘孢曲霉β-葡糖苷酶可根据Kawaguchi等,1996,Gene 173:287-288获得。

所述β-葡糖苷酶可以是融合蛋白。在一个方面，所述β-葡糖苷酶是米曲霉β-葡糖苷酶变体BG融合蛋白或米曲霉β-葡糖苷酶融合蛋白(根据WO 2008/057637获得)。

其它可用的内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶公开于使用根据Henrissat B.,1991,A classification of glycosyl hydrolases based on amino-acidsequence similarities,Biochem.J.280:309-316和Henrissat B.和Bairoch A.,1996,Updating the sequence-based classification of glycosyl hydrolases,Biochem.J.316:695-696分类的许多糖基水解酶家族中。

其它可用于本发明的纤维素分解酶描述于EP 495,257，EP 531,315，EP 531,372，WO 89/09259，WO 94/07998，WO 95/24471，WO 96/11262，WO 96/29397，WO 96/034108，WO97/14804，WO 98/08940，WO 98/012307，WO 98/13465，WO 98/015619，WO 98/015633，WO98/028411，WO 99/06574，WO 99/10481，WO 99/025846，WO 99/025847，WO 99/031255，WO2000/009707，WO 2002/050245，WO 2002/0076792，WO 2002/101078，WO 2003/027306，WO2003/052054，WO 2003/052055，WO 2003/052056，WO 2003/052057，WO 2003/052118，WO2004/016760，WO 2004/043980，WO 2004/048592，WO 2005/001065，WO 2005/028636，WO2005/093050，WO 2005/093073，WO 2006/074005，WO 2006/117432，WO 2007/071818，WO2007/071820，WO 2008/008070，WO 2008/008793，美国专利号4,435,307，美国专利号5,457,046，美国专利号5,648,263，美国专利号5,686,593，美国专利号5,691,178，美国专利号5,763,254，和美国专利号5,776,757。

在本发明的方法中，可使用任何具有纤维素分解增强活性的GH61多肽。

在第一个方面，所述具有纤维素分解增强活性的GH61多肽包含下述基序：

[ILMV]-P-X(4,5)-G-X-Y-[ILMV]-X-R-X-[EQ]-X(4)-[HNQ]和[FW]-[TF]-K-[AIV]，

其中X为任意氨基酸，X(4,5)为在4或5个连续位置上的任意氨基酸，而X(4)是在4个连续位置上的任意氨基酸。

包含上述所示的基序的GH61多肽可进一步包含：

H-X(1,2)-G-P-X(3)-[YW]-[AILMV]，

[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV]，或

H-X(1,2)-G-P-X(3)-[YW]-[AILMV]和[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV]，

其中X为任意氨基酸，X(1,2)为在1个位置或2个连续位置上的任意氨基酸，X(3)为3个连续位置上的任意氨基酸，而X(2)为2个连续位置上的任意氨基酸。在上述基序中，采用公认的IUPAC单字母氨基酸缩写。

在一个优选的方面，所述具有纤维素分解增强活性的GH61多肽还包含H-X(1,2)-G-P-X(3)-[YW]-[AILMV]。在另一个优选的方面，具有纤维素分解增强活性的GH61多肽还包含[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV]。在另一个优选的方面，具有纤维素分解增强活性的GH61多肽还包含H-X(1,2)-G-P-X(3)-[YW]-[AILMV]和[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV]。

在第二个方面，所述具有纤维素分解增强活性的GH61多肽包含下述基序：

[ILMV]-P-x(4,5)-G-x-Y-[ILMV]-x-R-x-[EQ]-x(3)-A-[HNQ]，

其中x为任意氨基酸，x(4,5)为在4或5个连续位置上的任意氨基酸，而x(3)为3个连续位置上的任意氨基酸。在上述基序中，采用公认的IUPAC单字母氨基酸缩写。

可用于本发明的方法的具有纤维素分解增强活性的GH61多肽的实例包括但不限于来自土生梭孢霉(WO 2005/074647，WO 2008/148131和WO 2011/035027)的具有纤维素分解增强活性的多肽；来自桔橙嗜热子囊菌的具有纤维素分解增强活性的多肽(WO 2005/074656和WO 2010/065830)，来自里氏木霉的具有纤维素分解增强活性的多肽(WO 2007/089290)，来自嗜热毁丝霉的具有纤维素分解增强活性的多肽(WO 2009/085935，WO 2009/085859，WO 2009/085864，WO 2009/085868)，来自烟曲霉的具有纤维素分解增强活性的多肽(WO 2010/138754)，和来自嗜松青霉(Penicillium pinophilum)(WO 2011/005867)，嗜热子囊菌菌种(WO 2011/039319)，青霉属菌种(WO 2011/041397)，和Thermoascuscrustaceous(WO 2011/041504)的具有纤维素分解增强活性的多肽。

在一个方面，所述具有纤维素分解增强活性的GH61多肽根据WO 2008/151043在可溶性致活化二价金属阳离子，例如硫酸锰的存在下使用。

在一个方面，所述具有纤维素分解增强活性的GH61多肽在二氧化合物、二环化合物、杂环化合物、含氮化合物、醌化合物、含硫化合物或从经预处理的纤维素材料(如经预处理的玉米秸秆(PCS))获得的液剂的存在下使用。

所述二氧化合物可包括任何含有两个或更多氧原子的合适化合物。在一些方面，所述二氧化合物含有如本文中所述的取代的芳基模块(moiety)。所述二氧化合物可包括一个或多个(例如几个)羟基和/或羟基衍生物，但亦包括缺乏羟基和羟基衍生物的取代的芳基模块。二氧化合物的非限定性实例包括邻苯二酚或儿茶酚；咖啡酸；3,4-二羟基苯甲酸；4-叔丁基-5-甲氧基-1,2-苯二酚；连苯三酚；没食子酸；甲基-3,4,5-三羟基苯甲酸；2,3,4-三羟基二苯甲酮；2,6-二甲氧基苯酚；芥子酸；3,5-二羟基苯甲酸；4-氯-1,2-苯二酚；4-硝基-1,2-苯二酚；鞣酸；没食子酸乙酯；羟乙酸甲酯；二羟基延胡索酸；2-丁炔-1,4-二醇；克酮酸；1,3-丙二醇；酒石酸；2,4-戊二醇；3-乙氧基-1,2-丙二醇；2,4,4’-三羟基二苯甲酮；顺-2-丁烯-1,4-二醇；3,4-二羟基-3-环丁烯-1,2-二酮；二羟基丙酮；乙酰丙烯醛(acroleinacetal)；甲基-4-羟基苯甲酸；4-羟基苯甲酸；和甲基-3,5-二甲氧基-4-羟基苯甲酸；或它们的盐或溶剂合物(solvate)。

所述二环化合物可包括任何如本文中所述的合适的取代稠环系统。所述化合物可包含一个或多个(例如几个)额外的环，且除非另行说明，不限于具体的环数。在一个方面，所述二环化合物是类黄酮。在另一个方面，所述二环化合物是任选取代的异类黄酮(isoflavonoid)。在另一个方面，所述二环化合物是任选取代的花色离子(flavyliumion)，如任选取代的花色素或任选取代的花色苷，或其衍生物。二环化合物的非限定性实例包括表儿茶素(epicatechin)；槲皮素(quercetin)；杨梅黄酮(myricetin)；黄杉素(taxifolin)；山奈酚(kaempferol)；桑素(morin)；金合欢素(acacetin)；柚皮素(naringenin)；异鼠李黄素(isorhamnetin)；芹菜苷配基(apigenin)；花青素(cyanidin)；花色素苷(cyanin)；kuromanin；花青素鼠李葡糖苷(keracyanin)；或它们的盐或溶剂合物。

所述杂环化合物可为任何合适的化合物，如本文中所述的任选取代的包含杂原子的芳环或非芳环。在一个方面，所述杂环是包含任选取代的杂环烷基模块或任选取代的杂芳基模块的化合物。在另一个方面，所述任选取代的杂环烷基模块或任选取代的杂芳基模块是任选取代的五元杂环烷基或任选取代的五元杂芳基模块。在另一个方面，任选取代的杂环烷基或任选取代的杂芳基模块是选自如下的任选取代的模块：吡唑基、呋喃基、咪唑基、异噁唑基、噁二唑基、噁唑基、吡咯基、吡啶基、嘧啶基、哒嗪基、噻唑基、三唑基、噻吩基(thienyl)、二氢噻吩-吡唑基(dihydrothieno-pyrazolyl)、硫茚基、咔唑基、苯并咪唑基、苯并噻吩基(benzothienyl)、苯并呋喃基、吲哚基、喹啉基、苯并三唑基、苯并噻唑基、苯并噁唑基(benzooxazolyl)、苯并咪唑基、异喹啉基、异吲哚基、吖啶基、苯并异噁唑基(benzoisazolyl)、二甲基乙内酰脲、吡嗪基、四氢呋喃基、吡咯啉基、吡咯烷基、吗啉基、吲哚基、二氮杂环庚三烯基(diazepinyl)、氮杂环庚三烯基(azepinyl)、硫杂环庚三烯基(thiepinyl)、哌啶基和氧杂环庚三烯基(oxepinyl)。在另一个方面，所述任选取代的杂环烷基模块或任选取代的杂芳基模块是任选取代的呋喃基。杂环化合物的非限定性实例包括(1,2-二羟乙基)-3,4-二氢呋喃-2(5H)-酮；4-羟基-5-甲基-3-呋喃酮；5-羟基-2(5H)-呋喃酮；[1,2-二羟乙基]呋喃-2,3,4(5H)-三酮；α-羟基-γ-丁内酯；核糖酸γ-内酯；己醛糖酸γ-内酯(aldohexuronicaldohexuronic acidγ-lactone)；葡糖酸δ-内酯；4-羟基香豆素；二氢苯并呋喃；5-(羟甲基)糠醛；糠偶姻(furoin)；2(5H)-呋喃酮；5,6-二氢-2H-吡喃-2-酮；和5,6-二氢-4-羟基-6-甲基-2H-吡喃-2-酮；或它们的盐或溶剂合物。

所述含氮化合物可为任何具有一个或多个氮原子的合适化合物。在一个方面，所述含氮化合物包含胺、亚胺、羟胺或氧化亚氮(nitroxide)模块。含氮化合物的非限定性实例包括丙酮肟；紫尿酸；吡啶-2-醛肟；2-氨基苯酚；1,2-苯二胺；2,2,6,6-四甲基-1-哌啶基氧(piperidinyloxy)；5,6,7,8-四氢生物蝶呤；6,7-二甲基-5,6,7,8-四氢蝶呤；和马来酰胺酸；或它们的盐或溶剂合物。

所述醌化合物可为任何本文中所述的包含醌模块的合适的化合物。醌化合物的非限定性实例包括1,4-苯醌；1,4-萘醌；2-羟基-1,4-萘醌；2,3-二甲氧基-5-甲基-1,4-苯醌或辅酶Q₀；2,3,5,6-四甲基-1,4-苯醌或四甲基对苯醌；1,4-二羟基蒽醌；3-羟基-1-甲基-5,6-二氢吲哚二酮或肾上腺色素；4-叔丁基-5-甲氧基-1,2-苯醌；吡咯并喹啉醌(pyrroloquinoline quinone)；或它们的盐或溶剂合物。

所述含硫化合物可为任何包含一个或多个硫原子的合适的化合物。在一个方面，所述含硫化合物包含选自如下的模块：亚硫酰，硫醚，亚磺酰，磺酰，磺酰胺(sulfamide)，磺酰胺(sulfonamide)，磺酸和磺酸酯。含硫化合物的非限定性实例包括乙硫醇；2-丙硫醇；2-丙烯-1-硫醇；2-巯基乙磺酸；苯硫醇；苯-1,2-二硫醇；半胱氨酸；甲硫氨酸；谷胱甘肽；胱氨酸；或它们的盐或溶剂合物。

在一个方面，如上所述的化合物对纤维素材料的有效量以对纤维素的糖单元的摩尔比计为约10^-6至约10，例如约10^-6至约7.5，约10^-6至约5，约10^-6至约2.5，约10^-6至约1，约10^-5至约1，约10^-5至约10^-1，约10^-4至约10^-1，约10^-3至约10^-1，和约10^-3至约10^-2。在另一个方面，如上所述的化合物的有效量为约0.1μM至约1M，例如约0.5μM至约0.75M，约0.75μM至约0.5M，约1μM至约0.25M，约1μM至约0.1M，约5μM至约50mM，约10μM至约25mM，约50μM至约25mM，约10μM至约10mM，约5μM至约5mM，或约0.1mM至约1mM。

术语“液剂(liquor)”意指在本文中所述的条件下，通过处理浆料中的木素纤维素和/或半纤维素材料，或其单糖例如木糖、阿拉伯糖、甘露糖等，所产生的溶液相，即水相、有机相或其组合，及其可溶性内含物。用于GH61多肽的纤维素分解增强的液剂可通过施加热和/或压力处理纤维素材料或半纤维素材料(或原料)，然后将溶液与残余固体分离来产生，所述处理任选在催化剂例如酸的存在下、任选在有机溶剂的存在下进行，且任选与对所述材料的物理破坏相结合。这样的条件决定了在用纤维素酶制备物水解纤维素材料的过程中，通过液剂和GH61多肽的组合所能获得的纤维素分解增强的程度。所述液剂可使用本领域中的标准方法如过滤、沉积或离心从经处理的材料分离。

在一个方面，所述液剂对纤维素的有效量为约10^-6至约10g每g纤维素，例如约10^-6至约7.5g，约10^-6至约5，约10^-6至约2.5g，约10^-6至约1g，约10^-5至约1g，约10^-5至约10^-1g，约10^-4至约10^-1g，约10^-3至约10^-1g，和约10^-3至约10^-2g每g纤维素。

在一个实施方案中，所述一种或多种(例如几种)半纤维素分解酶包含商业性半纤维素分解酶制备物。适用于本发明的商业性半纤维素分解酶制备物的实例包括，例如SHEARZYME^TM(Novozymes A/S)、HTec(Novozymes A/S)、Htec2(Novozymes A/S)、(Novozymes A/S)、(Novozymes A/S)、HC(Novozymes A/S)、Xylanase(Genencor)、XY(Genencor)、XC(Genencor)、TX-200A(AB Enzymes)、HSP 6000 Xylanase(DSM)、DEPOL^TM 333P(Biocatalysts Limit,Wales,UK)、DEPOL^TM 740L(Biocatalysts Limit,Wales,UK)和DEPOL^TM 762P(BiocatalystsLimit,Wales,UK)。

可用于本发明方法的木聚糖酶的实例包括但不限于棘孢曲霉(Aspergillusaculeatus)木聚糖酶(GeneSeqP:AAR63790；WO 94/21785)、烟曲霉(Aspergillusfumigatus)木聚糖酶(WO 2006/078256)、嗜松青霉(WO 2011/041405)、青霉属菌种(WO2010/126772)、土生梭孢霉(Thielavia terrestris)NRRL 8126(WO 2009/079210)和褐孢长毛盘菌GH10(WO 2011/057083)。

可用于本发明方法的β-木糖苷酶的实例包括但不限于、里氏木霉(Trichodermareesei)β-木糖苷酶(UniProtKB/TrEMBL登录号Q92458)，埃默森踝节菌(Talaromycesemersonii)(SwissProt登录号Q8X212)，和粗糙脉孢菌(Neurospora crassa)(SwissProt登录号Q7SOW4)。

可用于本发明方法的乙酰木聚糖酯酶的实例包括但不限于来自棘孢曲霉(WO2010/108918)、球毛壳菌(Chaetomium globosum)(Uniprot登录号Q2GWX4)、细丽毛壳菌(Chaetomium gracile)(GeneSeqP登录号AAB82124)、特异腐质霉(Humicola insolens)DSM1800(WO 2009/073709)、红褐肉座菌(Hypocrea jecorina)(WO 2005/001036)、嗜热毁丝霉(Wo 2010/014880)、粗糙脉孢菌(UniProt登录号q7s259)、颖枯壳针孢(Phaeosphaerianodorum)(Uniprot登录号Q0UHJ1)和土生梭孢霉NRRL 8126(WO 2009/042846)的乙酰木聚糖酯酶。

可用于本发明方法的阿魏酸酯酶的实例包括但不限于特异腐质霉DSM1800(WO2009/076122)阿魏酸酯酶、粗糙脉孢菌阿魏酸酯酶(UniProt登录号Q9HGR3)、和费希新萨托菌(Neosartorya fischer)(UniProt登录号A1D9T4)阿魏酸酯酶。

可用于本发明方法的阿拉伯呋喃糖苷酶的实例包括但不限于来自黑曲霉(Aspergillus niger)(GeneSeqP登录号AAR94170)、特异腐质霉(Humicola insolens)DSM1800(WO 2006/114094和WO 2009/073383)和M.giganteus(WO 2006/114094)的阿拉伯呋喃糖苷酶。

可用于本发明方法的α-葡糖醛酸糖苷酶的实例包括但不限于来自棒曲霉(Aspergillus clavatus)(UniProt登录号alcc12)、烟曲霉(SwissProt登录号Q4WW45)、黑曲霉(Uniprot登录号Q96WX9)、土曲霉(Aspergillus terreus)(SwissProt登录号Q0CJP9)、特异腐质霉(WO 2010/014706)、橘灰青霉(WO 2009/068565)、埃默森踝节菌(UniProt登录号Q8X211)和里氏木霉(Uniprot登录号Q99024)的α-葡糖醛酸糖苷酶。

用于本发明方法的具有酶活性的多肽可通过在含有合适碳源和氮源和无机盐的营养培养基上，使用本领域已知方法(参见，例如Bennett,J.W.和LaSure,L.(编),MoreGene Manipulations in Fungi,Academic Press,CA,1991)发酵上文指出的微生物菌株来产生。合适的培养基可从供应商获得，或可根据已公开的组成(例如美国典型培养物保藏中心的目录)来制备。适于生长和酶产生的温度范围和其他条件在本领域是已知的(参见，例如Bailey,J.E.和Ollis,D.F.,Biochemical Engineering Fundamentals,McGraw-HillBook Company,NY,1986)。

所述发酵可以是任何导致酶或蛋白表达或分离的培养细胞的方法。因此，发酵可以理解为包括在合适的培养基中并在允许所述酶得以表达或分离的条件下进行的摇瓶培养，或在实验室或工业发酵罐中的小-或大规模发酵(包括连续、分批、补料分批或固态发酵)。通过上述方法产生的所得的酶可从发酵培养基回收并通过常规方法纯化。

所述组合物可为发酵液配制物或细胞组合物，如本文中所述。在一些实施方案中，所述组合物是含有机酸、已被杀灭的细胞和/或细胞碎片、以及培养基的已杀灭细胞的(cell-killed)全培养液。

在一个方面，本发明涉及全培养液配制物或细胞培养组合物，其包含一种或多种(例如几种)具有纤维素分解和/或半纤维素分解活性的酶和具有过氧化氢酶活性的多肽。

术语“发酵液”用于本文中指由细胞发酵产生的、不经历或仅经历最低限的回收和/或纯化的制备物。举例而言，当让微生物培养物生长至饱和，在限制碳的条件下温育以允许蛋白合成(例如由宿主细胞表达酶)，并分泌入细胞培养基时，产生发酵液。所述发酵液可含有在发酵终止时得到的发酵材料的未分级或分级的内含物。通常而言，发酵液是未分级的，并包含去除微生物细胞(例如丝状真菌细胞)(例如通过离心去除)之后存在的废培养基和细胞碎片。在一些实施方案中，所述发酵液含有废细胞培养基，胞外酶，和有活力的和/或无活力的(viable and/or nonviable)微生物细胞。

在一个实施方案中，所述发酵液配制物和细胞组合物包含第一有机酸组分和第二有机酸组分，所述第一有机酸组分包含至少一种1-5碳的有机酸和/或其盐，而所述第二有机酸组分包含至少一种6个或更多个碳的有机酸和/或其盐。在一个具体实施方案中，所述第一有机酸组分是乙酸、甲酸、丙酸、它们的盐，或前述两者或更多者的混合物，而所述第二有机酸组分是苯甲酸、环己烷羧酸、4-甲基戊酸、苯乙酸、它们的盐，或前述两个或更多个的混合物。

在一个方面，所述组合物含有有机酸，并任选地还含有已被杀灭的细胞和/或细胞碎片。在一个实施方案中，从已杀灭细胞的全培养液中移除所述已被杀灭的细胞和/或细胞碎片，以提供不含这些组分的组合物。

所述发酵液配制物或细胞组合物可进一步包含防腐剂和/或抗微生物(例如抑菌)剂，包括但不限于山梨醇、氯化钠、山梨酸钾和其它本领域中已知的。

所述已杀灭细胞的全培养液或组合物可含有在发酵终止时得到的发酵材料的未分级内含物。通常而言，所述已杀灭细胞的全培养液或组合物含有让微生物细胞(例如丝状真菌细胞)生长至饱和，在限制碳的条件下温育以允许蛋白合成之后存在的废培养基和细胞碎片。在一些实施方案中，所述细胞杀灭的全培养液或组合物含有用过的细胞培养基，胞外酶，和杀灭的丝状真菌细胞。在一些实施方案中，在细胞杀灭的全培养液或组合物中存在的微生物细胞可使用本领域中已知的方法渗透和/或裂解。

如本文中所述的全培养液或细胞组合物通常为液体，但可含有不溶性组分，如被杀灭的细胞、细胞碎片、培养基组分和/或不溶性酶。在一些实施方案中，可去除不溶性组分以提供澄清的液体组合物。

本发明的全培养液配制物和细胞组合物可通过WO 90/15861或WO 2010/096673中描述的方法来产生。

在一个方面，本发明涉及本发明的酶组合物在降解或转化纤维素材料中的用途。

发酵。可通过一种或多种(例如几种)能将糖直接或间接发酵成所需发酵产物的发酵微生物发酵自经水解的纤维素材料获得的可发酵糖。“发酵”或“发酵方法”指任何发酵方法或包含发酵步骤的任何方法。发酵方法还包括用于消费品醇工业(例如，啤酒和葡萄酒)、乳品业(例如，发酵乳产品)、皮革业和烟草业的发酵方法。发酵条件依赖于期望的发酵产物和发酵生物体，并且能由本领域的技术人员容易地确定。

在发酵步骤中，作为预处理和酶水解步骤的结果从纤维素材料释放的糖，通过发酵生物体(如酵母)发酵成为产物，例如，乙醇。如本文中所述，水解(糖化)和发酵可以是单独或同时的。

在实施本发明的发酵步骤中可以使用任何合适的经水解的纤维素材料。通常根据所需发酵产品(即，要从发酵获得的物质)和使用的方法来选择所述材料，如本领域中所公知的。

术语“发酵培养基”在本文中可理解为指加入发酵微生物之前的培养基，如，由糖化过程产生的培养基，以及同步的糖化和发酵方法(SSF)中使用的培养基。

“发酵微生物”指适用于理想的发酵方法产生发酵产物的任何微生物，包括细菌和真菌生物体。发酵生物体可以是己糖和/或戊糖发酵生物体，或它们的组合。己糖和戊糖发酵生物体均在本领域公知。合适的发酵微生物能将糖(如葡萄糖、木糖、木酮糖、阿拉伯糖、麦芽糖、甘露糖、半乳糖和/或寡糖)直接或间接地发酵(即，转化)成所需的发酵产品。可产生乙醇的细菌和真菌发酵生物体的实例如Lin等,2006,Appl.Microbiol.Biotechnol.69:627-642所述。

能发酵己糖的发酵微生物的实例包括细菌和真菌生物体，如酵母。优选的酵母包括假丝酵母属、克鲁维酵母属和酵母属，例如Candida sonorensis、马克斯克鲁维酵母和酿酒酵母的菌株。

以其天然状态能发酵戊糖的发酵生物体的实例包括细菌和真菌生物体，如一些酵母。优选的木糖发酵酵母包括假丝酵母属，优选休哈塔假丝酵母(Candida sheatae)或Candida sonorensis的菌株；和毕赤酵母属，优选树干毕赤酵母(Pichia stipitis)的菌株，如树干毕赤酵母CBS 5773的菌株。优选的戊糖发酵酵母包括管囊酵母属(Pachysolen)，优选嗜鞣管囊酵母(Pachysolen tannophilus)的菌株。不能够发酵戊糖如木糖和阿拉伯糖的生物可通过本领域已知方法遗传修饰而发酵戊糖。

能有效地将己糖和戊糖发酵成乙醇的细菌包括，例如，凝结芽孢杆菌(Bacilluscoagulans)、丙酮丁醇梭菌(Clostridium acetobutylicum)、热纤维梭菌(Clostridiumthermocellum)、Clostridium phytofermentans、地芽孢杆菌属菌种、解糖热厌氧杆菌(Thermoanaerobacter saccharolyticum)和运动发酵单胞菌(Zymomonas mobilis)(Philippidis,1996,见上文)。

其它发酵生物包括芽孢杆菌属，如凝结芽孢杆菌；假丝酵母属，如Candidasonorensis、C.methanosorbosa、迪丹斯假丝酵母(Candida diddensii)、近平滑假丝酵母(Candida parapsilosis)、C.naedodendra、C.blankii、C.entomophilia、芸薹假丝酵母(C.brassicae)、假热带假丝酵母(Candida pseudotropicalis)、博伊丁假丝酵母(Candidaboidinii)、产朊假丝酵母(Candida utilis)和休哈塔假丝酵母(C.scehatae)；梭菌属，如丙酮丁醇梭菌、热纤维梭菌和C.phytofermentans；大肠杆菌，特别是经遗传修饰提高乙醇产量的大肠杆菌菌株；地芽孢杆菌属菌种；汉逊酵母属，如异常汉逊酵母(Hansenulaanomala)；克雷伯氏菌属(Klebsiella)，如产酸克雷伯氏菌(Klebsiella oxytoca)；克鲁维酵母属，如马克斯克鲁维酵母、乳酸克鲁维酵母(K.lactis)、K.thermotolerans和脆壁克鲁维酵母；裂殖酵母属，如粟酒裂殖酵母(S.pombe)；热厌氧杆菌属(Thermoanaerobacter)，如解糖热厌氧杆菌，和发酵单胞菌属(Zymomonas)，如运动发酵单胞菌的菌株。

在一个优选的方面，酵母是酒香酵母属(Bretannomyces)。在一个更优选的方面，酵母是克劳森酒香酵母(Bretannomyces clausenii)。在另一个更优选的方面，酵母是假丝酵母。在另一个更优选的方面，酵母是Candida sonorensis。在另一个更优选的方面，酵母是博伊丁假丝酵母。在另一个更优选的方面，酵母是Candida blankii。在另一个更优选的方面，酵母是芸薹假丝酵母。在另一个更优选的方面，酵母是迪丹斯假丝酵母。在另一个更优选的方面，酵母是Candida entomophiliia。在另一个更优选的方面，酵母是假热带假丝酵母。在另一个更优选的方面，酵母是休哈塔假丝酵母。在另一个更优选的方面，酵母是产朊假丝酵母。在另一个优选的方面，酵母是棒孢酵母属(Clavispora)。在另一个更优选的方面，酵母是葡萄牙棒孢酵母(Clavispora lusitaniae)。在另一个更优选的方面，酵母是仙人掌棒孢酵母(Clavispora opuntiae)。在另一个优选的方面，酵母是克鲁维酵母。在另一个更优选的方面，酵母是脆壁克鲁维酵母。在另一个更优选的方面，酵母是马克斯克鲁维酵母。在另一个更优选的方面，酵母是Kluyveromyces thermotolerans。在另一个优选的方面，酵母是管囊酵母属(Pachysolen)。在另一个更优选的方面，酵母是嗜鞣管囊酵母。在另一个优选的方面，酵母是毕赤酵母。在另一个更优选的方面，酵母是树干毕赤酵母。在另一个优选的方面，酵母是酵母属菌种。在另一个优选的方面，酵母是酿酒酵母。在另一个更优选的方面，酵母是糖化酵母(Saccharomyces distaticus)。在另一个更优选的方面，酵母是葡萄汁酵母(Saccharomyces uvarum)。

在一个优选的方面，细菌是芽孢杆菌属物种。在一个更优选的方面，细菌是凝结芽孢杆菌。在另一个更优选的方面，细菌是梭菌属。在另一个更优选的方面，细菌是丙酮丁醇梭菌。在另一个更优选的方面，细菌是Clostridiumphytofermentans。在另一个更优选的方面，细菌是热纤维梭菌。在另一个更优选的方面，细菌是地芽孢杆菌属菌种。在另一个更优选的方面，细菌是热厌氧杆菌属物种。在另一个更优选的方面，细菌是解糖热厌氧杆菌。在另一个更优选的方面，细菌是发酵单胞菌属物种。在另一个更优选的方面，细菌是运动发酵单胞菌。

商业上可得到的适合乙醇产生的酵母包括，例如BIOFERM^TM AFT和XR(NABC-NorthAmerican Bioproducts Corporation,GA,USA)，ETHANOL RED^TM酵母(Red Star/Lesaffre,USA)、FALI^TM(Fleischmann’s Yeast,Burns Philp Food Inc.,USA)，FERMIOL^TM(DSMSpecialties)，GERT STRAND^TM(Gert Strand AB,Sweden)以及SUPERSTART^TM和THERMOSACC^TM新鲜酵母(Ethanol Technology,WI,USA)。

在一个优选的方面，发酵微生物已经经过遗传修饰以提供发酵戊糖的能力，如利用木糖、利用阿拉伯糖和共同利用木糖和阿拉伯糖的微生物。

通过将异源基因克隆入多种发酵微生物已经构建了能将己糖和戊糖转化成乙醇(共发酵)的生物体(Chen和Ho,1993,Cloning and improving the expression of Pichiastipitis xylose reductase gene in Saccharomyces cerevisiae,Appl.Biochem.Biotechnol.39-40:135-147；Ho等,1998,Genetically engineeredSaccharomyces yeast capable of effectively cofermenting glucose and xylose,Appl.Environ.Microbiol.64:1852-1859；Kotter和Ciriacy,1993,Xylose fermentationby Saccharomyces cerevisiae,Appl.Microbiol.Biotechnol.38:776-783；Walfridsson等,1995,Xylose-metabolizing Saccharomyces cerevisiae strains overexpressingthe TKL1 and TAL1 genes encoding the pentose phosphate pathway enzymestransketolase and transaldolase,Appl.Environ.Microbiol.61:4184-4190；Kuyper等,2004,Minimal metabolic engineering of Saccharomyces cerevisiae for efficientanaerobic xylose fermentation:a proof of principle,FEMS Yeast Research 4:655-664；Beall等,1991,Parametric studies of ethanol production from xylose andother sugars by recombinant Escherichia coli,Biotech.Bioeng.38:296-303；Ingram等,1998,Metabolic engineering of bacteria for ethanol production,Biotechnol.Bioeng.58:204-214；Zhang等,1995,Metabolic engineering of a pentosemetabolism pathway in ethanologenic Zymomonas mobilis,Science 267:240-243；Deanda等,1996,Development of an arabinose-fermenting Zymomonas mobilis strainby metabolic pathway engineering,Appl.Environ.Microbiol.62:4465-4470；WO 2003/062430,xylose isomerase)。

在一个优选的方面，经过遗传修饰的发酵微生物是Candida sonorensi。在另一个优选的方面，经过遗传修饰的发酵微生物是大肠杆菌。在另一个优选的方面，经过遗传修饰的发酵微生物是产酸克雷伯氏菌。在另一个优选的方面，所述经遗传修饰的发酵微生物是马克斯克鲁维酵母。在另一个优选的方面，所述经遗传修饰的发酵微生物是酿酒酵母。在另一个优选的方面，经过遗传修饰的发酵微生物是运动发酵单胞菌。

本领域中公知的是，上述生物体还能用于产生其它物质，如本文所述。

通常向降解的纤维素材料或水解物加入发酵微生物，并进行约8至约96小时，例如约24至约60小时发酵。温度通常为约26℃至约60℃，例如约32℃或50℃，并且在约pH 3至约pH 8，例如约pH 4-5、6或7。

在一个方面，对降解的纤维素材料施用酵母和/或另一种微生物，并进行约12至约96小时，如通常为24-60小时的发酵。在另一个方面，温度优选为约20℃至约60℃，例如约25℃至约50℃，并且约32℃至约50℃，约32℃至约50℃，并且pH通常为约pH 3至约pH 7，例如约pH 4至约pH 7。然而，一些发酵生物体例如细菌，具有更高的最适发酵温度。酵母或另一种微生物优选以约10⁵-10¹²，优选约10⁷-10¹⁰，特别是约2 x 10⁸活细胞计数每ml发酵液的量施用。关于使用酵母进行发酵的进一步指导可见于例如“The Alcohol Textbook”(K.Jacques,T.P.Lyons和D.R.Kelsall编,Nottingham University Press,UnitedKingdom 1999)，其通过提述并入本文。

对于乙醇产生，在发酵之后，蒸馏发酵的浆料以提取乙醇。根据本发明的方法获得的乙醇可用作例如燃料乙醇，饮用乙醇即可饮用的中性酒，或工业乙醇。

发酵刺激剂可以与本文所述的任何方法组合使用，以进一步改进发酵工艺，尤其是改进发酵微生物的性能，如，速率增加和乙醇得率。“发酵刺激剂”指用于发酵微生物(特别是酵母)生长的刺激剂。优选的用于生长的发酵刺激剂包括维生素和矿物质。维生素的实例包括多种维生素、生物素、泛酸(盐)、烟酸、内消旋肌醇(meso-inositol)、硫胺素、吡哆醇(pyridoxine)、对氨基苯甲酸、叶酸、核黄素和维生素A、B、C、D和E。参见，例如，Alfenore等,Improving ethanol production and viability of Saccharomyces cerevisiae by avitamin feeding strategy during fed-batch process,Springer-Verlag(2002)，其通过提述并入本文。矿物质的实例包括能够提供营养物的矿物质和矿物质盐，所述营养物包括P、K、Mg、S、Ca、Fe、Zn、Mn和Cu。

发酵产物：发酵产物可以是源自发酵的任何物质。发酵产物可以是，不限于，醇(例如，阿拉伯醇、正丁醇、异丁醇、乙醇、甘油、甲醇、乙二醇、1,3-丙二醇[丙二醇]、丁二醇、丙三醇、山梨醇和木糖醇)；烷烃(例如戊烷、己烷、庚烷、辛烷、壬烷、癸烷、十一烷和十二烷)；环烷烃(例如环戊烷、环己烷、环庚烷、和环辛烷)；烯烃(例如戊烯、己烯、庚烯和辛烯)；氨基酸(例如，天冬氨酸、谷氨酸、甘氨酸、赖氨酸、丝氨酸和苏氨酸)；气体(例如，甲烷、氢气(H₂)、二氧化碳(CO₂)和一氧化碳(CO))；异戊二烯；酮(例如，丙酮)；有机酸(例如，乙酸、醋酮酸、己二酸、抗坏血酸、柠檬酸、2,5-二酮-D-葡糖酸、甲酸、反丁烯二酸、葡糖二酸、葡糖酸、葡糖醛酸、戊二酸、3-羟基丙酸、衣康酸、乳酸、苹果酸、丙二酸、草酸、草酰乙酸、丙酸、琥珀酸和木糖酸)；和聚酮化合物。发酵产物还可以是作为高价值产品的蛋白质。

在一个优选的方面，发酵产物是醇。可理解的是，术语“醇”包括包含一个或多个羟基模块的物质。在更优选的方面，所述醇是正丁醇。在另一个更优选的方面，所述醇是异丁醇。在另一个更优选的方面，所述醇是乙醇。在另一个更优选的方面，所述醇是甲醇。在另一个更优选的方面，所述醇是阿拉伯糖醇。在另一个更优选的方面，所述醇是丁二醇。在另一个更优选的方面，所述醇是乙二醇。在另一个更优选的方面，所述醇是丙三醇(glycerin)。在另一个更优选的方面，所述醇是甘油(glycerol)。在另一个更优选的方面，所述醇是1,3-丙二醇。在另一个更优选的方面，所述醇是山梨醇。在另一个更优选的方面，所述醇是木糖醇。参见，例如，Gong,C.S.,Cao,N.J.,Du,J.,和Tsao,G.T.,1999,Ethanolproduction fromrenewable resources,于Advances in Biochemical Engineering/Biotechnology,Scheper,T.编,Springer-Verlag Berlin Heidelberg,Germany,65:207-241；Silveira,M.M.,和Jonas,R.,2002,The biotechnological production of sorbitol,Appl.Microbiol.Biotechnol.59:400-408；Nigam,P.和Singh,D.,1995,Processes forfermentative production of xylitol–a sugar substitute, Process Biochemistry30(2):117-124；Ezeji,T.C.,Qureshi,N.和Blaschek,H.P.,2003,Production ofacetone,butanol and ethanol by Clostridium beijerinckii BA101 and in siturecovery by gas stripping,World Journal of Microbiology and Biotechnology 19(6):595-603。

在另一个优选的方面，所述发酵产物是烷烃。所述烷烃可以是未支化或支化的烷烃。在另一个更优选的方面，所述烷烃是戊烷。在另一个更优选的方面，所述烷烃是己烷。在另一个更优选的方面，所述烷烃是庚烷。在另一个更优选的方面，所述烷烃是辛烷。在另一个更优选的方面，所述烷烃是壬烷。在另一个更优选的方面，所述烷烃是癸烷。在另一个更优选的方面，所述烷烃是十一烷。在另一个更优选的方面，所述烷烃是十二烷。

在另一个优选的方面，所述发酵产物是环烷烃。在另一个更优选的方面，所述环烷烃是环戊烷。在另一个更优选的方面，所述环烷烃是环己烷。在另一个更优选的方面，所述环烷烃是环庚烷。在另一个更优选的方面，所述环烷烃是环辛烷。

在另一个优选的方面，所述发酵产物是烯烃。所述烯烃可为未支化或支化的烯烃。在另一个更优选的方面，所述烯烃是戊烯。在另一个更优选的方面，所述烯烃是己烯。在另一个更优选的方面，所述烯烃是庚烯。在另一个更优选的方面，所述烯烃是辛烯。

在另一个优选的方面，所述发酵产物是氨基酸。在另一个更优选的方面，所述有机酸是天冬氨酸。在另一个更优选的方面，所述氨基酸是谷氨酸。在另一个更优选的方面，所述氨基酸是甘氨酸。在另一个更优选的方面，所述氨基酸是赖氨酸。在另一个更优选的方面，所述氨基酸是丝氨酸。在另一个更优选的方面，所述氨基酸是苏氨酸。参见，例如，Richard,A.和Margaritis,A.,2004,Empirical modeling of batch fermentationkinetics for poly(glutamic acid)production and other microbial biopolymers,Biotechnology and Bioengineering 87(4):501-515。

在另一个优选的方面，所述物质是气体。在另一个更优选的方面，所述气体是甲烷。在另一个更优选的方面，所述气体是H₂。在另一个更优选的方面，所述气体是CO₂。在另一个更优选的方面，所述气体是CO。参见，例如，Kataoka,N.,A.Miya,和K.Kiriyama,1997,Studies on hydrogen production by continuous culture system of hydrogen-producing anaerobic bacteria,Water Science and Technology 36(6-7):41-47；和Gunaseelan,V.N.,1997,于Biomass and Bioenergy,卷13(1-2):83-114页,1997,Anaerobic digestion of biomass for methane production:A review。

在另一个优选的方面，所述发酵产物是异戊二烯。

在另一个优选的方面，所述发酵产物是酮。应理解的是，术语“酮”涵盖了含有一个或多个酮模块的物质。在另一个更优选的方面，所述酮是丙酮。参见，例如Qureshi和Blaschek,2003,见上文。

在另一个优选的方面，所述发酵产物是有机酸。在另一个更优选的方面，所述有机酸是乙酸。在另一个更优选的方面，所述有机酸是醋酮酸。在另一个更优选的方面，所述有机酸是己二酸。在另一个更优选的方面，所述有机酸是抗坏血酸。在另一个更优选的方面，所述有机酸是柠檬酸。在另一个更优选的方面，所述有机酸是2,5-二酮-D-葡糖酸。在另一个更优选的方面，所述有机酸是甲酸。在另一个更优选的方面，所述有机酸是反丁烯二酸。在另一个更优选的方面，所述有机酸是葡糖二酸。在另一个更优选的方面，所述有机酸是葡糖酸。在另一个更优选的方面，所述有机酸是葡糖醛酸。在另一个更优选的方面，所述有机酸是戊二酸。在另一个优选的方面，所述有机酸是3-羟基丙酸。在另一个更优选的方面，所述有机酸是衣康酸。在另一个更优选的方面，所述有机酸是乳酸。在另一个更优选的方面，所述有机酸是苹果酸。在另一个更优选的方面，所述有机酸是丙二酸。在另一个更优选的方面，所述有机酸是草酸。在另一个更优选的方面，所述有机酸是丙酸。在另一个更优选的方面，所述有机酸是琥珀酸。在另一个更优选的方面，所述有机酸是木糖酸。参见，例如，Chen,R.和Lee,Y.Y.,1997,Membrane-mediated extractive fermentation for lactic acidproduction from cellulosic biomass,Appl.Biochem.Biotechnol.63-65:435-448。

在另一个优选的方面，所述物质是聚酮化合物。

回收可以使用本领域已知的任何方法，任选地从发酵培养基回收发酵产物，所述方法包括，但不限于，层析、电泳方法、差示溶解度、蒸馏或提取。例如，通过常规蒸馏方法从发酵的纤维素材料分离并纯化醇。可以获得纯度高达约96vol.％的乙醇，其能用作，例如，燃料乙醇、饮用乙醇(即，可饮用的中性含酒精饮料)，或工业乙醇。

具有过氧化氢酶活性的多肽

在本发明的方法中，具有过氧化氢酶活性的多肽可为任何具有过氧化氢酶活性的多肽。具有过氧化氢酶活性的多肽可作为酶组合物中的酶和/或添加至所述组合物的一种或多种蛋白组分存在。在一个优选的方面，具有过氧化氢酶活性的多肽对于纤维素酶组合物的一种或多种组分是外源的。

具有过氧化氢酶活性的多肽可获得自任何属的微生物。在一个方面，从给定来源获得的多肽是胞外分泌的。

所述具有过氧化氢酶活性的多肽可为细菌多肽。例如，所述多肽可为革兰氏阳性细菌多肽例如具有过氧化氢酶活性的芽孢杆菌属(Bacillus)、链球菌属(Streptococcus)、链霉菌属(Streptomyces)、葡萄球菌属(Staphylococcus)、肠球菌属(Enterococcus)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、梭菌属(Clostridium)、地芽孢杆菌属(Geobacillus)或海洋芽孢杆菌属(Oceanobacillus)多肽；或革兰氏阴性细菌多肽，如具有过氧化氢酶活性的大肠杆菌(E.coli)、假单胞菌属(Pseudomonas)、沙门氏菌属(Salmonella)、弯曲杆菌属(Campylobacter)、螺杆菌属(Helicobacter)、黄杆菌属(Flavobacterium)、梭杆菌属(Fusobacterium)、泥杆菌属(Ilyobacter)、奈瑟氏菌属(Neisseria)或脲原体属(Ureaplasma)多肽。

在一个方面，所述具有过氧化氢酶活性的多肽是具有过氧化氢酶活性的嗜碱芽孢杆菌(Bacillus alkalophilus)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、短芽孢杆菌(Bacillus brevis)、环状芽孢杆菌(Bacillus circulans)、克劳氏芽孢杆菌(Bacillus clausii)、凝结芽孢杆菌(Bacillus coagulans)、坚强芽孢杆菌(Bacillusfirmus)、灿烂芽孢杆菌(Bacillus lautus)、迟缓芽孢杆菌(Bacillus lentus)、地衣芽孢杆菌(Bacillus licheniformis)、巨大芽孢杆菌(Bacillus megaterium)、短小芽孢杆菌(Bacillus pumilus)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)、枯草芽孢杆菌(Bacillus subtilis)或苏云金芽孢杆菌(Bacillus thuringiensis)多肽。

在另一个方面，所述具有过氧化氢酶活性的多肽是具有过氧化氢酶活性的似马链球菌(Streptococcus equisimilis)、酿脓链球菌(Streptococcus pyogenes)、乳房链球菌(Streptococcus uberis)或马链球菌兽瘟亚种(Streptococcus equisubsp.Zooepidemicus)多肽。

在另一个方面，所述具有过氧化氢酶活性的多肽是具有过氧化氢酶活性的不产色链霉菌(Streptomyces achromogenes)、除虫链霉菌(Streptomyces avermitilis)、天蓝链霉菌(Streptomyces coelicolor)、灰色链霉菌(Streptomyces griseus)或浅青紫链霉菌(Streptomyces lividans)多肽。

所述具有过氧化氢酶活性的多肽亦可为真菌多肽，且更优选为酵母多肽如具有过氧化氢酶活性的假丝酵母属(Candida)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)或西洋蓍霉属(Yarrowia)多肽；或更优选丝状真菌多肽如具有过氧化氢酶活性的枝顶孢霉属(Acremonium)、伞菌属(Agaricus)、链格孢属(Alternaria)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、Botryospaeria、拟蜡菌属(Ceriporiopsis)、毛喙壳属(Chaetomidium)、金孢子菌属(Chrysosporium)、Claviceps、Cochliobolus、鬼伞属(Coprinopsis)、Coptotermes、棒囊壳属(Corynascus)、隐丛赤壳菌属(Cryphonectria)、隐球菌属(Cryptococcus)、色二孢属(Diplodia)、黑耳属(Exidia)、Filibasidium、镰孢属(Fusarium)、赤霉属(Gibberella)、全鞭毛虫属(Holomastigotoides)、腐质霉属(Humicola)、耙齿菌属(Irpex)、蘑菇属(Lentinula)、Leptospaeria、梨孢菌属(Magnaporthe)、Melanocarpus、多孔菌属(Meripilus)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、新考玛脂霉属(Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、平革菌属(Phanerochaete)、瘤胃壶菌属(Piromyces)、Poitrasia、假黑盘菌属(Pseudoplectania)、Pseudotrichonympha、根毛霉属(Rhizomucor)、裂褶菌属(Schizophyllum)、柱顶孢属(Scytalidium)、踝节菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、木霉属(Trichoderma)、长毛盘菌属(Trichophaea)、轮枝孢属(Verticillium)、包脚菇属(Volvariella)或炭角菌属(Xylaria)多肽。

在另一个方面，所述多肽是具有过氧化氢酶活性的卡尔酵母(Saccharomycescarlsbergensis)、酿酒酵母(Saccharomyces cerevisiae)、糖化酵母(Saccharomycesdiastaticus)、道格拉氏酵母(Saccharomyces douglasii)、克鲁弗酵母(Saccharomyceskluyveri)、诺地酵母(Saccharomyces norbensis)或卵形酵母(Saccharomycesoviformis)多肽。

在另一个方面，所述多肽是具有过氧化氢酶活性的解纤维枝顶孢霉(Acremoniumcellulolyticus)、棘孢曲霉(Aspergillus aculeatus)、泡盛曲霉(Aspergillusawamori)、烟曲霉(Aspergillus fumigatus)、臭曲霉(Aspergillusfoetidus)、日本曲霉(Aspergillus japonicus)、构巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillusniger)、米曲霉(Aspergillus oryzae)、嗜角质金孢子菌(Chrysosporiumkeratinophilum)、Chrysosporium lucknowense、热带金孢子菌(Chrysosporiumtropicum)、Chrysosporium merdarium、Chrysosporium inops、毡金孢子菌(Chrysosporium pannicola)、Chrysosporium queenslandicum、Chrysosporium zonatum、杆孢状镰孢(Fusarium bactridioides)、禾谷镰孢(Fusarium cerealis)、库威镰孢(Fusarium crookwellense)、大刀镰孢(Fusarium culmorum)、禾本科镰孢(Fusariumgraminearum)、禾赤镰孢(Fusarium graminum)、异孢镰孢(Fusarium heterosporum)、合欢木镰孢(Fusarium negundi)、尖镰孢(Fusarium oxysporum)、多枝镰孢(Fusariumreticulatum)、粉红镰孢(Fusarium roseum)、接骨木镰孢(Fusarium sambucinum)、肤色镰孢(Fusarium sarcochroum)、拟分枝孢镰孢(Fusarium sporotrichioides)、硫色镰孢(Fusarium sulphureum)、圆镰孢(Fusarium torulosum)、拟丝孢镰孢(Fusariumtrichothecioides)、镶片镰孢(Fusarium venenatum)、灰腐质霉(Humicola grisea)、特异腐质霉(Humicola insolens)、疏棉状腐质霉(Humicola lanuginosa)、白耙齿菌(Irpexlacteus)、米黑毛霉(Mucor miehei)、嗜热毁丝霉(Myceliophthora thermophila)、粗糙脉孢菌(Neurospora crassa)、Penicillium emersonii、绳状青霉(Penicilliumfuniculosum)、产紫青霉(Penicillium purpurogenum)、黄孢平革菌(Phanerochaetechrysosporium)、Talaromyces stipitatus、桔橙嗜热子囊菌(Thermoascusaurantiacus)、无色梭孢壳(Thielavia achromatica)、Thielavia albomyces、Thielaviaalbopilosa、澳洲梭孢壳(Thielavia australeinsis)、Thielavia fimeti、小孢梭孢壳(Thielavia microspora)、卵孢梭孢壳(Thielavia ovispora)、Thielavia peruviana、瘤孢梭孢壳(Thielavia spededonium)、毛梭孢壳(Thielavia setosa)、Thielaviasubthermophila、土生梭孢霉(Thielavia terrestris)、哈茨木霉(Trichodermaharzianum)、康宁木霉(Trichoderma koningii)、长枝木霉(Trichodermalongibrachiatum)、里氏木霉(Trichoderma reesei)或绿色木霉(Trichoderma viride)多肽。

在一个优选实施方案中，具有过氧化氢酶活性的多肽是来自嗜热子囊菌属、踝节菌属、腐质霉属或青霉属的过氧化氢酶。在一个更优选的实施方案中，具有过氧化氢酶活性的多肽是来自桔橙嗜热子囊菌、Talaromyces stipitatus、特异腐质霉或Penicilliumemersonii的过氧化氢酶。

合适的过氧化氢酶及其编码序列的非限定性实例列于下表。

SEQ ID NO:1和2：来自桔橙嗜热子囊菌(Thermoascus aurantiacus)的过氧化氢酶的多核苷酸和多肽，如JP 2004261137A中所述。

SEQ ID NO:3和4：来自Talaromyces stipitatus的过氧化氢酶的多核苷酸和多肽，其可如实施例9-13中所述制备。

SEQ ID NO:5和6：来自特异腐质霉的过氧化氢酶的多核苷酸和多肽，其可如实施例14-20中所述制备。

SEQ ID NO:7和8：来自Penicillium emersonii的过氧化氢酶的多核苷酸和多肽，其可如实施例21-27中所述制备。

SEQ ID NO:9和10：来自Thermus Brockianus的过氧化氢酶的多核苷酸和多肽，如WO 2005/044994中所述。

SEQ ID NO:11和12：来自Saccharomyces pastorianus的过氧化氢酶的多核苷酸和多肽，如WO 2007/105350中所述。

SEQ ID NO:13和14：来自Saccharomyces pastorianus的过氧化氢酶的多核苷酸和多肽，如WO 2007/105350中所述。

SEQ ID NO:15和16：来自嗜松青霉的过氧化氢酶的多核苷酸和多肽，如WO 2009/104622中所述。

SEQ ID NO:17和18：来自灰腐质霉的过氧化氢酶的多核苷酸和多肽，如WO 2009/104622中所述。

SEQ ID NO:19和20：来自土生梭孢壳的过氧化氢酶的多核苷酸和多肽，如WO2010/074972中所述。

SEQ ID NO:21和22：来自热葡糖苷酶芽孢杆菌(Bacillusthermoglucosidasius)的过氧化氢酶的多核苷酸和多肽，如JP 11243961A中所述。

SEQ ID NO:23和24：来自米曲霉的过氧化氢酶的多核苷酸和多肽，如JP2002223772A中所述。

SEQ ID NO:25和26：来自桔橙嗜热子囊菌的过氧化氢酶的多核苷酸和多肽，如JP2007143405A中所述。

SEQ ID NO:27和28：来自热葡糖苷酶芽孢杆菌的过氧化氢酶的多核苷酸和多肽，如US 6,022,721中所述。

SEQ ID NO:29和30：来自热葡糖苷酶芽孢杆菌的过氧化氢酶的多核苷酸和多肽，如US 6,022,721中所述。

SEQ ID NO:31和32：来自海水产碱菌(Alcaligenes aquamarinus)的过氧化氢酶的多核苷酸和多肽，如WO 98/00526中所述。

SEQ ID NO:33和34：来自变黑微颤蓝细菌(Microscilla furvescens)的过氧化氢酶的多核苷酸和多肽，如WO 98/00526中所述。

SEQ ID NO:35和36：来自黑曲霉的过氧化氢酶的多核苷酸和多肽，如US5,360,901中所述。

SEQ ID NO 37：一种黑腐质霉热耐受性过氧化氢酶的多肽(GENESEQP:AXQ55105，公开于WO2009104622)。

在一个实施方案中，用于本发明的过氧化氢酶与SEQ ID NO:2的成熟多肽，SEQ IDNO:4的成熟多肽，SEQ ID NO:6的成熟多肽，SEQ ID NO:8的成熟多肽，SEQ ID NO:10的成熟多肽，SEQ ID NO:12的成熟多肽，SEQ ID NO:14的成熟多肽，SEQ ID NO:16的成熟多肽，SEQID NO:18的成熟多肽，SEQ ID NO:20的成熟多肽，SEQ ID NO:22的成熟多肽，SEQ ID NO:24的成熟多肽，SEQ ID NO:26的成熟多肽，SEQ ID NO:28的成熟多肽，SEQ ID NO:30的成熟多肽，SEQ ID NO:32的成熟多肽，SEQ ID NO:34的成熟多肽，SEQ ID NO:36的成熟多肽，SEQID NO:37的成熟多肽具有至少60％，例如至少65％，至少70％，至少75％，至少78％，至少80％，至少81％，至少82％，至少83％，至少84％，至少85％，至少86％，至少87％，至少88％，至少89％，至少90％，至少91％，至少92％，至少93％，至少94％，至少95％，至少96％，至少97％，至少98％，至少99％，或100％序列同一性，其具有过氧化氢酶活性。

SignalP程序预测SEQ ID NO:4的氨基酸1至19是信号肽，成熟多肽是SEQ ID NO:4的氨基酸20至733。在另一个方面，根据SignalP程序预测SEQ ID NO:6的氨基酸1至19是信号肽，成熟多肽是SEQ ID NO:6的氨基酸20至765。在另一个方面，根据SignalP程序预测SEQID NO:8的氨基酸1至19是信号肽，成熟多肽是SEQ ID NO:8的氨基酸20至741。在本领域中已知宿主细胞可产生由相同多核苷酸表达的两种或更多种不同成熟多肽(即具有不同的C端和/或N端氨基酸)的混合物。

在另一个实施方案中，用于本发明的过氧化氢酶由这样的多核苷酸编码，所述多核苷酸在低严格条件、中等严格条件、中等-高严格条件、高严格条件或非常高严格条件下与以下杂交：(i)SEQ ID NO:1的成熟多肽编码序列、SEQ ID NO:3的成熟多肽编码序列、SEQID NO:5的成熟多肽编码序列、或SEQ ID NO:7的成熟多肽编码序列，(ii)它们的cDNA序列，或(iii)(i)或(ii)的全长互补链(Sambrook等,1989,Molecular Cloning,A LaboratoryManual,2d edition,Cold Spring Harbor,New York)。

就本发明而言，杂交表明多核苷酸在非常低至非常高严格条件下杂交于对应于以下的标记的核酸探针：(i)SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5或SEQ ID NO:7；(ii)SEQ ID NO:1的成熟多肽编码序列、SEQ ID NO:3的成熟多肽编码序列、SEQ ID NO:5的成熟多肽编码序列、或SEQ ID NO:7的成熟多肽编码序列；(iii)它们的cDNA序列；或(iv)它们的全长互补链；或它们的亚序列。在这些条件下与所述核酸探针杂交的分子可使用，例如X射线或其他任何本领域中已知的检测手段检测。

在一个实施方案中，用于本发明的过氧化氢酶由多核苷酸编码，所述多核苷酸与SEQ ID NO:1的成熟多肽编码序列、SEQ ID NO:3的成熟多肽编码序列、SEQ ID NO:5的成熟多肽编码序列、或SEQ ID NO:7的成熟多肽编码序列，或它们的cDNA序列具有至少60％，例如至少65％，至少70％，至少75％，至少78％，至少80％，至少81％，至少82％，至少83％，至少84％，至少85％，至少86％，至少87％，至少88％，至少89％，至少90％，至少91％，至少92％，至少93％，至少94％，至少95％，至少96％，至少97％，至少98％，至少99％，或100％序列同一性。

在一个实施方案中，成熟多肽编码序列是SEQ ID NO:1的核苷酸1至2351或其cDNA序列。在另一个实施方案中，根据SignalP程序预测SEQ ID NO:3的核苷酸1至57编码信号肽，成熟多肽编码序列是SEQ ID NO:3的核苷酸58至2418或其cDNA序列。在另一个实施方案中，根据SignalP程序预测SEQ ID NO:5的核苷酸1至57编码信号肽，成熟多肽编码序列是SEQ ID NO:5的核苷酸58至3040或其cDNA序列。在另一个实施方案中，根据SignalP程序预测SEQ ID NO:7的核苷酸1至57编码信号肽，成熟多肽编码序列是SEQ ID NO:7的核苷酸58至2476或其cDNA序列。

在另一个实施方案中，用于本发明的过氧化氢酶涉及SEQ ID NO:2的成熟多肽的变体，SEQ ID NO:4的成熟多肽的变体，SEQ ID NO:6的成熟多肽的变体，或SEQ ID NO:8的成熟多肽的变体，其在一个或多个(例如几个)位置包含取代、缺失和/或插入。在一个实施方案中，引入SEQ ID NO:2的成熟多肽，SEQ ID NO:4的成熟多肽，SEQ ID NO:6的成熟多肽，SEQ ID NO:8的成熟多肽的氨基酸取代、缺失和/或插入的数量为多至10个，例如1、2、3、4、5、6、7、8、9或10个。氨基酸改变可为性质上较不重要的(of a minor nature)，即保守的氨基酸取代或插入，其不显著影响蛋白质的折叠和/或活性；通常为1至大约30个氨基酸的小缺失；小的氨基或羧基末端延伸，例如氨基末端甲硫氨酸残基；多至大约20-25个残基的小接头肽；或通过改变净电荷或其它功能来促进纯化的小延伸，如多组氨酸序列(polyhistidine tract)、抗原表位(antigenic epitope)或结合域(binding domain)。

保守取代的实例是在以下组之内：碱性氨基酸组(精氨酸、赖氨酸和组氨酸)、酸性氨基酸组(谷氨酸和天冬氨酸)、极性氨基酸组(谷氨酰胺和天冬酰胺)、疏水氨基酸组(亮氨酸、异亮氨酸和缬氨酸)、芳族氨基酸组(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸组(甘氨酸、丙氨酸、丝氨酸、苏氨酸和甲硫氨酸)。通常不改变特定活性的氨基酸取代是本领域已知的，并且由例如H.Neurath和R.L.Hill,1979,于The Proteins,Academic Press,New York中描述。最普遍发生的交换是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly。

或者，氨基酸改变具有导致多肽的物理化学性质改变的性质。例如，氨基酸改变可改善多肽的热稳定性，改变底物特异性，改变最适pH等。

可以根据本领域已知的方法，例如定位诱变或丙氨酸扫描诱变法(Cunningham和Wells,1989,Science 244:1081-1085)来鉴定亲本多肽中的必需氨基酸。在后一技术中，将单一丙氨酸突变引入到分子中的每个残基，并且测试所得突变分子是否有过氧化氢酶活性，以鉴定对于所述分子的活性关键的氨基酸残基。同样参见Hilton等,1996,J.Biol.Chem.271:4699-4708。酶的活性部位或其它的生物相互作用也可以通过对借助核磁共振、晶体学、电子衍射或光亲和标记等技术测定的结构的物理分析，结合对推定的接触位点氨基酸的突变来测定。参见例如de Vos等,1992,Science 255:306-312；Smith等,1992,J.Mol.Biol.224:899-904；Wlodaver等,1992,FEBS Lett.309:59-64。必需氨基酸的身份也可以从与相关多肽的比对来推断。

可使用已知的诱变、重组和/或改组方法，然后进行相关的筛选过程，如由Reidhaar-Olson和Sauer,1988,Science 241:53-57；Bowie和Sauer,1989,Proc.Natl.Acad.Sci.USA 86:2152-2156；WO 95/17413；或者WO 95/22625所公开的那些，进行一个或多个氨基酸取代、缺失和/或插入并加以测试。其他可使用的方法包括易错PCR、噬菌体展示(例如Lowman等,1991,Biochemistry 30:10832-10837；美国专利号5,223,409；WO 92/06204)和区域定向诱变(region-directed mutagenesis)(Derbyshire等,1986,Gene 46:145；等,1988,DNA 7:127)。

诱变/改组方法可与高通量、自动化筛选方法组合以检测由宿主细胞表达的经克隆、诱变的多肽的活性(Ness等,1999,Nature Biotechnology 17:893-896)。编码活性多肽的经诱变的DNA分子可自宿主细胞回收并使用本领域标准方法迅速测序。这些方法允许快速确定多肽中单个氨基酸残基的重要性。

所述多肽可为杂合多肽，其中一个多肽的区域融合于另一个多肽的区域的N端或C端。

所述多肽可为融合多肽或可切割的融合多肽，其中另一个多肽融合于本发明的多肽的N端或C端。通过将编码另一个多肽的多核苷酸融合于本发明的多核苷酸来产生融合多肽。产生融合多肽的技术是本领域已知的，并包括连接编码多肽的编码序列以使它们符合读框(in frame)，并且使融合多肽的表达在相同启动子和终止子的控制下。融合多肽亦可使用内蛋白(intein)技术构建，其中融合物在翻译后产生(Cooper等,1993,EMBO J.12:2575-2583；Dawson等,1994,Science 266:776-779)。

融合多肽还可以在两个多肽之间包含切割位点。一旦融合多肽被分泌，所述位点就被切割，释放所述两个多肽。切割位点的实例包括，但不限于，公开于Martin等,2003,J.Ind.Microbiol.Biotechnol.3:568-76；Svetina等,2000,J.Biotechnol.76:245-251；Rasmussen-Wilson等,1997,Appl.Environ.Microbiol.63:3488-3493；Ward等,1995,Biotechnology 13:498-503；和Contreras等,1991,Biotechnology 9:378-381；Eaton等,1986,Biochem.25:505-512)；Collins-Racie等,1995,Biotechnology 13:982-987；Carter等,1989,Proteins:Structure,Function,and Genetics 6:240-248；以及Stevens,2003,Drug Discovery World 4:35-48中的位点。

适用于本发明的商业性过氧化氢酶制备物的实例包括例如Terminox Ultra 50L/200L(Novozymes A/S)，Catazyme 25L(Novozymes A/S)，GC118(Danisco A/S)，OxygoneT100/T400(Danisco A/S)，ASC Super 200L(Mitsubishi Chemicals， Japan)和Reyonet200L(Nagase，Japan)。

核酸构建体

对于编码多肽(例如纤维素分解酶，具有过氧化氢酶活性的多肽，具有纤维素分解增强活性的多肽等)的分离的多核苷酸，可以通过构建核酸构建体以多种方式进行操纵，以提供所述多肽的表达，，核酸构建体包含编码所述多肽的分离的多核苷酸，其与一个或多个(例如几个)调控序列可操作地连接，所述调控序列在合适的宿主细胞中在与该调控序列相容的条件下指导编码序列的表达。可以用许多方式操作所述多核苷酸以提供多肽的表达。依赖于表达载体，在将多核苷酸插入载体之前对其进行操作可能是理想的或必需的。使用重组DNA方法修饰多核苷酸序列的技术是本领域熟知的。

调控序列可为启动子，其是被宿主细胞识别用于表达编码多肽的多核苷酸的多核苷酸。启动子含有介导多肽的表达的转录调控序列。启动子可以是在宿主细胞中显示转录活性的任何多核苷酸，包括突变的、截短的和杂合的启动子，并且可以从编码与宿主细胞同源或异源的胞外或胞内多肽的基因获得。

用于在细菌宿主细胞中指导本发明的核酸构建体转录的合适启动子的实例是从下述获得的启动子：解淀粉芽孢杆菌α-淀粉酶基因(amyQ)、地衣芽孢杆菌α-淀粉酶基因(amyL)、地衣芽孢杆菌青霉素酶基因(penP)、嗜热脂肪芽孢杆菌产麦芽淀粉酶基因(amyM)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、枯草芽孢杆菌xylA和xylB基因、苏云金芽孢杆菌cryIIIA基因(Agaisse和Lereclus,1994,Molecular Microbiology 13:97-107)、大肠杆菌lac操纵子、大肠杆菌trc启动子(Egon等,1988,Gene 69:301-315)、天蓝链霉菌琼脂糖酶基因(dagA)和原核β-内酰胺酶基因(Villa-Kamaroff等,1978,Proceedings of theNational Academy of Sciences USA 75:3727-3731)，以及tac启动子(DeBoer等,1983,Proc.Natl.Acad.Sci.USA 80:21-25)。另外的启动子在"Useful proteins fromrecombinant bacteria"于Gilbert等,1980,Scientific American,242:74-94中；和在Sambrook等,1989,见上文中描述。串联启动子的实例公开于WO 99/43835。

用于指导本发明的核酸构建体在丝状真菌宿主细胞中转录的合适启动子的实例是从下列酶的基因获得的启动子：构巢曲霉乙酰胺酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、米曲霉TAKA淀粉酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、尖镰孢胰蛋白酶样蛋白酶(WO 96/00787)、镶片镰孢淀粉葡糖苷酶(WO 00/56900)、镶片镰孢Daria(WO 00/56900)、镶片镰孢Quinn(WO 00/56900)、曼赫根毛霉(Rhizomucor miehei)脂肪酶、曼赫根毛霉天冬氨酸蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶IV、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉β-木糖苷酶，以及NA2-tpi启动子(一种修饰的启动子，其来自在曲霉属中性α-淀粉酶基因，其中未翻译的前导序列由曲霉属丙糖磷酸异构酶的基因的未翻译的前导序列所替代；非限制性实例包括修饰的启动子，其来自黑曲霉中性α-淀粉酶的基因，其中未翻译的前导序列由构巢曲霉或米曲霉丙糖磷酸异构酶的基因的未翻译的前导序列所替代)；和它们的突变的、截短的和杂合的启动子。

在酵母宿主中，有用的启动子从如下的基因获得：酿酒酵母烯醇化酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH1,ADH2/GAP)、酿酒酵母丙糖磷酸异构酶(TPI)、酿酒酵母金属硫蛋白(CUP1)和酿酒酵母3-磷酸甘油酸激酶。对于酵母宿主细胞其它有用的启动子由Romanos等,1992,Yeast 8:423-488描述。

调控序列也可以是转录终止子，其被宿主细胞识别以终止转录。所述终止子与编码所述多肽的多核苷酸的3’末端可操作地连接。在本发明中，可使用在宿主细胞中有功能的任何终止子。

对于细菌宿主细胞优选的终止子从如下的基因获得：克劳氏芽孢杆菌碱性蛋白酶(aprH)、地衣芽孢杆菌α-淀粉酶(amyL)和大肠杆菌核糖体RNA(rrnB)。

对于丝状真菌宿主细胞优选的终止子从如下酶的基因获得：构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶和尖镰孢胰蛋白酶样蛋白酶。

对于酵母宿主细胞优选的终止子从如下酶的基因获得：酿酒酵母烯醇化酶、酿酒酵母细胞色素C(CYC1)和酿酒酵母甘油醛-3-磷酸脱氢酶。对于酵母宿主细胞其它有用的终止子由Romanos等,1992,见上文描述。

调控序列还可以是启动子下游和基因的编码序列上游的mRNA稳定化区，其增加所述基因的表达。

合适的mRNA稳定化区的实例从如下的基因获得：苏云金芽孢杆菌cryIIIA基因(WO94/25612)和枯草芽孢杆菌SP82基因(Hue等,1995,Journal of Bacteriology 177:3465-3471)。

调控序列还可以是合适的前导序列，其为对于宿主细胞的翻译重要的mRNA非翻译区。前导序列可操作地连接于编码多肽的多核苷酸的5’-末端。可使用在宿主细胞中有功能的任何前导序列。

对于丝状真菌宿主细胞优选的前导序列从如下酶的基因获得：米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶。

对于酵母宿主细胞合适的前导序列从如下酶的基因获得：酿酒酵母烯醇化酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α因子和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。

调控序列也可以是聚腺苷酸化序列，其是与多核苷酸的3’末端可操作地连接的序列，并且在转录时，宿主细胞将其识别为将聚腺苷残基添加至转录的mRNA的信号。可使用在宿主细胞中有功能的任何聚腺苷酸化序列。

对于丝状真菌宿主细胞优选的聚腺苷酸化序列从如下酶的基因获得：构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶和尖镰孢胰蛋白酶样蛋白酶。

对于酵母宿主细胞有用的聚腺苷酸化序列由Guo和Sherman,1995,Mol.CellularBiol.15:5983-5990描述。

调控序列还可以是信号肽编码区，其编码与多肽的N端相连的信号肽，并指导所述多肽进入细胞分泌途径。多核苷酸的编码序列5’端可固有地包含信号肽编码序列，其与编码所述多肽的编码序列的区段一起天然地连接在翻译阅读框中。或者，编码序列5’端可含有对于所述编码序列外源的信号肽编码序列。外源信号肽编码序列在编码序列不天然地含有信号肽编码序列时可为必需的。或者，外源信号肽编码序列可简单地取代天然信号肽编码序列以增强多肽的分泌。然而，可使用指导表达的多肽进入宿主细胞的分泌途径的任何信号肽编码序列。

对于细菌宿主细胞有效的信号肽编码序列是从如下酶的基因获得的信号肽编码序列：芽孢杆菌属NCIB 11837产麦芽糖淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶(subtilisin)、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌α-淀粉酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT,nprS,nprM)和枯草芽孢杆菌prsA。另外的信号肽由Simonen和Palva,1993,Microbiological Reviews 57:109-137描述。

对于丝状真菌宿主细胞有效的信号肽编码序列是从如下酶的基因获得的信号肽编码序列：黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶V、疏棉状腐质霉脂肪酶和曼赫根毛霉天冬氨酸蛋白酶。

对于酵母宿主细胞有用的信号肽从酿酒酵母α因子和酿酒酵母转化酶的基因获得。其它有用的信号肽编码序列由Romanos等,1992,见上文描述。

调控序列还可以是前肽编码序列，其编码位于多肽N端的前肽。所得多肽称为酶原(proenzyme)或前多肽(propolypeptide)(或在某些情况下称为酶原(zymogen))。前多肽通常是无活性的，并且能够通过前肽的催化或自催化切割从前多肽转化为活性多肽。可以从枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、嗜热毁丝霉漆酶(WO95/33836)、曼赫根毛霉天冬氨酸蛋白酶和酿酒酵母α因子的基因获得前肽编码序列。

当信号肽和前肽序列二者均存在时，将前肽序列置于紧接着(next to)多肽的N端，并且将信号肽序列置于紧接着前肽序列的N端。

同样理想的是添加调节序列，其相对于宿主细胞的生长来调节多肽的表达。调节序列的实例是引起基因表达响应化学或物理刺激物，包括调节化合物的存在而开启或关闭的那些序列。原核系统中的调节序列包括lac、tac和trp操纵基因序列。在酵母中，可使用ADH2系统或GAL1系统。在丝状真菌中，可以使用黑曲霉葡糖淀粉酶启动子、米曲霉TAKA α-淀粉酶启动子和米曲霉葡糖淀粉酶启动子。调节序列的其它实例是那些允许基因扩增的序列。在真核系统中，这些调节序列包括在氨甲蝶呤(methotrexate)存在下扩增的二氢叶酸还原酶基因，和以重金属(with heavy metal)扩增的金属硫蛋白基因。在这些情况下，编码多肽的多核苷酸将与调节序列可操作地连接。

表达载体

上述多种核苷酸和调控序列可以结合在一起以产生重组表达载体，所述表达载体可以包括一个或多个(例如几个)方便的限制位点以允许在这些位点插入或取代编码多肽的多核苷酸，所述多肽例如纤维素分解酶，具有过氧化氢酶活性的多肽，具有纤维素分解增强活性的多肽等。可供选择的是，可以通过在适当的用于表达的载体中插入包含所述多核苷酸的核酸构建体或多核苷酸来表达所述多核苷酸。在制备表达载体的过程中，将编码序列置于载体中，从而将该编码序列与适当的调控序列可操作地连接以供表达。

重组表达载体可以是任何载体(例如，质粒或病毒)，其能够方便地进行重组DNA步骤，并且能够产生多核苷酸的表达。载体的选择将通常依赖于载体与将引入该载体的宿主细胞的相容性。载体可以是线状或闭合环状质粒。

载体可以是自主复制载体，即，作为染色体外实体(entity)存在的载体，其复制独立于染色体复制，例如，质粒、染色体外元件、微型染色体(minichromosome)或人工染色体。载体可以含有任何用于确保自复制的手段(means)。或者，载体可以是一种当被引入宿主细胞中时，整合到基因组中并且与整合了该载体的染色体一起复制的载体。此外，可以使用单独的载体或质粒或两个或更多个载体或质粒，其共同含有待引入宿主细胞基因组的完整DNA(total DNA)，或可以使用转座子(transposon)。

所述载体优选地含有一个或多个(例如几个)选择性标记，其允许简单选择经转化、转染、转导等的细胞。选择性标记是基因，其产物提供杀生物剂或病毒抗性、对重金属的抗性、对营养缺陷型的原养性(prototrophy to auxotrophs)等。

细菌选择性标记的实例是地衣芽孢杆菌或枯草芽孢杆菌dal基因，或赋予抗生素抗性的标记，所述抗生素抗性例如氨苄青霉素、氯霉素、卡那霉素、新霉素、壮观霉素或四环素抗性。对于酵母宿主细胞合适的标记包括但不限于ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于丝状真菌宿主细胞的选择性标记包括但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草铵膦(phosphinothricin)乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)(nitrate reductase)、pyrG(乳清酸核苷-5’-磷酸脱羧酶)(orotidine-5’-phosphate decarboxylase)、sC(硫酸腺苷酰转移酶)和trpC(邻氨基苯甲酸合酶(anthranilate synthase))以及它们的等同物。优选用在曲霉属细胞中的是构巢曲霉或米曲霉amdS和pyrG基因和吸水链霉菌(Streptomyces hygroscopicus)bar基因。

所述载体优选含有元件，其允许载体整合入宿主细胞基因组或载体在细胞中独立于基因组的自主复制。

为了整合入宿主细胞基因组，载体可依赖编码多肽的多核苷酸或用于通过同源或非同源重组整合入基因组的任何其它载体元件。或者，载体可以含有额外的多核苷酸，用于指导通过同源重组整合入宿主细胞基因组染色体中的精确位置。为了增加在精确位置整合的概率，整合元件应含有足够数量的核酸，如100至10,000碱基对，400至10,000碱基对，和800至10,000碱基对，其与相应的目标序列具有高度序列同一性以增强同源重组的概率。整合元件可为任何序列，其与宿主细胞基因组中的目标序列同源。此外，整合元件可为非编码或编码的多核苷酸。另一方面，可以将载体通过非同源重组整合到宿主细胞的基因组中。

为了自主复制，载体可以进一步包含复制起点，其使载体能够在所述的宿主细胞中自主地复制。复制起点可以是介导自主复制的任何质粒复制子(replicator)，其在细胞中发挥功能。术语“复制起点”或“质粒复制子”意指能够使质粒或载体体内复制的多核苷酸。

细菌复制起点的实例是允许在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177和pACYC184的复制起点，和允许在芽孢杆菌属中复制的质粒pUB110、pE194、pTA1060和pAMβ1的复制起点。

用于酵母宿主细胞中的复制起点的实例是2微米复制起点，ARS1,ARS4,ARS1和CEN3的组合，和ARS4和CEN6的组合。

在丝状真菌细胞中有用的复制起点的实例是AMA1和ANS1(Gems等,1991,Gene 98:61-67；Cullen等,1987,Nucleic Acids Res.15:9163-9175；WO 00/24883)。分离AMA1基因和构建包含该基因的质粒或载体能够根据公开于WO 00/24883中的方法完成。

可以将多于一个拷贝的多核苷酸插入宿主细胞以增加多肽的产生。多核苷酸拷贝数的增加可通过如下方法获得：将至少一个额外拷贝的序列整合入宿主细胞基因组，或将可扩增的选择性标记基因包括于多核苷酸，其中可通过在合适的选择剂(selectableagent)存在下培养细胞来选择含有选择性标记基因的扩增拷贝，且由此含有多核苷酸的额外拷贝的细胞。

用于连接上述元件以构建重组表达载体的方法是本领域技术人员熟知的(参见，例如，Sambrook等,1989,见上文)。

宿主细胞

包含编码多肽(例如纤维素分解酶，具有过氧化氢酶活性的多肽，具有纤维素分解增强活性的多肽)等的多核苷酸的重组宿主细胞可有利地用于重组产生所述多肽。将包含多核苷酸的构建体或载体引入宿主细胞，使所述构建体或载体如前所述作为染色体整合体或者作为自复制的染色体外载体维持。术语“宿主细胞”包括亲本细胞的任何后代，其由于复制过程中发生的突变而不同于亲本细胞。宿主细胞的选择将在很大程度上依赖于编码多肽的基因及其来源。

宿主细胞可以是在多肽的重组产生中有用的任何细胞，例如，原核或真核细胞。

原核宿主细胞可以是任何革兰氏阳性或革兰氏阴性细菌。革兰氏阳性细菌包括但不限于，芽孢杆菌属、梭菌属、肠球菌属、地芽孢杆菌属、乳杆菌属、乳球菌属、海洋芽孢杆菌属、葡萄球菌属、链球菌属和链霉菌属。革兰氏阴性细菌包括但不限于，弯曲杆菌属、大肠杆菌、黄杆菌属、梭杆菌属、螺杆菌属、泥杆菌属、奈瑟氏菌属、假单胞菌属、沙门氏菌属和脲原体属。

细菌宿主细胞可以是任何芽孢杆菌属细胞，包括但不限于嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌和苏云金芽孢杆菌细胞。

细菌宿主细胞还可以是任何链球菌属细胞，包括但不限于，似马链球菌、酿脓链球菌、乳房链球菌和马链球菌兽瘟亚种细胞。

细菌宿主细胞还可以是任何链霉菌属细胞，包括但不限于，不产色链霉菌、除虫链霉菌、天蓝链霉菌、灰色链霉菌和浅青紫链霉菌细胞。

可通过如下方法实现将DNA引入到芽孢杆菌属细胞：原生质体转化(参见，例如，Chang和Cohen,1979,Mol.Gen.Genet.168:111-115)，使用感受态细胞转化(参见，例如，Young和Spizizen,1961,J.Bacteriol.81:823-829或Dubnau和Davidoff-Abelson,1971,J.Mol.Biol.56:209-221)，电穿孔(参见，例如，Shigekawa和Dower,1988,Biotechniques6:742-751)或接合(参见，例如，Koehler和Thorne,1987,J.Bacteriol.169:5771-5278)。可通过如下方法实现将DNA引入到大肠杆菌细胞：原生质体转化(参见，例如，Hanahan,1983,J.Mol.Biol.166:557-580)或电穿孔(参见，例如，Dower等,1988,Nucleic Acids Res.16:6127-6145)。可通过如下方法实现将DNA引入到链霉菌属细胞：原生质体转化，和电穿孔(参见，例如，Gong等,2004,Folia Microbiol.(Praha)49:399-405)，接合(参见，例如，Mazodier等,1989,J.Bacteriol.171:3583-3585)，或转导(参见，例如，Burke等,2001,Proc.Natl.Acad.Sci.USA 98:6289-6294)。可通过如下方法实现将DNA引入到假单胞菌属细胞：电穿孔(参见，例如，Choi等,2006,J.Microbiol.Methods 64:391-397)或接合(参见，例如，Pinedo和Smets,2005,Appl.Environ.Microbiol.71:51-57)。可通过如下方法实现将DNA引入到链球菌属细胞：天然感受态(natural competence)(参见，例如，Perry和Kuramitsu,1981,Infect.Immun.32:1295-1297)，原生质体转化(参见，例如，Catt和Jollick,1991,Microbios.68:189-207)，电穿孔(参见，例如，Buckley等,1999,Appl.Environ.Microbiol.65:3800-3804)或接合(参见，例如，Clewell,1981,Microbiol.Rev.45:409-436)。然而，可使用本领域已知的将DNA引入宿主细胞的任何方法。

宿主细胞还可为真核生物，如哺乳动物、昆虫、植物或真菌细胞。

“真菌”用在本文包括以下门：子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)和接合菌门(Zygomycota)以及卵菌门(Oomycota)和所有有丝分裂孢子真菌(mitosporic fungi)(如由Hawksworth等,于Ainsworth and Bisby’s Dictionary of The Fungi,第8版,1995,CAB International,University Press,Cambridge,UK中所定义)。

真菌宿主细胞可为酵母细胞。“酵母”用在本文包括产子囊酵母(ascosporogenousyeast)(内孢霉目(Endomycetales))、产担子酵母(basidiosporogenous yeast)和属于半知菌类(Fungi Imperfecti)(芽孢纲(Blastomycetes))的酵母。由于酵母的分类在未来可能改变，就本发明而言，将酵母定义为如Biology and Activities of Yeast(SkinnerF.A.,,Passmore S.M.和Davenport R.R.编,Soc.App.Bacteriol.Symposium SeriesNo.9,1980)中所述。

酵母宿主细胞可为假丝酵母属、汉逊酵母属(Hansenula)、克鲁维酵母属、毕赤酵母属、酵母属、裂殖酵母属或西洋蓍霉属细胞，如乳酸克鲁维酵母(Kluyveromyceslactis)、卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母、卵形酵母、或解脂西洋蓍霉(Yarrowia lipolytica)细胞。

真菌宿主细胞可为丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门的亚门(如由Hawksworth等,1995,见上文，所定义)的所有丝状形式。丝状真菌通常的特征在于由壳多糖(chitin)、纤维素、葡聚糖、壳聚糖(chitosan)、甘露聚糖和其它复杂多糖构成的菌丝体壁。通过菌丝延伸进行营养生长，而碳分解代谢是专性需氧的。相反，酵母例如酿酒酵母的营养生长通过单细胞菌体的出芽生殖(budding)进行，而碳分解代谢可以是发酵的。

丝状真菌宿主细胞可为枝顶孢霉属、曲霉属、短梗霉属、烟管霉属(Bjerkandera)、拟蜡菌属、金孢子菌属、鬼伞属(Coprinus)、革盖菌属(Coriolus)、隐球菌属、Filibasidium、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新考玛脂霉属、脉孢菌属、拟青霉属、青霉属、平革菌属(Phanerochaete)、射脉菌属(Phlebia)、瘤胃壶菌属、侧耳属(Pleurotus)、裂褶菌属、踝节菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属(Trametes)或木霉属细胞。

例如，丝状真菌宿主细胞可为泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、黑刺烟管菌(Bjerkandera adusta)、干拟蜡菌(Ceriporiopsis aneirina)、Ceriporiopsis caregiea、Ceriporiopsis gilvescens、Ceriporiopsis pannocinta、Ceriporiopsis rivulosa、Ceriporiopsis subrufa、虫拟蜡菌(Ceriporiopsissubvermispora)、Chrysosporium inops、嗜角质金孢子菌、Chrysosporium lucknowense、Chrysosporium merdarium、毡金孢子菌、Chrysosporium queenslandicum、热带金孢子菌、Chrysosporium zonatum、灰盖鬼伞(Coprinus cinereus)、毛革盖菌(Coriolushirsutus)、杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、特异腐质霉、疏棉状腐质霉、米黑毛霉、嗜热毁丝霉、粗糙脉孢菌、产紫青霉、黄孢平革菌(Phanerochaete chrysosporium)、辐射射脉菌(Phlebiaradiata)、刺芹侧耳(Pleurotus eryngii)、土生梭孢壳、长绒毛栓菌(Trametes villosa)、变色栓菌(Trametes versicolor)、哈茨木霉、康宁木霉、长枝木霉、里氏木霉或绿色木霉细胞。

可以将真菌细胞通过涉及原生质体形成、原生质体转化和细胞壁再生的方法以本身公知的方式转化。用于转化曲霉属和木霉属宿主细胞的合适方法在EP 238023和Yelton等,1984,Proc.Natl.Acad.Sci.USA 81:1470-1474以及Christensen等,1988,Bio/Technology 6:1419-1422中描述。用于转化镰孢属菌种的合适方法由Malardier等,1989,Gene 78:147-156和WO 96/00787描述。可以使用由如下文献描述的方法转化酵母：Becker和Guarente,于Abelson,J.N.和Simon,M.I.编,Guide to Yeast Genetics and MolecularBiology,Methods in Enzymology,Volume 194,pp 182-187,Academic Press,Inc.,NewYork；Ito等,1983,J.Bacteriol.153:163；和Hinnen等,1978,Proc.Natl.Acad.Sci.USA75:1920。

产生方法

用于产生多肽(例如纤维素分解酶，具有过氧化氢酶活性的多肽，具有纤维素分解增强活性的多肽)等的方法，包括(a)在有助于产生多肽的条件下培养细胞，所述细胞以其野生型形式产生所述多肽；和(b)回收所述多肽。在一个优选的方面，所述细胞是曲霉属、嗜热子囊菌属、踝节菌属、木霉属、腐质霉属或青霉属细胞。在一个更优选的方面，所述细胞是黑曲霉、米曲霉、烟曲霉、桔橙嗜热子囊菌、Talaromyces stipitatus、里氏木霉、特异腐质霉或Penicillium emersonii细胞。

或者，用于产生多肽，例如纤维素分解酶，具有过氧化氢酶活性的多肽，具有纤维素分解增强活性的多肽等的方法，包括(a)在有助于产生多肽的条件下培养重组宿主细胞；和(b)回收所述多肽。

所述宿主细胞细胞使用本领域已知的方法在适合于产生所述多肽的营养培养基中培养。例如，可以通过在合适培养基中和允许表达和/或分离所述多肽的条件下的摇瓶培养，或实验室或工业发酵罐中的小规模或大规模发酵(包括连续、分批、补料分批或固态发酵)来培养细胞。使用本领域已知的方法在合适的营养培养基中进行培养，所述营养培养基包含碳源和氮源和无机盐。合适的培养基能够从商业供应商获得或可以根据公开的组成制备(例如，在美国典型培养物保藏中心的目录中)。如果多肽分泌到营养培养基中，则可以将该多肽从所述培养基中直接回收。如果多肽不分泌，则可以将其从细胞裂解物(lysate)回收。

可以使用本领域已知的对于所述多肽是特异性的方法来检测多肽。这些检测方法包括但不限于特异性抗体的使用、酶产物的形成或酶底物的消失。例如，酶测定法(enzymeassay)可用于确定多肽的活性。具有纤维素分解增强活性的多肽使用本文中所述的方法检测。

多肽可以使用本领域已知的方法回收。例如，多肽可以通过常规方法从营养培养基中回收，所述常规方法包括但不限于收集、离心、过滤、提取、喷雾干燥、蒸发或沉淀。在一个方面，回收全发酵液。

多肽可以通过多种本领域已知的方法纯化以获得基本上纯的多肽，所述方法包括但不限于层析(例如，离子交换、亲和、疏水、层析聚焦和大小排阻)、电泳方法(例如，制备型(preparative)等电聚焦)、差示溶解度(例如，硫酸铵沉淀)、SDS-PAGE或提取(参见，例如，Protein Purification,Janson和Ryden编,VCH Publishers,New York,1989)。

在另一个方面，不回收多肽，而是使用表达所述多肽的宿主细胞作为所述多肽的来源。

本发明由下述实施例进一步描述，其不应视为对本发明范围的限制。

实施例

菌株

真菌菌株NN70从真菌菌种保藏中心(Centraalbureau voor Schimmelcultures)获得，其命名为CBS 375.48。基于形态学特征和ITS rDNA序列二者，菌株NN70鉴定为Talaromyces stipitatus。

真菌菌株NN38从收集自中国的土壤样品通过稀释平板法用PDA培养基在45℃分离。然后将其通过将一个单分生孢子转移至YG琼脂平板上纯化。基于形态学特征和ITSrDNA序列二者，菌株NN38被鉴定为特异腐质霉。

真菌菌株NN051602从收集自中国的土壤样品通过稀释平板法用PDA培养基在45℃分离。然后将其通过将一个单分生孢子转移至YG琼脂平板上纯化。基于形态学特征和ITSrDNA序列二者，菌株NN051602被鉴定为Penicillium emersonii。

培养基

PDA培养基由39克马铃薯右旋糖琼脂和去离子水加至1升构成。

YG琼脂平板由5.0g的酵母提取物，10.0g的葡萄糖，20.0g的琼脂，和去离子水加至1升构成。

YPM培养基含有去离子水中的1％酵母提取物，2％的蛋白胨，和2％的麦芽糖。

YPG培养基含有去离子水中的0.4％的酵母提取物，0.1％的KH₂PO₄，0.05％的MgSO₄·7H₂O，1.5％葡萄糖。

基本培养基平板由342g的蔗糖，20ml的盐溶液，20g的琼脂，和去离子水加至1升构成，所述盐溶液由2.6％KCl，2.6％MgSO₄·7H₂O，7.6％KH₂PO₄，2ppm Na₂B₄O₇·10H₂O，20ppmCuSO₄·5H₂O，40ppm FeSO₄·7H₂O，40ppm MnSO₄·2H₂O，40ppm Na₂MoO₄·2H₂O，和400ppmZnSO₄·7H₂O构成。

实施例1：桔橙嗜热子囊菌过氧化氢酶或Talaromyces stipitatus过氧化氢酶对经预处理的玉米秸秆(PCS)的水解的加强作用

来自桔橙嗜热子囊菌的过氧化氢酶(如示于SEQ ID NO:2)由黑曲霉表达，并如日本公开号2004261137A中所述纯化。将来自Talaromyces stipitatus的过氧化氢酶(如示于SEQ ID NO:4)如实施例9-13克隆、表达和纯化。将玉米秸秆在美国能源部可再生能源实验室(U.S.Department of Energy National Renewable Energy Laboratory(NREL))使用稀硫酸在预处理反应器中在190℃，1分钟保留时间，0.05g酸/g干生物质，和在30％总固体浓度的条件下预处理。

PCS以10％的起始总固体(TS)和20g的水解系统总重量的条件水解。将里氏木霉纤维素酶组合物(CTec2，可从Novozymes A/S,Bagsvaerd,Denmark获得)添加至PCS进行酶水解，其中里氏木霉纤维素酶组合物对纤维素的比例为0.5％(w/w)，即基于蛋白量为5mg/g纤维素。将桔橙嗜热子囊菌过氧化氢酶或Talaromyces stipitatus过氧化氢酶以下表1中所示的剂量添加入水解系统。不添加过氧化氢酶的水解系统用作对照。将烧瓶在50℃，在130rpm振荡下温育72小时。除非另行指明，总水解时间为72小时。在水解完成后，糖通过高效液相色谱(HPLC)进行分析。

对于HPLC测量，将收集的样品使用0.22μm注射器式滤器(Millipore,Bedford,MA,USA)过滤，并如下所述分析滤过物的糖含量。稀释于0.005M H₂SO₄中的样品的糖浓度使用7.8×300mm HPX-87H柱(Bio-Rad Laboratories,Inc.,Hercules,CA,USA)来测量，即用0.005M H₂SO₄在65℃以0.7ml每分钟的流速洗脱，并通过对折射率检测(1100HPLC,Agilent Technologies,Santa Clara,CA,USA)所得的、经纯糖样品校准的葡萄糖信号积分来定量。使用所得的葡萄糖对于每个反应计算来自葡聚糖的葡萄糖产量的百分比。对测得的糖浓度根据合适的稀释因子进行调整。将测得的糖浓度针对在零时点在未经洗涤的生物质中相应的背景糖浓度进行调整，来确定酶产生的糖的净浓度。所有的HPLC数据处理使用MICROSOFT EXCEL^TM软件(Microsoft,Richland,WA,USA)进行。

葡萄糖转化为葡萄糖的程度根据Zhu,Y.等2010,Bioresource Technology.102(3):2897-2903的公开来计算。

示于表1的结果表明，通过添加少量过氧化氢酶可显著改善PCS至葡萄糖的转化。

表1：来自桔橙嗜热子囊菌的过氧化氢酶或来自T.stipitatus的过氧化氢酶对PCS的葡萄糖转化的作用

实施例2：Talaromyces stipitatus过氧化氢酶对于纤维素酶的单组分的加强作用

将PH-101(Fluka 11365,Sigma-Aldrich(Shanghai),中国上海)，一种微晶纤维素，以5g/l的终浓度和0.5ml的水解系统的总体积进行水解。将pH通过50mM乙酸钠调整并维持在5.0。此外，抗坏血酸以0.5mM的终浓度存在于水解系统中，或不存在于水解系统中。硫酸锰(II)以1mM的终浓度存在于水解系统中。

克隆、表达并纯化了来自烟曲霉的纤维二糖水解酶(CBH)I(WO 2011/057140)，来自烟曲霉的纤维二糖水解酶(CBH)II(WO 2011/057140)，来自里氏木霉的内切葡聚糖酶(EG)I(WO 2011/057140)和来自米曲霉的β-葡聚糖酶(BG)(WO 02/095014)。将这些单组分单独应用于的水解。使用10mg单组分纤维素酶/g 和5mg过氧化氢酶/g将试管在50℃在600rpm振荡下温育72小时。所有实验进行一式三次。

对水解程度的HPLC分析根据实施例1中所述的步骤进行。

纤维素转化的程度基于可溶化的糖基单元对不溶性纤维素的起始质量的质量比来计算。对于可溶性糖仅测量了葡萄糖和纤维二糖，因为长于纤维二糖的纤维糊精仅以可忽略的浓度存在(由于酶水解)。总纤维素转化的程度使用下述公式计算：

葡萄糖和纤维二糖的因子分别为1.111和1.053，这考虑了当纤维素中的糖基单元(平均分子量为162道尔顿)转化为葡萄糖(分子量为180道尔顿)或纤维二糖糖基单元(平均分子量为171道尔顿)时质量的增加。

表2：来自T.stipitatus的过氧化氢酶对Avicel的葡萄糖转化的作用。

如表2所示，在抗坏血酸存在下，每种单组分的纤维素酶的水解均可被T.stipitatus过氧化氢酶加强。

实施例3：特异腐质霉过氧化氢酶对PCS的水解的加强作用

PCS的制备和水解系统的设置与实施例1相同。来自特异腐质霉的过氧化氢酶如实施例14-20中所示克隆、表达和纯化。

将PCS以10％的起始TS和水解系统总重量20g的条件水解。使用里氏木霉纤维素酶组合物(可从Novozymes A/S,Bagsvaerd,Denmark获得的CTec2)进行酶水解。将按重量计百分之五的Ctec2基于蛋白量用特异腐质霉过氧化氢酶替代，且总酶剂量为4mg/g纤维素。使用含4mg里氏木霉纤维素酶组合物/g纤维素、但不含过氧化氢酶的水解系统作为对照。将烧瓶在50℃，在130rpm振荡下温育72小时。总水解时间为72小时。

葡萄糖转化的计算与实施例1相同，且加强作用示于表3。

表3：来自特异腐质霉的过氧化氢酶对PCS的葡萄糖转化的作用

	对照	特异腐质霉过氧化氢酶
			葡萄糖转化(％)	50.4±1.1	58.4±0.9

实施例4：特异腐质霉过氧化氢酶对PCS的水解的加强作用

将PCS以10％的起始TS和水解系统总重量20g的条件水解。使用里氏木霉纤维素酶组合物(可从Novozymes A/S,Bagsvaerd,Denmark获得的CTec3)进行酶水解。将按重量计百分之五的Ctec3基于蛋白量用特异腐质霉过氧化氢酶替代，且总酶剂量为4mg/g纤维素。使用含4mg里氏木霉纤维素酶组合物/g纤维素、但不含过氧化氢酶的水解系统作为对照。将烧瓶在50℃，在130rpm振荡下温育72小时。总水解时间为72小时。

葡萄糖转化的计算与实施例1相同，且加强作用示于表4。

表4：来自特异腐质霉的过氧化氢酶对PCS的葡萄糖转化的作用

	对照	特异腐质霉过氧化氢酶
			葡萄糖转化(％)	70.9±1.4	80.1±1.2

实施例5：桔橙嗜热子囊菌过氧化氢酶和桔橙嗜热子囊菌GH61A对PCS的水解的协同作用

PCS根据实施例1中所述的步骤制备，并以10％的起始TS和水解系统总重量20g的条件水解。将pH使用10M氢氧化钠调整至5.0。将里氏木霉纤维素酶组合物(在10％总蛋白重量的烟曲霉β-葡糖苷酶(WO 2005/047499)存在下的可从Novozymes A/S,Bagsvaerd,Denmark获得)添加入PCS进行酶水解，其中里氏木霉纤维素酶组合物对纤维素的比例为0.8％(w/w)。将来自桔橙嗜热子囊菌的过氧化氢酶，来自桔橙嗜热子囊菌的GH61A多肽(WO 2005/074656)，或其组合分别添加入水解系统。过氧化氢酶、GH61A多肽、或其组合的剂量基于纤维素的重量计算。含里氏木霉纤维素酶组合物但不含过氧化氢酶和GH61的水解系统用作对照。将烧瓶在50℃，在130rpm振荡下温育72小时。所有实验进行一式三次。对水解程度的HPLC分析根据实施例1中所述的步骤进行。在72小时水解之后PCS至葡萄糖的转化示于下表5。

表5：桔橙嗜热子囊菌过氧化氢酶和桔橙嗜热子囊菌GH61A对PCS的水解的协同作用

如表5中所示，仅过氧化氢酶或仅GH61A多肽均加强PCS的水解。令人意想不到地发现，当过氧化氢酶和GH61A多肽同时使用时，水解显著改善。这些结果表明过氧化氢酶和GH61A多肽对PCS的水解具有显著的协同作用。

实施例6：Penicillium emersonii过氧化氢酶对PCS水解的加强作用

PCS的制备和水解系统的设置与实施例1相同。将自P.emersonii的过氧化氢酶如实施例21-27中所示进行了克隆、表达和纯化。

将PCS以10％的起始TS和水解系统总重量20g的条件水解。将里氏木霉纤维素酶组合物(可从Novozymes A/S,Bagsvaerd,Denmark获得的CTec2)添加入PCS进行酶水解。将按重量计百分之五的Ctec2基于蛋白量用P.emersonii过氧化氢酶替代，且总酶剂量为4mg/g纤维素。使用含里氏木霉纤维素酶组合物、但不含过氧化氢酶的水解系统作为对照。将烧瓶在50℃、130rpm振荡下温育72小时。

葡萄糖转化的计算与实施例1相同，且加强作用示于表6。

表6：来自P.emersonii的过氧化氢酶对PCS的葡萄糖转化的作用

	对照	P.emersonii过氧化氢酶
			葡萄糖转化(％)	48.6±0.7	54.3±0.8

实施例7：在相对较高TS下桔橙嗜热子囊菌过氧化氢酶对PCS的水解的加强作用

PCS的制备和水解系统的设置与实施例1相同。将PCS以20％的起始TS和20g的水解系统的总重量水解。将里氏木霉纤维素酶组合物(可从Novozymes A/S,Bagsvaerd,Denmark获得的CTec2)添加入PCS进行酶水解。将按重量计百分之五的Ctec2基于蛋白量用桔橙嗜热子囊菌过氧化氢酶替代，总酶剂量为7mg/g纤维素。使用含里氏木霉纤维素酶组合物、但不含过氧化氢酶的水解系统作为对照。将烧瓶在50℃，在130rpm振荡下温育72小时。葡萄糖转化的计算与实施例1相同，且加强作用示于表7。

表7：来自桔橙嗜热子囊菌的过氧化氢酶对PCS的葡萄糖转化的作用

	对照	5％桔橙嗜热子囊菌过氧化氢酶替代
			葡萄糖转化(％)	58.6±1.4	64.8±0.8

实施例8：在相对较高TS下桔橙嗜热子囊菌过氧化氢酶对PCS的水解的加强作用

PCS的制备和水解系统的设置与实施例1相同。将PCS以20％的起始TS和20g的水解系统的总重量水解。使用里氏木霉纤维素酶组合物(可从Novozymes A/S,Bagsvaerd,Denmark获得的CTec3)进行酶水解。将按重量计百分之五的Ctec3基于蛋白量用桔橙嗜热子囊菌过氧化氢酶替代，且总酶剂量为6mg/g纤维素。使用含里氏木霉纤维素酶组合物、但不含过氧化氢酶的水解系统作为对照。将烧瓶在50℃、130rpm振荡下温育72小时。

葡萄糖转化的计算与实施例1相同，且过氧化氢酶的加强作用示于表8。

表8：来自桔橙嗜热子囊菌的过氧化氢酶对PCS的葡萄糖转化的作用

	对照	5％桔橙嗜热子囊菌过氧化氢酶替代
			葡萄糖转化(％)	72.0±	80.5±0.8

实施例9：Talaromyces stipitatus基因组DNA提取

将Talaromyces stipitatus菌株NN70在PDA琼脂平板在45℃生长3日。将菌丝体从琼脂平板在液氮冷却下直接收集入经灭菌的杵和研钵。将冻结的菌丝体用杵和研钵磨碎至细微粉末，并使用植物小提试剂盒(Plant Mini Kit)(QIAGEN Inc.,Valencia,CA,USA)分离基因组DNA。

实施例10：从基因组DNA克隆Talaromyces stipitatus过氧化氢酶基因

基于欧洲分子生物学实验室(European Molecular Biology Laboratory(EMBL)):EQ962660的DNA信息(即SEQ ID NO:3)和蛋白序列SWISSPROT:B8MT74(即SEQ IDNO:4)，设计了下示的寡核苷酸引物以从Talaromyces stipitatus NN70的基因组DNA扩增过氧化氢酶基因。引物由Invitrogen(Invitrogen,中国北京)制造。

正向引物：5’ACACAACTGGGGATCC ACC atgcgaggggcatactctctc 3’(SEQ ID NO:38)

反向引物：5’GTCACCCTCTAGATCT aacaagttactcgtgttaatcgtggaa 3’(SEQ ID NO:39)

小写字母代表基因的序列，而大写部分与US2010306879中所述的pPFJO355载体的插入位点同源。

表达载体pPFJO355含有来源于米曲霉的TAKA-淀粉酶启动子和黑曲霉葡糖淀粉酶终止子元件。此外pPFJO355具有用于在大肠杆菌中选择和繁殖的pUC18来源的序列，和pyrG基因，其编码来源于构巢曲霉的乳清苷脱羧酶、用于选择pyrG突变体曲霉属菌株的转化体。

将二十皮摩尔的引物对(正向和反向)用于PCR反应，所述反应由2μl的Talaromyces stipitatus NN70基因组DNA，10μl的5X GC缓冲液，1.5μl的DMSO，各2.5mM的dATP、dTTP、dGTP和dCTP，和0.6单位的PHUSION^TM高保真DNA聚合酶(Finnzymes Oy,Espoo,Finland)构成，最终体积为50μl。扩增使用Peltier Thermal Cycler(MJ Research Inc.,South San Francisco,CA,USA)进行，其编程如下：在98℃变性40秒；8个循环，每循环在98℃变性15秒，在70℃退火30秒，每个循环减少1℃，和在72℃延伸80秒；和另外23个循环，每个循环在98℃进行15秒，62℃进行30秒，和72℃进行80秒；在72℃最终延伸5分钟。然后加热块进入4℃浸泡循环。

PCR反应产物通过使用90mM Tris硼酸和1mM EDTA(TBE)缓冲液的1.0％琼脂糖凝胶电泳分离，其中在UV光下显示了预期大小(大约2.4kb)的单个产物条带，然后使用ILLUSTRA^TM GFX^TM PCR DNA和凝胶条带纯化试剂盒(GEHealthcare,Buckinghamshire,UK)根据生产商的指示从溶液纯化。

将质粒pPFJO355用Bam HI和Bgl II消化，通过使用TBE缓冲液的1.0％琼脂糖凝胶电泳分离，并使用ILLUSTRA^TM GFX^TM PCR DNA和凝胶条带纯化试剂盒根据生产商的指示纯化。

使用IN-FUSION^TM CF干式克隆试剂盒(Dry-down Cloning kit)(ClontechLaboratories,Inc.,Mountain View,CA,USA)将所述片段无需进行限制性消化和连接而直接克隆入表达载体pPFJO355。

将PCR反应产物和消化的载体使用IN-FUSION^TM CF干式PCR克隆(Dry-down PCRCloning)连接在一起，得到质粒pTs，其中Talaromyces stipitatus过氧化氢酶基因的转录处于来自米曲霉α-淀粉酶基因的启动子的调控之下。克隆操作根据生产商的指示进行。简言之，将30ng经Bam HI和Bgl II消化的pPFJO355，和60ng的纯化的Talaromycesstipitatus过氧化氢酶PCR反应产物添加至反应小瓶，并添加去离子水将粉末重悬于10μl的最终体积。将反应在37℃温育15分钟，然后在50℃温育15分钟。使用3μl的反应产物以转化大肠杆菌TOP10感受态细胞(TIANGEN Biotech(Beijing)Co.Ltd.,中国北京)。通过菌落PCR检出含有表达构建体的大肠杆菌转化体，这是一种从大肠杆菌菌落直接迅速筛选质粒插入的方法。简言之，在每个PCR试管中预混的PCR溶液等分试样(包含PCR缓冲液，MgCl₂，dNTP，和供PCR片段生成的引物对)中，通过用灭菌的移液吸头尖端挑取并将所述移液吸头尖在反应溶液中快速旋转(twirl)来添加单个菌落。通常筛选出7至10个菌落。在PCR程序之后，在琼脂糖凝胶上检查反应产物。给出预期大小的扩增的菌落可能含有正确的插入。质粒DNA使用QIAprep离心小提试剂盒(Spin Miniprep Kit)(QIAGEN Inc.,Valencia,CA,USA)制备。质粒pTs中插入的Talaromyces stipitatus过氧化氢酶基因通过使用3730XL DNA分析仪(Applied Biosystems Inc,Foster City,CA,USA)的DNA测序确认。

实施例11：米曲霉中Talaromyces stipitatus过氧化氢酶基因的表达

米曲霉HowB101(描述于专利WO9535385实施例1)原生质体根据Christensen等,1988,Bio/Technology 6:1419-1422的方法制备。使用3μg的质粒pTs转化米曲霉HowB101。

用质粒pTs转化米曲霉HowB101，每次转化产生约50个转化体。将八个转化体分离至单个基本培养基平板。

将来自每次转化的四个转化体分别接种入24孔板中的3ml YPM并在30℃，150rpm温育。在3日温育之后，将20μl来自每个培养物的上清在含(2-N-吗啉代)乙磺酸(MES)的NuPAGE Novex 4-12％Bis-Tris凝胶(Invitrogen Corporation,Carlsbad,CA,USA)上根据生产商的指示进行分析。将所得的凝胶用INSTANT BLUE^TM(Expedeon Ltd.,BabrahamCambridge,UK)染色。培养物的SDS-PAGE概貌显示检测出蛋白条带的表达。基因的主条带的大小为大约92KD。表达菌株命名为EXP84。

实施例12：表达菌株EXP84的发酵

将一个表达菌株EXP84的斜面用10ml的YPM洗涤并接种入八个含有400ml的YPM培养基的2升烧瓶以生成用于鉴定酶的培养液。在第3日收获培养物，并使用0.45μm DURAPORE膜(Millipore,Bedford,MA,USA)过滤。

实施例13：从米曲霉EXP84纯化重组Talaromyces stipitatus过氧化氢酶

将3200ml重组菌株EXP84的上清用硫酸铵(80％饱和)沉淀并重悬于50ml20mMTris-HCl缓冲液，pH7.5，然后针对相同的缓冲液透析，并通过0.45mm过滤器过滤，最终体积为100ml。将溶液施于在20mM Tris-HCl缓冲液pH7.5中平衡的40ml Q Fast Flow柱(GE Healthcare,Buckinghamshire,UK)。收集用0.08-0.2M NaCl洗脱的级分，并进一步在40ml Q Fast Flow柱(GE Healthcare,Buckinghamshire,UK)上用线性NaCl梯度(0.14–0.2M)纯化。级分通过SDS-PAGE(NP0336BOX,NUPAGE 4-12％BTGEL 1.5MM15W)评估。汇集含有大约92kDa的条带的级分。然后将汇集的溶液通过超滤浓缩。

实施例14：特异腐质霉基因组DNA提取

将特异腐质霉菌株NN38接种于PDA平板上，并在45℃避光温育3日。将数个菌丝体-PDA栓接种入含有100ml YPG培养基的500ml摇瓶。将烧瓶在45℃在160rpm振荡下温育3日。菌丝体通过经由(Calbiochem,La Jolla,CA,USA)的过滤来收集，并冻结在液氮中。将冻结的菌丝体通过杵和研钵磨碎为精细粉末，而基因组DNA使用植物大提试剂盒(Plant Maxi Kit)(QIAGEN Inc.,Valencia,CA,USA)根据生产商的指示分离。

实施例15：特异腐质霉菌株NN38的基因组测序、组装和注释

将提取的基因组DNA样品送至Beijing Genome Institute(BGI,中国深圳)以供使用GA2系统(Illumina,Inc.,San Diego,CA,USA)的基因组测序。在BGI将原始读取(raw read)使用程序SOAPdenovo(Li等,2010,Genome Research 20(2):265-72)进行组装。将组装后的序列使用标准的用于基因查找(gene finding)和功能预测的生物信息学手段进行分析。简言之，使用geneID(Parra等,2000,Genome Research 10(4):511-515)进行基因预测。使用Blastall version 2.2.10((Altschul等,1990,J.Mol.Biol.215(3):403–410；National Center for Biotechnology Information(NCBI),Bethesda,MD,USA)和HMMER version 2.1.1(National Center for Biotechnology Information(NCBI),Bethesda,MD,USA)基于结构同源性预测功能。通过对Blast结果的分析直接鉴定出过氧化氢酶基因(对于DNA序列为SEQ ID NO:5，对于蛋白序列为SEQ ID NO:6)。使用Agene程序(Munch和Krogh,2006,BMC Bioinformatics 7:263)和SignalP程序(Nielsen等,1997,Protein Engineering 10:1-6)鉴定起始密码子。还用SignalP预测信号肽。使用Pepstats(European Bioinformatics Institute,Hinxton,Cambridge CB10 1SD,UK)预测蛋白的等电点和分子量。

实施例16：从基因组DNA克隆特异腐质霉过氧化氢酶

基于特异腐质霉过氧化氢酶的DNA信息，设计了下示的寡核苷酸引物以从特异腐质霉NN38的基因组DNA扩增过氧化氢酶基因。引物由Invitrogen(Invitrogen,中国北京)制造。

正向引物：5’ACACAACTGGGGATCC ACC atgaacagagtcacgaatctcctcg 3’(SEQ IDNO:40)

反向引物：5’GTCACCCTCTAGATCT ggtacaactcccaccctattccttctc 3’(SEQ ID NO:41)

小写字母在正向引物中代表基因序列，在反向引物中代表基因的3’端的侧翼区，而大写部分与US2010306879中所述的pPFJO355载体的插入位点同源。

将20皮摩尔的引物对(正向和反向)用于PCR反应，所述反应由2μl的特异腐质霉NN38基因组DNA，10μl的5X GC缓冲液，1.5μl的DMSO，各2.5mM的dATP、dTTP、dGTP和dCTP，和0.6单位的PHUSION^TM高保真DNA聚合酶(Finnzymes Oy,Espoo,Finland)构成，最终体积为50μl。扩增使用PeltierThermal Cycler(MJ Research Inc.,South San Francisco,CA,USA)进行，其编程如下：在98℃变性1分钟；6个循环，每个循环在98℃变性15秒，在63℃退火30秒，每个循环降低1℃，并在72℃延伸3分钟；以及另外22个循环，每个循环在98℃进行15秒，62℃进行30秒，和72℃进行3分钟；在72℃最终延伸7分钟。加热块然后进入4℃浸泡循环。

PCR反应产物通过使用90mM Tris硼酸和1mM EDTA(TBE)缓冲液的1.0％琼脂糖凝胶电泳分离，其中在UV光下显现了预期大小(大约3.1kb)的单个产物条带，然后将其使用ILLUSTRA^TM GFX^TM PCRDNA和凝胶条带纯化试剂盒(GEHealthcare,Buckinghamshire,UK)根据生产商的指示从溶液纯化。

将质粒pPFJO355用Bam HI和Bgl II消化，通过使用TBE缓冲液的1.0％琼脂糖凝胶电泳分离，并使用ILLUSTRA^TM GFX^TM PCRDNA和凝胶条带纯化试剂盒根据生产商的指示纯化。

使用IN-FUSION^TM CF干式克隆试剂盒(Clontech Laboratories,Inc.,MountainView,CA,USA)将所述片段直接克隆入表达载体pPFJO355，而无需进行限制性消化和连接。

将PCR反应产物和消化的载体使用IN-FUSION^TM CF干式PCR克隆(Dry-down PCRCloning)连接在一起得到质粒pHi，该质粒中特异腐质霉过氧化氢酶基因的转录处于来自米曲霉α-淀粉酶基因的启动子的调控之下。克隆操作根据生产商的指示进行。简言之，将30ng经Bam HI和Bgl II消化的pPFJO355，和60ng的纯化的特异腐质霉过氧化氢酶PCR反应产物添加至反应小瓶，并添加去离子水将粉末重悬于10μl的最终体积。将反应在37℃温育15分钟，然后在50℃温育15分钟。使用3μl的反应产物以转化大肠杆菌TOP10感受态细胞(TIANGEN Biotech(Beijing)Co.Ltd.,中国北京)。通过菌落PCR检测含有报道构建体的大肠杆菌转化体，菌落PCR是一种从大肠杆菌菌落直接迅速筛选质粒插入的方法。简言之，在每个PCR试管中预混的PCR溶液等分试样(包含PCR缓冲液，MgCl₂，dNTP，和供PCR片段生成的引物对)中，通过用灭菌的移液吸头尖挑取并将该移液吸头尖在反应溶液中快速旋转(twirl)来添加单个菌落。通常筛选出7至10个菌落。在PCR程序之后，在琼脂糖凝胶上检查反应产物。给出预期大小的扩增的菌落可能含有正确的插入。质粒DNA使用QIAprep离心小提试剂盒(Spin Miniprep Kit)(QIAGEN Inc.,Valencia,CA,USA)制备。质粒pHi中插入的特异腐质霉过氧化氢酶基因通过使用3730XL DNA分析仪(Applied Biosystems Inc,Foster City,CA,USA)的DNA测序得到了确认。

实施例17：在米曲霉中表达特异腐质霉过氧化氢酶基因

米曲霉HowB101(描述于专利WO9535385实施例1)原生质体根据Christensen等,1988,Bio/Technology 6:1419-1422的方法制备。使用3μg的质粒pHi转化米曲霉HowB101。

用质粒pHi转化米曲霉HowB101每次转化产生约50个转化体。将八个转化体分离至各别的基本培养基平板。

将来自每次转化的四个转化体分别接种入24孔板中的3ml YPM中，并在30℃，150rpm温育。在3日温育之后，将来自每个培养物的上清20μl在含MES的NuPAGE Novex 4-12％Bis-Tris凝胶(Invitrogen Corporation,Carlsbad,CA,USA)上根据生产商的指示进行分析。将所得的凝胶用INSTANT BLUE^TM(Expedeon Ltd.,Babraham Cambridge,UK)染色。培养物的SDS-PAGE概貌显示检测出蛋白条带的表达。基因的主要条带的大小为大约80KD。表达菌株命名为O5。

实施例18：表达菌株O5的发酵

将一个表达菌株O5的斜面用10ml的YPM洗涤，并接种入12个含有400ml的YPM培养基的2升烧瓶中，以生成用于鉴定酶的培养液。在第3日收获培养物，并使用0.45μmDURAPORE膜(Millipore,Bedford,MA,USA)过滤。

实施例19：从米曲霉O5纯化重组特异腐质霉过氧化氢酶

将4000ml的重组菌株O5上清用硫酸铵(80％饱和)沉淀并重悬于50ml20mM Tris-HCl缓冲液，pH6.0，然后针对相同的缓冲液透析，并通过0.45mm过滤器过滤，最终体积为140ml。将溶液施于在20mM Bris-Tris缓冲液，pH6.0中平衡的40ml Q Fast Flow柱(GE Healthcare,Buckinghamshire,UK)，并用线性NaCl梯度(0–0.25M)洗脱蛋白。收集用0.2-0.5M NaCl洗脱的级分，并进一步在平衡于20mM Bis-Tris缓冲液pH6.0中的40ml Q Fast Flow柱(GE Healthcare,Buckinghamshire,UK)上纯化，并用线性NaCl梯度(0.2–0.5M)洗脱蛋白。级分通过SDS-PAGE(NP0336BOX,NUPAGE 4-12％BTGEL 1.5MM15W)评估。汇集含有大约80kDa的条带的级分。然后将汇集的溶液通过超滤浓缩。

特异腐质霉过氧化氢酶的成熟多肽与灰腐质霉热耐受性过氧化氢酶蛋白(WO2009104622-A1)具有99.25％同一性。

实施例20：过氧化氢酶活性测定

使用下述实验方案对纯化的特异腐质霉过氧化氢酶检查过氧化氢酶活性。

将30％H₂O₂(来自Xilong Chemical,中国广东)用双蒸水(ddH₂O)稀释1000倍来制备底物，最终浓度为10.3mM。通过将1μl的纯化的特异腐质霉过氧化氢酶样品添加入1000μl底物来起始反应。用Ultrospec 3300(GE Healthcare,Buckinghamshire,UK)分别在0和16秒读取240nm的光密度(OD)，OD的减少(从0.400至0.102)显示特异腐质霉过氧化氢酶的相对活性。

实施例21：Penicillium emersonii基因组DNA提取

将Penicillium emersonii菌株NN051602接种于PDA平板上，并在45℃避光温育3日。将数个菌丝体-PDA栓接种入含有100ml的YPG培养基的500ml摇瓶中。将烧瓶在45℃在160rpm振荡下温育3日。通过(Calbiochem,La Jolla,CA,USA)过滤来收集菌丝体，并在液氮中冷冻。将冷冻的菌丝体用杵和研钵磨碎至精细粉末，并使用真菌基因组DNA大提试剂盒-柱式(Large-Scale Column Fungal DNAout)(Baoman Biotechnology,中国上海)根据生产商的指示分离基因组DNA。

实施例22：基因组测序、组装和注释

将提取的基因组DNA样品递送至Beijing Genome Institute(BGI,中国深圳)以供使用GA2系统(Illumina,Inc.,San Diego,CA,USA)的基因组测序。在BGI将原始读取(raw read)使用程序SOAPdenovo(Li等,2010,Genome Research 20(2):265-72)进行组装。将组装的序列使用标准的供基因鉴定和功能预测的生物信息学手段进行分析。简言之，使用geneID(Parra等,2000,Genome Research 10(4):511-515)进行基因预测。使用Blastall 2.2.10版本(Altschul等,1990,J.Mol.Biol.215(3):403–410,http://blast.ncbi.nlm.nih.gov/Blast.cgi)和HMMER 2.1.1版本(National Center forBiotechnology Information(NCBI),Bethesda,MD,USA,http://hmmer.janelia.org)基于结构同源性预测功能。通过对Blast结果的分析直接鉴定出了过氧化氢酶。使用Agene程序(Munch和Krogh,2006,BMC Bioinformatics 7:263)和SignalP程序(Nielsen等,1997,Protein Engineering 10:1-6)鉴定起始密码子。进一步使用SignalP预测信号肽。使用Pepstats(Rice等,2000,Trends Genet.16(6):276-277)估计蛋白的等电点和分子量。

实施例23：从基因组DNA克隆Penicillium emersonii过氧化氢酶

选择了一个过氧化氢酶基因PE04230007241(SEQ ID NO:7)进行表达克隆。

基于通过基因组测序获得的基因信息，设计了下示的寡核苷酸引物以从Penicillium emersonii的基因组DNA扩增过氧化氢酶基因PE04230007241。引物由Invitrogen(Invitrogen,中国北京)制造。

正向引物	5’ACACAACTGGGGATCC ACC atgcgcgcagtgcagct 3’	SEQ ID NO:42
			反向引物	5’GTCACCCTCTAGATCT gtcgactattccaaccttcctatatggacac 3’	SEQ ID NO:43

正向引物的小写字母代表基因的编码序列，反向引物的小写字母代表基因的侧翼区，而大写部分与US2010306879中所述的pPFJO355载体的插入位点同源。

使用IN-FUSION^TM CF干式克隆试剂盒(Clontech Laboratories,Inc.,MountainView,CA,USA)将所述片段直接克隆入US2010306879中所述的表达载体pPFJO355，而无需进行限制性消化和连接。

表达载体pPFJO355含有来源于米曲霉的TAKA-淀粉酶启动子和黑曲霉葡糖淀粉酶终止子元件。此外pPFJO355具有用于在大肠杆菌中选择和繁殖的pUC18来源的序列，和pyrG基因，其编码来源于构巢曲霉的乳清苷脱羧酶、供选择pyrG突变体曲霉属菌株的转化体。

将20皮摩尔的上述每个用于PCR反应，所述反应由2μl的Penicillium emersonii基因组DNA，10μl的5X GC缓冲液，1.5μl的DMSO，各2.5mM的dATP、dTTP、dGTP和dCTP，和0.6单位的PHUSION^TM高保真DNA聚合酶(Finnzymes Oy,Espoo,Finland)构成，最终体积为50μl。扩增使用Peltier Thermal Cycler(MJ Research Inc.,South San Francisco,CA,USA)进行，其程序如下：在98℃变性1分钟；8个循环，每个循环在98℃变性15秒，在65℃退火30秒，每个循环减少1℃，并在72℃延伸3分钟；以及另外22个循环，每个循环在98℃进行15秒，58℃进行30秒，和72℃进行3分15秒；在72℃最终延伸10分钟。加热块然后进入4℃浸泡循环。

反应产物通过使用90mM Tris硼酸和1mM EDTA(TBE)缓冲液的1.0％琼脂糖凝胶电泳分离，其中将大约2.5kb的产物条带从凝胶切出，然后使用ILLUSTRA^TM GFX^TM PCRDNA和凝胶条带纯化试剂盒(GE Healthcare,Buckinghamshire,UK)根据生产商的指示从溶液纯化。

将PCR反应产物和消化的载体使用IN-FUSION^TM CF干式PCR克隆(Dry-down PCRCloning)连接在一起，得到质粒pCat_PE04230007241，其中Penicillium emersonii过氧化氢酶基因的转录处于来自米曲霉α-淀粉酶基因的启动子的调控之下。克隆操作根据生产商的指示进行。简言之，将30ng经Bam HI和Bgl II消化的pPFJO355，和60ng的纯化的Penicillium emersonii过氧化氢酶PCR反应产物添加至反应小瓶，并添加去离子水将粉末重悬于10μl的最终体积。将反应在37℃温育15分钟，然后在50℃温育15分钟。使用3μl的反应产物以转化大肠杆菌TOP10感受态细胞(TIANGEN Biotech(Beijing)Co.Ltd.,中国北京)。通过菌落PCR检出了一个含有pCat_PE04230007241的大肠杆菌转化体。菌落PCR是一种从大肠杆菌菌落直接迅速筛选质粒插入的方法。简言之，在每个PCR试管中预混的PCR溶液等分试样(包含PCR缓冲液，MgCl₂，dNTPs，和生成PCR片段的引物对)中，通过用灭菌的移液吸头尖挑取并将该移液吸头尖在反应溶液中快速旋转(twirl)来添加单个菌落。通常筛选出7至10个菌落。在PCR之后，通过使用TBE缓冲液的1.0％琼脂糖凝胶电泳分析反应产物。质粒DNA使用QIAprep离心小提试剂盒(Spin Miniprep Kit)(QIAGEN Inc.,Valencia,CA,USA)制备。pCat_PE04230007241中插入的Penicillium emersonii过氧化氢酶基因通过使用3730XL DNA分析仪(Applied Biosystems Inc,Foster City,CA,USA)的DNA测序得到了确认。

实施例24：在米曲霉中表达Penicillium emersonii过氧化氢酶基因

根据Christensen等,1988,Bio/Technology 6:1419-1422的方法制备米曲霉HowB101(描述于专利WO9535385实施例1)原生质体。使用3μg的pCat_PE04230007241转化米曲霉HowB101。

用pCat_PE04230007241转化米曲霉HowB101产生约50个转化体。将四个转化体分离至各别的基本培养基平板。

将四个转化体分别接种入24孔板中的3ml YPM并在30℃、150rpm温育。在3日温育之后，将来自每个培养物的20μl上清在含2-(N-吗啉代)乙磺酸(MES)的NuPAGE Novex 4-12％Bis-Tris凝胶(Invitrogen Corporation,Carlsbad,CA,USA)上根据生产商的指示进行分析。将所得的凝胶用INSTANT BLUE^TM(Expedeon Ltd.,Babraham Cambridge,UK)染色。培养物的SDS-PAGE概貌显示所有转化体均具有一条大约80KDa的条带。将表达菌株命名为O6YTS。

实施例25：米曲霉表达菌株O6YTS的发酵

将表达菌株O6YTS的一个斜面用10ml的YPM洗涤并接种入7个含有400ml的YPM培养基的2升烧瓶以生成用于鉴定酶的培养液。在第3日收获培养物，并使用0.45μm DURAPORE膜(Millipore,Bedford,MA,USA)过滤。

实施例26：从米曲霉O6YTS纯化重组Penicillium emersonii过氧化氢酶

将2800ml重组菌株O6YTS的上清用硫酸铵(80％饱和)沉淀并重悬于50ml20mMTris-HCl缓冲液，pH8.0，然后针对相同的缓冲液透析，并通过0.45mm过滤器过滤，最终体积为80ml。将溶液施于在20mM Tris-HCl缓冲液pH8.0中平衡的40ml Q FastFlow柱(GE Healthcare,Buckinghamshire,UK)。用0.18-0.25M NaCl洗脱的级分通过SDS-PAGE(NP0336BOX,NUPAGE4-12％BT GEL1.5MM15W)评估。汇集含有大约80kDa的条带的级分。然后将汇集的溶液通过超滤浓缩。

实施例27：过氧化氢酶活性测定

使用下述实验方案对纯化的Penicillium emersonii过氧化氢酶检查过氧化氢酶活性。

将30％H₂O₂(来自Xilong Chemical,中国广东)用双蒸水(ddH₂O)稀释1000倍来制备底物，最终浓度为10.3mM。通过将1μl的纯化的Penicillium emersonii过氧化氢酶样品添加入1000μl底物来起始反应。用Ultrospec 3300(GEHealthcare,Buckinghamshire,UK)分别在0和16秒读取240nm的光密度(OD)，OD的减少(从0.505至0.284)显示了Penicilliumemersonii过氧化氢酶的相对活性。

本发明通过下述编号段落进一步描述：

[1]一种用于降解或转化纤维素材料的方法，其包括：在具有过氧化氢酶活性的多肽的存在下用酶组合物处理纤维素材料。

[2]段1的方法，其中所述酶组合物包含一种或多种(例如几种)选自下组的酶：纤维素酶、具有纤维素分解增强活性的GH61多肽，半纤维素酶、酯酶、棒曲霉素、漆酶、木质素分解酶、果胶酶、过氧化物酶、蛋白酶和膨胀素。

[3]段2的方法，其中所述纤维素酶为一种或多种(例如几种)选自下组的酶：内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶。

[4]段2的方法，其中所述半纤维素酶为一种或多种(例如几种)选自下组的酶：木聚糖酶、乙酰木聚糖酯酶、阿魏酸酯酶、阿拉伯呋喃糖苷酶、木糖苷酶和葡糖醛酸糖苷酶。

[5]段1-4任一项的方法，其中所述纤维素材料选自下组：农业残余物、草本材料、城市固体废物、纸浆与造纸厂残余物、废纸和木材；优选芦竹、甘蔗渣、竹、玉米穗轴、玉米纤维、玉米秸秆、芒草属植物、橙皮、稻杆、柳枝稷、麦杆、桉树、枞树、松树、杨树、云杉、柳树、藻类纤维素、细菌纤维素、棉绒、滤纸、微晶纤维素或磷酸处理的纤维素。

[6]段1-5任一项的方法，其中所述纤维素材料被预处理，特别是通过化学预处理、物理预处理或生物化学预处理被预处理。

[7]段1-6任一项的方法，还包括回收经降解的纤维素材料。

[8]段7的方法，其中经降解的纤维素材料是糖。

[9]段8的方法，其中所述糖选自下组：葡萄糖、木糖、甘露糖、半乳糖和阿拉伯糖。

[10]段1-9任一项的方法，其中与不存在具有过氧化氢酶活性的多肽相比，具有过氧化氢酶活性的多肽的存在增加纤维素材料的水解。

[11]段1-10任一项的方法，其中所述具有过氧化氢酶活性的多肽选自下组：

(a)多肽，其与SEQ ID NO:2的成熟多肽、SEQ ID NO:4的成熟多肽、SEQ ID NO:6的成熟多肽、或SEQ ID NO:8的成熟多肽具有至少60％序列同一性；

(b)多肽，其由在低、中等、中等-高、高或非常高严格条件下与以下杂交的多核苷酸编码：(i)SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、或SEQ ID NO:7的成熟多肽编码序列，(ii)它们的cDNA序列，或(iii)(i)或(ii)的全长互补链；

(c)多肽，其由与以下具有至少60％序列同一性的多核苷酸编码：SEQ ID NO:1的成熟多肽编码序列、SEQ ID NO:3的成熟多肽编码序列、SEQ ID NO:5的成熟多肽编码序列、或SEQ ID NO:7的成熟多肽编码序列，或其cDNA序列；

(d)SEQ ID NO:2的成熟多肽的变体、SEQ ID NO:4的成熟多肽的变体、SEQ ID NO:6的成熟多肽的变体、或SEQ ID NO:8的成熟多肽的变体，其在一个或多个(例如几个)位置包含取代、缺失和/或插入；和

(e)(a)、(b)、(c)或(d)的多肽的具有过氧化氢酶活性的片段。

[12]段1-11任一项的方法，其中所述具有过氧化氢酶活性的多肽是来自嗜热子囊菌属、踝节菌属、腐质霉属或青霉属的过氧化氢酶。

[13]段12的方法，其中所述具有过氧化氢酶活性的多肽是来自桔橙嗜热子囊菌、Talaromyces stipitatus、特异腐质霉或Penicillium emersonii的过氧化氢酶。

[14]一种用于产生发酵产物的方法，其包括：

(c)从发酵回收发酵产物。

[15]段14的方法，其中所述酶组合物包含一种或多种(例如几种)选自下组的酶：纤维素酶、具有纤维素分解增强活性的GH61多肽，半纤维素酶、酯酶、棒曲霉素、漆酶、木质素分解酶、果胶酶、过氧化物酶、蛋白酶和膨胀素。

[16]段15的方法，其中所述纤维素酶为一种或多种(例如几种)选自下组的酶：内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶。

[17]段15的方法，其中所述半纤维素酶为一种或多种(例如几种)选自下组的酶：木聚糖酶、乙酰木聚糖酯酶、阿魏酸酯酶、阿拉伯呋喃糖苷酶、木糖苷酶和葡糖醛酸糖苷酶。

[18]段14-17任一项的方法，其中所述纤维素材料选自下组：农业残余物、草本材料、城市固体废物、纸浆与造纸厂残余物、废纸和木材；优选芦竹、甘蔗渣、竹、玉米穗轴、玉米纤维、玉米秸秆、芒草属植物、橙皮、稻杆、柳枝稷、麦杆、桉树、枞树、松树、杨树、云杉、柳树、藻类纤维素、细菌纤维素、棉绒、滤纸、微晶纤维素或磷酸处理的纤维素。

[19]段14-18任一项的方法，其中所述纤维素材料被预处理，特别是通过化学预处理、物理预处理或生物化学预处理被预处理；或其中(a)和(b)在同时糖化和发酵中同时进行。

[20]段14-19任一项的方法，其中所述发酵产物是醇、烷烃、环烷烃、烯烃、氨基酸、气体、异戊二烯、酮、有机酸或聚酮化合物。

[21]段14-20任一项的方法，其中与不存在具有过氧化氢酶活性的多肽相比，具有过氧化氢酶活性的多肽的存在增加纤维素材料的水解。

[22]段14-21任一项的方法，其中所述具有过氧化氢酶活性的多肽选自下组：

(c)多肽，其由与下述具有具有至少60％序列同一性的多核苷酸编码：SEQ ID NO:1的成熟多肽编码序列、SEQ ID NO:3的成熟多肽编码序列、SEQ ID NO:5的成熟多肽编码序列、或SEQ ID NO:7的成熟多肽编码序列，或其cDNA序列；

(e)(a)、(b)、(c)或(d)的多肽的具有过氧化氢酶活性的片段。

[23]段14-22任一项的方法，其中所述具有过氧化氢酶活性的多肽是来自嗜热子囊菌属、踝节菌属、腐质霉属或青霉属的过氧化氢酶。

[24]段23的方法，其中所述具有过氧化氢酶活性的多肽是来自桔橙嗜热子囊菌、Talaromyces stipitatus、特异腐质霉或Penicillium emersonii的过氧化氢酶。

[25]一种发酵纤维素材料的方法，其包括：用一种或多种(例如几种)发酵微生物发酵所述纤维素材料，其中所述纤维素材料在具有过氧化氢酶活性的多肽的存在下被酶组合物水解。

[26]段25的方法，其中所述酶组合物包含一种或多种(例如几种)选自下组的酶：纤维素酶、具有纤维素分解增强活性的GH61多肽，半纤维素酶、酯酶、棒曲霉素、漆酶、木质素分解酶、果胶酶、过氧化物酶、蛋白酶和膨胀素。

[27]段26的方法，其中所述纤维素酶为一种或多种(例如几种)选自下组的酶：内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶。

[28]段26的方法，其中所述半纤维素酶为一种或多种选自下组的酶：木聚糖酶、乙酰木聚糖酯酶、阿魏酸酯酶、阿拉伯呋喃糖苷酶、木糖苷酶和葡糖醛酸糖苷酶。

[29]段25-28任一项的方法，其中所述纤维素材料选自下组：农业残余物、草本材料、城市固体废物、纸浆与造纸厂残余物、废纸和木材；优选芦竹、甘蔗渣、竹、玉米穗轴、玉米纤维、玉米秸秆、芒草属植物、橙皮、稻杆、柳枝稷、麦杆、桉树、枞树、松树、杨树、云杉、柳树、藻类纤维素、细菌纤维素、棉绒、滤纸、微晶纤维素或磷酸处理的纤维素。

[30]段25-29任一项的方法，其中所述纤维素材料被预处理，特别是通过化学预处理、物理预处理或生物化学预处理被预处理。

[31]段25-30任一项的方法，其中所述发酵产生发酵产物。

[32]段31的方法，还包括回收所述发酵产物。

[33]段32的方法，其中所述发酵产物是醇、烷烃、环烷烃、烯烃、氨基酸、气体、异戊二烯、酮、有机酸或聚酮化合物。

[34]段25-33任一项的方法，其中与不存在具有过氧化氢酶活性的多肽相比，具有过氧化氢酶活性的多肽的存在增加纤维素材料的水解。

[35]段25-34任一项的方法，其中所述具有过氧化氢酶活性的多肽选自下组：

(e)(a)、(b)、(c)或(d)的多肽具有过氧化氢酶活性的片段。

[36]段25-35任一项的方法，其中所述具有过氧化氢酶活性的多肽是来自嗜热子囊菌属、踝节菌属、腐质霉属或青霉属的过氧化氢酶。

[37]段36的方法，其中所述具有过氧化氢酶活性的多肽是来自桔橙嗜热子囊菌、Talaromyces stipitatus、特异腐质霉或Penicillium emersonii的过氧化氢酶。

[38]一种用于降解或转化纤维素材料的酶组合物，其包含一种或多种(例如几种)具有纤维素分解和/或半纤维素分解活性的酶，和具有过氧化氢酶活性的多肽。

[39]段38的酶组合物，其还包含一种或多种(例如几种)选自下组的酶：具有纤维素分解增强活性的GH61多肽、酯酶、棒曲霉素、漆酶、木质素分解酶、果胶酶、过氧化物酶、蛋白酶和膨胀素。

[40]段38或39的酶组合物，其中所述具有纤维素分解活性的酶为选自下组的酶：内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶。

[41]段38-40任一项的酶组合物，其中所述具有半纤维素分解活性的酶为选自下组的酶：木聚糖酶、乙酰木聚糖酯酶、阿魏酸酯酶、阿拉伯呋喃糖苷酶、木糖苷酶和葡糖醛酸糖苷酶。

[42]段38-41任一项的酶组合物，其中所述具有过氧化氢酶活性的多肽选自下组：

(e)(a)、(b)、(c)或(d)的多肽的具有过氧化氢酶活性的片段。

[43]段38-42任一项的酶组合物，其中所述具有过氧化氢酶活性的多肽是来自嗜热子囊菌属、踝节菌属、腐质霉属或青霉属的过氧化氢酶。

[44]段43的酶组合物，其中所述具有过氧化氢酶活性的多肽是来自桔橙嗜热子囊菌、Talaromyces stipitatus、特异腐质霉或Penicillium emersonii的过氧化氢酶。

[45]段38-44任一项的酶组合物在降解或转化纤维素材料中的用途。

[46]段45的用途，其中所述纤维素材料选自下组：农业残余物、草本材料、城市固体废物、纸浆与造纸厂残余物、废纸和木材；优选芦竹、甘蔗渣、竹、玉米穗轴、玉米纤维、玉米秸秆、芒草属植物、橙皮、稻杆、柳枝稷、麦杆、桉树、枞树、松树、杨树、云杉、柳树、藻类纤维素、细菌纤维素、棉绒、滤纸、微晶纤维素或磷酸处理的纤维素。

[47]段45或46的用途，其中所述纤维素材料被预处理，特别是通过化学预处理、物理预处理或生物化学预处理被预处理。

[48]一种全培养液配制物或细胞培养组合物，其包含一种或多种(例如几种)具有纤维素分解和/或半纤维素分解活性的酶，和具有过氧化氢酶活性的多肽。

本文描述和要求保护的本发明并不局限于本文公开的具体方面的范围内，因为这些方面旨在作为本发明几个方面的说明。旨在将任何等同的方面包含于本发明的范围内。实际上，从前面的说明中，除本文所显示和描述的之外，本发明的多种修改对于本领域的技术人员来说是显而易见的。这些修改也旨在落入所附的权利要求的范围内。在冲突的情况下，将以包括定义部分的本公开为准。

序列表

<110> 诺维信公司(Novozymes A/S)

<120> 用于降解或转化纤维素材料的方法

<130> 12089-WO-PCT[2]

<150> PCT/CN2011/072143

<151> 2011-03-25

<150> PCT/CN2011/084230

<151> 2011-12-19

<160> 43

<170> PatentIn version 3.5

<210> 1

<211> 2354

<212> DNA

<213> 桔橙嗜热子囊菌(Thermoascus aurantiacus)

<400> 1

atggctgcta caatcgctgg tgggctacac aaggcccagg acctcatcaa gaacaccaca 60

tcgagggaca agaagctggt ggacttggag cgcgacactg acaatatcca cacaaagtgc 120

ccctttacgt cagaccatgg cgttgctatt agcaataccg acaattggct gaaggctgtg 180

gattaccagc atactggtcc atccctcctg gaagatcagt ttgctagaga gaaggtatat 240

ccaatttctc ttcccgaatg aaagctcggt tgcagcattt gactcgcatc cagattcacc 300

gcttcgatca cgagcgcatt ccagaaagag tggttcatgc acgaggagca ggtgccttcg 360

gaaacttcag actcaaggag agcgcggcgg atgttaccca cgcaggagta ctgacggaca 420

cgtcgcgaaa caccccagtc tttgtccgtt tctccactgt ccaagggagt aggggtagtg 480

ccgacacagt ccgcgacgtt cgaggattcg cggttaagtt ctacaccgac gagggtaatt 540

gggatatagt gggcaacaac atccctgtct tcttcatcca ggaagctata aagtttcccg 600

atgtcggtac gcgatctcgt attctacccg ttgtcaggtc tagcaactaa ctgcactaag 660

ttcacgctgt caagccggag ccacacaatg aggtccctac agcgcagacg gcccataata 720

acttctggga cttcgtatat atgcatcccg aggcgacaca catgttcatg tggatcatgt 780

ctgatagagc aattccacga tcgttccgta tgatgcaagg attcagtgtg aacactttcg 840

ttctcgttaa caaagagggc aaacgctcct ttgtcaagtt ccattggatc cccaagcttg 900

gcctgcactc actcgtttgg gatgaggccc agaaaattgc tggccaggat cccgattttc 960

accggaaaga cctctgggag gccattgcca acaagatcta ccccaaatgg gattttggta 1020

tccaggtgat cccagaggag aaacagcatg acttcgaatt tgatctcctc gatgccacca 1080

agctctggcc cgaggatctc atccccgtcc gtatcatcgg agagctggag cttaaccgca 1140

atccggacga gttcttcacc cagacagagc aggttgcttt ctgcaccagc cacattgtcc 1200

ccggcataga attctctgat gaccctctac tccatggccg caacttctcc tacttcgata 1260

cccagattac cagactggga attaactggg aagagcttcc aatcaaccgt cccgtatgtc 1320

ctgttttcaa ccacaacagg gacggccagt cgcgacatag gatcacacag ggaactgtta 1380

actactggcc caaccgcttt gaagcttgtc caccgaccaa acccgaggaa ggtgggttcg 1440

taacataccc gtcgacattc cacggcctca aacagcgcac cttgagttat aagttccgtg 1500

aacatcataa ccaagcgcag atgttctata actccctgtc ggagcacgaa aagctccatc 1560

ttaccaaggc attcagcttc gagcttgacc actgcgacga cccaaccgtc tacagtcggt 1620

tggccggcga acgcctggcc gaaatcgacc tcgggctcgc ccagaaagtc gccgagatgg 1680

tcggcgcccc gatcccgacg agagccctca aggagaacaa aggccagcga gcggtccggc 1740

tgtccttcac ggaattctat cctcctaacc caaccatcga gtcccgccgt gtggctatca 1800

taatcggcga cggctacgac ccgatagcgt tcttgggcat caaagcagcc gtcgaggccg 1860

ccaacgctct gcccttcatc atcggcacca agcgccagcc catgttcgcc gaaggcgaag 1920

acagaaccac ctccaagggc gtcatcccgg accaccagta cgacggacag cgctcgaccc 1980

tgttcgacgc gaccttcatc ccaggcggct ctcacgtcaa gacgctggcc cagaacgggc 2040

agatccggta ctggatcacc gagaccttcg ggcacctgaa ggctctggcc gcgacgggcg 2100

aggctgtcga ccttgtcaag caggtgctga gcgtcgttcc cggtctgcag ttcgccactc 2160

caaacgagcc caacgtcgtc gagtcatacg gcgtcgtcac cgtgggcggg aagcagaagc 2220

ctgagagctt cagcgagggg ttcaagatcc tcaaggatgc gaaggacttt gtgggccagt 2280

tcttctacca gatctcacag catcggaact ttaagcgtga gctggaaggg ctgcatgcca 2340

ccgttgcgtt ttaa 2354

<210> 2

<211> 746

<212> PRT

<213> 桔橙嗜热子囊菌

<400> 2

Met Ala Ala Thr Ile Ala Gly Gly Leu His Lys Ala Gln Asp Leu Ile

1 5 10 15

Lys Asn Thr Thr Ser Arg Asp Lys Lys Leu Val Asp Leu Glu Arg Asp

20 25 30

Thr Asp Asn Ile His Thr Lys Cys Pro Phe Thr Ser Asp His Gly Val

35 40 45

Ala Ile Ser Asn Thr Asp Asn Trp Leu Lys Ala Val Asp Tyr Gln His

50 55 60

Thr Gly Pro Ser Leu Leu Glu Asp Gln Phe Ala Arg Glu Lys Ile His

65 70 75 80

Arg Phe Asp His Glu Arg Ile Pro Glu Arg Val Val His Ala Arg Gly

85 90 95

Ala Gly Ala Phe Gly Asn Phe Arg Leu Lys Glu Ser Ala Ala Asp Val

100 105 110

Thr His Ala Gly Val Leu Thr Asp Thr Ser Arg Asn Thr Pro Val Phe

115 120 125

Val Arg Phe Ser Thr Val Gln Gly Ser Arg Gly Ser Ala Asp Thr Val

130 135 140

Arg Asp Val Arg Gly Phe Ala Val Lys Phe Tyr Thr Asp Glu Gly Asn

145 150 155 160

Trp Asp Ile Val Gly Asn Asn Ile Pro Val Phe Phe Ile Gln Glu Ala

165 170 175

Ile Lys Phe Pro Asp Val Val His Ala Val Lys Pro Glu Pro His Asn

180 185 190

Glu Val Pro Thr Ala Gln Thr Ala His Asn Asn Phe Trp Asp Phe Val

195 200 205

Tyr Met His Pro Glu Ala Thr His Met Phe Met Trp Ile Met Ser Asp

210 215 220

Arg Ala Ile Pro Arg Ser Phe Arg Met Met Gln Gly Phe Ser Val Asn

225 230 235 240

Thr Phe Val Leu Val Asn Lys Glu Gly Lys Arg Ser Phe Val Lys Phe

245 250 255

His Trp Ile Pro Lys Leu Gly Leu His Ser Leu Val Trp Asp Glu Ala

260 265 270

Gln Lys Ile Ala Gly Gln Asp Pro Asp Phe His Arg Lys Asp Leu Trp

275 280 285

Glu Ala Ile Ala Asn Lys Ile Tyr Pro Lys Trp Asp Phe Gly Ile Gln

290 295 300

Val Ile Pro Glu Glu Lys Gln His Asp Phe Glu Phe Asp Leu Leu Asp

305 310 315 320

Ala Thr Lys Leu Trp Pro Glu Asp Leu Ile Pro Val Arg Ile Ile Gly

325 330 335

Glu Leu Glu Leu Asn Arg Asn Pro Asp Glu Phe Phe Thr Gln Thr Glu

340 345 350

Gln Val Ala Phe Cys Thr Ser His Ile Val Pro Gly Ile Glu Phe Ser

355 360 365

Asp Asp Pro Leu Leu His Gly Arg Asn Phe Ser Tyr Phe Asp Thr Gln

370 375 380

Ile Thr Arg Leu Gly Ile Asn Trp Glu Glu Leu Pro Ile Asn Arg Pro

385 390 395 400

Val Cys Pro Val Phe Asn His Asn Arg Asp Gly Gln Ser Arg His Arg

405 410 415

Ile Thr Gln Gly Thr Val Asn Tyr Trp Pro Asn Arg Phe Glu Ala Cys

420 425 430

Pro Pro Thr Lys Pro Glu Glu Gly Gly Phe Val Thr Tyr Pro Ser Thr

435 440 445

Phe His Gly Leu Lys Gln Arg Thr Leu Ser Tyr Lys Phe Arg Glu His

450 455 460

His Asn Gln Ala Gln Met Phe Tyr Asn Ser Leu Ser Glu His Glu Lys

465 470 475 480

Leu His Leu Thr Lys Ala Phe Ser Phe Glu Leu Asp His Cys Asp Asp

485 490 495

Pro Thr Val Tyr Ser Arg Leu Ala Gly Glu Arg Leu Ala Glu Ile Asp

500 505 510

Leu Gly Leu Ala Gln Lys Val Ala Glu Met Val Gly Ala Pro Ile Pro

515 520 525

Thr Arg Ala Leu Lys Glu Asn Lys Gly Gln Arg Ala Val Arg Leu Ser

530 535 540

Phe Thr Glu Phe Tyr Pro Pro Asn Pro Thr Ile Glu Ser Arg Arg Val

545 550 555 560

Ala Ile Ile Ile Gly Asp Gly Tyr Asp Pro Ile Ala Phe Leu Gly Ile

565 570 575

Lys Ala Ala Val Glu Ala Ala Asn Ala Leu Pro Phe Ile Ile Gly Thr

580 585 590

Lys Arg Gln Pro Met Phe Ala Glu Gly Glu Asp Arg Thr Thr Ser Lys

595 600 605

Gly Val Ile Pro Asp His Gln Tyr Asp Gly Gln Arg Ser Thr Leu Phe

610 615 620

Asp Ala Thr Phe Ile Pro Gly Gly Ser His Val Lys Thr Leu Ala Gln

625 630 635 640

Asn Gly Gln Ile Arg Tyr Trp Ile Thr Glu Thr Phe Gly His Leu Lys

645 650 655

Ala Leu Ala Ala Thr Gly Glu Ala Val Asp Leu Val Lys Gln Val Leu

660 665 670

Ser Val Val Pro Gly Leu Gln Phe Ala Thr Pro Asn Glu Pro Asn Val

675 680 685

Val Glu Ser Tyr Gly Val Val Thr Val Gly Gly Lys Gln Lys Pro Glu

690 695 700

Ser Phe Ser Glu Gly Phe Lys Ile Leu Lys Asp Ala Lys Asp Phe Val

705 710 715 720

Gly Gln Phe Phe Tyr Gln Ile Ser Gln His Arg Asn Phe Lys Arg Glu

725 730 735

Leu Glu Gly Leu His Ala Thr Val Ala Phe

740 745

<210> 3

<211> 2452

<212> DNA

<213> Talaromyces stipitatus

<400> 3

atgcgagggg catactctct cggcgccttt gccagtctca tcgcggtagc ttcggctgcc 60

tgcccaatgc tgactggcga aatcccagca ggcagcattg caaaccctca tcaccttgga 120

agccgcgctg actcgaatgc ttccgacgaa acagaagcct ttctgtccga attctacctt 180

aatgacaaca acagcttcct cactaccgat gtgggcggcc cgatagaaga ccaaaacagt 240

ctcaaggccg gcattcgcgg atcaacgctc ttggaggatt tcatctttcg ccagaagatt 300

cagcgctttg atcacgagcg tgtaagttct tgaaatcata tgactacttc gatgtgtact 360

tacgacttct aggtgcccga acgcgctgtg catgctcgag gtgctggtgc tcatggtgta 420

ttcacatcgt atgctgattg gtccaacatc accgctgctt cattcctagg agctgccgga 480

aaggaaacgc ccacctttgt acgcttctcg actgttgccg gcagtcgtgg tagtgccgat 540

accgctcgtg atgttcacgg ctttgctacc cgcttctata ctgacgaagg caactacggt 600

aagatctatc catggtcata gcagcctata catttgctaa ctcacagcag atatcgttgg 660

aaacaacatt cccgtcttct tcatccaaga cgctattcag ttccctgacc tcattcatgc 720

agtcaagcca cagccagcca gtgaaatccc acaggccgct actgcccacg acactgctta 780

tgatttcttc ggccagcagc ctagtacctt gcataccctc ttctgggcaa tggcaggtca 840

tggtatcccg cggtctttcc gccatgttga cggattcggc gttcacgctt accgatttgt 900

gactgacgac ggctcttcaa agctagtcaa attccactgg aagtccttac agggtcgtgc 960

aagcttagtc tgggaagaag ctcaagccac tgctggcaag aatgctgatt tcatgaggca 1020

agatctgttt gacaatattg cagctggccg gtacccagaa tgggaggtga gtataagttg 1080

cctgtcctcc gaagaatttc actaacatga atagctcggc gtgcaactta tcgaggaacc 1140

agaccagctc agctacggat ttgatctgct tgatcccacc aagatactcc cagttgaaca 1200

agttccaatc accccgctcg gaaaaatgca actcaaccgt aacccgctaa actactttgc 1260

tgagaccgag caagtaatgg tacgttaact tctcttctcc ccctcccccc aaacaactcc 1320

gggtacagct catgctgatc attttagttc caacctggtc acattgttcg tggcattgat 1380

ttcacagagg accctcttct ccaaggccgt ctattttctt acctcgacac tcagcttaat 1440

cgcaacggtg gccccaactt tgagcagatt ccgatcaacc gtcctcgtgt tcctatccac 1500

aataacaacc gagacggttt tggccagatg tttattccac tcaacgatgc ggcatactcg 1560

ccaaacaccc taagcgatgg caaccctaag caggcaaatg agactgttgg aaatggtttc 1620

tttactactc caggacgcac tgccaatgga aacctcgtcc gcgccaaaag cccaacgttt 1680

gcggatgtgt ggtcccaacc tggcctcttt tacaactcct tgacagccac cgaacaacag 1740

tttgtcatca atgctctgcg gttcgagcta gccaatgtag caagtgagac tgtgaagaat 1800

aacttcatca cccagatcaa tcgcgtaaac aacaccttgg caacacttgt agccactgca 1860

attggtgtca atgctcctga acccgacccg acttactacc accacaacaa gacgtctgat 1920

gtgggaacat tcggtactcc tctgaagaag attgatggtc tcaaggtcgg agtccttgct 1980

tctgtcaacg atgaaaacag tatttccgag ggacagtctc tagcacgaag cttggcggat 2040

ttgaatgtgg acgtcgttat tgtcgctgaa cgacttgctg gtaatgtctc agctacatac 2100

tccgcatctg acgctatcaa cttcgatgct gttattgtca cttcaggggc taagggtctc 2160

tttggacctc aaaccttcac cgccgtatcc aacaccactc tttatcccgt gggccgtccc 2220

acgcagattt tggtcgacgc tttccgctac ggcaagccgg ttggagcagt gggtagtgca 2280

agcgaagcgc tgactgtttc ggacattgat actgaccgca gtggtgtgat tactggtgat 2340

ttgaacgacg agtttgtgaa gcaactgtcg gaggaccttg caacattcaa gttcttggac 2400

cgcttcaccg tcgacgagta gacgtttcca cgattaacac gagtaacttg tt 2452

<210> 4

<211> 733

<212> PRT

<213> Talaromyces stipitatus

<400> 4

Met Arg Gly Ala Tyr Ser Leu Gly Ala Phe Ala Ser Leu Ile Ala Val

1 5 10 15

Ala Ser Ala Ala Cys Pro Met Leu Thr Gly Glu Ile Pro Ala Gly Ser

20 25 30

Ile Ala Asn Pro His His Leu Gly Ser Arg Ala Asp Ser Asn Ala Ser

35 40 45

Asp Glu Thr Glu Ala Phe Leu Ser Glu Phe Tyr Leu Asn Asp Asn Asn

50 55 60

Ser Phe Leu Thr Thr Asp Val Gly Gly Pro Ile Glu Asp Gln Asn Ser

65 70 75 80

Leu Lys Ala Gly Ile Arg Gly Ser Thr Leu Leu Glu Asp Phe Ile Phe

85 90 95

Arg Gln Lys Ile Gln Arg Phe Asp His Glu Arg Val Pro Glu Arg Ala

100 105 110

Val His Ala Arg Gly Ala Gly Ala His Gly Val Phe Thr Ser Tyr Ala

115 120 125

Asp Trp Ser Asn Ile Thr Ala Ala Ser Phe Leu Gly Ala Ala Gly Lys

130 135 140

Glu Thr Pro Thr Phe Val Arg Phe Ser Thr Val Ala Gly Ser Arg Gly

145 150 155 160

Ser Ala Asp Thr Ala Arg Asp Val His Gly Phe Ala Thr Arg Phe Tyr

165 170 175

Thr Asp Glu Gly Asn Tyr Asp Ile Val Gly Asn Asn Ile Pro Val Phe

180 185 190

Phe Ile Gln Asp Ala Ile Gln Phe Pro Asp Leu Ile His Ala Val Lys

195 200 205

Pro Gln Pro Ala Ser Glu Ile Pro Gln Ala Ala Thr Ala His Asp Thr

210 215 220

Ala Tyr Asp Phe Phe Gly Gln Gln Pro Ser Thr Leu His Thr Leu Phe

225 230 235 240

Trp Ala Met Ala Gly His Gly Ile Pro Arg Ser Phe Arg His Val Asp

245 250 255

Gly Phe Gly Val His Ala Tyr Arg Phe Val Thr Asp Asp Gly Ser Ser

260 265 270

Lys Leu Val Lys Phe His Trp Lys Ser Leu Gln Gly Arg Ala Ser Leu

275 280 285

Val Trp Glu Glu Ala Gln Ala Thr Ala Gly Lys Asn Ala Asp Phe Met

290 295 300

Arg Gln Asp Leu Phe Asp Asn Ile Ala Ala Gly Arg Tyr Pro Glu Trp

305 310 315 320

Glu Leu Gly Val Gln Leu Ile Glu Glu Pro Asp Gln Leu Ser Tyr Gly

325 330 335

Phe Asp Leu Leu Asp Pro Thr Lys Ile Leu Pro Val Glu Gln Val Pro

340 345 350

Ile Thr Pro Leu Gly Lys Met Gln Leu Asn Arg Asn Pro Leu Asn Tyr

355 360 365

Phe Ala Glu Thr Glu Gln Val Met Phe Gln Pro Gly His Ile Val Arg

370 375 380

Gly Ile Asp Phe Thr Glu Asp Pro Leu Leu Gln Gly Arg Leu Phe Ser

385 390 395 400

Tyr Leu Asp Thr Gln Leu Asn Arg Asn Gly Gly Pro Asn Phe Glu Gln

405 410 415

Ile Pro Ile Asn Arg Pro Arg Val Pro Ile His Asn Asn Asn Arg Asp

420 425 430

Gly Phe Gly Gln Met Phe Ile Pro Leu Asn Asp Ala Ala Tyr Ser Pro

435 440 445

Asn Thr Leu Ser Asp Gly Asn Pro Lys Gln Ala Asn Glu Thr Val Gly

450 455 460

Asn Gly Phe Phe Thr Thr Pro Gly Arg Thr Ala Asn Gly Asn Leu Val

465 470 475 480

Arg Ala Lys Ser Pro Thr Phe Ala Asp Val Trp Ser Gln Pro Gly Leu

485 490 495

Phe Tyr Asn Ser Leu Thr Ala Thr Glu Gln Gln Phe Val Ile Asn Ala

500 505 510

Leu Arg Phe Glu Leu Ala Asn Val Ala Ser Glu Thr Val Lys Asn Asn

515 520 525

Phe Ile Thr Gln Ile Asn Arg Val Asn Asn Thr Leu Ala Thr Leu Val

530 535 540

Ala Thr Ala Ile Gly Val Asn Ala Pro Glu Pro Asp Pro Thr Tyr Tyr

545 550 555 560

His His Asn Lys Thr Ser Asp Val Gly Thr Phe Gly Thr Pro Leu Lys

565 570 575

Lys Ile Asp Gly Leu Lys Val Gly Val Leu Ala Ser Val Asn Asp Glu

580 585 590

Asn Ser Ile Ser Glu Gly Gln Ser Leu Ala Arg Ser Leu Ala Asp Leu

595 600 605

Asn Val Asp Val Val Ile Val Ala Glu Arg Leu Ala Gly Asn Val Ser

610 615 620

Ala Thr Tyr Ser Ala Ser Asp Ala Ile Asn Phe Asp Ala Val Ile Val

625 630 635 640

Thr Ser Gly Ala Lys Gly Leu Phe Gly Pro Gln Thr Phe Thr Ala Val

645 650 655

Ser Asn Thr Thr Leu Tyr Pro Val Gly Arg Pro Thr Gln Ile Leu Val

660 665 670

Asp Ala Phe Arg Tyr Gly Lys Pro Val Gly Ala Val Gly Ser Ala Ser

675 680 685

Glu Ala Leu Thr Val Ser Asp Ile Asp Thr Asp Arg Ser Gly Val Ile

690 695 700

Thr Gly Asp Leu Asn Asp Glu Phe Val Lys Gln Leu Ser Glu Asp Leu

705 710 715 720

Ala Thr Phe Lys Phe Leu Asp Arg Phe Thr Val Asp Glu

725 730

<210> 5

<211> 3076

<212> DNA

<213> Humicola insolens

<400> 5

atgaacagag tcacgaatct cctcgcctgg gccggcgcga tagggctcgc ccaagcaaca 60

tgcccctttg cggaccctgc cgctctgtat aggcgtcaag atactaccag cggccagtcg 120

ccacttgcag catacgaggt ggatgacagc accggatacc tgacctccga tgttggcggg 180

cccattcagg accagaccag cctcaaggca ggcatccggg gtccgaccct tcttgaggac 240

tttatgttcc gccagaagat ccagcacttc gaccatgaac gggtaaggac ataatgctca 300

cacgagcggc tgcgtaccta tttatttccg agacattggg ctggctggct ggctgtgact 360

gcctgagttt ggggacatac ggagtacctt actgacgcgc tgatccactc caggttcccg 420

aaagggcggt ccatgctcga ggcgctggag cacacgggac cttcacgagt tacgccgact 480

ggagtaacat cacagcggcg tcctttctga acgccacagg aaagcagacg ccggtgtttg 540

tccggttctc gaccgttgct gggtctcgag ggagcgcaga cacggcgaga gacgttcatg 600

gtttcgcgac gcggttgtaa gttttgttgt gtttcattcg ttccggtctg tagaggaggg 660

ttaggatatg agctaatgtg tgtgtgtgtg tgtgtgtgtg tgtgaagtta cactgatgaa 720

ggcaactttg gtacgtccca tgcatggtcc tcaattctct tatctggcag cgatgtggtc 780

attgtcgacg ttgctaactt gcgtagatat cgtcggaaac aacatcccgg tattcttcat 840

tcaagatgca atccagttcc ctgaccttat ccactcggtc aagccgcgtc ccgacaacga 900

gattccccaa gcggcgacgg ctcatgattc agcttgggac ttcttcagcc agcagccaag 960

caccatggta agcaatggac caaggagccg cacctggggt gacatgccag ggagtacacg 1020

gagcgttccg atgactctcg tgtgaccaag gcagtacaac actccacgga ggactcgaag 1080

agattcggaa atatggaaca cagaactgac aggatggtag cacacgttgt tctgggccat 1140

gtctggccac ggaatccctc gcagctatcg ccatatggta cgtttgcctg gctgagatga 1200

ccgtgaatcc atttctaacc tcaagtccag gatggcttcg gcgtccacac gttccggttt 1260

gtcaaagatg acggctcgtc caagttgatc aagtggcatt tcaagtcacg ccagggaaag 1320

gcgagtctag tctgggaaga ggcgcaggtt ctgtctggca agaatgccga cttccaccgt 1380

caggacctct gggatgctat tgagtccggg aacggaccag aatgggatgt ctgcgtccag 1440

attgtcgatg agtcccaggc gcaagccttt ggcttcgact tgctggaccc gacaaagatc 1500

atccccgagg agtacgcccc cttgacgaag ctgggcctct tgaaactgga tcgcaatccg 1560

accaactact tcgccgagac ggagcaggtc atgttccaac ccggtcatat cgtccgcggc 1620

atcgacttca cggaggatcc cctgctacag ggacgtctct tctcgtacct tgacacgcag 1680

ctgaaccgga atggcgggcc caactttgag cagctgccca tcaacatgcc gcgggtgccg 1740

attcacaaca ataatcgcga cggcgccggc cagatgttca tccacaggaa caagtatcct 1800

tgtaagtacc tcttttgcct cgatcgttgt ggtgccggct tgctgacaga cgcagacact 1860

cccaacaccc tgaacagtgg ttatccgcgg caagccaacc aaaatgccgg acgcggattc 1920

ttcacagcgc ctggccgtac cgtcagcggt gccctcgtcc gtgaggtgtc gccaacattc 1980

aacgaccact ggtcgcagcc ccgtctcttc ttcaactccc tcactcccgt cgaacagcag 2040

ttcctcgtca acgccatgcg cttcgaaatc agccttgtga agtcggaaga agtcaggaag 2100

aacgtgctca cccagctcaa ccgcgtcagc catgatgtgg ccgggcgcgt ggccgccgct 2160

atcggcctcg ccgcgcccga cgcggacgac acatactacc acaacaacaa gacggctggc 2220

gtctcgatcc ttggaagcgg gcccttgcct accatcaaga ctctccgcgt cggcatcctg 2280

gctaccacga gcgagtcgag cgcgctggat caggcagccc agctccgcac ccgtctggaa 2340

aaggacgggc ttgtggtcac ggttgtggct gaaacgctgc gcgagggggt agaccagaca 2400

tactcgacgg cggatgccac gggtttcgac ggcgttgttg ttgtggacgg ggcggcggcg 2460

ctgtttgcca gcaccgcgtc gtcgccgttg ttcccgacgg gcaggccgtt gcagatcttt 2520

gtggacgcgt atcggtgggg aaagccggtc ggtgtgtgtg gtgggaagtc gagcgaggtg 2580

ttggatgcgg cggatgttcc ggaaaatggg gacggggtgt attcggagga gtcggtggac 2640

aagtttgtgg aggagtttga gaaggggttg gctactttca gggtgagtct tggtgccttt 2700

gttttttgag atgttattgt tttgtttcgt ctcggacttt gtgaaagaat gacggactga 2760

cgtctttggt atctagttta ccgatcggtt tgctctcgac tcttaggagg acgaatggac 2820

agaaagtgag accgagagtg actcagagac tgagttggag tcggaatagg aatcggaatt 2880

ggaatcggag tcagggtcgg agtcaggatc agagaatgaa ttttgtatcc aggaagtcga 2940

tggggtgtat cagatttgta atcaccagga ggatgaggat tctgaggata gcacttcgga 3000

agaggaggga gatgaagttg agcctgtcat ttcatgggga tgaggagggg agaaggaata 3060

gggtgggagt tgtacc 3076

<210> 6

<211> 765

<212> PRT

<213> 特异腐质霉(Humicola insolens)

<400> 6

Met Asn Arg Val Thr Asn Leu Leu Ala Trp Ala Gly Ala Ile Gly Leu

1 5 10 15

Ala Gln Ala Thr Cys Pro Phe Ala Asp Pro Ala Ala Leu Tyr Arg Arg

20 25 30

Gln Asp Thr Thr Ser Gly Gln Ser Pro Leu Ala Ala Tyr Glu Val Asp

35 40 45

Asp Ser Thr Gly Tyr Leu Thr Ser Asp Val Gly Gly Pro Ile Gln Asp

50 55 60

Gln Thr Ser Leu Lys Ala Gly Ile Arg Gly Pro Thr Leu Leu Glu Asp

65 70 75 80

Phe Met Phe Arg Gln Lys Ile Gln His Phe Asp His Glu Arg Val Pro

85 90 95

Glu Arg Ala Val His Ala Arg Gly Ala Gly Ala His Gly Thr Phe Thr

100 105 110

Ser Tyr Ala Asp Trp Ser Asn Ile Thr Ala Ala Ser Phe Leu Asn Ala

115 120 125

Thr Gly Lys Gln Thr Pro Val Phe Val Arg Phe Ser Thr Val Ala Gly

130 135 140

Ser Arg Gly Ser Ala Asp Thr Ala Arg Asp Val His Gly Phe Ala Thr

145 150 155 160

Arg Phe Tyr Thr Asp Glu Gly Asn Phe Asp Ile Val Gly Asn Asn Ile

165 170 175

Pro Val Phe Phe Ile Gln Asp Ala Ile Gln Phe Pro Asp Leu Ile His

180 185 190

Ser Val Lys Pro Arg Pro Asp Asn Glu Ile Pro Gln Ala Ala Thr Ala

195 200 205

His Asp Ser Ala Trp Asp Phe Phe Ser Gln Gln Pro Ser Thr Met His

210 215 220

Thr Leu Phe Trp Ala Met Ser Gly His Gly Ile Pro Arg Ser Tyr Arg

225 230 235 240

His Met Asp Gly Phe Gly Val His Thr Phe Arg Phe Val Lys Asp Asp

245 250 255

Gly Ser Ser Lys Leu Ile Lys Trp His Phe Lys Ser Arg Gln Gly Lys

260 265 270

Ala Ser Leu Val Trp Glu Glu Ala Gln Val Leu Ser Gly Lys Asn Ala

275 280 285

Asp Phe His Arg Gln Asp Leu Trp Asp Ala Ile Glu Ser Gly Asn Gly

290 295 300

Pro Glu Trp Asp Val Cys Val Gln Ile Val Asp Glu Ser Gln Ala Gln

305 310 315 320

Ala Phe Gly Phe Asp Leu Leu Asp Pro Thr Lys Ile Ile Pro Glu Glu

325 330 335

Tyr Ala Pro Leu Thr Lys Leu Gly Leu Leu Lys Leu Asp Arg Asn Pro

340 345 350

Thr Asn Tyr Phe Ala Glu Thr Glu Gln Val Met Phe Gln Pro Gly His

355 360 365

Ile Val Arg Gly Ile Asp Phe Thr Glu Asp Pro Leu Leu Gln Gly Arg

370 375 380

Leu Phe Ser Tyr Leu Asp Thr Gln Leu Asn Arg Asn Gly Gly Pro Asn

385 390 395 400

Phe Glu Gln Leu Pro Ile Asn Met Pro Arg Val Pro Ile His Asn Asn

405 410 415

Asn Arg Asp Gly Ala Gly Gln Met Phe Ile His Arg Asn Lys Tyr Pro

420 425 430

Tyr Thr Pro Asn Thr Leu Asn Ser Gly Tyr Pro Arg Gln Ala Asn Gln

435 440 445

Asn Ala Gly Arg Gly Phe Phe Thr Ala Pro Gly Arg Thr Val Ser Gly

450 455 460

Ala Leu Val Arg Glu Val Ser Pro Thr Phe Asn Asp His Trp Ser Gln

465 470 475 480

Pro Arg Leu Phe Phe Asn Ser Leu Thr Pro Val Glu Gln Gln Phe Leu

485 490 495

Val Asn Ala Met Arg Phe Glu Ile Ser Leu Val Lys Ser Glu Glu Val

500 505 510

Arg Lys Asn Val Leu Thr Gln Leu Asn Arg Val Ser His Asp Val Ala

515 520 525

Gly Arg Val Ala Ala Ala Ile Gly Leu Ala Ala Pro Asp Ala Asp Asp

530 535 540

Thr Tyr Tyr His Asn Asn Lys Thr Ala Gly Val Ser Ile Leu Gly Ser

545 550 555 560

Gly Pro Leu Pro Thr Ile Lys Thr Leu Arg Val Gly Ile Leu Ala Thr

565 570 575

Thr Ser Glu Ser Ser Ala Leu Asp Gln Ala Ala Gln Leu Arg Thr Arg

580 585 590

Leu Glu Lys Asp Gly Leu Val Val Thr Val Val Ala Glu Thr Leu Arg

595 600 605

Glu Gly Val Asp Gln Thr Tyr Ser Thr Ala Asp Ala Thr Gly Phe Asp

610 615 620

Gly Val Val Val Val Asp Gly Ala Ala Ala Leu Phe Ala Ser Thr Ala

625 630 635 640

Ser Ser Pro Leu Phe Pro Thr Gly Arg Pro Leu Gln Ile Phe Val Asp

645 650 655

Ala Tyr Arg Trp Gly Lys Pro Val Gly Val Cys Gly Gly Lys Ser Ser

660 665 670

Glu Val Leu Asp Ala Ala Asp Val Pro Glu Asn Gly Asp Gly Val Tyr

675 680 685

Ser Glu Glu Ser Val Asp Lys Phe Val Glu Glu Phe Glu Lys Gly Leu

690 695 700

Ala Thr Phe Arg Glu Ser Glu Leu Glu Ser Glu Ser Gly Ser Glu Ser

705 710 715 720

Gly Ser Glu Asn Glu Phe Cys Ile Gln Glu Val Asp Gly Val Tyr Gln

725 730 735

Ile Cys Asn His Gln Glu Asp Glu Asp Ser Glu Asp Ser Thr Ser Glu

740 745 750

Glu Glu Gly Asp Glu Val Glu Pro Val Ile Ser Trp Gly

755 760 765

<210> 7

<211> 2479

<212> DNA

<213> Penicillium emersonii

<400> 7

atgcgcgcag tgcagcttct gcccagcctc gccggcctga ttggcgctgc ctctgccgtt 60

ggatgtccgt atctgacggg ccagctcgat gccagagacg tgcacaatcc gcacgagttc 120

cagcgtcgac aggatcccgg agatgcggct gcgtccacag agcagttcct gtcccagttc 180

tatctcaatg acagcaacag ctacatgacc actgatgtcg gcggccccat ctcggatcag 240

aacagtttga aggccggaga gcgcggtcca accctgttgg aggacttcat cttccgtcag 300

aagatccagc actttgatca cgagcgggta ggttgtacca tccatgcgag agagatcgat 360

cgatgttgac gtggtggcag gtcccagaac gcgcagtcca tgctcgagga gccggcgccc 420

acggaacgtt cacttcctac ggaaactggt ccaacatcac tgcggcctcc ttcctgagcg 480

ctgaagggaa ggagaccccc gtgtttgtgc gcttctccac cgtggccgga agtcgaggca 540

gtgcggacac ggcgcgcgat gtgcatggct ttgccaccag gttctacact gacgagggca 600

actttggtac gtcgtctcac aatcctctcg actggcatcg tctgaccgct gagcagatat 660

cgtcggcaac aacattccag tcttcttcat ccaggacgcc attctcttcc ctgatctgat 720

ccatgctgtc aagcccagcc ccgacaacga gatcccccag gctgcgactg ctcatgacac 780

ggcctgggac ttcttcagcc agcagcccag tgcgttgcac acgctcttct gggctatgtc 840

cggccatgga atccctcgct cttttcgcca catggacggc tttggcgtcc acactttccg 900

attcgtgact gacgacggcg cctccaagct ggtcaaattc cactggacct cgctgcaggg 960

ccgggccagc ctggtctggg aggaggcgca agcggcagcg ggaaagaacc tggactatat 1020

gcgccaggac ctctatgaca acatcgaagc cggtcgatat cctgaatggg aggtaggtgg 1080

ccgcattttc tcggcatata tatgtccatg ctgacgttcc tagctgggca ttcaaatcgt 1140

cgacgaggag gatcagctca agtttggatt tgatctgctg gatccaacca agatcattcc 1200

tgttgaatat gtccccatca cgccgcttgg gaagctgcag ctcaaccgga atccgctcaa 1260

ctatttcgcc gagacggagc agataatggt atgtaaacag tttgttgttc gattctttgc 1320

agtagactga cgatacatag ttccaacccg gccatattgt gcgcggaatt gactttaccg 1380

aagaccccct tctccaggga cggctcttct cctatctcga cacgcagttg aatcggaatg 1440

gaggccccaa tttcgagcag cttcccatca atcgtcctag ggtgccatgg cataacaaca 1500

accgtgatgg attcagtaag tttacccccc tgcgctgact ctctgcatgc taactccacc 1560

aggccaagcg tttatccccc tgaacaaggc ggcctacagc ccgaacacgc tcaacaatgg 1620

caaccccaag caggcgaacc agactgtggg cgatggattc ttcaccactc ccggacgtac 1680

gaccagtggc cggctcatgc gcaccgtcag ttcgaccttc tccgacgtct ggtcgcagcc 1740

tcggctgttc tacaactcgc tggtgccggc cgagcagcag ttcctcgtca acgccatccg 1800

tttcgagaac tccaacgtca agagcgaagt ggtccggaac aatgtcatca tccagctcaa 1860

ccgcgtcgat aacgacctcg cccgccgggt tgctcgggtc attggcgttg cagaacccga 1920

gcccgatcca acctattatc acaacaacaa gacggccaac gtgggtacgt ttggcacgcc 1980

gctcaagcgg atcgacggtc tcaaagtcgg tgtgcttgcc acagttggcg acccagacag 2040

tatcagtcag ggccagagcc tcagtgacgc gctctcggac tccaaggtcg atgtcactgt 2100

cgttgctgag tctttcacgg acggggtcga tgcgctctac accaactcgg acgcgaccgg 2160

cttcgacgcc gttatcgtgg ctgatggcgc cgaagggctt tttaccccga gtagcttcac 2220

agccaaaccg acgaactcat tctcgacgac aacgctttat ccggccggtc gtccgctgca 2280

gatcctggtc gacgccttcc ggttcggcaa gcccgtcggc gctctgggca gcggagctaa 2340

ggcgcttgat gcggcaggta tctcgactag ccggcctggt gtgtacgtcg ccaactcgac 2400

cagcgaggcg ttcacggacg atatcgagga tggtttgcga acgttcaagt tcctcgaccg 2460

gtttgcgctg gatgagtga 2479

<210> 8

<211> 741

<212> PRT

<213> Penicillium emersonii

<400> 8

Met Arg Ala Val Gln Leu Leu Pro Ser Leu Ala Gly Leu Ile Gly Ala

1 5 10 15

Ala Ser Ala Val Gly Cys Pro Tyr Leu Thr Gly Gln Leu Asp Ala Arg

20 25 30

Asp Val His Asn Pro His Glu Phe Gln Arg Arg Gln Asp Pro Gly Asp

35 40 45

Ala Ala Ala Ser Thr Glu Gln Phe Leu Ser Gln Phe Tyr Leu Asn Asp

50 55 60

Ser Asn Ser Tyr Met Thr Thr Asp Val Gly Gly Pro Ile Ser Asp Gln

65 70 75 80

Asn Ser Leu Lys Ala Gly Glu Arg Gly Pro Thr Leu Leu Glu Asp Phe

85 90 95

Ile Phe Arg Gln Lys Ile Gln His Phe Asp His Glu Arg Val Pro Glu

100 105 110

Arg Ala Val His Ala Arg Gly Ala Gly Ala His Gly Thr Phe Thr Ser

115 120 125

Tyr Gly Asn Trp Ser Asn Ile Thr Ala Ala Ser Phe Leu Ser Ala Glu

130 135 140

Gly Lys Glu Thr Pro Val Phe Val Arg Phe Ser Thr Val Ala Gly Ser

145 150 155 160

Arg Gly Ser Ala Asp Thr Ala Arg Asp Val His Gly Phe Ala Thr Arg

165 170 175

Phe Tyr Thr Asp Glu Gly Asn Phe Asp Ile Val Gly Asn Asn Ile Pro

180 185 190

Val Phe Phe Ile Gln Asp Ala Ile Leu Phe Pro Asp Leu Ile His Ala

195 200 205

Val Lys Pro Ser Pro Asp Asn Glu Ile Pro Gln Ala Ala Thr Ala His

210 215 220

Asp Thr Ala Trp Asp Phe Phe Ser Gln Gln Pro Ser Ala Leu His Thr

225 230 235 240

Leu Phe Trp Ala Met Ser Gly His Gly Ile Pro Arg Ser Phe Arg His

245 250 255

Met Asp Gly Phe Gly Val His Thr Phe Arg Phe Val Thr Asp Asp Gly

260 265 270

Ala Ser Lys Leu Val Lys Phe His Trp Thr Ser Leu Gln Gly Arg Ala

275 280 285

Ser Leu Val Trp Glu Glu Ala Gln Ala Ala Ala Gly Lys Asn Leu Asp

290 295 300

Tyr Met Arg Gln Asp Leu Tyr Asp Asn Ile Glu Ala Gly Arg Tyr Pro

305 310 315 320

Glu Trp Glu Leu Gly Ile Gln Ile Val Asp Glu Glu Asp Gln Leu Lys

325 330 335

Phe Gly Phe Asp Leu Leu Asp Pro Thr Lys Ile Ile Pro Val Glu Tyr

340 345 350

Val Pro Ile Thr Pro Leu Gly Lys Leu Gln Leu Asn Arg Asn Pro Leu

355 360 365

Asn Tyr Phe Ala Glu Thr Glu Gln Ile Met Phe Gln Pro Gly His Ile

370 375 380

Val Arg Gly Ile Asp Phe Thr Glu Asp Pro Leu Leu Gln Gly Arg Leu

385 390 395 400

Phe Ser Tyr Leu Asp Thr Gln Leu Asn Arg Asn Gly Gly Pro Asn Phe

405 410 415

Glu Gln Leu Pro Ile Asn Arg Pro Arg Val Pro Trp His Asn Asn Asn

420 425 430

Arg Asp Gly Phe Ser Gln Ala Phe Ile Pro Leu Asn Lys Ala Ala Tyr

435 440 445

Ser Pro Asn Thr Leu Asn Asn Gly Asn Pro Lys Gln Ala Asn Gln Thr

450 455 460

Val Gly Asp Gly Phe Phe Thr Thr Pro Gly Arg Thr Thr Ser Gly Arg

465 470 475 480

Leu Met Arg Thr Val Ser Ser Thr Phe Ser Asp Val Trp Ser Gln Pro

485 490 495

Arg Leu Phe Tyr Asn Ser Leu Val Pro Ala Glu Gln Gln Phe Leu Val

500 505 510

Asn Ala Ile Arg Phe Glu Asn Ser Asn Val Lys Ser Glu Val Val Arg

515 520 525

Asn Asn Val Ile Ile Gln Leu Asn Arg Val Asp Asn Asp Leu Ala Arg

530 535 540

Arg Val Ala Arg Val Ile Gly Val Ala Glu Pro Glu Pro Asp Pro Thr

545 550 555 560

Tyr Tyr His Asn Asn Lys Thr Ala Asn Val Gly Thr Phe Gly Thr Pro

565 570 575

Leu Lys Arg Ile Asp Gly Leu Lys Val Gly Val Leu Ala Thr Val Gly

580 585 590

Asp Pro Asp Ser Ile Ser Gln Gly Gln Ser Leu Ser Asp Ala Leu Ser

595 600 605

Asp Ser Lys Val Asp Val Thr Val Val Ala Glu Ser Phe Thr Asp Gly

610 615 620

Val Asp Ala Leu Tyr Thr Asn Ser Asp Ala Thr Gly Phe Asp Ala Val

625 630 635 640

Ile Val Ala Asp Gly Ala Glu Gly Leu Phe Thr Pro Ser Ser Phe Thr

645 650 655

Ala Lys Pro Thr Asn Ser Phe Ser Thr Thr Thr Leu Tyr Pro Ala Gly

660 665 670

Arg Pro Leu Gln Ile Leu Val Asp Ala Phe Arg Phe Gly Lys Pro Val

675 680 685

Gly Ala Leu Gly Ser Gly Ala Lys Ala Leu Asp Ala Ala Gly Ile Ser

690 695 700

Thr Ser Arg Pro Gly Val Tyr Val Ala Asn Ser Thr Ser Glu Ala Phe

705 710 715 720

Thr Asp Asp Ile Glu Asp Gly Leu Arg Thr Phe Lys Phe Leu Asp Arg

725 730 735

Phe Ala Leu Asp Glu

740

<210> 9

<211> 860

<212> DNA

<213> Thermus Brockianus

<400> 9

tagaccgcct gcagattgag ttgcccatgc ccaaggagca ggaccccaac gccgccgccg 60

cggtgcaggc ccttctgggc ggtcgcttcg gggagatgtc caccctgatg aactacatgt 120

accagtcctt caacttccgg gggaagaagg cgcttaagcc ctactacgac ctcatcgcca 180

acatcgccac ggaggagctt gggcacattg agctcgtttc cgccaccatc aacagcctcc 240

tggccaaaaa ccccggaaag gacctggagg aaggggtaga ccccgtgagc gcccccttgg 300

gcttctccaa ggacgcccgc aacgccgccc acttcatcgc cgggggggcc aacaccctgg 360

tgatgggggc catgggagag cactggcacg gggagtacgt cttcaccagc ggcaacctca 420

tcctggacct tctccacaac ttcttcctgg aggtggcggc ccgcacccac aagctccggg 480

tctacgagat gacggataac cccgtggccc gggagatgat cggctacctc ctggtgcggg 540

gtggggtcca cgccgccgcc tacggcaagg ccctggaaac ccttaccggg gtggagatga 600

ccaagatgct ccccatcccc cggattgaca acagcaagat ccccgaggcc aagaagtaca 660

tggacctggg cttccaccgc aacctctacc gctttagccc ctccgattac caggacctgg 720

gccttatctg gaatggggct tcccccgagg acgggagcga ggtggtggtg gtggacggcc 780

cccccacggg cggccccgtg tttgacgccg gccacgacgc cgccgagttc gcccccgagt 840

tccaccccgc cgagctctac 860

<210> 10

<211> 286

<212> PRT

<213> Thermus Brockianus

<400> 10

Asp Arg Leu Gln Ile Glu Leu Pro Met Pro Lys Glu Gln Asp Pro Asn

1 5 10 15

Ala Ala Ala Ala Val Gln Ala Leu Leu Gly Gly Arg Phe Gly Glu Met

20 25 30

Ser Thr Leu Met Asn Tyr Met Tyr Gln Ser Phe Asn Phe Arg Gly Lys

35 40 45

Lys Ala Leu Lys Pro Tyr Tyr Asp Leu Ile Ala Asn Ile Ala Thr Glu

50 55 60

Glu Leu Gly His Ile Glu Leu Val Ser Ala Thr Ile Asn Ser Leu Leu

65 70 75 80

Ala Lys Asn Pro Gly Lys Asp Leu Glu Glu Gly Val Asp Pro Val Ser

85 90 95

Ala Pro Leu Gly Phe Ser Lys Asp Ala Arg Asn Ala Ala His Phe Ile

100 105 110

Ala Gly Gly Ala Asn Thr Leu Val Met Gly Ala Met Gly Glu His Trp

115 120 125

His Gly Glu Tyr Val Phe Thr Ser Gly Asn Leu Ile Leu Asp Leu Leu

130 135 140

His Asn Phe Phe Leu Glu Val Ala Ala Arg Thr His Lys Leu Arg Val

145 150 155 160

Tyr Glu Met Thr Asp Asn Pro Val Ala Arg Glu Met Ile Gly Tyr Leu

165 170 175

Leu Val Arg Gly Gly Val His Ala Ala Ala Tyr Gly Lys Ala Leu Glu

180 185 190

Thr Leu Thr Gly Val Glu Met Thr Lys Met Leu Pro Ile Pro Arg Ile

195 200 205

Asp Asn Ser Lys Ile Pro Glu Ala Lys Lys Tyr Met Asp Leu Gly Phe

210 215 220

His Arg Asn Leu Tyr Arg Phe Ser Pro Ser Asp Tyr Gln Asp Leu Gly

225 230 235 240

Leu Ile Trp Asn Gly Ala Ser Pro Glu Asp Gly Ser Glu Val Val Val

245 250 255

Val Asp Gly Pro Pro Thr Gly Gly Pro Val Phe Asp Ala Gly His Asp

260 265 270

Ala Ala Glu Phe Ala Pro Glu Phe His Pro Ala Glu Leu Tyr

275 280 285

<210> 11

<211> 1542

<212> DNA

<213> Saccharomyces pastorianus

<400> 11

atgtcaggac aagaggagaa taaagtaaat tcttctgacg taagaaagga tagagttgtg 60

acgaactcta ctggtaatcc catcaatgag ccatttgtca cccagcgtgt tggggagcac 120

gggcctttgc ttttacaaga ttataaccta ctcgattctt tggcgcattt taacagggag 180

aatattcctc aaagaaatcc tcacgcccac ggttctgggg ccttcggtta ttttgaagtg 240

acagacgata ttacagatgt ttgtgggtct gccatgttta gcaagatcgg taagagaacg 300

aagtgtctga caagattctc cactgtgggt ggtgataaag gtagtgccga tactgttcgt 360

gacccaagag ggtttgcaac taaattctac acagaagaag gtaatttgga ttgggtctac 420

aacaatacac ctgtattttt tatcagggat ccttcgaaat tcccccattt tatccacacg 480

cagaagagaa acccgcaaac taatctaaga gacgctgata tgttttggga tttccttacg 540

actccagaga atcaagtggc catccatcaa gtcatgattc tcttttcaga ccgtggtact 600

cctgcgagct atcgtaacat gcacggatat tctggtcata cttataaatg gtcaagtaaa 660

aacggcgatt ggcgttatgt gcaagtccat attaaaacca atcaaggggt caagaatttg 720

actatagacg aagccactaa aatcgcaggg tccaacccag attactgcca aaaagacttg 780

tttgaatcta tccaaagcgg taactatcca tcgtggactg tttatattca aacaatgact 840

gaacaggagg ccaagaattt accattttcg gtctttgact tgaccaaggt atggcctcaa 900

aagcaattcc cattacgtcg tgtaggcaaa cttgttctga atgaaaatcc actgaatttc 960

ttcgcacaag tggaacaagc agcgtttgcc cctagtacta ctgtcccata ccaagaagcc 1020

agtgctgatc cggtgctaca agctcgatta ttttcttatg cagatgctca cagatacaga 1080

ctgggcccca atttccatca aatacccgtc aactgtccct atgcctccaa gttttttaac 1140

cctgccatca gagatggccc aatgaacgta aatggaaatt ttggttcaga acctacctat 1200

ttagccaacg acaaatcata ctcgtatatt cagcaagaaa gacctattca acaacatcaa 1260

gaagtatgga acggacccgc tatcccttac cactgggcaa catctccagg tgatgtcgat 1320

tatgttcaag ctaggaattt gtaccgcgtc ttagggaagc aacctggaca acaaaagaac 1380

ctagctcaca acatcggtat ccatgtagag ggcgcctgcc ctggaatcca gcaacgggtt 1440

tacgatatgt ttgcccgcgt agataaggga ctatctgatg cgatcaagaa agaagcagag 1500

gcaaaacacg ctgctgaact ttcaaataac tctaagtttt ga 1542

<210> 12

<211> 513

<212> PRT

<213> Saccharomyces pastorianus

<400> 12

Met Ser Gly Gln Glu Glu Asn Lys Val Asn Ser Ser Asp Val Arg Lys

1 5 10 15

Asp Arg Val Val Thr Asn Ser Thr Gly Asn Pro Ile Asn Glu Pro Phe

20 25 30

Val Thr Gln Arg Val Gly Glu His Gly Pro Leu Leu Leu Gln Asp Tyr

35 40 45

Asn Leu Leu Asp Ser Leu Ala His Phe Asn Arg Glu Asn Ile Pro Gln

50 55 60

Arg Asn Pro His Ala His Gly Ser Gly Ala Phe Gly Tyr Phe Glu Val

65 70 75 80

Thr Asp Asp Ile Thr Asp Val Cys Gly Ser Ala Met Phe Ser Lys Ile

85 90 95

Gly Lys Arg Thr Lys Cys Leu Thr Arg Phe Ser Thr Val Gly Gly Asp

100 105 110

Lys Gly Ser Ala Asp Thr Val Arg Asp Pro Arg Gly Phe Ala Thr Lys

115 120 125

Phe Tyr Thr Glu Glu Gly Asn Leu Asp Trp Val Tyr Asn Asn Thr Pro

130 135 140

Val Phe Phe Ile Arg Asp Pro Ser Lys Phe Pro His Phe Ile His Thr

145 150 155 160

Gln Lys Arg Asn Pro Gln Thr Asn Leu Arg Asp Ala Asp Met Phe Trp

165 170 175

Asp Phe Leu Thr Thr Pro Glu Asn Gln Val Ala Ile His Gln Val Met

180 185 190

Ile Leu Phe Ser Asp Arg Gly Thr Pro Ala Ser Tyr Arg Asn Met His

195 200 205

Gly Tyr Ser Gly His Thr Tyr Lys Trp Ser Ser Lys Asn Gly Asp Trp

210 215 220

Arg Tyr Val Gln Val His Ile Lys Thr Asn Gln Gly Val Lys Asn Leu

225 230 235 240

Thr Ile Asp Glu Ala Thr Lys Ile Ala Gly Ser Asn Pro Asp Tyr Cys

245 250 255

Gln Lys Asp Leu Phe Glu Ser Ile Gln Ser Gly Asn Tyr Pro Ser Trp

260 265 270

Thr Val Tyr Ile Gln Thr Met Thr Glu Gln Glu Ala Lys Asn Leu Pro

275 280 285

Phe Ser Val Phe Asp Leu Thr Lys Val Trp Pro Gln Lys Gln Phe Pro

290 295 300

Leu Arg Arg Val Gly Lys Leu Val Leu Asn Glu Asn Pro Leu Asn Phe

305 310 315 320

Phe Ala Gln Val Glu Gln Ala Ala Phe Ala Pro Ser Thr Thr Val Pro

325 330 335

Tyr Gln Glu Ala Ser Ala Asp Pro Val Leu Gln Ala Arg Leu Phe Ser

340 345 350

Tyr Ala Asp Ala His Arg Tyr Arg Leu Gly Pro Asn Phe His Gln Ile

355 360 365

Pro Val Asn Cys Pro Tyr Ala Ser Lys Phe Phe Asn Pro Ala Ile Arg

370 375 380

Asp Gly Pro Met Asn Val Asn Gly Asn Phe Gly Ser Glu Pro Thr Tyr

385 390 395 400

Leu Ala Asn Asp Lys Ser Tyr Ser Tyr Ile Gln Gln Glu Arg Pro Ile

405 410 415

Gln Gln His Gln Glu Val Trp Asn Gly Pro Ala Ile Pro Tyr His Trp

420 425 430

Ala Thr Ser Pro Gly Asp Val Asp Tyr Val Gln Ala Arg Asn Leu Tyr

435 440 445

Arg Val Leu Gly Lys Gln Pro Gly Gln Gln Lys Asn Leu Ala His Asn

450 455 460

Ile Gly Ile His Val Glu Gly Ala Cys Pro Gly Ile Gln Gln Arg Val

465 470 475 480

Tyr Asp Met Phe Ala Arg Val Asp Lys Gly Leu Ser Asp Ala Ile Lys

485 490 495

Lys Glu Ala Glu Ala Lys His Ala Ala Glu Leu Ser Asn Asn Ser Lys

500 505 510

Phe

<210> 13

<211> 1548

<212> DNA

<213> Saccharomyces pastorianus

<400> 13

atgtcgaaat tgggacaaga aaaaaatgaa gtaaattcct ctgatgtaag agaggataga 60

gttgtgacaa actccactgg taatccaatc aatgaaccat ttgtcaccca acgtattgga 120

gaacatggcc ctttgctttt gcaagattat aacttaattg attctttggc tcatttcaac 180

agggaaaata ttcctcaaag gaatccacat gctcatggtt ctggtgcctt cggctatttt 240

gaagtaaccg atgacattac tgatatctgc gggtctgcta tgtttagtaa aattgggaaa 300

agaacgaaat gtctaacaag attttcgact gtgggtggtg ataaaggtag tgccgacacg 360

gttcgtgatc caagggggtt tgccaccaaa ttctacactg aagaaggtaa tttagattgg 420

gtctacaata atacaccggt attctttatc agagaccctt ccaagttccc tcactttatc 480

cacacacaga agagaaaccc acaaaccaac ctaagggatg ctgacatgtt ttgggatttc 540

ctcaccactc ctgaaaatca ggtggccatt catcaagtaa tgatcctttt ttcagaccgt 600

ggtacccctg ccaactaccg tagtatgcat ggttattctg gtcataccta taaatggtcc 660

aataaaaacg gagattggca ttatgtgcaa gttcatatca aaaccgatca aggaataaag 720

aatttgacca tagaagaggc taccaaaatt gcgggatcca atccagatta ctgccagcag 780

gatttatttg aggctattca gaatggaaac tatccttcct ggacagttta tattcaaaca 840

atgaccgaac gcgatgccaa aaaattacca ttttcagtct ttgatttgac taaagtatgg 900

cctcaggggc aattcccttt acggcgtgtg ggtaagattg ttttgaacga gaatccactg 960

aacttcttcg cacaggtgga acaagctgcc ttcgccccca gtaccacggt tccttaccaa 1020

gaagcaagcg ctgatccagt attacaggcc cgtttgtttt catatgcgga tgctcataga 1080

tacaggctag gtcctaactt ccatcaaata cccgtaaact gtccatatgc atctaaattt 1140

ttcaatcccg ctatcagaga tggaccgatg aatgttaacg gcaacttcgg ctcagaacct 1200

acatatttgg ccaatgataa atcgtacacg tatatccaac aggacagacc cattcaacaa 1260

caccaagagg tatggaatgg gccagctatc ccttatcatt gggcaacatc cccaggtgat 1320

gtagatttcg tgcaagcaag aaatctctat cgcgttttgg gtaaacaacc tggacagcaa 1380

aagaacttgg catataacat cggcattcat gtagaaggcg cctgtcctca aatacagcag 1440

cgcgtttatg atatgtttgc tcgtgttgat aagggactat ctgaggcaat taaaaaagta 1500

gctgaggcaa aacatgcttc tgagctttcg agtaactcca aattttga 1548

<210> 14

<211> 515

<212> PRT

<213> Saccharomyces pastorianus

<400> 14

Met Ser Lys Leu Gly Gln Glu Lys Asn Glu Val Asn Ser Ser Asp Val

1 5 10 15

Arg Glu Asp Arg Val Val Thr Asn Ser Thr Gly Asn Pro Ile Asn Glu

20 25 30

Pro Phe Val Thr Gln Arg Ile Gly Glu His Gly Pro Leu Leu Leu Gln

35 40 45

Asp Tyr Asn Leu Ile Asp Ser Leu Ala His Phe Asn Arg Glu Asn Ile

50 55 60

Pro Gln Arg Asn Pro His Ala His Gly Ser Gly Ala Phe Gly Tyr Phe

65 70 75 80

Glu Val Thr Asp Asp Ile Thr Asp Ile Cys Gly Ser Ala Met Phe Ser

85 90 95

Lys Ile Gly Lys Arg Thr Lys Cys Leu Thr Arg Phe Ser Thr Val Gly

100 105 110

Gly Asp Lys Gly Ser Ala Asp Thr Val Arg Asp Pro Arg Gly Phe Ala

115 120 125

Thr Lys Phe Tyr Thr Glu Glu Gly Asn Leu Asp Trp Val Tyr Asn Asn

130 135 140

Thr Pro Val Phe Phe Ile Arg Asp Pro Ser Lys Phe Pro His Phe Ile

145 150 155 160

His Thr Gln Lys Arg Asn Pro Gln Thr Asn Leu Arg Asp Ala Asp Met

165 170 175

Phe Trp Asp Phe Leu Thr Thr Pro Glu Asn Gln Val Ala Ile His Gln

180 185 190

Val Met Ile Leu Phe Ser Asp Arg Gly Thr Pro Ala Asn Tyr Arg Ser

195 200 205

Met His Gly Tyr Ser Gly His Thr Tyr Lys Trp Ser Asn Lys Asn Gly

210 215 220

Asp Trp His Tyr Val Gln Val His Ile Lys Thr Asp Gln Gly Ile Lys

225 230 235 240

Asn Leu Thr Ile Glu Glu Ala Thr Lys Ile Ala Gly Ser Asn Pro Asp

245 250 255

Tyr Cys Gln Gln Asp Leu Phe Glu Ala Ile Gln Asn Gly Asn Tyr Pro

260 265 270

Ser Trp Thr Val Tyr Ile Gln Thr Met Thr Glu Arg Asp Ala Lys Lys

275 280 285

Leu Pro Phe Ser Val Phe Asp Leu Thr Lys Val Trp Pro Gln Gly Gln

290 295 300

Phe Pro Leu Arg Arg Val Gly Lys Ile Val Leu Asn Glu Asn Pro Leu

305 310 315 320

Asn Phe Phe Ala Gln Val Glu Gln Ala Ala Phe Ala Pro Ser Thr Thr

325 330 335

Val Pro Tyr Gln Glu Ala Ser Ala Asp Pro Val Leu Gln Ala Arg Leu

340 345 350

Phe Ser Tyr Ala Asp Ala His Arg Tyr Arg Leu Gly Pro Asn Phe His

355 360 365

Gln Ile Pro Val Asn Cys Pro Tyr Ala Ser Lys Phe Phe Asn Pro Ala

370 375 380

Ile Arg Asp Gly Pro Met Asn Val Asn Gly Asn Phe Gly Ser Glu Pro

385 390 395 400

Thr Tyr Leu Ala Asn Asp Lys Ser Tyr Thr Tyr Ile Gln Gln Asp Arg

405 410 415

Pro Ile Gln Gln His Gln Glu Val Trp Asn Gly Pro Ala Ile Pro Tyr

420 425 430

His Trp Ala Thr Ser Pro Gly Asp Val Asp Phe Val Gln Ala Arg Asn

435 440 445

Leu Tyr Arg Val Leu Gly Lys Gln Pro Gly Gln Gln Lys Asn Leu Ala

450 455 460

Tyr Asn Ile Gly Ile His Val Glu Gly Ala Cys Pro Gln Ile Gln Gln

465 470 475 480

Arg Val Tyr Asp Met Phe Ala Arg Val Asp Lys Gly Leu Ser Glu Ala

485 490 495

Ile Lys Lys Val Ala Glu Ala Lys His Ala Ser Glu Leu Ser Ser Asn

500 505 510

Ser Lys Phe

515

<210> 15

<211> 2403

<212> DNA

<213> 嗜松青霉(Penicillium pinophilum)

<400> 15

atgcgaggat tatactccct cggcgccttc gccagtctca ttgcggcggc ttcggctgca 60

tgcccaatgc tgactggcga aatcccagct ggtagtgttg ccaatcctca tcatcacgga 120

aagcgtgacg attcaaatgc ttcctccgaa acagaagcct ttctgtccga gttctacctc 180

aacgacaacg atgcctatct caccaccgat gtaggcggtc cgatcgagga tcaaaacagt 240

ttgaaggccg gcattcgtgg atcgaccctc ttggaagact tcatcttccg tcagaaaatc 300

cagcattttg atcatgagcg tgtaggttat ccattctatc acgtacttca ggggtagttc 360

tgacatgccc aggtcccgga acgtgccgtg catgctcgag gtgcaggtgc tcatggtgta 420

tttacttcat atgccgactg gtccaacatc actgctgctt catttttggg agcttccgga 480

aaggaaacgc ccacatttgt ccgcttctcg actgttgcag gcagccgagg aagtgccgac 540

accgctcgtg acgttcacgg atttgctact cgcttctata ctgacgaggg aaactatggt 600

agcctttctc tttgactcgt ccatagatag ggatgtaact gacttcaaca gacattgttg 660

gaaacaacat tcctgtcttc ttcatccaag atgctatctt attcccagat ctcatccata 720

gcgttaagcc acagccagcc aatgaaatcc cacaggctgc tactgcacac gacacggcct 780

atgacttctt tggtcaacag ccaagcactc tgcataccct cttctgggca atggcaggcc 840

atggtatccc acggtctttc cgtcatgttg acggattcgg tgtccacacc tatcggttcg 900

tgacagatga tggctcgtcc aagttggtca aatttcactg gacatcgctg caaggtcggg 960

ccagtctggt ctgggaggaa gctcaggcca ctgctggcaa aaatgccgac tttatgagac 1020

aggatctgta tgatagcatt gaggctggcc gttatccaga gtgggaggta tgtaccaccg 1080

aattcatgga aagtactcga ctaacgtgaa cagctcggcg tgcaaataat tgaggagtcg 1140

gatgtcttaa gctacggatt tgacctgttg gatccaacca agattcttcc ggttgaaaaa 1200

gttccaatta ctgcgctcgg aaaaatgcaa ctcaaccgta atccattgaa ttactttgcc 1260

gagacagagc aagtcatggt aagtcgacct tccggcactc gagtcatttc ctactaacgt 1320

ggatagttcc aacctggcca cattgttcgt ggtatcgact tcacctatta tcctcttctc 1380

cagggtcgtt tattctccta cctcgatact cagctgaatc gcaatggtgg tcccaacttt 1440

gaacaaattc caatcaatcg tccgcgtgtt cctatccaca acaacaaccg cgatggattc 1500

gcccaaatgt ttattccttt gaaccaggca gcatattcac ccaacacctt gaataatggc 1560

tctcctcgac aagccaacga gactgtcgga aatggcttct ttaccgcccc cgggcgctcc 1620

gcagatggac accttgttcg cgctacgagc ccaacatttg ccgacgtgtg gtctcagcct 1680

ggcttgtttt acaactcctt gacggctacc gaacaacagt tcgtgatcaa tgctttgcgt 1740

ttcgaattgt ctaatgtaaa gagcgaggat gttaaaagca atttcatcac acagataaat 1800

cgcgtaaaca acacgttagc aacacttgtg gcttctgcaa ttggagtctc cgcgcccgaa 1860

cccgactcta catactacca cagcaataag acgtctaatg tcggaacatt cggtactccg 1920

ttgaaaaagc ttgacggtct caaggtcgga gtccttgctt cggtgaacgg tgaaagtagt 1980

attgccgagg gacaagcatt ggcacaaagc ctagcgggct cgaacgtgga cgtcgttatc 2040

gtcgccgagc atcttacttc gaacgtgtca gctacatact ctggatcaga cgcaacgaac 2100

tttgatgctg ttattgtcag ctcaggggct gaaggtctct ttggacctca aacctttaca 2160

gccgaatcca atacaacact ttatccggca ggccgtccta gccagatttt ggtcgatgcc 2220

ttccgctttg gcaagccggt tggagcagtt ggtggtgcca gtgcagctct gtcagcggtg 2280

gatatcagta ctgatcgtag tggtgtgatt actggtgatt ccgtcagtga cgactttgtc 2340

aagcagctaa cggaggacct tgccacattc aaattcttgg accgattcgc tgtggatgag 2400

tag 2403

<210> 16

<211> 692

<212> PRT

<213> 嗜松青霉

<400> 16

Met Arg Gly Leu Tyr Ser Leu Gly Ala Phe Ala Ser Leu Ile Ala Ala

1 5 10 15

Ala Ser Ala Ala Cys Pro Met Leu Thr Gly Glu Ile Pro Ala Gly Ser

20 25 30

Val Ala Asn Pro His His His Gly Lys Arg Asp Asp Ser Asn Ala Ser

35 40 45

Ser Glu Thr Glu Ala Phe Leu Ser Glu Phe Tyr Leu Asn Asp Asn Asp

50 55 60

Ala Tyr Leu Thr Thr Asp Val Gly Gly Pro Ile Glu Asp Gln Asn Ser

65 70 75 80

Leu Lys Ala Gly Ile Arg Gly Ser Thr Leu Leu Glu Asp Phe Ile Phe

85 90 95

Arg Gln Lys Ile Gln His Phe Asp His Glu Arg Val Pro Glu Arg Ala

100 105 110

Val His Ala Arg Gly Ala Gly Ala His Gly Val Phe Thr Ser Tyr Ala

115 120 125

Asp Trp Ser Asn Ile Thr Ala Ala Ser Phe Leu Gly Ala Ser Gly Lys

130 135 140

Glu Thr Pro Thr Phe Val Arg Phe Ser Thr Val Ala Gly Ser Arg Gly

145 150 155 160

Ser Ala Asp Thr Ala Arg Asp Val His Gly Phe Ala Thr Arg Phe Tyr

165 170 175

Thr Asp Glu Gly Asn Tyr Asp Ile Val Gly Asn Asn Ile Pro Val Phe

180 185 190

Phe Ile Gln Asp Ala Ile Leu Phe Pro Asp Leu Ile His Ser Val Lys

195 200 205

Pro Gln Pro Ala Asn Glu Ile Pro Gln Ala Ala Thr Ala His Asp Thr

210 215 220

Ala Tyr Asp Phe Phe Gly Gln Gln Pro Ser Thr Leu His Thr Leu Phe

225 230 235 240

Trp Ala Met Ala Gly His Gly Ile Pro Arg Ser Phe Arg His Val Asp

245 250 255

Gly Phe Gly Val His Thr Tyr Arg Phe Val Thr Asp Asp Gly Ser Ser

260 265 270

Lys Leu Val Lys Phe His Trp Thr Ser Leu Gln Gly Arg Ala Ser Leu

275 280 285

Val Trp Glu Glu Ala Gln Ala Thr Ala Gly Lys Asn Ala Asp Phe Met

290 295 300

Arg Gln Asp Leu Tyr Asp Ser Ile Glu Ala Gly Arg Tyr Pro Glu Trp

305 310 315 320

Glu Leu Gly Val Gln Ile Ile Glu Glu Ser Asp Val Leu Ser Tyr Gly

325 330 335

Phe Asp Leu Leu Asp Pro Thr Lys Ile Leu Pro Val Glu Lys Val Pro

340 345 350

Ile Thr Ala Leu Gly Lys Met Gln Leu Asn Arg Asn Pro Leu Asn Tyr

355 360 365

Phe Ala Glu Thr Glu Gln Val Met Phe Gln Pro Gly His Ile Val Arg

370 375 380

Gly Ile Asp Phe Thr Tyr Tyr Pro Leu Leu Gln Gly Arg Leu Phe Ser

385 390 395 400

Tyr Leu Asp Thr Gln Leu Asn Arg Asn Gly Gly Pro Asn Phe Glu Gln

405 410 415

Ile Pro Ile Asn Arg Pro Arg Val Pro Ile His Asn Asn Asn Arg Asp

420 425 430

Gly Phe Ala Gln Met Phe Ile Pro Leu Asn Gln Ala Ala Tyr Ser Pro

435 440 445

Asn Thr Leu Asn Asn Gly Ser Pro Arg Gln Ala Asn Glu Thr Val Gly

450 455 460

Asn Gly Phe Phe Thr Ala Pro Gly Arg Ser Ala Asp Gly His Leu Val

465 470 475 480

Arg Ala Thr Ser Pro Thr Phe Ala Asp Val Trp Ser Gln Pro Gly Leu

485 490 495

Phe Tyr Asn Ser Leu Thr Ala Thr Glu Gln Gln Phe Val Ile Asn Ala

500 505 510

Leu Arg Phe Glu Leu Ser Asn Val Lys Ser Glu Asp Val Lys Ser Asn

515 520 525

Phe Ile Thr Gln Ile Asn Arg Val Asn Asn Thr Leu Ala Thr Leu Val

530 535 540

Ala Ser Ala Ile Gly Val Ser Ala Pro Glu Pro Asp Ser Thr Tyr Tyr

545 550 555 560

His Ser Asn Lys Thr Ser Asn Val Gly Thr Phe Gly Thr Pro Leu Lys

565 570 575

Lys Leu Asp Gly Leu Lys Val Gly Val Leu Ala Ser Val Asn Gly Glu

580 585 590

Ser Ser Ile Ala Glu Gly Gln Ala Leu Ala Gln Ser Leu Ala Gly Ser

595 600 605

Asn Val Asp Val Val Ile Val Ala Glu His Leu Thr Ser Asn Val Ser

610 615 620

Ala Thr Tyr Ser Gly Ser Asp Ala Thr Asn Phe Asp Ala Val Ile Val

625 630 635 640

Ser Ser Gly Ala Glu Gly Leu Phe Gly Pro Gln Thr Phe Thr Ala Glu

645 650 655

Ser Asn Thr Thr Leu Tyr Pro Ala Gly Arg Pro Ser Gln Ile Leu Val

660 665 670

Asp Ala Phe Arg Phe Gly Lys Pro Val Gly Ala Val Gly Gly Ala Ser

675 680 685

Ala Ala Leu Ser

690

<210> 17

<211> 2749

<212> DNA

<213> 灰腐质霉(Humicola grisea)

<400> 17

atgaacagag tcacgaatct cctcgcctgg gccggcgcga tagggctcgc ccaagcaaca 60

tgccccttcg cggaccctgc cgctctgtat aggcgtcagg atactaccag cggccagtcg 120

ccacttgcag catacgaggt ggatgacagc accggatacc tgacctccga tgttggcggg 180

cccattcagg accagaccag cctcaaggca ggcatccggg gtccgaccct tcttgaggac 240

tttatgttcc gccagaagat ccagcacttc gaccatgaac gggtaaggac ataatgctca 300

cacgagcggc tgcgtaccta tttattttga acgggtaagg acataatgct cacacgagcg 360

gctgcgtacc tatttatttc cgagagatgg gctggctggc tggctgtgat gcctgagttt 420

ggggacatac ggagtacctt actgacgcgc taatccactc caggttcccg aaagggcggt 480

ccatgctcga ggcgctggag cacacgggac cttcacgagt tacgccgact ggagtaacat 540

caccgcggcg tcctttctga acgccacagg aaagcagacg ccggtgtttg tccggttctc 600

gaccgttgct gggtctcgag ggagcgcaga cacggcgaga gacgttcatg gtttcgcgac 660

gcggttgtaa gttttgttgt gtttcattcg ttccggtctg tagaggaggg ttaggatatg 720

agctaacgtg tgtgtgtgtg tgtgaagtta cactgatgaa ggcaactttg gtacgtccca 780

cgcatggtcc tcaattctct tatctggcag cgatgtggtc attgtcgacg ttgctaactt 840

gcgtagatat cgtcggaaac aacatcccgg tattcttcat tcaagatgca atccagttcc 900

ctgaccttat ccactcggtc aagccgagtc cagacaacga gattccccaa gcggcgacgg 960

ctcatgattc agcttgggac ttcttcagcc agcagccaag cgccatggta agcaatggac 1020

caaggagccg cacctggggt gacataccag ggagtacacg gggcgttccg atgaccctcg 1080

tgtgaccaag gcagtacaac actccacgga ggactcgaag agattcggaa atatggaaca 1140

cagaactgac aggatggtag cacacgttgt tctgggccat gtctggccac ggaatccctc 1200

gcagctatcg ccatatggta cgtttgcctg gctgagatga ccgtgaatcc atttctaacc 1260

tcaagtccag gatggcttcg gcgtccacac gttccggttt gtcaaagatg acggctcgtc 1320

caagttgatc aagtggcatt tcaagtcacg ccagggaaag gcgagtctag tctgggaaga 1380

ggcgcaggtt ctttctggca agaatgccga cttccaccgt caggacctct gggatgctat 1440

tgagtccggg aacggaccag aatgggatgt ctgcgtccag attgtcgatg agtcccaggc 1500

gcaagccttt ggcttcgact tgctggaccc gacaaagatc atccccgagg agtacgcccc 1560

cttgacgaaa ctggggctct tgaagctgga tcgcaatccg accaactact tcgccgagac 1620

ggagcaggtc atgttccaac ccggtcatat agtccgcggc gtcgacttca cggaggatcc 1680

cctgctacag ggacgtctct tctcgtacct tgacacgcag ctgaaccgga atggcgggcc 1740

caactttgag cagctgccca tcaacatgcc gcgggtgccg attcacaaca ataatcgcga 1800

cggcgccggc cagatgttca tccacaggaa caagtatcct tgtaagtacc tcttttgcct 1860

cgatcgttgt ggtgccggct tgctgacaga cgcagacact cccaacaccc tgaacagtgg 1920

ttatccgcgg caagccaacc aaaatgccgg acgcggattc ttcacagcgc ctggccgtac 1980

cgtcagcggt gccctcgtcc gtgaggtgtc gccaacattc aacgaccact ggtcgcagcc 2040

ccgtctcttc ttcaactccc tcactcccgt cgaacagcag ttcctcgtca acgccatgcg 2100

cttcgaaatc agccttgtga agtcggaaga atgcaggaag aacgtgctca cccagctcaa 2160

ccgcgtcagc catgatgtgg ccgtgcgcgt ggccgccgct atcggcctcg ccgcgcccga 2220

cgcggacgac acatactacc acaacaacaa gacggctggc gtctcgatcc ttggaagcgg 2280

gcccttgcct accatcaaga ctctccgcgt cggcatcctg gctaccacga gcgagtcgag 2340

cgcgctggat caggcagccc agctccgcac ccgtctggaa aaggacgggc ttgtggtcac 2400

ggttgtggct gaaacgctgc gcgagggggt agaccagaca tactcgacgg cggatgccac 2460

gggtttcgac ggcgttgttg ttgtggacgg ggcggcggcg ctgtttgcca gcaccgcgtc 2520

gtcgccgttg ttcccgacgg gcaggccgtt gcagatcttt gtggacgcgt atcggtgggg 2580

aaagccggtc ggtgtgtgtg gtgggaagtc gagcgaggtg ttggatgcgg cggatgttcc 2640

ggaaaatggg gacggggtgt attcggagga gtcggtggac aagtttgtgg aggagtttga 2700

gaaggggttg gctactttca gggtgagtct tggtgccttt gttttttga 2749

<210> 18

<211> 684

<212> PRT

<213> 灰腐质霉

<400> 18

Met Asn Arg Val Thr Asn Leu Leu Ala Trp Ala Gly Ala Ile Gly Leu

1 5 10 15

Ala Gln Ala Thr Cys Pro Phe Ala Asp Pro Ala Ala Leu Tyr Arg Arg

20 25 30

Gln Asp Thr Thr Ser Gly Gln Ser Pro Leu Ala Ala Tyr Glu Val Asp

35 40 45

Asp Ser Thr Gly Tyr Leu Thr Ser Asp Val Gly Gly Pro Ile Gln Asp

50 55 60

Gln Thr Ser Leu Lys Ala Gly Ile Arg Gly Pro Thr Leu Leu Glu Asp

65 70 75 80

Phe Met Phe Arg Gln Lys Ile Gln His Phe Asp His Glu Arg Val Pro

85 90 95

Glu Arg Ala Val His Ala Arg Gly Ala Gly Ala His Gly Thr Phe Thr

100 105 110

Ser Tyr Ala Asp Trp Ser Asn Ile Thr Ala Ala Ser Phe Leu Asn Ala

115 120 125

Thr Gly Lys Gln Thr Pro Val Phe Val Arg Phe Ser Thr Val Ala Gly

130 135 140

Ser Arg Gly Ser Ala Asp Thr Ala Arg Asp Val His Gly Phe Ala Thr

145 150 155 160

Arg Phe Tyr Thr Asp Glu Gly Asn Phe Asp Ile Val Gly Asn Asn Ile

165 170 175

Pro Val Phe Phe Ile Gln Asp Ala Ile Gln Phe Pro Asp Leu Ile His

180 185 190

Ser Val Lys Pro Ser Pro Asp Asn Glu Ile Pro Gln Ala Ala Thr Ala

195 200 205

His Asp Ser Ala Trp Asp Phe Phe Ser Gln Gln Pro Ser Ala Met His

210 215 220

Thr Leu Phe Trp Ala Met Ser Gly His Gly Ile Pro Arg Ser Tyr Arg

225 230 235 240

His Met Asp Gly Phe Gly Val His Thr Phe Arg Phe Val Lys Asp Asp

245 250 255

Gly Ser Ser Lys Leu Ile Lys Trp His Phe Lys Ser Arg Gln Gly Lys

260 265 270

Ala Ser Leu Val Trp Glu Glu Ala Gln Val Leu Ser Gly Lys Asn Ala

275 280 285

Asp Phe His Arg Gln Asp Leu Trp Asp Ala Ile Glu Ser Gly Asn Gly

290 295 300

Pro Glu Trp Asp Val Cys Val Gln Ile Val Asp Glu Ser Gln Ala Gln

305 310 315 320

Ala Phe Gly Phe Asp Leu Leu Asp Pro Thr Lys Ile Ile Pro Glu Glu

325 330 335

Tyr Ala Pro Leu Thr Lys Leu Gly Leu Leu Lys Leu Asp Arg Asn Pro

340 345 350

Thr Asn Tyr Phe Ala Glu Thr Glu Gln Val Met Phe Gln Pro Gly His

355 360 365

Ile Val Arg Gly Val Asp Phe Thr Glu Asp Pro Leu Leu Gln Gly Arg

370 375 380

Leu Phe Ser Tyr Leu Asp Thr Gln Leu Asn Arg Asn Gly Gly Pro Asn

385 390 395 400

Phe Glu Gln Leu Pro Ile Asn Met Pro Arg Val Pro Ile His Asn Asn

405 410 415

Asn Arg Asp Gly Ala Gly Gln Met Phe Ile His Arg Asn Lys Tyr Pro

420 425 430

Tyr Thr Pro Asn Thr Leu Asn Ser Gly Tyr Pro Arg Gln Ala Asn Gln

435 440 445

Asn Ala Gly Arg Gly Phe Phe Thr Ala Pro Gly Arg Thr Val Ser Gly

450 455 460

Ala Leu Val Arg Glu Val Ser Pro Thr Phe Asn Asp His Trp Ser Gln

465 470 475 480

Pro Arg Leu Phe Phe Asn Ser Leu Thr Pro Val Glu Gln Gln Phe Leu

485 490 495

Val Asn Ala Met Arg Phe Glu Ile Ser Leu Val Lys Ser Glu Glu Cys

500 505 510

Arg Lys Asn Val Leu Thr Gln Leu Asn Arg Val Ser His Asp Val Ala

515 520 525

Val Arg Val Ala Ala Ala Ile Gly Leu Ala Ala Pro Asp Ala Asp Asp

530 535 540

Thr Tyr Tyr His Asn Asn Lys Thr Ala Gly Val Ser Ile Leu Gly Ser

545 550 555 560

Gly Pro Leu Pro Thr Ile Lys Thr Leu Arg Val Gly Ile Leu Ala Thr

565 570 575

Thr Ser Glu Ser Ser Ala Leu Asp Gln Ala Ala Gln Leu Arg Thr Arg

580 585 590

Leu Glu Lys Asp Gly Leu Val Val Thr Val Val Ala Glu Thr Leu Arg

595 600 605

Glu Gly Val Asp Gln Thr Tyr Ser Thr Ala Asp Ala Thr Gly Phe Asp

610 615 620

Gly Val Val Val Val Asp Gly Ala Ala Ala Leu Phe Ala Ser Thr Ala

625 630 635 640

Ser Ser Pro Leu Phe Pro Thr Gly Arg Pro Leu Gln Ile Phe Val Asp

645 650 655

Ala Tyr Arg Trp Gly Lys Pro Val Gly Val Cys Gly Gly Lys Ser Ser

660 665 670

Glu Val Leu Asp Ala Ala Asp Val Pro Glu Asn Gly

675 680

<210> 19

<211> 2362

<212> DNA

<213> 土生梭孢壳(Thielavia terrestris)

<400> 19

cgcaagatcg aagcggtcca gattcatgac cttgtcccac gcggccacga agtccttgac 60

gaacttttcc tgaccccctg cgctggcata cacctcggcg atggcgcgca gctcggcatg 120

cgagccaaac acgagatcgg cccgcgtggc cgtccacttc ttggcgcccg tcgcacggtc 180

ggtgccctcg aacagctcgc cgtcgaccga cttccacgcc gtgcgcatgt ccaggaggtt 240

cacgaagaag tcgttggtca gcttgccggg ccgggtggtg aagacgccgt gcgaggagcc 300

gtcgtagttg gcgcccagga cgcgcagccc gcccacgagc accgtcagct ccggcggcgt 360

cagcgtcagc agctgcgccc ggtcgacgag gaggtgctcc gtcggcacgc gcgccgtgcc 420

gcggccgtag ttgcggaagc cgtcggcata cggctcgagg tgcgcgaacg acgccacgtc 480

ggtctgctcc tgcgacgcgt cggtgcggcc gggccggaag ggcaccggca cgccggccgc 540

ctgctcgagc gccgccacgc cgcccagcac gatcaggtcc gccagcgaca ccttcttgcc 600

gcccgccgcc gacgcgttga acttggcctg cacgccctcg agcgcctgca gcacctcggc 660

cagctgcggc gggttgttga ccttccagtc cttctgcggc gccagccgga tgcgcgcgcc 720

gttggcgccg ccgcgcttgt cgctgccgcg gaacgtcgac gccgacgccc acgccaccga 780

gatgagcttg gccggggcca cgcccgtggc caggatgtcg cgcttcagcg cggcgatgtc 840

gctgtcgtcg acgagcgggt ggtcgaccgg cggcacgtag tcctcccaga ggagcacctc 900

ggacgggatc tccgggccga gccagcgcga acgcgggccc atgtcgcggt gcagcagctt 960

gaaccaggcg cgcgcgaacg cgtcggcgaa ctggtctggg tgctcgaggt agtggcgcgc 1020

gatcttctcg tacaccgggt cgaagcgcag cgccaggtcc gtcgtgagca tgcgcggccg 1080

gtgcttcttg ctcgggtcgt acgcgtccgg aatgaaagcg tcggcgttct tggccaccca 1140

ctggttggcg ccggcggggc tcttggtgag ctcccactcg aacttgaaga ggtactccaa 1200

gaagttggtg ctccaccggg tcggcgtctt ggtccagatg acctcgagcc cactggtgat 1260

ggtatcaggg cccttgccgg agccgtgctt gttggcccag ccgagaccct gctgctccag 1320

gccggccccc tcgggctcct tgccgacgtt gtccgagggg gccgcgccgt gcgtcttgcc 1380

gaacgtgtgg ccgccggcga tcagggccac cgtctcctcg tcgttcatgg ccatgcggct 1440

gaaggtcgtg cggatgtccc gcgcggccgc cacggggtcg gggatgccgt ccggaccctc 1500

ggggttgacg tagatcaggc ccatgtgggc ggccgccaag ggcgactcga gatcgcgcga 1560

gtggatgtcc ttgttgacct tcttggactc gtcgccgccc gtgacgccgt cgccggcgat 1620

gcccgcctgg ccgtccgagt agcggacatc gttgccgagc cacgtcgtct cgccgcccca 1680

gtaggtcgac tcgtcagcct cccacgtgtc cggacggccg ccggcaaagc cgaacgtctt 1740

gaggcccatg gactcgaggg cgacgttgcc agtcagcagc agcaggtcgg cccacgagat 1800

cttgtcgccg tacttctgct tgatgggcca cagcaggcgg cgggccttgt cgagactgac 1860

gttgtcgggc cagctgttga gtggcgcaaa ccgctgctgg ccctggccgc cgccgccgcg 1920

gccgtcgaag acgcggtagg tgccggcgct gtgccaggcc atgcggatga acagaccgcc 1980

gtagtggccg aagtcggccg gccaccagtc ctgcgagtcg gtcatgagcg cccgcaggtc 2040

ctgcttcagc gcgtcatagt caagcgactt gaaggcggcc ctatagtcga agtccttgta 2100

cgggctcgac gccggctggt gctggcggag gatgtggagc ggcagccggt tcggccacca 2160

gtcggtgttt cgagtaccgc cgccggcggc gttggcgaac ctgttcgggc actcacccat 2220

cttctcgctt gttcaatctt ccgtcgctgt ggctgctggg tgcttgtgcg tgtgtgtgtg 2280

tgtgtgtgtg agtcggagtg tgtatgtgtc tgtttgtttg tgtgggttgc cagaacgtaa 2340

gctgcgaaac aaaccgccac tg 2362

<210> 20

<211> 740

<212> PRT

<213> 土生梭孢壳

<400> 20

Met Arg Ala Lys His Glu Ile Gly Pro Arg Gly Arg Pro Leu Leu Gly

1 5 10 15

Ala Arg Arg Thr Val Gly Ala Leu Glu Gln Leu Ala Val Asp Arg Leu

20 25 30

Pro Arg Arg Ala His Val Gln Glu Val His Glu Glu Val Val Gly Gln

35 40 45

Leu Ala Gly Pro Gly Gly Glu Asp Ala Val Arg Gly Ala Val Val Val

50 55 60

Gly Ala Gln Asp Ala Gln Pro Ala His Glu His Arg Gln Leu Arg Arg

65 70 75 80

Arg Gln Arg Gln Gln Leu Arg Pro Val Asp Glu Glu Val Leu Arg Arg

85 90 95

His Ala Arg Arg Ala Ala Ala Val Val Ala Glu Ala Val Gly Ile Arg

100 105 110

Leu Glu Val Arg Glu Arg Arg His Val Gly Leu Leu Leu Arg Arg Val

115 120 125

Gly Ala Ala Gly Pro Glu Gly His Arg His Ala Gly Arg Leu Leu Glu

130 135 140

Arg Arg His Ala Ala Gln His Asp Gln Val Arg Gln Arg His Leu Leu

145 150 155 160

Ala Ala Arg Arg Arg Arg Val Glu Leu Gly Leu His Ala Leu Glu Arg

165 170 175

Leu Gln His Leu Gly Gln Leu Arg Arg Val Val Asp Leu Pro Val Leu

180 185 190

Leu Arg Arg Gln Pro Asp Ala Arg Ala Val Gly Ala Ala Ala Leu Val

195 200 205

Ala Ala Ala Glu Arg Arg Arg Arg Arg Pro Arg His Arg Asp Glu Leu

210 215 220

Gly Arg Gly His Ala Arg Gly Gln Asp Val Ala Leu Gln Arg Gly Asp

225 230 235 240

Val Ala Val Val Asp Glu Arg Val Val Asp Arg Arg His Val Val Leu

245 250 255

Pro Glu Glu His Leu Gly Arg Asp Leu Arg Ala Glu Pro Ala Arg Thr

260 265 270

Arg Ala His Val Ala Val Gln Gln Leu Glu Pro Gly Ala Arg Glu Arg

275 280 285

Val Gly Glu Leu Val Trp Val Leu Glu Val Val Ala Arg Asp Leu Leu

290 295 300

Val His Arg Val Glu Ala Gln Arg Gln Val Arg Arg Glu His Ala Arg

305 310 315 320

Pro Val Leu Leu Ala Arg Val Val Arg Val Arg Asn Glu Ser Val Gly

325 330 335

Val Leu Gly His Pro Leu Val Gly Ala Gly Gly Ala Leu Gly Glu Leu

340 345 350

Pro Leu Glu Leu Glu Glu Val Leu Gln Glu Val Gly Ala Pro Pro Gly

355 360 365

Arg Arg Leu Gly Pro Asp Asp Leu Glu Pro Thr Gly Asp Gly Ile Arg

370 375 380

Ala Leu Ala Gly Ala Val Leu Val Gly Pro Ala Glu Thr Leu Leu Leu

385 390 395 400

Gln Ala Gly Pro Leu Gly Leu Leu Ala Asp Val Val Arg Gly Gly Arg

405 410 415

Ala Val Arg Leu Ala Glu Arg Val Ala Ala Gly Asp Gln Gly His Arg

420 425 430

Leu Leu Val Val His Gly His Ala Ala Glu Gly Arg Ala Asp Val Pro

435 440 445

Arg Gly Arg His Gly Val Gly Asp Ala Val Arg Thr Leu Gly Val Asp

450 455 460

Val Asp Gln Ala His Val Gly Gly Arg Gln Gly Arg Leu Glu Ile Ala

465 470 475 480

Arg Val Asp Val Leu Val Asp Leu Leu Gly Leu Val Ala Ala Arg Asp

485 490 495

Ala Val Ala Gly Asp Ala Arg Leu Ala Val Arg Val Ala Asp Ile Val

500 505 510

Ala Glu Pro Arg Arg Leu Ala Ala Pro Val Gly Arg Leu Val Ser Leu

515 520 525

Pro Arg Val Arg Thr Ala Ala Gly Lys Ala Glu Arg Leu Glu Ala His

530 535 540

Gly Leu Glu Gly Asp Val Ala Ser Gln Gln Gln Gln Val Gly Pro Arg

545 550 555 560

Asp Leu Val Ala Val Leu Leu Leu Asp Gly Pro Gln Gln Ala Ala Gly

565 570 575

Leu Val Glu Thr Asp Val Val Gly Pro Ala Val Glu Trp Arg Lys Pro

580 585 590

Leu Leu Ala Leu Ala Ala Ala Ala Ala Ala Val Glu Asp Ala Val Gly

595 600 605

Ala Gly Ala Val Pro Gly His Ala Asp Glu Gln Thr Ala Val Val Ala

610 615 620

Glu Val Gly Arg Pro Pro Val Leu Arg Val Gly His Glu Arg Pro Gln

625 630 635 640

Val Leu Leu Gln Arg Val Ile Val Lys Arg Leu Glu Gly Gly Pro Ile

645 650 655

Val Glu Val Leu Val Arg Ala Arg Arg Arg Leu Val Leu Ala Glu Asp

660 665 670

Val Glu Arg Gln Pro Val Arg Pro Pro Val Gly Val Ser Ser Thr Ala

675 680 685

Ala Gly Gly Val Gly Glu Pro Val Arg Ala Leu Thr His Leu Leu Ala

690 695 700

Cys Ser Ile Phe Arg Arg Cys Gly Cys Trp Val Leu Val Arg Val Cys

705 710 715 720

Val Cys Val Cys Glu Ser Glu Cys Val Cys Val Cys Leu Phe Val Trp

725 730 735

Val Ala Arg Thr

740

<210> 21

<211> 1449

<212> DNA

<213> 热葡糖苷酶芽孢杆菌(Bacillus thermoglucosidasius)

<400> 21

atgagttcaa ataaactgac aactagctgg ggagcacctg ttggcgataa ccaaaactcg 60

ataacggccg gcaatcctgg cccgacatta atccaagacg tacatcttat cgaaaaatta 120

gcacacttca atagagaacg tgtcccagaa cgtgttgtcc atgcgaaagg cgctggtgcg 180

cacggctatt tcgaagtaac aaacgatatg tcgaaataca caaaagcgaa agtgtttaac 240

ggtgttggca aacgcacgcc tgtattcgtc cgcttctcta ctgtcgccgg tgaattggga 300

tctgcggata cagtccgcga cccgcgcggt tttgccgtca aattttatac cgaagaagga 360

aactatgaca tcgttggcaa caacacaccg attttcttca ttcgtgatgc gattaaattc 420

tcggatttta tccatacaca aaaacgcgac ccgcgcaccc atttgattta tccgacagca 480

atgtgggatt tcttgtcttt atctccggaa tctttgcacc aagtcactta tttattcggg 540

gatcgcggca tcccattgac ataccgccat atgaacggat acggaagcca tacattcaaa 600

tgggtgaatg aaaaaggcga agcggtatgg gtaaaatacc actttaaaac aaaccaaggc 660

gtgaaaaaca tggatccgga actagcggtt aaaatcgccg gagaaaatcc ggattaccat 720

acggaagatt tatataacgc catcgaaaaa ggcgactatc catcttggac attatatgtg 780

caaattatgc cgttagaaga cgcaaaaaca taccgtttca atccatttga tgtcacaaaa 840

gtttggtcac ataaagatta tccgttaatt gaagtcggcc gtatggtatt aaaccgcaat 900

ccagaaaatt attttgccga agtcgaacaa gcgacattct ctcctggaaa ccttgttcct 960

ggcgttgaac catcgccgga taaaatcttg caagcccgtt tgttcgctta tgcggatgcg 1020

caccgttacc gcgtcggcgt gaaccataac ttgcttccga tcaaccgccc gcgcgtggaa 1080

gtaaacaatt atcaacgtga cggcttcatg cgctttgaca ataatggcgg cggttcggtc 1140

aactacgaac caaacagctt cggcggaccg acagaagtgc cagaacataa aacgacccca 1200

ttcccggtat ccggcgtggc agaaagcgtg ccatatgacg acgatgatca ttatacgcaa 1260

gcaggcgact tataccgtct catgagcgaa gaagaaaaag cgcgccttgt gaaaaacatt 1320

gtcgaatcat tgaaacaagt aacaaaagaa gaaattaaac ttcgccaaat ccgccacttc 1380

tacaaagcag accctgacta cggccgccgc gttgccgaag gtcttggatt gccgattaaa 1440

aaagattct 1449

<210> 22

<211> 483

<212> PRT

<213> 热葡糖苷酶芽孢杆菌

<400> 22

Met Ser Ser Asn Lys Leu Thr Thr Ser Trp Gly Ala Pro Val Gly Asp

1 5 10 15

Asn Gln Asn Ser Ile Thr Ala Gly Asn Pro Gly Pro Thr Leu Ile Gln

20 25 30

Asp Val His Leu Ile Glu Lys Leu Ala His Phe Asn Arg Glu Arg Val

35 40 45

Pro Glu Arg Val Val His Ala Lys Gly Ala Gly Ala His Gly Tyr Phe

50 55 60

Glu Val Thr Asn Asp Met Ser Lys Tyr Thr Lys Ala Lys Val Phe Asn

65 70 75 80

Gly Val Gly Lys Arg Thr Pro Val Phe Val Arg Phe Ser Thr Val Ala

85 90 95

Gly Glu Leu Gly Ser Ala Asp Thr Val Arg Asp Pro Arg Gly Phe Ala

100 105 110

Val Lys Phe Tyr Thr Glu Glu Gly Lys Tyr Asp Ile Val Gly Asn Asn

115 120 125

Thr Pro Ile Phe Phe Ile Arg Asp Ala Ile Lys Phe Ser Asp Phe Ile

130 135 140

His Thr Gln Lys Arg Asp Pro Arg Thr His Leu Ile Tyr Pro Thr Ala

145 150 155 160

Met Trp Asp Phe Leu Ser Leu Ser Pro Glu Ser Leu His Gln Val Thr

165 170 175

Tyr Leu Phe Gly Asp Arg Gly Ile Pro Leu Thr Tyr Arg His Met Asn

180 185 190

Gly Tyr Gly Ser His Thr Phe Lys Trp Val Asn Glu Lys Gly Glu Ala

195 200 205

Val Trp Val Lys Tyr His Phe Lys Thr Asn Gln Gly Val Lys Asn Met

210 215 220

Asp Pro Glu Leu Ala Val Lys Ile Ala Gly Glu Asn Pro Asp Tyr His

225 230 235 240

Thr Glu Asp Leu Tyr Asn Ala Ile Glu Lys Gly Asp Tyr Pro Ser Trp

245 250 255

Thr Leu Tyr Val Gln Ile Met Pro Leu Glu Asp Ala Lys Thr Tyr Arg

260 265 270

Phe Asn Pro Glu Asp Val Thr Lys Val Trp Ser His Lys Asp Tyr Pro

275 280 285

Leu Ile Glu Val Gly Arg Met Val Leu Asn Arg Asn Pro Glu Asn Tyr

290 295 300

Phe Ala Glu Val Glu Gln Ala Thr Phe Ser Pro Gly Asn Leu Val Pro

305 310 315 320

Gly Val Glu Pro Ser Pro Asp Lys Ile Leu Gln Ala Arg Leu Phe Ala

325 330 335

Tyr Ala Asp Ala His Arg Tyr Arg Val Gly Val Asn His Asn Leu Leu

340 345 350

Pro Ile Asn Arg Pro Arg Val Glu Val Asn Asn Tyr Gln Arg Asp Gly

355 360 365

Phe Met Arg Phe Asp Asn Asn Gly Gly Gly Ser Val Asn Tyr Glu Pro

370 375 380

Asn Ser Phe Gly Gly Pro Thr Glu Val Pro Glu His Lys Thr Thr Pro

385 390 395 400

Phe Pro Val Ser Gly Val Ala Glu Ser Val Pro Tyr Asp Asp Asp Asp

405 410 415

His Tyr Thr Gln Ala Gly Asp Leu Tyr Arg Leu Met Ser Glu Glu Glu

420 425 430

Lys Ala Arg Leu Val Lys Asn Ile Val Glu Ser Leu Lys Gln Val Thr

435 440 445

Lys Glu Glu Ile Lys Leu Arg Gln Ile Arg His Phe Tyr Lys Ala Asp

450 455 460

Pro Asp Tyr Gly Arg Arg Val Ala Glu Gly Leu Gly Leu Pro Ile Lys

465 470 475 480

Lys Asp Ser

<210> 23

<211> 3210

<212> DNA

<213> 米曲霉(Aspergillus oryzae)

<400> 23

ccccccagaa gggtccaaag gcccagtccc ttccccttcg gtcttaacaa aagacggacc 60

tttacgacgg aatttcgaag taaggggcca gggcattcgt tccctggaaa gaagagcgag 120

cttctggtgg agactctcga taagcccgat aagaaaagca ctcgactctc cttcccgatg 180

acgaagttca taaacaagga acataatcag taagaagata ttctgaccaa taccaatgga 240

ttcgaataat cattactcat catcttgtat tcttcataag agaaaacagt atcagaaaaa 300

gaaaaaaaac cagttcgatg tcaacgtgac gttcatcaac cctgcgacgt cattttgacg 360

tgcgggaccc atcacaacat ccattcagaa gtttttcatt actggaaaag ctataagaag 420

ctgaagaata atacatttct tgttctcatg caagtaatga ccgtttcatg aacatagcct 480

cgatcccacc ttaatctatc tccgactatc ttatcgtccc cataatcatc atatccatca 540

gaccccaatc atggccaata ttgtggctgg gggcctccac aaggttcaag aagcagtgca 600

gggcgctgct tccaaggata agaagctagt tgacctagca cccgacaccc ataatgtaca 660

gtccagcaag gagccactga ccaccgacca tggtgtgcgt atcagcgata cggaccactg 720

gctgaaggag gtgaatgaca accacaccgg tcctatgatg cttgaggacc agattgcacg 780

agagaaggta tgattccccg aatcggtatg ggtcagaacc atagattgaa cgaatcgcaa 840

cccagattca tcgtttcgat catgagcgca ttcccgagag agtcgtccat gcgcgtggca 900

ccgctgcatt cggaaacttc aagctccatg agagcgctga agatgtatcc tacgctggta 960

tcttgacgga tacctcaagg aacactccgg ttttccttcg tttctccacg gtccagggca 1020

gtaaaggaag tgccgacacc gtccgtgacg ttcgtgggtt tgccgtgaaa ttctacaccg 1080

acgaaggaaa ttgggatctg gttggaaaca acatccccgt tttctttatc caagatgcga 1140

ttaagttccc ggattttggt acgtacctcc tcccaactat gagtccaaaa ctctagagct 1200

aacgagtgta gtccatgctg ttaagcccga gccgcacaac gaggtaccac aggcccaaac 1260

tgctcacaac aacttctggg actttgtcta tcttcacccg gaagccaccc atatgttcat 1320

gtgggccatg tctgatcggg ccattcctcg gtcataccgt atgatgcagg gtttcggtgt 1380

caacacattc agtctcatca acaaggaagg aaagcgccat tttgtcaagt tccatttcat 1440

cccccacctg ggagtgcact ctttggtgtg ggacgaggct ctgaaactgg ctggccagga 1500

ccccgatttc catcgcaagg atctcatgga ggccattgat aacggcgcat acccgaaatg 1560

ggacttcgcc atccaggtca tccctgagga gaaacaggat gacttcgaat ttgacatttt 1620

cgacgcgacg aagatctggc ccgaggagct cgtgcctctg cgcgtgatcg gcgaactgga 1680

actgaaccgc aacgtcgacg agttcttccc tcaaaccgag caagtcgcct tctgcaccag 1740

ccacatcgtc cccggcattg acttcagtga cgacccgctt ctccagggcc gtaacttctc 1800

ctacttcgac actcagatca gtcgactggg catcaactgg gaagaaatcc ccatcaaccg 1860

ccccgtctgc cccgttctga accacaaccg agacggcgcc aaacgccacc gcatcgccca 1920

gggcactgtc actacttggt cgaaccggtc cgaggccgga ccacccgcac cagtagaaca 1980

tggtggcttc gcgtcctacc ctgcgaaact gaacggtatc aagaagcgcg gcctgagccc 2040

caagttccgc gagcaccaca accaggctca actcttctac aactctctct ccgagcacga 2100

gaaggtccac gtcaagaagg ccttcggctt cgaactggac cactgcgacg accccatcgt 2160

ctacgagcgc ctcgccggcc accgtctcgc cgagatcgat ctcactctcg cccaggaagt 2220

cgccgagctc gtcggcgccc cgatcccaga caaggcactt cgcccgaacc atggaaagcg 2280

cagcaagcat ctttcgcaga ccgagttccc gggtaagcag ccgacgatcg ccagtcgccg 2340

aatcgccatc attatcggcg acggatacga ccccgtcgct ttcaatggcc tcaagggcgc 2400

catcacggcg gttggagcct taccgttcgt cattggcacc aagcggtcac ctatctacgc 2460

cgacggtgag gacaaatcat cttccaaggg cgtgatcgcc gaccaccagt atgacggaca 2520

gcgttcgacg atgtttgacg ctaccttcat ccctggcggt ccgcacgtcg aaagcctcaa 2580

ggccaatggc cagatccggt actggatcat tgagacattc ggtcatctca aggctctggg 2640

cgccactggt gaagcggcgg ctttcatcaa ggaagccctg ggctccgcgc ttgatgtgaa 2700

ggtcgctacg tctgataacc cccagccggt tgagtggtat ggtgttgtca cggctggaaa 2760

gatccacaaa cctgagagct tcaaggaggg tatccagatt gtcaaggatg cgaaggattt 2820

cattagcacc ttcttctacc agatcagtca gcatcggaac tacaagcgtg aactggatgg 2880

cctcgcctcg acagttgcat tctaaatgct ttcgtgattg gttgaggaca tggaggcttg 2940

tgttaacgca aaagtggcat tttagttaat gtcatccttg taatgaatta tgtctctaac 3000

tgtggatggc cagaatgtac gctaatatga atcatgaaaa tactctattc taattgtgaa 3060

tgtgaaagtg aaacggcgtc gaaaggtagt tatcaatgtt atcctgaggt atctaatata 3120

caacatcttt gatattgtag gaaagaaacg taagaaagga tcgtacatag tggggtatca 3180

taatctggta cagcgtccaa ggctcggctt 3210

<210> 24

<211> 747

<212> PRT

<213> 米曲霉

<400> 24

Met Ala Asn Ile Val Ala Gly Gly Leu His Lys Val Gln Glu Ala Val

1 5 10 15

Gln Gly Ala Ala Ser Lys Asp Lys Lys Leu Val Asp Leu Ala Pro Asp

20 25 30

Thr His Asn Val Gln Ser Ser Lys Glu Pro Leu Thr Thr Asp His Gly

35 40 45

Val Arg Ile Ser Asp Thr Asp His Trp Leu Lys Glu Val Asn Asp Asn

50 55 60

His Thr Gly Pro Met Met Leu Glu Asp Gln Ile Ala Arg Glu Lys Ile

65 70 75 80

His Arg Phe Asp His Glu Arg Ile Pro Glu Arg Val Val His Ala Arg

85 90 95

Gly Thr Ala Ala Phe Gly Asn Phe Lys Leu His Glu Ser Ala Glu Asp

100 105 110

Val Ser Tyr Ala Gly Ile Leu Thr Asp Thr Ser Arg Asn Thr Pro Val

115 120 125

Phe Leu Arg Phe Ser Thr Val Gln Gly Ser Lys Gly Ser Ala Asp Thr

130 135 140

Val Arg Asp Val Arg Gly Phe Ala Val Lys Phe Tyr Thr Asp Glu Gly

145 150 155 160

Asn Trp Asp Leu Val Gly Asn Asn Ile Pro Val Phe Phe Ile Gln Asp

165 170 175

Ala Ile Lys Phe Pro Asp Phe Val His Ala Val Lys Pro Glu Pro His

180 185 190

Asn Glu Val Pro Gln Ala Gln Thr Ala His Asn Asn Phe Trp Asp Phe

195 200 205

Val Tyr Leu His Pro Glu Ala Thr His Met Phe Met Trp Ala Met Ser

210 215 220

Asp Arg Ala Ile Pro Arg Ser Tyr Arg Met Met Gln Gly Phe Gly Val

225 230 235 240

Asn Thr Phe Ser Leu Ile Asn Lys Glu Gly Lys Arg His Phe Val Lys

245 250 255

Phe His Phe Ile Pro His Leu Gly Val His Ser Leu Val Trp Asp Glu

260 265 270

Ala Leu Lys Leu Ala Gly Gln Asp Pro Asp Phe His Arg Lys Asp Leu

275 280 285

Met Glu Ala Ile Asp Asn Gly Ala Tyr Pro Lys Trp Asp Phe Ala Ile

290 295 300

Gln Val Ile Pro Glu Glu Lys Gln Asp Asp Phe Glu Phe Asp Ile Phe

305 310 315 320

Asp Ala Thr Lys Ile Trp Pro Glu Glu Leu Val Pro Leu Arg Val Ile

325 330 335

Gly Glu Leu Glu Leu Asn Arg Asn Val Asp Glu Phe Phe Pro Gln Thr

340 345 350

Glu Gln Val Ala Phe Cys Thr Ser His Ile Val Pro Gly Ile Asp Phe

355 360 365

Ser Asp Asp Pro Leu Leu Gln Gly Arg Asn Phe Ser Tyr Phe Asp Thr

370 375 380

Gln Ile Ser Arg Leu Gly Ile Asn Trp Glu Glu Ile Pro Ile Asn Arg

385 390 395 400

Pro Val Cys Pro Val Leu Asn His Asn Arg Asp Gly Ala Lys Arg His

405 410 415

Arg Ile Ala Gln Gly Thr Val Thr Thr Trp Ser Asn Arg Ser Glu Ala

420 425 430

Gly Pro Pro Ala Pro Val Glu His Gly Gly Phe Ala Ser Tyr Pro Ala

435 440 445

Lys Leu Asn Gly Ile Lys Lys Arg Gly Leu Ser Pro Lys Phe Arg Glu

450 455 460

His His Asn Gln Ala Gln Leu Phe Tyr Asn Ser Leu Ser Glu His Glu

465 470 475 480

Lys Val His Val Lys Lys Ala Phe Gly Phe Glu Leu Asp His Cys Asp

485 490 495

Asp Pro Ile Val Tyr Glu Arg Leu Ala Gly His Arg Leu Ala Glu Ile

500 505 510

Asp Leu Thr Leu Ala Gln Glu Val Ala Glu Leu Val Gly Ala Pro Ile

515 520 525

Pro Asp Lys Ala Leu Arg Pro Asn His Gly Lys Arg Ser Lys His Leu

530 535 540

Ser Gln Thr Glu Phe Pro Gly Lys Gln Pro Thr Ile Ala Ser Arg Arg

545 550 555 560

Ile Ala Ile Ile Ile Gly Asp Gly Tyr Asp Pro Val Ala Phe Asn Gly

565 570 575

Leu Lys Gly Ala Ile Thr Ala Val Gly Ala Leu Pro Phe Val Ile Gly

580 585 590

Thr Lys Arg Ser Pro Ile Tyr Ala Asp Gly Glu Asp Lys Ser Ser Ser

595 600 605

Lys Gly Val Ile Ala Asp His Gln Tyr Asp Gly Gln Arg Ser Thr Met

610 615 620

Phe Asp Ala Thr Phe Ile Pro Gly Gly Pro His Val Glu Ser Leu Lys

625 630 635 640

Ala Asn Gly Gln Ile Arg Tyr Trp Ile Ile Glu Thr Phe Gly His Leu

645 650 655

Lys Ala Leu Gly Ala Thr Gly Glu Ala Ala Ala Phe Ile Lys Glu Ala

660 665 670

Leu Gly Ser Ala Leu Asp Val Lys Val Ala Thr Ser Asp Asn Pro Gln

675 680 685

Pro Val Glu Trp Tyr Gly Val Val Thr Ala Gly Lys Ile His Lys Pro

690 695 700

Glu Ser Phe Lys Glu Gly Ile Gln Ile Val Lys Asp Ala Lys Asp Phe

705 710 715 720

Ile Ser Thr Phe Phe Tyr Gln Ile Ser Gln His Arg Asn Tyr Lys Arg

725 730 735

Glu Leu Asp Gly Leu Ala Ser Thr Val Ala Phe

740 745

<210> 25

<211> 2502

<212> DNA

<213> 桔橙嗜热子囊菌

<400> 25

atgcgcgcaa ttggacttct gccaggcatc atcggcattg ctggtgctgc ctgtccttac 60

atgacaggcg agctgccgcg ctccttcgcc gagaaccctc atgctatcaa ccgtcgtgct 120

gagggtggtg gtggtgccgc tgccgagacg gagaagttcc tgtctcagtt ctacctgaac 180

gacaacgaca ccttcatgac caccgatgtt ggcggtccaa ttgaggatca gaacagtctc 240

agcgctggtg acagaggtcc taccctgctg gaggacttca tcctccgtca aaagatccag 300

cgctttgacc atgagcgggt aggttgatct ttactttcgg ccttcttcga gcggggtgat 360

attaaaacag gtaataggtg cccgagcgtg ctgtccatgc ccgaggagcg ggagcgcatg 420

gcgtgttcac atcctacgca gactggtcca acatcactgc cgcttccttc ctgtctgctg 480

caggaaagga gacacctgtc tttgtccggt tctccactgt agcaggaagc agaggaagcg 540

cagacacggc gcgtgacgtg cacggtttcg cgacgaggtt ctacacggat gaagggaact 600

tcggtaggca actatcatgc tctctttaaa tgttctcgat ctgacagcca gcagacattg 660

tcggcaacaa catccctgtc ttcttcattc aagatgcgat ccagttcccc gacctgatcc 720

atgctgtcaa gcccagcccg aacaacgaga tccctcaggc cgcaaccgcc catgactctg 780

cctgggactt tttcagccag cagccgagct ctttgcatac tctgttctgg gctatggccg 840

gtcatggcat tcctcgttcc tacaggaaca tggatggctt cggcatccac accttccgct 900

ttgtgacgga cgatggagct tccaagctcg tcaagttcca ctggacgtcg ctgcagggca 960

aggcgagcct tgtgtgggaa gaggcacagg ccgtggctgg aaagaacgcg gactatcacc 1020

gccaggactt gtgggacgca atcgaggctg gaaggtaccc tgagtgggag gtaggctctc 1080

cctgctatgt atggatgtgc cagaagctta ataatggcct agctcggcgt gcaaatcatg 1140

gatgaggaag accagctgcg ctttggcttc gatctgttgg acccgaccaa gatcgttccc 1200

gaggaatacg tgcccatcac gaagctcgga aagatgcagc tcaaccgcaa cccgctgaac 1260

tacttcgccg agactgaaca gatcatggtc agttcgccac cgtgttcggt tgctcgttgc 1320

tgaagtgcta acttgcaaca gttccaaccg ggtcacgttg tccgtggcat tgatttcacc 1380

gaggaccctc tgctccaggg acgtctcttc tcttacctcg acacccagct caaccgccac 1440

ggaggtccga acttcgagca gatccccatc aaccggccac gcactccaat tcacaacaac 1500

aaccgtgacg gagccggtat gctagcccat gtattccttt ctttatgcat ttttatatga 1560

tgcgttctaa cggcaacagc gcaaatgtac atccccctga acaaggcggc gtacaccccc 1620

aacactctga acaacggctc ccccaagcag gccaaccaga cggtcggaaa gggcttcttc 1680

acgactccag gccggacggc aagcggcagg cttgtgcgcg ccgtcagctc aaccttcgcc 1740

gacgtctggt cgcagcctcg tctgttctac aactccctcg tgccggcgga gcagcagttc 1800

ctgatcaacg cgatccgctt tgagacggcc cacatcacga gcgacgtcgt gaagaacaac 1860

gtcatcatcc agctgaaccg cgtgagcaac aacctcgcca agagagtcgc ccgggccatc 1920

ggtgtcgcgg agcccgagcc agacccaacc ttgtaccaca acaacaagac cgccaacgtc 1980

ggggtgttcg gcaagccgct cgccagactc gacggcctgc aggtcggggt cctcgccacc 2040

gtcaacaagc ccgactcgat caagcaggcc gccagcctga aggccagctt cgcggcggac 2100

aacgtcgacg tcaaggtcgt cgcggagcgc ctcgccgacg gcgtcgacga gacctactcg 2160

gccgccgacg cggtcaactt cgacgccatc ctggtcgcca acggcgctga gggcctcttc 2220

gcgcgcgaca gcttcaccgc caggccggcc aactcgacca ccgcgacgct ctaccccgcg 2280

ggccgcccgc tccagatcct ggtcgacggg ttccgctacg gcaagccggt cggggcgctc 2340

ggcagcggcg ccaaggcgct cgacgcagcg gagatttcga cgacccgggc cggcgtgtac 2400

gtcgccaact cgacgaccga cagcttcatc aatggcgtca gggacggtct gcggacgttc 2460

aagttcctgg accggttcgc gattgacgag gatgctgagt ga 2502

<210> 26

<211> 740

<212> PRT

<213> 桔橙嗜热子囊菌

<400> 26

Met Arg Ala Ile Gly Leu Leu Pro Gly Ile Ile Gly Ile Ala Gly Ala

1 5 10 15

Ala Cys Pro Tyr Met Thr Gly Glu Leu Pro Arg Ser Phe Ala Glu Asn

20 25 30

Pro His Ala Ile Asn Arg Arg Ala Glu Gly Gly Gly Gly Ala Ala Ala

35 40 45

Glu Thr Glu Lys Phe Leu Ser Gln Phe Tyr Leu Asn Asp Asn Asp Thr

50 55 60

Phe Met Thr Thr Asp Val Gly Gly Pro Ile Glu Asp Gln Asn Ser Leu

65 70 75 80

Ser Ala Gly Asp Arg Gly Pro Thr Leu Leu Glu Asp Phe Ile Leu Arg

85 90 95

Gln Lys Ile Gln Arg Phe Asp His Glu Arg Val Pro Glu Arg Ala Val

100 105 110

His Ala Arg Gly Ala Gly Ala His Gly Val Phe Thr Ser Tyr Ala Asp

115 120 125

Trp Ser Asn Ile Thr Ala Ala Ser Phe Leu Ser Ala Ala Gly Lys Glu

130 135 140

Thr Pro Val Phe Val Arg Phe Ser Thr Val Ala Gly Ser Arg Gly Ser

145 150 155 160

Ala Asp Thr Ala Arg Asp Val His Gly Phe Ala Thr Arg Phe Tyr Thr

165 170 175

Asp Glu Gly Asn Phe Asp Ile Val Gly Asn Asn Ile Pro Val Phe Phe

180 185 190

Ile Gln Asp Ala Ile Gln Phe Pro Asp Leu Ile His Ala Val Lys Pro

195 200 205

Ser Pro Asn Asn Glu Ile Pro Gln Ala Ala Thr Ala His Asp Ser Ala

210 215 220

Trp Asp Phe Phe Ser Gln Gln Pro Ser Ser Leu His Thr Leu Phe Trp

225 230 235 240

Ala Met Ala Gly His Gly Ile Pro Arg Ser Tyr Arg Asn Met Asp Gly

245 250 255

Phe Gly Ile His Thr Phe Arg Phe Val Thr Asp Asp Gly Ala Ser Lys

260 265 270

Leu Val Lys Phe His Trp Thr Ser Leu Gln Gly Lys Ala Ser Leu Val

275 280 285

Trp Glu Glu Ala Gln Ala Val Ala Gly Lys Asn Ala Asp Tyr His Arg

290 295 300

Gln Asp Leu Trp Asp Ala Ile Glu Ala Gly Arg Tyr Pro Glu Trp Glu

305 310 315 320

Leu Gly Val Gln Ile Met Asp Glu Glu Asp Gln Leu Arg Phe Gly Phe

325 330 335

Asp Leu Leu Asp Pro Thr Lys Ile Val Pro Glu Glu Tyr Val Pro Ile

340 345 350

Thr Lys Leu Gly Lys Met Gln Leu Asn Arg Asn Pro Leu Asn Tyr Phe

355 360 365

Ala Glu Thr Glu Gln Ile Met Phe Gln Pro Gly His Val Val Arg Gly

370 375 380

Ile Asp Phe Thr Glu Asp Pro Leu Leu Gln Gly Arg Leu Phe Ser Tyr

385 390 395 400

Leu Asp Thr Gln Leu Asn Arg His Gly Gly Pro Asn Phe Glu Gln Ile

405 410 415

Pro Ile Asn Arg Pro Arg Thr Pro Ile His Asn Asn Asn Arg Asp Gly

420 425 430

Ala Ala Gln Met Tyr Ile Pro Leu Asn Lys Ala Ala Tyr Thr Pro Asn

435 440 445

Thr Leu Asn Asn Gly Ser Pro Lys Gln Ala Asn Gln Thr Val Gly Lys

450 455 460

Gly Phe Phe Thr Thr Pro Gly Arg Thr Ala Ser Gly Arg Leu Val Arg

465 470 475 480

Ala Val Ser Ser Thr Phe Ala Asp Val Trp Ser Gln Pro Arg Leu Phe

485 490 495

Tyr Asn Ser Leu Val Pro Ala Glu Gln Gln Phe Leu Ile Asn Ala Ile

500 505 510

Arg Phe Glu Thr Ala His Ile Thr Ser Asp Val Val Lys Asn Asn Val

515 520 525

Ile Ile Gln Leu Asn Arg Val Ser Asn Asn Leu Ala Lys Arg Val Ala

530 535 540

Arg Ala Ile Gly Val Ala Glu Pro Glu Pro Asp Pro Thr Leu Tyr His

545 550 555 560

Asn Asn Lys Thr Ala Asn Val Gly Val Phe Gly Lys Pro Leu Ala Arg

565 570 575

Leu Asp Gly Leu Gln Val Gly Val Leu Ala Thr Val Asn Lys Pro Asp

580 585 590

Ser Ile Lys Gln Ala Ala Ser Leu Lys Ala Ser Phe Ala Ala Asp Asn

595 600 605

Val Asp Val Lys Val Val Ala Glu Arg Leu Ala Asp Gly Val Asp Glu

610 615 620

Thr Tyr Ser Ala Ala Asp Ala Val Asn Phe Asp Ala Ile Leu Val Ala

625 630 635 640

Asn Gly Ala Glu Gly Leu Phe Ala Arg Asp Ser Phe Thr Ala Arg Pro

645 650 655

Ala Asn Ser Thr Thr Ala Thr Leu Tyr Pro Ala Gly Arg Pro Leu Gln

660 665 670

Ile Leu Val Asp Gly Phe Arg Tyr Gly Lys Pro Val Gly Ala Leu Gly

675 680 685

Ser Gly Ala Lys Ala Leu Asp Ala Ala Glu Ile Ser Thr Thr Arg Ala

690 695 700

Gly Val Tyr Val Ala Asn Ser Thr Thr Asp Ser Phe Ile Asn Gly Val

705 710 715 720

Arg Asp Gly Leu Arg Thr Phe Lys Phe Leu Asp Arg Phe Ala Ile Asp

725 730 735

Glu Asp Ala Glu

740

<210> 27

<211> 1452

<212> DNA

<213> 热葡糖苷酶芽孢杆菌

<400> 27

atgagttcaa ataaactgac aactagctgg ggcgctccgg ttggagataa tcaaaactca 60

atgactgccg gttctcgcgg accaacttta attcaagatg tacatttact cgaaaaattg 120

gcccatttca accgagaacg tgttcctgaa cgtgttgttc acgccaaagg agcaggcgca 180

cacggatatt ttgaagtgac aaacgacgta acaaaataca cgaaagccgc tttcctttct 240

gaagtcggca aacgcacacc gttgttcatc cgtttctcaa cagttgccgg tgaacttggc 300

tctgctgaca cagttcgcga cccgcgcgga tttgctgtta aattttatac tgaagaagga 360

aactacgaca tcgtcggcaa caatacgcct gtattcttta tccgcgatgc gattaagttc 420

cctgatttca tccatacaca aaaaagagat ccaaaaacac acctgaaaaa ccctacggct 480

gtatgggatt tctggtcact ttcaccagag tcattgcacc aagtgacaat cctgatgtct 540

gaccgcggaa ttcctgcgac acttcgccac atgcacggct tcggaagcca tacattcaaa 600

tggacaaatg ccgaacccga aggcgtatgg attaaatatc actttaaaac agaacaaggc 660

gtgaaaaacc ttgatgtcaa tacggcagca aaaattgccg gtgaaaaccc tgattaccat 720

acagaagacc ttttcaacgc aatcgaaaac ggtgattatc ctgcatggaa actatatgtg 780

caaatcatgc ctttagaaga tgcaaatacg taccgtttcg atccgtttga tgtcacaaaa 840

gtttggtctc aaaaagacta cccgttaatc gaggtcggac gcatggttct agacagaaat 900

ccggaaaact actttgcaga ggtagaacaa gcgacatttt cacctggaac cctcgtgcct 960

ggtattgatg tttcaccgga taaaatgctt caaggtcgac tttttgctta tcatgatgca 1020

caccgctacc gtgtcggtgc aaaccatcaa gcgctgccaa tcaaccgcgc acgcaacaaa 1080

gtaaacaatt atcagcgtga tgggcaaatg cgttttgatg ataacggcgg cggatctgtg 1140

tattacgagc ctaacagctt cggcggtcca aaagagtcac ctgaggataa gcaagcagca 1200

tatccggtac aaggtatcgc tgacagcgta agctacgatc actacgatca ctacactcaa 1260

gccggcgatc tgtatcgttt aatgagtgaa gatgaacgta cccgccttgt tgaaaatatc 1320

gttaatgcca tgaagccggt agaaaaagaa gaaatcaagc tgcgccaaat cgagcacttc 1380

tacaaagcgg atcctgaata cggaaaacgc gtggcagaag gccttggatt gccgattaaa 1440

aaagattctt aa 1452

<210> 28

<211> 483

<212> PRT

<213> 热葡糖苷酶芽孢杆菌

<400> 28

Met Ser Ser Asn Lys Leu Thr Thr Ser Trp Gly Ala Pro Val Gly Asp

1 5 10 15

Asn Gln Asn Ser Met Thr Ala Gly Ser Arg Gly Pro Thr Leu Ile Gln

20 25 30

Asp Val His Leu Leu Glu Lys Leu Ala His Phe Asn Arg Glu Arg Val

35 40 45

Pro Glu Arg Val Val His Ala Lys Gly Ala Gly Ala His Gly Tyr Phe

50 55 60

Glu Val Thr Asn Asp Val Thr Lys Tyr Thr Lys Ala Ala Phe Leu Ser

65 70 75 80

Glu Val Gly Lys Arg Thr Pro Leu Phe Ile Arg Phe Ser Thr Val Ala

85 90 95

Gly Glu Leu Gly Ser Ala Asp Thr Val Arg Asp Pro Arg Gly Phe Ala

100 105 110

Val Lys Phe Tyr Thr Glu Glu Gly Asn Tyr Asp Ile Val Gly Asn Asn

115 120 125

Thr Pro Val Phe Phe Ile Arg Asp Ala Ile Lys Phe Pro Asp Phe Ile

130 135 140

His Thr Gln Lys Arg Asp Pro Lys Thr His Leu Lys Asn Pro Thr Ala

145 150 155 160

Val Trp Asp Phe Trp Ser Leu Ser Pro Glu Ser Leu His Gln Val Thr

165 170 175

Ile Leu Met Ser Asp Arg Gly Ile Pro Ala Thr Leu Arg His Met His

180 185 190

Gly Phe Gly Ser His Thr Phe Lys Trp Thr Asn Ala Glu Pro Glu Gly

195 200 205

Val Trp Ile Lys Tyr His Phe Lys Thr Glu Gln Gly Val Lys Asn Leu

210 215 220

Asp Val Asn Thr Ala Ala Lys Ile Ala Gly Glu Asn Pro Asp Tyr His

225 230 235 240

Thr Glu Asp Leu Phe Asn Ala Ile Glu Asn Gly Asp Tyr Pro Ala Trp

245 250 255

Lys Leu Tyr Val Gln Ile Met Pro Leu Glu Asp Ala Asn Thr Tyr Arg

260 265 270

Phe Asp Pro Phe Asp Val Thr Lys Val Trp Ser Gln Lys Asp Tyr Pro

275 280 285

Leu Ile Glu Val Gly Arg Met Val Leu Asp Arg Asn Pro Glu Asn Tyr

290 295 300

Phe Ala Glu Val Glu Gln Ala Thr Phe Ser Pro Gly Thr Leu Val Pro

305 310 315 320

Gly Ile Asp Val Ser Pro Asp Lys Met Leu Gln Gly Arg Leu Phe Ala

325 330 335

Tyr His Asp Ala His Arg Tyr Arg Val Gly Ala Asn His Gln Ala Leu

340 345 350

Pro Ile Asn Arg Ala Arg Asn Lys Val Asn Asn Tyr Gln Arg Asp Gly

355 360 365

Gln Met Arg Phe Asp Asp Asn Gly Gly Gly Ser Val Tyr Tyr Glu Pro

370 375 380

Asn Ser Phe Gly Gly Pro Lys Glu Ser Pro Glu Asp Lys Gln Ala Ala

385 390 395 400

Tyr Pro Val Gln Gly Ile Ala Asp Ser Val Ser Tyr Asp His Tyr Asp

405 410 415

His Tyr Thr Gln Ala Gly Asp Leu Tyr Arg Leu Met Ser Glu Asp Glu

420 425 430

Arg Thr Arg Leu Val Glu Asn Ile Val Asn Ala Met Lys Pro Val Glu

435 440 445

Lys Glu Glu Ile Lys Leu Arg Gln Ile Glu His Phe Tyr Lys Ala Asp

450 455 460

Pro Glu Tyr Gly Lys Arg Val Ala Glu Gly Leu Gly Leu Pro Ile Lys

465 470 475 480

Lys Asp Ser

<210> 29

<211> 1449

<212> DNA

<213> 热葡糖苷酶芽孢杆菌

<400> 29

atgagttcaa ataaactgac aactagctgg ggagcacctg ttggcgataa ccaaaactcg 60

ataacggccg gcaatcctgg cccgacatta atccaagacg tacatcttat cgaaaaatta 120

gcacacttca atagagaacg tgtcccagaa cgtgttgtcc atgcgaaagg cgctggtgcg 180

cacggctatt tcgaagtaac aaacgatatg tcgaaataca caaaagcgaa agtgtttaac 240

ggtgttggca aacgcacgcc tgtattcgtc cgcttctcta ctgtcgccgg tgaattggga 300

tctgcggata cagtccgcga cccgcgcggt tttgccgtca aattttatac cgaagaagga 360

aactatgaca tcgttggcaa caacacaccg attttcttca ttcgtgatgc gattaaattc 420

tcggatttta tccatacaca aaaacgcgac ccgcgcaccc atttgattta tccgacagca 480

atgtgggatt tcttgtcttt atctccggaa tctttgcacc aagtcactta tttattcggg 540

gatcgcggca tcccattgac ataccgccat atgaacggat acggaagcca tacattcaaa 600

tgggtgaatg aaaaaggcga agcggtatgg gtaaaatacc actttaaaac aaaccaaggc 660

gtgaaaaaca tggatccgga actagcggtt aaaatcgccg gagaaaatcc ggattaccat 720

acggaagatt tatataacgc catcgaaaaa ggcgactatc catcttggac attatatgtg 780

caaattatgc cgttagaaga cgcaaaaaca taccgtttca atccatttga tgtcacaaaa 840

gtttggtcac ataaagatta tccgttaatt gaagtcggcc gtatggtatt aaaccgcaat 900

ccagaaaatt attttgccga agtcgaacaa gcgacattct ctcctggaaa ccttgttcct 960

ggcgttgaac catcgccgga taaaatcttg caagcccgtt tgttcgctta tgcggatgcg 1020

caccgttacc gcgtcggcgt gaaccataac ttgcttccga tcaaccgccc gcgcgtggaa 1080

gtaaacaatt atcaacgtga cggcttcatg cgctttgaca ataatggcgg cggttcggtc 1140

aactacgaac caaacagctt cggcggaccg acagaagtgc cagaacataa aacgacccca 1200

ttcccggtat ccggcgtggc agaaagcgtg ccatatgacg acgatgatca ttatacgcaa 1260

gcaggcgact tataccgtct catgagcgaa gaagaaaaag cgcgccttgt gaaaaacatt 1320

gtcgaatcat tgaaacaagt aacaaaagaa gaaattaaac ttcgccaaat ccgccacttc 1380

tacaaagcag accctgacta cggccgccgc gttgccgaag gtcttggatt gccgattaaa 1440

aaagattct 1449

<210> 30

<211> 483

<212> PRT

<213> 热葡糖苷酶芽孢杆菌

<400> 30

Met Ser Ser Asn Lys Leu Thr Thr Ser Trp Gly Ala Pro Val Gly Asp

1 5 10 15

Asn Gln Asn Ser Ile Thr Ala Gly Asn Pro Gly Pro Thr Leu Ile Gln

20 25 30

Asp Val His Leu Ile Glu Lys Leu Ala His Phe Asn Arg Glu Arg Val

35 40 45

Pro Glu Arg Val Val His Ala Lys Gly Ala Gly Ala His Gly Tyr Phe

50 55 60

Glu Val Thr Asn Asp Met Ser Lys Tyr Thr Lys Ala Lys Val Phe Asn

65 70 75 80

Gly Val Gly Lys Arg Thr Pro Val Phe Val Arg Phe Ser Thr Val Ala

85 90 95

Gly Glu Leu Gly Ser Ala Asp Thr Val Arg Asp Pro Arg Gly Phe Ala

100 105 110

Val Lys Phe Tyr Thr Glu Glu Gly Asn Tyr Asp Ile Val Gly Asn Asn

115 120 125

Thr Pro Ile Phe Phe Ile Arg Asp Ala Ile Lys Phe Ser Asp Phe Ile

130 135 140

His Thr Gln Lys Arg Asp Pro Arg Thr His Leu Ile Tyr Pro Thr Ala

145 150 155 160

Met Trp Asp Phe Leu Ser Leu Ser Pro Glu Ser Leu His Gln Val Thr

165 170 175

Tyr Leu Phe Gly Asp Arg Gly Ile Pro Leu Thr Tyr Arg His Met Asn

180 185 190

Gly Tyr Gly Ser His Thr Phe Lys Trp Val Asn Glu Lys Gly Glu Ala

195 200 205

Val Trp Val Lys Tyr His Phe Lys Thr Asn Gln Gly Val Lys Asn Met

210 215 220

Asp Pro Glu Leu Ala Val Lys Ile Ala Gly Glu Asn Pro Asp Tyr His

225 230 235 240

Thr Glu Asp Leu Tyr Asn Ala Ile Glu Lys Gly Asp Tyr Pro Ser Trp

245 250 255

Thr Leu Tyr Val Gln Ile Met Pro Leu Glu Asp Ala Lys Thr Tyr Arg

260 265 270

Phe Asn Pro Phe Asp Val Thr Lys Val Trp Ser His Lys Asp Tyr Pro

275 280 285

Leu Ile Glu Val Gly Arg Met Val Leu Asn Arg Asn Pro Glu Asn Tyr

290 295 300

Phe Ala Glu Val Glu Gln Ala Thr Phe Ser Pro Gly Asn Leu Val Pro

305 310 315 320

Gly Val Glu Pro Ser Pro Asp Lys Ile Leu Gln Ala Arg Leu Phe Ala

325 330 335

Tyr Ala Asp Ala His Arg Tyr Arg Val Gly Val Asn His Asn Leu Leu

340 345 350

Pro Ile Asn Arg Pro Arg Val Glu Val Asn Asn Tyr Gln Arg Asp Gly

355 360 365

Phe Met Arg Phe Asp Asn Asn Gly Gly Gly Ser Val Asn Tyr Glu Pro

370 375 380

Asn Ser Phe Gly Gly Pro Thr Glu Val Pro Glu His Lys Thr Thr Pro

385 390 395 400

Phe Pro Val Ser Gly Val Ala Glu Ser Val Pro Tyr Asp Asp Asp Asp

405 410 415

His Tyr Thr Gln Ala Gly Asp Leu Tyr Arg Leu Met Ser Glu Glu Glu

420 425 430

Lys Ala Arg Leu Val Lys Asn Ile Val Glu Ser Leu Lys Gln Val Thr

435 440 445

Lys Glu Glu Ile Lys Leu Arg Gln Ile Arg His Phe Tyr Lys Ala Asp

450 455 460

Pro Asp Tyr Gly Arg Arg Val Ala Glu Gly Leu Gly Leu Pro Ile Lys

465 470 475 480

Lys Asp Ser

<210> 31

<211> 2262

<212> DNA

<213> 海水产碱菌(Alcaligenes aquamarinus)

<400> 31

atgaataacg catccgctga cgatctacac agtagcttgc agcaaagatg cagagcattt 60

gttcccttgg tatcgccaag gcatagagca ataagggaga gagctatgag cggtaaatgt 120

cctgtcatgc acggtggtaa cacctcgacc ggtacttcca acaaagattg gtggccggaa 180

gggttgaacc tggatatttt gcatcagcaa gatcgcaaat cagacccgat ggatccggat 240

ttcaactacc gtgaagaagt acgcaagctc gatttcgacg cgctgaagaa agatgtccac 300

gcgttgatga ccgatagcca agagtggtgg cccgctgact gggggcacta cggcggtttg 360

atgatccgta tggcttggca ctccgctggc acctaccgta ttgctgatgg ccgtgggggc 420

ggtggtaccg gaagccagcg ctttgcaccg ctcaactcct ggccggacaa cgtcagcctg 480

gataaagcgc gccgtctgct gtggccgatc aagaagaagt acggcaacaa aatcagctgg 540

gcagacctga tgattctggc tggcaccgtg gcttatgagt ccatgggctt acctgcttac 600

ggcttctctt tcggccgcgt cgatatttgg gaacccgaaa aagatatcta ctggggtgac 660

gaaaaagagt ggctggcacc ttctgacgaa cgctacggcg acgtgaacaa gccagagacc 720

atggaaaacc cgctggcggc tgtccaaatg ggtctgatct atgtgaaccc ggaaggtgtt 780

aacggccacc ctgatccgct gagaaccgca cagcaggtac ttgaaacctt cgcccgtatg 840

gcgatgaacg acgaaaaaac cgcagccctc acagctggcg gccacaccgt cggtaattgt 900

cacggtaatg gcaatgcctc tgcgttagcc cctgacccaa aagcctctga cgttgaaaac 960

cagggcttag gttggggcaa ccccaacatg cagggcaagg caagcaacgc cgtgacctcg 1020

ggtatcgaag gtgcttggac caccaacccc acgaaattcg atatgggcta tttcgacctg 1080

ctgttcggct acaattggga actgaaaaag agtcctgccg gtgcccacca ttgggaaccg 1140

attgacatca aaaaggaaaa caagccggtt gacgccagcg acccctctat tcgccacaac 1200

ccgatcatga ccgatgcgga tatggcgata aaggtaaatc cgacctatcg cgctatctgc 1260

gaaaaattca tggccgatcc tgagtacttc aagaaaactt tcgcgaaggc gtggttcaag 1320

ctgacgcacc gtgacctggg cccgaaatca cgttacatcg gcccggaagt gccggcagaa 1380

gacctgattt ggcaagaccc gattccggca ggtaacaccg actactgcga agaagtggtc 1440

aagcagaaaa ttgcacaaag tggcctgagc attagtgaga tggtctccac cgcttgggac 1500

agtgcccgta cttatcgcgg ttccgatatg cgcggcggtg ctaacggtgc ccgcattcgc 1560

ttggccccac agaacgagtg gcagggcaac gagccggagc gcctggcgaa agtgctgagc 1620

gtctacgagc agatctctgc cgacaccggc gctagcatcg cggacgtgat cgttctggcc 1680

ggtagcgtag gcatcgagaa agccgcgaaa gcagcaggtt acgatgtgcg cgttcccttc 1740

ctgaaaggcc gtggcgatgc gaccgccgag atgaccgacg cagactcctt cgcaccgctg 1800

gagccgctgg ccgatggctt ccgcaactgg cagaagaaag agtatgtggt gaagccggaa 1860

gagatgctgc tggatcgtgc gcagctgatg ggcttaaccg gcccggaaat gaccgtgctg 1920

ctgggcggta tgcgcgtact gggcaccaac tatggtggca ccaaacacgg cgtattcacc 1980

gattgtgaag gccagttgac caacgacttt tttgtgaacc tgaccgatat ggggaacagc 2040

tggaagccgg taggtagcaa cgcctacgaa atccgcgacc gcaagaccgg tgccgtgaag 2100

tggaccgcct cgcgggtgga tctggtattt ggttccaact cgctactgcg ctcttacgca 2160

gaagtgtacg cccaggacga taacggcgag aagttcgtca gagacttcgt cgccgcctgg 2220

accaaagtga tgaacgccga ccgtttcgac gtcgcgtcgt aa 2262

<210> 32

<211> 753

<212> PRT

<213> 海水产碱菌

<400> 32

Met Asn Asn Ala Ser Ala Asp Asp Leu His Ser Ser Leu Gln Gln Arg

1 5 10 15

Cys Arg Ala Phe Val Pro Leu Val Ser Pro Arg His Arg Ala Ile Arg

20 25 30

Glu Arg Ala Met Ser Gly Lys Cys Pro Val Met His Gly Gly Asn Thr

35 40 45

Ser Thr Gly Thr Ser Asn Lys Asp Trp Trp Pro Glu Gly Leu Asn Leu

50 55 60

Asp Ile Leu His Gln Gln Asp Arg Lys Ser Asp Pro Met Asp Pro Asp

65 70 75 80

Phe Asn Tyr Arg Glu Glu Val Arg Lys Leu Asp Phe Asp Ala Leu Lys

85 90 95

Lys Asp Val His Ala Leu Met Thr Asp Ser Gln Glu Trp Trp Pro Ala

100 105 110

Asp Trp Gly His Tyr Gly Gly Leu Met Ile Arg Met Ala Trp His Ser

115 120 125

Ala Gly Thr Tyr Arg Ile Ala Asp Gly Arg Gly Gly Gly Gly Thr Gly

130 135 140

Ser Gln Arg Phe Ala Pro Leu Asn Ser Trp Pro Asp Asn Val Ser Leu

145 150 155 160

Asp Lys Ala Arg Arg Leu Leu Trp Pro Ile Lys Lys Lys Tyr Gly Asn

165 170 175

Lys Ile Ser Trp Ala Asp Leu Met Ile Leu Ala Gly Thr Val Ala Tyr

180 185 190

Glu Ser Met Gly Leu Pro Ala Tyr Gly Phe Ser Phe Gly Arg Val Asp

195 200 205

Ile Trp Glu Pro Glu Lys Asp Ile Tyr Trp Gly Asp Glu Lys Glu Trp

210 215 220

Leu Ala Pro Ser Asp Glu Arg Tyr Gly Asp Val Asn Lys Pro Glu Thr

225 230 235 240

Met Glu Asn Pro Leu Ala Ala Val Gln Met Gly Leu Ile Tyr Val Asn

245 250 255

Pro Glu Gly Val Asn Gly His Pro Asp Pro Leu Arg Thr Ala Gln Gln

260 265 270

Val Leu Glu Thr Phe Ala Arg Met Ala Met Asn Asp Glu Lys Thr Ala

275 280 285

Ala Leu Thr Ala Gly Gly His Thr Val Gly Asn Cys His Gly Asn Gly

290 295 300

Asn Ala Ser Ala Leu Ala Pro Asp Pro Lys Ala Ser Asp Val Glu Asn

305 310 315 320

Gln Gly Leu Gly Trp Gly Asn Pro Asn Met Gln Gly Lys Ala Ser Asn

325 330 335

Ala Val Thr Ser Gly Ile Glu Gly Ala Trp Thr Thr Asn Pro Thr Lys

340 345 350

Phe Asp Met Gly Tyr Phe Asp Leu Leu Phe Gly Tyr Asn Trp Glu Leu

355 360 365

Lys Lys Ser Pro Ala Gly Ala His His Trp Glu Pro Ile Asp Ile Lys

370 375 380

Lys Glu Asn Lys Pro Val Asp Ala Ser Asp Pro Ser Ile Arg His Asn

385 390 395 400

Pro Ile Met Thr Asp Ala Asp Met Ala Ile Lys Val Asn Pro Thr Tyr

405 410 415

Arg Ala Ile Cys Glu Lys Phe Met Ala Asp Pro Glu Tyr Phe Lys Lys

420 425 430

Thr Phe Ala Lys Ala Trp Phe Lys Leu Thr His Arg Asp Leu Gly Pro

435 440 445

Lys Ser Arg Tyr Ile Gly Pro Glu Val Pro Ala Glu Asp Leu Ile Trp

450 455 460

Gln Asp Pro Ile Pro Ala Gly Asn Thr Asp Tyr Cys Glu Glu Val Val

465 470 475 480

Lys Gln Lys Ile Ala Gln Ser Gly Leu Ser Ile Ser Glu Met Val Ser

485 490 495

Thr Ala Trp Asp Ser Ala Arg Thr Tyr Arg Gly Ser Asp Met Arg Gly

500 505 510

Gly Ala Asn Gly Ala Arg Ile Arg Leu Ala Pro Gln Asn Glu Trp Gln

515 520 525

Gly Asn Glu Pro Glu Arg Leu Ala Lys Val Leu Ser Val Tyr Glu Gln

530 535 540

Ile Ser Ala Asp Thr Gly Ala Ser Ile Ala Asp Val Ile Val Leu Ala

545 550 555 560

Gly Ser Val Gly Ile Glu Lys Ala Ala Lys Ala Ala Gly Tyr Asp Val

565 570 575

Arg Val Pro Phe Leu Lys Gly Arg Gly Asp Ala Thr Ala Glu Met Thr

580 585 590

Asp Ala Asp Ser Phe Ala Pro Leu Glu Pro Leu Ala Asp Gly Phe Arg

595 600 605

Asn Trp Gln Lys Lys Glu Tyr Val Val Lys Pro Glu Glu Met Leu Leu

610 615 620

Asp Arg Ala Gln Leu Met Gly Leu Thr Gly Pro Glu Met Thr Val Leu

625 630 635 640

Leu Gly Gly Met Arg Val Leu Gly Thr Asn Tyr Gly Gly Thr Lys His

645 650 655

Gly Val Phe Thr Asp Cys Glu Gly Gln Leu Thr Asn Asp Phe Phe Val

660 665 670

Asn Leu Thr Asp Met Gly Asn Ser Trp Lys Pro Val Gly Ser Asn Ala

675 680 685

Tyr Glu Ile Arg Asp Arg Lys Thr Gly Ala Val Lys Trp Thr Ala Ser

690 695 700

Arg Val Asp Leu Val Phe Gly Ser Asn Ser Leu Leu Arg Ser Tyr Ala

705 710 715 720

Glu Val Tyr Ala Gln Asp Asp Asn Gly Glu Lys Phe Val Arg Asp Phe

725 730 735

Val Ala Ala Trp Thr Lys Val Met Asn Ala Asp Arg Phe Asp Val Ala

740 745 750

Ser

<210> 33

<211> 2238

<212> DNA

<213> 黑微颤蓝细菌(Microscilla furvescens)

<400> 33

atggaaaatc acaaacactc aggatcttct acgtataaca caaacactgg cggaaaatgc 60

ccttttaccg gaggttcgct taagcaaagt gcaggtggcg gcaccaaaaa cagggattgg 120

tggcccaaca tgctcaacct cggcatctta cgccaacatt catcgctatc ggacccaaac 180

gacccggatt ttgactatgc cgaagagttt aagaagctag atctggcagc ggttaaaaag 240

gacctggcag cgctaatgac agattcacag gactggtggc cagcagatta cggtcattat 300

ggccccttct ttatacgcat ggcgtggcac agcgccggca cctaccgtat cggtgatggc 360

cgtggtggcg gtggctccgg ctcacagcgc ttcgcgcctc tcaatagctg gccagacaat 420

gccaatctgg ataaagcacg cttgcttctt tggcccatca aacaaaaata cggtcgaaaa 480

atctcctggg cggatctaat gatactcaca ggaaacgtag ctctggaaac tatgggcttt 540

aaaacttttg gttttgcagg tggcagagca gatgtatggg agcctgaaga agatgtatac 600

tggggagcag aaaccgaatg gctgggagac aagcgctatg aaggtgaccg agagctcgaa 660

aatcccctgg gagccgtaca aatgggactc atctatgtaa accccgaagg acccaacggc 720

aagccagacc ctatcgctgc tgcgcgtgat attcgtgaga cttttggccg aatggcaatg 780

aatgacgaag aaaccgtggc tctcatagcg ggtggacaca ccttcggaaa aacccatggt 840

gctgccgatg cggagaaata tgtgggccga gagcctgccg ccgcaggtat tgaagaaatg 900

agcctggggt ggaaaaacac ctacggcacc ggacacggtg cggataccat caccagtgga 960

ctagaaggcg cctggaccaa gacccctact caatggagca ataacttttt tgaaaacctc 1020

tttggttacg agtgggagct taccaaaagt ccagctggag cttatcagtg gaaaccaaaa 1080

gacggtgccg gggctggcac cataccggat gcacatgatc ccagcaagtc gcacgctcca 1140

tttatgctca ctacggacct ggcgctgcgc atggaccctg attacgaaaa aatttctcga 1200

cggtactatg aaaaccctga tgagtttgca gatgctttcg cgaaagcatg gtacaaactg 1260

acacacagag atatgggacc aaaggtgcgc tacctgggac cagaagtgcc tcaggaagac 1320

ctcatctggc aagaccctat accagatgta agccatcctc ttgtagacga aaacgatatt 1380

gaaggcctaa aagccaaaat cctggaatcg ggactgacgg taagcgagct ggtaagcacg 1440

gcatgggctt ctgcatctac ttttagaaac tctgacaagc gcggcggtgc caacggtgca 1500

cgtatacgac tggccccaca aaaagactgg gaagtaaaca accctcagca acttgccagg 1560

gtactcaaaa cactagaagg tatccaggag gactttaacc aggcgcaatc agataacaaa 1620

gcagtatcgt tggccgacct gattgtgctg gccggctgtg cgggtgtaga aaaagctgca 1680

aaagatgctg gccatgaggt gcaggtgcct ttcaacccgg gacgagcgga tgccaccgct 1740

gagcaaaccg atgtggaagc tttcgaagca ctagagccag cggctgacgg ctttagaaac 1800

tacattaaac cggagcataa agtatccgct gaggaaatgc tcgtagaccg ggcgcagctt 1860

ctgtcgcttt cggcaccaga aatgactgct ttggtaggcg gtatgcgtgt actgggcacc 1920

aactacgacg gttcgcagca tggagtgttt acaaataagc cgggtcagct atccaatgac 1980

ttctttgtaa acctgctaga cctcaacact aaatggcgag ccagcgatga atcagacaaa 2040

gtttttgaag gcagagactt caaaactggc gaagtaaagt ggagtggcac ccgggtagac 2100

ctgatcttcg gatccaattc cgagctaaga gccctcgcag aagtgtacgg ctgtgcagat 2160

tctgaagaaa agtttgttaa agattttgtg aaggcctggg ccaaagtaat ggacctggac 2220

cggtttgatc tgaaataa 2238

<210> 34

<211> 745

<212> PRT

<213> 黑微颤蓝细菌

<400> 34

Met Glu Asn His Lys His Ser Gly Ser Ser Thr Tyr Asn Thr Asn Thr

1 5 10 15

Gly Gly Lys Cys Pro Phe Thr Gly Gly Ser Leu Lys Gln Ser Ala Gly

20 25 30

Gly Gly Thr Lys Asn Arg Asp Trp Trp Pro Asn Met Leu Asn Leu Gly

35 40 45

Ile Leu Arg Gln His Ser Ser Leu Ser Asp Pro Asn Asp Pro Asp Phe

50 55 60

Asp Tyr Ala Glu Glu Phe Lys Lys Leu Asp Leu Ala Ala Val Lys Lys

65 70 75 80

Asp Leu Ala Ala Leu Met Thr Asp Ser Gln Asp Trp Trp Pro Ala Asp

85 90 95

Tyr Gly His Tyr Gly Pro Phe Phe Ile Arg Met Ala Trp His Ser Ala

100 105 110

Gly Thr Tyr Arg Ile Gly Asp Gly Arg Gly Gly Gly Gly Ser Gly Ser

115 120 125

Gln Arg Phe Ala Pro Leu Asn Ser Trp Pro Asp Asn Ala Asn Leu Asp

130 135 140

Lys Ala Arg Leu Leu Leu Trp Pro Ile Lys Gln Lys Tyr Gly Arg Lys

145 150 155 160

Ile Ser Trp Ala Asp Leu Met Ile Leu Thr Gly Asn Val Ala Leu Glu

165 170 175

Thr Met Gly Phe Lys Thr Phe Gly Phe Ala Gly Gly Arg Ala Asp Val

180 185 190

Trp Glu Pro Glu Glu Asp Val Tyr Trp Gly Ala Glu Thr Glu Trp Leu

195 200 205

Gly Asp Lys Arg Tyr Glu Gly Asp Arg Glu Leu Glu Asn Pro Leu Gly

210 215 220

Ala Val Gln Met Gly Leu Ile Tyr Val Asn Pro Glu Gly Pro Asn Gly

225 230 235 240

Lys Pro Asp Pro Ile Ala Ala Ala Arg Asp Ile Arg Glu Thr Phe Gly

245 250 255

Arg Met Ala Met Asn Asp Glu Glu Thr Val Ala Leu Ile Ala Gly Gly

260 265 270

His Thr Phe Gly Lys Thr His Gly Ala Ala Asp Ala Glu Lys Tyr Val

275 280 285

Gly Arg Glu Pro Ala Ala Ala Gly Ile Glu Glu Met Ser Leu Gly Trp

290 295 300

Lys Asn Thr Tyr Gly Thr Gly His Gly Ala Asp Thr Ile Thr Ser Gly

305 310 315 320

Leu Glu Gly Ala Trp Thr Lys Thr Pro Thr Gln Trp Ser Asn Asn Phe

325 330 335

Phe Glu Asn Leu Phe Gly Tyr Glu Trp Glu Leu Thr Lys Ser Pro Ala

340 345 350

Gly Ala Tyr Gln Trp Lys Pro Lys Asp Gly Ala Gly Ala Gly Thr Ile

355 360 365

Pro Asp Ala His Asp Pro Ser Lys Ser His Ala Pro Phe Met Leu Thr

370 375 380

Thr Asp Leu Ala Leu Arg Met Asp Pro Asp Tyr Glu Lys Ile Ser Arg

385 390 395 400

Arg Tyr Tyr Glu Asn Pro Asp Glu Phe Ala Asp Ala Phe Ala Lys Ala

405 410 415

Trp Tyr Lys Leu Thr His Arg Asp Met Gly Pro Lys Val Arg Tyr Leu

420 425 430

Gly Pro Glu Val Pro Gln Glu Asp Leu Ile Trp Gln Asp Pro Ile Pro

435 440 445

Asp Val Ser His Pro Leu Val Asp Glu Asn Asp Ile Glu Gly Leu Lys

450 455 460

Ala Lys Ile Leu Glu Ser Gly Leu Thr Val Ser Glu Leu Val Ser Thr

465 470 475 480

Ala Trp Ala Ser Ala Ser Thr Phe Arg Asn Ser Asp Lys Arg Gly Gly

485 490 495

Ala Asn Gly Ala Arg Ile Arg Leu Ala Pro Gln Lys Asp Trp Glu Val

500 505 510

Asn Asn Pro Gln Gln Leu Ala Arg Val Leu Lys Thr Leu Glu Gly Ile

515 520 525

Gln Glu Asp Phe Asn Gln Ala Gln Ser Asp Asn Lys Ala Val Ser Leu

530 535 540

Ala Asp Leu Ile Val Leu Ala Gly Cys Ala Gly Val Glu Lys Ala Ala

545 550 555 560

Lys Asp Ala Gly His Glu Val Gln Val Pro Phe Asn Pro Gly Arg Ala

565 570 575

Asp Ala Thr Ala Glu Gln Thr Asp Val Glu Ala Phe Glu Ala Leu Glu

580 585 590

Pro Ala Ala Asp Gly Phe Arg Asn Tyr Ile Lys Pro Glu His Lys Val

595 600 605

Ser Ala Glu Glu Met Leu Val Asp Arg Ala Gln Leu Leu Ser Leu Ser

610 615 620

Ala Pro Glu Met Thr Ala Leu Val Gly Gly Met Arg Val Leu Gly Thr

625 630 635 640

Asn Tyr Asp Gly Ser Gln His Gly Val Phe Thr Asn Lys Pro Gly Gln

645 650 655

Leu Ser Asn Asp Phe Phe Val Asn Leu Leu Asp Leu Asn Thr Lys Trp

660 665 670

Arg Ala Ser Asp Glu Ser Asp Lys Val Phe Glu Gly Arg Asp Phe Lys

675 680 685

Thr Gly Glu Val Lys Trp Ser Gly Thr Arg Val Asp Leu Ile Phe Gly

690 695 700

Ser Asn Ser Glu Leu Arg Ala Leu Ala Glu Val Tyr Gly Cys Ala Asp

705 710 715 720

Ser Glu Glu Lys Phe Val Lys Asp Phe Val Lys Ala Trp Ala Lys Val

725 730 735

Met Asp Leu Asp Arg Phe Asp Leu Lys

740 745

<210> 35

<211> 3108

<212> DNA

<213> 黑曲霉

<400> 35

cttgtcaccg agtgcccgtt tgtcacttgt tgtggtgatc ttgagcacat cgcgttcctc 60

tcgtctcatc acatcgagtg atcaacattg catgacccta gtggagcccc ttcgtctccc 120

aacaggaggg tccggattac caagtcccga caccgtttgg ctgtaattcg actcaaattc 180

tggattcgta gcttaactaa gacgcgtggt ctgttaaccg gcctcgccat ggatgccgat 240

ataaggaccc taggggactc ccccctggtg actctcgtcg gaagatcgca gcactctgaa 300

ttctcctagt cttcgtttac tccgccatgc gtcatttctg ccttttgcca gctgttgctg 360

gtatcgctgg ggctcaatgc ccctacctgt cgggtgaaat gagtttcacc caggagcagg 420

acaatgctgg cgataccatt gaggtcacgg agcagcccat tgacaacacc ctgtatgtca 480

atgacaccgg tagctacatg actaccgact ttggcactcc gatctccgac cagaccagtc 540

tcaaggccgg gccccgtggt cctaccctgt tggaggactt tatcttccgt cagaagcttc 600

agcggttcga ccatgagcgt gtaagtacag taactgctgc ggtgtgtagt aacaataaat 660

tgacccagtg gttttcaatt aggtccccga gcgcgtcgtc cacgcccgtg gtgccggtgc 720

atatggtact ttcaaatcct acgccgactg gtcgaacgtc acggctgccg atttcttgag 780

tgccaacgat aaggagagcc cctatgttct gtcgcttctc tactgtggtc ggtttccgtg 840

gtagtgttga cactgcgcgt gatgttcacg gtcacgcttg tcggttctac actgacgagg 900

gtaactatgg tatcttgata tggtcaccca acaataattc aatacatgct aacagatatg 960

tctctactag acatcgtcgg tatcaatttc gcccccttct tcatccagga cgccatccag 1020

ttccccgatc ttgtccacgc catcaagccc atgcccaaca atgagatccc ccaggccgct 1080

actgcacaca cttccgcttg ggacttcttc agccagcaga gcactgccct ccacagtgcc 1140

ttgtggctga tgtctggtaa cggtattcct cgttctttcc gccacatgaa cggctacgga 1200

gtccacagct tccgcttcgt cgctgccaat ggcacttcca aggtggtgcg aacaccttgg 1260

aagtcccaac agggtgttgc cagtctggtg tgggatgaag ctcaggccgc tgctggtaag 1320

aacagtgact accaccgcca ggatctgtac aatgcgatgc ccaatggcca ctacccgaaa 1380

tacgaggtca gccaatccct tgatgtctat cgatagagcc ttttgctgac aatcccctag 1440

gtccaagccc agatcatgga tgaggctgac atgcttcgtt tcggcttcga ccttctggat 1500

cccaccaagt tggtccccga ggaggttgtc ccttacactc ctctcggaat gatggagctc 1560

aatgccaacc ccaccaacta ctttgctgaa gttgaacagg ctggtgtatg tattccccat 1620

tcatcaaatg ccagacataa tctaacttct gcagttccaa cccggtcacg tcgttcctgg 1680

cattgacttc accgacgacc ccctgctgca aggccgtctc ttctcctacc tcgacactca 1740

gttgacccgt cacggcggtc ccaacttcga gcaaatcccc gtcaaccgtc ctcgcaagcc 1800

cgttcacaac aacaaccgtg acggcttcgg ccagcagcag atccccacca acaactgggc 1860

ctacaccccc aacagcatga gcaacggtta ccccatgcaa gccaaccaga cccagggtca 1920

tggtttcttc accgcgccct accgctacgc ttccggccat ctcgtccgcc agaccagccc 1980

gaccttcaat gaccactggt cccagcccgc catgttctgg aactctctga tccccgctga 2040

gcagcagatg gttgtcaacg ccattgtctt tgagaactcc aaggttaaca gcccccacgt 2100

tcggaagaac gttgtcaacc agctgaacat ggtcaacaac aacctcgccg tccgtgtcgc 2160

tcgtggtctt ggtctcgatg agccctcccc caacccgact tactacacct ccaacaagac 2220

ctccaacgtc ggtaccttcg gcaagcccct cctcagcatc gagggtctgc aggtcggctt 2280

cctggcctcg aactcccacc ccgaatccat caagcagggc caggccatgg ccgcgcagtt 2340

ctctgccgct ggcgtcgacc tgaacattgt caccgaggcc tacgccgatg gtgtcaacac 2400

cacctacgcc ctgtctgatg ccatcgactt tgacgccctc atcatcgccg atggtgtgca 2460

gagcctcttc gcctcccccg ctctcgctaa ccagatgaac tctaccgcca cctctactct 2520

ctaccctcct gccagacctt tccagatcct ggtcgattct ttcaggtacg gtaagcccgt 2580

ggctgctgtc ggcagtggca gtgttgcgct caagaacgct ggtattgatt cctcccgctc 2640

tggtgtgtac actggctcga gcgagacgac ggagaagatc gccaaggagg tcttggaggg 2700

actctacact ttccgttttg tggaccggtt tgcgctggat gagtaagggt atcacgtttg 2760

tacttgtact cacgttcatc gtttgtgatg atacattgat tgatcgatag atattttgtg 2820

agatagatag agtatactag agwgkacata tctctactga tgaggtgttg tgctgctgca 2880

acacatattt atgaatatat attctcttct ttgtgaaagc tagccttcta tataatcagc 2940

aatggttaac tcttccaatt ctatagatac caatcaccta acccactcgg aatgacgaca 3000

gaaaacatcg acatgttcgc ccaagtaaag ctacttgaac ttctacattt atgctatgct 3060

ggagtcctct cataagtcca gaataaacaa agagatccga tcctgctc 3108

<210> 36

<211> 729

<212> PRT

<213> 黑曲霉

<400> 36

Met Arg His Phe Trp Leu Leu Pro Ala Val Ala Gly Ile Ala Gly Ala

1 5 10 15

Gln Cys Pro Tyr Leu Ser Gly Glu Met Ser Phe Thr Gln Glu Gln Asp

20 25 30

Asn Ala Gly Asp Thr Ile Glu Val Thr Glu Gln Pro Ile Asp Asn Thr

35 40 45

Leu Tyr Val Asn Asp Thr Gly Ser Tyr Met Thr Thr Asp Phe Gly Thr

50 55 60

Pro Ile Ser Asp Gln Thr Ser Leu Lys Ala Gly Pro Arg Gly Pro Thr

65 70 75 80

Leu Leu Glu Asp Phe Ile Phe Arg Gln Lys Leu Gln Arg Phe Asp His

85 90 95

Glu Arg Val Pro Glu Arg Val Val His Ala Arg Gly Gly Ala Tyr Gly

100 105 110

Thr Phe Lys Ser Tyr Ala Asp Trp Ser Asn Val Thr Ala Ala Asp Phe

115 120 125

Leu Ser Ala Asn Asp Lys Glu Thr Pro Met Phe Cys Arg Phe Ser Thr

130 135 140

Val Val Gly Phe Arg Gly Ser Val Asp Thr Ala Arg Asp Val His Gly

145 150 155 160

His Ala Cys Arg Phe Tyr Thr Asp Glu Gly Asn Tyr Asp Ile Val Gly

165 170 175

Ile Asn Phe Ala Pro Phe Phe Ile Gln Asp Ala Ile Gln Phe Pro Asp

180 185 190

Leu Val His Ala Ile Lys Pro Met Pro Asn Asn Glu Ile Pro Gln Ala

195 200 205

Ala Thr Ala His Thr Ser Ala Trp Asp Phe Phe Ser Gln Gln Ser Thr

210 215 220

Ala Leu His Ser Ala Leu Trp Leu Met Ser Gly Asn Gly Ile Pro Arg

225 230 235 240

Ser Phe Arg His Met Asn Gly Tyr Gly Val His Ser Phe Arg Phe Val

245 250 255

Ala Ala Asn Gly Thr Ser Lys Val Val Arg Thr Pro Trp Lys Ser Gln

260 265 270

Gln Gly Val Ala Ser Leu Val Trp Asp Glu Ala Gln Ala Ala Ala Gly

275 280 285

Lys Asn Ser Asp Tyr His Arg Gln Asp Leu Tyr Asn Ala Met Pro Asn

290 295 300

Gly His Tyr Pro Lys Tyr Glu Leu Gln Ala Gln Ile Met Asp Glu Ala

305 310 315 320

Asp Met Leu Arg Phe Gly Phe Asp Leu Leu Asp Pro Thr Lys Leu Val

325 330 335

Pro Glu Glu Val Val Pro Tyr Thr Pro Leu Gly Met Met Glu Leu Asn

340 345 350

Ala Asn Pro Thr Asn Tyr Phe Ala Glu Val Glu Gln Ala Gly Phe Gln

355 360 365

Pro Gly His Val Val Pro Gly Ile Asp Phe Thr Asp Asp Pro Leu Leu

370 375 380

Gln Gly Arg Leu Phe Ser Tyr Leu Asp Thr Gln Leu Thr Arg His Gly

385 390 395 400

Gly Pro Asn Phe Glu Gln Ile Pro Val Asn Arg Pro Arg Lys Pro Val

405 410 415

His Asn Asn Asn Arg Asp Gly Phe Gly Gln Gln Gln Ile Pro Thr Asn

420 425 430

Asn Trp Ala Tyr Thr Pro Asn Ser Met Ser Asn Gly Tyr Pro Met Gln

435 440 445

Ala Asn Gln Thr Gln Gly His Gly Phe Phe Thr Ala Pro Tyr Arg Tyr

450 455 460

Ala Ser Gly His Leu Val Arg Gln Thr Ser Pro Thr Phe Asn Asp His

465 470 475 480

Trp Ser Gln Pro Ala Met Phe Trp Asn Ser Leu Ile Pro Ala Glu Gln

485 490 495

Gln Met Val Val Asn Ala Ile Val Phe Glu Asn Ser Lys Val Asn Ser

500 505 510

Pro His Val Arg Lys Asn Val Val Asn Gln Leu Asn Met Val Asn Asn

515 520 525

Asn Leu Ala Val Arg Val Ala Arg Gly Leu Gly Leu Asp Glu Pro Ser

530 535 540

Pro Asn Pro Thr Tyr Tyr Thr Ser Asn Lys Thr Ser Asn Val Gly Thr

545 550 555 560

Phe Gly Lys Pro Leu Leu Ser Ile Glu Gly Leu Gln Val Gly Phe Leu

565 570 575

Ala Ser Asn Ser His Pro Glu Ser Ile Lys Gln Gly Gln Ala Met Ala

580 585 590

Ala Gln Phe Ser Ala Ala Gly Val Asp Leu Asn Ile Val Thr Glu Ala

595 600 605

Tyr Ala Asp Gly Val Asn Thr Thr Tyr Ala Leu Ser Asp Ala Ile Asp

610 615 620

Phe Asp Ala Leu Ile Ile Ala Asp Gly Val Gln Ser Leu Phe Ala Ser

625 630 635 640

Pro Ala Leu Ala Asn Gln Met Asn Ser Thr Ala Thr Ser Thr Leu Tyr

645 650 655

Pro Pro Ala Arg Pro Phe Gln Ile Leu Val Asp Ser Phe Arg Tyr Gly

660 665 670

Lys Pro Val Ala Ala Val Gly Ser Gly Ser Val Ala Leu Lys Asn Ala

675 680 685

Gly Ile Asp Ser Ser Arg Ser Gly Val Tyr Thr Gly Ser Ser Glu Thr

690 695 700

Thr Glu Lys Ile Ala Lys Glu Val Leu Glu Gly Leu Tyr Thr Phe Arg

705 710 715 720

Phe Val Asp Arg Phe Ala Leu Asp Glu

725

<210> 37

<211> 684

<212> PRT

<213> 灰腐质霉

<400> 37

Met Asn Arg Val Thr Asn Leu Leu Ala Trp Ala Gly Ala Ile Gly Leu

1 5 10 15

Ala Gln Ala Thr Cys Pro Phe Ala Asp Pro Ala Ala Leu Tyr Arg Arg

20 25 30

Gln Asp Thr Thr Ser Gly Gln Ser Pro Leu Ala Ala Tyr Glu Val Asp

35 40 45

Asp Ser Thr Gly Tyr Leu Thr Ser Asp Val Gly Gly Pro Ile Gln Asp

50 55 60

Gln Thr Ser Leu Lys Ala Gly Ile Arg Gly Pro Thr Leu Leu Glu Asp

65 70 75 80

Phe Met Phe Arg Gln Lys Ile Gln His Phe Asp His Glu Arg Val Pro

85 90 95

Glu Arg Ala Val His Ala Arg Gly Ala Gly Ala His Gly Thr Phe Thr

100 105 110

Ser Tyr Ala Asp Trp Ser Asn Ile Thr Ala Ala Ser Phe Leu Asn Ala

115 120 125

Thr Gly Lys Gln Thr Pro Val Phe Val Arg Phe Ser Thr Val Ala Gly

130 135 140

Ser Arg Gly Ser Ala Asp Thr Ala Arg Asp Val His Gly Phe Ala Thr

145 150 155 160

Arg Phe Tyr Thr Asp Glu Gly Asn Phe Asp Ile Val Gly Asn Asn Ile

165 170 175

Pro Val Phe Phe Ile Gln Asp Ala Ile Gln Phe Pro Asp Leu Ile His

180 185 190

Ser Val Lys Pro Ser Pro Asp Asn Glu Ile Pro Gln Ala Ala Thr Ala

195 200 205

His Asp Ser Ala Trp Asp Phe Phe Ser Gln Gln Pro Ser Ala Met His

210 215 220

Thr Leu Phe Trp Ala Met Ser Gly His Gly Ile Pro Arg Ser Tyr Arg

225 230 235 240

His Met Asp Gly Phe Gly Val His Thr Phe Arg Phe Val Lys Asp Asp

245 250 255

Gly Ser Ser Lys Leu Ile Lys Trp His Phe Lys Ser Arg Gln Gly Lys

260 265 270

Ala Ser Leu Val Trp Glu Glu Ala Gln Val Leu Ser Gly Lys Asn Ala

275 280 285

Asp Phe His Arg Gln Asp Leu Trp Asp Ala Ile Glu Ser Gly Asn Gly

290 295 300

Pro Glu Trp Asp Val Cys Val Gln Ile Val Asp Glu Ser Gln Ala Gln

305 310 315 320

Ala Phe Gly Phe Asp Leu Leu Asp Pro Thr Lys Ile Ile Pro Glu Glu

325 330 335

Tyr Ala Pro Leu Thr Lys Leu Gly Leu Leu Lys Leu Asp Arg Asn Pro

340 345 350

Thr Asn Tyr Phe Ala Glu Thr Glu Gln Val Met Phe Gln Pro Gly His

355 360 365

Ile Val Arg Gly Val Asp Phe Thr Glu Asp Pro Leu Leu Gln Gly Arg

370 375 380

Leu Phe Ser Tyr Leu Asp Thr Gln Leu Asn Arg Asn Gly Gly Pro Asn

385 390 395 400

Phe Glu Gln Leu Pro Ile Asn Met Pro Arg Val Pro Ile His Asn Asn

405 410 415

Asn Arg Asp Gly Ala Gly Gln Met Phe Ile His Arg Asn Lys Tyr Pro

420 425 430

Tyr Thr Pro Asn Thr Leu Asn Ser Gly Tyr Pro Arg Gln Ala Asn Gln

435 440 445

Asn Ala Gly Arg Gly Phe Phe Thr Ala Pro Gly Arg Thr Val Ser Gly

450 455 460

Ala Leu Val Arg Glu Val Ser Pro Thr Phe Asn Asp His Trp Ser Gln

465 470 475 480

Pro Arg Leu Phe Phe Asn Ser Leu Thr Pro Val Glu Gln Gln Phe Leu

485 490 495

Val Asn Ala Met Arg Phe Glu Ile Ser Leu Val Lys Ser Glu Glu Cys

500 505 510

Arg Lys Asn Val Leu Thr Gln Leu Asn Arg Val Ser His Asp Val Ala

515 520 525

Val Arg Val Ala Ala Ala Ile Gly Leu Ala Ala Pro Asp Ala Asp Asp

530 535 540

Thr Tyr Tyr His Asn Asn Lys Thr Ala Gly Val Ser Ile Leu Gly Ser

545 550 555 560

Gly Pro Leu Pro Thr Ile Lys Thr Leu Arg Val Gly Ile Leu Ala Thr

565 570 575

Thr Ser Glu Ser Ser Ala Leu Asp Gln Ala Ala Gln Leu Arg Thr Arg

580 585 590

Leu Glu Lys Asp Gly Leu Val Val Thr Val Val Ala Glu Thr Leu Arg

595 600 605

Glu Gly Val Asp Gln Thr Tyr Ser Thr Ala Asp Ala Thr Gly Phe Asp

610 615 620

Gly Val Val Val Val Asp Gly Ala Ala Ala Leu Phe Ala Ser Thr Ala

625 630 635 640

Ser Ser Pro Leu Phe Pro Thr Gly Arg Pro Leu Gln Ile Phe Val Asp

645 650 655

Ala Tyr Arg Trp Gly Lys Pro Val Gly Val Cys Gly Gly Lys Ser Ser

660 665 670

Glu Val Leu Asp Ala Ala Asp Val Pro Glu Asn Gly

675 680

<210> 38

<211> 40

<212> DNA

<213> 人工序列

<220>

<223> 合成的结构

<400> 38

acacaactgg ggatccacca tgcgaggggc atactctctc 40

<210> 39

<211> 43

<212> DNA

<213> 人工序列

<220>

<223> 合成的结构

<400> 39

gtcaccctct agatctaaca agttactcgt gttaatcgtg gaa 43

<210> 40

<211> 44

<212> DNA

<213> 人工序列

<220>

<223> 合成的结构

<400> 40

acacaactgg ggatccacca tgaacagagt cacgaatctc ctcg 44

<210> 41

<211> 43

<212> DNA

<213> 人工序列

<220>

<223> 合成的结构

<400> 41

gtcaccctct agatctggta caactcccac cctattcctt ctc 43

<210> 42

<211> 36

<212> DNA

<213> 人工序列

<220>

<223> 合成的结构

<400> 42

acacaactgg ggatccacca tgcgcgcagt gcagct 36

<210> 43

<211> 47

<212> DNA

<213> 人工序列

<220>

<223> 合成的结构

<400> 43

gtcaccctct agatctgtcg actattccaa ccttcctata tggacac 47

Claims

1.一种用于降解或转化纤维素材料的方法，其包括：在具有过氧化氢酶活性的多肽的存在下用酶组合物处理纤维素材料。

2.权利要求1的方法，其中所述酶组合物包含一种或多种(例如几种)选自下组的酶：纤维素酶、具有纤维素分解增强活性的GH61多肽，半纤维素酶、酯酶、棒曲霉素、漆酶、木质素分解酶、果胶酶、过氧化物酶、蛋白酶和膨胀素。

3.权利要求1或2的方法，其中所述纤维素材料选自下组：农业残余物、草本材料、城市固体废物、纸浆与造纸厂残余物、废纸和木材；优选芦竹、甘蔗渣、竹、玉米穗轴、玉米纤维、玉米秸秆、芒草属植物、橙皮、稻杆、柳枝稷、麦杆、桉树、枞树、松树、杨树、云杉、柳树、藻类纤维素、细菌纤维素、棉绒、滤纸、微晶纤维素或磷酸处理的纤维素。

4.权利要求1-3任一项的方法，其中所述纤维素材料被预处理，特别是通过化学预处理、物理预处理或生物化学预处理而被预处理。

5.权利要求1-4任一项的方法，其中所述具有过氧化氢酶活性的多肽选自下组：

(a)多肽，其与SEQ ID NO:2的成熟多肽、SEQ ID NO:4的成熟多肽、SEQID NO:6的成熟多肽、或SEQ ID NO:8的成熟多肽具有至少60％序列同一性；

(b)多肽，其由在低、中等、中等-高、高或非常高严格条件下与以下杂交的多核苷酸编码：(i)SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、或SEQ IDNO:7的成熟多肽编码序列，(ii)它们的cDNA序列，或(iii)(i)或(ii)的全长互补链；

(c)多肽，其由与以下具有至少60％序列同一性的多核苷酸编码：SEQ IDNO:1的成熟多肽编码序列、SEQ ID NO:3的成熟多肽编码序列、SEQ ID NO:5的成熟多肽编码序列、或SEQID NO:7的成熟多肽编码序列，或其cDNA序列；

(e)(a)、(b)、(c)或(d)的多肽的具有过氧化氢酶活性的片段。

6.权利要求1-5任一项的方法，其中所述具有过氧化氢酶活性的多肽是来自嗜热子囊菌属(Thermoascus)、踝节菌属(Talaromyces)、腐质霉属(Humicola)或青霉属(Penicillium)的过氧化氢酶。

7.一种用于产生发酵产物的方法，其包括：

(c)从发酵回收发酵产物。

8.权利要求7的方法，其中所述酶组合物包含一种或多种(例如几种)选自下组的酶：纤维素酶、具有纤维素分解增强活性的GH61多肽，半纤维素酶、酯酶、棒曲霉素、漆酶、木质素分解酶、果胶酶、过氧化物酶、蛋白酶和膨胀素。

9.权利要求7或8的方法，其中所述纤维素材料选自下组：农业残余物、草本材料、城市固体废物、纸浆与造纸厂残余物、废纸和木材；优选芦竹、甘蔗渣、竹、玉米穗轴、玉米纤维、玉米秸秆、芒草属植物、橙皮、稻杆、柳枝稷、麦杆、桉树、枞树、松树、杨树、云杉、柳树、藻类纤维素、细菌纤维素、棉绒、滤纸、微晶纤维素或磷酸处理的纤维素。

10.权利要求7-9任一项的方法，其中所述发酵产物是醇、烷烃、环烷烃、烯烃、氨基酸、气体、异戊二烯、酮、有机酸或聚酮化合物。

11.权利要求7-10任一项的方法，其中与不存在具有过氧化氢酶活性的多肽相比，具有过氧化氢酶活性的多肽的存在增加纤维素材料的水解。

12.权利要求7-11任一项的方法，其中所述具有过氧化氢酶活性的多肽选自下组：

(e)(a)、(b)、(c)或(d)的多肽具有过氧化氢酶活性的片段。

13.权利要求7-12任一项的方法，其中所述具有过氧化氢酶活性的多肽是来自嗜热子囊菌属、踝节菌属、腐质霉属或青霉属的过氧化氢酶。

14.一种发酵纤维素材料的方法，其包括用一种或多种(例如几种)发酵微生物发酵所述纤维素材料，其中所述纤维素材料在具有过氧化氢酶活性的多肽的存在下用酶组合物水解。

15.权利要求14的方法，其中所述酶组合物包含一种或多种(例如几种)选自下组的酶：纤维素酶、具有纤维素分解增强活性的GH61多肽，半纤维素酶、酯酶、棒曲霉素、漆酶、木质素分解酶、果胶酶、过氧化物酶、蛋白酶和膨胀素。

16.权利要求14或15的方法，其中所述纤维素材料选自下组：农业残余物、草本材料、城市固体废物、纸浆与造纸厂残余物、废纸和木材；优选芦竹、甘蔗渣、竹、玉米穗轴、玉米纤维、玉米秸秆、芒草属植物、橙皮、稻杆、柳枝稷、麦杆、桉树、枞树、松树、杨树、云杉、柳树、藻类纤维素、细菌纤维素、棉绒、滤纸、微晶纤维素或磷酸处理的纤维素。

17.权利要求14-16任一项的方法，其中具有过氧化氢酶活性的多肽选自下组：

(b)多肽，其由多核苷酸编码，所述多核苷酸在低、中等、中等-高、高或非常高严格条件下与以下杂交：(i)SEQ ID NO:1、SEQ ID NO:3、SEQ ID NO:5、或SEQ ID NO:7的成熟多肽编码序列，(ii)它们的cDNA序列，或(iii)(i)或(ii)的全长互补链；

(e)(a)、(b)、(c)或(d)的多肽的具有过氧化氢酶活性的片段。

18.权利要求14-17任一项的方法，其中所述具有过氧化氢酶活性的多肽是来自嗜热子囊菌属、踝节菌属、腐质霉属或青霉属的过氧化氢酶。

19.一种用于降解或转化纤维素材料的酶组合物，其包含一种或多种(例如几种)具有纤维素分解和/或半纤维素分解活性的酶，和具有过氧化氢酶活性的多肽。

20.权利要求19的酶组合物，其进一步包含一种或多种(例如几种)选自下组的酶：具有纤维素分解增强活性的GH61多肽、酯酶、棒曲霉素、漆酶、木质素分解酶、果胶酶、过氧化物酶、蛋白酶和膨胀素。

21.权利要求19或20的酶组合物，其中所述具有过氧化氢酶活性的多肽选自下组：

(c)多肽，其由与下述具有至少60％序列同一性的多核苷酸编码：SEQ ID NO:1的成熟多肽编码序列、SEQ ID NO:3的成熟多肽编码序列、SEQ ID NO:5的成熟多肽编码序列、或SEQ ID NO:7的成熟多肽编码序列，或其cDNA序列；

(e)(a)、(b)、(c)或(d)的多肽的具有过氧化氢酶活性的片段。

22.权利要求19-21任一项的酶组合物，其中所述具有过氧化氢酶活性的多肽是来自嗜热子囊菌属、踝节菌属、腐质霉属或青霉属的过氧化氢酶。

23.权利要求19-22任一项的酶组合物在降解或转化纤维素材料中的用途。

24.权利要求23的用途，其中所述纤维素材料选自下组：农业残余物、草本材料、城市固体废物、纸浆与造纸厂残余物、废纸和木材；优选芦竹、甘蔗渣、竹、玉米穗轴、玉米纤维、玉米秸秆、芒草属植物、橙皮、稻杆、柳枝稷、麦杆、桉树、枞树、松树、杨树、云杉、柳树、藻类纤维素、细菌纤维素、棉绒、滤纸、微晶纤维素或磷酸处理的纤维素。

25.一种全培养液配制物或细胞培养组合物，其包含一种或多种(例如几种)具有纤维素分解和/或半纤维素分解活性的酶，和具有过氧化氢酶活性的多肽。