CN103237891B - 具有纤维素分解增强活性的多肽变体及其编码多核苷酸 - Google Patents

具有纤维素分解增强活性的多肽变体及其编码多核苷酸 Download PDF

Info

Publication number
CN103237891B
CN103237891B CN201180057773.8A CN201180057773A CN103237891B CN 103237891 B CN103237891 B CN 103237891B CN 201180057773 A CN201180057773 A CN 201180057773A CN 103237891 B CN103237891 B CN 103237891B
Authority
CN
China
Prior art keywords
variant
another aspect
parent
polypeptide
acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201180057773.8A
Other languages
English (en)
Other versions
CN103237891A (zh
Inventor
M.斯维尼
M.沃古利斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Novozymes Inc
Original Assignee
Novozymes Biotech Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Novozymes Biotech Inc filed Critical Novozymes Biotech Inc
Priority to CN201710470220.4A priority Critical patent/CN107345226A/zh
Publication of CN103237891A publication Critical patent/CN103237891A/zh
Application granted granted Critical
Publication of CN103237891B publication Critical patent/CN103237891B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2434Glucanases acting on beta-1,4-glucosidic bonds
    • C12N9/2437Cellulases (3.2.1.4; 3.2.1.74; 3.2.1.91; 3.2.1.150)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8201Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation
    • C12N15/8202Methods for introducing genetic material into plant cells, e.g. DNA, RNA, stable or transient incorporation, tissue culture methods adapted for transformation by biological means, e.g. cell mediated or natural vector
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/14Preparation of compounds containing saccharide radicals produced by the action of a carbohydrase (EC 3.2.x), e.g. by alpha-amylase, e.g. by cellulase, hemicellulase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01004Cellulase (3.2.1.4), i.e. endo-1,4-beta-glucanase
    • DTEXTILES; PAPER
    • D21PAPER-MAKING; PRODUCTION OF CELLULOSE
    • D21CPRODUCTION OF CELLULOSE BY REMOVING NON-CELLULOSE SUBSTANCES FROM CELLULOSE-CONTAINING MATERIALS; REGENERATION OF PULPING LIQUORS; APPARATUS THEREFOR
    • D21C5/00Other processes for obtaining cellulose, e.g. cooking cotton linters ; Processes characterised by the choice of cellulose-containing starting materials
    • D21C5/005Treatment of cellulose-containing material with microorganisms or enzymes

Abstract

本发明涉及具有纤维素分解增强活性的多肽的变体。本发明亦涉及编码变体的多核苷酸;包含所述多核苷酸的核酸构建体、载体和宿主细胞;和使用所述变体的方法。

Description

具有纤维素分解增强活性的多肽变体及其编码多核苷酸
对于在联邦资助的研究和开发下完成的发明的权利的声明
该发明是在由能源部授予的Cooperative Agreement DE-FC36-08GO18080下以政府支持完成的。政府在该发明中具有一定权利。
对相关申请的交叉引用
该申请要求2010年9月30日提交的美国临时申请系列号61/388,527的权益,其通过提述并入本文。
涉及序列表
本申请包含计算机可读形式的序列表,其通过提述并入本文。
发明背景
技术领域
本发明涉及具有纤维素分解增强活性的多肽变体,编码所述变体的多核苷酸,产生所述变体的方法,和使用所述变体的方法。
背景技术
纤维素是单糖葡萄糖通过β-1,4-键共价连接的聚合物。许多微生物产生水解β-连接的葡聚糖的酶。这些酶包括内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶。内切葡聚糖酶在随机位置消化纤维素聚合物,使其暴露于纤维二糖水解酶攻击(attack)。纤维二糖水解酶从纤维素聚合物的末端顺序地释放纤维二糖的分子。纤维二糖是水溶性的β-1,4-连接的葡萄糖二聚体。β-葡糖苷酶将纤维二糖水解成葡萄糖。
将含木素纤维素原料(lignocellulosic feedstock)转化为乙醇具有以下优势:大量原料现成可用,避免燃烧或填埋材料的合意性和乙醇燃料的清洁性。木材、农业残余物、草本作物和城市固体废物被认为是用于乙醇生产的原料。这些材料主要由纤维素、半纤维素和木质素组成。一旦将纤维素转化成葡萄 糖,葡萄糖容易地由酵母发酵成乙醇。
WO2005/074647,WO2008/148131,WO2011/035027公开了来自土生梭孢霉(Thielavia terrestris)的具有纤维素分解增强活性的GH61多肽及其多核苷酸。WO2005/074656and WO2010/065830公开了来自橙橘嗜热子囊菌(Thermoascus aurantiacus)的具有纤维素分解增强活性的GH61多肽及其多核苷酸。WO2007/089290公开了来自里氏木霉(Trichoderma reesei)的具有纤维素分解增强活性的GH61多肽及其多核苷酸。WO2009/085935,WO2009/085859,WO2009/085864,和WO2009/085868公开了来自嗜热毁丝霉(Myceliophthora thermophila)的具有纤维素分解增强活性的GH61多肽及其多核苷酸。WO2010/138754公开了来自烟曲霉(Aspergillus fumigatus)的具有纤维素分解增强活性的分离的GH61多肽及其多核苷酸。WO2011/005867公开了来自嗜松青霉(Penicilliumpinophilum)的具有纤维素分解增强活性的分离的GH61多肽及其多核苷酸。WO2011/039319公开了来自嗜热子囊菌属菌种(Thermoascus sp)的具有纤维素分解增强活性的分离的GH61多肽及其多核苷酸。WO2011/041397公开了来自青霉属菌种(Penicillium sp)的具有纤维素分解增强活性的分离的GH61多肽及其多核苷酸。WO2011/041504公开了来自甲壳嗜热子囊菌(Thermoascus crustaceous)的具有纤维素分解增强活性的分离的GH61多肽及其多核苷酸。WO 2008/151043公开了通过将可溶性活化二价金属阳离子添加至包含具有纤维素分解增强活性的GH61多肽的组合物来增加该多肽的活性的方法。
在本领域中,改善具有纤维素分解增强活性的多肽增强木素纤维素原料的酶降解的能力会是有利的。
本发明提供了具有改善的性质的具有纤维素分解增强活性的多肽。
发明内容
本发明涉及分离的β-葡糖苷酶变体,其在对应于SEQ ID NO:2的成熟多肽的位置75,77,179,181,和183的一个或多个(例如几个)位置包含取代,其中所述变体具有纤维素分解增强活性。
本发明亦涉及编码所述变体的分离的多核苷酸;包含所述多核苷酸的核酸构建体、载体和宿主细胞;以及产生所述变体的方法。
本发明亦涉及用于降解或转化纤维素材料的方法,其包括:在此种具有纤维素分解增强活性的变体的存在下用酶组合物处理所述纤维素材料。
本发明亦涉及用于产生发酵产物的方法,其包括:
(a)在此种具有纤维素分解增强活性的变体的存在下用酶组合物糖化纤维素材料;
(b)用一种或多种(例如几种)发酵微生物发酵经糖化的纤维素材料以产生发酵产物;和
(c)从发酵回收所述发酵产物。
本发明亦涉及发酵纤维素材料的方法,其包括用一种或多种(例如几种)发酵微生物发酵所述纤维素材料,其中所述纤维素材料在此种具有纤维素分解增强活性的变体的存在下用酶组合物糖化。
附图说明
图1显示通过连苯三酚和烟曲霉CEL3Aβ-葡糖苷酶的组合;连苯三酚,烟曲霉GH61B野生型多肽,和烟曲霉CEL3Aβ-葡糖苷酶;以及连苯三酚,烟曲霉GH61B变体I75V+F77L+F179I+I181L+I183V,和烟曲霉CEL3Aβ-葡糖苷酶所致的磷酸溶胀的纤维素(0.5%w/w)的转化。
图2A和2B显示烟曲霉GH61B野生型多肽和烟曲霉GH61B变体I75V+F77L+F179I+I181L+I183V对里氏木霉纤维素酶组合物和烟曲霉CEL3Aβ-葡糖苷酶的组合在50℃或55℃转化经预处理的的玉米秸秆(PCS)的作用。
图3A和3B显示GH61B野生型多肽和烟曲霉GH61B变体I75V+F77L+F179I+I181L+I183V对高温纤维素酶组合物和烟曲霉CEL3Aβ-葡糖苷酶的组合在50℃,55℃,60℃或65℃PCS的作用。
图4A和4B显示通过差示扫描量热法所得的烟曲霉野生型GH61B多肽和烟曲霉GH61B变体I75V+F77L+F179I+I181L+I183V的Td(变性温度)。
定义
乙酰木聚糖酯酶:术语“乙酰木聚糖酯酶”意指羧基酯酶(EC3.1.1.72),其催化乙酰基从聚合木聚糖、乙酰化木糖、乙酰化葡萄糖、乙酸α-萘酯(alpha-napthyl acetate)和乙酸对硝基苯酯(p-nitrophenyl acetate)的水解。就本发明而言,乙酰木聚糖酯酶活性是使用含有0.01%TWEENTM20(聚氧乙烯山梨坦单月桂酸酯)的50mM乙酸钠pH5.0中的0.5mM乙酸对硝基苯酯作为底物确定的。一个单位的乙酰木聚糖酯酶定义为能够在pH5,25℃每分钟释放1微摩尔对硝基苯酚阴离子(p-nitrophenolate anion)的酶量。
等位变体(allelic variant):术语“等位变体”意指占据相同染色体基因座的基因的任何两种或更多种可选形式。等位变异通过突变天然地发生,并且可导致种群内的多态性。基因突变可以是沉默的(在编码的多肽中无变化)或可以编码具有改变的氨基酸序列的多肽。多肽的等位变体是由基因的等位变体编码的多肽。
α-L-阿拉伯呋喃糖苷酶:术语“α-L-阿拉伯呋喃糖苷酶”意指α-L-阿拉伯呋喃糖苷阿拉伯呋喃水解酶(EC3.2.1.55),其催化对α-L-阿拉伯糖苷中的末端非还原性α-L-阿拉伯呋喃糖苷残基的水解。该酶对α-L-阿拉伯呋喃糖苷、含有(1,3)-和/或(1,5)-键的α-L-阿拉伯聚糖、阿拉伯木聚糖和阿拉伯半乳聚糖起作用。α-L-阿拉伯呋喃糖苷酶也称为阿拉伯糖苷酶、α-阿拉伯糖苷酶、α-L-阿拉伯糖苷酶、α-阿拉伯呋喃糖苷酶、多糖α-L-阿拉伯呋喃糖苷酶、α-L-阿拉伯呋喃糖苷水解酶、L-阿拉伯糖苷酶或α-L-阿拉伯聚糖酶。就本发明而言,α-L-阿拉伯呋喃糖苷酶活性是使用总体积200μl中的每ml的100mM乙酸钠pH5中5mg的中等粘度小麦阿拉伯木聚糖(Megazyme International Ireland,Ltd.,Bray,Co.Wicklow,Ireland)在40℃进行30分钟,接着通过HPX-87H柱层析(Bio-RadLaboratories,Inc.,Hercules,CA,USA)的阿拉伯糖分析来确定的。
α-葡糖醛酸糖苷酶:术语“α-葡糖醛酸糖苷酶”意指α-D-葡糖苷酸葡糖醛酸水解酶(alpha-D-glucosiduronate glucuronohydrolase)(EC3.2.1.139),其催化α-D-葡糖醛酸糖苷水解为D-葡糖醛酸和醇。就本发明而言,α-葡糖醛酸糖苷酶活性是根据de Vries,1998,J.Bacteriol.180:243-249确定的。一个单位的α-葡糖醛酸糖苷酶等于能够在pH5,40℃每分钟释放1微摩尔葡糖醛酸或4-O-甲基葡糖醛酸的酶量。
β-葡糖苷酶:术语“β-葡糖苷酶”意指β-D-葡糖苷葡糖水解酶(beta-D-glucosideglucohydrolase)(E.C.No.3.2.1.21),其催化末端非还原β-D-葡萄糖残基的水解,并释放β-D-葡萄糖。就本发明而言,β-葡糖苷酶根据Venturi等,2002,Extracellular beta-D-glucosidase from Chaetomium thermophilum var.coprophilum:production,purification and some biochemical properties,J.Basic Microbiol.42:55-66的方法使用对硝基苯基-β-D-葡糖吡喃糖苷作为底物确定。一个单位的β-葡糖苷酶定义为在25℃,pH4.8,在含有0.01%20的50mM柠檬酸钠中从作为底物的1mM对硝基苯基-β-D-葡糖吡喃糖苷每分钟产生1.0微摩尔对硝基苯酚阴离子。
β-木糖苷酶:术语“β-木糖苷酶”意指β-D木糖苷木糖水解酶(β-D-xylosidexylohydrolase)(E.C.3.2.1.37),其催化短β(1→4)木寡糖(xylooligosaccharide)的外水解以从非还原端去除连续的D-木糖残基。就本发明而言,一个单位的β-木糖苷酶定义为在40℃,pH5从1mM对硝基苯基-β-D-木糖苷作为底物在含有0.01%20的100mM柠檬酸钠中每分钟产生1.0μmol对硝基苯酚阴离子。
cDNA:术语“cDNA”意指能够通过反转录从得自真核或原核细胞的成熟的、已剪接的mRNA分子制备的DNA分子。cDNA缺少通常存在于相应基因组DNA中的内含子序列。起始的(initial)、初级的RNA转录物是mRNA的前体,其通过一系列的步骤加工包括剪接,然后作为成熟的已剪接的mRNA出现。
纤维二糖水解酶:术语“纤维二糖水解酶”意指1,4-β-D-葡聚糖纤维二糖水解酶(1,4-beta-D-glucan cellobiohydrolase)(E.C.No.3.2.1.91),其催化纤维素、纤维寡糖,或任何包含β-1,4-连接的葡萄糖的聚合物中的1,4-β-D-糖苷键的水解,从链的还原或非还原末端释放纤维二糖(Teeri,1997,Crystalline cellulose degradation:New insightinto the function of cellobiohydrolases,Trends in Biotechnology15:160-167;Teeri等,1998,Trichoderma reesei cellobiohydrolases:why so efficient oncrystalline cellulose?,Biochem.Soc.Trans.26:173-178)。根据Lever等,1972,Anal.Biochem.47:273-279;van Tilbeurgh等,1982,FEBS Letters149:152-156;vanTilbeurgh和Claeyssens,1985,FEBS Letters187:283-288;以及Tomme等,1988,Eur.J.Biochem.170:575-581描述的方法确定纤维二糖水解酶活性。在本发明中,Tomme等的方法可用于确定纤维二糖水解酶活性。
纤维素材料:术语“纤维素材料”意指包含纤维素的任何材料。生物质的初生细胞壁(primary cell wall)中的主要多糖是纤维素,其次最丰富的是半纤维素,而第三是果胶。次生细胞壁(secondary cell wall)在细胞停止生长后产生,其同样含有多糖并通过共价交联至半纤维素的聚合木质素而加强。纤维素是脱水纤维二糖的均聚物,并且因此是直链β-(1-4)-D-葡聚糖,而半纤维素包括 多种化合物,例如木聚糖、木葡聚糖(xyloglucan)、阿拉伯木聚糖和甘露聚糖,具有系列取代基的复杂分支结构。尽管通常是多形的,存在于植物组织中的纤维素主要是平行葡聚糖链的不溶晶体基质。半纤维素通常与纤维素以及其它半纤维素以氢键相连,其帮助稳定细胞壁基质。
纤维素通常见于例如植物的茎、叶、壳、皮和穗轴,或树的叶、枝和木材。纤维素材料可以是,但不限于,农业残余物、草本材料(包括能量作物)、城市固体废物、纸浆与造纸厂残余物、废纸和木材(包括林业残余物)(参见,例如,Wiselogel等,1995,于Handbook onBioethanol(Charles E.Wyman编),pp.105-118,Taylor&Francis,Washington D.C.;Wyman,1994,Bioresource Technology50:3-16;Lynd,1990,Applied Biochemistry andBiotechnology24/25:695-719;Mosier等,1999,Recent Progress in Bioconversion ofLignocellulosics,于Advances in Biochemical Engineering/Biotechnology,T.Scheper主编,Volume65,pp.23-40,Springer-Verlag,New York)。在本文中应理解的是,纤维素可以是任何形式的木素纤维素,在混合基质中包含木质素、纤维素和半纤维素的植物细胞壁材料。在一个优选的方面,纤维素材料是任何生物质材料。在另一个优选的方面,所述纤维素材料是木素纤维素,其包含纤维素、半纤维素和木质素。
在一个方面,纤维素材料是农业残余物。在另一个方面,纤维素材料是草本材料(包括能量作物)。在另一个方面,纤维素材料是城市固体废物。在另一个方面,纤维素材料是纸浆和造纸厂残余物。在另一个方面,纤维素材料是废纸。在另一个方面,纤维素材料是木材(包括林业残余物)。
在另一个方面,纤维素材料是芦竹(arundo)。在另一个方面,纤维素材料是甘蔗渣。在另一个方面,纤维素材料是竹材。在另一个方面,纤维素材料是玉米穗轴。在另一个方面,纤维素材料是玉米纤维。在另一个方面,纤维素材料是玉米秸秆。在另一个方面,纤维素材料是芒草属。在另一个方面,纤维素材料是橙皮。在另一个方面,纤维素材料是稻杆。在另一个方面,纤维素材料是柳枝稷(switch grass)。在另一个方面,纤维素材料是麦杆。
在另一个方面,纤维素材料是白杨。在另一个方面,纤维素材料是桉树。在另一个方面,纤维素材料是枞树。在另一个方面,纤维素材料是松树。在另一个方面,纤维素材料是杨树。在另一个方面,纤维素材料是云杉。在另一个方面,纤维素材料是柳树。
在另一个方面,纤维素材料是藻类纤维素。在另一个方面,纤维素材料 是细菌纤维素。在另一个方面,纤维素材料是棉线头(cotton linter)。在另一个方面,纤维素材料是滤纸。在另一个方面,纤维素材料是微晶纤维素。在另一个方面,纤维素材料是磷酸处理的纤维素。
在另一个方面,纤维素材料是水生生物质。如用于本文中,“水生生物质”意指在水生环境中由光合作用过程产生的生物质。水生生物质可为藻类、挺水植物(emergentplant)、浮叶植物(floating-leaf plant)或沉水植物(submerged plant)。
纤维素材料可以按原样(as is)使用或进行预处理,使用本领域已知的常规方法,如本文所述。在一个优选的方面,预处理纤维素材料。
纤维素分解酶或纤维素酶:术语“纤维素分解酶”或“纤维素酶”意指一种或多种(例如几种)水解纤维素材料的酶。此类酶包括内切葡聚糖酶,纤维二糖水解酶,β-葡糖苷酶,或其组合。测量纤维素分解活性的两种基本方法包括:(1)测量总纤维素分解活性,和(2)测量单独的纤维素分解活性(内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶),如Zhang等,Outlook for cellulase improvement:Screening and selection strategies,2006,Biotechnology Advances 24:452-481所综述的。总纤维素分解活性通常是使用不溶性底物来测定的,所述底物包括Whatman No.1滤纸、微晶纤维素、细菌纤维素、藻类纤维素、棉花、经预处理的木素纤维素等。最常见的总纤维素分解活性测定法是使用Whatman No.1滤纸作为底物的滤纸测定法。该测定法是由International Union of Pure and AppliedChemistry(IUPAC)(Ghose,1987,Measurement of cellulase activities,PureAppl.Chem.59:257-68)确立的。
就本发明而言,纤维素分解酶活性通过测量在下述条件下由纤维素分解酶进行的纤维素材料水解的增加来确定:1-50mg的纤维素分解酶蛋白/g的PCS中纤维素(或其它经预处理的纤维素材料)在合适的温度,例如50℃、55℃或60℃进行3-7日,与未添加纤维素分解酶蛋白的对照水解相比较。通常条件为:1ml反应液,经洗涤或未洗涤的PCS,5%不溶性固形物,50mM乙酸钠pH5,1mM MnSO4,50℃、55℃或60℃,72小时,通过HPX-87H柱(Bio-Rad Laboratories,Inc.,Hercules,CA,USA)进行糖分析。
编码序列:术语“编码序列”意指直接指定变体的氨基酸序列的多核苷酸。编码序列的边界通常由开读框决定,所述开读框以起始密码子如ATG、GTG或TTG开始,并且以终止密码子如TAA、TAG或TGA结束。编码序列可以是基因组DNA、cDNA、合成DNA或其组合。
调控序列(control sequence):术语“调控序列”意指对编码本发明的变体的多核苷酸表达是必需的核酸序列。各个调控序列对于编码所述变体的多核苷酸可以是天然的(即,来自同一基因)或外源的(即,来自不同基因),或各个调控序列对于彼此可以是天然的或外源的。这些调控序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。最少的情况,调控序列包括启动子和转录和翻译的终止信号。调控序列可以和用于引入特异性限制位点的接头一起提供,所述特异性限制位点促进调控序列与编码变体的多核苷酸编码区的连接。
内切葡聚糖酶:术语“内切葡聚糖酶”意指内切-1,4-(1,3;1,4)-β-D-葡聚糖4-葡聚糖水解酶(endo-1,4-β-D-glucan4-glucanohydrolase)(E.C.3.2.1.4),其催化纤维素、纤维素衍生物(例如羧甲基纤维素和羟乙基纤维素)、地衣淀粉(lichenin)中的1,4-β-D-糖苷键、混合的β-1,3葡聚糖例如谷类β-D-葡聚糖或木葡聚糖和含有纤维素组分的其它植物材料中的β-1,4键的内水解(endohydrolysis)。内切葡聚糖酶活性可通过测量底物粘度的减少或由还原糖测定法(Zhang等,2006,Biotechnology Advances24:452-481)确定的还原端增加来确定。就本发明而言,根据Ghose,1987,Pure and Appl.Chem.59:257-268的方法,在pH5,40℃使用羧甲基纤维素(CMC)作为底物来确定内切葡聚糖酶活性。
表达:术语“表达”包括涉及变体产生的任何步骤,其包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。
表达载体:术语“表达载体”意指线性的或环状的DNA分子,其包含编码变体的多核苷酸,并且所述多核苷酸与提供用于其表达的调控序列可操作地连接。
家族61糖苷水解酶:术语“家族61糖苷水解酶”或“家族GH61”或“GH61”在本文中定义为根据Henrissat B.,1991,A classification of glycosyl hydrolases based onamino-acid sequence similarities,Biochem.J.280:309-316,及Henrissat B.,和Bairoch A.,1996,Updating the sequence-based classification of glycosylhydrolases,Biochem.J.316:695-696属于糖苷水解酶家族61的多肽。该家族中的酶原先基于在一个家族成员测量到的非常弱的内切-1,4-β-D葡聚糖酶活性而归类为糖苷水解酶家族。这些酶的结构和作用模式是非经典的,且它们无法视为真正的(bona fide)糖苷酶。然而,基于当与纤维素酶或纤维素酶的混合物一同使用时,其增强木素纤维素分解的能力,它们被保留在CAZy分类中。
阿魏酸酯酶:术语“阿魏酸酯酶(feruloyl esterase)”意指4-羟基-3-甲氧基肉桂酰-糖水解酶(EC3.1.1.73),其催化4-羟基-3-甲氧基肉桂酰(阿魏酰)基团从酯化的糖(其在天然生物质底物中通常为阿拉伯糖)的水解,以产生阿魏酸(4-羟基-3-甲氧基肉桂酸)。阿魏酸酯酶也称作阿魏酸酯酶(ferulic acid esterase)、羟基肉桂酰基酯酶、FAE-III、肉桂酸酯水解酶、FAEA、cinnAE、FAE-I或FAE-II。就本发明而言,阿魏酸酯酶活性是使用50mM乙酸钠pH5.0中的0.5mM阿魏酸对硝基苯酯作为底物确定的。一个单位的阿魏酸酯酶等于能够在pH5,25℃每分钟释放1微摩尔对硝基苯酚阴离子的酶量。
片段:术语“片段”意指从成熟多肽的氨基和/或羧基末端缺失一个或多个(例如几个)氨基酸的多肽;其中所述片段具有纤维素分解增强活性。在一个方面,所述片段含有SEQID NO:2的成熟多肽的至少200个氨基酸残基,例如至少210个氨基酸残基,或至少220个氨基酸残基。
半纤维素分解酶或半纤维素酶:术语“半纤维素分解酶”或“半纤维素酶”意指一种或多种(例如几种)水解半纤维素材料的酶。参见,例如Shallom,D.和Shoham,Y.Microbialhemicellulases.Current Opinion In Microbiology,2003,6(3):219-228)。半纤维素酶是植物生物质降解中的关键成分。半纤维素酶的实例包括但不限于乙酰甘露聚糖酯酶、乙酰木聚糖酯酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、香豆酸酯酶、阿魏酸酯酶、半乳糖苷酶、葡糖醛酸糖苷酶、葡糖醛酸酯酶、甘露聚糖酶、甘露糖苷酶、木聚糖酶和木糖苷酶。这些酶的底物,半纤维素,是支化和直链多糖的混杂集团,这些多糖通过氢键键合于植物细胞壁中的纤维素微纤维,将其交联为鲁棒(robust)的网络。半纤维素亦共价地附于木质素,与纤维素一同形成高度复杂的结构。半纤维素的可变的结构和组织形式需要许多酶的协同作用使其完全降解。半纤维素酶的催化模块为水解糖苷键的糖苷水解酶(GH),或水解乙酸或阿魏酸侧基的酯连接的糖酯酶(CE)。这些催化模块,基于其一级结构的同源性,可指派为GH和CE家族。一些家族,具有总体上类似的折叠,可进一步归类为宗族(clan),以字母标记(例如,GH-A)。最具信息性和最新的这些和其他糖活性酶的分类可在Carbohydrate-Active Enzymes(CAZy)数据库获得。半纤维素分解酶活性可根据Ghose和Bisaria,1987,Pure&Appl.Chem.59:1739-1752在合适的温度,例如50℃、55℃或60℃,和pH,例如5.0或5.5进行测量。
高严格条件:术语“高严格条件”意指对于长度至少100个核苷酸的长 探针,将非常低至非常高的严格条件定义为在42℃,在5X SSPE、0.3%SDS、200微克/ml已剪切并且变性的鲑精DNA和50%的甲酰胺中,根据标准的Southern印迹法进行预杂交和杂交12至24小时。使用2X SSC、0.2%SDS在65℃将载体材料最终洗涤三次,每次15分钟。
宿主细胞:术语“宿主细胞”意指任何细胞类型,所述细胞类型对于使用包含本发明多核苷酸的核酸构建体或表达载体的转化、转染、转导等是易感的(susceptible)。术语“宿主细胞”涵盖任何亲本细胞的后代,其由于在复制中发生的突变而不同于亲本细胞。
增加的热活性:术语“增加的热活性”意指与亲本的热依存性活性概貌相比,变体更高或更宽的温度依存性活性概貌。变体增加的热活性在一个或多个(例如几个)特定温度相对于亲本增强对反应的催化。更具热活性的变体会导致对于催化反应所需时间的减少和/或所需酶浓度的减少。变体相对于亲本的增加的热活性可在例如一个或多个(例如几个)温度的条件下进行评估。例如,所述一个或多个(例如几个)温度可为25℃至95℃范围内的任何温度,例如25,30,35,40,45,50,55,60,65,70,75,80,85,90,或95℃(或在此之间),pH范围为3至8,例如3.0,3.5,4.0,4.5,5.0,5.5,6.0,6.5,7.0,7.5,或8.0(或在此之间)。
在一个方面,变体相对于亲本的热活性在pH3.0和40℃确定。在另一个方面,变体相对于亲本的热活性在pH3.0和45℃确定。在另一个方面,变体相对于亲本的热活性在pH3.0和50℃确定。在另一个方面,变体相对于亲本的热活性在pH3.0和55℃确定。在另一个方面,变体相对于亲本的热活性在pH3.0和60℃确定。在另一个方面,变体相对于亲本的热活性在pH3.0和65℃确定。在另一个方面,变体相对于亲本的热活性在pH3.0和70℃确定。在另一个方面,变体相对于亲本的热活性在pH3.0和75℃确定。在另一个方面,变体相对于亲本的热活性在pH3.0和80℃确定。在另一个方面,变体相对于亲本的热活性在pH3.0和85℃确定。在另一个方面,变体相对于亲本的热活性在pH3.0和90℃确定。
在另一个方面,变体相对于亲本的热活性在pH3.5和40℃确定。在另一个方面,变体相对于亲本的热活性在pH3.5和45℃确定。在另一个方面,变体相对于亲本的热活性在pH3.5和50℃确定。在另一个方面,变体相对于亲本的热活性在pH3.5和55℃确定。在另一个方面,变体相对于亲本的热活性 在pH3.5和60℃确定。在另一个方面,变体相对于亲本的热活性在pH3.5和65℃确定。在另一个方面,变体相对于亲本的热活性在pH3.5和70℃确定。在另一个方面,变体相对于亲本的热活性在pH3.5和75℃确定。在另一个方面,变体相对于亲本的热活性在pH3.5和80℃确定。在另一个方面,变体相对于亲本的热活性在pH3.5和85℃确定。在另一个方面,变体相对于亲本的热活性在pH3.5和90℃确定。
在另一个方面,变体相对于亲本的热活性在pH4.0和40℃确定。在另一个方面,变体相对于亲本的热活性在pH4.0和45℃确定。在另一个方面,变体相对于亲本的热活性在pH4.0和50℃确定。在另一个方面,变体相对于亲本的热活性在pH4.0和55℃确定。在另一个方面,变体相对于亲本的热活性在pH4.0和60℃确定。在另一个方面,变体相对于亲本的热活性在pH4.0和65℃确定。在另一个方面,变体相对于亲本的热活性在pH4.0和70℃确定。在另一个方面,变体相对于亲本的热活性在pH4.0和75℃确定。在另一个方面,变体相对于亲本的热活性在pH4.0和80℃确定。在另一个方面,变体相对于亲本的热活性在pH4.0和85℃确定。在另一个方面,变体相对于亲本的热活性在pH4.0和90℃确定。
在另一个方面,变体相对于亲本的热活性在pH4.5和40℃确定。在另一个方面,变体相对于亲本的热活性在pH4.5和45℃确定。在另一个方面,变体相对于亲本的热活性在pH4.5和50℃确定。在另一个方面,变体相对于亲本的热活性在pH4.5和55℃确定。在另一个方面,变体相对于亲本的热活性在pH4.5和60℃确定。在另一个方面,变体相对于亲本的热活性在pH4.5和65℃确定。在另一个方面,变体相对于亲本的热活性在pH4.5和70℃确定。在另一个方面,变体相对于亲本的热活性在pH4.5和75℃确定。在另一个方面,变体相对于亲本的热活性在pH4.5和80℃确定。在另一个方面,变体相对于亲本的热活性在pH4.5和85℃确定。在另一个方面,变体相对于亲本的热活性在pH4.5和90℃确定。
在另一个方面,变体相对于亲本的热活性在pH5.0和40℃确定。在另一个方面,变体相对于亲本的热活性在pH5.0和45℃确定。在另一个方面,变体相对于亲本的热活性在pH5.0和50℃确定。在另一个方面,变体相对于亲本的热活性在pH5.0和55℃确定。在另一个方面,变体相对于亲本的热活性在pH5.0和60℃确定。在另一个方面,变体相对于亲本的热活性在pH5.0 和65℃确定。在另一个方面,变体相对于亲本的热活性在pH5.0和70℃确定。在另一个方面,变体相对于亲本的热活性在pH5.0和75℃确定。在另一个方面,变体相对于亲本的热活性在pH5.0和80℃确定。在另一个方面,变体相对于亲本的热活性在pH5.0和85℃确定。在另一个方面,变体相对于亲本的热活性在pH5.0和90℃确定。
在另一个方面,变体相对于亲本的热活性在pH5.5和40℃确定。在另一个方面,变体相对于亲本的热活性在pH5.5和45℃确定。在另一个方面,变体相对于亲本的热活性在pH5.5和50℃确定。在另一个方面,变体相对于亲本的热活性在pH5.5和55℃确定。在另一个方面,变体相对于亲本的热活性在pH5.5和60℃确定。在另一个方面,变体相对于亲本的热活性在pH5.5和65℃确定。在另一个方面,变体相对于亲本的热活性在pH5.5和70℃确定。在另一个方面,变体相对于亲本的热活性在pH5.5和75℃确定。在另一个方面,变体相对于亲本的热活性在pH5.5和80℃确定。在另一个方面,变体相对于亲本的热活性在pH5.5和85℃确定。在另一个方面,变体相对于亲本的热活性在pH5.5和90℃确定。
在另一个方面,变体相对于亲本的热活性在pH6.0和40℃确定。在另一个方面,变体相对于亲本的热活性在pH6.0和45℃确定。在另一个方面,变体相对于亲本的热活性在pH6.0和50℃确定。在另一个方面,变体相对于亲本的热活性在pH6.0和55℃确定。在另一个方面,变体相对于亲本的热活性在pH6.0和60℃确定。在另一个方面,变体相对于亲本的热活性在pH6.0和65℃确定。在另一个方面,变体相对于亲本的热活性在pH6.0和70℃确定。在另一个方面,变体相对于亲本的热活性在pH6.0和75℃确定。在另一个方面,变体相对于亲本的热活性在pH6.0和80℃确定。在另一个方面,变体相对于亲本的热活性在pH6.0和85℃确定。在另一个方面,变体相对于亲本的热活性在pH6.0和90℃确定。
在另一个方面,变体相对于亲本的热活性在pH6.5和40℃确定。在另一个方面,变体相对于亲本的热活性在pH6.5和45℃确定。在另一个方面,变体相对于亲本的热活性在pH6.5和50℃确定。在另一个方面,变体相对于亲本的热活性在pH6.5和55℃确定。在另一个方面,变体相对于亲本的热活性在pH6.5和60℃确定。在另一个方面,变体相对于亲本的热活性在pH6.5和65℃确定。在另一个方面,变体相对于亲本的热活性在pH6.5和70℃确 定。在另一个方面,变体相对于亲本的热活性在pH6.5和75℃确定。在另一个方面,变体相对于亲本的热活性在pH6.5和80℃确定。在另一个方面,变体相对于亲本的热活性在pH6.5和85℃确定。在另一个方面,变体相对于亲本的热活性在pH6.5和90℃确定。
在另一个方面,变体相对于亲本的热活性在pH7.0和40℃确定。在另一个方面,变体相对于亲本的热活性在pH7.0和45℃确定。在另一个方面,变体相对于亲本的热活性在pH7.0和50℃确定。在另一个方面,变体相对于亲本的热活性在pH7.0和55℃确定。在另一个方面,变体相对于亲本的热活性在pH7.0和60℃确定。在另一个方面,变体相对于亲本的热活性在pH7.0和65℃确定。在另一个方面,变体相对于亲本的热活性在pH7.0和70℃确定。在另一个方面,变体相对于亲本的热活性在pH7.0和75℃确定。在另一个方面,变体相对于亲本的热活性在pH7.0和80℃确定。在另一个方面,变体相对于亲本的热活性在pH7.0和85℃确定。在另一个方面,变体相对于亲本的热活性在pH7.0和90℃确定。
在另一个方面,变体相对于亲本的热活性在pH7.5和40℃确定。在另一个方面,变体相对于亲本的热活性在pH7.5和45℃确定。在另一个方面,变体相对于亲本的热活性在pH7.5和50℃确定。在另一个方面,变体相对于亲本的热活性在pH7.5和55℃确定。在另一个方面,变体相对于亲本的热活性在pH7.5和60℃确定。在另一个方面,变体相对于亲本的热活性在pH7.5和65℃确定。在另一个方面,变体相对于亲本的热活性在pH7.5和70℃确定。在另一个方面,变体相对于亲本的热活性在pH7.5和75℃确定。在另一个方面,变体相对于亲本的热活性在pH7.5和80℃确定。在另一个方面,变体相对于亲本的热活性在pH7.5和85℃确定。在另一个方面,变体相对于亲本的热活性在pH7.5和90℃确定。
在另一个方面,变体相对于亲本的热活性在pH8.0和40℃确定。在另一个方面,变体相对于亲本的热活性在pH8.0和45℃确定。在另一个方面,变体相对于亲本的热活性在pH8.0和50℃确定。在另一个方面,变体相对于亲本的热活性在pH8.0和55℃确定。在另一个方面,变体相对于亲本的热活性在pH8.0和60℃确定。在另一个方面,变体相对于亲本的热活性在pH8.0和65℃确定。在另一个方面,变体相对于亲本的热活性在pH8.0和70℃确定。在另一个方面,变体相对于亲本的热活性在pH8.0和75℃确定。在另一 个方面,变体相对于亲本的热活性在pH8.0和80℃确定。在另一个方面,变体相对于亲本的热活性在pH8.0和85℃确定。在另一个方面,变体相对于亲本的热活性在pH8.0和90℃确定。
相对于亲本的变体的增加的热活性可使用本领域中对于具有纤维素分解增强活性的多肽任何已知的酶测定来确定。参见,例如WO2005/074647,WO 2008/148131 WO 2005/074656,WO 2010/065830,WO 2007/089290,WO 2009/085935,WO 2009/085859,WO 2009/085864,WO 2009/085868和WO 2008/151043,其通过提述并入本文。或者,相对于亲本的变体的增加的热活性可使用任何对于变体的实用测定法来确定,其中将变体的性能与亲本相比较。举例而言,可使用实施例12或14中所述的实用测定法。
在一个方面,所述变体的热活性比亲本至少1.01倍,例如至少1.05倍,至少1.1倍,至少1.5倍,至少1.8倍,至少2倍,至少5倍,至少10倍,至少15倍,至少20倍,至少25倍,和至少50倍更具热活性。
具有增加的热活性的变体可或可不显示相对于亲本增加的热稳定性。例如,变体可具有相对于亲本改善的热活性,但并不具有增加的热稳定性。
增加的热稳定性:术语“增加的热稳定性”意指相对于亲本,变体在某温度一定时间的温育之后更高的纤维素分解增强活性的保留。变体相对于亲本的增加的热稳定性可例如在一个或多个(例如几个)温度的条件下评估。例如,所述一个或多个(例如几个)温度可为45℃至95℃范围的任何温度,例如45,50,55,60,65,70,75,80,85,或95℃(或在此之间),pH为3至8的范围,例如3.0,3.5,4.0,4.5,5.0,5.5,6.0,6.5,7.0,7.5,或8.0(或在此之间),进行合适时间的温育,例如1分钟,5分钟,10分钟,15分钟,30分钟,45分钟,或60分钟,使得所述变体保留剩余活性。
在一个方面,变体相对于亲本的热稳定性在pH3.0和50℃确定。在另一个方面,变体相对于亲本的热稳定性在pH3.0和55℃确定。在另一个方面,变体相对于亲本的热稳定性在pH3.0和60℃确定。在另一个方面,变体相对于亲本的热稳定性在pH3.0和65℃确定。在另一个方面,变体相对于亲本的热稳定性在pH3.0和70℃确定。在另一个方面,变体相对于亲本的热稳定性在pH3.0和75℃确定。在另一个方面,变体相对于亲本的热稳定性在pH3.0和80℃确定。在另一个方面,变体相对于亲本的热稳定性在pH3.0和85℃确定。在另一个方面,变体相对于亲本的热稳定性在pH3.0和90℃确定。
在另一个方面,变体相对于亲本的热稳定性在pH3.5和50℃确定。在另一个方面,变体相对于亲本的热稳定性在pH3.5和55℃确定。在另一个方面,变体相对于亲本的热稳定性在pH3.5和60℃确定。在另一个方面,变体相对于亲本的热稳定性在pH3.5和65℃确定。在另一个方面,变体相对于亲本的热稳定性在pH3.5和70℃确定。在另一个方面,变体相对于亲本的热稳定性在pH3.5和75℃确定。在另一个方面,变体相对于亲本的热稳定性在pH3.5和80℃确定。在另一个方面,变体相对于亲本的热稳定性在pH3.5和85℃确定。在另一个方面,变体相对于亲本的热稳定性在pH3.5和90℃确定。
在另一个方面,变体相对于亲本的热稳定性在pH4.0和50℃确定。在另一个方面,变体相对于亲本的热稳定性在pH4.0和55℃确定。在另一个方面,变体相对于亲本的热稳定性在pH4.0和60℃确定。在另一个方面,变体相对于亲本的热稳定性在pH4.0和65℃确定。在另一个方面,变体相对于亲本的热稳定性在pH4.0和70℃确定。在另一个方面,变体相对于亲本的热稳定性在pH4.0和75℃确定。在另一个方面,变体相对于亲本的热稳定性在pH4.0和80℃确定。在另一个方面,变体相对于亲本的热稳定性在pH4.0和85℃确定。在另一个方面,变体相对于亲本的热稳定性在pH4.0和90℃确定。
在另一个方面,变体相对于亲本的热稳定性在pH4.5和50℃确定。在另一个方面,变体相对于亲本的热稳定性在pH4.5和55℃确定。在另一个方面,变体相对于亲本的热稳定性在pH4.5和60℃确定。在另一个方面,变体相对于亲本的热稳定性在pH4.5和65℃确定。在另一个方面,变体相对于亲本的热稳定性在pH4.5和70℃确定。在另一个方面,变体相对于亲本的热稳定性在pH4.5和75℃确定。在另一个方面,变体相对于亲本的热稳定性在pH4.5和80℃确定。在另一个方面,变体相对于亲本的热稳定性在pH4.5和85℃确定。在另一个方面,变体相对于亲本的热稳定性在pH4.5和90℃确定。
在另一个方面,变体相对于亲本的热稳定性在pH5.0和50℃确定。在另一个方面,变体相对于亲本的热稳定性在pH5.0和55℃确定。在另一个方面,变体相对于亲本的热稳定性在pH5.0和60℃确定。在另一个方面,变体相对于亲本的热稳定性在pH5.0和65℃确定。在另一个方面,变体相对于亲本的热稳定性在pH5.0和70℃确定。在另一个方面,变体相对于亲本的热稳定性在pH5.0和75℃确定。在另一个方面,变体相对于亲本的热稳定性在pH5.0和80℃确定。在另一个方面,变体相对于亲本的热稳定性在pH5.0和85℃ 确定。在另一个方面,变体相对于亲本的热稳定性在pH5.0和90℃确定。
在另一个方面,变体相对于亲本的热稳定性在pH5.5和50℃确定。在另一个方面,变体相对于亲本的热稳定性在pH5.5和55℃确定。在另一个方面,变体相对于亲本的热稳定性在pH5.5和60℃确定。在另一个方面,变体相对于亲本的热稳定性在pH5.5和65℃确定。在另一个方面,变体相对于亲本的热稳定性在pH5.5和70℃确定。在另一个方面,变体相对于亲本的热稳定性在pH5.5和75℃确定。在另一个方面,变体相对于亲本的热稳定性在pH5.5和80℃确定。在另一个方面,变体相对于亲本的热稳定性在pH5.5和85℃确定。在另一个方面,变体相对于亲本的热稳定性在pH5.5和90℃确定。
在另一个方面,变体相对于亲本的热稳定性在pH6.0和50℃确定。在另一个方面,变体相对于亲本的热稳定性在pH6.0和55℃确定。在另一个方面,变体相对于亲本的热稳定性在pH6.0和60℃确定。在另一个方面,变体相对于亲本的热稳定性在pH6.0和65℃确定。在另一个方面,变体相对于亲本的热稳定性在pH6.0和70℃确定。在另一个方面,变体相对于亲本的热稳定性在pH6.0和75℃确定。在另一个方面,变体相对于亲本的热稳定性在pH6.0和80℃确定。在另一个方面,变体相对于亲本的热稳定性在pH6.0和85℃确定。在另一个方面,变体相对于亲本的热稳定性在pH6.0和90℃确定。
在另一个方面,变体相对于亲本的热稳定性在pH6.5和50℃确定。在另一个方面,变体相对于亲本的热稳定性在pH6.5和55℃确定。在另一个方面,变体相对于亲本的热稳定性在pH6.5和60℃确定。在另一个方面,变体相对于亲本的热稳定性在pH6.5和65℃确定。在另一个方面,变体相对于亲本的热稳定性在pH6.5和70℃确定。在另一个方面,变体相对于亲本的热稳定性在pH6.5和75℃确定。在另一个方面,变体相对于亲本的热稳定性在pH6.5和80℃确定。在另一个方面,变体相对于亲本的热稳定性在pH6.5和85℃确定。在另一个方面,变体相对于亲本的热稳定性在pH6.5和90℃确定。
在另一个方面,变体相对于亲本的热稳定性在pH7.0和50℃确定。在另一个方面,变体相对于亲本的热稳定性在pH7.0和55℃确定。在另一个方面,变体相对于亲本的热稳定性在pH7.0和60℃确定。在另一个方面,变体相对于亲本的热稳定性在pH7.0和65℃确定。在另一个方面,变体相对于亲本的热稳定性在pH7.0和70℃确定。在另一个方面,变体相对于亲本的热稳定性在pH7.0和75℃确定。在另一个方面,变体相对于亲本的热稳定性在pH7.0和80℃确定。在另一个方面,变体相对于亲本的热稳定性在pH7.0和85℃确定。在另一个方面,变体相对于亲本的热稳定性在pH7.0和90℃确定。
在另一个方面,变体相对于亲本的热稳定性在pH7.5和50℃确定。在另一个方面,变体相对于亲本的热稳定性在pH7.5和55℃确定。在另一个方面,变体相对于亲本的热稳定性在pH7.5和60℃确定。在另一个方面,变体相对于亲本的热稳定性在pH7.5和65℃确定。在另一个方面,变体相对于亲本的热稳定性在pH7.5和70℃确定。在另一个方面,变体相对于亲本的热稳定性在pH7.5和75℃确定。在另一个方面,变体相对于亲本的热稳定性在pH7.5和80℃确定。在另一个方面,变体相对于亲本的热稳定性在pH7.5和85℃确定。在另一个方面,变体相对于亲本的热稳定性在pH7.5和90℃确定。
在另一个方面,变体相对于亲本的热稳定性在pH8.0和50℃确定。在另一个方面,变体相对于亲本的热稳定性在pH8.0和55℃确定。在另一个方面,变体相对于亲本的热稳定性在pH8.0和60℃确定。在另一个方面,变体相对于亲本的热稳定性在pH8.0和65℃确定。在另一个方面,变体相对于亲本的热稳定性在pH8.0和70℃确定。在另一个方面,变体相对于亲本的热稳定性在pH8.0和75℃确定。在另一个方面,变体相对于亲本的热稳定性在pH8.0和80℃确定。在另一个方面,变体相对于亲本的热稳定性在pH8.0和85℃确定。在另一个方面,变体相对于亲本的热稳定性在pH8.0和90℃确定。
在上述每一个方面,变体相对于亲本的热稳定性可通过温育变体和亲本1分钟来确定。在上述每一个方面,变体相对于亲本的热稳定性可通过温育变体和亲本5分钟来确定。在上述每一个方面,变体相对于亲本的热稳定性可通过温育变体和亲本10分钟来确定。在上述每一个方面,变体相对于亲本的热稳定性可通过温育变体和亲本15分钟来确定。在上述每一个方面,变体相对于亲本的热稳定性可通过温育变体和亲本30分钟来确定。在上述每一个方面,变体相对于亲本的热稳定性可通过温育变体和亲本45分钟来确定。在上述每一个方面,变体相对于亲本的热稳定性可通过温育变体和亲本60分钟来确定。
变体相对于亲本增加的热稳定性可通过差示扫描量热法(DSC)使用本领域中的标准方法(参见,例如Sturtevant,1987,Annual Review of Physical Chemistry38:463-488)来确定。变体相对于亲本增加的热稳定性可使用任何本领域中已知的对于具有纤维素分解增强活性的GH61多肽的酶测定来确定。参见例如WO 2005/074647,WO 2008/148131WO2005/074656,WO 2010/065830,WO 2007/089290,WO 2009/085935,WO 2009/085859,WO2009/085864,WO 2009/085868和WO 2008/151043,其通过提述并入本文。或者,变体相对于亲本的增加的热稳定性可使用任何对于变体的实用测定法来确定,其中将变体的性能与亲本相比较。举例而言,可使用实施例12或14中所述的实用测定法。
在一个方面,具有纤维素分解增强活性的多肽的热稳定性比亲本至少1.01倍,例如至少1.05倍,至少1.1倍,至少1.5倍,至少1.8倍,至少2倍,至少5倍,至少10倍,至少15倍,至少20倍,至少25倍,和至少50倍更具热稳定性。
具有增加的热稳定性的变体可或可不显示相对于亲本增加的热活性。例如,变体可具有相对于亲本在升高的温度温育之后改善的重新折叠的能力,但不具有增加的热活性。
分离的:术语“分离的”意指以不在自然界出现的形式或环境存在的物质。分离的物质的非限定性实例包括(1)任何非天然存在的物质,(2)任何至少部分地从一种或多种或全部与其天然结合的天然存在的成分移除的物质,包括但不限于任何酶、变体、核酸、蛋白质、肽或辅因子;(3)任何相对于见于自然界的该物质和经人力修饰的物质;或(4)任何经人力修饰而相对于与其自然结合的成分增加该物质的量的物质(例如,编码该物质的基因的多重拷贝;较与与编码该物质的基因自然结合的启动子更强的启动子的使用)。分离的物质可存在于发酵液样品。
低严格条件:术语“低严格条件”意指对于长度至少100个核苷酸的长探针,将非常低至非常高的严格条件定义为在42℃,在5X SSPE、0.3%SDS、200微克/ml已剪切并且变性的鲑精DNA和25%的甲酰胺中,根据标准的Southern印迹法进行预杂交和杂交12至24小时。使用2X SSC、0.2%SDS在50℃将载体材料最终洗涤三次,每次15分钟。
成熟多肽:术语“成熟多肽”意指以其在翻译和任何翻译后修饰之后的最终形式存在的多肽,所述修饰例如N-末端加工、C-末端截短、糖基化、磷酸化等。在一个方面,根据预测SEQ ID NO:2的氨基酸-21至-1是信号肽的SignalP程序(Nielsen等,1997,ProteinEngineering10:1-6),成熟多肽是SEQ ID NO:2的氨基酸1至229。在本领域中已知宿主细胞可产生由相同多核苷酸表达的两种或更多种不同成熟多肽(即具有不同的C端和/或N端氨基酸)的混合物。
成熟多肽编码序列:术语“成熟多肽编码序列”意指编码具有纤维素分解增强活性的成熟多肽的多核苷酸。在一个方面,根据预测SEQ ID NO:1的核苷酸1至63编码信号肽的SignalP程序(Nielsen等,1997,见上),成熟多肽编码序列是SEQ ID NO:1的核苷酸64至859。在另一个方面,成熟多肽编码序列是SEQ ID NO:1的核苷酸64至859中含有的cDNA序列。
中等严格条件:术语“中等严格条件”意指对于长度至少100个核苷酸的长探针,将非常低至非常高的严格条件定义为在42℃,在5X SSPE、0.3%SDS、200微克/ml已剪切并且变性的鲑精DNA和35%的甲酰胺中,根据标准的Southern印迹法进行预杂交和杂交12至24小时。使用2X SSC、0.2%SDS在55℃将载体材料最终洗涤三次,每次15分钟。
中等-高严格条件:术语“中等-高严格条件”意指对于长度至少100个核苷酸的长探针,将非常低至非常高的严格条件定义为在42℃,在5X SSPE、0.3%SDS、200微克/ml已剪切并且变性的鲑精DNA和35%的甲酰胺中,根据标准的Southern印迹法进行预杂交和杂交12至24小时。使用2X SSC、0.2%SDS在60℃将载体材料最终洗涤三次,每次15分钟。
突变体:术语“突变体”意指编码变体的多核苷酸。
核酸构建体:术语“核酸构建体”意指单链或双链的核酸分子,其分离自天然存在的基因,或其经修饰以本来不存在于(not otherwise exist)自然界中的方式含有核酸的区段,或其为合成的,其包含一个或多个调控序列。
可操作地连接:术语“可操作地连接”意指这样的构型,其中将调控序列置于相对于多核苷酸的编码序列的适当位置,使得调控序列指导编码序列的表达。
亲本或亲本具有纤维素分解增强活性的多肽:术语“亲本”或“亲本具有纤维素分解增强活性的多肽”意指一种具有纤维素分解增强活性的多肽,对其进行改变以产生本发明的变体。所述亲本可为天然存在的(野生型)多肽或其变体,或它们的片段。
具有纤维素分解增强活性的多肽:术语“具有纤维素分解增强的多肽”意指催化具有纤维素分解活性的酶对纤维素材料的水解的增强的GH61多肽。就本发明而言,通过测量来自由纤维素分解酶在下述条件下水解纤维素材料的还原糖增加或纤维二糖与葡萄糖的总量增加来确定纤维素分解增强活性:1-50mg总蛋白/g PCS中纤维素,其中总蛋白包含50-99.5%w/w的纤维素分解酶蛋 白,及0.5-50%w/w的具有纤维素分解增强活性的多肽的蛋白质,在合适的温度,例如50℃、55℃或60℃和合适的pH,例如5.0或5.5历时1-7天,与用等量的总蛋白加载量而无纤维素分解增强活性(1-50mg纤维素分解蛋白/g PCS中纤维素)所进行的对照水解相比。在一个优选的方面,使用在总蛋白重量的2-3%的米曲霉β-葡糖苷酶(根据WO 02/095014在米曲霉中重组产生)或者总蛋白质量的2-3%的烟曲霉β-葡糖苷酶(如WO2002/095014所述在米曲霉中重组产生)的纤维素酶蛋白加载量存在下的1.5L(Novozymes A/S,Bagsvaerd,Denmark)的混合物作为纤维素分解活性的来源。
具有纤维素分解增强活性的GH61多肽通过降低达到相同水解水平所需的纤维素分解酶的量而增强由具有纤维素分解活性的酶催化的纤维素材料的水解,优选降低至少1.01倍,例如至少1.05倍,至少1.10倍,至少1.25倍,至少1.5倍,至少2倍,至少3倍,至少4倍,至少5倍,至少10倍,或至少20倍。
预处理的玉米秸秆:术语“PCS”或“预处理的玉米秸秆”意指通过用热和稀硫酸处理、碱预处理或中性预处理的源自玉米秸秆的纤维素材料。
序列同一性:参数“序列同一性”描述两个氨基酸序列之间或两个核苷酸序列之间的相关性。
就本发明而言,两个氨基酸序列之间的序列同一性程度使用如EMBOSS软件包(EMBOSS:The European Molecular Biology Open Software Suite,Rice等,2000,TrendsGenet.16:276-277),优选3.0.0、5.0.0版或更高版本的Needle程序中所执行的Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48:443-453)来测定。使用的参数为缺口罚分(gap penalty)10,缺口延伸罚分(gap extension penalty)0.5和EBLOSUM62(BLOSUM62的EMBOSS版)取代矩阵。使用Needle标记为“最高同一性(longest identity)”的输出结果(使用-nobrief选项获得)作为同一性百分比,并计算如下:
(同样的残基×100)/(比对长度-比对中缺口的总数)
就本发明而言,两个核苷酸序列之间的序列同一性程度使用如EMBOSS软件包(EMBOSS:The European Molecular Biology Open Software Suite,Rice等,2000,见上文),优选3.0.0、5.0.0版或更高版本的Needle程序中所执行的Needleman-Wunsch算法(Needleman和Wunsch,1970,见上文)来测定。使用的参数为缺口罚分10,缺口延伸罚分0.5和EDNAFULL(NCBI NUC4.4的 EMBOSS版)取代矩阵。使用Needle标记为“最高同一性”的输出结果(使用-nobrief选项获得)作为同一性百分比,并计算如下:
(同样的脱氧核糖核苷酸×100)/(比对长度-比对中缺口的总数)
亚序列:术语“亚序列(subsequence)”意指从成熟多肽编码序列的5’和/或3’端缺失一个或多个(例如几个)核苷酸的多核苷酸;其中所述亚序列编码具有纤维素分解增强活性的片段。在一个方面,所述亚序列含有SEQ ID NO:1的成熟多肽编码序列的至少600个核苷酸,例如至少630个核苷酸,或至少660个核苷酸。
变体:术语“变体”意指在一个或多个(例如几个)位置包含改变,即取代、插入和/或缺失的具有纤维素分解增强活性的多肽。取代意指将占据某位置的氨基酸用不同的氨基酸替代;缺失意指去除占据某位置的氨基酸;而插入意指在邻接并紧接着占据某位置的氨基酸之后添加氨基酸。本发明的变体具有SEQ ID NO:2的成熟多肽的纤维素分解增强活性至少20%,例如至少40%,至少50%,至少60%,至少70%,至少80%,至少90%,至少95%,或至少100%。
非常高严格条件:术语“非常高严格条件”意指对于长度至少100个核苷酸的长探针,将非常低至非常高的严格条件定义为在42℃,在5X SSPE、0.3%SDS、200微克/ml已剪切并且变性的鲑精DNA和50%的甲酰胺中,根据标准的Southern印迹法进行预杂交和杂交12至24小时。使用2X SSC、0.2%SDS在70℃将载体材料最终洗涤三次,每次15分钟。
非常低严格条件:术语“中等严格条件”意指对于长度至少100个核苷酸的长探针,将非常低至非常高的严格条件定义为在42℃,在5X SSPE、0.3%SDS、200微克/ml已剪切并且变性的鲑精DNA和25%的甲酰胺中,根据标准的Southern印迹法进行预杂交和杂交12至24小时。使用2X SSC、0.2%SDS在45℃将载体材料最终洗涤三次,每次15分钟。
含木聚糖材料:术语“含木聚糖材料”意指任何包含含有β-(1-4)连接的木糖残基骨架的植物细胞壁多糖的材料。陆生植物的木聚糖是具有β-(1-4)-吡喃木糖骨架的杂聚物,其由短的糖链分支。它们包含D-葡糖醛酸或其4-O-甲基醚,L-阿拉伯糖和/或多种包含D-木糖、L-阿拉伯糖、D-或L-半乳糖和D-葡萄糖的寡糖。木聚糖类型的多糖可分为均木聚糖(homoxylan)和杂木聚糖(heteroxylan),后者包括葡糖醛酸木聚糖,(阿拉伯)葡糖醛酸木聚糖,(葡糖醛酸)阿拉伯木聚糖,阿拉伯木聚糖和复合杂木聚糖。参见,例如Ebringerova等,2005,Adv.Polym.Sci.186:1-67。
在本发明的方法中,可使用任何含有木聚糖的材料。在一个优选的方面,所述含木聚糖材料是木素纤维素。
木聚糖降解活性或木聚糖分解活性:术语“木聚糖降解活性”或“木聚糖分解活性”意指水解含木聚糖材料的生物学活性。两种测定木聚糖分解活性的基础方法包括:(1)测定总木聚糖分解活性,和(2)测定单独的木聚糖分解活性(例如内切木聚糖酶、β-木糖苷酶、阿拉伯呋喃糖苷酶、α-葡糖醛酸糖苷酶、乙酰木聚糖酯酶、阿魏酸酯酶和α-葡糖醛酸酯酶(α-glucuronyl esterase))。最近在木聚糖分解酶测定法的进展总结于几个公开文献中,包括Biely和Puchard,Recent progress in the assays of xylanolytic enzymes,2006,Journal of the Science of Food和Agriculture86(11):1636-1647;Spanikova和Biely,2006,Glucuronoyl esterase-Novel carbohydrate esterase produced bySchizophyllum commune,FEBS Letters580(19):4597-4601;Herrmann,Vrsanska,Jurickova,Hirsch,Biely和Kubicek,1997,The beta-D-xylosidase of Trichodermareesei is a multifunctional beta-D-xylan xylohydrolase,BiochemicalJournal321:375-381。
总木聚糖降解活性可通过确定从多种类型的木聚糖形成的还原糖来测量,所述木聚糖包括例如燕麦小麦(oat spelt)、山毛榉木(beechwood)和落叶松木(larchwood)木聚糖,或者可通过光度法确定从多种共价染色的木聚糖释放出的染色的木聚糖片段来测量。最常见的总木聚糖分解活性测定法基于从多聚的4-O-甲基葡糖醛酸木聚糖产生还原糖,如Bailey,Biely,Poutanen,1992,Interlaboratory testing of methods for assay ofxylanase activity,Journal of Biotechnology23(3):257-270中所述。木聚糖酶活性亦可用0.2%AZCL-阿拉伯木聚糖作为底物在37℃在0.01%X-100(4-(1,1,3,3-四甲基丁基)苯基-聚乙二醇)和200mM磷酸钠缓冲液pH6中来确定。一个单位的木聚糖酶活性定义为在37℃,pH6在200mM磷酸钠pH6缓冲液中从作为底物的0.2%AZCL-阿拉伯木聚糖每分钟产生1.0微摩尔天青精。
就本发明而言,木聚糖降解活性是通过测量由木聚糖降解酶在下述通常条件下造成的桦木木聚糖(Sigma Chemical Co.,Inc.,St.Louis,MO,USA)水解的增加来确定的:1ml反应液,5mg/ml底物(总固形物),5mg木聚糖分解蛋白质/g底物,50mM乙酸钠,pH5,50℃,24小时,如Lever,1972,A new reaction for colorimetric determination ofcarbohydrates,Anal.Biochem47: 273-279所述使用对羟基苯甲酸酰肼(PHBAH)测定法进行糖分析。
木聚糖酶:术语“木聚糖酶”意指1,4-β-D-木聚糖-木糖水解酶(1,4-β-D-xylan-xylohydrolase)(E.C.3.2.1.8),其催化木聚糖中1,4-β-D-木糖苷键的内水解。就本发明而言,木聚糖酶活性是使用0.2%AZCL-阿拉伯木聚糖作为底物确定的。一个单位的木聚糖酶活性定义为在37℃,pH6在200mM磷酸钠pH6缓冲液中从作为底物的0.2%AZCL-阿拉伯木聚糖每分钟产生1.0微摩尔天青精。
野生型多肽:术语“野生型多肽”意指由天然存在的微生物,如见于自然界的细菌、酵母或丝状真菌表达的具有纤维素分解增强活性的多肽。
发明详述
本发明涉及分离的多肽,其在对应于SEQ ID NO:2的成熟多肽的位置75,77,179,181,和183的一个或多个(例如几个)位置包含取代,其中所述变体具有纤维素分解增强活性。
变体命名规则:
就本发明而言,使用公开于SEQ ID NO:2中的成熟多肽以确定在其它具有纤维素分解增强活性的多肽中对应的氨基酸残基。将其它具有纤维素分解增强活性的多肽的氨基酸序列与公开于SEQ ID NO:2中的成熟多肽进行比对,并基于该比对,可以使用Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48:443-453)(如用EMBOSS软件包(EMBOSS:欧洲分子生物开放软件套件(The European Molecular Biology Open SoftwareSuite),Rice等,2000,Trends Genet16:276-277)的Needle程序执行,优选为5.0.0版或之后的版本)确定SEQ ID NO:2所公开的成熟多肽中任何氨基酸残基对应的氨基酸位置编号。使用的参数为缺口开放罚分为10,缺口延伸罚分为0.5,和EBLOSUM62(BLOSUM62的EMBOSS版本)取代矩阵
在另一个具有纤维素分解增强活性的多肽中对应氨基酸残基的鉴定可通过使用数种计算机程序使用其各自的缺省参数进行的多个多肽序列的比对来确定,所述计算机程序包括但不限于MUSCLE(根据log期望的多重序列比较,multiple sequence comparisonby log-expectation;3.5版或之后的版本;Edgar,2004,Nucleic Acids Research32:1792-1797),MAFFT(6.857版或之后的版本;Katoh等,2005,Nucleic Acids Research33:511-518;Katoh和Toh,2007, Bioinformatics23:372-374;Katoh等,2009,Methods inMolecular Biology537:39-64;Katoh和Toh,2010,Bioinformatics26:1899-1900)和采用ClustalW的EMBOSS EMMA(1.83或之后;Thompson等,1994,Nucleic Acids Research22:4673-4680)。
当其它多肽与SEQ ID NO:2的成熟多肽歧异到传统的基于序列的比较无法检测出其关系时(Lindahl和Elofsson,2000,J.Mol.Biol.295:613-615),可使用其它配对序列比较算法。在基于序列的搜索中较高的敏感度可使用采用多肽家族的概率表现(probabilistic representation)(序型)搜索数据库的搜索程序来获得。例如,PSI-BLAST程序通过迭代的(iterative)数据库搜索过程来产生序型,并能够检测出较远的同源物(Atschul等,1997,Nucleic Acids Res.25:3389-3402)。当多肽的家族或超家族在蛋白质结构数据库中具有一个或多个代表时,甚至可达成更高的敏感度。程序如GenTHREADER(Jones1999,J.Mol.Biol.287:797-815;McGuffin和Jones,2003,Bioinformatics19:874-881)使用来自不同来源(PSI-BLAST、二级结构预测(secondary structure prediction)、结构比对序型(structural alignment profile)以及溶解势(solvation potential))的信息作为预测所查询序列(query sequence)的结构折叠(structural fold)的神经网络的输入。类似地,Gough等,2000,J.Mol.Biol.313:903-919的方法可用于将未知结构的序列与存在于SCOP数据库中的超家族模型进行比对。这些比对可接着用于生成所述多肽的同源性模型,且上述模型可就其准确度使用多种为此目的开发的工具加以评价。
对于已知结构的蛋白质,可获取数种工具和资源以供找回(retrieve)和生成结构比对。例如,已将SCOP超家族的蛋白质进行了结构比对,且这些比对是可获取并可下载的。两个或更多蛋白质结构可使用多种算法,如距离比对矩阵(distance alignment matrix)(Holm和Sander,1998,Proteins33:88-96)或组合延伸(combinatorial extension)(Shindyalov和Bourne,1998,Protein Engineering.11:739-747)进行比对,且这些算法的实施可另外用于查询具有目标结构的结构数据库,以发现可能的结构同源物(例如Holm和Park,2000,Bioinformatics16:566-567)。
在描述本发明的变体时,为了参照方便起见,采用了下面所述的命名法。使用通用的IUPAC单字母或三字母氨基酸缩写。
取代。对于氨基酸取代,使用下述命名法:初始氨基酸,位置,取代氨 基酸。相应地,在226位用丙氨酸取代苏氨酸命名为“Thr226Ala”或“T226A”。多重突变可以用加号(“+”)分开,例如,“Gly205Arg+Ser411Phe”或“G205R+S411F”,分别代表205和411位用精氨酸(R)取代甘氨酸(G),以及用苯丙氨酸(F)取代丝氨酸(S)。
缺失。对于氨基酸缺失,使用了如下命名法:初始氨基酸,位置*。相应地,在位置195缺失甘氨酸命名为“Gly195*”或“G195*”。多个缺失通过加号(“+”)分开,例如,“Gly195*+Ser411*”或“G195*+S411*”。
插入。对于氨基酸插入,使用了如下的命名法:初始氨基酸,位置,初始氨基酸,插入的氨基酸。因此,在位置195的甘氨酸之后插入赖氨酸命名为“Gly195GlyLys”或“G195GK”。多个氨基酸的插入命名为[初始氨基酸,位置,初始氨基酸,插入的氨基酸#1,插入的氨基酸#2;等等]。例如,在位置195的甘氨酸之后插入赖氨酸和丙氨酸记为“Gly195GlyLysAla”或“G195GKA”。
在此情况下,通过在插入的氨基酸残基前的氨基酸残基的位置号添加小写字母而对插入的氨基酸残基进行编号。因此,在上一例子中序列为:
亲本: 变体:
195 195195a195b
G G-K-A
多重改变。包含多重改变的变体由加号(“+”)分隔,例如“Arg170Tyr+Gly195Glu”或“R170Y+G195E”代表分别在位置170用酪氨酸取代精氨酸,和在位置195用谷氨酸取代甘氨酸。
不同的改变。当可在一个位置引入不同的改变时,所述不同改变由逗号分隔,例如“Arg170Tyr,Glu”代表在位置170用酪氨酸或谷氨酸取代精氨酸。因此,“Tyr167Gly,Ala+Arg170Gly,Ala”指下述变体:“Tyr167Gly+Arg170Gly”、“Tyr167Gly+Arg170Ala”、“Tyr167Ala+Arg170Gly”和“Tyr167Ala+Arg170Ala”。
变体
本发明提供了变体,其在对应于SEQ ID NO:2的成熟多肽的位置75,77,179,181和183的一个或多个(例如几个)位置包含取代,其中所述变体具有纤维素分解增强活性。
在一个实施方案中,所述变体与具有纤维素分解增强活性的亲本多肽的氨基酸序列具有至少60%,例如至少65%,至少70%,至少75%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少 87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,或至少99%,但少于100%的序列同一性。
在另一个实施方案中,所述变体与SEQ ID NO:2的成熟多肽具有至少60%,例如至少65%,至少70%,至少75%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,如至少96%,至少97%,至少98%,或至少99%,但少于100%的序列同一性。
在一个方面,本发明的变体中取代的数量为1-5,如1,2,3,4,或5个取代。
在另一个方面,变体在对应于位置75,77,179,181,和183的一个或多个(例如几个)位置包含取代。在另一个方面,变体在对应于位置75,77,179,181,和183的两个位置包含取代。在另一个方面,变体在对应于位置75,77,179,181,和183的三个位置包含取代。在另一个方面,变体在对应于位置75,77,179,181,和183的四个位置包含取代。在另一个方面,变体在对应于位置75,77,179,181,和183的每个位置包含取代。
在另一个方面,所述变体包含或组成为在对应于位置75的位置的取代。在另一个方面,在对应于位置75的位置的氨基酸用Ala,Arg,Asn,Asp,Cys,Gln,Glu,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr,或Val,优选用Val取代。在另一个方面,在另一个方面,所述变体包含或组成为SEQ ID NO:2的成熟多肽的取代I75V。
在另一个方面,所述变体包含或组成为在对应于位置77的位置的取代。在另一个方面,在对应于位置77的位置的氨基酸用Ala,Arg,Asn,Asp,Cys,Gln,Glu,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr,或Val,优选用Leu取代。在另一个方面,所述变体包含或组成为SEQ IDNO:2的成熟多肽的取代F77L。
在另一个方面,所述变体包含或组成为在对应于位置179的位置的取代。在另一个方面,在对应于位置179的位置的氨基酸用Ala,Arg,Asn,Asp,Cys,Gln,Glu,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr,或Val,优选用Ile取代。在另一个方面,所述变体包含或组成为SEQ IDNO:2的成熟多肽的取代F179I。
在另一个方面,所述变体包含或组成为在对应于位置181的位置的取代。在另一个方面,在对应于位置181的位置的氨基酸用Ala,Arg,Asn,Asp,Cys,Gln,Glu,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr,或Val,优选用Leu取代。在另一个方面,所述变体包含或组成为SEQ IDNO:2的成熟多肽的取代I181L。
在另一个方面,所述变体包含或组成为在对应于位置183的位置的取代。在另一个方面,在对应于位置183的位置的氨基酸用Ala,Arg,Asn,Asp,Cys,Gln,Glu,Gly,His,Ile,Leu,Lys,Met,Phe,Pro,Ser,Thr,Trp,Tyr,或Val,优选用Val取代。在另一个方面,所述变体包含或组成为取代SEQ ID NO:2的成熟多肽的I183V。
在另一个方面,所述变体包含或组成为在对应于位置75和77的位置的取代,如上述的那些。
在另一个方面,所述变体包含或组成为在对应于位置75和179的位置的取代,如上述的那些。
在另一个方面,所述变体包含或组成为在对应于位置75和181的位置的取代,如上述的那些。
在另一个方面,所述变体包含或组成为在对应于位置75和183的位置的取代,如上述的那些。
在另一个方面,所述变体包含或组成为在对应于位置77和179的位置的取代,如上述的那些。
在另一个方面,所述变体包含或组成为在对应于位置77和181的位置的取代,如上述的那些。
在另一个方面,所述变体包含或组成为在对应于位置77和183的位置的取代,如上述的那些。
在另一个方面,所述变体包含或组成为在对应于位置179和181的位置的取代,如上述的那些。
在另一个方面,所述变体包含或组成为在对应于位置179和183的位置的取代,如上述的那些。
在另一个方面,所述变体包含或组成为在对应于位置181和183的位置的取代,如上述的那些。
在另一个方面,所述变体包含或组成为在对应于位置75,77,和179的 位置的取代,如上述的那些。
在另一个方面,所述变体包含或组成为在对应于位置75,77,和181的位置的取代,如上述的那些。
在另一个方面,所述变体包含或组成为在对应于位置75,77,和183的位置的取代,如上述的那些。
在另一个方面,所述变体包含或组成为在对应于位置75,179,和181的位置的取代,如上述的那些。
在另一个方面,所述变体包含或组成为在对应于位置75,179,和183的位置的取代,如上述的那些。
在另一个方面,所述变体包含或组成为在对应于位置75,181,和183的位置的取代,如上述的那些。
在另一个方面,所述变体包含或组成为在对应于位置77,179,和181的位置的取代,如上述的那些。
在另一个方面,所述变体包含或组成为在对应于位置77,179,和183的位置的取代,如上述的那些。
在另一个方面,所述变体包含或组成为在对应于位置179,181,和183的位置的取代,如上述的那些。
在另一个方面,所述变体包含或组成为在对应于位置77,181,和183的位置的取代,如上述的那些。
在另一个方面,所述变体包含或组成为在对应于位置75,77,179,和181的位置的取代,如上述的那些。
在另一个方面,所述变体包含或组成为在对应于位置75,179,181,和183的位置的取代,如上述的那些。
在另一个方面,所述变体包含或组成为在对应于位置75,77,181,和183的位置的取代,如上述的那些。
在另一个方面,所述变体包含或组成为在对应于位置75,77,179,和183的位置的取代,如上述的那些。
在另一个方面,所述变体包含或组成为在对应于位置77,179,181,和183的位置的取代,如上述的那些。
在另一个方面,所述变体包含或组成为在对应于位置75,77,179,181,和183的位置的取代,如上述的那些。
在另一个方面,所述变体包含或组成为一个或多个(例如几个)选自下组的取代:I75V,F77L,F179I,I181L,和I183V。
在另一个方面,所述变体包含或组成为SEQ ID NO:2的成熟多肽的取代I75V+F77L。
在另一个方面,所述变体包含或组成为SEQ ID NO:2的成熟多肽的取代I75V+F179I。
在另一个方面,所述变体包含或组成为SEQ ID NO:2的成熟多肽的取代I75V+I181L。
在另一个方面,所述变体包含或组成为SEQ ID NO:2的成熟多肽的取代I75V+I183V。
在另一个方面,所述变体包含或组成为SEQ ID NO:2的成熟多肽的取代F77L+F179I。
在另一个方面,所述变体包含或组成为SEQ ID NO:2的成熟多肽的取代F77L+I181L。
在另一个方面,所述变体包含或组成为SEQ ID NO:2的成熟多肽的取代F77L+I183V。
在另一个方面,所述变体包含或组成为SEQ ID NO:2的成熟多肽的取代F179I+I181L。
在另一个方面,所述变体包含或组成为SEQ ID NO:2的成熟多肽的取代F179I+I183V。
在另一个方面,所述变体包含或组成为SEQ ID NO:2的成熟多肽的取代I181L+I183V。
在另一个方面,所述变体包含或组成为SEQ ID NO:2的成熟多肽的取代I75V+F77L+F179I。
在另一个方面,所述变体包含或组成为SEQ ID NO:2的成熟多肽的取代I75V+F77L+I181L。
在另一个方面,所述变体包含或组成为取SEQ ID NO:2的成熟多肽的代I75V+F77L+I183V。
在另一个方面,所述变体包含或组成为SEQ ID NO:2的成熟多肽的取代I75V+F179I+I181L。
在另一个方面,所述变体包含或组成为SEQ ID NO:2的成熟多肽的取代 I75V+F179I+I183V。
在另一个方面,所述变体包含或组成为SEQ ID NO:2的成熟多肽的取代I75V+I181L+I183V。
在另一个方面,所述变体包含或组成为SEQ ID NO:2的成熟多肽的取代F77L+F179I+I181L。
在另一个方面,所述变体包含或组成为SEQ ID NO:2的成熟多肽的取代F77L+F179I+I183V。
在另一个方面,所述变体包含或组成为SEQ ID NO:2的成熟多肽的取代F179I+I181L+I183V。
在另一个方面,所述变体包含或组成为SEQ ID NO:2的成熟多肽的取代F77L+I181L+I183V。
在另一个方面,所述变体包含或组成为SEQ ID NO:2的成熟多肽的取代I75V+F77L+F179I+I181L。
在另一个方面,所述变体包含或组成为SEQ ID NO:2的成熟多肽的取代I75V+F179I+I181L+I183V。
在另一个方面,所述变体包含或组成为SEQ ID NO:2的成熟多肽的取代I75V+F77L+I181L+I183V。
在另一个方面,所述变体包含或组成为SEQ ID NO:2的成熟多肽的取代I75V+F77L+F179I+I183V。
在另一个方面,所述变体包含或组成为SEQ ID NO:2的成熟多肽的取代F77L+F179I+I181L+I183V。
在另一个方面,所述变体包含或组成为SEQ ID NO:2的成熟多肽的取代I75V+F77L+F179I+I181L+I183V。
本发明的变体可进一步在一个或多个(例如几个)其它位置包含改变,例如缺失、插入和/或取代。
氨基酸改变可为性质上较不重要的(of a minor nature),即保守的氨基酸取代或插入,其不显著影响蛋白质的折叠和/或活性;通常为1至大约30个氨基酸的小缺失;小的氨基或羧基末端延伸,例如氨基末端甲硫氨酸残基;多至大约20-25个残基的小接头肽;或通过改变净电荷或其它功能来促进纯化的小延伸,如多组氨酸序列(poly histidinetract)、抗原表位(antigenic epitope)或结合域(binding domain)。
保守取代的实例是在以下组之内:碱性氨基酸组(精氨酸、赖氨酸和组氨酸)、酸性氨基酸组(谷氨酸和天冬氨酸)、极性氨基酸组(谷氨酰胺和天冬酰胺)、疏水氨基酸组(亮氨酸、异亮氨酸和缬氨酸)、芳族氨基酸组(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸组(甘氨酸、丙氨酸、丝氨酸、苏氨酸和甲硫氨酸)。通常不改变比活性(specific activity)的氨基酸取代是本领域已知的,并且由例如H.Neurath和R.L.Hill,1979,于The Proteins,Academic Press,New York中描述。最普遍发生的交换是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly。
或者,氨基酸改变具有这样的性质以使多肽的物理化学性质改变。例如,氨基酸改变可改善多肽的热稳定性,改变底物特异性,改变最适pH等。
能够根据本领域已知的方法,例如定位诱变或丙氨酸分区诱变法(Cunningham和Wells,1989,Science244:1081-1085)来鉴定亲本多肽中的必需氨基酸。在后一技术中,将单一丙氨酸突变引入到分子中的每个残基,并且就具有纤维素分解增强活性的多肽测试所得突变分子以鉴定对于所述分子的活性关键的氨基酸残基。同样参见Hilton等,1996,J.Biol.Chem.271:4699-4708。具有纤维素分解增强活性的多肽的活性部位或其它的生物相互作用也能够通过结构的物理分析而测定,如通过以下这些技术:如核磁共振、晶体学、电子衍射或光亲和标记,连同推定的接触位点氨基酸的突变来测定。参见例如de Vos等,1992,Science255:306-312;Smith等,1992,J.Mol.Biol.224:899-904;Wlodaver等,1992,FEBS Lett.309:59-64。必需氨基酸的身份也能够从与相关多肽的同一性分析来推断。
所述变体可组成为200至220个氨基酸,例如205至220,210至220,和215至220个氨基酸。
在一个实施方案中,所述变体具有增加的热活性。
在一个实施方案中,所述变体具有增加的热稳定性。
在一个实施方案中,所述变体具有增加的热活性和增加的热稳定性。
亲本具有纤维素分解增强活性的多肽
所述亲本具有纤维素分解增强活性的多肽可为(a)多肽,其与SEQ ID NO:2的成熟多肽具有至少60%序列同一性;(b)多肽,其由多核苷酸编码,所述多核苷酸在至少低严格条件下与以下杂交:(i)SEQ ID NO:1的成熟多肽编码 序列,(ii)其cDNA序列,或(iii)或(i)或(ii)的全长互补链;或(c)多肽,其由多核苷酸编码,所述多核苷酸与SEQ ID NO:1的成熟多肽编码序列或其cDNA序列具有至少60%序列同一性。
在一个方面,所述亲本与SEQ ID NO:2的成熟多肽具有至少60%,例如至少65%,至少70%,至少75%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%的序列同一性,并具有纤维素分解增强活性。在一个方面,亲本的氨基酸序列与SEQ ID NO:2的成熟多肽相差多至10个氨基酸,例如1、2、3、4、5、6、7、8、9或10个氨基酸。
在另一个方面,所述亲本包含或组成为SEQ ID NO:2的氨基酸序列。在另一个方面,所述亲本包含或组成为SEQ ID NO:2的成熟多肽。在另一个方面,所述亲本包含或组成为SEQ ID NO:2的氨基酸22至250。
在另一个方面,所述亲本为SEQ ID NO:2的成熟多肽含有至少200个氨基酸残基,例如至少210个氨基酸残基或至少220个氨基酸残基的片段。
在另一个方面中,所述亲本是SEQ ID NO:2的成熟多肽的等位变体。
在第二个方面,所述亲本由多核苷酸编码,所述多核苷酸在非常低严格条件、低严格条件、中等严格条件、中-高严格条件、高严格条件或非常高严格条件下,与以下杂交:(i)SEQ ID NO:1,(ii)其cDNA序列,或(iii)(i)或(ii)的全长互补链(J.Sambrook,E.F.Fritsch,和T.Maniatis,1989,Molecular Cloning,A Laboratory Manual,第2版,Cold Spring Harbor,New York)。
SEQ ID NO:1的多核苷酸或其亚序列,以及SEQ ID NO:2的多肽或其片段,可用于设计核酸探针,以根据本领域内公知的方法从不同属或种的菌株鉴定和克隆编码亲本的DNA。具体而言,根据标准的Southern印迹方法,可将这些探针用于与感兴趣的细胞的基因组DNA或cDNA杂交,以鉴定和从其中分离相应的基因。这些探针可明显短于完整序列,但长度上应为至少15,例如至少25,至少35,或至少70个核苷酸。优选地,所述核酸探针是至少100个核苷酸的长度,例如,至少200个核苷酸,至少300个核苷酸,至少400个核苷酸,至少500个核苷酸,至少600个核苷酸,至少700个核苷酸,至少800个核苷酸,或至少900个核苷酸的长度。DNA和RNA探针二者均可使用。通常将探针标记以探测相应的基因(例如,用32P、3H、35S、生物素 或抗生物素蛋白(avidin)标记)。这些探针涵盖于本发明中。
可从由这些其它菌株制备的基因组DNA或cDNA文库中筛选DNA,所述DNA与上述探针杂交并且编码亲本。可以通过琼脂糖或聚丙烯酰胺凝胶电泳,或通过其它分离技术分离来自这些其它菌株的基因组或其它DNA。可以将来自文库的DNA或分离的DNA转移至硝化纤维素(nitrocellulose)或其它合适的载体材料并且固定于其上。为了鉴定与SEQ ID NO:1或其亚序列杂交的克隆或DNA,将所述载体材料用在Sounthern印迹中。
就本发明而言,杂交表示多核苷酸在非常低至非常高的严格条件下与标记的核酸探针杂交,所述核酸探针对应于下述:(i)SEQ ID NO:1,(ii)SEQ ID NO:1的成熟多肽编码序列,(iii)其cDNA序列,(iv)其全长互补链,或(v)它们的亚序列。可使用例如X射线片(X-ray film)或其他任何本领域中已知的检测手段检测在这些条件下与核酸探针杂交的分子。
在一个方面,核酸探针是SEQ ID NO:1的成熟多肽编码序列或其cDNA序列。在另一个方面,核酸探针是SEQ ID NO:1的核苷酸64至859或其cDNA序列。在另一个方面,所述核酸探针是编码SEQ ID NO:2的多肽,其成熟多肽,或它们的片段的多核苷酸。在另一个方面,所述核酸探针是SEQ ID NO:1或其cDNA序列。
在另一个方面,所述亲本由多核苷酸编码,所述多核苷酸与SEQ ID NO:1的成熟多肽编码序列或其cDNA序列具有至少60%,例如至少65%,至少70%,至少75%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%或100%的序列同一性,并编码具有纤维素分解增强活性的多肽。在一个方面,所述成熟多肽编码序列是SEQ ID NO:1的核苷酸64至859。
所述亲本可为杂合多肽,其中一个多肽的区域融合于另一个多肽的区域的N端或C端。
所述亲本可为融合多肽或可切割的融合多肽,其中另一个多肽融合于本发明的多肽的N端或C端。通过将编码另一个多肽的多核苷酸融合于本发明的多核苷酸来产生融合多肽。产生融合多肽的技术是本领域已知的,并包括连接编码多肽的编码序列以使它们处于符合读框(in frame),并且使融合多肽的表达在相同启动子和终止子的控制下。融合蛋白亦可使用内蛋白(intein)技 术构建,其中融合物在翻译后产生(Cooper等,1993,EMBOJ.12:2575-2583;Dawson等,1994,Science266:776-779)。
融合多肽还可以在两个多肽之间包含切割位点。一旦分泌了融合多肽,就切割所述位点,释放所述两个多肽。切割位点的实例包括,但不限于,公开于Martin等,2003,J.Ind.Microbiol.Biotechnol.3:568-76;Svetina等,2000,J.Biotechnol.76:245-251;Rasmussen-Wilson等,1997,Appl.Environ.Microbiol.63:3488-3493;Ward等,1995,Biotechnology13:498-503;和Contreras等,1991,Biotechnology9:378-381;Eaton等,1986,Biochem.25:505-512);Collins-Racie等,1995,Biotechnology13:982-987;Carter等,1989,Proteins:Structure,Function,and Genetics6:240-248;以及Stevens,2003,Drug Discovery World4:35-48中的位点。
所述亲本可以获得自任何属的微生物。就本发明而言,用于本文与给定的来源有关的术语“获得自”,意思应为由多核苷酸编码的亲本由所述来源产生,或由其中插入了来自所述来源的多核苷酸的菌株产生。在一个方面,所述亲本是胞外分泌的。
所述亲本可以是具有纤维素分解增强活性的细菌多肽。例如,所述亲本可为革兰氏阳性细菌多肽例如具有纤维素分解增强活性的芽孢杆菌属(Bacillus)、梭菌属(Clostridium)、肠球菌属(Enterococcus)、地芽孢杆菌属(Geobacillus)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、海洋芽孢杆菌属(Oceanobacillus)、葡萄球菌属(Staphylococcus)、链球菌属(Streptococcus)、或链霉菌属(Streptomyces)多肽;或革兰氏阴性细菌多肽,如具有纤维素分解增强活性的弯曲杆菌属(Campylobacter)、大肠杆菌(E.coli)、黄杆菌属(Flavobacterium)、梭杆菌属(Fusobacterium)、螺杆菌属(Helicobacter)、泥杆菌属(Ilyobacter)、奈瑟氏菌属(Neisseria)、假单胞菌属(Pseudomonas)、沙门氏菌属(Salmonella)或脲原体属(Ureaplasma)多肽。
在一个方面,所述亲本是具有纤维素分解增强活性的嗜碱芽孢杆菌(Bacillusalkalophilus)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、短芽孢杆菌(Bacillusbrevis)、环状芽孢杆菌(Bacillus circulans)、克劳氏芽孢杆菌(Bacillus clausii)、凝结芽孢杆菌(Bacillus coagulans)、坚强芽孢杆菌(Bacillus firmus)、灿烂芽孢杆菌(Bacillus lautus)、迟缓芽孢杆菌(Bacillus lentus)、地衣芽孢杆菌(Bacilluslicheniformis)、巨大芽孢杆菌(Bacillus megaterium)、短小芽孢杆菌 (Bacilluspumilus)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)、枯草芽孢杆菌(Bacillussubtilis)或苏云金芽孢杆菌(Bacillus thuringiensis)多肽。
在另一个方面,所述亲本是具有纤维素分解增强活性的似马链球菌(Streptococcus equisimilis)、酿脓链球菌(Streptococcus pyogenes)、乳房链球菌(Streptococcus uberis)或马链球菌兽瘟亚种(Streptococcus equisubsp.Zooepidemicus)多肽。
在另一个方面,所述亲本是具有纤维素分解增强活性的不产色链霉菌(Streptomyces achromogenes)、除虫链霉菌(Streptomyces avermitilis)、天蓝链霉菌(Streptomyces coelicolor)、灰色链霉菌(Streptomyces griseus)或浅青紫链霉菌(Streptomyces lividans)多肽。
所述亲本可为具有纤维素分解增强活性的真菌多肽。例如,所述亲本可为具有纤维素分解增强活性的酵母多肽如具有纤维素分解增强活性的假丝酵母属(Candida)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)或西洋蓍霉属(Yarrowia)多肽。例如,所述亲本可为具有纤维素分解增强活性的丝状真菌多肽如具有纤维素分解增强活性的枝顶孢霉属(Acremonium)、伞菌属(Agaricus)、链格孢属(Alternaria)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、Botryospaeria、拟蜡菌属(Ceriporiopsis)、毛喙壳属(Chaetomidium)、金孢子菌属(Chrysosporium)、Claviceps、Cochliobolus、鬼伞属(Coprinopsis)、Coptotermes、棒囊壳属(Corynascus)、隐丛赤壳菌属(Cryphonectria)、隐球菌属(Cryptococcus)、色二孢属(Diplodia)、黑耳属(Exidia)、Filibasidium、镰孢属(Fusarium)、赤霉属(Gibberella)、全鞭毛虫属(Holomastigotoides)、腐质霉属(Humicola)、耙齿菌属(Irpex)、蘑菇属(Lentinula)、Leptospaeria、梨孢菌属(Magnaporthe)、Melanocarpus、多孔菌属(Meripilus)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、新考玛脂霉属(Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、平革菌属(Phanerochaete)、瘤胃壶菌属(Piromyces)、Poitrasia、假黑盘菌属(Pseudoplectania)、Pseudotrichonympha、根毛霉属(Rhizomucor)、裂褶菌属(Schizophyllum)、柱顶孢属(Scytalidium)、踝节菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、木霉属(Trichoderma)、长毛盘菌属(Trichophaea)、轮枝孢属(Verticillium)、包脚菇属(Volvariella)或炭角菌属(Xylaria)多肽。
在另一个方面,所述亲本是具有纤维素分解增强活性的卡尔酵母(Saccharomycescarlsbergensis)、酿酒酵母(Saccharomyces cerevisiae)、糖化酵母(Saccharomycesdiastaticus)、道格拉氏酵母(Saccharomyces douglasii)、克鲁弗酵母(Saccharomyceskluyveri)、诺地酵母(Saccharomyces norbensis)或卵形酵母(Saccharomycesoviformis)多肽。
在另一个方面,所述亲本是具有纤维素分解增强活性的解纤维枝顶孢霉(Acremonium cellulolyticus)、棘孢曲霉(Aspergillus aculeatus)、泡盛曲霉(Aspergillus awamori)、臭曲霉(Aspergillus foetidus)、烟曲霉(Aspergillusfumigatus)、日本曲霉(Aspergillus japonicus)、构巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillus niger)、米曲霉(Aspergillus oryzae)、Chrysosporium inops、嗜角质金孢子菌(Chrysosporium keratinophilum)、Chrysosporium lucknowense、Chrysosporium merdarium、毡金孢子菌(Chrysosporium pannicola)、Chrysosporiumqueenslandicum、热带金孢子菌(Chrysosporium tropicum)、Chrysosporium zonatum、杆孢状镰孢(Fusarium bactridioides)、禾谷镰孢(Fusarium cerealis)、库威镰孢(Fusarium crookwellense)、大刀镰孢(Fusarium culmorum)、禾本科镰孢(Fusariumgraminearum)、禾赤镰孢(Fusarium graminum)、异孢镰孢(Fusarium heterosporum)、合欢木镰孢(Fusarium negundi)、尖镰孢(Fusarium oxysporum)、多枝镰孢(Fusariumreticulatum)、粉红镰孢(Fusarium roseum)、接骨木镰孢(Fusarium sambucinum)、肤色镰孢(Fusarium sarcochroum)、拟分枝孢镰孢(Fusarium sporotrichioides)、硫色镰孢(Fusarium sulphureum)、圆镰孢(Fusarium torulosum)、拟丝孢镰孢(Fusariumtrichothecioides)、镶片镰孢(Fusarium venenatum)、灰腐质霉(Humicola grisea)、特异腐质霉(Humicola insolens)、疏棉状腐质霉(Humicola lanuginosa)、白耙齿菌(Irpexlacteus)、米黑毛霉(Mucor miehei)、嗜热毁丝霉(Myceliophthora thermophila)、粗糙脉孢菌(Neurospora crassa)、绳状青霉(Penicillium funiculosum)、产紫青霉(Penicillium purpurogenum)、黄孢平革菌(Phanerochaete chrysosporium)、无色梭孢壳(Thielavia achromatica)、Thielavia albomyces、Thielavia albopilosa、澳洲梭孢壳(Thielavia australeinsis)、Thielavia fimeti、小孢梭孢壳(Thielavia microspora)、卵孢梭孢壳(Thielavia ovispora)、Thielavia peruviana、毛梭孢壳(Thielaviasetosa)、瘤孢梭孢壳(Thielavia spededonium)、Thielavia subthermophila、土生梭孢霉(Thielavia terrestris)、哈茨木霉(Trichoderma harzianum)、康宁木霉(Trichodermakoningii)、长枝木霉 (Trichoderma longibrachiatum)、里氏木霉(Trichoderma reesei)或绿色木霉(Trichoderma viride)多肽。
在另一个方面,所述亲本是具有纤维素分解增强活性的烟曲霉多肽,例如包含SEQID NO:2的成熟多肽的多肽。
可理解的是对于前述的种,本发明包含完全和不完全阶段(perfect andimperfect states),和其它分类学的等同物(equivalent),例如无性型(anamorph),而无论它们已知的种名。本领域技术人员将容易地识别适合的等同物的身份。
这些种的菌株在许多培养物保藏中心对于公众能够容易地取得,所述保藏中心诸如美国典型培养物保藏中心(the American Type Culture Collection)(ATCC)、德意志微生物和细胞培养物保藏中心(Deutsche Sammlung vonMikroorganismen undZellkulturen GmbH)(DSMZ)、真菌菌种保藏中心(Centraalbureau VoorSchimmelcultures)(CBS)和农业研究机构专利培养物保藏中心北区研究中心(Agricultural Research Service Patent Culture Collection,Northern RegionalResearch Center)(NRRL)。
可以使用上述的探针从其它来源,包括从自然界(例如,土壤、堆肥、水等)分离的微生物或直接获得自自然材料(例如,土壤、堆肥、水等)的DNA样品鉴定和获得所述亲本。用于直接从天然生境(habitat)分离微生物和DNA的技术是本领域内公知的。随后可通过相似地筛选另一种微生物的基因组DNA或cDNA文库或混合的DNA样品来得到编码所述亲本的多核苷酸。一旦用探针检测到编码亲本的多核苷酸,就可以使用本领域普通技术人员已知的技术将所述多核苷酸分离或克隆(参见,例如,Sambrook等,1989,见上文)。
变体的制备
本发明还涉及用于获得具有纤维素分解增强活性的变体的方法,所述方法包括:(a)将在对应于SEQ ID NO:2的成熟多肽的位置75,77,179,181,和183的一个或多个(例如几个)位置将取代引入具有纤维素分解增强活性的亲本多肽,其中所述变体具有纤维素分解增强活性;和(b)回收所述变体。
所述变体可使用本领域任何已知的任何诱变方法,如定位诱变、合成基因构建(synthetic gene construction)、半合成基因构建(semi synthetic geneconstruction)、随机诱变、改组(shuffling)等来制备。
定位诱变是在编码亲本的多核苷酸上的一个或多个确定位点导入一个或多个(例如几个)突变的技术。
定位诱变可在体外通过PCR达成,涉及使用含有所期望突变的寡核苷酸引物。定位诱变亦可在体外通过表达盒诱变进行,涉及用限制酶在包含编码亲本的多核苷酸的质粒中的位点进行切割,然后将含有突变的寡核苷酸连接到所述多核苷酸中。通常在质粒上和在寡核苷酸上进行消化的限制酶是相同的,使所述质粒和插入物的粘性末端能够彼此连接。参见,例如,Scherer和Davis,1979,Proc.Natl.Acad.Sci.USA76:4949-4955;以及Barton等,1990,Nucleic Acids Res.18:7349-4966。
定位诱变亦可在体内通过本领域已知方法达成。参见,例如,美国专利申请公开号2004/0171154;Storici等,2001,Nature Biotechnol.19:773-776;Kren等,1998,Nat.Med.4:285-290;以及Calissano和Macino,1996,Fungal Genet.Newslett.43:15-16。
任何定位诱变方法可用于本发明。有许多可用的市售试剂盒可用于制备变体。
合成基因构建涉及在体外合成设计为编码目标多肽的多核苷酸分子。基因合成可使用多种技术进行,如由Tian等(2004,Nature432:1050-1054)所述基于多通道微芯片(multiplex microchip-based)的技术,以及类似的技术,其中合成寡核苷酸并在光可编程的(photo-programmable)微流芯片(microfluidic chip)上组装。
可使用已知的诱变、重组和/或改组方法,然后进行相关的筛选过程,如由Reidhaar-Olson和Sauer,1988,Science241:53-57;Bowie和Sauer,1989,Proc.Natl.Acad.Sci.USA86:2152-2156;WO95/17413;或者WO95/22625所公开的那些,进行一个或多个氨基酸取代、缺失和/或插入并加以测试。其他可使用的方法包括易错PCR、噬菌体展示(例如Lowman等,1991,Biochemistry 30:10832-10837;美国专利号5,223,409;WO92/06204)和区域定向诱变(region-directed mutagenesis)(Derbyshire等,1986,Gene46:145;等,1988,DNA 7:127)。
诱变/改组方法可与高通量、自动筛选方法组合以检测由宿主细胞表达的经克隆、诱变的多肽的活性(Ness等,1999,Nature Biotechnology17:893-896)。编码活性多肽的经诱变的DNA分子可自宿主细胞回收并使用本领域标准方法迅速测序。这些方法允许快速确定多肽中单个氨基酸残基的重要性。
半合成基因构建通过组合合成基因构建、和/或定位诱变、和/或随机诱变、 和/或改组的方面而达成。半合成构建通常为使用合成的多核苷酸片段与PCR技术组合的方法。基因的确定区域可因而从头开始合成,而其他区域可使用定位诱变引物扩增,还可对另外的其他区域进行易错PCR或非易错PCR(non-error prone PCR)扩增。多核苷酸亚序列可随后进行改组。
多核苷酸
本发明还涉及编码本发明的变体的分离的多核苷酸。
核酸构建体
本发明还涉及包含编码本发明的变体的多核苷酸的核酸构建体,所述多核苷酸与一个或多个调控序列可操作地连接,所述调控序列在合适的宿主细胞中在与该调控序列相容的条件下指导编码序列的表达。
可以用许多方式操作所述多核苷酸以提供变体的表达。依赖于表达载体,在将多核苷酸插入载体之前对其进行操作可能是理想的或必需的。使用重组DNA方法修饰多核苷酸的技术是本领域熟知的。
调控序列可为启动子,其由用于表达多核苷酸的宿主细胞所识别的多核苷酸。启动子含有介导多肽的表达的转录调控序列。启动子可以是在宿主细胞中显示转录活性的任何多核苷酸,包括突变的、截短的和杂合的启动子,并且可以从编码与宿主细胞同源或异源的胞外或胞内多肽的基因获得。
用于在细菌宿主细胞中指导本发明的核酸构建体转录的合适启动子的实例是从下述获得的启动子:解淀粉芽孢杆菌α-淀粉酶基因(amyQ)、地衣芽孢杆菌α-淀粉酶基因(amyL)、地衣芽孢杆菌青霉素酶基因(penP)、嗜热脂肪芽孢杆菌产麦芽淀粉酶基因(amyM)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、枯草芽孢杆菌xylA和xylB基因、苏云金芽孢杆菌(Bacillus thuringiensis)cryIIIA基因(Agaisse 和Lereclus,1994,MolecularMicrobiology13:97-107)、大肠杆菌lac操纵子、大肠杆菌trc启动子(Egon等,1988,Gene69:301-315)、天蓝链霉菌琼脂糖酶基因(dagA)和原核β-内酰胺酶基因(Villa-Kamaroff等,1978,Proceedings of the National Academy of Sciences USA75:3727-3731),以及tac启动子(DeBoer等,1983,Proc.Natl.Acad.Sci.USA80:21-25)。另外的启动子在"Useful proteins from recombinant bacteria"于Gilbert等,1980,ScientificAmerican,242:74-94中;和在Sambrook等,1989,见上文中描述。串联启动子的实例公开于WO99/43835。
用于指导本发明的核酸构建体在丝状真菌宿主细胞中转录的合适启动子的实例是从下列酶的基因获得的启动子:构巢曲霉乙酰胺酶、黑曲霉中性α-淀粉 酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、米曲霉TAKA淀粉酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、尖镰孢胰蛋白酶样蛋白酶(WO96/00787)、镶片镰孢淀粉葡糖苷酶(WO00/56900)、镶片镰孢Daria(WO00/56900)、镶片镰孢Quinn(WO00/56900)、曼赫根毛霉(Rhizomucor miehei)脂肪酶、曼赫根毛霉天冬氨酸蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶、里氏木霉翻译延伸因子,以及NA2-tpi启动子(一种修饰的启动子,其来自在曲霉属中性α-淀粉酶基因,其中未翻译的前导序列由曲霉属丙糖磷酸异构酶的基因的未翻译的前导序列所替代;非限制性实例包括修饰的启动子,其来自黑曲霉中性α-淀粉酶的基因,其中未翻译的前导序列由构巢曲霉或米曲霉丙糖磷酸异构酶的基因的未翻译的前导序列所替代);和它们的突变的、截短的和杂合的启动子。其它启动子描述于美国专利号6,011,147。
在酵母宿主中,有用的启动子从如下的基因获得:酿酒酵母烯醇化酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH1,ADH2/GAP)、酿酒酵母丙糖磷酸异构酶(TPI)、酿酒酵母金属硫蛋白(CUP1)和酿酒酵母3-磷酸甘油酸激酶。对于酵母宿主细胞其它有用的启动子由Romanos等,1992,Yeast8:423-488描述。
调控序列也可以是转录终止子序列,其由宿主细胞识别以终止转录。所述终止子序列与编码所述变体的多核苷酸的3’末端可操作地连接。可以使用在宿主细胞中有功能的任何终止子。
对于细菌宿主细胞优选的终止子从如下的基因获得:克劳氏芽孢杆菌碱性蛋白酶(aprH)、地衣芽孢杆菌α-淀粉酶(amyL)和大肠杆菌核糖体RNA(rrnB)。
对于丝状真菌宿主细胞优选的终止子从如下酶的基因获得:构巢曲霉乙酰胺酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶、尖镰孢胰蛋白酶样蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶和里氏木霉翻译延伸因子。
对于酵母宿主细胞优选的终止子从如下酶的基因获得:酿酒酵母烯醇化酶、酿酒酵母细胞色素C(CYC1)和酿酒酵母甘油醛-3-磷酸脱氢酶。对于酵母宿主细胞其它有用的终止子由Romanos等,1992,见上文描述。
调控序列还可以是启动子下游和本发明的变体的编码序列上游的mRNA稳定化区,其增加所述变体的表达。
合适的mRNA稳定化区的实例从如下的基因获得:苏云金芽孢杆菌cryIIIA基因(WO94/25612)和枯草芽孢杆菌SP82基因(Hue等,1995,Journal of Bacteriology177:3465-3471)。
调控序列还可以是合适的前导序列,其为对于宿主细胞的翻译重要的mRNA非翻译区。前导序列可操作地连接于编码变体的多核苷酸的5’-末端。可使用在宿主细胞中有功能的任何前导序列。
对于丝状真菌宿主细胞优选的前导序列从如下酶的基因获得:米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶。
对于酵母宿主细胞合适的前导序列从如下酶的基因获得:酿酒酵母烯醇化酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α因子和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。
调控序列也可以是聚腺苷酸化序列,其是与变体编码序列的3’末端可操作地连接的序列,并且在转录时,宿主细胞将其识别为将聚腺苷残基添加至转录的mRNA的信号。可使用在宿主细胞中有功能的任何聚腺苷酸化序列。
对于丝状真菌宿主细胞优选的聚腺苷酸化序列从如下酶的基因获得:构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶和尖镰孢胰蛋白酶样蛋白酶。
对于酵母宿主细胞有用的聚腺苷酸化序列由Guo和Sherman,1995,Mol.CellularBiol.15:5983-5990描述。
调控序列还可以是信号肽编码区,其编码与变体的N端相连的信号肽,并且指导所述变体进入细胞分泌途径。多核苷酸的编码序列5’端可固有地包含信号肽编码序列,其与编码所述变体的编码序列的区段一起天然地连接在翻译阅读框中。或者,编码序列5’端可含有对于所述编码序列外源的信号肽编码序列。外源信号肽编码序列在编码序列不天然地含有信号肽编码序列时可为必需的。或者,外源信号肽编码序列可以简单地取代天然信号肽编码序列以增强变体的分泌。然而,可使用指导表达的变体进入宿主细胞的分泌途径的任何信号肽编码序列。
对于细菌宿主细胞有效的信号肽编码序列是从如下酶的基因获得的信号肽编码序列:芽孢杆菌属NCIB11837产麦芽糖淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶(subtilisin)、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌α-淀粉酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT,nprS,nprM)和枯草芽孢杆菌prsA。另外的信号肽由Simonen和Palva,1993,Microbiological Reviews57:109-137描述。
对于丝状真菌宿主细胞有效的信号肽编码序列是从如下酶的基因获得的信号肽编码序列:黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶V、疏棉状腐质霉脂肪酶和曼赫根毛霉天冬氨酸蛋白酶。
对于酵母宿主细胞有用的信号肽从酿酒酵母α因子和酿酒酵母转化酶的基因获得。其它有用的信号肽编码序列由Romanos等,1992,见上文描述。
调控序列还可以是前肽编码序列,其编码位于变体N端的前肽。所得多肽称为酶原(proenzyme)或前多肽(propolypeptide)(或在某些情况下称为酶原(zymogen))。前多肽通常是无活性的,并且能够通过前肽的催化或自催化切割从前多肽转化为活性多肽。可以从枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、嗜热毁丝霉漆酶(WO95/33836)、曼赫根毛霉天冬氨酸蛋白酶和酿酒酵母α因子的基因获得前肽编码序列。
当信号肽和前肽序列二者均存在时,将前肽序列置于紧接着(next to)变体N端,并且将信号肽序列置于紧接着前肽序列的N端。
同样理想的是添加调节序列,其相对于宿主细胞的生长来调节变体的表达。调节序列的实例是引起基因表达响应化学或物理刺激物,包括调节化合物的存在而开启或关闭的那些系统。原核系统中的调节序列包括lac、tac和trp操纵基因系统。在酵母中,可使用ADH2系统或GAL1系统。在丝状真菌中,可以使用黑曲霉葡糖淀粉酶启动子、米曲霉TAKAα-淀粉酶启动子和米曲霉葡糖淀粉酶启动子、里氏木霉纤维二糖水解酶I启动子和里氏木霉纤维二糖水解酶II启动子。调节序列的其它实例是那些允许基因扩增的序列。在真核系统中,这些调节序列包括在氨甲蝶呤(methotrexate)存在下扩增的二氢叶酸还原酶基因,和以重金属(with heavy metal)扩增的金属硫蛋白基因。在这些情况下,编码变体的多核苷酸将与调节序列可操作地连接。
表达载体
本发明还涉及重组表达载体,所述重组表达载体包含编码本发明的变体的 多核苷酸、启动子和转录和翻译终止信号。多种核苷酸和调控序列可以结合在一起以产生重组表达载体,所述表达载体可以包括一个或多个(例如几个)方便的限制位点以允许在这些位点插入或取代编码变体的多核苷酸。可供选择的是,可以通过在适当的用于表达的载体中插入包含所述多核苷酸的核酸构建体或多核苷酸来表达所述多核苷酸。在制备表达载体的过程中,将编码序列置于载体中,从而将该编码序列与适当的调控序列可操作地连接以供表达。
重组表达载体可以是任何载体(例如,质粒或病毒),其能够方便地进行重组DNA步骤,并且能够产生多核苷酸的表达。载体的选择将通常依赖于载体与将引入该载体的宿主细胞的相容性。载体可以是线状或闭合环状质粒。
载体可以是自主复制载体,即,作为染色体外实体(entity)存在的载体,其复制独立于染色体复制,例如,质粒、染色体外元件、微型染色体(minichromosome)或人工染色体。载体可以含有任何用于确保自复制的手段(means)。或者,载体可以是一种当被引入宿主细胞中时,整合到基因组中并且与整合了该载体的染色体一起复制的载体。此外,可以使用单独的载体或质粒或两个或更多个载体或质粒,其共同含有待引入宿主细胞基因组的完整DNA(total DNA),或可以使用转座子(transposon)。
所述载体优选地含有一个或多个(例如几个)选择性标记,其允许简单选择经转化、转染、转导等的细胞。选择性标记是基因,其产物提供杀生物剂或病毒抗性、对重金属的抗性、对营养缺陷型的原养性(prototrophy to auxotrophs)等。
细菌选择性标记的实例是地衣芽孢杆菌或枯草芽孢杆菌dal基因,或赋予抗生素抗性的标记,所述抗生素抗性例如氨苄青霉素、氯霉素、卡那霉素、新霉素、壮观霉素或四环素抗性。对于酵母宿主细胞合适的标记包括但不限于ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于丝状真菌宿主细胞的选择性标记包括但不限于adeA(磷酸核糖氨基咪唑琥珀羧酰胺合酶,phosphoribosylaminoimidazole-succinocarboxamide synthase)、adeB(磷酸核糖氨基咪唑合酶,phosphoribosyl-aminoimidazole synthase)、amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草铵膦(phosphinothricin)乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)(nitrate reductase)、pyrG(乳清酸核苷-5’-磷酸脱羧酶)(orotidine-5’-phosphate decarboxylase)、sC(硫酸腺苷酰转移酶)和trpC(邻氨基苯甲酸合酶(anthranilate synthase))以及它们的等同物。优选用在曲霉属细胞中的是构巢曲霉或米曲霉amdS和pyrG基因和吸水链霉菌 (Streptomyces hygroscopicus)bar基因。优选用于木霉属细胞的是adeA、adeB、amdS、hph和pyrG基因。
选择性标记可为WO2010/039889中所述的双重选择性标记系统。在一个方面,所述双重选择性标记是hph-tk双重选择性标记系统。
所述载体优选含有元件,其允许载体整合入宿主细胞基因组或载体在细胞中独立于基因组的自主复制。
为了整合入宿主细胞基因组,载体可依赖编码变体的多核苷酸的序列或用于通过同源或非同源重组整合入基因组的任何其它载体元件。或者,载体可以含有额外的多核苷酸,用于指导通过同源重组整合入宿主细胞基因组染色体中的精确位置。为了增加在精确位置整合的可能性,整合元件应含有足够数量的核酸,如100至10,000碱基对,400至10,000碱基对,和800至10,000碱基对,其与相应的目标序列具有高度序列同一性以增强同源重组的概率。整合元件可以是任何序列,其与宿主细胞基因组中的目标序列同源。此外,整合元件可以是非编码或编码的多核苷酸。另一方面,可以将载体通过非同源重组整合到宿主细胞的基因组中。
为了自主复制,载体可以进一步包含复制起点,其使载体能够在所述的宿主细胞中自主地复制。复制起点可以是介导自主复制的任何质粒复制子(replicator),其在细胞中发挥功能。术语“复制起点”或“质粒复制子”意指能够使质粒或载体体内复制的多核苷酸。
细菌复制起点的实例是允许在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177和pACYC184的复制起点,和允许在芽孢杆菌属中复制的质粒pUB110、pE194、pTA1060和pAMβ1的复制起点。
用于酵母宿主细胞中的复制起点的实例是2微米复制起点,ARS1,ARS4,ARS1和CEN3的组合,和ARS4和CEN6的组合。
在丝状真菌细胞中有用的复制起点的实例是AMA1和ANS1(Gems等,1991,Gene98:61-67;Cullen等,1987,Nucleic Acids Res.15:9163-9175;WO 00/24883)。分离AMA1基因和构建包含该基因的质粒或载体能够根据公开于WO00/24883中的方法完成。
可以将多于一个拷贝的本发明的多核苷酸插入宿主细胞以增加变体的产生。多核苷酸拷贝数的增加可通过如下方法获得:将至少一个额外拷贝的序列整合入宿主细胞基因组,或将可扩增的选择性标记基因包括于多核苷酸, 其中可通过在合适的选择剂(selectable agent)存在下培养细胞来选择含有选择性标记基因的扩增拷贝,且由此含有多核苷酸的额外拷贝的细胞。
用于连接上述元件以构建本发明的重组表达载体的方法是本领域技术人员熟知的(参见,例如,Sambrook等,1989,见上文)。
宿主细胞
本发明还涉及重组宿主细胞,其包含编码本发明的变体的多核苷酸可操作地连接于一个或多个(例如几个)指导本发明变体的产生的调控序列。将包含多核苷酸的构建体或载体引入宿主细胞,使所述构建体或载体如前所述作为染色体整合体或者作为自复制的染色体外载体维持。术语“宿主细胞”包括亲本细胞的任何后代,其由于复制过程中发生的突变而不同于亲本细胞。宿主细胞的选择将在很大程度上依赖于编码变体的基因及亲本的来源。
宿主细胞可以是在变体的重组产生中有用的任何细胞,例如,原核或真核细胞。
原核宿主细胞可以是任何革兰氏阳性或革兰氏阴性细菌。革兰氏阳性细菌包括但不限于,芽孢杆菌属、梭菌属、肠球菌属、地芽孢杆菌属、乳杆菌属、乳球菌属、海洋芽孢杆菌属、葡萄球菌属、链球菌属和链霉菌属。革兰氏阴性细菌包括但不限于,弯曲杆菌属、大肠杆菌、黄杆菌属、梭杆菌属、螺杆菌属、泥杆菌属、奈瑟氏菌属、假单胞菌属、沙门氏菌属和脲原体属。
细菌宿主细胞可以是任何芽孢杆菌属细胞,包括但不限于嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌和苏云金芽孢杆菌细胞。
细菌宿主细胞还可以是任何链球菌属细胞,包括但不限于,似马链球菌、酿脓链球菌、乳房链球菌和马链球菌兽瘟亚种细胞。
细菌宿主细胞还可以是任何链霉菌属细胞,包括但不限于,不产色链霉菌、除虫链霉菌、天蓝链霉菌、灰色链霉菌和浅青紫链霉菌细胞。
可通过如下方法实现将DNA引入到芽孢杆菌属细胞:原生质体转化(参见,例如,Chang和Cohen,1979,Mol.Gen.Genet.168:111-115),感受态细胞转化(参见,例如,Young和Spizizen,1961,J.Bacteriol.81:823-829或Dubnau和Davidoff-Abelson,1971,J.Mol.Biol.56:209-221),电穿孔(参见,例如,Shigekawa和Dower,1988,Biotechniques6:742-751)或接合(参见,例如,Koehler 和Thorne,1987,J.Bacteriol.169:5771-5278)。可通过如下方法实现将DNA引入到大肠杆菌细胞:原生质体转化(参见,例如,Hanahan,1983,J.Mol.Biol.166:557-580)或电穿孔(参见,例如,Dower等,1988,Nucleic Acids Res.16:6127-6145)。可通过如下方法实现将DNA引入到链霉菌属细胞:原生质体转化、电穿孔(参见,例如,Gong等,2004,Folia Microbiol.(Praha)49:399-405),接合(参见,例如,Mazodier等,1989,J.Bacteriol.171:3583-3585),或转导(参见,例如,Burke等,2001,Proc.Natl.Acad.Sci.USA98:6289-6294)。可通过如下方法实现将DNA引入到假单胞菌属细胞:电穿孔(参见,例如,Choi等,2006,J.Microbiol.Methods64:391-397)或接合(参见,例如,Pinedo和Smets,2005,Appl.Environ.Microbiol.71:51-57)。可通过如下方法实现将DNA引入到链球菌属细胞:天然感受态(natural competence)(参见,例如,Perry和Kuramitsu,1981,Infect.Immun.32:1295-1297),原生质体转化(参见,例如,Catt和Jollick,1991,Microbios.68:189-207),电穿孔(参见,例如,Buckley等,1999,Appl.Environ.Microbiol.65:3800-3804)或接合(参见,例如,Clewell,1981,Microbiol.Rev.45:409-436)。然而,可以使用本领域已知的将DNA引入宿主细胞的任何方法。
宿主细胞还可以是真核生物,如哺乳动物、昆虫、植物或真菌细胞。
宿主细胞可为真菌细胞。“真菌”用在本文包括以下门:子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)和接合菌门(Zygomycota)以及卵菌门(Oomycota)和所有有丝分裂孢子真菌(mitosporic fungi)(如由Hawksworth等,于Ainsworth and Bisby’s Dictionary of The Fungi,第8版,1995,CAB International,University Press,Cambridge,UK中所定义)。
真菌宿主细胞可为酵母细胞。“酵母”用在本文包括产子囊酵母(ascosporogenousyeast)(内孢霉目(Endomycetales))、产担子酵母(basidiosporogenous yeast)和属于半知菌类(Fungi Imperfecti)(芽孢纲(Blastomycetes))的酵母。由于酵母的分类在未来可能改变,就本发明而言,将酵母定义为如Biology and Activities of Yeast(Skinner,Passmore,和Davenport编,Soc.App.Bacteriol.Symposium Series No.9,1980)中所述。
酵母宿主细胞可为假丝酵母属、汉逊酵母属(Hansenula)、克鲁维酵母属、毕赤酵母属、酵母属、裂殖酵母属或西洋蓍霉属细胞,如乳酸克鲁维酵母(Kluyveromyceslactis)、卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母、卵形酵母、或解脂西洋蓍霉(Yarrowia lipolytica)细胞。
真菌宿主细胞可为丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门的亚门(如由Hawksworth等,1995,见上文,所定义)的所有丝状形式。丝状真菌通常的特征在于由壳多糖(chitin)、纤维素、葡聚糖、壳聚糖(chitosan)、甘露聚糖和其它复杂多糖组成的菌丝体壁。通过菌丝延伸进行营养生长,而碳分解代谢是专性需氧的。相反,酵母例如酿酒酵母的营养生长通过单细胞菌体的出芽生殖(budding)进行,而碳分解代谢可以是发酵的。
丝状真菌宿主细胞可为枝顶孢霉属、曲霉属、短梗霉属、烟管霉属(Bjerkandera)、拟蜡菌属、金孢子菌属、鬼伞属(Coprinus)、革盖菌属(Coriolus)、隐球菌属、Filibasidium、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新考玛脂霉属、脉孢菌属、拟青霉属、青霉属、平革菌属(Phanerochaete)、射脉菌属(Phlebia)、瘤胃壶菌属、侧耳属(Pleurotus)、裂褶菌属、踝节菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属(Trametes)或木霉属细胞。
例如,丝状真菌宿主细胞可为泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、黑刺烟管菌(Bjerkandera adusta)、干拟蜡菌(Ceriporiopsis aneirina)、Ceriporiopsis caregiea、Ceriporiopsis gilvescens、Ceriporiopsis pannocinta、Ceriporiopsis rivulosa、Ceriporiopsis subrufa、虫拟蜡菌(Ceriporiopsissubvermispora)、Chrysosporium inops、嗜角质金孢子菌、Chrysosporium lucknowense、Chrysosporium merdarium、毡金孢子菌、Chrysosporium queenslandicum、热带金孢子菌、Chrysosporium zonatum、灰盖鬼伞(Coprinus cinereus)、毛革盖菌(Coriolushirsutus)、杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、特异腐质霉、疏棉状腐质霉、米黑毛霉、嗜热毁丝霉、粗糙脉孢菌、产紫青霉、黄孢平革菌(Phanerochaete chrysosporium)、辐射射脉菌(Phlebiaradiata)、刺芹侧耳(Pleurotus eryngii)、土生梭孢霉、长绒毛栓菌(Trametes villosa)、变色栓菌(Trametes versicolor)、哈茨木霉、康宁木霉、长枝木霉、里氏木霉或绿色木霉细胞。
可以将真菌细胞通过涉及原生质体形成、原生质体转化和细胞壁再生的方法以本身公知的方式转化。用于转化曲霉属和木霉属宿主细胞的合适方法在EP238 023和Yelton等,1984,Proc.Natl.Acad.Sci.USA81:1470-1474以及Christensen等,1988,Bio/Technology6:1419-1422中描述。用于转化镰孢属菌种 的合适方法由Malardier等,1989,Gene78:147-156和WO96/00787描述。可以使用由如下文献描述的方法转化酵母:Becker和Guarente,于Abelson,J.N.和Simon,M.I.编,Guide to Yeast Genetics and MolecularBiology,Methods in Enzymology,Volume194,pp182-187,Academic Press,Inc.,NewYork;Ito等,1983,J.Bacteriol.153:163;和Hinnen等,1978,Proc.Natl.Acad.Sci.USA75:1920。
产生方法
本发明还涉及用于产生变体的方法,其包括:(a)在适于所述变体表达的条件下培养本发明的宿主细胞;和(b)回收所述变体。
使用本领域已知的方法在适合于产生所述变体的营养培养基中培养细胞。例如,可以通过在合适培养基中和允许表达和/或分离所述变体的条件下进行的摇瓶培养,或实验室或工业发酵罐中的小规模或大规模发酵(包括连续、分批、补料分批或固态发酵)来培养细胞。使用本领域已知的方法在合适的营养培养基中进行培养,所述营养培养基包含碳源和氮源和无机盐。合适的培养基能够从商业供应商获得或可以根据公开的组成制备(例如,在美国典型培养物保藏中心的目录中)。如果变体分泌到营养培养基中,该变体能够从所述培养基中直接回收。如果变体不分泌,则其能够从细胞裂解物(lysate)回收。
可以使用本领域已知的对于所述变体是特异性的方法来检测变体。这些检测方法包括但不限于特异性抗体的使用、酶产物的形成或酶底物的消失。例如,酶测定法(enzymeassay)可用于测定变体的活性。
变体可以通过本领域已知的方法回收。例如,变体可以通过常规方法从营养培养基中回收,所述常规方法包括但不限于收集、离心、过滤、提取、喷雾干燥、蒸发或沉淀。在一个方面,回收了整个发酵液
变体可以使用多种本领域已知的方法纯化以获得基本上纯的变体,所述方法包括但不限于层析(例如,离子交换、亲和、疏水、层析聚焦和大小排阻)、电泳方法(例如,制备型(preparative)等电聚焦)、差示溶解度(例如,硫酸铵沉淀)、SDS-PAGE或提取(参见,例如,Protein Purification,Janson和Ryden编,VCH Publishers,New York,1989)。
组合物
本发明还涉及包含本发明的变体的组合物。优选地,所述组合物富含此种变体。术语“富含”表明所述组合物的纤维素分解增强活性以例如至少1.1的富集因子增加。
所述组合物可包含本发明的变体作为主要酶组分,例如单组分组合物。或者,所述组合物可包含多种酶活性,如选自下组的一个或多个(几个)酶:纤维素酶、具有纤维素分解增强活性的多肽、半纤维素酶、酯酶、棒曲霉素(expansin)、漆酶、木质素分解酶、果胶酶、过氧化物酶、蛋白酶和膨胀素。
所述组合物可依照本领域中已知的方法制备,并可为液体或干组合物的形式。所述组合物可依照本领域中已知的方法稳定化。
所述组合物可为发酵液配制物或细胞组合物,如本文中所述。因此,本发明亦涉及发酵液配制物和细胞组合物,其包含本发明的变体。在一些实施方案中,所述组合物是含有机酸的细胞杀灭的全培养液,杀灭的细胞和/或细胞碎片,以及培养基。
术语“发酵液”用于本文中指由细胞发酵产生、不经历或仅经历最低限的回收和/或纯化的制备物。举例而言,当将微生物培养物生长至饱和,在限制碳的条件下温育以允许蛋白合成(例如由宿主细胞表达酶),并分泌入细胞培养基时,产生发酵液。所述发酵液可含有在发酵终止时得到的发酵材料的未分级或分级的内含物。通常而言,发酵液是未分级的,并包含用过的培养基和例如通过离心去除微生物细胞(例如丝状真菌细胞)之后存在的细胞碎片。在一些实施方案中,所述发酵液含有用过的细胞培养基,胞外酶,和能成活的和/或不能成活的(viable and/or nonviable)微生物细胞。
在一个实施方案中,所述发酵液配制物和细胞组合物包含第一有机酸组分和第二有机酸组分,所述第一有机酸组分包含至少一个1-5碳的有机酸和/或其盐,而所述第二有机酸组分包含至少一个6个或更多个碳的有机酸和/或其盐。在一个具体实施方案中,所述第一有机酸组分是乙酸、甲酸、丙酸、其盐,或前述两个或更多个的混合物,而所述第二有机酸组分是苯甲酸、环己烷羧酸、4-甲基缬草酸、苯乙酸、其盐,或前述两个或更多个的混合物。
在一个方面,所述组合物含有有机酸,并任选地进一步含有杀灭的细胞和/或细胞碎片。在一个实施方案中,从细胞杀灭的全培养液中移除所述杀灭的细胞和/或细胞碎片以提供不含这些组分的组合物。
所述发酵液配制物或细胞组合物可进一步包含防腐剂和/或抗微生物(例如抑菌)剂,包括但不限于山梨醇、氯化钠、山梨酸钾和其它本领域中已知的。
所述细胞杀灭的全培养液或组合物可进一步包含一种或多种酶活性,如纤维二糖水解酶、内切葡聚糖酶、β-葡糖苷酶、内切-β-1,3(4)-葡聚糖酶、葡 糖水解酶、木葡聚糖酶、木聚糖酶、木糖苷酶、阿拉伯呋喃糖苷酶、α-葡糖醛酸糖苷酶、乙酰木聚糖酯酶、甘露聚糖酶、甘露糖苷酶、α-半乳糖苷酶、甘露聚糖乙酰酯酶、半乳聚糖酶、阿拉伯聚糖酶、果胶酸裂合酶、果胶酶裂合酶、果胶酸裂合酶、多聚半乳糖醛酸酶、果胶乙酰酯酶、果胶甲酰酯酶、β-半乳糖苷酶、半乳聚糖酶、阿拉伯聚糖酶、α-阿拉伯呋喃糖苷酶、鼠李半乳糖醛酸酶(rhamnogalacturonase)、阿魏酸酯酶、鼠李半乳糖醛酸聚糖裂合酶(rhamnogalacturonanlyase)、鼠李半乳糖醛酸聚糖乙酰酯酶(rhamnogalacturonan acetyl esterase)、木半乳糖醛酸糖苷酶(xylogalacturonosidase)、木半乳糖醛酸聚糖酶(xylogalacturonase)、鼠李半乳糖醛酸聚糖裂合酶、木质素过氧化物酶、锰依存性过氧化物酶、杂合过氧化物酶(其具有木质素过氧化物酶和锰依存性过氧化物酶的组合性质)、葡糖淀粉酶、淀粉酶、蛋白酶和漆酶。
在一个实施方案中,所述细胞杀灭的全培养液或组合物包含纤维素分解酶,其包括但不限于(i)内切葡聚糖酶(EG)或1,4-D-葡聚糖-4-葡聚糖水解酶(EC3.2.1.4),(ii)外切葡聚糖酶,其包括1,4-D-葡聚糖葡聚糖水解酶(亦称作纤维糊精酶)(EC3.2.1.74)和1,4-D-葡聚糖纤维二糖水解酶(外切纤维二糖水解酶,CBH)(EC3.2.1.91),和(iii)β-葡糖苷酶(BG)或β-葡糖苷葡糖水解酶(EC3.2.1.21)。
所述细胞杀灭的全培养液或组合物可含有在发酵终止时得到的发酵材料的未分级内含物。通常而言,所述细胞杀灭的全培养液或组合物含有用过的培养基和在将微生物细胞(例如丝状真菌细胞)生长至饱和,在限制碳的条件下温育以允许蛋白合成(例如纤维素酶和/或葡糖苷酶的表达)之后存在的细胞碎片。在一些实施方案中,所述细胞杀灭的全培养液或组合物含有用过的细胞培养基,胞外酶,和杀灭的丝状真菌细胞。在一些实施方案中,在细胞杀灭的全培养液或组合物中存在的微生物细胞可使用本领域中已知的方法渗透和/或裂解。
如本文中所述的全培养液或细胞组合物通常为液体,但可含有不溶性组分,如杀灭的细胞、细胞碎片、培养基组分和/或不溶性酶。在一些实施方案中,可去除不溶性组分以提供澄清的液体组合物。
本发明的全培养液配制物和细胞组合物可通过WO 90/15861或WO 2010/096673中描述的方法来产生。
下文中给出本发明的组合物的优选用途的实例。组合物的剂量和组合物使用的其它条件可给予本领域已知的方法来确定。
用途
本发明还涉及下述使用变体或其组合物的方法。
本发明还涉及降解或转化纤维素材料的方法,其包括:在本发明的变体的存在下,用酶组合物处理纤维素材料。在一个方面,所述方法还包括回收已降解或转化的纤维素材料。所述纤维素材料的降解或转化的可溶性产物可从不溶性纤维素材料使用任何本领域中公知的方法分离,如例如离心、过滤和/或重力沉降。
本发明还涉及用于产生发酵产物的方法,其包括:(a)在本发明的变体的存在下,用酶组合物糖化纤维素材料;(b)用一种或多种(例如几种)发酵微生物发酵经糖化的纤维素材料以产生发酵产物;和(c)从发酵回收发酵产物。
本发明还涉及发酵纤维素材料的方法,其包括:用一种或多种(例如几种)发酵微生物发酵纤维素材料,其中所述纤维素材料是在本发明的变体的存在下用酶组合物糖化的。在一个方面,纤维素材料的发酵产生发酵产物。在另一个方面,所述方法进一步包括从发酵回收发酵产物。
本发明的方法可以用于将纤维素材料糖化成可发酵糖,并且将可发酵糖转化成很多有用的发酵产物,例如燃料、饮用乙醇和/或平台化学品(platform chemical)(例如酸、醇、酮、气体等)。从纤维素材料产生期望的发酵产物通常涉及预处理、酶水解(糖化)和发酵。
根据本发明的纤维素材料的处理可以使用本领域的常规工艺完成。此外,本发明的方法能使用经配置以依照发明操作的任何常规生物质加工设备进行。
水解(糖化)和发酵,分别或同时,包括但不限于,分离的水解和发酵(SHF)、同步糖化和发酵(SSF)、同步糖化和共发酵(SSCF)、混合的水解和发酵(HHF)、分离的水解和共发酵(SHCF)、混合的水解和共发酵(HHCF),和直接微生物转化(DMC),有时也称为合并的生物加工(consolidated bioprocessing,CBP)。SHF使用分离的处理步骤以首先将纤维素材料酶水解为可发酵糖,例如,葡萄糖,纤维二糖和戊糖单体,然后将可发酵糖发酵成为乙醇。在SSF中,纤维素材料的酶水解和糖变为乙醇的发酵在一个步骤中组合(Philippidis,G.P.,1996,Cellulose bioconversion technology,于Handbook on Bioethanol:Productionand Utilization,Wyman,C.E编,Taylor&Francis,Washington,DC,179-212)。SSCF包括多种糖的共发酵(Sheehan,J.,和Himmel,M.,1999,Enzymes,energy and the environment:Astrategic perspective on the U.S.Department of Energy’s research anddevelopment activities for bioethanol,Biotechnol.Prog.15:817-827)。HHF在同步糖化和水解步骤之外,还涉及单独的水解步骤,所述步骤可以在同一个反应器中进行。HHF过程中的步骤可以在不同的温度,即,高温酶法糖化,然后在发酵菌株能够耐受的较低温度进行SSF。DMC在一个或多个(例如几个)步骤中组合了所有三个过程(酶产生、水解和发酵),其中使用相同的生物体产生用于将纤维素转化成可发酵糖并将可发酵糖转化成终产物的酶(Lynd,L.R.,Weimer,P.J.,van Zyl,W.H.,和Pretorius,I.S.,2002,Microbial celluloseutilization:Fundamentals and biotechnology,Microbiol.Mol.Biol.Reviews66:506-577)。在本文可以理解的是,本领域中已知的任何方法,包括预处理、酶水解(糖化)、发酵,或它们的组合,可用于实施本发明的方法。
常规设备包括补料批式搅拌反应器、批式搅拌反应器、具有超滤的连续流搅拌反应器和/或连续活塞流柱式反应器(Fernanda de Castilhos Corazza,Flávio Faria deMoraes,Gisella Maria Zanin和Ivo Neitzel,2003,Optimal control in fed-batchreactor for the cellobiose hydrolysis,Acta Scientiarum.Technology 25:33-38;Gusakov,A.V.,和Sinitsyn,A.P.,1985,Kinetics of the enzymatic hydrolysis ofcellulose:1.A mathematical model for a batch reactor process,Enz.Microb.Technol.7:346-352)、研磨反应器(Ryu,S.K.,和Lee,J.M.,1983,Bioconversion of waste cellulose by using an attrition bioreactor,Biotechnol.Bioeng.25:53-65),或者具有由电磁场引起的强烈搅拌的反应器(Gusakov,A.V.,Sinitsyn,A.P.,Davydkin,I.Y.,Davydkin,V.Y.,Protas,O.V.,1996,Enhancementof enzymatic cellulose hydrolysis using a novel type of bioreactorwithintensive stirring induced by electromagnetic field,Appl.Biochem.Biotechnol.56:141-153)。其它反应器类型包括:流化床、升流层(upflowblanket)、固定化和用于水解和/或发酵的挤出机型的反应器。
预处理。在本发明的方法的实施中,可以使用本领域已知的任何预处理过程破坏植物细胞壁的纤维素材料组分(Chandra等,2007,Substratepretreatment:The key toeffective enzymatic hydrolysis of lignocellulosics?Adv.Biochem.Engin./Biotechnol.108:67-93;Galbe和Zacchi,2007,Pretreatment of lignocellulosicmaterials for efficient bioethanol production,Adv.Biochem.Engin./Biotechnol.108:41-65;Hendriks和Zeeman,2009,Pretreatments to enhance thedigestibility of lignocellulosic biomass,Bioresource Technol.100:10-18;Mosier等,2005,Features of promising technologies for pretreatment oflignocellulosicbiomass,Bioresource Technol.96:673-686;Taherzadeh和Karimi,2008,Pretreatment of lignocellulosic wastes to improve ethanol and biogasproduction:A review,Int.J.of Mol.Sci.9:1621-1651;Yang和Wyman,2008,Pretreatment:the key to unlocking low-cost cellulosic ethanol,BiofuelsBioproducts and Biorefining-Biofpr.2:26-40)。
纤维素材料也可以在预处理之前使用本领域中已知的方法进行粒度减小、筛分、预浸泡、润湿、洗涤和/或调节/调理(conditioning)。
常规的预处理包括但不限于,蒸汽预处理(伴随或不伴随爆炸)、稀酸预处理、热水预处理、碱性预处理、石灰预处理、湿氧化、湿爆炸、氨纤维爆炸、有机溶剂预处理和生物预处理。其它预处理包括氨渗滤、超声、电穿孔、微波、超临界CO2、超临界H2O、臭氧、离子性液体和γ辐射预处理。
可以在水解和/或发酵之前预处理纤维素材料。预处理优选在水解前进行。或者,预处理可以与酶水解同时进行以释放可发酵糖,如葡萄糖、木糖和/或纤维二糖。在大多数情况下,预处理步骤本身使一些生物质转化成可发酵糖(甚至在不存在酶的情况下)。
蒸汽预处理。在蒸汽预处理中,加热纤维素材料以破坏植物细胞壁成分,包括木质素、半纤维素和纤维素,使酶可接触纤维素和其它级分,例如,半纤维素。将纤维素材料经过或通过反应容器,其中注入蒸汽以增加温度至需要的温度和压力,并且在其中保持期望的反应时间。蒸汽预处理优选在140-250℃,例如160-200℃,或170-190℃进行,其中最优的温度范围依赖于化学催化剂的添加。蒸汽预处理的停留时间优选1-60分钟,例如1-30分钟,1-20分钟,3-12分钟,或4-10分钟,其中最优的停留时间依赖于温度范围和化学催化剂的添加。蒸汽预处理允许相对较高的固体加载量,使纤维素材料在预处理过程中通常仅仅变得潮湿。蒸汽预处理经常与预处理后的物质的爆炸放料(explosive discharge)组合,这称为蒸汽爆炸,即,快速闪变至大气压和物质的湍流,以通过破碎增加可接触的表面积(Duff和Murray,1996,Bioresource Technology855:1-33;Galbe和Zacchi,2002,Appl.Microbiol.Biotechnol.59:618-628;美国专利申请No.20020164730)。在蒸汽预处理过程中,切割半纤维素乙酰基团,并且得到的酸自催化半纤维素部分水解成为单糖和寡糖。去除木质素仅至有限的程度。
化学预处理:术语“化学处理“指能促进纤维素、半纤维素和/或木质素分离和/或释放的任何化学处理。此种预处理可将晶体纤维素转化为无定形纤维素。合适的化学预处理工艺的实例包括例如稀酸预处理、石灰预处理、湿氧化、氨纤维/冷冻爆炸(AFEX)、氨渗滤(APR)、离子性液体和有机溶剂预处理。
经常在蒸汽预处理之前加入催化剂如H2SO4或SO2(通常0.3至5%w/w),其可减少时间,降低温度,增加回收率,并改进酶水解(Ballesteros等,2006,Appl.Biochem.Biotechnol.129-132:496-508;Varga等,2004,Appl.Biochem.Biotechnol.113-116:509-523;Sassner等.,2006,EnzymeMicrob.Technol.39:756-762)。
在稀酸预处理中,将纤维素材料与稀酸(通常是H2SO4)和水混合以形成浆料,由蒸汽加热至期望的温度,并在一段停留时间后闪变至大气压。可以用很多反应器设计进行稀酸预处理,例如,活塞流反应器、逆流反应器或连续逆流收缩床反应器(Duff和Murray,1996,见上文;Schell等,2004,BioresourceTechnol.91:179-188;Lee等,1999,Adv.Biochem.Eng.Biotechnol.65:93-115)。
还可以使用碱性条件下的几种预处理方法。这些碱预处理包括,但不限于,氢氧化钠、石灰、湿氧化、氨渗滤(APR)和氨纤维/冷冻爆炸(AFEX)。
用氧化钙或氢氧化钙,在85-150℃的温度进行石灰预处理,停留时间从1小时到几天(Wyman等,2005,Bioresource Technol.96:1959-1966;Mosier等,2005,BioresourceTechnol.96:673-686)。WO2006/110891、WO2006/110899、WO2006/110900和WO2006/110901公开了使用氨的预处理方法。
湿法氧化是热预处理,通常在180-200℃进行5-15分钟,加入氧化剂如过氧化氢或过压氧(Schmidt和Thomsen,1998,Bioresource Technol.64:139-151;Palonen等,2004,Appl.Biochem.Biotechnol.117:1-17;Varga等,2004,Biotechnol.Bioeng.88:567-574;Martin等,2006,J.Chem.Technol.Biotechnol.81:1669-1677)。预处理优选以1-40%干物质,例如2-30%干物质,或5-20%干物质进行,并且由于加入碱如碳酸钠,初始pH经常会增加。
湿法氧化预处理方法的修改方法,称为湿爆炸(湿氧化和蒸汽爆炸的组合),能够处理高达30%的干物质。在湿爆炸中,在预处理过程中,在一定的停留时间后引入氧化剂。然后通过闪变至大气压而结束预处理(WO 2006/032282)。
氨纤维爆炸(AFEX)涉及在温和温度如90-150℃和高压如17-20bar,用液体或气体氨将纤维素材料处理5-10分钟,其中干物质含量可以高达60%(Gollapalli 等,2002,Appl.Biochem.Biotechnol.98:23-35;Chundawat等,2007,Biotechnol.Bioeng.96:219-231;Alizadeh等,2005,Appl.Biochem.Biotechnol.121:1133-1141;Teymouri等,2005,Bioresource Technol.96:2014-2018)。在AFEX预处理过程中,纤维素和半纤维素保持相对完整。木质素-糖复合物受切割。
有机溶剂预处理通过用含水乙醇(40-60%乙醇)在160-200℃提取30-60分钟而将纤维素材料去木质素化(Pan等,2005,Biotechnol.Bioeng.90:473-481;Pan等,2006,Biotechnol.Bioeng.94:851-861;Kurabi等,2005,Appl.Biochem.Biotechnol.121:219-230)。经常加入硫酸作为催化剂。在有机溶剂预处理中,去除大部分半纤维素和木质素。
合适的预处理方法的其他实例如Schell等,2003,Appl.Biochem andBiotechn.Vol.105-108:69-85,和Mosier等,2005,Bioresource Technology96:673-686,和美国专利公开申请2002/0164730所述。
在一个方面,化学预处理优选作为稀酸处理,并且更优选作为连续稀酸处理进行。酸通常是硫酸,但也可以使用其它酸,如乙酸、柠檬酸、硝酸、磷酸、酒石酸、琥珀酸、氯化氢或其混合物。弱酸处理在优选1-5,例如1-4,或1-2.5的pH范围内进行。在一个方面,酸浓度在优选0.01至10wt%酸,例如0.05至5wt%酸或0.1至2wt%酸的范围内。将酸与纤维素材料接触,并在优选140-200℃,例如165-190℃范围内的温度保持1至60分钟的时间。
在另一个方面,预处理发生在含水浆料中。在优选的方面,在预处理过程中纤维素材料以优选10-80wt%,例如20-70wt%或30-60wt%,如约40wt%的量存在。预处理的纤维素材料可以不洗涤或者使用本领域任何已知的方法洗涤,例如,用水洗涤。
机械预处理或物理预处理:术语“机械预处理”或“物理预处理”指任何促进颗粒大小减少的预处理。举例而言,此种预处理可涉及各种类型的磨制(grinding)或粉碎(milling)(例如,干磨、湿磨或振动球磨)。
纤维素材料可经物理(机械)和化学预处理。机械或物理预处理可与下述结合:汽蒸/蒸汽爆炸、水热解(hydrothermolysis)、稀酸或弱酸处理、高温、高压处理、辐射(例如微波辐射),或其组合。在一个方面,高压指优选约100至400psi,例如约150至约250psi的范围的压力。在另一个方面,高温指约100至300℃,例如约140至约200℃范围的温度。在一个优选的方面,机械或物理预处理在使用如上所定义的高温和高压的分批过程、使用蒸汽枪水解 器系统,例如来自Sunds Defibrator AB,Sweden的Sunds Hydrolyzer中进行。所述物理和化学预处理可视需要顺序进行或同时进行。
因此,在一个优选的方面,对纤维素材料进行物理(机械)或化学预处理,或者它们的任何组合,以促进纤维素、半纤维素和/或木质素的分离和/或释放。
生物预处理:术语“生物预处理”指可以促进纤维素、半纤维素和/或木质素从纤维素材料分离和/或释放的任何生物预处理。生物预处理技术可以包括应用溶解木质素的微生物和/或酶(参见,例如,Hsu,T.-A.,1996,Pretreatment of biomass,于Handbook onBioethanol:Production and Utilization,Wyman,C.E编,Taylor&Francis,Washington,DC,179-212;Ghosh和Singh,1993,Physicochemical and biological treatments forenzymatic/microbial conversion of lignocellulosic biomass,Adv.Appl.Microbiol.39:295-333;McMillan,J.D.,1994,Pretreating lignocellulosicbiomass:a review,于Enzymatic Conversion of Biomass for Fuels Production,Himmel,M.E.,Baker,J.O.,和Overend,R.P.,编,ACS Symposium Series566,AmericanChemical Society,Washington,DC,第15章;Gong,C.S.,Cao,N.J.,Du,J.,和Tsao,G.T.,1999,Ethanol production from renewable resources,于Advances in BiochemicalEngineering/Biotechnology,Scheper,T.,编,Springer-Verlag Berlin Heidelberg,Germany,65:207-241;Olsson和Hahn-Hagerdal,1996,Fermentation of lignocellulosichydrolysates for ethanol production,Enz.Microb.Tech.18:312-331;和Vallander和Eriksson,1990,Production of ethanol from lignocellulosic materials:State ofthe art,Adv.Biochem.Eng./Biotechnol.42:63-95)。
糖化。在水解(也称作糖化)步骤中,将(例如经预处理的)纤维素材料水解以将纤维素和半纤维素分解成可发酵糖,如葡萄糖、纤维二糖、木糖、木酮糖、阿拉伯糖、甘露糖、半乳糖和/或可溶的寡糖。水解由酶组合物以酶法在本发明的变体的存在下进行。组合物的组分可以同时或顺序加入。
酶水解优选在易于由本领域技术人员确定的条件下,在合适的含水环境中进行。在一个方面,水解在适于酶组分的活性,即对于酶组分最佳的条件下进行。水解可以以补料批式或连续的过程进行,其中将纤维素材料逐渐补入,例如,含酶的水解溶液中。
糖化通常在搅拌釜反应器或发酵罐中,在受控的pH、温度和混合条件下进行。合适的处理时间、温度和pH条件可以由本领域技术人员容易地确定。例 如,糖化可以持续长达200小时,但是通常优选进行约12至约120小时,例如约16至约72小时,或约24至约48小时。温度优选约25℃至约70℃,例如约30℃至约65℃,约40℃至约60℃,或约50℃至55℃的范围。pH优选约3至约8,例如约3.5至约7,约4至约6,或约pH5.0至约pH5.5的范围。干燥固体含量优选约5至约50wt%,例如约10至约40wt%,或20至约30wt%。
酶组合物可包含任何可用于降解纤维素材料的蛋白。
在一个方面,所述酶组合物包含或进一步包含一种或多种(例如几种)选自下组的蛋白:纤维素酶、具有纤维素分解增强活性的多肽,半纤维素酶、酯酶、棒曲霉素、漆酶、木质素分解酶、果胶酶、过氧化物酶、蛋白酶和膨胀素。在另一个方面,所述纤维素酶优选为一种或多种(例如几种)选自下组的酶:内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶。在另一个方面,所述半纤维素酶优选为一种或多种(例如几种)选自下组的酶:乙酰甘露聚糖酯酶、乙酰木聚糖酯酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、香豆酸酯酶、阿魏酸酯酶、半乳糖苷酶、葡糖醛酸糖苷酶、葡糖醛酸酯酶、甘露聚糖酶、甘露糖苷酶、木聚糖酶和木糖苷酶。
在另一个方面,所述酶组合物包含一种或多种(例如几种)纤维素分解酶。在另一个方面,所述酶组合物包含或进一步包含一种或多种(例如几种)半纤维素分解酶。在另一个方面,所述酶组合物包含一种或多种(例如几种)纤维素分解酶和一种或多种(例如几种)半纤维素分解酶。在另一个方面,所述酶组合物包含一种或多种(例如几种)选自下组的酶:纤维素分解酶和半纤维素分解酶。在另一个方面,所述酶组合物包含内切葡聚糖酶。在另一个方面,所述酶组合物包含纤维二糖水解酶。在另一个方面,所述酶组合物包含β-葡糖苷酶。在另一个方面,所述酶组合物包含具有纤维素分解增强活性的多肽。在另一个方面,所述酶组合物包含内切葡聚糖酶和具有纤维素分解增强活性的多肽。在另一个方面,所述酶组合物包含纤维二糖水解酶和具有纤维素分解增强活性的多肽。在另一个方面,所述酶组合物包含β-葡糖苷酶和具有纤维素分解增强活性的多肽。在另一个方面,所述酶组合物包含内切葡聚糖酶和纤维二糖水解酶。在另一个方面,所述酶组合物包含内切葡聚糖酶和β-葡糖苷酶。在另一个方面,所述酶组合物包含纤维二糖水解酶和β-葡糖苷酶。在另一个方面,所述酶组合物包含内切葡聚糖酶、纤维二糖水解酶和具有纤维素分解增强活性的多肽。在另一个方面,所述酶组合物包含内切葡聚糖酶、β-葡糖 苷酶和具有纤维素分解增强活性的多肽。在另一个方面,所述酶组合物包含纤维二糖水解酶、β-葡糖苷酶和具有纤维素分解增强活性的多肽。在另一个方面,所述酶组合物包含内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶。在另一个方面,所述酶组合物包含内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶和具有纤维素分解增强活性的多肽。
在另一个方面,所述酶组合物包含乙酰甘露聚糖酯酶。在另一个方面,所述酶组合物包含乙酰木聚糖酯酶。在另一个方面,所述酶组合物包含阿拉伯聚糖酶(例如α-L-阿拉伯聚糖酶)。在另一个方面,所述酶组合物包含阿拉伯呋喃糖苷酶(例如α-L-阿拉伯呋喃糖苷酶)。在另一个方面,所述酶组合物包含香豆酸酯酶。在另一个方面,所述酶组合物包含阿魏酸酯酶。在另一个方面,所述酶组合物包含半乳糖苷酶(例如α-半乳糖苷酶和或β-半乳糖苷酶)。在另一个方面,所述酶组合物包含葡糖醛酸糖苷酶(例如α-D-葡糖醛酸糖苷酶)。在另一个方面,所述酶组合物包含葡糖醛酸酯酶。在另一个方面,所述酶组合物包含甘露聚糖酶。在另一个方面,所述酶组合物包含甘露糖苷酶(例如β-甘露糖苷酶)。在另一个方面,所述酶组合物包含木聚糖酶。在一个优选的方面,所述木聚糖酶是家族10木聚糖酶。在另一个方面,所述酶组合物包含木糖苷酶(例如β-木糖苷酶)。
在另一个方面,所述酶组合物包含酯酶。在另一个方面,所述酶组合物包含棒曲霉素。在另一个方面,所述酶组合物包含漆酶。在另一个方面,所述酶组合物包含木质素分解酶。在另一个优选的方面,所述木质素分解酶是锰过氧化物酶。在另一个优选的方面,所述木质素分解酶是木质素过氧化物酶。在另一个优选的方面,所述木质素分解酶是产生H2O2的酶。在另一个方面,所述酶组合物包含果胶酶。在另一个方面,所述酶组合物包含过氧化物酶。在另一个方面,所述酶组合物包含蛋白酶。在另一个方面,所述酶组合物包含膨胀素。
在本发明的方法中,酶可在糖化,糖化和发酵,或发酵之前或之中添加。
所述酶组合物的一种或多种(例如几种)组分可为野生型蛋白、重组蛋白或野生型蛋白和重组蛋白的组合。举例而言,一种或多种(例如几种)组分可为细胞的天然蛋白,其用作宿主细胞以重组表达酶组合物的一种或多种(例如几种)其他组分。酶组合物的一种或多种(例如几种)组分可作为单组分产生,然后将其组合以形成酶组合物。所述酶组合物可为多组分和单组分蛋白制备物的组合。
用于本发明方法中的酶可为任何适用于如例如发酵液配制物或细胞组合物,含或不含细胞碎片的细胞裂解液,半纯化或纯化的酶制备物,或宿主细胞,作为酶的来源。所述酶组合物可为干粉或颗粒,无粉尘的颗粒,液体,稳定化液体或稳定化受保护的酶。液体酶制备物可根据确立的工艺,例如通过添加稳定剂如糖、糖醇或其他多元醇,和/或乳酸或其他有机酸来稳定化。
具有本发明的酶和变体的最适量取决于几个因素,其包括但不限于,纤维素分解和/或半纤维素分解酶组分的混合物、纤维素底物、纤维素底物的浓度、纤维素底物的预处理、温度、时间、pH和包括发酵生物体(例如,同步糖化和发酵的酵母)。
在一个方面,纤维素分解或半纤维素分解酶蛋白对于纤维素材料的有效量是约0.5至约50mg,优选约0.5至约40mg,更优选约0.5至约25mg,更优选约0.75至约20mg,更优选约0.75至约15mg,甚至更优选约0.5至约10mg,并且最优选约2.5至约10mg每g纤维素材料。
在另一个方面,具有纤维素分解增强活性的变体对于纤维素材料的有效量是约0.01至约50.0mg,优选约0.01至约40mg,更优选约0.01至约30mg,更优选约0.01至约20mg,更优选约0.01至约10mg,更优选约0.01至约5mg,更优选约0.025至约1.5mg,更优选约0.05至约1.25mg,更优选约0.075至约1.25mg,更优选约0.1至约1.25mg,甚至更优选约0.15至约1.25mg,并且最优选约0.25至约1.0mg每g纤维素材料。
在另一个方面,具有纤维素分解增强活性的变体对于纤维素分解酶蛋白的有效量是约0.005至约1.0g,优选约0.01至约1.0g,更优选约0.15至约0.75g,更优选约0.15至约0.5g,更优选约0.1至约0.5g,甚至更优选约0.1至约0.5g,并且最优选约0.05至约0.2g每g纤维素分解酶蛋白。
具有纤维素分解酶活性或半纤维素分解酶活性的多肽,以及任何可用于纤维素材料的降解的蛋白/多肽,例如具有纤维素分解增强活性的GH61多肽(在本文中统称为具有酶活性的多肽)酶可源自或获得自任何合适的来源,包括细菌、真菌、酵母、植物或哺乳动物来源。术语“获得的”在本文中还意指该酶可在宿主生物中使用本文中所述的方法重组产生,其中经重组产生的酶对于宿主生物是天然的或异源的,或具有修饰的氨基酸序列,例如,具有一个或多个(例如几个)缺失、插入和/或取代的氨基酸,即重组产生的酶,其为天然氨基酸序列的片段和/或突变体或通过本领域已知的氨基酸改组方法产 生的酶。天然酶的含义中涵盖的是天然变体,而外来酶的含义中涵盖的是重组(如通过定位诱变或重排)获得的变体。
具有酶活性的多肽可以是细菌多肽。例如,所述多肽可以是革兰氏阳性细菌多肽如芽孢杆菌属(Bacillus)、链球菌属(Streptococcus)、链霉菌属(Streptomyces)、葡萄球菌属(Staphylococcus)、肠球菌属(Enterococcus)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、梭菌属(Clostridium)、地芽孢杆菌属(Geobacillus)、热解纤维素菌属(Caldicellulosiruptor)、热酸菌属(Acidothermus)、Thermobifidia或海洋芽孢杆菌属(Oceanobacillus)多肽,所述多肽具有酶活性;或革兰氏阴性细菌多肽,如大肠杆菌、假单胞菌属(Pseudomonas)、沙门氏菌属(Salmonella)、弯曲杆菌属(Campylobacter)、螺杆菌属(Helicobacter)、黄杆菌属(Flavobacterium)、梭杆菌属(Fusobacterium)、泥杆菌属(Ilyobacter)、奈瑟氏菌属(Neisseria)或脲原体属(Ureaplasma)多肽,所述多肽具有酶活性。
在一个方面,所述多肽是具有酶活性的嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌或苏云金芽孢杆菌多肽。
在另一个优选的方面,所述多肽是具有酶活性的似马链球菌、酿脓链球菌、乳房链球菌或马链球菌兽瘟亚种多肽。
在另一个优选的方面,所述多肽是具有酶活性的不产色链霉菌、除虫链霉菌、天蓝链霉菌、灰色链霉菌或浅青紫链霉菌多肽。
具有酶活性的多肽也可以是真菌多肽,并且更优选酵母多肽如假丝酵母属、克鲁维酵母属、毕赤酵母属、酵母属、裂殖酵母属或西洋蓍霉属多肽,其具有酶活性;或更优选丝状真菌多肽如枝顶孢霉属、伞菌属、链格孢属、曲霉属、短梗霉属、Botryospaeria、拟蜡菌属、Chaetomidium、金孢子菌属、Claviceps、Cochliobolus、鬼伞属、Coptotermes、棒囊壳属、隐丛赤壳菌属、隐球菌属、色二孢属、黑耳属、Filibasidium、镰孢属、赤霉属、全鞭毛虫属、腐质霉属、耙齿菌属、蘑菇属、Leptospaeria、梨孢菌属、Melanocarpus、多孔菌属、毛霉属、毁丝霉属、新考玛脂霉属、脉孢菌属、拟青霉属、青霉属、平革菌属、瘤胃壶菌属、Poitrasia、假黑盘菌属、Pseudotrichonympha、根毛霉属、裂褶菌属、柱顶孢属、踝节菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、木霉属、长毛盘菌属、轮枝孢属、包脚菇属或炭角菌属多肽,其具有酶活性。
在一个方面,所述多肽是具有酶活性的卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母或卵形酵母多肽。
在另一个方面,所述多肽是具有酶活性的解纤维枝顶孢霉、棘孢曲霉、泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、嗜角质金孢子菌、Chrysosporiumlucknowense、热带金孢子菌、Chrysosporium merdarium、Chrysosporium inops、毡金孢子菌、Chrysosporium queenslandicum、Chrysosporium zonatum、杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、灰腐质霉、特异腐质霉、疏棉状腐质霉、白耙齿菌、米黑毛霉、嗜热毁丝霉、粗糙脉孢菌、绳状青霉、产紫青霉、黄孢平革菌、Thielavia achromatica、Thielavia albomyces、Thielaviaalbopilosa、澳洲梭孢壳、Thielavia fimeti、小孢梭孢壳、卵孢梭孢壳、Thielaviaperuviana、瘤孢梭孢壳、毛梭孢壳、Thielavia subthermophila、土生梭孢霉、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、绿色木霉或褐孢长毛盘菌(Trichophaea saccata)多肽。
还可以使用具有酶活性的多肽经化学修饰或蛋白质工程改造的突变体。
酶组合物的一种或多种(例如几种)组分可以是重组组分,亦即,通过克隆编码所述单独组分的DNA序列并随后用该DNA序列转化细胞并在宿主中表达(参见,例如,WO91/17243和WO91/17244)产生。所述宿主优选是异源宿主(酶对宿主是外源的),但该宿主在一定条件下也可以是同源宿主(酶对宿主是天然的)。单组分纤维素分解蛋白还可以通过从发酵液中提纯这样的蛋白质来制备。
在一个方面,所述一种或多种(例如几种)纤维素分解酶包含商业性纤维素分解酶制备物。适用于本发明的商业的纤维素分解酶制备物的实例包括,例如,Ctec(Novozymes A/S)、CTec2(Novozymes A/S)、CELLUCLASTTM(Novozymes A/S)、NOVOZYMTM188(Novozymes A/S)、CELLUZYMETM(Novozymes A/S)、CEREFLOTM(Novozymes A/S)和ULTRAFLOTM(Novozymes A/S),ACCELERASETM(Genencor Int.)、LAMINEXTM(GenencorInt.)、SPEZYMETMCP(Genencor Int.),NL(DSM)、S/L100(DSM),ROHAMENTTM7069W LDI(DyadicInternational,Inc.)、LBR(Dyadic International,Inc.)或150L(Dyadic International, Inc.)。所述纤维素酶以固体的约0.001至约5.0wt%,例如固体的0.025至约4.0wt%,或固体的约0.005至约2.0wt%的有效量添加。
可以用于本发明的方法的细菌内切葡聚糖酶的实例包括但不仅限于,解纤维热酸菌(Acidothermus cellulolyticus)内切葡聚糖酶(WO91/05039;WO 93/15186;美国专利5,275,944;WO96/02551;美国专利5,536,655,WO 00/70031,WO05/093050);Thermobifidafusca内切葡聚糖酶III(WO 05/093050);和Thermobifida fusca内切葡聚糖酶V(WO05/093050)。
可以用于本发明的真菌内切葡聚糖酶的实例包括但不仅限于,里氏木霉内切葡聚糖酶I(Penttila等,1986,Gene45:253-263,里氏木霉Cel7B内切葡聚糖酶I;GENBANKTM登录号M15665;SEQ ID NO:4);里氏木霉内切葡聚糖酶II(Saloheimo等,1988,Gene63:11-22,里氏木霉Cel5A内切葡聚糖酶II;GENBANKTM登录号M19373;SEQ ID NO:6);里氏木霉内切葡聚糖酶III(Okada等,1988,Appl.Environ.Microbiol.64:555-563;GENBANKTM登录号AB003694;SEQ ID NO:8);里氏木霉内切葡聚糖酶V(Saloheimo等,1994,MolecularMicrobiology13:219-228;GENBANKTM登录号Z33381;SEQ ID NO:10);棘孢曲霉内切葡聚糖酶(Ooi等,1990,Nucleic Acids Research18:5884);川地曲霉(Aspergillus kawachii)内切葡聚糖酶(Sakamoto等,1995,Current Genetics27:435-439);胡萝卜软腐欧文氏菌(Erwinia carotovara)内切葡聚糖酶(Saarilahti等,1990,Gene90:9-14);尖镰孢内切葡聚糖酶(GENBANKTM登录号L29381);灰腐质霉thermoidea变种内切葡聚糖酶(GENBANKTM登录号AB003107);Melanocarpus albomyces内切葡聚糖酶(GENBANKTM登录号MAL515703);粗糙脉孢菌内切葡聚糖酶(GENBANKTM登录号XM_324477);特异腐质霉内切葡聚糖酶V(SEQ IDNO:12);嗜热毁丝霉CBS117.65内切葡聚糖酶(SEQ ID NO:14);担子菌纲(basidiomycete)CBS495.95内切葡聚糖酶(SEQ ID NO:16);担子菌纲CBS494.95内切葡聚糖酶(SEQ ID NO:18);土生梭孢霉NRRL8126CEL6B内切葡聚糖酶(SEQ ID NO:20);土生梭孢霉NRRL8126CEL6C内切葡聚糖酶(SEQ ID NO:22);土生梭孢霉NRRL8126CEL7C内切葡聚糖酶(SEQID NO:24);土生梭孢霉NRRL8126CEL7E内切葡聚糖酶(SEQ ID NO:26);土生梭孢霉NRRL8126CEL7F内切葡聚糖酶(SEQ ID NO:28);Cladorrhinum foecundissimumATCC62373CEL7A内切葡聚糖酶(SEQ ID NO:30);以及里氏木霉菌株No.VTT-D-80133内切葡聚糖酶(SEQ ID NO:32; GENBANKTM登录号M15665)。上述的SEQ ID NO:4,SEQ ID NO:6,SEQID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO:18,SEQID NO:20,SEQ ID NO:22,SEQ ID NO:24,SEQ ID NO:26,SEQ ID NO:28,SEQ ID NO:30和SEQ ID NO:32的内切葡聚糖酶分别由SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ IDNO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:17,SEQ ID NO:19,SEQ IDNO:21,SEQ ID NO:23,SEQ ID NO:25,SEQ ID NO:27,SEQ ID NO:29,和SEQ ID NO:31的成熟多肽编码序列编码。
可用于本发明的纤维二糖水解酶的实例包括但不仅限于,里氏木霉纤维二糖水解酶I(SEQ ID NO:34);里氏木霉纤维二糖水解酶II(SEQ ID NO:36);特异腐质霉纤维二糖水解酶I(SEQ ID NO:38);嗜热毁丝霉纤维二糖水解酶II(SEQ ID NO:40和SEQ ID NO:42);土生梭孢霉纤维二糖水解酶II(CEL6A)(SEQ ID NO:44);嗜热毛壳菌(Chaetomiumthermophilum)纤维二糖水解酶I(SEQ ID NO:46);和嗜热毛壳菌纤维二糖水解酶II(SEQID NO:48),烟曲霉纤维二糖水解酶I(SEQ ID NO:50),和烟曲霉纤维二糖水解酶II(SEQ IDNO:52)。上述的SEQ ID NO:34,SEQ ID NO:36,SEQ ID NO:38,SEQ ID NO:40,SEQ ID NO:42,SEQ ID NO:44,SEQ ID NO:46,SEQ ID NO:48,SEQ ID NO:50和SEQ ID NO:52的纤维二糖水解酶分别由SEQ ID NO:33,SEQ ID NO:35,SEQ ID NO:37,SEQ ID NO:39,SEQ ID NO:41,SEQ ID NO:43,SEQ ID NO:45,SEQ ID NO:47,SEQ ID NO:49和SEQ ID NO:51的成熟多肽编码序列编码。
可用于本发明的β-葡糖苷酶的实例包括但不仅限于米曲霉β-葡糖苷酶(SEQ IDNO:54);烟曲霉β-葡糖苷酶(SEQ ID NO:56);巴西青霉IBT20888β-葡糖苷酶(SEQ ID NO:58);黑曲霉β-葡糖苷酶(SEQ ID NO:60);和棘孢曲霉β-葡糖苷酶(SEQ ID NO:62)。上述的SEQ ID NO:54,SEQ ID NO:56,SEQ ID NO:58,SEQ ID NO:60,和SEQ ID NO:62的β-葡糖苷酶分别由SEQ ID NO:53,SEQ ID NO:55,SEQ ID NO:57,SEQ ID NO:59,和SEQ ID NO:61的成熟多肽编码序列编码。
其它可用于本发明的β-葡糖苷酶的实例包括SEQ ID NO:64的米曲霉β-葡糖苷酶变体融合蛋白或SEQ ID NO:66的米曲霉β-葡糖苷酶融合蛋白。SEQ ID NO:64和SEQ ID NO:66的β-葡糖苷酶融合蛋白分别由SEQ ID NO:63和SEQ ID NO:65编码。
所述米曲霉β-葡糖苷酶可根据WO2002/095014获得。烟曲霉β-葡糖苷酶可根据WO2005/047499获得。巴西青霉β-葡糖苷酶可根据WO 2007/019442获得。黑曲霉β-葡糖苷酶可根据Dan等,2000,J.Biol.Chem.275:4973-4980获得。棘孢曲霉β-葡糖苷酶可根据Kawaguchi等,1996,Gene173:287-288获得。
其它可用的内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶公开于使用根据Henrissat B.,1991,A classification of glycosyl hydrolases based on amino-acidsequence similarities,Biochem.J.280:309-316和Henrissat B.和Bairoch A.,1996,Updating the sequence-based classification of glycosyl hydrolases,Biochem.J.316:695-696的分类的许多糖基水解酶家族中。
其它可用于本发明的纤维素分解酶描述于WO98/13465、WO98/015619、WO 98/015633、WO 99/06574、WO99/10481、WO 99/025847、WO 99/031255、WO 2002/101078、WO2003/027306、WO 2003/052054、WO 2003/052055、WO 2003/052056、WO 2003/052057、WO2003/052118、WO 2004/016760、WO 2004/043980、WO 2004/048592、WO 2005/001065、WO2005/028636、WO 2005/093050、WO 2005/093073、WO 2006/074005、WO 2006/117432、WO2007/071818、WO 2007/071820、WO 2008/008070、WO 2008/008793、美国专利No.5,457,046、美国专利No.5,648,263以及美国专利No.5,686,593。
在另一个方面,所述具有纤维素分解增强活性的多肽在根据WO 2008/151043所述的可溶性活化二价金属阳离子,例如硫酸锰的存在下使用。
在一个方面,所述具有纤维素分解增强活性的多肽在二氧化合物、二环化合物、杂环化合物、含氮化合物、醌化合物、含硫化合物或从经预处理的纤维素材料(如经预处理的玉米秸秆(PCS))获得的液剂的存在下使用。
所述二氧化合物可包括任何含有两个或更多氧原子的合适化合物。在一些方面,所述二氧化合物含有如本文中所述的取代的芳基模块(moiety)。所述二氧化合物可包括一个或多个(几个)羟基和/或羟基衍生物,但亦包括缺乏羟基和羟基衍生物的取代的芳基模块。二氧化合物的非限定性实例包括邻苯二酚或儿茶酚;咖啡酸;3,4-二羟基苯甲酸;4-叔丁基-5-甲氧基-1,2-苯二酚;联苯三酚;没食子酸;甲基-3,4,5-三羟基苯甲酸;2,3,4-三羟基二苯甲酮;2,6-二甲氧基苯酚;芥子酸;3,5-二羟基苯甲酸;4-氯-1,2-苯二酚;4-硝基-1,2-苯二酚;鞣酸;没食子酸乙酯;羟乙酸甲酯;二羟基延胡索酸;2-丁炔-1,4-二 醇;克酮酸;1,3-丙二醇;酒石酸;2,4-戊二醇;3-乙氧基-1,2-丙二醇;2,4,4’-三羟基二苯甲酮;顺-2-丁烯-1,4-二醇;3,4-二羟基-3-环丁烯-1,2-二酮;二羟基丙酮;乙酰丙烯醛(acroleinacetal);甲基-4-羟基苯甲酸;4-羟基苯甲酸;和甲基-3,5-二甲氧基-4-羟基苯甲酸;或它们的盐或溶剂合物(solvate)。
所述二环化合物可包括任何如本文中所述的合适的取代稠环系统。所述化合物可包含一个或多个(例如几个)另外的环,且除非另行说明,不限于具体的环数。在一个方面,所述二环化合物是类黄酮。在另一个方面,所述二环化合物是任选取代的异类黄酮(isoflavonoid)。在另一个方面,所述二环化合物是任选取代的花色离子(flavyliumion),如任选取代的花色素或任选取代的花色苷,或其衍生物。二环化合物的非限定性实例包括表儿茶素(epicatechin);槲皮素(quercetin);杨梅黄酮(myricetin);黄杉素(taxifolin);山奈酚(kaempferol);桑素(morin);金合欢素(acacetin);柚皮素(naringenin);异鼠李黄素(isorhamnetin);芹菜苷配基(apigenin);花青素(cyanidin);花色素苷(cyanin);kuromanin;花青素鼠李葡糖苷(keracyanin);或它们的盐或溶剂合物。
所述杂环化合物可为任何合适的化合物,如本文中所述的任选取代的包含杂原子的芳环或非芳环。在一个方面,所述杂环是包含任选取代的杂环烷基模块或任选取代的杂芳基模块的化合物。在另一个方面,所述任选取代的杂环烷基模块或任选取代的杂芳基模块是任选取代的五元杂环烷基或任选取代的五元杂芳基模块。在另一个方面,任选取代的杂环烷基或任选取代的杂芳基模块是选自如下的任选取代的模块:吡唑基、呋喃基、咪唑基、异噁唑基、噁二唑基、噁唑基、吡咯基、吡啶基、嘧啶基、哒嗪基、噻唑基、三唑基、噻吩基(thienyl)、二氢噻吩-吡唑基(dihydrothieno-pyrazolyl)、硫茚基、咔唑基、苯并咪唑基、苯并噻吩基(benzothienyl)、苯并呋喃基、吲哚基、喹啉基、苯并三唑基、苯并噻唑基、苯并噁唑基(benzooxazolyl)、苯并咪唑基、异喹啉基、异吲哚基、吖啶基、苯并异噁唑基(benzoisazolyl)、二甲基乙内酰脲、吡嗪基、四氢呋喃基、吡咯啉基、吡咯烷基、吗啉基、吲哚基、二氮杂环庚三烯基(diazepinyl)、氮杂环庚三烯基(azepinyl)、硫杂环庚三烯基(thiepinyl)、哌啶基和氧杂环庚三烯基(oxepinyl)。在另一个方面,所述任选取代的杂环烷基模块或任选取代的杂芳基模块是任选取代的呋喃基。杂环化合物的非限定性实例包括(1,2-二羟乙基)-3,4-二氢呋喃-2(5H)-酮;4-羟基-5-甲基-3-呋喃酮;5-羟基-2(5H)-呋喃酮;[1,2-二羟乙基]呋喃-2,3,4(5H)-三酮;α-羟基-γ-丁内酯; 核糖酸γ-内酯;己醛糖酸γ-内酯(aldohexuronicaldohexuronic acidγ-lactone);葡糖酸δ-内酯;4-羟基香豆素;二氢苯并呋喃;5-(羟甲基)糠醛;糠偶姻(furoin);2(5H)-呋喃酮;5,6-二氢-2H-吡喃-2-酮;和5,6-二氢-4-羟基-6-甲基-2H-吡喃-2-酮;或它们的盐或溶剂合物。
所述含氮化合物可为任何具有一个或多个氮原子的合适化合物。在一个方面,所述含氮化合物包含胺、亚胺、羟胺或氧化亚氮(nitroxide)模块。含氮化合物的非限定性实例包括丙酮肟;紫尿酸;吡啶-2-醛肟;2-氨基苯酚;1,2-苯二胺;2,2,6,6-四甲基-1-哌啶基氧(piperidinyloxy);5,6,7,8-四氢生物蝶呤;6,7-二甲基-5,6,7,8-四氢蝶呤;和马来酰胺酸;或它们的盐或溶剂合物。
所述醌化合物可为任何本文中所述的包含醌模块的合适的化合物。醌化合物的非限定性实例包括1,4-苯醌;1,4-萘醌;2-羟基-1,4-萘醌;2,3-二甲氧基-5-甲基-1,4-苯醌或辅酶Q0;2,3,5,6-四甲基-1,4-苯醌或四甲基对苯醌;1,4-二羟基蒽醌;3-羟基-1-甲基-5,6-二氢吲哚二酮或肾上腺色素;4-叔丁基-5-甲氧基-1,2-苯醌;吡咯并喹啉醌(pyrroloquinoline quinone);或它们的盐或溶剂合物。
所述含硫化合物可为任何包含一个或多个硫原子的合适的化合物。在一个方面,所述含硫化合物包含选自亚硫酰,硫醚,亚磺酰,磺酰,磺酰胺(sulfamide),磺酰胺(sulfonamide),磺酸和磺酸酯的模块。含硫化合物的非限定性实例包括乙硫醇;2-丙硫醇;2-丙烯-1-硫醇;2-巯基乙磺酸;苯硫醇;苯-1,2-二硫醇;半胱氨酸;甲硫氨酸;谷胱甘肽;胱氨酸;或它们的盐或溶剂合物。
在一个方面此种如上所述的化合物对纤维素材料的有效量,作为对纤维素的糖单元的摩尔比例为约10-6至约10,例如约10-6至约7.5,约10-6至约5,约10-6至约2.5,约10-6至约1,约10-5至约1,约10-5至约10-1,约10-4至约10-1,约10-3至约10-1,或约10-3至约10-2。在另一个方面,此种如上所述的化合物的有效量为约0.1μM至约1M,例如约0.5μM至约0.75M,约0.75μM至约0.5M,约1μM至约0.25M,约1μM至约0.1M,约5μM至约50mM,约10μM至约25mM,约50μM至约25mM,约10μM至约10mM,约5μM至约5mM,或约0.1mM至约1mM。
术语“液剂(liquor)”意指在本文中所述的条件下,通过处理浆料中的木素纤维素和/或半纤维素材料,或其单糖例如木糖、阿拉伯糖、甘露糖等,所产生的溶液相,即水相、有机相或其组合,及其可溶性内含物。用于GH61多肽的纤维素分解增强的液剂可通过,任选在催化剂例如酸的存在下,任选 在有机溶剂的存在下,且任选与所述材料的物理破坏相组合来藉由施加热和/或压力来处理木素纤维素材料或半纤维素材料(或原料),然后将溶液从剩余固体分离来产生。此类条件确定在通过纤维素酶制备物水解纤维素底物过程中,通过液剂和GH61多肽的组合可获得的纤维素分解增强的程度。所述液剂可使用本领域中的标准方法如过滤、沉积或离心从经处理的材料分离。
在一个方面,所述液剂对纤维素的有效量为约10-6至约10g每g纤维素,例如约10-6至约7.5g,约10-6至约5,约10-6至约2.5g,约10-6至约1g,约10-5至约1g,约10-5至约10-1g,约10-4至约10-1g,约10-3至约10-1g,或约10-3至约10-2g每g纤维素。
在一个方面,所述一种或多种(例如几种)半纤维素分解酶包含商业性半纤维素分解酶制备物。适用于本发明的商业性半纤维素分解酶制备物的实例包括,例如SHEARZYMETM(Novozymes A/S)、HTec(Novozymes A/S)、Htec2(Novozymes A/S)、(Novozymes A/S)、 (Novozymes A/S)、HC(Novozymes A/S)、 Xylanase(Genencor)、XY(Genencor)、 XC(Genencor)、TX-200A(AB Enzymes)、HSP6000Xylanase(DSM)、DEPOLTM333P(Biocatalysts Limit,Wales,UK)、DEPOLTM740L(Biocatalysts Limit,Wales,UK)和DEPOLTM762P(Biocatalysts Limit,Wales,UK)。
可用于本发明方法的木聚糖酶的实例包括但不限于来自棘孢曲霉(GeneSeqP:AAR63790;WO94/21785)、烟曲霉(WO2006/078256;xyl3SEQ ID NO:67[DNA序列]和SEQ IDNO:68[推导的氨基酸序列])、嗜松青霉(WO 2011/041405)、青霉属菌种(WO2010/126772)、土生梭孢霉NRRL8126(WO 2009/079210)和褐孢长毛盘菌GH10(WO2011/057083)的木聚糖酶。
可用于本发明方法的β-木糖苷酶的实例包括但不限于里氏木霉β-木糖苷酶(UniProtKB/TrEMBL登录号Q92458;SEQ ID NO:69[DNA序列]和SEQ ID NO:70[推导的氨基酸序列])、埃默森踝节菌(Talaromyces emersonii)的β-木糖苷酶(SwissProt登录号Q8X212)和粗糙脉孢菌(Neurospora crassa)的β-木糖苷酶(SwissProt登录号Q7SOW4)。
可用于本发明方法的乙酰木聚糖酯酶的实例包括但不限于来自棘孢曲霉(WO2010/108918)、球毛壳菌(Chaetomium globosum)(Uniprot登录号Q2GWX4)、 细丽毛壳菌(Chaetomium gracile)(GeneSeqP登录号AAB82124)、特异腐质霉(Humicola insolens)DSM1800(WO2009/073709)、红褐肉座菌(Hypocrea jecorina)(WO2005/001036)、嗜热毁丝霉(Wo2010/014880)、粗糙脉孢菌(UniProt登录号q7s259)、颖枯壳针孢(Phaeosphaerianodorum)(Uniprot登录号Q0UHJ1)和土生梭孢霉NRRL8126(WO2009/042846)的乙酰木聚糖酯酶。
可用于本发明方法的阿魏酸酯酶的实例包括但不限于来自特异腐质霉DSM1800(WO2009/076122)、费希新萨托菌(Neosartorya fischer)(UniProt登录号A1D9T4)、粗糙脉孢菌(UniProt登录号Q9HGR3)、橘灰青霉(WO2009/127729)和土生梭孢霉(WO2010/053838和WO2010/065448)的阿魏酸酯酶。
可用于本发明方法的阿拉伯呋喃糖苷酶的实例包括但不限于来自黑曲霉(Aspergillus niger)(GeneSeqP登录号AAR94170)、特异腐质霉(Humicola insolens)DSM1800(WO2006/114094和WO2009/073383)和巨多孔菌(M.giganteus)(WO2006/114094)的阿拉伯呋喃糖苷酶。
可用于本发明方法的α-葡糖醛酸糖苷酶的实例包括但不限于来自棒曲霉(Aspergillus clavatus)(UniProt登录号alcc12)、烟曲霉(SwissProt登录号Q4WW45)、黑曲霉(Uniprot登录号Q96WX9)、土曲霉(Aspergillus terreus)(SwissProt登录号Q0CJP9)、特异腐质霉(WO2010/014706)、橘灰青霉(WO 2009/068565)、埃默森踝节菌(UniProt登录号Q8X211)和里氏木霉α-葡糖醛酸糖苷酶(Uniprot登录号Q99024)的α-葡糖醛酸糖苷酶。
用于本发明方法的具有酶活性的多肽可通过在含有合适碳源和氮源和无机盐的营养培养基上,使用本领域已知方法(参见,例如Bennett,J.W.和LaSure,L.(编),MoreGene Manipulations in Fungi,Academic Press,CA,1991)发酵上述指出的微生物菌株来产生。合适的培养基可从供应商获得,或可根据已公开组合物制备(例如美国典型培养物保藏中心的目录)。适于生长和酶产生的温度范围和其他条件在本领域是已知的(参见,例如Bailey,J.E.和Ollis,D.F.,Biochemical Engineering Fundamentals,McGraw-Hill BookCompany,NY,1986)。
所述发酵可以是任何其结果为酶或蛋白表达或分离的培养细胞的方法。因此,发酵可以理解为包括在合适的培养基中并在允许所述酶得以表达或分离的条件下进行的摇瓶培养,或在实验室或工业发酵罐中的小-或大规模发酵(包括连续、分批、补料分批或固态发酵)。通过上述方法产生的所得的酶可从发酵培养基回收并通过常规方法纯化。
发酵。可通过一种或多种(例如几种)能将糖直接或间接发酵成所需发酵产物的发酵微生物发酵自经水解的纤维素材料获得的可发酵糖。“发酵”或“发酵方法”指任何发酵方法或包含发酵步骤的任何方法。发酵方法还包括用于消费品醇工业(例如,啤酒和葡萄酒)、乳品业(例如,发酵乳产品)、皮革业和烟草业的发酵方法。发酵条件依赖于期望的发酵产物和发酵生物体,并且能由本领域的技术人员容易地确定。
在发酵步骤中,作为预处理和酶水解步骤的结果从纤维素材料释放的糖,通过发酵生物体(如酵母)发酵成为产物,例如,乙醇。如上所述,水解(糖化)和发酵可以是单独或同时的。
在实施本发明的发酵步骤中可以使用任何合适的经水解的纤维素材料。通常根据所需发酵产品(即,要从发酵获得的物质)和使用的方法来选择所述材料,如本领域中所公知的。
术语“发酵培养基”在本文中可理解为指加入发酵微生物之前的培养基,如,由糖化过程产生的培养基,以及同步的糖化和发酵方法(SSF)中使用的培养基。
“发酵微生物”指适用于理想的发酵方法产生发酵产物的任何微生物,包括细菌和真菌生物体。发酵生物体可以是己糖和/或戊糖发酵生物体,或它们的组合。己糖和戊糖发酵生物体均在本领域公知。合适的发酵微生物能将糖(如葡萄糖、木糖、木酮糖、阿拉伯糖、麦芽糖、甘露糖、半乳糖和/或寡糖)直接或间接地发酵(即,转化)成所需的发酵产品。
可产生乙醇的细菌和真菌发酵生物体的实例如Lin等,2006,Appl.Microbiol.Biotechnol.69:627-642所述。
能发酵己糖的发酵微生物的实例包括细菌和真菌生物体,如酵母。优选的酵母包括假丝酵母属、克鲁维酵母属和酵母属,例如Candida sonorensis、马克斯克鲁维酵母和酿酒酵母的菌株。
以其天然状态能发酵戊糖的发酵生物体的实例包括细菌和真菌生物体,如一些酵母。优选的木糖发酵酵母包括假丝酵母属,优选休哈塔假丝酵母(Candida sheatae)或Candida sonorensis;和毕赤酵母属,优选树干毕赤酵母(Pichia stipitis)的菌株,如树干毕赤酵母CBS5773的菌株。优选的戊糖发酵酵母包括管囊酵母属(Pachysolen),优选嗜鞣管囊酵母(Pachysolen tannophilus)的菌株。不能够发酵戊糖如木糖和阿拉伯糖的生物通过本领域已知方法可经遗传修饰而发酵戊糖。
能有效地将己糖和戊糖发酵成乙醇的细菌的实例包括,例如,凝结芽孢杆菌、丙酮丁醇梭菌(Clostridium acetobutylicum)、热纤维梭菌(Clostridium thermocellum)、Clostridium phytofermentans、地芽孢杆菌属菌种、解糖热厌氧杆菌(Thermoanaerobacter saccharolyticum)和运动发酵单胞菌(Philippidis,1996,见上文)。
其它发酵生物包括芽孢杆菌属,如凝结芽孢杆菌;假丝酵母属,如Candidasonorensis、C.methanosorbosa、迪丹斯假丝酵母(Candida diddensii)、近平滑假丝酵母(Candida parapsilosis)、C.naedodendra、C.blankii、C.entomophilia、芸薹假丝酵母(C.brassicae)、假热带假丝酵母(Candida pseudotropicalis)、博伊丁假丝酵母(Candidaboidinii)、产朊假丝酵母(Candida utilis)和休哈塔假丝酵母(C.scehatae);梭菌属,如丙酮丁醇梭菌、热纤维梭菌和C.phytofermentans;大肠杆菌,特别是经遗传修饰促进乙醇产率(yield)的大肠杆菌菌株;地芽孢杆菌属菌种;汉逊酵母属,如异常汉逊酵母(Hansenula anomala);克雷伯氏菌属(Klebsiella),如产酸克雷伯氏菌(Klebsiellaoxytoca);克鲁维酵母属,如马克斯克鲁维酵母、乳酸克鲁维酵母(K.latic)、K.thermotolerans和脆壁克鲁维酵母;裂殖酵母属,如粟酒裂殖酵母(S.pombe);热厌氧杆菌属(Thermoanaerobacter),如解糖热厌氧杆菌,和发酵单胞菌属(Zymomonas),如运动发酵单胞菌(Zymomonas mobilis)的菌株。
在一个优选的方面,酵母是酒香酵母属(Bretannomyces)。在一个更优选的方面,酵母是克劳森酒香酵母(Bretannomyces clausenii)。在另一个更优选的方面,酵母是假丝酵母。在另一个更优选的方面,酵母是Candida sonorensis。在另一个更优选的方面,酵母是博伊丁假丝酵母。在另一个更优选的方面,酵母是Candida blankii。在另一个更优选的方面,酵母是芸薹假丝酵母。在另一个更优选的方面,酵母是迪丹斯假丝酵母。在另一个更优选的方面,酵母是Candida entomophiliia。在另一个更优选的方面,酵母是假热带假丝酵母。在另一个更优选的方面,酵母是休哈塔假丝酵母。在另一个更优选的方面,酵母是产朊假丝酵母。在另一个优选的方面,酵母是棒孢酵母属(Clavispora)。在另一个更优选的方面,酵母是葡萄牙棒孢酵母(Clavispora lusitaniae)。在另一个更优选的方面,酵母是仙人掌棒孢酵母(Clavispora opuntiae)。在另一个优选的方面,酵母是克鲁维酵母。在另一个更优选的方面,酵母是脆壁克鲁维酵母。在另一个更优选的方面,酵母是马克斯克鲁维酵母。在另一个更优 选的方面,酵母是Kluyveromyces thermotolerans。在另一个优选的方面,酵母是管囊酵母属(Pachysolen)。在另一个更优选的方面,酵母是嗜鞣管囊酵母(Pachysolen tannophilus)。在另一个优选的方面,酵母是毕赤酵母。在另一个更优选的方面,酵母是树干毕赤酵母。在另一个优选的方面,酵母是酵母属菌种。在另一个优选的方面,酵母是酿酒酵母。在另一个更优选的方面,酵母是糖化酵母(Saccharomyces distaticus)。在另一个更优选的方面,酵母是葡萄汁酵母(Saccharomyces uvarum)。
在一个优选的方面,细菌是芽孢杆菌属。在一个更优选的方面,细菌是凝结芽孢杆菌。在另一个更优选的方面,细菌是梭菌属。在另一个更优选的方面,细菌是丙酮丁醇梭菌。在另一个更优选的方面,细菌是Clostridium phytofermentans在另一个更优选的方面,细菌是热纤维梭菌。在另一个更优选的方面,细菌是地芽孢杆菌属菌种。在另一个更优选的方面,细菌是热厌氧杆菌属。在另一个更优选的方面,细菌是解糖热厌氧杆菌。在另一个更优选的方面,细菌是发酵单胞菌属。在另一个更优选的方面,细菌是运动发酵单胞菌。
商业上可得到的适合乙醇产生的酵母包括,例如BIOFERMTMAFT和XR(NABC-NorthAmerican Bioproducts Corporation,GA,USA),ETHANOL REDTM酵母(Red Star/Lesaffre,USA)、FALITM(Fleischmann’s Yeast,Burns Philp Food Inc.,USA),FERMIOLTM(DSMSpecialties),GERT STRANDTM(Gert Strand AB,Sweden)以及SUPERSTARTTM和THERMOSACCTM新鲜酵母(Ethanol Technology,WI,USA)。
在一个优选的方面,发酵微生物已经经过遗传修饰,以提供发酵戊糖的能力,如利用木糖、利用阿拉伯糖和共同利用木糖和阿拉伯糖的微生物。
通过将异源基因克隆入多种发酵微生物已经构建了能将己糖和戊糖转化成乙醇(共发酵)的生物体(Chen和Ho,1993,Cloning and improving the expression of Pichiastipitis xylose reductase gene in Saccharomyces cerevisiae,Appl.Biochem.Biotechnol.39-40:135-147;Ho等,1998,Genetically engineeredSaccharomyces yeast capable of effectively cofermenting glucose and xylose,Appl.Environ.Microbiol.64:1852-1859;Kotter和Ciriacy,1993,Xylose fermentationby Saccharomyces cerevisiae,Appl.Microbiol.Biotechnol.38:776-783;Walfridsson等,1995,Xylose-metabolizing Saccharomyces cerevisiae strains overexpressingthe TKL1and TAL1genes encoding the pentose phosphate pathway enzymestransketolase and transaldolase,Appl.Environ.Microbiol.61:4184-4190;Kuyper等,2004,Minimal metabolic engineering of Saccharomyces cerevisiae for efficientanaerobic xylose fermentation:a proof of principle,FEMS Yeast Research4:655-664;Beall等,1991,Parametric studies of ethanol production from xylose andother sugars by recombinant Escherichia coli,Biotech.Bioeng.38:296-303;Ingram等,1998,Metabolic engineering of bacteria for ethanol production,Biotechnol.Bioeng.58:204-214;Zhang等,1995,Metabolic engineering of a pentosemetabolism pathway in ethanologenic Zymomonas mobilis,Science267:240-243;Deanda等,1996,Development of an arabinose-fermenting Zymomonas mobilis strainby metabolic pathway engineering,Appl.Environ.Microbiol.62:4465-4470;WO2003/062430,Xylose Isomerase)。
在一个优选的方面,经过遗传修饰的发酵微生物是Candida sonorensis。在另一个优选的方面,经过遗传修饰的发酵微生物是大肠杆菌。在另一个优选的方面,经过遗传修饰的发酵微生物是产酸克雷伯氏菌(Klebsiella oxytoca)。在另一个优选的方面,所述经遗传修饰的发酵微生物是马克斯克鲁维酵母。在另一个优选的方面,所述经遗传修饰的发酵微生物是酿酒酵母。在另一个优选的方面,经过遗传修饰的发酵微生物是运动发酵单胞菌。
本领域中公知的是,上述生物体还能用于产生其它物质,如本文所述。
通常向降解的纤维素材料或水解物加入发酵微生物,并进行约8至约96小时,例如约24至约60小时发酵。温度通常为约26℃至约60℃,例如约32℃或50℃,并且在约pH3至约pH8,例如约pH4-5、6或7。
在一个方面,对降解的纤维素材料施用酵母和/或另一种微生物,并进行约12至约96小时,如通常为24-60小时发酵。在另一个方面,温度优选为约20℃至约60℃,例如约25℃至约50℃,并且约32℃至约50℃,约32℃至约50℃,并且pH通常为约pH3至约pH7,例如约pH4至约pH7。然而,一些发酵生物体例如细菌,具有更高的最适发酵温度。酵母或另一种微生物优选以约105-1012,优选约107-1010,特别是约2x108活细胞计数每ml发酵液的量施用。关于使用酵母进行发酵的进一步指导可以在例如“The Alcohol Textbook”(K.Jacques,T.P.Lyons和D.R.Kelsall编,Nottingham University Press,United Kingdom1999)中找到,其通过提述并入本文。
对于乙醇产生,在发酵之后,蒸馏发酵的浆料以提取乙醇。根据本发明 的方法获得的乙醇可用作,例如燃料乙醇,饮用乙醇即可饮用的中性酒精饮料,或工业乙醇。
发酵刺激剂可以与本文所述的任何方法组合使用,以进一步改进发酵方法,而且特定地,改进发酵微生物的性能,如,速率增加和乙醇得率。“发酵刺激剂”指用于发酵微生物(特别是酵母)生长的刺激剂。优选的用于生长的发酵刺激剂包括维生素和矿物质。维生素的实例包括多种维生素、生物素、泛酸(盐)、烟酸、内消旋肌醇(meso-inositol)、硫胺素、吡哆醇(pyridoxine)、对氨基苯甲酸、叶酸、核黄素和维生素A、B、C、D和E。参见,例如,Alfenore等,Improving ethanol production and viability of Saccharomycescerevisiae by a vitamin feeding strategy during fed-batch process,Springer-Verlag(2002),其通过提述并入本文。矿物质的实例包括能够提供营养物的矿物质和矿物质盐,所述营养物包括P、K、Mg、S、Ca、Fe、Zn、Mn和Cu。
发酵产物:发酵产物可以是源自发酵的任何物质。发酵产物可以是,不限于,醇(例如,阿拉伯醇、正丁醇、异丁醇、乙醇、甘油、甲醇、乙二醇、1,3-丙二醇(丙二醇)、丁二醇、丙三醇、山梨醇和木糖醇);烷烃(例如戊烷、己烷、庚烷、辛烷、壬烷、癸烷、十一烷和十二烷);环烷烃(例如环戊烷、环己烷、环庚烷、和环辛烷);烯烃(例如戊烯、己烯、庚烯和辛烯);氨基酸(例如,天冬氨酸、谷氨酸、甘氨酸、赖氨酸、丝氨酸和苏氨酸);气体(例如,甲烷、氢气(H2)、二氧化碳(CO2)和一氧化碳(CO));异戊二烯;酮(例如,丙酮);有机酸(例如,乙酸、醋酮酸、己二酸、抗坏血酸、柠檬酸、2,5-二酮-D-葡糖酸、甲酸、反丁烯二酸、葡糖二酸、葡糖酸、葡糖醛酸、戊二酸、3-羟基丙酸、衣康酸、乳酸、苹果酸、丙二酸、草酸、草酰乙酸、丙酸、琥珀酸和木糖酸);和聚酮化合物。发酵产物还可以是作为高价值产品的蛋白质。
在一个优选的方面,发酵产物是醇。可理解的是,术语“醇”包括包含一个或多个羟基基团的物质。在更优选的方面,所述醇是正丁醇。在另一个更优选的方面,所述醇是异丁醇。在另一个更优选的方面,所述醇是乙醇。在另一个更优选的方面,所述醇是甲醇。在另一个更优选的方面,所述醇是阿拉伯醇。在另一个更优选的方面,所述醇是丁二醇。在另一个更优选的方面,所述醇是乙二醇。在另一个更优选的方面,所述醇是甘油(glycerin)。在另一个更优选的方面,所述醇是甘油(glycerol)。在另一个更优选的方面,所述醇是1,3-丙二醇。在另一个更优选的方面,所述醇是山梨醇。在另一个更优选的方面,所述醇是 木糖醇。参见,例如,Gong,C.S.,Cao,N.J.,Du,J.,和Tsao,G.T.,1999,Ethanol production fromrenewable resources,于Advances in Biochemical Engineering/Biotechnology,Scheper,T.编,Springer-Verlag Berlin Heidelberg,Germany,65:207-241;Silveira,M.M.,和Jonas,R.,2002,The biotechnological production of sorbitol,Appl.Microbiol.Biotechnol.59:400-408;Nigam,P.,和Singh,D.,1995,Processes forfermentative production of xylitol–a sugar substitute,Process Biochemistry30(2):117-124;Ezeji,T.C.,Qureshi,N.和Blaschek,H.P.,2003,Production of acetone,butanol and ethanol by Clostridium beijerinckii BA101 and in situ recovery bygas stripping,World Journal of Microbiology and Biotechnology19(6):595-603。
在另一个优选的方面,所述发酵产物是烷烃。所述烷烃是未支化或支化的烷烃。在另一个更优选的方面,所述烷烃是戊烷。在另一个更优选的方面,所述烷烃是己烷。在另一个更优选的方面,所述烷烃是庚烷。在另一个更优选的方面,所述烷烃是辛烷。在另一个更优选的方面,所述烷烃是壬烷。在另一个更优选的方面,所述烷烃是癸烷。在另一个更优选的方面,所述烷烃是十一烷。在另一个更优选的方面,所述烷烃是十二烷。
在另一个优选的方面,所述发酵产物是环烷烃。在另一个更优选的方面,所述环烷烃是环戊烷。在另一个更优选的方面,所述环烷烃是环己烷。在另一个更优选的方面,所述环烷烃是环庚烷。在另一个更优选的方面,所述环烷烃是环辛烷。
在另一个优选的方面,所述发酵产物是烯烃。所述烯烃可为未支化或支化的烯烃。在另一个更优选的方面,所述烯烃是戊烯。在另一个更优选的方面,所述烯烃是己烯。在另一个更优选的方面,所述烯烃是庚烯。在另一个更优选的方面,所述烯烃是辛烯。
在另一个优选的方面,所述发酵产物是氨基酸。在另一个更优选的方面,所述有机酸是天冬氨酸。在另一个更优选的方面,所述氨基酸是谷氨酸。在另一个更优选的方面,所述氨基酸是甘氨酸。在另一个更优选的方面,所述氨基酸是赖氨酸。在另一个更优选的方面,所述氨基酸是丝氨酸。在另一个更优选的方面,所述氨基酸是苏氨酸。参见,例如,Richard,A.,和Margaritis,A.,2004,Empirical modeling of batch fermentationkinetics for poly(glutamic acid)production and other microbial biopolymers,Biotechnology and Bioengineering87(4):501-515。
在另一个优选的方面,所述物质是气体。在另一个更优选的方面,所述气体是甲烷。在另一个更优选的方面,所述气体是H2。在另一个更优选的方面,所述气体是CO2。在另一个更优选的方面,所述气体是CO。参见,例如,Kataoka,N.,A.Miya,和K.Kiriyama,1997,Studies on hydrogen production by continuous culture system of hydrogen-producing anaerobic bacteria,Water Science and Technology36(6-7):41-47;和Gunaseelan V.N.于Biomass and Bioenergy,Vol.13(1-2),pp.83-114,1997,Anaerobicdigestion of biomass for methane production:A review。
在另一个优选的方面,所述发酵产物是异戊二烯。
在另一个优选的方面,所述发酵产物似乎酮。应理解的是,术语“酮”涵盖了含有一个或多个酮模块的酮。在另一个更优选的方面,所述酮是丙酮。参见,例如Qureshi和Blaschek,2003,见上文。
在另一个优选的方面,所述发酵产物是有机酸。在另一个更优选的方面,所述有机酸是乙酸。在另一个更优选的方面,所述有机酸是醋酮酸。在另一个更优选的方面,所述有机酸是己二酸。在另一个更优选的方面,所述有机酸是抗坏血酸。在另一个更优选的方面,所述有机酸是柠檬酸。在另一个更优选的方面,所述有机酸是2,5-二酮-D-葡糖酸。在另一个更优选的方面,所述有机酸是甲酸。在另一个更优选的方面,所述有机酸是反丁烯二酸。在另一个更优选的方面,所述有机酸是葡糖二酸。在另一个更优选的方面,所述有机酸是葡糖酸。在另一个更优选的方面,所述有机酸是葡糖醛酸。在另一个更优选的方面,所述有机酸是戊二酸。在另一个优选的方面,所述有机酸是3-羟基丙酸。在另一个更优选的方面,所述有机酸是衣康酸。在另一个更优选的方面,所述有机酸是乳酸。在另一个更优选的方面,所述有机酸是苹果酸。在另一个更优选的方面,所述有机酸是丙二酸。在另一个更优选的方面,所述有机酸是草酸。在另一个更优选的方面,所述有机酸是丙酸。在另一个更优选的方面,所述有机酸是琥珀酸。在另一个更优选的方面,所述有机酸是木糖酸。参见,例如,Chen,R.,和Lee,Y.Y.,1997,Membrane-mediated extractive fermentation for lactic acidproduction from cellulosic biomass,Appl.Biochem.Biotechnol.63-65:435-448。
在另一个优选的方面,所述物质是聚酮化合物。
回收可以使用本领域已知的任何方法,任选地从发酵培养基回收发酵产物,所述方法包括,但不限于,层析、电泳方法、差示溶解度、蒸馏或提取。例如,通过常规蒸馏方法从发酵的纤维素材料分离并纯化醇。可以获得纯度高达约96vol%的乙醇,其能用作,例如,燃料乙醇、饮用乙醇,即,中性饮料酒,或工业乙醇。
去污剂组合物
本发明的具有纤维素分解增强活性的变体多肽可添加至去污剂组合物并因此成为其成分。
本发明的去污剂组合物可配制为例如手洗或机洗洗衣去污剂组合物,包括适用于预处理有污迹的织物的洗衣添加组合物,和漂洗添加的织物软化剂剂组合物,或配制为用于一般家用硬表面清洁操作的去污剂组合物,或配制为供手洗或机洗的洗碗/碟操作。
在一个具体方面,本发明提供了包含本发明的变体多肽的去污剂添加剂。所述去污剂添加剂以及所述去污剂组合物可包含一种或多种(例如几种)酶如蛋白酶、脂肪酶、角质酶、淀粉酶、糖酶、纤维素酶、果胶酶、甘露聚糖酶、阿拉伯糖酶、半乳聚糖酶、木聚糖酶、氧化酶例如漆酶和/或过氧化物酶。
一般而言所选酶的性质应与选定的去污剂相容(即,最优pH,与其他酶和非酶成分的相容性等),且该酶应以有效量存在。
纤维素酶:合适的纤维素酶包括细菌或真菌来源的那些。包括化学修饰的或蛋白质工程的突变体。合适的纤维素酶包括来自芽孢杆菌属、假单胞菌属、腐质霉属、镰孢属、梭孢壳属、枝顶孢霉属的纤维素酶,例如,从公开于US4,435,307、US5,648,263、US5,691,178、US5,776,757和WO89/09259的特异腐质霉、嗜热毁丝霉和尖镰孢产生的真菌纤维素酶。
特别合适的纤维素酶为具有颜色保护益处的碱性或中性纤维素酶。此类纤维素酶的实例为描述于EP0495257、EP0531372、WO 96/11262、WO 96/29397、WO 98/08940的纤维素酶。其他实例为纤维素酶变体如描述于WO 94/07998、EP 0 531 315、US5,457,046、US5,686,593、US5,763,254、WO 95/24471、WO 98/12307和PCT/DK98/00299的那些。
商业上可获得的纤维素酶包括CELLUZYMETM和CAREZYMETM(Novozymes A/S)、CLAZINASETM和PURADAX HATM(Genencor International Inc.)、和KAC-500(B)TM(KaoCorporation)。
蛋白酶:所述蛋白酶包括动物、植物或微生物来源的那些。优选微生物来源的。包括化学修饰的或蛋白质工程的突变体。所述蛋白酶可为丝氨酸蛋白酶或金属蛋白酶,优选为碱性微生物蛋白酶或胰蛋白酶样蛋白酶。碱性蛋白酶的实例为枯草杆菌蛋白酶,特别是那些来源于芽孢杆菌属的,例如枯草杆菌蛋白酶Novo、枯草杆菌蛋白酶Carlsberg、枯草杆菌蛋白酶309、枯草杆菌蛋白酶147和枯草杆菌蛋白酶168(描述于WO89/06279)。胰蛋白酶样蛋白酶的实例为胰蛋白酶(例如,猪或牛来源的),和描述于WO 89/06270和WO 94/25583的镰孢属蛋白酶。
可用的蛋白酶的实例为描述于WO 92/19729、WO 98/20115、WO 98/20116和WO 98/34946的变体,特别是在一个或多个下述位置具有取代的变体:27、36、57、76、87、97、101、104、120、123、167、170、194、206、218、222、224、235和274。
优选的商业上可获得的蛋白酶包括ALCALASETM,SAVINASETM,PRIMASETM,DURALASETM,ESPERASETM,和KANNASETM(Novozymes A/S),MAXATASETM,MAXACALTM,MAXAPEMTM,PROPERASETM,PURAFECTTM,PURAFECT OXPTM,FN2TM,和FN3TM(Genencor InternationalInc.)。
脂肪酶:合适的脂肪酶包括细菌或真菌来源的那些。包括化学修饰或蛋白质工程的突变体。可用的脂肪酶的实例包括来自腐质霉属嗜热霉属(Thermomyces)),例如来自如描述于EP258068和EP305216的疏棉状腐质霉(细毛嗜热霉(T.Lanuginosus))或来自如描述于WO 96/13580的特异腐质霉的脂肪酶,假单胞菌属脂肪酶,例如来自产碱假单胞菌(P.alcaligenes)或类产碱假单胞菌(P.pseudoalcaligenes)(EP218272),洋葱假单胞菌(P.cepacia)(EP331376),施氏假单胞菌(P.stutzeri)(GB1,372,034),萤光假单胞菌(P.fluorescens),假单胞菌属菌种菌株SD705(WO95/06720和WO96/27002),威斯康星假单胞菌(P.wisconsinensis)(WO96/12012),芽孢杆菌属脂肪酶,例如来自枯草芽孢杆菌(Dartois等,1993,Biochemica et Biophysica Acta,1131,253-360),嗜热脂肪芽孢杆菌(JP64/744992)或短小芽孢杆菌(B.pumilus)(WO 91/16422)的脂肪酶。
其他实例为那些描述于WO92/05249、WO94/01541、EP407225、EP260105、WO 95/35381、WO 96/00292、WO 95/30744、WO 94/25578、WO 95/14783、WO 95/22615、WO 97/04079和WO 97/07202的脂肪酶变体。
优选的商业上可获得的脂肪酶包括LIPOLASETM和LIPOLASE ULTRATM (NovozymesA/S)。
淀粉酶:合适的淀粉酶(α和/或β)包括细菌或真菌来源的那些。包括化学修饰或蛋白质工程的突变体。淀粉酶包括,例如从芽孢杆菌属获得的α-淀粉酶,例如,从GB1,296,839更具体描述的地衣芽孢杆菌的特别菌株获得。
可用的淀粉酶的实例为描述于WO94/02597、WO94/18314、WO96/23873和WO97/43424的变体,特别是在一个或多个下述位置具有取代的变体:15、23、105、106、124、128、133、154、156、181、188、190、197、202、208、209、243、264、304、305、391、408和444。
商业上可获得的淀粉酶为DURAMYLTM,TERMAMYLTM,FUNGAMYLTM和BANTM(NovozymesA/S),RAPIDASETM和PURASTARTM(from Genencor International Inc.)。
过氧化物酶/氧化酶:合适的过氧化物酶/氧化酶包括植物、细菌或真菌来源的那些。包括化学修饰或蛋白质工程的突变体。有用的过氧化物酶的实例包括来自鬼伞属(Coprinus),例如灰盖鬼伞(C.cinerius)及其变体的过氧化物酶,如描述于WO93/24618、WO95/10602和WO98/15257的那些。
商业上可获得的过氧化物酶包括GUARDZYMETM(Novozymes A/S)。
所述去污剂酶可通过添加含有一种或多种(例如几种)酶的单独的附加剂,或通过添加包含所有这些酶的组合的添加剂而包含于去污剂组合物中。本发明的去污剂添加剂,即单独的添加剂或组合的添加剂,可例如配制为颗粒、液体、浆料等等。优选的去污剂添加剂剂型为颗粒,特别是无尘颗粒,液体,特别是稳定化的液体,或浆料。
无尘颗粒可例如如US4,106,991和4,661,452中所公开而产生,并可任选地通过本领域已知方法涂覆。蜡状涂覆材料的实例为具有1000至20000的平均摩尔重量的聚环氧乙烷产物(聚乙二醇,PEG);具有16至50个环氧乙烷单元的乙氧化壬基酚(ethoxylatednonylphenol);乙氧化脂族醇,其中所述醇含有12至20个碳原子,且其中有15至80个环氧乙烷单元;脂肪酸;和脂肪酸的甘油一酯、甘油二酯和甘油三酯。适用于通过流动床技术施用的形成薄膜的涂覆材料的实例在GB1483591中给出。液体酶制备物可例如通过根据已确立的方法添加多元醇如丙二醇,糖或糖醇,乳酸或硼酸而稳定化。受保护的酶可根据EP238,216中公开的方法制备。
本发明的去污剂组合物可为任何便利的形式,例如条、片、粉末、颗粒、 糊或液体。液体去污剂可为水性的,通常含有高至70%的水和0-30%的有机溶剂,或可为非水性的。
所述去污剂组合物包含一种或多种(例如几种)表面活性剂,其可为非离子型包括半极性型和/或阴离子型和/或阳离子型和/或两性离子型。所述表面活性剂通常以按重量计0.1%至60%的水平存在。
当其中包含阴离子型表面活性剂时,所述去污剂通常含有约1%至约40%的阴离子型表面活性剂,如直链烷基苯磺酸盐,α-烯基磺酸盐,烷基硫酸盐(脂肪醇硫酸盐),醇乙氧基硫酸盐,仲烷磺酸盐,α-磺基脂肪酸甲基酯,烷基或烯基琥珀酸或皂类。
当其中包含非离子型表面活性剂时,所述去污剂通常含有约0.2%至约40%的非离子型表面活性剂如醇乙氧化物,壬基苯酚乙氧化物,烷基聚糖苷,烷基二甲基胺氧化物,乙氧化脂肪酸单乙醇胺,脂肪酸单乙醇胺,多羟基烷基脂肪酸酰胺,或葡糖胺N-酰基N-烷基衍生物(“葡糖酰胺”)。
所述去污剂可含有0-65%去污剂助洗剂或络合剂如沸石、二磷酸盐、三磷酸盐、膦酸盐、碳酸盐、柠檬酸盐、氨三乙酸、乙二胺四乙酸、二乙二胺三氨基五乙酸、烷基或烯基琥珀酸、可溶性硅酸盐或层状硅酸盐(layeredsilicate)(例如来自Hoechst的SKS-6)。
所述去污剂可包含一种或多种(例如几种)聚合物。实例为羧甲基纤维素,聚乙烯基吡咯烷酮,聚乙二醇,聚乙烯醇,聚乙烯基吡啶-N-氧化物,聚乙烯基咪唑,聚羧酸酯如聚丙烯酸酯,延胡索酸/丙烯酸共聚物和甲基丙烯酸月桂酯/丙烯酸共聚物。
去污剂可含有漂白系统,其可包含H2O2源如过硼酸或过碳酸,其可与形成过酸的漂白增强剂如四乙酰基乙二胺(tetraacetylethylenediamine)或壬酰氧基苯磺酸(酯/盐)(nonanoyloxybenzenesulfonate)组合。或者,所述漂白系统可包含例如酰胺,酰亚胺或砜类型的过氧酸。
可以使用常规稳定剂使本发明的洗涤剂组合物中的酶稳定化,所述稳定剂例如,多元醇如丙二醇或甘油,糖或糖醇,乳酸,硼酸或硼酸衍生物,例如,芳族硼酸酯,或苯基硼酸(phenyl boronic acid)衍生物例如4-甲酰苯基硼酸,并且所述组合物可按例如WO 92/19709和WO 92/19708中所述配制。
所述去污剂还可含有其他常规的去污剂成分如例如织物调理剂(fabricconditioner)包括黏土、增泡剂(foam boosters)、抑泡剂(suds suppressors)、抗腐 蚀剂(anti-corrosion agents)、悬污剂(soil-suspending agents)、抗污物再沉积剂(anti-soil redeposition agents)、染料(dyes)、杀细菌剂(bactericides)、光学增亮剂(optical brighteners)、助水溶剂(hydrotropes)、晦暗抑制剂(tarnish inhibitors)或香料(perfumes)。
在去污剂组合物中,任何酶可以以对应于0.01-100mg酶蛋白每升洗液,优选0.05-5mg酶蛋白每升洗液,特别是0.1-1mg酶蛋白每升洗液的量添加。
在去污剂组合物中,本发明具有纤维素分解增强活性的变体多肽可以以对应于0.001-100mg蛋白,优选0.005-50mg蛋白,更优选0.01-25mg蛋白,甚至更优选0.05-10mg蛋白,最优选0.05-5mg蛋白,且甚至更优选0.01-1mg蛋白每升洗液的量添加。
本发明具有纤维素分解增强活性的变体多肽亦可组入WO97/07202(通过提述并入本文)中公开的去污剂配制物。
植物
本发明还涉及植物,例如,转基因植物、植物部分或植物细胞,其包含本发明的多核苷酸,从而以可回收的量表达和产生所述变体。变体可从植物或植物部分回收。或者,可以按原样(as such)将含有该变体的植物或植物部分用于改进食品或饲料的质量,例如,改进营养价值、适口性(palatability)和流变性质(rheological properties),或用于破坏抗营养因子。
转基因植物可以是双子叶的(双子叶植物)或单子叶的(单子叶植物)。单子叶植物的实例是草(grasses),如草地早熟禾(meadow grass)(蓝草(blue grass),早熟禾属(Poa));饲用牧草(forage grass)如羊茅属(Festuca)、黑麦草属(Lolium);寒地型牧草(temperate grass),如Agrostis(翦股颖属);和谷类,例如,小麦、燕麦、黑麦、大麦、稻(rice)、高粱和玉蜀黍(maize)(玉米)。
双子叶植物的实例是烟草(tobacco),豆类(legumes),如羽扇豆(lupins),马铃薯,糖甜菜(sugar beet),豌豆,豆(bean)和大豆(soybean)和十字花科的(cruciferous)植物(十字花科(family Brassicaceae)),如花椰菜(cauliflower),油菜籽(rape seed)和紧密相关的模型生物体拟南芥(Arabidopsis thaliana)。
植物部分的实例是茎(stem)、愈伤组织(callus)、叶(leaf)、根(root)、果实(fruit)、种子(seed)和块茎(tuber),以及包含这些部分的独立组织,例如,表皮(epidermis)、叶肉(mesophyll)、薄壁组织(parenchyme)、维管组织(vascular tissue)、分生组织(meristem)。具体的植物细胞区室(compartments),如叶绿体 (chloroplast)、质外体(apoplast)、线粒体(mitochondria)、液泡(vacuole)、过氧化物酶体(peroxisome)和细胞质(cytoplasm)也被认为是植物部分。此外,任何植物细胞,无论什么组织来源,都被认为是植物部分。同样地,植物部分,如分离以促进本发明的应用的具体组织和细胞也被认为是植物部分,例如胚(embryo)、胚乳(endosperm)、糊粉(aleurone)和种皮(seed coat)。
同样包含于本发明范围内的还有这些植物、植物部分和植物细胞的后代。
表达变体的转基因植物或植物细胞可以依照本领域已知方法构建。简而言之,通过如下方法构建所述植物或植物细胞:将编码变体的一个或多个(例如几个)表达构建体并入植物宿主基因组或叶绿体基因组,并且将所得的修饰植物或植物细胞繁殖为转基因植物或植物细胞。
表达构建体便利地是包含编码变体的多核苷酸的核酸构建体,所述多核苷酸与在选择的植物或植物部分中表达该多核苷酸所需的适当的调节序列可操作地连接。此外,表达构建体可以包含对于鉴定植物细胞有用的选择性标记,在所述宿主细胞中整合了表达构建体和将该构建体引入到所述植物中所必需的DNA序列(后者依赖于使用的DNA引入方法)。
调节序列的选择,例如启动子和终止子序列和任选地信号或转运序列的选择,举例来说,基于期望何时、何处以及如何表达变体而确定。例如,编码变体的基因的表达可以是组成型的或诱导型的,或可以是发育、阶段或组织特异性的,并且基因产物可以靶向特定的组织或植物部分例如种子或叶。调节序列由例如Tague等,1988,Plant Physiol.86:506所述。
对于组成性表达,可以使用35S-CaMV、玉米泛素1和稻肌动蛋白1启动子(Franck等,1980,Cell21:285-294,Christensen等,1992,Plant Mo.Biol.18:675-689;Zhang等,1991,Plant Cell3:1155-1165)。器官特异性启动子可以是例如来自贮藏库组织(storagesink tissue)例如种子、马铃薯块茎和果实的启动子(Edwards和Coruzzi,1990,Ann.Rev.Genet.24:275-303),或来自代谢库组织(metabolic sink tissue)例如分生组织的启动子(Ito等,1994,Plant Mol.Biol.24:863-878),种子特异性启动子诸如来自稻的谷蛋白(glutelin)、醇溶蛋白(prolamin)、球蛋白(globulin)或白蛋白(albumin)启动子(Wu等,1998,Plant CellPhysiol.39:885-889),来自豆球蛋白(legumin)B4和蚕豆(Viciafaba)的未知的种子蛋白基因的蚕豆启动子(Conrad等,1998,J.Plant Physiol.152:708-711)、来自种子油体蛋白(oil body protein)的启动子(Chen等,1998,Plant CellPhysiol.39: 935-941),来自欧洲油菜(Brassica napus)的贮藏蛋白napA启动子,或本技术领域公知的任何其他种子特异性的启动子,例如,在WO91/14772中所描述的。此外,启动子可为叶特异性的启动子,如来自稻或番茄的rbcs启动子(Kyozuka等,1993,PlantPhysiol.102:991-1000),小球藻病毒(chlorella virus)腺嘌呤甲基转移酶(adeninemethyltransferase)基因启动子(Mitra和Higgins,1994,Plant Mol.Biol.26:85-93),来自稻的aldP基因启动子(Kagaya等,1995,Mol.Gen.Genet.248:668-674),或伤口诱导的启动子,如马铃薯pin2启动子(Xu等,1993,Plant Mol.Biol.22:573-588)。同样地,所述启动子可通过非生物的处理诱导,所述非生物的处理诸如温度、干旱或盐度变化,或通过外源施加的激活所述启动子的物质诱导,例如乙醇、雌激素(oestrogens)、植物激素(planthormones)如乙烯、脱落酸(abscisic acid)和赤霉酸(gibberellic acid),和重金属。
启动子增强子元件也可以用于实现变体在植物中的较高表达。例如,启动子增强子元件可以是内含子,其置于启动子和编码变体的多核苷酸之间。例如Xu等,1993,见上,公开了使用稻肌动蛋白1基因的第一内含子以增强表达。
选择性标记基因和表达构建体的任何其它部分可以选自本领域内可用的那些。
将核酸构建体根据本领域已知的常规技术并入植物基因组,所述常规技术包括土壤杆菌属(Agrobacterium)介导的转化、病毒介导的转化、显微注射(microinjection)、粒子轰击、生物射弹转化和电穿孔(Gasser等,1990,Science244:1293;Potrykus,1990,Bio/Technology8:535;Shimamoto等,1989,Nature338:274)。
目前根癌土壤杆菌(Agrobacterium tumefaciens)介导的基因转移(genetransfer),是产生转基因双子叶植物(为了参考,见Hooykas和Schilperoort,1992,PlantMol.Biol.19:15-38)的优选方法,并可用于转化单子叶植物的方法,虽然对于这些植物常常使用其他的转化方法。目前,产生转基因单子叶植物的优选方法是用粒子(用转化DNA涂覆的微观的金或钨粒子)轰击胚愈伤组织(embryonic calli)或发育中的胚(developingembryos)(Christou,1992,Plant J.2:275-281;Shimamoto,1994,Curr.Opin.Biotechnol.5:158-162;Vasil等,1992,Bio/Technology10:667-674)。转化单子叶植物的可供选择的方法是基于原生质体转化,如由Omirulleh等,1993,PlantMol.Biol.21:415-428所描述的。供依照本发明使用的其它转化方法包括描述于美国专利号6,395,966和 7,151,204中的那些(两者均通过提述并入本文)。
转化之后,根据本领域熟知的方法选择具有并入的表达构建体的转化体并且再生成为完整植物。通常设计转化方法用于通过如下方法在再生期间或在后续世代中选择性消除选择基因:例如,使用带有两个独立的T-DNA构建体的共转化或通过特异性重组酶位点特异性地切除选择基因。
除了直接用根据本发明制备的构建体直接转化具体植物基因型之外,还可通过将具有构建体的植物与缺乏该构建体的第二植物杂交来制备转基因植物。举例而言,可将编码变体的构建体通过杂交而引入特定植物品种,而根本无需直接转化该给定品种的植物。因此,本发明不仅涵盖从依照本发明经转化的细胞直接再生的植物,还包括此类植物的后代(progeny)。如用于本文,后代可指依照本发明制备的亲本植物任何世代的后裔(offspring)。此种后代可包含依据本发明制备的DNA构建体,或依照本发明制备的DNA构建体的一部分。杂交导致转基因通过将起始种系与供体植物种系交叉授粉而引入植物种系。此类步骤的非限制性实例进一步描述于美国专利7,151,204号。
植物通过回交转化方法生成。举例而言,该植物包括称作回交转化的基因型、种系、近交体(inbred)或杂交体(hybrid)的植物。
可使用遗传标记以协助本发明的一种或多种转基因从一个遗传背景基因渗入(introgression)至另一个。标记协助的选择提供了相对于常规育种的优势,在于其可用于避免由表型变异导致的错误。进一步,遗传标记可在特定杂交的个体后代中提供有关良种种质相对程度的数据。举例而言,当本不(otherwise)具有非农艺学所需的遗传背景但具有所需性状的植物与良种亲本杂交时,可使用遗传标记来选择不仅具有目标性状,还具有相对较大比例所需种质的后代。以此方式,使一种或多种性状基因渗入特定遗传背景所需的世代数得到最小化。
本发明亦涉及产生本发明的变体的方法,其包括:(a)在有助于产生所述变体的条件下培养转基因植物或植物细胞,所述植物或植物细胞包含编码变体的多核苷酸;和(b)回收所述变体。
通过以下实施例进一步对本发明进行描述,但不应将其理解为对本发明范围的限制。
实施例
培养基
2X YT平板包含10g的胰蛋白胨,5g的酵母提取物,5g的氯化钠,15g的Bacto Agar,和去离子水加至1升。
PDA平板包含39g的马铃薯右旋糖琼脂和去离子水加至1升。
MDU2BP培养基包含45g的麦芽糖,1g的MgSO4·7H2O,1g的NaCl,2g的K2HSO4,12g的KH2PO4,2g的尿素,500μl的AMG痕量金属溶液,和去离子水加至1升;将pH调整至5.0,然后用0.22μm过滤单元过滤灭菌。
AMG痕量金属溶液包含14.3g的ZnSO4·7H2O,2.5g的CuSO4·5H2O,0.5g的NiCl2·6H2O,13.8g的FeSO4·H2O,8.5g的MnSO4·7H2O,3g的柠檬酸,和去离子水加至1升。
M410培养基包含50g的麦芽糖,50g的葡萄糖,2g的MgSO4·7H2O,2g的KH2PO4,4g的无水柠檬酸粉末,8g的酵母提取物,2g的尿素,0.5g的AMG痕量金属溶液,0.5g的CaCl2,和去离子水加至1升(pH6.0)。
LB培养基包含10g的Bacto-胰蛋白胨。5g的酵母提取物,10g的氯化钠,和去离子水加至1升。
LB平板包含10g的Bacto-胰蛋白胨。5g的酵母提取物,10g的氯化钠,15g的Bacto-琼脂,和去离子水加至1升。
YPG培养基包含4g的酵母提取物,1g的K2HPO4,0.5g的MgSO4,15.0g的葡萄糖,和去离子水加至1升(pH6.0)。
YPM培养基包含1%酵母提取物,2%蛋白胨,和2%麦芽糊精。
SC琼脂平板包含20g琼脂每升SC-URA培养基。
含半乳糖的SC-URA培养基包含100ml的10X Basal盐,25ml的20%不含维生素的酪蛋白水解物,10ml的1%色氨酸,4ml的5%苏氨酸(经过滤灭菌,在高压灭菌之后添加),和100ml的20%葡萄糖或100ml的20%半乳糖(经过滤灭菌,在高压灭菌之后添加),和去离子水加至1升。
10X Basal盐溶液包含75g的酵母氮基,113g的琥珀酸,68g的NaOH,和去离子水加至1升。
YP培养基包含10g酵母提取物,20g Bacto蛋白胨,和去离子水加至1升。
COVE盐溶液包含26g的KCl,26g的MgSO4·7H2O,76g的KH2PO4,50ml的COVE痕量金属溶液,和去离子水加至1升。
COVE痕量金属溶液包含0.04g的NaB4O7·10H2O,0.4g的CuSO4·5H2O, 1.2g的FeSO4·7H2O,0.7g的MnSO4·H2O,0.8g的Na2MoO2·2H2O,10g的ZnSO4·7H2O,和去离子水加至1升。
COVE平板包含342.3g的蔗糖,20ml的COVE盐溶液,10ml的1M乙酰胺,10ml的1.5MCsCl,25g的Noble琼脂(Difco),和去离子水加至1升。
COVE2平板包含30g的蔗糖,20ml的COVE盐溶液,10ml的1M乙酰胺,25g的Noble琼脂(Difco),和去离子水加至1升。
木霉属痕量金属溶液包含216g的FeCl3·6H2O,58g的ZnSO4·7H2O,27g的MnSO4·H2O,10g的CuSO4·5H2O,2.4g的H3BO3,336g的柠檬酸,和去离子水加至1升。
CIM培养基包含20g的纤维素,10g的玉米液冻干粉(corn steep solids),1.45g的(NH4)2SO4,2.08g的KH2PO4,0.28g的CaCl2,0.42g的MgSO4·7H2O,0.42ml的木霉属痕量金属溶液,1-2滴消泡剂,和去离子水加至1升;将pH调整至6.0。
实施例1:具有纤维素分解增强活性的烟曲霉GH61B多肽的制备
对烟曲霉部分基因组序列(The Institute for Genomic Research,Rockville,MD,USA)的tblastn检索(Altschul等,1997,Nucleic Acids Res.25:3389-3402)使用几种已知的GH61多肽,包括来自橙橘嗜热子囊菌的GH61A多肽(GeneSeqP登录号AEC05922)作为查询序列(query)来进行。基于在氨基酸水平与查询序列的高水平的类似性,数个基因鉴定为推定的家族GH61同源物。选择一个大约850bp,与橙橘嗜热子囊菌GH61A多肽在氨基酸水平具有高于70%序列同一性基因组区进行进一步研究。
烟曲霉NN051616如美国专利号7,244,605中所述生长并收获。将冻结的菌丝体用研钵和杵磨碎为精细粉末,并使用Plant Maxi Kit(QIAGEN Inc.,Valencia,CA,USA)根据生产商的指示分离基因组DNA。
设计了下示的两个合成的寡核苷酸引物以从基因组DNA PCR扩增烟曲霉家族GH61B多肽基因。使用Cloning Kit(BD Biosciences,Palo Alto,CA,USA)将片段直接克隆入表达载体pAlLo2(WO2004/099228),而无需进行限制性消化和连接。
正向引物:
5’-ACTGGATTTACCATGACTTTGTCCAAGATCACTTCCA-3'(SEQ ID NO:71)
反向引物:
5’-TCACCTCTAGTTAATTAAGCGTTGAACAGTGCAGGACCAG-3’(SEQ ID NO:72)
粗体字母代表编码序列。剩余序列同源于pAlLo2的插入位点。
使用五十皮摩尔的每种上述引物用于PCR反应中,所述反应包含204ng的烟曲霉基因组DNA,1X Pfx Amplification Buffer(Invitrogen Corp.,Carlsbad,CA,USA),各1.5μl的10mM dATP,dTTP,dGTP,和dCTP混合物,2.5单位的Pfx DNA聚合酶(Invitrogen Corp.,Carlsbad,CA,USA),和1μl的50mM MgSO4,最终体积为50μl。扩增使用 5333epgradient S(Eppendorf Scientific,Inc.,Westbury,NY,USA)进行,其程序如下:1个循环,在94℃进行3分钟;和30个循环,每个在94℃进行30秒,56℃进行30秒,和72℃进行1分钟。然后将加热块维持在72℃15分钟,接着进行4℃浸泡循环。
将反应产物通过使用40mM Tris碱-20mM乙酸钠-1mM EDTA二钠盐(TAE)的1.0%琼脂糖凝胶电泳进行分离,其中将大约850bp产物条带从凝胶切出,并使用Gel Extraction Kit(QIAGEN Inc.,Valencia,CA,USA)根据生产商的指示进行纯化。
然后将片段使用Cloning Kit克隆入pAlLo2。将载体用Nco I和Pac I消化。将片段通过如上所述的凝胶电泳和Gel Purification Kit(QIAGEN Inc.,Valencia,CA,USA)纯化。将基因片段和消化的片段合并在一起进行反应,得到表达质粒pAG43,其中家族GH61B多肽基因的转录处于NA2-tpi启动子的调控之下。NA2-tpi启动子是来自黑曲霉中性α-淀粉酶基因的修饰的启动子,其中其未翻译的前导序列被来自构巢曲霉丙糖磷酸异构酶基因的未翻译的前导序列替代。重组反应(20μl)包含1XBuffer(BD Biosciences,Palo Alto,CA,USA),1X BSA(BD Biosciences,Palo Alto,CA,USA),1μl的酶(稀释1:10)(BD Biosciences,Palo Alto,CA,USA),166ng的用Nco I和Pac I消化的pAlLo2,和110ng的烟曲霉GH61B多肽纯化的PCR产物。将反应物在37℃温育15分钟,接着在50℃温育15分钟。将反应物用40μl的10mM Tris-0.1M EDTA缓冲液稀释,并将2.5μl的稀释反应物用于转化大肠杆菌XL10Gold感受态细胞(Stratagene,La Jolla,CA,USA)。含有pAG43(GH61B蛋白基因)的大肠杆菌转化体通过选择性酶消化进行鉴定,并使用9600(QIAGEN Inc.,Valencia,CA,USA) 制备质粒DNA。
862bp PCR片段的DNA测序用Applied Biosystems Model377XL Automated DNASequencer(Applied Biosystems,Carlsbad,CA,USA)使用染料终止子化学(Giesecke等,1992,Journal of Virology Methods38:47-60)和引物步移策略进行。使用下述载体特异性引物进行测序:
pAllo25Seq:5'-TGTCCCTTGTCGATGCG3'(SEQ ID NO:73)
pAllo23Seq:5'-CACATGACTTGGCTTCC3'(SEQ ID NO:74)
审视核苷酸序列数据的品质,并将所有序列以PHRED/PHRAP软件(University ofWashington,Seattle,WA,USA)的协助彼此进行比较。
基于编码的蛋白对橙橘嗜热子囊菌GH61A多肽(GeneSeqP登录号AEC05922)的类似性构建对于烟曲霉序列的基因模型。烟曲霉GH61B的核苷酸序列和推导的氨基酸序列分别示于SEQ ID NO:1和SEQ ID NO:2。基因组片段编码250个氨基酸的多肽,其由两个53和56bp的内含子打断。基因和成熟编码序列的的%G+C含量分别为53.9%和57%。使用SignalP软件程序(Nielsen等,1997,Protein Engineering10:1-6),预测了21个残基的信号肽。预测的成熟蛋白含有229个氨基酸,其具有23.39kDa的预测分子量。
米曲霉JaL355原生质体根据Christensen等,1988,Bio/Technology6:1419-1422的方法制备。将六μg的pAG43用于转化米曲霉JaL355。将二十六个转化体分离至单个PDA平板。
将24个转化体的汇合的PDA平板各用5ml的0.01%20洗涤,并各自收集孢子。将八μl的各孢子储备分别添加至1ml的YPG,YPM,和M410培养基24孔板中并在34℃温育。在3日温育之后,将来自四个转化体的7.5μl的上清使用无染色,8-16%梯度SDS-PAGE凝胶(Bio-Rad Laboratories,Inc.,Hercules,CA,USA)根据生产商的指示进行分析。基于该凝胶,选择M410培养基作为最佳的培养基。在温育之后五日,将来自每个M410培养的7.5μl的上清使用无染色,8-16%梯度SDS-PAGE凝胶进行分析。培养的SDS-PAGE概貌显示数个转化体具有大约25kDa的新的主要条带。
将一个转化体(在PDA平板上生长)的汇合平板用5ml的0.01%20洗涤,并接种入四个含有100ml的M410培养基的500ml Erlenmeyer烧瓶以生成培养液以供表征酶。在第5日收获这些烧瓶(300ml),使用0.22μm EXPRESSTM Plus Membrane(Millipore,Bedford,MA,USA)过滤,并在4℃储藏。
将含有重组产生的具有纤维素分解增强活性的烟曲霉GH61B多肽的过滤的烧瓶培养液首先通过配置有10kDa聚醚砜膜(Pall Filtron,Northborough,MA,USA)的切线流浓缩器(Pall Filtron,Northborough,MA,USA)进行浓缩,缓冲液交换入20mM Tris-HCl pH8.0,然后使用HIGHLOADTM26/60SUPERDEXTM75凝胶排阻柱(GE Healthcare,Piscataway,NJ,USA)以750ml的150mM NaCl,20mM Tris-HCl pH8.0中的等张梯度进行纯化。基于SDS-PAGE分析收集并汇集级分。使用Microplate BCATMProtein Assay Kit(Thermo Fisher ScientificInc.,Rockford,IL,USA)确定蛋白浓度,其中使用牛血清白蛋白作为蛋白标样。
实施例2:烟曲霉GH61B变体I75V+F77L+F179I+I181L+I183V的构建
构建具有取代I75V,F77L,F179I,I181L,和I183V的具有纤维素分解增强活性的野生型烟曲霉GH61B多肽的变体。将来自质粒pAG43(实施例2)的野生型烟曲霉GH61B骨架作为起始模板,对其以数个单独步骤导入取代,生成中间体,直至获得具有最终目标氨基酸取代的下述质粒:pTH227(I75V+F77L+F179I+I181L+I183V)。使用XL Site-Directed Mutagenesis Kit(Stratagene,La Jolla,CA,USA)通过PCR介导的反应生成突变,其中使用设计为具有目标变化的如表1所示的合成的寡核苷酸引物对以组入所需的取代。
使用反向和正向引物对68337和68343和pAG43作为起始模板生成变体质粒pTH221。使用反向和正向引物对68335和68336以及变体质粒pTH221作为起始模板来生成变体质粒pTH227。
表1
使用9600制备所得的突变体质粒DNA,并将其使用3130xlGeneticAnalyzer(Applied Biosystems,Carlsbad,CA,USA)进行测序。
实施例3:烟曲霉GH61B变体I75V+F77L+F179I+I181L+I183V在米曲霉JaL250中的表达
根据Christensen等,1988,Bio/Technology6:1419-1422的方法制备米曲霉JaL250(WO99/61651)原生质体,并将其用5μg的pTH227(或作为对照的pAllo2)进行转化。转化得到约20-25个转化体。然后将转化体孢子纯化至单个选择性PDA平板,并然后在含有1ml的MDU2BP培养基的24孔培养平板中进行生长,并在34℃静态温育5日。在第5日收获培养液样品,并通过8-16%Tris-glycine SDS-PAGE(Bio-Rad Laboratories,Inc.,Hercules,CA,USA)进行分析。一旦来自每个孢子纯化的转化体的培养物汇合并形成孢子,通过将5ml的灭菌过滤的0.01%80(用玻璃蒸馏水稀释)施于每个PDA平板的中央并使用灭菌的涂布器将孢子涂布于溶液中来制备孢子储备。将来自对于每批通过SDS-PAGE鉴定为在预测的26kDa的分子量具有较深条带的最高生产转化体的孢子储备用于接种含有300ml的MDU2BP培养基的2升摇瓶。将摇瓶在34℃以220rpm搅拌温育5日。在温育之后,将培养液使用0.22μm聚醚砜膜(Millipore,Bedford,MA,USA)进行灭菌过滤以供纯化。根据对摇瓶培养液SDS-PAGE分析鉴定出的在26kDa具有最强条带的米曲霉菌株为TH168(烟曲霉GH61B变体I75V+F77L+F179I+I181L+I183V)。
实施例4:烟曲霉GH61B变体I75V+F77L+F179I+I181L+I183V的纯化
将重组产生的烟曲霉GH61B变体I75V+F77L+F179I+I181L+I183V首先通过配置有10kDa聚醚砜膜(Pall Filtron,Northborough,MA,USA)的切线流浓缩器(Pall Filtron,Northborough,MA,USA)进行浓缩,缓冲液交换入Tris-HCl pH8.0,然后使用(自填充)75mlHighPerformance柱(GE Healthcare,Piscataway,NJ,USA)用20mMTris-HCl pH8.0中的800ml0-600mM NaCl线性梯度进行纯化。收集级分,并基于SDS-PAGE分析进行汇集。使用Microplate BCATMProtein Assay Kit确定蛋白浓度,其中使用牛血清白蛋白作为蛋白标样。
实施例5:里氏木霉CEL5A内切葡聚糖酶II的制备
如下所述将里氏木霉家族GH5A内切葡聚糖酶II基因(SEQ ID NO:5[DNA序列]和SEQ ID NO:6[推导的氨基酸序列])克隆入米曲霉表达载体。
设计如下所示的两个合成的寡核苷酸引物以从里氏木霉RutC30基因组DNA PCR扩增内切葡聚糖酶II基因。使用Plant Maxi Kit分离基因组DNA。使用IN-FUSIONTMPCR Cloning Kit将片段直接克隆入pAILo2(WO2004/099228)。
正向引物:5’-ACTGGATTTACCATGAACAAGTCCGTGGCTCCATTGCT-3’(SEQ ID NO:79)
反向引物:5’-TCACCTCTAGTTAATTAACTACTTTCTTGCGAGACACG-3’(SEQ ID NO:80)
粗体字母代表编码序列。剩余序列含有与pAlLo2的插入位点相比的序列同一性(WO2004/099228)。
将五十皮摩尔的每种上述引物用于PCR反应,PCR反应包含200ng的里氏木霉基因组DNA,1X Pfx Amplification Buffer,6μl的10mM的dATP,dTTP,dGTP和dCTP混合物,2.5单位的Pfx DNA聚合酶,和1μl的50mM MgSO4,最终体积为50μl。将扩增反应在 5333(Eppendorf Scientific,Inc.,Westbury,NY,USA)中进行温育,其程序如下:1个循环,在98℃进行2分钟;和35个循环,每个在94℃进行30秒,61℃进行30秒,和68℃进行1.5分钟。在35个循环之后,将反应在68℃温育10分钟,然后冷却至10℃。将1.5kb PCR反应产物在使用TAE缓冲液和0.1μg的溴乙锭每ml的0.8%琼脂糖凝胶(Cambrex Bioproducts,Rutherford,NJ,USA)进行分离。在DARKREADERTM(Clare Chemical Research,Dolores,CO,USA)的协助下显影DNA片段。将1.5kb DNA条带用可丢弃的剃刀切出,并使用DA旋转杯(Millipore,Billerica,MA,USA)根据生产商的指示纯化。
将质粒pAlLo2通过用Nco I和Pac I的消化直链化。通过如上所述的凝胶过滤和超滤来纯化质粒片段。将纯化的PCR片段克隆入经直链化和纯化的pAlLo2载体使用IN-FUSIONTMPCR Cloning Kit进行。反应(20μl)含有1X IN-FUSIONTMBuffer,1X BSA,1μl的IN-FUSIONTM酶(稀释1:10),100ng的用Nco I和Pac I消化的pAlLo2,和100ng的里氏木霉CEL5A内切葡聚糖酶IIPCR产物。将反应物在室温温育30分钟。将2μl反应样品用于根据生产商的指示转化大肠杆菌Gold感受态细胞。在恢复期之后,将来 自转化反应的两个100μl等分试样铺板于补充100μg氨苄青霉素每升的150mm2X YT平板。将平板在37℃温育过夜。将一组三个推定的重组克隆从选择平板回收,并使用9600从每个平板制备质粒DNA。克隆通过Pci I/Bsp LU11I限制性消化进行分析。然后对一个具有预期的限制性消化样式的克隆进行测序以确认在克隆的插入物中无突变。选择克隆#3并命名为pAlLo27。
米曲霉JaL250(WO99/61651)原生质体根据Christensen等,1988,见上文的方法制备,并用5μg的pAlLo27(或作为对照的pAlLo2)转化。转化得到约50个转化体。将十一个转化体分离至单个PDA平板并在34℃温育5日。
将汇合的孢子平板用3ml的0.01%80洗涤,并使用孢子悬液接种125ml玻璃烧瓶中的25ml的MDU2BP培养基。将转化体培养物在34℃以200rpm恒定振荡进行温育。在接种后第五日,将培养物以6000x g离心,并收集其上清。将五微升的各上清与等体积的2X上样缓冲液(10%β-巯基乙醇)混合,并加载于1.5mm8%-16%Tris-Glycine SDS-PAGE凝胶上,并用SIMPLYBLUETMSafeStain(Invitrogen Corp.,Carlsbad,CA,USA)染色。培养液的SDS-PAGE概貌显示十一个转化体中的十个产生大约45kDa新的蛋白条带。将转化体编号1,命名为米曲霉JaL250AlLo27,培养于发酵罐中。
烧瓶培养基包含50g的蔗糖,10g的KH2PO4,0.5g的CaCl2,2g的MgSO4·7H2O,2g的K2SO4,2g的尿素,10g的酵母提取物,2g的柠檬酸,0.5ml的痕量金属溶液,和去离子水加至1升。痕量金属溶液包含13.8g的FeSO4·7H2O,14.3g的ZnSO4·7H2O,8.5g的MnSO4·H2O,2.5g的CuSO4·5H2O,3g的柠檬酸,和去离子水加至1升。
将一百ml的烧瓶培养基添加至500ml烧瓶。将烧瓶用两个来自PDA平板的米曲霉JaL250AlLo27的栓接种,并在34℃在定轨振荡器上以200rpm温育24小时。使用五十ml的烧瓶培养液接种3升发酵容器。
发酵批次培养基包含10g的酵母提取物,24g的蔗糖,5g的(NH4)2SO4,2g的KH2PO4,0.5g的CaCl2·2H2O,2g的MgSO4·7H2O,1g的柠檬酸,2g的K2SO4,0.5ml的抑泡剂,0.5ml的痕量金属溶液,和去离子水加至1升。痕量金属溶液包含13.8g的FeSO4·7H2O,14.3g的ZnSO4·7H2O,8.5g的MnSO4·H2O,2.5g的CuSO4·5H2O,3g的柠檬酸,和去离子水加至1升。发酵补料培养基包含麦芽糖。
将总共1.8升的发酵批次培养基添加至Applikon Biotechnology三升玻璃 夹套发酵器(glass jacketed fermentor)(Applikon Biotechnology,Inc.,Foster City,CA,USA)。将发酵补料培养基以0至4.4g/l/hr的速率剂量添加185小时的时间。将发酵容器维持在34℃的温度,并使用Applikon1030控制系统(Applikon Biotechnology,Inc.,FosterCity,CA,USA)将pH控制在6.1+/-0.1的设定点。将空气以1vvm的速率添加至容器,并通过在1100至1300rpm旋转的Rushton叶轮搅拌培养液。在发酵终止时,从容器收获全培养液,并以3000x g离心以去除生物质。将上清使用0.22μm EXPRESSTMPlusMembrane进行灭菌过滤,并储藏在4℃。
将上清使用400ml SEPHADEXTMG25脱盐柱(GE Healthcare,Piscataway,NJ,USA)根据生产商的指示脱盐并缓冲液交换入20mM Tris-HClpH8.0。将经脱盐的里氏木霉CEL5A内切葡聚糖酶II加载于MONOQTMHR16/10离子交换柱(GE Healthcare,Piscataway,NJ,USA)并用20mM Tris-HCl pH8中的300ml线性0-300mM NaCl梯度来洗脱,并收集10ml级分。级分基于SDS-PAGE分析汇集。蛋白浓度使用Microplate BCATMProtein Assay Kit 确定,其中使用牛血清白蛋白作为蛋白标样。
实施例6:烟曲霉GH3Aβ-葡糖苷酶的制备
烟曲霉β-葡糖苷酶(SEQ ID NO:55[DNA序列]和SEQ ID NO:56[推导的氨基酸序列])根据美国专利号7,244,605制备。蛋白浓度使用Microplate BCATMProtein Assay Kit确定,其中使用牛血清白蛋白作为蛋白标样。
实施例7:烟曲霉NN055679Cel7A纤维二糖水解酶I的制备
对烟曲霉部分基因组序列(The Institute for Genome Research,Rockville,MD,USA)的tfasty检索(Pearson等,1997,Genomics46:24-36)使用来自里氏木霉的Cel7纤维二糖水解酶蛋白序列(登录号P00725)作为查询序列来进行。基于在氨基酸水平与查询序列的高水平的类似性,数个基因鉴定为推定的家族GH7同源物。选择一个与检索序列具有显著同一性的基因组区进行进一步研究,并将相应基因命名为cel7A。
设计了下示的两个合成的寡核苷酸引物以从WO2005/047499中所述的烟曲霉的基因组DNA PCR扩增烟曲霉NN055679cel7A纤维二糖水解酶I基因(SEQ ID NO:49[DNA序列]和SEQ ID NO:50[推导的氨基酸序列])。
正向引物:5'-gggcATGCTGGCCTCCACCTTCTCC-3'(SEQ ID NO:81)
反向引物:5'-gggttaattaaCTACAGGCACTGAGAGTAA-3’(SEQ ID NO:82)
大写字母代表编码序列。剩余序列分别在正向和反向序列中提供对于SphI和PacI的限制性内切核酸酶位点。使用这些引物,使用标准PCR方法扩增烟曲霉cel7A基因,并将反应产物通过使用TAE缓冲液的1%琼脂糖凝胶电泳分离,并使用GelExtraction Kit(QIAGEN Inc.,Valencia,CA,USA)根据生产商的指示来纯化。
用Sph I和Pac I消化片段,并根据标准步骤将其连接入亦用Sph I和PacI消化的表达载体pAlLo2。将连接产物根据生产商的指示转化入大肠杆菌XL10Gold感受态细胞。通过限制性消化检测出含有正确大小的质粒的大肠杆菌转化体,并使用9600制备质粒DNA。来自该质粒的插入物的DNA测序用Perkin-ElmerApplied Biosystems Model377XL Automated DNA Sequencer(Perkin-Elmer/AppliedBiosystems,Inc.,Foster City,CA,USA)使用染料终止子化学(Giesecke等,1992,见上文)和引物步移策略进行。审视核苷酸序列数据的品质,并将所有序列在PHRED/PHRAP软件(University of Washington,Seattle,WA,USA)的协助下彼此比较。核苷酸序列显示为匹配通过TIGR确定的基因组序列(SEQ ID NO:49[DNA序列]和SEQ ID NO:50[推导的氨基酸序列])。所得的质粒命名为pEJG93。
米曲霉JaL250原生质体根据Christensen等,1988,见上文的方法来制备,并用5μg的pEJG93(以及作为载体对照的pAlLo2)转化。转化得到100个转化体。将十个转化体分离至单个PDA平板。
将十个转化体中的五个的汇合PDA平板用5ml的0.01%20洗涤,并分别接种入125ml玻璃烧瓶中的25ml的MDU2BP培养基,并在34℃,250rpm温育。在温育之后五日,将来自每个培养物的0.5μl的上清使用8-16%Tris-Glycine SDS-PAGE凝胶(InvitrogenCorp.,Carlsbad,CA,USA)根据生产商的指示来进行分析。培养物的SDS-PAGE概貌显示一个转化体具有大约70kDa的主要条带。将该转化体命名为米曲霉JaL250EJG93。
将一百ml的烧瓶培养基(实施例5)添加至500ml烧瓶。将烧瓶用来自PDA平板的米曲霉JaL250EJG93的两个栓接种,并在34℃在定轨振荡器上以200rpm温育24小时。使用五十ml的烧瓶培养液以接种3升发酵容器。
将总共1.8升的发酵批次培养基(实施例5)添加至Applikon Biotechnology 三升玻璃夹套发酵罐。将发酵补料培养基(实施例5)以0至4.4g/l/hr的速率施用185小时的时间。将发酵容器维持在34℃的温度,并将pH使用Applikon1030控制系统控制在6.1+/-0.1的设定点。将空气以1vvm的速率添加至容器,并将培养液通过在1100至1300rpm旋转的Rushton叶轮来搅拌。在发酵终止时,将全培养液从容器收获,并以3000x g离心以去除生物质。将上清使用0.22μm EXPRESSTMPlus Membrane灭菌过滤,并储藏在4℃。
将过滤的培养液使用配置有10kDa聚醚砜膜(Pall Filtron,Northborough,MA,USA)的切线流浓缩器(Pall Filtron,Northborough,MA,USA)浓缩并用20mM Tris-HCl pH8缓冲液交换,然后使用(自填充)75mlHigh Performance柱(用20mMTris-HCl pH8.0中的750ml0-600mM NaCl线性梯度)纯化,并收集10ml级分。将级分基于SDS-PAGE分析来汇集。蛋白浓度使用Microplate BCATMProtein Assay Kit确定,其中使用牛血清白蛋白作为蛋白标样。
实施例8:烟曲霉Cel6A纤维二糖水解酶II的制备
烟曲霉NN055679纤维二糖水解酶II(CBHII)(SEQ ID NO:51[DNA序列]和SEQ IDNO:52[推导的氨基酸序列])根据下述步骤制备。
设计两个下示的合成的寡核苷酸引物以从基因组DNA PCR扩增烟曲霉家族6A糖基水解酶的全长开读框。使用Cloning Kit(Invitrogen Corp.,Carlsbad,CA,USA)克隆PCR产物。使用IN-FUSIONTMCloning Kit将片段克隆入pAILo2。
正向引物:5’-ACTGGATTTACCATGAAGCACCTTGCATCTTCCATCG-3’(SEQ ID NO:83)
反向引物:5’-TCACCTCTAGTTAATTAAAAGGACGGGTTAGCGT-3’(SEQ ID NO:84)
粗体字母代表编码序列。剩余序列含有与pAlLo2插入位点相比的序列同一性。
将五十皮摩尔的每个上述引物用于PCR反应,所述反应包含500ng的烟曲霉基因组DNA,1X ThermoPol Taq反应缓冲液(New England Biolabs,Ipswich,MA,USA),6μl的10mM的dATP,dTTP,dGTP,和dCTP混合物,0.1单位的Taq DNA聚合酶(New England Biolabs,Ipswich,MA,USA),其最终体积为50μl。使用 5333扩增片段,其程序为1个循环,在98℃进行2分钟;和35个循环,每个在96℃进 行30秒,61℃进行30秒,和72℃进行2分钟。在35个循环之后,将反应物在72℃温育10分钟,然后冷却至10℃直至进一步操作。为了去除Taq DNA聚合酶产生的A-尾,将反应物在1单位的Pfx DNA聚合酶(Invitrogen Corp.,Carlsbad,CA,USA)的存在下在68℃温育10分钟。
将1.3kb PCR反应产物在使用TAE缓冲液和0.1μg的溴乙锭每ml的0.8%GTG-琼脂糖凝胶来分离。将DNA条带在DARK READERTM(ClareChemical Research,Dolores,CO,USA)的协助下显影以避免UV-诱导的突变。将1.3kb DNA条带用可丢弃的剃刀切出,并用DA旋转杯根据生产商的指示来纯化。
将纯化的1.3kb PCR产物克隆入(Invitrogen Corp.,Carlsbad,CA,USA)。将二微升的纯化的PCR产物与1μl的2M氯化钠溶液和1μl的载体混合。将反应物在室温温育15分钟,然后使用2μl的反应物根据生产商的指示转化大肠杆菌TOP10感受态细胞(Invitrogen Corp.,Carlsbad,CA,USA)。将每个转化反应的两个100微升的等分试样铺板于两个补充100μg的氨苄青霉素每ml的150mm2X YT平板上并在37℃温育过夜。
使用八个重组菌落以接种含有补充100μg的氨苄青霉素每ml的3ml的LB培养基的液体培养物。使用9600从这些培养物制备质粒DNA。克隆通过限制性消化来分析。将来自每个克隆的质粒DNA用Eco RI消化,并如上所述通过琼脂糖凝胶电泳来进行分析。八个克隆中的六个具有预期的限制性消化样式,并对克隆2,4,5,6,7和8进行测序以确认在克隆的插入物中无突变。对所示的5’和3’末端的序列分析表明克隆2,6和7具有正确序列。选择这三个克隆以重新克隆入pAlLo2。将每个克隆的一微升等分试样与17μl的1:10稀释0.1mM EDTA-10mM Tris pH7.4混合并使用1μl的该混合物以重新扩增烟曲霉糖基水解酶6A编码区。
将五十皮摩尔的上述每个引物用于PCR反应,所述反应包含1μl的克隆2,6和7的稀释混合物,1X Pfx Amplification Buffer,6μl的10mM的dATP,dTTP,dGTP,和dCTP的混合物,2.5单位的Pfx DNA聚合酶,1μl的50mM MgSO4,最终浓度为50μl。使用 5333扩增片段,其程序如下:1个循环,在98℃进行2分钟;和35个循环,每个在94℃进行30秒,61℃进行30秒,和68℃进行 1.5分钟。在35个循环之后,将反应物在68℃温育10分钟,然后冷却至10℃直至进一步操作。将1.3kb PCR反应产物在使用TAE缓冲液和0.1μg的溴乙锭每ml的0.8%GTG-琼脂糖凝胶来分离。将DNA条带在DARKREADERTMTransilluminator的协助下显影以避免UV-诱导的突变。将1.3kbDNA条带用可丢弃的剃刀切出,并用DA旋转杯根据生产商的指示来纯化。
将载体pAlLo2通过用Nco I和Pac I消化来直链化。将片段通过如上所述的凝胶电泳和超滤来纯化。将纯化的PCR产物克隆入直链化和纯化的pAlLo2载体用IN-FUSIONTMCloning Kit进行。反应(20μl)包含1XIN-FUSIONTMBuffer,1X BSA,1μl的IN-FUSIONTM酶(稀释1:10),100ng的用Nco I和Pac I消化的pAlLo2,和50ng的烟曲霉GH6A纯化的PCR产物。将反应物在室温温育30分钟。使用反应物的2μl样品以根据生产商的指示来转化大肠杆菌TOP10感受态细胞。在恢复期之后,将来自转化反应的两个100μl等分试样铺板于补充100μg的氨苄青霉素每ml的150mm2X YT平板。将平板在37℃温育过夜。从选择平板随机选择一组八个推定的重组克隆,并从每个使用9600制备质粒DNA。将克隆通过Pst I限制性消化来分析。八个克隆中的七个具有预期的选择性消化样式。然后对克隆1,2和3进行测序以确认在克隆的插入物中无突变。选择克隆#2并命名为pAlLo33。
米曲霉JaL355原生质体根据Christensen等,1988,见上文的方法来制备,并用5μg的pAlLo33(以及作为载体对照的pAlLo2)带来转化。转化得到约100个转化体。将十个转化体分离至单个PDA平板。
将十个转化体中的五个的汇合PDA平板用5ml的0.01%20洗涤并分别接种入125ml玻璃摇瓶中的25ml的MDU2BP培养基,并在34℃,250rpm温育。在温育之后五日,将来自每个培养物的0.5μl的上清使用8-16%Tris-Glycine SDS-PAGE凝胶(InvitrogenCorp.,Carlsbad,CA,USA)根据生产商的指示进行分析。培养物的SDS-PAGE概貌显示一个转化体具有大约70kDa的主要条带。将该转化体命名为米曲霉JaL355AlLo33。
将一百ml的摇瓶培养基(实施例5)添加至500ml烧瓶。将烧瓶用来自PDA平板的米曲霉Jal355ALlo33的两个栓接种,并在34℃在定轨振荡器上在200rpm温育24小时。使用五十ml的烧瓶培养液以接种3升发酵容器。
将总共1.8升的发酵批次培养基(实施例5)添加至Applikon Biotechnology三升玻璃夹套发酵罐。将发酵补料培养基(实施例5)以0至4.4g/l/hr施用185小时的时间。将发酵容器维持在34℃的温度,并将pH使用Applikon1030控制系统控制在6.1+/-0.1的设定点。将空气以1vvm的速率添加至容器,并将培养液通过在1100至1300rpm旋转的Rushton叶轮进行搅拌。在发酵终止时,从容器收获全培养液,并以3000x g离心以去除生物质。将上清使用0.22μmEXPRESSTMPlus Membrane灭菌过滤,并储藏于4℃。
将培养液使用0.7μm玻璃过滤器GF/F(Whatman,Piscataway,NJ,USA)过滤,然后使用0.22μm EXPRESSTMPlus Membrane过滤。将过滤的培养液使用配置有10kDa聚醚砜膜(PallFiltron,Northborough,MA,USA)的切线流浓缩器浓缩(Pall Filtron,Northborough,MA,USA)和用20mM Tris-HCl pH8.0缓冲液交换。
将经脱盐的培养液加载于MONOQTMHR16/10离子交换柱,并用20mMTris-HCl pH8中的300ml线性0-300mM NaCl梯度洗脱,并收集10ml级分。级分基于SDS-PAGE分析汇集。将汇集的级分调整至20mM Tris,pH8.0中的1.2M(NH4)2SO4,然后施于75ml自行倾入的(self-poured)的PHENYLSEPHAROSETM 柱(GE Healthcare,Piscataway,NJ,USA),并用20mM Tris-HCl pH8中的750ml线性1.2-0M(NH4)2SO4梯度进行洗脱,并收集10ml级分。将基于SDS-PAGE汇集的级分使用 10kDa MWCO离心浓缩器(GE Healthcare,Piscataway,NJ,USA)来浓缩。然后将浓缩的材料进一步使用HIGHLOADTM26/60Superdex75凝胶过滤柱以150mM NaCl,20mM Tris-HCl pH8.0中的200ml等张梯度来纯化。将级分收集并基于SDS-PAGE汇集,并使用10kDa MWCO离心浓缩器浓缩。蛋白浓度使用Microplate BCATMProtein Assay Kit确定,其中使用牛血清白蛋白作为蛋白标样。
实施例9:烟曲霉GH10木聚糖酶的制备
根据WO2006/078256使用米曲霉BECh2作为宿主来重组制备烟曲霉NN055679GH10木聚糖酶(xyn3;SEQ ID NO:67[DNA序列]和SEQ ID NO:68[推导的氨基酸序列])。
将经过滤的培养液使用配置有10kDa聚醚砜膜(Pall Filtron,Northborough,MA,USA)的切线流浓缩器(Pall Filtron,Northborough,MA,USA)脱盐并用25mM Tris-HClpH8.5缓冲液交换。将经脱盐的材料施于400ml(手动倾入的(hand-poured))Q-SEPHAROSETMFast-FlowTM柱(GE Healthcare,Piscataway,NJ,USA),用400ml25mM TrispH8.5洗涤,并用25mM Tris pH8.5中的1400ml的0-600mM NaCl的线性梯度来洗脱,并收集10ml的级分。级分基于SDS-PAGE汇集,并调整至1.5M(NH4)2SO4,20mM Tris pH8.0,并施于75ml自行倾入的PHENYL SEPHAROSETM 柱,用75ml20mMTris-HCl pH8.0洗涤,并使用20mM Tris-HCl pH8中的1500ml线性1.5-0M(NH4)2SO4梯度洗脱,并收集10ml级分。将级分基于SDS-PAGE分析汇集,并使用配置有10kDa MWCO膜的300ml搅拌室浓缩装置(stirred cellconcentration device)(Millipore,Bedford,MA,USA)来浓缩,并脱盐入20mMTris-HCl pH8.0,150mM NaCl。蛋白浓度使用Microplate BCATMProteinAssay用牛血清白蛋白作为蛋白标样来确定。
实施例10:里氏木霉RutC30GH3β-木糖苷酶的制备
里氏木霉RutC30β-木糖苷酶基因(SEQ ID NO:69[DNA序列]和SEQ ID NO:70[推导的氨基酸序列])通过使用LambdaXR Library Construction Kit(Stratagene,La Jolla,CA,USA)根据生产商的指示筛选从里氏木霉RutC30基因组DNA制备的LambdaLibrary来分离。里氏木霉RutC30基因组DNA使用标准方法制备。使用下示PCR引物扩增编码里氏木霉β-木糖苷酶的2300bp的DNA区段。
正向引物:5’-gtgaataacgcagctcttctcg-3’(SEQ ID NO:85)
反向引物:5’-ccttaattaattatgcgtcaggtgt-3’(SEQ ID NO:86)
引物994768设计为从β-木糖苷酶起始位点之后的第一个碱基开始扩增,而引物994769设计为在5’端具有Pac I位点。
将五十皮摩尔的上述每个引物用于PCR反应,所述反应包含50ng的来自Lamda Zap文库的质粒DNA,1μl的10mM dATP,dTTP,dGTP,和dCTP的混合物,5μl的10XPfx DNA Polymerase Buffer,和1单位的 Pfx DNA聚合酶,最终体积为50μl。使用 5333扩增DNA片段,其程序如下:1个循环,在95℃进行3分钟;和30个循环,每个在94℃进行45秒,55℃进行60秒,和72 ℃进行1分30秒。在30个循环之后,将反应在72℃温育10分钟,然后冷却至4℃直至进一步操作。
2.3kb PCR产物通过使用TAE缓冲液的1%琼脂糖凝胶电泳来纯化,从凝胶切出,并使用Gel Extraction Kit纯化。然后用Pac I消化2.3kb PCR产物以便于插入pAlLo1(WO2004/099228)。
将pAlLo1载体用Nco I消化,然后使用T4DNA聚合酶(Roche AppliedScience,Nutley,NJ,USA)根据生产商的指示填充。然后使用第二酶Pac I来消化pAlLo1的5’端,并将反应物通过如上所述的琼脂糖凝胶电泳纯化以分离6.9kb载体片段。
然后将2.3kbβ-木糖苷酶片段连接至6.9kb载体片段,并根据生产商的指示转化入大肠杆菌XL1-Blue Subcloning Competent Cells(Invitrogen Corp.,Carlsbad,CA,USA)。使用限制性消化分析筛选转化体以鉴定具有正确插入的那些。通过使用ABI3700DNAAnalyzer(Applied Biosystems,Foster City,CA,USA)和染料终止子化学(Giesecke等,1992见上文)的测序确认了新的表达载体pSaMe04。
设计下示的两个合成寡核苷酸引物以从pSaMe04PCR扩增里氏木霉β-木糖苷酶基因以构建木霉属表达载体。使用IN-FUSIONTMCloning Kit将片段直接克隆入表达载体pMJ09(WO2005/056772),无需选择性消化和连接。
TrBXYL-F(ID064491):
5’-CGGACTGCGCACCATGGTGAATAACGCAGCTCT-3’(SEQ ID NO:87)
TrBXYL-R(ID064492):
5’-TCGCCACGGAGCTTATTATGCGTCAGGTGTAGCAT-3’(SEQ ID NO:88)
粗体字母代表编码序列。剩余序列与pMJ09的插入位点同源。
将五十皮摩尔上述每个引物用于PCR反应,所述反应包含50ng的pSaMe04,1μl的10mM的dATP,dTTP,dGTP,和dCTP的混合物,5μl的10X ACCUTAQTMDNA Polymerase Buffer(Sigma-Aldrich,St.Louis,MO,USA),和5单位的ACCUTAQTMDNA聚合酶(Sigma-Aldrich,St.Louis,MO,USA),最终体积为50μl。使用 5333以扩增PCR片段,其程序如下:1个循环,在95℃进行3分钟;和30个循环,每个在94℃进行45秒,55℃进行60秒,和72℃进行1分30秒。在30个循环之后,将反应物在72℃温育10分钟,然后冷却至4℃直至进一步操作。
将反应产物通过使用TAE缓冲液的1.0%琼脂糖凝胶电泳来分离,其中将1.2kb产物条带从凝胶切出,并使用Gel Extraction Kit根据生产商的指示来纯化。
然后将1.2kb片段使用IN-FUSIONTMCloning Kit克隆入pMJ09。将载体用Nco I和Pac I消化,并通过如上所述的琼脂糖凝胶电泳纯化。将基因片段和消化的载体连接在一起用于反应,得到表达载体pSaMe-TrBXYL,其中β-木糖苷酶基因的转录在里氏木霉cbh1基因启动子的调控下。连接反应(50μl)包含1X IN-FUSIONTMBuffer,1X BSA,1μl的IN-FUSIONTM酶(稀释1:10),100ng用Nco I和Pac I消化的pMJ09,和100ng的里氏木霉β-木糖苷酶纯化的PCR产物。将反应在室温温育30分钟。使用一μl的反应物转化大肠杆菌XL10Gold感受态细胞。含有pSaMe-TrBXYL的大肠杆菌转化体通过限制性酶消化来检测,并使用9600制备质粒DNA。对来自pSaMe-TrBXYL的里氏木霉β-木糖苷酶基因的DNA测序使用染料终止子化学(Giesecke等,1992,见上文)和引物步移策略来进行。
将质粒pSaMe-AaXYL构建为包含里氏木霉纤维二糖水解酶I基因启动子和终止子和棘孢曲霉GH10木聚糖酶编码序列。
对棘孢曲霉木聚糖酶的克隆遵循如等,1994,Mol.Gen.Genet.243:253-260中概述的总体克隆方案。
RNA从棘孢曲霉CBS101.43菌丝体分离。多聚(A)+RNA从总RNA通过对寡聚(dT)-纤维素的层析来分离。双链cDNA如Maniatis等(Molecular cloning:a laboratorymanual.Cold Spring Harbor Laboratory Press,1982)中所述来分离。在合成之后,将cDNA用绿豆核酸酶处理,用T4 DNA聚合酶平端化,并连接于非回文的Bst XI将汇集的级分接头(Invitrogen Corp.,Carlsbad,CA,USA)。将cDNA通过使用TAE缓冲液的1%琼脂糖凝胶电泳进行大小分级,其中将600bp至4000bp范围的片段用于文库构建。将DNA在GAL1启动子和异-1-细胞色素c终止子之间连接入Bst XI-消化的pYES 2.0(Invitrogen Corp.,Carlsbad,CA,USA),并转化入大肠杆菌MC1061细胞(Stratagene,La Jolla,CA,USA)。将文库铺板于LB平板,并在37℃温育过夜。将菌落从平板刮去并重悬于补充100μg氨苄青霉素每ml的LB培养基。质粒DNA使用Plasmid Midi Kit(QIAGEN Inc.,Valencia,CA,USA)分离。汇集纯化的质粒DNA。
将纯化的质粒DNA混合物转化入酿酒酵母W3124细胞(MATa;ura3-52;leu2-3,112;his3-D200;pep4-1137;prcl::HIS3;prbl::LEU2;cir+;van den Hazel等,1992,Eur.J.Biochem.207:277-283)。培养、转化和培养基如Guthrie等,1991,Meth.Enzymol.Vol194,Academic Press所述。将转化的细胞在30℃铺板于含有2%葡萄糖的合成完全琼脂3日。在3日之后,将菌落复制铺板至含2%半乳糖的SC琼脂平板,并在30℃温育4日。表达木聚糖酶的菌落使用在pH4.5覆盖0.1%AZCL-桦木-木聚糖的1%琼脂糖(2006,FEMSMicrobiology Reviews21:29-42)来鉴定。表达木聚糖酶活性的菌落被蓝色区包围。从阳性克隆回收的质粒DNA,含有大约1.3kb的DNA插入物。对分离的基因片段的测序揭示了1218bp的开读框,其编码具有43.0kDa的理论分子量的多肽。将cDNA片段亚克隆入用Bam HI和Xho I消化的曲霉属表达载体pHD464(和Heldt-Hansen,1994,Mol.Gen.Genet.243,253–260),即用Bam HI和Xho I消化所述克隆并分离1.2kb cDNA插入物(Christgau等,1996,Biochem.J.319:705-712)以生成质粒pA2X2。
将棘孢曲霉GH10木聚糖酶编码序列使用作为模板的质粒pA2x2和下示的引物153505和153506使用标准方法进行PCR扩增以得到大约1.2kb片段。将1.2kb片段用Bam HI和Xho I消化(导入PCR引物)并克隆入载体pCaHj527(WO2004/099228)。所得的质粒命名为pMT2155,其中cDNA处于来自黑曲霉的中性淀粉酶II(NA2)启动子和来自黑曲霉的AMG终止子的转录调控下。
引物153505:
5’-TCTTGGATCCACCATGGTCGGACTGCTTTCAATCACC-3’(SEQ ID NO:89)
引物153506:
5’-TTAACTCGAGTCACAGACACTGCGAGTAATAGTC-3’(SEQ ID NO:90)
设计下示的两个合成寡核苷酸引物以从质粒pMT2155来PCR扩增棘孢曲霉GH10基因,并将用于插入的侧翼序列导入表达载体pMJ09(WO2005/056772)。粗体字母代表编码序列,而剩余序列同源于pMJ09的插入位点。
正向引物:5’-cggactgcgcaccatggtcggactgctttcaat-3’(SEQ ID NO:91)
反向引物:5’-tcgccacggagcttatcacagacactgcgagtaat-3’(SEQ ID NO:92)
将五十皮摩尔的上述每个引物用于PCR反应,所述反应组成为50ng的pMT2155,1μl的10mM的dATP,dTTP,dGTP,和dCTP的混合物,5μl的10X ACCUTAQTMDNA Polymerase Buffer,和5单位的ACCUTAQTMDNA 聚合酶,最终体积为50μl。使用 5333扩增DNA片段,其程序如下:1个循环,在95℃进行3分钟;和30个循环,每个在94℃进行45秒,55℃进行60秒,和72℃进行1分30秒。在30个循环之后,将反应物在72℃温育10分钟,然后冷却至4℃直至进一步操作。
将反应产物通过使用TAE缓冲液的1%琼脂糖凝胶电泳分离,其中将1.2kb产物条带从凝胶切出,并使用QIAquick Gel Extraction Kit根据生产商的指示进行纯化。
然后将片段使用IN-FUSIONTMCloning Kit克隆入pMJ09。将载体用NcoI和Pac I消化并如上所述通过琼脂糖凝胶电泳纯化。将1.2kb基因片段和消化的载体连接在一起用于反应,得到表达质粒pSaMe-AaXYL,其中家族GH10基因的转化处于里氏木霉cbh1启动子的调控下。连接反应物(50ul)包含1XIN-FUSIONTMBuffer,1X BSA,1μl的IN-FUSIONTM酶(稀释1:10),100ng用Nco I和Pac I消化的pAlLo2,和100ng的棘孢曲霉GH10木聚糖酶纯化的PCR产物。将反应物在室温温育30分钟。使用一μl的反应物以根据生产商的指示转化大肠杆菌XL10Gold感受态细胞。含有pSaMe-AaGH10的大肠杆菌转化体通过限制性酶消化来检测,并使用 9600制备质粒DNA。对来自pSaMe-AaXYL的棘孢曲霉GH10基因的DNA测序使用染料终止子化学(Giesecke等,1992,见上文)和引物步移策略进行。
将编码棘孢曲霉GH10内切葡聚糖酶的质粒pSaMe-AaXYL和编码里氏木霉β-木糖苷酶的pSaMe-TrBXYL通过PEG介导的转化(Penttila等,1987,Gene61155-164)共转化入里氏木霉RutC30以生成里氏木霉菌株SaMe-BXX13。每个质粒含有构巢曲霉amdS基因以使得转化体能够以乙酰胺作为唯一氮源生长。
里氏木霉RutC30在27℃和90rpm在25ml的补充2%(w/v)葡萄糖和10mM尿苷的YP培养基中培养17小时。将菌丝体通过使用Vacuum DrivenDisposable Filtration System(Millipore,Bedford,MA,USA)过滤收集并用去离子水洗涤两次和用1.2M山梨醇洗涤两次。原生质体通过将经洗涤的菌丝体悬于20ml的含有15mg每ml的GLUCANEXTM(Novozymes A/S,Bagsvaerd,Denmark)和0.36单位每ml的壳多糖酶(Sigma Chemical Co.,St.Louis,MO,USA)的1.2M山梨醇并在34℃以90rpm的轻柔振荡温育15-25 分钟来产生。原生质体通过在400x g离心7分钟并用冷的1.2M山梨醇洗涤两次来收集。原生质体使用血细胞计数器计数,并重悬于STC中至1X108个原生质体每ml的最终浓度。将过量原生质体储藏于在-80℃的Cryo1℃Freezing Container(Nalgene,Rochester,NY,USA)。
将大约4μg的质粒pSaMe-AaXYL和pSaMe-TRBXYL用Pme I消化并添加至100μl的原生质体溶液,并轻柔地混合,接着加入250μl的10mMCaCl2-10mM Tris-HCl pH7.5-60%PEG4000,混合,并在室温温育30分钟。然后添加STC(3ml)并混合,并将转化溶液铺板于使用构巢曲霉amdS选择的COVE平板。将平板在28℃温育5-7日。将转化体亚克隆在COVE2平板上并在28℃生长。
将超过40个转化体亚克隆在含有乙酰胺的新鲜平板上,并允许在28℃使孢子形成7日。
将里氏木霉转化体在含有25ml的pH6.0的CIM培养基的125ml带挡板的摇瓶中培养,即接种转化体的孢子并在28℃和200rpm温育7日。将里氏木霉RutC30作为对照运行。在第5日去除培养液样品。将一ml的每个培养液在微离心机中以15,700x g离心5分钟,并将上清转移至新管。
SDS-PAGE使用具有System(Bio-Rad Laboratories,Inc.,Hercules,CA,USA)的Tris-HCl(5%溶解)凝胶进行。将五μl的第7日上清(见上)悬于2X浓缩的Laemmli Sample Buffer(Bio-RadLaboratories,Inc.,Hercules,CA,USA),并在5%β-巯基乙醇的存在下煮沸3分钟。将上清样品加载于聚丙烯酰胺凝胶上,并对其进行用1X Tris/Glycine/SDS作为运行缓冲液(Bio-Rad Laboratories,Inc.,Hercules,CA,USA)的电泳。将所得的凝胶用BIO-SAFETMCoomassie Stain染色。基于蛋白凝胶显示最高的棘孢曲霉GH10木聚糖酶和里氏木霉β-木糖苷酶表达的转化体命名为里氏木霉SaMe-BXX13。
将里氏木霉SaMe-BXX13在含有250ml的pH6.0的CIM培养基的500ml带挡板的烧瓶中培养,所述培养基用里氏木霉SaMe-BXX13的孢子接种。将烧瓶在28℃以200rpm温育五日。然后使用0.22μm EXPRESSTMPlusMembrane过滤培养液。
将经过滤的培养液使用配置有10kDa聚醚砜膜(Pall Filtron,Northborough,MA,USA)的切线流浓缩器(Pall Filtron,Northborough,MA, USA)浓缩和用乙酸缓冲液交换至pH4.0。将样品加载于在50mM乙酸钠pH4.0中平衡的SP柱(GE Healthcare,Piscataway,NJ,USA)上,用0-1000mM氯化钠的梯度洗脱结合的蛋白质。将级分使用切线流浓缩器缓冲液交换至20mM磷酸钠pH7.0并施于用1.5M(NH4)2SO4-20mM磷酸钠pH7.0平衡的PHENYL SUPEROSETMHR16/10柱(GE Healthcare,Piscataway,NJ,USA)。将结合的蛋白质用在20柱体积中20mM Tris-HCl pH7.0中从1.5至0M(NH4)2SO4的线性梯度进行洗脱。将蛋白积分使用切线流浓缩器缓冲液交换至20mM TEA HCl pH7.5。将样品施于在20mM TEA HCl pH7.5中平衡的MONOQTMHR16/10离子交换柱,结合的蛋白质用0-300mM氯化钠的梯度洗脱。最终蛋白级分的缓冲液为20mM TEA-100mM氯化钠pH7.5。蛋白浓度使用Microplate BCATMProteinAssay Kit确定,其中使用牛血清白蛋白作为蛋白标样。
实施例11:磷酸溶胀的纤维素的制备
磷酸溶胀的纤维素(PASC)从PH101(FMC,Philadelphia,PA,USA)使用Zhang等,2006,Biomacromolecules7:644-648描述的实验方案来制备。
实施例12:磷酸溶胀的纤维素(PASC)的水解测定
将如实施例11中所述制备的PASC的1.0%浆料通过振荡充分重悬,并迅速转移至100ml烧杯,并用磁性搅拌棒迅速搅拌。将1.0%PASC浆料的五百μl等分试样使用具有宽开口的尖的1000μl微移液管(尖末端从基部约2mm处切去)移液入2.0ml96深孔板(Axygen,UnionCity,CA,USA)的孔中。然后将一百μl的10mM MnSO4-500mM乙酸钠pH5添加至每个孔。将二百μl的去离子水或1.0%连苯三酚(w/w)(Sigma Chemical Co.,Inc.,St.Louis,Mo,USA)溶液添加至每个孔中。制备酶混合物,然后将其以200μl的体积同时添加至所有孔中,使每个反应总体积为1ml。然后使用ALPS300TM平板密封器(Abgene,Epsom,United Kingdom)密封平板,充分混合,并在50℃或65℃温育大约3日。所有报道的实验一式三份进行。
对于水解反应的初步分析使用配置有AMINEXTMHPX-87H柱(Bio-RadLaboratories,Inc.,Hercules,CA,USA)的具有软件(Agilent Technologies,Inc.,Santa Clara,CA,USA)的1100HPLC(Agilent Technologies,Inc.,SantaClara,CA,USA)来进行。在大约4日之后,将深孔板从培养箱移除,并冷却过夜至4℃。然后将平板通过倒置混合均匀,并在RT7离心机中以52x g短暂地离心10秒。然后将样品通过移液混合,并将来自每个孔的200μl转移至HV(Millipore,Bedford,MA,USA)离心过滤板装置。将离心过滤板装置在RT7离心机中以2000rpm离心20分钟。将滤过物转移至96孔自动取样器平板,并用5mM H2SO41:1稀释,用硅密封垫密封,并插入HPLC插入器模块(设为4℃)以供将20μl注入连接于4.6x250mmHPX-87H柱的CATION HTM保护柱上,接着用5mM H2SO4中的0.05%w/w苯甲酸洗脱。糖通过折射率检测来检测,其中通过与纯化的糖标样相比的积分来定量。
所有HPLC数据处理使用MICROSOFT EXCELTM软件(Microsoft,Richland,WA,USA)进行。将测得的葡萄糖浓度就合适的稀释系数进行调整。在此测定中,仅测量葡萄糖,因为β-葡糖苷酶以高水平存在于所有除对照外的样品中。百分比相对转化使用下述方程计算:
%转化=[样品葡萄糖浓度]/[限制消化的葡萄糖浓度]x100
为了计算%转化,基于100mg的里氏木霉纤维素酶每克纤维素(CELLUCLAST PLUSTM,Novozymes A/S,Bagsvaerd,Denmark)的纤维素酶对照来设定100%转化点,并将所有值除以该数值并乘以100。将一式三份数据点取平均值,并计算标准偏差。
实施例13:烟曲霉GH61B变体I75V+F77L+F179I+I181L+I183V的添加对烟曲霉β-葡糖苷酶在50℃和65℃在连苯三酚存在下转化磷酸溶胀的纤维素的作用
对烟曲霉GH61B野生型多肽和烟曲霉GH61B变体L90V I75V+F77L+F179I+I181L+I183V评估其在连苯三酚存在下增强烟曲霉CEL3Aβ-葡糖苷酶水解磷酸溶胀的纤维素的能力。磷酸溶胀的纤维素水解测定如实施例12中所述进行。
连苯三酚(0.2%w/w),烟曲霉GH61B变体I75V+F77L+F179I+I181L+I183V(10mg蛋白每g纤维素)和烟曲霉CEL3Aβ-葡糖苷酶(5mg蛋白每g纤维素)的组合对磷酸溶胀的纤维素(0.5%w/w)的转化根据实施例12中所述的测定来确定。在50℃或65℃温育72小时之后,如实施例12中所述收集并分析数据。数据示于图1。
连苯三酚(0.2%w/w)和烟曲霉CEL3Aβ-葡糖苷酶(5mg蛋白每g纤维素)的组合导致磷酸溶胀的纤维素的转化在50℃和65℃分别为2.1±0.3%和2.2±1.0%。将烟曲霉GH61B野生型多肽(10mg蛋白每g纤维素)添加至连苯三酚(0.2%w/w)和烟曲霉CEL3Aβ-葡糖苷酶(5mg蛋白每g纤维素)的组合导致磷酸溶胀的纤维素的转化在50℃和65℃分别为23.8±0.6%和16.8±0.4%。将烟曲霉GH61B变体I75V+F77L+F179I+I181L+I183V(10mg蛋白每g纤维素)添加至连苯三酚(0.2%w/w)和烟曲霉CEL3Aβ-葡糖苷酶(5mg蛋白每g纤维素)的组合导致磷酸溶胀的纤维素的转化在50℃和65℃分别为29.0±1.0%和21.1±0.3%。
实施例14:经预处理的玉米秸秆水解测定
玉米秸秆在U.S.Department of Energy National Renewable EnergyLaboratory(NREL)使用1.4wt%硫酸在165℃和107psi处理8分钟。在经预处理的玉米秸秆中的水不溶性固体含有大约59%纤维素,5%半纤维素和28%木质素。纤维素和半纤维素通过两阶段硫酸水解,接着通过使用NREL Standard Analytical Procedure#002的高效液相色谱分析糖来确定。木质素在用硫酸使用NREL Standard Analytical Procedure #003水解纤维素和半纤维素级分之后通过重量分析法来确定。
PCS的水解使用2.2ml深孔板(Axygen,Union City,CA,USA)以1.0ml的总反应体积来进行。水解用含有1mM硫酸锰和多种蛋白加载的纤维素酶组合物(表示为mg蛋白每克纤维素)的50mg PCS每ml50mM乙酸钠pH5.0缓冲液来进行。制备酶混合物,并以100μl的体积同时添加至所有孔,在每个反应中得到1ml的终体积。然后将平板使用ALPS-300TM平板热密封器来密封,充分混合,并在50℃,55℃,60℃和/或65℃温育72小时。所有实验进行一式三次。
在水解之后,将样品使用0.45μm96孔过滤板(Millipore,Bedford,MA,USA)来过滤,并如上所述分析滤过物的糖含量。当不立即使用时,将经过滤的糖等分试样冷冻在-20℃。稀释于0.005M H2SO4中的样品的糖浓度使用4.6x250mmHPX-87H柱来测量,即在65℃以0.6ml每分钟的流速用0.05%w/w苯甲酸-0.005M H2SO4洗脱,并通过积分来自折射率检测 1100HPLC,Agilent Technologies,Santa Clara,CA,USA)的葡萄糖和纤维二糖信号(通过醇糖样品校正)来进行定量。使用所得的当量对于每个反应计算纤维素转化的百分比。
所有HPLC数据处理使用MICROSOFT EXCELTM软件进行。就合适的稀释因子调整测得的糖浓度。分别测量葡萄糖和纤维二糖。然而,为了计算总转化率,将葡萄糖和纤维二糖值合并。将纤维二糖浓度乘以1.053以转化为葡萄糖当量,并添加至葡萄糖浓度。纤维素转化的程度使用下述方程来计算:
%转化=[样品葡萄糖浓度]/[限制消化中的葡萄糖浓度]x100
为了计算%转化,基于100mg纤维素酶转化为每克纤维素(CELLUCLAST PLUSTM,Novozymes A/S,Bagsvaerd,Denmark)的纤维素酶对照来设定100%转化点,并将所有值除以该值,后乘以100。对一式三份的数据点取平均值,并计算标准偏差。
实施例15:烟曲霉GH61B变体I75V+F77L+F179I+I181L+I183V的添加对在50℃和55℃里氏木霉纤维素酶转化为和烟曲霉CEL3Aβ-葡糖苷酶转化PCS的作用
根据如下所述的发酵实验方案来制备来自里氏木霉菌株981-O-8(D4)的纤维素酶组合物。里氏木霉菌株981-O-8(D4)是里氏木霉RutC30(ATCC56765;Montenecourt和Eveleigh,1979,Adv.Chem.Ser.181:289-301)的诱变株。纤维素酶组合物类似于CELLUCLAST(Novozymes A/S,Bagsvaerd,Denmark)。向纤维素酶组合物补充烟曲霉β-葡糖苷酶。在实施例中,补充烟曲霉β-葡糖苷酶的纤维素酶组合物命名为“里氏木霉纤维素酶组合物”。
烧瓶培养基包含20g的右旋糖,10g的玉米液冻干粉,1.45g的(NH4)2SO4,2.08g的KH2PO4,0.36g的CaCl2,0.42g的MgSO4·7H2O,0.42ml的痕量金属溶液,和去离子水加至1升。痕量金属溶液包含216g的FeCl3·6H2O,58g的ZnSO4·7H2O,27g的MnSO4·H2O,10g的CuSO4·5H2O,2.4g的H3BO3,336g的柠檬酸,和去离子水加至1升。
将一百ml的烧瓶培养基添加至500ml烧瓶。用两个来自固体平板培养 的栓来接种烧瓶,并在28℃在定轨振荡器上以200rpm温育48小时。使用五十ml的烧瓶培养液来接种2升发酵容器。
发酵批次培养基包含30g的纤维素,4g的右旋糖,10g的玉米液冻干粉,3.8g的(NH4)2SO4,2.8g的KH2PO4,2.64g的CaCl2,1.63g的MgSO4.7H2O,1.8ml的消泡剂,0.66ml的痕量金属溶液,和去离子水加至1升。痕量金属溶液包含216g的FeCl3·6H2O,58g的ZnSO4·7H2O,27g的MnSO4·H2O,10g的CuSO4·5H2O,2.4g的H3BO3,336g的柠檬酸,和去离子水加至1升。发酵补料培养基包含右旋糖。
将总共1.8升的发酵批次培养基添加至Applikon Biotechnology三升玻璃夹套发酵罐。发酵补料培养基以0至4g/l/hr的速率给料185小时的时间。将发酵容器维持在28℃的温度,并将pH使用Applikon1030控制系统控制在4.5+/-0.1的设定点。将空气以1vvm的速率添加至容器,并将培养液通过在1100至1300rpm旋转的Rushton叶轮进行搅拌。在发酵终止时,从容器收获全培养液,并以3000x g离心以去除生物质。将上清灭菌过滤并储藏在5至10℃。
对烟曲霉GH61B野生型多肽和烟曲霉GH61B变体I75V+F77L+F179I+I181L+I183V评估其增强里氏木霉纤维素酶组合物和烟曲霉CEL3Aβ-葡糖苷酶的组合在50℃或55℃水解PCS的能力。PCS水解测定法如实施例14中所述进行。
里氏木霉纤维素酶组合物(2.7mg蛋白每克纤维素)和烟曲霉CEL3Aβ-葡糖苷酶(0.3mg蛋白每g纤维素)的组合;里氏木霉纤维素酶组合物(2.7mg蛋白每克纤维素),烟曲霉GH61B野生型多肽(0.3mg蛋白每g纤维素),和烟曲霉CEL3Aβ-葡糖苷酶(0.3mg蛋白每g纤维素)的组合;里氏木霉纤维素酶组合物(2.7mg蛋白每克纤维素),烟曲霉GH61B野生型多肽(0.45mg蛋白每g纤维素),和烟曲霉CEL3Aβ-葡糖苷酶(0.3mg蛋白每g纤维素)的组合;里氏木霉纤维素酶组合物(2.7mg蛋白每克纤维素),烟曲霉GH61B野生型多肽(0.6mg蛋白每g纤维素),和烟曲霉CEL3Aβ-葡糖苷酶(0.3mg蛋白每g纤维素)的组合;木霉属纤维素酶组合物(2.7mg蛋白每克纤维素),烟曲霉GH61B野生型多肽(0.75mg蛋白每g纤维素),和烟曲霉CEL3Aβ-葡糖苷酶(0.3mg蛋白每g纤维素)的组合;里氏木霉纤维素酶组合物(2.7mg蛋白每克纤维素),烟曲霉GH61B变体I75V+F77L+F179I+I181L+I183V(0.3mg蛋白每g纤维素),和烟曲霉CEL3Aβ-葡糖苷酶(0.3mg蛋白每g纤维素)的组合;里氏木 霉纤维素酶组合物(2.7mg蛋白每克纤维素),烟曲霉GH61B变体I75V+F77L+F179I+I181L+I183V(0.45mg蛋白每g纤维素),和烟曲霉CEL3Aβ-葡糖苷酶(0.3mg蛋白每g纤维素)的组合;里氏木霉纤维素酶组合物(2.7mg蛋白每克纤维素),烟曲霉GH61B变体I75V+F77L+F179I+I181L+I183V(0.6mg蛋白每g纤维素),和烟曲霉CEL3Aβ-葡糖苷酶(0.3mg蛋白每g纤维素)的组合;和里氏木霉纤维素酶组合物(2.7mg蛋白每克纤维素),烟曲霉GH61B变体I75V+F77L+F179I+I181L+I183V(0.75mg蛋白每g纤维素),和烟曲霉CEL3Aβ-葡糖苷酶(0.3mg蛋白每g纤维素)的组合对PCS的转化根据实施例15确定。在50℃或55℃温育72小时之后,如实施例15中所述收集并分析数据。对于50℃和55℃的结果分别示于图2A和2B。
里氏木霉纤维素酶组合物(2.7mg蛋白每克纤维素)和烟曲霉CEL3Aβ-葡糖苷酶(0.3mg蛋白每g纤维素)的组合在50℃和55℃分别导致53.5±0.2%和52.2±0.3%的PCS转化。
里氏木霉纤维素酶组合物(2.7mg蛋白每克纤维素),烟曲霉GH61B野生型多肽(0.3mg蛋白每g纤维素),和烟曲霉CEL3Aβ-葡糖苷酶(0.3mg蛋白每g纤维素)的组合在50℃和55℃分别导致62.6±0.1%和61.5±0.4%的PCS的转化。里氏木霉纤维素酶组合物(2.7mg蛋白每克纤维素),烟曲霉GH61B野生型多肽(0.45mg蛋白每g纤维素),和烟曲霉CEL3Aβ-葡糖苷酶(0.3mg蛋白每g纤维素)的组合在50℃和55℃分别导致64.3±0.1%和63.4±0.1%的PCS的转化。
里氏木霉纤维素酶组合物(2.7mg蛋白每克纤维素),烟曲霉GH61B野生型多肽(0.6mg蛋白每g纤维素),和烟曲霉CEL3Aβ-葡糖苷酶(0.3mg蛋白每g纤维素)的组合在50℃和55℃分别导致65.0±0.5%和64.5±0.6%的PCS的转化。里氏木霉纤维素酶组合物(2.7mg蛋白每克纤维素),烟曲霉GH61B野生型多肽(0.75mg蛋白每g纤维素),和烟曲霉CEL3Aβ-葡糖苷酶(0.3mg蛋白每g纤维素)的组合在50℃和55℃分别导致66.4±0.2%和66.1±0.4%的PCS的转化。
里氏木霉纤维素酶组合物(2.7mg蛋白每克纤维素),烟曲霉GH61B变体I75V+F77L+F179I+I181L+I183V(0.3mg蛋白每g纤维素),和烟曲霉CEL3Aβ-葡糖苷酶(0.3mg蛋白每g纤维素)的组合在50℃和55℃分别导致63.3±0.3%和62.3±0.4%的PCS的转化。里氏木霉纤维素酶组合物(2.7mg 蛋白每克纤维素),烟曲霉GH61B变体I75V+F77L+F179I+I181L+I183V(0.45mg蛋白每g纤维素),和烟曲霉CEL3Aβ-葡糖苷酶(0.3mg蛋白每g纤维素)的组合在50℃和55℃分别导致65.0±0.2%和64.5±0.2%的PCS的转化。里氏木霉纤维素酶组合物(2.7mg蛋白每克纤维素),烟曲霉GH61B变体I75V+F77L+F179I+I181L+I183V(0.6mg蛋白每g纤维素),和烟曲霉CEL3Aβ-葡糖苷酶(0.3mg蛋白每g纤维素)的组合在50℃和55℃分别导致65.7±0.2%和65.7±0.5%的PCS的转化。里氏木霉纤维素酶组合物(2.7mg蛋白每克纤维素),烟曲霉GH61B变体I75V+F77L+F179I+I181L+I183V(0.75mg蛋白每g纤维素),和烟曲霉CEL3Aβ-葡糖苷酶(0.3mg蛋白每g纤维素)的组合在50℃和55℃分别导致67.0±0.2%和66.9±0.3%的PCS的转化。
实施例16:烟曲霉GH61B变体I75V+F77L+F179I+I181L+I183V的添加对在50℃,55℃,60℃,和65℃高温纤维素酶组合物转化PCS的作用
称为“高温纤维素酶组合物”的纤维素酶的混合物通过以下述比例(对于总蛋白)混合制备的酶成分来制备:43.5%烟曲霉纤维二糖水解酶I,29.4%烟曲霉纤维二糖水解酶II,5.9%烟曲霉β-葡糖苷酶,5.9%烟曲霉GH10木聚糖酶3,3.5%里氏木霉β-木糖苷酶,和11.8%里氏木霉CEL5A内切葡聚糖酶II。在测定中以3mg总蛋白每克纤维素加载量的组合物具有下述酶加载量每克纤维素:1.31mg烟曲霉纤维二糖水解酶I每克纤维素,0.88mg烟曲霉纤维二糖水解酶II每克纤维素,0.18mg烟曲霉β-葡糖苷酶每克纤维素,0.18mg烟曲霉GH10木聚糖酶3每克纤维素,0.11mg里氏木霉β-木糖苷酶每克纤维素,和0.35mg里氏木霉CEL5A内切葡聚糖酶II每克纤维素。
对烟曲霉GH61B野生型多肽和烟曲霉GH61B变体I75V+F77L+F179I+I181L+I183V评估其在50℃,55℃,60℃,和65℃增强高温纤维素酶组合物水解PCS的能力。经预处理的玉米秸秆水解测定法如实施例14中所述进行。
高温纤维素酶组合物(3mg蛋白每g纤维素);高温纤维素酶组合物(3mg蛋白每g纤维素)和烟曲霉GH61B野生型多肽(0.45mg蛋白每g纤维素)的组合;高温纤维素酶组合物(3mg蛋白每g纤维素)和烟曲霉GH61B野生型多肽(0.75mg蛋白每g纤维素)的组合;高温纤维素酶组合物(3mg蛋白每g纤维素)和烟曲霉GH61B变体I75V+F77L+F179I+I181L+I183V(0.45mg蛋白每g纤维素)的组合;和高温纤维素酶组合物(3mg蛋白每g纤维素)和烟曲霉GH61B变体I75V+F77L+F179I+I181L+I183V(0.75mg蛋白每g纤维素)的组合对经预处理的玉米秸秆的转化如实施例14中所述测定。在50℃,55℃,60℃,和65℃温育72小时之后如实施例14中所述收集并分析数据。对于添加0.45mg GH61多肽每克纤维素和添加0.75mg GH61多肽每克纤维素的结果分别示于图3A和3B。
高温纤维素酶组合物(3mg蛋白每g纤维素)在50℃,55℃,60℃,和65℃分别导致48.5±0.3%,52.0±0.1%,43.7±0.2%,和36.4±0.1%的经预处理的玉米秸秆的转化。
高温纤维素酶组合物(3mg蛋白每g纤维素)和烟曲霉GH61B野生型多肽(0.45mg蛋白每g纤维素)的组合在50℃,55℃,60℃,或65℃分别导致60.4±0.2%,65.8±0.1%,55.8±0.1%,和45.2±0.2%的PCS的转化。高温纤维素酶组合物(3mg蛋白每g纤维素)和烟曲霉GH61B野生型多肽(0.75mg蛋白每g纤维素)的组合在50℃,55℃,60℃,和65℃分别导致61.9±0.1%,67.6±0.2%,57.8±0.3%,和45.5±0.7%的PCS的转化。
高温纤维素酶组合物(3mg蛋白每g纤维素)和烟曲霉GH61B变体I75V+F77L+F179I+I181L+I183V(0.45mg蛋白每g纤维素)的组合在50℃,55℃,60℃,和65℃分别导致51.4±0.7%,66.9±0.5%,56.8±0.4%,和46.2±0.1%的PCS的转化。
高温纤维素酶组合物(3mg蛋白每g纤维素)和烟曲霉GH61B变体I75V+F77L+F179I+I181L+I183V(0.75mg蛋白每g纤维素)的组合在50℃,55℃,60℃,和65℃分别导致62.3±0.2%,68.3±0.2%,58.8±0.4%,和46.2±1.1%的PCS的转化。
实施例17:通过差示扫描量热法确定烟曲霉野生型GH61B多肽和烟曲霉GH61B变体I75V+F77L+F179I+I181L+I183V的Td(变性温度)
烟曲霉野生型GH61B多肽和烟曲霉GH61B变体I75V+F77L+F179I+I181L+I183VGH61多肽的热稳定性通过差示扫描量热法(DSC)使用带自动取样器的VP-CapillaryDifferential Scanning Calorimeter(MicroCal Inc.,GE Health Care,Piscataway,NJ,USA)来确定。热变性温度Td(℃)取为热分析图(Cp对T)中变性峰(主要的吸热峰)顶部,所述热分析图在将酶在添加100ppm X100的50mM乙酸钠pH5.0的溶液中以恒定编程的加热速 率加热之后获得。将大约0.4ml的样品和参照溶液储藏在10℃,然后将样品加载于量热计。将样品和参照(参照:不含酶的缓冲液)溶液自动加载于DSC并在20℃热预平衡20分钟,然后以200K/hr的扫描速率从20℃至90℃进行DSC扫描。变性温度以大约+/-1℃的准确性确定。结果示于图4A和4B。
通过差示扫描量热法,烟曲霉野生型GH61B多肽在pH5具有大约68℃的Td(图5A),而烟曲霉GH61B变体I75V+F77L+F179I+I181L+I183VGH61多肽在pH5具有大约74℃的Td(图5B)。
本发明进一步通过下述编号的段落描述:
[1]一种变体,其在对应于SEQ ID NO:2的成熟多肽的位置75,77,179,181,和183的一个或多个位置包含取代,其中所述变体具有纤维素分解增强活性。
[2]段1的变体,其为具有纤维素分解增强活性的亲本多肽的变体,选自下组:(a)多肽,其与SEQ ID NO:2的成熟多肽具有至少60%序列同一性;(b)多肽,其由多核苷酸编码,所述多核苷酸在至少低严格条件下与以下杂交:(i)SEQ ID NO:1的成熟多肽编码序列,(ii)其cDNA序列,或(iii)或(i)或(ii)的全长互补链;(c)多肽,其由多核苷酸编码,所述多核苷酸与SEQ ID NO:1的成熟多肽编码序列或其cDNA序列具有至少60%序列同一性;和(d)SEQ ID NO:2的成熟多肽的片段,其具有纤维素分解增强活性。
[3]段2的变体,其中所述具有纤维素分解增强活性的亲本多肽与SEQ ID NO:2的成熟多肽具有至少60%,例如至少65%,至少70%,至少75%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性。
[4]段2的变体,其中所述具有纤维素分解增强活性的亲本多肽由多核苷酸编码,所述多核苷酸在低严格条件,中等严格条件,中等-高严格条件,高严格条件,或非常高严格条件下与以下杂交:(i)SEQ ID NO:1的成熟多肽编码序列,(ii)其cDNA序列,或(iii)(i)或(ii)的全长互补链。
[5]段2的变体,其中所述具有纤维素分解增强活性的亲本多肽由多核苷酸编码,所述多核苷酸与SEQ ID NO:1的成熟多肽编码序列或其cDNA序列具有至少60%,例如至少65%,至少70%,至少75%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,至少99%,或100%序列同一性。
段2的变体,其中所述具有纤维素分解增强活性的亲本多肽包含SEQ ID NO:2的成熟多肽或由SEQ ID NO:2的成熟多肽组成。
段2的变体,其中所述具有纤维素分解增强活性的亲本多肽是SEQ ID NO:2的成熟多肽的片段,其中所述片段具有纤维素分解增强活性。
段2的变体,其与具有纤维素分解增强活性的亲本多肽的氨基酸序列具有至少60%,例如至少65%,至少70%,至少75%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,或至少99%,但少于100%序列同一性。
段1-8任一项的变体,其与SEQ ID NO:2的成熟多肽具有至少60%,例如至少65%,至少70%,至少75%,至少80%,至少81%,至少82%,至少83%,至少84%,至少85%,至少86%,至少87%,至少88%,至少89%,至少90%,至少91%,至少92%,至少93%,至少94%,至少95%,至少96%,至少97%,至少98%,或至少99%,但少于100%序列同一性。
段1-9任一项的变体,其中所述变体组成为200至220个氨基酸,例如205至220,210至220,和215至220个氨基酸。
段1-10任一项的变体,其中取代的数量为1-5,如1,2,3,4或5个取代。
段1-11任一项的变体,其在对应于位置75的位置包含取代。
段12的变体,其中所述取代为Val。
段1-13任一项的变体,其在对应于位置77的位置包含取代。
段14的变体,其中所述取代为Leu。
段1-15任一项的变体,其在对应于位置179的位置包含取代。
段16的变体,其中所述取代为Ile。
段1-17任一项的变体,其在对应于位置181的位置包含取代。
段18的变体,其中所述取代为Leu。
[20]段1-17任一项的变体,其在对应于位置183的位置包含取代。
[21]段20的变体,其中所述取代为Val。
[22]段1-21任一项的变体,其在对应于任何位置75,77,179,181,和183的两个位置包含取代。
[23]段1-21任一项的变体,其在对应于任何位置75,77,179,181,和183的三个位置包含取代。
[24]段1-21任一项的变体,其在对应于任何位置75,77,179,181,和183的四个位置包含取代。
[25]段1-21任一项的变体,其在对应于任何位置75,77,179,181,和183的每个位置包含取代。
[26]段1-25任一项的变体,其包含或组成为一个或多个选自下组的取代:I75V,F77L,F179I,I181L,和I183V。
[27]段1-25任一项的变体,其包含或组成为SEQ ID NO:2的成熟多肽的取代I75V+F77L。
[28]段1-25任一项的变体,其包含或组成为SEQ ID NO:2的成熟多肽的取代I75V+F179I。
[29]段1-25任一项的变体,其包含或组成为SEQ ID NO:2的成熟多肽的取代I75V+I181L。
[30]段1-25任一项的变体,其包含或组成为SEQ ID NO:2的成熟多肽的取代I75V+I183V。
[31]段1-25任一项的变体,其包含或组成为SEQ ID NO:2的成熟多肽的取代F77L+F179I。
[32]段1-25任一项的变体,其包含或组成为SEQ ID NO:2的成熟多肽的取代F77L+I181L。
[33]段1-25任一项的变体,其包含或组成为SEQ ID NO:2的成熟多肽的取代F77L+I183V。
[34]段1-25任一项的变体,其包含或组成为SEQ ID NO:2的成熟多肽的取代F179I+I181L。
[35]段1-25任一项的变体,其包含或组成为SEQ ID NO:2的成熟多肽的取代F179I+I183V。
[36]段1-25任一项的变体,其包含或组成为SEQ ID NO:2的成熟多肽 的取代I181L+I183V。
[37]段1-25任一项的变体,其包含或组成为SEQ ID NO:2的成熟多肽的取代I75V+F77L+F179I。
[38]段1-25任一项的变体,其包含或组成为SEQ ID NO:2的成熟多肽的取代I75V+F77L+I181L。
[39]段1-25任一项的变体,其包含或组成为SEQ ID NO:2的成熟多肽的取代I75V+F77L+I183V。
[40]段1-25任一项的变体,其包含或组成为SEQ ID NO:2的成熟多肽的取代I75V+F179I+I181L。
[41]段1-25任一项的变体,其包含或组成为SEQ ID NO:2的成熟多肽的取代I75V+F179I+I183V。
[42]段1-25任一项的变体,其包含或组成为SEQ ID NO:2的成熟多肽的取代I75V+I181L+I183V。
[43]段1-25任一项的变体,其包含或组成为SEQ ID NO:2的成熟多肽的取代F77L+F179I+I181L。
[44]段1-25任一项的变体,其包含或组成为SEQ ID NO:2的成熟多肽的取代F77L+F179I+I183V。
[45]段1-25任一项的变体,其包含或组成为SEQ ID NO:2的成熟多肽的取代F179I+I181L+I183V。
[46]段1-25任一项的变体,其包含或组成为SEQ ID NO:2的成熟多肽的取代F77L+I181L+I183V。
[47]段1-25任一项的变体,其包含或组成为SEQ ID NO:2的成熟多肽的取代I75V+F77L+F179I+I181L。
[48]段1-25任一项的变体,其包含或组成为SEQ ID NO:2的成熟多肽的取代I75V+F179I+I181L+I183V。
[49]段1-25任一项的变体,其包含或组成为SEQ ID NO:2的成熟多肽的取代I75V+F77L+I181L+I183V。
[50]段1-25任一项的变体,其包含或组成为SEQ ID NO:2的成熟多肽的取代I75V+F77L+F179I+I183V。
[51]段1-25任一项的变体,其包含或组成为SEQ ID NO:2的成熟多肽的取代F77L+F179I+I181L+I183V。
[52]段1-25任一项的变体,其包含或组成为SEQ ID NO:2的成熟多肽的取代I75V+F77L+F179I+I181L+I183V。
[53]一种分离的多核苷酸,其编码段1-52任一项的变体。
[54]一种核酸构建体,其包含段53的多核苷酸。
[55]一种表达载体,其包含段53的多核苷酸。
[56]一种宿主细胞,其包含段53的多核苷酸。
[57]一种产生变体的方法,其包括:(a)在适于表达所述变体的条件下培养段56的宿主细胞;和(b)回收所述变体。
[58]一种转基因植物、植物部分或植物细胞,其用段53的多核苷酸转化。
[59]一种产生段1-52任一项的变体的方法,其包括:(a)在有助于产生所述变体的条件下培养包含编码所述变体的多核苷酸的转基因植物或植物细胞;和(b)回收所述变体。
[60]一种用于获得变体的方法,其包括:在亲本多肽的对应于SEQ ID NO:2的成熟多肽的位置75,77,179,181,和183的一个或多个位置处导入取代,其中所述变体具有纤维素分解增强活性;和回收所述变体。
[61]一种用于降解或转化纤维素材料的方法,其包括在段1-52任一项的变体的存在下用酶组合物处理所述纤维素材料。
[62]段61的方法,其中所述纤维素材料经预处理。
[63]段61或62的方法,其进一步包括回收经降解的纤维素材料。
[64]段61-63任一项的方法,其中所述酶组合物包含一种或多种选自下组的酶:纤维素酶、具有纤维素分解增强活性的多肽、半纤维素酶、棒曲霉素、酯酶、漆酶、木质素分解酶、果胶酶、过氧化物酶、蛋白酶和膨胀素。
[65]段64的方法,其中所述纤维素酶是一种或多种选自下组的酶:内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶。
[66]段64的方法,其中所述半纤维素酶是一种或多种选自下组的酶:木聚糖酶、乙酰木聚糖酯酶、阿魏酸酯酶、阿拉伯呋喃糖苷酶、木糖苷酶和葡糖醛酸糖苷酶。
[67]段61-66任一项的方法,其中所述经降解的纤维素材料是糖。
[68]段64的方法,其中所述糖选自下组:葡萄糖、木糖、甘露糖、半乳糖和阿拉伯糖。
[69]一种用于产生发酵产物的方法,其包括(a)在段1-52任一项的变体的 存在下用酶组合物糖化纤维素材料;(b)用一种或多种发酵微生物发酵经糖化的纤维素材料以产生发酵产物;和(c)从发酵回收所述发酵产物。
[70]段69的方法,其中所述纤维素材料经预处理。
[71]段69或70的方法,其中所述酶组合物包含一种或多种选自下组的酶:纤维素酶、具有纤维素分解增强活性的多肽、半纤维素酶、棒曲霉素、酯酶、漆酶、木质素分解酶、果胶酶、过氧化物酶、蛋白酶和膨胀素。
[72]段71的方法,其中所述纤维素酶是一种或多种选自下组的酶:内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶。
[73]段71的方法,其中所述半纤维素酶是一种或多种选自下组的酶:木聚糖酶、乙酰木聚糖酯酶、阿魏酸酯酶、阿拉伯呋喃糖苷酶、木糖苷酶和葡糖醛酸糖苷酶。
[74]段69-73任一项的方法,其中步骤(a)和(b)在同时糖化和发酵中同时进行。
[75]段69-74任一项的方法,其中所述发酵产物是醇、有机酸、酮、氨基酸或气体。
[76]一种发酵纤维素材料的方法,其包括用一种或多种发酵微生物发酵所述纤维素材料,其中所述纤维素材料是在段1-52任一项的变体存在下用酶组合物糖化的。
[77]段76的方法,其中所述纤维素材料在糖化之前经预处理。
[78]段76或77的方法,其中所述酶组合物包含一种或多种选自下组的酶:纤维素酶、具有纤维素分解增强活性的多肽、半纤维素酶、棒曲霉素、酯酶、漆酶、木质素分解酶、果胶酶、过氧化物酶、蛋白酶和膨胀素。
[79]段78的方法,其中所述纤维素酶是一种或多种选自下组的酶:内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶。
[80]段78的方法,其中所述半纤维素酶是一种或多种选自下组的酶:木聚糖酶、乙酰木聚糖酯酶、阿魏酸酯酶、阿拉伯呋喃糖苷酶、木糖苷酶和葡糖醛酸糖苷酶。
[81]段76-80任一项的方法,其中所述纤维素材料的发酵产生发酵产物。
[82]段81的方法,其进一步包括从发酵回收发酵产物。
[83]段81或82任一项的方法,其中所述发酵产物是醇、有机酸、酮、氨基酸或气体。
[84]一种去污剂组合物,其包含段1-52任一项的变体和表面活性剂。
[85]一种全培养液配制物或细胞培养组合物,其包含段1-52任一项的多肽。
本文描述和要求保护的本发明并不局限于本文公开的具体方面的范围内,因为这些方面旨在作为本发明几个方面的说明。旨在将任何等同的方面包含于本发明的范围内。实际上,从前面的说明中,除本文所显示和描述的之外,本发明的多种修改对于本领域的技术人员来说是显而易见的。这些修改也旨在落入所附的权利要求的范围内。在冲突的情况下,将以包括定义部分的本公开为准。
序列表
<110>诺维信股份有限公司(Novozymes,Inc.)
SWEENEY,MATT
WOGULIS,MARK
<120>具有纤维素分解增强活性的多肽变体及其编码多核苷酸
<130>12034-W0-PCT
<150>US 61/388,537
<151>2010-09-30
<160>92
<170>PatentIn version 3.5
<210>1
<211>862
<212>DNA
<213>烟曲霉(Aspergillus fumigatus)
<400>1
atgactttgt ccaagatcac ttccattgct ggccttctgg cctcagcgtc tctcgtggct 60
ggccacggct ttgtttctgg cattgttgct gatgggaaat agtatgtgct tgaaccacac120
aaatgacagc tgcaacagct aacttctatt ccagttacgg agggtacctt gttaaccaat180
acccctacat gagcaaccct cccgacacca ttgcctggtc caccaccgcc accgacctcg240
gctttgtgga cggcaccggc taccagtctc cggatattat ctgccacaga gacgcaaaga300
atggcaagtt gaccgcaacc gttgcagccg gttcacagat cgaattccag tggacgacgt360
ggccagagtc tcaccatgga ccggtacgac gccgaagaga agagaacata ttgtgaccag420
ataggctaac atagcatagt tgattactta cctcgctcca tgcaacggcg actgtgccac480
cgtggacaag accaccctga agtttgtcaa gatcgccgct caaggcttga tcgacggctc540
caacccacct ggtgtttggg ctgatgatga aatgatcgcc aacaacaaca cggccacagt600
gaccattcct gcctcctatg cccccggaaa ctacgtcctt cgccacgaga tcatcgccct660
tcactctgcg ggtaacctga acggcgcgca gaactacccc cagtgtttca acatccaaat720
caccggtggc ggcagtgctc agggatctgg caccgctggc acgtccctgt acaagaatac780
tgatcctggc atcaagtttg acatctactc ggatctgagc ggtggatacc ctattcctgg840
tcctgcactg ttcaacgctt aa 862
<210>2
<211>250
<212>PRT
<213>烟曲霉(Aspergillus fumigatus)
<220>
<221>信号
<222>(1)..(21)
<220>
<221>成熟肽
<222>(22)..(250)
<400>2
Met Thr Leu Ser Lys Ile Thr Ser Ile Ala Gly Leu Leu Ala Ser Ala
-20 -15 -10
Ser Leu Val Ala Gly His Gly Phe Val Ser Gly Ile Val Ala Asp Gly
-5 -1 1 5 10
Lys Tyr Tyr Gly Gly Tyr Leu Val Asn Gln Tyr Pro Tyr Met Ser Asn
15 20 25
Pro Pro Asp Thr Ile Ala Trp Ser Thr Thr Ala Thr Asp Leu Gly Phe
30 35 40
Val Asp Gly Thr Gly Tyr Gln Ser Pro Asp Ile Ile Cys His Arg Asp
45 50 55
Ala Lys Asn Gly Lys Leu Thr Ala Thr Val Ala Ala Gly Ser Gln Ile
60 65 70 75
Glu Phe Gln Trp Thr Thr Trp Pro Glu Ser His His Gly Pro Leu Ile
80 85 90
Thr Tyr Leu Ala Pro Cys Asn Gly Asp Cys Ala Thr Val Asp Lys Thr
95 100 105
Thr Leu Lys Phe Val Lys Ile Ala Ala Gln Gly Leu Ile Asp Gly Ser
110 115 120
Asn Pro Pro Gly Val Trp Ala Asp Asp Glu Met Ile Ala Asn Asn Asn
125 130 135
Thr Ala Thr Val Thr Ile Pro Ala Ser Tyr Ala Pro Gly Asn Tyr Val
140 145 150 155
Leu Arg His Glu Ile Ile Ala Leu His Ser Ala Gly Asn Leu Asn Gly
160 165 170
Ala Gln Asn Tyr Pro Gln Cys Phe Asn Ile Gln Ile Thr Gly Gly Gly
175 180 185
Ser Ala Gln Gly Ser Gly Thr Ala Gly Thr Ser Leu Tyr Lys Asn Thr
190 195 200
Asp Pro Gly Ile Lys Phe Asp Ile Tyr Ser Asp Leu Ser Gly Gly Tyr
205 210 215
Pro Ile Pro Gly Pro Ala Leu Phe Asn Ala
220 225
<210>3
<211>1377
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>3
atggcgccct cagttacact gccgttgacc acggccatcc tggccattgc ccggctcgtc 60
gccgcccagc aaccgggtac cagcaccccc gaggtccatc ccaagttgac aacctacaag120
tgtacaaagt ccggggggtg cgtggcccag gacacctcgg tggtccttga ctggaactac180
cgctggatgc acgacgcaaa ctacaactcg tgcaccgtca acggcggcgt caacaccacg240
ctctgccctg acgaggcgac ctgtggcaag aactgcttca tcgagggcgt cgactacgcc300
gcctcgggcg tcacgacctc gggcagcagc ctcaccatga accagtacat gcccagcagc360
tctggcggct acagcagcgt ctctcctcgg ctgtatctcc tggactctga cggtgagtac420
gtgatgctga agctcaacgg ccaggagctg agcttcgacg tcgacctctc tgctctgccg480
tgtggagaga acggctcgct ctacctgtct cagatggacg agaacggggg cgccaaccag540
tataacacgg ccggtgccaa ctacgggagc ggctactgcg atgctcagtg ccccgtccag600
acatggagga acggcaccct caacactagc caccagggct tctgctgcaa cgagatggat660
atcctggagg gcaactcgag ggcgaatgcc ttgacccctc actcttgcac ggccacggcc720
tgcgactctg ccggttgcgg cttcaacccc tatggcagcg gctacaaaag ctactacggc780
cccggagata ccgttgacac ctccaagacc ttcaccatca tcacccagtt caacacggac840
aacggctcgc cctcgggcaa ccttgtgagc atcacccgca agtaccagca aaacggcgtc900
gacatcccca gcgcccagcc cggcggcgac accatctcgt cctgcccgtc cgcctcagcc960
tacggcggcc tcgccaccat gggcaaggcc ctgagcagcg gcatggtgct cgtgttcagc1020
atttggaacg acaacagcca gtacatgaac tggctcgaca gcggcaacgc cggcccctgc1080
agcagcaccg agggcaaccc atccaacatc ctggccaaca accccaacac gcacgtcgtc1140
ttctccaaca tccgctgggg agacattggg tctactacga actcgactgc gcccccgccc1200
ccgcctgcgt ccagcacgac gttttcgact acacggagga gctcgacgac ttcgagcagc1260
ccgagctgca cgcagactca ctgggggcag tgcggtggca ttgggtacag cgggtgcaag1320
acgtgcacgt cgggcactac gtgccagtat agcaacgact actactcgca atgcctt 1377
<210>4
<211>459
<212>PRT
<213>里氏木霉(Trichoderma reesei)
<400>4
Met Ala Pro Ser Val Thr Leu Pro Leu Thr Thr Ala Ile Leu Ala Ile
1 5 10 15
Ala Arg Leu Val Ala Ala Gln Gln Pro Gly Thr Ser Thr Pro Glu Val
20 25 30
His Pro Lys Leu Thr Thr Tyr Lys Cys Thr Lys Ser Gly Gly Cys Val
35 40 45
Ala Gln Asp Thr Ser Val Val Leu Asp Trp Asn Tyr Arg Trp Met His
50 55 60
Asp Ala Asn Tyr Asn Ser Cys Thr Val Asn Gly Gly Val Asn Thr Thr
65 70 75 80
Leu Cys Pro Asp Glu Ala Thr Cys Gly Lys Asn Cys Phe Ile Glu Gly
85 90 95
Val Asp Tyr Ala Ala Ser Gly Val Thr Thr Ser Gly Ser Ser Leu Thr
100 105 110
Met Asn Gln Tyr Met Pro Ser Ser Ser Gly Gly Tyr Ser Ser Val Ser
115 120 125
Pro Arg Leu Tyr Leu Leu Asp Ser Asp Gly Glu Tyr Val Met Leu Lys
130 135 140
Leu Asn Gly Gln Glu Leu Ser Phe Asp Val Asp Leu Ser Ala Leu Pro
145 150 155 160
Cys Gly Glu Asn Gly Ser Leu Tyr Leu Ser Gln Met Asp Glu Asn Gly
165 170 175
Gly Ala Asn Gln Tyr Asn Thr Ala Gly Ala Asn Tyr Gly Ser Gly Tyr
180 185 190
Cys Asp Ala Gln Cys Pro Val Gln Thr Trp Arg Asn Gly Thr Leu Asn
195 200 205
Thr Ser His Gln Gly Phe Cys Cys Asn Glu Met Asp Ile Leu Glu Gly
210 215 220
Asn Ser Arg Ala Asn Ala Leu Thr Pro His Ser Cys Thr Ala Thr Ala
225 230 235 240
Cys Asp Ser Ala Gly Cys Gly Phe Asn Pro Tyr Gly Ser Gly Tyr Lys
245 250 255
Ser Tyr Tyr Gly Pro Gly Asp Thr Val Asp Thr Ser Lys Thr Phe Thr
260 265 270
Ile Ile Thr Gln Phe Asn Thr Asp Asn Gly Ser Pro Ser Gly Asn Leu
275 280 285
Val Ser Ile Thr Arg Lys Tyr Gln Gln Asn Gly Val Asp Ile Pro Ser
290 295 300
Ala Gln Pro Gly Gly Asp Thr Ile Ser Ser Cys Pro Ser Ala Ser Ala
305 310 315 320
Tyr Gly Gly Leu Ala Thr Met Gly Lys Ala Leu Ser Ser Gly Met Val
325 330 335
Leu Val Phe Ser Ile Trp Asn Asp Asn Ser Gln Tyr Met Asn Trp Leu
340 345 350
Asp Ser Gly Asn Ala Gly Pro Cys Ser Ser Thr Glu Gly Asn Pro Ser
355 360 365
Asn Ile Leu Ala Asn Asn Pro Asn Thr His Val Val Phe Ser Asn Ile
370 375 380
Arg Trp Gly Asp Ile Gly Ser Thr Thr Asn Ser Thr Ala Pro Pro Pro
385 390 395 400
Pro Pro Ala Ser Ser Thr Thr Phe Ser Thr Thr Arg Arg Ser Ser Thr
405 410 415
Thr Ser Ser Ser Pro Ser Cys Thr Gln Thr His Trp Gly Gln Cys Gly
420 425 430
Gly Ile Gly Tyr Ser Gly Cys Lys Thr Cys Thr Ser Gly Thr Thr Cys
435 440 445
Gln Tyr Ser Asn Asp Tyr Tyr Ser Gln Cys Leu
450 455
<210>5
<211>1254
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>5
atgaacaagt ccgtggctcc attgctgctt gcagcgtcca tactatatgg cggcgccgtc 60
gcacagcaga ctgtctgggg ccagtgtgga ggtattggtt ggagcggacc tacgaattgt120
gctcctggct cagcttgttc gaccctcaat ccttattatg cgcaatgtat tccgggagcc180
actactatca ccacttcgac ccggccacca tccggtccaa ccaccaccac cagggctacc240
tcaacaagct catcaactcc acccacgagc tctggggtcc gatttgccgg cgttaacatc300
gcgggttttg actttggctg taccacagat ggcacttgcg ttacctcgaa ggtttatcct360
ccgttgaaga acttcaccgg ctcaaacaac taccccgatg gcatcggcca gatgcagcac420
ttcgtcaacg aggacgggat gactattttc cgcttacctg tcggatggca gtacctcgtc480
aacaacaatt tgggcggcaa tcttgattcc acgagcattt ccaagtatga tcagcttgtt540
caggggtgcc tgtctctggg cgcatactgc atcgtcgaca tccacaatta tgctcgatgg600
aacggtggga tcattggtca gggcggccct actaatgctc aattcacgag cctttggtcg660
cagttggcat caaagtacgc atctcagtcg agggtgtggt tcggcatcat gaatgagccc720
cacgacgtga acatcaacac ctgggctgcc acggtccaag aggttgtaac cgcaatccgc780
aacgctggtg ctacgtcgca attcatctct ttgcctggaa atgattggca atctgctggg840
gctttcatat ccgatggcag tgcagccgcc ctgtctcaag tcacgaaccc ggatgggtca900
acaacgaatc tgatttttga cgtgcacaaa tacttggact cagacaactc cggtactcac960
gccgaatgta ctacaaataa cattgacggc gccttttctc cgcttgccac ttggctccga1020
cagaacaatc gccaggctat cctgacagaa accggtggtg gcaacgttca gtcctgcata1080
caagacatgt gccagcaaat ccaatatctc aaccagaact cagatgtcta tcttggctat1140
gttggttggg gtgccggatc atttgatagc acgtatgtcc tgacggaaac accgactagc1200
agtggtaact catggacgga cacatccttg gtcagctcgt gtctcgcaag aaag 1254
<210>6
<211>418
<212>PRT
<213>里氏木霉(Trichoderma reesei)
<400>6
Met Asn Lys Ser Val Ala Pro Leu Leu Leu Ala Ala Ser Ile Leu Tyr
1 5 10 15
Gly Gly Ala Val Ala Gln Gln Thr Val Trp Gly Gln Cys Gly Gly Ile
20 25 30
Gly Trp Ser Gly Pro Thr Asn Cys Ala Pro Gly Ser Ala Cys Ser Thr
35 40 45
Leu Asn Pro Tyr Tyr Ala Gln Cys Ile Pro Gly Ala Thr Thr Ile Thr
50 55 60
Thr Ser Thr Arg Pro Pro Ser Gly Pro Thr Thr Thr Thr Arg Ala Thr
65 70 75 80
Ser Thr Ser Ser Ser Thr Pro Pro Thr Ser Ser Gly Val Arg Phe Ala
85 90 95
Gly Val Asn Ile Ala Gly Phe Asp Phe Gly Cys Thr Thr Asp Gly Thr
100 105 110
Cys Val Thr Ser Lys Val Tyr Pro Pro Leu Lys Asn Phe Thr Gly Ser
115 120 125
Asn Asn Tyr Pro Asp Gly Ile Gly Gln Met Gln His Phe Val Asn Glu
130 135 140
Asp Gly Met Thr Ile Phe Arg Leu Pro Val Gly Trp Gln Tyr Leu Val
145 150 155 160
Asn Asn Asn Leu Gly Gly Asn Leu Asp Ser Thr Ser Ile Ser Lys Tyr
165 170 175
Asp Gln Leu Val Gln Gly Cys Leu Ser Leu Gly Ala Tyr Cys Ile Val
180 185 190
Asp Ile His Asn Tyr Ala Arg Trp Asn Gly Gly Ile Ile Gly Gln Gly
195 200 205
Gly Pro Thr Asn Ala Gln Phe Thr Ser Leu Trp Ser Gln Leu Ala Ser
210 215 220
Lys Tyr Ala Ser Gln Ser Arg Val Trp Phe Gly Ile Met Asn Glu Pro
225 230 235 240
His Asp Val Asn Ile Asn Thr Trp Ala Ala Thr Val Gln Glu Val Val
245 250 255
Thr Ala Ile Arg Asn Ala Gly Ala Thr Ser Gln Phe Ile Ser Leu Pro
260 265 270
Gly Asn Asp Trp Gln Ser Ala Gly Ala Phe Ile Ser Asp Gly Ser Ala
275 280 285
Ala Ala Leu Ser Gln Val Thr Asn Pro Asp Gly Ser Thr Thr Asn Leu
290 295 300
Ile Phe Asp Val His Lys Tyr Leu Asp Ser Asp Asn Ser Gly Thr His
305 310 315 320
Ala Glu Cys Thr Thr Asn Asn Ile Asp Gly Ala Phe Ser Pro Leu Ala
325 330 335
Thr Trp Leu Arg Gln Asn Asn Arg Gln Ala Ile Leu Thr Glu Thr Gly
340 345 350
Gly Gly Asn Val Gln Ser Cys Ile Gln Asp Met Cys Gln Gln Ile Gln
355 360 365
Tyr Leu Asn Gln Asn Ser Asp Val Tyr Leu Gly Tyr Val Gly Trp Gly
370 375 380
Ala Gly Ser Phe Asp Ser Thr Tyr Val Leu Thr Glu Thr Pro Thr Ser
385 390 395 400
Ser Gly Asn Ser Trp Thr Asp Thr Ser Leu Val Ser Ser Cys Leu Ala
405 410 415
Arg Lys
<210>7
<211>702
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>7
atgaagttcc ttcaagtcct ccctgccctc ataccggccg ccctggccca aaccagctgt 60
gaccagtggg caaccttcac tggcaacggc tacacagtca gcaacaacct ttggggagca120
tcagccggct ctggatttgg ctgcgtgacg gcggtatcgc tcagcggcgg ggcctcctgg180
cacgcagact ggcagtggtc cggcggccag aacaacgtca agtcgtacca gaactctcag240
attgccattc cccagaagag gaccgtcaac agcatcagca gcatgcccac cactgccagc300
tggagctaca gcgggagcaa catccgcgct aatgttgcgt atgacttgtt caccgcagcc360
aacccgaatc atgtcacgta ctcgggagac tacgaactca tgatctggct tggcaaatac420
ggcgatattg ggccgattgg gtcctcacag ggaacagtca acgtcggtgg ccagagctgg480
acgctctact atggctacaa cggagccatg caagtctatt cctttgtggc ccagaccaac540
actaccaact acagcggaga tgtcaagaac ttcttcaatt atctccgaga caataaagga600
tacaacgctg caggccaata tgttcttagc taccaatttg gtaccgagcc cttcacgggc660
agtggaactc tgaacgtcgc atcctggacc gcatctatca ac 702
<210>8
<211>234
<212>PRT
<213>里氏木霉(Trichoderma reesei)
<400>8
Met Lys Phe Leu Gln Val Leu Pro Ala Leu Ile Pro Ala Ala Leu Ala
1 5 10 15
Gln Thr Ser Cys Asp Gln Trp Ala Thr Phe Thr Gly Asn Gly Tyr Thr
20 25 30
Val Ser Asn Asn Leu Trp Gly Ala Ser Ala Gly Ser Gly Phe Gly Cys
35 40 45
Val Thr Ala Val Ser Leu Ser Gly Gly Ala Ser Trp His Ala Asp Trp
50 55 60
Gln Trp Ser Gly Gly Gln Asn Asn Val Lys Ser Tyr Gln Asn Ser Gln
65 70 75 80
Ile Ala Ile Pro Gln Lys Arg Thr Val Asn Ser Ile Ser Ser Met Pro
85 90 95
Thr Thr Ala Ser Trp Ser Tyr Ser Gly Ser Asn Ile Arg Ala Asn Val
100 105 110
Ala Tyr Asp Leu Phe Thr Ala Ala Asn Pro Asn His Val Thr Tyr Ser
115 120 125
Gly Asp Tyr Glu Leu Met Ile Trp Leu Gly Lys Tyr Gly Asp Ile Gly
130 135 140
Pro Ile Gly Ser Ser Gln Gly Thr Val Asn Val Gly Gly Gln Ser Trp
145 150 155 160
Thr Leu Tyr Tyr Gly Tyr Asn Gly Ala Met Gln Val Tyr Ser Phe Val
165 170 175
Ala Gln Thr Asn Thr Thr Asn Tyr Ser Gly Asp Val Lys Asn Phe Phe
180 185 190
Asn Tyr Leu Arg Asp Asn Lys Gly Tyr Asn Ala Ala Gly Gln Tyr Val
195 200 205
Leu Ser Tyr Gln Phe Gly Thr Glu Pro Phe Thr Gly Ser Gly Thr Leu
210 215 220
Asn Val Ala Ser Trp Thr Ala Ser Ile Asn
225 230
<210>9
<211>726
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>9
atgaaggcaa ctctggttct cggctccctc attgtaggcg ccgtttccgc gtacaaggcc 60
accaccacgc gctactacga tgggcaggag ggtgcttgcg gatgcggctc gagctccggc120
gcattcccgt ggcagctcgg catcggcaac ggagtctaca cggctgccgg ctcccaggct180
ctcttcgaca cggccggagc ttcatggtgc ggcgccggct gcggtaaatg ctaccagctc240
acctcgacgg gccaggcgcc ctgctccagc tgcggcacgg gcggtgctgc tggccagagc300
atcatcgtca tggtgaccaa cctgtgcccg aacaatggga acgcgcagtg gtgcccggtg360
gtcggcggca ccaaccaata cggctacagc taccatttcg acatcatggc gcagaacgag420
atctttggag acaatgtcgt cgtcgacttt gagcccattg cttgccccgg gcaggctgcc480
tctgactggg ggacgtgcct ctgcgtggga cagcaagaga cggatcccac gcccgtcctc540
ggcaacgaca cgggctcaac tcctcccggg agctcgccgc cagcgacatc gtcgagtccg600
ccgtctggcg gcggccagca gacgctctat ggccagtgtg gaggtgccgg ctggacggga660
cctacgacgt gccaggcccc agggacctgc aaggttcaga accagtggta ctcccagtgt720
cttcct 726
<210>10
<211>242
<212>PRT
<213>里氏木霉(Trichoderma reesei)
<400>10
Met Lys Ala Thr Leu Val Leu Gly Ser Leu Ile Val Gly Ala Val Ser
1 5 10 15
Ala Tyr Lys Ala Thr Thr Thr Arg Tyr Tyr Asp Gly Gln Glu Gly Ala
20 25 30
Cys Gly Cys Gly Ser Ser Ser Gly Ala Phe Pro Trp Gln Leu Gly Ile
35 40 45
Gly Asn Gly Val Tyr Thr Ala Ala Gly Ser Gln Ala Leu Phe Asp Thr
50 55 60
Ala Gly Ala Ser Trp Cys Gly Ala Gly Cys Gly Lys Cys Tyr Gln Leu
65 70 75 80
Thr Ser Thr Gly Gln Ala Pro Cys Ser Ser Cys Gly Thr Gly Gly Ala
85 90 95
Ala Gly Gln Ser Ile Ile Val Met Val Thr Asn Leu Cys Pro Asn Asn
100 105 110
Gly Asn Ala Gln Trp Cys Pro Val Val Gly Gly Thr Asn Gln Tyr Gly
115 120 125
Tyr Ser Tyr His Phe Asp Ile Met Ala Gln Asn Glu Ile Phe Gly Asp
130 135 140
Asn Val Val Val Asp Phe Glu Pro Ile Ala Cys Pro Gly Gln Ala Ala
145 150 155 160
Ser Asp Trp Gly Thr Cys Leu Cys Val Gly Gln Gln Glu Thr Asp Pro
165 170 175
Thr Pro Val Leu Gly Asn Asp Thr Gly Ser Thr Pro Pro Gly Ser Ser
180 185 190
Pro Pro Ala Thr Ser Ser Ser Pro Pro Ser Gly Gly Gly Gln Gln Thr
195 200 205
Leu Tyr Gly Gln Cys Gly Gly Ala Gly Trp Thr Gly Pro Thr Thr Cys
210 215 220
Gln Ala Pro Gly Thr Cys Lys Val Gln Asn Gln Trp Tyr Ser Gln Cys
225 230 235 240
Leu Pro
<210>11
<211>923
<212>DNA
<213>特异腐质霉(Humicola insolens)
<400>11
atgcgttcct cccccctcct ccgctccgcc gttgtggccg ccctgccggt gttggccctt 60
gccgctgatg gcaggtccac ccgctactgg gactgctgca agccttcgtg cggctgggcc120
aagaaggctc ccgtgaacca gcctgtcttt tcctgcaacg ccaacttcca gcgtatcacg180
gacttcgacg ccaagtccgg ctgcgagccg ggcggtgtcg cctactcgtg cgccgaccag240
accccatggg ctgtgaacga cgacttcgcg ctcggttttg ctgccacctc tattgccggc300
agcaatgagg cgggctggtg ctgcgcctgc tacgagctca ccttcacatc cggtcctgtt360
gctggcaaga agatggtcgt ccagtccacc agcactggcg gtgatcttgg cagcaaccac420
ttcgatctca acatccccgg cggcggcgtc ggcatcttcg acggatgcac tccccagttc480
ggcggtctgc ccggccagcg ctacggcggc atctcgtccc gcaacgagtg cgatcggttc540
cccgacgccc tcaagcccgg ctgctactgg cgcttcgact ggttcaagaa cgccgacaat600
ccgagcttca gcttccgtca ggtccagtgc ccagccgagc tcgtcgctcg caccggatgc660
cgccgcaacg acgacggcaa cttccctgcc gtccagatcc cctccagcag caccagctct720
ccggtcaacc agcctaccag caccagcacc acgtccacct ccaccacctc gagcccgcca780
gtccagccta cgactcccag cggctgcact gctgagaggt gggctcagtg cggcggcaat840
ggctggagcg gctgcaccac ctgcgtcgct ggcagcactt gcacgaagat taatgactgg900
taccatcagt gcctgtagaa ttc 923
<210>12
<211>305
<212>PRT
<213>特异腐质霉(Humicola insolens)
<400>12
Met Arg Ser Ser Pro Leu Leu Arg Ser Ala Val Val Ala Ala Leu Pro
1 5 10 15
Val Leu Ala Leu Ala Ala Asp Gly Arg Ser Thr Arg Tyr Trp Asp Cys
20 25 30
Cys Lys Pro Ser Cys Gly Trp Ala Lys Lys Ala Pro Val Asn Gln Pro
35 40 45
Val Phe Ser Cys Asn Ala Asn Phe Gln Arg Ile Thr Asp Phe Asp Ala
50 55 60
Lys Ser Gly Cys Glu Pro Gly Gly Val Ala Tyr Ser Cys Ala Asp Gln
65 70 75 80
Thr Pro Trp Ala Val Asn Asp Asp Phe Ala Leu Gly Phe Ala Ala Thr
85 90 95
Ser Ile Ala Gly Ser Asn Glu Ala Gly Trp Cys Cys Ala Cys Tyr Glu
100 105 110
Leu Thr Phe Thr Ser Gly Pro Val Ala Gly Lys Lys Met Val Val Gln
115 120 125
Ser Thr Ser Thr Gly Gly Asp Leu Gly Ser Asn His Phe Asp Leu Asn
130 135 140
Ile Pro Gly Gly Gly Val Gly Ile Phe Asp Gly Cys Thr Pro Gln Phe
145 150 155 160
Gly Gly Leu Pro Gly Gln Arg Tyr Gly Gly Ile Ser Ser Arg Asn Glu
165 170 175
Cys Asp Arg Phe Pro Asp Ala Leu Lys Pro Gly Cys Tyr Trp Arg Phe
180 185 190
Asp Trp Phe Lys Asn Ala Asp Asn Pro Ser Phe Ser Phe Arg Gln Val
195 200 205
Gln Cys Pro Ala Glu Leu Val Ala Arg Thr Gly Cys Arg Arg Asn Asp
210 215 220
Asp Gly Asn Phe Pro Ala Val Gln Ile Pro Ser Ser Ser Thr Ser Ser
225 230 235 240
Pro Val Asn Gln Pro Thr Ser Thr Ser Thr Thr Ser Thr Ser Thr Thr
245 250 255
Ser Ser Pro Pro Val Gln Pro Thr Thr Pro Ser Gly Cys Thr Ala Glu
260 265 270
Arg Trp Ala Gln Cys Gly Gly Asn Gly Trp Ser Gly Cys Thr Thr Cys
275 280 285
Val Ala Gly Ser Thr Cys Thr Lys Ile Asn Asp Trp Tyr His Gln Cys
290 295 300
Leu
305
<210>13
<211>1188
<212>DNA
<213>嗜热毁丝霉(Myceliophthora thermophila)
<400>13
cgacttgaaa cgccccaaat gaagtcctcc atcctcgcca gcgtcttcgc cacgggcgcc 60
gtggctcaaa gtggtccgtg gcagcaatgt ggtggcatcg gatggcaagg atcgaccgac120
tgtgtgtcgg gctaccactg cgtctaccag aacgattggt acagccagtg cgtgcctggc180
gcggcgtcga caacgctgca gacatcgacc acgtccaggc ccaccgccac cagcaccgcc240
cctccgtcgt ccaccacctc gcctagcaag ggcaagctga agtggctcgg cagcaacgag300
tcgggcgccg agttcgggga gggcaattac cccggcctct ggggcaagca cttcatcttc360
ccgtcgactt cggcgattca gacgctcatc aatgatggat acaacatctt ccggatcgac420
ttctcgatgg agcgtctggt gcccaaccag ttgacgtcgt ccttcgacca gggttacctc480
cgcaacctga ccgaggtggt caacttcgtg acgaacgcgg gcaagtacgc cgtcctggac540
ccgcacaact acggccggta ctacggcaac atcatcacgg acacgaacgc gttccggacc600
ttctggacca acctggccaa gcagttcgcc tccaactcgc tcgtcatctt cgacaccaac660
aacgagtaca acacgatgga ccagaccctg gtgctcaacc tcaaccaggc cgccatcgac720
ggcatccggg ccgccggcgc gacctcgcag tacatcttcg tcgagggcaa cgcgtggagc780
ggggcctgga gctggaacac gaccaacacc aacatggccg ccctgacgga cccgcagaac840
aagatcgtgt acgagatgca ccagtacctc gactcggaca gctcgggcac ccacgccgag900
tgcgtcagca gcaccatcgg cgcccagcgc gtcgtcggag ccacccagtg gctccgcgcc960
aacggcaagc tcggcgtcct cggcgagttc gccggcggcg ccaacgccgt ctgccagcag1020
gccgtcaccg gcctcctcga ccacctccag gacaacagcg acgtctggct gggtgccctc1080
tggtgggccg ccggtccctg gtggggcgac tacatgtact cgttcgagcc tccttcgggc1140
accggctatg tcaactacaa ctcgatcttg aagaagtact tgccgtaa 1188
<210>14
<211>389
<212>PRT
<213>嗜热毁丝霉(Myceliophthora thermophila)
<400>14
Met Lys Ser Ser Ile Leu Ala Ser Val Phe Ala Thr Gly Ala Val Ala
1 5 10 15
Gln Ser Gly Pro Trp Gln Gln Cys Gly Gly Ile Gly Trp Gln Gly Ser
20 25 30
Thr Asp Cys Val Ser Gly Tyr His Cys Val Tyr Gln Asn Asp Trp Tyr
35 40 45
Ser Gln Cys Val Pro Gly Ala Ala Ser Thr Thr Leu Gln Thr Ser Thr
50 55 60
Thr Ser Arg Pro Thr Ala Thr Ser Thr Ala Pro Pro Ser Ser Thr Thr
65 70 75 80
Ser Pro Ser Lys Gly Lys Leu Lys Trp Leu Gly Ser Asn Glu Ser Gly
85 90 95
Ala Glu Phe Gly Glu Gly Asn Tyr Pro Gly Leu Trp Gly Lys His Phe
100 105 110
Ile Phe Pro Ser Thr Ser Ala Ile Gln Thr Leu Ile Asn Asp Gly Tyr
115 120 125
Asn Ile Phe Arg Ile Asp Phe Ser Met Glu Arg Leu Val Pro Asn Gln
130 135 140
Leu Thr Ser Ser Phe Asp Gln Gly Tyr Leu Arg Asn Leu Thr Glu Val
145 150 155 160
Val Asn Phe Val Thr Asn Ala Gly Lys Tyr Ala Val Leu Asp Pro His
165 170 175
Asn Tyr Gly Arg Tyr Tyr Gly Asn Ile Ile Thr Asp Thr Asn Ala Phe
180 185 190
Arg Thr Phe Trp Thr Asn Leu Ala Lys Gln Phe Ala Ser Asn Ser Leu
195 200 205
Val Ile Phe Asp Thr Asn Asn Glu Tyr Asn Thr Met Asp Gln Thr Leu
210 215 220
Val Leu Asn Leu Asn Gln Ala Ala Ile Asp Gly Ile Arg Ala Ala Gly
225 230 235 240
Ala Thr Ser Gln Tyr Ile Phe Val Glu Gly Asn Ala Trp Ser Gly Ala
245 250 255
Trp Ser Trp Asn Thr Thr Asn Thr Asn Met Ala Ala Leu Thr Asp Pro
260 265 270
Gln Asn Lys Ile Val Tyr Glu Met His Gln Tyr Leu Asp Ser Asp Ser
275 280 285
Ser Gly Thr His Ala Glu Cys Val Ser Ser Thr Ile Gly Ala Gln Arg
290 295 300
Val Val Gly Ala Thr Gln Trp Leu Arg Ala Asn Gly Lys Leu Gly Val
305 310 315 320
Leu Gly Glu Phe Ala Gly Gly Ala Asn Ala Val Cys Gln Gln Ala Val
325 330 335
Thr Gly Leu Leu Asp His Leu Gln Asp Asn Ser Asp Val Trp Leu Gly
340 345 350
Ala Leu Trp Trp Ala Ala Gly Pro Trp Trp Gly Asp Tyr Met Tyr Ser
355 360 365
Phe Glu Pro Pro Ser Gly Thr Gly Tyr Val Asn Tyr Asn Ser Ile Leu
370 375 380
Lys Lys Tyr Leu Pro
385
<210>15
<211>1232
<212>DNA
<213>担子菌纲(Basidiomycete)CBS 495.95
<400>15
ggatccactt agtaacggcc gccagtgtgc tggaaagcat gaagtctctc ttcctgtcac 60
ttgtagcgac cgtcgcgctc agctcgccag tattctctgt cgcagtctgg gggcaatgcg120
gcggcattgg cttcagcgga agcaccgtct gtgatgcagg cgccggctgt gtgaagctca180
acgactatta ctctcaatgc caacccggcg ctcccactgc tacatccgcg gcgccaagta240
gcaacgcacc gtccggcact tcgacggcct cggccccctc ctccagcctt tgctctggca300
gccgcacgcc gttccagttc ttcggtgtca acgaatccgg cgcggagttc ggcaacctga360
acatccccgg tgttctgggc accgactaca cctggccgtc gccatccagc attgacttct420
tcatgggcaa gggaatgaat accttccgta ttccgttcct catggagcgt cttgtccccc480
ctgccactgg catcacagga cctctcgacc agacgtactt gggcggcctg cagacgattg540
tcaactacat caccggcaaa ggcggctttg ctctcattga cccgcacaac tttatgatct600
acaatggcca gacgatctcc agtaccagcg acttccagaa gttctggcag aacctcgcag660
gagtgtttaa atcgaacagt cacgtcatct tcgatgttat gaacgagcct cacgatattc720
ccgcccagac cgtgttccaa ctgaaccaag ccgctgtcaa tggcatccgt gcgagcggtg780
cgacgtcgca gctcattctg gtcgagggca caagctggac tggagcctgg acctggacga840
cctctggcaa cagcgatgca ttcggtgcca ttaaggatcc caacaacaac gtcgcgatcc900
agatgcatca gtacctggat agcgatggct ctggcacttc gcagacctgc gtgtctccca960
ccatcggtgc cgagcggttg caggctgcga ctcaatggtt gaagcagaac aacctcaagg1020
gcttcctggg cgagatcggc gccggctcta actccgcttg catcagcgct gtgcagggtg1080
cgttgtgttc gatgcagcaa tctggtgtgt ggctcggcgc tctctggtgg gctgcgggcc1140
cgtggtgggg cgactactac cagtccatcg agccgccctc tggcccggcg gtgtccgcga1200
tcctcccgca ggccctgctg ccgttcgcgt aa 1232
<210>16
<211>397
<212>PRT
<213>担子菌纲(Basidiomycete)CBS 495.95
<400>16
Met Lys Ser Leu Phe Leu Ser Leu Val Ala Thr Val Ala Leu Ser Ser
1 5 10 15
Pro Val Phe Ser Val Ala Val Trp Gly Gln Cys Gly Gly Ile Gly Phe
20 25 30
Ser Gly Ser Thr Val Cys Asp Ala Gly Ala Gly Cys Val Lys Leu Asn
35 40 45
Asp Tyr Tyr Ser Gln Cys Gln Pro Gly Ala Pro Thr Ala Thr Ser Ala
50 55 60
Ala Pro Ser Ser Asn Ala Pro Ser Gly Thr Ser Thr Ala Ser Ala Pro
65 70 75 80
Ser Ser Ser Leu Cys Ser Gly Ser Arg Thr Pro Phe Gln Phe Phe Gly
85 90 95
Val Asn Glu Ser Gly Ala Glu Phe Gly Asn Leu Asn Ile Pro Gly Val
100 105 110
Leu Gly Thr Asp Tyr Thr Trp Pro Ser Pro Ser Ser Ile Asp Phe Phe
115 120 125
Met Gly Lys Gly Met Asn Thr Phe Arg Ile Pro Phe Leu Met Glu Arg
130 135 140
Leu Val Pro Pro Ala Thr Gly Ile Thr Gly Pro Leu Asp Gln Thr Tyr
145 150 155 160
Leu Gly Gly Leu Gln Thr Ile Val Asn Tyr Ile Thr Gly Lys Gly Gly
165 170 175
Phe Ala Leu Ile Asp Pro His Asn Phe Met Ile Tyr Asn Gly Gln Thr
180 185 190
Ile Ser Ser Thr Ser Asp Phe Gln Lys Phe Trp Gln Asn Leu Ala Gly
195 200 205
Val Phe Lys Ser Asn Ser His Val Ile Phe Asp Val Met Asn Glu Pro
210 215 220
His Asp Ile Pro Ala Gln Thr Val Phe Gln Leu Asn Gln Ala Ala Val
225 230 235 240
Asn Gly Ile Arg Ala Ser Gly Ala Thr Ser Gln Leu Ile Leu Val Glu
245 250 255
Gly Thr Ser Trp Thr Gly Ala Trp Thr Trp Thr Thr Ser Gly Asn Ser
260 265 270
Asp Ala Phe Gly Ala Ile Lys Asp Pro Asn Asn Asn Val Ala Ile Gln
275 280 285
Met His Gln Tyr Leu Asp Ser Asp Gly Ser Gly Thr Ser Gln Thr Cys
290 295 300
Val Ser Pro Thr Ile Gly Ala Glu Arg Leu Gln Ala Ala Thr Gln Trp
305 310 315 320
Leu Lys Gln Asn Asn Leu Lys Gly Phe Leu Gly Glu Ile Gly Ala Gly
325 330 335
Ser Asn Ser Ala Cys Ile Ser Ala Val Gln Gly Ala Leu Cys Ser Met
340 345 350
Gln Gln Ser Gly Val Trp Leu Gly Ala Leu Trp Trp Ala Ala Gly Pro
355 360 365
Trp Trp Gly Asp Tyr Tyr Gln Ser Ile Glu Pro Pro Ser Gly Pro Ala
370 375 380
Val Ser Ala Ile Leu Pro Gln Ala Leu Leu Pro Phe Ala
385 390 395
<210>17
<211>1303
<212>DNA
<213>担子菌纲(Basidiomycete)CBS 495.95
<400>17
ggaaagcgtc agtatggtga aatttgcgct tgtggcaact gtcggcgcaa tcttgagcgc 60
ttctgcggcc aatgcggctt ctatctacca gcaatgtgga ggcattggat ggtctgggtc120
cactgtttgc gacgccggtc tcgcttgcgt tatcctcaat gcgtactact ttcagtgctt180
gacgcccgcc gcgggccaga caacgacggg ctcgggcgca ccggcgtcaa catcaacctc240
tcactcaacg gtcactacgg ggagctcaca ctcaacaacc gggacgacgg cgacgaaaac300
aactaccact ccgtcgacca ccacgaccct acccgccatc tctgtgtctg gtcgcgtctg360
ctctggctcc aggacgaagt tcaagttctt cggtgtgaat gaaagcggcg ccgaattcgg420
gaacactgct tggccagggc agctcgggaa agactataca tggccttcgc ctagcagcgt480
ggactacttc atgggggctg gattcaatac attccgtatc accttcttga tggagcgtat540
gagccctccg gctaccggac tcactggccc attcaaccag acgtacctgt cgggcctcac600
caccattgtc gactacatca cgaacaaagg aggatacgct cttattgacc cccacaactt660
catgcgttac aacaacggca taatcagcag cacatctgac ttcgcgactt ggtggagcaa720
tttggccact gtattcaaat ccacgaagaa cgccatcttc gacatccaga acgagccgta780
cggaatcgat gcgcagaccg tatacgaact gaatcaagct gccatcaatt cgatccgcgc840
cgctggcgct acgtcacagt tgattctggt tgaaggaacg tcatacactg gagcttggac900
gtgggtctcg tccggaaacg gagctgcttt cgcggccgtt acggatcctt acaacaacac960
ggcaattgaa atgcaccaat acctcgacag cgacggttct gggacaaacg aagactgtgt1020
ctcctccacc attgggtcgc aacgtctcca agctgccact gcgtggctgc aacaaacagg1080
actcaaggga ttcctcggag agacgggtgc tgggtcgaat tcccagtgca tcgacgccgt1140
gttcgatgaa ctttgctata tgcaacagca aggcggctcc tggatcggtg cactctggtg1200
ggctgcgggt ccctggtggg gcacgtacat ttactcgatt gaacctccga gcggtgccgc1260
tatcccagaa gtccttcctc agggtctcgc tccattcctc tag 1303
<210>18
<211>429
<212>PRT
<213>担子菌纲(Basidiomycete)CBS 495.95
<400>18
Met Val Lys Phe Ala Leu Val Ala Thr Val Gly Ala Ile Leu Ser Ala
1 5 10 15
Ser Ala Ala Asn Ala Ala Ser Ile Tyr Gln Gln Cys Gly Gly Ile Gly
20 25 30
Trp Ser Gly Ser Thr Val Cys Asp Ala Gly Leu Ala Cys Val Ile Leu
35 40 45
Asn Ala Tyr Tyr Phe Gln Cys Leu Thr Pro Ala Ala Gly Gln Thr Thr
50 55 60
Thr Gly Ser Gly Ala Pro Ala Ser Thr Ser Thr Ser His Ser Thr Val
65 70 75 80
Thr Thr Gly Ser Ser His Ser Thr Thr Gly Thr Thr Ala Thr Lys Thr
85 90 95
Thr Thr Thr Pro Ser Thr Thr Thr Thr Leu Pro Ala Ile Ser Val Ser
100 105 110
Gly Arg Val Cys Ser Gly Ser Arg Thr Lys Phe Lys Phe Phe Gly Val
115 120 125
Asn Glu Ser Gly Ala Glu Phe Gly Asn Thr Ala Trp Pro Gly Gln Leu
130 135 140
Gly Lys Asp Tyr Thr Trp Pro Ser Pro Ser Ser Val Asp Tyr Phe Met
145 150 155 160
Gly Ala Gly Phe Asn Thr Phe Arg Ile Thr Phe Leu Met Glu Arg Met
165 170 175
Ser Pro Pro Ala Thr Gly Leu Thr Gly Pro Phe Asn Gln Thr Tyr Leu
180 185 190
Ser Gly Leu Thr Thr Ile Val Asp Tyr Ile Thr Asn Lys Gly Gly Tyr
195 200 205
Ala Leu Ile Asp Pro His Asn Phe Met Arg Tyr Asn Asn Gly Ile Ile
210 215 220
Ser Ser Thr Ser Asp Phe Ala Thr Trp Trp Ser Asn Leu Ala Thr Val
225 230 235 240
Phe Lys Ser Thr Lys Asn Ala Ile Phe Asp Ile Gln Asn Glu Pro Tyr
245 250 255
Gly Ile Asp Ala Gln Thr Val Tyr Glu Leu Asn Gln Ala Ala Ile Asn
260 265 270
Ser Ile Arg Ala Ala Gly Ala Thr Ser Gln Leu Ile Leu Val Glu Gly
275 280 285
Thr Ser Tyr Thr Gly Ala Trp Thr Trp Val Ser Ser Gly Asn Gly Ala
290 295 300
Ala Phe Ala Ala Val Thr Asp Pro Tyr Asn Asn Thr Ala Ile Glu Met
305 310 315 320
His Gln Tyr Leu Asp Ser Asp Gly Ser Gly Thr Asn Glu Asp Cys Val
325 330 335
Ser Ser Thr Ile Gly Ser Gln Arg Leu Gln Ala Ala Thr Ala Trp Leu
340 345 350
Gln Gln Thr Gly Leu Lys Gly Phe Leu Gly Glu Thr Gly Ala Gly Ser
355 360 365
Asn Ser Gln Cys Ile Asp Ala Val Phe Asp Glu Leu Cys Tyr Met Gln
370 375 380
Gln Gln Gly Gly Ser Trp Ile Gly Ala Leu Trp Trp Ala Ala Gly Pro
385 390 395 400
Trp Trp Gly Thr Tyr Ile Tyr Ser Ile Glu Pro Pro Ser Gly Ala Ala
405 410 415
Ile Pro Glu Val Leu Pro Gln Gly Leu Ala Pro Phe Leu
420 425
<210>19
<211>1580
<212>DNA
<213>土生梭孢霉(Thielavia terrestris)
<400>19
agccccccgt tcaggcacac ttggcatcag atcagcttag cagcgcctgc acagcatgaa 60
gctctcgcag tcggccgcgc tggcggcact caccgcgacg gcgctcgccg ccccctcgcc120
cacgacgccg caggcgccga ggcaggcttc agccggctgc tcgtctgcgg tcacgctcga180
cgccagcacc aacgtttgga agaagtacac gctgcacccc aacagctact accgcaagga240
ggttgaggcc gcggtggcgc agatctcgga cccggacctc gccgccaagg ccaagaaggt300
ggccgacgtc ggcaccttcc tgtggctcga ctcgatcgag aacatcggca agctggagcc360
ggcgatccag gacgtgccct gcgagaacat cctgggcctg gtcatctacg acctgccggg420
ccgcgactgc gcggccaagg cgtccaacgg cgagctcaag gtcggcgaga tcgaccgcta480
caagaccgag tacatcgaca gtgagtgctg ccccccgggt tcgagaagag cgtgggggaa540
agggaaaggg ttgactgact gacacggcgc actgcagaga tcgtgtcgat cctcaaggca600
caccccaaca cggcgttcgc gctggtcatc gagccggact cgctgcccaa cctggtgacc660
aacagcaact tggacacgtg ctcgagcagc gcgtcgggct accgcgaagg cgtggcttac720
gccctcaaga acctcaacct gcccaacgtg atcatgtacc tcgacgccgg ccacggcggc780
tggctcggct gggacgccaa cctgcagccc ggcgcgcagg agctagccaa ggcgtacaag840
aacgccggct cgcccaagca gctccgcggc ttctcgacca acgtggccgg ctggaactcc900
tggtgagctt ttttccattc catttcttct tcctcttctc tcttcgctcc cactctgcag960
ccccccctcc cccaagcacc cactggcgtt ccggcttgct gactcggcct ccctttcccc1020
gggcaccagg gatcaatcgc ccggcgaatt ctcccaggcg tccgacgcca agtacaacaa1080
gtgccagaac gagaagatct acgtcagcac cttcggctcc gcgctccagt cggccggcat1140
gcccaaccac gccatcgtcg acacgggccg caacggcgtc accggcctgc gcaaggagtg1200
gggtgactgg tgcaacgtca acggtgcagg ttcgttgtct tctttttctc ctcttttgtt1260
tgcacgtcgt ggtccttttc aagcagccgt gtttggttgg gggagatgga ctccggctga1320
tgttctgctt cctctctagg cttcggcgtg cgcccgacga gcaacacggg cctcgagctg1380
gccgacgcgt tcgtgtgggt caagcccggc ggcgagtcgg acggcaccag cgacagctcg1440
tcgccgcgct acgacagctt ctgcggcaag gacgacgcct tcaagccctc gcccgaggcc1500
ggcacctgga acgaggccta cttcgagatg ctgctcaaga acgccgtgcc gtcgttctaa1560
gacggtccag catcatccgg 1580
<210>20
<211>396
<212>PRT
<213>土生梭孢霉(Thielavia terrestris)
<400>20
Met Lys Leu Ser Gln Ser Ala Ala Leu Ala Ala Leu Thr Ala Thr Ala
1 5 10 15
Leu Ala Ala Pro Ser Pro Thr Thr Pro Gln Ala Pro Arg Gln Ala Ser
20 25 30
Ala Gly Cys Ser Ser Ala Val Thr Leu Asp Ala Ser Thr Asn Val Trp
35 40 45
Lys Lys Tyr Thr Leu His Pro Asn Ser Tyr Tyr Arg Lys Glu Val Glu
50 55 60
Ala Ala Val Ala Gln Ile Ser Asp Pro Asp Leu Ala Ala Lys Ala Lys
65 70 75 80
Lys Val Ala Asp Val Gly Thr Phe Leu Trp Leu Asp Ser Ile Glu Asn
85 90 95
Ile Gly Lys Leu Glu Pro Ala Ile Gln Asp Val Pro Cys Glu Asn Ile
100 105 110
Leu Gly Leu Val Ile Tyr Asp Leu Pro Gly Arg Asp Cys Ala Ala Lys
115 120 125
Ala Ser Asn Gly Glu Leu Lys Val Gly Glu Ile Asp Arg Tyr Lys Thr
130 135 140
Glu Tyr Ile Asp Lys Ile Val Ser Ile Leu Lys Ala His Pro Asn Thr
145 150 155 160
Ala Phe Ala Leu Val Ile Glu Pro Asp Ser Leu Pro Asn Leu Val Thr
165 170 175
Asn Ser Asn Leu Asp Thr Cys Ser Ser Ser Ala Ser Gly Tyr Arg Glu
180 185 190
Gly Val Ala Tyr Ala Leu Lys Asn Leu Asn Leu Pro Asn Val Ile Met
195 200 205
Tyr Leu Asp Ala Gly His Gly Gly Trp Leu Gly Trp Asp Ala Asn Leu
210 215 220
Gln Pro Gly Ala Gln Glu Leu Ala Lys Ala Tyr Lys Asn Ala Gly Ser
225 230 235 240
Pro Lys Gln Leu Arg Gly Phe Ser Thr Asn Val Ala Gly Trp Asn Ser
245 250 255
Trp Asp Gln Ser Pro Gly Glu Phe Ser Gln Ala Ser Asp Ala Lys Tyr
260 265 270
Asn Lys Cys Gln Asn Glu Lys Ile Tyr Val Ser Thr Phe Gly Ser Ala
275 280 285
Leu Gln Ser Ala Gly Met Pro Asn His Ala Ile Val Asp Thr Gly Arg
290 295 300
Asn Gly Val Thr Gly Leu Arg Lys Glu Trp Gly Asp Trp Cys Asn Val
305 310 315 320
Asn Gly Ala Gly Phe Gly Val Arg Pro Thr Ser Asn Thr Gly Leu Glu
325 330 335
Leu Ala Asp Ala Phe Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly
340 345 350
Thr Ser Asp Ser Ser Ser Pro Arg Tyr Asp Ser Phe Cys Gly Lys Asp
355 360 365
Asp Ala Phe Lys Pro Ser Pro Glu Ala Gly Thr Trp Asn Glu Ala Tyr
370 375 380
Phe Glu Met Leu Leu Lys Asn Ala Val Pro Ser Phe
385 390 395
<210>21
<211>1203
<212>DNA
<213>土生梭孢霉(Thielavia terrestris)
<400>21
atgaagtacc tcaacctcct cgcagctctc ctcgccgtcg ctcctctctc cctcgctgca 60
cccagcatcg aggccagaca gtcgaacgtc aacccataca tcggcaagag cccgctcgtt120
attaggtcgt acgcccaaaa gcttgaggag accgtcagga ccttccagca acgtggcgac180
cagctcaacg ctgcgaggac acggacggtg cagaacgttg cgactttcgc ctggatctcg240
gataccaatg gtattggagc cattcgacct ctcatccaag atgctctcgc ccagcaggct300
cgcactggac agaaggtcat cgtccaaatc gtcgtctaca acctcccaga tcgcgactgc360
tctgccaacg cctcgactgg agagttcacc gtaggaaacg acggtctcaa ccgatacaag420
aactttgtca acaccatcgc ccgcgagctc tcgactgctg acgctgacaa gctccacttt480
gccctcctcc tcgaacccga cgcacttgcc aacctcgtca ccaacgcgaa tgcccccagg540
tgccgaatcg ccgctcccgc ttacaaggag ggtatcgcct acaccctcgc caccttgtcc600
aagcccaacg tcgacgtcta catcgacgcc gccaacggtg gctggctcgg ctggaacgac660
aacctccgcc ccttcgccga actcttcaag gaagtctacg acctcgcccg ccgcatcaac720
cccaacgcca aggtccgcgg cgtccccgtc aacgtctcca actacaacca gtaccgcgct780
gaagtccgcg agcccttcac cgagtggaag gacgcctggg acgagagccg ctacgtcaac840
gtcctcaccc cgcacctcaa cgccgtcggc ttctccgcgc acttcatcgt tgaccaggga900
cgcggtggca agggcggtat caggacggag tggggccagt ggtgcaacgt taggaacgct960
gggttcggta tcaggcctac tgcggatcag ggcgtgctcc agaacccgaa tgtggatgcg1020
attgtgtggg ttaagccggg tggagagtcg gatggcacga gtgatttgaa ctcgaacagg1080
tatgatccta cgtgcaggag tccggtggcg catgttcccg ctcctgaggc tggccagtgg1140
ttcaacgagt atgttgttaa cctcgttttg aacgctaacc cccctcttga gcctacctgg1200
taa 1203
<210>22
<211>400
<212>PRT
<213>土生梭孢霉(Thielavia terrestris)
<400>22
Met Lys Tyr Leu Asn Leu Leu Ala Ala Leu Leu Ala Val Ala Pro Leu
1 5 10 15
Ser Leu Ala Ala Pro Ser Ile Glu Ala Arg Gln Ser Asn Val Asn Pro
20 25 30
Tyr Ile Gly Lys Ser Pro Leu Val Ile Arg Ser Tyr Ala Gln Lys Leu
35 40 45
Glu Glu Thr Val Arg Thr Phe Gln Gln Arg Gly Asp Gln Leu Asn Ala
50 55 60
Ala Arg Thr Arg Thr Val Gln Asn Val Ala Thr Phe Ala Trp Ile Ser
65 70 75 80
Asp Thr Asn Gly Ile Gly Ala Ile Arg Pro Leu Ile Gln Asp Ala Leu
85 90 95
Ala Gln Gln Ala Arg Thr Gly Gln Lys Val Ile Val Gln Ile Val Val
100 105 110
Tyr Asn Leu Pro Asp Arg Asp Cys Ser Ala Asn Ala Ser Thr Gly Glu
115 120 125
Phe Thr Val Gly Asn Asp Gly Leu Asn Arg Tyr Lys Asn Phe Val Asn
130 135 140
Thr Ile Ala Arg Glu Leu Ser Thr Ala Asp Ala Asp Lys Leu His Phe
14 150 155 160
Ala Leu Leu Leu Glu Pro Asp Ala Leu Ala Asn Leu Val Thr Asn Ala
165 170 175
Asn Ala Pro Arg Cys Arg Ile Ala Ala Pro Ala Tyr Lys Glu Gly Ile
180 185 190
Ala Tyr Thr Leu Ala Thr Leu Ser Lys Pro Asn Val Asp Val Tyr Ile
195 200 205
Asp Ala Ala Asn Gly Gly Trp Leu Gly Trp Asn Asp Asn Leu Arg Pro
210 215 220
Phe Ala Glu Leu Phe Lys Glu Val Tyr Asp Leu Ala Arg Arg Ile Asn
225 230 235 240
Pro Asn Ala Lys Val Arg Gly Val Pro Val Asn Val Ser Asn Tyr Asn
245 250 255
Gln Tyr Arg Ala Glu Val Arg Glu Pro Phe Thr Glu Trp Lys Asp Ala
260 265 270
Trp Asp Glu Ser Arg Tyr Val Asn Val Leu Thr Pro His Leu Asn Ala
275 280 285
Val Gly Phe Ser Ala His Phe Ile Val Asp Gln Gly Arg Gly Gly Lys
290 295 300
Gly Gly Ile Arg Thr Glu Trp Gly Gln Trp Cys Asn Val Arg Asn Ala
305 310 315 320
Gly Phe Gly Ile Arg Pro Thr Ala Asp Gln Gly Val Leu Gln Asn Pro
325 330 335
Asn Val Asp Ala Ile Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly
340 345 350
Thr Ser Asp Leu Asn Ser Asn Arg Tyr Asp Pro Thr Cys Arg Ser Pro
355 360 365
Val Ala His Val Pro Ala Pro Glu Ala Gly Gln Trp Phe Asn Glu Tyr
370 375 380
Val Val Asn Leu Val Leu Asn Ala Asn Pro Pro Leu Glu Pro Thr Trp
385 390 395 400
<210>23
<211>1501
<212>DNA
<213>土生梭孢霉(Thielavia terrestris)
<400>23
gccgttgtca agatgggcca gaagacgctg cacggattcg ccgccacggc tttggccgtt 60
ctcccctttg tgaaggctca gcagcccggc aacttcacgc cggaggtgca cccgcaactg120
ccaacgtgga agtgcacgac cgccggcggc tgcgttcagc aggacacttc ggtggtgctc180
gactggaact accgttggat ccacaatgcc gacggcaccg cctcgtgcac gacgtccagc240
ggggtcgacc acacgctgtg tccagatgag gcgacctgcg cgaagaactg cttcgtggaa300
ggcgtcaact acacgagcag cggtgtcacc acatccggca gttcgctgac gatgaggcag360
tatttcaagg ggagcaacgg gcagaccaac agcgtttcgc ctcgtctcta cctgctcggc420
tcggatggaa actacgtaat gctcaagctg ctcggccagg agctgagctt cgatgtcgat480
ctctccacgc tcccctgcgg cgagaacggc gcgctgtacc tgtccgagat ggacgcgacc540
ggtggcagga accagtacaa caccggcggt gccaactacg gctcgggcta ctgtgacgcc600
cagtgtcccg tgcagacgtg gatgaacggc acgctgaaca ccaacgggca gggctactgc660
tgcaacgaga tggacatcct cgaggccaac tcccgcgcca acgcgatgac acctcacccc720
tgcgccaacg gcagctgcga caagagcggg tgcggactca acccctacgc cgagggctac780
aagagctact acggaccggg cctcacggtt gacacgtcga agcccttcac catcattacc840
cgcttcatca ccgacgacgg cacgaccagc ggcaccctca accagatcca gcggatctat900
gtgcagaatg gcaagacggt cgcgtcggct gcgtccggag gcgacatcat cacggcatcc960
ggctgcacct cggcccaggc gttcggcggg ctggccaaca tgggcgcggc gcttggacgg1020
ggcatggtgc tgaccttcag catctggaac gacgctgggg gctacatgaa ctggctcgac1080
agcggcaaca acggcccgtg cagcagcacc gagggcaacc cgtccaacat cctggccaac1140
tacccggaca cccacgtggt cttctccaac atccgctggg gagacatcgg ctcgacggtc1200
caggtctcgg gaggcggcaa cggcggctcg accaccacca cgtcgaccac cacgctgagg1260
acctcgacca cgaccaccac caccgccccg acggccactg ccacgcactg gggacaatgc1320
ggcggaatcg gggtacgtca accgcctcct gcattctgtt gaggaagtta actaacgtgg1380
cctacgcagt ggactggacc gaccgtctgc gaatcgccgt acgcatgcaa ggagctgaac1440
ccctggtact accagtgcct ctaaagtatt gcagtgaagc catactccgt gctcggcatg1500
g 1501
<210>24
<211>464
<212>PRT
<213>土生梭孢霉(Thielavia terrestris)
<400>24
Met Gly Gln Lys Thr Leu His Gly Phe Ala Ala Thr Ala Leu Ala Val
1 5 10 15
Leu Pro Phe Val Lys Ala Gln Gln Pro Gly Asn Phe Thr Pro Glu Val
20 25 30
His Pro Gln Leu Pro Thr Trp Lys Cys Thr Thr Ala Gly Gly Cys Val
35 40 45
Gln Gln Asp Thr Ser Val Val Leu Asp Trp Asn Tyr Arg Trp Ile His
50 55 60
Asn Ala Asp Gly Thr Ala Ser Cys Thr Thr Ser Ser Gly Val Asp His
65 70 75 80
Thr Leu Cys Pro Asp Glu Ala Thr Cys Ala Lys Asn Cys Phe Val Glu
85 90 95
Gly Val Asn Tyr Thr Ser Ser Gly Val Thr Thr Ser Gly Ser Ser Leu
100 105 110
Thr Met Arg Gln Tyr Phe Lys Gly Ser Asn Gly Gln Thr Asn Ser Val
115 120 125
Ser Pro Arg Leu Tyr Leu Leu Gly Ser Asp Gly Asn Tyr Val Met Leu
130 135 140
Lys Leu Leu Gly Gln Glu Leu Ser Phe Asp Val Asp Leu Ser Thr Leu
145 150 155 160
Pro Cys Gly Glu Asn Gly Ala Leu Tyr Leu Ser Glu Met Asp Ala Thr
165 170 175
Gly Gly Arg Asn Gln Tyr Asn Thr Gly Gly Ala Asn Tyr Gly Ser Gly
180 185 190
Tyr Cys Asp Ala Gln Cys Pro Val Gln Thr Trp Met Asn Gly Thr Leu
195 200 205
Asn Thr Asn Gly Gln Gly Tyr Cys Cys Asn Glu Met Asp lle Leu Glu
210 2l5 220
Ala Asn Ser Arg Ala Asn Ala Met Thr Pro His Pro Cys Ala Asn Gly
225 230 235 240
Ser Cys Asp Lys Ser Gly Cys Gly Leu Asn Pro Tyr Ala Glu Gly Tyr
245 250 255
Lys Ser Tyr Tyr Gly Pro Gly Leu Thr Val Asp Thr Ser Lys Pro Phe
260 265 270
Thr Ile Ile Thr Arg Phe Ile Thr Asp Asp Gly Thr Thr Ser Gly Thr
275 280 285
Leu Asn Gln Ile Gln Arg Ile Tyr Val Gln Asn Gly Lys Thr Val Ala
290 295 300
Ser Ala Ala Ser Gly Gly Asp Ile Ile Thr Ala Ser Gly Cys Thr Ser
305 310 315 320
Ala Gln Ala Phe Gly Gly Leu Ala Asn Met Gly Ala Ala Leu Gly Arg
325 330 335
Gly Met Val Leu Thr Phe Ser Ile Trp Asn Asp Ala Gly Gly Tyr Met
340 345 350
Asn Trp Leu Asp Ser Gly Asn Asn Gly Pro Cys Ser Ser Thr Glu Gly
355 360 365
Asn Pro Ser Asn Ile Leu Ala Asn Tyr Pro Asp Thr His Val Val Phe
370 375 380
Ser Asn Ile Arg Trp Gly Asp Ile Gly Ser Thr Val Gln Val Ser Gly
385 390 395 400
Gly Gly Asn Gly Gly Ser Thr Thr Thr Thr Ser Thr Thr Thr Leu Arg
405 410 415
Thr Ser Thr Thr Thr Thr Thr Thr Ala Pro Thr Ala Thr Ala Thr His
420 425 430
Trp Gly Gln Cys Gly Gly Ile Gly Trp Thr Gly Pro Thr Val Cys Glu
435 440 445
Ser Pro Tyr Ala Cys Lys Glu Leu Asn Pro Trp Tyr Tyr Gln Cys Leu
450 455 460
<210>25
<211>1368
<212>DNA
<213>土生梭孢霉(Thielavia terrestris)
<400>25
accgatccgc tcgaagatgg cgcccaagtc tacagttctg gccgcctggc tgctctcctc 60
gctggccgcg gcccagcaga tcggcaaagc cgtgcccgag gtccacccca aactgacaac120
gcagaagtgc actctccgcg gcgggtgcaa gcctgtccgc acctcggtcg tgctcgactc180
gtccgcgcgc tcgctgcaca aggtcgggga ccccaacacc agctgcagcg tcggcggcga240
cctgtgctcg gacgcgaagt cgtgcggcaa gaactgcgcg ctcgagggcg tcgactacgc300
ggcccacggc gtggcgacca agggcgacgc cctcacgctg caccagtggc tcaagggggc360
cgacggcacc tacaggaccg tctcgccgcg cgtatacctc ctgggcgagg acgggaagaa420
ctacgaggac ttcaagctgc tcaacgccga gctcagcttc gacgtcgacg tgtcccagct480
cgtctgcggc atgaacggcg ccctgtactt ctccgagatg gagatggacg gcggccgcag540
cccgctgaac ccggcgggcg ccacgtacgg cacgggctac tgcgacgcgc agtgccccaa600
gttggacttt atcaacggcg aggtatttct tctctcttct gtttttcttt tccatcgctt660
tttctgaccg gaatccgccc tcttagctca acaccaacca cacgtacggg gcgtgctgca720
acgagatgga catctgggag gccaacgcgc tggcgcaggc gctcacgccg cacccgtgca780
acgcgacgcg ggtgtacaag tgcgacacgg cggacgagtg cgggcagccg gtgggcgtgt840
gcgacgaatg ggggtgctcg tacaacccgt ccaacttcgg ggtcaaggac tactacgggc900
gcaacctgac ggtggacacg aaccgcaagt tcacggtgac gacgcagttc gtgacgtcca960
acgggcgggc ggacggcgag ctgaccgaga tccggcggct gtacgtgcag gacggcgtgg1020
tgatccagaa ccacgcggtc acggcgggcg gggcgacgta cgacagcatc acggacggct1080
tctgcaacgc gacggccacc tggacgcagc agcggggcgg gctcgcgcgc atgggcgagg1140
ccatcggccg cggcatggtg ctcatcttca gcctgtgggt tgacaacggc ggcttcatga1200
actggctcga cagcggcaac gccgggccct gcaacgccac cgagggcgac ccggccctga1260
tcctgcagca gcacccggac gccagcgtca ccttctccaa catccgatgg ggcgagatcg1320
gcagcacgta caagagcgag tgcagccact agagtagagc ttgtaatt 1368
<210>26
<211>423
<212>PRT
<213>土生梭孢霉(Thielavia terrestris)
<400>26
Met Ala Pro Lys Ser Thr Val Leu Ala Ala Trp Leu Leu Ser Ser Leu
1 5 10 15
Ala Ala Ala Gln Gln Ile Gly Lys Ala Val Pro Glu Val His Pro Lys
20 25 30
Leu Thr Thr Gln Lys Cys Thr Leu Arg Gly Gly Cys Lys Pro Val Arg
35 40 45
Thr Ser Val Val Leu Asp Ser Ser Ala Arg Ser Leu His Lys Val Gly
50 55 60
Asp Pro Asn Thr Ser Cys Ser Val Gly Gly Asp Leu Cys Ser Asp Ala
65 70 75 80
Lys Ser Cys Gly Lys Asn Cys Ala Leu Glu Gly Val Asp Tyr Ala Ala
85 90 95
His Gly Val Ala Thr Lys Gly Asp Ala Leu Thr Leu His Gln Trp Leu
100 105 110
Lys Gly Ala Asp Gly Thr Tyr Arg Thr Val Ser Pro Arg Val Tyr Leu
115 120 125
Leu Gly Glu Asp Gly Lys Asn Tyr Glu Asp Phe Lys Leu Leu Asn Ala
130 135 140
Glu Leu Ser Phe Asp Val Asp Val Ser Gln Leu Val Cys Gly Met Asn
145 150 155 160
Gly Ala Leu Tyr Phe Ser Glu Met Glu Met Asp Gly Gly Arg Ser Pro
165 170 175
Leu Asn Pro Ala Gly Ala Thr Tyr Gly Thr Gly Tyr Cys Asp Ala Gln
180 185 190
Cys Pro Lys Leu Asp Phe Ile Asn Gly Glu Leu Asn Thr Asn His Thr
195 200 205
Tyr Gly Ala Cys Cys Asn Glu Met Asp Ile Trp Glu Ala Asn Ala Leu
210 215 220
Ala Gln Ala Leu Thr Pro His Pro Cys Asn Ala Thr Arg Val Tyr Lys
225 230 235 240
Cys Asp Thr Ala Asp Glu Cys Gly Gln Pro Val Gly Val Cys Asp Glu
245 250 255
Trp Gly Cys Ser Tyr Asn Pro Ser Asn Phe Gly Val Lys Asp Tyr Tyr
260 265 270
Gly Arg Asn Leu Thr Val Asp Thr Asn Arg Lys Phe Thr Val Thr Thr
275 280 285
Gln Phe Val Thr Ser Asn Gly Arg Ala Asp Gly Glu Leu Thr Glu Ile
290 295 300
Arg Arg Leu Tyr Val Gln Asp Gly Val Val Ile Gln Asn His Ala Val
305 310 315 320
Thr Ala Gly Gly Ala Thr Tyr Asp Ser Ile Thr Asp Gly Phe Cys Asn
325 330 335
Ala Thr Ala Thr Trp Thr Gln Gln Arg Gly Gly Leu Ala Arg Met Gly
340 345 350
Glu Ala Ile Gly Arg Gly Met Val Leu Ile Phe Ser Leu Trp Val Asp
355 360 365
Asn Gly Gly Phe Met Asn Trp Leu Asp Ser Gly Asn Ala Gly Pro Cys
370 375 380
Asn Ala Thr Glu Gly Asp Pro Ala Leu Ile Leu Gln Gln His Pro Asp
385 390 395 400
Ala Ser Val Thr Phe Ser Asn Ile Arg Trp Gly Glu Ile Gly Ser Thr
405 410 415
Tyr Lys Ser Glu Cys Ser His
420
<210>27
<211>1011
<212>DNA
<213>土生梭孢霉(Thielavia terrestris)
<400>27
atgaccctac ggctccctgt catcagcctg ctggcctcgc tggcagcagg cgccgtcgtc 60
gtcccacggg cggagtttca cccccctctc ccgacttgga aatgcacgac ctccgggggc120
tgcgtgcagc agaacaccag cgtcgtcctg gaccgtgact cgaagtacgc cgcacacagc180
gccggctcgc ggacggaatc ggattacgcg gcaatgggag tgtccacttc gggcaatgcc240
gtgacgctgt accactacgt caagaccaac ggcaccctcg tccccgcttc gccgcgcatc300
tacctcctgg gcgcggacgg caagtacgtg cttatggacc tcctcaacca ggagctgtcg360
gtggacgtcg acttctcggc gctgccgtgc ggcgagaacg gggccttcta cctgtccgag420
atggcggcgg acgggcgggg cgacgcgggg gcgggcgacg ggtactgcga cgcgcagtgc480
cagggctact gctgcaacga gatggacatc ctcgaggcca actcgatggc gacggccatg540
acgccgcacc cgtgcaaggg caacaactgc gaccgcagcg gctgcggcta caacccgtac600
gccagcggcc agcgcggctt ctacgggccc ggcaagacgg tcgacacgag caagcccttc660
accgtcgtca cgcagttcgc cgccagcggc ggcaagctga cccagatcac ccgcaagtac720
atccagaacg gccgggagat cggcggcggc ggcaccatct ccagctgcgg ctccgagtct780
tcgacgggcg gcctgaccgg catgggcgag gcgctggggc gcggaatggt gctggccatg840
agcatctgga acgacgcggc ccaggagatg gcatggctcg atgccggcaa caacggccct900
tgcgccagtg gccagggcag cccgtccgtc attcagtcgc agcatcccga cacccacgtc960
gtcttctcca acatcaggtg gggcgacatc gggtctacca cgaagaacta g 1011
<210>28
<211>336
<212>PRT
<213>土生梭孢霉(Thielavia terrestris)
<400>28
Met Thr Leu Arg Leu Pro Val Ile Ser Leu Leu Ala Ser Leu Ala Ala
1 5 10 15
Gly Ala Val Val Val Pro Arg Ala Glu Phe His Pro Pro Leu Pro Thr
20 25 30
Trp Lys Cys Thr Thr Ser Gly Gly Cys Val Gln Gln Asn Thr Ser Val
35 40 45
Val Leu Asp Arg Asp Ser Lys Tyr Ala Ala His Ser Ala Gly Ser Arg
50 55 60
Thr Glu Ser Asp Tyr Ala Ala Met Gly Val Ser Thr Ser Gly Asn Ala
65 70 75 80
Val Thr Leu Tyr His Tyr Val Lys Thr Asn Gly Thr Leu Val Pro Ala
85 90 95
Ser Pro Arg Ile Tyr Leu Leu Gly Ala Asp Gly Lys Tyr Val Leu Met
100 105 110
Asp Leu Leu Asn Gln Glu Leu Ser Val Asp Val Asp Phe Ser Ala Leu
115 120 125
Pro Cys Gly Glu Asn Gly Ala Phe Tyr Leu Ser Glu Met Ala Ala Asp
130 135 140
Gly Arg Gly Asp Ala Gly Ala Gly Asp Gly Tyr Cys Asp Ala Gln Cys
145 150 155 160
Gln Gly Tyr Cys Cys Asn Glu Met Asp Ile Leu Glu Ala Asn Ser Met
165 170 175
Ala Thr Ala Met Thr Pro His Pro Cys Lys Gly Asn Asn Cys Asp Arg
180 185 190
Ser Gly Cys Gly Tyr Asn Pro Tyr Ala Ser Gly Gln Arg Gly Phe Tyr
195 200 205
Gly Pro Gly Lys Thr Val Asp Thr Ser Lys Pro Phe Thr Val Val Thr
210 215 220
Gln Phe Ala Ala Ser Gly Gly Lys Leu Thr Gln Ile Thr Arg Lys Tyr
225 230 235 240
Ile Gln Asn Gly Arg Glu Ile Gly Gly Gly Gly Thr Ile Ser Ser Cys
245 250 255
Gly Ser Glu Ser Ser Thr Gly Gly Leu Thr Gly Met Gly Glu Ala Leu
260 265 270
Gly Arg Gly Met Val Leu Ala Met Ser Ile Trp Asn Asp Ala Ala Gln
275 280 285
Glu Met Ala Trp Leu Asp Ala Gly Asn Asn Gly Pro Cys Ala Ser Gly
290 295 300
Gln Gly Ser Pro Ser Val Ile Gln Ser Gln His Pro Asp Thr His Val
305 310 315 320
Val Phe Ser Asn Ile Arg Trp Gly Asp Ile Gly Ser Thr Thr Lys Asn
325 330 335
<210>29
<211>1480
<212>DNA
<213>Cladorrhinum foecundissimum
<400>29
gatccgaatt cctcctctcg ttctttagtc acagaccaga catctgccca cgatggttca60
caagttcgcc ctcctcaccg gcctcgccgc ctccctcgca tctgcccagc agatcggcac120
cgtcgtcccc gagtctcacc ccaagcttcc caccaagcgc tgcactctcg ccggtggctg180
ccagaccgtc gacacctcca tcgtcatcga cgccttccag cgtcccctcc acaagatcgg240
cgacccttcc actccttgcg tcgtcggcgg ccctctctgc cccgacgcca agtcctgcgc300
tgagaactgc gcgctcgagg gtgtcgacta tgcctcctgg ggcatcaaga ccgagggcga360
cgccctaact ctcaaccagt ggatgcccga cccggcgaac cctggccagt acaagacgac420
tactccccgt acttaccttg ttgctgagga cggcaagaac tacgaggatg tgaagctcct480
ggctaaggag atctcgtttg atgccgatgt cagcaacctt ccctgcggca tgaacggtgc540
tttctacttg tctgagatgt tgatggatgg tggacgtggc gacctcaacc ctgctggtgc600
cgagtatggt accggttact gtgatgcgca gtgcttcaag ttggatttca tcaacggcga660
ggccaacatc gaccaaaagc acggcgcctg ctgcaacgaa atggacattt tcgaatccaa720
ctcgcgcgcc aagaccttcg tcccccaccc ctgcaacatc acgcaggtct acaagtgcga780
aggcgaagac gagtgcggcc agcccgtcgg cgtgtgcgac aagtgggggt gcggcttcaa840
cgagtacaaa tggggcgtcg agtccttcta cggccggggc tcgcagttcg ccatcgactc900
ctccaagaag ttcaccgtca ccacgcagtt cctgaccgac aacggcaagg aggacggcgt960
cctcgtcgag atccgccgct tgtggcacca ggatggcaag ctgatcaaga acaccgctat1020
ccaggttgag gagaactaca gcacggactc ggtgagcacc gagttctgcg agaagactgc1080
ttctttcacc atgcagcgcg gtggtctcaa ggcgatgggc gaggctatcg gtcgtggtat1140
ggtgctggtt ttcagcatct gggcggatga ttcgggtttt atgaactggt tggatgcgga1200
gggtaatggc ccttgcagcg cgactgaggg cgatccgaag gagattgtca agaataagcc1260
ggatgctagg gttacgttct caaacattag gattggtgag gttggtagca cgtatgctcc1320
gggtgggaag tgcggtgtta agagcagggt tgctaggggg cttactgctt cttaaggggg1380
gtgtgaagag aggaggaggt gttgttgggg gttggagatg ataattgggc gagatggtgt1440
agagcgggtt ggttggatat gaatacgttg aattggatgt 1480
<210>30
<211>440
<212>PRT
<213>Cladorrhinum foecundissimum
<400>30
Met Val H1s Lys Phe Ala Leu Leu Thr Gly Leu Ala Ala Ser Leu Ala
1 5 10 15
Ser Ala Gln Gln Ile Gly Thr Val Val Pro Glu Ser His Pro Lys Leu
20 25 30
Pro Thr Lys Arg Cys Thr Leu Ala Gly Gly Cys Gln Thr Val Asp Thr
35 40 45
Ser Ile Val Ile Asp Ala Phe Gln Arg Pro Leu His Lys Ile Gly Asp
50 55 60
Pro Ser Thr Pro Cys Val Val Gly Gly Pro Leu Cys Pro Asp Ala Lys
65 70 75 80
Ser Cys Ala Glu Asn Cys Ala Leu Glu Gly Val Asp Tyr Ala Ser Trp
85 90 95
Gly Ile Lys Thr Glu Gly Asp Ala Leu Thr Leu Asn Gln Trp Met Pro
100 105 110
Asp Pro Ala Asn Pro Gly Gln Tyr Lys Thr Thr Thr Pro Arg Thr Tyr
115 120 125
Leu Val Ala Glu Asp Gly Lys Asn Tyr Glu Asp Val Lys Leu Leu Ala
130 135 140
Lys Glu Ile Ser Phe Asp Ala Asp Val Ser Asn Leu Pro Cys Gly Met
145 150 155 160
Asn Gly Ala Phe Tyr Leu Ser Glu Met Leu Met Asp Gly Gly Arg Gly
165 170 175
Asp Leu Asn Pro Ala Gly Ala Glu Tyr Gly Thr Gly Tyr Cys Asp Ala
180 185 190
Gln Cys Phe Lys Leu Asp Phe Ile Asn Gly Glu Ala Asn Ile Asp Gln
195 200 205
Lys His Gly Ala Cys Cys Asn Glu Met Asp Ile Phe Glu Ser Asn Ser
210 215 220
Arg Ala Lys Thr Phe Val Pro His Pro Cys Asn Ile Thr Gln Val Tyr
225 230 235 240
Lys Cys Glu Gly Glu Asp Glu Cys Gly Gln Pro Val Gly Val Cys Asp
245 250 255
Lys Trp Gly Cys Gly Phe Asn Glu Tyr Lys Trp Gly Val Glu Ser Phe
260 265 270
Tyr Gly Arg Gly Ser Gln Phe Ala Ile Asp Ser Ser Lys Lys Phe Thr
275 280 285
Val Thr Thr Gln Phe Leu Thr Asp Asn Gly Lys Glu Asp Gly Val Leu
290 295 300
Val Glu Ile Arg Arg Leu Trp His Gln Asp Gly Lys Leu Ile Lys Asn
305 310 315 320
Thr Ala Ile Gln Val Glu Glu Asn Tyr Ser Thr Asp Ser Val Ser Thr
325 330 335
Glu Phe Cys Glu Lys Thr Ala Ser Phe Thr Met Gln Arg Gly Gly Leu
340 345 350
Lys Ala Met Gly Glu Ala Ile Gly Arg Gly Met Val Leu Val Phe Ser
355 360 365
Ile Trp Ala Asp Asp Ser Gly Phe Met Asn Trp Leu Asp Ala Glu Gly
370 375 380
Asn Gly Pro Cys Ser Ala Thr Glu Gly Asp Pro Lys Glu Ile Val Lys
385 390 395 400
Asn Lys Pro Asp Ala Arg Val Thr Phe Ser Asn Ile Arg Ile Gly Glu
405 410 415
Val Gly Ser Thr Tyr Ala Pro Gly Gly Lys Cys Gly Val Lys Ser Arg
420 425 430
Val Ala Arg Gly Leu Thr Ala Ser
435 440
<210>31
<211>1380
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>31
atggcgccct cagttacact gccgttgacc acggccatcc tggccattgc ccggctcgtc 60
gccgcccagc aaccgggtac cagcaccccc gaggtccatc ccaagttgac aacctacaag120
tgtacaaagt ccggggggtg cgtggcccag gacacctcgg tggtccttga ctggaactac180
cgctggatgc acgacgcaaa ctacaactcg tgcaccgtca acggcggcgt caacaccacg240
ctctgccctg acgaggcgac ctgtggcaag aactgcttca tcgagggcgt cgactacgcc300
gcctcgggcg tcacgacctc gggcagcagc ctcaccatga accagtacat gcccagcagc360
tctggcggct acagcagcgt ctctcctcgg ctgtatctcc tggactctga cggtgagtac420
gtgatgctga agctcaacgg ccaggagctg agcttcgacg tcgacctctc tgctctgccg480
tgtggagaga acggctcgct ctacctgtct cagatggacg agaacggggg cgccaaccag540
tataacacgg ccggtgccaa ctacgggagc ggctactgcg atgctcagtg ccccgtccag600
acatggagga acggcaccct caacactagc caccagggct tctgctgcaa cgagatggat660
atcctggagg gcaactcgag ggcgaatgcc ttgacccctc actcttgcac ggccacggcc720
tgcgactctg ccggttgcgg cttcaacccc tatggcagcg gctacaaaag ctactacggc780
cccggagata ccgttgacac ctccaagacc ttcaccatca tcacccagtt caacacggac840
aacggctcgc cctcgggcaa ccttgtgagc atcacccgca agtaccagca aaacggcgtc900
gacatcccca gcgcccagcc cggcggcgac accatctcgt cctgcccgtc cgcctcagcc960
tacggcggcc tcgccaccat gggcaaggcc ctgagcagcg gcatggtgct cgtgttcagc1020
atttggaacg acaacagcca gtacatgaac tggctcgaca gcggcaacgc cggcccctgc1080
agcagcaccg agggcaaccc atccaacatc ctggccaaca accccaacac gcacgtcgtc1140
ttctccaaca tccgctgggg agacattggg tctactacga actcgactgc gcccccgccc1200
ccgcctgcgt ccagcacgac gttttcgact acacggagga gctcgacgac ttcgagcagc1260
ccgagctgca cgcagactca ctgggggcag tgcggtggca ttgggtacag cgggtgcaag1320
acgtgcacgt cgggcactac gtgccagtat agcaacgact actactcgca atgcctttag1380
<210>32
<211>459
<212>PRT
<213>里氏木霉(Trichoderma reesei)
<400>32
Met Ala Pro Ser Val Thr Leu Pro Leu Thr Thr Ala Ile Leu Ala Ile
1 5 10 15
Ala Arg Leu Val Ala Ala Gln Gln Pro Gly Thr Ser Thr Pro Glu Val
20 25 30
His Pro Lys Leu Thr Thr Tyr Lys Cys Thr Lys Ser Gly Gly Cys Val
35 40 45
Ala Gln Asp Thr Ser Val Val Leu Asp Trp Asn Tyr Arg Trp Met His
50 55 60
Asp Ala Asn Tyr Asn Ser Cys Thr Val Asn Gly Gly Val Asn Thr Thr
65 70 75 80
Leu Cys Pro Asp Glu Ala Thr Cys Gly Lys Asn Cys Phe Ile Glu Gly
85 90 95
Val Asp Tyr Ala Ala Ser Gly Val Thr Thr Ser Gly Ser Ser Leu Thr
100 105 110
Met Asn Gln Tyr Met Pro Ser Ser Ser Gly Gly Tyr Ser Ser Val Ser
115 120 125
Pro Arg Leu Tyr Leu Leu Asp Ser Asp Gly Glu Tyr Val Met Leu Lys
130 135 140
Leu Asn Gly Gln Glu Leu Ser Phe Asp Val Asp Leu Ser Ala Leu Pro
145 150 155 160
Cys Gly Glu Asn Gly Ser Leu Tyr Leu Ser Gln Met Asp Glu Asn Gly
165 170 175
Gly Ala Asn Gln Tyr Asn Thr Ala Gly Ala Asn Tyr Gly Ser Gly Tyr
180 185 190
Cys Asp Ala Gln Cys Pro Val Gln Thr Trp Arg Asn Gly Thr Leu Asn
195 200 205
Thr Ser His Gln Gly Phe Cys Cys Asn Glu Met Asp Ile Leu Glu Gly
210 215 220
Asn Ser Arg Ala Asn Ala Leu Thr Pro His Ser Cys Thr Ala Thr Ala
225 230 235 240
Cys Asp Ser Ala Gly Cys Gly Phe Asn Pro Tyr Gly Ser Gly Tyr Lys
245 250 255
Ser Tyr Tyr Gly Pro Gly Asp Thr Val Asp Thr Ser Lys Thr Phe Thr
260 265 270
Ile Ile Thr Gln Phe Asn Thr Asp Asn Gly Ser Pro Ser Gly Asn Leu
275 280 285
Val Ser Ile Thr Arg Lys Tyr Gln Gln Asn Gly Val AspIle Pro Ser
290 295 300
Ala Gln Pro Gly Gly Asp Thr Ile Ser Ser Cys Pro Ser Ala Ser Ala
305 310 315 320
Tyr Gly Gly Leu Ala Thr Met Gly Lys Ala Leu Ser Ser Gly Met Val
325 330 335
Leu Val Phe Ser Ile Trp Asn Asp Asn Ser Gln Tyr Met Asn Trp Leu
340 345 350
Asp Ser Gly Asn Ala Gly Pro Cys Ser Ser Thr Glu Gly Asn Pro Ser
355 360 365
Asn Ile Leu Ala Asn Asn Pro Asn Thr His Val Val Phe Ser AsnIle
370 375 380
Arg Trp Gly Asp Ile Gly Ser Thr Thr Asn Ser Thr Ala Pro Pro Pro
385 390 395 400
Pro Pro Ala Ser Ser Thr Thr Phe Ser Thr Thr Arg Arg Ser Ser Thr
405 410 415
Thr Ser Ser Ser Pro Ser Cys Thr Gln Thr His Trp Gly Gln Cys Gly
420 425 430
Gly Ile Gly Tyr Ser Gly Cys Lys Thr Cys Thr Ser Gly Thr Thr Cys
435 440 445
Gln Tyr Ser Asn Asp Tyr Tyr Ser Gln Cys Leu
450 455
<210>33
<211>1545
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>33
atgtatcgga agttggccgt catctcggcc ttcttggcca cagctcgtgc tcagtcggcc 60
tgcactctcc aatcggagac tcacccgcct ctgacatggc agaaatgctc gtctggtggc120
acgtgcactc aacagacagg ctccgtggtc atcgacgcca actggcgctg gactcacgct180
acgaacagca gcacgaactg ctacgatggc aacacttgga gctcgaccct atgtcctgac240
aacgagacct gcgcgaagaa ctgctgtctg gacggtgccg cctacgcgtc cacgtacgga300
gttaccacga gcggtaacag cctctccatt ggctttgtca cccagtctgc gcagaagaac360
gttggcgctc gcctttacct tatggcgagc gacacgacct accaggaatt caccctgctt420
ggcaacgagt tctctttcga tgttgatgtt tcgcagctgc cgtgcggctt gaacggagct480
ctctacttcg tgtccatgga cgcggatggt ggcgtgagca agtatcccac caacaccgct540
ggcgccaagt acggcacggg gtactgtgac agccagtgtc cccgcgatct gaagttcatc600
aatggccagg ccaacgttga gggctgggag ccgtcatcca acaacgcgaa cacgggcatt660
ggaggacacg gaagctgctg ctctgagatg gatatctggg aggccaactc catctccgag720
gctcttaccc cccacccttg cacgactgtc ggccaggaga tctgcgaggg tgatgggtgc780
ggcggaactt actccgataa cagatatggc ggcacttgcg atcccgatgg ctgcgactgg840
aacccatacc gcctgggcaa caccagcttc tacggccctg gctcaagctt taccctcgat900
accaccaaga aattgaccgt tgtcacccag ttcgagacgt cgggtgccat caaccgatac960
tatgtccaga atggcgtcac tttccagcag cccaacgccg agcttggtag ttactctggc1020
aacgagctca acgatgatta ctgcacagct gaggaggcag aattcggcgg atcctctttc1080
tcagacaagg gcggcctgac tcagttcaag aaggctacct ctggcggcat ggttctggtc1140
atgagtctgt gggatgatta ctacgccaac atgctgtggc tggactccac ctacccgaca1200
aacgagacct cctccacacc cggtgccgtg cgcggaagct gctccaccag ctccggtgtc1260
cctgctcagg tcgaatctca gtctcccaac gccaaggtca ccttctccaa catcaagttc1320
ggacccattg gcagcaccgg caaccctagc ggcggcaacc ctcccggcgg aaacccgcct1380
ggcaccacca ccacccgccg cccagccact accactggaa gctctcccgg acctacccag1440
tctcactacg gccagtgcgg cggtattggc tacagcggcc ccacggtctg cgccagcggc1500
acaacttgcc aggtcctgaa cccttactac tctcagtgcc tgtaa 1545
<210>34
<211>514
<212>PRT
<213>里氏木霉(Trichoderma reesei)
<400>34
Met Tyr Arg Lys Leu Ala Val Ile Ser Ala Phe Leu Ala Thr Ala Arg
1 5 10 15
Ala Gln Ser Ala Cys Thr Leu Gln Ser Glu Thr His Pro Pro Leu Thr
20 25 30
Trp Gln Lys Cys Ser Ser Gly Gly Thr Cys Thr Gln Gln Thr Gly Ser
35 40 45
Val Val Ile Asp Ala Asn Trp Arg Trp Thr His Ala Thr Asn Ser Ser
50 55 60
Thr Asn Cys Tyr Asp Gly Asn Thr Trp Ser Ser Thr Leu Cys Pro Asp
65 70 75 80
Asn Glu Thr Cys Ala Lys Asn Cys Cys Leu Asp Gly Ala Ala Tyr Ala
85 90 95
Ser Thr Tyr Gly Val Thr Thr Ser Gly Asn Ser Leu Ser Ile Gly Phe
100 105 110
Val Thr Gln Ser Ala Gln Lys Asn Val Gly Ala Arg Leu Tyr Leu Met
115 120 125
Ala Ser Asp Thr Thr Tyr Gln Glu Phe Thr Leu Leu Gly Asn Glu Phe
130 135 140
Ser Phe Asp Val Asp Val Ser Gln Leu Pro Cys Gly Leu Asn Gly Ala
145 150 155 160
Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Val Ser Lys Tyr Pro
165 170 175
Thr Asn Thr Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln
180 185 190
Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Glu Gly
195 200 205
Trp Glu Pro Ser Ser Asn Asn Ala Asn Thr Gly Ile Gly Gly His Gly
210 215 220
Ser Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Ser Ile Ser Glu
225 230 235 240
Ala Leu Thr Pro His Pro Cys Thr Thr Val Gly Gln Glu Ile Cys Glu
245 250 255
Gly Asp Gly Cys Gly Gly Thr Tyr Ser Asp Asn Arg Tyr Gly Gly Thr
260 265 270
Cys Asp Pro Asp Gly Cys Asp Trp Asn Pro Tyr Arg Leu Gly Asn Thr
275 280 285
Ser Phe Tyr Gly Pro Gly Ser Ser Phe Thr Leu Asp Thr Thr Lys Lys
290 295 300
Leu Thr Val Val Thr Gln Phe Glu Thr Ser Gly Ala Ile Asn Arg Tyr
305 310 315 320
Tyr Val Gln Asn Gly Val Thr Phe Gln Gln Pro Asn Ala Glu Leu Gly
325 330 335
Ser Tyr Ser Gly Asn Glu Leu Asn Asp Asp Tyr Cys Thr Ala Glu Glu
340 345 350
Ala Glu Phe Gly Gly Ser Ser Phe Ser Asp Lys Gly Gly Leu Thr Gln
355 360 365
Phe Lys Lys Ala Thr Ser Gly Gly Met Val Leu Val Met Ser Leu Trp
370 375 380
Asp Asp Tyr Tyr Ala Asn Met Leu Trp Leu Asp Ser Thr Tyr Pro Thr
385 390 395 400
Asn Glu Thr Ser Ser Thr Pro Gly Ala Val Arg Gly Ser Cys Ser Thr
405 410 415
Ser Ser Gly Val Pro Ala Gln Val Glu Ser Gln Ser Pro Asn Ala Lys
420 425 430
Val Thr Phe Ser Asn Ile Lys Phe Gly Pro Ile Gly Ser Thr Gly Asn
435 440 445
Pro Ser Gly Gly Asn Pro Pro Gly Gly Asn Pro Pro Gly Thr Thr Thr
450 455 460
Thr Arg Arg Pro Ala Thr Thr Thr Gly Ser Ser Pro Gly Pro Thr Gln
465 470 475 480
Ser His Tyr Gly Gln Cys Gly Gly Ile Gly Tyr Ser Gly Pro Thr Val
485 490 495
Cys Ala Ser Gly Thr Thr Cys Gln Val Leu Asn Pro Tyr Tyr Ser Gln
500 505 510
Cys Leu
<210>35
<211>1611
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>35
atgattgtcg gcattctcac cacgctggct acgctggcca cactcgcagc tagtgtgcct 60
ctagaggagc ggcaagcttg ctcaagcgtc tggtaattat gtgaaccctc tcaagagacc120
caaatactga gatatgtcaa ggggccaatg tggtggccag aattggtcgg gtccgacttg180
ctgtgcttcc ggaagcacat gcgtctactc caacgactat tactcccagt gtcttcccgg240
cgctgcaagc tcaagctcgt ccacgcgcgc cgcgtcgacg acttctcgag tatcccccac300
aacatcccgg tcgagctccg cgacgcctcc acctggttct actactacca gagtacctcc360
agtcggatcg ggaaccgcta cgtattcagg caaccctttt gttggggtca ctccttgggc420
caatgcatat tacgcctctg aagttagcag cctcgctatt cctagcttga ctggagccat480
ggccactgct gcagcagctg tcgcaaaggt tccctctttt atgtggctgt aggtcctccc540
ggaaccaagg caatctgtta ctgaaggctc atcattcact gcagagatac tcttgacaag600
acccctctca tggagcaaac cttggccgac atccgcaccg ccaacaagaa tggcggtaac660
tatgccggac agtttgtggt gtatgacttg ccggatcgcg attgcgctgc ccttgcctcg720
aatggcgaat actctattgc cgatggtggc gtcgccaaat ataagaacta tatcgacacc780
attcgtcaaa ttgtcgtgga atattccgat atccggaccc tcctggttat tggtatgagt840
ttaaacacct gcctcccccc ccccttccct tcctttcccg ccggcatctt gtcgttgtgc900
taactattgt tccctcttcc agagcctgac tctcttgcca acctggtgac caacctcggt960
actccaaagt gtgccaatgc tcagtcagcc taccttgagt gcatcaacta cgccgtcaca1020
cagctgaacc ttccaaatgt tgcgatgtat ttggacgctg gccatgcagg atggcttggc1080
tggccggcaa accaagaccc ggccgctcag ctatttgcaa atgtttacaa gaatgcatcg1140
tctccgagag ctcttcgcgg attggcaacc aatgtcgcca actacaacgg gtggaacatt1200
accagccccc catcgtacac gcaaggcaac gctgtctaca acgagaagct gtacatccac1260
gctattggac gtcttcttgc caatcacggc tggtccaacg ccttcttcat cactgatcaa1320
ggtcgatcgg gaaagcagcc taccggacag caacagtggg gagactggtg caatgtgatc1380
ggcaccggat ttggtattcg cccatccgca aacactgggg actcgttgct ggattcgttt1440
gtctgggtca agccaggcgg cgagtgtgac ggcaccagcg acagcagtgc gccacgattt1500
gactcccact gtgcgctccc agatgccttg caaccggcgc ctcaagctgg tgcttggttc1560
caagcctact ttgtgcagct tctcacaaac gcaaacccat cgttcctgta a 1611
<210>36
<211>471
<212>PRT
<213>里氏木霉(Trichoderma reesei)
<400>36
Met Ile Val Gly Ile Leu Thr Thr Leu Ala Thr Leu Ala Thr Leu Ala
1 5 10 15
Ala Ser Val Pro Leu Glu Glu Arg Gln Ala Cys Ser Ser Val Trp Gly
20 25 30
Gln Cys Gly Gly Gln Asn Trp Ser Gly Pro Thr Cys Cys Ala Ser Gly
35 40 45
Ser Thr Cys Val Tyr Ser Asn Asp Tyr Tyr Ser Gln Cys Leu Pro Gly
50 55 60
Ala Ala Ser Ser Ser Ser Ser Thr Arg Ala Ala Ser Thr Thr Ser Arg
65 70 75 80
Val Ser Pro Thr Thr Ser Arg Ser Ser Ser Ala Thr Pro Pro Pro Gly
85 90 95
Ser Thr Thr Thr Arg Val Pro Pro Val Gly Ser Gly Thr Ala Thr Tyr
100 105 110
Ser Gly Asn Pro Phe Val Gly Val Thr Pro Trp Ala Asn Ala Tyr Tyr
115 120 125
Ala Ser Glu Val Ser Ser Leu Ala Ile Pro Ser Leu Thr Gly Ala Met
130 135 140
Ala Thr Ala Ala Ala Ala Val Ala Lys Val Pro Ser Phe Met Trp Leu
145 150 155 160
Asp Thr Leu Asp Lys Thr Pro Leu Met Glu Gln Thr Leu Ala Asp Ile
165 170 175
Arg Thr Ala Asn Lys Asn Gly Gly Asn Tyr Ala Gly Gln Phe Val Val
180 185 190
Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Leu Ala Ser Asn Gly Glu
195 200 205
Tyr Ser Ile Ala Asp Gly Gly Val Ala Lys Tyr Lys Asn Tyr Ile Asp
210 215 220
Thr Ile Arg Gln Ile Val Val Glu Tyr Ser Asp Ile Arg Thr Leu Leu
225 230 235 240
Val Ile Glu Pro Asp Ser Leu Ala Asn Leu Val Thr Asn Leu Gly Thr
245 250 255
Pro Lys Cys Ala Asn Ala Gln Ser Ala Tyr Leu Glu Cys Ile Asn Tyr
260 265 270
Ala Val Thr Gln Leu Asn Leu Pro Asn Val Ala Met Tyr Leu Asp Ala
275 280 285
Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Gln Asp Pro Ala Ala
290 295 300
Gln Leu Phe Ala Asn Val Tyr Lys Asn Ala Ser Ser Pro Arg Ala Leu
305 310 315 320
Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Gly Trp Asn Ile Thr
325 330 335
Ser Pro Pro Ser Tyr Thr Gln Gly Asn Ala Val Tyr Asn Glu Lys Leu
340 345 350
Tyr Ile His Ala Ile Gly Arg Leu Leu Ala Asn His Gly Trp Ser Asn
355 360 365
Ala Phe Phe Ile Thr Asp Gln Gly Arg Ser Gly Lys Gln Pro Thr Gly
370 375 380
Gln Gln Gln Trp Gly Asp Trp Cys Asn Val Ile Gly Thr Gly Phe Gly
385 390 395 400
Ile Arg Pro Ser Ala Asn Thr Gly Asp Ser Leu Leu Asp Ser Phe Val
405 410 415
Trp Val Lys Pro Gly Gly Glu Cys Asp Gly Thr Ser Asp Ser Ser Ala
420 425 430
Pro Arg Phe Asp Ser His Cys Ala Leu Pro Asp Ala Leu Gln Pro Ala
435 440 445
Pro Gln Ala Gly Ala Trp Phe Gln Ala Tyr Phe Val Gln Leu Leu Thr
450 455 460
Asn Ala Asn Pro Ser Phe Leu
465 470
<210>37
<211>2046
<212>DNA
<213>特异腐质霉(Humicola insolens)
<400>37
gccgtgacct tgcgcgcttt gggtggcggt ggcgagtcgt ggacggtgct tgctggtcgc 60
cggccttccc ggcgatccgc gtgatgagag ggccaccaac ggcgggatga tgctccatgg120
ggaacttccc catggagaag agagagaaac ttgcggagcc gtgatctggg gaaagatgct180
ccgtgtctcg tctatataac tcgagtctcc ccgagccctc aacaccacca gctctgatct240
caccatcccc atcgacaatc acgcaaacac agcagttgtc gggccattcc ttcagacaca300
tcagtcaccc tccttcaaaa tgcgtaccgc caagttcgcc accctcgccg cccttgtggc360
ctcggccgcc gcccagcagg cgtgcagtct caccaccgag aggcaccctt ccctctcttg420
gaacaagtgc accgccggcg gccagtgcca gaccgtccag gcttccatca ctctcgactc480
caactggcgc tggactcacc aggtgtctgg ctccaccaac tgctacacgg gcaacaagtg540
ggatactagc atctgcactg atgccaagtc gtgcgctcag aactgctgcg tcgatggtgc600
cgactacacc agcacctatg gcatcaccac caacggtgat tccctgagcc tcaagttcgt660
caccaagggc cagcactcga ccaacgtcgg ctcgcgtacc tacctgatgg acggcgagga720
caagtatcag agtacgttct atcttcagcc ttctcgcgcc ttgaatcctg gctaacgttt780
acacttcaca gccttcgagc tcctcggcaa cgagttcacc ttcgatgtcg atgtctccaa840
catcggctgc ggtctcaacg gcgccctgta cttcgtctcc atggacgccg atggtggtct900
cagccgctat cctggcaaca aggctggtgc caagtacggt accggctact gcgatgctca960
gtgcccccgt gacatcaagt tcatcaacgg cgaggccaac attgagggct ggaccggctc1020
caccaacgac cccaacgccg gcgcgggccg ctatggtacc tgctgctctg agatggatat1080
ctgggaagcc aacaacatgg ctactgcctt cactcctcac ccttgcacca tcattggcca1140
gagccgctgc gagggcgact cgtgcggtgg cacctacagc aacgagcgct acgccggcgt1200
ctgcgacccc gatggctgcg acttcaactc gtaccgccag ggcaacaaga ccttctacgg1260
caagggcatg accgtcgaca ccaccaagaa gatcactgtc gtcacccagt tcctcaagga1320
tgccaacggc gatctcggcg agatcaagcg cttctacgtc caggatggca agatcatccc1380
caactccgag tccaccatcc ccggcgtcga gggcaattcc atcacccagg actggtgcga1440
ccgccagaag gttgcctttg gcgacattga cgacttcaac cgcaagggcg gcatgaagca1500
gatgggcaag gccctcgccg gccccatggt cctggtcatg tccatctggg atgaccacgc1560
ctccaacatg ctctggctcg actcgacctt ccctgtcgat gccgctggca agcccggcgc1620
cgagcgcggt gcctgcccga ccacctcggg tgtccctgct gaggttgagg ccgaggcccc1680
caacagcaac gtcgtcttct ccaacatccg cttcggcccc atcggctcga ccgttgctgg1740
tctccccggc gcgggcaacg gcggcaacaa cggcggcaac cccccgcccc ccaccaccac1800
cacctcctcg gctccggcca ccaccaccac cgccagcgct ggccccaagg ctggccgctg1860
gcagcagtgc ggcggcatcg gcttcactgg cccgacccag tgcgaggagc cctacatttg1920
caccaagctc aacgactggt actctcagtg cctgtaaatt ctgagtcgct gactcgacga1980
tcacggccgg tttttgcatg aaaggaaaca aacgaccgcg ataaaaatgg agggtaatga2040
gatgtc 2046
<210>38
<211>525
<212>PRT
<213>特异腐质霉(Humicola insolens)
<400>38
Met Arg Thr Ala Lys Phe Ala Thr Leu Ala Ala Leu Val Ala Ser Ala
1 5 10 15
Ala Ala Gln Gln Ala Cys Ser Leu Thr Thr Glu Arg His Pro Ser Leu
20 25 30
Ser Trp Asn Lys Cys Thr Ala Gly Gly Gln Cys Gln Thr Val Gln Ala
35 40 45
Ser Ile Thr Leu Asp Ser Asn Trp Arg Trp Thr His Gln Val Ser Gly
50 55 60
Ser Thr Asn Cys Tyr Thr Gly Asn Lys Trp Asp Thr Ser Ile Cys Thr
65 70 75 80
Asp Ala Lys Ser Cys Ala Gln Asn Cys Cys Val Asp Gly Ala Asp Tyr
85 90 95
Thr Ser Thr Tyr Gly Ile Thr Thr Asn Gly Asp Ser Leu Ser Leu Lys
100 105 110
Phe Val Thr Lys Gly Gln His Ser Thr Asn Val Gly Ser Arg Thr Tyr
115 120 125
Leu Met Asp Gly Glu Asp Lys Tyr Gln Thr Phe Glu Leu Leu Gly Asn
130 135 140
Glu Phe Thr Phe Asp Val Asp Val Ser Asn Ile Gly Cys Gly Leu Asn
145 150 155 160
Gly Ala Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Leu Ser Arg
n 165 170 175
Tyr Pro Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp
180 185 190
Ala Gln Cys Pro Arg Asp Ile Lys Phe Ile Asn Gly Glu Ala Asn Ile
195 200 205
Glu Gly Trp Thr Gly Ser Thr Asn Asp Pro Asn Ala Gly Ala Gly Arg
210 215 220
Tyr Gly Thr Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Asn Met
225 230 235 240
Ala Thr Ala Phe Thr Pro His Pro Cys Thr Ile Ile Gly Gln Ser Arg
245 250 255
Cys Glu Gly Asp Ser Cys Gly Gly Thr Tyr Ser Asn Glu Arg Tyr Ala
260 265 270
Gly Val Cys Asp Pro Asp Gly Cys Asp Phe Asn Ser Tyr Arg Gln Gly
275 280 285
Asn Lys Thr Phe Tyr Gly Lys Gly Met Thr Val Asp Thr Thr Lys Lys
290 295 300
Ile Thr Val Val Thr Gln Phe Leu Lys Asp Ala Asn Gly Asp Leu Gly
305 310 315 320
Glu Ile Lys Arg Phe Tyr Val Gln Asp Gly Lys Ile Ile Pro Asn Ser
325 330 335
Glu Ser Thr Ile Pro Gly Val Glu Gly Asn Ser Ile Thr Gln Asp Trp
340 345 350
Cys Asp Arg Gln Lys Val Ala Phe Gly Asp Ile Asp Asp Phe Asn Arg
355 360 365
Lys Gly Gly Met Lys Gln Met Gly Lys Ala Leu Ala Gly Pro Met Val
370 375 380
Leu Val Met Ser Ile Trp Asp Asp His Ala Ser Asn Met Leu Trp Leu
385 390 395 400
Asp Ser Thr Phe Pro Val Asp Ala Ala Gly Lys Pro Gly Ala Glu Arg
405 410 415
Gly Ala Cys Pro Thr Thr Ser Gly Val Pro Ala Glu Val Glu Ala Glu
420 425 430
Ala Pro Asn Ser Asn Val Val Phe Ser Asn Ile Arg Phe Gly Pro Ile
435 440 445
Gly Ser Thr Val Ala Gly Leu Pro Gly Ala Gly Asn Gly Gly Asn Asn
450 455 460
Gly Gly Asn Pro Pro Pro Pro Thr Thr Thr Thr Ser Ser Ala Pro Ala
465 470 475 480
Thr Thr Thr Thr Ala Ser Ala Gly Pro Lys Ala Gly Arg Trp Gln Gln
485 490 495
Cys Gly Gly Ile Gly Phe Thr Gly Pro Thr Gln Cys Glu Glu Pro Tyr
500 505 510
lle Cys Thr Lys Leu Asn Asp Trp Tyr Ser Gln Cys Leu
515 520 525
<210>39
<211>1812
<212>DNA
<213>嗜热毁丝霉(Myceliophthora thermophila)
<400>39
atggccaaga agcttttcat caccgccgcc cttgcggctg ccgtgttggc ggcccccgtc 60
attgaggagc gccagaactg cggcgctgtg tggtaagaaa gcccggtctg agtttcccat120
gactttctca tcgagtaatg gcataaggcc caccccttcg actgactgtg agaatcgatc180
aaatccagga ctcaatgcgg cggcaacggg tggcagggtc ccacatgctg cgcctcgggc240
tcgacctgcg ttgcgcagaa cgagtggtac tctcagtgcc tgcccaacaa tcaggtgacg300
agttccaaca ctccgtcgtc gacttccacc tcgcagcgca gcagcagcac ctccagcagc360
agcaccagga gcggcagctc ctcctcctcc accaccacgc cccctcccgt ctccagcccc420
gtgactagca ttcccggcgg tgcgaccacc acggcgagct actctggcaa ccccttctcg480
ggcgtccggc tcttcgccaa cgactactac aggtccgagg tccacaatct cgccattcct540
agcatgaccg gtactctggc ggccaaggct tccgccgtcg ccgaagtccc tagcttccag600
tggctcgacc ggaacgtcac catcgacacc ctgatggtcc agactctgtc ccagatccgg660
gctgccaata atgccggtgc caatcctccc tatgctggtg agttacatgg cggcgacttg720
ccttctcgtc ccccaccttt cttgacggga tcggttacct gacctggagg caaaacaaaa780
ccagcccaac ttgtcgtcta cgacctcccc gaccgtgact gcgccgccgc tgcgtccaac840
ggcgagtttt cgattgcaaa cggcggcgcc gccaactaca ggagctacat cgacgctatc900
cgcaagcaca tcattgagta ctcggacatc cggatcatcc tggttatcga gcccgactcg960
atggccaaca tggtgaccaa catgaacgtg gccaagtgca gcaacgccgc gtcgacgtac1020
cacgagttga ccgtgtacgc gctcaagcag ctgaacctgc ccaacgtcgc catgtatctc1080
gacgccggcc acgccggctg gctcggctgg cccgccaaca tccagcccgc cgccgacctg1140
tttgccggca tctacaatga cgccggcaag ccggctgccg tccgcggcct ggccactaac1200
gtcgccaact acaacgcctg gagtatcgct tcggccccgt cgtacacgtc ccctaaccct1260
aactacgacg agaagcacta catcgaggcc ttcagcccgc tcctgaacgc ggccggcttc1320
cccgcacgct tcattgtcga cactggccgc aacggcaaac aacctaccgg tatggttttt1380
ttcttttttt ttctctgttc ccctccccct tccccttcag ttggcgtcca caaggtctct1440
tagtcttgct tcttctcgga ccaaccttcc cccaccccca aaacgcaccg cccacaaccg1500
ttcgactcta tactcttggg aatgggcgcc gaaactgacc gttcgacagg ccaacaacag1560
tggggtgact ggtgcaatgt caagggcact ggctttggcg tgcgcccgac ggccaacacg1620
ggccacgacc tggtcgatgc ctttgtctgg gtcaagcccg gcggcgagtc cgacggcaca1680
agcgacacca gcgccgcccg ctacgactac cactgcggcc tgtccgatgc cctgcagcct1740
gctccggagg ctggacagtg gttccaggcc tacttcgagc agctgctcac caacgccaac1800
ccgcccttct aa 1812
<210>40
<211>482
<212>PRT
<213>嗜热毁丝霉(Myceliophthora thermophila)
<400>40
Met Ala Lys Lys Leu Phe Ile Thr Ala Ala Leu Ala Ala Ala Val Leu
1 5 10 15
Ala Ala Pro Val Ile Glu Glu Arg Gln Asn Cys Gly Ala Val Trp Thr
20 25 30
Gln Cys Gly Gly Asn Gly Trp Gln Gly Pro Thr Cys Cys Ala Ser Gly
35 40 45
Ser Thr Cys Val Ala Gln Asn Glu Trp Tyr Ser Gln Cys Leu Pro Asn
50 55 60
Asn Gln Val Thr Ser Ser Asn Thr Pro Ser Ser Thr Ser Thr Ser Gln
65 70 75 80
Arg Ser Ser Ser Thr Ser Ser Ser Ser Thr Arg Ser Gly Ser Ser Ser
85 90 95
Ser Ser Thr Thr Thr Pro Pro Pro Val Ser Ser Pro Val Thr Ser Ile
100 105 110
Pro Gly Gly Ala Thr Thr Thr Ala Ser Tyr Ser Gly Asn Pro Phe Ser
115 120 125
Gly Val Arg Leu Phe Ala Asn Asp Tyr Tyr Arg Ser Glu Val His Asn
130 135 140
Leu Ala Ile Pro Ser Met Thr Gly Thr Leu Ala Ala Lys Ala Ser Ala
145 150 155 160
Val Ala Glu Val Pro Ser Phe Gln Trp Leu Asp Arg Asn Val Thr Ile
165 170 175
Asp Thr Leu Met Val Gln Thr Leu Ser Gln Ile Arg Ala Ala Asn Asn
180 185 190
Ala Gly Ala Asn Pro Pro Tyr Ala Ala Gln Leu Val Val Tyr Asp Leu
195 200 205
Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser Asn Gly Glu Phe Ser Ile
210 215 220
Ala Asn Gly Gly Ala Ala Asn Tyr Arg Ser Tyr Ile Asp Ala Ile Arg
225 230 235 240
Lys His Ile Ile Glu Tyr Ser Asp Ile Arg Ile Ile Leu Val Ile Glu
245 250 255
Pro Asp Ser Met Ala Asn Met Val Thr Asn Met Asn Val Ala Lys Cys
260 265 270
Ser Asn Ala Ala Ser Thr Tyr His Glu Leu Thr Val Tyr Ala Leu Lys
275 280 285
Gln Leu Asn Leu Pro Asn Val Ala Met Tyr Leu Asp Ala Gly His Ala
290 295 300
Gly Trp Leu Gly Trp Pro Ala Asn Ile Gln Pro Ala Ala Asp Leu Phe
305 310 315 320
Ala Gly Ile Tyr Asn Asp Ala Gly Lys Pro Ala Ala Val Arg Gly Leu
325 330 335
Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp Ser Ile Ala Ser Ala Pro
340 345 350
Ser Tyr Thr Ser Pro Asn Pro Asn Tyr Asp Glu Lys His Tyr Ile Glu
355 360 365
Ala Phe Ser Pro Leu Leu Asn Ala Ala Gly Phe Pro Ala Arg Phe Ile
370 375 380
Val Asp Thr Gly Arg Asn Gly Lys Gln Pro Thr Gly Gln Gln Gln Trp
385 390 395 400
Gly Asp Trp Cys Asn Val Lys Gly Thr Gly Phe Gly Val Arg Pro Thr
405 410 415
Ala Asn Thr Gly His Asp Leu Val Asp Ala Phe Val Trp Val Lys Pro
420 425 430
Gly Gly Glu Ser Asp Gly Thr Ser Asp Thr Ser Ala Ala Arg Tyr Asp
435 440 445
Tyr His Cys Gly Leu Ser Asp Ala Leu Gln Pro Ala Pro Glu Ala Gly
450 455 460
Gln Trp Phe Gln Ala Tyr Phe Glu Gln Leu Leu Thr Asn Ala Asn Pro
465 470 475 480
Pro Phe
<210>41
<211>1802
<212>DNA
<213>嗜热毁丝霉(Myceliophthora thermophila)
<400>41
atggccaaga agcttttcat caccgccgcg cttgcggctg ccgtgttggc ggcccccgtc 60
attgaggagc gccagaactg cggcgctgtg tggtaagaaa gcccggtccg agtctcccat120
gattttctcg tcgagtaatg gcataagggc caccccttcg actgaccgtg agaatcgatc180
aaatccagga ctcaatgcgg cggtaacggg tggcaaggtc ccacatgctg cgcctcgggc240
tcgacctgcg ttgcgcagaa cgagtggtac tctcagtgcc tgcccaacag ccaggtgacg300
agttccacca ctccgtcgtc gacttccacc tcgcagcgca gcaccagcac ctccagcagc360
accaccagga gcggcagctc ctcctcctcc tccaccacgc ccccgcccgt ctccagcccc420
gtgaccagca ttcccggcgg tgcgacctcc acggcgagct actctggcaa ccccttctcg480
ggcgtccggc tcttcgccaa cgactactac aggtccgagg tccacaatct cgccattcct540
agcatgactg gtactctggc ggccaaggct tccgccgtcg ccgaagtccc tagcttccag600
tggctcgacc ggaacgtcac catcgacacc ctgatggtcc agactctgtc ccaggtccgg660
gctctcaata aggccggtgc caatcctccc tatgctggtg agttacatgg cgacttgcct720
tctcgtcccc tacctttctt gacgggatcg gttacctgac ctggaggcaa aacaacaaca780
gcccaactcg tcgtctacga cctccccgac cgtgactgtg ccgccgctgc gtccaacggc840
gagttttcga ttgcaaacgg cggcgccgcc aactacagga gctacatcga cgctatccgc900
aagcacatca ttgagtactc ggacatccgg atcatcctgg ttatcgagcc cgactcgatg960
gccaacatgg tgaccaacat gaacgtggcc aagtgcagca acgccgcgtc gacgtaccac1020
gagttgaccg tgtacgcgct caagcagctg aacctgccca acgtcgccat gtatctcgac1080
gccggccacg ccggctggct cggctggccc gccaacatcc agcccgccgc cgagctgttt1140
gccggcatct acaatgatgc cggcaagccg gctgccgtcc gcggcctggc cactaacgtc1200
gccaactaca acgcctggag catcgcttcg gccccgtcgt acacgtcgcc taaccctaac1260
tacgacgaga agcactacat cgaggccttc agcccgctct tgaactcggc cggcttcccc1320
gcacgcttca ttgtcgacac tggccgcaac ggcaaacaac ctaccggtat gttttttttt1380
cttttgtctc tgtccccccc ttttctcccc cttcagttgg cgtccacaag gtctcttagt1440
cctgcttcat ctgtgaccaa cctccccccc cccggcaccg cccacaaccg tttgactcta1500
tactcttggg aatgggcgcc gaaactgacc gttccacagg ccaacaacag tggggtgact1560
ggtgcaatgt caagggcacc ggctttggcg tgcgcccgac ggccaacacg ggccacgagc1620
tggtcgatgc ctttgtctgg gtcaagcccg gcggcgagtc cgacggcaca agcgacacca1680
gcgccgcccg ctacgactac cactgcggcc tgtccgatgc cctgcagcct gcccccgagg1740
ctggacagtg gttccaggcc tacttcgagc agctgctcac caacgccaac ccgcccttct1800
aa 1802
<210>42
<211>481
<212>PRT
<213>嗜热毁丝霉(Myceliophthora thermophila)
<400>42
Met Ala Lys Lys Leu Phe Ile Thr Ala Ala Leu Ala Ala Ala Val Leu
1 5 10 15
Ala Ala Pro Val Ile Glu Glu Arg Gln Asn Cys Gly Ala Val Trp Thr
20 25 30
Gln Cys Gly Gly Asn Gly Trp Gln Gly Pro Thr Cys Cys Ala Ser Gly
35 40 45
Ser Thr Cys Val Ala Gln Asn Glu Trp Tyr Ser Gln Cys Leu Pro Asn
50 55 60
Ser Gln Val Thr Ser Ser Thr Thr Pro Ser Ser Thr Ser Thr Ser Gln
65 70 75 80
Arg Ser Thr Ser Thr Ser Ser Ser Thr Thr Arg Ser Gly Ser Ser Ser
85 90 95
Ser Ser Ser Thr Thr Pro Pro Pro Val Ser Ser Pro Val Thr Ser Ile
100 105 110
Pro Gly Gly Ala Thr Ser Thr Ala Ser Tyr Ser Gly Asn Pro Phe Ser
115 120 125
Gly Val Arg Leu Phe Ala Asn Asp Tyr Tyr Arg Ser Glu Val His Asn
130 135 140
Leu Ala Ile Pro Ser Met Thr Gly Thr Leu Ala Ala Lys Ala Ser Ala
145 150 155 160
Val Ala Glu Val Pro Ser Phe Gln Trp Leu Asp Arg Asn Val Thr Ile
165 170 175
Asp Thr Leu Met Val Gln Thr Leu Ser Gln Val Arg Ala Leu Asn Lys
180 185 190
Ala Gly Ala Asn Pro Pro Tyr Ala Ala Gln Leu Val Val Tyr Asp Leu
195 200 205
Pro Asp Arg Asp Cys Ala Ala Ala Ala Ser Asn Gly Glu Phe Ser Ile
210 215 220
Ala Asn Gly Gly Ala Ala Asn Tyr Arg Ser Tyr Ile Asp Ala Ile Arg
225 230 235 240
Lys His Ile Ile Glu Tyr Ser Asp Ile Arg Ile Ile Leu Val Ile Glu
245 250 255
Pro Asp Ser Met Ala Asn Met Val Thr Asn Met Asn Val Ala Lys Cys
260 265 270
Ser Asn Ala Ala Ser Thr Tyr His Glu Leu Thr Val Tyr Ala Leu Lys
275 280 285
Gln Leu Asn Leu Pro Asn Val Ala Met Tyr Leu Asp Ala Gly His Ala
290 295 300
Gly Trp Leu Gly Trp Pro Ala Asn Ile Gln Pro Ala Ala Glu Leu Phe
305 310 315 320
Ala Gly Ile Tyr Asn Asp Ala Gly Lys Pro Ala Ala Val Arg Gly Leu
325 330 335
Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp Ser Ile Ala Ser Ala Pro
340 345 350
Ser Tyr Thr Ser Pro Asn Pro Asn Tyr Asp Glu Lys His Tyr Ile Glu
355 360 365
Ala Phe Ser Pro Leu Leu Asn Ser Ala Gly Phe Pro Ala Arg Phe Ile
370 375 380
Val Asp Thr Gly Arg Asn Gly Lys Gln Pro Thr Gly Gln Gln Gln Trp
385 390 395 400
Gly Asp Trp Cys Asn Val Lys Gly Thr Gly Phe Gly Val Arg Pro Thr
405 410 415
Ala Asn Thr Gly His Glu Leu Val Asp Ala Phe Val Trp Val Lys Pro
420 425 430
Gly Gly Glu Ser Asp Gly Thr Ser Asp Thr Ser Ala Ala Arg Tyr Asp
435 440 445
Tyr His Cys Gly Leu Ser Asp Ala Leu Gln Pro Ala Pro Glu Ala Gly
450 455 460
Gln Trp Phe Gln Ala Tyr Phe Glu Gln Leu Leu Thr Asn Ala Asn Pro
465 470 475 480
Pro
<210>43
<211>1446
<212>DNA
<213>土生梭孢霉(Thielavia terrestris)
<400>43
atggctcaga agctccttct cgccgccgcc cttgcggcca gcgccctcgc tgctcccgtc 60
gtcgaggagc gccagaactg cggttccgtc tggagccaat gcggcggcat tggctggtcc120
ggcgcgacct gctgcgcttc gggcaatacc tgcgttgagc tgaacccgta ctactcgcag180
tgcctgccca acagccaggt gactacctcg accagcaaga ccacctccac caccaccagg240
agcagcacca ccagccacag cagcggtccc accagcacga gcaccaccac caccagcagt300
cccgtggtca ctaccccgcc gagtacctcc atccccggcg gtgcctcgtc aacggccagc360
tggtccggca acccgttctc gggcgtgcag atgtgggcca acgactacta cgcctccgag420
gtctcgtcgc tggccatccc cagcatgacg ggcgccatgg ccaccaaggc ggccgaggtg480
gccaaggtgc ccagcttcca gtggcttgac cgcaacgtca ccatcgacac gctgttcgcc540
cacacgctgt cgcagatccg cgcggccaac cagaaaggcg ccaacccgcc ctacgcgggc600
atcttcgtgg tctacgacct tccggaccgc gactgcgccg ccgccgcgtc caacggcgag660
ttctccatcg cgaacaacgg ggcggccaac tacaagacgt acatcgacgc gatccggagc720
ctcgtcatcc agtactcaga catccgcatc atcttcgtca tcgagcccga ctcgctggcc780
aacatggtga ccaacctgaa cgtggccaag tgcgccaacg ccgagtcgac ctacaaggag840
ttgaccgtct acgcgctgca gcagctgaac ctgcccaacg tggccatgta cctggacgcc900
ggccacgccg gctggctcgg ctggcccgcc aacatccagc cggccgccaa cctcttcgcc960
gagatctaca cgagcgccgg caagccggcc gccgtgcgcg gcctcgccac caacgtggcc1020
aactacaacg gctggagcct ggccacgccg ccctcgtaca cccagggcga ccccaactac1080
gacgagagcc actacgtcca ggccctcgcc ccgctgctca ccgccaacgg cttccccgcc1140
cacttcatca ccgacaccgg ccgcaacggc aagcagccga ccggacaacg gcaatgggga1200
gactggtgca acgttatcgg aactggcttc ggcgtgcgcc cgacgacaaa caccggcctc1260
gacatcgagg acgccttcgt ctgggtcaag cccggcggcg agtgcgacgg cacgagcaac1320
acgacctctc cccgctacga ctaccactgc ggcctgtcgg acgcgctgca gcctgctccg1380
gaggccggca cttggttcca ggcctacttc gagcagctcc tgaccaacgc caacccgccc1440
ttttaa 1446
<210>44
<211>481
<212>PRT
<213>土生梭孢霉(Thielavia terrestris)
<400>44
Met Ala Gln Lys Leu Leu Leu Ala Ala Ala Leu Ala Ala Ser Ala Leu
1 5 10 15
Ala Ala Pro Val Val Glu Glu Arg Gln Asn Cys Gly Ser Val Trp Ser
20 25 30
Gln Cys Gly Gly Ile Gly Trp Ser Gly Ala Thr Cys Cys Ala Ser Gly
35 40 45
Asn Thr Cys Val Glu Leu Asn Pro Tyr Tyr Ser Gln Cys Leu Pro Asn
50 55 60
Ser Gln Val Thr Thr Ser Thr Ser Lys Thr Thr Ser Thr Thr Thr Arg
65 70 75 80
Ser Ser Thr Thr Ser His Ser Ser Gly Pro Thr Ser Thr Ser Thr Thr
85 90 95
Thr Thr Ser Ser Pro Val Val Thr Thr Pro Pro Ser Thr Ser Ile Pro
100 105 110
Gly Gly Ala Ser Ser Thr Ala Ser Trp Ser Gly Asn Pro Phe Ser Gly
115 120 125
Val Gln Met Trp Ala Asn Asp Tyr Tyr Ala Ser Glu Val Ser Ser Leu
130 135 140
Ala Ile Pro Ser Met Thr Gly Ala Met Ala Thr Lys Ala Ala Glu Val
145 150 155 160
Ala Lys Val Pro Ser Phe Gln Trp Leu Asp Arg Asn Val Thr Ile Asp
165 170 175
Thr Leu Phe Ala His Thr Leu Ser Gln Ile Arg Ala Ala Asn Gln Lys
180 185 190
Gly Ala Asn Pro Pro Tyr Ala Gly Ile Phe Val Val Tyr Asp Leu Pro
195 200 205
Asp Arg Asp Cys Ala Ala Ala Ala Ser Asn Gly Glu Phe Ser Ile Ala
210 215 220
Asn Asn Gly Ala Ala Asn Tyr Lys Thr Tyr Ile Asp Ala Ile Arg Ser
225 230 235 240
Leu Val Ile Gln Tyr Ser Asp Ile Arg Ile Ile Phe Val Ile Glu Pro
245 250 255
Asp Ser Leu Ala Asn Met Val Thr Asn Leu Asn Val Ala Lys Cys Ala
260 265 270
Asn Ala Glu Ser Thr Tyr Lys Glu Leu Thr Val Tyr Ala Leu Gln Gln
275 280 285
Leu Asn Leu Pro Asn Val Ala Met Tyr Leu Asp Ala Gly His Ala Gly
290 295 300
Trp Leu Gly Trp Pro Ala Asn Ile Gln Pro Ala Ala Asn Leu Phe Ala
305 310 315 320
Glu Ile Tyr Thr Ser Ala Gly Lys Pro Ala Ala Val Arg Gly Leu Ala
325 330 335
Thr Asn Val Ala Asn Tyr Asn Gly Trp Ser Leu Ala Thr Pro Pro Ser
340 345 350
Tyr Thr Gln Gly Asp Pro Asn Tyr Asp Glu Ser His Tyr Val Gln Ala
355 360 365
Leu Ala Pro Leu Leu Thr Ala Asn Gly Phe Pro Ala His Phe Ile Thr
370 375 380
Asp Thr Gly Arg Asn Gly Lys Gln Pro Thr Gly Gln Arg Gln Trp Gly
385 390 395 400
Asp Trp Cys Asn Val Ile Gly Thr Gly Phe Gly Val Arg Pro Thr Thr
405 410 415
Asn Thr Gly Leu Asp Ile Glu Asp Ala Phe Val Trp Val Lys Pro Gly
420 425 430
Gly Glu Cys Asp Gly Thr Ser Asn Thr Thr Ser Pro Arg Tyr Asp Tyr
435 440 445
His Cys Gly Leu Ser Asp Ala Leu Gln Pro Ala Pro Glu Ala Gly Thr
450 455 460
Trp Phe Gln Ala Tyr Phe Glu Gln Leu Leu Thr Asn Ala Asn Pro Pro
465 470 475 480
Phe
<210P45
<211>1593
<212>DNA
<213>嗜热毛壳菌(chaetomium thermophilum)
<400>45
atgatgtaca agaagttcgc cgctctcgcc gccctcgtgg ctggcgccgc cgcccagcag 60
gcttgctccc tcaccactga gacccacccc agactcactt ggaagcgctg cacctctggc120
ggcaactgct cgaccgtgaa cggcgccgtc accatcgatg ccaactggcg ctggactcac180
actgtttccg gctcgaccaa ctgctacacc ggcaacgagt gggatacctc catctgctct240
gatggcaaga gctgcgccca gacctgctgc gtcgacggcg ctgactactc ttcgacctat300
ggtatcacca ccagcggtga ctccctgaac ctcaagttcg tcaccaagca ccagcacggc360
accaatgtcg gctctcgtgt ctacctgatg gagaacgaca ccaagtacca gatgttcgag420
ctcctcggca acgagttcac cttcgatgtc gatgtctcta acctgggctg cggtctcaac480
ggcgccctct acttcgtctc catggacgct gatggtggta tgagcaagta ctctggcaac540
aaggctggcg ccaagtacgg taccggctac tgcgatgctc agtgcccgcg cgaccttaag600
ttcatcaacg gcgaggccaa cattgagaac tggacccctt cgaccaatga tgccaacgcc660
ggtttcggcc gctatggcag ctgctgctct gagatggata tctgggatgc caacaacatg720
gctactgcct tcactcctca cccttgcacc attatcggcc agagccgctg cgagggcaac780
agctgcggtg gcacctacag ctctgagcgc tatgctggtg tttgcgatcc tgatggctgc840
gacttcaacg cctaccgcca gggcgacaag accttctacg gcaagggcat gaccgtcgac900
accaccaaga agatgaccgt cgtcacccag ttccacaaga actcggctgg cgtcctcagc960
gagatcaagc gcttctacgt tcaggacggc aagatcattg ccaacgccga gtccaagatc1020
cccggcaacc ccggcaactc catcacccag gagtggtgcg atgcccagaa ggtcgccttc1080
ggtgacatcg atgacttcaa ccgcaagggc ggtatggctc agatgagcaa ggccctcgag1140
ggccctatgg tcctggtcat gtccgtctgg gatgaccact acgccaacat gctctggctc1200
gactcgacct accccattga caaggccggc acccccggcg ccgagcgcgg tgcttgcccg1260
accacctccg gtgtccctgc cgagattgag gcccaggtcc ccaacagcaa cgttatcttc1320
tccaacatcc gcttcggccc catcggctcg accgtccctg gcctcgacgg cagcaccccc1380
agcaacccga ccgccaccgt tgctcctccc acttctacca ccaccagcgt gagaagcagc1440
actactcaga tttccacccc gactagccag cccggcggct gcaccaccca gaagtggggc1500
cagtgcggtg gtatcggcta caccggctgc actaactgcg ttgctggcac tacctgcact1560
gagctcaacc cctggtacag ccagtgcctg taa 1593
<210>46
<211>530
<212>PRT
<213>嗜热毛壳菌(Chaetomium thermophilum)
<400>46
Met Met Tyr Lys Lys Phe Ala Ala Leu Ala Ala Leu Val Ala Gly Ala
1 5 10 15
Ala Ala Gln Gln Ala Cys Ser Leu Thr Thr Glu Thr His Pro Arg Leu
20 25 30
Thr Trp Lys Arg Cys Thr Ser Gly Gly Asn Cys Ser Thr Val Asn Gly
35 40 45
Ala Val Thr Ile Asp Ala Asn Trp Arg Trp Thr His Thr Val Ser Gly
50 55 60
Ser Thr Asn Cys Tyr Thr Gly Asn Glu Trp Asp Thr Ser Ile Cys Ser
65 70 75 80
Asp Gly Lys Ser Cys Ala Gln Thr Cys Cys Val Asp Gly Ala Asp Tyr
85 90 95
Ser Ser Thr Tyr Gly Ile Thr Thr Ser Gly Asp Ser Leu Asn Leu Lys
100 105 110
Phe Val Thr Lys His Gln His Gly Thr Asn Val Gly Ser Arg Val Tyr
115 120 125
Leu Met Glu Asn Asp Thr Lys Tyr Gln Met Phe Glu Leu Leu Gly Asn
130 135 140
Glu Phe Thr Phe Asp Val Asp Val Ser Asn Leu Gly Cys Gly Leu Asn
145 150 155 160
Gly Ala Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Met Ser Lys
165 170 175
Tyr Ser Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp
180 185 190
Ala Gln Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Glu Ala Asn Ile
195 200 205
Glu Asn Trp Thr Pro Ser Thr Asn Asp Ala Asn Ala Gly Phe Gly Arg
210 215 220
Tyr Gly Ser Cys Cys Ser Glu Met Asp Ile Trp Asp Ala Asn Asn Met
225 230 235 240
Ala Thr Ala Phe Thr Pro His Pro Cys Thr Ile Ile Gly Gln Ser Arg
245 250 255
Cys Glu Gly Asn Ser Cys Gly Gly Thr Tyr Ser Ser Glu Arg Tyr Ala
260 265 270
Gly Val Cys Asp Pro Asp Gly Cys Asp Phe Asn Ala Tyr Arg Gln Gly
275 280 285
Asp Lys Thr Phe Tyr Gly Lys Gly Met Thr Val Asp Thr Thr Lys Lys
290 295 300
Met Thr Val Val Thr Gln Phe His Lys Asn Ser Ala Gly Val Leu Ser
305 310 315 320
Glu Ile Lys Arg Phe Tyr Val Gln Asp Gly Lys Ile Ile Ala Asn Ala
325 330 335
Glu Ser Lys Ile Pro Gly Asn Pro Gly Asn Ser Ile Thr Gln Glu Trp
340 345 350
Cys Asp Ala Gln Lys Val Ala Phe Gly Asp Ile Asp Asp Phe Asn Arg
355 360 365
Lys Gly Gly Met Ala Gln Met Ser Lys Ala Leu Glu Gly Pro Met Val
370 375 380
Leu Val Met Ser Val Trp Asp Asp His Tyr Ala Asn Met Leu Trp Leu
385 390 395 400
Asp Ser Thr Tyr Pro Ile Asp Lys Ala Gly Thr Pro Gly Ala Glu Arg
405 410 415
Gly Ala Cys Pro Thr Thr Ser Gly Val Pro Ala Glu Ile Glu Ala Gln
420 425 430
Val Pro Asn Ser Asn Val Ile Phe Ser Asn Ile Arg Phe Gly Pro Ile
435 440 445
Gly Ser Thr Val Pro Gly Leu Asp Gly Ser Thr Pro Ser Asn Pro Thr
450 455 460
Ala Thr Val Ala Pro Pro Thr Ser Thr Thr Thr Ser Val Arg Ser Ser
465 470 475 480
Thr Thr Gln Ile Ser Thr Pro Thr Ser Gln Pro Gly Gly Cys Thr Thr
485 490 495
Gln Lys Trp Gly Gln Cys Gly Gly Ile Gly Tyr Thr Gly Cys Thr Asn
500 505 510
Cys Val Ala Gly Thr Thr Cys Thr Glu Leu Asn Pro Trp Tyr Ser Gln
515 520 525
Cys Leu
530
<210>47
<211>1434
<212>DNA
<213>嗜热毛壳菌(Chaetomium thermophilum)
<400>47
atggctaagc agctgctgct cactgccgct cttgcggcca cttcgctggc tgcccctctc 60
cttgaggagc gccagagctg ctcctccgtc tggggtcaat gcggtggcat caattacaac120
ggcccgacct gctgccagtc cggcagtgtt tgcacttacc tgaatgactg gtacagccag180
tgcattcccg gtcaggctca gcccggcacg actagcacca cggctcggac caccagcacc240
agcaccacca gcacttcgtc ggtccgcccg accacctcga atacccctgt gacgactgct300
cccccgacga ccaccatccc gggcggcgcc tcgagcacgg ccagctacaa cggcaacccg360
ttttcgggtg ttcaactttg ggccaacacc tactactcgt ccgaggtgca cactttggcc420
atccccagct tgtctcctga gctggctgcc aaggccgcca aggtcgctga ggttcccagc480
ttccagtggc tcgaccgcaa tgtgactgtt gacactctct tctccggcac tcttgccgaa540
atccgcgccg ccaaccagcg cggtgccaac ccgccttatg ccggcatttt cgtggtttat600
gacttaccag accgtgattg cgcggctgct gcttcgaacg gcgagtggtc tatcgccaac660
aatggtgcca acaactacaa gcgctacatc gaccggatcc gtgagctcct tatccagtac720
tccgatatcc gcactattct ggtcattgaa cctgattccc tggccaacat ggtcaccaac780
atgaacgtcc agaagtgctc gaacgctgcc tccacttaca aggagcttac tgtctatgcc840
ctcaaacagc tcaatcttcc tcacgttgcc atgtacatgg atgctggcca cgctggctgg900
cttggctggc ccgccaacat ccagcctgct gctgagctct ttgctcaaat ctaccgcgac960
gctggcaggc ccgctgctgt ccgcggtctt gcgaccaacg ttgccaacta caatgcttgg1020
tcgatcgcca gccctccgtc ctacacctct cctaacccga actacgacga gaagcactat1080
attgaggcct ttgctcctct tctccgcaac cagggcttcg acgcaaagtt catcgtcgac1140
accggccgta acggcaagca gcccactggc cagcttgaat ggggtcactg gtgcaatgtc1200
aagggaactg gcttcggtgt gcgccctact gctaacactg ggcatgaact tgttgatgct1260
ttcgtgtggg tcaagcccgg tggcgagtcc gacggcacca gtgcggacac cagcgctgct1320
cgttatgact atcactgcgg cctttccgac gcactgactc cggcgcctga ggctggccaa1380
tggttccagg cttatttcga acagctgctc atcaatgcca accctccgct ctga 1434
<210>48
<211>477
<212>PRT
<213>嗜热毛壳菌(chaetomium thermophilum)
<400>48
Met Ala Lys Gln Leu Leu Leu Thr Ala Ala Leu Ala Ala Thr Ser Leu
1 5 10 15
Ala Ala Pro Leu Leu Glu Glu Arg Gln Ser Cys Ser Ser Val Trp Gly
20 25 30
Gln Cys Gly Gly Ile Asn Tyr Asn Gly Pro Thr Cys Cys Gln Ser Gly
35 40 45
Ser Val Cys Thr Tyr Leu Asn Asp Trp Tyr Ser Gln Cys Ile Pro Gly
50 55 60
Gln Ala Gln Pro Gly Thr Thr Ser Thr Thr Ala Arg Thr Thr Ser Thr
65 70 75 80
Ser Thr Thr Ser Thr Ser Ser Val Arg Pro Thr Thr Ser Asn Thr Pro
85 90 95
Val Thr Thr Ala Pro Pro Thr Thr Thr Ile Pro Gly Gly Ala Ser Ser
100 105 110
Thr Ala Ser Tyr Asn Gly Asn Pro Phe Ser Gly Val Gln Leu Trp Ala
115 120 125
Asn Thr Tyr Tyr Ser Ser Glu Val His Thr Leu Ala Ile Pro Ser Leu
130 135 140
Ser Pro Glu Leu Ala Ala Lys Ala Ala Lys Val Ala Glu Val Pro Ser
145 150 155 160
Phe Gln Trp Leu Asp Arg Asn Val Thr Val Asp Thr Leu Phe Ser Gly
165 170 175
Thr Leu Ala Glu Ile Arg Ala Ala Asn Gln Arg Gly Ala Asn Pro Pro
180 185 190
Tyr Ala Gly Ile Phe Val Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala
195 200 205
Ala Ala Ala Ser Asn Gly Glu Trp Ser Ile Ala Asn Asn Gly Ala Asn
210 215 220
Asn Tyr Lys Arg Tyr Ile Asp Arg Ile Arg Glu Leu Leu Ile Gln Tyr
225 230 235 240
Ser Asp Ile Arg Thr Ile Leu Val Ile Glu Pro Asp Ser Leu Ala Asn
245 250 255
Met Val Thr Asn Met Asn Val Gln Lys Cys Ser Asn Ala Ala Ser Thr
260 265 270
Tyr Lys Glu Leu Thr Val Tyr Ala Leu Lys Gln Leu Asn Leu Pro His
275 280 285
Val Ala Met Tyr Met Asp Ala Gly His Ala Gly Trp Leu Gly Trp Pro
290 295 300
Ala Asn Ile Gln Pro Ala Ala Glu Leu Phe Ala Gln Ile Tyr Arg Asp
305 310 315 320
Ala Gly Arg Pro Ala Ala Val Arg Gly Leu Ala Thr Asn Val Ala Asn
325 330 335
Tyr Asn Ala Trp Ser Ile Ala Ser Pro Pro Ser Tyr Thr Ser Pro Asn
340 345 350
Pro Asn Tyr Asp Glu Lys His Tyr Ile Glu Ala Phe Ala Pro Leu Leu
355 360 365
Arg Asn Gln Gly Phe Asp Ala Lys Phe Ile Val Asp Thr Gly Arg Asn
370 375 380
Gly Lys Gln Pro Thr Gly Gln Leu Glu Trp Gly His Trp Cys Asn Val
385 390 395 400
Lys Gly Thr Gly Phe Gly Val Arg Pro Thr Ala Asn Thr Gly His Glu
405 410 415
Leu Val Asp Ala Phe Val Trp Val Lys Pro Gly Gly Glu Ser Asp Gly
420 425 430
Thr Ser Ala Asp Thr Ser Ala Ala Arg Tyr Asp Tyr His Cys Gly Leu
435 440 445
Ser Asp Ala Leu Thr Pro Ala Pro Glu Ala Gly Gln Trp Phe Gln Ala
450 455 460
Tyr Phe Glu Gln Leu Leu Ile Asn Ala Asn Pro Pro Leu
465 470 475
<210>49
<211>1599
<212>DNA
<213>烟曲霉(Aspergillus fumigatus)
<400>49
atgctggcct ccaccttctc ctaccgcatg tacaagaccg cgctcatcct ggccgccctt 60
ctgggctctg gccaggctca gcaggtcggt acttcccagg cggaagtgca tccgtccatg120
acctggcaga gctgcacggc tggcggcagc tgcaccacca acaacggcaa ggtggtcatc180
gacgcgaact ggcgttgggt gcacaaagtc ggcgactaca ccaactgcta caccggcaac240
acctgggaca cgactatctg ccctgacgat gcgacctgcg catccaactg cgcccttgag300
ggtgccaact acgaatccac ctatggtgtg accgccagcg gcaattccct ccgcctcaac360
ttcgtcacca ccagccagca gaagaacatt ggctcgcgtc tgtacatgat gaaggacgac420
tcgacctacg agatgtttaa gctgctgaac caggagttca ccttcgatgt cgatgtctcc480
aacctcccct gcggtctcaa cggtgctctg tactttgtcg ccatggacgc cgacggtggc540
atgtccaagt acccaaccaa caaggccggt gccaagtacg gtactggata ctgtgactcg600
cagtgccctc gcgacctcaa gttcatcaac ggtcaggcca acgtcgaagg gtggcagccc660
tcctccaacg atgccaatgc gggtaccggc aaccacgggt cctgctgcgc ggagatggat720
atctgggagg ccaacagcat ctccacggcc ttcacccccc atccgtgcga cacgcccggc780
caggtgatgt gcaccggtga tgcctgcggt ggcacctaca gctccgaccg ctacggcggc840
acctgcgacc ccgacggatg tgatttcaac tccttccgcc agggcaacaa gaccttctac900
ggccctggca tgaccgtcga caccaagagc aagtttaccg tcgtcaccca gttcatcacc960
gacgacggca cctccagcgg caccctcaag gagatcaagc gcttctacgt gcagaacggc1020
aaggtgatcc ccaactcgga gtcgacctgg accggcgtca gcggcaactc catcaccacc1080
gagtactgca ccgcccagaa gagcctgttc caggaccaga acgtcttcga aaagcacggc1140
ggcctcgagg gcatgggtgc tgccctcgcc cagggtatgg ttctcgtcat gtccctgtgg1200
gatgatcact cggccaacat gctctggctc gacagcaact acccgaccac tgcctcttcc1260
accactcccg gcgtcgcccg tggtacctgc gacatctcct ccggcgtccc tgcggatgtc1320
gaggcgaacc accccgacgc ctacgtcgtc tactccaaca tcaaggtcgg ccccatcggc1380
tcgaccttca acagcggtgg ctcgaacccc ggtggcggaa ccaccacgac aactaccacc1440
cagcctacta ccaccacgac cacggctgga aaccctggcg gcaccggagt cgcacagcac1500
tatggccagt gtggtggaat cggatggacc ggacccacaa cctgtgccag cccttatacc1560
tgccagaagc tgaatgatta ttactctcag tgcctgtag 1599
<210>50
<211>532
<212>PRT
<213>烟曲霉(Aspergillus fumigatus)
<400>50
Met Leu Ala Ser Thr Phe Ser Tyr Arg Met Tyr Lys Thr Ala Leu Ile
1 5 10 15
Leu Ala Ala Leu Leu Gly Ser Gly Gln Ala Gln Gln Val Gly Thr Ser
20 25 30
Gln Ala Glu Val His Pro Ser Met Thr Trp Gln Ser Cys Thr Ala Gly
35 40 45
Gly Ser Cys Thr Thr Asn Asn Gly Lys Val Val Ile Asp Ala Asn Trp
50 55 60
Arg Trp Val His Lys Val Gly Asp Tyr Thr Asn Cys Tyr Thr Gly Asn
65 70 75 80
Thr Trp Asp Thr Thr Ile Cys Pro Asp Asp Ala Thr Cys Ala Ser Asn
85 90 95
Cys Ala Leu Glu Gly Ala Asn Tyr Glu Ser Thr Tyr Gly Val Thr Ala
100 105 110
Ser Gly Asn Ser Leu Arg Leu Asn Phe Val Thr Thr Ser Gln Gln Lys
115 120 125
Asn Ile Gly Ser Arg Leu Tyr Met Met Lys Asp Asp Ser Thr Tyr Glu
130 135 140
Met Phe Lys Leu Leu Asn Gln Glu Phe Thr Phe Asp Val Asp Val Ser
145 150 155 160
Asn Leu Pro Cys Gly Leu Asn Gly Ala Leu Tyr Phe Val Ala Met Asp
165 170 175
Ala Asp Gly Gly Met Ser Lys Tyr Pro Thr Asn Lys Ala Gly Ala Lys
180 185 190
Tyr Gly Thr Gly Tyr Cys Asp Ser Gln Cys Pro Arg Asp Leu Lys Phe
195 200 205
Ile Asn Gly Gln Ala Asn Val Glu Gly Trp Gln Pro Ser Ser Asn Asp
210 215 220
Ala Asn Ala Gly Thr Gly Asn His Gly Ser Cys Cys Ala Glu Met Asp
225 230 235 240
Ile Trp Glu Ala Asn Ser Ile Ser Thr Ala Phe Thr Pro His Pro Cys
245 250 255
Asp Thr Pro Gly Gln Val Met Cys Thr Gly Asp Ala Cys Gly Gly Thr
260 265 270
Tyr Ser Ser Asp Arg Tyr Gly Gly Thr Cys Asp Pro Asp Gly Cys Asp
275 280 285
Phe Asn Ser Phe Arg Gln Gly Asn Lys Thr Phe Tyr Gly Pro Gly Met
290 295 300
Thr Val Asp Thr Lys Ser Lys Phe Thr Val Val Thr Gln Phe Ile Thr
305 310 315 320
Asp Asp Gly Thr Ser Ser Gly Thr Leu Lys Glu Ile Lys Arg Phe Tyr
325 330 335
Val Gln Asn Gly Lys Val Ile Pro Asn Ser Glu Ser Thr Trp Thr Gly
340 345 350
Val Ser Gly Asn Ser Ile Thr Thr Glu Tyr Cys Thr Ala Gln Lys Ser
355 360 365
Leu Phe Gln Asp Gln Asn Val Phe Glu Lys His Gly Gly Leu Glu Gly
370 375 380
Met Gly Ala Ala Leu Ala Gln Gly Met Val Leu Val Met Ser Leu Trp
385 390 395 400
Asp Asp His Ser Ala Asn Met Leu Trp Leu Asp Ser Asn Tyr Pro Thr
405 410 415
Thr Ala Ser Ser Thr Thr Pro Gly Val Ala Arg Gly Thr Cys Asp Ile
420 425 430
Ser Ser Gly Val Pro Ala Asp Val Glu Ala Asn His Pro Asp Ala Tyr
435 440 445
Val Val Tyr Ser Asn Ile Lys Val Gly Pro Ile Gly Ser Thr Phe Asn
450 455 460
Ser Gly Gly Ser Asn Pro Gly Gly Gly Thr Thr Thr Thr Thr Thr Thr
465 470 475 480
Gln Pro Thr Thr Thr Thr Thr Thr Ala Gly Asn Pro Gly Gly Thr Gly
485 490 495
Val Ala Gln His Tyr Gly Gln Cys Gly Gly Ile Gly Trp Thr Gly Pro
500 505 510
Thr Thr Cys Ala Ser Pro Tyr Thr Cys Gln Lys Leu Asn Asp Tyr Tyr
515 520 525
Ser Gln Cys Leu
530
<210>51
<211>1713
<212>DNA
<213>烟曲霉(Aspergillus fumigatus)
<400>51
atgaagcacc ttgcatcttc catcgcattg actctactgt tgcctgccgt gcaggcccag 60
cagaccgtat ggggccaatg tatgttctgg ctgtcactgg aataagactg tatcaactgc120
tgatatgctt ctaggtggcg gccaaggctg gtctggcccg acgagctgtg ttgccggcgc180
agcctgtagc acactgaatc cctgtatgtt agatatcgtc ctgagtggag acttatactg240
acttccttag actacgctca gtgtatcccg ggagccaccg cgacgtccac caccctcacg300
acgacgacgg cggcgacgac gacatcccag accaccacca aacctaccac gactggtcca360
actacatccg cacccaccgt gaccgcatcc ggtaaccctt tcagcggcta ccagctgtat420
gccaacccct actactcctc cgaggtccat actctggcca tgccttctct gcccagctcg480
ctgcagccca aggctagtgc tgttgctgaa gtgccctcat ttgtttggct gtaagtggcc540
ttatcccaat actgagacca actctctgac agtcgtagcg acgttgccgc caaggtgccc600
actatgggaa cctacctggc cgacattcag gccaagaaca aggccggcgc caaccctcct660
atcgctggta tcttcgtggt ctacgacttg ccggaccgtg actgcgccgc tctggccagt720
aatggcgagt actcaattgc caacaacggt gtggccaact acaaggcgta cattgacgcc780
atccgtgctc agctggtgaa gtactctgac gttcacacca tcctcgtcat cggtaggccg840
tacacctccg ttgcgcgccg cctttctctg acatcttgca gaacccgaca gcttggccaa900
cctggtgacc aacctcaacg tcgccaaatg cgccaatgcg cagagcgcct acctggagtg960
tgtcgactat gctctgaagc agctcaacct gcccaacgtc gccatgtacc tcgacgcagg1020
tatgcctcac ttcccgcatt ctgtatccct tccagacact aactcatcag gccatgcggg1080
ctggctcgga tggcccgcca acttgggccc cgccgcaaca ctcttcgcca aagtctacac1140
cgacgcgggt tcccccgcgg ctgttcgtgg cctggccacc aacgtcgcca actacaacgc1200
ctggtcgctc agtacctgcc cctcctacac ccagggagac cccaactgcg acgagaagaa1260
gtacatcaac gccatggcgc ctcttctcaa ggaagccggc ttcgatgccc acttcatcat1320
ggatacctgt aagtgcttat tccaatcgcc gatgtgtgcc gactaatcaa tgtttcagcc1380
cggaatggcg tccagcccac gaagcaaaac gcctggggtg actggtgcaa cgtcatcggc1440
accggcttcg gtgttcgccc ctcgactaac accggcgatc cgctccagga tgcctttgtg1500
tggatcaagc ccggtggaga gagtgatggc acgtccaact cgacttcccc ccggtatgac1560
gcgcactgcg gatatagtga tgctctgcag cctgctcctg aggctggtac ttggttccag1620
gtatgtcatc cattagccag atgagggata agtgactgac ggacctaggc ctactttgag1680
cagcttctga ccaacgctaa cccgtccttt taa 1713
<210>52
<211>454
<212>PRT
<213>烟曲霉(Aspergillus fumigatus)
<400>52
Met Lys His Leu Ala Ser Ser Ile Ala Leu Thr Leu Leu Leu Pro Ala
1 5 10 15
Val Gln Ala Gln Gln Thr Val Trp Gly Gln Cys Gly Gly Gln Gly Trp
20 25 30
Ser Gly Pro Thr Ser Cys Val Ala Gly Ala Ala Cys Ser Thr Leu Asn
35 40 45
Pro Tyr Tyr Ala Gln Cys Ile Pro Gly Ala Thr Ala Thr Ser Thr Thr
50 55 60
Leu Thr Thr Thr Thr Ala Ala Thr Thr Thr Ser Gln Thr Thr Thr Lys
65 70 75 80
Pro Thr Thr Thr Gly Pro Thr Thr Ser Ala Pro Thr Val Thr Ala Ser
85 90 95
Gly Asn Pro Phe Ser Gly Tyr Gln Leu Tyr Ala Asn Pro Tyr Tyr Ser
100 105 110
Ser Glu Val His Thr Leu Ala Met Pro Ser Leu Pro Ser Ser Leu Gln
115 120 125
Pro Lys Ala Ser Ala Val Ala Glu Val Pro Ser Phe Val Trp Leu Asp
130 135 140
Val Ala Ala Lys Val Pro Thr Met Gly Thr Tyr Leu Ala Asp Ile Gln
145 150 155 160
Ala Lys Asn Lys Ala Gly Ala Asn Pro Pro Ile Ala Gly Ile Phe Val
165 170 175
Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Leu Ala Ser Asn Gly
180 185 190
Glu Tyr Ser Ile Ala Asn Asn Gly Val Ala Asn Tyr Lys Ala Tyr Ile
195 200 205
Asp Ala Ile Arg Ala Gln Leu Val Lys Tyr Ser Asp Val His Thr Ile
210 215 220
Leu Val Ile Glu Pro Asp Ser Leu Ala Asn Leu Val Thr Asn Leu Asn
225 230 235 240
Val Ala Lys Cys Ala Asn Ala Gln Ser Ala Tyr Leu Glu Cys Val Asp
245 250 255
Tyr Ala Leu Lys Gln Leu Asn Leu Pro Asn Val Ala Met Tyr Leu Asp
260 265 270
Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Leu Gly Pro Ala
275 280 285
Ala Thr Leu Phe Ala Lys Val Tyr Thr Asp Ala Gly Ser Pro Ala Ala
290 295 300
Val Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp Ser Leu
305 310 315 320
Ser Thr Cys Pro Ser Tyr Thr Gln Gly Asp Pro Asn Cys Asp Glu Lys
325 330 335
Lys Tyr Ile Asn Ala Met Ala Pro Leu Leu Lys Glu Ala Gly Phe Asp
340 345 350
Ala His Phe Ile Met Asp Thr Ser Arg Asn Gly Val Gln Pro Thr Lys
355 360 365
Gln Asn Ala Trp Gly Asp Trp Cys Asn Val Ile Gly Thr Gly Phe Gly
370 375 380
Val Arg Pro Ser Thr Asn Thr Gly Asp Pro Leu Gln Asp Ala Phe Val
385 390 395 400
Trp Ile Lys Pro Gly Gly Glu Ser Asp Gly Thr Ser Asn Ser Thr Ser
405 410 415
Pro Arg Tyr Asp Ala His Cys Gly Tyr Ser Asp Ala Leu Gln Pro Ala
420 425 430
Pro Glu Ala Gly Thr Trp Phe Gln Ala Tyr Phe Glu Gln Leu Leu Thr
435 440 445
Asn Ala Asn Pro Ser Phe
450
<210>53
<211>2586
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>53
atgaagcttg gttggatcga ggtggccgca ttggcggctg cctcagtagt cagtgccaag 60
gatgatctcg cgtactcccc tcctttctac ccttccccat gggcagatgg tcagggtgaa120
tgggcggaag tatacaaacg cgctgtagac atagtttccc agatgacgtt gacagagaaa180
gtcaacttaa cgactggaac aggatggcaa ctagagaggt gtgttggaca aactggcagt240
gttcccagac tcaacatccc cagcttgtgt ttgcaggata gtcctcttgg tattcgtttc300
tcggactaca attcagcttt ccctgcgggt gttaatgtcg ctgccacctg ggacaagacg360
ctcgcctacc ttcgtggtca ggcaatgggt gaggagttca gtgataaggg tattgacgtt420
cagctgggtc ctgctgctgg ccctctcggt gctcatccgg atggcggtag aaactgggaa480
ggtttctcac cagatccagc cctcaccggt gtactttttg cggagacgat taagggtatt540
caagatgctg gtgtcattgc gacagctaag cattatatca tgaacgaaca agagcatttc600
cgccaacaac ccgaggctgc gggttacgga ttcaacgtaa gcgacagttt gagttccaac660
gttgatgaca agactatgca tgaattgtac ctctggccct tcgcggatgc agtacgcgct720
ggagtcggtg ctgtcatgtg ctcttacaac caaatcaaca acagctacgg ttgcgagaat780
agcgaaactc tgaacaagct tttgaaggcg gagcttggtt tccaaggctt cgtcatgagt840
gattggaccg ctcatcacag cggcgtaggc gctgctttag caggtctgga tatgtcgatg900
cccggtgatg ttaccttcga tagtggtacg tctttctggg gtgcaaactt gacggtcggt960
gtccttaacg gtacaatccc ccaatggcgt gttgatgaca tggctgtccg tatcatggcc1020
gcttattaca aggttggccg cgacaccaaa tacacccctc ccaacttcag ctcgtggacc1080
agggacgaat atggtttcgc gcataaccat gtttcggaag gtgcttacga gagggtcaac1140
gaattcgtgg acgtgcaacg cgatcatgcc gacctaatcc gtcgcatcgg cgcgcagagc1200
actgttctgc tgaagaacaa gggtgccttg cccttgagcc gcaaggaaaa gctggtcgcc1260
cttctgggag aggatgcggg ttccaactcg tggggcgcta acggctgtga tgaccgtggt1320
tgcgataacg gtacccttgc catggcctgg ggtagcggta ctgcgaattt cccatacctc1380
gtgacaccag agcaggcgat tcagaacgaa gttcttcagg gccgtggtaa tgtcttcgcc1440
gtgaccgaca gttgggcgct cgacaagatc gctgcggctg cccgccaggc cagcgtatct1500
ctcgtgttcg tcaactccga ctcaggagaa ggctatctta gtgtggatgg aaatgagggc1560
gatcgtaaca acatcactct gtggaagaac ggcgacaatg tggtcaagac cgcagcgaat1620
aactgtaaca acaccgttgt catcatccac tccgtcggac cagttttgat cgatgaatgg1680
tatgaccacc ccaatgtcac tggtattctc tgggctggtc tgccaggcca ggagtctggt1740
aactccattg ccgatgtgct gtacggtcgt gtcaaccctg gcgccaagtc tcctttcact1800
tggggcaaga cccgggagtc gtatggttct cccttggtca aggatgccaa caatggcaac1860
ggagcgcccc agtctgattt cacccagggt gttttcatcg attaccgcca tttcgataag1920
ttcaatgaga cccctatcta cgagtttggc tacggcttga gctacaccac cttcgagctc1980
tccgacctcc atgttcagcc cctgaacgcg tcccgataca ctcccaccag tggcatgact2040
gaagctgcaa agaactttgg tgaaattggc gatgcgtcgg agtacgtgta tccggagggg2100
ctggaaagga tccatgagtt tatctatccc tggatcaact ctaccgacct gaaggcatcg2160
tctgacgatt ctaactacgg ctgggaagac tccaagtata ttcccgaagg cgccacggat2220
gggtctgccc agccccgttt gcccgctagt ggtggtgccg gaggaaaccc cggtctgtac2280
gaggatcttt tccgcgtctc tgtgaaggtc aagaacacgg gcaatgtcgc cggtgatgaa2340
gttcctcagc tgtacgtttc cctaggcggc ccgaatgagc ccaaggtggt actgcgcaag2400
tttgagcgta ttcacttggc cccttcgcag gaggccgtgt ggacaacgac ccttacccgt2460
cgtgaccttg caaactggga cgtttcggct caggactgga ccgtcactcc ttaccccaag2520
acgatctacg ttggaaactc ctcacggaaa ctgccgctcc aggcctcgct gcctaaggcc2580
cagtaa 2586
<210>54
<211>861
<212>PRT
<213>米曲霉(Aspergillus oryzae)
<400>54
Met Lys Leu Gly Trp Ile Glu Val Ala Ala Leu Ala Ala Ala Ser Val
1 5 10 15
Val Ser Ala Lys Asp Asp Leu Ala Tyr Ser Pro Pro Phe Tyr Pro Ser
20 25 30
Pro Trp Ala Asp Gly Gln Gly Glu Trp Ala Glu Val Tyr Lys Arg Ala
35 40 45
Val Asp Ile Val Ser Gln Met Thr Leu Thr Glu Lys Val Asn Leu Thr
50 55 60
Thr Gly Thr Gly Trp Gln Leu Glu Arg Cys Val Gly Gln Thr Gly Ser
65 70 75 80
Val Pro Arg Leu Asn Ile Pro Ser Leu Cys Leu Gln Asp Ser Pro Leu
85 90 95
Gly Ile Arg Phe Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Val Asn
100 105 110
Val Ala Ala Thr Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Gln Ala
115 120 125
Met Gly Glu Glu Phe Ser Asp Lys Gly Ile Asp Val Gln Leu Gly Pro
130 135 140
Ala Ala Gly Pro Leu Gly Ala His Pro Asp Gly Gly Arg Asn Trp Glu
145 150 155 160
Gly Phe Ser Pro Asp Pro Ala Leu Thr Gly Val Leu Phe Ala Glu Thr
165 170 175
Ile Lys Gly Ile Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr
180 185 190
Ile Met Asn Glu Gln Glu His Phe Arg Gln Gln Pro Glu Ala Ala Gly
195 200 205
Tyr Gly Phe Asn Val Ser Asp Ser Leu Ser Ser Asn Val Asp Asp Lys
210 215 220
Thr Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala
225 230 235 240
Gly Val Gly Ala Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr
245 250 255
Gly Cys Glu Asn Ser Glu Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu
260 265 270
Gly Phe Gln Gly Phe Val Met Ser Asp Trp Thr Ala His His Ser Gly
275 280 285
Val Gly Ala Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Val
290 295 300
Thr Phe Asp Ser Gly Thr Ser Phe Trp Gly Ala Asn Leu Thr Val Gly
305 310 315 320
Val Leu Asn Gly Thr Ile Pro Gln Trp Arg Val Asp Asp Met Ala Val
325 330 335
Arg Ile Met Ala Ala Tyr Tyr Lys Val Gly Arg Asp Thr Lys Tyr Thr
340 345 350
Pro Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Phe Ala His
355 360 365
Asn His Val Ser Glu Gly Ala Tyr Glu Arg Val Asn Glu Phe Val Asp
370 375 380
Val Gln Arg Asp His Ala Asp Leu Ile Arg Arg Ile Gly Ala Gln Ser
385 390 395 400
Thr Val Leu Leu Lys Asn Lys Gly Ala Leu Pro Leu Ser Arg Lys Glu
405 410 415
Lys Leu Val Ala Leu Leu Gly Glu Asp Ala Gly Ser Asn Ser Trp Gly
420 425 430
Ala Asn Gly Cys Asp Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met
435 440 445
Ala Trp Gly Ser Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu
450 455 460
Gln Ala Ile Gln Asn Glu Val Leu Gln Gly Arg Gly Asn Val Phe Ala
465 470 475 480
Val Thr Asp Ser Trp Ala Leu Asp Lys Ile Ala Ala Ala Ala Arg Gln
485 490 495
Ala Ser Val Ser Leu Val Phe Val Asn Ser Asp Ser Gly Glu Gly Tyr
500 505 510
Leu Ser Val Asp Gly Asn Glu Gly Asp Arg Asn Asn Ile Thr Leu Trp
515 520 525
Lys Asn Gly Asp Asn Val Val Lys Thr Ala Ala Asn Asn Cys Asn Asn
530 535 540
Thr Val Val Ile Ile His Ser Val Gly Pro Val Leu Ile Asp Glu Trp
545 550 555 560
Tyr Asp His Pro Asn Val Thr Gly Ile Leu Trp Ala Gly Leu Pro Gly
565 570 575
Gln Glu Ser Gly Asn Ser Ile Ala Asp Val Leu Tyr Gly Arg Val Asn
580 585 590
Pro Gly Ala Lys Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr
595 600 605
Gly Ser Pro Leu Val Lys Asp Ala Asn Asn Gly Asn Gly Ala Pro Gln
610 615 620
Ser Asp Phe Thr Gln Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys
625 630 635 640
Phe Asn Glu Thr Pro Ile Tyr Glu Phe Gly Tyr Gly Leu Ser Tyr Thr
645 650 655
Thr Phe Glu Leu Ser Asp Leu His Val Gln Pro Leu Asn Ala Ser Arg
660 665 670
Tyr Thr Pro Thr Ser Gly Met Thr Glu Ala Ala Lys Asn Phe Gly Glu
675 680 685
Ile Gly Asp Ala Ser Glu Tyr Val Tyr Pro Glu Gly Leu Glu Arg Ile
690 695 700
His Glu Phe Ile Tyr Pro Trp Ile Asn Ser Thr Asp Leu Lys Ala Ser
705 710 715 720
Ser Asp Asp Ser Asn Tyr Gly Trp Glu Asp Ser Lys Tyr Ile Pro Glu
725 730 735
Gly Ala Thr Asp Gly Ser Ala Gln Pro Arg Leu Pro Ala Ser Gly Gly
740 745 750
Ala Gly Gly Asn Pro Gly Leu Tyr Glu Asp Leu Phe Arg Val Ser Val
755 760 765
Lys Val Lys Asn Thr Gly Asn Val Ala Gly Asp Glu Val Pro Gln Leu
770 775 780
Tyr Val Ser Leu Gly Gly Pro Asn Glu Pro Lys Val Val Leu Arg Lys
785 790 795 800
Phe Glu Arg Ile His Leu Ala Pro Ser Gln Glu Ala Val Trp Thr Thr
805 810 815
Thr Leu Thr Arg Arg Asp Leu Ala Asn Trp Asp Val Ser Ala Gln Asp
820 825 830
Trp Thr Val Thr Pro Tyr Pro Lys Thr Ile Tyr Val Gly Asn Ser Ser
835 840 845
Arg Lys Leu Pro Leu Gln Ala Ser Leu Pro Lys Ala Gln
850 855 860
<210>55
<211>3060
<212>DNA
<213>烟曲霉(Aspergillus fumigatus)
<400>55
atgagattcg gttggctcga ggtggccgct ctgacggccg cttctgtagc caatgcccag 60
gtttgtgatg ctttcccgtc attgtttcgg atatagttga caatagtcat ggaaataatc120
aggaattggc tttctctcca ccattctacc cttcgccttg ggctgatggc cagggagagt180
gggcagatgc ccatcgacgc gccgtcgaga tcgtttctca gatgacactg gcggagaagg240
ttaaccttac aacgggtact gggtgggttg cgactttttt gttgacagtg agctttcttc300
actgaccatc tacacagatg ggaaatggac cgatgcgtcg gtcaaaccgg cagcgttccc360
aggtaagctt gcaattctgc aacaacgtgc aagtgtagtt gctaaaacgc ggtggtgcag420
acttggtatc aactggggtc tttgtggcca ggattcccct ttgggtatcc gtttctgtga480
gctatacccg cggagtcttt cagtccttgt attatgtgct gatgattgtc tctgtatagc540
tgacctcaac tccgccttcc ctgctggtac taatgtcgcc gcgacatggg acaagacact600
cgcctacctt cgtggcaagg ccatgggtga ggaattcaac gacaagggcg tggacatttt660
gctggggcct gctgctggtc ctctcggcaa atacccggac ggcggcagaa tctgggaagg720
cttctctcct gatccggttc tcactggtgt acttttcgcc gaaactatca agggtatcca780
agacgcgggt gtgattgcta ctgccaagca ttacattctg aatgaacagg agcatttccg840
acaggttggc gaggcccagg gatatggtta caacatcacg gagacgatca gctccaacgt900
ggatgacaag accatgcacg agttgtacct ttggtgagta gttgacactg caaatgagga960
ccttgattga tttgactgac ctggaatgca ggccctttgc agatgctgtg cgcggtaaga1020
ttttccgtag acttgacctc gcgacgaaga aatcgctgac gaaccatcgt agctggcgtt1080
ggcgctgtca tgtgttccta caatcaaatc aacaacagct acggttgtca aaacagtcaa1140
actctcaaca agctcctcaa ggctgagctg ggcttccaag gcttcgtcat gagtgactgg1200
agcgctcacc acagcggtgt cggcgctgcc ctcgctgggt tggatatgtc gatgcctgga1260
gacatttcct tcgacgacgg actctccttc tggggcacga acctaactgt cagtgttctt1320
aacggcaccg ttccagcctg gcgtgtcgat gacatggctg ttcgtatcat gaccgcgtac1380
tacaaggttg gtcgtgaccg tcttcgtatt ccccctaact tcagctcctg gacccgggat1440
gagtacggct gggagcattc tgctgtctcc gagggagcct ggaccaaggt gaacgacttc1500
gtcaatgtgc agcgcagtca ctctcagatc atccgtgaga ttggtgccgc tagtacagtg1560
ctcttgaaga acacgggtgc tcttcctttg accggcaagg aggttaaagt gggtgttctc1620
ggtgaagacg ctggttccaa cccgtggggt gctaacggct gccccgaccg cggctgtgat1680
aacggcactc ttgctatggc ctggggtagt ggtactgcca acttccctta ccttgtcacc1740
cccgagcagg ctatccagcg agaggtcatc agcaacggcg gcaatgtctt tgctgtgact1800
gataacgggg ctctcagcca gatggcagat gttgcatctc aatccaggtg agtgcgggct1860
cttagaaaaa gaacgttctc tgaatgaagt tttttaacca ttgcgaacag cgtgtctttg1920
gtgtttgtca acgccgactc tggagagggt ttcatcagtg tcgacggcaa cgagggtgac1980
cgcaaaaatc tcactctgtg gaagaacggc gaggccgtca ttgacactgt tgtcagccac2040
tgcaacaaca cgattgtggt tattcacagt gttgggcccg tcttgatcga ccggtggtat2100
gataacccca acgtcactgc catcatctgg gccggcttgc ccggtcagga gagtggcaac2160
tccctggtcg acgtgctcta tggccgcgtc aaccccagcg ccaagacccc gttcacctgg2220
ggcaagactc gggagtctta cggggctccc ttgctcaccg agcctaacaa tggcaatggt2280
gctccccagg atgatttcaa cgagggcgtc ttcattgact accgtcactt tgacaagcgc2340
aatgagaccc ccatttatga gtttggccat ggcttgagct acaccacctt tggttactct2400
caccttcggg ttcaggccct caatagttcg agttcggcat atgtcccgac tagcggagag2460
accaagcctg cgccaaccta tggtgagatc ggtagtgccg ccgactacct gtatcccgag2520
ggtctcaaaa gaattaccaa gtttatttac ccttggctca actcgaccga cctcgaggat2580
tcttctgacg acccgaacta cggctgggag gactcggagt acattcccga aggcgctagg2640
gatgggtctc ctcaacccct cctgaaggct ggcggcgctc ctggtggtaa ccctaccctt2700
tatcaggatc ttgttagggt gtcggccacc ataaccaaca ctggtaacgt cgccggttat2760
gaagtccctc aattggtgag tgacccgcat gttccttgcg ttgcaatttg gctaactcgc2820
ttctagtatg tttcactggg cggaccgaac gagcctcggg tcgttctgcg caagttcgac2880
cgaatcttcc tggctcctgg ggagcaaaag gtttggacca cgactcttaa ccgtcgtgat2940
ctcgccaatt gggatgtgga ggctcaggac tgggtcatca caaagtaccc caagaaagtg3000
cacgtcggca gctcctcgcg taagctgcct ctgagagcgc ctctgccccg tgtctactag3060
<210>56
<211>863
<212>PRT
(213>烟曲霉(Aspergillus fumigatus)
<400>56
Met Arg Phe Gly Trp Leu Glu Val Ala Ala Leu Thr Ala Ala Ser Val
1 5 10 15
Ala Asn Ala Gln Glu Leu Ala Phe Ser Pro Pro Phe Tyr Pro Ser Pro
20 25 30
Trp Ala Asp Gly Gln Gly Glu Trp Ala Asp Ala His Arg Arg Ala Val
35 40 45
Glu Ile Val Ser Gln Met Thr Leu Ala Glu Lys Val Asn Leu Thr Thr
50 55 60
Gly Thr Gly Trp Glu Met Asp Arg Cys Val Gly Gln Thr Gly Ser Val
65 70 75 80
Pro Arg Leu Gly Ile Asn Trp Gly Leu Cys Gly Gln Asp Ser Pro Leu
85 90 95
Gly Ile Arg Phe Ser Asp Leu Asn Ser Ala Phe Pro Ala Gly Thr Asn
100 105 110
Val Ala Ala Thr Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Lys Ala
115 120 125
Met Gly Glu Glu Phe Asn Asp Lys Gly Val Asp Ile Leu Leu Gly Pro
130 135 140
Ala Ala Gly Pro Leu Gly Lys Tyr Pro Asp Gly Gly Arg Ile Trp Glu
145 150 155 160
Gly Phe Ser Pro Asp Pro Val Leu Thr Gly Val Leu Phe Ala Glu Thr
165 170 175
Ile Lys Gly Ile Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr
180 185 190
Ile Leu Asn Glu Gln Glu His Phe Arg Gln Val Gly Glu Ala Gln Gly
195 200 205
Tyr Gly Tyr Asn Ile Thr Glu Thr Ile Ser Ser Asn Val Asp Asp Lys
210 215 220
Thr Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala
225 230 235 240
Gly Val Gly Ala Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr
245 250 255
Gly Cys Gln Asn Ser Gln Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu
260 265 270
Gly Phe Gln Gly Phe Val Met Ser Asp Trp Ser Ala His His Ser Gly
275 280 285
Val Gly Ala Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Ile
290 295 300
Ser Phe Asp Asp Gly Leu Ser Phe Trp Gly Thr Asn Leu Thr Val Ser
305 310 315 320
Val Leu Asn Gly Thr Val Pro Ala Trp Arg Val Asp Asp Met Ala Val
325 330 335
Arg Ile Met Thr Ala Tyr Tyr Lys Val Gly Arg Asp Arg Leu Arg Ile
340 345 350
Pro Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Trp Glu His
355 360 365
Ser Ala Val Ser Glu Gly Ala Trp Thr Lys Val Asn Asp Phe Val Asn
370 375 380
Val Gln Arg Ser His Ser Gln Ile Ile Arg Glu Ile Gly Ala Ala Ser
385 390 395 400
Thr Val Leu Leu Lys Asn Thr Gly Ala Leu Pro Leu Thr Gly Lys Glu
405 410 415
Val Lys Val Gly Val Leu Gly Glu Asp Ala Gly Ser Asn Pro Trp Gly
420 425 430
Ala Asn Gly Cys Pro Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met
435 440 445
Ala Trp Gly Ser Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu
450 455 460
Gln Ala Ile Gln Arg Glu Val Ile Ser Asn Gly Gly Asn Val Phe Ala
465 470 475 480
Val Thr Asp Asn Gly Ala Leu Ser Gln Met Ala Asp Val Ala Ser Gln
485 490 495
Ser Ser Val Ser Leu Val Phe Val Asn Ala Asp Ser Gly Glu Gly Phe
500 505 510
Ile Ser Val Asp Gly Asn Glu Gly Asp Arg Lys Asn Leu Thr Leu Trp
515 520 525
Lys Asn Gly Glu Ala Val Ile Asp Thr Val Val Ser His Cys Asn Asn
530 535 540
Thr Ile Val Val Ile His Ser Val Gly Pro Val Leu Ile Asp Arg Trp
545 550 555 560
Tyr Asp Asn Pro Asn Val Thr Ala Ile Ile Trp Ala Gly Leu Pro Gly
565 570 575
Gln Glu Ser Gly Asn Ser Leu Val Asp Val Leu Tyr Gly Arg Val Asn
580 585 590
Pro Ser Ala Lys Thr Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr
595 600 605
Gly Ala Pro Leu Leu Thr Glu Pro Asn Asn Gly Asn Gly Ala Pro Gln
610 615 620
Asp Asp Phe Asn Glu Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys
625 630 635 640
Arg Asn Glu Thr Pro Ile Tyr Glu Phe Gly His Gly Leu Ser Tyr Thr
645 650 655
Thr Phe Gly Tyr Ser His Leu Arg Val Gln Ala Leu Asn Ser Ser Ser
660 665 670
Ser Ala Tyr Val Pro Thr Ser Gly Glu Thr Lys Pro Ala Pro Thr Tyr
675 680 685
Gly Glu Ile Gly Ser Ala Ala Asp Tyr Leu Tyr Pro Glu Gly Leu Lys
690 695 700
Arg Ile Thr Lys Phe Ile Tyr Pro Trp Leu Asn Ser Thr Asp Leu Glu
705 710 715 720
Asp Ser Ser Asp Asp Pro Asn Tyr Gly Trp Glu Asp Ser Glu Tyr Ile
725 730 735
Pro Glu Gly Ala Arg Asp Gly Ser Pro Gln Pro Leu Leu Lys Ala Gly
740 745 750
Gly Ala Pro Gly Gly Asn Pro Thr Leu Tyr Gln Asp Leu Val Arg Val
755 760 765
Ser Ala Thr Ile Thr Asn Thr Gly Asn Val Ala Gly Tyr Glu Val Pro
770 775 780
Gln Leu Tyr Val Ser Leu Gly Gly Pro Asn Glu Pro Arg Val Val Leu
785 790 795 800
Arg Lys Phe Asp Arg Ile Phe Leu Ala Pro Gly Glu Gln Lys Val Trp
805 810 815
Thr Thr Thr Leu Asn Arg Arg Asp Leu Ala Asn Trp Asp Val Glu Ala
820 825 830
Gln Asp Trp Val Ile Thr Lys Tyr Pro Lys Lys Val His Val Gly Ser
835 840 845
Ser Ser Arg Lys Leu Pro Leu Arg Ala Pro Leu Pro Arg Val Tyr
850 855 860
<210>57
<211>2800
<212>DNA
<213>巴西青霉(Penicillium brasilianum)
<400>57
tgaaaatgca gggttctaca atctttctgg ctttcgcctc atgggcgagc caggttgctg 60
ccattgcgca gcccatacag aagcacgagg tttgttttat cttgctcatg gacgtgcttt120
gacttgacta attgttttac atacagcccg gatttctgca cgggccccaa gccatagaat180
cgttctcaga accgttctac ccgtcgccct ggatgaatcc tcacgccgag ggctgggagg240
ccgcatatca gaaagctcaa gattttgtct cgcaactcac tatcttggag aaaataaatc300
tgaccaccgg tgttgggtaa gtctctccga ctgcttctgg gtcacggtgc gacgagccac360
tgactttttg aagctgggaa aatgggccgt gtgtaggaaa cactggatca attcctcgtc420
tcggattcaa aggattttgt acccaggatt caccacaggg tgttcggttc gcagattatt480
cctccgcttt cacatctagc caaatggccg ccgcaacatt tgaccgctca attctttatc540
aacgaggcca agccatggca caggaacaca aggctaaggg tatcacaatt caattgggcc600
ctgttgccgg ccctctcggt cgcatccccg agggcggccg caactgggaa ggattctccc660
ctgatcctgt cttgactggt atagccatgg ctgagacaat taagggcatg caggatactg720
gagtgattgc ttgcgctaaa cattatattg gaaacgagca ggagcacttc cgtcaagtgg780
gtgaagctgc gggtcacgga tacactattt ccgatactat ttcatctaat attgacgacc840
gtgctatgca tgagctatac ttgtggccat ttgctgatgc cgttcgcgct ggtgtgggtt900
ctttcatgtg ctcatactct cagatcaaca actcctacgg atgccaaaac agtcagaccc960
tcaacaagct cctcaagagc gaattgggct tccaaggctt tgtcatgagc gattggggtg1020
cccatcactc tggagtgtca tcggcgctag ctggacttga tatgagcatg ccgggtgata1080
ccgaatttga ttctggcttg agcttctggg gctctaacct caccattgca attctgaacg1140
gcacggttcc cgaatggcgc ctggatgaca tggcgatgcg aattatggct gcatacttca1200
aagttggcct tactattgag gatcaaccag atgtcaactt caatgcctgg acccatgaca1260
cctacggata taaatacgct tatagcaagg aagattacga gcaggtcaac tggcatgtcg1320
atgttcgcag cgaccacaat aagctcattc gcgagactgc cgcgaagggt acagttctgc1380
tgaagaacaa ctttcatgct ctccctctga agcagcccag gttcgtggcc gtcgttggtc1440
aggatgccgg gccaaacccc aagggcccta acggctgcgc agaccgagga tgcgaccaag1500
gcactctcgc aatgggatgg ggctcagggt ctaccgaatt cccttacctg gtcactcctg1560
acactgctat tcagtcaaag gtcctcgaat acgggggtcg atacgagagt atttttgata1620
actatgacga caatgctatc ttgtcgcttg tctcacagcc tgatgcaacc tgtatcgttt1680
ttgcaaatgc cgattccggt gaaggctaca tcactgtcga caacaactgg ggtgaccgca1740
acaatctgac cctctggcaa aatgccgatc aagtgattag cactgtcagc tcgcgatgca1800
acaacacaat cgttgttctc cactctgtcg gaccagtgtt gctaaatggt atatatgagc1860
acccgaacat cacagctatt gtctgggcag ggatgccagg cgaagaatct ggcaatgctc1920
tcgtggatat tctttggggc aatgttaacc ctgccggtcg cactccgttc acctgggcca1980
aaagtcgaga ggactatggc actgatataa tgtacgagcc caacaacggc cagcgtgcgc2040
ctcagcagga tttcaccgag agcatctacc tcgactaccg ccatttcgac aaagctggta2100
tcgagccaat ttacgagttt ggattcggcc tctcctatac caccttcgaa tactctgacc2160
tccgtgttgt gaagaagtat gttcaaccat acagtcccac gaccggcacc ggtgctcaag2220
caccttccat cggacagcca cctagccaga acctggatac ctacaagttc cctgctacat2280
acaagtacat caaaaccttc atttatccct acctgaacag cactgtctcc ctccgcgctg2340
cttccaagga tcccgaatac ggtcgtacag actttatccc accccacgcg cgtgatggct2400
cccctcaacc tctcaacccc gctggagacc cagtggccag tggtggaaac aacatgctct2460
acgacgaact ttacgaggtc actgcacaga tcaaaaacac tggcgacgtg gccggcgacg2520
aagtcgtcca gctttacgta gatctcgggg gtgacaaccc gcctcgtcag ttgagaaact2580
ttgacaggtt ttatctgctg cccggtcaga gctcaacatt ccgggctaca ttgacgcgcc2640
gtgatttgag caactgggat attgaggcgc agaactggcg agttacggaa tcgcctaaga2700
gagtgtatgt tggacggtcg agtcgggatt tgccgctgag ctcacaattg gagtaatgat2760
catgtctacc aatagatgtt gaatgtctgg tgtggatatt 2800
<210>58
<211>878
<212>PRT
<213>巴西青霉(Penicillium brasilianum)
<400>58
Met Gln Gly Ser Thr Ile Phe Leu Ala Phe Ala Ser Trp Ala Ser Gln
1 5 10 15
Val Ala Ala Ile Ala Gln Pro Ile Gln Lys His Glu Pro Gly Phe Leu
20 25 30
His Gly Pro Gln Ala Ile Glu Ser Phe Ser Glu Pro Phe Tyr Pro Ser
35 40 45
Pro Trp Met Asn Pro His Ala Glu Gly Trp Glu Ala Ala Tyr Gln Lys
50 55 60
Ala Gln Asp Phe Val Ser Gln Leu Thr Ile Leu Glu Lys Ile Asn Leu
65 70 75 80
Thr Thr Gly Val Gly Trp Glu Asn Gly Pro Cys Val Gly Asn Thr Gly
85 90 95
Ser Ile Pro Arg Leu Gly Phe Lys Gly Phe Cys Thr Gln Asp Ser Pro
100 105 110
Gln Gly Val Arg Phe Ala Asp Tyr Ser Ser Ala Phe Thr Ser Ser Gln
115 120 125
Met Ala Ala Ala Thr Phe Asp Arg Ser Ile Leu Tyr Gln Arg Gly Gln
130 135 140
Ala Met Ala Gln Glu His Lys Ala Lys Gly Ile Thr Ile Gln Leu Gly
145 150 155 160
Pro Val Ala Gly Pro Leu Gly Arg Ile Pro Glu Gly Gly Arg Asn Trp
165 170 175
Glu Gly Phe Ser Pro Asp Pro Val Leu Thr Gly Ile Ala Met Ala Glu
180 185 190
Thr Ile Lys Gly Met Gln Asp Thr Gly Val Ile Ala Cys Ala Lys His
195 200 205
Tyr Ile Gly Asn Glu Gln Glu His Phe Arg Gln Val Gly Glu Ala Ala
210 215 220
Gly His Gly Tyr Thr Ile Ser Asp Thr Ile Ser Ser Asn Ile Asp Asp
225 230 235 240
Arg Ala Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg
245 250 255
Ala Gly Val Gly Ser Phe Met Cys Ser Tyr Ser Gln Ile Asn Asn Ser
260 265 270
Tyr Gly Cys Gln Asn Ser Gln Thr Leu Asn Lys Leu Leu Lys Ser Glu
275 280 285
Leu Gly Phe Gln Gly Phe Val Met Ser Asp Trp Gly Ala His His Ser
290 295 300
Gly Val Ser Ser Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp
305 310 315 320
Thr Glu Phe Asp Ser Gly Leu Ser Phe Trp Gly Ser Asn Leu Thr Ile
325 330 335
Ala Ile Leu Asn Gly Thr Val Pro Glu Trp Arg Leu Asp Asp Met Ala
340 345 350
Met Arg Ile Met Ala Ala Tyr Phe Lys Val Gly Leu Thr Ile Glu Asp
355 360 365
Gln Pro Asp Val Asn Phe Asn Ala Trp Thr His Asp Thr Tyr Gly Tyr
370 375 380
Lys Tyr Ala Tyr Ser Lys Glu Asp Tyr Glu Gln Val Asn Trp His Val
385 390 395 400
Asp Val Arg Ser Asp His Asn Lys Leu Ile Arg Glu Thr Ala Ala Lys
405 410 415
Gly Thr Val Leu Leu Lys Asn Asn Phe His Ala Leu Pro Leu Lys Gln
420 425 430
Pro Arg Phe Val Ala Val Val Gly Gln Asp Ala Gly Pro Asn Pro Lys
435 440 445
Gly Pro Asn Gly Cys Ala Asp Arg Gly Cys Asp Gln Gly Thr Leu Ala
450 455 460
Met Gly Trp Gly Ser Gly Ser Thr Glu Phe Pro Tyr Leu Val Thr Pro
465 470 475 480
Asp Thr Ala Ile Gln Ser Lys Val Leu Glu Tyr Gly Gly Arg Tyr Glu
485 490 495
Ser Ile Phe Asp Asn Tyr Asp Asp Asn Ala Ile Leu Ser Leu Val Ser
500 505 510
Gln Pro Asp Ala Thr Cys Ile Val Phe Ala Asn Ala Asp Ser Gly Glu
515 520 525
Gly Tyr Ile Thr Val Asp Asn Asn Trp Gly Asp Arg Asn Asn Leu Thr
530 535 540
Leu Trp Gln Asn Ala Asp Gln Val Ile Ser Thr Val Ser Ser Arg Cys
545 550 555 560
Asn Asn Thr Ile Val Val Leu His Ser Val Gly Pro Val Leu Leu Asn
565 570 575
Gly Ile Tyr Glu His Pro Asn Ile Thr Ala Ile Val Trp Ala Gly Met
580 585 590
Pro Gly Glu Glu Ser Gly Asn Ala Leu Val Asp Ile Leu Trp Gly Asn
595 600 605
Val Asn Pro Ala Gly Arg Thr Pro Phe Thr Trp Ala Lys Ser Arg Glu
610 615 620
Asp Tyr Gly Thr Asp Ile Met Tyr Glu Pro Asn Asn Gly Gln Arg Ala
625 630 635 640
Pro Gln Gln Asp Phe Thr Glu Ser Ile Tyr Leu Asp Tyr Arg His Phe
645 650 655
Asp Lys Ala Gly Ile Glu Pro Ile Tyr Glu Phe Gly Phe Gly Leu Ser
660 665 670
Tyr Thr Thr Phe Glu Tyr Ser Asp Leu Arg Val Val Lys Lys Tyr Val
675 680 685
Gln Pro Tyr Ser Pro Thr Thr Gly Thr Gly Ala Gln Ala Pro Ser Ile
690 695 700
Gly Gln Pro Pro Ser Gln Asn Leu Asp Thr Tyr Lys Phe Pro Ala Thr
705 710 715 720
Tyr Lys Tyr Ile Lys Thr Phe Ile Tyr Pro Tyr Leu Asn Ser Thr Val
725 730 735
Ser Leu Arg Ala Ala Ser Lys Asp Pro Glu Tyr Gly Arg Thr Asp Phe
740 745 750
Ile Pro Pro His Ala Arg Asp Gly Ser Pro Gln Pro Leu Asn Pro Ala
755 760 765
Gly Asp Pro Val Ala Ser Gly Gly Asn Asn Met Leu Tyr Asp Glu Leu
770 775 780
Tyr Glu Val Thr Ala Gln Ile Lys Asn Thr Gly Asp Val Ala Gly Asp
785 790 795 800
Glu Val Val Gln Leu Tyr Val Asp Leu Gly Gly Asp Asn Pro Pro Arg
805 810 815
Gln Leu Arg Asn Phe Asp Arg Phe Tyr Leu Leu Pro Gly Gln Ser Ser
820 825 830
Thr Phe Arg Ala Thr Leu Thr Arg Arg Asp Leu Ser Asn Trp Asp Ile
835 840 845
Glu Ala Gln Asn Trp Arg Val Thr Glu Ser Pro Lys Arg Val Tyr Val
850 855 860
Gly Arg Ser Ser Arg Asp Leu Pro Leu Ser Ser Gln Leu Glu
865 870 875
<210>59
<211>2583
<212>DNA
<213>黑曲霉(Aspergillus niger)
<400>59
atgaggttca ctttgatcga ggcggtggct ctgactgccg tctcgctggc cagcgctgat 60
gaattggcct actccccacc gtattaccca tccccttggg ccaatggcca gggcgactgg120
gcgcaggcat accagcgcgc tgttgatatt gtctcgcaaa tgacattgga tgagaaggtc180
aatctgacca caggaactgg atgggaattg gaactatgtg ttggtcagac tggcggtgtt240
ccccgattgg gagttccggg aatgtgttta caggatagcc ctctgggcgt tcgcgactcc300
gactacaact ctgctttccc tgccggcatg aacgtggctg caacctggga caagaatctg360
gcataccttc gcggcaaggc tatgggtcag gaatttagtg acaagggtgc cgatatccaa420
ttgggtccag ctgccggccc tctcggtaga agtcccgacg gtggtcgtaa ctgggagggc480
ttctccccag accctgccct aagtggtgtg ctctttgccg agaccatcaa gggtatccaa540
gatgctggtg tggttgcgac ggctaagcac tacattgctt acgagcaaga gcatttccgt600
caggcgcctg aagcccaagg ttttggattt aatatttccg agagtggaag tgcgaacctc660
gatgataaga ctatgcacga gctgtacctc tggcccttcg cggatgccat ccgtgcaggt720
gctggcgctg tgatgtgctc ctacaaccag atcaacaaca gttatggctg ccagaacagc780
tacactctga acaagctgct caaggccgag ctgggcttcc agggctttgt catgagtgat840
tgggctgctc accatgctgg tgtgagtggt gctttggcag gattggatat gtctatgcca900
ggagacgtcg actacgacag tggtacgtct tactggggta caaacttgac cattagcgtg960
ctcaacggaa cggtgcccca atggcgtgtt gatgacatgg ctgtccgcat catggccgcc1020
tactacaagg tcggccgtga ccgtctgtgg actcctccca acttcagctc atggaccaga1080
gatgaatacg gctacaagta ctactacgtg tcggagggac cgtacgagaa ggtcaaccag1140
tacgtgaatg tgcaacgcaa ccacagcgaa ctgattcgcc gcattggagc ggacagcacg1200
gtgctcctca agaacgacgg cgctctgcct ttgactggta aggagcgcct ggtcgcgctt1260
atcggagaag atgcgggctc caacccttat ggtgccaacg gctgcagtga ccgtggatgc1320
gacaatggaa cattggcgat gggctgggga agtggtactg ccaacttccc atacctggtg1380
acccccgagc aggccatctc aaacgaggtg cttaagcaca agaatggtgt attcaccgcc1440
accgataact gggctatcga tcagattgag gcgcttgcta agaccgccag tgtctctctt1500
gtctttgtca acgccgactc tggtgagggt tacatcaatg tggacggaaa cctgggtgac1560
cgcaggaacc tgaccctgtg gaggaacggc gataatgtga tcaaggctgc tgctagcaac1620
tgcaacaaca caatcgttgt cattcactct gtcggaccag tcttggttaa cgagtggtac1680
gacaacccca atgttaccgc tatcctctgg ggtggtttgc ccggtcagga gtctggcaac1740
tctcttgccg acgtcctcta tggccgtgtc aaccccggtg ccaagtcgcc ctttacctgg1800
ggcaagactc gtgaggccta ccaagactac ttggtcaccg agcccaacaa cggcaacgga1860
gcccctcagg aagactttgt cgagggcgtc ttcattgact accgtggatt tgacaagcgc1920
aacgagaccc cgatctacga gttcggctat ggtctgagct acaccacttt caactactcg1980
aaccttgagg tgcaggtgct gagcgcccct gcatacgagc ctgcttcggg tgagaccgag2040
gcagcgccaa ccttcggaga ggttggaaat gcgtcggatt acctctaccc cagcggattg2100
cagagaatta ccaagttcat ctacccctgg ctcaacggta ccgatctcga ggcatcttcc2160
ggggatgcta gctacgggca ggactcctcc gactatcttc ccgagggagc caccgatggc2220
tctgcgcaac cgatcctgcc tgccggtggc ggtcctggcg gcaaccctcg cctgtacgac2280
gagctcatcc gcgtgtcagt gaccatcaag aacaccggca aggttgctgg tgatgaagtt2340
ccccaactgt atgtttccct tggcggtccc aatgagccca agatcgtgct gcgtcaattc2400
gagcgcatca cgctgcagcc gtcggaggag acgaagtgga gcacgactct gacgcgccgt2460
gaccttgcaa actggaatgt tgagaagcag gactgggaga ttacgtcgta tcccaagatg2520
gtgtttgtcg gaagctcctc gcggaagctg ccgctccggg cgtctctgcc tactgttcac2580
taa 2583
<210>60
<211>860
<212>PRT
<213>黑曲霉(Aspergillus niger)
<400>60
Met Arg Phe Thr Leu Ile Glu Ala Val Ala Leu Thr Ala Val Ser Leu
1 5 10 15
Ala Ser Ala Asp Glu Leu Ala Tyr Ser Pro Pro Tyr Tyr Pro Ser Pro
20 25 30
Trp Ala Asn Gly Gln Gly Asp Trp Ala Gln Ala Tyr Gln Arg Ala Val
35 40 45
Asp Ile Val Ser Gln Met Thr Leu Asp Glu Lys Val Asn Leu Thr Thr
50 55 60
Gly Thr Gly Trp Glu Leu Glu Leu Cys Val Gly Gln Thr Gly Gly Val
65 70 75 80
Pro Arg Leu Gly Val Pro Gly Met Cys Leu Gln Asp Ser Pro Leu Gly
85 90 95
Val Arg Asp Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Met Asn Val
100 105 110
Ala Ala Thr Trp Asp Lys Asn Leu Ala Tyr Leu Arg Gly Lys Ala Met
115 120 125
Gly Gln Glu Phe Ser Asp Lys Gly Ala Asp Ile Gln Leu Gly Pro Ala
130 135 140
Ala Gly Pro Leu Gly Arg Ser Pro Asp Gly Gly Arg Asn Trp Glu Gly
145 150 155 160
Phe Ser Pro Asp Pro Ala Leu Ser Gly Val Leu Phe Ala Glu Thr Ile
165 170 175
Lys Gly Ile Gln Asp Ala Gly Val Val Ala Thr Ala Lys His Tyr Ile
180 185 190
Ala Tyr Glu Gln Glu His Phe Arg Gln Ala Pro Glu Ala Gln Gly Phe
195 200 205
Gly Phe Asn Ile Ser Glu Ser Gly Ser Ala Asn Leu Asp Asp Lys Thr
210 215 220
Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Ile Arg Ala Gly
225 230 235 240
Ala Gly Ala Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr Gly
245 250 255
Cys Gln Asn Ser Tyr Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu Gly
260 265 270
Phe Gln Gly Phe Val Met Ser Asp Trp Ala Ala His His Ala Gly Val
275 280 285
Ser Gly Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Val Asp
290 295 300
Tyr Asp Ser Gly Thr Ser Tyr Trp Gly Thr Asn Leu Thr Ile Ser Val
305 310 315 320
Leu Asn Gly Thr Val Pro Gln Trp Arg Val Asp Asp Met Ala Val Arg
325 330 335
Ile Met Ala Ala Tyr Tyr Lys Val Gly Arg Asp Arg Leu Trp Thr Pro
340 345 350
Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Tyr Lys Tyr Tyr
355 360 365
Tyr Val Ser Glu Gly Pro Tyr Glu Lys Val Asn Gln Tyr Val Asn Val
370 375 380
Gln Arg Asn His Ser Glu Leu Ile Arg Arg Ile Gly Ala Asp Ser Thr
385 390 395 400
Val Leu Leu Lys Asn Asp Gly Ala Leu Pro Leu Thr Gly Lys Glu Arg
405 410 415
Leu Val Ala Leu Ile Gly Glu Asp Ala Gly Ser Asn Pro Tyr Gly Ala
420 425 430
Asn Gly Cys Ser Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met Gly
435 440 445
Trp Gly Ser Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu Gln
450 455 460
Ala Ile Ser Asn Glu Val Leu Lys His Lys Asn Gly Val Phe Thr Ala
465 470 475 480
Thr Asp Asn Trp Ala Ile Asp Gln Ile Glu Ala Leu Ala Lys Thr Ala
485 490 495
Ser Val Ser Leu Val Phe Val Asn Ala Asp Ser Gly Glu Gly Tyr Ile
500 505 510
Asn Val Asp Gly Asn Leu Gly Asp Arg Arg Asn Leu Thr Leu Trp Arg
515 520 525
Asn Gly Asp Asn Val Ile Lys Ala Ala Ala Ser Asn Cys Asn Asn Thr
530 535 540
Ile Val Val Ile His Ser Val Gly Pro Val Leu Val Asn Glu Trp Tyr
545 550 555 560
Asp Asn Pro Asn Val Thr Ala Ile Leu Trp Gly Gly Leu Pro Gly Gln
565 570 575
Glu Ser Gly Asn Ser Leu Ala Asp Val Leu Tyr Gly Arg Val Asn Pro
580 585 590
Gly Ala Lys Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ala Tyr Gln
595 600 605
Asp Tyr Leu Val Thr Glu Pro Asn Asn Gly Asn Gly Ala Pro Gln Glu
610 615 620
Asp Phe Val Glu Gly Val Phe Ile Asp Tyr Arg Gly Phe Asp Lys Arg
625 630 635 640
Asn Glu Thr Pro Ile Tyr Glu Phe Gly Tyr Gly Leu Ser Tyr Thr Thr
645 650 655
Phe Asn Tyr Ser Asn Leu Glu Val Gln Val Leu Ser Ala Pro Ala Tyr
660 665 670
Glu Pro Ala Ser Gly Glu Thr Glu Ala Ala Pro Thr Phe Gly Glu Val
675 680 685
Gly Asn Ala Ser Asp Tyr Leu Tyr Pro Ser Gly Leu Gln Arg Ile Thr
690 695 700
Lys Phe Ile Tyr Pro Trp Leu Asn Gly Thr Asp Leu Glu Ala Ser Ser
705 710 715 720
Gly Asp Ala Ser Tyr Gly Gln Asp Ser Ser Asp Tyr Leu Pro Glu Gly
725 730 735
Ala Thr Asp Gly Ser Ala Gln Pro Ile Leu Pro Ala Gly Gly Gly Pro
740 745 750
Gly Gly Asn Pro Arg Leu Tyr Asp Glu Leu Ile Arg Val Ser Val Thr
755 760 765
Ile Lys Asn Thr Gly Lys Val Ala Gly Asp Glu Val Pro Gln Leu Tyr
770 775 780
Val Ser Leu Gly Gly Pro Asn Glu Pro Lys Ile Val Leu Arg Gln Phe
785 790 795 800
Glu Arg Ile Thr Leu Gln Pro Ser Glu Glu Thr Lys Trp Ser Thr Thr
805 810 815
Leu Thr Arg Arg Asp Leu Ala Asn Trp Asn Val Glu Lys Gln Asp Trp
820 825 830
Glu Ile Thr Ser Tyr Pro Lys Met Val Phe Val Gly Ser Ser Ser Arg
835 840 845
Lys Leu Pro Leu Arg Ala Ser Leu Pro Thr Val His
850 855 860
<210>61
<211>2583
<212>DNA
<213>棘孢曲霉(Aspergillus aculeatus)
<400>61
atgaagctca gttggcttga ggcggctgcc ttgacggctg cttcagtcgt cagcgctgat 60
gaactggcgt tctctcctcc tttctacccc tctccgtggg ccaatggcca gggagagtgg120
gcggaagcct accagcgtgc agtggccatt gtatcccaga tgactctgga tgagaaggtc180
aacctgacca ccggaactgg atgggagctg gagaagtgcg tcggtcagac tggtggtgtc240
ccaagactga acatcggtgg catgtgtctt caggacagtc ccttgggaat tcgtgatagt300
gactacaatt cggctttccc tgctggtgtc aacgttgctg cgacatggga caagaacctt360
gcttatctac gtggtcaggc tatgggtcaa gagttcagtg acaaaggaat tgatgttcaa420
ttgggaccgg ccgcgggtcc cctcggcagg agccctgatg gaggtcgcaa ctgggaaggt480
ttctctccag acccggctct tactggtgtg ctctttgcgg agacgattaa gggtattcaa540
gacgctggtg tcgtggcgac agccaagcat tacattctca atgagcaaga gcatttccgc600
caggtcgcag aggctgcggg ctacggattc aatatctccg acacgatcag ctctaacgtt660
gatgacaaga ccattcatga aatgtacctc tggcccttcg cggatgccgt tcgcgccggc720
gttggcgcca tcatgtgttc ctacaaccag atcaacaaca gctacggttg ccagaacagt780
tacactctga acaagcttct gaaggccgag ctcggcttcc agggctttgt gatgtctgac840
tggggtgctc accacagtgg tgttggctct gctttggccg gcttggatat gtcaatgcct900
ggcgatatca ccttcgattc tgccactagt ttctggggta ccaacctgac cattgctgtg960
ctcaacggta ccgtcccgca gtggcgcgtt gacgacatgg ctgtccgtat catggctgcc1020
tactacaagg ttggccgcga ccgcctgtac cagccgccta acttcagctc ctggactcgc1080
gatgaatacg gcttcaagta tttctacccc caggaagggc cctatgagaa ggtcaatcac1140
tttgtcaatg tgcagcgcaa ccacagcgag gttattcgca agttgggagc agacagtact1200
gttctactga agaacaacaa tgccctgccg ctgaccggaa aggagcgcaa agttgcgatc1260
ctgggtgaag atgctggatc caactcgtac ggtgccaatg gctgctctga ccgtggctgt1320
gacaacggta ctcttgctat ggcttggggt agcggcactg ccgaattccc atatctcgtg1380
acccctgagc aggctattca agccgaggtg ctcaagcata agggcagcgt ctacgccatc1440
acggacaact gggcgctgag ccaggtggag accctcgcta aacaagccag tgtctctctt1500
gtatttgtca actcggacgc gggagagggc tatatctccg tggacggaaa cgagggcgac1560
cgcaacaacc tcaccctctg gaagaacggc gacaacctca tcaaggctgc tgcaaacaac1620
tgcaacaaca ccatcgttgt catccactcc gttggacctg ttttggttga cgagtggtat1680
gaccacccca acgttactgc catcctctgg gcgggcttgc ctggccagga gtctggcaac1740
tccttggctg acgtgctcta cggccgcgtc aacccgggcg ccaaatctcc attcacctgg1800
ggcaagacga gggaggcgta cggggattac cttgtccgtg agctcaacaa cggcaacgga1860
gctccccaag atgatttctc ggaaggtgtt ttcattgact accgcggatt cgacaagcgc1920
aatgagaccc cgatctacga gttcggacat ggtctgagct acaccacttt caactactct1980
ggccttcaca tccaggttct caacgcttcc tccaacgctc aagtagccac tgagactggc2040
gccgctccca ccttcggaca agtcggcaat gcctctgact acgtgtaccc tgagggattg2100
accagaatca gcaagttcat ctatccctgg cttaattcca cagacctgaa ggcctcatct2160
ggcgacccgt actatggagt cgacaccgcg gagcacgtgc ccgagggtgc tactgatggc2220
tctccgcagc ccgttctgcc tgccggtggt ggctctggtg gtaacccgcg cctctacgat2280
gagttgatcc gtgtttcggt gacagtcaag aacactggtc gtgttgccgg tgatgctgtg2340
cctcaattgt atgtttccct tggtggaccc aatgagccca aggttgtgtt gcgcaaattc2400
gaccgcctca ccctcaagcc ctccgaggag acggtgtgga cgactaccct gacccgccgc2460
gatctgtcta actgggacgt tgcggctcag gactgggtca tcacttctta cccgaagaag2520
gtccatgttg gtagctcttc gcgtcagctg ccccttcacg cggcgctccc gaaggtgcaa2580
tga 2583
<210>62
<211>860
<212>PRT
<213>棘孢曲霉(Aspergillus aculeatus)
<400>62
Met Lys Leu Ser Trp Leu Glu Ala Ala Ala Leu Thr Ala Ala Ser Val
1 5 10 15
Val Ser Ala Asp Glu Leu Ala Phe Ser Pro Pro Phe Tyr Pro Ser Pro
20 25 30
Trp Ala Asn Gly Gln Gly Glu Trp Ala Glu Ala Tyr Gln Arg Ala Val
35 40 45
Ala Ile Val Ser Gln Met Thr Leu Asp Glu Lys Val Asn Leu Thr Thr
50 55 60
Gly Thr Gly Trp Glu Leu Glu Lys Cys Val Gly Gln Thr Gly Gly Val
65 70 75 80
Pro Arg Leu Asn Ile Gly Gly Met Cys Leu Gln Asp Ser Pro Leu Gly
85 90 95
Ile Arg Asp Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Val Asn Val
100 105 110
Ala Ala Thr Trp Asp Lys Asn Leu Ala Tyr Leu Arg Gly Gln Ala Met
115 120 125
Gly Gln Glu Phe Ser Asp Lys Gly Ile Asp Val Gln Leu Gly Pro Ala
130 135 140
Ala Gly Pro Leu Gly Arg Ser Pro Asp Gly Gly Arg Asn Trp Glu Gly
145 150 155 160
Phe Ser Pro Asp Pro Ala Leu Thr Gly Val Leu Phe Ala Glu Thr Ile
165 170 175
Lys Gly Ile Gln Asp Ala Gly Val Val Ala Thr Ala Lys His Tyr Ile
180 185 190
Leu Asn Glu Gln Glu His Phe Arg Gln Val Ala Glu Ala Ala Gly Tyr
195 200 205
Gly Phe Asn Ile Ser Asp Thr Ile Ser Ser Asn Val Asp Asp Lys Thr
210 215 220
Ile His Glu Met Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala Gly
225 230 235 240
Val Gly Ala Ile Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr Gly
245 250 255
Cys Gln Asn Ser Tyr Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu Gly
260 265 270
Phe Gln Gly Phe Val Met Ser Asp Trp Gly Ala His His Ser Gly Val
275 280 285
Gly Ser Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Ile Thr
290 295 300
Phe Asp Ser Ala Thr Ser Phe Trp Gly Thr Asn Leu Thr Ile Ala Val
305 310 315 320
Leu Asn Gly Thr Val Pro Gln Trp Arg Val Asp Asp Met Ala Val Arg
325 330 335
Ile Met Ala Ala Tyr Tyr Lys Val Gly Arg Asp Arg Leu Tyr Gln Pro
340 345 350
Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Phe Lys Tyr Phe
355 360 365
Tyr Pro Gln Glu Gly Pro Tyr Glu Lys Val Asn His Phe Val Asn Val
370 375 380
Gln Arg Asn His Ser Glu Val Ile Arg Lys Leu Gly Ala Asp Ser Thr
385 390 395 400
Val Leu Leu Lys Asn Asn Asn Ala Leu Pro Leu Thr Gly Lys Glu Arg
405 410 415
Lys Val Ala Ile Leu Gly Glu Asp Ala Gly Ser Asn Ser Tyr Gly Ala
420 425 430
Asn Gly Cys Ser Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met Ala
435 440 445
Trp Gly Ser Gly Thr Ala Glu Phe Pro Tyr Leu Val Thr Pro Glu Gln
450 455 460
Ala Ile Gln Ala Glu Val Leu Lys His Lys Gly Ser Val Tyr Ala Ile
465 470 475 480
Thr Asp Asn Trp Ala Leu Ser Gln Val Glu Thr Leu Ala Lys Gln Ala
485 490 495
Ser Val Ser Leu Val Phe Val Asn Ser Asp Ala Gly Glu Gly Tyr Ile
500 505 510
Ser Val Asp Gly Asn Glu Gly Asp Arg Asn Asn Leu Thr Leu Trp Lys
515 520 525
Asn Gly Asp Asn Leu Ile Lys Ala Ala Ala Asn Asn Cys Asn Asn Thr
530 535 540
Ile Val Val Ile His Ser Val Gly Pro Val Leu Val Asp Glu Trp Tyr
545 550 555 560
Asp His Pro Asn Val Thr Ala Ile Leu Trp Ala Gly Leu Pro Gly Gln
565 570 575
Glu Ser Gly Asn Ser Leu Ala Asp Val Leu Tyr Gly Arg Val Asn Pro
580 585 590
Gly Ala Lys Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ala Tyr Gly
595 600 605
Asp Tyr Leu Val Arg Glu Leu Asn Asn Gly Asn Gly Ala Pro Gln Asp
610 615 620
Asp Phe Ser Glu Gly Val Phe Ile Asp Tyr Arg Gly Phe Asp Lys Arg
625 630 635 640
Asn Glu Thr Pro Ile Tyr Glu Phe Gly His Gly Leu Ser Tyr Thr Thr
645 650 655
Phe Asn Tyr Ser Gly Leu His Ile Gln Val Leu Asn Ala Ser Ser Asn
660 665 670
Ala Gln Val Ala Thr Glu Thr Gly Ala Ala Pro Thr Phe Gly Gln Val
675 680 685
Gly Asn Ala Ser Asp Tyr Val Tyr Pro Glu Gly Leu Thr Arg Ile Ser
690 695 700
Lys Phe Ile Tyr Pro Trp Leu Asn Ser Thr Asp Leu Lys Ala Ser Ser
705 710 715 720
Gly Asp Pro Tyr Tyr Gly Val Asp Thr Ala Glu His Val Pro Glu Gly
725 730 735
Ala Thr Asp Gly Ser Pro Gln Pro Val Leu Pro Ala Gly Gly Gly Ser
740 745 750
Gly Gly Asn Pro Arg Leu Tyr Asp Glu Leu Ile Arg Val Ser Val Thr
755 760 765
Val Lys Asn Thr Gly Arg Val Ala Gly Asp Ala Val Pro Gln Leu Tyr
770 775 780
Val Ser Leu Gly Gly Pro Asn Glu Pro Lys Val Val Leu Arg Lys Phe
785 790 795 800
Asp Arg Leu Thr Leu Lys Pro Ser Glu Glu Thr Val Trp Thr Thr Thr
805 810 815
Leu Thr Arg Arg Asp Leu Ser Asn Trp Asp Val Ala Ala Gln Asp Trp
820 825 830
Val Ile Thr Ser Tyr Pro Lys Lys Val His Val Gly Ser Ser Ser Arg
835 840 845
Gln Leu Pro Leu His Ala Ala Leu Pro Lys Val Gln
850 855 860
<210>63
<211>3294
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>63
atgcgttcct cccccctcct ccgctccgcc gttgtggccg ccctgccggt gttggccctt 60
gccgctgatg gcaggtccac ccgctactgg gactgctgca agccttcgtg cggctgggcc120
aagaaggctc ccgtgaacca gcctgtcttt tcctgcaacg ccaacttcca gcgtatcacg180
gacttcgacg ccaagtccgg ctgcgagccg ggcggtgtcg cctactcgtg cgccgaccag240
accccatggg ctgtgaacga cgacttcgcg ctcggttttg ctgccacctc tattgccggc300
agcaatgagg cgggctggtg ctgcgcctgc tacgagctca ccttcacatc cggtcctgtt360
gctggcaaga agatggtcgt ccagtccacc agcactggcg gtgatcttgg cagcaaccac420
ttcgatctca acatccccgg cggcggcgtc ggcatcttcg acggatgcac tccccagttc480
ggtggtctgc ccggccagcg ctacggcggc atctcgtccc gcaacgagtg cgatcggttc540
cccgacgccc tcaagcccgg ctgctactgg cgcttcgact ggttcaagaa cgccgacaat600
ccgagcttca gcttccgtca ggtccagtgc ccagccgagc tcgtcgctcg caccggatgc660
cgccgcaacg acgacggcaa cttccctgcc gtccagatcc ccatgcgttc ctcccccctc720
ctccgctccg ccgttgtggc cgccctgccg gtgttggccc ttgccaagga tgatctcgcg780
tactcccctc ctttctaccc ttccccatgg gcagatggtc agggtgaatg ggcggaagta840
tacaaacgcg ctgtagacat agtttcccag atgacgttga cagagaaagt caacttaacg900
actggaacag gatggcaact agagaggtgt gttggacaaa ctggcagtgt tcccagactc960
aacatcccca gcttgtgttt gcaggatagt cctcttggta ttcgtttctc ggactacaat1020
tcagctttcc ctgcgggtgt taatgtcgct gccacctggg acaagacgct cgcctacctt1080
cgtggtcagg caatgggtga ggagttcagt gataagggta ttgacgttca gctgggtcct1140
gctgctggcc ctctcggtgc tcatccggat ggcggtagaa actgggaagg tttctcacca1200
gatccagccc tcaccggtgt actttttgcg gagacgatta agggtattca agatgctggt1260
gtcattgcga cagctaagca ttatatcatg aacgaacaag agcatttccg ccaacaaccc1320
gaggctgcgg gttacggatt caacgtaagc gacagtttga gttccaacgt tgatgacaag1380
actatgcatg aattgtacct ctggcccttc gcggatgcag tacgcgctgg agtcggtgct1440
gtcatgtgct cttacaacca aatcaacaac agctacggtt gcgagaatag cgaaactctg1500
aacaagcttt tgaaggcgga gcttggtttc caaggcttcg tcatgagtga ttggaccgct1560
catcacagcg gcgtaggcgc tgctttagca ggtctggata tgtcgatgcc cggtgatgtt1620
accttcgata gtggtacgtc tttctggggt gcaaacttga cggtcggtgt ccttaacggt1680
acaatccccc aatggcgtgt tgatgacatg gctgtccgta tcatggccgc ttattacaag1740
gttggccgcg acaccaaata cacccctccc aacttcagct cgtggaccag ggacgaatat1800
ggtttcgcgc ataaccatgt ttcggaaggt gcttacgaga gggtcaacga attcgtggac1860
gtgcaacgcg atcatgccga cctaatccgt cgcatcggcg cgcagagcac tgttctgctg1920
aagaacaagg gtgccttgcc cttgagccgc aaggaaaagc tggtcgccct tctgggagag1980
gatgcgggtt ccaactcgtg gggcgctaac ggctgtgatg accgtggttg cgataacggt2040
acccttgcca tggcctgggg tagcggtact gcgaatttcc catacctcgt gacaccagag2100
caggcgattc agaacgaagt tcttcagggc cgtggtaatg tcttcgccgt gaccgacagt2160
tgggcgctcg acaagatcgc tgcggctgcc cgccaggcca gcgtatctct cgtgttcgtc2220
aactccgact caggagaagg ctatcttagt gtggatggaa atgagggcga tcgtaacaac2280
atcactctgt ggaagaacgg cgacaatgtg gtcaagaccg cagcgaataa ctgtaacaac2340
accgttgtca tcatccactc cgtcggacca gttttgatcg atgaatggta tgaccacccc2400
aatgtcactg gtattctctg ggctggtctg ccaggccagg agtctggtaa ctccattgcc2460
gatgtgctgt acggtcgtgt caaccctggc gccaagtctc ctttcacttg gggcaagacc2520
cgggagtcgt atggttctcc cttggtcaag gatgccaaca atggcaacgg agcgccccag2580
tctgatttca cccagggtgt tttcatcgat taccgccatt tcgataagtt caatgagacc2640
cctatctacg agtttggcta cggcttgagc tacaccacct tcgagctctc cgacctccat2700
gttcagcccc tgaacgcgtc ccgatacact cccaccagtg gcatgactga agctgcaaag2760
aactttggtg aaattggcga tgcgtcggag tacgtgtatc cggaggggct ggaaaggatc2820
catgagttta tctatccctg gatcaactct accgacctga aggcatcgtc tgacgattct2880
aactacggct gggaagactc caagtatatt cccgaaggcg ccacggatgg gtctgcccag2940
ccccgtttgc ccgctagtgg tggtgccgga ggaaaccccg gtctgtacga ggatcttttc3000
cgcgtctctg tgaaggtcaa gaacacgggc aatgtcgccg gtgatgaagt tcctcagctg3060
tacgtttccc taggcggccc gaatgagccc aaggtggtac tgcgcaagtt tgagcgtatt3120
cacttggccc cttcgcagga ggccgtgtgg acaacgaccc ttacccgtcg tgaccttgca3180
aactgggacg tttcggctca ggactggacc gtcactcctt accccaagac gatctacgtt3240
ggaaactcct cacggaaact gccgctccag gcctcgctgc ctaaggccca gtaa 3294
<210>64
<211>1097
<212>PRT
<213>米曲霉(Aspergillus oryzae)
<400>64
Met Arg Ser Ser Pro Leu Leu Arg Ser Ala Val Val Ala Ala Leu Pro
1 5 10 15
Val Leu Ala Leu Ala Ala Asp Gly Arg Ser Thr Arg Tyr Trp Asp Cys
20 25 30
Cys Lys Pro Ser Cys Gly Trp Ala Lys Lys Ala Pro Val Asn Gln Pro
35 40 45
Val Phe Ser Cys Asn Ala Asn Phe Gln Arg Ile Thr Asp Phe Asp Ala
50 55 60
Lys Ser Gly Cys Glu Pro Gly Gly Val Ala Tyr Ser Cys Ala Asp Gln
65 70 75 80
Thr Pro Trp Ala Val Asn Asp Asp Phe Ala Leu Gly Phe Ala Ala Thr
85 90 95
Ser Ile Ala Gly Ser Asn Glu Ala Gly Trp Cys Cys Ala Cys Tyr Glu
100 105 110
Leu Thr Phe Thr Ser Gly Pro Val Ala Gly Lys Lys Met Val Val Gln
115 120 125
Ser Thr Ser Thr Gly Gly Asp Leu Gly Ser Asn His Phe Asp Leu Asn
130 135 140
lle Pro Gly Gly Gly Val Gly Ile Phe Asp Gly Cys Thr Pro Gln Phe
145 150 155 160
Gly Gly Leu Pro Gly Gln Arg Tyr Gly Gly Ile Ser Ser Arg Asn Glu
165 170 175
Cys Asp Arg Phe Pro Asp Ala Leu Lys Pro Gly Cys Tyr Trp Arg Phe
180 185 190
Asp Trp Phe Lys Asn Ala Asp Asn Pro Ser Phe Ser Phe Arg Gln Val
195 200 205
Gln Cys Pro Ala Glu Leu Val Ala Arg Thr Gly Cys Arg Arg Asn Asp
210 215 220
Asp Gly Asn Phe Pro Ala Val Gln Ile Pro Met Arg Ser Ser Pro Leu
225 230 235 240
Leu Arg Ser Ala Val Val Ala Ala Leu Pro Val Leu Ala Leu Ala Lys
245 250 255
Asp Asp Leu Ala Tyr Ser Pro Pro Phe Tyr Pro Ser Pro Trp Ala Asp
260 265 270
Gly Gln Gly Glu Trp Ala Glu Val Tyr Lys Arg Ala Val Asp Ile Val
275 280 285
Ser Gln Met Thr Leu Thr Glu Lys Val Asn Leu Thr Thr Gly Thr Gly
290 295 300
Trp Gln Leu Glu Arg Cys Val Gly Gln Thr Gly Ser Val Pro Arg Leu
305 310 315 320
Asn Ile Pro Ser Leu Cys Leu Gln Asp Ser Pro Leu Gly Ile Arg Phe
325 330 335
Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Val Asn Val Ala Ala Thr
340 345 350
Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Gln Ala Met Gly Glu Glu
355 360 365
Phe Ser Asp Lys Gly Ile Asp Val Gln Leu Gly Pro Ala Ala Gly Pro
370 375 380
Leu Gly Ala His Pro Asp Gly Gly Arg Asn Trp Glu Gly Phe Ser Pro
385 390 395 400
Asp Pro Ala Leu Thr Gly Val Leu Phe Ala Glu Thr Ile Lys Gly Ile
405 410 415
Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr Ile Met Asn Glu
420 425 430
Gln Glu His Phe Arg Gln Gln Pro Glu Ala Ala Gly Tyr Gly Phe Asn
435 440 445
Val Ser Asp Ser Leu Ser Ser Asn Val Asp Asp Lys Thr Met His Glu
450 455 460
Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala Gly Val Gly Ala
465 470 475 480
Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr Gly Cys Glu Asn
485 490 495
Ser Glu Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu Gly Phe Gln Gly
500 505 510
Phe Val Met Ser Asp Trp Thr Ala His His Ser Gly Val Gly Ala Ala
515 520 525
Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Val Thr Phe Asp Ser
530 535 540
Gly Thr Ser Phe Trp Gly Ala Asn Leu Thr Val Gly Val Leu Asn Gly
545 550 555 560
Thr Ile Pro Gln Trp Arg Val Asp Asp Met Ala Val Arg Ile Met Ala
565 570 575
Ala Tyr Tyr Lys Val Gly Arg Asp Thr Lys Tyr Thr Pro Pro Asn Phe
580 585 590
Ser Ser Trp Thr Arg Asp Glu Tyr Gly Phe Ala His Asn His Val Ser
595 600 605
Glu Gly Ala Tyr Glu Arg Val Asn Glu Phe Val Asp Val Gln Arg Asp
610 615 620
His Ala Asp Leu Ile Arg Arg Ile Gly Ala Gln Ser Thr Val Leu Leu
625 630 635 640
Lys Asn Lys Gly Ala Leu Pro Leu Ser Arg Lys Glu Lys Leu Val Ala
645 650 655
Leu Leu Gly Glu Asp Ala Gly Ser Asn Ser Trp Gly Ala Asn Gly Cys
660 665 670
Asp Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met Ala Trp Gly Ser
675 680 685
Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu Gln Ala Ile Gln
690 695 700
Asn Glu Val Leu Gln Gly Arg Gly Asn Val Phe Ala Val Thr Asp Ser
705 710 715 720
Trp Ala Leu Asp Lys Ile Ala Ala Ala Ala Arg Gln Ala Ser Val Ser
725 730 735
Leu Val Phe Val Asn Ser Asp Ser Gly Glu Gly Tyr Leu Ser Val Asp
740 745 750
Gly Asn Glu Gly Asp Arg Asn Asn Ile Thr Leu Trp Lys Asn Gly Asp
755 760 765
Asn Val Val Lys Thr Ala Ala Asn Asn Cys Asn Asn Thr Val Val Ile
770 775 780
Ile His Ser Val Gly Pro Val Leu Ile Asp Glu Trp Tyr Asp His Pro
785 790 795 800
Asn Val Thr Gly Ile Leu Trp Ala Gly Leu Pro Gly Gln Glu Ser Gly
805 810 815
Asn Ser Ile Ala Asp Val Leu Tyr Gly Arg Val Asn Pro Gly Ala Lys
820 825 830
Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr Gly Ser Pro Leu
835 840 845
Val Lys Asp Ala Asn Asn Gly Asn Gly Ala Pro Gln Ser Asp Phe Thr
850 855 860
Gln Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys Phe Asn Glu Thr
865 870 875 880
Pro Ile Tyr Glu Phe Gly Tyr Gly Leu Ser Tyr Thr Thr Phe Glu Leu
885 890 895
Ser Asp Leu His Val Gln Pro Leu Asn Ala Ser Arg Tyr Thr Pro Thr
900 905 910
Ser Gly Met Thr Glu Ala Ala Lys Asn Phe Gly Glu Ile Gly Asp Ala
915 920 925
Ser Glu Tyr Val Tyr Pro Glu Gly Leu Glu Arg Ile His Glu Phe Ile
930 935 940
Tyr Pro Trp Ile Asn Ser Thr Asp Leu Lys Ala Ser Ser Asp Asp Ser
945 950 955 960
Asn Tyr Gly Trp Glu Asp Ser Lys Tyr Ile Pro Glu Gly Ala Thr Asp
965 970 975
Gly Ser Ala Gln Pro Arg Leu Pro Ala Ser Gly Gly Ala Gly Gly Asn
980 985 990
Pro Gly Leu Tyr Glu Asp Leu Phe Arg Val Ser Val Lys Val Lys Asn
995 1000 1005
Thr Gly Asn Val Ala Gly Asp Glu Val Pro Gln Leu Tyr Val Ser
1010 1015 1020
Leu Gly Gly Pro Asn Glu Pro Lys Val Val Leu Arg Lys Phe Glu
1025 1030 1035
Arg Ile His Leu Ala Pro Ser Gln Glu Ala Val Trp Thr Thr Thr
1040 1045 1050
Leu Thr Arg Arg Asp Leu Ala Asn Trp Asp Val Ser Ala Gln Asp
105 1060 1065
Trp Thr Val Thr Pro Tyr Pro Lys Thr Ile Tyr Val Gly Asn Ser
1070 1075 1080
Ser Arg Lys Leu Pro Leu Gln Ala Ser Leu Pro Lys Ala Gln
1085 1090 1095
<210>65
<211>3294
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>65
atgcgttcct cccccctcct ccgctccgcc gttgtggccg ccctgccggt gttggccctt 60
gccgctgatg gcaggtccac ccgctactgg gactgctgca agccttcgtg cggctgggcc120
aagaaggctc ccgtgaacca gcctgtcttt tcctgcaacg ccaacttcca gcgtatcacg180
gacttcgacg ccaagtccgg ctgcgagccg ggcggtgtcg cctactcgtg cgccgaccag240
accccatggg ctgtgaacga cgacttcgcg ctcggttttg ctgccacctc tattgccggc300
agcaatgagg cgggctggtg ctgcgcctgc tacgagctca ccttcacatc cggtcctgtt360
gctggcaaga agatggtcgt ccagtccacc agcactggcg gtgatcttgg cagcaaccac420
ttcgatctca acatccccgg cggcggcgtc ggcatcttcg acggatgcac tccccagttc480
ggtggtctgc ccggccagcg ctacggcggc atctcgtccc gcaacgagtg cgatcggttc540
cccgacgccc tcaagcccgg ctgctactgg cgcttcgact ggttcaagaa cgccgacaat600
ccgagcttca gcttccgtca ggtccagtgc ccagccgagc tcgtcgctcg caccggatgc660
cgccgcaacg acgacggcaa cttccctgcc gtccagatcc ccatgcgttc ctcccccctc720
ctccgctccg ccgttgtggc cgccctgccg gtgttggccc ttgccaagga tgatctcgcg780
tactcccctc ctttctaccc ttccccatgg gcagatggtc agggtgaatg ggcggaagta840
tacaaacgcg ctgtagacat agtttcccag atgacgttga cagagaaagt caacttaacg900
actggaacag gatggcaact agagaggtgt gttggacaaa ctggcagtgt tcccagactc960
aacatcccca gcttgtgttt gcaggatagt cctcttggta ttcgtttctc ggactacaat1020
tcagctttcc ctgcgggtgt taatgtcgct gccacctggg acaagacgct cgcctacctt1080
cgtggtcagg caatgggtga ggagttcagt gataagggta ttgacgttca gctgggtcct1140
gctgctggcc ctctcggtgc tcatccggat ggcggtagaa actgggaaag tttctcacca1200
gatccagccc tcaccggtgt actttttgcg gagacgatta agggtattca agatgctggt1260
gtcattgcga cagctaagca ttatatcatg aacgaacaag agcatttccg ccaacaaccc1320
gaggctgcgg gttacggatt caacgtaagc gacagtttga gttccaacgt tgatgacaag1380
actatgcatg aattgtacct ctggcccttc gcggatgcag tacgcgctgg agtcggtgct1440
gttatgtgct cttacaacca aatcaacaac agctacggtt gcgagaatag cgaaactctg1500
aacaagcttt tgaaggcgga gcttggtttc caaggcttcg tcatgagtga ttggaccgct1560
caacacagcg gcgtaggcgc tgctttagca ggtctggata tgtcgatgcc cggtgatgtt1620
accttcgata gtggtacgtc tttctggggt gcaaacttga cggtcggtgt ccttaacggt1680
acaatccccc aatggcgtgt tgatgacatg gctgtccgta tcatggccgc ttattacaag1740
gttggccgcg acaccaaata cacccctccc aacttcagct cgtggaccag ggacgaatat1800
ggtttcgcgc ataaccatgt ttcggaaggt gcttacgaga gggtcaacga attcgtggac1860
gtgcaacgcg atcatgccga cctaatccgt cgcatcggcg cgcagagcac tgttctgctg1920
aagaacaagg gtgccttgcc cttgagccgc aaggaaaagc tggtcgccct tctgggagag1980
gatgcgggtt ccaactcgtg gggcgctaac ggctgtgatg accgtggttg cgataacggt2040
acccttgcca tggcctgggg tagcggtact gcgaatttcc catacctcgt gacaccagag2100
caggcgattc agaacgaagt tcttcagggc cgtggtaatg tcttcgccgt gaccgacagt2160
tgggcgctcg acaagatcgc tgcggctgcc cgccaggcca gcgtatctct cgtgttcgtc2220
aactccgact caggagaagg ctatcttagt gtggatggaa atgagggcga tcgtaacaac2280
atcactctgt ggaagaacgg cgacaatgtg gtcaagaccg cagcgaataa ctgtaacaac2340
accgttgtca tcatccactc cgtcggacca gttttgatcg atgaatggta tgaccacccc2400
aatgtcactg gtattctctg ggctggtctg ccaggccagg agtctggtaa ctccattgcc2460
gatgtgctgt acggtcgtgt caaccctggc gccaagtctc ctttcacttg gggcaagacc2520
cgggagtcgt atggttctcc cttggtcaag gatgccaaca atggcaacgg agcgccccag2580
tctgatttca cccagggtgt tttcatcgat taccgccatt tcgataagtt caatgagacc2640
cctatctacg agtttggcta cggcttgagc tacaccacct tcgagctctc cgacctccat2700
gttcagcccc tgaacgcgtc ccgatacact cccaccagtg gcatgactga agctgcaaag2760
aactttggtg aaattggcga tgcgtcggag tacgtgtatc cggaggggct ggaaaggatc2820
catgagttta tctatccctg gatcaactct accgacctga aggcatcgtc tgacgattct2880
aactacggct gggaagactc caagtatatt cccgaaggcg ccacggatgg gtctgcccag2940
ccccgtttgc ccgctagtgg tggtgccgga ggaaaccccg gtctgtacga ggatcttttc3000
cgcgtctctg tgaaggtcaa gaacacgggc aatgtcgccg gtgatgaagt tcctcagctg3060
tacgtttccc taggcggccc gaatgagccc aaggtggtac tgcgcaagtt tgagcgtatt3120
cacttggccc cttcgcagga ggccgtgtgg acaacgaccc ttacccgtcg tgaccttgca3180
aactgggacg tttcggctca ggactggacc gtcactcctt accccaagac gatctacgtt3240
ggaaactcct cacggaaact gccgctccag gcctcgctgc ctaaggccca gtaa 3294
<210>66
<211>1097
<212>PRT
<213>米曲霉(Aspergillus oryzae)
<400>66
Met Arg Ser Ser Pro Leu Leu Arg Ser Ala Val Val Ala Ala Leu Pro
1 5 10 15
Val Leu Ala Leu Ala Ala Asp Gly Arg Ser Thr Arg Tyr Trp Asp Cys
20 25 30
Cys Lys Pro Ser Cys Gly Trp Ala Lys Lys Ala Pro Val Asn Gln Pro
35 40 45
Val Phe Ser Cys Asn Ala Asn Phe Gln Arg Ile Thr Asp Phe Asp Ala
50 55 60
Lys Ser Gly Cys Glu Pro Gly Gly Val Ala Tyr Ser Cys Ala Asp Gln
65 70 75 80
Thr Pro Trp Ala Val Asn Asp Asp Phe Ala Leu Gly Phe Ala Ala Thr
85 90 95
Ser Ile Ala Gly Ser Asn Glu Ala Gly Trp Cys Cys Ala Cys Tyr Glu
100 105 110
Leu Thr Phe Thr Ser Gly Pro Val Ala Gly Lys Lys Met Val Val Gln
115 120 125
Ser Thr Ser Thr Gly Gly Asp Leu Gly Ser Asn His Phe Asp Leu Asn
130 135 140
Ile Pro Gly Gly Gly Val Gly Ile Phe Asp Gly Cys Thr Pro Gln Phe
145 150 155 160
Gly Gly Leu Pro Gly Gln Arg Tyr Gly Gly Ile Ser Ser Arg Asn Glu
165 170 175
Cys Asp Arg Phe Pro Asp Ala Leu Lys Pro Gly Cys Tyr Trp Arg Phe
180 185 190
Asp Trp Phe Lys Asn Ala Asp Asn Pro Ser Phe Ser Phe Arg Gln Val
195 200 205
Gln Cys Pro Ala Glu Leu Val Ala Arg Thr Gly Cys Arg Arg Asn Asp
210 215 220
Asp Gly Asn Phe Pro Ala Val Gln Ile Pro Met Arg Ser Ser Pro Leu
225 230 235 240
Leu Arg Ser Ala Val Val Ala Ala Leu Pro Val Leu Ala Leu Ala Lys
245 250 255
Asp Asp Leu Ala Tyr Ser Pro Pro Phe Tyr Pro Ser Pro Trp Ala Asp
260 265 270
Gly Gln Gly Glu Trp Ala Glu Val Tyr Lys Arg Ala Val Asp Ile Val
275 280 285
Ser Gln Met Thr Leu Thr Glu Lys Val Asn Leu Thr Thr Gly Thr Gly
290 295 300
Trp Gln Leu Glu Arg Cys Val Gly Gln Thr Gly Ser Val Pro Arg Leu
305 310 315 320
Asn Ile Pro Ser Leu Cys Leu Gln Asp Ser Pro Leu Gly Ile Arg Phe
325 330 335
Ser Asp Tyr Asn Ser Ala Phe Pro Ala Gly Val Asn Val Ala Ala Thr
340 345 350
Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Gln Ala Met Gly Glu Glu
355 360 365
Phe Ser Asp Lys Gly Ile Asp Val Gln Leu Gly Pro Ala Ala Gly Pro
370 375 380
Leu Gly Ala His Pro Asp Gly Gly Arg Asn Trp Glu Ser Phe Ser Pro
385 390 395 400
Asp Pro Ala Leu Thr Gly Val Leu Phe Ala Glu Thr Ile Lys Gly Ile
405 410 415
Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr Ile Met Asn Glu
420 425 430
Gln Glu His Phe Arg Gln Gln Pro Glu Ala Ala Gly Tyr Gly Phe Asn
435 440 445
Val Ser Asp Ser Leu Ser Ser Asn Val Asp Asp Lys Thr Met His Glu
450 455 460
Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala Gly Val Gly Ala
465 470 475 480
Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr Gly Cys Glu Asn
485 490 495
Ser Glu Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu Gly Phe Gln Gly
500 505 510
Phe Val Met Ser Asp Trp Thr Ala Gln His Ser Gly Val Gly Ala Ala
515 520 525
Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Val Thr Phe Asp Ser
530 535 540
Gly Thr Ser Phe Trp Gly Ala Asn Leu Thr Val Gly Val Leu Asn Gly
545 550 555 560
Thr Ile Pro Gln Trp Arg Val Asp Asp Met Ala Val Arg Ile Met Ala
565 570 575
Ala Tyr Tyr Lys Val Gly Arg Asp Thr Lys Tyr Thr Pro Pro Asn Phe
580 585 590
Ser Ser Trp Thr Arg Asp Glu Tyr Gly Phe Ala His Asn His Val Ser
595 600 605
Glu Gly Ala Tyr Glu Arg Val Asn Glu Phe Val Asp Val Gln Arg Asp
610 615 620
His Ala Asp Leu Ile Arg Arg Ile Gly Ala Gln Ser Thr Val Leu Leu
625 630 635 640
Lys Asn Lys Gly Ala Leu Pro Leu Ser Arg Lys Glu Lys Leu Val Ala
645 650 655
Leu Leu Gly Glu Asp Ala Gly Ser Asn Ser Trp Gly Ala Asn Gly Cys
660 665 670
Asp Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met Ala Trp Gly Ser
675 680 685
Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu Gln Ala Ile Gln
690 695 700
Asn Glu Val Leu Gln Gly Arg Gly Asn Val Phe Ala Val Thr Asp Ser
705 710 715 720
Trp Ala Leu Asp Lys Ile Ala Ala Ala Ala Arg Gln Ala Ser Val Ser
725 730 735
Leu Val Phe Val Asn Ser Asp Ser Gly Glu Gly Tyr Leu Ser Val Asp
740 745 750
Gly Asn Glu Gly Asp Arg Asn Asn Ile Thr Leu Trp Lys Asn Gly Asp
755 760 765
Asn Val Val Lys Thr Ala Ala Asn Asn Cys Asn Asn Thr Val Val Ile
770 775 780
Ile His Ser Val Gly Pro Val Leu Ile Asp Glu Trp Tyr Asp His Pro
785 790 795 800
Asn Val Thr Gly Ile Leu Trp Ala Gly Leu Pro Gly Gln Glu Ser Gly
805 810 815
Asn Ser Ile Ala Asp Val Leu Tyr Gly Arg Val Asn Pro Gly Ala Lys
820 825 830
Ser Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr Gly Ser Pro Leu
835 840 845
Val Lys Asp Ala Asn Asn Gly Asn Gly Ala Pro Gln Ser Asp Phe Thr
850 855 860
Gln Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys Phe Asn Glu Thr
865 870 875 880
Pro Ile Tyr Glu Phe Gly Tyr Gly Leu Ser Tyr Thr Thr Phe Glu Leu
885 890 895
Ser Asp Leu His Val Gln Pro Leu Asn Ala Ser Arg Tyr Thr Pro Thr
900 905 910
Ser Gly Met Thr Glu Ala Ala Lys Asn Phe Gly Glu Ile Gly Asp Ala
915 920 925
Ser Glu Tyr Val Tyr Pro Glu Gly Leu Glu Arg Ile His Glu Phe Ile
930 935 940
Tyr Pro Trp Ile Asn Ser Thr Asp Leu Lys Ala Ser Ser Asp Asp Ser
945 950 955 960
Asn Tyr Gly Trp Glu Asp Ser Lys Tyr Ile Pro Glu Gly Ala Thr Asp
965 970 975
Gly Ser Ala Gln Pro Arg Leu Pro Ala Ser Gly Gly Ala Gly Gly Asn
980 985 990
Pro Gly Leu Tyr Glu Asp Leu Phe Arg Val Ser Val Lys Val Lys Asn
995 1000 1005
Thr Gly Asn Val Ala Gly Asp Glu Val Pro Gln Leu Tyr Val Ser
1010 1015 1020
Leu Gly Gly Pro Asn Glu Pro Lys Val Val Leu Arg Lys Phe Glu
1025 1030 1035
Arg Ile His Leu Ala Pro Ser Gln Glu Ala Val Trp Thr Thr Thr
1040 1045 1050
Leu Thr Arg Arg Asp Leu Ala Asn Trp Asp Val Ser Ala Gln Asp
1055 1060 1065
Trp Thr Val Thr Pro Tyr Pro Lys Thr Ile Tyr Val Gly Asn Ser
1070 1075 1080
Ser Arg Lys Leu Pro Leu Gln Ala Ser Leu Pro Lys Ala Gln
1085 1090 1095
<210>67
<211>1415
<212>DNA
<213>烟曲霉(Aspergillus fumigatus)
<400>67
atggtccatc tatcttcatt ggcagcagcc ctggctgctc tgcctctgta tgtttaccca 60
ctcacgagag gaggaacagc tttgacattg ctatagtgta tatggagctg gcctgaacac120
agcagccaaa gccaaaggac taaagtactt tggttccgcc acggacaatc cagagctcac180
ggactctgcg tatgtcgcgc aactgagcaa caccgatgat tttggtcaaa tcacacccgg240
aaactccatg aaggtttgct tacgtctgcc tccctggagc attgcctcaa aagctaattg300
gttgttttgt ttggatagtg ggatgccacc gagccttctc agaattcttt ttcgttcgca360
aatggagacg ccgtggtcaa tctggcgaac aagaatggcc agctgatgcg atgccatact420
ctggtctggc acagtcagct accgaactgg ggtatgtaaa cgtcttgtct attctcaaat480
actctctaac agttgacagt ctctagcggg tcatggacca atgcgaccct tttggcggcc540
atgaagaatc atatcaccaa tgtggttact cactacaagg ggaagtgcta cgcctgggat600
gttgtcaatg aaggtttgtt gctccatcta tcctcaatag ttcttttgaa actgacaagc660
ctgtcaatct agccctgaac gaggacggta ctttccgtaa ctctgtcttc taccagatca720
tcggcccagc atacattcct attgcgttcg ccacggctgc tgccgcagat cccgacgtga780
aactctacta caacgactac aacattgaat actcaggcgc caaagcgact gctgcgcaga840
atatcgtcaa gatgatcaag gcctacggcg cgaagatcga cggcgtcggc ctccaggcac900
actttatcgt cggcagcact ccgagtcaat cggatctgac gaccgtcttg aagggctaca960
ctgctctcgg cgttgaggtg gcctataccg aacttgacat ccgcatgcag ctgccctcga1020
ccgccgcaaa gctggcccag cagtccactg acttccaagg cgtggccgca gcatgcgtta1080
gcaccactgg ctgcgtgggt gtcactatct gggactggac cgacaagtac tcctgggtcc1140
ccagcgtgtt ccaaggctac ggcgccccat tgccttggga tgagaactat gtgaagaagc1200
cagcgtacga tggcctgatg gcgggtcttg gagcaagcgg ctccggcacc acaacgacca1260
ctactactac ttctactacg acaggaggta cggaccctac tggagtcgct cagaaatggg1320
gacagtgtgg cggtattggc tggaccgggc caacaacttg tgtcagtggt accacttgcc1380
aaaagctgaa tgactggtac tcacagtgcc tgtaa 1415
<210>68
<211>397
<212>PRT
<213>烟曲霉(Aspergillus fumigatus)
<400>68
Met Val His Leu Ser Ser Leu Ala Ala Ala Leu Ala Ala Leu Pro Leu
1 5 10 15
Val Tyr Gly Ala Gly Leu Asn Thr Ala Ala Lys Ala Lys Gly Leu Lys
20 25 30
Tyr Phe Gly Ser Ala Thr Asp Asn Pro Glu Leu Thr Asp Ser Ala Tyr
35 40 45
Val Ala Gln Leu Ser Asn Thr Asp Asp Phe Gly Gln Ile Thr Pro Gly
50 55 60
Asn Ser Met Lys Trp Asp Ala Thr Glu Pro Ser Gln Asn Ser Phe Ser
65 70 75 80
Phe Ala Asn Gly Asp Ala Val Val Asn Leu Ala Asn Lys Asn Gly Gln
85 90 95
Leu Met Arg Cys His Thr Leu Val Trp His Ser Gln Leu Pro Asn Trp
100 105 110
Val Ser Ser Gly Ser Trp Thr Asn Ala Thr Leu Leu Ala Ala Met Lys
115 120 125
Asn His Ile Thr Asn Val Val Thr His Tyr Lys Gly Lys Cys Tyr Ala
130 135 140
Trp Asp Val Val Asn Glu Ala Leu Asn Glu Asp Gly Thr Phe Arg Asn
145 150 155 160
Ser Val Phe Tyr Gln Ile Ile Gly Pro Ala Tyr Ile Pro Ile Ala Phe
165 170 175
Ala Thr Ala Ala Ala Ala Asp Pro Asp Val Lys Leu Tyr Tyr Asn Asp
180 185 190
Tyr Asn Ile Glu Tyr Ser Gly Ala Lys Ala Thr Ala Ala Gln Asn Ile
195 200 205
Val Lys Met Ile Lys Ala Tyr Gly Ala Lys Ile Asp Gly Val Gly Leu
210 215 220
Gln Ala His Phe Ile Val Gly Ser Thr Pro Ser Gln Ser Asp Leu Thr
225 230 235 240
Thr Val Leu Lys Gly Tyr Thr Ala Leu Gly Val Glu Val Ala Tyr Thr
245 250 255
Glu Leu Asp Ile Arg Met Gln Leu Pro Ser Thr Ala Ala Lys Leu Ala
260 265 270
Gln Gln Ser Thr Asp Phe Gln Gly Val Ala Ala Ala Cys Val Ser Thr
275 280 285
Thr Gly Cys Val Gly Val Thr Ile Trp Asp Trp Thr Asp Lys Tyr Ser
290 295 300
Trp Val Pro Ser Val Phe Gln Gly Tyr Gly Ala Pro Leu Pro Trp Asp
305 310 315 320
Glu Asn Tyr Val Lys Lys Pro Ala Tyr Asp Gly Leu Met Ala Gly Leu
325 330 335
Gly Ala Ser Gly Ser Gly Thr Thr Thr Thr Thr Thr Thr Thr Ser Thr
340 345 350
Thr Thr Gly Gly Thr Asp Pro Thr Gly Val Ala Gln Lys Trp Gly Gln
355 360 365
Cys Gly Gly Ile Gly Trp Thr Gly Pro Thr Thr Cys Val Ser Gly Thr
370 375 380
Thr Cys Gln Lys Leu Asn Asp Trp Tyr Ser Gln Cys Leu
385 390 395
<210>69
<211> 2564
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>69
ggacagccgg acgcaatggt gaataacgca gctcttctcg ccgccctgtc ggctctcctg 60
cccacggccc tggcgcagaa caatcaaaca tacgccaact actctgctca gggccagcct120
gatctctacc ccgagacact tgccacgctc acactctcgt tccccgactg cgaacatggc180
cccctcaaga acaatctcgt ctgtgactca tcggccggct atgtagagcg agcccaggcc240
ctcatctcgc tcttcaccct cgaggagctc attctcaaca cgcaaaactc gggccccggc300
gtgcctcgcc tgggtcttcc gaactaccaa gtctggaatg aggctctgca cggcttggac360
cgcgccaact tcgccaccaa gggcggccag ttcgaatggg cgacctcgtt ccccatgccc420
atcctcacta cggcggccct caaccgcaca ttgatccacc agattgccga catcatctcg480
acccaagctc gagcattcag caacagcggc cgttacggtc tcgacgtcta tgcgccaaac540
gtcaatggct tccgaagccc cctctggggc cgtggccagg agacgcccgg cgaagacgcc600
tttttcctca gctccgccta tacttacgag tacatcacgg gcatccaggg tggcgtcgac660
cctgagcacc tcaaggttgc cgccacggtg aagcactttg ccggatacga cctcgagaac720
tggaacaacc agtcccgtct cggtttcgac gccatcataa ctcagcagga cctctccgaa780
tactacactc cccagttcct cgctgcggcc cgttatgcaa agtcacgcag cttgatgtgc840
gcatacaact ccgtcaacgg cgtgcccagc tgtgccaaca gcttcttcct gcagacgctt900
ttgcgcgaga gctggggctt ccccgaatgg ggatacgtct cgtccgattg cgatgccgtc960
tacaacgttt tcaaccctca tgactacgcc agcaaccagt cgtcagccgc cgccagctca1020
ctgcgagccg gcaccgatat cgactgcggt cagacttacc cgtggcacct caacgagtcc1080
tttgtggccg gcgaagtctc ccgcggcgag atcgagcggt ccgtcacccg tctgtacgcc1140
aacctcgtcc gtctcggata cttcgacaag aagaaccagt accgctcgct cggttggaag1200
gatgtcgtca agactgatgc ctggaacatc tcgtacgagg ctgctgttga gggcatcgtc1260
ctgctcaaga acgatggcac tctccctctg tccaagaagg tgcgcagcat tgctctgatc1320
ggaccatggg ccaatgccac aacccaaatg caaggcaact actatggccc tgccccatac1380
ctcatcagcc ctctggaagc tgctaagaag gccggctatc acgtcaactt tgaactcggc1440
acagagatcg ccggcaacag caccactggc tttgccaagg ccattgctgc cgccaagaag1500
tcggatgcca tcatctacct cggtggaatt gacaacacca ttgaacagga gggcgctgac1560
cgcacggaca ttgcttggcc cggtaatcag ctggatctca tcaagcagct cagcgaggtc1620
ggcaaacccc ttgtcgtcct gcaaatgggc ggtggtcagg tagactcatc ctcgctcaag1680
agcaacaaga aggtcaactc cctcgtctgg ggcggatatc ccggccagtc gggaggcgtt1740
gccctcttcg acattctctc tggcaagcgt gctcctgccg gccgactggt caccactcag1800
tacccggctg agtatgttca ccaattcccc cagaatgaca tgaacctccg acccgatgga1860
aagtcaaacc ctggacagac ttacatctgg tacaccggca aacccgtcta cgagtttggc1920
agtggtctct tctacaccac cttcaaggag actctcgcca gccaccccaa gagcctcaag1980
ttcaacacct catcgatcct ctctgctcct caccccggat acacttacag cgagcagatt2040
cccgtcttca ccttcgaggc caacatcaag aactcgggca agacggagtc cccatatacg2100
gccatgctgt ttgttcgcac aagcaacgct ggcccagccc cgtacccgaa caagtggctc2160
gtcggattcg accgacttgc cgacatcaag cctggtcact cttccaagct cagcatcccc2220
atccctgtca gtgctctcgc ccgtgttgat tctcacggaa accggattgt ataccccggc2280
aagtatgagc tagccttgaa caccgacgag tctgtgaagc ttgagtttga gttggtggga2340
gaagaggtaa cgattgagaa ctggccgttg gaggagcaac agatcaagga tgctacacct2400
gacgcataag ggttttaatg atgttgttat gacaaacggg tagagtagtt aatgatggaa2460
taggaagagg ccatagtttt ctgtttgcaa accatttttg ccattgcgaa aaaaaaaaaa2520
aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaaaaaaaa aaaa 2564
<210>70
<211>780
<212>PRT
<213>里氏木霉(Trichoderma reesei)
<400>70
Met Val Asn Asn Ala Ala Leu Leu Ala Ala Leu Ser Ala Leu Leu Pro
1 5 10 15
Thr Ala Leu Ala Gln Asn Asn Gln Thr Tyr Ala Asn Tyr Ser Ala Gln
20 25 30
Gly Gln Pro Asp Leu Tyr Pro Glu Thr Leu Ala Thr Leu Thr Leu Ser
35 40 45
Phe Pro Asp Cys Glu His Gly Pro Leu Lys Asn Asn Leu Val Cys Asp
50 55 60
Ser Ser Ala Gly Tyr Val Glu Arg Ala Gln Ala Leu Ile Ser Leu Phe
65 70 75 80
Thr Leu Glu Glu Leu Ile Leu Asn Thr Gln Asn Ser Gly Pro Gly Val
85 90 95
Pro Arg Leu Gly Leu Pro Asn Tyr Gln Val Trp Asn Glu Ala Leu His
100 105 110
Gly Leu Asp Arg Ala Asn Phe Ala Thr Lys Gly Gly Gln Phe Glu Trp
115 120 125
Ala Thr Ser Phe Pro Met Pro Ile Leu Thr Thr Ala Ala Leu Asn Arg
130 135 140
Thr Leu Ile His Gln Ile Ala Asp Ile Ile Ser Thr Gln Ala Arg Ala
145 150 155 160
Phe Ser Asn Ser Gly Arg Tyr Gly Leu Asp Val Tyr Ala Pro Asn Val
165 170 175
Asn Gly Phe Arg Ser Pro Leu Trp Gly Arg Gly Gln Glu Thr Pro Gly
180 185 190
Glu Asp Ala Phe Phe Leu Ser Ser Ala Tyr Thr Tyr Glu Tyr Ile Thr
195 200 205
Gly Ile Gln Gly Gly Val Asp Pro Glu His Leu Lys Val Ala Ala Thr
210 215 220
Val Lys His Phe Ala Gly Tyr Asp Leu Glu Asn Trp Asn Asn Gln Ser
225 230 235 240
Arg Leu Gly Phe Asp Ala Ile Ile Thr Gln Gln Asp Leu Ser Glu Tyr
245 250 255
Tyr Thr Pro Gln Phe Leu Ala Ala Ala Arg Tyr Ala Lys Ser Arg Ser
260 265 270
Leu Met Cys Ala Tyr Asn Ser Val Asn Gly Val Pro Ser Cys Ala Asn
275 280 285
Ser Phe Phe Leu Gln Thr Leu Leu Arg Glu Ser Trp Gly Phe Pro Glu
290 295 300
Trp Gly Tyr Val Ser Ser Asp Cys Asp Ala Val Tyr Asn Val Phe Asn
305 310 315 320
Pro His Asp Tyr Ala Ser Asn Gln Ser Ser Ala Ala Ala Ser Ser Leu
325 330 335
Arg Ala Gly Thr Asp Ile Asp Cys Gly Gln Thr Tyr Pro Trp His Leu
340 345 350
Asn Glu Ser Phe Val Ala Gly Glu Val Ser Arg Gly Glu Ile Glu Arg
355 360 365
Ser Val Thr Arg Leu Tyr Ala Asn Leu Val Arg Leu Gly Tyr Phe Asp
370 375 380
Lys Lys Asn Gln Tyr Arg Ser Leu Gly Trp Lys Asp Val Val Lys Thr
385 390 395 400
Asp Ala Trp Asn Ile Ser Tyr Glu Ala Ala Val Glu Gly Ile Val Leu
405 410 415
Leu Lys Asn Asp Gly Thr Leu Pro Leu Ser Lys Lys Val Arg Ser Ile
420 425 430
Ala Leu Ile Gly Pro Trp Ala Asn Ala Thr Thr Gln Met Gln Gly Asn
435 440 445
Tyr Tyr Gly Pro Ala Pro Tyr Leu Ile Ser Pro Leu Glu Ala Ala Lys
450 455 460
Lys Ala Gly Tyr His Val Asn Phe Glu Leu Gly Thr Glu Ile Ala Gly
465 470 475 480
Asn Ser Thr Thr Gly Phe Ala Lys Ala Ile Ala Ala Ala Lys Lys Ser
485 490 495
Asp Ala Ile Ile Tyr Leu Gly Gly Ile Asp Asn Thr Ile Glu Gln Glu
500 505 510
Gly Ala Asp Arg Thr Asp Ile Ala Trp Pro Gly Asn Gln Leu Asp Leu
515 520 525
Ile Lys Gln Leu Ser Glu Val Gly Lys Pro Leu Val Val Leu Gln Met
530 535 540
Gly Gly Gly Gln Val Asp Ser Ser Ser Leu Lys Ser Asn Lys Lys Val
545 550 555 560
Asn Ser Leu Val Trp Gly Gly Tyr Pro Gly Gln Ser Gly Gly Val Ala
565 570 575
Leu Phe Asp Ile Leu Ser Gly Lys Arg Ala Pro Ala Gly Arg Leu Val
580 585 590
Thr Thr Gln Tyr Pro Ala Glu Tyr Val His Gln Phe Pro Gln Asn Asp
595 600 605
Met Asn Leu Arg Pro Asp Gly Lys Ser Asn Pro Gly Gln Thr Tyr Ile
610 615 620
Trp Tyr Thr Gly Lys Pro Val Tyr Glu Phe Gly Ser Gly Leu Phe Tyr
625 630 635 640
Thr Thr Phe Lys Glu Thr Leu Ala Ser His Pro Lys Ser Leu Lys Phe
645 650 655
Asn Thr Ser Ser Ile Leu Ser Ala Pro His Pro Gly Tyr Thr Tyr Ser
660 665 670
Glu Gln Ile Pro Val Phe Thr Phe Glu Ala Asn Ile Lys Asn Ser Gly
675 680 685
Lys Thr Glu Ser Pro Tyr Thr Ala Met Leu Phe Val Arg Thr Ser Asn
690 695 700
Ala Gly Pro Ala Pro Tyr Pro Asn Lys Trp Leu Val Gly Phe Asp Arg
705 710 715 720
Leu Ala Asp Ile Lys Pro Gly His Ser Ser Lys Leu Ser Ile Pro Ile
725 730 735
Pro Val Ser Ala Leu Ala Arg Val Asp Ser His Gly Asn Arg Ile Val
740 745 750
Tyr Pro Gly Lys Tyr Glu Leu Ala Leu Asn Thr Asp Glu Ser Val Lys
755 760 765
Leu Glu Phe Glu Leu Val Gly Glu Glu Val Thr Ile
770 775 780
<210>71
<211>37
<212>DNA
<213>烟曲霉(Aspergillus fumigatus)
<400>71
actggattta ccatgacttt gtccaagatc acttcca 37
<210>72
<211>40
<212>DNA
<213>烟曲霉(Aspergillus fumigatus)
<400>72
tcacctctag ttaattaagc gttgaacagt gcaggaccag 40
<210>73
<211> 17
<212>DNA
<213>烟曲霉(Aspergillus fumigatus)
<400>73
tgtcccttgt cgatgcg 17
<210>74
<211> 17
<212>DNA
<213>烟曲霉(Aspergillus fumigatus)
<400>74
cacatgactt ggcttcc 17
<210>75
<211>56
<212>DNA
<213>烟曲霉(Aspergillus fumigatus)
<400>75
gcagaactac ccccagtgta tcaacctgca agtgaccggt ggcggcagtg ctcagg 56
<210>76
<211>56
<212>DNA
<213>烟曲霉(Aspergillus fumigatus)
<400>76
cctgagcact gccgccaccg gtcacttgca ggttgataca ctgggggtag ttctgc 56
<210>77
<211>39
<212>DNA
<213>烟曲霉(Aspergillus fumigatus)
<400>77
gcagccggtt cacaggtgga actgcagtgg acgacgtgg 39
<210>78
<211>39
<212>DNA
<213>烟曲霉(Aspergillus fumigatus)
<400>78
ccacgtcgtc cactgcagtt ccacctgtga accggctgc 39
<210>79
<211>38
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>79
actggattta ccatgaacaa gtccgtggct ccattgct 38
<210>80
<211>38
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>80
tcacctctag ttaattaact actttcttgc gagacacg 38
<210>81
<211>25
<212>DNA
<213>烟曲霉(Aspergillus fumigatus)
<400>81
gggcatgctg gcctccacct tctcc 25
<210>82
<211>30
<212>DNA
<213>烟曲霉(Aspergillus fumigatus)
<400>82
gggttaatta actacaggca ctgagagtaa 30
<210>83
<211>37
<212>DNA
<213>烟曲霉(Aspergillus fumigatus)
<400>83
actggattta ccatgaagca ccttgcatct tccatcg 37
<210>84
<211>34
<212>DNA
<213>烟曲霉(Aspergillus fumigatus)
<400>84
tcacctctag ttaattaaaa ggacgggtta gcgt 34
<210>85
<211>22
<212>DNA
<213>烟曲霉(Aspergillus fumigatus)
<400>85
gtgaataacg cagctcttct cg 22
<210>86
<211>25
<212>DNA
<213>烟曲霉(Aspergillus fumigatus)
<400>86
ccttaattaa ttatgcgtca ggtgt 25
<210>87
<211>33
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>87
cggactgcgc accatggtga ataacgcagc tct 33
<210>88
<211>35
<212>DNA
<213>里氏木霉(Trichoderma reesei)
<400>88
tcgccacgga gcttattatg cgtcaggtgt agcat 35
<210>89
<211>37
<212>DNA
<213>棘孢曲霉(Aspergillus aculeatus)
<400>89
tcttggatcc accatggtcg gactgctttc aatcacc 37
<210>90
<211>34
<212>DNA
<213>棘孢曲霉(Aspergillus aculeatus)
<400>90
ttaactcgag tcacagacac tgcgagtaat agtc 34
<210>91
<211>33
<212>DNA
<213>棘孢曲霉(Aspergillus aculeatus)
<400>91
cggactgcgc accatggtcg gactgctttc aat 33
<210>92
<211>35
<212>DNA
<213>棘孢曲霉(Aspergillus aculeatus)
<400>92
tcgccacgga gcttatcaca gacactgcga gtaat 35

Claims (37)

1.一种具有纤维素分解增强活性的亲本多肽的变体,其在对应于SEQ ID NO:2的成熟多肽的位置75,77,179,181,和183的位置包含取代,其中所述变体具有纤维素分解增强活性;
其中所述具有纤维素分解增强活性的亲本多肽与SEQ ID NO:2的成熟多肽具有100%序列同一性;
其中在对应于位置75的位置的取代是缬氨酸;
其中在对应于位置77的位置的取代是亮氨酸;
其中在对应于位置179的位置的取代是异亮氨酸;
其中在对应于位置181的位置的取代是亮氨酸;
其中在对应于位置183的位置的取代是缬氨酸;以及
其中取代的数量为5个取代。
2.权利要求1的变体,其中所述具有纤维素分解增强活性的亲本多肽由多核苷酸编码,所述多核苷酸与SEQ ID NO:1的成熟多肽编码序列或其cDNA序列具有100%序列同一性。
3.权利要求1的变体,其中所述具有纤维素分解增强活性的亲本多肽由SEQ ID NO:2的成熟多肽组成。
4.权利要求1-3任一项的变体,其中取代选自下组:I75V,F77L,F179I,I181L,和I183V。
5.权利要求1-3任一项的变体,其组成为SEQ ID NO:2的成熟多肽的取代I75V+F77L+F179I+I181L+I183V。
6.一种分离的多核苷酸,其编码权利要求1-5任一项的变体。
7.一种核酸构建体,其包含权利要求6的多核苷酸。
8.一种表达载体,其包含权利要求6的多核苷酸。
9.一种宿主细胞,其包含权利要求6的多核苷酸。
10.一种产生变体的方法,其包括:(a)在适于表达所述变体的条件下培养权利要求9的宿主细胞;和(b)回收所述变体。
11.一种产生权利要求1-5任一项的变体的方法,其包括:(a)在有助于产生所述变体的条件下培养包含编码所述变体的多核苷酸的转基因植物或植物细胞;和(b)回收所述变体。
12.一种用于获得具有纤维素分解增强活性的亲本多肽的变体的方法,其包括:在亲本多肽的对应于SEQ ID NO:2的成熟多肽的位置75,77,179,181,和183的位置处导入取代,其中所述变体具有纤维素分解增强活性和其中所述具有纤维素分解增强活性的亲本多肽与SEQ ID NO:2的成熟多肽具有100%序列同一性;其中在对应于位置75的位置的取代是缬氨酸;其中在对应于位置77的位置的取代是亮氨酸;其中在对应于位置179的位置的取代是异亮氨酸;其中在对应于位置181的位置的取代是亮氨酸;其中在对应于位置183的位置的取代是缬氨酸;以及其中取代的数量为5个取代;和回收所述变体。
13.一种用于降解或转化纤维素材料的方法,其包括在权利要求1-5任一项的变体的存在下用酶组合物处理所述纤维素材料。
14.权利要求13的方法,其中所述纤维素材料经预处理。
15.权利要求13的方法,其进一步包括回收经降解的或转化的纤维素材料。
16.权利要求13的方法,其中所述酶组合物包含一种或多种选自下组的酶:纤维素酶、具有纤维素分解增强活性的多肽、半纤维素酶、棒曲霉素、酯酶、漆酶、木质素分解酶、果胶酶、过氧化物酶、蛋白酶和膨胀素。
17.权利要求16的方法,其中所述纤维素酶是一种或多种选自下组的酶:内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶。
18.权利要求16的方法,其中所述半纤维素酶是一种或多种选自下组的酶:木聚糖酶、乙酰木聚糖酯酶、阿魏酸酯酶、阿拉伯呋喃糖苷酶、木糖苷酶和葡糖醛酸糖苷酶。
19.权利要求13-18任一项的方法,其中所述经降解的纤维素材料是糖。
20.权利要求19的方法,其中所述糖选自下组:葡萄糖、木糖、甘露糖、半乳糖和阿拉伯糖。
21.一种用于产生发酵产物的方法,其包括(a)在权利要求1-5任一项的变体的存在下用酶组合物糖化纤维素材料;(b)用一种或多种发酵微生物发酵经糖化的纤维素材料以产生发酵产物;和(c)从发酵回收所述发酵产物。
22.权利要求21的方法,其中所述纤维素材料经预处理。
23.权利要求21的方法,其中所述酶组合物包含一种或多种选自下组的酶:纤维素酶、具有纤维素分解增强活性的多肽、半纤维素酶、棒曲霉素、酯酶、漆酶、木质素分解酶、果胶酶、过氧化物酶、蛋白酶和膨胀素。
24.权利要求23的方法,其中所述纤维素酶是一种或多种选自下组的酶:内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶。
25.权利要求23的方法,其中所述半纤维素酶是一种或多种选自下组的酶:木聚糖酶、乙酰木聚糖酯酶、阿魏酸酯酶、阿拉伯呋喃糖苷酶、木糖苷酶和葡糖醛酸糖苷酶。
26.权利要求21-25任一项的方法,其中步骤(a)和(b)在同时糖化和发酵中同时进行。
27.权利要求21-25任一项的方法,其中所述发酵产物是醇、有机酸、酮、氨基酸或气体。
28.一种发酵纤维素材料的方法,其包括用一种或多种发酵微生物发酵所述纤维素材料,其中所述纤维素材料是在权利要求1-5任一项的变体存在下用酶组合物糖化的。
29.权利要求28的方法,其中所述纤维素材料在糖化之前经预处理。
30.权利要求28的方法,其中所述酶组合物包含一种或多种选自下组的酶:纤维素酶、具有纤维素分解增强活性的多肽、半纤维素酶、棒曲霉素、酯酶、漆酶、木质素分解酶、果胶酶、过氧化物酶、蛋白酶和膨胀素。
31.权利要求30的方法,其中所述纤维素酶是一种或多种选自下组的酶:内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶。
32.权利要求30的方法,其中所述半纤维素酶是一种或多种选自下组的酶:木聚糖酶、乙酰木聚糖酯酶、阿魏酸酯酶、阿拉伯呋喃糖苷酶、木糖苷酶和葡糖醛酸糖苷酶。
33.权利要求28的方法,其中所述纤维素材料的发酵产生发酵产物。
34.权利要求33的方法,其进一步包括从发酵回收发酵产物。
35.权利要求33或34任一项的方法,其中所述发酵产物是醇、有机酸、酮、氨基酸或气体。
36.一种去污剂组合物,其包含权利要求1-5任一项的变体和表面活性剂。
37.一种全培养液配制物或细胞培养组合物,其包含权利要求1-5任一项的变体。
CN201180057773.8A 2010-09-30 2011-09-29 具有纤维素分解增强活性的多肽变体及其编码多核苷酸 Active CN103237891B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710470220.4A CN107345226A (zh) 2010-09-30 2011-09-29 具有纤维素分解增强活性的多肽变体及其编码多核苷酸

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US38852710P 2010-09-30 2010-09-30
US61/388,527 2010-09-30
PCT/US2011/054036 WO2012044836A1 (en) 2010-09-30 2011-09-29 Variants of polypeptides having cellulolytic enhancing activity and polynucleotides encoding same

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN201710470220.4A Division CN107345226A (zh) 2010-09-30 2011-09-29 具有纤维素分解增强活性的多肽变体及其编码多核苷酸

Publications (2)

Publication Number Publication Date
CN103237891A CN103237891A (zh) 2013-08-07
CN103237891B true CN103237891B (zh) 2017-07-14

Family

ID=44789633

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201180057773.8A Active CN103237891B (zh) 2010-09-30 2011-09-29 具有纤维素分解增强活性的多肽变体及其编码多核苷酸
CN201710470220.4A Pending CN107345226A (zh) 2010-09-30 2011-09-29 具有纤维素分解增强活性的多肽变体及其编码多核苷酸

Family Applications After (1)

Application Number Title Priority Date Filing Date
CN201710470220.4A Pending CN107345226A (zh) 2010-09-30 2011-09-29 具有纤维素分解增强活性的多肽变体及其编码多核苷酸

Country Status (7)

Country Link
US (1) US9816082B2 (zh)
EP (1) EP2622070B1 (zh)
CN (2) CN103237891B (zh)
DK (1) DK2622070T3 (zh)
ES (1) ES2599613T3 (zh)
MX (1) MX2013003237A (zh)
WO (1) WO2012044836A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107345226A (zh) * 2010-09-30 2017-11-14 诺维信股份有限公司 具有纤维素分解增强活性的多肽变体及其编码多核苷酸

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103620043A (zh) * 2011-06-28 2014-03-05 诺维信公司 来自酶处理蔗渣的沼气
EP3219794B1 (en) 2011-11-21 2019-09-11 Novozymes A/S Gh61 polypeptide variants and polynucleotides encoding same
EP2841567B1 (en) 2012-04-27 2017-07-26 Novozymes, Inc. Gh61 polypeptide variants and polynucleotides encoding same
CN104364371B (zh) 2012-05-31 2018-10-23 诺维信公司 具有有机磷水解酶活性的多肽
EP2740840A1 (en) 2012-12-07 2014-06-11 Novozymes A/S Improving drainage of paper pulp
CN105671088B (zh) * 2014-11-20 2019-05-17 中国科学院大连化学物理研究所 一种表面活性剂改进的木质纤维素的连续糖化共发酵法
CN104789543B (zh) * 2015-04-25 2017-11-07 上海康地恩生物科技有限公司 一种护色纤维素酶及其突变体
WO2017070219A1 (en) 2015-10-20 2017-04-27 Novozymes A/S Lytic polysaccharide monooxygenase (lpmo) variants and polynucleotides encoding same
CN110295155A (zh) * 2015-12-23 2019-10-01 东莞泛亚太生物科技有限公司 提升耐温性的纤维素酶
JP6774494B2 (ja) 2016-02-19 2020-10-21 インターコンチネンタル グレート ブランズ エルエルシー バイオマス源から複数の有用なストリームを形成するためのプロセス
CN106367409A (zh) * 2016-08-26 2017-02-01 上海交通大学 一种同时高产纤维素酶和β‑葡萄糖苷酶的方法
WO2023225459A2 (en) 2022-05-14 2023-11-23 Novozymes A/S Compositions and methods for preventing, treating, supressing and/or eliminating phytopathogenic infestations and infections

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009059234A2 (en) * 2007-11-01 2009-05-07 Novozymes, Inc. Methods of reducing the inhibitory effect of a redox active metal ion on the enzymatic hydrolysis of cellulosic material
CN101809150A (zh) * 2007-05-31 2010-08-18 诺维信股份有限公司 提高多肽的纤维素分解增强活性的方法

Family Cites Families (151)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB1296839A (zh) 1969-05-29 1972-11-22
GB1372034A (en) 1970-12-31 1974-10-30 Unilever Ltd Detergent compositions
GB1483591A (en) 1973-07-23 1977-08-24 Novo Industri As Process for coating water soluble or water dispersible particles by means of the fluid bed technique
GB1590432A (en) 1976-07-07 1981-06-03 Novo Industri As Process for the production of an enzyme granulate and the enzyme granuate thus produced
DK187280A (da) 1980-04-30 1981-10-31 Novo Industri As Ruhedsreducerende middel til et fuldvaskemiddel fuldvaskemiddel og fuldvaskemetode
DK263584D0 (da) 1984-05-29 1984-05-29 Novo Industri As Enzymholdige granulater anvendt som detergentadditiver
US4933287A (en) 1985-08-09 1990-06-12 Gist-Brocades N.V. Novel lipolytic enzymes and their use in detergent compositions
EG18543A (en) 1986-02-20 1993-07-30 Albright & Wilson Protected enzyme systems
DK122686D0 (da) 1986-03-17 1986-03-17 Novo Industri As Fremstilling af proteiner
US5989870A (en) 1986-04-30 1999-11-23 Rohm Enzyme Finland Oy Method for cloning active promoters
ATE110768T1 (de) 1986-08-29 1994-09-15 Novo Nordisk As Enzymhaltiger reinigungsmittelzusatz.
NZ221627A (en) 1986-09-09 1993-04-28 Genencor Inc Preparation of enzymes, modifications, catalytic triads to alter ratios or transesterification/hydrolysis ratios
JPS6444992A (en) 1987-08-13 1989-02-17 Matsushita Electric Works Ltd Discharged lamp lighting circuit
DE3854249T2 (de) 1987-08-28 1996-02-29 Novo Nordisk As Rekombinante Humicola-Lipase und Verfahren zur Herstellung von rekombinanten Humicola-Lipasen.
DK6488D0 (da) 1988-01-07 1988-01-07 Novo Industri As Enzymer
DE68924654T2 (de) 1988-01-07 1996-04-04 Novo Nordisk As Spezifische Protease.
JP3079276B2 (ja) 1988-02-28 2000-08-21 天野製薬株式会社 組換え体dna、それを含むシュードモナス属菌及びそれを用いたリパーゼの製造法
EP0406314B1 (en) 1988-03-24 1993-12-01 Novo Nordisk A/S A cellulase preparation
US5648263A (en) 1988-03-24 1997-07-15 Novo Nordisk A/S Methods for reducing the harshness of a cotton-containing fabric
US5223409A (en) 1988-09-02 1993-06-29 Protein Engineering Corp. Directed evolution of novel binding proteins
WO1990015861A1 (en) 1989-06-13 1990-12-27 Genencor International, Inc. A method for killing cells without cell lysis
GB8915658D0 (en) 1989-07-07 1989-08-23 Unilever Plc Enzymes,their production and use
US5110735A (en) 1989-09-26 1992-05-05 Midwest Research Institute Thermostable purified endoglucanase from thermophilic bacterium acidothermus cellulolyticus
US5275944A (en) 1989-09-26 1994-01-04 Midwest Research Institute Thermostable purified endoglucanas from acidothermus cellulolyticus ATCC 43068
US5536655A (en) 1989-09-26 1996-07-16 Midwest Research Institute Gene coding for the E1 endoglucanase
IL97645A (en) 1990-03-23 1997-03-18 Gist Brocades Nv Production of enzymes in seeds and their use
WO1991016422A1 (de) 1990-04-14 1991-10-31 Kali-Chemie Aktiengesellschaft Alkalische bacillus-lipasen, hierfür codierende dna-sequenzen sowie bacilli, die diese lipasen produzieren
DK115890D0 (da) 1990-05-09 1990-05-09 Novo Nordisk As Enzym
KR100237148B1 (ko) 1990-05-09 2000-01-15 한센 핀 베네드 엔도글루칸아제 효소를 함유하는 셀룰라제 제조물
US6395966B1 (en) 1990-08-09 2002-05-28 Dekalb Genetics Corp. Fertile transgenic maize plants containing a gene encoding the pat protein
KR930702514A (ko) 1990-09-13 1993-09-09 안네 제케르 리파제 변체
IL99552A0 (en) 1990-09-28 1992-08-18 Ixsys Inc Compositions containing procaryotic cells,a kit for the preparation of vectors useful for the coexpression of two or more dna sequences and methods for the use thereof
EP0495258A1 (en) 1991-01-16 1992-07-22 The Procter & Gamble Company Detergent compositions with high activity cellulase and softening clays
JP3219765B2 (ja) 1991-04-30 2001-10-15 ザ、プロクター、エンド、ギャンブル、カンパニー タンパク分解酵素を阻害するためのホウ酸系物質−ポリオール複合体を有するビルダー入り液体洗剤
EP0511456A1 (en) 1991-04-30 1992-11-04 The Procter & Gamble Company Liquid detergents with aromatic borate ester to inhibit proteolytic enzyme
EP0583339B1 (en) 1991-05-01 1998-07-08 Novo Nordisk A/S Stabilized enzymes and detergent compositions
DK72992D0 (da) 1992-06-01 1992-06-01 Novo Nordisk As Enzym
DK88892D0 (da) 1992-07-06 1992-07-06 Novo Nordisk As Forbindelse
EP0651794B1 (en) 1992-07-23 2009-09-30 Novozymes A/S MUTANT $g(a)-AMYLASE, DETERGENT AND DISH WASHING AGENT
ATE262035T1 (de) 1992-10-06 2004-04-15 Novozymes As Zellulosevarianten
KR100322793B1 (ko) 1993-02-11 2002-06-20 마가렛 에이.혼 산화안정성알파-아밀라아제
ATE258224T1 (de) 1993-03-10 2004-02-15 Novozymes As Enzyme mit xylanaseaktivität aus aspergillus aculeatus
JP3618748B2 (ja) 1993-04-27 2005-02-09 ジェネンコー インターナショナル インコーポレイテッド 洗剤に使用する新しいリパーゼ変異体
DK52393D0 (zh) 1993-05-05 1993-05-05 Novo Nordisk As
FR2704860B1 (fr) 1993-05-05 1995-07-13 Pasteur Institut Sequences de nucleotides du locus cryiiia pour le controle de l'expression de sequences d'adn dans un hote cellulaire.
JP2859520B2 (ja) 1993-08-30 1999-02-17 ノボ ノルディスク アクティーゼルスカブ リパーゼ及びそれを生産する微生物及びリパーゼ製造方法及びリパーゼ含有洗剤組成物
EP0724631A1 (en) 1993-10-13 1996-08-07 Novo Nordisk A/S H 2?o 2?-stable peroxidase variants
JPH07143883A (ja) 1993-11-24 1995-06-06 Showa Denko Kk リパーゼ遺伝子及び変異体リパーゼ
DE4343591A1 (de) 1993-12-21 1995-06-22 Evotec Biosystems Gmbh Verfahren zum evolutiven Design und Synthese funktionaler Polymere auf der Basis von Formenelementen und Formencodes
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
JP3553958B2 (ja) 1994-02-22 2004-08-11 ノボザイムス アクティーゼルスカブ 脂質分解酵素の変異体の製造方法
EP0749473B1 (en) 1994-03-08 2005-10-12 Novozymes A/S Novel alkaline cellulases
EP0755442B1 (en) 1994-05-04 2002-10-09 Genencor International, Inc. Lipases with improved surfactant resistance
CA2191718A1 (en) 1994-06-03 1995-12-14 Randy M. Berka Phosphonyldipeptides useful in the treatment of cardiovascular diseases
AU2884595A (en) 1994-06-20 1996-01-15 Unilever Plc Modified pseudomonas lipases and their use
AU2884695A (en) 1994-06-23 1996-01-19 Unilever Plc Modified pseudomonas lipases and their use
EP0777737B1 (en) 1994-06-30 2005-05-04 Novozymes Biotech, Inc. Non-toxic, non-toxigenic, non-pathogenic fusarium expression system and promoters and terminators for use therein
EP1995303A3 (en) 1994-10-06 2008-12-31 Novozymes A/S Enzyme preparation with endoglucanase activity
BE1008998A3 (fr) 1994-10-14 1996-10-01 Solvay Lipase, microorganisme la produisant, procede de preparation de cette lipase et utilisations de celle-ci.
BR9509525A (pt) 1994-10-26 1995-10-26 Novo Nordisk As Construção de dna vetor de expressão recombinante célula processo para produzir a enzima que exibe atividade lipolítica enzima que exibe atividade lipolítica preparação de enzima aditivo de detergente e composição de detergente
AR000862A1 (es) 1995-02-03 1997-08-06 Novozymes As Variantes de una ó-amilasa madre, un metodo para producir la misma, una estructura de adn y un vector de expresion, una celula transformada por dichaestructura de adn y vector, un aditivo para detergente, composicion detergente, una composicion para lavado de ropa y una composicion para la eliminacion del
JPH08228778A (ja) 1995-02-27 1996-09-10 Showa Denko Kk 新規なリパーゼ遺伝子及びそれを用いたリパーゼの製造方法
CN1182451A (zh) 1995-03-17 1998-05-20 诺沃挪第克公司 新的内切葡聚糖酶
ATE282087T1 (de) 1995-07-14 2004-11-15 Novozymes As Modifiziertes enzym mit lipolytischer aktivität
CN1192780B (zh) 1995-08-11 2010-08-04 诺沃奇梅兹有限公司 新的脂解酶
US20030044956A1 (en) 1995-08-23 2003-03-06 Short Jay M. Enzymes having carboxymethyl cellulase activity and methods of use thereof
US5763385A (en) 1996-05-14 1998-06-09 Genencor International, Inc. Modified α-amylases having altered calcium binding properties
WO1998008940A1 (en) 1996-08-26 1998-03-05 Novo Nordisk A/S A novel endoglucanase
CN101085985B (zh) 1996-09-17 2012-05-16 诺沃奇梅兹有限公司 纤维素酶变体
US6451063B1 (en) 1996-09-25 2002-09-17 Genencor International, Inc. Cellulase for use in industrial processes
DE69718351T2 (de) 1996-10-08 2003-11-20 Novozymes As Diaminobenzoesäure derivate als farbstoffvorläufer
US6017870A (en) 1996-10-09 2000-01-25 Genencor International, Inc. Purified cellulase and method of producing
US5811381A (en) 1996-10-10 1998-09-22 Mark A. Emalfarb Cellulase compositions and methods of use
US7883872B2 (en) 1996-10-10 2011-02-08 Dyadic International (Usa), Inc. Construction of highly efficient cellulase compositions for enzymatic hydrolysis of cellulose
AU4772697A (en) 1996-11-04 1998-05-29 Novo Nordisk A/S Subtilase variants and compositions
ATE409743T1 (de) 1996-11-04 2008-10-15 Novozymes As Subtilase varianten und verbindungen
US6159731A (en) 1997-02-12 2000-12-12 Massachusetts Institute Of Technology Daxx, a Fas-binding protein that activates JNK and apoptosis
NZ502444A (en) 1997-07-31 2001-11-30 Dsm N Polypeptides with cellobiohydrolase activity (CBH A and CBH B) from Aspergillus
US5871550A (en) 1997-08-26 1999-02-16 Genencor International, Inc. Mutant Thermonospora spp. cellulase
EP1034280B1 (en) 1997-11-19 2006-05-31 Genencor International, Inc. Cellulase produced by actinomycetes and method of producing same
EP1038008B1 (en) 1997-12-16 2006-10-18 Genencor International, Inc. Methods for producing egiii-like enzymes
US5955310A (en) 1998-02-26 1999-09-21 Novo Nordisk Biotech, Inc. Methods for producing a polypeptide in a bacillus cell
EP1080210A2 (en) 1998-05-27 2001-03-07 Novo Nordisk Biotech, Inc. Methods for producing a polypeptide by modifying the copy number of a gene
DK1124949T3 (da) 1998-10-26 2006-11-06 Novozymes As Konstruktion og screening af et DNA-bibliotek af interesse i trådformede svampeceller
DK2278016T3 (da) 1999-03-22 2012-11-26 Novozymes Inc Promotorsekvenser fra Fusarium Venenatum og anvendelse deraf
AU5279100A (en) 1999-05-19 2000-12-05 Midwest Research Institute E1 endoglucanase variants y245g, y82r and w42r
ES2166316B1 (es) 2000-02-24 2003-02-16 Ct Investig Energeticas Ciemat Procedimiento de produccion de etanol a partir de biomasa lignocelulosica utilizando una nueva levadura termotolerante.
US7151204B2 (en) 2001-01-09 2006-12-19 Monsanto Technology Llc Maize chloroplast aldolase promoter compositions and methods for use thereof
EP1395653A2 (en) 2001-05-18 2004-03-10 Novozymes A/S Polypeptides having cellobiase activity and polynucleotides encoding same
US7314712B2 (en) 2001-07-27 2008-01-01 The United States Of America As Represented By The Secretary Of The Department Of Health And Human Services Systems for in vivo site-directed mutagenesis using oligonucleotides
US6982159B2 (en) 2001-09-21 2006-01-03 Genencor International, Inc. Trichoderma β-glucosidase
US7045331B2 (en) 2001-12-18 2006-05-16 Genencor International, Inc. EGVII endoglucanase and nucleic acids encoding the same
US7049125B2 (en) 2001-12-18 2006-05-23 Genencor International, Inc. EGVIII endoglucanase and nucleic acids encoding the same
US7005289B2 (en) 2001-12-18 2006-02-28 Genencor International, Inc. BGL5 β-glucosidase and nucleic acids encoding the same
US7045332B2 (en) 2001-12-18 2006-05-16 Genencor International, Inc. BGL4 β-glucosidase and nucleic acids encoding the same
US7056721B2 (en) 2001-12-18 2006-06-06 Genencor International, Inc. EGVI endoglucanase and nucleic acids encoding the same
JP4334352B2 (ja) 2002-01-23 2009-09-30 ロイヤル ネダルコ ベスローテン フェンノートシャップ ペントース糖の発酵
ES2375054T3 (es) 2002-08-16 2012-02-24 Danisco Us Inc. Nueva variante de celulasa cbh1 de hypocrea jecorina.
AU2003291395A1 (en) 2002-11-07 2004-06-03 Genencor International, Inc. Bgl6 beta-glucosidase and nucleic acids encoding the same
US7407788B2 (en) 2002-11-21 2008-08-05 Danisco A/S, Genencor Division BGL7 beta-glucosidase and nucleic acids encoding the same
EP2311942A1 (en) 2003-03-21 2011-04-20 Genecor International, Inc. Novel cbh1 homologs and variant cbh1 cellulases
DK1627050T3 (da) 2003-04-01 2013-10-14 Danisco Us Inc Humicola grisea cbh1.1-variant
ATE471370T1 (de) 2003-05-02 2010-07-15 Novozymes Inc Varianten von beta-glukosidasen
DK1862539T3 (da) 2003-05-29 2012-05-14 Danisco Us Inc Nye trichodermagener
WO2005047499A1 (en) 2003-10-28 2005-05-26 Novozymes Inc. Polypeptides having beta-glucosidase activity and polynucleotides encoding same
CN1914311B (zh) 2003-12-09 2011-05-04 诺维信股份有限公司 消除或减少丝状真菌菌株基因表达的方法
EP2301958B1 (en) 2004-01-30 2014-03-19 Novozymes Inc. Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
CA2554784C (en) 2004-02-06 2013-05-28 Novozymes, Inc. Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
EP1715736A4 (en) 2004-02-12 2008-09-03 Novozymes Inc POLYPEPTIDES HAVING XYLANASE ACTIVITY AND POLYNUCLEOTIDES ENCODING SAME
US8097445B2 (en) 2004-03-25 2012-01-17 Danisco Us Inc. Exo-endo cellulase fusion protein
CN1930294A (zh) 2004-03-25 2007-03-14 金克克国际有限公司 纤维素酶融合蛋白和编码该纤维素酶融合蛋白的异源纤维素酶融合构建物
DK176540B1 (da) 2004-09-24 2008-07-21 Cambi Bioethanol Aps Fremgangsmåde til behandling af biomasse og organisk affald med henblik på at udvinde önskede biologisk baserede produkter
US8008056B2 (en) 2004-12-30 2011-08-30 Danisco Us Inc. Variant Hypocrea jecorina CBH2 cellulases
CN101160388B (zh) 2005-04-12 2013-05-01 纳幕尔杜邦公司 生物质处理的系统和工艺
AR053066A1 (es) 2005-04-26 2007-04-18 Novozymes As Arabinofuranosidasas
PT1874927E (pt) 2005-04-29 2014-04-23 Ab Enzymes Oy Celulases melhoradas
CN104726433A (zh) 2005-08-04 2015-06-24 诺维信股份有限公司 具有β-葡糖苷酶活性的多肽和编码该多肽的多核苷酸
US7608689B2 (en) 2005-09-30 2009-10-27 Novozymes, Inc. Methods for enhancing the degradation or conversion of cellulosic material
DK1969123T3 (en) 2005-12-22 2017-08-28 Ab Enzymes Oy Hitherto UNKNOWN ENZYMS
FI120045B (fi) 2005-12-22 2009-06-15 Roal Oy Selluloosamateriaalin käsittely ja siinä käyttökelpoiset entsyymit
US8304212B2 (en) 2006-07-10 2012-11-06 Dyadic International, Inc. Methods and compositions for degradation of lignocellulosic material
WO2008148131A1 (en) 2007-05-31 2008-12-04 Novozymes, Inc. Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
CN101903518B (zh) 2007-09-28 2016-08-03 诺维信公司 具有乙酰木聚糖酯酶活性的多肽和编码该多肽的多核苷酸
US7867745B2 (en) 2007-11-27 2011-01-11 Novozymes A/S Polypeptides having alpha-glucuronidase activity and polynucleotides encoding same
WO2009073383A1 (en) 2007-11-30 2009-06-11 Novozymes A/S Polypeptides having arabinofuranosidase activity and polynucleotides encoding same
CA2707771A1 (en) 2007-12-05 2009-06-25 Novozymes A/S Polypeptides having xylanase activity and polynucleotides encoding same
WO2009073709A1 (en) 2007-12-06 2009-06-11 Novozymes A/S Polypeptides having acetylxylan esterase activity and polynucleotides encoding same
WO2009076122A1 (en) 2007-12-07 2009-06-18 Novozymes A/S Polypeptides having feruloyl esterase activity and polynucleotides encoding same
BRPI0821048A2 (pt) 2007-12-19 2015-06-16 Novozymes As Polipeptídeo e polinucleotídeo isolados, construção de ácido nucléico, célula hospedeira recombinante, métodos para produzir o polipeptídeo, um mutante de uma célula precursora, uma proteína e um produto de fermentação, para inibir a expressão de um polipeptídeo, para degradar ou converter um material celulósico, e para fermentar um material celulósico, planta trangênica, parte vegetal ou célula vegetal, e, melécula de rna inibidora
CN101952420A (zh) 2007-12-19 2011-01-19 诺维信公司 具有纤维素分解增强活性的多肽和编码该多肽的多核苷酸
CA2709485A1 (en) 2007-12-19 2009-07-09 Novozymes A/S Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
CN101952304A (zh) 2007-12-19 2011-01-19 诺维信公司 具有纤维素分解增强活性的多肽和编码该多肽的多核苷酸
CN102066409A (zh) 2008-04-17 2011-05-18 诺维信公司 具有阿魏酸酯酶活性的多肽和编码该多肽的多核苷酸
EP2310497B1 (en) 2008-07-29 2016-05-04 Novozymes A/S Polypeptides having alpha-glucuronidase activity and polynucleotides encoding same
WO2010014880A1 (en) 2008-07-31 2010-02-04 Novozymes A/S Polypeptides having acetylxylan esterase activity and polynucleotides encoding same
CN105671027A (zh) 2008-09-30 2016-06-15 诺维信股份有限公司 在丝状真菌细胞中使用阳性和阴性选择性基因的方法
WO2010053838A1 (en) 2008-11-10 2010-05-14 Novozymes, Inc Polypeptides having feruloyl esterase activity and polynucleotides encoding same
EP2373788A1 (en) 2008-12-04 2011-10-12 Novozymes Inc. Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
EP2373684A1 (en) 2008-12-04 2011-10-12 Novozymes Inc. Polypeptides having feruloyl esterase activity and polynucleotides encoding same
CN102325872B (zh) 2009-02-20 2014-09-10 丹尼斯科美国公司 发酵肉汤制剂
US8658409B2 (en) 2009-03-24 2014-02-25 Novozymes A/S Polypeptides having acetyl xylan esterase activity and polynucleotides encoding same
CA2795934A1 (en) 2009-04-30 2010-11-04 Novozymes, Inc. Polypeptides having xylanase activity and polynucleotides encoding same
EP2435561B1 (en) 2009-05-29 2018-08-08 Novozymes Inc. Methods for enhancing the degradation or conversion of cellulosic material
DK2451957T3 (en) 2009-07-07 2018-02-05 Novozymes Inc POLYPEPTIDES WITH CELLULOLYSE ENHANCING ACTIVITY AND POLYNUCLEOTIDES CODING THEM
CN102770534B (zh) 2009-09-17 2016-07-06 诺维信股份有限公司 具有纤维素分解增强活性的多肽及编码其的多核苷酸
MX2012003473A (es) 2009-09-29 2012-05-22 Novozymes Inc Polipeptidos que tienen actividad celulitica mejorada y polinucleotidos que codifican para los mismos.
EP2483403B1 (en) 2009-09-29 2017-11-15 Novozymes Inc. Polypeptides having xylanase activity and polynucleotides encoding same
CN102695720B (zh) 2009-09-30 2018-02-16 诺维信股份有限公司 具有纤维素分解增强活性的多肽和编码该多肽的多核苷酸
CN102666846A (zh) 2009-09-30 2012-09-12 诺维信公司 具有纤维素分解增强活性的多肽和编码该多肽的多核苷酸
BR112012008286B1 (pt) 2009-11-06 2018-11-21 Novozymes, Inc. E Novozymes A/S célula hospedeira microbiana transgênica, métodos para produzir um polipeptídeo, para degradar ou converter um material celulósico ou material contendo xilano, para produzir um produto de fermentação, para fermentar um material celulósico ou material contendo xilano, construções de ácido nucleico, e, vetor de expressão
MX2013003237A (es) * 2010-09-30 2013-05-30 Novozymes Inc Variantes de polipeptidos que tienen actividad potenciadora celulolitica y polinucleotidos que codifican a los mismos.

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101809150A (zh) * 2007-05-31 2010-08-18 诺维信股份有限公司 提高多肽的纤维素分解增强活性的方法
WO2009059234A2 (en) * 2007-11-01 2009-05-07 Novozymes, Inc. Methods of reducing the inhibitory effect of a redox active metal ion on the enzymatic hydrolysis of cellulosic material

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
通过DNA 改组技术获得高活性β-葡萄糖苷酸酶;熊爱生 等;《中国生物化学与分子生物学报》;20030430;第19卷(第2期);162-167 *
黑曲霉Aspergillus niger S菌株所产β-葡糖苷酶的纯化和酶学性质;王云 等;《中国科学院研究生院学报》;20090331;第26卷(第2期);274-279 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107345226A (zh) * 2010-09-30 2017-11-14 诺维信股份有限公司 具有纤维素分解增强活性的多肽变体及其编码多核苷酸

Also Published As

Publication number Publication date
MX2013003237A (es) 2013-05-30
ES2599613T3 (es) 2017-02-02
DK2622070T3 (en) 2016-11-21
CN107345226A (zh) 2017-11-14
CN103237891A (zh) 2013-08-07
EP2622070A1 (en) 2013-08-07
EP2622070B1 (en) 2016-08-03
WO2012044836A1 (en) 2012-04-05
US9816082B2 (en) 2017-11-14
US20130227748A1 (en) 2013-08-29
BR112013007699A2 (pt) 2020-08-04

Similar Documents

Publication Publication Date Title
CN103237891B (zh) 具有纤维素分解增强活性的多肽变体及其编码多核苷酸
CN103620028B (zh) 具有纤维二糖水解酶活性的多肽和编码该多肽的多核苷酸
CN102639697B (zh) 具有木聚糖酶活性的多肽和编码该多肽的多核苷酸
CN103384678B (zh) 具有纤维素水解增强活性的多肽及其编码多核苷酸
CN105886485B (zh) β-葡糖苷酶变体及其编码多核苷酸
CN102770534B (zh) 具有纤维素分解增强活性的多肽及编码其的多核苷酸
CN103958674B (zh) 具有木聚糖酶活性的多肽及其编码多核苷酸
CN103517986B (zh) 具有纤维二糖水解酶活性的多肽及编码该多肽的多核苷酸
CN105838698B (zh) 具有纤维二糖水解酶活性的多肽及编码该多肽的多核苷酸
CN103282489B (zh) 具有纤维素分解增强活性的多肽变体及其编码多核苷酸
CN103797126A (zh) 用于增强纤维素材料的降解或转化的方法
MX2012005152A (es) Composiciones para sacrificacion de material celulosico.
CN103703125B (zh) 具有内切葡聚糖酶活性的多肽及其编码多核苷酸
CN110079558A (zh) 用家族61多肽预处理纤维素材料的方法
CN103958672A (zh) Gh61多肽变体以及编码所述变体的多核苷酸
CN104245926A (zh) Gh61多肽变体以及编码其的多核苷酸
CN103339252A (zh) 具有纤维素分解增强活性的嵌合多肽及其编码多核苷酸
CN107002056A (zh) 碳水化合物结合模块变体以及编码它们的多核苷酸
CN103298931B (zh) 具有内切葡聚糖酶活性的多肽及其编码多核苷酸
CN104145016B (zh) 具有β-木糖苷酶活性的多肽和编码该多肽的多核苷酸
BR112013007699B1 (pt) Variante, polinucleotídeo isolado, célula hospedeira microbiana recombinante, métodos para produzir uma variante, para degradar um material celulósico, para produzir um produto de fermentação, para fermentar um material celulósico, e, composição enzimática, formulação do caldo completo ou composição de cultura de células
BR112013007693B1 (pt) Variante, polinucleotídeo isolado, célula hospedeira microbiana recombinante, métodos para produzir uma variante, para produzir uma variante tendo atividade intensificadora celulolítica, para degradar um material celulósico, para produzir um produto de fermentação, para fermentar um material celulósico, e, composição enzimática, formulação do caldo completo ou composição de cultura de células

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant