CN109112118A - Gh61多肽变体以及编码所述变体的多核苷酸 - Google Patents

Gh61多肽变体以及编码所述变体的多核苷酸 Download PDF

Info

Publication number
CN109112118A
CN109112118A CN201810939270.7A CN201810939270A CN109112118A CN 109112118 A CN109112118 A CN 109112118A CN 201810939270 A CN201810939270 A CN 201810939270A CN 109112118 A CN109112118 A CN 109112118A
Authority
CN
China
Prior art keywords
seq
hand
variant
substitution
mature polypeptide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810939270.7A
Other languages
English (en)
Inventor
J.林
D.伯翰
M.马兰塔
L.贝里斯福德
M.拉姆萨
B.G.汉森
F.W.拉斯马森
M.斯维尼
D.J.博伊尔三世
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Novo Nordisk AS
Novozymes Inc
Original Assignee
Novo Nordisk AS
Novozymes Biotech Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Novo Nordisk AS, Novozymes Biotech Inc filed Critical Novo Nordisk AS
Publication of CN109112118A publication Critical patent/CN109112118A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2434Glucanases acting on beta-1,4-glucosidic bonds
    • CCHEMISTRY; METALLURGY
    • C11ANIMAL OR VEGETABLE OILS, FATS, FATTY SUBSTANCES OR WAXES; FATTY ACIDS THEREFROM; DETERGENTS; CANDLES
    • C11DDETERGENT COMPOSITIONS; USE OF SINGLE SUBSTANCES AS DETERGENTS; SOAP OR SOAP-MAKING; RESIN SOAPS; RECOVERY OF GLYCEROL
    • C11D3/00Other compounding ingredients of detergent compositions covered in group C11D1/00
    • C11D3/16Organic compounds
    • C11D3/38Products with no well-defined composition, e.g. natural products
    • C11D3/386Preparations containing enzymes, e.g. protease or amylase
    • CCHEMISTRY; METALLURGY
    • C11ANIMAL OR VEGETABLE OILS, FATS, FATTY SUBSTANCES OR WAXES; FATTY ACIDS THEREFROM; DETERGENTS; CANDLES
    • C11DDETERGENT COMPOSITIONS; USE OF SINGLE SUBSTANCES AS DETERGENTS; SOAP OR SOAP-MAKING; RESIN SOAPS; RECOVERY OF GLYCEROL
    • C11D3/00Other compounding ingredients of detergent compositions covered in group C11D1/00
    • C11D3/16Organic compounds
    • C11D3/38Products with no well-defined composition, e.g. natural products
    • C11D3/386Preparations containing enzymes, e.g. protease or amylase
    • C11D3/38636Preparations containing enzymes, e.g. protease or amylase containing enzymes other than protease, amylase, lipase, cellulase, oxidase or reductase
    • CCHEMISTRY; METALLURGY
    • C11ANIMAL OR VEGETABLE OILS, FATS, FATTY SUBSTANCES OR WAXES; FATTY ACIDS THEREFROM; DETERGENTS; CANDLES
    • C11DDETERGENT COMPOSITIONS; USE OF SINGLE SUBSTANCES AS DETERGENTS; SOAP OR SOAP-MAKING; RESIN SOAPS; RECOVERY OF GLYCEROL
    • C11D3/00Other compounding ingredients of detergent compositions covered in group C11D1/00
    • C11D3/16Organic compounds
    • C11D3/38Products with no well-defined composition, e.g. natural products
    • C11D3/386Preparations containing enzymes, e.g. protease or amylase
    • C11D3/38645Preparations containing enzymes, e.g. protease or amylase containing cellulase
    • CCHEMISTRY; METALLURGY
    • C11ANIMAL OR VEGETABLE OILS, FATS, FATTY SUBSTANCES OR WAXES; FATTY ACIDS THEREFROM; DETERGENTS; CANDLES
    • C11DDETERGENT COMPOSITIONS; USE OF SINGLE SUBSTANCES AS DETERGENTS; SOAP OR SOAP-MAKING; RESIN SOAPS; RECOVERY OF GLYCEROL
    • C11D3/00Other compounding ingredients of detergent compositions covered in group C11D1/00
    • C11D3/16Organic compounds
    • C11D3/38Products with no well-defined composition, e.g. natural products
    • C11D3/386Preparations containing enzymes, e.g. protease or amylase
    • C11D3/38681Chemically modified or immobilised enzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0071Oxidoreductases (1.) acting on paired donors with incorporation of molecular oxygen (1.14)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/02Monosaccharides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/14Preparation of compounds containing saccharide radicals produced by the action of a carbohydrase (EC 3.2.x), e.g. by alpha-amylase, e.g. by cellulase, hemicellulase
    • DTEXTILES; PAPER
    • D21PAPER-MAKING; PRODUCTION OF CELLULOSE
    • D21CPRODUCTION OF CELLULOSE BY REMOVING NON-CELLULOSE SUBSTANCES FROM CELLULOSE-CONTAINING MATERIALS; REGENERATION OF PULPING LIQUORS; APPARATUS THEREFOR
    • D21C5/00Other processes for obtaining cellulose, e.g. cooking cotton linters ; Processes characterised by the choice of cellulose-containing starting materials
    • D21C5/005Treatment of cellulose-containing material with microorganisms or enzymes
    • DTEXTILES; PAPER
    • D21PAPER-MAKING; PRODUCTION OF CELLULOSE
    • D21HPULP COMPOSITIONS; PREPARATION THEREOF NOT COVERED BY SUBCLASSES D21C OR D21D; IMPREGNATING OR COATING OF PAPER; TREATMENT OF FINISHED PAPER NOT COVERED BY CLASS B31 OR SUBCLASS D21G; PAPER NOT OTHERWISE PROVIDED FOR
    • D21H17/00Non-fibrous material added to the pulp, characterised by its constitution; Paper-impregnating material characterised by its constitution
    • D21H17/005Microorganisms or enzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y101/00Oxidoreductases acting on the CH-OH group of donors (1.1)
    • C12Y101/99Oxidoreductases acting on the CH-OH group of donors (1.1) with other acceptors (1.1.99)

Abstract

本发明涉及GH61多肽变体。本发明还涉及编码这些变体的多核苷酸;包含这些多核苷酸的核酸构建体、载体、以及宿主细胞;以及使用这些变体的方法。

Description

GH61多肽变体以及编码所述变体的多核苷酸
本申请是基于申请日为2012年11月21日,优先权日为2011年11月21日,申请号为201280057243.8,发明名称为:“GH61多肽变体以及编码所述变体的多核苷酸”的专利申请的分案申请。
关于在联邦资助的研究和开发下完成的发明的权利的声明
本发明是根据能源部授予的合作协议DE-FC36-08GO18080在政府支持下完成的。政府在本发明中享有一定权利。
对序列表的引用
本申请含有一个计算机可读形式的序列表,该序列表通过引用结合在此。
发明背景
发明领域
本发明涉及GH61多肽变体、编码这些变体的多核苷酸、产生这些变体的方法、以及使用这些变体的方法。
相关技术的说明
纤维素是单糖葡萄糖通过β-1,4-键共价连接的一种聚合物。许多微生物产生水解β-连接的葡聚糖的酶。这些酶包括内切葡聚糖酶、纤维二糖水解酶、以及β-葡糖苷酶。内切葡聚糖酶在随机位置处消化纤维素聚合物,使其暴露于纤维二糖水解酶的攻击。纤维二糖水解酶从纤维素聚合物的末端按序释放纤维二糖分子。纤维二糖是一种水溶性的β-1,4-连接的葡萄糖二聚体。β-葡糖苷酶将纤维二糖水解成葡萄糖。
将木质纤维素原料转化成乙醇具有以下优点:大量原料的易得性、避免燃烧或填埋材料的合意性、以及乙醇燃料的清洁性。木材、农业残余物、草本作物、以及城市固体废物已被认为是用于乙醇生产的原料。这些材料主要由纤维素、半纤维素、以及木质素组成。一旦将木质纤维素转化成可发酵的糖(例如葡萄糖),那么这些可发酵的糖就可以容易地被酵母发酵成乙醇。
WO 2005/074647、WO 2008/148131、以及WO 2011/035027披露了来自土生梭孢霉(Thielavia terrestris)的具有纤维素分解增强活性的分离的GH61多肽及其多核苷酸。WO2005/074656和WO 2010/065830披露了来自金黄色嗜热子囊菌(Thermoascusaurantiacus)的具有纤维素分解增强活性的分离的GH61多肽及其多核苷酸。WO 2007/089290和WO 2012/149344披露了来自里氏木霉(Trichoderma reesei)的具有纤维素分解增强活性的分离的GH61多肽及其多核苷酸。WO 2009/085935、WO 2009/085859、WO 2009/085864、以及WO 2009/085868披露了来自嗜热毁丝霉(Myceliophthora thermophila)的具有纤维素分解增强活性的分离的GH61多肽及其多核苷酸。WO 2010/138754披露了来自烟曲霉(Aspergillus fumigatus)的具有纤维素分解增强活性的分离的GH61多肽及其多核苷酸。WO 2011/005867披露了来自嗜松青霉(Penicillium pinophilum)的具有纤维素分解增强活性的分离的GH61多肽及其多核苷酸。WO 2011/039319披露了来自嗜热子囊菌属物种(Thermoascus sp)的具有纤维素分解增强活性的分离的GH61多肽及其多核苷酸。WO 2011/041397披露了来自青霉属物种(Penicillium sp.(埃默森(emersonii))的具有纤维素分解增强活性的分离的GH61多肽及其多核苷酸。WO 2011/041504披露了来自甲壳嗜热子囊菌(Thermoascus crustaceus)的具有纤维素分解增强活性的分离的GH61多肽及其多核苷酸。WO 2012/030799披露了来自棘孢曲霉(Aspergillus aculeatus)的具有纤维素分解增强活性的GH61多肽及其多核苷酸。WO 2012/113340披露了来自嗜热棉毛菌(Thermomyceslanuginosus)的具有纤维素分解增强活性的GH61多肽及其多核苷酸。WO 2012/146171披露了来自特异腐质霉(Humicola insolens)的具有纤维素分解增强活性的GH61多肽及其多核苷酸。WO 2008/151043披露了通过向包含具有纤维素分解增强活性的GH61多肽的组合物中添加可溶性活化二价金属阳离子来增加该多肽的活性的方法。
WO 2012/044835和WO 2012/044836披露了具有纤维素分解增强活性以及改善的热活性和热稳定性的GH61多肽变体。
本发明提供了具有增加的热稳定性的GH61多肽变体。
发明概述
本发明涉及分离的GH61多肽变体,其包含在与SEQ ID NO:30的成熟多肽的位置105、154、188、189、216、以及229相对应的一个或多个(例如若干个)位置处的取代,其中这些变体具有纤维素分解增强活性。
本发明还涉及编码这些变体的分离的多核苷酸;包含这些多核苷酸的核酸构建体、载体、以及宿主细胞;以及产生这些变体的方法。
本发明还涉及用于降解或转化纤维素材料的方法,包括:在本发明的GH61多肽变体的存在下,用酶组合物处理该纤维素材料。在一个方面,这些方法进一步包括回收降解的或转化的纤维素材料。
本发明还涉及产生发酵产物的方法,包括:(a)在本发明的GH61多肽变体的存在下,用酶组合物使纤维素材料糖化;(b)用一种或多种(例如若干种)发酵微生物发酵糖化的纤维素材料,以产生该发酵产物;以及(c)从发酵物中回收该发酵产物。
本发明还涉及发酵纤维素材料的方法,包括:用一种或多种(例如若干种)发酵微生物发酵该纤维素材料,其中该纤维素材料在本发明的GH61多肽变体的存在下用酶组合物糖化。在一个方面,该纤维素材料的发酵产生发酵产物。在另一个方面,这些方法进一步包括从发酵物中回收该发酵产物。
附图简要说明
图1示出编码具有纤维素分解增强活性的GH61B多肽的烟曲霉基因的基因组DNA序列(SEQ ID NO:29)和推断的氨基酸序列(SEQ ID NO:30)。
图2示出质粒pMMar44的限制性图谱。
图3示出质粒pMMar49的限制性图谱。
图4示出质粒pMMar45的限制性图谱。
图5示出质粒pDFng113的限制性图谱。
图6示出添加烟曲霉GH61B多肽变体对高温纤维素组合物在50℃、55℃、以及60℃下进行的PCS转化的影响。
图7示出质粒pDFng153-4的限制性图谱。
图8示出质粒pDFng154-17的限制性图谱。
图9示出质粒pDFng155-33的限制性图谱。
图10示出质粒pBGMH16的限制性图谱。
定义
乙酰木聚糖酯酶:术语“乙酰木聚糖酯酶”意指一种羧基酯酶(EC3.1.1.72),它催化乙酰基从聚合木聚糖、乙酰化木糖、乙酰化葡萄糖、乙酸α-萘酯、以及乙酸对硝基苯酯的水解。出于本发明的目的,乙酰木聚糖酯酶活性是在含有0.01%TWEENTM20(聚氧乙烯脱水山梨醇单月桂酸酯)的50mM乙酸钠(pH 5.0)中使用0.5mM乙酸对硝基苯酯作为底物来测定的。一个单位的乙酰木聚糖酯酶定义为能够在pH 5、25℃下每分钟释放1微摩尔的对硝基苯酚阴离子的酶量。
等位变体:术语“等位变体”意指基因的占据相同染色体基因座的两种或两种以上可替代形式中的任一者。等位变异通过突变天然地发生,并且可以导致种群内的多态性。基因突变可以是沉默的(所编码的多肽中没有变化)或可以编码具有改变的氨基酸序列的多肽。多肽的等位变体是由基因的等位变体编码的多肽。
α-L-阿拉伯呋喃糖苷酶:术语“α-L-阿拉伯呋喃糖苷酶”意指α-L-阿拉伯呋喃糖苷阿拉伯呋喃水解酶(EC 3.2.1.55),其催化α-L-阿拉伯糖苷中的末端非还原性α-L-阿拉伯呋喃糖苷残基的水解。该酶对α-L-阿拉伯呋喃糖苷、含有(1,3)-和/或(1,5)-键的α-L-阿拉伯聚糖、阿拉伯木聚糖、以及阿拉伯半乳聚糖起作用。α-L-阿拉伯呋喃糖苷酶还被称为阿拉伯糖苷酶、α-阿拉伯糖苷酶、α-L-阿拉伯糖苷酶、α-阿拉伯呋喃糖苷酶、多糖α-L-阿拉伯呋喃糖苷酶、α-L-阿拉伯呋喃糖苷水解酶、L-阿拉伯糖苷酶、或α-L-阿拉伯聚糖酶。出于本发明的目的,α-L-阿拉伯呋喃糖苷酶活性是使用每ml的100mM乙酸钠(pH 5)中5mg的中等粘度小麦阿拉伯木聚糖(麦格酶国际爱尔兰股份有限公司(Megazyme International Ireland,Ltd.),爱尔兰威克洛郡布瑞(Bray,Co.Wicklow,Ireland)以总体积200μl在40℃下持续30分钟,接着通过HPX-87H柱色谱(伯乐实验室有限公司(Bio-RadLaboratories,Inc.),美国加州赫拉克勒斯(Hercules,CA,USA)进行阿拉伯糖分析来测定的。
α-葡糖醛酸糖苷酶:术语“α-葡糖醛酸糖苷酶”意指α-D-葡糖苷酸葡糖醛酸水解酶(EC 3.2.1.139),其催化α-D-葡糖醛酸糖苷水解为D-葡糖醛酸和醇。出于本发明的目的,α-葡糖醛酸糖苷酶活性是根据德弗里斯(de Vries),1998,细菌学杂志(J.Bacteriol.)180:243-249来测定的。一个单位的α-葡糖醛酸糖苷酶等于能够在pH 5、40℃下每分钟释放1微摩尔的葡糖醛酸或4-O-甲基葡糖醛酸的酶量。
β-葡糖苷酶:术语“β-葡糖苷酶”意指一种β-D-葡糖苷葡糖水解酶(E.C.3.2.1.21),其催化末端非还原性β-D-葡萄糖残基的水解,并释放β-D-葡萄糖。出于本发明的目的,β-葡糖苷酶活性是根据文丘里(Venturi)等人,2002,来自嗜热毛壳菌嗜粪变种的胞外β-D-葡糖苷酶:产生、纯化以及一些生化特性(Extracellular beta-D-glucosidase from Chaetomium thermophilum var.coprophilum:production,purification and some biochemical properties),基础微生物学杂志(J.BasicMicrobiol.)42:55-66的程序使用对硝基苯基-β-D-吡喃葡萄糖苷作为底物来测定的。一个单位的β-葡糖苷酶定义为在25℃、pH 4.8下,在含有0.01%20的50mM柠檬酸钠中从作为底物的1mM对硝基苯基-β-D-吡喃葡萄糖苷每分钟产生1.0微摩尔的对硝基苯酚阴离子。
β-木糖苷酶:术语“β-木糖苷酶”意指一种β-D-木糖苷木糖水解酶(E.C.3.2.1.37),其催化短β(1→4)-木寡糖的外水解,以从非还原性末端去除连续的D-木糖残基。出于本发明的目的,一个单位的β-木糖苷酶定义为在40℃、pH 5下在含有0.01%20的100mM柠檬酸钠中从作为底物的1mM对硝基苯基-β-D-木糖苷每分钟产生1.0微摩尔的对硝基苯酚阴离子。
cDNA:术语“cDNA”意指能够通过反转录从得自真核或原核细胞的成熟的、已剪接的mRNA分子制备的DNA分子。cDNA缺少可能存在于相对应的基因组DNA中的内含子序列。起始的、初级的RNA转录物是mRNA的前体,其通过一系列的步骤加工,这些步骤包括剪接,然后作为成熟的已剪接的mRNA出现。
纤维二糖水解酶:术语“纤维二糖水解酶”意指一种1,4-β-D-葡聚糖纤维二糖水解酶(E.C.3.2.1.91和E.C.3.2.1.176),其催化纤维素、纤维寡糖、或任何含有β-1,4-连接的葡萄糖的聚合物中的1,4-β-D-糖苷键水解,从而从链的还原性末端(纤维二糖水解酶I)或非还原性末端(纤维二糖水解酶II)释放纤维二糖(泰里(Teeri),1997,结晶纤维素降解:对纤维二糖水解酶的功能的新认识(Crystalline cellulose degradation:New insightinto the function of cellobiohydrolases),生物技术趋势(Trends inBiotechnology)15:160-167;泰里等人,1998,里氏木霉纤维二糖水解酶:对结晶纤维素为何如此有效?(Trichoderma reesei cellobiohydrolases:why so efficient oncrystalline cellulose?),生物化学学会会刊(Biochem.Soc.Trans.)26:173-178)。根据里弗(Lever)等人,1972,分析生物化学(Anal.Biochem.)47:273-279;范.帝伯赫(vanTilbeurgh)等人,1982,欧洲生化学会联合会快报(FEBS Letters),149:152-156;范.帝伯赫和克莱森斯(Claeyssens),1985,欧洲生化学会联合会快报,187:283-288;以及汤美(Tomme)等人,1988,欧洲生物化学杂志(Eur.J.Biochem.)170:575-581描述的程序来测定纤维二糖水解酶活性。
纤维素分解酶或纤维素酶:术语“纤维素分解酶”或“纤维素酶”意指一种或多种(例如若干种)水解纤维素材料的酶。此类酶包括一种或多种内切葡聚糖酶、一种或多种纤维二糖水解酶、一种或多种β-葡糖苷酶、或其组合。用于测量纤维素分解活性的两种基本方法包括:(1)测量总纤维素分解活性,和(2)测量单独的纤维素分解活性(内切葡聚糖酶、纤维二糖水解酶以及β-葡糖苷酶),如在张(Zhang)等人,纤维素酶改进的展望:筛选和选择策略(Outlook for cellulase improvement:Screening and selection strategies),2006,生物技术进展(Biotechnology Advances)24:452-481中所综述的。总纤维素分解活性通常使用不溶性底物来测量,这些底物包括瓦特曼(Whatman)1级滤纸、微晶纤维素、细菌纤维素、藻类纤维素、棉花、预处理的木质纤维素,等等。最常见的总纤维素分解活性测定是使用瓦特曼1级滤纸作为底物的滤纸测定。该测定是由国际纯粹与应用化学联合会(International Union of Pure and Applied Chemistry(IUPAC))(高斯(Ghose),1987,纤维素酶活性的测量(Measurement of cellulase activities),纯粹与应用化学(PureAppl.Chem.)59:257-68)确立的。
出于本发明的目的,纤维素分解酶活性通过测量在以下条件下与未添加纤维素分解酶蛋白的对照水解相比较,由一种或多种纤维素分解酶进行的纤维素材料水解的增加来测定:1-50mg的纤维素分解酶蛋白/g于PCS中的纤维素(或其他预处理的纤维素材料)在合适的温度(如40℃-80℃,例如50℃、55℃、60℃、65℃、或70℃)、以及合适的pH(如4-9,例如,5.0、5.5、6.0、6.5、或7.0)下持续3-7日。典型条件为:1ml反应,洗涤或未洗涤的预处理的玉米秸秆(PCS),5%不溶性固体,50mM乙酸钠(pH 5),1mM MnSO4,50℃、55℃、或60℃,72小时,通过HPX-87H柱(伯乐实验室有限公司,美国加州赫拉克勒斯)进行糖分析。40℃-80℃,例如,50℃、55℃、60℃、65℃、或70℃
纤维素材料:术语“纤维素材料”意指含有纤维素的任何材料。生物质的初生细胞壁(primary cell wall)中的主要多糖是纤维素,其次最丰富的是半纤维素,而第三是果胶。次生细胞壁(secondary cell wall)在细胞停止生长后产生,其同样含有多糖并且通过共价交联至半纤维素的聚合木质素而被加强。纤维素是脱水纤维二糖的均聚物,并且因此是一种线性β-(l-4)-D-葡聚糖,而半纤维素包括多种化合物,如木聚糖、木葡聚糖、阿拉伯木聚糖、以及甘露聚糖,处于具有一系列取代基的复杂分支结构(complex branchedstructures with a spectrum of substituent)中。尽管通常是多形的,但是发现植物组织中的纤维素主要作为平行葡聚糖链的不溶性晶体基质。半纤维素通常氢键合至纤维素以及其他半纤维素,这帮助稳定细胞壁基质。
纤维素通常见于例如植物的茎、叶、壳、皮和穗轴,或树的叶、枝和木材中。纤维素材料可以是,但不限于:农业残余物、草本材料(包括能量作物)、城市固体废物、纸浆和造纸厂残余物、废纸、以及木材(包括林业残余物)(参见,例如,维色洛戈尔(Wiselogel)等人,1995,于《生物乙醇手册》(Handbook on Bioethanol)(查尔斯E.怀曼(Charles E.Wyman)编),第105-118页,泰勒弗朗西斯出版集团(Taylor&Francis),华盛顿特区(WashingtonD.C.);怀曼(Wyman),1994,生物资源技术(Bioresource Technology)50:3-16;林德(Lynd),1990,应用生物化学与生物技术(Applied Biochemistry and Biotechnology)24/25:695-719;T.谢伯(T.Scheper)主编的生物化学工程/生物技术的进展(Advances inBiochemical Engineering/Biotechnology)中的莫思尔(Mosier)等人,1999,木质纤维的生物转化的最近进展(Recent Progress in Bioconversion of Lignocellulosics),第65卷,第23-40页,纽约斯普林格出版社(Springer-Verlag,New York)。在此应理解的是,纤维素的形式可以是木质纤维素、包含木质素的植物细胞壁材料、纤维素和混合基质中的半纤维素。在一个优选方面,纤维素材料是任何生物质材料。在另一个优选方面,纤维素材料是木质纤维素,其包含纤维素、半纤维素和木质素。
在一个方面,纤维素材料是农业残余物。在另一个方面,纤维素材料是草本材料(包括能量作物)。在另一个方面,纤维素材料是城市固体废物。在另一个方面,纤维素材料是纸浆和造纸厂残余物。在另一个方面,纤维素材料是废纸。在另一个方面,纤维素材料是木材(包括林业残余物)。
在另一个方面,纤维素材料是芦竹。在另一个方面,纤维素材料是甘蔗渣。在另一个方面,纤维素材料是竹材。在另一个方面,纤维素材料是玉米穗轴。在另一个方面,纤维素材料是玉米纤维。在另一个方面,纤维素材料是玉米秸杆。在另一个方面,纤维素材料是芒草属。在另一个方面,纤维素材料是橙皮。在另一个方面,纤维素材料是稻草。在另一个方面,纤维素材料是柳枝稷。在另一个方面,纤维素材料是小麦杆。
在另一个方面,纤维素材料是白杨。在另一个方面,纤维素材料是桉树。在另一个方面,纤维素材料是冷杉。在另一个方面,纤维素材料是松树。在另一个方面,纤维素材料是白杨。在另一个方面,纤维素材料是云杉。在另一个方面,纤维素材料是柳树。
在另一个方面,纤维素材料是藻类纤维素。在另一个方面,纤维素材料是细菌纤维素。在另一个方面,纤维素材料是棉绒。在另一个方面,纤维素材料是滤纸。在另一个方面,纤维素材料是微晶纤维素。在另一个方面,纤维素材料是磷酸处理的纤维素。
在另一个方面,纤维素材料是水生生物质。如在此所使用的,术语“水生生物质”意指在水生环境中由光合作用过程产生的生物质。水生生物质可以是藻类、挺水植物(emergent plant)、浮叶植物(floating-leaf plant)、或沉水植物(submerged plant)。
纤维素材料可以按原样使用或可以使用本领域已知的常规方法进行预处理,如在此所描述。在一个优选方面,纤维素材料经过了预处理。
编码序列:术语“编码序列”意指直接指定变体的氨基酸序列的多核苷酸。编码序列的边界通常由开放阅读框决定,该开放阅读框以起始密码子(如ATG、GTG或TTG)开始,并且以终止密码子(如TAA、TAG或TGA)结束。编码序列可以是基因组DNA、cDNA、合成DNA、或其组合。
控制序列:术语“控制序列”意指对编码本发明的变体的多核苷酸的表达来说必需的核酸序列。各个控制序列对于编码该变体的该多核苷酸来说可以是天然的(即,来自同一基因)或外源的(即,来自不同基因),或各个控制序列对于彼此来说可以是天然的或外源的。这类控制序列包括但不限于:前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列、以及转录终止子。至少,控制序列包括启动子以及转录和翻译终止信号。控制序列可以具有用于引入特异性限制位点目的的接头,这些特异性限制位点促进控制序列与编码变体的多核苷酸的编码区的连接。
内切葡聚糖酶:术语“内切葡聚糖酶”意指一种内切-1,4-(1,3;1,4)-β-D-葡聚糖-4-葡聚糖水解酶(E.C.3.2.1.4),其催化纤维素、纤维素衍生物(如羧甲基纤维素和羟乙基纤维素)、地衣淀粉中的1,4-β-D-糖苷键、混合的β-1,3葡聚糖如谷类β-D-葡聚糖或木葡聚糖、以及含有纤维素组分的其它植物材料中的β-1,4键的内切水解。内切葡聚糖酶活性可以通过测量底物粘度的降低或通过还原糖测定(张(Zhang)等人,2006,生物技术进展(Biotechnology Advances)24:452-481)所测定的还原性末端的增加来测定。出于本发明的目的,根据高斯,1987,纯粹与应用化学59:257-268的程序,在pH 5、40℃下使用羧甲基纤维素(CMC)作为底物来测定内切葡聚糖酶活性。
表达:术语“表达”包括涉及变体产生的任何步骤,其包括但不限于:转录、转录后修饰、翻译、翻译后修饰、以及分泌。
表达载体:术语“表达载体”意指线性或环状DNA分子,其包含一种多核苷酸,该多核苷酸编码变体并且可操作地连接至规定其表达的控制序列上。
家族61糖苷水解酶:术语“家族61糖苷水解酶”或“家族GH61”或“GH61”意指根据亨利萨特B.(Henrissat B.),1991,基于氨基酸序列相似性的糖基水解酶的分类法(Aclassification of glycosyl hydrolases based on amino-acid sequencesimilarities),生物化学杂志(Biochem.J.)280:309-316、以及亨利萨特B.和贝洛赫A.(Bairoch A.),1996,修正糖基水解酶的基于序列的分类法(Updating the sequence-based classification of glycosyl hydrolases),生物化学杂志316:695-696属于糖苷水解酶家族61的多肽。这个家族中的酶最初基于在一个家族成员中测量到的非常弱的内切-1,4-β-D葡聚糖酶活性而被归类为糖苷水解酶家族。这些酶的结构和作用模式是非经典的,并且它们不能被视为真正的糖苷酶。然而,基于当与纤维素酶或纤维素酶的混合物结合使用时,它们增强木质纤维素分解的能力,它们被保留在CAZy分类中。
阿魏酸酯酶:术语“阿魏酸酯酶”意指4-羟基-3-甲氧基肉桂酰-糖水解酶(EC3.1.1.73),其催化4-羟基-3-甲氧基肉桂酰(阿魏酰)基团从酯化的糖(其在天然生物质底物中通常为阿拉伯糖)的水解,以产生阿魏酸(4-羟基-3-甲氧基肉桂酸)。阿魏酸酯酶(feruloyl esterase)也被称为阿魏酸酯酶(ferulic acid esterase)、羟基肉桂酰基酯酶、FAE-III、肉桂酸酯水解酶、FAEA、cinnAE、FAE-I或FAE-II。出于本发明的目的,阿魏酸酯酶活性是在50mM乙酸钠(pH 5.0)中使用0.5mM阿魏酸对硝基苯酯作为底物来测定。一个单位的阿魏酸酯酶等于能够在pH 5、25℃下每分钟释放1微摩尔的对硝基苯酚阴离子的酶量。
片段:术语“片段”意指一种多肽,该多肽中不存在其成熟多肽的氨基和/或羧基末端的一个或多个(例如若干个)氨基酸,其中该片段具有纤维素分解增强活性。在一个方面,片段含有GH61多肽的成熟多肽的至少85%的氨基酸残基,例如至少90%的氨基酸残基、或至少95%的氨基酸残基。
半纤维素分解酶或半纤维素酶:术语“半纤维素分解酶”或“半纤维素酶”意指一种或多种(例如若干种)水解半纤维素材料的酶。参见,例如,沙洛姆(Shallom),D.和肖汉姆(Shoham),Y.微生物半纤维素酶(Microbial hemicellulases),微生物学新见(CurrentOpinion In Microbiology),2003,6(3):219-228。半纤维素酶是植物生物质降解中的关键组分。半纤维素酶的实例包括但不限于:乙酰甘露聚糖酯酶、乙酰木聚糖酯酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、香豆酸酯酶、阿魏酸酯酶、半乳糖苷酶、葡糖醛酸糖苷酶、葡糖醛酸酯酶、甘露聚糖酶、甘露糖苷酶、木聚糖酶和木糖苷酶。这些酶的底物半纤维素是支化和线性多糖的异质群体,这些多糖通过氢键键合至植物细胞壁中的纤维素微纤维上,从而将它们交联成一个稳固网络。半纤维素还共价连接至木质素,从而与纤维素共同形成高度复杂的结构。半纤维素的可变结构和组织需要许多酶的协同作用以使其完全降解。半纤维素酶的催化模块是水解糖苷键的糖苷水解酶(GH),或水解乙酸或阿魏酸侧基的酯键的碳水化合物酯酶(CE)。这些催化模块,基于其一级序列的同源性,可以被指派为GH和CE家族。一些具有总体上类似的折叠的家族可以进一步被分组为系(clan),以字母标记(例如,GH-A)。这些和其他碳水化合物活性酶的最具信息性和最新的分类可在碳水化合物活性酶(Carbohydrate-Active Enzymes)(CAZy)数据库中获得。半纤维素分解酶活性可以根据高斯和比萨拉(Bisaria),1987,纯粹与应用化学(Pure&AppI.Chem.)59:1739-1752在合适的温度(例如50℃、55℃、或60℃)和pH(例如5.0或5.5)下进行测量。
高严谨度条件:术语“高严谨度条件”意指对于长度为至少100个核苷酸的探针,在42℃下,在5X SSPE、0.3%SDS、200微克/ml已剪切并且变性的鲑鱼精子DNA和50%的甲酰胺中,根据标准的Southern印迹程序进行预杂交和杂交12至24小时。最后使用2X SSC、0.2%SDS在65℃下将载体材料洗涤三次,每次15分钟。
宿主细胞:术语“宿主细胞”意指对于用包含本发明的多核苷酸的核酸构建体或表达载体进行的转化、转染、转导等是易感的任何细胞类型。术语“宿主细胞”涵盖亲本细胞的由于在复制中发生的突变而不同于亲本细胞的任何后代。
改善的特性:术语“改善的特性”意指与和亲本相比被改善的变体相关联的特征。这种改善的特性包括但不限于增加的热稳定性。
增加的热稳定性:术语“增加的热稳定性”意指相对于亲本,GH61多肽变体在某一温度下孵育一段时期之后纤维素分解增强活性的保留较高。变体相对于亲本的热稳定性增加可以例如在一个或多个(例如若干个)温度的条件下评估。例如,该一个或多个(例如若干个)温度可以是45℃至95℃范围内的任何一个温度或多个温度,例如,45℃、50℃、55℃、60℃、65℃、70℃、75℃、80℃、85℃、或95℃(或在此之间,例如62℃、68℃、72℃,等等),在一个或多个(例如若干个)pH下,该一个或多个pH在3至9的范围内,例如3.0、3.5、4.0、4.5、5.0、5.5、6.0、6.5、7.0、7.5、8.0、8.5、或9.0(或在此之间),进行合适时期(时间)的孵育,例如1分钟、5分钟、10分钟、15分钟、20分钟、25分钟、30分钟、45分钟、或60分钟(或在此之间,例如23分钟、37分钟,等等),这样使得该变体保留残余活性。然而,也可以使用更长时期的孵育。术语“增加的热稳定性”能够与“改善的热稳定性”可互换地使用。
变体相对于亲本的热稳定性增加可以通过差示扫描量热法(DSC)使用本领域中的标准方法来测定(参见,例如,斯特蒂文特(Sturtevant),1987,物理化学年度综述(AnnualReview of Physical Chemistry)38:463-488;实例9和17)。变体相对于亲本的热稳定性增加还可以使用蛋白质热解折叠分析来测定(参见,例如,在此的实例10、18、以及23)。变体相对于亲本的热稳定性增加还可以使用本领域中已知的用于具有纤维素分解增强活性的GH61多肽的任何酶测定以测量温度处理后的残余活性来测定。参见例如,WO 2005/074647、WO 2008/148131、WO 2005/074656、WO 2010/065830、WO 2007/089290、WO 2009/085935、WO2009/085859、WO 2009/085864、WO 2009/085868、以及WO 2008/151043,它们通过引用结合在此。可替代地,变体相对于亲本的热稳定性增加可以使用其中将变体的性能与亲本相比较的用于该变体的任何应用测定来测定。例如,可以使用实例5、12、以及13中描述的应用测定。
分离的:术语“分离的”意指处于不天然存在的形式或环境中的物质。分离的物质的非限制性实例包括:(1)任何非天然存在的物质,(2)至少部分地从一种或多种或全部与其天然相关联的天然存在的成分移除的任何物质,包括但不限于任何酶、变体、核酸、蛋白质、肽或辅因子;(3)相对于在自然界中发现的该物质通过人力修饰的任何物质;或(4)相对于与其天然相关联的其他组分,通过增加该物质的量而被修饰的任何物质(例如,宿主细胞中的重组体产量;编码该物质的基因的多个拷贝;以及使用比与编码该物质的基因天然相关联的启动子更强的启动子)。
低严谨度条件:术语“低严谨度条件”意指对于长度为至少100个核苷酸的探针,在42℃下,在5X SSPE、0.3%SDS、200微克/ml已剪切并且变性的鲑鱼精子DNA和25%的甲酰胺中,根据标准的Southern印迹程序进行预杂交和杂交12至24小时。最后使用2X SSC、0.2%SDS在50℃下将载体材料洗涤三次,每次15分钟。
成熟多肽:术语“成熟多肽”意指处于其在翻译和任何翻译后修饰之后的最终形式的多肽,这些修饰如N-末端加工、C-末端截短、糖基化、磷酸化,等等。在一个方面,基于预测SEQ ID NO:2的氨基酸1至19是信号肽的SignalP程序(尼尔森(Nielsen)等人,1997,蛋白质工程(Protein Engineering)10:1-6),成熟多肽是SEQ ID NO:2的氨基酸20至326。在另一个方面,基于预测SEQ ID NO:4的氨基酸1至17是信号肽的SignalP程序,成熟多肽是SEQ IDNO:4的氨基酸18至239。在另一个方面,基于预测SEQ ID NO:6的氨基酸1至19是信号肽的SignalP程序,成熟多肽是SEQ ID NO:6的氨基酸20至258。在另一个方面,基于预测SEQ IDNO:8的氨基酸1至18是信号肽的SignalP程序,成熟多肽是SEQ ID NO:8的氨基酸19至226。在另一个方面,基于预测SEQ ID NO:10的氨基酸1至19是信号肽的SignalP程序,成熟多肽是SEQ ID NO:10的氨基酸20至304。在另一个方面,基于预测SEQ ID NO:12的氨基酸1至15是信号肽的SignalP程序,成熟多肽是SEQ ID NO:12的氨基酸16至317。在另一个方面,基于预测SEQ ID NO:14的氨基酸1至21是信号肽的SignalP程序,成熟多肽是SEQ ID NO:14的氨基酸22至249。在另一个方面,基于预测SEQ ID NO:16的氨基酸1至19是信号肽的SignalP程序,成熟多肽是SEQ ID NO:16的氨基酸20至249。在另一个方面,基于预测SEQ ID NO:18的氨基酸1至17是信号肽的SignalP程序,成熟多肽是SEQ ID NO:18的氨基酸18至232。在另一个方面,基于预测SEQ ID NO:20的氨基酸1至15是信号肽的SignalP程序,成熟多肽是SEQID NO:20的氨基酸16至235。在另一个方面,基于预测SEQ ID NO:22的氨基酸1至18是信号肽的SignalP程序,成熟多肽是SEQ ID NO:22的氨基酸19至323。在另一个方面,基于预测SEQ ID NO:24的氨基酸1至15是信号肽的SignalP程序,成熟多肽是SEQ ID NO:24的氨基酸16至310。在另一个方面,基于预测SEQ ID NO:26的氨基酸1至19是信号肽的SignalP程序,成熟多肽是SEQ ID NO:26的氨基酸20至246。在另一个方面,基于预测SEQ ID NO:28的氨基酸1至21是信号肽的SignalP程序,成熟多肽是SEQ ID NO:28的氨基酸22至354。在另一个方面,基于预测SEQ ID NO:30的氨基酸1至21是信号肽的SignalP程序,成熟多肽是SEQ IDNO:30的氨基酸22至250。在另一个方面,基于预测SEQ ID NO:32的氨基酸1至21是信号肽的SignalP程序,成熟多肽是SEQ ID NO:32的氨基酸22至322。在另一个方面,基于预测SEQ IDNO:34的氨基酸1至23是信号肽的SignalP程序,成熟多肽是SEQ ID NO:34的氨基酸24至444。在另一个方面,基于预测SEQ ID NO:36的氨基酸1至25是信号肽的SignalP程序,成熟多肽是SEQ ID NO:36的氨基酸26至253。在另一个方面,基于预测SEQ ID NO:38的氨基酸1至17是信号肽的SignalP程序,成熟多肽是SEQ ID NO:38的氨基酸18至246。在另一个方面,基于预测SEQ ID NO:40的氨基酸1至19是信号肽的SignalP程序,成熟多肽是SEQ ID NO:40的氨基酸20至334。在另一个方面,基于预测SEQ ID NO:42的氨基酸1至17是信号肽的SignalP程序,成熟多肽是SEQ ID NO:42的氨基酸18至227。在另一个方面,基于预测SEQ IDNO:44的氨基酸1至19是信号肽的SignalP程序,成熟多肽是SEQ ID NO:44的氨基酸20至223。在另一个方面,基于预测SEQ ID NO:46的氨基酸1至21是信号肽的SignalP程序,成熟多肽是SEQ ID NO:46的氨基酸22至368。在另一个方面,基于预测SEQ ID NO:48的氨基酸1至24是信号肽的SignalP程序,成熟多肽是SEQ ID NO:48的氨基酸25至330。在另一个方面,基于预测SEQ ID NO:50的氨基酸1至16是信号肽的SignalP程序,成熟多肽是SEQ ID NO:50的氨基酸17至236。在另一个方面,基于预测SEQ ID NO:52的氨基酸1至18是信号肽的SignalP程序,成熟多肽是SEQ ID NO:52的氨基酸19至250。在另一个方面,基于预测SEQ IDNO:54的氨基酸1至22是信号肽的SignalP程序,成熟多肽是SEQ ID NO:54的氨基酸23至478。在另一个方面,基于预测SEQ ID NO:56的氨基酸1至16是信号肽的SignalP程序,成熟多肽是SEQ ID NO:56的氨基酸17至230。在另一个方面,基于预测SEQ ID NO:58的氨基酸1至19是信号肽的SignalP程序,成熟多肽是SEQ ID NO:58的氨基酸20至257。在另一个方面,基于预测SEQ ID NO:60的氨基酸1至22是信号肽的SignalP程序,成熟多肽是SEQ ID NO:60的氨基酸23至251。在另一个方面,基于预测SEQ ID NO:62的氨基酸1至18是信号肽的SignalP程序,成熟多肽是SEQ ID NO:62的氨基酸19至349。在另一个方面,基于预测SEQ IDNO:64的氨基酸1至23是信号肽的SignalP程序,成熟多肽是SEQ ID NO:64的氨基酸24至436。在另一个方面,基于预测SEQ ID NO:66的氨基酸1至23是信号肽的SignalP程序,成熟多肽是SEQ ID NO:66的氨基酸21至344。在另一个方面,基于预测SEQ ID NO:68的氨基酸1至25是信号肽的SignalP程序,成熟多肽是SEQ ID NO:68的氨基酸26至400。在另一个方面,基于预测SEQ ID NO:70的氨基酸1至20是信号肽的SignalP程序,成熟多肽是SEQ ID NO:70的氨基酸21至389。在另一个方面,基于预测SEQ ID NO:72的氨基酸1至21是信号肽的SignalP程序,成熟多肽是SEQ ID NO:72的氨基酸22至406。在另一个方面,基于预测SEQ IDNO:74的氨基酸1至19是信号肽的SignalP程序,成熟多肽是SEQ ID NO:74的氨基酸20至427。在另一个方面,基于预测SEQ ID NO:76的氨基酸1至17是信号肽的SignalP程序,成熟多肽是SEQ ID NO:76的氨基酸18至267。在另一个方面,基于预测SEQ ID NO:78的氨基酸1至20是信号肽的SignalP程序,成熟多肽是SEQ ID NO:78的氨基酸21至273。在另一个方面,基于预测SEQ ID NO:80的氨基酸1至22是信号肽的SignalP程序,成熟多肽是SEQ ID NO:80的氨基酸23至272。在另一个方面,基于预测SEQ ID NO:82的氨基酸1至21是信号肽的SignalP程序,成熟多肽是SEQ ID NO:82的氨基酸22至327。在另一个方面,基于预测SEQ IDNO:84的氨基酸1至22是信号肽的SignalP程序,成熟多肽是SEQ ID NO:84的氨基酸23至274。在另一个方面,基于预测SEQ ID NO:86的氨基酸1至20是信号肽的SignalP程序,成熟多肽是SEQ ID NO:86的氨基酸21至322。在另一个方面,基于预测SEQ ID NO:88的氨基酸1至17是信号肽的SignalP程序,成熟多肽是SEQ ID NO:88的氨基酸18至234。在另一个方面,基于预测SEQ ID NO:90的氨基酸1至23是信号肽的SignalP程序,成熟多肽是SEQ ID NO:90的氨基酸24至233。在另一个方面,基于预测SEQ ID NO:92的氨基酸1至16是信号肽的SignalP程序,成熟多肽是SEQ ID NO:92的氨基酸17至237。在另一个方面,基于预测SEQ IDNO:94的氨基酸1至19是信号肽的SignalP程序,成熟多肽是SEQ ID NO:94的氨基酸20至484。在另一个方面,基于预测SEQ ID NO:96的氨基酸1至21是信号肽的SignalP程序,成熟多肽是SEQ ID NO:96的氨基酸22至329。在另一个方面,基于预测SEQ ID NO:98的氨基酸1至17是信号肽的SignalP程序,成熟多肽是SEQ ID NO:98的氨基酸18至227。在另一个方面,基于预测SEQ ID NO:100的氨基酸1至16是信号肽的SignalP程序,成熟多肽是SEQ ID NO:100的氨基酸17至257。在另一个方面,基于预测SEQ ID NO:102的氨基酸1至19是信号肽的SignalP程序,成熟多肽是SEQ ID NO:102的氨基酸20至246。在另一个方面,基于预测SEQID NO:104的氨基酸1至27是信号肽的SignalP程序,成熟多肽是SEQ ID NO:104的氨基酸28至265。在另一个方面,基于预测SEQ ID NO:106的氨基酸1至15是信号肽的SignalP程序,成熟多肽是SEQ ID NO:106的氨基酸16至310。在另一个方面,基于预测SEQ ID NO:108的氨基酸1至20是信号肽的SignalP程序,成熟多肽是SEQ ID NO:108的氨基酸21至354。在另一个方面,基于预测SEQ ID NO:110的氨基酸1至21是信号肽的SignalP程序,成熟多肽是SEQ IDNO:110的氨基酸22至267。在另一个方面,基于预测SEQ ID NO:112的氨基酸1至15是信号肽的SignalP程序,成熟多肽是SEQ ID NO:112的氨基酸16至237。在另一个方面,基于预测SEQID NO:114的氨基酸1至19是信号肽的SignalP程序,成熟多肽是SEQ ID NO:114的氨基酸20至234。在另一个方面,基于预测SEQ ID NO:116的氨基酸1至17是信号肽的SignalP程序,成熟多肽是SEQ ID NO:116的氨基酸18至226。在另一个方面,基于预测SEQ ID NO:118的氨基酸1至16是信号肽的SignalP程序,成熟多肽是SEQ ID NO:118的氨基酸17至231。在另一个方面,基于预测SEQ ID NO:120的氨基酸1至21是信号肽的SignalP程序,成熟多肽是SEQ IDNO:120的氨基酸22至248。在另一个方面,基于预测SEQ ID NO:122的氨基酸1至17是信号肽的SignalP程序,成熟多肽是SEQ ID NO:122的氨基酸18至233。在另一个方面,基于预测SEQID NO:124的氨基酸1至20是信号肽的SignalP程序,成熟多肽是SEQ ID NO:124的氨基酸21至243。在另一个方面,基于预测SEQ ID NO:126的氨基酸1至20是信号肽的SignalP程序,成熟多肽是SEQ ID NO:126的氨基酸21至363。在另一个方面,基于预测SEQ ID NO:128的氨基酸1至19是信号肽的SignalP程序,成熟多肽是SEQ ID NO:128的氨基酸20至296。在另一个方面,基于预测SEQ ID NO:130的氨基酸1至15是信号肽的SignalP程序,成熟多肽是SEQ IDNO:130的氨基酸16至318。在另一个方面,基于预测SEQ ID NO:132的氨基酸1至18是信号肽的SignalP程序,成熟多肽是SEQ ID NO:132的氨基酸19至259。在另一个方面,基于预测SEQID NO:134的氨基酸1至19是信号肽的SignalP程序,成熟多肽是SEQ ID NO:134的氨基酸20至325。在另一个方面,基于预测SEQ ID NO:136的氨基酸1至18是信号肽的SignalP程序,成熟多肽是SEQ ID NO:136的氨基酸19至298。在另一个方面,基于预测SEQ ID NO:138的氨基酸1至19是信号肽的SignalP程序,成熟多肽是SEQ ID NO:138的氨基酸20至298。在另一个方面,基于预测SEQ ID NO:140的氨基酸1至21是信号肽的SignalP程序,成熟多肽是SEQ IDNO:140的氨基酸22至344。在另一个方面,基于预测SEQ ID NO:142的氨基酸1至19是信号肽的SignalP程序,成熟多肽是SEQ ID NO:142的氨基酸20至330。在另一个方面,基于预测SEQID NO:144的氨基酸1至18是信号肽的SignalP程序,成熟多肽是SEQ ID NO:144的氨基酸19至216。在另一个方面,基于预测SEQ ID NO:146的氨基酸1至17是信号肽的SignalP程序,成熟多肽是SEQ ID NO:146的氨基酸18至490。在另一个方面,基于预测SEQ ID NO:148的氨基酸1至20是信号肽的SignalP程序,成熟多肽是SEQ ID NO:148的氨基酸21至306。在另一个方面,基于预测SEQ ID NO:150的氨基酸1至21是信号肽的SignalP程序,成熟多肽是SEQ IDNO:150的氨基酸22至339。在另一个方面,基于预测SEQ ID NO:152的氨基酸1至21是信号肽的SignalP程序,成熟多肽是SEQ ID NO:152的氨基酸22至344。在另一个方面,基于预测SEQID NO:154的氨基酸1至22是信号肽的SignalP程序,成熟多肽是SEQ ID NO:154的氨基酸23至408。在另一个方面,基于预测SEQ ID NO:156的氨基酸1至18是信号肽的SignalP程序,成熟多肽是SEQ ID NO:156的氨基酸19至234。在另一个方面,基于预测SEQ ID NO:158的氨基酸1至21是信号肽的SignalP程序,成熟多肽是SEQ ID NO:158的氨基酸22至248。在另一个方面,基于预测SEQ ID NO:160的氨基酸1至20是信号肽的SignalP程序,成熟多肽是SEQ IDNO:160的氨基酸21至242。在另一个方面,基于预测SEQ ID NO:162的氨基酸1至22是信号肽的SignalP程序,成熟多肽是SEQ ID NO:162的氨基酸23至334。在另一个方面,基于预测SEQID NO:164的氨基酸1至17是信号肽的SignalP程序,成熟多肽是SEQ ID NO:164的氨基酸18至230。在另一个方面,基于预测SEQ ID NO:166的氨基酸1至18是信号肽的SignalP程序,成熟多肽是SEQ ID NO:166的氨基酸19至397。在另一个方面,基于预测SEQ ID NO:168的氨基酸1至22是信号肽的SignalP程序,成熟多肽是SEQ ID NO:168的氨基酸23至410。在另一个方面,基于预测SEQ ID NO:170的氨基酸1至19是信号肽的SignalP程序,成熟多肽是SEQ IDNO:170的氨基酸20至232。在另一个方面,基于预测SEQ ID NO:172的氨基酸1至20是信号肽的SignalP程序,成熟多肽是SEQ ID NO:172的氨基酸21至266。在另一个方面,基于预测SEQID NO:174的氨基酸1至23是信号肽的SignalP程序,成熟多肽是SEQ ID NO:174的氨基酸24至324。在另一个方面,基于预测SEQ ID NO:176的氨基酸1至20是信号肽的SignalP程序,成熟多肽是SEQ ID NO:176的氨基酸21至240。在另一个方面,基于预测SEQ ID NO:178的氨基酸1至20是信号肽的SignalP程序,成熟多肽是SEQ ID NO:178的氨基酸21至225。在另一个方面,基于预测SEQ ID NO:180的氨基酸1至15是信号肽的SignalP程序,成熟多肽是SEQ IDNO:180的氨基酸16至235。在另一个方面,基于预测SEQ ID NO:182的氨基酸1至19是信号肽的SignalP程序,成熟多肽是SEQ ID NO:182的氨基酸20至336。在另一个方面,基于预测SEQID NO:184的氨基酸1至16是信号肽的SignalP程序,成熟多肽是SEQ ID NO:184的氨基酸17至253。在另一个方面,基于预测SEQ ID NO:186的氨基酸1至17是信号肽的SignalP程序,成熟多肽是SEQ ID NO:186的氨基酸18至255。在另一个方面,基于预测SEQ ID NO:188的氨基酸1至17是信号肽的SignalP程序,成熟多肽是SEQ ID NO:188的氨基酸18至225。在另一个方面,基于预测SEQ ID NO:190的氨基酸1至15是信号肽的SignalP程序,成熟多肽是SEQ IDNO:190的氨基酸16至237。在另一个方面,基于预测SEQ ID NO:192的氨基酸1至17是信号肽的SignalP程序,成熟多肽是SEQ ID NO:192的氨基酸18至227。在另一个方面,基于预测SEQID NO:194的氨基酸1至21是信号肽的SignalP程序,成熟多肽是SEQ ID NO:194的氨基酸22至315。在另一个方面,基于预测SEQ ID NO:196的氨基酸1至20是信号肽的SignalP程序,成熟多肽是SEQ ID NO:196的氨基酸21至439。在另一个方面,基于预测SEQ ID NO:198的氨基酸1至17是信号肽的SignalP程序,成熟多肽是SEQ ID NO:198的氨基酸18至246。在另一个方面,基于预测SEQ ID NO:200的氨基酸1至18是信号肽的SignalP程序,成熟多肽是SEQ IDNO:200的氨基酸19至324。在另一个方面,基于预测SEQ ID NO:202的氨基酸1至20是信号肽的SignalP程序,成熟多肽是SEQ ID NO:202的氨基酸21至242。在另一个方面,基于预测SEQID NO:204的氨基酸1至15是信号肽的SignalP程序,成熟多肽是SEQ ID NO:204的氨基酸16至306。在另一个方面,基于预测SEQ ID NO:206的氨基酸1至19是信号肽的SignalP程序,成熟多肽是SEQ ID NO:206的氨基酸20至252。在另一个方面,基于预测SEQ ID NO:208的氨基酸1至19是信号肽的SignalP程序,成熟多肽是SEQ ID NO:208的氨基酸20至344。在另一个方面,基于预测SEQ ID NO:210的氨基酸1至21是信号肽的SignalP程序,成熟多肽是SEQ IDNO:210的氨基酸22至347。在另一个方面,基于预测SEQ ID NO:212的氨基酸1至22是信号肽的SignalP程序,成熟多肽是SEQ ID NO:212的氨基酸23至334。在另一个方面,基于预测SEQID NO:214的氨基酸1至23是信号肽的SignalP程序,成熟多肽是SEQ ID NO:214的氨基酸24至366。在另一个方面,基于预测SEQ ID NO:216的氨基酸1至20是信号肽的SignalP程序,成熟多肽是SEQ ID NO:216的氨基酸21至364。在本领域中已知宿主细胞可以产生由相同多核苷酸表达的两种或两种以上不同成熟多肽(即,具有不同的C末端和/或N末端氨基酸)的混合物。
成熟多肽编码序列:术语“成熟多肽编码序列”意指编码具有纤维素分解增强活性的成熟多肽的多核苷酸。在一个方面,基于预测SEQ ID NO:1的核苷酸330至387编码信号肽的SignalP程序(尼尔森等人,1997,同上),成熟多肽编码序列是SEQ ID NO:1的核苷酸388至1332。在另一个方面,基于预测SEQ ID NO:3的核苷酸47至97编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:3的核苷酸98至821。在另一个方面,基于预测SEQ ID NO:5的核苷酸69至125编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:5的核苷酸126至978。在另一个方面,基于预测SEQ ID NO:7的核苷酸1至54编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:7的核苷酸55至678。在另一个方面,基于预测SEQ IDNO:9的核苷酸1至57编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:9的核苷酸58至912。在另一个方面,基于预测SEQ ID NO:11的核苷酸1至45编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:11的核苷酸46至951。在另一个方面,基于预测SEQ IDNO:13的核苷酸1至63编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:13的核苷酸64至796。在另一个方面,基于预测SEQ ID NO:15的核苷酸20至76编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:15的核苷酸77至766。在另一个方面,基于预测SEQ ID NO:17的核苷酸1至51编码信号肽的SignalP程序,成熟多肽编码序列是SEQ IDNO:17的核苷酸52至921。在另一个方面,基于预测SEQ ID NO:19的核苷酸1至45编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:19的核苷酸46至851。在另一个方面,基于预测SEQ ID NO:21的核苷酸1至54编码信号肽的SignalP程序,成熟多肽编码序列是SEQ IDNO:21的核苷酸55至1239。在另一个方面,基于预测SEQ ID NO:23的核苷酸1至45编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:23的核苷酸46至1250。在另一个方面,基于预测SEQ ID NO:25的核苷酸1至57编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:25的核苷酸58至811。在另一个方面,基于预测SEQ ID NO:27的核苷酸1至63编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:27的核苷酸64至1112。在另一个方面,基于预测SEQ ID NO:29的核苷酸1至63编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:29的核苷酸64至859。在另一个方面,基于预测SEQ ID NO:31的核苷酸1至63编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:31的核苷酸64至1018。在另一个方面,基于预测SEQ ID NO:33的核苷酸1至69编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:33的核苷酸70至1483。在另一个方面,基于预测SEQ ID NO:35的核苷酸1至75编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:35的核苷酸76至832。在另一个方面,基于预测SEQ ID NO:37的核苷酸1至51编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:37的核苷酸52至875。在另一个方面,基于预测SEQ ID NO:39的核苷酸1至57编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:39的核苷酸58至1250。在另一个方面,基于预测SEQ ID NO:41的核苷酸1至51编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:41的核苷酸52至795。在另一个方面,基于预测SEQ ID NO:43的核苷酸1至57编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:43的核苷酸58至974。在另一个方面,基于预测SEQ ID NO:45的核苷酸1至63编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:45的核苷酸64至1104。在另一个方面,基于预测SEQ IDNO:47的核苷酸1至72编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:47的核苷酸73至990。在另一个方面,基于预测SEQ ID NO:49的核苷酸1至48编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:49的核苷酸49至1218。在另一个方面,基于预测SEQID NO:51的核苷酸1至54编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:51的核苷酸55至930。在另一个方面,基于预测SEQ ID NO:53的核苷酸1至66编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:53的核苷酸67至1581。在另一个方面,基于预测SEQ ID NO:55的核苷酸1至48编码信号肽的SignalP程序,成熟多肽编码序列是SEQ IDNO:55的核苷酸49至865。在另一个方面,基于预测SEQ ID NO:57的核苷酸1至57编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:57的核苷酸58至1065。在另一个方面,基于预测SEQ ID NO:59的核苷酸1至66编码信号肽的SignalP程序,成熟多肽编码序列是SEQID NO:59的核苷酸67至868。在另一个方面,基于预测SEQ ID NO:61的核苷酸1至54编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:61的核苷酸55至1099。在另一个方面,基于预测SEQ ID NO:63的核苷酸1至69编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:63的核苷酸70至1490。在另一个方面,基于预测SEQ ID NO:65的核苷酸1至60编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:65的核苷酸61至1032。在另一个方面,基于预测SEQ ID NO:67的核苷酸1至75编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:67的核苷酸76至1200。在另一个方面,基于预测SEQ ID NO:69的核苷酸1至60编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:69的核苷酸61至1167。在另一个方面,基于预测SEQ ID NO:71的核苷酸1至63编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:71的核苷酸64至1218。在另一个方面,基于预测SEQ ID NO:73的核苷酸1至57编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:73的核苷酸58至1281。在另一个方面,基于预测SEQ ID NO:75的核苷酸1至51编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:75的核苷酸52至801。在另一个方面,基于预测SEQ ID NO:77的核苷酸1至60编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:77的核苷酸61至819。在另一个方面,基于预测SEQ ID NO:79的核苷酸1至66编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:79的核苷酸67至869。在另一个方面,基于预测SEQ ID NO:81的核苷酸1至63编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:81的核苷酸64至1036。在另一个方面,基于预测SEQ ID NO:83的核苷酸1至66编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:83的核苷酸67至878。在另一个方面,基于预测SEQ IDNO:85的核苷酸1至60编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:85的核苷酸61至966。在另一个方面,基于预测SEQ ID NO:87的核苷酸1至51编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:87的核苷酸52至702。在另一个方面,基于预测SEQID NO:89的核苷酸1至69编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:89的核苷酸70至699。在另一个方面,基于预测SEQ ID NO:91的核苷酸1至48编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:91的核苷酸49至711。在另一个方面,基于预测SEQ ID NO:93的核苷酸1至57编码信号肽的SignalP程序,成熟多肽编码序列是SEQ IDNO:93的核苷酸58至1452。在另一个方面,基于预测SEQ ID NO:95的核苷酸1至63编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:95的核苷酸64至1018。在另一个方面,基于预测SEQ ID NO:97的核苷酸1至51编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:97的核苷酸52至818。在另一个方面,基于预测SEQ ID NO:99的核苷酸1至48编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:99的核苷酸49至1117。在另一个方面,基于预测SEQ ID NO:101的核苷酸1至57编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:101的核苷酸58至875。在另一个方面,基于预测SEQ ID NO:103的核苷酸1至81编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:103的核苷酸82至1064。在另一个方面,基于预测SEQ ID NO:105的核苷酸1至45编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:105的核苷酸46至1032。在另一个方面,基于预测SEQ ID NO:107的核苷酸1至60编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:107的核苷酸61至1062。在另一个方面,基于预测SEQ ID NO:109的核苷酸1至63编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:109的核苷酸64至801。在另一个方面,基于预测SEQ IDNO:111的核苷酸1至45编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:111的核苷酸46至840。在另一个方面,基于预测SEQ ID NO:113的核苷酸1至57编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:113的核苷酸58至702。在另一个方面,基于预测SEQ ID NO:115的核苷酸1至51编码信号肽的SignalP程序,成熟多肽编码序列是SEQID NO:115的核苷酸52至750。在另一个方面,基于预测SEQ ID NO:117的核苷酸1至48编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:117的核苷酸49至851。在另一个方面,基于预测SEQ ID NO:119的核苷酸1至63编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:119的核苷酸64至860。在另一个方面,基于预测SEQ ID NO:121的核苷酸1至51编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:121的核苷酸52至830。在另一个方面,基于预测SEQ ID NO:123的核苷酸1至60编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:123的核苷酸61至925。在另一个方面,基于预测SEQ ID NO:125的核苷酸1至60编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:125的核苷酸61至1089。在另一个方面,基于预测SEQ ID NO:127的核苷酸1至57编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:127的核苷酸58至1083。在另一个方面,基于预测SEQ IDNO:129的核苷酸1至45编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:129的核苷酸46至1029。在另一个方面,基于预测SEQ ID NO:131的核苷酸1至54编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:131的核苷酸55至1110。在另一个方面,基于预测SEQ ID NO:133的核苷酸1至57编码信号肽的SignalP程序,成熟多肽编码序列是SEQID NO:133的核苷酸58至1100。在另一个方面,基于预测SEQ ID NO:135的核苷酸1至54编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:135的核苷酸55至1036。在另一个方面,基于预测SEQ ID NO:137的核苷酸1至57编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:137的核苷酸58至1022。在另一个方面,基于预测SEQ ID NO:139的核苷酸1至63编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:139的核苷酸64至1032。在另一个方面,基于预测SEQ ID NO:141的核苷酸1至57编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:141的核苷酸58至1054。在另一个方面,基于预测SEQ ID NO:143的核苷酸1至54编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:143的核苷酸55至769。在另一个方面,基于预测SEQ ID NO:145的核苷酸1至51编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:145的核苷酸52至1533。在另一个方面,基于预测SEQID NO:147的核苷酸1至60编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:147的核苷酸61至918。在另一个方面,基于预测SEQ ID NO:149的核苷酸1至63编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:149的核苷酸64至1089。在另一个方面,基于预测SEQ ID NO:151的核苷酸1至63编码信号肽的SignalP程序,成熟多肽编码序列是SEQID NO:151的核苷酸64至1086。在另一个方面,基于预测SEQ ID NO:153的核苷酸1至66编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:153的核苷酸67至1395。在另一个方面,基于预测SEQ ID NO:155的核苷酸1至54编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:155的核苷酸55至899。在另一个方面,基于预测SEQ ID NO:157的核苷酸1至63编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:157的核苷酸64至807。在另一个方面,基于预测SEQ ID NO:159的核苷酸1至60编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:159的核苷酸61至726。在另一个方面,基于预测SEQ ID NO:161的核苷酸1至66编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:161的核苷酸67至1078。在另一个方面,基于预测SEQ ID NO:163的核苷酸1至51编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:163的核苷酸52至872。在另一个方面,基于预测SEQ IDNO:165的核苷酸1至54编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:165的核苷酸55至1191。在另一个方面,基于预测SEQ ID NO:167的核苷酸1至66编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:167的核苷酸67至1230。在另一个方面,基于预测SEQ ID NO:169的核苷酸1至57编码信号肽的SignalP程序,成熟多肽编码序列是SEQID NO:169的核苷酸58至696。在另一个方面,基于预测SEQ ID NO:171的核苷酸1至60编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:171的核苷酸61至798。在另一个方面,基于预测SEQ ID NO:173的核苷酸1至69编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:173的核苷酸70至972。在另一个方面,基于预测SEQ ID NO:175的核苷酸1至60编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:175的核苷酸61至1112。在另一个方面,基于预测SEQ ID NO:177的核苷酸1至60编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:177的核苷酸61至985。在另一个方面,基于预测SEQ ID NO:179的核苷酸1至45编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:179的核苷酸46至856。在另一个方面,基于预测SEQ ID NO:181的核苷酸1至57编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:181的核苷酸58至1008。在另一个方面,基于预测SEQ ID NO:183的核苷酸1至48编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:183的核苷酸49至1312。在另一个方面,基于预测SEQ ID NO:185的核苷酸1至51编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:185的核苷酸52至921。在另一个方面,基于预测SEQID NO:187的核苷酸1至51编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:187的核苷酸52至739。在另一个方面,基于预测SEQ ID NO:189的核苷酸1至45编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:189的核苷酸46至898。在另一个方面,基于预测SEQ ID NO:191的核苷酸1至51编码信号肽的SignalP程序,成熟多肽编码序列是SEQID NO:191的核苷酸52至941。在另一个方面,基于预测SEQ ID NO:193的核苷酸1至63编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:193的核苷酸64至945。在另一个方面,基于预测SEQ ID NO:195的核苷酸1至60编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:195的核苷酸61至1377。在另一个方面,基于预测SEQ ID NO:197的核苷酸1至51编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:197的核苷酸52至818。在另一个方面,基于预测SEQ ID NO:199的核苷酸1至54编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:199的核苷酸55至1122。在另一个方面,基于预测SEQ ID NO:201的核苷酸1至61编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:201的核苷酸60至1034。在另一个方面,基于预测SEQ ID NO:203的核苷酸1至45编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:203的核苷酸46至1197。在另一个方面,基于预测SEQ IDNO:205的核苷酸1至57编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:205的核苷酸58至756。在另一个方面,基于预测SEQ ID NO:207的核苷酸1至57编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:207的核苷酸58至1032。在另一个方面,基于预测SEQ ID NO:209的核苷酸1至63编码信号肽的SignalP程序,成熟多肽编码序列是SEQID NO:209的核苷酸64至1041。在另一个方面,基于预测SEQ ID NO:211的核苷酸1至66编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:211的核苷酸67至1002。在另一个方面,基于预测SEQ ID NO:213的核苷酸1至69编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:213的核苷酸70至1098。在另一个方面,基于预测SEQ ID NO:215的核苷酸1至60编码信号肽的SignalP程序,成熟多肽编码序列是SEQ ID NO:215的核苷酸61至1088。在以上各方面中,术语“成熟多肽编码序列”应理解成包括基因组DNA序列的cDNA序列或cDNA序列的基因组DNA序列。
中等严谨度条件:术语“中等严谨度条件”意指对于长度为至少100个核苷酸的探针,在42℃下,在5X SSPE、0.3%SDS、200微克/ml已剪切并且变性的鲑鱼精子DNA和35%的甲酰胺中,根据标准的Southern印迹程序进行预杂交和杂交12至24小时。最后使用2X SSC、0.2%SDS在55℃下将载体材料洗涤三次,每次15分钟。
中-高等严谨度条件:术语“中-高等严谨度条件”意指对于长度为至少100个核苷酸的探针,在42℃下,在5X SSPE、0.3%SDS、200微克/ml已剪切并且变性的鲑鱼精子DNA和35%的甲酰胺中,根据标准的Southern印迹程序进行预杂交和杂交12至24小时。最后使用2X SSC、0.2%SDS在60℃下将载体材料洗涤三次,每次15分钟。
突变体:术语“突变体”意指编码变体的多核苷酸。
核酸构建体:术语“核酸构建体”意指单链或双链核酸分子,其分离自天然存在的基因,或其被修饰成以本来在自然界中不存在的方式含有核酸的区段,或其为合成的,其包含一个或多个控制序列。
可操作地连接:术语“可操作地连接”意指一种构型,在该构型中,将一个控制序列放置在相对于一个多核苷酸的编码序列的适当位置,这样使得该控制序列指导该编码序列的表达。
亲本或亲本GH61多肽:术语“亲本”或“亲本GH61多肽”意指一种GH61多肽,对其做出改变以产生本发明的GH61多肽变体。亲本可以是天然存在的(野生型)多肽或其变体或片段。
具有纤维素分解增强活性的多肽:术语“具有纤维素分解增强活性的多肽”意指催化具有纤维素分解活性的酶对纤维素材料的水解增强的GH61多肽或其变体。出于本发明的目的,纤维素分解增强活性通过测量来自由纤维素分解酶在以下条件下水解纤维素材料的还原糖的增加或纤维二糖与葡萄糖总量的增加来测定:1-50mg总蛋白质/g于预处理的玉米秸秆(PCS)中的纤维素,其中总蛋白质由50%w/w-99.5%w/w纤维素分解酶蛋白以及0.5%w/w-50%w/w GH61多肽或其变体的蛋白质组成,在合适的温度(如40℃-80℃,例如,50℃、55℃、60℃、65℃、或70℃)以及合适的pH(如4-9,例如,5.0、5.5、6.0、6.5、或7.0)下持续1-7天,与用相等的总蛋白质负载量而无纤维素分解增强活性(1-50mg纤维素分解蛋白/g于PCS中的纤维素)的对照水解相比较。在一个优选方面,使用在总蛋白质重量的2%-3%的米曲霉(Aspergillus oryzae)β-葡糖苷酶(根据WO 02/095014在米曲霉中重组产生)或者总蛋白质重量的2%-3%的烟曲霉β-葡糖苷酶(如WO 2002/095014中所述在米曲霉中重组产生)的纤维素酶蛋白负载量存在下的1.5L(诺维信公司(Novozymes A/S),丹麦巴格斯瓦尔德(Denmark))的混合物作为纤维素分解活性的来源。
用于测定GH61多肽或其变体的纤维素分解增强活性的另一种测定是在40℃下将GH61多肽或其变体与0.5%磷酸溶胀纤维素(PASC)、100mM乙酸钠(pH 5)、1mM MnSO4、0.1%没食子酸、0.025mg/ml的烟曲霉β-葡糖苷酶、以及0.01%X100一起孵育24-96小时,然后测定从PASC释放的葡萄糖。
具有纤维素分解增强活性的GH61多肽或其变体通过将达到相同的水解程度所需要的纤维素分解酶的量降低优选至少1.01倍,例如,至少1.05倍、至少1.10倍、至少1.25倍、至少1.5倍、至少2倍、至少3倍、至少4倍、至少5倍、至少10倍、或至少20倍,来增强由具有纤维素分解活性的酶催化的纤维素材料的水解。
预处理的玉米秸杆:术语“PCS”或“预处理的玉米秸杆”意指通过用热和稀硫酸处理、碱预处理、或中性预处理从玉米秸杆得到的纤维素材料。
序列一致性:两个氨基酸序列之间或两个核苷酸序列之间的相关性通过参数“序列一致性”来描述。
出于本发明的目的,两个氨基酸序列之间的序列一致性使用如EMBOSS包(EMBOSS:欧洲分子生物学开放软件套件(The European Molecular Biology Open SoftwareSuite),赖斯(Rice)等人,2000,遗传学趋势(Trends Genet.)16:276-277)(优选5.0.0版或更高版本)的Needle程序中所实现的尼德尔曼-文施(Needleman-Wunsch)算法(尼德尔曼和文施,1970,分子生物学杂志(J.Mol.Biol.)48:443-453)来测定。使用的参数为缺口罚分(gap penalty)10、缺口延伸罚分(gap extension penalty)0.5、以及EBLOSUM62(BLOSUM62的EMBOSS版)取代矩阵。使用Needle标记为“最长同一性(longest identity)”的输出(使用-nobrief选项获得)作为同一性百分比,并且计算如下:
(相同残基x 100)/(比对长度–比对中缺口的总数)
出于本发明的目的,两个脱氧核糖核苷酸序列之间的序列一致性使用如EMBOSS包(EMBOSS:欧洲分子生物学开放软件套件,赖斯等人,2000,同上)(优选5.0.0版或更高版本)的Needle程序中所实现的尼德尔曼-文施算法(尼德尔曼和文施,1970,同上)来测定。使用的参数为缺口罚分(gap penalty)10、缺口延伸罚分(gap extension penalty)0.5、以及EDNAFULL(NCBI NUC4.4的EMBOSS版)取代矩阵。使用Needle标记为“最长同一性(longestidentity)”的输出(使用-nobrief选项获得)作为同一性百分比,并且计算如下:
(相同脱氧核糖核苷酸x 100)/(比对长度–比对中缺口的总数)
子序列:术语“子序列”意指从成熟多肽编码序列的5'和/或3'端缺失一个或多个(例如若干个)核苷酸的多核苷酸,其中该子序列编码具有纤维素分解增强活性的片段。在一个方面,一个子序列含有GH61多肽的成熟多肽编码序列的至少85%的核苷酸,例如至少90%的核苷酸或至少95%的核苷酸。
变体:术语“变体”意指在一个或多个(例如若干个)位置上包含改变,即取代、插入、和/或缺失的具有纤维素分解增强活性的多肽。取代意指占据一个位置的氨基酸替换不同的氨基酸;缺失意指去除占据一个位置的氨基酸;并且插入意指在邻接并且紧随占据一个位置的氨基酸之后添加一个氨基酸。本发明的变体具有其亲本GH61多肽的纤维素分解增强活性的至少20%,例如至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、或至少100%。
极高严谨度条件:术语“极高严谨度条件”意指对于长度为至少100个核苷酸的探针,在42℃下,在5X SSPE、0.3%SDS、200微克/ml已剪切并且变性的鲑鱼精子DNA和50%的甲酰胺中,根据标准的Southern印迹程序进行预杂交和杂交12至24小时。最后使用2X SSC、0.2%SDS在70℃下将载体材料洗涤三次,每次15分钟。
极低严谨度条件:术语“极低严谨度条件”意指对于长度为至少100个核苷酸的探针,在42℃下,在5X SSPE、0.3%SDS、200微克/ml已剪切并且变性的鲑鱼精子DNA和25%的甲酰胺中,根据标准的Southern印迹程序进行预杂交和杂交12至24小时。最后使用2X SSC、0.2%SDS在45℃下将载体材料洗涤三次,每次15分钟。
野生型GH61多肽:术语“野生型”GH61多肽意指由天然存在的微生物表达的GH61多肽,这些微生物如在自然界中发现的细菌、酵母、或丝状真菌。
含木聚糖材料:术语“含木聚糖材料”意指包含含有β-(1-4)连接的木糖残基骨架的植物细胞壁多糖的任何材料。陆生植物的木聚糖是具有β-(1-4)-D-吡喃木糖骨架的杂聚物,其由短的碳水化合物链分支。它们包含D-葡糖醛酸或其4-O-甲基醚,L-阿拉伯糖、和/或由D-木糖、L-阿拉伯糖、D-或L-半乳糖、以及D-葡萄糖构成的不同寡糖。木聚糖类型的多糖可以分为均木聚糖和杂木聚糖,这些杂木聚糖包括葡糖醛酸木聚糖、(阿拉伯)葡糖醛酸木聚糖、(葡糖醛酸)阿拉伯木聚糖、阿拉伯木聚糖、以及复合杂木聚糖。参见,例如,埃伯林格罗瓦(Ebringerova)等人,2005,聚合物科学进展(Adv.Polym.Sci.)186:1–67。
在本发明的方法中,可以使用含有木聚糖的任何材料。在一个优选方面,该含木聚糖材料是木质纤维素。
木聚糖降解活性或木聚糖分解活性:术语“木聚糖降解活性”或“木聚糖分解活性”意指水解含木聚糖材料的生物学活性。用于测量木聚糖分解活性的两种基本方法包括:(1)测量总木聚糖分解活性,和(2)测量单独的木聚糖分解活性(例如内切木聚糖酶、β-木糖苷酶、阿拉伯呋喃糖苷酶、α-葡糖醛酸糖苷酶、乙酰木聚糖酯酶、阿魏酸酯酶、以及α-葡糖醛酸酯酶)。木聚糖分解酶测定的最近进展总结于若干出版物中,这些出版物包括:别雷(Biely)和普乔尔德(Puchard),2006,木聚糖分解酶测定的最近进展(Recent progress in theassays of xylanolytic enzymes),食品与农业科学杂志(Journal of the Science ofFood and Agriculture)86(11):1636-1647;斯帕尼科瓦(Spanikova)和别雷,2006,葡糖醛酸酯酶-由产生的新型碳水化合物酯酶裂褶菌(Schizophyllum commune)(Glucuronoylesterase-Novel carbohydrate esterase produced by Schizophyllum commune),欧洲生化学会联合会快报580(19):4597-4601;赫尔曼(Herrmann)、沃散斯卡(Vrsanska)、尤日奇科娃(Jurickova)、赫西(Hirsch)、别雷、以及库比切克(Kubicek),1997,里氏木霉的β-D-木糖苷酶是一种多功能β-D-木聚糖木糖水解酶(The beta-D-xylosidase of Trichodermareesei is a multifunctional beta-D-xylan xylohydrolase),生物化学杂志(Biochemical Journal)321:375-381。
总木聚糖降解活性可以通过测定由不同类型的木聚糖形成的还原糖来测量,这些木聚糖包括(例如)燕麦斯佩尔特小麦(oat spelt)、山毛榉木(beechwood)、以及落叶松木(larchwood)木聚糖,或者可以通过从不同共价染色的木聚糖释放出的染色的木聚糖片段的光度测定来测量。最常见的总木聚糖分解活性测定是基于从多聚的4-O-甲基葡糖醛酸木聚糖产生还原糖,如贝利(Bailey)、别雷、剖坦恩(Poutanen),1992,用于木聚糖酶活性的测定方法的实验室间测试(Interlaboratory testing of methods for assay of xylanaseactivity),生物技术杂志(Journal of Biotechnology)23(3):257-270中所述。木聚糖酶活性还可在37℃下在0.01%X-100(4-(1,1,3,3-四甲基丁基)苯基-聚乙二醇)和200mM磷酸钠缓冲液(pH 6)中用0.2%AZCL-阿拉伯木聚糖作为底物来测定。一个单位的木聚糖酶活性定义为在37℃、pH 6下在200mM磷酸钠(pH 6)缓冲液中从作为底物的0.2%AZCL-阿拉伯木聚糖每分钟产生1.0微摩尔天青精。
出于本发明的目的,木聚糖降解活性通过测量由木聚糖降解酶在以下典型条件下造成的桦木木聚糖(西格玛化学有限公司(Sigma Chemical Co.,Inc.),美国密苏里州圣路易斯(St.Louis,MO,USA))水解的增加来测定:1ml反应、5mg/ml底物(总固体),5mg木聚糖分解蛋白质/g底物、50mM乙酸钠(pH 5)、50℃、24小时,如里弗(Lever),1972,用于碳水化合物的比色测定的新反应(A new reaction for colorimetric determination ofcarbohydrates),分析生物化学(Anal.Biochem)47:273-279所述使用对羟基苯甲酸酰肼(PHBAH)测定进行糖分析。
木聚糖酶:术语“木聚糖酶”意指1,4-β-D-木聚糖-木糖水解酶(E.C.3.2.1.8),其催化木聚糖中1,4-β-D-木糖苷键的内切水解。出于本发明的目的,木聚糖酶活性是在0.01%X-100和200mM磷酸钠缓冲液(pH 6)中在37℃下,使用0.2%AZCL-阿拉伯木聚糖作为底物来测定的。一个单位的木聚糖酶活性定义为在37℃、pH 6下在200mM磷酸钠pH 6缓冲液中从作为底物的0.2%AZCL-阿拉伯木聚糖每分钟产生1.0微摩尔天青精。
变体命名惯例
出于本发明的目的,使用在SEQ ID NO:30中披露的成熟多肽来确定另一个GH61多肽中相对应的氨基酸残基。将另一个GH61多肽的氨基酸序列与SEQ ID NO:30中披露的成熟多肽进行比对,并且基于该比对,可以使用如EMBOSS包(EMBOSS:欧洲分子生物学开放软件套件,赖斯等人,2000,遗传学趋势16:276-277)(优选5.0.0版或更高版本)的Needle程序中所实现的尼德尔曼-文施算法(尼德尔曼和文施,1970,分子生物学杂志48:443-453)来确定与SEQ ID NO:30中所披露的成熟多肽中任何氨基酸残基相对应的氨基酸位置编号。使用的参数为缺口罚分(gap penalty)10、缺口延伸罚分(gap extension penalty)0.5、以及EBLOSUM62(BLOSUM62的EMBOSS版)取代矩阵。氨基酸位置的编号基于SEQ ID NO:30的全长多肽(例如,包括信号肽),其中位置1是信号肽的第一个氨基酸(如,Met)。
另一个GH61多肽中相对应氨基酸残基的鉴定可以通过使用若干计算机程序使用其对应的缺省参数进行的多个多肽序列的比对来确定,这些计算机程序包括但不限于MUSCLE(通过log期望的多序列比较;3.5版或更高版本;埃德加(Edgar),2004,核酸研究(Nucleic Acids Research)32:1792-1797);MAFFT(6.857版或更高版本;加藤(Katoh)和库玛(Kuma),2002,核酸研究30:3059-3066;加藤等人,2005,核酸研究33:511-518;加藤和朝都(Toh),2007,生物信息学(Bioinformatics)23:372-374;加藤等人,2009,分子生物学中的方法(Methods in Molecular Biology)537:39-64;加藤和朝都,2010,生物信息学(Bioinformatics)26:1899-1900),以及采用ClustalW的EMBOSS EMMA(1.83或更高版本;汤普森等人,1994,核酸研究22:4673-4680)。
例如,与烟曲霉GH61多肽(SEQ ID NO:30)中的位置105相对应的位置是埃默森青霉GH61多肽(SEQ ID NO:36)中的位置109、金黄色嗜热子囊菌GH61多肽(SEQ ID NO:14)中的位置105、以及棘孢曲霉GH61多肽(SEQ ID NO:68)中的位置103;与烟曲霉GH61多肽中的位置188相对应的位置是埃默森青霉GH61多肽中的位置192、金黄色嗜热子囊菌GH61多肽中的位置188、以及棘孢曲霉GH61多肽中的位置186;与烟曲霉GH61多肽的位置154相对应的位置是棘孢曲霉GH61多肽中的位置152;并且与烟曲霉GH61多肽中的位置189相对应的位置是埃默森青霉GH61多肽中的位置193以及棘孢曲霉GH61多肽中的位置187。
当另一个GH61多肽与SEQ ID NO:30的成熟多肽歧异,这样使得传统的基于序列的比较无法检测出它们的关系时(林达尔(Lindahl)和埃洛氟松(Elofsson),2000,分子生物学杂志295:613-615),可以使用其他配对序列比较算法。基于序列的搜索中的较高的灵敏度可以使用利用多肽家族的概率表现(序型)搜索数据库的搜索程序来获得。例如,PSI-BLAST程序通过迭代数据库搜索过程来产生序型,并且能够检测出远程同源物(阿特休尔(Atschul)等人,1997,核酸研究25:3389-3402)。当多肽的家族或超家族在蛋白质结构数据库中具有一个或多个代表时,甚至可以实现更高灵敏度。程序如GenTHREADER(琼斯(Jones),1999,分子生物学杂志287:797-815;麦古芬(McGuffin)和琼斯,2003,生物信息学19:874-881)利用来自不同来源(PSI-BLAST、二级结构预测、结构比对序型以及溶解势)的信息作为预测所查询序列的结构折叠的神经网络的输入。类似地,可以使用高夫(Gough)等人,2000,分子生物学杂志313:903-919的方法来将未知结构的序列与存在于SCOP数据库中的超家族模型进行比对。这些比对可以进而用于生成该多肽的同源性模型,并且这类模型可以针对准确度使用多种为那个目的开发的工具加以评价。
对于已知结构的蛋白质,若干工具和资源可用于检索和生成结构比对。例如,已将SCOP超家族的蛋白质进行了结构比对,并且那些比对是可获取并且可下载的。两个或两个以上蛋白质结构可以使用多种算法,如距离比对矩阵(Holm and Sander,1998,Proteins33:88-96)或组合延伸(combinatorial extension)(辛迪亚洛夫(Shindyalov)和博尔内(Bourne),1998,蛋白质工程(Protein Engineering)11:739-747)进行比对,并且这些算法的实施可以另外用于查询具有感兴趣的结构的结构数据库,以便发现可能的结构同源物(例如,霍尔姆(Holm)和帕克(Park),2000,生物信息学16:566-567)。
在描述本发明的GH61多肽变体时,为了方便参照起见,采用了以下所述的命名法。采用公认的IUPAC单字母或三字母氨基酸缩写。
取代。对于氨基酸取代,使用以下命名法:初始氨基酸、位置、取代氨基酸。相应地,将位置226处的苏氨酸取代为丙氨酸命名为“Thr226Ala”或“T226A”。多个突变通过添加加号(“+”)分开,例如,“Gly205Arg+Ser411Phe”或“G205R+S411F”,对应地代表分别位置205和411的甘氨酸(G)取代为精氨酸(R),以及丝氨酸(S)取代为苯丙氨酸(F)。
缺失。对于氨基酸缺失,使用以下命名法:初始氨基酸、位置、*。相应地,在位置195处的缺失命名为“Gly195*”或“G195*”。多个缺失通过添加加号(“+”)分开,例如,“Gly195*+Ser411*”或“G195*+S411*”。
插入。对于氨基酸插入,使用以下命名法:初始氨基酸、位置、初始氨基酸、插入氨基酸。相应地,在位置195处的甘氨酸之后插入赖氨酸命名为“Gly195GlyLys”或“G195GK”。多个氨基酸的插入命名为[初始氨基酸、位置、初始氨基酸、插入氨基酸#1,插入氨基酸#2;等等]。例如,在位置195处的甘氨酸之后插入赖氨酸和丙氨酸表示为“Glyl95GlyLysAla”或“G195GKA”。
在这类情况下,通过在一个或多个插入氨基酸残基前的氨基酸残基的位置号添加小写字母而对一个或多个插入氨基酸残基进行编号。因此,在以上实例中,序列将为:
<u>亲本:</u> <u>变体:</u>
195 195 195a 195b
G G-K-A
多个取代。包含多个取代的变体通过添加加号(“+”)分开,例如“Arg170Tyr+Gly195Glu”或“R170Y+G195E”对应地代表分别在位置170处的精氨酸取代为酪氨酸,以及在位置195处甘氨酸取代为谷氨酸。
不同的取代。在可以在一个位置处引入不同的取代的情况下,这些不同取代由逗号分开,例如“Arg170Tyr,Glu”代表在位置170处的精氨酸取代为酪氨酸或谷氨酸。因此,“Tyr167Gly,Ala+Arg170Gly,Ala”指以下变体:
“Tyrl67Gly+Argl70Gly”、“Tyrl67Gly+Argl70Ala”、“Tyrl67Ala+Argl70Gly”、以及“Tyrl67Ala+Argl70Ala”。
发明详细说明
本发明涉及分离的GH61多肽变体,包含在与SEQ ID NO:30的成熟多肽的位置105、154、188、189、216、以及229相对应的一个或多个(例如若干个)位置处的取代,其中这些变体具有纤维素分解增强活性。
变体
在一个实施例中,该变体与亲本GH61多肽的氨基酸序列具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但少于100%的序列一致性。
在另一个实施例中,该变体与SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、或180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、或216的成熟多肽具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但少于100%的序列一致性。
在一个方面,本发明的变体中取代的数目是1-6个,例如1、2、3、4、5、或6个取代。
在另一个方面,变体包含在与位置105、154、188、189、216、以及229相对应的一个或多个(例如若干个)位置处的取代。在另一个方面,变体包含在与位置105、154、188、189、216、以及229中的任何一个相对应的两个位置处的取代。在另一个方面,变体包含在与位置105、154、188、189、216、以及229中的任何一个相对应的三个位置处的取代。在另一个方面,变体包含在与位置105、154、188、189、216、以及229中的任何一个相对应的四个位置处的取代。在另一个方面,变体包含在与位置105、154、188、189、216、以及229中的任何一个相对应的五个位置处的取代。在另一个方面,变体包含在与位置105、154、188、189、216、以及229相对应的每个位置处的取代。
在另一个方面,该变体包含在与位置105相对应的位置处的取代或由其组成。在另一个方面,与位置105相对应的位置处的氨基酸取代为Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val、优选取代为Pro或Lys。在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代E105P或E105K,或由其组成。
在另一个方面,该变体包含在与位置154相对应的位置处的取代或由其组成。在另一个方面,与位置154相对应的位置处的氨基酸取代为Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val、优选取代为Ile或Leu。在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代E154I或E154L,或由其组成。
在另一个方面,该变体包含在与位置188相对应的位置处的取代或由其组成。在另一个方面,与位置188相对应的位置处的氨基酸取代为Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val、优选取代为Ala、Met、Phe、或Trp。在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代G188A、G188F、G188M、或G188W,或由其组成。
在另一个方面,该变体包含在与位置189相对应的位置处的取代或由其组成。在另一个方面,与位置189相对应的位置处的氨基酸取代为Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val、优选取代为His或Lys。在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代N189H或N189K,或由其组成。
在另一个方面,该变体包含在与位置216相对应的位置处的取代或由其组成。在另一个方面,与位置216相对应的位置处的氨基酸取代为Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val、优选取代为Leu或Tyr。在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代A216L或A216Y,或由其组成。
在另一个方面,该变体包含在与位置229相对应的位置处的取代或由其组成。在另一个方面,与位置229相对应的位置处的氨基酸取代为Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val、优选取代为Trp、His、Ile或Tyr。在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代K229W、K229H、K229I、或K229Y,或由其组成。
在另一个方面,该变体包含在与位置105和154相对应的位置处的取代(如以上描述的那些)或由其组成。
在另一个方面,该变体包含在与位置105和188相对应的位置处的取代(如以上描述的那些)或由其组成。
在另一个方面,该变体包含在与位置105和189相对应的位置处的取代(如以上描述的那些)或由其组成。
在另一个方面,该变体包含在与位置105和216相对应的位置处的取代(如以上描述的那些)或由其组成。
在另一个方面,该变体包含在与位置105和229相对应的位置处的取代(如以上描述的那些)或由其组成。
在另一个方面,该变体包含在与位置154和188相对应的位置处的取代(如以上描述的那些)或由其组成。
在另一个方面,该变体包含在与位置154和189相对应的位置处的取代(如以上描述的那些)或由其组成。
在另一个方面,该变体包含在与位置154和216相对应的位置处的取代(如以上描述的那些)或由其组成。
在另一个方面,该变体包含在与位置154和229相对应的位置处的取代(如以上描述的那些)或由其组成。
在另一个方面,该变体包含在与位置188和189相对应的位置处的取代(如以上描述的那些)或由其组成。
在另一个方面,该变体包含在与位置188和216相对应的位置处的取代(如以上描述的那些)或由其组成。
在另一个方面,该变体包含在与位置188和229相对应的位置处的取代(如以上描述的那些)或由其组成。
在另一个方面,该变体包含在与位置189和216相对应的位置处的取代(如以上描述的那些)或由其组成。
在另一个方面,该变体包含在与位置189和229相对应的位置处的取代(如以上描述的那些)或由其组成。
在另一个方面,该变体包含在与位置216和229相对应的位置处的取代(如以上描述的那些)或由其组成。
在另一个方面,该变体包含在与位置105、154、以及188相对应的位置处的取代(如以上描述的那些)或由其组成。
在另一个方面,该变体包含在与位置105、154、以及189相对应的位置处的取代(如以上描述的那些)或由其组成。
在另一个方面,该变体包含在与位置105、154、以及216相对应的位置处的取代(如以上描述的那些)或由其组成。
在另一个方面,该变体包含在与位置105、154、以及229相对应的位置处的取代(如以上描述的那些)或由其组成。
在另一个方面,该变体包含在与位置105、188、以及189相对应的位置处的取代(如以上描述的那些)或由其组成。
在另一个方面,该变体包含在与位置105、188、以及216相对应的位置处的取代(如以上描述的那些)或由其组成。
在另一个方面,该变体包含在与位置105、188、以及229相对应的位置处的取代(如以上描述的那些)或由其组成。
在另一个方面,该变体包含在与位置105、189、以及216相对应的位置处的取代(如以上描述的那些)或由其组成。
在另一个方面,该变体包含在与位置105、189、以及229相对应的位置处的取代(如以上描述的那些)或由其组成。
在另一个方面,该变体包含在与位置105、216、以及229相对应的位置处的取代(如以上描述的那些)或由其组成。
在另一个方面,该变体包含在与位置154、188、以及189相对应的位置处的取代(如以上描述的那些)或由其组成。
在另一个方面,该变体包含在与位置154、188、以及216相对应的位置处的取代(如以上描述的那些)或由其组成。
在另一个方面,该变体包含在与位置154、188、以及229相对应的位置处的取代(如以上描述的那些)或由其组成。
在另一个方面,该变体包含在与位置154、189、以及216相对应的位置处的取代(如以上描述的那些)或由其组成。
在另一个方面,该变体包含在与位置154、189、以及229相对应的位置处的取代(如以上描述的那些)或由其组成。
在另一个方面,该变体包含在与位置154、216、以及229相对应的位置处的取代(如以上描述的那些)或由其组成。
在另一个方面,该变体包含在与位置188、189、以及216相对应的位置处的取代(如以上描述的那些)或由其组成。
在另一个方面,该变体包含在与位置188、189、以及229相对应的位置处的取代(如以上描述的那些)或由其组成。
在另一个方面,该变体包含在与位置188、216、以及229相对应的位置处的取代(如以上描述的那些)或由其组成。
在另一个方面,该变体包含在与位置189、216、以及229相对应的位置处的取代(如以上描述的那些)或由其组成。
在另一个方面,该变体包含在与位置105、154、188、以及189相对应的位置处的取代(如以上描述的那些)或由其组成。
在另一个方面,该变体包含在与位置105、154、188、以及216相对应的位置处的取代(如以上描述的那些)或由其组成。
在另一个方面,该变体包含在与位置105、154、188、以及229相对应的位置处的取代(如以上描述的那些)或由其组成。
在另一个方面,该变体包含在与位置105、154、189、以及216相对应的位置处的取代(如以上描述的那些)或由其组成。
在另一个方面,该变体包含在与位置105、154、189、以及229相对应的位置处的取代(如以上描述的那些)或由其组成。
在另一个方面,该变体包含在与位置105、154、216、以及229相对应的位置处的取代(如以上描述的那些)或由其组成。
在另一个方面,该变体包含在与位置105、188、189、以及216相对应的位置处的取代(如以上描述的那些)或由其组成。
在另一个方面,该变体包含在与位置105、188、189、以及229相对应的位置处的取代(如以上描述的那些)或由其组成。
在另一个方面,该变体包含在与位置105、188、216、以及229相对应的位置处的取代(如以上描述的那些)或由其组成。
在另一个方面,该变体包含在与位置105、189、216、以及229相对应的位置处的取代(如以上描述的那些)或由其组成。
在另一个方面,该变体包含在与位置154、188、189、以及216相对应的位置处的取代(如以上描述的那些)或由其组成。
在另一个方面,该变体包含在与位置154、188、189、以及229相对应的位置处的取代(如以上描述的那些)或由其组成。
在另一个方面,该变体包含在与位置154、188、216、以及229相对应的位置处的取代(如以上描述的那些)或由其组成。
在另一个方面,该变体包含在与位置154、189、216、以及229相对应的位置处的取代(如以上描述的那些)或由其组成。
在另一个方面,该变体包含在与位置188、189、216、以及229相对应的位置处的取代(如以上描述的那些)或由其组成。
在另一个方面,该变体包含在与位置105、154、188、189、以及216相对应的位置处的取代(如以上描述的那些)或由其组成。
在另一个方面,该变体包含在与位置105、154、188、189、以及229相对应的位置处的取代(如以上描述的那些)或由其组成。
在另一个方面,该变体包含在与位置105、154、188、216、以及229相对应的位置处的取代(如以上描述的那些)或由其组成。
在另一个方面,该变体包含在与位置105、154、189、216、以及229相对应的位置处的取代(如以上描述的那些)或由其组成。
在另一个方面,该变体包含在与位置105、188、189、216、以及229相对应的位置处的取代(如以上描述的那些)或由其组成。
在另一个方面,该变体包含在与位置154、188、189、216、以及229相对应的位置处的取代(如以上描述的那些)或由其组成。
在另一个方面,该变体包含在与位置105、154、188、189、216、以及229相对应的位置处的取代(如以上描述的那些)或由其组成。
在另一个方面,该变体包含在与在此描述的其他GH61多肽的SEQ ID NO:30相对应的位置处的选自由以下各项组成的组的一个或多个(例如若干个)取代或由其组成:E105P,K;E154I,L;G188A,F,M,W;A216L,Y;以及K229W,H,I,Y,或包含选自由以下各项组成的组的一个或多个(例如若干个)取代或由其组成:E105P,K;E154I,L;G188A,F,M,W;A216L,Y;以及K229W,H,I,Y。
在以下各方面中,该变体包含在与在此描述的其他GH61多肽的SEQ ID NO:30相对应的位置处的一个或多个(例如若干个)以下描述的取代,或由其组成。
在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代E105P,K和E154I,L,或由其组成。
在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代E105P,K和G188A,F,M,W,或由其组成。
在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代E105P,K和N189H,K,或由其组成。
在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代E105P,K和A216L,Y,或由其组成。
在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代E105P,K和K229W,H,I,Y,或由其组成。
在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代E154I,L和G188A,F,M,W,或由其组成。
在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代E154I,L和N189H,K,或由其组成。
在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代E154I,L和A216L,Y,或由其组成。
在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代E154I,L和K229W,H,I,Y,或由其组成。
在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代G188A,F,M,W和N189H,K,或由其组成。
在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代G188A,F,M,W和A216L,Y,或由其组成。
在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代G188A,F,M,W和K229W,H,I,Y,或由其组成。
在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代N189H,K和A216L,Y,或由其组成。
在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代N189H,K和K229W,H,I,Y,或由其组成。
在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代A216L,Y和K229W,H,I,Y,或由其组成。
在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代E105P,K、E154I,L、以及G188A,F,M,W,或由其组成。
在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代E105P,K、E154I,L、以及N189H,K,或由其组成。
在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代E105P,K、E154I,L、以及A216L,Y,或由其组成。
在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代E105P,K、E154I,L、以及K229W,H,I,Y,或由其组成。
在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代E105P,K、G188A,F,M,W、以及N189H,K,或由其组成。
在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代E105P,K、G188A,F,M,W、以及A216L,Y,或由其组成。
在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代E105P,K、G188A,F,M,W、以及K229W,H,I,Y,或由其组成。
在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代E105P,K、N189H,K、以及A216L,Y,或由其组成。
在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代E105P,K、N189H,K、以及K229W,H,I,Y,或由其组成。
在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代E105P,K、A216L,Y、以及K229W,H,I,Y,或由其组成。
在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代E154I,L、G188A,F,M,W、以及N189H,K,或由其组成。
在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代E154I,L、G188A,F,M,W、以及A216L,Y,或由其组成。
在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代E154I,L、G188A,F,M,W、以及K229W,H,I,Y,或由其组成。
在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代E154I,L、N189H,K、以及A216L,Y,或由其组成。
在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代E154I,L、N189H,K、以及K229W,H,I,Y,或由其组成。
在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代E154I,L、A216L,Y、以及K229W,H,I,Y,或由其组成。
在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代G188A,F,M,W、N189H,K、以及A216L,Y,或由其组成。
在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代G188A,F,M,W、N189H,K、以及K229W,H,I,Y,或由其组成。
在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代G188A,F,M,W、A216L,Y、以及K229W,H,I,Y,或由其组成。
在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代N189H,K、A216L,Y、以及K229W,H,I,Y,或由其组成。
在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代E105P,K、E154I,L、G188A,F,M,W、以及N189H,K,或由其组成。
在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代E105P,K、E154I,L、G188A,F,M,W、以及A216L,Y,或由其组成。
在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代E105P,K、E154I,L、G188A,F,M,W、以及K229W,H,I,Y,或由其组成。
在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代E105P,K、E154I,L、N189H,K、以及A216L,Y,或由其组成。
在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代E105P,K、E154I,L、N189H,K、以及K229W,H,I,Y,或由其组成。
在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代E105P,K、E154I,L、A216L,Y、以及K229W,H,I,Y,或由其组成。
在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代E105P,K、G188A,F,M,W、N189H,K、以及A216L,Y,或由其组成。
在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代E105P,K、G188A,F,M,W、N189H,K、以及K229W,H,I,Y,或由其组成。
在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代E105P,K、G188A,F,M,W、A216L,Y、以及K229W,H,I,Y,或由其组成。
在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代E105P,K、N189H,K、A216L,Y、以及K229W,H,I,Y,或由其组成。
在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代E154I,L、G188A,F,M,W、N189H,K、以及A216L,Y,或由其组成。
在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代E154I,L、G188A,F,M,W、N189H,K、以及K229W,H,I,Y,或由其组成。
在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代E154I,L、G188A,F,M,W、A216L,Y、以及K229W,H,I,Y,或由其组成。
在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代E154I,L、N189H,K、A216L,Y、以及K229W,H,I,Y,或由其组成。
在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代G188A,F,M,W、N189H,K、A216L,Y、以及K229W,H,I,Y,或由其组成。
在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代E105P,K、E154I,L、G188A,F,M,W、N189H,K、以及A216L,Y,或由其组成。
在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代E105P,K、E154I,L、G188A,F,M,W、N189H,K、以及K229W,H,I,Y,或由其组成。
在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代E105P,K、E154I,L、G188A,F,M,W、A216L,Y、以及K229W,H,I,Y,或由其组成。
在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代E105P,K、E154I,L、N189H,K、A216L,Y、以及K229W,H,I,Y,或由其组成。
在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代E105P,K、G188A,F,M,W、N189H,K、A216L,Y、以及K229W,H,I,Y,或由其组成。
在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代E154I,L、G188A,F,M,W、N189H,K、A216L,Y、以及K229W,H,I,Y,或由其组成。
在另一个方面,该变体包含SEQ ID NO:30的成熟多肽的取代E105P,K、E154I,L、G188A,F,M,W、N189H,K、A216L,Y、以及K229W,H,I,Y,或由其组成。
在另一个方面,该变体包含SEQ ID NO:14的成熟多肽的取代D105K,P,或由其组成。在另一个方面,该变体包含SEQ ID NO:14的成熟多肽的取代Q188W,F,M,或由其组成。
在另一个方面,该变体包含SEQ ID NO:36的成熟多肽的取代D109P,K,或由其组成。在另一个方面,该变体包含SEQ ID NO:36的成熟多肽的取代N192A,W,M,或由其组成。在另一个方面,该变体包含SEQ ID NO:36的成熟多肽的取代N193K,H,或由其组成。在另一个方面,该变体包含SEQ ID NO:36的成熟多肽的取代D109P,K,或由其组成。在另一个方面,该取代是SEQ ID NO:36的成熟多肽的N192A,W,M。在另一个方面,该变体包含SEQ ID NO:36的成熟多肽的取代N193K,H,或由其组成。
在另一个方面,该变体包含SEQ ID NO:68的成熟多肽的取代D103K,P,或由其组成。在另一个方面,该变体包含SEQ ID NO:68的成熟多肽的取代N152I,L,或由其组成。在另一个方面,该变体包含SEQ ID NO:68的成熟多肽的取代G186A,F,M,W,或由其组成。在另一个方面,该变体包含SEQ ID NO:68的成熟多肽的取代N187H,K,或由其组成。
这些变体可以进一步包含在一个或多个(例如若干个)其他位置处的一个或多个另外的改变,例如,取代、插入、或缺失。
氨基酸改变可以具有次要性质,即不显著影响蛋白质的折叠和/或活性的保守氨基酸取代或插入;典型地1-30个氨基酸的小缺失;小的氨基或羧基末端延伸,如氨基末端甲硫氨酸残基;至多20-25个残基的小接头肽;或通过改变净电荷或另一功能来促进纯化的小延伸,如多组氨酸序列(poly histidine tract)、抗原性表位或结合结构域。
保守取代的实例在下组之内:碱性氨基酸(精氨酸、赖氨酸和组氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、极性氨基酸(谷氨酰胺和天冬酰胺)、疏水氨基酸(亮氨酸、异亮氨酸和缬氨酸)、芳族氨基酸(苯丙氨酸、色氨酸和酪氨酸)、以及小氨基酸(甘氨酸、丙氨酸、丝氨酸、苏氨酸以及甲硫氨酸)。一般不改变比活性的氨基酸取代是本领域中已知的,并且(例如)由H.纽拉特(Neurath)和R.L.希尔(Hill),1979在《蛋白质》(The Proteins)(学术出版社(Academic Press),纽约(New York))中描述。常见取代是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu、以及Asp/Gly。
可替代地,氨基酸改变具有改变多肽的物理化学特性的这样一种性质。例如,氨基酸改变可以提高多肽的热稳定性、改变底物特异性、改变最适pH,等等。
本发明的变体可以进一步包含在与SEQ ID NO:30的成熟多肽的位置111、152、155、以及162相对应的一个或多个(例如若干个)位置处的取代,其中这些变体具有纤维素分解增强活性(WO 2012/044835)。
在一个方面,本发明的变体中另外的取代的数目是1-4个,如1、2、3、或4个取代。
在另一个方面,该变体进一步包含在与位置111、152、155、以及162相对应的一个或多个(例如若干个)位置处的取代。在另一个方面,该变体进一步包含在与位置111、152、155、以及162中的任何一个相对应的两个位置处的取代。在另一个方面,该变体进一步包含在与位置111、152、155、以及162中的任何一个相对应的三个位置处的取代。在另一个方面,该变体进一步包含在与位置111、152、155、以及162相对应的每个位置处的取代。
在另一个方面,该变体进一步包含在与位置111相对应的位置处的取代。在另一个方面,与位置111相对应的位置处的氨基酸取代为Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val、优选取代为Val。在另一个方面,该变体进一步包含SEQ ID NO:30的成熟多肽的取代L111V。
在另一个方面,该变体进一步包含在与位置152相对应的位置处的取代。在另一个方面,与位置152相对应的位置处的氨基酸取代为Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val、优选取代为Ser。在另一个方面,该变体进一步包含SEQ ID NO:30的成熟多肽的取代D152S。
在另一个方面,该变体进一步包含在与位置155相对应的位置处的取代。在另一个方面,与位置155相对应的位置处的氨基酸取代为Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val、优选取代为Leu。在另一个方面,该变体进一步包含SEQ ID NO:30的成熟多肽的取代M155L。
在另一个方面,该变体进一步包含在与位置162相对应的位置处的取代。在另一个方面,与位置162相对应的位置处的氨基酸取代为Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val、优选取代为Trp。在另一个方面,该变体进一步包含SEQ ID NO:30的成熟多肽的取代A162W。
在另一个方面,该变体进一步包含在与位置111和152相对应的位置处的取代,如以上描述的那些。
在另一个方面,该变体进一步包含在与位置111和155相对应的位置处的取代,如以上描述的那些。
在另一个方面,该变体进一步包含在与位置111和162相对应的位置处的取代,如以上描述的那些。
在另一个方面,该变体进一步包含在与位置152和155相对应的位置处的取代,如以上描述的那些。
在另一个方面,该变体进一步包含在与位置152和162相对应的位置处的取代,如以上描述的那些。
在另一个方面,该变体进一步包含在与位置155和162相对应的位置处的取代,如以上描述的那些。
在另一个方面,该变体进一步包含在与位置111、152、以及155相对应的位置处的取代,如以上描述的那些。
在另一个方面,该变体进一步包含在与位置111、152、以及162相对应的位置处的取代,如以上描述的那些。
在另一个方面,该变体进一步包含在与位置111、155、以及162相对应的位置处的取代,如以上描述的那些。
在另一个方面,该变体进一步包含在与位置152、155、以及162相对应的位置处的取代,如以上描述的那些。
在另一个方面,该变体进一步包含在与位置111、152、155、以及162相对应的位置处的取代,如以上描述的那些。
在另一个方面,该变体进一步包含在与在此描述的其他GH61多肽的SEQ ID NO:30相对应的位置处的选自由以下各项组成的组的一个或多个(例如若干个)取代:L111V、D152S、M155L、以及A162W;或选自由以下各项组成的组的一个或多个(例如若干个)取代:L111V、D152S、M155L、以及A162W。
在另一个方面,该变体包含取代L111V、D152S、M155L、A162W、以及G188A,或在其相对应的位置处的相同取代。在另一个方面,该变体包含取代L111V、D152S、M155L、A162W、G188F、以及K229W,或在其相对应的位置处的相同取代。在另一个方面,该变体包含取代L111V、D152S、M155L、A162W、以及K229W,或其相对应的取代。在另一个方面,该变体包含取代L111V、D152S、M155L、A162W、A216Y、以及K229W,或在其相对应的位置处的相同取代。在另一个方面,该变体包含取代L111V、D152S、M155L、A162W、N189K、以及K229W,或在其相对应的位置处的相同取代。在另一个方面,该变体包含取代L111V、D152S、M155L、A162W、以及N189K,或在其相对应的位置处的相同取代。在另一个方面,该变体包含取代L111V、D152S、M155L、A162W、以及G188W,或在其相对应的位置处的相同取代。
在以下各方面中,该变体进一步包含在与在此描述的其他GH61多肽的SEQ ID NO:30相对应的位置处的一个或多个(例如若干个)以下描述的取代。
在另一个方面,该变体进一步包含SEQ ID NO:30的成熟多肽的取代L111V+D152S、或其相对应的取代。
在另一个方面,该变体进一步包含SEQ ID NO:30的成熟多肽的取代L111V+M155L、或其相对应的取代。
在另一个方面,该变体进一步包含SEQ ID NO:30的成熟多肽的取代L111V+A162W、或其相对应的取代。
在另一个方面,该变体进一步包含SEQ ID NO:30的成熟多肽的取代D152S+M155L、或其相对应的取代。
在另一个方面,该变体进一步包含SEQ ID NO:30的成熟多肽的取代D152S+A162W、或其相对应的取代。
在另一个方面,该变体进一步包含SEQ ID NO:30的成熟多肽的取代M155L+A162W、或其相对应的取代。
在另一个方面,该变体进一步包含SEQ ID NO:30的成熟多肽的取代L111V+D152S+M155L、或其相对应的取代。
在另一个方面,该变体进一步包含SEQ ID NO:30的成熟多肽的取代L111V+D152S+A162W、或其相对应的取代。
在另一个方面,该变体进一步包含SEQ ID NO:30的成熟多肽的取代L111V+M155L+A162W、或其相对应的取代。
在另一个方面,该变体进一步包含SEQ ID NO:30的成熟多肽的取代D152S+M155L+A162W、或其相对应的取代。
在另一个方面,该变体进一步包含SEQ ID NO:3 0的成熟多肽的取代L111V+D152S+M155L+A162W、或其相对应的取代。
在以上各方面中,本发明的变体可以进一步包含在与SEQ ID NO:30的成熟多肽的位置96、98、200、202、以及204相对应的一个或多个(例如若干个)位置处的取代,其中这些变体具有纤维素分解增强活性(WO2012/044836)。
在一个方面,本发明的变体中另外的取代的数目是1-5个,如1、2、3、4、或5个取代。
在另一个方面,该变体进一步包含在与位置96、98、200、202、以及204相对应的一个或多个(例如若干个)位置处的取代。在另一个方面,该变体进一步包含在与位置96、98、200、202、以及204中的任何一个相对应的两个位置处的取代。在另一个方面,该变体进一步包含在与位置96、98、200、202、以及204中的任何一个相对应的三个位置处的取代。在另一个方面,该变体进一步包含在与位置96、98、200、202、以及204中的任何一个相对应的四个位置处的取代。在另一个方面,该变体进一步包含在与位置96、98、200、202、以及204相对应的每个位置处的取代。
在另一个方面,该变体进一步包含在与位置96相对应的位置处的取代。在另一个方面,与位置96相对应的位置处的氨基酸取代为Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val、优选取代为Val。在另一个方面,该变体进一步包含SEQ ID NO:30的成熟多肽的取代I96V。
在另一个方面,该变体进一步包含在与位置98相对应的位置处的取代。在另一个方面,与位置98相对应的位置处的氨基酸取代为Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val、优选取代为Leu。在另一个方面,该变体进一步包含SEQ ID NO:30的成熟多肽的取代F98L。
在另一个方面,该变体进一步包含在与位置200相对应的位置处的取代。在另一个方面,与位置200相对应的位置处的氨基酸取代为Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val、优选取代为Ile。在另一个方面,该变体进一步包含SEQ ID NO:30的成熟多肽的取代F200I。
在另一个方面,该变体进一步包含在与位置202相对应的位置处的取代。在另一个方面,与位置202相对应的位置处的氨基酸取代为Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val、优选取代为Leu。在另一个方面,该变体进一步包含SEQ ID NO:30的成熟多肽的取代I202L。
在另一个方面,该变体进一步包含在与位置204相对应的位置处的取代。在另一个方面,与位置204相对应的位置处的氨基酸取代为Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val、优选取代为Val。在另一个方面,该变体进一步包含SEQ ID NO:30的成熟多肽的取代I204V。
在另一个方面,该变体进一步包含在与位置96和98相对应的位置处的取代,如以上描述的那些。
在另一个方面,该变体进一步包含在与位置96和200相对应的位置处的取代,如以上描述的那些。
在另一个方面,该变体进一步包含在与位置96和202相对应的位置处的取代,如以上描述的那些。
在另一个方面,该变体进一步包含在与位置96和204相对应的位置处的取代,如以上描述的那些。
在另一个方面,该变体进一步包含在与位置98和200相对应的位置处的取代,如以上描述的那些。
在另一个方面,该变体进一步包含在与位置98和202相对应的位置处的取代,如以上描述的那些。
在另一个方面,该变体进一步包含在与位置98和204相对应的位置处的取代,如以上描述的那些。
在另一个方面,该变体进一步包含在与位置200和202相对应的位置处的取代,如以上描述的那些。
在另一个方面,该变体进一步包含在与位置200和204相对应的位置处的取代,如以上描述的那些。
在另一个方面,该变体进一步包含在与位置202和204相对应的位置处的取代,如以上描述的那些。
在另一个方面,该变体进一步包含在与位置96、98、以及200相对应的位置处的取代,如以上描述的那些。
在另一个方面,该变体进一步包含在与位置96、98、以及202相对应的位置处的取代,如以上描述的那些。
在另一个方面,该变体进一步包含在与位置96、98、以及204相对应的位置处的取代,如以上描述的那些。
在另一个方面,该变体进一步包含在与位置96、200、以及202相对应的位置处的取代,如以上描述的那些。
在另一个方面,该变体进一步包含在与位置96、200、以及204相对应的位置处的取代,如以上描述的那些。
在另一个方面,该变体进一步包含在与位置96、202、以及204相对应的位置处的取代,如以上描述的那些。
在另一个方面,该变体进一步包含在与位置98、200、以及202相对应的位置处的取代,如以上描述的那些。
在另一个方面,该变体进一步包含在与位置98、200、以及204相对应的位置处的取代,如以上描述的那些。
在另一个方面,该变体进一步包含在与位置200、202、以及204相对应的位置处的取代,如以上描述的那些。
在另一个方面,该变体进一步包含在与位置98、202、以及204相对应的位置处的取代,如以上描述的那些。
在另一个方面,该变体进一步包含在与位置96、98、200、以及202相对应的位置处的取代,如以上描述的那些。
在另一个方面,该变体进一步包含在与位置96、200、202、以及204相对应的位置处的取代,如以上描述的那些。
在另一个方面,该变体进一步包含在与位置96、98、202、以及204相对应的位置处的取代,如以上描述的那些。
在另一个方面,该变体进一步包含在与位置96、98、200、以及204相对应的位置处的取代,如以上描述的那些。
在另一个方面,该变体进一步包含在与位置98、200、202、以及204相对应的位置处的取代,如以上描述的那些。
在另一个方面,该变体进一步包含在与位置96、98、200、202、以及204相对应的位置处的取代,如以上描述的那些。
在另一个方面,该变体进一步包含在与在此描述的其他GH61多肽的SEQ ID NO:30相对应的位置处的选自由以下各项组成的组的一个或多个(例如若干个)取代:I96V、F98L、F200I、I202L、以及I204V;或选自由以下各项组成的组的一个或多个(例如若干个)取代:I96V、F98L、F200I、I202L、以及I204V。
在以下各方面中,该变体进一步包含在与在此描述的其他GH61多肽的SEQ ID NO:30相对应的位置处的一个或多个(例如若干个)以下描述的取代。
在另一个方面,该变体进一步包含SEQ ID NO:30的成熟多肽的取代I96V+F98L、或其相对应的取代。
在另一个方面,该变体进一步包含SEQ ID NO:30的成熟多肽的取代I96V+F200I、或其相对应的取代。
在另一个方面,该变体进一步包含SEQ ID NO:30的成熟多肽的取代I96V+I202L、或其相对应的取代。
在另一个方面,该变体进一步包含SEQ ID NO:30的成熟多肽的取代I96V+I204V、或其相对应的取代。
在另一个方面,该变体进一步包含SEQ ID NO:30的成熟多肽的取代F98L+F200I、或其相对应的取代。
在另一个方面,该变体进一步包含SEQ ID NO:30的成熟多肽的取代F98L+I202L、或其相对应的取代。
在另一个方面,该变体进一步包含SEQ ID NO:30的成熟多肽的取代F98L+I204V、或其相对应的取代。
在另一个方面,该变体进一步包含SEQ ID NO:30的成熟多肽的取代F200I+I202L、或其相对应的取代。
在另一个方面,该变体进一步包含SEQ ID NO:30的成熟多肽的取代F200I+I204V、或其相对应的取代。
在另一个方面,该变体进一步包含SEQ ID NO:30的成熟多肽的取代I202L+I204V、或其相对应的取代。
在另一个方面,该变体进一步包含SEQ ID NO:30的成熟多肽的取代I96V+F98L+F200I、或其相对应的取代。
在另一个方面,该变体进一步包含SEQ ID NO:30的成熟多肽的取代I96V+F98L+I202L、或其相对应的取代。
在另一个方面,该变体进一步包含SEQ ID NO:30的成熟多肽的取代I96V+F98L+I204V、或其相对应的取代。
在另一个方面,该变体进一步包含SEQ ID NO:30的成熟多肽的取代I96V+F200I+I202L、或其相对应的取代。
在另一个方面,该变体进一步包含SEQ ID NO:30的成熟多肽的取代I96V+F200I+I204V、或其相对应的取代。
在另一个方面,该变体进一步包含SEQ ID NO:30的成熟多肽的取代I96V+I202L+I204V、或其相对应的取代。
在另一个方面,该变体进一步包含SEQ ID NO:30的成熟多肽的取代F98L+F200I+I202L、或其相对应的取代。
在另一个方面,该变体进一步包含SEQ ID NO:30的成熟多肽的取代F98L+F200I+I204V、或其相对应的取代。
在另一个方面,该变体进一步包含SEQ ID NO:30的成熟多肽的取代F200I+I202L+I204V、或其相对应的取代。
在另一个方面,该变体进一步包含SEQ ID NO:30的成熟多肽的取代F98L+I202L+I204V、或其相对应的取代。
在另一个方面,该变体进一步包含SEQ ID NO:30的成熟多肽的取代I96V+F98L+F200I+I202L、或其相对应的取代。
在另一个方面,该变体进一步包含SEQ ID NO:30的成熟多肽的取代I96V+F200I+I202L+I204V、或其相对应的取代。
在另一个方面,该变体进一步包含SEQ ID NO:30的成熟多肽的取代I96V+F98L+I202L+I204V、或其相对应的取代。
在另一个方面,该变体进一步包含SEQ ID NO:30的成熟多肽的取代I96V+F98L+F200I+I204V、或其相对应的取代。
在另一个方面,该变体进一步包含SEQ ID NO:30的成熟多肽的取代F98L+F200I+I202L+I204V、或其相对应的取代。
在另一个方面,该变体进一步包含SEQ ID NO:30的成熟多肽的取代I96V+F98L+F200I+I202L +I204V、或其相对应的取代。
该变体可以由相对应的亲本GH61多肽的成熟多肽的至少85%的氨基酸残基,例如至少90%的氨基酸残基或至少95%的氨基酸残基组成。
可以根据本领域中已知的程序,如定点诱变或丙氨酸扫描诱变(坎宁汉(Cunningham)和威尔斯(Wells),1989,科学(Science)244:1081-1085)来鉴定多肽中的必需氨基酸。在后一技术中,在分子中的每个残基中引入单个丙氨酸突变,并且针对纤维素分解增强活性测试所得突变分子,以鉴定对于该分子的活性关键的氨基酸残基。同样参见,希尔顿(Hilton)等人,1996,生物化学杂志271:4699-4708。酶或其他生物学相互作用的活性位点也可以通过对如用如核磁共振、结晶学、电子衍射、或光亲和标记的这类技术测定的结构进行物理分析,结合对推定的接触位点氨基酸进行突变而测定。参见,例如,德弗斯(deVos)等人,1992,科学255:306-312;史密斯(Smith)等人,1992,分子生物学杂志224:899-904;乌乐达维尔(Wlodaver)等人,1992,欧洲生化学会联合会快报309:59-64。必需氨基酸的身份还可以从与相关多肽的比对来推断。GH61多肽中的必需氨基酸与SEQ ID NO:30的成熟多肽的位置22、107、194、和/或196相对应。
在一个实施例中,与其亲本GH61多肽相比,变体具有增加的热稳定性。
在一个方面,变体相对于亲本的热稳定性在pH 3.0和45℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 3.0和50℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 3.0和55℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 3.0和60℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 3.0和62℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 3.0和65℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 3.0和68℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 3.0和70℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 3.0和72℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 3.0和75℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 3.0和80℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 3.0和85℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 3.0和90℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 3.0和95℃下测定。
在另一个方面,变体相对于亲本的热稳定性在pH 3.5和45℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 3.5和50℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 3.5和55℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 3.5和60℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 3.5和62℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 3.5和65℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 3.5和68℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 3.5和70℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 3.5和72℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 3.5和75℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 3.5和80℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH3.5和85℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 3.5和90℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 3.5和95℃下测定。
在另一个方面,变体相对于亲本的热稳定性在pH 4.0和45℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 4.0和50℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 4.0和55℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 4.0和60℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 4.0和62℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 4.0和65℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 4.0和68℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 4.0和70℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 4.0和72℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 4.0和75℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 4.0和80℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH4.0和85℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 4.0和90℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 4.0和95℃下测定。
在另一个方面,变体相对于亲本的热稳定性在pH 4.5和45℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 4.5和50℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 4.5和55℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 4.5和60℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 4.5和62℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 4.5和65℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 4.5和68℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 4.5和70℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 4.5和72℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 4.5和75℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 4.5和80℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH4.5和85℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 4.5和90℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 4.5和95℃下测定。
在另一个方面,变体相对于亲本的热稳定性在pH 5.0和45℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 5.0和50℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 5.0和55℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 5.0和60℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 5.0和62℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 5.0和65℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 5.0和68℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 5.0和70℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 5.0和72℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 5.0和75℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 5.0和80℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH5.0和85℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 5.0和90℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 5.0和95℃下测定。
在另一个方面,变体相对于亲本的热稳定性在pH 5.5和45℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 5.5和50℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 5.5和55℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 5.5和60℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 5.5和62℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 5.5和65℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 5.5和68℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 5.5和70℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 5.5和72℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 5.5和75℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 5.5和80℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH5.5和85℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 5.5和90℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 5.5和95℃下测定。
在另一个方面,变体相对于亲本的热稳定性在pH 6.0和45℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 6.0和50℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 6.0和55℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 6.0和60℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 6.0和62℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 6.0和65℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 6.0和68℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 6.0和70℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 6.0和72℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 6.0和75℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 6.0和80℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH6.0和85℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 6.0和90℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 6.0和95℃下测定。
在另一个方面,变体相对于亲本的热稳定性在pH 6.5和45℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 6.5和50℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 6.5和55℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 6.5和60℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 6.5和62℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 6.5和65℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 6.5和68℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 6.5和70℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 6.5和72℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 6.5和75℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 6.5和80℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH6.5和85℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 6.5和90℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 6.5和95℃下测定。
在另一个方面,变体相对于亲本的热稳定性在pH 7.0和45℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 7.0和50℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 7.0和55℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 7.0和60℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 7.0和62℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 7.0和65℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 7.0和68℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 7.0和70℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 7.0和72℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 7.0和75℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 7.0和80℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH7.0和85℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 7.0和90℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 7.0和95℃下测定。
在另一个方面,变体相对于亲本的热稳定性在pH 7.5和45℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 7.5和50℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 7.5和55℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 7.5和60℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 7.5和62℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 7.5和65℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 7.5和68℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 7.5和70℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 7.5和72℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 7.5和75℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 7.5和80℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH7.5和85℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 7.5和90℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 7.5和95℃下测定。
在另一个方面,变体相对于亲本的热稳定性在pH 8.0和45℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 8.0和50℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 8.0和55℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 8.0和60℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 8.0和62℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 8.0和65℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 8.0和68℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 8.0和70℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 8.0和72℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 8.0和75℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 8.0和80℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH8.0和85℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 8.0和90℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 8.0和95℃下测定。
在另一个方面,变体相对于亲本的热稳定性在pH 8.5和45℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 8.5和50℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 8.5和55℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 8.5和60℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 8.5和62℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 8.5和65℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 8.5和68℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 8.5和70℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 8.5和72℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 8.5和75℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 8.5和80℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH8.5和85℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 8.5和90℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 8.5和95℃下测定。
在另一个方面,变体相对于亲本的热稳定性在pH 9.0和45℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 9.0和50℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 9.0和55℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 9.0和60℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 9.0和62℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 9.0和65℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 9.0和68℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 9.0和70℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 9.0和72℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 9.0和75℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 9.0和80℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH9.0和85℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 9.0和90℃下测定。在另一个方面,变体相对于亲本的热稳定性在pH 9.0和95℃下测定。
在以上各方面中,变体相对于亲本的热稳定性可以通过将该变体和该亲本孵育1分钟来测定。在以上各方面中,变体相对于亲本的热稳定性可以通过将该变体和该亲本孵育5分钟来测定。在以上各方面中,变体相对于亲本的热稳定性可以通过将该变体和该亲本孵育10分钟来测定。在以上各方面中,变体相对于亲本的热稳定性可以通过将该变体和该亲本孵育15分钟来测定。在以上各方面中,变体相对于亲本的热稳定性可以通过将该变体和该亲本孵育20分钟来测定。在以上各方面中,变体相对于亲本的热稳定性可以通过将该变体和该亲本孵育25分钟来测定。在以上各方面中,变体相对于亲本的热稳定性可以通过将该变体和该亲本孵育30分钟来测定。在以上各方面中,变体相对于亲本的热稳定性可以通过将该变体和该亲本孵育45分钟来测定。在以上各方面中,变体相对于亲本的热稳定性可以通过将该变体和该亲本孵育60分钟来测定。也可以使用比60分钟更长的时间段。
在一个方面,与亲本相比,具有纤维素分解增强活性的变体的热稳定性增加至少1.01倍,例如至少1.05倍、至少1.1倍、至少1.2倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.8倍、至少2倍、至少5倍、至少10倍、至少15倍、至少20倍、至少25倍、至少50倍、至少75倍、或至少100倍。
亲本GH61多肽
亲本GH61多肽可以是具有纤维素分解增强活性的任何GH61多肽。
亲本GH61多肽可以是(a)与SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、或215的成熟多肽具有至少60%序列一致性的多肽;(b)由在至少低严谨度条件下与以下杂交的多核苷酸编码的多肽:(i)1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、或215的成熟多肽编码序列、或(ii)(i)的全长互补体;或(c)由与以下具有至少60%的序列一致性的多核苷酸编码的多肽:SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、或215的成熟多肽编码序列。
在一个方面,该亲本与具有纤维素分解增强活性的SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、或180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、或216的成熟多肽具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性。
在另一个方面,该亲本的氨基酸序列与SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、或180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、或216的成熟多肽有至多10个氨基酸,例如1、2、3、4、5、6、7、8、9、或10个氨基酸的不同。
在另一个方面,该亲本包含SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、或180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、或216的氨基酸序列,或由其组成。
在另一个方面,该亲本包含SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、或180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、或216的成熟多肽,或由其组成。
在另一个方面,该亲本是含有GH61多肽的成熟多肽的至少85%的氨基酸残基,例如至少90%的氨基酸残基或至少95%的氨基酸残基的片段。
在另一个实施例中,该亲本是SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、或180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、或216的成熟多肽的等位变体。
在另一个方面,该亲本由在极低严谨度条件下、低严谨度条件下、中等严谨度条件下、中-高等严谨度条件下、高严谨度条件下、或极高严谨度条件下与以下杂交的多核苷酸编码:(i)SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、或215的成熟多肽编码序列、或其全长互补体(萨姆布鲁克(Sambrook)等人,1989,分子克隆(Molecular Cloning)实验室手册(A Laboratory Manual),第2版,冷泉港(Cold Spring Harbor),纽约(New York))。
SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、或215的多核苷酸、或其子序列,以及SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、或180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、或216的多肽、或其片段可以用来设计核酸探针,以根据本领域中熟知的方法由不同属或种的菌株鉴定和克隆编码亲本的DNA。具体来说,可以根据标准的Southern印迹程序,将这类探针用于与感兴趣的细胞的基因组DNA或cDNA杂交,以便在其中鉴定和分离相对应的基因。这类探针可以明显短于完整序列,但是长度应为至少15,例如至少25、至少35、或至少70个核苷酸。优选地,该核酸探针的长度为至少100个核苷酸,例如长度为至少200个核苷酸、至少300个核苷酸、至少400个核苷酸、至少500个核苷酸、至少600个核苷酸、至少700个核苷酸、至少800个核苷酸、或至少900个核苷酸。DNA和RNA探针二者均可使用。典型地将探针进行标记(例如,用32P、3H、35S、生物素或抗生物素蛋白),以检测相对应的基因。这类探针涵盖于本发明。
可以筛选由这类其他菌株制备的基因组DNA或cDNA文库中与上述探针杂交并且编码亲本的DNA。可以通过琼脂糖或聚丙烯酰胺凝胶电泳、或其他分离技术来分离来自这类其他菌株的基因组或其他DNA。可以将来自文库的DNA或分离的DNA转移至硝化纤维素或其他合适的载体材料上并且固定于其上。为了鉴定与SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、或215、或其子序列杂交的克隆或DNA,将该载体材料用于Southern印迹中。
出于本发明的目的,杂交指示多核苷酸在极低至极高严谨度条件下与对应于以下的标记的核酸探针杂交:(i)SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、或215;(ii)其成熟多肽编码序列;(iii)其全长互补体;或(iv)其子序列。可以使用例如X射线片或本领域中已知的任何其他检测手段检测核酸探针在这些条件下所杂交的分子。
在一个方面,该核酸探针是SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、或179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、或215的成熟多肽编码序列。
在另一个方面,该核酸探针是编码SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、或180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、或216的多肽、其成熟多肽、或其片段的多核苷酸。
在另一个方面,该核酸探针是SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、或179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、或215。
在另一个实施例中,该亲本由与SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、或179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、或215的成熟多肽编码序列具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多核苷酸编码。
该亲本可以是一种杂合多肽,其中一个多肽的区域融合在另一个多肽的区域的N末端或C末端。
该亲本可以是一种融合多肽或可裂解的融合多肽,其中另一个多肽融合在本发明的多肽的N末端或C末端。融合多肽是通过将编码另一个多肽的多核苷酸融合至本发明的多核苷酸来产生。产生融合多肽的技术是本领域中已知的,并且包括连接编码多肽的编码序列,以使得它们同框,并且融合多肽的表达受到相同的启动子和终止子的控制。融合多肽还可以使用内蛋白技术构建,其中融合多肽在翻译后产生(库珀(Cooper)等人,1993,欧洲分子生物学学会杂志(EMBO J.)12:2575-2583;道森(Dawson)等人,1994,科学266:776-779)。
融合多肽可以进一步在两个多肽之间包含一个裂解位点。一旦分泌了融合蛋白,该位点就被裂解,从而释放这两个多肽。裂解位点的实例包括但不限于在以下披露的位点:马丁(Martin)等人,2003,工业微生物学与生物技术杂志(J.Ind.Microbiol.Biotechnol.)3:568-576;斯韦蒂娜(Svetina)等人,2000,生物技术杂志(J.Biotechnol.)76:245-251;罗斯默森-威尔森(Rasmussen-Wilson)等人,1997,应用与环境微生物学(Appl.Environ.Microbiol.)63:3488-3493;沃德(Ward)等人,1995,生物技术(Biotechnology)13:498-503;以及孔特雷拉斯(Contreras)等人,1991,生物技术9:378-381;伊顿(Eaton)等人,1986,生物化学(Biochemistry)25:505-512;柯林斯-雷西(Collins-Racie)等人,1995,生物技术13:982-987;卡特(Carter)等人,1989,蛋白质:结构、功能与遗传学(Proteins:Structure,Function,and Genetics)6:240-248;以及史蒂文斯(Stevens),2003,世界药物发现(Drug Discovery World)4:35-48。
该亲本可以获自任何属的微生物。出于本发明的目的,如在此与给定来源结合使用的术语“获自”,意思应为由多核苷酸编码的亲本由该来源产生,或由其中插入了来自该来源的多核苷酸的菌株产生。在一个方面,该亲本分泌到胞外。
该亲本可以是一种细菌GH61多肽。例如,该亲本可以是一种革兰氏阳性菌多肽,如芽孢杆菌属(Bacillus)、梭菌属(Clostridium)、肠球菌属(Enterococcus)、土芽孢杆菌属(Geobacillus)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、海洋芽孢杆菌属(Oceanobacillus)、葡萄球菌属(Staphylococcus)、链球菌属(Streptococcus)、或链霉菌属(Streptomyces)GH61多肽;或一种革兰氏阴性菌多肽,如弯曲杆菌属(Campylobacter)、大肠杆菌(E.coli)、黄杆菌属(Flavobacterium)、梭杆菌属(Fusobacterium)、螺杆菌属(Helicobacter)、泥杆菌属(Ilyobacter)、奈瑟氏菌属(Neisseria)、假单胞菌属(Pseudomonas)、沙门菌属(Salmonella)或脲原体属(Ureaplasma)GH61多肽。
在一个方面,该亲本是嗜碱芽孢杆菌(Bacillus alkalophilus)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、短芽孢杆菌(Bacillus brevis)、环状芽孢杆菌(Bacillus circulans)、克劳氏芽孢杆菌(Bacillus clausii)、凝结芽孢杆菌(Bacilluscoagulans)、坚强芽孢杆菌(Bacillus firmus)、灿烂芽孢杆菌(Bacillus lautus)、迟缓芽孢杆菌(Bacillus lentus)、地衣芽孢杆菌(Bacillus licheniformis)、巨大芽孢杆菌(Bacillus megaterium)、短小芽孢杆菌(Bacillus pumilus)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)、枯草芽孢杆菌(Bacillus subtilis)、或苏云金芽孢杆菌(Bacillus thuringiensis)GH61多肽。
在另一个方面,该亲本是似马链球菌(Streptococcus equisimilis)、酿脓链球菌(Streptococcus pyogenes)、乳房链球菌(Streptococcus uberis)、或马链球菌兽瘟亚种(Streptococcus equi subsp.Zooepidemicus)GH61多肽。
在另一个方面,该亲本是不产色链霉菌(Streptomyces achromogenes)、除虫链霉菌(Streptomyces avermitilis)、天蓝链霉菌(Streptomyces coelicolor)、灰色链霉菌(Streptomyces griseus)或浅青紫链霉菌(Streptomyces lividans)GH61多肽。
该亲本可以是一种真菌GH61多肽。例如,该亲本可以是一种酵母GH61多肽,如假丝酵母属(Candida)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母菌属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)、或耶氏酵母属(Yarrowia)GH61多肽;或一种丝状真菌GH61多肽,如枝顶孢霉属(Acremonium)、伞菌属(Agaricus)、链格孢属(Alternaria)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、Botryospaeria、拟蜡菌属(Ceriporiopsis)、毛喙壳属(Chaetomidium)、金孢子菌属(Chrysosporium)、麦角菌属(Claviceps)、旋孢腔菌属(Cochliobolus)、鬼伞属(Coprinopsis)、乳白蚁属(Coptotermes)、棒囊壳属(Corynascus)、隐丛赤壳菌属(Cryphonectria)、隐球菌属(Cryptococcus)、色二孢属(Diplodia)、黑耳属(Exidia)、线黑粉酵母属(Filibasidium)、镰刀菌属(Fusarium)、赤霉属(Gibberella)、全鞭毛虫属(Holomastigotoides)、腐质霉属(Humicola)、耙齿菌属(Irpex)、蘑燕属(Lentinula)、小腔球菌属(Leptospaeria)、梨孢菌属(Magnaporthe)、Melanocarpus、多孔菌属(Meripilus)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、新美鞭菌属(Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、平革菌属(Phanerochaete)、瘤胃壶菌属(Piromyces)、Poitrasia、假黑盘菌属(Pseudoplectania)、Pseudotrichonympha、根毛霉菌属(Rhizomucor)、裂褶菌属(Schizophyllum)、柱顶孢属(Scytalidium)、踝节菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)、木霉属(Trichoderma)、长毛盘菌属(Trichophaea)、轮枝孢属(Verticillium)、小包脚菇属(Volvariella)或炭角菌属(Xylaria)GH61多肽。
在另一个方面,该亲本是卡尔酵母(Saccharomyces carlsbergensis)、酿酒酵母(Saccharomyces cerevisiae)、糖化酵母(Saccharomyces diastaticus)、道格拉氏酵母(Saccharomyces douglasii)、克鲁弗酵母(Saccharomyces kluyveri)、诺地酵母(Saccharomyces norbensis)、或卵形酵母(Saccharomyces oviformis)GH61多肽。
在另一个方面,该亲本是解纤维枝顶孢霉(Acremonium cellulolyticus)、棘孢曲霉(Aspergillus aculeatus)、泡盛曲霉(Aspergillus awamori)、臭曲霉(Aspergillusfoetidus)、烟曲霉(Aspergillus fumigatus)、日本曲霉(Aspergillus japonicus)、迟缓曲霉(Aspergillus lentulus)、构巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillusniger)、米曲霉(Aspergillus oryzae)、土曲霉(Aspergillus terreus)、Chrysosporiuminops、嗜角质金孢子菌(Chrysosporium keratinophilum)、Chrysosporium lucknowense、Chrysosporium merdarium、租金孢子菌(Chrysosporium pannicola)、Chrysosporiumqueenslandicum、热带金孢子菌(Chrysosporium tropicum)、Chrysosporium zonatum、雪白芬尼菌(Fennellia nivea)、拟杆镰孢(Fusarium bactridioides)、谷类镰孢(Fusariumcerealis)、库威镰孢(Fusarium crookwellense)、大刀镰孢(Fusarium culmorum)、禾谷镰孢(Fusarium graminearum)、禾赤镰孢(Fusarium graminum)、异孢镰孢(Fusariumheterosporum)、合欢木镰孢(Fusarium negundi)、尖镰孢(Fusarium oxysporum)、多枝镰孢(Fusarium reticulatum)、粉红镰孢(Fusarium roseum)、接骨木镰孢(Fusariumsambucinum)、肤色镰孢(Fusarium sarcochroum)、拟分枝孢镰孢(Fusariumsporotrichioides)、硫色镰孢(Fusarium sulphureum)、圆镰孢(Fusarium torulosum)、拟丝镰孢(Fusarium trichothecioides)、镶片镰孢(Fusarium venenatum)、灰腐质霉(Humicola grisea)、特异腐质霉(Humicola insolens)、疏棉状腐质霉(Humicolalanuginosa)、白耙齿菌(Irpex lacteus)、米黑毛霉(Mucor miehei)、嗜热毁丝霉(Myceliophthora thermophila)、粗糙链孢菌(Neurospora crassa)、埃默森青霉(Penicillium emersonii)、绳状青霉(Penicillium funiculosum)、嗜松青霉(Penicillium pinophilum)、产紫青霉(Penicillium purpurogenum)、黄孢原毛平革菌(Phanerochaete chrysosporium)、Talaromyces leycettanus、金黄色嗜热子囊菌(Thermoascus aurantiacus)、无色梭孢壳(Thielavia achromatica)、Thielaviaalbomyces、Thielavia albopilosa、澳洲梭孢壳(Thielavia australeinsis)、Thielaviafimeti、小孢梭孢壳(Thielavia microspora)、卵孢梭孢壳(Thielavia ovispora)、Thielavia peruviana、毛梭孢壳(Thielavia setosa)、瘤孢梭孢壳(Thielaviaspededonium)、Thielavia subthermophila、土生梭孢霉(Thielavia terrestris)、哈茨木霉(Trichoderma harzianum)、康宁木霉(Trichoderma koningii)、长枝木霉(Trichodermalongibrachiatum)、里氏木霉(Trichoderma reesei)、或绿色木霉(Trichoderma viride)GH61多肽。
应理解的是,对于以上提到的种,本发明包含完全和不完全阶段(perfect andimperfect states)二者,以及其他分类学的等同物,例如无性型,而无论它们已知的种名。本领域技术人员将容易地识别适当的等同物的身份。
这些种的菌株在许多培养物保藏中心对于公众来说是容易获得的,这些保藏中心如美国典型培养物保藏中心(ATCC)、德意志微生物和细胞培养物保藏中心(DSMZ)、真菌菌种保藏中心(CBS)、以及农业研究机构专利培养物保藏中心北区研究中心(NRRL)。
可以使用以上提到的探针从其他来源,包括从自然界(例如,土壤、堆肥、水,等等)分离的微生物或直接从自然材料(例如,土壤、堆肥、水,等等)获得的DNA样品鉴定和获得该亲本。用于直接从天然生境分离微生物和DNA的技术是本领域内熟知的。然后可以通过类似地筛选另一种微生物的基因组DNA或cDNA文库或混合的DNA样品来获得编码亲本的多核苷酸。一旦用探针检测到编码亲本的多核苷酸,就可以通过使用本领域普通技术人员已知的技术分离或克隆该多核苷酸(参见,例如,萨姆布鲁克(Sambrook)等人,1989,见上文)。
变体的制备
本发明还涉及用于获得具有纤维素分解增强活性的GH61多肽变体的方法,包括:(a)在与SEQ ID NO:30的成熟多肽的位置105、154、188、189、216、以及229相对应的一个或多个(例如若干个)位置处将取代引入亲本GH61多肽,其中该变体具有纤维素分解增强活性;并且任选地(b)回收该变体。在一个方面,该方法进一步包括在与SEQ ID NO:30的成熟多肽的位置111、152、155、以及162相对应的一个或多个(例如若干个)位置处将取代引入该亲本GH61多肽,其中该变体具有纤维素分解增强活性。在另一个方面,该方法进一步或甚至更进一步包括在与SEQ ID NO:30的成熟多肽的位置96、98、200、202、以及204相对应的一个或多个(例如若干个)位置处将取代引入该亲本GH61多肽,其中该变体具有纤维素分解增强活性。
这些变体可以使用本领域已知的任何诱变程序,如定点诱变、合成基因构建、半合成基因构建、随机诱变、改组,等等来制备。
定点诱变是在编码该亲本的多核苷酸中的一个或多个限定位点引入一个或多个(例如若干个)突变的技术。
定点诱变可以在体外通过涉及使用含有所希望突变的寡核苷酸引物的PCR达成。定点诱变还可以在体外通过表达盒诱变来执行,这涉及用限制酶在包含编码该亲本的多核苷酸的质粒中的位点进行裂解,并且随后将含有该突变的寡核苷酸连接在该多核苷酸中。消化该质粒和该寡核苷酸的限制酶通常是相同的,从而允许该质粒和插入物的粘性末端互相连接。参见,例如,谢勒(Scherer)和戴维斯(Davis),1979,美国国家科学院院刊(Proc.Natl.Acad.Sci.USA)76:4949-4955;以及巴顿(Barton)等人,1990,核酸研究(Nucleic Acids Res.)18:7349-4966。
定点诱变还可以在体内通过本领域已知的方法达成。参见,例如,美国专利申请公开号2004/0171154;斯道瑞希(Storici)等人,2001,自然生物技术(Nature Biotechnol.)19:773-776;卡伦(Kren)等人,1998,自然医学(Nat.Med.)4:285-290;以及凯利萨诺(Calissano)和马奇诺(Macino),1996,真菌遗传学简讯(Fungal Genet.Newslett.)43:15-16。
位点饱和诱变在一个或多个(例如,若干个)特定位置处将多肽编码序列系统性地置换为编码全部19个氨基酸的序列(帕里克(Parikh)和松村(Matsumura),2005,分子生物学杂志352:621-628)。
任何定点诱变程序都可以在本发明中使用。有许多可以用于制备变体的可获得的商业试剂盒。
合成基因构建需要体外合成设计成编码目标多肽的多核苷酸分子。基因合成可以利用多种技术来执行,如由田(Tian)等人(2004,自然432:1050-1054)所描述的基于多通道微芯片(multiplex microchip-based)的技术、以及类似技术,其中合成寡核苷酸并且在光可编程的微流芯片上组装。
可以做出单个或多个氨基酸取代、缺失、和/或插入并且使用诱变、重组、和/或改组的已知方法进行测试,随后进行相关筛选程序,如由里德哈尔-奥尔森(Reidhaar-Olson)和萨奥尔(Sauer),1988,科学241:53-57;博维(Bowie)和萨奥尔,1989,美国国家科学院院刊86:2152-2156;WO 95/17413;或WO 95/22625披露的那些。其他可以使用的方法包括易错PCR、噬菌体展示(例如洛曼(Lowman)等人,1991,生物化学30:10832-10837;美国专利号5,223,409、WO 92/06204)以及区域定向诱变(德比什尔(Derbyshire)等人,1986,基因46:145;内尔(Ner)等人,1988,DNA 7:127)。
诱变/改组方法可以与高通量、自动筛选方法组合以检测由宿主细胞表达的克隆、诱变的多肽的活性(内丝(Ness)等人,1999,自然生物技术(Nature Biotechnology)l7:893-896)。编码活性多肽的诱变DNA分子可以从宿主细胞回收并且使用本领域中的标准方法快速测序。这些方法允许快速确定多肽中个别氨基酸残基的重要性。
半合成基因构建通过组合合成基因构建、和/或定点诱变、和/或随机诱变、和/或改组的方面而达成。半合成构建典型的是利用合成的多核苷酸片段与PCR技术的组合的方法。基因的限定区域因而可以从头合成,而其他区域可以使用位点特异性诱变引物扩增,而其他区域可以进行易错PCR或非易错PCR扩增。然后可以将多核苷酸子序列改组。
多核苷酸
本发明还涉及编码本发明的GH61多肽变体的分离的多核苷酸。
核酸构建体
本发明还涉及包含编码本发明的GH61多肽变体的多核苷酸的核酸构建体,该多核苷酸可操作地连接至一个或多个控制序列上,该一个或多个控制序列在合适的宿主细胞中在与该控制序列相容的条件下指导编码序列的表达。
可以用多种方式操纵该多核苷酸,以提供GH61多肽变体的表达。取决于表达载体,在将多核苷酸插入载体之前对其进行操纵可能是希望的或必需的。使用重组DNA方法修饰多核苷酸的技术是本领域中熟知的。
控制序列可以是启动子,其是由用于表达编码本发明的变体的多核苷酸的宿主细胞所识别的多核苷酸。该启动子含有介导GH61多肽变体的表达的转录控制序列。该启动子可以是在宿主细胞中显示转录活性的任何多核苷酸,包括突变的、截短的、以及杂合的启动子,并且可以从编码与宿主细胞同源或异源的胞外或胞内多肽的基因获得。
用于在细菌宿主细胞中指导本发明的核酸构建体转录的合适启动子的实例是从以下获得的启动子:解淀粉芽孢杆菌α-淀粉酶基因(amyQ)、地衣芽孢杆菌α-淀粉酶基因(amyL)、地衣芽孢杆菌青霉素酶基因(penP)、嗜热脂肪芽孢杆菌产麦芽淀粉酶基因(amyM)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、枯草芽孢杆菌xylA和xylB基因、苏云金芽孢杆菌crylllA基因(埃盖斯(Agaisse)和勒尔克吕(Lereclus),1994,分子微生物学(MolecularMicrobiology)13:97-107)、大肠杆菌lac操纵子、大肠杆菌trc启动子(Egon等人,1988,基因(Gene)69:301-315)、天蓝链霉菌琼脂糖酶基因(dagA)、以及原核β-内酰胺酶基因(维拉-科马罗夫(Villa-Kamaroff)等人,1978,美国国家科学院院刊75:3727-3731)、以及tac启动子(德波尔(DeBoer)等人,1983,美国国家科学院院刊80:21-25)。另外的启动子描述于吉尔伯特(Gilbert)等人,1980,科学美国人(Scientific American)242:74-94中的“来自重组细菌的有用蛋白质”(“Useful proteins from recombinant bacteria”)、以及萨姆布鲁克(Sambrook)等人,1989,见上文。串联启动子的实例在WO 99/43835中披露。
用于在丝状真菌宿主细胞中指导本发明的核酸构建体转录的合适启动子的实例是从以下基因获得的启动子:构巢曲霉乙酰胺酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、米曲霉TAKA淀粉酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、尖镰孢胰蛋白酶样蛋白酶(WO 96/00787)、镶片镰孢淀粉葡糖苷酶(WO 00/56900)、镶片镰孢Daria(WO 00/56900)、镶片镰孢Quinn(WO 00/56900)、曼赫根毛霉(Rhizomucor miehei)脂肪酶、曼赫根毛霉天冬氨酸蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶、以及里氏木霉翻译延长因子,以及NA2-tpi启动子(一种修饰的启动子,其来自曲霉属中性α-淀粉酶基因,其中未翻译的前导序列由曲霉属丙糖磷酸异构酶基因的未翻译的前导序列替代;非限制性实例包括修饰的启动子,其来自黑曲霉中性α-淀粉酶的基因,其中未翻译的前导序列由构巢曲霉或米曲霉丙糖磷酸异构酶基因的未翻译的前导序列替代);以及其突变的、截短的、以及杂合的启动子。其他启动子在美国专利号6,011,147中描述。
在酵母宿主中,有用的启动子从以下基因获得:酿酒酵母烯醇酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH1/GAP、ADH2/GAP)、酿酒酵母丙糖磷酸异构酶(TPI)、酿酒酵母金属硫蛋白(CUP1)、以及和酿酒酵母3-磷酸甘油酸激酶。用于酵母宿主细胞的其他有用的启动子由罗马努斯(Romanos)等人,1992,酵母(Yeast)8:423-488描述。
控制序列还可以是转录终止子,其由宿主细胞识别以终止转录。该终止子可操作地连接至编码该GH61多肽变体的多核苷酸的3’-末端。可以使用在宿主细胞中有功能的任何终止子。
细菌宿主细胞的优选终止子从以下基因获得:克劳氏芽孢杆菌碱性蛋白酶(aprH)、地衣芽孢杆菌α-淀粉酶(amyL)、以及大肠杆菌核糖体RNA(rrnB)。
用于丝状真菌宿主细胞的优选终止子从以下基因获得:构巢曲霉乙酰胺酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶、尖镰孢胰蛋白酶样蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶、以及里氏木霉翻译延长因子。
用于酵母宿主细胞的优选终止子从以下基因获得:酿酒酵母烯醇酶、酿酒酵母细胞色素C(CYC1)、以及酿酒酵母甘油醛-3-磷酸脱氢酶。用于酵母宿主细胞的其他有用的终止子由罗马努斯等人,1992,见上文描述。
控制序列还可以是启动子下游和基因的编码序列上游的mRNA稳定子区,其增加该基因的表达。
合适的mRNA稳定子区的实例从以下获得:苏云金芽孢杆菌cryIIIA基因(WO 94/25612)和枯草芽孢杆菌SP82基因(休(Hue)等人,1995,细菌学杂志(Journal ofBacteriology)177:3465-3471)。
控制序列还可以是前导序列,其为对于宿主细胞的翻译来说重要的mRNA非翻译区。该前导序列可操作地连接至编码该GH61多肽变体的多核苷酸的5’末端。可以使用在宿主细胞中有功能的任何前导序列。
用于丝状真菌宿主细胞的优选前导序列从以下基因获得:米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶。
适用于酵母宿主细胞的前导序列从以下基因获得:酿酒酵母烯醇酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α因子、以及酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。
控制序列还可以是聚腺苷酸化序列,其是可操作地连接至GH61多肽变体编码序列的3’末端的序列,并且在转录时,被宿主细胞识别为将聚腺苷残基添加至转录的mRNA上的信号。可以使用在宿主细胞中有功能的任何聚腺苷酸化序列。
用于丝状真菌宿主细胞的优选聚腺苷酸化序列从以下基因获得:构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶、以及尖镰孢胰蛋白酶样蛋白酶。
用于酵母宿主细胞的有用的聚腺苷酸化序列由郭(Guo)和舍曼(Sherman),1995,分子细胞生物学(Mol.Cellular Biol.)15:5983-5990描述。
控制序列还可以是信号肽编码区,其编码连接至GH61多肽变体的N末端的信号肽,并且指导该变体进入细胞分泌途径。多核苷酸的编码序列的5’末端可以固有地含有信号肽编码序列,该信号肽编码序列与编码该变体的编码序列的区段一起天然地连接在翻译阅读框中。可替代地,编码序列5’末端可以含有对于该编码序列是外源的信号肽编码序列。在编码序列不含天然信号肽编码序列时可能需要外源信号肽编码序列。可替代地,外源信号肽编码序列可以简单地替代天然信号肽编码序列,以便增强变体的分泌。然而,可以使用指导表达的变体进入宿主细胞的分泌途径的任何信号肽编码序列。
用于细菌宿主细胞的有效信号肽编码序列是从以下基因获得的信号肽编码序列:芽孢杆菌属NCIB 11837产麦芽糖淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌α-淀粉酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT、nprS、nprM)、以及枯草芽孢杆菌prsA。另外的信号肽由西蒙(Simonen)和帕夫拉(Palva),1993,微生物学综述(Microbiological Reviews)57:109-137描述。
用于丝状真菌宿主细胞的有效信号肽编码序列是从以下基因获得的信号肽编码序列:黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶V、疏棉状腐质霉脂肪酶、以及曼赫根毛霉天冬氨酸蛋白酶。
用于酵母宿主细胞的有用的信号肽是从酿酒酵母α因子和酿酒酵母转化酶的基因获得。其它有用的信号肽编码序列由罗马努斯等人,1992,见上文描述。
控制序列还可以是前肽编码序列,其编码位于GH61多肽变体N末端的前肽。所得多肽称为前酶或前多肽(或在一些情况下称为酶原)。前多肽通常是无活性的,并且能够通过前肽的催化或自催化裂解从前多肽转化为活性多肽。前肽编码序列可以从以下基因获得:枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、嗜热毁丝霉漆酶(WO95/33836)、曼赫根毛霉天冬氨酸蛋白酶、以及酿酒酵母α因子。
在信号肽和前肽序列二者均存在的情况下,前肽序列的位置紧接着GH61多肽变体的N末端,并且信号肽序列的位置紧接着前肽序列的N末端。
还可能希望添加调节序列,其相对于宿主细胞的生长来调节GH61多肽变体的表达。调节序列的实例是使得基因的表达响应于化学或物理刺激(包括调节化合物的存在)而开启或关闭的那些序列。原核系统中的调节序列包括lac、tac、以及trp操纵子系统。在酵母中,可以使用ADH2系统或GAL1系统。在丝状真菌中,可以使用黑曲霉葡糖淀粉酶启动子、米曲霉TAKA α-淀粉酶启动子和米曲霉葡糖淀粉酶启动子、里氏木霉纤维二糖水解酶I启动子、以及里氏木霉纤维二糖水解酶II启动子。调节序列的其他实例是允许基因扩增的那些序列。在真核系统中,这些调节序列包括在氨甲蝶呤的存在下扩增的二氢叶酸还原酶基因、以及以重金属扩增的金属硫蛋白基因。在这些情况下,编码变体的多核苷酸将可操作地连接至该调节序列。
表达载体
本发明还涉及重组表达载体,该重组表达载体包含编码本发明的GH61多肽变体的多核苷酸、启动子、以及转录和翻译终止信号。多种核苷酸和控制序列可以接合在一起,以产生重组表达载体,该重组表达载体可以包括一个或多个方便的限制位点,以允许在这类位点插入或取代编码变体的多核苷酸。可替代地,可以通过在适当的用于表达的载体中插入多核苷酸或包含该多核苷酸的核酸构建体来表达该多核苷酸。在创建表达载体的过程中,将编码序列置于载体中,以使得该编码序列与适当的控制序列可操作地连接用于表达。
重组表达载体可以是任何载体(例如,质粒或病毒),其能够方便地进行重组DNA程序,并且能够引起多核苷酸的表达。载体的选择将典型地取决于载体与该载体待引入其中的宿主细胞的相容性。载体可以是线性或闭合环状质粒。
载体可以是自主复制载体,即,作为染色体外实体存在的载体,其复制独立于染色体复制,例如,质粒、染色体外元件、微染色体、或人工染色体。载体可以含有用于确保自我复制的任何构件。或者,载体可以是一种当被引入宿主细胞中时,整合到基因组中并且与整合了该载体的一个或多个染色体一起复制的载体。此外,可以使用单一载体或质粒或两个或两个以上载体或质粒,其共同含有待引入宿主细胞基因组中的完整DNA,或可以使用转座子。
载体优选含有一个或多个选择性标记,其允许容易地选择转化的、转染的、转导的、或类似细胞。选择性标记是基因,其产物提供杀生物剂或病毒抗性、对重金属的抗性、对营养缺陷型的原养性、等等。
细菌选择性标记的实例是地衣芽孢杆菌或枯草芽孢杆菌dal基因、或赋予抗生素抗性(如氨苄青霉素、氯霉素、卡那霉素、新霉素、壮观霉素、或四环素抗性)的标记。用于酵母宿主细胞的合适标记包括但不限于:ADE2、HIS3、LEU2、LYS2、MET3、TRP1、以及URA3。用于丝状真菌宿主细胞的选择性标记包括但不限于:adeA(磷酸核糖氨基咪唑琥珀羧酰胺合酶)、adeB(磷酸核糖氨基咪唑合酶)、amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(膦丝菌素乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清酸核苷-5’-磷酸脱羧酶)、sC(硫酸腺苷酸转移酶)、以及trpC(邻氨基苯甲酸合酶)、以及其等同物。优选用于曲霉属细胞的是构巢曲霉或米曲霉amdS和pyrG基因以及吸水链霉菌(Streptomyces hygroscopicus)bar基因。优选用于木霉属细胞的是adeA、adeB、amdS、hph、以及pyrG基因。
选择性标记可以是WO 2010/039889中所述的双重选择性标记系统。在一个方面,该双重选择性标记是hph-tk双重选择性标记系统。
载体优选含有其允许载体整合到宿主细胞的基因组中或载体在细胞中独立于基因组自主复制的元件。
为了整合到宿主细胞基因组中,载体可以依赖编码GH61多肽变体的多核苷酸序列或载体的用于通过同源或非同源重组整合到基因组中的任何其他元件。可替代地,载体可以含有另外的用于指导通过同源重组整合到宿主细胞基因组的一条或多条染色体中的一个或多个精确位置的多核苷酸。为了增加在精确位置整合的可能性,整合元件应含有足够数量的核酸,如100至10,000个碱基对、400至10,000个碱基对、以及800至10,000个碱基对,其与相对应的靶序列具有高度序列一致性以提高同源重组的概率。整合元件可以是与宿主细胞基因组中的靶序列同源的任何序列。此外,整合元件可以是非编码或编码多核苷酸。另一方面,可以将载体通过非同源重组整合到宿主细胞的基因组中。
为了自主复制,载体可以进一步包含复制起点,其使载体能够在所谈论的宿主细胞中自主复制。复制起点可以是在细胞中具有功能的介导自主复制的任何质粒复制子。术语“复制起点”或“质粒复制子”意指能够使质粒或载体在体内复制的多核苷酸。
细菌复制起点的实例是允许在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177、以及pACYC184的复制起点,以及允许在芽孢杆菌中复制的质粒pUB110、pE194、pTA1060、以及pAMβ1的复制起点。
用于酵母宿主细胞的复制起点的实例是2微米复制起点,ARS1、ARS4、ARS1和CEN3的组合、以及ARS4和CEN6的组合。
适用于丝状真菌细胞的复制起点的实例是AMA1和ANS1(格姆斯(Gems)等人,1991,基因(Gene)98:61-67;卡伦(Cullen)等人,1987,核酸研究15:9163-9175;WO 00/24883)。AMA1基因的分离以及包含该基因的质粒或载体的构建可以根据在WO 00/24883中披露的方法达成。
可以将一个以上拷贝的本发明的多核苷酸插入宿主细胞中,以增加GH61多肽变体的产生。多核苷酸拷贝数的增加可以通过如下方法获得:将至少一个额外拷贝的序列整合到宿主细胞基因组中、或与多核苷酸一起包括可扩增的选择性标记基因,其中可以通过在适当的选择剂的存在下培养细胞来选择含有选择性标记基因的扩增拷贝、并且由此含有多核苷酸的额外拷贝的细胞。
用于连接上述元件以构建本发明的重组表达载体的程序是本领域技术人员熟知的(参见,例如,萨姆布鲁克等人,1989,见上文)。
宿主细胞
本发明还涉及重组宿主细胞,这些重组宿主细胞包含编码本发明的GH61多肽变体的多核苷酸,其可操作地连接至指导本发明变体的产生的一个或多个控制序列。将包含多核苷酸的构建体或载体引入宿主细胞,以使得该构建体或载体如前所述以染色体整合体形式或以自我复制的染色体外载体形式维持。术语“宿主细胞”涵盖亲本细胞的由于在复制中发生的突变而不同于亲本细胞的任何后代。宿主细胞的选择将在很大程度上取决于编码变体的基因及其来源。
宿主细胞可以是在GH61多肽变体的重组产生中有用的任何细胞,例如,原核细胞或真核细胞。
原核宿主细胞可以是任何革兰氏阳性或革兰氏阴性细菌。革兰氏阳性细菌包括但不限于:芽孢杆菌、梭菌、肠球菌、土芽孢杆菌、乳杆菌、乳球菌、海洋芽孢杆菌、葡萄球菌、链球菌、以及链霉菌。革兰氏阴性细菌包括但不限于:弯曲杆菌、大肠杆、黄杆菌、梭杆菌、螺杆菌、泥杆菌、奈瑟氏菌、假单胞菌、沙门菌、以及脲原体属。
细菌宿主细胞可以是任何芽孢杆菌细胞,包括但不限于:嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌、以及苏云金芽孢杆菌细胞。
细菌宿主细胞还可以是任何链球菌细胞,包括但不限于:似马链球菌、酿脓链球菌、乳房链球菌、以及马链球菌兽瘟亚种细胞。
细菌宿主细胞还可以是任何链霉菌细胞,包括但不限于:不产色链霉菌、除虫链霉菌、天蓝链霉菌、灰色链霉菌、以及浅青紫链霉菌细胞。
可以通过如下方法实现将DNA引入芽孢杆菌细胞中:原生质体转化(参见,例如,常(Chang)和科恩(Cohen),1979,分子和普通遗传学(Mol.Gen.Genet.)168:111-115)、感受态细胞转化(参见,例如,扬(Young)和斯皮宰曾(Spizizen),1961,细菌学杂志(J.Bacteriol.)81:823-829、或Dubnau和达维多夫-阿贝尔森(Davidoff-Abelson),1971,分子生物学杂志56:209-221)、电穿孔(参见,例如,茂川(Shigekawa)和道尔(Dower),1988,生物技术(Biotechniques)6:742-751)、或接合(参见,例如,克勒(Koehler)和索恩(Thorne),1987,细菌学杂志169:5271-5278)。可以通过如下方法实现将DNA引入大肠杆菌细胞中:原生质体转化(参见,例如,哈纳汉(Hanahan),1983,分子生物学杂志166:557-580)、或电穿孔(参见,例如,道尔等人,1988,核酸研究16:6127-6145)。可以通过如下方法实现将DNA引入到链霉菌细胞中:原生质体转化、电穿孔(参见,例如贡(Gong)等人,2004,微生物学报(Folia Microbiol.(Praha))49:399-405)、接合(参见,例如,马佐迪耶(Mazodier)等人,1989,细菌学杂志171:3583-3585)、或转导(参见,例如,布尔克(Burke)等人,2001,美国科学院院刊98:6289-6294)。可以通过如下方法实现将DNA引入到假单胞菌细胞中:电穿孔(参见,例如,蔡(Choi)等人,2006,微生物学方法杂志(J.Microbiol.Methods)64:391-397)、或接合(参见,例如,皮内多(Pinedo)和斯梅茨(Smets),2005,应用与环境微生物学(Appl.Environ.Microbiol.)71:51-57)。可以通过如下方法实现将DNA引入链球菌细胞中:天然感受态(参见,例如,佩里(Perry)和藏满(Kuramitsu),1981,传染与免疫(Infect.Immun.)32:1295-1297)、原生质体转化(参见,例如,卡特(Catt)和约里克(Jollick),1991,微生物(Microbios)68:189-207)、电穿孔(参见,例如,布克莱(Buckley)等人,1999,应用与环境微生物学65:3800-3804)、或接合(参见,例如,克莱怀尔(Clewell),1981,微生物学综述(Microbiol.Rev.)45:409-436)。然而,可以使用用于将DNA引入宿主细胞的本领域已知的任何方法。
宿主细胞还可以是真核细胞,如哺乳动物、昆虫、植物、或真菌细胞。
宿主细胞可以是真菌细胞。如在此所使用的“真菌”包括以下门:子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)、和接合菌门(Zygomycota)、以及卵菌门(Oomycota)和所有有丝分裂孢子真菌(mitosporic fungi)(如由霍克斯沃思(Hawksworth)等人,在安-倍氏菌物辞典(Ainsworth and Bisby’sDictionary of The Fungi),第8版,1995,国际应用生物科学中心(CAB International),英国剑桥大学出版社(University Press,Cambridge,UK)中所定义)。
真菌宿主细胞可以是酵母细胞。如在此所使用的“酵母”包括产子囊酵母(ascosporogenousyeast)(内孢霉目(Endomycetales))、产担子酵母(basidiosporogenousyeast)、以及属于不完全真菌(Fungi Imperfecti)(芽生菌目(Blastomycetes))的酵母。由于酵母的分类在未来可能改变,因此出于本发明的目的,酵母应如酵母的生物学和活性(Biology and Activities of Yeast)(斯金纳(Skinner)、帕斯莫尔(Passmore)、以及达文波特(Davenport)编,应用细菌学学会第9次系列座谈会(Soc.App.Bacteriol.SymposiumSeries No.9),1980)中所述来定义。
酵母宿主细胞可以是假丝酵母属、汉逊酵母属(Hansenula)、克鲁维酵母属、毕赤酵母属、酵母属、裂殖酵母属、或耶氏酵母属细胞,如乳酸克鲁维酵母(Kluyveromyceslactis)、卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母、卵形酵母、或解脂耶氏酵母(Yarrowia lipolytica)细胞。
真菌宿主细胞可以是丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门的亚门(如由霍克斯沃思等人,1995,见上文所定义)的所有丝状形式。丝状真菌通常的特征在于由壳多糖、纤维素、葡聚糖、壳聚糖、甘露聚糖、以及其他复杂多糖构成的菌丝体壁。营养生长是通过菌丝延长,而碳分解代谢是专性需氧的。相反,酵母(如酿酒酵母)的营养生长是通过单细胞菌体的出芽(budding),而碳分解代谢可以是发酵的。
丝状真菌宿主细胞可以是枝顶孢霉属、曲霉属、短梗霉属、烟管霉属(Bjerkandera)、拟腊菌属、金孢子菌属、鬼伞属、革盖菌属(Coriolus)、隐球菌属、Filibasidium、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新美鞭菌属、链孢菌属、拟青霉属、青霉属、平革菌属、射脉菌属(Phlebia)、瘤胃壶菌属、侧耳属(Pleurotus)、裂褶菌属、踝节菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属(Trametes)、或木霉属细胞。
例如,丝状真菌宿主细胞可以是泡盛曲霉、臭曲霉、烟曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、黑刺烟管菌(Bjerkandera adusta)、干拟赌菌(Ceriporiopsisaneirina)、Ceriporiopsis caregiea、浅黄拟蜡孔菌(Ceriporiopsis gilvescens)、Ceriporiopsis pannocinta、Ceriporiopsis rivulosa、Ceriporiopsis subrufa、虫拟蜡菌(Ceriporiopsis subvermispora)、Chrysosporium inops、嗜角质金孢子菌、Chrysosporium lucknowense、Chrysosporium merdarium、租金孢子菌、Chrysosporiumqueenslandicum、热带金孢子菌、Chrysosporium zonatum、灰盖鬼伞(Coprinuscinereus)、毛革盖菌(Coriolus hirsutus)、杆孢状镰孢、谷类镰孢、库威镰孢、大刀镰孢、禾谷镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、特异腐质霉、疏棉状腐质霉、米黑毛霉、嗜热毁丝霉、粗糙链孢菌、产紫青霉、黄孢平革菌(Phanerochaetechrysosporium)、射脉菌(Phlebia radiata)、刺芹侧耳(Pleurotus eryngii)、土生梭孢霉、长域毛栓菌(Trametes villosa)、变色栓菌(Trametes versicolor)、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、或绿色木霉细胞。
可以将真菌细胞通过涉及原生质体形成、原生质体转化、以及细胞壁再生的方法以本身已知的方式转化。用于转化曲霉属和木霉属宿主细胞的合适程序在EP 238023和约尔顿(Yelton)等人,1984,美国国家科学院院刊81:1470-1474、以及克里斯滕森(Christensen)等人,1988,生物/技术(Bio/Technology)6:1419-1422中描述。用于转化镰孢属物种的合适方法由马拉迪尔(Malardier)等人,1989,基因78:147-156、以及WO 96/00787描述。可以使用由如以下文献描述的程序转化酵母:贝克尔(Becker)和瓜伦特(Guarente),在阿贝尔森(Abelson),J.N.和西蒙(Simon),M.I.编,酵母遗传学与分子生物学指南,酶学方法(Guide to Yeast Genetics and Molecular Biology,Methods inEnzymology),第194卷,第182-187页,学术出版社有限公司(Academic Press,Inc.),纽约;伊藤(Ito)等人,1983,细菌学杂志153:163;以及Hinnen等人,1978,美国科学院院刊75:1920。
产生方法
本发明还涉及产生GH61多肽变体的方法,包括:(a)在适合于该变体表达的条件下培养本发明的宿主细胞;并且任选地(b)回收该变体。
使用本领域中已知的方法在适合于产生该GH61多肽变体的营养培养基中培养该宿主细胞。例如,可以通过在合适培养基中并且在允许表达和/或分离该变体的条件下进行摇瓶培养,或在实验室或工业发酵罐中进行小规模或大规模发酵(包括连续、分批、补料分批、或固态发酵)来培养细胞。使用本领域中已知的程序在包含碳源和氮源以及无机盐的合适的营养培养基中进行培养。合适的培养基可从商业供应商获得或可以根据公开的组成(例如,在美国典型培养物保藏中心的目录中)制备。如果变体被分泌到营养培养基中,那么该变体能够从该培养基中直接回收。如果变体不被分泌,那么其可以从细胞裂解物中回收。
可以使用本领域中已知的对于该变体是特异性的方法来检测该GH61多肽变体。这些检测方法包括但不限于:使用特异性抗体、形成酶产物、或酶底物的消失。例如,酶测定(enzyme assay)可以用于测定该变体的活性。参见,例如,在实例5中描述的测定。
GH61多肽变体可以使用本领域中已知的方法回收。例如,变体可以通过常规程序从营养培养基中回收,这些常规程序包括但不限于:收集、离心、过滤、提取、喷雾干燥、蒸发或沉淀。在一个方面,回收了包含本发明的变体的整个发酵液。
GH61多肽变体可以通过本领域中已知的多种程序纯化以获得基本上纯的变体,这些程序包括但不限于:色谱(例如,离子交换、亲和、疏水、色谱聚焦、以及尺寸排阻)、电泳程序(例如,制备型等电聚焦)、差示溶解度(例如,硫酸铵沉淀)、SDS-PAGE、或提取(参见,例如,蛋白质纯化(Protein Purification),詹森(Janson)和赖登(Ryden)编,VCH出版社(VCHPublishers),纽约,1989)。
在一个替代方面,不回收GH61多肽变体,而是使用表达该变体的本发明的宿主细胞作为该变体的来源。
发酵液配制品或细胞组合物
本发明还涉及包含本发明的变体的发酵液配制品或细胞组合物。发酵液产物进一步包含在发酵过程中使用的另外的成分,例如像,细胞(包括含有编码本发明的多肽的基因的宿主细胞,其被用于产生感兴趣的多肽)、细胞碎片、生物质、发酵培养基和/或发酵产物。在一些实施例中,该组合物是含有一种或多种有机酸、杀灭的细胞和/或细胞碎片、以及培养基的细胞杀灭的全液。
如在此使用的术语“发酵液”是指由细胞发酵产生、不经历或仅经历最低限的回收和/或纯化的制备物。举例来说,当使微生物培养物生长至饱和,在限制碳的条件下孵育以允许蛋白质合成(例如由宿主细胞表达酶),并分泌到细胞培养基中时,产生发酵液。该发酵液可以含有在发酵终止时得到的发酵材料的未分级或分级的内含物。一般来说,发酵液是未分级的,并且包含用过的培养基以及例如通过离心去除微生物细胞(例如丝状真菌细胞)之后存在的细胞碎片。在一些实施例中,发酵液含有用过的细胞培养基、胞外酶、以及有活力和/或无活力的微生物细胞。
在一个实施例中,发酵液配制品和细胞组合物包含第一有机酸组分和第二有机酸组分,该第一有机酸组分包含至少一种1-5个碳的有机酸和/或其盐,并且该第二有机酸组分包含至少一种6个或更多个碳的有机酸和/或其盐。在一个特定实施例中,该第一有机酸组分是乙酸、甲酸、丙酸、其盐,或前述两种或两种以上的混合物,并且该第二有机酸组分是苯甲酸、环己烷甲酸、4-甲基戊酸、苯乙酸、其盐,或前述两种或两种以上的混合物。
在一个方面,该组合物含有一种或多种有机酸,并且任选地进一步含有杀灭的细胞和/或细胞碎片。一个实施例中,从细胞杀灭的全液中去除这些杀灭的细胞和/或细胞碎片,以提供不含这些组分的组合物。
这些发酵液配制品或细胞组合物可以进一步包含防腐剂和/或抗微生物(例如抑菌)剂,包括但不限于山梨醇、氯化钠、山梨酸钾、以及本领域中已知的其他。
这些发酵液配制品或细胞组合物可以进一步包含多种酶活性,如选自由以下各项组成的组的一种或多种(例如,若干种)酶:纤维素酶、半纤维素酶、酯酶、苹果菌素、漆酶、木质素分解酶、果胶酶、过氧化物酶、蛋白酶、以及扩张蛋白(swollenin)。这些发酵液配制品或细胞组合物还可以包含选自由以下各项组成的组的一种或多种(例如若干种)酶:水解酶、异构酶、连接酶、裂解酶、氧化还原酶、或转移酶,例如,α-半乳糖苷酶、α-葡糖苷酶、氨肽酶、淀粉酶、β-半乳糖苷酶、β-葡糖苷酶、β-木糖苷酶、碳水化物酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、壳多糖酶、角质酶、环糊精葡萄糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、葡糖淀粉酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变位酶、氧化酶、果胶分解酶、过氧化物酶、植酸酶、多酚氧化酶、蛋白分解酶、核糖核酸酶、转谷氨酰胺酶、或木聚糖酶。
该细胞杀灭的全液或组合物可以含有在发酵终止时得到的发酵材料的未分级的内含物。典型地,该细胞杀灭的全液或组合物含有用过的培养基以及在使微生物细胞(例如丝状真菌细胞)生长至饱和,在限制碳的条件下孵育以允许蛋白质合成(例如纤维素酶和/或一种或多种葡糖苷酶酶类的表达)之后存在的细胞碎片。在一些实施例中,该细胞杀灭的全液或组合物含有用过的细胞培养基、胞外酶、以及杀灭的丝状真菌细胞。在一些实施例中,在细胞杀灭的全液或组合物中存在的微生物细胞可以使用本领域中已知的方法渗透和/或裂解。
如在此所述的全液或细胞组合物典型地为液体,但是可能含有不溶性组分,如杀灭的细胞、细胞碎片、培养基组分和/或一种或多种不溶性酶。在一些实施例中,可以去除不溶性组分,以提供澄清的液体组合物。
本发明的全液配制品和细胞组合物可以通过WO 90/15861或WO 2010/096673中描述的方法来产生。
下文中给出本发明的组合物的优选用途的实例。组合物的剂量以及组合物使用的其他条件可以根据本领域已知的方法来确定。
酶组合物
本发明还涉及包含本发明的变体的组合物。优选地,这些组合物富集了这种变体。术语“富集”表明该组合物的纤维素分解增强活性(例如)增加了以至少1.1的富集因子。
这些组合物可以包含本发明的变体作为主要酶组分,例如单组分组合物。可替代地,这些组合物可以包含多种酶活性,如选自由以下各项组成的组的一种或多种(例如,若干种)酶:纤维素酶、半纤维素酶、酯酶、苹果菌素、漆酶、木质素分解酶、果胶酶、过氧化物酶、蛋白酶、以及扩张蛋白。这些组合物还可以包含选自由以下各项组成的组的一种或多种(例如若干种)酶:水解酶、异构酶、连接酶、裂解酶、氧化还原酶、或转移酶,例如,α-半乳糖苷酶、α-葡糖苷酶、氨肽酶、淀粉酶、β-半乳糖苷酶、β-葡糖苷酶、β-木糖苷酶、碳水化物酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、壳多糖酶、角质酶、环糊精葡萄糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、葡糖淀粉酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变位酶、氧化酶、果胶分解酶、过氧化物酶、植酸酶、多酚氧化酶、蛋白分解酶、核糖核酸酶、转谷氨酰胺酶、或木聚糖酶。这些组合物可以根据本领域中已知的方法制备,并且可以呈液体或干组合物的形式。这些组合物可以根据本领域中已知的方法稳定化。
下文中给出本发明的组合物的优选用途的实例。组合物的剂量以及组合物使用的其他条件可以根据本领域已知的方法来确定。
用途
本发明还针对使用具有纤维素分解增强活性的GH61多肽变体、或其组合物的以下方法。
本发明还涉及用于降解或转化纤维素材料的方法,包括:在本发明的GH61多肽变体的存在下,用酶组合物处理该纤维素材料。在一个方面,这些方法进一步包括回收降解的或转化的纤维素材料。该纤维素材料的降解或转化的可溶性产物可以使用本领域中已知的方法与不溶性纤维素材料分离,例如像离心、过滤、或重力沉降。
本发明还涉及产生发酵产物的方法,包括:(a)在本发明的GH61多肽变体的存在下,用酶组合物糖化纤维素材料;(b)用一种或多种(例如若干种)发酵微生物发酵糖化的纤维素材料,以产生该发酵产物;并且(c)从发酵物中回收该发酵产物。
本发明还涉及发酵纤维素材料的方法,包括:用一种或多种(例如若干种)发酵微生物发酵该纤维素材料,其中该纤维素材料在本发明的GH61多肽变体的存在下用酶组合物糖化。在一个方面,该纤维素材料的发酵产生发酵产物。在另一个方面,这些方法进一步包括从发酵物中回收该发酵产物。
本发明的方法可以用于将纤维素材料糖化成可发酵糖,并且将这些可发酵糖转化成很多有用的发酵产物,例如燃料、饮用乙醇、和/或平台化学品(platform chemical)(例如酸、醇、酮、气体、等等)。从纤维素材料产生所希望的发酵产物典型地涉及预处理、酶水解(糖化)、以及发酵。
根据本发明的纤维素材料的处理可以使用本领域常规的方法达成。此外,本发明的方法可以使用配置成根据发明操作的任何常规生物质加工设备实施。
分别或同时的水解(糖化)和发酵包括但不限于:分别水解和发酵(SHF)、同时糖化和发酵(SSF)、同时糖化和共发酵(SSCF)、混合的水解和发酵(HHF)、分别水解和共发酵(SHCF)、混合的水解和共发酵(HHCF),以及直接微生物转化(DMC),有时还被称为合并的生物加工(CBP)。SHF使用单独的处理步骤以首先将纤维素材料酶水解为可发酵糖,例如,葡萄糖、纤维二糖、以及戊糖单体,然后将这些可发酵糖发酵成乙醇。在SSF中,纤维素材料的酶水解和糖至乙醇的发酵被组合在一个步骤中(《生物乙醇手册:生产和利用》(Handbook onBioethanol:Production and Utilization)(怀曼,C.E.(Wyman,C.E.)编,泰勒-弗朗西斯出版集团(Taylor&Francis),华盛顿特区(Washington,DC),179-212)中,菲利皮迪斯,G.P.(Philippidis,G.P.),1996,纤维素生物转化技术(Cellulose bioconversiontechnology))。SSCF涉及多种糖的共发酵(希恩,J.(Sheehan,J.)和希默尔,M.(Himmel,M.),1999,酶、能量与环境:美国能源部研究和开发生物乙醇的战略性观点(Enzymes,energy and the environment:A strategic perspective on the U.S.Department ofEnergy’s research and development activities for bioethanol),生物技术进展(Biotechnol.Prog.)15:817-827)。HHF在同时糖化和水解步骤之外,还涉及单独的水解步骤,该步骤可以在同一反应器中进行。HHF过程中的步骤可以在不同的温度下执行,即高温酶糖化,随后在发酵菌株能够耐受的较低温度下进行SSF。DMC将全部三个过程(酶产生、水解和发酵)组合在一个或多个(例如若干个)步骤中,其中使用相同生物体来产生用于将纤维素转化成可发酵糖的酶并且将可发酵糖转化成最终产物(林德,L.R.(Lynd,L.R.),韦默,P.J.(Weimer,P.J.),范泽尔,W.H.(van Zyl,W.H.)、以及普利特瑞斯,I.S.(Pretorius,I.S.),2002,微生物纤维素利用:基础与生物技术(Microbial cellulose utilization:Fundamentals and biotechnology),微生物分子生物学综述(Microbiol.Mol.Biol.Reviews)66:506-577)。在此应理解的是,本领域中已知的任何方法,包括预处理、酶水解(糖化)、发酵、或其组合,可以用于实施本发明的方法。
常规设备可以包括补料分批搅拌反应器、分批搅拌反应器、具有超滤的连续流搅拌反应器、和/或连续活塞流柱式反应器(费尔南达.德.卡斯蒂柳斯.柯瑞芝(Fernanda deCastilhos Corazza)、弗拉维奥.法里亚.德.莫赖斯(Flávio Faria de Moraes)、吉塞拉.玛丽亚.扎宁(Gisella Maria Zanin)以及伊沃.雷特泽尔(Ivo Neitzel),2003,用于纤维二糖水解的补料分批反应器的优化控制(Optimal control in fed-batch reactor forthe cellobiose hydrolysis),科技学报(自然科学版)(Acta Scientiarum.Technology)25:33-38;古萨科夫,A.V.(Gusakov,A.V.)和辛涅特西,A.P.(Sinitsyn,A.P.),1985,纤维素的酶水解动力学:1.分批反应器加工的数学模型(Kinetics of the enzymatichydrolysis of cellulose:1.A mathematical model for a batch reactor process),酶与微生物技术(Enz.Microb.Technol.)7:346-352)、研磨反应器(隆,S.K.(Ryu,S.K.)和李,J.M.(Lee,J.M.),1983,通过使用研磨反应器进行的废弃纤维素的生物转化(Bioconversion of waste cellulose by using an attrition bioreactor),生物技术与生物工程(Biotechnol.Bioeng.)25:53-65)、或具有由电磁场引起的强烈搅拌的反应器(古萨科夫,A.V.、辛涅特西,A.P.、谢尔盖,I.Y.(Davydkin,I.Y.)、谢尔盖,V.Y.、普罗塔斯,O.V.(Protas,O.V.),1996,使用具有由电磁场引起的强烈搅拌的新型反应器增强酶纤维素水解(Enhancement of enzymatic cellulose hydrolysis using a novel type ofbioreactor with intensive stirring induced by electromagnetic field),应用生物化学与生物技术(Appl.Biochem.Biotechnol.)56:141-153)。另外的反应器类型包括:流化床、升流层(upflow blanket)、固定化、以及用于水解和/或发酵的挤出机型反应器。
预处理。在本发明的方法的实践中,可以使用本领域已知的任何预处理过程来破坏植物细胞壁的纤维素材料组分(钱德拉(Chandra)等人,2007,底物预处理:木质纤维素的高效酶水解的关键?(Substrate pretreatment:The key to effective enzymatichydrolysis of lignocellulosics?),生物化学工程/生物技术的进展(Adv.Biochem.Engin./Biotechnol.)108:67-93;盖博(Galbe)和小林(Zacchi),2007,用于高效生物乙醇生产的木质纤维素材料的预处理(Pretreatment of lignocellulosicmaterials for efficient bioethanol production),生物化学工程/生物技术的进展108:41-65;亨德里克斯(Hendriks)和季曼(Zeeman),2009,用以增强木质纤维素生物质的消化性的预处理(Pretreatments to enhance the digestibility of lignocellulosicbiomass),生物资源技术(Bioresource Technol.)100:10-18;莫热(Mosier)等人,2005,用于木质纤维素生物质的预处理的有前景技术的特征(Features of promisingtechnologies for pretreatment of lignocellulosic biomass),生物资源技术96:673-686;塔希尔扎德(Taherzadeh)和卡里米(Karimi),2008,预处理木质纤维素废弃物以改善乙醇和生物气体产生:综述(Pretreatment of lignocellulosic wastes to improveethanol and biogas production:A review),分子科学国际杂志(Int.J.of Mol.Sci.)9:1621-1651;杨(Yang)和怀曼,2008,预处理:释放低成本纤维素乙醇的关键(Pretreatment:the key to unlocking low-cost cellulosic ethanol),生物燃料、生物产品与生物精炼(Biofuels Bioproducts and Biorefining-Biofpr.)2:26-40)。
纤维素材料也可以在预处理之前使用本领域中已知的方法进行粒度减小、筛分、预浸泡、润湿、洗涤、和/或调理。
常规预处理包括但不限于:蒸汽预处理(伴随或不伴随爆炸)、稀酸预处理、热水预处理、碱性预处理、石灰预处理、湿氧化、湿爆炸、氨纤维爆炸、有机溶剂预处理、以及生物预处理。另外的预处理包括氨渗滤、超声、电穿孔、微波、超临界CO2、超临界H2O、臭氧、离子性液体、以及γ辐射预处理。
可以在水解和/或发酵之前预处理纤维素材料。预处理优选在水解前执行。可替代地,预处理可以与酶水解同时执行,以释放可发酵糖,如葡萄糖、木糖、和/或纤维二糖。在大多数情况下,预处理步骤本身使一些生物质转化成可发酵糖(甚至在不存在酶的情况下)。
蒸汽预处理。在蒸汽预处理中,加热纤维素材料以破坏植物细胞壁成分,包括木质素、半纤维素、以及纤维素,以使酶可接触纤维素和其他级分,例如,半纤维素。使纤维素材料经过或通过反应容器,其中注入蒸汽以将温度增加至需要的温度和压力,并且在其中保持所希望的反应时间。蒸汽预处理优选在140℃-250℃,例如160℃-200℃、或170℃-190℃下执行,其中最佳温度范围取决于化学催化剂的添加。蒸汽预处理的停留时间优选为1-60分钟,例如1-30分钟、1-20分钟、3-12分钟、或4-10分钟,其中最佳停留时间取决于温度范围和化学催化剂的添加。蒸汽预处理允许相对较高的固体加载量,以使得纤维素材料在预处理过程中通常仅仅变得潮湿。蒸汽预处理经常与预处理后的材料的爆炸放料组合,这被称为蒸汽爆炸,即,迅速闪变至大气压和材料的湍流,以通过破碎增加可及的表面积(达夫(Duff)和默里(Murray),1996,生物资源技术855:1-33;盖博和小林,2002,应用微生物学与生物技术(Appl.Microbiol.Biotechnol.)59:618-628;美国专利申请号20020164730)。在蒸汽预处理过程中,半纤维素乙酰基被裂解,并且得到的酸自催化半纤维素部分水解成单糖和寡糖。仅在有限的程度上去除木质素。
化学预处理:术语“化学处理”是指能促进纤维素、半纤维素、和/或木质素的分离和/或释放的任何化学预处理。这种预处理可以将结晶纤维素转化为无定形纤维素。合适的化学预处理方法的实例包括:(例如)稀酸预处理、石灰预处理、湿氧化、氨纤维/冷冻爆炸(AFEX)、氨渗滤(APR)、离子性液体、以及有机溶剂预处理。
经常在蒸汽预处理之前添加催化剂,如H2SO4或SO2(典型地0.3至5%w/w),其降低时间和温度、增加回收率、并且改善酶水解(巴列斯特罗斯(Ballesteros)等人,2006,应用生物化学与生物技术(Appl.Biochem.Biotechnol.)129-132:496-508;瓦尔加(Varga)等人,2004,应用生物化学与生物技术113-116:509-523;萨斯那(Sassner)等人,2006,酶与微生物技术(Enzyme Microb.Technol.)39:756-762)。在稀酸预处理中,将纤维素材料与稀酸(典型地为H2SO4)和水混合以形成浆料,由蒸汽加热至所希望的温度,并且在停留时间后闪变至大气压。可以用许多反应器设计执行稀酸预处理,例如,活塞流反应器、逆流反应器、或连续逆流收缩床反应器(达夫和默里,1996,见上文,舍尔(Schell)等人,2004,生物资源技术91:179-188,李(Lee)等人,1999,生物化学工程与生物技术的进展65:93-115)。
还可以使用碱性条件下的若干预处理方法。这些碱性预处理包括但不限于:氢氧化钠、石灰、湿氧化、氨渗滤(APR)、以及氨纤维/冷冻爆炸(AFEX)。
用氧化钙或氢氧化钙,在85℃-150℃的温度下执行石灰预处理,并且停留时间从1小时到若干天(怀曼等人,2005,生物资源技术96:1959-1966;莫热等人,2005,生物资源技术96:673-686)。WO 2006/110891、WO 2006/110899、WO 2006/110900、以及WO 2006/110901披露了使用氨的预处理方法。
湿氧化是一种热预处理,典型地在添加氧化剂(如过氧化氧或过压氧)的情况下在180℃-200℃下持续5-15分钟(施密特(Schmidt)和汤姆森(Thomsen),1998,生物资源技术64:139-151;帕罗内(Palonen)等人,2004,应用生物化学与生物技术117:1-17;瓦尔加(Varga)等人,2004,生物技术与生物工程(Biotechnol.Bioeng.)88:567-574;马丁(Martin)等人,2006,化学技术与生物技术杂志(J.Chem.Technol.Biotechnol.)81:1669-1677)。预处理优选以1%-40%干物质,例如2%-30%干物质或5%-20%干物质执行,并且由于添加碱如碳酸钠,初始pH经常增加。
被称为湿爆炸(湿氧化和蒸汽爆炸的组合)的湿氧化预处理方法的修改方案能够处理高达30%的干物质。在湿爆炸中,在预处理过程中,在一定的停留时间之后引入氧化剂。然后通过闪变至大气压而终止预处理(WO2006/032282)。
氨纤维爆炸(AFEX)涉及在如90℃-150℃的中等温度和如17-20bar的高压下,用液体或气态氨将纤维素材料处理5-10分钟,其中干物质含量可以高达60%(格拉帕里(Gollapalli)等人,2002,应用生物化学与生物技术98:23-35;俊达瓦特(Chundawat)等人,2007,生物技术与生物工程(Biotechnol.Bioeng.)96:219-231;阿里扎德(Alizadeh)等人,2005,应用生物化学与生物技术121:1133-1141;泰莫里(Teymouri)等人,2005,生物资源技术96:2014-2018)。在AFEX预处理过程中,纤维素和半纤维素保持相对完整。木质素-糖类复合物被裂解。
有机溶剂预处理通过使用含水乙醇(40%-60%乙醇)在160℃-200℃下提取30-60分钟而将纤维素材料脱木质素(潘(Pan)等人,2005,生物技术与生物工程(Biotechnol.Bioeng.)90:473-481;潘等人,2006,生物技术与生物工程94:851-861;库拉比(Kurabi)等人,2005,应用生物化学与生物技术121:219-230)。通常添加硫酸作为催化剂。在有机溶剂预处理中,去除了大部分半纤维素和木质素。
合适的预处理方法的其他实例由舍尔(Schell)等人,2003,应用生物化学与生物技术,第105-108卷,第69-85页、和莫热等人,2005,生物资源技术96:673-686、以及美国公开申请2002/0164730描述。
在一个方面,化学预处理优选作为稀酸处理,并且更优选以连续稀酸处理形式执行。酸通常是硫酸,但也可以使用其他酸,如乙酸、柠檬酸、硝酸、磷酸、酒石酸、琥珀酸、氯化氢、或其混合物。弱酸处理优选在1-5,例如1-4或1-2.5的pH范围内进行。在一个方面,酸浓度优选在0.0.1至10wt%酸,例如0.05至5wt%酸或0.1至2wt%酸的范围内。使酸与纤维素材料相接触,并在优选140℃-200℃,例如165℃-190℃范围内的温度下保持1至60分钟范围内的时期。
在另一个方面,预处理在含水浆料中进行。在优选方面,在预处理过程中纤维素材料以优选10-80wt%之间,例如20-70wt%或30-60wt%,如大约40wt%的量存在。预处理的纤维素材料可以不洗涤或者使用本领域已知的任何方法洗涤,例如,用水洗涤。
机械预处理或物理预处理:术语“机械预处理”或“物理预处理”是指促进颗粒大小减少的任何预处理。例如,这种预处理可以涉及各种类型的研磨(grinding)或碾磨(milling)(例如,干磨、湿磨、或振动球磨)。
纤维素材料可以进行物理(机械)和化学预处理二者。机械或物理预处理可以与以下相结合:蒸汽/蒸汽爆炸、水热解(hydrothermolysis)、稀酸或弱酸处理、高温、高压处理、辐射(例如微波福射)、或其组合。在一个方面,高压意指在优选约100至约400psi,例如约150至约250psi范围内的压力。在另一个方面,高温意指在约100℃至约300℃,例如约140℃至约200℃范围内的温度。在一个优选方面,机械或物理预处理在分批过程中使用蒸汽枪水解器系统来执行,其使用如上所定义的高压和高温,该系统例如来自顺智公司(SundsDefibrator AB),瑞典(Sweden)的Sunds水解器(Sunds Hydrolyzer)。这些物理和化学预处理可以根据需要依次执行或同时执行。
因此,在一个优选方面,对纤维素材料进行物理(机械)或化学预处理、或其任何组合,以促进纤维素、半纤维素、和/或木质素的分离和/或释放。
生物预处理:术语“生物预处理”是指促进纤维素、半纤维素、和/或木质素从纤维素材料中分离和/或释放的任何生物预处理。生物预处理技术可以涉及应用溶解木质素的微生物和/或酶(参见,例如,《生物乙醇手册:生产和利用》(怀曼C.E.编,泰勒-弗朗西斯出版集团,华盛顿特区,179-212)中,舒T.-A.(Hsu,T.-A.),1996,生物质的预处理(Pretreatment of biomass);高希(Ghosh)和辛格(Singh),1993,用于纤维素生物质的酶/微生物转化的物理化学与生物处理(Physicochemical and biological treatments forenzymatic/microbial conversion of cellulosic biomass),应用微生物学进展(Adv.Appl.Microbiol.)39:295-333;用于燃料生产的生物质的酶转化(EnzymaticConversion of Biomass for Fuels Production)(希默尔,M.E.、贝克,J.O.、以及奥弗伦R.P.(Overend,R.P.)编,美国化学学会第566次系列座谈会(ACS Symposium Series 566),美国化学学会(American Chemical Society),华盛顿特区,第15章)中,麦克米兰,J.D.(McMillan,J.D.),1994,预处理木质纤维素生物质:综述(Pretreating lignocellulosicbiomass:a review);生物化学工程/生物技术的进展(舍佩尔,T.编,德国海德堡柏林(Berlin Heidelberg,Germany)施普林格(Springer-Verlag),65:207-241)中,贡,C.S.(Gong,C.S.)、卡奥,N.J.(Cao,N.J.)、杜,J.(Du,J.)、以及曹,G.T.(Tsao,G.T.),1999,由可更新资源生产乙醇(Ethanol production from renewable resources);奥尔森(Olsson)和哈恩-哈格达尔(Hahn-Hagerdal),1996,用于乙醇生产的木质纤维素水解物的发酵(Fermentation of lignocellulosic hydrolysates for ethanol production),酶与微生物技术(Enz.Microb.Tech.)18:312-331;以及瓦蓝德(Vallander)和埃里克松(Eriksson),1990,由木质纤维素材料生产乙醇:技术现状(Production of ethanol fromlignocellulosic materials:State of the art),生物化学工程/生物技术的进展42:63-95)。
糖化。在水解步骤(也称为糖化)中,将(例如预处理的)纤维素材料水解,以将纤维素和半纤维素分解成可发酵糖,如葡萄糖、纤维二糖、木糖、木酮糖、阿拉伯糖、甘露糖、半乳糖、和/或可溶性寡糖。水解由酶组合物在本发明的GH61多肽变体的存在下酶促进行。这些组合物的酶可以同时或依次添加。
酶水解优选在易于由本领域技术人员确定的条件下、在合适的含水环境中执行。在一个方面,水解在适于一种或多种酶组分的活性,即对于该一种或多种酶组分最佳的条件下执行。水解可以作为补料分批或连续过程执行,其中将纤维素材料逐渐馈入例如含酶的水解溶液中。
糖化通常在搅拌釜反应器或发酵罐中、在受控的pH、温度、以及混合条件下执行。合适的处理时间、温度和pH条件可以由本领域技术人员容易地确定。例如,糖化可以持续至多200小时,但是典型地执行优选约12至约120小时,例如约16至约72小时或约24至约48小时。温度在优选约25℃至约80℃,例如约30℃至约65℃、约40℃至约60℃、或约50℃至55℃范围内。pH在优选约3至约9,例如约3.5至约7、约4至约6、或约5.0至约5.5范围内。干燥固体含量在优选约5至约50wt%,例如约10至约40wt%或约20至约30wt%范围内。
该酶组合物可以包含适用于降解纤维素材料的任何蛋白。
在一个方面,该酶组合物包含或进一步包含选自由以下各项组成的组的一种或多种(例如,若干种)蛋白质:纤维素酶、具有纤维素分解增强活性的多肽、半纤维素酶、酯酶、苹果菌素、漆酶、木质素分解酶、果胶酶、过氧化物酶、蛋白酶、以及扩张蛋白。在另一个方面,该纤维素酶优选为一种或多种(例如,若干种)选自由以下各项组成的组的酶:内切葡聚糖酶、纤维二糖水解酶、以及β-葡糖苷酶。在另一个方面,该半纤维素酶优选为一种或多种(例如,若干种)选自由以下各项组成的组的酶:乙酰甘露聚糖酯酶、乙酰木聚糖酯酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、香豆酸酯酶、阿魏酸酯酶、半乳糖苷酶、葡糖醛酸糖苷酶、葡糖醛酸酯酶、甘露聚糖酶、甘露糖苷酶、木聚糖酶、以及木糖苷酶。
在另一个方面,该酶组合物包含一种或多种(例如,若干种)纤维素分解酶。在另一个方面,该酶组合物包含或进一步包含一种或多种(例如,若干种)半纤维素分解酶。在另一个方面,该酶组合物包含一种或多种(例如,若干种)纤维素分解酶和一种或多种(例如,若干种)半纤维素分解酶。在另一个方面,该酶组合物包含选自纤维素分解酶和半纤维素分解酶的组的一种或多种(例如,若干种)酶。在另一个方面,该酶组合物包含内切葡聚糖酶。在另一个方面,该酶组合物包含纤维二糖水解酶。在另一个方面,该酶组合物包含β-葡糖苷酶。在另一个方面,该酶组合物包含具有纤维素分解增强活性的多肽。在另一个方面,该酶组合物包含内切葡聚糖酶和具有纤维素分解增强活性的多肽。在另一个方面,该酶组合物包含纤维二糖水解酶和具有纤维素分解增强活性的多肽。在另一个方面,该酶组合物包含β-葡糖苷酶和具有纤维素分解增强活性的多肽。在另一个方面,该酶组合物包含内切葡聚糖酶和纤维二糖水解酶。在另一个方面,该酶组合物包含内切葡聚糖酶和β-葡糖苷酶。在另一个方面,该酶组合物包含纤维二糖水解酶和β-葡糖苷酶。在另一个方面,该酶组合物包含内切葡聚糖酶、纤维二糖水解酶、以及具有纤维素分解增强活性的多肽。在另一个方面,该酶组合物包含内切葡聚糖酶、β-葡糖苷酶、以及具有纤维素分解增强活性的多肽。在另一个方面,该酶组合物包含纤维二糖水解酶、β-葡糖苷酶、以及具有纤维素分解增强活性的多肽。在另一个方面,该酶组合物包含内切葡聚糖酶、纤维二糖水解酶、以及β-葡糖苷酶。在另一个方面,该酶组合物包含内切葡聚糖酶、纤维二糖水解酶、β-葡糖苷酶、以及具有纤维素分解增强活性的多肽。
在另一个方面,该酶组合物包含乙酰甘露聚糖酯酶。在另一个方面,该酶组合物包含乙酰木聚糖酯酶。在另一个方面,该酶组合物包含阿拉伯聚糖酶(例如,α-L-阿拉伯聚糖酶)。在另一个方面,该酶组合物包含阿拉伯呋喃糖苷酶(例如,α-L-阿拉伯呋喃糖苷酶)。在另一个方面,该酶组合物包含香豆酸酯酶。在另一个方面,该酶组合物包含阿魏酸酯酶。在另一个方面,该酶组合物包含半乳糖苷酶(例如,α-半乳糖苷酶和/或β-半乳糖苷酶)。在另一个方面,该酶组合物包含葡糖醛酸糖苷酶(例如,α-D-葡糖醛酸糖苷酶)。在另一个方面,该酶组合物包含葡糖醛酸酯酶。在另一个方面,该酶组合物包含甘露聚糖酶。在另一个方面,该酶组合物包含甘露糖苷酶(例如,β-甘露糖苷酶)。在另一个方面,该酶组合物包含木聚糖酶。在一个优选方面,该木聚糖酶是家族10木聚糖酶。在另一个优选方面,该木聚糖酶是家族11木聚糖酶。在另一个方面,该酶组合物包含木糖苷酶(例如,β-木糖苷酶)。
在另一个方面,该酶组合物包含酯酶。在另一个方面,该酶组合物包含苹果菌素。在另一个方面,该酶组合物包含漆酶。在另一个方面,该酶组合物包含木质素分解酶。在一个优选方面,该木质素分解酶是锰过氧化物酶。在另一个优选方面,该木质素分解酶是木质素过氧化物酶。在另一个优选方面,该木质素分解酶是H2O2产生酶。在另一个方面,该酶组合物包含果胶酶。在另一个方面,该酶组合物包含过氧化物酶。在另一个方面,该酶组合物包含蛋白酶。在另一个方面,该酶组合物包含扩张蛋白。
在本发明的方法中,该一种或多种酶可以在糖化、糖化和发酵、或发酵之前或之中添加。
该酶组合物的一种或多种(例如,若干种)组分可以是野生型蛋白、重组蛋白、或野生型蛋白和重组蛋白的组合。例如,一种或多种(例如,若干种)组分可以是用作宿主细胞以重组表达该酶组合物的一种或多种(例如,若干种)其他组分的细胞的天然蛋白。该酶组合物的一种或多种(例如,若干种)组分可以作为单组分产生,然后将其组合以形成该酶组合物。该酶组合物可以是多组分和单组分蛋白制备物的组合。
在本发明的方法中使用的酶可以处于适于使用的任何形式,例如像,发酵液配制品或细胞组合物、含或不含细胞碎片的细胞裂解液、半纯化或纯化的酶制备物、或宿主细胞,作为酶的来源。酶组合物可以是干粉或颗粒、无粉尘的颗粒、液体、稳定化液体、或稳定化受保护的酶。液体酶制备物可以根据确立的工艺,例如通过添加稳定剂(如糖、糖醇或另外的多元醇、和/或乳酸或另外的有机酸)而加以稳定化。
酶和GH61多肽变体的最佳量取决于若干因素,包括但不限于:纤维素分解酶和/或半纤维素分解酶组分的混合物、纤维素材料、纤维素材料的浓度、纤维素材料的一种或多种预处理、温度、时间、pH、以及发酵生物体(例如,用于同时糖化和发酵的酵母)的纳入。
在一个方面,纤维素分解或半纤维素分解酶对纤维素材料的有效量是约0.5至约50mg,例如,约0.5至约40mg、约0.5至约25mg、约0.75至约20mg、约0.75至约15mg、约0.5至约10mg、或约2.5至约10mg每g纤维素材料。
在另一个方面,GH61多肽变体对纤维素材料的有效量是约0.01至约50.0mg,例如,约0.01至约40mg、约0.01至约30mg、约0.01至约20mg、约0.01至约10mg、约0.01至约5mg、约0.025至约1.5mg、约0.05至约1.25mg、约0.075至约1.25mg、约0.1至约1.25mg、约0.15至约1.25mg、或约0.25至约1.0mg每g纤维素材料。
在另一个方面,GH61多肽变体对纤维素分解或半纤维素分解酶的有效量是约0.005至约1.0g,例如,约0.01至约1.0g、约0.15至约0.75g、约0.15至约0.5g、约0.1至约0.5g、约0.1至约0.25g、或约0.05至约0.2g每g纤维素分解或半纤维素分解酶。
具有纤维素分解酶活性或半纤维素分解酶活性的多肽,以及适用于纤维素材料的降解的其他蛋白质/多肽,例如具有纤维素分解增强活性的GH61多肽(在下文统称为“具有酶活性的多肽”)可以源自或获自任何合适的来源,包括细菌、真菌、酵母、植物、或哺乳动物来源。术语“获得的”在此还意指该酶可以已在宿主生物体中采用在此所述的方法重组产生,其中重组产生的酶对于宿主生物体是天然的或外源的,或具有修饰的氨基酸序列,例如,具有一个或多个(例如,若干个)缺失、插入和/或取代的氨基酸,即重组产生的酶,其为天然氨基酸序列的突变体和/或片段或通过本领域已知的氨基酸改组方法产生的酶。天然酶的含义中涵盖天然变体,而外源酶的含义中涵盖重组(如通过定点诱变或改组)获得的变体。
具有酶活性的多肽可以是细菌多肽。例如,该多肽可以是革兰氏阳性菌多肽,如具有酶活性的芽孢杆菌、链球菌、链霉菌、葡萄球菌、肠球菌、乳杆菌、乳球菌、梭菌、土芽孢杆菌、热解纤维素菌(Caldicellulosiruptor)、热酸菌属(Acidothermus)、Thermobifidia、或海洋芽孢杆菌多肽;或革兰氏阴性菌多肽,如具有酶活性的大肠杆菌、假单胞菌、沙门菌、弯曲杆菌、螺杆菌、黄杆菌、梭杆菌、泥杆菌、奈瑟氏菌、或脲原体属多肽。
在一个方面,该多肽是具有酶活性的嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌、或苏云金芽孢杆菌多肽。
在另一个方面,该多肽是具有酶活性的似马链球菌、酿脓链球菌、乳房链球菌、或马链球菌兽瘟亚种多肽。
在另一个方面,该多肽是具有酶活性的不产色链霉菌、除虫链霉菌、天蓝链霉菌、灰色链霉菌、或浅青紫链霉菌多肽。
具有酶活性的多肽还可以是真菌多肽,并且更优选地是酵母多肽,如具有酶活性的假丝酵母属、克鲁维酵母属、毕赤酵母属、酵母菌属、裂殖酵母属、或耶氏酵母属多肽;或更优选地一种丝状真菌多肽,如具有酶活性的枝顶孢霉属、伞菌属、链格孢属、曲霉属、短梗霉属、Botryospaeria、拟蜡菌属、毛喙壳属、金孢子菌属、麦角菌属、旋孢腔菌属、鬼伞属、乳白蚁属、棒囊壳属、隐丛赤壳菌属、隐球菌属、色二孢属、黑耳属、线黑粉酵母属、镰刀菌属、赤霉属、全鞭毛虫属、腐质霉属、耙齿菌属、蘑燕属、小腔球菌属、梨孢菌属、Melanocarpus、多孔菌属、毛霉属、毁丝霉属、新美鞭菌属、链孢菌属、拟青霉属、青霉属、平革菌属、瘤胃壶菌属、Poitrasia、假黑盘菌属、Pseudotrichonympha、根毛霉菌属、裂褶菌属、柱顶孢属、踝节菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、木霉属、长毛盘菌属、轮枝孢属、小包脚菇属、或炭角菌属多肽。
在一个方面,该多肽是具有酶活性的卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母、或卵形酵母多肽。
在另一个方面,该多肽是具有酶活性的解纤维枝顶孢霉、棘孢曲霉、泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、嗜角质金孢子菌、Chrysosporiumlucknowense、热带金孢子菌、Chrysosporium merdarium、Chrysosporium inops、租金抱子菌、Chrysosporium queenslandicum、Chrysosporium zonatum、杆孢状镰孢、谷类镰抱、库威镰孢、大刀镰孢、禾谷镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、灰腐质霉、特异腐质霉、疏棉状腐质霉、白耙齿菌、米黑毛霉、嗜热毁丝霉、粗糙链孢菌、绳状青霉、产紫青霉、黄孢平革菌、Thielavia achromatica、Thielavia albomyces、Thielaviaalbopilosa、澳洲梭孢壳、Thielavia fimeti、小孢梭孢壳、卵孢梭孢壳、Thielaviaperuviana、瘤孢梭孢壳、毛梭孢壳、Thielavia subthermophila、土生梭孢霉、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、绿色木霉、或褐孢长毛盘菌(Trichophaea saccata)多肽。
还可以使用具有酶活性的多肽的化学修饰或蛋白质工程改造的突变体。
酶组合物的一种或多种(例如,若干种)组分可以是重组组分,即,通过克隆编码该单一组分的DNA序列并且随后用该DNA序列转化细胞并且在宿主中表达产生(参见,例如,WO91/17243和WO 91/17244)。该宿主优选是异源宿主(酶对宿主是外源的),但该宿主在某些条件下也可以是同源宿主(酶对宿主是天然的)。单组分纤维素分解蛋白还可以通过从发酵液中纯化这种蛋白质来制备。
在一个方面,该一种或多种(例如,若干种)纤维素分解酶包含商业纤维素分解酶制剂。适用于本发明的商业纤维素分解酶制剂的实例包括:(例如)CTec(诺维信公司)、CTec2(诺维信公司)、CTec3(诺维信公司)、CELLUCLASTTM(诺维信公司)、NOVOZYMTM 188(诺维信公司)、CELLUZYMETM(诺维信公司)、CEREFLOTM(诺维信公司)、以及ULTRAFLOTM(诺维信公司)、ACCELERASETM(杰能科国际(Genencor Int.))、LAMINEXTM(杰能科国际)、SPEZYMETM CP(杰能科国际)、NL(帝斯曼(DSM));S/L 100(帝斯曼)、ROHAMENTTM 7069W(罗姆股份有限公司(GmbH))、LDI(Dyadic国际有限公司(Dyadic International,Inc.))、LBR(Dyadic国际有限公司)、或150L(Dyadic国际有限公司)。所添加的纤维素酶的有效量为约0.001至约5.0wt%的固体,例如0.025至约4.0wt%的固体、或约0.005至约2.0wt%的固体。
可以在本发明的方法中使用的细菌内切葡聚糖酶的实例包括但不限于:解纤维热酸菌(Acidothermus cellulolyticus)内切葡聚糖酶(WO 91/05039、WO 93/15186、美国专利号5,275,944、WO 96/02551、美国专利号5,536,655、WO 00/70031、WO 05/093050);褐色高温双歧菌(Thermobifida fusca)内切葡聚糖酶III(WO 05/093050);以及褐色高温双歧菌内切葡聚糖酶V(WO 05/093050)。
可以用于本发明的真菌内切葡聚糖酶的实例包括但不限于:里氏木霉内切葡聚糖酶I(彭蒂莱(Penttila)等人,1986,基因45:253-263,里氏木霉Cel7B内切葡聚糖酶I(GENBANKTM登录号M15665)、里氏木霉内切葡聚糖酶II(萨洛黑莫(Saloheimo)等人,1988,基因63:11-22),里氏木霉Cel5A内切葡聚糖酶II(GENBANKTM登录号M19373)、里氏木霉内切葡聚糖酶III(奥卡达(Okada)等人,1988,应用与环境微生物学(Appl.Environ.Microbiol.)64:555-563,GENBANKTM登录号AB003694);里氏木霉内切葡聚糖酶V(萨洛黑莫等人,1994,分子微生物学(Molecular Microbiology 13:219-228,GENBANKTM登录号Z33381);棘孢曲霉内切葡聚糖酶(黄(Ooi)等人,1990,核酸研究18:5884);川地曲霉(spergillus kawachii)内切葡聚糖酶(坂元(Sakamoto)等人,1995,当代遗传学(Current Genetics)27:435-439)、胡萝卜软腐欧文氏菌(Erwinia carotovara)内切葡聚糖酶(萨里拉赫蒂(Saarilahti)等人,1990,基因90:9-14)、尖镰孢内切葡聚糖酶(GENBANKTM登录号L29381)、灰腐质霉thermoidea变种内切葡聚糖酶(GENBANKTM登录号AB003107)、Melanocarpus albomyces内切葡聚糖酶(GENBANKTM登录号MAL515703)、粗糙链孢菌内切葡聚糖酶(GENBANKTM登录号XM_324477)、特异腐质霉内切葡聚糖酶V、嗜热毁丝霉CBS 117.65内切葡聚糖酶、担子菌纲(basidiomycete)CBS 495.95内切葡聚糖酶、担子菌纲CBS 494.95内切葡聚糖酶、土生梭孢霉NRRL 8126 CEL6B内切葡聚糖酶、土生梭孢霉NRRL 8126 CEL6C内切葡聚糖酶、土生梭孢霉NRRL 8126 CEL7C内切葡聚糖酶、土生梭孢霉NRRL 8126 CEL7E内切葡聚糖酶、土生梭孢霉NRRL 8126 CEL7F内切葡聚糖酶、Cladorrhinum foecundissimum ATCC 62373 CEL7A内切葡聚糖酶、以及里氏木霉菌株号VTT-D-80133内切葡聚糖酶(GENBANKTM登录号M15665)。
适用于本发明的纤维二糖水解酶的实例包括但不限于:棘孢曲霉纤维二糖水解酶II(WO 2011/059740)、嗜热毛壳菌纤维二糖水解酶I、嗜热毛壳菌纤维二糖水解酶II、特异腐质霉纤维二糖水解酶I、嗜热毁丝霉纤维二糖水解酶II(WO 2009/042871)、Thielaviahyrcanie纤维二糖水解酶II(WO 2010/141325)、土生梭孢霉纤维二糖水解酶II(CEL6A,WO2006/074435)、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、以及褐孢长毛盘菌纤维二糖水解酶II(WO 2010/057086)。
适用于本发明的β-葡糖苷酶的实例包括但不限于来自以下的β-葡糖苷酶:棘孢曲霉(川口(Kawaguchi)等人,1996,基因173:287-288)、烟曲霉(WO 2005/047499)、黑曲霉(丹(Dan)等人,2000,生物化学杂志(J.Biol.Chem.)275:4973-4980)、米曲霉(WO 2002/095014)、巴西青霉IBT 20888(WO 2007/019442和WO 2010/088387)、土生梭孢霉(WO 2011/035029)、以及褐孢长毛盘菌(WO 2007/019442)。
β-葡糖苷酶可以是融合蛋白。在一个方面,β-葡糖苷酶是米曲霉β-葡糖苷酶变体BG融合蛋白(WO 2008/057637)或米曲霉β-葡糖苷酶融合蛋白(WO 2008/057637)。
其他适用内切葡聚糖酶、纤维二糖水解酶、以及β-葡糖苷酶披露于使用根据以下的分类法的许多糖基水解酶家族中:亨利萨特B.,1991,基于氨基酸序列相似性的糖基水解酶的一种分类法,生物化学杂志280:309-316、以及亨利萨特B.和贝洛赫A.,1996,修正糖基水解酶的基于序列的分类法,生物化学杂志316:695-696。
可以用于本发明的其他纤维素分解酶描述于以下文献中:WO 98/13465、WO 98/015619、WO 98/015633、WO 99/06574、WO 99/10481、WO 99/025847、WO 99/031255、WO2002/101078、WO 2003/027306、WO 2003/052054、WO 2003/052055、WO 2003/052056、WO2003/052057、WO 2003/052118、WO 2004/016760、WO 2004/043980、WO 2004/048592、WO2005/001065、WO 2005/028636、WO 2005/093050、WO 2005/093073、WO 2006/074005、WO2006/117432、WO 2007/071818、WO 2007/071820、WO 2008/008070、WO 2008/008793、美国专利号5,457,046、美国专利号5,648,263、以及美国专利号5,686,593。
在本发明的方法中,具有纤维素分解增强活性的任何GH61多肽都可以被用作酶组合物的组分。
适用于本发明的方法的具有纤维素分解增强活性的GH61多肽的实例包括但不限于:来自土生梭孢霉(WO 2005/074647、WO 2008/148131、以及WO 2011/035027)、金黄色嗜热子囊菌(WO 2005/074656和WO 2010/065830)、里氏木霉(WO 2007/089290)、嗜热毁丝霉(WO 2009/085935、WO 2009/085859、WO 2009/085864、WO 2009/085868)、烟曲霉(WO 2010/138754)的GH61多肽;来自:嗜松青霉(WO 2011/005867)、嗜热子囊菌属物种(WO 2011/039319)、青霉属物种(WO 2011/041397)、甲壳嗜热子囊菌(WO 2011/041504)、棘孢曲霉(WO2012/0307990)、以及嗜热棉毛菌(WO 2012/113340)的GH61多肽。WO 2012/146171披露了来自特异腐质霉的具有纤维素分解增强活性的GH61多肽以及其多核苷酸。
在一个方面,具有纤维素分解增强活性的GH61多肽变体和GH61多肽在根据WO2008/151043的可溶性活化二价金属阳离子(例如锰或铜)的存在下使用。
在另一个方面,具有纤维素分解增强活性的GH61多肽变体和GH61多肽在二氧化合物、二环化合物、杂环化合物、含氮化合物、醌化合物、含硫化合物、或从预处理的纤维素材料(如预处理的玉米秸杆(PCS))获得的液剂的存在下使用。
该二氧化合物可以包括含有两个或两个以上氧原子的任何合适化合物。在一些方面,该二氧化合物含有如在此所述的取代的芳基部分。该二氧化合物可以包含一个或多个(例如,若干个)羟基和/或羟基衍生物,但是还包括缺乏羟基和羟基衍生物的取代的芳基部分。二氧化合物的非限制性实例包括邻苯二酚或儿茶酚;咖啡酸;3,4-二羟基苯甲酸;4-叔丁基-5-甲氧基-1,2-苯二酚;联苯三酚;没食子酸;甲基-3,4,5-三羟基苯甲酸;2,3,4-三羟基二苯甲酮;2,6-二甲氧基苯酚;芥子酸;3,5-二羟基苯甲酸;4-氯-1,2-苯二酚;4-硝基-1,2-苯二酚;鞣酸;没食子酸乙酯;羟乙酸甲酯;二羟基富马酸;2-丁炔-1,4-二醇;克酮酸;1,3-丙二醇;酒石酸;2,4-戊二醇;3-乙氧基-1,2-丙二醇;2,4,4’-三羟基二苯甲酮;顺-2-丁烯-1,4-二醇;3,4-二羟基-3-环丁烯-1,2-二酮;二羟基丙酮;乙酰丙烯醛;甲基-4-羟基苯甲酸;4-羟基苯甲酸;以及甲基-3,5-二甲氧基-4-羟基苯甲酸;或其盐或溶剂合物。
该二环化合物可以包括如在此所述的任何合适的取代稠合环系统。这些化合物可以包含一个或多个(例如,若干个)另外的环,并且除非另外说明,否则不限于具体的环数。在一个方面,该二环化合物是类黄酮。在另一个方面,该二环化合物是任选取代的异类黄酮。在另一个方面,该二环化合物是任选取代的花色离子(flavylium ion),如任选取代的花色素或任选取代的花色素苷、或其衍生物。二环化合物的非限制性实例包括:表儿茶素、槲皮素、杨梅黄酮、黄杉素、山奈酚、桑色素、金合欢素、柚皮素、异鼠李素、芹菜苷配基、花青素、花青苷、kuromanin、花青素鼠李葡糖苷(keracyanin)、或其盐或溶剂合物。
该杂环化合物可以是任何合适的化合物,如包含杂原子的任选取代的芳环或非芳环,如在此所描述。在一个方面,该杂环是包含任选取代的杂环烷基部分或任选取代的杂芳基部分的化合物。在另一个方面,该任选取代的杂环烷基部分或任选取代的杂芳基部分是任选取代的5元杂环烷基或任选取代的5元杂芳基部分。在另一个方面,该任选取代的杂环烷基或任选取代的杂芳基部分是选自以下的任选取代的部分:吡唑基、呋喃基、咪唑基、异噁唑基、噁二唑基、噁唑基、吡咯基、吡啶基、嘧啶基、哒嗪基、噻唑基、三唑基、噻吩基、二氢噻吩并-吡唑基、硫茚基、咔唑基、苯并咪唑基、苯并噻吩基、苯并呋喃基、吲哚基、喹啉基、苯并三唑基、苯并噻唑基、苯并噁唑基、苯并咪唑基、异喹啉基、异吲哚基、吖啶基、苯并异噁唑基、二甲基乙内酰脲、吡嗪基、四氢呋喃基、吡咯啉基、吡咯烷基、吗啉基、吲哚基、二氮杂环庚三烯基、氮杂环庚三烯基、硫杂环庚三烯基、哌啶基、以及氧杂环庚三烯基。在另一个方面,该任选取代的杂环烷基部分或任选取代的杂芳基部分是任选取代的呋喃基。杂环化合物的非限制性实例包括:(1,2-二羟乙基)-3,4-二羟呋喃-2(5H)-酮、4-羟基-5-甲基-3-呋喃酮、5-羟基-2(5H)-呋喃酮、[1,2-二羟乙基]呋喃-2,3,4(5H)-三酮、α-羟基-γ-丁内酯、核糖酸γ-内酯、己酸糖酸γ-内酯(aldohexuronicaldohexuronic acidγ-lactone)、葡糖酸δ-内酯、4-羟基香豆素、二氢苯并呋喃、5-(羟甲基)糠醛、1,2-二呋喃乙醇酮、2(5H)-呋喃酮、5,6-二氢-2H-吡喃-2-酮、以及5,6-二氢-4-羟基-6-甲基-2H-吡喃-2-酮、或其盐或溶剂合物。
该含氮化合物可以是具有一个或多个氮原子的任何合适化合物。在一个方面,该含氮化合物包含胺、亚胺、羟胺、或氧化亚氮部分。含氮化合物的非制定性实例包括:丙酮肟、紫尿酸、吡啶-2-醛肟、2-氨基苯酚、1,2-苯二胺、2,2,6,6-四甲基-1-哌啶氧基、5,6,7,8-四氢生物蝶呤、6,7-二甲基-5,6,7,8-四氢蝶呤、以及马来酰胺酸、或其盐或溶剂合物。
该醌化合物可以是如在此所述的包含醌部分的任何合适的化合物。醌化合物的非限制性实例包括:1,4-苯醌、1,4-萘醌、2-羟基-1,4-萘醌、2,3-二甲氧基-5-甲基-1,4-苯醌或辅酶Q0、2,3,5,6-四甲基-1,4-苯醌或四甲基对苯醌、1,4-二羟基蒽醌、3-羟基-1-甲基-5,6-二氢吲哚二酮或肾上腺色素、4-叔丁基-5-甲氧基-1,2-苯醌、吡咯并喹啉醌、或其盐或溶剂合物。
该含硫化合物可以是包含一个或多个硫原子的任何合适化合物。在一个方面,该含硫化合物包含选自亚硫酰、硫醚、亚磺酰、磺酰、磺酰胺、氨苯磺胺、磺酸、以及磺酸酯的部分。含硫化合物的非限制性实例包括:乙硫醇、2-丙硫醇、2-丙烯-1-硫醇、2-巯基乙磺酸、苯硫醇、苯-1,2-二硫醇、半胱氨酸、甲硫氨酸、谷胱甘肽、胱氨酸、或其盐或溶剂合物。
在一个方面,以上所述的这种化合物对纤维素材料的有效量,作为对纤维素的葡糖基单元的摩尔比为约10-6至约10,例如,约10-6至约7.5、约10-6至约5、约10-6至约2.5、约10-6至约1、约10-5至约1、约10-5至约10-1、约10-4至约10-1、约10-3至约10-1、或约10-3至约10-2。在另一个方面,以上所述的这种化合物的有效量为约0.1μM至约1M,例如,约0.5μM至约0.75M、约0.75μM至约0.5M、约1μM至约0.25M、约1μM至约0.1M、约5μM至约50mM、约10μM至约25mM、约50μM至约25mM、约10μM至约10mM、约5μM至约5mM、或约0.1mM至约1mM。
术语“液剂(liquor)”意指在此所述的条件下,由处理浆料中的木质纤维素和/或半纤维素材料、或其单糖(例如木糖、阿拉伯糖、甘露糖,等等)所产生的溶液相(水相、有机相或其组合中的任一个)、以及其可溶性内含物。用于GH61多肽或变体的纤维素分解增强的液剂可以通过,任选在催化剂(例如酸)的存在下、任选在有机溶剂的存在下、并且任选与该材料的物理破坏组合,来通过施加热和/或压力对木质纤维素或半纤维素材料(或原料)进行,并且然后将溶液与残余固体分离来产生。这类条件确定在由纤维素酶制剂水解纤维素底物的过程中,通过液剂和GH61多肽或变体的组合可获得的纤维素分解增强的程度。该液剂可以使用本领域中的标准方法(如过滤、沉积、或离心)与处理的材料分离。
在一个方面,该液剂对纤维素的有效量为约10-6至约10g每g纤维素,例如,约10-6至约7.5g、约10-6至约5g、约10-6至约2.5g、约10-6至约1g、约10-5至约1g、约10-5至约10-1g、约10-4至约10-1g、约10-3至约10-1g、或约10-3至约10-2g每g纤维素。
在一个方面,该一种或多种(例如,若干种)半纤维素分解酶包含商业半纤维素分解酶制剂。适用于本发明的商业半纤维素分解酶制剂的实例包括:(例如)SHEARZYMETM(诺维信公司)、HTec(诺维信公司)、HTec2(诺维信公司)、HTec3(诺维信公司)、(诺维信公司)、(诺维信公司)、HC(诺维信公司)、Xylanase(杰能科)、XY(杰能科)、XC(杰能科)、TX-200A(AB酶制剂公司(AB Enzymes))、HSP 6000Xylanase(帝斯曼)、DEPOLTM 333P(生物催化剂有限公司(Biocatalysts Limit),英国威尔士(Wales,UK))、DEPOLTM 740L(生物催化剂有限公司,英国威尔士)以及DEPOLTM 762P(生物催化剂有限公司,英国威尔士)。
适用于本发明的方法的木聚糖酶的实例包括但不限于来自以下的木聚糖酶:棘孢曲霉(GeneSeqP:AAR63790;WO 94/21785)、烟曲霉(WO 2006/078256)、嗜松青霉(WO 2011/041405)、青霉属物种(WO 2010/126772)、土生梭孢霉NRRL 8126(WO 2009/079210)、以及褐孢长毛盘菌GH10(WO 2011/057083)。
适用于本发明的方法的β-木糖苷酶的实例包括但不限于来自以下的β-木糖苷酶:粗糙链孢菌(SwissProt登录号Q7SOW4)、里氏木霉(UniProtKB/TrEMBL登录号Q92458)、以及埃默森踝节菌(Talaromyces emersonii)(SwissProt登录号Q8X212)。
适用于本发明的方法的乙酰木聚糖酯酶的实例包括但不限于来自以下的乙酰木聚糖酯酶:棘孢曲霉(WO 2010/108918)、球毛壳菌(Uniprot登录号Q2GWX4)、细毛壳菌(Chaetomium gracile)(GeneSeqP登录号AAB82124)、特异腐质霉DSM 1800(WO 2009/073709)、红褐肉座菌(Hypocrea jecorina)(WO 2005/001036)、嗜热毁丝霉(WO 2010/014880)、粗糙链孢菌(UniProt登录号q7s259)、颖枯壳针孢(Phaeosphaeria nodorum)(Uniprot登录号Q0UHJ1)、以及土生梭孢霉NRRL 8126(WO 2009/042846)。
适用于本发明的方法的阿魏酸酯酶(feruloyl esterase或ferulic acidesterase)的实例包括但不限于来自以下的阿魏酸酯酶:特异腐质霉DSM 1800(WO 2009/076122)、费希新萨托菌(Neosartorya fischeri)(UniProt登录号A1D9T4)、粗糙链孢菌(UniProt登录号Q9HGR3)、橘灰青霉(WO 2009/127729)、以及土生梭孢霉(WO 2010/053838和WO 2010/065448)。
适用于本发明的方法的阿拉伯呋喃糖苷酶的实例包括但不限于来自以下的阿拉伯呋喃糖苷酶:黑曲霉(GeneSeqP登录号AAR94170)、特异腐质霉DSM 1800(WO 2006/114094和WO 2009/073383)、以及巨多孔菌(M.giganteus)(WO 2006/114094)。
适用于本发明的方法的α-葡糖醛酸糖苷酶的实例包括但不限于来自以下的α-葡糖醛酸糖苷酶:棒曲霉(Aspergillus clavatus)(UniProt登录号alccl2)、烟曲霉(SwissProt登录号Q4WW45)、黑曲霉(Uniprot登录号Q96WX9)、土曲霉(Aspergillusterreus)(SwissProt登录号Q0CJP9)、特异腐质霉(WO 2010/014706)、橘灰青霉(WO 2009/068565)、埃默森踝节菌(UniProt登录号Q8X211)、以及里氏木霉(Uniprot登录号Q99024)。
用于本发明的方法的具有酶活性的多肽可以通过在含有合适碳源和氮源以及无机盐的营养培养基上,使用本领域中已知的程序(参见,例如,班尼特,J.W.(Bennett,J.W.)和拉热,L.(LaSure,L.)(编),真菌中的更多基因操纵(More Gene Manipulations inFungi),学术出版社(Academic Press),加利福尼亚州(CA),1991)发酵上述微生物菌株来产生。合适的培养基可从商业供应商获得或可以根据公开的组成(例如,在美国典型培养物保藏中心的目录中)制备。适于生长和酶产生的温度范围和其他条件在本领域中是已知的(参见,例如,贝利,J.E.(Bailey,J.E.)和奥利斯,D.F.(Ollis,D.F.),生物化学工程基础(Biochemical Engineering Fundamentals),麦格劳-希尔图书公司(McGraw-Hill BookCompany),NY,纽约1986)。
发酵可以是导致酶或蛋白质的表达或分离的任何细胞培养方法。因此,发酵可以理解为包括在合适的培养基中并在允许该酶得以表达或分离的条件下执行的摇瓶培养,或在实验室或工业发酵罐中的小或大规模发酵(包括连续、分批、补料分批或固态发酵)。通过上述方法产生的所得的酶可以从发酵培养基中回收并且通过常规程序纯化。
发酵。可以通过能够将糖直接或间接发酵成所希望的发酵产物的一种或多种(例如,若干种)发酵微生物发酵从水解的纤维素材料获得的可发酵糖。“发酵”或“发酵方法”指任何发酵方法或包含发酵步骤的任何方法。发酵方法还包括用于消费品醇工业(例如,啤酒和葡萄酒)、乳品业(例如,发酵乳产品)、皮革业、以及烟草业的发酵方法。发酵条件取决于所希望的发酵产物和发酵生物体,并且可以由本领域的技术人员容易地确定。
在发酵步骤中,作为预处理和酶水解步骤的结果从纤维素材料释放的糖由发酵生物体(如酵母)发酵成产物,例如,乙醇。如上所述,水解(糖化)和发酵可以是分开或同时的。
在实践本发明的发酵步骤中可以使用任何合适的水解的纤维素材料。通常基于所希望的发酵产物(即,要从发酵获得的物质)和采用的方法来选择该材料,如本领域中所熟知的。
术语“发酵培养基”在此可理解为指添加一种或多种发酵微生物之前的培养基,如,由糖化过程产生的培养基,以及同时的糖化和发酵过程(SSF)中使用的培养基。
“发酵微生物”是指适用于所希望的发酵方法以产生发酵产物的任何微生物,包括细菌和真菌生物体。发酵生物体可以是己糖和/或戊糖发酵生物体、或其组合。己糖和戊糖发酵生物体二者均是本领域中所熟知的。合适的发酵微生物能够将糖(如葡萄糖、木糖、木酮糖、阿拉伯糖、麦芽糖、甘露糖、半乳糖、和/或寡糖)直接或间接地发酵(即,转化)成所希望的发酵产物。产生乙醇的细菌和真菌发酵生物体的实例由琳(Lin)等人,2006,应用微生物学与生物技术(Appl.Microbiol.Biotechnol.)69:627-642描述。
能够发酵己糖的发酵微生物的实例包括细菌和真菌生物体,如酵母。优选酵母包括假丝酵母属、克鲁维酵母属、以及酵母菌属菌株,例如Candida sonorensis、马克斯克鲁维酵母、以及酿酒酵母。
能够以天然状态发酵戊糖的发酵生物体的实例包括细菌和真菌生物体,如一些酵母。优选的木糖发酵酵母包括假丝酵母属菌株,优选休哈塔假丝酵母(C.sheatae)或C.sonorensis;和毕赤酵母属菌株,优选树干毕赤酵母(P.stipitis),如树干毕赤酵母CBS5773。优选的戊糖发酵酵母包括管囊酵母属(Pachysolen)菌株,优选为嗜鞋管囊酵母(P.tannophilus)。不能够发酵戊糖(如木糖和阿拉伯糖)的生物体可以通过本领域已知方法来进行遗传修饰而发酵戊糖。
能够有效地将己糖和戊糖发酵成乙醇的细菌的实例包括,例如,凝结芽孢杆菌、丙酮丁醇梭菌(Clostridium acetobutylicum)、热纤维梭菌(Clostridium thermocellum)、Clostridium phytofermentans、土芽孢杆菌属物种、解糖热厌氧杆菌(Thermoanaerobacter saccharolyticum)、以及运动发酵单胞菌(Zymomonas mobilis)(菲利皮迪斯,1996,见上文)。
其他发酵生物体包括以下的菌株:芽孢杆菌属,如凝结芽孢杆菌;假丝酵母属,如C.sonorensis、C.methanosorbosa、迪丹斯假丝酵母(C.diddensiae)、近平滑假丝酵母(Candida parapsilosis)、C.naedodendra、C.blankii、C.entomophilia、芸薹假丝酵母(C.brassicae)、假热带假丝酵母(C.pseudotropicalis)、博伊丁假丝酵母(C.boidinii)、产元假丝酵母(C.utilis)、以及休哈塔假丝酵母;梭菌属,如丙酮丁醇梭菌、热纤维梭菌、以及C.phytofermentans;大肠杆菌,特别是遗传修饰以改善乙醇产率的大肠杆菌菌株;土芽孢杆菌属物种;汉逊酵母属,如异常汉逊酵母(Hansenula anomala);克雷伯氏菌属(Klebsiella),如产酸克雷伯氏菌(K.oxytoca);克鲁维酵母属,如马克斯克鲁维酵母(K.marxianus)、乳酸克鲁维酵母(K.lactis)、K.thermotolerans、以及脆壁克鲁维酵母(K.fragilis);裂殖酵母属,如粟酒裂殖酵母(S.pombe);热厌氧杆菌属(Thermoanaerobacter),如解糖热厌氧杆菌、以及发酵单胞菌属(Zymomonas),如运动发酵单胞菌。
在一个优选方面,酵母是酒香酵母属(Bretannomyces)。在一个更优选方面,酵母是克劳森酒香酵母(Bretannomyces clausenii)。在另一个优选方面,酵母是假丝酵母。在另一个更优选方面,酵母是Candida sonorensis。在另一个更优选方面,酵母是博伊丁假丝酵母。在另一个更优选方面,酵母是Candida blankii。在另一个更优选方面,酵母是芸薹假丝酵母。在另一个更优选方面,酵母是迪丹斯假丝酵母。在另一个更优选方面,酵母是Candida entomophiliia。在另一个更优选方面,酵母是假热带假丝酵母。在另一个更优选方面,酵母是休哈塔假丝酵母。在另一个更优选方面,酵母是产朊假丝酵母。在另一个优选方面,酵母是棒孢酵母属(Clavispora)。在另一个更优选方面,酵母是葡萄牙棒孢酵母(Clavispora lusitaniae)。在另一个更优选方面,酵母是仙人掌棒孢酵母(Clavisporaopuntiae)。在另一个优选方面,酵母是克鲁维酵母。在另一个更优选方面,酵母是脆壁克鲁维酵母。在另一个更优选方面,酵母是马克斯克鲁维酵母。在另一个更优选方面,酵母是Kluyveromyces thermotolerans。在另一个优选方面,酵母是管囊酵母属(Pachysolen)。在另一个更优选方面,酵母是嗜鞣管囊酵母(Pachysolen tannophilus)。在另一个优选方面,酵母是毕赤酵母。在另一个优选方面,酵母是树干毕赤酵母。在另一个优选方面,酵母是酵母属物种。在另一个更优选方面,酵母是酿酒酵母。在另一个更优选方面,酵母是糖化酵母(Saccharomyces distaticus)。在另一个更优选方面,酵母是葡萄汁酵母(Saccharomycesuvarum)。
在一个优选方面,细菌是芽孢杆菌属。在一个更优选方面,细菌是凝结芽孢杆菌。在另一个优选方面,细菌是梭菌属。在另一个更优选方面,细菌是丙酮丁醇梭菌。在另一个更优选方面,细菌是Clostridium phytofermentans。在另一个更优选方面,细菌是热纤维梭菌。在另一个更优选方面,细菌是土芽孢杆菌属物种。在另一个更优选方面,细菌是热厌氧杆菌属。在另一个更优选方面,细菌是解糖热厌氧杆菌。在另一个优选方面,细菌是发酵单胞菌属。在另一个更优选方面,细菌是运动发酵单胞菌。
可商购获得的适用于乙醇生产的酵母包括,例如,BIOFERMTM AFT和XR(NABC-北美生物产品基团(North American Bioproducts Corporation),美国佐治亚州(GA,USA))、ETHANOL REDTM酵母(弗曼迪斯/乐斯福(Fermentis/Lesaffre),美国)、FALITM(菲氏酵母(Fleischmann’s Yeast),美国)、FERMIOLTM(帝斯曼配料部(DSM Specialties))、GERTSTRANDTM(Gert Strand AB,瑞士(Sweden))、以及SUPERSTARTTM和THERMOSACCTM新鲜酵母(乙醇技术(Ethanol Technology),美国威斯康辛州(WI,USA))。
在一个优选方面,发酵微生物已经经过遗传修饰,以提供发酵戊糖的能力,如利用木糖、利用阿拉伯糖、以及共同利用木糖和阿拉伯糖的微生物。
将异源基因克隆到多种发酵微生物中已经构建出能够将己糖和戊糖转化成乙醇(共发酵)的生物体(陈(Chen)和霍(Ho),1993,酿酒酵母中毕赤酵母木糖还原酶基因的克隆和改善表达(Cloning and improving the expression of Pichia stipitis xylosereductase gene in Saccharomyces cerevisiae),应用生物化学与生物技术(Appl.Biochem.Biotechnol.)39-40:135-147;霍等人,1998,遗传工程改造能够有效共表达葡萄糖和木糖的酵母菌属酵母(Genetically engineered Saccharomyces yeastcapable of effectively cofermenting glucose and xylose),应用与环境微生物学64:1852-1859;科特(Kotter)和西拉塞(Ciriacy),1993,酿酒酵母的木糖发酵(Xylosefermentation by Saccharomyces cerevisiae),应用微生物学与生物技术(Appl.Microbiol.Biotechnol.)38:776-783;瓦尔弗里德森(Walfridsson)等人,1995,过表达编码戊糖磷酸途径酶转酮醇酶和转醛醇酶的TKL1和TAL1基因的木糖代谢酿酒酵母菌株(Xylose-metabolizing Saccharomyces cerevisiae strains overexpressing theTKL1and TAL1genes encoding the pentose phosphate pathway enzymestransketolase and transaldolase),应用与环境微生物学61:4184-4190;凯珀(Kuyper)等人,2004,用于有效厌氧木糖发酵的酿酒酵母的最小代谢工程:原理的证实(Minimalmetabolic engineering of Saccharomyces cerevisiae for efficient anaerobicxylose fermentation:a proof of principle),欧洲微生物学会联合会酵母研究(FEMSYeast Research)4:655-664;比尔(Beall)等人,1991,通过重组大肠杆菌从木糖和其他糖产生乙醇的参数研究(Parametric studies of ethanol production from xylose andother sugars by recombinant Escherichia coli),生物技术与生物工程(Biotech.Bioeng.)38:296-303;英格拉姆(Ingram)等人,1998,用于乙醇产生的细菌的代谢工程(Metabolic engineering of bacteria for ethanol production),生物技术与生物工程58:204-214;张(Zhang)等人,1995,产生乙醇的运动发酵单胞菌中戊糖代谢途径的代谢工程(Metabolic engineering of a pentose metabolism pathway inethanologenic Zymomonas mobilis),科学(Science)267:240-243;狄安妲(Deanda)等人,1996,通过代谢途径工程开发发酵阿拉伯糖的运动发酵单胞菌菌株(Development of anarabinose-fermenting Zymomonas mobilis strain by metabolic pathwayengineering),应用与环境微生物学62:4465-4470;WO 2003/062430,木糖异构酶)。
在一个优选方面,遗传修饰的发酵微生物是Candida sonorensis。在另一个优选方面,遗传修饰的发酵微生物是大肠杆菌。在另一个优选方面,遗传修饰的发酵微生物是产酸克雷伯氏菌(Klebsiella oxytoca)。在另一个优选方面,遗传修饰的发酵微生物是马克斯克鲁维酵母。在另一个优选方面,遗传修饰的发酵微生物是酿酒酵母。在另一个优选方面,遗传修饰的发酵微生物是运动发酵单胞菌。
本领域中熟知的是,上述生物体还可以用于产生其他物质,如在此所述。
典型地向降解的纤维素材料或水解物中添加发酵微生物,并且执行发酵持续约8至约96小时,例如约24至约60小时。温度典型地在约26℃至约60℃之间,例如约32℃或50℃,并且在约pH 3至约pH 8,例如pH 4-5、6、或7。
在一个方面,对降解的纤维素材料施用酵母和/或另一种微生物,并执行发酵持续约12至约96小时,如典型地24-60小时。在另一个方面,温度优选在约20℃至约60℃之间,例如约25℃至约50℃、约32℃至约50℃、或约32℃至约50℃,并且pH通常为约pH 3至约pH 7,例如约pH 4至约pH 7。然而,一些发酵生物体(例如细菌)具有更高的最适发酵温度。酵母或另一种微生物的施用量优选为约105-1012,优选约107-1010,特别是约2×108活细胞计数每ml发酵液。关于使用酵母进行发酵的进一步指南可以见于例如“醇教材”(“The AlcoholTextbook”)(编辑K.雅克(K.Jacques)、T.P.里昂(T.P.Lyons)和D.R.凯尔索尔(D.R.Kelsall),诺丁汉大学出版社(Nottingham University Press),联合王国(UnitedKingdom)1999),其通过引用结合在此。
发酵刺激物可以与在此所述的任何方法组合使用,以进一步改进发酵方法,并且尤其是改进发酵微生物的性能,如,速率增加和乙醇产率。“发酵刺激物”是指用于发酵微生物(尤其是酵母)生长的刺激物。用于生长的优选发酵刺激物包括维生素和矿物质。维生素的实例包括多种维生素、生物素、泛酸、烟酸、内消旋肌醇、硫胺素、吡哆醇、对氨基苯甲酸、叶酸、核黄素、以及维生素A、B、C、D、以及E。参见,例如,阿尔芬诺尔(Alfenore)等人,通过在补料分批过程中的微生物馈送策略改善乙醇生产和酿酒酵母的存活(Improving ethanolproduction and viability ofSaccharomyces cerevisiae by a vitamin feedingstrategy during fed-batch process),施普林格(Springer-Verlag)(2002),其通过引用结合在此。矿物质的实例包括可以提供营养物的矿物质和矿物质盐,这些营养物包括P、K、Mg、S、Ca、Fe、Zn、Mn和Cu。
发酵产物:发酵产物可以是由发酵得到的任何物质。发酵产物可以是而不限于:醇(例如,阿拉伯醇、正丁醇、异丁醇、乙醇、甘油、甲醇、乙二醇、1,3-丙二醇(丙二醇)、丁二醇、丙三醇、山梨醇、以及木糖醇);烷烃(例如戊烷、己烷、庚烷、辛烷、壬烷、癸烷、十一烷、以及十二烷);环烷烃(例如,环戊烷、环己烷、环庚烷、以及环辛烷);烯烃(例如,戊烯、己烯、庚烯、以及辛烯);氨基酸(例如,天冬氨酸、谷氨酸、甘氨酸、赖氨酸、丝氨酸、以及苏氨酸);气体(例如,甲烷、氢气(H2)、二氧化碳(CO2)、以及一氧化碳(CO));异戊二烯;酮(例如,丙酮);有机酸(例如,乙酸、醋酮酸、己二酸、抗坏血酸、柠檬酸、2,5-二酮-D-葡糖酸、甲酸、富马酸、葡糖二酸、葡糖酸、葡糖醛酸、戊二酸、3-羟基丙酸、衣康酸、乳酸、苹果酸、丙二酸、草酸、草酰乙酸、丙酸、琥珀酸、以及木糖酸);以及聚酮化合物。发酵产物还可以是作为高价值产品的蛋白质。
在一个优选方面,发酵产物是醇。应理解的是,术语“醇”包括包含一个或多个羟基部分的物质。在一个更优选方面,该醇是正丁醇。在另一个更优选方面,该醇是异丁醇。在另一个更优选方面,该醇是乙醇。在另一个更优选方面,该醇是甲醇。在另一个更优选方面,该醇是阿拉伯糖醇。在另一个更优选方面,该醇是丁二醇。在另一个更优选方面,该醇是乙二醇。在另一个更优选方面,该醇是丙三醇。在另一个更优选方面,该醇是甘油。在另一个更优选方面,该醇是1,3-丙二醇。在另一个更优选方面,该醇是山梨醇。在另一个更优选方面,该醇是木糖醇。参见,例如,生物化学工程/生物技术的进展(舍佩尔,T.编,德国海德堡柏林施普林格,65:207-241)中,贡,C.S.、卡奥,N.J.、杜,J.、以及曹,G.T.,1999,由可更新资源生产乙醇;西尔韦拉,M.M.(Silveira,M.M.)和乔纳斯,R.(Jonas,R.),2002,山梨醇的生物技术生产(The biotechnological production of sorbitol),应用微生物学与生物技术59:400-408;尼加姆,P.(Nigam,P.)和辛格,D.,1995,用于木糖醇-一种糖替代品的发酵产生工艺(Processes for fermentative production of xylitol-a sugar substitute),过程生物化学(Process Biochemistry)30(2):117-124;Ezeji,T.C.、库雷希,N.(Qureshi,N.)和布拉舍克,H.P.(Blaschek,H.P.),2003,通过拜季林斯基羧菌BA101生产丙酮、丁醇和乙醇并且通过气提原位回收(Production of acetone,butanol and ethanol byClostridium beijerinckii BA101and in situ recovery by gas stripping),微生物与生物技术世界杂志(World Journal of Microbiology and Biotechnology)19(6):595-603。
在另一个优选方面,发酵产物是烷烃。该烷烃是未支化或支化的烷烃。在另一个更优选方面,该烷烃是戊烷。在另一个更优选方面,该烷烃是己烷。在另一个更优选方面,该烷烃是庚烷。在另一个更优选方面,该烷烃是辛烷。在另一个更优选方面,该烷烃是壬烷。在另一个更优选方面,该烷烃是癸烷。在另一个更优选方面,该烷烃是十一烷。在另一个更优选方面,该烷烃是十二烷。
在另一个优选方面,发酵产物是环烷烃。在另一个更优选方面,该环烷烃是环戊烷。在另一个更优选方面,该环烷烃是环己烷。在另一个更优选方面,该环烷烃是环庚烷。在另一个更优选方面,该环烷烃是环辛烷。
在另一个优选方面,发酵产物是烯烃。该烯烃是未支化或支化的烯烃。在另一个更优选方面,该烯烃是戊烯。在另一个更优选方面,该烯烃是己烯。在另一个更优选方面,该烯烃是庚烯。在另一个更优选方面,该烯烃是辛烯。
在另一个优选方面,发酵产物是氨基酸。在另一个更优选方面,该氨基酸是天冬氨酸。在另一个更优选方面,该氨基酸是谷氨酸。在另一个更优选方面,该氨基酸是甘氨酸。在另一个更优选方面,该氨基酸是赖氨酸。在另一个更优选方面,该氨基酸是丝氨酸。在另一个更优选方面,该氨基酸是苏氨酸。参见,例如,理查德,A.(Richard,A.)和马加里蒂斯,A.(Margaritis,A.),2004,用于聚谷氨酸生产和其他微生物生物聚合物的分批发酵动力学的经验模型(Empirical modeling of batch fermentation kinetics for poly(glutamicacid)production and other microbial biopolymers),生物技术与生物工程87(4):501-515。
在另一个优选方面,发酵产物是气体。在另一个更优选方面,该气体是甲烷。在另一个更优选方面,该气体是H2。在另一个更优选方面,该气体是CO2。在另一个更优选方面,该气体是CO。参见,例如,片冈,N.(Kataoka,N.)、A.米亚(A.Miya)、以及K.桐山(K.Kiriyama),1997,通过产氢厌氧细菌产生氢气的研究(Studies on hydrogen production bycontinuous culture system of hydrogen-producing anaerobic bacteria),水科学与技术(Water Science and Technology)36(6-7):41-47;以及古那森兰V.N.(GunaseelanV.N.)于生物质与生物能源(Biomass and Bioenergy),第13(1-2)卷,第83-114页,1997,用于甲烷生产的生物质的厌氧消化:综述(Anaerobic digestion of biomass for methaneproduction:A review)。
在另一个优选方面,发酵产物是异戊二烯。
在另一个优选方面,发酵产物是酮。应理解的是,术语“酮”包括包含一个或多个酮部分的物质。在另一个更优选方面,该酮是丙酮。参见,例如,库雷希和布拉舍克,2003,见上文。
在另一个优选方面,发酵产物是有机酸。在另一个更优选方面,该有机酸是乙酸。在另一个更优选方面,该有机酸是醋酮酸。在另一个更优选方面,该有机酸是己二酸。在另一个更优选方面,该有机酸是抗坏血酸。在另一个更优选方面,该有机酸是柠檬酸。在另一个更优选方面,该有机酸是2,5-二酮-D-葡糖酸。在另一个更优选方面,该有机酸是甲酸。在另一个更优选方面,该有机酸是富马酸。在另一个更优选方面,该有机酸是葡糖二酸。在另一个更优选方面,该有机酸是葡糖酸。在另一个更优选方面,该有机酸是葡糖醛酸。在另一个更优选方面,该有机酸是戊二酸。在另一个更优选方面,该有机酸是3-二羟基丙酸。在另一个更优选方面,该有机酸是衣康酸。在另一个更优选方面,该有机酸是乳酸。在另一个更优选方面,该有机酸是苹果酸。在另一个更优选方面,该有机酸是丙二酸。在另一个更优选方面,该有机酸是草酸。在另一个更优选方面,该有机酸是丙酸。在另一个更优选方面,该有机酸是琥珀酸。在另一个更优选方面,该有机酸是木糖酸。参见,例如,陈,R.(Chen,R.)和李,Y.Y.,1997,用于由纤维素生物质生产的乳酸的膜介导的萃取发酵(Membrane-mediatedextractive fermentation for lactic acid production from cellulosic biomass),应用生物化学与生物技术63-65:435-448。
在另一个优选方面,发酵产物是聚酮化合物。
回收。可以使用本领域已知的任何方法,任选地从发酵培养基中回收发酵产物,这些方法包括但不限于:色谱、电泳程序、差示溶解度、蒸馏、或萃取。例如,通过常规蒸馏方法从发酵的纤维素材料中分离和纯化醇。可以获得纯度高达约96体积%的乙醇,其可以用作(例如)燃料乙醇、饮用乙醇,即,饮用中性酒、或工业乙醇。
洗涤剂组合物
本发明还涉及包含本发明的GH61多肽变体和表面活性剂的洗涤剂组合物。本发明的GH61多肽变可以添加至洗涤剂组合物中并且因此变成洗涤剂组合物的组分。
本发明的洗涤剂组合物可以配制为(例如)手洗或机洗洗衣洗涤剂组合物,包括适用于预处理有污迹的织物的洗衣添加剂组合物,和漂洗添加的织物软化剂组合物,或配制为用于一般家用硬表面清洁操作的洗涤剂组合物,或配制用于手洗或机洗餐具洗涤操作。在一个方面,本发明还涉及用于清洁或洗涤硬表面或衣物的方法,该方法包括使该硬表面或该衣物与本发明的洗涤剂组合物相接触。
在一个特定方面,本发明提供包含本发明的GH61多肽变体的洗涤剂添加剂。该洗涤剂添加剂以及该洗涤剂组合物可以包含一种或多种(例如,若干种)选自由以下各项组成的组的酶:淀粉酶、阿拉伯糖酶、角质酶、碳水化合物酶、纤维素酶、半乳聚糖酶、漆酶、脂肪酶、甘露聚糖酶、氧化酶、果胶酶、过氧化物酶、蛋白酶、以及木聚糖酶。
一般来说,一种或多种所选酶的性质应与选定的洗涤剂相容(即,最优pH,与其他酶和非酶成分的相容性,等等),并且该一种或多种酶应以有效量存在。
纤维素酶:合适的纤维素酶包括细菌或真菌来源的那些纤维素酶。包括化学修饰的或蛋白质工程改造的突变体。合适的纤维素酶包括来自芽孢杆菌属、假单胞菌属、腐质霉属、镰孢属、梭孢壳属、枝顶孢霉属的纤维素酶,例如,从在US 4,435,307、US 5,648,263、US5,691,178、US 5,776,757以及WO 89/09259中披露的特异腐质霉、嗜热毁丝霉和尖镰孢产生的真菌纤维素酶。
特别合适的纤维素酶是具有颜色保护益处的碱性或中性纤维素酶。这类纤维素酶的实例为在EP 0 495 257、EP 0 531 372、WO 96/11262、WO 96/29397、WO 98/08940中描述的纤维素酶。其他实例为纤维素酶变体,如在WO 94/07998、EP 0 531 315、US 5,457,046、US 5,686,593、US 5,763,254、WO 95/24471、WO 98/12307以及PCT/DK98/00299中描述的那些。
可商购获得的纤维素酶包括CELLUZYMETM和CAREZYMETM(诺维信公司)、CLAZINASETM和PURADAX HATM(杰能科国际有限公司)、以及KAC-500(B)TM(花王株式会社(KaoCorporation))。
蛋白酶:合适的蛋白酶包括动物、植物或微生物来源的那些蛋白酶。优选为微生物来源。包括化学修饰的或蛋白质工程改造的突变体。该蛋白酶可以是丝氨酸蛋白酶或金属蛋白酶,优选为碱性微生物蛋白酶或胰蛋白酶样蛋白酶。碱性蛋白酶的实例为枯草杆菌蛋白酶,特别是源自芽孢杆菌属的那些,例如枯草杆菌蛋白酶Novo、枯草杆菌蛋白酶Carlsberg、枯草杆菌蛋白酶309、枯草杆菌蛋白酶147以及枯草杆菌蛋白酶168(在WO 89/06279中描述)。胰蛋白酶样蛋白酶的实例为胰蛋白酶(例如,猪或牛来源的),以及在WO 89/06270和WO 94/25583中描述的镰孢属蛋白酶。
适用蛋白酶的实例为在WO 92/19729、WO 98/20115、WO 98/20116、以及WO 98/34946中描述的变体,特别是具有在一个或多个以下位置处的取代的变体:27、36、57、76、87、97、101、104、120、123、167、170、194、206、218、222、224、235、以及274。
优选的可商购获得的蛋白酶包括:ALCALASETM、SAVINASETM、PRIMASETM、DURALASETM、ESPERASETM、以及KANNASETM(诺维信公司),MAXATASETM、MAXACALTM、MAXAPEMTM、PROPERASETM、PURAFECTTM、PURAFECT OXPTM、FN2TM、以及FN3TM(杰能科国际有限公司)。
脂肪酶:合适的脂肪酶包括细菌或真菌来源的那些脂肪酶。包括化学修饰的或蛋白质工程改造的突变体。适用脂肪酶的实例包括来自腐质霉属(与嗜热霉属同义),例如来自如EP 258 068和EP 305 216描述的疏棉状腐质霉(细毛嗜热霉或来自如WO 96/13580中描述的特异腐质霉的脂肪酶;假单胞菌属脂肪酶,例如来自产碱假单胞菌或类产碱假单胞菌(EP 218 272)、洋葱假单胞菌(EP 331 376)、施氏假单胞菌(GB 1,372,034)、萤光假单胞菌、假单胞菌属物种菌株SD 705(WO 95/06720和WO 96/27002)、威斯康星假单胞菌(WO 96/12012);芽孢杆菌属脂肪酶,例如来自枯草芽孢杆菌(达图瓦(Dartois)等人,1993,生物化学与生物物理学报(Biochemica et Biophysica Acta),1131:253-360),嗜热脂肪芽抱杆菌(JP 64/744992)或短小芽孢杆菌(WO 91/16422)。
脂肪酶变体的其他实例如在WO 92/05249、WO 94/01541、EP 407 225、EP 260105、WO 95/35381、WO 96/00292、WO 95/30744、WO 94/25578、WO 95/14783、WO 95/22615、WO 97/04079以及WO 97/07202中描述的那些。
优选的可商购获得的脂肪酶包括:LIPOLASETM和LIPOLASE ULTRATM(诺维信公司)。
淀粉酶:合适的淀粉酶(α和/或β)包括细菌或真菌来源的那些。包括化学修饰的或蛋白质工程改造的突变体。淀粉酶包括例如从芽孢杆菌属获得的α-淀粉酶,例如,在GB 1,296,839中更详细描述的地衣芽孢杆菌的特定菌株。
适用淀粉酶的实例为在WO 94/02597、WO 94/18314、WO 96/23873、以及WO 97/43424中描述的变体,特别是具有在一个或多个以下位置处的取代的变体:15、23、105、106、124、128、133、154、156、181、188、190、197、202、208、209、243、264、304、305、391、408、以及444。
可商购获得的淀粉酶为DURAMYLTM、TERMAMYLTM、FUNGAMYLTM以及BANTM(诺维信公司);RAPIDASETM和PURASTARTM(从杰能科国际有限公司)。
过氧化物酶/氧化酶:合适的过氧化物酶/氧化酶包括植物、细菌或真菌来源的那些酶。包括化学修饰的或蛋白质工程改造的突变体。适用过氧化物酶的实例包括来自鬼伞属,例如来自灰盖鬼伞的过氧化物酶,以及其变体,如在WO 93/24618、WO 95/10602、以及WO98/15257中描述的那些。
可商购获得的过氧化物酶包括GUARDZYMETM(诺维信公司)。
一种或多种洗涤剂酶可以通过添加含有一种或多种(例如,若干种)酶的单独的添加剂,或通过添加包含所有这些酶的组合的添加剂而包括于洗涤剂组合物中。本发明的洗涤剂添加剂,即单独的添加剂或组合的添加剂,可以例如配制为颗粒、液体、浆料,等等。优选的洗涤剂添加剂配制品为颗粒,尤其是无尘颗粒;液体,尤其是稳定化的液体;或浆料。
无尘颗粒可以例如在US 4,106,991和4,661,452中所披露而产生,并且可以任选地通过本领域已知的方法进行涂覆。蜡状涂覆材料的实例为具有1000至20000的平均摩尔重量的聚环氧乙烷产物(聚乙二醇,PEG);具有16至50个环氧乙烷单元的乙氧化壬基苯酚;乙氧化脂肪醇,其中该醇含有12至20个碳原子,并且其中有15至80个环氧乙烷单元;脂肪醇;脂肪酸;以及脂肪酸的甘油单酯、甘油二酯和甘油三酯。适用于通过流化床技术应用的成膜涂覆材料的实例在GB 1483591中给出。液体酶制剂可以例如通过根据已确立的方法添加多元醇(如丙二醇)、糖或糖醇、乳酸或硼酸而稳定化。受保护的酶可以根据EP 238,216中披露的方法制备。
本发明的洗涤剂组合物可以呈任何便利的形式,例如条、片、粉末、颗粒、糊、或液体。液体洗涤剂可以是水性的,典型地含有至多70%的水和0-30%的有机溶剂,或可以是非水性的。
该洗涤剂组合物包含一种或多种(例如,若干种)表面活性剂,其可以是非离子型(包括半极性型)和/或阴离子型和/或阳离子型和/或两性离子型。这些表面活性剂典型地以按重量计0.1%至60%的水平存在。
当其中包括阴离子型表面活性剂时,该洗涤剂将通常含有约1%至约40%的阴离子型表面活性剂,如线性烷基苯磺酸盐、α-烯基磺酸盐、烷基硫酸盐(脂肪醇硫酸盐)、醇乙氧基硫酸盐、仲烷磺酸盐、α-磺基脂肪酸甲基酯、烷基或烯基琥珀酸、或皂类。
当其中包括非离子型表面活性剂时,该洗涤剂将通常含有约0.2%至约40%的非离子型表面活性剂,如醇乙氧化物、壬基苯酚乙氧化物、烷基聚糖苷、烷基二甲基胺氧化物、乙氧化脂肪酸单乙醇胺、脂肪酸单乙醇胺、多羟基烷基脂肪酸酰胺、或葡糖胺的N-酰基N-烷基衍生物(“葡糖酰胺”)。
该洗涤剂可以含有0-65%洗涤剂助洗剂或络合剂,如沸石、二磷酸盐、三磷酸盐、膦酸盐、碳酸盐、柠檬酸盐、氨三乙酸、乙二胺四乙酸、二乙二胺三氨基五乙酸、烷基或烯基琥珀酸、可溶性硅酸盐、或层状硅酸盐(例如,来自赫斯特(Hoechst)的SKS-6)。
该洗涤剂可以包含一种或多种(例如,若干种)聚合物。实例为羧甲基纤维素、聚乙烯基吡咯烷酮、聚乙二醇、聚乙烯醇、聚乙烯基吡啶-N-氧化物、聚乙烯基咪唑、聚羧酸酯(如聚丙烯酸酯)、马来酸/丙烯酸共聚物、以及甲基丙烯酸月桂酯/丙烯酸共聚物。
洗涤剂可以含有漂白系统,其可以包含H2O2源,如过硼酸或过碳酸,其可以与形成过酸的漂白活化剂(如四乙酰基乙二胺或壬酰氧基苯磺酸盐)组合。可替代地,该漂白系统可以包含例如酰胺、酰亚胺、或砜类型的过氧酸。
可以使用常规稳定剂使本发明的洗涤剂组合物中的一种或多种酶稳定化,这些稳定剂例如为多元醇(如丙二醇或甘油)、糖或糖醇、乳酸、硼酸、或硼酸衍生物(例如,芳族硼酸酯、或苯基硼酸衍生物(如4-甲酰苯基硼酸)),并且该组合物可以如(例如)WO 92/19709和WO 92/19708中所述进行配制。
该洗涤剂还可以含有其他常规洗涤剂成分,例如像织物调理剂,包括黏土、泡沫促进剂、抑泡剂、抗腐蚀剂、悬污剂、抗污物再沉积剂、染料、杀细菌剂、光学增亮剂、助水溶剂、晦暗抑制剂、或香料。
在洗涤剂组合物中,任何酶的添加量可以对应于0.01-100mg酶蛋白每升洗液,优选0.05-5mg酶蛋白每升洗液,尤其是0.1-1mg酶蛋白每升洗液。
在洗涤剂组合物中,具有纤维素分解增强活性的本发明的GH61多肽变体的添加量可以对应于0.001-100mg蛋白质、优选0.005-50mg蛋白质、更优选0.01-25mg蛋白质、甚至更优选0.05-10mg蛋白质、最优选0.05-5mg蛋白质,并且甚至最优选0.01-1mg蛋白质每升洗液。
具有纤维素分解增强活性的本发明的GH61多肽变体还可以结合到WO97/07202(通过引用由此结合)中披露的洗涤剂配制品中。
植物
本发明还涉及植物,例如,转基因植物、植物部分、或植物细胞,其包含本发明的多核苷酸,以便以可回收的量表达和产生GH61多肽变体。该变体可以从植物或植物部分回收。可替代地,可以按原样将含有该变体的植物或植物部分用于改善食品或饲料的质量,例如,改善营养价值、可口性、以及流变性质,或用以破坏抗营养因子。
转基因植物可以是双子叶的(双子叶植物)或单子叶的(单子叶植物)。单子叶植物的实例是草,如草地早熟禾(meadow grass)(蓝草(blue grass),早熟禾属(Poa));饲用牧草(forage grass),如羊茅属(Festuca)、黑麦草属(Lolium);温带草(temperate grass),如翦股颖属(Agrostis);以及谷类,例如,小麦、燕麦、黑麦、大麦、稻、高粱、以及玉蜀黍。
双子叶植物的实例是烟草、豆类(如羽扇豆(lupins)、马铃薯、糖甜菜(sugarbeet)、豌豆、豆(bean)和大豆(soybean))、以及十字花科植物(十字花科(familyBrassicaceae))(如花椰菜、油菜籽、以及紧密相关的模型生物体拟南芥)。
植物部分的实例是茎、愈伤组织、叶、根、果实、种子、以及块茎、以及包含这些部分的独立组织,例如,表皮、叶肉、薄壁组织(parenchyme)、维管组织、分生组织。特定植物细胞代谢区,如叶绿体、质外体(apoplast)、线粒体、液泡、过氧化物酶体以及细胞质也被认为是植物部分。此外,任何植物细胞,无论什么组织来源,都被认为是植物部分。同样地,植物部分,如分离以促进本发明的利用的特定组织和细胞也被认为是植物部分,例如胚、胚乳、糊粉和种皮。
同样包含于本发明范围内的是这些植物、植物部分和植物细胞的后代。
表达变体的转基因植物或植物细胞可以根据本领域已知的方法构建。简而言之,通过如下方法构建该植物或植物细胞:将编码变体的一个或多个表达构建体并入到植物宿主基因组或叶绿体基因组中,并且使所得的修饰植物或植物细胞繁殖为转基因植物或植物细胞。
表达构建体宜为包含编码变体的多核苷酸的核酸构建体,该多核苷酸与在选择的植物或植物部分中表达该多核苷酸所需的适当的调节序列可操作地连接。此外,表达构建体可以包含对于鉴定植物细胞有用的选择性标记,在这些宿主细胞中整合了表达构建体和将该构建体引入所讨论的植物中所必需的DNA序列(后者取决于使用的DNA引入方法)。
调节序列(如启动子和终止子序列以及任选地信号或转运序列)的选择(例如)基于期望何时、何处以及如何表达变体而确定。例如,编码变体的基因的表达可以是组成型的或诱导型的,或可以是发育、阶段或组织特异性的,并且基因产物可以靶向特定的组织或植物部分(如种子或叶)。调节序列由例如塔格(Tague)等人,1988,植物生理学(PlantPhysiology)86:506描述。
对于组成型表达,可以使用35S-CaMV、玉米泛素1、或稻肌动蛋白1启动子(弗兰克(Franck)等人,1980,细胞(Cell)21:285-294;克里斯滕森(Christensen)等人,1992,植物分子生物学(Plant Mol.Biol.)18:675-689;张(Zhang)等人,1991,植物细胞(Plant Cell)3:1155-1165)。器官特异性启动子可以是例如:来自贮藏库组织(storage sink tissue)(如种子、马铃薯块茎、以及果实)(爱德华兹(Edwards)和科鲁兹(Coruzzi),1990,遗传学年度综述(Ann.Rev.Genet.)24:275-303)、或代谢库组织(metabolic sink tissue)(如分生组织)的启动子(伊托(Ito)等人,1994,植物分子生物学24:863-878);种子特异性启动子,如来自稻的谷蛋白、醇溶蛋白(prolamin)、球蛋白(globulin)、或白蛋白启动子(吴(Wu)等人,1998,植物细胞生理学(Plant Cell Physiol.)39:885-889);来自豆球蛋白B4和来自蚕豆的未知种子蛋白基因的蚕豆启动子(康拉德(Conrad)等人,1998,植物生理学杂志(J.Plant Physiol.)152:708-711);来自种子油体蛋白的启动子(陈(Chen)等人,1998,植物细胞生理学39:935-941);来自欧洲油菜(Brassica napus)的贮藏蛋白napA启动子、或本技术领域已知的任何其他种子特异性启动子,例如,如在WO 91/14772中所描述。此外,启动子可以是叶特异性启动子,如来自稻或番茄的rbcs启动子(京冢(Kyozuka)等人,1993,植物生理学(Plant Physiol.)102:991-1000)、小球藻病毒腺嘌呤甲基转移酶基因启动子(麦卓(Mitra)和希金斯(Higgins),1994,植物分子生物学26:85-93)、来自稻的aldP基因启动子(加贺屋(Kagaya)等人,1995,分子遗传学与基因组学(Mol.Gen.Genet.)248:668-674)、或伤口诱导型启动子(如马铃薯pin2启动子)(许(Xu)等人,1993,植物分子生物学22:573-588)。同样地,该启动子可以通过非生物处理来诱导,如温度、干旱、或盐度变化,或通过外源施加的激活该启动子的物质来诱导,例如乙醇、雌激素、植物激素(如乙烯、脱落酸和赤霉酸)、以及重金属。
启动子增强子元件也可以用于实现变体在植物中的较高表达。例如,启动子增强子元件可以是置于启动子与编码变体的多核苷酸之间的内含子。例如,许等人,1993,见上文,披露了使用稻肌动蛋白1基因的第一内含子以增强表达。
选择性标记基因和表达构建体的任何其他部分可以选自本领域内可用的那些。
核酸构建体是根据本领域已知的常规技术并入到植物基因组中,这些常规技术包括:农杆菌介导的转化、病毒介导的转化、显微注射、粒子轰击、生物射弹转化、以及电穿孔(盖瑟(Gasser)等人,1990,科学244:1293;波特里库斯(Potrykus),1990,生物/技术(Bio/Technology)8:535;岛本(Shimamoto)等人,1989,自然(Nature)338:274)。
目前根癌农杆菌介导的基因转移是一种用于产生转基因双子叶植物(关于综述,请参见霍伊卡(Hooykas)和施尔伯鲁特(Schilperoort),1992,植物分子生物学19:15-38)并且用于转化单子叶植物的方法,虽然对于这些植物常常使用其他的转化方法。用于产生转基因单子叶植物的方法是粒子(用转化DNA涂覆的微观的金或钨粒子)轰击胚愈伤组织或发育中的胚(克里斯托(Christou),1992,植物杂志(Plant J.)2:275-281;岛本,1994,生物技术当前述评(Curr.Opin.Biotechnol.)5:158-162;瓦西尔(Vasil)等人,1992,生物/技术10:667-674)。用于转化单子叶植物的替代方法是基于原生质体转化,如由Omirulleh等人,1993,植物分子生物学21:415-428所描述。另外的转化方法包括在美国专利号6,395,966和7,151,204中描述的那些(这两个专利均通过引用以其全文结合在此)。
转化之后,根据本领域熟知的方法选择具有结合的表达构建体的转化体并且再生成为完整植物。通常设计转化程序用于通过如下方法在再生期间或在后续世代中选择性消除选择基因:例如,使用带有两个独立的T-DNA构建体的共转化或利用特异性重组酶位点特异性地切除选择基因。
除用本发明的构建体直接转化具体植物基因型之外,还可以通过将具有构建体的植物与缺乏该构建体的第二植物杂交来制备转基因植物。例如,可以将编码变体的构建体通过杂交引入具体植物品种,而根本无需直接转化那个给定品种的植物。因此,本发明不仅涵盖从根据本发明转化的细胞直接再生的植物,还包括这类植物的后代。如在此所使用,后代可以指根据本发明制备的亲本植物的任何世代的后裔。这种后代可以包括根据本发明制备的DNA构建体。杂交导致转基因通过将起始种系与供体植物种系交叉授粉而引入植物种系。这类步骤的非限制性实例在美国专利号7,151,204中描述。
植物可以通过回交转化方法生成。例如,植物包括被称为回交转化的基因型、种系、近交体、或杂交体的植物。
可以使用遗传标记以协助本发明的一种或多种转基因从一个遗传背景渗入到另一个。标记协助的选择提供了相对于常规育种的优势,在于其可以用于避免由表型变异导致的错误。另外,遗传标记可以在具体杂交的个别后代中提供有关良种种质相对程度的数据。例如,当具有所希望性状并且另外具有非农艺学所希望的遗传背景的植物与良种亲本杂交时,可以使用遗传标记来选择不仅具有感兴趣的性状,还具有相对较大比例所希望种质的后代。以此方式,使一种或多种性状渗入特定遗传背景所需的世代数得以最小化。
本发明还涉及产生本发明的变体的方法,包括:(a)在有助于产生该变体的条件下培养包含编码该变体的多核苷酸的转基因植物或植物细胞;并且(b)回收该变体。
通过以下实例进一步描述本发明,但不应将其理解为限制本发明的范围。
实例
菌株
使用米曲霉菌株PFJO218(amy-、alp-、Npl-、CPA-、KA-、pyrG-、ku70-;美国专利申请20100221783)作为GH61多肽变体的表达宿主。
还使用米曲霉菌株COLs1300作为GH61多肽变体的表达宿主。通过缺失启动子以及亚硝酸盐还原酶(niiA)基因和硝酸盐还原酶(niaD)基因二者的5'部分而由米曲霉PFJ0220(EP 2 147 107 B1)产生黑曲霉COLs1300(amyA、amyB、amyC、alpA、nprA、kusA、niaD、niiA、amdS+)。
培养基和试剂
AMG痕量金属溶液由以下组成:14.3g的ZnSO4·7H2O、2.5g的CuSO4·5H2O、0.5g的NiCl2·6H2O、13.8g的FeSO4·7H2O、8.5g的MnSO4·H2O、3g的柠檬酸、以及去离子水补足至1升。
COLs1300培养基由100ml的蔗糖培养基和1ml的1M尿素组成。
COLs1300原生质体化溶液由以下组成:80mg的(诺维信公司,丹麦鲍斯韦(Bagsvaerd,Denmark))、0.5mg/ml的壳多糖酶(西格玛化学有限公司,美国密苏里州圣路易斯)、10ml的1.2M MgSO4、以及100μl的1M NaH2PO4(pH 5.8)。
COVE-N-Gly平板由以下组成:50ml的COVE盐溶液、218g的山梨醇、10g的甘油、2.02g的KNO3、25g的诺布尔琼脂、以及去离子水补足至1升。
具有10mM尿苷的COVE-N-Gly平板由以下组成:50ml的COVE盐溶液、218g的山梨醇、10g的甘油、2.02g的KNO3、25g的诺布尔琼脂、以及去离子水补足至1升;然后以10mM的浓度向各个平板中添加尿苷。
COVE盐溶液由以下组成:26g的KCl、26g的MgSO4·7H2O、76g的KH2PO4、50ml的COVE痕量元素溶液、以及去离子水补足至1升。
COVE痕量元素溶液由以下组成:40mg的Na2B4O7·10H2O、0.4g的CuSO4·5H2O、1.2g的FeSO4·7H2O、0.7g的MnSO4·H2O、0.8g的Na2MoO2·2H2O、10g的ZnSO4·7H2O、以及去离子水补足至1升。
LB培养基由以下组成:10g的胰蛋白胨、5g的酵母提取物、5g的NaCl、以及去离子水补足至1升。
LB+Amp培养基由以下组成:每ml补充有100μg氨苄青霉素的LB培养基。
M400培养基由以下组成:50g的麦芽糖糊精、2g的MgSO4·7H2O、2g的KH2PO4、4g的柠檬酸、8g的酵母提取物、2g的尿素、0.5ml的AMG痕量金属溶液、0.5g的CaCl2、以及去离子水补足至1升;用NaOH调节至pH 6。在pH调节之后,添加0.7ml的消泡剂。
Magnificent Broth由以下组成:50g的Magnificent Broth粉(麦克康纳尔研究公司(MacConnell Research Corp.)美国加州圣迭戈(San Diego,CA,USA))以及去离子水补足至1升。
MaltV1培养基由以下组成:20g的麦芽糖、10g的细菌蛋白胨、1g的酵母提取物、1.45g的(NH4)2SO4、2.08g的KH2PO4、0.28g的CaCl2、0.42g的MgSO4·7H2O、0.42ml的木霉痕量金属溶液、0.48g的柠檬酸、19.52g的2-(N-吗啉代)乙磺酸(MES)、以及去离子水补足至1升;用NaOH调节至pH 5.5。
MDU2BP培养基(pH 5.0)由以下组成:135g的麦芽糖、3g的MgSO4·7H2O、3g的NaCl、6g的K2SO4、36g的KH2PO4、21g的酵母提取物、6g的尿素、1.5ml的AMG痕量金属溶液、以及去离子水补足至1升。
PEG溶液由以下组成:6g的聚乙二醇4000(PEG 4000)、100μl的1M Tris(pH 7.5)、100μl的1M CaCl2、以及去离子水补足至10ml。
原生质体化培养基由以下组成:92ml的转化蔗糖培养基、2ml的1M尿苷、1ml的1MNaNO3、以及10ml的YP培养基。
原生质体化溶液由以下组成:15ml的1.2M MgSO4、150μl的1M NaH2PO4(pH 5.8)、100mg的(诺维信公司,丹麦鲍斯韦)、以及10mg的壳多糖酶(西格玛化学有限公司,美国密苏里州圣路易斯)。
ST溶液由以下组成:1.5ml的2M山梨醇、500μl的1M Tris(pH 7.5)、以及去离子水补足至5ml。
STC溶液由以下组成:60ml的2M山梨醇、1ml的1M Tris(pH 7.5)、1ml的1M CaCl2、以及去离子水补足至100ml。
蔗糖培养基由以下组成:20ml的COVE盐溶液、342g的蔗糖、以及去离子水补足至1升。
蔗糖琼脂平板由以下组成:20ml的木霉痕量金属溶液、20g的诺布尔琼脂、342g的蔗糖、以及去离子水补足至1升。
TAE缓冲液由以下组成:40mM的2-氨基-2-羟甲基-丙烷-1,3-二醇、20mM的冰醋酸、以及2mM乙二胺四乙酸(pH 8.0)。
TBE缓冲液由以下组成:10.8g的Tris碱、5.5g的硼酸、以及0.74g的EDTA(pH 8)于补足至1升的去离子水中。
TE缓冲液由以下组成:10mM Tris-0.1mM EDTA(pH 8)。
顶层琼脂由以下组成:500ml的蔗糖培养基、5g的低熔点琼脂糖、以及10ml的20mMTris(pH 7.5)。
转化蔗糖培养基由以下组成:70ml的1M蔗糖以及20ml的COVE盐溶液。
木霉痕量金属溶液由以下组成:216g的FeCl3·6H2O、58g的ZnSO4·7H2O、27g的MnSO4·H2O、10g的CuSO4·5H2O、2.4g的H3BO3、336g的柠檬酸、以及去离子水补足至1升。
2XYT琼脂平板由以下组成:16g的胰蛋白胨、10g的酵母提取物、5g的NaCl、15g的细菌琼脂、以及去离子水补足至1升。
2XYT+Amp琼脂平板由以下组成:每ml补充有100μg氨苄青霉素的2XYT琼脂。
YP培养基由以下组成:10g细菌酵母提取物、20g的细菌蛋白胨、以及去离子水补足至1升。
实例1:表达载体pMMar44、pMMar49、pMMar45、以及pDFng113的构建
如下所述构建质粒pMMar44,以表达烟曲霉GH61B多肽并且生成突变体基因文库。此外,如下所述构建质粒pMMar49、pMMar45、以及pDFng113,以分别表达烟曲霉GH61B多肽变体(WO 2012/044835)、青霉属物种(埃默森)GH61A多肽(下文埃默森青霉GH61A多肽)、以及金黄色嗜热子囊菌GH61A多肽,并且生成变体。
用Bam HI和Not I消化含有用于在曲霉菌属中自主维持的AMA序列的质粒pENI2376(美国专利申请20060234340),以使该质粒线性化并且去除一个8bp片段。使用PCR纯化试剂盒(凯杰有限公司(QIAGEN Inc.),美国加州瓦伦西亚(Valencia,CA,USA))根据制造商的说明纯化消化的质粒。
使用表1中示出的引物由以下描述的源质粒扩增烟曲霉GH61B多肽编码序列(图1;SEQ ID NO:29[基因组DNA序列]和SEQ ID NO:30[推导的氨基酸序列])、突变烟曲霉GH61B多肽编码序列(WO 2012/044835)、埃默森青霉GH61A多肽编码序列(SEQ ID NO:35[基因组DNA序列]和SEQ ID NO:36[推导的氨基酸序列])、以及金黄色嗜热子囊菌GH61A多肽编码序列(SEQ ID NO:13[基因组DNA序列]和SEQ ID NO:14[推导的氨基酸序列])。粗体字母代表编码序列。其余序列与用于表达GH61多肽编码序列的pENI2376的插入位点同源。
表1
以下描述含有烟曲霉GH61B多肽编码序列的质粒pMMar44的构建。使用表1中示出的具有被设计来克隆到质粒pENI2376中的突出端的引物、由质粒pAG43(WO 2010/138754)扩增烟曲霉GH61B多肽编码序列。
将五十皮摩尔的表1中列出的每种引物用于最终体积为50μl的由以下组成的PCR反应:90ng的pAG43、1X2PCR缓冲液(科隆达实验室有限公司(ClontechLaboratories,Inc.),美国加州山景城(Mountain View,CA,USA))、1μl的dATP、dTTP、dGTP、以及dCTP的共混物(各以10mM)、以及1X2DNA聚合酶混合物(科隆达实验室有限公司,美国加州山景城)。使用5333(艾本德科技有限公司(Eppendorf Scientific,Inc.),美国纽约韦斯特伯里(Westbury,NY,USA))执行扩增,其被编程为:1个循环,在95℃下持续1分钟;30个循环,在95℃下持续30秒、60℃下持续30秒、以及72℃下持续1分钟;以及最终延长,在72℃下持续10分钟。接着将加热块进行4℃浸泡循环。
将反应产物通过使用TBE缓冲液的1.0%琼脂糖凝胶电泳进行分离,其中将大约862bp的PCR产物条带从凝胶切离,并且使用凝胶提取试剂盒(凯杰有限公司,美国加州瓦伦西亚)进行提取。
使用IN-FUSIONTM PCR克隆试剂盒(科隆达实验室有限公司,美国加州山景城)将862bp PCR产物与消化的pENI2376的同源末端接合在一起。将总共63ng的862bp PCR产物和200ng的Bam HI/Not I消化的pENI2376用于最终体积为20μl的由以下组成的反应:4μl的5X IN-FUSIONTM反应缓冲液(科隆达实验室有限公司,美国加州山景城)以及2μl的IN-FUSIONTM酶(科隆达实验室有限公司,美国加州山景城)。将该反应在37℃下孵育15分钟,其后在50℃下15分钟,并且接着置于冰上。用TE缓冲液将反应体积增加至100μl,并且根据制造商的说明将2μl的反应转化到大肠杆菌超级感受态细胞(Stratagene公司,美国加州拉霍亚(La Jolla,CA,USA))中。在2XYT+Amp琼脂平板上对大肠杆菌转化体进行选择。使用9600(凯杰有限公司,美国加州瓦伦西亚)自若干所得大肠杆菌转化体制备质粒DNA。烟曲霉GH61B多肽编码序列插入物使用染料终止子化学(吉塞克(Giesecke)等人,1992,病毒学方法杂志(J.Virol.Methods)38:47-60)、用Model377XL自动DNA测序仪(应用生物系统有限公司(Applied Biosystems Inc.),美国加州福斯特市(Foster City,CA,USA)),通过DNA测序来证实。用于基因插入物和序列的验证的测序引物在以下示出。
引物996271:
ACTCAATTTACCTCTATCCACACTT(SEQ ID NO:225)
引物pALLO2 3’:
GAATTGTGAGCGGATAACAATTTCA(SEQ ID NO:226)
选择含有正确的烟曲霉GH61B多肽编码序列的质粒并且命名为pMMar44(图2)。
以下描述质粒pMMar49的构建,该质粒含有八个碱基对改变,导致烟曲霉GH61B多肽的四个氨基酸突变(WO 2012/044835)。使用表1中示出的具有被设计来克隆到质粒pENI2376中的突出端的引物、由质粒pTH230扩增突变烟曲霉GH61B多肽编码序列(WO 2012/044835)。
将五十皮摩尔的表1中列出的每种引物用于最终体积为50μl的由以下组成的PCR反应:100ng的pTH230、1X2PCR缓冲液(科隆达实验室有限公司,美国加州山景城)、1μl的dATP、dTTP、dGTP、以及dCTP的共混物(各以10mM)、以及1X2DNA聚合酶混合物(科隆达实验室有限公司,美国加州山景城)。使用5333执行扩增,其被编程为:1个循环,在95℃下持续1分钟;30个循环,在95℃下持续30秒、60℃下持续30秒、以及72℃下持续1分钟;以及最终延长,在72℃下持续7分钟。接着将加热块进行4℃浸泡循环。
将反应产物通过使用TBE缓冲液的1.0%琼脂糖凝胶电泳进行分离,其中将大约862bp的PCR产物条带从凝胶切离,并且使用凝胶提取试剂盒进行提取。
使用IN-FUSIONTM PCR克隆试剂盒将862bp PCR产物与消化的pENI2376的同源末端接合在一起。将总共90ng的862bp PCR产物和220ng的Bam HI/Not I消化的pENI2376用于最终体积为20μl的由以下组成的反应:4μl的5X IN-FUSIONTM反应缓冲液以及2μl的IN-FUSIONTM酶。将该反应在37℃下孵育15分钟,其后在50℃下15分钟,并且接着置于冰上。用TE缓冲液将反应体积增加至100μl,并且根据制造商的说明将2μl的反应转化到大肠杆菌超级感受态细胞中。在2XYT+Amp琼脂平板上对大肠杆菌转化体进行选择。使用9600自若干所得大肠杆菌转化体制备质粒DNA。突变型烟曲霉GH61B多肽编码序列插入物使用染料终止子化学(吉塞克(Giesecke)等人,1992,见上文)、用Model377XL自动DNA测序仪,通过DNA测序来证实。测序引物996271和pALLO23’用于基因插入物和序列的验证。
选择含有正确的突变型烟曲霉GH61B多肽编码序列的质粒并且命名为pMMar49(图3)。
以下描述含有埃默森青霉GH61A多肽编码序列的质粒pMMar45的构建。使用表1中示出的具有被设计来克隆到质粒pENI2376中的突出端的引物、由含有埃默森青霉GH61A多肽编码序列的质粒pDM286扩增埃默森青霉GH61A多肽编码序列。
根据以下方案构建质粒pDM286。使用PHUSIONTM高保真度热启动DNA聚合酶(Finnzymes Oy公司,芬兰埃斯波(Espoo,Finland))以及以下示出的基因特异性正向和反向引物,由质粒pGH61D23Y4(WO 2011/041397)扩增埃默森青霉GH61A多肽基因。处于斜体的区域代表与插入位点同源的载体。
正向引物:
5'-CGGACTGCGCACCATGCTGTCTTCGACGACTCGCAC-3'(SEQ ID NO:227)
反向引物:
5'-TCGCCACGGAGCTTATCGACTTCTTCTAGAACGTC-3'(SEQ ID NO:228)
扩增反应含有30ng的质粒pGH61D23Y4、50皮摩尔的以上列出的每种引物、1μl的dATP、dTTP、dGTP、以及dCTP的10mM共混物、1X PHUSIONTM高保真度热启动DNA聚合酶缓冲液(Finnzymes Oy公司,芬兰埃斯波)以及1个单位的PHUSIONTM高保真度热启动DNA聚合酶缓冲液(Finnzymes Oy公司,芬兰埃斯波),最终体积为50μl。
扩增反应在5333epgradient S(艾本德科技有限公司,美国纽约韦斯特伯里)中孵育,其被编程为:1个循环,在98℃下持续30秒;35个循环,在98℃下持续10秒、60℃下持续30秒、以及72℃下持续30秒;以及1个循环,在72℃下持续10分钟。
PCR产物通过使用TAE缓冲液的1%琼脂糖凝胶电泳进行分离。将0.87kb的片段从凝胶切离并且使用提取II试剂盒(Macherey-Nagel有限公司,美国宾夕法尼亚州伯利恒(Bethlehem,PA,USA))根据制造商的方案进行提取。
用Nco I和Pac I消化质粒pMJ09(US 2005/0214920 A1),并且在消化之后,通过使用TBE缓冲液的1.0%琼脂糖凝胶电泳分离消化的载体,其中将大约7.1kb的片段从凝胶切离并且使用凝胶提取试剂盒进行提取。使用IN-FUSIONTM PCR克隆试剂盒根据制造商的方案将0.87kb PCR产物插入Nco I/Pac I消化的pMJ09中。IN-FUSIONTM反应由以下组成:1X IN-FUSIONTM反应缓冲液、180ng的Not I/Pac I消化的质粒pMJ09、108ng的0.87kb PCR产物、以及1μl的IN-FUSIONTM酶,反应体积为10μl。该反应在37℃下孵育15分钟,并且接着在50℃下持续15分钟。向该反应中添加40μl的TE,并且使用2μl来根据制造商的方案转化ONE TOP10感受态细胞(英杰(Invitrogen),美国加州卡尔斯巴德(Carlsbad,CA,USA))。通过测序筛选转化体,并且鉴定出含有插入物而没有PCR错误的一个克隆并命名为质粒pDM286。可以用Pme I消化质粒pDM286,以生成用于里氏木霉转化的大约5.4kb片段。这个5.4kb片段含有表达盒[里氏木霉Cel7A纤维二糖水解酶(CBHI)启动子、埃默森青霉糖基水解酶61A(GH61A)基因、里氏木霉Cel7A纤维二糖水解酶(CBHI)终止子]以及构巢曲霉乙酰胺酶(amdS)基因。
为了构建pMMar45,将50皮摩尔的表1中列出的每种引物用于最终体积为50μl的由以下组成的PCR反应:120ng的pDM286、1XPCR缓冲液(罗氏诊断产品有限公司(Roche Diagnostics,Inc.),美国印第安纳州印第安纳波利斯(Indianapolis,IN,USA))、1μl的dATP、dTTP、dGTP、以及dCTP的共混物(各以10mM)、以及1XDNA聚合酶混合物(罗氏诊断产品有限公司,美国印第安纳州印第安纳波利斯)。使用5333执行扩增,其被编程为:1个循环,在95℃下持续1分钟;30个循环,在95℃下持续30秒、60℃下持续30秒、以及72℃下持续1分钟;以及最终延长,在72℃下持续10分钟。接着将加热块进行4℃浸泡循环。
将反应产物通过使用TBE缓冲液的1.0%琼脂糖凝胶电泳进行分离,其中将大约762bp的PCR产物条带从凝胶切离,并且使用凝胶提取试剂盒进行提取。
使用IN-FUSIONTM PCR克隆试剂盒将762bp PCR产物与Bam HI/Not I消化的pENI2376的同源末端接合在一起。将总共90ng的762bp PCR产物和200ng的消化的pENI2376用于最终体积为20μl的由以下组成的反应:4μl的5X IN-FUSIONTM反应缓冲液以及2μl的IN-FUSIONTM酶。将该反应在37℃下孵育15分钟,其后在50℃下15分钟,并且接着置于冰上。用TE缓冲液将反应体积增加至100μl,并且根据制造商的说明将2μl的反应转化到大肠杆菌超级感受态细胞中。在2XYT+Amp琼脂平板上对大肠杆菌转化体进行选择。使用9600自若干所得大肠杆菌转化体制备质粒DNA。埃默森青霉GH61A多肽编码序列插入物使用染料终止子化学(吉塞克(Giesecke)等人,1992,见上文),用Model 377XL自动DNA测序仪,通过DNA测序来证实。测序引物996271和pALLO2 3’用于基因插入物和序列的验证。
选择含有正确的埃默森青霉GH61A多肽编码序列的质粒并且命名为pMMar45(图4)。
以下描述含有金黄色嗜热子囊菌GH61A多肽编码序列的质粒pDFng113的构建。使用表1中示出的具有被设计来克隆到质粒pENI2376中的突出端的引物、由质粒pDZA2(WO2005/074656)扩增金黄色嗜热子囊菌GH61A多肽编码序列。
将五十皮摩尔的表1中列出的每种引物用于最终体积为50μl的由以下组成的PCR反应:100ng的pDZA2、1XPCR缓冲液、1μl的dATP、dTTP、dGTP、以及dCTP的共混物(各以10mM)、以及1XDNA聚合酶混合物。使用5333执行扩增,其被编程为:1个循环,在94℃下持续2分钟;30个循环,在94℃下持续15秒、59.9℃下持续30秒、以及72℃下持续1分钟;以及最终延长,在72℃下持续7分钟。接着将加热块进行4℃浸泡循环。
将反应产物通过使用TBE缓冲液的1.0%琼脂糖凝胶电泳进行分离,其中将大约822bp的PCR产物条带从凝胶切离,并且使用凝胶提取试剂盒进行提取。
使用IN-FUSIONTM PCR克隆试剂盒将822bp PCR产物与Bam HI/Not I消化的pENI2376的同源末端接合在一起。将总共37ng的799bp PCR产物和200ng的消化的pENI2376用于最终体积为20μl的由以下组成的反应:4μl的5X IN-FUSIONTM反应缓冲液以及2μl的IN-FUSIONTM酶。将该反应在37℃下孵育15分钟,其后在50℃下15分钟,并且接着置于冰上。用TE缓冲液将反应体积增加至50μl,并且根据制造商的说明将2μl的反应转化到大肠杆菌高效感受态细胞中。在2XYT+Amp琼脂平板上对大肠杆菌转化体进行选择。使用9600自若干所得大肠杆菌转化体制备质粒DNA。金黄色嗜热子囊菌GH61A多肽编码序列插入物使用染料终止子化学(吉塞克(Giesecke)等人,1992,见上文),用Model 377XL自动DNA测序仪,通过DNA测序来证实。测序引物996271和pALLO23’用于基因插入物和序列的验证。
选择含有正确的金黄色嗜热子囊菌GH61A多肽编码序列的质粒并且命名为pDFng113(图5)。
实例2:烟曲霉GH61B多肽位点饱和文库的构建
烟曲霉GH61B多肽编码序列的位点饱和文库由GeneArt AG(德国雷根斯堡(Regensburg,Germany))合成。对于总共165个残基,除去最保守残基,平均每个位置合成16.8个突变,得到总共2768种突变体。含有具有已知突变的突变质粒的大肠杆菌DH10B(英杰,美国加州卡尔斯巴德)菌株排列在96孔平板中作为50μl甘油原种,并且在-80℃下储存。
通过使用无菌96孔复制器将GeneArt平板压印到2XYT+Amp琼脂平板上,从解冻的GeneArt平板产生DNA。该琼脂平板在37℃下孵育过夜。从该琼脂平板所得的克隆被用于接种96深孔块,其中每孔含有补充有400μg氨苄青霉素(每ml)的1ml Magnificent broth。用气孔可透气盖覆盖该块并且接着在加湿箱中在37℃、350rpm下过夜。在1100xg下将该块离心10分钟并且弃去上清液。使用9600从细胞沉淀中提取质粒。
实例3:烟曲霉GH61B、埃默森青霉GH61A、以及金黄色嗜热子囊菌GH61A多肽变体在米曲霉PFJO218中的表达
将米曲霉PFJO218在10mM尿苷存在下在COVE-N-Gly平板上孵育并且在34℃下孵育直到汇合。通过用8ml的0.01%20洗涤从该平板收集孢子。将1ml的孢子悬浮液用于接种500ml聚碳酸盐摇瓶中的103ml的原生质体化培养基。将该摇瓶在30℃下孵育,并且在180rpm下振荡17-20小时。通过衬有(Calbiochem,美国加州拉霍亚)的漏斗过滤菌丝体并且用200ml的0.6M MgSO4洗涤。将洗涤的菌丝体在125ml无菌聚碳酸盐摇瓶中的15ml的原生质体化溶液中重悬并且在冰上孵育5分钟。向摇瓶中添加12mg牛血清白蛋白/ml去离子水的溶液1ml,并且接着将该摇瓶在37℃下、在70rpm下混合孵育1-3小时,直到原生质体化完成。通过衬有的漏斗将菌丝体/原生质体混合物过滤到50ml锥形管中,并且用5ml的ST覆盖。在低加速/减速下将该50ml锥形管在1050x g下离心15分钟。离心后,液体被分成3相。将含有原生质体的中间相转移到新的50ml锥形管。在1050xg下简短离心5分钟之后,向原生质体中添加两体积的STC。弃去上清液。在重悬原生质体沉淀、在1050x g下离心10分钟、并且每次撇出上清液的情况下,用20ml的STC洗涤原生质体两次。在最终撇出后,在STC中在1×108/ml浓度下重悬原生质体沉淀。在转化之前将原生质体冰冻于-80℃。
在其中每孔有3.5μl的PEG溶液的24孔平板中,使用1.3μl体积的每种突变质粒转化3.5μl的米曲霉PFJO218原生质体。还如上将质粒pMMar44、pMMar45、或pDFng113(表1)转化到米曲霉PFJO218原生质体中,以提供包含烟曲霉、埃默森青霉、或金黄色嗜热子囊菌野生型GH61多肽的培养液。将该24孔平板在37℃下静止孵育30分钟,其后添加28.6μl的含有10mM NaNO3和14.3μl的STC的转化蔗糖培养基。然后将该24孔平板置于加湿箱中在37℃下静止持续7天。在第7天,向每孔添加1ml的MaltV1培养基。将该平板返回加湿箱中在39℃下静止并且再孵育5天。使用移液管收获至少550μl的每种变体或野生型烟曲霉、埃默森青霉、或金黄色嗜热子囊菌GH61多肽的培养液,以去除菌丝体面并且吸出液体,用于使用PASC作为底物进行测定。产生具有使用PASC测定(实例5)的改善的热稳定性的突变体的突变质粒被再次转化并且使用上述方案重新测试。
对一些突变体进行孢子纯化用于进一步特征化。在7天的转化孵育之后并且在添加1ml的MaltV1表达培养基之前,将一个环在来自转化的初始生长上触击以收集孔中的孢子。然后将孢子在COVE-N-Gly平板上划线并且在37℃下孵育大约36小时。将单个单独的转化体从平板上切除并且转移到新鲜的COVE-N-Gly平板上。将这些平板储存在34℃下直到汇合。一旦汇合,则将浸泡在0.01%20中的环在孢子上触击,其接着用于接种24孔平板,其中每孔含有1ml的MaltV1表达培养基。将该24孔平板置于39℃下的加湿箱中。在第五天,通过去除菌丝体面并且用移液管向上吸取培养液来收获样品。
实例4:烟曲霉β-葡糖苷酶的制备
根据WO 2005/047499使用米曲霉作为宿主重组制备烟曲霉NN055679Cel3A β-葡糖苷酶(SEQ ID NO:243[DNA序列]和SEQ ID NO:244[推导的氨基酸序列])。
用20%乙酸钠将过滤的培养液调节至pH 8.0,这使得该溶液浑浊。为了去除浑浊,将该溶液在20,000x g下离心20分钟,并且通过0.2μm过滤单元(Nalgene,美国纽约罗切斯特(Rochester,NY,USA))过滤上清液。用去离子水稀释滤液,以达到与50mM Tris/HCl(pH8.0)相同的电导率。将调节的酶溶液施加到用50mM Tris-HCl(pH 8.0)平衡的QFast Flow柱(通用电气医疗集团(GE Healthcare),美国新泽西州皮斯卡特维(Piscataway,NJ,USA))中,并且用0至500mM氯化钠的线性梯度洗脱。合并各部分并且用1%(w/v)活性炭处理,以从β-葡糖苷酶池去除颜色。由通过0.2μm过滤单元(Nalgene,美国纽约罗切斯特)过滤悬浮液去除炭。滤液用20%乙酸调节至pH 5.0并且用去离子水稀释10倍。将调节的滤液施加到用10mM琥珀酸(pH 5.0)平衡的SPFast Flow柱(通用电气医疗集团,美国新泽西州皮斯卡特维)中,并且用0至500mM氯化钠的线性梯度洗脱。使用微平板BCATM蛋白质测定试剂盒(赛默飞世尔科技(Thermo Fischer Scientific),美国麻萨诸塞州沃尔瑟姆(Waltham,MA,USA))来测定蛋白质浓度,其中使用牛血清白蛋白作为蛋白质标准。
实例5:烟曲霉GH61B多肽变体文库的筛选
使用具有热循环器(伯乐实验室有限公司(Bio-Rad Laboratories,Inc.),美国加州里士满(Richmond,CA,USA))的FX实验室自动工作站(贝克库曼特(Beckman Coulter),美国加州富尔顿(Fullerton,CA,USA)),将来自MaltV1培养基(实例3)中生长的烟曲霉GH61B变体和亲本(野生型)多肽的文库平板的80μl的每种培养液样品与20μl的1M乙酸钠-10mM MnSO4pH 5.0缓冲液混合。然后将这些样品在62℃、65℃、以及68℃下热激发20分钟并且与环境温度对照相比较。在热激发之后,在2mM MnSO4-200mM乙酸钠(pH 5)中将这些培养液样品稀释1.25、2.5、6.25、以及15.625倍,并且接着将12.5μl的稀释液转移到384孔聚丙烯测定平板中,该平板含有25μl的1%磷酸膨胀纤维素(PASC)和12.5μl的辅因子溶液(400mM乙酸钠(pH 5)、4mM MnSO4、0.4%没食子酸、0.1mg/ml的烟曲霉β-葡糖苷酶、以及0.04%X100)。使用ALPS-300TM(Abgene,联合王国埃普索姆(Epsom,United Kingdom))用塑料板将这些板热密封并且在40℃下孵育4天。
缓冲液处理的培养液样品的背景葡萄糖浓度在孵育之前通过每升使用以下试剂执行葡萄糖测定进行测定:0.9951g的ATP、0.5176g的NAD、0.5511g的MgSO4·7H2O、20.9g的MOPS、1000单位的己糖激酶、1000单位的葡萄糖-6-磷酸脱氢酶、以及0.01%X-100(pH 7.5)。FX实验室自动工作站用于这个测定。使用水作为稀释剂在384孔聚苯乙烯平板中执行四个2倍连续稀释。向新的384孔聚苯乙烯平板中添加5μl的稀释液,其后添加60μl的以上试剂。将该平板在环境温度(22℃±2℃)下孵育30至45分钟。在360nm的激发和465nm的发射下使用DTX 880平板读取器(贝克库曼特,美国加州富尔顿)测定相对荧光单位(RFU),并且与在与样品相同的平板中稀释的葡萄糖标准(1mg/ml和0.125mg/ml)相比较。在第四天末,使用上述葡萄糖测定针对葡萄糖浓度对40℃孵育的PASC平板进行分析。从适当样品中减去任何背景葡萄糖,并且然后通过将环境样品处理的PASC测定中释放的葡萄糖与热激发样品处理的PASC测定中释放的葡萄糖相比较来计算残余活性。在计算中仅使用拟合曲线中的线性部分的数据(定义为在含有5mg/ml PASC的测定中产生小于或等于1mg/ml葡萄糖)。用于计算热处理的残余活性的公式如下:(热处理样品产生的mg/ml葡萄糖/环境处理样品产生的mg/ml葡萄糖)×100%。改进的变体是与来自处于至少一种热处理条件的MaltV1培养基的野生型烟曲霉GH61A多肽培养液相比,具有较高残余活性%的那些。全部计算使用(微软公司(Microsoft Corporation),美国华盛顿州雷德蒙德(Redmond,WA,USA))。
实例6:通过热处理后的残余活性测量的烟曲霉GH61B多肽变体的热稳定性
基于如实例5中描述的残余活性比,在之前实例中构建的文库的筛选产生表2和3中列出的结果。
表2示出在62、65、或68℃下处理后(来自每种变体和野生型对照的3-5个样品)的平均残余活性%。当温度从62℃增加至65℃至68℃时,亲本烟曲霉GH61B多肽分别显示出70%、45%、以及22%的降低的残余活性。与野生型烟曲霉GH61多肽相比,烟曲霉GH61B多肽变体的热稳定性的增加在62℃处理下在1.03至1.1倍增加范围内、在65℃处理下在1.09至1.4倍增加范围内、并且在68℃处理下在1.5至2.5倍增加范围内。这些结果显示在68℃处理下的改善最显著。
表2在62℃、65℃、以及68℃处理下具有改善的热稳定性的变体
表3示出在62℃、65℃、或68℃下处理后(来自每种变体的3-5个样品和野生型对照的110个样品)的平均残余活性%。当温度从62℃增加至65℃至68℃时,亲本烟曲霉GH61B多肽对应地显示出56%、35%、以及12%的降低的残余活性。与野生型烟曲霉GH61多肽相比,烟曲霉GH61B多肽变体的热稳定性的增加在62℃处理下在1.02倍至1.2倍增加范围内、在65℃处理下在1.14倍至1.6倍增加范围内、并且在68℃处理下在2.08倍至3.25倍增加范围内。这些结果显示在68℃处理下的改善最显著。
表3在62℃、65℃、以及68℃处理下具有改善的热稳定性的烟曲霉GH61B多肽变体
实例7:烟曲霉GH61B组合变体的热稳定性
通过使用II XL定点诱变试剂盒(Stratagene,美国加州拉霍亚)在pMMar49(实例1)上执行定点诱变来构建烟曲霉GH61B多肽的四种变体。为每个构建体设计两种致突变引物以插入所希望的突变。将125ng的每种引物(表4)用于最终体积为50μl的含有以下的PCR反应:大约25ng的模板质粒、1X反应缓冲液、3μl的1μl的XL dNTP混合物、以及1μl的2.5U/μlPfu高效酶。在以下设置下使用热循环器:95℃热启动;一个循环,在95℃下持续1分钟;18个循环,每个循环在95℃下持续50秒、在60℃下持续50秒、并且在68℃下持续10分钟;以及4℃保持。向扩增反应中直接添加一微升的Dpn I,并且在37℃下孵育1小时。根据制造商的说明,使用2μl体积的DpnI消化的反应来转化大肠杆菌XL10-Gold高效感受态细胞(Stratagene,美国加州拉霍亚)。在2XYT+Amp琼脂平板上对大肠杆菌转化体进行选择。具有所希望的突变的克隆之一命名为以下列出的每种质粒。
突变G188A、G188W、K229W、以及N189K单独地添加在含有突变L111V、D152S、M155L、以及A162W的烟曲霉GH61B多肽变体(pMMar49,实例1)的顶部,从而分别得到pLSBF09-1、pLSBF09-2、pLSBF09-3、以及pLSBF09-4。用于定点诱变反应的寡核苷酸的汇总以下在表4中示出。
通过使用如上所述的II XL定点诱变试剂盒在pLSBF09-3上执行定点诱变来构建烟曲霉GH61B的三种另外的变体。如所描述单独添加突变G188F、N189K、以及A216Y,从而得到pDFNG146、pDFNG147、以及pLSBF21。用于定点诱变反应的寡核苷酸的汇总以下在表4中示出。
使用9600制备以上七种变体质粒。然后使用3130xl遗传分析器(应用生物系统,美国加州福斯特市)对变体质粒构建体进行测序以验证改变。
表4
基于根据实例5测定的残余活性比,在之前实例中构建的文库的筛选产生表5中列出的结果。表5示出在65℃、68℃、或72℃下处理后(来自每种组合变体的1-14个样品和野生型的23个样品)的平均残余活性%。
当温度从65℃增加至68℃至72℃时,亲本烟曲霉GH61B多肽对应地显示出33%、3%、以及1%的降低的残余活性。与野生型烟曲霉GH61多肽相比,烟曲霉GH61B多肽组合变体的热稳定性的增加在65℃下在1.66倍至2.42倍增加范围内、在68℃下在14.36倍至19.57倍增加范围内、并且在72℃下在31.45倍至80.07倍增加范围内。这些结果显示在72℃处理下的改善最显著。
表5在65℃、68℃、以及72℃处理下具有改善的热稳定性的烟曲霉GH61B多肽变体
实例8:烟曲霉GH61B多肽变体的纯化
如之前在WO 2012/044835中所描述对野生型烟曲霉GH61B多肽进行表达和纯化。
培养烟曲霉GH61B多肽变体菌株以回收培养液用于纯化。在分离单克隆之后,将米曲霉PFJO218转化体在34℃下在COVE-N-GLY平板上培养4天,以制备更大规模的发酵。使用0.01%20从每个平板回收孢子。将每种孢子悬浮液(500μl)接种到125ml塑料摇瓶中的25ml的M400培养基中。在150rpm振荡下将这些转化体在39℃下发酵3天,并且收集培养液并使用0.22μm过滤器过滤。然后使用100 5kDa MWCO离心浓缩装置(赛多利斯(Sartorius Stedim),德国哥廷根(Goettingen,Germany))通过离心超滤将过滤的培养液浓缩,并且接着缓冲液交换为20mM Tris-HCl(pH 8.5)。
浓缩的并且缓冲液交换的烟曲霉GH61B多肽变体通过一种或多种色谱方法进一步纯化。在一种方法中,该浓缩的并且缓冲液交换的培养液接着各自被施加到用20mM Tris-HCl(pH 8.0)平衡的MONOHR 16/10柱(通用电气医疗集团,美国新泽西州皮斯卡特维)。结合的蛋白质用20mM Tris-HCl(pH 8.0)中的0-600mM氯化钠的线性梯度洗脱。各部分使用无染色Tris-HCl 8%-16%SDS-PAGE凝胶(伯乐实验室有限公司,美国加州赫拉克勒斯)通过SDS-PAGE进行分析、基于约25kDa条带的丰度而合并、并且使用5kDa MWCO离心浓缩装置(通用电气医疗集团,美国新泽西州皮斯卡特维)浓缩。可替代地,该浓缩并且脱盐的培养液接着各自被施加到用20mM Tris-HCl(pH 8.0)和150mM NaCl平衡过的26/6075(通用电气医疗集团,美国新泽西州皮斯卡特维)尺寸排阻柱。使用20mM Tris-HCl(pH 8.0)和150mM NaCl作为流动相等度洗脱施加的蛋白质。各部分使用无染色Tris-HCl 8%-16%SDS-PAGE凝胶通过SDS-PAGE进行分析、基于约25kDa条带的丰度而合并、并且使用5kDaMWCO离心浓缩装置浓缩。
使用微平板BCATM蛋白质测定试剂盒来测定蛋白质浓度,其中使用牛血清白蛋白作为蛋白质标准。
实例9:通过差式扫描量热法测定烟曲霉野生型GH61B多肽和烟曲霉GH61B多肽变体的Tm(解链温度)
如在实例8中所述进行纯化的烟曲霉野生型GH61B多肽和烟曲霉GH61B多肽变体的热稳定性使用VP差示扫描量热计(微凯尔有限公司(MicroCal Inc.),通用电气医疗集团,美国新泽西州皮斯卡特维)通过差示扫描量热法(DSC)来测定。将解链温度Tm(℃)记为以恒定编程的加热速率加热1mg蛋白质每ml的50mM乙酸钠(pH 5.0)、100μM CuSO4中的酶溶液、或1mg蛋白质每ml的50mM乙酸钠(pH 5.0)、10mM EDTA(pH 5.0)中的酶溶液之后获得的热谱图(Cp相对于T)中的顶部变性峰值(主热吸收峰)。1ml的样品和参比溶液在装载量热计的样品和参比池之前在25℃下使用ThermoVac(微凯尔有限公司,通用电气医疗集团,美国新泽西州皮斯卡特维)进行脱气。将样品和参比(参比:脱气的水)溶液手动装载到DSC中并且进行热预平衡至25℃之后以90K/小时的扫描速率从25℃至95℃执行DSC扫描。以大约+/-1℃的精确度测定变性温度。烟曲霉GH61B多肽变体的热稳定性测定的结果在表6中示出。
表6如通过差示扫描量热法测定的烟曲霉GH61B多肽和烟曲霉GH61B多肽的变体的解链温度(℃)
实例10:通过蛋白质热解折叠分析测定烟曲霉野生型GH61B多肽和烟曲霉GH61B多肽变体的Tm(解链温度)
烟曲霉GH61B多肽变体的蛋白质热解折叠使用宝石橙蛋白染色试剂(Orange Protein Stain)(英杰,丹麦奈鲁姆(Naerum,Denmark))、使用StepOnePlusTM实时PCR系统(应用生物系统有限公司,美国加州福斯特市)进行监测。在96孔白色PCR平板中,将100mM乙酸钠(pH 5.0)中的15μl蛋白质样品(如实例8中所述进行制备)与20mM EDTA中的宝石橙(所得浓度=10X;储备溶液=DMSO中5000X)混合(1:1)。用光学PCR密封件密封该平板。PCR仪被设置扫描速率为76℃每小时,在25℃下开始,并且在96℃下完成。每20秒使用内置LED蓝光进行激发并且使用ROX过滤器(610nm,发射)来监测荧光。Tm值计算为一阶导数(dF/dK)的最大值(格雷戈里(Gregory)等人,2009,生物分子筛选杂志(J.Biomol.Screen.14:700))。热稳定性测定的结果在表7中示出。
表7通过热解折叠分析测定的烟曲霉GH61B多肽和变体的解链温度(℃)
突变 Tm
野生型 59
E105P 62
E154L 61
A216Y 60
A216L 63
K229H 61
K229I 60
实例11:高温纤维素酶组合物的制备
如WO 2011/057140中所述在米曲霉中重组制备烟曲霉GH7A纤维二糖水解酶I(SEQID NO:245[基因组DNA序列]和SEQ ID NO:246[推导的氨基酸序列])。烟曲霉GH7A纤维二糖水解酶I的过滤的培养液使用配备有10kDa聚醚砜膜(颇尔Filtron(Pall Filtron),美国麻萨诸塞州诺斯伯勒(Northborough,MA,USA))的切向流动浓缩器(颇尔Filtron,美国麻萨诸塞州诺斯伯勒)进行浓缩并且与20mM Tris-HCl(pH 8.0)进行缓冲液交换。
如WO 2011/057140中所述在米曲霉中重组制备烟曲霉GH6A纤维二糖水解酶II(SEQ ID NO:247[基因组DNA序列]和SEQ ID NO:248[推导的氨基酸序列])。烟曲霉GH6A纤维二糖水解酶II的过滤的培养液使用配备有10kDa聚醚砜膜的切向流动浓缩器进行浓缩并且与20mM Tris-HCl(pH 8.0)进行缓冲液交换。
如WO 2011/057140中所述在米曲霉中重组制备里氏木霉GH5内切葡聚糖酶II(SEQID NO:249[基因组DNA序列]和SEQ ID NO:250[推导的氨基酸序列])。里氏木霉GH5内切葡聚糖酶II的过滤的培养液使用配备有10kDa聚醚砜膜的切向流动浓缩器进行浓缩并且与20mM Tris-HCl(pH 8.0)进行缓冲液交换。
根据WO 2006/078256使用米曲霉BECh2(WO 2000/39322)作为宿主重组制备烟曲霉GH10木聚糖酶(xyn3)(SEQ ID NO:251[基因组DNA序列]和SEQ ID NO:252[推导的氨基酸序列])。烟曲霉NN055679 GH10木聚糖酶(xyn3)的过滤培养液使用26/10脱盐柱(通用电气医疗集团,美国新泽西州皮斯卡特维)根据制造商的说明进行脱盐并且与50mM乙酸钠(pH 5.0)进行缓冲液交换。
如实例4中所述制备烟曲霉Cel3Aβ-葡糖苷酶。
如WO 2011/057140中所述在米曲霉中重组制备烟曲霉GH3β-木糖苷酶(SEQ IDNO:253[基因组DNA序列]和SEQ ID NO:254[推导的氨基酸序列])并且根据WO 2011/057140进行纯化。
使用微平板BCATM蛋白质测定试剂盒来测定上述每种单组分的蛋白质浓度,其中使用牛血清白蛋白作为蛋白质标准。该纤维素酶组合物由以下组成:44.7%烟曲霉Cel7A纤维二糖水解酶I、29.4%烟曲霉Cel6A纤维二糖水解酶II、11.8%里氏木霉GH5内切葡聚糖酶II、5.9%烟曲霉GH10木聚糖酶(xyn3)、5.9%烟曲霉β-葡糖苷酶、以及2.3%烟曲霉β-木糖苷酶。该纤维素酶组合物在此命名为“高温纤维素酶组合物”。
实例12:预处理的玉米秸杆水解测定
在美国能源部国家可再生能源实验室(NREL)使用1.4wt%硫酸在165℃和107psi下对玉米秸秆预处理8分钟。预处理的玉米秸秆(PCS)中的水不溶性固体含有大约59%纤维素、5%半纤维素、以及28%木质素。纤维素和半纤维素通过两段硫酸水解、以及随后通过使用NREL标准分析程序#002的高效液相色谱法的分析进行测定。木质素在用硫酸水解纤维素和半纤维素部分后,使用NREL标准分析程序#003用重量分析法进行测定。
PCS的水解使用2.2ml深孔平板(爱思进(Axygen),美国加州联合市(Union City,CA,USA))在1.0ml的总反应体积中进行。利用50mg PCS每ml的含有1mM硫酸锰和高温纤维素酶组合物的蛋白质装载量(表示为mg蛋白质每克纤维素)的50mM乙酸钠pH 5.0缓冲液执行水解。制备酶混合物并且然后以100μl的体积同时添加到所有孔中,以使各反应中的最终体积为1ml。然后使用ALPS-300TM平板热密封件(Abgene,联合王国埃普索姆)将平板密封、彻底混合、并且在50℃、55℃、以及60℃下孵育72小时。所有实验一式三份执行。
在水解后,用0.45μm96孔过滤器平板(密理博(Millipore),美国麻萨诸塞州新贝德福德(Bedford,MA,USA))过滤样品并且如以下所述针对糖含量对滤液进行分析。在不立即使用时,将过滤的含糖等分试样冰冻于-20℃。稀释于0.005M H2SO4中的样品的糖浓度使用4.6x250mmHPX-87H柱(伯乐实验室有限公司,美国加州赫拉克勒斯(Hercules,CA,USA)),通过用0.05%w/w苯甲酸-0.005M H2SO4,在0.6ml每分钟的流速下、在65℃下洗脱,并且使用由纯糖样品标定的反射指数检测器( 1100HPLC,安捷伦科技(Agilent Technologies),美国加州圣克拉拉(SantaClara,CA,USA))通过葡萄糖和纤维二糖信号的积分定量来进行测量。使用所得等价量来计算每种反应的纤维素转化百分比。
所有HPLC数据处理使用MICROSOFT EXCELTM软件(微软,美国华盛顿里奇兰(Richland,WA,USA))执行。针对适当稀释因子,调节测量的糖浓度。单独测量葡萄糖和纤维二糖。然而,为了计算总转化,合并葡萄糖和纤维二糖值。将纤维二糖浓度乘以1.053,以便转化成葡萄糖等价量并且加到葡萄糖浓度中。纤维素转化的程度使用以下方程式计算:
转化%=([样品葡萄糖浓度]/[有限消化物中的葡萄糖浓度])×100
为了计算转化%,基于50mg纤维素酶组合物每克纤维素(CELLUCLAST PLUSTM,诺维信公司,丹麦鲍斯韦)的纤维素酶对照设定一个100%转化点,并且所有值除以这个数并接着乘以100。将三份数据点平均并且计算标准差。
实例13:添加烟曲霉GH61B多肽变体对高温纤维素酶组合物在50℃、55℃、以及60℃下进行的PCS的转化的影响
针对增强高温纤维素酶组合物(实例11)在50℃、55℃、或60℃下水解PCS的能力对烟曲霉GH61B野生型多肽和烟曲霉GH61B多肽变体N189K、G188W、K229W、以及G188A进行评价。如实例12中所述执行预处理的玉米秸秆水解测定。高温组合物在测定中当以3mg蛋白质每克纤维素装载时具有以下每克纤维素的酶装载量:1.34mg的烟曲霉纤维二糖水解酶I每克纤维素、0.88mg的烟曲霉纤维二糖水解酶II每克纤维素、0.18mg的烟曲霉β-葡糖苷酶每克纤维素、0.18mg的烟曲霉GH10木聚糖酶(Xyl3)每克纤维素、0.18mg的烟曲霉β-木糖苷酶每克纤维素、以及0.35mg的里氏木霉CEL5A内切葡聚糖酶II每克纤维素。
如实例12中所述测定通过以下各物获得的对预处理的玉米秸秆的转化:高温纤维素酶组合物(3mg蛋白质每克纤维素);高温纤维素酶组合物(3mg蛋白质每克纤维素)和烟曲霉GH61B野生型多肽(0.25mg蛋白质每克纤维素)的组合;高温纤维素酶组合物(3mg蛋白质每克纤维素)和烟曲霉GH61B变体N168K多肽(0.25mg蛋白质每克纤维素)的组合;高温纤维素酶组合物(3mg蛋白质每克纤维素)和烟曲霉GH61B变体G167W多肽(0.25mg蛋白质每克纤维素)的组合;高温纤维素酶组合物(3mg蛋白质每克纤维素)和烟曲霉GH61B变体K208W多肽(0.25mg蛋白质每克纤维素)的组合;以及高温纤维素酶组合物(3mg蛋白质每克纤维素)和烟曲霉GH61B变体G167A多肽(0.25mg蛋白质每克纤维素)的组合。在50℃、55℃、或60℃下孵育72小时之后,如实例12中所述,收集和分析数据。这些结果在图6中示出。
高温纤维素酶组合物(3mg蛋白质每克纤维素)在50℃、55℃、或60℃下分别使预处理的玉米秸秆转化46.8±0.3%、47.9±1.0%、以及45.2±0.2%。
高温纤维素酶组合物(3mg蛋白质每克纤维素)和烟曲霉GH61B野生型多肽(0.25mg蛋白质每克纤维素)的组合在50℃、55℃、或60℃下分别使预处理的玉米秸秆转化55.3±0.3%、56.2±0.7%、以及51.3±0.4%。
高温纤维素酶组合物(3mg蛋白质每克纤维素)和烟曲霉GH61B变体N189K多肽(0.25mg蛋白质每克纤维素)的组合在50℃、55℃、或60℃下分别使预处理的玉米秸秆转化56.3±0.5%、57.5±0.3%、以及51.3±0.3%。
高温纤维素酶组合物(3mg蛋白质每克纤维素)和烟曲霉GH61B变体G188W多肽(0.25mg蛋白质每克纤维素)的组合在50℃、55℃、或60℃下分别使预处理的玉米秸秆转化55.8±0.4%、57.5±0.4%、以及52.4±0.04%。
高温纤维素酶组合物(3mg蛋白质每克纤维素)和烟曲霉GH61B变体K229W多肽(0.25mg蛋白质每克纤维素)的组合在50℃、55℃、或60℃下分别使预处理的玉米秸秆转化56.8±0.7%、57.6±0.1%、以及53.0±0.3%。
高温纤维素酶组合物(3mg蛋白质每克纤维素)和烟曲霉GH61B变体G188A多肽(0.25mg蛋白质每克纤维素)的组合在50℃、55℃、或60℃下分别使预处理的玉米秸秆转化55.9±0.3%、56.9±0.5%、以及51.3±0.3%。
实例14:埃默森青霉GH61A和金黄色嗜热子囊菌GH61A多肽变体的构建
通过如实例7中所述使用定点诱变试剂盒(Stratagene,美国加州拉霍亚),分别在质粒pMMar45和pDFng113上执行定点诱变来构建埃默森青霉GH61A多肽的变体(SEQ ID NO:35[DNA序列]和SEQ ID NO:36[氨基酸序列])和金黄色嗜热子囊菌GH61A多肽的变体(SEQ ID NO:13[DNA序列]和SEQ ID NO:14[氨基酸序列])。用于定点诱变的引物以及获得的变体的汇总在表8中示出。使用在实例7中描述的相同方案。
使用9600制备所得突变质粒DNA。使用3130xl遗传分析器对每种突变质粒进行测序以验证取代。测序引物996271和pALLO2 3’用于验证。
表8
根据实例3中描述的程序来执行使用米曲霉PFJO218作为宿主表达埃默森青霉GH61A多肽变体和金黄色嗜热子囊菌GH61A多肽变体。
实例15:埃默森青霉野生型GH61A多肽和埃默森青霉GH61A多肽变体的制备
如实例8中所述培养埃默森青霉GH61A多肽野生型和变体菌株,以回收培养液用于纯化。
然后使用20 5kDa MWCO离心浓缩装置(赛多利斯(SartoriusStedim),德国哥廷根(Goettingen,Germany))通过离心超滤将过滤的培养液浓缩,并且接着缓冲液交换为20mM Tris-HCl(pH 8.0)。使用微平板BCATM蛋白质测定试剂盒来测定蛋白质浓度,其中使用牛血清白蛋白作为蛋白质标准。
在埃默森青霉GH61A野生型多肽、埃默森青霉GH61A多肽变体N192W、以及埃默森青霉GH61A多肽变体N193K的情况下,通过将浓缩的并且缓冲液交换的培养液施加到用20mMTris-HCl(pH 8.0)平衡的QFast Flow柱(通用电气医疗集团,美国新泽西州皮斯卡特维)中来进行进一步纯化。结合的蛋白质用20mM Tris-HCl(pH8.0)中的0-500mM氯化钠的线性梯度洗脱。各部分使用Tris-HCl8%-16%SDS-PAGE凝胶(伯乐实验室有限公司,美国加州赫拉克勒斯)进行分析、基于约25kDa条带的丰度而合并、并且使用5kDa MWCO离心浓缩装置浓缩。使用微平板BCATM蛋白质测定试剂盒来测定蛋白质浓度,其中使用牛血清白蛋白作为蛋白质标准。
实例16:金黄色嗜热子囊菌GH61A多肽变体的制备
如实例8中所述培养金黄色嗜热子囊菌GH61A多肽野生型和变体菌株,以回收培养液用于纯化。
然后使用20 5kDa MWCO离心浓缩装置(赛多利斯(SartoriusStedim),德国哥廷根(Goettingen,Germany))通过离心超滤将过滤的培养液浓缩,并且接着缓冲液交换为20mM Tris-HCl(pH 8.0)。使用微平板BCATM蛋白质测定试剂盒来测定蛋白质浓度,其中使用牛血清白蛋白作为蛋白质标准。
通过将浓缩的并且缓冲液交换的培养液施加到用20mM Tris-HCl(pH 8.0)平衡的QFast Flow柱中来进行纯化。结合的蛋白质用20mM Tris-HCl(pH 8.0)中的0-500mM氯化钠的线性梯度洗脱。各部分使用Tris-HCl8%-16%SDS-PAGE凝胶通过SDS-PAGE进行分析、基于约25kDa条带的丰度而合并、并且使用5kDa MWCO离心浓缩装置浓缩。使用微平板BCATM蛋白质测定试剂盒来测定蛋白质浓度,其中使用牛血清白蛋白作为蛋白质标准。
实例17:通过差式扫描量热法测定埃默森青霉野生型GH61A多肽和埃默森青霉GH61A多肽变体的Tm(解链温度)
如在实例15中所述进行纯化的埃默森青霉野生型GH61A多肽和埃默森青霉GH61A多肽变体的热稳定性使用VP差示扫描量热计通过差示扫描量热法(DSC)来测定。将解链温度Tm(℃)记为以恒定编程的加热速率加热1mg蛋白质每ml的50mM乙酸钠(pH 5.0)、100μMCuSO4中的酶溶液、或1mg蛋白质每ml的50mM乙酸钠(pH 5.0)、10mM EDTA(pH 5.0)中的酶溶液之后获得的热谱图(Cp相对于T)中的顶部变性峰值(主热吸收峰)。在装载量热计的样品和参比池之前,将1ml的样品和参比溶液在25℃下使用ThermoVac进行脱气。将样品和参比(参比:脱气的水)溶液手动装载到DSC中并且进行热预平衡至25℃之后以90K/小时的扫描速率从25℃至95℃执行DSC扫描。以大约+/-1℃的精确度测定变性温度。
埃默森青霉GH61A多肽变体的热稳定性测定的结果在表9中示出。
表9如通过差示扫描量热法测定的埃默森青霉GH61A多肽和埃默森青霉GH61A多肽的变体的解链温度(℃)
酶样品 Tm+100μm CuSO<sub>4</sub>
埃默森青霉GH61A 82
埃默森青霉GH61A N192W 84
埃默森青霉GH61A N193K 83
实例18:通过蛋白质热解折叠分析测定埃默森青霉GH61A和金黄色嗜热子囊菌GH61A多肽变体的Tm(解链温度)
埃默森青霉GH61A和金黄色嗜热子囊菌GH61A多肽变体的蛋白质热解折叠使用宝石橙蛋白染色试剂进行监测并且如实例10中所述使用StepOnePlusTM实时PCR系统执行。如实例15中所述将埃默森青霉GH61A野生型多肽和埃默森青霉GH61A多肽变体浓缩并且缓冲液交换。如实例16中所述纯化金黄色嗜热子囊菌GH61A野生型多肽和金黄色嗜热子囊菌GH61A多肽变体。热稳定性测定的结果在表10中示出。
表10通过蛋白质热解折叠分析得到的埃默森青霉GH61A和金黄色嗜热子囊菌GH61A多肽变体的解链温度(℃)
实例19:表达载体pDFng153-4、pDFng154-17、以及pDFng155-33的构建
如以下所述构建质粒pDFng153-4(图7)、pDFng154-17(图8)、以及pDFng155-33(图9),用于分别表达金黄色嗜热子囊菌GH61A多肽、埃默森青霉GH61A多肽、以及棘孢曲霉GH61多肽,并且生成在表11中列出的变体。使用质粒pBGMH16(图10)构建这些质粒。
根据以下所述的方案构建质粒pBGMH16。通过用引物对BGMH24/BGMH25对pUC19进行PCR扩增,其后进行基于尿嘧啶特异性切除试剂USERTM的克隆(纽英伦生物技术(NewEngland BioLabs),美国麻萨诸塞州伊普斯威奇(Ipswich,MA,USA))来去除pUC19中的Nb.BtsI识别位点。质粒pUC19在杨尼斯-佩龙(Yanisch-Perron)等人,1985,基因(Gene)3(1):103-19中描述。
BGMH 24 <u>ATGCAGCGCU</u>GCCATAACCATGAGTGA(SEQ ID NO:271)
BGMH 25 <u>AGCGCTGCAU</u>AATTCTCTTACTGTCATG(SEQ ID NO:272)
加下划线的序列用于PCR片段的USERTM辅助融合,从而产生pBGMH13。USERTM(尿嘧啶特异性切除试剂)酶(纽英伦生物技术,美国麻萨诸塞州伊普斯威奇)在尿嘧啶的位置处生成单一核苷酸缺口。USERTM酶是尿嘧啶DNA糖基化酶(UDG)和DNA糖基化酶-裂解酶内切核酸酶VIII的混合物。UDG催化尿嘧啶碱基的切除,从而形成无碱基(脱嘧啶)位点,而保持磷酸二酯骨架的完整。内切核酸酶VIII的裂解酶活性在碱基位点的3′和5′侧破坏磷酸二酯骨架,这样使得释放无碱基的脱氧核糖。
最终体积为50μl的扩增反应由以下组成:100ng的每种引物、10ng的pUC19、1XCx反应缓冲液(Stratagene,美国加州拉霍亚)、2.5μl的dATP、dTTP、dGTP、以及dCTP的共混物(各以10mM)、以及2.5单位的Cx热启动DNA聚合酶(Stratagene,美国加州拉霍亚)。使用5333执行反应,其被编程为:1个循环,在95℃下持续2分钟;32个循环,每个循环在95℃下持续30秒、55℃下持续30秒、以及72℃下持续3分钟;以及最终延长,在72℃下持续7分钟。添加5μl的10X NEBuffer 4(纽英伦生物技术有限公司,美国麻萨诸塞州伊普斯威奇)和20单位的Dpn I,并且在37℃下孵育1小时。在80℃下持续20分钟使Dpn I失活。将总体积为10μl的总共100ng的PCR产物和1单位的USERTM酶在37℃下孵育20分钟,接着在25℃下20分钟。将10μl转化到ONETOP10感受态细胞中。这产生质粒pBHMG13。
质粒pBGMH14含有作为载体骨架的pBGMH13的部分和一个Pac I/Nt.BbvCI USERTM盒(汉森(Hansen等人,2011,应用与环境微生物学77(9):3044-51),该盒在一侧侧接米曲霉niaD基因的部分并且在另一侧侧接米曲霉niiA基因的部分。可以用Pac I和Nt.BbvCI使PacI/Nt.BbvCI USERTM盒线性化,并且具有相容的突出端的PCR产物可以克隆到这个位点(纽英伦生物技术有限公司,美国麻萨诸塞州伊普斯威奇)。
加下划线的序列用于三种片段的USERTM辅助融合。以粗体标记的序列用于在niiA与niaD片段之间引入PacI/Nt.BbvCI USERTM盒(汉森等人,2011,见上文)。
使用引物BGMH27和BGMH29生成米曲霉niiA片段。引物对BGMH28/BGMH32用于扩增米曲霉niaD基因区,而引物对BGMH30/BGMH31用于扩增质粒骨架区。
来自米曲霉BECH2的基因组DNA(WO 00/39322)使用FASTDNATM 2ml SPIN Kit forSoil(安倍生物医疗(MP Biomedicals),美国加州圣安娜(Santa Ana,California,USA))进行纯化。
最终体积为50μl的扩增反应由以下组成:100ng的每种引物、模板DNA(pBGMH13或米曲霉BECH2基因组DNA)、1XCx反应缓冲液、2.5μl的dATP、dTTP、dGTP、以及dCTP的共混物(各以10mM)、以及2.5单位的Cx热启动DNA聚合酶。使用 5333执行反应,其被编程为:1个循环,在95℃下持续2分钟;32个循环,每个循环在95℃下持续30秒、55℃下持续30秒、以及72℃下持续4分钟;以及最终延长,在72℃下持续10分钟。对于模板DNA为质粒的PCR管,添加5μl的10XNEBuffer 4和20单位的Dpn I,并且在37℃下孵育1小时。在80℃下持续20分钟使Dpn I失活。将总体积为10μl的总共50ng的每种PCR产物和1单位的USERTM酶在37℃下孵育20分钟,接着在25℃下20分钟。接着将10μl转化到ONETOP10感受态细胞中。通过基于尿嘧啶特异性切除试剂的克隆融合这三种片段,从而产生pBGMH14。
启动子P13amy是来自pJaL676(WO 2003/008575)的NA-2tpi启动子的衍生物。使用的黑曲霉AMG终止子由克里斯滕森等人,1988,自然生物技术(Nature Biotechnology)6:141-1422描述。
将P13amy启动子和AMG终止子克隆到pBGMH14中的PacI/Nt.BbvCI USERTM盒中。设计引物,以使在启动子和终止子之间引入AsiSI/Nb.BtsI USERTM盒(汉森等人,2011,见上文)。
加下划线的序列用于两种片段到PacI/Nt.BbvCI消化的pBGMH14中的USERTM辅助的融合。以粗体标记的序列用于在启动子与终止子之间引入AsiSI/Nb.BtsI USERTM盒(汉森等人,2011,见上文)。
使用用以扩增启动子P13amy的引物对BGMH49/BGMH50和用以扩增AMG终止子的引物对BGMH51/BGMH52对启动子P13amy和AMG终止子进行PCR扩增。最终体积为50μl的扩增反应由以下组成:100ng的每种引物、模板DNA、1XCx反应缓冲液、2.5μl的dATP、dTTP、dGTP、以及dCTP的共混物(各以10mM)、以及2.5单位的Cx热启动DNA聚合酶。使用5333执行反应,其被编程为:1个循环,在95℃下持续2分钟;32个循环,每个循环在95℃下持续30秒、55℃下持续30秒、以及72℃下持续45秒;以及最终延长,在72℃下持续3分钟。接着添加5μl的10X NEBuffer 4和20单位的Dpn I并且在37℃下孵育1小时。在80℃下持续20分钟使Dpn I失活。
这两种片段通过基于USERTM的克隆方法,在总体积为10μl的由10ng的PacI/Nt.BbvCI消化的pBGMH14、50ng的两种PCR产物中的每一种、以及1单位的USERTM酶组成的反应中融合到PacI/Nt.BbvCI消化的pBGMH14中。该反应在37℃下孵育20分钟,接着在25℃下20分钟。接着将10μl转化到ONETOP10感受态细胞中。在2XYT+Amp琼脂平板上选择大肠杆菌转化体并且使用Spin Miniprep试剂盒(凯杰有限公司,美国加州瓦伦西亚)制备质粒DNA。通过测序分析证实质粒pBGMH16。
使用Model 377XL自动DNA测序仪和染料终止子化学(吉塞克等人,1992,见上文)执行DNA测序。用于BGMH16中的niiA、niaD、P13amy启动子、AsiSI/Nb.BtsI USERTM盒、以及AMG终止子序列的验证的测序引物在以下示出。
质粒pBGMH16含有设计成修复米曲霉COLs1300中的niiA基因和niaD基因的侧翼区。用Asi Si和Nb Bts I消化质粒pBGMH16,以使该质粒线性化并且产生单链突出端,这样使得具有相容突出端的PCR产物可以通过USERTM克隆(纽英伦生物技术有限公司,美国麻萨诸塞州伊普斯威奇)克隆到这个位点。使用DNA纯化试剂盒(凯杰有限公司,美国加州瓦伦西亚)根据制造商的说明纯化消化的质粒。
使用表11中示出的引物由以下描述的源质粒扩增金黄色嗜热子囊菌GH61A多肽编码序列(SEQ ID NO:13[基因组DNA序列]和SEQ ID NO:14[推导的氨基酸序列])、埃默森青霉GH61A多肽编码序列(SEQ ID NO:35[基因组DNA序列]和SEQ ID NO:36[推导的氨基酸序列])、以及棘孢曲霉GH61多肽编码序列(SEQ ID NO:67[基因组DNA序列]和SEQ ID NO:68[推导的氨基酸序列])。粗体字母代表编码序列。插入到每个引物中的单个脱氧尿苷(U)残基是使用USERTM酶(纽英伦生物技术有限公司,美国麻萨诸塞州伊普斯威奇)从PCR产物切除的U,以获得用于插入位点的突出端。加下划线的字母代表His标签。其余序列与用于表达GH61多肽的pBGMH16的插入位点同源。
表11
以下描述含有金黄色嗜热子囊菌GH61A多肽编码序列的质粒pDFng153-4的构建。使用表11中示出的具有被设计用于克隆到质粒pBGMH16中的突出端的引物、由质粒pDFng113扩增金黄色嗜热子囊菌GH61A多肽编码序列。最终体积为50μl的扩增由以下组成:100ng的在表11中列出的每种引物、30ng的pDFng113、1XCx反应缓冲液、2.5μl的dATP、dTTP、dGTP、以及dCTP的共混物(各以10mM)、以及2.5单位的Cx热启动DNA聚合酶。使用 5333执行扩增,其被编程为:1个循环,在95℃下持续2分钟;30个循环,每个循环在95℃下持续30秒、57.7℃下持续30秒、以及72℃下持续1.5分钟;以及最终延长,在72℃下持续10分钟。接着将加热块进行10℃浸泡循环。
通过使用TBE缓冲液的0.7%琼脂糖凝胶电泳对PCR反应进行分析,其中观察到约894bp PCR产物条带。接着用1μl的Dpn I和4.5μl的NEBuffer 4在37℃下将PCR反应消化过夜并且使用纯化试剂盒根据制造商的说明进行纯化。
在由含有894bp PCR产物的10μl的PCR、1μl的AsiSI和Nb.BtsI消化的质粒pBGMH16、以及1μl的USERTM酶(纽英伦生物技术有限公司,美国麻萨诸塞州伊普斯威奇)组成的反应中将894bp PCR反应以及AsiSI和Nb.BtsI消化的pBGMH16的同源末端接合在一起。该反应在37℃下孵育15分钟,接着在25℃下15分钟。根据制造商的说明将10μl的反应转化到大肠杆菌超级感受态细胞中。在2XYT+Amp琼脂平板上对大肠杆菌转化体进行选择。使用9600自若干所得大肠杆菌转化体制备质粒DNA。金黄色嗜热子囊菌GH61A多肽编码序列插入物使用Model 377XL自动DNA测序仪和染料终止子化学(吉塞克等人,1992,见上文),通过DNA测序来证实。以下示出的测序引物用于基因插入物和序列的验证。
引物TaGH61seqF:
CCCAGTTATCAACTACCTTG(SEQ ID NO:309)
引物pBGMH16seqF:
CTCAATTTACCTCTATCCAC(SEQ ID NO:310)
引物pBGMH16seqR:
TATAACCAATTGCCCTCATC(SEQ ID NO:311)
选择含有正确的金黄色嗜热子囊菌GH61A多肽编码序列的质粒并且命名为pDFng153-4。
以下描述含有埃默森青霉GH61A多肽编码序列的质粒pDFng154-17的构建。使用表11中示出的具有被设计用于克隆到质粒pBGMH16中的突出端的引物、由质粒pMMar45扩增埃默森青霉GH61A多肽编码序列。最终体积为50μl的扩增由以下组成:100ng的在表11中列出的每种引物、30ng的pMMar45、1XCx反应缓冲液、2.5μl的dATP、dTTP、dGTP、以及dCTP的共混物(各以10mM)、以及2.5单位的Cx热启动DNA聚合酶。使用5333执行扩增,其被编程为:1个循环,在95℃下持续2分钟;30个循环,在95℃下持续30秒、64.1℃下持续30秒、以及72℃下持续1.5分钟;以及最终延长,在72℃下持续10分钟。接着将加热块进行10℃浸泡循环。
通过使用TBE缓冲液的0.7%琼脂糖凝胶电泳对PCR反应进行分析,其中观察到大约930bp PCR产物条带。接着用1μl的Dpn I和4.5μl的NEBuffer 4在37℃下将PCR反应消化过夜并且使用纯化试剂盒根据制造商的说明进行纯化。
在由含有930bp PCR产物的10μl的PCR、1μl的AsiSI和Nb.BtsI消化的pBGMH16、以及1μl的USERTM酶组成的反应中将930bp PCR反应以及AsiSI和Nb.BtsI消化的pBGMH16的同源末端接合在一起。该反应在37℃下孵育15分钟,接着在25℃下15分钟。根据制造商的说明将10μl的反应转化到大肠杆菌超级感受态细胞中。在2XYT+Amp琼脂平板上对大肠杆菌转化体进行选择。使用9600自若干所得大肠杆菌转化体制备质粒DNA。埃默森青霉GH61A多肽编码序列插入物使用Model 377XL自动DNA测序仪和染料终止子化学(吉塞克等人,1992,见上文),通过DNA测序来证实。测序引物pBGMH16seqF和pBGMH16seqR以及以下示出的引物PeGH61seqF用于基因插入物和序列的验证。
PeGH61seqF:
GCACCGTCGAGCTGCAGTGG(SEQ ID NO:312)
选择含有正确的埃默森青霉GH61A多肽编码序列的质粒并且命名为pDFng154-17。
以下描述含有棘孢曲霉GH61A多肽编码序列的质粒pDFng155-33的构建。使用表11中示出的具有被设计用于克隆到质粒pBGMH16中的突出端的引物、由质粒Xyz1566(WO2012/030799,实例3,P23NJ4基因)扩增棘孢曲霉GH61A多肽编码序列。最终体积为50μl的扩增反应由以下组成:100ng的在表11中列出的每种引物、30ng的质粒Xyz1566、1XCx反应缓冲液、2.5μl的dATP、dTTP、dGTP、以及dCTP的共混物(各以10mM)、以及2.5单位的Cx热启动DNA聚合酶。使用 5333(艾本德科技有限公司)执行扩增,其被编程为:1个循环,在95℃下持续2分钟;30个循环,每个循环在95℃下持续30秒、63.4℃下持续30秒、以及72℃下持续1.5分钟;以及最终延长,在72℃下持续10分钟。接着将加热块进行10℃浸泡循环。
通过使用TBE缓冲液的0.7%琼脂糖凝胶电泳对PCR反应进行分析,其中观察到大约1.3kb PCR产物条带。接着用1μl的Dpn I和4.5μl的NEBuffer 4在37℃下将PCR反应消化过夜并且使用纯化试剂盒根据制造商的说明进行纯化。
在由含有1.3kb PCR产物的10μl的PCR、1μl的消化的pBGMH16、以及1μl的USERTM酶组成的反应中将1.3kb PCR反应以及消化的pBGMH16的同源末端接合在一起。该反应在37℃下孵育15分钟,接着在25℃下15分钟。根据制造商的说明将10μl的反应转化到大肠杆菌超级感受态细胞中。在2XYT+Amp琼脂平板上对大肠杆菌转化体进行选择。使用9600自若干所得大肠杆菌转化体制备质粒DNA。棘孢曲霉GH61A多肽编码序列插入物使用Model 377XL自动DNA测序仪和染料终止子化学(吉塞克等人,1992,见上文),通过DNA测序来证实。以下示出的测序引物pBGMH16seqF和pBGMH16seqR以及引物AaGH61seqF用于基因插入物和序列的验证。
引物AaGH61seqF:
CCTTGCCAACTGCAATGGTG(SEQ ID NO:313)
选择含有正确的棘孢曲霉GH61A多肽编码序列的质粒并且命名为pDFng155-33。
实例20:金黄色嗜热子囊菌GH61A和埃默森青霉GH61A多肽变体的构建
通过使用表12中所述的引物,根据实例7中所述的程序,分别在质粒pDFng153-4和pDFng154-17上执行定点诱变来构建金黄色嗜热子囊菌GH61A的变体和埃默森青霉GH61A多肽的变体。
测序引物pBGMH16seqF、pBGMH16seqR、以及TaGH61seqF(仅用于金黄色嗜热子囊菌GH61A变体)、以及以下示出的引物PeGH61seqR(仅用于埃默森青霉GH61A变体)用于验证。
PeGH61seqR(仅用于埃默森青霉GH61A变体):
GCACCGTCGAGCTGCAGTGG(SEQ ID NO:314)
表12
由用于米曲霉COLs1300转化的突变质粒、金黄色嗜热子囊菌GH61A多肽质粒pDFng153-4和埃默森青霉GH61A多肽质粒pDFng154-17扩增PCR片段。最终体积为50μl的扩增由以下组成:10μM的引物1201513和1201514中的每一种(参见下文)、10ng的pDFng153-4、pDFng154-17、或一种突变质粒中的任一个、5X 高保真度缓冲液(纽英伦生物技术有限公司,美国麻萨诸塞州伊普斯威奇)、1μl的dATP、dTTP、dGTP、以及dCTP的共混物(各以10mM)、以及0.5μl的高保真度DNA聚合酶(纽英伦生物技术有限公司,美国麻萨诸塞州伊普斯威奇)。对于pDFng154-17和埃默森青霉GH61多肽突变质粒,还添加1.5μl的DMSO。使用 5333执行扩增,其被编程为:1个循环,在98℃下持续30秒;10个循环,每个循环在98℃下持续10秒、65℃下(每循环减1℃)持续30秒、以及72℃下持续3分钟;25个循环,每个循环在98℃下持续10秒、55℃下30秒、以及72℃下持续3分钟;以及最终延长,在72℃下持续10分钟。接着将加热块进行10℃浸泡循环。
引物1201513:
CCAGACCAGCAGAGGAGATAATACT(SEQ ID NO:323)
引物1201514:
CAAGGATACCTACAGTTATTCGA(SEQ ID NO:324)
每种PCR反应通过使用TBE缓冲液的0.7%琼脂糖凝胶电泳进行分析,其中观察到来自金黄色嗜热子囊菌的7718bp PCR产物或来自埃默森青霉的7754bp PCR产物。接着用1μl的Dpn I和4.5μl的NEBuffer 4在37℃下将PCR反应消化过夜并且使用纯化试剂盒根据制造商的说明进行纯化。
实例21:棘孢曲霉GH61多肽变体的构建
通过SOE-PCR(通过突出端延伸聚合酶链式反应剪接)用质粒pDFng155-33构建棘孢曲霉GH61多肽变体。简单地说,第一PCR反应使用了正向引物BGMH110V2F和突变特异性反向引物(表13)。第二PCR反应使用了反向引物BGMH109V2R和含有编码改变的氨基酸的序列的突变特异性正向引物(表13)。突变特异性正向和反向引物含有15-20个重叠核苷酸。第三PCR反应使用了重叠核苷酸来共同剪接第一和第二反应中产生的片段。最后,使用正向引物BGMH110V2F和反向引物BGMH109V2R,通过PCR扩增剪接的片段。
引物BGMH110V2F:
5’-CCAGACCAGCAGAGGAGATAATACTCTGCG-3’(SEQ ID NO:325)
引物BGMH109V2R:
5’-CAAGGATACCTACAGTTATTCGAAACCTCCTG-3’(SEQ ID NO:326)
用于棘孢曲霉GH61多肽变体的最终反应体积为50μl的第一SOE-PCR反应含有0.5皮摩尔的BGMH110V2F引物、0.5皮摩尔的在表13中列出的反向引物、50ng的模板(pDFng155-33)、5纳摩尔的dATP、dTTP、dGTP、以及dCTP中的每一个,1X高保真度缓冲液、以及0.7单位的高保真度DNA聚合酶。使用Gradient(艾本德科技有限公司,美国纽约韦斯特伯里)执行扩增,其被编程为:1个循环,在98℃下持续2分钟;35个循环,每个循环在98℃下持续25秒、66℃下持续30秒、以及72℃下持续5分钟;以及最终延长,在72℃下持续10分钟。接着将加热块进行10℃保持阶段。
用于棘孢曲霉GH61变体的最终反应体积为50μl的第二SOE-PCR反应含有0.5皮摩尔的在表13中列出的正向引物、0.5皮摩尔的BGMH109V2R引物、50ng的模板(pDFng155-33)、5纳摩尔的dATP、dTTP、dGTP、以及dCTP中的每一个,1X高保真度缓冲液、以及0.7单位的高保真度DNA聚合酶。使用Gradient执行扩增,其被编程为:1个循环,在98℃下持续2分钟;35个循环,每个循环在98℃下持续25秒、66℃下持续30秒、以及72℃下持续5分钟;以及最终延长,在72℃下持续10分钟。接着将加热块进行10℃保持阶段。
每种PCR反应通过使用TAE缓冲液的1.0%琼脂糖电泳进行分析,其中观察到一个3.9至6.5kb(如表13中指明)PCR产物条带,指示正确扩增。接着将剩余的45微升用10单位的Dpn I和1X NEB4进行处理,以去除剩余的野生型模板。该反应在37℃下孵育1小时并且接着使用96UF纯化试剂盒(凯杰有限公司,美国加州瓦伦西亚)进行纯化。将纯化的PCR产物重悬于去离子水中,补足至等于20μl的最终体积。每种片段的浓度使用NanoDrop 2000(塞默科技(Thermo Scientific),美国北卡罗来纳州威尔明顿(Wilmington,DE,USA))进行测量。
用于棘孢曲霉GH61变体的最终反应体积为50μl的第三PCR反应含有100至200ng的在第一和第二SOE-PCR反应中产生的每种片段、5纳摩尔的dATP、dTTP、dGTP、以及dCTP中的每一个,1X高保真度缓冲液、以及0.7单位的高保真度DNA聚合酶。使用 Gradient执行扩增,其被编程为:1个循环,在98℃下持续2分钟;35个循环,每个循环在98℃下持续15秒、68℃下持续30秒、以及72℃下持续10分钟;以及最终延长,在72℃下持续10分钟。接着将加热块进行10℃保持阶段。在第五循环的退火/延长步骤期间添加引物BGMH110V2F引物(0.5皮摩尔)和引物BGMH109V2R(0.5皮摩尔),以允许重叠核苷酸剪接。
使用类似于第三PCR反应的条件产生野生型片段。最终反应体积为50μl的该反应由以下组成:50ng的模板(pDFng155-33)、0.5皮摩尔的引物BGMH110V2F、0.5皮摩尔的引物BGMH109V2R、5纳摩尔dATP、dTTP、dGTP、以及dCTP中的每一个,1X高保真度缓冲液、以及0.7单位高保真度DNA聚合酶。使用 Gradient执行扩增,其被编程为:1个循环,在98℃下持续2分钟;35个循环,每个循环在98℃下持续15秒、68℃下持续30秒、以及72℃下持续10分钟;以及最终延长,在72℃下持续10分钟。接着将加热块进行10℃保持阶段。
通过使用TAE缓冲液的1.0%琼脂糖电泳对每种PCR反应进行分析,其中观察到大约8kb PCR产物条带,指示正确扩增。接着使用96UF纯化试剂盒纯化剩余的45μl的每种PCR反应。将纯化的PCR产物重悬于去离子水中,补足至等于20μl的最终体积。每种片段的浓度使用NanoDrop 2000进行测量。然后如实例22中所述将整个体积转化到米曲霉COLs1300菌株中。
表13
实例22:金黄色嗜热子囊菌GH61A、埃默森青霉GH61A、以及棘孢曲霉GH61多肽变体在米曲霉COLs1300中的表达
将米曲霉COLs1300在含有10mM尿苷的COVE-N-Gly平板上接种并且在34℃下孵育直到汇合。通过用10ml的YP培养基洗涤从该平板收集孢子。将全部孢子悬浮液用于接种500ml聚碳酸盐摇瓶中的101ml的COL1300原生质体化培养基。将该摇瓶在30℃下孵育,并且在200rpm下振荡18-24小时。通过衬有的漏斗过滤菌丝体并且用200ml的0.6M MgSO4洗涤。将洗涤的菌丝体在125ml无菌聚碳酸盐摇瓶中的10ml的COLs1300原生质体化溶液中重悬并且在室温下孵育3分钟。向摇瓶中添加12mg BSA/ml去离子水的溶液1ml,并且接着将该摇瓶在37℃下、在以65rpm混合下孵育45-90分钟,直到原生质体化完成。通过衬有的漏斗将菌丝体/原生质体混合物过滤在50ml锥形管中,并且用5ml的ST覆盖。在低加速/减速下将该50ml锥形管在1050x g下离心15分钟。离心后,液体被分成3相。将含有原生质体的中间相转移到新的50ml锥形管。在1050x g下简短离心5分钟之后,向原生质体中添加两体积的STC。弃去上清液,并且在重悬原生质体沉淀、在1050xg下离心5分钟、并且每次撇出上清液的情况下,用5ml的STC洗涤原生质体两次。在最终撇出后,在STC中在5×107/ml浓度下重悬原生质体沉淀。在转化之前将原生质体冰冻于-80℃。
如实例21中所述,将15μl体积的每种突变片段用于转化15ml圆底管中的100μl米曲霉COLs1300原生质体。在室温下初始孵育15分钟之后,向含有转化混合物的15ml圆底管中添加300μl的PEG溶液。该反应在室温下再孵育15分钟。向该反应中添加6ml的熔化的顶层琼脂并且将全部混合物均匀地倒在补充有10mM NaNO3的蔗糖琼脂平板上,并且留放在室温下直到顶层琼脂凝固。将这些平板在37℃下孵育4-6天。使用无菌接种环挑取所得的转化体并且接种到每孔含有200μl的MDU2BP的96孔平底平板中。该平板在34℃下在加湿箱中静止孵育。在第五天,通过去除菌丝体面收获样品。
实例23:通过蛋白质热解折叠分析测定金黄色嗜热子囊菌GH61A、埃默森青霉GH61A、以及棘孢曲霉GH61多肽变体的Tm(解链温度)
金黄色嗜热子囊菌GH61A、埃默森青霉GH61A、以及棘孢曲霉GH61多肽变体的蛋白质热解折叠通过根据实例10中所述的蛋白质热解折叠分析进行测定。金黄色嗜热子囊菌GH61A、埃默森青霉GH61A、以及棘孢曲霉GH61多肽变体以及其野生型多肽如实例22中所述进行制备。热稳定性测定的结果在表14中示出。
表14通过蛋白质热解折叠分析测定的金黄色嗜热子囊菌GH61A、埃默森青霉GH61A、以及棘孢曲霉GH61多肽变体的解链温度(℃)
蛋白质骨架 突变 Tm
金黄色嗜热子囊菌GH61 野生型 75
金黄色嗜热子囊菌GH61 Q188F 78
金黄色嗜热子囊菌GH61 Q188M 76
埃默森青霉GH61 野生型 71
埃默森青霉GH61 N192M 74
埃默森青霉GH61 N193H 73
棘孢曲霉GH61 野生型 46
棘孢曲霉GH61 D103K 48
棘孢曲霉GH61 D103P 48
棘孢曲霉GH61 N152I 48
棘孢曲霉GH61 N152L 49
棘孢曲霉GH61 G186F 51
棘孢曲霉GH61 G186M 51
棘孢曲霉GH61 G186A 48
棘孢曲霉GH61 G186W 49
棘孢曲霉GH61 N187H 48
棘孢曲霉GH61 N187K 48
通过以下编号的段落进一步描述本发明:
[1]一种GH61多肽变体,包含在与30的成熟多肽的位置105、154、188、189、216、以及229相对应的一个或多个位置处的取代,其中该变体具有纤维素分解增强活性。
[2]如段落1所述的变体,该变体与亲本GH61多肽的氨基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%、但少于100%的序列一致性。
[3]如段落1或2中任一项所述的变体,该变体是选自由以下各项组成的组的具有纤维素分解增强活性的亲本GH61多肽的变体:(a)与SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、或180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、或216的成熟多肽具有至少60%序列一致性的多肽;(b)由在至少低严谨度条件下与以下杂交的多核苷酸编码的多肽:(i)SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、或179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、或215的成熟多肽编码序列,或(ii)(i)的全长互补体;(c)由与SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、或179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、或215的成熟多肽编码序列具有至少60%的序列一致性的多核苷酸编码的多肽;(d)SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、或180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、或216的成熟多肽的片段。
[4]如段落3所述的变体,其中该亲本GH61多肽与SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、或180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、或216的成熟多肽具有至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性。
[5]如段落3所述的变体,其中该亲本GH61多肽由在低严谨度条件下、中等严谨度条件下、中-高等严谨度条件下、高严谨度条件下、或极高严谨度条件下与以下杂交的多核苷酸编码:(i)SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、或179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、或215的成熟多肽编码序列、或(ii)(i)的全长互补体。
[6]如段落3所述的变体,其中该亲本GH61多肽由一个多核苷酸编码,该多核苷酸与SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、或179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、或215的成熟多肽编码序列具有至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性。
[7]如段落3所述的变体,其中该亲本GH61多肽包含SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、或180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、或216的成熟多肽,或由其组成。
[8]如段落3所述的变体,其中该亲本GH61多肽是SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、或179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、或215的成熟多肽的片段,其中该片段具有纤维素分解增强活性。
[9]如段落1-8中任一项所述的变体,该变体与SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、或180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、或216的成熟多肽具有至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%、但是少于100%的序列一致性。
[10]如段落2-9中任一项所述的变体,其中该变体由该亲本GH61多肽的成熟多肽的至少85%的氨基酸残基,例如至少90%的氨基酸残基或至少95%的氨基酸残基组成。
[11]如段落1-10中任一项所述的变体,其中取代的数目为1-6个,例如,1、2、3、4、5、或6个取代。
[12]如段落1-11中任一项所述的变体,该变体包含在与位置105相对应的位置处的取代。
[13]如段落12所述的变体,其中该取代是Pro或Lys。
[14]如段落1-13中任一项所述的变体,该变体包含在与位置154相对应的位置处的取代。
[15]如段落14所述的变体,其中该取代是Ile或Leu。
[16]如段落1-15中任一项所述的变体,该变体包含在与位置188相对应的位置处的取代。
[17]如段落16所述的变体,其中该取代是Ala、Met、Phe、或Trp。
[18]如段落1-17中任一项所述的变体,该变体包含在与位置189相对应的位置处的取代。
[19]如段落18所述的变体,其中该取代是His或Lys。
[20]如段落1-19中任一项所述的变体,该变体包含在与位置216相对应的位置处的取代。
[21]如段落20所述的变体,其中该取代是Leu或Tyr。
[22]如段落1-21中任一项所述的变体,该变体包含在与位置229相对应的位置处的取代。
[23]如段落22所述的变体,其中该取代是Trp、His、Ile、或Tyr。
[24]如段落1-23中任一项所述的变体,该变体包含在与位置105、154、188、189、216、以及229中的任何一个相对应的两个位置处的取代。
[25]如段落1-23中任一项所述的变体,该变体包含在与位置105、154、188、189、216、以及229中的任何一个相对应的三个位置处的取代。
[26]如段落1-23中任一项所述的变体,该变体包含在与位置105、154、188、189、216、以及229中的任何一个相对应的四个位置处的取代。
[27]如段落1-23中任一项所述的变体,该变体包含在与位置105、154、188、189、216、以及229中的任何一个相对应的五个位置处的取代。
[28]如段落1-23中任一项所述的变体,该变体包含在与位置105、154、188、189、216、以及229相对应的每个位置处的取代。
[29]如段落1-28中任一项所述的变体,该变体包含选自由以下各项组成的组的一个或多个取代或相对应的取代:E105P,K;E154I,L;G188A,F,M,W;N189H,K;A216L,Y;以及K229W,H,I,Y。
[30]如段落1-29中任一项所述的变体,该变体包含取代E105P,K和E154I,L;或其相对应的取代。
[31]如段落1-29中任一项所述的变体,该变体包含取代E105P,K和G188A,F,M,W;或其相对应的取代。
[32]如段落1-29中任一项所述的变体,该变体包含取代E105P,K和N189H,K;或其相对应的取代。
[33]如段落1-29中任一项所述的变体,该变体包含取代E105P,K和A216L,Y;或其相对应的取代。
[34]如段落1-29中任一项所述的变体,该变体包含取代E105P,K和K229W,H,I,Y;或其相对应的取代。
[35]如段落1-29中任一项所述的变体,该变体包含取代E154I,L和G188A,F,M,W;或其相对应的取代。
[36]如段落1-29中任一项所述的变体,该变体包含取代E154I,L和N189H,K;或其相对应的取代。
[37]如段落1-29中任一项所述的变体,该变体包含取代E154I,L和A216L,Y;或其相对应的取代。
[38]如段落1-29中任一项所述的变体,该变体包含取代E154I,L和K229W,H,I,Y;或其相对应的取代。
[39]如段落1-29中任一项所述的变体,该变体包含取代G188A,F,M,W和N189H,K;或其相对应的取代。
[40]如段落1-29中任一项所述的变体,该变体包含取代G188A,F,M,W和A216L,Y;或其相对应的取代。
[41]如段落1-29中任一项所述的变体,该变体包含取代G188A,F,M,W和K229W,H,I,Y;或其相对应的取代。
[42]如段落1-29中任一项所述的变体,该变体包含取代N189H,K和A216L,Y;或其相对应的取代。
[43]如段落1-29中任一项所述的变体,该变体包含取代N189H,K和K229W,H,I,Y;或其相对应的取代。
[44]如段落1-29中任一项所述的变体,该变体包含取代A216L,Y和K229W,H,I,Y;或其相对应的取代。
[45]如段落1-29中任一项所述的变体,该变体包含取代E105P,K;E154I,L;以及G188A,F,M,W;或其相对应的取代。
[46]如段落1-29中任一项所述的变体,该变体包含取代E105P,K;E154I,L;以及N189H,K;或其相对应的取代。
[47]如段落1-29中任一项所述的变体,该变体包含取代E105P,K;E154I,L;以及A216L,Y;或其相对应的取代。
[48]如段落1-29中任一项所述的变体,该变体包含取代E105P,K;E154I,L;以及K229W,H,I,Y;或其相对应的取代。
[49]如段落1-29中任一项所述的变体,该变体包含取代E105P,K;G188A,F,M,W;以及N189H,K;或其相对应的取代。
[50]如段落1-29中任一项所述的变体,该变体包含取代E105P,K;G188A,F,M,W;以及A216L,Y;或其相对应的取代。
[51]如段落1-29中任一项所述的变体,该变体包含取代E105P,K;G188A,F,M,W;以及K229W,H,I,Y;或其相对应的取代。
[52]如段落1-29中任一项所述的变体,该变体包含取代E105P,K;N189H,K;以及A216L,Y;或其相对应的取代。
[53]如段落1-29中任一项所述的变体,该变体包含取代E105P,K;N189H,K;以及K229W,H,I,Y;或其相对应的取代。
[54]如段落1-29中任一项所述的变体,该变体包含取代E105P,K;A216L,Y;以及K229W,H,I,Y;或其相对应的取代。
[55]如段落1-29中任一项所述的变体,该变体包含取代E154I,L;G188A,F,M,W;以及N189H,K;或其相对应的取代。
[56]如段落1-29中任一项所述的变体,该变体包含取代E154I,L;G188A,F,M,W;以及A216L,Y;或其相对应的取代。
[57]如段落1-29中任一项所述的变体,该变体包含取代E154I,L;G188A,F,M,W;以及K229W,H,I,Y;或其相对应的取代。
[58]如段落1-29中任一项所述的变体,该变体包含取代E154I,L;N189H,K;以及A216L,Y;或其相对应的取代。
[59]如段落1-29中任一项所述的变体,该变体包含取代E154I,L;N189H,K;以及K229W,H,I,Y;或其相对应的取代。
[60]如段落1-29中任一项所述的变体,该变体包含取代E154I,L;A216L,Y;以及K229W,H,I,Y;或其相对应的取代。
[61]如段落1-29中任一项所述的变体,该变体包含取代G188A,F,M,W;N189H,K;以及A216L,Y;或其相对应的取代。
[62]如段落1-29中任一项所述的变体,该变体包含取代G188A,F,M,W;N189H,K;以及K229W,H,I,Y;或其相对应的取代。
[63]如段落1-29中任一项所述的变体,该变体包含取代G188A,F,M,W;A216L,Y;以及K229W,H,I,Y;或其相对应的取代。
[64]如段落1-29中任一项所述的变体,该变体包含取代N189H,K;A216L,Y;以及K229W,H,I,Y;或其相对应的取代。
[65]如段落1-29中任一项所述的变体,该变体包含取代E105P,K;E154I,L;G188A,F,M,W;以及N189H,K;或其相对应的取代。
[66]如段落1-29中任一项所述的变体,该变体包含取代E105P,K;E154I,L;G188A,F,M,W;以及A216L,Y;或其相对应的取代。
[67]如段落1-29中任一项所述的变体,该变体包含取代E105P,K;E154I,L;G188A,F,M,W;以及K229W,H,I,Y;或其相对应的取代。
[68]如段落1-29中任一项所述的变体,该变体包含取代E105P,K;E154I,L;N189H,K;以及A216L,Y;或其相对应的取代。
[69]如段落1-29中任一项所述的变体,该变体包含取代E105P,K;E154I,L;N189H,K;以及K229W,H,I,Y;或其相对应的取代。
[70]如段落1-29中任一项所述的变体,该变体包含取代E105P,K;E154I,L;A216L,Y;以及K229W,H,I,Y;或其相对应的取代。
[71]如段落1-29中任一项所述的变体,该变体包含取代E105P,K;G188A,F,M,W;N189H,K;以及A216L,Y;或其相对应的取代。
[72]如段落1-29中任一项所述的变体,该变体包含取代E105P,K;G188A,F,M,W;N189H,K;以及K229W,H,I,Y;或其相对应的取代。
[73]如段落1-29中任一项所述的变体,该变体包含取代E105P,K;G188A,F,M,W;A216L,Y;以及K229W,H,I,Y;或其相对应的取代。
[74]如段落1-29中任一项所述的变体,该变体包含取代E105P,K;N189H,K;A216L,Y;以及K229W,H,I,Y;或其相对应的取代。
[75]如段落1-29中任一项所述的变体,该变体包含取代E154I,L;G188A,F,M,W;N189H,K;以及A216L,Y;或其相对应的取代。
[76]如段落1-29中任一项所述的变体,该变体包含取代E154I,L;G188A,F,M,W;N189H,K;以及K229W,H,I,Y;或其相对应的取代。
[77]如段落1-29中任一项所述的变体,该变体包含取代E154I,L;G188A,F,M,W;A216L,Y;以及K229W,H,I,Y;或其相对应的取代。
[78]如段落1-29中任一项所述的变体,该变体包含取代E154I,L;N189H,K;A216L,Y;以及K229W,H,I,Y;或其相对应的取代。
[79]如段落1-29中任一项所述的变体,该变体包含取代G188A,F,M,W;N189H,K;A216L,Y;以及K229W,H,I,Y;或其相对应的取代。
[80]如段落1-29中任一项所述的变体,该变体包含取代E105P,K;E154I,L;G188A,F,M,W;N189H,K;以及A216L,Y;或其相对应的取代。
[81]如段落1-29中任一项所述的变体,该变体包含取代E105P,K;E154I,L;G188A,F,M,W;N189H,K;以及K229W,H,I,Y;或其相对应的取代。
[82]如段落1-29中任一项所述的变体,该变体包含取代E105P,K;E154I,L;G188A,F,M,W;A216L,Y;以及K229W,H,I,Y;或其相对应的取代。
[83]如段落1-29中任一项所述的变体,该变体包含取代E105P,K;E154I,L;N189H,K;A216L,Y;以及K229W,H,I,Y;或其相对应的取代。
[84]如段落1-29中任一项所述的变体,该变体包含取代E105P,K;G188A,F,M,W;N189H,K;A216L,Y;以及K229W,H,I,Y;或其相对应的取代。
[85]如段落1-29中任一项所述的变体,该变体包含取代E154I,L;G188A,F,M,W;N189H,K;A216L,Y;以及K229W,H,I,Y;或其相对应的取代。
[86]如段落1-29中任一项所述的变体,该变体包含取代E105P,K;E154I,L;G188A,F,M,W;N189H,K;A216L,Y;以及K229W,H,I,Y;或其相对应的取代。
[87]如段落1-86中任一项所述的变体,该变体进一步包含在与30的成熟多肽的位置111、152、155、以及162相对应的一个或多个位置处的取代,其中该变体具有纤维素分解增强活性。
[88]如段落87所述的变体,其中取代的数目为1-4个,例如,1、2、3、或4个取代。
[89]如段落87或88所述的变体,该变体包含在与位置111相对应的位置处的取代。
[90]如段落89所述的变体,其中该取代是Val。
[91]如段落87-90中任一项所述的变体,该变体包含在与位置152相对应的位置处的取代。
[92]如段落91所述的变体,其中该取代是Ser。
[93]如段落87-92中任一项所述的变体,该变体包含在与位置155相对应的位置处的取代。
[94]如段落93所述的变体,其中该取代是Leu。
[95]如段落87-94中任一项所述的变体,该变体包含在与位置162相对应的位置处的取代。
[96]如段落95所述的变体,其中该取代是Trp。
[97]如段落87-96中任一项所述的变体,该变体包含在与位置111、152、155、以及162中的任何一个相对应的两个位置处的取代。
[98]如段落87-96中任一项所述的变体,该变体包含在与位置111、152、155、以及162中的任何一个相对应的三个位置处的取代。
[99]如段落87-96中任一项所述的变体,该变体包含在与位置111、152、155、以及162相对应的每个位置处的取代。
[100]如段落87-99中任一项所述的变体,该变体包含选自由以下各项组成的组的一个或多个取代或相对应的取代:L111V、D152S、M155L、以及A162W。
[101]如段落87-100中任一项所述的变体,该变体包含取代L111V+D152S;或其相对应的取代。
[102]如段落87-100中任一项所述的变体,该变体包含取代L111V+M155L;或其相对应的取代。
[103]如段落87-100中任一项所述的变体,该变体包含取代L111V+A162W;或其相对应的取代。
[104]如段落87-100中任一项所述的变体,该变体包含取代D152S+M155L;或其相对应的取代。
[105]如段落87-100中任一项所述的变体,该变体包含取代D152S+A162W;或其相对应的取代。
[106]如段落87-100中任一项所述的变体,该变体包含取代M155L+A162W;或其相对应的取代。
[107]如段落87-100中任一项所述的变体,该变体包含取代L111V+D152S+M155L;或其相对应的取代。
[108]如段落87-100中任一项所述的变体,该变体包含取代L111V+D152S+A162W;或其相对应的取代。
[109]如段落87-100中任一项所述的变体,该变体包含取代L111V+M155L+A162W;或其相对应的取代。
[110]如段落87-100中任一项所述的变体,该变体包含取代D152S+M155L+A162W;或其相对应的取代。
[111]如段落87-100中任一项所述的变体,该变体包含取代L111V+D152S+M155L+A162W;或其相对应的取代。
[112]如段落1-111中任一项所述的变体,该变体进一步包含在与30的成熟多肽的位置96、98、200、202、以及204相对应的一个或多个位置处的取代,其中该变体具有纤维素分解增强活性。
[113]如段落112所述的变体,其中取代的数目为1-5个,例如,1、2、3、4、或5个取代。
[114]如段落112或113所述的变体,该变体包含在与位置96相对应的位置处的取代。
[115]如段落114所述的变体,其中该取代是Val。
[116]如段落112-115中任一项所述的变体,该变体包含在与位置98相对应的位置处的取代。
[117]如段落116所述的变体,其中该取代是Leu。
[118]如段落112-117中任一项所述的变体,该变体包含在与位置200相对应的位置处的取代。
[119]如段落118所述的变体,其中该取代是Ile。
[120]如段落112-119中任一项所述的变体,该变体包含在与位置202相对应的位置处的取代。
[121]如段落120所述的变体,其中该取代是Leu。
[122]如段落112-121中任一项所述的变体,该变体包含在与位置204相对应的位置处的取代。
[123]如段落120所述的变体,其中该取代是Val。
[124]如段落112-123中任一项所述的变体,该变体包含在与位置96、98、200、202、以及204中的任何一个相对应的两个位置处的取代。
[125]如段落112-123中任一项所述的变体,该变体包含在与位置96、98、200、202、以及204中的任何一个相对应的三个位置处的取代。
[126]如段落112-123中任一项所述的变体,该变体包含在与位置96、98、200、202、以及204中的任何一个相对应的四个位置处的取代。
[127]如段落112-123中任一项所述的变体,该变体包含在与位置96、98、200、202、以及204相对应的每个位置处的取代。
[128]如段落112-127中任一项所述的变体,该变体包含选自由以下各项组成的组的一个或多个取代或相对应的取代:I96V、F98L、F200I、I202L、以及I204V。
[129]如段落112-128中任一项所述的变体,该变体包含取代I96V+F98L;或其相对应的取代。
[130]如段落112-128中任一项所述的变体,该变体包含取代I96V+F200I;或其相对应的取代。
[131]如段落112-128中任一项所述的变体,该变体包含取代I96V+I202L;或其相对应的取代。
[132]如段落112-128中任一项所述的变体,该变体包含取代I96V+I204V;或其相对应的取代。
[133]如段落112-128中任一项所述的变体,该变体包含取代F98L+F200I;或其相对应的取代。
[134]如段落112-128中任一项所述的变体,该变体包含取代F98L+I202L;或其相对应的取代。
[135]如段落112-128中任一项所述的变体,该变体包含取代F98L+I204V;或其相对应的取代。
[136]如段落112-128中任一项所述的变体,该变体包含取代F200I+I202L;或其相对应的取代。
[137]如段落112-128中任一项所述的变体,该变体包含取代F200I+I204V;或其相对应的取代。
[138]如段落112-128中任一项所述的变体,该变体包含取代I202L+I204V;或其相对应的取代。
[139]如段落112-128中任一项所述的变体,该变体包含取代I96V+F98L+F200I;或其相对应的取代。
[140]如段落112-128中任一项所述的变体,该变体包含取代I96V+F98L+I202L;或其相对应的取代。
[141]如段落112-128中任一项所述的变体,该变体包含取代I96V+F98L+I204V;或其相对应的取代。
[142]如段落112-128中任一项所述的变体,该变体包含取代I96V+F200I+I202L;或其相对应的取代。
[143]如段落112-128中任一项所述的变体,该变体包含取代I96V+F200I+I204V;或其相对应的取代。
[144]如段落112-128中任一项所述的变体,该变体包含取代I96V+I202L+I204V;或其相对应的取代。
[145]如段落112-128中任一项所述的变体,该变体包含取代F98L+F200I+I202L;或其相对应的取代。
[146]如段落112-128中任一项所述的变体,该变体包含取代F98L+F200I+I204V;或其相对应的取代。
[147]如段落112-128中任一项所述的变体,该变体包含取代F200I+I202L+I204V;或其相对应的取代。
[148]如段落112-128中任一项所述的变体,该变体包含取代F98L+I202L+I204V;或其相对应的取代。
[149]如段落112-128中任一项所述的变体,该变体包含取代I96V+F98L+F200I+I202L;或其相对应的取代。
[150]如段落112-128中任一项所述的变体,该变体包含取代I96V+F200I+I202L+I204V;或其相对应的取代。
[151]如段落112-128中任一项所述的变体,该变体包含取代I96V+F98L+I202L+I204V;或其相对应的取代。
[152]如段落112-128中任一项所述的变体,该变体包含取代I96V+F98L+F200I+I204V;或其相对应的取代。
[153]如段落112-128中任一项所述的变体,该变体包含取代F98L+F200I+I202L+I204V;或其相对应的取代。
[154]如段落112-128中任一项所述的变体,该变体包含取代I96V+F98L+F200I+I202L+I204V;或其相对应的取代。
[155]如段落1-154中任一项所述的变体,其中与该亲本相比,该变体的热稳定性增加至少1.01倍,例如至少1.05倍、至少1.1倍、至少1.2倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.8倍、至少2倍、至少5倍、至少10倍、至少15倍、至少20倍、至少25倍、至少50倍、至少75倍、或至少100倍。
[156]一种分离的多核苷酸,其编码如段落1-155中任一项所述的变体。
[157]一种核酸构建体,其包含如段落156所述的多核苷酸。
[158]一种表达载体,其包含如段落156所述的多核苷酸。
[159]一种宿主细胞,其包含如段落156所述的多核苷酸。
[160]一种产生GH61多肽变体的方法,包括:在适于该变体表达的条件下培养如段落159所述的宿主细胞。
[161]如段落160所述的方法,进一步包括回收该变体。
[162]一种转基因植物、植物部分或植物细胞,其用如段落156所述的多核苷酸进行了转化。
[163]一种产生如段落1-155中任一项所述的变体的方法,包括:在有助于该变体产生的条件下培养包含编码该变体的多核苷酸的转基因植物或植物细胞。
[164]如段落163所述的方法,进一步包括回收该变体。
[165]一种用于获得GH61多肽变体的方法,包括:在亲本GH61多肽的与30的成熟多肽的位置105、154、188、189、216、以及229相对应的一个或多个位置处引入取代,其中该变体具有纤维素分解增强活性;并且任选地回收该变体。
[166]如段落165所述的方法,进一步包括在该亲本GH61多肽的与30的成熟多肽的位置111、152、155、以及162相对应的一个或多个(例如若干个)位置处引入取代,其中该变体具有纤维素分解增强活性。
[167]如段落165或166所述的方法,进一步包括在该亲本GH61多肽的与30的成熟多肽的位置96、98、200、202、以及204相对应的一个或多个(例如若干个)位置处引入取代,其中该变体具有纤维素分解增强活性。
[168]一种用于降解或转化纤维素材料的方法,包括:在如段落1-155中任一项所述的具有纤维素分解增强活性的GH61多肽变体的存在下,用酶组合物处理该纤维素材料。
[169]如段落168所述的方法,其中该纤维素材料经过了预处理。
[170]如段落168或169所述的方法,进一步包括回收该降解的纤维素材料。
[171]如段落168-170中任一项所述的方法,其中该酶组合物包含选自由以下各项组成的组的一种或多种酶:纤维素酶、具有纤维素分解增强活性的多肽、半纤维素酶、酯酶、苹果菌素、漆酶、木质素分解酶、果胶酶、过氧化物酶、蛋白酶、以及扩张蛋白。
[172]如段落171所述的方法,其中该纤维素酶是选自下组的一种或多种酶,该组由以下各项组成:内切葡聚糖酶、内切葡聚糖酶、以及β-葡糖苷酶。
[173]如段落171所述的方法,其中该半纤维素酶是选自由以下各项组成的组的一种或多种酶:木聚糖酶、乙酰木聚糖酯酶、阿魏酸酯酶、阿拉伯呋喃糖苷酶、木糖苷酶、以及葡糖醛酸糖苷酶。
[174]如段落168-173中任一项所述的方法,其中该降解的纤维素材料是糖。
[175]如段落174所述的方法,其中该糖选自由以下各项组成的组:葡萄糖、木糖、甘露糖、半乳糖、以及阿拉伯糖。
[176]一种用于产生发酵产物的方法,包括:(a)在如段落1-155中任一项所述的具有纤维素分解增强活性的GH61多肽变体的存在下,用酶组合物糖化纤维素材料;(b)用一种或多种发酵微生物发酵糖化的纤维素材料,以产生该发酵产物;以及(c)从发酵物中回收该发酵产物。
[177]如段落176所述的方法,其中该纤维素材料经过了预处理。
[178]如段落176或177所述的方法,其中该酶组合物包含选自由以下各项组成的组的一种或多种酶:纤维素酶、具有纤维素分解增强活性的多肽、半纤维素酶、酯酶、苹果菌素、漆酶、木质素分解酶、果胶酶、过氧化物酶、蛋白酶、以及扩张蛋白。
[179]如段落178所述的方法,其中该纤维素酶是选自下组的一种或多种酶,该组由以下各项组成:内切葡聚糖酶、内切葡聚糖酶、以及β-葡糖苷酶。
[180]如段落178所述的方法,其中该半纤维素酶是选自由以下各项组成的组的一种或多种酶:木聚糖酶、乙酰木聚糖酯酶、阿魏酸酯酶、阿拉伯呋喃糖苷酶、木糖苷酶、以及葡糖醛酸糖苷酶。
[181]如段落176-180中任一项所述的方法,其中步骤(a)和(b)是在同时的糖化和发酵中同时执行。
[182]如段落176-181中任一项所述的方法,其中该发酵产物是醇、烷烃、环烷烃、烯烃、氨基酸、气体、异戊二烯、酮、有机酸、或聚酮化合物。
[183]一种发酵纤维素材料的方法,包括:用一种或多种发酵微生物发酵该纤维素材料,其中在如段落1-155中任一项所述的具有纤维素分解增强活性的GH61多肽变体的存在下,用酶组合物糖化该纤维素材料。
[184]如段落183所述的方法,其中该纤维素材料在糖化之前经过了预处理。
[185]如段落183或184所述的方法,其中该酶组合物包含选自由以下各项组成的组的一种或多种酶:纤维素酶、具有纤维素分解增强活性的多肽、半纤维素酶、酯酶、苹果菌素、漆酶、木质素分解酶、果胶酶、过氧化物酶、蛋白酶、以及扩张蛋白。
[186]如段落185所述的方法,其中该纤维素酶是选自下组的一种或多种酶,该组由以下各项组成:内切葡聚糖酶、内切葡聚糖酶、以及β-葡糖苷酶。
[187]如段落185所述的方法,其中该半纤维素酶是选自由以下各项组成的组的一种或多种酶:木聚糖酶、乙酰木聚糖酯酶、阿魏酸酯酶、阿拉伯呋喃糖苷酶、木糖苷酶、以及葡糖醛酸糖苷酶。
[188]如段落183-187中任一项所述的方法,其中该纤维素材料的发酵产生发酵产物。
[189]如段落189所述的方法,进一步包括从发酵物中回收该发酵产物。
[190]如段落188或189所述的方法,其中该发酵产物是醇、烷烃、环烷烃、烯烃、氨基酸、气体、异戊二烯、酮、有机酸、或聚酮化合物。
[191]一种全液配制品或细胞培养组合物,包含如段落1-155中任一项所述的变体。
[192]一种洗涤剂组合物,包含表面活性剂和如段落1-155中任一项所述的变体。
[193]如段落192所述的组合物,进一步包含选自由以下各项组成的组的一种或多种(例如,若干种)酶:淀粉酶、阿拉伯糖酶、角质酶、碳水化合物酶、纤维素酶、半乳聚糖酶、漆酶、脂肪酶、甘露聚糖酶、氧化酶、果胶酶、过氧化物酶、蛋白酶、以及木聚糖酶。
[194]如段落192或193所述的组合物,该组合物被配制为条、片、粉末、颗粒、糊、或液体。
[195]一种用于清洁或洗涤硬表面或衣物的方法,该方法包括使该硬表面或该衣物与如段落192-194中任一项所述的组合物相接触。
在此描述和要求的本发明的范围不受在此披露的具体方面限制,这是因为这些方面意欲作为本发明的若干方面的阐述。意欲任何等同方面都是在本发明的范围内。事实上,除了在此示出和描述的那些之外,本发明的各种修改将根据以上描述而对本领域技术人员变得显而易见。意欲这类修改也落入随附权利要求的范围内。在不一致的情况下,以包括定义的本披露为准。
序列表
&lt;110&gt; 诺维信股份有限公司(NOVOZYMES INC.)
诺维信公司(NOVOZYMES A/S)
&lt;120&gt; GH61多肽变体以及编码所述变体的多核苷酸
&lt;130&gt; 12342-WO-PCT
&lt;150&gt; US 61/562,277
&lt;151&gt; 2011-11-21
&lt;160&gt; 346
&lt;170&gt; PatentIn version 3.5
&lt;210&gt; 1
&lt;211&gt; 1846
&lt;212&gt; DNA
&lt;213&gt; 土生梭孢霉(Thielavia terrestris)
&lt;400&gt; 1
aattgaagga gggagtggcg gagtggccac caagtcaggc ggctgtcaac taaccaagga 60
tgggaacagt tcggctcgcc ttgcccgagg gcagcgttcc ctgatgggga cgaaccatgg 120
gactggggtc agctgctgta taaaagttca aatcgatgat ctctcagatg gcgctgctgg 180
ggtgttctgc gcttttccat cctcgcaacc tggtatccca ctagtccagc gttcggcacc 240
atgaagtcgt tcaccattgc cgccttggca gccctatggg cccaggaggc cgccgcccac 300
gcgaccttcc aggacctctg gattgatgga gtcgactacg gctcgcaatg tgtccgcctc 360
ccggcgtcca actcccccgt caccaatgtt gcgtccgacg atatccgatg caatgtcggc 420
acctcgaggc ccaccgtcaa gtgcccggtc aaggccggct ccacggtcac gatcgagatg 480
caccaggttc gcacgcctct ctgcgtaggc cccccagcta ctatatggca ctaacacgac 540
ctccagcaac ctggcgaccg gtcttgcgcc aacgaggcta tcggcggcga ccactacggc 600
cccgtaatgg tgtacatgtc caaggtcgat gacgcggtga cagccgacgg ttcatcgggc 660
tggttcaagg tgttccagga cagctgggcc aagaacccgt cgggttcgac gggcgacgac 720
gactactggg gcaccaagga cctcaactcg tgctgcggca agatgaacgt caagatcccc 780
gaagacatcg agccgggcga ctacctgctc cgcgccgagg ttatcgcgct gcacgtggcc 840
gccagctcgg gcggcgcgca gttctacatg tcctgctacc agctgaccgt gacgggctcc 900
ggcagcgcca ccccctcgac cgtgaatttc ccgggcgcct actcggccag cgacccgggc 960
atcctgatca acatccacgc gcccatgtcg acctacgtcg tcccgggccc gaccgtgtac 1020
gcgggcggct cgaccaagtc ggctggcagc tcctgctccg gctgcgaggc gacctgcacg 1080
gttggttccg gccccagcgc gacactgacg cagcccacct ccaccgcgac cgcgacctcc 1140
gcccctggcg gcggcggctc cggctgcacg gcggccaagt accagcagtg cggcggcacc 1200
ggctacactg ggtgcaccac ctgcgctgta agttccctcg tgatatgcag cggaacaccg 1260
tctggactgt tttgctaact cgcgtcgtag tccgggtcta cctgcagcgc cgtctcgcct 1320
ccgtactact cgcagtgcct ctaagccggg agcgcttgct cagcgggctg ctgtgaagga 1380
gctccatgtc cccatgccgc catggccgga gtaccgggct gagcgcccaa ttcttgtata 1440
tagttgagtt ttcccaatca tgaatacata tgcatctgca tggactgttg cgtcgtcagt 1500
ctacatcctt tgctccactg aactgtgaga ccccatgtca tccggaccat tcgatcggtg 1560
ctcgctctac catctcggtt gatgggtctg ggcttgagag tcactggcac gtcctcggcg 1620
gtaatgaaat gtggaggaaa gtgtgagctg tctgacgcac tcggcgctga tgagacgttg 1680
agcgcggccc acactggtgt tctgtaagcc agcacacaaa agaatactcc aggatggccc 1740
atagcggcaa atatacagta tcagggatgc aaaaagtgca aaagtaaggg gctcaatcgg 1800
ggatcgaacc cgagacctcg cacatgactt atttcaagtc aggggt 1846
&lt;210&gt; 2
&lt;211&gt; 326
&lt;212&gt; PRT
&lt;213&gt; 土生梭孢霉(Thielavia terrestris)
&lt;400&gt; 2
Met Lys Ser Phe Thr Ile Ala Ala Leu Ala Ala Leu Trp Ala Gln Glu
1 5 10 15
Ala Ala Ala His Ala Thr Phe Gln Asp Leu Trp Ile Asp Gly Val Asp
20 25 30
Tyr Gly Ser Gln Cys Val Arg Leu Pro Ala Ser Asn Ser Pro Val Thr
35 40 45
Asn Val Ala Ser Asp Asp Ile Arg Cys Asn Val Gly Thr Ser Arg Pro
50 55 60
Thr Val Lys Cys Pro Val Lys Ala Gly Ser Thr Val Thr Ile Glu Met
65 70 75 80
His Gln Gln Pro Gly Asp Arg Ser Cys Ala Asn Glu Ala Ile Gly Gly
85 90 95
Asp His Tyr Gly Pro Val Met Val Tyr Met Ser Lys Val Asp Asp Ala
100 105 110
Val Thr Ala Asp Gly Ser Ser Gly Trp Phe Lys Val Phe Gln Asp Ser
115 120 125
Trp Ala Lys Asn Pro Ser Gly Ser Thr Gly Asp Asp Asp Tyr Trp Gly
130 135 140
Thr Lys Asp Leu Asn Ser Cys Cys Gly Lys Met Asn Val Lys Ile Pro
145 150 155 160
Glu Asp Ile Glu Pro Gly Asp Tyr Leu Leu Arg Ala Glu Val Ile Ala
165 170 175
Leu His Val Ala Ala Ser Ser Gly Gly Ala Gln Phe Tyr Met Ser Cys
180 185 190
Tyr Gln Leu Thr Val Thr Gly Ser Gly Ser Ala Thr Pro Ser Thr Val
195 200 205
Asn Phe Pro Gly Ala Tyr Ser Ala Ser Asp Pro Gly Ile Leu Ile Asn
210 215 220
Ile His Ala Pro Met Ser Thr Tyr Val Val Pro Gly Pro Thr Val Tyr
225 230 235 240
Ala Gly Gly Ser Thr Lys Ser Ala Gly Ser Ser Cys Ser Gly Cys Glu
245 250 255
Ala Thr Cys Thr Val Gly Ser Gly Pro Ser Ala Thr Leu Thr Gln Pro
260 265 270
Thr Ser Thr Ala Thr Ala Thr Ser Ala Pro Gly Gly Gly Gly Ser Gly
275 280 285
Cys Thr Ala Ala Lys Tyr Gln Gln Cys Gly Gly Thr Gly Tyr Thr Gly
290 295 300
Cys Thr Thr Cys Ala Ser Gly Ser Thr Cys Ser Ala Val Ser Pro Pro
305 310 315 320
Tyr Tyr Ser Gln Cys Leu
325
&lt;210&gt; 3
&lt;211&gt; 880
&lt;212&gt; DNA
&lt;213&gt; 土生梭孢霉(Thielavia terrestris)
&lt;400&gt; 3
accccgggat cactgcccct aggaaccagc acacctcggt ccaatcatgc ggttcgacgc 60
cctctccgcc ctcgctcttg cgccgcttgt ggctggccac ggcgccgtga ccagctacat 120
catcggcggc aaaacctatc ccggctacga gggcttctcg cctgcctcga gcccgccgac 180
gatccagtac cagtggcccg actacaaccc gaccctgagc gtgaccgacc cgaagatgcg 240
ctgcaacggc ggcacctcgg cagagctcag cgcgcccgtc caggccggcg agaacgtgac 300
ggccgtctgg aagcagtgga cccaccagca aggccccgtc atggtctgga tgttcaagtg 360
ccccggcgac ttctcgtcgt gccacggcga cggcaagggc tggttcaaga tcgaccagct 420
gggcctgtgg ggcaacaacc tcaactcgaa caactggggc accgcgatcg tctacaagac 480
cctccagtgg agcaacccga tccccaagaa cctcgcgccg ggcaactacc tcatccgcca 540
cgagctgctc gccctgcacc aggccaacac gccgcagttc tacgccgagt gcgcccagct 600
ggtcgtctcc ggcagcggct ccgccctgcc cccgtccgac tacctctaca gcatccccgt 660
ctacgcgccc cagaacgacc ccggcatcac cgtgagtggg cttccgttcc gcggcgagct 720
ctgtggaaat cttgctgacg atgggctagg ttgacatcta caacggcggg cttacctcct 780
acaccccgcc cggcggcccc gtctggtctg gcttcgagtt ttaggcgcat tgagtcgggg 840
gctacgaggg gaaggcatct gttcgcatga gcgtgggtac 880
&lt;210&gt; 4
&lt;211&gt; 239
&lt;212&gt; PRT
&lt;213&gt; 土生梭孢霉(Thielavia terrestris)
&lt;400&gt; 4
Met Arg Phe Asp Ala Leu Ser Ala Leu Ala Leu Ala Pro Leu Val Ala
1 5 10 15
Gly His Gly Ala Val Thr Ser Tyr Ile Ile Gly Gly Lys Thr Tyr Pro
20 25 30
Gly Tyr Glu Gly Phe Ser Pro Ala Ser Ser Pro Pro Thr Ile Gln Tyr
35 40 45
Gln Trp Pro Asp Tyr Asn Pro Thr Leu Ser Val Thr Asp Pro Lys Met
50 55 60
Arg Cys Asn Gly Gly Thr Ser Ala Glu Leu Ser Ala Pro Val Gln Ala
65 70 75 80
Gly Glu Asn Val Thr Ala Val Trp Lys Gln Trp Thr His Gln Gln Gly
85 90 95
Pro Val Met Val Trp Met Phe Lys Cys Pro Gly Asp Phe Ser Ser Ser
100 105 110
His Gly Asp Gly Lys Gly Trp Phe Lys Ile Asp Gln Leu Gly Leu Trp
115 120 125
Gly Asn Asn Leu Asn Ser Asn Asn Trp Gly Thr Ala Ile Val Tyr Lys
130 135 140
Thr Leu Gln Trp Ser Asn Pro Ile Pro Lys Asn Leu Ala Pro Gly Asn
145 150 155 160
Tyr Leu Ile Arg His Glu Leu Leu Ala Leu His Gln Ala Asn Thr Pro
165 170 175
Gln Phe Tyr Ala Glu Cys Ala Gln Leu Val Val Ser Gly Ser Gly Ser
180 185 190
Ala Leu Pro Pro Ser Asp Tyr Leu Tyr Ser Ile Pro Val Tyr Ala Pro
195 200 205
Gln Asn Asp Pro Gly Ile Thr Val Asp Ile Tyr Asn Gly Gly Leu Thr
210 215 220
Ser Tyr Thr Pro Pro Gly Gly Pro Val Trp Ser Gly Phe Glu Phe
225 230 235
&lt;210&gt; 5
&lt;211&gt; 1000
&lt;212&gt; DNA
&lt;213&gt; 土生梭孢霉(Thielavia terrestris)
&lt;400&gt; 5
ctcctgttcc tgggccaccg cttgttgcct gcactattgg tagagttggt ctattgctag 60
agttggccat gcttctcaca tcagtcctcg gctcggctgc cctgcttgct agcggcgctg 120
cggcacacgg cgccgtgacc agctacatca tcgccggcaa gaattacccg gggtgggtag 180
ctgattattg agggcgcatt caaggttcat accggtgtgc atggctgaca accggctggc 240
agataccaag gcttttctcc tgcgaactcg ccgaacgtca tccaatggca atggcatgac 300
tacaaccccg tcttgtcgtg cagcgactcg aagcttcgct gcaacggcgg cacgtcggcc 360
accctgaacg ccacggccgc accgggcgac accatcaccg ccatctgggc gcagtggacg 420
cacagccagg gccccatcct ggtgtggatg tacaagtgcc cgggctcctt cagctcctgt 480
gacggctccg gcgctggctg gttcaagatc gacgaggccg gcttccacgg cgacggcgtc 540
aaggtcttcc tcgacaccga gaacccgtcc ggctgggaca tcgccaagct cgtcggcggc 600
aacaagcagt ggagcagcaa ggtccccgag ggcctcgccc ccggcaacta cctcgtccgc 660
cacgagttga tcgccctgca ccaggccaac aacccgcagt tctacccgga gtgcgcccag 720
gtcgtcatca ccggctccgg caccgcgcag ccggatgcct catacaaggc ggctatcccc 780
ggctactgca accagaatga cccgaacatc aaggtgagat ccaggcgtaa tgcagtctac 840
tgctggaaag aaagtggtcc aagctaaacc gcgctccagg tgcccatcaa cgaccactcc 900
atccctcaga cctacaagat tcccggccct cccgtcttca agggcaccgc cagcaagaag 960
gcccgggact tcaccgcctg aagttgttga atcgatggag 1000
&lt;210&gt; 6
&lt;211&gt; 258
&lt;212&gt; PRT
&lt;213&gt; 土生梭孢霉(Thielavia terrestris)
&lt;400&gt; 6
Met Leu Leu Thr Ser Val Leu Gly Ser Ala Ala Leu Leu Ala Ser Gly
1 5 10 15
Ala Ala Ala His Gly Ala Val Thr Ser Tyr Ile Ile Ala Gly Lys Asn
20 25 30
Tyr Pro Gly Tyr Gln Gly Phe Ser Pro Ala Asn Ser Pro Asn Val Ile
35 40 45
Gln Trp Gln Trp His Asp Tyr Asn Pro Val Leu Ser Cys Ser Asp Ser
50 55 60
Lys Leu Arg Cys Asn Gly Gly Thr Ser Ala Thr Leu Asn Ala Thr Ala
65 70 75 80
Ala Pro Gly Asp Thr Ile Thr Ala Ile Trp Ala Gln Trp Thr His Ser
85 90 95
Gln Gly Pro Ile Leu Val Trp Met Tyr Lys Cys Pro Gly Ser Phe Ser
100 105 110
Ser Cys Asp Gly Ser Gly Ala Gly Trp Phe Lys Ile Asp Glu Ala Gly
115 120 125
Phe His Gly Asp Gly Val Lys Val Phe Leu Asp Thr Glu Asn Pro Ser
130 135 140
Gly Trp Asp Ile Ala Lys Leu Val Gly Gly Asn Lys Gln Trp Ser Ser
145 150 155 160
Lys Val Pro Glu Gly Leu Ala Pro Gly Asn Tyr Leu Val Arg His Glu
165 170 175
Leu Ile Ala Leu His Gln Ala Asn Asn Pro Gln Phe Tyr Pro Glu Cys
180 185 190
Ala Gln Val Val Ile Thr Gly Ser Gly Thr Ala Gln Pro Asp Ala Ser
195 200 205
Tyr Lys Ala Ala Ile Pro Gly Tyr Cys Asn Gln Asn Asp Pro Asn Ile
210 215 220
Lys Val Pro Ile Asn Asp His Ser Ile Pro Gln Thr Tyr Lys Ile Pro
225 230 235 240
Gly Pro Pro Val Phe Lys Gly Thr Ala Ser Lys Lys Ala Arg Asp Phe
245 250 255
Thr Ala
&lt;210&gt; 7
&lt;211&gt; 681
&lt;212&gt; DNA
&lt;213&gt; 土生梭孢霉(Thielavia terrestris)
&lt;400&gt; 7
atgctcgcaa acggtgccat cgtcttcctg gccgccgccc tcggcgtcag tggccactac 60
acctggccac gggttaacga cggcgccgac tggcaacagg tccgtaaggc ggacaactgg 120
caggacaacg gctacgtcgg ggatgtcacg tcgccacaga tccgctgttt ccaggcgacc 180
ccgtccccgg ccccatccgt cctcaacacc acggccggct cgaccgtgac ctactgggcc 240
aaccccgacg tctaccaccc cgggcctgtg cagttttaca tggcccgcgt gcccgatggc 300
gaggacatca actcgtggaa cggcgacggc gccgtgtggt tcaaggtgta cgaggaccat 360
cctacctttg gcgctcagct cacatggccc agcacgggca agagctcgtt cgcggttccc 420
atccccccgt gcatcaagtc cggctactac ctcctccggg cggagcaaat cggcctgcac 480
gtcgcccaga gcgtaggcgg agcgcagttc tacatctcat gcgcccagct cagcgtcacc 540
ggcggcggca gcaccgagcc gccgaacaag gtggccttcc ccggcgctta cagtgcgacg 600
gacccgggca ttctgatcaa catctactac cctgttccca cgtcctacca gaaccccggc 660
ccggccgtct tcagctgctg a 681
&lt;210&gt; 8
&lt;211&gt; 226
&lt;212&gt; PRT
&lt;213&gt; 土生梭孢霉(Thielavia terrestris)
&lt;400&gt; 8
Met Leu Ala Asn Gly Ala Ile Val Phe Leu Ala Ala Ala Leu Gly Val
1 5 10 15
Ser Gly His Tyr Thr Trp Pro Arg Val Asn Asp Gly Ala Asp Trp Gln
20 25 30
Gln Val Arg Lys Ala Asp Asn Trp Gln Asp Asn Gly Tyr Val Gly Asp
35 40 45
Val Thr Ser Pro Gln Ile Arg Cys Phe Gln Ala Thr Pro Ser Pro Ala
50 55 60
Pro Ser Val Leu Asn Thr Thr Ala Gly Ser Thr Val Thr Tyr Trp Ala
65 70 75 80
Asn Pro Asp Val Tyr His Pro Gly Pro Val Gln Phe Tyr Met Ala Arg
85 90 95
Val Pro Asp Gly Glu Asp Ile Asn Ser Trp Asn Gly Asp Gly Ala Val
100 105 110
Trp Phe Lys Val Tyr Glu Asp His Pro Thr Phe Gly Ala Gln Leu Thr
115 120 125
Trp Pro Ser Thr Gly Lys Ser Ser Phe Ala Val Pro Ile Pro Pro Cys
130 135 140
Ile Lys Ser Gly Tyr Tyr Leu Leu Arg Ala Glu Gln Ile Gly Leu His
145 150 155 160
Val Ala Gln Ser Val Gly Gly Ala Gln Phe Tyr Ile Ser Cys Ala Gln
165 170 175
Leu Ser Val Thr Gly Gly Gly Ser Thr Glu Pro Pro Asn Lys Val Ala
180 185 190
Phe Pro Gly Ala Tyr Ser Ala Thr Asp Pro Gly Ile Leu Ile Asn Ile
195 200 205
Tyr Tyr Pro Val Pro Thr Ser Tyr Gln Asn Pro Gly Pro Ala Val Phe
210 215 220
Ser Cys
225
&lt;210&gt; 9
&lt;211&gt; 960
&lt;212&gt; DNA
&lt;213&gt; 土生梭孢霉(Thielavia terrestris)
&lt;400&gt; 9
atgaagggac ttttcagtgc cgccgccctc tccctggccg tcggccaggc ttcggcccat 60
tacatcttcc agcaactctc catcaacggg aaccagtttc cggtgtacca atatattcgc 120
aagaacacca attataacag tcccgttacc gatctcacgt ccgacgatct tcggtgcaat 180
gtcggcgccc agggtgctgg gacagacacc gtcacggtga aggccggcga ccagttcacc 240
ttcacccttg acacccctgt ttaccaccag gggcccatct ccatctacat gtccaaggcc 300
ccgggcgcgg cgtcagacta cgatggcagc ggcggctggt tcaagatcaa ggactggggc 360
ccgactttca acgccgacgg cacggccacc tgggacatgg ccggctcata cacctacaac 420
atcccgacct gcattcccga cggcgactat ctgctccgca tccagtcgct ggccatccac 480
aacccctggc cggcgggcat cccgcagttc tacatctcct gcgcccagat caccgtgacc 540
ggcggcggca acggcaaccc tggcccgacg gccctcatcc ccggcgcctt caaggacacc 600
gacccgggct acacggtgaa catctacacg aacttccaca actacacggt tcccggcccg 660
gaggtcttca gctgcaacgg cggcggctcg aacccgcccc cgccggtgag tagcagcacg 720
cccgcgacca cgacgctggt cacgtcgacg cgcaccacgt cctccacgtc ctccgcctcg 780
acgccggcct cgaccggcgg ctgcaccgtc gccaagtggg gccagtgcgg cggcaacggg 840
tacaccggct gcacgacctg cgcggccggg tccacctgca gcaagcagaa cgactactac 900
tcgcagtgct tgtaagggag gccgcaaagc atgaggtgtt tgaagaggag gagaggggtc 960
&lt;210&gt; 10
&lt;211&gt; 304
&lt;212&gt; PRT
&lt;213&gt; 土生梭孢霉(Thielavia terrestris)
&lt;400&gt; 10
Met Lys Gly Leu Phe Ser Ala Ala Ala Leu Ser Leu Ala Val Gly Gln
1 5 10 15
Ala Ser Ala His Tyr Ile Phe Gln Gln Leu Ser Ile Asn Gly Asn Gln
20 25 30
Phe Pro Val Tyr Gln Tyr Ile Arg Lys Asn Thr Asn Tyr Asn Ser Pro
35 40 45
Val Thr Asp Leu Thr Ser Asp Asp Leu Arg Cys Asn Val Gly Ala Gln
50 55 60
Gly Ala Gly Thr Asp Thr Val Thr Val Lys Ala Gly Asp Gln Phe Thr
65 70 75 80
Phe Thr Leu Asp Thr Pro Val Tyr His Gln Gly Pro Ile Ser Ile Tyr
85 90 95
Met Ser Lys Ala Pro Gly Ala Ala Ser Asp Tyr Asp Gly Ser Gly Gly
100 105 110
Trp Phe Lys Ile Lys Asp Trp Gly Pro Thr Phe Asn Ala Asp Gly Thr
115 120 125
Ala Thr Trp Asp Met Ala Gly Ser Tyr Thr Tyr Asn Ile Pro Thr Cys
130 135 140
Ile Pro Asp Gly Asp Tyr Leu Leu Arg Ile Gln Ser Leu Ala Ile His
145 150 155 160
Asn Pro Trp Pro Ala Gly Ile Pro Gln Phe Tyr Ile Ser Cys Ala Gln
165 170 175
Ile Thr Val Thr Gly Gly Gly Asn Gly Asn Pro Gly Pro Thr Ala Leu
180 185 190
Ile Pro Gly Ala Phe Lys Asp Thr Asp Pro Gly Tyr Thr Val Asn Ile
195 200 205
Tyr Thr Asn Phe His Asn Tyr Thr Val Pro Gly Pro Glu Val Phe Ser
210 215 220
Cys Asn Gly Gly Gly Ser Asn Pro Pro Pro Pro Val Ser Ser Ser Thr
225 230 235 240
Pro Ala Thr Thr Thr Leu Val Thr Ser Thr Arg Thr Thr Ser Ser Thr
245 250 255
Ser Ser Ala Ser Thr Pro Ala Ser Thr Gly Gly Cys Thr Val Ala Lys
260 265 270
Trp Gly Gln Cys Gly Gly Asn Gly Tyr Thr Gly Cys Thr Thr Cys Ala
275 280 285
Ala Gly Ser Thr Cys Ser Lys Gln Asn Asp Tyr Tyr Ser Gln Cys Leu
290 295 300
&lt;210&gt; 11
&lt;211&gt; 954
&lt;212&gt; DNA
&lt;213&gt; 土生梭孢霉(Thielavia terrestris)
&lt;400&gt; 11
atgaagggcc tcagcctcct cgccgctgcg tcggcagcga ctgctcatac catcttcgtg 60
cagctcgagt cagggggaac gacctatccg gtatcctacg gcatccggga ccctagctac 120
gacggtccca tcaccgacgt cacctccgac tcactggctt gcaatggtcc cccgaacccc 180
acgacgccgt ccccgtacat catcaacgtc accgccggca ccacggtcgc ggcgatctgg 240
aggcacaccc tcacatccgg ccccgacgat gtcatggacg ccagccacaa ggggccgacc 300
ctggcctacc tcaagaaggt cgatgatgcc ttgaccgaca cgggtatcgg cggcggctgg 360
ttcaagatcc aggaggccgg ttacgacaat ggcaattggg ctaccagcac ggtgatcacc 420
aacggtggct tccaatatat tgacatcccc gcctgcattc ccaacggcca gtatctgctc 480
cgcgccgaga tgatcgcgct ccacgccgcc agcacgcagg gtggtgccca gctctacatg 540
gagtgcgcgc agatcaacgt ggtgggcggc tccggcagcg ccagcccgca gacgtacagc 600
atcccgggca tctaccaggc aaccgacccg ggcctgctga tcaacatcta ctccatgacg 660
ccgtccagcc agtacaccat tccgggtccg cccctgttca cctgcagcgg cagcggcaac 720
aacggcggcg gcagcaaccc gtcgggcggg cagaccacga cggcgaagcc cacgacgacg 780
acggcggcga cgaccacctc ctccgccgct cctaccagca gccagggggg cagcagcggt 840
tgcaccgttc cccagtggca gcagtgcggt ggcatctcgt tcaccggctg caccacctgc 900
gcggcgggct acacctgcaa gtatctgaac gactattact cgcaatgcca gtaa 954
&lt;210&gt; 12
&lt;211&gt; 317
&lt;212&gt; PRT
&lt;213&gt; 土生梭孢霉(Thielavia terrestris)
&lt;400&gt; 12
Met Lys Gly Leu Ser Leu Leu Ala Ala Ala Ser Ala Ala Thr Ala His
1 5 10 15
Thr Ile Phe Val Gln Leu Glu Ser Gly Gly Thr Thr Tyr Pro Val Ser
20 25 30
Tyr Gly Ile Arg Asp Pro Ser Tyr Asp Gly Pro Ile Thr Asp Val Thr
35 40 45
Ser Asp Ser Leu Ala Cys Asn Gly Pro Pro Asn Pro Thr Thr Pro Ser
50 55 60
Pro Tyr Ile Ile Asn Val Thr Ala Gly Thr Thr Val Ala Ala Ile Trp
65 70 75 80
Arg His Thr Leu Thr Ser Gly Pro Asp Asp Val Met Asp Ala Ser His
85 90 95
Lys Gly Pro Thr Leu Ala Tyr Leu Lys Lys Val Asp Asp Ala Leu Thr
100 105 110
Asp Thr Gly Ile Gly Gly Gly Trp Phe Lys Ile Gln Glu Ala Gly Tyr
115 120 125
Asp Asn Gly Asn Trp Ala Thr Ser Thr Val Ile Thr Asn Gly Gly Phe
130 135 140
Gln Tyr Ile Asp Ile Pro Ala Cys Ile Pro Asn Gly Gln Tyr Leu Leu
145 150 155 160
Arg Ala Glu Met Ile Ala Leu His Ala Ala Ser Thr Gln Gly Gly Ala
165 170 175
Gln Leu Tyr Met Glu Cys Ala Gln Ile Asn Val Val Gly Gly Ser Gly
180 185 190
Ser Ala Ser Pro Gln Thr Tyr Ser Ile Pro Gly Ile Tyr Gln Ala Thr
195 200 205
Asp Pro Gly Leu Leu Ile Asn Ile Tyr Ser Met Thr Pro Ser Ser Gln
210 215 220
Tyr Thr Ile Pro Gly Pro Pro Leu Phe Thr Cys Ser Gly Ser Gly Asn
225 230 235 240
Asn Gly Gly Gly Ser Asn Pro Ser Gly Gly Gln Thr Thr Thr Ala Lys
245 250 255
Pro Thr Thr Thr Thr Ala Ala Thr Thr Thr Ser Ser Ala Ala Pro Thr
260 265 270
Ser Ser Gln Gly Gly Ser Ser Gly Cys Thr Val Pro Gln Trp Gln Gln
275 280 285
Cys Gly Gly Ile Ser Phe Thr Gly Cys Thr Thr Cys Ala Ala Gly Tyr
290 295 300
Thr Cys Lys Tyr Leu Asn Asp Tyr Tyr Ser Gln Cys Gln
305 310 315
&lt;210&gt; 13
&lt;211&gt; 799
&lt;212&gt; DNA
&lt;213&gt; 金黄色嗜热子囊菌(Thermoascus aurantiacus)
&lt;400&gt; 13
atgtcctttt ccaagataat tgctactgcc ggcgttcttg cctctgcttc tctagtggct 60
ggccatggct tcgttcagaa catcgtgatt gatggtaaaa agtatgtcat tgcaagacgc 120
acataagcgg caacagctga caatcgacag ttatggcggg tatctagtga accagtatcc 180
atacatgtcc aatcctccag aggtcatcgc ctggtctact acggcaactg atcttggatt 240
tgtggacggt actggatacc aaaccccaga tatcatctgc cataggggcg ccaagcctgg 300
agccctgact gctccagtct ctccaggagg aactgttgag cttcaatgga ctccatggcc 360
tgattctcac catggcccag ttatcaacta ccttgctccg tgcaatggtg attgttccac 420
tgtggataag acccaattag aattcttcaa aattgccgag agcggtctca tcaatgatga 480
caatcctcct gggatctggg cttcagacaa tctgatagca gccaacaaca gctggactgt 540
caccattcca accacaattg cacctggaaa ctatgttctg aggcatgaga ttattgctct 600
tcactcagct cagaaccagg atggtgccca gaactatccc cagtgcatca atctgcaggt 660
cactggaggt ggttctgata accctgctgg aactcttgga acggcactct accacgatac 720
cgatcctgga attctgatca acatctatca gaaactttcc agctatatca tccctggtcc 780
tcctctgtat actggttaa 799
&lt;210&gt; 14
&lt;211&gt; 249
&lt;212&gt; PRT
&lt;213&gt; 金黄色嗜热子囊菌(Thermoascus aurantiacus)
&lt;400&gt; 14
Met Ser Phe Ser Lys Ile Ile Ala Thr Ala Gly Val Leu Ala Ser Ala
1 5 10 15
Ser Leu Val Ala Gly His Gly Phe Val Gln Asn Ile Val Ile Asp Gly
20 25 30
Lys Tyr Tyr Gly Gly Tyr Leu Val Asn Gln Tyr Pro Tyr Met Ser Asn
35 40 45
Pro Pro Glu Val Ile Ala Trp Ser Thr Thr Ala Thr Asp Leu Gly Phe
50 55 60
Val Asp Gly Thr Gly Tyr Gln Thr Pro Asp Ile Ile Cys His Arg Gly
65 70 75 80
Ala Lys Pro Gly Ala Leu Thr Ala Pro Val Ser Pro Gly Gly Thr Val
85 90 95
Glu Leu Gln Trp Thr Pro Trp Pro Asp Ser His His Gly Pro Val Ile
100 105 110
Asn Tyr Leu Ala Pro Cys Asn Gly Asp Cys Ser Thr Val Asp Lys Thr
115 120 125
Gln Leu Glu Phe Phe Lys Ile Ala Glu Ser Gly Leu Ile Asn Asp Asp
130 135 140
Asn Pro Pro Gly Ile Trp Ala Ser Asp Asn Leu Ile Ala Ala Asn Asn
145 150 155 160
Ser Trp Thr Val Thr Ile Pro Thr Thr Ile Ala Pro Gly Asn Tyr Val
165 170 175
Leu Arg His Glu Ile Ile Ala Leu His Ser Ala Gln Asn Gln Asp Gly
180 185 190
Ala Gln Asn Tyr Pro Gln Cys Ile Asn Leu Gln Val Thr Gly Gly Gly
195 200 205
Ser Asp Asn Pro Ala Gly Thr Leu Gly Thr Ala Leu Tyr His Asp Thr
210 215 220
Asp Pro Gly Ile Leu Ile Asn Ile Tyr Gln Lys Leu Ser Ser Tyr Ile
225 230 235 240
Ile Pro Gly Pro Pro Leu Tyr Thr Gly
245
&lt;210&gt; 15
&lt;211&gt; 1172
&lt;212&gt; DNA
&lt;213&gt; 里氏木霉(Trichoderma reesei)
&lt;400&gt; 15
ggatctaagc cccatcgata tgaagtcctg cgccattctt gcagcccttg gctgtcttgc 60
cgggagcgtt ctcggccatg gacaagtcca aaacttcacg atcaatggac aatacaatca 120
gggtttcatt ctcgattact actatcagaa gcagaatact ggtcacttcc ccaacgttgc 180
tggctggtac gccgaggacc tagacctggg cttcatctcc cctgaccaat acaccacgcc 240
cgacattgtc tgtcacaaga acgcggcccc aggtgccatt tctgccactg cagcggccgg 300
cagcaacatc gtcttccaat ggggccctgg cgtctggcct cacccctacg gtcccatcgt 360
tacctacgtg gctgagtgca gcggatcgtg cacgaccgtg aacaagaaca acctgcgctg 420
ggtcaagatt caggaggccg gcatcaacta taacacccaa gtctgggcgc agcaggatct 480
gatcaaccag ggcaacaagt ggactgtgaa gatcccgtcg agcctcaggc ccggaaacta 540
tgtcttccgc catgaacttc ttgctgccca tggtgcctct agtgcgaacg gcatgcagaa 600
ctatcctcag tgcgtgaaca tcgccgtcac aggctcgggc acgaaagcgc tccctgccgg 660
aactcctgca actcagctct acaagcccac tgaccctggc atcttgttca acccttacac 720
aacaatcacg agctacacca tccctggccc agccctgtgg caaggctaga tccaggggta 780
cggtgttggc gttcgtgaag tcggagctgt tgacaaggat atctgatgat gaacggagag 840
gactgatggg cgtgactgag tgtatatatt tttgatgacc aaattgtata cgaaatccga 900
acgcatggtg atcattgttt atccctgtag tatattgtct ccaggctgct aagagcccac 960
cgggtgtatt acggcaacaa agtcaggaat ttgggtggca atgaacgcag gtctccatga 1020
atgtatatgt gaagaggcat cggctggcat gggcattacc agatataggc cctgtgaaac 1080
atatagtact tgaacgtgct actggaacgg atcataagca agtcatcaac atgtgaaaaa 1140
acactacatg taaaaaaaaa aaaaaaaaaa aa 1172
&lt;210&gt; 16
&lt;211&gt; 249
&lt;212&gt; PRT
&lt;213&gt; 里氏木霉(Trichoderma reesei)
&lt;400&gt; 16
Met Lys Ser Cys Ala Ile Leu Ala Ala Leu Gly Cys Leu Ala Gly Ser
1 5 10 15
Val Leu Gly His Gly Gln Val Gln Asn Phe Thr Ile Asn Gly Gln Tyr
20 25 30
Asn Gln Gly Phe Ile Leu Asp Tyr Tyr Tyr Gln Lys Gln Asn Thr Gly
35 40 45
His Phe Pro Asn Val Ala Gly Trp Tyr Ala Glu Asp Leu Asp Leu Gly
50 55 60
Phe Ile Ser Pro Asp Gln Tyr Thr Thr Pro Asp Ile Val Cys His Lys
65 70 75 80
Asn Ala Ala Pro Gly Ala Ile Ser Ala Thr Ala Ala Ala Gly Ser Asn
85 90 95
Ile Val Phe Gln Trp Gly Pro Gly Val Trp Pro His Pro Tyr Gly Pro
100 105 110
Ile Val Thr Tyr Val Val Glu Cys Ser Gly Ser Cys Thr Thr Val Asn
115 120 125
Lys Asn Asn Leu Arg Trp Val Lys Ile Gln Glu Ala Gly Ile Asn Tyr
130 135 140
Asn Thr Gln Val Trp Ala Gln Gln Asp Leu Ile Asn Gln Gly Asn Lys
145 150 155 160
Trp Thr Val Lys Ile Pro Ser Ser Leu Arg Pro Gly Asn Tyr Val Phe
165 170 175
Arg His Glu Leu Leu Ala Ala His Gly Ala Ser Ser Ala Asn Gly Met
180 185 190
Gln Asn Tyr Pro Gln Cys Val Asn Ile Ala Val Thr Gly Ser Gly Thr
195 200 205
Lys Ala Leu Pro Ala Gly Thr Pro Ala Thr Gln Leu Tyr Lys Pro Thr
210 215 220
Asp Pro Gly Ile Leu Phe Asn Pro Tyr Thr Thr Ile Thr Ser Tyr Thr
225 230 235 240
Ile Pro Gly Pro Ala Leu Trp Gln Gly
245
&lt;210&gt; 17
&lt;211&gt; 924
&lt;212&gt; DNA
&lt;213&gt; 嗜热毁丝霉(Myceliophthora thermophila)
&lt;400&gt; 17
atgaagttca cctcgtccct cgctgtcctg gccgctgccg gcgcccaggc tcactgttag 60
tcgaccctcg aacccaacac ccccctcccc ccttttctcc tccatctcct cggcctcact 120
tagtagccgc tgacaacgac tagatacctt ccctagggcc ggcactggtg gctcgctctc 180
tggcgagtgg gaggtggtcc gcatgaccga gaaccattac tcgcacggcc cggtcaccga 240
tgtcaccagc cccgagatga cctgctatca gtccggcgtg cagggtgcgc cccagaccgt 300
ccaggtcaag gcgggctccc aattcacctt cagcgtggat ccctcgatcg gccaccccgg 360
ccctctccag ttctacatgg ctaaggtgcc gtcgggccag acggccgcca cctttgacgg 420
cacgggagcc gtgtggttca agatctacca agacggcccg aacggcctcg gcaccgacag 480
cattacctgg cccagcgccg gttcgtgact tcctccccac tcgctttttt ttttttattt 540
tttatttttt tttctttcgg aactcaagaa tctttctctc tctctcccgt ctttggcctt 600
gaacaacact aaaactcttc cttactgtat taattaggca aaaccgaggt ctcggtcacc 660
atccccagct gcatcgatga tggcgagtac ctgctccggg tcgagcacat cgcgctccac 720
agcgccagca gcgtgggcgg cgctcagttc tacattgcct gcgcccagct ctccgtcacc 780
ggcggctccg gcaccctcaa cacgggctcg ctcgtctccc tgcccggcgc ctacaaggcc 840
accgacccgg gcatcctctt ccagctctac tggcccatcc cgaccgagta catcaacccc 900
ggcccggccc ccgtctcttg ctaa 924
&lt;210&gt; 18
&lt;211&gt; 232
&lt;212&gt; PRT
&lt;213&gt; 嗜热毁丝霉(Myceliophthora thermophila)
&lt;400&gt; 18
Met Lys Phe Thr Ser Ser Leu Ala Val Leu Ala Ala Ala Gly Ala Gln
1 5 10 15
Ala His Tyr Thr Phe Pro Arg Ala Gly Thr Gly Gly Ser Leu Ser Gly
20 25 30
Glu Trp Glu Val Val Arg Met Thr Glu Asn His Tyr Ser His Gly Pro
35 40 45
Val Thr Asp Val Thr Ser Pro Glu Met Thr Cys Tyr Gln Ser Gly Val
50 55 60
Gln Gly Ala Pro Gln Thr Val Gln Val Lys Ala Gly Ser Gln Phe Thr
65 70 75 80
Phe Ser Val Asp Pro Ser Ile Gly His Pro Gly Pro Leu Gln Phe Tyr
85 90 95
Met Ala Lys Val Pro Ser Gly Gln Thr Ala Ala Thr Phe Asp Gly Thr
100 105 110
Gly Ala Val Trp Phe Lys Ile Tyr Gln Asp Gly Pro Asn Gly Leu Gly
115 120 125
Thr Asp Ser Ile Thr Trp Pro Ser Ala Gly Lys Thr Glu Val Ser Val
130 135 140
Thr Ile Pro Ser Cys Ile Asp Asp Gly Glu Tyr Leu Leu Arg Val Glu
145 150 155 160
His Ile Ala Leu His Ser Ala Ser Ser Val Gly Gly Ala Gln Phe Tyr
165 170 175
Ile Ala Cys Ala Gln Leu Ser Val Thr Gly Gly Ser Gly Thr Leu Asn
180 185 190
Thr Gly Ser Leu Val Ser Leu Pro Gly Ala Tyr Lys Ala Thr Asp Pro
195 200 205
Gly Ile Leu Phe Gln Leu Tyr Trp Pro Ile Pro Thr Glu Tyr Ile Asn
210 215 220
Pro Gly Pro Ala Pro Val Ser Cys
225 230
&lt;210&gt; 19
&lt;211&gt; 854
&lt;212&gt; DNA
&lt;213&gt; 嗜热毁丝霉(Myceliophthora thermophila)
&lt;400&gt; 19
atgaaggccc tctctctcct tgcggctgcc tcggcagtct ctgcgcatac catcttcgtc 60
cagctcgaag cagacggcac gaggtacccg gtctcgtacg ggatccggga cccaagctac 120
gacggcccca tcaccgacgt cacatccaac gacgttgctt gcaacggcgg gccgaacccg 180
acgaccccct ccagcgacgt catcaccgtc accgcgggca ccacggtcaa ggccatctgg 240
aggcacaccc tccaatccgg cccggacgat gtcatggacg ccagccacaa gggcccgacc 300
ctggcctacc tcaagaaggt cggcgatgcc accaaggact cgggcgtcgg cggtggctgg 360
ttcaagattc aggaggacgg ctacaacaac ggccagtggg gcaccagcac cgttatctcc 420
aacggcggcg agcactacat gtgagccatt cctccgagag aagaccaaga ctcttgacga 480
tctcgctgac ccgtgcaaca agtgacatcc cggcctgcat ccccgagggt cagtacctcc 540
tccgcgccga gatgatcgcc ctccacgcgg ccgggtcccc cggcggtgcc cagctctacg 600
taagcctctg cccttccccc cttcctcttg atcgaatcgg actgcccacc ccccttttcg 660
actccgacta acaccgttgc cagatggaat gtgcccagat caacatcgtc ggcggctccg 720
gctcggtgcc cagctcgacc gtcagcttcc ccggcgcgta cagccccaac gacccgggtc 780
tcctcatcaa catctattcc atgtcgccct cgagctcgta caccatcccg ggcccgcccg 840
tcttcaagtg ctag 854
&lt;210&gt; 20
&lt;211&gt; 235
&lt;212&gt; PRT
&lt;213&gt; 嗜热毁丝霉(Myceliophthora thermophila)
&lt;400&gt; 20
Met Lys Ala Leu Ser Leu Leu Ala Ala Ala Ser Ala Val Ser Ala His
1 5 10 15
Thr Ile Phe Val Gln Leu Glu Ala Asp Gly Thr Arg Tyr Pro Val Ser
20 25 30
Tyr Gly Ile Arg Asp Pro Ser Tyr Asp Gly Pro Ile Thr Asp Val Thr
35 40 45
Ser Asn Asp Val Ala Cys Asn Gly Gly Pro Asn Pro Thr Thr Pro Ser
50 55 60
Ser Asp Val Ile Thr Val Thr Ala Gly Thr Thr Val Lys Ala Ile Trp
65 70 75 80
Arg His Thr Leu Gln Ser Gly Pro Asp Asp Val Met Asp Ala Ser His
85 90 95
Lys Gly Pro Thr Leu Ala Tyr Leu Lys Lys Val Gly Asp Ala Thr Lys
100 105 110
Asp Ser Gly Val Gly Gly Gly Trp Phe Lys Ile Gln Glu Asp Gly Tyr
115 120 125
Asn Asn Gly Gln Trp Gly Thr Ser Thr Val Ile Ser Asn Gly Gly Glu
130 135 140
His Tyr Ile Asp Ile Pro Ala Cys Ile Pro Glu Gly Gln Tyr Leu Leu
145 150 155 160
Arg Ala Glu Met Ile Ala Leu His Ala Ala Gly Ser Pro Gly Gly Ala
165 170 175
Gln Leu Tyr Met Glu Cys Ala Gln Ile Asn Ile Val Gly Gly Ser Gly
180 185 190
Ser Val Pro Ser Ser Thr Val Ser Phe Pro Gly Ala Tyr Ser Pro Asn
195 200 205
Asp Pro Gly Leu Leu Ile Asn Ile Tyr Ser Met Ser Pro Ser Ser Ser
210 215 220
Tyr Thr Ile Pro Gly Pro Pro Val Phe Lys Cys
225 230 235
&lt;210&gt; 21
&lt;211&gt; 1242
&lt;212&gt; DNA
&lt;213&gt; 嗜热毁丝霉(Myceliophthora thermophila)
&lt;400&gt; 21
atgaagtcct tcgccctcac cactctggcc gccctggccg gcaacgccgc cgctcacgcg 60
accttccagg ccctctgggt cgacggcgtc gactacggcg cgcagtgtgc ccgtctgccc 120
gcgtccaact ccccggtcac cgacgtgacc tccaacgcga tccgctgcaa cgccaacccg 180
tcgcccgctc ggggcaagtg cccggtcaag gccggctcga ccgttacggt cgagatgcat 240
caggtacgtt ggatgaatga aaggggaaag gaagcagagg cagaagggga aggcgaaggg 300
aaagaaaaag aaaaagaaat ggaaaagaaa aagaaatgga aaagaaaaag aaaaatgaaa 360
aagaaagtgg aaaccgtcag actaactggg gctcctcccc cccacccctc ctttgatatc 420
agcaacccgg tgaccggtcg tgcagcagcg aggcgatcgg cggggcgcac tacggccccg 480
tcatggtgta catgtccaag gtgtcggacg cggcgtcggc ggacgggtcg tcgggctggt 540
tcaaggtgtt cgaggacggc tgggccaaga acccgtccgg cgggtcgggc gacgacgact 600
actggggcac caaggacctg aactcgtgct gcgggaagat gaacgtcaag atccccgccg 660
acctgccctc gggcgactac ctgctccggg ccgaggccct cgcgctgcac acggcgggca 720
gcgccggcgg cgcccagttc tacatgacgt gctaccagct caccgtgacg ggctccggca 780
gcgccagccc gcccaccgtc tccttcccgg gcgcctacaa ggccaccgac ccgggcatcc 840
tcgtcaacat ccacgccccg ctgtccggct acaccgtgcc cggcccggcc gtctactccg 900
gcggctccac caagaaggcc ggcagcgcct gcaccggctg cgagtccacc tgcgccgtcg 960
gctccggccc caccgccacc gtctcccagt cgcccggttc caccgccacc tccgcccccg 1020
gcggcggcgg cggctgcacc gtccagaagt accagcagtg cggcggcgag ggctacaccg 1080
gctgcaccaa ctgcgcggta cgtttttcaa ccccgttttt ttttttcctt ccctacctta 1140
tttggttacc taattaatta ctttccggct gctgactttt tgctttagtc cggctctacc 1200
tgcagcgccg tctcgccgcc ctactactcg cagtgcgtct aa 1242
&lt;210&gt; 22
&lt;211&gt; 323
&lt;212&gt; PRT
&lt;213&gt; 嗜热毁丝霉(Myceliophthora thermophila)
&lt;400&gt; 22
Met Lys Ser Phe Ala Leu Thr Thr Leu Ala Ala Leu Ala Gly Asn Ala
1 5 10 15
Ala Ala His Ala Thr Phe Gln Ala Leu Trp Val Asp Gly Val Asp Tyr
20 25 30
Gly Ala Gln Cys Ala Arg Leu Pro Ala Ser Asn Ser Pro Val Thr Asp
35 40 45
Val Thr Ser Asn Ala Ile Arg Cys Asn Ala Asn Pro Ser Pro Ala Arg
50 55 60
Gly Lys Cys Pro Val Lys Ala Gly Ser Thr Val Thr Val Glu Met His
65 70 75 80
Gln Gln Pro Gly Asp Arg Ser Cys Ser Ser Glu Ala Ile Gly Gly Ala
85 90 95
His Tyr Gly Pro Val Met Val Tyr Met Ser Lys Val Ser Asp Ala Ala
100 105 110
Ser Ala Asp Gly Ser Ser Gly Trp Phe Lys Val Phe Glu Asp Gly Trp
115 120 125
Ala Lys Asn Pro Ser Gly Gly Ser Gly Asp Asp Asp Tyr Trp Gly Thr
130 135 140
Lys Asp Leu Asn Ser Cys Cys Gly Lys Met Asn Val Lys Ile Pro Ala
145 150 155 160
Asp Leu Pro Ser Gly Asp Tyr Leu Leu Arg Ala Glu Ala Leu Ala Leu
165 170 175
His Thr Ala Gly Ser Ala Gly Gly Ala Gln Phe Tyr Met Thr Cys Tyr
180 185 190
Gln Leu Thr Val Thr Gly Ser Gly Ser Ala Ser Pro Pro Thr Val Ser
195 200 205
Phe Pro Gly Ala Tyr Lys Ala Thr Asp Pro Gly Ile Leu Val Asn Ile
210 215 220
His Ala Pro Leu Ser Gly Tyr Thr Val Pro Gly Pro Ala Val Tyr Ser
225 230 235 240
Gly Gly Ser Thr Lys Lys Ala Gly Ser Ala Cys Thr Gly Cys Glu Ser
245 250 255
Thr Cys Ala Val Gly Ser Gly Pro Thr Ala Thr Val Ser Gln Ser Pro
260 265 270
Gly Ser Thr Ala Thr Ser Ala Pro Gly Gly Gly Gly Gly Cys Thr Val
275 280 285
Gln Lys Tyr Gln Gln Cys Gly Gly Glu Gly Tyr Thr Gly Cys Thr Asn
290 295 300
Cys Ala Ser Gly Ser Thr Cys Ser Ala Val Ser Pro Pro Tyr Tyr Ser
305 310 315 320
Gln Cys Val
&lt;210&gt; 23
&lt;211&gt; 1253
&lt;212&gt; DNA
&lt;213&gt; 嗜热毁丝霉(Myceliophthora thermophila)
&lt;400&gt; 23
atgaagcctt ttagcctcgt cgccctggcg accgccgtga gcggccatgc catcttccag 60
cgggtgtcgg tcaacgggca ggaccagggc cagctcaagg gggtgcgggc gccgtcgagc 120
aactccccga tccagaacgt caacgatgcc aacatggcct gcaacgccaa cattgtgtac 180
cacgacagca ccatcatcaa ggtgcccgcg ggagcccgcg tcggcgcgtg gtggcagcac 240
gtcatcggcg ggccgcaggg cgccaacgac ccggacaacc cgatcgcggc ctcccacaag 300
ggtatgatga tcgatgatgc ctctctcttc ccccgttctt gatggacagg cgatggctcc 360
caggaacacg cgtgactgac caccgaatcc aggccccatc caggtctacc tggccaaggt 420
ggacaacgcg gcgacggcgt cgccgtcggg cctcaggtgg ttcaaggtgg ccgagcgcgg 480
cctgaacaac ggcgtgtggg ccgtcgatga gctcatcgcc aacaacggct ggcactactt 540
cgacctgccg tcgtgcgtgg cccccggcca gtacctgatg cgcgtcgagc tgctcgccct 600
gcacagcgcc tcaagccccg gcggcgccca gttctacatg ggctgcgcac agatcgaagg 660
tgcgtcgatc tttgttctcc ttccgtgtcc tctctgatcc tttctctctt ctttttcttt 720
cttttactcc ctttccttcc atcttcggag aagcaacgaa gggggaaagg gatagaagag 780
aggaatgaga gacgacgaaa gagaggattg gggaaagaca agacagggaa aaaaagacaa 840
gaaaaaaaaa aaaaaaaaaa aacagagtga gctaacaaga acaatcagtc actggctccg 900
gcaccaactc gggctccgac tttgtctcgt tccccggcgc ctactcggcc aacgatccgg 960
gcatcttgct aagcatctac gacagctcgg gcaagcccac caacggcggg cgctcgtacc 1020
cgatccccgg cccgcgcccc atctcctgct ccggcagcgg cgacggcggc aacaacggcg 1080
gcggcggcga cgacaacaac aataacaacg gtggtggcaa caacggcggc ggcggcggcg 1140
gcagcgtccc cctgtacggg cagtgcggcg gcatcggcta cacgggcccg accacctgtg 1200
cccagggaac ttgcaaggtg tcgaacgaat actacagcca gtgcctcccc tag 1253
&lt;210&gt; 24
&lt;211&gt; 310
&lt;212&gt; PRT
&lt;213&gt; 嗜热毁丝霉(Myceliophthora thermophila)
&lt;400&gt; 24
Met Lys Pro Phe Ser Leu Val Ala Leu Ala Thr Ala Val Ser Gly His
1 5 10 15
Ala Ile Phe Gln Arg Val Ser Val Asn Gly Gln Asp Gln Gly Gln Leu
20 25 30
Lys Gly Val Arg Ala Pro Ser Ser Asn Ser Pro Ile Gln Asn Val Asn
35 40 45
Asp Ala Asn Met Ala Cys Asn Ala Asn Ile Val Tyr His Asp Ser Thr
50 55 60
Ile Ile Lys Val Pro Ala Gly Ala Arg Val Gly Ala Trp Trp Gln His
65 70 75 80
Val Ile Gly Gly Pro Gln Gly Ala Asn Asp Pro Asp Asn Pro Ile Ala
85 90 95
Ala Ser His Lys Gly Pro Ile Gln Val Tyr Leu Ala Lys Val Asp Asn
100 105 110
Ala Ala Thr Ala Ser Pro Ser Gly Leu Arg Trp Phe Lys Val Ala Glu
115 120 125
Arg Gly Leu Asn Asn Gly Val Trp Ala Val Asp Glu Leu Ile Ala Asn
130 135 140
Asn Gly Trp His Tyr Phe Asp Leu Pro Ser Cys Val Ala Pro Gly Gln
145 150 155 160
Tyr Leu Met Arg Val Glu Leu Leu Ala Leu His Ser Ala Ser Ser Pro
165 170 175
Gly Gly Ala Gln Phe Tyr Met Gly Cys Ala Gln Ile Glu Val Thr Gly
180 185 190
Ser Gly Thr Asn Ser Gly Ser Asp Phe Val Ser Phe Pro Gly Ala Tyr
195 200 205
Ser Ala Asn Asp Pro Gly Ile Leu Leu Ser Ile Tyr Asp Ser Ser Gly
210 215 220
Lys Pro Thr Asn Gly Gly Arg Ser Tyr Pro Ile Pro Gly Pro Arg Pro
225 230 235 240
Ile Ser Cys Ser Gly Ser Gly Asp Gly Gly Asn Asn Gly Gly Gly Gly
245 250 255
Asp Asp Asn Asn Asn Asn Asn Gly Gly Gly Asn Asn Gly Gly Gly Gly
260 265 270
Gly Gly Ser Val Pro Leu Tyr Gly Gln Cys Gly Gly Ile Gly Tyr Thr
275 280 285
Gly Pro Thr Thr Cys Ala Gln Gly Thr Cys Lys Val Ser Asn Glu Tyr
290 295 300
Tyr Ser Gln Cys Leu Pro
305 310
&lt;210&gt; 25
&lt;211&gt; 814
&lt;212&gt; DNA
&lt;213&gt; 嗜热毁丝霉(Myceliophthora thermophila)
&lt;400&gt; 25
atgaagctct ccctcttctc cgtcctggcc actgccctca ccgtcgaggg gcatgccatc 60
ttccagaagg tctccgtcaa cggagcggac cagggctccc tcaccggcct ccgcgctccc 120
aacaacaaca accccgtgca ggatgtcaac agccaggaca tgatctgcgg ccagtcggga 180
tcgacgtcga acactatcat cgaggtcaag gccggcgata ggatcggtgc ctggtatcag 240
catgtcatcg gcggtgccca gttccccaac gacccagaca acccgattgc caagtcgcac 300
aagggccccg tcatggccta cctcgccaag gttgacaatg ccgcaaccgc cagcaagacg 360
ggcctgaagt ggtatgtatt cccgcggccc gagggacatc gggttgggca agtcgagact 420
gacggagctc gcttctccgt ataggttcaa gatttgggag gataccttta atcccagcac 480
caagacctgg ggtgtcgaca acctcatcaa taacaacggc tgggtgtact tcaacctccc 540
gcagtgcatc gccgacggca actacctcct ccgcgtcgag gtcctcgctc tgcactcggc 600
ctactctcag ggccaggctc agttctacca gtcctgcgcc cagatcaacg tatccggcgg 660
cggctccttc acaccgccgt cgactgtcag cttcccgggt gcctacagcg ccagcgaccc 720
cggtatcctg atcaacatct acggcgccac cggccagccc gacaacaacg gccagccgta 780
cactgcccct gggcccgcgc ccatctcctg ctga 814
&lt;210&gt; 26
&lt;211&gt; 246
&lt;212&gt; PRT
&lt;213&gt; 嗜热毁丝霉(Myceliophthora thermophila)
&lt;400&gt; 26
Met Lys Leu Ser Leu Phe Ser Val Leu Ala Thr Ala Leu Thr Val Glu
1 5 10 15
Gly His Ala Ile Phe Gln Lys Val Ser Val Asn Gly Ala Asp Gln Gly
20 25 30
Ser Leu Thr Gly Leu Arg Ala Pro Asn Asn Asn Asn Pro Val Gln Asp
35 40 45
Val Asn Ser Gln Asp Met Ile Cys Gly Gln Ser Gly Ser Thr Ser Asn
50 55 60
Thr Ile Ile Glu Val Lys Ala Gly Asp Arg Ile Gly Ala Trp Tyr Gln
65 70 75 80
His Val Ile Gly Gly Ala Gln Phe Pro Asn Asp Pro Asp Asn Pro Ile
85 90 95
Ala Lys Ser His Lys Gly Pro Val Met Ala Tyr Leu Ala Lys Val Asp
100 105 110
Asn Ala Ala Thr Ala Ser Lys Thr Gly Leu Lys Trp Phe Lys Ile Trp
115 120 125
Glu Asp Thr Phe Asn Pro Ser Thr Lys Thr Trp Gly Val Asp Asn Leu
130 135 140
Ile Asn Asn Asn Gly Trp Val Tyr Phe Asn Leu Pro Gln Cys Ile Ala
145 150 155 160
Asp Gly Asn Tyr Leu Leu Arg Val Glu Val Leu Ala Leu His Ser Ala
165 170 175
Tyr Ser Gln Gly Gln Ala Gln Phe Tyr Gln Ser Cys Ala Gln Ile Asn
180 185 190
Val Ser Gly Gly Gly Ser Phe Thr Pro Pro Ser Thr Val Ser Phe Pro
195 200 205
Gly Ala Tyr Ser Ala Ser Asp Pro Gly Ile Leu Ile Asn Ile Tyr Gly
210 215 220
Ala Thr Gly Gln Pro Asp Asn Asn Gly Gln Pro Tyr Thr Ala Pro Gly
225 230 235 240
Pro Ala Pro Ile Ser Cys
245
&lt;210&gt; 27
&lt;211&gt; 1115
&lt;212&gt; DNA
&lt;213&gt; 金黄色嗜热子囊菌(Thermoascus aurantiacus)
&lt;400&gt; 27
atgtcgttct cgaagattgc tgcgatcacc ggggccatta cctatgcgtc tctggccgcc 60
gctcacggtt atgttacagg aatcgtagcc gatggcacct agtatgtaac gctcatgcca 120
agatccgcat tgctgtacta acaattagca gctacggggg ctatatcgtg acccaatacc 180
cctacatgtc gacaccgccg gatgtcatcg cctggtctac caaagcaact gatcttggtt 240
tcgtggatcc cagtagctat gcttcgtctg atattatctg ccacaagggt gctgagcctg 300
gtgccctgag cgccaaggtg gctgctggag ggaccgtcga gctgcagtgg acggattggc 360
ctgagagtca caagggcccg gtcattgact acctcgccgc ctgtaacggg gactgctcga 420
ctgtcgacaa gaccaaacta gagttcttca agattgatga gagtggccta attgacggca 480
gcagcgcccc aggcacatgg gcctctgaca acttgattgc caataacaac agctggaccg 540
tcaccatccc gagcacgatt gctcccggca actatgtcct gagacatgaa atcattgccc 600
tccactccgc cggaaataca aatggtgctc agaactaccc ccagtgtatc aaccttgagg 660
tcacaggcag tggcaccgac acccctgccg gcaccctcgg aacggagctt tataaggcaa 720
cggaccctgg cattctggtc aacatctacc agaccctgac cagctacgat attcccggcc 780
ctgctctgta caccggtggt agctctggta gctctggttc ctccaacacc gccaaggcca 840
ccacttcgac ggcttctagc tctatcgtga ccccgacgcc tgttaacaac ccaaccgtta 900
ctcagactgc cgttgttgat gtcacccaga ctgtttccca gaatgctgcc gtcgccacca 960
cgactccggc ctccactgca gttgctacag ctgtcccaac gggaaccacc tttagctttg 1020
attcgatgac ctcggatgaa ttcgtcagcc tgatgcgtgc gaccgtgaat tggctgcttt 1080
ctaacaagaa gcatgcccgg gatctttctt actaa 1115
&lt;210&gt; 28
&lt;211&gt; 354
&lt;212&gt; PRT
&lt;213&gt; 金黄色嗜热子囊菌(Thermoascus aurantiacus)
&lt;400&gt; 28
Met Ser Phe Ser Lys Ile Ala Ala Ile Thr Gly Ala Ile Thr Tyr Ala
1 5 10 15
Ser Leu Ala Ala Ala His Gly Tyr Val Thr Gly Ile Val Ala Asp Gly
20 25 30
Thr Tyr Tyr Gly Gly Tyr Ile Val Thr Gln Tyr Pro Tyr Met Ser Thr
35 40 45
Pro Pro Asp Val Ile Ala Trp Ser Thr Lys Ala Thr Asp Leu Gly Phe
50 55 60
Val Asp Pro Ser Ser Tyr Ala Ser Ser Asp Ile Ile Cys His Lys Gly
65 70 75 80
Ala Glu Pro Gly Ala Leu Ser Ala Lys Val Ala Ala Gly Gly Thr Val
85 90 95
Glu Leu Gln Trp Thr Asp Trp Pro Glu Ser His Lys Gly Pro Val Ile
100 105 110
Asp Tyr Leu Ala Ala Cys Asn Gly Asp Cys Ser Thr Val Asp Lys Thr
115 120 125
Lys Leu Glu Phe Phe Lys Ile Asp Glu Ser Gly Leu Ile Asp Gly Ser
130 135 140
Ser Ala Pro Gly Thr Trp Ala Ser Asp Asn Leu Ile Ala Asn Asn Asn
145 150 155 160
Ser Trp Thr Val Thr Ile Pro Ser Thr Ile Ala Pro Gly Asn Tyr Val
165 170 175
Leu Arg His Glu Ile Ile Ala Leu His Ser Ala Gly Asn Thr Asn Gly
180 185 190
Ala Gln Asn Tyr Pro Gln Cys Ile Asn Leu Glu Val Thr Gly Ser Gly
195 200 205
Thr Asp Thr Pro Ala Gly Thr Leu Gly Thr Glu Leu Tyr Lys Ala Thr
210 215 220
Asp Pro Gly Ile Leu Val Asn Ile Tyr Gln Thr Leu Thr Ser Tyr Asp
225 230 235 240
Ile Pro Gly Pro Ala Leu Tyr Thr Gly Gly Ser Ser Gly Ser Ser Gly
245 250 255
Ser Ser Asn Thr Ala Lys Ala Thr Thr Ser Thr Ala Ser Ser Ser Ile
260 265 270
Val Thr Pro Thr Pro Val Asn Asn Pro Thr Val Thr Gln Thr Ala Val
275 280 285
Val Asp Val Thr Gln Thr Val Ser Gln Asn Ala Ala Val Ala Thr Thr
290 295 300
Thr Pro Ala Ser Thr Ala Val Ala Thr Ala Val Pro Thr Gly Thr Thr
305 310 315 320
Phe Ser Phe Asp Ser Met Thr Ser Asp Glu Phe Val Ser Leu Met Arg
325 330 335
Ala Thr Val Asn Trp Leu Leu Ser Asn Lys Lys His Ala Arg Asp Leu
340 345 350
Ser Tyr
&lt;210&gt; 29
&lt;211&gt; 862
&lt;212&gt; DNA
&lt;213&gt; 烟曲霉(Aspergillus fumigatus)
&lt;400&gt; 29
atgactttgt ccaagatcac ttccattgct ggccttctgg cctcagcgtc tctcgtggct 60
ggccacggct ttgtttctgg cattgttgct gatgggaaat agtatgtgct tgaaccacac 120
aaatgacagc tgcaacagct aacttctatt ccagttacgg agggtacctt gttaaccaat 180
acccctacat gagcaaccct cccgacacca ttgcctggtc caccaccgcc accgacctcg 240
gctttgtgga cggcaccggc taccagtctc cggatattat ctgccacaga gacgcaaaga 300
atggcaagtt gaccgcaacc gttgcagccg gttcacagat cgaattccag tggacgacgt 360
ggccagagtc tcaccatgga ccggtacgac gccgaagaga agagaacata ttgtgaccag 420
ataggctaac atagcatagt tgattactta cctcgctcca tgcaacggcg actgtgccac 480
cgtggacaag accaccctga agtttgtcaa gatcgccgct caaggcttga tcgacggctc 540
caacccacct ggtgtttggg ctgatgatga aatgatcgcc aacaacaaca cggccacagt 600
gaccattcct gcctcctatg cccccggaaa ctacgtcctt cgccacgaga tcatcgccct 660
tcactctgcg ggtaacctga acggcgcgca gaactacccc cagtgtttca acatccaaat 720
caccggtggc ggcagtgctc agggatctgg caccgctggc acgtccctgt acaagaatac 780
tgatcctggc atcaagtttg acatctactc ggatctgagc ggtggatacc ctattcctgg 840
tcctgcactg ttcaacgctt aa 862
&lt;210&gt; 30
&lt;211&gt; 250
&lt;212&gt; PRT
&lt;213&gt; 烟曲霉(Aspergillus fumigatus)
&lt;400&gt; 30
Met Thr Leu Ser Lys Ile Thr Ser Ile Ala Gly Leu Leu Ala Ser Ala
1 5 10 15
Ser Leu Val Ala Gly His Gly Phe Val Ser Gly Ile Val Ala Asp Gly
20 25 30
Lys Tyr Tyr Gly Gly Tyr Leu Val Asn Gln Tyr Pro Tyr Met Ser Asn
35 40 45
Pro Pro Asp Thr Ile Ala Trp Ser Thr Thr Ala Thr Asp Leu Gly Phe
50 55 60
Val Asp Gly Thr Gly Tyr Gln Ser Pro Asp Ile Ile Cys His Arg Asp
65 70 75 80
Ala Lys Asn Gly Lys Leu Thr Ala Thr Val Ala Ala Gly Ser Gln Ile
85 90 95
Glu Phe Gln Trp Thr Thr Trp Pro Glu Ser His His Gly Pro Leu Ile
100 105 110
Thr Tyr Leu Ala Pro Cys Asn Gly Asp Cys Ala Thr Val Asp Lys Thr
115 120 125
Thr Leu Lys Phe Val Lys Ile Ala Ala Gln Gly Leu Ile Asp Gly Ser
130 135 140
Asn Pro Pro Gly Val Trp Ala Asp Asp Glu Met Ile Ala Asn Asn Asn
145 150 155 160
Thr Ala Thr Val Thr Ile Pro Ala Ser Tyr Ala Pro Gly Asn Tyr Val
165 170 175
Leu Arg His Glu Ile Ile Ala Leu His Ser Ala Gly Asn Leu Asn Gly
180 185 190
Ala Gln Asn Tyr Pro Gln Cys Phe Asn Ile Gln Ile Thr Gly Gly Gly
195 200 205
Ser Ala Gln Gly Ser Gly Thr Ala Gly Thr Ser Leu Tyr Lys Asn Thr
210 215 220
Asp Pro Gly Ile Lys Phe Asp Ile Tyr Ser Asp Leu Ser Gly Gly Tyr
225 230 235 240
Pro Ile Pro Gly Pro Ala Leu Phe Asn Ala
245 250
&lt;210&gt; 31
&lt;211&gt; 1021
&lt;212&gt; DNA
&lt;213&gt; 嗜松青霉(Penicillium pinophilum)
&lt;400&gt; 31
atgccttcta ctaaagtcgc tgccctttct gctgttctag ctttggcctc cacggttgct 60
ggccatggtt ttgtgcaaaa catcgttatc gacggtaaat cgtaagcagt gatgcatcca 120
ttattaaact agacatgctt acaaaaaaat cagttactct ggataccttg tgaatcagtt 180
cccctacgag tccaacccac cagctgttat tgggtgggca acaactgcaa ccgacctggg 240
attcgtcgct cccagtgagt acaccaatgc agacattatc tgccacaaga acgccacacc 300
tggcgcgctt tctgctccag ttgctgcagg gggcactgtc gagctccagt ggactacatg 360
gcccgatagt catcacggtc ctgtcatcag ctacctcgcc aactgcaatg gcaattgttc 420
taccgtggat aagactaagc tagactttgt caagattgac caaggtggtt tgatcgacga 480
tactaccccc ccgggtacat gggcttccga caaacttatc gctgccaaca acagctggac 540
tgtaactatc ccctccacca tcgcgcctgg aaactacgtt ttgcgccacg aaatcattgc 600
tcttcactcc gctggaaacg cagacggtgc ccaaaactac cctcaatgca tcaacttgga 660
gatcaccggc agcggaaccg ccgctccctc tggtaccgct ggcgaaaagc tctacacctc 720
tactgacccc ggtatcttgg tcaatatcta ccaatccttg tcgacctacg ttattcccgg 780
accaactctg tggagcggtg ctgccaatgg cgctgttgcc actggttctg ctactgcggt 840
tgctacgact gccactgctt ctgcgaccgc tactcctacc acacttgtta cctctgtcgc 900
tccagcttca tctacctttg ccactgctgt tgtgaccact gtcgctcctg cagtaactga 960
tgtcgtgact gtcaccgatg tagttaccgt gaccaccgtc atcaccacta ctgtcctttg 1020
a 1021
&lt;210&gt; 32
&lt;211&gt; 322
&lt;212&gt; PRT
&lt;213&gt; 嗜松青霉(Penicillium pinophilum)
&lt;400&gt; 32
Met Pro Ser Thr Lys Val Ala Ala Leu Ser Ala Val Leu Ala Leu Ala
1 5 10 15
Ser Thr Val Ala Gly His Gly Phe Val Gln Asn Ile Val Ile Asp Gly
20 25 30
Lys Ser Tyr Ser Gly Tyr Leu Val Asn Gln Phe Pro Tyr Glu Ser Asn
35 40 45
Pro Pro Ala Val Ile Gly Trp Ala Thr Thr Ala Thr Asp Leu Gly Phe
50 55 60
Val Ala Pro Ser Glu Tyr Thr Asn Ala Asp Ile Ile Cys His Lys Asn
65 70 75 80
Ala Thr Pro Gly Ala Leu Ser Ala Pro Val Ala Ala Gly Gly Thr Val
85 90 95
Glu Leu Gln Trp Thr Thr Trp Pro Asp Ser His His Gly Pro Val Ile
100 105 110
Ser Tyr Leu Ala Asn Cys Asn Gly Asn Cys Ser Thr Val Asp Lys Thr
115 120 125
Lys Leu Asp Phe Val Lys Ile Asp Gln Gly Gly Leu Ile Asp Asp Thr
130 135 140
Thr Pro Pro Gly Thr Trp Ala Ser Asp Lys Leu Ile Ala Ala Asn Asn
145 150 155 160
Ser Trp Thr Val Thr Ile Pro Ser Thr Ile Ala Pro Gly Asn Tyr Val
165 170 175
Leu Arg His Glu Ile Ile Ala Leu His Ser Ala Gly Asn Ala Asp Gly
180 185 190
Ala Gln Asn Tyr Pro Gln Cys Ile Asn Leu Glu Ile Thr Gly Ser Gly
195 200 205
Thr Ala Ala Pro Ser Gly Thr Ala Gly Glu Lys Leu Tyr Thr Ser Thr
210 215 220
Asp Pro Gly Ile Leu Val Asn Ile Tyr Gln Ser Leu Ser Thr Tyr Val
225 230 235 240
Ile Pro Gly Pro Thr Leu Trp Ser Gly Ala Ala Asn Gly Ala Val Ala
245 250 255
Thr Gly Ser Ala Thr Ala Val Ala Thr Thr Ala Thr Ala Ser Ala Thr
260 265 270
Ala Thr Pro Thr Thr Leu Val Thr Ser Val Ala Pro Ala Ser Ser Thr
275 280 285
Phe Ala Thr Ala Val Val Thr Thr Val Ala Pro Ala Val Thr Asp Val
290 295 300
Val Thr Val Thr Asp Val Val Thr Val Thr Thr Val Ile Thr Thr Thr
305 310 315 320
Val Leu
&lt;210&gt; 33
&lt;211&gt; 1486
&lt;212&gt; DNA
&lt;213&gt; 嗜热子囊菌属物种(Thermoascus sp.)
&lt;400&gt; 33
atgttgtcgt tcgcttctgc caagtcagct gtgctgacga cccttctact tcttggatcc 60
gctcaggctc acactttgat gaccaccctg tttgtggatg gcgtcaatca gggagatggt 120
gtctgtattc gcatgaacaa caacggtagt actgccaaca cctatatcca gcctgtcacg 180
agcaaggata ttgcctgcgg taagtacagt accggtccag atatcatact ctatttcaat 240
ccgacaacag tcagagctgg agagcaatgc taaacatccc caggcattca aggcgaaatt 300
ggcgccgctc gagtctgtcc agccaaggct tcatccaccc tcacgttcca attccgagag 360
cagccatcca acccgaattc cgctcctctc gatccctcgc acaaaggccc cgctgcggtg 420
tacctgaaaa aggtagactc cgccatcgcg agcaacaacg ccgctggaga cggctggttc 480
aagatctggg agtccgtcta cgacgagtcc acgggcaaat ggggtacgac caagatgatc 540
gagaacaacg ggcacatctc tgtcaaggtc cccgacgata tcgagggtgg gtattatctc 600
gcgcgtacgg agcttctggc gctgcacgcg gcgaacgaag gggatccgca gttctacgtt 660
ggctgcgcgc agctgttcat cgattcagcg gggacagcga aaccgcctac tgtctctatt 720
ggagagggga cctacgatct gagcatgcct gccatgacgt acaatatcta ccagactccg 780
ttggctctac catacccgat gtatgggcct cctgtctaca cacctggctc tggctcgggt 840
tctggctctg gttccgggtc agcttctgca acgagatctt ctgctattcc tactgccacc 900
gctgttacgg actgttcttc cgaagaggac agggaagact cagtcatggc aaccggtgtt 960
cccgttgcaa gaagcacact cagaacctgg gttgacagac tgtcatggca tggtaaggcc 1020
cgtgagaacg tgaaaccagc cgccaggaga agcgcccttg tccagaccga gggtctgaag 1080
ccggaaggct gcatcttcgt caacggcaac tggtgcggtt tcgaggtccc cgattacaac 1140
gatgcggaaa gctgctgggc tgtacgttcc cgtctaatta cttaaaacga aataaaagct 1200
aacagtactt ttctttttct aatcccaggc ctccgacaac tgctggaaac agtccgactc 1260
gtgctggaac cagacccagc ccaccggcta caacaactgc cagatctggc aagaccagaa 1320
atgcaagccc atccaggact cgtgtagcca atccaacccg actggaccgc cgaacaaggg 1380
caaggatata actccaacgt ggccgcccct ggagggctcg atgaagacct tcaccaagcg 1440
cactgtcagt taccgtgatt ggattatgaa aaggaaagga gcataa 1486
&lt;210&gt; 34
&lt;211&gt; 444
&lt;212&gt; PRT
&lt;213&gt; 嗜热子囊菌属物种(Thermoascus sp.)
&lt;400&gt; 34
Met Leu Ser Phe Ala Ser Ala Lys Ser Ala Val Leu Thr Thr Leu Leu
1 5 10 15
Leu Leu Gly Ser Ala Gln Ala His Thr Leu Met Thr Thr Leu Phe Val
20 25 30
Asp Gly Val Asn Gln Gly Asp Gly Val Cys Ile Arg Met Asn Asn Asn
35 40 45
Gly Ser Thr Ala Asn Thr Tyr Ile Gln Pro Val Thr Ser Lys Asp Ile
50 55 60
Ala Cys Gly Ile Gln Gly Glu Ile Gly Ala Ala Arg Val Cys Pro Ala
65 70 75 80
Lys Ala Ser Ser Thr Leu Thr Phe Gln Phe Arg Glu Gln Pro Ser Asn
85 90 95
Pro Asn Ser Ala Pro Leu Asp Pro Ser His Lys Gly Pro Ala Ala Val
100 105 110
Tyr Leu Lys Lys Val Asp Ser Ala Ile Ala Ser Asn Asn Ala Ala Gly
115 120 125
Asp Gly Trp Phe Lys Ile Trp Glu Ser Val Tyr Asp Glu Ser Thr Gly
130 135 140
Lys Trp Gly Thr Thr Lys Met Ile Glu Asn Asn Gly His Ile Ser Val
145 150 155 160
Lys Val Pro Asp Asp Ile Glu Gly Gly Tyr Tyr Leu Ala Arg Thr Glu
165 170 175
Leu Leu Ala Leu His Ala Ala Asn Glu Gly Asp Pro Gln Phe Tyr Val
180 185 190
Gly Cys Ala Gln Leu Phe Ile Asp Ser Ala Gly Thr Ala Lys Pro Pro
195 200 205
Thr Val Ser Ile Gly Glu Gly Thr Tyr Asp Leu Ser Met Pro Ala Met
210 215 220
Thr Tyr Asn Ile Tyr Gln Thr Pro Leu Ala Leu Pro Tyr Pro Met Tyr
225 230 235 240
Gly Pro Pro Val Tyr Thr Pro Gly Ser Gly Ser Gly Ser Gly Ser Gly
245 250 255
Ser Gly Ser Ala Ser Ala Thr Arg Ser Ser Ala Ile Pro Thr Ala Thr
260 265 270
Ala Val Thr Asp Cys Ser Ser Glu Glu Asp Arg Glu Asp Ser Val Met
275 280 285
Ala Thr Gly Val Pro Val Ala Arg Ser Thr Leu Arg Thr Trp Val Asp
290 295 300
Arg Leu Ser Trp His Gly Lys Ala Arg Glu Asn Val Lys Pro Ala Ala
305 310 315 320
Arg Arg Ser Ala Leu Val Gln Thr Glu Gly Leu Lys Pro Glu Gly Cys
325 330 335
Ile Phe Val Asn Gly Asn Trp Cys Gly Phe Glu Val Pro Asp Tyr Asn
340 345 350
Asp Ala Glu Ser Cys Trp Ala Ala Ser Asp Asn Cys Trp Lys Gln Ser
355 360 365
Asp Ser Cys Trp Asn Gln Thr Gln Pro Thr Gly Tyr Asn Asn Cys Gln
370 375 380
Ile Trp Gln Asp Gln Lys Cys Lys Pro Ile Gln Asp Ser Cys Ser Gln
385 390 395 400
Ser Asn Pro Thr Gly Pro Pro Asn Lys Gly Lys Asp Ile Thr Pro Thr
405 410 415
Trp Pro Pro Leu Glu Gly Ser Met Lys Thr Phe Thr Lys Arg Thr Val
420 425 430
Ser Tyr Arg Asp Trp Ile Met Lys Arg Lys Gly Ala
435 440
&lt;210&gt; 35
&lt;211&gt; 835
&lt;212&gt; DNA
&lt;213&gt; 青霉属物种(Penicillium sp.)
&lt;400&gt; 35
atgctgtctt cgacgactcg caccctcgcc tttacaggcc ttgcgggcct tctgtccgct 60
cccctggtca aggcccatgg ctttgtccag ggcattgtca tcggtgacca attgtaagtc 120
cctctcttgc agttctgtcg attaactgct ggactgcttg cttgactccc tgctgactcc 180
caacagctac agcgggtaca tcgtcaactc gttcccctac gaatccaacc caccccccgt 240
catcggctgg gccacgaccg ccaccgacct gggcttcgtc gacggcacag gataccaagg 300
cccggacatc atctgccacc ggaatgcgac gcccgcgccg ctgacagccc ccgtggccgc 360
cggcggcacc gtcgagctgc agtggacgcc gtggccggac agccaccacg gacccgtcat 420
cacctacctg gcgccgtgca acggcaactg ctcgaccgtc gacaagacga cgctggagtt 480
cttcaagatc gaccagcagg gcctgatcga cgacacgagc ccgccgggca cctgggcgtc 540
ggacaacctc atcgccaaca acaatagctg gaccgtcacc attcccaaca gcgtcgcccc 600
cggcaactac gtcctgcgcc acgagatcat cgccctgcac tcggccaaca acaaggacgg 660
cgcccagaac tacccccagt gcatcaacat cgaggtcacg ggcggcggct ccgacgcgcc 720
tgagggtact ctgggcgagg atctctacca tgacaccgac ccgggcattc tggtcgacat 780
ttacgagccc attgcgacgt ataccattcc ggggccgcct gagccgacgt tctag 835
&lt;210&gt; 36
&lt;211&gt; 253
&lt;212&gt; PRT
&lt;213&gt; 青霉属物种(Penicillium sp.)
&lt;400&gt; 36
Met Leu Ser Ser Thr Thr Arg Thr Leu Ala Phe Thr Gly Leu Ala Gly
1 5 10 15
Leu Leu Ser Ala Pro Leu Val Lys Ala His Gly Phe Val Gln Gly Ile
20 25 30
Val Ile Gly Asp Gln Phe Tyr Ser Gly Tyr Ile Val Asn Ser Phe Pro
35 40 45
Tyr Glu Ser Asn Pro Pro Pro Val Ile Gly Trp Ala Thr Thr Ala Thr
50 55 60
Asp Leu Gly Phe Val Asp Gly Thr Gly Tyr Gln Gly Pro Asp Ile Ile
65 70 75 80
Cys His Arg Asn Ala Thr Pro Ala Pro Leu Thr Ala Pro Val Ala Ala
85 90 95
Gly Gly Thr Val Glu Leu Gln Trp Thr Pro Trp Pro Asp Ser His His
100 105 110
Gly Pro Val Ile Thr Tyr Leu Ala Pro Cys Asn Gly Asn Cys Ser Thr
115 120 125
Val Asp Lys Thr Thr Leu Glu Phe Phe Lys Ile Asp Gln Gln Gly Leu
130 135 140
Ile Asp Asp Thr Ser Pro Pro Gly Thr Trp Ala Ser Asp Asn Leu Ile
145 150 155 160
Ala Asn Asn Asn Ser Trp Thr Val Thr Ile Pro Asn Ser Val Ala Pro
165 170 175
Gly Asn Tyr Val Leu Arg His Glu Ile Ile Ala Leu His Ser Ala Asn
180 185 190
Asn Lys Asp Gly Ala Gln Asn Tyr Pro Gln Cys Ile Asn Ile Glu Val
195 200 205
Thr Gly Gly Gly Ser Asp Ala Pro Glu Gly Thr Leu Gly Glu Asp Leu
210 215 220
Tyr His Asp Thr Asp Pro Gly Ile Leu Val Asp Ile Tyr Glu Pro Ile
225 230 235 240
Ala Thr Tyr Thr Ile Pro Gly Pro Pro Glu Pro Thr Phe
245 250
&lt;210&gt; 37
&lt;211&gt; 878
&lt;212&gt; DNA
&lt;213&gt; 土生梭孢霉(Thielavia terrestris)
&lt;400&gt; 37
atgaagttct cactggtgtc tctgctggct tacggcctct cggtcgaggc gcactccatc 60
ttccaggttc gtctcgcaca tcacgctcaa ctcggctcgt ggcgtaaggg caaggattaa 120
cacggccggc agagagtctc ggtcaacggc caagaccaag gcctgctcac cggcctccgc 180
gctccaagca acaacaaccc agtgcaagat gtcaacagcc agaacatgat ttgcggccag 240
tcgggctcca agtcgcagac cgttatcaac gtcaaggccg gcgacaggat cggctcgctc 300
tggcagcatg tcatcggcgg cgcccagttt tcgggtgacc cggacaaccc gatcgcccac 360
tcgcacaagg gccccgtgat ggcgtacctt gctaaggtcg acaatgccgc gtccgcgagc 420
caaacgggtc tgaagtggta agtagcgggc gacgctcagg ggacggggat cgggggcctg 480
ctccatccga gactaacacc gtggacaggt tcaagatctg gcaggacggg ttcgatacca 540
gcagcaagac atggggcgtc gacaacctga tcaagaacaa cggctgggtg tacttccacc 600
tgccgcagtg cctcgctccg ggccagtatc tcctgcgcgt cgaggttctg gcgctgcact 660
cggcgtacca gcagggccag gcccagttct accagtcctg cgcccagatc aacgtctccg 720
gctccgggtc cttcagcccg tcccagacgg tcagcatccc gggcgtctac agcgccaccg 780
acccgagcat cctcatcaac atctacggca gcacggggca gcccgacaac ggcggcaagg 840
cttacaaccc ccctggaccc gccccgatct cctgctga 878
&lt;210&gt; 38
&lt;211&gt; 246
&lt;212&gt; PRT
&lt;213&gt; 土生梭孢霉(Thielavia terrestris)
&lt;400&gt; 38
Met Lys Phe Ser Leu Val Ser Leu Leu Ala Tyr Gly Leu Ser Val Glu
1 5 10 15
Ala His Ser Ile Phe Gln Arg Val Ser Val Asn Gly Gln Asp Gln Gly
20 25 30
Leu Leu Thr Gly Leu Arg Ala Pro Ser Asn Asn Asn Pro Val Gln Asp
35 40 45
Val Asn Ser Gln Asn Met Ile Cys Gly Gln Ser Gly Ser Lys Ser Gln
50 55 60
Thr Val Ile Asn Val Lys Ala Gly Asp Arg Ile Gly Ser Leu Trp Gln
65 70 75 80
His Val Ile Gly Gly Ala Gln Phe Ser Gly Asp Pro Asp Asn Pro Ile
85 90 95
Ala His Ser His Lys Gly Pro Val Met Ala Tyr Leu Ala Lys Val Asp
100 105 110
Asn Ala Ala Ser Ala Ser Gln Thr Gly Leu Lys Trp Phe Lys Ile Trp
115 120 125
Gln Asp Gly Phe Asp Thr Ser Ser Lys Thr Trp Gly Val Asp Asn Leu
130 135 140
Ile Lys Asn Asn Gly Trp Val Tyr Phe His Leu Pro Gln Cys Leu Ala
145 150 155 160
Pro Gly Gln Tyr Leu Leu Arg Val Glu Val Leu Ala Leu His Ser Ala
165 170 175
Tyr Gln Gln Gly Gln Ala Gln Phe Tyr Gln Ser Cys Ala Gln Ile Asn
180 185 190
Val Ser Gly Ser Gly Ser Phe Ser Pro Ser Gln Thr Val Ser Ile Pro
195 200 205
Gly Val Tyr Ser Ala Thr Asp Pro Ser Ile Leu Ile Asn Ile Tyr Gly
210 215 220
Ser Thr Gly Gln Pro Asp Asn Gly Gly Lys Ala Tyr Asn Pro Pro Gly
225 230 235 240
Pro Ala Pro Ile Ser Cys
245
&lt;210&gt; 39
&lt;211&gt; 1253
&lt;212&gt; DNA
&lt;213&gt; 土生梭孢霉(Thielavia terrestris)
&lt;400&gt; 39
atgaggacga cattcgccgc cgcgttggca gccttcgctg cgcaggaagt ggcaggccat 60
gccatcttcc aacagctctg ggtggacggc accgactata tacgtgctcc ccttttcctt 120
ttgtgtttgc ccatcctcga ttgataaccc gaggccatcc aatgctgact cttacagcac 180
ggctcctcct gcgtccgcat gccgctgtcg aactcgcccg tcacgaacgt cggcagcagg 240
gacatgatct gcaacgccgg cacgcgcccc gtcagcggga agtgccccgt caaggccggc 300
ggcaccgtga cggttgagat gcaccaggtg ggctgatttc ctgagcgtcc tattcctccc 360
ggaagcccct ttcccatcct ttgccctggc taacccctcc gcccctccca gcaacccggg 420
gatcggtcgt gtaacaacga agccatcggc ggcgcccact ggggaccggt gcaggtgtac 480
ctcagcaagg tggaggacgc gagcacggcg gacgggtcga cgggctggtt caagatcttc 540
gcggacacgt ggtccaagaa ggcgggcagc tcggtggggg acgacgacaa ctggggcacg 600
cgcgacctca acgcgtgctg cggcaagatg caggtcaaga tcccggcgga catcccgtcg 660
ggcgactacc tgctgcgggc ggaggcgctg gcgctgcaca cggcgggcca ggtgggcggc 720
gcgcagttct acatgagctg ctaccagatc accgtgtcgg gcggcggcag cgccagcccg 780
gccaccgtca agttccccgg cgcctacagc gccaacgacc cgggcatcca catcaacatc 840
cacgcggccg tgtccaacta cgtcgcgccc ggcccggccg tctattccgg cggcacgacc 900
aaggtggccg ggtccgggtg ccaaggctgc gagaacacgt gcaaggtcgg ctcgtcgccc 960
acggcgacgg cgccgtcggg caagagcggc gcgggttccg acggcggcgc tgggaccgac 1020
ggcgggtctt cgtcttcgag ccccgacacg ggcagcgcgt gcagcgtgca ggcctacggg 1080
cagtgcggcg ggaacgggta ctcgggttgc acccagtgcg cggtaagttc ggggtcgtct 1140
gtcttttgta ggaacatccg agaggcttgg ctgacgaggc gttgttgtag cccggctata 1200
cttgcaaggc ggtctctccg ccgtactatt cgcagtgcgc cccttcttct tag 1253
&lt;210&gt; 40
&lt;211&gt; 334
&lt;212&gt; PRT
&lt;213&gt; 土生梭孢霉(Thielavia terrestris)
&lt;400&gt; 40
Met Arg Thr Thr Phe Ala Ala Ala Leu Ala Ala Phe Ala Ala Gln Glu
1 5 10 15
Val Ala Gly His Ala Ile Phe Gln Gln Leu Trp His Gly Ser Ser Cys
20 25 30
Val Arg Met Pro Leu Ser Asn Ser Pro Val Thr Asn Val Gly Ser Arg
35 40 45
Asp Met Ile Cys Asn Ala Gly Thr Arg Pro Val Ser Gly Lys Cys Pro
50 55 60
Val Lys Ala Gly Gly Thr Val Thr Val Glu Met His Gln Gln Pro Gly
65 70 75 80
Asp Arg Ser Cys Asn Asn Glu Ala Ile Gly Gly Ala His Trp Gly Pro
85 90 95
Val Gln Val Tyr Leu Ser Lys Val Glu Asp Ala Ser Thr Ala Asp Gly
100 105 110
Ser Thr Gly Trp Phe Lys Ile Phe Ala Asp Thr Trp Ser Lys Lys Ala
115 120 125
Gly Ser Ser Val Gly Asp Asp Asp Asn Trp Gly Thr Arg Asp Leu Asn
130 135 140
Ala Cys Cys Gly Lys Met Gln Val Lys Ile Pro Ala Asp Ile Pro Ser
145 150 155 160
Gly Asp Tyr Leu Leu Arg Ala Glu Ala Leu Ala Leu His Thr Ala Gly
165 170 175
Gln Val Gly Gly Ala Gln Phe Tyr Met Ser Cys Tyr Gln Ile Thr Val
180 185 190
Ser Gly Gly Gly Ser Ala Ser Pro Ala Thr Val Lys Phe Pro Gly Ala
195 200 205
Tyr Ser Ala Asn Asp Pro Gly Ile His Ile Asn Ile His Ala Ala Val
210 215 220
Ser Asn Tyr Val Ala Pro Gly Pro Ala Val Tyr Ser Gly Gly Thr Thr
225 230 235 240
Lys Val Ala Gly Ser Gly Cys Gln Gly Cys Glu Asn Thr Cys Lys Val
245 250 255
Gly Ser Ser Pro Thr Ala Thr Ala Pro Ser Gly Lys Ser Gly Ala Gly
260 265 270
Ser Asp Gly Gly Ala Gly Thr Asp Gly Gly Ser Ser Ser Ser Ser Pro
275 280 285
Asp Thr Gly Ser Ala Cys Ser Val Gln Ala Tyr Gly Gln Cys Gly Gly
290 295 300
Asn Gly Tyr Ser Gly Cys Thr Gln Cys Ala Pro Gly Tyr Thr Cys Lys
305 310 315 320
Ala Val Ser Pro Pro Tyr Tyr Ser Gln Cys Ala Pro Ser Ser
325 330
&lt;210&gt; 41
&lt;211&gt; 798
&lt;212&gt; DNA
&lt;213&gt; 土生梭孢霉(Thielavia terrestris)
&lt;400&gt; 41
atgaagctga gcgttgccat cgccgtgctg gcgtcggctc ttgccgaggc tcactgtgag 60
tgcatcgtct cactccagct actgcgaagc ttgctgacga tggtccctag acaccttccc 120
cagcatcgga aacaccgctg actggcagta tgtgcggatt acaacgaact accagagcaa 180
cgggccggtg acggacgtca cctcggatca aattcggtgc tacgaacgga acccaggcac 240
gggagcgcag ggcatataca acgtcaccgc cggccagacc atcaactaca acgcgaaggc 300
gtccatctcc cacccggggc ccatgtcctt ctacattgct aaggttcccg ccggccaaac 360
cgctgcgacc tgggacggta agggggctgt gtggaccaag atctaccagg acatgcccaa 420
gttcggcagc agcctgacct ggcccaccat gggtaagaat tctcaccctg gaaatgaacg 480
cacatttgca cagatctaac atggcctaca ggcgccaagt ctgtccccgt caccatccct 540
cgttgcctcc agaacggcga ttaccttctg cgagccgagc acatcgctct acacagcgcg 600
agcagcgtcg gtggcgccca gttctacctc tcgtgcgccc agcttactgt cagcggcggc 660
agtggcacct ggaaccccaa gaaccgggtc tccttccccg gcgcttacaa ggcaacagac 720
ccgggcatct tgatcaacat ctactacccc gtgccgacca gctactcgcc gcccggcccg 780
ccggctgaga cgtgctaa 798
&lt;210&gt; 42
&lt;211&gt; 227
&lt;212&gt; PRT
&lt;213&gt; 土生梭孢霉(Thielavia terrestris)
&lt;400&gt; 42
Met Lys Leu Ser Val Ala Ile Ala Val Leu Ala Ser Ala Leu Ala Glu
1 5 10 15
Ala His Tyr Thr Phe Pro Ser Ile Gly Asn Thr Ala Asp Trp Gln Tyr
20 25 30
Val Arg Ile Thr Thr Asn Tyr Gln Ser Asn Gly Pro Val Thr Asp Val
35 40 45
Thr Ser Asp Gln Ile Arg Cys Tyr Glu Arg Asn Pro Gly Thr Gly Ala
50 55 60
Gln Gly Ile Tyr Asn Val Thr Ala Gly Gln Thr Ile Asn Tyr Asn Ala
65 70 75 80
Lys Ala Ser Ile Ser His Pro Gly Pro Met Ser Phe Tyr Ile Ala Lys
85 90 95
Val Pro Ala Gly Gln Thr Ala Ala Thr Trp Asp Gly Lys Gly Ala Val
100 105 110
Trp Thr Lys Ile Tyr Gln Asp Met Pro Lys Phe Gly Ser Ser Leu Thr
115 120 125
Trp Pro Thr Met Gly Ala Lys Ser Val Pro Val Thr Ile Pro Arg Cys
130 135 140
Leu Gln Asn Gly Asp Tyr Leu Leu Arg Ala Glu His Ile Ala Leu His
145 150 155 160
Ser Ala Ser Ser Val Gly Gly Ala Gln Phe Tyr Leu Ser Cys Ala Gln
165 170 175
Leu Thr Val Ser Gly Gly Ser Gly Thr Trp Asn Pro Lys Asn Arg Val
180 185 190
Ser Phe Pro Gly Ala Tyr Lys Ala Thr Asp Pro Gly Ile Leu Ile Asn
195 200 205
Ile Tyr Tyr Pro Val Pro Thr Ser Tyr Ser Pro Pro Gly Pro Pro Ala
210 215 220
Glu Thr Cys
225
&lt;210&gt; 43
&lt;211&gt; 977
&lt;212&gt; DNA
&lt;213&gt; 土生梭孢霉(Thielavia terrestris)
&lt;400&gt; 43
atgaagctgt catcccagct cgccgccctc acgctggccg cggcctccgt gtcaggccac 60
tacatcttcg agcagattgc ccatggcggc accaagttcc caccttacga gtacatccga 120
agaaacacga actataacag ccctgtcacc agtctctcgt cgaacgacct gcgatgcaac 180
gtaggcggcg agacggctgg caacacgacc gtcctcgacg tgaaggcggg cgactccttc 240
accttctact cggacgtggc cgtgtaccac caggggccca tctcactgtg cgtgccccgg 300
gccaactttg atcagtccca agcggactgt ccgctcgcct ggataaccac aattgactga 360
cagcccgcac agctacatgt ccaaggctcc cggctccgtc gtggactacg acggctccgg 420
cgactggttc aagatccacg actggggccc gaccttcagc aacggccagg cctcgtggcc 480
gctgcggggt gcgtcccttc cctttccctc ccccttcctc ccccttcctc cccccctttc 540
cccccttttc tgtctggtcg cacgccctgc tgacgtcccc gtagacaact accagtacaa 600
catcccgacg tgcatcccga acggcgagta cctgctgcgc atccagtcgc tggcgatcca 660
caacccgggc gccacgccgc agttctacat cagctgcgcg caggtccggg tctcgggcgg 720
cggcagcgcc tccccctccc caacggccaa gatccccggc gcgttcaagg cgaccgatcc 780
cgggtatacc gcgaatgtga gtgccctatg ttccttgcgc tccttgttcc ttgctccttg 840
ctcggcgtgc ttgaacgcta cgggctgtgg agggagggat ggatggatga ataggatgct 900
gactgatggt gggacaccag atttacaata acttccactc gtatacggtg ccgggtccgg 960
cggtctttca gtgctag 977
&lt;210&gt; 44
&lt;211&gt; 223
&lt;212&gt; PRT
&lt;213&gt; 土生梭孢霉(Thielavia terrestris)
&lt;400&gt; 44
Met Lys Leu Ser Ser Gln Leu Ala Ala Leu Thr Leu Ala Ala Ala Ser
1 5 10 15
Val Ser Gly His Tyr Ile Phe Glu Gln Ile Ala His Gly Gly Thr Lys
20 25 30
Phe Pro Pro Tyr Glu Tyr Ile Arg Arg Asn Thr Asn Tyr Asn Ser Pro
35 40 45
Val Thr Ser Leu Ser Ser Asn Asp Leu Arg Cys Asn Val Gly Gly Glu
50 55 60
Thr Ala Gly Asn Thr Thr Val Leu Asp Val Lys Ala Gly Asp Ser Phe
65 70 75 80
Thr Phe Tyr Ser Asp Val Ala Val Tyr His Gln Gly Pro Ile Ser Leu
85 90 95
Tyr Met Ser Lys Ala Pro Gly Ser Val Val Asp Tyr Asp Gly Ser Gly
100 105 110
Asp Trp Phe Lys Ile His Asp Trp Gly Pro Thr Phe Ser Asn Gly Gln
115 120 125
Ala Ser Trp Pro Leu Arg Asp Asn Tyr Gln Tyr Asn Ile Pro Thr Cys
130 135 140
Ile Pro Asn Gly Glu Tyr Leu Leu Arg Ile Gln Ser Leu Ala Ile His
145 150 155 160
Asn Pro Gly Ala Thr Pro Gln Phe Tyr Ile Ser Cys Ala Gln Val Arg
165 170 175
Val Ser Gly Gly Gly Ser Ala Ser Pro Ser Pro Thr Ala Lys Ile Pro
180 185 190
Gly Ala Phe Lys Ala Thr Asp Pro Gly Tyr Thr Ala Asn Ile Tyr Asn
195 200 205
Asn Phe His Ser Tyr Thr Val Pro Gly Pro Ala Val Phe Gln Cys
210 215 220
&lt;210&gt; 45
&lt;211&gt; 1107
&lt;212&gt; DNA
&lt;213&gt; 土生梭孢霉(Thielavia terrestris)
&lt;400&gt; 45
atgccttctt tcgcctccaa gactctcctt tccaccctgg cgggtgccgc atccgtggcc 60
gcccacgggc acgtgtcgaa catcgtcatc aacggggtct cgtaccaggg ttacgatccg 120
acctccttcc cttacatgca gaacccgccc atcgtggtcg gctggactgc cgccgacacg 180
gacaacggct ttgttgcccc ggatgccttc gccagtggcg atatcatctg ccacaagaac 240
gccaccaacg ccaagggcca cgccgtggtc gccgcgggag acaagatctt catccagtgg 300
aacacatggc ccgagtccca ccacggcccc gtcatcgact acctcgcgag ctgcggcagc 360
gcgtcctgcg agaccgtcga caagaccaag ctcgagttct tcaagatcga cgaggtcggc 420
ctggtcgacg gcagctcggc gcccggtgtg tggggctccg accagctcat cgccaacaac 480
aactcgtggc tcgtcgagat cccgcccacc atcgcgccgg gcaactacgt cctgcgccac 540
gagatcatcg cgctgcacag cgccgaaaac gccgacggcg cccagaacta cccgcagtgc 600
ttcaacctgc agatcaccgg caccggcacc gccaccccct ccggcgtccc cggcacctcg 660
ctctacaccc cgaccgaccc gggcatcctc gtcaacatct acagcgcccc gatcacctac 720
accgtcccgg ggccggccct catctccggc gccgtcagca tcgcccagtc ctcctccgcc 780
atcaccgcct ccggcaccgc cctgaccggc tctgccaccg cacccgccgc cgccgctgct 840
accacaactt ccaccaccaa cgccgcggct gctgctacct ctgctgctgc tgctgctggt 900
acttccacaa ccaccaccag cgccgcggcc gtggtccaga cctcctcctc ctcctcctcc 960
gccccgtcct ctgccgccgc cgccgccacc accaccgcgg ctgccagcgc ccgcccgacc 1020
ggctgctcct ctggccgctc caggaagcag ccgcgccgcc acgcgcggga tatggtggtt 1080
gcgcgagggg ctgaggaggc aaactga 1107
&lt;210&gt; 46
&lt;211&gt; 368
&lt;212&gt; PRT
&lt;213&gt; 土生梭孢霉(Thielavia terrestris)
&lt;400&gt; 46
Met Pro Ser Phe Ala Ser Lys Thr Leu Leu Ser Thr Leu Ala Gly Ala
1 5 10 15
Ala Ser Val Ala Ala His Gly His Val Ser Asn Ile Val Ile Asn Gly
20 25 30
Val Ser Tyr Gln Gly Tyr Asp Pro Thr Ser Phe Pro Tyr Met Gln Asn
35 40 45
Pro Pro Ile Val Val Gly Trp Thr Ala Ala Asp Thr Asp Asn Gly Phe
50 55 60
Val Ala Pro Asp Ala Phe Ala Ser Gly Asp Ile Ile Cys His Lys Asn
65 70 75 80
Ala Thr Asn Ala Lys Gly His Ala Val Val Ala Ala Gly Asp Lys Ile
85 90 95
Phe Ile Gln Trp Asn Thr Trp Pro Glu Ser His His Gly Pro Val Ile
100 105 110
Asp Tyr Leu Ala Ser Cys Gly Ser Ala Ser Cys Glu Thr Val Asp Lys
115 120 125
Thr Lys Leu Glu Phe Phe Lys Ile Asp Glu Val Gly Leu Val Asp Gly
130 135 140
Ser Ser Ala Pro Gly Val Trp Gly Ser Asp Gln Leu Ile Ala Asn Asn
145 150 155 160
Asn Ser Trp Leu Val Glu Ile Pro Pro Thr Ile Ala Pro Gly Asn Tyr
165 170 175
Val Leu Arg His Glu Ile Ile Ala Leu His Ser Ala Glu Asn Ala Asp
180 185 190
Gly Ala Gln Asn Tyr Pro Gln Cys Phe Asn Leu Gln Ile Thr Gly Thr
195 200 205
Gly Thr Ala Thr Pro Ser Gly Val Pro Gly Thr Ser Leu Tyr Thr Pro
210 215 220
Thr Asp Pro Gly Ile Leu Val Asn Ile Tyr Ser Ala Pro Ile Thr Tyr
225 230 235 240
Thr Val Pro Gly Pro Ala Leu Ile Ser Gly Ala Val Ser Ile Ala Gln
245 250 255
Ser Ser Ser Ala Ile Thr Ala Ser Gly Thr Ala Leu Thr Gly Ser Ala
260 265 270
Thr Ala Pro Ala Ala Ala Ala Ala Thr Thr Thr Ser Thr Thr Asn Ala
275 280 285
Ala Ala Ala Ala Thr Ser Ala Ala Ala Ala Ala Gly Thr Ser Thr Thr
290 295 300
Thr Thr Ser Ala Ala Ala Val Val Gln Thr Ser Ser Ser Ser Ser Ser
305 310 315 320
Ala Pro Ser Ser Ala Ala Ala Ala Ala Thr Thr Thr Ala Ala Ala Ser
325 330 335
Ala Arg Pro Thr Gly Cys Ser Ser Gly Arg Ser Arg Lys Gln Pro Arg
340 345 350
Arg His Ala Arg Asp Met Val Val Ala Arg Gly Ala Glu Glu Ala Asn
355 360 365
&lt;210&gt; 47
&lt;211&gt; 993
&lt;212&gt; DNA
&lt;213&gt; 土生梭孢霉(Thielavia terrestris)
&lt;400&gt; 47
atgccgcccg cactccctca actcctaacc acggtcctga ccgccctcac cctcggttcc 60
accgccctcg cccactcaca cctcgcgtac attatcgtta acggcaagct ctaccagggc 120
ttcgacccgc gcccgcacca ggccaactac ccttcccggg tcgggtggtc caccggcgcc 180
gtcgacgacg gcttcgtcac gccggccaac tactccaccc cggacatcat ttgccacatc 240
gccggcacca gcccggccgg ccacgcgccc gtgcgcccgg gcgaccgcat ccacgtccag 300
tggaacggct ggccggtcgg ccacatcggt cccgtgctgt cgtacctcgc ccgctgcgag 360
tcggacacgg gctgcacggg ccagaacaag accgcgctgc ggtggaccaa gatcgacgac 420
tccagcccga ccatgcagaa cgtcgccggc gcgggcaccc agggcgaggg cacccccggc 480
aagcgctggg ccaccgacgt gctgatcgcc gccaacaaca gctggcaggt cgccgtgccg 540
gcggggctgc cgaccggcgc gtacgtgctg cgcaacgaga tcatcgcgct gcactacgcg 600
gcgaggaaga acggggcgca gaactatccg ctctgcatga acctgtgggt ggacgccagt 660
ggtgataata gtagtgtggc tgcaacgacg gcggcggtga cggcgggggg tctgcagatg 720
gatgcgtatg acgcgcgcgg gttctacaag gagaacgatc cgggcgtgct ggtcaatgtc 780
acggccgcgc tgtcgtcgta tgtcgtgccc gggccgacgg tggcggcggg cgccacgccg 840
gtgccgtacg cgcagcagag cccgagcgtg tcgacggcgg cgggcacgcc cgtcgtcgtt 900
acaaggacta gcgagacggc gccgtacacg ggcgccatga cgccgacggt tgcggcgagg 960
atgaagggga gggggtatga tcggcggggt tag 993
&lt;210&gt; 48
&lt;211&gt; 330
&lt;212&gt; PRT
&lt;213&gt; 土生梭孢霉(Thielavia terrestris)
&lt;400&gt; 48
Met Pro Pro Ala Leu Pro Gln Leu Leu Thr Thr Val Leu Thr Ala Leu
1 5 10 15
Thr Leu Gly Ser Thr Ala Leu Ala His Ser His Leu Ala Tyr Ile Ile
20 25 30
Val Asn Gly Lys Leu Tyr Gln Gly Phe Asp Pro Arg Pro His Gln Ala
35 40 45
Asn Tyr Pro Ser Arg Val Gly Trp Ser Thr Gly Ala Val Asp Asp Gly
50 55 60
Phe Val Thr Pro Ala Asn Tyr Ser Thr Pro Asp Ile Ile Cys His Ile
65 70 75 80
Ala Gly Thr Ser Pro Ala Gly His Ala Pro Val Arg Pro Gly Asp Arg
85 90 95
Ile His Val Gln Trp Asn Gly Trp Pro Val Gly His Ile Gly Pro Val
100 105 110
Leu Ser Tyr Leu Ala Arg Cys Glu Ser Asp Thr Gly Cys Thr Gly Gln
115 120 125
Asn Lys Thr Ala Leu Arg Trp Thr Lys Ile Asp Asp Ser Ser Pro Thr
130 135 140
Met Gln Asn Val Ala Gly Ala Gly Thr Gln Gly Glu Gly Thr Pro Gly
145 150 155 160
Lys Arg Trp Ala Thr Asp Val Leu Ile Ala Ala Asn Asn Ser Trp Gln
165 170 175
Val Ala Val Pro Ala Gly Leu Pro Thr Gly Ala Tyr Val Leu Arg Asn
180 185 190
Glu Ile Ile Ala Leu His Tyr Ala Ala Arg Lys Asn Gly Ala Gln Asn
195 200 205
Tyr Pro Leu Cys Met Asn Leu Trp Val Asp Ala Ser Gly Asp Asn Ser
210 215 220
Ser Val Ala Ala Thr Thr Ala Ala Val Thr Ala Gly Gly Leu Gln Met
225 230 235 240
Asp Ala Tyr Asp Ala Arg Gly Phe Tyr Lys Glu Asn Asp Pro Gly Val
245 250 255
Leu Val Asn Val Thr Ala Ala Leu Ser Ser Tyr Val Val Pro Gly Pro
260 265 270
Thr Val Ala Ala Gly Ala Thr Pro Val Pro Tyr Ala Gln Gln Ser Pro
275 280 285
Ser Val Ser Thr Ala Ala Gly Thr Pro Val Val Val Thr Arg Thr Ser
290 295 300
Glu Thr Ala Pro Tyr Thr Gly Ala Met Thr Pro Thr Val Ala Ala Arg
305 310 315 320
Met Lys Gly Arg Gly Tyr Asp Arg Arg Gly
325 330
&lt;210&gt; 49
&lt;211&gt; 1221
&lt;212&gt; DNA
&lt;213&gt; 土生梭孢霉(Thielavia terrestris)
&lt;400&gt; 49
atgaagacat tcaccgccct cctggccgca gccggcctcg tcgccggcca tggatatgtc 60
gacaacgcca ccattggcgg ccagttttat caggtactct accgcttcac ccaaggtccg 120
ctggccacaa ctctataggt gtcataaatt aacaagccac cgtcccgcag ttctatcagg 180
tgtgctcgct accgaccatg tggtcccgtc tcagcaagcc actcacacgc ccatgatccc 240
ctagccttac gtcgacccgt atttagcaac cttggcacgt agtatttatt gtcccaaata 300
ttgagctgaa ctgcacctcc ctagaatccc gcggtgctaa cattctttca gcccgacagg 360
gtctctcgat ccatcccggg caacggcccg gtcacggacg tcactctcat cgacctgcag 420
tgcaacgcca attccacccc ggccaagctc cacgccactg ccgctgccgg ctcggacgtg 480
attctccgct ggacgctctg gcctgagtcg cacgttggcc ccgtcatcac ctacatggcc 540
cgctgccccg acacgggctg ccaggactgg atgccgggca cttcgtagga gcccatcttg 600
caccatatcc atttcaaccg gccacacgca ctgacccata tgtctgtcta cccctgcagt 660
gcggtctggt tcaagatcaa ggagggcggc cgcgacggca cttccaacac ctgggccgac 720
gtacgtgtac cccgtcccag agagccaaag cccccccttc aacaaagcaa acatctcaat 780
agcccgagcc tacgcactaa cccctctcct tccccctcga aaacacagac cccgctgatg 840
acggcgccca cctcgtacac gtacacgatc ccctcctgcc tgaagaaggg ctactacctg 900
gtccgccacg agatcatcgc gctgcacgcc gcctacacct accccggcgc gcagttctac 960
ccgggctgcc accagctcaa cgtcacgggc ggcgggtcca ccgtaccgtc gagcggcctg 1020
gtggcctttc ccggggcgta caagggcagt gaccccggga ttacgtacga tgcgtataaa 1080
ggtgggttgg ctggttggcc caggtcttgg tgatggggga atgtggtgat gaggtttatt 1140
atttgggatc ccgtggctaa cgtaaccctg ggtgtagcgc aaacgtacca gattcctggg 1200
ccggcggtct ttacttgctg a 1221
&lt;210&gt; 50
&lt;211&gt; 236
&lt;212&gt; PRT
&lt;213&gt; 土生梭孢霉(Thielavia terrestris)
&lt;400&gt; 50
Met Lys Thr Phe Thr Ala Leu Leu Ala Ala Ala Gly Leu Val Ala Gly
1 5 10 15
His Gly Tyr Val Asp Asn Ala Thr Ile Gly Gly Gln Phe Tyr Gln Asn
20 25 30
Pro Ala Val Leu Thr Phe Phe Gln Pro Asp Arg Val Ser Arg Ser Ile
35 40 45
Pro Gly Asn Gly Pro Val Thr Asp Val Thr Leu Ile Asp Leu Gln Cys
50 55 60
Asn Ala Asn Ser Thr Pro Ala Lys Leu His Ala Thr Ala Ala Ala Gly
65 70 75 80
Ser Asp Val Ile Leu Arg Trp Thr Leu Trp Pro Glu Ser His Val Gly
85 90 95
Pro Val Ile Thr Tyr Met Ala Arg Cys Pro Asp Thr Gly Cys Gln Asp
100 105 110
Trp Met Pro Gly Thr Ser Ala Val Trp Phe Lys Ile Lys Glu Gly Gly
115 120 125
Arg Asp Gly Thr Ser Asn Thr Trp Ala Asp Thr Pro Leu Met Thr Ala
130 135 140
Pro Thr Ser Tyr Thr Tyr Thr Ile Pro Ser Cys Leu Lys Lys Gly Tyr
145 150 155 160
Tyr Leu Val Arg His Glu Ile Ile Ala Leu His Ala Ala Tyr Thr Tyr
165 170 175
Pro Gly Ala Gln Phe Tyr Pro Gly Cys His Gln Leu Asn Val Thr Gly
180 185 190
Gly Gly Ser Thr Val Pro Ser Ser Gly Leu Val Ala Phe Pro Gly Ala
195 200 205
Tyr Lys Gly Ser Asp Pro Gly Ile Thr Tyr Asp Ala Tyr Lys Ala Gln
210 215 220
Thr Tyr Gln Ile Pro Gly Pro Ala Val Phe Thr Cys
225 230 235
&lt;210&gt; 51
&lt;211&gt; 933
&lt;212&gt; DNA
&lt;213&gt; 土生梭孢霉(Thielavia terrestris)
&lt;400&gt; 51
atggccttgc tgctcttggc aggcttggcc attctggccg ggccggctca tgcccacggc 60
ggcctcgcca actacacagt gggcaacacc tggtataggg ggtgcgtaag gggggcaccg 120
acaacgcctg cttagtaact ccaccatttc gagcgggcta acaccgggcg cagctacgac 180
cccttcacgc cggcggccga ccagatcggc cagccgtgga tgatccaacg cgcgtgggac 240
tcgatcgacc cgatcttcag cgtcaacgac aaggcgctcg cctgcaacac cccggccacg 300
gcgccgacct cttacattcc catccgcgcg ggcgagaaca tcacggccgt gtactggtac 360
tggctgcacc cggtgggccc catgacggcg tggctggcgc ggtgcgacgg cgactgccgc 420
gacgccgacg tcaacgaggc gcgctggttc aagatctggg aggccggcct gctcagcggg 480
ccgaacctgg ccgagggcat gtggtaccag aaggcgttcc agaactggga cggcagcccg 540
gacctgtggc ccgtcacgat cccggccggg ctgaagagcg gcctgtacat gatccggcac 600
gagatcttgt cgatccacgt cgaggataaa ccgcagtttt atcccgagtg tgcgcatctg 660
aatgtgaccg ggggtgggga cctgctgccg cctgatgagt ttttggtgaa gttcccgggc 720
gcttacaaag aagatagtga gtgaaacgcg aagcttcggt agccattggg ttgcgctgat 780
ggaggttaga cccgtcgatc aagatcaata tctactcgga ccagtacgcc aatacaacgg 840
tgagtgtaac aggtcgagca aaaccaaaca gatgccgatg actgatgatc tcagaattac 900
acaattcccg gagggccgat atgggatggg tga 933
&lt;210&gt; 52
&lt;211&gt; 250
&lt;212&gt; PRT
&lt;213&gt; 土生梭孢霉(Thielavia terrestris)
&lt;400&gt; 52
Met Ala Leu Leu Leu Leu Ala Gly Leu Ala Ile Leu Ala Gly Pro Ala
1 5 10 15
His Ala His Gly Gly Leu Ala Asn Tyr Thr Val Gly Asn Thr Trp Tyr
20 25 30
Arg Gly Tyr Asp Pro Phe Thr Pro Ala Ala Asp Gln Ile Gly Gln Pro
35 40 45
Trp Met Ile Gln Arg Ala Trp Asp Ser Ile Asp Pro Ile Phe Ser Val
50 55 60
Asn Asp Lys Ala Leu Ala Cys Asn Thr Pro Ala Thr Ala Pro Thr Ser
65 70 75 80
Tyr Ile Pro Ile Arg Ala Gly Glu Asn Ile Thr Ala Val Tyr Trp Tyr
85 90 95
Trp Leu His Pro Val Gly Pro Met Thr Ala Trp Leu Ala Arg Cys Asp
100 105 110
Gly Asp Cys Arg Asp Ala Asp Val Asn Glu Ala Arg Trp Phe Lys Ile
115 120 125
Trp Glu Ala Gly Leu Leu Ser Gly Pro Asn Leu Ala Glu Gly Met Trp
130 135 140
Tyr Gln Lys Ala Phe Gln Asn Trp Asp Gly Ser Pro Asp Leu Trp Pro
145 150 155 160
Val Thr Ile Pro Ala Gly Leu Lys Ser Gly Leu Tyr Met Ile Arg His
165 170 175
Glu Ile Leu Ser Ile His Val Glu Asp Lys Pro Gln Phe Tyr Pro Glu
180 185 190
Cys Ala His Leu Asn Val Thr Gly Gly Gly Asp Leu Leu Pro Pro Asp
195 200 205
Glu Phe Leu Val Lys Phe Pro Gly Ala Tyr Lys Glu Asp Asn Pro Ser
210 215 220
Ile Lys Ile Asn Ile Tyr Ser Asp Gln Tyr Ala Asn Thr Thr Asn Tyr
225 230 235 240
Thr Ile Pro Gly Gly Pro Ile Trp Asp Gly
245 250
&lt;210&gt; 53
&lt;211&gt; 1584
&lt;212&gt; DNA
&lt;213&gt; 土生梭孢霉(Thielavia terrestris)
&lt;400&gt; 53
atgatgccgt cccttgttcg cttctcaatg ggtctggcga ccgccttcgc ctcgctgtcc 60
acagcacata ccgtcttcac cacgcttttc atcaacggcg tcgaccaagg ggacgggacc 120
tgcatccgca tggccaagaa gggcagcgtt tgcacccatc ccattgctgg tggcctcgac 180
agcccagaca tggcttgtgg tatgccctct gcgtttcccc tgcgagagct ttcctcgagc 240
taacccaatg ccgcgttgcc caggccgaga cggacaacaa gccgtggcat tcacctgccc 300
agccccggcg ggctccaagt tgagcttcga gttccgcatg tgggccgacg cctctcagcc 360
cggctctatc gacccatccc acctcggctc gacggcaatc tacctcaaac aagtctccaa 420
catcagctcc gactcggctg ccggccctgg ctggttcaag atctacgccg agggctacga 480
cacagccgcc aagaagtggg ccacagagaa gctcatcgac aacggcggcc tgctgagcat 540
cgagcttccg cccactctgc cggcgggata ctacctcgcc cgcagcgaga tcgtcaccat 600
ccagaacgtc accaacgacc acgtcgaccc gcagttctac gttggctgcg cacagctctt 660
cgtccagggg cctccgacca cccccaccgt cccgccagac agactcgtct ccatcccggg 720
ccacgtccat gcctccgacc cggggctgac cttcaacatc tggcgcgacg acccctccaa 780
gacggcctac accgtcgtcg gcccggcccc cttctccccc accgccgccc ccacccccac 840
ctccaccaac accaacgggc agcaacaaca acaacagcaa caggcgataa agcagacgga 900
cggcgtgatc cccgccgact gccagctcaa gaacgccaac tggtgcggcg ccgaggtgcc 960
cgcgtacgcc gacgaggccg gctgctgggc gtcgtcggcc gactgcttcg cccagctgga 1020
cgcctgctac acgtcggcgc cgcccacggg cagccgcggc tgccggctgt gggaggactg 1080
gtgcaccggc attcagcagg gctgccgcgc ggggcggtgg cgggggccgc cgccctttca 1140
tggggagggg gcagcagcgg aggtgtgaac ggttcgggga cgggtggcgg tggtggtggt 1200
ggtggtggtg gcactggctc ttcttcggct tctgccccga cggagacggc ctctgctggc 1260
cgggggggcg caagaatagc tgccgtggcc ggctgcggag gcgggacagg agacatggtt 1320
gaagaggttt tcctctttta ttgggacgct tgcagcggct ggcgacggag ccgtggtggt 1380
ggttcgattc ttgcgaggct tatccttcat gtccttcttc cacttttgag accgaggcga 1440
gcccctcgag tccatttact tctcttccac ctgtacctca acttctgtta tccaggaacc 1500
agtggtttct ataatcgcct gagcattaaa ctaggcatat ggccaagcaa aatgtcgcct 1560
gatgtagcgc attacgtgaa ataa 1584
&lt;210&gt; 54
&lt;211&gt; 478
&lt;212&gt; PRT
&lt;213&gt; 土生梭孢霉(Thielavia terrestris)
&lt;400&gt; 54
Met Met Pro Ser Leu Val Arg Phe Ser Met Gly Leu Ala Thr Ala Phe
1 5 10 15
Ala Ser Leu Ser Thr Ala His Thr Val Phe Thr Thr Leu Phe Ile Asn
20 25 30
Gly Val Asp Gln Gly Asp Gly Thr Cys Ile Arg Met Ala Lys Lys Gly
35 40 45
Ser Val Cys Thr His Pro Ile Ala Gly Gly Leu Asp Ser Pro Asp Met
50 55 60
Ala Cys Gly Arg Asp Gly Gln Gln Ala Val Ala Phe Thr Cys Pro Ala
65 70 75 80
Pro Ala Gly Ser Lys Leu Ser Phe Glu Phe Arg Met Trp Ala Asp Ala
85 90 95
Ser Gln Pro Gly Ser Ile Asp Pro Ser His Leu Gly Ser Thr Ala Ile
100 105 110
Tyr Leu Lys Gln Val Ser Asn Ile Ser Ser Asp Ser Ala Ala Gly Pro
115 120 125
Gly Trp Phe Lys Ile Tyr Ala Glu Gly Tyr Asp Thr Ala Ala Lys Lys
130 135 140
Trp Ala Thr Glu Lys Leu Ile Asp Asn Gly Gly Leu Leu Ser Ile Glu
145 150 155 160
Leu Pro Pro Thr Leu Pro Ala Gly Tyr Tyr Leu Ala Arg Ser Glu Ile
165 170 175
Val Thr Ile Gln Asn Val Thr Asn Asp His Val Asp Pro Gln Phe Tyr
180 185 190
Val Gly Cys Ala Gln Leu Phe Val Gln Gly Pro Pro Thr Thr Pro Thr
195 200 205
Val Pro Pro Asp Arg Leu Val Ser Ile Pro Gly His Val His Ala Ser
210 215 220
Asp Pro Gly Leu Thr Phe Asn Ile Trp Arg Asp Asp Pro Ser Lys Thr
225 230 235 240
Ala Tyr Thr Val Val Gly Pro Ala Pro Phe Ser Pro Thr Ala Ala Pro
245 250 255
Thr Pro Thr Ser Thr Asn Thr Asn Gly Gln Gln Gln Gln Gln Gln Gln
260 265 270
Gln Ala Ile Lys Gln Thr Asp Gly Val Ile Pro Ala Asp Cys Gln Leu
275 280 285
Lys Asn Ala Asn Trp Cys Gly Ala Glu Val Pro Ala Tyr Ala Asp Glu
290 295 300
Ala Gly Cys Trp Ala Ser Ser Ala Asp Cys Phe Ala Gln Leu Asp Ala
305 310 315 320
Cys Tyr Thr Ser Ala Pro Pro Thr Gly Ser Arg Gly Cys Arg Leu Trp
325 330 335
Glu Asp Trp Cys Thr Gly Ile Gln Gln Gly Cys Arg Ala Gly Arg Trp
340 345 350
Arg Gly Pro Pro Pro Phe His Gly Glu Gly Ala Ala Ala Glu Thr Ala
355 360 365
Ser Ala Gly Arg Gly Gly Ala Arg Ile Ala Ala Val Ala Gly Cys Gly
370 375 380
Gly Gly Thr Gly Asp Met Val Glu Glu Val Phe Leu Phe Tyr Trp Asp
385 390 395 400
Ala Cys Ser Gly Trp Arg Arg Ser Arg Gly Gly Gly Ser Ile Leu Ala
405 410 415
Arg Leu Ile Leu His Val Leu Leu Pro Leu Leu Arg Pro Arg Arg Ala
420 425 430
Pro Arg Val His Leu Leu Leu Phe His Leu Tyr Leu Asn Phe Cys Tyr
435 440 445
Pro Gly Thr Ser Gly Phe Tyr Asn Arg Leu Ser Ile Lys Leu Gly Ile
450 455 460
Trp Pro Ser Lys Met Ser Pro Asp Val Ala His Tyr Val Lys
465 470 475
&lt;210&gt; 55
&lt;211&gt; 868
&lt;212&gt; DNA
&lt;213&gt; 土生梭孢霉(Thielavia terrestris)
&lt;400&gt; 55
atgcagctcc tcgtgggctt gctgcttgca gccgtggctg ctcgagcaca ttgtatttct 60
acccctttcc gcgtgcctcc cagcctcaag gcaagaagac gcacgcagca gctaacggac 120
cctatcagac acatttccca gactcgtggt aaatgggcag cccgaggaca aggactggtc 180
ggttacgcgc atgaccaaga acgcgcagag caagcaggga gtccaggacc cgaccagtcc 240
cgacattcgc tgctacacgt cgcagacggc gcctaacgtg gctacggtcc ctgccggagc 300
caccgtccat tacatatcga ctcagcagat caaccacccg ggcccgacgc agtactacct 360
cgccaaggta ccggcggggt cgtcggccaa gacgtgggac gggtcagggg ccgtctggtt 420
caagatctcg accaccatgc cttacttgga caacaacaag cagcttgtct ggccgaatca 480
gagtaggaac aattcccgct ccaatcttcg atttggcctt gagctacggc cgattgcatg 540
ggagagaccg ttgactgacg gggcaaccca accttcatca gacacgtaca cgacggtcaa 600
cacgaccatc cccgccgata cgcccagtgg ggaatacctc ctccgggtcg agcagatcgc 660
gctgcacctg gcctcgcagc ccaacggggc tcagttctac ctggcctgct cgcagatcca 720
gattacgggc ggcggcaacg gcacgcccgg cccgctagtc gcgttgccgg gggcgtacaa 780
gagcaacgac ccgggcattt tggtcaacat ctactctatg cagcccggcg attacaagcc 840
gcccgggccg ccggtgtgga gtggctga 868
&lt;210&gt; 56
&lt;211&gt; 230
&lt;212&gt; PRT
&lt;213&gt; 土生梭孢霉(Thielavia terrestris)
&lt;400&gt; 56
Met Gln Leu Leu Val Gly Leu Leu Leu Ala Ala Val Ala Ala Arg Ala
1 5 10 15
His Tyr Thr Phe Pro Arg Leu Val Val Asn Gly Gln Pro Glu Asp Lys
20 25 30
Asp Trp Ser Val Thr Arg Met Thr Lys Asn Ala Gln Ser Lys Gln Gly
35 40 45
Val Gln Asp Pro Thr Ser Pro Asp Ile Arg Cys Tyr Thr Ser Gln Thr
50 55 60
Ala Pro Asn Val Ala Thr Val Pro Ala Gly Ala Thr Val His Tyr Ile
65 70 75 80
Ser Thr Gln Gln Ile Asn His Pro Gly Pro Thr Gln Tyr Tyr Leu Ala
85 90 95
Lys Val Pro Ala Gly Ser Ser Ala Lys Thr Trp Asp Gly Ser Gly Ala
100 105 110
Val Trp Phe Lys Ile Ser Thr Thr Met Pro Tyr Leu Asp Asn Asn Lys
115 120 125
Gln Leu Val Trp Pro Asn Gln Asn Thr Tyr Thr Thr Val Asn Thr Thr
130 135 140
Ile Pro Ala Asp Thr Pro Ser Gly Glu Tyr Leu Leu Arg Val Glu Gln
145 150 155 160
Ile Ala Leu His Leu Ala Ser Gln Pro Asn Gly Ala Gln Phe Tyr Leu
165 170 175
Ala Cys Ser Gln Ile Gln Ile Thr Gly Gly Gly Asn Gly Thr Pro Gly
180 185 190
Pro Leu Val Ala Leu Pro Gly Ala Tyr Lys Ser Asn Asp Pro Gly Ile
195 200 205
Leu Val Asn Ile Tyr Ser Met Gln Pro Gly Asp Tyr Lys Pro Pro Gly
210 215 220
Pro Pro Val Trp Ser Gly
225 230
&lt;210&gt; 57
&lt;211&gt; 1068
&lt;212&gt; DNA
&lt;213&gt; 土生梭孢霉(Thielavia terrestris)
&lt;400&gt; 57
atgaagctgt acctggcggc ctttctaggc gccgtcgcca ccccgggagc gttcgctcat 60
cgtaggttcc ccgtctatct ccctaggggt agcaccacga ctaatttctc gtcgtccccc 120
tgtagaaatc cacgggattc tacttgtcaa cggcaccgaa acgccggaat ggaaatacgt 180
ccggtaatat ctaccttgct ctccttcttc cacaaccagc ctaacacatc atcagtgacg 240
tggcctggga gggcgcctac gaaccggaaa aataccccaa caccgagttc tttaagacgc 300
ccccgcagac ggacatcaac aacccgaaca tcacctgcgg caggaacgcg ttcgactcgg 360
ccagcaagac tgagacggcc gacatactgg ccggctcaga ggtcggcttc cgcgtctcgt 420
gggacggcaa cggcaagtac ggcgtgttct ggcatcccgg gccggggcag atctacctct 480
ctcgtgctcc gaacgacgac ctggaggact accgcggcga cggagactgg ttcaagatcg 540
caaccggcgc cgccgtctcc aataccgagt ggctgctgtg gaacaagcat gacgtgagcc 600
ccaacattcc tcgcccaatc gatccccaac ctggtcacca tggcggcgtc cgggatgcaa 660
agagactaac tccagaggaa cctacctagt tcaacttcac catccccaag acgacgccgc 720
cgggcaagta cctgatgcgc atcgagcagt tcatgccctc cacggtcgaa tacagccagt 780
ggtacgtcaa ctgcgcccac gtcaacatca tcggccccgg cggaggcacg ccgacgggct 840
ttgccaggtt tcccggcacc tacactgttg acgatcccgg taagccggac ctaccggaca 900
cagaggcctc gggatagctt gctaaccttg tttgctctct ctctttttct ctcccgacta 960
ggcatcaagg tgccgttgaa ccagatcgtc aacagcggag agttgccgca ggaccaactg 1020
aggctgctcg agtacaagcc cccgggccca gcgctgtgga ctggttga 1068
&lt;210&gt; 58
&lt;211&gt; 257
&lt;212&gt; PRT
&lt;213&gt; 土生梭孢霉(Thielavia terrestris)
&lt;400&gt; 58
Met Lys Leu Tyr Leu Ala Ala Phe Leu Gly Ala Val Ala Thr Pro Gly
1 5 10 15
Ala Phe Ala His Gln Ile His Gly Ile Leu Leu Val Asn Gly Thr Glu
20 25 30
Thr Pro Glu Trp Lys Tyr Val Arg Asp Val Ala Trp Glu Gly Ala Tyr
35 40 45
Glu Pro Glu Lys Tyr Pro Asn Thr Glu Phe Phe Lys Thr Pro Pro Gln
50 55 60
Thr Asp Ile Asn Asn Pro Asn Ile Thr Cys Gly Arg Asn Ala Phe Asp
65 70 75 80
Ser Ala Ser Lys Thr Glu Thr Ala Asp Ile Leu Ala Gly Ser Glu Val
85 90 95
Gly Phe Arg Val Ser Trp Asp Gly Asn Gly Lys Tyr Gly Val Phe Trp
100 105 110
His Pro Gly Pro Gly Gln Ile Tyr Leu Ser Arg Ala Pro Asn Asp Asp
115 120 125
Leu Glu Asp Tyr Arg Gly Asp Gly Asp Trp Phe Lys Ile Ala Thr Gly
130 135 140
Ala Ala Val Ser Asn Thr Glu Trp Leu Leu Trp Asn Lys His Asp Phe
145 150 155 160
Asn Phe Thr Ile Pro Lys Thr Thr Pro Pro Gly Lys Tyr Leu Met Arg
165 170 175
Ile Glu Gln Phe Met Pro Ser Thr Val Glu Tyr Ser Gln Trp Tyr Val
180 185 190
Asn Cys Ala His Val Asn Ile Ile Gly Pro Gly Gly Gly Thr Pro Thr
195 200 205
Gly Phe Ala Arg Phe Pro Gly Thr Tyr Thr Val Asp Asp Pro Gly Ile
210 215 220
Lys Val Pro Leu Asn Gln Ile Val Asn Ser Gly Glu Leu Pro Gln Asp
225 230 235 240
Gln Leu Arg Leu Leu Glu Tyr Lys Pro Pro Gly Pro Ala Leu Trp Thr
245 250 255
Gly
&lt;210&gt; 59
&lt;211&gt; 871
&lt;212&gt; DNA
&lt;213&gt; 甲壳嗜热子囊菌(Thermoascus crustaceus)
&lt;400&gt; 59
atggcctttt cccagataat ggctattacc ggcgtttttc ttgcctctgc ttccctggtg 60
gctggccatg gctttgttca gaatatcgtg attgatggta aaaggtacct aactacctac 120
cttactatct gatgtcattt acaagaaagg gcacagacac aagcggcaaa aaaaagaaag 180
aaagaaagaa agaaagaaag ctgacaaaaa ttcaacaagt tatggcgggt acatcgtgaa 240
ccaatatcca tacatgtcag atcctccgga ggtcgtcggc tggtctacca ccgcaaccga 300
cctcggattc gtggacggta ccggatacca aggacctgat atcatctgcc acaggggcgc 360
caagcctgca gccctgactg cccaagtggc cgccggagga accgtcaagc tggaatggac 420
tccatggcct gattctcacc acggcccggt gatcaactac cttgctcctt gcaacggtga 480
ctgttccacc gtggacaaga cccaattgaa attcttcaag atcgcccagg ccggtctcat 540
cgatgacaac agtcctcctg gtatctgggc ctcagacaat ctgatagcgg ccaacaacag 600
ctggactgtc accatcccaa ccacaactgc acctggaaac tatgttctaa ggcatgagat 660
cattgctctc cactcagctg ggaacaagga tggtgcgcag aactatcccc agtgcatcaa 720
cctgaaggtc actggaaatg gttctggcaa tcctcctgct ggtgctcttg gaacggcact 780
ctacaaggat acagatccgg gaattctgat caatatctac cagaaacttt ccagctatgt 840
tattcctggt cctgctttgt acactggtta g 871
&lt;210&gt; 60
&lt;211&gt; 251
&lt;212&gt; PRT
&lt;213&gt; 甲壳嗜热子囊菌(Thermoascus crustaceus)
&lt;400&gt; 60
Met Ala Phe Ser Gln Ile Met Ala Ile Thr Gly Val Phe Leu Ala Ser
1 5 10 15
Ala Ser Leu Val Ala Gly His Gly Phe Val Gln Asn Ile Val Ile Asp
20 25 30
Gly Lys Ser Tyr Gly Gly Tyr Ile Val Asn Gln Tyr Pro Tyr Met Ser
35 40 45
Asp Pro Pro Glu Val Val Gly Trp Ser Thr Thr Ala Thr Asp Leu Gly
50 55 60
Phe Val Asp Gly Thr Gly Tyr Gln Gly Pro Asp Ile Ile Cys His Arg
65 70 75 80
Gly Ala Lys Pro Ala Ala Leu Thr Ala Gln Val Ala Ala Gly Gly Thr
85 90 95
Val Lys Leu Glu Trp Thr Pro Trp Pro Asp Ser His His Gly Pro Val
100 105 110
Ile Asn Tyr Leu Ala Pro Cys Asn Gly Asp Cys Ser Thr Val Asp Lys
115 120 125
Thr Gln Leu Lys Phe Phe Lys Ile Ala Gln Ala Gly Leu Ile Asp Asp
130 135 140
Asn Ser Pro Pro Gly Ile Trp Ala Ser Asp Asn Leu Ile Ala Ala Asn
145 150 155 160
Asn Ser Trp Thr Val Thr Ile Pro Thr Thr Thr Ala Pro Gly Asn Tyr
165 170 175
Val Leu Arg His Glu Ile Ile Ala Leu His Ser Ala Gly Asn Lys Asp
180 185 190
Gly Ala Gln Asn Tyr Pro Gln Cys Ile Asn Leu Lys Val Thr Gly Asn
195 200 205
Gly Ser Gly Asn Pro Pro Ala Gly Ala Leu Gly Thr Ala Leu Tyr Lys
210 215 220
Asp Thr Asp Pro Gly Ile Leu Ile Asn Ile Tyr Gln Lys Leu Ser Ser
225 230 235 240
Tyr Val Ile Pro Gly Pro Ala Leu Tyr Thr Gly
245 250
&lt;210&gt; 61
&lt;211&gt; 1102
&lt;212&gt; DNA
&lt;213&gt; 甲壳嗜热子囊菌(Thermoascus crustaceus)
&lt;400&gt; 61
atgtcattct cgaagatact tgctatcgct ggggccatta cctacgcatc ttcagctgcc 60
gctcatggtt atgtccaggg aattgttgtc gatggcagct agtatgtcac tctggatgga 120
accttcagca cgtactgtac taacaatcag cagctacggg ggatatatgg tgacccaata 180
tccctacacc gctcaacctc cggaactcat cgcctggtcc actaaagcaa ccgatcttgg 240
gtttgtggac ggcagtggct atacttctcc tgatatcatc tgccataagg gtgctgagcc 300
tggtgcccag agcgccaaag tggcagctgg agggaccgtt gagctgcagt ggacggcatg 360
gcccgagtct cacaagggcc cagttattga ctacctcgcc gcctgcgacg gggactgctc 420
atctgttgat aagactgcac taaagttctt taagattgac gagagtggtc tgattgacgg 480
caacggtgct ggaacatggg cctctgatac gttgatcaaa aataacaaca gctggactgt 540
caccatccca agcacaattg cttccggaaa ctacgtacta agacacgaaa taattgcgct 600
ccattctgcc ggaaacaaag atggtgctca gaactatccc cagtgtatca acctcgaggt 660
cactggtagt ggcaccgaaa accctgctgg cactctcgga acagcgcttt acacagacac 720
tgatcctggc cttctggtca acatctacca gggtctgtcc aactattcaa tccctggtcc 780
tgctctgtat agcggcaaca gtgataacgc tggttccctc aaccctacca ccacgccgtc 840
aattcagaat gctgctgctg ctccctccac ttccacagca tctgttgtca ctgattcttc 900
gtcagccacc cagactgcta gtgtcgccgc cacgactcca gcctccactt cggctgttac 960
agcctcacca gctcccgata ctggaagcga cgtaaccaaa tatctggatt cgatgagctc 1020
ggatgaggtc ctcaccctgg tgcgcgggac cctgtcttgg ctggtttcta acaagaaaca 1080
tgcgcgggat ctttctcact ga 1102
&lt;210&gt; 62
&lt;211&gt; 349
&lt;212&gt; PRT
&lt;213&gt; 甲壳嗜热子囊菌(Thermoascus crustaceus)
&lt;400&gt; 62
Met Ser Phe Ser Lys Ile Leu Ala Ile Ala Gly Ala Ile Thr Tyr Ala
1 5 10 15
Ser Ser Ala Ala Ala His Gly Tyr Val Gln Gly Ile Val Val Asp Gly
20 25 30
Ser Tyr Tyr Gly Gly Tyr Met Val Thr Gln Tyr Pro Tyr Thr Ala Gln
35 40 45
Pro Pro Glu Leu Ile Ala Trp Ser Thr Lys Ala Thr Asp Leu Gly Phe
50 55 60
Val Asp Gly Ser Gly Tyr Thr Ser Pro Asp Ile Ile Cys His Lys Gly
65 70 75 80
Ala Glu Pro Gly Ala Gln Ser Ala Lys Val Ala Ala Gly Gly Thr Val
85 90 95
Glu Leu Gln Trp Thr Ala Trp Pro Glu Ser His Lys Gly Pro Val Ile
100 105 110
Asp Tyr Leu Ala Ala Cys Asp Gly Asp Cys Ser Ser Val Asp Lys Thr
115 120 125
Ala Leu Lys Phe Phe Lys Ile Asp Glu Ser Gly Leu Ile Asp Gly Asn
130 135 140
Gly Ala Gly Thr Trp Ala Ser Asp Thr Leu Ile Lys Asn Asn Asn Ser
145 150 155 160
Trp Thr Val Thr Ile Pro Ser Thr Ile Ala Ser Gly Asn Tyr Val Leu
165 170 175
Arg His Glu Ile Ile Ala Leu His Ser Ala Gly Asn Lys Asp Gly Ala
180 185 190
Gln Asn Tyr Pro Gln Cys Ile Asn Leu Glu Val Thr Gly Ser Gly Thr
195 200 205
Glu Asn Pro Ala Gly Thr Leu Gly Thr Ala Leu Tyr Thr Asp Thr Asp
210 215 220
Pro Gly Leu Leu Val Asn Ile Tyr Gln Gly Leu Ser Asn Tyr Ser Ile
225 230 235 240
Pro Gly Pro Ala Leu Tyr Ser Gly Asn Ser Asp Asn Ala Gly Ser Leu
245 250 255
Asn Pro Thr Thr Thr Pro Ser Ile Gln Asn Ala Ala Ala Ala Pro Ser
260 265 270
Thr Ser Thr Ala Ser Val Val Thr Asp Ser Ser Ser Ala Thr Gln Thr
275 280 285
Ala Ser Val Ala Ala Thr Thr Pro Ala Ser Thr Ser Ala Val Thr Ala
290 295 300
Ser Pro Ala Pro Asp Thr Gly Ser Asp Val Thr Lys Tyr Leu Asp Ser
305 310 315 320
Met Ser Ser Asp Glu Val Leu Thr Leu Val Arg Gly Thr Leu Ser Trp
325 330 335
Leu Val Ser Asn Lys Lys His Ala Arg Asp Leu Ser His
340 345
&lt;210&gt; 63
&lt;211&gt; 1493
&lt;212&gt; DNA
&lt;213&gt; 甲壳嗜热子囊菌(Thermoascus crustaceus)
&lt;400&gt; 63
atgttgtcat tcattcccac caagtcagct gcgctgacga ctcttctact tcttggaaca 60
gctcatgctc acactttgat gaccaccatg tttgtggacg gcgtcaacca gggagatggt 120
gtctgcattc gcatgaacaa tgacggcgga actgccaata cctatatcca gcctatcacg 180
agcaaggata tcgcctgcgg taagtaccca gatgtcatca tactctgcca taacatccgt 240
catatctact agaatcggag caatgttaag tatttccagg catccaaggc gaaatcggcg 300
cctcccgagt ctgcccagtc aaggcatctt ccaccctaac cttccaattc cgcgagcaac 360
ccaacaaccc aaactcctcc cctctcgatc catcgcacaa aggccccgcc gcggtgtacc 420
tgaaaaaggt cgactccgcc atcgcgagca acaacgccgc cggagacagc tggttcaaga 480
tctgggagtc cgtctacgac gagtccacgg gcaaatgggg cacgaccaag atgatcgaga 540
acaacgggca catctccgtc aaggtgcccg atgatatcga gggtggttac tatcttgccc 600
ggacggagct gctggcgcta cattctgcgg atcaggggga tccgcagttc tatgttggct 660
gtgcgcagct gtttatcgat tcggatggga cggcgaaacc gcccactgtt tctattggag 720
aggggacgta cgatctgagc atgcctgcca tgacgtataa tatctgggag acaccgttgg 780
ctctgccgta tccgatgtat gggcctcctg tctatacgcc tggctctggt tctggatcag 840
tccgtgcgac gagctcttct gctgtcccta ctgcaaccga atcctctttt gtagaggaaa 900
gagcaaaccc cgtcacggca aacagtgttt attctgcaag gggcaaattc aaaacctgga 960
ttgataaact gtcatggcgc gggaaggtcc gtgagaacgt cagacaagcc gcgggaagaa 1020
gaagcactct cgtccagact gtgggtctaa agccaaaagg ctgcatcttc gtcaatggaa 1080
actggtgcgg cttcgaggtt cccgactaca acgatgcgga gagctgctgg gctgtatgtt 1140
cccctcctta gcctcttaca tccctaagta ctacatttga aaacaacaaa aagaaatgta 1200
tatactaact acgtacgctc tactctaggc ctccgacaac tgctggaaac agtccgacgc 1260
ctgctggaac aagacccaac ccacgggcta caataactgc cagatctggc aggacaagaa 1320
atgcaaggtc atccaggatt cctgtagcgg acccaacccg catggaccac cgaataaggg 1380
caaggatttg actccggagt ggccgccact gaagggctcg atggatacgt tctccaagcg 1440
tactatcggt taccgcgatt ggattgttag aaggagaggt gcatgagggt gta 1493
&lt;210&gt; 64
&lt;211&gt; 436
&lt;212&gt; PRT
&lt;213&gt; 甲壳嗜热子囊菌(Thermoascus crustaceus)
&lt;400&gt; 64
Met Leu Ser Phe Ile Pro Thr Lys Ser Ala Ala Leu Thr Thr Leu Leu
1 5 10 15
Leu Leu Gly Thr Ala His Ala His Thr Leu Met Thr Thr Met Phe Val
20 25 30
Asp Gly Val Asn Gln Gly Asp Gly Val Cys Ile Arg Met Asn Asn Asp
35 40 45
Gly Gly Thr Ala Asn Thr Tyr Ile Gln Pro Ile Thr Ser Lys Asp Ile
50 55 60
Ala Cys Gly Ile Gln Gly Glu Ile Gly Ala Ser Arg Val Cys Pro Val
65 70 75 80
Lys Ala Ser Ser Thr Leu Thr Phe Gln Phe Arg Glu Gln Pro Asn Asn
85 90 95
Pro Asn Ser Ser Pro Leu Asp Pro Ser His Lys Gly Pro Ala Ala Val
100 105 110
Tyr Leu Lys Lys Val Asp Ser Ala Ile Ala Ser Asn Asn Ala Ala Gly
115 120 125
Asp Ser Trp Phe Lys Ile Trp Glu Ser Val Tyr Asp Glu Ser Thr Gly
130 135 140
Lys Trp Gly Thr Thr Lys Met Ile Glu Asn Asn Gly His Ile Ser Val
145 150 155 160
Lys Val Pro Asp Asp Ile Glu Gly Gly Tyr Tyr Leu Ala Arg Thr Glu
165 170 175
Leu Leu Ala Leu His Ser Ala Asp Gln Gly Asp Pro Gln Phe Tyr Val
180 185 190
Gly Cys Ala Gln Leu Phe Ile Asp Ser Asp Gly Thr Ala Lys Pro Pro
195 200 205
Thr Val Ser Ile Gly Glu Gly Thr Tyr Asp Leu Ser Met Pro Ala Met
210 215 220
Thr Tyr Asn Ile Trp Glu Thr Pro Leu Ala Leu Pro Tyr Pro Met Tyr
225 230 235 240
Gly Pro Pro Val Tyr Thr Pro Gly Ser Gly Ser Gly Ser Val Arg Ala
245 250 255
Thr Ser Ser Ser Ala Val Pro Thr Ala Thr Glu Ser Ser Phe Val Glu
260 265 270
Glu Arg Ala Asn Pro Val Thr Ala Asn Ser Val Tyr Ser Ala Arg Gly
275 280 285
Lys Phe Lys Thr Trp Ile Asp Lys Leu Ser Trp Arg Gly Lys Val Arg
290 295 300
Glu Asn Val Arg Gln Ala Ala Gly Arg Arg Ser Thr Leu Val Gln Thr
305 310 315 320
Val Gly Leu Lys Pro Lys Gly Cys Ile Phe Val Asn Gly Asn Trp Cys
325 330 335
Gly Phe Glu Val Pro Asp Tyr Asn Asp Ala Glu Ser Cys Trp Ala Ala
340 345 350
Ser Asp Asn Cys Trp Lys Gln Ser Asp Ala Cys Trp Asn Lys Thr Gln
355 360 365
Pro Thr Gly Tyr Asn Asn Cys Gln Ile Trp Gln Asp Lys Lys Cys Lys
370 375 380
Val Ile Gln Asp Ser Cys Ser Gly Pro Asn Pro His Gly Pro Pro Asn
385 390 395 400
Lys Gly Lys Asp Leu Thr Pro Glu Trp Pro Pro Leu Lys Gly Ser Met
405 410 415
Asp Thr Phe Ser Lys Arg Thr Ile Gly Tyr Arg Asp Trp Ile Val Arg
420 425 430
Arg Arg Gly Ala
435
&lt;210&gt; 65
&lt;211&gt; 1035
&lt;212&gt; DNA
&lt;213&gt; 棘孢曲霉(Aspergillus aculeatus)
&lt;400&gt; 65
atgaagtata ttcctctcgt tattgcagtt gctgccggcc tggcacgtcc ggctactgcc 60
cactacatct tcagcaagct cgtgctgaac ggagaggcat ctgcggactg gcaatacatc 120
cgcgagacta ctcgcagcat agtctatgag ccgaccaagt acacctctac cttcgataac 180
ctaacaccca gcgatagcga cttccgctgt aatctcggtt ccttcagcaa tgctgcgaag 240
accgaggtcg ctgaggttgc ggcaggcgat accatcgcaa tgaagctatt ctacgacacc 300
agtattgcgc atcctggccc gggacaagtt tatatgtcca aggcaccgac cggcaatgtt 360
caggaatacc aaggagacgg ggattggttc aaaatctggg aaaagaccct ttgcaacacg 420
gatggtgatc tgactacaga ggcctggtgc acctggggca tgtcacagtt tgaatttcaa 480
atcccagctg cgaccccggc aggagagtac ctagtgcgcg ccgagcatat aggcctgcat 540
ggcgctcaag cgaacgaggc cgaattcttc tacagctgtg cgcagatcaa ggttacaggc 600
tcgggaactg gatctcccag tctcacgtat caaattcctg gtctctataa cgacactatg 660
accctgttca atggcctcaa tctttggact gattcagccg agaaggtgca gctggatttc 720
ctggagacgc caattgggga cgacgtgtgg agcggagcag gctcggggag cccatctgct 780
gccacctctt cgaccagcgg tgcaactctt gcagctcagg gtacaactac ctctgccgcg 840
catgctcagg cccagaccac cattaccacc agcaccagca ccatcacgtc tctcgaatca 900
gccagctcaa ccgatctcgt tgcgcagtat ggtcagtgcg gaggccttaa ctggtccggt 960
ccaaccgagt gtgagacacc ttatacctgt gtgcagcaga acccttacta ccatcaatgc 1020
gtgaattcgt gctga 1035
&lt;210&gt; 66
&lt;211&gt; 344
&lt;212&gt; PRT
&lt;213&gt; 棘孢曲霉(Aspergillus aculeatus)
&lt;400&gt; 66
Met Lys Tyr Ile Pro Leu Val Ile Ala Val Ala Ala Gly Leu Ala Arg
1 5 10 15
Pro Ala Thr Ala His Tyr Ile Phe Ser Lys Leu Val Leu Asn Gly Glu
20 25 30
Ala Ser Ala Asp Trp Gln Tyr Ile Arg Glu Thr Thr Arg Ser Ile Val
35 40 45
Tyr Glu Pro Thr Lys Tyr Thr Ser Thr Phe Asp Asn Leu Thr Pro Ser
50 55 60
Asp Ser Asp Phe Arg Cys Asn Leu Gly Ser Phe Ser Asn Ala Ala Lys
65 70 75 80
Thr Glu Val Ala Glu Val Ala Ala Gly Asp Thr Ile Ala Met Lys Leu
85 90 95
Phe Tyr Asp Thr Ser Ile Ala His Pro Gly Pro Gly Gln Val Tyr Met
100 105 110
Ser Lys Ala Pro Thr Gly Asn Val Gln Glu Tyr Gln Gly Asp Gly Asp
115 120 125
Trp Phe Lys Ile Trp Glu Lys Thr Leu Cys Asn Thr Asp Gly Asp Leu
130 135 140
Thr Thr Glu Ala Trp Cys Thr Trp Gly Met Ser Gln Phe Glu Phe Gln
145 150 155 160
Ile Pro Ala Ala Thr Pro Ala Gly Glu Tyr Leu Val Arg Ala Glu His
165 170 175
Ile Gly Leu His Gly Ala Gln Ala Asn Glu Ala Glu Phe Phe Tyr Ser
180 185 190
Cys Ala Gln Ile Lys Val Thr Gly Ser Gly Thr Gly Ser Pro Ser Leu
195 200 205
Thr Tyr Gln Ile Pro Gly Leu Tyr Asn Asp Thr Met Thr Leu Phe Asn
210 215 220
Gly Leu Asn Leu Trp Thr Asp Ser Ala Glu Lys Val Gln Leu Asp Phe
225 230 235 240
Leu Glu Thr Pro Ile Gly Asp Asp Val Trp Ser Gly Ala Gly Ser Gly
245 250 255
Ser Pro Ser Ala Ala Thr Ser Ser Thr Ser Gly Ala Thr Leu Ala Ala
260 265 270
Gln Gly Thr Thr Thr Ser Ala Ala His Ala Gln Ala Gln Thr Thr Ile
275 280 285
Thr Thr Ser Thr Ser Thr Ile Thr Ser Leu Glu Ser Ala Ser Ser Thr
290 295 300
Asp Leu Val Ala Gln Tyr Gly Gln Cys Gly Gly Leu Asn Trp Ser Gly
305 310 315 320
Pro Thr Glu Cys Glu Thr Pro Tyr Thr Cys Val Gln Gln Asn Pro Tyr
325 330 335
Tyr His Gln Cys Val Asn Ser Cys
340
&lt;210&gt; 67
&lt;211&gt; 1203
&lt;212&gt; DNA
&lt;213&gt; 棘孢曲霉(Aspergillus aculeatus)
&lt;400&gt; 67
atgtctgttg ctaagtttgc tggtgttatc ctcggttcgg ccgctctcgt cgctggccac 60
ggttacgtgt cgggtgctgt tgtcgacgga acctactatg gcggctacat tgtcacttcc 120
tacccctatt ccagcgatcc cccggagacc attggatggt ctaccgaggc gaccgacttg 180
ggtttcgtcg atggtagcga gtatgctgat gccgacatca tttgccacaa gagtgccaag 240
cccggtgcca tctctgctga ggtcaaggcc ggtggtactg ttgagctcca gtggactacc 300
tggcccgaca gccaccacgg ccctgtcctg acctaccttg ccaactgcaa tggtgactgc 360
agcagcgtca ccaagaccga cctcgagttt ttcaagattg acgagagcgg tctcatcaac 420
gacgacgacg tccccggtac ctgggccagt gataacttga tcgccaacaa caacagctgg 480
actgtgacca tcccctctga cattgcggct ggcaactacg tcctccgtca cgaaatcatt 540
gcccttcact ctgctggtaa caaggatggt gctcagaact accctcagtg cctcaacttg 600
aaggtcactg gcggcggtga tctcgctcct tctggcactg ctggtgagag cctgtacaag 660
gacaccgatg ctggtatcct cgtcaacatc taccagtctc tttcctccta cgatattccc 720
ggacctgcta tgtacaacgc tacctccagc tcctccagct cctccagctc cagctccagc 780
tccagctcca gctccagctc cggctcttcc agctccgccg ccgcctccag cagctccagc 840
agctccagca ctactgccgc cgccgccgcc gctaccagcg ctgcttcttc cgtcacctct 900
gctgctggct ccgtcgttac tcagactgct accgctgttg agactgatac tgccactgcc 960
taccagacct ccactgaggt tgcgcaagtc accgtcaccg gtagcgctcc ccagcagacc 1020
tacgttgcca ctcccagcag ctccagctct gcctccagca gctccagtgc ttccgtatcc 1080
accagcacca gcctcaccag ctacttcgag tccctgagcg ctgatcagtt cctcagcgtt 1140
ctcaagcaga ctttcacctg gttggtcagc gagaagaagc acgcccgtga cctctccgcc 1200
taa 1203
&lt;210&gt; 68
&lt;211&gt; 400
&lt;212&gt; PRT
&lt;213&gt; 棘孢曲霉(Aspergillus aculeatus)
&lt;400&gt; 68
Met Ser Val Ala Lys Phe Ala Gly Val Ile Leu Gly Ser Ala Ala Leu
1 5 10 15
Val Ala Gly His Gly Tyr Val Ser Gly Ala Val Val Asp Gly Thr Tyr
20 25 30
Tyr Gly Gly Tyr Ile Val Thr Ser Tyr Pro Tyr Ser Ser Asp Pro Pro
35 40 45
Glu Thr Ile Gly Trp Ser Thr Glu Ala Thr Asp Leu Gly Phe Val Asp
50 55 60
Gly Ser Glu Tyr Ala Asp Ala Asp Ile Ile Cys His Lys Ser Ala Lys
65 70 75 80
Pro Gly Ala Ile Ser Ala Glu Val Lys Ala Gly Gly Thr Val Glu Leu
85 90 95
Gln Trp Thr Thr Trp Pro Asp Ser His His Gly Pro Val Leu Thr Tyr
100 105 110
Leu Ala Asn Cys Asn Gly Asp Cys Ser Ser Val Thr Lys Thr Asp Leu
115 120 125
Glu Phe Phe Lys Ile Asp Glu Ser Gly Leu Ile Asn Asp Asp Asp Val
130 135 140
Pro Gly Thr Trp Ala Ser Asp Asn Leu Ile Ala Asn Asn Asn Ser Trp
145 150 155 160
Thr Val Thr Ile Pro Ser Asp Ile Ala Ala Gly Asn Tyr Val Leu Arg
165 170 175
His Glu Ile Ile Ala Leu His Ser Ala Gly Asn Lys Asp Gly Ala Gln
180 185 190
Asn Tyr Pro Gln Cys Leu Asn Leu Lys Val Thr Gly Gly Gly Asp Leu
195 200 205
Ala Pro Ser Gly Thr Ala Gly Glu Ser Leu Tyr Lys Asp Thr Asp Ala
210 215 220
Gly Ile Leu Val Asn Ile Tyr Gln Ser Leu Ser Ser Tyr Asp Ile Pro
225 230 235 240
Gly Pro Ala Met Tyr Asn Ala Thr Ser Ser Ser Ser Ser Ser Ser Ser
245 250 255
Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Gly Ser Ser Ser Ser
260 265 270
Ala Ala Ala Ser Ser Ser Ser Ser Ser Ser Ser Thr Thr Ala Ala Ala
275 280 285
Ala Ala Ala Thr Ser Ala Ala Ser Ser Val Thr Ser Ala Ala Gly Ser
290 295 300
Val Val Thr Gln Thr Ala Thr Ala Val Glu Thr Asp Thr Ala Thr Ala
305 310 315 320
Tyr Gln Thr Ser Thr Glu Val Ala Gln Val Thr Val Thr Gly Ser Ala
325 330 335
Pro Gln Gln Thr Tyr Val Ala Thr Pro Ser Ser Ser Ser Ser Ala Ser
340 345 350
Ser Ser Ser Ser Ala Ser Val Ser Thr Ser Thr Ser Leu Thr Ser Tyr
355 360 365
Phe Glu Ser Leu Ser Ala Asp Gln Phe Leu Ser Val Leu Lys Gln Thr
370 375 380
Phe Thr Trp Leu Val Ser Glu Lys Lys His Ala Arg Asp Leu Ser Ala
385 390 395 400
&lt;210&gt; 69
&lt;211&gt; 1170
&lt;212&gt; DNA
&lt;213&gt; 棘孢曲霉(Aspergillus aculeatus)
&lt;400&gt; 69
atgaagtcct ctactttcgg tatgctcgct ctggcagcag cagccaagat ggtcgatgcc 60
cacaccaccg tcttcgccgt ctggatcaac ggcgaggacc agggtctggg caacagtgcc 120
agtggctaca tccggtctcc ccccagcaac agccccgtca aggacgtgac ctcgaccgac 180
atcacctgca acgtcaacgg cgaccaggcg gcggctaaga ccctctccgt caagggcggc 240
gacgtcgtca ccttcgagtg gcaccacgac agccgggacg cctccgacga catcatcgcc 300
tcctcccaca agggccccgt catggtctac atggccccga ccaccgccgg cagcagcggc 360
aagaactggg tcaagatcgc cgaggacgga tactccgacg gcacctgggc cgtcgacacc 420
ctgatcgcca acagcggcaa gcacaacatc accgtccccg acgtccccgc cggcgactac 480
ctcttccgcc cggagatcat cgccctccac gaggccgaga acgagggcgg cgcccagttc 540
tacatggagt gtgtccagtt caaggtcacc tccgacggtg ccaacactct gcccgacggt 600
gtcagcctgc ccggcgccta ctccgccact gaccccggta tcctcttcaa catgtacggc 660
tccttcgaca gctatcccat ccccggtccc tccgtctggg atggcactag ctctggctct 720
tcctcttctt cctcttcttc ctcttccagc tcttccgccg ccgctgccgt tgttgccacc 780
tcctcttcct cttcctctgc ttccatcgag gccgtgacca ccaagggtgc cgtcgccgcc 840
gtctccaccg ccgccgccgt ggctcctacc accaccaccg ctgcccccac caccttcgcc 900
acggccgtcg cctccaccaa gaaggccact gcctgccgca acaagaccaa gtcctcctcc 960
gctgccacca ccgccgccgc cgtcgccgag accacctctt ccaccgctgc cgccaccgct 1020
gctgcttcct ctgcctcttc cgcctccggc accgccggca agtacgagcg ctgcggtggc 1080
cagggctgga ccggtgccac cacctgcgtt gatggctgga cctgcaagca gtggaaccct 1140
tactactacc agtgcgttga gtctgcctag 1170
&lt;210&gt; 70
&lt;211&gt; 389
&lt;212&gt; PRT
&lt;213&gt; 棘孢曲霉(Aspergillus aculeatus)
&lt;400&gt; 70
Met Lys Ser Ser Thr Phe Gly Met Leu Ala Leu Ala Ala Ala Ala Lys
1 5 10 15
Met Val Asp Ala His Thr Thr Val Phe Ala Val Trp Ile Asn Gly Glu
20 25 30
Asp Gln Gly Leu Gly Asn Ser Ala Ser Gly Tyr Ile Arg Ser Pro Pro
35 40 45
Ser Asn Ser Pro Val Lys Asp Val Thr Ser Thr Asp Ile Thr Cys Asn
50 55 60
Val Asn Gly Asp Gln Ala Ala Ala Lys Thr Leu Ser Val Lys Gly Gly
65 70 75 80
Asp Val Val Thr Phe Glu Trp His His Asp Ser Arg Asp Ala Ser Asp
85 90 95
Asp Ile Ile Ala Ser Ser His Lys Gly Pro Val Met Val Tyr Met Ala
100 105 110
Pro Thr Thr Ala Gly Ser Ser Gly Lys Asn Trp Val Lys Ile Ala Glu
115 120 125
Asp Gly Tyr Ser Asp Gly Thr Trp Ala Val Asp Thr Leu Ile Ala Asn
130 135 140
Ser Gly Lys His Asn Ile Thr Val Pro Asp Val Pro Ala Gly Asp Tyr
145 150 155 160
Leu Phe Arg Pro Glu Ile Ile Ala Leu His Glu Ala Glu Asn Glu Gly
165 170 175
Gly Ala Gln Phe Tyr Met Glu Cys Val Gln Phe Lys Val Thr Ser Asp
180 185 190
Gly Ala Asn Thr Leu Pro Asp Gly Val Ser Leu Pro Gly Ala Tyr Ser
195 200 205
Ala Thr Asp Pro Gly Ile Leu Phe Asn Met Tyr Gly Ser Phe Asp Ser
210 215 220
Tyr Pro Ile Pro Gly Pro Ser Val Trp Asp Gly Thr Ser Ser Gly Ser
225 230 235 240
Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ser Ala Ala Ala Ala
245 250 255
Val Val Ala Thr Ser Ser Ser Ser Ser Ser Ala Ser Ile Glu Ala Val
260 265 270
Thr Thr Lys Gly Ala Val Ala Ala Val Ser Thr Ala Ala Ala Val Ala
275 280 285
Pro Thr Thr Thr Thr Ala Ala Pro Thr Thr Phe Ala Thr Ala Val Ala
290 295 300
Ser Thr Lys Lys Ala Thr Ala Cys Arg Asn Lys Thr Lys Ser Ser Ser
305 310 315 320
Ala Ala Thr Thr Ala Ala Ala Val Ala Glu Thr Thr Ser Ser Thr Ala
325 330 335
Ala Ala Thr Ala Ala Ala Ser Ser Ala Ser Ser Ala Ser Gly Thr Ala
340 345 350
Gly Lys Tyr Glu Arg Cys Gly Gly Gln Gly Trp Thr Gly Ala Thr Thr
355 360 365
Cys Val Asp Gly Trp Thr Cys Lys Gln Trp Asn Pro Tyr Tyr Tyr Gln
370 375 380
Cys Val Glu Ser Ala
385
&lt;210&gt; 71
&lt;211&gt; 1221
&lt;212&gt; DNA
&lt;213&gt; 棘孢曲霉(Aspergillus aculeatus)
&lt;400&gt; 71
atgcgtcagg ctcagtcttt gtccctcttg acagctcttc tgtctgccac gcgtgtggct 60
ggacacggtc acgtcactaa cgttgtcgtc aacggtgttt actacgaggg cttcgatatc 120
aacagcttcc cctacgagtc cgatccccct aaggtggcgg cttggaccac tcctaacact 180
ggcaacggtt tcatttcccc cagcgactac ggtaccgatg acattatttg ccaccagaat 240
gccaccaacg cccaggccca cattgttgtt gcggctggtg acaagatcaa catccagtgg 300
accgcgtggc ccgattccca ccacggtcct gtccttgact acctcgctcg ctgcgacggt 360
gagtgtgaga cggttgataa gaccactctt gagtttttca agatcgacgg cgtcggtctc 420
atcagtgaca ccgaagtgcc cggtacctgg ggagatgacc agctgatcgc caacaacaac 480
agctggttgg tcgagatccc cccgaccatt gctcctggca actatgttct tcgccacgag 540
cttatcgctc tccacagcgc cggcactgaa gatggtgctc agaactaccc ccagtgtttc 600
aacctccagg tcactggctc cggtactgac gagcccgctg gtaccctcgg caccaagctc 660
tacactgagg atgaggctgg tatcgttgtg aacatctaca cctctctgtc ttcctatgcc 720
gtccccggcc ccacccagta cagcggcgcc gtctctgtca gccaatccac ttcggccatt 780
acctccaccg gaactgctgt tgtcggtagc ggcagcgctg ttgccacctc tgccgccgcg 840
gctaccacca gcgctgctgc ttcttctgcc gctgctgcta ccaccgctgc tgccgttacc 900
agcgccaatg ccaacactca gattgcccag cccagcagca gctcttctta ctcccagatc 960
gccgtgcagg tgccctcctc ctggaccacc cttgtgaccg tcactcctcc cgccgccgcc 1020
gccaccaccc ctgctgccgt ccctgagcct cagaccccct ctgccagctc tggagccacc 1080
actaccagca gcagcagcgg cgccgcccag tctctctacg gccagtgcgg tggtatcaac 1140
tggaccggag ctacctcttg cgttgagggc gctacttgct accagtacaa cccttactac 1200
taccagtgca tctctgccta a 1221
&lt;210&gt; 72
&lt;211&gt; 406
&lt;212&gt; PRT
&lt;213&gt; 棘孢曲霉(Aspergillus aculeatus)
&lt;400&gt; 72
Met Arg Gln Ala Gln Ser Leu Ser Leu Leu Thr Ala Leu Leu Ser Ala
1 5 10 15
Thr Arg Val Ala Gly His Gly His Val Thr Asn Val Val Val Asn Gly
20 25 30
Val Tyr Tyr Glu Gly Phe Asp Ile Asn Ser Phe Pro Tyr Glu Ser Asp
35 40 45
Pro Pro Lys Val Ala Ala Trp Thr Thr Pro Asn Thr Gly Asn Gly Phe
50 55 60
Ile Ser Pro Ser Asp Tyr Gly Thr Asp Asp Ile Ile Cys His Gln Asn
65 70 75 80
Ala Thr Asn Ala Gln Ala His Ile Val Val Ala Ala Gly Asp Lys Ile
85 90 95
Asn Ile Gln Trp Thr Ala Trp Pro Asp Ser His His Gly Pro Val Leu
100 105 110
Asp Tyr Leu Ala Arg Cys Asp Gly Glu Cys Glu Thr Val Asp Lys Thr
115 120 125
Thr Leu Glu Phe Phe Lys Ile Asp Gly Val Gly Leu Ile Ser Asp Thr
130 135 140
Glu Val Pro Gly Thr Trp Gly Asp Asp Gln Leu Ile Ala Asn Asn Asn
145 150 155 160
Ser Trp Leu Val Glu Ile Pro Pro Thr Ile Ala Pro Gly Asn Tyr Val
165 170 175
Leu Arg His Glu Leu Ile Ala Leu His Ser Ala Gly Thr Glu Asp Gly
180 185 190
Ala Gln Asn Tyr Pro Gln Cys Phe Asn Leu Gln Val Thr Gly Ser Gly
195 200 205
Thr Asp Glu Pro Ala Gly Thr Leu Gly Thr Lys Leu Tyr Thr Glu Asp
210 215 220
Glu Ala Gly Ile Val Val Asn Ile Tyr Thr Ser Leu Ser Ser Tyr Ala
225 230 235 240
Val Pro Gly Pro Thr Gln Tyr Ser Gly Ala Val Ser Val Ser Gln Ser
245 250 255
Thr Ser Ala Ile Thr Ser Thr Gly Thr Ala Val Val Gly Ser Gly Ser
260 265 270
Ala Val Ala Thr Ser Ala Ala Ala Ala Thr Thr Ser Ala Ala Ala Ser
275 280 285
Ser Ala Ala Ala Ala Thr Thr Ala Ala Ala Val Thr Ser Ala Asn Ala
290 295 300
Asn Thr Gln Ile Ala Gln Pro Ser Ser Ser Ser Ser Tyr Ser Gln Ile
305 310 315 320
Ala Val Gln Val Pro Ser Ser Trp Thr Thr Leu Val Thr Val Thr Pro
325 330 335
Pro Ala Ala Ala Ala Thr Thr Pro Ala Ala Val Pro Glu Pro Gln Thr
340 345 350
Pro Ser Ala Ser Ser Gly Ala Thr Thr Thr Ser Ser Ser Ser Gly Ala
355 360 365
Ala Gln Ser Leu Tyr Gly Gln Cys Gly Gly Ile Asn Trp Thr Gly Ala
370 375 380
Thr Ser Cys Val Glu Gly Ala Thr Cys Tyr Gln Tyr Asn Pro Tyr Tyr
385 390 395 400
Tyr Gln Cys Ile Ser Ala
405
&lt;210&gt; 73
&lt;211&gt; 1284
&lt;212&gt; DNA
&lt;213&gt; 棘孢曲霉(Aspergillus aculeatus)
&lt;400&gt; 73
atgtctcttt ccaagattgc cactcttctg ctgggctcgg tctcgctggt cgctggtcat 60
gggtatgtct cgagcatcga ggtggacggt accacctatg gagggtactt ggtcgacact 120
tattactacg aatccgaccc gcccgagtta atcgcctggt ccacaaatgc cacggatgat 180
ggctatgtat cgccctccga ctacgagagc gtgaacatca tctgccacaa ggggtctgcg 240
cccggcgcgt tgtcggcccc tgtcgcgccc ggaggctggg tgcagatgac ctggaacacc 300
tggcccaccg accatcacgg ccctgtcatc acgtatatgg ccaattgcca cggttcttgc 360
gcagatgtgg acaagaccac cctcgagttc ttcaagatcg atgctggcgg cttgatcgat 420
gacacggacg tgcctggaac ttgggcgacc gatgagctca ttgaagatag ctatagtcgc 480
aacatcacta tccccagcga tattgccccc gggtactatg ttttgcgaca cgagatcatt 540
gctctgcaca gcgccgagaa cctggacgga gcccagaact acccccagtg catcaatctg 600
gaagtcaccg gcagcgagac agcaaccccg agtggcacct tgggcactgc tctgtacaag 660
gagaccgacc ccggcatcta tgttgacatc tggaacacgt tgagcacgta tactattccc 720
ggccccgcgc tgtacactgc tggtagcact gcgaccgcag ccgctgctgc cgataccacc 780
actacttctg ctggcaccac cgctgaggcc accaccgctg ccgccgccgt gagtaccacc 840
gcggacgctg ttccgaccga gtcttcagct ccttccgaga ccagcgcgac taccgcgaac 900
cctgctcggc ccactgccgg cagcgacatc cgcttccagc ccggtcaggt caaggctggt 960
gcttcagtca acaactcggc tactgagact tcctctggtg agtctgccac gacgaccaca 1020
acatcagtgg ccactgcggc ttcgagcgcg gattcgtcga cgacttctgg ggttttgagt 1080
ggcgcctgca gccaggaggg ctactggtac tgcaacgggg gcactgcgtt ccagcgctgt 1140
gtcaacgggg aatgggatgc gtcccagagt gtggctgcgg gcacggtctg caccgccggt 1200
atctcggaga ccatcaccat ttcagccgcc gccacgcgcc gggatgccat gcgtcgtcat 1260
ctggcgcgtc ccaagcgtca ctga 1284
&lt;210&gt; 74
&lt;211&gt; 427
&lt;212&gt; PRT
&lt;213&gt; 棘孢曲霉(Aspergillus aculeatus)
&lt;400&gt; 74
Met Ser Leu Ser Lys Ile Ala Thr Leu Leu Leu Gly Ser Val Ser Leu
1 5 10 15
Val Ala Gly His Gly Tyr Val Ser Ser Ile Glu Val Asp Gly Thr Thr
20 25 30
Tyr Gly Gly Tyr Leu Val Asp Thr Tyr Tyr Tyr Glu Ser Asp Pro Pro
35 40 45
Glu Leu Ile Ala Trp Ser Thr Asn Ala Thr Asp Asp Gly Tyr Val Ser
50 55 60
Pro Ser Asp Tyr Glu Ser Val Asn Ile Ile Cys His Lys Gly Ser Ala
65 70 75 80
Pro Gly Ala Leu Ser Ala Pro Val Ala Pro Gly Gly Trp Val Gln Met
85 90 95
Thr Trp Asn Thr Trp Pro Thr Asp His His Gly Pro Val Ile Thr Tyr
100 105 110
Met Ala Asn Cys His Gly Ser Cys Ala Asp Val Asp Lys Thr Thr Leu
115 120 125
Glu Phe Phe Lys Ile Asp Ala Gly Gly Leu Ile Asp Asp Thr Asp Val
130 135 140
Pro Gly Thr Trp Ala Thr Asp Glu Leu Ile Glu Asp Ser Tyr Ser Arg
145 150 155 160
Asn Ile Thr Ile Pro Ser Asp Ile Ala Pro Gly Tyr Tyr Val Leu Arg
165 170 175
His Glu Ile Ile Ala Leu His Ser Ala Glu Asn Leu Asp Gly Ala Gln
180 185 190
Asn Tyr Pro Gln Cys Ile Asn Leu Glu Val Thr Gly Ser Glu Thr Ala
195 200 205
Thr Pro Ser Gly Thr Leu Gly Thr Ala Leu Tyr Lys Glu Thr Asp Pro
210 215 220
Gly Ile Tyr Val Asp Ile Trp Asn Thr Leu Ser Thr Tyr Thr Ile Pro
225 230 235 240
Gly Pro Ala Leu Tyr Thr Ala Gly Ser Thr Ala Thr Ala Ala Ala Ala
245 250 255
Ala Asp Thr Thr Thr Thr Ser Ala Gly Thr Thr Ala Glu Ala Thr Thr
260 265 270
Ala Ala Ala Ala Val Ser Thr Thr Ala Asp Ala Val Pro Thr Glu Ser
275 280 285
Ser Ala Pro Ser Glu Thr Ser Ala Thr Thr Ala Asn Pro Ala Arg Pro
290 295 300
Thr Ala Gly Ser Asp Ile Arg Phe Gln Pro Gly Gln Val Lys Ala Gly
305 310 315 320
Ala Ser Val Asn Asn Ser Ala Thr Glu Thr Ser Ser Gly Glu Ser Ala
325 330 335
Thr Thr Thr Thr Thr Ser Val Ala Thr Ala Ala Ser Ser Ala Asp Ser
340 345 350
Ser Thr Thr Ser Gly Val Leu Ser Gly Ala Cys Ser Gln Glu Gly Tyr
355 360 365
Trp Tyr Cys Asn Gly Gly Thr Ala Phe Gln Arg Cys Val Asn Gly Glu
370 375 380
Trp Asp Ala Ser Gln Ser Val Ala Ala Gly Thr Val Cys Thr Ala Gly
385 390 395 400
Ile Ser Glu Thr Ile Thr Ile Ser Ala Ala Ala Thr Arg Arg Asp Ala
405 410 415
Met Arg Arg His Leu Ala Arg Pro Lys Arg His
420 425
&lt;210&gt; 75
&lt;211&gt; 804
&lt;212&gt; DNA
&lt;213&gt; 棘孢曲霉(Aspergillus aculeatus)
&lt;400&gt; 75
atgcttgtca aactcatctc ttttctttca gctgctacca gcgtagctgc tcatggtcat 60
gtgtcaaaca ttgtgatcaa cggggtgtcc taccgcggat gggacatcaa ttcggaccct 120
tacaattcca accctccggt ggtggttgca tggcaaacac ccaacacagc taatggcttc 180
atctcccctg atgcatacga cacagatgat gttatttgcc atctgagcgc tacgaatgcc 240
agaggccacg cagtcgtcgc tgctggcgac aagatcagcc tccagtggac gacctggcct 300
gacagtcacc atggccctgt catcagctac ctagccaact gcggctccag ctgcgagaca 360
gtcgataaga ccaccctcga gttcttcaag atcgatggtg ttggcttggt ggatgagagc 420
aatccccctg gtatctgggg agacgatgag ctcattgcca acaacaactc ttggctggta 480
gagattccag ctagtatcgc gccaggatac tatgtgctgc gtcacgagtt gatcgctctg 540
catggagcag ggagtgagaa tggagcccag aattacatgc aatgtttcaa ccttcaggtt 600
actgggactg gcacggtcca gccttccggg gtcctgggca cggagctgta caaacccaca 660
gacgctggaa ttcttgtcaa tatctaccag tcgctctcca cctatgttgt tcctggcccg 720
accctgatcc cccaggccgt ttccctcgtt cagtcgagct ccaccattac cgcctcgggc 780
acggcagtga caaccacggc ttga 804
&lt;210&gt; 76
&lt;211&gt; 267
&lt;212&gt; PRT
&lt;213&gt; 棘孢曲霉(Aspergillus aculeatus)
&lt;400&gt; 76
Met Leu Val Lys Leu Ile Ser Phe Leu Ser Ala Ala Thr Ser Val Ala
1 5 10 15
Ala His Gly His Val Ser Asn Ile Val Ile Asn Gly Val Ser Tyr Arg
20 25 30
Gly Trp Asp Ile Asn Ser Asp Pro Tyr Asn Ser Asn Pro Pro Val Val
35 40 45
Val Ala Trp Gln Thr Pro Asn Thr Ala Asn Gly Phe Ile Ser Pro Asp
50 55 60
Ala Tyr Asp Thr Asp Asp Val Ile Cys His Leu Ser Ala Thr Asn Ala
65 70 75 80
Arg Gly His Ala Val Val Ala Ala Gly Asp Lys Ile Ser Leu Gln Trp
85 90 95
Thr Thr Trp Pro Asp Ser His His Gly Pro Val Ile Ser Tyr Leu Ala
100 105 110
Asn Cys Gly Ser Ser Cys Glu Thr Val Asp Lys Thr Thr Leu Glu Phe
115 120 125
Phe Lys Ile Asp Gly Val Gly Leu Val Asp Glu Ser Asn Pro Pro Gly
130 135 140
Ile Trp Gly Asp Asp Glu Leu Ile Ala Asn Asn Asn Ser Trp Leu Val
145 150 155 160
Glu Ile Pro Ala Ser Ile Ala Pro Gly Tyr Tyr Val Leu Arg His Glu
165 170 175
Leu Ile Ala Leu His Gly Ala Gly Ser Glu Asn Gly Ala Gln Asn Tyr
180 185 190
Met Gln Cys Phe Asn Leu Gln Val Thr Gly Thr Gly Thr Val Gln Pro
195 200 205
Ser Gly Val Leu Gly Thr Glu Leu Tyr Lys Pro Thr Asp Ala Gly Ile
210 215 220
Leu Val Asn Ile Tyr Gln Ser Leu Ser Thr Tyr Val Val Pro Gly Pro
225 230 235 240
Thr Leu Ile Pro Gln Ala Val Ser Leu Val Gln Ser Ser Ser Thr Ile
245 250 255
Thr Ala Ser Gly Thr Ala Val Thr Thr Thr Ala
260 265
&lt;210&gt; 77
&lt;211&gt; 822
&lt;212&gt; DNA
&lt;213&gt; 棘孢曲霉(Aspergillus aculeatus)
&lt;400&gt; 77
atgaagtatc ttgcgatctt cgcggcagca gcagctggac tggcccgccc gacagcagcg 60
cactacatct tcagcaagct gattctggac ggcgaagtct ctgaggactg gcagtatatt 120
cgtaaaacca cccgggagac atgctatttg ccgaccaagt tcaccgacac cttcgacaac 180
ttgactccga acgaccagga tttccggtgc aatctcggct cgttcagcaa cgccgccaag 240
accgaagtgg ccgaggtgga agcgggctcc acgattggca tgcagctttt cgctggtagc 300
cacatgcgtc acccgggacc tgcgcaagtc ttcatgtcta aggccccgtc cggcaacgta 360
cagagctacg agggtgacgg ctcctggttc aagatctggg agcgtacact ctgcgacaaa 420
agtggcgatc tgactggaga tgcgtggtgt acatacggcc agaccgagat cgagtttcaa 480
atccccgagg cgaccccgac gggcgaatac ctggtccgag cggagcacat cggtcttcac 540
cgcgcacaga gtaatcaagc cgagttctac tacagctgcg cccaggtcaa ggtcacgggc 600
aatggtaccg gggtgccgag ccagacatat cagatccctg gcatgtacaa tgaccgctcg 660
gagcttttca acgggctgaa cttgtggtcc tactcggtgg agaacgtcga ggcagccatg 720
aagaattcta tcgtgggtga tgaaatttgg aatggaagtt ctgttccctc tgagtcccat 780
gtcccgaagt ataagaagag tcatgcttgt cgtgtttatt ga 822
&lt;210&gt; 78
&lt;211&gt; 273
&lt;212&gt; PRT
&lt;213&gt; 棘孢曲霉(Aspergillus aculeatus)
&lt;400&gt; 78
Met Lys Tyr Leu Ala Ile Phe Ala Ala Ala Ala Ala Gly Leu Ala Arg
1 5 10 15
Pro Thr Ala Ala His Tyr Ile Phe Ser Lys Leu Ile Leu Asp Gly Glu
20 25 30
Val Ser Glu Asp Trp Gln Tyr Ile Arg Lys Thr Thr Arg Glu Thr Cys
35 40 45
Tyr Leu Pro Thr Lys Phe Thr Asp Thr Phe Asp Asn Leu Thr Pro Asn
50 55 60
Asp Gln Asp Phe Arg Cys Asn Leu Gly Ser Phe Ser Asn Ala Ala Lys
65 70 75 80
Thr Glu Val Ala Glu Val Glu Ala Gly Ser Thr Ile Gly Met Gln Leu
85 90 95
Phe Ala Gly Ser His Met Arg His Pro Gly Pro Ala Gln Val Phe Met
100 105 110
Ser Lys Ala Pro Ser Gly Asn Val Gln Ser Tyr Glu Gly Asp Gly Ser
115 120 125
Trp Phe Lys Ile Trp Glu Arg Thr Leu Cys Asp Lys Ser Gly Asp Leu
130 135 140
Thr Gly Asp Ala Trp Cys Thr Tyr Gly Gln Thr Glu Ile Glu Phe Gln
145 150 155 160
Ile Pro Glu Ala Thr Pro Thr Gly Glu Tyr Leu Val Arg Ala Glu His
165 170 175
Ile Gly Leu His Arg Ala Gln Ser Asn Gln Ala Glu Phe Tyr Tyr Ser
180 185 190
Cys Ala Gln Val Lys Val Thr Gly Asn Gly Thr Gly Val Pro Ser Gln
195 200 205
Thr Tyr Gln Ile Pro Gly Met Tyr Asn Asp Arg Ser Glu Leu Phe Asn
210 215 220
Gly Leu Asn Leu Trp Ser Tyr Ser Val Glu Asn Val Glu Ala Ala Met
225 230 235 240
Lys Asn Ser Ile Val Gly Asp Glu Ile Trp Asn Gly Ser Ser Val Pro
245 250 255
Ser Glu Ser His Val Pro Lys Tyr Lys Lys Ser His Ala Cys Arg Val
260 265 270
Tyr
&lt;210&gt; 79
&lt;211&gt; 872
&lt;212&gt; DNA
&lt;213&gt; 嗜热棉毛菌(Thermomyces lanuginosus)
&lt;400&gt; 79
atgaagggct ccagcgctgc gtcggtgctt cttaccttcc tcgcgggcat ctcccgtacc 60
tctgcgcacg ggtatgtctc caacctcgtt atcaacggcg tctactatcg gggctggctc 120
cccggcgaag acccctacaa ccctgacccc ccgattggcg ttggctggga gacgcccaac 180
ctgggcaacg gcttcgtgac gccgtcggaa gcgtcgaccg acgccgtcat ctgccacaag 240
gaagccacac cagcccgcgg tcatgtctcc gtgaaggccg gtgacaagat ctacatccaa 300
tggcagccga atccatggcc ggattcccac cacggtgcgt caaacttctg cccgaaagct 360
gttcacactc actaacaaca cttttaggcc ccgtcctgga ctatctggcc ccttgcaacg 420
ggccctgtga gtccgtcgac aagaccagcc tgcgcttctt caagatcgac ggagtgggtc 480
ttatcgacgg ctcttctcct ccgggctact gggccgacga cgaactcatt gcgaacggca 540
acgggtggct ggttcagatc cccgaggaca tcaagccggg taactacgtc ctgcgacacg 600
agatcatcgc cttgcacagc gccgggaacc cggacggcgc ccagctgtac ccgcagtgct 660
tcaaccttga gattacggga tccggcaccg tcgagccgga gggcgtgcca gccaccgagt 720
tctactcgcc cgatgacccg ggcatcctgg tcaacatcta cgagcccctg tccacgtatg 780
aggtgccggg tccctcgctc atcccgcagg cggttcagat cgagcagtct tcgtctgcga 840
ttacggcgac gggcacgccg acgccggcat ga 872
&lt;210&gt; 80
&lt;211&gt; 272
&lt;212&gt; PRT
&lt;213&gt; 嗜热棉毛菌(Thermomyces lanuginosus)
&lt;400&gt; 80
Met Lys Gly Ser Ser Ala Ala Ser Val Leu Leu Thr Phe Leu Ala Gly
1 5 10 15
Ile Ser Arg Thr Ser Ala His Gly Tyr Val Ser Asn Leu Val Ile Asn
20 25 30
Gly Val Tyr Tyr Arg Gly Trp Leu Pro Gly Glu Asp Pro Tyr Asn Pro
35 40 45
Asp Pro Pro Ile Gly Val Gly Trp Glu Thr Pro Asn Leu Gly Asn Gly
50 55 60
Phe Val Thr Pro Ser Glu Ala Ser Thr Asp Ala Val Ile Cys His Lys
65 70 75 80
Glu Ala Thr Pro Ala Arg Gly His Val Ser Val Lys Ala Gly Asp Lys
85 90 95
Ile Tyr Ile Gln Trp Gln Pro Asn Pro Trp Pro Asp Ser His His Gly
100 105 110
Pro Val Leu Asp Tyr Leu Ala Pro Cys Asn Gly Pro Cys Glu Ser Val
115 120 125
Asp Lys Thr Ser Leu Arg Phe Phe Lys Ile Asp Gly Val Gly Leu Ile
130 135 140
Asp Gly Ser Ser Pro Pro Gly Tyr Trp Ala Asp Asp Glu Leu Ile Ala
145 150 155 160
Asn Gly Asn Gly Trp Leu Val Gln Ile Pro Glu Asp Ile Lys Pro Gly
165 170 175
Asn Tyr Val Leu Arg His Glu Ile Ile Ala Leu His Ser Ala Gly Asn
180 185 190
Pro Asp Gly Ala Gln Leu Tyr Pro Gln Cys Phe Asn Leu Glu Ile Thr
195 200 205
Gly Ser Gly Thr Val Glu Pro Glu Gly Val Pro Ala Thr Glu Phe Tyr
210 215 220
Ser Pro Asp Asp Pro Gly Ile Leu Val Asn Ile Tyr Glu Pro Leu Ser
225 230 235 240
Thr Tyr Glu Val Pro Gly Pro Ser Leu Ile Pro Gln Ala Val Gln Ile
245 250 255
Glu Gln Ser Ser Ser Ala Ile Thr Ala Thr Gly Thr Pro Thr Pro Ala
260 265 270
&lt;210&gt; 81
&lt;211&gt; 1039
&lt;212&gt; DNA
&lt;213&gt; 嗜热棉毛菌(Thermomyces lanuginosus)
&lt;400&gt; 81
atggcattct ctacggttac agtttttgtt acgttcctgg ccttcatctc catagcttct 60
gctcatggct tcgtgacaaa aatcaccgta ctcggagata ataataagga gtacgtctca 120
gtctcgctag gttgctaaca caggagagat cgctgaccat tgcagctacc ccggctttga 180
cccgagcact cccaaggagg ttcctccggg tctcgatgtc gcttggtcta ctagtgccag 240
tgatcaggga tacatgagca gttcaaatgc ctcgtatcac agtaaggact ttatctgcca 300
cagaaacgcc aaacctgctc cagacgcagc tcaagttcat gcgggcgaca aggtgcagct 360
tcactggact caatggcctg gacctgagga tcaccagggt cctatccttg attacctcgc 420
gagctgcaac ggaccctgct caaacgtgga gaaggcgagc cttaagtgga cgaagattga 480
cgaggcaggg cgctttccca acggaacgtg ggcaacggac ctgctcagga atgggggaaa 540
cacgtggaat gtgacgattc catcggatct tgctcctgga gaatatgtcc tccgcaacga 600
gatcattgca cttcactcgg cgagaaatat gggtggagct cagcactaca tgcaatgtgt 660
caatctgaac gtcactggca ccggccatag agagctacag ggcgtctccg ccgcagaatt 720
ttacaatcct acggatcctg gaattttgat taacgtctgg caaactcaaa gcctttcctc 780
ctaccatatt cccggaccta cactgttagc cgccgatacc ggcaacgacg gtggccattc 840
tgcatcatct accttggcga ctgtgacaag cagacgtctt tccactccga gcgacgccat 900
gcccgggaat ggttcatacg gtgcaatttc gccgcccctc aaacctgcta aaggattcca 960
tcctgtttgt aacgcccgat tcagacatgg cagcactttc actttgacta ccctggtcgc 1020
accaccagcc aggacctaa 1039
&lt;210&gt; 82
&lt;211&gt; 327
&lt;212&gt; PRT
&lt;213&gt; 嗜热棉毛菌(Thermomyces lanuginosus)
&lt;400&gt; 82
Met Ala Phe Ser Thr Val Thr Val Phe Val Thr Phe Leu Ala Phe Ile
1 5 10 15
Ser Ile Ala Ser Ala His Gly Phe Val Thr Lys Ile Thr Val Leu Gly
20 25 30
Asp Asn Asn Lys Asp Tyr Pro Gly Phe Asp Pro Ser Thr Pro Lys Glu
35 40 45
Val Pro Pro Gly Leu Asp Val Ala Trp Ser Thr Ser Ala Ser Asp Gln
50 55 60
Gly Tyr Met Ser Ser Ser Asn Ala Ser Tyr His Ser Lys Asp Phe Ile
65 70 75 80
Cys His Arg Asn Ala Lys Pro Ala Pro Asp Ala Ala Gln Val His Ala
85 90 95
Gly Asp Lys Val Gln Leu His Trp Thr Gln Trp Pro Gly Pro Glu Asp
100 105 110
His Gln Gly Pro Ile Leu Asp Tyr Leu Ala Ser Cys Asn Gly Pro Cys
115 120 125
Ser Asn Val Glu Lys Ala Ser Leu Lys Trp Thr Lys Ile Asp Glu Ala
130 135 140
Gly Arg Phe Pro Asn Gly Thr Trp Ala Thr Asp Leu Leu Arg Asn Gly
145 150 155 160
Gly Asn Thr Trp Asn Val Thr Ile Pro Ser Asp Leu Ala Pro Gly Glu
165 170 175
Tyr Val Leu Arg Asn Glu Ile Ile Ala Leu His Ser Ala Arg Asn Met
180 185 190
Gly Gly Ala Gln His Tyr Met Gln Cys Val Asn Leu Asn Val Thr Gly
195 200 205
Thr Gly His Arg Glu Leu Gln Gly Val Ser Ala Ala Glu Phe Tyr Asn
210 215 220
Pro Thr Asp Pro Gly Ile Leu Ile Asn Val Trp Gln Thr Gln Ser Leu
225 230 235 240
Ser Ser Tyr His Ile Pro Gly Pro Thr Leu Leu Ala Ala Asp Thr Gly
245 250 255
Asn Asp Gly Gly His Ser Ala Ser Ser Thr Leu Ala Thr Val Thr Ser
260 265 270
Arg Arg Leu Ser Thr Pro Ser Asp Ala Met Pro Gly Asn Gly Ser Tyr
275 280 285
Gly Ala Ile Ser Pro Pro Leu Lys Pro Ala Lys Gly Phe His Pro Val
290 295 300
Cys Asn Ala Arg Phe Arg His Gly Ser Thr Phe Thr Leu Thr Thr Leu
305 310 315 320
Val Ala Pro Pro Ala Arg Thr
325
&lt;210&gt; 83
&lt;211&gt; 881
&lt;212&gt; DNA
&lt;213&gt; 嗜热棉毛菌(Thermomyces lanuginosus)
&lt;400&gt; 83
atgaaaggct ccaccactgc gtctttgctt cttccgctcc tggcgagcgt tactcgcacc 60
tctgcgcacg ggtttgtctc caacctcgtc atcaatggcg tcttctatcg gggctggctc 120
ccgaccgagg acccctacaa ggctgacccc ccgattggcg tcggctggga gacgcctaac 180
ctgggcaacg gcttcgtgct gcccgaagaa gcgtcgaccg atgccatcgt ctgccacaaa 240
gaggccgagc cggcccgcgg ctatgccagc gtcgctgccg gtgacaagat ctacattcag 300
tggcagccga acccatggcc ggagtctcat cacggtacgt caaactgccc attgttgcaa 360
ttcagaatca tctactaaca actcttcaag gccccgtcat tgactacctg gccccttgca 420
acggtgactg ctcgactgtc aacaagacca gtttggagtt cttcaagatc gacggcgtgg 480
gcctcatcga cggctcctcc ccgccgggta agtgggctga cgacgagctc attgccaacg 540
gcaacggctg gctggtccag atccccgagg acatcaagcc gggcaactac gtcctgcgcc 600
atgagatcat cgccttgcac gaggcgttca accagaacgg cgctcagatc tacccgcagt 660
gcttcaacct ccagattacc ggctccggca ctgtcgagcc cgagggcacg ccggctaccg 720
agctgtattc gcccaccgat ccgggcattc tggttgacat ctacaacccc ttgagcacgt 780
acgtcgtgcc cggcccgacg ctcatcccgc aggcggttga gattgagcag tcttcgtcgg 840
ctgtcacggc gactggtacg ccgacgccgg cggcggcgta a 881
&lt;210&gt; 84
&lt;211&gt; 274
&lt;212&gt; PRT
&lt;213&gt; 嗜热棉毛菌(Thermomyces lanuginosus)
&lt;400&gt; 84
Met Lys Gly Ser Thr Thr Ala Ser Leu Leu Leu Pro Leu Leu Ala Ser
1 5 10 15
Val Thr Arg Thr Ser Ala His Gly Phe Val Ser Asn Leu Val Ile Asn
20 25 30
Gly Val Phe Tyr Arg Gly Trp Leu Pro Thr Glu Asp Pro Tyr Lys Ala
35 40 45
Asp Pro Pro Ile Gly Val Gly Trp Glu Thr Pro Asn Leu Gly Asn Gly
50 55 60
Phe Val Leu Pro Glu Glu Ala Ser Thr Asp Ala Ile Val Cys His Lys
65 70 75 80
Glu Ala Glu Pro Ala Arg Gly Tyr Ala Ser Val Ala Ala Gly Asp Lys
85 90 95
Ile Tyr Ile Gln Trp Gln Pro Asn Pro Trp Pro Glu Ser His His Gly
100 105 110
Pro Val Ile Asp Tyr Leu Ala Pro Cys Asn Gly Asp Cys Ser Thr Val
115 120 125
Asn Lys Thr Ser Leu Glu Phe Phe Lys Ile Asp Gly Val Gly Leu Ile
130 135 140
Asp Gly Ser Ser Pro Pro Gly Lys Trp Ala Asp Asp Glu Leu Ile Ala
145 150 155 160
Asn Gly Asn Gly Trp Leu Val Gln Ile Pro Glu Asp Ile Lys Pro Gly
165 170 175
Asn Tyr Val Leu Arg His Glu Ile Ile Ala Leu His Glu Ala Phe Asn
180 185 190
Gln Asn Gly Ala Gln Ile Tyr Pro Gln Cys Phe Asn Leu Gln Ile Thr
195 200 205
Gly Ser Gly Thr Val Glu Pro Glu Gly Thr Pro Ala Thr Glu Leu Tyr
210 215 220
Ser Pro Thr Asp Pro Gly Ile Leu Val Asp Ile Tyr Asn Pro Leu Ser
225 230 235 240
Thr Tyr Val Val Pro Gly Pro Thr Leu Ile Pro Gln Ala Val Glu Ile
245 250 255
Glu Gln Ser Ser Ser Ala Val Thr Ala Thr Gly Thr Pro Thr Pro Ala
260 265 270
Ala Ala
&lt;210&gt; 85
&lt;211&gt; 969
&lt;212&gt; DNA
&lt;213&gt; Aurantiporus alborubescens
&lt;400&gt; 85
atgcgaacca tcgccacgtt tgttacgctt gtagcctcag ttctccctgc ggtcctcgca 60
cacggaggtg tcctctccta ttcsaacggg gggaattggt actggggatg gaagccttac 120
aattcacctg acgggcagac caccatccaa cgcccgtggg caacatacaa tccgatcact 180
gatgcgacgg atcctaccat tgcttgcaac aacgacggga catctggagc tctgcagttg 240
actgcgacag tcgcggcggg atctgccatc acggcgtatt ggaaccaggt gtggccgcat 300
gataaagggc cgatgacgac atacctcgca caatgccccg gcagtacctg cacaggagtc 360
aacgcgaaga ctctgaaatg gttcaagatc gatcacgccg ggttgctttc tggtactgtc 420
tacagtggct cgtgggcatc aggcaagatg attgcacaga actcgacctg gacaactacc 480
attccagcga cggtgccttc agggaactat ctgatacgtt tcgagactat tgccctgcac 540
tctttgccag cgcaatttta ccctgagtgc gcacaaattc aaatcacggg cggaggttcc 600
cgtgctccaa ccgctgcaga gcttgttagc ttccctggcg cgtacagcaa caatgatcct 660
ggtgtcaaca ttgacatcta ctccaatgcc gcgcagagtg caaccacata cgtaatacca 720
ggacctccat tgtacggcgg tgcttccgga tctggtccat cttccgcgcc tccatcaagt 780
accccaggta gttcgtccac ttcccacggt cccacgtccg tcagcacgtc cagcagtgct 840
gcaccatcga cgacaggaac cgtgacgcag tacggtcagt gcggtggcat tggttgggct 900
ggagctaccg gctgtatctc accattcaag tgcacggtca tcaacgatta ttactaccag 960
tgcctctga 969
&lt;210&gt; 86
&lt;211&gt; 322
&lt;212&gt; PRT
&lt;213&gt; Aurantiporus alborubescens
&lt;400&gt; 86
Met Arg Thr Ile Ala Thr Phe Val Thr Leu Val Ala Ser Val Leu Pro
1 5 10 15
Ala Val Leu Ala His Gly Gly Val Leu Ser Tyr Ser Asn Gly Gly Asn
20 25 30
Trp Tyr Trp Gly Trp Lys Pro Tyr Asn Ser Pro Asp Gly Gln Thr Thr
35 40 45
Ile Gln Arg Pro Trp Ala Thr Tyr Asn Pro Ile Thr Asp Ala Thr Asp
50 55 60
Pro Thr Ile Ala Cys Asn Asn Asp Gly Thr Ser Gly Ala Leu Gln Leu
65 70 75 80
Thr Ala Thr Val Ala Ala Gly Ser Ala Ile Thr Ala Tyr Trp Asn Gln
85 90 95
Val Trp Pro His Asp Lys Gly Pro Met Thr Thr Tyr Leu Ala Gln Cys
100 105 110
Pro Gly Ser Thr Cys Thr Gly Val Asn Ala Lys Thr Leu Lys Trp Phe
115 120 125
Lys Ile Asp His Ala Gly Leu Leu Ser Gly Thr Val Tyr Ser Gly Ser
130 135 140
Trp Ala Ser Gly Lys Met Ile Ala Gln Asn Ser Thr Trp Thr Thr Thr
145 150 155 160
Ile Pro Ala Thr Val Pro Ser Gly Asn Tyr Leu Ile Arg Phe Glu Thr
165 170 175
Ile Ala Leu His Ser Leu Pro Ala Gln Phe Tyr Pro Glu Cys Ala Gln
180 185 190
Ile Gln Ile Thr Gly Gly Gly Ser Arg Ala Pro Thr Ala Ala Glu Leu
195 200 205
Val Ser Phe Pro Gly Ala Tyr Ser Asn Asn Asp Pro Gly Val Asn Ile
210 215 220
Asp Ile Tyr Ser Asn Ala Ala Gln Ser Ala Thr Thr Tyr Val Ile Pro
225 230 235 240
Gly Pro Pro Leu Tyr Gly Gly Ala Ser Gly Ser Gly Pro Ser Ser Ala
245 250 255
Pro Pro Ser Ser Thr Pro Gly Ser Ser Ser Thr Ser His Gly Pro Thr
260 265 270
Ser Val Ser Thr Ser Ser Ser Ala Ala Pro Ser Thr Thr Gly Thr Val
275 280 285
Thr Gln Tyr Gly Gln Cys Gly Gly Ile Gly Trp Ala Gly Ala Thr Gly
290 295 300
Cys Ile Ser Pro Phe Lys Cys Thr Val Ile Asn Asp Tyr Tyr Tyr Gln
305 310 315 320
Cys Leu
&lt;210&gt; 87
&lt;211&gt; 705
&lt;212&gt; DNA
&lt;213&gt; Aurantiporus alborubescens
&lt;400&gt; 87
atgaaggcta tcttggctat tttctcggcc cttgctccac ttgccgctgc gcattatacc 60
ttccctgatt ttattgtcaa cggaacaaca actgccgatt gggtctacat ccgagagacc 120
gcgaaccact actcgaatgg tcctgtaacc aacgtgaacg atccagaatt ccgatgctac 180
gagctggacc tgcaaaacac ggcagcgagt accctcaccg ccacggtctc tgcaggctcc 240
agcgtcggct ttaaagctaa cagcgccctt taccatcctg gttatctcga tgtgtatatg 300
tccaaagcga ccccagctgc taattcaccc agtgctggaa cggaccaaag ctggttcaag 360
gtctatgaat ccgctccggt cttcgcgaat ggggccctaa gcttcccttc ggagaacatc 420
caatctttca cgttcacaat cccgaagtcc cttcccagtg gccaatatct catccgtgtg 480
gaacacatcg ctctccactc cgccagtagc tacggaggtg cacaattcta catcagctgc 540
gctcaagtca atgtcgtcaa cggcgggaac ggaaacccag gaccgttagt caagattccc 600
ggcgtttaca ctgggaacga gcctggcatc ctcatcaaca tctacagctt cccaccgggt 660
ttcagtggct accaatcccc gggacctgct gtgtggcgtg gttga 705
&lt;210&gt; 88
&lt;211&gt; 234
&lt;212&gt; PRT
&lt;213&gt; Aurantiporus alborubescens
&lt;400&gt; 88
Met Lys Ala Ile Leu Ala Ile Phe Ser Ala Leu Ala Pro Leu Ala Ala
1 5 10 15
Ala His Tyr Thr Phe Pro Asp Phe Ile Val Asn Gly Thr Thr Thr Ala
20 25 30
Asp Trp Val Tyr Ile Arg Glu Thr Ala Asn His Tyr Ser Asn Gly Pro
35 40 45
Val Thr Asn Val Asn Asp Pro Glu Phe Arg Cys Tyr Glu Leu Asp Leu
50 55 60
Gln Asn Thr Ala Ala Ser Thr Leu Thr Ala Thr Val Ser Ala Gly Ser
65 70 75 80
Ser Val Gly Phe Lys Ala Asn Ser Ala Leu Tyr His Pro Gly Tyr Leu
85 90 95
Asp Val Tyr Met Ser Lys Ala Thr Pro Ala Ala Asn Ser Pro Ser Ala
100 105 110
Gly Thr Asp Gln Ser Trp Phe Lys Val Tyr Glu Ser Ala Pro Val Phe
115 120 125
Ala Asn Gly Ala Leu Ser Phe Pro Ser Glu Asn Ile Gln Ser Phe Thr
130 135 140
Phe Thr Ile Pro Lys Ser Leu Pro Ser Gly Gln Tyr Leu Ile Arg Val
145 150 155 160
Glu His Ile Ala Leu His Ser Ala Ser Ser Tyr Gly Gly Ala Gln Phe
165 170 175
Tyr Ile Ser Cys Ala Gln Val Asn Val Val Asn Gly Gly Asn Gly Asn
180 185 190
Pro Gly Pro Leu Val Lys Ile Pro Gly Val Tyr Thr Gly Asn Glu Pro
195 200 205
Gly Ile Leu Ile Asn Ile Tyr Ser Phe Pro Pro Gly Phe Ser Gly Tyr
210 215 220
Gln Ser Pro Gly Pro Ala Val Trp Arg Gly
225 230
&lt;210&gt; 89
&lt;211&gt; 702
&lt;212&gt; DNA
&lt;213&gt; 褐孢长毛盘菌(Trichophaea saccata)
&lt;400&gt; 89
atgacgcccc tgaaactccg cccccttctc ctcctggtgc tttccacgac cctcagcctc 60
gtgcacgcgc actatcgctt ctacgaactg atcgccaacg gggccaccca cgcttccttc 120
gaatacatcc gccaatgggt gcccatctac agcaactctc ccgtaaccga cgtcaccagc 180
gtcaacctcc gctgcaacgt caacgccact cccgccgccg aggtgatcac cgttgctgcc 240
ggtagcaccg tcggcttcgt agcagacaca acagtaacgc accccggtgc gttcaccgcg 300
tacatggcga aagcgcccga agacatcacg gaatgggatg gcaacgggga ctggttcaag 360
atctgggaga agggtccaac gagtataacc agtagcggga taacctggga cgtcacggat 420
acccaatgga ccttcaccat cccttccgcg acaccaaacg gtcaatacct actccgcttc 480
gagcacatag cgctccacgc cgccagcacc gtggggggtg ctcaattcta catgtcgtgc 540
gcgcagatac aagtaacgaa cggcggcaac gggagtcccg ggcccaccat caagttcccg 600
ggcggataca gcgccacaga ccccggtatc ctgatcaata tctattatcc catccccact 660
agttacacta ttcctggtcc accggtttgg accggtaagt aa 702
&lt;210&gt; 90
&lt;211&gt; 233
&lt;212&gt; PRT
&lt;213&gt; 褐孢长毛盘菌(Trichophaea saccata)
&lt;400&gt; 90
Met Thr Pro Leu Lys Leu Arg Pro Leu Leu Leu Leu Val Leu Ser Thr
1 5 10 15
Thr Leu Ser Leu Val His Ala His Tyr Arg Phe Tyr Glu Leu Ile Ala
20 25 30
Asn Gly Ala Thr His Ala Ser Phe Glu Tyr Ile Arg Gln Trp Val Pro
35 40 45
Ile Tyr Ser Asn Ser Pro Val Thr Asp Val Thr Ser Val Asn Leu Arg
50 55 60
Cys Asn Val Asn Ala Thr Pro Ala Ala Glu Val Ile Thr Val Ala Ala
65 70 75 80
Gly Ser Thr Val Gly Phe Val Ala Asp Thr Thr Val Thr His Pro Gly
85 90 95
Ala Phe Thr Ala Tyr Met Ala Lys Ala Pro Glu Asp Ile Thr Glu Trp
100 105 110
Asp Gly Asn Gly Asp Trp Phe Lys Ile Trp Glu Lys Gly Pro Thr Ser
115 120 125
Ile Thr Ser Ser Gly Ile Thr Trp Asp Val Thr Asp Thr Gln Trp Thr
130 135 140
Phe Thr Ile Pro Ser Ala Thr Pro Asn Gly Gln Tyr Leu Leu Arg Phe
145 150 155 160
Glu His Ile Ala Leu His Ala Ala Ser Thr Val Gly Gly Ala Gln Phe
165 170 175
Tyr Met Ser Cys Ala Gln Ile Gln Val Thr Asn Gly Gly Asn Gly Ser
180 185 190
Pro Gly Pro Thr Ile Lys Phe Pro Gly Gly Tyr Ser Ala Thr Asp Pro
195 200 205
Gly Ile Leu Ile Asn Ile Tyr Tyr Pro Ile Pro Thr Ser Tyr Thr Ile
210 215 220
Pro Gly Pro Pro Val Trp Thr Gly Lys
225 230
&lt;210&gt; 91
&lt;211&gt; 714
&lt;212&gt; DNA
&lt;213&gt; 褐孢长毛盘菌(Trichophaea saccata)
&lt;400&gt; 91
atgaaatgcc ttctctccct ccttctcgcc gcgacagcgg tctccgctca cacgatcttc 60
caagaaatcg gcataaacgg ggtgatgcaa gctcgctacg actacatgcg gctgccgtcc 120
tacgacggtc ccattacgga cgtaacgagc acctacatgg cgtgcaacgg tggtcccaat 180
ccattggtcc aaatctcgaa cgacgtcgct ttcgtaaaag ccggcgacag catcacgctg 240
caatgggcgc aaacgttgac gacagatttc aacacggggc tgatcatcga tccatcgcac 300
ttgggtcctg tgatggtcta catggccaaa gtaccctccg ccaccggtcc gatccccaac 360
agcggctggt tcaaaatcta cgaagacggc tacgacccga caacaaagac atgggcggta 420
accaagctca tcaacaacaa gggaaaagtg accgtcacca tcccatcgtg tctaccggca 480
ggggactact tgctgcgcgg tgaaatcatt gccttgcacg cggctagtac ctatccaggc 540
gcacagtttt acatggagtg tgcgcagttg cggcttacca gtggcggcac taagatgcct 600
accacgtata acattccggg gatctattcg cccactgatc cgggtgttac gttcaatctt 660
tacaatggat tcacgagtta taccattcct ggcccaaggc cgtttacatg ctag 714
&lt;210&gt; 92
&lt;211&gt; 237
&lt;212&gt; PRT
&lt;213&gt; 褐孢长毛盘菌(Trichophaea saccata)
&lt;400&gt; 92
Met Lys Cys Leu Leu Ser Leu Leu Leu Ala Ala Thr Ala Val Ser Ala
1 5 10 15
His Thr Ile Phe Gln Glu Ile Gly Ile Asn Gly Val Met Gln Ala Arg
20 25 30
Tyr Asp Tyr Met Arg Leu Pro Ser Tyr Asp Gly Pro Ile Thr Asp Val
35 40 45
Thr Ser Thr Tyr Met Ala Cys Asn Gly Gly Pro Asn Pro Leu Val Gln
50 55 60
Ile Ser Asn Asp Val Ala Phe Val Lys Ala Gly Asp Ser Ile Thr Leu
65 70 75 80
Gln Trp Ala Gln Thr Leu Thr Thr Asp Phe Asn Thr Gly Leu Ile Ile
85 90 95
Asp Pro Ser His Leu Gly Pro Val Met Val Tyr Met Ala Lys Val Pro
100 105 110
Ser Ala Thr Gly Pro Ile Pro Asn Ser Gly Trp Phe Lys Ile Tyr Glu
115 120 125
Asp Gly Tyr Asp Pro Thr Thr Lys Thr Trp Ala Val Thr Lys Leu Ile
130 135 140
Asn Asn Lys Gly Lys Val Thr Val Thr Ile Pro Ser Cys Leu Pro Ala
145 150 155 160
Gly Asp Tyr Leu Leu Arg Gly Glu Ile Ile Ala Leu His Ala Ala Ser
165 170 175
Thr Tyr Pro Gly Ala Gln Phe Tyr Met Glu Cys Ala Gln Leu Arg Leu
180 185 190
Thr Ser Gly Gly Thr Lys Met Pro Thr Thr Tyr Asn Ile Pro Gly Ile
195 200 205
Tyr Ser Pro Thr Asp Pro Gly Val Thr Phe Asn Leu Tyr Asn Gly Phe
210 215 220
Thr Ser Tyr Thr Ile Pro Gly Pro Arg Pro Phe Thr Cys
225 230 235
&lt;210&gt; 93
&lt;211&gt; 1455
&lt;212&gt; DNA
&lt;213&gt; Penicillium thomii
&lt;400&gt; 93
atgtctctgt ctaagatttc tggattgatc ctcggatctg ctgccttggt ggctggccac 60
ggttacgtga gcggaatcgt cgttgacgat acctactatg gtggatacct tgtcacccag 120
tacccttatg agagtgacgc cccagagctc attgcctggt cggagcaaga gaccgatctg 180
ggttacatcg atggctctga gtatgccaac tccaacatca tctgtcacaa ggaggccaaa 240
cctggtgctt tggaagcacc cgttaaggct ggtggctccg tcgagctcca gtggaccact 300
tggcctacca gccaccacgg tcctgtcatt acctacatgg ccaactgtaa cggcgactgt 360
gacgacgttg acaagactac tttgcagttc ttcaagattg accagggtgg tttgatcagc 420
gataccaccg agcccggtac ctgggcaact gacaacctca tcgccaacaa caatagccgt 480
actgtcaccg tccccagcga cattgccgat ggaaactacg tcctccgtca cgagatcatt 540
gccctccact ccgccgggga gaccaacggt gcccagaact acccccaatg tatcaacttg 600
aaggtcactg gcggcggtag cgctactcct tctggtaccc tgggtaccgc cctgtacaag 660
aacaccgacc ccggtatcct gatcaacatc tacacttccc tcagcaccta cgatatcccc 720
ggcccaaccc tgtacactgc cggcgccgcc gctgctaccg ctgcctccac ggctgcctct 780
tccaccgccg ctgccgttac tactgccgac gccgtcacta ccgccgctgc cgtcaccagc 840
agctctgcat ccgtggaagt tgtgcccaca actactccca gctcatcaat cgtcagtgcc 900
ttcccaacct ggagcccctc ttctacccca cccttctcca actcttccaa cggatggcgt 960
ccgtcattca gccgcggacc tggtggcccc cgcttcacat ctgctcctgc tcctcagttc 1020
tccgctccta gcggcgctca gcagaagcag tctgccactg ctacccccat cgtggctacc 1080
cctgtcgtga tcaccatgac cgagaccagc acctcctggg tcaccgaaat ggttactctt 1140
actgacaagt ctgttgtgca gaccaccagc gctgtcccag tcgtcgtcgc cgccaccact 1200
acccttaccg agggaagcga gcctgctcag acagcctccc ccagcgttgt ctccggctcc 1260
tctagctccg gctctagctc ctcatctacc accaccacct caaagacctc aactggatcc 1320
gactacgtct ccagcgactg gatgtcttac ctcagctcct tgagcgctgc tgaggtcctc 1380
cagatgctgc gccagacctt ccgttggatg gtcagcaacg acaaggtgca cgctcgtgat 1440
attaccatca actag 1455
&lt;210&gt; 94
&lt;211&gt; 484
&lt;212&gt; PRT
&lt;213&gt; Penicillium thomii
&lt;400&gt; 94
Met Ser Leu Ser Lys Ile Ser Gly Leu Ile Leu Gly Ser Ala Ala Leu
1 5 10 15
Val Ala Gly His Gly Tyr Val Ser Gly Ile Val Val Asp Asp Thr Tyr
20 25 30
Tyr Gly Gly Tyr Leu Val Thr Gln Tyr Pro Tyr Glu Ser Asp Ala Pro
35 40 45
Glu Leu Ile Ala Trp Ser Glu Gln Glu Thr Asp Leu Gly Tyr Ile Asp
50 55 60
Gly Ser Glu Tyr Ala Asn Ser Asn Ile Ile Cys His Lys Glu Ala Lys
65 70 75 80
Pro Gly Ala Leu Glu Ala Pro Val Lys Ala Gly Gly Ser Val Glu Leu
85 90 95
Gln Trp Thr Thr Trp Pro Thr Ser His His Gly Pro Val Ile Thr Tyr
100 105 110
Met Ala Asn Cys Asn Gly Asp Cys Asp Asp Val Asp Lys Thr Thr Leu
115 120 125
Gln Phe Phe Lys Ile Asp Gln Gly Gly Leu Ile Ser Asp Thr Thr Glu
130 135 140
Pro Gly Thr Trp Ala Thr Asp Asn Leu Ile Ala Asn Asn Asn Ser Arg
145 150 155 160
Thr Val Thr Val Pro Ser Asp Ile Ala Asp Gly Asn Tyr Val Leu Arg
165 170 175
His Glu Ile Ile Ala Leu His Ser Ala Gly Glu Thr Asn Gly Ala Gln
180 185 190
Asn Tyr Pro Gln Cys Ile Asn Leu Lys Val Thr Gly Gly Gly Ser Ala
195 200 205
Thr Pro Ser Gly Thr Leu Gly Thr Ala Leu Tyr Lys Asn Thr Asp Pro
210 215 220
Gly Ile Leu Ile Asn Ile Tyr Thr Ser Leu Ser Thr Tyr Asp Ile Pro
225 230 235 240
Gly Pro Thr Leu Tyr Thr Ala Gly Ala Ala Ala Ala Thr Ala Ala Ser
245 250 255
Thr Ala Ala Ser Ser Thr Ala Ala Ala Val Thr Thr Ala Asp Ala Val
260 265 270
Thr Thr Ala Ala Ala Val Thr Ser Ser Ser Ala Ser Val Glu Val Val
275 280 285
Pro Thr Thr Thr Pro Ser Ser Ser Ile Val Ser Ala Phe Pro Thr Trp
290 295 300
Ser Pro Ser Ser Thr Pro Pro Phe Ser Asn Ser Ser Asn Gly Trp Arg
305 310 315 320
Pro Ser Phe Ser Arg Gly Pro Gly Gly Pro Arg Phe Thr Ser Ala Pro
325 330 335
Ala Pro Gln Phe Ser Ala Pro Ser Gly Ala Gln Gln Lys Gln Ser Ala
340 345 350
Thr Ala Thr Pro Ile Val Ala Thr Pro Val Val Ile Thr Met Thr Glu
355 360 365
Thr Ser Thr Ser Trp Val Thr Glu Met Val Thr Leu Thr Asp Lys Ser
370 375 380
Val Val Gln Thr Thr Ser Ala Val Pro Val Val Val Ala Ala Thr Thr
385 390 395 400
Thr Leu Thr Glu Gly Ser Glu Pro Ala Gln Thr Ala Ser Pro Ser Val
405 410 415
Val Ser Gly Ser Ser Ser Ser Gly Ser Ser Ser Ser Ser Thr Thr Thr
420 425 430
Thr Ser Lys Thr Ser Thr Gly Ser Asp Tyr Val Ser Ser Asp Trp Met
435 440 445
Ser Tyr Leu Ser Ser Leu Ser Ala Ala Glu Val Leu Gln Met Leu Arg
450 455 460
Gln Thr Phe Arg Trp Met Val Ser Asn Asp Lys Val His Ala Arg Asp
465 470 475 480
Ile Thr Ile Asn
&lt;210&gt; 95
&lt;211&gt; 1021
&lt;212&gt; DNA
&lt;213&gt; 柄篮状菌(Talaromyces stipitatus)
&lt;400&gt; 95
atgccttcca ctaaagttgc tgctctatct gccgtcctgg ctttggcctc cacggttgct 60
ggccatggct ttgtgcaaaa tattgtcatt gacggtaaat cgtaagtgac ttgcttttgt 120
actatagagc tagataaata cttatactaa ataattcagc tacactggct acctcgtgaa 180
ccagtatcct taccagtcca acccaccagc tgttattggg tggtcaacca ctgcaaccga 240
cttgggattt gtcgatggat ctggatacac caacccggat atcatctgcc acaaaaacgc 300
caaacccggt cagctttctg ctccggttgc cgcaggaggc aaggttgagc tcgaatggac 360
aacatggccc gagagccatc acggccctgt catcagctat ctcgccaatt gcaatggcga 420
ttgtactacc gtggataaga cgaagctcga atttgtcaaa atcgatcagc ggggtctgat 480
cgacgacagc aatcctcccg gtacatgggc cgccgaccag ctcatcgccg ccaacaacag 540
ctggactgta actattcccg agagcatcgc gcctggaaac tacgtccttc gccacgaaat 600
catcgctctt cactccgcca acaacgcaac cggagctcaa aactaccctc aatgcatcaa 660
cttgcaaatc actggcagcg ggacggccaa cccatctggt acccctggcg agaaactcta 720
taccccaact gacccaggta tcttggtcaa catctaccag tcattgtcgt cttatgttat 780
tcccggtccg actttgtgga gtggtgctgc agcgcacgtt gttgccactg cagccggttc 840
tgctactggg gttgcttctg ccaccgctac tccgaccact cttgtgactg ccgtttcatc 900
gcctaccggt gctccttcag tggtgactcc tgaggctcct tcagtaacct cgttcgcccc 960
agtggtgact gttactgatg tcgttactgt gactaccgtc atcactacta ctatctctta 1020
g 1021
&lt;210&gt; 96
&lt;211&gt; 320
&lt;212&gt; PRT
&lt;213&gt; 柄篮状菌(Talaromyces stipitatus)
&lt;400&gt; 96
Met Pro Ser Thr Lys Val Ala Ala Leu Ser Ala Val Leu Ala Leu Ala
1 5 10 15
Ser Thr Val Ala Gly His Gly Phe Val Gln Asn Ile Val Ile Asp Gly
20 25 30
Lys Ser Tyr Thr Gly Tyr Leu Val Asn Gln Tyr Pro Tyr Gln Ser Asn
35 40 45
Pro Pro Ala Val Ile Gly Trp Ser Thr Thr Ala Thr Asp Leu Gly Phe
50 55 60
Val Asp Gly Ser Gly Tyr Thr Asn Pro Asp Ile Ile Cys His Lys Asn
65 70 75 80
Ala Lys Pro Gly Gln Leu Ser Ala Pro Val Ala Ala Gly Gly Lys Val
85 90 95
Glu Leu Glu Trp Thr Thr Trp Pro Glu Ser His His Gly Pro Val Ile
100 105 110
Ser Tyr Leu Ala Asn Cys Asn Gly Asp Cys Thr Thr Val Asp Lys Thr
115 120 125
Lys Leu Glu Phe Val Lys Ile Asp Gln Arg Gly Leu Ile Asp Asp Ser
130 135 140
Asn Pro Pro Gly Thr Trp Ala Ala Asp Gln Leu Ile Ala Ala Asn Asn
145 150 155 160
Ser Trp Thr Val Thr Ile Pro Glu Ser Ile Ala Pro Gly Asn Tyr Val
165 170 175
Leu Arg His Glu Ile Ile Ala Leu His Ser Ala Asn Asn Ala Thr Gly
180 185 190
Ala Gln Asn Tyr Pro Gln Cys Ile Asn Leu Gln Ile Thr Gly Ser Gly
195 200 205
Thr Ala Asn Pro Ser Gly Thr Pro Gly Glu Lys Leu Tyr Thr Pro Thr
210 215 220
Asp Pro Gly Ile Leu Val Asn Ile Tyr Gln Ser Leu Ser Ser Tyr Val
225 230 235 240
Ile Pro Gly Pro Thr Leu Trp Ser Gly Ala Ala Ala His Val Val Ala
245 250 255
Thr Ala Ala Gly Ser Ala Thr Gly Val Ala Ser Ala Thr Ala Thr Pro
260 265 270
Thr Thr Leu Val Thr Ala Val Ser Ser Pro Thr Gly Ala Pro Ser Val
275 280 285
Val Thr Pro Glu Ala Pro Ser Val Thr Ser Phe Ala Pro Val Val Thr
290 295 300
Val Thr Asp Val Val Thr Val Thr Thr Val Ile Thr Thr Thr Ile Ser
305 310 315 320
&lt;210&gt; 97
&lt;211&gt; 821
&lt;212&gt; DNA
&lt;213&gt; 特异腐质霉(Humicola insolens)
&lt;400&gt; 97
atgaagctca gcgttgtcct cacaggcctg gcggcagccc tcgccgaggc tcattgtcag 60
tccatacgac agcgaaaccc ctggatgatc acgagactaa ccagtcctac cagacacctt 120
ccccagcgtc ggcaacaccg ccgactggca ggtcgtgcgc cagacgacca acttccagag 180
caacggcccc gtgacggacg tcaactcgga ccagatccgg tgctacgagc gcttccccgg 240
ccagggggcg cccggcatct acaacgtcac cgccggccag accatctcgt acaacgccaa 300
ggcctctatc tcccacccgg gccccatggc cttctacatc gccaaggtcc ctgccggcta 360
caccgccgcc aactgggatg gcaggggcgc cgtgtggtcc aagatctacc aggacatgcc 420
gcgcattgcg gggagtctga cctggcctac caatggtacg aaatcctctt ctatccttca 480
tacttgctat tcctccaact gcctggcagc tcacactaac ttccacacac ccaggcgccc 540
gttccgtctc ggtaaccatc ccccgctgcc tgcaagacgg ccactacctg ttgcgcgccg 600
agcacatcgg cctgcacagc gcgagcggcg tgggcggcgc gcagttctac atctcgtgtg 660
cccagctcta cgtcagcggc ggcaccggca cttggaaccc gcgcaacaag gtcgcgttcc 720
ccggcgccta cagcccgacg cacccgggca tcatgatcaa catctactgg ccggtgccga 780
cgagctacac gccgccgggg ccgccggttg agacgtgctg a 821
&lt;210&gt; 98
&lt;211&gt; 227
&lt;212&gt; PRT
&lt;213&gt; 特异腐质霉(Humicola insolens)
&lt;400&gt; 98
Met Lys Leu Ser Val Val Leu Thr Gly Leu Ala Ala Ala Leu Ala Glu
1 5 10 15
Ala His Tyr Thr Phe Pro Ser Val Gly Asn Thr Ala Asp Trp Gln Val
20 25 30
Val Arg Gln Thr Thr Asn Phe Gln Ser Asn Gly Pro Val Thr Asp Val
35 40 45
Asn Ser Asp Gln Ile Arg Cys Tyr Glu Arg Phe Pro Gly Gln Gly Ala
50 55 60
Pro Gly Ile Tyr Asn Val Thr Ala Gly Gln Thr Ile Ser Tyr Asn Ala
65 70 75 80
Lys Ala Ser Ile Ser His Pro Gly Pro Met Ala Phe Tyr Ile Ala Lys
85 90 95
Val Pro Ala Gly Tyr Thr Ala Ala Asn Trp Asp Gly Arg Gly Ala Val
100 105 110
Trp Ser Lys Ile Tyr Gln Asp Met Pro Arg Ile Ala Gly Ser Leu Thr
115 120 125
Trp Pro Thr Asn Gly Ala Arg Ser Val Ser Val Thr Ile Pro Arg Cys
130 135 140
Leu Gln Asp Gly His Tyr Leu Leu Arg Ala Glu His Ile Gly Leu His
145 150 155 160
Ser Ala Ser Gly Val Gly Gly Ala Gln Phe Tyr Ile Ser Cys Ala Gln
165 170 175
Leu Tyr Val Ser Gly Gly Thr Gly Thr Trp Asn Pro Arg Asn Lys Val
180 185 190
Ala Phe Pro Gly Ala Tyr Ser Pro Thr His Pro Gly Ile Met Ile Asn
195 200 205
Ile Tyr Trp Pro Val Pro Thr Ser Tyr Thr Pro Pro Gly Pro Pro Val
210 215 220
Glu Thr Cys
225
&lt;210&gt; 99
&lt;211&gt; 1120
&lt;212&gt; DNA
&lt;213&gt; 特异腐质霉(Humicola insolens)
&lt;400&gt; 99
atgcgcccct tcctcgccgc cctcgccgcg gccaccacgg tccacgccca cggctgggtc 60
gacaacgcca ccatcgacgg cgtcttctac cagctctacc acccgtacat ggacccgtac 120
atgggcgagt tcgccccgcc tcgcatctcg cgcaagctgg tgtggaacgg ctacgtgaac 180
gacgtgacgt ccatcgacct gcaatgcggc ggacacacgg ccgaagggca aatcggcacg 240
gaacccgcgc cgctgcacgc ccccgccacg gccgggtcga cggtcaacct ccgctggacg 300
ctgtggccgg actcgcacat ggggcccatc atgacgtaca tggcgcggtg tccggacgag 360
ggttgtgata agtggttgcc gggggaggag taagtgtttc ctggcgggaa tggctgtgta 420
tttgagaagg agatattatg agtgaaactg ggagaggcga gaagaagaga tgctgacgcg 480
ggttttgctc tcctcagacc agtctggttc aaaatccacg aagccggccg gtacaccacc 540
gacaagtctt accccgacga catctgggaa gttgtaagtg ccctgcctac ctatccatcc 600
ctaattccct ccctcccctc tccacctcct ccttccgcgc ccccctcccc ccccttattt 660
gctaaccaac cccctccctt acagacccgc ctcatgtacc ccgccaacga aggctacaac 720
tacaccatcc ccgcctgcct cgcatccggc cactacctgg tccggcacga gatcatcgcc 780
ttacactcgg cctgggccaa aggcgaagcg cagttctatc cctcgtgcca ccagctgacc 840
gtcacctcca tcggcggtaa cgtgcgcgaa gcgccggccg agtaccgcgt cagtttcccc 900
ggcgcgtaca aggacgatga tccgggtatt ttcatcaacg tttggaaccg taagttcttt 960
ttttgttccc cttcctccca acctacctag gtgtcgtaat gtggtccgta agggtttgtt 1020
tgttgttgag ggatatagct gacaatggat gtgtgataac acagctggcc cctacaccat 1080
tcccggaccg ccggtctgga cgtgccccga gtctgagtaa 1120
&lt;210&gt; 100
&lt;211&gt; 257
&lt;212&gt; PRT
&lt;213&gt; 特异腐质霉(Humicola insolens)
&lt;400&gt; 100
Met Arg Pro Phe Leu Ala Ala Leu Ala Ala Ala Thr Thr Val His Ala
1 5 10 15
His Gly Trp Val Asp Asn Ala Thr Ile Asp Gly Val Phe Tyr Gln Leu
20 25 30
Tyr His Pro Tyr Met Asp Pro Tyr Met Gly Glu Phe Ala Pro Pro Arg
35 40 45
Ile Ser Arg Lys Leu Val Trp Asn Gly Tyr Val Asn Asp Val Thr Ser
50 55 60
Ile Asp Leu Gln Cys Gly Gly His Thr Ala Glu Gly Gln Ile Gly Thr
65 70 75 80
Glu Pro Ala Pro Leu His Ala Pro Ala Thr Ala Gly Ser Thr Val Asn
85 90 95
Leu Arg Trp Thr Leu Trp Pro Asp Ser His Met Gly Pro Ile Met Thr
100 105 110
Tyr Met Ala Arg Cys Pro Asp Glu Gly Cys Asp Lys Trp Leu Pro Val
115 120 125
Trp Phe Lys Ile His Glu Ala Gly Arg Tyr Thr Thr Asp Lys Ser Tyr
130 135 140
Pro Asp Asp Ile Trp Glu Val Thr Arg Leu Met Tyr Pro Ala Asn Glu
145 150 155 160
Gly Tyr Asn Tyr Thr Ile Pro Ala Cys Leu Ala Ser Gly His Tyr Leu
165 170 175
Val Arg His Glu Ile Ile Ala Leu His Ser Ala Trp Ala Lys Gly Glu
180 185 190
Ala Gln Phe Tyr Pro Ser Cys His Gln Leu Thr Val Thr Ser Ile Gly
195 200 205
Gly Asn Val Arg Glu Ala Pro Ala Glu Tyr Arg Val Ser Phe Pro Gly
210 215 220
Ala Tyr Lys Asp Asp Asp Pro Gly Ile Phe Ile Asn Val Trp Asn Pro
225 230 235 240
Gly Pro Tyr Thr Ile Pro Gly Pro Pro Val Trp Thr Cys Pro Glu Ser
245 250 255
Glu
&lt;210&gt; 101
&lt;211&gt; 878
&lt;212&gt; DNA
&lt;213&gt; 特异腐质霉(Humicola insolens)
&lt;400&gt; 101
atgagactct ccctgacaac cctcctggcc tctgccctgt ccgtccaggg tcacgccatc 60
ttccaggtgc gttcctttca ccacccacat catcatgatg aacctcaaag ttgctaaccc 120
ccgctgggca gagagttacc gtcaacggcc aggaccaagg ctcgttgact ggtctccggg 180
ccccgaataa caacaacccc gtgcagaacg tcaacagcca ggacatcatc tgtggcgctc 240
ccgggtcgcg gtcacagtcc gtcatcaacg tcaatgccgg cgaccgcatc ggtgcctggt 300
accagcatgt catcggcggc gcccagttcc ccggcgaccc ggacaacccg atcgccaggt 360
cccacaaggg ccccatctcc gtctatctgg ccaaggtgga caacgctgcc acggcgaacc 420
accagggtct gcaatggtaa acatacctcg ggtcaagtca gaacctctgt gatcgccgag 480
acgactaacc cctctttccc ataaacaggt tcaagatctg gcacgacggc ttcaacccct 540
ccacccggca atgggccgtc gacaccatga tcaacaacaa cggctgggtc tatttcaacc 600
tcccgcagtg catcgctccc ggccactatc tcatgcgcgt cgagctgctc gctctccact 660
cggccaccta ccaaggccag gcgcagttct acatctcgtg cgcccagatc aacgtccagt 720
cgggcggcaa ctttactccc tggcagacgg ttagcttccc cggcgcctac caggccaacc 780
accccggcat tcaggtcaac atttacggcg ccatgggcca gccggataac ggcggcaggc 840
cctaccagat tccgggcccg gagccgattc agtgctga 878
&lt;210&gt; 102
&lt;211&gt; 246
&lt;212&gt; PRT
&lt;213&gt; 特异腐质霉(Humicola insolens)
&lt;400&gt; 102
Met Arg Leu Ser Leu Thr Thr Leu Leu Ala Ser Ala Leu Ser Val Gln
1 5 10 15
Gly His Ala Ile Phe Gln Arg Val Thr Val Asn Gly Gln Asp Gln Gly
20 25 30
Ser Leu Thr Gly Leu Arg Ala Pro Asn Asn Asn Asn Pro Val Gln Asn
35 40 45
Val Asn Ser Gln Asp Ile Ile Cys Gly Ala Pro Gly Ser Arg Ser Gln
50 55 60
Ser Val Ile Asn Val Asn Ala Gly Asp Arg Ile Gly Ala Trp Tyr Gln
65 70 75 80
His Val Ile Gly Gly Ala Gln Phe Pro Gly Asp Pro Asp Asn Pro Ile
85 90 95
Ala Arg Ser His Lys Gly Pro Ile Ser Val Tyr Leu Ala Lys Val Asp
100 105 110
Asn Ala Ala Thr Ala Asn His Gln Gly Leu Gln Trp Phe Lys Ile Trp
115 120 125
His Asp Gly Phe Asn Pro Ser Thr Arg Gln Trp Ala Val Asp Thr Met
130 135 140
Ile Asn Asn Asn Gly Trp Val Tyr Phe Asn Leu Pro Gln Cys Ile Ala
145 150 155 160
Pro Gly His Tyr Leu Met Arg Val Glu Leu Leu Ala Leu His Ser Ala
165 170 175
Thr Tyr Gln Gly Gln Ala Gln Phe Tyr Ile Ser Cys Ala Gln Ile Asn
180 185 190
Val Gln Ser Gly Gly Asn Phe Thr Pro Trp Gln Thr Val Ser Phe Pro
195 200 205
Gly Ala Tyr Gln Ala Asn His Pro Gly Ile Gln Val Asn Ile Tyr Gly
210 215 220
Ala Met Gly Gln Pro Asp Asn Gly Gly Arg Pro Tyr Gln Ile Pro Gly
225 230 235 240
Pro Glu Pro Ile Gln Cys
245
&lt;210&gt; 103
&lt;211&gt; 1067
&lt;212&gt; DNA
&lt;213&gt; 特异腐质霉(Humicola insolens)
&lt;400&gt; 103
atgggaccga cctgggcagt gattctgggg ctgattgctc cttctgtgct cagtcacagt 60
tgcgtctccc aacagacctc tcgactttta tcaagctggt actgactcat aacccaactc 120
acctagatat ccatgggatc ctcctggtca atggcacaga gacaccagag tggaaatacg 180
tcctgtatgt ttcctcatat cctagcccca ttgtacgagt tgttgacgtg atacagcgat 240
gttgcgccgg cggttccaat ttcaaaccca gactctctcc cccctggata ccaaggctat 300
aaggttgatc ccatcatcgg atccgggaac cccaacatca cttgtggccg gctagcattt 360
gactcggcac ccaagacgca aatcgccgat gtgctagccg gctccgaggt aggattccga 420
gtctcggctg atggcttggg aaatcgggat ctggagaagg gctacatccc gacgttctgg 480
cacccaggtc cggcccaggc atacttgtca cgtgccccga acgacgacct gtacagctac 540
aaaggcgacg gggactggtt caagattgcc tacgctggcc cggtggacga cctgacgtgg 600
tccctttggc cgggagtttc agatgtatgt tcatcctcca tagtcctgtt tttgccctct 660
ccaggaccaa attattaata tcgagtcgca gttcaacttc accattccgt tgtcgacacc 720
ccctggcaag tatttgctcc gaatcgagaa cttcatgcca acggcctcga caggatatct 780
tcagttctac gtcaattgtg catttgtcaa catcattgga ccaggaggtg ggaccccgac 840
cgagttcatt cgaattcccg gggattacac cgacgaggat ccaggtgagt ttgtgttatg 900
agacatgttc aactcgcacc gacgaatgct tgtttcctga cagagatttg taaaaactag 960
gctttctcgt tcccccggag caaagctcct tggatggcag agtcccaagg gaccagttga 1020
aactgatgag ctacacgcca ccaggtcctg cggtgtggac ggggtga 1067
&lt;210&gt; 104
&lt;211&gt; 265
&lt;212&gt; PRT
&lt;213&gt; 特异腐质霉(Humicola insolens)
&lt;400&gt; 104
Met Gly Pro Thr Trp Ala Val Ile Leu Gly Leu Ile Ala Pro Ser Val
1 5 10 15
Leu Asn Ile His Gly Ile Leu Leu Val Asn Gly Thr Glu Thr Pro Glu
20 25 30
Trp Lys Tyr Val Leu Asp Val Ala Pro Ala Val Pro Ile Ser Asn Pro
35 40 45
Asp Ser Leu Pro Pro Gly Tyr Gln Gly Tyr Lys Val Asp Pro Ile Ile
50 55 60
Gly Ser Gly Asn Pro Asn Ile Thr Cys Gly Arg Leu Ala Phe Asp Ser
65 70 75 80
Ala Pro Lys Thr Gln Ile Ala Asp Val Leu Ala Gly Ser Glu Val Gly
85 90 95
Phe Arg Val Ser Ala Asp Gly Leu Gly Asn Arg Asp Leu Glu Lys Gly
100 105 110
Tyr Ile Pro Thr Phe Trp His Pro Gly Pro Ala Gln Ala Tyr Leu Ser
115 120 125
Arg Ala Pro Asn Asp Asp Leu Tyr Ser Tyr Lys Gly Asp Gly Asp Trp
130 135 140
Phe Lys Ile Ala Tyr Ala Gly Pro Val Asp Asp Leu Thr Trp Ser Leu
145 150 155 160
Trp Pro Gly Val Ser Asp Phe Asn Phe Thr Ile Pro Leu Ser Thr Pro
165 170 175
Pro Gly Lys Tyr Leu Leu Arg Ile Glu Asn Phe Met Pro Thr Ala Ser
180 185 190
Thr Gly Tyr Leu Gln Phe Tyr Val Asn Cys Ala Phe Val Asn Ile Ile
195 200 205
Gly Pro Gly Gly Gly Thr Pro Thr Glu Phe Ile Arg Ile Pro Gly Asp
210 215 220
Tyr Thr Asp Glu Asp Pro Gly Phe Leu Val Pro Pro Glu Gln Ser Ser
225 230 235 240
Leu Asp Gly Arg Val Pro Arg Asp Gln Leu Lys Leu Met Ser Tyr Thr
245 250 255
Pro Pro Gly Pro Ala Val Trp Thr Gly
260 265
&lt;210&gt; 105
&lt;211&gt; 1035
&lt;212&gt; DNA
&lt;213&gt; 特异腐质霉(Humicola insolens)
&lt;400&gt; 105
atgaaggccc tcaccctcct cgccgccgcg accgcggcct cggcgcacac catcttcgtg 60
cagctcgagg ccgacggcac gcgctacccc gtctcgcacg gcgtgcgcac cccgcagtac 120
gacggcccca tcaccgacgt ctcgtccaac gacctggcct gcaacggcgg gcccaacccg 180
accatgaaga cggacaagat catcaccgtg acggcgggca gcaccgtcaa ggccatctgg 240
cggcacacgc tgcagtcggg ccccaacgac gtcatggacc ccagccacaa gggcccgacg 300
ctggcgtacc tgaagaaggt ggacaacgcg ctgacggatt cgggcgtggg cggcggctgg 360
ttcaagatcc aggaggacgg gcacagcaat gggaattggg gcacgctcaa ggtaatcaac 420
aaccagggca ttcactatat cgatatcccc gactgcatcg acagcgggca gtatttgttg 480
cgggccgaga tgatcgctct gcacgctgcc gggtcgccgg gcggtgcgca gctttatgtg 540
agtttcttcc ttcttttctt cttctctccc tttgtgataa gaataaagat ccacaccaca 600
gtcaaaccaa agcatcctaa cctcggcatc tactcacaga tggaatgcgc ccaaatcgaa 660
atcgtcggcg gcaagggcac cgtcaagccc cagacctact ccatcccggg catctacaag 720
tccaacgacc cgggcatcct catcaacatc tactccatgt cgccctcgag ccagtacatc 780
atccccggcc cgcccctctt cacctgcaac ggcggcggcg gcagcaacaa cggcggcggc 840
aacaacggcg gcagcaaccc ccccgtccag cagccccccg ccaccaccct caccaccgcc 900
atcgcccagc ccacgcccat ctgctccgtc cagcagtggg gtcagtgcgg cggccagggc 960
tatagcggct gcaccacctg cgcgtcgccg tataggtgta acgagatcaa cgcgtggtat 1020
tcgcagtgct tgtaa 1035
&lt;210&gt; 106
&lt;211&gt; 310
&lt;212&gt; PRT
&lt;213&gt; 特异腐质霉(Humicola insolens)
&lt;400&gt; 106
Met Lys Ala Leu Thr Leu Leu Ala Ala Ala Thr Ala Ala Ser Ala His
1 5 10 15
Thr Ile Phe Val Gln Leu Glu Ala Asp Gly Thr Arg Tyr Pro Val Ser
20 25 30
His Gly Val Arg Thr Pro Gln Tyr Asp Gly Pro Ile Thr Asp Val Ser
35 40 45
Ser Asn Asp Leu Ala Cys Asn Gly Gly Pro Asn Pro Thr Met Lys Thr
50 55 60
Asp Lys Ile Ile Thr Val Thr Ala Gly Ser Thr Val Lys Ala Ile Trp
65 70 75 80
Arg His Thr Leu Gln Ser Gly Pro Asn Asp Val Met Asp Pro Ser His
85 90 95
Lys Gly Pro Thr Leu Ala Tyr Leu Lys Lys Val Asp Asn Ala Leu Thr
100 105 110
Asp Ser Gly Val Gly Gly Gly Trp Phe Lys Ile Gln Glu Asp Gly His
115 120 125
Ser Asn Gly Asn Trp Gly Thr Leu Lys Val Ile Asn Asn Gln Gly Ile
130 135 140
His Tyr Ile Asp Ile Pro Asp Cys Ile Asp Ser Gly Gln Tyr Leu Leu
145 150 155 160
Arg Ala Glu Met Ile Ala Leu His Ala Ala Gly Ser Pro Gly Gly Ala
165 170 175
Gln Leu Tyr Met Glu Cys Ala Gln Ile Glu Ile Val Gly Gly Lys Gly
180 185 190
Thr Val Lys Pro Gln Thr Tyr Ser Ile Pro Gly Ile Tyr Lys Ser Asn
195 200 205
Asp Pro Gly Ile Leu Ile Asn Ile Tyr Ser Met Ser Pro Ser Ser Gln
210 215 220
Tyr Ile Ile Pro Gly Pro Pro Leu Phe Thr Cys Asn Gly Gly Gly Gly
225 230 235 240
Ser Asn Asn Gly Gly Gly Asn Asn Gly Gly Ser Asn Pro Pro Val Gln
245 250 255
Gln Pro Pro Ala Thr Thr Leu Thr Thr Ala Ile Ala Gln Pro Thr Pro
260 265 270
Ile Cys Ser Val Gln Gln Trp Gly Gln Cys Gly Gly Gln Gly Tyr Ser
275 280 285
Gly Cys Thr Thr Cys Ala Ser Pro Tyr Arg Cys Asn Glu Ile Asn Ala
290 295 300
Trp Tyr Ser Gln Cys Leu
305 310
&lt;210&gt; 107
&lt;211&gt; 1065
&lt;212&gt; DNA
&lt;213&gt; 特异腐质霉(Humicola insolens)
&lt;400&gt; 107
atggctccca agacctcgac gttccttgcc tccctcacgg gcgccgccct cgtggctgcc 60
cacggccatg tcagccacat cattgtcaat ggcgtccagt accggaacta cgaccccacc 120
accgacttct acagcggcaa ccctccgacc gtgatcggct ggtcggccct caaccaggac 180
aacggcttca tcgagcccaa caacttcggc acccccgaca tcatctgcca taagtcggcc 240
aagcccggcg gcggccacgt cacggtgagg gccggtgaca agatcagcat cgtctggacc 300
cccgagtggc ccgagtcgca cgtcggcccc gtcatcgact accttgccgc gtgcaacggc 360
gactgcgaga cggtcgacaa gacctccctc cgcttcttca agatcgacgg cgccggctac 420
gacgccgcgg ccggccgctg ggccgccgac gctctgcgcg ccaacggcaa ctcgtggctt 480
gtgcagatcc ccgccgacct caaggccggc aactacgtgc ttcggcacga gatcatcgcc 540
ctgcacggcg ccgccaaccc caacggcgcc caggcctacc cgcagtgcat caacatccgc 600
gtcaccggcg gcggcaacaa ccagccctcg ggcgtccccg gcacccagct ctacaaggcc 660
tcggacccgg gcatcctctt caacccctgg gtcgccaacc ctcagtaccc cgtcccgggc 720
ccggccctca tccccggcgc cgtgagctcc atccctcaga gccgctcgac cgccaccgcc 780
acgggcaccg ccacccgccc cggcgccgac acggacccga cgggcgtccc tcccgtcgtc 840
accaccactt ctgccccggc tcaggtgacc accaccacca gcagccgcac cacctccctc 900
cctcagatca ccaccacctt cgcgaccagc accaccccgc cgcccccggc cgctacccag 960
agcaagtggg gccagtgcgg cggcaacggc tggaccggcc cgaccgtctg cgcgccgggc 1020
tcgagctgca acaagctcaa cgactggtac tcgcagtgca tctaa 1065
&lt;210&gt; 108
&lt;211&gt; 354
&lt;212&gt; PRT
&lt;213&gt; 特异腐质霉(Humicola insolens)
&lt;400&gt; 108
Met Ala Pro Lys Thr Ser Thr Phe Leu Ala Ser Leu Thr Gly Ala Ala
1 5 10 15
Leu Val Ala Ala His Gly His Val Ser His Ile Ile Val Asn Gly Val
20 25 30
Gln Tyr Arg Asn Tyr Asp Pro Thr Thr Asp Phe Tyr Ser Gly Asn Pro
35 40 45
Pro Thr Val Ile Gly Trp Ser Ala Leu Asn Gln Asp Asn Gly Phe Ile
50 55 60
Glu Pro Asn Asn Phe Gly Thr Pro Asp Ile Ile Cys His Lys Ser Ala
65 70 75 80
Lys Pro Gly Gly Gly His Val Thr Val Arg Ala Gly Asp Lys Ile Ser
85 90 95
Ile Val Trp Thr Pro Glu Trp Pro Glu Ser His Val Gly Pro Val Ile
100 105 110
Asp Tyr Leu Ala Ala Cys Asn Gly Asp Cys Glu Thr Val Asp Lys Thr
115 120 125
Ser Leu Arg Phe Phe Lys Ile Asp Gly Ala Gly Tyr Asp Ala Ala Ala
130 135 140
Gly Arg Trp Ala Ala Asp Ala Leu Arg Ala Asn Gly Asn Ser Trp Leu
145 150 155 160
Val Gln Ile Pro Ala Asp Leu Lys Ala Gly Asn Tyr Val Leu Arg His
165 170 175
Glu Ile Ile Ala Leu His Gly Ala Ala Asn Pro Asn Gly Ala Gln Ala
180 185 190
Tyr Pro Gln Cys Ile Asn Ile Arg Val Thr Gly Gly Gly Asn Asn Gln
195 200 205
Pro Ser Gly Val Pro Gly Thr Gln Leu Tyr Lys Ala Ser Asp Pro Gly
210 215 220
Ile Leu Phe Asn Pro Trp Val Ala Asn Pro Gln Tyr Pro Val Pro Gly
225 230 235 240
Pro Ala Leu Ile Pro Gly Ala Val Ser Ser Ile Pro Gln Ser Arg Ser
245 250 255
Thr Ala Thr Ala Thr Gly Thr Ala Thr Arg Pro Gly Ala Asp Thr Asp
260 265 270
Pro Thr Gly Val Pro Pro Val Val Thr Thr Thr Ser Ala Pro Ala Gln
275 280 285
Val Thr Thr Thr Thr Ser Ser Arg Thr Thr Ser Leu Pro Gln Ile Thr
290 295 300
Thr Thr Phe Ala Thr Ser Thr Thr Pro Pro Pro Pro Ala Ala Thr Gln
305 310 315 320
Ser Lys Trp Gly Gln Cys Gly Gly Asn Gly Trp Thr Gly Pro Thr Val
325 330 335
Cys Ala Pro Gly Ser Ser Cys Asn Lys Leu Asn Asp Trp Tyr Ser Gln
340 345 350
Cys Ile
&lt;210&gt; 109
&lt;211&gt; 804
&lt;212&gt; DNA
&lt;213&gt; 特异腐质霉(Humicola insolens)
&lt;400&gt; 109
atgtatcttt tacctatcgc cgcggccgcc ctagcgttca ccaccaccgc atacgcccac 60
gcccaagtct acggcttgcg tgtcaacgac caacaccaag gcgatgggcg caacaaatac 120
atccgctcgc ccagcagcaa ttcccccatc cggtgggacc acgtaaccca cccattcctc 180
atctgcaaca tccgcgacga caaccaaccc ccgggtcccg cgcctgactt tgtccgcgcc 240
ttcgccggcg accgcgtggc gttccaatgg taccacgccc gccccaacga cccgacggat 300
tacgtcctcg acagctccca cctcggcgtc ctcgttacct ggatcgcgcc gtacacggac 360
gggcccggga ccggccccat ttggaccaag atccaccagg acgggtggaa cggcacgcac 420
tgggccacga gccggctcat cagcaacggc gggttcgtcg agttccggct gcccggctcg 480
ctaaagcccg ggaagtacct ggtgcggcag gagattatcg ctctgcacca ggccgacatg 540
cccggtccga accgcgggcc tgagttctac cccagctgcg cgcaattgga ggtttttggg 600
tctggtgagg cggcgccgcc gcaggggtat gatatcaaca aggggtatgc ggagagcggg 660
gataagttgt ggttcaacat ttacatcaac aagaatgatg agttcaaaat gcctggaccg 720
gaggtttggg atggtgggtg tcggtttgga gagcgatggg caaccgagga accaggcaag 780
cccaaggtga accaacacgg ataa 804
&lt;210&gt; 110
&lt;211&gt; 267
&lt;212&gt; PRT
&lt;213&gt; 特异腐质霉(Humicola insolens)
&lt;400&gt; 110
Met Tyr Leu Leu Pro Ile Ala Ala Ala Ala Leu Ala Phe Thr Thr Thr
1 5 10 15
Ala Tyr Ala His Ala Gln Val Tyr Gly Leu Arg Val Asn Asp Gln His
20 25 30
Gln Gly Asp Gly Arg Asn Lys Tyr Ile Arg Ser Pro Ser Ser Asn Ser
35 40 45
Pro Ile Arg Trp Asp His Val Thr His Pro Phe Leu Ile Cys Asn Ile
50 55 60
Arg Asp Asp Asn Gln Pro Pro Gly Pro Ala Pro Asp Phe Val Arg Ala
65 70 75 80
Phe Ala Gly Asp Arg Val Ala Phe Gln Trp Tyr His Ala Arg Pro Asn
85 90 95
Asp Pro Thr Asp Tyr Val Leu Asp Ser Ser His Leu Gly Val Leu Val
100 105 110
Thr Trp Ile Ala Pro Tyr Thr Asp Gly Pro Gly Thr Gly Pro Ile Trp
115 120 125
Thr Lys Ile His Gln Asp Gly Trp Asn Gly Thr His Trp Ala Thr Ser
130 135 140
Arg Leu Ile Ser Asn Gly Gly Phe Val Glu Phe Arg Leu Pro Gly Ser
145 150 155 160
Leu Lys Pro Gly Lys Tyr Leu Val Arg Gln Glu Ile Ile Ala Leu His
165 170 175
Gln Ala Asp Met Pro Gly Pro Asn Arg Gly Pro Glu Phe Tyr Pro Ser
180 185 190
Cys Ala Gln Leu Glu Val Phe Gly Ser Gly Glu Ala Ala Pro Pro Gln
195 200 205
Gly Tyr Asp Ile Asn Lys Gly Tyr Ala Glu Ser Gly Asp Lys Leu Trp
210 215 220
Phe Asn Ile Tyr Ile Asn Lys Asn Asp Glu Phe Lys Met Pro Gly Pro
225 230 235 240
Glu Val Trp Asp Gly Gly Cys Arg Phe Gly Glu Arg Trp Ala Thr Glu
245 250 255
Glu Pro Gly Lys Pro Lys Val Asn Gln His Gly
260 265
&lt;210&gt; 111
&lt;211&gt; 843
&lt;212&gt; DNA
&lt;213&gt; 特异腐质霉(Humicola insolens)
&lt;400&gt; 111
atgaagctcc tcgctcctct gatgctggct ggcgccgcca gcgcccgtga gtaacccctg 60
gctggatctc atgctggtgc cagtgttcca tgactgacaa ccaccctcag acaccatctt 120
cacctccctc gaggttgatg gccgcaacta cggcacgggc aacggcgtcc gcgtcccctc 180
ctacaacggc cccgtcgagg atgtcacgtc caactcgatc gcctgcaacg gcccgccgaa 240
cccgaccagc ccgaccgaca cggtcatcac cgtccaggct ggccagaacg tgactgccat 300
ctggcggtac atgctcaaca cccagggcac ctcgcccaac gacatcatgg acagcagcca 360
caagggtcct actctcgcct acctcaagaa ggtcaacgat gcccggactg actcgggcgt 420
cggcgatggc tggttcaaga tccagcacga cggcttcgac ggcaccacct ggggcaccga 480
gcgcgtcatc ttcggccagg gccgtcacac catcaagatc cccgagtgca tcgagcccgg 540
ccagtacctg ctgcgtgctg agatgatcgc cctccacggc gcccagaact acccgggtgc 600
tcagttctac atggagtgcg cccagctcaa cattgtcggt ggcaccggca ccaagaaacc 660
cagcaccgtc agcttccctg gcgcttacaa ggtatgtccg agtttggtac cgagataact 720
ggagatgaga aaagtgatgc taacaaacca tgacagggca ccgaccccgg cgtcaagctc 780
agcatctggt ggccgcccgt caccaactac gtcattcccg gccccgatgt cttcaagtgc 840
taa 843
&lt;210&gt; 112
&lt;211&gt; 237
&lt;212&gt; PRT
&lt;213&gt; 特异腐质霉(Humicola insolens)
&lt;400&gt; 112
Met Lys Leu Leu Ala Pro Leu Met Leu Ala Gly Ala Ala Ser Ala His
1 5 10 15
Thr Ile Phe Thr Ser Leu Glu Val Asp Gly Arg Asn Tyr Gly Thr Gly
20 25 30
Asn Gly Val Arg Val Pro Ser Tyr Asn Gly Pro Val Glu Asp Val Thr
35 40 45
Ser Asn Ser Ile Ala Cys Asn Gly Pro Pro Asn Pro Thr Ser Pro Thr
50 55 60
Asp Thr Val Ile Thr Val Gln Ala Gly Gln Asn Val Thr Ala Ile Trp
65 70 75 80
Arg Tyr Met Leu Asn Thr Gln Gly Thr Ser Pro Asn Asp Ile Met Asp
85 90 95
Ser Ser His Lys Gly Pro Thr Leu Ala Tyr Leu Lys Lys Val Asn Asp
100 105 110
Ala Arg Thr Asp Ser Gly Val Gly Asp Gly Trp Phe Lys Ile Gln His
115 120 125
Asp Gly Phe Asp Gly Thr Thr Trp Gly Thr Glu Arg Val Ile Phe Gly
130 135 140
Gln Gly Arg His Thr Ile Lys Ile Pro Glu Cys Ile Glu Pro Gly Gln
145 150 155 160
Tyr Leu Leu Arg Ala Glu Met Ile Ala Leu His Gly Ala Gln Asn Tyr
165 170 175
Pro Gly Ala Gln Phe Tyr Met Glu Cys Ala Gln Leu Asn Ile Val Gly
180 185 190
Gly Thr Gly Thr Lys Lys Pro Ser Thr Val Ser Phe Pro Gly Ala Tyr
195 200 205
Lys Gly Thr Asp Pro Gly Val Lys Leu Ser Ile Trp Trp Pro Pro Val
210 215 220
Thr Asn Tyr Val Ile Pro Gly Pro Asp Val Phe Lys Cys
225 230 235
&lt;210&gt; 113
&lt;211&gt; 705
&lt;212&gt; DNA
&lt;213&gt; 特异腐质霉(Humicola insolens)
&lt;400&gt; 113
atgaagctcc tctcaaccct cgccgccatt gcggccacct tggccacggc ggatgcgcac 60
tacatcttca acatcctgta cgtcaacggc cagcgcatgg gcggcgagta cacctacgtg 120
cggcgcaact ccaactcgta cttccccgtg ttccccgaca tcctcaactc caacgacatg 180
cgttgcaacg tgggtgccag accgggcaac acccaaaccg ccaccgtcag ggccggcgac 240
aggatcggct tcaaggtctt caacaacgag gtcatcgagc accctggtcc cggcttcatc 300
tacatgtcca aagccccggg cagcgtcaac aactatgacg gcagcgggga ctggttcaag 360
gtttacgaga ccggtctctg ccgcggtggt ggcaacgtcg acaccaactg gtgctcgtac 420
tacaaggacc ggctcgagtt taccatcccg cccaagactc ctcccggcga gtatctggtg 480
cgtatcgagc atatcggtct gcacgagggc cacgtcaaca gggcgcagtt ctacatcacc 540
tgcgcgcagc tcaagattga ggggcccggc ggcggcaacc cgaacccact cgtgaagatc 600
ccgggcatct acagggccaa cgaccccggc atcgcctaca acaagtggac caacaacccg 660
gcgccgtaca tcatgccggg tcccaaggtg tgggatggca actaa 705
&lt;210&gt; 114
&lt;211&gt; 234
&lt;212&gt; PRT
&lt;213&gt; 特异腐质霉(Humicola insolens)
&lt;400&gt; 114
Met Lys Leu Leu Ser Thr Leu Ala Ala Ile Ala Ala Thr Leu Ala Thr
1 5 10 15
Ala Asp Ala His Tyr Ile Phe Asn Ile Leu Tyr Val Asn Gly Gln Arg
20 25 30
Met Gly Gly Glu Tyr Thr Tyr Val Arg Arg Asn Ser Asn Ser Tyr Phe
35 40 45
Pro Val Phe Pro Asp Ile Leu Asn Ser Asn Asp Met Arg Cys Asn Val
50 55 60
Gly Ala Arg Pro Gly Asn Thr Gln Thr Ala Thr Val Arg Ala Gly Asp
65 70 75 80
Arg Ile Gly Phe Lys Val Phe Asn Asn Glu Val Ile Glu His Pro Gly
85 90 95
Pro Gly Phe Ile Tyr Met Ser Lys Ala Pro Gly Ser Val Asn Asn Tyr
100 105 110
Asp Gly Ser Gly Asp Trp Phe Lys Val Tyr Glu Thr Gly Leu Cys Arg
115 120 125
Gly Gly Gly Asn Val Asp Thr Asn Trp Cys Ser Tyr Tyr Lys Asp Arg
130 135 140
Leu Glu Phe Thr Ile Pro Pro Lys Thr Pro Pro Gly Glu Tyr Leu Val
145 150 155 160
Arg Ile Glu His Ile Gly Leu His Glu Gly His Val Asn Arg Ala Gln
165 170 175
Phe Tyr Ile Thr Cys Ala Gln Leu Lys Ile Glu Gly Pro Gly Gly Gly
180 185 190
Asn Pro Asn Pro Leu Val Lys Ile Pro Gly Ile Tyr Arg Ala Asn Asp
195 200 205
Pro Gly Ile Ala Tyr Asn Lys Trp Thr Asn Asn Pro Ala Pro Tyr Ile
210 215 220
Met Pro Gly Pro Lys Val Trp Asp Gly Asn
225 230
&lt;210&gt; 115
&lt;211&gt; 753
&lt;212&gt; DNA
&lt;213&gt; 特异腐质霉(Humicola insolens)
&lt;400&gt; 115
atgctgggaa gcgctcttct gctcctgggc actgccctgg gcgccaccgc ccactacacg 60
ttccctagga tcaacagcgg cggcgactgg cagtatgtcc gccgggccga caactggcag 120
gacaacggct tcgttggcaa cgtcaactcg cctcagatcc ggtgcttcca gagcaggcac 180
caggccgccc cggccaccct caacgtcacc gccggctcca cggtgaccta ctacgccaat 240
cccaacgtct atcaccccgg cccgatggcc ttctacatgg cccgcgtccc cgatggccag 300
gatatcaact cgtggaccgg cgagggtgcc gtgtggttca agatctacca cgagcagcct 360
accggcctgg gccagcagct gaggtggtct agcgatggta cgtgaatggt gatcctgtgg 420
catctcaacc tcttccagac ttctgacccg agcccccgcg gccctacagg caagaactcg 480
ttccaggttc agatcccccg ctgcatccgc tctggctact acctgctccg tgctgagcac 540
atcggcttgc acagcgccgg cagccctggt ggcgctcagt tctacatctc ttgcgcccag 600
ctcgccgtca acggcggtgg cagcaccgag ccccccaaca aggtgtcctt ccctggtgcc 660
tacagcccgt ccgaccccgg cattcagatc aacatctact ggcctgttcc gacctcgtac 720
aagaaccccg gccccccggt cttccagtgc taa 753
&lt;210&gt; 116
&lt;211&gt; 226
&lt;212&gt; PRT
&lt;213&gt; 特异腐质霉(Humicola insolens)
&lt;400&gt; 116
Met Leu Gly Ser Ala Leu Leu Leu Leu Gly Thr Ala Leu Gly Ala Thr
1 5 10 15
Ala His Tyr Thr Phe Pro Arg Ile Asn Ser Gly Gly Asp Trp Gln Tyr
20 25 30
Val Arg Arg Ala Asp Asn Trp Gln Asp Asn Gly Phe Val Gly Asn Val
35 40 45
Asn Ser Pro Gln Ile Arg Cys Phe Gln Ser Arg His Gln Ala Ala Pro
50 55 60
Ala Thr Leu Asn Val Thr Ala Gly Ser Thr Val Thr Tyr Tyr Ala Asn
65 70 75 80
Pro Asn Val Tyr His Pro Gly Pro Met Ala Phe Tyr Met Ala Arg Val
85 90 95
Pro Asp Gly Gln Asp Ile Asn Ser Trp Thr Gly Glu Gly Ala Val Trp
100 105 110
Phe Lys Ile Tyr His Glu Gln Pro Thr Gly Leu Gly Gln Gln Leu Arg
115 120 125
Trp Ser Ser Asp Gly Lys Asn Ser Phe Gln Val Gln Ile Pro Arg Cys
130 135 140
Ile Arg Ser Gly Tyr Tyr Leu Leu Arg Ala Glu His Ile Gly Leu His
145 150 155 160
Ser Ala Gly Ser Pro Gly Gly Ala Gln Phe Tyr Ile Ser Cys Ala Gln
165 170 175
Leu Ala Val Asn Gly Gly Gly Ser Thr Glu Pro Pro Asn Lys Val Ser
180 185 190
Phe Pro Gly Ala Tyr Ser Pro Ser Asp Pro Gly Ile Gln Ile Asn Ile
195 200 205
Tyr Trp Pro Val Pro Thr Ser Tyr Lys Asn Pro Gly Pro Pro Val Phe
210 215 220
Gln Cys
225
&lt;210&gt; 117
&lt;211&gt; 854
&lt;212&gt; DNA
&lt;213&gt; 特异腐质霉(Humicola insolens)
&lt;400&gt; 117
atgaagctgc ttcctgggtt gcttctggca gccacggctg cccaagccca ttgtacgttt 60
ccgatcccca agaccatctt cgagaatttt cgagccagat ctttctgaga gagttgctga 120
caattcctgc tagacacatt ccccaggctc gttgtcaacg ggcagcctga ggagagggac 180
tggtcggtca ctcggatgac aaagaaccac cagagcaagt cgggaattga aaacccaact 240
agccccgaca tccgttgcta cagctcgcag actgccccta acgtggcgat tgtgccggcc 300
gggtctacca tccactacat ctcgacccaa caaatcaacc atcctggccc gactcagtac 360
tatctcgcca aggtcccagc tggtcagtca gccaagacct gggatggctc tggcaacgtg 420
tggttcaaga tcgccacgag catgccggag tacgatcaaa acaggcagct ggtttggccc 480
ggtcatagta aggactcact ctcgtccgat catctctttt gagtgagtct tgggcatacc 540
cactgactac gtctgctatg acagatacct atcagaccat caacgccacc atcccggcca 600
acacgccgag cggagagtac ctcctgcgtg tcgagcaaat tgccctccac atggccagcc 660
agccgaacaa ggcccagttc tacatctcgt gctctcagat tcagattacc aatggcggaa 720
acggcactcc gggccctcta gttgcattcc cgggggcata caggagcaac gaccctggca 780
tcctggtcaa tctctacagc ggcatgcagc cttcgcagta ccagccccct ggaccggccg 840
tgtggcgtgg ctga 854
&lt;210&gt; 118
&lt;211&gt; 231
&lt;212&gt; PRT
&lt;213&gt; 特异腐质霉(Humicola insolens)
&lt;400&gt; 118
Met Lys Leu Leu Pro Gly Leu Leu Leu Ala Ala Thr Ala Ala Gln Ala
1 5 10 15
His Tyr Thr Phe Pro Arg Leu Val Val Asn Gly Gln Pro Glu Glu Arg
20 25 30
Asp Trp Ser Val Thr Arg Met Thr Lys Asn His Gln Ser Lys Ser Gly
35 40 45
Ile Glu Asn Pro Thr Ser Pro Asp Ile Arg Cys Tyr Ser Ser Gln Thr
50 55 60
Ala Pro Asn Val Ala Ile Val Pro Ala Gly Ser Thr Ile His Tyr Ile
65 70 75 80
Ser Thr Gln Gln Ile Asn His Pro Gly Pro Thr Gln Tyr Tyr Leu Ala
85 90 95
Lys Val Pro Ala Gly Gln Ser Ala Lys Thr Trp Asp Gly Ser Gly Asn
100 105 110
Val Trp Phe Lys Ile Ala Thr Ser Met Pro Glu Tyr Asp Gln Asn Arg
115 120 125
Gln Leu Val Trp Pro Gly His Asn Thr Tyr Gln Thr Ile Asn Ala Thr
130 135 140
Ile Pro Ala Asn Thr Pro Ser Gly Glu Tyr Leu Leu Arg Val Glu Gln
145 150 155 160
Ile Ala Leu His Met Ala Ser Gln Pro Asn Lys Ala Gln Phe Tyr Ile
165 170 175
Ser Cys Ser Gln Ile Gln Ile Thr Asn Gly Gly Asn Gly Thr Pro Gly
180 185 190
Pro Leu Val Ala Phe Pro Gly Ala Tyr Arg Ser Asn Asp Pro Gly Ile
195 200 205
Leu Val Asn Leu Tyr Ser Gly Met Gln Pro Ser Gln Tyr Gln Pro Pro
210 215 220
Gly Pro Ala Val Trp Arg Gly
225 230
&lt;210&gt; 119
&lt;211&gt; 863
&lt;212&gt; DNA
&lt;213&gt; 特异腐质霉(Humicola insolens)
&lt;400&gt; 119
atgctcctga actcggtcat cggctcggcc gtcctcctgg ccaccggcgc cgccgcccac 60
ggtgccgtga ccagctacgt cattgccggg aagaactacc ctgggtaggt aacctcgtgg 120
aagcgaatgc aggcagttca ttcactaaca catacctccg ttagctacaa cggctacgcc 180
ccgtccacca cccccaacac gatccagtgg caatggtcga cctacgaccc catctactcc 240
gccaccgacc ccaagctccg ctgcaacggc ggccgctcgg ccacgcagtc cgccccggct 300
gctccgggcg acaacatcac cgccatctgg cagcagtgga cgcatagcca gggccccatc 360
ctcgtctgga tgtacaagtg tcccggcgcc ttcagctcgt gcgacggctc gggccagggc 420
tggttcaaga ttgacgaggc cggcttcaat ggcgacggca agaccgtgtt cctcgacacc 480
gagcgcccct ccggctggga gatcgccaag ctggttggcg gcaacaaggg ctggaccagc 540
accatcccca agaacctggc cccgggcaac tacctggtcc gccacgagtt gattgccctt 600
caccaggcca acgccccgca gtggtaccct gagtgcgcgc aggtcgtgat caccggctcg 660
ggcactaagg agccgcctgc gtcgtacaag gctgccattc ccggctactg caaccagaac 720
gatcccaaca ttcgggtatg tgaggcctat ttggagttcg gctaaggcat gatactaact 780
ctacccccca ggttcctatc aacgaccact ccatccccca gacctacaag atccctggcc 840
ctccggtctg gcgcggcgag taa 863
&lt;210&gt; 120
&lt;211&gt; 248
&lt;212&gt; PRT
&lt;213&gt; 特异腐质霉(Humicola insolens)
&lt;400&gt; 120
Met Leu Leu Asn Ser Val Ile Gly Ser Ala Val Leu Leu Ala Thr Gly
1 5 10 15
Ala Ala Ala His Gly Ala Val Thr Ser Tyr Val Ile Ala Gly Lys Asn
20 25 30
Tyr Pro Gly Tyr Asn Gly Tyr Ala Pro Ser Thr Thr Pro Asn Thr Ile
35 40 45
Gln Trp Gln Trp Ser Thr Tyr Asp Pro Ile Tyr Ser Ala Thr Asp Pro
50 55 60
Lys Leu Arg Cys Asn Gly Gly Arg Ser Ala Thr Gln Ser Ala Pro Ala
65 70 75 80
Ala Pro Gly Asp Asn Ile Thr Ala Ile Trp Gln Gln Trp Thr His Ser
85 90 95
Gln Gly Pro Ile Leu Val Trp Met Tyr Lys Cys Pro Gly Ala Phe Ser
100 105 110
Ser Cys Asp Gly Ser Gly Gln Gly Trp Phe Lys Ile Asp Glu Ala Gly
115 120 125
Phe Asn Gly Asp Gly Lys Thr Val Phe Leu Asp Thr Glu Arg Pro Ser
130 135 140
Gly Trp Glu Ile Ala Lys Leu Val Gly Gly Asn Lys Gly Trp Thr Ser
145 150 155 160
Thr Ile Pro Lys Asn Leu Ala Pro Gly Asn Tyr Leu Val Arg His Glu
165 170 175
Leu Ile Ala Leu His Gln Ala Asn Ala Pro Gln Trp Tyr Pro Glu Cys
180 185 190
Ala Gln Val Val Ile Thr Gly Ser Gly Thr Lys Glu Pro Pro Ala Ser
195 200 205
Tyr Lys Ala Ala Ile Pro Gly Tyr Cys Asn Gln Asn Asp Pro Asn Ile
210 215 220
Arg Val Pro Ile Asn Asp His Ser Ile Pro Gln Thr Tyr Lys Ile Pro
225 230 235 240
Gly Pro Pro Val Trp Arg Gly Glu
245
&lt;210&gt; 121
&lt;211&gt; 883
&lt;212&gt; DNA
&lt;213&gt; 特异腐质霉(Humicola insolens)
&lt;400&gt; 121
atgaagctca ccacctccat cgccctgctg gctgcggccg gcgcgcaggc tcactgtacg 60
tgctccctca tctcatccat ctcctcagac catgttttac ctattggtta ctaacaagct 120
ctcacgcaga caccttcccc cgcaccaagg tcgacggcgt cacctcgggc gagtgggaga 180
cgatccgcat caccgagaac cactggtcgc acggccccgt gacggacgtg acctcgcagg 240
ccatgacgtg ctacgagaag acgcccggcc agggcgcgcc caagacggtt aacgtgaagg 300
ccggcggcac cgtcaccttc accgtcgaca cggacgtggg ccacccgggc ccgctgcact 360
tctacttggc caaggtgccc gcgggcaaga cggccgcgac gtttgacggc aagggcgccg 420
tgtggttcaa gatttaccag gacggccccg gcgggttggg gaccagctcg ttgacttggc 480
ctagctttgg tgagctttct tttctttatt ttcttcaatc ctcccataat tacctcccga 540
cgaggaaata aatatacctt acctgatatt aacccatccc cccccacctc ctccaggcaa 600
gaaggaagtc tctgtccaaa tccccccctg cgtgcaggac ggcgagtacc tgctgcgcgt 660
cgagcacatt gcgctgcaca gcgccgcgag cgtcggcggc gcgcagctct acatttcgtg 720
cgcgcaaatc aacgtcaccg gcggcaccgg cacgctcaac ccgggccagc tcgtctcgtt 780
cccgggcgcc tacaagccca ccgacccggg catcctgttc cagctctact ggccgccgcc 840
gacccagtac atcaaccccg gtccggcgcc ggtgaagtgc tga 883
&lt;210&gt; 122
&lt;211&gt; 233
&lt;212&gt; PRT
&lt;213&gt; 特异腐质霉(Humicola insolens)
&lt;400&gt; 122
Met Lys Leu Thr Thr Ser Ile Ala Leu Leu Ala Ala Ala Gly Ala Gln
1 5 10 15
Ala His Tyr Thr Phe Pro Arg Thr Lys Val Asp Gly Val Thr Ser Gly
20 25 30
Glu Trp Glu Thr Ile Arg Ile Thr Glu Asn His Trp Ser His Gly Pro
35 40 45
Val Thr Asp Val Thr Ser Gln Ala Met Thr Cys Tyr Glu Lys Thr Pro
50 55 60
Gly Gln Gly Ala Pro Lys Thr Val Asn Val Lys Ala Gly Gly Thr Val
65 70 75 80
Thr Phe Thr Val Asp Thr Asp Val Gly His Pro Gly Pro Leu His Phe
85 90 95
Tyr Leu Ala Lys Val Pro Ala Gly Lys Thr Ala Ala Thr Phe Asp Gly
100 105 110
Lys Gly Ala Val Trp Phe Lys Ile Tyr Gln Asp Gly Pro Gly Gly Leu
115 120 125
Gly Thr Ser Ser Leu Thr Trp Pro Ser Phe Gly Lys Lys Glu Val Ser
130 135 140
Val Gln Ile Pro Pro Cys Val Gln Asp Gly Glu Tyr Leu Leu Arg Val
145 150 155 160
Glu His Ile Ala Leu His Ser Ala Ala Ser Val Gly Gly Ala Gln Leu
165 170 175
Tyr Ile Ser Cys Ala Gln Ile Asn Val Thr Gly Gly Thr Gly Thr Leu
180 185 190
Asn Pro Gly Gln Leu Val Ser Phe Pro Gly Ala Tyr Lys Pro Thr Asp
195 200 205
Pro Gly Ile Leu Phe Gln Leu Tyr Trp Pro Pro Pro Thr Gln Tyr Ile
210 215 220
Asn Pro Gly Pro Ala Pro Val Lys Cys
225 230
&lt;210&gt; 123
&lt;211&gt; 928
&lt;212&gt; DNA
&lt;213&gt; 特异腐质霉(Humicola insolens)
&lt;400&gt; 123
atgaagactc tcgcatccgc cctcattgcc gcgggccttc tggcccagta cgccgctgcc 60
catgccattt tccagtttgc cagcagcggt ggcactgact ttgggacgtc ctgtgttagg 120
atgccggtga gtgaacgggt gcccctgaac atgtgttgct cacgaaacaa ggttatgttg 180
actctataca gcccaacaac tctcccgtca cgagcgtcac cagcagtgac atggcttgca 240
atgttggcgg atctcgcggt gtatctggca tttgcgaggt gaacggtaag agttctcctc 300
agccttttct ctgtcaagca ctaaacagca ctcgctaacc atttcaatct cagccggctc 360
cgacttcacc gtcgagatgc acgcgcagcc caacgaccgg tcgtgcgcca gcgaagccat 420
tggcggcaac cacttcgggc ccgtcatggt gtacatggcc aaggtggacg acgcgacgcg 480
ggcggacggt gcgtcggcgt cttggttcaa ggtggacgag ttcggctacg acgccggctc 540
caagacatgg ggaaccgaca tgctcaacaa gaactgcggc aagcggacgt tccgcatccc 600
gagcaaaatc ccgtctgggg actatctggt gcgtgcggag gctattgctt tgcacaccgc 660
gggccagccg tcgggtgcgc agttttatat gagctgctat gtgagttctt ccatgcttcc 720
ccttgtggtg tcactgtata gaagatgcta atatctccca cagcaagttc gcatcaaggg 780
cagcaacaac ggtcagcttc cggctggtgt tcggattcct ggcgcctaca gcgcgacgga 840
cccgggcatc ctcgtcgata tctggggcaa tggtttcagc cagtacacta ttcctggccc 900
tcgtgtcatt gatgggagct ttttctga 928
&lt;210&gt; 124
&lt;211&gt; 243
&lt;212&gt; PRT
&lt;213&gt; 特异腐质霉(Humicola insolens)
&lt;400&gt; 124
Met Lys Thr Leu Ala Ser Ala Leu Ile Ala Ala Gly Leu Leu Ala Gln
1 5 10 15
Tyr Ala Ala Ala His Ala Ile Phe Gln Phe Ala Ser Ser Gly Gly Thr
20 25 30
Asp Phe Gly Thr Ser Cys Val Arg Met Pro Pro Asn Asn Ser Pro Val
35 40 45
Thr Ser Val Thr Ser Ser Asp Met Ala Cys Asn Val Gly Gly Ser Arg
50 55 60
Gly Val Ser Gly Ile Cys Glu Val Asn Ala Gly Ser Asp Phe Thr Val
65 70 75 80
Glu Met His Ala Gln Pro Asn Asp Arg Ser Cys Ala Ser Glu Ala Ile
85 90 95
Gly Gly Asn His Phe Gly Pro Val Met Val Tyr Met Ala Lys Val Asp
100 105 110
Asp Ala Thr Arg Ala Asp Gly Ala Ser Ala Ser Trp Phe Lys Val Asp
115 120 125
Glu Phe Gly Tyr Asp Ala Gly Ser Lys Thr Trp Gly Thr Asp Met Leu
130 135 140
Asn Lys Asn Cys Gly Lys Arg Thr Phe Arg Ile Pro Ser Lys Ile Pro
145 150 155 160
Ser Gly Asp Tyr Leu Val Arg Ala Glu Ala Ile Ala Leu His Thr Ala
165 170 175
Gly Gln Pro Ser Gly Ala Gln Phe Tyr Met Ser Cys Tyr Gln Val Arg
180 185 190
Ile Lys Gly Ser Asn Asn Gly Gln Leu Pro Ala Gly Val Arg Ile Pro
195 200 205
Gly Ala Tyr Ser Ala Thr Asp Pro Gly Ile Leu Val Asp Ile Trp Gly
210 215 220
Asn Gly Phe Ser Gln Tyr Thr Ile Pro Gly Pro Arg Val Ile Asp Gly
225 230 235 240
Ser Phe Phe
&lt;210&gt; 125
&lt;211&gt; 1092
&lt;212&gt; DNA
&lt;213&gt; 特异腐质霉(Humicola insolens)
&lt;400&gt; 125
atgcctcgct tcaccaagtc cattgtctcg gccctggccg gcgcttccct ggtcgcagcc 60
cacggccatg tcacccacat cgtcatcaac ggcgtgctgt acccgaactt cgaccctaca 120
tcccaccctt acctgcagaa cccgccgacc gttgtgggct ggaccgccgc caacaccgac 180
aacggcttcg ttgctcccga ccagttcgcc tcgggcgata tcatctgcca caaccaggcc 240
accaacgcgg gcggccacgc cgtggtcgcg gccggcgaca agatttggat ccagtgggac 300
cagtggcctg agagccacca cggccccgtc ctcgactacc tcgcctcctg cggcagctcg 360
ggctgcgagt cggtcaacaa gctcgacctc gagttcttca agatcggcga aaagggcctg 420
atcgacggct cctccgcgcc gggccggtgg gcgtcggacg agctgatcgc caacaacgcc 480
ggctggctgg tccagatccc cgccgacatt gcgcccggcc actacgtcct gcgccacgaa 540
atcatcgccc tccacgccgc cggccagccc aacggcgccc agaactaccc gcagtgcttc 600
aacctcctcg tcacgggctc cggcaccgcg cggccgcagg gcgtcaaggg aacagcgctg 660
tacaccccca acgacaaggg catcttggcg ggcatctaca atgcccccgt ctcgtacgag 720
attcccggcc ccgcgctcta ctccggcgcc gccaggaact tgcagcagag ctcgtcccag 780
gccacgtcga ctgccacggc tttgactggg gacgcggtgc ctgttccgac ccaagccccc 840
gtcactacca cttcctcttc ttcggccgat gccgccaccg ccacctccac caccgtccag 900
ccgccccagc aaaccaccct cacgaccgcc atcgccacgt cgaccgctgc tgctgccccg 960
acgaccaccg ccggcagcgg aaacggtggc aaccggccct tcccaacccg ctgccctggc 1020
ctggctgggc tcgggtttga caagcgccgt cgccagctcc gcgctgagga gggtgtgcag 1080
gtggttgctt ga 1092
&lt;210&gt; 126
&lt;211&gt; 363
&lt;212&gt; PRT
&lt;213&gt; 特异腐质霉(Humicola insolens)
&lt;400&gt; 126
Met Pro Arg Phe Thr Lys Ser Ile Val Ser Ala Leu Ala Gly Ala Ser
1 5 10 15
Leu Val Ala Ala His Gly His Val Thr His Ile Val Ile Asn Gly Val
20 25 30
Leu Tyr Pro Asn Phe Asp Pro Thr Ser His Pro Tyr Leu Gln Asn Pro
35 40 45
Pro Thr Val Val Gly Trp Thr Ala Ala Asn Thr Asp Asn Gly Phe Val
50 55 60
Ala Pro Asp Gln Phe Ala Ser Gly Asp Ile Ile Cys His Asn Gln Ala
65 70 75 80
Thr Asn Ala Gly Gly His Ala Val Val Ala Ala Gly Asp Lys Ile Trp
85 90 95
Ile Gln Trp Asp Gln Trp Pro Glu Ser His His Gly Pro Val Leu Asp
100 105 110
Tyr Leu Ala Ser Cys Gly Ser Ser Gly Cys Glu Ser Val Asn Lys Leu
115 120 125
Asp Leu Glu Phe Phe Lys Ile Gly Glu Lys Gly Leu Ile Asp Gly Ser
130 135 140
Ser Ala Pro Gly Arg Trp Ala Ser Asp Glu Leu Ile Ala Asn Asn Ala
145 150 155 160
Gly Trp Leu Val Gln Ile Pro Ala Asp Ile Ala Pro Gly His Tyr Val
165 170 175
Leu Arg His Glu Ile Ile Ala Leu His Ala Ala Gly Gln Pro Asn Gly
180 185 190
Ala Gln Asn Tyr Pro Gln Cys Phe Asn Leu Leu Val Thr Gly Ser Gly
195 200 205
Thr Ala Arg Pro Gln Gly Val Lys Gly Thr Ala Leu Tyr Thr Pro Asn
210 215 220
Asp Lys Gly Ile Leu Ala Gly Ile Tyr Asn Ala Pro Val Ser Tyr Glu
225 230 235 240
Ile Pro Gly Pro Ala Leu Tyr Ser Gly Ala Ala Arg Asn Leu Gln Gln
245 250 255
Ser Ser Ser Gln Ala Thr Ser Thr Ala Thr Ala Leu Thr Gly Asp Ala
260 265 270
Val Pro Val Pro Thr Gln Ala Pro Val Thr Thr Thr Ser Ser Ser Ser
275 280 285
Ala Asp Ala Ala Thr Ala Thr Ser Thr Thr Val Gln Pro Pro Gln Gln
290 295 300
Thr Thr Leu Thr Thr Ala Ile Ala Thr Ser Thr Ala Ala Ala Ala Pro
305 310 315 320
Thr Thr Thr Ala Gly Ser Gly Asn Gly Gly Asn Arg Pro Phe Pro Thr
325 330 335
Arg Cys Pro Gly Leu Ala Gly Leu Gly Phe Asp Lys Arg Arg Arg Gln
340 345 350
Leu Arg Ala Glu Glu Gly Val Gln Val Val Ala
355 360
&lt;210&gt; 127
&lt;211&gt; 1086
&lt;212&gt; DNA
&lt;213&gt; 特异腐质霉(Humicola insolens)
&lt;400&gt; 127
atgaagggac ttctcagcat cgccgccctt tccctggcgg ttggtgaggc ttcggcccac 60
tacatcttcc agcagctctc gacgggtggc accaagcacc ccatgtggaa gtacatccgc 120
cagcacacca actacaactc tcccgtcatc gacctcgact ccaacgacct ccgctgcaat 180
gtcggtgccc ggggtgctgg aactgagacc gttacggtcg ctgctggctc gagcctgacc 240
ttccacctcg acacccccgt ctaccaccag ggccctgtgt cggtgtaagt agaagttctc 300
agacgaacca ccaatgtcgg cagataattt ctaactccga tgtccagcta tatgtccaag 360
gctcccggct ccgtgtcgga ctatgacggc agcggcggct ggttcaagat tcaagactgg 420
ggcccgacct tcaccggcag cggcgccacc tggaagctgg atgactccta caccttcaac 480
atcccctcgt gcattcccga cggcgagtac ctcgtccgca tccagtccct gggtatccac 540
aacccctggc cggcgggtat tccgcagttc tatatctcgt gcgctcaggt gcgcgtcacc 600
ggcggtggca acgcgaaccc gagcccgcag gtgtcgatcc caggtgcctt caaggagacc 660
gacccgggct acactgccaa cgtgagtttc catccatgct acatatccct tttacgctct 720
cgatcccatg actaaccccc ccctgaaaag atctacaaca acttccgcag ctacaccgtc 780
cccggcccgt ccgtcttcac ctgcagcggc aacagcggcg gcggctccaa ccccagcaac 840
cctaaccccc cgaccccgac gaccttcacc acccaggtga ccaccccgac cccggcgtct 900
ccgccctctt gcaccgtcgc gaagtggtac gtctgaaaaa aaatctcctc caggccggac 960
atgagaaaac taacatgaac gaaaaacagg ggccagtgcg gtggccaggg ctacagcggc 1020
tgcaccaact gcgaggccgg ctcgacctgc aggcagcaga acgcttacta ttctcagtgc 1080
atctaa 1086
&lt;210&gt; 128
&lt;211&gt; 296
&lt;212&gt; PRT
&lt;213&gt; 特异腐质霉(Humicola insolens)
&lt;400&gt; 128
Met Lys Gly Leu Leu Ser Ile Ala Ala Leu Ser Leu Ala Val Gly Glu
1 5 10 15
Ala Ser Ala His Tyr Ile Phe Gln Gln Leu Ser Thr Gly Gly Thr Lys
20 25 30
His Pro Met Trp Lys Tyr Ile Arg Gln His Thr Asn Tyr Asn Ser Pro
35 40 45
Val Ile Asp Leu Asp Ser Asn Asp Leu Arg Cys Asn Val Gly Ala Arg
50 55 60
Gly Ala Gly Thr Glu Thr Val Thr Val Ala Ala Gly Ser Ser Leu Thr
65 70 75 80
Phe His Leu Asp Thr Pro Val Tyr His Gln Gly Pro Val Ser Val Tyr
85 90 95
Met Ser Lys Ala Pro Gly Ser Val Ser Asp Tyr Asp Gly Ser Gly Gly
100 105 110
Trp Phe Lys Ile Gln Asp Trp Gly Pro Thr Phe Thr Gly Ser Gly Ala
115 120 125
Thr Trp Lys Leu Asp Asp Ser Tyr Thr Phe Asn Ile Pro Ser Cys Ile
130 135 140
Pro Asp Gly Glu Tyr Leu Val Arg Ile Gln Ser Leu Gly Ile His Asn
145 150 155 160
Pro Trp Pro Ala Gly Ile Pro Gln Phe Tyr Ile Ser Cys Ala Gln Val
165 170 175
Arg Val Thr Gly Gly Gly Asn Ala Asn Pro Ser Pro Gln Val Ser Ile
180 185 190
Pro Gly Ala Phe Lys Glu Thr Asp Pro Gly Tyr Thr Ala Asn Ile Tyr
195 200 205
Asn Asn Phe Arg Ser Tyr Thr Val Pro Gly Pro Ser Val Phe Thr Cys
210 215 220
Ser Gly Asn Ser Gly Gly Gly Ser Asn Pro Ser Asn Pro Asn Pro Pro
225 230 235 240
Thr Pro Thr Thr Phe Thr Thr Gln Val Thr Thr Pro Thr Pro Ala Ser
245 250 255
Pro Pro Ser Cys Thr Val Ala Lys Trp Gly Gln Cys Gly Gly Gln Gly
260 265 270
Tyr Ser Gly Cys Thr Asn Cys Glu Ala Gly Ser Thr Cys Arg Gln Gln
275 280 285
Asn Ala Tyr Tyr Ser Gln Cys Ile
290 295
&lt;210&gt; 129
&lt;211&gt; 1032
&lt;212&gt; DNA
&lt;213&gt; 特异腐质霉(Humicola insolens)
&lt;400&gt; 129
atgaggccct tctcactcgt cgctctggcg acggccgtca gcggccacgc catcttccag 60
cgcgtgtcgg ttaacggcgt cgaccaaggc cagctcaagg gcgtccgcgc tccctcgagc 120
aactacccca tcgagaacgt caaccacccc gactttgcct gcaacaccaa catccagcac 180
cgcgacggca ccgtcatcaa gatccccgcc ggcgccaccg tcggcgcctg gtggcagcac 240
gagatcggcg ggccctcgtt cccgggtgac ccggataacc cgatcgctgc ttcgcacaag 300
ggtgagttcc catagataga tctcttctct cccgacccct tgtatcctct cataactaac 360
cacctcaacc ccccaggccc tatccaagtc tacctcgcca aggtcgacaa cgccgcgacc 420
gcctccccca acggcctgcg gtggttcaag attgccgaga agggcctgtc gggcggcgtc 480
tgggccgtcg acgagatgat ccgcaacaac ggctggcact acttcaccat gccgcagtgc 540
atcgcgcccg gccactacct gatgcgcgtc gagctgttgg cgctgcactc ggccagcttc 600
cccggcggcg cccagttcta catggagtgc gcccagatcg aggtcaccgg ctcgggcaac 660
ttctcgccct ccgagacggt cagcttcccc ggcgcctacc cggccaacca cccgggtatc 720
gtcgtcagca tctacgacgc ccagggtaac gccaacaacg gcgggcgcga gtaccagatc 780
cccgggccgc ggccgatcac ctgctccggc ggtggaagca acaatggtgg cgggaacaac 840
aatggtggtg gaaacaacaa cggcggcggc aacaacaacg gcggtgggaa caacaacggt 900
ggtggtaaca ccggtggcgg ctcggcgccg ctctggggcc agtgcggcgg caatgggtat 960
accggcccga cgacttgtgc cgagggtact tgcaagaagc agaatgactg gtactcgcag 1020
tgtacgcctt ag 1032
&lt;210&gt; 130
&lt;211&gt; 318
&lt;212&gt; PRT
&lt;213&gt; 特异腐质霉(Humicola insolens)
&lt;400&gt; 130
Met Arg Pro Phe Ser Leu Val Ala Leu Ala Thr Ala Val Ser Gly His
1 5 10 15
Ala Ile Phe Gln Arg Val Ser Val Asn Gly Val Asp Gln Gly Gln Leu
20 25 30
Lys Gly Val Arg Ala Pro Ser Ser Asn Tyr Pro Ile Glu Asn Val Asn
35 40 45
His Pro Asp Phe Ala Cys Asn Thr Asn Ile Gln His Arg Asp Gly Thr
50 55 60
Val Ile Lys Ile Pro Ala Gly Ala Thr Val Gly Ala Trp Trp Gln His
65 70 75 80
Glu Ile Gly Gly Pro Ser Phe Pro Gly Asp Pro Asp Asn Pro Ile Ala
85 90 95
Ala Ser His Lys Gly Pro Ile Gln Val Tyr Leu Ala Lys Val Asp Asn
100 105 110
Ala Ala Thr Ala Ser Pro Asn Gly Leu Arg Trp Phe Lys Ile Ala Glu
115 120 125
Lys Gly Leu Ser Gly Gly Val Trp Ala Val Asp Glu Met Ile Arg Asn
130 135 140
Asn Gly Trp His Tyr Phe Thr Met Pro Gln Cys Ile Ala Pro Gly His
145 150 155 160
Tyr Leu Met Arg Val Glu Leu Leu Ala Leu His Ser Ala Ser Phe Pro
165 170 175
Gly Gly Ala Gln Phe Tyr Met Glu Cys Ala Gln Ile Glu Val Thr Gly
180 185 190
Ser Gly Asn Phe Ser Pro Ser Glu Thr Val Ser Phe Pro Gly Ala Tyr
195 200 205
Pro Ala Asn His Pro Gly Ile Val Val Ser Ile Tyr Asp Ala Gln Gly
210 215 220
Asn Ala Asn Asn Gly Gly Arg Glu Tyr Gln Ile Pro Gly Pro Arg Pro
225 230 235 240
Ile Thr Cys Ser Gly Gly Gly Ser Asn Asn Gly Gly Gly Asn Asn Asn
245 250 255
Gly Gly Gly Asn Asn Asn Gly Gly Gly Asn Asn Asn Gly Gly Gly Asn
260 265 270
Asn Asn Gly Gly Gly Asn Thr Gly Gly Gly Ser Ala Pro Leu Trp Gly
275 280 285
Gln Cys Gly Gly Asn Gly Tyr Thr Gly Pro Thr Thr Cys Ala Glu Gly
290 295 300
Thr Cys Lys Lys Gln Asn Asp Trp Tyr Ser Gln Cys Thr Pro
305 310 315
&lt;210&gt; 131
&lt;211&gt; 1113
&lt;212&gt; DNA
&lt;213&gt; 特异腐质霉(Humicola insolens)
&lt;400&gt; 131
atggtgttgc ggtctctctc tatcctggcc ttcgtagcca gaggcgtctt cgcccacggt 60
ggcctctcca actacacggt cggcgacacg tggtatagcg ggtgcgtcca tgaacaactc 120
ctatatcttc cccccctcca cattgcgacc gctgcacatc tcactcgtcc ataaacaaca 180
acatcaatcg gtagacactg tccaaaagct aaccaccgta cctcctgaac acagctacga 240
ccccttcacc cccgccgccg cccaactctc ccaaccctgg ctgatccaac gccaatggac 300
cagcatcgac ccgctcttct ccccgacctc tccctacctc gcctgcaact tccccggcac 360
cgcgccacca tcttacatcc ctctccgcgc cggcgacatc ctcaccgcgg tttactggtt 420
ctggctgcac cccgtggggc cgatgagcgt ttggctggcg cggtgcgcag gggactgccg 480
cgacgaggac gtgacgcggg cgcgctggtt caagatctgg catgcggggt ttctggaggg 540
gccgaatttg gagctcggga tgtggtatca gaagaagttc cagcggtggg atggcgggcc 600
ggcgctctgg cgggtgagga taccgagggg gttgaagaag gggttgtaca tggtcaggca 660
tgagattttg tcgattcatg tgggtggacg gccccagttt tatcccgagt gtgcgcactt 720
gaatgtgacg gagggtggtg aggtggtagt gccgggggag tggacgagaa ggttccctgg 780
ggcgtatgac gatgatggtg agtgccttgc tagacgggaa ggctctatgg atggggcgga 840
tgagacgaaa ggctggtgtg agactgtcag cactgacggc ctgcagacaa gtcagtcttc 900
atcgatatct accggccgga acatgaaaac aggacggtac gtgggacaag caagcctcgg 960
atttttcaga ttttcgactc tgacaacgaa caggactatg agatccctgg aggcccgatt 1020
tgggaaaggt acgtacaatc gcatcatctt gactctgtat tcaggggcta acataaacac 1080
agcttggggg agatggagtt atggcctgaa tga 1113
&lt;210&gt; 132
&lt;211&gt; 259
&lt;212&gt; PRT
&lt;213&gt; 特异腐质霉(Humicola insolens)
&lt;400&gt; 132
Met Val Leu Arg Ser Leu Ser Ile Leu Ala Phe Val Ala Arg Gly Val
1 5 10 15
Phe Ala His Gly Gly Leu Ser Asn Tyr Thr Val Gly Asp Thr Trp Tyr
20 25 30
Ser Gly Tyr Asp Pro Phe Thr Pro Ala Ala Ala Gln Leu Ser Gln Pro
35 40 45
Trp Leu Ile Gln Arg Gln Trp Thr Ser Ile Asp Pro Leu Phe Ser Pro
50 55 60
Thr Ser Pro Tyr Leu Ala Cys Asn Phe Pro Gly Thr Ala Pro Pro Ser
65 70 75 80
Tyr Ile Pro Leu Arg Ala Gly Asp Ile Leu Thr Ala Val Tyr Trp Phe
85 90 95
Trp Leu His Pro Val Gly Pro Met Ser Val Trp Leu Ala Arg Cys Ala
100 105 110
Gly Asp Cys Arg Asp Glu Asp Val Thr Arg Ala Arg Trp Phe Lys Ile
115 120 125
Trp His Ala Gly Phe Leu Glu Gly Pro Asn Leu Glu Leu Gly Met Trp
130 135 140
Tyr Gln Lys Lys Phe Gln Arg Trp Asp Gly Gly Pro Ala Leu Trp Arg
145 150 155 160
Val Arg Ile Pro Arg Gly Leu Lys Lys Gly Leu Tyr Met Val Arg His
165 170 175
Glu Ile Leu Ser Ile His Val Gly Gly Arg Pro Gln Phe Tyr Pro Glu
180 185 190
Cys Ala His Leu Asn Val Thr Glu Gly Gly Glu Val Val Val Pro Gly
195 200 205
Glu Trp Thr Arg Arg Phe Pro Gly Ala Tyr Asp Asp Asp Asp Lys Ser
210 215 220
Val Phe Ile Asp Ile Tyr Arg Pro Glu His Glu Asn Arg Thr Asp Tyr
225 230 235 240
Glu Ile Pro Gly Gly Pro Ile Trp Glu Ser Leu Gly Glu Met Glu Leu
245 250 255
Trp Pro Glu
&lt;210&gt; 133
&lt;211&gt; 1103
&lt;212&gt; DNA
&lt;213&gt; 特异腐质霉(Humicola insolens)
&lt;400&gt; 133
atgaggaccg tcttcgccgc cgcactggca gcactcgctg cccgggaagt cgccggccat 60
gccacgttcc agcaactctg ggttgacgga accgattata taagtgcccc ccttttctcg 120
gttccatttg atatcatgat gctgacaccc ccagcacggc agcacctgcg tccgcctccc 180
cgccagcaac agccccctga ccgacgtcac cagcagcgac ttcgcctgca acatcggcgg 240
ccggcgcggc gtgggcggca aatgccccgt caaagccggc ggcgtggtca cgatcgagat 300
gcatcagcag cccaacgacc ggaactgccg cagcgaggcc atcggcggca tgcactgggg 360
tccggtgcag gtctacctca gcaaggtccc cgacgcgtcg accgccgagc cgacgcaggt 420
gggctggttc aagatcttct ccaacgcgtg ggccaagaag cccggcggca actcgggcga 480
cgacgactac tggggcacgc gcgagctcaa cggctgctgc gggcgcatgg acgtgccgat 540
ccccaccgac ctggaagacg gcgactacct gctgcgcgcc gaggcgctgg cgctgcacgc 600
catgccgggc cagttctaca tgtcgtgcta ccagatcacc atcacgggcg gcacgggcac 660
cgcgaagccg gcgactgtcc gcttccccgg agcgtacacc aacaacgacg ccggcatccg 720
cgccaacatc cacgccccgc tgagcaccta catcgcgccc ggcccggagg tgtactccgg 780
cggtaccacc cgggcgcccg gtgagggctg cccgggatgt gctacgacct gccaggttgg 840
ctcgtcgccc agcgcgcagg ctccaggcca tggcacggcc gtgggcggcg gagctggtgg 900
cccgtctgct tgcaccgtcc aggcgtatgg ccagtgcggt ggccagggat acacgggttg 960
caccgagtgc gcggtaagtt gggacttcct tgtcattaaa atcgcaaatg gaacggatgg 1020
gctaacattt gcgggtgcag gatggtttcg tttgccgcga cgtctcggct ccgtggtact 1080
ctcagtgcca gcctgctttc taa 1103
&lt;210&gt; 134
&lt;211&gt; 325
&lt;212&gt; PRT
&lt;213&gt; 特异腐质霉(Humicola insolens)
&lt;400&gt; 134
Met Arg Thr Val Phe Ala Ala Ala Leu Ala Ala Leu Ala Ala Arg Glu
1 5 10 15
Val Ala Gly His Ala Thr Phe Gln Gln Leu Trp Val Asp Gly Thr Asp
20 25 30
Tyr Gly Ser Thr Cys Val Arg Leu Pro Ala Ser Asn Ser Pro Leu Thr
35 40 45
Asp Val Thr Ser Ser Asp Phe Ala Cys Asn Ile Gly Gly Arg Arg Gly
50 55 60
Val Gly Gly Lys Cys Pro Val Lys Ala Gly Gly Val Val Thr Ile Glu
65 70 75 80
Met His Gln Gln Pro Asn Asp Arg Asn Cys Arg Ser Glu Ala Ile Gly
85 90 95
Gly Met His Trp Gly Pro Val Gln Val Tyr Leu Ser Lys Val Pro Asp
100 105 110
Ala Ser Thr Ala Glu Pro Thr Gln Val Gly Trp Phe Lys Ile Phe Ser
115 120 125
Asn Ala Trp Ala Lys Lys Pro Gly Gly Asn Ser Gly Asp Asp Asp Tyr
130 135 140
Trp Gly Thr Arg Glu Leu Asn Gly Cys Cys Gly Arg Met Asp Val Pro
145 150 155 160
Ile Pro Thr Asp Leu Glu Asp Gly Asp Tyr Leu Leu Arg Ala Glu Ala
165 170 175
Leu Ala Leu His Ala Met Pro Gly Gln Phe Tyr Met Ser Cys Tyr Gln
180 185 190
Ile Thr Ile Thr Gly Gly Thr Gly Thr Ala Lys Pro Ala Thr Val Arg
195 200 205
Phe Pro Gly Ala Tyr Thr Asn Asn Asp Ala Gly Ile Arg Ala Asn Ile
210 215 220
His Ala Pro Leu Ser Thr Tyr Ile Ala Pro Gly Pro Glu Val Tyr Ser
225 230 235 240
Gly Gly Thr Thr Arg Ala Pro Gly Glu Gly Cys Pro Gly Cys Ala Thr
245 250 255
Thr Cys Gln Val Gly Ser Ser Pro Ser Ala Gln Ala Pro Gly His Gly
260 265 270
Thr Ala Val Gly Gly Gly Ala Gly Gly Pro Ser Ala Cys Thr Val Gln
275 280 285
Ala Tyr Gly Gln Cys Gly Gly Gln Gly Tyr Thr Gly Cys Thr Glu Cys
290 295 300
Ala Asp Gly Phe Val Cys Arg Asp Val Ser Ala Pro Trp Tyr Ser Gln
305 310 315 320
Cys Gln Pro Ala Phe
325
&lt;210&gt; 135
&lt;211&gt; 1039
&lt;212&gt; DNA
&lt;213&gt; 特异腐质霉(Humicola insolens)
&lt;400&gt; 135
atgaggctcc cccaagtggc ttccgttctg gccctcgcgg cccaggtcca cggtcacggc 60
tacatctacc gtgtcaccgc cgacaacatt gtgtaagcgc cctcagattc cggacctctt 120
cctacctggt ggctaacctt ctctcaactc ttcagctacc cgggatacga catctatgtc 180
gatcccctcc tccaaccgcc cccgtaccgc attgcctacg gtggtggcca gacgggtccc 240
gtctatgata tcaacagcaa ggatatcgcc tgccagcgcg tccacagccc cgctccgggt 300
ctgattgccc aggctcgcgc gggcagcaac atcaccttct ggtggtcgcg gtggctgtac 360
agccacaagg gtcccatctc ggcatggatg gctccgtatg agggcgacat tgccaatgtg 420
gacgtcaacc agctcgagtt cttcaagatt ggcgaggagt tccacgatga gaccggcaag 480
tgggcgacgg agaagctggt ggacgacccc gagggcaagt ggaccgtcaa gatccccgcc 540
gatatcaagc ccggtctcta tgtcgtgcgg aacgaggtaa gtttcatccg tcccaaaaaa 600
ggggtcccat cccatgcatg gtgcatgccc agtctaatca tcatctcccg gatagatcat 660
cgccctccac ttcgccgtcc gcatgcctcc cttctttgcc gccttcaccc ccctcggacc 720
gcagttctac atgacctgct tcgccttcaa catcaccggc gacggcacgg ccactcccca 780
gggctacaag ttccctggcg cctacagcaa ggacgatccg gccctgtggt gggatctgga 840
ggagaacaag aacccgtacc ccggcgccgg ccccaagccc cacgtctcgg cctacgatgt 900
cgacctcgtc cccaacgagt tgtacatcgt cagcccgacg aacaacgcga cggctgatga 960
gctctactgg gaggcccaga ggcaggcgct tgctgcccag gcggcgacga cggagtactt 1020
tgactcgatt ggtggctaa 1039
&lt;210&gt; 136
&lt;211&gt; 298
&lt;212&gt; PRT
&lt;213&gt; 特异腐质霉(Humicola insolens)
&lt;400&gt; 136
Met Arg Leu Pro Gln Val Ala Ser Val Leu Ala Leu Ala Ala Gln Val
1 5 10 15
His Gly His Gly Tyr Ile Tyr Arg Val Thr Ala Asp Asn Ile Val Tyr
20 25 30
Pro Gly Tyr Asp Ile Tyr Val Asp Pro Leu Leu Gln Pro Pro Pro Tyr
35 40 45
Arg Ile Ala Tyr Gly Gly Gly Gln Thr Gly Pro Val Tyr Asp Ile Asn
50 55 60
Ser Lys Asp Ile Ala Cys Gln Arg Val His Ser Pro Ala Pro Gly Leu
65 70 75 80
Ile Ala Gln Ala Arg Ala Gly Ser Asn Ile Thr Phe Trp Trp Ser Arg
85 90 95
Trp Leu Tyr Ser His Lys Gly Pro Ile Ser Ala Trp Met Ala Pro Tyr
100 105 110
Glu Gly Asp Ile Ala Asn Val Asp Val Asn Gln Leu Glu Phe Phe Lys
115 120 125
Ile Gly Glu Glu Phe His Asp Glu Thr Gly Lys Trp Ala Thr Glu Lys
130 135 140
Leu Val Asp Asp Pro Glu Gly Lys Trp Thr Val Lys Ile Pro Ala Asp
145 150 155 160
Ile Lys Pro Gly Leu Tyr Val Val Arg Asn Glu Ile Ile Ala Leu His
165 170 175
Phe Ala Val Arg Met Pro Pro Phe Phe Ala Ala Phe Thr Pro Leu Gly
180 185 190
Pro Gln Phe Tyr Met Thr Cys Phe Ala Phe Asn Ile Thr Gly Asp Gly
195 200 205
Thr Ala Thr Pro Gln Gly Tyr Lys Phe Pro Gly Ala Tyr Ser Lys Asp
210 215 220
Asp Pro Ala Leu Trp Trp Asp Leu Glu Glu Asn Lys Asn Pro Tyr Pro
225 230 235 240
Gly Ala Gly Pro Lys Pro His Val Ser Ala Tyr Asp Val Asp Leu Val
245 250 255
Pro Asn Glu Leu Tyr Ile Val Ser Pro Thr Asn Asn Ala Thr Ala Asp
260 265 270
Glu Leu Tyr Trp Glu Ala Gln Arg Gln Ala Leu Ala Ala Gln Ala Ala
275 280 285
Thr Thr Glu Tyr Phe Asp Ser Ile Gly Gly
290 295
&lt;210&gt; 137
&lt;211&gt; 1025
&lt;212&gt; DNA
&lt;213&gt; 特异腐质霉(Humicola insolens)
&lt;400&gt; 137
atgcacgtcc agtctctcct tgccggagcg ctcgctctgg ctccgtcggc gtctgctcac 60
ttcctcttcc cgcacctgat gctgaacggt gtccgcacgg gagcctacga gtatgtccgg 120
gagcacgact tcggcttcat gccgcacaac aacgactgga tcaactcgcc cgatttccgt 180
tgcaacgagg ggtcctggcg tcatcgccgc gagcccaaga ccgccgtagt cactgccggc 240
gttgacgtcg tgggcttcaa cctgcacctg gactttgacc tgtaccatcc gggccccgtg 300
acggtaagca catctgagtc agaacatacc tccctgtgac gtagactaat gagtctctta 360
ccgcagatct atctctcccg cgcccccggc gacgtgcgtg actacgacgg atctggtgac 420
tggttcaagg tgtaccagct gggcacccgc caacccttca acggcactga cgagggctgg 480
gccacttgga agatgaagaa ctggcagttc cgcctgcccg ctgagatccc ggcgggcgag 540
tacctgatgc gcatcgagca gatgagcgtg caccctcctt accgccagaa ggagtggtac 600
gtgcagtgcg cccacctaaa gatcaacagc aactacaacg gccccgcgcc cggcccgacc 660
atcaagattc ccggagggta caagatcagc gatcctgcga ttcaatatga ccagtgggcg 720
cagccgccgc cgacgtacgc gcccatgccg ggaccgccgc tgtggcccaa caacaatcct 780
cagcagggca acccgaatca gggcggaaat aacggcggtg gcaaccaggg cggcggcaat 840
ggtggctgca ccgttccgaa gtggtatgta gagttcttca ctattatcat gagatgcagc 900
gttggacttg tgcttacacc tagaacaggg gccaatgcgg tggtcagggt tacagcgggt 960
gcaggaactg cgagtctggc tcgacatgcc gtgcccagaa cgactggtac tcgcagtgcc 1020
tgtaa 1025
&lt;210&gt; 138
&lt;211&gt; 298
&lt;212&gt; PRT
&lt;213&gt; 特异腐质霉(Humicola insolens)
&lt;400&gt; 138
Met His Val Gln Ser Leu Leu Ala Gly Ala Leu Ala Leu Ala Pro Ser
1 5 10 15
Ala Ser Ala His Phe Leu Phe Pro His Leu Met Leu Asn Gly Val Arg
20 25 30
Thr Gly Ala Tyr Glu Tyr Val Arg Glu His Asp Phe Gly Phe Met Pro
35 40 45
His Asn Asn Asp Trp Ile Asn Ser Pro Asp Phe Arg Cys Asn Glu Gly
50 55 60
Ser Trp Arg His Arg Arg Glu Pro Lys Thr Ala Val Val Thr Ala Gly
65 70 75 80
Val Asp Val Val Gly Phe Asn Leu His Leu Asp Phe Asp Leu Tyr His
85 90 95
Pro Gly Pro Val Thr Ile Tyr Leu Ser Arg Ala Pro Gly Asp Val Arg
100 105 110
Asp Tyr Asp Gly Ser Gly Asp Trp Phe Lys Val Tyr Gln Leu Gly Thr
115 120 125
Arg Gln Pro Phe Asn Gly Thr Asp Glu Gly Trp Ala Thr Trp Lys Met
130 135 140
Lys Asn Trp Gln Phe Arg Leu Pro Ala Glu Ile Pro Ala Gly Glu Tyr
145 150 155 160
Leu Met Arg Ile Glu Gln Met Ser Val His Pro Pro Tyr Arg Gln Lys
165 170 175
Glu Trp Tyr Val Gln Cys Ala His Leu Lys Ile Asn Ser Asn Tyr Asn
180 185 190
Gly Pro Ala Pro Gly Pro Thr Ile Lys Ile Pro Gly Gly Tyr Lys Ile
195 200 205
Ser Asp Pro Ala Ile Gln Tyr Asp Gln Trp Ala Gln Pro Pro Pro Thr
210 215 220
Tyr Ala Pro Met Pro Gly Pro Pro Leu Trp Pro Asn Asn Asn Pro Gln
225 230 235 240
Gln Gly Asn Pro Asn Gln Gly Gly Asn Asn Gly Gly Gly Asn Gln Gly
245 250 255
Gly Gly Asn Gly Gly Cys Thr Val Pro Lys Trp Gly Gln Cys Gly Gly
260 265 270
Gln Gly Tyr Ser Gly Cys Arg Asn Cys Glu Ser Gly Ser Thr Cys Arg
275 280 285
Ala Gln Asn Asp Trp Tyr Ser Gln Cys Leu
290 295
&lt;210&gt; 139
&lt;211&gt; 1035
&lt;212&gt; DNA
&lt;213&gt; 特异腐质霉(Humicola insolens)
&lt;400&gt; 139
atgccaccac cactactggc caccgtcctc tccttgctag ccctcacccg cggcgccctt 60
tcccattccc acctagccca cgtcatcatc aacggccagc tctaccacgg cttcgaccca 120
cgtccaaacc aaaacaacca tccagcccgt gtcggctggt ccacgaccgc cacagatgac 180
ggcttcgtca ccccgggcaa ttactcccat cccgacatca tctgccaccg cggcggcgtc 240
agcccgcgcg cccacgctcc cgtcaccgcc ggcggcaagg tccaggtcca atggaacggc 300
tggccgatcg gacacgtcgg gccgatcctg acctacatcg cgccgtgcgg cggactgccg 360
ggcgccgaag aagggtgtac gggcgtggac aaaaccgacc tgcggtggac caagatcgac 420
gactcgatgc cgccgttccg gtttaccgac gccaccaagc cagtctctgg cagagcgcag 480
ttcccgatag gccaggtctg ggcgacggat gcgctggtcg aggcgaataa tagctggtcg 540
gtggtcattc ccaggaatat cccgccgggg ccgtacgttt tgaggcagga gattgtggcc 600
ctgcattacg cggcgaagtt gaacggggcg cagaactatc cgttgtgtct gaacctctgg 660
gtggaaaagg ggcagcagga tcagggagag cccttcaaat tcgatgctta cgacgcgagg 720
gagttttaca gcgaggacca tccgggtgtg ttgattgatg ttatgacgat ggttgggccg 780
agagccgtgt accggatacc tggaccgacc gtggccagtg gtgccacgag aattccgcac 840
tcattgcaga cgagcgccga gacgtgggtg gaagggacgc cggtggccgt gacgagggcg 900
acggaaacgg ttcagatgga gataactacg acacctgcag gtcagggagc tggtgtgagg 960
acagctaccc ctgccatgcc aacaccaaca gtgacgaaga ggtggaaggg aagatttgag 1020
atgggtaggc catga 1035
&lt;210&gt; 140
&lt;211&gt; 344
&lt;212&gt; PRT
&lt;213&gt; 特异腐质霉(Humicola insolens)
&lt;400&gt; 140
Met Pro Pro Pro Leu Leu Ala Thr Val Leu Ser Leu Leu Ala Leu Thr
1 5 10 15
Arg Gly Ala Leu Ser His Ser His Leu Ala His Val Ile Ile Asn Gly
20 25 30
Gln Leu Tyr His Gly Phe Asp Pro Arg Pro Asn Gln Asn Asn His Pro
35 40 45
Ala Arg Val Gly Trp Ser Thr Thr Ala Thr Asp Asp Gly Phe Val Thr
50 55 60
Pro Gly Asn Tyr Ser His Pro Asp Ile Ile Cys His Arg Gly Gly Val
65 70 75 80
Ser Pro Arg Ala His Ala Pro Val Thr Ala Gly Gly Lys Val Gln Val
85 90 95
Gln Trp Asn Gly Trp Pro Ile Gly His Val Gly Pro Ile Leu Thr Tyr
100 105 110
Ile Ala Pro Cys Gly Gly Leu Pro Gly Ala Glu Glu Gly Cys Thr Gly
115 120 125
Val Asp Lys Thr Asp Leu Arg Trp Thr Lys Ile Asp Asp Ser Met Pro
130 135 140
Pro Phe Arg Phe Thr Asp Ala Thr Lys Pro Val Ser Gly Arg Ala Gln
145 150 155 160
Phe Pro Ile Gly Gln Val Trp Ala Thr Asp Ala Leu Val Glu Ala Asn
165 170 175
Asn Ser Trp Ser Val Val Ile Pro Arg Asn Ile Pro Pro Gly Pro Tyr
180 185 190
Val Leu Arg Gln Glu Ile Val Ala Leu His Tyr Ala Ala Lys Leu Asn
195 200 205
Gly Ala Gln Asn Tyr Pro Leu Cys Leu Asn Leu Trp Val Glu Lys Gly
210 215 220
Gln Gln Asp Gln Gly Glu Pro Phe Lys Phe Asp Ala Tyr Asp Ala Arg
225 230 235 240
Glu Phe Tyr Ser Glu Asp His Pro Gly Val Leu Ile Asp Val Met Thr
245 250 255
Met Val Gly Pro Arg Ala Val Tyr Arg Ile Pro Gly Pro Thr Val Ala
260 265 270
Ser Gly Ala Thr Arg Ile Pro His Ser Leu Gln Thr Ser Ala Glu Thr
275 280 285
Trp Val Glu Gly Thr Pro Val Ala Val Thr Arg Ala Thr Glu Thr Val
290 295 300
Gln Met Glu Ile Thr Thr Thr Pro Ala Gly Gln Gly Ala Gly Val Arg
305 310 315 320
Thr Ala Thr Pro Ala Met Pro Thr Pro Thr Val Thr Lys Arg Trp Lys
325 330 335
Gly Arg Phe Glu Met Gly Arg Pro
340
&lt;210&gt; 141
&lt;211&gt; 1057
&lt;212&gt; DNA
&lt;213&gt; 特异腐质霉(Humicola insolens)
&lt;400&gt; 141
atgaagtccc tgacctacgc cgcgctggcc gccctctggg cccagcagac cgctgctcat 60
gccaccttcc agcaactctg ggtcgacggc gtcgactacg gcagtcagtg cgcccgcctg 120
ccgccgtcca actcccccat cgccagcgtc acctcgaccg ccatgcgctg caacaacggt 180
ccccgcgctg ccgccaagtg ccccgtcaag gctggcggca ccgtcaccat cgagatgcac 240
caggttggtt tccttgaagt gttcccctac cacatataca gaccgtagct aacacaccca 300
tccttagcaa cccggtgacc ggtcctgcaa ccaggacgcc attggcggtg cccaccacgg 360
ccccgtgatg gtgtacatgt ccaaggtctc tgatgccttc accgccgacg gctcgtcagg 420
ctggttcaag atcttccagg acggctgggc caagaacccc aacggccgcg ttggcgacga 480
cgacttctgg ggcaccaagg acctcaacac ctgctgcggc aagatgaacg tcaagatccc 540
cgccgacatc gcccccggcg actacctgct ccgcgccgag gccatcgcgc tgcacgccgc 600
cggccccagc ggtggcgccc agccctacgt cacctgctac cagctcaccg tcacgggcgg 660
cggcaacgcc aacccgccca ccgtcaactt ccccggcgcc tacagcgagc gtgaccctgg 720
catcgccgtc agcatccacg gcgctctgtc caactacgtc gtccccggtc ctccggtcta 780
ctcgggcggc agcgagaagc gcgctggcag cccctgcgag ggctgcgagg ccacctgcaa 840
ggtcggctcg agccccagcc agactcttgc tccttccaac ccggccccga cctctcccgc 900
caacggcggc ggcaacaacg gtggtggcaa cactggcggc ggctgcaccg tgcccaagtg 960
gcagcagtgc ggcggccagg gctactcggg ctgcaccgtc tgcgagtctg gctcgacttg 1020
ccgcgctcag aaccagtggt actctcagtg cgtgtaa 1057
&lt;210&gt; 142
&lt;211&gt; 330
&lt;212&gt; PRT
&lt;213&gt; 特异腐质霉(Humicola insolens)
&lt;400&gt; 142
Met Lys Ser Leu Thr Tyr Ala Ala Leu Ala Ala Leu Trp Ala Gln Gln
1 5 10 15
Thr Ala Ala His Ala Thr Phe Gln Gln Leu Trp Val Asp Gly Val Asp
20 25 30
Tyr Gly Ser Gln Cys Ala Arg Leu Pro Pro Ser Asn Ser Pro Ile Ala
35 40 45
Ser Val Thr Ser Thr Ala Met Arg Cys Asn Asn Gly Pro Arg Ala Ala
50 55 60
Ala Lys Cys Pro Val Lys Ala Gly Gly Thr Val Thr Ile Glu Met His
65 70 75 80
Gln Gln Pro Gly Asp Arg Ser Cys Asn Gln Asp Ala Ile Gly Gly Ala
85 90 95
His His Gly Pro Val Met Val Tyr Met Ser Lys Val Ser Asp Ala Phe
100 105 110
Thr Ala Asp Gly Ser Ser Gly Trp Phe Lys Ile Phe Gln Asp Gly Trp
115 120 125
Ala Lys Asn Pro Asn Gly Arg Val Gly Asp Asp Asp Phe Trp Gly Thr
130 135 140
Lys Asp Leu Asn Thr Cys Cys Gly Lys Met Asn Val Lys Ile Pro Ala
145 150 155 160
Asp Ile Ala Pro Gly Asp Tyr Leu Leu Arg Ala Glu Ala Ile Ala Leu
165 170 175
His Ala Ala Gly Pro Ser Gly Gly Ala Gln Pro Tyr Val Thr Cys Tyr
180 185 190
Gln Leu Thr Val Thr Gly Gly Gly Asn Ala Asn Pro Pro Thr Val Asn
195 200 205
Phe Pro Gly Ala Tyr Ser Glu Arg Asp Pro Gly Ile Ala Val Ser Ile
210 215 220
His Gly Ala Leu Ser Asn Tyr Val Val Pro Gly Pro Pro Val Tyr Ser
225 230 235 240
Gly Gly Ser Glu Lys Arg Ala Gly Ser Pro Cys Glu Gly Cys Glu Ala
245 250 255
Thr Cys Lys Val Gly Ser Ser Pro Ser Gln Thr Leu Ala Pro Ser Asn
260 265 270
Pro Ala Pro Thr Ser Pro Ala Asn Gly Gly Gly Asn Asn Gly Gly Gly
275 280 285
Asn Thr Gly Gly Gly Cys Thr Val Pro Lys Trp Gln Gln Cys Gly Gly
290 295 300
Gln Gly Tyr Ser Gly Cys Thr Val Cys Glu Ser Gly Ser Thr Cys Arg
305 310 315 320
Ala Gln Asn Gln Trp Tyr Ser Gln Cys Val
325 330
&lt;210&gt; 143
&lt;211&gt; 772
&lt;212&gt; DNA
&lt;213&gt; 特异腐质霉(Humicola insolens)
&lt;400&gt; 143
atgaagctcc tcctccccgc cctcctggct ctggccgccg agtccgtctc ggcgcactac 60
atcttccaac aactcaccgt cgccggcacc aagtaccccg tgtggaagta catccggcgc 120
aacagcaatc cggcgtggct tcaaaacggc cctgtgaccg acctcgcctc gaccgacctg 180
cgctgcaacg tgggcgggca ggtcagcaac ggcaccgaga ctctcacggt ccgcgcgggc 240
gaccagttca cgttccacct cgacacggcg gtgtaccacc agggcccgac ctcgctgtac 300
atgtcgcgcg ctccgggcaa ggtggaggac tatgatggca gcgggccgtg gtttaagatt 360
tatgattggg ggccgacagg gaataattgg gtcatgaggg gtatggtttc ccctattaat 420
tattattatt gtttacttgg ggcatcatct ggtggtggtg ctggtgacga tgataagagt 480
gatggagaag gacctggctg acgacctaaa aacccgatca gattcgtaca cgtacaacat 540
cccccgctgc atccccgacg gcgagtatct cctgcgcatc cagcagctgg gtctgcacaa 600
tccgggcgcc gcgccgcagt tctacatcag ctgcgcccag atcaaggtca ccggcggcgg 660
cactaccaac ccgaccccca cggctctgat tccgggagcg ttcagggcta cggatccggg 720
atacactgtc aacgtaagtc aaactttgag caactccata tcaacctcgt ga 772
&lt;210&gt; 144
&lt;211&gt; 216
&lt;212&gt; PRT
&lt;213&gt; 特异腐质霉(Humicola insolens)
&lt;400&gt; 144
Met Lys Leu Leu Leu Pro Ala Leu Leu Ala Leu Ala Ala Glu Ser Val
1 5 10 15
Ser Ala His Tyr Ile Phe Gln Gln Leu Thr Val Ala Gly Thr Lys Tyr
20 25 30
Pro Val Trp Lys Tyr Ile Arg Arg Asn Ser Asn Pro Ala Trp Leu Gln
35 40 45
Asn Gly Pro Val Thr Asp Leu Ala Ser Thr Asp Leu Arg Cys Asn Val
50 55 60
Gly Gly Gln Val Ser Asn Gly Thr Glu Thr Leu Thr Val Arg Ala Gly
65 70 75 80
Asp Gln Phe Thr Phe His Leu Asp Thr Ala Val Tyr His Gln Gly Pro
85 90 95
Thr Ser Leu Tyr Met Ser Arg Ala Pro Gly Lys Val Glu Asp Tyr Asp
100 105 110
Gly Ser Gly Pro Trp Phe Lys Ile Tyr Asp Trp Gly Pro Thr Gly Asn
115 120 125
Asn Trp Val Met Arg Asp Ser Tyr Thr Tyr Asn Ile Pro Arg Cys Ile
130 135 140
Pro Asp Gly Glu Tyr Leu Leu Arg Ile Gln Gln Leu Gly Leu His Asn
145 150 155 160
Pro Gly Ala Ala Pro Gln Phe Tyr Ile Ser Cys Ala Gln Ile Lys Val
165 170 175
Thr Gly Gly Gly Thr Thr Asn Pro Thr Pro Thr Ala Leu Ile Pro Gly
180 185 190
Ala Phe Arg Ala Thr Asp Pro Gly Tyr Thr Val Asn Val Ser Gln Thr
195 200 205
Leu Ser Asn Ser Ile Ser Thr Ser
210 215
&lt;210&gt; 145
&lt;211&gt; 1536
&lt;212&gt; DNA
&lt;213&gt; 特异腐质霉(Humicola insolens)
&lt;400&gt; 145
atgcgttctg tttcccttct tgcggccgct ttcgcgccgc tggctacggc acacacggtc 60
tttacagctc ttttcatcaa caatgtccac cagggcgacg gcacttgcgt ccgtatggct 120
aagcagggca acctcgccac ccatcccgtc agtctgaaca gcaatgagat ggcctgcggt 180
gggtaggccc cgttcctcga gcagctgatc tcgaactaac atgttgattc ttgaactcca 240
ggtcgcgatg gccaacaacc agtggcattt acttgcccag cacctgcggg agccaagctg 300
accttattgt ttcgtatgtg ggcagatggc tctcagccag gttccatcga caagtctcac 360
gttggtccca tgtccatcta cctcaagaaa gtctcagata tgaacaccga ctcggccgca 420
gggcccgggt ggttcaagat ctggagtgag ggctacgacg ctgcgacgaa gaaatgggcc 480
acggagaaac tcatcgccaa caacggtttg ctcagcgtca acctacctcc cggcctccct 540
gcaggctact acctcgcccg ccacgaaatc gtcactctcc aaaacgtcac caacaacaag 600
gccgatccgc agttctacgt cggctgtgcg cagctgttcg tccaagggtt gggcaccgcc 660
gcctccgtgc ctgctgacaa aaccgtttcc atccccggcc atctgaaccc caacgacccg 720
gcgctggtat tcaaccccta tacccaaaac gctgcgacat acccaagctt cggcccaccg 780
ctcttcttcc caaatgctgc ttcggcggga tcaaacaagg cccagtcaac actcaagcaa 840
acctccggcg tcatcccctc cgactgcctc atcaaaaacg ccaactggtg cggccgtgaa 900
gttccagact ataccaacga ggcgggatgc tggacggcgg cggggaactg ttgggagcag 960
gctgatcaat gctacaagac agccccgcca tcgggccata agggatgcaa gacctgggag 1020
gagcagaagt gcaacgtcat ccagaactcc tgtgaagcga agaggttttc gggcccgcca 1080
aacagggggg tcaagtttgc tgatatggat gtgaatcagc ttgttccggg ggcgatccct 1140
gaagcagtga acgccggtca gaatggggag gcggttgttg ttgacggcac aacgagctct 1200
gcagatgaga aggcgagtgt ggatttgaca acatcgtctc taccgacgcc gacgcctgcg 1260
gctgaagaaa acgggaagga ggatgaaaga ctggctcttg atccgaccct gacggaggac 1320
gagtcgtttt tctcagttga gccaacgtct gagcccactg gtgttcaggt tgaggtgcct 1380
ttgacaactg tggtcctcct tccaacgctc acctcatctt tgaatccatt gccaaccccg 1440
acctcaattt cccagccggc tcacccggga agaccatgca caggtcgccg tcgtaggccg 1500
aggccagggt ttccgaaaca cccgcgcgat ttttaa 1536
&lt;210&gt; 146
&lt;211&gt; 490
&lt;212&gt; PRT
&lt;213&gt; 特异腐质霉(Humicola insolens)
&lt;400&gt; 146
Met Arg Ser Val Ser Leu Leu Ala Ala Ala Phe Ala Pro Leu Ala Thr
1 5 10 15
Ala His Thr Val Phe Thr Ala Leu Phe Ile Asn Asn Val His Gln Gly
20 25 30
Asp Gly Thr Cys Val Arg Met Ala Lys Gln Gly Asn Leu Ala Thr His
35 40 45
Pro Val Ser Leu Asn Ser Asn Glu Met Ala Cys Gly Arg Asp Gly Gln
50 55 60
Gln Pro Val Ala Phe Thr Cys Pro Ala Pro Ala Gly Ala Lys Leu Thr
65 70 75 80
Leu Leu Phe Arg Met Trp Ala Asp Gly Ser Gln Pro Gly Ser Ile Asp
85 90 95
Lys Ser His Val Gly Pro Met Ser Ile Tyr Leu Lys Lys Val Ser Asp
100 105 110
Met Asn Thr Asp Ser Ala Ala Gly Pro Gly Trp Phe Lys Ile Trp Ser
115 120 125
Glu Gly Tyr Asp Ala Ala Thr Lys Lys Trp Ala Thr Glu Lys Leu Ile
130 135 140
Ala Asn Asn Gly Leu Leu Ser Val Asn Leu Pro Pro Gly Leu Pro Ala
145 150 155 160
Gly Tyr Tyr Leu Ala Arg His Glu Ile Val Thr Leu Gln Asn Val Thr
165 170 175
Asn Asn Lys Ala Asp Pro Gln Phe Tyr Val Gly Cys Ala Gln Leu Phe
180 185 190
Val Gln Gly Leu Gly Thr Ala Ala Ser Val Pro Ala Asp Lys Thr Val
195 200 205
Ser Ile Pro Gly His Leu Asn Pro Asn Asp Pro Ala Leu Val Phe Asn
210 215 220
Pro Tyr Thr Gln Asn Ala Ala Thr Tyr Pro Ser Phe Gly Pro Pro Leu
225 230 235 240
Phe Phe Pro Asn Ala Ala Ser Ala Gly Ser Asn Lys Ala Gln Ser Thr
245 250 255
Leu Lys Gln Thr Ser Gly Val Ile Pro Ser Asp Cys Leu Ile Lys Asn
260 265 270
Ala Asn Trp Cys Gly Arg Glu Val Pro Asp Tyr Thr Asn Glu Ala Gly
275 280 285
Cys Trp Thr Ala Ala Gly Asn Cys Trp Glu Gln Ala Asp Gln Cys Tyr
290 295 300
Lys Thr Ala Pro Pro Ser Gly His Lys Gly Cys Lys Thr Trp Glu Glu
305 310 315 320
Gln Lys Cys Asn Val Ile Gln Asn Ser Cys Glu Ala Lys Arg Phe Ser
325 330 335
Gly Pro Pro Asn Arg Gly Val Lys Phe Ala Asp Met Asp Val Asn Gln
340 345 350
Leu Val Pro Gly Ala Ile Pro Glu Ala Val Asn Ala Gly Gln Asn Gly
355 360 365
Glu Ala Val Val Val Asp Gly Thr Thr Ser Ser Ala Asp Glu Lys Ala
370 375 380
Ser Val Asp Leu Thr Thr Ser Ser Leu Pro Thr Pro Thr Pro Ala Ala
385 390 395 400
Glu Glu Asn Gly Lys Glu Asp Glu Arg Leu Ala Leu Asp Pro Thr Leu
405 410 415
Thr Glu Asp Glu Ser Phe Phe Ser Val Glu Pro Thr Ser Glu Pro Thr
420 425 430
Gly Val Gln Val Glu Val Pro Leu Thr Thr Val Val Leu Leu Pro Thr
435 440 445
Leu Thr Ser Ser Leu Asn Pro Leu Pro Thr Pro Thr Ser Ile Ser Gln
450 455 460
Pro Ala His Pro Gly Arg Pro Cys Thr Gly Arg Arg Arg Arg Pro Arg
465 470 475 480
Pro Gly Phe Pro Lys His Pro Arg Asp Phe
485 490
&lt;210&gt; 147
&lt;211&gt; 921
&lt;212&gt; DNA
&lt;213&gt; 特异腐质霉(Humicola insolens)
&lt;400&gt; 147
atgttcttcc gcaacgccgc cactcttgct ctggcctacg ccaccaccgg cgtctcggcc 60
cacgcgctca tgtacggcgt ctgggtcaac ggcgtcgacc aaggcgacgg ccgcaacgtc 120
tacatccgca cgccccccaa caacagcccg gtcaaagacc tcgccagccc ggacatcgtc 180
tgcaacgtca acggcgggcg cgccgttccg gacttcgtcc aggcctcggc gggggacacc 240
ctcaccttcg agtggctgca caacacccgc ggcgacgaca tcatcgaccg ctcccacctc 300
ggccccatca tcacctacat cgcccctttt accacgggca acccgacggg gcccgtctgg 360
accaaaatcg ccgaacaggg cttcaaccct tccacccgcc gctgggccgt cgacgatctg 420
atcgacaacg gcggcaagac cgacttcgtc ctgcccgcgt ccctcgcgcc gggcaggtac 480
atcatccggc aggagatcat cgcgcaccac gagtccgaaa ccacgttcga atccaacccg 540
gcgcggggtg cccagttcta cccgtcgtgc gtgcagatcc aagtctcttc tggctcgggc 600
accgccgtgc cggatcagaa ctttgacttc aacacgggct acacgtacgc cgaccccggc 660
atccacttca acatctacac ctcgttcaac agctactcca tccccggccc ggaggtttgg 720
acgggcgcta gcaccggcgg cggcaacggc aacggcaacg gcaacggcaa tgccacgcct 780
acgcagccta ctcccactcc cactgtcact cccactccca tcgagaccgc ccagccggtt 840
accacgacga ccacctcgac ccggccgttc cctacccgct gccctggccg ccgcctcaag 900
cgtgaggagc ccaaggcttg a 921
&lt;210&gt; 148
&lt;211&gt; 306
&lt;212&gt; PRT
&lt;213&gt; 特异腐质霉(Humicola insolens)
&lt;400&gt; 148
Met Phe Phe Arg Asn Ala Ala Thr Leu Ala Leu Ala Tyr Ala Thr Thr
1 5 10 15
Gly Val Ser Ala His Ala Leu Met Tyr Gly Val Trp Val Asn Gly Val
20 25 30
Asp Gln Gly Asp Gly Arg Asn Val Tyr Ile Arg Thr Pro Pro Asn Asn
35 40 45
Ser Pro Val Lys Asp Leu Ala Ser Pro Asp Ile Val Cys Asn Val Asn
50 55 60
Gly Gly Arg Ala Val Pro Asp Phe Val Gln Ala Ser Ala Gly Asp Thr
65 70 75 80
Leu Thr Phe Glu Trp Leu His Asn Thr Arg Gly Asp Asp Ile Ile Asp
85 90 95
Arg Ser His Leu Gly Pro Ile Ile Thr Tyr Ile Ala Pro Phe Thr Thr
100 105 110
Gly Asn Pro Thr Gly Pro Val Trp Thr Lys Ile Ala Glu Gln Gly Phe
115 120 125
Asn Pro Ser Thr Arg Arg Trp Ala Val Asp Asp Leu Ile Asp Asn Gly
130 135 140
Gly Lys Thr Asp Phe Val Leu Pro Ala Ser Leu Ala Pro Gly Arg Tyr
145 150 155 160
Ile Ile Arg Gln Glu Ile Ile Ala His His Glu Ser Glu Thr Thr Phe
165 170 175
Glu Ser Asn Pro Ala Arg Gly Ala Gln Phe Tyr Pro Ser Cys Val Gln
180 185 190
Ile Gln Val Ser Ser Gly Ser Gly Thr Ala Val Pro Asp Gln Asn Phe
195 200 205
Asp Phe Asn Thr Gly Tyr Thr Tyr Ala Asp Pro Gly Ile His Phe Asn
210 215 220
Ile Tyr Thr Ser Phe Asn Ser Tyr Ser Ile Pro Gly Pro Glu Val Trp
225 230 235 240
Thr Gly Ala Ser Thr Gly Gly Gly Asn Gly Asn Gly Asn Gly Asn Gly
245 250 255
Asn Ala Thr Pro Thr Gln Pro Thr Pro Thr Pro Thr Val Thr Pro Thr
260 265 270
Pro Ile Glu Thr Ala Gln Pro Val Thr Thr Thr Thr Thr Ser Thr Arg
275 280 285
Pro Phe Pro Thr Arg Cys Pro Gly Arg Arg Leu Lys Arg Glu Glu Pro
290 295 300
Lys Ala
305
&lt;210&gt; 149
&lt;211&gt; 1092
&lt;212&gt; DNA
&lt;213&gt; 特异腐质霉(Humicola insolens)
&lt;400&gt; 149
atggctcatc catgggcacg ttgcgtctat acagccatct ggctcgctgc ctccgcttct 60
ggacgtaggt acaagactcc ggcagtgcca tttatgaacc cacaacgtgg actggtcccg 120
tgctaacaca tcacagactc gcgcgtttgg agtgtctcgg tcaatggacg ctaccaggga 180
ccgggtgttg atgactacct gcgcgcaccg ccaagtgact ctccggtggt ggacctggac 240
tcaccaaccc tcaactgcaa tgtcaatgga aacaagcctg ttccagggtt tgttgaggtg 300
tctgcgggag attctctgga atggaagtgg tactacatca acccgtacaa cccaagcgac 360
atgatcatcg cggcagaaca ccgcggaccg atcatcacct acatcacgaa ttacaccgat 420
ggccagcctc aaggagctgt ctggaccaag attgatcacg aaggctacga tcctgtgaca 480
gaccggttcg ccgtcgacaa cttgatcgcc aacaggggat ggaaagcaat caagcttccc 540
atgctcgccg acgggaagta catcctgcga caggagatca tcgcactcca cagcgcacac 600
aaccaaggcg gggcccagct gtatccgaac tgcattcaga tcaaggtcgt tggtggcaag 660
ggaagcgcgg tgcccaacca gaactttgat ctcaacaagg ggtacacatc cgatcacccg 720
ggacttcggt tcaacctgtg gcaaccattc aacaattaca ccattcccgg tcctgaggtc 780
tggaagggag ttgtggttgc gagcaatggt acaacgaaca gcaccacaaa tctcaccaac 840
aacaccggca ccggttttgc gaacagcact atggccactg gtgaaacaag gaccgagagg 900
agttttatga cacttaccgc atcacattca gacactggcg tccccgccaa atctcatact 960
gtggctgtaa gctggacaac atccgccgcc gttgttgggt ctccgattag cgttaccaca 1020
actttcagtt cctttaccac aacaccggtt ccgacgaact ctaccggtgc ttatctctac 1080
cggtacaagt ga 1092
&lt;210&gt; 150
&lt;211&gt; 339
&lt;212&gt; PRT
&lt;213&gt; 特异腐质霉(Humicola insolens)
&lt;400&gt; 150
Met Ala His Pro Trp Ala Arg Cys Val Tyr Thr Ala Ile Trp Leu Ala
1 5 10 15
Ala Ser Ala Ser Gly His Ser Arg Val Trp Ser Val Ser Val Asn Gly
20 25 30
Arg Tyr Gln Gly Pro Gly Val Asp Asp Tyr Leu Arg Ala Pro Pro Ser
35 40 45
Asp Ser Pro Val Val Asp Leu Asp Ser Pro Thr Leu Asn Cys Asn Val
50 55 60
Asn Gly Asn Lys Pro Val Pro Gly Phe Val Glu Val Ser Ala Gly Asp
65 70 75 80
Ser Leu Glu Trp Lys Trp Tyr Tyr Ile Asn Pro Tyr Asn Pro Ser Asp
85 90 95
Met Ile Ile Ala Ala Glu His Arg Gly Pro Ile Ile Thr Tyr Ile Thr
100 105 110
Asn Tyr Thr Asp Gly Gln Pro Gln Gly Ala Val Trp Thr Lys Ile Asp
115 120 125
His Glu Gly Tyr Asp Pro Val Thr Asp Arg Phe Ala Val Asp Asn Leu
130 135 140
Ile Ala Asn Arg Gly Trp Lys Ala Ile Lys Leu Pro Met Leu Ala Asp
145 150 155 160
Gly Lys Tyr Ile Leu Arg Gln Glu Ile Ile Ala Leu His Ser Ala His
165 170 175
Asn Gln Gly Gly Ala Gln Leu Tyr Pro Asn Cys Ile Gln Ile Lys Val
180 185 190
Val Gly Gly Lys Gly Ser Ala Val Pro Asn Gln Asn Phe Asp Leu Asn
195 200 205
Lys Gly Tyr Thr Ser Asp His Pro Gly Leu Arg Phe Asn Leu Trp Gln
210 215 220
Pro Phe Asn Asn Tyr Thr Ile Pro Gly Pro Glu Val Trp Lys Gly Val
225 230 235 240
Val Val Ala Ser Asn Gly Thr Thr Asn Ser Thr Thr Asn Leu Thr Asn
245 250 255
Asn Thr Gly Thr Gly Phe Ala Asn Ser Thr Met Ala Thr Gly Glu Thr
260 265 270
Arg Thr Glu Arg Ser Phe Met Thr Leu Thr Ala Ser His Ser Asp Thr
275 280 285
Gly Val Pro Ala Lys Ser His Thr Val Ala Val Ser Trp Thr Thr Ser
290 295 300
Ala Ala Val Val Gly Ser Pro Ile Ser Val Thr Thr Thr Phe Ser Ser
305 310 315 320
Phe Thr Thr Thr Pro Val Pro Thr Asn Ser Thr Gly Ala Tyr Leu Tyr
325 330 335
Arg Tyr Lys
&lt;210&gt; 151
&lt;211&gt; 1089
&lt;212&gt; DNA
&lt;213&gt; 里氏木霉(Trichoderma reesei)
&lt;400&gt; 151
atgatccaga agctttccaa cctccttgtc accgcactgg cggtggctac tggcgttgtc 60
ggacatggac atattaatga cattgtcatc aacggggtgt ggtatcaggc ctatgatcct 120
acaacgtttc catacgagtc aaaccccccc atagtagtgg gctggacggc tgccgacctt 180
gacaacggta cgtgatcctc atctctatct gtacaacgct catgctaatc caactcaata 240
ggcttcgttt cacccgacgc ataccaaaac cctgacatca tctgccacaa gaatgctacg 300
aatgccaagg ggcacgcgtc tgtcaaggcc ggagacacta ttctcttcca gtgggtgcca 360
gttccatggc cgcaccctgg tcccattgtc gactacctgg ccaactgcaa tggtgactgc 420
gagaccgttg acaagacgac gcttgagttc ttcaagatcg atggcgttgg tctcctcagc 480
ggcggggatc cgggcacctg ggcctcagac gtgctgatct ccaacaacaa cacctgggtc 540
gtcaagatcc ccgacaatct tgcgccaggc aattacgtgc tccgccacga gatcatcgcg 600
ttacacagcg ccgggcaggc aaacggcgct cagaactacc cccagtgctt caacattgcc 660
gtctcaggct cgggttctct gcagcccagc ggcgttctag ggaccgacct ctatcacgcg 720
acggaccctg gtgttctcat caacatctac accagcccgc tcaactacat catccctgga 780
cctaccgtgg tatcaggcct gccaacgagt gttgcccagg ggagctccgc cgcgacggcc 840
accgccagcg ccactgttcc tggaggcggt agcggcccga ccagcagaac cacgacaacg 900
gcgaggacga cgcaggcctc aagcaggccc agctctacgc ctcccgcaac cacgtcggca 960
cctgctggcg gcccaaccca gactctgtac ggccagtgtg gtggcagcgg ttacagcggg 1020
cctactcgat gcgcgccgcc agccacttgc tctaccttga acccctacta cgcccagtgc 1080
cttaactag 1089
&lt;210&gt; 152
&lt;211&gt; 344
&lt;212&gt; PRT
&lt;213&gt; 里氏木霉(Trichoderma reesei)
&lt;400&gt; 152
Met Ile Gln Lys Leu Ser Asn Leu Leu Val Thr Ala Leu Ala Val Ala
1 5 10 15
Thr Gly Val Val Gly His Gly His Ile Asn Asp Ile Val Ile Asn Gly
20 25 30
Val Trp Tyr Gln Ala Tyr Asp Pro Thr Thr Phe Pro Tyr Glu Ser Asn
35 40 45
Pro Pro Ile Val Val Gly Trp Thr Ala Ala Asp Leu Asp Asn Gly Phe
50 55 60
Val Ser Pro Asp Ala Tyr Gln Asn Pro Asp Ile Ile Cys His Lys Asn
65 70 75 80
Ala Thr Asn Ala Lys Gly His Ala Ser Val Lys Ala Gly Asp Thr Ile
85 90 95
Leu Phe Gln Trp Val Pro Val Pro Trp Pro His Pro Gly Pro Ile Val
100 105 110
Asp Tyr Leu Ala Asn Cys Asn Gly Asp Cys Glu Thr Val Asp Lys Thr
115 120 125
Thr Leu Glu Phe Phe Lys Ile Asp Gly Val Gly Leu Leu Ser Gly Gly
130 135 140
Asp Pro Gly Thr Trp Ala Ser Asp Val Leu Ile Ser Asn Asn Asn Thr
145 150 155 160
Trp Val Val Lys Ile Pro Asp Asn Leu Ala Pro Gly Asn Tyr Val Leu
165 170 175
Arg His Glu Ile Ile Ala Leu His Ser Ala Gly Gln Ala Asn Gly Ala
180 185 190
Gln Asn Tyr Pro Gln Cys Phe Asn Ile Ala Val Ser Gly Ser Gly Ser
195 200 205
Leu Gln Pro Ser Gly Val Leu Gly Thr Asp Leu Tyr His Ala Thr Asp
210 215 220
Pro Gly Val Leu Ile Asn Ile Tyr Thr Ser Pro Leu Asn Tyr Ile Ile
225 230 235 240
Pro Gly Pro Thr Val Val Ser Gly Leu Pro Thr Ser Val Ala Gln Gly
245 250 255
Ser Ser Ala Ala Thr Ala Thr Ala Ser Ala Thr Val Pro Gly Gly Gly
260 265 270
Ser Gly Pro Thr Ser Arg Thr Thr Thr Thr Ala Arg Thr Thr Gln Ala
275 280 285
Ser Ser Arg Pro Ser Ser Thr Pro Pro Ala Thr Thr Ser Ala Pro Ala
290 295 300
Gly Gly Pro Thr Gln Thr Leu Tyr Gly Gln Cys Gly Gly Ser Gly Tyr
305 310 315 320
Ser Gly Pro Thr Arg Cys Ala Pro Pro Ala Thr Cys Ser Thr Leu Asn
325 330 335
Pro Tyr Tyr Ala Gln Cys Leu Asn
340
&lt;210&gt; 153
&lt;211&gt; 1398
&lt;212&gt; DNA
&lt;213&gt; 埃默森青霉(Penicillium emersonii)
&lt;400&gt; 153
atgtttggat tcaagtctac taccttggct gtttggatgc tcagtcttcc ggcaacatcg 60
catgcccaca ctgtcatgac cacactgttt gtcgatggcg tcaaccaggg agacggtgtc 120
tgtatccgta tgaacaagaa cggctctacg tccaatttct tcgtcagtcc tgtcagtagc 180
agggacgttg cttgtggtag ggaaaaagag caccaatccc tacatgtact ctacttttgt 240
tttcaaaaca taagaactga caagcaaaaa ggaatcgatg gagaaatcgg tgtcgcaaga 300
gtctgtccgg ccaaggcctc gtcgatcctg accttcgagt tccgcgaaca tcccgacaac 360
gtgagctctg cacctctcga tccctcacac aagggtcccg cgtcggtgta cttgaagaag 420
gtcgattccg ccatcgccag caacaacgcc gcaggagacg ggtggttcaa gatctgggaa 480
tccgtctacg acgagacgtc agacaaatgg ggcacgacga agatgatcga gaacgatgga 540
cacatctccg ttcagatccc ggaggagatt gagggagggt actatctcgc gcgaacggag 600
cttctggcgc ttcacgcggc gagctcgaat ccgcccaatc cgcagttctt tgtcggctgc 660
gcgcagctct tcatcgagtc gaatgggacc gcaaagccgt cgactgttcg catcggtgag 720
ggtacctata acctgtccat gccgggactg acctacaata tctgggaaaa gccgctgtcc 780
ctgccgtatg cgatggttgg tccgacggtt tacagagctg gctcgggggc tagctcatca 840
gcagtcgctc ccacggcagc gagtgctact gctgctgcta ccgttacgca ggcggtagct 900
ccattaccaa ctaccagtgc tccaagttca caacaaaatg tcggctcatg cggagttgtt 960
gttgcggacg agatagaaaa gcgagacact ctcgttcaga cggaaggact caagccagaa 1020
ggctgcatct ttgtcaatgg taactggtgc ggtttcgaag tgccttcgta cacggaccaa 1080
gacagctgct gggccgtaag tctcttgctt tcaccttact actttttttt ttctttcgaa 1140
agaaaaatga aaaatgtgac caagctgaca acctgtctcc atataatata gtcatcgaac 1200
aactgctggg cccaatccga cgactgctgg aacaagacac aaccgacggg atacaacctc 1260
tgtccgatct ggcaggccaa atgccgagag atctccaacg ggtgcgagaa agggacttgg 1320
acggggcctc ctcatcaggg agaggacatg actccgtcgt ggccgtcgtt gaggggggaa 1380
ttgaagatct ttacctga 1398
&lt;210&gt; 154
&lt;211&gt; 408
&lt;212&gt; PRT
&lt;213&gt; 埃默森青霉(Penicillium emersonii)
&lt;400&gt; 154
Met Phe Gly Phe Lys Ser Thr Thr Leu Ala Val Trp Met Leu Ser Leu
1 5 10 15
Pro Ala Thr Ser His Ala His Thr Val Met Thr Thr Leu Phe Val Asp
20 25 30
Gly Val Asn Gln Gly Asp Gly Val Cys Ile Arg Met Asn Lys Asn Gly
35 40 45
Ser Thr Ser Asn Phe Phe Val Ser Pro Val Ser Ser Arg Asp Val Ala
50 55 60
Cys Gly Ile Asp Gly Glu Ile Gly Val Ala Arg Val Cys Pro Ala Lys
65 70 75 80
Ala Ser Ser Ile Leu Thr Phe Glu Phe Arg Glu His Pro Asp Asn Val
85 90 95
Ser Ser Ala Pro Leu Asp Pro Ser His Lys Gly Pro Ala Ser Val Tyr
100 105 110
Leu Lys Lys Val Asp Ser Ala Ile Ala Ser Asn Asn Ala Ala Gly Asp
115 120 125
Gly Trp Phe Lys Ile Trp Glu Ser Val Tyr Asp Glu Thr Ser Asp Lys
130 135 140
Trp Gly Thr Thr Lys Met Ile Glu Asn Asp Gly His Ile Ser Val Gln
145 150 155 160
Ile Pro Glu Glu Ile Glu Gly Gly Tyr Tyr Leu Ala Arg Thr Glu Leu
165 170 175
Leu Ala Leu His Ala Ala Ser Ser Asn Pro Pro Asn Pro Gln Phe Phe
180 185 190
Val Gly Cys Ala Gln Leu Phe Ile Glu Ser Asn Gly Thr Ala Lys Pro
195 200 205
Ser Thr Val Arg Ile Gly Glu Gly Thr Tyr Asn Leu Ser Met Pro Gly
210 215 220
Leu Thr Tyr Asn Ile Trp Glu Lys Pro Leu Ser Leu Pro Tyr Ala Met
225 230 235 240
Val Gly Pro Thr Val Tyr Arg Ala Gly Ser Gly Ala Ser Ser Ser Ala
245 250 255
Val Ala Pro Thr Ala Ala Ser Ala Thr Ala Ala Ala Thr Val Thr Gln
260 265 270
Ala Val Ala Pro Leu Pro Thr Thr Ser Ala Pro Ser Ser Gln Gln Asn
275 280 285
Val Gly Ser Cys Gly Val Val Val Ala Asp Glu Ile Glu Lys Arg Asp
290 295 300
Thr Leu Val Gln Thr Glu Gly Leu Lys Pro Glu Gly Cys Ile Phe Val
305 310 315 320
Asn Gly Asn Trp Cys Gly Phe Glu Val Pro Ser Tyr Thr Asp Gln Asp
325 330 335
Ser Cys Trp Ala Ser Ser Asn Asn Cys Trp Ala Gln Ser Asp Asp Cys
340 345 350
Trp Asn Lys Thr Gln Pro Thr Gly Tyr Asn Leu Cys Pro Ile Trp Gln
355 360 365
Ala Lys Cys Arg Glu Ile Ser Asn Gly Cys Glu Lys Gly Thr Trp Thr
370 375 380
Gly Pro Pro His Gln Gly Glu Asp Met Thr Pro Ser Trp Pro Ser Leu
385 390 395 400
Arg Gly Glu Leu Lys Ile Phe Thr
405
&lt;210&gt; 155
&lt;211&gt; 902
&lt;212&gt; DNA
&lt;213&gt; 樟绒枝霉(Malbranchea cinnamomea)
&lt;400&gt; 155
atgagaattg aaaagcttct aaacgctgcg ctcctcgctg gagcagtatc tgctcacacc 60
atcatgacca gcttggttgt tgatggaacc gaatatcgta tgttcaatct caccttgagc 120
tttcttttca cactagtttg ttgagaatct ggccattttc agctcctgga catgctgtcc 180
gcatcccaag ttacaacggg gtatgcatgt ggatgggctc tgtttcctat taagagcccc 240
atgagctgat cgccttgaca tagcccatta ccgatgtcac ctccaacagc gtggcttgca 300
atggtccccc taatcccact acccctagct ccgagatcat catggtccgg gctggatcga 360
ctatccaggg gaaatggaga cataccgaga ccgacgtgat tgacccaagc cacaaggtat 420
gactataccg ccacgagaga tatccttgac tcacttacac cctctttcta acctctctat 480
attagggccc cgtaatggcg tacctgaaga aagtcgacga cgccatcaac gaccctggaa 540
cgggtgacgg ctggttcaag atttgggaag acggcctgca cgacgatggc acctgggccg 600
tcgacgacct catcgccgcc aacggttacc aggacattcc catcccccca tgtctcgcgg 660
acggccagta cttgctgcgg gctgagatca ttgctctgca tggtgctagc cagccgggtg 720
gtgcgcaact gtatatggaa tgcgcccaga tcggagttgt gggtggctct ggaacagcta 780
acccgtccac agttgcgttc cccggcgcct acaaggccga tgatcctggc atcactgtca 840
acatttattg gccgcctctt gaggaataca tcattcctgg tcctgaccca ttcacctgct 900
aa 902
&lt;210&gt; 156
&lt;211&gt; 234
&lt;212&gt; PRT
&lt;213&gt; 樟绒枝霉(Malbranchea cinnamomea)
&lt;400&gt; 156
Met Arg Ile Glu Lys Leu Leu Asn Ala Ala Leu Leu Ala Gly Ala Val
1 5 10 15
Ser Ala His Thr Ile Met Thr Ser Leu Val Val Asp Gly Thr Glu Tyr
20 25 30
Pro Pro Gly His Ala Val Arg Ile Pro Ser Tyr Asn Gly Pro Ile Thr
35 40 45
Asp Val Thr Ser Asn Ser Val Ala Cys Asn Gly Pro Pro Asn Pro Thr
50 55 60
Thr Pro Ser Ser Glu Ile Ile Met Val Arg Ala Gly Ser Thr Ile Gln
65 70 75 80
Gly Lys Trp Arg His Thr Glu Thr Asp Val Ile Asp Pro Ser His Lys
85 90 95
Gly Pro Val Met Ala Tyr Leu Lys Lys Val Asp Asp Ala Ile Asn Asp
100 105 110
Pro Gly Thr Gly Asp Gly Trp Phe Lys Ile Trp Glu Asp Gly Leu His
115 120 125
Asp Asp Gly Thr Trp Ala Val Asp Asp Leu Ile Ala Ala Asn Gly Tyr
130 135 140
Gln Asp Ile Pro Ile Pro Pro Cys Leu Ala Asp Gly Gln Tyr Leu Leu
145 150 155 160
Arg Ala Glu Ile Ile Ala Leu His Gly Ala Ser Gln Pro Gly Gly Ala
165 170 175
Gln Leu Tyr Met Glu Cys Ala Gln Ile Gly Val Val Gly Gly Ser Gly
180 185 190
Thr Ala Asn Pro Ser Thr Val Ala Phe Pro Gly Ala Tyr Lys Ala Asp
195 200 205
Asp Pro Gly Ile Thr Val Asn Ile Tyr Trp Pro Pro Leu Glu Glu Tyr
210 215 220
Ile Ile Pro Gly Pro Asp Pro Phe Thr Cys
225 230
&lt;210&gt; 157
&lt;211&gt; 810
&lt;212&gt; DNA
&lt;213&gt; 樟绒枝霉(Malbranchea cinnamomea)
&lt;400&gt; 157
atgcttccga acgcagctgg tctgcttgta gcaggtgtcg tctctctttc tggagtagcc 60
gcacatggac atgtctcgaa aattttcctg gacggccagg agtaagccaa ttgtgcgtca 120
tttttttagt atccgttggt taatcattga tttgtattcc tcagatacgg tggttggatc 180
gccgatgtct atccgtacat gcccgaaccc ccagagacaa ttggctggcc tacaaatgtg 240
accgacaatg gcttcgtgtc ccccgacagg ttcagctctc cagaaatcat ctgtcaccgc 300
gggggcgttc caagcgccat ctcggcgccc gtttccgcgg gcgggaccgt cgagttggaa 360
tggagcacgt ggcccgagag ccatcatggt cctgtgctca actaccttgc caaggtcgac 420
ggcgacttca gcgacatcgg ccccagcacg ctccagttct tcaagtttga cgagaccggc 480
cttgtatccg gctcaaaccc agggtactgg ggtacggatg tgatgctcgc gaatggccgg 540
cggtactcca tgatgatccc aagcaccatc gctcccggga agtacgtctt gcgccatgag 600
ctcgtcgccc tgcagaacgt cggcgccgcc cagctgtacc cgcagtgtat caacattgaa 660
gtgacaagta ataccactgg aggagacgtc aaccccggcg gtacgcctgc taccgagctc 720
tactctcctg cggaccccgg tttcttgttc aacatctacg aacagtatga ttcgtaccca 780
attcccggtc cggatgtttt ccgcgattaa 810
&lt;210&gt; 158
&lt;211&gt; 248
&lt;212&gt; PRT
&lt;213&gt; 樟绒枝霉(Malbranchea cinnamomea)
&lt;400&gt; 158
Met Leu Pro Asn Ala Ala Gly Leu Leu Val Ala Gly Val Val Ser Leu
1 5 10 15
Ser Gly Val Ala Ala His Gly His Val Ser Lys Ile Phe Leu Asp Gly
20 25 30
Gln Glu Tyr Gly Gly Trp Ile Ala Asp Val Tyr Pro Tyr Met Pro Glu
35 40 45
Pro Pro Glu Thr Ile Gly Trp Pro Thr Asn Val Thr Asp Asn Gly Phe
50 55 60
Val Ser Pro Asp Arg Phe Ser Ser Pro Glu Ile Ile Cys His Arg Gly
65 70 75 80
Gly Val Pro Ser Ala Ile Ser Ala Pro Val Ser Ala Gly Gly Thr Val
85 90 95
Glu Leu Glu Trp Ser Thr Trp Pro Glu Ser His His Gly Pro Val Leu
100 105 110
Asn Tyr Leu Ala Lys Val Asp Gly Asp Phe Ser Asp Ile Gly Pro Ser
115 120 125
Thr Leu Gln Phe Phe Lys Phe Asp Glu Thr Gly Leu Val Ser Gly Ser
130 135 140
Asn Pro Gly Tyr Trp Gly Thr Asp Val Met Leu Ala Asn Gly Arg Arg
145 150 155 160
Tyr Ser Met Met Ile Pro Ser Thr Ile Ala Pro Gly Lys Tyr Val Leu
165 170 175
Arg His Glu Leu Val Ala Leu Gln Asn Val Gly Ala Ala Gln Leu Tyr
180 185 190
Pro Gln Cys Ile Asn Ile Glu Val Thr Ser Asn Thr Thr Gly Gly Asp
195 200 205
Val Asn Pro Gly Gly Thr Pro Ala Thr Glu Leu Tyr Ser Pro Ala Asp
210 215 220
Pro Gly Phe Leu Phe Asn Ile Tyr Glu Gln Tyr Asp Ser Tyr Pro Ile
225 230 235 240
Pro Gly Pro Asp Val Phe Arg Asp
245
&lt;210&gt; 159
&lt;211&gt; 729
&lt;212&gt; DNA
&lt;213&gt; 樟绒枝霉(Malbranchea cinnamomea)
&lt;400&gt; 159
atggttcagt ttaagctgag cacggcctct cttctggctc ttgcctccta cgccgccgcc 60
cacggctacg tgagctcgat ccaagccgac ggacagacct atcccggcgc tgatccacac 120
aaccccaacc cagagtcccc cggctggcag gcggagaaca ccgatctggg cttcgtcgag 180
ccctccgcct tctcgacccc cgccatcgcc tgccacaaga acgcgcgggc tccgcccgcc 240
cacgcgaccg tccaggccgg gagcaccatc aagctgacgt ggaacacctg gccggagtcg 300
caccacggac ccgtgctcga ctacatcgcg ccgtgcaacg gcgactgctc tagcgcgtcg 360
gcgggctcgc tgaacttcgt caagatcgcc gagaagggcc tgatctccgg ctccaaccca 420
ggcttctggg ccgccgacga gctgatccag aacggcaact cgtgggaggt caccatcccc 480
gcgaacctgg cgccgggcaa gtacgtgctg cgccacgaga tcatcgcgct gcactcggcc 540
ggcaacccca acggcgccca ggcctacccg cagtgcatca acctcgaggt cactggcggc 600
ggctccgcga ctccctctgg ccagccggcg acttcgttct actcccccaa cgaccccggc 660
atcctgttca acctgtacca gtcgttcgac tcctacccga tccccggccc cgccgtgtgg 720
agcggttaa 729
&lt;210&gt; 160
&lt;211&gt; 242
&lt;212&gt; PRT
&lt;213&gt; 樟绒枝霉(Malbranchea cinnamomea)
&lt;400&gt; 160
Met Val Gln Phe Lys Leu Ser Thr Ala Ser Leu Leu Ala Leu Ala Ser
1 5 10 15
Tyr Ala Ala Ala His Gly Tyr Val Ser Ser Ile Gln Ala Asp Gly Gln
20 25 30
Thr Tyr Pro Gly Ala Asp Pro His Asn Pro Asn Pro Glu Ser Pro Gly
35 40 45
Trp Gln Ala Glu Asn Thr Asp Leu Gly Phe Val Glu Pro Ser Ala Phe
50 55 60
Ser Thr Pro Ala Ile Ala Cys His Lys Asn Ala Arg Ala Pro Pro Ala
65 70 75 80
His Ala Thr Val Gln Ala Gly Ser Thr Ile Lys Leu Thr Trp Asn Thr
85 90 95
Trp Pro Glu Ser His His Gly Pro Val Leu Asp Tyr Ile Ala Pro Cys
100 105 110
Asn Gly Asp Cys Ser Ser Ala Ser Ala Gly Ser Leu Asn Phe Val Lys
115 120 125
Ile Ala Glu Lys Gly Leu Ile Ser Gly Ser Asn Pro Gly Phe Trp Ala
130 135 140
Ala Asp Glu Leu Ile Gln Asn Gly Asn Ser Trp Glu Val Thr Ile Pro
145 150 155 160
Ala Asn Leu Ala Pro Gly Lys Tyr Val Leu Arg His Glu Ile Ile Ala
165 170 175
Leu His Ser Ala Gly Asn Pro Asn Gly Ala Gln Ala Tyr Pro Gln Cys
180 185 190
Ile Asn Leu Glu Val Thr Gly Gly Gly Ser Ala Thr Pro Ser Gly Gln
195 200 205
Pro Ala Thr Ser Phe Tyr Ser Pro Asn Asp Pro Gly Ile Leu Phe Asn
210 215 220
Leu Tyr Gln Ser Phe Asp Ser Tyr Pro Ile Pro Gly Pro Ala Val Trp
225 230 235 240
Ser Gly
&lt;210&gt; 161
&lt;211&gt; 1081
&lt;212&gt; DNA
&lt;213&gt; 樟绒枝霉(Malbranchea cinnamomea)
&lt;400&gt; 161
atgtcaccct ccttcaagtc cactgccatc ctcggagccg ttgctctggc cgcccgcgtg 60
cgcgcccacg gctacgtgtc tggaatcgtc gttgacggtg cttagtacgt ctgcatgttc 120
ctctcttcgt tacaggtaac atctttcttg gtattgctcg tgctgaccct tttctttcag 180
ccatggcggt tacatcgtcg acaagtaccc ctacatgccc aacccgcccg atgtggtcgg 240
ctggtcgact acggccacgg acctgggctt cgtcgcccct gacgcctttg gcgacccgga 300
catcatctgc caccgggacg gtgcccccgg tgccatccac gccaaagtca acgccggtgc 360
caccatcgag ctgcagtgga acacctggcc cgagagccac cacggtcccg tcatcgacta 420
cctggctaac tgcaacggtg actgctcgtc cgtcgacaag acctcgctca agttcttcaa 480
gatcagcgag gccggcctaa acgacggctc caacgccccc ggccagtggg cgtccgacga 540
tctcattgcc aacaacaaca gctggactgt gaccatcccc aagtcgatcg ccccgggcaa 600
ctacgtgctg cgccacgaga tcatcgccct gcacagcgcc ggcaaccaga atggcgcgca 660
gaactacccc cagtgcttca acctcgagat caccagcaac ggcagcgaca acccggaggg 720
cgtgctggga accgagctgt acaaggccga cgacccgggc attctgttca acatctacca 780
gcccatggac tcgtacccga ttcccggccc tgctctctac accggcggct cttctccctc 840
ccctaatccg cccacctcta cccagtcgcc tgtgccccag cccacccagt ctcccccatc 900
gggcagcaac cccggcaacg gcaacggcga cgacgacaac gacaacggca acgagacccc 960
atccccgtct ctccccgtcg agatccctga cgacctgacc tcgcgcgagc tactcctcgt 1020
ggcccaggag atcattgccc gtctgcttga gctgcagaat cagctggtcg tctcgaacta 1080
a 1081
&lt;210&gt; 162
&lt;211&gt; 334
&lt;212&gt; PRT
&lt;213&gt; 樟绒枝霉(Malbranchea cinnamomea)
&lt;400&gt; 162
Met Ser Pro Ser Phe Lys Ser Thr Ala Ile Leu Gly Ala Val Ala Leu
1 5 10 15
Ala Ala Arg Val Arg Ala His Gly Tyr Val Ser Gly Ile Val Val Asp
20 25 30
Gly Ala Tyr His Gly Gly Tyr Ile Val Asp Lys Tyr Pro Tyr Met Pro
35 40 45
Asn Pro Pro Asp Val Val Gly Trp Ser Thr Thr Ala Thr Asp Leu Gly
50 55 60
Phe Val Ala Pro Asp Ala Phe Gly Asp Pro Asp Ile Ile Cys His Arg
65 70 75 80
Asp Gly Ala Pro Gly Ala Ile His Ala Lys Val Asn Ala Gly Ala Thr
85 90 95
Ile Glu Leu Gln Trp Asn Thr Trp Pro Glu Ser His His Gly Pro Val
100 105 110
Ile Asp Tyr Leu Ala Asn Cys Asn Gly Asp Cys Ser Ser Val Asp Lys
115 120 125
Thr Ser Leu Lys Phe Phe Lys Ile Ser Glu Ala Gly Leu Asn Asp Gly
130 135 140
Ser Asn Ala Pro Gly Gln Trp Ala Ser Asp Asp Leu Ile Ala Asn Asn
145 150 155 160
Asn Ser Trp Thr Val Thr Ile Pro Lys Ser Ile Ala Pro Gly Asn Tyr
165 170 175
Val Leu Arg His Glu Ile Ile Ala Leu His Ser Ala Gly Asn Gln Asn
180 185 190
Gly Ala Gln Asn Tyr Pro Gln Cys Phe Asn Leu Glu Ile Thr Ser Asn
195 200 205
Gly Ser Asp Asn Pro Glu Gly Val Leu Gly Thr Glu Leu Tyr Lys Ala
210 215 220
Asp Asp Pro Gly Ile Leu Phe Asn Ile Tyr Gln Pro Met Asp Ser Tyr
225 230 235 240
Pro Ile Pro Gly Pro Ala Leu Tyr Thr Gly Gly Ser Ser Pro Ser Pro
245 250 255
Asn Pro Pro Thr Ser Thr Gln Ser Pro Val Pro Gln Pro Thr Gln Ser
260 265 270
Pro Pro Ser Gly Ser Asn Pro Gly Asn Gly Asn Gly Asp Asp Asp Asn
275 280 285
Asp Asn Gly Asn Glu Thr Pro Ser Pro Ser Leu Pro Val Glu Ile Pro
290 295 300
Asp Asp Leu Thr Ser Arg Glu Leu Leu Leu Val Ala Gln Glu Ile Ile
305 310 315 320
Ala Arg Leu Leu Glu Leu Gln Asn Gln Leu Val Val Ser Asn
325 330
&lt;210&gt; 163
&lt;211&gt; 875
&lt;212&gt; DNA
&lt;213&gt; 樟绒枝霉(Malbranchea cinnamomea)
&lt;400&gt; 163
atgaagacgc tctctgcggg tctccttgcg cttgccagcg ctgccagcgc tcactgtccg 60
tccagccttc ccttgctctc tcctgacatt cgcgccagca tttccatcag gtccaataaa 120
actaacacac gagccatggg acgacggtca tagacacctt cccctccctg atcgccaacg 180
gcgtcgtcac cggcgaatgg gagtatgtcc ggcagacgga gaaccattac tcaaacgccc 240
ccgtcaccga cgtctccagc gaggccatcc gctgctacga gaatcccggg cggcccgccg 300
caaagaccct gagcgttgcc gccggctcga ccgtgggctt caccgtctcc cccagcatct 360
accacccggg cccactgcag ttctacatgg ccagggtgcc cgacggccag accgcggact 420
cgtgggacgg cagcgggcag gtgtggttca agatcttcga gcagggaccg cagatcgatc 480
cgtcgggatt gacgtggccg agtgacggtg cgacgagaaa accccctttt tttttttttt 540
tttttttttt tccctctcgc catctgctaa ctgcgagtga actggctcta ggactctccc 600
aggtccaagt caccatcccc agctccctcc cgtcgggcga ctacctgctg cgcgtcgagc 660
agattggcct gcactccgcg tcgtccgtca acggcgccca gttctacctc tcctgcgcac 720
agctcaccgt caccggcggc ggaaacggga acccaggccc gctcgtctcg ttcccgggcg 780
cgtacagccc cacggacccg ggtctgctga tcaacatcta ctggccgatt ccgaccagct 840
acgagctgcc cgggccaccg gtgtggcgcg gttag 875
&lt;210&gt; 164
&lt;211&gt; 230
&lt;212&gt; PRT
&lt;213&gt; 樟绒枝霉(Malbranchea cinnamomea)
&lt;400&gt; 164
Met Lys Thr Leu Ser Ala Gly Leu Leu Ala Leu Ala Ser Ala Ala Ser
1 5 10 15
Ala His Tyr Thr Phe Pro Ser Leu Ile Ala Asn Gly Val Val Thr Gly
20 25 30
Glu Trp Glu Tyr Val Arg Gln Thr Glu Asn His Tyr Ser Asn Ala Pro
35 40 45
Val Thr Asp Val Ser Ser Glu Ala Ile Arg Cys Tyr Glu Asn Pro Gly
50 55 60
Arg Pro Ala Ala Lys Thr Leu Ser Val Ala Ala Gly Ser Thr Val Gly
65 70 75 80
Phe Thr Val Ser Pro Ser Ile Tyr His Pro Gly Pro Leu Gln Phe Tyr
85 90 95
Met Ala Arg Val Pro Asp Gly Gln Thr Ala Asp Ser Trp Asp Gly Ser
100 105 110
Gly Gln Val Trp Phe Lys Ile Phe Glu Gln Gly Pro Gln Ile Asp Pro
115 120 125
Ser Gly Leu Thr Trp Pro Ser Asp Gly Leu Ser Gln Val Gln Val Thr
130 135 140
Ile Pro Ser Ser Leu Pro Ser Gly Asp Tyr Leu Leu Arg Val Glu Gln
145 150 155 160
Ile Gly Leu His Ser Ala Ser Ser Val Asn Gly Ala Gln Phe Tyr Leu
165 170 175
Ser Cys Ala Gln Leu Thr Val Thr Gly Gly Gly Asn Gly Asn Pro Gly
180 185 190
Pro Leu Val Ser Phe Pro Gly Ala Tyr Ser Pro Thr Asp Pro Gly Leu
195 200 205
Leu Ile Asn Ile Tyr Trp Pro Ile Pro Thr Ser Tyr Glu Leu Pro Gly
210 215 220
Pro Pro Val Trp Arg Gly
225 230
&lt;210&gt; 165
&lt;211&gt; 1194
&lt;212&gt; DNA
&lt;213&gt; 樟绒枝霉(Malbranchea cinnamomea)
&lt;400&gt; 165
atgcggttct cagccgtggc cgcggttggc tttctgatgg gcaccgccag cgcacacatg 60
aagatgaaga ctccatatcc atttggcccc gacacgctca acaccagccc cctccaggca 120
aacctgaccg acttcccctg caagcacaga cccggcgtct acgacccacc gctactccca 180
caccccgacg cgaatacctt caccgtcggc gtccccgtca ccctcagctt catcggcagc 240
gccgtccacg gcggcggctc gtgtcagatc agcctgacca cggaccgaca gccgaccagg 300
gactcggtct ggaaggtcat ccactccatc gagggcggct gtcccgccaa caccgacggc 360
aacctgggag gcggcgcgga cgccgaggtc gccagcacct tcgagttcca gattcccccc 420
agcattccgc ccggcgagta cacgctggcg tggacctggc tcaaccgcct cggcaaccgc 480
gagttctaca tgaactgcgc cccgatcacc gtcgtcgcgc ccaagaagcg atacgccccg 540
tcgtcgtcgt cgtcggaccc gcggcccctt gcgtccctcg cccagcgcca ggacctcccg 600
gacatgttca tcgcgaacat caacggctgc acgaccgagg agggcatcga cgtgcgcttc 660
cccgaccccg gcccctccgt cgaacgcgca gggaacccca gcaggctcct ggcgagcggc 720
gaggtgatct gcaagatgcg cggcagcgac acgggaccca tcgcgggggg tggcagcggc 780
ggcggagacg gaggcaacga ctcggaggcc agcccagctc ccagtcaaga tcctcacccc 840
agttcaaacc caagccccga cccgaatcca gacccggacc cgcagtgcct gccgccagcg 900
ccatcaacat caaccgcgtc gaccccgacg tctccgtcgg cgacaccacc cgcctccccg 960
tcctccaccg gcgacagcgg cgacggtggc ccggggctca ccggctcctg caccgagggc 1020
tggttcaact gcatcggcgg cacgcacttc cagcagtgca cggccagcgg gcagtggagc 1080
gtcgcgcggc ccgtggcccc gggcacggtc tgccgcgaag gagtggggcc tgatctgcag 1140
atcggttatg ccaaggggga cgacgttaga ggcgtccgtc gggcgcaccg ctga 1194
&lt;210&gt; 166
&lt;211&gt; 397
&lt;212&gt; PRT
&lt;213&gt; 樟绒枝霉(Malbranchea cinnamomea)
&lt;400&gt; 166
Met Arg Phe Ser Ala Val Ala Ala Val Gly Phe Leu Met Gly Thr Ala
1 5 10 15
Ser Ala His Met Lys Met Lys Thr Pro Tyr Pro Phe Gly Pro Asp Thr
20 25 30
Leu Asn Thr Ser Pro Leu Gln Ala Asn Leu Thr Asp Phe Pro Cys Lys
35 40 45
His Arg Pro Gly Val Tyr Asp Pro Pro Leu Leu Pro His Pro Asp Ala
50 55 60
Asn Thr Phe Thr Val Gly Val Pro Val Thr Leu Ser Phe Ile Gly Ser
65 70 75 80
Ala Val His Gly Gly Gly Ser Cys Gln Ile Ser Leu Thr Thr Asp Arg
85 90 95
Gln Pro Thr Arg Asp Ser Val Trp Lys Val Ile His Ser Ile Glu Gly
100 105 110
Gly Cys Pro Ala Asn Thr Asp Gly Asn Leu Gly Gly Gly Ala Asp Ala
115 120 125
Glu Val Ala Ser Thr Phe Glu Phe Gln Ile Pro Pro Ser Ile Pro Pro
130 135 140
Gly Glu Tyr Thr Leu Ala Trp Thr Trp Leu Asn Arg Leu Gly Asn Arg
145 150 155 160
Glu Phe Tyr Met Asn Cys Ala Pro Ile Thr Val Val Ala Pro Lys Lys
165 170 175
Arg Tyr Ala Pro Ser Ser Ser Ser Ser Asp Pro Arg Pro Leu Ala Ser
180 185 190
Leu Ala Gln Arg Gln Asp Leu Pro Asp Met Phe Ile Ala Asn Ile Asn
195 200 205
Gly Cys Thr Thr Glu Glu Gly Ile Asp Val Arg Phe Pro Asp Pro Gly
210 215 220
Pro Ser Val Glu Arg Ala Gly Asn Pro Ser Arg Leu Leu Ala Ser Gly
225 230 235 240
Glu Val Ile Cys Lys Met Arg Gly Ser Asp Thr Gly Pro Ile Ala Gly
245 250 255
Gly Gly Ser Gly Gly Gly Asp Gly Gly Asn Asp Ser Glu Ala Ser Pro
260 265 270
Ala Pro Ser Gln Asp Pro His Pro Ser Ser Asn Pro Ser Pro Asp Pro
275 280 285
Asn Pro Asp Pro Asp Pro Gln Cys Leu Pro Pro Ala Pro Ser Thr Ser
290 295 300
Thr Ala Ser Thr Pro Thr Ser Pro Ser Ala Thr Pro Pro Ala Ser Pro
305 310 315 320
Ser Ser Thr Gly Asp Ser Gly Asp Gly Gly Pro Gly Leu Thr Gly Ser
325 330 335
Cys Thr Glu Gly Trp Phe Asn Cys Ile Gly Gly Thr His Phe Gln Gln
340 345 350
Cys Thr Ala Ser Gly Gln Trp Ser Val Ala Arg Pro Val Ala Pro Gly
355 360 365
Thr Val Cys Arg Glu Gly Val Gly Pro Asp Leu Gln Ile Gly Tyr Ala
370 375 380
Lys Gly Asp Asp Val Arg Gly Val Arg Arg Ala His Arg
385 390 395
&lt;210&gt; 167
&lt;211&gt; 1233
&lt;212&gt; DNA
&lt;213&gt; 樟绒枝霉(Malbranchea cinnamomea)
&lt;400&gt; 167
atgcgtttct cggcttccac cgttgcagca gcggctgctt tcctgtccgc tggggttgtc 60
aacgcccata tgaacatgaa gtttccctat ccatatgggc ctgatactct gaacaacagc 120
cctcttcaga acaacctcgc cgactttccc tgcaagcaac ggcctggagt gtatgaccct 180
ccagcgctcc ccagtcctga tgccaacacc ctcaccatcg gcgtccctgc gaccctggag 240
ttccttggcg atgctgtcca tggtggtggt tcttgccaaa tcagcttgac aactgacaag 300
gagcctacca aagactctgt ctggaaggtt atccattcca ttgagggtgg atgccctgcc 360
aacactgaag ggaaccttgg aagtgatcca aagggagaac gtgccagcaa gttccagttc 420
actatccctc ccagcatcgc accaggcgag tatactctgg cttggacctg gatcaaccgc 480
attggtaacc gcgagtatta tatggactgc gccccaatca gagttcaaga agcgcccaag 540
aagcggtata ccccaacccc gccaactgag ccacgaagcc tgattccctt ggcgaaacgt 600
gacgaccttc ctgatatgtt tatcgccaac atcaacggct gcaatacccc tgaaggtatc 660
gacatccgtt acccaaaccc cggtccttct attgagtatg cgggcaatcc catgaacctt 720
atgaaggtcg gtgagccagt ttgcgtgtac gcagatggca ctcctggccc tcttgctgga 780
ggtgaagagg gtggtgacgg tggtaacact gagcaaccgc aaccgtcgaa caacgcgggc 840
ccttcgcctg gtgtcttcgc gcctctccag tccgagactg ttgttcctcc agtgcccaca 900
ccacccactc cggctcccca gccgtcgacc ccgactgtcc agactcaggc cccggccccc 960
accgttccct ccaatccaac tccaacggtg gtgccagctc cggctcctaa cagcggcaac 1020
ggtggctctg ctttgactgg tccttgtact gaagagggca tttacaactg cattggcggc 1080
acttccttcc agcgatgtgc tagtggtgaa tggaccgcag ttctgccagt tgctgagggc 1140
actgtctgca aggaagggtt cagtactgat ttgggaatta cccatgcgaa aaagcgtggc 1200
attcatcgtc gccgtggcca ctttcgcgca taa 1233
&lt;210&gt; 168
&lt;211&gt; 410
&lt;212&gt; PRT
&lt;213&gt; 樟绒枝霉(Malbranchea cinnamomea)
&lt;400&gt; 168
Met Arg Phe Ser Ala Ser Thr Val Ala Ala Ala Ala Ala Phe Leu Ser
1 5 10 15
Ala Gly Val Val Asn Ala His Met Asn Met Lys Phe Pro Tyr Pro Tyr
20 25 30
Gly Pro Asp Thr Leu Asn Asn Ser Pro Leu Gln Asn Asn Leu Ala Asp
35 40 45
Phe Pro Cys Lys Gln Arg Pro Gly Val Tyr Asp Pro Pro Ala Leu Pro
50 55 60
Ser Pro Asp Ala Asn Thr Leu Thr Ile Gly Val Pro Ala Thr Leu Glu
65 70 75 80
Phe Leu Gly Asp Ala Val His Gly Gly Gly Ser Cys Gln Ile Ser Leu
85 90 95
Thr Thr Asp Lys Glu Pro Thr Lys Asp Ser Val Trp Lys Val Ile His
100 105 110
Ser Ile Glu Gly Gly Cys Pro Ala Asn Thr Glu Gly Asn Leu Gly Ser
115 120 125
Asp Pro Lys Gly Glu Arg Ala Ser Lys Phe Gln Phe Thr Ile Pro Pro
130 135 140
Ser Ile Ala Pro Gly Glu Tyr Thr Leu Ala Trp Thr Trp Ile Asn Arg
145 150 155 160
Ile Gly Asn Arg Glu Tyr Tyr Met Asp Cys Ala Pro Ile Arg Val Gln
165 170 175
Glu Ala Pro Lys Lys Arg Tyr Thr Pro Thr Pro Pro Thr Glu Pro Arg
180 185 190
Ser Leu Ile Pro Leu Ala Lys Arg Asp Asp Leu Pro Asp Met Phe Ile
195 200 205
Ala Asn Ile Asn Gly Cys Asn Thr Pro Glu Gly Ile Asp Ile Arg Tyr
210 215 220
Pro Asn Pro Gly Pro Ser Ile Glu Tyr Ala Gly Asn Pro Met Asn Leu
225 230 235 240
Met Lys Val Gly Glu Pro Val Cys Val Tyr Ala Asp Gly Thr Pro Gly
245 250 255
Pro Leu Ala Gly Gly Glu Glu Gly Gly Asp Gly Gly Asn Thr Glu Gln
260 265 270
Pro Gln Pro Ser Asn Asn Ala Gly Pro Ser Pro Gly Val Phe Ala Pro
275 280 285
Leu Gln Ser Glu Thr Val Val Pro Pro Val Pro Thr Pro Pro Thr Pro
290 295 300
Ala Pro Gln Pro Ser Thr Pro Thr Val Gln Thr Gln Ala Pro Ala Pro
305 310 315 320
Thr Val Pro Ser Asn Pro Thr Pro Thr Val Val Pro Ala Pro Ala Pro
325 330 335
Asn Ser Gly Asn Gly Gly Ser Ala Leu Thr Gly Pro Cys Thr Glu Glu
340 345 350
Gly Ile Tyr Asn Cys Ile Gly Gly Thr Ser Phe Gln Arg Cys Ala Ser
355 360 365
Gly Glu Trp Thr Ala Val Leu Pro Val Ala Glu Gly Thr Val Cys Lys
370 375 380
Glu Gly Phe Ser Thr Asp Leu Gly Ile Thr His Ala Lys Lys Arg Gly
385 390 395 400
Ile His Arg Arg Arg Gly His Phe Arg Ala
405 410
&lt;210&gt; 169
&lt;211&gt; 699
&lt;212&gt; DNA
&lt;213&gt; 樟绒枝霉(Malbranchea cinnamomea)
&lt;400&gt; 169
atgaaggcag cagtatcctt ggcccttctt gttgccgtag ctggagcagc ctctgctcac 60
aatatcttcc ccaacctcat cgtcgacggg acggttacgg gagactggga attcgtccgc 120
accaccgcca acaaatggtc ccgcgagggc ttaaccaacg tcaacagcga gagtatgaga 180
tgctacgagg aggccggccg tccaccctcg gaggtgaaaa ccgtcaaagc ggggtcgaga 240
gtcggtttcg cttcccaggc gcctattcgc catattgggc cagtgctctt ttacatggcc 300
cgtgttcccg atgggcagga tgtggactcg tggaccccat cgggggacgt ctggttcaag 360
atccatcagc agggaccgga gcggtctgag tcgggatgga cctggcctac gcaagaccaa 420
accgaactct tcgtcgacat cccagcctcc gtcccagacg gcaactatct cctgcgaatc 480
gagcaaatcg cgctccacga cgcacagtac gttggtggtg cgcagtttta cctcgcatgc 540
ggccaaatca acgtcaccgg gggcggcagc ggggacccag gtcccaaggt ctcattccct 600
ggcgcgtata aacccaccga tcctggtatt ttgctggacc tccatggaca tccgccggcg 660
aattatcagt tcccgggacc agccgtatgg caaggctga 699
&lt;210&gt; 170
&lt;211&gt; 232
&lt;212&gt; PRT
&lt;213&gt; 樟绒枝霉(Malbranchea cinnamomea)
&lt;400&gt; 170
Met Lys Ala Ala Val Ser Leu Ala Leu Leu Val Ala Val Ala Gly Ala
1 5 10 15
Ala Ser Ala His Asn Ile Phe Pro Asn Leu Ile Val Asp Gly Thr Val
20 25 30
Thr Gly Asp Trp Glu Phe Val Arg Thr Thr Ala Asn Lys Trp Ser Arg
35 40 45
Glu Gly Leu Thr Asn Val Asn Ser Glu Ser Met Arg Cys Tyr Glu Glu
50 55 60
Ala Gly Arg Pro Pro Ser Glu Val Lys Thr Val Lys Ala Gly Ser Arg
65 70 75 80
Val Gly Phe Ala Ser Gln Ala Pro Ile Arg His Ile Gly Pro Val Leu
85 90 95
Phe Tyr Met Ala Arg Val Pro Asp Gly Gln Asp Val Asp Ser Trp Thr
100 105 110
Pro Ser Gly Asp Val Trp Phe Lys Ile His Gln Gln Gly Pro Glu Arg
115 120 125
Ser Glu Ser Gly Trp Thr Trp Pro Thr Gln Asp Gln Thr Glu Leu Phe
130 135 140
Val Asp Ile Pro Ala Ser Val Pro Asp Gly Asn Tyr Leu Leu Arg Ile
145 150 155 160
Glu Gln Ile Ala Leu His Asp Ala Gln Tyr Val Gly Gly Ala Gln Phe
165 170 175
Tyr Leu Ala Cys Gly Gln Ile Asn Val Thr Gly Gly Gly Ser Gly Asp
180 185 190
Pro Gly Pro Lys Val Ser Phe Pro Gly Ala Tyr Lys Pro Thr Asp Pro
195 200 205
Gly Ile Leu Leu Asp Leu His Gly His Pro Pro Ala Asn Tyr Gln Phe
210 215 220
Pro Gly Pro Ala Val Trp Gln Gly
225 230
&lt;210&gt; 171
&lt;211&gt; 801
&lt;212&gt; DNA
&lt;213&gt; 樟绒枝霉(Malbranchea cinnamomea)
&lt;400&gt; 171
atgaaggcca ccgttctagc tggcctcgcg gccgtgattg ctgctcaagg tgtagctggg 60
catgcgacat tccagcagct atgggttgat ggagaggata agggaggtgc ttgcgcaaga 120
ttgcctttga gcaactcacc cgtgacagat gtcaatagcg cagagatcgc atgcaacgcg 180
aacagcggtc ctgcggccga gaagtgtacc gtttccgcag gcggagtcgt caccgtcgag 240
atgcaccagc agcccggaga tcggtcgtgt gacaacgaag ccattggagg caaccactgg 300
ggtcccgtgc tcgtatacat gagtaaagtc gacgactccg ccaccgcaga cgggtccggc 360
gggtggttca agatcttcga agacacctgg gctcccgcac ccgactccaa ttccggctcc 420
gacgactact ggggcgtcaa ggatctgaac gcccactgcg gccgcatgga cgtgccaatc 480
cccgctgacc tggcgccagg agactacctg ctgagagcgg aggtgattgc gctgcacacc 540
gcgtcgtcgc ccggcggtgc gcagttctac atgacctgct accagctcac ggttgatgga 600
gaggggtcac agagcccgca aaccgtgtcg ttccccggcg cttattcgcc aagtgaccct 660
gggattcaga tcaatatcta tcagaagttg acggaatatg tctctcctgg accagctgtg 720
attgagggtg gaaccaccgt tgaggccggc acaggcggta gcaccattcc cggcaaacta 780
aatgacgtgt tcttgtcttg a 801
&lt;210&gt; 172
&lt;211&gt; 266
&lt;212&gt; PRT
&lt;213&gt; 樟绒枝霉(Malbranchea cinnamomea)
&lt;400&gt; 172
Met Lys Ala Thr Val Leu Ala Gly Leu Ala Ala Val Ile Ala Ala Gln
1 5 10 15
Gly Val Ala Gly His Ala Thr Phe Gln Gln Leu Trp Val Asp Gly Glu
20 25 30
Asp Lys Gly Gly Ala Cys Ala Arg Leu Pro Leu Ser Asn Ser Pro Val
35 40 45
Thr Asp Val Asn Ser Ala Glu Ile Ala Cys Asn Ala Asn Ser Gly Pro
50 55 60
Ala Ala Glu Lys Cys Thr Val Ser Ala Gly Gly Val Val Thr Val Glu
65 70 75 80
Met His Gln Gln Pro Gly Asp Arg Ser Cys Asp Asn Glu Ala Ile Gly
85 90 95
Gly Asn His Trp Gly Pro Val Leu Val Tyr Met Ser Lys Val Asp Asp
100 105 110
Ser Ala Thr Ala Asp Gly Ser Gly Gly Trp Phe Lys Ile Phe Glu Asp
115 120 125
Thr Trp Ala Pro Ala Pro Asp Ser Asn Ser Gly Ser Asp Asp Tyr Trp
130 135 140
Gly Val Lys Asp Leu Asn Ala His Cys Gly Arg Met Asp Val Pro Ile
145 150 155 160
Pro Ala Asp Leu Ala Pro Gly Asp Tyr Leu Leu Arg Ala Glu Val Ile
165 170 175
Ala Leu His Thr Ala Ser Ser Pro Gly Gly Ala Gln Phe Tyr Met Thr
180 185 190
Cys Tyr Gln Leu Thr Val Asp Gly Glu Gly Ser Gln Ser Pro Gln Thr
195 200 205
Val Ser Phe Pro Gly Ala Tyr Ser Pro Ser Asp Pro Gly Ile Gln Ile
210 215 220
Asn Ile Tyr Gln Lys Leu Thr Glu Tyr Val Ser Pro Gly Pro Ala Val
225 230 235 240
Ile Glu Gly Gly Thr Thr Val Glu Ala Gly Thr Gly Gly Ser Thr Ile
245 250 255
Pro Gly Lys Leu Asn Asp Val Phe Leu Ser
260 265
&lt;210&gt; 173
&lt;211&gt; 975
&lt;212&gt; DNA
&lt;213&gt; 嗜热棒囊壳(Corynascus thermophilus)
&lt;400&gt; 173
atgccccctc cacggctaca cacgttcctt gccctcttgg ccctggtatc agcccccacc 60
gcacgggggc attcccatct cgcatacatc atcatcaacg gcgaggtgta ccacggattc 120
gacccgcggc cgggggagga gaactcgccg gcgcgcgtgg gctggtcgac gggggcggtc 180
gacgacgggt tcgtggggcc ggccgactac tcgtcgcccg acataatctg ccacgtcgag 240
ggggccagcc cgccggcgca cgcgcccgtc cgggccggcg accgggttca cgtgcagtgg 300
aacggctggc cgctcgggca tgtggggccg gtgctgtcgt acctggcccc ctgcggcggc 360
ctggaggggg ccgagcgcgg gtgtgccgga gtggacaagc ggcagctgcg gtggaccaag 420
gtggacgact cgctgccggc gatggagaga ctgtccacca cggtcggggc cgcggacggc 480
ggcggcgtgc ccgggcagcg ctgggccacc gacgtgctgg tcgcggccaa caacagctgg 540
caggtcgaga tcccgcgcgg gctccgggac gggccgtacg tgctgcggca cgagatcgtc 600
gcgctgcact tcgcggccga ccgcggcggc gcgcagaact acccggtctg cgtcaacctc 660
tgggtcgagg gcggcgacgg caccatggag ctggacggct tcgacgccac cgagctctac 720
cggcccgacg acccgggcat cctgctcgac gtgacggccg gcccgcgctc gtacgtcgtg 780
cccggcccga cgctggtcgc gggggccacg cgggtgccgt acgcgcagca gaacagcagc 840
tcggcgaggg cggagggaac ccccgtgatg gtcatcagga gcacagagac ggtgcccctg 900
acggtagcac ctaccccgac caatagtacg ggtcgggctt acgggaggag gtacggaagc 960
aggtttcagg ggtag 975
&lt;210&gt; 174
&lt;211&gt; 324
&lt;212&gt; PRT
&lt;213&gt; 嗜热棒囊壳(Corynascus thermophilus)
&lt;400&gt; 174
Met Pro Pro Pro Arg Leu His Thr Phe Leu Ala Leu Leu Ala Leu Val
1 5 10 15
Ser Ala Pro Thr Ala Arg Gly His Ser His Leu Ala Tyr Ile Ile Ile
20 25 30
Asn Gly Glu Val Tyr His Gly Phe Asp Pro Arg Pro Gly Glu Glu Asn
35 40 45
Ser Pro Ala Arg Val Gly Trp Ser Thr Gly Ala Val Asp Asp Gly Phe
50 55 60
Val Gly Pro Ala Asp Tyr Ser Ser Pro Asp Ile Ile Cys His Val Glu
65 70 75 80
Gly Ala Ser Pro Pro Ala His Ala Pro Val Arg Ala Gly Asp Arg Val
85 90 95
His Val Gln Trp Asn Gly Trp Pro Leu Gly His Val Gly Pro Val Leu
100 105 110
Ser Tyr Leu Ala Pro Cys Gly Gly Leu Glu Gly Ala Glu Arg Gly Cys
115 120 125
Ala Gly Val Asp Lys Arg Gln Leu Arg Trp Thr Lys Val Asp Asp Ser
130 135 140
Leu Pro Ala Met Glu Arg Leu Ser Thr Thr Val Gly Ala Ala Asp Gly
145 150 155 160
Gly Gly Val Pro Gly Gln Arg Trp Ala Thr Asp Val Leu Val Ala Ala
165 170 175
Asn Asn Ser Trp Gln Val Glu Ile Pro Arg Gly Leu Arg Asp Gly Pro
180 185 190
Tyr Val Leu Arg His Glu Ile Val Ala Leu His Phe Ala Ala Asp Arg
195 200 205
Gly Gly Ala Gln Asn Tyr Pro Val Cys Val Asn Leu Trp Val Glu Gly
210 215 220
Gly Asp Gly Thr Met Glu Leu Asp Gly Phe Asp Ala Thr Glu Leu Tyr
225 230 235 240
Arg Pro Asp Asp Pro Gly Ile Leu Leu Asp Val Thr Ala Gly Pro Arg
245 250 255
Ser Tyr Val Val Pro Gly Pro Thr Leu Val Ala Gly Ala Thr Arg Val
260 265 270
Pro Tyr Ala Gln Gln Asn Ser Ser Ser Ala Arg Ala Glu Gly Thr Pro
275 280 285
Val Met Val Ile Arg Ser Thr Glu Thr Val Pro Leu Thr Val Ala Pro
290 295 300
Thr Pro Thr Asn Ser Thr Gly Arg Ala Tyr Gly Arg Arg Tyr Gly Ser
305 310 315 320
Arg Phe Gln Gly
&lt;210&gt; 175
&lt;211&gt; 1115
&lt;212&gt; DNA
&lt;213&gt; 嗜热棒囊壳(Corynascus thermophilus)
&lt;400&gt; 175
atggctccat taacgtccgc agccctgatc ctgggcaccc ttatcagctt ggtctcgggc 60
catggctatc tgaagagcat caccgtcaac ggcaaggagt acctcgcttg gcaggttggc 120
caggacgact atatcaaccc gactccggtc cgatatgccc gcaggcttgc aaacaacggg 180
ccagtcccgg atttcaccac caaggatatc acgtacgttt ccgtggaggc cggcactggc 240
tgtggcggaa gagggcaaga ccgccggact gacgcgtgcc atgactttac agctgcggcg 300
ccggtggtaa tgagccggct gagggaatca tcgagctgaa ggctggcgac actgtgtacg 360
cgccgtcccc tccccagcta acgttacccg atcgacctca tctggacggt tagctgacag 420
ggtcgtcttc tctcgcacac gcaaatagga ccctcaactg ggaccagtgg ggtagcagcc 480
actccggccc agtcatgaag tgagtcttgc ggccttcccg gcgacggacc gtaccagagg 540
ttattacggg agtagcagtc gtaatcagcg aacccattcg aactaacccc tcccgcacca 600
gctatctcgc ccattgcacc aacgacgact gcaagtcgtt caagggcgac agcggcaacg 660
tctgggtcaa gatcgagcag ctcgcgtaca acccgtcggc caaccccccc tgggcgtccg 720
acctcctccg cgagcagggc gccaagtgga aggtgacgat cccgcccacc ctcgcccccg 780
gcgagtacct gctgcggcac gagatcctgg gcctgcacgt cgccggaacc gtgatgggcg 840
cccagttcta ccccagctgc acccagatca gggtcaccca gggcgggaac acgcagctgc 900
cctccggcat cgcgcttccc ggtgcttacg acccgcatga cgggggtgta agtctcggat 960
gtatgatctg gaattgtctc gacgcttgct gacagtgttt attccagatc ttggtcgagt 1020
tgtggagggt taaccagggc caggtcaact acaccgcgcc tggaggaccc gtctggagcg 1080
cggcggcgcc ggatcccaac cgctctggcc cctga 1115
&lt;210&gt; 176
&lt;211&gt; 240
&lt;212&gt; PRT
&lt;213&gt; 嗜热棒囊壳(Corynascus thermophilus)
&lt;400&gt; 176
Met Ala Pro Leu Thr Ser Ala Ala Leu Ile Leu Gly Thr Leu Ile Ser
1 5 10 15
Leu Val Ser Gly His Gly Tyr Leu Lys Ser Ile Thr Val Asn Gly Lys
20 25 30
Glu Tyr Leu Ala Trp Gln Val Gly Gln Asp Asp Tyr Ile Asn Pro Thr
35 40 45
Pro Val Arg Tyr Ala Arg Arg Leu Ala Asn Asn Gly Pro Val Pro Asp
50 55 60
Phe Thr Thr Lys Asp Ile Thr Cys Gly Ala Gly Gly Asn Glu Pro Ala
65 70 75 80
Glu Gly Ile Ile Glu Leu Lys Ala Gly Asp Thr Val Thr Leu Asn Trp
85 90 95
Asp Gln Trp Gly Ser Ser His Ser Gly Pro Val Met Asn Tyr Leu Ala
100 105 110
His Cys Thr Asn Asp Asp Cys Lys Ser Phe Lys Gly Asp Ser Gly Asn
115 120 125
Val Trp Val Lys Ile Glu Gln Leu Ala Tyr Asn Pro Ser Ala Asn Pro
130 135 140
Pro Trp Ala Ser Asp Leu Leu Arg Glu Gln Gly Ala Lys Trp Lys Val
145 150 155 160
Thr Ile Pro Pro Thr Leu Ala Pro Gly Glu Tyr Leu Leu Arg His Glu
165 170 175
Ile Leu Gly Leu His Val Ala Gly Thr Val Met Gly Ala Gln Phe Tyr
180 185 190
Pro Ser Cys Thr Gln Ile Arg Val Thr Gln Gly Gly Asn Thr Gln Leu
195 200 205
Pro Ser Gly Ile Ala Leu Pro Gly Ala Tyr Asp Pro His Asp Gly Gly
210 215 220
Gly Pro Val Trp Ser Ala Ala Ala Pro Asp Pro Asn Arg Ser Gly Pro
225 230 235 240
&lt;210&gt; 177
&lt;211&gt; 988
&lt;212&gt; DNA
&lt;213&gt; 嗜热棒囊壳(Corynascus thermophilus)
&lt;400&gt; 177
atgaaatacg ccctccagct cgctgcggcc gcggcttttg cggtgaacag cgcggccggc 60
cactacatct tccagcagtt tgcgacaggc gggacgacgt acccgccctg gaagtacatc 120
cgccgcaaca ccaacccgga ctggctgcag aacgggccgg tgacggacct gtcgtcgacc 180
gacctgcgct gtaacgtggg cgggcaggtc agcaacggga ccgagaccat caccgtcaac 240
gccggcgacg aattcacctt catcctcgac acgcccgtct accacgccgg ccccacctcg 300
ctctacatgt ccaaggcgcc cggcgcggcg gccgactacg acggcagcgg gtcctggttc 360
aagatctatg actggggccc gcagggaacg agctggacgc tgagcggtac gtgtgcctgt 420
ttctcatcat caccacgacc atcctcatga tgattaccgc tctcgttatg attatgctgc 480
tgttgcggtt ctgctggaag agtatctgac ccgtctaccg tatccaggct cgtacaccca 540
gagaattccc aggtgcatcc ctgacggcga atacctcctc cgcatccagc agatcggact 600
tcacaacccc ggcgccgagc cacaggtacg gtcctggact tccgggtctc ctcttgcgca 660
ccgtcgctga cgcaggacga acaaaaacag ttctacatca gctgcgccca agtcaaggtg 720
gtcaatggcg gcagcaccaa cccgagcccg accgcccaga ttccgggagc cttccacagc 780
aacgatcccg gcttgaccgt caacgtaagc ccggcctcgc atcatttccc cgggaaccga 840
aatagcaatg agctgacaac cgatcgtaga tctacaccga ccctctcaac aactacgtcg 900
tccccggacc ccgggttgta agtctctccg gatgccctcc tccgttgatg gtcacgcctt 960
gctaatgtcg tccaagttct cctgctag 988
&lt;210&gt; 178
&lt;211&gt; 225
&lt;212&gt; PRT
&lt;213&gt; 嗜热棒囊壳(Corynascus thermophilus)
&lt;400&gt; 178
Met Lys Tyr Ala Leu Gln Leu Ala Ala Ala Ala Ala Phe Ala Val Asn
1 5 10 15
Ser Ala Ala Gly His Tyr Ile Phe Gln Gln Phe Ala Thr Gly Gly Thr
20 25 30
Thr Tyr Pro Pro Trp Lys Tyr Ile Arg Arg Asn Thr Asn Pro Asp Trp
35 40 45
Leu Gln Asn Gly Pro Val Thr Asp Leu Ser Ser Thr Asp Leu Arg Cys
50 55 60
Asn Val Gly Gly Gln Val Ser Asn Gly Thr Glu Thr Ile Thr Val Asn
65 70 75 80
Ala Gly Asp Glu Phe Thr Phe Ile Leu Asp Thr Pro Val Tyr His Ala
85 90 95
Gly Pro Thr Ser Leu Tyr Met Ser Lys Ala Pro Gly Ala Ala Ala Asp
100 105 110
Tyr Asp Gly Ser Gly Ser Trp Phe Lys Ile Tyr Asp Trp Gly Pro Gln
115 120 125
Gly Thr Ser Trp Thr Leu Ser Gly Ser Tyr Thr Gln Arg Ile Pro Arg
130 135 140
Cys Ile Pro Asp Gly Glu Tyr Leu Leu Arg Ile Gln Gln Ile Gly Leu
145 150 155 160
His Asn Pro Gly Ala Glu Pro Gln Phe Tyr Ile Ser Cys Ala Gln Val
165 170 175
Lys Val Val Asn Gly Gly Ser Thr Asn Pro Ser Pro Thr Ala Gln Ile
180 185 190
Pro Gly Ala Phe His Ser Asn Asp Pro Gly Leu Thr Val Asn Ile Tyr
195 200 205
Thr Asp Pro Leu Asn Asn Tyr Val Val Pro Gly Pro Arg Val Phe Ser
210 215 220
Cys
225
&lt;210&gt; 179
&lt;211&gt; 859
&lt;212&gt; DNA
&lt;213&gt; 嗜热棒囊壳(Corynascus thermophilus)
&lt;400&gt; 179
atgaaggccc tctctctcct tgcggctgcc tcggcggtct ctgcccacac catcttcgtc 60
cagctcgaag cggacggcac gaggtacccg gtctcgtacg gcatccggac gccgacgtac 120
gacggcccca tcaccgacgt cacgtccaac gacgttgcct gcaacggcgg gccgaacccg 180
acgaccccgt ccggcgacgt catcacggtc acggcgggca ccacggtcaa ggccatctgg 240
agacacacgc tccagtccgg cccggacgac gtcatggacg ccagccacaa gggcccgacc 300
ctggcctacc tcaagaaggt cgacgacgcc accacggact cgggcatcgg cggcggctgg 360
ttcaagattc aggaggacgg ctacaacaac ggcgagtggg gcaccagcaa ggtgatctcc 420
aacggcggcg agcactacat gtgagtcctt tctccgacag agcgaggaga aacacagaga 480
gggagagaga gagaggccga ccaatctcgc tgacccgctg caacagcgac atcccggcct 540
gcattccccc gggccagtac ctcctccgcg ccgagatgat tgctctccac agcgccgggt 600
ctcccggcgg tgctcagctc tacgtaagcc tctctgccct tccttattac cacccccccc 660
ccaaacctct gactgacacg cttggcagat ggaatgcgcc cagatcaaca tcgtcggcag 720
ctccggctcc ctgcccagct cgaccgtcag cttccccggc gcgtacagcg ccaacgaccc 780
gggcatcctc atcaacatct actccatgtc cccctcggac acgtacatca ttccgggccc 840
ggaggtcttc acttgctag 859
&lt;210&gt; 180
&lt;211&gt; 235
&lt;212&gt; PRT
&lt;213&gt; 嗜热棒囊壳(Corynascus thermophilus)
&lt;400&gt; 180
Met Lys Ala Leu Ser Leu Leu Ala Ala Ala Ser Ala Val Ser Ala His
1 5 10 15
Thr Ile Phe Val Gln Leu Glu Ala Asp Gly Thr Arg Tyr Pro Val Ser
20 25 30
Tyr Gly Ile Arg Thr Pro Thr Tyr Asp Gly Pro Ile Thr Asp Val Thr
35 40 45
Ser Asn Asp Val Ala Cys Asn Gly Gly Pro Asn Pro Thr Thr Pro Ser
50 55 60
Gly Asp Val Ile Thr Val Thr Ala Gly Thr Thr Val Lys Ala Ile Trp
65 70 75 80
Arg His Thr Leu Gln Ser Gly Pro Asp Asp Val Met Asp Ala Ser His
85 90 95
Lys Gly Pro Thr Leu Ala Tyr Leu Lys Lys Val Asp Asp Ala Thr Thr
100 105 110
Asp Ser Gly Ile Gly Gly Gly Trp Phe Lys Ile Gln Glu Asp Gly Tyr
115 120 125
Asn Asn Gly Glu Trp Gly Thr Ser Lys Val Ile Ser Asn Gly Gly Glu
130 135 140
His Tyr Ile Asp Ile Pro Ala Cys Ile Pro Pro Gly Gln Tyr Leu Leu
145 150 155 160
Arg Ala Glu Met Ile Ala Leu His Ser Ala Gly Ser Pro Gly Gly Ala
165 170 175
Gln Leu Tyr Met Glu Cys Ala Gln Ile Asn Ile Val Gly Ser Ser Gly
180 185 190
Ser Leu Pro Ser Ser Thr Val Ser Phe Pro Gly Ala Tyr Ser Ala Asn
195 200 205
Asp Pro Gly Ile Leu Ile Asn Ile Tyr Ser Met Ser Pro Ser Asp Thr
210 215 220
Tyr Ile Ile Pro Gly Pro Glu Val Phe Thr Cys
225 230 235
&lt;210&gt; 181
&lt;211&gt; 1011
&lt;212&gt; DNA
&lt;213&gt; 嗜热棒囊壳(Corynascus thermophilus)
&lt;400&gt; 181
atggccaaga cctctgctct cctcgccggc ctgacgggcg cggccctcgt cgctgcccac 60
ggccacgtca gccacatcat cgtcaacggc gtgtactaca ggaactacga cccgacgacc 120
gactcgtacc agaccaaccc gccgagggtc atcggctggg cggccgccca gcaggacaat 180
ggcttcgtcg agcccaacaa ctttggctcg ccggatgtca tctgccacaa gagcgccact 240
cccggcggcg gccacgccac cgtcgctgcc ggagacaaga tcagcctcgt ctggacgccc 300
gagtggcccg agtcccacat cggcccggtc atcgactatc tggcggcctg caacggcgac 360
tgcgagacgg tcgacaagac gtcgctgcgc tggttcaaga tcgacggcgc cggctacgac 420
aagtcgaccg gccgctgggc cgccgacgcc ctgcgcgcca acggcaacag ctggctcgtc 480
cagatcccgt cggacctcaa ggcgggcaac tacgtgctcc gccacgagat catcgccctc 540
cacggcgcca acaacgccaa cggcgcccag tcgtacccgc agtgcatcaa cctccgcgtc 600
acgggcggcg gcaacaacct gcccagcggc gtgcccggca cctcgctgta cagggccaac 660
gacccgggca tcctcttcaa cccctacgtc ccctcgcccg actacccggt ccccggcccg 720
tccctcattc ccggcgccgt cagctccatc gcccagagca agtcggtcgc cacggccacg 780
gccacggcca cccctcccgg cggcggcaac aacaaccccc ccgccaccac caccgccggc 840
ggccccacca gcaccaccag cagcccctcc cagcagacca ccaccccgcc gtcgggcagc 900
gtgcagacca agtacggcca gtgcggcggc aacggctgga ccggcccgac cctgtgcgcc 960
cccggctcga gctgcaccgt tctcaacgag tggtactccc agtgcgtgta a 1011
&lt;210&gt; 182
&lt;211&gt; 336
&lt;212&gt; PRT
&lt;213&gt; 嗜热棒囊壳(Corynascus thermophilus)
&lt;400&gt; 182
Met Ala Lys Thr Ser Ala Leu Leu Ala Gly Leu Thr Gly Ala Ala Leu
1 5 10 15
Val Ala Ala His Gly His Val Ser His Ile Ile Val Asn Gly Val Tyr
20 25 30
Tyr Arg Asn Tyr Asp Pro Thr Thr Asp Ser Tyr Gln Thr Asn Pro Pro
35 40 45
Arg Val Ile Gly Trp Ala Ala Ala Gln Gln Asp Asn Gly Phe Val Glu
50 55 60
Pro Asn Asn Phe Gly Ser Pro Asp Val Ile Cys His Lys Ser Ala Thr
65 70 75 80
Pro Gly Gly Gly His Ala Thr Val Ala Ala Gly Asp Lys Ile Ser Leu
85 90 95
Val Trp Thr Pro Glu Trp Pro Glu Ser His Ile Gly Pro Val Ile Asp
100 105 110
Tyr Leu Ala Ala Cys Asn Gly Asp Cys Glu Thr Val Asp Lys Thr Ser
115 120 125
Leu Arg Trp Phe Lys Ile Asp Gly Ala Gly Tyr Asp Lys Ser Thr Gly
130 135 140
Arg Trp Ala Ala Asp Ala Leu Arg Ala Asn Gly Asn Ser Trp Leu Val
145 150 155 160
Gln Ile Pro Ser Asp Leu Lys Ala Gly Asn Tyr Val Leu Arg His Glu
165 170 175
Ile Ile Ala Leu His Gly Ala Asn Asn Ala Asn Gly Ala Gln Ser Tyr
180 185 190
Pro Gln Cys Ile Asn Leu Arg Val Thr Gly Gly Gly Asn Asn Leu Pro
195 200 205
Ser Gly Val Pro Gly Thr Ser Leu Tyr Arg Ala Asn Asp Pro Gly Ile
210 215 220
Leu Phe Asn Pro Tyr Val Pro Ser Pro Asp Tyr Pro Val Pro Gly Pro
225 230 235 240
Ser Leu Ile Pro Gly Ala Val Ser Ser Ile Ala Gln Ser Lys Ser Val
245 250 255
Ala Thr Ala Thr Ala Thr Ala Thr Pro Pro Gly Gly Gly Asn Asn Asn
260 265 270
Pro Pro Ala Thr Thr Thr Ala Gly Gly Pro Thr Ser Thr Thr Ser Ser
275 280 285
Pro Ser Gln Gln Thr Thr Thr Pro Pro Ser Gly Ser Val Gln Thr Lys
290 295 300
Tyr Gly Gln Cys Gly Gly Asn Gly Trp Thr Gly Pro Thr Leu Cys Ala
305 310 315 320
Pro Gly Ser Ser Cys Thr Val Leu Asn Glu Trp Tyr Ser Gln Cys Val
325 330 335
&lt;210&gt; 183
&lt;211&gt; 1315
&lt;212&gt; DNA
&lt;213&gt; 嗜热棒囊壳(Corynascus thermophilus)
&lt;400&gt; 183
atgaaaacgc ttgccgccct cctcgtctcc gccggcctcg tggctgcgca cggctatgtt 60
gaccgtgcca cgatcggcgg caaggagtac caggtaatga caacaaacac ggctactccc 120
gtgtggatgc gtcgtcgaag agtagctaac aatacggtcc ctatagttct accaggtggg 180
ctcggtaccg gccagttggc tctccatgcc ggcagttcct gacatgcatc tcgcatattt 240
agccgtacgt tgatccgtac atgggcgaca acaaggtaac aacaaacctt aatataacaa 300
gaacaaccta tccatcctcc ctcccccccc ctctccacac cccccccctc tctctctctt 360
tctctccttt ctcctctgat gcaccggtcg agcacgcact aaacaggggg taattacggg 420
gggcatttca gcccgacagg gtctcccgct cgatcccggg caacggcccc gtggaggacg 480
tcaactcgct cgacatccag tgcaacgcgg gcgcgcagcc ggccaagctc cacgcccccg 540
ccgccgccgg ctcgaccgtg acgctcaact ggaccctctg gcccgactcg cacgtcggcc 600
ccgtcatcac ctacatggcg cgctgccccg acagcggctg ccagaactgg tcgcccggaa 660
cccagtatgg cccattccaa tcctgtttgt tgatattgat ggggggtaaa gacggagggg 720
atggttggcg gtgctaaatg gtttactttc ctgatgacag gcccgtctgg ttcaagatca 780
aggagggcgg ccgtgagggc acgtccaacg tctgggcggc cgtacgtgat cacaccccgt 840
tccgaaaaca acgaggcaca caccaaagcc aactaacccc tcccttcttt cgctctctat 900
ctctctcgac agaccccgct catgaaggcg ccgtcggcgt acacgtacac gatcccggcc 960
tgcctcaaga gcggctacta cctggtgcgg cacgagatca tcgcgctgca ctcggcctgg 1020
cagtaccccg gcgcgcagtt ctacccgggc tgccaccagc tccaggtcac cggcggcggc 1080
tcgaccgtgc cctcggccaa cctggtcgcc ttccccggcg cctacaaggg cagcgacccc 1140
ggcatcacct acgacgcgta caagggtgag ccatctcttt ctctctttct ctctgtctcg 1200
cttttctctt tccttgtgcc tcttggttgt ccgtcttgga gcagggcagg gcgactgacg 1260
cggagtggca gcgcaacctt acacgatccc gggcccgccc gtgtttactt gctaa 1315
&lt;210&gt; 184
&lt;211&gt; 253
&lt;212&gt; PRT
&lt;213&gt; 嗜热棒囊壳(Corynascus thermophilus)
&lt;400&gt; 184
Met Lys Thr Leu Ala Ala Leu Leu Val Ser Ala Gly Leu Val Ala Ala
1 5 10 15
His Gly Tyr Val Asp Arg Ala Thr Ile Gly Gly Lys Glu Tyr Gln Phe
20 25 30
Tyr Gln Val Gly Ser Val Pro Ala Ser Trp Leu Ser Met Pro Ala Val
35 40 45
Pro Asp Met His Leu Ala Tyr Leu Ala Pro Asp Arg Val Ser Arg Ser
50 55 60
Ile Pro Gly Asn Gly Pro Val Glu Asp Val Asn Ser Leu Asp Ile Gln
65 70 75 80
Cys Asn Ala Gly Ala Gln Pro Ala Lys Leu His Ala Pro Ala Ala Ala
85 90 95
Gly Ser Thr Val Thr Leu Asn Trp Thr Leu Trp Pro Asp Ser His Val
100 105 110
Gly Pro Val Ile Thr Tyr Met Ala Arg Cys Pro Asp Ser Gly Cys Gln
115 120 125
Asn Trp Ser Pro Gly Thr Gln Pro Val Trp Phe Lys Ile Lys Glu Gly
130 135 140
Gly Arg Glu Gly Thr Ser Asn Val Trp Ala Ala Thr Pro Leu Met Lys
145 150 155 160
Ala Pro Ser Ala Tyr Thr Tyr Thr Ile Pro Ala Cys Leu Lys Ser Gly
165 170 175
Tyr Tyr Leu Val Arg His Glu Ile Ile Ala Leu His Ser Ala Trp Gln
180 185 190
Tyr Pro Gly Ala Gln Phe Tyr Pro Gly Cys His Gln Leu Gln Val Thr
195 200 205
Gly Gly Gly Ser Thr Val Pro Ser Ala Asn Leu Val Ala Phe Pro Gly
210 215 220
Ala Tyr Lys Gly Ser Asp Pro Gly Ile Thr Tyr Asp Ala Tyr Lys Ala
225 230 235 240
Gln Pro Tyr Thr Ile Pro Gly Pro Pro Val Phe Thr Cys
245 250
&lt;210&gt; 185
&lt;211&gt; 924
&lt;212&gt; DNA
&lt;213&gt; 嗜热棒囊壳(Corynascus thermophilus)
&lt;400&gt; 185
atgtaccgca cgctcggttc ccttgccctg ctcgctggag gcgctgctgc ccacggtgcc 60
gtgaccagct acaacatcgc gggcaaggac taccctgggt aaggaaggag atctctctct 120
ctctctctct ctctctctct ctctctctct ctcgttctct tgctaacaca aaggcacctc 180
tgcagatact cgggctttgc cccgaccggc gaacccgtca tccagtggca atggcccgac 240
tacaaccccg tcatgtccgc tagcgacttc aagctccgct gcaacggcgg caccaacgcg 300
cagctgtatg ctgaggcggc ccccggcgat accatcacgg ccacctgggc ccagtggacg 360
cacgcccagg gcccgatcct ggtgtggatg tacaagtgcc ccggcgactt cagctcctgc 420
gacggctccg gcgagggctg gttcaagatc gacgaggccg gcttccacgg cgacggccag 480
actgtcttcc tcgacagcga gaacccctcg ggctgggaca tcgccaagct ggtcggcggc 540
aacaagtcgt ggagcagcaa gatccccgag ggcctcgctc cgggcaacta cctggtccgc 600
cacgagctca tcgccctgca ccaggccaac gccccgcagt tctaccccga gtgcgcccag 660
gtcaaggtta ccggctccgg caccgccgag cccgactcct cgtacaaggc cgccatcccc 720
ggctactgct cgcagagcga ccccaacatt tcggtaagga gggactcccg gccgagagag 780
agagaggact cattcctggt gctaacccgt tcacttccgc agttcaacat caacgaccac 840
tccctcccgc aggagtacaa gatccccggc ccgccggtct tcaagggcac tgcctccgcc 900
aaggctcgct ccttccaggc ctaa 924
&lt;210&gt; 186
&lt;211&gt; 255
&lt;212&gt; PRT
&lt;213&gt; 嗜热棒囊壳(Corynascus thermophilus)
&lt;400&gt; 186
Met Tyr Arg Thr Leu Gly Ser Leu Ala Leu Leu Ala Gly Gly Ala Ala
1 5 10 15
Ala His Gly Ala Val Thr Ser Tyr Asn Ile Ala Gly Lys Asp Tyr Pro
20 25 30
Gly Tyr Ser Gly Phe Ala Pro Thr Gly Glu Pro Val Ile Gln Trp Gln
35 40 45
Trp Pro Asp Tyr Asn Pro Val Met Ser Ala Ser Asp Phe Lys Leu Arg
50 55 60
Cys Asn Gly Gly Thr Asn Ala Gln Leu Tyr Ala Glu Ala Ala Pro Gly
65 70 75 80
Asp Thr Ile Thr Ala Thr Trp Ala Gln Trp Thr His Ala Gln Gly Pro
85 90 95
Ile Leu Val Trp Met Tyr Lys Cys Pro Gly Asp Phe Ser Ser Cys Asp
100 105 110
Gly Ser Gly Glu Gly Trp Phe Lys Ile Asp Glu Ala Gly Phe His Gly
115 120 125
Asp Gly Gln Thr Val Phe Leu Asp Ser Glu Asn Pro Ser Gly Trp Asp
130 135 140
Ile Ala Lys Leu Val Gly Gly Asn Lys Ser Trp Ser Ser Lys Ile Pro
145 150 155 160
Glu Gly Leu Ala Pro Gly Asn Tyr Leu Val Arg His Glu Leu Ile Ala
165 170 175
Leu His Gln Ala Asn Ala Pro Gln Phe Tyr Pro Glu Cys Ala Gln Val
180 185 190
Lys Val Thr Gly Ser Gly Thr Ala Glu Pro Asp Ser Ser Tyr Lys Ala
195 200 205
Ala Ile Pro Gly Tyr Cys Ser Gln Ser Asp Pro Asn Ile Ser Phe Asn
210 215 220
Ile Asn Asp His Ser Leu Pro Gln Glu Tyr Lys Ile Pro Gly Pro Pro
225 230 235 240
Val Phe Lys Gly Thr Ala Ser Ala Lys Ala Arg Ser Phe Gln Ala
245 250 255
&lt;210&gt; 187
&lt;211&gt; 742
&lt;212&gt; DNA
&lt;213&gt; 嗜热棒囊壳(Corynascus thermophilus)
&lt;400&gt; 187
atgctggcga caaccttcgc tctcctgacg gccgctctcg gcgtcagcgc ccattatacc 60
ctcccccggg tcgggtccgg ctccgagtgg cagcacgtgc gccgggctga caactggcaa 120
aacaacggct tcgtcgacaa cgtctactcg cagcagatcc gctgcttcca gtcgagcaat 180
gccggcgccc cggatgtcta caccgtccag gcgggctcga gcgtgaccta ctacgccaac 240
cccagcatct accaccccgg ccccatgcag ttctacctcg cccgcgttcc ggacggacag 300
gacgtcaagt cgtggaacgg cgacggcgct gtgtggttca aggtgtacga ggagcagcct 360
cagttcggct cccagcttac ctggcctagc aacggtgcgt cgaccatgct ctctcgtttg 420
gcccgttgcc aggtgctaac tgtccttccc gtccgcaggc aagaactcgt tccaggttcc 480
catccccagc tgcatccgcc cgggcaagta cctcctccgc gccgagcaca tcgccctgca 540
cgttgcccag agccagggcg gtgcccagtt ctacatctcg tgcgcccagc tcgacgtcac 600
tggcggcggc agcaccgagc cttcccagaa ggttgccttc ccgggtgcct actcgcccac 660
cgaccccggc attctcatca acatcaactg gcccatcccg acctcgtaca agaaccccgg 720
cccgccggtc ttccgctgct aa 742
&lt;210&gt; 188
&lt;211&gt; 225
&lt;212&gt; PRT
&lt;213&gt; 嗜热棒囊壳(Corynascus thermophilus)
&lt;400&gt; 188
Met Leu Ala Thr Thr Phe Ala Leu Leu Thr Ala Ala Leu Gly Val Ser
1 5 10 15
Ala His Tyr Thr Leu Pro Arg Val Gly Ser Gly Ser Glu Trp Gln His
20 25 30
Val Arg Arg Ala Asp Asn Trp Gln Asn Asn Gly Phe Val Asp Asn Val
35 40 45
Tyr Ser Gln Gln Ile Arg Cys Phe Gln Ser Ser Asn Ala Gly Ala Pro
50 55 60
Asp Val Tyr Thr Val Gln Ala Gly Ser Ser Val Thr Tyr Tyr Ala Asn
65 70 75 80
Pro Ser Ile Tyr His Pro Gly Pro Met Gln Phe Tyr Leu Ala Arg Val
85 90 95
Pro Asp Gly Gln Asp Val Lys Ser Trp Asn Gly Asp Gly Ala Val Trp
100 105 110
Phe Lys Val Tyr Glu Glu Gln Pro Gln Phe Gly Ser Gln Leu Thr Trp
115 120 125
Pro Ser Asn Gly Lys Asn Ser Phe Gln Val Pro Ile Pro Ser Cys Ile
130 135 140
Arg Pro Gly Lys Tyr Leu Leu Arg Ala Glu His Ile Ala Leu His Val
145 150 155 160
Ala Gln Ser Gln Gly Gly Ala Gln Phe Tyr Ile Ser Cys Ala Gln Leu
165 170 175
Asp Val Thr Gly Gly Gly Ser Thr Glu Pro Ser Gln Lys Val Ala Phe
180 185 190
Pro Gly Ala Tyr Ser Pro Thr Asp Pro Gly Ile Leu Ile Asn Ile Asn
195 200 205
Trp Pro Ile Pro Thr Ser Tyr Lys Asn Pro Gly Pro Pro Val Phe Arg
210 215 220
Cys
225
&lt;210&gt; 189
&lt;211&gt; 901
&lt;212&gt; DNA
&lt;213&gt; 嗜热棒囊壳(Corynascus thermophilus)
&lt;400&gt; 189
atgaaggttc tcgcgcccct ggttctggcc ggcgccgcca gcgcccacac catcttcacg 60
tcgctcgagg tgggcggcgt caaccatggc gtcggccagg gcgtccgcgt gccgtcgtac 120
aacggcccga tcgaggacgt gacgtccaac tcgatcgcct gcaacggccc ccccaacccg 180
acgacgccga cggacaaggt gatcacggtc caggccggcc agacggtgac ggccatctgg 240
cggtacatgc tcagcaccac cggctcggcc cccaacgacg tcatggacag cagccacaag 300
ggcccgacca tggcctacct caagaaggtc ggcaacgcca ccaccgactc gggcgtcggc 360
ggcggctggt tcaagatcca ggaggacggg ctgaacaacg gcgtctgggg cacggagcgc 420
gtcatcaacg gccagggccg ccacaacatc aagatccccg agtgcatcgc ccccggccag 480
tacctcctcc gcgccgagat gctcgccctg cacggagcct ccaactaccc cggcgcccag 540
ttctacatgg agtgcgctca gctcaacagt acgtttgtcc acgagagacg gaaaaacaaa 600
acagaagcaa ggggaggcgg ggcagatgtg atggctaaca ttgatgcttt cttcttcagt 660
cgtcggcggc agcggcagca agaccccgtc caccgtcagc ttcccgggtg cttacagcgt 720
acgttgttcc aaaaggcttt ttcttcgcgt ttttttttct ttgaactgat acagccccct 780
ctgtgacgac tactaacacg gccacaatca acagggcaac gaccccggtg tcaagatcaa 840
catctactgg cctcccgtca ccgaatacaa ggttcccggc cccagcgtct tcacttgcta 900
a 901
&lt;210&gt; 190
&lt;211&gt; 237
&lt;212&gt; PRT
&lt;213&gt; 嗜热棒囊壳(Corynascus thermophilus)
&lt;400&gt; 190
Met Lys Val Leu Ala Pro Leu Val Leu Ala Gly Ala Ala Ser Ala His
1 5 10 15
Thr Ile Phe Thr Ser Leu Glu Val Gly Gly Val Asn His Gly Val Gly
20 25 30
Gln Gly Val Arg Val Pro Ser Tyr Asn Gly Pro Ile Glu Asp Val Thr
35 40 45
Ser Asn Ser Ile Ala Cys Asn Gly Pro Pro Asn Pro Thr Thr Pro Thr
50 55 60
Asp Lys Val Ile Thr Val Gln Ala Gly Gln Thr Val Thr Ala Ile Trp
65 70 75 80
Arg Tyr Met Leu Ser Thr Thr Gly Ser Ala Pro Asn Asp Val Met Asp
85 90 95
Ser Ser His Lys Gly Pro Thr Met Ala Tyr Leu Lys Lys Val Gly Asn
100 105 110
Ala Thr Thr Asp Ser Gly Val Gly Gly Gly Trp Phe Lys Ile Gln Glu
115 120 125
Asp Gly Leu Asn Asn Gly Val Trp Gly Thr Glu Arg Val Ile Asn Gly
130 135 140
Gln Gly Arg His Asn Ile Lys Ile Pro Glu Cys Ile Ala Pro Gly Gln
145 150 155 160
Tyr Leu Leu Arg Ala Glu Met Leu Ala Leu His Gly Ala Ser Asn Tyr
165 170 175
Pro Gly Ala Gln Phe Tyr Met Glu Cys Ala Gln Leu Asn Ile Val Gly
180 185 190
Gly Ser Gly Ser Lys Thr Pro Ser Thr Val Ser Phe Pro Gly Ala Tyr
195 200 205
Ser Gly Asn Asp Pro Gly Val Lys Ile Asn Ile Tyr Trp Pro Pro Val
210 215 220
Thr Glu Tyr Lys Val Pro Gly Pro Ser Val Phe Thr Cys
225 230 235
&lt;210&gt; 191
&lt;211&gt; 944
&lt;212&gt; DNA
&lt;213&gt; 嗜热棒囊壳(Corynascus thermophilus)
&lt;400&gt; 191
atgaagctga gcgctgccat cgccgtgctc gcggccgccc ttgccgaggc gcactgtaag 60
ctggcttgcc ggtcctcccc cttctcaacg acgccgagct cgagcgcgtg ggactaatga 120
cgatgtgacg acgacatcaa gatacctttc ccagcatcgc caacacgccc gactggcagt 180
atgtgcgcat cacgaccaac taccagagca acggccccgt gacggacgtc aactcggacc 240
agatccgctg ctacgagcgc aacccgggca cgggcgcgcc cggcatctac aacgtcaccg 300
ccggcaccac catcaactac aacgccaagt cgtccatctc ccacccgggc cccatggcct 360
tctacatcgc caaggtcccc gccggccagt cggccgccac ctgggacggc aagggcgccg 420
tctggtccaa gatctaccag gagatgccgc actttggctc gagcctgacc tgggactcga 480
acggtatgat gagttctctc tctccttctc tctttgatgc tctccttgtg atgctaaacg 540
acgacccccg ccaggccgcg tctccatgcc cgtcaccatc ccccgctgtc tgcagaacgg 600
cgagtacctg ctgcgtgccg agcacattgc cctccacagc gccggcagcg tcggcggcgc 660
ccagttctac atctcgtgcg ctcagatctc gggtatgcat tatatacttc catattgtcc 720
acccactcac cccccatccc ccacgcttaa tagctcgagc agcggaacca tctgaagcta 780
acacgtcccc cccagtcacc ggcggcaccg gcacctggaa cccccgcaac aaggtgtcct 840
tccccggcgc ctacaaggcc accgacccgg gcatcctgat caacatctac tggcccatcc 900
cgaccagcta cacgcccgcc ggcccggccg tcgacacctg ctag 944
&lt;210&gt; 192
&lt;211&gt; 227
&lt;212&gt; PRT
&lt;213&gt; 嗜热棒囊壳(Corynascus thermophilus)
&lt;400&gt; 192
Met Lys Leu Ser Ala Ala Ile Ala Val Leu Ala Ala Ala Leu Ala Glu
1 5 10 15
Ala His Tyr Thr Phe Pro Ser Ile Ala Asn Thr Pro Asp Trp Gln Tyr
20 25 30
Val Arg Ile Thr Thr Asn Tyr Gln Ser Asn Gly Pro Val Thr Asp Val
35 40 45
Asn Ser Asp Gln Ile Arg Cys Tyr Glu Arg Asn Pro Gly Thr Gly Ala
50 55 60
Pro Gly Ile Tyr Asn Val Thr Ala Gly Thr Thr Ile Asn Tyr Asn Ala
65 70 75 80
Lys Ser Ser Ile Ser His Pro Gly Pro Met Ala Phe Tyr Ile Ala Lys
85 90 95
Val Pro Ala Gly Gln Ser Ala Ala Thr Trp Asp Gly Lys Gly Ala Val
100 105 110
Trp Ser Lys Ile Tyr Gln Glu Met Pro His Phe Gly Ser Ser Leu Thr
115 120 125
Trp Asp Ser Asn Gly Arg Val Ser Met Pro Val Thr Ile Pro Arg Cys
130 135 140
Leu Gln Asn Gly Glu Tyr Leu Leu Arg Ala Glu His Ile Ala Leu His
145 150 155 160
Ser Ala Gly Ser Val Gly Gly Ala Gln Phe Tyr Ile Ser Cys Ala Gln
165 170 175
Ile Ser Val Thr Gly Gly Thr Gly Thr Trp Asn Pro Arg Asn Lys Val
180 185 190
Ser Phe Pro Gly Ala Tyr Lys Ala Thr Asp Pro Gly Ile Leu Ile Asn
195 200 205
Ile Tyr Trp Pro Ile Pro Thr Ser Tyr Thr Pro Ala Gly Pro Ala Val
210 215 220
Asp Thr Cys
225
&lt;210&gt; 193
&lt;211&gt; 948
&lt;212&gt; DNA
&lt;213&gt; 嗜热棒囊壳(Corynascus thermophilus)
&lt;400&gt; 193
atgtcttcct tcacctccaa gggcctcctt tccgccctca tgggcgctgc cacggttgcc 60
gcccacggcc acgtcaccaa tatcgtcatc aacggcgtct cgtaccagaa ctacgatccg 120
ttcagccacc cttacatgcg gaaccccccg acggttgtcg gctggacggc gagcaacacg 180
gacaacggct tcgtcggccc cgagtccttc tctagcccgg acatcatctg ccacaagtcg 240
gccaccaacg ccggcggtca tgccgttgtt gccgccggcg acaagatttc catccagtgg 300
gacacctggc ccgagtcgca ccacggtccg gtcatcgact acctcgccga ctgcggcgac 360
gcgggctgcg agaaggtcga caagaccacg ctcgagttct tcaagatcag cgagaagggc 420
ctgatcgacg gcagcagcgc gcccggcagg tgggcgtccg acgagctgat cgccaacaac 480
aactcgtggc tggtccagat cccgcccgac atcgcccccg gcaactacgt cctgcgccac 540
gagatcatcg ccctgcacag cgccggccag cagaacggcg cgcagaacta cccccagtgc 600
gtcaacctgc acatcaccgg ctccggcacc cggaaaccct cgggcgtccc cggcaccgag 660
ctctaccggc cgaccgaccc cggcatcctg gccaacatct acacctcccc cgtcgcctac 720
cagatccccg gcccggccat catcccgggc gcctccgccg tcgagcagac cacctcggcc 780
atcaccgcct ccgccagcgc ggttcttccc ggcttcgcta ccgccgcgcc cccggctgcg 840
accaccacaa ccaccaccgc ctccgctacc agtgctcccc gcccgaccgg ctgtgccggt 900
ctgaggaagc gccgtcgcca cgcccgtgat gtcaaggttg ccctctag 948
&lt;210&gt; 194
&lt;211&gt; 315
&lt;212&gt; PRT
&lt;213&gt; 嗜热棒囊壳(Corynascus thermophilus)
&lt;400&gt; 194
Met Ser Ser Phe Thr Ser Lys Gly Leu Leu Ser Ala Leu Met Gly Ala
1 5 10 15
Ala Thr Val Ala Ala His Gly His Val Thr Asn Ile Val Ile Asn Gly
20 25 30
Val Ser Tyr Gln Asn Tyr Asp Pro Phe Ser His Pro Tyr Met Arg Asn
35 40 45
Pro Pro Thr Val Val Gly Trp Thr Ala Ser Asn Thr Asp Asn Gly Phe
50 55 60
Val Gly Pro Glu Ser Phe Ser Ser Pro Asp Ile Ile Cys His Lys Ser
65 70 75 80
Ala Thr Asn Ala Gly Gly His Ala Val Val Ala Ala Gly Asp Lys Ile
85 90 95
Ser Ile Gln Trp Asp Thr Trp Pro Glu Ser His His Gly Pro Val Ile
100 105 110
Asp Tyr Leu Ala Asp Cys Gly Asp Ala Gly Cys Glu Lys Val Asp Lys
115 120 125
Thr Thr Leu Glu Phe Phe Lys Ile Ser Glu Lys Gly Leu Ile Asp Gly
130 135 140
Ser Ser Ala Pro Gly Arg Trp Ala Ser Asp Glu Leu Ile Ala Asn Asn
145 150 155 160
Asn Ser Trp Leu Val Gln Ile Pro Pro Asp Ile Ala Pro Gly Asn Tyr
165 170 175
Val Leu Arg His Glu Ile Ile Ala Leu His Ser Ala Gly Gln Gln Asn
180 185 190
Gly Ala Gln Asn Tyr Pro Gln Cys Val Asn Leu His Ile Thr Gly Ser
195 200 205
Gly Thr Arg Lys Pro Ser Gly Val Pro Gly Thr Glu Leu Tyr Arg Pro
210 215 220
Thr Asp Pro Gly Ile Leu Ala Asn Ile Tyr Thr Ser Pro Val Ala Tyr
225 230 235 240
Gln Ile Pro Gly Pro Ala Ile Ile Pro Gly Ala Ser Ala Val Glu Gln
245 250 255
Thr Thr Ser Ala Ile Thr Ala Ser Ala Ser Ala Val Leu Pro Gly Phe
260 265 270
Ala Thr Ala Ala Pro Pro Ala Ala Thr Thr Thr Thr Thr Thr Ala Ser
275 280 285
Ala Thr Ser Ala Pro Arg Pro Thr Gly Cys Ala Gly Leu Arg Lys Arg
290 295 300
Arg Arg His Ala Arg Asp Val Lys Val Ala Leu
305 310 315
&lt;210&gt; 195
&lt;211&gt; 1380
&lt;212&gt; DNA
&lt;213&gt; 嗜热棒囊壳(Corynascus thermophilus)
&lt;400&gt; 195
atgcatcctc ccatctttgt tcttgggctt gcgagcctgc tttgccccct ctcgtctgca 60
cacactactt tcaccaccct cttcatcaat gatgtcaacc aaggtgacgg aacctgcatt 120
cgcatggcga aggagggcaa cgtcgctact catcctctcg cgggcggcct cgactctgaa 180
gacatggcct gtggtacgtt gacacgtcct tgaccccgcc gagactgtcc cgtgtatcta 240
aacttctcat caggccggga tggccaagaa cccgttgcat ttacctgccc ggccccagct 300
ggtgccaagt tgaccttcga gtttcgcatg tgggccgacg cttcgcagcc cggatcgatc 360
gacccgtccc atcttggcgc tatggccatc tacctcaaga aggtttctaa catgaaatct 420
gacgcggccg ctgggccggg ctggttcaag atttgggacc aaggctacga cacggaggcc 480
aagaagtggg ccaccgagaa tctcattgag aacaacggcc tgctgagcgt caaccttccc 540
tcgggcttgt cgaccggcta ctacctcgtc cgtcaggaga ccattacctt ccaaaacgtc 600
accaatgaca tgccagatcc ccagttctac gtcggttgcg cgcagctcta cgtcgaaggc 660
acctcggact cacccatccc cccagacaag accgtctcca ttcccggcca catcagcgac 720
ccggccgacc cgggcctgac ctttaacatc tacacggacg acgtgtccgc ctacaagccc 780
cccggcccgg aggtttactt ccccaccgcc atcacctcct ccggaagcag cgacgacagg 840
ggggccgcgc gccagcagac tcccgccgac aagcaggccg gagaaggcct cgttcccacc 900
gactgcgtcg tcaagaacgc aaactggtgc gccgccgccc tgccgcccta caccgacgag 960
gccggctgct gggccgccgt ggaggactgc aacaggcagc tggacgagtg ctacaccagc 1020
gcgcccccct cgggcagcag ggggtgcaag atctgggagg agcaggtatg catcgtcgtc 1080
tcgcggaagt gcgaggcccg ggatttccag cccctcccgc ggctgtggaa ggatctaaga 1140
gagggaattg atgagccgat cccgggtggg aagttgcctc cggcgctcaa cgcgggagag 1200
agcggggatc atggcggaag aggctgcggc caccatggtg gcgaggagga ggctggggct 1260
ggggcggcct ccactcctgc ttttgctgct ccccatgcgg ccaggattca caacccaaat 1320
ttcaagaggg gccggcgccg tgagtcgcgt tggcggcgac tggcatctgg tgagcaatag 1380
&lt;210&gt; 196
&lt;211&gt; 439
&lt;212&gt; PRT
&lt;213&gt; 嗜热棒囊壳(Corynascus thermophilus)
&lt;400&gt; 196
Met His Pro Pro Ile Phe Val Leu Gly Leu Ala Ser Leu Leu Cys Pro
1 5 10 15
Leu Ser Ser Ala His Thr Thr Phe Thr Thr Leu Phe Ile Asn Asp Val
20 25 30
Asn Gln Gly Asp Gly Thr Cys Ile Arg Met Ala Lys Glu Gly Asn Val
35 40 45
Ala Thr His Pro Leu Ala Gly Gly Leu Asp Ser Glu Asp Met Ala Cys
50 55 60
Gly Arg Asp Gly Gln Glu Pro Val Ala Phe Thr Cys Pro Ala Pro Ala
65 70 75 80
Gly Ala Lys Leu Thr Phe Glu Phe Arg Met Trp Ala Asp Ala Ser Gln
85 90 95
Pro Gly Ser Ile Asp Pro Ser His Leu Gly Ala Met Ala Ile Tyr Leu
100 105 110
Lys Lys Val Ser Asn Met Lys Ser Asp Ala Ala Ala Gly Pro Gly Trp
115 120 125
Phe Lys Ile Trp Asp Gln Gly Tyr Asp Thr Glu Ala Lys Lys Trp Ala
130 135 140
Thr Glu Asn Leu Ile Glu Asn Asn Gly Leu Leu Ser Val Asn Leu Pro
145 150 155 160
Ser Gly Leu Ser Thr Gly Tyr Tyr Leu Val Arg Gln Glu Thr Ile Thr
165 170 175
Phe Gln Asn Val Thr Asn Asp Met Pro Asp Pro Gln Phe Tyr Val Gly
180 185 190
Cys Ala Gln Leu Tyr Val Glu Gly Thr Ser Asp Ser Pro Ile Pro Pro
195 200 205
Asp Lys Thr Val Ser Ile Pro Gly His Ile Ser Asp Pro Ala Asp Pro
210 215 220
Gly Leu Thr Phe Asn Ile Tyr Thr Asp Asp Val Ser Ala Tyr Lys Pro
225 230 235 240
Pro Gly Pro Glu Val Tyr Phe Pro Thr Ala Ile Thr Ser Ser Gly Ser
245 250 255
Ser Asp Asp Arg Gly Ala Ala Arg Gln Gln Thr Pro Ala Asp Lys Gln
260 265 270
Ala Gly Glu Gly Leu Val Pro Thr Asp Cys Val Val Lys Asn Ala Asn
275 280 285
Trp Cys Ala Ala Ala Leu Pro Pro Tyr Thr Asp Glu Ala Gly Cys Trp
290 295 300
Ala Ala Val Glu Asp Cys Asn Arg Gln Leu Asp Glu Cys Tyr Thr Ser
305 310 315 320
Ala Pro Pro Ser Gly Ser Arg Gly Cys Lys Ile Trp Glu Glu Gln Val
325 330 335
Cys Ile Val Val Ser Arg Lys Cys Glu Ala Arg Asp Phe Gln Pro Leu
340 345 350
Pro Arg Leu Trp Lys Asp Leu Arg Glu Gly Ile Asp Glu Pro Ile Pro
355 360 365
Gly Gly Lys Leu Pro Pro Ala Leu Asn Ala Gly Glu Ser Gly Asp His
370 375 380
Gly Gly Arg Gly Cys Gly His His Gly Gly Glu Glu Glu Ala Gly Ala
385 390 395 400
Gly Ala Ala Ser Thr Pro Ala Phe Ala Ala Pro His Ala Ala Arg Ile
405 410 415
His Asn Pro Asn Phe Lys Arg Gly Arg Arg Arg Glu Ser Arg Trp Arg
420 425 430
Arg Leu Ala Ser Gly Glu Gln
435
&lt;210&gt; 197
&lt;211&gt; 821
&lt;212&gt; DNA
&lt;213&gt; 嗜热棒囊壳(Corynascus thermophilus)
&lt;400&gt; 197
atgaagctct ctctcttttc cgtcctggcc gctgccctca ccgtcgaggg gcatgccatc 60
ttccagaagg tctccgtcaa cggggcggac cagggctccc tcaccggcct ccgcgctccc 120
aacaacaaca acccggtgca ggatgtcagc agccaggaca tgatctgcgg ccagccggga 180
tcgacgtcga gcacggtcat cgaggtcaag gccggcgaca ggatcggcgc ctggtaccag 240
cacgtcatcg gcggtgccca gttccccggc gaccctgaca acccgatcgc cgcgtcgcac 300
aagggccccg tcatggccta cctcgccaag gttgacaatg ccgcaaccgc cgacaagacg 360
ggcctgcagt ggtatgtgtt cccgccgccc gagggacgtc agcttggggc aagtcgcgtc 420
tgaccgggct cgcttctttc tctctgtata ggttcaagat ctgggaggac acctttgatc 480
ccagcagcaa gacctggggt gtcgacaacc tcatcaacaa caacggctgg gtgtacttca 540
acatcccgca gtgcatcgcc gacggccact acctcctccg ggttgaggtc ctcgccctgc 600
actcggccta ccagaccggc ggggctcagt tctaccagtc ctgcgcccag atcagcgtgt 660
ccggcggcgg ctccttcacg ccgtcgtcga ctgtgagctt cccgggcgcc tacaacgcca 720
acgaccccgg catcacgatc aacatctacg gcgctaccgg tcagcccgac aacaacggcc 780
agccgtacac tgcccctggc cccgcgccca tctcctgctg a 821
&lt;210&gt; 198
&lt;211&gt; 246
&lt;212&gt; PRT
&lt;213&gt; 嗜热棒囊壳(Corynascus thermophilus)
&lt;400&gt; 198
Met Lys Leu Ser Leu Phe Ser Val Leu Ala Ala Ala Leu Thr Val Glu
1 5 10 15
Gly His Ala Ile Phe Gln Lys Val Ser Val Asn Gly Ala Asp Gln Gly
20 25 30
Ser Leu Thr Gly Leu Arg Ala Pro Asn Asn Asn Asn Pro Val Gln Asp
35 40 45
Val Ser Ser Gln Asp Met Ile Cys Gly Gln Pro Gly Ser Thr Ser Ser
50 55 60
Thr Val Ile Glu Val Lys Ala Gly Asp Arg Ile Gly Ala Trp Tyr Gln
65 70 75 80
His Val Ile Gly Gly Ala Gln Phe Pro Gly Asp Pro Asp Asn Pro Ile
85 90 95
Ala Ala Ser His Lys Gly Pro Val Met Ala Tyr Leu Ala Lys Val Asp
100 105 110
Asn Ala Ala Thr Ala Asp Lys Thr Gly Leu Gln Trp Phe Lys Ile Trp
115 120 125
Glu Asp Thr Phe Asp Pro Ser Ser Lys Thr Trp Gly Val Asp Asn Leu
130 135 140
Ile Asn Asn Asn Gly Trp Val Tyr Phe Asn Ile Pro Gln Cys Ile Ala
145 150 155 160
Asp Gly His Tyr Leu Leu Arg Val Glu Val Leu Ala Leu His Ser Ala
165 170 175
Tyr Gln Thr Gly Gly Ala Gln Phe Tyr Gln Ser Cys Ala Gln Ile Ser
180 185 190
Val Ser Gly Gly Gly Ser Phe Thr Pro Ser Ser Thr Val Ser Phe Pro
195 200 205
Gly Ala Tyr Asn Ala Asn Asp Pro Gly Ile Thr Ile Asn Ile Tyr Gly
210 215 220
Ala Thr Gly Gln Pro Asp Asn Asn Gly Gln Pro Tyr Thr Ala Pro Gly
225 230 235 240
Pro Ala Pro Ile Ser Cys
245
&lt;210&gt; 199
&lt;211&gt; 1125
&lt;212&gt; DNA
&lt;213&gt; 嗜热棒囊壳(Corynascus thermophilus)
&lt;400&gt; 199
atgaagtcct tcaccctcac cgccctggcc gccctggccg gcaacgccgc cgcccacgcg 60
accttccagg ccctctgggt cgacggcgtc gactacggct cgcagtgcgc ccgtcttccc 120
ggatccaact ccccgatcac cgacgtgagc tcgacggcca tccgctgcaa tgccaacgcc 180
ggccgcgccc agggcaagtg cccggtcaag gccggctcga ccgtgacgat cgagatgcac 240
caggtatgtt ccactaaaag gaggaaaaga aaaaaaacag agtggaacgg tcaggctgac 300
tgaggctctc tcgctacgat cagcaacccg gtgaccggtc gtgcggcagc gacgccatcg 360
gcggcgccca ccacggcccc gtcctcgtgt acatgtccaa ggtgtcggat gcggcgtcgg 420
ccgacggctc gtccggctgg ttcaaggtgt tcgaggacgg ctgggccaag aacccgtcgg 480
gcggctccgg cgacgacgac tactggggca ccaaggacct caacgcctgc tgcggcaaga 540
tgaacgtcaa gatcccgtcc gacctgccgt cgggcgacta cctgctccgt gccgaggcca 600
tcgccctgca cacggccggc ggctcgggcg gcgcccagtt ctacatcacc tgctaccagc 660
tcaccgtcga gggttccggc aacgccagcc cggccaccgt ctccttccct ggcgcctaca 720
aggcctccga cccgggcatc ctggtcaaca tccacgccgc catgtccggc tacaccgtgc 780
ccggcccgtc cgtctactcg ggcggcagca ccaagaaggc cggcagcggc tgctccggct 840
gcgaggccac ctgcgccgtc ggctctagcc ccagcgccac cgtcacctcg tcgcccggca 900
gccagcccac ctcccccggc ggcggcgacg gcggcggctg caccgtcccc aagtaccagc 960
agtgcggtgg ccagggctac agcggctgca ccaactgcga ggtgagttcc cctgcttact 1020
tgttgtcctc tgtacccctt ccatgttttc gatgctgact ttctgcgtta gtctggctct 1080
acttgcagcg ccgtctcgcc gccgtactac taccagtgcg tgtaa 1125
&lt;210&gt; 200
&lt;211&gt; 324
&lt;212&gt; PRT
&lt;213&gt; 嗜热棒囊壳(Corynascus thermophilus)
&lt;400&gt; 200
Met Lys Ser Phe Thr Leu Thr Ala Leu Ala Ala Leu Ala Gly Asn Ala
1 5 10 15
Ala Ala His Ala Thr Phe Gln Ala Leu Trp Val Asp Gly Val Asp Tyr
20 25 30
Gly Ser Gln Cys Ala Arg Leu Pro Gly Ser Asn Ser Pro Ile Thr Asp
35 40 45
Val Ser Ser Thr Ala Ile Arg Cys Asn Ala Asn Ala Gly Arg Ala Gln
50 55 60
Gly Lys Cys Pro Val Lys Ala Gly Ser Thr Val Thr Ile Glu Met His
65 70 75 80
Gln Gln Pro Gly Asp Arg Ser Cys Gly Ser Asp Ala Ile Gly Gly Ala
85 90 95
His His Gly Pro Val Leu Val Tyr Met Ser Lys Val Ser Asp Ala Ala
100 105 110
Ser Ala Asp Gly Ser Ser Gly Trp Phe Lys Val Phe Glu Asp Gly Trp
115 120 125
Ala Lys Asn Pro Ser Gly Gly Ser Gly Asp Asp Asp Tyr Trp Gly Thr
130 135 140
Lys Asp Leu Asn Ala Cys Cys Gly Lys Met Asn Val Lys Ile Pro Ser
145 150 155 160
Asp Leu Pro Ser Gly Asp Tyr Leu Leu Arg Ala Glu Ala Ile Ala Leu
165 170 175
His Thr Ala Gly Gly Ser Gly Gly Ala Gln Phe Tyr Ile Thr Cys Tyr
180 185 190
Gln Leu Thr Val Glu Gly Ser Gly Asn Ala Ser Pro Ala Thr Val Ser
195 200 205
Phe Pro Gly Ala Tyr Lys Ala Ser Asp Pro Gly Ile Leu Val Asn Ile
210 215 220
His Ala Ala Met Ser Gly Tyr Thr Val Pro Gly Pro Ser Val Tyr Ser
225 230 235 240
Gly Gly Ser Thr Lys Lys Ala Gly Ser Gly Cys Ser Gly Cys Glu Ala
245 250 255
Thr Cys Ala Val Gly Ser Ser Pro Ser Ala Thr Val Thr Ser Ser Pro
260 265 270
Gly Ser Gln Pro Thr Ser Pro Gly Gly Gly Asp Gly Gly Gly Cys Thr
275 280 285
Val Pro Lys Tyr Gln Gln Cys Gly Gly Gln Gly Tyr Ser Gly Cys Thr
290 295 300
Asn Cys Glu Ser Gly Ser Thr Cys Ser Ala Val Ser Pro Pro Tyr Tyr
305 310 315 320
Tyr Gln Cys Val
&lt;210&gt; 201
&lt;211&gt; 1037
&lt;212&gt; DNA
&lt;213&gt; 嗜热棒囊壳(Corynascus thermophilus)
&lt;400&gt; 201
atgaagtcgt tcacctcagc cttgttcgcc gctgggctcc ttgctcagca tgccgcagcc 60
cactccatct tccagcaggc aagcagcggc tcgatcgact tcgacacgct gtgcacccgg 120
atgccggtca gtcccgaggg cccttgggtg atggatcatc tgcccataga cttgttaccg 180
acgagctgac gggttctcgt tattaatagc ccaacaatag ccctgtcact agcgtgacca 240
gcggcgacat gacctgcaac gtcggcggca ccaacggagt gtcgggcttc tgcgaggtga 300
acggtatggt ttcccgagtt ttcgaccagt ccccccgttt gatttttacc gccgcctgac 360
acgtgggctt cttgcttcgc tccttcggct agccggcgac gagtttacgg ttgagatgca 420
cgcgcagccc ggcgaccgct cgtgcgacaa cgaggccatc ggcgggaacc acttcggccc 480
ggtcctcatc tacatgagca aggtcgacga cgcctcgact gccgacgggt ccggcgactg 540
gttcaaggtg gacgagttcg gctacgaccc gagcaccaag acctggggca ccgacaagct 600
caacgagaac tgcggcaagc gcactttcaa gatcccccgc aacatccctg cgggcgacta 660
tctcgtccgg gccgaggcca tcgcgctgca cactgccagc cagccgggcg gcgcgcagtt 720
ctacatgagc tgctatgtaa gtttctagag tctctctctc tctctcgctt tctctctctc 780
gctcgccccg tctctccatt tgtcttcgtt cttccttttc ccttccttca aatgatgtct 840
ccccgctaac tttctctctc cccacaactt agcaagtccg gatttccggc ggcaacggag 900
gccagctgcc tgccggagtc aagatcccgg gcgcgtacag tgccaacgac cccggtatcc 960
tcatcgacat ctggggcaac gacttcaacg agtacatcat cccgggcccg cccgttatcg 1020
acagcagcta cttctaa 1037
&lt;210&gt; 202
&lt;211&gt; 242
&lt;212&gt; PRT
&lt;213&gt; 嗜热棒囊壳(Corynascus thermophilus)
&lt;400&gt; 202
Met Lys Ser Phe Thr Ser Ala Leu Phe Ala Ala Gly Leu Leu Ala Gln
1 5 10 15
His Ala Ala Ala His Ser Ile Phe Gln Gln Ala Ser Ser Gly Ser Ile
20 25 30
Asp Phe Asp Thr Leu Cys Thr Arg Met Pro Pro Asn Asn Ser Pro Val
35 40 45
Thr Ser Val Thr Ser Gly Asp Met Thr Cys Asn Val Gly Gly Thr Asn
50 55 60
Gly Val Ser Gly Phe Cys Glu Val Asn Ala Gly Asp Glu Phe Thr Val
65 70 75 80
Glu Met His Ala Gln Pro Gly Asp Arg Ser Cys Asp Asn Glu Ala Ile
85 90 95
Gly Gly Asn His Phe Gly Pro Val Leu Ile Tyr Met Ser Lys Val Asp
100 105 110
Asp Ala Ser Thr Ala Asp Gly Ser Gly Asp Trp Phe Lys Val Asp Glu
115 120 125
Phe Gly Tyr Asp Pro Ser Thr Lys Thr Trp Gly Thr Asp Lys Leu Asn
130 135 140
Glu Asn Cys Gly Lys Arg Thr Phe Lys Ile Pro Arg Asn Ile Pro Ala
145 150 155 160
Gly Asp Tyr Leu Val Arg Ala Glu Ala Ile Ala Leu His Thr Ala Ser
165 170 175
Gln Pro Gly Gly Ala Gln Phe Tyr Met Ser Cys Tyr Gln Val Arg Ile
180 185 190
Ser Gly Gly Asn Gly Gly Gln Leu Pro Ala Gly Val Lys Ile Pro Gly
195 200 205
Ala Tyr Ser Ala Asn Asp Pro Gly Ile Leu Ile Asp Ile Trp Gly Asn
210 215 220
Asp Phe Asn Glu Tyr Ile Ile Pro Gly Pro Pro Val Ile Asp Ser Ser
225 230 235 240
Tyr Phe
&lt;210&gt; 203
&lt;211&gt; 1200
&lt;212&gt; DNA
&lt;213&gt; 嗜热棒囊壳(Corynascus thermophilus)
&lt;400&gt; 203
atgaaggcct ttagcctcgt cgccctggcg acggccgtga gcggccatac catcttccag 60
cgggtgtcgg tcaacgggca agaccagggc cagctcaagg gcgtgcgggc gccgtcgagc 120
aacttcccga tccagaacgt caacgattcc aacttcgcct gcaacgcaaa catcgtgtac 180
aaggacgaca ccatcatcaa gatccccgcg ggagcccgcg tgggttcgtg gtggcagcac 240
gtcatcggcg gcccgcaggg ctccaacgac ccggacaacc cgatcgccgc ctcccacaag 300
ggtatgctga gatggcgaac caacccgcgc cccctttccc cccctcaacc tcccggaaca 360
cgcgtagctg acgggcaaat ccaggcccca tccaggtcta cctggccaag gttgacaacg 420
cggcgacagc gtcgcccacg ggcctcaggt ggttcaaggt tgccgagcgc gggctgaaca 480
acggcgtgtg ggcggtcgac gagctcatcg ccaacaacgg ctggcactac ttcgacctgc 540
cgtcgtgcgt ggcccccggc cagtacctga tgcgcgtcga gctgctcgcc ctgcacagcg 600
cctcgagccc cggcggcgcc cagttctaca tgggctgcgc ccagatcgaa ggtgggtgca 660
attctcgttc tgcttccccg tcccttccgg ccctttcttt ctctctctcc ccttgtgctt 720
tcttcgctcc ttgacgaacc cgaggaaaga gggaagagga aagaggaaag agggaggaaa 780
cggggcggag agacagacgg gatcgaatga gagagacaag acaagatcgg ctgacgagga 840
caaccagtca ccggctcggg cacccacacg ggctccgact tcgtctcgtt cccgggcgcc 900
tactcggcca acgacccggg catcctgctg agcatctacg actcctcggg caagcccacc 960
aacggcgggc gggcgtacca gatccccggc ccgcgcccca tctcgtgctc gggcggcagc 1020
aacggcggcg gtgacaacgg cggcggcgac aacggcggcg gcaacaacgg cggcggcaac 1080
agcggcggca ccgtccccct ctacggccag tgcggcggca acggatacac cggcccgacc 1140
acctgcgccg agggaacctg caaggtgtcg aacgagtggt acagccagtg cctcccctag 1200
&lt;210&gt; 204
&lt;211&gt; 306
&lt;212&gt; PRT
&lt;213&gt; 嗜热棒囊壳(Corynascus thermophilus)
&lt;400&gt; 204
Met Lys Ala Phe Ser Leu Val Ala Leu Ala Thr Ala Val Ser Gly His
1 5 10 15
Thr Ile Phe Gln Arg Val Ser Val Asn Gly Gln Asp Gln Gly Gln Leu
20 25 30
Lys Gly Val Arg Ala Pro Ser Ser Asn Phe Pro Ile Gln Asn Val Asn
35 40 45
Asp Ser Asn Phe Ala Cys Asn Ala Asn Ile Val Tyr Lys Asp Asp Thr
50 55 60
Ile Ile Lys Ile Pro Ala Gly Ala Arg Val Gly Ser Trp Trp Gln His
65 70 75 80
Val Ile Gly Gly Pro Gln Gly Ser Asn Asp Pro Asp Asn Pro Ile Ala
85 90 95
Ala Ser His Lys Gly Pro Ile Gln Val Tyr Leu Ala Lys Val Asp Asn
100 105 110
Ala Ala Thr Ala Ser Pro Thr Gly Leu Arg Trp Phe Lys Val Ala Glu
115 120 125
Arg Gly Leu Asn Asn Gly Val Trp Ala Val Asp Glu Leu Ile Ala Asn
130 135 140
Asn Gly Trp His Tyr Phe Asp Leu Pro Ser Cys Val Ala Pro Gly Gln
145 150 155 160
Tyr Leu Met Arg Val Glu Leu Leu Ala Leu His Ser Ala Ser Ser Pro
165 170 175
Gly Gly Ala Gln Phe Tyr Met Gly Cys Ala Gln Ile Glu Val Thr Gly
180 185 190
Ser Gly Thr His Thr Gly Ser Asp Phe Val Ser Phe Pro Gly Ala Tyr
195 200 205
Ser Ala Asn Asp Pro Gly Ile Leu Leu Ser Ile Tyr Asp Ser Ser Gly
210 215 220
Lys Pro Thr Asn Gly Gly Arg Ala Tyr Gln Ile Pro Gly Pro Arg Pro
225 230 235 240
Ile Ser Cys Ser Gly Gly Ser Asn Gly Gly Gly Asp Asn Gly Gly Gly
245 250 255
Asp Asn Gly Gly Gly Asn Asn Gly Gly Gly Asn Ser Gly Gly Thr Val
260 265 270
Pro Leu Tyr Gly Gln Cys Gly Gly Asn Gly Tyr Thr Gly Pro Thr Thr
275 280 285
Cys Ala Glu Gly Thr Cys Lys Val Ser Asn Glu Trp Tyr Ser Gln Cys
290 295 300
Leu Pro
305
&lt;210&gt; 205
&lt;211&gt; 759
&lt;212&gt; DNA
&lt;213&gt; 梭孢端梗霉(Acrophialophora fusispora)
&lt;400&gt; 205
atgcgcatag aagctatcac aggcctcgtg ctggcctcgg ccggtgcagt gtctgcccat 60
ggctgggtcg atgtctgggc tattggcggc aagaactaca caggcttcaa ccccacggtg 120
gcgccatggg tcccggatca gggcaccatt gcgtggccgg cctggaacac cgacacagga 180
ccggtgtaca gcaaggacgt caacaccaca gacatcatct gctcaatcaa tgccaccaac 240
gccaagatct actccgaccc catcgccgct gggaacgtca tcaacctgca ctggacggtg 300
tggccagact cacaccacgg gcccatcctg tcgtacctgg ccgcgtgcaa cggcgactgc 360
gccaaggccg acaagaccaa gctcaagtgg ttcaagattg cccatgccgg tcaaatcagc 420
ctgggcaccg gcggcggcca ggttggctac tgggccagcg acaagctgca agacgacaac 480
ggcacctggc ccgtcaccat tccggcctcc atcaagcccg gcaattacgt gctgcggaac 540
gagattattg ccctccattc ggcgtacgac gtcggcgccg cccagctcta cccgcagtgc 600
gttaatatca agatcacggg caacggccgc gtcacccctg ccggcgtggt gggaaccaag 660
ctctacaagg agaccgatcc tggcctgcat tataacatct ataacgacga gtctaagcct 720
gtctatcaga tccccggccc ggccttgtgt aagtgctaa 759
&lt;210&gt; 206
&lt;211&gt; 252
&lt;212&gt; PRT
&lt;213&gt; 梭孢端梗霉(Acrophialophora fusispora)
&lt;400&gt; 206
Met Arg Ile Glu Ala Ile Thr Gly Leu Val Leu Ala Ser Ala Gly Ala
1 5 10 15
Val Ser Ala His Gly Trp Val Asp Val Trp Ala Ile Gly Gly Lys Asn
20 25 30
Tyr Thr Gly Phe Asn Pro Thr Val Ala Pro Trp Val Pro Asp Gln Gly
35 40 45
Thr Ile Ala Trp Pro Ala Trp Asn Thr Asp Thr Gly Pro Val Tyr Ser
50 55 60
Lys Asp Val Asn Thr Thr Asp Ile Ile Cys Ser Ile Asn Ala Thr Asn
65 70 75 80
Ala Lys Ile Tyr Ser Asp Pro Ile Ala Ala Gly Asn Val Ile Asn Leu
85 90 95
His Trp Thr Val Trp Pro Asp Ser His His Gly Pro Ile Leu Ser Tyr
100 105 110
Leu Ala Ala Cys Asn Gly Asp Cys Ala Lys Ala Asp Lys Thr Lys Leu
115 120 125
Lys Trp Phe Lys Ile Ala His Ala Gly Gln Ile Ser Leu Gly Thr Gly
130 135 140
Gly Gly Gln Val Gly Tyr Trp Ala Ser Asp Lys Leu Gln Asp Asp Asn
145 150 155 160
Gly Thr Trp Pro Val Thr Ile Pro Ala Ser Ile Lys Pro Gly Asn Tyr
165 170 175
Val Leu Arg Asn Glu Ile Ile Ala Leu His Ser Ala Tyr Asp Val Gly
180 185 190
Ala Ala Gln Leu Tyr Pro Gln Cys Val Asn Ile Lys Ile Thr Gly Asn
195 200 205
Gly Arg Val Thr Pro Ala Gly Val Val Gly Thr Lys Leu Tyr Lys Glu
210 215 220
Thr Asp Pro Gly Leu His Tyr Asn Ile Tyr Asn Asp Glu Ser Lys Pro
225 230 235 240
Val Tyr Gln Ile Pro Gly Pro Ala Leu Cys Lys Cys
245 250
&lt;210&gt; 207
&lt;211&gt; 1035
&lt;212&gt; DNA
&lt;213&gt; 瘤孢棒囊壳(Corynascus sepedonium)
&lt;400&gt; 207
atgtctaaga cttctgctct ccttgctggc ctaacgggcg cggccctcgt cgctgcccac 60
gggcacgtca gccatatcat tgtcaacggt gtctactatg agaactacga ccccacgaca 120
cactggtacc agcccaaccc accaacagtc atcggctgga cggcagccca gcaggacaac 180
ggcttcatcg agcccaacaa ctttggcacg tcggacatca tctgccacaa gagcggttct 240
ccaggcggcg gtcacgctac cgtcgctgcg ggcgacaaga tcaacatcgt ctggactccg 300
gagtggcccg actcccatat cggcccggtc attgactacc tggctgcctg caacggtgac 360
tgcgagaccg taaacaagga gtcgctgcgc ttctttaaga ttgacggggc cggctatgac 420
aaggccgctg gccgctgggc cgccgagact ctgcgccaga acggcaacag ctggctcgtc 480
cagatcccgt ctgaccttaa ggctggcaac tacgtgctcc gccacgaaat catcgccctc 540
cacggcgctg gaagcgccaa cggtgctcaa gcctacccgc agtgcatcaa ccttcgcgtg 600
acgggcggcg gcagcagcgt gcccagcggc gtggccggca cctcgctcta caaagcctcc 660
gacgcaggca tcctcttcaa cccctacgtc gcctctcccg attacccggt cccaggcccg 720
gcgctcattg ctggtgccgc cagctctatc gtacagagca cgtcggcagt gaccgctacc 780
gcctcggcca ccgctcccgg tggcggcggc gccaacccca accctacgcc caccaccacc 840
tcctcgagca atcccgcccc aagcaccacc ctcaggacaa ccacctcggc cgcgcaaacc 900
acgcccccgc ctaccaatgg caacgtccag acaaagtacg gtcagtgtgg tggtagggac 960
tggagcggcc caacggcgtg cgcggctggt tccagctgct cggtgctcaa cgactggtac 1020
tcccagtgcg tgtaa 1035
&lt;210&gt; 208
&lt;211&gt; 344
&lt;212&gt; PRT
&lt;213&gt; 瘤孢棒囊壳(Corynascus sepedonium)
&lt;400&gt; 208
Met Ser Lys Thr Ser Ala Leu Leu Ala Gly Leu Thr Gly Ala Ala Leu
1 5 10 15
Val Ala Ala His Gly His Val Ser His Ile Ile Val Asn Gly Val Tyr
20 25 30
Tyr Glu Asn Tyr Asp Pro Thr Thr His Trp Tyr Gln Pro Asn Pro Pro
35 40 45
Thr Val Ile Gly Trp Thr Ala Ala Gln Gln Asp Asn Gly Phe Ile Glu
50 55 60
Pro Asn Asn Phe Gly Thr Ser Asp Ile Ile Cys His Lys Ser Gly Ser
65 70 75 80
Pro Gly Gly Gly His Ala Thr Val Ala Ala Gly Asp Lys Ile Asn Ile
85 90 95
Val Trp Thr Pro Glu Trp Pro Asp Ser His Ile Gly Pro Val Ile Asp
100 105 110
Tyr Leu Ala Ala Cys Asn Gly Asp Cys Glu Thr Val Asn Lys Glu Ser
115 120 125
Leu Arg Phe Phe Lys Ile Asp Gly Ala Gly Tyr Asp Lys Ala Ala Gly
130 135 140
Arg Trp Ala Ala Glu Thr Leu Arg Gln Asn Gly Asn Ser Trp Leu Val
145 150 155 160
Gln Ile Pro Ser Asp Leu Lys Ala Gly Asn Tyr Val Leu Arg His Glu
165 170 175
Ile Ile Ala Leu His Gly Ala Gly Ser Ala Asn Gly Ala Gln Ala Tyr
180 185 190
Pro Gln Cys Ile Asn Leu Arg Val Thr Gly Gly Gly Ser Ser Val Pro
195 200 205
Ser Gly Val Ala Gly Thr Ser Leu Tyr Lys Ala Ser Asp Ala Gly Ile
210 215 220
Leu Phe Asn Pro Tyr Val Ala Ser Pro Asp Tyr Pro Val Pro Gly Pro
225 230 235 240
Ala Leu Ile Ala Gly Ala Ala Ser Ser Ile Val Gln Ser Thr Ser Ala
245 250 255
Val Thr Ala Thr Ala Ser Ala Thr Ala Pro Gly Gly Gly Gly Ala Asn
260 265 270
Pro Asn Pro Thr Pro Thr Thr Thr Ser Ser Ser Asn Pro Ala Pro Ser
275 280 285
Thr Thr Leu Arg Thr Thr Thr Ser Ala Ala Gln Thr Thr Pro Pro Pro
290 295 300
Thr Asn Gly Asn Val Gln Thr Lys Tyr Gly Gln Cys Gly Gly Arg Asp
305 310 315 320
Trp Ser Gly Pro Thr Ala Cys Ala Ala Gly Ser Ser Cys Ser Val Leu
325 330 335
Asn Asp Trp Tyr Ser Gln Cys Val
340
&lt;210&gt; 209
&lt;211&gt; 1044
&lt;212&gt; DNA
&lt;213&gt; 瘤孢棒囊壳(Corynascus sepedonium)
&lt;400&gt; 209
atgccttctt ctacctccaa gggtcttttc tccgccctca tgggcgcggc gtcggttgcc 60
gcccatggtc atgtcaccaa cattgtcatc aacggtgtgt cgtaccagaa ctacgacccg 120
accagcttcc cttacatgca gaacccgccg acggttgttg gctggacggc aagcaacact 180
gataacggct tcgtcgctcc tgatgcgttt gctagcggcg acatcatctg ccacagggac 240
gccaccaatg ctggtggtca tgccgtcgtt gctgctggtg acaaggtctt catccagtgg 300
gatacctggc ctgagtcgca ccatggcccc gtccttgatt acctcgccag ctgcggtgac 360
gccggctgcg aaacggtcga caagaacact ctcgagttct tcaagatcgg cgaggctggc 420
ctgatcgacg gcagcagtgc tcccggcaag tgggcgtcgg accagctgat tgagaacaat 480
aactcgtgga tggttcagat ccctgccaac cttgcgcccg gaaactatgt gctgcggcat 540
gagattattg ctttgcacag cgctgggcaa gctaacggtg cccaaaacta cccccagtgc 600
ttcaacctgc aagttaccgg ctccggcacg gacaagcctg ccggtgtgct cggcaccgag 660
ctctacactc ccaccgacgc cggcatcttg gccaacatct acacctcgcc tgttcagtac 720
gagattcctg gcccggctct gatctcgggc gcttcggccg ttgaacagtc ctcctcggct 780
atcaccgcct ccgccagcgc tgagaccggc tccgccacag caccccctgc cggctctgcc 840
acggccgccc ccaccactac cactaccacg gctggctcgg atgctagcgc tacgccctcg 900
tcctcgtcca gctctggtgc gagcaccacc gccgagccca ccccttcggc tactactacc 960
gccggcggca gcaccccgcg cccgacccgg tgccctggcc tgaagcgccg ccgccacgcc 1020
cgtgatgtca agctcgccct ctaa 1044
&lt;210&gt; 210
&lt;211&gt; 347
&lt;212&gt; PRT
&lt;213&gt; 瘤孢棒囊壳(Corynascus sepedonium)
&lt;400&gt; 210
Met Pro Ser Ser Thr Ser Lys Gly Leu Phe Ser Ala Leu Met Gly Ala
1 5 10 15
Ala Ser Val Ala Ala His Gly His Val Thr Asn Ile Val Ile Asn Gly
20 25 30
Val Ser Tyr Gln Asn Tyr Asp Pro Thr Ser Phe Pro Tyr Met Gln Asn
35 40 45
Pro Pro Thr Val Val Gly Trp Thr Ala Ser Asn Thr Asp Asn Gly Phe
50 55 60
Val Ala Pro Asp Ala Phe Ala Ser Gly Asp Ile Ile Cys His Arg Asp
65 70 75 80
Ala Thr Asn Ala Gly Gly His Ala Val Val Ala Ala Gly Asp Lys Val
85 90 95
Phe Ile Gln Trp Asp Thr Trp Pro Glu Ser His His Gly Pro Val Leu
100 105 110
Asp Tyr Leu Ala Ser Cys Gly Asp Ala Gly Cys Glu Thr Val Asp Lys
115 120 125
Asn Thr Leu Glu Phe Phe Lys Ile Gly Glu Ala Gly Leu Ile Asp Gly
130 135 140
Ser Ser Ala Pro Gly Lys Trp Ala Ser Asp Gln Leu Ile Glu Asn Asn
145 150 155 160
Asn Ser Trp Met Val Gln Ile Pro Ala Asn Leu Ala Pro Gly Asn Tyr
165 170 175
Val Leu Arg His Glu Ile Ile Ala Leu His Ser Ala Gly Gln Ala Asn
180 185 190
Gly Ala Gln Asn Tyr Pro Gln Cys Phe Asn Leu Gln Val Thr Gly Ser
195 200 205
Gly Thr Asp Lys Pro Ala Gly Val Leu Gly Thr Glu Leu Tyr Thr Pro
210 215 220
Thr Asp Ala Gly Ile Leu Ala Asn Ile Tyr Thr Ser Pro Val Gln Tyr
225 230 235 240
Glu Ile Pro Gly Pro Ala Leu Ile Ser Gly Ala Ser Ala Val Glu Gln
245 250 255
Ser Ser Ser Ala Ile Thr Ala Ser Ala Ser Ala Glu Thr Gly Ser Ala
260 265 270
Thr Ala Pro Pro Ala Gly Ser Ala Thr Ala Ala Pro Thr Thr Thr Thr
275 280 285
Thr Thr Ala Gly Ser Asp Ala Ser Ala Thr Pro Ser Ser Ser Ser Ser
290 295 300
Ser Gly Ala Ser Thr Thr Ala Glu Pro Thr Pro Ser Ala Thr Thr Thr
305 310 315 320
Ala Gly Gly Ser Thr Pro Arg Pro Thr Arg Cys Pro Gly Leu Lys Arg
325 330 335
Arg Arg His Ala Arg Asp Val Lys Leu Ala Leu
340 345
&lt;210&gt; 211
&lt;211&gt; 1005
&lt;212&gt; DNA
&lt;213&gt; 樟绒枝霉(Malbranchea cinnamomea)
&lt;400&gt; 211
atgtcaccct ccttcaagtc cactgccatc ctcggagccg ttgctctggc cgcccgcgtg 60
cgcgcccacg gctacgtgtc tggaatcgtc gttgacggtg cttaccatgg cggttacatc 120
gtcgacaagt acccctacat gcccaaccca cccgatgtgg tcggctggtc gactacggcc 180
acggacctgg gcttcgtcgc ccctgacgcc tttggcgacc cggacatcat ctgccaccgg 240
gacggtgccc ccggtgccat ccacgccaaa gtcaacgccg gtgccaccat cgagctgcag 300
tggaacacct ggcccgaaag ccaccacggg cccgtcatcg actacctggc taactgcaac 360
ggtgactgct cgtccgtcga caagacctcg ctcaagttct tcaagatcag cgaggccggc 420
ctaaacgacg gctccaacgc ccccggccag tgggcgtccg acgatctcat tgccaacaac 480
aacagctgga ctgtgaccat ccccaagtcg atcgccccgg gcaactacgt gctgcgccac 540
gagatcatcg ccctgcacag cgccggcaac cagaatggcg cgcagaacta cccccagtgc 600
ttcaacctcg agatcaccag caacggcagc gacaacccgg agggcgtgct gggaaccgag 660
ctgtacaagg ccgacgaccc gggcattctg ttcaacatct accagcccat ggactcgtac 720
ccgattcccg gccctgctct ctacaccggc ggctcttctc cctcccctaa tccgcccacc 780
tctacccagt cgcctgtgcc ccagcccacc cagtctcccc catcgggcag caaccccggc 840
aacggcaacg gcgacgacga caacgacaac ggcaacgaga ccccatcccc gtctctcccc 900
gtcgagatcc ctgacgacct gacctcgcgc gagctactcc ttgtggccca ggagatcatt 960
gcccgtctgc ttgagctgca gaatcagctg gtcgtctcga actaa 1005
&lt;210&gt; 212
&lt;211&gt; 334
&lt;212&gt; PRT
&lt;213&gt; 樟绒枝霉(Malbranchea cinnamomea)
&lt;400&gt; 212
Met Ser Pro Ser Phe Lys Ser Thr Ala Ile Leu Gly Ala Val Ala Leu
1 5 10 15
Ala Ala Arg Val Arg Ala His Gly Tyr Val Ser Gly Ile Val Val Asp
20 25 30
Gly Ala Tyr His Gly Gly Tyr Ile Val Asp Lys Tyr Pro Tyr Met Pro
35 40 45
Asn Pro Pro Asp Val Val Gly Trp Ser Thr Thr Ala Thr Asp Leu Gly
50 55 60
Phe Val Ala Pro Asp Ala Phe Gly Asp Pro Asp Ile Ile Cys His Arg
65 70 75 80
Asp Gly Ala Pro Gly Ala Ile His Ala Lys Val Asn Ala Gly Ala Thr
85 90 95
Ile Glu Leu Gln Trp Asn Thr Trp Pro Glu Ser His His Gly Pro Val
100 105 110
Ile Asp Tyr Leu Ala Asn Cys Asn Gly Asp Cys Ser Ser Val Asp Lys
115 120 125
Thr Ser Leu Lys Phe Phe Lys Ile Ser Glu Ala Gly Leu Asn Asp Gly
130 135 140
Ser Asn Ala Pro Gly Gln Trp Ala Ser Asp Asp Leu Ile Ala Asn Asn
145 150 155 160
Asn Ser Trp Thr Val Thr Ile Pro Lys Ser Ile Ala Pro Gly Asn Tyr
165 170 175
Val Leu Arg His Glu Ile Ile Ala Leu His Ser Ala Gly Asn Gln Asn
180 185 190
Gly Ala Gln Asn Tyr Pro Gln Cys Phe Asn Leu Glu Ile Thr Ser Asn
195 200 205
Gly Ser Asp Asn Pro Glu Gly Val Leu Gly Thr Glu Leu Tyr Lys Ala
210 215 220
Asp Asp Pro Gly Ile Leu Phe Asn Ile Tyr Gln Pro Met Asp Ser Tyr
225 230 235 240
Pro Ile Pro Gly Pro Ala Leu Tyr Thr Gly Gly Ser Ser Pro Ser Pro
245 250 255
Asn Pro Pro Thr Ser Thr Gln Ser Pro Val Pro Gln Pro Thr Gln Ser
260 265 270
Pro Pro Ser Gly Ser Asn Pro Gly Asn Gly Asn Gly Asp Asp Asp Asn
275 280 285
Asp Asn Gly Asn Glu Thr Pro Ser Pro Ser Leu Pro Val Glu Ile Pro
290 295 300
Asp Asp Leu Thr Ser Arg Glu Leu Leu Leu Val Ala Gln Glu Ile Ile
305 310 315 320
Ala Arg Leu Leu Glu Leu Gln Asn Gln Leu Val Val Ser Asn
325 330
&lt;210&gt; 213
&lt;211&gt; 1101
&lt;212&gt; DNA
&lt;213&gt; Talaromyces leycettanus
&lt;400&gt; 213
atgcatcaac acttccgata cactgcgctc ctgacagcgt tgctgtcagc atcaacccga 60
gtcgcatccc acggccatgt cagcaacatt gtcattaatg gcgttcccta tcaaggatgg 120
gatatcgatt ccatgcccta cgagtcagac ccaccagtgg ttgtcgcctg ggagacacct 180
aacacgtcaa acggtttcat taccccggat cagtacggta cgagtgatat tatctgccat 240
ctgaacgcaa ccaacgcaaa gggccatgcc gtcgttgctg ccggagacaa gatcagcatt 300
caatggactg cctggcccag ctcccaccac ggccctgtca tcagctacct ggccaactgt 360
ggcgccagct gtgagacagt cgacaaaacg acgttgcaat tctttaagat cgacaacatc 420
ggtttcatag atgactcttc ccccccaggc atctgggcag ccgatcaatt ggaagcaaac 480
aacaacacct ggctcgtgga gatccccccg accatcgctc caggatacta cgtcctgcgc 540
aacgagatca tcgccctaca cggtgcagag aatcaggatg gcgcccagaa ctatccgcag 600
tgcttcaatc tgcaggtcac cggctcgggt accgataaac ccgccggcgt tcttggaact 660
cagctctatt ctcccactga cccgggcatt ctcgtgaaca tttacacgag cctttcgacc 720
tacatcgtcc ccggtccaac cccgtacagt ggttgggtgt ccgtcgtgca gtctagctct 780
gctatcaccg cttctggaac cccggtgacg ggcactggcg gagttagccc aaccacggct 840
gctactacga cttcttcttc tcactccacg acttctacta ctaccgggcc cactgtaacc 900
tcgactagcc acactactac cactactact cctactaccc tcagaaccac gactacaact 960
gcagctggtg gtggtgcgac acagaccgtc tacggccaat gcggcggtag tggttggact 1020
ggcgcaactg cctgcgcagc cggagctact tgcagcactc tgaatcccta ctatgcccaa 1080
tgccttccta ctggtgcttg a 1101
&lt;210&gt; 214
&lt;211&gt; 366
&lt;212&gt; PRT
&lt;213&gt; Talaromyces leycettanus
&lt;400&gt; 214
Met His Gln His Phe Arg Tyr Thr Ala Leu Leu Thr Ala Leu Leu Ser
1 5 10 15
Ala Ser Thr Arg Val Ala Ser His Gly His Val Ser Asn Ile Val Ile
20 25 30
Asn Gly Val Pro Tyr Gln Gly Trp Asp Ile Asp Ser Met Pro Tyr Glu
35 40 45
Ser Asp Pro Pro Val Val Val Ala Trp Glu Thr Pro Asn Thr Ser Asn
50 55 60
Gly Phe Ile Thr Pro Asp Gln Tyr Gly Thr Ser Asp Ile Ile Cys His
65 70 75 80
Leu Asn Ala Thr Asn Ala Lys Gly His Ala Val Val Ala Ala Gly Asp
85 90 95
Lys Ile Ser Ile Gln Trp Thr Ala Trp Pro Ser Ser His His Gly Pro
100 105 110
Val Ile Ser Tyr Leu Ala Asn Cys Gly Ala Ser Cys Glu Thr Val Asp
115 120 125
Lys Thr Thr Leu Gln Phe Phe Lys Ile Asp Asn Ile Gly Phe Ile Asp
130 135 140
Asp Ser Ser Pro Pro Gly Ile Trp Ala Ala Asp Gln Leu Glu Ala Asn
145 150 155 160
Asn Asn Thr Trp Leu Val Glu Ile Pro Pro Thr Ile Ala Pro Gly Tyr
165 170 175
Tyr Val Leu Arg Asn Glu Ile Ile Ala Leu His Gly Ala Glu Asn Gln
180 185 190
Asp Gly Ala Gln Asn Tyr Pro Gln Cys Phe Asn Leu Gln Val Thr Gly
195 200 205
Ser Gly Thr Asp Lys Pro Ala Gly Val Leu Gly Thr Gln Leu Tyr Ser
210 215 220
Pro Thr Asp Pro Gly Ile Leu Val Asn Ile Tyr Thr Ser Leu Ser Thr
225 230 235 240
Tyr Ile Val Pro Gly Pro Thr Pro Tyr Ser Gly Trp Val Ser Val Val
245 250 255
Gln Ser Ser Ser Ala Ile Thr Ala Ser Gly Thr Pro Val Thr Gly Thr
260 265 270
Gly Gly Val Ser Pro Thr Thr Ala Ala Thr Thr Thr Ser Ser Ser His
275 280 285
Ser Thr Thr Ser Thr Thr Thr Gly Pro Thr Val Thr Ser Thr Ser His
290 295 300
Thr Thr Thr Thr Thr Thr Pro Thr Thr Leu Arg Thr Thr Thr Thr Thr
305 310 315 320
Ala Ala Gly Gly Gly Ala Thr Gln Thr Val Tyr Gly Gln Cys Gly Gly
325 330 335
Ser Gly Trp Thr Gly Ala Thr Ala Cys Ala Ala Gly Ala Thr Cys Ser
340 345 350
Thr Leu Asn Pro Tyr Tyr Ala Gln Cys Leu Pro Thr Gly Ala
355 360 365
&lt;210&gt; 215
&lt;211&gt; 1091
&lt;212&gt; DNA
&lt;213&gt; 嗜热毛壳菌(Chaetomium thermophilum)
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (522)..(524)
&lt;223&gt; n是a, c, g或t
&lt;400&gt; 215
atgccttcct tcgcttcgaa gactctcatt tctgccctcg ccggcgctgc cagcgtcgcc 60
gctcacggcc acgtcaagaa cttcgtcatc aacggtctgt cgtaccaggc ctacgacccg 120
accgtcttcc cgtacatgca gaaccctccc atcgtcgccg gctggacggc ctccaacact 180
gacaacggct tcgtgggccc cgagtcctac tcgagccccg atatcatctg ccacaagtcg 240
gccacgaacg ccaagggcca tgccgtcatc aaggccggtg actctgtcta catccagtgg 300
gacacctggc ccgagtcgca ccacggcccg gtcatcgact acctcgccag ctgcggcagc 360
gccggctgcg agacggtcga caagacccag ctcgagttct tcaagatcgc cgaggccggt 420
ctgattgacg gctcccaggc tcccggaaag tgggctgccg atcagctcat cgcccagaac 480
aactcgtggc tggtcaccat ccccgagaat atcaagccgc tnnnggctcc tacgtcctcc 540
gccacgagat catcgccctg cacagcgctg gccagaccaa cggtgcccag aactaccccg 600
tctgcatcaa cctcgaggtc actggtggcg gcagcgacgt tccctcgggt gtcaagggta 660
ctgagctcta caagcccacc gaccccggca tcctcatcaa catctaccag tcgctctcga 720
actacaccat ccctggccct gctctgatgc ccggcgccaa gccagtcacc cagcacacct 780
cagccatcat cggcagcacc accgccatca ctggcaccgc caccgctgct ccggccgcgc 840
cgacctcgac cgccgctgcc atcaccacca gctctgctaa tgccaacccc gccccgacca 900
ccacccgcgg caacgccaac cccgtcccga ctaccaccct ccgcacgagc accatcgctc 960
ctcagcccac tgctgccccc atccagaccc cgacctccag cgtcggccgg cccccgcgcc 1020
cgacccgctg ccctggtctg gacaacttca agcgcgctcg tcgccacgct cgtgaccttg 1080
ctgcccacta a 1091
&lt;210&gt; 216
&lt;211&gt; 364
&lt;212&gt; PRT
&lt;213&gt; 嗜热毛壳菌(Chaetomium thermophilum)
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (174)..(176)
&lt;223&gt; Xaa可为任何天然存在的氨基酸
&lt;400&gt; 216
Met Pro Ser Phe Ala Ser Lys Thr Leu Ile Ser Ala Leu Ala Gly Ala
1 5 10 15
Ala Ser Val Ala Ala His Gly His Val Lys Asn Phe Val Ile Asn Gly
20 25 30
Leu Ser Tyr Gln Ala Tyr Asp Pro Thr Val Phe Pro Tyr Met Gln Asn
35 40 45
Pro Pro Ile Val Ala Gly Trp Thr Ala Ser Asn Thr Asp Asn Gly Phe
50 55 60
Val Gly Pro Glu Ser Tyr Ser Ser Pro Asp Ile Ile Cys His Lys Ser
65 70 75 80
Ala Thr Asn Ala Lys Gly His Ala Val Ile Lys Ala Gly Asp Ser Val
85 90 95
Tyr Ile Gln Trp Asp Thr Trp Pro Glu Ser His His Gly Pro Val Ile
100 105 110
Asp Tyr Leu Ala Ser Cys Gly Ser Ala Gly Cys Glu Thr Val Asp Lys
115 120 125
Thr Gln Leu Glu Phe Phe Lys Ile Ala Glu Ala Gly Leu Ile Asp Gly
130 135 140
Ser Gln Ala Pro Gly Lys Trp Ala Ala Asp Gln Leu Ile Ala Gln Asn
145 150 155 160
Asn Ser Trp Leu Val Thr Ile Pro Glu Asn Ile Lys Pro Xaa Xaa Xaa
165 170 175
Gly Ser Tyr Val Leu Arg His Glu Ile Ile Ala Leu His Ser Ala Gly
180 185 190
Gln Thr Asn Gly Ala Gln Asn Tyr Pro Val Cys Ile Asn Leu Glu Val
195 200 205
Thr Gly Gly Gly Ser Asp Val Pro Ser Gly Val Lys Gly Thr Glu Leu
210 215 220
Tyr Lys Pro Thr Asp Pro Gly Ile Leu Ile Asn Ile Tyr Gln Ser Leu
225 230 235 240
Ser Asn Tyr Thr Ile Pro Gly Pro Ala Leu Met Pro Gly Ala Lys Pro
245 250 255
Val Thr Gln His Thr Ser Ala Ile Ile Gly Ser Thr Thr Ala Ile Thr
260 265 270
Gly Thr Ala Thr Ala Ala Pro Ala Ala Pro Thr Ser Thr Ala Ala Ala
275 280 285
Ile Thr Thr Ser Ser Ala Asn Ala Asn Pro Ala Pro Thr Thr Thr Arg
290 295 300
Gly Asn Ala Asn Pro Val Pro Thr Thr Thr Leu Arg Thr Ser Thr Ile
305 310 315 320
Ala Pro Gln Pro Thr Ala Ala Pro Ile Gln Thr Pro Thr Ser Ser Val
325 330 335
Gly Arg Pro Pro Arg Pro Thr Arg Cys Pro Gly Leu Asp Asn Phe Lys
340 345 350
Arg Ala Arg Arg His Ala Arg Asp Leu Ala Ala His
355 360
&lt;210&gt; 217
&lt;211&gt; 40
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 217
cacaactggg gatccatgac tttgtccaag atcacttcca 40
&lt;210&gt; 218
&lt;211&gt; 40
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 218
ggcctccgcg gccgcttaag cgttgaacag tgcaggacca 40
&lt;210&gt; 219
&lt;211&gt; 40
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 219
cacaactggg gatccatgac tttgtccaag atcacttcca 40
&lt;210&gt; 220
&lt;211&gt; 40
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 220
ggcctccgcg gccgcttaag cgttgaacag tgcaggacca 40
&lt;210&gt; 221
&lt;211&gt; 40
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 221
cacaactggg gatccatgct gtcttcgacg actcgcaccc 40
&lt;210&gt; 222
&lt;211&gt; 40
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 222
ggcctccgcg gccgcctaga acgtcggctc aggcggcccc 40
&lt;210&gt; 223
&lt;211&gt; 27
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 223
ctggggatcc atgtcctttt ccaagat 27
&lt;210&gt; 224
&lt;211&gt; 29
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 224
ctccgcggcc gcttaaccag tatacagag 29
&lt;210&gt; 225
&lt;211&gt; 25
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 225
actcaattta cctctatcca cactt 25
&lt;210&gt; 226
&lt;211&gt; 25
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 226
gaattgtgag cggataacaa tttca 25
&lt;210&gt; 227
&lt;211&gt; 36
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 227
cggactgcgc accatgctgt cttcgacgac tcgcac 36
&lt;210&gt; 228
&lt;211&gt; 35
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 228
tcgccacgga gcttatcgac ttcttctaga acgtc 35
&lt;210&gt; 229
&lt;211&gt; 45
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 229
atcatcgccc ttcactctgc ggccaacctg aacggcgcgc agaac 45
&lt;210&gt; 230
&lt;211&gt; 45
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 230
gttctgcgcg ccgttcaggt tggccgcaga gtgaagggcg atgat 45
&lt;210&gt; 231
&lt;211&gt; 45
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 231
atcatcgccc ttcactctgc gtggaacctg aacggcgcgc agaac 45
&lt;210&gt; 232
&lt;211&gt; 45
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 232
gttctgcgcg ccgttcaggt tccacgcaga gtgaagggcg atgat 45
&lt;210&gt; 233
&lt;211&gt; 49
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 233
acaagaatac tgatcctggc atctggtttg acatctactc ggatctgag 49
&lt;210&gt; 234
&lt;211&gt; 49
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 234
ctcagatccg agtagatgtc aaaccagatg ccaggatcag tattcttgt 49
&lt;210&gt; 235
&lt;211&gt; 44
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 235
tcgcccttca ctctgcgggt aagctgaacg gcgcgcagaa ctac 44
&lt;210&gt; 236
&lt;211&gt; 44
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 236
gtagttctgc gcgccgttca gcttacccgc agagtgaagg gcga 44
&lt;210&gt; 237
&lt;211&gt; 45
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 237
atcatcgccc ttcactctgc gtttaacctg aacggcgcgc agaac 45
&lt;210&gt; 238
&lt;211&gt; 45
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 238
gttctgcgcg ccgttcaggt taaacgcaga gtgaagggcg atgat 45
&lt;210&gt; 239
&lt;211&gt; 44
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 239
tcgcccttca ctctgcgggt aagctgaacg gcgcgcagaa ctac 44
&lt;210&gt; 240
&lt;211&gt; 44
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 240
gtagttctgc gcgccgttca gcttacccgc agagtgaagg gcga 44
&lt;210&gt; 241
&lt;211&gt; 45
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 241
gtgctcaggg atctggcacc tacggcacgt ccctgtacaa gaata 45
&lt;210&gt; 242
&lt;211&gt; 45
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 242
tattcttgta cagggacgtg ccgtaggtgc cagatccctg agcac 45
&lt;210&gt; 243
&lt;211&gt; 3060
&lt;212&gt; DNA
&lt;213&gt; 烟曲霉(Aspergillus fumigatus)
&lt;400&gt; 243
atgagattcg gttggctcga ggtggccgct ctgacggccg cttctgtagc caatgcccag 60
gtttgtgatg ctttcccgtc attgtttcgg atatagttga caatagtcat ggaaataatc 120
aggaattggc tttctctcca ccattctacc cttcgccttg ggctgatggc cagggagagt 180
gggcagatgc ccatcgacgc gccgtcgaga tcgtttctca gatgacactg gcggagaagg 240
ttaaccttac aacgggtact gggtgggttg cgactttttt gttgacagtg agctttcttc 300
actgaccatc tacacagatg ggaaatggac cgatgcgtcg gtcaaaccgg cagcgttccc 360
aggtaagctt gcaattctgc aacaacgtgc aagtgtagtt gctaaaacgc ggtggtgcag 420
acttggtatc aactggggtc tttgtggcca ggattcccct ttgggtatcc gtttctgtga 480
gctatacccg cggagtcttt cagtccttgt attatgtgct gatgattgtc tctgtatagc 540
tgacctcaac tccgccttcc ctgctggtac taatgtcgcc gcgacatggg acaagacact 600
cgcctacctt cgtggcaagg ccatgggtga ggaattcaac gacaagggcg tggacatttt 660
gctggggcct gctgctggtc ctctcggcaa atacccggac ggcggcagaa tctgggaagg 720
cttctctcct gatccggttc tcactggtgt acttttcgcc gaaactatca agggtatcca 780
agacgcgggt gtgattgcta ctgccaagca ttacattctg aatgaacagg agcatttccg 840
acaggttggc gaggcccagg gatatggtta caacatcacg gagacgatca gctccaacgt 900
ggatgacaag accatgcacg agttgtacct ttggtgagta gttgacactg caaatgagga 960
ccttgattga tttgactgac ctggaatgca ggccctttgc agatgctgtg cgcggtaaga 1020
ttttccgtag acttgacctc gcgacgaaga aatcgctgac gaaccatcgt agctggcgtt 1080
ggcgctgtca tgtgttccta caatcaaatc aacaacagct acggttgtca aaacagtcaa 1140
actctcaaca agctcctcaa ggctgagctg ggcttccaag gcttcgtcat gagtgactgg 1200
agcgctcacc acagcggtgt cggcgctgcc ctcgctgggt tggatatgtc gatgcctgga 1260
gacatttcct tcgacgacgg actctccttc tggggcacga acctaactgt cagtgttctt 1320
aacggcaccg ttccagcctg gcgtgtcgat gacatggctg ttcgtatcat gaccgcgtac 1380
tacaaggttg gtcgtgaccg tcttcgtatt ccccctaact tcagctcctg gacccgggat 1440
gagtacggct gggagcattc tgctgtctcc gagggagcct ggaccaaggt gaacgacttc 1500
gtcaatgtgc agcgcagtca ctctcagatc atccgtgaga ttggtgccgc tagtacagtg 1560
ctcttgaaga acacgggtgc tcttcctttg accggcaagg aggttaaagt gggtgttctc 1620
ggtgaagacg ctggttccaa cccgtggggt gctaacggct gccccgaccg cggctgtgat 1680
aacggcactc ttgctatggc ctggggtagt ggtactgcca acttccctta ccttgtcacc 1740
cccgagcagg ctatccagcg agaggtcatc agcaacggcg gcaatgtctt tgctgtgact 1800
gataacgggg ctctcagcca gatggcagat gttgcatctc aatccaggtg agtgcgggct 1860
cttagaaaaa gaacgttctc tgaatgaagt tttttaacca ttgcgaacag cgtgtctttg 1920
gtgtttgtca acgccgactc tggagagggt ttcatcagtg tcgacggcaa cgagggtgac 1980
cgcaaaaatc tcactctgtg gaagaacggc gaggccgtca ttgacactgt tgtcagccac 2040
tgcaacaaca cgattgtggt tattcacagt gttgggcccg tcttgatcga ccggtggtat 2100
gataacccca acgtcactgc catcatctgg gccggcttgc ccggtcagga gagtggcaac 2160
tccctggtcg acgtgctcta tggccgcgtc aaccccagcg ccaagacccc gttcacctgg 2220
ggcaagactc gggagtctta cggggctccc ttgctcaccg agcctaacaa tggcaatggt 2280
gctccccagg atgatttcaa cgagggcgtc ttcattgact accgtcactt tgacaagcgc 2340
aatgagaccc ccatttatga gtttggccat ggcttgagct acaccacctt tggttactct 2400
caccttcggg ttcaggccct caatagttcg agttcggcat atgtcccgac tagcggagag 2460
accaagcctg cgccaaccta tggtgagatc ggtagtgccg ccgactacct gtatcccgag 2520
ggtctcaaaa gaattaccaa gtttatttac ccttggctca actcgaccga cctcgaggat 2580
tcttctgacg acccgaacta cggctgggag gactcggagt acattcccga aggcgctagg 2640
gatgggtctc ctcaacccct cctgaaggct ggcggcgctc ctggtggtaa ccctaccctt 2700
tatcaggatc ttgttagggt gtcggccacc ataaccaaca ctggtaacgt cgccggttat 2760
gaagtccctc aattggtgag tgacccgcat gttccttgcg ttgcaatttg gctaactcgc 2820
ttctagtatg tttcactggg cggaccgaac gagcctcggg tcgttctgcg caagttcgac 2880
cgaatcttcc tggctcctgg ggagcaaaag gtttggacca cgactcttaa ccgtcgtgat 2940
ctcgccaatt gggatgtgga ggctcaggac tgggtcatca caaagtaccc caagaaagtg 3000
cacgtcggca gctcctcgcg taagctgcct ctgagagcgc ctctgccccg tgtctactag 3060
&lt;210&gt; 244
&lt;211&gt; 863
&lt;212&gt; PRT
&lt;213&gt; 烟曲霉(Aspergillus fumigatus)
&lt;400&gt; 244
Met Arg Phe Gly Trp Leu Glu Val Ala Ala Leu Thr Ala Ala Ser Val
1 5 10 15
Ala Asn Ala Gln Glu Leu Ala Phe Ser Pro Pro Phe Tyr Pro Ser Pro
20 25 30
Trp Ala Asp Gly Gln Gly Glu Trp Ala Asp Ala His Arg Arg Ala Val
35 40 45
Glu Ile Val Ser Gln Met Thr Leu Ala Glu Lys Val Asn Leu Thr Thr
50 55 60
Gly Thr Gly Trp Glu Met Asp Arg Cys Val Gly Gln Thr Gly Ser Val
65 70 75 80
Pro Arg Leu Gly Ile Asn Trp Gly Leu Cys Gly Gln Asp Ser Pro Leu
85 90 95
Gly Ile Arg Phe Ser Asp Leu Asn Ser Ala Phe Pro Ala Gly Thr Asn
100 105 110
Val Ala Ala Thr Trp Asp Lys Thr Leu Ala Tyr Leu Arg Gly Lys Ala
115 120 125
Met Gly Glu Glu Phe Asn Asp Lys Gly Val Asp Ile Leu Leu Gly Pro
130 135 140
Ala Ala Gly Pro Leu Gly Lys Tyr Pro Asp Gly Gly Arg Ile Trp Glu
145 150 155 160
Gly Phe Ser Pro Asp Pro Val Leu Thr Gly Val Leu Phe Ala Glu Thr
165 170 175
Ile Lys Gly Ile Gln Asp Ala Gly Val Ile Ala Thr Ala Lys His Tyr
180 185 190
Ile Leu Asn Glu Gln Glu His Phe Arg Gln Val Gly Glu Ala Gln Gly
195 200 205
Tyr Gly Tyr Asn Ile Thr Glu Thr Ile Ser Ser Asn Val Asp Asp Lys
210 215 220
Thr Met His Glu Leu Tyr Leu Trp Pro Phe Ala Asp Ala Val Arg Ala
225 230 235 240
Gly Val Gly Ala Val Met Cys Ser Tyr Asn Gln Ile Asn Asn Ser Tyr
245 250 255
Gly Cys Gln Asn Ser Gln Thr Leu Asn Lys Leu Leu Lys Ala Glu Leu
260 265 270
Gly Phe Gln Gly Phe Val Met Ser Asp Trp Ser Ala His His Ser Gly
275 280 285
Val Gly Ala Ala Leu Ala Gly Leu Asp Met Ser Met Pro Gly Asp Ile
290 295 300
Ser Phe Asp Asp Gly Leu Ser Phe Trp Gly Thr Asn Leu Thr Val Ser
305 310 315 320
Val Leu Asn Gly Thr Val Pro Ala Trp Arg Val Asp Asp Met Ala Val
325 330 335
Arg Ile Met Thr Ala Tyr Tyr Lys Val Gly Arg Asp Arg Leu Arg Ile
340 345 350
Pro Pro Asn Phe Ser Ser Trp Thr Arg Asp Glu Tyr Gly Trp Glu His
355 360 365
Ser Ala Val Ser Glu Gly Ala Trp Thr Lys Val Asn Asp Phe Val Asn
370 375 380
Val Gln Arg Ser His Ser Gln Ile Ile Arg Glu Ile Gly Ala Ala Ser
385 390 395 400
Thr Val Leu Leu Lys Asn Thr Gly Ala Leu Pro Leu Thr Gly Lys Glu
405 410 415
Val Lys Val Gly Val Leu Gly Glu Asp Ala Gly Ser Asn Pro Trp Gly
420 425 430
Ala Asn Gly Cys Pro Asp Arg Gly Cys Asp Asn Gly Thr Leu Ala Met
435 440 445
Ala Trp Gly Ser Gly Thr Ala Asn Phe Pro Tyr Leu Val Thr Pro Glu
450 455 460
Gln Ala Ile Gln Arg Glu Val Ile Ser Asn Gly Gly Asn Val Phe Ala
465 470 475 480
Val Thr Asp Asn Gly Ala Leu Ser Gln Met Ala Asp Val Ala Ser Gln
485 490 495
Ser Ser Val Ser Leu Val Phe Val Asn Ala Asp Ser Gly Glu Gly Phe
500 505 510
Ile Ser Val Asp Gly Asn Glu Gly Asp Arg Lys Asn Leu Thr Leu Trp
515 520 525
Lys Asn Gly Glu Ala Val Ile Asp Thr Val Val Ser His Cys Asn Asn
530 535 540
Thr Ile Val Val Ile His Ser Val Gly Pro Val Leu Ile Asp Arg Trp
545 550 555 560
Tyr Asp Asn Pro Asn Val Thr Ala Ile Ile Trp Ala Gly Leu Pro Gly
565 570 575
Gln Glu Ser Gly Asn Ser Leu Val Asp Val Leu Tyr Gly Arg Val Asn
580 585 590
Pro Ser Ala Lys Thr Pro Phe Thr Trp Gly Lys Thr Arg Glu Ser Tyr
595 600 605
Gly Ala Pro Leu Leu Thr Glu Pro Asn Asn Gly Asn Gly Ala Pro Gln
610 615 620
Asp Asp Phe Asn Glu Gly Val Phe Ile Asp Tyr Arg His Phe Asp Lys
625 630 635 640
Arg Asn Glu Thr Pro Ile Tyr Glu Phe Gly His Gly Leu Ser Tyr Thr
645 650 655
Thr Phe Gly Tyr Ser His Leu Arg Val Gln Ala Leu Asn Ser Ser Ser
660 665 670
Ser Ala Tyr Val Pro Thr Ser Gly Glu Thr Lys Pro Ala Pro Thr Tyr
675 680 685
Gly Glu Ile Gly Ser Ala Ala Asp Tyr Leu Tyr Pro Glu Gly Leu Lys
690 695 700
Arg Ile Thr Lys Phe Ile Tyr Pro Trp Leu Asn Ser Thr Asp Leu Glu
705 710 715 720
Asp Ser Ser Asp Asp Pro Asn Tyr Gly Trp Glu Asp Ser Glu Tyr Ile
725 730 735
Pro Glu Gly Ala Arg Asp Gly Ser Pro Gln Pro Leu Leu Lys Ala Gly
740 745 750
Gly Ala Pro Gly Gly Asn Pro Thr Leu Tyr Gln Asp Leu Val Arg Val
755 760 765
Ser Ala Thr Ile Thr Asn Thr Gly Asn Val Ala Gly Tyr Glu Val Pro
770 775 780
Gln Leu Tyr Val Ser Leu Gly Gly Pro Asn Glu Pro Arg Val Val Leu
785 790 795 800
Arg Lys Phe Asp Arg Ile Phe Leu Ala Pro Gly Glu Gln Lys Val Trp
805 810 815
Thr Thr Thr Leu Asn Arg Arg Asp Leu Ala Asn Trp Asp Val Glu Ala
820 825 830
Gln Asp Trp Val Ile Thr Lys Tyr Pro Lys Lys Val His Val Gly Ser
835 840 845
Ser Ser Arg Lys Leu Pro Leu Arg Ala Pro Leu Pro Arg Val Tyr
850 855 860
&lt;210&gt; 245
&lt;211&gt; 1599
&lt;212&gt; DNA
&lt;213&gt; 烟曲霉(Aspergillus fumigatus)
&lt;400&gt; 245
atgctggcct ccaccttctc ctaccgcatg tacaagaccg cgctcatcct ggccgccctt 60
ctgggctctg gccaggctca gcaggtcggt acttcccagg cggaagtgca tccgtccatg 120
acctggcaga gctgcacggc tggcggcagc tgcaccacca acaacggcaa ggtggtcatc 180
gacgcgaact ggcgttgggt gcacaaagtc ggcgactaca ccaactgcta caccggcaac 240
acctgggaca cgactatctg ccctgacgat gcgacctgcg catccaactg cgcccttgag 300
ggtgccaact acgaatccac ctatggtgtg accgccagcg gcaattccct ccgcctcaac 360
ttcgtcacca ccagccagca gaagaacatt ggctcgcgtc tgtacatgat gaaggacgac 420
tcgacctacg agatgtttaa gctgctgaac caggagttca ccttcgatgt cgatgtctcc 480
aacctcccct gcggtctcaa cggtgctctg tactttgtcg ccatggacgc cgacggtggc 540
atgtccaagt acccaaccaa caaggccggt gccaagtacg gtactggata ctgtgactcg 600
cagtgccctc gcgacctcaa gttcatcaac ggtcaggcca acgtcgaagg gtggcagccc 660
tcctccaacg atgccaatgc gggtaccggc aaccacgggt cctgctgcgc ggagatggat 720
atctgggagg ccaacagcat ctccacggcc ttcacccccc atccgtgcga cacgcccggc 780
caggtgatgt gcaccggtga tgcctgcggt ggcacctaca gctccgaccg ctacggcggc 840
acctgcgacc ccgacggatg tgatttcaac tccttccgcc agggcaacaa gaccttctac 900
ggccctggca tgaccgtcga caccaagagc aagtttaccg tcgtcaccca gttcatcacc 960
gacgacggca cctccagcgg caccctcaag gagatcaagc gcttctacgt gcagaacggc 1020
aaggtgatcc ccaactcgga gtcgacctgg accggcgtca gcggcaactc catcaccacc 1080
gagtactgca ccgcccagaa gagcctgttc caggaccaga acgtcttcga aaagcacggc 1140
ggcctcgagg gcatgggtgc tgccctcgcc cagggtatgg ttctcgtcat gtccctgtgg 1200
gatgatcact cggccaacat gctctggctc gacagcaact acccgaccac tgcctcttcc 1260
accactcccg gcgtcgcccg tggtacctgc gacatctcct ccggcgtccc tgcggatgtc 1320
gaggcgaacc accccgacgc ctacgtcgtc tactccaaca tcaaggtcgg ccccatcggc 1380
tcgaccttca acagcggtgg ctcgaacccc ggtggcggaa ccaccacgac aactaccacc 1440
cagcctacta ccaccacgac cacggctgga aaccctggcg gcaccggagt cgcacagcac 1500
tatggccagt gtggtggaat cggatggacc ggacccacaa cctgtgccag cccttatacc 1560
tgccagaagc tgaatgatta ttactctcag tgcctgtag 1599
&lt;210&gt; 246
&lt;211&gt; 532
&lt;212&gt; PRT
&lt;213&gt; 烟曲霉(Aspergillus fumigatus)
&lt;400&gt; 246
Met Leu Ala Ser Thr Phe Ser Tyr Arg Met Tyr Lys Thr Ala Leu Ile
1 5 10 15
Leu Ala Ala Leu Leu Gly Ser Gly Gln Ala Gln Gln Val Gly Thr Ser
20 25 30
Gln Ala Glu Val His Pro Ser Met Thr Trp Gln Ser Cys Thr Ala Gly
35 40 45
Gly Ser Cys Thr Thr Asn Asn Gly Lys Val Val Ile Asp Ala Asn Trp
50 55 60
Arg Trp Val His Lys Val Gly Asp Tyr Thr Asn Cys Tyr Thr Gly Asn
65 70 75 80
Thr Trp Asp Thr Thr Ile Cys Pro Asp Asp Ala Thr Cys Ala Ser Asn
85 90 95
Cys Ala Leu Glu Gly Ala Asn Tyr Glu Ser Thr Tyr Gly Val Thr Ala
100 105 110
Ser Gly Asn Ser Leu Arg Leu Asn Phe Val Thr Thr Ser Gln Gln Lys
115 120 125
Asn Ile Gly Ser Arg Leu Tyr Met Met Lys Asp Asp Ser Thr Tyr Glu
130 135 140
Met Phe Lys Leu Leu Asn Gln Glu Phe Thr Phe Asp Val Asp Val Ser
145 150 155 160
Asn Leu Pro Cys Gly Leu Asn Gly Ala Leu Tyr Phe Val Ala Met Asp
165 170 175
Ala Asp Gly Gly Met Ser Lys Tyr Pro Thr Asn Lys Ala Gly Ala Lys
180 185 190
Tyr Gly Thr Gly Tyr Cys Asp Ser Gln Cys Pro Arg Asp Leu Lys Phe
195 200 205
Ile Asn Gly Gln Ala Asn Val Glu Gly Trp Gln Pro Ser Ser Asn Asp
210 215 220
Ala Asn Ala Gly Thr Gly Asn His Gly Ser Cys Cys Ala Glu Met Asp
225 230 235 240
Ile Trp Glu Ala Asn Ser Ile Ser Thr Ala Phe Thr Pro His Pro Cys
245 250 255
Asp Thr Pro Gly Gln Val Met Cys Thr Gly Asp Ala Cys Gly Gly Thr
260 265 270
Tyr Ser Ser Asp Arg Tyr Gly Gly Thr Cys Asp Pro Asp Gly Cys Asp
275 280 285
Phe Asn Ser Phe Arg Gln Gly Asn Lys Thr Phe Tyr Gly Pro Gly Met
290 295 300
Thr Val Asp Thr Lys Ser Lys Phe Thr Val Val Thr Gln Phe Ile Thr
305 310 315 320
Asp Asp Gly Thr Ser Ser Gly Thr Leu Lys Glu Ile Lys Arg Phe Tyr
325 330 335
Val Gln Asn Gly Lys Val Ile Pro Asn Ser Glu Ser Thr Trp Thr Gly
340 345 350
Val Ser Gly Asn Ser Ile Thr Thr Glu Tyr Cys Thr Ala Gln Lys Ser
355 360 365
Leu Phe Gln Asp Gln Asn Val Phe Glu Lys His Gly Gly Leu Glu Gly
370 375 380
Met Gly Ala Ala Leu Ala Gln Gly Met Val Leu Val Met Ser Leu Trp
385 390 395 400
Asp Asp His Ser Ala Asn Met Leu Trp Leu Asp Ser Asn Tyr Pro Thr
405 410 415
Thr Ala Ser Ser Thr Thr Pro Gly Val Ala Arg Gly Thr Cys Asp Ile
420 425 430
Ser Ser Gly Val Pro Ala Asp Val Glu Ala Asn His Pro Asp Ala Tyr
435 440 445
Val Val Tyr Ser Asn Ile Lys Val Gly Pro Ile Gly Ser Thr Phe Asn
450 455 460
Ser Gly Gly Ser Asn Pro Gly Gly Gly Thr Thr Thr Thr Thr Thr Thr
465 470 475 480
Gln Pro Thr Thr Thr Thr Thr Thr Ala Gly Asn Pro Gly Gly Thr Gly
485 490 495
Val Ala Gln His Tyr Gly Gln Cys Gly Gly Ile Gly Trp Thr Gly Pro
500 505 510
Thr Thr Cys Ala Ser Pro Tyr Thr Cys Gln Lys Leu Asn Asp Tyr Tyr
515 520 525
Ser Gln Cys Leu
530
&lt;210&gt; 247
&lt;211&gt; 1713
&lt;212&gt; DNA
&lt;213&gt; 烟曲霉(Aspergillus fumigatus)
&lt;400&gt; 247
atgaagcacc ttgcatcttc catcgcattg actctactgt tgcctgccgt gcaggcccag 60
cagaccgtat ggggccaatg tatgttctgg ctgtcactgg aataagactg tatcaactgc 120
tgatatgctt ctaggtggcg gccaaggctg gtctggcccg acgagctgtg ttgccggcgc 180
agcctgtagc acactgaatc cctgtatgtt agatatcgtc ctgagtggag acttatactg 240
acttccttag actacgctca gtgtatcccg ggagccaccg cgacgtccac caccctcacg 300
acgacgacgg cggcgacgac gacatcccag accaccacca aacctaccac gactggtcca 360
actacatccg cacccaccgt gaccgcatcc ggtaaccctt tcagcggcta ccagctgtat 420
gccaacccct actactcctc cgaggtccat actctggcca tgccttctct gcccagctcg 480
ctgcagccca aggctagtgc tgttgctgaa gtgccctcat ttgtttggct gtaagtggcc 540
ttatcccaat actgagacca actctctgac agtcgtagcg acgttgccgc caaggtgccc 600
actatgggaa cctacctggc cgacattcag gccaagaaca aggccggcgc caaccctcct 660
atcgctggta tcttcgtggt ctacgacttg ccggaccgtg actgcgccgc tctggccagt 720
aatggcgagt actcaattgc caacaacggt gtggccaact acaaggcgta cattgacgcc 780
atccgtgctc agctggtgaa gtactctgac gttcacacca tcctcgtcat cggtaggccg 840
tacacctccg ttgcgcgccg cctttctctg acatcttgca gaacccgaca gcttggccaa 900
cctggtgacc aacctcaacg tcgccaaatg cgccaatgcg cagagcgcct acctggagtg 960
tgtcgactat gctctgaagc agctcaacct gcccaacgtc gccatgtacc tcgacgcagg 1020
tatgcctcac ttcccgcatt ctgtatccct tccagacact aactcatcag gccatgcggg 1080
ctggctcgga tggcccgcca acttgggccc cgccgcaaca ctcttcgcca aagtctacac 1140
cgacgcgggt tcccccgcgg ctgttcgtgg cctggccacc aacgtcgcca actacaacgc 1200
ctggtcgctc agtacctgcc cctcctacac ccagggagac cccaactgcg acgagaagaa 1260
gtacatcaac gccatggcgc ctcttctcaa ggaagccggc ttcgatgccc acttcatcat 1320
ggatacctgt aagtgcttat tccaatcgcc gatgtgtgcc gactaatcaa tgtttcagcc 1380
cggaatggcg tccagcccac gaagcaaaac gcctggggtg actggtgcaa cgtcatcggc 1440
accggcttcg gtgttcgccc ctcgactaac accggcgatc cgctccagga tgcctttgtg 1500
tggatcaagc ccggtggaga gagtgatggc acgtccaact cgacttcccc ccggtatgac 1560
gcgcactgcg gatatagtga tgctctgcag cctgctcctg aggctggtac ttggttccag 1620
gtatgtcatc cattagccag atgagggata agtgactgac ggacctaggc ctactttgag 1680
cagcttctga ccaacgctaa cccgtccttt taa 1713
&lt;210&gt; 248
&lt;211&gt; 454
&lt;212&gt; PRT
&lt;213&gt; 烟曲霉(Aspergillus fumigatus)
&lt;400&gt; 248
Met Lys His Leu Ala Ser Ser Ile Ala Leu Thr Leu Leu Leu Pro Ala
1 5 10 15
Val Gln Ala Gln Gln Thr Val Trp Gly Gln Cys Gly Gly Gln Gly Trp
20 25 30
Ser Gly Pro Thr Ser Cys Val Ala Gly Ala Ala Cys Ser Thr Leu Asn
35 40 45
Pro Tyr Tyr Ala Gln Cys Ile Pro Gly Ala Thr Ala Thr Ser Thr Thr
50 55 60
Leu Thr Thr Thr Thr Ala Ala Thr Thr Thr Ser Gln Thr Thr Thr Lys
65 70 75 80
Pro Thr Thr Thr Gly Pro Thr Thr Ser Ala Pro Thr Val Thr Ala Ser
85 90 95
Gly Asn Pro Phe Ser Gly Tyr Gln Leu Tyr Ala Asn Pro Tyr Tyr Ser
100 105 110
Ser Glu Val His Thr Leu Ala Met Pro Ser Leu Pro Ser Ser Leu Gln
115 120 125
Pro Lys Ala Ser Ala Val Ala Glu Val Pro Ser Phe Val Trp Leu Asp
130 135 140
Val Ala Ala Lys Val Pro Thr Met Gly Thr Tyr Leu Ala Asp Ile Gln
145 150 155 160
Ala Lys Asn Lys Ala Gly Ala Asn Pro Pro Ile Ala Gly Ile Phe Val
165 170 175
Val Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Leu Ala Ser Asn Gly
180 185 190
Glu Tyr Ser Ile Ala Asn Asn Gly Val Ala Asn Tyr Lys Ala Tyr Ile
195 200 205
Asp Ala Ile Arg Ala Gln Leu Val Lys Tyr Ser Asp Val His Thr Ile
210 215 220
Leu Val Ile Glu Pro Asp Ser Leu Ala Asn Leu Val Thr Asn Leu Asn
225 230 235 240
Val Ala Lys Cys Ala Asn Ala Gln Ser Ala Tyr Leu Glu Cys Val Asp
245 250 255
Tyr Ala Leu Lys Gln Leu Asn Leu Pro Asn Val Ala Met Tyr Leu Asp
260 265 270
Ala Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Leu Gly Pro Ala
275 280 285
Ala Thr Leu Phe Ala Lys Val Tyr Thr Asp Ala Gly Ser Pro Ala Ala
290 295 300
Val Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Ala Trp Ser Leu
305 310 315 320
Ser Thr Cys Pro Ser Tyr Thr Gln Gly Asp Pro Asn Cys Asp Glu Lys
325 330 335
Lys Tyr Ile Asn Ala Met Ala Pro Leu Leu Lys Glu Ala Gly Phe Asp
340 345 350
Ala His Phe Ile Met Asp Thr Ser Arg Asn Gly Val Gln Pro Thr Lys
355 360 365
Gln Asn Ala Trp Gly Asp Trp Cys Asn Val Ile Gly Thr Gly Phe Gly
370 375 380
Val Arg Pro Ser Thr Asn Thr Gly Asp Pro Leu Gln Asp Ala Phe Val
385 390 395 400
Trp Ile Lys Pro Gly Gly Glu Ser Asp Gly Thr Ser Asn Ser Thr Ser
405 410 415
Pro Arg Tyr Asp Ala His Cys Gly Tyr Ser Asp Ala Leu Gln Pro Ala
420 425 430
Pro Glu Ala Gly Thr Trp Phe Gln Ala Tyr Phe Glu Gln Leu Leu Thr
435 440 445
Asn Ala Asn Pro Ser Phe
450
&lt;210&gt; 249
&lt;211&gt; 1849
&lt;212&gt; DNA
&lt;213&gt; 里氏木霉(Trichoderma reesei)
&lt;400&gt; 249
tgccatttct gacctggata ggttttccta tggtcattcc tataagagac acgctctttc 60
gtcggcccgt agatatcaga ttggtattca gtcgcacaga cgaaggtgag ttgatcctcc 120
aacatgagtt ctatgagccc cccccttgcc cccccccgtt caccttgacc tgcaatgaga 180
atcccacctt ttacaagagc atcaagaagt attaatggcg ctgaatagcc tctgctcgat 240
aatatctccc cgtcatcgac aatgaacaag tccgtggctc cattgctgct tgcagcgtcc 300
atactatatg gcggcgccgt cgcacagcag actgtctggg gccagtgtgg aggtattggt 360
tggagcggac ctacgaattg tgctcctggc tcagcttgtt cgaccctcaa tccttattat 420
gcgcaatgta ttccgggagc cactactatc accacttcga cccggccacc atccggtcca 480
accaccacca ccagggctac ctcaacaagc tcatcaactc cacccacgag ctctggggtc 540
cgatttgccg gcgttaacat cgcgggtttt gactttggct gtaccacaga gtgagtaccc 600
ttgtttcctg gtgttgctgg ctggttgggc gggtatacag cgaagcggac gcaagaacac 660
cgccggtccg ccaccatcaa gatgtgggtg gtaagcggcg gtgttttgta caactacctg 720
acagctcact caggaaatga gaattaatgg aagtcttgtt acagtggcac ttgcgttacc 780
tcgaaggttt atcctccgtt gaagaacttc accggctcaa acaactaccc cgatggcatc 840
ggccagatgc agcacttcgt caacgaggac gggatgacta ttttccgctt acctgtcgga 900
tggcagtacc tcgtcaacaa caatttgggc ggcaatcttg attccacgag catttccaag 960
tatgatcagc ttgttcaggg gtgcctgtct ctgggcgcat actgcatcgt cgacatccac 1020
aattatgctc gatggaacgg tgggatcatt ggtcagggcg gccctactaa tgctcaattc 1080
acgagccttt ggtcgcagtt ggcatcaaag tacgcatctc agtcgagggt gtggttcggc 1140
atcatgaatg agccccacga cgtgaacatc aacacctggg ctgccacggt ccaagaggtt 1200
gtaaccgcaa tccgcaacgc tggtgctacg tcgcaattca tctctttgcc tggaaatgat 1260
tggcaatctg ctggggcttt catatccgat ggcagtgcag ccgccctgtc tcaagtcacg 1320
aacccggatg ggtcaacaac gaatctgatt tttgacgtgc acaaatactt ggactcagac 1380
aactccggta ctcacgccga atgtactaca aataacattg acggcgcctt ttctccgctt 1440
gccacttggc tccgacagaa caatcgccag gctatcctga cagaaaccgg tggtggcaac 1500
gttcagtcct gcatacaaga catgtgccag caaatccaat atctcaacca gaactcagat 1560
gtctatcttg gctatgttgg ttggggtgcc ggatcatttg atagcacgta tgtcctgacg 1620
gaaacaccga ctggcagtgg taactcatgg acggacacat ccttggtcag ctcgtgtctc 1680
gcaagaaagt agcactctga gctgaatgca gaagcctcgc caacgtttgt atctcgctat 1740
caaacatagt agctactcta tgaggctgtc tgttctcgat ttcagcttta tatagtttca 1800
tcaaacagta catattccct ctgtggccac gcaaaaaaaa aaaaaaaaa 1849
&lt;210&gt; 250
&lt;211&gt; 418
&lt;212&gt; PRT
&lt;213&gt; 里氏木霉(Trichoderma reesei)
&lt;400&gt; 250
Met Asn Lys Ser Val Ala Pro Leu Leu Leu Ala Ala Ser Ile Leu Tyr
1 5 10 15
Gly Gly Ala Val Ala Gln Gln Thr Val Trp Gly Gln Cys Gly Gly Ile
20 25 30
Gly Trp Ser Gly Pro Thr Asn Cys Ala Pro Gly Ser Ala Cys Ser Thr
35 40 45
Leu Asn Pro Tyr Tyr Ala Gln Cys Ile Pro Gly Ala Thr Thr Ile Thr
50 55 60
Thr Ser Thr Arg Pro Pro Ser Gly Pro Thr Thr Thr Thr Arg Ala Thr
65 70 75 80
Ser Thr Ser Ser Ser Thr Pro Pro Thr Ser Ser Gly Val Arg Phe Ala
85 90 95
Gly Val Asn Ile Ala Gly Phe Asp Phe Gly Cys Thr Thr Asp Gly Thr
100 105 110
Cys Val Thr Ser Lys Val Tyr Pro Pro Leu Lys Asn Phe Thr Gly Ser
115 120 125
Asn Asn Tyr Pro Asp Gly Ile Gly Gln Met Gln His Phe Val Asn Glu
130 135 140
Asp Gly Met Thr Ile Phe Arg Leu Pro Val Gly Trp Gln Tyr Leu Val
145 150 155 160
Asn Asn Asn Leu Gly Gly Asn Leu Asp Ser Thr Ser Ile Ser Lys Tyr
165 170 175
Asp Gln Leu Val Gln Gly Cys Leu Ser Leu Gly Ala Tyr Cys Ile Val
180 185 190
Asp Ile His Asn Tyr Ala Arg Trp Asn Gly Gly Ile Ile Gly Gln Gly
195 200 205
Gly Pro Thr Asn Ala Gln Phe Thr Ser Leu Trp Ser Gln Leu Ala Ser
210 215 220
Lys Tyr Ala Ser Gln Ser Arg Val Trp Phe Gly Ile Met Asn Glu Pro
225 230 235 240
His Asp Val Asn Ile Asn Thr Trp Ala Ala Thr Val Gln Glu Val Val
245 250 255
Thr Ala Ile Arg Asn Ala Gly Ala Thr Ser Gln Phe Ile Ser Leu Pro
260 265 270
Gly Asn Asp Trp Gln Ser Ala Gly Ala Phe Ile Ser Asp Gly Ser Ala
275 280 285
Ala Ala Leu Ser Gln Val Thr Asn Pro Asp Gly Ser Thr Thr Asn Leu
290 295 300
Ile Phe Asp Val His Lys Tyr Leu Asp Ser Asp Asn Ser Gly Thr His
305 310 315 320
Ala Glu Cys Thr Thr Asn Asn Ile Asp Gly Ala Phe Ser Pro Leu Ala
325 330 335
Thr Trp Leu Arg Gln Asn Asn Arg Gln Ala Ile Leu Thr Glu Thr Gly
340 345 350
Gly Gly Asn Val Gln Ser Cys Ile Gln Asp Met Cys Gln Gln Ile Gln
355 360 365
Tyr Leu Asn Gln Asn Ser Asp Val Tyr Leu Gly Tyr Val Gly Trp Gly
370 375 380
Ala Gly Ser Phe Asp Ser Thr Tyr Val Leu Thr Glu Thr Pro Thr Gly
385 390 395 400
Ser Gly Asn Ser Trp Thr Asp Thr Ser Leu Val Ser Ser Cys Leu Ala
405 410 415
Arg Lys
&lt;210&gt; 251
&lt;211&gt; 1415
&lt;212&gt; DNA
&lt;213&gt; 烟曲霉(Aspergillus fumigatus)
&lt;400&gt; 251
atggtccatc tatcttcatt ggcagcagcc ctggctgctc tgcctctgta tgtttaccca 60
ctcacgagag gaggaacagc tttgacattg ctatagtgta tatggagctg gcctgaacac 120
agcagccaaa gccaaaggac taaagtactt tggttccgcc acggacaatc cagagctcac 180
ggactctgcg tatgtcgcgc aactgagcaa caccgatgat tttggtcaaa tcacacccgg 240
aaactccatg aaggtttgct tacgtctgcc tccctggagc attgcctcaa aagctaattg 300
gttgttttgt ttggatagtg ggatgccacc gagccttctc agaattcttt ttcgttcgca 360
aatggagacg ccgtggtcaa tctggcgaac aagaatggcc agctgatgcg atgccatact 420
ctggtctggc acagtcagct accgaactgg ggtatgtaaa cgtcttgtct attctcaaat 480
actctctaac agttgacagt ctctagcggg tcatggacca atgcgaccct tttggcggcc 540
atgaagaatc atatcaccaa tgtggttact cactacaagg ggaagtgcta cgcctgggat 600
gttgtcaatg aaggtttgtt gctccatcta tcctcaatag ttcttttgaa actgacaagc 660
ctgtcaatct agccctgaac gaggacggta ctttccgtaa ctctgtcttc taccagatca 720
tcggcccagc atacattcct attgcgttcg ccacggctgc tgccgcagat cccgacgtga 780
aactctacta caacgactac aacattgaat actcaggcgc caaagcgact gctgcgcaga 840
atatcgtcaa gatgatcaag gcctacggcg cgaagatcga cggcgtcggc ctccaggcac 900
actttatcgt cggcagcact ccgagtcaat cggatctgac gaccgtcttg aagggctaca 960
ctgctctcgg cgttgaggtg gcctataccg aacttgacat ccgcatgcag ctgccctcga 1020
ccgccgcaaa gctggcccag cagtccactg acttccaagg cgtggccgca gcatgcgtta 1080
gcaccactgg ctgcgtgggt gtcactatct gggactggac cgacaagtac tcctgggtcc 1140
ccagcgtgtt ccaaggctac ggcgccccat tgccttggga tgagaactat gtgaagaagc 1200
cagcgtacga tggcctgatg gcgggtcttg gagcaagcgg ctccggcacc acaacgacca 1260
ctactactac ttctactacg acaggaggta cggaccctac tggagtcgct cagaaatggg 1320
gacagtgtgg cggtattggc tggaccgggc caacaacttg tgtcagtggt accacttgcc 1380
aaaagctgaa tgactggtac tcacagtgcc tgtaa 1415
&lt;210&gt; 252
&lt;211&gt; 397
&lt;212&gt; PRT
&lt;213&gt; 烟曲霉(Aspergillus fumigatus)
&lt;400&gt; 252
Met Val His Leu Ser Ser Leu Ala Ala Ala Leu Ala Ala Leu Pro Leu
1 5 10 15
Val Tyr Gly Ala Gly Leu Asn Thr Ala Ala Lys Ala Lys Gly Leu Lys
20 25 30
Tyr Phe Gly Ser Ala Thr Asp Asn Pro Glu Leu Thr Asp Ser Ala Tyr
35 40 45
Val Ala Gln Leu Ser Asn Thr Asp Asp Phe Gly Gln Ile Thr Pro Gly
50 55 60
Asn Ser Met Lys Trp Asp Ala Thr Glu Pro Ser Gln Asn Ser Phe Ser
65 70 75 80
Phe Ala Asn Gly Asp Ala Val Val Asn Leu Ala Asn Lys Asn Gly Gln
85 90 95
Leu Met Arg Cys His Thr Leu Val Trp His Ser Gln Leu Pro Asn Trp
100 105 110
Val Ser Ser Gly Ser Trp Thr Asn Ala Thr Leu Leu Ala Ala Met Lys
115 120 125
Asn His Ile Thr Asn Val Val Thr His Tyr Lys Gly Lys Cys Tyr Ala
130 135 140
Trp Asp Val Val Asn Glu Ala Leu Asn Glu Asp Gly Thr Phe Arg Asn
145 150 155 160
Ser Val Phe Tyr Gln Ile Ile Gly Pro Ala Tyr Ile Pro Ile Ala Phe
165 170 175
Ala Thr Ala Ala Ala Ala Asp Pro Asp Val Lys Leu Tyr Tyr Asn Asp
180 185 190
Tyr Asn Ile Glu Tyr Ser Gly Ala Lys Ala Thr Ala Ala Gln Asn Ile
195 200 205
Val Lys Met Ile Lys Ala Tyr Gly Ala Lys Ile Asp Gly Val Gly Leu
210 215 220
Gln Ala His Phe Ile Val Gly Ser Thr Pro Ser Gln Ser Asp Leu Thr
225 230 235 240
Thr Val Leu Lys Gly Tyr Thr Ala Leu Gly Val Glu Val Ala Tyr Thr
245 250 255
Glu Leu Asp Ile Arg Met Gln Leu Pro Ser Thr Ala Ala Lys Leu Ala
260 265 270
Gln Gln Ser Thr Asp Phe Gln Gly Val Ala Ala Ala Cys Val Ser Thr
275 280 285
Thr Gly Cys Val Gly Val Thr Ile Trp Asp Trp Thr Asp Lys Tyr Ser
290 295 300
Trp Val Pro Ser Val Phe Gln Gly Tyr Gly Ala Pro Leu Pro Trp Asp
305 310 315 320
Glu Asn Tyr Val Lys Lys Pro Ala Tyr Asp Gly Leu Met Ala Gly Leu
325 330 335
Gly Ala Ser Gly Ser Gly Thr Thr Thr Thr Thr Thr Thr Thr Ser Thr
340 345 350
Thr Thr Gly Gly Thr Asp Pro Thr Gly Val Ala Gln Lys Trp Gly Gln
355 360 365
Cys Gly Gly Ile Gly Trp Thr Gly Pro Thr Thr Cys Val Ser Gly Thr
370 375 380
Thr Cys Gln Lys Leu Asn Asp Trp Tyr Ser Gln Cys Leu
385 390 395
&lt;210&gt; 253
&lt;211&gt; 2376
&lt;212&gt; DNA
&lt;213&gt; 烟曲霉(Aspergillus fumigatus)
&lt;400&gt; 253
atggcggttg ccaaatctat tgctgccgtg ctggtagcac tgttgcctgg tgcgcttgct 60
caggcgaata caagctatgt tgattacaat gtggaggcga atccggatct cacccctcag 120
tcggtcgcta cgattgacct gtcctttccc gactgcgaga atggaccgct cagcaagact 180
ctcgtttgcg acacgtcggc tcggccgcat gaccgagctg ctgccctggt ttccatgttc 240
accttcgagg agctggtgaa caacacaggc aacactagcc ctggtgttcc aagacttggt 300
ctccctccgt accaagtatg gagcgaggct ctccatggac ttgaccgcgc caacttcaca 360
aacgagggag agtacagctg ggccacctcg ttccccatgc ctatcctgac aatgtcggcc 420
ttgaaccgaa ccctgatcaa ccagatcgcg accatcatcg caactcaagg acgagctttc 480
aataacgttg ggcggtatgg gctggacgtg tacgccccga atataaatgc attcagatcg 540
gctatgtggg gaagaggtca agagaccccc ggagaagacg cttactgcct ggcatcggcg 600
tatgcgtacg agtatatcac tggcatccag ggtggtgttg atccggaaca cctcaagttg 660
gtggccactg ccaaacacta tgcgggctac gatcttgaga actgggacgg tcactcccgt 720
ttgggcaacg atatgaacat tacacagcag gaactttccg aatactacac ccctcagttc 780
cttgttgcag ccagagacgc caaagtgcac agtgtcatgt gctcctacaa cgcggtaaat 840
ggggtgccca gctgcgcaaa ctcgttcttc ctccagaccc tcctccgtga cacattcggc 900
ttcgtcgagg atggttatgt atccagcgac tgcgactcgg cgtacaatgt ctggaacccg 960
cacgagtttg cggccaacat cacgggggcc gctgcagact ctatccgggc ggggacggac 1020
attgattgcg gcactactta tcaatactat ttcggcgaag cctttgacga gcaagaggtc 1080
acccgtgcag aaatcgaaag aggtgtgatc cgcctgtaca gcaacttggt gcgtctcggc 1140
tatttcgatg gcaatggaag cgtgtatcgg gacctgacgt ggaatgatgt cgtgaccacg 1200
gatgcctgga atatctcata cgaagccgct gtagaaggca ttgtcctact gaagaacgat 1260
ggaaccttgc ctctcgccaa gtcggtccgc agtgttgcat tgattgggcc ctggatgaat 1320
gtgacgactc agcttcaggg caactacttt ggaccggcgc cttatctgat tagtccgttg 1380
aatgccttcc agaattctga cttcgacgtg aactacgctt tcggcacgaa catttcatcc 1440
cactccacag atgggttttc cgaggcgttg tctgctgcga agaaatccga cgtcatcata 1500
ttcgcgggcg ggattgacaa cactttggaa gcagaagcca tggatcgcat gaatatcaca 1560
tggcccggca atcagctaca gctcatcgac cagttgagcc aactcggcaa accgctgatc 1620
gtcctccaga tgggcggcgg ccaagtcgac tcctcctcgc tcaagtccaa caagaatgtc 1680
aactccctga tctggggtgg ataccccgga caatccggcg ggcaggctct cctagacatc 1740
atcaccggca agcgcgcccc cgccggccga ctcgtggtca cgcagtaccc ggccgaatac 1800
gcaacccagt tccccgccac cgacatgagc ctgcggcctc acggcaataa tcccggccag 1860
acctacatgt ggtacaccgg cacccccgtc tacgagtttg gccacgggct cttctacacg 1920
accttccacg cctccctccc tggcaccggc aaggacaaga cctccttcaa catccaagac 1980
ctcctcacgc agccgcatcc gggcttcgca aacgtcgagc aaatgccttt gctcaacttc 2040
accgtgacga tcaccaatac cggcaaggtc gcttccgact acactgctat gctcttcgcg 2100
aacaccaccg cgggacctgc tccatacccg aacaagtggc tcgtcggctt cgaccggctg 2160
gcgagcctgg aaccgcacag gtcgcagact atgaccatcc ccgtgactat cgacagcgtg 2220
gctcgtacgg atgaggccgg caatcgggtt ctctacccgg gaaagtacga gttggccctg 2280
aacaatgagc ggtcggttgt ccttcagttt gtgctgacag gccgagaggc tgtgattttc 2340
aagtggcctg tagagcagca gcagatttcg tctgcg 2376
&lt;210&gt; 254
&lt;211&gt; 792
&lt;212&gt; PRT
&lt;213&gt; 烟曲霉(Aspergillus fumigatus)
&lt;400&gt; 254
Met Ala Val Ala Lys Ser Ile Ala Ala Val Leu Val Ala Leu Leu Pro
1 5 10 15
Gly Ala Leu Ala Gln Ala Asn Thr Ser Tyr Val Asp Tyr Asn Val Glu
20 25 30
Ala Asn Pro Asp Leu Thr Pro Gln Ser Val Ala Thr Ile Asp Leu Ser
35 40 45
Phe Pro Asp Cys Glu Asn Gly Pro Leu Ser Lys Thr Leu Val Cys Asp
50 55 60
Thr Ser Ala Arg Pro His Asp Arg Ala Ala Ala Leu Val Ser Met Phe
65 70 75 80
Thr Phe Glu Glu Leu Val Asn Asn Thr Gly Asn Thr Ser Pro Gly Val
85 90 95
Pro Arg Leu Gly Leu Pro Pro Tyr Gln Val Trp Ser Glu Ala Leu His
100 105 110
Gly Leu Asp Arg Ala Asn Phe Thr Asn Glu Gly Glu Tyr Ser Trp Ala
115 120 125
Thr Ser Phe Pro Met Pro Ile Leu Thr Met Ser Ala Leu Asn Arg Thr
130 135 140
Leu Ile Asn Gln Ile Ala Thr Ile Ile Ala Thr Gln Gly Arg Ala Phe
145 150 155 160
Asn Asn Val Gly Arg Tyr Gly Leu Asp Val Tyr Ala Pro Asn Ile Asn
165 170 175
Ala Phe Arg Ser Ala Met Trp Gly Arg Gly Gln Glu Thr Pro Gly Glu
180 185 190
Asp Ala Tyr Cys Leu Ala Ser Ala Tyr Ala Tyr Glu Tyr Ile Thr Gly
195 200 205
Ile Gln Gly Gly Val Asp Pro Glu His Leu Lys Leu Val Ala Thr Ala
210 215 220
Lys His Tyr Ala Gly Tyr Asp Leu Glu Asn Trp Asp Gly His Ser Arg
225 230 235 240
Leu Gly Asn Asp Met Asn Ile Thr Gln Gln Glu Leu Ser Glu Tyr Tyr
245 250 255
Thr Pro Gln Phe Leu Val Ala Ala Arg Asp Ala Lys Val His Ser Val
260 265 270
Met Cys Ser Tyr Asn Ala Val Asn Gly Val Pro Ser Cys Ala Asn Ser
275 280 285
Phe Phe Leu Gln Thr Leu Leu Arg Asp Thr Phe Gly Phe Val Glu Asp
290 295 300
Gly Tyr Val Ser Ser Asp Cys Asp Ser Ala Tyr Asn Val Trp Asn Pro
305 310 315 320
His Glu Phe Ala Ala Asn Ile Thr Gly Ala Ala Ala Asp Ser Ile Arg
325 330 335
Ala Gly Thr Asp Ile Asp Cys Gly Thr Thr Tyr Gln Tyr Tyr Phe Gly
340 345 350
Glu Ala Phe Asp Glu Gln Glu Val Thr Arg Ala Glu Ile Glu Arg Gly
355 360 365
Val Ile Arg Leu Tyr Ser Asn Leu Val Arg Leu Gly Tyr Phe Asp Gly
370 375 380
Asn Gly Ser Val Tyr Arg Asp Leu Thr Trp Asn Asp Val Val Thr Thr
385 390 395 400
Asp Ala Trp Asn Ile Ser Tyr Glu Ala Ala Val Glu Gly Ile Val Leu
405 410 415
Leu Lys Asn Asp Gly Thr Leu Pro Leu Ala Lys Ser Val Arg Ser Val
420 425 430
Ala Leu Ile Gly Pro Trp Met Asn Val Thr Thr Gln Leu Gln Gly Asn
435 440 445
Tyr Phe Gly Pro Ala Pro Tyr Leu Ile Ser Pro Leu Asn Ala Phe Gln
450 455 460
Asn Ser Asp Phe Asp Val Asn Tyr Ala Phe Gly Thr Asn Ile Ser Ser
465 470 475 480
His Ser Thr Asp Gly Phe Ser Glu Ala Leu Ser Ala Ala Lys Lys Ser
485 490 495
Asp Val Ile Ile Phe Ala Gly Gly Ile Asp Asn Thr Leu Glu Ala Glu
500 505 510
Ala Met Asp Arg Met Asn Ile Thr Trp Pro Gly Asn Gln Leu Gln Leu
515 520 525
Ile Asp Gln Leu Ser Gln Leu Gly Lys Pro Leu Ile Val Leu Gln Met
530 535 540
Gly Gly Gly Gln Val Asp Ser Ser Ser Leu Lys Ser Asn Lys Asn Val
545 550 555 560
Asn Ser Leu Ile Trp Gly Gly Tyr Pro Gly Gln Ser Gly Gly Gln Ala
565 570 575
Leu Leu Asp Ile Ile Thr Gly Lys Arg Ala Pro Ala Gly Arg Leu Val
580 585 590
Val Thr Gln Tyr Pro Ala Glu Tyr Ala Thr Gln Phe Pro Ala Thr Asp
595 600 605
Met Ser Leu Arg Pro His Gly Asn Asn Pro Gly Gln Thr Tyr Met Trp
610 615 620
Tyr Thr Gly Thr Pro Val Tyr Glu Phe Gly His Gly Leu Phe Tyr Thr
625 630 635 640
Thr Phe His Ala Ser Leu Pro Gly Thr Gly Lys Asp Lys Thr Ser Phe
645 650 655
Asn Ile Gln Asp Leu Leu Thr Gln Pro His Pro Gly Phe Ala Asn Val
660 665 670
Glu Gln Met Pro Leu Leu Asn Phe Thr Val Thr Ile Thr Asn Thr Gly
675 680 685
Lys Val Ala Ser Asp Tyr Thr Ala Met Leu Phe Ala Asn Thr Thr Ala
690 695 700
Gly Pro Ala Pro Tyr Pro Asn Lys Trp Leu Val Gly Phe Asp Arg Leu
705 710 715 720
Ala Ser Leu Glu Pro His Arg Ser Gln Thr Met Thr Ile Pro Val Thr
725 730 735
Ile Asp Ser Val Ala Arg Thr Asp Glu Ala Gly Asn Arg Val Leu Tyr
740 745 750
Pro Gly Lys Tyr Glu Leu Ala Leu Asn Asn Glu Arg Ser Val Val Leu
755 760 765
Gln Phe Val Leu Thr Gly Arg Glu Ala Val Ile Phe Lys Trp Pro Val
770 775 780
Glu Gln Gln Gln Ile Ser Ser Ala
785 790
&lt;210&gt; 255
&lt;211&gt; 42
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 255
gcagtggacg ccgtggccgc cgagccacca cggacccgtc at 42
&lt;210&gt; 256
&lt;211&gt; 42
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 256
atgacgggtc cgtggtggct cggcggccac ggcgtccact gc 42
&lt;210&gt; 257
&lt;211&gt; 42
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 257
gcagtggacg ccgtggccga agagccacca cggacccgtc at 42
&lt;210&gt; 258
&lt;211&gt; 42
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 258
atgacgggtc cgtggtggct cttcggccac ggcgtccact gc 42
&lt;210&gt; 259
&lt;211&gt; 43
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 259
catcgccctg cactcggccg ccaacaagga cggcgcccag aac 43
&lt;210&gt; 260
&lt;211&gt; 43
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 260
gttctgggcg ccgtccttgt tggcggccga gtgcagggcg atg 43
&lt;210&gt; 261
&lt;211&gt; 43
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 261
catcgccctg cactcggcct ggaacaagga cggcgcccag aac 43
&lt;210&gt; 262
&lt;211&gt; 43
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 262
gttctgggcg ccgtccttgt tccaggccga gtgcagggcg atg 43
&lt;210&gt; 263
&lt;211&gt; 43
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 263
cgccctgcac tcggccaaca agaaggacgg cgcccagaac tac 43
&lt;210&gt; 264
&lt;211&gt; 43
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 264
gtagttctgg gcgccgtcct tcttgttggc cgagtgcagg gcg 43
&lt;210&gt; 265
&lt;211&gt; 47
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 265
gcttcaatgg actccatggc ctaaatctca ccatggccca gttatca 47
&lt;210&gt; 266
&lt;211&gt; 47
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 266
tgataactgg gccatggtga gatttaggcc atggagtcca ttgaagc 47
&lt;210&gt; 267
&lt;211&gt; 47
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 267
gcttcaatgg actccatggc ctccttctca ccatggccca gttatca 47
&lt;210&gt; 268
&lt;211&gt; 47
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 268
tgataactgg gccatggtga gaaggaggcc atggagtcca ttgaagc 47
&lt;210&gt; 269
&lt;211&gt; 48
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 269
gagattattg ctcttcactc agcttggaac caggatggtg cccagaac 48
&lt;210&gt; 270
&lt;211&gt; 48
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 270
gttctgggca ccatcctggt tccaagctga gtgaagagca ataatctc 48
&lt;210&gt; 271
&lt;211&gt; 27
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (10)..(10)
&lt;223&gt; N=尿嘧啶
&lt;400&gt; 271
atgcagcgcn gccataacca tgagtga 27
&lt;210&gt; 272
&lt;211&gt; 28
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (10)..(10)
&lt;223&gt; N=尿嘧啶
&lt;400&gt; 272
agcgctgcan aattctctta ctgtcatg 28
&lt;210&gt; 273
&lt;211&gt; 36
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (8)..(8)
&lt;223&gt; N=尿嘧啶
&lt;400&gt; 273
aattaagncc tcagcgtgat ttaaaacgcc attgct 36
&lt;210&gt; 274
&lt;211&gt; 41
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (8)..(8)
&lt;223&gt; N=尿嘧啶
&lt;400&gt; 274
acttaatnaa accctcagcg cagttaggtt ggtgttcttc t 41
&lt;210&gt; 275
&lt;211&gt; 29
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (11)..(11)
&lt;223&gt; N=尿嘧啶
&lt;400&gt; 275
agctcaagga nacctacagt tattcgaaa 29
&lt;210&gt; 276
&lt;211&gt; 35
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (11)..(11)
&lt;223&gt; N=尿嘧啶
&lt;400&gt; 276
atccttgagc ngtttcctgt gtgaaattgt tatcc 35
&lt;210&gt; 277
&lt;211&gt; 37
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (9)..(9)
&lt;223&gt; N=尿嘧啶
&lt;400&gt; 277
atctcctcng ctggtctggt taagccagcc ccgacac 37
&lt;210&gt; 278
&lt;211&gt; 27
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (9)..(9)
&lt;223&gt; N=尿嘧啶
&lt;400&gt; 278
agaggagana atactctgcg ctccgcc 27
&lt;210&gt; 279
&lt;211&gt; 32
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (9)..(9)
&lt;223&gt; N=尿嘧啶
&lt;400&gt; 279
gggtttaanc ctcacacagg aaacagctat ga 32
&lt;210&gt; 280
&lt;211&gt; 46
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (12)..(12)
&lt;223&gt; N=尿嘧啶
&lt;400&gt; 280
agtgtctgcg ancgctctca ctgcccccag ttgtgtatat agagga 46
&lt;210&gt; 281
&lt;211&gt; 36
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (12)..(12)
&lt;223&gt; N=尿嘧啶
&lt;400&gt; 281
atcgcagaca cngctggcgg tagacaatca atccat 36
&lt;210&gt; 282
&lt;211&gt; 32
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (9)..(9)
&lt;223&gt; N=尿嘧啶
&lt;400&gt; 282
ggacttaang gatctaagat gagctcatgg ct 32
&lt;210&gt; 283
&lt;211&gt; 24
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 283
acgccattgc tatgatgctt gaag 24
&lt;210&gt; 284
&lt;211&gt; 21
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 284
tggtgaggtg ctatcgtcct t 21
&lt;210&gt; 285
&lt;211&gt; 21
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 285
cttcctgtag gtgcaccgaa g 21
&lt;210&gt; 286
&lt;211&gt; 21
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 286
acagaacgat atcggacctc g 21
&lt;210&gt; 287
&lt;211&gt; 23
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 287
tcgttatgtt aagtcttcta tca 23
&lt;210&gt; 288
&lt;211&gt; 21
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 288
agagctcgaa gttcctccga g 21
&lt;210&gt; 289
&lt;211&gt; 22
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 289
tatcacgagg ccctttcgtc tc 22
&lt;210&gt; 290
&lt;211&gt; 22
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 290
tccgtcggct cctctccttc gt 22
&lt;210&gt; 291
&lt;211&gt; 24
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 291
tgcatatcct ctgacagtat atga 24
&lt;210&gt; 292
&lt;211&gt; 23
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 292
cagtgaagag ggcagtcgat agt 23
&lt;210&gt; 293
&lt;211&gt; 22
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 293
acgaggaaca tggctatctg ga 22
&lt;210&gt; 294
&lt;211&gt; 23
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 294
tcagctcatt ctgggaggtg gga 23
&lt;210&gt; 295
&lt;211&gt; 22
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 295
actccaggat cctttaaatc ca 22
&lt;210&gt; 296
&lt;211&gt; 21
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 296
actggcaagg gatgccatgc t 21
&lt;210&gt; 297
&lt;211&gt; 22
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 297
tgatcatata accaattgcc ct 22
&lt;210&gt; 298
&lt;211&gt; 22
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 298
agttgtgtat atagaggatt ga 22
&lt;210&gt; 299
&lt;211&gt; 23
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 299
tggtccttcg ctcgtgatgt gga 23
&lt;210&gt; 300
&lt;211&gt; 20
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 300
agtcctcagc gttaccggca 20
&lt;210&gt; 301
&lt;211&gt; 20
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 301
accctcagct gtgtccggga 20
&lt;210&gt; 302
&lt;211&gt; 21
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 302
tggtatgtga acgccagtct g 21
&lt;210&gt; 303
&lt;211&gt; 28
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (8)..(8)
&lt;223&gt; N=尿嘧啶
&lt;400&gt; 303
agagcganat gtccttttcc aagataat 28
&lt;210&gt; 304
&lt;211&gt; 49
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (8)..(8)
&lt;223&gt; N=尿嘧啶
&lt;400&gt; 304
tctgcgantt agtgatggtg gtgatgatga ccagtataca gaggaggac 49
&lt;210&gt; 305
&lt;211&gt; 28
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (8)..(8)
&lt;223&gt; N=尿嘧啶
&lt;400&gt; 305
agagcganat gctgtcttcg acgactcg 28
&lt;210&gt; 306
&lt;211&gt; 49
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (8)..(8)
&lt;223&gt; N=尿嘧啶
&lt;400&gt; 306
tctgcganct agtgatggtg gtgatgatgg aacgtcggct caggcggcc 49
&lt;210&gt; 307
&lt;211&gt; 33
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (8)..(8)
&lt;223&gt; N=尿嘧啶
&lt;400&gt; 307
agagcganat gtctgttgct aagtttgctg gtg 33
&lt;210&gt; 308
&lt;211&gt; 49
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;220&gt;
&lt;221&gt; misc_feature
&lt;222&gt; (8)..(8)
&lt;223&gt; N=尿嘧啶
&lt;400&gt; 308
tctgcgantt agtgatggtg gtgatgatgg gcggagaggt cacgggcgt 49
&lt;210&gt; 309
&lt;211&gt; 20
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 309
cccagttatc aactaccttg 20
&lt;210&gt; 310
&lt;211&gt; 20
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 310
ctcaatttac ctctatccac 20
&lt;210&gt; 311
&lt;211&gt; 20
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 311
tataaccaat tgccctcatc 20
&lt;210&gt; 312
&lt;211&gt; 20
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 312
gcaccgtcga gctgcagtgg 20
&lt;210&gt; 313
&lt;211&gt; 20
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 313
ccttgccaac tgcaatggtg 20
&lt;210&gt; 314
&lt;211&gt; 20
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 314
gcaccgtcga gctgcagtgg 20
&lt;210&gt; 315
&lt;211&gt; 45
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 315
attattgctc ttcactcagc tttcaaccag gatggtgccc agaac 45
&lt;210&gt; 316
&lt;211&gt; 45
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 316
gttctgggca ccatcctggt tgaaagctga gtgaagagca ataat 45
&lt;210&gt; 317
&lt;211&gt; 45
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 317
attattgctc ttcactcagc tatgaaccag gatggtgccc agaac 45
&lt;210&gt; 318
&lt;211&gt; 45
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 318
gttctgggca ccatcctggt tcatagctga gtgaagagca ataat 45
&lt;210&gt; 319
&lt;211&gt; 31
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 319
ccctgcactc ggccatgaac aaggacggcg c 31
&lt;210&gt; 320
&lt;211&gt; 31
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 320
gcgccgtcct tgttcatggc cgagtgcagg g 31
&lt;210&gt; 321
&lt;211&gt; 29
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 321
gcactcggcc aaccacaagg acggcgccc 29
&lt;210&gt; 322
&lt;211&gt; 29
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 322
gggcgccgtc cttgtggttg gccgagtgc 29
&lt;210&gt; 323
&lt;211&gt; 25
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 323
ccagaccagc agaggagata atact 25
&lt;210&gt; 324
&lt;211&gt; 23
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 324
caaggatacc tacagttatt cga 23
&lt;210&gt; 325
&lt;211&gt; 30
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 325
ccagaccagc agaggagata atactctgcg 30
&lt;210&gt; 326
&lt;211&gt; 32
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 326
caaggatacc tacagttatt cgaaacctcc tg 32
&lt;210&gt; 327
&lt;211&gt; 42
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 327
tccagtggac tacctggccc aagagccacc acggccctgt cc 42
&lt;210&gt; 328
&lt;211&gt; 32
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 328
gggccaggta gtccactgga gctcaacagt ac 32
&lt;210&gt; 329
&lt;211&gt; 42
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 329
tccagtggac tacctggccc cccagccacc acggccctgt cc 42
&lt;210&gt; 330
&lt;211&gt; 32
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 330
gggccaggta gtccactgga gctcaacagt ac 32
&lt;210&gt; 331
&lt;211&gt; 46
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 331
ccggtacctg ggccagtgat atcttgatcg ccaacaacaa cagctg 46
&lt;210&gt; 332
&lt;211&gt; 30
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 332
atcactggcc caggtaccgg ggacgtcgtc 30
&lt;210&gt; 333
&lt;211&gt; 46
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 333
ccggtacctg ggccagtgat ctcttgatcg ccaacaacaa cagctg 46
&lt;210&gt; 334
&lt;211&gt; 30
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 334
atcactggcc caggtaccgg ggacgtcgtc 30
&lt;210&gt; 335
&lt;211&gt; 49
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 335
aaatcattgc ccttcactct gctttcaaca aggatggtgc tcagaacta 49
&lt;210&gt; 336
&lt;211&gt; 33
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 336
agcagagtga agggcaatga tttcgtgacg gag 33
&lt;210&gt; 337
&lt;211&gt; 49
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 337
aaatcattgc ccttcactct gctatgaaca aggatggtgc tcagaacta 49
&lt;210&gt; 338
&lt;211&gt; 33
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 338
agcagagtga agggcaatga tttcgtgacg gag 33
&lt;210&gt; 339
&lt;211&gt; 49
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 339
aaatcattgc ccttcactct gctgccaaca aggatggtgc tcagaacta 49
&lt;210&gt; 340
&lt;211&gt; 33
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 340
agcagagtga agggcaatga tttcgtgacg gag 33
&lt;210&gt; 341
&lt;211&gt; 49
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 341
aaatcattgc ccttcactct gcttggaaca aggatggtgc tcagaacta 49
&lt;210&gt; 342
&lt;211&gt; 33
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 342
agcagagtga agggcaatga tttcgtgacg gag 33
&lt;210&gt; 343
&lt;211&gt; 47
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 343
cattgccctt cactctgctg gtcacaagga tggtgctcag aactacc 47
&lt;210&gt; 344
&lt;211&gt; 34
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 344
accagcagag tgaagggcaa tgatttcgtg acgg 34
&lt;210&gt; 345
&lt;211&gt; 47
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 345
cattgccctt cactctgctg gtaagaagga tggtgctcag aactacc 47
&lt;210&gt; 346
&lt;211&gt; 34
&lt;212&gt; DNA
&lt;213&gt; 人工序列
&lt;220&gt;
&lt;223&gt; 人工DNA引物
&lt;400&gt; 346
accagcagag tgaagggcaa tgatttcgtg acgg 34

Claims (21)

1.一种GH61多肽变体,包含一个在与SEQ ID NO:30的成熟多肽的位置105、154、188、189、216、以及229相对应的一个或多个位置处的取代,其中该变体具有纤维素分解增强活性。
2.如权利要求1所述的变体,该变体与亲本GH61多肽的氨基酸序列具有至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%、但少于100%的序列一致性。
3.如权利要求1或2中任一项所述的变体,该变体是选自由以下各项组成的组的具有纤维素分解增强活性的亲本GH61多肽的变体:(a)与SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、或180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、或216的成熟多肽具有至少60%序列一致性的多肽;(b)由在至少低严谨度条件下与以下杂交的多核苷酸编码的多肽:(i)SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、或179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、或215的成熟多肽编码序列,或(ii)(i)的全长互补体;(c)由与SEQ ID NO:1、3、5、7、9、11、13、15、17、19、21、23、25、27、29、31、33、35、37、39、41、43、45、47、49、51、53、55、57、59、61、63、65、67、69、71、73、75、77、79、81、83、85、87、89、91、93、95、97、99、101、103、105、107、109、111、113、115、117、119、121、123、125、127、129、131、133、135、137、139、141、143、145、147、149、151、153、155、157、159、161、163、165、167、169、171、173、175、177、或179、181、183、185、187、189、191、193、195、197、199、201、203、205、207、209、211、213、或215的成熟多肽编码序列具有至少60%的序列一致性的多核苷酸编码的多肽;以及(d)SEQ IDNO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、或180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、或216的成熟多肽的片段。
4.如权利要求3所述的变体,其中该亲本GH61多肽包含SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、或180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、或216的成熟多肽,或由其组成。
5.如权利要求1-4中任一项所述的变体,该变体与SEQ ID NO:2、4、6、8、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、72、74、76、78、80、82、84、86、88、90、92、94、96、98、100、102、104、106、108、110、112、114、116、118、120、122、124、126、128、130、132、134、136、138、140、142、144、146、148、150、152、154、156、158、160、162、164、166、168、170、172、174、176、178、或180、182、184、186、188、190、192、194、196、198、200、202、204、206、208、210、212、214、或216的成熟多肽具有至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少95%、至少96%、至少97%、至少98%、或至少99%、但少于100%的序列一致性。
6.如权利要求1-5中任一项所述的变体,该变体包含选自由以下各项组成的组的一个或多个取代或相对应的取代:E105P,K;E154I,L;G188A,F,M,W;N189H,K;A216L,Y;以及K229W,H,I,Y。
7.如权利要求1-6中任一项所述的变体,该变体进一步包含一个在与SEQ ID NO:30的成熟多肽的位置111、152、155、以及162相对应的一个或多个位置处的取代,其中该变体具有纤维素分解增强活性。
8.如权利要求7所述的变体,该变体包含选自由以下各项组成的组的一个或多个取代或相对应的取代:L111V、D152S、M155L、以及A162W。
9.如权利要求1-8中任一项所述的变体,该变体进一步包含一个在与SEQ ID NO:30的成熟多肽的位置96、98、200、202、以及204相对应的一个或多个位置处的取代,其中该变体具有纤维素分解增强活性。
10.如权利要求9所述的变体,该变体包含选自由以下各项组成的组的一个或多个取代或相对应的取代:I96V、F98L、F200I、I202L、以及I204V。
11.如权利要求1-10中任一项所述的变体,其中与该亲本相比,该变体的热稳定性增加至少1.01倍,例如至少1.05倍、至少1.1倍、至少1.2倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.8倍、至少2倍、至少5倍、至少10倍、至少15倍、至少20倍、至少25倍、至少50倍、至少75倍、或至少100倍。
12.一种分离的多核苷酸,其编码如权利要求1-11中任一项所述的变体。
13.一种产生GH61多肽变体的方法,包括:(a)在适于该变体表达的条件下培养包含如权利要求12所述的多核苷酸的宿主细胞;并且任选地(b)回收该变体。
14.一种转基因植物、植物部分或植物细胞,其用如权利要求12所述的多核苷酸进行了转化。
15.一种产生如权利要求1-11中任一项所述的变体的方法,包括:(a)在有助于该变体产生的条件下培养包含编码该变体的多核苷酸的转基因植物或植物细胞;并且任选地(b)回收该变体。
16.一种用于获得GH61多肽变体的方法,包括在亲本GH61多肽的与SEQ ID NO:30的成熟多肽的位置105、154、188、189、216、以及229相对应的一个或多个位置处引入一个取代,其中该变体具有纤维素分解增强活性;并且任选地回收该变体。
17.一种用于降解或转化纤维素材料的工艺,包括:在如权利要求1-11中任一项所述的具有纤维素分解增强活性的GH61多肽变体的存在下,用一种酶组合物处理该纤维素材料。
18.一种用于产生发酵产物的工艺,包括:(a)在如权利要求1-11中任一项所述的具有纤维素分解增强活性的GH61多肽变体的存在下,用一种酶组合物糖化纤维素材料;(b)用一种或多种发酵微生物发酵该糖化的纤维素材料,以产生该发酵产物;并且(c)从该发酵中回收该发酵产物。
19.一种发酵纤维素材料的工艺,包括:用一种或多种发酵微生物发酵该纤维素材料,其中在如权利要求1-11中任一项所述的具有纤维素分解增强活性的GH61多肽变体的存在下,用一种酶组合物糖化该纤维素材料。
20.一种全液配制品或细胞培养组合物,包含如权利要求1-11中任一项所述的变体。
21.一种洗涤剂组合物,包含一种表面活性剂和如权利要求1-11中任一项所述的变体。
CN201810939270.7A 2011-11-21 2012-11-21 Gh61多肽变体以及编码所述变体的多核苷酸 Pending CN109112118A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201161562277P 2011-11-21 2011-11-21
US61/562,277 2011-11-21
CN201280057243.8A CN103958672A (zh) 2011-11-21 2012-11-21 Gh61多肽变体以及编码所述变体的多核苷酸

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201280057243.8A Division CN103958672A (zh) 2011-11-21 2012-11-21 Gh61多肽变体以及编码所述变体的多核苷酸

Publications (1)

Publication Number Publication Date
CN109112118A true CN109112118A (zh) 2019-01-01

Family

ID=48539370

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201280057243.8A Pending CN103958672A (zh) 2011-11-21 2012-11-21 Gh61多肽变体以及编码所述变体的多核苷酸
CN201810939270.7A Pending CN109112118A (zh) 2011-11-21 2012-11-21 Gh61多肽变体以及编码所述变体的多核苷酸

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201280057243.8A Pending CN103958672A (zh) 2011-11-21 2012-11-21 Gh61多肽变体以及编码所述变体的多核苷酸

Country Status (7)

Country Link
US (2) US10351834B2 (zh)
EP (3) EP2802651B1 (zh)
CN (2) CN103958672A (zh)
BR (1) BR112014012165A2 (zh)
CA (1) CA2855451A1 (zh)
DK (2) DK2802651T3 (zh)
WO (1) WO2013119302A2 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105969751A (zh) * 2016-06-14 2016-09-28 南京工业大学 一种β-葡萄糖苷酶基因及其应用
CN112143745A (zh) * 2020-09-18 2020-12-29 集美大学 一种β-木糖苷酶及其应用

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8569581B2 (en) 2009-09-17 2013-10-29 Novozymes, Inc Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
MX2013007997A (es) * 2011-02-23 2013-08-21 Novozymes Inc Polipeptidos que tienen actividad de incremento celulolitico y polinucleotidos que codifican para los mismos.
US9340810B2 (en) * 2011-04-25 2016-05-17 Novozymes, Inc. Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
WO2013043910A1 (en) * 2011-09-20 2013-03-28 Novozymes A/S Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
WO2013064075A1 (en) * 2011-10-31 2013-05-10 Novozymes, Inc. Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
CN104755617B (zh) 2012-10-08 2019-01-01 诺维信公司 具有纤维素分解增强活性的多肽以及编码它们的多核苷酸
EP3027743A1 (en) 2013-07-29 2016-06-08 Danisco US Inc. Variant enzymes
EP3077514A1 (en) * 2013-12-03 2016-10-12 Novozymes A/S Fungal gene library by double split-marker integration
WO2015144782A1 (en) * 2014-03-25 2015-10-01 Novozymes A/S Dishwashing composition containing cellulytic enzymes and use thereof
US20180171271A1 (en) * 2015-06-30 2018-06-21 Novozymes A/S Laundry detergent composition, method for washing and use of composition
WO2017070219A1 (en) 2015-10-20 2017-04-27 Novozymes A/S Lytic polysaccharide monooxygenase (lpmo) variants and polynucleotides encoding same
EP3487995B1 (en) 2016-07-21 2021-05-26 Novozymes A/S Serine protease variants and polynucleotides encoding same
WO2023225459A2 (en) 2022-05-14 2023-11-23 Novozymes A/S Compositions and methods for preventing, treating, supressing and/or eliminating phytopathogenic infestations and infections

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1980953A (zh) * 2004-01-30 2007-06-13 诺维信股份有限公司 具有分解纤维增强活性的多肽及其编码多核苷酸
CN101555472A (zh) * 2002-12-20 2009-10-14 诺维信公司 具有纤维二糖水解酶ⅱ活性的多肽及编码它的多核苷酸
CN101784659A (zh) * 2007-05-31 2010-07-21 诺维信股份有限公司 具有纤维素分解增强活性的多肽和编码它的多核苷酸
WO2011050037A1 (en) * 2009-10-23 2011-04-28 Novozymes, Inc. Cellobiohydrolase variants and polynucleotides encoding same

Family Cites Families (173)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US1271679A (en) * 1918-01-17 1918-07-09 Ralph E Duckett Combined fork and spoon.
US2559170A (en) * 1947-12-10 1951-07-03 Pickett Herbert Micrometer caliper with ball pivot and cam
GB1296839A (zh) 1969-05-29 1972-11-22
GB1372034A (en) 1970-12-31 1974-10-30 Unilever Ltd Detergent compositions
GB1483591A (en) 1973-07-23 1977-08-24 Novo Industri As Process for coating water soluble or water dispersible particles by means of the fluid bed technique
GB1590432A (en) 1976-07-07 1981-06-03 Novo Industri As Process for the production of an enzyme granulate and the enzyme granuate thus produced
DK187280A (da) 1980-04-30 1981-10-31 Novo Industri As Ruhedsreducerende middel til et fuldvaskemiddel fuldvaskemiddel og fuldvaskemetode
DK263584D0 (da) 1984-05-29 1984-05-29 Novo Industri As Enzymholdige granulater anvendt som detergentadditiver
EP0218272B1 (en) 1985-08-09 1992-03-18 Gist-Brocades N.V. Novel lipolytic enzymes and their use in detergent compositions
EG18543A (en) 1986-02-20 1993-07-30 Albright & Wilson Protected enzyme systems
DK122686D0 (da) 1986-03-17 1986-03-17 Novo Industri As Fremstilling af proteiner
US5989870A (en) 1986-04-30 1999-11-23 Rohm Enzyme Finland Oy Method for cloning active promoters
US4810414A (en) 1986-08-29 1989-03-07 Novo Industri A/S Enzymatic detergent additive
NZ221627A (en) 1986-09-09 1993-04-28 Genencor Inc Preparation of enzymes, modifications, catalytic triads to alter ratios or transesterification/hydrolysis ratios
DE3854249T2 (de) 1987-08-28 1996-02-29 Novo Nordisk As Rekombinante Humicola-Lipase und Verfahren zur Herstellung von rekombinanten Humicola-Lipasen.
JPS6474992A (en) 1987-09-16 1989-03-20 Fuji Oil Co Ltd Dna sequence, plasmid and production of lipase
ATE129523T1 (de) 1988-01-07 1995-11-15 Novo Nordisk As Spezifische protease.
DK6488D0 (da) 1988-01-07 1988-01-07 Novo Industri As Enzymer
JP3079276B2 (ja) 1988-02-28 2000-08-21 天野製薬株式会社 組換え体dna、それを含むシュードモナス属菌及びそれを用いたリパーゼの製造法
WO1989009259A1 (en) 1988-03-24 1989-10-05 Novo-Nordisk A/S A cellulase preparation
US5776757A (en) 1988-03-24 1998-07-07 Novo Nordisk A/S Fungal cellulase composition containing alkaline CMC-endoglucanase and essentially no cellobiohydrolase and method of making thereof
US5223409A (en) 1988-09-02 1993-06-29 Protein Engineering Corp. Directed evolution of novel binding proteins
NZ234059A (en) 1989-06-13 1992-05-26 Genencor Int Method of killing cells by acid treatment; composition therefor
GB8915658D0 (en) 1989-07-07 1989-08-23 Unilever Plc Enzymes,their production and use
US5275944A (en) 1989-09-26 1994-01-04 Midwest Research Institute Thermostable purified endoglucanas from acidothermus cellulolyticus ATCC 43068
US5110735A (en) 1989-09-26 1992-05-05 Midwest Research Institute Thermostable purified endoglucanase from thermophilic bacterium acidothermus cellulolyticus
US5536655A (en) 1989-09-26 1996-07-16 Midwest Research Institute Gene coding for the E1 endoglucanase
IL97645A (en) 1990-03-23 1997-03-18 Gist Brocades Nv Production of enzymes in seeds and their use
JP3112937B2 (ja) 1990-04-14 2000-11-27 カリ―ヒエミー アクチエンゲゼルシヤフト アルカリ性バチルスーリパーゼ、これをコード化するdna配列およびこのリパーゼを生産するバチルス
BR9106435A (pt) 1990-05-09 1993-05-04 Novo Nordisk As Preparado de celulase,enzima demonstrando atividade de andoglucanase,enzima de endoglucanase,construcao de dna,vetor de expressao celula,processo para produzir uma enzima de endoglucanase,aditivo composicao detergente,e processo para reduzir a taxa em que os tecidos contendo celulose,se tornam asperos,prover clareamento da cor de tecidos contendo celulose colorida,prover uma variacao localizada da cor de tecidos contendo colorida,e melhorar as propriedades de drenagem de polpa
DK115890D0 (da) 1990-05-09 1990-05-09 Novo Nordisk As Enzym
US6395966B1 (en) 1990-08-09 2002-05-28 Dekalb Genetics Corp. Fertile transgenic maize plants containing a gene encoding the pat protein
DK0548228T3 (da) 1990-09-13 1999-05-10 Novo Nordisk As Lipasevarianter
IL99552A0 (en) 1990-09-28 1992-08-18 Ixsys Inc Compositions containing procaryotic cells,a kit for the preparation of vectors useful for the coexpression of two or more dna sequences and methods for the use thereof
EP0495257B1 (en) 1991-01-16 2002-06-12 The Procter & Gamble Company Compact detergent compositions with high activity cellulase
ES2085024T3 (es) 1991-04-30 1996-05-16 Procter & Gamble Detergentes liquidos reforzados con complejo de acido borico-poliol para inhibir la enzima proteolitica.
EP0511456A1 (en) 1991-04-30 1992-11-04 The Procter & Gamble Company Liquid detergents with aromatic borate ester to inhibit proteolytic enzyme
ATE168130T1 (de) 1991-05-01 1998-07-15 Novo Nordisk As Stabilisierte enzyme und waschmittelzusammensetzungen
DK72992D0 (da) 1992-06-01 1992-06-01 Novo Nordisk As Enzym
DK88892D0 (da) 1992-07-06 1992-07-06 Novo Nordisk As Forbindelse
EP0651794B1 (en) 1992-07-23 2009-09-30 Novozymes A/S MUTANT $g(a)-AMYLASE, DETERGENT AND DISH WASHING AGENT
EP0663950B1 (en) 1992-10-06 2004-03-17 Novozymes A/S Cellulase variants
DK0867504T4 (da) 1993-02-11 2011-08-29 Genencor Int Oxidativ stabil alfa-amylase
ATE258224T1 (de) 1993-03-10 2004-02-15 Novozymes As Enzyme mit xylanaseaktivität aus aspergillus aculeatus
EP0652946B1 (en) 1993-04-27 2005-01-26 Genencor International, Inc. New lipase variants for use in detergent applications
DK52393D0 (zh) 1993-05-05 1993-05-05 Novo Nordisk As
FR2704860B1 (fr) 1993-05-05 1995-07-13 Pasteur Institut Sequences de nucleotides du locus cryiiia pour le controle de l'expression de sequences d'adn dans un hote cellulaire.
JP2859520B2 (ja) 1993-08-30 1999-02-17 ノボ ノルディスク アクティーゼルスカブ リパーゼ及びそれを生産する微生物及びリパーゼ製造方法及びリパーゼ含有洗剤組成物
AU7853194A (en) 1993-10-13 1995-05-04 Novo Nordisk A/S H2o2-stable peroxidase variants
JPH07143883A (ja) 1993-11-24 1995-06-06 Showa Denko Kk リパーゼ遺伝子及び変異体リパーゼ
DE4343591A1 (de) 1993-12-21 1995-06-22 Evotec Biosystems Gmbh Verfahren zum evolutiven Design und Synthese funktionaler Polymere auf der Basis von Formenelementen und Formencodes
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
ATE222604T1 (de) 1994-02-22 2002-09-15 Novozymes As Methode zur herstellung einer variante eines lipolytischen enzymes
EP1632557B1 (en) 1994-03-08 2011-02-23 Novozymes A/S Novel alkaline cellulases
JP3851656B2 (ja) 1994-05-04 2006-11-29 ジェネンコア インターナショナル インコーポレーテッド 改善された界面活性剤耐性を有するリパーゼ
DK0765394T3 (da) 1994-06-03 2001-12-10 Novozymes As Oprensede Myceliopthora-laccaser og nukleinsyrer der koder for disse
WO1995035381A1 (en) 1994-06-20 1995-12-28 Unilever N.V. Modified pseudomonas lipases and their use
AU2884695A (en) 1994-06-23 1996-01-19 Unilever Plc Modified pseudomonas lipases and their use
EP0777737B1 (en) 1994-06-30 2005-05-04 Novozymes Biotech, Inc. Non-toxic, non-toxigenic, non-pathogenic fusarium expression system and promoters and terminators for use therein
JPH10507073A (ja) 1994-10-06 1998-07-14 ノボ ノルディスク アクティーゼルスカブ エンドグルカナーゼ活性を有する酵素及び酵素調製品
BE1008998A3 (fr) 1994-10-14 1996-10-01 Solvay Lipase, microorganisme la produisant, procede de preparation de cette lipase et utilisations de celle-ci.
CN1167503A (zh) 1994-10-26 1997-12-10 诺沃挪第克公司 一种具有脂解活性的酶
AR000862A1 (es) 1995-02-03 1997-08-06 Novozymes As Variantes de una ó-amilasa madre, un metodo para producir la misma, una estructura de adn y un vector de expresion, una celula transformada por dichaestructura de adn y vector, un aditivo para detergente, composicion detergente, una composicion para lavado de ropa y una composicion para la eliminacion del
JPH08228778A (ja) 1995-02-27 1996-09-10 Showa Denko Kk 新規なリパーゼ遺伝子及びそれを用いたリパーゼの製造方法
CN101173263A (zh) 1995-03-17 2008-05-07 诺沃奇梅兹有限公司 新的内切葡聚糖酶
EP0839186B1 (en) 1995-07-14 2004-11-10 Novozymes A/S A modified enzyme with lipolytic activity
WO1997007202A1 (en) 1995-08-11 1997-02-27 Novo Nordisk A/S Novel lipolytic enzymes
US20030044956A1 (en) 1995-08-23 2003-03-06 Short Jay M. Enzymes having carboxymethyl cellulase activity and methods of use thereof
US5763385A (en) 1996-05-14 1998-06-09 Genencor International, Inc. Modified α-amylases having altered calcium binding properties
WO1998008940A1 (en) 1996-08-26 1998-03-05 Novo Nordisk A/S A novel endoglucanase
BR9711479B1 (pt) 1996-09-17 2009-08-11 variante de celulase tendo uma resistência aumentada a tensìdeo de ánion.
US6451063B1 (en) 1996-09-25 2002-09-17 Genencor International, Inc. Cellulase for use in industrial processes
JP2001502369A (ja) 1996-10-08 2001-02-20 ノボ ノルディスク アクティーゼルスカブ 染料前駆体としてのジアミノ安息香酸誘導体
US6017870A (en) 1996-10-09 2000-01-25 Genencor International, Inc. Purified cellulase and method of producing
US7883872B2 (en) 1996-10-10 2011-02-08 Dyadic International (Usa), Inc. Construction of highly efficient cellulase compositions for enzymatic hydrolysis of cellulose
US5811381A (en) 1996-10-10 1998-09-22 Mark A. Emalfarb Cellulase compositions and methods of use
ATE510910T1 (de) 1996-11-04 2011-06-15 Novozymes As Subtilase-varianten und verbindungen
WO1998020116A1 (en) 1996-11-04 1998-05-14 Novo Nordisk A/S Subtilase variants and compositions
US6159731A (en) 1997-02-12 2000-12-12 Massachusetts Institute Of Technology Daxx, a Fas-binding protein that activates JNK and apoptosis
AU739445B2 (en) 1997-07-31 2001-10-11 Dsm Ip Assets B.V. Cellulose degrading enzymes of aspergillus
US5871550A (en) 1997-08-26 1999-02-16 Genencor International, Inc. Mutant Thermonospora spp. cellulase
JP2001523464A (ja) 1997-11-19 2001-11-27 ジェネンコア インターナショナル インコーポレーテッド 放線菌類により産生されるセルラーゼとその産生方法
AU1726299A (en) 1997-12-16 1999-07-05 Genencor International, Inc. Novel egiii-like enzymes, dna encoding such enzymes and methods for producing such enzymes
US5955310A (en) 1998-02-26 1999-09-21 Novo Nordisk Biotech, Inc. Methods for producing a polypeptide in a bacillus cell
ATE332968T1 (de) 1998-10-26 2006-08-15 Novozymes As Erstellung und durchmusterung von interessierenden dna-banken in zellen von filamentösen pilzen
ES2317706T3 (es) 1998-12-23 2009-04-16 Novozymes A/S Metodo para produicir polipeptidos en celulas mutantes de aspergillus.
EP2278016B1 (en) 1999-03-22 2012-09-26 Novozymes Inc. Promoter sequences derived from Fusarium Venenatum and uses thereof
EP1179051A4 (en) 1999-05-19 2003-04-23 Midwest Research Inst ENDOGLUCANASE E1 VARIANTS: Y245G, Y82R AND W42R
ES2166316B1 (es) 2000-02-24 2003-02-16 Ct Investig Energeticas Ciemat Procedimiento de produccion de etanol a partir de biomasa lignocelulosica utilizando una nueva levadura termotolerante.
US7151204B2 (en) 2001-01-09 2006-12-19 Monsanto Technology Llc Maize chloroplast aldolase promoter compositions and methods for use thereof
AU2002316785A1 (en) 2001-05-18 2002-12-03 Novozymes A/S Polypeptides having cellobiase activity and polynucleotides encoding same
US7063962B2 (en) 2001-07-20 2006-06-20 Novozymes A/S DNA sequences for regulating transcription
WO2003012036A2 (en) 2001-07-27 2003-02-13 The Government Of The United States Of America As Represented By The Secretary Of Health And Human Services Systems for in vivo site-directed mutagenesis using oligonucleotides
US6982159B2 (en) 2001-09-21 2006-01-03 Genencor International, Inc. Trichoderma β-glucosidase
US7056721B2 (en) 2001-12-18 2006-06-06 Genencor International, Inc. EGVI endoglucanase and nucleic acids encoding the same
US7045332B2 (en) 2001-12-18 2006-05-16 Genencor International, Inc. BGL4 β-glucosidase and nucleic acids encoding the same
US7005289B2 (en) 2001-12-18 2006-02-28 Genencor International, Inc. BGL5 β-glucosidase and nucleic acids encoding the same
US7045331B2 (en) 2001-12-18 2006-05-16 Genencor International, Inc. EGVII endoglucanase and nucleic acids encoding the same
US7049125B2 (en) 2001-12-18 2006-05-23 Genencor International, Inc. EGVIII endoglucanase and nucleic acids encoding the same
CN100448996C (zh) 2002-01-23 2009-01-07 皇家奈达尔科股份有限公司 戊糖的发酵
DK1578943T3 (da) 2002-08-16 2012-01-09 Danisco Us Inc Nye variant-Hypocrea jecorina-CBH1-cellulaser
EP1556512B1 (en) 2002-11-07 2016-06-15 Danisco US Inc. Bgl6 beta-glucosidase and nucleic acids encoding the same
US7407788B2 (en) 2002-11-21 2008-08-05 Danisco A/S, Genencor Division BGL7 beta-glucosidase and nucleic acids encoding the same
CA2514834A1 (en) 2003-02-06 2004-08-19 Novozymes A/S Human heavy chain antibody expression in filamentous fungi
US7452707B2 (en) 2003-03-21 2008-11-18 Danisco A/S, Genencor Division CBH1 homologs and variant CBH1 cellulases
JP5427342B2 (ja) 2003-04-01 2014-02-26 ジェネンコー・インターナショナル・インク 変異体フミコーラ・グリセアcbh1.1
DK1627049T3 (da) 2003-05-29 2010-05-31 Genencor Int Nye Trichoderma-gener
ES2437198T3 (es) 2003-10-28 2014-01-09 Novozymes Inc. Polipéptidos con actividad de beta-glucosidasa y polinucleótidos aislados que codifican los polipéptidos
US7271244B2 (en) 2004-02-06 2007-09-18 Novozymes, Inc. Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
US7960160B2 (en) 2004-02-12 2011-06-14 Novozymes, Inc. Polypeptides having xylanase activity from Aspergillus fumigatus
US8097445B2 (en) 2004-03-25 2012-01-17 Danisco Us Inc. Exo-endo cellulase fusion protein
BRPI0509212A (pt) 2004-03-25 2007-08-28 Genencor Int proteìna de fusão de celulase e construto de fusão de celulase heterólogo codificando a mesma
DK176540B1 (da) 2004-09-24 2008-07-21 Cambi Bioethanol Aps Fremgangsmåde til behandling af biomasse og organisk affald med henblik på at udvinde önskede biologisk baserede produkter
DK2292747T3 (en) 2004-12-30 2017-04-24 Danisco Us Inc CBH2 CELLULASE VARIETIES OF HYPOCREA JECORINA
ES2358243T5 (es) * 2005-01-06 2014-06-09 Novozymes, Inc. Polipéptidos con actividad celobiohidrolasa y polinucleótidos que los codifican
EP1885840B1 (en) 2005-04-12 2012-02-29 E.I. Du Pont De Nemours And Company System and process for biomass treatment
AR053066A1 (es) 2005-04-26 2007-04-18 Novozymes As Arabinofuranosidasas
BRPI0609906A8 (pt) 2005-04-29 2017-11-21 Ab Enzymes Oy proteína de fusão de celulase, seu processo de produção e composição detergente contendo a mesma, vetor de expressão, célula hospedeira, preparação de enzima, processos para desbotamento e para bioacabamento e métodos de tratamento de fibra celulósica contendo material têxtil, para tratar fibra ou polpa derivada de madeira e para melhorar a qualidade de ração animal
JP5221347B2 (ja) 2005-08-04 2013-06-26 ノボザイムス,インコーポレイティド β−グルコシダーゼ活性を有するポリペプチドおよびそれをコードするポリヌクレオチド
CA2623908A1 (en) 2005-09-30 2007-08-09 Novozymes, Inc. Methods for enhancing the degradation or conversion of cellulosic material
FI120045B (fi) 2005-12-22 2009-06-15 Roal Oy Selluloosamateriaalin käsittely ja siinä käyttökelpoiset entsyymit
WO2007071820A1 (en) 2005-12-22 2007-06-28 Ab Enzymes Oy Novel enzymes
US8304212B2 (en) 2006-07-10 2012-11-06 Dyadic International, Inc. Methods and compositions for degradation of lignocellulosic material
US8546106B2 (en) 2006-07-21 2013-10-01 Novozymes, Inc. Methods of increasing secretion of polypeptides having biological activity
JP5497632B2 (ja) 2007-05-09 2014-05-21 ノボザイムス アクティーゼルスカブ 関心対象のポリペプチドを産生するライブラリークローンの選択に適した発現クローニング法
CN101809150B (zh) 2007-05-31 2013-09-04 诺维信股份有限公司 提高多肽的纤维素分解增强活性的方法
CN101874109B (zh) 2007-09-28 2013-07-10 诺维信公司 具有纤维二糖水解酶活性的多肽和编码该多肽的多核苷酸
EP2195421B1 (en) 2007-09-28 2015-09-16 Novozymes A/S Polypeptides having acetylxylan esterase activity and polynucleotides encoding same
BRPI0820552A2 (pt) 2007-11-27 2014-10-14 Novozymes As Polipetídeo isolado, polinucleotídeo isolado, construção de ácido nucléico, vetor de expressão recombinante, célula hospedeira recombinante, métodos para produzir o polipeptídeo, para produzir uma proteína, e para degradar ou converter um material de biomassa, planta, parte vegetal ou célula vegetal transgêncica, método, composição, e. uso do polipeptídio.
EP2238243B1 (en) 2007-11-30 2019-01-09 Novozymes A/S Polypeptides having arabinofuranosidase activity and polynucleotides encoding same
CA2707771A1 (en) 2007-12-05 2009-06-25 Novozymes A/S Polypeptides having xylanase activity and polynucleotides encoding same
DK2224822T3 (da) 2007-12-06 2014-08-25 Novozymes As Polypeptider med acetylxylanesterase-aktivitet og polynukleotider, der koder for disse
US8034995B2 (en) 2007-12-07 2011-10-11 Novozymes A/S Polypeptides having feruloyl esterase activity and polynucleotides encoding same
CN101970471A (zh) 2007-12-19 2011-02-09 诺维信公司 具有纤维素分解增强活性的多肽和编码该多肽的多核苷酸
CA2709490A1 (en) 2007-12-19 2009-07-09 Novozymes A/S Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
EP2235048A1 (en) 2007-12-19 2010-10-06 Novozymes A/S Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
BRPI0822090A2 (pt) 2007-12-19 2017-05-23 Novozymes As polipeptídeo isolado, polinucleotídeo isolado, construção de ácido nucléico, célula hospedeira recombinante, métodos para produzir o polipeptídeo, para produzir um mutante de uma célula precursora, de inibir a expressão de um polipeptídeo, para produzir uma proteína, para degradar ou converter um material celulósico, para a produção de um produto de fermentação, para fermentar um material celulósico, planta transgênica, parte vegetal ou célula vegetal, molécula de rna inibidora de duplo filamento
US9481873B2 (en) 2008-04-17 2016-11-01 Novozymes A/S Polypeptides having ferulic acid esterase activity and polynucleotides encoding same
CN102112603A (zh) 2008-07-29 2011-06-29 诺维信公司 具有α-葡糖醛酸糖苷酶活性的多肽和编码该多肽的多核苷酸
BRPI0914685A2 (pt) 2008-07-31 2019-09-24 Novozymes As peptídeo e polinucleotídeo isolados, célula hospedeira recombinante, métodos para produzir o polipeptídeo, um mutante de uma célula precursora, uma proteína, e um produto de fermentação, para inibir a expressão de um polipeptídeo, para degradar ou converter e para fermentar um material celulósico ou contendo xilano, planta transgênica, parte de planta ou célula de planta, e, molécula de rna inibidora de filamento duplo
JP2012504390A (ja) 2008-09-30 2012-02-23 ノボザイムス,インコーポレイティド 糸状菌細胞におけるポジティブ及びネガティブ選択遺伝子の使用方法
CA2743049A1 (en) 2008-11-10 2010-05-14 Kimberly Brown Polypeptides having feruloyl esterase activity and polynucleotides encoding same
US8805427B2 (en) 2008-11-14 2014-08-12 Microsoft Corporation Channel reuse with cognitive low interference signals
US7771983B2 (en) 2008-12-04 2010-08-10 Novozymos, Inc. Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
WO2010065448A1 (en) 2008-12-04 2010-06-10 Novozymes, Inc. Polypeptides having feruloyl esterase activity and polynucleotides encoding same
EP2391715A1 (en) 2009-01-28 2011-12-07 Novozymes Inc. Polypeptides having beta-glucosidase activity and polynucleotides encoding same
RU2560424C2 (ru) 2009-02-20 2015-08-20 ДАНИСКО ЮЭс ИНК. Способ получения состава ферментационного бульона
EP2411511B1 (en) 2009-03-24 2018-08-08 Novozymes A/S Polypeptides having acetyl xylan esterase activity and polynucleotides encoding same
CA2795934A1 (en) 2009-04-30 2010-11-04 Novozymes, Inc. Polypeptides having xylanase activity and polynucleotides encoding same
AU2010253848C1 (en) 2009-05-29 2015-02-19 Novozymes, Inc. Methods for enhancing the degradation or conversion of cellulosic material
EP2438163B1 (en) 2009-06-02 2015-01-21 Novozymes Inc. Polypeptides having cellobiohydrolase activity and polynucleotides encoding same
CA2767169A1 (en) 2009-07-07 2011-01-13 Novozymes, Inc. Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
US8569581B2 (en) 2009-09-17 2013-10-29 Novozymes, Inc Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
EP2478095A1 (en) 2009-09-18 2012-07-25 Novozymes Inc. Polypeptides having beta-glucosidase activity and polynucleotides encoding same
EP2483295B1 (en) 2009-09-29 2015-11-25 Novozymes Inc. Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
BR112012006978B1 (pt) 2009-09-29 2018-11-06 Novozymes, Inc. célula hospedeira microbiana transgênica, métodos para produzir um polipeptídeo tendo atividade de xilanase, para degradar ou converter um material celulósico ou um material contendo xilano, para produzir um produto de fermentação, para fermentar um material celulósico ou um material contendo xilano, construção contendo ácido nucleico, e, vetor de expressão.
CA2775244A1 (en) 2009-09-30 2011-04-07 Novozymes A/S Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
WO2011041504A1 (en) 2009-09-30 2011-04-07 Novozymes, Inc. Polypeptides derived from thermoascus crustaceus having cellulolytic enhancing activity and polynucleotides encoding same
US20120260371A1 (en) 2009-10-29 2012-10-11 Novozymes A/S Polypeptides Having Cellobiohydrolase Activity and Polynucleotides Encoding Same
CN102639697B (zh) 2009-11-06 2015-03-25 诺维信股份有限公司 具有木聚糖酶活性的多肽和编码该多肽的多核苷酸
DK3550016T3 (da) 2009-11-06 2022-07-11 Novozymes Inc Sammensætninger til saccharificering af cellulosemateriale
ES2684760T3 (es) 2010-03-30 2018-10-04 Novozymes A/S Proceso para el aumento de productos derivados de procesos de fermentación
EA201300060A1 (ru) * 2010-06-29 2013-05-30 ДСМ АйПи АССЕТС Б.В. Полипептид, обладающий или содействующий активности деградации углеводного материала, и его применение
US9303074B2 (en) 2010-08-30 2016-04-05 Novoyzmes A/S Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
US8508089B2 (en) 2010-09-01 2013-08-13 Magnamotor, Llc Magnetic drive motor assembly and associated methods
WO2012044836A1 (en) 2010-09-30 2012-04-05 Novozymes, Inc. Variants of polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
MX2013003236A (es) 2010-09-30 2013-05-30 Novozymes Inc Variantes de polipeptidos que tienen actividad potenciadora celulolitica y polinucleotidos que codifican a los mismos.
MX2013004758A (es) * 2010-11-18 2013-06-28 Novozymes Inc Polipeptidos quimericos que tienen actividad de incremento celulolitico y polinucleotidos que codifican para los mismos.
MX2013007997A (es) 2011-02-23 2013-08-21 Novozymes Inc Polipeptidos que tienen actividad de incremento celulolitico y polinucleotidos que codifican para los mismos.
WO2012146171A1 (en) 2011-04-25 2012-11-01 Novozymes, Inc. Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
BR112013027463A2 (pt) 2011-04-29 2017-09-26 Novozymes Inc métodos para degradar ou converter, e para fermentar um material celulóliso, para produzir um produto de fermentação, e para limpar ou lavar uma superfície dura ou roupa suja, e, composição de detergente
WO2013163590A2 (en) * 2012-04-27 2013-10-31 Novozymes, Inc. Gh61 polypeptide variants and polynucleotides encoding same
JP6474992B2 (ja) 2014-10-21 2019-02-27 浜松ホトニクス株式会社 光検出ユニット

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101555472A (zh) * 2002-12-20 2009-10-14 诺维信公司 具有纤维二糖水解酶ⅱ活性的多肽及编码它的多核苷酸
CN1980953A (zh) * 2004-01-30 2007-06-13 诺维信股份有限公司 具有分解纤维增强活性的多肽及其编码多核苷酸
CN101784659A (zh) * 2007-05-31 2010-07-21 诺维信股份有限公司 具有纤维素分解增强活性的多肽和编码它的多核苷酸
WO2011050037A1 (en) * 2009-10-23 2011-04-28 Novozymes, Inc. Cellobiohydrolase variants and polynucleotides encoding same

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105969751A (zh) * 2016-06-14 2016-09-28 南京工业大学 一种β-葡萄糖苷酶基因及其应用
CN112143745A (zh) * 2020-09-18 2020-12-29 集美大学 一种β-木糖苷酶及其应用
CN112143745B (zh) * 2020-09-18 2023-09-01 集美大学 一种β-木糖苷酶及其应用

Also Published As

Publication number Publication date
DK2802651T3 (en) 2017-05-22
EP3597736A1 (en) 2020-01-22
EP2802651B1 (en) 2017-03-08
CA2855451A1 (en) 2013-08-15
US20190316103A1 (en) 2019-10-17
US20150007369A1 (en) 2015-01-01
EP3219794B1 (en) 2019-09-11
DK3219794T3 (da) 2019-12-16
BR112014012165A2 (pt) 2020-06-23
WO2013119302A3 (en) 2013-12-19
EP2802651A2 (en) 2014-11-19
CN103958672A (zh) 2014-07-30
WO2013119302A2 (en) 2013-08-15
EP3219794A1 (en) 2017-09-20
US10351834B2 (en) 2019-07-16

Similar Documents

Publication Publication Date Title
US20240018560A1 (en) Compositions for saccharification of cellulosic material
CN105886485B (zh) β-葡糖苷酶变体及其编码多核苷酸
CN102770534B (zh) 具有纤维素分解增强活性的多肽及编码其的多核苷酸
CN104694517B (zh) 具有木聚糖酶活性的多肽和编码该多肽的多核苷酸
CN103562384B (zh) 具有内切葡聚糖酶活性的多肽及其编码多核苷酸
CN102597243B (zh) 具有纤维素分解增强活性的多肽和编码该多肽的多核苷酸
CN103384678B (zh) 具有纤维素水解增强活性的多肽及其编码多核苷酸
CN102695720B (zh) 具有纤维素分解增强活性的多肽和编码该多肽的多核苷酸
DK2802651T3 (en) GH61 POLYPEPTIDE VARIATIONS AND POLYNUCLEOTIDES CODING THEM
CN103237891B (zh) 具有纤维素分解增强活性的多肽变体及其编码多核苷酸
ES2594528T3 (es) Variantes de polipéptidos con actividad de mejora celulolítica y polinucleótidos que las codifican
DK2841567T3 (en) GH61 polypeptide variants and polynucleotides encoding them
CN110079558A (zh) 用家族61多肽预处理纤维素材料的方法
CN107338233A (zh) 具有木聚糖酶活性的多肽和编码该多肽的多核苷酸
NZ598403A (en) Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
CN107190030A (zh) 在纤维二糖脱氢酶存在下增加纤维素材料水解的方法
CN103797126A (zh) 用于增强纤维素材料的降解或转化的方法
DK2640833T3 (en) Chimeric polypeptides having cellulolytic enhancing ACTIVITY AND POLYNUCLEOTIDES ENCODING THEM
NZ597623A (en) Polypeptides having beta-glucosidase activity and polynucleotides encoding same
CN103930438A (zh) 具有β-葡糖苷酶活性的嵌合多肽和对其进行编码的多核苷酸
CN107002056A (zh) 碳水化合物结合模块变体以及编码它们的多核苷酸
CN104145016B (zh) 具有β-木糖苷酶活性的多肽和编码该多肽的多核苷酸
CN109415712A (zh) 纤维二糖水解酶变体和编码它们的多核苷酸
BR122022002011B1 (pt) Variante do polipeptídeo genitor gh61, polinucleotídeo isolado, célula hospedeira microbiana recombinante, métodos para produção de uma variante do polipeptídeo gh61, processos para degradação ou conversão de um material celulósico, para produção de um produto da fermentação e para fermentação de um material celulósico, composição de enzimas, composição detergente, e, método para limpeza ou lavagem de uma superfície dura ou roupa

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20190101

WD01 Invention patent application deemed withdrawn after publication