CN107002056A - 碳水化合物结合模块变体以及编码它们的多核苷酸 - Google Patents

碳水化合物结合模块变体以及编码它们的多核苷酸 Download PDF

Info

Publication number
CN107002056A
CN107002056A CN201580047693.2A CN201580047693A CN107002056A CN 107002056 A CN107002056 A CN 107002056A CN 201580047693 A CN201580047693 A CN 201580047693A CN 107002056 A CN107002056 A CN 107002056A
Authority
CN
China
Prior art keywords
seq
variant
substitution
hand
amino acid
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201580047693.2A
Other languages
English (en)
Inventor
P·韦斯特
K·博克
T·索伦森
M·温达尔
B·麦克布莱耶
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Novo Nordisk AS
Original Assignee
Novo Nordisk AS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Novo Nordisk AS filed Critical Novo Nordisk AS
Publication of CN107002056A publication Critical patent/CN107002056A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/14Preparation of compounds containing saccharide radicals produced by the action of a carbohydrase (EC 3.2.x), e.g. by alpha-amylase, e.g. by cellulase, hemicellulase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2434Glucanases acting on beta-1,4-glucosidic bonds
    • C12N9/2437Cellulases (3.2.1.4; 3.2.1.74; 3.2.1.91; 3.2.1.150)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/82Vectors or expression systems specially adapted for eukaryotic hosts for plant cells, e.g. plant artificial chromosomes (PACs)
    • C12N15/8241Phenotypically and genetically modified plants via recombinant DNA technology
    • C12N15/8242Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits
    • C12N15/8257Phenotypically and genetically modified plants via recombinant DNA technology with non-agronomic quality (output) traits, e.g. for industrial processing; Value added, non-agronomic traits for the production of primary gene products, e.g. pharmaceutical products, interferon
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/02Monosaccharides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P5/00Preparation of hydrocarbons or halogenated hydrocarbons
    • C12P5/02Preparation of hydrocarbons or halogenated hydrocarbons acyclic
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/06Ethanol, i.e. non-beverage
    • C12P7/14Multiple stages of fermentation; Multiple types of microorganisms or re-use of microorganisms
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/16Butanols
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/18Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic polyhydric
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/18Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic polyhydric
    • C12P7/20Glycerol
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01091Cellulose 1,4-beta-cellobiosidase (3.2.1.91)
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K2319/00Fusion polypeptide
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P2203/00Fermentation products obtained from optionally pretreated or hydrolyzed cellulosic or lignocellulosic material as the carbon source

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biotechnology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Microbiology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Medicinal Chemistry (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Physics & Mathematics (AREA)
  • Cell Biology (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Measuring Or Testing Involving Enzymes Or Micro-Organisms (AREA)

Abstract

本发明涉及纤维二糖水解酶变体和碳水化合物结合模块变体。本发明还涉及编码这些变体的多核苷酸;包含这些多核苷酸的核酸构建体、载体、以及宿主细胞;以及使用这些变体的方法。

Description

碳水化合物结合模块变体以及编码它们的多核苷酸
相关申请的交叉引用
本申请要求于2014年9月5日提交的美国临时专利申请序列号62/046,344的优先权。该申请的内容全部通过引用结合在此。
参照序列表
本申请包括计算机可读形式的序列表,将其通过引用结合在此。
发明背景
发明领域
本发明涉及包括碳水化合物结合模块变体的多肽、编码这些变体的多核苷酸、产生这些变体的方法、以及使用这些变体的方法。
相关技术描述
纤维素是单糖葡萄糖通过β-1,4-键共价连接的一种聚合物。许多微生物产生水解β-连接的葡聚糖的酶。这些酶包括内切葡聚糖酶、纤维二糖水解酶、以及β-葡糖苷酶。内切葡聚糖酶在任意位置消化纤维素聚合物,使其打开而被纤维二糖水解酶攻击。纤维二糖水解酶从纤维素聚合物的末端顺序地释放纤维二糖分子。纤维二糖是葡萄糖的水溶性β-1,4-连接的二聚体。β-葡糖苷酶将纤维二糖水解成葡萄糖。
将木质纤维素原料转化成乙醇具有如下优点,即易于获得大量原料、避免燃烧或填埋材料的期望性、以及乙醇燃料的清洁性。木材、农业残余物、草本作物和城市固体废物被认为是用于乙醇生产的原料。这些材料主要由纤维素、半纤维素和木质素组成。一旦将木质纤维素转化为可发酵糖(例如,葡萄糖),就容易通过酵母将这些可发酵糖发酵成乙醇。
已经描述了与木质素结合降低的经修饰的碳水化合物结合模块(WO 2011/097713A1;林德(Linder)等人.,1995,蛋白质科学(Protein Science)4:1056-1064;以及林德(Linder)等人.,1999,FEBS 447:13-16)。碳水化合物结合模块的另外变体已经描述于WO2012/135719中。
包括纤维二糖水解酶催化结构域和碳水化合物结合模块的杂合多肽描述于例如WO 2010/060056、WO 2013/091577和WO 2014/138672中。
本领域中将有利的是提供包括具有改进的特性(例如增加的结合亲和力)的碳水化合物结合模块变体(例如纤维二糖水解酶变体)的多肽用于将纤维素材料转化为单糖、二糖和多糖。
本发明提供了包括与其亲本相比具有改进特性的碳水化合物结合模块变体的多肽。
发明概述
本发明涉及碳水化合物结合模块变体,其包括在对应于SEQ ID NO:4的碳水化合物结合模块的位置5、13、31和32的一个或多个(例如,若干个)位置处的取代,其中这些变体具有碳水化合物结合活性。在一方面,纤维素分解酶包括本发明的碳水化合物结合模块变体。在一些实施例中,这些碳水化合物结合模块变体具有改进的结合活性。
本发明还涉及分离的纤维二糖水解酶变体,这些变体包括在与SEQ ID NO:2的位置483、491、509和510相对应的一个或多个(例如,若干个)位置处的取代,其中这些变体具有纤维二糖水解酶活性。
本发明还涉及分离的杂合多肽,这些杂合多肽包括在此所述的碳水化合物结合模块变体和纤维素分解酶的异源催化结构域。在一方面,该催化结构域是纤维二糖水解酶催化结构域。
本发明还涉及杂合多肽,这些杂合多肽包括在此所述的碳水化合物结合模块变体和纤维素分解酶的异源催化结构域。在一方面,该催化结构域是纤维二糖水解酶催化结构域。
本发明还涉及编码这些变体和杂合多肽的分离的多核苷酸;包含这些多核苷酸的核酸构建体、载体和宿主细胞;以及产生这些变体和杂合多肽的方法。
本发明还涉及用于降解或转化纤维素材料的方法,该方法包括:在本发明的纤维二糖水解酶变体或杂合多肽的存在下,用一种酶组合物处理该纤维素材料。在一方面,该方法进一步包括对降解的或转化的纤维素材料进行回收。
本发明还涉及产生发酵产物的方法,这些方法包括:(a)在本发明的纤维二糖水解酶变体或杂合多肽的存在下,用一种酶组合物糖化一种纤维素材料;(b)用一种或多种(例如,若干种)发酵微生物发酵糖化的纤维素材料,以产生该发酵产物;并且(c)从发酵中回收该发酵产物。
本发明还涉及发酵纤维素材料的方法,这些方法包括:用一种或多种(例如,若干种)发酵微生物发酵该纤维素材料,其中在本发明的纤维二糖水解酶变体或杂合多肽的存在下,用一种酶组合物糖化该纤维素材料。在一方面,该纤维素材料的发酵产生发酵产物。在另一方面,该方法进一步包括从发酵回收该发酵产物。
附图简述
图1显示里氏木霉纤维二糖水解酶I基因的cDNA序列(SEQ ID NO:31)和推导的氨基酸序列(SEQ ID NO:2)。信号肽以斜体显示。碳水化合物结合模块是加下划线的。
图2显示R.emersonii野生型纤维二糖水解酶I以及杂合多肽PC1-147、PC1-499和PC1-500对微晶纤维素的水解。以mM计的值显示了在24小时后在pH 5和50℃下释放的纤维二糖。
图3显示R.emersonii野生型纤维二糖水解酶I以及杂合多肽PC1-147、PC1-499和PC1-500对微晶纤维素的水解。以mM计的值显示了在24小时后在pH 5和60℃下释放的纤维二糖。
图4显示经预处理的玉米秸秆在35℃、50℃和60℃下通过包括杂合多肽PC1-147、PC1-499或PC1-500的酶组合物的纤维素转化百分比的比较。
图5显示经预处理的玉米秸秆在35℃、50℃和60℃下通过包括杂合多肽PC1-147、PC1-499、PC1-500或PC1-668的酶组合物的纤维素转化百分比的比较。
图6显示经预处理的玉米秸秆在35℃、50℃和60℃下通过包括多肽AC1-596、AC1-660或AC1-661的酶组合物的纤维素转化百分比的比较。
图7显示经预处理的玉米秸秆在35℃、50℃和60℃下通过包括多肽PC1-147或PC1-899的酶组合物的纤维素转化百分比的比较。
定义
乙酰木聚糖酯酶:术语“乙酰木聚糖酯酶”是指一种羧酸酯酶(EC 3.1.1.72),其催化来自聚合木聚糖、乙酰化木糖、乙酰化葡萄糖、α-萘基乙酸酯、和对硝基苯基乙酸酯的乙酰基的水解。可以在包含0.01%TWEENTM20(聚氧乙烯脱水山梨糖醇单月桂酸酯)的50mM乙酸钠(pH 5.0)中使用0.5mM对硝基苯基乙酸酯作为底物来测定乙酰木聚糖酯酶活性。将一个单位的乙酰木聚糖酯酶定义为在pH 5、25℃下每分钟能够释放1微摩尔对硝基酚根阴离子的酶的量。
等位基因变体:术语“等位基因变体”意指占用同一染色体基因座的一种基因的两个或更多个替代形式中的任一者。等位基因变异由突变天然产生,并且可以导致群体内多态性。基因突变可以是沉默的(在所编码的多肽中没有改变)或可编码具有改变的氨基酸序列的多肽。多肽的等位基因变体是由基因的等位基因变体编码的多肽。
α-L-阿拉伯呋喃糖苷酶:术语“α-L-阿拉伯呋喃糖苷酶”意指一种α-L-阿拉伯呋喃糖苷阿拉伯呋喃水解酶(EC 3.2.1.55),其催化α-L-阿拉伯糖苷中的末端非还原性α-L-阿拉伯呋喃糖苷残基的水解。该酶对α-L-阿拉伯呋喃糖苷、包含(1,3)-和/或(1,5)-键的α-L-阿拉伯聚糖、阿拉伯糖基木聚糖以及阿拉伯半乳聚糖起作用。α-L-阿拉伯呋喃糖苷酶还被称为阿拉伯糖苷酶、α-阿拉伯糖苷酶、α-L-阿拉伯糖苷酶、α-阿拉伯呋喃糖苷酶、多糖α-L-阿拉伯呋喃糖苷酶、α-L-阿拉伯呋喃糖苷水解酶、L-阿拉伯糖苷酶、或α-L-阿拉伯聚糖酶。可以使用每ml的100mM乙酸钠(pH 5)中5mg的中等粘度小麦阿拉伯糖基木聚糖(麦格酶国际爱尔兰股份有限公司(Megazyme International Ireland,Ltd.),爱尔兰威克洛郡布瑞公司(Bray,Co.Wicklow,Ireland)以总体积200μl在40℃下持续30分钟,接着通过HPX-87H柱层析(伯乐实验室有限公司(Bio-Rad Laboratories,Inc.),赫拉克勒斯,加利福尼亚州,美国)进行阿拉伯糖分析来测定α-L-阿拉伯呋喃糖苷酶活性。
α-葡糖醛酸糖苷酶:术语“α-葡糖醛酸糖苷酶”是指可催化α-D-葡萄糖苷酸水解成为D-葡糖醛酸酯和醇的一种α-D-葡萄糖苷酸葡糖醛酸水解酶(EC 3.2.1.139)。可以根据德弗里斯(de Vries),1998,细菌学杂志(J.Bacteriol.)180:243-249来测定α-葡糖醛酸糖苷酶活性。一个单位的α-葡糖醛酸糖苷酶等于能够在pH 5、40℃下每分钟释放1微摩尔的葡糖醛酸或4-O-甲基葡糖醛酸的酶的量。
辅助活性9多肽:术语“辅助活性9多肽”或“AA9多肽”意指分类为溶解性多糖单加氧酶(lytic polysaccharide monooxygenase)(昆兰(Quinlan)等人,2011,美国科学院院刊(Proc.Natl.Acad.Sci.USA)208:15079-15084;菲利普斯(Phillips)等人,2011,ACS化学生物学(ACS Chem.Biol.)6:1399-1406;林(Lin)等人,2012,结构(Structure)20:1051-1061)的多肽。根据亨利萨特(Henrissat),1991,生物化学杂志(Biochem.J.)280:309-316;以及亨利萨特和贝洛赫(Bairoch),1996,生物化学杂志316:695-696,AA9多肽之前被分类为糖苷水解酶家族61(GH61)。
AA9多肽通过具有纤维素分解活性的酶增强纤维素材料的水解。可以通过测量在以下条件下与具有无纤维素分解增强活性的相等的总蛋白负载的对照水解(1-50mg的纤维素分解蛋白/g的PCS中的纤维素)相比,由纤维素分解酶水解纤维素材料的还原糖的增加或纤维二糖与葡萄糖总量的增加来测定纤维素分解增强活性:1-50mg的总蛋白/g于预处理的玉米秸秆(PCS)中的纤维素,其中总蛋白由50%-99.5%w/w纤维素分解酶蛋白和0.5%-50%w/w AA9多肽蛋白组成,在适合的温度(如40℃-80℃,例如40℃、45℃、50℃、55℃、60℃、65℃、70℃、75℃、或80℃)和适合的pH(如4-9,例如4.5、5.0、5.5、6.0、6.5、7.0、7.5、8.0、8.5、或9.0)下持续1-7天。
可以使用CELLUCLASTTM1.5L(诺维信公司,巴格斯瓦德(Bagsvaerd),丹麦)和β-葡糖苷酶的混合物作为纤维素分解活性的来源来测定AA9多肽增强活性,其中该β-葡糖苷酶是以纤维素酶蛋白负载的至少2%-5%蛋白的重量存在的。在一方面,该β-葡糖苷酶是米曲霉β-葡糖苷酶(例如,根据WO 02/095014,在米曲霉中重组产生的)。在另一方面,该β-葡糖苷酶是烟曲霉β-葡糖苷酶(例如,如在WO 02/095014中描述的,在米曲霉中重组产生的)。
AA9多肽增强活性还可通过以下来确定:在40℃下将AA9多肽与0.5%磷酸溶胀纤维素(PASC)、100mM乙酸钠(pH 5)、1mM MnSO4、0.1%没食子酸、0.025mg/ml的烟曲霉β-葡糖苷酶、以及0.01%X-100(4-(1,1,3,3-四甲基丁基)苯基-聚乙二醇)一起孵育24-96小时,接着测定从PASC释放的葡萄糖。
还可以根据WO 2013/028928测定高温组合物的AA9多肽增强活性。
AA9多肽通过将达到相同的水解程度所需要的纤维素分解酶的量降低优选至少1.01倍,例如,至少1.05倍、至少1.10倍、至少1.25倍、至少1.5倍、至少2倍、至少3倍、至少4倍、至少5倍、至少10倍、或至少20倍,来增强由具有纤维素分解活性的酶催化的纤维素材料的水解。
根据WO 2008/151043或WO 2012/122518,AA9多肽也可以在可溶性活化二价金属阳离子(例如锰或铜)的存在下使用。
该AA9多肽可以在二氧化合物、二环化合物、杂环化合物、含氮化合物、醌化合物、含硫化合物、或从预处理的纤维素材料或半纤维素材料(如预处理的玉米秸杆)获得的液体的存在下使用(WO 2012/021394、WO 2012/021395、WO 2012/021396、WO 2012/021399、WO2012/021400、WO 2012/021401、WO 2012/021408、以及WO 2012/021410)。
β-葡糖苷酶:术语“β-葡糖苷酶”意指β-D-葡糖苷葡糖水解酶(E.C.3.2.1.21),其催化末端非还原β-D-葡萄糖残基的水解,并释放β-D-葡萄糖。可以根据文丘里(Venturi)等人,2002,基础微生物学杂志(J.Basic Microbiol.)42:55-66的程序使用对硝基苯基-β-D-吡喃葡萄糖苷作为底物来测定β-葡糖苷酶活性。一个单位的β-葡糖苷酶定义为在25℃、pH4.8下,在包含0.01%20的50mM柠檬酸钠中从作为底物的1mM对硝基苯基-β-D-吡喃葡萄糖苷每分钟产生1.0微摩尔的对硝基苯酚阴离子。
β-木糖苷酶:术语“β-木糖苷酶”意指β-D木糖苷木糖水解酶(E.C.3.2.1.37),其催化短β(1→4)木寡糖的外水解以从非还原端去除连续的D-木糖残基。可以在包含0.01%20的100mM柠檬酸钠中,在pH 5、40℃下,使用1mM对硝基苯基-β-D-木糖苷作为底物测定β-木糖苷酶活性。一个单位的β-木糖苷酶定义为在40℃、pH 5下,在包含0.01%20的100mM柠檬酸钠中从1mM对硝基苯基-β-D-木糖苷每分钟产生1.0微摩尔的对硝基酚根阴离子。
碳水化合物结合模块:术语“碳水化合物结合模块”意指提供碳水化合物结合活性的碳水化合物活性酶内的区域(布拉斯顿(Boraston)等人,2004,生物化学杂志(Biochem.J.)383:769-781)。大多数已知的碳水化合物结合模块(CBM)是具有离散折叠的连续氨基酸序列。碳水化合物结合模块(CBM)典型地发现于酶的N-末端处或C-末端的端点处。已知一些CBM具有针对纤维素的特异性。
过氧化氢酶:术语“过氧化氢酶”意指过氧化氢:过氧化氢氧化还原酶(EC1.11.1.6),该酶催化2H2O2转化为O2+2H2O。出于本发明的目的,根据美国专利号5,646,025确定过氧化氢酶活性。一个单位的过氧化氢酶活性等于在测定条件下催化1微摩尔的过氧化氢氧化的酶的量。
催化结构域:术语“催化结构域”意指酶的包含该酶的催化机器的区域。在一方面,催化结构域是SEQ ID NO:30的氨基酸1至429。在另一方面,催化结构域是SEQ ID NO:36的氨基酸1至437。在另一方面,催化结构域是SEQ ID NO:38的氨基酸1至440。在另一方面,催化结构域是SEQ ID NO:40的氨基酸1至437。在另一方面,催化结构域是SEQ ID NO:42的氨基酸1至437。在另一方面,催化结构域是SEQ ID NO:44的氨基酸1至438。在另一方面,催化结构域是SEQ ID NO:46的氨基酸1至437。在另一方面,催化结构域是SEQ ID NO:48的氨基酸1至430。在另一方面,催化结构域是SEQ ID NO:50的氨基酸1至433。
催化结构域编码序列:术语“催化结构域编码序列”意指编码具有催化活性的催化结构域的多核苷酸。在一方面,催化结构域编码序列是SEQ ID NO:29的核苷酸52至1469。在另一方面,催化结构域编码序列是SEQ ID NO:31的核苷酸52至1389。在另一方面,催化结构域编码序列是SEQ ID NO:32的核苷酸52至1389。在另一方面,催化结构域编码序列是SEQID NO:35的核苷酸79至1389。在另一方面,催化结构域编码序列是SEQ ID NO:37的核苷酸52至1371。在另一方面,催化结构域编码序列是SEQ ID NO:39的核苷酸55至1482。在另一方面,催化结构域编码序列是SEQ ID NO:41的核苷酸76至1386。在另一方面,催化结构域是SEQ ID NO:43的核苷酸76至1386。在另一方面,催化结构域编码序列是SEQ ID NO:45的核苷酸55至1504。在另一方面,催化结构域编码序列是SEQ ID NO:47的核苷酸61至1350。在另一方面,催化结构域编码序列是SEQ ID NO:49的核苷酸55至1353。
cDNA:术语“cDNA”意指可以通过从得自真核或原核细胞的成熟的、剪接的mRNA分子进行反转录而制备的DNA分子。cDNA缺乏可以存在于对应基因组DNA中的内含子序列。早先的初始RNA转录本是mRNA的前体,其在呈现为成熟的剪接的mRNA之前要经一系列的步骤进行加工,包括剪接。
纤维二糖水解酶:术语“纤维二糖水解酶”意指一种1,4-β-D-葡聚糖纤维二糖水解酶(E.C.3.2.1.91和E.C.3.2.1.176),其催化纤维素、纤维寡糖、或任何包含β-1,4-连接葡萄糖的聚合物中的1,4-β-D-糖苷键的水解,从而从链的还原性末端(纤维二糖水解酶I)或非还原性末端(纤维二糖水解酶II)释放纤维二糖(泰里(Teeri),1997,生物技术趋势(Trends in Biotechnology)15:160-167;泰里等人,1998,生物化学学会会刊(Biochem.Soc.Trans.)26:173-178)。可以根据里弗(Lever)等人,1972,分析生物化学(Anal.Biochem.)47:273-279;范·帝伯赫(van Tilbeurgh)等人,1982,欧洲生化学会联合会快报(FEBS Letters),149:152-156;范·帝伯赫和克莱森斯(Claeyssens),1985,欧洲生化学会联合会快报,187:283-288;以及汤美(Tomme)等人,1988,欧洲生物化学杂志(Eur.J.Biochem.)170:575-581所描述的程序来测定纤维二糖水解酶活性。
纤维素分解酶或纤维素酶:术语“纤维素分解酶”或“纤维素酶”意指一种或多种(例如,若干种)水解纤维素材料的酶。此类酶包括一种或多种内切葡聚糖酶、一种或多种纤维二糖水解酶、一种或多种β-葡糖苷酶、或其组合。用于测量纤维素分解酶活性的两种基本方法包括:(1)测定总纤维素分解酶活性,以及(2)测定单独的纤维素分解酶活性(内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶),如在张(Zhang)等人,2006,生物技术进展(Biotechnology Advances)24:452-481中所述的。可使用不溶性底物,包括沃特曼(Whatman)№1滤纸、微晶纤维素、细菌纤维素、藻类纤维素、棉花、预处理的木质纤维素等,测量总纤维素分解酶活性。最常见的总纤维素分解活性测定是将瓦特曼№1滤纸用作底物的滤纸测定。该测定法是由国际纯粹与应用化学联合会(IUPAC)建立的(高斯(Ghose),1987,纯粹与应用化学(Pure Appl.Chem.)59:257-68)。
可以通过测量在以下条件下与未添加纤维素分解酶蛋白的对照水解相比,在一种或多种纤维素分解酶对纤维素材料的水解过程中产生/释放的糖的增加来测定纤维素分解酶活性:1-50mg的纤维素分解酶蛋白/g于预处理的玉米秸秆(PCS)中的纤维素(或其他预处理的纤维素材料),在适合的温度(如40℃-80℃,例如40℃、45℃、50℃、55℃、60℃、65℃、70℃、75℃、或80℃)和适合的pH(如4-9,例如,4.0、4.5、5.0、5.5、6.0、6.5、7.0、7.5、8.0、8.5、或9.0)下持续3-7天。典型条件为:1ml反应,洗涤或未洗涤的PCS,5%不溶性固体(干重),50mM乙酸钠(pH 5),1mM MnSO4,50℃、55℃或60℃,72小时,通过HPX-87H柱层析(伯乐实验室有限公司,赫拉克勒斯,加利福尼亚州,美国)进行糖分析。
纤维素材料:术语“纤维素材料”意指包含纤维素的任何材料。生物质的初生细胞壁中的主要多糖是纤维素,第二丰富的是半纤维素,而第三丰富的是果胶。细胞停止生长后产生的次生细胞壁也包含多糖,并且它通过与半纤维素共价交联的聚合木质素得到强化。纤维素是脱水纤维二糖的均聚物,因此是线性β-(1-4)-D-葡聚糖,而半纤维素包括多种化合物,如具有一系列取代基以复杂支链结构存在的木聚糖、木葡聚糖、阿拉伯糖基木聚糖、以及甘露聚糖。尽管纤维素一般为多态的,但发现其在植物组织中主要以平行葡聚糖链的不溶性晶体基质存在。半纤维素通常氢键合至纤维素连同其他半纤维素,这有助于稳定细胞壁基质。
纤维素通常见于例如植物的茎、叶、壳、皮和穗轴或树叶、树枝和树木中。纤维素材料可以是,但不限于:农业废弃物、草本材料(包括能源作物)、城市固体废物、纸浆和造纸厂废弃物、废纸、和木材(包括林业废弃物)(参见例如维塞劳格尔(Wiselogel)等人,1995,生物乙醇手册(Handbook on Bioethanol)(查尔斯E.怀曼(Charles E.Wyman),编著)中,第105-118页,泰勒-弗朗西斯出版集团(Taylor&Francis),华盛顿特区;怀曼(Wyman),1994,生物资源技术(Bioresource Technology)50:3-16;林德(Lynd),1990,应用生物化学与生物技术(Applied Biochemistry and Biotechnology)24/25:695-719;马塞尔(Mosier)等人,1999,木质纤维素的生物转化的最近进展,生物化学工程/生物技术进展(Advances inBiochemical Engineering/Biotechnology),斯卡皮尔(T.Scheper),总编辑,第65卷,第23-40页,施普林格出版公司(Springer-Verlag),纽约)。在此应该理解的是,纤维素可以处于木素纤维素,在混合基质中包含木质素、纤维素、和半纤维素的植物细胞壁材料的形式。在一方面,该纤维素材料是任何生物质材料。在另一方面,该纤维素材料是木质纤维素,该木质纤维素包括纤维素、半纤维素、以及木质素。
在一个实施例中,该纤维素材料是农业废弃物、草本材料(包括能源作物)、城市固体废物、纸浆和造纸厂废弃物、废纸或木材(包括林业废弃物)。
在另一个实施例中,该纤维素材料是芦竹、甘蔗渣、竹子、玉米芯、玉米纤维、玉米秸秆、芒属、稻秸、甘蔗秸秆、柳枝稷或麦秸。
在另一个实施例中,该纤维素材料是山杨、桉树、冷杉、松树、白杨、云杉或柳树。
在另一个实施例中,该纤维素材料是海藻纤维素、细菌纤维素、棉短绒、滤纸、微晶纤维素(例如,)、或经磷酸处理的纤维素。
在另一个实施例中,该纤维素材料是一种水生生物质。如在此使用,术语“水生生物质”意指在水生环境中通过光合作用过程产生的生物质。水生生物质可以是藻类、挺水植物、浮叶植物、或沉水植物。
纤维素材料可以按原样使用或可以使用本领域已知的常规方法进行预处理,如在此所描述。在优选方面中,对该纤维素材料进行预处理。
编码序列:术语“编码序列”意指直接指明变体的氨基酸序列的多核苷酸。编码序列的边界一般由开放阅读框架决定,该开放阅读框架从起始密码子(如ATG、GTG或TTG)开始并且以终止密码子(如TAA、TAG或TGA)结束。编码序列可以是一种基因组DNA、cDNA、合成DNA或其组合。
控制序列:术语“控制序列”意指对于表达编码本发明的变体的多核苷酸所必需的核酸序列。每个控制序列对于编码该变体的多核苷酸来说可以是原生的(即,来自相同基因)或外源的(即,来自不同基因),或相对于彼此是原生的或外源的。这些调控序列包括但不局限于前导子、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。至少,控制序列包括启动子,以及转录和翻译终止信号。出于引入有利于将这些控制序列与编码变体的多核苷酸的编码区连接的特异性限制酶切位点的目的,这些控制序列可以提供有多个接头。
内切葡聚糖酶:术语“内切葡聚糖酶”意指一种4-(1,3;1,4)-β-D-葡聚糖4-葡聚糖水解酶(E.C.3.2.1.4),其催化纤维素、纤维素衍生物(如羧甲基纤维素和羟乙基纤维素)、地衣多糖中的1,4-β-D-糖苷键和混合β-1,3-1,4葡聚糖如谷类β-D-葡聚糖或木葡聚糖以及包含纤维素组分的其他植物材料中的β-1,4键的内切水解。可以通过测量底物粘度的降低或通过还原糖测定所确定的还原性末端的增加来确定内切葡聚糖酶活性(张(Zhang)等人,2006,生物技术进展(Biotechnology Advances)24:452-481)。还可以根据高斯(Ghose),1987,纯粹与应用化学(Pure and Appl.Chem.)59:257-268的程序,在pH 5、40℃下,使用羧甲基纤维素(CMC)作为底物测定内切葡聚糖酶活性。
表达:术语“表达”包括涉及变体产生的任何步骤,包括但不限于,转录、转录后修饰、翻译、翻译后修饰以及分泌。
表达载体:术语“表达载体”意指线性或环状DNA分子,该分子包括编码变体的多核苷酸并且该多核苷酸可操作地与提供用于其表达的控制序列相连接。
阿魏酸酯酶:术语“阿魏酸酯酶”意指4-羟基-3-甲氧基肉桂酰基-糖水解酶(EC3.1.1.73),其催化4-羟基-3-甲氧基肉桂酰基(阿魏酰基)基团从酯化的糖(其在天然生物质底物中通常为阿拉伯糖)的水解,以产生阿魏酸酯(4-羟基-3-甲氧基肉桂酸酯)。阿魏酸酯酶(FAE)也被称为阿魏酸酯酶(ferulic acid esterase)、羟基肉桂酰基酯酶、FAE-III、肉桂酸酯水解酶、FAEA、cinnAE、FAE-I、或FAE-II。可以在50mM乙酸钠(pH 5.0)中,使用0.5mM对硝基苯基阿魏酸酯作为底物测定对阿魏酰酯酶活性。一个单位的阿魏酸酯酶等于,在pH 5,25℃,每分钟能够释放1μmol的对硝基酚根阴离子的酶的量。
片段:术语“片段”意指从成熟多肽的氨基和/或羧基末端缺失一个或多个(例如,若干个)氨基酸的多肽;其中该片段具有纤维二糖水解酶活性。在一方面,一个片段包含SEQID NO:2的成熟多肽的至少425个氨基酸残基,例如至少450个氨基酸残基或至少475个氨基酸残基。在另一方面,一个片段包含SEQ ID NO:6的成熟多肽的至少425个氨基酸残基,例如至少450个氨基酸残基或至少475个氨基酸残基。在另一方面,一个片段包含SEQ ID NO:10的成熟多肽的至少425个氨基酸残基,例如至少450个氨基酸残基或至少475个氨基酸残基。在另一方面,一个片段包含SEQ ID NO:14的成熟多肽的至少425个氨基酸残基,例如至少450个氨基酸残基或至少475个氨基酸残基。在另一方面,一个片段包含SEQ ID NO:18的成熟多肽的至少425个氨基酸残基,例如至少450个氨基酸残基或至少475个氨基酸残基。在另一方面,一个片段包含SEQ ID NO:22的成熟多肽的至少425个氨基酸残基,例如至少450个氨基酸残基或至少475个氨基酸残基。在另一方面,一个片段包含SEQ ID NO:26的成熟多肽的至少425个氨基酸残基,例如至少450个氨基酸残基或至少475个氨基酸残基。
半纤维素分解酶或半纤维素酶:术语“半纤维素分解酶”或“半纤维素酶”意指水解半纤维素材料的一种或多种(例如,若干种)酶。参见例如,沙鲁姆(Shallom)和沙哈姆(Shoham),2003,微生物学当前观点(Current Opinion In Microbiology)6(3):219-228)。半纤维素酶是在植物生物质的降解中的关键组分。半纤维素酶的实例包括但不限于,乙酰基甘露聚糖酯酶、乙酰基木聚糖酯酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、香豆酸酯酶、阿魏酸酯酶、半乳糖苷酶、葡糖醛酸糖苷酶、葡糖醛酸酯酶、甘露聚糖酶、甘露糖苷酶、木聚糖酶以及木糖苷酶。这些酶的底物半纤维素是支链和直链多糖的异质性组,其可通过氢键与植物细胞壁中的纤维素微纤维相结合,交联成坚固的网络。半纤维素还共价附接至木质素,从而与纤维素一起形成高度复杂的结构。半纤维素的可变结构和组织要求许多酶的协同作用以使其完全降解。半纤维素酶的催化模块是水解糖苷键的糖苷水解酶(GH),抑或是水解乙酸或阿魏酸侧基的酯键的碳水化合物酯酶(CE)。这些催化模块基于它们一级序列的同源性,可以被分配到GH和CE家族中。具有总体相似的折叠的一些家族可以进一步被分组为以字母标记的氏族(例如,GH-A)。在碳水化合物活性酶(CAZY)数据库中可得到这些酶以及碳水化合物活性酶的最翔实和更新的分类。可以根据高斯(Ghose)和比赛亚(Bisaria),1987,纯粹与应用化学(Pure&AppI.Chem.)59:1739-1752,在适合的温度如40℃-80℃,例如40℃、45℃、50℃、55℃、60℃、65℃、70℃、75℃、或80℃,以及适合的pH如4-9,例如4.0、4.5、5.0、5.5、6.0、6.5、7.0、7.5、8.0、8.5、或9.0下测量半纤维素分解酶活性。
半纤维素材料:该术语“半纤维素材料”意指包含半纤维素的任何材料。半纤维素包括木聚糖、葡糖醛酸木聚糖、阿拉伯糖基木聚糖、葡甘露聚糖以及木葡聚糖。这些多糖包含许多不同的糖单体。在半纤维素中的糖单体可以包括木糖、甘露糖、半乳糖、鼠李糖、以及阿拉伯糖。半纤维素包含大部分的D-戊糖糖类。在大多数情况下,木糖是以最大的量存在的糖单体,尽管在软木中甘露糖可以是最丰富的糖。木聚糖包含β-(1-4)-连接的木糖残基的主链。陆生植物的木聚糖是具有β-(1-4)-D-吡喃木糖主链的杂聚物,其通过短的碳水化合物链分支。它们包括D-葡糖醛酸或其4-O-甲基醚、L-阿拉伯糖、和/或不同的低聚糖,这些低聚糖由D-木糖、L-阿拉伯糖、D-或L-半乳糖、以及D-葡萄糖构成。可以将木聚糖类型的多糖分成同源木聚糖(homoxylan)和异源木聚糖(heteroxylan),包括葡糖醛酸木聚糖、(阿拉伯糖)葡糖醛酸木聚糖、(葡糖醛酸)阿拉伯糖基木聚糖、阿拉伯糖基木聚糖、以及复杂的异源木聚糖。参见,例如,埃伯林格罗瓦(Ebringerova)等人,2005,聚合物科学进展(Adv.Polym.Sci.)186:1-67。半纤维素材料在此也称为“含木聚糖的材料”。
用于半纤维素材料的来源基本上与在此描述的用于纤维素材料的那些来源相同。
在本发明的方法中,可以使用任何包含半纤维素的材料。在优选的方面,该半纤维素材料是木素纤维素。
高严格条件:术语“高严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃下在5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和50%甲酰胺中预杂交和杂交12至24小时。载体材料最终使用0.2X SSC、0.2%SDS,在65℃下洗涤三次,每次15分钟。
宿主细胞:术语“宿主细胞”意指易于用包含本发明的多核苷酸的核酸构建体或表达载体转化、转染、转导等的任何细胞类型。该术语“宿主细胞”涵盖亲本细胞的任何后代,由于复制期间发生的突变,该后代与其亲本细胞不完全相同。
杂合多肽:术语“杂合多肽”意指其中一个多肽的一个区域融合在另一个(异源)多肽的一个区域的N-末端或C-末端的一种多肽。
增加的比性能:术语本发明变体的“增加的比性能”意指与亲本进行的相同程度的转化相比纤维素材料至产物的改进的转化。确定每单位蛋白(例如,mg蛋白或微摩尔蛋白)的增加的比性能。可以例如在pH、温度和底物浓度中的一个或多个(例如,若干个)条件下评估变体相对于亲本的增加的比性能。在一方面,产物是葡萄糖。在另一方面,产物是纤维二糖。在另一方面,产物是葡萄糖+纤维二糖。
在一方面,条件是pH。例如,pH可以是3至7范围内的任何pH,例如3.0、3.5、4.0、4.5、5.0、5.5、6.0、6.5、或7.0(或其之间)。可以使用达到希望的pH的任何合适的缓冲液。
在另一方面,条件是温度。例如,温度可以是25℃至90℃范围内的任何温度,例如25℃、30℃、35℃、40℃、45℃、50℃、55℃、60℃、65℃、70℃、75℃、80℃、85℃、或90℃(或其之间)。
在另一方面,条件是底物浓度。可以将在此定义的任何纤维素材料用作底物。在一方面,将底物浓度测量为干固体含量。干固体含量优选地处于约1wt%至约50wt%,例如,约5wt%至约45wt%、约10wt%至约40wt%或约20wt%至约30wt%的范围内。在另一方面,将底物浓度测量为不溶性葡聚糖含量。不溶性葡聚糖含量优选地处于约2.5wt%至约25wt%,例如,约5wt%至约20wt%或约10wt%至约15wt%的范围内。
在另一方面,使用以上条件中的两个或更多个(例如,若干个)的组合来测定变体相对于亲本的增加的比性能,如25℃至90℃范围内的任何温度,例如25℃、30℃、35℃、40℃、45℃、50℃、55℃、60℃、65℃、70℃、75℃、80℃、85℃或90℃(或其之间),在3至7范围内的pH,例如3.0、3.5、4.0、4.5、5.0、5.5、6.0、6.5或7.0(或其之间)下。
可以使用本领域已知的用于纤维二糖水解酶的任何酶测定来确定变体相对于亲本的增加的比性能,如在此所描述。可替代地,可以使用在实例9和12中描述的测定来确定变体相对于亲本的增加的比性能。
在另一方面,变体的比性能比亲本的比性能高至少1.01倍,例如,至少1.02倍、至少1.03倍、至少1.04倍、至少1.05倍、至少1.06倍、至少1.07倍、至少1.08倍、至少1.09倍、至少1.1倍、至少1.2倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少5倍、至少10倍、至少15倍、至少20倍、至少25倍以及至少50倍。
分离的:术语“分离的”意指处于自然界中不存在的形式或环境中的物质。分离的物质的非限制性实例包括(1)任何非天然存在的物质,(2)包括但不限于任何酶、变体、核酸、蛋白、肽或辅因子的任何物质,该物质至少部分地从与其本质相关的一种或多种或所有天然存在的成分中去除;(3)相对于天然发现的物质通过人工修饰的任何物质;或(4)通过相对于与其天然相关的其他组分,增加物质的量而修饰的任何物质(例如宿主细胞中的重组产生;编码该物质的基因的多个拷贝;以及比与编码该物质的基因天然相关联的启动子更强的启动子的使用)而修饰的任何物质。在此所述的碳水化合物结合模块变体、纤维二糖水解酶变体、或杂合多肽中的任一种可以是分离形式的。
低严格条件:术语“低严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃下在5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和25%甲酰胺中预杂交和杂交12至24小时。载体材料最终使用0.2X SSC、0.2%SDS,在50℃下洗涤三次,每次15分钟。
成熟多肽:术语“成熟多肽”意指在翻译和任何翻译后修饰如N-末端加工、C-末端截短、糖基化作用、磷酸化作用等之后处于其最终形式的多肽。在一方面,基于预测SEQ IDNO:2的氨基酸1至17、SEQ ID NO:6的氨基酸1至18、SEQ ID NO:10的氨基酸1至18、SEQ IDNO:14的氨基酸1至25、SEQ ID NO:18的氨基酸1至26、SEQ ID NO:22的氨基酸1至17、和SEQID NO:26的氨基酸1至17、SEQ ID NO:61的氨基酸1至18、SEQ ID NO:63的氨基酸1至18、SEQID NO:73的氨基酸1至18、SEQ ID NO:78的氨基酸1至26、SEQ ID NO:90的氨基酸1至26、SEQID NO:92的氨基酸1至26、SEQ ID NO:94的氨基酸1至18分别是信号肽的信号P(SignalP)程序(尼尔森(Nielsen)等人,1997,蛋白质工程(Protein Engineering)10:1-6),该成熟多肽是SEQ ID NO:2的氨基酸18至514、SEQ ID NO:6的氨基酸19至525、SEQ ID NO:10的氨基酸19至530、SEQ ID NO:14的氨基酸26至537、SEQ ID NO:18的氨基酸27至532、SEQ ID NO:22的氨基酸18至526、SEQ ID NO:26的氨基酸18至525、SEQ ID NO:61的氨基酸19至519、SEQID NO:63的氨基酸19至519、SEQ ID NO:73的氨基酸19至519、SEQ ID NO:78的氨基酸27至532、SEQ ID NO:90的氨基酸27至532,SEQ ID NO:92的氨基酸27至532、SEQ ID NO:94的氨基酸19至521。本领域已知,宿主细胞可以产生由同一多核苷酸表达的两种或更多种不同成熟多肽(即,具有不同C-末端和/或N-末端氨基酸)的混合物。
成熟多肽编码序列:术语“成熟多肽编码序列”意指编码具有纤维二糖水解酶活性的成熟多肽的一种多核苷酸。在一方面,基于预测SEQ ID NO:1的核苷酸1至51、SEQ ID NO:5的核苷酸1至54、SEQ ID NO:9的核苷酸1至54、SEQ ID NO:13的核苷酸1至75、SEQ ID NO:17的核苷酸1至78、SEQ ID NO:21的核苷酸1至51和SEQ ID NO:25的核苷酸1至51分别编码信号肽的信号P(SignalP)程序(尼尔森等人,同上),该成熟多肽编码序列是SEQ ID NO:1的核苷酸52至1542、SEQ ID NO:5的核苷酸55至1635、SEQ ID NO:9的核苷酸55至1590、SEQ IDNO:13的核苷酸76至1614、SEQ ID NO:17的核苷酸79至1596、SEQ ID NO:21的核苷酸52至1578以及SEQ ID NO:25的核苷酸52至1575,或其基因组DNA或cDNA序列。
中严格条件:术语“中严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃下在5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和35%甲酰胺中预杂交和杂交12至24小时。载体材料最终使用0.2X SSC、0.2%SDS,在55℃下洗涤三次,每次15分钟。
中-高严格条件:术语“中-高严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃下在5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和35%甲酰胺中预杂交和杂交12至24小时。载体材料最终使用0.2X SSC、0.2%SDS,在60℃下洗涤三次,每次15分钟。
突变体:术语“突变体”意指编码变体的多核苷酸。
核酸构建体:术语“核酸构建体”意指单-链或双链的核酸分子,该核酸分子是从天然存在的基因中分离的,或以本来不存在于自然界中的方式被修饰成包含核酸的区段,或是合成的,该核酸分子包括一个或多个控制序列。
可操作地连接:术语“可操作地连接”意指如下的构造,其中,控制序列相对于多核苷酸的编码序列安置在适当位置,从而使得该控制序列指导该编码序列的表达。
亲本纤维二糖水解酶:术语“亲本纤维二糖水解酶”意指一种纤维二糖水解酶,对该纤维二糖水解酶进行改变以产生本发明的酶变体。该亲本可以是天然存在的(野生型)多肽或其变体或片段。该亲本纤维二糖水解酶可以包括碳水化合物结合模块。
碳水化合物结合模块:术语“碳水化合物结合模块”意指一种碳水化合物结合模块,对该碳水化合物结合模块进行改变以产生本发明的碳水化合物结合模块变体。该亲本可以是天然存在的(野生型)多肽或其变体或片段。
预处理的纤维素材料或半纤维素材料:术语“预处理的纤维素材料或半纤维素材料”意指通过热处理和稀硫酸处理、碱预处理、中性预处理、或本领域已知的任何预处理从生物质得到的纤维素材料或半纤维素材料。
预处理的玉米秸杆:术语“预处理的玉米秸杆”或“PCS”意指通过热和稀硫酸处理、碱预处理、中性预处理、或本领域已知的任何预处理从玉米秸杆得到的纤维素材料。
序列一致性:两个氨基酸序列之间或者两个核苷酸序列之间的关联度通过参数“序列一致性”来描述。
出于本发明的目的,使用如在EMBOSS包(EMBOSS:欧洲分子生物学开放软件套件,赖斯(Rice)等人,2000,遗传学趋势(Trends Genet.)16:276-277)(优选5.0.0版或更新版本)的尼德尔程序中所实施的尼德尔曼-翁施算法(尼德尔曼(Needleman)和翁施(Wunsch),1970,分子生物学杂志(J.Mol.Biol.)48:443-453)来确定两个氨基酸序列之间的序列一致性。所使用的参数是空位开放罚分10、空位延伸罚分0.5,和EBLOSUM62(BLOSUM62的EMBOSS版本)取代矩阵。将标记为“最长一致性”的尼德尔(Needle)输出(使用-非简化(nobrief)选项获得)用作百分比一致性并且是如下计算的:
(一致的残基x 100)/(比对长度-比对中的空位总数)
出于本发明的目的,使用如在EMBOSS包(EMBOSS:欧洲分子生物学开放软件套件,赖斯等人,2000,同上)(优选5.0.0版或更新版本)的尼德尔程序中所实施的尼德尔曼-翁施算法(尼德尔曼和翁施,1970,同上)来确定两个脱氧核糖核苷酸序列之间的序列一致性。所使用的参数是空位开放罚分10,空位延伸罚分0.5,以及EDNAFULL(NCBI NUC4.4的EMBOSS版)取代矩阵。将标记为“最长一致性”的尼德尔(Needle)输出(使用-非简化(nobrief)选项获得)用作百分比一致性并且是如下计算的:
(一致的脱氧核糖核苷酸x 100)/(比对长度-比对中的空位总数)
子序列:术语“子序列”意指使一个或多个(例如,若干个)核苷酸从成熟多肽编码序列的5'端和/或3'端缺失的多核苷酸;其中该子序列编码具有纤维二糖水解酶活性的片段。在一方面,一个子序列包含SEQ ID NO:1的成熟多肽编码序列的至少1275个核苷酸,例如至少1350个核苷酸或至少1425个核苷酸。在另一方面,一个子序列包含SEQ ID NO:5的成熟多肽编码序列的至少1275个核苷酸,例如至少1350个核苷酸或至少1425个核苷酸。在另一方面,一个子序列包含SEQ ID NO:9的成熟多肽编码序列的至少1275个核苷酸,例如至少1350个核苷酸或至少1425个核苷酸。在另一方面,一个子序列包含SEQ ID NO:13的成熟多肽编码序列的至少1275个核苷酸,例如至少1350个核苷酸或至少1425个核苷酸。在另一方面,一个子序列包含SEQ ID NO:17的成熟多肽编码序列的至少1275个核苷酸,例如至少1350个核苷酸或至少1425个核苷酸。在另一方面,一个子序列包含SEQ ID NO:21的成熟多肽编码序列的至少1275个核苷酸,例如至少1350个核苷酸或至少1425个核苷酸。在另一方面,一个子序列包含SEQ ID NO:25的成熟多肽编码序列的至少1275个核苷酸,例如至少1350个核苷酸或至少1425个核苷酸。
变体:术语“变体”意指在一个或多个(例如,若干个)位置处包括改变(即,取代、插入和/或缺失)的具有纤维二糖水解酶活性或碳水化合物结合模块的一个多肽。取代意指占据一个位置的氨基酸由不同的氨基酸代替;缺失意指除去占据一个位置的氨基酸;以及插入意指在占据一个位置的氨基酸的毗邻处和紧邻处添加一个氨基酸。
本发明的纤维二糖水解酶变体具有SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:10、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:22或SEQ ID NO:26的成熟多肽的至少20%,例如至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%或至少100%的纤维二糖水解酶活性。本发明的碳水化合物结合模块变体具有SEQ ID NO:4、SEQ ID NO:8、SEQ ID NO:12、SEQ ID NO:16、SEQ ID NO:20、SEQ ID NO:24或SEQ ID NO:28的至少20%,例如至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%或至少100%的碳水化合物结合活性。
非常高严格条件:术语“非常高严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃下在5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和50%甲酰胺中预杂交和杂交12至24小时。载体材料最终使用2X SSC、0.2%SDS,在70℃下洗涤三次,每次15分钟。
非常低严格条件:术语“非常低严格条件”是指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃下在5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和25%甲酰胺中预杂交和杂交12至24小时。载体材料最终使用0.2X SSC、0.2%SDS,在45℃下洗涤三次,每次15分钟。
野生型纤维二糖水解酶:术语“野生型”纤维二糖水解酶意指由天然存在的微生物(如在自然界中发现的细菌、酵母或丝状真菌)表达的一种纤维二糖水解酶。
包含木聚糖的材料:术语“包含木聚糖的材料”意指包括包含β-(1-4)-连接的木糖残基主链的植物细胞壁多糖的任何材料。陆生植物的木聚糖是具有β-(1-4)-D-吡喃木糖主链的杂聚物,其通过短的碳水化合物链分支。它们包括D-葡糖醛酸或其4-O-甲基醚、L-阿拉伯糖、和/或不同的低聚糖,这些低聚糖由D-木糖、L-阿拉伯糖、D-或L-半乳糖、以及D-葡萄糖构成。可以将木聚糖类型的多糖分成同源木聚糖(homoxylan)和异源木聚糖(heteroxylan),包括葡糖醛酸木聚糖、(阿拉伯糖)葡糖醛酸木聚糖、(葡糖醛酸)阿拉伯糖基木聚糖、阿拉伯糖基木聚糖、以及复杂的异源木聚糖。参见,例如,埃伯林格罗瓦(Ebringerova)等人,2005,聚合物科学进展(Adv.Polym.Sci.)186:1-67。
在本发明的方法中,可以使用包含木聚糖的任何材料。在一个优选方面,包含木聚糖的材料是木质纤维素。
木聚糖降解活性或木聚糖分解活性:术语“木聚糖降解活性”或“木聚糖分解活性”意指水解包含木聚糖的材料的生物活性。用于测量木聚糖分解活性的两种基本方法包括:(1)测量总木聚糖分解活性,和(2)测量单独的木聚糖分解活性(例如,内切木聚糖酶、β-木糖苷酶、阿拉伯呋喃糖苷酶、α-葡糖醛酸糖苷酶、乙酰木聚糖酯酶、阿魏酸酯酶、以及α-葡糖醛酸酯酶)。木聚糖分解酶的测定的最近进展总结于若干出版物中,这些出版物包括别雷(Biely)和普查德(Puchard),2006,食品与农业科学杂志(Journal of the Science ofFood and Agriculture)86(11):1636-1647;斯帕尼克娃(Spanikova)和别雷,2006,欧洲生化学会联合会快报(FEBS Letters)580(19):4597-4601;赫尔曼(Herrimann)等人,1997,生物化学杂志(Biochemical Journal)321:375-381。
可以通过确定由不同类型的木聚糖,包括例如燕麦木聚糖、山毛榉木材木聚糖、和落叶松木材木聚糖形成的还原糖,或者通过光度确定从不同共价染色的木聚糖释放的染色的木聚糖片段,测量总木聚糖降解活性。一种常见的总木聚糖分解活性测定是基于由聚合4-O-甲基葡糖醛酸木聚糖产生还原糖,如描述于别雷(Bailey)等人,1992,用于木聚糖酶活性测定的多个实验室测试方法(Interlaboratory testing of methods for assay ofxylanase activity),生物技术杂志(Journal of Biotechnology)23(3):257-270中。木聚糖酶活性还可以在37℃下在0.01%X-100和200mM磷酸钠(pH 6)中用0.2%AZCL-阿拉伯糖基木聚糖作为底物来测定。将一个单位的木聚糖酶活性定义为在37℃、pH 6下,在200mM磷酸钠(pH 6)中从作为底物的0.2%AZCL-阿拉伯糖基木聚糖每分钟产生1.0微摩尔天青蛋白。
木聚糖降解活性可以是通过测量由一种或多种木聚糖降解酶在以下典型条件下造成的桦木木聚糖(西格玛化学有限公司(Sigma Chemical Co.,Inc.),圣路易斯,密苏里州,美国(St.Louis,MO,USA))水解的增加来测定:1ml反应、5mg/ml底物(总固体),5mg木聚糖分解蛋白质/g底物、50mM乙酸钠(pH 5)、50℃、24小时,如里弗(Lever),1972,分析生物化学(Anal.Biochem)47:273-279所述使用对羟基苯甲酸酰肼(PHBAH)测定进行糖分析。
木聚糖酶:术语“木聚糖酶”意指1,4-β-D-木聚糖-木糖水解酶(1,4-β-D-xylan-xylohydrolase)(E.C.3.2.1.8),其催化木聚糖中1,4-β-D-木糖苷键的内水解。可以在37℃下在0.01%X-100和200mM磷酸钠(pH 6)中用0.2%AZCL-阿拉伯糖基木聚糖作为底物来测定木聚糖酶活性。将一个单位的木聚糖酶活性定义为在37℃、pH 6下,在200mM磷酸钠(pH 6)中从作为底物的0.2%AZCL-阿拉伯糖基木聚糖每分钟产生1.0微摩尔天青蛋白。
在此提及“约”一个数值或参数包括指向那个数值或参数本身的方面。例如,提及“约X”的描述包括方面“X”。
如在此和所附权利要求书中使用的,单数形式“一种/个”、“或”以及“该”包括复数指示物,除非上下文以另外的方式清楚表明。应理解的是,在此描述的本发明的这些方面包括“由方面组成”和/或“基本由方面组成”。
除非另外定义或由背景清楚指示,否则在此所用的全部技术与科学术语具有如本发明所属领域的普通技术人员通常理解的相同含义。
发明详述
本发明涉及碳水化合物结合模块变体,其包括在对应于SEQ ID NO:4的碳水化合物结合模块的位置5、13、31和32的一个或多个(例如,若干个)位置处的取代,其中这些变体具有碳水化合物结合活性。在一方面,纤维素分解酶包括本发明的碳水化合物结合模块变体(例如,杂合多肽)。
本发明还涉及分离的纤维二糖水解酶变体,这些变体包括在与SEQ ID NO:2的位置483、491、509和510相对应的一个或多个(例如,若干个)位置处的取代,其中这些变体具有纤维二糖水解酶活性。
变体命名规则
出于本发明的目的,将在SEQ ID NO:2中披露的多肽序列或在SEQ ID NO:4中披露的碳水化合物结合模块(CBM)用以分别确定另一种纤维二糖水解酶或CBM中的对应的氨基酸残基。将另一种纤维二糖水解酶或CBM的氨基酸序列与SEQ ID NO:2或SEQ ID NO:4分别进行比对,并且基于该比对,使用如在EMBOSS包(EMBOSS:欧洲分子生物学开放软件套件,赖斯(Rice)等人,2000,遗传学趋势(Trends Genet.)16:276-277)(优选3.0.0版或更新版本)的尼德尔程序中所实施的尼德尔曼-翁施算法(尼德尔曼(Needleman)和翁施(Wunsch),1970,分子生物学杂志(J.Mol.Biol.)48:443-453)来确定与在SEQ ID NO:2中披露的多肽或在SEQ ID NO:4中披露的CBM中的任何氨基酸残基相对应的氨基酸位置编号。所使用的参数是空位开放罚分10、空位延伸罚分0.5,和EBLOSUM62(BLOSUM62的EMBOSS版本)取代矩阵。
另一种纤维二糖水解酶或CBM中对应的氨基酸残基的鉴别可以通过使用若干计算机程序使用其对应的缺省参数比对多个多肽序列来确定,这些计算机程序包括但不限于MUSCLE(通过对数期望值的多序列比较;3.5版或更新版本;埃德加(Edgar),2004,核酸研究(Nucleic Acids Research)32:1792-1797);MAFFT(6.857版或更新版本;加藤(Katoh)和库玛(Kuma),2002,核酸研究30:3059-3066;加藤等人,2005,核酸研究33:511-518;加藤和朝都(Toh),2007,生物信息学(Bioinformatics)23:372-374;加藤等人,2009,分子生物学中的方法(Methods in Molecular Biology)537:39-64;加藤和朝都,2010,生物信息学26:1899-1900);以及采用ClustalW的EMBOSS EMMA(1.83版或更新版本;汤普森(Thompson)等人,1994,核酸研究22:4673-4680)。
当其他酶与SEQ ID NO:2的多肽相背离或其他CBM与SEQ ID NO:4相背离使得传统的基于序列的比较方法不能检测其关系时(林达尔(Lindahl)和埃洛弗松(Elofsson),2000,分子生物学杂志)295:613-615),可应用其他成对序列比较算法。在基于序列的搜索中的更大灵敏度可以使用搜索程序来获得,这些搜索程序利用多肽家族的概率表示(谱(profile))来搜索数据库。例如,PSI-BLAST程序通过迭代数据库搜索过程来产生多个谱,并且能够检测远距离同源物(阿特休尔(Atschul)等人,1997,核酸研究(Nucleic AcidsRes.)25:3389-3402)。如果多肽的家族或超家族在蛋白结构数据库中具有一个或多个代表,则可以实现甚至更大的灵敏度。程序如GenTHREADER(琼斯(Jones),1999,分子生物学杂志(J.Mol.Biol.)287:797-815;麦古芬(McGuffin)和琼斯,2003,生物信息学(Bioinformatics)19:874-881)利用来自不同来源(PSI-BLAST、二级结构预测、结构比对谱以及溶剂化势)的信息作为预测查询序列的结构折叠的神经网络的输入。类似地,高夫(Gough)等人,2000,分子生物学杂志(J.Mol.Biol.)313:903-919的方法可以用于比对未知结构的序列与存在于SCOP数据库中的超家族模型。这些比对进而可以用于产生多肽的同源性模型,并且使用出于该目的而开发的多种工具可以评定此类模型的准确度。
对于已知结构的蛋白质,可获取数种工具和资源以供找回(retrieve)和生成结构比对。例如,蛋白的SCOP超家族已经在结构上进行比对,并且那些比对是可访问的并且可下载的。可以使用多种算法如距离比对矩阵(奥尔姆(Holm)和桑德(Sander),1998,蛋白质(Proteins)33:88-96)或组合延伸(辛迪亚洛夫(Shindyalov)和伯恩(Bourne),1998,蛋白质工程(Protein Engineering)11:739-747)比对两种或更多种蛋白质结构,并且这些算法的实施可以另外用于查询具有感兴趣结构的结构数据库,以便发现可能的结构同源物(例如,奥尔姆和帕克(Park),2000,生物信息学(Bioinformatics)16:566-567)。
在描述本发明的变体中,以下所述的命名法适于引用方便。采用了已接受的IUPAC单个字母和三字母的氨基酸缩写。
取代。对于氨基酸取代,使用以下命名法:初始氨基酸、位置、取代氨基酸。因此,在位置226处的苏氨酸被丙氨酸取代表示为“Thr226Ala”或者“T226A”。多个突变由加号(“+”)分开,例如,“Gly205Arg+Ser411Phe”或“G205R+S411F”代表分别在位置205和位置411处甘氨酸(G)被精氨酸(R)取代,并且丝氨酸(S)被苯丙氨酸(F)取代。
缺失。对于氨基酸缺失,使用以下命名法:初始氨基酸、位置、*。因此,在位置195处的甘氨酸缺失表示为“Gly195*”或“G195*”。多个缺失由加号(“+”)分隔,例如,“Gly195*+Ser411*”或“G195*+S411*”。
插入。对于氨基酸插入,使用以下命名法:初始氨基酸、位置、初始氨基酸、插入氨基酸。因此,在位置195处的甘氨酸之后插入赖氨酸被表示为“Gly195GlyLys”或“G195GK”。多个氨基酸的插入被表示为[原始氨基酸、位置、原始氨基酸、插入的氨基酸#1、插入的氨基酸#2等]。例如,在位置195处的甘氨酸之后插入赖氨酸和丙氨酸被表示为“Gly195GlyLysAla”或“G195GKA”。
在此类情况下,通过将小写字母添加至在所插入的一个或多个氨基酸残基之前的氨基酸残基的位置编号中来对所插入的一个或多个氨基酸残基进行编号。在以上实例中,该序列因此将是:
亲本: 变体:
195 195 195a 195b
G G-K-A
多种改变。包括多种改变的变体由加号(“+”)分开,例如“Arg170Tyr+Gly195Glu”或者“R170Y+G195E”代表在位置170和位置195处的精氨酸和甘氨酸分别被酪氨酸和谷氨酸取代。
不同改变。可以在一个位置上引入不同的变化时,这些不同的变化由一个逗号分开,例如“Arg170Tyr,Glu”代表在位置170上的精氨酸被酪氨酸或谷氨酸取代。因此,“Tyr167Gly,Ala+Arg170Gly,Ala”命名了以下变体:“Tyr167Gly+Arg170Gly”、“Tyr167Gly+Arg170Ala”、“Tyr167Ala+Arg170Gly”以及“Tyr167Ala+Arg170Ala”。
碳水化合物结合模块变体
本发明涉及亲本碳水化合物结合模块的变体,其包括在对应于SEQ ID NO:4的碳水化合物结合模块的位置5、13、31和32的一个或多个(例如,若干个)位置处的取代,其中该变体具有碳水化合物结合活性。
在一方面,该碳水化合物结合模块变体与亲本碳水化合物结合模块的氨基酸序列具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但小于100%序列一致性。
在另一方面,该碳水化合物结合模块变体与SEQ ID NO:4、SEQ ID NO:8、SEQ IDNO:12、SEQ ID NO:16、SEQ ID NO:20、SEQ ID NO:24或SEQ ID NO:28的多肽具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%,如至少96%、至少97%、至少98%、或至少99%,但小于100%序列一致性。
在一方面,本发明的碳水化合物结合模块变体中的取代数目是1-4个,如1、2、3、或4个取代。
在一方面,该碳水化合物结合模块变体在对应于SEQ ID NO:4的位置5的位置处包括取代或由其组成。在一个实施例中,在对应于位置5的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val,如被Tyr、Phe或Trp取代。在另一个实施例中,在对应于SEQ ID NO:4的位置5的位置处的氨基酸被Trp取代。在另一个实施例中,在对应于SEQ ID NO:4的位置5的位置处的氨基酸是被Trp取代的Tyr(例如SEQ ID NO:4的Y5W)。
在另一方面,该碳水化合物结合模块变体在对应于SEQ ID NO:4的位置13的位置处包括取代或由其组成。在一个实施例中,在对应于位置13的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val,如被Tyr、Phe或Trp取代。在另一个实施例中,在对应于SEQ ID NO:4的位置13的位置处的氨基酸被Trp取代。在另一个实施例中,在对应于SEQ ID NO:4的位置13的位置处的氨基酸是被Trp取代的Tyr(例如SEQ ID NO:4的Y13W)。
在另一方面,该碳水化合物结合模块变体在对应于SEQ ID NO:4的位置31的位置处包括取代或由其组成。在一个实施例中,在对应于位置31的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val,如被Tyr、Phe或Trp取代。在另一个实施例中,在对应于SEQ ID NO:4的位置31的位置处的氨基酸被Trp取代。在另一个实施例中,在对应于SEQ ID NO:4的位置31的位置处的氨基酸是被Trp取代的Tyr(例如SEQ ID NO:4的Y31W)。
在另一方面,该碳水化合物结合模块变体在对应于SEQ ID NO:4的位置32的位置处包括取代或由其组成。在一个实施例中,在对应于位置32的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val,如被Tyr、Phe或Trp取代。在另一个实施例中,在对应于SEQ ID NO:4的位置32的位置处的氨基酸被Trp取代。在另一个实施例中,在对应于SEQ ID NO:4的位置32的位置处的氨基酸是被Trp取代的Tyr(例如SEQ ID NO:4的Y32W)。
在另一方面,该碳水化合物结合模块变体包括在对应于SEQ ID NO:4的位置5、13、31和32的两个位置处的取代或由其组成,如以上所述的那些。在一个实施例中,该碳水化合物结合模块变体包括在对应于位置5和13的位置处的取代或由其组成(例如,在对应于位置5和13的位置处被Trp取代,如Y5W和/或Y13W)。在另一个实施例中,该碳水化合物结合模块变体包括在对应于位置5和31的位置处的取代或由其组成(例如,在对应于位置5和31的位置处被Trp取代,如Y5W和/或Y31W)。在另一个实施例中,该碳水化合物结合模块变体包括在对应于位置5和32的位置处的取代或由其组成(例如,在对应于位置5和32的位置处被Trp取代,如Y5W和/或Y32W)。在另一个实施例中,该碳水化合物结合模块变体包括在对应于位置13和31的位置处的取代或由其组成(例如,在对应于位置13和31的位置处被Trp取代,如Y13W和/或Y31W)。在另一个实施例中,该碳水化合物结合模块变体包括在对应于位置13和32的位置处的取代或由其组成(例如,在对应于位置13和32的位置处被Trp取代,如Y13W和/或Y32W)。在另一个实施例中,该碳水化合物结合模块变体包括在对应于位置31和32的位置处的取代或由其组成(例如,在对应于位置31和32的位置处被Trp取代,如Y31W和/或Y32W)。
在另一方面,该碳水化合物结合模块变体包括在对应于SEQ ID NO:4的位置5、13、31和32的位置的三个位置处的取代或由其组成,如以上所述的那些。在一个实施例中,该碳水化合物结合模块变体包括在对应于位置5、13和31的位置处的取代或由其组成(例如,在对应于位置5、13和31的位置处被Trp取代,如Y5W、Y13W和/或Y31W)。在另一个实施例中,该碳水化合物结合模块变体包括在对应于位置5、13和32的位置处的取代或由其组成(例如,在对应于位置5、13和32的位置处被Trp取代,如Y5W、Y13W和/或Y32W)。在另一个实施例中,该碳水化合物结合模块变体包括在对应于位置5、31和32的位置处的取代或由其组成(例如,在对应于位置5、31和32的位置处被Trp取代,如Y5W、Y31W和/或Y32W)。在另一个实施例中,该碳水化合物结合模块变体包括在对应于位置13、31和32的位置处的取代或由其组成(例如,在对应于位置13、31和32的位置处被Trp取代,如Y13W、Y31W和/或Y32W)。
在另一方面,该碳水化合物结合模块变体包括在对应于SEQ ID NO:4的位置5、13、31和32的位置的所有四个位置处的取代或由其组成,如以上所述的那些。在一个实施例中,该碳水化合物结合模块变体包括在对应于位置5、13、31和32的一个或多个位置处的Trp取代或由其组成,如Y5W、Y13W、Y31W和/或Y32W。
该碳水化合物结合模块变体可以进一步包括在一个或多个(例如,若干个)其他位置处的取代、缺失和/或插入,如在对应于WO 2012/135719中所披露的位置的位置处的一个或多个(例如,若干个)取代,将该文献通过引用结合在此。例如,在一方面,该碳水化合物结合模块变体进一步包括在对应于SEQ ID NO:4的位置4、6和29的一个或多个(例如,若干个)位置处的取代。在另一方面,该碳水化合物结合模块变体进一步包括在对应于位置4、6和29中的任一个的两个位置处的取代。在另一方面,该碳水化合物结合模块变体进一步包括在对应于位置4、6和29中的每一个位置处的取代。
在另一方面,该碳水化合物结合模块变体包括在对应于位置4的位置处的取代或由其组成。在另一方面,在对应于位置4的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val取代,优选被Glu、Leu、Lys、Phe或Trp取代。在另一方面,该碳水化合物结合模块变体包括SEQ ID NO:4的取代H4L或由其组成。在另一方面,该碳水化合物结合模块变体包括SEQ ID NO:4的取代H4K或由其组成。在另一方面,该碳水化合物结合模块变体包括SEQ ID NO:4的取代H4E或由其组成。在另一方面,该碳水化合物结合模块变体包括SEQ ID NO:4的取代H4F或由其组成。在另一方面,该碳水化合物结合模块变体包括SEQ ID NO:4的取代H4W或由其组成。
在另一方面,该碳水化合物结合模块变体包括在对应于位置6的位置处的取代或由其组成。在另一方面,在对应于位置6的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val取代,优选被Ala取代。在另一方面,该碳水化合物结合模块变体包括SEQ ID NO:4的取代G6A或由其组成。
在另一方面,该碳水化合物结合模块变体包括在对应于位置29的位置处的取代或由其组成。在另一方面,在对应于位置29的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val取代,优选被Asp取代。在另一方面,该碳水化合物结合模块变体包括SEQ ID NO:4的取代N29D或由其组成。
在另一方面,该碳水化合物结合模块变体进一步包括在对应于位置4和6的位置处的取代或由其组成,如以上所述的那些。
在另一方面,该碳水化合物结合模块变体进一步包括在对应于位置4和29的位置处的取代或由其组成,如以上所述的那些。
在另一方面,该碳水化合物结合模块变体进一步包括在对应于位置6和29的位置处的取代或由其组成,如以上所述的那些。
在另一方面,该碳水化合物结合模块变体进一步包括在对应于位置4、6和29的位置处的取代或由其组成,如以上所述的那些。
在另一方面,该碳水化合物结合模块变体进一步包括以下项或由以下项组成:选自下组的一个或多个(例如,若干个)取代,该组由以下项组成:H4L,K,E,F,W、G6A、和N29D;或选自下组的一个或多个(例如,若干个)取代,该组由以下项组成:对应于在此所述的其他纤维素结合模块中的SEQ ID NO:4的H4L,K,E,F,W,G6A、和N29D。
在另一方面,该碳水化合物结合模块变体包括SEQ ID NO:4的取代H4L+G6A或由其组成。
在另一方面,该碳水化合物结合模块变体包括SEQ ID NO:4的取代H4K+G6A或由其组成。
在另一方面,该碳水化合物结合模块变体包括SEQ ID NO:4的取代H4E+G6A或由其组成。
在另一方面,该碳水化合物结合模块变体包括SEQ ID NO:4的取代H4F+G6A或由其组成。
在另一方面,该碳水化合物结合模块变体包括SEQ ID NO:4的取代H4W+G6A或由其组成。
在另一方面,该碳水化合物结合模块变体包括SEQ ID NO:4的取代H4L+N29D或由其组成。
在另一方面,该碳水化合物结合模块变体包括SEQ ID NO:4的取代H4K+N29D或由其组成。
在另一方面,该碳水化合物结合模块变体包括SEQ ID NO:4的取代H4E+N29D或由其组成。
在另一方面,该碳水化合物结合模块变体包括SEQ ID NO:4的取代H4F+N29D或由其组成。
在另一方面,该碳水化合物结合模块变体包括SEQ ID NO:4的取代H4W+N29D或由其组成。
在另一方面,该碳水化合物结合模块变体包括SEQ ID NO:4的取代G6A+N29D或由其组成。
在另一方面,该碳水化合物结合模块变体包括SEQ ID NO:4的取代H4L+G6A+N29D或由其组成。
在另一方面,该碳水化合物结合模块变体包括SEQ ID NO:4的取代H4K+G6A+N29D或由其组成。
在另一方面,该碳水化合物结合模块变体包括SEQ ID NO:4的取代H4E+G6A+N29D或由其组成。
在另一方面,该碳水化合物结合模块变体包括SEQ ID NO:4的取代H4F+G6A+N29D或由其组成。
在另一方面,该碳水化合物结合模块变体包括SEQ ID NO:4的取代H4W+G6A+N29D或由其组成。
氨基酸变化可以是微小性质的,即不显著影响蛋白质折叠和/或活性的保守性氨基酸置换或插入;典型地1至30个氨基酸的小缺失;小氨基-端或羧基端延长,如氨基端甲硫氨酸残基;至多20-25个残基的小连接肽;或通过改变净电荷或另一种功能而促进纯化的小延长部分,如多组氨酸束、抗原表位或结合模块。
保守取代的实例是在下组的范围内:碱性氨基酸(精氨酸、赖氨酸及组氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、极性氨基酸(谷氨酰胺和天冬酰胺)、疏水性氨基酸(亮氨酸、异亮氨酸及缬氨酸)、芳香族氨基酸(苯丙氨酸、色氨酸及酪氨酸)及小氨基酸(甘氨酸、丙氨酸、丝氨酸、苏氨酸及蛋氨酸)。通常不改变比活性的氨基酸置换是本领域已知的并且例如由H.诺伊拉特(H.Neurath)和R.L.希尔(R.L.Hill),1979,在蛋白质(The Proteins),学术出版社(Academic Press),纽约(New York)中进行描述。常见取代是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu、以及Asp/Gly。
可替代地,氨基酸变化是这样一种性质,使得多肽的理化性质被改变。例如,氨基酸改变可以改进多肽的热稳定性、改变底物特异性、改变最适pH等。
可以根据本领域已知的方法,如定点诱变或丙氨酸扫描诱变鉴定多肽中的必需氨基酸(康宁汉(Cunningham)和韦尔斯(Wells),1989,科学(Science)244:1081-1085)。在后一种技术中,在分子中的每个残基处引入单一丙氨酸突变,并且测试所得突变分子的纤维二糖水解酶活性以鉴定对该分子的活性至关重要的氨基酸残基。还参见希尔顿(Hilton)等人,1996,生物化学杂志(J.Biol.Chem.)271:4699-4708。酶或其他生物学相互作用的活性部位还可通过对结构的物理分析来确定,如由下述技术确定:核磁共振、晶体学(crystallography)、电子衍射、或光亲和标记,连同对推定的接触位点(contract site)氨基酸进行突变。参见,例如德沃斯(de Vos)等人,1992,科学(Science)255:306-312;史密斯(Smith)等人,1992,分子生物学杂志(J.Mol.Biol.)224:899-904;乌乐达维尔(Wlodaver)等人,1992,欧洲生物化学学会联盟通讯(FEBS Lett.)309:59-64。也可以从与相关多肽的比对推断必需氨基酸的身份。
在一些方面,这些碳水化合物结合模块变体可以由28到36个(包括28个和36个)氨基酸,例如28、29、30、31、32、33、34、35或36个氨基酸组成。
如下文更详细地描述,本发明还涉及具有纤维素分解活性的多肽,其包括如上所述的碳水化合物结合模块变体。在一方面,该多肽源自具有碳水化合物结合模块的“野生型”纤维素分解酶(如“野生型”纤维二糖水解酶),其中该碳水化合物结合模块包括在对应于SEQ ID NO:4的5、13、31和32的一个或多个(例如,若干个)位置处的取代。在一方面,本发明的碳水化合物结合模块变体可以与缺少碳水化合物结合模块的多肽融合。在另一方面,包含在多肽中的碳水化合物结合模块可以被本发明的碳水化合物结合模块变体替换。在另一方面,该多肽是选自下组的纤维素分解酶,该组由以下项组成:内切葡聚糖酶、纤维二糖水解酶、以及GH61多肽。在一个实施例中,该纤维素分解酶是内切葡聚糖酶。在另一个实施例中,该纤维素分解酶是纤维二糖水解酶。在另一个实施例中,该纤维素分解酶是GH61多肽。
在一些方面,该碳水化合物结合模块变体具有改进的结合活性。在一些实施例中,与亲本相比,碳水化合物结合模块变体不具有降低的结合活性。在一些实施例中,与亲本相比,该碳水化合物结合模块变体具有高至少1.01倍,例如,至少1.02倍、至少1.03倍、至少1.04倍、至少1.05倍、至少1.06倍、至少1.07倍、至少1.08倍、至少1.09倍、至少1.1倍、至少1.2倍、至少1.3倍、至少1.4倍、至少1.5倍、至少1.6倍、至少1.7倍、至少1.8倍、至少1.9倍、至少2倍、至少2.1倍、至少2.2倍、至少2.3倍、至少2.4倍、至少2.5倍、至少5倍、至少10倍、至少15倍、至少20倍、至少25倍以及至少50倍的结合活性。
纤维二糖水解酶变体
本发明还涉及包括碳水化合物结合模块的亲本纤维二糖水解酶的变体,其中该碳水化合物结合模块在对应于SEQ ID NO:4的位置5、13、31和32的一个或多个(例如,若干个)位置处包括取代。例如,在一方面是亲本纤维二糖水解酶的变体,其在对应于SEQ ID NO:2的位置483、491、509或510的一个或多个(例如,若干个)位置处包括取代,其中该变体具有纤维二糖水解酶活性。
在一个实施例中,该变体与亲本纤维二糖水解酶的氨基酸序列具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但小于100%序列一致性。
在另一个实施例中,该变体与SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:10、SEQ IDNO:14、SEQ ID NO:18、SEQ ID NO:22、SEQ ID NO:26、SEQ ID NO:42、SEQ ID NO:44或SEQID NO:78的成熟多肽具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%,如至少96%、至少97%、至少98%、或至少99%,但小于100%序列一致性。
在一方面,本发明的变体中的取代数目是1-3个,如1、2、3、或3个取代。
在另一方面,该变体在对应于SEQ ID NO:2的位置483的位置处包括取代或由其组成。在一个实施例中,在对应于位置483的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val,如被Tyr、Phe或Trp取代。在另一个实施例中,在对应于SEQ ID NO:2的位置483的位置处的氨基酸被Trp取代。在另一个实施例中,在对应于SEQ ID NO:2的位置483的位置处的氨基酸是被Trp取代的Tyr(例如SEQ ID NO:4的Y483W)。
在另一方面,该变体在对应于SEQ ID NO:2的位置491的位置处包括取代或由其组成。在一个实施例中,在对应于位置491的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val,如被Tyr、Phe或Trp取代。在另一个实施例中,在对应于SEQ ID NO:2的位置491的位置处的氨基酸被Trp取代。在另一个实施例中,在对应于SEQ ID NO:2的位置491的位置处的氨基酸是被Trp取代的Tyr(例如SEQ ID NO:4的Y491W)。
在另一方面,该变体在对应于SEQ ID NO:2的位置509的位置处包括取代或由其组成。在一个实施例中,在对应于位置509的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val,如被Tyr、Phe或Trp取代。在另一个实施例中,在对应于SEQ ID NO:2的位置509的位置处的氨基酸被Trp取代。在另一个实施例中,在对应于SEQ ID NO:2的位置509的位置处的氨基酸是被Trp取代的Tyr(例如SEQ ID NO:4的Y509W)。
在另一方面,该变体在对应于SEQ ID NO:2的位置510的位置处包括取代或由其组成。在一个实施例中,在对应于位置510的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val,如被Tyr、Phe或Trp取代。在另一个实施例中,在对应于SEQ ID NO:2的位置510的位置处的氨基酸被Trp取代。在另一个实施例中,在对应于SEQ ID NO:2的位置510的位置处的氨基酸是被Trp取代的Tyr(例如SEQ ID NO:4的Y510W)。
在另一方面,该变体包括在对应于SEQ ID NO:2的位置483、491、509和510的两个位置处的取代或由其组成,如以上所述的那些。在一个实施例中,该变体包括在对应于位置483和491的位置处的取代或由其组成(例如,在对应于位置483和491的位置处被Trp取代,如Y483W和/或Y491W)。在另一个实施例中,该变体包括在对应于位置483和509的位置处的取代或由其组成(例如,在对应于位置483和509的位置处被Trp取代,如Y483W和/或Y509W)。在另一个实施例中,该变体包括在对应于位置483和510的位置处的取代或由其组成(例如,在对应于位置483和510的位置处被Trp取代,如Y483W和/或Y510W)。在另一个实施例中,该变体包括在对应于位置491和509的位置处的取代或由其组成(例如,在对应于位置491和509的位置处被Trp取代,如Y491W和/或Y509W)。在另一个实施例中,该变体包括在对应于位置491和510的位置处的取代或由其组成(例如,在对应于位置491和510的位置处被Trp取代,如Y491W和/或Y32W)。在另一个实施例中,该变体包括在对应于位置509和510的位置处的取代或由其组成(例如,在对应于位置509和510的位置处被Trp取代,如Y509W和/或Y510W)。
在另一方面,该变体包括在对应于SEQ ID NO:2的位置483、491、509和32的三个位置处的取代或由其组成,如以上所述的那些。在一个实施例中,该变体包括在对应于位置483、491和509的位置处的取代或由其组成(例如,在对应于位置483、491和509的位置处被Trp取代,如Y483W、Y491W和/或Y509W)。在另一个实施例中,该变体包括在对应于位置483、491和510的位置处的取代或由其组成(例如,在对应于位置483、491和510的位置处被Trp取代,如Y5W、Y491W和/或Y510W)。在另一个实施例中,该变体包括在对应于位置483、509和510的位置处的取代或由其组成(例如,在对应于位置483、509和510的位置处被Trp取代,如Y483W、Y509W和/或Y510W)。在另一个实施例中,该变体包括在对应于位置491、509和510的位置处的取代或由其组成(例如,在对应于位置491、509和510的位置处被Trp取代,如Y491W、Y509W和/或Y510W)。
在另一方面,该变体包括在对应于SEQ ID NO:2的位置483、491、509和510的四个位置处的取代或由其组成,如以上所述的那些。在一个实施例中,该变体包括在对应于位置483、491、509和510的一个或多个位置处的Trp取代或由其组成,如Y483W、Y491W、Y509W和/或Y510W。
在一方面,该变体包括以下项或者由以下项组成:SEQ ID NO:90或SEQ ID NO:92,或其成熟多肽序列。
这些纤维二糖水解酶变体可以进一步包括在一个或多个(例如,若干个)其他位置处的取代、缺失和/或插入,如在对应于PCT/US 2014/022068、WO 2011/050037、WO 2005/028636、WO 2005/001065、WO 2004/016760、和美国专利号7,375,197中所披露的位置的一个或多个(例如,若干个)位置处的改变,将这些文献以其全部内容结合在此。
例如,在另一方面,一种变体包括在对应于SEQ ID NO:2的位置214、215、216和217的位置的一个或多个位置处的改变,其中对应于位置214、215和217的一个或多个位置处的改变是一个取代并且对应于位置216的位置处的改变是一个缺失。在另一方面,一种变体在对应于SEQ ID NO:2的位置214、215、216及217中的任何位置的两个位置处包括一个改变,其中对应于位置214、215和217的一个或多个位置处的改变是一个取代并且对应于位置216的位置处的改变是一个缺失。在另一方面,一种变体在对应于SEQ ID NO:2的位置214、215、216及217中的任何位置的三个位置处包括一个改变,其中对应于位置214、215和217的一个或多个位置处的改变是一个取代并且对应于位置216的位置处的改变是一个缺失。在另一方面,一种变体在对应于位置214、215和217的每个位置处都包括一个取代并且在对应于位置216的位置处包括一个缺失。
在另一方面,该变体包括与位置214相对应的位置处的取代或由其组成。在另一方面,在对应于位置214的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val取代,优选被Ala取代。在另一方面,该变体包括SEQ ID NO:2的取代N214A或由其组成。
在另一方面,该变体包括与位置215相对应的位置处的取代或由其组成。在另一方面,在对应于位置215的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val取代,优选被Ala取代。在另一方面,该变体包括SEQ ID NO:2的取代N215A或由其组成。
在另一方面,该变体在对应于位置216的位置处包括一个缺失或由其组成。在另一方面,在对应于位置216的位置处的氨基酸是Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val,优选是Ala。在另一方面,该变体包括SEQ ID NO:2的缺失A216*或由其组成。
在另一方面,该变体包括与位置217相对应的位置处的取代或由其组成。在另一方面,在对应于位置217的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val取代,优选被Ala、Gly或Trp取代。在另一方面,该变体包括SEQ ID NO:2的取代N217A,G,W或由其组成。
在另一方面,该变体在对应于位置214和215的位置处包括一个改变或由其组成,如以上所述的那些。
在另一方面,该变体在对应于位置214和216的位置处包括改变或由其组成,如以上所述的那些。
在另一方面,该变体在对应于位置214和217的位置处包括改变或由其组成,如以上所述的那些。
在另一方面,该变体在对应于位置215和216的位置处包括改变或由其组成,如以上所述的那些。
在另一方面,该变体在对应于位置215和217的位置处包括改变或由其组成,如以上所述的那些。
在另一方面,该变体在对应于位置216和217的位置处包括改变或由其组成,如以上所述的那些。
在另一方面,该变体在对应于位置214、215和216的位置处包括改变或由其组成,如上文描述的那些。
在另一方面,该变体在对应于位置214、215和217的位置处包括改变或由其组成,如上文描述的那些。
在另一方面,该变体在对应于位置214、216和217的位置处包括改变或由其组成,如上文描述的那些。
在另一方面,该变体在对应于位置215、216和217的位置处包括改变或由其组成,如上文描述的那些。
在另一方面,该变体在对应于位置214、215、216及217的位置处包括改变或由其组成,如上文描述的那些。
在另一方面,该变体包括选自下组的一种或多种改变或由其组成,该组由以下各项组成:N214A、N215A、A216*、以及N217A,G,W。
在另一方面,该变体包括SEQ ID NO:2的改变N214A+N215A或由其组成。
在另一方面,该变体包括SEQ ID NO:2的改变N214A+A216*或由其组成。
在另一方面,该变体包括SEQ ID NO:2的改变N214A+N217A,G,W或由其组成。
在另一方面,该变体包括SEQ ID NO:2的改变N215A+A216*或由其组成。
在另一方面,该变体包括SEQ ID NO:2的改变N215A+N217A,G,W或由其组成。
在另一方面,该变体包括SEQ ID NO:2的改变A216*+N217A,G,W或由其组成。
在另一方面,该变体包括SEQ ID NO:2的改变N214A+N215A+A216*或由其组成。
在另一方面,该变体包括SEQ ID NO:2的改变N214A+N215A+N217A,G,W或由其组成。
在另一方面,该变体包括SEQ ID NO:2的改变N214A+A216*+N217A,G,W或由其组成。
在另一方面,该变体包括SEQ ID NO:2的成熟多肽的改变N215A+A216*+N217A,G,W或由其组成。
在另一方面,该变体包括SEQ ID NO:2的改变N214A+N215A+A216*+N217A,G,W或由其组成。
可以根据本领域已知的程序,如在此所述的来鉴定亲本中的必需氨基酸。
在一些方面,这些纤维二糖水解酶变体可以由310至537个氨基酸(包含首尾),例如320至330、330至340、340至350、350至360、360至370、370至380、380至390至390、490至400、400至415、415至425、425至435、435至445、445至455、455至465、465至475、475至485,485至495、495至505,505至515、515至525、或525至537个氨基酸组成。
亲本纤维二糖水解酶和碳水化合物结合模块
该亲本碳水化合物结合模块可以是(a)与SEQ ID NO:4、SEQ ID NO:8、SEQ ID NO:12、SEQ ID NO:16、SEQ ID NO:20、SEQ ID NO:24或SEQ ID NO:28的碳水化合物结合模块具有至少60%序列一致性的碳水化合物结合模块;(b)由在至少低严格条件下与SEQ ID NO:3、SEQ ID NO:7、SEQ ID NO:11、SEQ ID NO:15、SEQ ID NO:19、SEQ ID NO:23或SEQ ID NO:27的碳水化合物结合模块编码序列或其全长互补体杂交的多核苷酸编码的碳水化合物结合模块;或(c)由与SEQ ID NO:3、SEQ ID NO:7、SEQ ID NO:11、SEQ ID NO:15、SEQ ID NO:19、SEQ ID NO:23或SEQ ID NO:27的碳水化合物结合模块编码序列具有至少60%序列一致性的多核苷酸编码的碳水化合物结合模块。
亲本纤维二糖水解酶可以是(a)与SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:10、SEQID NO:14、SEQ ID NO:18、SEQ ID NO:22、SEQ ID NO:26、SEQ ID NO:42、SEQ ID NO:44或SEQ ID NO:78的成熟多肽具有至少60%序列一致性的多肽;(b)由在至少低严格条件下与以下杂交的多核苷酸编码的多肽:(i)SEQ ID NO:1、SEQ ID NO:5、SEQ ID NO:9、SEQ IDNO:13、SEQ ID NO:17、SEQ ID NO:21、SEQ ID NO:25、SEQ ID NO:41、SEQ ID NO:43或SEQID NO:77的成熟多肽编码序列,(ii)其基因组DNA或cDNA序列,或(iii)(i)或(ii)的全长互补体;(c)由与SEQ ID NO:1、SEQ ID NO:5、SEQ ID NO:9、SEQ ID NO:13、SEQ ID NO:17、SEQID NO:21、SEQ ID NO:25、SEQ ID NO:41、SEQ ID NO:43或SEQ ID NO:77的成熟多肽编码序列具有至少60%序列一致性的多核苷酸编码的多肽;或(d)(a)、(b)或(c)的一个片段,该片段具有纤维二糖水解酶活性。
在一个第一方面,该亲本碳水化合物结合模块具有与SEQ ID NO:4、SEQ ID NO:8、SEQ ID NO:12、SEQ ID NO:16、SEQ ID NO:20、SEQ ID NO:24、或SEQ ID NO:28的碳水化合物结合模块至少60%,例如至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,其具有碳水化合物结合活性。在一个实施例中,该亲本碳水化合物结合模块的氨基酸序列与SEQ ID NO:4、SEQ ID NO:8、SEQ ID NO:12、SEQ ID NO:16、SEQ IDNO:20、SEQ ID NO:24或SEQ ID NO:28的碳水化合物结合模块相差多达10个氨基酸,例如1、2、3、4、5、6、7、8、9或10个。
在另一个实施例中,该亲本碳水化合物结合模块包括SEQ ID NO:4、SEQ ID NO:8、SEQ ID NO:12、SEQ ID NO:16、SEQ ID NO:20、SEQ ID NO:24或SEQ ID NO:28的氨基酸序列或由其组成。
在另一个实施例中,该亲本碳水化合物结合模块是SEQ ID NO:4、SEQ ID NO:8、SEQ ID NO:12、SEQ ID NO:16、SEQ ID NO:20、SEQ ID NO:24、或SEQ ID NO:28的成熟多肽的一个片段,该片段包含至少28个氨基酸残基,例如至少30个、至少32个、或至少34个氨基酸残基。
在另一个实施例中,该亲本碳水化合物结合模块是SEQ ID NO:4、SEQ ID NO:8、SEQ ID NO:12、SEQ ID NO:16、SEQ ID NO:20、SEQ ID NO:24或SEQ ID NO:28的碳水化合物结合模块的等位基因变体。
在另一个第一方面中,该亲本纤维二糖水解酶与SEQ ID NO:2、SEQ ID NO:6、SEQID NO:10、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:22、SEQ ID NO:26、SEQ ID NO:42、SEQID NO:44、或SEQ ID NO:78的成熟多肽具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,其具有纤维二糖水解酶活性。在一个实施例中,该亲本纤维二糖水解酶的氨基酸序列与SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:10、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:22、SEQ ID NO:26、SEQ ID NO:42、SEQ IDNO:44、或SEQ ID NO:78的成熟多肽相差多达10个氨基酸,例如1、2、3、4、5、6、7、8、9或10个。
在另一个实施例中,该亲本纤维二糖水解酶包括SEQ ID NO:2、SEQ ID NO:6、SEQID NO:10、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:22、SEQ ID NO:26、SEQ ID NO:42、SEQID NO:44、或SEQ ID NO:78的氨基酸序列或由其组成。在另一个实施例中,该亲本纤维二糖水解酶包括SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:10、SEQ ID NO:14、SEQ ID NO:18、SEQID NO:22、SEQ ID NO:26、SEQ ID NO:42、SEQ ID NO:44、或SEQ ID NO:78的成熟多肽或由其组成。在另一个实施例中,亲本纤维二糖水解酶包括SEQ ID NO:2的氨基酸18至514、SEQID NO:6的氨基酸19至525、SEQ ID NO:10的氨基酸19至530,SEQ ID NO:14的氨基酸26至537、SEQ ID NO:18的氨基酸27至532、SEQ ID NO:22的氨基酸18至526、或SEQ ID NO:26的氨基酸18至525或由其组成。
在另一个实施例中,该亲本纤维二糖水解酶是包含亲本纤维二糖水解酶的成熟多肽的至少85%的氨基酸残基,例如至少90%的氨基酸残基或至少95%的氨基酸残基的片段。
在另一个实施例中,该亲本纤维二糖水解酶是SEQ ID NO:2、SEQ ID NO:6、SEQ IDNO:10、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:22、SEQ ID NO:26、SEQ ID NO:42、SEQ IDNO:44或SEQ ID NO:78的成熟多肽的等位基因变体。
在一个第二方面中,该亲本碳水化合物结合模块由以下的多核苷酸编码,该多核苷酸在非常低严格条件、低严格条件、中严格条件、中-高严格条件、高严格条件或非常高严格条件下与SEQ ID NO:3、SEQ ID NO:7、SEQ ID NO:11、SEQ ID NO:15、SEQ ID NO:19、SEQID NO:23、或SEQ ID NO:27的碳水化合物结合模块编码序列,或其全长互补体杂交(萨拉布鲁克(Sambrook)等人,1989,分子克隆实验指南(Molecular Cloning,A LaboratoryManual),第二版,冷泉港(Cold Spring Harbor),纽约)。
在另一个第二方面中,该亲本纤维二糖水解酶由以下多核苷酸编码,该多核苷酸在非常低严格条件、低严格条件、中等严格条件、中-高严格条件、高严格条件、或非常高严格条件下与(i)SEQ ID NO:1、SEQ ID NO:5、SEQ ID NO:9、SEQ ID NO:13、SEQ ID NO:17、SEQ ID NO:21、SEQ ID NO:25、SEQ ID NO:41、SEQ ID NO:43、或SEQ ID NO:77的成熟多肽编码序列,(ii)其基因组DNA或cDNA序列,或(iii)(i)或(ii)的全长互补体杂交(萨拉布鲁克(Sambrook)等人,1989,同上)。
可以使用SEQ ID NO:1、SEQ ID NO:5、SEQ ID NO:9、SEQ ID NO:13、SEQ ID NO:17、SEQ ID NO:21、SEQ ID NO:25、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:77、SEQ IDNO:3、SEQ ID NO:7、SEQ ID NO:11、SEQ ID NO:15、SEQ ID NO:19、SEQ ID NO:23、或SEQ IDNO:27的多核苷酸或其子序列,连同SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:10、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:22、SEQ ID NO:26、SEQ ID NO:42、SEQ ID NO:44、or SEQ IDNO:78、SEQ ID NO:4、SEQ ID NO:8、SEQ ID NO:12、SEQ ID NO:16、SEQ ID NO:20、SEQ IDNO:24、或SEQ ID NO:28的多肽或其片段来设计核酸探针,以便根据本领域熟知的方法鉴定和克隆编码来自不同属或种的菌株的亲本的DNA。具体而言,可以根据标准DNA印迹程序,使用这类探针与感兴趣的细胞的基因组DNA或cDNA杂交,以便鉴定和分离其中的对应基因。这类探针可以明显短于完整序列,但是长度应为至少15,例如至少25、至少35、或至少70个核苷酸。优选地,该核酸探针的长度为至少100个核苷酸,例如长度为至少200个核苷酸、至少300个核苷酸、至少400个核苷酸、至少500个核苷酸、至少600个核苷酸、至少700个核苷酸、至少800个核苷酸、或至少900个核苷酸。DNA和RNA探针两者都可使用。典型地将探针进行标记(例如,用32P、3H、35S、生物素、或抗生物素蛋白),以检测相应的基因。本发明涵盖此类探针。
可以针对与上文所述的探针杂交并编码亲本的DNA来筛选由这类其他菌株制备的基因组DNA或cDNA文库。来自这类其他菌株的基因组DNA或其他DNA可以通过琼脂糖或聚丙烯酰胺凝胶电泳,或其他分离技术来分离。来自文库的DNA或分离的DNA可转移到并固定在硝酸纤维素或其他适合的载体材料上。为了鉴定与SEQ ID NO:1、SEQ ID NO:5、SEQ ID NO:9、SEQ ID NO:13、SEQ ID NO:17、SEQ ID NO:21、SEQ ID NO:25、SEQ ID NO:41、SEQ ID NO:43、SEQ ID NO:77、SEQ ID NO:3、SEQ ID NO:7、SEQ ID NO:11、SEQ ID NO:15、SEQ ID NO:19、SEQ ID NO:23、或SEQ ID NO:27、或其子序列杂交的克隆或DNA,在DNA印迹中使用载体材料。
出于本发明的目的,杂交指示该多核苷酸在非常低至非常高严格条件下与对应于以下各项的经标记的核酸探针杂交:(i)SEQ ID NO:1、SEQ ID NO:5、SEQ ID NO:9、SEQ IDNO:13、SEQ ID NO:17、SEQ ID NO:21、SEQ ID NO:25、SEQ ID NO:41、SEQ ID NO:43、或SEQID NO:77;(ii)SEQ ID NO:1、SEQ ID NO:5、SEQ ID NO:9、SEQ ID NO:13、SEQ ID NO:17、SEQ ID NO:21、SEQ ID NO:25、SEQ ID NO:41、SEQ ID NO:43、或SEQ ID NO:77的成熟多肽编码序列;(iii)其基因组DNA或cDNA序列;(iv)其全长互补体;或(v)其子序列;或者(i)SEQID NO:3、SEQ ID NO:7、SEQ ID NO:11、SEQ ID NO:15、SEQ ID NO:19、SEQ ID NO:23或SEQID NO:27;(ii)其全长互补体;或(iii)其子序列。可以使用例如X-射线胶片或本领域已知的任何其他检测手段来检测在这些条件下核酸探针杂交的分子。
在一个实施例中,该核酸探针是SEQ ID NO:1、SEQ ID NO:5、SEQ ID NO:9、SEQ IDNO:13、SEQ ID NO:17、SEQ ID NO:21、SEQ ID NO:25、SEQ ID NO:41、SEQ ID NO:43、或SEQID NO:77的成熟多肽编码序列。在另一个实施例中,该核酸探针是SEQ ID NO:1的核苷酸52至1542、SEQ ID NO:5的核苷酸55至1635、SEQ ID NO:9的核苷酸55至1590、SEQ ID NO:13的核苷酸76至1614、SEQ ID NO:17的核苷酸79至1596、SEQ ID NO:21的核苷酸52至1578、或SEQ ID NO:25的核苷酸52至1575。在另一个实施例中,该核酸探针是编码SEQ ID NO:2、SEQID NO:6、SEQ ID NO:10、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:22、SEQ ID NO:26、SEQID NO:42、SEQ ID NO:44、或SEQ ID NO:78的多肽;其成熟多肽;或其片段的多核苷酸。在另一个实施例中,该核酸探针是SEQ ID NO:1、SEQ ID NO:5、SEQ ID NO:9、SEQ ID NO:13、SEQID NO:17、SEQ ID NO:21、SEQ ID NO:25、SEQ ID NO:41、SEQ ID NO:43或SEQ ID NO:77或其基因组DNA或cDNA序列。
在另一个实施例中,该核酸探针SEQ ID NO:3、SEQ ID NO:7、SEQ ID NO:11、SEQID NO:15、SEQ ID NO:19、SEQ ID NO:23或SEQ ID NO:27。在另一个实施例中,该核酸探针是如下多核苷酸,该多核苷酸编码SEQ ID NO:4、SEQ ID NO:8、SEQ ID NO:12、SEQ ID NO:16、SEQ ID NO:20、SEQ ID NO:24、或SEQ ID NO:28的碳水化合物结合模块或其片段。
对于长度为约15个核苷酸至约70个核苷酸的短探针而言,严格条件定义为最佳地遵循标准DNA印迹程序,在比使用根据博尔顿(Bolton)和麦卡锡(McCarthy)(1962,美国国家科学院院刊(Proc.Natl.Acad.Sci.USA)48:1390)的计算所计算的Tm低约5℃至约10℃下,在每ml 0.9M NaCl、0.09M Tris-HCl(pH 7.6)、6mM EDTA、0.5%NP-40、1X登哈特氏溶液(Denhardt’s solution)、1mM焦磷酸钠、1mM磷酸二氢钠、0.1mM ATP、以及0.2mg的酵母RNA中预杂交和杂交12至24小时。最后,将载体材料在比所计算的Tm低5℃至10℃下,在6X SCC加0.1%SDS中洗涤一次(持续15分钟)并且使用6X SSC洗涤两次(每次15分钟)。
在一个第三方面,该亲本碳水化合物结合模块是由与SEQ ID NO:3、SEQ ID NO:7、SEQ ID NO:11、SEQ ID NO:15、SEQ ID NO:19、SEQ ID NO:23、或SEQ ID NO:27的碳水化合物结合模块编码序列具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多核苷酸编码的,该多核苷酸编码具有碳水化合物结合活性的多肽。在一个实施例中,该碳水化合物结合模块编码序列是SEQ ID NO:3、SEQID NO:7、SEQ ID NO:11、SEQ ID NO:15、SEQ ID NO:19、SEQ ID NO:23、或SEQ ID NO:27。在另一个实施例中,该亲本由以下多核苷酸编码,该多核苷酸包括SEQ ID NO:3、SEQ ID NO:7、SEQ ID NO:11、SEQ ID NO:15、SEQ ID NO:19、SEQ ID NO:23、或SEQ ID NO:27或由其组成。
在另一个第三方面中,该亲本纤维二糖水解酶是由与SEQ ID NO:1、SEQ ID NO:5、SEQ ID NO:9、SEQ ID NO:13、SEQ ID NO:17、SEQ ID NO:21、SEQ ID NO:25、SEQ ID NO:41、SEQ ID NO:43、或SEQ ID NO:77的成熟多肽编码序列具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多核苷酸编码的,该多核苷酸编码具有纤维二糖水解酶活性的多肽。在一方面,该成熟多肽编码序列是SEQ IDNO:1的核苷酸52至1542、SEQ ID NO:5的核苷酸55至1635、SEQ ID NO:9的核苷酸55至1590、SEQ ID NO:13的核苷酸76至1614、SEQ ID NO:17的核苷酸79至1596、SEQ ID NO:21的核苷酸52至1578、或SEQ ID NO:25的核苷酸52至1575,或其基因组DNA或cDNA序列。在另一方面,该亲本纤维二糖水解酶由以下多核苷酸编码,该多核苷酸包括SEQ ID NO:1、SEQ ID NO:5、SEQ ID NO:9、SEQ ID NO:13、SEQ ID NO:17、SEQ ID NO:21、或SEQ ID NO:25,或其基因组DNA或cDNA序列,或由其组成。
该亲本可以从任何属类的微生物中获得。出于本发明的目的,如在此结合一种给定的来源使用的术语“从...中获得”应意指由多核苷酸编码的亲本是由该来源或由其中已经插入来自该来源的多核苷酸的一种菌株产生的。在一方面,该亲本是胞外分泌的。
该亲本可以是一种细菌纤维二糖水解酶或碳水化合物结合模块。例如,该亲本可以是革兰氏阳性细菌多肽,如芽孢杆菌属(Bacillus)、梭菌属(Clostridium)、肠球菌属(Enterococcus)、土芽孢杆菌属(Geobacillus)、乳杆菌属(Lactobacillus)、乳球菌属(Lactococcus)、海洋芽孢杆菌属(Oceanobacillus)、葡萄球菌属(Staphylococcus)、链球菌属(Streptococcus)、或链霉菌属(Streptomyces)纤维二糖水解酶;或一种革兰氏阴性细菌多肽,如弯曲杆菌属(Campylobacter)、大肠杆菌(E.coli)、黄杆菌属(Flavobacterium)、梭杆菌属(Fusobacterium)、螺杆菌属(Helicobacter)、泥杆菌属(Ilyobacter)、奈瑟氏菌属(Neisseria)、假单胞菌属(Pseudomonas)、沙门菌属(Salmonella)或脲原体属(Ureaplasma)多肽。
在一方面,该亲本是嗜碱芽孢杆菌(Bacillus alkalophilus)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、短芽孢杆菌(Bacillus brevis)、环状芽孢杆菌(Bacillus circulans)、克劳氏芽孢杆菌(Bacillus clausii)、凝结芽孢杆菌(Bacilluscoagulans)、坚强芽孢杆菌(Bacillus firmus)、灿烂芽孢杆菌(Bacillus lautus)、迟缓芽孢杆菌(Bacillus lentus)、地衣芽孢杆菌(Bacillus licheniformis)、巨大芽孢杆菌(Bacillus megaterium)、短小芽孢杆菌(Bacillus pumilus)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)、枯草芽孢杆菌(Bacillus subtilis)、或苏云金芽孢杆菌(Bacillus thuringiensis)多肽。
在另一方面,该亲本是似马链球菌(Streptococcus equisimilis)、酿脓链球菌(Streptococcus pyogenes)、乳房链球菌(Streptococcus uberis)、或马链球菌兽瘟亚种(Streptococcus equi subsp.Zooepidemicus)多肽。
在另一方面,该亲本是不产色链霉菌(Streptomyces achromogenes)、除虫链霉菌(Streptomyces avermitilis)、天蓝链霉菌(Streptomyces coelicolor)、灰色链霉菌(Streptomyces griseus)、或浅青紫链霉菌(Streptomyces lividans)多肽。
该亲本可以是一种真菌纤维二糖水解酶或碳水化合物结合模块。例如,该亲本可以是酵母纤维二糖水解酶或碳水化合物结合模块,如假丝酵母属(Candida)、克鲁弗酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)、或耶氏酵母属(Yarrowia)多肽。例如,该亲本可以是丝状真菌纤维二糖水解酶或碳水化合物结合模块,如枝顶孢霉属(Acremonium)、伞菌属(Agaricus)、链格孢属(Alternaria)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、葡萄座腔菌属(Botryospaeria)、拟蜡菌属(Ceriporiopsis)、毛壳菌属(Chaetomium)、金孢子菌属(Chrysosporium)、麦角菌属(Claviceps)、旋孢腔菌属(Cochliobolus)、鬼伞属(Coprinopsis)、乳白蚁属(Coptotermes)、棒囊壳属(Corynascus)、隐丛赤壳菌属(Cryphonectria)、隐球菌属(Cryptococcus)、色二孢属(Diplodia)、黑耳属(Exidia)、芬尼菌属(Fennellia)、线黑粉酵母属(Filibasidium)、镰孢属(Fusarium)、赤霉属(Gibberella)、全鞭毛虫属(Holomastigotoides)、腐质霉属(Humicola)、耙齿菌属(Irpex)、香菇属(Lentinula)、小腔球菌属(Leptospaeria)、梨孢菌属(Magnaporthe)、黑果菌属(Melanocarpus)、亚灰树花菌属(Meripilus)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、新美鞭菌属(Neocallimastix)、链孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉菌属(Penicillium)、平革菌属(Phanerochaete)、瘤胃壶菌属(Piromyces)、Poitrasia、假黑盘菌属(Pseudoplectania)、假披发虫属(Pseudotrichonympha)、根毛霉菌属(Rhizomucor)、裂褶菌属(Schizophyllum)、柱顶孢属(Scytalidium)、篮状菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳霉属(Thielavia)、弯颈霉属(Tolypocladium)、木霉属(Trichoderma)、长毛盘菌属(Trichophaea)、轮枝孢属(Verticillium)、小包脚菇属(Volvariella)、或炭角菌属(Xylaria)多肽。
在另一方面,该亲本是卡氏酵母(Saccharomyces carlsbergensis)、酿酒酵母(Saccharomyces cerevisiae)、糖化酵母(Saccharomyces diastaticus)、道格拉氏酵母(Saccharomyces douglasii)、克鲁弗酵母(Saccharomyces kluyveri)、诺地酶母(Saccharomyces norbensis)、或卵形酵母(Saccharomyces oviformis)多肽。
在另一方面,该亲本是解纤维枝顶孢霉(Acremonium cellulolyticus)、棘孢曲霉(Aspergillus aculeatus)、泡盛曲霉(Aspergillus awamori)、臭曲霉(Aspergillusfoetidus)、烟曲霉(Aspergillus fumigatus)、日本曲霉(Aspergillus japonicus)、构巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillus niger)、米曲霉(Aspergillusoryzae)、狭边金孢子菌(Chrysosporium inops)、嗜角质金孢子菌(Chrysosporiumkeratinophilum)、卢克诺文思金孢子菌(Chrysosporium lucknowense)、粪状金孢子菌(Chrysosporium merdarium)、租金孢子菌(Chrysosporium pannicola)、女王杜香金孢子菌(Chrysosporium queenslandicum)、热带金孢子菌(Chrysosporium tropicum)、褐薄金孢子菌(Chrysosporium zonatum)、嗜热棒囊孢壳菌(Corynascus thermophilus)、杆孢状镰孢(Fusarium bactridioides)、谷类镰孢(Fusarium cerealis)、库威镰孢(Fusariumcrookwellense)、大刀镰孢(Fusarium culmorum)、禾谷镰孢(Fusarium graminearum)、禾赤镰孢(Fusarium graminum)、异孢镰孢(Fusarium heterosporum)、合欢木镰孢(Fusariumnegundi)、尖镰孢(Fusarium oxysporum)、多枝镰孢(Fusarium reticulatum)、粉红镰孢(Fusarium roseum)、接骨木镰孢(Fusarium sambucinum)、肤色镰孢(Fusariumsarcochroum)、拟分枝孢镰孢(Fusarium sporotrichioides)、硫色镰孢(Fusariumsulphureum)、圆镰孢(Fusarium torulosum)、拟丝孢镰孢(Fusarium trichothecioides)、镶片镰孢(Fusarium venenatum)、灰腐质霉(Humicola grisea)、特异腐质霉(Humicolainsolens)、疏棉状腐质霉(Humicola lanuginosa)、白耙齿菌(Irpex lacteus)、米黑毛霉(Mucor miehei)、嗜热毁丝霉(Myceliophthora thermophila)、粗糙链孢菌(Neurosporacrassa)、埃默森青霉菌(Penicillium emersonii)、绳状青霉菌(Penicilliumfuniculosum)、产紫青霉菌(Penicillium purpurogenum)、黄孢原毛平革菌(Phanerochaete chrysosporium)、匹斯特斯多孔菌(Polyporus pinsitus)、金黄色嗜热子囊菌(Thermoascus aurantiacus)、甲壳嗜热子囊菌(Thermoascus crustaceus)、无色梭孢壳霉(Thielavia achromatica)、成层梭孢壳菌(Thielavia albomyces)、白毛梭孢壳(Thielavia albopilosa)、澳洲梭孢壳霉(Thielavia australeinsis)、粪梭孢壳(Thielavia fimeti)、小孢梭孢壳霉(Thielavia microspora)、卵孢梭孢壳霉(Thielaviaovispora)、秘鲁梭孢壳(Thielavia peruviana)、瘤孢梭孢壳霉(Thielaviaspededonium)、毛梭孢壳霉(Thielavia setosa)、耐热梭孢壳(Thielaviasubthermophila)、土生梭孢壳霉(Thielavia terrestris)、哈茨木霉(Trichodermaharzianum)、康宁木霉(Trichoderma koningii)、长枝木霉(Trichodermalongibrachiatum)、里氏木霉(Trichoderma reesei)、或绿色木霉(Trichoderma viride)多肽。
在另一方面,该亲本是里氏木霉纤维二糖水解酶,例如SEQ ID NO:2的纤维二糖水解酶或其成熟多肽;或者里氏木霉碳水化合物结合模块,例如SEQ ID NO:4的碳水化合物结合模块。
在另一方面,该亲本是特异腐质霉(Humicola insolens)纤维二糖水解酶,例如SEQ ID NO:6或其成熟多肽的纤维二糖水解酶;或者特异腐质霉碳水化合物结合模块,例如SEQ ID NO:8的碳水化合物结合模块。
在另一方面,该亲本是嗜热毛壳菌纤维二糖水解酶,例如SEQ ID NO:10或其成熟多肽的纤维二糖水解酶;或者嗜热毛壳菌碳水化合物结合模块,例如SEQ ID NO:12的碳水化合物结合模块。
在另一方面,该亲本是丝衣霉状篮状菌纤维二糖水解酶,例如SEQ ID NO:14或其成熟多肽的纤维二糖水解酶;或者丝衣霉状篮状菌碳水化合物结合模块,例如SEQ ID NO:16的碳水化合物结合模块。
在另一方面,该亲本是Talaromyces leycettanus纤维二糖水解酶,例如SEQ IDNO:42、SEQ ID NO:44或其成熟多肽的纤维二糖水解酶;或者Talaromyces leycettanus碳水化合物结合模块,例如SEQ ID NO:42的氨基酸472至507或SEQ ID NO:44的氨基酸472至507的碳水化合物结合模块。
在另一方面,该亲本是烟曲霉纤维二糖水解酶,例如SEQ ID NO:18、SEQ ID NO:78或其成熟多肽的纤维二糖水解酶;或者烟曲霉碳水化合物结合模块,例如SEQ ID NO:20的碳水化合物结合模块。
在另一方面,该亲本是土生梭孢壳霉纤维二糖水解酶,例如SEQ ID NO:22或其成熟多肽的纤维二糖水解酶;或者土生梭孢壳霉碳水化合物结合模块,例如SEQ ID NO:24的碳水化合物结合模块。
在另一方面,该亲本是嗜热毁丝霉纤维二糖水解酶,例如SEQ ID NO:26或其成熟多肽的纤维二糖水解酶;或者嗜热毁丝霉碳水化合物结合模块,例如SEQ ID NO:28的碳水化合物结合模块。
将理解的是,对于以上提到的物种而言,本发明涵盖完全状态和不完全状态(perfect and imperfect states)二者、以及其他分类学等效物,例如无性型,而不管它们已知的物种名称是什么。本领域普通技术人员将容易地识别适当等效物的身份。
这些物种的菌株可以容易地在许多培养物保藏中心为公众所获得,如美国典型培养物保藏中心(ATCC)、德国微生物菌种保藏中心(Deutsche Sammlung vonMikroorganismen und Zellkulturen GmbH,DSMZ)、荷兰菌种保藏中心(CentraalbureauVoor Schimmelcultures,CBS)以及美国农业研究服务专利培养物保藏中心北方地区研究中心(NRRL)。
可以使用以上提到的探针从其他来源,包括从自然界(例如,土壤、堆肥、水等)分离的微生物或直接从自然材料(例如,土壤、堆肥、水等)获得的DNA样品鉴定和获得该亲本。用于直接地从自然生活环境分离微生物和DNA的技术是本领域中熟知的。然后可通过在另一种微生物或混合DNA样品的基因组DNA或cDNA文库中类似地进行筛选来获得编码亲本的多核苷酸。一旦已经用一个或多个探针检测到编码亲本的多核苷酸,则可以通过利用对本领域的普通技术人员来说已知的技术来分离或克隆该多核苷酸(参见例如,萨拉布鲁克(Sambrook)等人,1989,见上文)。
变体的制备
本发明还涉及用于获得具有纤维二糖水解酶活性的变体的方法,这些方法包括:(a)在与SEQ ID NO:2的位置483、491、509和510对应的一个或多个(例如,若干)位置处向亲本纤维二糖水解酶引入取代,其中该变体具有纤维二糖水解酶活性;并且(b)回收该变体。
本发明还涉及用于获得碳水化合物结合模块变体的方法,这些方法包括:(a)在对应于SEQ ID NO:4的碳水化合物结合模块的位置5、13、31和32的一个或多个(例如,若干个)位置处向亲本碳水化合物结合模块引入取代,其中该变体具有碳水化合物结合活性;并且(b)回收该变体。
可以使用本领域已知的任何诱变程序来制备这些变体,例如定点诱变、合成基因构建、半合成基因构建、随机诱变、改组等。
定点诱变是在编码该亲本的多核苷酸中的一个或多个限定位点处引入一个或多个(例如,若干个)突变的技术。
通过使用涉及包含所希望的突变的寡核苷酸引物的PCR可以体外实现定点诱变。也可以通过盒式诱变进行体外定点诱变,所述盒式诱变涉及由限制酶在包括编码亲本的多核苷酸的质粒中的位点处切割并且随后将包含突变的寡核苷酸连接在多核苷酸中。通常,消化该质粒与该寡核苷酸的限制酶是相同的,以允许该质粒的粘性末端以及插入片段彼此连接。参见,例如谢勒(Scherer)和戴维斯(Davis),1979,美国国家科学院院刊(Proc.Natl.Acad.Sci.USA)76:4949-4955;和巴顿(Barton)等人,1990,核酸研究(NucleicAcids Res.)18:7349-4966。
还可以通过本领域已知的方法体内实现定点诱变。参见,例如,美国专利申请公开号2004/0171154;斯托西(Storici)等人,2001,自然生物技术(Nature Biotechnol.)19:773-776;凯伦(Kren)等人,1998,自然医学(Nat.Med.)4:285-290;以及卡里萨诺(Calissano)和曼奇诺(Macino),1996,真菌遗传学通讯(Fungal Genet.Newslett.)43:15-16。
在本发明中可以使用任何定点诱变程序。存在可用于制备变体的很多可商购的试剂盒。
合成基因构建需要体外合成设计的多核苷酸分子以编码感兴趣的多肽。基因合成可以利用多种技术来进行,如由田(Tian)等人(2004,自然(Nature)432:1050-1054)所述的基于多路微芯片的技术、以及其中在光可编程的微流芯片上合成并组装寡核苷酸的类似技术。
可以做出单个或多个氨基酸取代、缺失和/或插入并且使用诱变、重组和/或改组的已知方法进行测试,随后进行相关筛选程序,如由里德哈尔-奥尔森(Reidhaar-Olson)和萨奥尔(Sauer),1988,科学(Science)241:53-57;博维(Bowie)和萨奥尔,1989,美国国家科学院院刊(Proc.Natl.Acad.Sci.USA)86:2152-2156;WO 95/17413;或WO 95/22625披露的那些。可以使用的其他方法包括易错PCR、噬菌体展示(例如,罗曼(Lowman)等人,1991,生物化学(Biochemistry)30:10832-10837;美国专利号5,223,409;WO 92/06204)和区域定向诱变(德比舍尔(Derbyshire)等人,1986,基因(Gene)46:145;Ner等人,1988,DNA 7:127)。
诱变/改组方法可以与高通量自动化筛选方法组合以检测由宿主细胞表达的克隆的诱变多肽的活性(奈斯(Ness)等人,1999,自然生物技术(Nature Biotechnology)17:893-896)。编码活性多肽的诱变的DNA分子可以回收自宿主细胞,并且使用本领域的标准方法对其进行迅速测序。这些方法允许迅速确定多肽中单个氨基酸残基的重要性。
通过组合合成基因构建、和/或定点诱变、和/或随机诱变、和/或改组的多个方面来实现半合成基因构建。半合成构建典型地是利用合成的多核苷酸片段的过程结合PCR技术。因此,基因的限定的区域可以从头合成,而其他区域可以使用位点特异性诱变引物来扩增,而还有其他区域可以经受易错PCR或非易错PCR扩增。然后可以对多核苷酸子序列进行改组。
杂合多肽
本发明还涉及杂合多肽,这些杂合多肽包括在此所述的碳水化合物结合模块变体和纤维素分解酶的异源催化结构域。在一些实施例中,该杂合多肽具有碳水化合物结合活性。在一些实施例中,该杂合多肽具有纤维素分解活性(例如,纤维二糖水解酶活性)。在一些实施例中,该杂合多肽具有碳水化合物结合活性和纤维素分解活性(例如,纤维二糖水解酶活性)两者。
该杂合多肽可以通过将缺乏碳水化合物结合模块的纤维素分解酶的催化结构域与在此所述的碳水化合物结合模块变体融合,或通过将包括碳水化合物结合模块变体(如在此所述的纤维二糖水解酶变体)的纤维素分解酶的现有催化结构域用不同纤维素分解酶的催化结构域替换来形成。
在一方面,该碳水化合物结合模块变体被融合至异源催化结构域的N-末端。在另一方面,该碳水化合物结合模块变体被融合至异源催化结构域的C-末端。
在一方面是一种具有纤维素分解活性的杂合多肽,该杂合多肽包括:
(a)在包括纤维素分解酶的异源催化结构域的杂合多肽的N-末端处的片段;和
(b)在包括碳水化合物结合模块变体的第一多肽片段的C-末端的片段,其中该变体包括在对应于SEQ ID NO:4的碳水化合物结合模块的位置5、13、31和32的一个或多个(例如,若干个)位置处的取代。
在杂合多肽中使用的催化结构域可以是在此所述的任何纤维素分解酶的任何合适的催化结构域(如下文酶组合物部分中所述的任何纤维素分解酶的催化结构域),并且可以从任何属的微生物获得,如上文所述。
例如,该催化结构域尤其可以从内切葡聚糖酶、纤维二糖水解酶、或GH61多肽中获得。在一个实施例中,该催化结构域来自内切葡聚糖酶。在另一个实施例中,该催化结构域来自纤维二糖水解酶。在另一个实施例中,该催化结构域来自GH61多肽。
在一方面,该杂合多肽的催化结构域是纤维二糖水解酶催化结构域,并且该杂合多肽具有纤维二糖水解酶活性。
该杂合多肽的催化结构域可以是丝状真菌纤维二糖水解酶。例如,该亲本可以是一种丝状真菌纤维二糖水解酶,如曲霉属、毛壳菌属、金孢子菌属、毁丝霉属、青霉属、踝节菌属、嗜热子嚢菌属或木霉属纤维二糖水解酶。
在一方面,该杂合多肽的催化结构域是棘孢曲霉、泡盛曲霉、臭曲霉、烟曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、嗜热毛壳菌、狭边金孢子菌(Chrysosporium inops)、嗜角质金孢子菌(Chrysosporium keratinophilum)、卢克诺文思金孢子菌(Chrysosporiumlucknowense)、莫达瑞姆金孢子菌(Chrysosporium merdarium)、租金孢子菌(Chrysosporium pannicola)、昆士兰金孢子菌(Chrysosporium queenslandicum)、热带金孢子菌(Chrysosporium tropicum)、带纹金孢子菌(Chrysosporium zonatum)、嗜热毁丝霉、埃默森青霉、绳状青霉菌、产紫青霉菌、丝衣霉状篮状菌(Talaromycesbyssochlamydoides)、埃默森篮状菌、Talaromyces leycettanus、哈茨木霉、康宁木霉、长枝木霉、里氏木霉或绿色木霉纤维二糖水解酶催化结构域。
在一个实施例中,该催化结构域是里氏木霉纤维二糖水解酶的异源催化结构域,例如SEQ ID NO:30的催化结构域,如SEQ ID NO:30的氨基酸1至429。
在另一个实施例中,该催化结构域是烟曲霉纤维二糖水解酶的异源催化结构域,例如SEQ ID NO:36的催化结构域,如SEQ ID NO:36的氨基酸1至437。
在另一个实施例中,该催化结构域是金黄色嗜热子囊菌纤维二糖水解酶的异源催化结构域,例如SEQ ID NO:38的催化结构域,如SEQ ID NO:38的氨基酸1至440。
在另一个实施例中,该催化结构域是埃默森青霉菌纤维二糖水解酶的异源催化结构域,例如SEQ ID NO:40的催化结构域,如SEQ ID NO:40的氨基酸1至437。
在另一个实施例中,该催化结构域是Talaromyces leycettanus纤维二糖水解酶的异源催化结构域,例如SEQ ID NO:42的催化结构域,如SEQ ID NO:44的氨基酸1至438。
在另一个实施例中,该催化结构域是丝衣霉状篮状菌纤维二糖水解酶的异源催化结构域,例如SEQ ID NO:46的催化结构域,如SEQ ID NO:46的氨基酸1至437。
在另一个实施例中,该催化结构域是嗜热毁丝霉纤维二糖水解酶的异源催化结构域,例如SEQ ID NO:48的催化结构域,如SEQ ID NO:48的氨基酸1至430。
在另一个实施例中,该催化结构域是嗜热毛壳菌纤维二糖水解酶的异源催化结构域,例如SEQ ID NO:50的催化结构域,如SEQ ID NO:50的氨基酸1至433。
在另一个方面是一种具有纤维素分解活性的杂合多肽,该杂合多肽包括:
(a)在包括纤维素分解酶的异源催化结构域的杂合多肽的N-末端处的片段;其中该片段
(i)与SEQ ID NO:30的氨基酸1至429、SEQ ID NO:36的氨基酸1至437、SEQ ID NO:38的氨基酸1至440、SEQ ID NO:40的氨基酸1至437、SEQ ID NO:42的氨基酸1至437、SEQ IDNO:44的氨基酸1至438、SEQ ID NO:46的氨基酸1至437、SEQ ID NO:48的氨基酸1至430、或SEQ ID NO:50的氨基酸1至433具有至少60%一致性,
(ii)由以下催化结构域编码序列编码,该催化结构域编码序列在低严格条件下与SEQ ID NO:29的核苷酸52至1469、SEQ ID NO:31的核苷酸52至1389、SEQ ID NO:32的核苷酸52至1389、SEQ ID NO:35的核苷酸79至1389、SEQ ID NO:37的核苷酸52至1371、SEQ IDNO:39的核苷酸55至1482、SEQ ID NO:41的核苷酸76至1386、SEQ ID NO:43的核苷酸76至1386、SEQ ID NO:45的核苷酸55至1504、SEQ ID NO:47的核苷酸61至1350或SEQ ID NO:49的核苷酸55至1353;其cDNA序列;或前述的全长互补体杂交;
(iii)由与SEQ ID NO:29的核苷酸52至1469、SEQ ID NO:31的核苷酸52至1389、SEQ ID NO:32的核苷酸52至1389、SEQ ID NO:35的核苷酸79至1389、SEQ ID NO:37的核苷酸52至1371、SEQ ID NO:39的核苷酸55至1482、SEQ ID NO:41的核苷酸76至1386、SEQ IDNO:43的核苷酸76至1386、SEQ ID NO:45的核苷酸55至1504、SEQ ID NO:47的核苷酸61至1350、或SEQ ID NO:49的核苷酸55至1353;或其cDNA序列具有至少60%一致性的催化结构域编码序列编码;
(iv)是SEQ ID NO:30的氨基酸1至429、SEQ ID NO:36的氨基酸1至437、SEQ IDNO:38的氨基酸1至440、SEQ ID NO:40的氨基酸1至437、SEQ ID NO:42的氨基酸1至437、SEQID NO:44的氨基酸1至438、SEQ ID NO:46的氨基酸1至437、SEQ ID NO:48的氨基酸1至433、或SEQ ID NO:50的氨基酸1至433的变体,该变体在一个或多个(例如,若干个)位置处包括取代,缺失和/或插入;抑或
(v)包括SEQ ID NO:30的氨基酸1至429、SEQ ID NO:36的氨基酸1至437、SEQ IDNO:38的氨基酸1至440、SEQ ID NO:40的氨基酸1至437、SEQ ID NO:42的氨基酸1至437、SEQID NO:44的氨基酸1至438、SEQ ID NO:46的氨基酸1至437、SEQ ID NO:48的氨基酸1至430、或SEQ ID NO:50的氨基酸1至433或由其组成;和
(b)在包括碳水化合物结合模块变体的第一多肽片段的C-末端的片段,其中该变体包括在对应于SEQ ID NO:4的碳水化合物结合模块的位置5、13、31和32的一个或多个(例如,若干个)位置处的取代。
在一个实施例中,在包括异源催化结构域的杂合多肽的N-末端的片段(i)与SEQID NO:30的氨基酸1至429具有至少60%一致性;(ii)由以下催化结构域编码序列编码,该催化结构域编码序列在低严格条件下与SEQ ID NO:29的核苷酸52至1469、SEQ ID NO:31的核苷酸52至1389、或SEQ ID NO:32的核苷酸52至1389;其cDNA序列;或前述的全长互补体杂交;或(iii)由与SEQ ID NO:29的核苷酸52至1469、SEQ ID NO:31的核苷酸52至1389、或SEQID NO:32的核苷酸52至1389具有至少60%一致性的催化结构域编码序列编码。
在另一个实施例中,在包括异源催化结构域的杂合多肽的N-末端的片段(i)与SEQID NO:36的氨基酸1至437具有至少60%一致性;(ii)由以下催化结构域编码序列编码,该催化结构域编码序列在低严格条件下与SEQ ID NO:35的核苷酸79至1389;其cDNA序列;或前述的全长互补体杂交;或(iii)由与SEQ ID NO:35的核苷酸79至1389具有至少60%一致性的催化结构域编码序列编码。
在另一个实施例中,在包括异源催化结构域的杂合多肽的N-末端的片段(i)与SEQID NO:38的氨基酸1至440具有至少60%一致性;(ii)由以下催化结构域编码序列编码,该催化结构域编码序列在低严格条件下与SEQ ID NO:37的核苷酸52至1371;其cDNA序列;或前述的全长互补体杂交;或(iii)由与SEQ ID NO:37的核苷酸52至1371具有至少60%一致性的催化结构域编码序列编码。
在另一个实施例中,在包括异源催化结构域的杂合多肽的N-末端的片段(i)与SEQID NO:40的氨基酸1至437具有至少60%一致性;(ii)由以下催化结构域编码序列编码,该催化结构域编码序列在低严格条件下与SEQ ID NO:39的核苷酸55至1482;其cDNA序列;或前述的全长互补体杂交;或(iii)由与SEQ ID NO:39的核苷酸55至1482具有至少60%一致性的催化结构域编码序列编码。
在另一个实施例中,在包括异源催化结构域的杂合多肽的N-末端的片段(i)与SEQID NO:42的氨基酸1至437具有至少60%一致性;(ii)由以下催化结构域编码序列编码,该催化结构域编码序列在低严格条件下与SEQ ID NO:41的核苷酸76至1386;其cDNA序列;或前述的全长互补体杂交;或(iii)由与SEQ ID NO:41的核苷酸76至1386具有至少60%一致性的催化结构域编码序列编码。
在另一个实施例中,在包括异源催化结构域的杂合多肽的N-末端的片段(i)与SEQID NO:44的氨基酸1至438具有至少60%一致性;(ii)由以下催化结构域编码序列编码,该催化结构域编码序列在低严格条件下与SEQ ID NO:43的核苷酸76至1386;其cDNA序列;或前述的全长互补体杂交;或(iii)由与SEQ ID NO:43的核苷酸76至1386具有至少60%一致性的催化结构域编码序列编码。
在另一个实施例中,在包括异源催化结构域的杂合多肽的N-末端的片段(i)与SEQID NO:46的氨基酸1至437具有至少60%一致性;(ii)由以下催化结构域编码序列编码,该催化结构域编码序列在低严格条件下与SEQ ID NO:45的核苷酸55至1504;其cDNA序列;或前述的全长互补体杂交;或(iii)由与SEQ ID NO:45的核苷酸55至1504具有至少60%一致性的催化结构域编码序列编码。
在另一个实施例中,在包括异源催化结构域的杂合多肽的N-末端的片段(i)与SEQID NO:48的氨基酸1至430具有至少60%一致性;(ii)由以下催化结构域编码序列编码,该催化结构域编码序列在低严格条件下与SEQ ID NO:47的核苷酸61至1350;其cDNA序列;或前述的全长互补体杂交;或(iii)由与SEQ ID NO:47的核苷酸61至1350具有至少60%一致性的催化结构域编码序列编码。
在另一个实施例中,在包括异源催化结构域的杂合多肽的N-末端的片段(i)与SEQID NO:50的氨基酸1至433具有至少60%一致性;(ii)由以下催化结构域编码序列编码,该催化结构域编码序列在低严格条件下与SEQ ID NO:49的核苷酸55至1353;其cDNA序列;或前述的全长互补体杂交;或(iii)由与SEQ ID NO:49的核苷酸55至1353具有至少60%一致性的催化结构域编码序列编码。
在另一个实施例中,在包括异源催化结构域的杂合多肽的N-末端的片段的片段与SEQ ID NO:30的氨基酸1至429具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,其具有纤维二糖水解酶活性。在另一方面,该亲本的氨基酸序列与SEQ ID NO:30的氨基酸1至429相差多达10个氨基酸,例如1、2、3、4、5、6、7、8、9或10个。在另一个实施例中,在包括异源催化结构域的杂合多肽的N-末端的片段包括SEQ ID NO:30的氨基酸1至429或由其组成。
在另一个实施例中,在包括异源催化结构域的杂合多肽的N-末端的片段的片段与SEQ ID NO:36的氨基酸1至437具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,其具有纤维二糖水解酶活性。在另一方面,该亲本的氨基酸序列与SEQ ID NO:36的氨基酸1至437相差多达10个氨基酸,例如1、2、3、4、5、6、7、8、9或10个。在另一个实施例中,在包括异源催化结构域的杂合多肽的N-末端的片段包括SEQ ID NO:36的氨基酸1至437或由其组成。
在另一个实施例中,在包括异源催化结构域的杂合多肽的N-末端的片段的片段与SEQ ID NO:38的氨基酸1至440具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,其具有纤维二糖水解酶活性。在另一方面,该亲本的氨基酸序列与SEQ ID NO:38的氨基酸1至440相差多达10个氨基酸,例如1、2、3、4、5、6、7、8、9或10个。在另一个实施例中,在包括异源催化结构域的杂合多肽的N-末端的片段包括SEQ ID NO:38的氨基酸1至440或由其组成。
在另一个实施例中,在包括异源催化结构域的杂合多肽的N-末端的片段的片段与SEQ ID NO:40的氨基酸1至437具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,其具有纤维二糖水解酶活性。在另一方面,该亲本的氨基酸序列与SEQ ID NO:40的氨基酸1至437相差多达10个氨基酸,例如1、2、3、4、5、6、7、8、9或10个。在另一个实施例中,在包括异源催化结构域的杂合多肽的N-末端的片段包括SEQ ID NO:40的氨基酸1至437或由其组成。
在另一个实施例中,在包括异源催化结构域的杂合多肽的N-末端的片段的片段与SEQ ID NO:42的氨基酸1至437具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,其具有纤维二糖水解酶活性。在另一方面,该亲本的氨基酸序列与SEQ ID NO:42的氨基酸1至437相差多达10个氨基酸,例如1、2、3、4、5、6、7、8、9或10个。在另一个实施例中,在包括异源催化结构域的杂合多肽的N-末端的片段包括SEQ ID NO:42的氨基酸1至437或由其组成。
在另一个实施例中,在包括异源催化结构域的杂合多肽的N-末端的片段的片段与SEQ ID NO:44的氨基酸1至438具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,其具有纤维二糖水解酶活性。在另一方面,该亲本的氨基酸序列与SEQ ID NO:44的氨基酸1至438相差多达10个氨基酸,例如1、2、3、4、5、6、7、8、9或10个。在另一个实施例中,在包括异源催化结构域的杂合多肽的N-末端的片段包括SEQ ID NO:44的氨基酸1至438或由其组成。
在另一个实施例中,在包括异源催化结构域的杂合多肽的N-末端的片段的片段与SEQ ID NO:46的氨基酸1至437具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,其具有纤维二糖水解酶活性。在另一方面,该亲本的氨基酸序列与SEQ ID NO:46的氨基酸1至437相差多达10个氨基酸,例如1、2、3、4、5、6、7、8、9或10个。在另一个实施例中,在包括异源催化结构域的杂合多肽的N-末端的片段包括SEQ ID NO:46的氨基酸1至437或由其组成。
在另一个实施例中,在包括异源催化结构域的杂合多肽的N-末端的片段的片段与SEQ ID NO:48的氨基酸1至430具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,其具有纤维二糖水解酶活性。在另一方面,该亲本的氨基酸序列与SEQ ID NO:48的氨基酸1至430相差多达10个氨基酸,例如1、2、3、4、5、6、7、8、9或10个。在另一个实施例中,在包括异源催化结构域的杂合多肽的N-末端的片段包括SEQ ID NO:48的氨基酸1至430或由其组成。在一些实施例中,该杂合多肽包括SEQ IDNO:61或由其组成。在其他实施例中,该杂合多肽包括SEQ ID NO:63或由其组成。
在另一个实施例中,在包括异源催化结构域的杂合多肽的N-末端的片段的片段与SEQ ID NO:50的氨基酸1至433具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性,其具有纤维二糖水解酶活性。在另一方面,该亲本的氨基酸序列与SEQ ID NO:50的氨基酸1至433相差多达10个氨基酸,例如1、2、3、4、5、6、7、8、9或10个。在另一个实施例中,在包括异源催化结构域的杂合多肽的N-末端的片段包括SEQ ID NO:50的氨基酸1至433或由其组成。
在另一方面,在包括异源催化结构域的杂合多肽的N-末端的片段在低严格条件、中等严格条件、中-高严格条件、高严格条件或非常高严格条件下与SEQ ID NO:29的核苷酸52至1469、SEQ ID NO:31的核苷酸52至1389、SEQ ID NO:32的核苷酸52至1389;其cDNA序列;或前述的全长互补体杂交(萨拉布鲁克等人,1989,同上)。
在另一方面,在包括异源催化结构域的杂合多肽的N-末端的片段在低严格条件、中等严格条件、中-高严格条件、高严格条件或非常高严格条件下与SEQ ID NO:35的核苷酸79至1389;其cDNA序列;或前述的全长互补体杂交(萨拉布鲁克等人,1989,同上)。
在另一方面,在包括异源催化结构域的杂合多肽的N-末端的片段在低严格条件、中等严格条件、中-高严格条件、高严格条件或非常高严格条件下与SEQ ID NO:37的核苷酸52至1371;其cDNA序列;或前述的全长互补体杂交(萨拉布鲁克等人,1989,同上)。
在另一方面,在包括异源催化结构域的杂合多肽的N-末端的片段在低严格条件、中等严格条件、中-高严格条件、高严格条件或非常高严格条件下与SEQ ID NO:39的核苷酸55至1482;其cDNA序列;或前述的全长互补体杂交(萨拉布鲁克等人,1989,同上)。
在另一方面,在包括异源催化结构域的杂合多肽的N-末端的片段在低严格条件、中等严格条件、中-高严格条件、高严格条件或非常高严格条件下与SEQ ID NO:41的核苷酸76至1386;其cDNA序列;或前述的全长互补体杂交(萨拉布鲁克等人,1989,同上)。
在另一方面,在包括异源催化结构域的杂合多肽的N-末端的片段在低严格条件、中等严格条件、中-高严格条件、高严格条件或非常高严格条件下与SEQ ID NO:43的核苷酸76至1386;其cDNA序列;或前述的全长互补体杂交(萨拉布鲁克等人,1989,同上)。
在另一方面,在包括异源催化结构域的杂合多肽的N-末端的片段在低严格条件、中等严格条件、中-高严格条件、高严格条件或非常高严格条件下与SEQ ID NO:45的核苷酸55至1504;其cDNA序列;或前述的全长互补体杂交(萨拉布鲁克等人,1989,同上)。
在另一方面,在包括异源催化结构域的杂合多肽的N-末端的片段在低严格条件、中等严格条件、中-高严格条件、高严格条件或非常高严格条件下与SEQ ID NO:47的核苷酸61至1350;其cDNA序列;或前述的全长互补体杂交(萨拉布鲁克等人,1989,同上)。
在另一方面,在包括异源催化结构域的杂合多肽的N-末端的片段在低严格条件、中等严格条件、中-高严格条件、高严格条件或非常高严格条件下与SEQ ID NO:49的核苷酸55至1353;其cDNA序列;或前述的全长互补体杂交(萨拉布鲁克等人,1989,同上)。
在另一方面,在包括异源催化结构域的杂合多肽的N-末端的片段与SEQ ID NO:29的核苷酸52至1469、SEQ ID NO:31的核苷酸52至1389、SEQ ID NO:32的核苷酸52至1389;或其cDNA序列具有至少60%,例如至少65%、至少70%、至少75%、至少80%至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性。在另一个实施例中,在包括异源催化结构域的杂合多肽的N-末端的片段包括SEQ ID NO:29的核苷酸52至1469、SEQ ID NO:31的核苷酸52至1389、SEQ IDNO:32的核苷酸52至1389;或其cDNA序列或由其组成。
在另一方面,在包括异源催化结构域的杂合多肽的N-末端的片段与SEQ ID NO:35的核苷酸79至1389;或其cDNA序列具有至少60%,例如至少65%、至少70%、至少75%、至少80%至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性。在另一个实施例中,在包括异源催化结构域的杂合多肽的N-末端的片段包括SEQ ID NO:35的核苷酸79至1389;或其cDNA序列或由其组成。
在另一方面,在包括异源催化结构域的杂合多肽的N-末端的片段与SEQ ID NO:37的核苷酸52至1371;或其cDNA序列具有至少60%,例如至少65%、至少70%、至少75%、至少80%至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性。在另一个实施例中,在包括异源催化结构域的杂合多肽的N-末端的片段包括SEQ ID NO:37的核苷酸52至1371;或其cDNA序列或由其组成。
在另一方面,在包括异源催化结构域的杂合多肽的N-末端的片段与SEQ ID NO:39的核苷酸55至1482;或其cDNA序列具有至少60%,例如至少65%、至少70%、至少75%、至少80%至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性。在另一个实施例中,在包括异源催化结构域的杂合多肽的N-末端的片段包括SEQ ID NO:39的核苷酸55至1482;或其cDNA序列或由其组成。
在另一方面,在包括异源催化结构域的杂合多肽的N-末端的片段与SEQ ID NO:41的核苷酸76至1386;或其cDNA序列具有至少60%,例如至少65%、至少70%、至少75%、至少80%至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性。在另一个实施例中,在包括异源催化结构域的杂合多肽的N-末端的片段包括SEQ ID NO:41的核苷酸76至1386;或其cDNA序列或由其组成。
在另一方面,在包括异源催化结构域的杂合多肽的N-末端的片段与SEQ ID NO:43的核苷酸76至1386;或其cDNA序列具有至少60%,例如至少65%、至少70%、至少75%、至少80%至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性。在另一个实施例中,在包括异源催化结构域的杂合多肽的N-末端的片段包括SEQ ID NO:43的核苷酸76至1386;或其cDNA序列或由其组成。
在另一方面,在包括异源催化结构域的杂合多肽的N-末端的片段与SEQ ID NO:45的核苷酸55至1504;或其cDNA序列具有至少60%,例如至少65%、至少70%、至少75%、至少80%至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性。在另一个实施例中,在包括异源催化结构域的杂合多肽的N-末端的片段包括SEQ ID NO:45的核苷酸55至1504;或其cDNA序列或由其组成。
在另一方面,在包括异源催化结构域的杂合多肽的N-末端的片段与SEQ ID NO:47的核苷酸61至1350;或其cDNA序列具有至少60%,例如至少65%、至少70%、至少75%、至少80%至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性。在另一个实施例中,在包括异源催化结构域的杂合多肽的N-末端的片段包括SEQ ID NO:47的核苷酸61至1350;或其cDNA序列或由其组成。
在另一方面,在包括异源催化结构域的杂合多肽的N-末端的片段与SEQ ID NO:49的核苷酸55至1353;或其cDNA序列具有至少60%,例如至少65%、至少70%、至少75%、至少80%至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性。在另一个实施例中,在包括异源催化结构域的杂合多肽的N-末端的片段包括SEQ ID NO:49的核苷酸55至1353;或其cDNA序列或由其组成。
在包含杂合多肽的异源催化结构域的杂合多肽的N-末端的片段可以进一步包括在一个或多个(例如,若干个)其他位置处的取代、缺失和/或插入,如在对应于PCT/US2014/022068、WO 2011/050037、WO 2005/028636、WO 2005/001065、WO 2004/016760、和美国专利号7,375,197中所披露的位置的一个或多个(例如,若干个)位置处的改变,将这些文献以其全部内容结合在此。
例如,在一方面,在N-末端包括异源催化结构域的片段是在对应于SEQ ID NO:30的位置197、198、199及200的一个或多个位置处包括一个改变的纤维二糖水解酶,其中对应于位置197、198和200的一个或多个位置处的改变是一个取代并且对应于位置199的位置处的改变是一个缺失。在另一方面,该片段在对应于SEQ ID NO:30的位置197、198、199及200中的任何位置的两个位置处包括一个改变,其中在对应于位置197、198和200的一个或多个位置处的改变是一个取代并且在对应于位置199的位置处的改变是一个缺失。在另一方面,该片段在对应于SEQ ID NO:30的位置197、198、199及200中的任何位置的三个位置处包括一个改变,其中在对应于位置197、198和200的一个或多个位置处的改变是一个取代并且在对应于位置199的位置处的改变是一个缺失。在另一方面,该片段在对应于位置197、198和200的每个位置处都包括一个取代并且在对应于位置199的位置处包括一个缺失。
在另一方面,在N-末端包括异源催化结构域的片段在对应于SEQ ID NO:30的位置197的位置处包括取代或由其组成。在另一方面,在对应于位置197的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val取代,优选被Ala取代。在另一方面,该片段包括SEQ ID NO:30的取代N197A或由其组成。
在另一方面,在N-末端包括异源催化结构域的片段在对应于SEQ ID NO:30的位置198的位置处包括取代或由其组成。在另一方面,在对应于位置198的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val取代,优选被Ala取代。在另一方面,该片段包括SEQ ID NO:30的取代N198A或由其组成。
在另一方面,在N-末端包括异源催化结构域的片段在对应于SEQ ID NO:30的位置199的位置处包括缺失或由其组成。在另一方面,在对应于位置199的位置处的氨基酸是Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val,优选是Ala。在另一方面,该变体包括SEQ ID NO:30的缺失A199*或由其组成。
在另一方面,在N-末端包括异源催化结构域的片段在对应于SEQ ID NO:30的位置200的位置处包括取代或由其组成。在另一方面,在对应于位置200的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val取代,优选被Ala、Gly或Trp取代。在另一方面,该片段包括SEQ ID NO:30的成熟多肽的取代N200A,G,W或由其组成。
在另一方面,在N-末端包括异源催化结构域的片段包括在对应于SEQ ID NO:30的位置197和198的位置处的改变或由其组成,如以上所述的那些。
在另一方面,在N-末端包括异源催化结构域的片段包括在对应于SEQ ID NO:30的位置197和199的位置处的改变或由其组成,如以上所述的那些。
在另一方面,在N-末端包括异源催化结构域的片段包括在对应于SEQ ID NO:30的位置197和200的位置处的改变或由其组成,如以上所述的那些。
在另一方面,在N-末端包括异源催化结构域的片段包括在对应于SEQ ID NO:30的位置198和199的位置处的改变或由其组成,如以上所述的那些。
在另一方面,在N-末端包括异源催化结构域的片段包括在对应于SEQ ID NO:30的位置198和200的位置处的改变或由其组成,如以上所述的那些。
在另一方面,在N-末端包括异源催化结构域的片段包括在对应于SEQ ID NO:30的位置199和200的位置处的改变或由其组成,如以上所述的那些。
在另一方面,在N-末端包括异源催化结构域的片段包括在对应于SEQ ID NO:30的位置197、198和199的位置处的改变或由其组成,如以上所述的那些。
在另一方面,在N-末端包括异源催化结构域的片段包括在对应于SEQ ID NO:30的位置197、198和200的位置处的改变或由其组成,如以上所述的那些。
在另一方面,在N-末端包括异源催化结构域的片段包括在对应于SEQ ID NO:30的位置197、199和200的位置处的改变或由其组成,如以上所述的那些。
在另一方面,在N-末端包括异源催化结构域的片段包括在对应于SEQ ID NO:30的位置198、199和200的位置处的改变或由其组成,如以上所述的那些。
在另一方面,在N-末端包括异源催化结构域的片段包括在对应于SEQ ID NO:30的位置197、198、199和200的位置处的改变或由其组成,如以上所述的那些。
在另一方面,在N-末端包括异源催化结构域的片段包括选自下组的一个或多个改变或由其组成,该组有由以下各项组成:N197A、N198A、A199*、和N200A,G,W。
在另一方面,在N-末端包括异源催化结构域的片段包括SEQ ID NO:30的改变N197A+N198A或由其组成。
在另一方面,在N-末端包括异源催化结构域的片段包括SEQ ID NO:30的改变N197A+A199*或由其组成。
在另一方面,在N-末端包括异源催化结构域的片段包括SEQ ID NO:30的改变N197A+N200A,G,W或由其组成。
在另一方面,在N-末端包括异源催化结构域的片段包括SEQ ID NO:30的改变N198A+A199*或由其组成。
在另一方面,在N-末端包括异源催化结构域的片段包括SEQ ID NO:30的改变N198A+N200A,G,W或由其组成。
在另一方面,在N-末端包括异源催化结构域的片段包括SEQ ID NO:30的改变A199*+N200A,G,W或由其组成。
在另一方面,在N-末端包括异源催化结构域的片段包括SEQ ID NO:30的改变N197A+N198A+A199*或由其组成。
在另一方面,在N-末端包括异源催化结构域的片段包括SEQ ID NO:30的改变N197A+N198A+N200A,G,W或由其组成。
在另一方面,在N-末端包括异源催化结构域的片段包括SEQ ID NO:30的改变N197A+A199*+N200A,G,W或由其组成。
在另一方面,在N-末端包括异源催化结构域的片段包括SEQ ID NO:30的改变N198A+A199*+N200A,G,W或由其组成。
在另一方面,在N-末端包括异源催化结构域的片段包括SEQ ID NO:30的改变N197A+N198A+A199*+N200A,G,W或由其组成。
这些杂合多肽的碳水化合物结合模块变体可以是上文所述的任何合适的碳水化合物结合模块变体。
在一方面,该杂合多肽的碳水化合物结合模块变体与亲本碳水化合物结合模块的氨基酸序列具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但小于100%序列一致性。
在另一方面,该杂合多肽的碳水化合物结合模块变体与SEQ ID NO:4、SEQ ID NO:8、SEQ ID NO:12、SEQ ID NO:16、SEQ ID NO:20、SEQ ID NO:24或SEQ ID NO:28的多肽具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%,如至少96%、至少97%、至少98%、或至少99%,但小于100%序列一致性。
在一方面,该杂合多肽的碳水化合物结合模块变体中的取代数目是1-4个,如1、2、3、或4个取代。
在一方面,该杂合多肽的碳水化合物结合模块变体在对应于SEQ ID NO:4的位置5的位置处包括取代或由其组成。在一个实施例中,在对应于位置5的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val,如被Tyr、Phe或Trp取代。在另一个实施例中,在对应于SEQ ID NO:4的位置5的位置处的氨基酸被Trp取代。在另一个实施例中,在对应于SEQ ID NO:4的位置5的位置处的氨基酸是被Trp取代的Tyr(例如SEQ ID NO:4的Y5W)。
在另一方面,该杂合多肽的碳水化合物结合模块变体在对应于SEQ ID NO:4的位置13的位置处包括取代或由其组成。在一个实施例中,在对应于位置13的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val,如被Tyr、Phe或Trp取代。在另一个实施例中,在对应于SEQ ID NO:4的位置13的位置处的氨基酸被Trp取代。在另一个实施例中,在对应于SEQ ID NO:4的位置13的位置处的氨基酸是被Trp取代的Tyr(例如SEQ ID NO:4的Y13W)。
在另一方面,该杂合多肽的碳水化合物结合模块变体在对应于SEQ ID NO:4的位置31的位置处包括取代或由其组成。在一个实施例中,在对应于位置31的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val,如被Tyr、Phe或Trp取代。在另一个实施例中,在对应于SEQ ID NO:4的位置31的位置处的氨基酸被Trp取代。在另一个实施例中,在对应于SEQ ID NO:4的位置31的位置处的氨基酸是被Trp取代的Tyr(例如SEQ ID NO:4的Y31W)。
在另一方面,该杂合多肽的碳水化合物结合模块变体在对应于SEQ ID NO:4的位置32的位置处包括取代或由其组成。在一个实施例中,在对应于位置32的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val,如被Tyr、Phe或Trp取代。在另一个实施例中,在对应于SEQ ID NO:4的位置32的位置处的氨基酸被Trp取代。在另一个实施例中,在对应于SEQ ID NO:4的位置32的位置处的氨基酸是被Trp取代的Tyr(例如SEQ ID NO:4的Y5W)。
在另一方面,该杂合多肽的碳水化合物结合模块变体包括在对应于SEQ ID NO:4的位置5、13、31和32的两个位置处的取代或由其组成,如以上所述的那些。在一个实施例中,该碳水化合物结合模块变体包括在对应于位置5和13的位置处的取代或由其组成(例如,在对应于位置5和13的位置处被Trp取代,如Y5W和/或Y13W)。在另一个实施例中,该碳水化合物结合模块变体包括在对应于位置5和31的位置处的取代或由其组成(例如,在对应于位置5和31的位置处被Trp取代,如Y5W和/或Y31W)。在另一个实施例中,该碳水化合物结合模块变体包括在对应于位置5和32的位置处的取代或由其组成(例如,在对应于位置5和32的位置处被Trp取代,如Y5W和/或Y32W)。在另一个实施例中,该碳水化合物结合模块变体包括在对应于位置13和31的位置处的取代或由其组成(例如,在对应于位置13和31的位置处被Trp取代,如Y13W和/或Y31W)。在另一个实施例中,该碳水化合物结合模块变体包括在对应于位置13和32的位置处的取代或由其组成(例如,在对应于位置13和32的位置处被Trp取代,如Y13W和/或Y32W)。在另一个实施例中,该碳水化合物结合模块变体包括在对应于位置31和32的位置处的取代或由其组成(例如,在对应于位置31和32的位置处被Trp取代,如Y31W和/或Y32W)。
在另一方面,该杂合多肽的碳水化合物结合模块变体包括在对应于SEQ ID NO:4的位置5、13、31和32的三个位置处的取代或由其组成,如以上所述的那些。在一个实施例中,该碳水化合物结合模块变体包括在对应于位置5、13和31的位置处的取代或由其组成(例如,在对应于位置5、13和31的位置处被Trp取代,如Y5W、Y13W和/或Y31W)。在另一个实施例中,该碳水化合物结合模块变体包括在对应于位置5、13和32的位置处的取代或由其组成(例如,在对应于位置5、13和32的位置处被Trp取代,如Y5W、Y13W和/或Y32W)。在另一个实施例中,该碳水化合物结合模块变体包括在对应于位置5、31和32的位置处的取代或由其组成(例如,在对应于位置5、31和32的位置处被Trp取代,如Y5W、Y31W和/或Y32W)。在另一个实施例中,该碳水化合物结合模块变体包括在对应于位置13、31和32的位置处的取代或由其组成(例如,在对应于位置13、31和32的位置处被Trp取代,如Y13W、Y31W和/或Y32W)。
在另一方面,该杂合多肽的碳水化合物结合模块变体包括在对应于SEQ ID NO:4的位置5、13、31和32的所有四个位置处的取代或由其组成,如以上所述的那些。在一个实施例中,该碳水化合物结合模块变体包括在对应于位置5、13、31和32的一个或多个位置处的Trp取代或由其组成,如Y5W、Y13W、Y31W和/或Y32W。
该杂合多肽的碳水化合物结合模块变体可以进一步包括在一个或多个(例如,若干个)其他位置处的取代、缺失和/或插入,如在对应于WO 2012/135719中所披露的位置的位置处的一个或多个(例如,若干个)取代,将该文献通过引用结合在此。例如,在一方面,该杂合多肽的碳水化合物结合模块变体进一步包括在对应于SEQ ID NO:4的位置4、6和29的一个或多个(例如,若干个)位置处的取代。在另一方面,该杂合多肽的碳水化合物结合模块变体进一步包括在对应于位置4、6和29中的任一个的两个位置处的取代。在另一方面,该杂合多肽的碳水化合物结合模块变体进一步包括在对应于位置4、6和29的每个位置处的取代。
在另一方面,该杂合多肽的碳水化合物结合模块变体包括在对应于位置4的位置处的取代或由其组成。在另一方面,在对应于位置4的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val取代,优选被Glu、Leu、Lys、Phe或Trp取代。在另一方面,该杂合多肽的碳水化合物结合模块变体包括SEQID NO:4的取代H4L或由其组成。在另一方面,该杂合多肽的碳水化合物结合模块变体包括SEQ ID NO:4的取代H4K或由其组成。在另一方面,该杂合多肽的碳水化合物结合模块变体包括SEQ ID NO:4的取代H4E或由其组成。在另一方面,该杂合多肽的碳水化合物结合模块变体包括SEQ ID NO:4的取代H4F或由其组成。在另一方面,该杂合多肽的碳水化合物结合模块变体包括SEQ ID NO:4的取代H4W或由其组成。
在另一方面,该杂合多肽的碳水化合物结合模块变体包括在对应于位置6的位置处的取代或由其组成。在另一方面,在对应于位置6的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr或Val取代,优选被Ala取代。在另一方面,该杂合多肽的碳水化合物结合模块变体包括SEQ ID NO:4的取代G6A或由其组成。
在另一方面,该杂合多肽的碳水化合物结合模块变体包括在对应于位置29的位置处的取代或由其组成。在另一方面,在对应于位置29的位置处的氨基酸被Ala、Arg、Asn、Asp、Cys、Gln、Glu、Gly、His、Ile、Leu、Lys、Met、Phe、Pro、Ser、Thr、Trp、Tyr、或Val取代,优选被Asp取代。在另一方面,该杂合多肽的碳水化合物结合模块变体包括SEQ ID NO:4的取代N29D或由其组成。
在另一方面,该杂合多肽的碳水化合物结合模块变体进一步包括在对应于位置4和6的位置处的取代或由其组成,如以上所述的那些。
在另一方面,该杂合多肽的碳水化合物结合模块变体进一步包括在对应于位置4和29的位置处的取代或由其组成,如以上所述的那些。
在另一方面,该杂合多肽的碳水化合物结合模块变体进一步包括在对应于位置6和29的位置处的取代或由其组成,如以上所述的那些。
在另一方面,该杂合多肽的碳水化合物结合模块变体进一步包括在对应于位置4、6和29的位置处的取代或由其组成,如以上所述的那些。
在另一方面,该杂合多肽的碳水化合物结合模块变体进一步包括以下项或由以下项组成:选自下组的一个或多个(例如,若干个)取代,该组由以下项组成:H4L,K,E,F,W、G6A、和N29D;或选自下组的一个或多个(例如,若干个)取代,该组由以下项组成:对应于在此所述的其他纤维素结合模块中的SEQ ID NO:4的H4L,K,E,F,W,G6A、和N29D。
在另一方面,该杂合多肽的碳水化合物结合模块变体包括SEQ ID NO:4的取代H4L+G6A或由其组成。
在另一方面,该杂合多肽的碳水化合物结合模块变体包括SEQ ID NO:4的取代H4K+G6A或由其组成。
在另一方面,该杂合多肽的碳水化合物结合模块变体包括SEQ ID NO:4的取代H4E+G6A或由其组成。
在另一方面,该杂合多肽的碳水化合物结合模块变体包括SEQ ID NO:4的取代H4F+G6A或由其组成。
在另一方面,该杂合多肽的碳水化合物结合模块变体包括SEQ ID NO:4的取代H4W+G6A或由其组成。
在另一方面,该杂合多肽的碳水化合物结合模块变体包括SEQ ID NO:4的取代H4L+N29D或由其组成。
在另一方面,该杂合多肽的碳水化合物结合模块变体包括SEQ ID NO:4的取代H4K+N29D或由其组成。
在另一方面,该杂合多肽的碳水化合物结合模块变体包括SEQ ID NO:4的取代H4E+N29D或由其组成。
在另一方面,该杂合多肽的碳水化合物结合模块变体包括SEQ ID NO:4的取代H4F+N29D或由其组成。
在另一方面,该杂合多肽的碳水化合物结合模块变体包括SEQ ID NO:4的取代H4W+N29D或由其组成。
在另一方面,该杂合多肽的碳水化合物结合模块变体包括SEQ ID NO:4的取代G6A+N29D或由其组成。
在另一方面,该杂合多肽的碳水化合物结合模块变体包括SEQ ID NO:4的取代H4L+G6A+N29D或由其组成。
在另一方面,该杂合多肽的碳水化合物结合模块变体包括SEQ ID NO:4的取代H4K+G6A+N29D或由其组成。
在另一方面,该杂合多肽的碳水化合物结合模块变体包括SEQ ID NO:4的取代H4E+G6A+N29D或由其组成。
在另一方面,该杂合多肽的碳水化合物结合模块变体包括SEQ ID NO:4的取代H4F+G6A+N29D或由其组成。
在另一方面,该杂合多肽的碳水化合物结合模块变体包括SEQ ID NO:4的取代H4W+G6A+N29D或由其组成。
在一些实施例中,该杂合多肽包括SEQ ID NO:61或由其组成。在其他实施例中,该杂合多肽由SEQ ID NO:60的编码序列编码。
在其他实施例中,该杂合多肽包括SEQ ID NO:63或由其组成。在其他实施例中,该杂合多肽由SEQ ID NO:62的编码序列编码。
在其他实施例中,该杂合多肽包括SEQ ID NO:73或由其组成。在其他实施例中,该杂合多肽由SEQ ID NO:72的编码序列编码。
在其他实施例中,该杂合多肽包括SEQ ID NO:94或由其组成。在其他实施例中,该杂合多肽由SEQ ID NO:93的编码序列编码。
可以根据本领域已知的程序,如在此所述的来鉴定亲本中的必需氨基酸。
用于产生融合多肽的技术在本领域是已知的,并且包括连接编码多肽的编码序列,这样使得它们在框内并且融合多肽的表达处于相同的一个或多个启动子和终止子的控制下。融合多肽还可以使用内含肽技术来构建,其中融合多肽在翻译后产生(库珀(Cooper)等人,1993,欧洲分子生物学学会杂志(EMBO J.)12:2575-2583;道森(Dawson)等人,1994,科学(Science)266:776-779)。
多核苷酸
本发明还涉及编码本发明的碳水化合物结合模块变体、纤维二糖水解酶变体和杂合多肽的分离的多核苷酸。
核酸构建体
本发明还涉及包含编码本发明的碳水化合物结合模块变体、纤维二糖水解酶变体和杂合多肽的、可操作地连接至一个或多个控制序列上的一种多核苷酸的核酸构建体,该一个或多个控制序列在与控制序列相容的条件下指导编码序列在一种适合的宿主细胞中的表达。
可以按多种方式操纵该多核苷酸以提供变体的表达。取决于表达载体,在其插入载体以前操纵多核苷酸可以是希望的或必需的。用于利用重组DNA方法修饰多核苷酸的技术是本领域熟知的。
该控制序列可以是启动子,即,被宿主细胞识别以对编码本发明的多肽的多核苷酸进行表达的多核苷酸。启动子包含介导多肽表达的转录控制序列。启动子可以是在宿主细胞中显示转录活性的任何多核苷酸,包括突变、截短和杂合启动子,并且可以从编码与宿主细胞同源或异源的胞外或胞内多肽的基因中获得。
用于在细菌宿主细胞中指导本发明的核酸构建体的转录的适合启动子的实例是从以下基因中获得的启动子:解淀粉芽孢杆菌α-淀粉酶基因(amyQ)、地衣芽孢杆菌α-淀粉酶基因(amyL)、地衣芽孢杆菌青霉素酶基因(penP)、嗜热脂肪芽孢杆菌产麦芽糖淀粉酶基因(amyM)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、枯草芽孢杆菌xylA和xylB基因、苏云金芽孢杆菌cryIIIA基因(阿盖塞(Agaisse)和勒尔克吕(Lereclus),1994,分子微生物学(Molecular Microbiology)13:97-107)、大肠杆菌lac操纵子、大肠杆菌trc启动子(埃贡(Egon)等人,1988,基因(Gene)69:301-315)、天蓝链霉菌琼脂水解酶基因(dagA)、以及原核β-内酰胺酶基因(维拉-卡马洛夫(Villa-Kamaroff)等人,1978,美国国家科学院院刊(Proc.Natl.Acad.Sci.USA)75:3727-3731)以及tac启动子(德波尔(DeBoer)等人,1983,美国国家科学院院刊80:21-25)。其他启动子描述在吉尔伯特(Gilbert)等人,1980,科学美国人(Scientific American)242:74-94的“来自重组细菌的有用蛋白质(Useful proteinsfrom recombinant bacteria)”;以及在萨姆布鲁克(Sambrook)等人,1989,同上。串联启动子的实例披露在WO 99/43835中。
在丝状真菌宿主细胞中,用于指导本发明的核酸构建体的转录的合适启动子的实例是获得自以下各项的基因的启动子:构巢曲霉乙酰胺酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉葡萄糖淀粉酶(glaA)、米曲霉TAKA淀粉酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、尖镰孢胰蛋白酶-样蛋白酶(WO 96/00787)、镶片镰孢菌淀粉葡糖苷酶(WO 00/56900)、镶片镰孢菌Daria(达莉亚)(WO 00/56900)、镶片镰孢菌Quinn(奎恩)(WO 00/56900)、米黑根毛霉脂肪酶、米黑根毛霉天冬氨酸蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶,以及里氏木霉翻译延伸因子,连同NA2-tpi启动子(来自编码中性α-淀粉酶的曲霉属基因的修饰的启动子,其中已经用来自编码丙糖磷酸异构酶的曲霉属基因的未翻译的前导子替换未翻译的前导子;非限制性实例包括来自编码中性α-淀粉酶的黑曲霉基因的修饰的启动子,其中已经用来自编码丙糖磷酸异构酶的构巢曲霉或米曲霉基因的未翻译的前导子替换未翻译的前导子);及其突变型、截短型及杂合型启动子。其他启动子在美国专利号6,011,147中描述。
在酵母宿主中,从针对以下各项的基因获得有用的启动子:酿酒酵母烯醇酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母乙醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH1,ADH2/GAP)、酿酒酵母磷酸丙糖异构酶(TPI)、酿酒酵母金属硫蛋白(CUP1)、和酿酒酵母3-磷酸甘油酸激酶。在罗马诺斯(Romanos)等人,1992,酵母(Yeast)8:423-488中描述了酵母宿主细胞的其他有用启动子。
控制序列也可以是由宿主细胞识别以终止转录的转录终止子。该终止子可操作地连接至编码该变体的多核苷酸的3'-末端。在该宿主细胞中起作用的任何终止子都可以用于本发明中。
用于细菌宿主细胞的优选终止子是从克劳氏芽孢杆菌碱性蛋白酶(aprH)、地衣芽孢杆菌α-淀粉酶(amyL)以及大肠杆菌核糖体RNA(rrnB)的基因获得。
用于丝状真菌宿主细胞的优选终止子是从以下各项的基因获得:构巢曲霉乙酰胺酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶、尖镰孢胰蛋白酶样蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶、以及里氏木霉翻译延长因子。
酵母宿主细胞的优选终止子从针对以下各项的基因获得:酿酒酵母烯醇化酶、酿酒酵母细胞色素C(CYC1)和酿酒酵母甘油醛-3-磷酸脱氢酶。在罗马诺斯(Romanos)等人,1992,上文中描述了酵母宿主细胞的其他有用终止子。
控制序列还可以是启动子下游和基因的编码序列上游的mRNA稳定子区,其增加该基因的表达。
适合的mRNA稳定子区的实例是从以下获得的:苏云金杆菌cryIIIA基因(WO 94/25612)和枯草芽孢杆菌SP82基因(化(Hue)等人,1995,细菌学杂志(Journal ofBacteriology)177:3465-3471)。
该控制序列还可以是前导子,一种对宿主细胞翻译很重要的非翻译mRNA区域。该前导序列可操作地连接至编码该变体的多核苷酸的5'-末端。可以使用在宿主细胞中有功能的任何前导子。
用于丝状真菌宿主细胞的优选前导子是从米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶的基因获得。
适用于酵母宿主细胞的前导子从以下各项的基因获得:酿酒酵母烯醇酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α因子、以及酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。
该控制序列还可以是多腺苷酸化序列,即被可操作地连接至该变体编码多核苷酸的3’-末端并且当转录时由宿主细胞识别成将多腺苷酸残基添加到所转录的mRNA上的信号的序列。可以使用在宿主细胞中有功能的任何多聚腺苷酸化序列。
丝状真菌宿主细胞的优选多聚腺苷酸化从针对以下各项的基因获得:构巢曲霉邻氨基苯甲酸酯合酶、黑曲霉葡糖淀粉酶、黑曲霉醹-葡糖苷酶、米曲霉TAKA淀粉酶和尖孢镰刀菌胰蛋白酶样蛋白酶。
有用于酵母宿主细胞的多腺苷酸化序列在郭(Guo)和谢尔曼(Sherman),1995,分子细胞生物学(Mol.Cellular Biol.)15:5983-5990中描述。
该控制序列还可以是信号肽编码区,编码与变体的N-端连接的信号肽,并且引导该变体进入细胞的分泌通路。该多核苷酸的编码序列的5’-端可以固有地包含信号肽编码序列,该信号肽编码序列在翻译阅读框中与编码该变体的编码序列的区段天然地连接在一起。可替代地,编码序列5’-端可以包括对于该编码序列是外源的信号肽编码序列。在编码序列不天然地包含信号肽编码序列的情况下,可能需要外源信号肽编码序列。可替代地,外源信号肽编码序列可以简单地置换天然信号肽编码序列,以便增强变体的分泌。然而,可以使用指导表达的变体进入宿主细胞的分泌通路的任何信号肽编码序列。
用于细菌宿主细胞的有效信号肽编码序列是从以下各项的基因获得的信号肽编码序列:芽孢杆菌属NCIB 11837产麦芽糖淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌α-淀粉酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT、nprS、nprM)以及枯草芽孢杆菌prsA。西蒙纳(Simonen)和帕尔瓦(Palva),1993,微生物学评论(Microbiological Reviews)57:109-137描述了另外的信号肽。
用于丝状真菌宿主细胞的有效信号肽编码序列是获得自以下各项的基因的信号肽编码序列:黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶V、柔毛腐质霉脂肪酶以及米黑毛霉天冬氨酸蛋白酶。
从酿酒酵母醹-因子和酿酒酵母转化酶的基因获得用于酵母宿主细胞的有用信号肽。其他的有用的信号肽编码序列由罗曼诺斯(Romanos)等人(1992,上文)描述。
该控制序列还可以是编码位于变体的N-末端处的前肽的前肽编码序列。生成的多肽被称为前体酶(proenzyme)或多肽原(或在一些情况下被称为酶原(zymogen))。多肽原通常是无活性的并且可以通过催化切割或自身催化切割来自多肽原的前肽而转化为活性多肽。前肽编码序列可以从以下各项的基因获得:枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、嗜热毁丝霉漆酶(WO 95/33836)、米黑根毛霉天冬氨酸蛋白酶、以及酿酒酵母α-因子。
在信号肽和前肽序列两者都在的情况下,将前肽序列紧邻变体的N-末端定位并且将信号肽序列紧邻前肽序列的N-末端定位。
还令人希望的可以是添加相对于宿主细胞的生长来调节该变体的表达的调节序列。调节序列的实例是使得基因的表达响应于化学或物理刺激(包括调控化合物的存在)而开启或关闭的那些序列。原核系统中的调控序列包括lac、tac以及trp操纵子系统。在酵母中,可以使用ADH2系统或GAL1系统。在丝状真菌中,可以使用黑曲霉葡糖淀粉酶启动子、米曲霉TAKAα-淀粉酶启动子和米曲霉葡糖淀粉酶启动子、里氏木霉纤维二糖水解酶I启动子以及里氏木霉纤维二糖水解酶II启动子。调节序列的其他实例是那些允许基因扩增的序列。在真核系统中,这些调控序列包括在甲氨蝶呤存在下被扩增的二氢叶酸还原酶基因以及用重金属扩增的金属硫蛋白基因。在这些情况下,编码该变体的多核苷酸将可操作地连接至该调节序列。
表达载体
本发明还涉及包含编码本发明的碳水化合物结合模块变体、纤维二糖水解酶变体、或杂合多肽的多核苷酸与启动子、以及转录和翻译终止信号一起的重组表达载体。各种核苷酸和控制序列可以连接在一起以产生重组表达载体,所述重组表达载体可以包含一个或多个合宜的限制性位点以允许在这样的位点插入或取代编码该变体序列的多核苷酸。可替代地,可以通过将多核苷酸或包含该多核苷酸的核酸构建体插入用于表达的适当载体中而表达该多核苷酸。在产生该表达载体时,该编码序列位于该载体中,这样使得该编码序列与该供表达的适当控制序列可操作地连接。
重组表达载体可以是可便利地经受重组DNA程序并且可引起多核苷酸表达的任何载体(例如,质粒或病毒)。载体的选择将典型地取决于该载体与有待引入该载体的宿主细胞的相容性。该载体可以是一种线性的或闭合的环状质粒。
载体可以是自主复制载体,即,作为染色体外实体存在的载体,其复制独立于染色体复制,例如,质粒、染色体外元件、微染色体或人工染色体。该载体可包含任何用以保证自我复制的要素。可替代地,该载体可以是这样载体,当它被引入该宿主细胞中时,被整合到基因组中并且与其中已整合了它的一个或多个染色体一起复制。此外,可以使用单一载体或质粒或两个或更多个载体或质粒(这些载体或质粒共同包含待引入到宿主细胞的基因组中的总DNA)或转座子。
该载体优选包含一个或多个允许方便地选择转化细胞、转染细胞、转导细胞等细胞的选择性标记。选择性标记是这样一种基因,该基因的产物提供了杀生物剂抗性或病毒抗性、重金属抗性、营养缺陷型的原养型等。
细菌性选择性标记的实例是地衣芽孢杆菌或枯草芽孢杆菌dal基因,或赋予抗生素抗性(如氨比西林、氯霉素、卡那霉素、新霉素、大观霉素或四环素抗性)的标记。用于酵母宿主细胞的适合的标记包括但不局限于ADE2、HIS3、LEU2、LYS2、MET3、TRP1、以及URA3。用于在丝状真菌宿主细胞中使用的选择性标记包括但不限于,adeA(磷酸核糖酰氨基咪唑-琥珀羧胺合酶)、adeB(磷酸核糖酰-氨基咪唑合酶)、amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草丁膦乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清酸核苷-5'-磷酸脱羧酶)、sC(硫酸腺苷基转移酶)、以及trpC(邻氨基苯甲酸合酶)、连同其等效物。优选地用于曲霉细胞中的是构巢曲霉或米曲霉amdS和pyrG基因以及吸水链霉菌bar基因。在木霉属细胞中优选使用的是adeA、adeB、amdS、hph以及pyrG基因。
选择性标记可以是如在WO 2010/039889中描述的双选择性标记系统。在一方面,双选择性标记是hph-tk双选择性标记系统。
载体优选包含允许载体整合到宿主细胞的基因组中或载体在细胞中独立于基因组自主复制的一个或多个元件。
对于整合到该宿主细胞基因组中,该载体可以依靠编码该变体的多核苷酸序列或者用于通过同源或非同源重组整合到该基因组中的该载体的任何其他元件。可替代地,该载体可以包含用于指导通过同源重组而整合到宿主细胞基因组中的一个或多个染色体中的一个或多个精确位置的另外的多核苷酸。为了增加在精确位置整合的可能性,这些整合元件应包含足够数量的核酸,例如100至10,000个碱基对、400至10,000个碱基对、以及800至10,000个碱基对,这些碱基对与对应的靶序列具有高度的序列一致性以提高同源重组的可能性。这些整合元件可以是与宿主细胞的基因组内的靶序列同源的任何序列。此外,这些整合元件可以是非编码多核苷酸或编码多核苷酸。在另一方面,该载体可以通过非同源重组整合到宿主细胞的基因组中。
对于自主复制,该载体可以进一步包括使该载体能够在所讨论的宿主细胞中自主复制的复制起点。复制起点可以是在细胞中起作用的介导自主复制的任何质粒复制子。术语“复制起点(origin of replication)”或“质粒复制子(plasmid replicator)”意指使得质粒或载体可在体内复制的多核苷酸。
细菌复制起点的实例是允许在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177、以及pACYC184的复制起点,以及允许在芽孢杆菌属中复制的质粒pUB110、pE194、pTA1060、以及pAMβ1的复制起点。
用于酵母宿主细胞中的复制起点的实例是2微米复制起点、ARS1、ARS4、ARS1和CEN3的组合、以及ARS4和CEN6的组合。
在丝状真菌细胞中有用的复制起点的实例是AMA1和ANS1(格姆斯(Gems)等人,1991,基因(Gene)98:61-67;卡伦(Cullen)等人,1987,核酸研究(Nucleic Acids Res.)15:9163-9175;WO 00/24883)。AMA1基因的分离和包括该基因的质粒或载体的构建可以根据披露于WO 00/24883中的方法完成。
可以将多于一个拷贝的本发明的多核苷酸插入宿主细胞以增加变体的产生。通过将序列的至少一个另外的拷贝整合到宿主细胞基因组中或通过包括一个与该多核苷酸一起的可扩增的选择性标记基因可以获得多核苷酸的增加的拷贝数目,其中通过在适当的选择性试剂的存在下培养细胞可以选择包含选择性标记基因的经扩增的拷贝的细胞、以及由此该多核苷酸的另外的拷贝。
用于连接以上所述的元件以构建本发明的重组表达载体的程序是本领域的普通技术人员熟知的(参见,例如,萨姆布鲁克(Sambrook)等人,1989,同上)。
宿主细胞
本发明还涉及重组宿主细胞,这些重组宿主细胞包含编码本发明的碳水化合物结合模块变体、纤维二糖水解酶变体或杂合多肽的、可操作地连接至一个或多个控制序列的一种多核苷酸,该一个或多个控制序列指导该所希望的变体多肽的产生。将包括多核苷酸的构建体或载体引入宿主细胞中,这样使得该构建体或载体被维持作为染色体整合体或作为自主复制的染色体外载体,如早前所述。术语“宿主细胞”涵盖由于复制过程中发生的突变与亲本细胞不同的亲本细胞的任何后代。宿主细胞的选择在很大程度上将取决于编码该变体的基因及其来源。
宿主细胞可以是在重组产生变体中有用的任何细胞,例如原核细胞或真核细胞。
原核宿主细胞可以是任何革兰氏阳性或革兰氏阴性细菌。革兰氏阳性细菌包括但不限于:芽孢杆菌属、梭菌属、肠球菌属、土芽孢杆菌属、乳杆菌属、乳球菌属、海洋芽孢杆菌属、葡萄球菌属、链球菌属、以及链霉菌属。革兰氏阴性细菌包括但不限于:弯曲杆菌属、大肠杆菌、黄杆菌菌、梭杆菌菌、螺杆菌属、泥杆菌属、奈瑟氏菌属、假单胞菌属、沙门氏菌属、以及脲原体属。
细菌宿主细胞可以是任何芽孢杆菌属细胞,包括但不限于:嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚硬芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌以及苏云金芽孢杆菌细胞。
细菌宿主细胞还可以是任何链球菌属细胞,包括但不限于:似马链球菌、酿脓链球菌、乳房链球菌以及马链球菌兽瘟亚种细胞。
细菌宿主细胞还可以是任何链霉菌属细胞,包括但不限于:不产色链霉菌、除虫链霉菌、天蓝链霉菌、灰色链霉菌、以及浅青紫链霉菌细胞。
将DNA引入芽孢杆菌属细胞中可通过以下来实现:原生质体转化(参见例如,张(Chang)和科恩(Cohen),1979,分子遗传学与基因组学(Mol.Gen.Genet.)168:111-115)、感受态细胞转化(参见,例如,杨格(Young)和斯皮宰曾(Spizizen),1961,细菌学杂志(J.Bacteriol.)81:823-829;或杜拜努(Dubnau)以及大卫杜夫-阿贝尔森(Davidoff-Abelson),1971,分子生物学杂志(J.Mol.Biol.)56:209-221)、电穿孔(参见,例如,茂川(Shigekawa)和道尔(Dower),1988,生物技术(Biotechniques)6:742-751)、或者接合(参见,例如克勒(Koehler)和索恩(Thorne),1987,细菌学杂志169:5271-5278)。将DNA引入大肠杆菌细胞中可通过以下来实现:原生质体转化(参见,例如,哈纳汗(Hanahan),1983,分子生物学杂志(J.Mol.Biol.)166:557-580)或电穿孔(参见,例如,道尔(Dower)等人,1988,核酸研究(Nucleic Acids Res.)16:6127-6145)。将DNA引入链霉菌属细胞中可通过以下来实现:原生质体转化、电穿孔(参见例如,贡(Gong)等人,2004,叶线形微生物学(FoliaMicrobiol.)(Praha(布拉格))49:399-405)、接合(参见例如,马佐迪耶(Mazodier)等人,1989,细菌学杂志(J.Bacteriol.)171:3583-3585)、或转导(参见例如,伯克(Burke)等人,2001,美国科学院院刊(Proc.Natl.Acad.Sci.USA)98:6289-6294)。将DNA引入假单孢菌属细胞中可通过以下来实现:电穿孔(参见例如,蔡(Choi)等人,2006,微生物学方法杂志(J.Microbiol.Methods)64:391-397)或接合(参见例如,皮内多(Pinedo)和斯梅茨(Smets),2005,应用与环境微生物学(Appl.Environ.Microbiol.)71:51-57)。将DNA引入链球菌属细胞中可通过以下来实现:天然感受态(参见,例如,佩里(Perry)和藏满(Kuramitsu),1981,感染与免疫(Infect.Immun.)32:1295-1297)、原生质体转化(参见,例如,凯特(Catt)和乔力克(Jollick),1991,微生物学(Microbios)68:189-207)、电穿孔(参见,例如,巴克利(Buckley)等人,1999,应用与环境微生物学(Appl.Environ.Microbiol.)65:3800-3804)、或者接合(参见,例如,克莱威尔(Clewell),1981,微生物学评论(Microbiol.Rev.)45:409-436)。然而,可以使用本领域已知的将DNA引入宿主细胞的任何方法。
宿主细胞也可以是真核生物,如哺乳动物、昆虫、植物或真菌细胞。
宿主细胞可以是真菌细胞。如在此使用的“真菌”包括子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)和接合菌门(Zygomycota)以及卵菌门(Oomycota)和所有有丝分裂孢子真菌(如霍克斯沃思(Hawksworth)等人定义,引自:安斯沃斯(Ainsworth)和比斯比(Bisby)的真菌大词典(Dictionary of The Fungi),第8版,1995,国际CAB,大学出版社(University Press),剑桥(Cambridge),英国)。
真菌宿主细胞可以是酵母细胞。如在此使用的“酵母”包括产子嚢酵母(内孢霉目)、产担子酵母和属于半知菌类(芽孢纲)的酵母。由于酵母的分类可能在将来变化,为了本发明的目的,酵母应当如酵母的生物学与活性(Biology and Activities of Yeast)(斯金纳(Skinner),帕斯莫尔(Passmore)和达文波特(Davenport)编著,应用细菌学学会专题论文集系列9(Soc.App.Bacteriol.Symposium Series No.9),1980)所描述那样定义。
酵母宿主细胞可以是假丝酵母属细胞、汉逊酵母属细胞、克鲁维酵母属细胞、毕赤酵母属细胞、酵母菌属细胞、裂殖酵母或耶罗维亚酵母属细胞、如乳酸克鲁维酵母细胞、卡氏酵母细胞、酿酒酵母细胞、糖化酵母细胞、道格拉斯酵母(Saccharomyces douglasii)细胞、克鲁弗酵母细胞、诺地酵母细胞、卵形酵母细胞或解脂耶罗维亚酵母细胞。
该真菌宿主细胞可以是丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门(Oomycota)亚类的所有丝状形式(如霍克斯沃思等人,1995,上文定义)。丝状真菌通常的特征在于由几丁质、纤维素、葡聚糖、壳聚糖、甘露聚糖、以及其他复杂多糖构成的菌丝体壁。营养生长是通过菌丝延伸,而碳分解代谢是专性需氧的。相反,酵母(如酿酒酵母)的营养生长是通过单细胞菌体的出芽(budding),而碳分解代谢可以是发酵的。
丝状真菌宿主细胞可以是枝顶孢霉属、曲霉属、短梗霉属、烟管霉属(Bjerkandera)、拟腊菌属、金孢子菌属、鬼伞属、革盖菌属(Coriolus)、隐球菌属、线黑粉菌科(Filibasidium)、镰孢属、腐质霉属、梨孢菌属(Magnaporthe)、毛霉属、毁丝霉属、新美鞭菌属、链孢菌属、拟青霉属、青霉属、平革菌属、射脉菌属(Phlebia)、瘤胃壶菌属、侧耳属(Pleurotus)、裂褶菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属(Trametes)或木霉属细胞。
例如,丝状真菌宿主细胞可以是泡盛曲霉、臭曲霉、烟曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、黑刺烟管菌(Bjerkandera adusta)、干拟蜡菌(Ceriporiopsisaneirina)、卡内基拟蜡菌(Ceriporiopsis caregiea)、浅黄拟蜡孔菌(Ceriporiopsisgilvescens)、潘诺希塔拟蜡菌(Ceriporiopsis pannocinta)、环带拟蜡菌(Ceriporiopsisrivulosa)、微红拟蜡菌(Ceriporiopsis subrufa)、虫拟蜡菌(Ceriporiopsissubvermispora)、狭边金孢子菌(Chrysosporium inops)、嗜角质金孢子菌、卢克诺文思金孢子菌(Chrysosporium lucknowense)、粪状金孢子菌(Chrysosporium merdarium)、租金孢子菌、昆士兰金孢子菌(Chrysosporium queenslandicum)、热带金孢子菌、褐薄金孢子菌(Chrysosporium zonatum)、灰盖鬼伞(Coprinus cinereus)、毛革盖菌(Coriolushirsutus)、杆孢状镰孢、谷类镰孢、库威镰孢、大刀镰孢、禾谷镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢、镶片镰孢、特异腐质霉、柔毛腐质霉、米黑毛霉、嗜热毁丝霉、粗糙链孢菌、产紫青霉、黄孢平革菌(Phanerochaete chrysosporium)、射脉菌(Phlebia radiata)、刺芹侧耳(Pleurotus eryngii)、土生梭孢壳霉、长域毛栓菌(Trametes villosa)、变色栓菌(Trametes versicolor)、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、或绿色木霉细胞。
可以将真菌细胞通过涉及原生质体形成、原生质体转化和细胞壁重建的方法以本身公知的方式转化。用于转化曲霉属和木霉属宿主细胞的适合程序描述在EP 238023;约尔顿(Yelton)等人,1984,美国国家科学院院刊(Proc.Natl.Acad.Sci.USA)81:1470-1474;和克里斯滕森(Christensen)等人,1988,生物技术(Bio/Technology)6:1419-1422中。用于转化镰刀菌属物种的适合方法由马拉迪尔(Malardier)等人,1989,基因(Gene)78:147-156、以及WO 96/00787描述。可以使用由如以下文献描述的程序转化酵母:贝克尔(Becker)和瓜伦特(Guarente),在阿贝尔森(Abelson),J.N.和西蒙(Simon),M.I.编,酵母遗传学与分子生物学指南(Guide to Yeast Genetics and Molecular Biology),酶学方法(Guide toYeast Genetics and Molecular Biology,Methods in Enzymology),第194卷,第182-187页,学术出版社有限公司(Academic Press,Inc.),纽约;伊藤(Ito)等人,1983,细菌学杂志(J.Bacteriol.)153:163;以及亨内恩(Hinnen)等人,1978,美国国家科学院院刊(Proc.Natl.Acad.Sci.USA)75:1920。
产生的方法
本发明还涉及产生在此所述的碳水化合物结合模块变体、纤维二糖水解酶变体、或杂合多肽的方法,这些方法包括:(a)在适于产生碳水化合物结合模块变体、纤维二糖水解酶变体或杂合多肽的条件下培养本发明的重组宿主细胞;并且任选地(b)回收该碳水化合物结合模块变体、纤维二糖水解酶变体或杂合多肽。
这些宿主细胞使用本领域已知的方法在适合于产生变体的营养培养基中进行培养。例如,可以通过在适合的培养基中和在允许有待表达和/或分离在此所述的碳水化合物结合模块变体、纤维二糖水解酶变体、或杂合多肽的条件下,进行摇瓶培养,或者在实验室或工业发酵罐中进行小规模或大规模发酵(包括连续,分批,分批补料,或固态发酵)来培养细胞。该培养是使用本领域中已知的程序,在适合的营养培养基中发生,该培养基包括碳和氮来源及无机盐。合适的培养基可从供应商获得,或可根据已公开组合物制备(例如美国典型培养物保藏中心的目录)。如果该变体被分泌到该营养培养基中,则该变体可直接从该培养基中回收。如果该变体没有分泌,则它可从细胞裂解液中回收。
使用本领域已知的对这些变体特异的方法可以检测该变体。这些检测方法包括但不限于特异性抗体的使用、酶产物的形成或酶底物的消失。例如,可以使用酶测定来确定该变体的活性。
可以使用本领域已知的方法来回收该变体。例如,可以通过多种常规程序从该营养培养基中回收该变体,这些常规程序包括但不局限于收集、离心、过滤、萃取、喷雾干燥、蒸发、或沉淀。
可以通过本领域中已知的多种程序来纯化变体以获得基本上纯的变体,这些程序包括但不限于:色谱法(例如,离子交换色谱、亲和色谱、疏水作用色谱、色谱聚焦及尺寸排阻色谱)、电泳程序(例如,制备型等电点聚焦)、差别溶解度(例如,硫酸铵沉淀)、SDS-PAGE、或萃取(参见,例如,蛋白质纯化(Protein Purification),詹森(Janson)和赖登(Ryden)编辑,VCH出版社(VCH Publishers),纽约,1989)。
在可替代的方面,没有回收该变体,而是将表达该变体的本发明的宿主细胞用作该变体的来源。
发酵液配制品或细胞组合物
本发明还涉及包括本发明的碳水化合物结合模块变体、纤维二糖水解酶变体或杂合多肽的发酵液配制品或细胞组合物。发酵液产物进一步包括在发酵过程中使用的另外的成分,例如像,细胞(包括包含编码本发明的变体的基因的宿主细胞,这些宿主细胞被用于产生感兴趣的变体)、细胞碎片、生物质、发酵介质和/或发酵产物。在一些实施例中,该组合物是包含一种或多种有机酸、杀灭的细胞和/或细胞碎片以及培养基的细胞杀灭的全培养液。
如在此使用的术语“发酵液”是指由细胞发酵产生、不经历或经历最低限的回收和/或纯化的制剂。例如,当微生物培养株在允许蛋白质合成(例如,由宿主细胞的酶表达)并且将蛋白质分泌到细胞培养基中的碳受限的条件下孵育生长到饱和时,产生发酵液。发酵液可以包含在发酵结束时得到的发酵材料的未分级的或分级的内容物。典型地,发酵液是未分级的并且包括用过的培养基以及例如通过离心去除微生物细胞(例如,丝状真菌细胞)之后存在的细胞碎片。在一些实施例中,发酵液包含用过的细胞培养基、胞外酶以及有活力的和/或无活力的微生物细胞。
在一个实施例中,该发酵液配制品和细胞组合物包括第一有机酸组分(包括至少一种1-5碳的有机酸和/或其盐)以及第二有机酸组分(包括至少一种6碳或更多碳的有机酸和/或其盐)。在具体实施例中,该第一有机酸组分是乙酸、甲酸、丙酸、其盐,或前述两种或更多种的混合物;并且该第二有机酸组分是苯甲酸、环己烷羧酸、4-甲基戊酸、苯乙酸、其盐,或前述两种或更多种的混合物。
在一方面,该组合物包含一种或多种有机酸,并且任选地进一步包含杀灭的细胞和/或细胞碎片。在一个实施例中,从细胞杀灭的全培养液中去除这些杀灭的细胞和/或细胞碎片,以提供不含这些组分的组合物。
这些发酵液配制品或细胞组合物可以进一步包括防腐剂和/或抗微生物(例如,抑菌)剂,包括但不限于山梨醇、氯化钠、山梨酸钾、以及本领域中已知的其他试剂。
该细胞杀灭的全培养液或组合物可以包含在发酵结束时得到的发酵材料的未分级的内容物。典型地,该细胞杀灭的全培养液或组合物包含用过的培养基以及在微生物细胞(例如,丝状真菌细胞)生长至饱和、在碳限制条件下孵育以允许蛋白合成之后存在的细胞碎片。在一些实施例中,该细胞杀灭的全培养液或组合物包含用过的细胞培养基、胞外酶和杀灭的丝状真菌细胞。在一些实施例中,可以使用本领域已知的方法来使细胞杀灭的全培养液或组合物中存在的微生物细胞透性化和/或裂解。
如在此描述的全培养液或细胞组合物典型地是液体,但是可以包含不溶性组分,例如杀灭的细胞、细胞碎片、培养基组分和/或一种或多种不溶性酶。在一些实施例中,可以去除不溶性组分以提供澄清的液体组合物。
可以通过描述于WO 90/15861或WO 2010/096673中的方法生产本发明的全培养液配制品和细胞组合物。
酶组合物
本发明还涉及包括本发明的碳水化合物结合模块变体、纤维二糖水解酶变体或杂合多肽的组合物。优选地,这些组合物富含这样的一种多肽。术语“富集”指示该组合物的纤维二糖水解酶活性或纤维素分解酶活性已经增加,例如,富集因子为至少1.1。
该组合物可以包括本发明的碳水化合物结合模块变体、纤维二糖水解酶变体或杂合多肽作为主要酶组分,例如,单组分组合物。可替代地,这些组合物可以包括多种酶活性,如一种或多种(例如,若干种)选自下组的酶,该组由以下各项组成:水解酶、异构酶、连接酶、裂解酶、氧化还原酶、或转移酶,例如,α-半乳糖苷酶、α-葡糖苷酶、氨肽酶、淀粉酶、β-半乳糖苷酶、β-葡糖苷酶、β-木糖苷酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、壳多糖酶、角质酶、环糊精葡萄糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、棒曲霉素、葡糖淀粉酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变聚糖酶、氧化酶、果胶分解酶、过氧化物酶、植酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、膨胀素、转谷氨酰胺酶、或木聚糖酶。
这些组合物可以根据本领域已知的方法制备,并可以是液体或干燥组合物的形式。可以根据本领域中已知的方法稳定这些组合物。
下文中给出本发明的组合物的优选用途的实例。可以基于本领域已知的方法来确定组合物的剂量和使用该组合物的其他条件。
用途
本发明还针对用于使用在此所述的纤维二糖水解酶变体或包括在此所述的碳水化合物结合模块变体和纤维素分解酶的异源催化结构域的杂合多肽连同其组合物的以下方法。
本发明涉及用于降解或转化纤维素材料的方法,该方法包括:在包括本发明的碳水化合物结合模块变体的纤维二糖水解酶变体或纤维素分解酶的存在下,用一种酶组合物处理该纤维素材料。在一个方面,这些方法进一步包括对降解的或转化的纤维素材料进行回收。该纤维素材料的降解或转化的可溶性产物可以使用本领域中已知的方法与不溶性纤维素材料分离,例如像离心、过滤、或重力沉降。
本发明还涉及产生一种发酵产物的方法,这些方法包括:(a)在包括本发明的碳水化合物结合模块变体的纤维二糖水解酶变体或纤维素分解酶的存在下,用一种酶组合物糖化纤维素材料;(b)用一种或多种(例如,若干种)发酵微生物发酵这一糖化的纤维素材料,以产生该发酵产物;并且(c)从该发酵中回收该发酵产物。
本发明还涉及发酵纤维素材料的方法,这些方法包括:用一种或多种(例如,若干种)发酵微生物发酵该纤维素材料,其中在包括本发明的碳水化合物结合模块的纤维二糖水解酶变体或纤维素分解酶的存在下,用一种酶组合物糖化该纤维素材料。在一方面,该纤维素材料的发酵产生发酵产物。在另一方面,该方法进一步包括从发酵回收该发酵产物。
本发明的方法可以用于将纤维素材料糖化为可发酵糖,并且将可发酵糖转化为多种有用的发酵产物,例如燃料、饮用乙醇、和/或平台化合物(例如酸、醇、酮、气体、等)。由该纤维素材料产生所希望的发酵产物典型地涉及预处理、酶水解(糖化)、以及发酵。
根据本发明,可以使用本领域常规的过程来完成纤维素材料的加工。此外,可以使用被配置为根据本发明进行操作的常规生物质加工装置来实施本发明的方法。
分开或同时的水解(糖化)和发酵包括但不限于:分开水解和发酵(SHF)、同时糖化和发酵(SSF)、同时糖化和共发酵(SSCF)、杂合的水解和发酵(HHF)、分开水解和共发酵(SHCF)、杂合的水解和共发酵(HHCF),以及直接微生物转化(DMC),有时还被称为合并的生物加工(CBP)。SHF使用分开的处理步骤,以首先将纤维素材料酶促水解为可发酵糖(例如,葡萄糖、纤维二糖、以及戊糖单体),并且然后将可发酵糖发酵为乙醇。在SSF中,纤维素材料的酶水解和糖发酵成乙醇被组合在一个步骤中(菲利皮迪斯·G.P.(Philippidis,G.P.),1996,纤维素生物转化技术(Cellulose bioconversion technology),生物乙醇手册:生产和利用(Handbook on Bioethanol:Production and Utilization),怀曼·C.E(Wyman,C.E.)编辑,泰勒-弗朗西斯出版集团(Taylor&Francis),华盛顿特区(Washington,DC),179-212))。SSCF涉及多种糖的共发酵(希恩·J.(Sheehan,J.)和希默尔·M.(Himmel,M.),1999,酶、能量与环境:美国能源部研究和开发生物乙醇活性的战略性观点(Enzymes,energy and the environment:A strategic perspective on the U.S.Department ofEnergy’s research and development activities for bioethanol),生物技术进展(Biotechnol.Prog.)15:817-827)。HHF涉及分开的水解步骤并且另外涉及可以在同一反应器中进行的同时的糖化和水解步骤。HHF过程中的步骤可以在不同的温度下进行,即高温酶糖化,接着在发酵菌株能够耐受的更低温度下进行SSF。DMC将全部三个过程(酶产生、水解以及发酵)组合在一个或多个(例如,若干个)步骤中,其中相同生物被用来产生用于将纤维素材料转化成可发酵糖的酶并且将可发酵糖转化成最终产物(林德·L.R.(Lynd,L.R.)、韦默·P.J.(Weimer,P.J.),范泽尔·W.H.(van Zyl,W.H.)、以及普利特瑞斯·I.S.(Pretorius,I.S.),2002,微生物纤维素利用:基础与生物技术(Microbial celluloseutilization:Fundamentals and biotechnology),微生物分子生物学综述(Microbiol.Mol.Biol.Reviews)66:506-577)。在此应理解的是,本领域中已知的包括预处理、酶水解(糖化)、发酵、或其组合的任何方法,可以用于实施本发明的方法。
常规设备可以包括分批补料搅拌反应器、分批搅拌反应器、具有超滤的连续流搅拌反应器、和/或连续活塞流柱式反应器(费尔南达.德.卡斯蒂柳斯.柯瑞芝(Fernanda deCastilhos Corazza)、弗拉维奥.法里亚.德.莫赖斯(Flávio Faria de Moraes)、吉塞拉.玛丽亚.扎宁(Gisella Maria Zanin)以及伊沃.雷特泽尔(Ivo Neitzel),2003,用于纤维二糖水解的分批补料反应器的优化控制(Optimal control in fed-batch reactor forthe cellobiose hydrolysis),科技学报(自然科学版)(Acta Scientiarum.Technology)25:33-38;古萨科夫·A.V.(Gusakov,A.V.)和辛涅特西·A.P.(Sinitsyn,A.P.),1985,纤维素的酶水解动力学:1.分批反应器加工的数学模型(Kinetics of the enzymatichydrolysis of cellulose:1.Amathematicalmodel for a batch reactor process),酶与微生物技术(Enz.Microb.Technol.)7:346-352);摩擦反应器(隆·S.K.(Ryu,S.K.)和李·J.M.(Lee,J.M.),1983,通过使用摩擦生物反应器进行的废弃纤维素的生物转化(Bioconversion of waste cellulose by using an attrition bioreactor),生物技术与生物工程(Biotechnol.Bioeng.)25:53-65);或具有由电磁场引起的强烈搅拌的反应器(古萨科夫·A.V.、辛涅特西·A.P.、谢尔盖·I.Y.(Davydkin,I.Y.)、谢尔盖·V.Y.、普罗塔斯·O.V.(Protas,O.V.),1996,使用具有由电磁场引起的强烈搅拌的新型反应器增强酶纤维素水解(Enhancement of enzymatic cellulose hydrolysis using anovel type ofbioreactor with intensive stirring induced by electromagnetic field),应用生物化学与生物技术(Appl.Biochem.Biotechnol.)56:141-153)。另外的反应器类型包括:流化床,升流包覆层(blanket),固定化、以及用于水解和/或发酵的挤出机类型的反应器。
预处理。在本发明的方法的实践中,可以使用本领域已知的任何预处理方法来破坏植物细胞壁的纤维素材料组分(钱德拉(Chandra)等人,2007,底物预处理:木质纤维素的有效酶水解的关键?(Substrate pretreatment:The key to effective enzymatichydrolysis of lignocellulosics?),生物化学工程/生物技术的进展(Adv.Biochem.Engin./Biotechnol.)108:67-93;盖博(Galbe)和小林(Zacchi),2007,用于高效生物乙醇生产的木质纤维素材料的预处理(Pretreatment of lignocellulosicmaterials for efficient bioethanol production),生物化学工程/生物技术的进展108:41-65;亨德里克斯(Hendriks)和季曼(Zeeman),2009,用以增强木质纤维素生物质的消化性的预处理(Pretreatments to enhance the digestibility of lignocellulosicbiomass),生物资源技术(Bioresource Technol.)100:10-18;莫热(Mosier)等人,2005,用于木质纤维素生物质的预处理的有前景技术的特征(Features of promisingtechnologies for pretreatment of lignocellulosic biomass),生物资源技术96:673-686;塔希尔扎德(Taherzadeh)和卡里米(Karimi),2008,预处理木质纤维素废弃物以改进乙醇和生物气体产生:综述(Pretreatment of lignocellulosic wastes to improveethanol and biogas production:A review),分子科学国际杂志(Int.J.of Mol.Sci.)9:1621-1651;杨(Yang)和怀曼,2008,预处理:释放低成本纤维素乙醇的关键(Pretreatment:the key to unlocking low-cost cellulosic ethanol),生物燃料、生物产品与生物精炼(Biofuels Bioproducts and Biorefining-Biofpr.)2:26-40)。
纤维素材料也可以在预处理之前使用本领域中已知的方法进行粒度减小、筛分、预浸泡、润湿、洗涤和/或调理。
常规预处理包括但不限于:蒸汽预处理(伴随或不伴随爆炸)、稀酸预处理、热水预处理、碱预处理、石灰预处理、湿氧化、湿爆炸、氨纤维爆炸、有机溶剂预处理、以及生物预处理。另外的预处理包括氨渗滤、超声、电穿孔、微波、超临界CO2、超临界H2O、臭氧、离子液体以及γ辐射预处理。
可以在水解和/或发酵之前对纤维素材料进行预处理。优选在水解前进行预处理。可替代地,预处理可以与酶水解同时进行,以释放可发酵的糖,如葡萄糖、木糖、和/或纤维二糖。在多数情况下,预处理步骤自身导致将生物质转化为可发酵糖(即使在没有酶的情况下)。
蒸汽预处理。在蒸汽预处理中,加热纤维素材料以破坏植物细胞壁成分,包括木质素、半纤维素、以及纤维素,以使纤维素和其他级分,例如,半纤维素可接近酶。纤维素材料经过或穿过反应容器,将蒸汽注入该反应容器以增加温度至所需温度和压力,并且将蒸汽保持在其中持续希望的反应时间。蒸汽预处理优选在140℃至250℃,例如160℃至200℃、或170℃至190℃下进行,其中最佳温度范围取决于化学催化剂的添加。蒸汽预处理的停留时间优选是1-60分钟,例如1-30分钟、1-20分钟、3-12分钟、或4-10分钟,其中最佳停留时间取决于温度范围和添加的化学催化剂。蒸汽预处理允许相对较高的固体加载量,这样使得纤维素材料在预处理过程中通常仅变得潮湿。蒸汽预处理经常与预处理后的材料的爆发放料(explosive discharge)合并,这被称为蒸汽爆炸,即,快速急骤蒸发至大气压和材料的湍流,以通过破碎增加可接触的表面积(迪福(Duff)和默里(Murray),1996,生物资源技术(Bioresource Technology)855:1-33;盖尔贝(Galbe)和赛琪(Zacchi),2002,应用微生物学与生物技术(Appl.Microbiol.Biotechnol.)59:618-628;美国专利申请号20020164730)。在蒸汽预处理过程中,半纤维素乙酰基被裂解,并且得到的酸自催化半纤维素部分水解成单糖和寡糖。仅在有限的程度上去除木质素。
化学预处理:术语“化学处理”是指促进纤维素、半纤维素和/或木质素的分离和/或释放的任何化学预处理。这种预处理可以将结晶纤维素转化为无定形纤维素。适合的化学预处理工艺的实例包括例如稀酸预处理、石灰预处理、湿法氧化、氨纤维/冷冻爆炸(AFEX)、氨渗滤(APR)、离子液体、以及有机溶剂预处理。
经常在蒸汽预处理之前添加一种催化剂(例如H2SO4或SO2)(典型地是0.3%至5%w/w),该催化剂减少时间并降低温度、增加回收率、并改进酶水解(巴列斯特罗斯(Ballesteros)等人,2006,应用生物化学与生物技术129-132:496-508;瓦尔加(Varga)等人,2004,应用生物化学与生物技术113-116:509-523;塞斯尼尔(Sassner)等人,2006,酶与微生物技术(Enzyme Microb.Technol.)39:756-762)。在稀酸预处理中,纤维素材料与稀酸(典型地是H2SO4)和水混合,以形成浆料,由蒸汽加热至希望的温度,并且在停留时间后闪变至大气压。可以用许多反应器设计来进行稀酸预处理,例如,活塞流反应器、逆流反应器、或连续逆流收缩床反应器(达夫和默里,1996,见上文,舍尔(Schell)等人,2004,生物资源技术91:179-188;李(Lee)等人,1999,生物化学工程与生物技术的进展65:93-115)。
还可以使用碱性条件下的若干预处理方法。这些碱预处理包括,但不限于,氢氧化钠、石灰、湿氧化、氨渗滤(APR)和氨纤维/冷冻爆炸(AFEX)。
用氧化钙或氢氧化钙,在85℃-150℃的温度下进行石灰预处理,并且停留时间为从1小时到几天(怀曼(Wyman)等人,2005,生物资源技术(Bioresource Technol.)96:1959-1966;马塞尔(Mosier)等人,2005,生物资源技术96:673-686)。WO 2006/110891、WO 2006/110899、WO 2006/110900和WO 2006/110901公开了使用氨的预处理方法。
湿氧化是一种热预处理,其典型地在添加氧化剂(如过氧化氧或过压氧)的情况下在180℃至200℃下持续5-15分钟进行(施密特(Schmidt)和汤姆森(Thomsen),1998,生物资源技术64:139-151;帕罗内(Palonen)等人,2004,应用生物化学与生物技术117:1-17;瓦尔加等人,2004,生物技术与生物工程(Biotechnol.Bioeng.)88:567-574;马丁(Martin)等人,2006,化学技术与生物技术杂志(J.Chem.Technol.Biotechnol.)81:1669-1677)。预处理优选以1%-40%干物质,例如2%-30%干物质,或5%-20%干物质进行,并且由于添加碱如碳酸钠,初始pH经常会增加。
被称为湿爆炸(湿氧化和蒸汽爆炸的组合)的湿氧化预处理方法的修改方案能够处理高达30%的干物质。在湿爆炸中,在某一停留时间后,在预处理过程中引入氧化剂。然后通过急骤蒸发至大气压结束预处理(WO 2006/032282)。
氨纤维爆炸(AFEX)涉及在如90℃-150℃的中等温度和如17-20巴的高压下,用液体或气态氨处理纤维素材料5-10分钟,其中干物质含量可以高达60%(格拉帕里(Gollapalli)等人,2002,应用生物化学与生物技术(Appl.Biochem.Biotechnol.)98:23-35;俊达瓦特(Chundawat)等人,2007,生物技术与生物工程(Biotechnol.Bioeng.)96:219-231;阿里扎德(Alizadeh)等人,2005,应用生物化学与生物技术121:1133-1141;泰莫里(Teymouri)等人,2005,生物资源技术(Bioresource Technol.)96:2014-2018)。在AFEX预处理过程中,纤维素和半纤维素保持相对完整。木质素-碳水化合物复合物被裂解。
有机溶剂预处理通过使用含水乙醇(40%-60%乙醇)在160℃-200℃下萃取30-60分钟而将纤维素材料脱木质素(潘(Pan)等人,2005,生物技术与生物工程(Biotechnol.Bioeng.)90:473-481;潘等人,2006,生物技术与生物工程94:851-861;库拉比(Kurabi)等人,2005,应用生物化学与生物技术(Appl.Biochem.Biotechnol.)121:219-230)。通常添加硫酸作为催化剂。在有机溶剂预处理中,大部分半纤维素和木质素被去除。
适合的预处理方法的其他实例由舍尔(Schell)等人,2003,应用生物化学与生物技术(Appl.Biochem.and Biotechnol.),第105-108卷,第69-85页、和莫热(Mosier)等人,2005,生物资源技术(Bioresource Technology)96:673-686、以及美国公开申请2002/0164730描述。
在一方面,化学预处理优选作为稀酸处理,并且更优选作为连续稀酸处理进行。酸通常是硫酸,但也可以使用其他酸,如乙酸、柠檬酸、硝酸、磷酸、酒石酸、琥珀酸、氯化氢、或其混合物。弱酸处理优选在1至5,例如1至4或1至2.5的pH范围中进行。在一方面,酸浓度在优选从0.01wt%至10wt%酸,例如0.05wt%至5wt%酸或0.1wt%至2wt%酸的范围中。使酸与纤维素材料相接触,并且保持在优选140℃-200℃,例如165℃-190℃范围中的温度下,持续从1至60分钟范围内的时期。
在另一方面,预处理发生在含水浆料中。在优选方面中,在预处理过程中纤维素材料以优选在10wt%-80wt%之间,例如20wt%-70wt%或30wt%-60wt%,如大约40wt%的量存在。预处理的纤维素材料可以不洗涤或者使用本领域任何已知的方法洗涤,例如,用水洗涤。
机械预处理或物理预处理:术语“机械预处理”或“物理预处理”是指促进颗粒粒度减小的任何预处理。例如,这样的预处理可以涉及不同类型的研磨或碾磨(例如,干磨、湿磨或振动球磨)。
纤维素材料可以物理地(机械地)且化学地预处理。机械或物理预处理可以与蒸汽/蒸汽爆炸、水热解(hydrothermolysis)、稀酸或弱酸处理、高温、高压处理、辐射(例如,微波福射)或其组合相结合。在一方面,高压意指在优选约100至约400psi,例如约150至约250psi范围中的压力。在另一方面,高温意指在约100℃至约300℃,例如约140℃至约200℃范围中的温度。在一个优选方面中,机械或物理预处理在分批过程中使用蒸汽枪水解器系统,例如从顺智公司(Sunds Defibrator AB),瑞典可获得的顺智水解器(SundsHydrolyzer)来进行,该系统使用如上所定义的高压和高温。这些物理预处理和化学预处理可以根据需要顺序地进行或同时进行。
因此,在一个优选方面,使纤维素材料经受物理(机械)或化学预处理、或其任何组合,以促进纤维素、半纤维素、和/或木质素的分离和/或释放。
生物预处理:术语“生物预处理”是指促进纤维素、半纤维素、和/或木质素从纤维素材料中分离和/或释放的任何生物预处理。生物预处理技术可以涉及应用溶解木质素的微生物和/或酶(参见,例如,舒·T.-A.(Hsu,T.-A.),1996,生物质的预处理(Pretreatmentof biomass),生物乙醇手册:生产和利用(Handbook on Bioethanol:Production andUtilization),怀曼·C.E.编辑,泰勒-弗朗西斯出版集团,华盛顿特区,179-212;高希(Ghosh)和辛格(Singh),1993,用于纤维素生物质的酶/微生物转化的物理化学与生物处理(Physicochemical and biological treatments for enzymatic/microbial conversionof cellulosic biomass),应用微生物学进展(Adv.Appl.Microbiol.)39:295-333;麦克米兰·J.D.(McMillan,J.D.),1994,预处理木质纤维素生物质:综述(Pretreatinglignocellulosic biomass:a review),用于燃料生产的生物质的酶转化(EnzymaticConversion of Biomass for Fuels Production),希默尔·M.E.、贝克·J.O.、以及奥弗伦·R.P.(Overend,R.P.)编辑,美国化学学会讨论会系列566(ACS Symposium Series566),美国化学学会(American Chemical Society),华盛顿特区,第15章;贡·C.S.(Gong,C.S.)、卡奥·N.J.(Cao,N.J.)、杜·J.(Du,J.)、以及曹·G.T.(Tsao,G.T.),1999,由可再生资源生产乙醇(Ethanol production from renewable resources),生物化学工程/生物技术的进展,舍佩尔·T.编辑,施普林格出版社德国海德堡柏林(Berlin Heidelberg,Germany),65:207-241);奥尔森(Olsson)和哈恩-哈格达尔(Hahn-Hagerdal),1996,用于乙醇生产的木质纤维素水解物的发酵(Fermentation of lignocellulosic hydrolysatesfor ethanol production),酶与微生物技术(Enz.Microb.Tech.)18:312-331;以及瓦蓝德(Vallander)和埃里克松(Eriksson),1990,由木质纤维素材料生产乙醇:技术现状(Production of ethanol from lignocellulosic materials:State of the art),生物化学工程/生物技术的进展42:63-95)。
糖化。在水解步骤(还称为糖化)中,将(例如预处理的)纤维素材料水解,以将纤维素和/或半纤维素分解成可发酵糖,如葡萄糖、纤维二糖、木糖、木酮糖、阿拉伯糖、甘露糖、半乳糖和/或可溶性寡糖。水解由酶组合物在包括本发明的碳水化合物结合模块变体的纤维二糖水解酶变体或纤维素分解酶的存在下酶促进行。这些组合物的酶可以同时或顺序添加。
酶水解优选在易于由本领域技术人员确定的条件下,在合适的含水环境中执行。在一方面,水解在适合于一种或多种酶的活性,即对于该一种或多种酶来说最佳的条件下进行。水解可以作为进料分批过程或连续过程进行,其中将纤维素材料逐渐进料至例如含酶的水解溶液中。
糖化通常在搅拌釜反应器或发酵罐中,在受控的pH、温度和混合条件下进行。适合的处理时间、温度以及pH条件可以由本领域技术人员容易地确定。例如,糖化可以持续长达200小时,但是典型地进行优选约12至约120小时,例如约16至约72小时或约24至约48小时。温度优选约25℃至约70℃,例如约30℃至约65℃,约40℃至约60℃,或约50℃至55℃的范围。pH优选约3至约8,例如约3.5至约7,约4至约6,或约pH 5.0至约pH 5.5的范围。干燥固体含量在优选约5wt%至约50wt%,例如约10wt%至约40wt%或约20wt%至约30wt%的范围中。
这些酶组合物可以包包括用于降解纤维素材料的任何蛋白。
在一方面,该酶组合物包括或进一步包括选自下组的一种或多种(如,若干种)蛋白质,该组由以下各项组成:纤维素酶、具有增强纤维素分解活性的GH61多肽、半纤维素酶、酯酶、棒曲霉素、漆酶、木质素分解酶、果胶酶、过氧化物酶、蛋白酶、以及膨胀素。在另一方面,纤维素酶优选是一种或多种(例如,若干种)选自下组的酶,该组由以下各项组成:内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶。在另一方面,半纤维素酶优选是一种或多种(例如,若干种)选自下组的酶,该组由以下各项组成:乙酰甘露聚糖酯酶、乙酰木聚糖酯酶、阿拉伯聚糖酶、阿拉伯呋喃糖苷酶、香豆酸酯酶、阿魏酸酯酶、半乳糖苷酶、葡糖醛酸糖苷酶、葡萄糖醛酸酯酶、甘露聚糖酶、甘露糖苷酶、木聚糖酶、以及木糖苷酶。
在另一方面,该酶组合物包括一种或多种(例如,若干种)纤维素分解酶。在另一方面,该酶组合物包括或进一步包括一种或多种(例如,若干种)半纤维素分解酶。在另一方面,该酶组合物包括一种或多种(例如,若干种)纤维素分解酶和一种或多种(例如,若干种)半纤维素分解酶。在另一方面,该酶组合物包括选自纤维素分解酶和半纤维素分解酶的组的一种或多种(例如,若干种)酶。在另一方面,该酶组合物包括内切葡聚糖酶。在另一方面,该酶组合物包括一种纤维二糖水解酶。在另一方面,该酶组合物包括β-葡糖苷酶。在另一方面,该酶组合物包括一种具有增强纤维素分解活性的多肽。在另一方面,该酶组合物包括一种内切葡聚糖酶以及一种具有增强纤维素分解活性的多肽。在另一方面,该酶组合物包括一种纤维二糖水解酶以及一种具有增强纤维素分解活性的多肽。在另一方面,该酶组合物包括一种β-葡糖苷酶以及一种具有增强纤维素分解活性的多肽。在另一方面,该酶组合物包括一种内切葡聚糖酶和一种纤维二糖水解酶。在另一方面,该酶组合物包括内切葡聚糖酶和β-葡糖苷酶。在另一方面,该酶组合物包括一种纤维二糖水解酶和一种β-葡糖苷酶。在另一方面,该酶组合物包括一种内切葡聚糖酶、一种纤维二糖水解酶、以及一种具有纤维素分解增强活性的多肽。在另一方面,该酶组合物包括一种内切葡聚糖酶、一种β-葡糖苷酶、以及一种具有纤维素分解增强活性的多肽。在另一方面,该酶组合物包含一种纤维二糖水解酶、一种β-葡糖苷酶、以及一种具有纤维素分解增强活性的多肽。在另一方面,该酶组合物包括内切葡聚糖酶、纤维二糖水解酶、以及β-葡糖苷酶。在另一方面,该酶组合物包括内切葡聚糖酶、纤维二塘水解酶、β-葡糖苷酶、以及具有增强纤维素分解活性的多肽。
在另一方面,该酶组合物包括乙酰甘露聚糖酯酶。在另一方面,该酶组合物包括乙酰木聚糖酯酶。在另一方面,该酶组合物包括阿拉伯聚糖酶(例如,α-L-阿拉伯聚糖酶)。在另一方面,该酶组合物包括阿拉伯呋喃糖苷酶(例如,α-L-阿拉伯呋喃糖苷酶)。在另一方面,该酶组合物包括香豆酸酯酶。在另一方面,该酶组合物包括阿魏酸酯酶。在另一方面,该酶组合物包括半乳糖苷酶(例如,α-半乳糖苷酶和/或β-半乳糖苷酶)。在另一方面,该酶组合物包括葡糖醛酸糖苷酶(例如,α-D-葡糖醛酸糖苷酶)。在另一方面,该酶组合物包括葡糖醛酸酯酶。在另一方面,该酶组合物包括甘露聚糖酶。在另一方面,该酶组合物包括甘露糖苷酶(例如,β-甘露糖苷酶)。在另一方面,该酶组合物包括木聚糖酶。在一个优选方面中,该木聚糖酶是家族10木聚糖酶。在另一方面,该酶组合物包括木糖苷酶(例如β-木糖苷酶)。
在另一方面,该酶组合物包括酯酶。在另一方面,该酶组合物包括棒曲霉素。在另一方面,该酶组合物包括一种漆酶。在另一方面,该酶组合物包含一种木质素分解酶。在一个优选方面,该木质素分解酶是一种锰过氧化物酶。在另一个优选方面中,该木质素分解酶是木质素过氧化物酶。在另一个优选方面中,该木质素分解酶是H2O2产生酶。在另一方面,该酶组合物包括果胶酶。在另一方面,该酶组合物包括过氧化物酶。在另一方面,该酶组合物包括蛋白酶。在另一方面,该酶组合物包括膨胀素。
在本发明的方法中,可以在糖化、糖化和发酵、或发酵之前或之中添加这一种或多种酶。
该酶组合物的一种或多种(例如,若干种)组分可以是野生型蛋白、重组蛋白、或野生型蛋白和重组蛋白的组合。例如,一种或多种(例如,若干种)组分可以是一种细胞的天然蛋白质,将该细胞用作重组地表达该酶组合物的一种或多种(例如,若干种)其他组分的宿主细胞。该酶组合物的一种或多种(例如,若干种)组分可以作为单组分来产生,然后将其合并以形成该酶组合物。酶组合物可以是多组分和单组分蛋白制剂的组合。
在本发明的方法中使用的酶可以处于任何适于使用的形式,例如像发酵液配制品或细胞组合物、具有或不具有细胞碎片的细胞裂解物、半纯化的或纯化的酶制剂、或作为酶的来源的宿主细胞。所述酶组合物可为干粉或颗粒,无粉尘的颗粒,液体,稳定化液体或稳定化受保护的酶。可以根据已建立的方法例如通过添加稳定剂(如糖、糖醇或其他多元醇)、和/或乳酸或另一种有机酸,对液体酶制剂进行稳定化。
包括碳水化合物结合模块变体的酶和纤维二糖水解酶变体或纤维素分解酶的最佳量取决于若干因素,包括但不限于:纤维素分解酶和/或半纤维素分解酶组分的混合物、纤维素材料、纤维素材料的浓度、纤维素材料的一种或多种预处理、温度、时间、pH、以及所包含的发酵生物体(例如,用于同时进行糖化和发酵的酵母)。
在一方面,对纤维素材料的纤维素分解酶或半纤维素分解酶的有效量是约0.5至约50mg,例如约0.5至约40mg、约0.5至约25mg、约0.75至约20mg、约0.75至约15mg、约0.5至约10mg,或约2.5至约10mg/g的纤维素材料。
在另一个优选方面,包括碳水化合物结合模块变体的纤维二糖水解酶变体或纤维素分解酶对纤维素材料的有效量是约0.01至约50.0mg、优选约0.01至约40mg、更优选约0.01至约30mg、更优选约0.01至约20mg、更优选约0.01至约10mg、更优选约0.01至约5mg、更优选约0.025至约1.5mg、更优选约0.05至约1.25mg、更优选约0.075至约1.25mg、更优选约0.1至约1.25mg、甚至更优选约0.15至约1.25mg、并且最优选约0.25至约1.0mg/g的纤维素材料。
在另一个优选方面中,包括碳水化合物结合模块的纤维二糖水解酶变体或纤维素分解酶对纤维素分解酶或半纤维素分解酶的有效量是约0.005至约1.0g,例如约0.01至约1.0g、约0.15至约0.75g、约0.15至约0.5g、约0.1至约0.5g、约0.1至约0.25g、或约0.05至约0.2g/g的纤维素分解酶或半纤维素分解酶。
具有纤维素分解酶活性或半纤维素分解酶活性的多肽,以及适用于纤维素材料的降解的其他蛋白质/多肽,例如具有纤维素分解增强活性的GH61多肽(在下文统称为“具有酶活性的多肽”)可以源自或获自任何适合的来源,包括细菌、真菌、酵母、植物、或哺乳动物来源。术语“获得的”在此还指该酶可以在宿主生物中利用在此描述的方法重组地产生,其中重组产生的酶对于该宿主生物来说是天然的或异源的,或具有修饰的氨基酸序列,例如,具有一个或多个(例如,若干个)缺失、插入和/或取代的氨基酸,即重组产生的酶是天然氨基酸序列的突变体和/或片段或通过本领域已知的氨基酸重排方法产生的酶。原生酶的含义中涵盖天然变体,而外源酶的含义中涵盖重组(如通过定点诱变或改组)获得的变体。
具有酶活性的多肽可以是细菌多肽。例如,该多肽可以是具有酶活性的革兰氏阳性细菌多肽,例如芽孢杆菌属、链球菌属、链霉菌属、葡萄球菌属、肠球菌属、乳酸杆菌属、乳球菌属、梭菌属、土芽孢杆菌属、热解纤维素菌属、热酸菌属、热裂菌属(Thermobifidia)、或海洋芽孢杆菌属多肽,或具有酶活性的革兰氏阴性细菌多肽,例如大肠杆菌、假单孢菌属、沙门氏菌属、弯曲杆菌属、螺杆菌属、黄杆菌属、梭杆菌属、泥杆菌属、奈瑟氏菌属、或脲原体属多肽。
在一方面,该多肽是具有酶活性的嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚硬芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌、或苏云金芽孢杆菌多肽。
在另一方面,该多肽是具有酶活性的似马链球菌、酿脓链球菌、乳房链球菌、或马链球菌兽疫亚种多肽。
在另一方面,该多肽是具有酶活性的不产色链霉菌、除虫链霉菌、天蓝链霉菌、灰色链霉菌、或浅青紫链霉菌多肽。
该具有酶活性的多肽也可以是一种真菌多肽,并且更优选地是一种酵母多肽,例如具有酶活性的念珠菌属(Candida)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)或耶氏酵母属(Yarrowia)多肽;或更优选是一种丝状真菌多肽,如具有酶活性的顶孢霉属(Acremonium)、伞菌属(Agaricus)、链格孢属(Alternaria)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、葡萄座腔菌属(Botryospaeria)、拟蜡菌属(Ceriporiopsis)、毛喙壳属(Chaetomidium)、金孢子菌属(Chrysosporium)、麦角菌属(Claviceps)、旋孢腔菌属(Cochliobolus)、鬼伞属(Coprinopsis)、乳白蚁属(Coptotermes)、棒囊壳属(Corynascus)、隐丛赤壳菌属(Cryphonectria)、隐球菌属(Cryptococcus)、色二孢属(Diplodia)、黑耳属(Exidia)、线黑粉酵母属(Filibasidium)、镰孢属(Fusarium)、赤霉属(Gibberella)、全鞭毛虫属(Holomastigotoides)、腐质霉属(Humicola)、耙齿菌属(Irpex)、香菇属(Lentinula)、小腔球菌属(Leptospaeria)、梨孢菌属(Magnaporthe)、黑果菌属(Melanocarpus)、亚灰树花菌属(Meripilus)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、新美鞭菌属(Neocallimastix)、链孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉菌属(Penicillium)、平革菌属(Phanerochaete)、瘤胃壶菌属(Piromyces)、Poitrasia、假黑盘菌属(Pseudoplectania)、假披发虫属(Pseudotrichonympha)、根毛霉菌属(Rhizomucor)、裂褶菌属(Schizophyllum)、柱顶孢属(Scytalidium)、篮状菌属(Talaromyces)、嗜热子囊菌属(Thermoascus)、梭孢壳霉属(Thielavia)、弯颈霉属(Tolypocladium)、木霉属(Trichoderma)、长毛盘菌属(Trichophaea)、轮枝孢属(Verticillium)、小包脚菇属(Volvariella)、或炭角菌属(Xylaria)多肽。
在一方面,多肽是具有酶活性的卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酶母、或卵形酵母多肽。
在另一方面,该多肽是具有酶活性的解纤维枝顶孢霉、棘孢曲霉、泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、嗜角质金孢子菌、拉克淖金孢子菌、热带金孢子菌、粪状金孢子菌、狭边金孢子菌、毡金孢子菌、女王杜香金孢子菌、褐薄金孢子菌、杆孢状镰孢、禾谷镰孢、库威镰孢、黄色镰刀菌、禾谷镰刀菌、禾赤镰孢、异孢镰孢、合欢木镰孢、尖孢镰刀菌、多枝镰孢、粉红镰孢菌、接骨木镰孢、肤色镰孢、拟分枝孢镰刀菌、硫色镰孢、圆镰孢、拟丝孢镰刀菌、镶片镰孢菌、灰腐质霉、特异腐质霉、疏棉状腐质霉、白囊耙齿菌、米黑毛霉、嗜热毁丝霉、粗糙脉孢菌、绳状青霉菌、产紫青霉、黄孢原毛平革菌、无色梭孢壳、阿波梭孢壳菌、白毛梭孢壳霉、澳洲梭孢壳、菲美蒂梭孢壳菌、小孢梭孢壳、卵孢梭孢壳、秘鲁梭孢壳霉、瘤孢梭孢壳、毛梭孢壳、耐热梭孢壳、太瑞斯梭孢壳霉、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、绿色木霉多肽、或褐孢长毛盘菌多肽。
还可以使用具有酶活性的多肽的化学修饰的或蛋白工程化的突变体。
该酶组合物的一种或多种(例如,若干种)组分可以是重组组分,即,通过克隆编码该单一组分的DNA序列并且随后用该DNA序列转化细胞并且在宿主中表达产生(参见例如,WO 91/17243和WO 91/17244)。优选宿主是异源宿主(酶对于宿主而言是异源的),但是在某些条件下,宿主还可以是同源宿主(酶对于宿主而言是原生的)。还可以通过纯化来自发酵液的这样一种蛋白来制备单组分纤维素分解蛋白。
在一方面,该一种或多种(例如,若干种)纤维素分解酶包括商业纤维素分解酶制剂。适用于本发明的商业纤维素分解酶制剂的实例包括:(例如)CTec(诺维信A/S公司)、CTec2(诺维信A/S公司)、CTec3(诺维信A/S公司)、CELLUCLASTTM(诺维信A/S公司)、NOVOZYMTM188(诺维信A/S公司)、CELLUZYMETM(诺维信A/S公司)、CEREFLOTM(诺维信A/S公司)、以及ULTRAFLOTM(诺维信A/S公司)、ACCELERASETM(杰能科国际公司(Genencor Int.))、LAMINEXTM(杰能科国际)、SPEZYMETM CP(杰能科国际)、NL(帝斯曼(DSM));S/L 100(帝斯曼)、ROHAMENTTM 7069 W(罗姆股份有限公司(GmbH))、LDI(Dyadic国际有限公司(DyadicInternational,Inc.))、LBR(Dyadic国际有限公司)、或150L(Dyadic国际有限公司)。将纤维素酶以从约0.001至约5.0wt%的固体,例如约0.025至约4.0wt%的固体或约0.005至约2.0wt%的固体的有效量添加。
可以在本发明的方法中使用的细菌内切葡聚糖酶的实例包括但不限于:解纤维热酸菌(Acidothermus cellulolyticus)内切葡聚糖酶(WO 91/05039;WO 93/15186;美国专利号5,275,944;WO 96/02551;美国专利号5,536,655;WO 00/70031;WO 05/093050);褐色高温双歧菌(Thermobifida fusca)内切葡聚糖酶III(WO 05/093050);以及褐色高温双歧菌内切葡聚糖酶V(WO 05/093050)。
可以用于本发明的真菌内切葡聚糖酶的实例包括但不限于:里氏木霉内切葡聚糖酶I(彭蒂莱(Penttila)等人,1986,基因(Gene)45:253-263,里氏木霉Cel7B内切葡聚糖酶I(GENBANKTM登录号M15665);里氏木霉内切葡聚糖酶II(萨洛黑莫(Saloheimo)等人,1988,基因63:11-22),里氏木霉Cel5A内切葡聚糖酶II(GENBANKTM登录号M19373);里氏木霉内切葡聚糖酶III(奥卡达(Okada)等人,1988,应用与环境微生物学(Appl.Environ.Microbiol.)64:555-563,GENBANKTM登录号AB003694);里氏木霉内切葡聚糖酶V(萨洛黑莫等人,1994,分子微生物学(Molecular Microbiology)13:219-228,GENBANKTM登录号Z33381);棘孢曲霉内切葡聚糖酶(黄(Ooi)等人,1990,核酸研究(Nucleic Acids Research)18:5884);川地曲霉(spergillus kawachii)内切葡聚糖酶(坂元(Sakamoto)等人,1995,当代遗传学(CurrentGenetics)27:435-439);胡萝卜软腐欧文氏菌(Erwinia carotovara)内切葡聚糖酶(萨里拉赫蒂(Saarilahti)等人,1990,基因90:9-14);尖镰孢内切葡聚糖酶(GENBANKTM登录号L29381);灰腐质霉高温变种内切葡聚糖酶(GENBANKTM登录号AB003107);热白丝菌(Melanocarpus albomyces)内切葡聚糖酶(GENBANKTM登录号MAL515703);粗糙链孢菌内切葡聚糖酶(GENBANKTM登录号XM_324477);特异腐质霉内切葡聚糖酶V;嗜热毁丝霉CBS117.65内切葡聚糖酶;担子菌纲(basidiomycete)CBS 495.95内切葡聚糖酶;担子菌纲CBS494.95内切葡聚糖酶;土生梭孢壳霉NRRL 8126 CEL6B内切葡聚糖酶;土生梭孢壳霉NRRL8126 CEL6C内切葡聚糖酶;土生梭孢壳霉NRRL 8126 CEL7C内切葡聚糖酶;土生梭孢壳霉NRRL 8126 CEL7E内切葡聚糖酶;土生梭孢壳霉NRRL 8126 CEL7F内切葡聚糖酶;Cladorrhinum foecundissimum ATCC 62373 CEL7A内切葡聚糖酶;以及里氏木霉菌株号VTT-D-80133内切葡聚糖酶(GENBANKTM登录号M15665)。
可用于本发明的纤维二糖水解酶的实例包括,但不限于:棘孢曲霉纤维二糖水解酶II(WO 2011/059740)、嗜热毛壳菌纤维二糖水解酶I、嗜热毛壳菌纤维二糖水解酶II、特异腐质霉纤维二糖水解酶I、嗜热毁丝霉纤维二糖水解酶II(WO 2009/042871)、赫卡尼亚梭孢壳霉(Thielavia hyrcanie)纤维二糖水解酶II(WO 2010/141325)、太瑞斯梭孢壳霉纤维二糖水解酶II(CEL6A、WO 2006/074435)、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、以及褐孢长毛盘菌纤维二糖水解酶II(WO 2010/057086)。
可用于本发明的β-葡糖苷酶的实例包括但不限于来自以下各项的β-葡糖苷酶:棘孢曲霉(川口(Kawaguchi)等人,1996,基因173:287-288)、烟曲霉(WO 2005/047499)、黑曲霉(丹(Dan)等人,2000,生物化学杂志(J.Biol.Chem.)275:4973-4980)、米曲霉(WO 2002/095014)、巴西青霉菌IBT 20888(WO 2007/019442和WO 2010/088387)、土生梭孢壳霉(WO2011/035029)、以及褐孢长毛盘菌(WO 2007/019442)。
所述β-葡糖苷酶可以是融合蛋白。在一方面,该β-葡糖苷酶是米曲霉β-葡糖苷酶变异体BG融合蛋白(WO 2008/057637)或米曲霉β-葡糖苷酶融合蛋白(WO 2008/057637)。
其他有用的内切葡聚糖酶、纤维二糖水解酶、以及β-葡糖苷酶披露于使用根据以下的分类的许多糖基水解酶家族中:亨利萨特·B.(Henrissat B.),1991,基于氨基酸序列相似性的糖基水解酶的分类(A classification of glycosyl hydrolases based onamino-acid sequence similarities),生物化学杂志(Biochem.J.)280:309-316;以及亨利萨特·B.和贝洛赫·A.(Bairoch A.),1996,修正糖基水解酶的基于序列的分类(Updating the sequence-based classification of glycosyl hydrolases),生物化学杂志316:695-696。
可以在本发明中使用的其他纤维素分解酶描述于WO 98/13465、WO 98/015619、WO98/015633、WO 99/06574、WO 99/10481、WO 99/025847、WO 99/031255、WO 2002/101078、WO2003/027306、WO 2003/052054、WO 2003/052055、WO 2003/052056、WO 2003/052057、WO2003/052118、WO 2004/016760、WO 2004/043980、WO 2004/048592、WO 2005/001065、WO2005/028636、WO 2005/093050、WO 2005/093073、WO 2006/074005、WO 2006/117432、WO2007/071818、WO 2007/071820、WO 2008/008070、WO 2008/008793、美国专利号5,457,046、美国专利号5,648,263、以及美国专利号5,686,593中。
在本发明的方法中,可以使用具有纤维素分解增强活性的任何GH61多肽。
在一方面,该具有纤维素分解增强活性的GH61多肽包括下述基序:
[ILMV]-P-X(4,5)-G-X-Y-[ILMV]-X-R-X-[EQ]-X(4)-[HNQ](SEQ ID NO:27或SEQID NO:28)和[FW]-[TF]-K-[AIV],
其中X为任意氨基酸,X(4,5)为在4或5个连续位置的任意氨基酸,而X(4)是在4个连续位置的任意氨基酸。
包括以上提到的基序的多肽可以进一步包括:
H-X(1,2)-G-P-X(3)-[YW]-[AILMV](SEQ ID NO:29或SEQ ID NO:30),
[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV](SEQ ID NO:31),或
H-X(1,2)-G-P-X(3)-[YW]-[AILMV](SEQ ID NO:32或SEQ ID NO:33)和[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV](SEQ ID NO:34),
其中X为任意氨基酸,X(1,2)为在1个位置或2个连续位置的任意氨基酸,X(3)为3个连续位置的任意氨基酸,而X(2)为2个连续位置的任意氨基酸。在以上基序中,采用可接受的IUPAC单一字母氨基酸缩写。
在一个优选方面中,该具有纤维素分解增强活性的GH61多肽进一步包括H-X(1,2)-G-P-X(3)-[YW]-[AILMV](SEQ ID NO:29或SEQ ID NO:30)。在另一个优选方面中,该具有纤维素分解增强活性的分离的GH61多肽进一步包括[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV](SEQ ID NO:31)。在另一个优选方面中,该具有纤维素分解增强活性的GH61多肽进一步包括H-X(1,2)-G-P-X(3)-[YW]-[AILMV](SEQ ID NO:32或SEQ ID NO:33)和[EQ]-X-Y-X(2)-C-X-[EHQN]-[FILV]-X-[ILV](SEQ ID NO:34)。
在第二个方面中,该具有纤维素分解增强活性的GH61多肽具有以下基序:
[ILMV]-P-x(4,5)-G-x-Y-[ILMV]-x-R-x-[EQ]-x(3)-A-[HNQ](SEQ ID NO:35或SEQ ID NO:36),
其中x为任意氨基酸,x(4,5)为在4或5个连续位置的任意氨基酸,而x(3)为3个连续位置的任意氨基酸。在上述基序中,采用公认的IUPAC单字母氨基酸缩写。
适用于本发明的方法的具有纤维素分解增强活性的GH61多肽的实例包括但不限于来自以下各项的GH61多肽:土生梭孢壳霉(WO 2005/074647、WO 2008/148131、以及WO2011/035027)、金黄色嗜热子囊菌(WO 2005/074656和WO 2010/065830)、里氏木霉(WO2007/089290)、嗜热毁丝霉(WO 2009/085935、WO 2009/085859、WO 2009/085864、WO 2009/085868)、烟曲霉(WO 2010/138754);来自以下各项的GH61多肽:嗜松青霉(WO 2011/005867)、嗜热子囊菌属菌种(WO 2011/039319)、青霉菌属种(WO 2011/041397)、以及甲壳嗜热子囊菌(WO 2011/041504)。
在一方面,根据WO 2008/151043中所述的,具有纤维素分解增强活性的多肽GH61可在例如硫酸锰等可溶性活化二价金属阳离子的存在下使用。
在另一方面,具有增强纤维素分解活性的GH61多肽在以下各项的存在下使用:二氧基化合物、双环化合物、杂环化合物、含氮化合物、醌化合物、含硫化合物、或一种获得自经预处理的纤维素材料(例如预处理的玉米秸秆(PCS))的液体。
二氧基化合物可以包括包含两个或更多个氧原子的任何适合化合物。在一些方面,二氧基化合物包含一个如在此所述的被取代的芳基部分。二氧基化合物可以包括一个或多个(例如,若干个)羟基和/或羟基衍生物,而且还包括缺乏羟基和羟基衍生物的取代的芳基部分。二氧基化合物的非限制性实例包括邻苯二酚或儿茶酚;咖啡酸;3,4-二羟基苯甲酸;4-叔丁基-5-甲氧基-1,2-苯二酚;连苯三酚;没食子酸;3,4,5-三羟基苯甲酸甲酯;2,3,4-三羟基二苯甲酮;2,6-二甲氧基苯酚;芥子酸;3,5-二羟基苯甲酸;4-氯-1,2-苯二酚;4-硝基-1,2-苯二酚;丹宁酸;没食子酸乙酯;羟乙酸甲酯;二羟基富马酸;2-丁炔-1,4-二醇;克酮酸;1,3-丙二醇;酒石酸;2,4-戊二醇;3-乙氧基-1,2-丙二醇;2,4,4'-三羟基二苯甲酮;顺-2-丁烯-1,4-二醇;3,4-二羟基-3-环丁烯-1,2-二酮;二羟基丙酮;丙烯醛乙缩醛;4-羟基苯甲酸甲酯;4-羟基苯甲酸;以及3,5-二甲氧基-4-羟基苯甲酸甲酯;或其盐或溶剂化物。
双环化合物可以包含如在此所述的任何适合被取代的稠环系统。这些化合物可以包括一个或多个(例如,若干个)另外的环,并且除非另有说明,否则不限于具体数目的环。在一方面,双环化合物是一种类黄酮。在另一方面,双环化合物是一种任选取代的异类黄酮。在另一方面,双环化合物是一种任选取代的花色离子(flavylium ion),如一种任选取代的花色素或任选取代的花色素苷、或其衍生物。双环化合物的非限制性实例包括表儿茶素;槲皮酮;杨梅黄酮;紫杉叶素;堪非醇;桑色素;刺槐素;柚皮素;异鼠李素;芹黄素;矢车菊素;矢车菊素苷;黑豆多酚;花青素鼠李葡糖苷;或其盐或溶剂化物。
杂环化合物可以是如在此所述的任何适合化合物,如包含一个杂原子的一种任选地被取代的芳香族或非芳香族环。在一方面,杂环是包含一个任选地被取代的杂环烷基部分或一个任选地被取代的杂芳基部分的一种化合物。在另一方面,任选地被取代的杂环烷基部分或任选地被取代的杂芳基部分是一个任选地被取代的5元杂环烷基或一个任选地被取代的5元杂芳基部分。在另一方面,任选地被取代的杂环烷基或任选地被取代的杂芳基部分是一个选自以下的任选地被取代的部分:吡唑基、呋喃基、咪唑基、异噁唑基、噁二唑基、噁唑基、吡咯基、吡啶基、嘧啶基、哒嗪基、噻唑基、三唑基、噻吩基、二氢噻吩并吡唑基、硫茚基、咔唑基、苯并咪唑基、苯并噻吩基、苯并呋喃基、吲哚基、喹啉基、苯并三唑基、苯并噻唑基、苯并噁唑基、苯并咪唑基、异喹啉基、异吲哚基、吖啶基、苯并异唑基、二甲基乙内酰脲、吡嗪基、四氢呋喃基、吡咯啉基、吡咯烷基、吗啉基、吲哚基、二氮呯基、氮呯基、噻呯基、哌啶基以及氧呯基。在另一方面,任选地被取代的杂环烷基部分或任选地被取代的杂芳基部分是一个任选地被取代的呋喃基。杂环化合物的非限制性实例包括(1,2-二羟基乙基)-3,4-二羟基呋喃-2(5H)-酮;4-羟基-5-甲基-3-呋喃酮;5-羟基-2(5H)-呋喃酮;[1,2-二羟基乙基]呋喃-2,3,4(5H)-三酮;α-羟基-γ-丁内酯;核糖酸γ-内酯;己糖醛酸(aldohexuronicaldohexuronic acid)γ-内酯;葡萄糖酸δ-内酯;4-羟基香豆素;二氢苯并呋喃;5-(羟基甲基)糠醛;联糠醛;2(5H)-呋喃酮;5,6-二氢-2H-吡喃-2-酮;以及5,6-二氢-4-羟基-6-甲基-2H-吡喃-2-酮;或其盐或溶剂化物。
含氮化合物可以是具有一个或多个氮原子的任何适合化合物。在一方面,含氮化合物包含一个胺、亚胺、羟胺或氮氧化物部分。含氮化合物的非限制性实例包括丙酮肟;紫尿酸;吡啶-2-醛肟;2-氨基苯酚;1,2-苯二胺;2,2,6,6-四甲基-1-哌啶基氧基;5,6,7,8-四氢生物蝶呤;6,7-二甲基-5,6,7,8-四氢蝶呤;以及顺丁烯酰胺酸;或其盐或溶剂化物。
醌化合物可以是如在此所描述的包含一个醌部分的任何适合的化合物。醌化合物的非限制性实例包括:1,4-苯醌、1,4-萘醌、2-羟基-1,4-萘醌、2,3-二甲氧基-5-甲基-1,4-苯醌或辅酶Q0、2,3,5,6-四甲基-1,4-苯醌或杜醌、1,4-二羟基蒽醌、3-羟基-1-甲基-5,6-二氢吲哚二酮或肾上腺素红、4-叔丁基-5-甲氧基-1,2-苯醌、吡咯并喹啉醌、或其盐或溶剂化物。
含硫化合物可以是包括一个或多个硫原子的任何适合化合物。在一方面,含硫化合物包含一个选自以下的部分:亚硫酰基、硫醚、亚磺酰基、磺酰基、硫酰胺、磺酰胺、磺酸以及磺酸酯。含硫化合物的非限制性实例包括乙硫醇;2-丙硫醇;2-丙烯-1-硫醇;2-巯基乙磺酸;苯硫酚;苯-1,2-二硫酚;半胱氨酸;蛋氨酸;谷胱甘肽;胱氨酸;或其盐或溶剂化物。
在一方面,以上所描述的这种化合物对纤维素材料的有效量,作为与纤维素的葡糖基单元的摩尔比是约10-6至约10,例如,约10-6至约7.5、约10-6至约5、约10-6至约2.5、约10-6至约1、约10-5至约1、约10-5至约10-1、约10-4至约10-1、约10-3至约10-1、或约10-3至约10-2。在另一方面,以上所描述的这种化合物的有效量是约0.1μM至约1M,例如,约0.5μM至约0.75M、约0.75μM至约0.5M、约1μM至约0.25M、约1μM至约0.1M、约5μM至约50mM、约10μM至约25mM、约50μM至约25mM、约10μM至约10mM、约5μM至约5mM、或约0.1mM至约1mM。
术语“液体”是指在如在此所述的条件下,由木质纤维素和/或半纤维素材料或其单糖(例如,木糖、阿拉伯糖、甘露糖等)在浆料中的处理产生的水性、有机、或其组合的溶液相,及其可溶性内容物。用于GH61多肽的纤维素分解增强的液剂可以通过,任选在催化剂(例如酸)的存在下、任选在有机溶剂的存在下、并且任选与物理破坏一种木质纤维素或半纤维素材料(或原料)组合,通过施加热和/或压力来对该材料进行处理,并且然后将溶液与残余固体分离来产生。在由纤维素酶制剂对纤维素底物的水解过程中,从液剂与GH61多肽的组合中可得到纤维素分解增强的程度是由这类条件决定的。可以使用本领域的标准方法,如过滤、沉淀或离心,而将液剂与经过处理的材料进行分离。
在一方面,对于纤维素来说的液体的有效量是约10-6至约10g/g的纤维素,例如约10-6至约7.5g、约10-6至约5g、约10-6至约2.5g、约10-6至约1g、约10-5至约1g、约10-5至约10- 1g、约10-4至约10-1g、约10-3至约10-1g、或约10-3至约10-2g/g的纤维素。
在一方面,该一种或多种(例如,若干种)半纤维素分解酶包括商业半纤维素分解酶制剂。适于在本发明中使用的商业化半纤维素分解酶制剂的实例包括例如SHEARZYMETM(诺维信公司)、HTec(诺维信公司)、HTec2(诺维信公司)、HTec3(诺维信公司)、(诺维信公司)、(诺维信公司)、HC(诺维信公司)、木聚糖酶(杰能科公司)、XY(杰能科公司)、XC(杰能科公司)、TX-200A(AB酶公司(AB Enzymes))、HSP 6000木聚糖酶(DSM)、DEPOLTM333P(生物催化剂有限公司(Biocatalysts Limit),威尔士,英国)、DEPOLTM740L(生物催化剂有限公司,英国威尔士)以及DEPOLTM762P(生物催化剂有限公司,英国威尔士)。
有用于本发明的方法的木聚糖酶的实例包括但不限于来自以下各项的木聚糖酶:棘孢曲霉(GeneSeqP:AAR63790;WO 94/21785)、烟曲霉(WO 2006/078256)、嗜松青霉菌(WO2011/041405)、青霉菌属种(WO 2010/126772)、土生梭孢壳霉NRRL 8126(WO 2009/079210)以及褐孢长毛盘菌(Trichophaea saccata)GH10(WO 2011/057083)。
有用于本发明的方法的β-木糖苷酶的实例包括但不限于来自以下各项的β-木糖苷酶:粗糙链孢菌(SwissProt登录号Q7SOW4)、里氏木霉(UniProtKB/TrEMBL登录号Q92458)以及埃默森踝节菌(Talaromyces emersonii)(SwissProt登录号Q8X212)。
可用于本发明的工艺中的乙酰木聚糖酯酶的实例包括但不限于来自以下各项的乙酰木聚糖酯酶:棘孢曲霉(WO 2010/108918)、球毛壳菌(Uniprot登录号Q2GWX4)、细丽毛壳(GeneSeqP登录号AAB82124)、特异腐质霉DSM 1800(WO 2009/073709)、红褐肉座菌(WO2005/001036)、嗜热毁丝霉(Myceliophtera thermophila)(WO 2010/014880)、粗糙脉孢菌(UniProt登录号q7s259)、颖枯壳针孢(Uniprot登录号Q0UHJ1)、以及太瑞斯梭孢壳霉NRRL8126(WO 2009/042846)。
可用于本发明的工艺中的阿魏酸酯酶(feruloyl esterase,ferulic acidesterase)的实例包括但不限于来自以下各项的阿魏酸酯酶:特异腐质霉DSM1800(WO2009/076122)、费希新萨托菌(Neosartorya fischeri)(UniProt登录号A1D9T4)、粗糙脉孢菌(UniProt登录号Q9HGR3)、黄灰青霉(WO 2009/127729)、以及太瑞斯梭孢壳霉(WO 2010/053838和WO 2010/065448)。
可用于本发明的工艺中的阿拉伯呋喃糖苷酶的实例包括但不限于来自以下各项的阿拉伯呋喃糖苷酶:黑曲霉(GeneSeqP登录号AAR94170)、特异腐质霉DSM 1800(WO 2006/114094和WO 2009/073383)、以及巨芒(M.giganteus)(WO 2006/114094)。
可用于本发明的工艺中的α-葡萄糖醛酸酶的实例包括但不限于来自以下各项的α-葡萄糖醛酸酶:棒曲霉(UniProt登录号alcc12)、烟曲霉(SwissProt登录号Q4WW45)、黑曲霉(Uniprot登录号Q96WX9)、土曲霉(SwissProt登录号Q0CJP9)、特异腐质霉(WO 2010/014706)、黄灰青霉(WO 2009/068565)、埃默森篮状菌(UniProt登录号Q8X211)、以及里氏木霉(Uniprot登录号Q99024)。
有用于本发明的方法中的具有酶活性的多肽可以通过在包含适合的碳源和氮源以及无机盐的营养培养基上,使用本领域已知的程序发酵上面指出的微生物菌株来产生(参见例如,班尼特(Bennett),J.W.和拉素尔(LaSure),L.(编辑),真菌中的更多基因操作(More Gene Manipulations in Fungi),学术出版社(Academic Press),加利福尼亚州,1991)。合适的培养基可从供应商获得,或可根据已公开组合物制备(例如美国典型培养物保藏中心的目录)。适合于生长和酶产生的温度范围和其他条件在本领域中是已知的(参见,例如,贝利·J.E.(Bailey,J.E.)和奥利斯·D.F.(Ollis,D.F.),生物化学工程基础(Biochemical Engineering Fundamentals),麦格劳-希尔图书公司(McGraw-Hill BookCompany),纽约,1986)。
发酵可以是导致酶或蛋白质的表达或分离的培养细胞的任何方法。所以,可以将发酵理解为包括摇瓶培养,或者在一种适合的培养基中并且在允许表达或分离该酶的条件下在实验室或工业发酵罐中进行小规模或大规模发酵(包括连续发酵、分批发酵、分批补料发酵或固态发酵)。通过上述方法产生的所得酶可以从发酵培养基回收并且通过常规程序纯化。
发酵。可以通过能够将糖直接或间接发酵成所希望的发酵产物的一种或多种(例如,若干种)发酵微生物发酵从水解的纤维素材料获得的可发酵糖。“发酵”或“发酵方法”指任何发酵方法或包括发酵步骤的任何方法。发酵方法还包括用于消费品醇工业(例如,啤酒和葡萄酒)、乳品业(例如,发酵乳产品)、皮革业和烟草业的发酵方法。发酵条件取决于所希望的发酵产物和发酵生物,并且可以由本领域的普通技术人员容易地确定。
在发酵步骤中,作为预处理和酶水解步骤的结果从纤维素材料释放的糖,通过发酵生物体(如酵母)发酵成为产物,例如,乙醇。如上所述,水解(糖化)和发酵可以是分开的或同时的。
在实践本发明的发酵步骤中可以使用任何适合的水解的纤维素材料。通常基于所希望的发酵产物(即,要从发酵获得的物质)和所采用的方法来选择材料,如本领域中所熟知的。
术语“发酵培养基”在此可理解为指在添加一种或多种发酵微生物之前的培养基,如,由糖化过程产生的培养基,以及在同时糖化和发酵过程(SSF)中使用的培养基。
“发酵微生物”是指适用于所希望的发酵方法以产生发酵产物的任何微生物,包括细菌和真菌生物。发酵生物可以是己糖和/或戊糖发酵生物、或其组合。己糖和戊糖发酵生物二者均是本领域中所熟知的。适合的发酵微生物能够将糖(如葡萄糖、木糖、木酮糖、阿拉伯糖、麦芽糖、甘露糖、半乳糖、和/或寡糖)直接或间接地发酵(即,转化)成所希望的发酵产物。
由林(Lin)等人,2006,应用微生物学与生物技术(Appl.Microbiol.Biotechnol.)69:627-642描述了产生乙醇的细菌和真菌发酵生物的实例。
能够发酵己糖的发酵微生物的实例包括细菌生物和真菌生物,如酵母。优选的酵母包括假丝酵母属、克鲁维酵母菌属、以及酿酒酵母属(Saccharomyces)的菌株,例如萨纳瑞西斯假丝酵母(Candida sonorensis)、马克思克鲁维酵母、以及酿酒酵母。
可以发酵处于其原生状态的戊糖的发酵微生物的实例包括细菌和真菌生物,如某一种酵母。优选的发酵木糖的酵母包括假丝酵母属的菌株,优选是休哈塔假丝酵母(C.sheatae)或萨纳瑞西斯假丝酵母(C.sonorensis);以及毕赤酵母属的菌株,优选是树干毕赤酵母,例如树干毕赤酵母CBS 5773。优选的戊糖发酵酵母包括管囊酵母属(Pachysolen)菌株,优选嗜鞋管囊酵母(P.tannophilus)。不能发酵戊糖(如木糖和阿拉伯糖)的生物体可以通过本领域已知方法来进行遗传修饰而发酵戊糖。
可以将己糖和戊糖有效地发酵为乙醇的细菌的实例包括例如凝结芽孢杆菌、丙酮丁醇梭杆菌、热纤维梭菌、弗陶菲尔门塔斯梭菌(Clostridium phytofermentans)、土芽孢杆菌属、嗜热厌氧糖分解菌(Thermoanaerobacter saccharolyticum)、以及运动发酵单胞菌(菲利普斯(Philippidis),1996,同上)。
其他发酵生物体包括以下各项的菌株:芽孢杆菌属,如凝结芽孢杆菌;假丝酵母属,如萨纳瑞西斯假丝酵母、甲醇山梨糖假丝酵母、迪丹斯假丝酵母、近平滑假丝酵母(Candida parapsilosis)、内德顿卓假丝酵母(C.naedodendra)、布朗克假丝酵母、嗜虫假丝酵母、芸薹假丝酵母、假热带假丝酵母、博伊丁假丝酵母、产朊假丝酵母、以及休哈塔假丝酵母;梭菌属,如丙酮丁醇梭菌、热纤维梭菌、以及发酵植物多糖梭菌;大肠杆菌,特别是已被遗传修饰以改进乙醇产率的大肠杆菌菌株;土芽孢杆菌属种;汉逊酵母属,如异常汉逊酵母;克雷伯氏菌属,如产酸克雷伯氏菌;克鲁维酵母属,如马克斯克鲁维酵母、乳酸克鲁维酵母、耐热克鲁维酵母、以及脆壁克鲁维酵母;裂殖酵母属,如粟酒裂殖酵母(S.pombe);热厌氧杆菌属(Thermoanaerobacter),如解糖热厌氧杆菌、以及发酵单胞菌属(Zymomonas),如运动发酵单胞菌。
在一个优选的方面,酵母是酒香酵母属(Bretannomyces)。在一个更优选方面,酵母是克劳森酒香酵母(Bretannomyces clausenii)。在另一个优选方面,酵母是假丝酵母。在另一个更优选方面,酵母是萨纳瑞西斯假丝酵母。在另一个更优选方面,酵母是博伊丁假丝酵母。在另一个更优选方面,酵母是布朗克假丝酵母。在另一个更优选方面,酵母是芸薹假丝酵母。在另一个更优选方面,酵母是迪丹斯假丝酵母。在另一个更优选方面,酵母是嗜虫假丝酵母。在另一个更优选方面,酵母是假热带假丝酵母。在另一个更优选方面,酵母是休哈塔假丝酵母。在另一个更优选方面,酵母是产朊假丝酵母。在另一个优选方面,酵母是棒孢酵母属(Clavispora)。在另一个更优选方面,酵母是葡萄牙棒孢酵母(Clavisporalusitaniae)。在另一个更优选方面,酵母是仙人掌棒孢酵母(Clavispora opuntiae)。在另一个优选方面,酵母是克鲁维酵母属。在另一个更优选方面,酵母是脆壁克鲁维酵母。在另一个更优选方面,酵母是马克斯克鲁维酵母。在另一个更优选方面,酵母是耐热克鲁维酵母。在另一个优选方面,酵母是管囊酵母属。在另一个更优选方面,酵母是嗜鞣管囊酵母。在另一个优选方面,酵母是毕赤酵母属。在另一个优选方面,酵母是树干毕赤酵母。在另一个优选方面,酵母是酵母属种。在另一个更优选方面,酵母是酿酒酵母。在另一个更优选方面,酵母是糖化酵母(Saccharomyces distaticus)。在另一个更优选方面,酵母是葡萄汁酵母(Saccharomyces uvarum)。
在一个优选方面,细菌是芽孢杆菌属。在一个更优选方面,细菌是凝结芽孢杆菌。在另一个优选方面,细菌是梭菌属。在另一个更优选方面,细菌是丙酮丁醇梭菌。在另一个更优选方面,细菌是Clostridium phytofermentans。在另一个更优选方面,细菌是热纤维梭菌。在另一个更优选方面,细菌是土芽孢杆菌属种。在另一个更优选方面,细菌是热厌氧杆菌属。在另一个更优选方面,细菌是解糖热厌氧杆菌。在另一个优选方面,细菌是发酵单胞菌属。在另一个更优选方面,细菌是运动发酵单胞菌。
可商购的适合乙醇生产的酵母包括例如,BIOFERMTM AFT和XR(NABC-北美生物产品股份有限公司(North American Bioproducts Corporation),佐治亚州,美国)、ETHANOLREDTM酵母(弗曼迪斯/乐斯福公司(Fermentis/Lesaffre),美国)、FALITM(弗莱希曼氏酵母公司(Fleischmann’s Yeast),美国)、FERMIOLTM(DSM专业公司(DSM Specialties))、GERTSTRANDTM(格特 特兰德AB公司(Gert Strand AB),瑞典)、以及SUPERSTARTTM和THERMOSACCTM新鲜酵母(乙醇技术公司(Ethanol Technology),威斯康星州,美国)。
在一个优选的方面,发酵微生物已经经过遗传修饰,提供发酵戊糖的能力,如利用木糖、利用阿拉伯糖和共同利用木糖和阿拉伯糖的微生物。
通过将异源基因克隆进不同发酵微生物已经构建了能够将己糖和戊糖转化为乙醇(共发酵)的生物体(陈(Chen)和何(Ho),1993,在酿酒酵母中克隆和改进树干毕赤酵母木糖还原酶基因的表达(Cloning and improving the expression of Pichia stipitisxylose reductase gene in Saccharomyces cerevisiae),应用生物化学与生物技术(Appl.Biochem.Biotechnol.)39-40:135-147;霍等人,1998,能够有效共发酵葡萄糖和木糖的遗传工程化的酵母菌属酵母(Genetically engineered Saccharomyces yeastcapable of effectively cofermenting glucose and xylose),应用与环境微生物学64:1852-1859;科特(Kotter)和西拉塞(Ciriacy),1993,酿酒酵母发酵木糖(Xylosefermentation by Saccharomyces cerevisiae),应用微生物学与生物技术(Appl.Microbiol.Biotechnol.)38:776-783;维尔福森(Walfridsson)等人,1995,过表达编码戊糖磷酸途径酶转酮醇酶和转醛醇酶的TKL1和TAL1基因的木糖代谢酿酒酵母菌株(Xylose-metabolizing Saccharomyces cerevisiae strains overexpressing theTKL1and TAL1genes encoding the pentose phosphate pathway enzymestransketolase and transaldolase),应用与环境微生物学61:4184-4190;凯珀(Kuyper)等人,2004,用于有效厌氧木糖发酵的酿酒酵母的最小代谢工程化:原理的证实(Minimalmetabolic engineering of Saccharomyces cerevisiae for efficient anaerobicxylose fermentation:a proof of principle),欧洲微生物学会联合会酵母研究(FEMSYeast Research)4:655-664;比尔(Beall)等人,1991,通过重组大肠杆菌从木糖和其他糖产生乙醇的参数研究(Parametric studies of ethanol production from xylose andother sugars by recombinantEscherichia coli),生物技术与生物工程(Biotech.Bioeng.)38:296-303;英格拉姆(Ingram)等人,1998,用于乙醇产生的细菌的代谢工程化(Metabolic engineering of bacteria for ethanol production),生物技术与生物工程58:204-214;张(Zhang)等人,1995,产生乙醇的运动发酵单胞菌中戊糖代谢途径的代谢工程化(Metabolic engineering of a pentose metabolism pathway inethanologenic Zymomonas mobilis),科学(Science)267:240-243;狄安妲(Deanda)等人,1996,通过代谢途径工程化开发发酵阿拉伯糖的运动发酵单胞菌菌株(Development of anarabinose-fermenting Zymomonas mobilis strain by metabolic pathwayengineering),应用与环境微生物学62:4465-4470;WO 2003/062430,木糖异构酶)。
在一个优选方面,遗传修饰的发酵微生物是萨纳瑞西斯假丝酵母。在另一个优选方面,遗传修饰的发酵微生物是大肠杆菌。在另一个优选方面,遗传修饰的发酵微生物是产酸克雷伯氏菌(Klebsiella oxytoca)。在另一个优选方面,遗传修饰的发酵微生物是马克斯克鲁维酵母。在另一个优选方面,遗传修饰的发酵微生物是酿酒酵母。在另一个优选方面,遗传修饰的发酵微生物是运动发酵单胞菌。
本领域中公知的是,上述生物体还能用于产生其他物质,如本文所述。
典型地向降解的纤维素材料或水解物中添加发酵微生物,并且进行发酵持续约8至约96小时,例如约24至约60小时。温度典型地在约26℃至约60℃之间,例如约32℃或50℃,并且pH为约pH 3至约pH 8,例如pH 4至5、6或7。
在一方面,应用酵母和/或另一种微生物至降解的纤维素材料并且进行发酵,持续约12至约96小时,例如典型地24-60小时。在另一方面,温度优选在约20℃至约60℃之间,例如约25℃至约50℃、约32℃至约50℃、或约32℃至约50℃,并且pH通常是从约pH 3至约pH7,例如约pH 4至约pH 7。然而,一些发酵生物体例如细菌,具有更高的最适发酵温度。酵母或另一种微生物优选以每ml发酵液大约105至1012,优选从大约107至1010,特别是大约2×108个活细胞计数的量施用。关于使用酵母进行发酵的进一步指南可以见于例如“醇教材(The Alcohol Textbook)”(K·雅克(K.Jacques)、T.P.里昂(Lyons)以及D.R.凯尔索尔(Kelsall)编辑,诺丁汉大学出版社(Nottingham University Press),英国(UnitedKingdom)1999),将其通过引用结合在此。
发酵刺激剂可以与在此所述的任何方法组合使用,以进一步改进发酵工艺,而且特定地,改进发酵微生物的性能,如,速率增加和乙醇得率。“发酵刺激剂”是指用于发酵微生物(特别是酵母)生长的刺激剂。用于生长的优选发酵刺激剂包括维生素和矿物质。维生素的实例包括多种维生素、生物素、泛酸、烟酸、内消旋肌醇、硫胺素、吡哆醇、对氨基苯酸、叶酸、核黄素、以及维生素A、B、C、D和E。例如参见阿尔弗雷多(Alfenore)等人,通过在进料分批方法过程中的一种维生素进料策略改进乙醇产生和酿酒酵母的存活力(Improvingethanol production and viability of Saccharomyces cerevisia by a vitaminfeeding strategy during fed-batch process),施普林格(2002),其通过引用结合在此。矿物质的实例包括可以供应包括P、K、Mg、S、Ca、Fe、Zn、Mn和Cu营养素的矿物质和矿物盐。
发酵产物:发酵产物可以是由发酵得到的任何物质。发酵产物可以是,不限于,醇(例如,阿拉伯醇、正丁醇、异丁醇、乙醇、甘油、甲醇、乙二醇、1,3-丙二醇(丙二醇)、丁二醇、丙三醇、山梨醇和木糖醇);链烷烃(例如,戊烷、己烷、庚烷、辛烷、壬烷、癸烷、十一烷、以及十二烷)、环烷烃(例如,环戊烷、环己烷、环庚烷、以及环辛烷)、链烯烃(例如,戊烯、己烯、庚烯、以及辛烯);氨基酸(例如,天冬氨酸、谷氨酸、甘氨酸、赖氨酸、丝氨酸和苏氨酸);气体(例如,甲烷、氢气(H2)、二氧化碳(CO2)、以及一氧化碳(CO));异戊二烯;酮(例如,丙酮);有机酸(例如,乙酸、醋酮酸、己二酸、抗坏血酸、柠檬酸、2,5-二酮-D-葡糖酸、甲酸、反丁烯二酸、葡糖二酸、葡糖酸、葡糖醛酸、戊二酸、3-羟基丙酸、衣康酸、乳酸、苹果酸、丙二酸、草酸、草酰乙酸、丙酸、琥珀酸和木糖酸);和聚酮化合物。发酵产物还可以是作为高价值产品的蛋白质。
在一个优选的方面,发酵产物是一种醇。可理解的是,术语“醇”包括包含一个或多个羟基基团的物质。在更优选的方面,该醇是正丁醇。在另一个更优选的方面,该醇是异丁醇。在另一个更优选方面,该醇是乙醇。在另一个更优选方面,该醇是甲醇。在另一个更优选方面,该醇是阿拉伯糖醇。在另一个更优选方面,该醇是丁二醇。在另一个更优选方面,该醇是乙二醇。在另一个更优选方面,该醇是丙三醇。在另一个更优选方面,该醇是甘油。在另一个更优选方面,该醇是1,3-丙二醇。在另一个更优选方面,该醇是山梨醇。在另一个更优选方面,该醇是木糖醇。参见,例如,贡·C.S.、卡奥·N.J.、杜·J.、以及曹·G.T.,1999,由可再生资源生产乙醇,生物化学工程/生物技术的进展,舍佩尔·T.编辑,施普林格,德国海德堡柏林,65:207-241;西尔韦拉·M.M.(Silveira,M.M.)和乔纳斯·R.(Jonas,R.),2002,山梨糖醇的生物技术生产(The biotechnological production of sorbitol),应用微生物学与生物技术59:400-408;尼加姆·P.(Nigam,P.)和辛格·D.,1995,用于木糖醇-一种糖替代品的发酵产生工艺(Processes for fermentative production of xylitol-a sugarsubstitute),加工生物化学(Process Biochemistry)30(2):117-124;伊泽吉·T.C.(Ezeji,T.C.)、库雷希·N.(Qureshi,N.)和布拉舍克·H.P.(Blaschek,H.P.),2003,通过拜季林斯基羧菌BA101生产丙酮、丁醇和乙醇并且通过气提原位回收(Production ofacetone,butanol and ethanol by Clostridium beijerinckii BA101and in siturecovery by gas stripping),微生物与生物技术世界杂志(World Journal ofMicrobiology and Biotechnology)19(6):595-603。
在另一个优选的方面,该发酵产物是烷烃。该烷烃可以是非支链或支链烷烃。在另一个更优选方面,该烷烃是戊烷。在另一个更优选方面,该烷烃是己烷。在另一个更优选方面,该烷烃是庚烷。在另一个更优选方面,该烷烃是辛烷。在另一个更优选方面,该烷烃是壬烷。在另一个更优选方面,该烷烃是癸烷。在另一个更优选方面,该烷烃是十一烷。在另一个更优选方面,该烷烃是十二烷。
在另一个优选方面,发酵产物是一种环烷烃。在另一个更优选方面,该环烷烃是环戊烷。在另一个更优选方面,该环烷烃是环己烷。在另一个更优选方面,该环烷烃是环庚烷。在另一个更优选方面,该环烷烃是环辛烷。
在另一个优选方面,发酵产物是一种烯烃。该烯烃可以是非支链或支链烯烃。在另一个更优选方面,该烯烃是戊烯。在另一个更优选方面,该烯烃是己烯。在另一个更优选方面,该烯烃是庚烯。在另一个更优选方面,该烯烃是辛烯。
在另一个优选方面,发酵产物是一种氨基酸。在另一个更优选方面,该有机酸是天冬氨酸。在另一个更优选方面,该氨基酸是谷氨酸。在另一个更优选方面,该氨基酸是甘氨酸。在另一个更优选方面,该氨基酸是赖氨酸。在另一个更优选方面,该氨基酸是丝氨酸。在另一个更优选方面,该氨基酸是苏氨酸。参见,例如,理查德·A.(Richard,A.)和马加里蒂斯·A.(Margaritis,A.),2004,用于聚(谷氨酸)产生和其他微生物生物聚合物的分批发酵动力学的经验模型(Empirical modeling of batch fermentation kinetics for poly(glutamic acid)production and other microbial biopolymers),生物技术与生物工程87(4):501-515。
在另一个优选的方面,该物质是气体。在另一个更优选方面,该气体是甲烷。在另一个更优选方面,该气体是H2。在另一个更优选方面,该气体是CO2。在另一个更优选方面,该气体是CO。参见,例如,片冈·N.(Kataoka,N.)、A·米亚(A.Miya)、以及K·桐山(K.Kiriyama),1997,关于通过产氢厌氧细菌连续培养系统产生氢气的研究(Studies onhydrogen production by continuous culture system of hydrogen-producinganaerobic bacteria),水科学与技术(Water Science and Technology)36(6-7):41-47;以及古那森兰·V.N.(Gunaseelan V.N.),生物质与生物能源(Biomass and Bioenergy),第13(1-2)卷,第83-114页,1997,用于甲烷生产的生物质的厌氧消化:综述(Anaerobicdigestion of biomass for methane production:A review)。
在另一个优选方面,该发酵产物是异戊二烯。
在另一个优选方面,发酵产物是一种酮。应理解的是,术语“酮”涵盖包含一个或多个酮部分的物质。在另一个更优选方面,该酮是丙酮。参见,例如,库雷希和布拉舍克,2003,见上文。
在另一个优选方面,发酵产物是有机酸。在另一个更优选方面,该有机酸是乙酸。在另一个更优选方面,该有机酸是醋酮酸。在另一个更优选方面,该有机酸是己二酸。在另一个更优选方面,该有机酸是抗坏血酸。在另一个更优选方面,该有机酸是柠檬酸。在另一个更优选方面,该有机酸是2,5-二酮-D-葡糖酸。在另一个更优选方面,该有机酸是甲酸。在另一个更优选方面,该有机酸是反丁烯二酸。在另一个更优选方面,该有机酸是葡糖二酸。在另一个更优选方面,该有机酸是葡糖酸。在另一个更优选方面,该有机酸是葡糖醛酸。在另一个更优选方面,该有机酸是戊二酸。在另一个更优选方面,该有机酸是3-二羟基丙酸。在另一个更优选方面,该有机酸是衣康酸。在另一个更优选方面,该有机酸是乳酸。在另一个更优选方面,该有机酸是苹果酸。在另一个更优选方面,该有机酸是丙二酸。在另一个更优选方面,该有机酸是草酸。在另一个更优选方面,该有机酸是丙酸。在另一个更优选方面,该有机酸是琥珀酸。在另一个更优选方面,该有机酸是木糖酸。参见,例如,陈,·R.(Chen,R.)和李·Y.Y.,1997,用于由纤维素生物质产生乳酸的膜介导的萃取发酵(Membrane-mediated extractive fermentation for lactic acid production from cellulosicbiomass),应用生物化学与生物技术63-65:435-448。
在另一个优选方面,该发酵产物是聚酮化合物。
回收。可以使用本领域中已知的任何方法可任选地从发酵培养基回收一种或多种发酵产物,这些方法包括但不限于,层析法、电泳程序、差别溶解度、蒸馏、或提取。例如,通过常规蒸馏方法从发酵的纤维素材料中分离和纯化醇。可以获得具有高达约96vol.%的纯度的乙醇,这可以用作例如燃料乙醇、引用乙醇,即饮用中性乙醇、或工业乙醇。
植物
本发明还涉及分离的植物,例如转基因植物、植物部分或植物细胞,这些植物包括本发明的多肽,从而表达并且产生可回收的量的本发明的碳水化合物结合模块变体、纤维二糖水解酶变体或杂合多肽。该变体可以从植物或植物部分回收。可替代地,包含该变体的植物或植物部分可以按原样用于改进食品或进料的质量,例如,改进营养价值、可口性以及流变特性,或用以破坏抗营养因子。
转基因植物可以是双子叶的(双子叶植物)或单子叶的(单子叶植物)。单子叶植物的实例是草,如草甸草(蓝草,早熟禾属);饲草,如羊茅属(Festuca)、黑麦草属(Lolium);温带草,如翦股颖属(Agrostis);以及谷类,例如小麦、燕麦、黑麦、大麦、稻、高粱、以及玉蜀黍(玉米)。
双子叶植物的实例是烟草、豆类(如羽扇豆(lupins)、马铃薯、糖甜菜(sugarbeet)、豌豆、豆(bean)和大豆(soybean))、以及十字花科植物(十字花科(familyBrassicaceae))(如花椰菜、油菜籽、以及紧密相关的模式生物拟南芥)。
植物部分的实例是茎、愈伤组织、叶、根、果实、种子、以及块茎、以及包括这些部分的独立组织,例如,表皮、叶肉、薄壁组织(parenchyme)、维管组织、分生组织。特定植物细胞区室,如叶绿体、质外体(apoplast)、线粒体、液泡、过氧化物酶体以及细胞质也被认为是植物部分。此外,任何植物细胞,无论是何种组织来源,都被认为是植物部分。同样地,植物部分,如分离以有助于本发明的利用的特定组织和细胞也被认为是植物部分,例如胚、胚乳、糊粉和种皮。
同样包括于本发明范围内的是此类植物、植物部分以及植物细胞的子代。
表达变体的转基因植物或植物细胞可以根据本领域已知的方法来构建。简而言之,通过如下方法构建该植物或植物细胞:将编码变体的一个或多个表达构建体并入到植物宿主基因组或叶绿体基因组中,并且使所得的修饰植物或植物细胞繁殖为转基因植物或植物细胞。
表达构建体宜为包括编码变体的多核苷酸的核酸构建体,该多核苷酸与在选择的植物或植物部分中表达该多核苷酸所需的适当的调节序列可操作地连接。而且,表达构建体可包括用于鉴定整合了此表达构建体的植物细胞的选择性标记,和将此构建体引入所讨论的植物所必需的DNA序列(后者取决于所用的引入DNA的方法)。
例如,基于希望在何时、何处、以及如何表达该变体来确定对调节序列如启动子和终止子序列和任选的信号或转运序列的选择。例如,编码变体的基因的表达可以是组成型的或诱导型的,或可以是发育、阶段或组织特异性的,并且可以使基因产物靶向特定组织或植物部分,如种子或叶。调节序列由例如塔格(Tague)等人,1988,植物生理学(PlantPhysiology)86:506描述。
对于组成型表达,可以使用35S-CaMV、玉米泛素1、或稻肌动蛋白1启动子(弗兰克(Franck)等人,1980,细胞(Cell)21:285-294;克里斯滕森(Christensen)等人,1992,植物分子生物学(Plant Mol.Biol.)18:675-689;张(Zhang)等人,1991,植物细胞(Plant Cell)3:1155-1165)。器官特异性启动子可以是以下各项的启动子,例如来自贮藏库组织(例如种子、马铃薯块茎、和果实)(爱德华兹(Edwards)和科鲁兹(Coruzzi),1990,遗传学年鉴(Ann.Rev.Genet.)24:275-303),或来自代谢库组织(例如分生组织)(伊藤(Ito)等人,1994,植物分子生物学(Plant Mol.Biol.)24:863-878)的启动子,种子特异性启动子,例如来自稻的谷蛋白、醇溶谷蛋白、球蛋白或白蛋白启动子(吴(Wu)等人,1998,植物与细胞生理学(Plant Cell Physiol.)39:885-889),来自豆球蛋白B4的蚕豆启动子和来自蚕豆的未知种子蛋白基因(康拉德(Conrad)等人,1998,植物生理学杂志(J.Plant Physiol.)152:708-711),来自种子油体蛋白的启动子(陈(Chen)等人,1998,植物与细胞生理学(Plant CellPhysiol.)39:935-941),来自欧洲油菜的贮藏蛋白napA启动子,或本领域已知的任何其他种子特异性启动子,例如,如在WO 91/14772中所描述的。此外,启动子可以是叶特异性启动子,如来自稻或番茄的rbcs启动子(京冢(Kyozuka)等人,1993,植物生理学(PlantPhysiol.)102:991-1000)、小球藻病毒腺嘌呤甲基转移酶基因启动子(麦卓(Mitra)和希金斯(Higgins),1994,植物分子生物学26:85-93)、来自稻的aldP基因启动子(加贺屋(Kagaya)等人,1995,分子遗传学与基因组学(Mol.Gen.Genet.)248:668-674)、或伤口诱导型启动子(如马铃薯pin2启动子)(许(Xu)等人,1993,植物分子生物学22:573-588)。同样,该启动子可以通过如温度、干旱或盐度变化等非生物处理来诱导,或通过外源地施加使该启动子活化的物质(例如乙醇;雌激素;植物激素,如乙烯、脱落酸及赤霉酸;及重金属)来诱导。
启动子增强子元件也可以用于实现变体在植物中的较高表达。例如,启动子增强子元件可以是置于启动子与编码变体的多核苷酸之间的内含子。例如,许(Xu)等人,1993,见上文,披露了使用稻肌动蛋白1基因的第一内含子以增强表达。
该选择性标记基因及该表达构建体的任何其他部分可以选自本领域中可用的那些。
可以根据本领域中已知的常规技术将核酸构建体结合到植物基因组中,这些常规技术包括土壤杆菌介导的转化、病毒介导的转化、微注射、粒子轰击、生物射弹转化、以及电穿孔(加塞尔(Gasser)等人,1990,科学(Science)244:1293;波特里库斯(Potrykus),1990,生物/技术(Bio/Technology)8:535;岛本(Shimamoto)等人,1989,自然(Nature)338:274)。
目前根癌土壤杆菌介导的基因转移是用于产生转基因双子叶植物(关于综述,请参见霍伊卡(Hooykas)和施尔伯鲁特(Schilperoort),1992,植物分子生物学(PlantMol.Biol.)19:15-38)并且用于转化单子叶植物的方法,但对于这些植物还常常使用其他的转化方法。用于产生转基因单子叶植物的方法是粒子(涂覆有转化DNA的微观金或钨粒子)轰击胚愈伤组织或发育中的胚(克里斯托(Christou),1992,植物杂志(Plant J.)2:275-281;岛本,1994,生物技术当前述评(Curr.Opin.Biotechnol.)5:158-162;瓦西尔(Vasil)等人,1992,生物/技术(Bio/Technology)10:667-674)。用于转化单子叶植物的替代方法是基于原生质体转化,如由奥米儒勒(Omirulleh)等人,1993,植物分子生物学(Plant Mol.Biol.)21:415-428所描述。另外的转化方法包括美国专利号6,395,966和7,151,204(两者都通过引用以其全文结合于此)中所描述的那些。
在转化后,根据本领域熟知的方法选出已并入了表达构建体的转化体,并使其再生成为完整植物。通常设计转化程序用于通过如下方法在再生期间或在后续世代中选择性消除选择基因:例如,使用带有两个独立的T-DNA构建体的共转化或利用特异性重组酶位点特异性地切除选择基因。
除用本发明的构建体直接转化具体植物基因型之外,还可以通过使具有构建体的植物与缺乏该构建体的第二植物杂交来产生转基因植物。例如,可以通过杂交将编码变体的构建体引入特定植物品种中,无需总是直接地转化该给定品种的植物。因此,本发明不仅涵盖了从根据本发明已经转化的细胞直接再生的植物,而且还涵盖了此类植物的后代。如在此使用的,后代可以是指根据本发明制备的亲本植物的任何代的后代。此类后代可以包括根据本发明制备的DNA构建体。杂交导致通过供体植物系与起始系交叉授粉,将转基因引入植物系。此类步骤的非限制性实例描述于美国专利号7,151,204中。
植物可以通过回交转化方法生成。例如,植物包括被称为回交转化的基因型、种系、近交体、或杂交体的植物。
可以使用遗传标记以协助本发明的一种或多种转基因从一个遗传背景渗入到另一个。标记协助的选择提供了相对于常规育种的优势,在于其可以用于避免由表型变异导致的错误。另外,遗传标记可以在具体杂交的个别后代中提供有关良种种质相对程度的数据。例如,当具有所希望性状并且另外具有非农艺学所希望的遗传背景的植物与良种亲本杂交时,可以使用遗传标记来选择不仅具有感兴趣的性状,还具有相对较大比例所希望种质的后代。以此方式,使一种或多种性状渗入特定遗传背景所需的世代数得以最小化。
本发明还涉及产生本发明的变体的方法,包括:(a)在有助于产生该变体的条件下培养包含编码该变体的多核苷酸的转基因植物或植物细胞;并且(b)回收该变体。
可通过以下编号的段落进一步描述本发明:
[1]一种分离的碳水化合物结合模块(CBM)变体,其在对应于SEQ ID NO:4的位置5、13、31或32的一个或多个(例如,若干个)位置处包括取代,其中该变体具有碳水化合物结合活性。
[2]如段落[1]所述的变体,其是选自以下的亲本碳水化合物结合模块的变体:(a)与SEQ NO:4、SEQ NO:8、SEQ NO:12、SEQ NO:16、SEQ NO:20、SEQ NO:24或SEQ NO:28的碳水化合物结合模块具有至少60%序列一致性的碳水化合物结合模块;(b)由在至少低严格条件下与SEQ ID NO:3、SEQ ID NO:7、SEQ ID NO:11、SEQ ID NO:15、SEQ ID NO:19、SEQ IDNO:23或SEQ ID NO:27的碳水化合物结合模块编码序列或其全长互补体杂交的多核苷酸编码的碳水化合物结合模块;(c)由与SEQ ID NO:3、SEQ ID NO:7、SEQ ID NO:11、SEQ ID NO:15、SEQ ID NO:19、SEQ ID NO:23或SEQ ID NO:27的碳水化合物结合模块编码序列具有至少60%序列一致性的多核苷酸编码的碳水化合物结合模块。
[3]如段落[2]所述的变体,其中该碳水化合物结合模块与SEQ ID NO:4、SEQ IDNO:8、SEQ ID NO:12、SEQ ID NO:16、SEQ ID NO:20、SEQ ID NO:24或SEQ ID NO:28具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性。
[4]如段落[2]或[3]所述的变体,其中该亲本碳水化合物结合模块由以下多核苷酸编码,该多核苷酸在低严格条件、中严格条件、中-高严格条件、高严格条件、或非常高严格条件下与SEQ ID NO:3、SEQ ID NO:7、SEQ ID NO:11、SEQ ID NO:15、SEQ ID NO:19、SEQID NO:23、或SEQ ID NO:27、或其全长互补体杂交。
[5]如段落[2]-[4]中任一项所述的变体,其中该亲本碳水化合物结合模块是由以下多核苷酸编码的,该多核苷酸与SEQ ID NO:3、SEQ ID NO:7、SEQ ID NO:11、SEQ ID NO:15、SEQ ID NO:19、SEQ ID NO:23或SEQ ID NO:27的碳水化合物结合模块编码序列具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性。
[6]如段落[2]-[5]中任一项所述的变体,其中该亲本碳水化合物结合模块包括SEQ ID NO:4、SEQ ID NO:8、SEQ ID NO:12、SEQ ID NO:16、SEQ ID NO:20、SEQ ID NO:24、或SEQ ID NO:28或由其组成。
[7]如段落[2]-[6]中任一项所述的变体,其中该亲本碳水化合物结合模块是SEQID NO:4、SEQ ID NO:8、SEQ ID NO:12、SEQ ID NO:16、SEQ ID NO:20、SEQ ID NO:24、或SEQID NO:28的片段,其中该片段具有碳水化合物结合活性。
[8]如段落[2]-[7]中任一项所述的变体,其与该亲本碳水化合物结合模块的氨基酸序列具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但小于100%序列一致性。
[9]如段落[1]-[8]中任一项所述的变体,其与SEQ ID NO:4、SEQ ID NO:8、SEQ IDNO:12、SEQ ID NO:16、SEQ ID NO:20、SEQ ID NO:24或SEQ ID NO:28具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%,但小于100%序列一致性。
[10]如段落[1]-[9]中任一项所述的变体,其中该碳水化合物结合模块变体由28至36个氨基酸,例如28、29、30、31、32、33、34、35或36个氨基酸组成。
[11]如段落[1]-[10]中任一项所述的变体,其中取代的数目为1-4个,例如,1、2、3或4个取代。
[12]如段落[1]-[11]中任一项所述的变体,其在对应于SEQ ID NO:4的位置5的位置处包括取代。
[13]如段落[12]所述的变体,其中该取代是用Tyr、Phe或Trp进行的,如Trp(例如Y5W)。
[14]如段落[1]-[13]中任一项所述的变体,其在对应于SEQ ID NO:4的位置13的位置处包括取代。
[15]如段落[14]所述的变体,其中该取代是用Tyr、Phe或Trp进行的,如Trp(例如Y13W)。
[16]如段落[1]-[15]中任一项所述的变体,其在对应于SEQ ID NO:4的位置31的位置处包括取代。
[17]如段落[16]所述的变体,其中该取代是用Tyr、Phe或Trp进行的,如Trp(例如Y31W)。
[18]如段落[1]-[17]中任一项所述的变体,其在对应于SEQ ID NO:4的位置32的位置处包括取代。
[19]如段落[18]所述的变体,其中该取代是用Tyr、Phe或Trp进行的,如Trp(例如Y32W)。
[20]如段落[1]-[19]中任一项所述的变体,其包括在对应于位置5和31;5和32;13和31;13和32;或31和32的两个位置处的取代。
[21]如段落[20]所述的变体,其包括取代Y5W+Y13W;Y5W+Y31W;Y5W+Y32W;Y13W+Y31W;Y13W+Y32W;或Y31W+Y32W。
[22]如段落[1]-[19]中任一项所述的变体,其包括在对应于位置5、13和31;5、13和32;5、31和32;或13、31和32的三个位置处的取代。
[23]如段落[22]所述的变体,其包括取代Y5W、Y13W、+Y31W;Y5W、Y13W、+Y32W;Y5W、Y31W、+Y32W;或Y13W、Y31W、+Y32W。
[24]如段落[1]-[19]中任一项所述的变体,其包括在对应于位置5、13、31和32的所有四个位置处的取代。
[25]如段落[24]所述的变体,其包括取代Y5W、Y13W、Y31W和Y32W。
[26]如段落[1]-[25]中任一项所述的变体,其进一步包括在对应于SEQ ID NO:4的位置4、6和29的一个或多个(例如,若干个)位置处的取代。
[27]一种具有纤维素分解活性的分离的多肽,其包括段落[1]-[26]中任一项所述的碳水化合物结合模块变体。
[28]如段落[27]所述的多肽,其选自下组,该组由以下各项组成:内切葡聚糖酶、纤维二糖水解酶、以及GH61多肽。
[29]一种包括如段落[1]-[28]中任一项所述的变体的组合物。
[30]一种编码如段落[1]-[28]中任一项所述的变体的分离的多核苷酸。
[31]一种核酸构建体,其包含如段落[30]所述的多核苷酸。
[32]一种表达载体,其包含如段落[30]所述的多核苷酸。
[33]一种包含如段落[30]所述的多核苷酸的宿主细胞。
[34]一种产生变体的方法,该方法包括:在适合于该变体表达的条件下培养如段落[33]所述的宿主细胞。
[35]如段落[34]所述的方法,进一步包括回收该变体。
[36]一种用如段落[30]所述的多核苷酸转化的转基因植物、植物部分或植物细胞。
[37]一种产生如段落[1]-[28]中任一项所述的变体的方法,该方法包括:在有助于该变体产生的条件下培养包含编码该变体的多核苷酸的转基因植物、植物部分或植物细胞。
[38]如段落[37]所述的方法,进一步包括回收该变体。
[39]用于获得亲本碳水化合物结合模块变体的方法,该方法包括在对应于SEQ IDNO:4的位置5、13、31和32的一个或多个(例如,若干个)位置处向该碳水化合物结合模块引入取代,其中该变体具有碳水化合物结合活性;并且回收该变体。
[40]一种分离的纤维二糖水解酶变体,其在对应于SEQ ID NO:2的位置483、491、509或510的一个或多个(例如,若干个)位置处包括取代,其中该变体具有纤维二糖水解酶活性。
[41]如段落[40]所述的变体,该变体是选自以下的亲本纤维二糖水解酶的变体:(a)与SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:10、SEQ ID NO:14、SEQ ID NO:18、SEQ IDNO:22、SEQ ID NO:26、SEQ ID NO:42、SEQ ID NO:44或SEQ ID NO:78的成熟多肽具有至少60%序列一致性的多肽;(b)由在至少低严格条件下与以下杂交的多核苷酸编码的多肽:(i)SEQ ID NO:1、SEQ ID NO:5、SEQ ID NO:9、SEQ ID NO:13、SEQ ID NO:17、SEQ ID NO:21、SEQ ID NO:25、SEQ ID NO:41、SEQ ID NO:43或SEQ ID NO:77的成熟多肽编码序列,(ii)其基因组DNA或cDNA序列,或(iii)(i)或(ii)的全长互补体;(c)由与SEQ ID NO:1、SEQID NO:5、SEQ ID NO:9、SEQ ID NO:13、SEQ ID NO:17、SEQ ID NO:21、SEQ ID NO:25、SEQID NO:41、SEQ ID NO:43或SEQ ID NO:77的成熟多肽编码序列具有至少60%序列一致性的多核苷酸编码的多肽;以及(d)(a)、(b)或(c)的一个片段,该片段具有纤维二糖水解酶活性。
[42]如段落[41]所述的变体,其中该亲本纤维二糖水解酶与SEQ ID NO:2、SEQ IDNO:6、SEQ ID NO:10、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:22、SEQ ID NO:26、SEQ IDNO:42、SEQ ID NO:44、或SEQ ID NO:78的成熟多肽具有至少60%、至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
[43]如段落[41]或[42]所述的变体,其中该亲本纤维二糖水解酶由以下多核苷酸编码,该多核苷酸在低严格条件、中严格条件、中-高严格条件、高严格条件、或非常高严格条件下与(i)SEQ ID NO:1、SEQ ID NO:5、SEQ ID NO:9、SEQ ID NO:13、SEQ ID NO:17、SEQID NO:21、SEQ ID NO:25、SEQ ID NO:41、SEQ ID NO:43、或SEQ ID NO:77的成熟多肽编码序列;(ii)其基因组DNA或cDNA序列,或(iii)(i)或(ii)的全长互补体杂交。
[44]如段落[41]-[43]中任一项所述的变体,其中该亲本纤维二糖水解酶由以下多核苷酸编码,该多核苷酸与SEQ ID NO:1、SEQ ID NO:5、SEQ ID NO:9、SEQ ID NO:13、SEQID NO:17、SEQ ID NO:21、SEQ ID NO:25、SEQ ID NO:41、SEQ ID NO:43、或SEQ ID NO:77的成熟多肽编码序列或者其基因组DNA或cDNA序列具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
[45]如段落[41]-[44]中任一项所述的变体,其中该亲本纤维二糖水解酶包括SEQID NO:2、SEQ ID NO:6、SEQ ID NO:10、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:22、SEQID NO:26、SEQ ID NO:42、SEQ ID NO:44、或SEQ ID NO:78的成熟多肽或由其组成。
[46]如段落[41]-[44]中任一项所述的变体,其中该亲本纤维二糖水解酶是SEQID NO:2、SEQ ID NO:6、SEQ ID NO:10、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:22、SEQID NO:26、SEQ ID NO:42、SEQ ID NO:44、或SEQ ID NO:78的成熟多肽的一个片段,其中该片段具有纤维二糖水解酶活性。
[47]如段落[41]-[46]中任一项所述的变体,其与该亲本纤维二糖水解酶的氨基酸序列具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%、但小于100%序列一致性。
[48]如段落[40]-[47]所述的变体,该变体与SEQ ID NO:2、SEQ ID NO:6、SEQ IDNO:10、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:22、SEQ ID NO:26、SEQ ID NO:42、SEQ IDNO:44或SEQ ID NO:78的成熟多肽具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%,但小于100%序列一致性。
[49]如段落[40]-[48]中任一项所述的变体,其中该变体可以由310至537个氨基酸,例如320至330、330至340、340至350、350至360、360至370、370至380、380至390至390、490至400、400至415、415至425、425至435、435至445、445至455、455至465、465至475、475至485,485至495、495至505,505至515、515至525、或525至537个氨基酸组成。
[50]如段落[40]-[49]中任一项所述的变体,其中取代的数目为1-4个,例如,1、2、3或4个取代。
[51]如段落[40]-[50]中任一项所述的变体,该变体包括在对应于位置483的位置处的取代。
[52]如段落[51]所述的变体,其中该取代是用Tyr、Phe或Trp进行的,如Trp(例如Y483W)。
[53]如段落[40]-[52]中任一项所述的变体,该变体包括在对应于位置491的位置处的取代。
[54]如段落[53]所述的变体,其中该取代是用Tyr、Phe或Trp进行的,如Trp(例如Y491W)。
[55]如段落[40]-[54]中任一项所述的变体,该变体包括在对应于位置509的位置处的取代。
[56]如段落[55]所述的变体,其中该取代是用Tyr、Phe或Trp进行的,如Trp(例如Y509W)。
[57]如段落[40]-[56]中任一项所述的变体,该变体包括在对应于位置510的位置处的取代。
[58]如段落[57]所述的变体,其中该取代是用Tyr、Phe或Trp进行的,如Trp(例如Y510W)。
[59]如段落[40]-[58]中所述的变体,其包括在对应于位置483和491;483和509;483和510;4831和509;483和510;或509和510的两个位置处的取代。
[60]如段落[59]所述的变体,该变体包括取代Y483W+Y491W;Y483W+Y509W;Y483W+Y510W;Y483W+Y509W;Y483W+Y510W;或Y509W+Y510W。
[61]如段落[40]-[50]中任一项所述的变体,其包括在对应于位置483、491和509;483、491和510;483、509和510;或491、509和510的三个位置处的取代。
[62]如段落[61]所述的变体,该变体包括取代Y483W、Y491W、+Y509W;Y483W、Y491W、+Y510W;Y483W、Y509W、+Y510W;or Y491W、Y509W、+Y510W。
[63]如段落[40]-[58]中任一项所述的变体,其包括在对应于位置483、491、509和510的所有四个位置处的取代。
[64]如段落[63]所述的变体,其包括取代Y5W、Y13W、Y31W、+Y32W。
[65]如段落[40]-[64]中任一项所述的变体,其进一步包括在对应于SEQ ID NO:2的位置214、215、216和217的一个或多个(例如,若干个)位置处的取代。
[66]如段落[40]-[58]中任一项所述的变体,该变体包括以下项或者由以下项组成:SEQ ID NO:90或SEQ ID NO:92,或其成熟多肽序列。
[67]一种包括如段落[40]-[66]中任一项所述的变体的组合物。
[68]一种编码如段落[40]-[66]中任一项所述的变体的分离的多核苷酸。
[69]一种核酸构建体,其包含如段落[68]所述的多核苷酸。
[70]一种表达载体,其包含如段落[68]所述的多核苷酸。
[71]一种包含如段落[68]所述的多核苷酸的宿主细胞。
[72]一种产生亲本纤维二糖水解酶的变体的方法,该方法包括:在适合于该变体表达的条件下培养如段落[71]所述的宿主细胞。
[73]如段落[72]所述的方法,进一步包括回收该变体。
[74]一种用如段落[68]所述的多核苷酸转化的转基因植物、植物部分或植物细胞。
[75]一种产生如段落[40]-[66]中任一项所述的变体的方法,该方法包括:在有助于该变体产生的条件下培养包含编码该变体的多核苷酸的转基因植物、植物部分或植物细胞。
[76]如段落[75]所述的方法,进一步包括回收该变体。
[77]一种用于获得亲本纤维二糖水解酶的变体的方法,该方法包括:在亲本纤维二糖水解酶中在对应于SEQ ID NO:2的成熟多肽的位置483、491、509和510的一个或多个(例如,若干个)位置处引入取代,其中该变体具有纤维二糖水解酶活性;并且回收该变体。
[78]一种杂合多肽,其包括段落[1]-[26]中任一项所述的碳水化合物结合模块变体和纤维素分解酶的异源催化结构域。
[79]如段落[78]所述的杂合多肽,其具有纤维素分解活性(例如,纤维二糖水解酶活性)。
[80]一种具有纤维素分解活性的杂合多肽,该杂合多肽包括:
(a)在包括纤维素分解酶的异源催化结构域的杂合多肽的N-末端处的片段;和
(b)在包括段落[1]-[26]中任一项所述的碳水化合物结合模块变体的第一多肽片段的C-末端处的片段。
[81]段落[78]-[80]中任一项所述的杂合多肽,其具有碳水化合物结合活性。
[82]一种具有纤维素分解活性的杂合多肽,该杂合多肽包括:
(a)在包括纤维素分解酶的异源催化结构域的杂合多肽的N-末端处的片段;其中该片段
(i)与SEQ ID NO:30的氨基酸1至429、SEQ ID NO:36的氨基酸1至437、SEQ ID NO:38的氨基酸1至440、SEQ ID NO:40的氨基酸1至437、SEQ ID NO:42的氨基酸1至437、SEQ IDNO:44的氨基酸1至438、SEQ ID NO:46的氨基酸1至437、SEQ ID NO:48的氨基酸1至430、或SEQ ID NO:50的氨基酸1至433具有至少60%一致性,
(ii)由以下催化结构域编码序列编码,该催化结构域编码序列在低严格条件下与SEQ ID NO:29的核苷酸52至1469、SEQ ID NO:31的核苷酸52至1389、SEQ ID NO:32的核苷酸52至1389、SEQ ID NO:35的核苷酸79至1389、SEQ ID NO:37的核苷酸52至1371、SEQ IDNO:39的核苷酸55至1482、SEQ ID NO:41的核苷酸76至1386、SEQ ID NO:43的核苷酸76至1386、SEQ ID NO:45的核苷酸55至1504、SEQ ID NO:47的核苷酸61至1350或SEQ ID NO:49的核苷酸55至1353;其cDNA序列;或前述的全长互补体杂交;
(iii)由与SEQ ID NO:29的核苷酸52至1469、SEQ ID NO:31的核苷酸52至1389、SEQ ID NO:32的核苷酸52至1389、SEQ ID NO:35的核苷酸79至1389、SEQ ID NO:37的核苷酸52至1371、SEQ ID NO:39的核苷酸55至1482、SEQ ID NO:41的核苷酸76至1386、SEQ IDNO:43的核苷酸76至1386、SEQ ID NO:45的核苷酸55至1504、SEQ ID NO:47的核苷酸61至1350、或SEQ ID NO:49的核苷酸55至1353;或其cDNA序列具有至少60%一致性的催化结构域编码序列编码;
(iv)是SEQ ID NO:30的氨基酸1至429、SEQ ID NO:36的氨基酸1至437、SEQ IDNO:38的氨基酸1至440、SEQ ID NO:40的氨基酸1至437、SEQ ID NO:42的氨基酸1至437、SEQID NO:44的氨基酸1至438、SEQ ID NO:46的氨基酸1至437、SEQ ID NO:48的氨基酸1至433、或SEQ ID NO:50的氨基酸1至433的变体,该变体在一个或多个(例如,若干个)位置处包括取代,缺失和/或插入;抑或
(v)包括SEQ ID NO:30的氨基酸1至429、SEQ ID NO:36的氨基酸1至437、SEQ IDNO:38的氨基酸1至440、SEQ ID NO:40的氨基酸1至437、SEQ ID NO:42的氨基酸1至437、SEQID NO:44的氨基酸1至438、SEQ ID NO:46的氨基酸1至437、SEQ ID NO:48的氨基酸1至430、或SEQ ID NO:50的氨基酸1至433或由其组成;和
(b)在包括碳水化合物结合模块变体的第一多肽片段的C-末端的片段,其中该变体包括在对应于SEQ ID NO:4的碳水化合物结合模块(例如段落[1]-[26]中任一项所述的碳水化合物结合模块变体)的位置5、13、31和32的一个或多个(例如,若干个)位置处的取代。
[83]如段落[78]-[82]中任一项所述的杂合多肽,该杂合多肽包括以下项或由以下项组成:SEQ ID NO:61、SEQ ID NO:63、SEQ ID NO:73、或SEQ ID NO:94,或其成熟多肽。
[84]如段落[78]-[83]中任一项所述的杂合多肽,其进一步包括在对应于SEQ IDNO:2的位置214、215、216和217的一个或多个(例如,若干个)位置处的取代。
[85]一种组合物,其包括段落[78]-[84]中任一项所述的杂合多肽。
[86]一种分离的多核苷酸,该多核苷酸编码如段落[78]-[84]中任一项所述的杂合多肽。
[87]一种核酸构建体,其包含如段落[86]所述的多核苷酸。
[88]一种表达载体,其包含如段落[86]所述的多核苷酸。
[89]一种包含如段落[86]所述的多核苷酸的宿主细胞。
[90]一种产生杂合多肽的方法,该方法包括:在适合于该杂合多肽表达的条件下培养如段落[89]所述的宿主细胞。
[91]如段落[90]所述的方法,该方法进一步包括回收该多杂合肽。
[92]一种用如段落[86]所述的多核苷酸转化的转基因植物、植物部分或植物细胞。
[93]一种产生如段落[78]-[84]中任一项所述的杂合多肽的方法,该方法包括:在有助于该杂合多肽产生的条件下培养包含编码该杂合多肽的多核苷酸的转基因植物、植物部分或植物细胞。
[94]一种用于降解或转化纤维素材料的方法,包括:在如段落[40]-[66]中任一项所述的变体或如段落[78]-[84]中任一项所述的杂合多肽的存在下,用酶组合物处理该纤维素材料。
[95]如段落[94]所述的方法,其中该纤维素材料经过预处理。
[96]如段落[94]或[95]所述的方法,其中该酶组合物包括一种或多种选自下组的酶:纤维素酶、具有纤维素分解增强活性的GH61多肽、半纤维素酶、棒曲霉素、酯酶、漆酶、木质素分解酶、果胶酶、过氧化物酶、蛋白酶和膨胀素。
[97]如段落[96]所述的方法,其中该纤维素酶是选自下组的一种或多种酶,该组由以下各项组成:内切葡聚糖酶、纤维二糖水解酶、以及β-葡糖苷酶。
[98]如段落96所述的方法,其中该半纤维素酶是选自下组的一种或多种酶,该组由以下各项组成:木聚糖酶、乙酰木聚糖酯酶、阿魏酸酯酶、阿拉伯呋喃糖苷酶、木糖苷酶、以及葡糖醛酸糖苷酶。
[99]如段落[94]-[98]中任一项所述的方法,其进一步包括回收已降解的纤维素材料。
[100]如段落[99]所述的方法,其中该已降解的纤维素材料是糖。
[101]如段落[100]所述的方法,其中该糖选自下组,该组由以下各项组成:葡萄糖、木糖、甘露糖、半乳糖,和阿拉伯糖。
[102]一种用于产生发酵产物的方法,该方法包括:(a)在如段落[40]-[66]中任一项所述的变体或如段落[78]-[84]中任一项所述的杂合多肽的存在下,用一种酶组合物糖化纤维素材料;(b)用一种或多种发酵微生物发酵这一糖化的纤维素材料,以产生该发酵产物;并且(c)从发酵中回收该发酵产物。
[103]如段落[102]所述的方法,其中该纤维素材料经过预处理。
[104]如段落[102]或[103]所述的方法,其中该酶组合物包括选自下组的一种或多种酶,该组由以下各项组成:纤维素酶、具有纤维素分解增强活性的GH61多肽、半纤维素酶、棒曲霉素、酯酶、漆酶、木质素分解酶、果胶酶、过氧化物酶、蛋白酶以及膨胀素。
[105]如段落[104]所述的方法,其中该纤维素酶是选自下组的一种或多种酶,该组由以下各项组成:内切葡聚糖酶、纤维二糖水解酶、以及β-葡糖苷酶。
[106]如段落[104]所述的方法,其中该半纤维素酶是选自下组的一种或多种酶,该组由以下各项组成:木聚糖酶、乙酰木聚糖酯酶、阿魏酸酯酶、阿拉伯呋喃糖苷酶、木糖苷酶、以及葡糖醛酸糖苷酶。
[107]如段落[102]-[106]中任一项所述的方法,其中步骤(a)和(b)在同步糖化和发酵中同时进行。
[108]如段落[102]-[107]中任一项所述的方法,其中该发酵产物是醇、有机酸、酮、氨基酸、烷烃、环烷烃、烯烃、异戊二烯、聚酮化合物、或气体。
[109]一种发酵纤维素材料的方法,该方法包括:用一种或多种发酵微生物发酵该纤维素材料,其中在如段落[40]-[66]中任一项所述的变体或如段落[78]-[84]中任一项所述的杂合多肽的存在下,用一种酶组合物糖化该纤维素材料。
[110]如段落[109]所述的方法,其中该纤维素材料的发酵产生发酵产物。
[111]如段落[110]所述的方法,其进一步包括从该发酵回收该发酵产物。
[112]如段落[109-[111]中任一项所述的方法,其中该纤维素材料在糖化前经过预处理。
[113]如段落[109]-[112]中任一项所述的方法,其中所述酶组合物包括一种或多种选自下组的酶:纤维素酶、具有纤维素分解增强活性的GH61多肽、半纤维素酶、棒曲霉素、酯酶、漆酶、木质素分解酶、果胶酶、过氧化物酶、蛋白酶和膨胀素。
[114]如段落[113]所述的方法,其中该纤维素酶是选自下组的一种或多种酶,该组由以下各项组成:内切葡聚糖酶、纤维二糖水解酶、以及β-葡糖苷酶。
[115]如段落[113]所述的方法,其中该半纤维素酶是选自下组的一种或多种酶,该组由以下各项组成:木聚糖酶、乙酰木聚糖酯酶、阿魏酸酯酶、阿拉伯呋喃糖苷酶、木糖苷酶、以及葡糖醛酸糖苷酶。
[116]如段落[110]-[115中任一项所述的方法,其中该发酵产物是醇、有机酸、酮、氨基酸、烷烃、环烷烃、烯烃、异戊二烯、聚酮化合物、或气体。
[117]一种全培养液配制品或细胞培养组合物,包括如段落[40]-[66]中任一项所述的变体或如段落[78]-[84]中任一项所述的杂合多肽。
通过以下实例进一步对本发明进行描述,但不应将其理解为对本发明范围的限制。
实例
菌株
将米曲霉菌株MT3568用作于表达这些碳水化合物结合模块变体及其杂合多肽的宿主。米曲霉MT3568是米曲霉JaL355的amdS(乙酰胺酶)破坏的基因衍生物(WO 2002/40694),其中通过破坏米曲霉乙酰胺酶(amdS)基因修复pyrG营养缺陷型。
培养基和溶液
COVE蔗糖板或斜面由342g的蔗糖、20g的琼脂粉、20ml的COVE盐溶液、以及补足至1升的去离子水构成。该培养基通过在15psi下高压杀菌15分钟来进行灭菌(细菌学分析手册(Bacteriological Analytical Manual),第8版,修订A,1998)。将该培养基冷却至60℃并且然后添加10mM乙酰胺、15mM CsCl以及X-100(50μl/500ml)。
COVE盐溶液由26g的MgSO4·7H2O、26g的KCl、26g的KH2PO4、50ml的COVE痕量金属溶液、以及补足至1升的去离子水构成。
COVE痕量金属溶液由0.04g的Na2B4O7·10H2O、0.4g的CuSO4·5H2O、1.2g的FeSO4·7H2O、0.7g的MnSO4·H2O、0.8g的Na2MoO4·2H2O、10g的ZnSO4·7H2O、以及补足至1升的去离子水构成。
DAP-4C培养基由20g的右旋糖、10g的麦芽糖、11g的MgSO4·7H2O、1g的KH2PO4、2g的柠檬酸、5.2g的K3PO4·H2O、0.5g的酵母提取物(Difco)、1ml的消泡剂、0.5ml的KU6痕量金属溶液、2.5g的CaCO3、以及补足至1升的去离子水构成。该培养基通过在15psi下高压杀菌15分钟来进行灭菌(细菌学分析手册(Bacteriological Analytical Manual),第8版,修订A,1998)。在使用之前,每150ml的培养基添加3.5ml的无菌的50%(NH4)2HPO4和5ml的无菌的20%乳酸。
G2-Gly培养基由18g的酵母提取物、24g的甘油(86%-88%)、1ml消泡剂、以及补足至1升的去离子水构成。
KU6痕量金属溶液由0.13g的NiCl2、2.5g的CuSO4·5H2O、13.9g的FeSO4·7H2O、8.45g的MnSO4·H2O、6.8g的ZnCl2、3g的柠檬酸、以及补足至1升的去离子水构成。
LB培养基由10g的细菌用胰蛋白胨、5g的酵母提取物、10g的氯化钠,以及补足到1升的去离子水组成。
LB板由10g的细菌用胰蛋白胨(Bacto-Tryptone)、5g的酵母提取物、10g的氯化钠、15g的细菌用琼脂及补足到1升的去离子水构成。
PDA板由马铃薯浸出液(马铃薯浸出液是通过将300g切片的(经过洗涤但未削皮)的马铃薯在水中煮沸30分钟,并且然后将该培养液倾析或滤过粗滤布而制成)构成。然后,添加蒸馏水,直到悬浮液的总体积为1升。然后,添加20g的右旋糖和20g的琼脂粉。该培养基通过在15psi下高压杀菌15分钟来进行灭菌(细菌学分析手册(BacteriologicalAnalytical Manual),第8版,修订A,1998)。
TAE缓冲液由40mM Tris碱、20mM乙酸钠、以及1mM EDTA二钠构成。
YP+2%葡萄糖培养基由去离子水中的1%酵母提取物、2%蛋白胨、以及2%葡萄糖构成。
YP+2%麦芽糖培养基由10g的酵母提取物、20g的蛋白胨、20g的麦芽糖、以及补足至1升的去离子水构成。
实例1:里氏木霉纤维二糖水解酶I的DNA序列信息的来源
里氏木霉GH7纤维二糖水解酶I基因的基因组DNA序列和推导的氨基酸序列分别示于SEQ ID NO:1和SEQ ID NO:2中。基因组序列信息由美国能源部联合基因组研究所(JGI)生成并且由马丁内斯(Martinez)等人,2008,自然生物技术(Nature Biotechnology)26(5):553-560公布。全长纤维二糖水解酶I的氨基酸序列可公开地获自国家生物技术信息中心(NCBI)并且被注释为GenBank:EGR44817.1(SEQ ID NO:2)。里氏木霉纤维二糖水解酶I基因的cDNA序列示于SEQ ID NO:31中。
基于可公开获得的氨基酸序列,产生编码全长纤维二糖水解酶I的密码子优化的合成基因,用于米曲霉表达,基于由古斯塔夫松(Gustafsson)等人,2004,生物技术趋势(Trends in Biotechnology)22(7):346-353研发的算法。通过基因合成服务(生命科技公司,圣地亚哥,加利福尼亚州,美国)用5’Bam HI限制酶切位点、3’Hind III限制酶切位点和位于起始密码子和Bam HI限制酶切位点之间的Kozac共有序列(CACC)合成密码子优化的编码序列(SEQ ID NO:32)。
实例2:包含编码纤维二糖水解酶I的里氏木霉cDNA序列的米曲霉表达载体的构建
根据厂商的说明书,用Fast Digest Bam HI和Hind III(菲门特斯公司(Fermentas Inc.),格伦伯尼,马里兰州,美国)消化由基因合成提供的编码里氏木霉纤维二糖水解酶I(SEQ ID NO:4)的卡那霉素抗性大肠杆菌克隆载体。使用TAE缓冲液,通过1.0%琼脂糖凝胶电泳分离反应产物,其中从凝胶切下1552bp产物带,并且使用ILLUSTRATM GFXTM DNA纯化试剂盒(通用电气医疗集团生命科学部(GE Healthcare LifeSciences),布隆德比,丹麦)进行纯化。
然后,使用T4DNA连接酶(新英格兰生物实验室(New England Biolabs),伊普斯威奇,马萨诸塞州,美国)将1552bp片段克隆进用Bam HI和Hind III消化的pDau109(WO 2005/042735)中。将Bam HI-Hind III消化的pDau109和包含里氏木霉纤维二糖水解酶I编码序列的BamHI/Hind III片段以1:3的摩尔比混合(即,质量比大约2.5:1或20ng:50ng)并且根据厂商的说明书,在具有1mM ATP的1X T4DNA连接酶缓冲液(新英格兰生物实验室,伊普斯威奇,马萨诸塞州,美国)中,在16℃下,用50单位的T4DNA连接酶连接过夜。将里氏木霉纤维二糖水解酶I基因克隆进Bam HI-Hind III消化的pDau109中,导致里氏木霉纤维二糖水解酶I基因在NA2-tpi双启动子的控制下进行转录。NA2-tpi启动子是来自编码黑曲霉中性α-淀粉酶的基因的修饰的启动子,其中已经用来自编码构巢曲霉磷酸丙糖异构酶的基因的未翻译的前导序列替换了未翻译的前导序列。
根据厂商的方案,将连接混合物转化进ONETOP10F′化学感受态大肠杆菌细胞中,并且将其分散在补充有0.1mg氨比西林/ml的LB板上。在37℃下孵育过夜后,观察到菌落在LB氨比西林板上在选择下生长。
使用以下引物,如下所述,在菌落上通过PCR验证里氏木霉纤维二糖水解酶I基因插入进pDau109中。
引物F-pDau109
5’-CCCTTGTCGATGCGATGTATC-3’(SEQ ID NO:51)
引物R-pDau109
5’-ATCCTCAATTCCGTCGGTCGA-3’(SEQ ID NO:52)
将1.1X预混合液(赛默飞世尔科技公司(Thermo FisherScientific),罗斯基勒,丹麦)用于PCR。PCR溶液由10μl的1.1X预混合液、0.5μl的引物F-pDau109(10μM)和0.5μl的引物R-pDau109(10μM)构成。使用牙签将少量的细胞转移至PCR溶液中。使用PTC-200DNA引擎进行PCR,编程为1个循环,在94℃下持续3分钟;30个循环,每个循环在94℃下持续30秒,在50℃下持续1分钟,以及在72℃下持续2分钟;以及1个循环,在72℃下持续1分钟。然后将PCR溶液保持在15℃,直至从PCR仪中移出。
使用TAE缓冲液,通过1.0%琼脂糖凝胶电泳分析PCR产物,其中观察到一个1860bpPCR产物带,从而证实里氏木霉纤维二糖水解酶I编码序列插入进pDau109中。
将包含里氏木霉纤维二糖水解酶I质粒构建体的大肠杆菌转化体在补充有0.1mg的氨比西林/ml的LB培养基中进行培养并且使用Spin Miniprep试剂盒分离质粒DNA。将该质粒指定为pKHJN0036。
实例3:Rasamsonia emersonii纤维二糖水解酶I的DNA序列信息的来源
野生型Rasamsonia emersoniiGH7纤维二糖水解酶I基因的基因组DNA序列和推导的氨基酸序列分别示于SEQ ID NO:39和SEQ ID NO:40中。该基因序列与Genbank条目AF439935.4具有99%一致性。Rasamsonia emersonii纤维二糖水解酶I基因的cDNA序列和推导的氨基酸序列分别示于SEQ ID NO:53和SEQ ID NO:40中。
基于Rasamsonia emersonii纤维二糖水解酶I的cDNA序列,产生编码全长纤维二糖水解酶I的密码子优化的合成基因,用于米曲霉表达,基于由古斯塔夫松(Gustafsson)等人,2004,生物技术趋势(Trends in Biotechnology)22(7):346-353研发的算法。通过基因合成服务(生命科技公司,圣地亚哥,加利福尼亚州,美国)用5’Bam HI限制酶切位点、3’Hind III限制酶切位点和位于起始密码子和Bam HI限制酶切位点之间的Kozac共有序列(CACC)合成密码子优化的编码序列(SEQ ID NO:54)。
实例4:包含编码纤维二糖水解酶I的Rasamsonia emersoniic DNA序列的米曲霉表达载体的构建
根据厂商的说明书,用Fast Digest Bam HI和Hind III(菲门特斯公司,格伦伯尼,马里兰州,美国)消化由基因合成提供的编码Rasamsonia emersonii纤维二糖水解酶I的卡那霉素抗性大肠杆菌克隆载体。使用TAE缓冲液,通过1.0%琼脂糖凝胶电泳分离反应产物,其中从凝胶切下1375bp产物带,并且使用ILLUSTRATM GFXTM DNA纯化试剂盒进行纯化。
然后,使用T4DNA连接酶将1375bp片段克隆进用Bam HI和Hind III消化的pDau109中。将Bam HI-Hind III消化的pDau109和包含里氏木霉纤维二糖水解酶I编码序列的BamHI/Hind III片段以1:3的摩尔比混合(即,质量比大约2.5:1或20ng:50ng)并且根据厂商的说明书,在具有1mM ATP的1X T4DNA连接酶缓冲液中,在16℃下,用50单位的T4DNA连接酶连接过夜。将Rasamsonia emersonii纤维二糖水解酶I基因克隆进Bam HI-Hind III消化的pDau109中导致Rasamsonia emersonii纤维二糖水解酶I基因在NA2-tpi双启动子的控制下进行转录。
根据厂商的方案,将连接混合物转化进ONETOP10F′化学感受态大肠杆菌细胞中,并且将其分散在补充有0.1mg氨比西林/ml的LB板上。在37℃下孵育过夜后,观察到转化体在LB氨比西林板上在选择下生长。使用引物F-pDau109和R-pDau109,如下所述,在转化体上通过PCR验证Rasamsonia emersonii纤维二糖水解酶I基因插入进pDau109中。
将1.1X预混合液(赛默飞世尔科技公司(Thermo FisherScientific),罗斯基勒,丹麦)用于PCR。PCR溶液由10μl的1.1X 预混合液、0.5μl的引物F-pDau109(10μM)和0.5μl的引物R-pDau109(10μM)构成。使用牙签将少量的细胞转移至PCR溶液中。使用PTC-200DNA引擎进行PCR,编程为1个循环,在94℃下持续3分钟;30个循环,每个循环在94℃下持续30秒,在50℃下持续1分钟,以及在72℃下持续2分钟;以及1个循环,在72℃下持续1分钟。然后将PCR溶液保持在15℃,直至从PCR仪中移出。
使用TAE缓冲液,通过1.0%琼脂糖凝胶电泳分析PCR产物,其中观察到一个1600bpPCR产物带,从而证实Rasamsonia emersonii纤维二糖水解酶I编码序列插入进pDau109中。
将包含Rasamsonia emersonii纤维二糖水解酶I质粒构建体的大肠杆菌转化体在补充有0.1mg的氨比西林/ml的LB培养基中进行培养并且使用Spin Miniprep试剂盒分离质粒DNA。将该质粒指定为pKHJN0135。
实例5:具有来自里氏木霉纤维二糖水解酶I的接头和碳水化合物结合模块的Rasamsonia emersonii纤维二糖水解酶I的杂合多肽的构建(PC1-147)
编码里氏木霉(红褐肉座菌)纤维二糖水解酶I的密码子优化的合成基因描述于实例1中。
编码R.emersonii纤维二糖水解酶I的密码子优化的合成基因描述于实例3中。
为了产生编码具有来自里氏木霉纤维二糖水解酶I的接头和碳水化合物结合模块(CBM)的R.emersonii纤维二糖水解酶I的的杂合多肽的基因(SEQ ID NO:55和56分别用于杂合多肽DNA和氨基酸序列),使用剪接重叠延伸(SOE)PCR将编码里氏木霉纤维二糖水解酶I接头和CBM的DNA片段装配到编码R.emersonii纤维二糖水解酶I的基因的3’-端。
使用下示引物F-SOE和引物R-pDau109扩增编码里氏木霉纤维二糖水解酶I接头和CBM的DNA片段。
引物F-SOE:
5’-GGTCC CATCA ACTCG ACATT CACAG CCTCG GGTGG AAACC CTCCT GGCGG AAACCCTC-3’(SEQ ID NO:57)
引物R-pDau109:
5’-ATCCTCAATTCCGTCGGTCGA-3’(SEQ ID NO:58)
引物F-pDau109:
5’-CCACACTTCTCTTCCTTCCTCAATCCTC-3’(SEQ ID NO:59)
使用高保真PCR试剂盒扩增编码里氏木霉纤维二糖水解酶I接头和CBM的DNA片段。PCR溶液由10μl的5X HF缓冲液、1μl的dNTP(10mM)、0.5μl的DNA聚合酶(0.2单位/μl)、0.25μl的引物F-SOE(100μM)、0.25μl的引物R-pDau109(100μM)、10μl的模板DNA(pDAu222-里氏木霉纤维二糖水解酶I,1ng/μl)以及28μl的去离子水构成,总体积为50μl。使用PCR系统9700进行PCR,编程为1个循环,在98℃下持续30秒;和30个循环,每个循环在98℃下持续10秒,在55℃下持续30秒,以及在72℃下持续1分钟。然后将PCR溶液保持在8℃,直至从PCR仪中移出。
使用TAE缓冲液使PCR溶液经受1%琼脂糖凝胶电泳,其中从凝胶上切下编码里氏木霉接头和CBM的405bp PCR片段并使用MinElute凝胶提取试剂盒(凯杰公司,巴伦西亚,加利福尼亚州,美国)进行纯化。
使用以上引物F-pDau109和引物R-pDau109扩增编码R.emersonii纤维二糖水解酶I的DNA片段。
使用高保真PCR试剂盒扩增编码R.emersonii野生型纤维二糖水解酶1的DNA片段。PCR溶液由10μl的5X HF缓冲液、1μl的dNTP(10mM)、0.5μl的DNA聚合酶(0.2单位/μl)、0.25μl的引物F-pDAu109(100μM)、0.25μl的引物R-pDau109(100μM)、10μl的模板DNA(pDAu222-R.emersonii纤维二糖水解酶I,1ng/μl)以及28μl的去离子水构成,总体积为50μl。使用PCR系统9700进行PCR,编程为1个循环,在98℃下持续30秒;和30个循环,每个循环在98℃下持续10秒,在55℃下持续30秒,以及在72℃下持续1分钟。然后将PCR溶液保持在8℃,直至从PCR仪中移出。
使用TAE缓冲液使PCR溶液经受1%琼脂糖凝胶电泳,其中从凝胶上切下编码R.emersonii野生型纤维二糖水解酶I的1600bp片段并使用MinElute凝胶提取试剂盒进行纯化。
使用SOE PCR和高保真PCR试剂盒装配两个纯化的DNA片段。PCR溶液由10μl的5X HF缓冲液、1μl的dNTP(10mM)、0.5μl的DNA聚合酶(0.2单位/μl)、0.25μl的引物F-pDAu109(100μM)、10μl的编码里氏木霉纤维二糖水解酶1接头和CBM的凝胶纯化的片段、2μl的编码R.emersonii纤维二糖水解酶I的DNA片段以及26μl的去离子水构成,总体积为50μl。使用PCR系统9700进行PCR,编程为1个循环,在98℃下持续30秒;和30个循环,每个循环在98℃下持续20秒,在55℃下持续30秒,以及在72℃下持续1分钟。然后将PCR溶液保持在8℃,直至从PCR仪中移出。
然后,如下用Bam HI(新英格兰生物实验室,伊普斯威奇,马萨诸塞州,美国)和Hind III(新英格兰生物实验室,伊普斯威奇,马萨诸塞州,美国)消化PCR产生的DNA片段。将四十μl的PCR产物与5μl缓冲液2(新英格兰生物实验室,伊普斯威奇,马萨诸塞州,美国)、1μl的Bam HI和1μl的Hind III混合并在37℃下孵育4小时。使用TAE缓冲液,使所得PCR产物经受1%琼脂糖凝胶电泳。从凝胶切下大约1567bp的带并使用MinElute凝胶提取试剂盒进行纯化。
使用T4DNA连接酶将编码具有来自里氏木霉纤维二糖水解酶I的接头和碳水化合物结合模块(CBM)的R.emersonii纤维二糖水解酶I的纯化的1567bp片段克隆进用Bam HI和HindIII消化的pDAu109中。将Bam HI-Hind III消化的pDau109和包含具有来自里氏木霉纤维二糖水解酶I编码序列的接头和碳水化合物结合模块(CBM)的R.emersonii纤维二糖水解酶I的Bam HI/Hind III片段以1:3的摩尔比混合(即,等体积的凝胶纯化的产物)并且在具有1mM ATP的1X T4 DNA连接酶缓冲液中用50单位的T4DNA连接酶连接并在22℃下孵育10分钟。
根据厂商的方案,将连接混合物转化进ONETOP10F′化学感受态大肠杆菌细胞中,并且将其分散在补充有0.1mg氨比西林/ml的LB板上。在37℃下孵育过夜后,观察到转化体在LB氨比西林板上在选择下生长。将两个转化体在补充有0.15mg氨比西林/ml的LB培养基中进行培养并且使用Spin Miniprep试剂盒分离质粒。
通过测序验证编码具有来自里氏木霉纤维二糖水解酶I的接头和碳水化合物结合模块(CBM)的R.emersonii纤维二糖水解酶I的DNA片段插入pDAu109中。使用应用生物系统3730xl DNA分析仪,用载体引物F-pDau109和R-pDau109对分离的质粒测序,以便确定不含PCR错误并且包含正确插入的代表性质粒。
选择不含PCR错误并且包含编码具有来自里氏木霉纤维二糖水解酶I的接头和碳水化合物结合模块(CBM)的R.emersonii纤维二糖水解酶I的DNA片段的一个质粒克隆并将其指定为质粒pE147。将相应的杂合多肽命名为PC1-147。实例6:具有来自里氏木霉纤维二糖水解酶I的接头和碳水化合物结合模块的Rasamsonia emersonii纤维二糖水解酶I的杂合多肽的定点诱变(PC1-499、PC1-500)
在实例5中描述了包含编码具有来自里氏木霉纤维二糖水解酶I的接头和碳水化合物结合模块的Rasamsonia emersonii纤维二糖水解酶I的杂合多肽的DNA片段的质粒pE147。
为了产生包含对应于上述杂合多肽PC1-147的碳水化合物结合模块的Y32W的Y→W取代的杂合多肽PC1-499,将编码SEQ ID NO:56的位置515的TAT密码子用编码PC1-147的基因中的TGG密码子进行替换。将突变体DNA序列和相应的多肽序列分别命名为SEQ ID NO:60和SEQ ID NO:61。
为了产生包含对应于上述杂合多肽PC1-147的碳水化合物结合模块的Y5W的Y→W取代的杂合多肽PC1-500,将编码SEQ ID NO:56的位置488的TAC密码子用编码PC1-147的基因中的TGG密码子进行替换。将突变体DNA序列和相应的多肽序列分别命名为SEQ ID NO:62和SEQ ID NO:63。
使用SOE引物设计工具,如下所示,为每个定点诱变设计两个合成引物。该引入的定点突变将编码SEQ ID NO:56的位置515的TAT密码子改变为TGG密码子以及将编码SEQ IDNO:56的位置488的TAC密码子改变为TGG密码子。
引物F-Y497W:
5’-CTGTC AGGTC TTGAA CCCTT ACTGG TCGCA GTGTC TCTAA G-3’(SEQ ID NO:64)
引物R-Y497W:
5’-GTAAG GGTTC AAGAC CTGAC AGGTT GTGCC GG-3’(SEQ ID NO:65)
引物F-Y470W:
5’-CTGGA CCGAC CCAGT CCCAC TGGGG ACAGT GTGGA GGCAT CGG-3’(SEQ ID NO:66)
引物R-Y470W:
5’-GTGGG ACTGG GTCGG TCCAG GGGAC GAACC-3’(SEQ ID NO:67)
通过包含杂合多肽PC1-147的编码序列的pDau109载体的PCR扩增促进定点诱变。先前将该基因克隆进Bam HI-Hind III消化的pDau109中,导致该基因在NA2-tpi双启动子的控制下进行转录。
使用高保真PCR试剂盒通过PCR引入突变。PCR溶液由10μl的5X HF缓冲液、1μl的dNTP(10mM)、0.5μl的DNA聚合酶(0.2单位/μl)、0.25μl的引物F-Y497W(100μM)、0.25μl的引物R-Y497W(100μM)、10μl的质粒pE147DNA(1ng/μl)以及28μl的去离子水构成,总体积为50μl。对于ACC至TGG突变,使用2.5μl的引物F-Y470W(100μM)和2.5μl的引物R-Y470W(100μM)。使用PCR系统9700进行PCR,编程为1个循环,在98℃下持续30秒;和19个循环,每个循环在98℃下持续30秒,在55℃下持续1分钟,以及在72℃下持续4分钟。然后将PCR溶液保持在8℃,直至从PCR仪中移出。
PCR后,将10个单位的DpnI直接添加至PCR溶液中并在37℃下孵育1小时。然后,根据厂商的方案将1μl的DpnI处理的PCR溶液转化进ONE TOP10F′化学感受态大肠杆菌细胞中,并且将其分散在补充有0.15mg氨比西林/ml的LB板上。在37℃下孵育过夜后,观察到转化体在LB氨比西林板上在选择下生长。将四个转化体在补充有0.15mg氨比西林/ml的LB培养基中进行培养并且使用Spin Miniprep试剂盒分离质粒。
使用应用生物系统3730xl DNA分析仪,用引物F-p147、F-Central1、R-Central2以及R-pDau109对分离的质粒测序,以便确定不含PCR错误并且包含所希望的突变的代表性质粒。
引物F-p147
5’-CCACACTTCTCTTCCTTCCTCAATCCTC-3’(SEQ ID NO:68)
引物F-Central1
5’-GTGAG GCGAA CGTGG AAGGA TG-3’(SEQ ID NO:69)
引物R-Central2
5’-GTACC TGTGT CCGTG CCGTC ATCTG-3’(SEQ ID NO:70)
引物R-pDau109
5’-ATCCT CAATT CCGTC GGTCG A-3’(SEQ ID NO:71)
选择一个不含PCR错误并且包含TAT至TGG突变的质粒克隆并且将其指定为质粒pE499。将相应的融合多肽命名为PC1-499。
选择一个不含PCR错误并且包含TAC至TGG突变的质粒克隆并且将其指定为质粒pE500。将相应的融合多肽命名为PC1-500。
实施例7:杂合多肽PC1-147、PC1-499和PC1-500的表达
根据克里斯滕森(Christensen)等人,1988,见上文和WO 2004/032648,将表达质粒pE147、pE499和pE500(见上文)转化进米曲霉MT3568原生质体中。根据EP 0238023B1,第14-15页的方法制备米曲霉MT3568原生质体。
在不具有CsCl的COVE蔗糖板上通过单一的分生孢子纯化转化体。将转化体的孢子接种进包含0.50ml YP+2%麦芽糖+0.5%葡萄糖培养基的96深孔板中并且在34℃下静止孵育6天。从96深孔培养的培养上清液分析通过转化体的杂合多肽的产生。通过测量由微晶纤维素的水解释放的还原糖验证表达。在25℃和1100rpm下,在96孔微量滴定板(NUNC赛默飞世尔科技公司,罗斯基勒,丹麦)中进行水解。每种水解反应混合物都包含50mM乙酸钠(pH5.0)中的90g/升的167μl的微晶纤维素、0.01%X-100、20μl的培养上清液以及63μl的50mM乙酸钠(pH 5.0)、0.01%X-100。将板用胶带密封。通过将板以3500rpm旋转3分钟而终止水解反应。然后,向96孔PCR板(赛默飞世尔科技公司,罗斯基勒,丹麦)中的75μl终止溶液中添加50μl的反应上清液。终止溶液由2%(w/v)NaOH中的15mg/ml4-羟基苯甲酰肼(西格玛化学有限公司,圣路易斯,密苏里州,美国)、50mg/ml酒石酸钾钠(西格玛化学有限公司,圣路易斯,密苏里州,美国)构成。将板用盖密封并且将混合物在95℃下孵育10分钟并且在20℃下孵育5分钟。然后,将100μl转移至微量滴定板中并且使用Plus 384(分子设备公司(Molecular Devices),森尼韦尔,加利福尼亚州,美国)测量410nm下的吸光度。还原糖的浓度与氧化的4-羟基苯甲酰肼在410nm下的吸光度成比例。通过向96孔PCR板中的75μl的终止溶液和46μl的milliQ水的混合物中添加4μl的培养上清液而测量培养上清液中的还原糖含量。将板用盖密封并且将混合物在95℃下孵育10分钟并且在20℃下孵育5分钟。然后,将100μl转移至微量滴定板中并在410nm下测量吸光度。从410nm下的水解反应的吸光度中减去来自细胞培养上清液的410nm下的吸光度,以测量由这些酶释放的还原糖的量。
基于微晶纤维素的水解水平,选择用于杂合多肽PC1-147、PC1-499和PC1-500中的每一者的一个转化体并分别命名为米曲霉PC1-147、米曲霉PC1-499和米曲霉PC1-500。
对于较大规模的生产,将米曲霉PC1-147或米曲霉PC1-499或PC1-500孢子分散到COVE蔗糖斜面上并且在37℃下孵育五天。用5ml的G2-Gly培养基将融合的孢子斜面洗涤两次。然后,使用孢子悬浮液接种包含150ml的G2-Gly培养基的500ml烧瓶。将预培养物在30℃下进行孵育,同时以150rpm进行恒定振荡。一天后,使用每种预培养物接种四个包含150ml的DAP-4C培养基的500ml烧瓶。在接种后第四天,经由瓶盖MF75Supor MachV 0.2μm PES过滤器通过过滤收集培养液。
实施例8:杂合多肽PC1-147、PC1-499和PC1-500的纯化
将发酵液通过具有0.22μm截留的PES瓶顶过滤器进行过滤。向过滤的发酵液中添加硫酸铵至浓度为1.8M。
通过HIC/亲和层析、随后通过IEX/亲和层析从发酵液中纯化所希望的杂合多肽。
在HIC/亲和色谱步骤中,将发酵液施加至已经用1.8M硫酸铵、25mM HEPES(pH7.0)预平衡的200ml苯基6快流(Fast Flow)柱(高分辨率)(通用电气医疗集团(GE Healthcare),皮斯卡塔韦(Piscataway),新泽西州,美国)上。施加样品后,将该柱用2个柱体积的1.8M硫酸铵,随后是1个柱体积的0.54M硫酸铵洗涤。将结合的蛋白用25mMHEPES(pH 7.0)分批洗脱。
在280nm下监测蛋白的洗脱。使用12孔4%-12%Bis-Tris凝胶(通用电气医疗集团(GE Healthcare),皮斯卡塔韦(Piscataway),新泽西州,美国)在SDS-PAGE上分析具有280nm高吸光度的级分的纤维二糖水解酶I含量。将具有高含量的此蛋白的级分合并并收集,用于进一步纯化。将合并的级分在用25mM MES(pH 6.0)平衡的SEPHADEXTM G-25(中)柱(通用电气医疗集团(GE Healthcare),皮斯卡塔韦(Piscataway),新泽西州,美国)上脱盐。在280nm下监测蛋白的洗脱并且选择在280nm下具有高吸光度的级分用于第二色谱步骤。
将合并的级分施加至用25mM MES(pH 6.0)平衡的60ml RESOURCETM 15Q柱(通用电气医疗集团(GE Healthcare),皮斯卡塔韦(Piscataway),新泽西州,美国)上,并且用1.5柱体积的线性100-200mM氯化钠梯度、随后是1.5柱体积的300mM氯化钠,随后是1.5柱体积的1M氯化钠洗脱结合的蛋白。在280nm下监测蛋白的洗脱并且在SDS-PAGE上分析在280nm下具有高吸光度的级分。
合并具有高含量的纤维二糖水解酶I的级分。
实施例9:在微晶纤维素上,杂合多肽PC1-147、PC1-499和PC1-500的活性测量
使用洗涤的微晶纤维素(PH101;西格玛-奥德里奇(Sigma-Aldrich),圣路易斯,密苏里州,美国)作为底物(参见PCT/US 2014/022068),将纯化的杂合多肽PC1-147、PC1-499和PC1-500(见上文)的活性与纯化的野生型R.emersonii纤维二糖水解酶I的活性进行比较。
将纯化的杂合多肽在50mM乙酸钠,2mM CaCl2pH 5中稀释。将稀释的杂合多肽和β-葡糖苷酶添加到每个孔(微孔板96F 26960赛默飞世尔科技公司(Thermo Scientific))中。然后将洗涤过的AVICEL添加到每个孔中,并将微量滴定板迅速转移到恒温混合器(eppendorf)中,并在1100rpm和50℃或60℃下孵育24小时。杂合多肽于反应中的终浓度为3μM,并且AVICEL的浓度为76g/l。通过在5℃下以3500rpm离心3min(Hereaus multifuge 3S-R)来终止反应。将上清液稀释并转移到PCR样品管(赛默科技公司(Thermoscientific)0.2ml无裙边96孔PCR板AB0600)中。将PAHBAH(4-羟基-苯甲酰肼)(西格玛(Sigma),H 9882)溶解于缓冲液(0.18M酒石酸钾钠(默克(Merck),1.08087)和0.5M NaOH)中,以制备15mg/ml溶液。将75μl的PAHBAH溶液添加至PCR样品管中的上清液中。
将PCR样品管放于帕尔帖热循环仪中并在95℃下孵育10min并且在20℃下孵育5min。孵育后,将100μl转移至96孔微量滴定板(微孔板96F 26960赛默飞世尔科技公司)中并在410nm下测量吸光度。对于每个运行都包括一个标准品。使用的标准品是在50mM乙酸钠、2mM CaCl2(pH 5)中稀释至浓度为0.008、0.016、0.0312、0.0625、0.125、0.25、0.5、1mM的葡萄糖。除标准品之外,每个运行还包括一个空白(不具有纤维二糖水解酶)。对于所有测量值,减去空白测量值。使用这些标准品将吸光度数据标准化为葡萄糖浓度。
如图2所示的结果展示,在50℃下,与野生型纤维二糖水解酶I相比,杂合多肽PC1-500(包含与具有对应于CBM的Y5W的取代的里氏木霉碳水化合物结合模块变体连接的埃默森菌纤维二糖水解酶I催化结构域)和PC1-499(包含与具有对应于CBM的Y32W的取代的里氏木霉碳水化合物结合模块变体连接的R.emersoni纤维二糖水解酶I催化结构域)对微晶纤维素分别具有大约145%和124%增加,并且与缺少对应于CBM的Y5W或Y32W的任一取代的杂合多肽相比,分别增加57%和44%。
如图3所示的结果展示,在60℃下,与野生型纤维二糖水解酶I相比,杂合多肽PC1-500和PC1-499显示分别增加209%和186%,并且与缺少对应于CBM的Y5W或Y32W的任一取代的杂合多肽相比,分别增加34%和24%。
实例10:预处理的玉米秸杆水解测定
在美国能源部国家可再生能源实验室(NREL)使用1.4wt%硫酸在165℃和107psi下对玉米秸秆预处理8分钟。预处理的玉米秸秆(PCS)中的不溶于水的固体包含56.5%纤维素,4.6%半纤维素和28.4%木质素。通过两阶段硫酸水解,接着通过使用NREL标准分析程序#002的高效液相色谱分析糖来测定纤维素和半纤维素。木质素在用硫酸水解纤维素和半纤维素级分之后使用NREL标准分析程序#003以重量分析法测定。
通过在剧烈混合下添加10M NaOH将PCS的pH调节至5.0,并且然后在120℃下高压杀菌20分钟来制备未碾磨、未洗涤PCS(全浆料PCS)。全浆料PCS的干重是29%。
通过将具有96个锥形孔的深度1/4英寸的特氟隆板的上表面加工为直径1/4英寸并且将下表面加工为直径1/8英寸而产生一个96孔板。每个孔的中心都在标准96孔微量滴定板的对应孔的中心的等效位置处,在中心上大约23/64英寸。每个孔的所得体积大约是135μl。在下文中,将此96孔铝板称为“填充(fill)板”。通过将适合体积的玉米秸秆施加至该板的上表面,然后使用刮刀将该材料铺在表面上并进入洞中,将pH调节的玉米秸秆用于填充该填充板中的洞。当玉米秸秆被挤压通过底表面中的洞时,洞被认为足够满,从而形成面条样管。使用与该填充板表面保持垂直的列装载刮刀(Column Loader Scraper)(密理博(Millipore))将过量的玉米秸秆从该填充板的顶表面和底表面刮下,使得每个孔中的玉米秸秆的表面都与该填充板的表面平齐。然后,将该填充板放在2.2ml深孔板(爱思进,联合市,加利福尼亚州,美国)的顶部,顶表面与该孔板的开口端(例如,该孔板的顶部)相邻,并且将这些孔与该填充板中的玉米秸秆填充孔对齐。将该填充板固定在此位置,并且将该装配在Sorvall Legend RT+(赛默科技(Thermo Scientific),沃尔瑟姆,马萨诸塞州,美国)中于2500rpm(1350x g)下离心5分钟。离心后,玉米秸秆已经被转移至该深孔板。将3mm玻璃珠(飞世尔科技(FisherScientific),沃尔瑟姆,马萨诸塞州,美国)放置于每个孔中供混合。
在共0.2ml的反应体积中进行PCS的水解。用50mg的不溶性PCS固形物,包含包含1mM硫酸锰和不同酶组合物的不同蛋白负载量(表示为mg蛋白质/克纤维素)的50mM乙酸钠(pH 5.0)缓冲液进行水解。制备酶组合物并且然后将其以从20μl至50μl的范围的体积同时添加至所有的孔中,在每个反应中的终体积为0.2-0.50ml。然后使用ALPS-300TM板式热封机(ALPS-300TM plate heat sealer)(阿博基因公司(Abgene),埃普索姆,英国)将板密封,充分混合,并且在特定温度下孵育72小时。
在水解后,使用0.45μm96孔过滤器板(密理博(Millipore),贝德福德,马萨诸塞州,美国)过滤样品并且如以下所描述分析滤液的糖含量。在不立即使用时,将过滤的等分部分冷冻在-20℃下。通过以下方式测量稀释于0.005M H2SO4中的样品的糖浓度:使用4.6X 250mmHPX-87H柱(伯乐实验室有限公司,赫拉克勒斯,加利福尼亚州,美国),通过用0.05%w/w苯甲酸-0.005M H2SO4在65℃、0.6ml/分钟的流速下洗脱,并且通过整合来自由纯糖样品标定的折射指数检测(1100HPLC,安捷伦科技(Agilent Technologies),圣克拉拉,加利福尼亚州,美国)的葡萄糖、纤维二糖、以及木糖信号进行定量。使用所得葡萄糖和纤维二糖等效量来计算各反应的纤维素转化的百分比。
单独测量葡萄糖和纤维二糖。针对适当稀释因子来调节所测量的糖浓度。通过针对在零时间点时,未洗涤PCS中的对应的背景糖浓度调节所测量的糖浓度来测定由未洗涤PCS酶促地产生的糖的净浓度。使用MICROSOFT EXCELTM软件(微软,里奇兰,华盛顿,美国)来进行所有HPLC数据处理。
使用以下等式计算葡萄糖向葡萄糖的转化程度:%纤维素转化=(葡萄糖浓度/限制消化中的葡萄糖浓度)×100。为了计算葡萄糖转化百分比,基于纤维素酶对照(100mg的补充有橙黄嗜热子囊菌GH61A多肽、烟曲霉GH10木聚糖酶(xyn3)和埃默森篮状菌β-木糖苷酶的里氏木霉纤维素酶/克纤维素)设定100%转化点。将一式四份的数据点取平均值并且计算标准差。
实例11:不具有纤维二糖水解酶I的酶组合物的制备
如在WO 2012/103288中所述,在米曲霉中重组地制备Talaromyces leycettanusGH6纤维二糖水解酶II(GENESEQP:AZY49446)。将Talaromyces leycettanus GH6纤维二糖水解酶II的过滤的培养液使用400ml SEPHADEXTM G-25柱(通用电气医疗集团,英国)进行浓缩并且与20mM Tris(pH 8.0)进行缓冲液交换。将这些级分合并,并向脱盐蛋白中添加3M硫酸铵、20mM Tris(pH 8.0)至终浓度为1.2M硫酸铵、20mM Tris(pH 8.0)。将该蛋白质装载在用1.2M硫酸铵在20mM Tris(pH 8.0)中平衡的Phenyl SepharoseTM6快流柱(高载量)(通用电气医疗集团,皮斯卡塔韦,新泽西州,美国)中,并且用不具有硫酸铵的20mM Tris(pH8.0)洗脱结合的蛋白质。将级分通过8%-16%Tris-HCl SDS-PAGE凝胶(伯乐公司(Bio-Rad),赫拉克勒斯,加利福尼亚州,美国)分析并合并。使用具有10kDa分子量截留切向流动膜(Sartorius公司,波希米亚(Bohemia),纽约州,美国)的Vivaflow 200将合并的蛋白质与20mM MES(pH 6.0)进行缓冲液交换。
使用米曲霉用作宿主,根据WO 2011/057140重组地制备里氏木霉GH5内切葡聚糖酶II(GENESEQP:AZI04858)。将里氏木霉内切葡聚糖酶II的过滤的培养液使用配备有10kDa聚醚砜膜(颇尔滤清器公司(Pall Filtron),诺斯伯勒(Northborough),马萨诸塞州,美国)的切向流动浓缩器(颇尔滤清器公司,诺斯伯勒,马萨诸塞州,美国)进行脱盐并且与20mMTris(pH 8.0)进行缓冲液交换。
根据WO 2005/074656,使用米曲霉JaL250作为宿主,重组制备具有纤维素分解增强活性的金黄色嗜热子囊菌CGMCC 0583GH61A多肽(GENESEQP:AEC05922)。使用0.22μmEXPRESSTM Plus膜(密理博(Millipore),贝德福德,马萨诸塞州,美国)过滤培养液。
使用米曲霉BECh2(WO 2000/39322)作为宿主,根据WO 2006/078256重组地制备烟曲霉GH10木聚糖酶(xyn3)(GENESEQP:AZI04884)。使用26/10脱盐柱(通用电气医疗集团,皮斯卡特维,新泽西州,美国)将烟曲霉木聚糖酶的过滤的培养液脱盐并缓冲液交换进50mM乙酸钠pH 5.0中。
根据WO 2012/044915重组地制备烟曲霉Cel3Aβ-葡糖苷酶4M突变体(GENESEQP:AZU67153)。使用配备有10kDa聚醚砜膜(颇尔滤清器公司,诺斯伯勒,马萨诸塞州,美国)的切向流浓缩器(颇尔滤清器公司,诺斯伯勒,马萨诸塞州,美国)浓缩烟曲霉Cel3Aβ-葡糖苷酶4M的过滤培养液并与包含100mM氯化钠的50mM乙酸钠(pH 5.0)进行缓冲液交换。
使用米曲霉JaL355作为宿主(WO 2003/070956),根据拉斯穆森(Rasmussen)等人,2006,生物技术与生物工程(Biotechnology and Bioengineering)94:869-876重组地制备埃默森篮状菌CBS 393.64β-木糖苷酶(GENESEQP:AZI04896)。将过滤的培养液浓缩并且使用配备有10kDa聚醚砜膜(颇尔滤清器公司,诺斯伯勒,马萨诸塞州,美国)的切向流浓缩器脱盐进50mM乙酸钠(pH 5.0)中。
使用微板BCATM蛋白测定试剂盒(Microplate BCATM Protein Assay Kit)(赛默飞世尔科技,沃尔瑟姆,马萨诸塞州,美国)确定上述每种单组分的蛋白浓度,在该试剂盒中将牛血清白蛋白用作蛋白标准品。制备一种酶组合物,其由如下各单组分构成:39.7%Talaromyces leycettanus GH6纤维二糖水解酶II、15.9%里氏木霉GH5内切葡聚糖酶II、23.8%金黄色嗜热子囊菌GH61A多肽、7.9%烟曲霉GH10木聚糖酶、7.9%烟曲霉β-葡糖苷酶以及4.8%埃默森篮状菌β-木糖苷酶。在此将该酶组合物指定为“不具有纤维二糖水解酶I的纤维素分解酶组合物”。
实例12:杂合多肽PC1-147、PC1-499和PC1-500对纤维素酶组合物水解未洗涤的PCS的影响的比较
在35℃、50℃和60℃下,使用未洗涤的PCS作为底物,将杂合多肽PC1-499和PC1-500(分别包含对应于纤维素结合模块的Y32W和Y5W的取代)添加到没有纤维二糖水解酶I(见上文)的纤维素分解酶组合物中,并针对杂合多肽PC1-147(缺少对应于纤维素结合模块的Y5W或Y32W的任一取代)进行比较。单独地以3.33mg酶蛋白/g纤维素向不具有纤维二糖水解酶I的纤维素酶组合物的5.67mg酶蛋白/g纤维素中添加每种纤维二糖水解酶I。
如在上文中所描述的进行该测定。将具有未洗涤的PCS(20%总固形物)的反应在35℃、50℃和60℃下于包含1mM硫酸锰的50mM乙酸钠(pH 5.0)缓冲液中进行72小时。一式四份地进行所有反应并且贯穿整个水解在200rpm下进行振荡。
图4中所示的结果展示,与包含缺少对应于CBM的Y5W或Y32W的任一取代的杂合多肽PC1-147的纤维素酶组合物相比,包含杂合多肽PC1-499(包含与具有对应于CBM的Y32W的取代的里氏木霉碳水化合物结合模块(CBM)变体连接的R.emersoni纤维二糖水解酶I催化结构域)的纤维素酶组合物在所有温度下具有显著更高的纤维素转化率。另外,与PC1-147相比,杂合多肽PC1-500(包含连接到具有对应于CBM的Y5W的取代的里氏木霉碳水化合物结合模块变体的R.emersonii纤维二糖水解酶I催化结构域)在所有温度下具有显著更高的纤维素转化率。
实例13:具有来自里氏木霉纤维二糖水解酶I的接头和碳水化合物结合模块的Rasamsonia emersonii纤维二糖水解酶I的杂合多肽的定点诱变(PC1-668)
在实例5中描述了包含编码具有来自里氏木霉纤维二糖水解酶I的接头和碳水化合物结合模块的Rasamsonia emersonii纤维二糖水解酶I的杂合多肽的DNA片段的质粒pE147。
为了产生包含对应于上述杂合多肽PC1-147的碳水化合物结合模块的Y13W的Y→W取代的杂合多肽PC1-668,将编码SEQ ID NO:56的位置496的TAT密码子用编码PC1-147的基因中的TGG密码子进行替换。将突变体DNA序列和相应的多肽序列分别命名为SEQ ID NO:72和SEQ ID NO:73。
使用SOE引物设计工具,如下所示,为每个定点诱变设计两个合成引物。引入的定点突变将编码SEQ ID NO:56的位置496的TAT密码子改变为TGG密码子。
引物F-Y478W:
5’-GGACA GTGTG GAGGC ATCGG TTGGT CCGGT CCGAC CGTCT GTGC-3’(SEQ ID NO:74)
引物R-Y478W:
5’-ACCGA TGCCT CCACA CTGTC CGTAG TGGGA CT-3’(SEQ ID NO:75)
通过包含杂合多肽PC1-147的编码序列的pDau109载体的PCR扩增促进定点诱变。先前将该基因克隆进Bam HI-Hind III消化的pDau109中,导致该基因在NA2-tpi双启动子的控制下进行转录。
使用高保真PCR试剂盒通过PCR引入突变。PCR溶液由10μl的5X HF缓冲液、1μl的dNTP(10mM)、0.5μl的DNA聚合酶(0.2单位/μl)、0.25μl的引物F-Y478W(100μM)、0.25μl的引物R-Y478W(100μM)、10μl的质粒pE147DNA(1ng/μl)以及28μl的去离子水构成,总体积为50μl。使用PCR系统9700进行PCR,编程为1个循环,在98℃下持续30秒;和19个循环,每个循环在98℃下持续30秒,在55℃下持续1分钟,以及在72℃下持续4分钟。然后将PCR溶液保持在8℃,直至从PCR仪中移出。
PCR后,将10个单位的DpnI直接添加至PCR溶液中并在37℃下孵育1小时。然后,根据厂商的方案将1μl的DpnI处理的PCR溶液转化进ONETOP10F′化学感受态大肠杆菌细胞中,并且将其分散在补充有0.15mg氨比西林/ml的LB板上。在37℃下孵育过夜后,观察到转化体在LB氨比西林板上在选择下生长。将四个转化体在补充有0.15mg氨比西林/ml的LB培养基中进行培养并且使用Spin Miniprep试剂盒分离质粒。
使用应用生物系统3730xl DNA分析仪,用引物F-p147、F-Central1、R-Central2以及R-pDau109对分离的质粒测序,以便确定不含PCR错误并且包含所希望的突变的代表性质粒。
引物F-p147
5’-CCACA CTTCT CTTCC TTCCT CAATC CTC-3’(SEQ ID NO:68)
引物F-Central1
5’-GTGAG GCGAA CGTGG AAGGA TG-3’(SEQ ID NO:69)
引物R-Central2
5’-GTACC TGTGT CCGTG CCGTC ATCTG-3’(SEQ ID NO:70)
引物R-pDau109
5’-ATCCT CAATT CCGTC GGTCG A-3’(SEQ ID NO:71)
选择一个不含PCR错误并且包含TAT至TGG突变的质粒克隆并且将其指定为质粒pE668。将相应的融合多肽命名为PC1-668。
实例14:烟曲霉纤维二糖水解酶I的DNA序列信息的来源
烟曲霉Af293GH7纤维二糖水解酶I基因的基因组DNA序列和推导的氨基酸序列分别示于SEQ ID NO:76和SEQ ID NO:78中。基因组序列信息由基因组学研究院(TheInstitute for Genomic Research),罗克维尔市(Rockville),马里兰(Maryland)20850,美国产生,并由尼尔曼(Nierman),W.C.等人,2005,自然438(7071):1151-1156公开。全长纤维二糖水解酶I的氨基酸序列可公开地获自国家生物技术信息中心(NCBI)并且被注释为GenBank:EAL89006.1。烟曲霉纤维二糖水解酶I基因的cDNA序列和推导的氨基酸序列分别示于SEQ ID NO:77和SEQ ID NO:78中。
基于可公开获得的氨基酸序列,产生编码全长纤维二糖水解酶I的密码子优化的合成基因,用于米曲霉表达,基于由古斯塔夫松(Gustafsson)等人,2004,生物技术趋势(Trends in Biotechnology)22(7):346-353研发的算法。通过基因合成服务(生命科技公司,圣地亚哥,加利福尼亚州,美国)用5’Bam HI限制酶切位点、3’Hind III限制酶切位点和位于起始密码子和Bam HI限制酶切位点之间的Kozac共有序列(CACC)合成密码子优化的编码序列(SEQ ID NO:79)。
实例15:包含编码纤维二糖水解酶I的烟曲霉DNA序列的米曲霉表达载体的构建
根据厂商的说明书,用Bam HI和Hind III(纽英伦生物技术有限公司(NewEngland Biolabs),马萨诸塞州(MA),美国)消化由基因合成提供的编码烟曲霉纤维二糖水解酶I(实例14)的卡那霉素抗性大肠杆菌克隆载体。将反应产物通过使用TAE缓冲液的1.0%琼脂糖凝胶电泳进行分离,其中将1606bp的PCR产物条带从凝胶切离,并且使用MinElute凝胶提取试剂盒(凯杰有限公司(QIAGEN Inc.),瓦伦西亚,加利福尼亚州,美国)进行纯化。
使用T4DNA连接酶(新英格兰生物实验室(New England Biolabs),马萨诸塞州,美国)将纯化的编码烟曲霉纤维二糖水解酶I的1606bp片段克隆进用Bam HI和Hind III消化的pDau109(WO 2005/042735)中。将Bam HI-Hind III消化的pDau109和包含烟曲霉纤维二糖水解酶I的Bam HI/Hind III片段以1:3的摩尔比混合(即,等体积的凝胶纯化的产物)并且在具有1mM ATP的1X T4DNA连接酶缓冲液中用50单位的T4DNA连接酶连接并在22℃下孵育10分钟。
将烟曲霉纤维二糖水解酶I基因克隆进Bam HI-Hind III消化的pDau109中,将导致烟曲霉纤维二糖水解酶I基因在NA2-tpi双启动子的控制下进行转录。NA2-tpi启动子是来自编码黑曲霉中性α-淀粉酶的基因的修饰的启动子,其中已经用来自编码构巢曲霉磷酸丙糖异构酶的基因的未翻译的前导序列替换了未翻译的前导序列。
根据厂商的方案,将连接混合物转化进ONETOP10F′化学感受态大肠杆菌细胞中,并且将其分散在补充有0.1mg氨比西林/ml的LB板上。在37℃下孵育过夜后,观察到菌落在LB氨比西林板上在选择下生长。
通过DNA测序验证烟曲霉纤维二糖水解酶I基因插入到pDau109中。使用应用生物系统3730xl DNA分析仪,用以下所示的载体引物和烟曲霉纤维二糖水解酶I基因特异性引物对分离的质粒测序,以便确定不含PCR错误并且包含所希望的插入的代表性质粒。
引物F-pDau109
5’-CCCTT GTCGA TGCGA TGTAT C-3’(SEQ ID NO:59)
引物R-pDau109
5’-ATCCT CAATT CCGTC GGTCG A-3’(SEQ ID NO:58)
引物F-pE596
5’-GTGAT ACACC CGGAC AGGTG ATGTG-3’(SEQ ID NO:80)
引物R-pE596
5’-CCATA TCGAT CCGAC GAGTA GGTTC-3’(SEQ ID NO:81)
将包含烟曲霉纤维二糖水解酶I质粒构建体的大肠杆菌转化体在补充有0.1mg的氨比西林/ml的LB培养基中进行培养并且使用Spin Miniprep试剂盒分离质粒DNA。将质粒命名为pE596并且将相应的多肽命名为AC1-596。
实例16:包含编码纤维二糖水解酶I的Rasamsonia byssochlamydoides DNA序列的米曲霉表达载体的构建
将Rasamsonia byssochlamydoides(丝衣霉状篮状菌)菌株CBS413.71GH7纤维二糖水解酶I基因的基因组DNA序列和推导的氨基酸序列分别示于SEQ ID NO:82和SEQ IDNO:83中。GH7纤维二糖水解酶I基因是1507bp,其包括具有两个预测的内含子(604至667和1236至1310)的终止密码子。将R.byssochlamydoidesGH7基因至pDau109载体中的克隆描述于专利WO 2012/103300(将其内容通过引用结合在此)中。将包含R.byssochlamydoidesGH7基因的pDau109的质粒命名为pE637。
实施例17:具有来自烟曲霉纤维二糖水解酶I(RC1-638)的接头和碳水化合物结合模块的Rasamsonia byssochlamydoides纤维二糖水解酶I的融合多肽的构建
编码烟曲霉纤维二糖水解酶I的密码子优化的合成基因描述于实例14和15中。
编码R.byssochlamydoides纤维二糖水解酶I的基因描述于实例16中。
为了产生编码具有来自烟曲霉纤维二糖水解酶I的接头和碳水化合物结合模块(CBM)的R.byssochlamydoides纤维二糖水解酶I的融合多肽的基因(SEQ ID NO:84和85分别用于融合多肽DNA和氨基酸序列),使用剪接重叠延伸(SOE)PCR将编码烟曲霉纤维二糖水解酶I接头和CBM的DNA片段装配到编码R.byssochlamydoides纤维二糖水解酶I的基因的3’-端。
使用下示引物F-SOE638和引物R-SOE638扩增编码烟曲霉纤维二糖水解酶I接头和CBM的DNA片段。
引物F-SOE638:
5’-CAATC AACTC GACCT TCACC ACTTC GGGCT CGAAC CCTGG AGGCG GAACG-3’(SEQID NO:86)
引物R-SOE638:
5’-CTAGA TCTCG AGTTA CAAAC ACTGC GAGTA GTAG-3’(SEQ ID NO:87)
使用高保真PCR试剂盒扩增编码烟曲霉纤维二糖水解酶I接头和CBM的DNA片段。PCR溶液由10μl的5X HF缓冲液、4μl的dNTP(2,5mM)、0.5μl的DNA聚合酶(0.2单位/μl)、0.25μl的引物F-SOE638(100μM)、0.25μl的引物R-SOE638(100μM)、10μl的模板DNA(pE596纤维二糖水解酶I,1ng/μl)以及25μl的去离子水构成,总体积为50μl。使用PCR系统9700进行PCR,编程为1个循环,在98℃下持续30秒;和30个循环,每个循环在98℃下持续10秒,在55℃下持续30秒,以及在72℃下持续1分钟。然后将PCR溶液保持在8℃,直至从PCR仪中移出。
使用TAE缓冲液使PCR溶液经受1%琼脂糖凝胶电泳,其中从凝胶上切下编码烟曲霉纤维二糖水解酶接头和CBM的239bp PCR片段并使用MinElute凝胶提取试剂盒(凯杰公司,巴伦西亚,加利福尼亚州,美国)进行纯化。
使用下示引物F-pDau109和引物R-SOE637扩增编码R.byssochlamydoides纤维二糖水解酶I的DNA片段。
引物F-pDau109:
5’-CCACA CTTCT CTTCC TTCCT CAATC CTC-3’(SEQ ID NO:59)
引物R-SOE637
5’-CGAAG TGGTG AAGGT CGAGT TGATT G-3’(SEQ ID NO:88)
使用高保真PCR试剂盒扩增编码R.byssochlamydoides野生型纤维二糖水解酶I的DNA片段。PCR溶液由10μl的5X HF缓冲液、4μl的dNTP(2.5mM)、0.5μl的DNA聚合酶(0.2单位/μl)、0.25μl的引物F-pDAu109(100μM)、0.25μl的引物R-SOE637(100μM)、10μl的模板DNA(pE637-R.byssochlamydoides纤维二糖水解酶I,1ng/μl)以及25μl的去离子水构成,总体积为50μl。使用PCR系统9700进行PCR,编程为1个循环,在98℃下持续30秒;和30个循环,每个循环在98℃下持续10秒,在55℃下持续30秒,以及在72℃下持续1分钟。然后将PCR溶液保持在8℃,直至从PCR仪中移出。
使用TAE缓冲液使PCR溶液经受1%琼脂糖凝胶电泳,其中从凝胶上切下编码R.byssochlamydoides野生型纤维二糖水解酶I的1658bp片段并使用MinElute凝胶提取试剂盒进行纯化。
使用SOE PCR和高保真PCR试剂盒装配两个纯化的DNA片段。PCR溶液由10μl的5X HF缓冲液、4μl的dNTP(2.5mM)、0.5μl的DNA聚合酶(0.2单位/μl)、0.25μl的引物F-pDAu109(100μM)、0.25的R-pDAu109(100μM)、2μl的编码烟曲霉纤维二糖水解酶1接头和CBM的凝胶纯化的片段、2μl的编码R.byssochlamydoides纤维二糖水解酶I的DNA片段以及31μl的去离子水构成,以给出终体积为50μl。使用PCR系统9700程序进行PCR,程序为1个循环,在98℃下,持续2分钟;10个循环,98℃持续20秒,65℃持续20秒,和72℃持续4分钟20秒;然后接着是20个循环,98℃,持续20秒,55℃持续20秒,以及72℃持续6分钟。然后将PCR溶液保持在6℃,直至从PCR仪中移出。
然后,如下用Bam HI(新英格兰生物实验室,伊普斯威奇,马萨诸塞州,美国)和XhoI(新英格兰生物实验室,伊普斯威奇,马萨诸塞州,美国)消化PCR产生的DNA片段。将二十μl的PCR产物与2.3μl缓冲液3.1(新英格兰生物实验室,伊普斯威奇,马萨诸塞州,美国)、0.8μl的Bam HI和0.6μl的HXhoI混合并在37℃下孵育过夜。使用TAE缓冲液,使所得PCR产物经受1%琼脂糖凝胶电泳。从凝胶切下大约1717bp的带并使用MinElute凝胶提取试剂盒进行纯化。
使用T4DNA连接酶将编码具有来自烟曲霉纤维二糖水解酶I的接头和碳水化合物结合模块(CBM)的R.byssochlamydoides纤维二糖水解酶I的1717bp片段克隆进用Bam HI和XhoI消化的pDAu109中。将Bam HI-Xho消化的pDau109和包含具有来自烟曲霉纤维二糖水解酶I编码序列的接头和碳水化合物结合模块(CBM)的R.byssochlamydoides纤维二糖水解酶I的Bam HI/XhoI片段以1:3的摩尔比混合(即,等体积的凝胶纯化的产物)并且在具有1mMATP的1X T4DNA连接酶缓冲液中用50单位的T4DNA连接酶连接并在22℃下孵育10分钟。
根据厂商的方案,将连接混合物转化进ONETOP10F′化学感受态大肠杆菌细胞中,并且将其分散在补充有0.1mg氨比西林/ml的LB板上。在37℃下孵育过夜后,观察到转化体在LB氨比西林板上在选择下生长。将两个转化体在补充有0.15mg氨比西林/ml的LB培养基中进行培养并且使用Spin Miniprep试剂盒分离质粒。
通过测序验证编码具有来自烟曲霉纤维二糖水解酶I的接头和碳水化合物结合模块(CBM)的R.byssochlamydoides纤维二糖水解酶I的DNA片段插入pDAu109中。使用应用生物系统3730xl DNA分析仪,用载体引物F-pDau109和R-pDau109对分离的质粒测序,以便确定不含PCR错误并且包含正确插入的代表性质粒。
选择不含PCR错误并且包含编码具有来自烟曲霉纤维二糖水解酶I的接头和碳水化合物结合模块(CBM)的R.byssochlamydoides纤维二糖水解酶I的DNA片段的一个质粒克隆并将其指定为质粒pE638。将相应的杂合多肽命名为RC1-638。
实例18:烟曲霉纤维二糖水解酶I(AC1-660和AC1-661)和具有来自烟曲霉纤维二糖水解酶I的接头和碳水化合物结合模块的Rasamsonia byssochlamydoides纤维二糖水解酶I的融合多肽(RC1-899)的定点诱变
质粒pE596(实例15)用于构建烟曲霉纤维二糖水解酶I变体AC1-660和AC1-661。
AC1-660(突变体DNA序列的SEQ ID NO:89和该变体的SEQ ID NO:90)在位置501(对应于碳水化合物结合模块的Y5W)处包含Y→W取代,并且通过将TAC密码子(Y501)用TGG密码子(501W)替换来产生。
AC1-661(突变体DNA序列的SEQ ID NO:91和该变体的SEQ ID NO:92)在位置527(对应于碳水化合物结合模块的Y31W)处包含Y→W取代,并且通过将TAC密码子(Y527)用TGG密码子(527W)替换来产生。
使用质粒pE638(实例17)来产生R.byssochlamydoides-烟曲霉融合纤维二糖水解酶I变体(RC1-899)。RC1-899(突变体DNA序列的SEQ ID NO:93和该变体的SEQ ID NO:94)在位置516(对应于碳水化合物结合模块的Y31W)处包含Y→W取代,并且通过将TAC密码子(Y516)用TGG密码子(516W)替换来产生。
使用SOE引物设计工具,为每个定点诱变设计两个合成引物。将编码野生型烟曲霉纤维二糖水解酶I的合成基因的定点诱变通过使用以下所述引物和程序对pE596进行PCR扩增来促进。将编码具有来自烟曲霉纤维二糖水解酶I的接头和碳水化合物结合模块(CBM)的R.byssochlamydoides纤维二糖水解酶I的融合基因的定点诱变通过使用引物F-Y527W和R-Y527W以及以下所述的程序对pE638进行PCR扩增来促进。
引物F-Y501W:
5’-GTACA GGTGT GGCCC AGCAC TGGGG ACAGT GTGGC GGTAT CGG-3’(SEQ ID NO:95)
引物R-Y501W:
5’-GTGCT GGGCC ACACC TGTAC CTCCA GGGTT G-3’(SEQ ID NO:96)
引物F-Y527W:
5’-ATACC TGTCA GAAAT TGAAC GACTG GTACT CGCAG TGTTT GTAAG CTTC-3’(SEQID NO:97)
引物R-Y527W:
5’-GTCGT TCAAT TTCTG ACAGG TATAA GGCGA TG-3’(SEQ ID NO:98)
使用高保真PCR试剂盒(纽英伦生物技术有限公司(New EnglandBiolabs Inc.)马萨诸塞州(MA),美国)通过PCR引入突变。PCR溶液由10μl的5X HF缓冲液、4μl的dNTP(2.5mM)、0.5μl的DNA聚合酶(0.2单位/μl)、0.25μl的引物F-Y501W或F-Y527W(100μM)、0.25μl的引物R-Y501W或R-Y527W(100μM)、5μl的模板DNA(pE596,1ng/μl或者pE638,1ng/μl)以及30μl的去离子水构成,总体积为50μl。使用应用生物系统(AppliedBiosystems)韦里蒂(Veriti)孔热循环仪进行PCR,编程为1个循环,在98℃下持续30秒;和19个循环,每个循环在98℃下持续30秒,在55℃下持续1分钟,以及在72℃下持续7分钟。然后将PCR溶液保持在8℃,直至从PCR仪中移出。
PCR后,将10个单位的DpnI直接添加至PCR溶液中并在37℃下孵育1小时。然后,根据厂商的方案将1μl的DpnI处理的PCR溶液转化进ONETOP10F′化学感受态大肠杆菌细胞中,并且将其分散在补充有0.15mg氨比西林/ml的LB板上。在37℃下孵育过夜后,观察到转化体在LB氨比西林板上在选择下生长。将四个转化体在补充有0.10mg的氨比西林/ml的LB培养基中进行培养并且使用Spin Miniprep试剂盒(凯杰公司(QIAGENInc.),巴伦西亚,加利福尼亚州,美国)分离质粒。
将pE596的分离的突变体质粒使用应用生物系统(Applied Biosystems)3730x1DNA分析仪(应用生物系统公司(Applied Biosystems),福斯特城,加利福尼亚州,美国),用引物F-pDau109(SEQ ID NO:59)、R-pDau109(SEQ ID NO:58)、F-pE596(SEQ ID NO:80)和R-pE596(SEQ ID NO:81)进行测序,以便确定不含PCR错误并包含所希望的突变的代表性质粒。
引物F-pDau109:
5’-CCACACTTCTCTTCCTTCCTCAATCCTC-3’(SEQ ID NO:59)
引物R-pDau109:
5’-ATCCTCAATTCCGTCGGTCGA-3’(SEQ ID NO:58)
引物F-pE596
5’-GTGAT ACACC CGGAC AGGTG ATGTG-3’(SEQ ID NO:80)
引物R-pE596
5’-CCATA TCGAT CCGAC GAGTA GGTTC-3’(SEQ ID NO:81)
选择不含PCR错误并且包含TAC(Y501)至TGG(501W)突变(对应于该碳水化合物结合模块的Y5W)的一个质粒克隆并将其命名为质粒pE660,并且相应的多肽命名为AC1-660。
选择不含PCR错误并且包含TAC(Y527)至TGG(527W)突变(对应于该碳水化合物结合模块的Y31W)的一个质粒克隆并将其命名为质粒pE661,并且相应的多肽命名为AC1-661。
将pE638的分离的突变体质粒使用应用生物系统(Applied Biosystems)3730x1DNA分析仪(应用生物系统公司(Applied Biosystems),福斯特城,加利福尼亚州,美国),用引物F-pDau109(SEQ ID NO:59)、R-pDau109(SEQ ID NO:58)、F-pE638(SEQ ID NO:99)和R-pE638(SEQ ID NO:100)进行测序,以便确定不含PCR错误并包含所希望的突变的代表性质粒。
引物F-pDau109:
5’-CCACACTTCTCTTCCTTCCTCAATCCTC-3’(SEQ ID NO:59)
引物R-pDau109:
5’-ATCCTCAATTCCGTCGGTCGA-3’(SEQ ID NO:58)
引物F-pE638:
5’-CCTCA GCCGA ACTCC GACAT TGC-3’(SEQ ID NO:99)
引物R-pE638:
5’-GCAAT GTCGG AGTTC GGCTG AGG-3’(SEQ ID NO:100)
选择不含PCR错误并且包含TAC(Y516)至TGG(516W)突变(对应于该碳水化合物结合模块的Y31W)的一个质粒克隆并将其命名为质粒pE899,并且相应的多肽命名为RC1-899。
实施例19:野生型烟曲霉纤维二糖水解酶I(AC1-596)、烟曲霉变体AC1-660和AC1-661、R.emersonii融合蛋白变体PC1-668以及R.byssochlamydoides-烟曲霉融合蛋白变体RC1-899的表达
根据克里斯滕森(Christensen)等人,1988(同上)和WO 2004/032648,将表达质粒pE596(实施例15)、pE660和pE661(实施例18)、pE668(实施例13)和pE899(实施例18)转化到米曲霉MT3568原生质体中。根据EP 0238023 B1,第14-15页的方法制备米曲霉MT3568原生质体。
在不具有Triton X-100的COVE蔗糖板上通过单一的分生孢子纯化转化体。将转化体的孢子接种进包含0.50ml的DAP-4C培养基的96深孔板中并且在34℃下静止孵育6天。
从96深孔培养的培养的上清液分析转化体的野生型烟曲霉纤维二糖水解酶I(AC1-596)、烟曲霉纤维二糖水解酶变体AC1-660和AC1-661、以及R.byssochlamydoides-烟曲霉融合纤维二糖水解酶I变体RC1-899的产生。通过测量由微晶纤维素的水解释放的还原糖验证表达。在32℃和1100rpm下,在96孔微量滴定板(NUNC赛默飞世尔科技公司,罗斯基勒,丹麦)中进行水解。每种水解反应混合物都包含50mM乙酸钠(pH 5.0)中的90g/升的170μl的微晶纤维素、0.01%X-100、20μl的培养上清液以及60μl的50mM乙酸钠(pH5.0)、0.01%X-100。将板用胶带密封。通过将板以3500rpm旋转3分钟而终止水解反应。然后,向96孔PCR板(赛默飞世尔科技公司,罗斯基勒,丹麦)中的37.5μl MQ水中添加12.5μl的反应上清液。向该混合物中添加75μl的终止液。终止溶液由2%(w/v)NaOH中的15mg/ml 4-羟基苯甲酰肼(西格玛化学有限公司,圣路易斯,密苏里州,美国)、50mg/ml酒石酸钾钠(西格玛化学有限公司,圣路易斯,密苏里州,美国)构成。将板用盖密封并且将混合物在95℃下孵育10分钟并且在20℃下孵育5分钟。然后,将100μl转移至微量滴定板中并且使用Plus 384(分子设备公司(Molecular Devices),森尼韦尔,加利福尼亚州,美国)测量410nm下的吸光度。还原糖的浓度与氧化的4-羟基苯甲酰肼在410nm下的吸光度成比例。通过向96孔PCR板中的75μl的终止溶液和49μl的milliQ水的混合物中添加1μl的培养上清液而测量培养上清液中的还原糖含量。将板用盖密封并且将混合物在95℃下孵育10分钟并且在20℃下孵育5分钟。然后,将100μl转移至微量滴定板中并在410nm下测量吸光度。从410nm下的水解反应的吸光度中减去来自细胞培养上清液的410nm下的吸光度,以测量由这些酶释放的还原糖的量。
基于微晶纤维素的水解程度,选择一个表达野生型烟曲霉纤维二糖水解酶I的转化体并且将其指定为米曲霉AC1-596。
基于微晶纤维素的水解程度,选择一个表达烟曲霉纤维二糖水解酶I变体AC1-660的转化体并且将其指定为米曲霉AC1-660。
基于微晶纤维素的水解程度,选择一个表达烟曲霉纤维二糖水解酶I变体AC1-661的转化体并且将其指定为米曲霉AC1-661。
基于微晶纤维素的水解程度,选择一个表达R.emersonii-里氏木霉融合纤维二糖水解酶I变体PC1-668的转化体并且将其指定为米曲霉PC1-668。
基于微晶纤维素的水解程度,选择一个表达R.byssochlamydoides-烟曲霉融合纤维二糖水解酶I变体RC1-899的转化体并且将其指定为米曲霉RC1-899。
对于更大规模的生产,将米曲霉AC1-596、米曲霉AC1-660、米曲霉AC1-661、米曲霉PC1-668或米曲霉RC1-899孢子分散到COVE蔗糖斜面上并且在37℃下孵育五天。用具有0.01%吐温(TWEEN)20的5ml MQ水将融合的孢子斜面洗涤两次。然后,使用孢子悬浮液以接种包含150ml的G2-Gly培养基的500ml烧瓶。以200rpm进行恒定振荡,将预培养物在30℃下进行孵育。一天后,使用预培养物来接种四个包含200ml的DAP-4C培养基的500ml烧瓶。在接种后第四天,经由瓶盖MF75Supor MachV 0.2μm PES过滤器通过过滤收集培养液。
实例20:杂合多肽PC1-147、PC1-499、PC1-500和PC1-688对纤维素酶组合物水解未洗涤的PCS的影响的比较
在35℃、50℃和60℃下,使用未洗涤的PCS作为底物,将杂合多肽PC1-499、PC1-500和PC1-668(分别包含对应于纤维素结合模块的Y32W、Y5W和Y13W的取代)添加到没有纤维二糖水解酶I(实例11)的纤维素分解酶组合物中,并针对杂合多肽PC1-147(缺少对应于CBM的Y5W、Y13W或Y32W的取代)进行比较。单独地以3.33mg酶蛋白/g纤维素向不具有纤维二糖水解酶I的纤维素酶组合物的5.67mg酶蛋白/g纤维素中添加每种纤维二糖水解酶I。
如在实例11中所描述进行该测定。将具有未洗涤的PCS(20%总固形物)的反应在35℃、50℃和60℃下于包含1mM硫酸锰的71mM乙酸钠(pH 5.0)缓冲液中进行72小时。一式四份地进行所有反应并且贯穿整个水解在200rpm下进行振荡。
图5中所示的结果展示,与包括缺少对应于CBM的Y5W、Y13W、或Y32W的任一取代的杂合多肽PC1-147的纤维素酶组合物相比,包含杂合多肽PC1-668(包含与具有对应于CBM的Y13W的取代的里氏木霉碳水化合物结合模块变体连接的R.emersoni纤维二糖水解酶I催化结构域)的纤维素酶组合物在所有温度下具有显著更高的纤维素转化率。如先前所观察到的,与PC1-147相比,杂合多肽PC1-499和杂合多肽PC1-500(包含连接到分别具有对应于CBM的Y32W或Y5W的取代的里氏木霉碳水化合物结合模块变体的R.emersonii纤维二糖水解酶I催化结构域)在所有温度下具有显著更高的纤维素转化率。
实施例21:变体多肽AC1-660、变体多肽AC1-661和野生型多肽AC1-596对维素酶组合物水解未洗涤的PCS的影响的比较
在35℃、50℃和60℃下,使用未洗涤的PCS作为底物,将变体多肽AC1-660和AC1-661(分别包含对应于纤维素结合模块的Y5W和Y13W的取代)添加到没有纤维二糖水解酶I(实例11)的纤维素分解酶组合物中,并针对野生型多肽AC1-596(缺少对应于CBM的Y5W和Y31W的任一取代)进行比较。单独地以3.33mg酶蛋白/g纤维素向不具有纤维二糖水解酶I的纤维素酶组合物的5.67mg酶蛋白/g纤维素中添加每种纤维二糖水解酶I。
如在实例11中所描述进行该测定。将具有未洗涤的PCS(20%总固形物)的反应在35℃、50℃和60℃下于包含1mM硫酸锰的71mM乙酸钠(pH 5.0)缓冲液中进行72小时。一式四份地进行所有反应并且贯穿整个水解在200rpm下进行振荡。
图6中所示的结果展示,与包括缺少对应于CBM的Y5W或Y31W的任一取代的野生型多肽AC1-596的纤维素酶组合物相比,包含变体多肽AC1-660(包含具有CBM的Y5W的取代的烟曲霉纤维二糖水解酶I变体)的纤维素酶组合物在所有温度下具有显著更高的纤维素转化率。此外,与AC1-596相比,该变体多肽AC1-661(包含具有对应于CBM的Y31W的取代的烟曲霉纤维二糖水解酶I变体)在所有温度下具有显著更高的纤维素转化率。
实施例22:变体多肽RC1-899和杂合多肽PC1-147对纤维素酶组合物水解未洗涤的PCS的影响的比较
在35℃、50℃和60℃下,使用未洗涤的PCS作为底物,将变体多肽RC1-899(与具有对应于CBM的Y31W的取代的烟曲霉碳水化合物结合模块连接的R.byssochlamydoides纤维二糖水解酶I催化结构域)添加到不含纤维二糖水解酶I的纤维素分解酶组合物(实施例11)中,并且针对杂合多肽PC1-147(包含连接到缺乏对应于CBM的Y31W的取代的R.emersonii纤维二糖水解酶I催化结构域)进行比较。单独地以2、3和4mg酶蛋白/g纤维素向不具有纤维二糖水解酶I的纤维素酶组合物的5.108mg酶蛋白/g纤维素中添加每种纤维二糖水解酶I。
如在实例11中所描述进行该测定。将具有未洗涤的PCS(20%总固形物)的反应在35℃、50℃和60℃下于包含1mM硫酸锰的80mM乙酸钠(pH 5.0)缓冲液中进行72小时。一式四份地进行所有反应并且贯穿整个水解在200rpm下进行振荡。
图7所示的结果展示,与包括杂合多肽PC1-147的纤维素酶组合物相比,包含变体多肽RC1-899的纤维素酶组合物在35℃和50℃下具有显著更高的纤维素转化率。
实施例23:通过差示扫描量热法确定R.byssochlamydoides-烟曲霉融合蛋白变体RC1-899的Td
使用一台VP-毛细管差示扫描量热仪(微量热公司(MicroCal Inc.),皮斯卡塔韦,新泽西州,美国)通过差示扫描热量测定(DSC)测定RC1-899的热稳定性。在200K/小时的恒定的程序化加热速率下,加热在缓冲液(50mM乙酸盐缓冲液,pH 5.0)中的酶溶液(大约0.5mg/ml)后获得的热分析图(Cp对T)中,将热变性温度Td(℃)当作变性峰(主要的吸热峰)的顶端。
将样品和参比溶液(大约0.2ml)从10℃下的储存条件装载到量热仪中(参比:不具有酶的缓冲液),并且在20℃下热预平衡20分钟,随后从20℃到100℃进行DSC扫描。以大约+/-1℃的精确度确定变性温度。
结果展示R.byssochlamydoides-烟曲霉融合纤维二糖水解酶I具有大约77℃的Td,该Td与PC1-147的改进的Td相可比较(在大约1摄氏度内)。
在此描述并且要求保护的本发明不局限于在此披露的特定方面的范围,因为这些方面旨在作为本发明若干方面的说明。预期任何等效方面都处于本发明的范围内。实际上,除在此所示和描述的那些之外,本发明的不同修改对于本领域普通技术人员而言从前述描述将变得清楚。这样的修饰也旨在落入所附权利要求的范围内。在有冲突的情况下,以包括定义的本披露为准。
序列表
<110> 诺维信有限公司(Novozymes A/S)
韦斯特, 彼得(Westh, Peter)
博尔奇, 金姆(Borch, Kim)
索伦森, 特赖因 H (Sorensen, Trine H)
温德尔, 迈克尔 S(Windahl, Michael S)
麦克布瑞尔, 布雷特(McBrayer, Brett)
<120> 碳水化合物结合模块变体以及编码它们的多核苷酸
<130> 13019-WO-PCT
<150> US 62/046,344
<151> 2014-09-05
<160> 100
<170> PatentIn版本3.5
<210> 1
<211> 1893
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 1
caactcagat cctccaggag acttgtacac catcttttga ggcacagaaa cccaatagtc 60
aaccgcggac tgcgcatcat gtatcggaag ttggccgtca tctcggcctt cttggccaca 120
gctcgtgctc agtcggcctg cactctccaa tcggagactc acccgcctct gacatggcag 180
aaatgctcgt ctggtggcac gtgcactcaa cagacaggct ccgtggtcat cgacgccaac 240
tggcgctgga ctcacgctac gaacagcagc acgaactgct acgatggcaa cacttggagc 300
tcgaccctat gtcctgacaa cgagacctgc gcgaagaact gctgtctgga cggtgccgcc 360
tacgcgtcca cgtacggagt taccacgagc ggtaacagcc tctccattgg ctttgtcacc 420
cagtctgcgc agaagaacgt tggcgctcgc ctttacctta tggcgagcga cacgacctac 480
caggaattca ccctgcttgg caacgagttc tctttcgatg ttgatgtttc gcagctgccg 540
tgcggcttga acggagctct ctacttcgtg tccatggacg cggatggtgg cgtgagcaag 600
tatcccacca acaccgctgg cgccaagtac ggcacggggt actgtgacag ccagtgtccc 660
cgcgatctga agttcatcaa tggccaggcc aacgttgagg gctgggagcc gtcatccaac 720
aacgcgaaca cgggcattgg aggacacgga agctgctgct ctgagatgga tatctgggag 780
gccaactcca tctccgaggc tcttaccccc cacccttgca cgactgtcgg ccaggagatc 840
tgcgagggtg atgggtgcgg cggaacttac tccgataaca gatatggcgg cacttgcgat 900
cccgatggct gcgactggaa cccataccgc ctgggcaaca ccagcttcta cggccctggc 960
tcaagcttta ccctcgatac caccaagaaa ttgaccgttg tcacccagtt cgagacgtcg 1020
ggtgccatca accgatacta tgtccagaat ggcgtcactt tccagcagcc caacgccgag 1080
cttggtagtt actctggcaa cgagctcaac gatgattact gcacagctga ggaggcagaa 1140
ttcggcggat cctctttctc agacaagggc ggcctgactc agttcaagaa ggctacctct 1200
ggcggcatgg ttctggtcat gagtctgtgg gatgattact acgccaacat gctgtggctg 1260
gactccacct acccgacaaa cgagacctcc tccacacccg gtgccgtgcg cggaagctgc 1320
tccaccagct ccggtgtccc tgctcaggtc gaatctcagt ctcccaacgc caaggtcacc 1380
ttctccaaca tcaagttcgg acccattggc agcaccggca accctagcgg cggcaaccct 1440
cccggcggaa acccgcctgg caccaccacc acccgccgcc cagccactac cactggaagc 1500
tctcccggac ctacccagtc tcactacggc cagtgcggcg gtattggcta cagcggcccc 1560
acggtctgcg ccagcggcac aacttgccag gtcctgaacc cttactactc tcagtgcctg 1620
taaagctccg tggcgaaagc ctgacgcacc ggtagattct tggtgagccc gtatcatgac 1680
ggcggcggga gctacatggc cccgggtgat ttattttttt tgtatctact tctgaccctt 1740
ttcaaatata cggtcaactc atctttcact ggagatgcgg cctgcttggt attgcgatgt 1800
tgtcagcttg gcaaattgtg gctttcgaaa acacaaaacg attccttagt agccatgcat 1860
tttaagataa cggaatagaa gaaagaggaa att 1893
<210> 2
<211> 514
<212> PRT
<213> 里氏木霉(Trichoderma reesei)
<400> 2
Met Tyr Arg Lys Leu Ala Val Ile Ser Ala Phe Leu Ala Thr Ala Arg
1 5 10 15
Ala Gln Ser Ala Cys Thr Leu Gln Ser Glu Thr His Pro Pro Leu Thr
20 25 30
Trp Gln Lys Cys Ser Ser Gly Gly Thr Cys Thr Gln Gln Thr Gly Ser
35 40 45
Val Val Ile Asp Ala Asn Trp Arg Trp Thr His Ala Thr Asn Ser Ser
50 55 60
Thr Asn Cys Tyr Asp Gly Asn Thr Trp Ser Ser Thr Leu Cys Pro Asp
65 70 75 80
Asn Glu Thr Cys Ala Lys Asn Cys Cys Leu Asp Gly Ala Ala Tyr Ala
85 90 95
Ser Thr Tyr Gly Val Thr Thr Ser Gly Asn Ser Leu Ser Ile Gly Phe
100 105 110
Val Thr Gln Ser Ala Gln Lys Asn Val Gly Ala Arg Leu Tyr Leu Met
115 120 125
Ala Ser Asp Thr Thr Tyr Gln Glu Phe Thr Leu Leu Gly Asn Glu Phe
130 135 140
Ser Phe Asp Val Asp Val Ser Gln Leu Pro Cys Gly Leu Asn Gly Ala
145 150 155 160
Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Val Ser Lys Tyr Pro
165 170 175
Thr Asn Thr Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln
180 185 190
Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Glu Gly
195 200 205
Trp Glu Pro Ser Ser Asn Asn Ala Asn Thr Gly Ile Gly Gly His Gly
210 215 220
Ser Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Ser Ile Ser Glu
225 230 235 240
Ala Leu Thr Pro His Pro Cys Thr Thr Val Gly Gln Glu Ile Cys Glu
245 250 255
Gly Asp Gly Cys Gly Gly Thr Tyr Ser Asp Asn Arg Tyr Gly Gly Thr
260 265 270
Cys Asp Pro Asp Gly Cys Asp Trp Asn Pro Tyr Arg Leu Gly Asn Thr
275 280 285
Ser Phe Tyr Gly Pro Gly Ser Ser Phe Thr Leu Asp Thr Thr Lys Lys
290 295 300
Leu Thr Val Val Thr Gln Phe Glu Thr Ser Gly Ala Ile Asn Arg Tyr
305 310 315 320
Tyr Val Gln Asn Gly Val Thr Phe Gln Gln Pro Asn Ala Glu Leu Gly
325 330 335
Ser Tyr Ser Gly Asn Glu Leu Asn Asp Asp Tyr Cys Thr Ala Glu Glu
340 345 350
Ala Glu Phe Gly Gly Ser Ser Phe Ser Asp Lys Gly Gly Leu Thr Gln
355 360 365
Phe Lys Lys Ala Thr Ser Gly Gly Met Val Leu Val Met Ser Leu Trp
370 375 380
Asp Asp Tyr Tyr Ala Asn Met Leu Trp Leu Asp Ser Thr Tyr Pro Thr
385 390 395 400
Asn Glu Thr Ser Ser Thr Pro Gly Ala Val Arg Gly Ser Cys Ser Thr
405 410 415
Ser Ser Gly Val Pro Ala Gln Val Glu Ser Gln Ser Pro Asn Ala Lys
420 425 430
Val Thr Phe Ser Asn Ile Lys Phe Gly Pro Ile Gly Ser Thr Gly Asn
435 440 445
Pro Ser Gly Gly Asn Pro Pro Gly Gly Asn Pro Pro Gly Thr Thr Thr
450 455 460
Thr Arg Arg Pro Ala Thr Thr Thr Gly Ser Ser Pro Gly Pro Thr Gln
465 470 475 480
Ser His Tyr Gly Gln Cys Gly Gly Ile Gly Tyr Ser Gly Pro Thr Val
485 490 495
Cys Ala Ser Gly Thr Thr Cys Gln Val Leu Asn Pro Tyr Tyr Ser Gln
500 505 510
Cys Leu
<210> 3
<211> 108
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 3
acccagtctc actacggcca gtgcggcggt attggctaca gcggccccac ggtctgcgcc 60
agcggcacaa cttgccaggt cctgaaccct tactactctc agtgcctg 108
<210> 4
<211> 36
<212> PRT
<213> 里氏木霉(Trichoderma reesei)
<400> 4
Thr Gln Ser His Tyr Gly Gln Cys Gly Gly Ile Gly Tyr Ser Gly Pro
1 5 10 15
Thr Val Cys Ala Ser Gly Thr Thr Cys Gln Val Leu Asn Pro Tyr Tyr
20 25 30
Ser Gln Cys Leu
35
<210> 5
<211> 1638
<212> DNA
<213> 特异腐质霉(Humicola insolens)
<400> 5
atgcgtaccg ccaagttcgc caccctcgcc gcccttgtgg cctcggccgc cgcccagcag 60
gcgtgcagtc tcaccaccga gaggcaccct tccctctctt ggaacaagtg caccgccggc 120
ggccagtgcc agaccgtcca ggcttccatc actctcgact ccaactggcg ctggactcac 180
caggtgtctg gctccaccaa ctgctacacg ggcaacaagt gggatactag catctgcact 240
gatgccaagt cgtgcgctca gaactgctgc gtcgatggtg ccgactacac cagcacctat 300
ggcatcacca ccaacggtga ttccctgagc ctcaagttcg tcaccaaggg ccagcactcg 360
accaacgtcg gctcgcgtac ctacctgatg gacggcgagg acaagtatca gagtacgttc 420
tatcttcagc cttctcgcgc cttgaatcct ggctaacgtt tacacttcac agccttcgag 480
ctcctcggca acgagttcac cttcgatgtc gatgtctcca acatcggctg cggtctcaac 540
ggcgccctgt acttcgtctc catggacgcc gatggtggtc tcagccgcta tcctggcaac 600
aaggctggtg ccaagtacgg taccggctac tgcgatgctc agtgcccccg tgacatcaag 660
ttcatcaacg gcgaggccaa cattgagggc tggaccggct ccaccaacga ccccaacgcc 720
ggcgcgggcc gctatggtac ctgctgctct gagatggata tctgggaagc caacaacatg 780
gctactgcct tcactcctca cccttgcacc atcattggcc agagccgctg cgagggcgac 840
tcgtgcggtg gcacctacag caacgagcgc tacgccggcg tctgcgaccc cgatggctgc 900
gacttcaact cgtaccgcca gggcaacaag accttctacg gcaagggcat gaccgtcgac 960
accaccaaga agatcactgt cgtcacccag ttcctcaagg atgccaacgg cgatctcggc 1020
gagatcaagc gcttctacgt ccaggatggc aagatcatcc ccaactccga gtccaccatc 1080
cccggcgtcg agggcaattc catcacccag gactggtgcg accgccagaa ggttgccttt 1140
ggcgacattg acgacttcaa ccgcaagggc ggcatgaagc agatgggcaa ggccctcgcc 1200
ggccccatgg tcctggtcat gtccatctgg gatgaccacg cctccaacat gctctggctc 1260
gactcgacct tccctgtcga tgccgctggc aagcccggcg ccgagcgcgg tgcctgcccg 1320
accacctcgg gtgtccctgc tgaggttgag gccgaggccc ccaacagcaa cgtcgtcttc 1380
tccaacatcc gcttcggccc catcggctcg accgttgctg gtctccccgg cgcgggcaac 1440
ggcggcaaca acggcggcaa ccccccgccc cccaccacca ccacctcctc ggctccggcc 1500
accaccacca ccgccagcgc tggccccaag gctggccgct ggcagcagtg cggcggcatc 1560
ggcttcactg gcccgaccca gtgcgaggag ccctacattt gcaccaagct caacgactgg 1620
tactctcagt gcctgtaa 1638
<210> 6
<211> 525
<212> PRT
<213> 特异腐质霉(Humicola insolens)
<400> 6
Met Arg Thr Ala Lys Phe Ala Thr Leu Ala Ala Leu Val Ala Ser Ala
1 5 10 15
Ala Ala Gln Gln Ala Cys Ser Leu Thr Thr Glu Arg His Pro Ser Leu
20 25 30
Ser Trp Asn Lys Cys Thr Ala Gly Gly Gln Cys Gln Thr Val Gln Ala
35 40 45
Ser Ile Thr Leu Asp Ser Asn Trp Arg Trp Thr His Gln Val Ser Gly
50 55 60
Ser Thr Asn Cys Tyr Thr Gly Asn Lys Trp Asp Thr Ser Ile Cys Thr
65 70 75 80
Asp Ala Lys Ser Cys Ala Gln Asn Cys Cys Val Asp Gly Ala Asp Tyr
85 90 95
Thr Ser Thr Tyr Gly Ile Thr Thr Asn Gly Asp Ser Leu Ser Leu Lys
100 105 110
Phe Val Thr Lys Gly Gln His Ser Thr Asn Val Gly Ser Arg Thr Tyr
115 120 125
Leu Met Asp Gly Glu Asp Lys Tyr Gln Thr Phe Glu Leu Leu Gly Asn
130 135 140
Glu Phe Thr Phe Asp Val Asp Val Ser Asn Ile Gly Cys Gly Leu Asn
145 150 155 160
Gly Ala Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Leu Ser Arg
165 170 175
Tyr Pro Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp
180 185 190
Ala Gln Cys Pro Arg Asp Ile Lys Phe Ile Asn Gly Glu Ala Asn Ile
195 200 205
Glu Gly Trp Thr Gly Ser Thr Asn Asp Pro Asn Ala Gly Ala Gly Arg
210 215 220
Tyr Gly Thr Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Asn Met
225 230 235 240
Ala Thr Ala Phe Thr Pro His Pro Cys Thr Ile Ile Gly Gln Ser Arg
245 250 255
Cys Glu Gly Asp Ser Cys Gly Gly Thr Tyr Ser Asn Glu Arg Tyr Ala
260 265 270
Gly Val Cys Asp Pro Asp Gly Cys Asp Phe Asn Ser Tyr Arg Gln Gly
275 280 285
Asn Lys Thr Phe Tyr Gly Lys Gly Met Thr Val Asp Thr Thr Lys Lys
290 295 300
Ile Thr Val Val Thr Gln Phe Leu Lys Asp Ala Asn Gly Asp Leu Gly
305 310 315 320
Glu Ile Lys Arg Phe Tyr Val Gln Asp Gly Lys Ile Ile Pro Asn Ser
325 330 335
Glu Ser Thr Ile Pro Gly Val Glu Gly Asn Ser Ile Thr Gln Asp Trp
340 345 350
Cys Asp Arg Gln Lys Val Ala Phe Gly Asp Ile Asp Asp Phe Asn Arg
355 360 365
Lys Gly Gly Met Lys Gln Met Gly Lys Ala Leu Ala Gly Pro Met Val
370 375 380
Leu Val Met Ser Ile Trp Asp Asp His Ala Ser Asn Met Leu Trp Leu
385 390 395 400
Asp Ser Thr Phe Pro Val Asp Ala Ala Gly Lys Pro Gly Ala Glu Arg
405 410 415
Gly Ala Cys Pro Thr Thr Ser Gly Val Pro Ala Glu Val Glu Ala Glu
420 425 430
Ala Pro Asn Ser Asn Val Val Phe Ser Asn Ile Arg Phe Gly Pro Ile
435 440 445
Gly Ser Thr Val Ala Gly Leu Pro Gly Ala Gly Asn Gly Gly Asn Asn
450 455 460
Gly Gly Asn Pro Pro Pro Pro Thr Thr Thr Thr Ser Ser Ala Pro Ala
465 470 475 480
Thr Thr Thr Thr Ala Ser Ala Gly Pro Lys Ala Gly Arg Trp Gln Gln
485 490 495
Cys Gly Gly Ile Gly Phe Thr Gly Pro Thr Gln Cys Glu Glu Pro Tyr
500 505 510
Ile Cys Thr Lys Leu Asn Asp Trp Tyr Ser Gln Cys Leu
515 520 525
<210> 7
<211> 110
<212> DNA
<213> 特异腐质霉(Humicola insolens)
<400> 7
cccaaggctg gccgctggca gcagtgcggc ggcatcggct tcactggccc gacccagtgc 60
gaggagccct acatttgcac caagctcaac gactggtact ctcagtgcct 110
<210> 8
<211> 37
<212> PRT
<213> 特异腐质霉(Humicola insolens)
<400> 8
Pro Lys Ala Gly Arg Trp Gln Gln Cys Gly Gly Ile Gly Phe Thr Gly
1 5 10 15
Pro Thr Gln Cys Glu Glu Pro Tyr Ile Cys Thr Lys Leu Asn Asp Trp
20 25 30
Tyr Ser Gln Cys Leu
35
<210> 9
<211> 1593
<212> DNA
<213> 嗜热毛壳菌(Chaetomium thermophilum)
<400> 9
atgatgtaca agaagttcgc cgctctcgcc gccctcgtgg ctggcgccgc cgcccagcag 60
gcttgctccc tcaccactga gacccacccc agactcactt ggaagcgctg cacctctggc 120
ggcaactgct cgaccgtgaa cggcgccgtc accatcgatg ccaactggcg ctggactcac 180
actgtttccg gctcgaccaa ctgctacacc ggcaacgagt gggatacctc catctgctct 240
gatggcaaga gctgcgccca gacctgctgc gtcgacggcg ctgactactc ttcgacctat 300
ggtatcacca ccagcggtga ctccctgaac ctcaagttcg tcaccaagca ccagcacggc 360
accaatgtcg gctctcgtgt ctacctgatg gagaacgaca ccaagtacca gatgttcgag 420
ctcctcggca acgagttcac cttcgatgtc gatgtctcta acctgggctg cggtctcaac 480
ggcgccctct acttcgtctc catggacgct gatggtggta tgagcaagta ctctggcaac 540
aaggctggcg ccaagtacgg taccggctac tgcgatgctc agtgcccgcg cgaccttaag 600
ttcatcaacg gcgaggccaa cattgagaac tggacccctt cgaccaatga tgccaacgcc 660
ggtttcggcc gctatggcag ctgctgctct gagatggata tctgggatgc caacaacatg 720
gctactgcct tcactcctca cccttgcacc attatcggcc agagccgctg cgagggcaac 780
agctgcggtg gcacctacag ctctgagcgc tatgctggtg tttgcgatcc tgatggctgc 840
gacttcaacg cctaccgcca gggcgacaag accttctacg gcaagggcat gaccgtcgac 900
accaccaaga agatgaccgt cgtcacccag ttccacaaga actcggctgg cgtcctcagc 960
gagatcaagc gcttctacgt tcaggacggc aagatcattg ccaacgccga gtccaagatc 1020
cccggcaacc ccggcaactc catcacccag gagtggtgcg atgcccagaa ggtcgccttc 1080
ggtgacatcg atgacttcaa ccgcaagggc ggtatggctc agatgagcaa ggccctcgag 1140
ggccctatgg tcctggtcat gtccgtctgg gatgaccact acgccaacat gctctggctc 1200
gactcgacct accccattga caaggccggc acccccggcg ccgagcgcgg tgcttgcccg 1260
accacctccg gtgtccctgc cgagattgag gcccaggtcc ccaacagcaa cgttatcttc 1320
tccaacatcc gcttcggccc catcggctcg accgtccctg gcctcgacgg cagcaccccc 1380
agcaacccga ccgccaccgt tgctcctccc acttctacca ccaccagcgt gagaagcagc 1440
actactcaga tttccacccc gactagccag cccggcggct gcaccaccca gaagtggggc 1500
cagtgcggtg gtatcggcta caccggctgc actaactgcg ttgctggcac tacctgcact 1560
gagctcaacc cctggtacag ccagtgcctg taa 1593
<210> 10
<211> 530
<212> PRT
<213> 嗜热毛壳菌(Chaetomium thermophilum)
<400> 10
Met Met Tyr Lys Lys Phe Ala Ala Leu Ala Ala Leu Val Ala Gly Ala
1 5 10 15
Ala Ala Gln Gln Ala Cys Ser Leu Thr Thr Glu Thr His Pro Arg Leu
20 25 30
Thr Trp Lys Arg Cys Thr Ser Gly Gly Asn Cys Ser Thr Val Asn Gly
35 40 45
Ala Val Thr Ile Asp Ala Asn Trp Arg Trp Thr His Thr Val Ser Gly
50 55 60
Ser Thr Asn Cys Tyr Thr Gly Asn Glu Trp Asp Thr Ser Ile Cys Ser
65 70 75 80
Asp Gly Lys Ser Cys Ala Gln Thr Cys Cys Val Asp Gly Ala Asp Tyr
85 90 95
Ser Ser Thr Tyr Gly Ile Thr Thr Ser Gly Asp Ser Leu Asn Leu Lys
100 105 110
Phe Val Thr Lys His Gln His Gly Thr Asn Val Gly Ser Arg Val Tyr
115 120 125
Leu Met Glu Asn Asp Thr Lys Tyr Gln Met Phe Glu Leu Leu Gly Asn
130 135 140
Glu Phe Thr Phe Asp Val Asp Val Ser Asn Leu Gly Cys Gly Leu Asn
145 150 155 160
Gly Ala Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Met Ser Lys
165 170 175
Tyr Ser Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp
180 185 190
Ala Gln Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Glu Ala Asn Ile
195 200 205
Glu Asn Trp Thr Pro Ser Thr Asn Asp Ala Asn Ala Gly Phe Gly Arg
210 215 220
Tyr Gly Ser Cys Cys Ser Glu Met Asp Ile Trp Asp Ala Asn Asn Met
225 230 235 240
Ala Thr Ala Phe Thr Pro His Pro Cys Thr Ile Ile Gly Gln Ser Arg
245 250 255
Cys Glu Gly Asn Ser Cys Gly Gly Thr Tyr Ser Ser Glu Arg Tyr Ala
260 265 270
Gly Val Cys Asp Pro Asp Gly Cys Asp Phe Asn Ala Tyr Arg Gln Gly
275 280 285
Asp Lys Thr Phe Tyr Gly Lys Gly Met Thr Val Asp Thr Thr Lys Lys
290 295 300
Met Thr Val Val Thr Gln Phe His Lys Asn Ser Ala Gly Val Leu Ser
305 310 315 320
Glu Ile Lys Arg Phe Tyr Val Gln Asp Gly Lys Ile Ile Ala Asn Ala
325 330 335
Glu Ser Lys Ile Pro Gly Asn Pro Gly Asn Ser Ile Thr Gln Glu Trp
340 345 350
Cys Asp Ala Gln Lys Val Ala Phe Gly Asp Ile Asp Asp Phe Asn Arg
355 360 365
Lys Gly Gly Met Ala Gln Met Ser Lys Ala Leu Glu Gly Pro Met Val
370 375 380
Leu Val Met Ser Val Trp Asp Asp His Tyr Ala Asn Met Leu Trp Leu
385 390 395 400
Asp Ser Thr Tyr Pro Ile Asp Lys Ala Gly Thr Pro Gly Ala Glu Arg
405 410 415
Gly Ala Cys Pro Thr Thr Ser Gly Val Pro Ala Glu Ile Glu Ala Gln
420 425 430
Val Pro Asn Ser Asn Val Ile Phe Ser Asn Ile Arg Phe Gly Pro Ile
435 440 445
Gly Ser Thr Val Pro Gly Leu Asp Gly Ser Thr Pro Ser Asn Pro Thr
450 455 460
Ala Thr Val Ala Pro Pro Thr Ser Thr Thr Thr Ser Val Arg Ser Ser
465 470 475 480
Thr Thr Gln Ile Ser Thr Pro Thr Ser Gln Pro Gly Gly Cys Thr Thr
485 490 495
Gln Lys Trp Gly Gln Cys Gly Gly Ile Gly Tyr Thr Gly Cys Thr Asn
500 505 510
Cys Val Ala Gly Thr Thr Cys Thr Glu Leu Asn Pro Trp Tyr Ser Gln
515 520 525
Cys Leu
530
<210> 11
<211> 117
<212> DNA
<213> 嗜热毛壳菌(Chaetomium thermophilum)
<400> 11
ggcggctgca ccacccagaa gtggggccag tgcggtggta tcggctacac cggctgcact 60
aactgcgttg ctggcactac ctgcactgag ctcaacccct ggtacagcca gtgcctg 117
<210> 12
<211> 39
<212> PRT
<213> 嗜热毛壳菌(Chaetomium thermophilum)
<400> 12
Gly Gly Cys Thr Thr Gln Lys Trp Gly Gln Cys Gly Gly Ile Gly Tyr
1 5 10 15
Thr Gly Cys Thr Asn Cys Val Ala Gly Thr Thr Cys Thr Glu Leu Asn
20 25 30
Pro Trp Tyr Ser Gln Cys Leu
35
<210> 13
<211> 1614
<212> DNA
<213> 丝衣霉状篮状菌(Talaromyces byssochlamydoides)
<400> 13
atgtccgcct ctctttctta cagactctac gaaaatgctc tcattctctg ttccctcgtg 60
gttgctgccc agggccagca gattggcacc ttgcaggctg aggtccaccc ttctctgact 120
tgggagacct gcagcaccgg cggcagttgt accaccatcg acggctctat cgtccttgat 180
gccaactggc gctgggtcca ccaggtcggc accagcacca actgctatac cggcaatacc 240
tgggatacct ccatctgcga taccgatacg acctgtgccc aagaatgcgc tgtcgatggt 300
gctgactacg agagcaccta cggtatcacc accagcggca atgaagttcg tctcaacttt 360
gtcaccgaca actcgaatgg agcgaacgtc ggctcccgtg tctacctaat ggcggatgac 420
acccactacc agatcttcaa tctgctgaac caggagttta ccttcacagt ggatgtctca 480
aacctgccct gcggtctcaa cggcgccctc tacctcgttg ttatggatgc cgacggtggt 540
gtatccgagt atacgaataa tgcggctggt gctcagtatg gtgtgggcta ctgtgactcg 600
cagtgtcccc gagatctcaa gttcatccaa ggccaggcca acgttgaggg ctggacacct 660
tcctccaata atgccaatac tggtgttggg aacctcgggt cctgctgtgc agaaatagat 720
atctgggaat cgaacagcat ttctcaagcg cttaccgccc atccgtgcaa cactcccaca 780
aatacggtgt gtgatggcaa cgcctgcggt ggcacataca gcactactcg ctatgctggc 840
acttgtgatc ctgatggctg tgatttcaac ccgtaccggt tgggcaacac gactttctat 900
ggtcctggca tgactattga taccacccag ccgatcaccg ttgtcactca gttcatcact 960
gatgatggaa cttccactgg caccttgtct gaaattaagc gctactacat tcagaacgac 1020
gtcgtgtatg cccagcccaa ctccgacatc gctggcatta ctggaaatgt cattgatgcc 1080
gcttactgta ccgctgagaa ttctgtcttc caagaagaag gttccttcgc acaacacggt 1140
ggcatgagtg gtgtcagtga ggctctgtcc gctggtatgg tcttggtcat gagcgtgtgg 1200
gatgactacg acgccaatat gctgtggctc gacagcgact acccaaccaa cgagtctaca 1260
agcacccccg gtgtggcccg aggtagctgt tccacttcct ctggtgttcc cgccaccgtt 1320
gaatcccaga gccctaactc ctatgtgatc tactcgaaca tcaaggttgg tcccatcggc 1380
tcgaccttca gttccggtgg ttctggcagt ggctctggcg gcggttccgg tggctctagc 1440
accactacaa ccaccacttc gtccacgccc acgactacca gctcttccgg ctctggcagt 1500
ggcgtcgctc agcactgggg acagtgcggt ggtgagggct ggactggccc aactacctgt 1560
gcctccccgt acacctgtca ggagcagaac ccttactact cccagtgtct gtaa 1614
<210> 14
<211> 537
<212> PRT
<213> 丝衣霉状篮状菌(Talaromyces byssochlamydoides)
<400> 14
Met Ser Ala Ser Leu Ser Tyr Arg Leu Tyr Glu Asn Ala Leu Ile Leu
1 5 10 15
Cys Ser Leu Val Val Ala Ala Gln Gly Gln Gln Ile Gly Thr Leu Gln
20 25 30
Ala Glu Val His Pro Ser Leu Thr Trp Glu Thr Cys Ser Thr Gly Gly
35 40 45
Ser Cys Thr Thr Ile Asp Gly Ser Ile Val Leu Asp Ala Asn Trp Arg
50 55 60
Trp Val His Gln Val Gly Thr Ser Thr Asn Cys Tyr Thr Gly Asn Thr
65 70 75 80
Trp Asp Thr Ser Ile Cys Asp Thr Asp Thr Thr Cys Ala Gln Glu Cys
85 90 95
Ala Val Asp Gly Ala Asp Tyr Glu Ser Thr Tyr Gly Ile Thr Thr Ser
100 105 110
Gly Asn Glu Val Arg Leu Asn Phe Val Thr Asp Asn Ser Asn Gly Ala
115 120 125
Asn Val Gly Ser Arg Val Tyr Leu Met Ala Asp Asp Thr His Tyr Gln
130 135 140
Ile Phe Asn Leu Leu Asn Gln Glu Phe Thr Phe Thr Val Asp Val Ser
145 150 155 160
Asn Leu Pro Cys Gly Leu Asn Gly Ala Leu Tyr Leu Val Val Met Asp
165 170 175
Ala Asp Gly Gly Val Ser Glu Tyr Thr Asn Asn Ala Ala Gly Ala Gln
180 185 190
Tyr Gly Val Gly Tyr Cys Asp Ser Gln Cys Pro Arg Asp Leu Lys Phe
195 200 205
Ile Gln Gly Gln Ala Asn Val Glu Gly Trp Thr Pro Ser Ser Asn Asn
210 215 220
Ala Asn Thr Gly Val Gly Asn Leu Gly Ser Cys Cys Ala Glu Ile Asp
225 230 235 240
Ile Trp Glu Ser Asn Ser Ile Ser Gln Ala Leu Thr Ala His Pro Cys
245 250 255
Asn Thr Pro Thr Asn Thr Val Cys Asp Gly Asn Ala Cys Gly Gly Thr
260 265 270
Tyr Ser Thr Thr Arg Tyr Ala Gly Thr Cys Asp Pro Asp Gly Cys Asp
275 280 285
Phe Asn Pro Tyr Arg Leu Gly Asn Thr Thr Phe Tyr Gly Pro Gly Met
290 295 300
Thr Ile Asp Thr Thr Gln Pro Ile Thr Val Val Thr Gln Phe Ile Thr
305 310 315 320
Asp Asp Gly Thr Ser Thr Gly Thr Leu Ser Glu Ile Lys Arg Tyr Tyr
325 330 335
Ile Gln Asn Asp Val Val Tyr Ala Gln Pro Asn Ser Asp Ile Ala Gly
340 345 350
Ile Thr Gly Asn Val Ile Asp Ala Ala Tyr Cys Thr Ala Glu Asn Ser
355 360 365
Val Phe Gln Glu Glu Gly Ser Phe Ala Gln His Gly Gly Met Ser Gly
370 375 380
Val Ser Glu Ala Leu Ser Ala Gly Met Val Leu Val Met Ser Val Trp
385 390 395 400
Asp Asp Tyr Asp Ala Asn Met Leu Trp Leu Asp Ser Asp Tyr Pro Thr
405 410 415
Asn Glu Ser Thr Ser Thr Pro Gly Val Ala Arg Gly Ser Cys Ser Thr
420 425 430
Ser Ser Gly Val Pro Ala Thr Val Glu Ser Gln Ser Pro Asn Ser Tyr
435 440 445
Val Ile Tyr Ser Asn Ile Lys Val Gly Pro Ile Gly Ser Thr Phe Ser
450 455 460
Ser Gly Gly Ser Gly Ser Gly Ser Gly Gly Gly Ser Gly Gly Ser Ser
465 470 475 480
Thr Thr Thr Thr Thr Thr Ser Ser Thr Pro Thr Thr Thr Ser Ser Ser
485 490 495
Gly Ser Gly Ser Gly Val Ala Gln His Trp Gly Gln Cys Gly Gly Glu
500 505 510
Gly Trp Thr Gly Pro Thr Thr Cys Ala Ser Pro Tyr Thr Cys Gln Glu
515 520 525
Gln Asn Pro Tyr Tyr Ser Gln Cys Leu
530 535
<210> 15
<211> 108
<212> DNA
<213> 丝衣霉状篮状菌(Talaromyces byssochlamydoides)
<400> 15
gtcgctcagc actggggaca gtgcggtggt gagggctgga ctggcccaac tacctgtgcc 60
tccccgtaca cctgtcagga gcagaaccct tactactccc agtgtctg 108
<210> 16
<211> 36
<212> PRT
<213> 丝衣霉状篮状菌(Talaromyces byssochlamydoides)
<400> 16
Val Ala Gln His Trp Gly Gln Cys Gly Gly Glu Gly Trp Thr Gly Pro
1 5 10 15
Thr Thr Cys Ala Ser Pro Tyr Thr Cys Gln Glu Gln Asn Pro Tyr Tyr
20 25 30
Ser Gln Cys Leu
35
<210> 17
<211> 1599
<212> DNA
<213> 烟曲霉(Aspergillus fumigatus)
<400> 17
atgctggcct ccaccttctc ctaccgcatg tacaagaccg cgctcatcct ggccgccctt 60
ctgggctctg gccaggctca gcaggtcggt acttcccagg cggaagtgca tccgtccatg 120
acctggcaga gctgcacggc tggcggcagc tgcaccacca acaacggcaa ggtggtcatc 180
gacgcgaact ggcgttgggt gcacaaagtc ggcgactaca ccaactgcta caccggcaac 240
acctgggaca cgactatctg ccctgacgat gcgacctgcg catccaactg cgcccttgag 300
ggtgccaact acgaatccac ctatggtgtg accgccagcg gcaattccct ccgcctcaac 360
ttcgtcacca ccagccagca gaagaacatt ggctcgcgtc tgtacatgat gaaggacgac 420
tcgacctacg agatgtttaa gctgctgaac caggagttca ccttcgatgt cgatgtctcc 480
aacctcccct gcggtctcaa cggtgctctg tactttgtcg ccatggacgc cggcggtggc 540
atgtccaagt acccaaccaa caaggccggt gccaagtacg gtactggata ctgtgactcg 600
cagtgccctc gcgacctcaa gttcatcaac ggtcaggcca acgttgaagg gtggcagccc 660
tcctccaacg atgccaatgc gggtaccggc aaccacgggt cctgctgcgc ggagatggat 720
atctgggagg ccaacagcat ctccacggcc ttcacccccc atccgtgcga cacgcccggc 780
caggtgatgt gcaccggtga tgcctgcggt ggcacctaca gctccgaccg ctacggcggc 840
acctgcgacc ccgacggatg tgatttcaac tccttccgcc agggcaacaa gaccttctac 900
ggccctggca tgaccgtcga caccaagagc aagtttaccg tcgtcaccca gttcatcacc 960
gacgacggca cctccagcgg caccctcaag gagatcaagc gcttctacgt gcagaacggc 1020
aaggtgatcc ccaactcgga gtcgacctgg accggcgtca gcggcaactc catcaccacc 1080
gagtactgca ccgcccagaa gagcctgttc caggaccaga acgtcttcga aaagcacggc 1140
ggcctcgagg gcatgggtgc tgccctcgcc cagggcatgg ttctcgtcat gtccctgtgg 1200
gatgatcact cggccaacat gctctggctc gacagcaact acccgaccac tgcctcttcc 1260
accactcccg gcgtcgcccg tggtacctgc gacatctcct ccggcgtccc tgcggatgtc 1320
gaggcgaacc accccgacgc ctacgtcgtc tactccaaca tcaaggtcgg ccccatcggc 1380
tcgaccttca acagcggtgg ctcgaacccc ggtggcggaa ccaccacgac aactaccacc 1440
cagcctacta ccaccacgac cacggctgga aaccctggcg gcaccggagt cgcacagcac 1500
tatggccagt gtggtggaat cggatggacc ggacccacaa cctgtgccag cccttatacc 1560
tgccagaagc tgaatgatta ttactctcag tgcctgtag 1599
<210> 18
<211> 532
<212> PRT
<213> 烟曲霉(Aspergillus fumigatus)
<400> 18
Met Leu Ala Ser Thr Phe Ser Tyr Arg Met Tyr Lys Thr Ala Leu Ile
1 5 10 15
Leu Ala Ala Leu Leu Gly Ser Gly Gln Ala Gln Gln Val Gly Thr Ser
20 25 30
Gln Ala Glu Val His Pro Ser Met Thr Trp Gln Ser Cys Thr Ala Gly
35 40 45
Gly Ser Cys Thr Thr Asn Asn Gly Lys Val Val Ile Asp Ala Asn Trp
50 55 60
Arg Trp Val His Lys Val Gly Asp Tyr Thr Asn Cys Tyr Thr Gly Asn
65 70 75 80
Thr Trp Asp Thr Thr Ile Cys Pro Asp Asp Ala Thr Cys Ala Ser Asn
85 90 95
Cys Ala Leu Glu Gly Ala Asn Tyr Glu Ser Thr Tyr Gly Val Thr Ala
100 105 110
Ser Gly Asn Ser Leu Arg Leu Asn Phe Val Thr Thr Ser Gln Gln Lys
115 120 125
Asn Ile Gly Ser Arg Leu Tyr Met Met Lys Asp Asp Ser Thr Tyr Glu
130 135 140
Met Phe Lys Leu Leu Asn Gln Glu Phe Thr Phe Asp Val Asp Val Ser
145 150 155 160
Asn Leu Pro Cys Gly Leu Asn Gly Ala Leu Tyr Phe Val Ala Met Asp
165 170 175
Ala Gly Gly Gly Met Ser Lys Tyr Pro Thr Asn Lys Ala Gly Ala Lys
180 185 190
Tyr Gly Thr Gly Tyr Cys Asp Ser Gln Cys Pro Arg Asp Leu Lys Phe
195 200 205
Ile Asn Gly Gln Ala Asn Val Glu Gly Trp Gln Pro Ser Ser Asn Asp
210 215 220
Ala Asn Ala Gly Thr Gly Asn His Gly Ser Cys Cys Ala Glu Met Asp
225 230 235 240
Ile Trp Glu Ala Asn Ser Ile Ser Thr Ala Phe Thr Pro His Pro Cys
245 250 255
Asp Thr Pro Gly Gln Val Met Cys Thr Gly Asp Ala Cys Gly Gly Thr
260 265 270
Tyr Ser Ser Asp Arg Tyr Gly Gly Thr Cys Asp Pro Asp Gly Cys Asp
275 280 285
Phe Asn Ser Phe Arg Gln Gly Asn Lys Thr Phe Tyr Gly Pro Gly Met
290 295 300
Thr Val Asp Thr Lys Ser Lys Phe Thr Val Val Thr Gln Phe Ile Thr
305 310 315 320
Asp Asp Gly Thr Ser Ser Gly Thr Leu Lys Glu Ile Lys Arg Phe Tyr
325 330 335
Val Gln Asn Gly Lys Val Ile Pro Asn Ser Glu Ser Thr Trp Thr Gly
340 345 350
Val Ser Gly Asn Ser Ile Thr Thr Glu Tyr Cys Thr Ala Gln Lys Ser
355 360 365
Leu Phe Gln Asp Gln Asn Val Phe Glu Lys His Gly Gly Leu Glu Gly
370 375 380
Met Gly Ala Ala Leu Ala Gln Gly Met Val Leu Val Met Ser Leu Trp
385 390 395 400
Asp Asp His Ser Ala Asn Met Leu Trp Leu Asp Ser Asn Tyr Pro Thr
405 410 415
Thr Ala Ser Ser Thr Thr Pro Gly Val Ala Arg Gly Thr Cys Asp Ile
420 425 430
Ser Ser Gly Val Pro Ala Asp Val Glu Ala Asn His Pro Asp Ala Tyr
435 440 445
Val Val Tyr Ser Asn Ile Lys Val Gly Pro Ile Gly Ser Thr Phe Asn
450 455 460
Ser Gly Gly Ser Asn Pro Gly Gly Gly Thr Thr Thr Thr Thr Thr Thr
465 470 475 480
Gln Pro Thr Thr Thr Thr Thr Thr Ala Gly Asn Pro Gly Gly Thr Gly
485 490 495
Val Ala Gln His Tyr Gly Gln Cys Gly Gly Ile Gly Trp Thr Gly Pro
500 505 510
Thr Thr Cys Ala Ser Pro Tyr Thr Cys Gln Lys Leu Asn Asp Tyr Tyr
515 520 525
Ser Gln Cys Leu
530
<210> 19
<211> 108
<212> DNA
<213> 烟曲霉(Aspergillus fumigatus)
<400> 19
gtcgcacagc actatggcca gtgtggtgga atcggatgga ccggacccac aacctgtgcc 60
agcccttata cctgccagaa gctgaatgat tattactctc agtgcctg 108
<210> 20
<211> 36
<212> PRT
<213> 烟曲霉(Aspergillus fumigatus)
<400> 20
Val Ala Gln His Tyr Gly Gln Cys Gly Gly Ile Gly Trp Thr Gly Pro
1 5 10 15
Thr Thr Cys Ala Ser Pro Tyr Thr Cys Gln Lys Leu Asn Asp Tyr Tyr
20 25 30
Ser Gln Cys Leu
35
<210> 21
<211> 1581
<212> DNA
<213> 土生梭孢壳霉(Thielavia terrestris)
<400> 21
atgcacgcca agttcgcgac cctcgccgcc cttgtggcgt ccgccgcggc ccagcaggcc 60
tgcacactca cggctgagaa ccaccccacc ctgtcgtggt ccaagtgcac gtccggcggc 120
agctgcacca gcgtctcggg ctccgtcacc atcgatgcca actggcggtg gactcaccag 180
gtctcgagct cgaccaactg ctacacgggc aatgagtggg acacgtccat ctgcaccgac 240
ggtgcttcgt gcgccgccgc ctgctgcctc gatggcgccg actactcggg cacctatggc 300
atcaccacca gcggcaacgc cctcagcctc cagttcgtca ctcagggccc ctactcgacc 360
aacattggct cgcgtaccta cctgatggcc tcggacacca agtaccagat gttcactctg 420
ctcggcaacg agttcacctt cgacgtggac gtcacaggcc tcggctgcgg tctgaacggc 480
gccctctact tcgtctccat ggacgaggac ggtggtcttt ccaagtactc gggcaacaag 540
gctggcgcca agtacggcac cggctactgc gactcgcagt gcccccgcga cctcaagttc 600
atcaacggcg aggctaacaa cgttggctgg accccgtcgt ccaacgacaa gaacgccggc 660
ttgggcaact acggcagctg ctgctccgag atggatgtct gggaggccaa cagcatctcg 720
gcggcctaca cgccccatcc ttgcactacc atcggccaga cgcgctgcga gggcgacgac 780
tgcggtggta cctacagcac tgaccgctac gccggcgagt gcgaccctga cggatgcgac 840
ttcaactcgt accgcatggg caacacgacc ttctacggca agggcatgac cgtcgacacc 900
agcaagaagt tcacggtggt gacccagttc ctgacggact cgtctggcaa cctgtccgag 960
atcaagcgct tctacgtcca gaacggcgtc gtcattccca actcgaactc caacatcgcg 1020
ggcgtctcgg gcaactccat cacccaggcc ttctgcgatg ctcagaagac cgctttcggc 1080
gacaccaacg tcttcgacca aaagggcggc ctggcccaga tgggcaaggc tcttgcccag 1140
cccatggtcc tcgtcatgtc cctctgggac gaccacgccg tcaacatgct ctggctcgac 1200
tcgacctacc cgaccaacgc ggccggcaag ccgggcgccg cccgcggtac ctgccccacc 1260
acctcgggcg tccccgccga cgtcgagtcc caggcgccca actccaaggt catctactcc 1320
aacatccgct tcggccccat cggctccacc gtctccggcc tgcccggcgg cggcagcaac 1380
cccggcggcg gctccagctc caccaccacc accaccagac ccgccacctc caccacctcc 1440
tcggccagct ccggcccgac cggcggtggc acggctgccc actggggcca gtgcggcggc 1500
atcggctgga ccggcccgac cgtctgcgcc tcgccctaca cctgccagaa gctgaacgac 1560
tggtactacc agtgcctcta a 1581
<210> 22
<211> 526
<212> PRT
<213> 土生梭孢壳霉(Thielavia terrestris)
<400> 22
Met His Ala Lys Phe Ala Thr Leu Ala Ala Leu Val Ala Ser Ala Ala
1 5 10 15
Ala Gln Gln Ala Cys Thr Leu Thr Ala Glu Asn His Pro Thr Leu Ser
20 25 30
Trp Ser Lys Cys Thr Ser Gly Gly Ser Cys Thr Ser Val Ser Gly Ser
35 40 45
Val Thr Ile Asp Ala Asn Trp Arg Trp Thr His Gln Val Ser Ser Ser
50 55 60
Thr Asn Cys Tyr Thr Gly Asn Glu Trp Asp Thr Ser Ile Cys Thr Asp
65 70 75 80
Gly Ala Ser Cys Ala Ala Ala Cys Cys Leu Asp Gly Ala Asp Tyr Ser
85 90 95
Gly Thr Tyr Gly Ile Thr Thr Ser Gly Asn Ala Leu Ser Leu Gln Phe
100 105 110
Val Thr Gln Gly Pro Tyr Ser Thr Asn Ile Gly Ser Arg Thr Tyr Leu
115 120 125
Met Ala Ser Asp Thr Lys Tyr Gln Met Phe Thr Leu Leu Gly Asn Glu
130 135 140
Phe Thr Phe Asp Val Asp Val Thr Gly Leu Gly Cys Gly Leu Asn Gly
145 150 155 160
Ala Leu Tyr Phe Val Ser Met Asp Glu Asp Gly Gly Leu Ser Lys Tyr
165 170 175
Ser Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser
180 185 190
Gln Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Glu Ala Asn Asn Val
195 200 205
Gly Trp Thr Pro Ser Ser Asn Asp Lys Asn Ala Gly Leu Gly Asn Tyr
210 215 220
Gly Ser Cys Cys Ser Glu Met Asp Val Trp Glu Ala Asn Ser Ile Ser
225 230 235 240
Ala Ala Tyr Thr Pro His Pro Cys Thr Thr Ile Gly Gln Thr Arg Cys
245 250 255
Glu Gly Asp Asp Cys Gly Gly Thr Tyr Ser Thr Asp Arg Tyr Ala Gly
260 265 270
Glu Cys Asp Pro Asp Gly Cys Asp Phe Asn Ser Tyr Arg Met Gly Asn
275 280 285
Thr Thr Phe Tyr Gly Lys Gly Met Thr Val Asp Thr Ser Lys Lys Phe
290 295 300
Thr Val Val Thr Gln Phe Leu Thr Asp Ser Ser Gly Asn Leu Ser Glu
305 310 315 320
Ile Lys Arg Phe Tyr Val Gln Asn Gly Val Val Ile Pro Asn Ser Asn
325 330 335
Ser Asn Ile Ala Gly Val Ser Gly Asn Ser Ile Thr Gln Ala Phe Cys
340 345 350
Asp Ala Gln Lys Thr Ala Phe Gly Asp Thr Asn Val Phe Asp Gln Lys
355 360 365
Gly Gly Leu Ala Gln Met Gly Lys Ala Leu Ala Gln Pro Met Val Leu
370 375 380
Val Met Ser Leu Trp Asp Asp His Ala Val Asn Met Leu Trp Leu Asp
385 390 395 400
Ser Thr Tyr Pro Thr Asn Ala Ala Gly Lys Pro Gly Ala Ala Arg Gly
405 410 415
Thr Cys Pro Thr Thr Ser Gly Val Pro Ala Asp Val Glu Ser Gln Ala
420 425 430
Pro Asn Ser Lys Val Ile Tyr Ser Asn Ile Arg Phe Gly Pro Ile Gly
435 440 445
Ser Thr Val Ser Gly Leu Pro Gly Gly Gly Ser Asn Pro Gly Gly Gly
450 455 460
Ser Ser Ser Thr Thr Thr Thr Thr Arg Pro Ala Thr Ser Thr Thr Ser
465 470 475 480
Ser Ala Ser Ser Gly Pro Thr Gly Gly Gly Thr Ala Ala His Trp Gly
485 490 495
Gln Cys Gly Gly Ile Gly Trp Thr Gly Pro Thr Val Cys Ala Ser Pro
500 505 510
Tyr Thr Cys Gln Lys Leu Asn Asp Trp Tyr Tyr Gln Cys Leu
515 520 525
<210> 23
<211> 108
<212> DNA
<213> 土生梭孢壳霉(Thielavia terrestris)
<400> 23
acggctgccc actggggcca gtgcggcggc atcggctgga ccggcccgac cgtctgcgcc 60
tcgccctaca cctgccagaa gctgaacgac tggtactacc agtgcctc 108
<210> 24
<211> 36
<212> PRT
<213> 土生梭孢壳霉(Thielavia terrestris)
<400> 24
Thr Ala Ala His Trp Gly Gln Cys Gly Gly Ile Gly Trp Thr Gly Pro
1 5 10 15
Thr Val Cys Ala Ser Pro Tyr Thr Cys Gln Lys Leu Asn Asp Trp Tyr
20 25 30
Tyr Gln Cys Leu
35
<210> 25
<211> 1578
<212> DNA
<213> 嗜热毁丝霉(Myceliophthora thermophilum)
<220>
<221> 尚未归类的特征
<222> (1092)..(1092)
<223> n is a, c, g, or t
<400> 25
atgtacgcca agttcgcgac cctcgccgcc cttgtggctg gcgccgctgc tcagaacgcc 60
tgcactctga ccgctgagaa ccacccctcg ctgacgtggt ccaagtgcac gtctggcggc 120
agctgcacca gcgtccaggg ttccatcacc atcgacgcca actggcggtg gactcaccgg 180
accgatagcg ccaccaactg ctacgagggc aacaagtggg atacttcgta ctgcagcgat 240
ggtccttctt gcgcctccaa gtgctgcatc gacggcgctg actactcgag cacctatggc 300
atcaccacga gcggtaactc cctgaacctc aagttcgtca ccaagggcca gtactcgacc 360
aacatcggct cgcgtaccta cctgatggag agcgacacca agtaccagtt ccagctcctc 420
ggcaacgagt tcaccttcga tgtcgacgtc tccaacctcg gctgcggcct caatggcgcc 480
ctctacttcg tgtccatgga tgccgatggt ggcatgtcca agtactcggg caacaaggca 540
ggtgccaagt acggtaccgg ctactgtgat tctcagtgcc cccgcgacct caagttcatc 600
aacggcgagg ccaacgtaga gaactggcag agctcgacca acgatgccaa cgccggcacg 660
ggcaagtacg gcagctgctg ctccgagatg gacgtctggg aggccaacaa catggccgcc 720
gccttcactc cccacccttg caccgtgatc ggccagtcgc gctgcgaggg cgactcgtgc 780
ggcggtacct acagcaccga ccgctatgcc ggcatctgcg accccgacgg atgcgacttc 840
aactcgtacc gccagggcaa caagaccttc tacggcaagg gcatgacggt cgacacgacc 900
aagaagatca cggtcgtcac ccagttcctc aagaactcgg ccggcgagct ctccgagatc 960
aagcggttct acgtccagaa cggcaaggtc atccccaact ccgagtccac catcccgggc 1020
gtcgagggca actccatcac ccaggactgg tgcgaccgcc agaaggccgc cttcggcgac 1080
gtgaccgact tncaggacaa gggcggcatg gtccagatgg gcaaggccct cgcggggccc 1140
atggtcctcg tcatgtccat ctgggacgac cacgccgtca acatgctctg gctcgactcc 1200
acctggccca tcgacggcgc cggcaagccg ggcgccgagc gcggtgcctg ccccaccacc 1260
tcgggcgtcc ccgctgaggt cgaggccgag gcccccaact ccaacgtcat cttctccaac 1320
atccgcttcg gccccatcgg ctccaccgtc tccggcctgc ccgacggcgg cagcggcaac 1380
cccaacccgc ccgtcagctc gtccaccccg gtcccctcct cgtccaccac atcctccggt 1440
tcctccggcc cgactggcgg cacgggtgtc gctaagcact atgagcaatg cggaggaatc 1500
gggttcactg gccctaccca gtgcgagagc ccctacactt gcaccaagct gaatgactgg 1560
tactcgcagt gcctgtaa 1578
<210> 26
<211> 525
<212> PRT
<213> 嗜热毁丝霉(Myceliophthora thermophilum)
<220>
<221> 尚未归类的特征
<222> (364)..(364)
<223> XAA = 任何氨基酸
<400> 26
Met Tyr Ala Lys Phe Ala Thr Leu Ala Ala Leu Val Ala Gly Ala Ala
1 5 10 15
Ala Gln Asn Ala Cys Thr Leu Thr Ala Glu Asn His Pro Ser Leu Thr
20 25 30
Trp Ser Lys Cys Thr Ser Gly Gly Ser Cys Thr Ser Val Gln Gly Ser
35 40 45
Ile Thr Ile Asp Ala Asn Trp Arg Trp Thr His Arg Thr Asp Ser Ala
50 55 60
Thr Asn Cys Tyr Glu Gly Asn Lys Trp Asp Thr Ser Tyr Cys Ser Asp
65 70 75 80
Gly Pro Ser Cys Ala Ser Lys Cys Cys Ile Asp Gly Ala Asp Tyr Ser
85 90 95
Ser Thr Tyr Gly Ile Thr Thr Ser Gly Asn Ser Leu Asn Leu Lys Phe
100 105 110
Val Thr Lys Gly Gln Tyr Ser Thr Asn Ile Gly Ser Arg Thr Tyr Leu
115 120 125
Met Glu Ser Asp Thr Lys Tyr Gln Phe Gln Leu Leu Gly Asn Glu Phe
130 135 140
Thr Phe Asp Val Asp Val Ser Asn Leu Gly Cys Gly Leu Asn Gly Ala
145 150 155 160
Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Met Ser Lys Tyr Ser
165 170 175
Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln
180 185 190
Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Glu Ala Asn Val Glu Asn
195 200 205
Trp Gln Ser Ser Thr Asn Asp Ala Asn Ala Gly Thr Gly Lys Tyr Gly
210 215 220
Ser Cys Cys Ser Glu Met Asp Val Trp Glu Ala Asn Asn Met Ala Ala
225 230 235 240
Ala Phe Thr Pro His Pro Cys Thr Val Ile Gly Gln Ser Arg Cys Glu
245 250 255
Gly Asp Ser Cys Gly Gly Thr Tyr Ser Thr Asp Arg Tyr Ala Gly Ile
260 265 270
Cys Asp Pro Asp Gly Cys Asp Phe Asn Ser Tyr Arg Gln Gly Asn Lys
275 280 285
Thr Phe Tyr Gly Lys Gly Met Thr Val Asp Thr Thr Lys Lys Ile Thr
290 295 300
Val Val Thr Gln Phe Leu Lys Asn Ser Ala Gly Glu Leu Ser Glu Ile
305 310 315 320
Lys Arg Phe Tyr Val Gln Asn Gly Lys Val Ile Pro Asn Ser Glu Ser
325 330 335
Thr Ile Pro Gly Val Glu Gly Asn Ser Ile Thr Gln Asp Trp Cys Asp
340 345 350
Arg Gln Lys Ala Ala Phe Gly Asp Val Thr Asp Xaa Gln Asp Lys Gly
355 360 365
Gly Met Val Gln Met Gly Lys Ala Leu Ala Gly Pro Met Val Leu Val
370 375 380
Met Ser Ile Trp Asp Asp His Ala Val Asn Met Leu Trp Leu Asp Ser
385 390 395 400
Thr Trp Pro Ile Asp Gly Ala Gly Lys Pro Gly Ala Glu Arg Gly Ala
405 410 415
Cys Pro Thr Thr Ser Gly Val Pro Ala Glu Val Glu Ala Glu Ala Pro
420 425 430
Asn Ser Asn Val Ile Phe Ser Asn Ile Arg Phe Gly Pro Ile Gly Ser
435 440 445
Thr Val Ser Gly Leu Pro Asp Gly Gly Ser Gly Asn Pro Asn Pro Pro
450 455 460
Val Ser Ser Ser Thr Pro Val Pro Ser Ser Ser Thr Thr Ser Ser Gly
465 470 475 480
Ser Ser Gly Pro Thr Gly Gly Thr Gly Val Ala Lys His Tyr Glu Gln
485 490 495
Cys Gly Gly Ile Gly Phe Thr Gly Pro Thr Gln Cys Glu Ser Pro Tyr
500 505 510
Thr Cys Thr Lys Leu Asn Asp Trp Tyr Ser Gln Cys Leu
515 520 525
<210> 27
<211> 111
<212> DNA
<213> 嗜热毁丝霉(Myceliophthora thermophilum)
<400> 27
gtcgctaagc actatgagca atgcggagga atcgggttca ctggccctac ccagtgcgag 60
agcccctaca cttgcaccaa gctgaatgac tggtactcgc agtgcctgta a 111
<210> 28
<211> 36
<212> PRT
<213> 嗜热毁丝霉(Myceliophthora thermophilum)
<400> 28
Val Ala Lys His Tyr Glu Gln Cys Gly Gly Ile Gly Phe Thr Gly Pro
1 5 10 15
Thr Gln Cys Glu Ser Pro Tyr Thr Cys Thr Lys Leu Asn Asp Trp Tyr
20 25 30
Ser Gln Cys Leu
35
<210> 29
<211> 1676
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<220>
<221> 外显子
<222> (1)..(461)
<220>
<221> 信号肽
<222> (1)..(17)
<220>
<221> CDS
<222> (1)..(461)
<220>
<221> 成熟肽
<222> (52)..(1673)
<220>
<221> 内含子
<222> (462)..(529)
<220>
<221> 外显子
<222> (530)..(1226)
<220>
<221> CDS
<222> (530)..(1226)
<220>
<221> 内含子
<222> (1227)..(1289)
<220>
<221> 外显子
<222> (1290)..(1673)
<220>
<221> CDS
<222> (1290)..(1673)
<400> 29
atg tat cgg aag ttg gcc gtc atc tcg gcc ttc ttg gcc aca gct cgt 48
Met Tyr Arg Lys Leu Ala Val Ile Ser Ala Phe Leu Ala Thr Ala Arg
-15 -10 -5
gct cag tcg gcc tgc act ctc caa tcg gag act cac ccg cct ctg aca 96
Ala Gln Ser Ala Cys Thr Leu Gln Ser Glu Thr His Pro Pro Leu Thr
-1 1 5 10 15
tgg cag aaa tgc tcg tct ggt ggc acg tgc act caa cag aca ggc tcc 144
Trp Gln Lys Cys Ser Ser Gly Gly Thr Cys Thr Gln Gln Thr Gly Ser
20 25 30
gtg gtc atc gac gcc aac tgg cgc tgg act cac gct acg aac agc agc 192
Val Val Ile Asp Ala Asn Trp Arg Trp Thr His Ala Thr Asn Ser Ser
35 40 45
acg aac tgc tac gat ggc aac act tgg agc tcg acc cta tgt cct gac 240
Thr Asn Cys Tyr Asp Gly Asn Thr Trp Ser Ser Thr Leu Cys Pro Asp
50 55 60
aac gag acc tgc gcg aag aac tgc tgt ctg gac ggt gcc gcc tac gcg 288
Asn Glu Thr Cys Ala Lys Asn Cys Cys Leu Asp Gly Ala Ala Tyr Ala
65 70 75
tcc acg tac gga gtt acc acg agc ggt aac agc ctc tcc att ggc ttt 336
Ser Thr Tyr Gly Val Thr Thr Ser Gly Asn Ser Leu Ser Ile Gly Phe
80 85 90 95
gtc acc cag tct gcg cag aag aac gtt ggc gct cgc ctt tac ctt atg 384
Val Thr Gln Ser Ala Gln Lys Asn Val Gly Ala Arg Leu Tyr Leu Met
100 105 110
gcg agc gac acg acc tac cag gaa ttc acc ctg ctt ggc aac gag ttc 432
Ala Ser Asp Thr Thr Tyr Gln Glu Phe Thr Leu Leu Gly Asn Glu Phe
115 120 125
tct ttc gat gtt gat gtt tcg cag ctg cc gtaagtgact taccatgaac 481
Ser Phe Asp Val Asp Val Ser Gln Leu Pro
130 135
ccctgacgct atcttcttgt tggctcccag ctgactggcc aattcaag g tgc ggc 536
Cys Gly
ttg aac gga gct ctc tac ttc gtg tcc atg gac gcg gat ggt ggc gtg 584
Leu Asn Gly Ala Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Val
140 145 150 155
agc aag tat ccc acc aac acc gct ggc gcc aag tac ggc acg ggg tac 632
Ser Lys Tyr Pro Thr Asn Thr Ala Gly Ala Lys Tyr Gly Thr Gly Tyr
160 165 170
tgt gac agc cag tgt ccc cgc gat ctg aag ttc atc aat ggc cag gcc 680
Cys Asp Ser Gln Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala
175 180 185
aac gtt gag ggc tgg gag ccg tca tcc aac aac gcg aac acg ggc att 728
Asn Val Glu Gly Trp Glu Pro Ser Ser Asn Asn Ala Asn Thr Gly Ile
190 195 200
gga gga cac gga agc tgc tgc tct gag atg gat atc tgg gag gcc aac 776
Gly Gly His Gly Ser Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn
205 210 215
tcc atc tcc gag gct ctt acc ccc cac cct tgc acg act gtc ggc cag 824
Ser Ile Ser Glu Ala Leu Thr Pro His Pro Cys Thr Thr Val Gly Gln
220 225 230 235
gag atc tgc gag ggt gat ggg tgc ggc gga act tac tcc gat aac aga 872
Glu Ile Cys Glu Gly Asp Gly Cys Gly Gly Thr Tyr Ser Asp Asn Arg
240 245 250
tat ggc ggc act tgc gat ccc gat ggc tgc gac tgg aac cca tac cgc 920
Tyr Gly Gly Thr Cys Asp Pro Asp Gly Cys Asp Trp Asn Pro Tyr Arg
255 260 265
ctg ggc aac acc agc ttc tac ggc cct ggc tca agc ttt acc ctc gat 968
Leu Gly Asn Thr Ser Phe Tyr Gly Pro Gly Ser Ser Phe Thr Leu Asp
270 275 280
acc acc aag aaa ttg acc gtt gtc acc cag ttc gag acg tcg ggt gcc 1016
Thr Thr Lys Lys Leu Thr Val Val Thr Gln Phe Glu Thr Ser Gly Ala
285 290 295
atc aac cga tac tat gtc cag aat ggc gtc act ttc cag cag ccc aac 1064
Ile Asn Arg Tyr Tyr Val Gln Asn Gly Val Thr Phe Gln Gln Pro Asn
300 305 310 315
gcc gag ctt ggt agt tac tct ggc aac gag ctc aac gat gat tac tgc 1112
Ala Glu Leu Gly Ser Tyr Ser Gly Asn Glu Leu Asn Asp Asp Tyr Cys
320 325 330
aca gct gag gag gca gaa ttc ggc gga tcc tct ttc tca gac aag ggc 1160
Thr Ala Glu Glu Ala Glu Phe Gly Gly Ser Ser Phe Ser Asp Lys Gly
335 340 345
ggc ctg act cag ttc aag aag gct acc tct ggc ggc atg gtt ctg gtc 1208
Gly Leu Thr Gln Phe Lys Lys Ala Thr Ser Gly Gly Met Val Leu Val
350 355 360
atg agt ctg tgg gat gat gtgagtttga tggacaaaca tgcgcgttga 1256
Met Ser Leu Trp Asp Asp
365
caaagagtca agcagctgac tgagatgtta cag tac tac gcc aac atg ctg tgg 1310
Tyr Tyr Ala Asn Met Leu Trp
370 375
ctg gac tcc acc tac ccg aca aac gag acc tcc tcc aca ccc ggt gcc 1358
Leu Asp Ser Thr Tyr Pro Thr Asn Glu Thr Ser Ser Thr Pro Gly Ala
380 385 390
gtg cgc gga agc tgc tcc acc agc tcc ggt gtc cct gct cag gtc gaa 1406
Val Arg Gly Ser Cys Ser Thr Ser Ser Gly Val Pro Ala Gln Val Glu
395 400 405
tct cag tct ccc aac gcc aag gtc acc ttc tcc aac atc aag ttc gga 1454
Ser Gln Ser Pro Asn Ala Lys Val Thr Phe Ser Asn Ile Lys Phe Gly
410 415 420
ccc att ggc agc acc ggc aac cct agc ggc ggc aac cct ccc ggc gga 1502
Pro Ile Gly Ser Thr Gly Asn Pro Ser Gly Gly Asn Pro Pro Gly Gly
425 430 435 440
aac ccg cct ggc acc acc acc acc cgc cgc cca gcc act acc act gga 1550
Asn Pro Pro Gly Thr Thr Thr Thr Arg Arg Pro Ala Thr Thr Thr Gly
445 450 455
agc tct ccc gga cct acc cag tct cac tac ggc cag tgc ggc ggt att 1598
Ser Ser Pro Gly Pro Thr Gln Ser His Tyr Gly Gln Cys Gly Gly Ile
460 465 470
ggc tac agc ggc ccc acg gtc tgc gcc agc ggc aca act tgc cag gtc 1646
Gly Tyr Ser Gly Pro Thr Val Cys Ala Ser Gly Thr Thr Cys Gln Val
475 480 485
ctg aac cct tac tac tct cag tgc ctg taa 1676
Leu Asn Pro Tyr Tyr Ser Gln Cys Leu
490 495
<210> 30
<211> 514
<212> PRT
<213> 里氏木霉(Trichoderma reesei)
<400> 30
Met Tyr Arg Lys Leu Ala Val Ile Ser Ala Phe Leu Ala Thr Ala Arg
-15 -10 -5
Ala Gln Ser Ala Cys Thr Leu Gln Ser Glu Thr His Pro Pro Leu Thr
-1 1 5 10 15
Trp Gln Lys Cys Ser Ser Gly Gly Thr Cys Thr Gln Gln Thr Gly Ser
20 25 30
Val Val Ile Asp Ala Asn Trp Arg Trp Thr His Ala Thr Asn Ser Ser
35 40 45
Thr Asn Cys Tyr Asp Gly Asn Thr Trp Ser Ser Thr Leu Cys Pro Asp
50 55 60
Asn Glu Thr Cys Ala Lys Asn Cys Cys Leu Asp Gly Ala Ala Tyr Ala
65 70 75
Ser Thr Tyr Gly Val Thr Thr Ser Gly Asn Ser Leu Ser Ile Gly Phe
80 85 90 95
Val Thr Gln Ser Ala Gln Lys Asn Val Gly Ala Arg Leu Tyr Leu Met
100 105 110
Ala Ser Asp Thr Thr Tyr Gln Glu Phe Thr Leu Leu Gly Asn Glu Phe
115 120 125
Ser Phe Asp Val Asp Val Ser Gln Leu Pro Cys Gly Leu Asn Gly Ala
130 135 140
Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Val Ser Lys Tyr Pro
145 150 155
Thr Asn Thr Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln
160 165 170 175
Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Glu Gly
180 185 190
Trp Glu Pro Ser Ser Asn Asn Ala Asn Thr Gly Ile Gly Gly His Gly
195 200 205
Ser Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Ser Ile Ser Glu
210 215 220
Ala Leu Thr Pro His Pro Cys Thr Thr Val Gly Gln Glu Ile Cys Glu
225 230 235
Gly Asp Gly Cys Gly Gly Thr Tyr Ser Asp Asn Arg Tyr Gly Gly Thr
240 245 250 255
Cys Asp Pro Asp Gly Cys Asp Trp Asn Pro Tyr Arg Leu Gly Asn Thr
260 265 270
Ser Phe Tyr Gly Pro Gly Ser Ser Phe Thr Leu Asp Thr Thr Lys Lys
275 280 285
Leu Thr Val Val Thr Gln Phe Glu Thr Ser Gly Ala Ile Asn Arg Tyr
290 295 300
Tyr Val Gln Asn Gly Val Thr Phe Gln Gln Pro Asn Ala Glu Leu Gly
305 310 315
Ser Tyr Ser Gly Asn Glu Leu Asn Asp Asp Tyr Cys Thr Ala Glu Glu
320 325 330 335
Ala Glu Phe Gly Gly Ser Ser Phe Ser Asp Lys Gly Gly Leu Thr Gln
340 345 350
Phe Lys Lys Ala Thr Ser Gly Gly Met Val Leu Val Met Ser Leu Trp
355 360 365
Asp Asp Tyr Tyr Ala Asn Met Leu Trp Leu Asp Ser Thr Tyr Pro Thr
370 375 380
Asn Glu Thr Ser Ser Thr Pro Gly Ala Val Arg Gly Ser Cys Ser Thr
385 390 395
Ser Ser Gly Val Pro Ala Gln Val Glu Ser Gln Ser Pro Asn Ala Lys
400 405 410 415
Val Thr Phe Ser Asn Ile Lys Phe Gly Pro Ile Gly Ser Thr Gly Asn
420 425 430
Pro Ser Gly Gly Asn Pro Pro Gly Gly Asn Pro Pro Gly Thr Thr Thr
435 440 445
Thr Arg Arg Pro Ala Thr Thr Thr Gly Ser Ser Pro Gly Pro Thr Gln
450 455 460
Ser His Tyr Gly Gln Cys Gly Gly Ile Gly Tyr Ser Gly Pro Thr Val
465 470 475
Cys Ala Ser Gly Thr Thr Cys Gln Val Leu Asn Pro Tyr Tyr Ser Gln
480 485 490 495
Cys Leu
<210> 31
<211> 1545
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 31
atgtatcgga agttggccgt catctcggcc ttcttggcca cagctcgtgc tcagtcggcc 60
tgcactctcc aatcggagac tcacccgcct ctgacatggc agaaatgctc gtctggtggc 120
acgtgcactc aacagacagg ctccgtggtc atcgacgcca actggcgctg gactcacgct 180
acgaacagca gcacgaactg ctacgatggc aacacttgga gctcgaccct atgtcctgac 240
aacgagacct gcgcgaagaa ctgctgtctg gacggtgccg cctacgcgtc cacgtacgga 300
gttaccacga gcggtaacag cctctccatt ggctttgtca cccagtctgc gcagaagaac 360
gttggcgctc gcctttacct tatggcgagc gacacgacct accaggaatt caccctgctt 420
ggcaacgagt tctctttcga tgttgatgtt tcgcagctgc cgtgcggctt gaacggagct 480
ctctacttcg tgtccatgga cgcggatggt ggcgtgagca agtatcccac caacaccgct 540
ggcgccaagt acggcacggg gtactgtgac agccagtgtc cccgcgatct gaagttcatc 600
aatggccagg ccaacgttga gggctgggag ccgtcatcca acaacgcgaa cacgggcatt 660
ggaggacacg gaagctgctg ctctgagatg gatatctggg aggccaactc catctccgag 720
gctcttaccc cccacccttg cacgactgtc ggccaggaga tctgcgaggg tgatgggtgc 780
ggcggaactt actccgataa cagatatggc ggcacttgcg atcccgatgg ctgcgactgg 840
aacccatacc gcctgggcaa caccagcttc tacggccctg gctcaagctt taccctcgat 900
accaccaaga aattgaccgt tgtcacccag ttcgagacgt cgggtgccat caaccgatac 960
tatgtccaga atggcgtcac tttccagcag cccaacgccg agcttggtag ttactctggc 1020
aacgagctca acgatgatta ctgcacagct gaggaggcag aattcggcgg atcctctttc 1080
tcagacaagg gcggcctgac tcagttcaag aaggctacct ctggcggcat ggttctggtc 1140
atgagtctgt gggatgatta ctacgccaac atgctgtggc tggactccac ctacccgaca 1200
aacgagacct cctccacacc cggtgccgtg cgcggaagct gctccaccag ctccggtgtc 1260
cctgctcagg tcgaatctca gtctcccaac gccaaggtca ccttctccaa catcaagttc 1320
ggacccattg gcagcaccgg caaccctagc ggcggcaacc ctcccggcgg aaacccgcct 1380
ggcaccacca ccacccgccg cccagccact accactggaa gctctcccgg acctacccag 1440
tctcactacg gccagtgcgg cggtattggc tacagcggcc ccacggtctg cgccagcggc 1500
acaacttgcc aggtcctgaa cccttactac tctcagtgcc tgtaa 1545
<210> 32
<211> 1545
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<400> 32
atgtatcgta agctcgcagt catctccgcg ttcctcgcaa cagcacgagc gcagtccgcc 60
tgtaccttgc agtcggaaac acatcctccc ctcacttggc agaaatgttc gtccggagga 120
acgtgtacgc agcagactgg ctcggtggtc atcgacgcca actggaggtg gacgcatgca 180
accaactcct ccaccaactg ttacgatggc aacacttggt cctccacctt gtgtcccgat 240
aacgaaacct gtgccaagaa ctgttgtttg gatggtgcag cctacgcctc gacatacgga 300
gtcactactt ccggcaactc gctctcgatc ggcttcgtga ctcagtccgc acagaaaaac 360
gtcggagcgc gactctactt gatggcatcc gatacaacct accaggaatt cactctcttg 420
ggcaacgagt tctccttcga cgtcgacgtc tcccagctcc cttgtggcct caacggagca 480
ctctacttcg tgtcgatgga cgcggatgga ggtgtctcca agtacccgac caacacagca 540
ggagcgaaat acggcacggg ttactgtgac tcgcagtgtc ctcgcgatct caagttcatc 600
aacggccagg caaacgtcga aggctgggaa ccctcgtcga acaacgccaa caccggcatt 660
ggaggccatg gctcctgttg ttcggaaatg gatatctggg aggccaactc gatctccgag 720
gcactcacac cccacccctg tacaaccgtc ggccaggaga tttgtgaagg agacggctgt 780
ggcggaactt actccgataa ccgttacggt ggtacctgtg atcccgatgg ctgtgactgg 840
aacccctacc gcctcggtaa cacatcgttc tacggtccgg gttcctcctt caccctcgac 900
actaccaaaa agttgacggt ggtcacgcag ttcgagactt ccggagccat caaccggtac 960
tacgtgcaga acggagtcac attccagcag cccaacgcag aactcggctc gtactcggga 1020
aacgagctca acgatgatta ctgtacagcg gaagaggcag aattcggagg atcgtcgttc 1080
tccgacaagg gtggtttgac ccagttcaag aaggccacat cgggaggaat ggtgttggtc 1140
atgtccttgt gggacgacta ctatgccaac atgctctggc tcgactccac ctaccccacc 1200
aacgagacct cctcgacacc tggcgcagtg aggggctcgt gttccacttc gtcgggagtg 1260
cctgcacagg tggagtccca gtcgccgaac gccaaggtca ctttctccaa cattaagttc 1320
ggacccatcg gttcgaccgg caacccctcc ggtggaaacc ctcctggcgg aaaccctcct 1380
ggcacaacta caacacgacg gcctgcgact acaacgggtt cgtcccctgg accgacccag 1440
tcccactacg gacagtgtgg aggcatcggt tattccggtc cgaccgtctg tgcgtccggc 1500
acaacctgtc aggtcttgaa cccttactat tcgcagtgtc tctaa 1545
<210> 33
<211> 1545
<212> DNA
<213> 里氏木霉(Trichoderma reesei)
<220>
<221> 信号肽
<222> (1)..(51)
<220>
<221> CDS
<222> (1)..(1542)
<220>
<221> 成熟肽
<222> (52)..(1542)
<400> 33
atg tat cgt aag ctc gca gtc atc tcc gcg ttc ctc gca aca gca cga 48
Met Tyr Arg Lys Leu Ala Val Ile Ser Ala Phe Leu Ala Thr Ala Arg
-15 -10 -5
gcg cag tcc gcc tgt acc ttg cag tcg gaa aca cat cct ccc ctc act 96
Ala Gln Ser Ala Cys Thr Leu Gln Ser Glu Thr His Pro Pro Leu Thr
-1 1 5 10 15
tgg cag aaa tgt tcg tcc gga gga acg tgt acg cag cag act ggc tcg 144
Trp Gln Lys Cys Ser Ser Gly Gly Thr Cys Thr Gln Gln Thr Gly Ser
20 25 30
gtg gtc atc gac gcc aac tgg agg tgg acg cat gca acc aac tcc tcc 192
Val Val Ile Asp Ala Asn Trp Arg Trp Thr His Ala Thr Asn Ser Ser
35 40 45
acc aac tgt tac gat ggc aac act tgg tcc tcc acc ttg tgt ccc gat 240
Thr Asn Cys Tyr Asp Gly Asn Thr Trp Ser Ser Thr Leu Cys Pro Asp
50 55 60
aac gaa acc tgt gcc aag aac tgt tgt ttg gat ggt gca gcc tac gcc 288
Asn Glu Thr Cys Ala Lys Asn Cys Cys Leu Asp Gly Ala Ala Tyr Ala
65 70 75
tcg aca tac gga gtc act act tcc ggc aac tcg ctc tcg atc ggc ttc 336
Ser Thr Tyr Gly Val Thr Thr Ser Gly Asn Ser Leu Ser Ile Gly Phe
80 85 90 95
gtg act cag tcc gca cag aaa aac gtc gga gcg cga ctc tac ttg atg 384
Val Thr Gln Ser Ala Gln Lys Asn Val Gly Ala Arg Leu Tyr Leu Met
100 105 110
gca tcc gat aca acc tac cag gaa ttc act ctc ttg ggc aac gag ttc 432
Ala Ser Asp Thr Thr Tyr Gln Glu Phe Thr Leu Leu Gly Asn Glu Phe
115 120 125
tcc ttc gac gtc gac gtc tcc cag ctc cct tgt ggc ctc aac gga gca 480
Ser Phe Asp Val Asp Val Ser Gln Leu Pro Cys Gly Leu Asn Gly Ala
130 135 140
ctc tac ttc gtg tcg atg gac gcg gat gga ggt gtc tcc aag tac ccg 528
Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Val Ser Lys Tyr Pro
145 150 155
acc aac aca gca gga gcg aaa tac ggc acg ggt tac tgt gac tcg cag 576
Thr Asn Thr Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln
160 165 170 175
tgt cct cgc gat ctc aag ttc atc aac ggc cag gca aac gtc gaa ggc 624
Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Glu Gly
180 185 190
tgg gaa ccc tcg tcg gcc aac gcc gcc acc ggc att gga ggc cat ggc 672
Trp Glu Pro Ser Ser Ala Asn Ala Ala Thr Gly Ile Gly Gly His Gly
195 200 205
tcc tgt tgt tcg gaa atg gat atc tgg gag gcc aac tcg atc tcc gag 720
Ser Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Ser Ile Ser Glu
210 215 220
gca ctc aca ccc cac ccc tgt aca acc gtc ggc cag gag att tgt gaa 768
Ala Leu Thr Pro His Pro Cys Thr Thr Val Gly Gln Glu Ile Cys Glu
225 230 235
gga gac ggc tgt ggc gga act tac tcc gat aac cgt tac ggt ggt acc 816
Gly Asp Gly Cys Gly Gly Thr Tyr Ser Asp Asn Arg Tyr Gly Gly Thr
240 245 250 255
tgt gat ccc gat ggc tgt gac tgg aac ccc tac cgc ctc ggt aac aca 864
Cys Asp Pro Asp Gly Cys Asp Trp Asn Pro Tyr Arg Leu Gly Asn Thr
260 265 270
tcg ttc tac ggt ccg ggt tcc tcc ttc acc ctc gac act acc aaa aag 912
Ser Phe Tyr Gly Pro Gly Ser Ser Phe Thr Leu Asp Thr Thr Lys Lys
275 280 285
ttg acg gtg gtc acg cag ttc gag act tcc gga gcc atc aac cgg tac 960
Leu Thr Val Val Thr Gln Phe Glu Thr Ser Gly Ala Ile Asn Arg Tyr
290 295 300
tac gtg cag aac gga gtc aca ttc cag cag ccc aac gca gaa ctc ggc 1008
Tyr Val Gln Asn Gly Val Thr Phe Gln Gln Pro Asn Ala Glu Leu Gly
305 310 315
tcg tac tcg gga aac gag ctc aac gat gat tac tgt aca gcg gaa gag 1056
Ser Tyr Ser Gly Asn Glu Leu Asn Asp Asp Tyr Cys Thr Ala Glu Glu
320 325 330 335
gca gaa ttc gga gga tcg tcg ttc tcc gac aag ggt ggt ttg acc cag 1104
Ala Glu Phe Gly Gly Ser Ser Phe Ser Asp Lys Gly Gly Leu Thr Gln
340 345 350
ttc aag aag gcc aca tcg gga gga atg gtg ttg gtc atg tcc ttg tgg 1152
Phe Lys Lys Ala Thr Ser Gly Gly Met Val Leu Val Met Ser Leu Trp
355 360 365
gac gac tac tat gcc aac atg ctc tgg ctc gac tcc acc tac ccc acc 1200
Asp Asp Tyr Tyr Ala Asn Met Leu Trp Leu Asp Ser Thr Tyr Pro Thr
370 375 380
aac gag acc tcc tcg aca cct ggc gca gtg agg ggc tcg tgt tcc act 1248
Asn Glu Thr Ser Ser Thr Pro Gly Ala Val Arg Gly Ser Cys Ser Thr
385 390 395
tcg tcg gga gtg cct gca cag gtg gag tcc cag tcg ccg aac gcc aag 1296
Ser Ser Gly Val Pro Ala Gln Val Glu Ser Gln Ser Pro Asn Ala Lys
400 405 410 415
gtc act ttc tcc aac att aag ttc gga ccc atc ggt tcg acc ggc aac 1344
Val Thr Phe Ser Asn Ile Lys Phe Gly Pro Ile Gly Ser Thr Gly Asn
420 425 430
ccc tcc ggt gga aac cct cct ggc gga aac cct cct ggc aca act aca 1392
Pro Ser Gly Gly Asn Pro Pro Gly Gly Asn Pro Pro Gly Thr Thr Thr
435 440 445
aca cga cgg cct gcg act aca acg ggt tcg tcc cct gga ccg acc cag 1440
Thr Arg Arg Pro Ala Thr Thr Thr Gly Ser Ser Pro Gly Pro Thr Gln
450 455 460
tcc cac tac gga cag tgt gga ggc atc ggt tat tcc ggt ccg acc gtc 1488
Ser His Tyr Gly Gln Cys Gly Gly Ile Gly Tyr Ser Gly Pro Thr Val
465 470 475
tgt gcg tcc ggc aca acc tgt cag gtc ttg aac cct tac tat tcg cag 1536
Cys Ala Ser Gly Thr Thr Cys Gln Val Leu Asn Pro Tyr Tyr Ser Gln
480 485 490 495
tgt ctc taa 1545
Cys Leu
<210> 34
<211> 514
<212> PRT
<213> 里氏木霉(Trichoderma reesei)
<400> 34
Met Tyr Arg Lys Leu Ala Val Ile Ser Ala Phe Leu Ala Thr Ala Arg
-15 -10 -5
Ala Gln Ser Ala Cys Thr Leu Gln Ser Glu Thr His Pro Pro Leu Thr
-1 1 5 10 15
Trp Gln Lys Cys Ser Ser Gly Gly Thr Cys Thr Gln Gln Thr Gly Ser
20 25 30
Val Val Ile Asp Ala Asn Trp Arg Trp Thr His Ala Thr Asn Ser Ser
35 40 45
Thr Asn Cys Tyr Asp Gly Asn Thr Trp Ser Ser Thr Leu Cys Pro Asp
50 55 60
Asn Glu Thr Cys Ala Lys Asn Cys Cys Leu Asp Gly Ala Ala Tyr Ala
65 70 75
Ser Thr Tyr Gly Val Thr Thr Ser Gly Asn Ser Leu Ser Ile Gly Phe
80 85 90 95
Val Thr Gln Ser Ala Gln Lys Asn Val Gly Ala Arg Leu Tyr Leu Met
100 105 110
Ala Ser Asp Thr Thr Tyr Gln Glu Phe Thr Leu Leu Gly Asn Glu Phe
115 120 125
Ser Phe Asp Val Asp Val Ser Gln Leu Pro Cys Gly Leu Asn Gly Ala
130 135 140
Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Val Ser Lys Tyr Pro
145 150 155
Thr Asn Thr Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln
160 165 170 175
Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Glu Gly
180 185 190
Trp Glu Pro Ser Ser Ala Asn Ala Ala Thr Gly Ile Gly Gly His Gly
195 200 205
Ser Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Ser Ile Ser Glu
210 215 220
Ala Leu Thr Pro His Pro Cys Thr Thr Val Gly Gln Glu Ile Cys Glu
225 230 235
Gly Asp Gly Cys Gly Gly Thr Tyr Ser Asp Asn Arg Tyr Gly Gly Thr
240 245 250 255
Cys Asp Pro Asp Gly Cys Asp Trp Asn Pro Tyr Arg Leu Gly Asn Thr
260 265 270
Ser Phe Tyr Gly Pro Gly Ser Ser Phe Thr Leu Asp Thr Thr Lys Lys
275 280 285
Leu Thr Val Val Thr Gln Phe Glu Thr Ser Gly Ala Ile Asn Arg Tyr
290 295 300
Tyr Val Gln Asn Gly Val Thr Phe Gln Gln Pro Asn Ala Glu Leu Gly
305 310 315
Ser Tyr Ser Gly Asn Glu Leu Asn Asp Asp Tyr Cys Thr Ala Glu Glu
320 325 330 335
Ala Glu Phe Gly Gly Ser Ser Phe Ser Asp Lys Gly Gly Leu Thr Gln
340 345 350
Phe Lys Lys Ala Thr Ser Gly Gly Met Val Leu Val Met Ser Leu Trp
355 360 365
Asp Asp Tyr Tyr Ala Asn Met Leu Trp Leu Asp Ser Thr Tyr Pro Thr
370 375 380
Asn Glu Thr Ser Ser Thr Pro Gly Ala Val Arg Gly Ser Cys Ser Thr
385 390 395
Ser Ser Gly Val Pro Ala Gln Val Glu Ser Gln Ser Pro Asn Ala Lys
400 405 410 415
Val Thr Phe Ser Asn Ile Lys Phe Gly Pro Ile Gly Ser Thr Gly Asn
420 425 430
Pro Ser Gly Gly Asn Pro Pro Gly Gly Asn Pro Pro Gly Thr Thr Thr
435 440 445
Thr Arg Arg Pro Ala Thr Thr Thr Gly Ser Ser Pro Gly Pro Thr Gln
450 455 460
Ser His Tyr Gly Gln Cys Gly Gly Ile Gly Tyr Ser Gly Pro Thr Val
465 470 475
Cys Ala Ser Gly Thr Thr Cys Gln Val Leu Asn Pro Tyr Tyr Ser Gln
480 485 490 495
Cys Leu
<210> 35
<211> 1599
<212> DNA
<213> 烟曲霉(Aspergillus fumigatus)
<220>
<221> 信号肽
<222> (1)..(26)
<220>
<221> CDS
<222> (1)..(1596)
<220>
<221> 成熟肽
<222> (79)..(1596)
<400> 35
atg ctg gcc tcc acc ttc tcc tac cgc atg tac aag acc gcg ctc atc 48
Met Leu Ala Ser Thr Phe Ser Tyr Arg Met Tyr Lys Thr Ala Leu Ile
-25 -20 -15
ctg gcc gcc ctt ctg ggc tct ggc cag gct cag cag gtc ggt act tcc 96
Leu Ala Ala Leu Leu Gly Ser Gly Gln Ala Gln Gln Val Gly Thr Ser
-10 -5 -1 1 5
cag gcg gaa gtg cat ccg tcc atg acc tgg cag agc tgc acg gct ggc 144
Gln Ala Glu Val His Pro Ser Met Thr Trp Gln Ser Cys Thr Ala Gly
10 15 20
ggc agc tgc acc acc aac aac ggc aag gtg gtc atc gac gcg aac tgg 192
Gly Ser Cys Thr Thr Asn Asn Gly Lys Val Val Ile Asp Ala Asn Trp
25 30 35
cgt tgg gtg cac aaa gtc ggc gac tac acc aac tgc tac acc ggc aac 240
Arg Trp Val His Lys Val Gly Asp Tyr Thr Asn Cys Tyr Thr Gly Asn
40 45 50
acc tgg gac acg act atc tgc cct gac gat gcg acc tgc gca tcc aac 288
Thr Trp Asp Thr Thr Ile Cys Pro Asp Asp Ala Thr Cys Ala Ser Asn
55 60 65 70
tgc gcc ctt gag ggt gcc aac tac gaa tcc acc tat ggt gtg acc gcc 336
Cys Ala Leu Glu Gly Ala Asn Tyr Glu Ser Thr Tyr Gly Val Thr Ala
75 80 85
agc ggc aat tcc ctc cgc ctc aac ttc gtc acc acc agc cag cag aag 384
Ser Gly Asn Ser Leu Arg Leu Asn Phe Val Thr Thr Ser Gln Gln Lys
90 95 100
aac att ggc tcg cgt ctg tac atg atg aag gac gac tcg acc tac gag 432
Asn Ile Gly Ser Arg Leu Tyr Met Met Lys Asp Asp Ser Thr Tyr Glu
105 110 115
atg ttt aag ctg ctg aac cag gag ttc acc ttc gat gtc gat gtc tcc 480
Met Phe Lys Leu Leu Asn Gln Glu Phe Thr Phe Asp Val Asp Val Ser
120 125 130
aac ctc ccc tgc ggt ctc aac ggt gct ctg tac ttt gtc gcc atg gac 528
Asn Leu Pro Cys Gly Leu Asn Gly Ala Leu Tyr Phe Val Ala Met Asp
135 140 145 150
gcc gac ggt ggc atg tcc aag tac cca acc aac aag gcc ggt gcc aag 576
Ala Asp Gly Gly Met Ser Lys Tyr Pro Thr Asn Lys Ala Gly Ala Lys
155 160 165
tac ggt act gga tac tgt gac tcg cag tgc cct cgc gac ctc aag ttc 624
Tyr Gly Thr Gly Tyr Cys Asp Ser Gln Cys Pro Arg Asp Leu Lys Phe
170 175 180
atc aac ggt cag gcc aac gtc gaa ggg tgg cag ccc tcc tcc aac gat 672
Ile Asn Gly Gln Ala Asn Val Glu Gly Trp Gln Pro Ser Ser Asn Asp
185 190 195
gcc aat gcg ggt acc ggc aac cac ggg tcc tgc tgc gcg gag atg gat 720
Ala Asn Ala Gly Thr Gly Asn His Gly Ser Cys Cys Ala Glu Met Asp
200 205 210
atc tgg gag gcc aac agc atc tcc acg gcc ttc acc ccc cat ccg tgc 768
Ile Trp Glu Ala Asn Ser Ile Ser Thr Ala Phe Thr Pro His Pro Cys
215 220 225 230
gac acg ccc ggc cag gtg atg tgc acc ggt gat gcc tgc ggt ggc acc 816
Asp Thr Pro Gly Gln Val Met Cys Thr Gly Asp Ala Cys Gly Gly Thr
235 240 245
tac agc tcc gac cgc tac ggc ggc acc tgc gac ccc gac gga tgt gat 864
Tyr Ser Ser Asp Arg Tyr Gly Gly Thr Cys Asp Pro Asp Gly Cys Asp
250 255 260
ttc aac tcc ttc cgc cag ggc aac aag acc ttc tac ggc cct ggc atg 912
Phe Asn Ser Phe Arg Gln Gly Asn Lys Thr Phe Tyr Gly Pro Gly Met
265 270 275
acc gtc gac acc aag agc aag ttt acc gtc gtc acc cag ttc atc acc 960
Thr Val Asp Thr Lys Ser Lys Phe Thr Val Val Thr Gln Phe Ile Thr
280 285 290
gac gac ggc acc tcc agc ggc acc ctc aag gag atc aag cgc ttc tac 1008
Asp Asp Gly Thr Ser Ser Gly Thr Leu Lys Glu Ile Lys Arg Phe Tyr
295 300 305 310
gtg cag aac ggc aag gtg atc ccc aac tcg gag tcg acc tgg acc ggc 1056
Val Gln Asn Gly Lys Val Ile Pro Asn Ser Glu Ser Thr Trp Thr Gly
315 320 325
gtc agc ggc aac tcc atc acc acc gag tac tgc acc gcc cag aag agc 1104
Val Ser Gly Asn Ser Ile Thr Thr Glu Tyr Cys Thr Ala Gln Lys Ser
330 335 340
ctg ttc cag gac cag aac gtc ttc gaa aag cac ggc ggc ctc gag ggc 1152
Leu Phe Gln Asp Gln Asn Val Phe Glu Lys His Gly Gly Leu Glu Gly
345 350 355
atg ggt gct gcc ctc gcc cag ggt atg gtt ctc gtc atg tcc ctg tgg 1200
Met Gly Ala Ala Leu Ala Gln Gly Met Val Leu Val Met Ser Leu Trp
360 365 370
gat gat cac tcg gcc aac atg ctc tgg ctc gac agc aac tac ccg acc 1248
Asp Asp His Ser Ala Asn Met Leu Trp Leu Asp Ser Asn Tyr Pro Thr
375 380 385 390
act gcc tct tcc acc act ccc ggc gtc gcc cgt ggt acc tgc gac atc 1296
Thr Ala Ser Ser Thr Thr Pro Gly Val Ala Arg Gly Thr Cys Asp Ile
395 400 405
tcc tcc ggc gtc cct gcg gat gtc gag gcg aac cac ccc gac gcc tac 1344
Ser Ser Gly Val Pro Ala Asp Val Glu Ala Asn His Pro Asp Ala Tyr
410 415 420
gtc gtc tac tcc aac atc aag gtc ggc ccc atc ggc tcg acc ttc aac 1392
Val Val Tyr Ser Asn Ile Lys Val Gly Pro Ile Gly Ser Thr Phe Asn
425 430 435
agc ggt ggc tcg aac ccc ggt ggc gga acc acc acg aca act acc acc 1440
Ser Gly Gly Ser Asn Pro Gly Gly Gly Thr Thr Thr Thr Thr Thr Thr
440 445 450
cag cct act acc acc acg acc acg gct gga aac cct ggc ggc acc gga 1488
Gln Pro Thr Thr Thr Thr Thr Thr Ala Gly Asn Pro Gly Gly Thr Gly
455 460 465 470
gtc gca cag cac tat ggc cag tgt ggt gga atc gga tgg acc gga ccc 1536
Val Ala Gln His Tyr Gly Gln Cys Gly Gly Ile Gly Trp Thr Gly Pro
475 480 485
aca acc tgt gcc agc cct tat acc tgc cag aag ctg aat gat tat tac 1584
Thr Thr Cys Ala Ser Pro Tyr Thr Cys Gln Lys Leu Asn Asp Tyr Tyr
490 495 500
tct cag tgc ctg tag 1599
Ser Gln Cys Leu
505
<210> 36
<211> 532
<212> PRT
<213> 烟曲霉(Aspergillus fumigatus)
<400> 36
Met Leu Ala Ser Thr Phe Ser Tyr Arg Met Tyr Lys Thr Ala Leu Ile
-25 -20 -15
Leu Ala Ala Leu Leu Gly Ser Gly Gln Ala Gln Gln Val Gly Thr Ser
-10 -5 -1 1 5
Gln Ala Glu Val His Pro Ser Met Thr Trp Gln Ser Cys Thr Ala Gly
10 15 20
Gly Ser Cys Thr Thr Asn Asn Gly Lys Val Val Ile Asp Ala Asn Trp
25 30 35
Arg Trp Val His Lys Val Gly Asp Tyr Thr Asn Cys Tyr Thr Gly Asn
40 45 50
Thr Trp Asp Thr Thr Ile Cys Pro Asp Asp Ala Thr Cys Ala Ser Asn
55 60 65 70
Cys Ala Leu Glu Gly Ala Asn Tyr Glu Ser Thr Tyr Gly Val Thr Ala
75 80 85
Ser Gly Asn Ser Leu Arg Leu Asn Phe Val Thr Thr Ser Gln Gln Lys
90 95 100
Asn Ile Gly Ser Arg Leu Tyr Met Met Lys Asp Asp Ser Thr Tyr Glu
105 110 115
Met Phe Lys Leu Leu Asn Gln Glu Phe Thr Phe Asp Val Asp Val Ser
120 125 130
Asn Leu Pro Cys Gly Leu Asn Gly Ala Leu Tyr Phe Val Ala Met Asp
135 140 145 150
Ala Asp Gly Gly Met Ser Lys Tyr Pro Thr Asn Lys Ala Gly Ala Lys
155 160 165
Tyr Gly Thr Gly Tyr Cys Asp Ser Gln Cys Pro Arg Asp Leu Lys Phe
170 175 180
Ile Asn Gly Gln Ala Asn Val Glu Gly Trp Gln Pro Ser Ser Asn Asp
185 190 195
Ala Asn Ala Gly Thr Gly Asn His Gly Ser Cys Cys Ala Glu Met Asp
200 205 210
Ile Trp Glu Ala Asn Ser Ile Ser Thr Ala Phe Thr Pro His Pro Cys
215 220 225 230
Asp Thr Pro Gly Gln Val Met Cys Thr Gly Asp Ala Cys Gly Gly Thr
235 240 245
Tyr Ser Ser Asp Arg Tyr Gly Gly Thr Cys Asp Pro Asp Gly Cys Asp
250 255 260
Phe Asn Ser Phe Arg Gln Gly Asn Lys Thr Phe Tyr Gly Pro Gly Met
265 270 275
Thr Val Asp Thr Lys Ser Lys Phe Thr Val Val Thr Gln Phe Ile Thr
280 285 290
Asp Asp Gly Thr Ser Ser Gly Thr Leu Lys Glu Ile Lys Arg Phe Tyr
295 300 305 310
Val Gln Asn Gly Lys Val Ile Pro Asn Ser Glu Ser Thr Trp Thr Gly
315 320 325
Val Ser Gly Asn Ser Ile Thr Thr Glu Tyr Cys Thr Ala Gln Lys Ser
330 335 340
Leu Phe Gln Asp Gln Asn Val Phe Glu Lys His Gly Gly Leu Glu Gly
345 350 355
Met Gly Ala Ala Leu Ala Gln Gly Met Val Leu Val Met Ser Leu Trp
360 365 370
Asp Asp His Ser Ala Asn Met Leu Trp Leu Asp Ser Asn Tyr Pro Thr
375 380 385 390
Thr Ala Ser Ser Thr Thr Pro Gly Val Ala Arg Gly Thr Cys Asp Ile
395 400 405
Ser Ser Gly Val Pro Ala Asp Val Glu Ala Asn His Pro Asp Ala Tyr
410 415 420
Val Val Tyr Ser Asn Ile Lys Val Gly Pro Ile Gly Ser Thr Phe Asn
425 430 435
Ser Gly Gly Ser Asn Pro Gly Gly Gly Thr Thr Thr Thr Thr Thr Thr
440 445 450
Gln Pro Thr Thr Thr Thr Thr Thr Ala Gly Asn Pro Gly Gly Thr Gly
455 460 465 470
Val Ala Gln His Tyr Gly Gln Cys Gly Gly Ile Gly Trp Thr Gly Pro
475 480 485
Thr Thr Cys Ala Ser Pro Tyr Thr Cys Gln Lys Leu Asn Asp Tyr Tyr
490 495 500
Ser Gln Cys Leu
505
<210> 37
<211> 1374
<212> DNA
<213> 金黄色嗜热子囊菌(Thermoascus aurantiacus)
<220>
<221> 信号肽
<222> (1)..(17)
<220>
<221> CDS
<222> (1)..(1371)
<220>
<221> 成熟肽
<222> (52)..(1371)
<400> 37
atg tat cag cgc gct ctt ctc ttc tct ttc ttc ctc tcc gcc gcc cgc 48
Met Tyr Gln Arg Ala Leu Leu Phe Ser Phe Phe Leu Ser Ala Ala Arg
-15 -10 -5
gcg cag cag gcc ggt acc cta acc gca gag aat cac cct tcc ctg acc 96
Ala Gln Gln Ala Gly Thr Leu Thr Ala Glu Asn His Pro Ser Leu Thr
-1 1 5 10 15
tgg cag caa tgc tcc agc ggc ggt agt tgt acc acg cag aat gga aaa 144
Trp Gln Gln Cys Ser Ser Gly Gly Ser Cys Thr Thr Gln Asn Gly Lys
20 25 30
gtc gtt atc gat gcg aac tgg cgt tgg gtc cat acc acc tct gga tac 192
Val Val Ile Asp Ala Asn Trp Arg Trp Val His Thr Thr Ser Gly Tyr
35 40 45
acc aac tgc tac acg ggc aat acg tgg gac acc agt atc tgt ccc gac 240
Thr Asn Cys Tyr Thr Gly Asn Thr Trp Asp Thr Ser Ile Cys Pro Asp
50 55 60
gac gtg acc tgc gct cag aat tgt gcc ttg gat gga gcg gat tac agt 288
Asp Val Thr Cys Ala Gln Asn Cys Ala Leu Asp Gly Ala Asp Tyr Ser
65 70 75
ggc acc tat ggt gtt acg acc agt ggc aac gcc ctg aga ctg aac ttt 336
Gly Thr Tyr Gly Val Thr Thr Ser Gly Asn Ala Leu Arg Leu Asn Phe
80 85 90 95
gtc acc caa agc tca ggg aag aac att ggc tcg cgc ctg tac ctg ctg 384
Val Thr Gln Ser Ser Gly Lys Asn Ile Gly Ser Arg Leu Tyr Leu Leu
100 105 110
cag gac gac acc act tat cag atc ttc aag ctg ctg ggt cag gag ttt 432
Gln Asp Asp Thr Thr Tyr Gln Ile Phe Lys Leu Leu Gly Gln Glu Phe
115 120 125
acc ttc gat gtc gac gtc tcc aat ctc cct tgc ggg ctg aac ggc gcc 480
Thr Phe Asp Val Asp Val Ser Asn Leu Pro Cys Gly Leu Asn Gly Ala
130 135 140
ctc tac ttt gtg gcc atg gac gcc gac ggc gga ttg tcc aaa tac cct 528
Leu Tyr Phe Val Ala Met Asp Ala Asp Gly Gly Leu Ser Lys Tyr Pro
145 150 155
ggc aac aag gca ggc gct aag tat ggc act ggt tac tgc gac tct cag 576
Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln
160 165 170 175
tgc cct cgg gat ctc aag ttc atc aac ggt cag gcc aac gtt gaa ggc 624
Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Glu Gly
180 185 190
tgg cag ccg tct gcc aac gac cca aat gcc ggc gtt ggt aac cac ggt 672
Trp Gln Pro Ser Ala Asn Asp Pro Asn Ala Gly Val Gly Asn His Gly
195 200 205
tcc tgc tgc gct gag atg gat gtc tgg gaa gcc aac agc atc tct act 720
Ser Cys Cys Ala Glu Met Asp Val Trp Glu Ala Asn Ser Ile Ser Thr
210 215 220
gcg gtg acg cct cac cca tgc gac acc ccc ggc cag acc atg tgc cag 768
Ala Val Thr Pro His Pro Cys Asp Thr Pro Gly Gln Thr Met Cys Gln
225 230 235
gga gac gac tgt ggt gga acc tac tcc tcc act cga tat gct ggt acc 816
Gly Asp Asp Cys Gly Gly Thr Tyr Ser Ser Thr Arg Tyr Ala Gly Thr
240 245 250 255
tgc gac cct gat ggc tgc gac ttc aat cct tac cgc cag ggc aac cac 864
Cys Asp Pro Asp Gly Cys Asp Phe Asn Pro Tyr Arg Gln Gly Asn His
260 265 270
tcg ttc tac ggc ccc ggg aag atc gtc gac act agc tcc aaa ttc acc 912
Ser Phe Tyr Gly Pro Gly Lys Ile Val Asp Thr Ser Ser Lys Phe Thr
275 280 285
gtc gtc acc cag ttc atc acc gac gac ggg acc ccc tcc ggc acc ctg 960
Val Val Thr Gln Phe Ile Thr Asp Asp Gly Thr Pro Ser Gly Thr Leu
290 295 300
acg gag atc aaa cgc ttc tac gtc cag aac ggc aag gtg atc ccc cag 1008
Thr Glu Ile Lys Arg Phe Tyr Val Gln Asn Gly Lys Val Ile Pro Gln
305 310 315
tcg gag tcg acg atc agc ggc gtc acc ggc aac tca atc acc acc gag 1056
Ser Glu Ser Thr Ile Ser Gly Val Thr Gly Asn Ser Ile Thr Thr Glu
320 325 330 335
tat tgc acg gcc cag aag gcc gcc ttc ggc gac aac acc ggc ttc ttc 1104
Tyr Cys Thr Ala Gln Lys Ala Ala Phe Gly Asp Asn Thr Gly Phe Phe
340 345 350
acg cac ggc ggg ctt cag aag atc agt cag gct ctg gct cag ggc atg 1152
Thr His Gly Gly Leu Gln Lys Ile Ser Gln Ala Leu Ala Gln Gly Met
355 360 365
gtc ctc gtc atg agc ctg tgg gac gat cac gcc gcc aac atg ctc tgg 1200
Val Leu Val Met Ser Leu Trp Asp Asp His Ala Ala Asn Met Leu Trp
370 375 380
ctg gac agc acc tac ccg act gat gcg gac ccg gac acc cct ggc gtc 1248
Leu Asp Ser Thr Tyr Pro Thr Asp Ala Asp Pro Asp Thr Pro Gly Val
385 390 395
gcg cgc ggt acc tgc ccc acg acc tcc ggc gtc ccg gcc gac gtt gag 1296
Ala Arg Gly Thr Cys Pro Thr Thr Ser Gly Val Pro Ala Asp Val Glu
400 405 410 415
tcg cag aac ccc aat tca tat gtt atc tac tcc aac atc aag gtc gga 1344
Ser Gln Asn Pro Asn Ser Tyr Val Ile Tyr Ser Asn Ile Lys Val Gly
420 425 430
ccc atc aac tcg acc ttc acc gcc aac taa 1374
Pro Ile Asn Ser Thr Phe Thr Ala Asn
435 440
<210> 38
<211> 457
<212> PRT
<213> 金黄色嗜热子囊菌(Thermoascus aurantiacus)
<400> 38
Met Tyr Gln Arg Ala Leu Leu Phe Ser Phe Phe Leu Ser Ala Ala Arg
-15 -10 -5
Ala Gln Gln Ala Gly Thr Leu Thr Ala Glu Asn His Pro Ser Leu Thr
-1 1 5 10 15
Trp Gln Gln Cys Ser Ser Gly Gly Ser Cys Thr Thr Gln Asn Gly Lys
20 25 30
Val Val Ile Asp Ala Asn Trp Arg Trp Val His Thr Thr Ser Gly Tyr
35 40 45
Thr Asn Cys Tyr Thr Gly Asn Thr Trp Asp Thr Ser Ile Cys Pro Asp
50 55 60
Asp Val Thr Cys Ala Gln Asn Cys Ala Leu Asp Gly Ala Asp Tyr Ser
65 70 75
Gly Thr Tyr Gly Val Thr Thr Ser Gly Asn Ala Leu Arg Leu Asn Phe
80 85 90 95
Val Thr Gln Ser Ser Gly Lys Asn Ile Gly Ser Arg Leu Tyr Leu Leu
100 105 110
Gln Asp Asp Thr Thr Tyr Gln Ile Phe Lys Leu Leu Gly Gln Glu Phe
115 120 125
Thr Phe Asp Val Asp Val Ser Asn Leu Pro Cys Gly Leu Asn Gly Ala
130 135 140
Leu Tyr Phe Val Ala Met Asp Ala Asp Gly Gly Leu Ser Lys Tyr Pro
145 150 155
Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln
160 165 170 175
Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Glu Gly
180 185 190
Trp Gln Pro Ser Ala Asn Asp Pro Asn Ala Gly Val Gly Asn His Gly
195 200 205
Ser Cys Cys Ala Glu Met Asp Val Trp Glu Ala Asn Ser Ile Ser Thr
210 215 220
Ala Val Thr Pro His Pro Cys Asp Thr Pro Gly Gln Thr Met Cys Gln
225 230 235
Gly Asp Asp Cys Gly Gly Thr Tyr Ser Ser Thr Arg Tyr Ala Gly Thr
240 245 250 255
Cys Asp Pro Asp Gly Cys Asp Phe Asn Pro Tyr Arg Gln Gly Asn His
260 265 270
Ser Phe Tyr Gly Pro Gly Lys Ile Val Asp Thr Ser Ser Lys Phe Thr
275 280 285
Val Val Thr Gln Phe Ile Thr Asp Asp Gly Thr Pro Ser Gly Thr Leu
290 295 300
Thr Glu Ile Lys Arg Phe Tyr Val Gln Asn Gly Lys Val Ile Pro Gln
305 310 315
Ser Glu Ser Thr Ile Ser Gly Val Thr Gly Asn Ser Ile Thr Thr Glu
320 325 330 335
Tyr Cys Thr Ala Gln Lys Ala Ala Phe Gly Asp Asn Thr Gly Phe Phe
340 345 350
Thr His Gly Gly Leu Gln Lys Ile Ser Gln Ala Leu Ala Gln Gly Met
355 360 365
Val Leu Val Met Ser Leu Trp Asp Asp His Ala Ala Asn Met Leu Trp
370 375 380
Leu Asp Ser Thr Tyr Pro Thr Asp Ala Asp Pro Asp Thr Pro Gly Val
385 390 395
Ala Arg Gly Thr Cys Pro Thr Thr Ser Gly Val Pro Ala Asp Val Glu
400 405 410 415
Ser Gln Asn Pro Asn Ser Tyr Val Ile Tyr Ser Asn Ile Lys Val Gly
420 425 430
Pro Ile Asn Ser Thr Phe Thr Ala Asn
435 440
<210> 39
<211> 1428
<212> DNA
<213> 埃默森青霉菌(Penicillium emersonii)
<220>
<221> 外显子
<222> (1)..(603)
<220>
<221> CDS
<222> (1)..(603)
<220>
<221> 信号肽
<222> (1)..(18)
<220>
<221> 成熟肽
<222> (55)..(1425)
<220>
<221> 内含子
<222> (604)..(663)
<220>
<221> 外显子
<222> (664)..(1425)
<220>
<221> CDS
<222> (664)..(1425)
<400> 39
atg ctt cga cgg gct ctt ctt cta tcc tct tcc gcc atc ctt gct gtc 48
Met Leu Arg Arg Ala Leu Leu Leu Ser Ser Ser Ala Ile Leu Ala Val
-15 -10 -5
aag gca cag cag gcc ggc acg gcg acg gca gag aac cac ccg ccc ctg 96
Lys Ala Gln Gln Ala Gly Thr Ala Thr Ala Glu Asn His Pro Pro Leu
-1 1 5 10
aca tgg cag gaa tgc acc gcc cct ggg agc tgc acc acc cag aac ggg 144
Thr Trp Gln Glu Cys Thr Ala Pro Gly Ser Cys Thr Thr Gln Asn Gly
15 20 25 30
gcg gtc gtt ctt gat gcg aac tgg cgt tgg gtg cac gat gtg aac gga 192
Ala Val Val Leu Asp Ala Asn Trp Arg Trp Val His Asp Val Asn Gly
35 40 45
tac acc aac tgc tac acg ggc aat acc tgg aac ccc acg tac tgc cct 240
Tyr Thr Asn Cys Tyr Thr Gly Asn Thr Trp Asn Pro Thr Tyr Cys Pro
50 55 60
gac gac gaa acc tgc gcc cag aac tgt gcg ctg gac ggc gcg gat tac 288
Asp Asp Glu Thr Cys Ala Gln Asn Cys Ala Leu Asp Gly Ala Asp Tyr
65 70 75
gag ggc acc tac ggc gtg act tcg tcg ggc agc tcc ttg aag ctc aat 336
Glu Gly Thr Tyr Gly Val Thr Ser Ser Gly Ser Ser Leu Lys Leu Asn
80 85 90
ttc gtc acc ggg tcg aac gtc gga tcc cgt ctc tac ctg ctg cag gac 384
Phe Val Thr Gly Ser Asn Val Gly Ser Arg Leu Tyr Leu Leu Gln Asp
95 100 105 110
gac tcg acc tat cag atc ttc aag ctt ctg aac cgc gag ttt acc ttt 432
Asp Ser Thr Tyr Gln Ile Phe Lys Leu Leu Asn Arg Glu Phe Thr Phe
115 120 125
gac gtc gat gtc tcc aat ctt ccg tgc gga ttg aac ggc gct ctg tac 480
Asp Val Asp Val Ser Asn Leu Pro Cys Gly Leu Asn Gly Ala Leu Tyr
130 135 140
ttt gtc gcc atg gac gcc gac ggc ggc gtg tcc aag tac ccg aac aac 528
Phe Val Ala Met Asp Ala Asp Gly Gly Val Ser Lys Tyr Pro Asn Asn
145 150 155
aag gct ggt gcc aag tac gga acc ggg tat tgc gac tcc caa tgc cca 576
Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln Cys Pro
160 165 170
cgg gac ctc aag ttc atc gac ggc gag gtatgtccag tggtaaaatc 623
Arg Asp Leu Lys Phe Ile Asp Gly Glu
175 180
gatcgtctcg tgaacttctg ctgacaggtt cgatctacag gcc aac gtc gag ggc 678
Ala Asn Val Glu Gly
185
tgg cag ccg tct tcg aac aac gcc aac acc gga att ggc gac cat ggc 726
Trp Gln Pro Ser Ser Asn Asn Ala Asn Thr Gly Ile Gly Asp His Gly
190 195 200
tcc tgc tgt gcg gag atg gat gtc tgg gaa gcc aac agc atc tcc aat 774
Ser Cys Cys Ala Glu Met Asp Val Trp Glu Ala Asn Ser Ile Ser Asn
205 210 215 220
gcg gtc act ccg cac ccg tgc gac acg cca ggc cag acg atg tgc tct 822
Ala Val Thr Pro His Pro Cys Asp Thr Pro Gly Gln Thr Met Cys Ser
225 230 235
ggc gat gac tgc ggt ggc aca tac tct aac gat cgc tac gcg gga acc 870
Gly Asp Asp Cys Gly Gly Thr Tyr Ser Asn Asp Arg Tyr Ala Gly Thr
240 245 250
tgc gat cct gac ggc tgt gac ttc aac cct tac cgc atg ggc aac act 918
Cys Asp Pro Asp Gly Cys Asp Phe Asn Pro Tyr Arg Met Gly Asn Thr
255 260 265
tct ttc tac ggg cct ggc aag atc atc gat acc acc aag cct ttc act 966
Ser Phe Tyr Gly Pro Gly Lys Ile Ile Asp Thr Thr Lys Pro Phe Thr
270 275 280
gtc gtg acg cag ttc ctc act gat gat ggt acg gat act gga act ctc 1014
Val Val Thr Gln Phe Leu Thr Asp Asp Gly Thr Asp Thr Gly Thr Leu
285 290 295 300
agc gag atc aag cgc ttc tac gtc cag aac ggc aac gtc att ccg cag 1062
Ser Glu Ile Lys Arg Phe Tyr Val Gln Asn Gly Asn Val Ile Pro Gln
305 310 315
ccc aac tcg gac atc agt ggc gtg acc ggc aac tcg atc acg acg gag 1110
Pro Asn Ser Asp Ile Ser Gly Val Thr Gly Asn Ser Ile Thr Thr Glu
320 325 330
ttc tgt act gct cag aag cag gcc ttt ggc gac acg gac gac ttc tct 1158
Phe Cys Thr Ala Gln Lys Gln Ala Phe Gly Asp Thr Asp Asp Phe Ser
335 340 345
cag cac ggt ggc ctg gcc aag atg gga gcg gcc atg cag cag ggt atg 1206
Gln His Gly Gly Leu Ala Lys Met Gly Ala Ala Met Gln Gln Gly Met
350 355 360
gtc ctg gtg atg agt ttg tgg gac gac tac gcc gcg cag atg ctg tgg 1254
Val Leu Val Met Ser Leu Trp Asp Asp Tyr Ala Ala Gln Met Leu Trp
365 370 375 380
ctg gat tcc gac tac ccg acg gat gcg gac ccc acg acc cct ggt att 1302
Leu Asp Ser Asp Tyr Pro Thr Asp Ala Asp Pro Thr Thr Pro Gly Ile
385 390 395
gcc cgt gga acg tgt ccg acg gac tcg ggc gtc cca tcg gat gtc gag 1350
Ala Arg Gly Thr Cys Pro Thr Asp Ser Gly Val Pro Ser Asp Val Glu
400 405 410
tcg cag agc ccc aac tcc tac gtg acc tac tcg aac atc aag ttt ggt 1398
Ser Gln Ser Pro Asn Ser Tyr Val Thr Tyr Ser Asn Ile Lys Phe Gly
415 420 425
ccg atc aac tcg acc ttc acc gct tcg tga 1428
Pro Ile Asn Ser Thr Phe Thr Ala Ser
430 435
<210> 40
<211> 455
<212> PRT
<213> 埃默森青霉菌(Penicillium emersonii)
<400> 40
Met Leu Arg Arg Ala Leu Leu Leu Ser Ser Ser Ala Ile Leu Ala Val
-15 -10 -5
Lys Ala Gln Gln Ala Gly Thr Ala Thr Ala Glu Asn His Pro Pro Leu
-1 1 5 10
Thr Trp Gln Glu Cys Thr Ala Pro Gly Ser Cys Thr Thr Gln Asn Gly
15 20 25 30
Ala Val Val Leu Asp Ala Asn Trp Arg Trp Val His Asp Val Asn Gly
35 40 45
Tyr Thr Asn Cys Tyr Thr Gly Asn Thr Trp Asn Pro Thr Tyr Cys Pro
50 55 60
Asp Asp Glu Thr Cys Ala Gln Asn Cys Ala Leu Asp Gly Ala Asp Tyr
65 70 75
Glu Gly Thr Tyr Gly Val Thr Ser Ser Gly Ser Ser Leu Lys Leu Asn
80 85 90
Phe Val Thr Gly Ser Asn Val Gly Ser Arg Leu Tyr Leu Leu Gln Asp
95 100 105 110
Asp Ser Thr Tyr Gln Ile Phe Lys Leu Leu Asn Arg Glu Phe Thr Phe
115 120 125
Asp Val Asp Val Ser Asn Leu Pro Cys Gly Leu Asn Gly Ala Leu Tyr
130 135 140
Phe Val Ala Met Asp Ala Asp Gly Gly Val Ser Lys Tyr Pro Asn Asn
145 150 155
Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln Cys Pro
160 165 170
Arg Asp Leu Lys Phe Ile Asp Gly Glu Ala Asn Val Glu Gly Trp Gln
175 180 185 190
Pro Ser Ser Asn Asn Ala Asn Thr Gly Ile Gly Asp His Gly Ser Cys
195 200 205
Cys Ala Glu Met Asp Val Trp Glu Ala Asn Ser Ile Ser Asn Ala Val
210 215 220
Thr Pro His Pro Cys Asp Thr Pro Gly Gln Thr Met Cys Ser Gly Asp
225 230 235
Asp Cys Gly Gly Thr Tyr Ser Asn Asp Arg Tyr Ala Gly Thr Cys Asp
240 245 250
Pro Asp Gly Cys Asp Phe Asn Pro Tyr Arg Met Gly Asn Thr Ser Phe
255 260 265 270
Tyr Gly Pro Gly Lys Ile Ile Asp Thr Thr Lys Pro Phe Thr Val Val
275 280 285
Thr Gln Phe Leu Thr Asp Asp Gly Thr Asp Thr Gly Thr Leu Ser Glu
290 295 300
Ile Lys Arg Phe Tyr Val Gln Asn Gly Asn Val Ile Pro Gln Pro Asn
305 310 315
Ser Asp Ile Ser Gly Val Thr Gly Asn Ser Ile Thr Thr Glu Phe Cys
320 325 330
Thr Ala Gln Lys Gln Ala Phe Gly Asp Thr Asp Asp Phe Ser Gln His
335 340 345 350
Gly Gly Leu Ala Lys Met Gly Ala Ala Met Gln Gln Gly Met Val Leu
355 360 365
Val Met Ser Leu Trp Asp Asp Tyr Ala Ala Gln Met Leu Trp Leu Asp
370 375 380
Ser Asp Tyr Pro Thr Asp Ala Asp Pro Thr Thr Pro Gly Ile Ala Arg
385 390 395
Gly Thr Cys Pro Thr Asp Ser Gly Val Pro Ser Asp Val Glu Ser Gln
400 405 410
Ser Pro Asn Ser Tyr Val Thr Tyr Ser Asn Ile Lys Phe Gly Pro Ile
415 420 425 430
Asn Ser Thr Phe Thr Ala Ser
435
<210> 41
<211> 1599
<212> DNA
<213> Talaromyces leycettanus
<220>
<221> 信号肽
<222> (1)..(25)
<220>
<221> CDS
<222> (1)..(1596)
<220>
<221> 成熟肽
<222> (76)..(1596)
<400> 41
atg gcc agc ctc ttc tct ttc aag atg tac aag gcc gct ctg gtc ctc 48
Met Ala Ser Leu Phe Ser Phe Lys Met Tyr Lys Ala Ala Leu Val Leu
-25 -20 -15 -10
tcc tct ctc ctt gcg gcc acc cag gcc cag cag gcc ggc acc ctg acc 96
Ser Ser Leu Leu Ala Ala Thr Gln Ala Gln Gln Ala Gly Thr Leu Thr
-5 -1 1 5
acc gaa acc cat cct tct ctg acc tgg cag caa tgc tct gcc ggc ggc 144
Thr Glu Thr His Pro Ser Leu Thr Trp Gln Gln Cys Ser Ala Gly Gly
10 15 20
agc tgc acc act cag aac ggc aag gtc gtc atc gac gcc aac tgg cgc 192
Ser Cys Thr Thr Gln Asn Gly Lys Val Val Ile Asp Ala Asn Trp Arg
25 30 35
tgg gtt cac agc acc agc ggc tcg aac aac tgc tac act ggc aac act 240
Trp Val His Ser Thr Ser Gly Ser Asn Asn Cys Tyr Thr Gly Asn Thr
40 45 50 55
tgg gat gct act ctc tgc cct gac gac gtg act tgc gct gcc aac tgc 288
Trp Asp Ala Thr Leu Cys Pro Asp Asp Val Thr Cys Ala Ala Asn Cys
60 65 70
gcc ctg gac ggc gct gac tac tcg ggc acc tac ggt gtc acc acc agc 336
Ala Leu Asp Gly Ala Asp Tyr Ser Gly Thr Tyr Gly Val Thr Thr Ser
75 80 85
ggc aac tct ctg cgc ctg aac ttc gtc acc cag gcg tcg cag aag aac 384
Gly Asn Ser Leu Arg Leu Asn Phe Val Thr Gln Ala Ser Gln Lys Asn
90 95 100
gtc ggc tct cgt ctc tat ctg atg gag aat gac aca acc tac cag atc 432
Val Gly Ser Arg Leu Tyr Leu Met Glu Asn Asp Thr Thr Tyr Gln Ile
105 110 115
ttc aag ttg ctg aac cag gag ttc acc ttt gac gtt gat gtc tcc aac 480
Phe Lys Leu Leu Asn Gln Glu Phe Thr Phe Asp Val Asp Val Ser Asn
120 125 130 135
ctt ccc tgc ggt ctc aac ggt gct ctc tac ctg gtt gcc atg gat gcc 528
Leu Pro Cys Gly Leu Asn Gly Ala Leu Tyr Leu Val Ala Met Asp Ala
140 145 150
gac ggc ggc atg gcc aag tac cca acc aac aag gct ggt gcg aag tac 576
Asp Gly Gly Met Ala Lys Tyr Pro Thr Asn Lys Ala Gly Ala Lys Tyr
155 160 165
gga acc ggt tac tgc gac tcc cag tgc cct cgc gac ctg aag ttc atc 624
Gly Thr Gly Tyr Cys Asp Ser Gln Cys Pro Arg Asp Leu Lys Phe Ile
170 175 180
aac ggt gag gcc aat gtt gag gga tgg cag cct tct tcc aat gac ccc 672
Asn Gly Glu Ala Asn Val Glu Gly Trp Gln Pro Ser Ser Asn Asp Pro
185 190 195
aac tct ggc att ggc aac cac ggc tct tgc tgt gct gag atg gac atc 720
Asn Ser Gly Ile Gly Asn His Gly Ser Cys Cys Ala Glu Met Asp Ile
200 205 210 215
tgg gag gcc aac agc atc tcc aat gca gtc act cct cac cct tgc gac 768
Trp Glu Ala Asn Ser Ile Ser Asn Ala Val Thr Pro His Pro Cys Asp
220 225 230
acc ccg gga cag gtc atg tgc acc ggc aac aac tgt ggt ggc act tac 816
Thr Pro Gly Gln Val Met Cys Thr Gly Asn Asn Cys Gly Gly Thr Tyr
235 240 245
agc act act cgc tat gct ggc act tgc gat cct gat ggc tgc gac ttc 864
Ser Thr Thr Arg Tyr Ala Gly Thr Cys Asp Pro Asp Gly Cys Asp Phe
250 255 260
aac ccc tac cgc atg ggc aac cac tcc ttc tac ggc ccc aaa cag atc 912
Asn Pro Tyr Arg Met Gly Asn His Ser Phe Tyr Gly Pro Lys Gln Ile
265 270 275
gtc gac acc agc tcc aag ttc act gtt gtt act cag ttc ctc acc gat 960
Val Asp Thr Ser Ser Lys Phe Thr Val Val Thr Gln Phe Leu Thr Asp
280 285 290 295
gat ggc acc tcc acc ggc acc ctc agc gag atc agg cgc ttc tac gtt 1008
Asp Gly Thr Ser Thr Gly Thr Leu Ser Glu Ile Arg Arg Phe Tyr Val
300 305 310
cag aac ggc cag gtc atc ccc aac tcc gtg tcc acg atc agc ggc gtc 1056
Gln Asn Gly Gln Val Ile Pro Asn Ser Val Ser Thr Ile Ser Gly Val
315 320 325
tcc ggc aac tcc atc acc acc gag ttc tgc acg gcc cag aag cag gct 1104
Ser Gly Asn Ser Ile Thr Thr Glu Phe Cys Thr Ala Gln Lys Gln Ala
330 335 340
ttc ggc gac act gat gac ttc agc aag cac ggc ggt ctg tct ggc atg 1152
Phe Gly Asp Thr Asp Asp Phe Ser Lys His Gly Gly Leu Ser Gly Met
345 350 355
tcc gcc gcc ctc tcc cag ggt atg gtt ctc gtc atg agc ttg tgg gac 1200
Ser Ala Ala Leu Ser Gln Gly Met Val Leu Val Met Ser Leu Trp Asp
360 365 370 375
gac cac gcc gcc aac atg ctc tgg ctt gac agc acc tac ccg acc aac 1248
Asp His Ala Ala Asn Met Leu Trp Leu Asp Ser Thr Tyr Pro Thr Asn
380 385 390
gcc acc tct tcc acc ccc ggt gcc gcc cgt ggt act tgc gac atc tcc 1296
Ala Thr Ser Ser Thr Pro Gly Ala Ala Arg Gly Thr Cys Asp Ile Ser
395 400 405
tcc ggt gtc ccc gcc gat gtt gag tcc aac gac ccc aac gcc tac gtc 1344
Ser Gly Val Pro Ala Asp Val Glu Ser Asn Asp Pro Asn Ala Tyr Val
410 415 420
gtc tac tcc aac atc aag gtc ggc ccg atc ggc tct acc ttc agc agc 1392
Val Tyr Ser Asn Ile Lys Val Gly Pro Ile Gly Ser Thr Phe Ser Ser
425 430 435
tct ggc tct ggc tct agc tcc agc tcc agc acc acc acc acc acc acc 1440
Ser Gly Ser Gly Ser Ser Ser Ser Ser Ser Thr Thr Thr Thr Thr Thr
440 445 450 455
gct tcc cca acc acg acc acc tcc agc gct tcc agc acc ggc act ggc 1488
Ala Ser Pro Thr Thr Thr Thr Ser Ser Ala Ser Ser Thr Gly Thr Gly
460 465 470
gtt gct cag cac tgg ggt cag tgc ggt ggc cag gga tgg acc ggt ccg 1536
Val Ala Gln His Trp Gly Gln Cys Gly Gly Gln Gly Trp Thr Gly Pro
475 480 485
acc acc tgc gtt agc ccc tac acc tgc cag gag ctg aac ccc tac tac 1584
Thr Thr Cys Val Ser Pro Tyr Thr Cys Gln Glu Leu Asn Pro Tyr Tyr
490 495 500
tac cag tgc ctg taa 1599
Tyr Gln Cys Leu
505
<210> 42
<211> 532
<212> PRT
<213> Talaromyces leycettanus
<400> 42
Met Ala Ser Leu Phe Ser Phe Lys Met Tyr Lys Ala Ala Leu Val Leu
-25 -20 -15 -10
Ser Ser Leu Leu Ala Ala Thr Gln Ala Gln Gln Ala Gly Thr Leu Thr
-5 -1 1 5
Thr Glu Thr His Pro Ser Leu Thr Trp Gln Gln Cys Ser Ala Gly Gly
10 15 20
Ser Cys Thr Thr Gln Asn Gly Lys Val Val Ile Asp Ala Asn Trp Arg
25 30 35
Trp Val His Ser Thr Ser Gly Ser Asn Asn Cys Tyr Thr Gly Asn Thr
40 45 50 55
Trp Asp Ala Thr Leu Cys Pro Asp Asp Val Thr Cys Ala Ala Asn Cys
60 65 70
Ala Leu Asp Gly Ala Asp Tyr Ser Gly Thr Tyr Gly Val Thr Thr Ser
75 80 85
Gly Asn Ser Leu Arg Leu Asn Phe Val Thr Gln Ala Ser Gln Lys Asn
90 95 100
Val Gly Ser Arg Leu Tyr Leu Met Glu Asn Asp Thr Thr Tyr Gln Ile
105 110 115
Phe Lys Leu Leu Asn Gln Glu Phe Thr Phe Asp Val Asp Val Ser Asn
120 125 130 135
Leu Pro Cys Gly Leu Asn Gly Ala Leu Tyr Leu Val Ala Met Asp Ala
140 145 150
Asp Gly Gly Met Ala Lys Tyr Pro Thr Asn Lys Ala Gly Ala Lys Tyr
155 160 165
Gly Thr Gly Tyr Cys Asp Ser Gln Cys Pro Arg Asp Leu Lys Phe Ile
170 175 180
Asn Gly Glu Ala Asn Val Glu Gly Trp Gln Pro Ser Ser Asn Asp Pro
185 190 195
Asn Ser Gly Ile Gly Asn His Gly Ser Cys Cys Ala Glu Met Asp Ile
200 205 210 215
Trp Glu Ala Asn Ser Ile Ser Asn Ala Val Thr Pro His Pro Cys Asp
220 225 230
Thr Pro Gly Gln Val Met Cys Thr Gly Asn Asn Cys Gly Gly Thr Tyr
235 240 245
Ser Thr Thr Arg Tyr Ala Gly Thr Cys Asp Pro Asp Gly Cys Asp Phe
250 255 260
Asn Pro Tyr Arg Met Gly Asn His Ser Phe Tyr Gly Pro Lys Gln Ile
265 270 275
Val Asp Thr Ser Ser Lys Phe Thr Val Val Thr Gln Phe Leu Thr Asp
280 285 290 295
Asp Gly Thr Ser Thr Gly Thr Leu Ser Glu Ile Arg Arg Phe Tyr Val
300 305 310
Gln Asn Gly Gln Val Ile Pro Asn Ser Val Ser Thr Ile Ser Gly Val
315 320 325
Ser Gly Asn Ser Ile Thr Thr Glu Phe Cys Thr Ala Gln Lys Gln Ala
330 335 340
Phe Gly Asp Thr Asp Asp Phe Ser Lys His Gly Gly Leu Ser Gly Met
345 350 355
Ser Ala Ala Leu Ser Gln Gly Met Val Leu Val Met Ser Leu Trp Asp
360 365 370 375
Asp His Ala Ala Asn Met Leu Trp Leu Asp Ser Thr Tyr Pro Thr Asn
380 385 390
Ala Thr Ser Ser Thr Pro Gly Ala Ala Arg Gly Thr Cys Asp Ile Ser
395 400 405
Ser Gly Val Pro Ala Asp Val Glu Ser Asn Asp Pro Asn Ala Tyr Val
410 415 420
Val Tyr Ser Asn Ile Lys Val Gly Pro Ile Gly Ser Thr Phe Ser Ser
425 430 435
Ser Gly Ser Gly Ser Ser Ser Ser Ser Ser Thr Thr Thr Thr Thr Thr
440 445 450 455
Ala Ser Pro Thr Thr Thr Thr Ser Ser Ala Ser Ser Thr Gly Thr Gly
460 465 470
Val Ala Gln His Trp Gly Gln Cys Gly Gly Gln Gly Trp Thr Gly Pro
475 480 485
Thr Thr Cys Val Ser Pro Tyr Thr Cys Gln Glu Leu Asn Pro Tyr Tyr
490 495 500
Tyr Gln Cys Leu
505
<210> 43
<211> 1599
<212> DNA
<213> Talaromyces leycettanus
<220>
<221> 信号肽
<222> (1)..(25)
<220>
<221> CDS
<222> (1)..(1596)
<220>
<221> 成熟肽
<222> (76)..(1596)
<400> 43
atg gcg tcc tct ctc tct tac agg atc tac aag aat gct ctc atc ttc 48
Met Ala Ser Ser Leu Ser Tyr Arg Ile Tyr Lys Asn Ala Leu Ile Phe
-25 -20 -15 -10
tct tct ctc ctg gcc gct gcc cag ggt cag cag att ggt acc tac cag 96
Ser Ser Leu Leu Ala Ala Ala Gln Gly Gln Gln Ile Gly Thr Tyr Gln
-5 -1 1 5
acg gag acc cat ccg cct ctg acc tgg cag aca tgc acc agc ggc ggc 144
Thr Glu Thr His Pro Pro Leu Thr Trp Gln Thr Cys Thr Ser Gly Gly
10 15 20
agt tgc acg acc aac caa ggc tcc atc gtc ctc gat gcc aac tgg cgc 192
Ser Cys Thr Thr Asn Gln Gly Ser Ile Val Leu Asp Ala Asn Trp Arg
25 30 35
tgg gtg cac gag gtc ggc agc acc acc aac tgc tac acc ggc aat acc 240
Trp Val His Glu Val Gly Ser Thr Thr Asn Cys Tyr Thr Gly Asn Thr
40 45 50 55
tgg gac acc tcc atc tgc agc acg gat acg acc tgc gct cag caa tgt 288
Trp Asp Thr Ser Ile Cys Ser Thr Asp Thr Thr Cys Ala Gln Gln Cys
60 65 70
gcc gtc gat ggt gcc gac tac gag ggc acc tat ggt atc acg acc agc 336
Ala Val Asp Gly Ala Asp Tyr Glu Gly Thr Tyr Gly Ile Thr Thr Ser
75 80 85
ggc agc cag gtc cgc atc aac ttc gtc acc aac aac tcg aac gga aag 384
Gly Ser Gln Val Arg Ile Asn Phe Val Thr Asn Asn Ser Asn Gly Lys
90 95 100
aac gtc ggc gcg cgt gtc tac atg atg gcg gac aac acc cac tac caa 432
Asn Val Gly Ala Arg Val Tyr Met Met Ala Asp Asn Thr His Tyr Gln
105 110 115
att tac cag ctg ctg aac cag gag ttc acc ttt gat gtc gac gtg tcc 480
Ile Tyr Gln Leu Leu Asn Gln Glu Phe Thr Phe Asp Val Asp Val Ser
120 125 130 135
aac ctg cct tgc ggc ctc aac ggt gcc ctc tac ttt gtg gtc atg gac 528
Asn Leu Pro Cys Gly Leu Asn Gly Ala Leu Tyr Phe Val Val Met Asp
140 145 150
gcc gat ggt ggt gtc tcc aag tat ccc aac aac aag gct ggt gcc cag 576
Ala Asp Gly Gly Val Ser Lys Tyr Pro Asn Asn Lys Ala Gly Ala Gln
155 160 165
tac ggt gtc ggt tac tgc gac tcc cag tgt ccc aga gac ctc aaa ttc 624
Tyr Gly Val Gly Tyr Cys Asp Ser Gln Cys Pro Arg Asp Leu Lys Phe
170 175 180
atc cag gga cag gcc aac gtc gag ggc tgg caa ccg tcg tcc aac aac 672
Ile Gln Gly Gln Ala Asn Val Glu Gly Trp Gln Pro Ser Ser Asn Asn
185 190 195
gcc aat acc ggc ctg ggc aac cac ggc tcc tgc tgt gct gaa ctg gac 720
Ala Asn Thr Gly Leu Gly Asn His Gly Ser Cys Cys Ala Glu Leu Asp
200 205 210 215
gtc tgg gag tcg aac agc atc tcc cag gcc ctc act ccc cac ccc tgc 768
Val Trp Glu Ser Asn Ser Ile Ser Gln Ala Leu Thr Pro His Pro Cys
220 225 230
gac act ccc acc aat acc ctg tgc acc ggt gat agc tgc ggt ggc aca 816
Asp Thr Pro Thr Asn Thr Leu Cys Thr Gly Asp Ser Cys Gly Gly Thr
235 240 245
tac agc agc aac cgt tat gcg ggc act tgc gat cct gac ggc tgc gat 864
Tyr Ser Ser Asn Arg Tyr Ala Gly Thr Cys Asp Pro Asp Gly Cys Asp
250 255 260
ttc aac ccc tac cgc ttg ggc aac acc acc ttc tac ggt cct ggc aag 912
Phe Asn Pro Tyr Arg Leu Gly Asn Thr Thr Phe Tyr Gly Pro Gly Lys
265 270 275
act att gac acc acc aaa ccc ttc acg gtt gtg acg cag ttc atc acg 960
Thr Ile Asp Thr Thr Lys Pro Phe Thr Val Val Thr Gln Phe Ile Thr
280 285 290 295
gat gac ggc act tcc agc ggc acc ctg tcc gaa att agg cgt ttc tat 1008
Asp Asp Gly Thr Ser Ser Gly Thr Leu Ser Glu Ile Arg Arg Phe Tyr
300 305 310
gtc cag aac ggt gtt acg tac gcc cag ccc aac tct gac gtc agc ggt 1056
Val Gln Asn Gly Val Thr Tyr Ala Gln Pro Asn Ser Asp Val Ser Gly
315 320 325
atc agc ggc aat gcc atc aac agt gct tac tgc act gcg gag aac acc 1104
Ile Ser Gly Asn Ala Ile Asn Ser Ala Tyr Cys Thr Ala Glu Asn Thr
330 335 340
gtc ttc aac ggt gcc ggc acc ttc gcg cag cac ggc ggc ctg gct ggc 1152
Val Phe Asn Gly Ala Gly Thr Phe Ala Gln His Gly Gly Leu Ala Gly
345 350 355
atg agc cag gcc atg tcc acc ggt atg gtc ttg gtg atg agc ctg tgg 1200
Met Ser Gln Ala Met Ser Thr Gly Met Val Leu Val Met Ser Leu Trp
360 365 370 375
gat gat tac tat gcc gac atg ctc tgg ctc gac agc acc tac cca acc 1248
Asp Asp Tyr Tyr Ala Asp Met Leu Trp Leu Asp Ser Thr Tyr Pro Thr
380 385 390
aac gac acc gca agc acg ccc ggt gcg gtc cgt gga acc tgc tct acg 1296
Asn Asp Thr Ala Ser Thr Pro Gly Ala Val Arg Gly Thr Cys Ser Thr
395 400 405
tcg tcc ggt gtc ccc agc cag gtc gaa tcc gcc agc ccg aac gcc tac 1344
Ser Ser Gly Val Pro Ser Gln Val Glu Ser Ala Ser Pro Asn Ala Tyr
410 415 420
gtg acc tac tcg aac atc aag gtt ggt ccc att ggc tcg act ttc aac 1392
Val Thr Tyr Ser Asn Ile Lys Val Gly Pro Ile Gly Ser Thr Phe Asn
425 430 435
tct ggc ggc tct ggc tct ggc agc agc tcc agc act acc acg acc act 1440
Ser Gly Gly Ser Gly Ser Gly Ser Ser Ser Ser Thr Thr Thr Thr Thr
440 445 450 455
cac gcc agc acc acg acg acg tcc tcc gcc tcg tct acg gga act ggc 1488
His Ala Ser Thr Thr Thr Thr Ser Ser Ala Ser Ser Thr Gly Thr Gly
460 465 470
gtg gcc caa cac tgg ggc cag tgt ggt gga cag ggc tgg acc ggc cca 1536
Val Ala Gln His Trp Gly Gln Cys Gly Gly Gln Gly Trp Thr Gly Pro
475 480 485
aca acc tgc gtt tcc ccg tac act tgc cag gag ctg aac ccg tac tac 1584
Thr Thr Cys Val Ser Pro Tyr Thr Cys Gln Glu Leu Asn Pro Tyr Tyr
490 495 500
tac cag tgt ctg tag 1599
Tyr Gln Cys Leu
505
<210> 44
<211> 532
<212> PRT
<213> Talaromyces leycettanus
<400> 44
Met Ala Ser Ser Leu Ser Tyr Arg Ile Tyr Lys Asn Ala Leu Ile Phe
-25 -20 -15 -10
Ser Ser Leu Leu Ala Ala Ala Gln Gly Gln Gln Ile Gly Thr Tyr Gln
-5 -1 1 5
Thr Glu Thr His Pro Pro Leu Thr Trp Gln Thr Cys Thr Ser Gly Gly
10 15 20
Ser Cys Thr Thr Asn Gln Gly Ser Ile Val Leu Asp Ala Asn Trp Arg
25 30 35
Trp Val His Glu Val Gly Ser Thr Thr Asn Cys Tyr Thr Gly Asn Thr
40 45 50 55
Trp Asp Thr Ser Ile Cys Ser Thr Asp Thr Thr Cys Ala Gln Gln Cys
60 65 70
Ala Val Asp Gly Ala Asp Tyr Glu Gly Thr Tyr Gly Ile Thr Thr Ser
75 80 85
Gly Ser Gln Val Arg Ile Asn Phe Val Thr Asn Asn Ser Asn Gly Lys
90 95 100
Asn Val Gly Ala Arg Val Tyr Met Met Ala Asp Asn Thr His Tyr Gln
105 110 115
Ile Tyr Gln Leu Leu Asn Gln Glu Phe Thr Phe Asp Val Asp Val Ser
120 125 130 135
Asn Leu Pro Cys Gly Leu Asn Gly Ala Leu Tyr Phe Val Val Met Asp
140 145 150
Ala Asp Gly Gly Val Ser Lys Tyr Pro Asn Asn Lys Ala Gly Ala Gln
155 160 165
Tyr Gly Val Gly Tyr Cys Asp Ser Gln Cys Pro Arg Asp Leu Lys Phe
170 175 180
Ile Gln Gly Gln Ala Asn Val Glu Gly Trp Gln Pro Ser Ser Asn Asn
185 190 195
Ala Asn Thr Gly Leu Gly Asn His Gly Ser Cys Cys Ala Glu Leu Asp
200 205 210 215
Val Trp Glu Ser Asn Ser Ile Ser Gln Ala Leu Thr Pro His Pro Cys
220 225 230
Asp Thr Pro Thr Asn Thr Leu Cys Thr Gly Asp Ser Cys Gly Gly Thr
235 240 245
Tyr Ser Ser Asn Arg Tyr Ala Gly Thr Cys Asp Pro Asp Gly Cys Asp
250 255 260
Phe Asn Pro Tyr Arg Leu Gly Asn Thr Thr Phe Tyr Gly Pro Gly Lys
265 270 275
Thr Ile Asp Thr Thr Lys Pro Phe Thr Val Val Thr Gln Phe Ile Thr
280 285 290 295
Asp Asp Gly Thr Ser Ser Gly Thr Leu Ser Glu Ile Arg Arg Phe Tyr
300 305 310
Val Gln Asn Gly Val Thr Tyr Ala Gln Pro Asn Ser Asp Val Ser Gly
315 320 325
Ile Ser Gly Asn Ala Ile Asn Ser Ala Tyr Cys Thr Ala Glu Asn Thr
330 335 340
Val Phe Asn Gly Ala Gly Thr Phe Ala Gln His Gly Gly Leu Ala Gly
345 350 355
Met Ser Gln Ala Met Ser Thr Gly Met Val Leu Val Met Ser Leu Trp
360 365 370 375
Asp Asp Tyr Tyr Ala Asp Met Leu Trp Leu Asp Ser Thr Tyr Pro Thr
380 385 390
Asn Asp Thr Ala Ser Thr Pro Gly Ala Val Arg Gly Thr Cys Ser Thr
395 400 405
Ser Ser Gly Val Pro Ser Gln Val Glu Ser Ala Ser Pro Asn Ala Tyr
410 415 420
Val Thr Tyr Ser Asn Ile Lys Val Gly Pro Ile Gly Ser Thr Phe Asn
425 430 435
Ser Gly Gly Ser Gly Ser Gly Ser Ser Ser Ser Thr Thr Thr Thr Thr
440 445 450 455
His Ala Ser Thr Thr Thr Thr Ser Ser Ala Ser Ser Thr Gly Thr Gly
460 465 470
Val Ala Gln His Trp Gly Gln Cys Gly Gly Gln Gly Trp Thr Gly Pro
475 480 485
Thr Thr Cys Val Ser Pro Tyr Thr Cys Gln Glu Leu Asn Pro Tyr Tyr
490 495 500
Tyr Gln Cys Leu
505
<210> 45
<211> 1507
<212> DNA
<213> 丝衣霉状篮状菌(Talaromyces byssochlamydoides)
<220>
<221> 外显子
<222> (1)..(603)
<220>
<221> CDS
<222> (1)..(603)
<220>
<221> 信号肽
<222> (1)..(18)
<220>
<221> 成熟肽
<222> (55)..(1504)
<220>
<221> 内含子
<222> (604)..(667)
<220>
<221> 外显子
<222> (668)..(1235)
<220>
<221> CDS
<222> (668)..(1235)
<220>
<221> 内含子
<222> (1236)..(1310)
<220>
<221> 外显子
<222> (1311)..(1504)
<220>
<221> CDS
<222> (1311)..(1504)
<400> 45
atg ttt cga cgg gct ctt ttc ctg tcc tct tcc gcc ttc ctt gct gtc 48
Met Phe Arg Arg Ala Leu Phe Leu Ser Ser Ser Ala Phe Leu Ala Val
-15 -10 -5
aaa gcc cag cag atc ggc acg gtc agt ccg gag aac cat ccg ccc ctg 96
Lys Ala Gln Gln Ile Gly Thr Val Ser Pro Glu Asn His Pro Pro Leu
-1 1 5 10
gca tgg gag cag tgc act gcc cct ggg agt tgc acg act gtg aat ggt 144
Ala Trp Glu Gln Cys Thr Ala Pro Gly Ser Cys Thr Thr Val Asn Gly
15 20 25 30
gcg gtc gtc ctt gat gcg aac tgg cgt tgg gtc cac aat gtt ggg gga 192
Ala Val Val Leu Asp Ala Asn Trp Arg Trp Val His Asn Val Gly Gly
35 40 45
tac acc aac tgc tac act ggc aat acc tgg gac acc acg tac tgc cct 240
Tyr Thr Asn Cys Tyr Thr Gly Asn Thr Trp Asp Thr Thr Tyr Cys Pro
50 55 60
gac gac gtg acc tgc gca gag aat tgt gcg ctg gat ggc gca gat tac 288
Asp Asp Val Thr Cys Ala Glu Asn Cys Ala Leu Asp Gly Ala Asp Tyr
65 70 75
gag ggc acc tac ggc gtg acc acc tcg ggc agc tcc ctg aag ctc gat 336
Glu Gly Thr Tyr Gly Val Thr Thr Ser Gly Ser Ser Leu Lys Leu Asp
80 85 90
ttc gtc acc ggg tct aac gtc gga tct cgt ctc tac ctg ttg gag aat 384
Phe Val Thr Gly Ser Asn Val Gly Ser Arg Leu Tyr Leu Leu Glu Asn
95 100 105 110
gat tcg acc tat cag atc ttc aag ctt ctg aac cag gaa ttc acc ttt 432
Asp Ser Thr Tyr Gln Ile Phe Lys Leu Leu Asn Gln Glu Phe Thr Phe
115 120 125
gac gtc gac gtt tcc aat ctt ccg tgc gga tta aac ggc gct ctg tac 480
Asp Val Asp Val Ser Asn Leu Pro Cys Gly Leu Asn Gly Ala Leu Tyr
130 135 140
ctt gtt acc atg gct gct gac ggc ggg gtg tct cag tac ccg aat aac 528
Leu Val Thr Met Ala Ala Asp Gly Gly Val Ser Gln Tyr Pro Asn Asn
145 150 155
aag gcc ggc gca gcg tat gga acc ggt tat tgc gat tcc cag tgt cca 576
Lys Ala Gly Ala Ala Tyr Gly Thr Gly Tyr Cys Asp Ser Gln Cys Pro
160 165 170
agg gac ttg aag ttt atc gat ggc cag gtatgtagag ctgtaatcac 623
Arg Asp Leu Lys Phe Ile Asp Gly Gln
175 180
ccatgttgtg aaatcactct cctactgaca tggtcgattt atag gcc aac gtt gag 679
Ala Asn Val Glu
185
ggc tgg cag ccg tct tcg aac aac gcc aat aca ggt att ggc aac cat 727
Gly Trp Gln Pro Ser Ser Asn Asn Ala Asn Thr Gly Ile Gly Asn His
190 195 200
ggc tcc tgc tgt gcg gag atg gat atc tgg gaa gcc aac agc atc tcc 775
Gly Ser Cys Cys Ala Glu Met Asp Ile Trp Glu Ala Asn Ser Ile Ser
205 210 215
aat gcg gtg act ccg cac cca tgc gac aca ccc ggc cag aca atg tgc 823
Asn Ala Val Thr Pro His Pro Cys Asp Thr Pro Gly Gln Thr Met Cys
220 225 230 235
gag ggg aac gac tgt ggt ggc acg tat tcc acc aat cgc tat gca ggc 871
Glu Gly Asn Asp Cys Gly Gly Thr Tyr Ser Thr Asn Arg Tyr Ala Gly
240 245 250
acc tgc gat cct gac ggc tgc gac ttc aac ccc tac cgc atg ggc aac 919
Thr Cys Asp Pro Asp Gly Cys Asp Phe Asn Pro Tyr Arg Met Gly Asn
255 260 265
cat tct ttc tac ggc cct ggg gag att gtc gat act acc cag ccc ttc 967
His Ser Phe Tyr Gly Pro Gly Glu Ile Val Asp Thr Thr Gln Pro Phe
270 275 280
act gtc gtg aca cag ttc ctt acc gat gat ggc acg gat act ggc act 1015
Thr Val Val Thr Gln Phe Leu Thr Asp Asp Gly Thr Asp Thr Gly Thr
285 290 295
ctc agc gag atc aaa cgc ttc tac gtc caa aac ggg aaa gtc att cct 1063
Leu Ser Glu Ile Lys Arg Phe Tyr Val Gln Asn Gly Lys Val Ile Pro
300 305 310 315
cag ccg aac tcc gac att gcc ggc gtg act ggc aac tcg atc acc agc 1111
Gln Pro Asn Ser Asp Ile Ala Gly Val Thr Gly Asn Ser Ile Thr Ser
320 325 330
gag ttt tgc gat gcc cag aag acg gct ttc ggc gac att aac aac ttt 1159
Glu Phe Cys Asp Ala Gln Lys Thr Ala Phe Gly Asp Ile Asn Asn Phe
335 340 345
gat aca cac ggc ggt ctg gcc agt atg gga gct gcg ctg cag cag ggt 1207
Asp Thr His Gly Gly Leu Ala Ser Met Gly Ala Ala Leu Gln Gln Gly
350 355 360
atg gtt ctg gtg atg agt ctg tgg gac g gtaggtcctt gggagacacc 1255
Met Val Leu Val Met Ser Leu Trp Asp
365 370
cggacgttct atatcaacca gaactgccag aactgacgaa ttaaaacact tttag at 1312
Asp
tac gcg gca aac atg ctg tgg ttg gac agc att tat cca aca aat gca 1360
Tyr Ala Ala Asn Met Leu Trp Leu Asp Ser Ile Tyr Pro Thr Asn Ala
375 380 385
tct gct agc act cct ggt gct gct cgt gga acc tgt tcg acg agc tcc 1408
Ser Ala Ser Thr Pro Gly Ala Ala Arg Gly Thr Cys Ser Thr Ser Ser
390 395 400 405
ggt gtc cca tcg caa gtc gag tcg cag agc ccc aac gcc tac gtg acg 1456
Gly Val Pro Ser Gln Val Glu Ser Gln Ser Pro Asn Ala Tyr Val Thr
410 415 420
tac tcc aac att aaa gtt gga cca atc aac tcg acc ttc acc act tcg 1504
Tyr Ser Asn Ile Lys Val Gly Pro Ile Asn Ser Thr Phe Thr Thr Ser
425 430 435
taa 1507
<210> 46
<211> 455
<212> PRT
<213> 丝衣霉状篮状菌(Talaromyces byssochlamydoides)
<400> 46
Met Phe Arg Arg Ala Leu Phe Leu Ser Ser Ser Ala Phe Leu Ala Val
-15 -10 -5
Lys Ala Gln Gln Ile Gly Thr Val Ser Pro Glu Asn His Pro Pro Leu
-1 1 5 10
Ala Trp Glu Gln Cys Thr Ala Pro Gly Ser Cys Thr Thr Val Asn Gly
15 20 25 30
Ala Val Val Leu Asp Ala Asn Trp Arg Trp Val His Asn Val Gly Gly
35 40 45
Tyr Thr Asn Cys Tyr Thr Gly Asn Thr Trp Asp Thr Thr Tyr Cys Pro
50 55 60
Asp Asp Val Thr Cys Ala Glu Asn Cys Ala Leu Asp Gly Ala Asp Tyr
65 70 75
Glu Gly Thr Tyr Gly Val Thr Thr Ser Gly Ser Ser Leu Lys Leu Asp
80 85 90
Phe Val Thr Gly Ser Asn Val Gly Ser Arg Leu Tyr Leu Leu Glu Asn
95 100 105 110
Asp Ser Thr Tyr Gln Ile Phe Lys Leu Leu Asn Gln Glu Phe Thr Phe
115 120 125
Asp Val Asp Val Ser Asn Leu Pro Cys Gly Leu Asn Gly Ala Leu Tyr
130 135 140
Leu Val Thr Met Ala Ala Asp Gly Gly Val Ser Gln Tyr Pro Asn Asn
145 150 155
Lys Ala Gly Ala Ala Tyr Gly Thr Gly Tyr Cys Asp Ser Gln Cys Pro
160 165 170
Arg Asp Leu Lys Phe Ile Asp Gly Gln Ala Asn Val Glu Gly Trp Gln
175 180 185 190
Pro Ser Ser Asn Asn Ala Asn Thr Gly Ile Gly Asn His Gly Ser Cys
195 200 205
Cys Ala Glu Met Asp Ile Trp Glu Ala Asn Ser Ile Ser Asn Ala Val
210 215 220
Thr Pro His Pro Cys Asp Thr Pro Gly Gln Thr Met Cys Glu Gly Asn
225 230 235
Asp Cys Gly Gly Thr Tyr Ser Thr Asn Arg Tyr Ala Gly Thr Cys Asp
240 245 250
Pro Asp Gly Cys Asp Phe Asn Pro Tyr Arg Met Gly Asn His Ser Phe
255 260 265 270
Tyr Gly Pro Gly Glu Ile Val Asp Thr Thr Gln Pro Phe Thr Val Val
275 280 285
Thr Gln Phe Leu Thr Asp Asp Gly Thr Asp Thr Gly Thr Leu Ser Glu
290 295 300
Ile Lys Arg Phe Tyr Val Gln Asn Gly Lys Val Ile Pro Gln Pro Asn
305 310 315
Ser Asp Ile Ala Gly Val Thr Gly Asn Ser Ile Thr Ser Glu Phe Cys
320 325 330
Asp Ala Gln Lys Thr Ala Phe Gly Asp Ile Asn Asn Phe Asp Thr His
335 340 345 350
Gly Gly Leu Ala Ser Met Gly Ala Ala Leu Gln Gln Gly Met Val Leu
355 360 365
Val Met Ser Leu Trp Asp Asp Tyr Ala Ala Asn Met Leu Trp Leu Asp
370 375 380
Ser Ile Tyr Pro Thr Asn Ala Ser Ala Ser Thr Pro Gly Ala Ala Arg
385 390 395
Gly Thr Cys Ser Thr Ser Ser Gly Val Pro Ser Gln Val Glu Ser Gln
400 405 410
Ser Pro Asn Ala Tyr Val Thr Tyr Ser Asn Ile Lys Val Gly Pro Ile
415 420 425 430
Asn Ser Thr Phe Thr Thr Ser
435
<210> 47
<211> 1353
<212> DNA
<213> 嗜热毁丝霉(Myceliophthora thermophila)
<220>
<221> 信号肽
<222> (1)..(20)
<220>
<221> CDS
<222> (1)..(1350)
<220>
<221> 成熟肽
<222> (61)..(1350)
<400> 47
atg aag cag tac ctc cag tac ctc gcg gcg acc ctg ccc ctg gtg ggc 48
Met Lys Gln Tyr Leu Gln Tyr Leu Ala Ala Thr Leu Pro Leu Val Gly
-20 -15 -10 -5
ctg gcc acg gcc cag cag gcg ggt aac ctg cag acc gag act cac ccc 96
Leu Ala Thr Ala Gln Gln Ala Gly Asn Leu Gln Thr Glu Thr His Pro
-1 1 5 10
agg ctc act tgg tcc aag tgc acg gcc ccg gga tcc tgc caa cag gtc 144
Arg Leu Thr Trp Ser Lys Cys Thr Ala Pro Gly Ser Cys Gln Gln Val
15 20 25
aac ggc gag gtc gtc atc gac tcc aac tgg cgc tgg gtg cac gac gag 192
Asn Gly Glu Val Val Ile Asp Ser Asn Trp Arg Trp Val His Asp Glu
30 35 40
aac gcg cag aac tgc tac gac ggc aac cag tgg acc aac gct tgc agc 240
Asn Ala Gln Asn Cys Tyr Asp Gly Asn Gln Trp Thr Asn Ala Cys Ser
45 50 55 60
tct gcc acc gac tgc gcc gag aat tgc gcg ctc gag ggt gcc gac tac 288
Ser Ala Thr Asp Cys Ala Glu Asn Cys Ala Leu Glu Gly Ala Asp Tyr
65 70 75
cag ggc acc tat ggc gcc tcg acc agc ggc aat gcc ctg acg ctc acc 336
Gln Gly Thr Tyr Gly Ala Ser Thr Ser Gly Asn Ala Leu Thr Leu Thr
80 85 90
ttc gtc act aag cac gag tac ggc acc aac att ggc tcg cgc ctc tac 384
Phe Val Thr Lys His Glu Tyr Gly Thr Asn Ile Gly Ser Arg Leu Tyr
95 100 105
ctc atg aac ggc gcg aac aag tac cag atg ttc acc ctc aag ggc aac 432
Leu Met Asn Gly Ala Asn Lys Tyr Gln Met Phe Thr Leu Lys Gly Asn
110 115 120
gag ctg gcc ttc gac gtc gac ctc tcg gcc gtc gag tgc ggc ctc aac 480
Glu Leu Ala Phe Asp Val Asp Leu Ser Ala Val Glu Cys Gly Leu Asn
125 130 135 140
agc gcc ctc tac ttc gtg gcc atg gag gag gat ggc ggt gtg tcg agc 528
Ser Ala Leu Tyr Phe Val Ala Met Glu Glu Asp Gly Gly Val Ser Ser
145 150 155
tac ccg acc aac acg gcc ggt gct aag ttc ggc act ggg tac tgc gac 576
Tyr Pro Thr Asn Thr Ala Gly Ala Lys Phe Gly Thr Gly Tyr Cys Asp
160 165 170
gcc caa tgc gca cgc gac ctc aag ttc gtc ggc ggc aag ggc aac atc 624
Ala Gln Cys Ala Arg Asp Leu Lys Phe Val Gly Gly Lys Gly Asn Ile
175 180 185
gag ggc tgg aag ccg tcc acc aac gat gcc aat gcc ggt gtc ggt cct 672
Glu Gly Trp Lys Pro Ser Thr Asn Asp Ala Asn Ala Gly Val Gly Pro
190 195 200
tat ggc ggg tgc tgc gct gag atc gac gtc tgg gag tcg aac aag tat 720
Tyr Gly Gly Cys Cys Ala Glu Ile Asp Val Trp Glu Ser Asn Lys Tyr
205 210 215 220
gct ttc gct ttc acc ccg cac ggt tgc gag aac cct aaa tac cac gtc 768
Ala Phe Ala Phe Thr Pro His Gly Cys Glu Asn Pro Lys Tyr His Val
225 230 235
tgc gag acc acc aac tgc ggt ggc acc tac tcc gag gac cgc ttc gct 816
Cys Glu Thr Thr Asn Cys Gly Gly Thr Tyr Ser Glu Asp Arg Phe Ala
240 245 250
ggt gac tgc gat gcc aac ggc tgc gac tac aac ccc tac cgc atg ggc 864
Gly Asp Cys Asp Ala Asn Gly Cys Asp Tyr Asn Pro Tyr Arg Met Gly
255 260 265
aac cag gac ttc tac ggt ccc ggc ttg acg gtc gat acc agc aag aag 912
Asn Gln Asp Phe Tyr Gly Pro Gly Leu Thr Val Asp Thr Ser Lys Lys
270 275 280
ttc acc gtc gtc agc cag ttc gag gag aac aag ctc acc cag ttc ttc 960
Phe Thr Val Val Ser Gln Phe Glu Glu Asn Lys Leu Thr Gln Phe Phe
285 290 295 300
gtc cag gac ggc aag aag att gag atc ccc ggc ccc aag gtc gag ggc 1008
Val Gln Asp Gly Lys Lys Ile Glu Ile Pro Gly Pro Lys Val Glu Gly
305 310 315
atc gat gcg gac agc gcc gct atc acc cct gag ctg tgc agt gcc ctg 1056
Ile Asp Ala Asp Ser Ala Ala Ile Thr Pro Glu Leu Cys Ser Ala Leu
320 325 330
ttc aag gcc ttc gat gac cgt gac cgc ttc tcg gag gtt ggc ggc ttc 1104
Phe Lys Ala Phe Asp Asp Arg Asp Arg Phe Ser Glu Val Gly Gly Phe
335 340 345
gat gcc atc aac acg gcc ctc agc act ccc atg gtc ctc gtc atg tcc 1152
Asp Ala Ile Asn Thr Ala Leu Ser Thr Pro Met Val Leu Val Met Ser
350 355 360
atc tgg gat gat cac tac gcc aat atg ctc tgg ctc gac tcg agc tac 1200
Ile Trp Asp Asp His Tyr Ala Asn Met Leu Trp Leu Asp Ser Ser Tyr
365 370 375 380
ccc cct gag aag gct ggc cag cct ggc ggt gac cgt ggc ccg tgt cct 1248
Pro Pro Glu Lys Ala Gly Gln Pro Gly Gly Asp Arg Gly Pro Cys Pro
385 390 395
cag gac tct ggc gtc ccg gcc gac gtt gag gct cag tac cct aat gcc 1296
Gln Asp Ser Gly Val Pro Ala Asp Val Glu Ala Gln Tyr Pro Asn Ala
400 405 410
aag gtc atc tgg tcc aac atc cgc ttc ggc ccc atc ggc tcg act gtc 1344
Lys Val Ile Trp Ser Asn Ile Arg Phe Gly Pro Ile Gly Ser Thr Val
415 420 425
aac gtc taa 1353
Asn Val
430
<210> 48
<211> 450
<212> PRT
<213> 嗜热毁丝霉(Myceliophthora thermophila)
<400> 48
Met Lys Gln Tyr Leu Gln Tyr Leu Ala Ala Thr Leu Pro Leu Val Gly
-20 -15 -10 -5
Leu Ala Thr Ala Gln Gln Ala Gly Asn Leu Gln Thr Glu Thr His Pro
-1 1 5 10
Arg Leu Thr Trp Ser Lys Cys Thr Ala Pro Gly Ser Cys Gln Gln Val
15 20 25
Asn Gly Glu Val Val Ile Asp Ser Asn Trp Arg Trp Val His Asp Glu
30 35 40
Asn Ala Gln Asn Cys Tyr Asp Gly Asn Gln Trp Thr Asn Ala Cys Ser
45 50 55 60
Ser Ala Thr Asp Cys Ala Glu Asn Cys Ala Leu Glu Gly Ala Asp Tyr
65 70 75
Gln Gly Thr Tyr Gly Ala Ser Thr Ser Gly Asn Ala Leu Thr Leu Thr
80 85 90
Phe Val Thr Lys His Glu Tyr Gly Thr Asn Ile Gly Ser Arg Leu Tyr
95 100 105
Leu Met Asn Gly Ala Asn Lys Tyr Gln Met Phe Thr Leu Lys Gly Asn
110 115 120
Glu Leu Ala Phe Asp Val Asp Leu Ser Ala Val Glu Cys Gly Leu Asn
125 130 135 140
Ser Ala Leu Tyr Phe Val Ala Met Glu Glu Asp Gly Gly Val Ser Ser
145 150 155
Tyr Pro Thr Asn Thr Ala Gly Ala Lys Phe Gly Thr Gly Tyr Cys Asp
160 165 170
Ala Gln Cys Ala Arg Asp Leu Lys Phe Val Gly Gly Lys Gly Asn Ile
175 180 185
Glu Gly Trp Lys Pro Ser Thr Asn Asp Ala Asn Ala Gly Val Gly Pro
190 195 200
Tyr Gly Gly Cys Cys Ala Glu Ile Asp Val Trp Glu Ser Asn Lys Tyr
205 210 215 220
Ala Phe Ala Phe Thr Pro His Gly Cys Glu Asn Pro Lys Tyr His Val
225 230 235
Cys Glu Thr Thr Asn Cys Gly Gly Thr Tyr Ser Glu Asp Arg Phe Ala
240 245 250
Gly Asp Cys Asp Ala Asn Gly Cys Asp Tyr Asn Pro Tyr Arg Met Gly
255 260 265
Asn Gln Asp Phe Tyr Gly Pro Gly Leu Thr Val Asp Thr Ser Lys Lys
270 275 280
Phe Thr Val Val Ser Gln Phe Glu Glu Asn Lys Leu Thr Gln Phe Phe
285 290 295 300
Val Gln Asp Gly Lys Lys Ile Glu Ile Pro Gly Pro Lys Val Glu Gly
305 310 315
Ile Asp Ala Asp Ser Ala Ala Ile Thr Pro Glu Leu Cys Ser Ala Leu
320 325 330
Phe Lys Ala Phe Asp Asp Arg Asp Arg Phe Ser Glu Val Gly Gly Phe
335 340 345
Asp Ala Ile Asn Thr Ala Leu Ser Thr Pro Met Val Leu Val Met Ser
350 355 360
Ile Trp Asp Asp His Tyr Ala Asn Met Leu Trp Leu Asp Ser Ser Tyr
365 370 375 380
Pro Pro Glu Lys Ala Gly Gln Pro Gly Gly Asp Arg Gly Pro Cys Pro
385 390 395
Gln Asp Ser Gly Val Pro Ala Asp Val Glu Ala Gln Tyr Pro Asn Ala
400 405 410
Lys Val Ile Trp Ser Asn Ile Arg Phe Gly Pro Ile Gly Ser Thr Val
415 420 425
Asn Val
430
<210> 49
<211> 1590
<212> DNA
<213> 嗜热毛壳菌(Chaetomium thermophilum)
<220>
<221> 信号肽
<222> (1)..(18)
<220>
<221> CDS
<222> (1)..(1587)
<220>
<221> 成熟肽
<222> (55)..(1587)
<400> 49
atg atg tac aag aag ttc gcc gct ctc gcc gcc ctc gtg gct ggc gcc 48
Met Met Tyr Lys Lys Phe Ala Ala Leu Ala Ala Leu Val Ala Gly Ala
-15 -10 -5
gcc gcc cag cag gct tgc tcc ctc acc act gag acc cac ccc aga ctc 96
Ala Ala Gln Gln Ala Cys Ser Leu Thr Thr Glu Thr His Pro Arg Leu
-1 1 5 10
act tgg aag cgc tgc acc tct ggc ggc aac tgc tcg acc gtg aac ggc 144
Thr Trp Lys Arg Cys Thr Ser Gly Gly Asn Cys Ser Thr Val Asn Gly
15 20 25 30
gcc gtc acc atc gat gcc aac tgg cgc tgg act cac acc gtt tcc ggc 192
Ala Val Thr Ile Asp Ala Asn Trp Arg Trp Thr His Thr Val Ser Gly
35 40 45
tcg acc aac tgc tac acc ggc aac gag tgg gat acc tcc atc tgc tct 240
Ser Thr Asn Cys Tyr Thr Gly Asn Glu Trp Asp Thr Ser Ile Cys Ser
50 55 60
gat ggc aag agc tgc gcc cag acc tgc tgc gtc gac ggc gct gac tac 288
Asp Gly Lys Ser Cys Ala Gln Thr Cys Cys Val Asp Gly Ala Asp Tyr
65 70 75
tct tcg acc tat ggt atc acc acc agc ggt gac tcc ctg aac ctc aag 336
Ser Ser Thr Tyr Gly Ile Thr Thr Ser Gly Asp Ser Leu Asn Leu Lys
80 85 90
ttc gtc acc aag cac cag tac ggc acc aat gtc ggc tct cgt gtc tac 384
Phe Val Thr Lys His Gln Tyr Gly Thr Asn Val Gly Ser Arg Val Tyr
95 100 105 110
ctg atg gag aac gac acc aag tac cag atg ttc gag ctc ctc ggc aac 432
Leu Met Glu Asn Asp Thr Lys Tyr Gln Met Phe Glu Leu Leu Gly Asn
115 120 125
gag ttc acc ttc gat gtc gat gtc tct aac ctg ggc tgc ggt ctc aac 480
Glu Phe Thr Phe Asp Val Asp Val Ser Asn Leu Gly Cys Gly Leu Asn
130 135 140
ggt gcc ctc tac ttc gtc tcc atg gac gct gat ggt ggt atg agc aag 528
Gly Ala Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Met Ser Lys
145 150 155
tac tct ggc aac aag gct ggc gcc aag tac ggt acc ggc tac tgc gat 576
Tyr Ser Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp
160 165 170
gct cag tgc ccg cgc gac ctt aag ttc atc aac ggc gag gcc aac att 624
Ala Gln Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Glu Ala Asn Ile
175 180 185 190
gag aac tgg acc cct tcg acc aat gat gcc aac gcc ggt ttc ggc cgc 672
Glu Asn Trp Thr Pro Ser Thr Asn Asp Ala Asn Ala Gly Phe Gly Arg
195 200 205
tat ggc agc tgc tgc tct gag atg gat atc tgg gag gcc aac aac atg 720
Tyr Gly Ser Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Asn Met
210 215 220
gct act gcc ttc act cct cac cct tgc acc att atc ggc cag agc cgc 768
Ala Thr Ala Phe Thr Pro His Pro Cys Thr Ile Ile Gly Gln Ser Arg
225 230 235
tgc gag ggc aac agc tgc ggt ggc acc tac agc tct gag cgc tat gct 816
Cys Glu Gly Asn Ser Cys Gly Gly Thr Tyr Ser Ser Glu Arg Tyr Ala
240 245 250
ggt gtt tgc gat cct gat ggc tgc gac ttc aac gcc tac cgc cag ggc 864
Gly Val Cys Asp Pro Asp Gly Cys Asp Phe Asn Ala Tyr Arg Gln Gly
255 260 265 270
gac aag acc ttc tac ggc aag ggc atg acc gtc gac acc acc aag aag 912
Asp Lys Thr Phe Tyr Gly Lys Gly Met Thr Val Asp Thr Thr Lys Lys
275 280 285
atg acc gtc gtc acc cag ttc cac aag aac tcg gct ggc gtc ctc agc 960
Met Thr Val Val Thr Gln Phe His Lys Asn Ser Ala Gly Val Leu Ser
290 295 300
gag atc aag cgc ttc tac gtt cag gac ggc aag atc att gcc aac gcc 1008
Glu Ile Lys Arg Phe Tyr Val Gln Asp Gly Lys Ile Ile Ala Asn Ala
305 310 315
gag tcc aag atc ccc ggc aac ccc ggc aac tcc atc acc cag gag tgg 1056
Glu Ser Lys Ile Pro Gly Asn Pro Gly Asn Ser Ile Thr Gln Glu Trp
320 325 330
tgc gat gcc cag aag gtc gcc ttc ggt gac atc gat gac ttc aac cgc 1104
Cys Asp Ala Gln Lys Val Ala Phe Gly Asp Ile Asp Asp Phe Asn Arg
335 340 345 350
aag ggc ggt atg gct cag atg agc aag gcc ctc gag ggc cct atg gtc 1152
Lys Gly Gly Met Ala Gln Met Ser Lys Ala Leu Glu Gly Pro Met Val
355 360 365
ctg gtc atg tcc gtc tgg gat gac cac tac gcc aac atg ctc tgg ctc 1200
Leu Val Met Ser Val Trp Asp Asp His Tyr Ala Asn Met Leu Trp Leu
370 375 380
gac tcg acc tac ccc atc gac aag gcc ggc acc ccc ggc gcc gag cgc 1248
Asp Ser Thr Tyr Pro Ile Asp Lys Ala Gly Thr Pro Gly Ala Glu Arg
385 390 395
ggt gct tgc ccg acc acc tcc ggt gtc cct gcc gag att gag gcc cag 1296
Gly Ala Cys Pro Thr Thr Ser Gly Val Pro Ala Glu Ile Glu Ala Gln
400 405 410
gtc ccc aac agc aac gtc atc ttc tcc aac atc cgc ttc ggc ccc atc 1344
Val Pro Asn Ser Asn Val Ile Phe Ser Asn Ile Arg Phe Gly Pro Ile
415 420 425 430
ggc tcg acc gtc cct ggc ctc gac ggc agc act ccc agc aac ccg acc 1392
Gly Ser Thr Val Pro Gly Leu Asp Gly Ser Thr Pro Ser Asn Pro Thr
435 440 445
gcc acc gtt gct cct ccc act tct acc acc agc gtg aga agc agc act 1440
Ala Thr Val Ala Pro Pro Thr Ser Thr Thr Ser Val Arg Ser Ser Thr
450 455 460
act cag att tcc acc ccg act agc cag ccc ggc ggc tgc acc acc cag 1488
Thr Gln Ile Ser Thr Pro Thr Ser Gln Pro Gly Gly Cys Thr Thr Gln
465 470 475
aag tgg ggc cag tgc ggt ggt atc ggc tac acc ggc tgc act aac tgc 1536
Lys Trp Gly Gln Cys Gly Gly Ile Gly Tyr Thr Gly Cys Thr Asn Cys
480 485 490
gtt gct ggc act acc tgc act gag ctc aac ccc tgg tac agc cag tgc 1584
Val Ala Gly Thr Thr Cys Thr Glu Leu Asn Pro Trp Tyr Ser Gln Cys
495 500 505 510
ctg taa 1590
Leu
<210> 50
<211> 529
<212> PRT
<213> 嗜热毛壳菌(Chaetomium thermophilum)
<400> 50
Met Met Tyr Lys Lys Phe Ala Ala Leu Ala Ala Leu Val Ala Gly Ala
-15 -10 -5
Ala Ala Gln Gln Ala Cys Ser Leu Thr Thr Glu Thr His Pro Arg Leu
-1 1 5 10
Thr Trp Lys Arg Cys Thr Ser Gly Gly Asn Cys Ser Thr Val Asn Gly
15 20 25 30
Ala Val Thr Ile Asp Ala Asn Trp Arg Trp Thr His Thr Val Ser Gly
35 40 45
Ser Thr Asn Cys Tyr Thr Gly Asn Glu Trp Asp Thr Ser Ile Cys Ser
50 55 60
Asp Gly Lys Ser Cys Ala Gln Thr Cys Cys Val Asp Gly Ala Asp Tyr
65 70 75
Ser Ser Thr Tyr Gly Ile Thr Thr Ser Gly Asp Ser Leu Asn Leu Lys
80 85 90
Phe Val Thr Lys His Gln Tyr Gly Thr Asn Val Gly Ser Arg Val Tyr
95 100 105 110
Leu Met Glu Asn Asp Thr Lys Tyr Gln Met Phe Glu Leu Leu Gly Asn
115 120 125
Glu Phe Thr Phe Asp Val Asp Val Ser Asn Leu Gly Cys Gly Leu Asn
130 135 140
Gly Ala Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Met Ser Lys
145 150 155
Tyr Ser Gly Asn Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp
160 165 170
Ala Gln Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Glu Ala Asn Ile
175 180 185 190
Glu Asn Trp Thr Pro Ser Thr Asn Asp Ala Asn Ala Gly Phe Gly Arg
195 200 205
Tyr Gly Ser Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Asn Met
210 215 220
Ala Thr Ala Phe Thr Pro His Pro Cys Thr Ile Ile Gly Gln Ser Arg
225 230 235
Cys Glu Gly Asn Ser Cys Gly Gly Thr Tyr Ser Ser Glu Arg Tyr Ala
240 245 250
Gly Val Cys Asp Pro Asp Gly Cys Asp Phe Asn Ala Tyr Arg Gln Gly
255 260 265 270
Asp Lys Thr Phe Tyr Gly Lys Gly Met Thr Val Asp Thr Thr Lys Lys
275 280 285
Met Thr Val Val Thr Gln Phe His Lys Asn Ser Ala Gly Val Leu Ser
290 295 300
Glu Ile Lys Arg Phe Tyr Val Gln Asp Gly Lys Ile Ile Ala Asn Ala
305 310 315
Glu Ser Lys Ile Pro Gly Asn Pro Gly Asn Ser Ile Thr Gln Glu Trp
320 325 330
Cys Asp Ala Gln Lys Val Ala Phe Gly Asp Ile Asp Asp Phe Asn Arg
335 340 345 350
Lys Gly Gly Met Ala Gln Met Ser Lys Ala Leu Glu Gly Pro Met Val
355 360 365
Leu Val Met Ser Val Trp Asp Asp His Tyr Ala Asn Met Leu Trp Leu
370 375 380
Asp Ser Thr Tyr Pro Ile Asp Lys Ala Gly Thr Pro Gly Ala Glu Arg
385 390 395
Gly Ala Cys Pro Thr Thr Ser Gly Val Pro Ala Glu Ile Glu Ala Gln
400 405 410
Val Pro Asn Ser Asn Val Ile Phe Ser Asn Ile Arg Phe Gly Pro Ile
415 420 425 430
Gly Ser Thr Val Pro Gly Leu Asp Gly Ser Thr Pro Ser Asn Pro Thr
435 440 445
Ala Thr Val Ala Pro Pro Thr Ser Thr Thr Ser Val Arg Ser Ser Thr
450 455 460
Thr Gln Ile Ser Thr Pro Thr Ser Gln Pro Gly Gly Cys Thr Thr Gln
465 470 475
Lys Trp Gly Gln Cys Gly Gly Ile Gly Tyr Thr Gly Cys Thr Asn Cys
480 485 490
Val Ala Gly Thr Thr Cys Thr Glu Leu Asn Pro Trp Tyr Ser Gln Cys
495 500 505 510
Leu
<210> 51
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 51
cccttgtcga tgcgatgtat c 21
<210> 52
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 52
atcctcaatt ccgtcggtcg a 21
<210> 53
<211> 1570
<212> DNA
<213> Rasamsonia emersonii
<400> 53
gaatcgatgc tcaattcggg atggagatgt cgatcagatg gagtataaaa gggcagggtg 60
aatccagggt ccaggccatc tgccatcact cagactcaaa cactccatca gcagcttcga 120
aagcggtctt tttgctatca tcatgcttcg acgggctctt cttctatcct cttccgccat 180
ccttgctgtc aaggcacagc aggccggcac ggcgacggca gagaaccacc cgcccctgac 240
atggcaggaa tgcaccgccc ctgggagctg caccacccag aacggggcgg tcgttcttga 300
tgcgaactgg cgttgggtgc acgatgtgaa cggatacacc aactgctaca cgggcaatac 360
ctggaacccc acgtactgcc ctgacgacga aacctgcgcc cagaactgtg cgctggacgg 420
cgcggattac gagggcacct acggcgtgac ttcgtcgggc agctccttga agctcaattt 480
cgtcaccggg tcgaacgtcg gatcccgtct ctacctgctg caggacgact cgacctatca 540
gatcttcaag cttctgaacc gcgagtttac ctttgacgtc gatgtctcca atcttccgtg 600
cggattgaac ggcgctctgt actttgtcgc catggacgcc gacggcggcg tgtccaagta 660
cccgaacaac aaggctggtg ccaagtacgg aaccgggtat tgcgactccc aatgcccacg 720
ggacctcaag ttcatcgacg gcgaggtatg tccagtggta aaatcgatcg tctcgtgaac 780
ttctgctgac aggttcgatc tacaggccaa cgtcgagggc tggcagccgt cttcgaacaa 840
cgccaacacc ggaattggcg accatggctc ctgctgtgcg gagatggatg tctgggaagc 900
caacagcatc tccaatgcgg tcactccgca cccgtgcgac acgccaggcc agacgatgtg 960
ctctggcgat gactgcggtg gcacatactc taacgatcgc tacgcgggaa cctgcgatcc 1020
tgacggctgt gacttcaacc cttaccgcat gggcaacact tctttctacg ggcctggcaa 1080
gatcatcgat accaccaagc ctttcactgt cgtgacgcag ttcctcactg atgatggtac 1140
ggatactgga actctcagcg agatcaagcg cttctacgtc cagaacggca acgtcattcc 1200
gcagcccaac tcggacatca gtggcgtgac cggcaactcg atcacgacgg agttctgtac 1260
tgctcagaag caggcctttg gcgacacgga cgacttctct cagcacggtg gcctggccaa 1320
gatgggagcg gccatgcagc agggtatggt cctggtgatg agtttgtggg acgactacgc 1380
cgcgcagatg ctgtggctgg attccgacta cccgacggat gcggacccca cgacccctgg 1440
tattgcccgt ggaacgtgtc cgacggactc gggcgtccca tcggatgtcg agtcgcagag 1500
ccccaactcc tacgtgacct actcgaacat caagtttggt ccgatcaact cgaccttcac 1560
cgcttcgtga 1570
<210> 54
<211> 1368
<212> DNA
<213> Rasamsonia emersonii
<400> 54
atgttgcgaa gggccttgtt gctctcgtcc tccgcaatct tggcggtcaa ggcacagcag 60
gcaggcaccg caaccgcaga gaaccatcct ccgctcactt ggcaggaatg tacagcacct 120
ggctcctgta caacccagaa cggagcggtc gtgctcgatg cgaactggcg ctgggtgcac 180
gatgtcaacg gatacacaaa ctgttataca ggtaacacgt ggaaccctac gtattgtccc 240
gacgacgaaa cgtgtgccca gaactgtgcg ttggatggag cagactacga gggaacgtat 300
ggcgtgacct cgtccggctc ctccttgaag ctcaacttcg tcacgggctc gaacgtcggc 360
tcccgcttgt acctcctcca ggacgactcg acctaccaga tcttcaagct cctcaacagg 420
gagttcacct tcgacgtcga tgtctccaac ttgccctgtg gtctcaacgg agccttgtac 480
ttcgtcgcga tggatgcaga cggaggtgtc tcgaagtacc ccaacaacaa ggcaggtgcc 540
aagtatggta ctggctactg tgattcgcag tgtcctcgcg atctcaagtt cattgacggt 600
gaggcgaacg tggaaggatg gcagccctcg tccaacaacg cgaacactgg catcggtgat 660
cacggttcgt gttgtgccga gatggacgtc tgggaagcca actccatctc gaacgcggtc 720
acaccgcacc cgtgtgatac tcctggccag actatgtgtt ccggagatga ttgtggaggc 780
acctattcga acgaccggta tgcaggcacg tgtgacccgg atggctgtga cttcaacccg 840
taccgcatgg gcaacacctc cttctatgga ccgggtaaga tcatcgatac aactaagccc 900
ttcaccgtcg tcacgcagtt cctcacagat gacggcacgg acacaggtac tttgtcggag 960
atcaaacgct tctacgtcca gaacggaaac gtcatccccc agccgaactc cgacatttcg 1020
ggagtcacag gcaactcgat tacgaccgag ttctgtacag cccagaaaca ggcattcggt 1080
gacacggatg atttctccca gcacggagga ttggcgaaaa tgggagccgc aatgcagcag 1140
ggaatggtcc tcgtgatgtc gctctgggac gactatgcag cccagatgtt gtggctcgac 1200
tcggactacc ccacagacgc cgatcccacg acacccggta tcgcacgagg cacttgtccg 1260
acagattccg gagtcccgtc ggacgtcgag tcccagtccc ccaactcgta cgtcacctat 1320
tcgaacatca aattcggtcc catcaactcg acattcacag cctcgtaa 1368
<210> 55
<211> 1560
<212> DNA
<213> Rasamsonia emersonii
<400> 55
atgttgcgaa gggccttgtt gctctcgtcc tccgcaatct tggcggtcaa ggcacagcag 60
gcaggcaccg caaccgcaga gaaccatcct ccgctcactt ggcaggaatg tacagcacct 120
ggctcctgta caacccagaa cggagcggtc gtgctcgatg cgaactggcg ctgggtgcac 180
gatgtcaacg gatacacaaa ctgttataca ggtaacacgt ggaaccctac gtattgtccc 240
gacgacgaaa cgtgtgccca gaactgtgcg ttggatggag cagactacga gggaacgtat 300
ggcgtgacct cgtccggctc ctccttgaag ctcaacttcg tcacgggctc gaacgtcggc 360
tcccgcttgt acctcctcca ggacgactcg acctaccaga tcttcaagct cctcaacagg 420
gagttcacct tcgacgtcga tgtctccaac ttgccctgtg gtctcaacgg agccttgtac 480
ttcgtcgcga tggatgcaga cggaggtgtc tcgaagtacc ccaacaacaa ggcaggtgcc 540
aagtatggta ctggctactg tgattcgcag tgtcctcgcg atctcaagtt cattgacggt 600
gaggcgaacg tggaaggatg gcagccctcg tccaacaacg cgaacactgg catcggtgat 660
cacggttcgt gttgtgccga gatggacgtc tgggaagcca actccatctc gaacgcggtc 720
acaccgcacc cgtgtgatac tcctggccag actatgtgtt ccggagatga ttgtggaggc 780
acctattcga acgaccggta tgcaggcacg tgtgacccgg atggctgtga cttcaacccg 840
taccgcatgg gcaacacctc cttctatgga ccgggtaaga tcatcgatac aactaagccc 900
ttcaccgtcg tcacgcagtt cctcacagat gacggcacgg acacaggtac tttgtcggag 960
atcaaacgct tctacgtcca gaacggaaac gtcatccccc agccgaactc cgacatttcg 1020
ggagtcacag gcaactcgat tacgaccgag ttctgtacag cccagaaaca ggcattcggt 1080
gacacggatg atttctccca gcacggagga ttggcgaaaa tgggagccgc aatgcagcag 1140
ggaatggtcc tcgtgatgtc gctctgggac gactatgcag cccagatgtt gtggctcgac 1200
tcggactacc ccacagacgc cgatcccacg acacccggta tcgcacgagg cacttgtccg 1260
acagattccg gagtcccgtc ggacgtcgag tcccagtccc ccaactcgta cgtcacctat 1320
tcgaacatca aattcggtcc catcaactcg acattcacag cctcgggtgg aaaccctcct 1380
ggcggaaacc ctcctggcac aactacaaca cgacggcctg cgactacaac gggttcgtcc 1440
cctggaccga cccagtccca ctacggacag tgtggaggca tcggttattc cggtccgacc 1500
gtctgtgcgt ccggcacaac ctgtcaggtc ttgaaccctt actattcgca gtgtctctaa 1560
<210> 56
<211> 519
<212> PRT
<213> Rasamsonia emersonii
<400> 56
Met Leu Arg Arg Ala Leu Leu Leu Ser Ser Ser Ala Ile Leu Ala Val
1 5 10 15
Lys Ala Gln Gln Ala Gly Thr Ala Thr Ala Glu Asn His Pro Pro Leu
20 25 30
Thr Trp Gln Glu Cys Thr Ala Pro Gly Ser Cys Thr Thr Gln Asn Gly
35 40 45
Ala Val Val Leu Asp Ala Asn Trp Arg Trp Val His Asp Val Asn Gly
50 55 60
Tyr Thr Asn Cys Tyr Thr Gly Asn Thr Trp Asn Pro Thr Tyr Cys Pro
65 70 75 80
Asp Asp Glu Thr Cys Ala Gln Asn Cys Ala Leu Asp Gly Ala Asp Tyr
85 90 95
Glu Gly Thr Tyr Gly Val Thr Ser Ser Gly Ser Ser Leu Lys Leu Asn
100 105 110
Phe Val Thr Gly Ser Asn Val Gly Ser Arg Leu Tyr Leu Leu Gln Asp
115 120 125
Asp Ser Thr Tyr Gln Ile Phe Lys Leu Leu Asn Arg Glu Phe Thr Phe
130 135 140
Asp Val Asp Val Ser Asn Leu Pro Cys Gly Leu Asn Gly Ala Leu Tyr
145 150 155 160
Phe Val Ala Met Asp Ala Asp Gly Gly Val Ser Lys Tyr Pro Asn Asn
165 170 175
Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln Cys Pro
180 185 190
Arg Asp Leu Lys Phe Ile Asp Gly Glu Ala Asn Val Glu Gly Trp Gln
195 200 205
Pro Ser Ser Asn Asn Ala Asn Thr Gly Ile Gly Asp His Gly Ser Cys
210 215 220
Cys Ala Glu Met Asp Val Trp Glu Ala Asn Ser Ile Ser Asn Ala Val
225 230 235 240
Thr Pro His Pro Cys Asp Thr Pro Gly Gln Thr Met Cys Ser Gly Asp
245 250 255
Asp Cys Gly Gly Thr Tyr Ser Asn Asp Arg Tyr Ala Gly Thr Cys Asp
260 265 270
Pro Asp Gly Cys Asp Phe Asn Pro Tyr Arg Met Gly Asn Thr Ser Phe
275 280 285
Tyr Gly Pro Gly Lys Ile Ile Asp Thr Thr Lys Pro Phe Thr Val Val
290 295 300
Thr Gln Phe Leu Thr Asp Asp Gly Thr Asp Thr Gly Thr Leu Ser Glu
305 310 315 320
Ile Lys Arg Phe Tyr Val Gln Asn Gly Asn Val Ile Pro Gln Pro Asn
325 330 335
Ser Asp Ile Ser Gly Val Thr Gly Asn Ser Ile Thr Thr Glu Phe Cys
340 345 350
Thr Ala Gln Lys Gln Ala Phe Gly Asp Thr Asp Asp Phe Ser Gln His
355 360 365
Gly Gly Leu Ala Lys Met Gly Ala Ala Met Gln Gln Gly Met Val Leu
370 375 380
Val Met Ser Leu Trp Asp Asp Tyr Ala Ala Gln Met Leu Trp Leu Asp
385 390 395 400
Ser Asp Tyr Pro Thr Asp Ala Asp Pro Thr Thr Pro Gly Ile Ala Arg
405 410 415
Gly Thr Cys Pro Thr Asp Ser Gly Val Pro Ser Asp Val Glu Ser Gln
420 425 430
Ser Pro Asn Ser Tyr Val Thr Tyr Ser Asn Ile Lys Phe Gly Pro Ile
435 440 445
Asn Ser Thr Phe Thr Ala Ser Gly Gly Asn Pro Pro Gly Gly Asn Pro
450 455 460
Pro Gly Thr Thr Thr Thr Arg Arg Pro Ala Thr Thr Thr Gly Ser Ser
465 470 475 480
Pro Gly Pro Thr Gln Ser His Tyr Gly Gln Cys Gly Gly Ile Gly Tyr
485 490 495
Ser Gly Pro Thr Val Cys Ala Ser Gly Thr Thr Cys Gln Val Leu Asn
500 505 510
Pro Tyr Tyr Ser Gln Cys Leu
515
<210> 57
<211> 58
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 57
ggtcccatca actcgacatt cacagcctcg ggtggaaacc ctcctggcgg aaaccctc 58
<210> 58
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 58
atcctcaatt ccgtcggtcg a 21
<210> 59
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 59
ccacacttct cttccttcct caatcctc 28
<210> 60
<211> 1560
<212> DNA
<213> Rasamsonia emersonii
<400> 60
atgttgcgaa gggccttgtt gctctcgtcc tccgcaatct tggcggtcaa ggcacagcag 60
gcaggcaccg caaccgcaga gaaccatcct ccgctcactt ggcaggaatg tacagcacct 120
ggctcctgta caacccagaa cggagcggtc gtgctcgatg cgaactggcg ctgggtgcac 180
gatgtcaacg gatacacaaa ctgttataca ggtaacacgt ggaaccctac gtattgtccc 240
gacgacgaaa cgtgtgccca gaactgtgcg ttggatggag cagactacga gggaacgtat 300
ggcgtgacct cgtccggctc ctccttgaag ctcaacttcg tcacgggctc gaacgtcggc 360
tcccgcttgt acctcctcca ggacgactcg acctaccaga tcttcaagct cctcaacagg 420
gagttcacct tcgacgtcga tgtctccaac ttgccctgtg gtctcaacgg agccttgtac 480
ttcgtcgcga tggatgcaga cggaggtgtc tcgaagtacc ccaacaacaa ggcaggtgcc 540
aagtatggta ctggctactg tgattcgcag tgtcctcgcg atctcaagtt cattgacggt 600
gaggcgaacg tggaaggatg gcagccctcg tccaacaacg cgaacactgg catcggtgat 660
cacggttcgt gttgtgccga gatggacgtc tgggaagcca actccatctc gaacgcggtc 720
acaccgcacc cgtgtgatac tcctggccag actatgtgtt ccggagatga ttgtggaggc 780
acctattcga acgaccggta tgcaggcacg tgtgacccgg atggctgtga cttcaacccg 840
taccgcatgg gcaacacctc cttctatgga ccgggtaaga tcatcgatac aactaagccc 900
ttcaccgtcg tcacgcagtt cctcacagat gacggcacgg acacaggtac tttgtcggag 960
atcaaacgct tctacgtcca gaacggaaac gtcatccccc agccgaactc cgacatttcg 1020
ggagtcacag gcaactcgat tacgaccgag ttctgtacag cccagaaaca ggcattcggt 1080
gacacggatg atttctccca gcacggagga ttggcgaaaa tgggagccgc aatgcagcag 1140
ggaatggtcc tcgtgatgtc gctctgggac gactatgcag cccagatgtt gtggctcgac 1200
tcggactacc ccacagacgc cgatcccacg acacccggta tcgcacgagg cacttgtccg 1260
acagattccg gagtcccgtc ggacgtcgag tcccagtccc ccaactcgta cgtcacctat 1320
tcgaacatca aattcggtcc catcaactcg acattcacag cctcgggtgg aaaccctcct 1380
ggcggaaacc ctcctggcac aactacaaca cgacggcctg cgactacaac gggttcgtcc 1440
cctggaccga cccagtccca ctacggacag tgtggaggca tcggttattc cggtccgacc 1500
gtctgtgcgt ccggcacaac ctgtcaggtc ttgaaccctt actggtcgca gtgtctctaa 1560
<210> 61
<211> 519
<212> PRT
<213> Rasamsonia emersonii
<400> 61
Met Leu Arg Arg Ala Leu Leu Leu Ser Ser Ser Ala Ile Leu Ala Val
1 5 10 15
Lys Ala Gln Gln Ala Gly Thr Ala Thr Ala Glu Asn His Pro Pro Leu
20 25 30
Thr Trp Gln Glu Cys Thr Ala Pro Gly Ser Cys Thr Thr Gln Asn Gly
35 40 45
Ala Val Val Leu Asp Ala Asn Trp Arg Trp Val His Asp Val Asn Gly
50 55 60
Tyr Thr Asn Cys Tyr Thr Gly Asn Thr Trp Asn Pro Thr Tyr Cys Pro
65 70 75 80
Asp Asp Glu Thr Cys Ala Gln Asn Cys Ala Leu Asp Gly Ala Asp Tyr
85 90 95
Glu Gly Thr Tyr Gly Val Thr Ser Ser Gly Ser Ser Leu Lys Leu Asn
100 105 110
Phe Val Thr Gly Ser Asn Val Gly Ser Arg Leu Tyr Leu Leu Gln Asp
115 120 125
Asp Ser Thr Tyr Gln Ile Phe Lys Leu Leu Asn Arg Glu Phe Thr Phe
130 135 140
Asp Val Asp Val Ser Asn Leu Pro Cys Gly Leu Asn Gly Ala Leu Tyr
145 150 155 160
Phe Val Ala Met Asp Ala Asp Gly Gly Val Ser Lys Tyr Pro Asn Asn
165 170 175
Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln Cys Pro
180 185 190
Arg Asp Leu Lys Phe Ile Asp Gly Glu Ala Asn Val Glu Gly Trp Gln
195 200 205
Pro Ser Ser Asn Asn Ala Asn Thr Gly Ile Gly Asp His Gly Ser Cys
210 215 220
Cys Ala Glu Met Asp Val Trp Glu Ala Asn Ser Ile Ser Asn Ala Val
225 230 235 240
Thr Pro His Pro Cys Asp Thr Pro Gly Gln Thr Met Cys Ser Gly Asp
245 250 255
Asp Cys Gly Gly Thr Tyr Ser Asn Asp Arg Tyr Ala Gly Thr Cys Asp
260 265 270
Pro Asp Gly Cys Asp Phe Asn Pro Tyr Arg Met Gly Asn Thr Ser Phe
275 280 285
Tyr Gly Pro Gly Lys Ile Ile Asp Thr Thr Lys Pro Phe Thr Val Val
290 295 300
Thr Gln Phe Leu Thr Asp Asp Gly Thr Asp Thr Gly Thr Leu Ser Glu
305 310 315 320
Ile Lys Arg Phe Tyr Val Gln Asn Gly Asn Val Ile Pro Gln Pro Asn
325 330 335
Ser Asp Ile Ser Gly Val Thr Gly Asn Ser Ile Thr Thr Glu Phe Cys
340 345 350
Thr Ala Gln Lys Gln Ala Phe Gly Asp Thr Asp Asp Phe Ser Gln His
355 360 365
Gly Gly Leu Ala Lys Met Gly Ala Ala Met Gln Gln Gly Met Val Leu
370 375 380
Val Met Ser Leu Trp Asp Asp Tyr Ala Ala Gln Met Leu Trp Leu Asp
385 390 395 400
Ser Asp Tyr Pro Thr Asp Ala Asp Pro Thr Thr Pro Gly Ile Ala Arg
405 410 415
Gly Thr Cys Pro Thr Asp Ser Gly Val Pro Ser Asp Val Glu Ser Gln
420 425 430
Ser Pro Asn Ser Tyr Val Thr Tyr Ser Asn Ile Lys Phe Gly Pro Ile
435 440 445
Asn Ser Thr Phe Thr Ala Ser Gly Gly Asn Pro Pro Gly Gly Asn Pro
450 455 460
Pro Gly Thr Thr Thr Thr Arg Arg Pro Ala Thr Thr Thr Gly Ser Ser
465 470 475 480
Pro Gly Pro Thr Gln Ser His Tyr Gly Gln Cys Gly Gly Ile Gly Tyr
485 490 495
Ser Gly Pro Thr Val Cys Ala Ser Gly Thr Thr Cys Gln Val Leu Asn
500 505 510
Pro Tyr Trp Ser Gln Cys Leu
515
<210> 62
<211> 1560
<212> DNA
<213> Rasamsonia emersonii
<400> 62
atgttgcgaa gggccttgtt gctctcgtcc tccgcaatct tggcggtcaa ggcacagcag 60
gcaggcaccg caaccgcaga gaaccatcct ccgctcactt ggcaggaatg tacagcacct 120
ggctcctgta caacccagaa cggagcggtc gtgctcgatg cgaactggcg ctgggtgcac 180
gatgtcaacg gatacacaaa ctgttataca ggtaacacgt ggaaccctac gtattgtccc 240
gacgacgaaa cgtgtgccca gaactgtgcg ttggatggag cagactacga gggaacgtat 300
ggcgtgacct cgtccggctc ctccttgaag ctcaacttcg tcacgggctc gaacgtcggc 360
tcccgcttgt acctcctcca ggacgactcg acctaccaga tcttcaagct cctcaacagg 420
gagttcacct tcgacgtcga tgtctccaac ttgccctgtg gtctcaacgg agccttgtac 480
ttcgtcgcga tggatgcaga cggaggtgtc tcgaagtacc ccaacaacaa ggcaggtgcc 540
aagtatggta ctggctactg tgattcgcag tgtcctcgcg atctcaagtt cattgacggt 600
gaggcgaacg tggaaggatg gcagccctcg tccaacaacg cgaacactgg catcggtgat 660
cacggttcgt gttgtgccga gatggacgtc tgggaagcca actccatctc gaacgcggtc 720
acaccgcacc cgtgtgatac tcctggccag actatgtgtt ccggagatga ttgtggaggc 780
acctattcga acgaccggta tgcaggcacg tgtgacccgg atggctgtga cttcaacccg 840
taccgcatgg gcaacacctc cttctatgga ccgggtaaga tcatcgatac aactaagccc 900
ttcaccgtcg tcacgcagtt cctcacagat gacggcacgg acacaggtac tttgtcggag 960
atcaaacgct tctacgtcca gaacggaaac gtcatccccc agccgaactc cgacatttcg 1020
ggagtcacag gcaactcgat tacgaccgag ttctgtacag cccagaaaca ggcattcggt 1080
gacacggatg atttctccca gcacggagga ttggcgaaaa tgggagccgc aatgcagcag 1140
ggaatggtcc tcgtgatgtc gctctgggac gactatgcag cccagatgtt gtggctcgac 1200
tcggactacc ccacagacgc cgatcccacg acacccggta tcgcacgagg cacttgtccg 1260
acagattccg gagtcccgtc ggacgtcgag tcccagtccc ccaactcgta cgtcacctat 1320
tcgaacatca aattcggtcc catcaactcg acattcacag cctcgggtgg aaaccctcct 1380
ggcggaaacc ctcctggcac aactacaaca cgacggcctg cgactacaac gggttcgtcc 1440
cctggaccga cccagtccca ctggggacag tgtggaggca tcggttattc cggtccgacc 1500
gtctgtgcgt ccggcacaac ctgtcaggtc ttgaaccctt actattcgca gtgtctctaa 1560
<210> 63
<211> 519
<212> PRT
<213> Rasamsonia emersonii
<400> 63
Met Leu Arg Arg Ala Leu Leu Leu Ser Ser Ser Ala Ile Leu Ala Val
1 5 10 15
Lys Ala Gln Gln Ala Gly Thr Ala Thr Ala Glu Asn His Pro Pro Leu
20 25 30
Thr Trp Gln Glu Cys Thr Ala Pro Gly Ser Cys Thr Thr Gln Asn Gly
35 40 45
Ala Val Val Leu Asp Ala Asn Trp Arg Trp Val His Asp Val Asn Gly
50 55 60
Tyr Thr Asn Cys Tyr Thr Gly Asn Thr Trp Asn Pro Thr Tyr Cys Pro
65 70 75 80
Asp Asp Glu Thr Cys Ala Gln Asn Cys Ala Leu Asp Gly Ala Asp Tyr
85 90 95
Glu Gly Thr Tyr Gly Val Thr Ser Ser Gly Ser Ser Leu Lys Leu Asn
100 105 110
Phe Val Thr Gly Ser Asn Val Gly Ser Arg Leu Tyr Leu Leu Gln Asp
115 120 125
Asp Ser Thr Tyr Gln Ile Phe Lys Leu Leu Asn Arg Glu Phe Thr Phe
130 135 140
Asp Val Asp Val Ser Asn Leu Pro Cys Gly Leu Asn Gly Ala Leu Tyr
145 150 155 160
Phe Val Ala Met Asp Ala Asp Gly Gly Val Ser Lys Tyr Pro Asn Asn
165 170 175
Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln Cys Pro
180 185 190
Arg Asp Leu Lys Phe Ile Asp Gly Glu Ala Asn Val Glu Gly Trp Gln
195 200 205
Pro Ser Ser Asn Asn Ala Asn Thr Gly Ile Gly Asp His Gly Ser Cys
210 215 220
Cys Ala Glu Met Asp Val Trp Glu Ala Asn Ser Ile Ser Asn Ala Val
225 230 235 240
Thr Pro His Pro Cys Asp Thr Pro Gly Gln Thr Met Cys Ser Gly Asp
245 250 255
Asp Cys Gly Gly Thr Tyr Ser Asn Asp Arg Tyr Ala Gly Thr Cys Asp
260 265 270
Pro Asp Gly Cys Asp Phe Asn Pro Tyr Arg Met Gly Asn Thr Ser Phe
275 280 285
Tyr Gly Pro Gly Lys Ile Ile Asp Thr Thr Lys Pro Phe Thr Val Val
290 295 300
Thr Gln Phe Leu Thr Asp Asp Gly Thr Asp Thr Gly Thr Leu Ser Glu
305 310 315 320
Ile Lys Arg Phe Tyr Val Gln Asn Gly Asn Val Ile Pro Gln Pro Asn
325 330 335
Ser Asp Ile Ser Gly Val Thr Gly Asn Ser Ile Thr Thr Glu Phe Cys
340 345 350
Thr Ala Gln Lys Gln Ala Phe Gly Asp Thr Asp Asp Phe Ser Gln His
355 360 365
Gly Gly Leu Ala Lys Met Gly Ala Ala Met Gln Gln Gly Met Val Leu
370 375 380
Val Met Ser Leu Trp Asp Asp Tyr Ala Ala Gln Met Leu Trp Leu Asp
385 390 395 400
Ser Asp Tyr Pro Thr Asp Ala Asp Pro Thr Thr Pro Gly Ile Ala Arg
405 410 415
Gly Thr Cys Pro Thr Asp Ser Gly Val Pro Ser Asp Val Glu Ser Gln
420 425 430
Ser Pro Asn Ser Tyr Val Thr Tyr Ser Asn Ile Lys Phe Gly Pro Ile
435 440 445
Asn Ser Thr Phe Thr Ala Ser Gly Gly Asn Pro Pro Gly Gly Asn Pro
450 455 460
Pro Gly Thr Thr Thr Thr Arg Arg Pro Ala Thr Thr Thr Gly Ser Ser
465 470 475 480
Pro Gly Pro Thr Gln Ser His Trp Gly Gln Cys Gly Gly Ile Gly Tyr
485 490 495
Ser Gly Pro Thr Val Cys Ala Ser Gly Thr Thr Cys Gln Val Leu Asn
500 505 510
Pro Tyr Tyr Ser Gln Cys Leu
515
<210> 64
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 64
ctgtcaggtc ttgaaccctt actggtcgca gtgtctctaa g 41
<210> 65
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 65
gtaagggttc aagacctgac aggttgtgcc gg 32
<210> 66
<211> 43
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 66
ctggaccgac ccagtcccac tggggacagt gtggaggcat cgg 43
<210> 67
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 67
gtgggactgg gtcggtccag gggacgaacc 30
<210> 68
<211> 28
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 68
ccacacttct cttccttcct caatcctc 28
<210> 69
<211> 22
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 69
gtgaggcgaa cgtggaagga tg 22
<210> 70
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 70
gtacctgtgt ccgtgccgtc atctg 25
<210> 71
<211> 21
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 71
atcctcaatt ccgtcggtcg a 21
<210> 72
<211> 1560
<212> DNA
<213> Rasamsonia emersonii
<400> 72
atgttgcgaa gggccttgtt gctctcgtcc tccgcaatct tggcggtcaa ggcacagcag 60
gcaggcaccg caaccgcaga gaaccatcct ccgctcactt ggcaggaatg tacagcacct 120
ggctcctgta caacccagaa cggagcggtc gtgctcgatg cgaactggcg ctgggtgcac 180
gatgtcaacg gatacacaaa ctgttataca ggtaacacgt ggaaccctac gtattgtccc 240
gacgacgaaa cgtgtgccca gaactgtgcg ttggatggag cagactacga gggaacgtat 300
ggcgtgacct cgtccggctc ctccttgaag ctcaacttcg tcacgggctc gaacgtcggc 360
tcccgcttgt acctcctcca ggacgactcg acctaccaga tcttcaagct cctcaacagg 420
gagttcacct tcgacgtcga tgtctccaac ttgccctgtg gtctcaacgg agccttgtac 480
ttcgtcgcga tggatgcaga cggaggtgtc tcgaagtacc ccaacaacaa ggcaggtgcc 540
aagtatggta ctggctactg tgattcgcag tgtcctcgcg atctcaagtt cattgacggt 600
gaggcgaacg tggaaggatg gcagccctcg tccaacaacg cgaacactgg catcggtgat 660
cacggttcgt gttgtgccga gatggacgtc tgggaagcca actccatctc gaacgcggtc 720
acaccgcacc cgtgtgatac tcctggccag actatgtgtt ccggagatga ttgtggaggc 780
acctattcga acgaccggta tgcaggcacg tgtgacccgg atggctgtga cttcaacccg 840
taccgcatgg gcaacacctc cttctatgga ccgggtaaga tcatcgatac aactaagccc 900
ttcaccgtcg tcacgcagtt cctcacagat gacggcacgg acacaggtac tttgtcggag 960
atcaaacgct tctacgtcca gaacggaaac gtcatccccc agccgaactc cgacatttcg 1020
ggagtcacag gcaactcgat tacgaccgag ttctgtacag cccagaaaca ggcattcggt 1080
gacacggatg atttctccca gcacggagga ttggcgaaaa tgggagccgc aatgcagcag 1140
ggaatggtcc tcgtgatgtc gctctgggac gactatgcag cccagatgtt gtggctcgac 1200
tcggactacc ccacagacgc cgatcccacg acacccggta tcgcacgagg cacttgtccg 1260
acagattccg gagtcccgtc ggacgtcgag tcccagtccc ccaactcgta cgtcacctat 1320
tcgaacatca aattcggtcc catcaactcg acattcacag cctcgggtgg aaaccctcct 1380
ggcggaaacc ctcctggcac aactacaaca cgacggcctg cgactacaac gggttcgtcc 1440
cctggaccga cccagtccca ctacggacag tgtggaggca tcggttggtc cggtccgacc 1500
gtctgtgcgt ccggcacaac ctgtcaggtc ttgaaccctt actattcgca gtgtctctaa 1560
<210> 73
<211> 519
<212> PRT
<213> Rasamsonia emersonii
<400> 73
Met Leu Arg Arg Ala Leu Leu Leu Ser Ser Ser Ala Ile Leu Ala Val
1 5 10 15
Lys Ala Gln Gln Ala Gly Thr Ala Thr Ala Glu Asn His Pro Pro Leu
20 25 30
Thr Trp Gln Glu Cys Thr Ala Pro Gly Ser Cys Thr Thr Gln Asn Gly
35 40 45
Ala Val Val Leu Asp Ala Asn Trp Arg Trp Val His Asp Val Asn Gly
50 55 60
Tyr Thr Asn Cys Tyr Thr Gly Asn Thr Trp Asn Pro Thr Tyr Cys Pro
65 70 75 80
Asp Asp Glu Thr Cys Ala Gln Asn Cys Ala Leu Asp Gly Ala Asp Tyr
85 90 95
Glu Gly Thr Tyr Gly Val Thr Ser Ser Gly Ser Ser Leu Lys Leu Asn
100 105 110
Phe Val Thr Gly Ser Asn Val Gly Ser Arg Leu Tyr Leu Leu Gln Asp
115 120 125
Asp Ser Thr Tyr Gln Ile Phe Lys Leu Leu Asn Arg Glu Phe Thr Phe
130 135 140
Asp Val Asp Val Ser Asn Leu Pro Cys Gly Leu Asn Gly Ala Leu Tyr
145 150 155 160
Phe Val Ala Met Asp Ala Asp Gly Gly Val Ser Lys Tyr Pro Asn Asn
165 170 175
Lys Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln Cys Pro
180 185 190
Arg Asp Leu Lys Phe Ile Asp Gly Glu Ala Asn Val Glu Gly Trp Gln
195 200 205
Pro Ser Ser Asn Asn Ala Asn Thr Gly Ile Gly Asp His Gly Ser Cys
210 215 220
Cys Ala Glu Met Asp Val Trp Glu Ala Asn Ser Ile Ser Asn Ala Val
225 230 235 240
Thr Pro His Pro Cys Asp Thr Pro Gly Gln Thr Met Cys Ser Gly Asp
245 250 255
Asp Cys Gly Gly Thr Tyr Ser Asn Asp Arg Tyr Ala Gly Thr Cys Asp
260 265 270
Pro Asp Gly Cys Asp Phe Asn Pro Tyr Arg Met Gly Asn Thr Ser Phe
275 280 285
Tyr Gly Pro Gly Lys Ile Ile Asp Thr Thr Lys Pro Phe Thr Val Val
290 295 300
Thr Gln Phe Leu Thr Asp Asp Gly Thr Asp Thr Gly Thr Leu Ser Glu
305 310 315 320
Ile Lys Arg Phe Tyr Val Gln Asn Gly Asn Val Ile Pro Gln Pro Asn
325 330 335
Ser Asp Ile Ser Gly Val Thr Gly Asn Ser Ile Thr Thr Glu Phe Cys
340 345 350
Thr Ala Gln Lys Gln Ala Phe Gly Asp Thr Asp Asp Phe Ser Gln His
355 360 365
Gly Gly Leu Ala Lys Met Gly Ala Ala Met Gln Gln Gly Met Val Leu
370 375 380
Val Met Ser Leu Trp Asp Asp Tyr Ala Ala Gln Met Leu Trp Leu Asp
385 390 395 400
Ser Asp Tyr Pro Thr Asp Ala Asp Pro Thr Thr Pro Gly Ile Ala Arg
405 410 415
Gly Thr Cys Pro Thr Asp Ser Gly Val Pro Ser Asp Val Glu Ser Gln
420 425 430
Ser Pro Asn Ser Tyr Val Thr Tyr Ser Asn Ile Lys Phe Gly Pro Ile
435 440 445
Asn Ser Thr Phe Thr Ala Ser Gly Gly Asn Pro Pro Gly Gly Asn Pro
450 455 460
Pro Gly Thr Thr Thr Thr Arg Arg Pro Ala Thr Thr Thr Gly Ser Ser
465 470 475 480
Pro Gly Pro Thr Gln Ser His Tyr Gly Gln Cys Gly Gly Ile Gly Trp
485 490 495
Ser Gly Pro Thr Val Cys Ala Ser Gly Thr Thr Cys Gln Val Leu Asn
500 505 510
Pro Tyr Tyr Ser Gln Cys Leu
515
<210> 74
<211> 44
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 74
ggacagtgtg gaggcatcgg ttggtccggt ccgaccgtct gtgc 44
<210> 75
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 75
accgatgcct ccacactgtc cgtagtggga ct 32
<210> 76
<211> 1599
<212> DNA
<213> 烟曲霉(Aspergillus fumigatus)
<400> 76
atgctggcct ccaccttctc ctaccgcatg tacaagaccg cgctcatcct ggccgccctt 60
ctgggctctg gccaggctca gcaggtcggt acttcccagg cggaagtgca tccgtccatg 120
acctggcaga gctgcacggc tggcggcagc tgcaccacca acaacggcaa ggtggtcatc 180
gacgcgaact ggcgttgggt gcacaaagtc ggcgactaca ccaactgcta caccggcaac 240
acctgggaca cgactatctg ccctgacgat gcgacctgcg catccaactg cgcccttgag 300
ggtgccaact acgaatccac ctatggtgtg accgccagcg gcaattccct ccgcctcaac 360
ttcgtcacca ccagccagca gaagaacatt ggctcgcgtc tgtacatgat gaaggacgac 420
tcgacctacg agatgtttaa gctgctgaac caggagttca ccttcgatgt cgatgtctcc 480
aacctcccct gcggtctcaa cggtgctctg tactttgtcg ccatggacgc cgacggtggc 540
atgtccaagt acccaaccaa caaggccggt gccaagtacg gtactggata ctgtgactcg 600
cagtgccctc gcgacctcaa gttcatcaac ggtcaggcca acgttgaagg gtggcagccc 660
tcctccaacg atgccaatgc gggtaccggc aaccacgggt cctgctgcgc ggagatggat 720
atctgggagg ccaacagcat ctccacggcc ttcacccccc atccgtgcga cacgcccggc 780
caggtgatgt gcaccggtga tgcctgcggt ggcacctaca gctccgaccg ctacggcggc 840
acctgcgacc ccgacggatg tgatttcaac tccttccgcc agggcaacaa gaccttctac 900
ggccctggca tgaccgtcga caccaagagc aagtttaccg tcgtcaccca gttcatcacc 960
gacgacggca cctccagcgg caccctcaag gagatcaagc gcttctacgt gcagaacggc 1020
aaggtgatcc ccaactcgga gtcgacctgg accggcgtca gcggcaactc catcaccacc 1080
gagtactgca ccgcccagaa aagcctgttc caggaccaga acgtcttcga aaagcacggc 1140
ggcctcgagg gcatgggtgc tgccctcgcc cagggcatgg ttctcgtcat gtccctgtgg 1200
gatgatcact cggccaacat gctctggctc gacagcaact acccgaccac tgcctcttcc 1260
accactcccg gcgtcgcccg tggtacctgc gacatctcct ccggcgtccc tgcggatgtc 1320
gaggcgaacc accccgacgc ctacgtcgtc tactccaaca tcaaggtcgg ccccatcggc 1380
tcgaccttca acagcggtgg ctcgaacccc ggtggcggaa ccaccacgac aactaccacc 1440
cagcctacta ccaccacgac cacggctgga aaccctggcg gcaccggagt cgcacagcac 1500
tatggccagt gtggtggaat cggatggacc ggacccacaa cctgtgccag cccttatacc 1560
tgccagaagc tgaatgatta ttactctcag tgcctgtag 1599
<210> 77
<211> 1599
<212> DNA
<213> 烟曲霉(Aspergillus fumigatus)
<400> 77
atgctggcct ccaccttctc ctaccgcatg tacaagaccg cgctcatcct ggccgccctt 60
ctgggctctg gccaggctca gcaggtcggt acttcccagg cggaagtgca tccgtccatg 120
acctggcaga gctgcacggc tggcggcagc tgcaccacca acaacggcaa ggtggtcatc 180
gacgcgaact ggcgttgggt gcacaaagtc ggcgactaca ccaactgcta caccggcaac 240
acctgggaca cgactatctg ccctgacgat gcgacctgcg catccaactg cgcccttgag 300
ggtgccaact acgaatccac ctatggtgtg accgccagcg gcaattccct ccgcctcaac 360
ttcgtcacca ccagccagca gaagaacatt ggctcgcgtc tgtacatgat gaaggacgac 420
tcgacctacg agatgtttaa gctgctgaac caggagttca ccttcgatgt cgatgtctcc 480
aacctcccct gcggtctcaa cggtgctctg tactttgtcg ccatggacgc cgacggtggc 540
atgtccaagt acccaaccaa caaggccggt gccaagtacg gtactggata ctgtgactcg 600
cagtgccctc gcgacctcaa gttcatcaac ggtcaggcca acgttgaagg gtggcagccc 660
tcctccaacg atgccaatgc gggtaccggc aaccacgggt cctgctgcgc ggagatggat 720
atctgggagg ccaacagcat ctccacggcc ttcacccccc atccgtgcga cacgcccggc 780
caggtgatgt gcaccggtga tgcctgcggt ggcacctaca gctccgaccg ctacggcggc 840
acctgcgacc ccgacggatg tgatttcaac tccttccgcc agggcaacaa gaccttctac 900
ggccctggca tgaccgtcga caccaagagc aagtttaccg tcgtcaccca gttcatcacc 960
gacgacggca cctccagcgg caccctcaag gagatcaagc gcttctacgt gcagaacggc 1020
aaggtgatcc ccaactcgga gtcgacctgg accggcgtca gcggcaactc catcaccacc 1080
gagtactgca ccgcccagaa aagcctgttc caggaccaga acgtcttcga aaagcacggc 1140
ggcctcgagg gcatgggtgc tgccctcgcc cagggcatgg ttctcgtcat gtccctgtgg 1200
gatgatcact cggccaacat gctctggctc gacagcaact acccgaccac tgcctcttcc 1260
accactcccg gcgtcgcccg tggtacctgc gacatctcct ccggcgtccc tgcggatgtc 1320
gaggcgaacc accccgacgc ctacgtcgtc tactccaaca tcaaggtcgg ccccatcggc 1380
tcgaccttca acagcggtgg ctcgaacccc ggtggcggaa ccaccacgac aactaccacc 1440
cagcctacta ccaccacgac cacggctgga aaccctggcg gcaccggagt cgcacagcac 1500
tatggccagt gtggtggaat cggatggacc ggacccacaa cctgtgccag cccttatacc 1560
tgccagaagc tgaatgatta ttactctcag tgcctgtag 1599
<210> 78
<211> 532
<212> PRT
<213> 烟曲霉(Aspergillus fumigatus)
<400> 78
Met Leu Ala Ser Thr Phe Ser Tyr Arg Met Tyr Lys Thr Ala Leu Ile
1 5 10 15
Leu Ala Ala Leu Leu Gly Ser Gly Gln Ala Gln Gln Val Gly Thr Ser
20 25 30
Gln Ala Glu Val His Pro Ser Met Thr Trp Gln Ser Cys Thr Ala Gly
35 40 45
Gly Ser Cys Thr Thr Asn Asn Gly Lys Val Val Ile Asp Ala Asn Trp
50 55 60
Arg Trp Val His Lys Val Gly Asp Tyr Thr Asn Cys Tyr Thr Gly Asn
65 70 75 80
Thr Trp Asp Thr Thr Ile Cys Pro Asp Asp Ala Thr Cys Ala Ser Asn
85 90 95
Cys Ala Leu Glu Gly Ala Asn Tyr Glu Ser Thr Tyr Gly Val Thr Ala
100 105 110
Ser Gly Asn Ser Leu Arg Leu Asn Phe Val Thr Thr Ser Gln Gln Lys
115 120 125
Asn Ile Gly Ser Arg Leu Tyr Met Met Lys Asp Asp Ser Thr Tyr Glu
130 135 140
Met Phe Lys Leu Leu Asn Gln Glu Phe Thr Phe Asp Val Asp Val Ser
145 150 155 160
Asn Leu Pro Cys Gly Leu Asn Gly Ala Leu Tyr Phe Val Ala Met Asp
165 170 175
Ala Asp Gly Gly Met Ser Lys Tyr Pro Thr Asn Lys Ala Gly Ala Lys
180 185 190
Tyr Gly Thr Gly Tyr Cys Asp Ser Gln Cys Pro Arg Asp Leu Lys Phe
195 200 205
Ile Asn Gly Gln Ala Asn Val Glu Gly Trp Gln Pro Ser Ser Asn Asp
210 215 220
Ala Asn Ala Gly Thr Gly Asn His Gly Ser Cys Cys Ala Glu Met Asp
225 230 235 240
Ile Trp Glu Ala Asn Ser Ile Ser Thr Ala Phe Thr Pro His Pro Cys
245 250 255
Asp Thr Pro Gly Gln Val Met Cys Thr Gly Asp Ala Cys Gly Gly Thr
260 265 270
Tyr Ser Ser Asp Arg Tyr Gly Gly Thr Cys Asp Pro Asp Gly Cys Asp
275 280 285
Phe Asn Ser Phe Arg Gln Gly Asn Lys Thr Phe Tyr Gly Pro Gly Met
290 295 300
Thr Val Asp Thr Lys Ser Lys Phe Thr Val Val Thr Gln Phe Ile Thr
305 310 315 320
Asp Asp Gly Thr Ser Ser Gly Thr Leu Lys Glu Ile Lys Arg Phe Tyr
325 330 335
Val Gln Asn Gly Lys Val Ile Pro Asn Ser Glu Ser Thr Trp Thr Gly
340 345 350
Val Ser Gly Asn Ser Ile Thr Thr Glu Tyr Cys Thr Ala Gln Lys Ser
355 360 365
Leu Phe Gln Asp Gln Asn Val Phe Glu Lys His Gly Gly Leu Glu Gly
370 375 380
Met Gly Ala Ala Leu Ala Gln Gly Met Val Leu Val Met Ser Leu Trp
385 390 395 400
Asp Asp His Ser Ala Asn Met Leu Trp Leu Asp Ser Asn Tyr Pro Thr
405 410 415
Thr Ala Ser Ser Thr Thr Pro Gly Val Ala Arg Gly Thr Cys Asp Ile
420 425 430
Ser Ser Gly Val Pro Ala Asp Val Glu Ala Asn His Pro Asp Ala Tyr
435 440 445
Val Val Tyr Ser Asn Ile Lys Val Gly Pro Ile Gly Ser Thr Phe Asn
450 455 460
Ser Gly Gly Ser Asn Pro Gly Gly Gly Thr Thr Thr Thr Thr Thr Thr
465 470 475 480
Gln Pro Thr Thr Thr Thr Thr Thr Ala Gly Asn Pro Gly Gly Thr Gly
485 490 495
Val Ala Gln His Tyr Gly Gln Cys Gly Gly Ile Gly Trp Thr Gly Pro
500 505 510
Thr Thr Cys Ala Ser Pro Tyr Thr Cys Gln Lys Leu Asn Asp Tyr Tyr
515 520 525
Ser Gln Cys Leu
530
<210> 79
<211> 1599
<212> DNA
<213> 烟曲霉(Aspergillus fumigatus)
<400> 79
atgttggcct ccacgttctc ctatcgcatg tacaaaacag cgctcatctt ggcagccctc 60
ttgggctcgg gacaggcaca gcaggtcgga acctcgcagg ccgaggtcca tccttccatg 120
acgtggcagt cgtgtacagc gggtggttcg tgtaccacaa acaacggtaa agtcgtgatc 180
gatgcaaact ggaggtgggt gcacaaggtc ggcgactaca ccaactgtta cacaggcaac 240
acatgggata caaccatctg tcccgacgat gccacttgtg catccaactg tgcactcgag 300
ggtgccaact atgagtcgac gtacggagtg accgcctccg gaaactcgct caggctcaac 360
ttcgtcacaa cttcccagca gaagaacatc ggctcgcggt tgtatatgat gaaagacgat 420
tccacttacg agatgttcaa gctcctcaac caggaattca ctttcgatgt cgacgtctcc 480
aacctccctt gtggcttgaa cggagcgctc tacttcgtcg ccatggatgc ggatggaggc 540
atgtccaagt atcctaccaa caaagcagga gccaagtatg gtacaggtta ctgtgattcc 600
cagtgtccca gggatctcaa gttcatcaac ggtcaggcca acgtcgaggg ttggcagcct 660
tcgtcgaacg atgccaacgc aggtaccggc aaccacggtt cctgttgtgc cgaaatggac 720
atttgggaag cgaactcgat ctcgacggcg ttcactcctc acccgtgtga tacacccgga 780
caggtgatgt gtacaggcga cgcctgtggc ggaacctact cgtcggatcg atatggcggt 840
acgtgtgacc ccgacggctg tgacttcaac tccttcaggc agggcaacaa aacattctat 900
ggacctggca tgacggtgga tacaaagtcg aaattcacag tcgtcactca gttcatcacc 960
gacgatggta cgtcctcggg taccttgaag gagatcaaaa ggttctatgt ccagaacgga 1020
aaggtcatcc cgaactcgga gtccacgtgg acaggagtgt cgggtaactc catcactacg 1080
gagtattgta cagcccagaa gtcgctcttc caggatcaga acgtcttcga gaaacatgga 1140
ggcttggaag gaatgggtgc cgcattggcc cagggtatgg tcctcgtcat gtccttgtgg 1200
gacgaccact cggccaacat gctctggttg gattccaact accccaccac tgcctcgtcc 1260
acgacaccgg gtgtcgcacg cggaacttgt gatatctcct cgggagtgcc tgcagacgtc 1320
gaggcgaacc atcccgacgc ctacgtggtc tactcgaaca ttaaggtggg acccatcggt 1380
tcgacattca actccggagg ctcgaaccct ggaggcggaa cgaccactac tacaacgact 1440
cagccgacaa caacaactac cacagcaggc aaccctggag gtacaggtgt ggcccagcac 1500
tacggacagt gtggcggtat cggatggaca ggacctacta cttgtgcatc gccttatacc 1560
tgtcagaaat tgaacgacta ctactcgcag tgtttgtaa 1599
<210> 80
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 80
gtgatacacc cggacaggtg atgtg 25
<210> 81
<211> 25
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 81
ccatatcgat ccgacgagta ggttc 25
<210> 82
<211> 1507
<212> DNA
<213> 丝衣霉状篮状菌(Talaromyces byssochlamydoides)
<400> 82
atgtttcgac gggctctttt cctgtcctct tccgccttcc ttgctgtcaa agcccagcag 60
atcggcacgg tcagtccgga gaaccatccg cccctggcat gggagcagtg cactgcccct 120
gggagttgca cgactgtgaa tggtgcggtc gtccttgatg cgaactggcg ttgggtccac 180
aatgttgggg gatacaccaa ctgctacact ggcaatacct gggacaccac gtactgccct 240
gacgacgtga cctgcgcaga gaattgtgcg ctggatggcg cagattacga gggcacctac 300
ggcgtgacca cctcgggcag ctccctgaag ctcgatttcg tcaccgggtc taacgtcgga 360
tctcgtctct acctgttgga gaatgattcg acctatcaga tcttcaagct tctgaaccag 420
gaattcacct ttgacgtcga cgtttccaat cttccgtgcg gattaaacgg cgctctgtac 480
cttgttacca tggctgctga cggcggggtg tctcagtacc cgaataacaa ggccggcgca 540
gcgtatggaa ccggttattg cgattcccag tgtccaaggg acttgaagtt tatcgatggc 600
caggtatgta gagctgtaat cacccatgtt gtgaaatcac tctcctactg acatggtcga 660
tttataggcc aacgttgagg gctggcagcc gtcttcgaac aacgccaata caggtattgg 720
caaccatggc tcctgctgtg cggagatgga tatctgggaa gccaacagca tctccaatgc 780
ggtgactccg cacccatgcg acacacccgg ccagacaatg tgcgagggga acgactgtgg 840
tggcacgtat tccaccaatc gctatgcagg cacctgcgat cctgacggct gcgacttcaa 900
cccctaccgc atgggcaacc attctttcta cggccctggg gagattgtcg atactaccca 960
gcccttcact gtcgtgacac agttccttac cgatgatggc acggatactg gcactctcag 1020
cgagatcaaa cgcttctacg tccaaaacgg gaaagtcatt cctcagccga actccgacat 1080
tgccggcgtg actggcaact cgatcaccag cgagttttgc gatgcccaga agacggcttt 1140
cggcgacatt aacaactttg atacacacgg cggtctggcc agtatgggag ctgcgctgca 1200
gcagggtatg gttctggtga tgagtctgtg ggacggtagg tccttgggag acacccggac 1260
gttctatatc aaccagaact gccagaactg acgaattaaa acacttttag attacgcggc 1320
aaacatgctg tggttggaca gcatttatcc aacaaatgca tctgctagca ctcctggtgc 1380
tgctcgtgga acctgttcga cgagctccgg tgtcccatcg caagtcgagt cgcagagccc 1440
caacgcctac gtgacgtact ccaacattaa agttggacca atcaactcga ccttcaccac 1500
ttcgtaa 1507
<210> 83
<211> 455
<212> PRT
<213> 丝衣霉状篮状菌(Talaromyces byssochlamydoides)
<400> 83
Met Phe Arg Arg Ala Leu Phe Leu Ser Ser Ser Ala Phe Leu Ala Val
1 5 10 15
Lys Ala Gln Gln Ile Gly Thr Val Ser Pro Glu Asn His Pro Pro Leu
20 25 30
Ala Trp Glu Gln Cys Thr Ala Pro Gly Ser Cys Thr Thr Val Asn Gly
35 40 45
Ala Val Val Leu Asp Ala Asn Trp Arg Trp Val His Asn Val Gly Gly
50 55 60
Tyr Thr Asn Cys Tyr Thr Gly Asn Thr Trp Asp Thr Thr Tyr Cys Pro
65 70 75 80
Asp Asp Val Thr Cys Ala Glu Asn Cys Ala Leu Asp Gly Ala Asp Tyr
85 90 95
Glu Gly Thr Tyr Gly Val Thr Thr Ser Gly Ser Ser Leu Lys Leu Asp
100 105 110
Phe Val Thr Gly Ser Asn Val Gly Ser Arg Leu Tyr Leu Leu Glu Asn
115 120 125
Asp Ser Thr Tyr Gln Ile Phe Lys Leu Leu Asn Gln Glu Phe Thr Phe
130 135 140
Asp Val Asp Val Ser Asn Leu Pro Cys Gly Leu Asn Gly Ala Leu Tyr
145 150 155 160
Leu Val Thr Met Ala Ala Asp Gly Gly Val Ser Gln Tyr Pro Asn Asn
165 170 175
Lys Ala Gly Ala Ala Tyr Gly Thr Gly Tyr Cys Asp Ser Gln Cys Pro
180 185 190
Arg Asp Leu Lys Phe Ile Asp Gly Gln Ala Asn Val Glu Gly Trp Gln
195 200 205
Pro Ser Ser Asn Asn Ala Asn Thr Gly Ile Gly Asn His Gly Ser Cys
210 215 220
Cys Ala Glu Met Asp Ile Trp Glu Ala Asn Ser Ile Ser Asn Ala Val
225 230 235 240
Thr Pro His Pro Cys Asp Thr Pro Gly Gln Thr Met Cys Glu Gly Asn
245 250 255
Asp Cys Gly Gly Thr Tyr Ser Thr Asn Arg Tyr Ala Gly Thr Cys Asp
260 265 270
Pro Asp Gly Cys Asp Phe Asn Pro Tyr Arg Met Gly Asn His Ser Phe
275 280 285
Tyr Gly Pro Gly Glu Ile Val Asp Thr Thr Gln Pro Phe Thr Val Val
290 295 300
Thr Gln Phe Leu Thr Asp Asp Gly Thr Asp Thr Gly Thr Leu Ser Glu
305 310 315 320
Ile Lys Arg Phe Tyr Val Gln Asn Gly Lys Val Ile Pro Gln Pro Asn
325 330 335
Ser Asp Ile Ala Gly Val Thr Gly Asn Ser Ile Thr Ser Glu Phe Cys
340 345 350
Asp Ala Gln Lys Thr Ala Phe Gly Asp Ile Asn Asn Phe Asp Thr His
355 360 365
Gly Gly Leu Ala Ser Met Gly Ala Ala Leu Gln Gln Gly Met Val Leu
370 375 380
Val Met Ser Leu Trp Asp Asp Tyr Ala Ala Asn Met Leu Trp Leu Asp
385 390 395 400
Ser Ile Tyr Pro Thr Asn Ala Ser Ala Ser Thr Pro Gly Ala Ala Arg
405 410 415
Gly Thr Cys Ser Thr Ser Ser Gly Val Pro Ser Gln Val Glu Ser Gln
420 425 430
Ser Pro Asn Ala Tyr Val Thr Tyr Ser Asn Ile Lys Val Gly Pro Ile
435 440 445
Asn Ser Thr Phe Thr Thr Ser
450 455
<210> 84
<211> 1705
<212> DNA
<213> 丝衣霉状篮状菌(Talaromyces byssochlamydoides)
<400> 84
atgtttcgac gggctctttt cctgtcctct tccgccttcc ttgctgtcaa agcccagcag 60
atcggcacgg tcagtccgga gaaccatccg cccctggcat gggagcagtg cactgcccct 120
gggagttgca cgactgtgaa tggtgcggtc gtccttgatg cgaactggcg ttgggtccac 180
aatgttgggg gatacaccaa ctgctacact ggcaatacct gggacaccac gtactgccct 240
gacgacgtga cctgcgcaga gaattgtgcg ctggatggcg cagattacga gggcacctac 300
ggcgtgacca cctcgggcag ctccctgaag ctcgatttcg tcaccgggtc taacgtcgga 360
tctcgtctct acctgttgga gaatgattcg acctatcaga tcttcaagct tctgaaccag 420
gaattcacct ttgacgtcga cgtttccaat cttccgtgcg gattaaacgg cgctctgtac 480
cttgttacca tggctgctga cggcggggtg tctcagtacc cgaataacaa ggccggcgca 540
gcgtatggaa ccggttattg cgattcccag tgtccaaggg acttgaagtt tatcgatggc 600
caggtatgta gagctgtaat cacccatgtt gtgaaatcac tctcctactg acatggtcga 660
tttataggcc aacgttgagg gctggcagcc gtcttcgaac aacgccaata caggtattgg 720
caaccatggc tcctgctgtg cggagatgga tatctgggaa gccaacagca tctccaatgc 780
ggtgactccg cacccatgcg acacacccgg ccagacaatg tgcgagggga acgactgtgg 840
tggcacgtat tccaccaatc gctatgcagg cacctgcgat cctgacggct gcgacttcaa 900
cccctaccgc atgggcaacc attctttcta cggccctggg gagattgtcg atactaccca 960
gcccttcact gtcgtgacac agttccttac cgatgatggc acggatactg gcactctcag 1020
cgagatcaaa cgcttctacg tccaaaacgg gaaagtcatt cctcagccga actccgacat 1080
tgccggcgtg actggcaact cgatcaccag cgagttttgc gatgcccaga agacggcttt 1140
cggcgacatt aacaactttg atacacacgg cggtctggcc agtatgggag ctgcgctgca 1200
gcagggtatg gttctggtga tgagtctgtg ggacggtagg tccttgggag acacccggac 1260
gttctatatc aaccagaact gccagaactg acgaattaaa acacttttag attacgcggc 1320
aaacatgctg tggttggaca gcatttatcc aacaaatgca tctgctagca ctcctggtgc 1380
tgctcgtgga acctgttcga cgagctccgg tgtcccatcg caagtcgagt cgcagagccc 1440
caacgcctac gtgacgtact ccaacattaa agttggacca atcaactcga ccttcaccac 1500
ttcgggctcg aaccctggag gcggaacgac cactactaca acgactcagc cgacaacaac 1560
aactaccaca gcaggcaacc ctggaggtac aggtgtggcc cagcactacg gacagtgtgg 1620
cggtatcgga tggacaggac ctactacttg tgcatcgcct tatacctgtc agaaattgaa 1680
cgactactac tcgcagtgtt tgtaa 1705
<210> 85
<211> 521
<212> PRT
<213> 丝衣霉状篮状菌(Talaromyces byssochlamydoides)
<400> 85
Met Phe Arg Arg Ala Leu Phe Leu Ser Ser Ser Ala Phe Leu Ala Val
1 5 10 15
Lys Ala Gln Gln Ile Gly Thr Val Ser Pro Glu Asn His Pro Pro Leu
20 25 30
Ala Trp Glu Gln Cys Thr Ala Pro Gly Ser Cys Thr Thr Val Asn Gly
35 40 45
Ala Val Val Leu Asp Ala Asn Trp Arg Trp Val His Asn Val Gly Gly
50 55 60
Tyr Thr Asn Cys Tyr Thr Gly Asn Thr Trp Asp Thr Thr Tyr Cys Pro
65 70 75 80
Asp Asp Val Thr Cys Ala Glu Asn Cys Ala Leu Asp Gly Ala Asp Tyr
85 90 95
Glu Gly Thr Tyr Gly Val Thr Thr Ser Gly Ser Ser Leu Lys Leu Asp
100 105 110
Phe Val Thr Gly Ser Asn Val Gly Ser Arg Leu Tyr Leu Leu Glu Asn
115 120 125
Asp Ser Thr Tyr Gln Ile Phe Lys Leu Leu Asn Gln Glu Phe Thr Phe
130 135 140
Asp Val Asp Val Ser Asn Leu Pro Cys Gly Leu Asn Gly Ala Leu Tyr
145 150 155 160
Leu Val Thr Met Ala Ala Asp Gly Gly Val Ser Gln Tyr Pro Asn Asn
165 170 175
Lys Ala Gly Ala Ala Tyr Gly Thr Gly Tyr Cys Asp Ser Gln Cys Pro
180 185 190
Arg Asp Leu Lys Phe Ile Asp Gly Gln Ala Asn Val Glu Gly Trp Gln
195 200 205
Pro Ser Ser Asn Asn Ala Asn Thr Gly Ile Gly Asn His Gly Ser Cys
210 215 220
Cys Ala Glu Met Asp Ile Trp Glu Ala Asn Ser Ile Ser Asn Ala Val
225 230 235 240
Thr Pro His Pro Cys Asp Thr Pro Gly Gln Thr Met Cys Glu Gly Asn
245 250 255
Asp Cys Gly Gly Thr Tyr Ser Thr Asn Arg Tyr Ala Gly Thr Cys Asp
260 265 270
Pro Asp Gly Cys Asp Phe Asn Pro Tyr Arg Met Gly Asn His Ser Phe
275 280 285
Tyr Gly Pro Gly Glu Ile Val Asp Thr Thr Gln Pro Phe Thr Val Val
290 295 300
Thr Gln Phe Leu Thr Asp Asp Gly Thr Asp Thr Gly Thr Leu Ser Glu
305 310 315 320
Ile Lys Arg Phe Tyr Val Gln Asn Gly Lys Val Ile Pro Gln Pro Asn
325 330 335
Ser Asp Ile Ala Gly Val Thr Gly Asn Ser Ile Thr Ser Glu Phe Cys
340 345 350
Asp Ala Gln Lys Thr Ala Phe Gly Asp Ile Asn Asn Phe Asp Thr His
355 360 365
Gly Gly Leu Ala Ser Met Gly Ala Ala Leu Gln Gln Gly Met Val Leu
370 375 380
Val Met Ser Leu Trp Asp Asp Tyr Ala Ala Asn Met Leu Trp Leu Asp
385 390 395 400
Ser Ile Tyr Pro Thr Asn Ala Ser Ala Ser Thr Pro Gly Ala Ala Arg
405 410 415
Gly Thr Cys Ser Thr Ser Ser Gly Val Pro Ser Gln Val Glu Ser Gln
420 425 430
Ser Pro Asn Ala Tyr Val Thr Tyr Ser Asn Ile Lys Val Gly Pro Ile
435 440 445
Asn Ser Thr Phe Thr Thr Ser Gly Ser Asn Pro Gly Gly Gly Thr Thr
450 455 460
Thr Thr Thr Thr Thr Gln Pro Thr Thr Thr Thr Thr Thr Ala Gly Asn
465 470 475 480
Pro Gly Gly Thr Gly Val Ala Gln His Tyr Gly Gln Cys Gly Gly Ile
485 490 495
Gly Trp Thr Gly Pro Thr Thr Cys Ala Ser Pro Tyr Thr Cys Gln Lys
500 505 510
Leu Asn Asp Tyr Tyr Ser Gln Cys Leu
515 520
<210> 86
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 86
caatcaactc gaccttcacc acttcgggct cgaaccctgg aggcggaacg 50
<210> 87
<211> 34
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 87
ctagatctcg agttacaaac actgcgagta gtag 34
<210> 88
<211> 26
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 88
cgaagtggtg aaggtcgagt tgattg 26
<210> 89
<211> 1599
<212> DNA
<213> 烟曲霉(Aspergillus fumigatus)
<400> 89
atgttggcct ccacgttctc ctatcgcatg tacaaaacag cgctcatctt ggcagccctc 60
ttgggctcgg gacaggcaca gcaggtcgga acctcgcagg ccgaggtcca tccttccatg 120
acgtggcagt cgtgtacagc gggtggttcg tgtaccacaa acaacggtaa agtcgtgatc 180
gatgcaaact ggaggtgggt gcacaaggtc ggcgactaca ccaactgtta cacaggcaac 240
acatgggata caaccatctg tcccgacgat gccacttgtg catccaactg tgcactcgag 300
ggtgccaact atgagtcgac gtacggagtg accgcctccg gaaactcgct caggctcaac 360
ttcgtcacaa cttcccagca gaagaacatc ggctcgcggt tgtatatgat gaaagacgat 420
tccacttacg agatgttcaa gctcctcaac caggaattca ctttcgatgt cgacgtctcc 480
aacctccctt gtggcttgaa cggagcgctc tacttcgtcg ccatggatgc ggatggaggc 540
atgtccaagt atcctaccaa caaagcagga gccaagtatg gtacaggtta ctgtgattcc 600
cagtgtccca gggatctcaa gttcatcaac ggtcaggcca acgtcgaggg ttggcagcct 660
tcgtcgaacg atgccaacgc aggtaccggc aaccacggtt cctgttgtgc cgaaatggac 720
atttgggaag cgaactcgat ctcgacggcg ttcactcctc acccgtgtga tacacccgga 780
caggtgatgt gtacaggcga cgcctgtggc ggaacctact cgtcggatcg atatggcggt 840
acgtgtgacc ccgacggctg tgacttcaac tccttcaggc agggcaacaa aacattctat 900
ggacctggca tgacggtgga tacaaagtcg aaattcacag tcgtcactca gttcatcacc 960
gacgatggta cgtcctcggg taccttgaag gagatcaaaa ggttctatgt ccagaacgga 1020
aaggtcatcc cgaactcgga gtccacgtgg acaggagtgt cgggtaactc catcactacg 1080
gagtattgta cagcccagaa gtcgctcttc caggatcaga acgtcttcga gaaacatgga 1140
ggcttggaag gaatgggtgc cgcattggcc cagggtatgg tcctcgtcat gtccttgtgg 1200
gacgaccact cggccaacat gctctggttg gattccaact accccaccac tgcctcgtcc 1260
acgacaccgg gtgtcgcacg cggaacttgt gatatctcct cgggagtgcc tgcagacgtc 1320
gaggcgaacc atcccgacgc ctacgtggtc tactcgaaca ttaaggtggg acccatcggt 1380
tcgacattca actccggagg ctcgaaccct ggaggcggaa cgaccactac tacaacgact 1440
cagccgacaa caacaactac cacagcaggc aaccctggag gtacaggtgt ggcccagcac 1500
tggggacagt gtggcggtat cggatggaca ggacctacta cttgtgcatc gccttatacc 1560
tgtcagaaat tgaacgacta ctactcgcag tgtttgtaa 1599
<210> 90
<211> 532
<212> PRT
<213> 烟曲霉(Aspergillus fumigatus)
<400> 90
Met Leu Ala Ser Thr Phe Ser Tyr Arg Met Tyr Lys Thr Ala Leu Ile
1 5 10 15
Leu Ala Ala Leu Leu Gly Ser Gly Gln Ala Gln Gln Val Gly Thr Ser
20 25 30
Gln Ala Glu Val His Pro Ser Met Thr Trp Gln Ser Cys Thr Ala Gly
35 40 45
Gly Ser Cys Thr Thr Asn Asn Gly Lys Val Val Ile Asp Ala Asn Trp
50 55 60
Arg Trp Val His Lys Val Gly Asp Tyr Thr Asn Cys Tyr Thr Gly Asn
65 70 75 80
Thr Trp Asp Thr Thr Ile Cys Pro Asp Asp Ala Thr Cys Ala Ser Asn
85 90 95
Cys Ala Leu Glu Gly Ala Asn Tyr Glu Ser Thr Tyr Gly Val Thr Ala
100 105 110
Ser Gly Asn Ser Leu Arg Leu Asn Phe Val Thr Thr Ser Gln Gln Lys
115 120 125
Asn Ile Gly Ser Arg Leu Tyr Met Met Lys Asp Asp Ser Thr Tyr Glu
130 135 140
Met Phe Lys Leu Leu Asn Gln Glu Phe Thr Phe Asp Val Asp Val Ser
145 150 155 160
Asn Leu Pro Cys Gly Leu Asn Gly Ala Leu Tyr Phe Val Ala Met Asp
165 170 175
Ala Asp Gly Gly Met Ser Lys Tyr Pro Thr Asn Lys Ala Gly Ala Lys
180 185 190
Tyr Gly Thr Gly Tyr Cys Asp Ser Gln Cys Pro Arg Asp Leu Lys Phe
195 200 205
Ile Asn Gly Gln Ala Asn Val Glu Gly Trp Gln Pro Ser Ser Asn Asp
210 215 220
Ala Asn Ala Gly Thr Gly Asn His Gly Ser Cys Cys Ala Glu Met Asp
225 230 235 240
Ile Trp Glu Ala Asn Ser Ile Ser Thr Ala Phe Thr Pro His Pro Cys
245 250 255
Asp Thr Pro Gly Gln Val Met Cys Thr Gly Asp Ala Cys Gly Gly Thr
260 265 270
Tyr Ser Ser Asp Arg Tyr Gly Gly Thr Cys Asp Pro Asp Gly Cys Asp
275 280 285
Phe Asn Ser Phe Arg Gln Gly Asn Lys Thr Phe Tyr Gly Pro Gly Met
290 295 300
Thr Val Asp Thr Lys Ser Lys Phe Thr Val Val Thr Gln Phe Ile Thr
305 310 315 320
Asp Asp Gly Thr Ser Ser Gly Thr Leu Lys Glu Ile Lys Arg Phe Tyr
325 330 335
Val Gln Asn Gly Lys Val Ile Pro Asn Ser Glu Ser Thr Trp Thr Gly
340 345 350
Val Ser Gly Asn Ser Ile Thr Thr Glu Tyr Cys Thr Ala Gln Lys Ser
355 360 365
Leu Phe Gln Asp Gln Asn Val Phe Glu Lys His Gly Gly Leu Glu Gly
370 375 380
Met Gly Ala Ala Leu Ala Gln Gly Met Val Leu Val Met Ser Leu Trp
385 390 395 400
Asp Asp His Ser Ala Asn Met Leu Trp Leu Asp Ser Asn Tyr Pro Thr
405 410 415
Thr Ala Ser Ser Thr Thr Pro Gly Val Ala Arg Gly Thr Cys Asp Ile
420 425 430
Ser Ser Gly Val Pro Ala Asp Val Glu Ala Asn His Pro Asp Ala Tyr
435 440 445
Val Val Tyr Ser Asn Ile Lys Val Gly Pro Ile Gly Ser Thr Phe Asn
450 455 460
Ser Gly Gly Ser Asn Pro Gly Gly Gly Thr Thr Thr Thr Thr Thr Thr
465 470 475 480
Gln Pro Thr Thr Thr Thr Thr Thr Ala Gly Asn Pro Gly Gly Thr Gly
485 490 495
Val Ala Gln His Trp Gly Gln Cys Gly Gly Ile Gly Trp Thr Gly Pro
500 505 510
Thr Thr Cys Ala Ser Pro Tyr Thr Cys Gln Lys Leu Asn Asp Tyr Tyr
515 520 525
Ser Gln Cys Leu
530
<210> 91
<211> 1599
<212> DNA
<213> 烟曲霉(Aspergillus fumigatus)
<400> 91
atgttggcct ccacgttctc ctatcgcatg tacaaaacag cgctcatctt ggcagccctc 60
ttgggctcgg gacaggcaca gcaggtcgga acctcgcagg ccgaggtcca tccttccatg 120
acgtggcagt cgtgtacagc gggtggttcg tgtaccacaa acaacggtaa agtcgtgatc 180
gatgcaaact ggaggtgggt gcacaaggtc ggcgactaca ccaactgtta cacaggcaac 240
acatgggata caaccatctg tcccgacgat gccacttgtg catccaactg tgcactcgag 300
ggtgccaact atgagtcgac gtacggagtg accgcctccg gaaactcgct caggctcaac 360
ttcgtcacaa cttcccagca gaagaacatc ggctcgcggt tgtatatgat gaaagacgat 420
tccacttacg agatgttcaa gctcctcaac caggaattca ctttcgatgt cgacgtctcc 480
aacctccctt gtggcttgaa cggagcgctc tacttcgtcg ccatggatgc ggatggaggc 540
atgtccaagt atcctaccaa caaagcagga gccaagtatg gtacaggtta ctgtgattcc 600
cagtgtccca gggatctcaa gttcatcaac ggtcaggcca acgtcgaggg ttggcagcct 660
tcgtcgaacg atgccaacgc aggtaccggc aaccacggtt cctgttgtgc cgaaatggac 720
atttgggaag cgaactcgat ctcgacggcg ttcactcctc acccgtgtga tacacccgga 780
caggtgatgt gtacaggcga cgcctgtggc ggaacctact cgtcggatcg atatggcggt 840
acgtgtgacc ccgacggctg tgacttcaac tccttcaggc agggcaacaa aacattctat 900
ggacctggca tgacggtgga tacaaagtcg aaattcacag tcgtcactca gttcatcacc 960
gacgatggta cgtcctcggg taccttgaag gagatcaaaa ggttctatgt ccagaacgga 1020
aaggtcatcc cgaactcgga gtccacgtgg acaggagtgt cgggtaactc catcactacg 1080
gagtattgta cagcccagaa gtcgctcttc caggatcaga acgtcttcga gaaacatgga 1140
ggcttggaag gaatgggtgc cgcattggcc cagggtatgg tcctcgtcat gtccttgtgg 1200
gacgaccact cggccaacat gctctggttg gattccaact accccaccac tgcctcgtcc 1260
acgacaccgg gtgtcgcacg cggaacttgt gatatctcct cgggagtgcc tgcagacgtc 1320
gaggcgaacc atcccgacgc ctacgtggtc tactcgaaca ttaaggtggg acccatcggt 1380
tcgacattca actccggagg ctcgaaccct ggaggcggaa cgaccactac tacaacgact 1440
cagccgacaa caacaactac cacagcaggc aaccctggag gtacaggtgt ggcccagcac 1500
tacggacagt gtggcggtat cggatggaca ggacctacta cttgtgcatc gccttatacc 1560
tgtcagaaat tgaacgactg gtactcgcag tgtttgtaa 1599
<210> 92
<211> 532
<212> PRT
<213> 烟曲霉(Aspergillus fumigatus)
<400> 92
Met Leu Ala Ser Thr Phe Ser Tyr Arg Met Tyr Lys Thr Ala Leu Ile
1 5 10 15
Leu Ala Ala Leu Leu Gly Ser Gly Gln Ala Gln Gln Val Gly Thr Ser
20 25 30
Gln Ala Glu Val His Pro Ser Met Thr Trp Gln Ser Cys Thr Ala Gly
35 40 45
Gly Ser Cys Thr Thr Asn Asn Gly Lys Val Val Ile Asp Ala Asn Trp
50 55 60
Arg Trp Val His Lys Val Gly Asp Tyr Thr Asn Cys Tyr Thr Gly Asn
65 70 75 80
Thr Trp Asp Thr Thr Ile Cys Pro Asp Asp Ala Thr Cys Ala Ser Asn
85 90 95
Cys Ala Leu Glu Gly Ala Asn Tyr Glu Ser Thr Tyr Gly Val Thr Ala
100 105 110
Ser Gly Asn Ser Leu Arg Leu Asn Phe Val Thr Thr Ser Gln Gln Lys
115 120 125
Asn Ile Gly Ser Arg Leu Tyr Met Met Lys Asp Asp Ser Thr Tyr Glu
130 135 140
Met Phe Lys Leu Leu Asn Gln Glu Phe Thr Phe Asp Val Asp Val Ser
145 150 155 160
Asn Leu Pro Cys Gly Leu Asn Gly Ala Leu Tyr Phe Val Ala Met Asp
165 170 175
Ala Asp Gly Gly Met Ser Lys Tyr Pro Thr Asn Lys Ala Gly Ala Lys
180 185 190
Tyr Gly Thr Gly Tyr Cys Asp Ser Gln Cys Pro Arg Asp Leu Lys Phe
195 200 205
Ile Asn Gly Gln Ala Asn Val Glu Gly Trp Gln Pro Ser Ser Asn Asp
210 215 220
Ala Asn Ala Gly Thr Gly Asn His Gly Ser Cys Cys Ala Glu Met Asp
225 230 235 240
Ile Trp Glu Ala Asn Ser Ile Ser Thr Ala Phe Thr Pro His Pro Cys
245 250 255
Asp Thr Pro Gly Gln Val Met Cys Thr Gly Asp Ala Cys Gly Gly Thr
260 265 270
Tyr Ser Ser Asp Arg Tyr Gly Gly Thr Cys Asp Pro Asp Gly Cys Asp
275 280 285
Phe Asn Ser Phe Arg Gln Gly Asn Lys Thr Phe Tyr Gly Pro Gly Met
290 295 300
Thr Val Asp Thr Lys Ser Lys Phe Thr Val Val Thr Gln Phe Ile Thr
305 310 315 320
Asp Asp Gly Thr Ser Ser Gly Thr Leu Lys Glu Ile Lys Arg Phe Tyr
325 330 335
Val Gln Asn Gly Lys Val Ile Pro Asn Ser Glu Ser Thr Trp Thr Gly
340 345 350
Val Ser Gly Asn Ser Ile Thr Thr Glu Tyr Cys Thr Ala Gln Lys Ser
355 360 365
Leu Phe Gln Asp Gln Asn Val Phe Glu Lys His Gly Gly Leu Glu Gly
370 375 380
Met Gly Ala Ala Leu Ala Gln Gly Met Val Leu Val Met Ser Leu Trp
385 390 395 400
Asp Asp His Ser Ala Asn Met Leu Trp Leu Asp Ser Asn Tyr Pro Thr
405 410 415
Thr Ala Ser Ser Thr Thr Pro Gly Val Ala Arg Gly Thr Cys Asp Ile
420 425 430
Ser Ser Gly Val Pro Ala Asp Val Glu Ala Asn His Pro Asp Ala Tyr
435 440 445
Val Val Tyr Ser Asn Ile Lys Val Gly Pro Ile Gly Ser Thr Phe Asn
450 455 460
Ser Gly Gly Ser Asn Pro Gly Gly Gly Thr Thr Thr Thr Thr Thr Thr
465 470 475 480
Gln Pro Thr Thr Thr Thr Thr Thr Ala Gly Asn Pro Gly Gly Thr Gly
485 490 495
Val Ala Gln His Tyr Gly Gln Cys Gly Gly Ile Gly Trp Thr Gly Pro
500 505 510
Thr Thr Cys Ala Ser Pro Tyr Thr Cys Gln Lys Leu Asn Asp Trp Tyr
515 520 525
Ser Gln Cys Leu
530
<210> 93
<211> 1705
<212> DNA
<213> 丝衣霉状篮状菌(Talaromyces byssochlamydoides)
<400> 93
atgtttcgac gggctctttt cctgtcctct tccgccttcc ttgctgtcaa agcccagcag 60
atcggcacgg tcagtccgga gaaccatccg cccctggcat gggagcagtg cactgcccct 120
gggagttgca cgactgtgaa tggtgcggtc gtccttgatg cgaactggcg ttgggtccac 180
aatgttgggg gatacaccaa ctgctacact ggcaatacct gggacaccac gtactgccct 240
gacgacgtga cctgcgcaga gaattgtgcg ctggatggcg cagattacga gggcacctac 300
ggcgtgacca cctcgggcag ctccctgaag ctcgatttcg tcaccgggtc taacgtcgga 360
tctcgtctct acctgttgga gaatgattcg acctatcaga tcttcaagct tctgaaccag 420
gaattcacct ttgacgtcga cgtttccaat cttccgtgcg gattaaacgg cgctctgtac 480
cttgttacca tggctgctga cggcggggtg tctcagtacc cgaataacaa ggccggcgca 540
gcgtatggaa ccggttattg cgattcccag tgtccaaggg acttgaagtt tatcgatggc 600
caggtatgta gagctgtaat cacccatgtt gtgaaatcac tctcctactg acatggtcga 660
tttataggcc aacgttgagg gctggcagcc gtcttcgaac aacgccaata caggtattgg 720
caaccatggc tcctgctgtg cggagatgga tatctgggaa gccaacagca tctccaatgc 780
ggtgactccg cacccatgcg acacacccgg ccagacaatg tgcgagggga acgactgtgg 840
tggcacgtat tccaccaatc gctatgcagg cacctgcgat cctgacggct gcgacttcaa 900
cccctaccgc atgggcaacc attctttcta cggccctggg gagattgtcg atactaccca 960
gcccttcact gtcgtgacac agttccttac cgatgatggc acggatactg gcactctcag 1020
cgagatcaaa cgcttctacg tccaaaacgg gaaagtcatt cctcagccga actccgacat 1080
tgccggcgtg actggcaact cgatcaccag cgagttttgc gatgcccaga agacggcttt 1140
cggcgacatt aacaactttg atacacacgg cggtctggcc agtatgggag ctgcgctgca 1200
gcagggtatg gttctggtga tgagtctgtg ggacggtagg tccttgggag acacccggac 1260
gttctatatc aaccagaact gccagaactg acgaattaaa acacttttag attacgcggc 1320
aaacatgctg tggttggaca gcatttatcc aacaaatgca tctgctagca ctcctggtgc 1380
tgctcgtgga acctgttcga cgagctccgg tgtcccatcg caagtcgagt cgcagagccc 1440
caacgcctac gtgacgtact ccaacattaa agttggacca atcaactcga ccttcaccac 1500
ttcgggctcg aaccctggag gcggaacgac cactactaca acgactcagc cgacaacaac 1560
aactaccaca gcaggcaacc ctggaggtac aggtgtggcc cagcactacg gacagtgtgg 1620
cggtatcgga tggacaggac ctactacttg tgcatcgcct tatacctgtc agaaattgaa 1680
cgactggtac tcgcagtgtt tgtaa 1705
<210> 94
<211> 521
<212> PRT
<213> 丝衣霉状篮状菌(Talaromyces byssochlamydoides)
<400> 94
Met Phe Arg Arg Ala Leu Phe Leu Ser Ser Ser Ala Phe Leu Ala Val
1 5 10 15
Lys Ala Gln Gln Ile Gly Thr Val Ser Pro Glu Asn His Pro Pro Leu
20 25 30
Ala Trp Glu Gln Cys Thr Ala Pro Gly Ser Cys Thr Thr Val Asn Gly
35 40 45
Ala Val Val Leu Asp Ala Asn Trp Arg Trp Val His Asn Val Gly Gly
50 55 60
Tyr Thr Asn Cys Tyr Thr Gly Asn Thr Trp Asp Thr Thr Tyr Cys Pro
65 70 75 80
Asp Asp Val Thr Cys Ala Glu Asn Cys Ala Leu Asp Gly Ala Asp Tyr
85 90 95
Glu Gly Thr Tyr Gly Val Thr Thr Ser Gly Ser Ser Leu Lys Leu Asp
100 105 110
Phe Val Thr Gly Ser Asn Val Gly Ser Arg Leu Tyr Leu Leu Glu Asn
115 120 125
Asp Ser Thr Tyr Gln Ile Phe Lys Leu Leu Asn Gln Glu Phe Thr Phe
130 135 140
Asp Val Asp Val Ser Asn Leu Pro Cys Gly Leu Asn Gly Ala Leu Tyr
145 150 155 160
Leu Val Thr Met Ala Ala Asp Gly Gly Val Ser Gln Tyr Pro Asn Asn
165 170 175
Lys Ala Gly Ala Ala Tyr Gly Thr Gly Tyr Cys Asp Ser Gln Cys Pro
180 185 190
Arg Asp Leu Lys Phe Ile Asp Gly Gln Ala Asn Val Glu Gly Trp Gln
195 200 205
Pro Ser Ser Asn Asn Ala Asn Thr Gly Ile Gly Asn His Gly Ser Cys
210 215 220
Cys Ala Glu Met Asp Ile Trp Glu Ala Asn Ser Ile Ser Asn Ala Val
225 230 235 240
Thr Pro His Pro Cys Asp Thr Pro Gly Gln Thr Met Cys Glu Gly Asn
245 250 255
Asp Cys Gly Gly Thr Tyr Ser Thr Asn Arg Tyr Ala Gly Thr Cys Asp
260 265 270
Pro Asp Gly Cys Asp Phe Asn Pro Tyr Arg Met Gly Asn His Ser Phe
275 280 285
Tyr Gly Pro Gly Glu Ile Val Asp Thr Thr Gln Pro Phe Thr Val Val
290 295 300
Thr Gln Phe Leu Thr Asp Asp Gly Thr Asp Thr Gly Thr Leu Ser Glu
305 310 315 320
Ile Lys Arg Phe Tyr Val Gln Asn Gly Lys Val Ile Pro Gln Pro Asn
325 330 335
Ser Asp Ile Ala Gly Val Thr Gly Asn Ser Ile Thr Ser Glu Phe Cys
340 345 350
Asp Ala Gln Lys Thr Ala Phe Gly Asp Ile Asn Asn Phe Asp Thr His
355 360 365
Gly Gly Leu Ala Ser Met Gly Ala Ala Leu Gln Gln Gly Met Val Leu
370 375 380
Val Met Ser Leu Trp Asp Asp Tyr Ala Ala Asn Met Leu Trp Leu Asp
385 390 395 400
Ser Ile Tyr Pro Thr Asn Ala Ser Ala Ser Thr Pro Gly Ala Ala Arg
405 410 415
Gly Thr Cys Ser Thr Ser Ser Gly Val Pro Ser Gln Val Glu Ser Gln
420 425 430
Ser Pro Asn Ala Tyr Val Thr Tyr Ser Asn Ile Lys Val Gly Pro Ile
435 440 445
Asn Ser Thr Phe Thr Thr Ser Gly Ser Asn Pro Gly Gly Gly Thr Thr
450 455 460
Thr Thr Thr Thr Thr Gln Pro Thr Thr Thr Thr Thr Thr Ala Gly Asn
465 470 475 480
Pro Gly Gly Thr Gly Val Ala Gln His Tyr Gly Gln Cys Gly Gly Ile
485 490 495
Gly Trp Thr Gly Pro Thr Thr Cys Ala Ser Pro Tyr Thr Cys Gln Lys
500 505 510
Leu Asn Asp Trp Tyr Ser Gln Cys Leu
515 520
<210> 95
<211> 43
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 95
gtacaggtgt ggcccagcac tggggacagt gtggcggtat cgg 43
<210> 96
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 96
gtgctgggcc acacctgtac ctccagggtt g 31
<210> 97
<211> 49
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 97
atacctgtca gaaattgaac gactggtact cgcagtgttt gtaagcttc 49
<210> 98
<211> 32
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 98
gtcgttcaat ttctgacagg tataaggcga tg 32
<210> 99
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 99
cctcagccga actccgacat tgc 23
<210> 100
<211> 23
<212> DNA
<213> 人工序列
<220>
<223> 人工DNA引物
<400> 100
gcaatgtcgg agttcggctg agg 23

Claims (25)

1.一种在对应于SEQ ID NO:2的位置483、491、509或510的一个或多个(例如,若干个)位置处包括取代的纤维二糖水解酶变体,其中该变体具有纤维二糖水解酶活性。
2.如权利要求1所述的变体,该变体是选自以下的亲本纤维二糖水解酶的变体:(a)与SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:10、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:22、SEQ ID NO:26、SEQ ID NO:42、SEQ ID NO:44或SEQ ID NO:78的成熟多肽具有至少60%序列一致性的多肽;(b)由在至少低严格条件下与以下杂交的多核苷酸编码的多肽:(i)SEQID NO:1、SEQ ID NO:5、SEQ ID NO:9、SEQ ID NO:13、SEQ ID NO:17、SEQ ID NO:21、SEQ IDNO:25、SEQ ID NO:41、SEQ ID NO:43或SEQ ID NO:77的成熟多肽编码序列,(ii)其基因组DNA或cDNA序列,或(iii)(i)或(ii)的全长互补体;(c)由与SEQ ID NO:1、SEQ ID NO:5、SEQID NO:9、SEQ ID NO:13、SEQ ID NO:17、SEQ ID NO:21、SEQ ID NO:25、SEQ ID NO:41、SEQID NO:43或SEQ ID NO:77的成熟多肽编码序列具有至少60%序列一致性的多核苷酸编码的多肽;以及(d)(a)、(b)或(c)的一个片段,该片段具有纤维二糖水解酶活性。
3.如权利要求1或2所述的变体,该变体与SEQ ID NO:2、SEQ ID NO:6、SEQ ID NO:10、SEQ ID NO:14、SEQ ID NO:18、SEQ ID NO:22、SEQ ID NO:26、SEQ ID NO:42、SEQ ID NO:44或SEQ ID NO:78的成熟多肽具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%,但小于100%序列一致性。
4.如权利要求1-3中任一项所述的变体,该变体在对应于位置483的位置处包括一个取代,例如用Tyr、Phe或Trp的取代(例如Y483W)。
5.如权利要求1-4中任一项所述的变体,该变体在对应于位置491的位置处包括一个取代,例如用Tyr、Phe或Trp的取代(例如Y491W)。
6.如权利要求1-5中任一项所述的变体,该变体在对应于位置509的位置处包括一个取代,例如取代是用Tyr、Phe或Trp进行的(例如Y509W)。
7.如权利要求1-6中任一项所述的变体,该变体在对应于位置510的位置处包括一个取代,例如取代是用Tyr、Phe或Trp进行的(例如Y510W)。
8.如权利要求1-7中任一项所述的变体,该变体包括以下项或者由以下项组成:SEQ IDNO:90或SEQ ID NO:92,或其成熟多肽序列。
9.一种具有纤维素分解活性的杂合多肽,该杂合多肽包括:
(a)在包括纤维素分解酶的异源催化结构域的杂合多肽的N-末端处的片段;和
(b)在包括碳水化合物结合模块(CBM)变体的第一多肽片段的C-末端处的片段,
其中该CBM变体在对应于SEQ ID NO:4的位置5、13、31或32的一个或多个(例如,若干个)位置处包括取代。
10.如权利要求9所述的杂合多肽,其中该CBM变体是选自以下的亲本碳水化合物结合模块的变体:(a)与SEQ ID NO:4、SEQ ID NO:8、SEQ ID NO:12、SEQ ID NO:16、SEQ ID NO:20、SEQ ID NO:24或SEQ ID NO:28的碳水化合物结合模块具有至少60%序列一致性的碳水化合物结合模块;(b)由在至少低严格条件下与SEQ ID NO:3、SEQ ID NO:7、SEQ ID NO:11、SEQ ID NO:15、SEQ ID NO:19、SEQ ID NO:23或SEQ ID NO:27的碳水化合物结合模块编码序列或其全长互补体杂交的多核苷酸编码的碳水化合物结合模块;(c)由与SEQ ID NO:3、SEQ ID NO:7、SEQ ID NO:11、SEQ ID NO:15、SEQ ID NO:19、SEQ ID NO:23或SEQ ID NO:27的碳水化合物结合模块编码序列具有至少60%序列一致性的多核苷酸编码的碳水化合物结合模块。
11.如权利要求9或10所述的杂合多肽,其中该CBM变体与SEQ ID NO:4、SEQ ID NO:8、SEQ ID NO:12、SEQ ID NO:16、SEQ ID NO:20、SEQ ID NO:24或SEQ ID NO:28具有至少60%,例如至少65%、至少70%、至少75%、至少80%、至少81%、至少82%、至少83%、至少84%、至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或至少99%,但小于100%序列一致性。
12.如权利要求9-11中任一项所述的杂合多肽,其中该CBM变体包括在对应于SEQ IDNO:4的位置5的位置处的取代,例如用Tyr、Phe或Trp的取代(例如Y5W)。
13.如权利要求9-12中任一项所述的杂合多肽,其中该CBM变体包括在对应于SEQ IDNO:4的位置13的位置处的取代,例如用Tyr、Phe或Trp的取代(例如Y13W)。
14.如权利要求9-13中任一项所述的杂合多肽,其中该CBM变体包括在对应于SEQ IDNO:4的位置31的位置处的取代,例如用Tyr、Phe或Trp的取代(例如Y31W)。
15.如权利要求9-14中任一项所述的杂合多肽,其中该CBM变体包括在对应于SEQ IDNO:4的位置32的位置处的取代,例如用Tyr、Phe或Trp的取代(例如Y32W)。
16.如权利要求9-15中任一项所述的杂合多肽,该杂合多肽包括以下项或由以下项组成:SEQ ID NO:61、SEQ ID NO:63、SEQ ID NO:73、或SEQ ID NO:94,或其成熟多肽。
17.一种组合物(例如全培养液配制品),其包括如权利要求1-8中任一项所述的变体或如权利要求9-16中任一项所述的杂合多肽。
18.一种分离的多核苷酸,其编码如权利要求1-8中任一项所述的变体或如权利要求9-16中任一项所述的杂合多肽。
19.一种核酸构建体或表达载体,其包含如权利要求18所述的多核苷酸。
20.一种宿主细胞,其包含如权利要求18所述的多核苷酸,或如权利要求19所述的核酸构建体或表达载体。
21.一种产生纤维二糖水解酶变体或杂合多肽的方法,该方法包括在适合于该纤维二糖水解酶变体或杂合多肽表达的条件下培养如权利要求20所述的宿主细胞。
22.一种用如权利要求18所述的多核苷酸转化的转基因植物、植物部分或植物细胞。
23.一种产生纤维二糖水解酶变体或杂合多肽的方法,该方法包括:在有助于产生该纤维二糖水解酶变体或杂合多肽的条件下培养如权利要求22所述的转基因植物、植物部分或植物细胞。
24.一种用于降解或转化纤维素材料的方法,所述方法包括:用酶组合物处理该纤维素材料,其中该组合物包括如权利要求1-8中任一项的变体或如权利要求9-16中任一项所述的杂合多肽。
25.一种用于产生发酵产物的方法,所述方法包括:(a)用酶组合物糖化纤维素材料,其中该组合物包括如权利要求1-8中任一项的变体或如权利要求9-16中任一项所述的杂合多肽;以及(b)用一种或多种发酵微生物发酵这一糖化的纤维素材料,以产生该发酵产物。
CN201580047693.2A 2014-09-05 2015-09-04 碳水化合物结合模块变体以及编码它们的多核苷酸 Pending CN107002056A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201462046344P 2014-09-05 2014-09-05
US62/046,344 2014-09-05
PCT/US2015/048620 WO2016037096A1 (en) 2014-09-05 2015-09-04 Carbohydrate binding module variants and polynucleotides encoding same

Publications (1)

Publication Number Publication Date
CN107002056A true CN107002056A (zh) 2017-08-01

Family

ID=54151398

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580047693.2A Pending CN107002056A (zh) 2014-09-05 2015-09-04 碳水化合物结合模块变体以及编码它们的多核苷酸

Country Status (5)

Country Link
US (2) US11390898B2 (zh)
EP (2) EP3189137A1 (zh)
CN (1) CN107002056A (zh)
BR (2) BR112017004251A2 (zh)
WO (1) WO2016037096A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109337888A (zh) * 2018-11-12 2019-02-15 南开大学 纤维二糖水解酶突变体及其生产方法和应用
CN111417725A (zh) * 2017-10-02 2020-07-14 诺维信公司 具有甘露聚糖酶活性的多肽和编码它们的多核苷酸

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022251056A1 (en) 2021-05-27 2022-12-01 Novozymes A/S Transcriptional regulators and polynucleotides encoding the same

Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2011117728A2 (en) * 2010-03-26 2011-09-29 IFP Energies Nouvelles Novel cbh1-eg1 fusion proteins and use thereof
CN102388134A (zh) * 2009-01-28 2012-03-21 诺维信股份有限公司 具有β-葡糖苷酶活性的多肽和编码该多肽的多核苷酸
CN102482652A (zh) * 2009-06-02 2012-05-30 诺维信股份有限公司 具有纤维二糖水解酶活性的多肽和编码该多肽的多核苷酸
WO2012078656A1 (en) * 2010-12-06 2012-06-14 Novozymes North America, Inc. Methods of hydrolyzing oligomers in hemicellulosic liquor
CN102597228A (zh) * 2009-10-23 2012-07-18 诺维信股份有限公司 纤维二糖水解酶变体及编码其的多核苷酸
WO2012135719A1 (en) * 2011-03-31 2012-10-04 Novozymes, Inc. Cellulose binding domain variants and polynucleotides encoding same
CN102918151A (zh) * 2010-03-31 2013-02-06 诺维信股份有限公司 纤维二糖水解酶变体及编码其的多核苷酸
WO2013052831A2 (en) * 2011-10-06 2013-04-11 Bp Corporation North America Inc. Variant cbh i polypeptides with reduced product inhibition
CN103502444A (zh) * 2011-03-17 2014-01-08 丹尼斯科美国公司 糖基水解酶及其在生物质水解方面的用途
CN103620028A (zh) * 2011-01-26 2014-03-05 诺维信公司 具有纤维二糖水解酶活性的多肽和编码该多肽的多核苷酸
CN103842515A (zh) * 2011-03-17 2014-06-04 丹尼斯科美国公司 降低糖化过程的粘度的方法
CN103998605A (zh) * 2011-12-20 2014-08-20 诺维信股份有限公司 纤维二糖水解酶变体和编码它们的多核苷酸

Family Cites Families (136)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DK122686D0 (da) 1986-03-17 1986-03-17 Novo Industri As Fremstilling af proteiner
US5989870A (en) 1986-04-30 1999-11-23 Rohm Enzyme Finland Oy Method for cloning active promoters
US5648263A (en) 1988-03-24 1997-07-15 Novo Nordisk A/S Methods for reducing the harshness of a cotton-containing fabric
US5223409A (en) 1988-09-02 1993-06-29 Protein Engineering Corp. Directed evolution of novel binding proteins
NZ234059A (en) 1989-06-13 1992-05-26 Genencor Int Method of killing cells by acid treatment; composition therefor
US5536655A (en) 1989-09-26 1996-07-16 Midwest Research Institute Gene coding for the E1 endoglucanase
US5275944A (en) 1989-09-26 1994-01-04 Midwest Research Institute Thermostable purified endoglucanas from acidothermus cellulolyticus ATCC 43068
US5110735A (en) 1989-09-26 1992-05-05 Midwest Research Institute Thermostable purified endoglucanase from thermophilic bacterium acidothermus cellulolyticus
NZ237549A (en) 1990-03-23 1993-06-25 Gist Brocades Nv Production of enhanced levels of enzymes in the seeds of transgenic plants and the use of these seeds
WO1991017243A1 (en) 1990-05-09 1991-11-14 Novo Nordisk A/S A cellulase preparation comprising an endoglucanase enzyme
DK115890D0 (da) 1990-05-09 1990-05-09 Novo Nordisk As Enzym
US6395966B1 (en) 1990-08-09 2002-05-28 Dekalb Genetics Corp. Fertile transgenic maize plants containing a gene encoding the pat protein
IL99552A0 (en) 1990-09-28 1992-08-18 Ixsys Inc Compositions containing procaryotic cells,a kit for the preparation of vectors useful for the coexpression of two or more dna sequences and methods for the use thereof
DE69435154D1 (de) 1993-03-10 2008-12-04 Novozymes As Enzyme mit Xylanaseaktivität aus Aspergillus aculeatus
FR2704860B1 (fr) 1993-05-05 1995-07-13 Pasteur Institut Sequences de nucleotides du locus cryiiia pour le controle de l'expression de sequences d'adn dans un hote cellulaire.
DE4343591A1 (de) 1993-12-21 1995-06-22 Evotec Biosystems Gmbh Verfahren zum evolutiven Design und Synthese funktionaler Polymere auf der Basis von Formenelementen und Formencodes
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
BR9507817A (pt) 1994-06-03 1997-09-16 Novo Nordisk Biotech Inc Construção de dna enzima vetor recombinante célula hospedeira recombinante lacase de ascomicete ou deuteromicete processos para obter uma enzima de lacase para melhorar o rendimento de enzima recombinante para polimerizar um substrato de lignina ou lignossulfato em soluç o para despolimerizar in situ a pasta kraft para oxidar corantes ou precursores de corantes para pintar cabelo e para polimerizar ou oxidar um composto fenólico ou anilina composição de corante e recipiente contendo a mesma
WO1996000787A1 (en) 1994-06-30 1996-01-11 Novo Nordisk Biotech, Inc. Non-toxic, non-toxigenic, non-pathogenic fusarium expression system and promoters and terminators for use therein
US5646025A (en) 1995-05-05 1997-07-08 Novo Nordisk A/S Scytalidium catalase gene
US20030044956A1 (en) 1995-08-23 2003-03-06 Short Jay M. Enzymes having carboxymethyl cellulase activity and methods of use thereof
US6451063B1 (en) 1996-09-25 2002-09-17 Genencor International, Inc. Cellulase for use in industrial processes
US6017870A (en) 1996-10-09 2000-01-25 Genencor International, Inc. Purified cellulase and method of producing
US7883872B2 (en) 1996-10-10 2011-02-08 Dyadic International (Usa), Inc. Construction of highly efficient cellulase compositions for enzymatic hydrolysis of cellulose
US5811381A (en) 1996-10-10 1998-09-22 Mark A. Emalfarb Cellulase compositions and methods of use
AU739445B2 (en) 1997-07-31 2001-10-11 Dsm Ip Assets B.V. Cellulose degrading enzymes of aspergillus
US5871550A (en) 1997-08-26 1999-02-16 Genencor International, Inc. Mutant Thermonospora spp. cellulase
TW552268B (en) * 1997-10-08 2003-09-11 Yun-Ru Chen Chimeric proteins with a cellulose binding domain (CBD)
KR20010032218A (ko) 1997-11-19 2001-04-16 마가렛 에이.혼 악티노미케테스에 의하여 제조되는 셀룰라제 및 이를제조하는 방법
DE69836227T2 (de) 1997-12-16 2007-08-23 Genencor International, Inc., Palo Alto Verfahren zur herstellung egiii-ähnlicher enzyme
US5955310A (en) 1998-02-26 1999-09-21 Novo Nordisk Biotech, Inc. Methods for producing a polypeptide in a bacillus cell
DE69932345T2 (de) 1998-10-26 2007-07-19 Novozymes A/S Erstellung und durchmusterung von interessierenden dna-banken in zellen von filamentösen pilzen
CN100529096C (zh) 1998-12-23 2009-08-19 诺维信公司 在曲霉属突变细胞中产生多肽的方法
WO2000056900A2 (en) 1999-03-22 2000-09-28 Novo Nordisk Biotech, Inc. Promoter sequences derived from fusarium venenatum and uses thereof
CA2372594A1 (en) 1999-05-19 2000-11-23 Midwest Research Institute E1 endoglucanase variants y245g, y82r and w42r
US8637293B2 (en) 1999-07-13 2014-01-28 Alliance For Sustainable Energy, Llc Cellobiohydrolase I enzymes
US7375197B2 (en) 2002-01-14 2008-05-20 Midwest Research Institute Cellobiohydrolase I gene and improved variants
ES2166316B1 (es) 2000-02-24 2003-02-16 Ct Investig Energeticas Ciemat Procedimiento de produccion de etanol a partir de biomasa lignocelulosica utilizando una nueva levadura termotolerante.
AU2002223504A1 (en) 2000-11-17 2002-05-27 Novozymes A/S Heterologous expression of taxanes
US7151204B2 (en) 2001-01-09 2006-12-19 Monsanto Technology Llc Maize chloroplast aldolase promoter compositions and methods for use thereof
AU2002316785A1 (en) 2001-05-18 2002-12-03 Novozymes A/S Polypeptides having cellobiase activity and polynucleotides encoding same
EP2295544B1 (en) * 2001-06-26 2016-06-22 Novozymes A/S Polypeptides having cellobiohydrolase I activity and polynucleotides encoding same
CA2455013A1 (en) 2001-07-27 2003-02-13 Francesca Storici Systems for in vivo site-directed mutagenesis using oligonucleotides
US6982159B2 (en) 2001-09-21 2006-01-03 Genencor International, Inc. Trichoderma β-glucosidase
US7045331B2 (en) 2001-12-18 2006-05-16 Genencor International, Inc. EGVII endoglucanase and nucleic acids encoding the same
US7005289B2 (en) 2001-12-18 2006-02-28 Genencor International, Inc. BGL5 β-glucosidase and nucleic acids encoding the same
US7049125B2 (en) 2001-12-18 2006-05-23 Genencor International, Inc. EGVIII endoglucanase and nucleic acids encoding the same
US7056721B2 (en) 2001-12-18 2006-06-06 Genencor International, Inc. EGVI endoglucanase and nucleic acids encoding the same
US7045332B2 (en) 2001-12-18 2006-05-16 Genencor International, Inc. BGL4 β-glucosidase and nucleic acids encoding the same
BR0306740A (pt) 2002-01-23 2004-12-28 Royal Nedalco B V Célula hospedeira transformada com um construto de ácido nucléico, molécula de ácido nucleico isolada, e, processos para a produção de etanol, e de um produto de fermentação
AU2003206683A1 (en) 2002-02-19 2003-09-09 Novozymes A/S Expression cloning methods in filamentous fungi
EP2322607B1 (en) 2002-08-16 2015-09-16 Danisco US Inc. Novel variant Hyprocrea jecorina CBH1 cellulases with increase thermal stability comprising substitution or deletion at position S113
EP1886582B1 (en) 2002-10-11 2015-01-14 Novozymes A/S Method of preparing a heat-treated product
JP4744879B2 (ja) 2002-11-07 2011-08-10 ジェネンコー・インターナショナル・インク BGL6β−グルコシダーゼ及びそれをエンコードする核酸
US7407788B2 (en) 2002-11-21 2008-08-05 Danisco A/S, Genencor Division BGL7 beta-glucosidase and nucleic acids encoding the same
EP2298876A1 (en) 2003-03-21 2011-03-23 Genencor International, Inc. Novel cbh1 homologs and variant cbh1 cellulases
JP5427342B2 (ja) 2003-04-01 2014-02-26 ジェネンコー・インターナショナル・インク 変異体フミコーラ・グリセアcbh1.1
EP1862539B1 (en) 2003-05-29 2012-01-25 Danisco US Inc. Novel trichoderma genes
DK2377931T3 (da) 2003-08-25 2013-07-08 Novozymes Inc Varianter af glycosidhydrolase
EP1682656B1 (en) 2003-10-28 2013-09-18 Novozymes Inc. Polypeptides having beta-glucosidase activity and polynucleotides encoding same
US8846340B2 (en) 2003-10-30 2014-09-30 Novozymes A/S Carbohydrate-binding modules of a new family
ES2391826T3 (es) 2004-01-30 2012-11-30 Novozymes, Inc. Polipéptidos con actividad de mejora celulolítica y polinucleótidos que los codifican
EP1733033B1 (en) 2004-02-06 2012-06-20 Novozymes Inc. Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
CN101389645B (zh) 2004-02-12 2016-08-03 诺维信股份有限公司 具有木聚糖酶活性的多肽和编码它的多核苷酸
US8097445B2 (en) 2004-03-25 2012-01-17 Danisco Us Inc. Exo-endo cellulase fusion protein
WO2005093050A2 (en) 2004-03-25 2005-10-06 Genencor International, Inc. Cellulase fusion protein and heterologous cellulase fusion construct encoding the same
DK176540B1 (da) 2004-09-24 2008-07-21 Cambi Bioethanol Aps Fremgangsmåde til behandling af biomasse og organisk affald med henblik på at udvinde önskede biologisk baserede produkter
CA2592550C (en) 2004-12-30 2015-05-19 Genencor International, Inc. Novel variant hypocrea jecorina cbh2 cellulases
ES2358243T5 (es) 2005-01-06 2014-06-09 Novozymes, Inc. Polipéptidos con actividad celobiohidrolasa y polinucleótidos que los codifican
WO2006110891A2 (en) 2005-04-12 2006-10-19 E. I. Du Pont De Nemours And Company Treatment of biomass to obtain a target chemical
AR053066A1 (es) 2005-04-26 2007-04-18 Novozymes As Arabinofuranosidasas
US7741093B2 (en) 2005-04-29 2010-06-22 Ab Enzymes Oy Cellulases and their uses
DK1874927T3 (da) 2005-04-29 2014-04-22 Ab Enzymes Oy Forbedrede cellulaser
US8097772B2 (en) 2005-08-04 2012-01-17 Novozymes, Inc. Polypeptides having beta-glucosidase activity and polynucleotides encoding same
AU2006337184B2 (en) 2005-09-30 2012-08-16 Novozymes, Inc. Methods for enhancing the degradation or conversion of cellulosic material
FI120045B (fi) 2005-12-22 2009-06-15 Roal Oy Selluloosamateriaalin käsittely ja siinä käyttökelpoiset entsyymit
MX2008008225A (es) 2005-12-22 2008-10-01 Ab Enzymes Oy Nuevas enzimas.
PL2007884T3 (pl) 2006-04-13 2012-08-31 Ab Enzymes Oy Białka fuzyjne celulazy i ich zastosowanie
WO2008008793A2 (en) 2006-07-10 2008-01-17 Dyadic International Inc. Methods and compositions for degradation of lignocellulosic material
BRPI0714870A2 (pt) 2006-07-21 2013-05-28 Novozymes Inc mÉtodo para produzir um polipeptÍdeo secretado tendo atividade biolàgica, proteÍna de fusço isolada, polinucleotÍdeo isolado, construÇço de proteÍna de fusço, vetor de expressço, cÉlula hospedeira féngica, mÉtodos para degradar ou conventer um material celulàsico e para produzir uma substÂncia
US8044264B2 (en) 2007-05-31 2011-10-25 Novozymes, Inc. Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
CA2689910A1 (en) 2007-05-31 2008-12-11 Novozymes, Inc. Compositions for degrading cellulosic material
US8034996B2 (en) 2007-09-28 2011-10-11 Novozymes A/S Polypeptides having acetylxylan esterase activity and polynucleotides encoding same
CN101874109B (zh) 2007-09-28 2013-07-10 诺维信公司 具有纤维二糖水解酶活性的多肽和编码该多肽的多核苷酸
BRPI0820552A2 (pt) 2007-11-27 2014-10-14 Novozymes As Polipetídeo isolado, polinucleotídeo isolado, construção de ácido nucléico, vetor de expressão recombinante, célula hospedeira recombinante, métodos para produzir o polipeptídeo, para produzir uma proteína, e para degradar ou converter um material de biomassa, planta, parte vegetal ou célula vegetal transgêncica, método, composição, e. uso do polipeptídio.
CA2707017A1 (en) 2007-11-30 2009-06-11 Novozymes A/S Polypeptides having arabinofuranosidase activity and polynucleotides encoding same
US7851193B2 (en) 2007-12-05 2010-12-14 Novozymes A/S Polypeptides having xylanase activity and polynucleotides encoding same
ES2490608T3 (es) 2007-12-06 2014-09-04 Novozymes A/S Polipéptidos con actividad de esterasa de acetilxilano y polinucleótidos que codifican los mismos
EP2225370A1 (en) 2007-12-07 2010-09-08 Novozymes A/S Polypeptides having feruloyl esterase activity and polynucleotides encoding same
WO2009085868A1 (en) 2007-12-19 2009-07-09 Novozymes A/S Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
CN101970471A (zh) 2007-12-19 2011-02-09 诺维信公司 具有纤维素分解增强活性的多肽和编码该多肽的多核苷酸
CA2709490A1 (en) 2007-12-19 2009-07-09 Novozymes A/S Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
CN101952304A (zh) 2007-12-19 2011-01-19 诺维信公司 具有纤维素分解增强活性的多肽和编码该多肽的多核苷酸
WO2009127729A1 (en) 2008-04-17 2009-10-22 Novozymes A/S Polypeptides having ferulic acid esterase activity and polynucleotides encoding same
DK2310497T3 (da) 2008-07-29 2016-07-25 Novozymes As Polypeptider med alfa-glucuronidaseaktivitet og polynukleotider, der koder for dem
US8071335B2 (en) 2008-07-31 2011-12-06 Novozymes, Inc. Polypeptides having acetylxylan esterase activity and polynucleotides encoding same
JP2012504390A (ja) 2008-09-30 2012-02-23 ノボザイムス,インコーポレイティド 糸状菌細胞におけるポジティブ及びネガティブ選択遺伝子の使用方法
EP2356136A1 (en) 2008-11-10 2011-08-17 Novozymes Inc. Polypeptides having feruloyl esterase activity and polynucleotides encoding same
US8805427B2 (en) 2008-11-14 2014-08-12 Microsoft Corporation Channel reuse with cognitive low interference signals
CN108315272A (zh) 2008-11-21 2018-07-24 拉勒曼德匈牙利流动性管理有限责任公司 用于使用纤维素进行同时糖化和发酵的表达纤维素酶的酵母
WO2010065448A1 (en) 2008-12-04 2010-06-10 Novozymes, Inc. Polypeptides having feruloyl esterase activity and polynucleotides encoding same
CA2745760A1 (en) 2008-12-04 2010-06-10 Novozymes A/S Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
RU2560424C2 (ru) 2009-02-20 2015-08-20 ДАНИСКО ЮЭс ИНК. Способ получения состава ферментационного бульона
CA2750920A1 (en) 2009-02-27 2010-09-02 Iogen Energy Corporation Novel lignin-resistant cellulase enzymes
BRPI1013483B1 (pt) 2009-03-24 2019-04-24 Novozymes A/S Construção de ácido nucleico, vetor de expressão recombinante, célula hospedeira microbiana transgênica, métodos para produzir o polipeptídeo, para degradar um xilano acetilado e para produzir um produto de fermentação, e, composição
EP2424995A1 (en) 2009-04-30 2012-03-07 Novozymes Inc. Polypeptides having xylanase activity and polynucleotides encoding same
CA2763031A1 (en) 2009-05-29 2010-12-02 Novozymes, Inc. Methods for enhancing the degradation or conversion of cellulosic material
EP2451957B1 (en) 2009-07-07 2017-11-15 Novozymes Inc. Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
DK2478096T3 (en) 2009-09-17 2017-08-28 Novozymes Inc POLYPEPTIDES WITH CELLULOLYTIC IMPROVING ACTIVITY AND POLYNUCLEOTIDES CODING THEM
EP2478095A1 (en) 2009-09-18 2012-07-25 Novozymes Inc. Polypeptides having beta-glucosidase activity and polynucleotides encoding same
BR112012006982B1 (pt) 2009-09-29 2021-12-21 Novozymes, Inc. Célula hospedeira microbiana transgênica, métodos para produzir um polipeptídeo, para produzir um mutante de uma célula precursora, para inibir a expressão de um polipeptídeo, para produzir uma proteína, para degradar ou converter um material celulósico, para produzir um produto de fermentação, para fermentar um material celulósico, construções de ácido nucleico, vetor de expressão, polipeptídeo isolado tendo atividade intensificadora celulolítica, polinucleotídeo isolado que codifica o mesmo, e, composição detergente
WO2011041405A1 (en) 2009-09-29 2011-04-07 Novozymes, Inc. Polypeptides having xylanase activity and polynucleotides encoding same
EP2483296B1 (en) 2009-09-30 2015-07-29 Novozymes Inc. Polypeptides derived from thermoascus crustaceus having cellulolytic enhancing activity and polynucleotides encoding same
WO2011039319A1 (en) 2009-09-30 2011-04-07 Novozymes A/S Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
WO2011059740A1 (en) 2009-10-29 2011-05-19 Novozymes, Inc. Polypeptides having cellobiohydrolase activity and polynucleotides encoding same
CA2780179A1 (en) 2009-11-06 2011-05-12 Novozymes, Inc. Compositions for saccharification of cellulosic material
EP2496692B1 (en) 2009-11-06 2016-03-16 Novozymes, Inc. Polypeptides having xylanase activity and polynucleotides encoding same
DK2357227T3 (en) 2010-02-11 2015-09-14 Süd Chemie Ip Gmbh & Co Kg Optimized cellulase enzymes
EP2534246A4 (en) 2010-02-11 2013-07-10 Iogen Energy Corp MODULES FOR BINDING CARBON WITH LIGNINED REDUCED BINDING
EP2603594B1 (en) 2010-08-12 2018-04-25 Novozymes, Inc. Compositions comprising a polypeptide having cellulolytic enhancing activity and a bicyclic compound and uses thereof
BR112013004256A2 (pt) 2010-10-01 2016-08-02 Novozymes Inc variante de beta-glicosidase,polinucleotídeo isolado, célula hospedeira recombinante, métodos para produzir uma variante, para degradar um material celulósico, para produzir um produto de fermentação, e para fermentar um material celulósico, e, formulação de caldo total ou composição de cultura de células.
BR112013008048A2 (pt) 2010-10-06 2016-06-14 Bp Corp North America Inc polipeptídeos, composição, caldo de fermentação, métodos para sacrificar biomassa e para produzir etanol, ácido nucleico, vetor, células recombinante e hospedeira e métodos para produzir polipeptídeo e para gerar polipeptídeo de cbh i variante tolerante a produto e ácido nucleíco
WO2012103288A1 (en) 2011-01-26 2012-08-02 Novozymes A/S Polypeptides having cellobiohydrolase activity and polynucleotides encoding same
WO2012104239A1 (en) 2011-01-31 2012-08-09 Dsm Ip Assets B.V. Mutant cellobiohydrolase
EP3339442B1 (en) 2011-03-09 2022-05-11 Novozymes A/S Methods of increasing the cellulolytic enhancing activity of a polypeptide
US9409958B2 (en) * 2011-03-10 2016-08-09 Novozymes, Inc. Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
WO2012140752A1 (ja) 2011-04-13 2012-10-18 トヨタ自動車株式会社 車載周辺物認識装置及びこれを用いる運転支援装置
WO2013028928A1 (en) 2011-08-24 2013-02-28 Novozymes, Inc. Cellulolytic enzyme compositions and uses thereof
US9279163B2 (en) 2011-08-31 2016-03-08 Iogen Energy Corporation Cellobiohydrolase enzymes
BR112014015242B1 (pt) 2011-12-22 2023-01-31 Novozymes, Inc Polipeptídeo híbrido isolado, polinucleotídeo isolado,célula hospedeira, método de produção de um polipeptídeo híbrido, processos para degradação ou conversão de um material celulósico, para produção de um produto de fermentação, de fermentação de um material celulósico, formulação ou composição de cultura de células microbianas de caldo completo, e,célula hospedeira microbiana transgênica
WO2013138357A1 (en) 2012-03-12 2013-09-19 Codexis, Inc. Cbh1a variants
EP2912168A1 (en) 2012-10-23 2015-09-02 Novozymes A/S Cellobiohydrolase variants and polynucleotides encoding same
MX2015007234A (es) * 2012-12-12 2015-10-29 Danisco Us Inc Variantes de celobiohidrolasas.
WO2014093282A1 (en) 2012-12-12 2014-06-19 Danisco Us Inc. Variants of cellobiohydrolases
BR112015013646A2 (pt) 2012-12-12 2017-11-14 Danisco Us Inc variante isolada de uma enzima celobio-hidrolase (cbh) parental, polinucleotídeo isolado, vetor, célula hospedeira, composição detergente, aditivo alimentar, método para hidrolisar um substrato celulósico, sobrenadante de cultura celular, métodos de produção de um polipeptídeo cbh variante e sobrenadante de cultura celular
EP2964760B1 (en) 2013-03-08 2021-05-12 Novozymes A/S Cellobiohydrolase variants and polynucleotides encoding same

Patent Citations (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102388134A (zh) * 2009-01-28 2012-03-21 诺维信股份有限公司 具有β-葡糖苷酶活性的多肽和编码该多肽的多核苷酸
CN102482652A (zh) * 2009-06-02 2012-05-30 诺维信股份有限公司 具有纤维二糖水解酶活性的多肽和编码该多肽的多核苷酸
CN102597228A (zh) * 2009-10-23 2012-07-18 诺维信股份有限公司 纤维二糖水解酶变体及编码其的多核苷酸
WO2011117728A2 (en) * 2010-03-26 2011-09-29 IFP Energies Nouvelles Novel cbh1-eg1 fusion proteins and use thereof
CN102918151A (zh) * 2010-03-31 2013-02-06 诺维信股份有限公司 纤维二糖水解酶变体及编码其的多核苷酸
WO2012078656A1 (en) * 2010-12-06 2012-06-14 Novozymes North America, Inc. Methods of hydrolyzing oligomers in hemicellulosic liquor
CN103620028A (zh) * 2011-01-26 2014-03-05 诺维信公司 具有纤维二糖水解酶活性的多肽和编码该多肽的多核苷酸
CN103502444A (zh) * 2011-03-17 2014-01-08 丹尼斯科美国公司 糖基水解酶及其在生物质水解方面的用途
CN103842515A (zh) * 2011-03-17 2014-06-04 丹尼斯科美国公司 降低糖化过程的粘度的方法
WO2012135719A1 (en) * 2011-03-31 2012-10-04 Novozymes, Inc. Cellulose binding domain variants and polynucleotides encoding same
WO2013052831A2 (en) * 2011-10-06 2013-04-11 Bp Corporation North America Inc. Variant cbh i polypeptides with reduced product inhibition
CN103998605A (zh) * 2011-12-20 2014-08-20 诺维信股份有限公司 纤维二糖水解酶变体和编码它们的多核苷酸

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111417725A (zh) * 2017-10-02 2020-07-14 诺维信公司 具有甘露聚糖酶活性的多肽和编码它们的多核苷酸
US11746310B2 (en) 2017-10-02 2023-09-05 Novozymes A/S Polypeptides having mannanase activity and polynucleotides encoding same
CN109337888A (zh) * 2018-11-12 2019-02-15 南开大学 纤维二糖水解酶突变体及其生产方法和应用
CN109337888B (zh) * 2018-11-12 2021-08-17 南开大学 纤维二糖水解酶突变体及其生产方法和应用

Also Published As

Publication number Publication date
US20220364133A1 (en) 2022-11-17
WO2016037096A1 (en) 2016-03-10
BR112017004251A2 (pt) 2017-12-12
BR122023022768A2 (pt) 2023-12-12
EP3594335B1 (en) 2024-05-01
EP3594335C0 (en) 2024-05-01
EP3189137A1 (en) 2017-07-12
US11390898B2 (en) 2022-07-19
EP3594335A1 (en) 2020-01-15
US20170283843A1 (en) 2017-10-05

Similar Documents

Publication Publication Date Title
CN105886485B (zh) β-葡糖苷酶变体及其编码多核苷酸
CN103620028B (zh) 具有纤维二糖水解酶活性的多肽和编码该多肽的多核苷酸
CN103517986B (zh) 具有纤维二糖水解酶活性的多肽及编码该多肽的多核苷酸
CN102639697B (zh) 具有木聚糖酶活性的多肽和编码该多肽的多核苷酸
CN103958674B (zh) 具有木聚糖酶活性的多肽及其编码多核苷酸
CN103517985B (zh) 具有纤维二糖水解酶活性的多肽及编码该多肽的多核苷酸
CN103237891B (zh) 具有纤维素分解增强活性的多肽变体及其编码多核苷酸
CN103282489B (zh) 具有纤维素分解增强活性的多肽变体及其编码多核苷酸
CN105164254B (zh) 纤维二糖水解酶变体和编码它们的多核苷酸
CN107338233A (zh) 具有木聚糖酶活性的多肽和编码该多肽的多核苷酸
CN103608461A (zh) 增加多肽的纤维素分解增强活性的方法
CN103703125B (zh) 具有内切葡聚糖酶活性的多肽及其编码多核苷酸
CN103958672A (zh) Gh61多肽变体以及编码所述变体的多核苷酸
CN103998605A (zh) 纤维二糖水解酶变体和编码它们的多核苷酸
CN104755617B (zh) 具有纤维素分解增强活性的多肽以及编码它们的多核苷酸
CN102918151A (zh) 纤维二糖水解酶变体及编码其的多核苷酸
CN103958675A (zh) 具有木聚糖酶活性的多肽以及编码它们的多核苷酸
CN103339252A (zh) 具有纤维素分解增强活性的嵌合多肽及其编码多核苷酸
CN104039834B (zh) 具有纤维二糖水解酶活性的杂合多肽和编码它们的多核苷酸
CN104870639A (zh) 具有纤维素分解增强活性的多肽以及编码它们的多核苷酸
CN104736698A (zh) 纤维二糖水解酶变体和编码它们的多核苷酸
CN103108951A (zh) 具有β-葡糖苷酶活性的多肽和编码该多肽的多核苷酸
CN107002056A (zh) 碳水化合物结合模块变体以及编码它们的多核苷酸
CN103930438A (zh) 具有β-葡糖苷酶活性的嵌合多肽和对其进行编码的多核苷酸
CN108467877A (zh) 用于降解或转化纤维素材料的方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination