CN106536730A - 无糖基化酶及其用途 - Google Patents

无糖基化酶及其用途 Download PDF

Info

Publication number
CN106536730A
CN106536730A CN201580042200.6A CN201580042200A CN106536730A CN 106536730 A CN106536730 A CN 106536730A CN 201580042200 A CN201580042200 A CN 201580042200A CN 106536730 A CN106536730 A CN 106536730A
Authority
CN
China
Prior art keywords
gly
ser
ala
thr
leu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201580042200.6A
Other languages
English (en)
Inventor
M·梅多夫
N·科瑞德
J·林驰
S·兰德里
A·吉田
D·彭泽伦
T·C·马斯特曼
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xyleco Inc
Original Assignee
Xyleco Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xyleco Inc filed Critical Xyleco Inc
Publication of CN106536730A publication Critical patent/CN106536730A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2434Glucanases acting on beta-1,4-glucosidic bonds
    • C12N9/2445Beta-glucosidase (3.2.1.21)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/02Monosaccharides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/14Preparation of compounds containing saccharide radicals produced by the action of a carbohydrase (EC 3.2.x), e.g. by alpha-amylase, e.g. by cellulase, hemicellulase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01021Beta-glucosidase (3.2.1.21)
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E50/00Technologies for the production of fuel of non-fossil origin
    • Y02E50/10Biofuels, e.g. bio-diesel

Landscapes

  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Engineering & Computer Science (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Health & Medical Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Genetics & Genomics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Processing Of Solid Wastes (AREA)
  • Purification Treatments By Anaerobic Or Anaerobic And Aerobic Bacteria Or Animals (AREA)

Abstract

本发明涉及包含具有纤维二糖酶活性的无糖基化多肽的组合物和用于产生和使用所述组合物的方法。本发明至少部分是基于以下惊人发现:来自里氏木霉的在非真菌细胞系中表达以及从不使酶显著糖基化的宿主细胞分离的所述纤维二糖酶比来自里氏木霉的内源性纤维二糖酶(糖基化型和分泌型)对纯底物具有更高比活性。

Description

无糖基化酶及其用途
相关申请
本申请要求2014年8月8日提交的美国临时申请号62/035,346的权益;所述美国临时申请的整个内容据此以引用的方式并入。
序列表
本申请含有已以电子方式以ASCII格式提交,并且据此以引用的方式整体并入的序列表。所述ASCII拷贝于2015年8月5日创建,命名为X2002-7000WO_SL.txt,并且大小是76,949个字节。
发明领域
本发明大体上涉及具有纤维二糖酶活性的组合物和用于产生本文所述的组合物的方法。本发明也提供使用此类组合物例如来加工生物质材料的方法。
发明背景
诸如纤维素酶、木聚糖酶和木质素酶的生物质降解酶对于诸如原料的生物质的降解是重要的。纤维素和木质纤维素材料在许多应用中被大量生产、加工和使用。此类材料常常被使用一次,接着作为废弃物丢弃,或仅被视为是废弃材料,例如污水、甘蔗渣、锯屑和秸杆
发明概述
本发明至少部分是基于以下惊人发现:来自里氏木霉(T.reesei)的在非真菌细胞系中表达以及从不使纤维二糖酶显著糖基化的宿主细胞分离的纤维二糖酶比来自里氏木霉的内源性纤维二糖酶(糖基化型和分泌型)对纯底物具有更高比活性。此外,当无糖基化纤维二糖酶与含有其他糖化酶的酶混合物一起用于糖化反应中时,相较于无无糖基化纤维二糖酶的反应,观察到糖产物的产率实质性增加。因此,本文提供具有例如纤维二糖酶活性的酶活性的无糖基化多肽、包含所述无糖基化多肽的组合物和用于产生和使用本文所述的组合物的方法。
因此,在一个方面,本公开的特征在于一种具有纤维二糖酶活性的无糖基化多肽。在一个实施方案中,相较于来自野生型里氏木霉或其突变体(诸如里氏木霉RUTC30)的糖基化Cel3A酶,无糖基化多肽具有增加的纤维二糖酶活性。举例来说,相较于来自野生型里氏木霉的糖基化Cel3A酶,无糖基化多肽可具有增加的底物识别力或更具活性的底物识别位点。在一个实施方案中,相较于来自野生型里氏木霉的糖基化Cel3A酶,无糖基化多肽具有降低的空间位阻。
在一个实施方案中,无糖基化多肽包含与SEQ ID NO:1或其功能性片段的至少75%、80%、85%、90%、95%、96%、97%、98%、99%同一性。在一个实施方案中,无糖基化多肽包含氨基酸序列SEQ ID NO:1(例如由氨基酸序列SEQ ID NO:1组成)。在另一实施方案中,无糖基化多肽与氨基酸序列SEQ ID NO:1相差至多1、2、3、4、5、6、7、8、9、10、15或20个氨基酸。
在一个实施方案中,多肽包括来自野生型里氏木霉或其突变体(诸如里氏木霉RUTC30)的Cel3A酶,或其功能性变体或片段。
在一个实施方案中,无糖基化多肽由核酸序列编码,其中所述核酸序列包含与SEQID NO:2或SEQ ID NO:3的至少75%、80%、85%、90%、95%、96%、97%、98%、99%同一性(例如由SEQ ID NO:2或SEQ ID NO:3组成)。在一个实施方案中,无糖基化多肽由包含SEQID NO:2或SEQ ID NO:3(例如由SEQ ID NO:2或SEQ ID NO:3组成)的核酸序列编码。
在一个实施方案中,无糖基化多肽由包含邻近于一个或多个糖基化位点的突变或在一个或多个糖基化位点处的突变的基因表达,其中所述突变阻止在所述糖基化位点处的糖基化。在一个实施方案中,突变在以下中的一个或多个处:SEQ ID NO:1的氨基酸位置78处的苏氨酸、氨基酸位置241处的苏氨酸、氨基酸位置343处的丝氨酸、氨基酸位置450处的丝氨酸、氨基酸位置599处的苏氨酸、氨基酸位置616处的丝氨酸、氨基酸位置691处的苏氨酸、氨基酸位置21处的丝氨酸、氨基酸位置24处的苏氨酸、氨基酸位置25处的丝氨酸、氨基酸位置28处的丝氨酸、氨基酸位置38处的苏氨酸、氨基酸位置42处的苏氨酸、氨基酸位置303处的苏氨酸、氨基酸位置398处的丝氨酸、氨基酸位置435处的丝氨酸、氨基酸位置436处的丝氨酸、氨基酸位置439处的苏氨酸、氨基酸位置442处的苏氨酸、氨基酸位置446处的苏氨酸、氨基酸位置451处的丝氨酸、氨基酸位置619处的丝氨酸、氨基酸位置622处的丝氨酸、氨基酸位置623处的苏氨酸、氨基酸位置626处的丝氨酸或氨基酸位置630处的苏氨酸。邻近于一个或多个糖基化位点的突变可阻止在那个位点处的糖基化,例如通过改变多肽的构象或改变由糖基化酶识别的共有位点以使糖基化将不发生在所述糖基化位点处。
在一个实施方案中,无糖基化多肽将碳水化合物,诸如葡萄糖的二聚体、三聚体、四聚体、五聚体、六聚体、七聚体、八聚体或寡聚体;或葡萄糖和木糖的寡聚体水解成一个或多个单糖,例如葡萄糖。在一个实施方案中,纤维二糖酶活性包括水解纤维二糖的β1,4糖苷键。
在另一方面,本公开的特征在于一种编码本文所述的无糖基化多肽的核酸序列。
在一个实施方案中,核酸序列编码Cel3A酶或其功能性片段,其中所述核酸序列包含与SEQ ID NO:2或SEQ ID NO:3的至少75%、80%、85%、90%、95%、96%、97%、98%、99%同一性(例如由SEQ ID NO:2或SEQ ID NO:3组成)。在一个实施方案中,核酸序列编码Cel3A酶,其中所述核酸序列包含SEQ ID NO:2或SEQ ID NO:3(例如由SEQ ID NO:2或SEQID NO:3组成)。
在一个方面,本公开的特征在于一种包括本文所述的核酸序列的核酸分子。
在一个实施方案中,核酸分子进一步包括启动子,例如用于原核细胞表达(例如细菌细胞表达,例如在大肠杆菌(E.coli)中表达)的启动子。在一个实施方案中,启动子序列是组成型启动子序列、诱导型启动子序列或阻遏型启动子序列。在一个实施方案中,启动子是T7启动子。
在一个实施方案中,核酸分子进一步包含编码标签的核酸序列,所述标签例如用于检测和/或纯化和/或用于与另一分子连接的标签,例如His标签。
在一个实施方案中,核酸分子进一步包含编码一个或多个信号序列,例如分泌信号序列的核酸。
在一个方面,本公开的特征在于一种包含本文所述的核酸序列或本文所述的核酸分子的表达载体。
在一个实施方案中,载体进一步包含编码选择标记,例如卡那霉素或氨苄青霉素标记的核酸序列。
在一个方面,本公开的特征在于一种包含本文所述的载体的细胞。
在一个实施方案中,细胞是原核细胞/细菌细胞,例如大肠杆菌细胞,例如Origami大肠杆菌细胞。
在一个实施方案中,细胞表达本文所述的无糖基化多肽。
在一个实施方案中,细胞在糖基化方面受损。
在一个方面,本公开的特征在于一种用于产生本文所述的无糖基化多肽的方法,其包括在适于表达本文所述的多肽的条件下培养表达所述多肽的细胞,其中所述细胞不使所述多肽糖基化,例如细菌细胞,例如大肠杆菌细胞,例如origami大肠杆菌细胞。
在一个方面,本公开的特征在于一种用于产生本文所述的无糖基化多肽的方法,其包括用去糖基化酶处理包含氨基酸序列SEQ ID NO:1或与SEQ ID NO:1具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%同一性的氨基酸序列的多肽。举例来说,去糖基化酶可为PGNase或EndoH。
在一个方面,本公开的特征在于一种用于产生本文所述的无糖基化多肽的方法,其包括培养包含编码多肽的核酸序列的细胞,所述多肽与SEQ ID NO:1具有至少75%、80%、85%、90%、95%、96%、97%、98%、99%同一性,其中所述核酸具有一个或多个阻止所编码多肽的糖基化的突变;以及任选地从培养物获得所述无糖基化多肽。
在一个方面,本公开的特征在于一种用于在糖基化抑制剂存在下培养表达本文所述的无糖基化多肽的细胞的方法。举例来说,糖基化抑制剂是衣霉素(tunicamycin)。
在一个方面,本公开的特征在于一种酶混合物,其包含本文所述的无糖基化多肽和一种或多种其他酶,诸如一种或多种糖基化酶,例如来自真菌细胞的纤维素酶。在一个实施方案中,酶混合物包含含有与SEQ ID NO:1具有至少75%、80%、95%、90%、95%、96%、97%、98%、99%同一性的氨基酸序列的糖基化多肽和本文所述的无糖基化多肽,其中所述糖基化多肽与所述无糖基化肽两者均具有纤维二糖酶活性。
在一个实施方案中,酶混合物包含糖基化多肽和无糖基化多肽,并且所述糖基化多肽与所述无糖基化多肽两者均包括来自野生型里氏木霉或其突变体(诸如里氏木霉RUTC30)的Cel3A酶。
在一个实施方案中,酶混合物进一步包含至少一种源于微生物的其他酶,其中所述其他酶具有生物质降解活性。在一个实施方案中,其他酶选自木质素酶、内切葡聚糖酶、纤维二糖水解酶、木聚糖酶和纤维二糖酶。
在一个实施方案中,反应混合物具有的无糖基化多肽与其余酶之间的比率是至少1:32,例如1:32至1:300。在一个实施方案中,反应混合物具有的无糖基化多肽与糖基化多肽的比率是至少1:32,例如1:32至1:300。
在一个方面,本公开的特征在于一种从生物质产生产物(例如氢气、糖、醇等)(或使生物质转化成产物)的方法,其包括使生物质,例如已用辐射,例如来自电子束的辐射处理的生物质与本文所述的无糖基化多肽在适于产生糖产物的条件下接触。在一个实施方案中,方法进一步包括使生物质与产生一种或多种生物质降解酶的微生物或包含生物质降解酶的酶混合物,例如本文所述的酶混合物接触。
在一个方面,本公开的特征在于一种从生物质产生产物(例如氢气、糖、醇等)(或使生物质转化成产物)的方法,其包括使生物质与本文所述的酶混合物在适于产生所述产物的条件下接触。
在一个实施方案中,产物是糖产物,例如本文所述的糖产物。在一个实施方案中,糖产物是葡萄糖和/或木糖,或其他糖产物,诸如果糖、阿拉伯糖、半乳糖和纤维二糖。
在一个实施方案中,方法进一步包括分离糖产物。在一个实施方案中,糖产物的分离包括沉淀、结晶、色谱法、离心和/或提取。
在一个实施方案中,酶混合物包含选自以下的酶中的至少两种:B2AF03、CIP1、CIP2、Cel1a、Cel3a、Cel5a、Cel6a、Cel7a、Cel7b、Cel12a、Cel45a、Cel74a、paMan5a、paMan26a、膨胀蛋白(Swollenin)或表1中所列的任何酶。在一个实施方案中,以上所列的酶从异源性或内源性表达酶的细胞,例如里氏木霉(Trichoderma reesei)或鹅柄孢壳菌(Podospora anserina)分离。
在一个实施方案中,生物质包括淀粉材料或包括纤维素组分的淀粉材料。在一些实施方案中,生物质包括以下中的一种或多种:农业产品或废弃物、纸产品或废弃物、林业产品或一般性废弃物或其任何组合;其中:a)农业产品或废弃物包括甘蔗、黄麻、大麻、亚麻、竹子、剑麻、苜蓿、干草、秘鲁胡萝卜(arracacha)、荞麦、香蕉、大麦、木薯、野葛(kudzu)、圆齿酢酱草(oca)、西米、高粱、马铃薯、甜薯、芋头、山药、菜豆、蚕豆、扁豆、豌豆、草、柳枝稷、芒草、绳草、草芦(reed canary grass)、谷物残渣、菜籽秆(canola straw)、小麦秆、大麦秆、燕麦秆、稻草、玉米穗轴、玉米秸杆、玉米纤维、椰子毛、甜菜浆、甘蔗渣、大豆秸杆、谷物残渣、稻壳、燕麦壳、小麦谷壳、大麦壳或细麸(beeswing)或其组合;b)纸产品或废弃物包括纸、着色纸、装料纸、涂覆纸、填充纸、杂志、印刷品、打印纸、涂塑纸(polycoated paper)、卡片坯料、卡纸板、纸板或纸浆或其组合;c)林业产品包括白杨木、刨花板、木片或锯屑或其组合;并且d)一般性废弃物包括粪肥、污水或垃圾(offal)或其组合。在一个实施方案中,方法进一步包括在引入微生物或酶混合物之前处理生物质以降低生物质的不顺应性的步骤,例如通过用电子进行轰击、声波处理、氧化、热解、蒸汽爆炸、化学处理、机械处理和/或冷冻研磨来处理生物质。
在一个实施方案中,产生生物质降解酶的微生物来自选自以下属的种:芽孢杆菌属(Bacillus)、鬼伞属(Coprinus)、毁丝霉属(Myceliophthora)、头孢霉属(Cephalosporium)、柱顶孢霉属(Scytalidium)、青霉属(Penicillium)、曲霉属(Aspergillus)、假单胞菌属(Pseudomonas)、腐质霉属(Humicola)、镰刀菌属(Fusarium)、梭孢壳属(Thielavia)、枝顶孢属(Acremonium)、金孢子菌属(Chrysosporium)或木霉属(Trichoderma)。在一个实施方案中,产生生物质降解酶的微生物选自曲霉属、特异腐质霉(Humicola insolens)(嗜热柱顶孢霉(Scytalidium thermophilum))、灰盖鬼伞(Coprinuscinereus)、尖孢镰刀菌(Fusarium oxysporum)、嗜热毁丝霉(Myceliophthorathermophila)、大型亚灰树花菌(Meripilus giganteus)、太瑞斯梭孢壳霉(Thielaviaterrestris)、桃色枝顶孢(Acremonium persicinum)、Acremonium acremonium、Acremonium brachypenium、Acremonium dichromosporum、Acremonium obclavatum、Acremonium pinkertoniae、灰粉枝顶孢(Acremonium roseogriseum)、Acremoniumincoloratum、棕色枝顶孢(Acremonium furatum)、Chrysosporium lucknowense、绿色木霉(Trichoderma viride)、里氏木霉或康宁木霉(Trichoderma koningii)。
在一个实施方案中,已通过将微生物与诱导生物质样品在相较于未诱导微生物,适于使生物质降解酶的产生增加的条件下组合来诱导微生物产生生物质降解酶。在一个实施方案中,诱导生物质样品包括纸、纸产品、纸废弃物、纸浆、着色纸、装料纸、涂覆纸、填充纸、杂志、印刷品、打印纸、涂塑纸、卡片坯料、卡纸板、纸板、棉花、木材、刨花板、林业废弃物、锯屑、白杨木、木片、草、柳枝稷、芒草、绳草、草芦、谷物残渣、稻壳、燕麦壳、小麦谷壳、大麦壳、农业废弃物、青贮饲料、菜籽秆、小麦秆、大麦秆、燕麦秆、稻草、黄麻、大麻、亚麻、竹子、剑麻、蕉麻(abaca)、玉米穗轴、玉米秸杆、大豆秸杆、玉米纤维、苜蓿、干草、椰子毛、糖加工残渣、甘蔗渣、甜菜浆、龙舌兰甘蔗渣(agave bagasse)、海藻、海草、粪肥、污水、垃圾、农业或工业废弃物、秘鲁胡萝卜、荞麦、香蕉、大麦、木薯、野葛、圆齿酢酱草、西米、高粱、马铃薯、甜薯、芋头、山药、菜豆、蚕豆、扁豆、豌豆或其任何组合。
附图简述
图1是在大肠杆菌中表达的纯化Cel3a的图片。泳道1代表分子量标准(PrecisionPlus全蓝蛋白质标准,Biorad);泳道2代表纯化Cel3a-His蛋白。
图2是Cel3a-N'His样品的色谱图,其显示在31分钟处检测到Cel3a-N'His。
图3是显示在Cel3a-N'His的色谱图中在31分钟处的峰的质谱区域中无糖基化迹象的概况。
图4是显示对电荷状态包络线的去卷积的图谱,所述去卷积鉴定出主要组分(无糖基化Cel3a-N'His)和次要组分(经修饰的Cel3a-N'His)的分子量。
图5是显示纯化Cel3a-N'His的如通过纤维二糖酶测定所测定的纤维二糖酶活性的图。
图6是显示对于已知浓度的Cel3a-N'His产生的纤维二糖酶活性标准曲线的图,所述标准曲线可用于确定Cel3a浓度未知的样品的Cel3a浓度。
图7是显示重组Cel3a相较于来自里氏木霉的内源性纤维二糖酶(L4196)的比活性的图。
图8是显示相较于标准酶混合物(L331对照),在添加无糖基化纤维二糖酶Cel3a下(L331(0.8mg/ml Cel3a),由用标准酶混合物进行的糖化反应获得的葡萄糖产物的产率的图。
详细描述
定义
除非另外定义,否则本文所用的所有技术和科学术语都具有与由本发明所属领域中的普通技术人员通常理解相同的含义。
术语“一个/一种(a/an)”是指冠词的一个或超过一个(即至少一个)语法对象。举例来说,“一种要素”意指一种要素或超过一种要素。
如本文所用的术语“无糖基化”是指例如多肽的分子在一个或多个当所述分子在它的天然环境中产生时连接有聚糖的位点处未被糖基化(即它包含不连接于糖基化基团的羟基或其他官能团)。举例来说,当蛋白质中的一个或多个在里氏木霉中产生Cel3A酶时通常具有连接于它的聚糖基团的位点不具有连接在那个位点处的聚糖时,所述Cel3A酶是无糖基化的。在一些实施方案中,无糖基化分子不具有任何连接的聚糖。在一个实施方案中,已使分子改变或突变以致分子不能被糖基化,例如使一个或多个糖基化位点突变以致聚糖不能连接于所述糖基化位点。在另一实施方案中,可例如通过酶促过程,例如通过与移除聚糖或具有去糖基化活性的酶一起孵育来从分子移除连接的聚糖。在另一实施方案中,可例如通过使用糖基化抑制剂(其抑制糖基化酶)来抑制分子的糖基化。在另一实施方案中,例如多肽的分子可由不进行糖基化的宿主细胞(例如大肠杆菌)产生。
如本文所用的术语“生物质”是指任何非化石化有机物质。生物质可为淀粉材料和/或纤维素、半纤维素或木质纤维素材料。举例来说,生物质可为农业产品、纸产品、林业产品或其任何中间体、副产品、残余物或废弃物、或一般性废弃物。生物质可为所述材料的组合。在一个实施方案中,例如通过本文所述的糖化和/或发酵反应来加工生物质以产生产物,诸如糖、醇、有机酸或生物燃料。
如本文所用的术语“生物质降解酶”是指将本文所述的生物质物质的组分分解成中间体或最终产物的酶。举例来说,生物质降解酶包括至少淀粉酶(例如α、β或γ淀粉酶)、纤维素酶、半纤维素酶、木质素酶、内切葡聚糖酶、纤维二糖酶、木聚糖酶和纤维二糖水解酶。生物质降解酶由广泛多种微生物产生,并且可从诸如里氏木霉的微生物分离。生物质降解酶可被内源性表达或异源性表达。
如本文所用的术语“纤维二糖酶”是指催化葡萄糖的二聚体、三聚体、四聚体、五聚体、六聚体、七聚体、八聚体或寡聚体;或葡萄糖和木糖的寡聚体水解成葡萄糖和/或木糖的酶。举例来说,纤维二糖酶是β-葡萄糖苷酶,其催化纤维二糖中的β-1,4键以释放两个葡萄糖分子。
如本文所用的术语“纤维二糖酶活性”是指一个种类的纤维素酶催化纤维二糖水解成葡萄糖,例如催化β-D-葡萄糖残基水解以释放β-D-葡萄糖的活性。可根据本文例如在实施例6中所述的测定来测定纤维二糖酶活性。一个单位的纤维二糖酶活性可定义为[葡萄糖]g/L/[Cel3a]g/L/30分钟。
如本文所用的术语“纤维二糖水解酶”是指水解纤维素中的糖苷键的酶。举例来说,纤维二糖水解酶是1,4-β-D-葡聚糖纤维二糖水解酶,其催化纤维素、纤维寡糖或任何含有β-1,4连接的葡萄糖的聚合物中的1,4-β-D-葡萄糖苷键的水解,从而从聚合物链释放寡糖。
如本文所用的术语“内切葡聚糖酶”是指催化纤维素的内部β-1,4葡萄糖苷键的水解的酶。举例来说,内切葡聚糖酶是内切-1,4-(1,3;1,4)-β-D-葡聚糖4-葡聚糖水解酶,其催化纤维素、纤维素衍生物(诸如羧甲基纤维素和羟乙基纤维素)、地衣淀粉(lichenan)中的1,4-β-D-糖苷键;混合β-1,3葡聚糖(诸如谷类β-D-葡聚糖或木葡聚糖)和其他含有纤维素组分的植物材料中的β-1,4键的内水解。
如本文所用的术语“酶混合物”是指至少两种不同酶或某一酶的至少两种不同变体(例如某一酶的糖基化形式和无糖基化形式)的组合。本文提及的酶混合物包括至少本文所述的具有纤维二糖酶活性的无糖基化多肽。在一个实施方案中,酶混合物包括纤维二糖酶、内切葡聚糖酶、纤维二糖水解酶、木质素酶和/或木聚糖酶中的一种或多种。在一些实施方案中,酶混合物包括表达和例如分泌一种或多种酶的细胞,例如微生物。举例来说,酶混合物可包括本文所述的无糖基化多肽和表达和例如分泌一种或多种其他酶和/或所述多肽的变体的细胞,例如微生物。
如本文所用的术语“木质素酶”是指诸如通过氧化反应来催化通常见于植物的细胞壁中的木质素的分解的酶。
术语“核酸”或“多核苷酸”可互换使用,并且是指呈单链或双链形式的脱氧核糖核酸(DNA)或核糖核酸(RNA)及其聚合物。除非明确限制,否则所述术语涵盖含有天然核苷酸的已知类似物的核酸,其与参照核酸具有类似结合性质,并且以与天然存在的核苷酸类似的方式进行代谢。除非另外指示,否则特定核酸序列也隐含地涵盖其保守修饰的变体(例如简并密码子取代)、等位基因、直系同源物、SNP和互补序列以及明确指示的序列。具体来说,简并密码子取代可通过产生其中一个或多个所选(或所有)密码子的第三位置被混合碱基和/或脱氧肌苷残基取代的序列来实现(Batzer等,Nucleic Acid Res.19:5081(1991);Ohtsuka等,J.Biol.Chem.260:2605-2608(1985);以及Rossolini等,Mol.Cell.Probes 8:91-98(1994))。
如本文所用的术语“可操作地连接”是指以下构型:其中控制或调控序列相对于编码多肽的核酸序列被放置在使得所述控制序列影响多肽(由DNA序列编码)的表达的位置处。在一个实施方案中,控制或调控序列在编码具有纤维二糖酶活性的多肽的核酸序列的上游。在一个实施方案中,控制或调控序列在编码具有纤维二糖酶活性的多肽的核酸序列的下游。
术语“肽”、“多肽”和“蛋白质”可互换使用,并且是指包含由肽键共价连接的氨基酸残基组成的化合物。蛋白质或肽必须含有至少两个氨基酸,并且关于可构成蛋白质的序列或肽的序列的氨基酸的最大数目不设限制。多肽包括包含两个或更多个由肽键彼此接合的氨基酸的任何肽或蛋白质。“多肽”包括例如生物活性片段、大致上同源性多肽、寡肽、同二聚体、异二聚体、多肽的变体、修饰的多肽、衍生物、类似物、融合蛋白以及其他多肽。多肽包括天然肽、重组肽或其组合。
如本文所用的术语“启动子”是指由细胞的合成机构或引入的合成机构识别,为启始多核苷酸序列的特异性转录所需的DNA序列。
如在本文中可互换使用的术语“调控序列”或“控制序列”是指为表达核酸产物所需的核酸序列。在一些情况下,这个序列可为启动子序列,并且在其他情况下,这个序列也可包括增强子序列和为表达基因产物所需的其他调控元件。调控/控制序列可例如是以调控方式(例如可诱导方式)来表达核酸产物的序列。
术语“组成型”启动子是指当与编码多肽的多核苷酸可操作地连接时,在细胞的大多数或所有生理条件下导致在所述细胞中产生所述多肽的核苷酸序列。在一个实施方案中,多肽是具有纤维二糖酶活性的多肽。
术语“诱导型”启动子是指当与编码多肽的多核苷酸可操作地连接时,仅当对应于启动子的诱导剂存在于细胞中时导致在所述细胞中大量产生所述多肽的核苷酸序列。在一个实施方案中,多肽是具有纤维二糖酶活性的多肽。
术语“阻遏型”启动子是指当与编码多肽的多核苷酸可操作地连接时,仅直至对应于启动子的阻遏子存在于细胞中时导致在所述细胞中大量产生所述多肽的核苷酸序列。在一个实施方案中,多肽是具有纤维二糖酶活性的多肽。
如本文所用的术语“木聚糖酶”是指水解含有木聚糖的材料的酶。木聚糖是包含木糖单元的多糖。木聚糖酶可为内切木聚糖酶、β-木糖苷酶、阿拉伯呋喃糖苷酶、α-葡萄糖醛酸苷酶、乙酰木聚糖酯酶、阿魏酸酯酶或α-葡萄糖醛酸基酯酶。
描述
糖基化被认为在诸如酶活性、溶解性、稳定性、折叠和/或分泌的酶结构和功能方面起关键作用。相应地,用于使生物质转化成生物燃料和其他产物的方法已集中于产生和利用糖基化酶(例如纤维二糖酶)来用于使纤维素和/或木质纤维素材料糖化。用于糖化的酶通常在使蛋白质适当糖基化、折叠和分泌的真核生物宿主细胞系(诸如巴斯德毕赤酵母(Pichia pastoris))中产生。
本发明至少部分基于以下惊人发现:来自里氏木霉的在非真菌细胞系中表达以及从不使酶显著糖基化的宿主细胞分离的纤维二糖酶比来自里氏木霉的内源性纤维二糖酶(糖基化型和分泌型)对纯底物具有更高比活性。此外,当无糖基化纤维二糖酶与含有其他糖化酶的酶混合物一起用于糖化反应中时,相较于无无糖基化纤维二糖酶的反应,观察到糖产物的产率实质性增加。因此,本文提供具有例如纤维二糖酶活性的酶活性的无糖基化多肽、包含所述无糖基化多肽的组合物和用于产生和使用本文所述的组合物的方法。
多肽和变体
本公开提供一种具有纤维二糖酶活性的无糖基化多肽。在一个实施方案中,无糖基化多肽是纤维二糖酶。纤维二糖酶是水解它的底物纤维二糖中的β-1,4键以释放两个葡萄糖分子的酶。纤维二糖是葡萄糖的水溶性1,4-连接的二聚体。
Cel3a(也称为BglI)是在里氏木霉中鉴定的纤维二糖酶。以下提供Cel3a的氨基酸序列(GenBank登记号NW_006711153):
MGDSHSTSGASAEAVVPPAGTPWGTAYDKAKAALAKLNLQDKVGIVSGVGWNGGPCVGNTSPASKISYPSLCLQDGPLGVRYSTGSTAFTPGVQAASTWDVNLIRERGQFIGEEVKASGIHVILGPVAGPLGKTPQGGRNWEGFGVDPYLTGIAMGQTINGIQSVGVQATAKHYILNEQELNRETISSNPDDRTLHELYTWPFADAVQANVASVMCSYNKVNTTWACEDQYTLQTVLKDQLGFPGYVMTDWNAQHTTVQSANSGLDMSMPGTDFNGNNRLWGPALTNAVNSNQVPTSRVDDMVTRILAAWYLTGQDQAGYPSFNISRNVQGNHKTNVRAIARDGIVLLKNDANILPLKKPASIAVVGSAAIIGNHARNSPSCNDKGCDDGALGMGWGSGAVNYPYFVAPYDAINTRASSQGTQVTLSNTDNTSSGASAARGKDVAIVFITADSGEGYITVEGNAGDRNNLDPWHNGNALVQAVAGANSNVIVVVHSVGAIILEQILALPQVKAVVWAGLPSQESGNALVDVLWGDVSPSGKLVYTIAKSPNDYNTRIVSGGSDSFSEGLFIDYKHFDDANITPRYEFGYGLSYTKFNYSRLSVLSTAKSGPATGAVVPGGPSDLFQNVATVTVDIANSGQVTGAEVAQLYITYPSSAPRTPPKQLRGFAKLNLTPGQSGTATFNIRRRDLSYWDTASQKWVVPSGSFGISVGASSRDIRLTSTLSVAGSGS
(SEQ ID NO:1)
本公开也提供本文所述的具有纤维二糖酶活性的无糖基化多肽(例如Cel3a)的功能性变体。在一个实施方案中,功能性变体具有与本文所述的Cel3a或其功能性片段具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%同一性,例如与本文所述的Cel3a或其功能性片段具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%同一性的氨基酸序列。在一个实施方案中,功能性变体具有与SEQ ID NO:1或其功能性片段具有至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%同一性、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%同一性的氨基酸序列。
在两个或更多个氨基酸或核酸序列的情形下的同一性百分比是指相同的两个或更多个序列。如使用以下序列比较算法中的一种或通过手动比对和目视检查所测量,如果当在比较窗或指定区域上进行比较和对准以达成最大对应性时,两个序列具有指定百分比的相同氨基酸残基或核苷酸(例如在指定区域上,或当未指定时在整个序列上,60%同一性,任选70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性),那么两个序列“大致上同一”。任选地,在长度是至少约50个核苷酸、100个核苷酸、150个核苷酸的区域上存在同一性。更优选地,在长度是至少约200或更多个氨基酸、或至少约500或1000或更多个核苷酸的区域上存在同一性。
对于序列比较,通常一个序列充当一个或多个测试序列与其进行比较的参照序列。当使用序列比较算法时,将测试序列和参照序列输入计算机中,必要时指定子序列坐标,并且指定序列算法程序参数。可使用默认程序参数,或可指定替代参数。序列比较算法接着基于程序参数计算测试序列相对于参照序列的序列同一性百分比。使序列对准以供比较的方法在本领域中是熟知的。可例如通过Smith和Waterman,(1970)Adv.Appl.Math.2:482c的局部同源性算法,通过Needleman和Wunsch,(1970)J.Mol.Biol.48:443的同源性比对算法,通过Pearson和Lipman,(1988)Proc.Nat'l.Acad.Sci.USA 85:2444的类似性搜索方法,通过这些算法的计算机化执行程序(Wisconsin Genetics软件包,GeneticsComputer Group,575Science Dr.,Madison,WI)中的GAP、BESTFIT、FASTA和TFASTA),或通过手动比对和目视检查(参见例如Brent等,(2003)Current Protocols in MolecularBiology)来进行供比较的序列的最优比对。
适于确定序列同一性百分比和序列相似性百分比的算法的两个实例是BLAST和BLAST 2.0算法,其分别描述于Altschul等,(1977)Nuc.Acids Res.25:3389-3402;以及Altschul等,(1990)J.Mol.Biol.215:403-410中。用于进行BLAST分析的软件可通过国家生物技术信息中心(National Center for Biotechnology Information)公开获得。
功能性变体可包含一个或多个突变,以使变体保留比由里氏木霉产生的SEQ IDNO:1的酶的纤维二糖酶活性更好,例如相较于所述纤维二糖酶活性得以增加的纤维二糖酶活性。在一个实施方案中,功能性变体具有如同如由大肠杆菌产生的无糖基化形式的SEQID NO:1的纤维二糖酶活性的至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少99%(例如至少80%、至少85%、至少90%、至少95%或至少99%)。可使用本文所述的功能性测定测试纤维二糖酶活性。
在另一实施方案中,无糖基化多肽与例如氨基酸序列SEQ ID NO:1的参照氨基酸序列相差至多1、至多2、至多3、至多4、至多5、至多6、至多7、至多8、至多9、至多10、至多15、至多20、至多30、至多40或至多50个氨基酸。
存在于功能性变体中的突变包括氨基酸取代、添加和缺失。可通过本领域中已知的标准技术,诸如定点诱变和PCR介导的诱变来引入突变。突变可为保守性氨基酸取代,其中氨基酸残基被具有类似侧链的氨基酸残基替换。本领域中已定义具有类似侧链的氨基酸残基的家族。这些家族包括具有碱性侧链的氨基酸(例如赖氨酸、精氨酸、组氨酸)、具有酸性侧链的氨基酸(例如天冬氨酸、谷氨酸)、具有不带电荷极性侧链的氨基酸(例如甘氨酸、天冬酰胺、谷氨酰胺、丝氨酸、苏氨酸、酪氨酸、半胱氨酸、色氨酸)、具有非极性侧链的氨基酸(例如丙氨酸、缬氨酸、亮氨酸、异亮氨酸、脯氨酸、苯丙氨酸、甲硫氨酸)、具有β分支侧链的氨基酸(例如苏氨酸、缬氨酸、异亮氨酸)和具有芳族侧链的氨基酸(例如酪氨酸、苯丙氨酸、色氨酸、组氨酸)。因此,本公开的具有纤维二糖酶活性的多肽内的一个或多个氨基酸残基可被来自同一侧链家族的其他氨基酸替换,并且所得多肽保留与野生型多肽的纤维二糖酶活性类似的纤维二糖酶活性(例如至少80%、85%、90%、95%或99%的纤维二糖酶活性)。或者,突变可为其中氨基酸残基被具有不同侧链的氨基酸残基替换的氨基酸取代。
所述突变可改变或影响纤维二糖酶的各种酶特征。举例来说,所述突变可改变或影响纤维二糖酶的纤维二糖酶活性、热稳定性、最优反应pH、酶动力学或底物识别。在一些实施方案中,相较于由里氏木霉产生的纤维二糖酶和/或在大肠杆菌中产生的SEQ ID NO:1,突变使变体的纤维二糖酶活性增加。在一些实施方案中,相较于野生型纤维二糖酶和/或在大肠杆菌中产生的SEQ ID NO:1,突变使变体的热稳定性增加或降低。在一个实施方案中,相较于野生型纤维二糖酶和/或在大肠杆菌中产生的SEQ ID NO:1,突变改变变体最优进行纤维二糖酶反应所处的pH范围。在一个实施方案中,相较于野生型纤维二糖酶和/或在大肠杆菌中产生的SEQ ID NO:1,突变使纤维二糖酶反应的动力学(例如kcat、KM或KD)增加或降低。在一个实施方案中,相较于野生型纤维二糖酶和/或在大肠杆菌中产生的SEQ ID NO:1,突变使纤维二糖酶识别或结合底物(例如纤维二糖)的能力增加或降低。
本发明也提供如本文所述的具有纤维二糖酶活性的多肽(例如Cel3a或SEQ IDNO:1)的功能性片段。本领域普通技术人员可易于设想如本文所述的具有纤维二糖酶活性的多肽的含有导致酶活性的功能性结构域的片段将保留例如纤维二糖酶活性的功能活性,并且因此,所述片段涵盖在本发明中。在一个实施方案中,功能性片段的长度是至少700个氨基酸、至少650个氨基酸、至少600个氨基酸、至少550个氨基酸、至少500个氨基酸、至少450个氨基酸、至少400个氨基酸、至少350个氨基酸、至少300个氨基酸、至少250个氨基酸、至少200个氨基酸、至少150个氨基酸、至少100个氨基酸或至少50个氨基酸。在一个实施方案中,功能性片段是700至744个氨基酸、650至699个氨基酸、600至649个氨基酸、550至599个氨基酸、500至549个氨基酸、450至499个氨基酸、400至449个氨基酸、350至399个氨基酸、300至349个氨基酸、250至299个氨基酸、200至249个氨基酸、150至199个氨基酸、100至149个氨基酸或50至99个氨基酸。关于上述氨基酸长度的范围,氨基酸长度的最低值和最高值包括在各公开范围内。在一个实施方案中,功能性片段具有如同野生型Cel3a或在大肠杆菌中产生的包含SEQ ID NO:1的多肽的纤维二糖酶活性的至少10%、至少20%、至少30%、至少40%、至少50%、至少60%、至少70%、至少75%、至少80%、至少85%、至少90%、至少95%或至少99%。
用于检测纤维二糖酶活性的测定在本领域中是已知的。举例来说,可通过使纯化纤维二糖酶与例如纤维二糖D-(+)-纤维二糖的底物一起孵育,以及在反应完成之后检测游离葡萄糖的所得量来确定对从纤维二糖释放的葡萄糖的量的检测。可使用本领域中已知的多种方法测定游离葡萄糖的量。举例来说,在含有50mM柠檬酸二氢钠的缓冲液(pH 5.0,NaOH)中制备纯化纤维二糖酶的稀释液。以使得纤维二糖在反应混合物中的最终浓度是30mM的量将纤维二糖底物添加至纯化纤维二糖酶中。在适于反应发生的条件下,例如在振荡器(700rpm)中,在48℃下持续30分钟孵育反应混合物。为终止反应,在100℃下加热反应混合物5分钟。使反应混合物经0.45μm过滤器过滤,分析滤液以定量葡萄糖和/或纤维二糖酶的量。测量诸如葡萄糖的分析物的YSI仪器可用于测定由反应产生的葡萄糖的浓度。或者,UPLC(超高效液相色谱法)可用于测定来自反应的葡萄糖和纤维二糖的浓度。可将这个测定排列成单反应或多反应形式,例如96孔形式。在一些实施方案中,多反应形式可优选用以产生关于不同浓度的纯化纤维二糖酶来表示纤维二糖酶活性的活性曲线。可使用标准布拉德福德(Bradford)测定来测定纯化纤维二糖酶的浓度。制备纯化纤维二糖酶测定的稀释液,例如2倍稀释液,并且等分至96孔板中,例如12个孔的2倍稀释液。如先前所述添加纤维二糖底物以使纤维二糖酶在反应中的最终浓度是30mM。将板密封并在足以发生纤维二糖酶反应的条件下,接着在足以终止反应的条件下处理。接着使反应经96孔形式0.45μm膜(例如Durapore)过滤,并且通过YSI和/或HPLC方法(例如UPLC)来分析。
这个活性测定也可用于通过产生浓度已知的Cel3a样品的稀释液的活性的标准曲线来确定样品中Cel3a的浓度或效价。测定浓度未知的样品的稀释液的活性,并且与标准曲线进行比较以基于标准曲线鉴定近似浓度。这个方法进一步详述于实施例6中。
在其他实施方案中,可使用比色/荧光测定。在用于发生反应的条件下使纯化纤维二糖酶与底物纤维二糖一起孵育。如下检测产物葡萄糖。向混合物中添加葡萄糖氧化酶,其使葡萄糖(产物)氧化成葡萄糖酸和过氧化氢。接着添加过氧化物酶和邻联茴香胺。邻联茴香胺与过氧化氢在过氧化物酶存在下反应以形成有色产物。添加硫酸,其与氧化邻联茴香胺反应以形成更稳定有色产物。当例如通过分光光度计或色度计例如在540nm下测量时,颜色的强度与葡萄糖浓度成正比。所述比色/荧光葡萄糖测定可例如从Sigma Aldrich(目录号GAGO-20)商购获得。
对于所有上述具有纤维二糖酶活性的多肽,使用用于产生本文所述的无糖基化多肽的方法使多肽无糖基化。
糖基化是碳水化合物连接于糖基接受体所采用的酶促过程,所述糖基接受体例如精氨酸或天冬酰胺侧链的氮或丝氨酸、苏氨酸或酪氨酸侧链的羟基氧。有两种类型的糖基化:N连接的糖基化和O连接的糖基化。N连接的糖基化发生在共有位点Asn-X-Ser/Thr处,其中X可为除脯氨酸之外的任何氨基酸。O连接的糖基化发生在Ser/Thr残基处。可使用本领域中已知的各种算法预测糖基化位点,所述算法诸如可通过瑞士生物信息学研究所(SwissInstitute of Bioinformatics)公开获得的Prosite和可通过生物序列分析中心(Centerfor Biological Sequence Analysis)公开获得的NetNGlyc1.0或NetOGlyc 4.0。
在各个实施方案中,功能性变体含有一个或多个突变,其中一个或多个存在于通过本文所述的核酸序列表达的Cel3a多肽中的糖基化位点已被突变以使聚糖不再能附接或连接于糖基化位点。在另一实施方案中,功能性变体含有一个或多个邻近于一个或多个存在于通过本文所述的核酸序列表达的Cel3a多肽中的糖基化位点的突变,所述糖基化位点已被突变以使聚糖不再能附接或连接于糖基化位点。举例来说,邻近于糖基化位点的突变使由糖基化酶识别的共有基序突变,或改变多肽的构象以使多肽不能被糖基化,例如糖基化位点被隐藏或归因于新构象的空间位阻阻止糖基化酶接近糖基化位点。邻近于Cel3a多肽中的糖基化位点的突变直接邻近于糖基化位点或离糖基化位点有至少2、至少3、至少4、至少5、至少6、至少7、至少8、至少9、至少10、至少15、至少20、至少30或至少40个氨基酸,所述糖基化位点由于邻近突变而将不被糖基化。
在一个实施方案中,使Cel3a或SEQ ID NO:1的一个或多个以下糖基化位点突变:氨基酸位置78处的苏氨酸、氨基酸位置241处的苏氨酸、氨基酸位置343处的丝氨酸、氨基酸位置450处的丝氨酸、氨基酸位置599处的苏氨酸、氨基酸位置616处的丝氨酸、氨基酸位置691处的苏氨酸、氨基酸位置21处的丝氨酸、氨基酸位置24处的苏氨酸、氨基酸位置25处的丝氨酸、氨基酸位置28处的丝氨酸、氨基酸位置38处的苏氨酸、氨基酸位置42处的苏氨酸、氨基酸位置303处的苏氨酸、氨基酸位置398处的丝氨酸、氨基酸位置435处的丝氨酸、氨基酸位置436处的丝氨酸、氨基酸位置439处的苏氨酸、氨基酸位置442处的苏氨酸、氨基酸位置446处的苏氨酸、氨基酸位置451处的丝氨酸、氨基酸位置619处的丝氨酸、氨基酸位置622处的丝氨酸、氨基酸位置623处的苏氨酸、氨基酸位置626处的丝氨酸或氨基酸位置630处的苏氨酸或其任何组合。在各实施方案中,使糖基化位点从丝氨酸或苏氨酸突变成丙氨酸。举例来说,本文所述的无糖基化多肽具有一个或多个以下突变:T78A、T241A、S343A、S450A、T599A、S616A、T691A、S21A、T24A、S25A、S28A、T38A、T42A、T303A、T398A、S435A、S436A、T439A、T442A、T446A、S451A、S619A、S622A、T623A、S626A或T630A或其任何组合。或者,使一个或多个邻近于上述糖基化位点的氨基酸突变。
用以检测多肽是否由聚糖修饰(例如多肽是否被糖基化或无糖基化)的测定在本领域中是已知的。多肽可被纯化或分离,并且可被染色以检测和定量聚糖部分,或可通过质谱测定法来分析多肽,并且与相应参照多肽进行比较。参照多肽与测试多肽(其糖基化状态待测定)具有相同一级序列,但被糖基化或无糖基化。
相较于例如糖基化Cel3a多肽的相应糖基化多肽,本文所述的无糖基化多肽具有增加的纤维二糖酶活性。举例来说,相较于糖基化多肽,具有纤维二糖酶活性的无糖基化多肽具有至少1%、2%、5%、10%、15%、20%、25%、30%、40%、50%、60%、70%、80%、90%、100%或200%纤维二糖酶活性。
核酸
本发明也提供一种编码本发明的具有纤维二糖酶活性的多肽的核酸序列。在一个实施方案中,核酸序列编码具有本文所述的氨基酸序列的Cel3a酶或其功能性片段。
在一个实施方案中,以下提供编码Cel3a的核酸序列:
ATGCGTTACCGAACAGCAGCTGCGCTGGCACTTGCCACTGGGCCCTTTGCTAGGGCAGACAGTCACTCAACATCGGGGGCCTCGGCTGAGGCAGTTGTACCTCCTGCAGGGACTCCATGGGGAACCGCGTACGACAAGGCGAAGGCCGCATTGGCAAAGCTCAATCTCCAAGATAAGGTCGGCATCGTGAGCGGTGTCGGCTGGAACGGCGGTCCTTGCGTTGGAAACACATCTCCGGCCTCCAAGATCAGCTATCCATCGCTATGCCTTCAAGACGGACCCCTCGGTGTTCGATACTCGACAGGCAGCACAGCCTTTACGCCGGGCGTTCAAGCGGCCTCGACGTGGGATGTCAATTTGATCCGCGAACGTGGACAGTTCATCGGTGAGGAGGTGAAGGCCTCGGGGATTCATGTCATACTTGGTCCTGTGGCTGGGCCGCTGGGAAAGACTCCGCAGGGCGGTCGCAACTGGGAGGGCTTCGGTGTCGATCCATATCTCACGGGCATTGCCATGGGTCAAACCATCAACGGCATCCAGTCGGTAGGCGTGCAGGCGACAGCGAAGCACTATATCCTCAACGAGCAGGAGCTCAATCGAGAAACCATTTCGAGCAACCCAGATGACCGAACTCTCCATGAGCTGTATACTTGGCCATTTGCCGACGCGGTTCAGGCCAATGTCGCTTCTGTCATGTGCTCGTACAACAAGGTCAATACCACCTGGGCCTGCGAGGATCAGTACACGCTGCAGACTGTGCTGAAAGACCAGCTGGGGTTCCCAGGCTATGTCATGACGGACTGGAACGCACAGCACACGACTGTCCAAAGCGCGAATTCTGGGCTTGACATGTCAATGCCTGGCACAGACTTCAACGGTAACAATCGGCTCTGGGGTCCAGCTCTCACCAATGCGGTAAATAGCAATCAGGTCCCCACGAGCAGAGTCGACGATATGGTGACTCGTATCCTCGCCGCATGGTACTTGACAGGCCAGGACCAGGCAGGCTATCCGTCGTTCAACATCAGCAGAAATGTTCAAGGAAACCACAAGACCAATGTCAGGGCAATTGCCAGGGACGGCATCGTTCTGCTCAAGAATGACGCCAACATCCTGCCGCTCAAGAAGCCCGCTAGCATTGCCGTCGTTGGATCTGCCGCAATCATTGGTAACCACGCCAGAAACTCGCCCTCGTGCAACGACAAAGGCTGCGACGACGGGGCCTTGGGCATGGGTTGGGGTTCCGGCGCCGTCAACTATCCGTACTTCGTCGCGCCCTACGATGCCATCAATACCAGAGCGTCTTCGCAGGGCACCCAGGTTACCTTGAGCAACACCGACAACACGTCCTCAGGCGCATCTGCAGCAAGAGGAAAGGACGTCGCCATCGTCTTCATCACCGCCGACTCGGGTGAAGGCTACATCACCGTGGAGGGCAACGCGGGCGATCGCAACAACCTGGATCCGTGGCACAACGGCAATGCCCTGGTCCAGGCGGTGGCCGGTGCCAACAGCAACGTCATTGTTGTTGTCCACTCCGTTGGCGCCATCATTCTGGAGCAGATTCTTGCTCTTCCGCAGGTCAAGGCCGTTGTCTGGGCGGGTCTTCCTTCTCAGGAGAGCGGCAATGCGCTCGTCGACGTGCTGTGGGGAGATGTCAGCCCTTCTGGCAAGCTGGTGTACACCATTGCGAAGAGCCCCAATGACTATAACACTCGCATCGTTTCCGGCGGCAGTGACAGCTTCAGCGAGGGACTGTTCATCGACTATAAGCACTTCGACGACGCCAATATCACGCCGCGGTACGAGTTCGGCTATGGACTGTCTTACACCAAGTTCAACTACTCACGCCTCTCCGTCTTGTCGACCGCCAAGTCTGGTCCTGCGACTGGGGCCGTTGTGCCGGGAGGCCCGAGTGATCTGTTCCAGAATGTCGCGACAGTCACCGTTGACATCGCAAACTCTGGCCAAGTGACTGGTGCCGAGGTAGCCCAGCTGTACATCACCTACCCATCTTCAGCACCCAGGACCCCTCCGAAGCAGCTGCGAGGCTTTGCCAAGCTGAACCTCACGCCTGGTCAGAGCGGAACAGCAACGTTCAACATCCGACGACGAGATCTCAGCTACTGGGACACGGCTTCGCAGAAATGGGTGGTGCCGTCGGGGTCGTTTGGCATCAGCGTGGGAGCGAGCAGCCGGGATATCAGGCTGACGAGCACTCTGTCGGTAGCG
(SEQ ID NO:2)
编码本文所述的具有纤维二糖酶活性的多肽的核酸序列可针对在宿主细胞中的表达增加进行密码子优化。密码子优化包括改变核酸序列以考虑包括密码子使用偏好、隐蔽剪接位点、mRNA二级结构、过早多聚腺苷酸位点、密码子和抗密码子的相互作用、以及RNA不稳定性基序的因素来增加编码多肽在宿主中的表达。用于密码子优化的各种算法和商业服务在本领域中是已知的和可用的。
以下提供编码Cel3a的密码子优化核酸序列:
ATGCGTTATCGTACAGCCGCAGCCCTGGCACTGGCCACAGGTCCGTTCGCACGTGCCGATAGTCACAGTACCAGCGGTGCCAGCGCAGAAGCCGTGGTTCCGCCGGCAGGCACACCGTGGGGCACAGCCTATGATAAAGCCAAAGCCGCCCTGGCCAAGCTGAATCTGCAGGATAAAGTGGGCATCGTGAGTGGCGTGGGCTGGAACGGTGGTCCGTGCGTTGGCAACACCAGCCCGGCAAGCAAGATCAGCTATCCGAGCTTATGCCTGCAGGATGGTCCGCTGGGCGTGCGCTATAGCACCGGTAGTACCGCCTTTACACCTGGTGTGCAGGCCGCCAGTACCTGGGACGTTAACCTGATCCGCGAACGTGGCCAATTTATCGGCGAAGAAGTTAAAGCCAGCGGCATTCATGTTATTCTGGGTCCGGTGGCCGGTCCTCTGGGTAAAACCCCGCAGGGCGGCCGTAATTGGGAAGGCTTCGGCGTTGATCCGTATTTAACCGGCATCGCAATGGGCCAGACCATTAATGGCATCCAGAGCGTGGGTGTTCAAGCCACCGCCAAACACTACATATTAAACGAACAGGAACTGAATCGTGAAACCATCAGCAGCAATCCGGATGATCGCACCCTGCATGAGCTGTATACATGGCCTTTTGCCGACGCAGTTCAGGCCAACGTGGCAAGTGTGATGTGTAGCTATAACAAGGTGAACACCACCTGGGCCTGCGAAGACCAGTACACCCTGCAGACCGTTTTAAAAGACCAACTGGGCTTCCCTGGTTACGTGATGACAGATTGGAATGCCCAGCACACAACCGTTCAGAGCGCAAACAGTGGCCTGGATATGAGCATGCCGGGCACCGACTTCAACGGCAATAATCGTCTGTGGGGTCCGGCACTGACCAATGCCGTTAACAGCAACCAGGTGCCGACCAGTCGTGTGGACGATATGGTTACCCGTATTCTGGCCGCCTGGTACCTGACAGGTCAAGACCAGGCCGGCTACCCGAGCTTCAACATCAGCCGCAACGTGCAGGGTAATCACAAGACCAACGTTCGCGCAATCGCACGCGATGGTATCGTGCTGTTAAAGAACGATGCCAACATTCTGCCGCTGAAAAAACCGGCCAGCATCGCCGTTGTTGGTAGCGCAGCCATCATTGGCAACCACGCCCGTAACAGTCCGAGCTGCAATGATAAAGGCTGTGACGACGGTGCCCTGGGCATGGGTTGGGGTAGTGGTGCCGTGAACTACCCGTATTTCGTGGCCCCGTACGACGCCATTAACACCCGTGCAAGTAGCCAGGGTACCCAGGTTACCCTGAGCAACACCGACAACACAAGCAGCGGTGCCAGTGCAGCACGTGGTAAGGATGTGGCCATCGTGTTCATCACCGCCGACAGCGGCGAAGGCTACATTACCGTGGAGGGTAATGCCGGTGATCGCAATAATCTGGACCCGTGGCATAACGGCAACGCCCTGGTTCAGGCAGTGGCAGGCGCAAATAGCAACGTGATCGTTGTGGTGCATAGCGTGGGTGCCATCATTCTGGAGCAGATCCTGGCCCTGCCGCAAGTTAAGGCAGTTGTGTGGGCAGGTCTGCCGAGCCAAGAAAGTGGCAATGCCCTGGTGGACGTTCTGTGGGGCGATGTTAGTCCGAGCGGCAAGCTGGTGTATACAATCGCCAAGAGCCCGAACGACTATAACACCCGCATCGTTAGCGGCGGCAGTGATAGCTTCAGCGAGGGCCTGTTTATCGACTACAAGCATTTCGATGATGCCAATATTACCCCGCGCTACGAATTTGGTTATGGCCTGAGCTATACCAAGTTCAACTACAGCCGCCTGAGCGTTTTAAGTACCGCCAAGAGTGGTCCGGCAACAGGTGCCGTGGTTCCTGGTGGTCCGAGTGATCTGTTTCAGAATGTGGCCACCGTGACCGTGGATATCGCCAACAGTGGTCAGGTTACCGGCGCCGAAGTGGCACAGCTGTACATCACCTATCCGAGCAGTGCACCGCGCACCCCGCCGAAACAGCTGCGTGGCTTCGCCAAATTAAACCTGACCCCGGGCCAGAGCGGTACAGCAACCTTCAATATTCGCCGCCGTGATCTGAGCTATTGGGACACCGCCAGCCAAAAATGGGTGGTGCCGAGCGGCAGCTTTGGCATTAGTGTGGGTGCAAGTAGCCGCGACATTCGCTTAACAAGCACCCTGAGTGTTGCC
(SEQ ID NO:3)
在一个实施方案中,编码Cel3a酶或其功能性变体的核酸序列包含与SEQ ID NO:2的至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%同一性。在一个实施方案中,编码Cel3a酶或其功能性变体的核酸序列包含与SEQ ID NO:2或SEQ ID NO:3的至少50%、至少55%、至少60%、至少65%、至少70%、至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%同一性。
本文提供一种编码如上所述的无糖基化多肽,例如Cel3a多肽的核酸序列,其中一个或多个存在于多肽中的糖基化位点已被突变以使聚糖不再能附接或连接于糖基化位点。在另一实施方案中,本文所述的核酸序列编码如上所述的无糖基化多肽,例如Cel3a多肽,其中一个或多个突变邻近于一个或多个存在于多肽中的已被突变的糖基化位点以使聚糖不再能附接或连接于糖基化位点,如先前所述。在一个实施方案中,核酸序列编码在Cel3a或SEQ ID NO:1的一个或多个以下糖基化位点处包含一个或多个突变的多肽:氨基酸位置78处的苏氨酸、氨基酸位置241处的苏氨酸、氨基酸位置343处的丝氨酸、氨基酸位置450处的丝氨酸、氨基酸位置599处的苏氨酸、氨基酸位置616处的丝氨酸、氨基酸位置691处的苏氨酸、氨基酸位置21处的丝氨酸、氨基酸位置24处的苏氨酸、氨基酸位置25处的丝氨酸、氨基酸位置28处的丝氨酸、氨基酸位置38处的苏氨酸、氨基酸位置42处的苏氨酸、氨基酸位置303处的苏氨酸、氨基酸位置398处的丝氨酸、氨基酸位置435处的丝氨酸、氨基酸位置436处的丝氨酸、氨基酸位置439处的苏氨酸、氨基酸位置442处的苏氨酸、氨基酸位置446处的苏氨酸、氨基酸位置451处的丝氨酸、氨基酸位置619处的丝氨酸、氨基酸位置622处的丝氨酸、氨基酸位置623处的苏氨酸、氨基酸位置626处的丝氨酸或氨基酸位置630处的苏氨酸或其任何组合。在各实施方案中,使糖基化位点从丝氨酸或苏氨酸突变成丙氨酸。举例来说,本发明的核酸序列编码包含一个或多个以下突变的无糖基化多肽:T78A、T241A、S343A、S450A、T599A、S616A、T691A、S21A、T24A、S25A、S28A、T38A、T42A、T303A、T398A、S435A、S436A、T439A、T442A、T446A、S451A、S619A、S622A、T623A、S626A或T630A或其任何组合。普通技术人员可易于通过使用本领域中已知的方法,诸如定点诱变来修饰野生型Cel3a的核酸序列(SEQ ID NO:2)以编码具有一个或多个糖基化位点突变的多肽。
用于分离或克隆编码多肽的核酸序列的技术在本领域中是已知的,并且包括从基因组DNA分离、从cDNA制备或其组合。可例如通过使用熟知的聚合酶链式反应(PCR)或抗体表达文库筛选以检测具有共有结构特征的克隆DNA片段来实现从所述基因组DNA克隆本发明的核酸序列。参见例如Innis等,1990,PCR:A Guide to Methods and Application,Academic Press,New York。可使用其他扩增程序,诸如连接酶链式反应(LCR)、连接活化转录(LAT)和基于核苷酸序列的扩增(NASBA)。核酸序列可从里氏木霉菌株(例如野生型里氏木霉或里氏木霉RUTC30)或另一或相关生物体克隆,并且因此,例如可为核酸序列的多肽编码区域的等位基因或物种变体。
可通过在遗传工程改造中用于使核酸序列从它的天然位置重新定位于它将被再现所处的不同位点的标准克隆程序来获得核酸序列。克隆程序可涉及切除和分离包含编码多肽的核苷酸序列的所需片段,将所述片段插入载体分子中,以及将重组载体并入宿主细胞中,在所述宿主细胞中,多个拷贝或克隆的核苷酸序列将被复制。核苷酸序列可为基因组、cDNA、RNA、半合成、合成来源或其任何组合。
表达载体和宿主细胞
本发明也提供包含编码本文所述的具有纤维二糖酶活性的多肽的核酸序列的核酸构建体,所述核酸序列可操作地连接于一个或多个指导所表达多肽的表达、分泌和/或分离的控制序列。
如本文所用,“表达载体”是用于向宿主细胞中引入和表达目标核酸序列的核酸构建体。在一些实施方案中,载体包含可操作地连接于目标核酸序列,并且能够实现目标核酸序列中编码的多肽的表达的适合控制序列。控制序列可为由用于表达核酸序列的宿主细胞识别的适当启动子序列。在一个实施方案中,目标核酸序列是编码如本文所述的具有纤维二糖酶活性的多肽的核酸序列。
本发明的表达载体中的启动子可包括从编码细胞外或细胞内多肽的基因获得的对于宿主细胞是同源性或异源性的启动子、突变启动子、截短启动子和杂合启动子。
适于指导本发明的核酸构建体在细菌宿主细胞中转录的启动子的实例是从大肠杆菌lac操纵元、大肠杆菌tac启动子(杂合启动子,DeBoer等,PNAS,1983,80:21-25)、大肠杆菌rec A、大肠杆菌araBAD、大肠杆菌tetA和原核β-内酰胺酶获得的启动子。适合的启动子的其他实例包括病毒启动子,诸如来自噬菌体的启动子,包括T7启动子、T5启动子、T3启动子、M13启动子和SP6启动子。在一些实施方案中,超过一个启动子控制目标核酸序列的表达,例如大肠杆菌lac启动子和T7启动子。可适用于本发明中的其他启动子描述于“Usefulproteins from recombinant bacteria”,Scientific American,1980,242:74-94;以及Sambrook等,Molecular Cloning:A Laboratory Manual,1989中。在一些优选实施方案中,启动子是诱导型的,其中添加分子会刺激下游阅读框的转录和表达。
适于指导本发明的核酸构建体在真核宿主细胞中,例如在真菌或酵母细胞中转录的启动子的实例是从里氏木霉、甲醇诱导性醇氧化酶(AOX启动子)、构巢曲霉(Aspergillusnidulans)色氨酸生物合成(trpC启动子)、黑曲霉泡盛变种(Aspergillus nigervar.awamori)葡萄糖淀粉酶(glaA)、酿酒酵母(Saccharomyces cerevisiae)半乳糖激酶(GAL1)的基因获得的启动子或乳酸克鲁维酵母(Kluyveromyces lactis)Plac4-PBI启动子。
存在于本发明的表达载体中的控制序列也可为编码连接于多肽的氨基末端的氨基酸序列,并且将所编码多肽引导至细胞的分泌路径中的信号序列,例如分泌信号序列。信号序列可为内源性信号序列,例如其中当由目标多肽所源于的生物体内源性表达时,信号序列存在于野生型多肽的N末端。信号序列可为外来或异源性信号肽,其中信号序列来自不同生物体或来自不同于所表达的目标多肽的多肽。将所表达多肽引导至宿主细胞的分泌路径中的任何信号序列都可用于本发明中。通常,信号序列由6个与136个之间的碱性和/或疏水性氨基酸组成。
适于本发明的信号序列的实例包括来自酿酒酵母α因子的信号序列。
融合标签也可用于本发明的表达载体以有助于检测和纯化所表达多肽。适合的融合标签的实例包括His标签(例如3xHis、6x His(SEQ ID NO:6)或8xHis(SEQ ID NO:7))、GST标签、HSV标签、S标签、T7标签。其他适合的融合标签包括myc标签、血凝素(HA)标签和荧光蛋白标签(例如绿色荧光蛋白)。通常使融合标签可操作地连接于待表达的多肽的N末端或C末端。在一些实施方案中,在融合标签序列与待表达的多肽的N末端或C末端之间可存在接头区域。在一个实施方案中,接头区域包含具有1个至20个的氨基酸,不影响或改变所表达多肽的表达或功能的序列。
利用本文所述的融合标签允许例如通过使用特异性识别标签的抗体进行蛋白质印迹来检测所表达蛋白质。标签也允许例如通过亲和色谱法来从宿主细胞纯化所表达多肽。举例来说,可通过使用镍亲和色谱法来纯化融合于His标签的所表达多肽。His标签对镍离子具有亲和力,并且镍柱将截留his标记的多肽,同时允许所有其他蛋白质和细胞碎片流动通过柱。使用例如含有咪唑的洗脱缓冲液洗脱His标记的多肽使His标记的多肽从柱释放,从而产生大致上纯化的多肽。
本发明的表达载体可进一步包含如为本领域技术人员通常所知的用以使得能够分离用构建体转化的经遗传修饰的微生物的可选择标记基因。可选择标记基因可赋予对抗生素的抗性或在缺乏为宿主生物体所特定的营养物的培养基上生长的能力,所述宿主生物体否则不可在这些条件下生长。本发明不受对可选择标记基因的选择的限制,并且本领域技术人员可易于确定适当基因。举例来说,可选择标记基因可赋予对氨苄青霉素、氯霉素、四环素、卡那霉素、潮霉素、腐草霉素、遗传霉素或G418的抗性,或可弥补宿主微生物在trp、arg、leu、pyr4、pyr、ura3、ura5、his或ade基因中的一个基因方面的缺陷,或可赋予在乙酰胺作为唯一氮源的情况下生长的能力。
本发明的表达载体可进一步包含如为本领域技术人员通常所知的其他核酸序列,例如其他控制序列,例如转录终止子、用以将各种其他核酸序列连接在一起的合成序列、复制起点、核糖体结合位点、多克隆位点(或多接头位点)、多聚腺苷酸化信号等。适于表达载体的核糖体结合位点取决于所用的宿主细胞,例如对于在原核宿主细胞中表达,可使用原核RBS,例如T7噬菌体RBS。多克隆位点或多接头位点含有一个或多个优选不存在于表达载体的其余序列中的限制酶位点。限制酶位点用于插入编码具有纤维二糖酶活性的多肽的核酸序列或其他所需控制序列。本发明的实施不受这些其他核酸序列(例如其他控制序列)中的任何一个或多个的存在的限制。
适用于本发明中的表达载体的实例包括用于在原核生物中表达的载体,例如细菌表达载体。适用于本发明中的一种细菌表达载体是pET载体(Novagen),其含有以下:病毒T7启动子,其仅对T7RNA聚合酶(而非细菌RNA聚合酶)具有特异性,并且也不存在于原核基因组中任何地方;lac操纵子,其包含lac启动子和lac阻遏蛋白的编码序列(lacI基因);多接头;f1复制起点(以使当与M13辅助噬菌体共感染时,可产生单链质粒);氨苄青霉素抗性基因和ColE1复制起点(Blaber,1998)。启动子与lac操纵子两者均位于其中插入编码本文所述的多肽的核酸序列的多接头的5'或上游。lac操纵子赋予编码具有纤维二糖酶活性的多肽的核酸序列的可诱导表达。添加乳糖代谢物IPTG(异丙基β-D-1-硫代半乳糖吡喃糖苷)会触发lac操纵元的转录,并且诱导核酸序列在lac操纵子的控制下的蛋白质表达。使用这个系统要求向宿主细胞中添加T7RNA聚合酶以达成载体表达。T7RNA聚合酶可通过第二表达载体来引入,或可使用被遗传工程改造以表达T7RNA聚合酶的宿主细胞株。
供与本发明一起使用的示例性表达载体是可从Novagen商购获得的pET载体。pET表达系统描述于美国专利号4,952,496;5,693,489;和5,869,320中。在一个实施方案中,pET载体是可从Novagen商购获得的pET-DUET载体,例如pET-Duet1。适用于本发明中的其他载体包括含有His标签序列的载体,诸如美国专利号5,310,663和5,284,933;以及欧洲专利号282042中所述的那些。
本发明也涉及一种包含本发明的核酸序列或表达载体的宿主细胞,其用于重组产生具有纤维二糖酶活性的多肽。
将包含本发明的核酸序列的表达载体引入宿主细胞中以使所述载体得以维持(例如通过染色体整合或作为自我复制性染色体外载体),以便表达多肽。
宿主细胞可为原核生物或真核生物。宿主细胞可为细菌,诸如大肠杆菌菌株,例如K12菌株NovaBlue、NovaBlue T1R、JM109和DH5α。优选地,细菌细胞能够折叠或部分折叠外源表达的蛋白质,诸如大肠杆菌Origami菌株,例如Origami B、Origami B(DE3)、Origami 2和Origami 2(DE3)菌株。在一些实施方案中,可优选的是使用具有糖基化缺陷,或具有受损糖基化途径的宿主细胞以使由所述宿主细胞表达的蛋白质不被显著糖基化。
宿主细胞可为酵母或丝状真菌,特别是分类为子囊菌门(Ascomycota)的那些。适用作用于表达本发明的经修饰的TrCel3Aβ-葡萄糖苷酶的宿主微生物的酵母的属包括酵母属(Saccharomyces)、毕赤酵母属(Pichia)、汉逊酵母属(Hansenula)、克鲁维酵母属(Kluyveromyces)、耶罗威亚酵母属(Yarrowia)和Arxula。适用作用于表达本发明的多肽的微生物的真菌的属包括木霉属、肉座菌属(Hypocrea)、曲霉属、镰刀菌属、腐质霉属、链孢霉属(Neurospora)、金孢子菌属、毁丝霉属、梭孢壳属、侧孢霉属(Sporotrichum)和青霉属。举例来说,宿主细胞可为巴斯德毕赤酵母。举例来说,宿主细胞可为里氏木霉的工业菌株或其突变体,例如里氏木霉RUTC30。通常,宿主细胞是不表达亲本纤维二糖酶或Cel3a的细胞。
对例如细菌细胞或真菌细胞的特定宿主细胞的选择取决于用于产生本发明的无糖基化多肽的表达载体(例如控制序列)和/或方法,如以下进一步详细所述。
可通过由微生物转化领域技术人员所知的许多方法来将本发明的表达载体引入宿主细胞中,所述方法包括但不限于转化、用CaCl2处理细胞、电穿孔、基因枪轰击、脂质体转染和PEG介导的原生质体融合(例如White等,WO 2005/093072,其以引用的方式并入本文)。在选择含有表达载体的重组宿主细胞(例如通过利用表达载体的可选择标记进行选择)之后,可在诱导本发明的具有纤维二糖酶活性的多肽的表达的条件下培养重组宿主细胞。
用于产生无糖基化多肽的方法
本发明进一步提供用于产生如本文所述的具有纤维二糖酶活性的无糖基化多肽的方法。所述方法包括在适于表达多肽的条件下培养表达本发明的多肽的重组宿主细胞。所述方法也可包括从重组宿主细胞回收无糖基化多肽。
用于回收由原核生物和真核生物细胞表达的多肽的方法在本领域中是已知的。在各实施方案中,用于回收多肽的方法包括例如通过机械、化学或酶促手段来溶解细胞。举例来说,可例如通过声波处理、研磨(与珠粒一起振荡)或剪切力来将细胞物理破坏分开。可处理细胞膜以使它们可被渗透以便释放细胞的内含物,诸如用例如曲通(Triton)、NP-40或SDS的清洁剂处理。可使用诸如溶菌酶(lysozyme)或溶解酶(lysonase)的酶使具有细胞壁的细胞(例如细菌细胞)可被渗透。在本发明的情形下,上述机械、化学和酶促技术的任何组合也适于从宿主细胞回收所表达目标多肽。举例来说,当在例如大肠杆菌细胞的细菌细胞中表达本文所述的具有纤维二糖酶活性的无糖基化多肽时,通常通过离心和沉淀细胞培养物,以及再混悬于含有溶菌酶的溶解缓冲液中来使细胞溶解。为确保完全溶解,使再混悬细胞经受以下方法中的一种:声波处理、研磨或均质化。
在一个实施方案中,在添加至生物质中以进行糖化反应之前,不使本文所述的具有纤维二糖酶活性的所表达无糖基化多肽溶解。在一些情况下,用于溶解宿主细胞的方法可导致蛋白质变性和/或酶活性降低,此导致下游加工成本增加。因此,本发明也提供用于在糖化步骤之前将表达本文所述的具有纤维二糖酶活性的无糖基化多肽的宿主细胞直接添加至生物质中的方法。
在一个实施方案中,例如通过离心来分离表达本文所述的具有纤维二糖酶活性的无糖基化多肽的宿主细胞(例如大肠杆菌细胞),并且添加至糖化反应,例如含有生物质的糖化反应器中。通过来自生物质的剪切力、叶轮和增加温度的组合来使细胞溶解。在一个实施方案中,将表达本文所述的具有纤维二糖酶活性的无糖基化多肽的宿主细胞(例如大肠杆菌细胞)的培养物从发酵罐直接添加至糖化罐中,并且消除对通过离心来沉淀细胞的需要。
使用在糖基化方面缺陷的宿主细胞
在各实施方案中,表达载体包含编码可操作地连接于融合标签的本文所述的具有纤维二糖酶活性的多肽的核酸序列,所述表达载体被引入不使在细胞中表达的蛋白质显著糖基化的所述细胞(例如细菌宿主细胞)中,并且在所述细胞中表达。在用于表达多肽的条件下培养重组宿主细胞,从而导致产生具有纤维二糖酶活性的无糖基化多肽。可使用针对如本文所述的融合标签的亲和色谱方法从宿主细胞纯化或分离无糖基化多肽。
举例来说,在这个实施方案中,表达载体在编码具有纤维二糖酶活性的多肽的核酸序列的上游含有lac操纵子和T7启动子,并且宿主细胞能够表达T7RNA聚合酶。通过添加IPTG来诱导具有纤维二糖酶活性的多肽的表达。优选地,宿主细胞是大肠杆菌细胞,优选是大肠杆菌Origami细胞。在这个实施方案中,融合标签是His标签,并且对所表达无糖基化多肽的纯化包括镍亲和色谱法。
使用具有糖基化能力的宿主细胞
在另一实施方案中,在宿主细胞中表达包含编码如本文所述的多肽的核酸序列的表达载体,所述多肽包含一个或多个糖基化位点突变以使所述多肽不被糖基化,其中所述宿主细胞能够使在所述细胞内表达的蛋白质糖基化,例如酵母或真菌宿主细胞。或者,宿主细胞不能够使在所述细胞例如细菌宿主细胞内表达的蛋白质糖基化。在这个实施方案中,使多肽可操作地连接于融合标签。可使用针对如本文所述的融合标签的亲和色谱方法从细菌宿主细胞纯化或分离无糖基化多肽。
在另一实施方案中,在宿主细胞中表达包含编码本文所述的具有纤维二糖酶活性的多肽的核酸序列的表达载体,其中所述宿主细胞能够使在所述细胞内表达的蛋白质糖基化。在足以达成多肽的表达和糖基化的条件下培养细胞。在这个实施方案中,使多肽可操作地连接于融合标签。可使用针对如本文所述的融合标签的亲和色谱方法从细菌宿主细胞纯化或分离糖基化多肽。在从宿主细胞和其他内源性宿主酶(例如糖基化酶)纯化之后,可通过与去糖基化酶一起孵育来移除所分离的糖基化多肽的聚糖。去糖基化酶包括PNGase F、PNGase A、EndoH(内切糖苷酶H)、EndoS(内切糖苷酶S)、EndoD(内切糖苷酶D)、EndoF(内切糖苷酶F)、EndoF1(内切糖苷酶F1)或EndoF2(内切糖苷酶F2)。含有足以完全移除聚糖的酶的蛋白质去糖基化混合物可例如从New England Biolabs商购获得。使所分离多肽与一种或多种去糖基化酶在足以从多肽移除所有聚糖的条件下一起孵育。本领域中已知用于从多肽移除聚糖的其他方法,例如用弱碱进行β消除或温和肼解。可使用本领域中已知的用于染色和观察聚糖的方法或质谱法来确定对多肽的糖基化状态的评估。
在另一实施方案中,在宿主细胞中表达包含编码本文所述的具有纤维二糖酶活性的多肽的核酸序列的表达载体,其中所述宿主细胞能够使在所述细胞内表达的蛋白质糖基化。在足以表达多肽的条件下,但在糖基化抑制剂存在下培养细胞。糖基化抑制剂以使得所表达多肽不被糖基化的浓度并持续足够时间存在。在这个实施方案中,使多肽可操作地连接于融合标签。可使用针对如本文所述的融合标签的亲和色谱方法从细菌宿主细胞纯化或分离所得无糖基化多肽。
适用于这个实施方案中的糖基化抑制剂的实例包括衣霉素、苯甲基-GalNAc(苯甲基2-乙酰胺基-2-脱氧-α-D-吡喃半乳糖苷)、2-氟-2-脱氧-D-葡萄糖和5'CDP(5'二磷酸胞苷)。在一些实施方案中,使用糖基化抑制剂的组合。优选地,用于这个实施方案中的糖基化抑制剂的浓度足以抑制多肽的糖基化,但不导致细胞毒性或对宿主细胞的蛋白质表达的抑制。
使用无糖基化多肽产生产物的方法
本发明提供用于使用如本文所述的具有纤维二糖酶活性的无糖基化多肽将生物质转化或加工成产物的方法和组合物。用于使生物质转化成诸如糖产物的产物的方法在本领域中是已知的,例如如美国专利申请2014/0011258中所述,所述专利的内容以引用的方式整体并入本文。简要来说,将生物质进行最优预处理例如以降低不顺应性,并且通过涉及使所处理生物质与生物质降解酶或纤维素分解酶一起孵育以产生糖(例如葡萄糖和/或木糖)的糖化过程来糖化。可接着例如通过发酵或蒸馏来进一步加工糖产物以产生最终产物。最终产物包括醇(例如乙醇、异丁醇或正丁醇)、糖醇(例如赤藻糖醇、木糖醇或山梨糖醇)或有机酸(例如乳酸、丙酮酸、丁二酸)。
使用本文所述的方法,可使生物质材料转化成一种或多种产物,诸如能量、燃料、食物和材料。产物的具体实例包括但不限于氢气、糖(例如葡萄糖、木糖、阿拉伯糖、甘露糖、半乳糖、果糖、纤维二糖、二糖、寡糖和多糖)、醇(例如一元醇或二元醇,诸如乙醇、正丙醇、异丁醇、仲丁醇、叔丁醇或正丁醇)、水合醇或含水醇(例如含有大于10%、20%、30%或甚至大于40%水)、生物柴油、有机酸、烃(例如甲烷、乙烷、丙烷、异丁烯、戊烷、正己烷、生物柴油、生物汽油及其混合物)、副产物(例如蛋白质,诸如纤维素分解蛋白质(酶)或单细胞蛋白)、以及呈任何组合或相对浓度,并且任选地与任何添加剂(例如,燃料添加剂)组合的任何这些产物的混合物。其他实例包括羧酸、羧酸的盐、羧酸和羧酸的盐和羧酸的酯(例如甲酯、乙酯和正丙酯)的混合物、酮(例如丙酮)、醛(例如乙醛)、α和β不饱和酸(例如丙烯酸)和烯烃(例如乙烯)。其他醇和醇衍生物包括丙醇、丙二醇、1,4-丁二醇、1,3-丙二醇、糖醇和多元醇(例如二醇、甘油、赤藻糖醇、苏糖醇、阿糖醇、木糖醇、核糖醇、甘露糖醇、山梨糖醇、半乳糖醇、艾杜糖醇、肌醇、庚七醇、异麦芽酮糖醇、麦芽糖醇、乳糖醇、麦芽三糖醇、麦芽四糖醇和聚糖醇(polyglycitol)以及其他多元醇)、以及任何这些醇的甲酯或乙酯。其他产物包括丙烯酸甲酯、甲基丙烯酸甲酯、乳酸、柠檬酸、甲酸、乙酸、丙酸、丁酸、丁二酸、戊酸、己酸、3-羟基丙酸、棕榈酸、硬脂酸、草酸、丙二酸、戊二酸、油酸、亚油酸、乙醇酸、γ-羟基丁酸及其混合物、任何这些酸的盐、任何酸和它们的相应盐的混合物。
生物质
待使用本文所述的方法加工的生物质是包含纤维素的淀粉材料和/或纤维素材料,例如木质纤维素材料。生物质也可包含半纤维素和/或木质素。生物质可包括以下中的一种或多种:农业产品或废弃物、纸产品或废弃物、林业产品或一般性废弃物或其任何组合。农业产品或废弃物包括可被栽培、收获或加工以供例如由人或动物使用或消耗的材料;或由栽培、收获或加工方法产生的任何中间体、副产品或废弃物。农业产品或废弃物包括但不限于甘蔗、黄麻、大麻、亚麻、竹子、剑麻、苜蓿、干草、秘鲁胡萝卜、荞麦、香蕉、大麦、木薯、野葛、圆齿酢酱草、西米、高粱、马铃薯、甜薯、芋头、山药、菜豆、蚕豆、扁豆、豌豆、草、柳枝稷、芒草、绳草、草芦、谷物残渣、菜籽秆、小麦秆、大麦秆、燕麦秆、稻草、玉米穗轴、玉米秸杆、玉米纤维、椰子毛、甜菜浆、甘蔗渣、大豆秸杆、谷物残渣、稻壳、燕麦壳、小麦谷壳、大麦壳或细麸或其组合。纸产品或废弃物包括用于制造纸产品的材料;任何纸产品;或由制造或分解纸产品产生的任何中间体、副产品或废弃物。纸产品或废弃物包括但不限于纸、着色纸、装料纸、涂覆纸、瓦楞纸、填充纸、杂志、印刷品、打印纸、涂塑纸、卡片坯料、卡纸板、纸板或纸浆或其组合。林业产品或废弃物包括通过栽培、收获或加工木材产生的材料;或由栽培、收获或加工木材产生的任何中间体、副产品或废弃物。林业产品或废弃物包括但不限于白杨木、来自任何树属或树种的木材、刨花板、木片或锯屑或其组合。一般性废弃物包括但不限于粪肥、污水或垃圾或其组合。
在一个实施方案中,生物质包括农业废弃物,诸如玉米穗轴,例如玉米秸杆。在另一实施方案中,生物质包括草。
在一个实施方案中,在与本文所述的组合物接触之前处理生物质。举例来说,处理生物质以降低生物质的不顺应性,降低它的堆密度,和/或增加它的表面积。适合的生物质处理方法可包括但不限于:用电子进行轰击、声波处理、氧化、热解、蒸汽爆炸、化学处理、机械处理和冷冻研磨。优选地,处理方法是用电子进行轰击。
在一些实施方案中,进行电子轰击直至生物质接受至少0.5Mrad,例如至少5、10、20、30或至少40Mrad的总剂量。在一些实施方案中,进行处理直至生物质接受约0.5Mrad至约150Mrad、约1Mrad至约100Mrad、约5Mrad至约75Mrad、约2Mrad至约75Mrad、约10Mrad至约50Mrad,例如约5Mrad至约50Mrad、约20Mrad至约40Mrad、约10Mrad至约35Mrad、或约20Mrad至约30Mrad的剂量。在一些执行中,25至35Mrad的总剂量是优选的,在理想情况下历经几秒进行施加,例如在每次穿过5Mrad下,其中各次穿过被施加约1秒。在一些情况下,施加每次穿过大于7至9Mrad的剂量可导致原料材料的热降解。
生物质材料(例如植物生物质、动物生物质、纸和城市废物生物质)可用作原料以产生有用中间体和产物,诸如有机酸、有机酸的盐、酸酐、有机酸的酯和燃料,例如用于内燃机的燃料或用于燃料电池的原料。本文描述可使用可易于获得,但常常可难以加工的纤维素和/或木质纤维素材料作为原料的系统和方法,所述材料例如城市废物流和废纸流,诸如包括报纸、牛皮纸(kraft paper)、瓦楞纸或这些的混合物的流。
为了将生物质转化成可被容易加工的形式,可通过糖化剂(例如酶或酸)将原料中的含有葡聚糖或木聚糖的纤维素水解成低分子量碳水化合物如糖,所过过程被称为糖化。然后,低分子量碳水化合物可用于例如现有制造厂中,如单细胞蛋白质厂、酶制造厂或燃料厂,例如,乙醇制造设施。
可使用例如生物质降解酶的酶,通过使材料和所述酶在溶剂中,例如在水溶液中组合来水解生物质。可根据本文所述的方法制备/诱导酶。
具体来说,生物质降解酶可由能够分解生物质(诸如生物质的纤维素和/或木质素部分),或含有或制造各种纤维素分解酶(纤维素酶)、木质素酶或各种小分子生物质降解代谢物的生物体(例如微生物)供给。这些酶可为协同作用降解生物质的结晶纤维素或木质素部分的酶复合物。纤维素分解酶的实例包括:内切葡聚糖酶、纤维二糖水解酶和纤维二糖酶(β-葡萄糖苷酶)。
在糖化期间,纤维素底物可通过内切葡聚糖酶在随机位置初步水解,从而产生低聚中间体。这些中间体随后被作为外切葡聚糖酶如纤维二糖水解酶的底物,以从纤维素聚合物的末端产生纤维二糖。纤维二糖是水溶性的1,4-连接的葡萄糖二聚体。最后,纤维二糖酶裂解纤维二糖以得到葡萄糖。此过程的效率(例如,水解时间和/或水解完全性)取决于纤维素材料的不顺应性。
糖化
通常通过使不顺应性降低的生物质和生物质降解酶在例如水溶液的流体介质中组合来用以上讨论的生物质降解酶处理不顺应性降低的生物质。在一些情况下,在糖化之前在热水中煮沸、浸渍或蒸煮原料,如2012年4月26日公开的由Medoff和Masterman完成的美国专利申请公布2012/0100577 A1中所述,所述美国专利申请公布的整个内容被并入本文。
本文提供用于本文所述的糖化过程中的能够降解生物质的酶的混合物,例如生物质降解酶的酶混合物。
糖化过程可在制造厂中的储罐(例如,具有至少4000、40,000或500,000L体积的储罐)中部分或完全地进行,和/或可在转运中,例如,在轨道车、油罐卡车中或在高级油轮或船舱中部分或完全地进行。完全糖化所需要的时间将取决于工艺条件和所使用的生物质材料和酶。如果糖化是在受控的条件下在制造厂中进行,则纤维素可在约12-96小时内大致上完全转化成糖,例如葡萄糖。如果糖化是在转运中部分或完全地进行,则糖化可能花费较长时间。
在一优选实施方案中,在对于发生酶促反应最优的pH下,例如在对于生物质降解酶的活性最优的pH下发生糖化反应。优选地,糖化反应的pH在pH 4-4.5下。在一优选实施方案中,在对于发生酶促反应最优的温度下,例如在对于生物质降解酶的活性最优的温度下发生糖化反应。优选地,糖化反应的温度在42℃–52℃下。
通常优选在糖化期间例如使用喷射混合对储罐内容物进行混合,如在2010年5月18日提交的国际申请号PCT/US2010/035331中所描述,所述申请以英语公布为WO 2010/135380并且指定美国,所述申请的全部公开内容以引用的方式并入本文。
表面活性剂的添加可提高糖化速率。表面活性剂的实例包括非离子型表面活性剂(如20或80聚乙二醇表面活性剂)、离子型表面活性剂或两性表面活性剂。
通常优选的是由糖化得到的糖溶液的浓度相对较高,例如,大于40重量%,或大于50重量%、60重量%、70重量%、80重量%、90重量%或甚至大于95重量%。可例如通过蒸发去除水以增加糖溶液的浓度。这减小了待装运的体积并且还抑制了溶液中的微生物生长。
或者,可使用较低浓度的糖溶液,在这种情况下,可能希望以低浓度(例如,50至150ppm)添加抗微生物添加剂,例如广谱抗生素。其它适合的抗生素包括两性霉素B、氨苄青霉素、氯霉素、环丙沙星、庆大霉素、潮霉素B、卡那霉素、新霉素、青霉素、嘌呤霉素、链霉素。抗生素将在运输和储存期间抑制微生物的生长,并且可以适当的浓度(例如,按重量计在15与1000ppm之间,例如,在25与500ppm之间,或在50与150ppm之间)使用。如果希望,则即使糖浓度相对较高也可包括抗生素。或者,可使用具有抗微生物防腐特性的其它添加剂。优选地,抗微生物添加剂是食品级的。
可通过限制与酶一起添加到生物质材料中的水量来获得相对较高浓度的溶液。可例如通过控制糖化发生到何种程度来控制浓度。例如,可通过向溶液中添加更多生物质材料来增加浓度。为了保持正在溶液中产生的糖,可添加表面活性剂,例如,上文所论述的那些表面活性剂中一种。还可通过增加溶液的温度来增加溶解度。例如,可将溶液维持在40℃-50℃、60℃-80℃或甚至更高的温度下。
在本文所述的方法中,例如在糖化之后,可分离糖(例如葡萄糖和木糖)。举例来说,可通过沉淀、结晶、色谱法(例如模拟移动床色谱法、高压色谱法)、离心、提取、本领域中已知的任何其他分离方法及其组合来分离糖。
用于糖化的酶混合物
本发明提供一种酶混合物,其包含糖基化多肽,所述糖基化多肽包含与SEQ IDNO:1的至少50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性;和无糖基化多肽,所述无糖基化多肽包含与SEQ IDNO:1的至少50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性,其中所述糖基化多肽与所述无糖基化多肽两者均具有纤维二糖酶活性。具有纤维二糖酶活性的无糖基化多肽是任何本文所述的无糖基化多肽,例如使用本文所述的方法产生。可从内源性表达多肽的微生物分离或获得包含与SEQID NO:1的至少50%、55%、60%、65%、70%、75%、80%、85%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%同一性的糖基化多肽。
在一个实施方案中,糖基化多肽和无糖基化多肽均是来自野生型里氏木霉的例如包含SEQ ID NO:1的Cel3A酶。
在各实施方案中,酶混合物进一步包含至少一种源于微生物的其他酶,其中所述其他酶具有生物质或纤维素基材料降解活性,例如所述其他酶是纤维素分解酶,例如纤维素酶。举例来说,其他酶是木质素酶、内切葡聚糖酶、纤维二糖水解酶、木聚糖酶和纤维二糖酶。在一个实施方案中,混合物进一步包含一种或多种木质素酶、一种或多种内切葡聚糖酶、一种或多种纤维二糖水解酶和一种或多种木聚糖酶。在各实施方案中,其他生物质降解酶被糖基化。在各实施方案中,酶混合物进一步包含至少2种、至少3种、至少4种、至少5种、至少6种、至少7种、至少8种、至少9种或至少10种本文所述的其他生物质降解酶。举例来说,酶混合物进一步包含至少1种、至少2种、至少3种、至少4种、至少5种、至少6种、至少7种、至少8种、至少9种、至少10种、至少11种、至少12种、至少13种、至少14种、至少15种或所有表1中所列的酶。
举例来说,酶混合物进一步包含由微生物产生的其他生物质降解酶的混合物,所述微生物例如真菌细胞,诸如野生型里氏木霉或其突变体,例如里氏木霉RUTC30。在一个实施方案中,从微生物分离其他生物质降解酶。在一个实施方案中,混合物包含一种或多种以下生物质降解酶:B2AF03、CIP1、CIP2、Cel1a、Cel3a、Cel5a、Cel6a、Cel7a、Cel7b、Cel12a、Cel45a、Cel74a、paMan5a、paMan26a或膨胀蛋白或其任何组合。例如以上所列的其他生物质降解酶可从酶所源于的微生物(例如真菌细胞)内源性表达和分离(以下列于表1中)。或者,可使用类似表达方法在本文所述的宿主细胞中异源性表达例如以上所列的其他生物质降解酶,并且从所述宿主细胞分离。在一个实施方案中,异源性表达的其他生物质降解酶在酶的C末端或N末端用His标签进行标记,并且使用本领域中已知的镍亲和色谱法技术进行分离。举例来说,其他生物质降解酶可选自以下表1。
表1.其他生物质降解酶的实例
以下提供表1中所列的生物质降解酶的氨基酸序列。
B2AF03(鹅柄孢壳菌)
MKSSVFWGASLTSAVVRAIDLPFQFYPNCVDDLLSTNQVCNTTLSPPERAAALVAALTPEEKLQNIVSKSLGAPRIGLPAYNWWSEALHGVAYAPGTQFWQGDGPFNSSTSFPMPLLMAATFDDELLEKIAEVIGIEGRAFGNAGFSGLDYWTPNVNPFKDPRWGRGSETPGEDVLLVKRYAAAMIKGLEGPVPEKERRVVATCKHYAANDFEDWNGATRHNFNAKISLQDMAEYYFMPFQQCVRDSRVGSIMCAYNAVNGVPSCASPYLLQTILREHWNWTEHNNYITSDCEAVLDVSLNHKYAATNAEGTAISFEAGMDTSCEYEGSSDIPGAWSQGLLKESTVDRALLRLYEGIVRAGYFDGKQSLYSSLGWADVNKPSAQKLSLQAAVDGTVLLKNDGTLPLSDLLDKSRPKKVAMIGFWSDAKDKLRGGYSGTAAYLHTPAYAASQLGIPFSTASGPILHSDLASNQSWTDNAMAAAKDADYILYFGGIDTSAAGETKDRYDLDWPGAQLSLINLLTTLSKPLIVLQMGDQLDNTPLLSNPKINAILWANWPGQDGGTAVMELVTGLKSPAGRLPVTQYPSNFTELVPMTDMALRPSAGNSQLGRTYRWYKTPVQAFGFGLHYTTFSPKFGKKFPAVIDVDEVLEGCDDKYLDTCPLPDLPVVVENRGNRTSDYVALAFVSAPGVGPGPWPIKTLGAFTRLRGVKGGEKREGGLKWNLGNLARHDEEGNTVVYPGKYEVSLDEPPKARLRFEIVRGGKGKGKVKGKGKAAQKGGVVLDRWPKPPKGQEPPAIERV(SEQ ID NO:9)
CIP1(里氏木霉)
MVRRTALLALGALSTLSMAQISDDFESGWDQTKWPISAPDCNQGGTVSLDTTVAHSGSNSMKVVGGPNGYCGHIFFGTTQVPTGDVYVRAWIRLQTALGSNHVTFIIMPDTAQGGKHLRIGGQSQVLDYNRESDDATLPDLSPNGIASTVTLPTGAFQCFEYHLGTDGTIETWLNGSLIPGMTVGPGVDNPNDAGWTRASYIPEITGVNFGWEAYSGDVNTVWFDDISIASTRVGCGPGSPGGPGSSTTGRSSTSGPTSTSRPSTTIPPPTSRTTTATGPTQTHYGQCGGIGYSGPTVCASGTTCQVLNPYYSQCL(SEQ ID NO:10)
CIP2(里氏木霉)
MASRFFALLLLAIPIQAQSPVWGQCGGIGWSGPTTCVGGATCVSYNPYYSQCIPSTQASSSIASTTLVTSFTTTTATRTSASTPPASSTGAGGATCSALPGSITLRSNAKLNDLFTMFNGDKVTTKDKFSCRQAEMSELIQRYELGTLPGRPSTLTASFSGNTLTINCGEAGKSISFTVTITYPSSGTAPYPAIIGYGGGSLPAPAGVAMINFNNDNIAAQVNTGSRGQGKFYDLYGSSHSAGAMTAWAWGVSRVIDALELVPGARIDTTKIGVTGCSRNGKGAMVAGAFEKRIVLTLPQESGAGGSACWRISDYLKSQGANIQTASEIIGEDPWFSTTFNSYVNQVPVLPFDHHSLAALIAPRGLFVIDNNIDWLGPQSCFGCMTAAHMAWQALGVSDHMGYSQIGAHAHCAFPSNQQSQLTAFVQKFLLGQSTNTAIFQSDFSANQSQWIDWTTPTLS(SEQ ID NO:11)
Cel1a(里氏木霉)
MLPKDFQWGFATAAYQIEGAVDQDGRGPSIWDTFCAQPGKIADGSSGVTACDSYNRTAEDIALLKSLGAKSYRFSISWSRIIPEGGRGDAVNQAGIDHYVKFVDDLLDAGITPFITLFHWDLPEGLHQRYGGLLNRTEFPLDFENYARVMFRALPKVRNWITFNEPLCSAIPGYGSGTFAPGRQSTSEPWTVGHNILVAHGRAVKAYRDDFKPASGDGQIGIVLNGDFTYPWDAADPADKEAAERRLEFFTAWFADPIYLGDYPASMRKQLGDRLPTFTPEERALVHGSNDFYGMNHYTSNYIRHRSSPASADDTVGNVDVLFTNKQGNCIGPETQSPWLRPCAAGFRDFLVWISKRYGYPPIYVTENGTSIKGESDLPKEKILEDDFRVKYYNEYIRAMVTAVELDGVNVKGYFAWSLMDNFEWADGYVTRFGVTYVDYENGQKRFPKKSAKSLKPLFDELIAAA(SEQ ID NO:12)
Cel3a(里氏木霉)
MRYRTAAALALATGPFARADSHSTSGASAEAVVPPAGTPWGTAYDKAKAALAKLNLQDKVGIVSGVGWNGGPCVGNTSPASKISYPSLCLQDGPLGVRYSTGSTAFTPGVQAASTWDVNLIRERGQFIGEEVKASGIHVILGPVAGPLGKTPQGGRNWEGFGVDPYLTGIAMGQTINGIQSVGVQATAKHYILNEQELNRETISSNPDDRTLHELYTWPFADAVQANVASVMCSYNKVNTTWACEDQYTLQTVLKDQLGFPGYVMTDWNAQHTTVQSANSGLDMSMPGTDFNGNNRLWGPALTNAVNSNQVPTSRVDDMVTRILAAWYLTGQDQAGYPSFNISRNVQGNHKTNVRAIARDGIVLLKNDANILPLKKPASIAVVGSAAIIGNHARNSPSCNDKGCDDGALGMGWGSGAVNYPYFVAPYDAINTRASSQGTQVTLSNTDNTSSGASAARGKDVAIVFITADSGEGYITVEGNAGDRNNLDPWHNGNALVQAVAGANSNVIVVVHSVGAIILEQILALPQVKAVVWAGLPSQESGNALVDVLWGDVSPSGKLVYTIAKSPNDYNTRIVSGGSDSFSEGLFIDYKHFDDANITPRYEFGYGLSYTKFNYSRLSVLSTAKSGPATGAVVPGGPSDLFQNVATVTVDIANSGQVTGAEVAQLYITYPSSAPRTPPKQLRGFAKLNLTPGQSGTATFNIRRRDLSYWDTASQKWVVPSGSFGISVGASSRDIRLTSTLSVA(SEQ ID NO:13)
Cel5a(里氏木霉)
MNKSVAPLLLAASILYGGAAAQQTVWGQCGGIGWSGPTNCAPGSACSTLNPYYAQCIPGATTITTSTRPPSGPTTTTRATSTSSSTPPTSSGVRFAGVNIAGFDFGCTTDGTCVTSKVYPPLKNFTGSNNYPDGIGQMQHFVNDDGMTIFRLPVGWQYLVNNNLGGNLDSTSISKYDQLVQGCLSLGAYCIVDIHNYARWNGGIIGQGGPTNAQFTSLWSQLASKYASQSRVWFGIMNEPHDVNINTWAATVQEVVTAIRNAGATSQFISLPGNDWQSAGAFISDGSAAALSQVTNPDGSTTNLIFDVHKYLDSDNSGTHAECTTNNIDGAFSPLATWLRQNNRQAILTETGGGNVQSCIQDMCQQIQYLNQNSDVYLGYVGWGAGSFDSTYVLTETPTGSGNSWTDTSLVSSCLARK(SEQ ID NO:14)
Cel6a(里氏木霉)
MIVGILTTLATLATLAASVPLEERQACSSVWGQCGGQNWSGPTCCASGSTCVYSNDYYSQCLPGAASSSSSTRAASTTSRVSPTTSRSSSATPPPGSTTTRVPPVGSGTATYSGNPFVGVTPWANAYYASEVSSLAIPSLTGAMATAAAAVAKVPSFMWLDTLDKTPLMEQTLADIRTANKNGGNYAGQFVVYDLPDRDCAALASNGEYSIADGGVAKYKNYIDTIRQIVVEYSDIRTLLVIEPDSLANLVTNLGTPKCANAQSAYLECINYAVTQLNLPNVAMYLDAGHAGWLGWPANQDPAAQLFANVYKNASSPRALRGLATNVANYNGWNITSPPSYTQGNAVYNEKLYIHAIGPLLANHGWSNAFFITDQGRSGKQPTGQQQWGDWCNVIGTGFGIRPSANTGDSLLDSFVWVKPGGECDGTSDSSAPRFDSHCALPDALQPAPQAGAWFQAYFVQLLTNANPSFL(SEQ ID NO:15)
Cel7a(里氏木霉)
MYRKLAVISAFLATARAQSACTLQSETHPPLTWQKCSSGGTCTQQTGSVVIDANWRWTHATNSSTNCYDGNTWSSTLCPDNETCAKNCCLDGAAYASTYGVTTSGNSLSIGFVTQSAQKNVGARLYLMASDTTYQEFTLLGNEFSFDVDVSQLPCGLNGALYFVSMDADGGVSKYPTNTAGAKYGTGYCDSQCPRDLKFINGQANVEGWEPSSNNANTGIGGHGSCCSEMDIWEANSISEALTPHPCTTVGQEICEGDGCGGTYSDNRYGGTCDPDGCDWNPYRLGNTSFYGPGSSFTLDTTKKLTVVTQFETSGAINRYYVQNGVTFQQPNAELGSYSGNELNDDYCTAEEAEFGGSSFSDKGGLTQFKKATSGGMVLVMSLWDDYYANMLWLDSTYPTNETSSTPGAVRGSCSTSSGVPAQVESQSPNAKVTFSNIKFGPIGSTGNPSGGNPPGGNPPGTTTTRRPATTTGSSPGPTQSHYGQCGGIGYSGPTVCASGTTCQVLNPYYSQCL(SEQ ID NO:16)
Cel7b(里氏木霉)
MAPSVTLPLTTAILAIARLVAAQQPGTSTPEVHPKLTTYKCTKSGGCVAQDTSVVLDWNYRWMHDANYNSCTVNGGVNTTLCPDEATCGKNCFIEGVDYAASGVTTSGSSLTMNQYMPSSSGGYSSVSPRLYLLDSDGEYVMLKLNGQELSFDVDLSALPCGENGSLYLSQMDENGGANQYNTAGANYGSGYCDAQCPVQTWRNGTLNTSHQGFCCNEMDILEGNSRANALTPHSCTATACDSAGCGFNPYGSGYKSYYGPGDTVDTSKTFTIITQFNTDNGSPSGNLVSITRKYQQNGVDIPSAQPGGDTISSCPSASAYGGLATMGKALSSGMVLVFSIWNDNSQYMNWLDSGNAGPCSSTEGNPSNILANNPNTHVVFSNIRWGDIGSTTNSTAPPPPPASSTTFSTTRRSSTTSSSPSCTQTHWGQCGGIGYSGCKTCTSGTTCQYSNDYYSQCL(SEQ ID NO:17)
Cel12a(里氏木霉)
MKFLQVLPALIPAALAQTSCDQWATFTGNGYTVSNNLWGASAGSGFGCVTAVSLSGGASWHADWQWSGGQNNVKSYQNSQIAIPQKRTVNSISSMPTTASWSYSGSNIRANVAYDLFTAANPNHVTYSGDYELMIWLGKYGDIGPIGSSQGTVNVGGQSWTLYYGYNGAMQVYSFVAQTNTTNYSGDVKNFFNYLRDNKGYNAAGQYVLSYQFGTEPFTGSGTLNVASWTASIN(SEQ ID NO:18)
Cel45a(里氏木霉)
MKATLVLGSLIVGAVSAYKATTTRYYDGQEGACGCGSSSGAFPWQLGIGNGVYTAAGSQALFDTAGASWCGAGCGKCYQLTSTGQAPCSSCGTGGAAGQSIIVMVTNLCPNNGNAQWCPVVGGTNQYGYSYHFDIMAQNEIFGDNVVVDFEPIACPGQAASDWGTCLCVGQQETDPTPVLGNDTGSTPPGSSPPATSSSPPSGGGQQTLYGQCGGAGWTGPTTCQAPGTCKVQNQWYSQCLP(SEQ ID NO:19)
Cel74a(里氏木霉)
MKVSRVLALVLGAVIPAHAAFSWKNVKLGGGGGFVPGIIFHPKTKGVAYARTDIGGLYRLNADDSWTAVTDGIADNAGWHNWGIDAVALDPQDDQKVYAAVGMYTNSWDPSNGAIIRSSDRGATWSFTNLPFKVGGNMPGRGAGERLAVDPANSNIIYFGARSGNGLWKSTDGGVTFSKVSSFTATGTYIPDPSDSNGYNSDKQGLMWVTFDSTSSTTGGATSRIFVGTADNITASVYVSTNAGSTWSAVPGQPGKYFPHKAKLQPAEKALYLTYSDGTGPYDGTLGSVWRYDIAGGTWKDITPVSGSDLYFGFGGLGLDLQKPGTLVVASLNSWWPDAQLFRSTDSGTTWSPIWAWASYPTETYYYSISTPKAPWIKNNFIDVTSESPSDGLIKRLGWMIESLEIDPTDSNHWLYGTGMTIFGGHDLTNWDTRHNVSIQSLADGIEEFSVQDLASAPGGSELLAAVGDDNGFTFASRNDLGTSPQTVWATPTWATSTSVDYAGNSVKSVVRVGNTAGTQQVAISSDGGATWSIDYAADTSMNGGTVAYSADGDTILWSTASSGVQRSQFQGSFASVSSLPAGAVIASDKKTNSVFYAGSGSTFYVSKDTGSSFTRGPKLGSAGTIRDIAAHPTTAGTLYVSTDVGIFRSTDSGTTFGQVSTALTNTYQIALGVGSGSNWNLYAFGTGPSGARLYASGDSGASWTDIQGSQGFGSIDSTKVAGSGSTAGQVYVGTNGRGVFYAQGTVGGGTGGTSSSTKQSSSSTSSASSSTTLRSSVVSTTRASTVTSSRTSSAAGPTGSGVAGHYAQCGGIGWTGPTQCVAPYVCQKQNDYYYQCV(SEQ IDNO:20)
paMan5a(鹅柄孢壳菌)
MKGLFAFGLGLLSLVNALPQAQGGGAAASAKVSGTRFVIDGKTGYFAGTNSYWIGFLTNNRDVDTTLDHIASSGLKILRVWGFNDVNNQPSGNTVWFQRLASSGSQINTGPNGLQRLDYLVRSAETRGIKLIIALVNYWDDFGGMKAYVNAFGGTKESWYTNARAQEQYKRYIQAVVSRYVNSPAIFAWELANEPRCKGCNTNVIFNWATQISDYIRSLDKDHLITLGDEGFGLPGQTTYPYQYGEGTDFVKNLQIKNLDFGTFHMYPGHWGVPTSFGPGWIKDHAAACRAAGKPCLLEEYGYESDRCNVQKGWQQASRELSRDGMSGDLFWQWGDQLSTGQTHNDGFTIYYGSSLATCLVTDHVRAINALPA(SEQ ID NO:21)
paMan26a(鹅柄孢壳菌)
MVKLLDIGLFALALASSAVAKPCKPRDGPVTYEAEDAILTGTTVDTAQVGYTGRGYVTGFDEGSDKITFQISSATTKLYDLSIRYAAIYGDKRTNVVLNNGAVSEVFFPAGDSFTSVAAGQVLLNAGQNTIDIVNNWGWYLIDSITLTPSAPRPPHDINPNLNNPNADTNAKKLYSYLRSVYGNKIISGQQELHHAEWIRQQTGKTPALVAVDLMDYSPSRVERGTTSHAVEDAIAHHNAGGIVSVLWHWNAPVGLYDTEENKWWSGFYTRATDFDIAATLANPQGANYTLLIRDIDAIAVQLKRLEAAGVPVLWRPLHEAEGGWFWWGAKGPEPAKQLWDILYERLTVHHGLDNLIWVWNSILEDWYPGDDTVDILSADVYAQGNGPMSTQYNELIALGRDKKMIAAAEVGAAPLPGLLQAYQANWLWFAVWGDDFINNPSWNTVAVLNEIYNSDYVLTLDEIQGWRS(SEQ ID NO:22)
膨胀蛋白(里氏木霉)
MAGKLILVALASLVSLSIQQNCAALFGQCGGIGWSGTTCCVAGAQCSFVNDWYSQCLASTGGNPPNGTTSSSLVSRTSSASSSVGSSSPGGNSPTGSASTYTTTDTATVAPHSQSPYPSIAASSCGSWTLVDNVCCPSYCANDDTSESCSGCGTCTTPPSADCKSGTMYPEVHHVSSNESWHYSRSTHFGLTSGGACGFGLYGLCTKGSVTASWTDPMLGATCDAFCTAYPLLCKDPTGTTLRGNFAAPNGDYYTQFWSSLPGALDNYLSCGECIELIQTKPDGTDYAVGEAGYTDPITLEIVDSCPCSANSKWCCGPGADHCGEIDFKYGCPLPADSIHLDLSDIAMGRLQGNGSLTNGVIPTRYRRVQCPKVGNAYIWLRNGGGPYYFALTAVNTNGPGSVTKIEIKGADTDNWVALVHDPNYTSSRPQERYGSWVIPQGSGPFNLPVGIRLTSPTGEQIVNEQAIKTFTPPATGDPNFYYIDIGVQFSQN(SEQ ID NO:23)
本文所述的无糖基化多肽与混合物中其他生物质降解酶之间的比率可为例如至少1:1;1:2;1:4;1:8;1:16;1:32;1:50;1:75;1:100、1:150;1:200;1:300、1:400或1:500。在一个实施方案中,本文所述的无糖基化多肽与混合物中其他酶的比率是1:32。本文所述的无糖基化多肽与糖基化多肽之间的比率是例如至少1:1;1:2;1:4;1:8;1:16;1:32;1:50;1:75;1:100、1:150;1:200;1:300、1:400或1:500。
适用于本发明的酶混合物中的生物质降解酶的其他实例包括来自芽孢杆菌属、鬼伞属、毁丝霉属、头孢霉属、柱顶孢霉属、青霉属、曲霉属、假单胞菌属、腐质霉属、镰刀菌属、梭孢壳属、枝顶孢属、金孢子菌属和木霉属中的种的酶,特别是由选自以下种的菌株产生的那些:曲霉属(参见例如欧洲公布号0458162)、特异腐质霉(重新分类为嗜热柱顶孢霉,参见例如美国专利号4,435,307)、灰盖鬼伞、尖孢镰刀菌、嗜热毁丝霉、大型亚灰树花菌、太瑞斯梭孢壳霉、枝顶孢属种(包括但不限于桃色枝顶孢、A.acremonium、A.brachypenium、A.dichromosporum、A.obclavatum、A.pinkertoniae、灰粉枝顶孢、A.incoloratum和棕色枝顶孢)。优选菌株包括特异腐质霉DSM1800、尖孢镰刀菌DSM 2672、嗜热毁丝霉CBS 117.65、头孢霉属种RYM-202、枝顶孢属种CBS 478.94、枝顶孢属种CBS 265.95、桃色枝顶孢CBS169.65、Acremonium acremonium AHU 9519、头孢霉属种CBS 535.71、Acremoniumbrachypenium CBS 866.73、Acremonium dichromosporum CBS 683.73、Acremoniumobclavatum CBS 311.74、Acremonium pinkertoniae CBS 157.70、灰粉枝顶孢CBS134.56、Acremonium incoloratumCBS 146.62和棕色枝顶孢CBS 299.70H。生物质降解酶也可从金孢子菌属,优选Chrysosporium lucknowense菌株获得。可使用的其他菌株包括但不限于木霉属(特别是绿色木霉、里氏木霉和康宁木霉)、嗜碱性芽孢杆菌属(alkalophilicBacillus)(参见例如美国专利号3,844,890和欧洲公布号0458162)和链霉菌属(参见例如欧洲公布号0458162)。
在各实施方案中,在相较于未诱导微生物,适于使生物质降解酶的产生增加的条件下诱导微生物来产生本文所述的生物质降解酶。举例来说,使包含如本文所述的生物质的诱导生物质样品与微生物一起孵育以增加生物质降解酶的产生。对诱导过程的进一步描述可见于US 2014/0011258中,所述专利的内容据此以引用的方式整体并入。
由以上提及的微生物产生和/或分泌的生物质降解酶可被分离并添加至本发明的酶混合物中。或者,在一个实施方案中,在添加至糖化反应中之前,不使以上提及的表达本文和以上所述的生物质降解酶的微生物或宿主细胞溶解。
在一个实施方案中,酶混合物包含表达如本文所述的具有纤维二糖酶活性的无糖基化多肽的宿主细胞和一种或多种本文所述的其他生物质降解酶。在一个实施方案中,酶混合物包含表达如本文所述的具有纤维二糖酶活性的无糖基化多肽的宿主细胞和一种或多种表达一种或多种本文所述的其他生物质降解酶的宿主细胞。举例来说,
相较于由使用生物质降解酶的标准混合物(例如RUTC30混合物,例如不添加具有纤维二糖酶活性的无糖基化多肽)进行糖化获得的糖产物的产率,使用本文所述的包含具有纤维二糖酶活性的无糖基化多肽的酶混合物导致由糖化获得的糖产物的产率增加。当将具有纤维二糖酶活性的无糖基化多肽添加至糖化过程中时,糖产物的产率增加至少5%、至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少60%、至少70%、至少80%、至少90%、至少100%。
进一步加工
可对由糖化产生的糖进行进一步加工步骤以产生替代性产物。举例来说,糖可被氢化、发酵或用其他化学物质处理以产生其他产物。
葡萄糖可被氢化成山梨糖醇。木糖可被氢化成木糖醇。氢化可通过使用催化剂(例如,Pt/γ-Al2O3、Ru/C、雷尼镍(Raney Nickel)或本领域中已知的其他催化剂)与H2组合在高压(例如10至12000psi)下来实现。可使用本领域中已知的方法分离和纯化山梨糖醇和/或木糖醇产物。
由糖化获得的糖产物也可被发酵以产生醇;糖醇,诸如赤藻糖醇;或有机酸,例如乳酸、谷氨酸或柠檬酸或氨基酸。
酵母和发酵单胞菌属(Zymomonas)细菌,例如,可用于将一种或多种糖发酵或转化成一种或多种醇。其它微生物在下文进行讨论。发酵的最佳pH是约pH 4至7。例如,酵母的最佳pH是约pH 4至5,而发酵单胞菌的最佳pH是约pH 5至6。典型的发酵时间是约24至168小时(例如,24至96小时),其中温度在20℃至40℃(例如,26℃至40℃)范围内,然而嗜热微生物偏好较高的温度。
在一些实施方案中,例如,当使用厌氧生物体时,至少一部分发酵是在不存在氧的情况下,例如,在惰性气体如N2、Ar、He、CO2或其混合物的覆盖层下进行。另外,混合物可具有在部分或全部发酵期间流经储罐的惰性气体的恒定吹扫。在一些情况下,可通过发酵期间的二氧化碳产生来实现或维持厌氧条件而不需要额外的惰性气体。
在一些实施方案中,可在低分子量糖完全转化成产物(例如,乙醇)之前中断全部或部分发酵过程。中间体发酵产物包括高浓度的糖和碳水化合物。糖和碳水化合物可经由本领域已知的任何手段进行分离。这些中间体发酵产物可用于制备用于人或动物消耗的食品。另外或可替代地,可在不锈钢实验室磨机中将中间体发酵产物研磨成细小粒子尺寸以产生面粉状物质。
可在发酵期间使用射流混合,并且在一些情况下在同一储罐中进行糖化和发酵。
可在糖化和/或发酵期间添加微生物的营养物,例如,在2011年7月15日提交的美国专利申请公布2012/0052536中所述的基于食品的营养物包,所述专利申请公布的完整公开内容以引用的方式并入本文。
“发酵”包括2012年12月22日提交的美国临时申请号61/579,559和2012年12月22日提交的美国临时申请号61/579,576中公开的方法和产物,所述美国临时申请两者的内容均以引用的方式整体并入本文。
可利用移动发酵罐,如在国际申请号PCT/US2007/074028(其在2007年7月20日提交,以英语公布为WO2008/011598并且指定美国)中所描述,所述申请的内容以引用的方式整体并入本文。类似地,糖化设备可以是可移动的。此外,糖化和/或发酵可以在转运期间部分或完全地进行。
在发酵中使用的微生物可以是天然存在的微生物和/或工程化的微生物。例如,微生物可以是细菌(包括但不限于,例如纤维素分解细菌)、真菌(包括但不限于,例如酵母)、植物、原生生物,例如,原生动物或真菌样原生动物(包括但不限于,例如,粘菌)或海藻。当生物体相容时,可使用生物体的混合物。
合适的发酵微生物具有将碳水化合物(如葡萄糖、果糖、木糖、阿拉伯糖、甘露糖、半乳糖、寡糖或多糖)转化成发酵产物的能力。发酵微生物包括以下种属的菌株:酵母属菌种(Saccharomyces spp.)(包括但不限于酿酒酵母(S.cerevisiae)(面包酵母)、糖化酵母(S.distaticus)、葡萄汁酵母(S.uvarum))、克鲁维酵母(Kluyveromyces)属(包括但不限于马克斯克鲁维酵母(K.marxianus)、脆壁克鲁维酵母(K.fragilis))、假丝酵母(Candida)属(包括但不限于假热带假丝酵母(C.pseudotropicalis)和芸薹假丝酵母(C.brassicae))、树干毕赤酵母(Pichia stipitis)(休哈塔假丝酵母(Candida shehatae)的亲缘菌)、棒孢酵母(Clavispora)属(包括但不限于葡萄牙棒孢酵母(C.lusitaniae)和仙人掌棒孢酵母(C.opuntiae))、管囊酵母(Pachysolen)属(包括但不限于嗜鞣管囊酵母(P.tannophilus))、酒香酵母(Bretannomyces)属(包括但不限于,例如铁红梅氏酒香酵母(B.clausenii)(Handbook on Bioethanol:Production and Utilization,Wyman,C.E.编,Taylor&Francis,Washington,D.C.,179-212中的Philippidis,G.P.,1996,Cellulosebioconversion technology))。其它适合的微生物包括例如运动发酵单胞菌(Zymomonasmobilis)、梭菌属菌种(Clostridium spp.)(包括但不限于热纤维梭菌(C.thermocellum)(Philippidis,1996,同上)、糖丁基丙酮梭菌(C.saccharobutylacetonicum)、糖丁酸梭菌(C.saccharobutylicum)、略紫色梭菌(C.Puniceum)、拜氏梭菌(C.beijernckii)以及丙酮丁醇梭菌(C.acetobutylicum))、丛梗孢酵母(Moniliella pollinis)、Moniliellamegachiliensis、乳酸杆菌属种(Lactobacillus spp.)、解脂耶氏酵母(Yarrowialipolytica)、短梗霉属菌种(Aureobasidium sp.)、三型孢菌属菌种(Trichosporonoidessp.)、变异三角酵母(Trigonopsis variabilis)、毛孢子菌属菌种(Trichosporon sp.)、丛梗孢酵母属菌种(Moniliellaacetoabutans sp.)、变异核瑚菌(Typhula variabilis)、木兰假丝酵母(Candida magnoliae)、黑粉菌纲属菌种(Ustilaginomycetes sp.)、筑波拟酵母(Pseudozyma tsukubaensis)、接合酵母属(Zygosaccharomyces)的酵母种、德巴利酵母属(Debaryomyces)、汉逊酵母属(Hansenula)和毕赤酵母属(Pichia)、以及暗丛梗孢形圆酵母属(Torula)的真菌。
举例来说,梭菌属种可用于产生乙醇、丁醇、丁酸、乙酸和丙酮。乳酸杆菌属种可用于产生乳酸。
许多这样的微生物菌株可公开商购获得抑或通过储藏所获得,所述储藏所如,例如,ATCC(美国典型培养物保藏中心(American Type Culture Collection),Manassas,Va.,USA)、NRRL(农业研究服务培养物保藏中心(Agricultural Research ServiceCulture Collection),Peoria,Ill.,USA)或DSMZ(德意志微生物保藏中心(DeutscheSammlung von Mikroorganismen und Zellkulturen GmbH),Braunschweig,Germany)。
可商购获得的酵母包括,例如,Red/乐斯福乙醇红(Lesaffre EthanolRed)(可从Red Star/Lesaffre,USA获得)、(可从Fleischmann's Yeast(BurnsPhilip Food Inc.的部门),USA获得)、(可从Alltech,现在的Lalemand获得)、GERT(可从Gert Strand AB,Sweden获得)以及(可从DSMSpecialties获得)。
可用于糖化生物质材料和产生糖的许多微生物也可用于使那些糖发酵和转化成有用产物。
在发酵之后,可使用例如“醪塔”蒸馏所得流体以使乙醇和其它醇与大部分水和残余固体分离。出醪塔的蒸气可以是例如35重量%乙醇并且可被供应至精馏塔中。可使用气相分子筛将来自精馏塔的接近共沸的(92.5%)乙醇与水的混合物纯化为纯(99.5%)乙醇。可将醪塔底部物传送至三效蒸发器的第一效。精馏塔回流冷凝器可为此第一效提供热量。在第一效之后,可使用离心机分离固体并且在旋转干燥器中干燥。可将离心机流出液的一部分(25%)再循环至发酵,并且将其余部分传送至第二效蒸发器和第三效蒸发器中。大部分蒸发器冷凝液可作为相当干净的冷凝液返回所述过程中,其中分离一小部分至废水处理以防止低沸点化合物的积累。
可使用由本文所述的方法获得的产物的其他类型的化学转化,例如产生有机糖衍生产物(例如糠醛和糠醛衍生产物)。糖衍生产物的化学转化描述于2012年7月3日提交的美国临时申请号61/667,481中,所述美国临时申请的公开内容以引用的方式整体并入本文。
实施例
通过参照以下实验实施例来进一步详述本发明。除非另外规定,否则这些实施例仅出于说明的目的提供,并且不意图具有限制性。因此,本发明决不应解释为限于以下实施例,而是应解释为涵盖由于本文提供的教义而变得明显的任何和所有变化形式。
在不进一步描述的情况下,据信本领域普通技术人员可使用先前描述和以下说明性实施例制备和利用本发明化合物以及实施要求保护的方法。以下操作实施例明确指出本发明的各个方面,并且不应解释为以任何方式限制本公开的其余部分。
实施例1:将Cel3a-C'His克隆至表达载体中
成熟Cel3a序列(氨基酸20-744)由Genewiz合成并针对大肠杆菌表达进行密码子优化。在以下实施例中提及的Cel3a-C'His是指在C末端具有8xHis(SEQ ID NO:7)标签的密码子优化的成熟Cel3a序列(aa 20-744)。以下引物用于将Cel3a-C'His克隆至pET-Duet(Novagen,目录号71146)中:
正向5'–CATGCCATGGGCGATAGTCACAGTACCAGC(SEQ ID NO:4)
反向3'–CCCAAGCTTTCATTAGTGATGATGATGATGATGATGATGGCTGCCGCTGCCGGCAACACTCAGGGTGC(SEQ ID NO:5)
(NcoI和HindIII位点被加下划线;起始密码子和终止密码子用粗体表示;聚组氨酸(8-His(SEQ ID NO:7))标签;和甘氨酸-丝氨酸(GSGS)接头(SEQ ID NO:8)用斜体表示。)
使用PfuUltra II Fusion HS聚合酶(Agilent,目录号600672)进行扩增反应。
通过使用NcoI限制酶(New England Biolabs,R3193)和HindIII限制酶(NewEngland Biolabs,R3104)在由制造商建议的条件下进行限制消化来克隆扩增的DNA。使用T4DNA连接酶(New England Biolabs,M0202)将消化的扩增DNA连接至pETDuet载体中的NcoI-HindIII位点中,随后转化大肠杆菌克隆宿主Top10One Shot(Invitrogen)。使用Qiagen的质粒纯化试剂盒进行质粒纯化。
实施例2:表达和纯化Cel3a-C'His
将Cel3A-C'His构建体转化至大肠杆菌表达宿主Origami B(DE3)(EMDMillipore,目录号70837)中,并且在含有LB培养基和100μg/ml氨苄青霉素(FisherScientific,目录号BP1760)、15μg/ml卡那霉素(kanamysin)(Fisher Scientific,目录号BP906)和12.5μg/ml四环素(Fisher Scientific,目录号BP912)的板上划线。从板挑选携带重组DNA的菌落以接种2ml起子培养物(starter culture),并且在37℃下生长过夜,接着随后用于接种100ml含有适当抗生素的LB培养基。使培养物在37℃下生长直至OD600达到0.8。
为诱导蛋白质表达,添加500μM IPTG(异丙基-b-D-硫代半乳糖吡喃糖苷;FisherScientific,目录号BP1755)。使表达培养物在37℃下进一步再生长4小时。通过使用Sorvall St16转子TX400,在室温(RT)下在4000g下离心20分钟来收集细胞;并且将沉淀储存在-80℃下。
对于蛋白质提取,在冰上解冻细胞沉淀,并且再混悬于2ml含有50mM Tris-HCl(pH7.5)、0.1%曲通X-100、5mM咪唑(Fisher Scientific,目录号O3196)和1mg/ml溶菌酶(Fisher Scientific,目录号BP535)的非变性溶解缓冲液中,接着在冰上孵育20分钟。为消化样品中的DNA,添加2μl溶解酶(lysonase)(EMD Millipore,目录号71230),并且再孵育10分钟。接着在微量离心机中在4℃下在最大速度下离心样品10分钟。将澄清溶解产物转移至含有100μl预平衡Profinity(Biorad)Ni装料IMAC树脂浆液(Biorad,目录号732-4614)的新管中。非变性结合缓冲液由50mM Tris HCl(pH 7.5)、150mM NaCl、0.1%曲通X-100和5μM咪唑组成。使蛋白质在室温下分批结合1小时,接着用含有25μM咪唑的非变性缓冲液洗涤。将蛋白质洗脱于300ml含有200μM咪唑的非变性缓冲液中。由上述表达和纯化过程获得的纯化Cel3a蛋白显示于图1中。
实施例3:在生物反应器中表达Cel3a-C'His
在这个实施例中,将Cel3a的表达和纯化按比例扩大至3升和5升生物反应器。熟练技术人员可易于使用本文所述的方法来将产生进一步扩大,例如扩大至3L和7L生物反应器。
对于各生物反应器操作,将pET Duet-1Cel3a-C'His构建体转化至大肠杆菌Origami B(DE3)宿主细胞系中,并且在含有LB培养基和100μg/ml氨苄青霉素(FisherScientific,目录号BP1760)、15μg/ml卡那霉素(kanamysin)(Fisher Scientific,目录号BP906)和12.5μg/ml四环素(Fisher Scientific,目录号BP912)的板上划线。
在第1天,从板挑选携带重组DNA的菌落以接种200ml起子培养物,并且在37℃下生长过夜。准备生物反应器,例如与适当抗生素一起添加1.5L LB培养基至各3L反应器中,并且将4L LB培养基添加至各5L反应器中。各反应器具有pH探头、溶氧(DO)探头和冷凝器。
在第2天,通过分光光度计在600nM下测量过夜接种物的OD。可通过使用LB培养基来对分光光度计进行空白处理(blank)。将生物反应器设置成37℃、300rpm和2.5vvm。一旦生物反应器达到37℃,即将适当毫升的过夜接种物添加至各1.5L和各4L培养物中以达成0.05的目标起始OD值。通过使用乙醇和无菌移液管从顶部取出样品来不时测量反应器的OD。当OD接近0.8时,更频繁获取样品。
当反应器的OD达到0.7-0.8时(在接种之后约2-4小时),使生物反应器的温度降低至20℃,并且用IPTG诱导培养物以达成Cel3a-C'His蛋白质表达。将750ml IPTG添加至各1.5L反应器中,并且将1.5ml IPTG添加至各5L反应器中。使反应器运行过夜。
在第3天,在早晨,将细胞收集至干净的2L离心瓶中,并且在4200rpm下离心45分钟。丢弃上清液,并且保存沉淀并记录沉淀的重量。使用PBS缓冲液,将沉淀转移至50mL锥形离心管中。在Sorvall St-16台式离心机中在4500rpm下将50mL管离心45分钟。丢弃上清液,并且将沉淀冷冻在-20℃下直至准备用于纯化,或立刻处理以进行纯化。
实施例4:从细胞提取蛋白质
制备具有EDTA的溶解缓冲液,其在去离子水中含有以下各物质:50mM Tris-HCl(pH 7.5)、0.1%曲通X-100、1%甘油、5mM咪唑、1mg/mL溶菌酶和1mM EDTA。将细胞沉淀再混悬于5mL体积的具有EDTA的溶解缓冲液中。将10μl溶解酶(DNA酶)添加至样品中。接着在室温下孵育样品1小时。
接着,在冰上超声处理样品持续三个1分钟间隔(例如持续总计3分钟,Sorvall超声发生器处于设置17下)。
此时,从提取过程的各部分保留1000μl等分试样以分析由提取和纯化过程获得的Cel3a-C'His蛋白的产率和活性。从超声处理样品(样品A)获取等分试样以代表分离的总蛋白质。接着在13000rpm下离心样品5分钟,并且移除上清液。从上清液获取等分试样(样品D),从而代表可溶性部分。将剩余沉淀再混悬于1000μl溶解缓冲液+EDTA中,接着在13000rpm下离心5分钟。移除上清液,并且从上清液获取等分试样(样品E),从而代表可溶性洗涤部分。保留剩余沉淀(样品C),从而代表不溶性部分。所有样品都储存在冰箱(例如4℃)中直至分析。
例如如实施例6中所述,使用总蛋白质等分试样(样品A)进行纤维二糖酶活性测定。
也通过SDS-PAGE和蛋白质印迹来分析样品A、C、D和E。稀释样品至2.00OD以进行标准化。将17.5μl LDS样品缓冲液(混合375μl LDS缓冲液和150μl NuPAGE还原剂以制备525μl LDS样品缓冲液)添加至32.5μl各样品中。将样品煮沸5分钟,并且将20μl各样品上样至各凝胶孔中。也将标准物(分子量阶梯)上样至凝胶孔中。
实施例5:对纯化Cel3a-N'His的质谱法分析
克隆在N末端具有His标签的Cel3a(Cel3a-N'His),在大肠杆菌中表达,并且使用与以上在实施例1-4中所述的方法类似的方法收集。将Cel3a-N'His克隆至pET-Duet1载体中。用含有Profinity Ni装料IMAC树脂浆液的亲和柱纯化表达的Cel3a-N'His,并且使用在溶解缓冲液中含有200mM咪唑的洗脱缓冲液洗脱。
在含有50mM Tris-HCl和0.5M EDTA的缓冲液中透析纯化Cel3a-N'His。接着使透析的蛋白质经受液相色谱法-质谱法(LCMS)完整质量分析。
例如通过布拉德福测定以及通过Nanodrop测定来测定样品浓度。样品浓度在约4mg/mL下。用含0.1%甲酸的去离子水制备10X和100X稀释样品以提供0.4mg/mL和0.04mg/mL样品来进行LCMS。
LC条件如下:
-Acquity UPLC H类别生物系统:BEH300C4柱,1.7μm,2.1x150mm(p/n:186004497)
-柱温:45℃
-MPA:含0.1%FA的水
-MPB:含0.1%FA的ACN
质谱仪条件如下:
-源温:125℃
-去溶剂化温度:450℃
-锥孔电压:40V
-校正:Csl(500-5000Da)
-锁定质量(Lockmass):Csl
样品的色谱图显示于图2中。所述图显示三个目标区域:大峰在31分钟处,一簇峰在38与40分钟之间,并且较小峰在约45分钟处。对在约45分钟处的峰和在约39分钟处的峰簇的手动质谱去卷积显示主峰不是电荷状态包络线的一部分,而是聚合物系列(以44amu作为重复单元),并且因此归因于可能来自溶解缓冲液中使用的曲通-X。
对在31分钟处检测的峰的质谱区域的分析指示蛋白质电荷状态包络线,并且重要的是,不具有糖基化迹象(图3)。电荷状态包络线的扩展指示存在2-3种略微大于主要组分的次要蛋白质。对电荷状态包络线的去卷积指示主要组分具有分子量78,052(图4),此对应于Cel3a-N'His的预期分子量。次要组分具有以下分子量:78,100、78,182和78,229(图4),因此指示对Cel3a-N'His蛋白的轻度修饰。
在主要组分的电荷状态之中的是对应于较小肽片段的若干信号。这些通过更广泛间隔的同位素峰来区分。一些鉴定片段具有分子量8,491、9,261和11,629。这些片段可在MS源中产生,或可源于样品。
来自这个实验的结果证明使用由本发明涵盖的方法,无糖基化纤维二糖酶Cel3a-N'His得以克隆、表达和分离。
实施例6:纤维二糖酶活性测定
使用IMAC技术纯化His标记的Cel3a(例如在N末端或C末端具有His标签的Cel3a)。使用布拉德福测定和/或nanodrop来测定纯化的His标记的Cel3a的量(效价)。对于nanodrop定量,通过将目标形式的Cel3a的氨基酸序列插入ExPASy ProtParam在线工具中来估计摩尔消光系数。
对于活性测定,以96孔板形式对含有Cel3a-N'His的样品进行两倍连续稀释。使稀释液与D-(+)-纤维二糖(Fluka)底物溶液一起在48℃下在50mM柠檬酸二氢钠缓冲液中在pH5.0下孵育30分钟。在30分钟之后,加热样品至100℃,持续10分钟以终止反应。使用YSI生物化学分析仪(YSI Life Sciences)和/或HPLC方法分析样品中的葡萄糖和纤维二糖。将纯化Cel3a-N'His的蛋白质活性记录为每30分钟纤维二糖向葡萄糖的转化百分比(图5)。
对于其中Cel3a的量不能通过使用布拉德福测定和/或nanodrop测定的样品,例如粗制溶解产物样品,活性测定可用于测定Cel3a的效价。产生具有已知浓度的纯化Cel3a-N'His的样品的纤维二糖酶活性的标准曲线。在96孔板的一行中制备具有已知浓度的Cel3a-N'His的两倍连续稀释液,例如12个两倍连续稀释液。其他行含有效价待测定的其他剩余样品(例如粗制溶解产物样品)的两倍连续稀释液。使稀释液与D-(+)-纤维二糖(Fluka)底物溶液一起在48℃下在50mM柠檬酸二氢钠缓冲液中在pH 5.0下孵育30分钟。在30分钟之后,加热样品至100℃,持续10分钟以终止反应。使用YSI生物化学分析仪(YSI Life Sciences)和/或HPLC方法分析样品中的葡萄糖和纤维二糖。使用浓度已知的Cel3a-N'His样品,利用在测定的线性范围内的数据点产生标准曲线(图6)。可将从Cel3a效价未知的样品检测的纤维二糖酶活性与标准曲线进行比较以确定样品中的Cel3a效价。
如果使用在测定的线性范围内的值进行计算,那么活性单位数仅是相对的。测定的线性范围如使用小于30%的原始可溶性底物负载量的葡萄糖值所定义。此外,低于0.05g/L的葡萄糖值由于仪器报告水平而被忽略。一个单位的纤维二糖酶活性定义为葡萄糖的量/Cel3a的量/30分钟:[葡萄糖]g/L/[Cel3a]g/L/30分钟。
使用本文所述的纤维二糖酶活性,进行从大肠杆菌纯化的无糖基化Cel3a与来自里氏木霉的内源性(糖基化型)纤维二糖酶Cel3a之间的活性比较。结果显示于图7中,所述图7显示重组Cel3a(从大肠杆菌纯化的无糖基化Cel3a;在图7中标记为Cel3a)相较于内源性Cel3a(在图7中标记为L4196)显示用于使纤维二糖转化成葡萄糖的更高比活性。具体来说,在纤维二糖酶的浓度低于0.2mg/mL下,重组Cel3a相比于内源性Cel3a在30分钟之后能够产生更大量的葡萄糖。
实施例7:添加无糖基化纤维二糖酶使由糖化过程获得的产物增加
在这个实施例中,在两个糖化反应之间比较葡萄糖产率。在一个糖化反应中,将包含表1中所述的酶的酶混合物添加至生物质中。在第二糖化反应中,将0.8mg/ml从大肠杆菌纯化的无糖基化Cel3a添加至包含表1中所述的酶的酶混合物中,并且添加至生物质中。在如本文所述的条件下运行糖化反应,其中在反应的0与80分钟之间的多个时间点获取样品。使用本领域中的方法,诸如通过YSI仪器或HPLC来测量和定量所得葡萄糖,并且随时间绘图,如图8中所示。这些结果显示添加无糖基化Cel3a使糖化反应中例如葡萄糖的糖产物的产率增加。
等效案
本文引用的各个和每个专利、专利申请和公布的公开内容都据此以引用的方式整体并入本文。尽管已参照特定方面来公开本发明,但明显的是本发明的其他方面和变化形式可由本领域其他技术人员在不脱离本发明的真实精神和范围下进行设计。随附权利要求意图解释为包括所有所述方面和等效变化形式。
序列表
<110> XYLECO, INC.
<120> 无糖基化酶及其用途
<130> X2002-7000WO
<140>
<141>
<150> 62/035,346
<151> 2014-08-08
<160> 23
<170> PatentIn 3.5版
<210> 1
<211> 731
<212> PRT
<213> 里氏木霉
<400> 1
Met Gly Asp Ser His Ser Thr Ser Gly Ala Ser Ala Glu Ala Val Val
1 5 10 15
Pro Pro Ala Gly Thr Pro Trp Gly Thr Ala Tyr Asp Lys Ala Lys Ala
20 25 30
Ala Leu Ala Lys Leu Asn Leu Gln Asp Lys Val Gly Ile Val Ser Gly
35 40 45
Val Gly Trp Asn Gly Gly Pro Cys Val Gly Asn Thr Ser Pro Ala Ser
50 55 60
Lys Ile Ser Tyr Pro Ser Leu Cys Leu Gln Asp Gly Pro Leu Gly Val
65 70 75 80
Arg Tyr Ser Thr Gly Ser Thr Ala Phe Thr Pro Gly Val Gln Ala Ala
85 90 95
Ser Thr Trp Asp Val Asn Leu Ile Arg Glu Arg Gly Gln Phe Ile Gly
100 105 110
Glu Glu Val Lys Ala Ser Gly Ile His Val Ile Leu Gly Pro Val Ala
115 120 125
Gly Pro Leu Gly Lys Thr Pro Gln Gly Gly Arg Asn Trp Glu Gly Phe
130 135 140
Gly Val Asp Pro Tyr Leu Thr Gly Ile Ala Met Gly Gln Thr Ile Asn
145 150 155 160
Gly Ile Gln Ser Val Gly Val Gln Ala Thr Ala Lys His Tyr Ile Leu
165 170 175
Asn Glu Gln Glu Leu Asn Arg Glu Thr Ile Ser Ser Asn Pro Asp Asp
180 185 190
Arg Thr Leu His Glu Leu Tyr Thr Trp Pro Phe Ala Asp Ala Val Gln
195 200 205
Ala Asn Val Ala Ser Val Met Cys Ser Tyr Asn Lys Val Asn Thr Thr
210 215 220
Trp Ala Cys Glu Asp Gln Tyr Thr Leu Gln Thr Val Leu Lys Asp Gln
225 230 235 240
Leu Gly Phe Pro Gly Tyr Val Met Thr Asp Trp Asn Ala Gln His Thr
245 250 255
Thr Val Gln Ser Ala Asn Ser Gly Leu Asp Met Ser Met Pro Gly Thr
260 265 270
Asp Phe Asn Gly Asn Asn Arg Leu Trp Gly Pro Ala Leu Thr Asn Ala
275 280 285
Val Asn Ser Asn Gln Val Pro Thr Ser Arg Val Asp Asp Met Val Thr
290 295 300
Arg Ile Leu Ala Ala Trp Tyr Leu Thr Gly Gln Asp Gln Ala Gly Tyr
305 310 315 320
Pro Ser Phe Asn Ile Ser Arg Asn Val Gln Gly Asn His Lys Thr Asn
325 330 335
Val Arg Ala Ile Ala Arg Asp Gly Ile Val Leu Leu Lys Asn Asp Ala
340 345 350
Asn Ile Leu Pro Leu Lys Lys Pro Ala Ser Ile Ala Val Val Gly Ser
355 360 365
Ala Ala Ile Ile Gly Asn His Ala Arg Asn Ser Pro Ser Cys Asn Asp
370 375 380
Lys Gly Cys Asp Asp Gly Ala Leu Gly Met Gly Trp Gly Ser Gly Ala
385 390 395 400
Val Asn Tyr Pro Tyr Phe Val Ala Pro Tyr Asp Ala Ile Asn Thr Arg
405 410 415
Ala Ser Ser Gln Gly Thr Gln Val Thr Leu Ser Asn Thr Asp Asn Thr
420 425 430
Ser Ser Gly Ala Ser Ala Ala Arg Gly Lys Asp Val Ala Ile Val Phe
435 440 445
Ile Thr Ala Asp Ser Gly Glu Gly Tyr Ile Thr Val Glu Gly Asn Ala
450 455 460
Gly Asp Arg Asn Asn Leu Asp Pro Trp His Asn Gly Asn Ala Leu Val
465 470 475 480
Gln Ala Val Ala Gly Ala Asn Ser Asn Val Ile Val Val Val His Ser
485 490 495
Val Gly Ala Ile Ile Leu Glu Gln Ile Leu Ala Leu Pro Gln Val Lys
500 505 510
Ala Val Val Trp Ala Gly Leu Pro Ser Gln Glu Ser Gly Asn Ala Leu
515 520 525
Val Asp Val Leu Trp Gly Asp Val Ser Pro Ser Gly Lys Leu Val Tyr
530 535 540
Thr Ile Ala Lys Ser Pro Asn Asp Tyr Asn Thr Arg Ile Val Ser Gly
545 550 555 560
Gly Ser Asp Ser Phe Ser Glu Gly Leu Phe Ile Asp Tyr Lys His Phe
565 570 575
Asp Asp Ala Asn Ile Thr Pro Arg Tyr Glu Phe Gly Tyr Gly Leu Ser
580 585 590
Tyr Thr Lys Phe Asn Tyr Ser Arg Leu Ser Val Leu Ser Thr Ala Lys
595 600 605
Ser Gly Pro Ala Thr Gly Ala Val Val Pro Gly Gly Pro Ser Asp Leu
610 615 620
Phe Gln Asn Val Ala Thr Val Thr Val Asp Ile Ala Asn Ser Gly Gln
625 630 635 640
Val Thr Gly Ala Glu Val Ala Gln Leu Tyr Ile Thr Tyr Pro Ser Ser
645 650 655
Ala Pro Arg Thr Pro Pro Lys Gln Leu Arg Gly Phe Ala Lys Leu Asn
660 665 670
Leu Thr Pro Gly Gln Ser Gly Thr Ala Thr Phe Asn Ile Arg Arg Arg
675 680 685
Asp Leu Ser Tyr Trp Asp Thr Ala Ser Gln Lys Trp Val Val Pro Ser
690 695 700
Gly Ser Phe Gly Ile Ser Val Gly Ala Ser Ser Arg Asp Ile Arg Leu
705 710 715 720
Thr Ser Thr Leu Ser Val Ala Gly Ser Gly Ser
725 730
<210> 2
<211> 2232
<212> DNA
<213> 里氏木霉
<400> 2
atgcgttacc gaacagcagc tgcgctggca cttgccactg ggccctttgc tagggcagac 60
agtcactcaa catcgggggc ctcggctgag gcagttgtac ctcctgcagg gactccatgg 120
ggaaccgcgt acgacaaggc gaaggccgca ttggcaaagc tcaatctcca agataaggtc 180
ggcatcgtga gcggtgtcgg ctggaacggc ggtccttgcg ttggaaacac atctccggcc 240
tccaagatca gctatccatc gctatgcctt caagacggac ccctcggtgt tcgatactcg 300
acaggcagca cagcctttac gccgggcgtt caagcggcct cgacgtggga tgtcaatttg 360
atccgcgaac gtggacagtt catcggtgag gaggtgaagg cctcggggat tcatgtcata 420
cttggtcctg tggctgggcc gctgggaaag actccgcagg gcggtcgcaa ctgggagggc 480
ttcggtgtcg atccatatct cacgggcatt gccatgggtc aaaccatcaa cggcatccag 540
tcggtaggcg tgcaggcgac agcgaagcac tatatcctca acgagcagga gctcaatcga 600
gaaaccattt cgagcaaccc agatgaccga actctccatg agctgtatac ttggccattt 660
gccgacgcgg ttcaggccaa tgtcgcttct gtcatgtgct cgtacaacaa ggtcaatacc 720
acctgggcct gcgaggatca gtacacgctg cagactgtgc tgaaagacca gctggggttc 780
ccaggctatg tcatgacgga ctggaacgca cagcacacga ctgtccaaag cgcgaattct 840
gggcttgaca tgtcaatgcc tggcacagac ttcaacggta acaatcggct ctggggtcca 900
gctctcacca atgcggtaaa tagcaatcag gtccccacga gcagagtcga cgatatggtg 960
actcgtatcc tcgccgcatg gtacttgaca ggccaggacc aggcaggcta tccgtcgttc 1020
aacatcagca gaaatgttca aggaaaccac aagaccaatg tcagggcaat tgccagggac 1080
ggcatcgttc tgctcaagaa tgacgccaac atcctgccgc tcaagaagcc cgctagcatt 1140
gccgtcgttg gatctgccgc aatcattggt aaccacgcca gaaactcgcc ctcgtgcaac 1200
gacaaaggct gcgacgacgg ggccttgggc atgggttggg gttccggcgc cgtcaactat 1260
ccgtacttcg tcgcgcccta cgatgccatc aataccagag cgtcttcgca gggcacccag 1320
gttaccttga gcaacaccga caacacgtcc tcaggcgcat ctgcagcaag aggaaaggac 1380
gtcgccatcg tcttcatcac cgccgactcg ggtgaaggct acatcaccgt ggagggcaac 1440
gcgggcgatc gcaacaacct ggatccgtgg cacaacggca atgccctggt ccaggcggtg 1500
gccggtgcca acagcaacgt cattgttgtt gtccactccg ttggcgccat cattctggag 1560
cagattcttg ctcttccgca ggtcaaggcc gttgtctggg cgggtcttcc ttctcaggag 1620
agcggcaatg cgctcgtcga cgtgctgtgg ggagatgtca gcccttctgg caagctggtg 1680
tacaccattg cgaagagccc caatgactat aacactcgca tcgtttccgg cggcagtgac 1740
agcttcagcg agggactgtt catcgactat aagcacttcg acgacgccaa tatcacgccg 1800
cggtacgagt tcggctatgg actgtcttac accaagttca actactcacg cctctccgtc 1860
ttgtcgaccg ccaagtctgg tcctgcgact ggggccgttg tgccgggagg cccgagtgat 1920
ctgttccaga atgtcgcgac agtcaccgtt gacatcgcaa actctggcca agtgactggt 1980
gccgaggtag cccagctgta catcacctac ccatcttcag cacccaggac ccctccgaag 2040
cagctgcgag gctttgccaa gctgaacctc acgcctggtc agagcggaac agcaacgttc 2100
aacatccgac gacgagatct cagctactgg gacacggctt cgcagaaatg ggtggtgccg 2160
tcggggtcgt ttggcatcag cgtgggagcg agcagccggg atatcaggct gacgagcact 2220
ctgtcggtag cg 2232
<210> 3
<211> 2232
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成
多核苷酸
<400> 3
atgcgttatc gtacagccgc agccctggca ctggccacag gtccgttcgc acgtgccgat 60
agtcacagta ccagcggtgc cagcgcagaa gccgtggttc cgccggcagg cacaccgtgg 120
ggcacagcct atgataaagc caaagccgcc ctggccaagc tgaatctgca ggataaagtg 180
ggcatcgtga gtggcgtggg ctggaacggt ggtccgtgcg ttggcaacac cagcccggca 240
agcaagatca gctatccgag cttatgcctg caggatggtc cgctgggcgt gcgctatagc 300
accggtagta ccgcctttac acctggtgtg caggccgcca gtacctggga cgttaacctg 360
atccgcgaac gtggccaatt tatcggcgaa gaagttaaag ccagcggcat tcatgttatt 420
ctgggtccgg tggccggtcc tctgggtaaa accccgcagg gcggccgtaa ttgggaaggc 480
ttcggcgttg atccgtattt aaccggcatc gcaatgggcc agaccattaa tggcatccag 540
agcgtgggtg ttcaagccac cgccaaacac tacatattaa acgaacagga actgaatcgt 600
gaaaccatca gcagcaatcc ggatgatcgc accctgcatg agctgtatac atggcctttt 660
gccgacgcag ttcaggccaa cgtggcaagt gtgatgtgta gctataacaa ggtgaacacc 720
acctgggcct gcgaagacca gtacaccctg cagaccgttt taaaagacca actgggcttc 780
cctggttacg tgatgacaga ttggaatgcc cagcacacaa ccgttcagag cgcaaacagt 840
ggcctggata tgagcatgcc gggcaccgac ttcaacggca ataatcgtct gtggggtccg 900
gcactgacca atgccgttaa cagcaaccag gtgccgacca gtcgtgtgga cgatatggtt 960
acccgtattc tggccgcctg gtacctgaca ggtcaagacc aggccggcta cccgagcttc 1020
aacatcagcc gcaacgtgca gggtaatcac aagaccaacg ttcgcgcaat cgcacgcgat 1080
ggtatcgtgc tgttaaagaa cgatgccaac attctgccgc tgaaaaaacc ggccagcatc 1140
gccgttgttg gtagcgcagc catcattggc aaccacgccc gtaacagtcc gagctgcaat 1200
gataaaggct gtgacgacgg tgccctgggc atgggttggg gtagtggtgc cgtgaactac 1260
ccgtatttcg tggccccgta cgacgccatt aacacccgtg caagtagcca gggtacccag 1320
gttaccctga gcaacaccga caacacaagc agcggtgcca gtgcagcacg tggtaaggat 1380
gtggccatcg tgttcatcac cgccgacagc ggcgaaggct acattaccgt ggagggtaat 1440
gccggtgatc gcaataatct ggacccgtgg cataacggca acgccctggt tcaggcagtg 1500
gcaggcgcaa atagcaacgt gatcgttgtg gtgcatagcg tgggtgccat cattctggag 1560
cagatcctgg ccctgccgca agttaaggca gttgtgtggg caggtctgcc gagccaagaa 1620
agtggcaatg ccctggtgga cgttctgtgg ggcgatgtta gtccgagcgg caagctggtg 1680
tatacaatcg ccaagagccc gaacgactat aacacccgca tcgttagcgg cggcagtgat 1740
agcttcagcg agggcctgtt tatcgactac aagcatttcg atgatgccaa tattaccccg 1800
cgctacgaat ttggttatgg cctgagctat accaagttca actacagccg cctgagcgtt 1860
ttaagtaccg ccaagagtgg tccggcaaca ggtgccgtgg ttcctggtgg tccgagtgat 1920
ctgtttcaga atgtggccac cgtgaccgtg gatatcgcca acagtggtca ggttaccggc 1980
gccgaagtgg cacagctgta catcacctat ccgagcagtg caccgcgcac cccgccgaaa 2040
cagctgcgtg gcttcgccaa attaaacctg accccgggcc agagcggtac agcaaccttc 2100
aatattcgcc gccgtgatct gagctattgg gacaccgcca gccaaaaatg ggtggtgccg 2160
agcggcagct ttggcattag tgtgggtgca agtagccgcg acattcgctt aacaagcacc 2220
ctgagtgttg cc 2232
<210> 4
<211> 30
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成
引物
<400> 4
catgccatgg gcgatagtca cagtaccagc 30
<210> 5
<211> 68
<212> DNA
<213> 人工序列
<220>
<223> 人工序列的描述:合成
引物
<400> 5
cgtgggactc acaacggccg tcgccgtcgg tagtagtagt agtagtagta gtgattactt 60
tcgaaccc 68
<210> 6
<211> 6
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成
6xHis标签
<400> 6
His His His His His His
1 5
<210> 7
<211> 8
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成
8xHis标签
<400> 7
His His His His His His His His
1 5
<210> 8
<211> 4
<212> PRT
<213> 人工序列
<220>
<223> 人工序列的描述:合成
<400> 8
Gly Ser Gly Ser
1
<210> 9
<211> 800
<212> PRT
<213> 鹅柄孢壳菌
<400> 9
Met Lys Ser Ser Val Phe Trp Gly Ala Ser Leu Thr Ser Ala Val Val
1 5 10 15
Arg Ala Ile Asp Leu Pro Phe Gln Phe Tyr Pro Asn Cys Val Asp Asp
20 25 30
Leu Leu Ser Thr Asn Gln Val Cys Asn Thr Thr Leu Ser Pro Pro Glu
35 40 45
Arg Ala Ala Ala Leu Val Ala Ala Leu Thr Pro Glu Glu Lys Leu Gln
50 55 60
Asn Ile Val Ser Lys Ser Leu Gly Ala Pro Arg Ile Gly Leu Pro Ala
65 70 75 80
Tyr Asn Trp Trp Ser Glu Ala Leu His Gly Val Ala Tyr Ala Pro Gly
85 90 95
Thr Gln Phe Trp Gln Gly Asp Gly Pro Phe Asn Ser Ser Thr Ser Phe
100 105 110
Pro Met Pro Leu Leu Met Ala Ala Thr Phe Asp Asp Glu Leu Leu Glu
115 120 125
Lys Ile Ala Glu Val Ile Gly Ile Glu Gly Arg Ala Phe Gly Asn Ala
130 135 140
Gly Phe Ser Gly Leu Asp Tyr Trp Thr Pro Asn Val Asn Pro Phe Lys
145 150 155 160
Asp Pro Arg Trp Gly Arg Gly Ser Glu Thr Pro Gly Glu Asp Val Leu
165 170 175
Leu Val Lys Arg Tyr Ala Ala Ala Met Ile Lys Gly Leu Glu Gly Pro
180 185 190
Val Pro Glu Lys Glu Arg Arg Val Val Ala Thr Cys Lys His Tyr Ala
195 200 205
Ala Asn Asp Phe Glu Asp Trp Asn Gly Ala Thr Arg His Asn Phe Asn
210 215 220
Ala Lys Ile Ser Leu Gln Asp Met Ala Glu Tyr Tyr Phe Met Pro Phe
225 230 235 240
Gln Gln Cys Val Arg Asp Ser Arg Val Gly Ser Ile Met Cys Ala Tyr
245 250 255
Asn Ala Val Asn Gly Val Pro Ser Cys Ala Ser Pro Tyr Leu Leu Gln
260 265 270
Thr Ile Leu Arg Glu His Trp Asn Trp Thr Glu His Asn Asn Tyr Ile
275 280 285
Thr Ser Asp Cys Glu Ala Val Leu Asp Val Ser Leu Asn His Lys Tyr
290 295 300
Ala Ala Thr Asn Ala Glu Gly Thr Ala Ile Ser Phe Glu Ala Gly Met
305 310 315 320
Asp Thr Ser Cys Glu Tyr Glu Gly Ser Ser Asp Ile Pro Gly Ala Trp
325 330 335
Ser Gln Gly Leu Leu Lys Glu Ser Thr Val Asp Arg Ala Leu Leu Arg
340 345 350
Leu Tyr Glu Gly Ile Val Arg Ala Gly Tyr Phe Asp Gly Lys Gln Ser
355 360 365
Leu Tyr Ser Ser Leu Gly Trp Ala Asp Val Asn Lys Pro Ser Ala Gln
370 375 380
Lys Leu Ser Leu Gln Ala Ala Val Asp Gly Thr Val Leu Leu Lys Asn
385 390 395 400
Asp Gly Thr Leu Pro Leu Ser Asp Leu Leu Asp Lys Ser Arg Pro Lys
405 410 415
Lys Val Ala Met Ile Gly Phe Trp Ser Asp Ala Lys Asp Lys Leu Arg
420 425 430
Gly Gly Tyr Ser Gly Thr Ala Ala Tyr Leu His Thr Pro Ala Tyr Ala
435 440 445
Ala Ser Gln Leu Gly Ile Pro Phe Ser Thr Ala Ser Gly Pro Ile Leu
450 455 460
His Ser Asp Leu Ala Ser Asn Gln Ser Trp Thr Asp Asn Ala Met Ala
465 470 475 480
Ala Ala Lys Asp Ala Asp Tyr Ile Leu Tyr Phe Gly Gly Ile Asp Thr
485 490 495
Ser Ala Ala Gly Glu Thr Lys Asp Arg Tyr Asp Leu Asp Trp Pro Gly
500 505 510
Ala Gln Leu Ser Leu Ile Asn Leu Leu Thr Thr Leu Ser Lys Pro Leu
515 520 525
Ile Val Leu Gln Met Gly Asp Gln Leu Asp Asn Thr Pro Leu Leu Ser
530 535 540
Asn Pro Lys Ile Asn Ala Ile Leu Trp Ala Asn Trp Pro Gly Gln Asp
545 550 555 560
Gly Gly Thr Ala Val Met Glu Leu Val Thr Gly Leu Lys Ser Pro Ala
565 570 575
Gly Arg Leu Pro Val Thr Gln Tyr Pro Ser Asn Phe Thr Glu Leu Val
580 585 590
Pro Met Thr Asp Met Ala Leu Arg Pro Ser Ala Gly Asn Ser Gln Leu
595 600 605
Gly Arg Thr Tyr Arg Trp Tyr Lys Thr Pro Val Gln Ala Phe Gly Phe
610 615 620
Gly Leu His Tyr Thr Thr Phe Ser Pro Lys Phe Gly Lys Lys Phe Pro
625 630 635 640
Ala Val Ile Asp Val Asp Glu Val Leu Glu Gly Cys Asp Asp Lys Tyr
645 650 655
Leu Asp Thr Cys Pro Leu Pro Asp Leu Pro Val Val Val Glu Asn Arg
660 665 670
Gly Asn Arg Thr Ser Asp Tyr Val Ala Leu Ala Phe Val Ser Ala Pro
675 680 685
Gly Val Gly Pro Gly Pro Trp Pro Ile Lys Thr Leu Gly Ala Phe Thr
690 695 700
Arg Leu Arg Gly Val Lys Gly Gly Glu Lys Arg Glu Gly Gly Leu Lys
705 710 715 720
Trp Asn Leu Gly Asn Leu Ala Arg His Asp Glu Glu Gly Asn Thr Val
725 730 735
Val Tyr Pro Gly Lys Tyr Glu Val Ser Leu Asp Glu Pro Pro Lys Ala
740 745 750
Arg Leu Arg Phe Glu Ile Val Arg Gly Gly Lys Gly Lys Gly Lys Val
755 760 765
Lys Gly Lys Gly Lys Ala Ala Gln Lys Gly Gly Val Val Leu Asp Arg
770 775 780
Trp Pro Lys Pro Pro Lys Gly Gln Glu Pro Pro Ala Ile Glu Arg Val
785 790 795 800
<210> 10
<211> 316
<212> PRT
<213> 里氏木霉
<400> 10
Met Val Arg Arg Thr Ala Leu Leu Ala Leu Gly Ala Leu Ser Thr Leu
1 5 10 15
Ser Met Ala Gln Ile Ser Asp Asp Phe Glu Ser Gly Trp Asp Gln Thr
20 25 30
Lys Trp Pro Ile Ser Ala Pro Asp Cys Asn Gln Gly Gly Thr Val Ser
35 40 45
Leu Asp Thr Thr Val Ala His Ser Gly Ser Asn Ser Met Lys Val Val
50 55 60
Gly Gly Pro Asn Gly Tyr Cys Gly His Ile Phe Phe Gly Thr Thr Gln
65 70 75 80
Val Pro Thr Gly Asp Val Tyr Val Arg Ala Trp Ile Arg Leu Gln Thr
85 90 95
Ala Leu Gly Ser Asn His Val Thr Phe Ile Ile Met Pro Asp Thr Ala
100 105 110
Gln Gly Gly Lys His Leu Arg Ile Gly Gly Gln Ser Gln Val Leu Asp
115 120 125
Tyr Asn Arg Glu Ser Asp Asp Ala Thr Leu Pro Asp Leu Ser Pro Asn
130 135 140
Gly Ile Ala Ser Thr Val Thr Leu Pro Thr Gly Ala Phe Gln Cys Phe
145 150 155 160
Glu Tyr His Leu Gly Thr Asp Gly Thr Ile Glu Thr Trp Leu Asn Gly
165 170 175
Ser Leu Ile Pro Gly Met Thr Val Gly Pro Gly Val Asp Asn Pro Asn
180 185 190
Asp Ala Gly Trp Thr Arg Ala Ser Tyr Ile Pro Glu Ile Thr Gly Val
195 200 205
Asn Phe Gly Trp Glu Ala Tyr Ser Gly Asp Val Asn Thr Val Trp Phe
210 215 220
Asp Asp Ile Ser Ile Ala Ser Thr Arg Val Gly Cys Gly Pro Gly Ser
225 230 235 240
Pro Gly Gly Pro Gly Ser Ser Thr Thr Gly Arg Ser Ser Thr Ser Gly
245 250 255
Pro Thr Ser Thr Ser Arg Pro Ser Thr Thr Ile Pro Pro Pro Thr Ser
260 265 270
Arg Thr Thr Thr Ala Thr Gly Pro Thr Gln Thr His Tyr Gly Gln Cys
275 280 285
Gly Gly Ile Gly Tyr Ser Gly Pro Thr Val Cys Ala Ser Gly Thr Thr
290 295 300
Cys Gln Val Leu Asn Pro Tyr Tyr Ser Gln Cys Leu
305 310 315
<210> 11
<211> 460
<212> PRT
<213> 里氏木霉
<400> 11
Met Ala Ser Arg Phe Phe Ala Leu Leu Leu Leu Ala Ile Pro Ile Gln
1 5 10 15
Ala Gln Ser Pro Val Trp Gly Gln Cys Gly Gly Ile Gly Trp Ser Gly
20 25 30
Pro Thr Thr Cys Val Gly Gly Ala Thr Cys Val Ser Tyr Asn Pro Tyr
35 40 45
Tyr Ser Gln Cys Ile Pro Ser Thr Gln Ala Ser Ser Ser Ile Ala Ser
50 55 60
Thr Thr Leu Val Thr Ser Phe Thr Thr Thr Thr Ala Thr Arg Thr Ser
65 70 75 80
Ala Ser Thr Pro Pro Ala Ser Ser Thr Gly Ala Gly Gly Ala Thr Cys
85 90 95
Ser Ala Leu Pro Gly Ser Ile Thr Leu Arg Ser Asn Ala Lys Leu Asn
100 105 110
Asp Leu Phe Thr Met Phe Asn Gly Asp Lys Val Thr Thr Lys Asp Lys
115 120 125
Phe Ser Cys Arg Gln Ala Glu Met Ser Glu Leu Ile Gln Arg Tyr Glu
130 135 140
Leu Gly Thr Leu Pro Gly Arg Pro Ser Thr Leu Thr Ala Ser Phe Ser
145 150 155 160
Gly Asn Thr Leu Thr Ile Asn Cys Gly Glu Ala Gly Lys Ser Ile Ser
165 170 175
Phe Thr Val Thr Ile Thr Tyr Pro Ser Ser Gly Thr Ala Pro Tyr Pro
180 185 190
Ala Ile Ile Gly Tyr Gly Gly Gly Ser Leu Pro Ala Pro Ala Gly Val
195 200 205
Ala Met Ile Asn Phe Asn Asn Asp Asn Ile Ala Ala Gln Val Asn Thr
210 215 220
Gly Ser Arg Gly Gln Gly Lys Phe Tyr Asp Leu Tyr Gly Ser Ser His
225 230 235 240
Ser Ala Gly Ala Met Thr Ala Trp Ala Trp Gly Val Ser Arg Val Ile
245 250 255
Asp Ala Leu Glu Leu Val Pro Gly Ala Arg Ile Asp Thr Thr Lys Ile
260 265 270
Gly Val Thr Gly Cys Ser Arg Asn Gly Lys Gly Ala Met Val Ala Gly
275 280 285
Ala Phe Glu Lys Arg Ile Val Leu Thr Leu Pro Gln Glu Ser Gly Ala
290 295 300
Gly Gly Ser Ala Cys Trp Arg Ile Ser Asp Tyr Leu Lys Ser Gln Gly
305 310 315 320
Ala Asn Ile Gln Thr Ala Ser Glu Ile Ile Gly Glu Asp Pro Trp Phe
325 330 335
Ser Thr Thr Phe Asn Ser Tyr Val Asn Gln Val Pro Val Leu Pro Phe
340 345 350
Asp His His Ser Leu Ala Ala Leu Ile Ala Pro Arg Gly Leu Phe Val
355 360 365
Ile Asp Asn Asn Ile Asp Trp Leu Gly Pro Gln Ser Cys Phe Gly Cys
370 375 380
Met Thr Ala Ala His Met Ala Trp Gln Ala Leu Gly Val Ser Asp His
385 390 395 400
Met Gly Tyr Ser Gln Ile Gly Ala His Ala His Cys Ala Phe Pro Ser
405 410 415
Asn Gln Gln Ser Gln Leu Thr Ala Phe Val Gln Lys Phe Leu Leu Gly
420 425 430
Gln Ser Thr Asn Thr Ala Ile Phe Gln Ser Asp Phe Ser Ala Asn Gln
435 440 445
Ser Gln Trp Ile Asp Trp Thr Thr Pro Thr Leu Ser
450 455 460
<210> 12
<211> 466
<212> PRT
<213> 里氏木霉
<400> 12
Met Leu Pro Lys Asp Phe Gln Trp Gly Phe Ala Thr Ala Ala Tyr Gln
1 5 10 15
Ile Glu Gly Ala Val Asp Gln Asp Gly Arg Gly Pro Ser Ile Trp Asp
20 25 30
Thr Phe Cys Ala Gln Pro Gly Lys Ile Ala Asp Gly Ser Ser Gly Val
35 40 45
Thr Ala Cys Asp Ser Tyr Asn Arg Thr Ala Glu Asp Ile Ala Leu Leu
50 55 60
Lys Ser Leu Gly Ala Lys Ser Tyr Arg Phe Ser Ile Ser Trp Ser Arg
65 70 75 80
Ile Ile Pro Glu Gly Gly Arg Gly Asp Ala Val Asn Gln Ala Gly Ile
85 90 95
Asp His Tyr Val Lys Phe Val Asp Asp Leu Leu Asp Ala Gly Ile Thr
100 105 110
Pro Phe Ile Thr Leu Phe His Trp Asp Leu Pro Glu Gly Leu His Gln
115 120 125
Arg Tyr Gly Gly Leu Leu Asn Arg Thr Glu Phe Pro Leu Asp Phe Glu
130 135 140
Asn Tyr Ala Arg Val Met Phe Arg Ala Leu Pro Lys Val Arg Asn Trp
145 150 155 160
Ile Thr Phe Asn Glu Pro Leu Cys Ser Ala Ile Pro Gly Tyr Gly Ser
165 170 175
Gly Thr Phe Ala Pro Gly Arg Gln Ser Thr Ser Glu Pro Trp Thr Val
180 185 190
Gly His Asn Ile Leu Val Ala His Gly Arg Ala Val Lys Ala Tyr Arg
180 185 190
Asp Asp Phe Lys Pro Ala Ser Gly Asp Gly Gln Ile Gly Ile Val Leu
210 215 220
Asn Gly Asp Phe Thr Tyr Pro Trp Asp Ala Ala Asp Pro Ala Asp Lys
225 230 235 240
Glu Ala Ala Glu Arg Arg Leu Glu Phe Phe Thr Ala Trp Phe Ala Asp
245 250 255
Pro Ile Tyr Leu Gly Asp Tyr Pro Ala Ser Met Arg Lys Gln Leu Gly
260 265 270
Asp Arg Leu Pro Thr Phe Thr Pro Glu Glu Arg Ala Leu Val His Gly
275 280 285
Ser Asn Asp Phe Tyr Gly Met Asn His Tyr Thr Ser Asn Tyr Ile Arg
290 295 300
His Arg Ser Ser Pro Ala Ser Ala Asp Asp Thr Val Gly Asn Val Asp
305 310 315 320
Val Leu Phe Thr Asn Lys Gln Gly Asn Cys Ile Gly Pro Glu Thr Gln
325 330 335
Ser Pro Trp Leu Arg Pro Cys Ala Ala Gly Phe Arg Asp Phe Leu Val
340 345 350
Trp Ile Ser Lys Arg Tyr Gly Tyr Pro Pro Ile Tyr Val Thr Glu Asn
355 360 365
Gly Thr Ser Ile Lys Gly Glu Ser Asp Leu Pro Lys Glu Lys Ile Leu
370 375 380
Glu Asp Asp Phe Arg Val Lys Tyr Tyr Asn Glu Tyr Ile Arg Ala Met
385 390 395 400
Val Thr Ala Val Glu Leu Asp Gly Val Asn Val Lys Gly Tyr Phe Ala
405 410 415
Trp Ser Leu Met Asp Asn Phe Glu Trp Ala Asp Gly Tyr Val Thr Arg
420 425 430
Phe Gly Val Thr Tyr Val Asp Tyr Glu Asn Gly Gln Lys Arg Phe Pro
435 440 445
Lys Lys Ser Ala Lys Ser Leu Lys Pro Leu Phe Asp Glu Leu Ile Ala
450 455 460
Ala Ala
465
<210> 13
<211> 744
<212> PRT
<213> 里氏木霉
<400> 13
Met Arg Tyr Arg Thr Ala Ala Ala Leu Ala Leu Ala Thr Gly Pro Phe
1 5 10 15
Ala Arg Ala Asp Ser His Ser Thr Ser Gly Ala Ser Ala Glu Ala Val
20 25 30
Val Pro Pro Ala Gly Thr Pro Trp Gly Thr Ala Tyr Asp Lys Ala Lys
35 40 45
Ala Ala Leu Ala Lys Leu Asn Leu Gln Asp Lys Val Gly Ile Val Ser
50 55 60
Gly Val Gly Trp Asn Gly Gly Pro Cys Val Gly Asn Thr Ser Pro Ala
65 70 75 80
Ser Lys Ile Ser Tyr Pro Ser Leu Cys Leu Gln Asp Gly Pro Leu Gly
85 90 95
Val Arg Tyr Ser Thr Gly Ser Thr Ala Phe Thr Pro Gly Val Gln Ala
100 105 110
Ala Ser Thr Trp Asp Val Asn Leu Ile Arg Glu Arg Gly Gln Phe Ile
115 120 125
Gly Glu Glu Val Lys Ala Ser Gly Ile His Val Ile Leu Gly Pro Val
130 135 140
Ala Gly Pro Leu Gly Lys Thr Pro Gln Gly Gly Arg Asn Trp Glu Gly
145 150 155 160
Phe Gly Val Asp Pro Tyr Leu Thr Gly Ile Ala Met Gly Gln Thr Ile
165 170 175
Asn Gly Ile Gln Ser Val Gly Val Gln Ala Thr Ala Lys His Tyr Ile
180 185 190
Leu Asn Glu Gln Glu Leu Asn Arg Glu Thr Ile Ser Ser Asn Pro Asp
195 200 205
Asp Arg Thr Leu His Glu Leu Tyr Thr Trp Pro Phe Ala Asp Ala Val
195 200 205
Gln Ala Asn Val Ala Ser Val Met Cys Ser Tyr Asn Lys Val Asn Thr
225 230 235 240
Thr Trp Ala Cys Glu Asp Gln Tyr Thr Leu Gln Thr Val Leu Lys Asp
245 250 255
Gln Leu Gly Phe Pro Gly Tyr Val Met Thr Asp Trp Asn Ala Gln His
260 265 270
Thr Thr Val Gln Ser Ala Asn Ser Gly Leu Asp Met Ser Met Pro Gly
275 280 285
Thr Asp Phe Asn Gly Asn Asn Arg Leu Trp Gly Pro Ala Leu Thr Asn
290 295 300
Ala Val Asn Ser Asn Gln Val Pro Thr Ser Arg Val Asp Asp Met Val
305 310 315 320
Thr Arg Ile Leu Ala Ala Trp Tyr Leu Thr Gly Gln Asp Gln Ala Gly
325 330 335
Tyr Pro Ser Phe Asn Ile Ser Arg Asn Val Gln Gly Asn His Lys Thr
340 345 350
Asn Val Arg Ala Ile Ala Arg Asp Gly Ile Val Leu Leu Lys Asn Asp
355 360 365
Ala Asn Ile Leu Pro Leu Lys Lys Pro Ala Ser Ile Ala Val Val Gly
370 375 380
Ser Ala Ala Ile Ile Gly Asn His Ala Arg Asn Ser Pro Ser Cys Asn
385 390 395 400
Asp Lys Gly Cys Asp Asp Gly Ala Leu Gly Met Gly Trp Gly Ser Gly
405 410 415
Ala Val Asn Tyr Pro Tyr Phe Val Ala Pro Tyr Asp Ala Ile Asn Thr
420 425 430
Arg Ala Ser Ser Gln Gly Thr Gln Val Thr Leu Ser Asn Thr Asp Asn
435 440 445
Thr Ser Ser Gly Ala Ser Ala Ala Arg Gly Lys Asp Val Ala Ile Val
450 455 460
Phe Ile Thr Ala Asp Ser Gly Glu Gly Tyr Ile Thr Val Glu Gly Asn
465 470 475 480
Ala Gly Asp Arg Asn Asn Leu Asp Pro Trp His Asn Gly Asn Ala Leu
485 490 495
Val Gln Ala Val Ala Gly Ala Asn Ser Asn Val Ile Val Val Val His
500 505 510
Ser Val Gly Ala Ile Ile Leu Glu Gln Ile Leu Ala Leu Pro Gln Val
515 520 525
Lys Ala Val Val Trp Ala Gly Leu Pro Ser Gln Glu Ser Gly Asn Ala
530 535 540
Leu Val Asp Val Leu Trp Gly Asp Val Ser Pro Ser Gly Lys Leu Val
545 550 555 560
Tyr Thr Ile Ala Lys Ser Pro Asn Asp Tyr Asn Thr Arg Ile Val Ser
565 570 575
Gly Gly Ser Asp Ser Phe Ser Glu Gly Leu Phe Ile Asp Tyr Lys His
580 585 590
Phe Asp Asp Ala Asn Ile Thr Pro Arg Tyr Glu Phe Gly Tyr Gly Leu
595 600 605
Ser Tyr Thr Lys Phe Asn Tyr Ser Arg Leu Ser Val Leu Ser Thr Ala
610 615 620
Lys Ser Gly Pro Ala Thr Gly Ala Val Val Pro Gly Gly Pro Ser Asp
625 630 635 640
Leu Phe Gln Asn Val Ala Thr Val Thr Val Asp Ile Ala Asn Ser Gly
645 650 655
Gln Val Thr Gly Ala Glu Val Ala Gln Leu Tyr Ile Thr Tyr Pro Ser
660 665 670
Ser Ala Pro Arg Thr Pro Pro Lys Gln Leu Arg Gly Phe Ala Lys Leu
675 680 685
Asn Leu Thr Pro Gly Gln Ser Gly Thr Ala Thr Phe Asn Ile Arg Arg
690 695 700
Arg Asp Leu Ser Tyr Trp Asp Thr Ala Ser Gln Lys Trp Val Val Pro
705 710 715 720
Ser Gly Ser Phe Gly Ile Ser Val Gly Ala Ser Ser Arg Asp Ile Arg
725 730 735
Leu Thr Ser Thr Leu Ser Val Ala
740
<210> 14
<211> 418
<212> PRT
<213> 里氏木霉
<400> 14
Met Asn Lys Ser Val Ala Pro Leu Leu Leu Ala Ala Ser Ile Leu Tyr
1 5 10 15
Gly Gly Ala Ala Ala Gln Gln Thr Val Trp Gly Gln Cys Gly Gly Ile
20 25 30
Gly Trp Ser Gly Pro Thr Asn Cys Ala Pro Gly Ser Ala Cys Ser Thr
35 40 45
Leu Asn Pro Tyr Tyr Ala Gln Cys Ile Pro Gly Ala Thr Thr Ile Thr
50 55 60
Thr Ser Thr Arg Pro Pro Ser Gly Pro Thr Thr Thr Thr Arg Ala Thr
65 70 75 80
Ser Thr Ser Ser Ser Thr Pro Pro Thr Ser Ser Gly Val Arg Phe Ala
85 90 95
Gly Val Asn Ile Ala Gly Phe Asp Phe Gly Cys Thr Thr Asp Gly Thr
100 105 110
Cys Val Thr Ser Lys Val Tyr Pro Pro Leu Lys Asn Phe Thr Gly Ser
115 120 125
Asn Asn Tyr Pro Asp Gly Ile Gly Gln Met Gln His Phe Val Asn Asp
130 135 140
Asp Gly Met Thr Ile Phe Arg Leu Pro Val Gly Trp Gln Tyr Leu Val
145 150 155 160
Asn Asn Asn Leu Gly Gly Asn Leu Asp Ser Thr Ser Ile Ser Lys Tyr
165 170 175
Asp Gln Leu Val Gln Gly Cys Leu Ser Leu Gly Ala Tyr Cys Ile Val
180 185 190
Asp Ile His Asn Tyr Ala Arg Trp Asn Gly Gly Ile Ile Gly Gln Gly
195 200 205
Gly Pro Thr Asn Ala Gln Phe Thr Ser Leu Trp Ser Gln Leu Ala Ser
210 215 220
Lys Tyr Ala Ser Gln Ser Arg Val Trp Phe Gly Ile Met Asn Glu Pro
225 230 235 240
His Asp Val Asn Ile Asn Thr Trp Ala Ala Thr Val Gln Glu Val Val
245 250 255
Thr Ala Ile Arg Asn Ala Gly Ala Thr Ser Gln Phe Ile Ser Leu Pro
260 265 270
Gly Asn Asp Trp Gln Ser Ala Gly Ala Phe Ile Ser Asp Gly Ser Ala
275 280 285
Ala Ala Leu Ser Gln Val Thr Asn Pro Asp Gly Ser Thr Thr Asn Leu
290 295 300
Ile Phe Asp Val His Lys Tyr Leu Asp Ser Asp Asn Ser Gly Thr His
305 310 315 320
Ala Glu Cys Thr Thr Asn Asn Ile Asp Gly Ala Phe Ser Pro Leu Ala
325 330 335
Thr Trp Leu Arg Gln Asn Asn Arg Gln Ala Ile Leu Thr Glu Thr Gly
340 345 350
Gly Gly Asn Val Gln Ser Cys Ile Gln Asp Met Cys Gln Gln Ile Gln
355 360 365
Tyr Leu Asn Gln Asn Ser Asp Val Tyr Leu Gly Tyr Val Gly Trp Gly
370 375 380
Ala Gly Ser Phe Asp Ser Thr Tyr Val Leu Thr Glu Thr Pro Thr Gly
385 390 395 400
Ser Gly Asn Ser Trp Thr Asp Thr Ser Leu Val Ser Ser Cys Leu Ala
405 410 415
Arg Lys
<210> 15
<211> 471
<212> PRT
<213> 里氏木霉
<400> 15
Met Ile Val Gly Ile Leu Thr Thr Leu Ala Thr Leu Ala Thr Leu Ala
1 5 10 15
Ala Ser Val Pro Leu Glu Glu Arg Gln Ala Cys Ser Ser Val Trp Gly
20 25 30
Gln Cys Gly Gly Gln Asn Trp Ser Gly Pro Thr Cys Cys Ala Ser Gly
35 40 45
Ser Thr Cys Val Tyr Ser Asn Asp Tyr Tyr Ser Gln Cys Leu Pro Gly
50 55 60
Ala Ala Ser Ser Ser Ser Ser Thr Arg Ala Ala Ser Thr Thr Ser Arg
65 70 75 80
Val Ser Pro Thr Thr Ser Arg Ser Ser Ser Ala Thr Pro Pro Pro Gly
85 90 95
Ser Thr Thr Thr Arg Val Pro Pro Val Gly Ser Gly Thr Ala Thr Tyr
100 105 110
Ser Gly Asn Pro Phe Val Gly Val Thr Pro Trp Ala Asn Ala Tyr Tyr
115 120 125
Ala Ser Glu Val Ser Ser Leu Ala Ile Pro Ser Leu Thr Gly Ala Met
130 135 140
Ala Thr Ala Ala Ala Ala Val Ala Lys Val Pro Ser Phe Met Trp Leu
145 150 155 160
Asp Thr Leu Asp Lys Thr Pro Leu Met Glu Gln Thr Leu Ala Asp Ile
165 170 175
Arg Thr Ala Asn Lys Asn Gly Gly Asn Tyr Ala Gly Gln Phe Val Val
180 185 190
Tyr Asp Leu Pro Asp Arg Asp Cys Ala Ala Leu Ala Ser Asn Gly Glu
195 200 205
Tyr Ser Ile Ala Asp Gly Gly Val Ala Lys Tyr Lys Asn Tyr Ile Asp
210 215 220
Thr Ile Arg Gln Ile Val Val Glu Tyr Ser Asp Ile Arg Thr Leu Leu
225 230 235 240
Val Ile Glu Pro Asp Ser Leu Ala Asn Leu Val Thr Asn Leu Gly Thr
245 250 255
Pro Lys Cys Ala Asn Ala Gln Ser Ala Tyr Leu Glu Cys Ile Asn Tyr
260 265 270
Ala Val Thr Gln Leu Asn Leu Pro Asn Val Ala Met Tyr Leu Asp Ala
275 280 285
Gly His Ala Gly Trp Leu Gly Trp Pro Ala Asn Gln Asp Pro Ala Ala
290 295 300
Gln Leu Phe Ala Asn Val Tyr Lys Asn Ala Ser Ser Pro Arg Ala Leu
305 310 315 320
Arg Gly Leu Ala Thr Asn Val Ala Asn Tyr Asn Gly Trp Asn Ile Thr
325 330 335
Ser Pro Pro Ser Tyr Thr Gln Gly Asn Ala Val Tyr Asn Glu Lys Leu
340 345 350
Tyr Ile His Ala Ile Gly Pro Leu Leu Ala Asn His Gly Trp Ser Asn
355 360 365
Ala Phe Phe Ile Thr Asp Gln Gly Arg Ser Gly Lys Gln Pro Thr Gly
370 375 380
Gln Gln Gln Trp Gly Asp Trp Cys Asn Val Ile Gly Thr Gly Phe Gly
385 390 395 400
Ile Arg Pro Ser Ala Asn Thr Gly Asp Ser Leu Leu Asp Ser Phe Val
405 410 415
Trp Val Lys Pro Gly Gly Glu Cys Asp Gly Thr Ser Asp Ser Ser Ala
420 425 430
Pro Arg Phe Asp Ser His Cys Ala Leu Pro Asp Ala Leu Gln Pro Ala
435 440 445
Pro Gln Ala Gly Ala Trp Phe Gln Ala Tyr Phe Val Gln Leu Leu Thr
450 455 460
Asn Ala Asn Pro Ser Phe Leu
465 470
<210> 16
<211> 514
<212> PRT
<213> 里氏木霉
<400> 16
Met Tyr Arg Lys Leu Ala Val Ile Ser Ala Phe Leu Ala Thr Ala Arg
1 5 10 15
Ala Gln Ser Ala Cys Thr Leu Gln Ser Glu Thr His Pro Pro Leu Thr
20 25 30
Trp Gln Lys Cys Ser Ser Gly Gly Thr Cys Thr Gln Gln Thr Gly Ser
35 40 45
Val Val Ile Asp Ala Asn Trp Arg Trp Thr His Ala Thr Asn Ser Ser
50 55 60
Thr Asn Cys Tyr Asp Gly Asn Thr Trp Ser Ser Thr Leu Cys Pro Asp
65 70 75 80
Asn Glu Thr Cys Ala Lys Asn Cys Cys Leu Asp Gly Ala Ala Tyr Ala
85 90 95
Ser Thr Tyr Gly Val Thr Thr Ser Gly Asn Ser Leu Ser Ile Gly Phe
100 105 110
Val Thr Gln Ser Ala Gln Lys Asn Val Gly Ala Arg Leu Tyr Leu Met
115 120 125
Ala Ser Asp Thr Thr Tyr Gln Glu Phe Thr Leu Leu Gly Asn Glu Phe
130 135 140
Ser Phe Asp Val Asp Val Ser Gln Leu Pro Cys Gly Leu Asn Gly Ala
145 150 155 160
Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Val Ser Lys Tyr Pro
165 170 175
Thr Asn Thr Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln
180 185 190
Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Glu Gly
195 200 205
Trp Glu Pro Ser Ser Asn Asn Ala Asn Thr Gly Ile Gly Gly His Gly
210 215 220
Ser Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Ser Ile Ser Glu
225 230 235 240
Ala Leu Thr Pro His Pro Cys Thr Thr Val Gly Gln Glu Ile Cys Glu
245 250 255
Gly Asp Gly Cys Gly Gly Thr Tyr Ser Asp Asn Arg Tyr Gly Gly Thr
260 265 270
Cys Asp Pro Asp Gly Cys Asp Trp Asn Pro Tyr Arg Leu Gly Asn Thr
275 280 285
Ser Phe Tyr Gly Pro Gly Ser Ser Phe Thr Leu Asp Thr Thr Lys Lys
290 295 300
Leu Thr Val Val Thr Gln Phe Glu Thr Ser Gly Ala Ile Asn Arg Tyr
305 310 315 320
Tyr Val Gln Asn Gly Val Thr Phe Gln Gln Pro Asn Ala Glu Leu Gly
325 330 335
Ser Tyr Ser Gly Asn Glu Leu Asn Asp Asp Tyr Cys Thr Ala Glu Glu
340 345 350
Ala Glu Phe Gly Gly Ser Ser Phe Ser Asp Lys Gly Gly Leu Thr Gln
355 360 365
Phe Lys Lys Ala Thr Ser Gly Gly Met Val Leu Val Met Ser Leu Trp
370 375 380
Asp Asp Tyr Tyr Ala Asn Met Leu Trp Leu Asp Ser Thr Tyr Pro Thr
385 390 395 400
Asn Glu Thr Ser Ser Thr Pro Gly Ala Val Arg Gly Ser Cys Ser Thr
405 410 415
Ser Ser Gly Val Pro Ala Gln Val Glu Ser Gln Ser Pro Asn Ala Lys
420 425 430
Val Thr Phe Ser Asn Ile Lys Phe Gly Pro Ile Gly Ser Thr Gly Asn
435 440 445
Pro Ser Gly Gly Asn Pro Pro Gly Gly Asn Pro Pro Gly Thr Thr Thr
450 455 460
Thr Arg Arg Pro Ala Thr Thr Thr Gly Ser Ser Pro Gly Pro Thr Gln
465 470 475 480
Ser His Tyr Gly Gln Cys Gly Gly Ile Gly Tyr Ser Gly Pro Thr Val
485 490 495
Cys Ala Ser Gly Thr Thr Cys Gln Val Leu Asn Pro Tyr Tyr Ser Gln
500 505 510
Cys Leu
<210> 17
<211> 459
<212> PRT
<213> 里氏木霉
<400> 17
Met Ala Pro Ser Val Thr Leu Pro Leu Thr Thr Ala Ile Leu Ala Ile
1 5 10 15
Ala Arg Leu Val Ala Ala Gln Gln Pro Gly Thr Ser Thr Pro Glu Val
20 25 30
His Pro Lys Leu Thr Thr Tyr Lys Cys Thr Lys Ser Gly Gly Cys Val
35 40 45
Ala Gln Asp Thr Ser Val Val Leu Asp Trp Asn Tyr Arg Trp Met His
50 55 60
Asp Ala Asn Tyr Asn Ser Cys Thr Val Asn Gly Gly Val Asn Thr Thr
65 70 75 80
Leu Cys Pro Asp Glu Ala Thr Cys Gly Lys Asn Cys Phe Ile Glu Gly
85 90 95
Val Asp Tyr Ala Ala Ser Gly Val Thr Thr Ser Gly Ser Ser Leu Thr
100 105 110
Met Asn Gln Tyr Met Pro Ser Ser Ser Gly Gly Tyr Ser Ser Val Ser
115 120 125
Pro Arg Leu Tyr Leu Leu Asp Ser Asp Gly Glu Tyr Val Met Leu Lys
130 135 140
Leu Asn Gly Gln Glu Leu Ser Phe Asp Val Asp Leu Ser Ala Leu Pro
145 150 155 160
Cys Gly Glu Asn Gly Ser Leu Tyr Leu Ser Gln Met Asp Glu Asn Gly
165 170 175
Gly Ala Asn Gln Tyr Asn Thr Ala Gly Ala Asn Tyr Gly Ser Gly Tyr
180 185 190
Cys Asp Ala Gln Cys Pro Val Gln Thr Trp Arg Asn Gly Thr Leu Asn
195 200 205
Thr Ser His Gln Gly Phe Cys Cys Asn Glu Met Asp Ile Leu Glu Gly
210 215 220
Asn Ser Arg Ala Asn Ala Leu Thr Pro His Ser Cys Thr Ala Thr Ala
225 230 235 240
Cys Asp Ser Ala Gly Cys Gly Phe Asn Pro Tyr Gly Ser Gly Tyr Lys
245 250 255
Ser Tyr Tyr Gly Pro Gly Asp Thr Val Asp Thr Ser Lys Thr Phe Thr
260 265 270
Ile Ile Thr Gln Phe Asn Thr Asp Asn Gly Ser Pro Ser Gly Asn Leu
275 280 285
Val Ser Ile Thr Arg Lys Tyr Gln Gln Asn Gly Val Asp Ile Pro Ser
290 295 300
Ala Gln Pro Gly Gly Asp Thr Ile Ser Ser Cys Pro Ser Ala Ser Ala
305 310 315 320
Tyr Gly Gly Leu Ala Thr Met Gly Lys Ala Leu Ser Ser Gly Met Val
325 330 335
Leu Val Phe Ser Ile Trp Asn Asp Asn Ser Gln Tyr Met Asn Trp Leu
340 345 350
Asp Ser Gly Asn Ala Gly Pro Cys Ser Ser Thr Glu Gly Asn Pro Ser
355 360 365
Asn Ile Leu Ala Asn Asn Pro Asn Thr His Val Val Phe Ser Asn Ile
370 375 380
Arg Trp Gly Asp Ile Gly Ser Thr Thr Asn Ser Thr Ala Pro Pro Pro
385 390 395 400
Pro Pro Ala Ser Ser Thr Thr Phe Ser Thr Thr Arg Arg Ser Ser Thr
405 410 415
Thr Ser Ser Ser Pro Ser Cys Thr Gln Thr His Trp Gly Gln Cys Gly
420 425 430
Gly Ile Gly Tyr Ser Gly Cys Lys Thr Cys Thr Ser Gly Thr Thr Cys
435 440 445
Gln Tyr Ser Asn Asp Tyr Tyr Ser Gln Cys Leu
450 455
<210> 18
<211> 234
<212> PRT
<213> 里氏木霉
<400> 18
Met Lys Phe Leu Gln Val Leu Pro Ala Leu Ile Pro Ala Ala Leu Ala
1 5 10 15
Gln Thr Ser Cys Asp Gln Trp Ala Thr Phe Thr Gly Asn Gly Tyr Thr
20 25 30
Val Ser Asn Asn Leu Trp Gly Ala Ser Ala Gly Ser Gly Phe Gly Cys
35 40 45
Val Thr Ala Val Ser Leu Ser Gly Gly Ala Ser Trp His Ala Asp Trp
50 55 60
Gln Trp Ser Gly Gly Gln Asn Asn Val Lys Ser Tyr Gln Asn Ser Gln
65 70 75 80
Ile Ala Ile Pro Gln Lys Arg Thr Val Asn Ser Ile Ser Ser Met Pro
85 90 95
Thr Thr Ala Ser Trp Ser Tyr Ser Gly Ser Asn Ile Arg Ala Asn Val
100 105 110
Ala Tyr Asp Leu Phe Thr Ala Ala Asn Pro Asn His Val Thr Tyr Ser
115 120 125
Gly Asp Tyr Glu Leu Met Ile Trp Leu Gly Lys Tyr Gly Asp Ile Gly
130 135 140
Pro Ile Gly Ser Ser Gln Gly Thr Val Asn Val Gly Gly Gln Ser Trp
145 150 155 160
Thr Leu Tyr Tyr Gly Tyr Asn Gly Ala Met Gln Val Tyr Ser Phe Val
165 170 175
Ala Gln Thr Asn Thr Thr Asn Tyr Ser Gly Asp Val Lys Asn Phe Phe
180 185 190
Asn Tyr Leu Arg Asp Asn Lys Gly Tyr Asn Ala Ala Gly Gln Tyr Val
195 200 205
Leu Ser Tyr Gln Phe Gly Thr Glu Pro Phe Thr Gly Ser Gly Thr Leu
210 215 220
Asn Val Ala Ser Trp Thr Ala Ser Ile Asn
225 230
<210> 19
<211> 242
<212> PRT
<213> 里氏木霉
<400> 19
Met Lys Ala Thr Leu Val Leu Gly Ser Leu Ile Val Gly Ala Val Ser
1 5 10 15
Ala Tyr Lys Ala Thr Thr Thr Arg Tyr Tyr Asp Gly Gln Glu Gly Ala
20 25 30
Cys Gly Cys Gly Ser Ser Ser Gly Ala Phe Pro Trp Gln Leu Gly Ile
35 40 45
Gly Asn Gly Val Tyr Thr Ala Ala Gly Ser Gln Ala Leu Phe Asp Thr
50 55 60
Ala Gly Ala Ser Trp Cys Gly Ala Gly Cys Gly Lys Cys Tyr Gln Leu
65 70 75 80
Thr Ser Thr Gly Gln Ala Pro Cys Ser Ser Cys Gly Thr Gly Gly Ala
85 90 95
Ala Gly Gln Ser Ile Ile Val Met Val Thr Asn Leu Cys Pro Asn Asn
100 105 110
Gly Asn Ala Gln Trp Cys Pro Val Val Gly Gly Thr Asn Gln Tyr Gly
115 120 125
Tyr Ser Tyr His Phe Asp Ile Met Ala Gln Asn Glu Ile Phe Gly Asp
130 135 140
Asn Val Val Val Asp Phe Glu Pro Ile Ala Cys Pro Gly Gln Ala Ala
145 150 155 160
Ser Asp Trp Gly Thr Cys Leu Cys Val Gly Gln Gln Glu Thr Asp Pro
165 170 175
Thr Pro Val Leu Gly Asn Asp Thr Gly Ser Thr Pro Pro Gly Ser Ser
180 185 190
Pro Pro Ala Thr Ser Ser Ser Pro Pro Ser Gly Gly Gly Gln Gln Thr
195 200 205
Leu Tyr Gly Gln Cys Gly Gly Ala Gly Trp Thr Gly Pro Thr Thr Cys
210 215 220
Gln Ala Pro Gly Thr Cys Lys Val Gln Asn Gln Trp Tyr Ser Gln Cys
225 230 235 240
Leu Pro
<210> 20
<211> 838
<212> PRT
<213> 里氏木霉
<400> 20
Met Lys Val Ser Arg Val Leu Ala Leu Val Leu Gly Ala Val Ile Pro
1 5 10 15
Ala His Ala Ala Phe Ser Trp Lys Asn Val Lys Leu Gly Gly Gly Gly
20 25 30
Gly Phe Val Pro Gly Ile Ile Phe His Pro Lys Thr Lys Gly Val Ala
35 40 45
Tyr Ala Arg Thr Asp Ile Gly Gly Leu Tyr Arg Leu Asn Ala Asp Asp
50 55 60
Ser Trp Thr Ala Val Thr Asp Gly Ile Ala Asp Asn Ala Gly Trp His
65 70 75 80
Asn Trp Gly Ile Asp Ala Val Ala Leu Asp Pro Gln Asp Asp Gln Lys
85 90 95
Val Tyr Ala Ala Val Gly Met Tyr Thr Asn Ser Trp Asp Pro Ser Asn
100 105 110
Gly Ala Ile Ile Arg Ser Ser Asp Arg Gly Ala Thr Trp Ser Phe Thr
115 120 125
Asn Leu Pro Phe Lys Val Gly Gly Asn Met Pro Gly Arg Gly Ala Gly
130 135 140
Glu Arg Leu Ala Val Asp Pro Ala Asn Ser Asn Ile Ile Tyr Phe Gly
145 150 155 160
Ala Arg Ser Gly Asn Gly Leu Trp Lys Ser Thr Asp Gly Gly Val Thr
165 170 175
Phe Ser Lys Val Ser Ser Phe Thr Ala Thr Gly Thr Tyr Ile Pro Asp
180 185 190
Pro Ser Asp Ser Asn Gly Tyr Asn Ser Asp Lys Gln Gly Leu Met Trp
195 200 205
Val Thr Phe Asp Ser Thr Ser Ser Thr Thr Gly Gly Ala Thr Ser Arg
210 215 220
Ile Phe Val Gly Thr Ala Asp Asn Ile Thr Ala Ser Val Tyr Val Ser
225 230 235 240
Thr Asn Ala Gly Ser Thr Trp Ser Ala Val Pro Gly Gln Pro Gly Lys
245 250 255
Tyr Phe Pro His Lys Ala Lys Leu Gln Pro Ala Glu Lys Ala Leu Tyr
260 265 270
Leu Thr Tyr Ser Asp Gly Thr Gly Pro Tyr Asp Gly Thr Leu Gly Ser
275 280 285
Val Trp Arg Tyr Asp Ile Ala Gly Gly Thr Trp Lys Asp Ile Thr Pro
290 295 300
Val Ser Gly Ser Asp Leu Tyr Phe Gly Phe Gly Gly Leu Gly Leu Asp
305 310 315 320
Leu Gln Lys Pro Gly Thr Leu Val Val Ala Ser Leu Asn Ser Trp Trp
325 330 335
Pro Asp Ala Gln Leu Phe Arg Ser Thr Asp Ser Gly Thr Thr Trp Ser
340 345 350
Pro Ile Trp Ala Trp Ala Ser Tyr Pro Thr Glu Thr Tyr Tyr Tyr Ser
355 360 365
Ile Ser Thr Pro Lys Ala Pro Trp Ile Lys Asn Asn Phe Ile Asp Val
370 375 380
Thr Ser Glu Ser Pro Ser Asp Gly Leu Ile Lys Arg Leu Gly Trp Met
385 390 395 400
Ile Glu Ser Leu Glu Ile Asp Pro Thr Asp Ser Asn His Trp Leu Tyr
405 410 415
Gly Thr Gly Met Thr Ile Phe Gly Gly His Asp Leu Thr Asn Trp Asp
420 425 430
Thr Arg His Asn Val Ser Ile Gln Ser Leu Ala Asp Gly Ile Glu Glu
435 440 445
Phe Ser Val Gln Asp Leu Ala Ser Ala Pro Gly Gly Ser Glu Leu Leu
450 455 460
Ala Ala Val Gly Asp Asp Asn Gly Phe Thr Phe Ala Ser Arg Asn Asp
465 470 475 480
Leu Gly Thr Ser Pro Gln Thr Val Trp Ala Thr Pro Thr Trp Ala Thr
485 490 495
Ser Thr Ser Val Asp Tyr Ala Gly Asn Ser Val Lys Ser Val Val Arg
500 505 510
Val Gly Asn Thr Ala Gly Thr Gln Gln Val Ala Ile Ser Ser Asp Gly
515 520 525
Gly Ala Thr Trp Ser Ile Asp Tyr Ala Ala Asp Thr Ser Met Asn Gly
530 535 540
Gly Thr Val Ala Tyr Ser Ala Asp Gly Asp Thr Ile Leu Trp Ser Thr
545 550 555 560
Ala Ser Ser Gly Val Gln Arg Ser Gln Phe Gln Gly Ser Phe Ala Ser
565 570 575
Val Ser Ser Leu Pro Ala Gly Ala Val Ile Ala Ser Asp Lys Lys Thr
580 585 590
Asn Ser Val Phe Tyr Ala Gly Ser Gly Ser Thr Phe Tyr Val Ser Lys
595 600 605
Asp Thr Gly Ser Ser Phe Thr Arg Gly Pro Lys Leu Gly Ser Ala Gly
610 615 620
Thr Ile Arg Asp Ile Ala Ala His Pro Thr Thr Ala Gly Thr Leu Tyr
625 630 635 640
Val Ser Thr Asp Val Gly Ile Phe Arg Ser Thr Asp Ser Gly Thr Thr
645 650 655
Phe Gly Gln Val Ser Thr Ala Leu Thr Asn Thr Tyr Gln Ile Ala Leu
660 665 670
Gly Val Gly Ser Gly Ser Asn Trp Asn Leu Tyr Ala Phe Gly Thr Gly
675 680 685
Pro Ser Gly Ala Arg Leu Tyr Ala Ser Gly Asp Ser Gly Ala Ser Trp
690 695 700
Thr Asp Ile Gln Gly Ser Gln Gly Phe Gly Ser Ile Asp Ser Thr Lys
705 710 715 720
Val Ala Gly Ser Gly Ser Thr Ala Gly Gln Val Tyr Val Gly Thr Asn
725 730 735
Gly Arg Gly Val Phe Tyr Ala Gln Gly Thr Val Gly Gly Gly Thr Gly
740 745 750
Gly Thr Ser Ser Ser Thr Lys Gln Ser Ser Ser Ser Thr Ser Ser Ala
755 760 765
Ser Ser Ser Thr Thr Leu Arg Ser Ser Val Val Ser Thr Thr Arg Ala
770 775 780
Ser Thr Val Thr Ser Ser Arg Thr Ser Ser Ala Ala Gly Pro Thr Gly
785 790 795 800
Ser Gly Val Ala Gly His Tyr Ala Gln Cys Gly Gly Ile Gly Trp Thr
805 810 815
Gly Pro Thr Gln Cys Val Ala Pro Tyr Val Cys Gln Lys Gln Asn Asp
820 825 830
Tyr Tyr Tyr Gln Cys Val
835
<210> 21
<211> 373
<212> PRT
<213> 鹅柄孢壳菌
<400> 21
Met Lys Gly Leu Phe Ala Phe Gly Leu Gly Leu Leu Ser Leu Val Asn
1 5 10 15
Ala Leu Pro Gln Ala Gln Gly Gly Gly Ala Ala Ala Ser Ala Lys Val
20 25 30
Ser Gly Thr Arg Phe Val Ile Asp Gly Lys Thr Gly Tyr Phe Ala Gly
35 40 45
Thr Asn Ser Tyr Trp Ile Gly Phe Leu Thr Asn Asn Arg Asp Val Asp
50 55 60
Thr Thr Leu Asp His Ile Ala Ser Ser Gly Leu Lys Ile Leu Arg Val
65 70 75 80
Trp Gly Phe Asn Asp Val Asn Asn Gln Pro Ser Gly Asn Thr Val Trp
85 90 95
Phe Gln Arg Leu Ala Ser Ser Gly Ser Gln Ile Asn Thr Gly Pro Asn
100 105 110
Gly Leu Gln Arg Leu Asp Tyr Leu Val Arg Ser Ala Glu Thr Arg Gly
115 120 125
Ile Lys Leu Ile Ile Ala Leu Val Asn Tyr Trp Asp Asp Phe Gly Gly
130 135 140
Met Lys Ala Tyr Val Asn Ala Phe Gly Gly Thr Lys Glu Ser Trp Tyr
145 150 155 160
Thr Asn Ala Arg Ala Gln Glu Gln Tyr Lys Arg Tyr Ile Gln Ala Val
165 170 175
Val Ser Arg Tyr Val Asn Ser Pro Ala Ile Phe Ala Trp Glu Leu Ala
180 185 190
Asn Glu Pro Arg Cys Lys Gly Cys Asn Thr Asn Val Ile Phe Asn Trp
195 200 205
Ala Thr Gln Ile Ser Asp Tyr Ile Arg Ser Leu Asp Lys Asp His Leu
210 215 220
Ile Thr Leu Gly Asp Glu Gly Phe Gly Leu Pro Gly Gln Thr Thr Tyr
225 230 235 240
Pro Tyr Gln Tyr Gly Glu Gly Thr Asp Phe Val Lys Asn Leu Gln Ile
245 250 255
Lys Asn Leu Asp Phe Gly Thr Phe His Met Tyr Pro Gly His Trp Gly
260 265 270
Val Pro Thr Ser Phe Gly Pro Gly Trp Ile Lys Asp His Ala Ala Ala
275 280 285
Cys Arg Ala Ala Gly Lys Pro Cys Leu Leu Glu Glu Tyr Gly Tyr Glu
290 295 300
Ser Asp Arg Cys Asn Val Gln Lys Gly Trp Gln Gln Ala Ser Arg Glu
305 310 315 320
Leu Ser Arg Asp Gly Met Ser Gly Asp Leu Phe Trp Gln Trp Gly Asp
325 330 335
Gln Leu Ser Thr Gly Gln Thr His Asn Asp Gly Phe Thr Ile Tyr Tyr
340 345 350
Gly Ser Ser Leu Ala Thr Cys Leu Val Thr Asp His Val Arg Ala Ile
355 360 365
Asn Ala Leu Pro Ala
370
<210> 22
<211> 469
<212> PRT
<213> 鹅柄孢壳菌
<400> 22
Met Val Lys Leu Leu Asp Ile Gly Leu Phe Ala Leu Ala Leu Ala Ser
1 5 10 15
Ser Ala Val Ala Lys Pro Cys Lys Pro Arg Asp Gly Pro Val Thr Tyr
20 25 30
Glu Ala Glu Asp Ala Ile Leu Thr Gly Thr Thr Val Asp Thr Ala Gln
35 40 45
Val Gly Tyr Thr Gly Arg Gly Tyr Val Thr Gly Phe Asp Glu Gly Ser
50 55 60
Asp Lys Ile Thr Phe Gln Ile Ser Ser Ala Thr Thr Lys Leu Tyr Asp
65 70 75 80
Leu Ser Ile Arg Tyr Ala Ala Ile Tyr Gly Asp Lys Arg Thr Asn Val
85 90 95
Val Leu Asn Asn Gly Ala Val Ser Glu Val Phe Phe Pro Ala Gly Asp
100 105 110
Ser Phe Thr Ser Val Ala Ala Gly Gln Val Leu Leu Asn Ala Gly Gln
115 120 125
Asn Thr Ile Asp Ile Val Asn Asn Trp Gly Trp Tyr Leu Ile Asp Ser
130 135 140
Ile Thr Leu Thr Pro Ser Ala Pro Arg Pro Pro His Asp Ile Asn Pro
145 150 155 160
Asn Leu Asn Asn Pro Asn Ala Asp Thr Asn Ala Lys Lys Leu Tyr Ser
165 170 175
Tyr Leu Arg Ser Val Tyr Gly Asn Lys Ile Ile Ser Gly Gln Gln Glu
180 185 190
Leu His His Ala Glu Trp Ile Arg Gln Gln Thr Gly Lys Thr Pro Ala
195 200 205
Leu Val Ala Val Asp Leu Met Asp Tyr Ser Pro Ser Arg Val Glu Arg
210 215 220
Gly Thr Thr Ser His Ala Val Glu Asp Ala Ile Ala His His Asn Ala
225 230 235 240
Gly Gly Ile Val Ser Val Leu Trp His Trp Asn Ala Pro Val Gly Leu
245 250 255
Tyr Asp Thr Glu Glu Asn Lys Trp Trp Ser Gly Phe Tyr Thr Arg Ala
260 265 270
Thr Asp Phe Asp Ile Ala Ala Thr Leu Ala Asn Pro Gln Gly Ala Asn
275 280 285
Tyr Thr Leu Leu Ile Arg Asp Ile Asp Ala Ile Ala Val Gln Leu Lys
290 295 300
Arg Leu Glu Ala Ala Gly Val Pro Val Leu Trp Arg Pro Leu His Glu
305 310 315 320
Ala Glu Gly Gly Trp Phe Trp Trp Gly Ala Lys Gly Pro Glu Pro Ala
325 330 335
Lys Gln Leu Trp Asp Ile Leu Tyr Glu Arg Leu Thr Val His His Gly
340 345 350
Leu Asp Asn Leu Ile Trp Val Trp Asn Ser Ile Leu Glu Asp Trp Tyr
355 360 365
Pro Gly Asp Asp Thr Val Asp Ile Leu Ser Ala Asp Val Tyr Ala Gln
370 375 380
Gly Asn Gly Pro Met Ser Thr Gln Tyr Asn Glu Leu Ile Ala Leu Gly
385 390 395 400
Arg Asp Lys Lys Met Ile Ala Ala Ala Glu Val Gly Ala Ala Pro Leu
405 410 415
Pro Gly Leu Leu Gln Ala Tyr Gln Ala Asn Trp Leu Trp Phe Ala Val
420 425 430
Trp Gly Asp Asp Phe Ile Asn Asn Pro Ser Trp Asn Thr Val Ala Val
435 440 445
Leu Asn Glu Ile Tyr Asn Ser Asp Tyr Val Leu Thr Leu Asp Glu Ile
450 455 460
Gln Gly Trp Arg Ser
465
<210> 23
<211> 493
<212> PRT
<213> 里氏木霉
<400> 23
Met Ala Gly Lys Leu Ile Leu Val Ala Leu Ala Ser Leu Val Ser Leu
1 5 10 15
Ser Ile Gln Gln Asn Cys Ala Ala Leu Phe Gly Gln Cys Gly Gly Ile
20 25 30
Gly Trp Ser Gly Thr Thr Cys Cys Val Ala Gly Ala Gln Cys Ser Phe
35 40 45
Val Asn Asp Trp Tyr Ser Gln Cys Leu Ala Ser Thr Gly Gly Asn Pro
50 55 60
Pro Asn Gly Thr Thr Ser Ser Ser Leu Val Ser Arg Thr Ser Ser Ala
65 70 75 80
Ser Ser Ser Val Gly Ser Ser Ser Pro Gly Gly Asn Ser Pro Thr Gly
85 90 95
Ser Ala Ser Thr Tyr Thr Thr Thr Asp Thr Ala Thr Val Ala Pro His
100 105 110
Ser Gln Ser Pro Tyr Pro Ser Ile Ala Ala Ser Ser Cys Gly Ser Trp
115 120 125
Thr Leu Val Asp Asn Val Cys Cys Pro Ser Tyr Cys Ala Asn Asp Asp
130 135 140
Thr Ser Glu Ser Cys Ser Gly Cys Gly Thr Cys Thr Thr Pro Pro Ser
145 150 155 160
Ala Asp Cys Lys Ser Gly Thr Met Tyr Pro Glu Val His His Val Ser
165 170 175
Ser Asn Glu Ser Trp His Tyr Ser Arg Ser Thr His Phe Gly Leu Thr
180 185 190
Ser Gly Gly Ala Cys Gly Phe Gly Leu Tyr Gly Leu Cys Thr Lys Gly
195 200 205
Ser Val Thr Ala Ser Trp Thr Asp Pro Met Leu Gly Ala Thr Cys Asp
210 215 220
Ala Phe Cys Thr Ala Tyr Pro Leu Leu Cys Lys Asp Pro Thr Gly Thr
225 230 235 240
Thr Leu Arg Gly Asn Phe Ala Ala Pro Asn Gly Asp Tyr Tyr Thr Gln
245 250 255
Phe Trp Ser Ser Leu Pro Gly Ala Leu Asp Asn Tyr Leu Ser Cys Gly
260 265 270
Glu Cys Ile Glu Leu Ile Gln Thr Lys Pro Asp Gly Thr Asp Tyr Ala
275 280 285
Val Gly Glu Ala Gly Tyr Thr Asp Pro Ile Thr Leu Glu Ile Val Asp
290 295 300
Ser Cys Pro Cys Ser Ala Asn Ser Lys Trp Cys Cys Gly Pro Gly Ala
305 310 315 320
Asp His Cys Gly Glu Ile Asp Phe Lys Tyr Gly Cys Pro Leu Pro Ala
325 330 335
Asp Ser Ile His Leu Asp Leu Ser Asp Ile Ala Met Gly Arg Leu Gln
340 345 350
Gly Asn Gly Ser Leu Thr Asn Gly Val Ile Pro Thr Arg Tyr Arg Arg
355 360 365
Val Gln Cys Pro Lys Val Gly Asn Ala Tyr Ile Trp Leu Arg Asn Gly
370 375 380
Gly Gly Pro Tyr Tyr Phe Ala Leu Thr Ala Val Asn Thr Asn Gly Pro
385 390 395 400
Gly Ser Val Thr Lys Ile Glu Ile Lys Gly Ala Asp Thr Asp Asn Trp
405 410 415
Val Ala Leu Val His Asp Pro Asn Tyr Thr Ser Ser Arg Pro Gln Glu
420 425 430
Arg Tyr Gly Ser Trp Val Ile Pro Gln Gly Ser Gly Pro Phe Asn Leu
435 440 445
Pro Val Gly Ile Arg Leu Thr Ser Pro Thr Gly Glu Gln Ile Val Asn
450 455 460
Glu Gln Ala Ile Lys Thr Phe Thr Pro Pro Ala Thr Gly Asp Pro Asn
465 470 475 480
Phe Tyr Tyr Ile Asp Ile Gly Val Gln Phe Ser Gln Asn
485 490

Claims (53)

1.一种具有纤维二糖酶活性的无糖基化多肽,其包含与SEQ ID NO:1或其功能性片段的至少90%同一性。
2.如权利要求1所述的无糖基化多肽,其中所述多肽包括来自野生型里氏木霉的Cel3A酶或其功能性变体或片段。
3.如权利要求2所述的无糖基化多肽,其中所述Cel3A酶包含所述氨基酸序列SEQ IDNO:1(例如由所述氨基酸序列SEQ ID NO:1组成)。
4.如权利要求1-3中任一项所述的无糖基化多肽,其中所述多肽由包含SEQ ID NO:2(例如由SEQ ID NO:2组成)的核酸序列编码。
5.如权利要求1-4中任一项所述的无糖基化多肽,其中所述多肽包含邻近于一个或多个糖基化位点或在所述一个或多个糖基化位点处的突变,其中所述突变阻止在所述一个或多个糖基化位点处的糖基化。
6.如权利要求5所述的无糖基化多肽,其中所述突变在以下中的一个或多个处:SEQ IDNO:1的氨基酸位置78处的苏氨酸、氨基酸位置241处的苏氨酸、氨基酸位置343处的丝氨酸、氨基酸位置450处的丝氨酸、氨基酸位置599处的苏氨酸、氨基酸位置616处的丝氨酸、氨基酸位置691处的苏氨酸、氨基酸位置21处的丝氨酸、氨基酸位置24处的苏氨酸、氨基酸位置25处的丝氨酸、氨基酸位置28处的丝氨酸、氨基酸位置38处的苏氨酸、氨基酸位置42处的苏氨酸、氨基酸位置303处的苏氨酸、氨基酸位置398处的丝氨酸、氨基酸位置435处的丝氨酸、氨基酸位置436处的丝氨酸、氨基酸位置439处的苏氨酸、氨基酸位置442处的苏氨酸、氨基酸位置446处的苏氨酸、氨基酸位置451处的丝氨酸、氨基酸位置619处的丝氨酸、氨基酸位置622处的丝氨酸、氨基酸位置623处的苏氨酸、氨基酸位置626处的丝氨酸,或氨基酸位置630处的苏氨酸。
7.如前述权利要求中任一项所述的无糖基化多肽,其中所述无糖基化多肽相较于来自野生型里氏木霉的糖基化Cel3A酶具有增加的纤维二糖酶活性。
8.如前述权利要求中任一项所述的无糖基化多肽,其中所述无糖基化多肽相较于来自野生型里氏木霉的糖基化Cel3A酶具有增加的底物识别力、更具活性的底物识别位点或降低的空间位阻。
9.如前述权利要求中任一项所述的无糖基化多肽,其中所述无糖基化多肽将诸如纤维二糖的碳水化合物水解成一个或多个单糖,例如葡萄糖。
10.如前述权利要求中任一项所述的无糖基化多肽,其中所述纤维二糖酶活性包括水解纤维二糖的β1,4糖苷键。
11.一种核酸序列,其编码如权利要求1-10所述的多肽。
12.一种编码Cel3A酶或其功能性变体的核酸序列,其中所述核酸序列包含与SEQ IDNO:2或SEQ ID NO:3的至少90%同一性(例如由SEQ ID NO:2或SEQ ID NO:3组成)。
13.一种核酸分子,其包含如权利要求11和12中任一项所述的核酸序列。
14.如权利要求13所述的核酸分子,其进一步包含启动子,例如用于原核细胞表达,例如细菌细胞表达,例如在大肠杆菌中表达的启动子。
15.如权利要求14所述的核酸分子,其中所述启动子序列是组成型启动子序列、诱导型启动子序列或阻遏型启动子序列。
16.如权利要求14或15所述的核酸分子,其中所述启动子是T7启动子。
17.如权利要求13-16中任一项所述的核酸分子,其进一步包含编码标签的核酸序列,例如用于检测和/或纯化和/或用于与另一分子连接的标签,例如His标签。
18.如权利要求13-17中任一项所述的核酸分子,其进一步包含编码一个或多个信号序列,例如分泌信号序列的核酸。
19.一种表达载体,其包含如权利要求11-18中任一项所述的核酸序列。
20.如权利要求18所述的表达载体,其进一步包含编码选择标记,例如卡那霉素或氨苄青霉素标记的核酸序列。
21.一种细胞,其包含如权利要求13-20中任一项所述的载体。
22.一种原核细胞或细菌细胞,其包含如权利要求13-20中任一项所述的载体。
23.一种细胞,其表达如权利要求1-10中任一项所述的多肽。
24.一种原核细胞或细菌细胞,其表达如权利要求1-10中任一项所述的多肽。
25.如权利要求22或24所述的细菌细胞,其中所述细菌细胞在糖基化方面受损。
26.如权利要求25所述的细菌细胞,其中所述细菌细胞是大肠杆菌细胞。
27.如权利要求26所述的细菌细胞,其中所述大肠杆菌细胞是origami大肠杆菌细胞。
28.一种用于产生如权利要求1、2、3、4、7、8、9或10中任一项所述的无糖基化多肽的方法,其包括在适于表达所述多肽的条件下培养表达如权利要求1、2、3、4、7、8、9或10中任一项所述的多肽的细胞,其中所述细胞不使所述多肽糖基化,例如细菌细胞,例如大肠杆菌细胞,例如origami大肠杆菌细胞。
29.一种用于产生如权利要求1、2、3、4、7、8、9或10中任一项所述的无糖基化多肽的方法,其包括用去糖基化酶处理包含与SEQ ID NO:1具有至少90%同一性的氨基酸的多肽。
30.如权利要求29所述的方法,其中所述去糖基化酶选自PGNase和EndoH。
31.一种用于产生如权利要求1、2、3、4、7、8、9或10中任一项所述的无糖基化多肽的方法,其包括培养包含编码如权利要求1、2、3、4、7、8、9或10中任一项所述的多肽的核酸序列的细胞,其中所述核酸序列具有一个或多个阻止所述所编码多肽的糖基化的突变。
32.一种方法,其用于在例如衣霉素的糖基化抑制剂存在下培养表达如权利要求1、2、3、4、7、8、9或10中任一项所述的无糖基化多肽的细胞。
33.一种酶混合物,其包含糖基化多肽,所述糖基化多肽包含与SEQ ID NO:1具有至少90%同一性的氨基酸序列;和无糖基化多肽,所述无糖基化多肽包含与SEQ ID NO:1具有至少90%同一性的氨基酸序列,其中所述糖基化多肽与所述无糖基化肽两者均具有纤维二糖酶活性。
34.如权利要求33所述的酶混合物,其中所述无糖基化多肽是如权利要求1-10中任一项所述的无糖基化多肽。
35.如权利要求33或34所述的酶混合物,其中所述糖基化多肽与所述无糖基化多肽两者均包括来自野生型里氏木霉的Cel3A酶。
36.如权利要求33-35中任一项所述的酶混合物,其进一步包含至少一种源于微生物的其他酶,其中所述其他酶具有对纤维素基材料的生物质降解活性。
37.如权利要求36所述的酶混合物,其中所述其他酶选自木质素酶、内切葡聚糖酶、纤维二糖水解酶、木聚糖酶和纤维二糖酶。
38.如权利要求33或34所述的酶混合物,其中所述混合物进一步包含一种或多种木质素酶、一种或多种内切葡聚糖酶、一种或多种纤维二糖水解酶、一种或多种木聚糖酶。
39.如权利要求33-38中任一项所述的酶混合物,其中在所述混合物中所述无糖基化多肽与其余酶之间的比率是至少1:32,例如1:32至1:300。
40.如权利要求33-38中任一项所述的酶混合物,其中所述无糖基化多肽与糖基化多肽的比率是至少1:32,例如1:32至1:300。
41.一种从生物质产生产物(例如氢气、糖、醇等)(或使生物质转化成产物)的方法,其包括使例如通过用电子束处理的生物质与如权利要求1-10中任一项所述的无糖基化多肽和产生一种或多种生物质降解酶的微生物(混合物)或包含生物质降解酶的酶混合物在适于产生所述糖产物的条件下接触。
42.一种从生物质产生产物(例如氢气、糖、醇)的方法,其包括使生物质与如权利要求33-40中任一项所述的酶混合物在适于产生所述产物的条件下接触。
43.如权利要求41或42所述的方法,其中所述产物是糖产物。
44.如权利要求41-43中任一项所述的方法,其进一步包括分离所述糖产物。
45.如权利要求44所述的方法,其中所述糖产物的所述分离包括沉淀、结晶、色谱法、离心和/或提取。
46.如权利要求43-45中任一项所述的方法,其中所述糖产物是葡萄糖和/或木糖。
47.如权利要求41-46中任一项所述的方法,其中所述酶混合物包含选自以下的酶中的至少两种:B2AF03、CIP1、CIP2、Cel1a、Cel3a、Cel5a、Cel6a、Cel7a、Cel7b、Cel12a、Cel45a、Cel74a、paMan5a、paMan26a、膨胀蛋白以及表1中所列的酶。
48.如权利要求41-47中任一项所述的方法,其中所述生物质包括以下中的一种或多种:农业产品或废弃物、纸产品或废弃物、林业产品或一般性废弃物或其任何组合;其中:
a)农业产品或废弃物包括甘蔗、黄麻、大麻、亚麻、竹子、剑麻、苜蓿、干草、秘鲁胡萝卜、荞麦、香蕉、大麦、木薯、野葛、圆齿酢酱草、西米、高粱、马铃薯、甜薯、芋头、山药、菜豆、蚕豆、扁豆、豌豆、草、柳枝稷、芒草、绳草、草芦、谷物残渣、菜籽秆、小麦秆、大麦秆、燕麦秆、稻草、玉米穗轴、玉米秸杆、玉米纤维、椰子毛、甜菜浆、甘蔗渣、大豆秸杆、谷物残渣、稻壳、燕麦壳、小麦谷壳、大麦壳或细麸或其组合;
b)纸产品或废弃物包括纸、着色纸、装料纸、涂覆纸、填充纸、杂志、印刷品、打印纸、涂塑纸、卡片坯料、卡纸板、纸板或纸浆或其组合;
c)林业产品包括白杨木、刨花板、木片或锯屑或其组合;并且
d)一般性废弃物包括粪肥、污水或垃圾或其组合。
49.如权利要求41-48中任一项所述的方法,其进一步包括在引入所述微生物或所述酶混合物之前处理所述生物质以降低所述生物质的不顺应性的步骤,其中所述处理包括用电子进行轰击、声波处理、氧化、热解、蒸汽爆炸、化学处理、机械处理或冷冻研磨。
50.如权利要求41-49中任一项所述的方法,其中产生生物质降解酶的所述微生物来自选自以下属的种:芽孢杆菌属、鬼伞属、毁丝霉属、头孢霉属、柱顶孢霉属、青霉属、曲霉属、假单胞菌属、腐质霉属、镰刀菌属、梭孢壳属、枝顶孢属、金孢子菌属或木霉属。
51.如权利要求41-50中任一项所述的方法,其中产生生物质降解酶的所述微生物选自曲霉属、特异腐质霉(嗜热柱顶孢霉)灰盖鬼伞、尖孢镰刀菌、嗜热毁丝霉、大型亚灰树花菌、太瑞斯梭孢壳霉、桃色枝顶孢、Acremonium acremonium、Acremonium brachypenium、Acremonium dichromosporum、Acremonium obclavatum、Acremonium pinkertoniae、灰粉枝顶孢、Acremonium incoloratum、棕色枝顶孢、Chrysosporium lucknowense、绿色木霉、里氏木霉或康宁木霉。
52.如权利要求41-51中任一项所述的方法,其中已通过将所述微生物与诱导生物质样品在相较于未诱导微生物,适于使生物质降解酶的产生增加的条件下组合来诱导所述微生物以产生生物质降解酶。
53.如权利要求52中任一项所述的方法,其中所述诱导生物质样品包括纸、纸产品、纸废弃物、纸浆、着色纸、装料纸、涂覆纸、填充纸、杂志、印刷品、打印纸、涂塑纸、卡片坯料、卡纸板、纸板、棉花、木材、刨花板、林业废弃物、锯屑、白杨木、木片、草、柳枝稷、芒草、绳草、草芦、谷物残渣、稻壳、燕麦秆、小麦谷壳、大麦壳、农业废弃物、青贮饲料、菜籽秆、小麦秆、大麦秆、燕麦秆、稻草、黄麻、大麻、亚麻、竹子、剑麻、蕉麻、玉米穗轴、玉米秸杆、大豆秸杆、玉米纤维、苜蓿、干草、椰子毛、糖加工残渣、甘蔗渣、甜菜浆、龙舌兰甘蔗渣、海藻、海草、粪肥、污水、垃圾、农业或工业废弃物、秘鲁胡萝卜、荞麦、香蕉、大麦、木薯、野葛、圆齿酢酱草、西米、高粱、马铃薯、甜薯、芋头、山药、菜豆、蚕豆、扁豆、豌豆或其任何组合。
CN201580042200.6A 2014-08-08 2015-08-07 无糖基化酶及其用途 Pending CN106536730A (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201462035346P 2014-08-08 2014-08-08
US62/035,346 2014-08-08
PCT/US2015/044136 WO2016022878A1 (en) 2014-08-08 2015-08-07 Aglycosylated enzyme and uses thereof

Publications (1)

Publication Number Publication Date
CN106536730A true CN106536730A (zh) 2017-03-22

Family

ID=55264604

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201580042200.6A Pending CN106536730A (zh) 2014-08-08 2015-08-07 无糖基化酶及其用途

Country Status (16)

Country Link
US (2) US10131894B2 (zh)
EP (1) EP3177719A4 (zh)
JP (1) JP2017524363A (zh)
KR (1) KR20170040246A (zh)
CN (1) CN106536730A (zh)
AP (1) AP2016009640A0 (zh)
AU (1) AU2015300897A1 (zh)
BR (1) BR112017002391A2 (zh)
CA (1) CA2955960A1 (zh)
CU (1) CU20170011A7 (zh)
EA (1) EA201790054A1 (zh)
IL (1) IL250272A0 (zh)
MX (1) MX2017001596A (zh)
PH (1) PH12016502604A1 (zh)
SG (1) SG11201610894UA (zh)
WO (1) WO2016022878A1 (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3177719A4 (en) * 2014-08-08 2018-04-04 Xyleco, Inc. Aglycosylated enzyme and uses thereof

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102149819A (zh) * 2008-09-12 2011-08-10 Ifp新能源公司 具有提高的活性的β-葡糖苷酶变体及其用途

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5028515B2 (zh) 1971-09-30 1975-09-16
US5997913A (en) * 1990-12-10 1999-12-07 Genencor International, Inc. Method enhancing flavor and aroma in foods by overexpression of β-glucosidase
ES2272333T3 (es) 1999-11-19 2007-05-01 Yissum Research Development Company Of The Hebrew University Of Jerusalem Procedimiento para aumentar el nivel de una sustancia de fermentacion.
US6946277B2 (en) 2001-01-31 2005-09-20 Council Of Scientific And Industrial Research Method for enhancing cellobiase activity of termitomyces clypeatus using a glycosylation inhibitor
FI120045B (fi) * 2005-12-22 2009-06-15 Roal Oy Selluloosamateriaalin käsittely ja siinä käyttökelpoiset entsyymit
MX2009000712A (es) 2006-07-21 2009-03-23 Xyleco Inc Sistemas para conversion de biomasa.
DK2046819T3 (da) * 2006-07-21 2015-06-22 Novozymes Inc Fremgangsmåder til forøgelse af secernering af polypeptider med biologisk aktivitet
EP2037274A1 (de) 2007-09-11 2009-03-18 GALAB Technologies GmbH Lektinbasierter Glykan-Assay
MX344902B (es) 2009-05-20 2017-01-11 Xyleco Inc Procesar materiales conteniendo hidrocarburo.
CA2780767A1 (en) * 2009-11-20 2011-05-26 Danisco Us Inc. Beta-glucosidase i variants with improved properties
NZ708842A (en) 2010-07-19 2017-01-27 Xyleco Inc Processing biomass
CN106399392A (zh) 2010-10-20 2017-02-15 希乐克公司 通过用电子束照射来处理木质纤维素材料的方法
KR20140023313A (ko) 2011-03-17 2014-02-26 다니스코 유에스 인크. 셀룰라제 조성물 및 리그노셀룰로스계 바이오매스의 발효성 당으로의 전환을 향상시키기 위해 상기 조성물을 사용하는 방법
EP2794895A1 (en) 2011-12-22 2014-10-29 Xyleco, Inc. Processing biomass
FR2994981B1 (fr) * 2012-09-05 2014-09-12 Centre Nat Rech Scient Polypeptide a activite beta-glucosidase renforcee a basse temperature
WO2014086706A1 (en) 2012-12-07 2014-06-12 Novozymes A/S Method for generating site-specific mutations in filamentous fungi
EP3177719A4 (en) 2014-08-08 2018-04-04 Xyleco, Inc. Aglycosylated enzyme and uses thereof

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102149819A (zh) * 2008-09-12 2011-08-10 Ifp新能源公司 具有提高的活性的β-葡糖苷酶变体及其用途

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
无: "XM_006964014.1", 《NCBI》 *

Also Published As

Publication number Publication date
CU20170011A7 (es) 2017-08-08
US20190024068A1 (en) 2019-01-24
JP2017524363A (ja) 2017-08-31
AU2015300897A1 (en) 2017-01-05
EP3177719A1 (en) 2017-06-14
US10131894B2 (en) 2018-11-20
PH12016502604A1 (en) 2017-04-24
WO2016022878A1 (en) 2016-02-11
AP2016009640A0 (en) 2016-12-31
KR20170040246A (ko) 2017-04-12
US20170137797A1 (en) 2017-05-18
SG11201610894UA (en) 2017-01-27
MX2017001596A (es) 2017-05-15
BR112017002391A2 (pt) 2017-11-28
EA201790054A1 (ru) 2017-07-31
CA2955960A1 (en) 2016-02-11
IL250272A0 (en) 2017-03-30
EP3177719A4 (en) 2018-04-04

Similar Documents

Publication Publication Date Title
US9914946B2 (en) Polypeptides having xylanase activity and polynucleotides encoding same
US20180237759A1 (en) Compositions for degrading cellulosic material
EP2064323B1 (en) Methods of increasing the cellulolytic enhancing activity of a polypeptide
US9080163B2 (en) Cellobiohydrolase variants
US9512416B2 (en) Endoglucanase variants
WO2018106656A1 (en) Truncated lpmo enzymes and use thereof
US20190316108A1 (en) Solubilized enzyme and uses thereof
CN106536730A (zh) 无糖基化酶及其用途
WO2018069499A1 (en) Method for processing lignocellulosic biomass
OA18211A (en) Aglycosylated enzyme and uses thereof.

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20170322

WD01 Invention patent application deemed withdrawn after publication