CN108884478A - 在ssf方法中组合使用至少一种内切蛋白酶和至少一种外切蛋白酶以改善乙醇产量 - Google Patents

在ssf方法中组合使用至少一种内切蛋白酶和至少一种外切蛋白酶以改善乙醇产量 Download PDF

Info

Publication number
CN108884478A
CN108884478A CN201780012025.5A CN201780012025A CN108884478A CN 108884478 A CN108884478 A CN 108884478A CN 201780012025 A CN201780012025 A CN 201780012025A CN 108884478 A CN108884478 A CN 108884478A
Authority
CN
China
Prior art keywords
polypeptide
ser
ala
gly
protease
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201780012025.5A
Other languages
English (en)
Inventor
李明
C-L.宋
小伯纳多.维达尔
福山志朗
松井知子
绫部圭
L.P.莱萨德
N.E.克里尔
K.詹森
W.彭
郭新颜
汤岚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Novo Nordisk AS
Original Assignee
Novo Nordisk AS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Novo Nordisk AS filed Critical Novo Nordisk AS
Publication of CN108884478A publication Critical patent/CN108884478A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/50Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
    • C12N9/58Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from fungi
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/485Exopeptidases (3.4.11-3.4.19)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/50Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
    • C12N9/52Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from bacteria or Archaea
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/04Polysaccharides, i.e. compounds containing more than five saccharide radicals attached to each other by glycosidic bonds
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/06Ethanol, i.e. non-beverage
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E50/00Technologies for the production of fuel of non-fossil origin
    • Y02E50/10Biofuels, e.g. bio-diesel

Landscapes

  • Life Sciences & Earth Sciences (AREA)
  • Chemical & Material Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Mycology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Polysaccharides And Polysaccharide Derivatives (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

提供了通过在SSF方法中组合使用至少一种内切蛋白酶和至少一种外切蛋白酶从含淀粉材料生产乙醇的改进的方法。更特别地,外切蛋白酶应构成蛋白酶混合物的至少5%(w/w)。

Description

在SSF方法中组合使用至少一种内切蛋白酶和至少一种外切 蛋白酶以改善乙醇产量
对序列表的引用
本申请包含计算机可读形式的序列表。将该计算机可读形式通过引用结合在此。
技术领域
本发明涉及从糊化和/或未糊化的含淀粉材料产生发酵产物的方法,并且涉及用于本发明方法的蛋白酶。
背景技术
从含淀粉材料生产发酵产物(例如,乙醇)是本领域中熟知的。通常使用两种不同种类的方法。最常使用的方法通常被称作“传统方法”,包括在高温时典型地使用细菌α-淀粉酶液化经糊化的淀粉,随后在葡糖淀粉酶和发酵生物的存在下进行同时糖化和发酵。常规淀粉转化过程如液化以及糖化过程描述于例如美国专利号3,912,590、EP 252730以及EP063909中。
另一种熟知的方法通常被称作“生淀粉水解”-方法(RSH方法),包括典型地在酸性真菌α-淀粉酶和葡糖淀粉酶的存在下在低于初始糊化温度处将颗粒淀粉同时糖化和发酵。
美国专利号5,231,017-A披露了在乙醇发酵期间在包含用α-淀粉酶液化经糊化的淀粉的方法中酸性真菌蛋白酶的用途。
WO 2003/066826披露了生淀粉水解方法(RSH方法),该生淀粉水解方法在真菌葡糖淀粉酶、α-淀粉酶和真菌蛋白酶的存在下,在非煮熟的醪液上进行。
WO 2007/145912披露了用于产生乙醇的方法,该方法包括在3.5至7.0的pH下并且在低于淀粉糊化温度处,将包含获得自植物材料的颗粒状淀粉的浆料与能够溶解颗粒状淀粉的α-淀粉酶接触持续5分钟至24小时的时间;获得包含大于20%葡萄糖的基质,并且在发酵生物和淀粉水解酶的存在下,在10℃和40℃之间的温度处,发酵该基质持续10小时至250小时的时间。在接触步骤期间添加的另外的酶可以包括蛋白酶。
WO 2010/008841披露了通过使用至少葡糖淀粉酶和金属蛋白酶糖化淀粉材料并使用酵母生物发酵,用于从经糊化的连同未经糊化的含淀粉材料产生发酵产物(如乙醇)的方法。具体地,该金属蛋白酶源自嗜热子囊菌的菌株。
WO 2014/037438披露了源自大型亚灰树花菌、变色栓菌、和污叉丝孔菌的丝氨酸蛋白酶及其在动物饲料中的用途。
WO 2015/078372披露了在淀粉湿碾磨方法中使用的源自大型亚灰树花菌、变色栓菌、和污叉丝孔菌的丝氨酸蛋白酶。
WO 2013/102674披露了属于S53家族的外切蛋白酶。
S53蛋白酶是本领域已知的,例如来自多叶奇果菌(Grifola frondosa)的S53肽,登录号为MER078639。来自褐腐菌(Uniprot:B8PMI5)的S53蛋白酶由Martinez等人,在“Genome,transcriptome,and secretome analysis of wood decay fungus Postiaplacenta supports unique mechanisms of lignocellulose conversion[支持木质纤维素转化的独特机制的木材腐朽菌真菌褐腐菌的基因组、转录组和分泌物分析]”,2009,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]106:1954-1959中进行了分离。
Vanden Wymelenberg等人在“Computational analysis of the Phanerochaetechrysosporium v2.0 genome database and mass spectrometry identification ofpeptides in ligninolytic cultures reveal complex mixtures of secretedproteins[揭示了所分泌的蛋白质的复杂混合物的黄孢原毛平革菌v2.0基因组数据库的计算分析和木质素溶解培养物中肽的质谱鉴定]”,2006,Fungal Genet.Biol.[真菌遗传学与生物学]43:343-356中已经分离了S53蛋白酶(Uniprot:Q281W2)。来自褐腐菌(Uniprot:B8P431)的另一个S53多肽由Martinez等人,在“Genome,transcriptome,and secretomeanalysis of wood decay fungus Postia placenta supports unique mechanisms oflignocellulose conversion[支持木质纤维素转化的独特机制的木材腐朽菌真菌褐腐菌的基因组、转录组和分泌物分析]”,2009,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]106:1954-1959中进行了鉴定。
Floudas等人在“The Paleozoic origin of enzymatic lignin decompositionreconstructed from 31 fungal genomes[从31个真菌基因组重构的酶木质素分解的古生代来源]”,2012,Science[科学],336:1715-1719中已经公开了S53蛋白酶的序列。Fernandez-Fueyo等人在“Comparative genomics of Ceriporiopsis subvermispora andPhanerochaete chrysosporium provide insight into selective ligninolysis[提供了对选择性木质溶解的洞察的虫拟蜡菌和黄孢原毛平革菌的比较基因组学]”,2012,ProcNatl Acad Sci USA.[美国国家科学院院刊]109:5458-5463中已经公开了三个丝氨酸蛋白酶的序列(Uniprot:M2QQ01、Uniprot:M2QWH2、Uniprot:M2RD67)。
本发明的目的是当在糖化和/或发酵过程中添加/存在蛋白酶时,鉴定在淀粉至乙醇过程中将导致乙醇产量增加的所述蛋白酶混合物。
发明内容
本发明的诸位发明人惊奇地发现,向SSF方法中添加内切蛋白酶和外切蛋白酶的混合物将导致乙醇产量增加。在第一方面,本发明提供一种用于从含淀粉材料产生发酵产物的方法,该方法包括:
a)使用产碳水化合物源的酶在低于所述含淀粉材料的初始糊化温度的温度使含淀粉材料糖化;以及
b)使用发酵生物进行发酵;其中
步骤a)和/或b)在内切蛋白酶和外切蛋白酶混合物存在下进行,并且其中外切蛋白酶以总蛋白酶酶蛋白为基础构成蛋白酶混合物的至少5%(w/w)。
在第二方面,本发明提供一种用于从含淀粉材料产生发酵产物的方法,该方法包括以下步骤:
(a)在高于所述含淀粉材料的初始糊化温度的温度,在α-淀粉酶存在下,液化该含淀粉材料;
(b)使用产碳水化合物源的酶来使步骤(a)中获得的液化材料糖化;
(c)使用发酵生物进行发酵;
其中步骤b)和/或c)在内切蛋白酶和外切蛋白酶混合物存在下进行,并且其中外切蛋白酶以总蛋白酶酶蛋白为基础构成蛋白酶混合物的至少5%(w/w)。
在第三方面,本发明涉及适用于本发明方法的组合物,更特别是包含内切蛋白酶和外切蛋白酶混合物的组合物,并且其中外切蛋白酶以总蛋白酶酶蛋白为基础构成蛋白酶混合物的至少5%(w/w),例如至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、特别是至少75%、更特别地,外切蛋白酶以总蛋白酶酶蛋白为基础构成组合物中蛋白酶混合物的从5%至95%(w/w)之间基于总蛋白酶酶蛋白,特别地10%至80%(w/w)、特别地15%至70%(w/w)、更特别地20%至60%(w/w)、并且甚至更特别地25%至50%(w/w)。
在第四方面,本发明涉及根据本发明的组合物在含淀粉材料的糖化中的用途。
在第五方面,本发明涉及一种具有丝氨酸蛋白酶活性并且属于S10家族的多肽,该多肽选自由以下组成的组:(a)多肽,该多肽与SEQ ID NO:6的成熟多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性;(b)由多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:8的成熟多肽编码序列具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性;(c)(a)、或(b)的多肽的片段,该片段具有丝氨酸蛋白酶活性。
在第六方面,本发明涉及一种具有丝氨酸蛋白酶活性并且属于S53家族的多肽,该多肽选自由以下组成的组:
(a)多肽,该多肽与SEQ ID NO:23的成熟多肽具有至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性;或
(b)由多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:29的成熟多肽编码序列具有至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性;或
(c)(a)、或(b)的多肽的片段,该片段具有丝氨酸蛋白酶活性。
在第七方面,本发明涉及一种具有丝氨酸蛋白酶活性并且属于S53家族的多肽,该多肽选自由以下组成的组:
(a)多肽,该多肽与SEQ ID NO:25的成熟多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性;或
(b)由多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:30的成熟多肽编码序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性;或
(c)(a)、或(b)的多肽的片段,该片段具有丝氨酸蛋白酶活性。
本发明还涉及编码本发明丝氨酸蛋白酶的多核苷酸;包含这些多核苷酸的核酸构建体、载体和宿主细胞;以及涉及产生本发明的丝氨酸蛋白酶的方法。
定义
蛋白酶:术语“蛋白酶”包括属于EC 3.4酶组(包括其十八个亚类中的每一个)的任何酶。EC编号参考加利福尼亚州的圣迭戈的NC-IUBMB学术出版社(Academic Press)的1992年酶命名法,分别包括出版于1994,Eur.J.Biochem.[欧洲生物化学杂志]223:1-5;1995,Eur.J.Biochem.[欧洲生物化学杂志]232:1-6;1996,Eur.J.Biochem.[欧洲生物化学杂志]237:1-5;1997,Eur.J.Biochem.[欧洲生物化学杂志]250:1-6;以及1999,Eur.J.Biochem.[欧洲生物化学杂志]264:610-650的增刊1-5。命名定期得以增补和更新;参见例如万维网(WWW)于http://www.chem.qmw.ac.uk/iubmb/enzyme/index.html。
蛋白酶根据其催化机制分为以下几类:丝氨酸蛋白酶(S)、半胱氨酸蛋白酶(C)、天冬氨酸蛋白酶(A)、金属蛋白酶(M)以及未知或还未分类的蛋白酶(U),参见Handbook ofProteolytic Enzymes[蛋白水解酶手册],A.J.Barrett,N.D.Rawlings,J.F.Woessner(编辑),学术出版社(Academic Press)(1998),尤其是概述部分。
具有蛋白酶活性的多肽或蛋白酶有时还被指定为肽酶、朊酶、肽水解酶或蛋白水解酶。蛋白酶可以是始于任一端的水解肽的外切型蛋白酶(外肽酶)或在多肽链内部发挥作用的内切型蛋白酶(内肽酶)。
S53蛋白酶:术语“S53”意指选自以下的蛋白酶活性:
(a)属于EC 3.4.21酶组的蛋白酶;和/或
(b)属于EC 3.4.14酶组的蛋白酶;和/或
(c)肽酶S53家族的丝氨酸蛋白酶,其包括两种不同类型的肽酶:三肽基氨肽酶(外切型)和内切肽酶;如在1993,Biochem.J.[生物化学杂志]290:205-218和在MEROPS蛋白酶数据库,发行9.4(2011年1月31日)(www.merops.ac.uk)中所述的。该数据库描述于Rawlings,N.D.,Barrett,A.J.和Bateman,A.,2010,“MEROPS:肽酶数据库(MEROPS:thepeptidase database)”,Nucl.Acids Res.[核酸研究]38:D227-D233中。
为了确定给定蛋白酶是否为丝氨酸蛋白酶和S53家族的蛋白酶,可参考上述手册和其中述及的原理。可以对所有类型的蛋白酶进行这样的确定,而不论其是天然存在的或野生型蛋白酶;还是基因工程化的或合成的蛋白酶。
该S53家族的肽酶倾向于在酸性pH下最有活性(不像同源的枯草杆菌蛋白酶),并且这可归因于羧基残基(尤其Asp)在该氧阴离子穴中的功能的重要性。这些氨基酸序列不与家族S8(即丝氨酸内肽酶枯草杆菌蛋白酶和同系物)中的那些密切相似,并且这一点与完全不同的活性位点残基以及关于最大活性的所得的较低的pH一起,为该家族提供了实质性差异。肽酶单元的蛋白质折叠对于这个家族的成员来说与枯草杆菌蛋白酶的类似,具有氏族类型SB。
S8蛋白酶:该家族的大多数成员是内肽酶,并且在中性-温和的碱性pH下具有活性。该家族中的许多肽酶都是耐热的。酪蛋白通常用作蛋白质底物,并且典型的合成底物是Suc-Ala-Ala-Pro-Phe-NHPhNO2。该家族的大多数成员是非特异性肽酶,优选在疏水性残基后切割。链接到S10家族定义的活性和特异性:http://merops.sanger.ac.uk/cgi-bin/famsum?family=S8
S10蛋白酶:S10家族中的羧肽酶显示出两种主要的特异性类型。一些(例如羧肽酶C)在P1和P1位置表现出对疏水残基的优先性。第二组的羧肽酶(例如羧肽酶D)显示出对易断裂键两侧的碱性氨基酸的优先性,但也能够在这些位置切割具有疏水残基的肽。链接到S10家族定义的活性和特异性:http://merops.sanger.ac.uk/cgi-bin/famsum?family=S10
等位基因变体:术语“等位基因变体”意指占用同一染色体基因座的基因的两个或更多个替代形式中的任一者。等位基因变异通过突变天然地产生,并且可能导致群体内的多态性。基因突变可以是沉默的(在所编码的多肽中没有改变)或可编码具有改变的氨基酸序列的多肽。多肽的等位基因变体是由基因的等位基因变体编码的多肽。
催化结构域:术语“催化结构域”意指酶的含有该酶的催化机构的区域。
cDNA:术语“cDNA”意指可以通过得自真核或原核细胞的成熟的、剪接的mRNA分子的反转录而制备的DNA分子。cDNA缺乏可以存在于对应基因组DNA中的内含子序列。早先的初始RNA转录物本是mRNA的前体,其在呈现为成熟的剪接的mRNA之前要经一系列步骤进行加工,包括剪接。
编码序列:术语“编码序列”意思指这样一种多核苷酸,该多核苷酸直接地指定了多肽的氨基酸序列。编码序列的边界一般由开放阅读框决定,该开放阅读框以起始密码子(如ATG、GTG或TTG)开始并且以终止密码子(如TAA、TAG或TGA)结束。编码序列可以是基因组DNA、cDNA、合成DNA、或其组合。
控制序列:术语“控制序列”是指表达编码本发明的成熟多肽的多核苷酸所必需的核酸序列。每个控制序列对于编码该多肽的多核苷酸来说可以是天然的(即,来自相同基因)或外源的(即,来自不同基因),或相对于彼此是天然的或外源的。此类控制序列包括但不限于前导子、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。至少,控制序列包括启动子、以及转录和翻译终止信号。出于引入有利于将这些控制序列与编码多肽的多核苷酸的编码区连接的特异性限制性酶切位点的目的,这些控制序列可以提供有多个接头。
表达:术语“表达”包括涉及多肽的产生的任何步骤,包括但不限于转录、转录后修饰、翻译、翻译后修饰以及分泌。
表达载体:术语“表达载体”意指直链或环状DNA分子,该DNA分子包含编码多肽的多核苷酸并且可操作地连接至提供用于其表达的控制序列。
片段:术语“片段”意指具有从成熟多肽或结构域的氨基和/或羧基端缺失的一个或多个(例如,若干个)氨基酸的多肽;其中该片段具有丝氨酸蛋白酶活性。
宿主细胞:术语“宿主细胞”意指易于用包含本发明的多核苷酸的核酸构建体或表达载体进行转化、转染、转导等的任何细胞类型。术语“宿主细胞”涵盖由于复制期间发生的突变而与亲本细胞不同的亲本细胞的任何后代。
分离的:术语“分离的”意思指处于自然界中不存在的形式或环境中的一种物质。分离的物质的非限制性实例包括(1)任何非天然存在的物质,(2)包括但不限于任何酶、变体、核酸、蛋白质、肽或辅因子的任何物质,该物质至少部分地从与其本质相关的一种或多种或所有天然存在的成分中去除;(3)相对于天然发现的物质通过人工修饰的任何物质;或(4)通过相对于与其天然相关的其他组分增加物质的量而修饰的任何物质(例如宿主细胞中的重组产生;编码该物质的基因的多个拷贝;以及使用比与编码该物质的基因天然相关的启动子更强的启动子)。分离的物质可以存在于发酵液样品中;例如宿主细胞可以经遗传修饰以表达本发明的多肽。来自该宿主细胞的发酵液将包含分离的多肽。
成熟多肽:术语“成熟多肽”意指在翻译和任何翻译后修饰如N-末端加工、C-末端截短、糖基化作用、磷酸化作用等之后处于其最终形式的多肽。
本领域已知,宿主细胞可产生由相同多核苷酸表达的两种或更多种不同成熟多肽(即,具有不同C-末端和/或N-末端氨基酸)的混合物。本领域还已知,不同的宿主细胞不同地加工多肽,并且因此一个表达多核苷酸的宿主细胞当与另一个表达相同多核苷酸的宿主细胞相比时可以产生不同的成熟多肽(例如,具有不同的C-末端和/或N-末端氨基酸)。
成熟多肽编码序列:术语“成熟多肽编码序列”意指编码具有丝氨酸蛋白酶活性的成熟多肽的多核苷酸。
核酸构建体:术语“核酸构建体”意指单-链或双链的核酸分子,该核酸分子是从天然存在的基因中分离的,或以本来不存在于自然界中的方式被修饰成含有核酸的区段,或是合成的,该核酸分子包含一个或多个控制序列。
可操作地连接:术语“可操作地连接”意思指这样一种构型,在该构型中,一个控制序列被放置在相对于多核苷酸的编码序列适当的位置处,这样使得该控制序列引导该编码序列的表达。
蛋白酶活性:术语“蛋白酶活性”意指蛋白质水解活性(EC 3.4)。存在若干种蛋白酶活性类型,例如在Arg和Lys残基的羧基末端侧切割的胰蛋白酶样蛋白酶以及在疏水性氨基酸残基的羧基末端侧切割的糜蛋白酶样蛋白酶。
可以使用任何测定来测量蛋白酶活性,其中采用一种底物,该底物包括与所讨论的蛋白酶的特异性相关的肽键。测定pH值和测定温度同样适用于所讨论的蛋白酶。测定pH值的实例是pH 2、3、4、5、6、7、8、9、10、11或12。测定温度的实例是15℃、20℃、25℃、30℃、35℃、37℃、40℃、45℃、50℃、55℃、60℃、65℃、70℃、80℃、90℃或95℃。普通蛋白酶底物的实例是酪蛋白、牛血清白蛋白以及血红蛋白。在经典的Anson和Mirsky方法中,将变性的血红蛋白用作底物并且在用所讨论的蛋白酶孵育测定后,确定三氯乙酸可溶的血红蛋白的量用作蛋白酶活性的量度(Anson,M.L.和Mirsky,A.E.,1932,J.Gen.Physiol.[普通生理学杂志]16:59以及Anson,M.L.,1938,J.Gen.Physiol.[普通生理学杂志]22:79)。
出于本发明的目的,使用描述于“材料与方法”中的测定确定蛋白酶活性,如动力学Suc-AAPF-pNA测定、Protazyme AK测定、动力学Suc-AAPX-pNA测定以及邻苯二甲醛(OPA)。对于Protazyme AK测定,当用该蛋白酶孵育时,不可溶Protazyme AK(天青精-交联的酪蛋白)底物释放蓝色并且确定该颜色作为蛋白酶活性的量度。对于Suc-AAPF-pNA测定,当用该蛋白酶孵育时,无色的Suc-AAPF-pNA底物释放黄色的对硝基苯胺并且确定该黄色作为蛋白酶活性的量度。
序列一致性:两个氨基酸序列之间或两个核苷酸序列之间的关联度通过参数“序列一致性”来描述。
出于本发明的目的,使用如在EMBOSS包(EMBOSS:欧洲分子生物学开放软件套件,Rice等人,2000,Trends Genet.[遗传学趋势]16:276-277)(优选5.0.0版或更新版本)的Needle程序中所实施的Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.[分子生物学杂志]48:443-453)来确定两个氨基酸序列之间的序列一致性。使用的参数是缺口开放罚分10、缺口扩展罚分0.5、以及EBLOSUM62(BLOSUM62的EMBOSS版本)取代矩阵。使用Needle标记的“最长一致性”的输出(使用-nobrief选项获得)作为一致性百分比并且计算如下:
(相同的残基X 100)/(比对长度-在比对中的空位总数)
出于本发明的目的,使用Needleman-Wunsch算法(Needleman和Wunsch,1970,见上文)来确定两个脱氧核苷酸序列之间的序列一致性,该算法如EMBOSS软件包(EMBOSS:欧洲分子生物学开放软件套件,Rice等人,2000,见上文)(优选5.0.0版或更新版本)的Needle程序所实施的。所使用的参数是空位开放罚分10,空位延伸罚分0.5,以及EDNAFULL(NCBINUC4.4的EMBOSS版)取代矩阵。使用Needle标记的“最长一致性”的输出(使用-nobrief选项获得)作为一致性百分比并且计算如下:
(一致的脱氧核糖核苷酸x 100)/(比对长度-比对中的空位总数)
子序列:术语“子序列”意指使一个或多个(例如,若干个)核苷酸从成熟多肽编码序列的5'端和/或3'端缺失的多核苷酸;其中该子序列编码具有蛋白酶活性的片段。
变体:术语“变体”意指具有蛋白酶活性的、在一个或多个(例如,若干个)位置处包括改变(即,取代、插入和/或缺失)的多肽。取代意指用不同的氨基酸替代占用某一位置的氨基酸;缺失意指去除占用某一位置的氨基酸;并且插入意指在邻接并且紧随占用某一位置的氨基酸之后添加氨基酸。
具体实施方式
本发明涉及通过在SSF方法中组合使用至少一种内切蛋白酶和至少一种外切蛋白酶从含淀粉材料生产乙醇的改进的方法。更特别地,外切蛋白酶应以总蛋白酶酶蛋白为基础构成蛋白酶混合物的至少5%(w/w)。
更具体地,本发明涉及用于从含淀粉材料生产发酵产物的方法,该方法包括:
a)使用产碳水化合物源的酶在低于所述含淀粉材料的初始糊化温度的温度使含淀粉材料糖化;以及
b)使用发酵生物进行发酵;其中
步骤a)和/或b)在内切蛋白酶和外切蛋白酶混合物存在下进行,并且其中外切蛋白酶以总蛋白酶酶蛋白为基础构成蛋白酶混合物的至少5%(w/w)。
在第二方面,本发明提供一种用于从含淀粉材料产生发酵产物的方法,该方法包括以下步骤:
(a)在高于所述含淀粉材料的初始糊化温度的温度,在α-淀粉酶存在下,液化该含淀粉材料;
(b)使用产碳水化合物源的酶来使步骤(a)中获得的液化材料糖化;
(c)使用发酵生物进行发酵;
其中步骤b)和/或c)在内切蛋白酶和外切蛋白酶混合物存在下进行,并且其中外切蛋白酶以总蛋白酶酶蛋白为基础构成蛋白酶混合物的至少5%(w/w)。
从含淀粉材料生产发酵产物(例如乙醇)的方法,是本领域中熟知的。通常使用两种不同种类的方法。最常使用的方法通常被称作“传统方法”,包括在高温时典型地使用细菌α-淀粉酶液化经糊化的淀粉,随后在葡糖淀粉酶和发酵生物的存在下进行同时糖化和发酵。另一种熟知的方法通常被称作“生淀粉水解”-方法(RSH方法),包括典型地在酸性真菌α-淀粉酶和葡糖淀粉酶的存在下在低于初始糊化温度处将颗粒淀粉同时糖化和发酵。
天然淀粉由室温时不溶于水的微观颗粒组成。加热水性淀粉浆料时,颗粒膨胀并且最后破裂,将淀粉分子分散至溶液中。在高达约50℃至75℃的温度时,膨胀可以是可逆的。然而,在更高温度,开始不可逆膨胀,称为“糊化”。在这种“糊化”过程中,黏度有显著的增加。有待加工的颗粒状淀粉可以具有高度精制的淀粉质量,优选地至少90%、至少95%、至少97%或至少99.5%纯,或它可以为含更粗糙的淀粉材料,这些材料包括(例如,经碾磨的)全谷物,全谷物包含非淀粉部分,如胚芽残留物和纤维。该原材料(如全谷物)可以例如经过碾磨减少粒度,以便展开结构并且允许进一步加工。在干式碾磨中,整个谷粒被碾磨并且使用。湿磨使胚芽与粗粉(淀粉颗粒和蛋白质)很好分离并且时常应用于在例如糖浆的生产中使用淀粉水解物的场所。干式和湿式碾磨两者是本领域中众所周知的淀粉加工法并且可以用于本发明的方法中。用于减少该含淀粉材料的粒度的方法为本领域的普通技术人员所已知。
由于典型工业过程中的固体水平为30%-40%,因此不得不稀释或“液化”淀粉以使其能够被适当加工。在当前商业实践中,这种黏度的降低主要通过酶促降解来实现。
在α-淀粉酶,优选细菌α-淀粉酶和/或酸性真菌α-淀粉酶的存在下进行液化。在一个实施例中,在液化过程中还存在植酸酶。在一个实施例中,在液化期间,还存在降低黏度的酶例如木聚糖酶和/或β-葡聚糖酶。
在液化过程中,α-淀粉酶将长链淀粉降解为支链以及线性的较短单元(麦芽糊精)。液化可以作为一个三步热浆料方法进行。将浆料加热至60℃-95℃之间(例如70℃-90℃,例如77℃-86℃、80℃-85℃、83℃-85℃)并且添加α-淀粉酶以开始液化(稀释)。
在一个实施例中,可以将浆料在95℃-140℃(例如,105℃-125℃)之间喷射蒸煮约1-15分钟,例如约3-10分钟,尤其是5分钟左右。然后,将浆料冷却至60℃-95℃并且添加更多的α-淀粉酶,以获得最终水解(二次液化)。在pH 4.5-6.5,典型地在5与6之间的pH时进行喷射蒸煮过程。可以例如在喷射蒸煮之前,将α-淀粉酶以单一剂量添加。
在70℃-95℃之间,例如80℃-90℃,例如85℃左右,将液化过程进行约10分钟至5小时,典型地是1小时-2小时。pH在4与7之间,例如在4.5与5.5之间。为了确保这些条件下最佳的酶稳定性,可以任选地添加钙(以提供1ppm-60ppm游离钙离子,例如约40ppm游离钙离子)。如此处理之后,液化淀粉将典型地具有10-15的“右旋糖当量”(DE)。
通常,液化和液化条件在本领域是熟知的。
用于液化中的α-淀粉酶优选是细菌酸稳定型α-淀粉酶。具体地,α-淀粉酶来自微小杆菌属物种或芽孢杆菌属物种(例如像嗜热脂肪芽孢杆菌或地衣芽孢杆菌)。
可以使用本领域熟知的条件,用产碳水化合物源的酶,具体是葡糖淀粉酶或β-淀粉酶以及任选地脱支酶(例如异淀粉酶或支链淀粉酶)进行糖化。例如,全部糖化步骤可以持续从约24至约72小时。然而,常见地在30℃-65℃之间的温度(典型地约60℃)进行典型地40分钟-90分钟的预糖化,随后在同时糖化和发酵(SSF)方法中,在发酵期间进行完全糖化。典型地在20℃-75℃的范围内的温度(例如,25℃-65℃和40℃-70℃,典型地60℃左右),并且在约4与5之间的pH,一般在约pH 4.5时进行糖化。
糖化步骤和发酵步骤可以依序或同时进行。在一个实施例中,糖化和发酵是同时进行的(称为“SSF”)。然而,通常,在30℃至65℃、典型地约60℃的温度处执行一个预糖化步骤约30分钟至2小时(例如,30分钟至90分钟),随后在被称为同时糖化和发酵(SSF)的发酵期间进行一个完全糖化。pH通常在4.2-4.8之间,例如,pH 4.5。在同时进行的糖化和发酵(SSF)过程中,没有糖化的保持阶段,而是将酵母和酶一起添加,并且然后在25℃-40℃的温度进行该过程,例如在28℃至35℃之间,例如在30℃至34℃之间,例如约32℃。SSF过程可以在从约3与7之间、优选地从pH 4.0到6.5、或更优选地从pH 4.5到5.5的pH进行。
在一个实施例中,发酵进行6小时至120小时,尤其进行24小时至96小时。
代替如上所述的常规方法,在含淀粉材料没有糊化(即,没有蒸煮)的情况下从含淀粉材料生产发酵产物(例如乙醇)的方法(通常被称为“粗淀粉水解”方法)。可在不使包含含淀粉材料以及水的水性浆料液化的情况下生产发酵产物如乙醇。在一个实施例中,该方法包括:在低于初始糊化温度、优选地在α-淀粉酶和/或产碳水化合物源的酶的存在下将(例如碾磨的)含淀粉材料(例如颗粒状淀粉)糖化,以产生可以通过适合的发酵生物发酵成发酵产物的多种糖。在此实施例中,所希望的发酵产物例如乙醇是从未经糊化的(即,未蒸煮),优选地经碾磨的谷粒如玉米中产生的。
因此,在此方面,本发明涉及自含淀粉材料产生发酵产物的方法,所述方法包括以下步骤:
a)使用产碳水化合物源的酶在低于所述含淀粉材料的初始糊化温度的温度使含淀粉材料糖化;以及
b)使用发酵生物进行发酵;其中
步骤a)和/或b)在内切蛋白酶和外切蛋白酶混合物存在下进行,并且其中外切蛋白酶构成蛋白酶混合物的至少5%(w/w)。
在特定实施例中,步骤a)和b)同时进行,其中其中糖化酶以及发酵生物(例如,酵母)一起添加,并且然后在25℃-40℃温度时执行。SSF过程可以在从约3与7之间、优选地从pH 4.0到6.5、或更优选地从pH 4.5到5.5的pH进行。在一个实施例中,发酵进行6小时至120小时,尤其进行24小时至96小时。
术语“初始糊化温度”意指淀粉的糊化发生的最低温度。通常,在水中加热的淀粉在约50℃与75℃之间开始糊化;糊化的确切温度依赖于具体的淀粉,并且能够由技术人员容易地确定。因此,起始糊化温度可根据植物物种、植物物种的具体品种、以及生长条件而变化。在本发明的上下文中,给定的含淀粉的材料的初始糊化温度是使用Gorinstein和Lii,1992,[淀粉]44(12):461-466所描述的方法,使5%的淀粉颗粒丧失双折射的温度。在一个实施例中,低于初始糊化温度意味着温度典型地在30℃-75℃之间、优选地在45℃-60℃之间的范围内。在一个优选的实施例中,该方法在从25℃至40℃,如从28℃至35℃,如从30℃至34℃,优选地约32℃的温度处进行。
如上文在背景技术部分中所披露的,在发酵过程中蛋白酶的用途是本领域已知的,然而,根据本发明,当在内切蛋白酶和外切蛋白酶混合物存在下进行糖化和/或发酵时,可以获得增加的乙醇产量。特别地,本发明的诸位发明人发现,外切蛋白酶应以总蛋白酶酶蛋白为基础构成蛋白酶混合物的至少5%(w/w)。
在一个实施例中,外切蛋白酶以总蛋白酶酶蛋白为基础构成蛋白酶混合物的至少10%(w/w),例如至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、特别地至少75%、更特别地外切蛋白酶以总蛋白酶酶蛋白为基础构成组合物中蛋白酶混合物的从5%至95%(w/w)、特别地10%至80%(w/w)、特别地15%至70%(w/w)、更特别地20%至60%(w/w)、并且甚至更特别地25%至50%(w/w)。
在另一个实施例中,内切蛋白酶和外切蛋白酶以5:2微克酶蛋白(EP)/g干固体(DS)的比例存在,特别地是5:3,更特别地是5:4。
用于本发明方法的蛋白酶选自内肽酶(内切蛋白酶)和外肽酶(外切蛋白酶)。在内肽酶中,丝氨酸蛋白酶(EC 3.4.21)和金属蛋白酶(EC 3.4.24)是特别相关的。
在一个具体实施例中,内切蛋白酶选自下组,该组由以下组成:属于S53、S8家族的丝氨酸蛋白酶,或属于M35家族的金属蛋白酶。
在另一个具体实施例中,内切蛋白酶选自A1蛋白酶。
在一个实施例中,内切蛋白酶选自S53家族的丝氨酸蛋白酶,例如来自亚灰树花菌属(Meripilus)的菌株,更特别是大型亚灰树花菌(Meripilus giganteus)。
更特别地,S53蛋白酶是一种具有丝氨酸蛋白酶活性多肽,该蛋白酶选自下组,该组由以下组成:
多肽,该多肽与SEQ ID NO:1的成熟多肽或SEQ ID NO:2的多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性。
在另一个实施例中,内切蛋白酶选自S8家族的丝氨酸蛋白酶,例如来自火球菌属(Pyrococcus)或高温球菌属(Thermococcus)的菌株,特别是强烈火球菌(Pyrococcusfuriosus)和嗜热高温球菌(Thermococcus litoralis)。
更特别地,S8蛋白酶是一种具有丝氨酸蛋白酶活性多肽,该蛋白酶选自下组,该组由以下组成:
多肽,该多肽与SEQ ID NO:3的多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性。
在另一个具体实施例中,内切蛋白酶选自金属蛋白酶(参见Handbook ofProteolytic Enzymes[蛋白水解酶手册]A.J.Barrett、N.D.Rawlings、J.F.Woessner编辑,学术出版社(Academic Press)(1998));特别地,本发明的蛋白酶选自下组,该组由以下组成:
(a)属于EC 3.4.24金属内肽酶的蛋白酶;
(b)属于以上手册的M组的金属蛋白酶;
(c)属于M35家族的金属蛋白酶(如在以上手册的第1492-1495页所定义)。
在一个具体实施例中,内切蛋白酶选自M35家族,更特别地M35蛋白酶源自橙色嗜热子囊菌(Thermoascus aurantiacus),其成熟多肽包含SEQ ID NO:16的氨基酸1-177或与SEQ ID NO:16的多肽具有至少75%一致性,优选至少80%、更优选至少85%、更优选至少90%、更优选至少91%、更优选至少92%、甚至更优选至少93%、最优选至少94%、并且甚至最优选至少95%,例如甚至至少96%、至少97%、至少98%、至少99%一致性的多肽。
外切蛋白酶优选地选自属于家族S10、S53、M14、M28、特别是S10的蛋白酶,更特别是选自曲霉属或青霉属的S10,例如米曲霉、黑曲霉或简青霉(Penicilliumsimplicissimum)。
在一个具体实施例中,S10外切蛋白酶选自具有丝氨酸蛋白酶活性的多肽,选自下组,该组由以下组成:
多肽,该多肽与SEQ ID NO:4的成熟多肽或SEQ ID NO:5的多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性。
在一个具体实施例中,S10外切蛋白酶选自具有丝氨酸蛋白酶活性的多肽,选自下组,该组由以下组成:
多肽,该多肽与SEQ ID NO:6的成熟多肽或SEQ ID NO:7的多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性。
在另一个具体实施例中,S10外切蛋白酶是具有丝氨酸蛋白酶活性的多肽,选自与SEQ ID NO:31的多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽。
在另一个实施例中,外切蛋白酶选自S53外切蛋白酶,其来源于曲霉属、木霉属、嗜热子囊菌属或嗜热真菌属的菌株,特别是米曲霉、黑曲霉、里氏木霉、嗜热嗜热子囊菌(Thermoascus thermophilus)或疏棉状嗜热丝孢菌(Thermomyces lanuginosus)。
在一个具体实施例中,S53外切蛋白酶是具有丝氨酸蛋白酶活性的多肽,选自与SEQ ID NO:19的成熟多肽或SEQ ID NO:20的多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽。
在一个具体实施例中,S53外切蛋白酶是具有丝氨酸蛋白酶活性的多肽,选自与SEQ ID NO:21的成熟多肽或SEQ ID NO:22的多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽。
在一个具体实施例中,S53外切蛋白酶是具有丝氨酸蛋白酶活性的多肽,选自与SEQ ID NO:23的成熟多肽或SEQ ID NO:24的多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽。
在一个具体实施例中,S53外切蛋白酶是具有丝氨酸蛋白酶活性的多肽,选自与SEQ ID NO:25的成熟多肽或SEQ ID NO:26的多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽。
在一个具体实施例中,S53外切蛋白酶是具有丝氨酸蛋白酶活性的多肽,选自与SEQ ID NO:32的多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽。
在开始该方法之前,可以制备具有10-55w/w%干固体(DS)、优选25-45w/w%干固体、更优选30-40w/w%干固体的含淀粉材料(例如颗粒状淀粉)的浆料。该浆料可以包括水和/或工艺用水,如釜馏物(逆流)、洗涤器水、蒸发器冷凝物或馏出物、由蒸馏得到的侧流汽提器水,或来自其他发酵产物设备的工艺用水。
在一个具体实施例中,本发明的方法在将含淀粉材料转化为糖/糊精之前进一步包含以下步骤:
(x)减少该含淀粉材料的粒度;以及
(y)形成包含该含淀粉材料和水的浆料。
在实施例中,将该含淀粉材料碾磨,以减少粒度。在实施例中,该粒度被减少至0.05mm-3.0mm、优选0.1mm-0.5mm之间,或使得至少30%、优选至少50%、更优选至少70%、甚至更优选至少90%的含淀粉材料适合通过一个具有0.05mm-3.0mm筛网、优选0.1mm-0.5mm筛网的筛子。
在经受本发明的方法之后,含淀粉材料中至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或优选地至少99%的干固体被转化成可溶的淀粉水解产物。
在一个实施例中,粒度是小于#7筛,例如#6筛。#7筛通常用于常规现有技术过程中。
液化中存在的和/或添加的α-淀粉酶
用于液化中的α-淀粉酶优选是细菌酸稳定型α-淀粉酶。具体地,α-淀粉酶来自微小杆菌属物种或芽孢杆菌属物种(例如像嗜热脂肪芽孢杆菌或地衣芽孢杆菌)。
在一个实施例中,α-淀粉酶来自芽孢杆菌属,如嗜热脂肪芽孢杆菌菌株,特别是嗜热脂肪芽孢杆菌α-淀粉酶的变体,如WO 99/019467中的SEQ ID NO:3或在此的SEQ ID NO:15中所示的α-淀粉酶。
在一个实施例中,嗜热脂肪芽孢杆菌α-淀粉酶在从位置179至位置182的区域中具有两个氨基酸的双缺失,更具体地在位置I181+G182、R179+G180、G180+I181、R179+I181或G180+G182(优选I181+G182)处的双缺失,和任选地N193F取代(使用SEQ ID NO:15进行编号)。
在一个实施例中,嗜热脂肪芽孢杆菌α-淀粉酶在位置S242处具有取代,优选S242Q取代。
在一个实施例中,嗜热脂肪芽孢杆菌α-淀粉酶在位置E188处具有取代,优选E188P取代。
在一个实施例中,α-淀粉酶选自嗜热脂肪芽孢杆菌α-淀粉酶变体的组,所述变体具有以下突变:
-I181*+G182*+N193F+E129V+K177L+R179E;
-
I181*+G182*+N193F+V59A+Q89R+E129V+K177L+R179E+H208Y+K220P+N224L+Q254S;
-I181*+G182*+N193F +V59A Q89R+ E129V+ K177L+ R179E+Q254S+M284V;和
-
I181*+G182*+N193F+E129V+K177L+R179E+K220P+N224L+S242Q+Q254S(使用SEQID NO:15进行编号)。
在一个实施例中,该α-淀粉酶变体与SEQ ID NO:15的多肽具有至少75%一致性,优选地至少80%,更优选地至少85%,更优选地至少90%,更优选地至少91%,更优选地至少92%,甚至更优选地至少93%,最优选地至少94%,并且甚至最优选地至少95%,如甚至至少96%、至少97%、至少98%、至少99%,但小于100%一致性。
应理解的是,当提及嗜热脂肪芽孢杆菌α-淀粉酶及其变体时,它们通常以截短的形式产生。具体地,截短可以为这样使得WO 99/19467中的SEQ ID NO:3或本文的SEQ IDNO:15中所示的嗜热脂肪芽孢杆菌α-淀粉酶或其变体在C-末端截短以优选地具有大约490个氨基酸,如从482-493个氨基酸。优选地,嗜热脂肪芽孢杆菌变体α-淀粉酶优选地在SEQID NO:15的位置484之后,特别是在位置485之后、特别是在位置486之后、特别是在位置487之后、特别是在位置488之后、特别是在位置489之后、特别是在位置490之后、特别是在位置491之后、特别是在位置492之后,更特别是在位置493之后被截短。
在糖化和/或发酵中存在的和/或添加的葡糖淀粉酶
在一个实施例中,在糖化期间存在的产碳水化合物源的酶可以是葡糖淀粉酶。在本发明的方法中,在糖化和/或发酵,优选同时糖化和发酵(SSF)(即,未经糊化的或经糊化的淀粉材料的糖化和发酵)中,存在和/或添加葡糖淀粉酶。
在一个实施例中,在糖化和/或发酵中存在的和/或添加的葡糖淀粉酶是真菌来源的,优选地来自曲霉属的菌株,优选黑曲霉、泡盛曲霉或米曲霉;或木霉属的菌株,优选里氏木霉;或篮状菌属的菌株,优选埃默森篮状菌;或栓菌属的菌株,优选瓣环栓菌(T.cingulata);或密孔菌属的菌株,优选是血红密孔菌;或粘褶菌属(Gloeophyllum)的菌株,如篱边粘褶菌(G.serpiarium)、冷杉粘褶菌(G.abietinum)或密粘褶菌(G.trabeum);或黑层孔属(Nigrofomes)的菌株。
在一个实施例中,葡糖淀粉酶是源自篮状菌属,如埃默森篮状菌的菌株,如示于SEQ ID NO:11中的菌株。
在一个实施例中,葡糖淀粉酶选自下组,该组由以下组成:
(i)包含SEQ ID NO:11的多肽的葡糖淀粉酶;
(ii)包含以下氨基酸序列的葡糖淀粉酶,该氨基酸序列与SEQ ID NO:11的多肽具有至少60%、至少70%,例如至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的一致性。
在实施例中,葡糖淀粉酶源自密孔菌属的菌株,特别是描述于WO 2011/066576中的血红密孔菌的菌株(SEQ ID NO 2、4或6),如示为WO 2011/066576中的SEQ ID NO:4或本文的SEQ ID NO:12的菌株。
在一个实施例中,葡糖淀粉酶选自下组,该组由以下组成:
(i)包含SEQ ID NO:12的多肽的葡糖淀粉酶;
(ii)包含以下氨基酸序列的葡糖淀粉酶,该氨基酸序列与SEQ ID NO:12的多肽具有至少60%、至少70%,例如至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的一致性。
在一个实施例中,葡糖淀粉酶是源自粘褶菌属的菌株,如篱边粘褶菌或密粘褶菌的菌株,特别是如在WO 2011/068803中描述的粘褶菌属的菌株(SEQ ID NO:2、4、6、8、10、12、14或16)。在一个优选的实施例中,葡糖淀粉酶是示出于WO 2011/068803中的SEQ IDNO:2中的篱边粘褶菌。
在一个实施例中,葡糖淀粉酶是源自篱边粘褶菌,如示于SEQ ID NO:13中的菌株。
在一个实施例中,葡糖淀粉酶选自下组,该组由以下组成:
(i)包含SEQ ID NO:13的多肽的葡糖淀粉酶;
(ii)包含以下氨基酸序列的葡糖淀粉酶,该氨基酸序列与SEQ ID NO:13的多肽具有至少60%、至少70%,例如至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的一致性。
在另一个实施例中,葡糖淀粉酶源自密粘褶菌,如示于SEQ ID NO:14中的密粘褶菌。在一个实施例中,葡糖淀粉酶选自下组,该组由以下组成:
(i)包含SEQ ID NO:14的多肽的葡糖淀粉酶;
(ii)包含以下氨基酸序列的葡糖淀粉酶,该氨基酸序列与SEQ ID NO:14的多肽具有至少60%、至少70%,例如至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的一致性。
在一个实施例中,该葡糖淀粉酶是源自栓菌属,如瓣环栓菌的菌株,如示于SEQ IDNO:10中的菌株。
在一个实施例中,葡糖淀粉酶选自下组,该组由以下组成:
(i)包含SEQ ID NO:10的多肽的葡糖淀粉酶;
(ii)包含以下氨基酸序列的葡糖淀粉酶,该氨基酸序列与SEQ ID NO:10的多肽具有至少60%、至少70%,例如至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的一致性。
在一个实施例中,葡糖淀粉酶源自黑层孔属(Nigrofomes)的菌株,具体是披露于WO 2012/064351中的黑层孔属物种的菌株。
在一个实施例中,葡糖淀粉酶能以如下量添加到糖化和/或发酵中:0.0001-20AGU/g DS,优选0.001-10AGU/g DS,尤其是0.01-5AGU/g DS之间,如0.1-2AGU/g DS,尤其是0.1-0.5AGU/g DS。
包含葡糖淀粉酶的可商购组合物包括AMG 200L;AMG 300L;SANTMSUPER、SANTMEXTRA L、SPIRIZYMETM PLUS、SPIRIZYMETM FUEL、SPIRIZYMETM B4U、SPIRIZYMETM ULTRA、SPIRIZYMETM EXCEL和AMGTM E(来自诺维信公司(Novozymes A/S));OPTIDEXTM 300、GC480、GC417(来自杜邦公司(DuPont.));AMIGASETM和AMIGASETM PLUS(来自帝斯曼公司(DSM));G-ZYMETM G900、G-ZYMETM和G990 ZR(来自杜邦公司)。
根据本发明的优选实施例,在糖化和/或发酵中,葡糖淀粉酶是与α-淀粉酶相结合存在的和/或添加的。下面描述了适合的α-淀粉酶的实例。
在糖化和/或发酵中存在和/或添加的α-淀粉酶
在一个实施例中,在本发明的方法中,在糖化和/或发酵中存在和/或添加的α-淀粉酶。在一个优选实施例中,α-淀粉酶是真菌或细菌来源的。在一个优选实施例中,α-淀粉酶是真菌酸稳定的α-淀粉酶。真菌酸性稳定的α-淀粉酶是在3.0至7.0的pH范围内,并且优选地在3.5至6.5的pH范围内具有活性的α-淀粉酶,包括在约4.0、4.5、5.0、5.5和6.0的pH时的活性。
在一个实施例中,该α-淀粉酶是源自曲霉属,具体是土曲霉、黑曲霉、米曲霉、泡盛曲霉、或白曲霉的菌株;或者根毛霉属的菌株,优选是微小根毛霉的菌株;或者亚灰树花菌属,优选是大型亚灰树花菌的菌株。
在一个优选实施例中,在糖化和/或发酵中存在的和/或添加的α-淀粉酶是源自根毛霉属的菌株,优选菌株微小根毛霉,如示于WO 2013/006756中的SEQ ID NO:3中的菌株,如具有黑曲霉连接子和淀粉结合结构域的微小根毛霉α-淀粉酶杂合体,如示于在此的SEQID NO:9中的杂合体或其变体。
在一个实施例中,在糖化和/或发酵中存在的和/或添加的α-淀粉酶选自下组,该组由以下组成:
(i)包含SEQ ID NO:9的多肽的α-淀粉酶;
(ii)包含以下氨基酸序列的α-淀粉酶,该氨基酸序列与SEQ ID NO:9的多肽具有至少60%、至少70%,例如至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的一致性。
在一个优选的实施例中,该α-淀粉酶是示于SEQ ID NO:9中的具有以下取代或取代的组合中的至少一个的α-淀粉酶的变体:D165M;Y141W;Y141R;K136F;K192R;P224A;P224R;S123H+Y141W;G20S+Y141W;A76G+Y141W;G128D+Y141W;G128D+D143N;P219C+Y141W;N142D+D143N;Y141W+K192R;Y141W+D143N;Y141W+N383R;Y141W+P219C+A265C;Y141W+N142D+D143N;Y141W+K192R V410A;G128D+Y141W+D143N;Y141W+D143N+P219C;Y141W+D143N+K192R;G128D+D143N+K192R;Y141W+D143N+K192R+P219C;G128D+Y141W+D143N+K192R;或G128D+Y141W+D143N+K192R+P219C(使用SEQ ID NO:9进行编号)。
在一个实施例中,该α-淀粉酶来源于具有黑曲霉葡糖淀粉酶连接子和淀粉结合域(SBD)的微小根毛霉,优选披露为SEQ ID NO:9,优选具有以下取代中的一个或多个:G128D、D143N,优选G128D+D143N(使用SEQ ID NO:9进行编号),并且其中在糖化和/或发酵中存在的和/或添加的α-淀粉酶变体与本文的SEQ ID NO:9的多肽具有至少75%的一致性,优选至少80%,更优选至少85%,更优选至少90%,更优选至少91%,更优选至少92%,甚至更优选至少93%,最优选至少94%,并且甚至最优选至少95%,如甚至至少96%、至少97%、至少98%、至少99%,但小于100%的一致性。
在一个优选的实施例中,在糖化和/或发酵过程中存在的和/或添加的葡糖淀粉酶与α-淀粉酶之间的比率优选可以在500:1至1:1,例如从250:1至1:1、例如从100:1至1:1、例如从100:2至100:50、例如从100:3至100:70的范围内。
在一个实施例中,该α-淀粉酶以0.001至10AFAU/g DS,优选地0.01至5AFAU/g DS,特别地0.3至2AFAU/g DS或0.001至1FAU-F/g DS,优选地0.01至1FAU-F/g DS的量存在。
在另一个实施例中,其中当糖化和发酵同时进行时,α-淀粉酶和葡糖淀粉酶以在0.1和100AGU/FAU-F之间,优选地在2和50AGU/FAU-F之间,特别地在10和40AGU/FAU-F之间的比率添加。
发酵
基于例如植物材料的种类、可获得的可发酵糖、一种或多种发酵生物和/或所希望的发酵产物确定发酵条件。本领域的普通技术人员可以容易地确定适合的发酵条件。发酵可以在常规使用的条件下进行。优选的发酵过程是厌氧过程。
例如,发酵可以在高达75℃,例如40℃-70℃之间,如50℃-60℃之间的温度处进行。然而,还已知的是细菌具有低至室温左右(20℃左右)的显著较低的最适温度。适合的发酵生物的实例可以发现于上面的“发酵生物”部分中。
对于使用酵母生产乙醇,发酵可以持续24至96小时,特别是持续35至60小时。在一个实施例中,在20℃至40℃,优选26℃至34℃之间,特别是32℃左右的温度处进行发酵。
除了发酵微生物(例如,酵母)以外,发酵还可包括营养物以及额外酶,这些额外酶包括植酸酶。酵母在发酵中的使用在本领域中是熟知的。
其他发酵产物可以在本领域的普通技术人员已知的、适于所讨论的发酵生物的温度发酵。
典型地在3与7之间,优选从pH 3.5至6,更优选pH 4至5的范围内的pH进行发酵。发酵典型地持续6小时-96小时。
本发明的方法可以作为分批过程或作为连续过程进行。发酵可以在超滤系统中进行,其中将渗余物在固体、水和发酵生物的存在下保持在再循环之下,并且其中渗透物是包含所希望的发酵产物的液体。同样考虑的是在具有超滤膜的连续膜反应器中执行的方法/工艺,并且其中将渗余物在固体、水和一种或多种发酵生物的存在下保持在再循环之下,并且其中渗透物是含有发酵产物的液体。
发酵后,可以将发酵生物与发酵的浆料分开并再循环。
含淀粉材料
可以在本发明的方法中使用任何适合的含淀粉起始材料。在一个实施例中,所述包含淀粉材料是粒状淀粉。在另一个实施例中,所述包含淀粉材料源自完整谷物。通常基于所希望的发酵产物来选择起始材料。适于在本发明的方法中使用的含淀粉起始材料的实例包括大麦、豆类、树薯(cassava)、谷物、玉米、买罗高梁(milo)、豌豆、马铃薯、稻、黑麦、西米、高粱、甘薯、木薯(tapioca)、小麦以及全谷物或其任何混合物。该含淀粉材料还可以是蜡质或非蜡质类型的玉米和大麦。在优选的实施例中,该含淀粉材料是玉米。在优选的实施例中,该含淀粉材料是小麦。
发酵产物
术语“发酵产物”意指通过包括使用发酵生物的发酵方法或过程生产的产品。发酵产物包括醇(例如,乙醇、甲醇、丁醇);有机酸(例如,柠檬酸、乙酸、衣康酸、乳酸、丁二酸、葡糖酸);酮(例如,丙酮);氨基酸(例如,谷氨酸);气体(例如,H2和CO2);抗生素(例如,青霉素和四环素);酶;维生素(例如,核黄素、B12、β-胡萝卜素);和激素。在一个优选实施例中,该发酵产物是乙醇,例如燃料乙醇;饮用乙醇,即中性饮用酒精;或用于消费性醇工业(例如,啤酒和酒)、乳品工业(例如,发酵的乳制品)、皮革工业和烟草工业的工业乙醇或产物。优选的啤酒类型包括爱尔啤酒(ale)、烈性黑啤酒(stout)、波特啤酒(porter)、拉格啤酒(lager)、苦啤酒(bitter)、麦芽酒(malt liquor)、低麦芽啤酒(happoushu)、高醇啤酒、低醇啤酒、低热量啤酒或清淡啤酒。在优选的实施例中,该发酵产物是乙醇。
发酵生物
术语“发酵生物”是指适于生产所希望的发酵产物的任何生物,包括细菌和真菌生物,例如酵母和丝状真菌。适合的发酵生物能够将可发酵糖(如阿拉伯糖、果糖、葡萄糖、麦芽糖、甘露糖或木糖)直接或间接地发酵(即,转化)为所希望的发酵产物。
发酵生物的实例包括真菌生物,例如酵母。优选的酵母包括酵母菌(Saccharomyces),特别是酿酒酵母或葡萄汁酵母(Saccharomyces uvarum);毕赤酵母属(Pichia),特别是树干毕赤酵母(Pichiastipitis)的菌株,如树干毕赤酵母CBS 5773,或巴斯德毕赤酵母(Pichia pastoris)的菌株;假丝酵母属(Candida),特别是阿拉伯糖发酵假丝酵母(Candida arabinofermentans)、博伊丁假丝酵母(Candida boidinii)、迪丹斯假丝酵母(Candida diddensii)、休哈塔假丝酵母(Candida shehatae)、萨纳瑞西斯假丝酵母(Candida sonorensis)、假热带假丝酵母(Candida tropicalis)、或产朊假丝酵母(Candida utilis)。其他发酵生物包括汉逊酵母属的菌株,特别是异常汉森酵母或多形汉逊酵母;克鲁弗酵母属的菌株,特别是脆壁克鲁弗酵母或马克斯克鲁弗酵母(Kluyveromyces marxianus);以及裂殖酵母属的菌株,特别是粟酒裂殖酵母。
优选的细菌发酵生物包括埃希氏菌属的菌株,特别是大肠杆菌;发酵单胞菌属的菌株,特别是运动发酵单胞菌;发酵杆菌属的菌株,特别是棕榈科发酵杆菌(Zymobactorpalmae);克雷伯菌属的菌株,特别是产酸克雷伯菌;明串珠菌属的菌株,特别是肠膜状明串珠菌;梭菌属的菌株,特别是丁酸梭菌;肠杆菌属的菌株,特别是产气肠杆菌;以及高温厌氧杆菌属的菌株,特别是高温厌氧杆菌BG1L1(Appl.Microbiol.Biotech.[应用微生物学与生物技术]77:61-86)、产乙醇高温厌氧杆菌(Thermoanarobacter ethanolicus)、产甲烷高温厌氧杆菌(Thermoanaerobacter mathranii)或热解糖高温厌氧杆菌(Thermoanaerobacterthermosaccharolyticum)。乳杆菌属的菌株也被预期,如谷氨酸棒状杆菌R、嗜热葡糖苷酶芽孢杆菌(Bacillus thermoglucosidaisus)和嗜热葡糖苷酶土芽孢杆菌(Geobacillusthermoglucosidasius)的菌株。
在一个实施例中,该发酵生物是C6糖发酵生物,如例如酿酒酵母的菌株。
在一个实施例中,该发酵生物是C5糖发酵生物,如例如酿酒酵母的菌株。
发酵中所使用的起始酵母的量是在合适时间内有效产生商业上有效量乙醇的量(例如,在小于72小时内从具有25%-40%之间DS的底物产生至少10%乙醇)。酵母细胞总体上以约104至约1012、并且优选地从约107至约1010、特别地约5x 107活酵母计数/mL发酵液的量来供应。在将酵母添加至醪液之后,使它典型地经受发酵约24小时-96小时,例如,35小时-60小时。温度在约26℃-34℃之间,典型地约32℃,并且pH是从pH 3-6,例如,约pH 4-5。
酵母是用于乙醇发酵的优选发酵生物。优选的是酵母属的菌株,尤其是酿酒酵母种的菌株,优选是对高水平的乙醇(即,直到例如约10、12、15或20vol.%或更多的乙醇)耐受的菌株。
在实施例中,利用C5的酵母是披露于WO 2004/085627中的酿酒酵母菌株。
在一个实施例中,发酵生物是WO 2010/074577(内达尔科公司(Nedalco))中关注的C5真核微生物细胞。
在一个实施例中,发酵生物是披露于US 2008/0014620中的能够直接将木糖同分异构化为木酮糖的经转化C5真核细胞。
在一个实施例中,发酵生物是披露于WO 2009/109633中的C5糖发酵细胞。
可商购的酵母包括LNF SA-1、LNF BG-1、LNF PE-2和LNF CAT-1(可获得自巴西的LNF),RED STARTM和ETHANOL REDTM酵母(可获得自富酶泰斯/乐斯富(Fermentis/Lesaffre),美国),FALI(可获得自弗莱施曼酵母(Fleischmann’s Yeast),美国),SUPERSTART和THERMOSACCTM新鲜酵母(可获得自乙醇技术(Ethanol Technology),威斯康星州(WI),美国),BIOFERM AFT和XR(可获得自NABC-北美生物产品集团(NABC-NorthAmerican Bioproducts Corporation),佐治亚州(GA),美国),GERT STRAND(可获得自格特·斯特兰德AB公司(Gert Strand AB),瑞典)以及FERMIOL(可获得自帝斯曼食品配料部(DSM Specialties))。
能够从可发酵糖生产所希望的发酵产物的发酵生物优选在精确条件下以具体生长速率生长。当将该发酵生物引入进/添加至发酵培养基中时,接种的发酵生物经过多个阶段。不出现原始生长。此时期称为“停滞期”并且可以被认为是适应时期。在称为“对数期”的接下来的阶段过程中,生长速率逐渐增加。在最大生长期间后,速率停止并且发酵生物进入“静止期”。在另外的时间段后,发酵生物进入“死亡期”,其中活细胞的数目下降。
回收
继发酵之后,可以将发酵产物与发酵培养基分开。因此,在一个实施例中,该发酵产物是在发酵之后回收。可以将发酵介质蒸馏以提取所希望的发酵产物或可以通过微滤或膜过滤技术从发酵介质中提取所希望的发酵产物。可替代地,可以通过汽提回收发酵产物。回收方法在本领域中是熟知的。
酶组合物
本发明还涉及包含内切蛋白酶和外切蛋白酶的混合物的组合物,并且其中外切蛋白酶以总蛋白酶酶蛋白为基础构成混合物中蛋白酶的至少5%(w/w),例如至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、特别地至少75%、更特别地外切蛋白酶以总蛋白酶酶蛋白为基础构成混合物中蛋白酶的在5%至95%(w/w)之间、特别地10%至80%(w/w)、特别地15%至70%(w/w)、更特别地20%至60%(w/w)、并且甚至更特别地以总蛋白酶酶蛋白为基础构成组合物中蛋白酶混合物的25%至50%(w/w)。
在一个实施例中,内切蛋白酶源自属于家族S53、S8、M35或A1的蛋白酶并且外切蛋白酶源自属于家族S10、S53、M14或M28的蛋白酶。
在一个具体实施例中,内切蛋白酶是来自大型亚灰树花菌的S53并且外切蛋白酶是来自米曲霉、黑曲霉或简青霉的S10。
内切蛋白酶优选地选自S53家族的丝氨酸蛋白酶,例如比如来自亚灰树花菌、特别地来自大型亚灰树花菌的S53蛋白酶或S8家族的丝氨酸蛋白酶,例如比如来自火球菌属和高温球菌属,特别地来自强烈火球菌和嗜热高温球菌的S8蛋白酶,或选自M35家族的金属蛋白酶,更特别地来自橙色嗜热子囊菌的M35蛋白酶。
在一个具体实施例中,M35金属蛋白酶源自橙色嗜热子囊菌,例如比如包含SEQ IDNO:16的氨基酸1-177的成熟多肽或与SEQ ID NO:16的多肽具有至少75%一致性、优选至少80%、更优选至少85%、更优选至少90%、更优选至少91%、更优选至少92%、甚至更优选至少93%、最优选至少94%、并且甚至最优选至少95%、例如甚至至少96%、至少97%、至少98%、至少99%一致性的多肽。
在另一个具体实施例中,内切蛋白酶可以是A1蛋白酶。
在另一个特定实施例中,S53内切蛋白酶选自下组,该组由以下组成:
多肽,该多肽与SEQ ID NO:1的成熟多肽或SEQ ID NO:2的多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性。
外切蛋白酶优选地选自属于家族S10、S53、M14、M28,特别地S10或S53的蛋白酶,更特别地来自曲霉属或青霉属,例如米曲霉、黑曲霉或简青霉的S10或来自曲霉属、木霉属、嗜热子囊菌属或嗜热真菌属,特别地米曲霉、里氏木霉、嗜热嗜热子囊菌或疏棉状嗜热丝孢菌的S53外切蛋白酶。
在一个特定实施例中,S10外切蛋白酶选自下组,该组由以下组成:
多肽,该多肽与SEQ ID NO:4的成熟多肽或SEQ ID NO:5的多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性。
在另一个特定实施例中,S10外切蛋白酶选自下组,该组由以下组成:
多肽,该多肽与SEQ ID NO:6的成熟多肽或SEQ ID NO:7的多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性。
在另一个具体实施例中,S10外切蛋白酶是具有丝氨酸蛋白酶活性的多肽,选自与SEQ ID NO:31的多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽。
在另一个特定实施例中,S53外切蛋白酶是具有丝氨酸蛋白酶活性的多肽,选自与SEQ ID NO:19的成熟多肽或SEQ ID NO:20的多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽。
在另一个特定实施例中,S53外切蛋白酶是具有丝氨酸蛋白酶活性的多肽,选自与SEQ ID NO:21的成熟多肽或SEQ ID NO:22的多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽。
在另一个特定实施例中,S53外切蛋白酶是具有丝氨酸蛋白酶活性的多肽,选自与SEQ ID NO:23的成熟多肽或SEQ ID NO:24的多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽。
在另一个特定实施例中,S53外切蛋白酶是具有丝氨酸蛋白酶活性的多肽,选自与SEQ ID NO:25的成熟多肽或SEQ ID NO:26的多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽。
在另一个特定实施例中,S53外切蛋白酶是具有丝氨酸蛋白酶活性的多肽,选自与SEQ ID NO:32的多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽。
在一个具体实施例中,内切蛋白酶是来自大型亚灰树花菌的S53蛋白酶,例如SEQID NO:2中披露的S53蛋白酶,并且外切蛋白酶是来自曲霉属或青霉属,特别地米曲霉或简青霉的S10蛋白酶,例如SEQ ID NO:5和SEQ ID NO:7中披露的S10蛋白酶。
在另一个具体实施例中,内切蛋白酶是选自大型亚灰树花菌的S53蛋白酶,例如SEQ ID NO:2中披露的S53蛋白酶,并且外切蛋白酶是选自曲霉属、木霉属、嗜热子囊菌属或嗜热真菌属,特别地米曲霉、木霉属、嗜热子囊菌属或嗜热真菌属的S53蛋白酶,选自下组,该组由以下组成:SEQ ID NO:20、22、24和26。
这些组合物可包含蛋白酶作为主要酶组分。可替代地,这些组合物可以包含多种酶活性,如末端蛋白酶/外切蛋白酶以及一种或多种(例如,若干种)选自下组的酶,该组由以下组成:水解酶、异构酶、连接酶、裂解酶、氧化还原酶、或转移酶,例如,α-半乳糖苷酶、α-葡糖苷酶、氨肽酶、α-淀粉酶、β-淀粉酶、支链淀粉酶、β-半乳糖苷酶、β-葡糖苷酶、β-木糖苷酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、壳多糖酶、角质酶、环糊精葡萄糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、葡糖淀粉酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变聚糖酶、氧化酶、果胶分解酶、过氧化物酶、植酸酶、多酚氧化酶、蛋白酶、核糖核酸酶、转谷氨酰胺酶、或木聚糖酶。在一个实施例中,该组合物还包含产碳水化合物源的酶以及任选地α-淀粉酶。在一个具体实施例中,该产碳水化合物源的酶选自下组,该组由以下组成:葡糖淀粉酶、α-葡糖苷酶、麦芽糖淀粉酶、支链淀粉酶和β-淀粉酶。
具体地,该产碳水化合物源的酶是葡糖淀粉酶,并且以0.001至10AGU/g DS的量存在,优选地从0.01至5AGU/g DS、特别地0.1至0.5AGU/g DS。
在一个实施例中,组合物中包含的葡糖淀粉酶是真菌来源的,优选源自曲霉属的菌株,优选黑曲霉、米曲霉或泡盛曲霉,木霉属的菌株,特别是里氏木霉、篮状菌属的菌株,尤其是埃默森篮状菌;或阿太菌属(Athelia)菌株,特别是罗耳阿太菌(Athelia rolfsii);栓菌属的菌株,优选瓣环栓菌;粘褶菌属的菌株,如篱边粘褶菌或密粘褶菌的菌株;密孔菌属的菌株,如血红密孔菌的菌株;或黑层孔属的菌株,或其混合物。
在一个实施例中,该葡糖淀粉酶是源自栓菌属,如瓣环栓菌的菌株,如示于SEQ IDNO:10中的菌株。
在一个实施例中,葡糖淀粉酶选自下组,该组由以下组成:
(i)包含SEQ ID NO:10的多肽的葡糖淀粉酶;
(ii)包含以下氨基酸序列的葡糖淀粉酶,该氨基酸序列与SEQ ID NO:10的多肽具有至少60%、至少70%,例如至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的一致性。
在一个实施例中,葡糖淀粉酶是源自篮状菌属,如埃默森篮状菌的菌株,如示于SEQ ID NO:11中的菌株。
在一个实施例中,葡糖淀粉酶选自下组,该组由以下组成:
(i)包含SEQ ID NO:11的多肽的葡糖淀粉酶;
(ii)包含以下氨基酸序列的葡糖淀粉酶,该氨基酸序列与SEQ ID NO:11的多肽具有至少60%、至少70%,例如至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的一致性。
在一个实施例中,葡糖淀粉酶是源自密孔菌属的菌株,特别是描述于WO 2011/066576中的血红密孔菌的菌株(SEQ ID NO 2、4或6),如示为WO 2011/066576中的SEQ IDNO:4的菌株。
在一个实施例中,葡糖淀粉酶选自下组,该组由以下组成:
(i)包含SEQ ID NO:12的多肽的葡糖淀粉酶;
(ii)包含以下氨基酸序列的葡糖淀粉酶,该氨基酸序列与SEQ ID NO:12的多肽具有至少60%、至少70%,例如至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的一致性。
在一个实施例中,葡糖淀粉酶是源自粘褶菌属的菌株,如篱边粘褶菌或密粘褶菌的菌株,特别是如在WO 2011/068803中描述的粘褶菌属的菌株(SEQ ID NO:2、4、6、8、10、12、14或16)。在一个优选的实施例中,葡糖淀粉酶是示出于WO 2011/068803中的SEQ IDNO:2中的篱边粘褶菌。
在一个实施例中,葡糖淀粉酶是源自篱边粘褶菌,如示于SEQ ID NO:13中的菌株。
在一个实施例中,葡糖淀粉酶选自下组,该组由以下组成:
(i)包含SEQ ID NO:13的多肽的葡糖淀粉酶;
(ii)包含以下氨基酸序列的葡糖淀粉酶,该氨基酸序列与SEQ ID NO:13的多肽具有至少60%、至少70%,例如至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的一致性。
在另一个实施例中,葡糖淀粉酶源自密粘褶菌,如示于SEQ ID NO:14中的密粘褶菌。
在一个实施例中,葡糖淀粉酶选自下组,该组由以下组成:
(i)包含SEQ ID NO:14的多肽的葡糖淀粉酶;
(ii)包含以下氨基酸序列的葡糖淀粉酶,该氨基酸序列与SEQ ID NO:14的多肽具有至少60%、至少70%,例如至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的一致性。
在一个实施例中,葡糖淀粉酶源自黑层孔属(Nigrofomes)的菌株,具体是披露于WO 2012/064351中的黑层孔属物种的菌株。
在一个实施例中,葡糖淀粉酶能以如下量添加到糖化和/或发酵中:0.0001-20AGU/g DS,优选0.001-10AGU/g DS,尤其是0.01-5AGU/g DS之间,如0.1-2AGU/g DS。
包含葡糖淀粉酶的可商购组合物包括AMG 200L;AMG 300L;SANTMSUPER、SANTMEXTRA L、SPIRIZYMETM PLUS、SPIRIZYMETM FUEL、SPIRIZYMETM B4U、SPIRIZYMETM ULTRA、SPIRIZYMETM EXCEL和AMGTM E(来自诺维信公司(Novozymes A/S));OPTIDEXTM 300、GC480、GC417(来自杜邦公司(DuPont.));AMIGASETM和AMIGASETM PLUS(来自帝斯曼公司(DSM));G-ZYMETM G900、G-ZYMETM和G990ZR(来自杜邦公司)。
除了葡糖淀粉酶之外,该组合物可以进一步包含α-淀粉酶。具体地,该α-淀粉酶是酸性真菌α-淀粉酶。真菌酸性稳定的α-淀粉酶是在3.0至7.0的pH范围内,并且优选地在3.5至6.5的pH范围内具有活性的α-淀粉酶,包括在约4.0、4.5、5.0、5.5、和6.0的pH时的活性。
优选地,酸性真菌α-淀粉酶源自曲霉属,具体是土曲霉、黑曲霉、米曲霉、泡盛曲霉、或白曲霉的菌株;或者源自根毛霉属,优选地微小根毛霉的菌株;或亚灰树花菌属,优选地大型亚灰树花菌的菌株。
在一个优选的实施例中,该α-淀粉酶源自根毛霉属的菌株,优选的是菌株微小根毛霉,例如示于WO 2013/006756中的SEQ ID NO:3中的一种,例如具有黑曲霉连接子和淀粉结合域的微小根毛霉α-淀粉酶杂合体,例如示于在此的SEQ ID NO:9中的一种,或其变体。
在一个实施例中,该α-淀粉酶选自下组,该组由以下组成:
(i)包含SEQ ID NO:9的多肽的α-淀粉酶;
(ii)包含以下氨基酸序列的α-淀粉酶,该氨基酸序列与SEQ ID NO:9的多肽具有至少60%、至少70%,例如至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的一致性。
在一个优选的实施例中,该α-淀粉酶是示于SEQ ID NO:9中的具有以下取代或取代的组合中的至少一个的α-淀粉酶的变体:D165M;Y141W;Y141R;K136F;K192R;P224A;P224R;S123H+Y141W;G20S+Y141W;A76G+Y141W;G128D+Y141W;G128D+D143N;P219C+Y141W;N142D+D143N;Y141W+K192R;Y141W+D143N;Y141W+N383R;Y141W+P219C+A265C;Y141W+N142D+D143N;Y141W+K192R V410A;G128D+Y141W+D143N;Y141W+D143N+P219C;Y141W+D143N+K192R;G128D+D143N+K192R;Y141W+D143N+K192R+P219C;G128D+Y141W+D143N+K192R;或G128D+Y141W+D143N+K192R+P219C(使用SEQ ID NO:9进行编号)。
在一个实施例中,该α-淀粉酶来源于具有黑曲霉葡糖淀粉酶连接子和淀粉结合域(SBD)的微小根毛霉,优选披露为SEQ ID NO:9,优选具有以下取代中的一个或多个:G128D、D143N,优选G128D+D143N(使用SEQ ID NO:9进行编号),并且其中该α-淀粉酶变体与SEQ IDNO:9的多肽具有至少75%一致性,优选至少80%,更优选至少85%,更优选至少90%,更优选至少91%,更优选至少92%,甚至更优选至少93%,最优选至少94%,并且甚至最优选至少95%,例如甚至至少96%、至少97%、至少98%、至少99%,但小于100%一致性。
在一个优选的实施例中,在糖化和/或发酵过程中存在的和/或添加的葡糖淀粉酶与α-淀粉酶之间的比率优选可以在500:1至1:1,例如从250:1至1:1、例如从100:1至1:1、例如从100:2至100:50、例如从100:3至100:70的范围内。
组合物可以根据本领域已知的方法制备,并且可以是液体或干燥组合物的形式。例如,组合物可以处于颗粒或微颗粒的形式。可以根据本领域已知的方法将变体稳定化。
组合物可以根据本领域已知的方法制备,并且可以是液体或干燥组合物的形式。可以根据本领域已知的方法稳定组合物。
本发明的酶组合物可为任何适于使用的形式,例如像,去除或未去除细胞的粗发酵液,含有或不含细胞碎片的细胞裂解物,半纯化或纯化的酶组合物,或宿主细胞,作为酶的来源。
该酶组合物可为干粉或颗粒,无粉尘的颗粒,液体,稳定化液体或稳定化受保护的酶。可以根据已建立的方法例如通过添加稳定剂(如糖、糖醇或其他多元醇)、和/或乳酸或另一种有机酸,对液体酶组合物进行稳定化。
根据本发明的组合物的用途
考虑将根据本发明的组合物用于淀粉的糖化。因此,在一个方面,本发明涉及根据本发明的组合物在含淀粉材料的糖化中的用途。
在一个实施例中,该用途还包括发酵糖化的含淀粉材料以产生发酵产物。淀粉材料可以是凝胶化的或未糊化的淀粉。特别地,发酵产物是醇,更特别是乙醇。
在一个具体实施例中,糖化和发酵同时进行。
具有丝氨酸蛋白酶活性的多肽
本发明涉及具有丝氨酸外切蛋白酶(肽酶)活性的多肽,并且该多肽还属于S10羧肽酶家族。在一个实施例中,本发明涉及具有丝氨酸蛋白酶活性并且属于S10家族的多肽,该多肽选自由以下组成的组:
(a)多肽,该多肽与SEQ ID NO:6的成熟多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性;
(b)由多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:8的成熟多肽编码序列具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性;
(c)(a)、或(b)的多肽的片段,该片段具有丝氨酸蛋白酶活性。
在一个方面,这些多肽与SEQ ID NO:6的成熟多肽相差多达10个(例如1个、2个、3个、4个、5个、6个、7个、8个、9个、或10个)氨基酸。
在具体的实施例中,本发明涉及与SEQ ID NO:6的成熟多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列一致性的多肽,并且其中该成熟多肽具有SEQ ID NO:6的多肽的至少70%的丝氨酸蛋白酶活性。
在具体的实施例中,本发明涉及与SEQ ID NO:6的成熟多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:6的成熟多肽的至少75%的丝氨酸蛋白酶活性。
在具体的实施例中,本发明涉及与SEQ ID NO:6的成熟多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:6的成熟多肽的至少80%的丝氨酸蛋白酶活性。
在具体的实施例中,本发明涉及与SEQ ID NO:6的成熟多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:6的成熟多肽的至少85%的丝氨酸蛋白酶活性。
在具体的实施例中,本发明涉及与SEQ ID NO:6的成熟多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:6的成熟多肽的至少90%的丝氨酸蛋白酶活性。
在具体的实施例中,本发明涉及与SEQ ID NO:6的成熟多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:6的成熟多肽的至少95%的丝氨酸蛋白酶活性。
在具体的实施例中,本发明涉及与SEQ ID NO:6的成熟多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:6的成熟多肽的至少100%的丝氨酸蛋白酶活性。
在一个实施例中,该多肽已经被分离。本发明的多肽优选地包含SEQ ID NO:6的氨基酸序列或其等位基因变体或由其组成;或是其具有丝氨酸蛋白酶活性的片段。在另一个方面中,该多肽包括SEQ ID NO:6的成熟多肽或由其组成。在另一个方面中,该多肽包含在本文中披露为SEQ ID NO:7的SEQ ID NO:6的氨基酸51至473,或由其组成。
在另一个实施例中,本发明涉及具有丝氨酸蛋白酶活性的多肽,该多肽由与SEQID NO:8的成熟多肽编码序列或其cDNA序列具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多核苷酸所编码。在一个另外的实施例中,该多肽已经被分离。在另一个实施例中,本发明涉及具有丝氨酸外切蛋白酶(肽酶)活性的多肽,并且该多肽还属于S53家族。
具体地,本发明涉及具有丝氨酸蛋白酶活性并且属于S53家族的多肽,该多肽选自由以下组成的组:
(a)多肽,该多肽与SEQ ID NO:23的成熟多肽具有至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性;或
(b)由多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:29的成熟多肽编码序列具有至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性。
在一个实施例中,该成熟多肽是SEQ ID NO:23的氨基酸208至614,特别地是SEQID NO:23的氨基酸209至614,更特别地是SEQ ID NO:23的氨基酸210至614,更特别地是SEQID NO:23的氨基酸211至614,更特别地是SEQ ID NO:23的氨基酸212至614。
具体地,本发明涉及具有丝氨酸蛋白酶活性并且属于S53家族的多肽,该多肽选自由以下组成的组:
(a)多肽,该多肽与SEQ ID NO:25的成熟多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性;或
(b)由多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:30的成熟多肽编码序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性。
在一个实施例中,该成熟多肽是SEQ ID NO:25的氨基酸199至594,特别地是SEQID NO:25的氨基酸200至594,更特别地是SEQ ID NO:25的氨基酸201至594,更特别地是SEQID NO:25的氨基酸202至594,更特别地是SEQ ID NO:25的氨基酸203至594。
在一个具体实施例中,本发明涉及具有丝氨酸外切蛋白酶(肽酶)活性的多肽,并且该多肽还属于S53家族,其中该多肽包含SEQ ID NO:23的多肽或由其组成;或SEQ ID NO:23的氨基酸208至614,特别地是SEQ ID NO:23的氨基酸209至614,更特别地是SEQ ID NO:23的氨基酸210至614,更特别地是SEQ ID NO:23的氨基酸211至614,更特别地是SEQ IDNO:23的氨基酸212至614。
在一个具体实施例中,本发明涉及具有丝氨酸外切蛋白酶(肽酶)活性的多肽,并且该多肽还属于S53家族,其中该多肽包含SEQ ID NO:25的多肽或由其组成;或SEQ ID NO:25的氨基酸199至594,特别地是SEQ ID NO:25的氨基酸200至594,更特别地是SEQ ID NO:25的氨基酸201至594,更特别地是SEQ ID NO:25的氨基酸202至594,更特别地是SEQ IDNO:25的氨基酸203至594。
在另一个实施例中,本发明涉及在一个或多个(例如,若干个)位置处包括取代、缺失和/或插入的SEQ ID NO:6的成熟多肽的变体。在一个实施例中,引入SEQ ID NO:6的成熟多肽中的氨基酸取代、缺失和/或插入的数目多达10个,例如1、2、3、4、5、6、7、8、9或10个。这些氨基酸变化可为性质上较不重要的,即,不会显著地影响蛋白的折叠和/或活性的保守氨基酸取代或插入;典型为1-30个氨基酸的小缺失;小的氨基-末端或羧基末端延伸,例如氨基末端的甲硫氨酸残基;多至20-25个残基的小接头肽;或小的延伸,其通过改变净电荷或另一功能(例如聚组氨酸段、抗原表位或结合结构域)来促进纯化。
保守取代的实例是在下组之内:碱性氨基酸(精氨酸、赖氨酸及组氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、极性氨基酸(谷氨酰胺和天冬酰胺)、疏水性氨基酸(亮氨酸、异亮氨酸及缬氨酸)、芳香族氨基酸(苯丙氨酸、色氨酸及酪氨酸)及小氨基酸(甘氨酸、丙氨酸、丝氨酸、苏氨酸及甲硫氨酸)。一般不会改变比活性的氨基酸取代在本领域是已知的并且例如由H.Neurath和R.L.Hill,1979,在:The Proteins[蛋白],学术出版社(AcademicPress),纽约中描述。常发生的取代为Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly。
可以根据本领域中已知的程序,如定点诱变或丙氨酸扫描诱变(Cunningham和Wells,1989,Science[科学]244:1081-1085)来鉴定多肽中的必需氨基酸。在后一项技术中,在该分子中的每个残基处引入单个丙氨酸突变,并且测试所得分子的[酶]活性以鉴定对于该分子的活性关键的氨基酸残基。还参见,Hilton等人,1996,J.Biol.Chem.[生物化学杂志]271:4699-4708。酶或其他生物学相互作用的活性位点还可以通过对结构的物理分析来确定,如通过这样的技术确定:如核磁共振、晶体学、电子衍射或光亲和标记,连同对推定的接触位点氨基酸进行突变。参见,例如,de Vos等人,1992,Science[科学]255:306-312;Smith等人,1992,J.Mol.Biol.[分子生物学杂志]224:899-904;Wlodaver等人,1992,FEBSLett.[欧洲生化学会联合会快报]309:59-64。还可以从与相关多肽的比对来推断必需氨基酸的身份。
使用已知的诱变、重组和/或改组方法、随后进行一个相关的筛选程序可以做出单一或多种氨基酸取代、缺失和/或插入并对其进行测试,这些相关的筛选程序例如由Reidhaar-Olson和Sauer,1988,Science[科学]241:53-57;Bowie和Sauer,1989,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]86:2152-2156;WO 95/17413;或WO 95/22625。其他可以使用的方法包括易错PCR、噬菌体展示(例如Lowman等人,1991,Biochemistry[生物化学]30:10832-10837;美国专利号5,223,409;WO 92/06204),以及区域定向诱变(Derbyshire等人,1986,Gene[基因]46:145;Ner等人,1988,DNA 7:127)。
诱变/改组方法可以与高通量自动化筛选方法组合以检测由宿主细胞表达的克隆的诱变多肽的活性(Ness等人,1999,Nature Biotechnology[自然生物技术]17:893-896)。可从宿主细胞回收编码活性多肽的诱变的DNA分子,并使用本领域的标准方法快速测序。这些方法允许迅速确定多肽中个体氨基酸残基的重要性。
该多肽可为杂合多肽,其中一个多肽的区域在另一个多肽的区域的N-末端或C-末端处融合。
该多肽可为融合多肽或可切割的融合多肽,其中另一个多肽在本发明多肽的N-末端或C-末端处融合。通过将编码另一个多肽的多核苷酸与本发明多核苷酸融合而产生融合多肽。用于产生融合多肽的技术是本领域已知的,且包括连接编码多肽的编码序列使得它们符合读框,而且融合多肽的表达处于相同的启动子和终止子的控制之下。还可使用内含肽技术构建融合多肽,其中在翻译后产生融合多肽(Cooper等人,1993,EMBO J.[欧洲分子生物学学会杂志]12:2575-2583;Dawson等人,1994,Science[科学]266:776-779)。
融合多肽可进一步包含两个多肽之间的切割位点。在融合蛋白分泌之时,该位点被切割而释放这两个多肽。切割位点的实例包括但不限于在以下文献中披露的位点:Martin等人,2003,J.Ind.Microbiol.Biotechnol.[工业微生物生物技术杂志]3:568-576;Svetina等人,2000,J.Biotechnol.[生物技术杂志]76:245-251;Rasmussen-Wilson等人,1997,Appl.Environ.Microbiol.[应用与环境微生物学]63:3488-3493;Ward等人,1995,Biotechnology[生物技术]13:498-503;和Contreras等人,1991,Biotechnology[生物技术]9:378-381;Eaton等人,1986,Biochemistry[生物化学]25:505-512;Collins-Racie等人,1995,Biotechnology[生物技术]13:982-987;Carter等人,1989,Proteins:Structure、Function、and Genetics[蛋白质:结构、功能与遗传学]6:240-248;以及Stevens,2003,Drug Discovery World[药物发现世界]4:35-48。
具有丝氨酸蛋白酶活性的多肽的来源
可以从任何属的微生物获得本发明的具有丝氨酸蛋白酶活性的多肽。出于本发明的目的,如在此结合给定来源使用的术语“从……获得”应当意指由多核苷酸编码的多肽是由该来源或由已经插入了来自该来源的多核苷酸的菌株产生的。在一方面,获得自给定来源的多肽被分泌到细胞外。
在另一个方面,所述多肽来自青霉属、嗜热子囊菌属或嗜热真菌属,例如,从简青霉、嗜热嗜热子囊菌或疏棉状嗜热丝孢菌获得的多肽。
这些物种的菌株可容易地在许多培养物保藏中心为公众所获得,如美国典型培养物保藏中心(American Type Culture Collection,ATCC)、德国微生物和细胞培养物保藏中心(Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH,DSMZ)、荷兰菌种保藏中心(Centraalbureau Voor Schimmelcultures,CBS)以及美国农业研究服务专利培养物保藏中心北方地区研究中心(Agricultural Research Service Patent CultureCollection,Northern Regional Research Center,NRRL)。
可以使用以上提到的探针从其他来源,包括从自然界(例如,土壤、堆肥、水等)分离的微生物或直接从天然材料(例如,土壤、堆肥、水等)获得的DNA样品鉴定和获得该多肽。用于从天然生境中直接分离微生物和DNA的技术是本领域已知的。然后可通过类似地筛选另一微生物的基因组DNA或cDNA文库或混合的DNA样品来获得编码该多肽的多核苷酸。一旦已经用一种或多种探针检测到编码多肽的多核苷酸,则可通过利用本领域普通技术人员所知的技术(参见,例如Sambrook等人,1989,见上文)分离或克隆多核苷酸。
多核苷酸
本发明还涉及编码S10家族或S53家族的丝氨酸外切蛋白酶多肽的多核苷酸。在一个实施例中,编码多肽的多核苷酸已经被分离。
在一个实施例中,编码SEQ ID NO:6、SEQ ID NO:19、SEQ ID NO:21、SEQ ID NO:23和SEQ ID NO:25的外切蛋白酶的多核苷酸在本文中分别披露为SEQ ID NO:8、SEQ ID NO:27、SEQ ID NO:28、SEQ ID NO:29和SEQ ID NO:30。
用于分离或克隆多核苷酸的技术是本领域中已知的且包括从基因组DNA或cDNA或其组合进行分离。可以例如通过使用熟知的聚合酶链反应(PCR)或表达文库的抗体筛选来检测具有共有结构特征的克隆DNA片段,实现从基因组DNA克隆多核苷酸。参见例如,Innis等人,1990,PCR:A Guide to Methods and Application[PCR:方法和应用指南],学术出版社(Academic Press),纽约。可以使用其他核酸扩增程序如连接酶链式反应(LCR)、连接激活转录(LAT)和基于多核苷酸的扩增(NASBA)。这些多核苷酸可以克隆自[属]的菌株或相关生物,并且因此,例如可以是该多核苷酸多肽编码区的等位基因变体或物种变体。
编码本发明多肽的多核苷酸的修饰对于合成基本上类似于该多肽的多肽可以是必需的。术语“基本上类似”于该多肽是指多肽的非天然存在的形式。
核酸构建体
本发明还涉及核酸构建体,这些核酸构建体包含可操作地连接至一个或多个控制序列的本发明的多核苷酸,在与控制序列相容的条件下,这个或这些控制序列指导编码序列在适合的宿主细胞中的表达。
可用许多方式操作所述多核苷酸以提供多肽的表达。取决于表达载体,在多核苷酸插入载体之前对其进行操作可为合意的或必需的。用于利用重组DNA方法修饰多核苷酸的技术是本领域已知的。
该控制序列可为启动子,即,被宿主细胞识别用于表达编码本发明多肽的多核苷酸的多核苷酸。该启动子包含转录控制序列,其介导该多肽的表达。该启动子可以是在宿主细胞中显示出转录活性的任何多核苷酸,包括变体、截短型及杂合型启动子,并且可以从编码与该宿主细胞同源或异源的细胞外或细胞内多肽的基因获得。
用于在细菌宿主细胞中指导本发明的核酸构建体的转录的适合的启动子的实例是从以下获得的启动子:解淀粉芽孢杆菌α-淀粉酶基因(amyQ)、地衣芽孢杆菌α-淀粉酶基因(amyL)、地衣芽孢杆菌青霉素酶基因(penP)、嗜热芽孢杆菌麦芽糖淀粉酶基因(amyM)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、枯草芽孢杆菌xylA和xylB基因、苏云金芽孢杆菌cryIIIA基因(Agaisse和Lereclus,1994,Molecular Microbiology[分子微生物学]13:97-107)、大肠杆菌乳糖操纵子、大肠杆菌trc启动子(Egon等人,1988,Gene[基因]69:301-315)、天蓝链霉菌琼脂水解酶基因(dagA)、和原核β-内酰胺酶基因(Villa-Kamaroff等人,1978,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]75:3727-3731);以及tac启动子(DeBoer等人,1983,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]80:21-25)。其他启动子描述于Gilbert等人,1980,Scientific American[科学美国人]242:74-94的“Usefulproteins from recombinant bacteria[来自重组细菌的有用蛋白质]”中;和在Sambrook等人,1989,见上文。串联启动子的实例披露于WO 99/43835中。
在丝状真菌宿主细胞中,用于指导本发明的核酸构建体的转录的合适启动子的实例是获得自以下酶的基因的启动子:构巢曲霉(Aspergillus nidulans)乙酰胺酶、黑曲霉(Aspergillus niger)中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉(Aspergillus awamori)葡萄糖淀粉酶(glaA)、米曲霉(Aspergillus oryzae)TAKA淀粉酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、尖孢镰孢菌(Fusarium oxysporum)胰蛋白酶-样蛋白酶(WO 96/00787)、镶片镰孢(Fusarium venenatum)淀粉葡糖苷酶(WO 00/56900)、镶片镰孢Daria(WO 00/56900)、镶片镰孢菌Quinn(WO 00/56900)、米黑根毛霉(Rhizomucormiehei)脂肪酶、米黑根毛霉天冬氨酸蛋白酶、里氏木霉(Trichoderma reesei)β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶,以及里氏木霉翻译延长因子,以及NA2-tpi启动子(来自曲霉属中性α-淀粉酶基因的经修饰的启动子,其中未翻译的前导序列已经用来自曲霉属丙糖磷酸异构酶基因的未翻译的前导序列替换;非限制性实例包括来自黑曲霉中性α-淀粉酶的基因的经修饰的启动子,其中未翻译的前导序列已经用来自构巢曲霉或米曲霉丙糖磷酸异构酶基因的未翻译的前导序列替换);及其变体、截短的及杂合的启动子。其他启动子在美国专利号6,011,147中描述。
在酵母宿主中,从以下酶的基因获得有用的启动子:酿酒酵母(Saccharomycescerevisiae)烯醇化酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母乙醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH1,ADH2/GAP)、酿酒酵母磷酸丙糖异构酶(TPI)、酿酒酵母金属硫蛋白(CUP1)、和酿酒酵母3-磷酸甘油酸激酶。Romanos等人,1992,Yeast[酵母]8:423-488描述了酵母宿主细胞的其他有用的启动子。
控制序列也可为由宿主细胞识别以终止转录的转录终止子。该终止子可操作地连接到编码该多肽的多核苷酸的3’-末端。在宿主细胞中有功能的任何终止子可用于本发明中。
细菌宿主细胞的优选终止子从以下酶的基因获得:克劳氏芽孢杆菌(Bacillusclausii)碱性蛋白酶(aprH)、地衣芽孢杆菌α-淀粉酶(amyL)、和大肠杆菌核糖体RNA(rrnB)。
用于丝状真菌宿主细胞的优选终止子从以下酶的基因获得:构巢曲霉乙酰胺酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶、尖孢镰孢菌胰蛋白酶-样蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶以及里氏木霉翻译延长因子。
用于酵母宿主细胞的优选终止子从以下酶的基因获得:酿酒酵母烯醇化酶、酿酒酵母细胞色素C(CYC1)、以及酿酒酵母甘油醛-3-磷酸脱氢酶。酵母宿主细胞的其他有用终止子在Romanos等人,1992,见上文描述。
控制序列还可为启动子下游和基因的编码序列上游的mRNA稳定子区域,其增加该基因的表达。
合适的mRNA稳定子区域的实例是从以下获得的:苏云金芽孢杆菌cryIIIA基因(WO94/25612)和枯草芽孢杆菌SP82基因(Hue等人,1995,Journal of Bacteriology[细菌学杂志]177:3465-3471)。
该控制序列也可以是前导序列,一种对宿主细胞翻译很重要的非翻译mRNA区域。该前导子可操作地连接到编码该多肽的多核苷酸的5’-末端。可以使用在宿主细胞中有功能的任何前导序列。
用于丝状真菌宿主细胞的优选前导序列是从米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶的基因获得的。
对于酵母宿主细胞适合的前导序列从以下酶的基因获得:酿酒酵母烯醇化酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α因子、和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。
控制序列也可以是多聚腺苷化序列,一种与多核苷酸3’-末端可操作地连接并在转录时由宿主细胞识别为向转录的mRNA添加聚腺苷酸残基的信号序列。可以使用在宿主细胞中起作用的任何聚腺苷酸化序列。
用于丝状真菌宿主细胞的优选聚腺苷酸化序列是从以下的基因获得:构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶以及尖孢镰孢菌胰蛋白酶样蛋白酶。
对于酵母宿主细胞有用的多聚腺苷酸化序列由Guo和Sherman,1995,Mol.Cellular Biol.[分子细胞生物学]15:5983-5990描述。
控制序列也可为编码与多肽的N-末端连接的信号肽并指导多肽进入细胞的分泌途径的信号肽编码区。多核苷酸的编码序列的5’-端可固有地含有在翻译阅读框中与编码多肽的编码序列的区段天然地连接的信号肽编码序列。可替代地,编码序列的5’-端可含有对于编码序列为外来的信号肽编码序列。在编码序列天然地不含有信号肽编码序列的情况下,可能需要外源信号肽编码序列。可替代地,外源信号肽编码序列可以单纯地替代天然信号肽编码序列以便增强多肽的分泌。然而,可以使用指导已表达多肽进入宿主细胞的分泌途径的任何信号肽编码序列。
用于细菌宿主细胞的有效信号肽编码序列是从芽孢杆菌NCIB 11837生麦芽糖淀粉酶、地衣芽孢杆菌枯草杆菌蛋白酶、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌α-淀粉酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT、nprS、nprM)和枯草杆菌prsA的基因获得的信号肽编码序列。另外的信号肽由Simonen和Palva,1993,Microbiological Reviews[微生物评论]57:109-137描述。
用于丝状真菌宿主细胞的有效的信号肽编码序列是从以下酶的基因获得的信号肽编码序列:黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶V、疏棉状腐质霉脂肪酶和米黑根毛霉天冬氨酸蛋白酶。
用于酵母宿主细胞的有用的信号肽从酿酒酵母α-因子和酿酒酵母转化酶的基因获得。Romanos等人(1992,见上文)描述了其他有用的信号肽编码序列。
控制序列也可为编码处于多肽的N-末端的前肽的前肽编码序列。所得的多肽被称为前体酶(proenzyme)或多肽原(或在一些情况下被称为酶原(zymogen))。多肽原通常是无活性的并且可通过催化切割或自身催化切割来自多肽原的前肽而转化为活性多肽。可以从枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、嗜热毁丝霉漆酶(Myceliophthora thermophila laccase)(WO 95/33836)、米黑根毛霉天冬氨酸蛋白酶(Rhizomucor miehei aspartic proteinase)和酿酒酵母(Saccharomyces cerevisiae)α-因子的基因获得前肽编码序列。
在信号肽序列和前肽序列二者都存在的情况下,该前肽序列位于紧邻多肽的N-末端且该信号肽序列位于紧邻该前肽序列的N-末端。
也可为合意的是添加调节序列,所述调节序列调节宿主细胞生长相关的多肽的表达。调节序列的实例是引起基因的表达响应于化学或物理刺激(包括调节化合物的存在)而开启或关闭的那些。原核系统中的调节序列包括lac、tac以及trp操纵基因系统。在酵母中,可以使用ADH2系统或GAL1系统。在丝状真菌中,可使用黑曲霉葡糖淀粉酶启动子、米曲霉TAKA α-淀粉酶启动子和米曲霉葡糖淀粉酶启动子、里氏木霉纤维二糖水解酶I启动子以及里氏木霉纤维二糖水解酶II启动子。调节序列的其他实例是允许基因扩增的那些。在真核系统中,这些调节序列包括在甲氨蝶呤存在下扩增的二氢叶酸还原酶基因以及用重金属扩增的金属硫蛋白基因。在这些情况中,编码多肽的多核苷酸将与调控序列可操作地连接。
表达载体
本发明还涉及包含本发明的多核苷酸、启动子、以及转录和翻译终止信号的重组表达载体。不同的核苷酸和控制序列可以连接在一起以产生重组表达载体,该重组表达载体可以包括一个或多个便利的限制酶切位点以允许在这些位点处插入或取代编码该多肽的多核苷酸。可替代地,多核苷酸可通过将该多核苷酸或包含该多核苷酸的核酸构建体插入用于表达的适当载体中来表达。在产生该表达载体时,该编码序列位于该载体中使得该编码序列与该用于表达的适当控制序列可操作地连接。
重组表达载体可以是可方便地经受重组DNA程序并且可引起多核苷酸表达的任何载体(例如,质粒或病毒)。载体的选择将典型地取决于载体与待引入载体的宿主细胞的相容性。载体可以是线状或闭合的环状质粒。
载体可以是自主复制载体,即作为染色体外实体存在的载体,其复制独立于染色体复制,例如质粒、染色体外元件、微染色体或人工染色体。载体可以包含用于确保自我复制的任何装置。可替代地,载体可以是这样的载体,当它引入宿主细胞中时整合入基因组中并与其中已整合了它的染色体一起复制。此外,可以使用单独的载体或质粒或两个或更多个载体或质粒,其共同含有待引入宿主细胞基因组的总DNA,或可以使用转座子。
载体优选包含允许方便地选择转化细胞、转染细胞、转导细胞等细胞的一个或多个选择性标记。选择性标记是这样一种基因,该基因的产物提供了杀生物剂抗性或病毒抗性、重金属抗性、营养缺陷型的原养型等。
细菌性选择性标记的实例是地衣芽孢杆菌或枯草芽孢杆菌dal基因,或赋予抗生素抗性(例如氨苄青霉素、氯霉素、卡那霉素、新霉素、大观霉素或四环素抗性)的标记。用于酵母宿主细胞的适合的标志物包括但不限于:ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于丝状真菌宿主细胞中的选择性标记包括但不限于:adeA(磷酸核糖酰氨基咪唑-琥珀酸甲酰胺合酶)、adeB(磷酸核糖酰-氨基咪唑合酶)、amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草丁膦乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清酸核苷-5'-磷酸脱羧酶)、sC(硫酸腺苷酰基转移酶)、以及trpC(邻氨基苯甲酸合酶)、以及其等效物。优选地用于曲霉细胞中的是构巢曲霉或米曲霉amdS和pyrG基因以及吸水链霉菌bar基因。在木霉属细胞中优选使用的是adeA、adeB、amdS、hph以及pyrG基因。
选择性标志物可以是如在WO 2010/039889中描述的双选择性标志物系统。在一方面,双选择性标志物是hph-tk双选择性标志物系统。
载体优选含有允许载体整合到宿主细胞的基因组中或载体在细胞中独立于基因组自主复制的一个或多个元件。
对于整合到该宿主细胞基因组中,该载体可以依靠编码该多肽的多核苷酸序列或用于通过同源或非同源重组整合到该基因组中的该载体的任何其他元件。可替代地,该载体可含有用于指导通过同源重组而整合入宿主细胞基因组中的一个或多个染色体中的一个或多个精确位置处的另外的多核苷酸。为了增加在精确位置整合的可能性,整合的元件应含有足够数量的核酸,如100至10,000个碱基对、400至10,000个碱基对、以及800至10,000个碱基对,其与相应的靶序列具有高度的序列一致性以增强同源重组的可能性。整合元件可以是与宿主细胞基因组内的靶序列同源的任何序列。此外,整合元件可以是非编码多核苷酸或编码多核苷酸。另一方面,载体可以通过非同源重组整合入宿主细胞的基因组中。
对于自主复制,载体可以进一步包含使载体能够在所讨论的宿主细胞中自主地进行复制的复制起点。复制起点可为在细胞中有功能的介导自主复制的任何质粒复制子。术语“复制起点”或“质粒复制子”意指使质粒或载体能够在体内复制的多核苷酸。
细菌复制起点的实例是容许在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177和pACYC184的复制起点,以及容许在芽孢杆菌属中复制的质粒pUB110、pE194、pTA1060和pAMβ1。
用于酵母宿主细胞中的复制起点的实例是2微米复制起点、ARS1、ARS4、ARS1与CEN3的组合、及ARS4与CEN6的组合。
用于丝状真菌细胞中的复制起点的实例是AMA1和ANS1(Gems等人,1991,Gene[基因]98:61-67;Cullen等人,1987,Nucleic Acids Res[核酸研究]15:9163-9175;WO 00/24883)。可根据WO 00/24883中公开的方法完成AMA1基因的分离和包含该基因的质粒或载体的构建。
可将本发明多核苷酸的多于一个拷贝插入宿主细胞以增加多肽的产生。通过将序列的至少一个另外的拷贝整合到宿主细胞基因组中或者通过包括与该多核苷酸一起的可扩增的选择性标志基因可以获得多核苷酸的增加的拷贝数目,其中通过在适当的选择性试剂的存在下培养细胞可以选择含有选择性标志基因的经扩增的拷贝的细胞、以及由此该多核苷酸的另外的拷贝。
用于连接以上所描述的元件以构建本发明的重组表达载体的方法是本领域的技术人员熟知的(参见,例如,Sambrook等人,1989,见上文)。
宿主细胞
本发明还涉及重组宿主细胞,这些宿主细胞包含可操作地连接到一个或多个控制序列的本发明的多核苷酸,这个或这些控制序列指导本发明的多肽的产生。将包含多核苷酸的构建体或载体引入宿主细胞中,这样使得该构建体或载体作为染色体整合体或作为自主复制的染色体外载体维持,如较早前所述。术语“宿主细胞”涵盖由于复制过程中发生的突变而与亲本细胞不同的亲本细胞的任何后代。宿主细胞的选择会在很大程度上取决于编码该多肽的基因及其来源。
宿主细胞可为在本发明的多肽的重组产生中有用的任何细胞,例如原核细胞或真核细胞。
宿主细胞可以是真核生物,如真菌细胞。
宿主细胞可以是真菌细胞。如在此使用的“真菌”包括子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)、和接合菌门(Zygomycota)以及卵菌门(Oomycota)和所有有丝分裂孢子真菌(如由Hawksworth等人所定义的,在:Ainsworthand Bisby’s Dictionary of The Fungi[Ainsworth和Bisby的真菌大词典],第8版,1995,国际CAB,University Press[大学出版社],剑桥,英国)。
真菌宿主细胞可以是酵母细胞。如本申请中使用的“酵母”包括产子酵母(内孢霉目)、产担子酵母和属于半知菌类(芽孢纲)的酵母。由于酵母的分类可能在将来变化,出于本发明的目的,酵母应当如酵母的生物学与活性(Skinner、Passmore和Davenport编辑,Soc.App.Bacteriol.Symposium Series No.9[应用细菌学学会专题论文集系列9],1980)所描述那样定义。
酵母宿主细胞可为假丝酵母属、汉逊酵母属、克鲁弗酵母属、毕赤酵母属、酵母属、裂殖酵母属、或耶氏酵母属细胞,如乳酸克鲁弗酵母(Kluyveromyces lactis)、卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母、卵形酵母或解脂耶氏酵母(Yarrowia lipolytica)细胞。
真菌宿主细胞可为丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门(Oomycota)的亚门的所有丝状形式(如由Hawksworth等人,1995,见上文)。丝状真菌通常的特征在于由几丁质、纤维素、葡聚糖、壳多糖、甘露聚糖、以及其他复杂多糖构成的菌丝体壁。营养生长是通过菌丝延长,而碳分解代谢是专性需氧的。相反,酵母(例如酿酒酵母)的营养生长是通过单细胞菌体的出芽(budding),而碳分解代谢可以是发酵性的。
丝状真菌宿主细胞可以是枝顶孢霉属、曲霉属、短梗霉属、烟管霉属(Bjerkandera)、拟腊菌属、金孢子菌属、鬼伞属、革盖菌属(Coriolus)、隐球菌属、线黑粉菌科(Filibasidium)、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新美鞭菌属、链孢菌属、拟青霉属、青霉属、平革菌属、射脉菌属(Phlebia)、梨囊鞭菌属、侧耳属(Pleurotus)、裂褶菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属(Trametes)或木霉属细胞。
例如,丝状真菌宿主细胞可以是泡盛曲霉、臭曲霉、烟曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、黑刺烟管菌(Bjerkandera adusta)、干拟蜡菌(Ceriporiopsisaneirina)、卡内基拟蜡菌(Ceriporiopsis caregiea)、浅黄拟蜡孔菌(Ceriporiopsisgilvescens)、潘诺希塔拟蜡菌(Ceriporiopsis pannocinta)、环带拟蜡菌(Ceriporiopsisrivulosa)、微红拟蜡菌(Ceriporiopsis subrufa)、虫拟蜡菌(Ceriporiopsissubvermispora)、狭边金孢子菌(Chrysosporium inops)、嗜角质金孢子菌、卢克诺文思金孢子菌(Chrysosporium lucknowense)、粪状金孢子菌(Chrysosporium merdarium)、租金孢子菌、女王杜香金孢子菌(Chrysosporium queenslandicum)、热带金孢子菌、褐薄金孢子菌(Chrysosporium zonatum)、灰盖鬼伞(Coprinus cinereus)、毛革盖菌(Coriolushirsutus)、杆孢状镰孢菌、谷类镰孢菌、库威镰孢菌、大刀镰孢菌、禾谷镰孢菌、禾赤镰孢菌、异孢镰孢菌、合欢木镰孢菌、尖孢镰孢菌、多枝镰孢菌、粉红镰孢菌、接骨木镰孢菌、肤色镰孢菌、拟分枝孢镰孢菌、硫色镰孢菌、圆镰孢菌、拟丝孢镰孢菌、镶片镰孢菌、特异腐质霉、柔毛腐质霉、米黑毛霉、嗜热毁丝霉、粗糙脉孢菌、产紫青霉、黄孢原毛平革菌、射脉菌(Phlebia radiata)、刺芹侧耳(Pleurotus eryngii)、土生梭孢壳霉、长域毛栓菌(Trametes villosa)、变色栓菌(Trametes versicolor)、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、或绿色木霉细胞。
真菌细胞可以通过下述过程转化,该过程涉及原生质体形成、原生质体的转化、以及以本身已知的方式的细胞壁的再生。用于转化曲霉属和木霉属宿主细胞的适合程序描述于以下文献中:EP 238023,Yelton等人,1984,Proc.Natl.Acad.Sci.USA [美国国家科学院院刊]81:1470-1474以及Christensen等人,1988,Bio/Technology[生物/技术]6:1419-1422。用于转化镰孢属物种的适合方法由Malardier等人1989,Gene[基因]78:147-156和WO96/00787描述。可使用由如以下文献描述的方法转化酵母:Becker和Guarente,于Abelson,J.N.和Simon,M.I.编,Guide to Yeast Genetics and Molecular Biology[酵母遗传学与分子生物学指南],Methods in Enzymology[酶学方法],第194卷,第182-187页,学术出版社有限公司(Academic Press,Inc.),纽约;Ito等人,1983,J.Bacteriol.[细菌学杂志]153:163;以及Hinnen等人,1978,Proc.Natl.Acad.Sci.USA[美国科学院院刊]75:1920。
产生方法
本发明还涉及产生本发明多肽的方法,该方法包括:(a)在有益于产生该多肽的条件下培养本发明的重组宿主细胞;和任选地(b)回收该多肽。
这些宿主细胞是在适合于使用本领域中已知的方法产生这些多肽的营养介质中培养的。例如,可通过摇瓶培养、或在实验室或工业发酵器中小规模或大规模发酵(包括连续、分批、补料分批或固态发酵)培养细胞,所述培养在适合的介质中并且在允许表达和/或分离多肽的条件下进行。使用本领域中已知的程序,培养发生在包含碳和氮来源及无机盐的适合的营养介质中。适合的培养基可以从商业供应商获得或可以根据公开的组成(例如,在美国典型培养物保藏中心(American Type Culture Collection)的目录中)制备。如果多肽被分泌到营养介质中,那么可直接从介质中回收多肽。如果多肽不分泌,那么其可从细胞裂解液中进行回收。
可以使用针对该多肽具有特异性的本领域已知的方法检测该多肽。
可使用本领域已知的方法来回收多肽。例如,可通过常规方法,包括但不限于,收集、离心、过滤、提取、喷雾干燥、蒸发或沉淀,从营养介质回收多肽。在一方面,回收包含多肽的发酵液。
可通过本领域已知的多种方法纯化多肽以获得基本上纯的多肽,所述方法包括但不限于层析(例如,离子交换、亲和、疏水、层析聚焦和大小排阻)、电泳方法(例如,制备型等电聚焦)、差示溶解度(例如,硫酸铵沉淀)、SDS-PAGE或提取(参见,例如,ProteinPurification[蛋白质纯化],Janson和Ryden编辑,VCH出版公司(VCH Publishers),纽约,1989)。
在一个替代性方面,不回收多肽,而是将表达该多肽的本发明的宿主细胞用作多肽的来源。
在如下列出的优选实施例中进一步披露本发明。
实施例1.一种用于从含淀粉材料产生发酵产物的方法,所述方法包括:
a)使用产碳水化合物源的酶在低于所述含淀粉材料的初始糊化温度的温度使含淀粉材料糖化;以及
b)使用发酵生物进行发酵;其中
步骤a)和/或b)在内切蛋白酶和外切蛋白酶混合物存在下进行,并且其中外切蛋白酶以总蛋白酶酶蛋白为基础构成蛋白酶混合物的至少5%(w/w)。
实施例2.一种用于从含淀粉材料产生发酵产物的方法,所述方法包括以下步骤:
(a)在高于所述含淀粉材料的初始糊化温度的温度,在α-淀粉酶存在下,液化该含淀粉材料;
(b)使用产碳水化合物源的酶来使步骤(a)中获得的液化材料糖化;
(c)使用发酵生物进行发酵;
其中步骤b)和/或c)在内切蛋白酶和外切蛋白酶混合物存在下进行,并且其中外切蛋白酶以总蛋白酶酶蛋白为基础构成蛋白酶混合物的至少5%(w/w)。
实施例3.根据实施例1或2所述的方法,其中糖化和发酵同时进行。
实施例4.根据前述实施例中任一项所述的方法,其中外切蛋白酶以总蛋白酶酶蛋白为基础构成蛋白酶混合物的至少10%(w/w),例如至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、特别地至少75%、更特别地外切蛋白酶以总蛋白酶酶蛋白为基础构成组合物中蛋白酶混合物的从5%至95%(w/w)、特别地10%至80%(w/w)、特别地15%至70%(w/w)、更特别地20%至60%(w/w)、并且甚至更特别地25%至50%(w/w)。
实施例5.根据前述实施例中任一项所述的方法,其中内切蛋白酶和外切蛋白酶以5:2微克酶蛋白(EP)/g干固体(DS)的比例存在,特别地是5:3,更特别地是5:4。
实施例6.根据实施例1-5中任一项所述的方法,其中内切蛋白酶源自属于S53、S8、M35、A1家族的蛋白酶。
实施例7.根据实施例1-5中任一项所述的方法,其中外切蛋白酶源自属于S10、S53、M14、M28家族的蛋白酶。
实施例8.如实施例6所述的方法,其中S53蛋白酶源自亚灰树花菌属,更特别地大型亚灰树花菌的菌株。
实施例9.如实施例1-8中任一项所述的方法,其中S53蛋白酶是具有丝氨酸蛋白酶活性的多肽,选自与SEQ ID NO:1的成熟多肽或SEQ ID NO:2的多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽。
实施例10.如实施例6所述的方法,其中S8蛋白酶源自火球菌属、高温球菌属,特别地强烈火球菌和嗜热高温球菌的菌株。
实施例11.如实施例10所述的方法,其中S8蛋白酶是具有丝氨酸蛋白酶活性的多肽,选自与SEQ ID NO:3的多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽。
实施例12.根据实施例7所述的方法,其中S10外切蛋白酶源自曲霉属或青霉属,特别地是米曲霉、黑曲霉或简青霉的菌株。
实施例13.如实施例12所述的方法,其中S10外切蛋白酶是具有丝氨酸蛋白酶活性的多肽,选自与SEQ ID NO:4的成熟多肽或SEQ ID NO:5的多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽。
实施例14.如实施例12所述的方法,其中S10外切蛋白酶是具有丝氨酸蛋白酶活性的多肽,选自与SEQ ID NO:6的成熟多肽或SEQ ID NO:7的多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽。
实施例15.如实施例12所述的方法,其中S10外切蛋白酶是具有丝氨酸蛋白酶活性的多肽,选自与SEQ ID NO:31的多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽。
实施例16.根据实施例7所述的方法,其中S53外切蛋白酶来源于曲霉属、木霉属、嗜热子囊菌属或嗜热真菌属的菌株,特别是米曲霉、黑曲霉、里氏木霉、嗜热嗜热子囊菌或疏棉状嗜热丝孢菌。
实施例17.根据实施例16所述的方法,其中S53蛋白酶是具有丝氨酸蛋白酶活性的多肽,选自与SEQ ID NO:19的成熟多肽或SEQ ID NO:20的多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽。
实施例18.根据实施例16所述的方法,其中S53蛋白酶是具有丝氨酸蛋白酶活性的多肽,选自与SEQ ID NO:21的成熟多肽或SEQ ID NO:22的多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽。
实施例19.根据实施例16所述的方法,其中S53蛋白酶是具有丝氨酸蛋白酶活性的多肽,选自与SEQ ID NO:23的成熟多肽或SEQ ID NO:24的多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽。
实施例20.根据实施例16所述的方法,其中S53蛋白酶是具有丝氨酸蛋白酶活性的多肽,选自与SEQ ID NO:25的成熟多肽或SEQ ID NO:26的多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽。
实施例21.根据实施例16所述的方法,其中S53蛋白酶是具有丝氨酸蛋白酶活性的多肽,选自与SEQ ID NO:32的多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽。
实施例22.如前述实施例中任一项所述的方法,其中在糖化和/或发酵过程中存在和/或添加α-淀粉酶。
实施例23.根据实施例22所述的方法,其中α-淀粉酶是酸性α-淀粉酶,优选地是酸性真菌α-淀粉酶。
实施例24.根据实施例23所述的方法,其中该α-淀粉酶是源自曲霉属,具体是土曲霉、黑曲霉、米曲霉、泡盛曲霉、或白曲霉的菌株;或者根毛霉属的菌株,优选是微小根毛霉的菌株;或者亚灰树花菌属,优选是大型亚灰树花菌的菌株。
实施例25.根据实施例24所述的方法,其中在糖化和/或发酵中存在的该α-淀粉酶是源自根毛霉属的菌株,优选微小根毛霉的菌株,如具有来自黑曲霉葡糖淀粉酶的连接子和淀粉结合结构域的微小根毛霉α-淀粉酶杂合体。
实施例26.如实施例25所述的方法,其中在糖化和/或发酵过程中存在的α-淀粉酶选自下组,该组由以下组成:
(i)包含SEQ ID NO:9的多肽的α-淀粉酶;
(ii)包含以下氨基酸序列的α-淀粉酶,该氨基酸序列与SEQ ID NO:9的多肽具有至少60%、至少70%,例如至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的一致性。
实施例27.如实施例26所述的方法,其中源自具有黑曲霉葡糖淀粉酶接头和淀粉结合结构域(SBD)的微小根毛霉的α-淀粉酶,优选如SEQ ID NO:9披露的,优选具有一个或多个以下取代:G128D、D143N,优选G128D+D143N。
实施例28.如实施例22-27中任一项所述的方法,其中该α-淀粉酶以0.001至10AFAU/g DS,优选地0.01至5AFAU/g DS,特别地0.3至2AFAU/g DS或0.001至1FAU-F/g DS,优选地0.01至1FAU-F/g DS的量存在。
实施例29.如实施例1-28中任一项所述的方法,其中该产碳水化合物源的酶选自下组,该组由以下支链淀粉酶组成:葡糖淀粉酶、α-葡糖苷酶、麦芽糖淀粉酶、和β-淀粉酶。
实施例30.如实施例1-29中任一项所述的方法,其中该产碳水化合物源的酶是葡糖淀粉酶,并且以0.001至10AGU/g DS的量存在,优选地从0.01至5AGU/g DS、特别地0.1至0.5AGU/g DS。
实施例31.如实施例28-30中任一项所述的方法,其中当糖化和发酵同时进行时,α-淀粉酶和葡糖淀粉酶以在0.1和100AGU/FAU-F之间,优选地在2和50AGU/FAU-F之间,特别地在10和40AGU/FAU-F之间的比率添加。
实施例32.如实施例29-31中任一项所述的方法,其中葡糖淀粉酶源自曲霉属的菌株,优选黑曲霉或泡盛曲霉,篮状菌属的菌株,特别是埃默森篮状菌;或阿太菌属的菌株,特别是罗耳阿太菌;栓菌属的菌株,优选瓣环栓菌;粘褶菌属的菌株,如篱边粘褶菌或密粘褶菌的菌株;密孔菌属的菌株,如血红密孔菌的菌株;或其混合物。
实施例33.如实施例32所述的方法,其中该葡糖淀粉酶是源自栓菌属,如瓣环栓菌的菌株,如示于SEQ ID NO:10中的菌株。
实施例34.如实施例33所述的方法,其中该葡糖淀粉酶选自下组,该组由以下组成:
(i)包含SEQ ID NO:10的多肽的葡糖淀粉酶;
(ii)包含以下氨基酸序列的葡糖淀粉酶,该氨基酸序列与SEQ ID NO:10的多肽具有至少60%、至少70%,例如至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的一致性。
实施例35.如实施例32所述的方法,其中该葡糖淀粉酶是源自篮状菌属,如埃默森篮状菌的菌株,如示于SEQ ID NO:11中的菌株。
实施例36.如实施例35所述的方法,其中该葡糖淀粉酶选自下组,该组由以下组成:
(i)包含SEQ ID NO:11的多肽的葡糖淀粉酶;
(ii)包含以下氨基酸序列的葡糖淀粉酶,该氨基酸序列与SEQ ID NO:11的多肽具有至少60%、至少70%,例如至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的一致性。
实施例37.如实施例32所述的方法,其中该葡糖淀粉酶源自密孔菌属的菌株,如血红密孔菌的菌株,如示于SEQ ID NO:12中的菌株。
实施例38.如实施例37所述的方法,其中该葡糖淀粉酶选自下组,该组由以下组成:
(i)包含SEQ ID NO:12的多肽的葡糖淀粉酶;
(ii)包含以下氨基酸序列的葡糖淀粉酶,该氨基酸序列与SEQ ID NO:12的多肽具有至少60%、至少70%,例如至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的一致性。
实施例39.如实施例32所述的方法,其中该葡糖淀粉酶源自粘褶菌属的菌株,如示于SEQ ID NO:13中的篱边粘褶菌的菌株。
实施例40.如实施例39所述的方法,其中该葡糖淀粉酶选自下组,该组由以下组成:
(i)包含SEQ ID NO:13的多肽的葡糖淀粉酶;
(ii)包含以下氨基酸序列的葡糖淀粉酶,该氨基酸序列与SEQ ID NO:13的多肽具有至少60%、至少70%,例如至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的一致性。
实施例41.如实施例32所述的方法,其中该葡糖淀粉酶源自粘褶菌属的菌株,如密粘褶菌的菌株,如示于SEQ ID NO:14中的菌株。
实施例42.如实施例41所述的方法,其中该葡糖淀粉酶选自下组,该组由以下组成:
(i)包含SEQ ID NO:14的多肽的葡糖淀粉酶;
(ii)包含以下氨基酸序列的葡糖淀粉酶,该氨基酸序列与SEQ ID NO:14的多肽具有至少60%、至少70%,例如至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的一致性。
实施例43.如实施例1-42中任一项所述的方法,其中该发酵产物是在发酵之后回收。
实施例44.如实施例1-43中任一项所述的方法,其中该发酵产物是醇,优选乙醇,特别是燃料乙醇、饮用乙醇和/或工业乙醇。
实施例45.如实施例1-44中任一项所述的方法,其中该发酵生物是酵母,优选酵母属的菌株,特别是酿酒酵母的菌株。
实施例46.如实施例1所述的方法,其中所述包含淀粉材料是粒状淀粉。
实施例47.如实施例46所述的方法,其中所述包含淀粉材料源自完整谷物。
实施例48.如实施例1-47中任一项所述的方法,其中所述含淀粉材料源自玉米、小麦、大麦、黑麦、蜀黍、西米、木薯、木薯淀粉、高粱、稻或马铃薯。
实施例49.如实施例1-48中任一项所述的方法,其中在3与7之间,优选从3.5至6,或更优选从4至5的范围内的pH进行发酵。
实施例50.如实施例1-49中任一项所述的方法,其中该方法进行1至96小时,优选地从6至72小时。
实施例51.如实施例1-50中任一项所述的方法,其中所述含淀粉材料的干固体含量是在从10-55w/w-%,优选地25-45w/w-%,更优选地30-40w/w-%的范围。
实施例52.如实施例1-51中任一项所述的方法,其中所述含淀粉材料通过将含淀粉材料的颗粒尺寸减小至0.1mm-0.5mm的颗粒尺寸来制备。
实施例53.如实施例3所述的方法,其中同时糖化和发酵期间的温度是在25℃和40℃之间,如在28℃和35℃之间,如在30℃和34℃之间,如约32℃。
实施例54.如实施例3所述的方法,其中同时糖化和发酵期间的pH选自范围3-7,优选4.0-6.5,更特别地4.5-5.5,例如pH 5.0。
实施例55.如实施例2-54中任一项所述的方法,其中液化在pH4.0-6.5,优选在pH从4.5至5.5,例如pH 5.0进行。
实施例56.如实施例2-55中任一项所述的方法,其中液化温度为从70℃-95℃的范围,优选80℃-90℃,例如约85℃。
实施例57.如实施例1或2所述的方法,该方法在步骤(a)之前进一步包括以下步骤:
x)减少含淀粉材料的粒度;
y)形成一种包含该含淀粉材料和水的浆料。
实施例58.如实施例2-57中任一项所述的方法,其中支链淀粉酶在i)发酵过程中,和/或ii)液化之前、过程中和/或之后存在。
实施例59.一种包括内切蛋白酶和外切蛋白酶的混合物的组合物,并且其中外切蛋白酶以总蛋白酶酶蛋白为基础构成混合物中蛋白酶的至少5%(w/w),例如至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、特别地至少75%、更特别地外切蛋白酶以总蛋白酶酶蛋白为基础构成混合物中蛋白酶的从5%至95%(w/w)、特别地10%至80%(w/w)、特别地15%至70%(w/w)、更特别地20%至60%(w/w)、并且甚至更特别地以总蛋白酶酶蛋白为基础构成组合物中蛋白酶混合物的25%至50%(w/w)。
实施例60.如实施例59所述的组合物,其中内切蛋白酶源自属于S53、S8、M35或A1家族的蛋白酶,并且外切蛋白酶源自属于S10、S53、M14或M28家族的蛋白酶。
实施例61.根据实施例60所述的组合物,其中内切蛋白酶是来自大型亚灰树花菌的S53并且外切蛋白酶是来自米曲霉、黑曲霉或简青霉的S10。
实施例62.如实施例61所述的组合物,其中S53蛋白酶是具有丝氨酸蛋白酶活性的多肽,选自与SEQ ID NO:1的成熟多肽或SEQ ID NO:2的多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽。
实施例63.如实施例61所述的组合物,其中S10蛋白酶是具有丝氨酸蛋白酶活性的多肽,选自与SEQ ID NO:4的成熟多肽或SEQ ID NO:5的多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽。
实施例64.如实施例61所述的组合物,其中S10外切蛋白酶是具有丝氨酸蛋白酶活性的多肽,选自与SEQ ID NO:6的成熟多肽或SEQ ID NO:7的多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽。
实施例65.如实施例61所述的组合物,其中S10外切蛋白酶是具有丝氨酸蛋白酶活性的多肽,选自与SEQ ID NO:31的多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽。
实施例66.根据实施例59所述的组合物,其中其中S53外切蛋白酶来源于曲霉属、木霉属、嗜热子囊菌属或嗜热真菌属的菌株,特别是米曲霉、黑曲霉、里氏木霉、嗜热嗜热子囊菌或疏棉状嗜热丝孢菌。
实施例67.根据实施例66所述的组合物,其中S53外切蛋白酶是具有丝氨酸蛋白酶活性的多肽,选自与SEQ ID NO:19的成熟多肽或SEQ ID NO:20的多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽。
实施例68.根据实施例66所述的组合物,其中S53外切蛋白酶是具有丝氨酸蛋白酶活性的多肽,选自与SEQ ID NO:21的成熟多肽或SEQ ID NO:22的多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽。
实施例69.根据实施例66所述的组合物,其中S53外切蛋白酶是具有丝氨酸蛋白酶活性的多肽,选自与SEQ ID NO:23的成熟多肽或SEQ ID NO:24的多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽。
实施例70.根据实施例66所述的组合物,其中S53外切蛋白酶是具有丝氨酸蛋白酶活性的多肽,选自与SEQ ID NO:25的成熟多肽或SEQ ID NO:26的多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽。
实施例71.根据实施例66所述的组合物,其中S53外切蛋白酶是具有丝氨酸蛋白酶活性的多肽,选自与SEQ ID NO:32的多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽。
实施例72.如实施例59-71中任一项所述的组合物,进一步包含选自下组的产碳水化合物源的酶,该组由以下组成:葡糖淀粉酶、α-葡糖苷酶、麦芽糖淀粉酶和β-淀粉酶。
实施例73.如实施例72所述的组合物,其中产碳水化合物源的酶选自下组的葡糖淀粉酶,所述组的葡糖淀粉酶源自:曲霉属的菌株,优选黑曲霉或泡盛曲霉,木霉属的菌株,特别是里氏木霉,篮状菌属的菌株,特别是埃默森篮状菌;或阿太菌属的菌株,特别是罗耳阿太菌;栓菌属的菌株,优选瓣环栓菌;粘褶菌属的菌株,如篱边粘褶菌或密粘褶菌的菌株;密孔菌属的菌株,如血红密孔菌的菌株;或其混合物。
实施例74.如实施例59-73中任一项所述的组合物,进一步包含选自下组的α-淀粉酶,该组由源自以下的真菌α-淀粉酶组成:曲霉属,特别是土曲霉、黑曲霉、米曲霉、泡盛曲霉、或白曲霉的菌株;或者根毛霉属的菌株,优选是微小根毛霉的菌株;或者亚灰树花菌属,优选是大型亚灰树花菌的菌株。
实施例75.根据实施例59-74中任一项所述的组合物在含淀粉材料的糖化中的用途。
实施例76.根据实施例75所述的用途,进一步包括发酵糖化的含淀粉材料以产生发酵产物。
实施例77.根据实施例75-76中任一项所述的用途,其中淀粉材料是凝胶化或未糊化的淀粉。
实施例78.根据实施例75-77中任一项所述的用途,其中发酵产物是醇,特别是乙醇。
实施例79.根据实施例75-78中任一项所述的用途,其中糖化和发酵同时进行。
实施例80.一种具有丝氨酸蛋白酶活性并且属于S10家族的多肽,所述多肽选自由以下组成的组:
(a)多肽,该多肽与SEQ ID NO:6的成熟多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性;
(b)由多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:8的成熟多肽编码序列具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性;
(c)(a)、或(b)的多肽的片段,该片段具有丝氨酸蛋白酶活性。
实施例81.如实施例80所述的多肽,该多肽包括SEQ ID NO:6或SEQ ID NO:6的成熟多肽或由其组成。
实施例82.如实施例80-81所述的多肽,其中成熟多肽是SEQ ID NO:6的氨基酸51到473。
实施例83.如实施例80-82中任一项所述的多肽,该多肽是SEQ ID NO:6的成熟多肽的变体,该变体在一个或若干位置处包括取代、缺失、和/或插入。
实施例84.一种具有丝氨酸蛋白酶活性并且属于S53家族的多肽,所述多肽选自由以下组成的组:
(a)多肽,该多肽与SEQ ID NO:23的成熟多肽具有至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性;或
(b)由多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:29的成熟多肽编码序列具有至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性;或
(c)(a)、或(b)的多肽的片段,该片段具有丝氨酸蛋白酶活性。
实施例85.一种具有丝氨酸蛋白酶活性并且属于S53家族的多肽,所述多肽选自由以下组成的组:
(a)多肽,该多肽与SEQ ID NO:25的成熟多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性;或
(b)由多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:30的成熟多肽编码序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性;或
(c)(a)、或(b)的多肽的片段,该片段具有丝氨酸蛋白酶活性。
实施例86.如实施例84所述的多肽,其中该成熟多肽是SEQ ID NO:24。
实施例87.如实施例85所述的多肽,其中该成熟多肽是SEQ ID NO:26。
实施例88.一种编码实施例80-87中任一项所述的多肽的多核苷酸。
实施例89.一种核酸构建体或表达载体,该核酸构建体或表达载体包含如实施例88所述的多核苷酸,该多核苷酸可操作地连接至指导该多肽在表达宿主中的产生的一个或多个控制序列。
实施例90.一种重组宿主细胞,该重组宿主细胞包含如实施例88所述的异源多核苷酸,该多核苷酸可操作地连接至指导该多肽的产生的一个或多个控制序列。
实施例91.一种产生如实施例80-87中任一项所述的多肽的方法,该方法包括:在有益于产生该多肽的条件下培养如实施例90所述的宿主细胞。
实施例92.如实施例91所述的方法,该方法进一步包括回收该多肽。
通过以下实例进一步描述本发明,这些实例不应理解为对本发明的范围进行限制。
实例
酶测定
蛋白酶测定
AZCL-酪蛋白测定
边搅拌边将蓝色底物AZCL-酪蛋白的0.2%溶液悬浮于pH 9的Borax/NaH2PO4缓冲液中。边搅拌边将该溶液分散在微量滴定板(每孔100微升)上,添加30微升酶样品并且将这些板在Eppendorf热混器中在45℃和600rpm孵育30分钟。使用变性的酶样品(100℃煮沸20min)用作空白对照。孵育之后通过将微量滴定板转移到冰上来终止该反应并且通过在4℃以3000rpm离心5分钟将着色的溶液与固体分离。将60微升的上清液转移到微量滴定板并且使用伯乐酶标仪(BioRad Microplate Reader)测量在595nm处的吸光度。
动力学Suc-AAPF-pNA测定:
pNA底物:Suc-AAPF-pNA(巴亨公司(Bachem)L-1400)。
温度:室温(25℃)
测定缓冲液:100mM琥珀酸,100mM HEPES,100mM CHES,100mM CABS,1mM CaCl2,150mM KCl,0.01%Triton X-100,用HCl或NaOH调节至pH值2.0、3.0、4.0、5.0、6.0、7.0、8.0、9.0、10.0及11.0。
将20μl蛋白酶样品(稀释于0.01%Triton X-100中)与100μl测定缓冲液混合。通过添加100μl pNA底物(50mg,溶解在1.0ml DMSO中,并进一步地用0.01%Triton X-100稀释45倍)开始进行测定。监测OD405的增加作为蛋白酶活性的量度。
端点Suc-AAPF-pNA测定:
pNA底物:Suc-AAPF-pNA(巴亨公司(Bachem)L-1400)。
温度:受控的(测定温度)。
测定缓冲液:100mM琥珀酸,100mM HEPES,100mM CHES,100mM CABS,1mM CaCl2,150mM KCl,0.01%Triton X-100,pH 4.0
将200μl pNA底物(50mg,溶解在1.0ml DMSO中,并进一步地用测定缓冲液稀释45倍)用移液管移至Eppendorf管中并置于冰上。添加20μl蛋白酶样品(稀释在0.01%TritonX-100中)。通过将Eppendorf管转移至设定为测定温度的Eppendorf恒温混匀仪中来启动测定。将管在Eppendorf恒温混匀仪上在最高振摇速率(1400rpm)下孵育15分钟。通过转移该管返回至冰浴并添加600μl 500mM H3BO3/NaOH(pH 9.7)停止孵育。混合该管并将200μl混合物转移至微量滴定板中,将其在OD405处读取。在测定中包括空白缓冲液(buffer blind)(代替酶)。OD405(样品)-OD405(空白)是蛋白酶活性的量度。
Protazyme AK测定:
底物:Protazyme AK片(交联和染色的酪蛋白;来自麦格酶公司(Megazyme))
温度:受控的(测定温度)。
测定缓冲液:100mM琥珀酸,100mM HEPES,100mM CHES,100mM CABS,1mM CaCl2,150mM KCl,0.01%Triton X-100,pH 6.5。
通过温和搅拌,将Protazyme AK片剂悬浮于2.0ml 0.01%Triton X-100中。将500μl此悬浮液和500μl测试缓冲液在Eppendorf管中混和并且放在冰上。添加20μl蛋白酶样品(稀释在0.01%Triton X-100中)。通过将Eppendorf管转移至设定为测定温度的Eppendorf恒温混匀仪中来启动测定。将管在Eppendorf恒温混匀仪上在最高振摇速率(1400rpm)下孵育15分钟。通过将该管转移返回至冰浴停止孵育。随后将管在冰冷的离心机中离心数分钟并将200μl上清液转移至微量滴定板中,将其在OD650处读取。在测定中包括空白缓冲液(buffer blind)(代替酶)。OD650(样品)-OD650(空白)是蛋白酶活性的量度。
动力学Suc-AAPX-pNA测定:
pNA底物:Suc-AAPA-pNA(巴亨公司(Bachem)L-1775)
Suc-AAPR-pNA(巴亨公司(Bachem)L-1720)
Suc-AAPD-pNA(巴亨公司(Bachem)L-1835)
Suc-AAPI-pNA(巴亨公司(Bachem)L-1790)
Suc-AAPM-pNA(巴亨公司(Bachem)L-1395)
Suc-AAPV-pNA(巴亨公司(Bachem)L-1770)
Suc-AAPL-pNA(巴亨公司(Bachem)L-1390)
Suc-AAPE-pNA(巴亨公司(Bachem)L-1710)
Suc-AAPK-pNA(巴亨公司(Bachem)L-1725)
Suc-AAPF-pNA(巴亨公司(Bachem)L-1400)
温度:室温(25℃)
测定缓冲液:100mM琥珀酸,100mM HEPES,100mM CHES,100mM CABS,1mM CaCl2,150mM KCl,0.01%Triton X-100,pH 4.0或pH 9.0。
将20μl蛋白酶(稀释于0.01%Triton X-100中)与100μl测定缓冲液混合。通过添加100μl pNA底物(50mg,溶解在1.0ml DMSO中,并进一步地用0.01%Triton X-100稀释45倍)开始进行测定。监测OD405的增加作为蛋白酶活性的量度。
邻苯二甲醛(OPA)测定:
这一测定检测伯胺并且因此可以将肽键由一种蛋白酶的切割测量为蛋白酶处理的样品与对照样品之间的吸光度的差异。基本上根据Nielsen等人(Nielsen,PM,Petersen,D,Dampmann,C.Improved method for determining food protein degree ofhydrolysis[用于确定食物蛋白水解程度的改进方法],J Food Sci[食品科学杂志],2001,66:642-646)进行该测定。
将500μl样品通过100kDa微量浓缩(Microcon)离心过滤器(60min,11,000rpm,5℃)过滤。将这些样品在去离子水中稀释大约(例如10倍、50倍或100倍),并将25μL的每份样品装载到96孔微量滴定板中(5个重复)。将200μl OPA试剂(100mM四硼酸二钠十水合物,3.5mM十二烷基硫酸钠(SDS),5.7mM二硫苏糖醇(DDT),6mM邻苯二甲醛)分配在所有孔中,振荡该板(10sec,750rpm)并且在340nm下测量吸光度。
对于葡糖淀粉酶活性的测定
葡糖淀粉酶单位,AGU
葡糖淀粉酶单位(AGU)被定义为在标准条件下(37℃,pH 4.3,底物:100mM麦芽糖,缓冲液:乙酸盐0.1M,反应时间:6分钟,如以下葡糖淀粉酶孵育中所说明的)每分钟水解1微摩尔麦芽糖由此产生葡萄糖的酶的量。
通过3个反应步骤描述分析原理:
步骤1是一个酶反应:
葡糖淀粉酶(AMG)EC 3.2.1.3(外切-α-1,4-葡聚糖-葡糖淀粉酶)水解麦芽糖以形成α-D-葡萄糖。孵育之后,用NaOH来停止该反应。
步骤2和步骤3引起终点反应:
在由己糖激酶催化的反应中,葡萄糖被ATP磷酸化。形成的葡萄糖-6-磷酸被葡萄糖-6-磷酸脱氢酶氧化成6-磷酸葡萄糖酸。在这个相同的反应中,等摩尔量的NAD+被还原成NADH,导致在340nm处的吸光度增加。可以使用自动分析仪系统例如Konelab 30分析仪(赛默飞世尔科技公司(Thermo Fisher Scientific))。
酸性α-淀粉酶活性(AFAU)
能以AFAU(酸性真菌α-淀粉酶单位)测量酸性α-淀粉酶活性,其相对于酶标准品确定。1AFAU定义为在下述标准条件下每小时降解5.260mg淀粉干物质的酶量。
酸性α-淀粉酶是内-α-淀粉酶(1,4-α-D-葡聚糖-葡糖水解酶,E.C.3.2.1.1),它水解在淀粉分子的内部区域中的α-1,4-糖苷键以形成具有不同链长度的糊精和寡糖。与碘形成的颜色的强度跟淀粉的浓度成正比。使用反向比色法将酶活性测定为在指定的分析条件下淀粉浓度的减小。
λ=590nm
蓝色/紫色 t=23秒 脱色
标准条件/反应条件:
更详细描述这种分析方法的文件夹EB-SM-0259.02/01可以从丹麦的诺维信公司索取得到,通过引用将该文件夹特此包括。
FAU-F的测定
相对于具有声明强度的酶标准品测量FAU-F真菌α-淀粉酶单位(Fungal Alpha-Amylase Units(Fungamyl))。
更详细描述这种分析方法的文件夹(EB-SM-0216.02)可以从丹麦的诺维信公司索取得到,通过引用将该文件夹特此包括。
α-淀粉酶活性(KNU)
可以使用马铃薯淀粉作为底物测定α-淀粉酶活性。此方法是基于由酶分解改性的马铃薯淀粉,并且该反应通过将淀粉/酶溶液的样品与碘溶液混合来追踪。最初形成黑蓝色,但淀粉分解过程中蓝色变弱并且逐渐变为红褐色,将其与有色玻璃标准品比较。
一千Novoα淀粉酶单位(KNU)定义为在标准条件下(即,在37℃+/-0.05;0.0003MCa2+;和pH 5.6)将5260mg可溶的淀粉干物质Merck Amylum糊精化的酶量。
更详细描述这种分析方法的文件夹EB-SM-0009.02/01可以从丹麦的诺维信公司索取得到,通过引用将该文件夹特此包括。
α-淀粉酶活性(KNU-A)
相对于所声明强度的酶标准,以KNU(A)Kilo Novozymes单位(A)测量α淀粉酶活性。
样品中的α淀粉酶和试剂盒中的α-葡糖苷酶将底物(4,6-亚乙基(G7)-对硝基苯基(G1)-α,D-麦芽七糖苷(亚乙基-G7PNP))水解成葡萄糖和黄色的对硝基苯酚。
通过Konelab 30观察对硝基苯酚的形成速率。这是反应速率及由此为酶活性的表达。
该酶是具有酶分类号EC 3.2.1.1的α-淀粉酶。
关于确定KNU-A活性的文件夹EB-SM-5091.02-D可从丹麦诺维信公司应要求得到,该文件夹通过提述由此包括。
α-淀粉酶369(AA369):具有以下突变的嗜热脂肪芽孢杆菌α-淀粉酶:I181*+G182*+N193F+V59A+Q89R+E129V+K177L+R179E+Q254S+M284V截短至491个氨基酸(使用SEQ IDNO:15进行编号)。
α-淀粉酶X:具有以下突变的嗜热脂肪芽孢杆菌α-淀粉酶:I181*+G182*+N193F截短至491个氨基酸(使用SEQ ID NO:15进行编号)。
葡糖淀粉酶Po:草酸青霉菌葡糖淀粉酶的成熟部分披露为WO 2011/127802中的SEQ ID NO:2以及本文中显示的SEQ ID NO:17。
蛋白酶Pfu:源自强烈火球菌的蛋白酶,示于在此的SEQ ID NO:3中。
葡糖淀粉酶Po 498(GA498):草酸青霉菌葡糖淀粉酶的变体具有以下突变:K79V+P2N+P4S+P11F+T65A+Q327F(使用SEQ ID NO:17进行编号)。
α-淀粉酶共混物A:包含以下项的共混物:α-淀粉酶AA369、葡糖淀粉酶GA498和蛋白酶PfuS(剂量:2.1μg EP/g DS AA369,4.5μg EP/g DS GA498,0.0385μg EP/g DS PfuS,其中EP是酶蛋白并且DS是总干固体)。
葡糖淀粉酶共混物A:包含以下的共混物:WO 99/28448中披露为SEQ ID NO:34以及在此披露为SEQ ID NO:11的埃默森篮状菌葡糖淀粉酶、WO 06/69289中披露为SEQ IDNO:2以及披露为SEQ ID NO:10的瓣环栓菌葡糖淀粉酶、以及在此的SEQ ID NO:9中披露的具有黑曲霉葡糖淀粉酶接头和淀粉结合结构域(SBD)的微小根毛霉α-淀粉酶,其具有以下取代:G128D+D143N(使用SEQ ID NO:9进行编号)(以AGU:AGU:FAU-F表示的活性比为约29:8:1)。
实例1.来自米曲霉的外肽酶与来自大型亚灰树花菌的内切蛋白酶组合用于同时 糖化和发酵方法中增加乙醇滴度的效果
使用Labomat BFA-24(马西斯公司(Mathis),康科德,北卡罗来纳州)在金属罐中进行液化。在罐中添加222g工业生产的磨碎的玉米至377g自来水中并充分混合。目标干固体为约32%DS。将pH调节至pH 5.0并使用水分天平(Mettler-Toledo)测量干固体。将α-淀粉酶共混物A以0.03%(w/w)添加至玉米浆料中,并在Labomat室中在85℃液化2小时。液化后,将罐在冰浴中冷却至室温,然后将液化的醪转移到容器中,然后补充3ppm的青霉素和350ppm的尿素。通过小规模发酵进行同时糖化和发酵(SSF)。将大约5g每种上述液化的玉米醪添加至15ml管制瓶中。向每个瓶中添加0.6AGU/gDS的葡糖淀粉酶共混物A和适当量的来自大大型亚灰树花菌的内切蛋白酶(SEQ ID NO:2),含有或不含来自米曲霉的外肽酶,即羧肽酶(SEQ ID NO:5),如下表所示,然后每5g浆料添加25微升水合酵母。作为对照,仅添加葡糖淀粉酶共混物A并且不添加内切蛋白酶或外肽酶。实际葡糖淀粉酶和蛋白酶剂量基于每个小瓶中的玉米浆料的精确重量。将小瓶在32℃孵育。在24小时、48小时和56小时时间点选择三个重复进行分析。在每个时间点,通过添加50微升的40%H2SO4来终止发酵,随后离心,并且通过0.45微米过滤器过滤。使用HPLC测定乙醇和低聚糖浓度。
如下表结果所示,与对照或单独的内切蛋白酶相比,内切蛋白酶与外肽酶的组合增加了乙醇产量,具有统计学显著性。
用不含或含有外肽酶的不同处理的内切蛋白酶处理56小时的乙醇产量。
处理 乙醇(g/l)
1.对照 119.4
2.内切蛋白酶(5) 127.7
3.内切蛋白酶(7) 126.7
4.内切蛋白酶(9) 127.8
5.内切蛋白酶(5)+外切蛋白酶(2) 128.8
6.内切蛋白酶(5)+外切蛋白酶(4) 129.1
实例2.来自简青霉的外肽酶与来自大型亚灰树花菌的内切蛋白酶组合用于同时 糖化和发酵方法中增加乙醇滴度的效果
使用α-淀粉酶共混物A的工业制备的液化醪用于实验。通过水分天平(Mettler-Toledo)测定的干固体为约33%DS,将pH调节至pH 5.0,并且随后补充3ppm青霉素和350ppm尿素。通过小规模发酵进行同时糖化和发酵(SSF)。将约5g工业液化的玉米醪添加至15ml管制瓶中。向每个瓶中添加0.6AGU/gDS的葡糖淀粉酶共混物A和适当量的来自大大型亚灰树花菌的内切蛋白酶(SEQ ID NO:2),含有或不含来自简青霉的外肽酶,即羧肽酶(SEQ IDNO:7),如下表所示,然后每5g浆料添加25微升水合酵母。作为对照,添加葡糖淀粉酶共混物A和350ppm尿素,但不添加内切蛋白酶或外肽酶。实际葡糖淀粉酶和蛋白酶剂量基于每个小瓶中的玉米浆料的精确重量。将小瓶在32℃孵育。在24小时、48小时和54小时时间点选择三个重复进行分析。在每个时间点,通过添加50微升的40%H2SO4来终止发酵,随后离心,并且通过0.45微米过滤器过滤。使用HPLC测定乙醇和低聚糖浓度。
如下表结果所示,与对照或单独的内切蛋白酶相比,内切蛋白酶与外肽酶的组合增加了乙醇产量,具有统计学显著性。特别地,用来自简青霉的外肽酶处理显著增强了酵母发酵速率,如24小时所示,乙醇滴度高得多。
用不含或含有外肽酶的内切蛋白酶处理24小时的乙醇产量。
处理 乙醇(g/l)
1.对照 84.9
2.仅内切蛋白酶 88.0
3.内切蛋白酶+外肽酶 91.1
用不含或含有外肽酶的内切蛋白酶处理48小时的乙醇产量。
处理 乙醇(g/l)
1.对照 131.2
2.仅内切蛋白酶 132.0
3.内切蛋白酶+外肽酶 132.6
到达48小时时发酵完成,并且54小时后乙醇滴度无进一步增加。
实例3.来自外肽酶三肽氨基肽酶与内切蛋白酶组合用于同时糖化和发酵方法中 增加乙醇滴度的效果
液化在Labomat BFA-24(马西斯公司(Mathis),瑞士)中进行。在罐中添加150.2g自制磨碎的玉米至250g自来水中并充分混合。目标干固体为约32.5%DS。将pH调节至pH5.5并使用水分天平(Mettler-Toledo)测量干固体。将α-淀粉酶X以0.045%(w/w)添加至玉米中,并在Labomat室中在85℃液化2.5小时。
液化后,将罐在冰浴中冷却至室温,然后将液化的醪转移到容器中,然后补充3ppm的青霉素和350ppm的尿素。通过小规模发酵进行同时糖化和发酵(SSF)。将大约5g每种上述液化的玉米浆料添加至15ml管制瓶中。每个小瓶用添加0.6AGU/gDS的葡糖淀粉酶共混物A和适当量的来自大型亚灰树花菌的内切蛋白酶(SEQ ID NO:2),含有或不含三肽酰氨肽酶外切蛋白酶,外切蛋白酶1、2、3和4其成熟形式在本文中分别披露为SEQ ID NO:20、SEQ IDNO:22、SEQ ID NO:24和SEQ ID NO:26。组合如下所示,然后每5g浆料添加20微升水合酵母。作为对照,仅添加葡糖淀粉酶并且不添加内切蛋白酶或外切蛋白酶。实际葡糖淀粉酶和蛋白酶剂量基于每个小瓶中的玉米浆料的精确重量。将小瓶在32℃孵育。进行三次重复以进行52小时时间点分析。在每个时间点,通过添加50微升的40%H2SO4来终止发酵,离心,并且通过0.45微米过滤器过滤。使用HPLC测定乙醇和低聚糖浓度。
外切蛋白酶1、2、3或4,其为SEQ ID NO:20、SEQ ID NO:22、SEQ ID NO:24、和SEQID NO:26。
SEQ ID NO:20 米曲霉
SEQ ID NO:22 里氏木霉
SEQ ID NO:24 嗜热嗜热子囊菌
SEQ ID NO:26 疏棉状嗜热丝孢菌
如下表结果所示,与单独的内切蛋白酶相比,内切蛋白酶与外切蛋白酶的组合增加了乙醇产量,并且具有统计学显著性。
用不含或含有外切蛋白酶的内切蛋白酶的不同处理52小时的乙醇产量。
实例4.来自简青霉的S10肽酶的克隆和表达
基因
分离真菌菌株并基于分类为简青霉的形态和分子特性两者(ITS测序)。简青霉菌株注释为简青霉菌株NN044175并进行全基因组测序。S10肽酶多肽编码序列的基因组DNA序列在简青霉菌株NN044175的基因组中鉴定,并且基因组DNA序列和诱导的氨基酸序列分别显示在SEQ ID NO:18和SEQ ID NO:6中。1618个核苷酸的基因组DNA序列分别含有53bp的(核苷酸246至298)、44bp(核苷酸630至673)、51bp(核苷酸1188至1238)和48bp(核苷酸1506至1553)的4个内含子。该基因组DNA片段编码具有473个氨基酸的多肽。互补DNA序列示出于SEQ ID NO:8
表达载体
曲霉属表达载体pDau109(WO 2005/042735)由以下组成:基于与构巢曲霉磷酸甘油醛异构酶非翻译前导序列(Pna2/tpl)融合的部分重复的黑曲霉中性淀粉酶II(NA2)启动子和黑曲霉淀粉转葡糖苷酶终止子(Tamg)。载体上还存在来自构巢曲霉的曲霉选择标记amdS和氨苄青霉素抗性基因(β内酰胺酶),该曲霉选择标记amdS能够在作为唯一氮源的乙酰胺上生长,并且该氨苄青霉素抗性基因(β内酰胺酶)允许使用商业上可获得的和高度感受态的菌株在通常使用的LB氨苄西林板上容易地选择阳性重组大肠杆菌克隆。pDau109含有位于启动子区域和终止子之间的多克隆位点,允许在启动子区域前插入感兴趣的基因。
表达克隆
编码简青霉S10肽酶(SEQ ID NO:18)的基因从分离自简青霉菌株NN044175的基因组DNA中进行PCR扩增。使用独特的限制性位点BamHI和HindIII将编码简青霉S10肽酶(SEQID NO:18)的PCR产物克隆至pDau109曲霉属表达载体,并转化到大肠杆菌(Top10,英杰公司(Invitrogen))中。将含有插入的表达质粒从大肠杆菌转化体中纯化出来,并用载体引物和基因特异性引物进行测序以便确定没有PCR错误的代表性质粒表达克隆。将质粒表达克隆转化到米曲霉中,并使含有整合表达构建体的重组米曲霉克隆在液体培养基中生长。通过SDS-page验证简青霉S10肽酶的表达。在纯化之前,将含有酶的上清液无菌过滤。
实例5.简青霉S10肽酶(SEQ ID NO:6)的表征。
酶:在SEQ ID NO:7中披露简青霉S10成熟肽酶。
测定:
使用基于Z-Ala-Lys-OH的终点测定法获得酶的pH曲线和pH 5的温度-活性曲线。对于pH-稳定性曲线,将蛋白酶在测定缓冲液中稀释10x,并在37℃处孵育2小时。孵育以后,在分析剩余活性之前,将酶样品转移到pH 5。
重点Z-Ala-Xxx-OH测定:
Z-Ala-Xxx-OH底物:
Z-Ala-Ala-OH(巴亨公司(Bachem)C-1045)。
Z-Ala-Leu-OH(巴亨公司(Bachem)C-3155)。
Z-Ala-Glu-OH(巴亨公司(Bachem)C-1075)。
Z-Ala-Lys-OH(巴亨公司(Bachem)C-1140)。
Z-Ala-Phe-OH(巴亨公司(Bachem)C-1155)。
Z-Ala-His-OH(巴亨公司(Bachem)C-1120)。
Z-Ala-Met-OH(巴亨公司(Bachem)C-1145)
温度:除温度活动曲线外37℃。
测定缓冲液:100mM琥珀酸、100mM HEPES、100mM CHES、100mM CABS、1mM CaCl2、150mM KCl、0.01%Triton X-100,使用HCl或NaOH调节至pH值:2.0、3.0、4.0、5.0、6.0、7.0、8.0、9.0、10.0及11.0。
将100μl Z-Ala-Xxx-OH底物(50mg溶解在1.0ml DMSO中,并进一步稀释25倍,于0.01%的Triton X-100中)与在Eppendorf管中150μl测定缓冲液混合,并置于冰上。添加50μl肽酶样品(稀释在0.01%Triton X-100中)。通过将Eppendorf管转移至设定为测定温度的Eppendorf恒温混匀仪中来启动测定。将管在艾本德恒温混匀仪上在最高振摇速率下孵育15分钟。然后将管转移回冰浴,并且当管已经冷却,添加500μl停止试剂(17.9g TCA+29.9g乙酸钠三水合物+19.0ml浓缩CH3COOH和去离子水添加至500ml)并将管涡旋并在室温放置15分钟(以确保完全沉淀)。将管离心(15000x g,3分钟,室温),将30μl上清液转移到微量滴定板中并添加225μl新制备的OPA-试剂(将3.81g四硼酸二钠和1.00g SDS溶解在约80ml去离子水中-在使用前,添加溶解在2ml乙醇中的80mg邻二醛,然后添加1.0ml10%(w/v)DTE,最后用去离子水调节终体积至100ml)。2分钟后,在MTP读数器中读取A340。相对于适当的盲试样(blind)(底物试样和酶试样)的A340测量是羧肽酶活性的测量。
披露为SEQ ID NO:7(简青霉)的蛋白酶显示在约pH 5具有最优活性,在pH 3-6具有最优的pH稳定性曲线,并且在pH 5在约55℃处具有温度最优。
确定N-末端开始于SEQ ID NO:6中的位置46,因此成熟蛋白酶对应于SEQ ID NO:7。
实例6.来自黑曲霉的外肽酶与来自大型亚灰树花菌的内切蛋白酶组合用于同时 糖化和发酵方法中增加乙醇滴度的效果
使用α-淀粉酶X(pH=5.5,T=85℃)的液化醪用于实验。通过水分天平(Mettler-Toledo)测定的干固体为约30%DS,将pH调节至pH 5.0,并且随后补充3ppm青霉素和500ppm尿素。通过在T=32℃的小规模发酵进行同时糖化和发酵(SSF)。将约5g工业液化的玉米醪添加至15ml管制瓶中。向每个瓶中添加0.6AGU/gDS的葡糖淀粉酶共混物A和适当量的来自大大型亚灰树花菌的内切蛋白酶(SEQ ID NO:2),含有或不含来自黑曲霉的外肽酶,即羧肽酶(SEQ ID NO:31),如下表所示,然后每5g浆料添加100微升水合酵母。作为对照,葡糖淀粉酶共混物A不添加内切蛋白酶或外肽酶。实际葡糖淀粉酶和蛋白酶剂量基于每个小瓶中的玉米浆料的精确重量。将小瓶在32℃孵育。在SSF期间使用每种处理的三个重复。50小时后,通过添加50微升的40%H2SO4来终止发酵,随后离心,并且通过0.45微米过滤器过滤。使用HPLC测定乙醇和低聚糖浓度。
如下表结果所示,与对照或单独的内切蛋白酶相比,内切蛋白酶与外肽酶的组合增加了乙醇产量,具有统计学显著性。
用不含或含有外肽酶的内切蛋白酶在50小时的乙醇产量。
处理 乙醇(g/l)
1.对照 121.9
2.仅内切蛋白酶 123.6
3.内切蛋白酶+外肽酶 124.5
实例7.来自黑曲霉的外肽酶或三肽氨基肽酶(TPAP)与来自大型亚灰树花菌的内 切蛋白酶组合用于同时糖化和发酵方法中增加乙醇滴度的效果
使用α-淀粉酶X(pH=5.5,T=85℃)的工业制备的液化醪用于实验。通过水分天平(Mettler-Toledo)测定的干固体为约30%DS,将pH调节至pH 5.0,并且随后补充3ppm青霉素和500ppm尿素。通过小规模发酵进行同时糖化和发酵(SSF)。将约5g工业液化的玉米醪添加至15ml管制瓶中。向每个瓶中添加0.6AGU/gDS的葡糖淀粉酶共混物A和适当量的来自大大型亚灰树花菌的内切蛋白酶(SEQ ID NO:2),含有或不含来自黑曲霉的外肽酶三肽氨基肽酶(SEQ ID NO:32),如下表所示,然后每5g浆料添加100微升水合酵母。作为对照,葡糖淀粉酶共混物A不添加内切蛋白酶或外肽酶。实际葡糖淀粉酶和蛋白酶剂量基于每个小瓶中的玉米浆料的精确重量。将小瓶在32℃孵育。在SSF期间使用每种处理的三个重复。50小时后,通过添加50微升的40%H2SO4来终止发酵,随后离心,并且通过0.45微米过滤器过滤。使用HPLC测定乙醇和低聚糖浓度。
如下表所示,与对照或单独的内切蛋白酶相比,内切蛋白酶与三肽氨基肽酶的组合增加了乙醇产量。
用不含或含有三肽氨基肽酶的内切蛋白酶50小时的乙醇产量。
处理 乙醇(g/l)
1.对照 121.9
2.仅内切蛋白酶 123.6
3.内切蛋白酶+外肽酶 124.4
序列表
<110> 诺维信公司
<120> 在SSF方法中组合使用至少一种内切蛋白酶和至少一种外切蛋白酶以改善乙醇产量
<130> 14036-WO-PCT[2]
<160> 32
<170> 专利版本 3.5
<210> 1
<211> 564
<212> PRT
<213> 大型亚灰树花菌
<400> 1
Met Val Ala Thr Ser Leu Leu Val Ala Ser Leu Phe Thr Leu Ala Leu
1 5 10 15
Gly Thr Pro Thr Gly Arg Asn Leu Lys Leu His Glu Ala Arg Glu Asp
20 25 30
Leu Pro Ala Gly Phe Ser Leu Arg Gly Ala Ala Ser Pro Asp Thr Thr
35 40 45
Leu Lys Leu Arg Ile Ala Leu Val Gln Asn Asn Phe Ala Glu Leu Glu
50 55 60
Asp Lys Leu Tyr Asp Val Ser Thr Pro Ser Ser Ala Asn Tyr Gly Asn
65 70 75 80
His Leu Ser Lys Glu Glu Val Glu Gln Tyr Ile Ala Pro Ala Pro Glu
85 90 95
Ser Val Lys Ala Val Asn Ala Trp Leu Thr Glu Asn Gly Leu Asp Ala
100 105 110
His Thr Ile Ser Pro Ala Gly Asp Trp Leu Ala Phe Glu Val Pro Val
115 120 125
Ser Lys Ala Asn Glu Leu Phe Asp Ala Asp Phe Ser Val Phe Thr His
130 135 140
Asp Glu Ser Gly Leu Glu Ala Ile Arg Thr Leu Ala Tyr Ser Ile Pro
145 150 155 160
Ala Glu Leu Gln Gly His Leu Asp Leu Val His Pro Thr Val Thr Phe
165 170 175
Pro Asn Pro Asn Ala His Leu Pro Val Val Arg Ser Thr Gln Pro Ile
180 185 190
Arg Asn Leu Thr Gly Arg Ala Ile Pro Ala Ser Cys Ala Ser Thr Ile
195 200 205
Thr Pro Ala Cys Leu Gln Ala Ile Tyr Gly Ile Pro Thr Thr Lys Ala
210 215 220
Thr Gln Ser Ser Asn Lys Leu Ala Val Ser Gly Phe Ile Asp Gln Phe
225 230 235 240
Ala Asn Lys Ala Asp Leu Lys Ser Phe Leu Ala Gln Phe Arg Lys Asp
245 250 255
Ile Ser Ser Ser Thr Thr Phe Ser Leu Gln Thr Leu Asp Gly Gly Glu
260 265 270
Asn Asp Gln Ser Pro Ser Glu Ala Gly Ile Glu Ala Asn Leu Asp Ile
275 280 285
Gln Tyr Thr Val Gly Leu Ala Thr Gly Val Pro Thr Thr Phe Ile Ser
290 295 300
Val Gly Asp Asp Phe Gln Asp Gly Asn Leu Glu Gly Phe Leu Asp Ile
305 310 315 320
Ile Asn Phe Leu Leu Gly Glu Ser Asn Pro Pro Gln Val Leu Thr Thr
325 330 335
Ser Tyr Gly Gln Asn Glu Asn Thr Ile Ser Ala Lys Leu Ala Asn Gln
340 345 350
Leu Cys Asn Ala Tyr Ala Gln Leu Gly Ala Arg Gly Thr Ser Ile Leu
355 360 365
Phe Ala Ser Gly Asp Gly Gly Val Ser Gly Ser Gln Ser Ala His Cys
370 375 380
Ser Asn Phe Val Pro Thr Phe Pro Ser Gly Cys Pro Phe Met Thr Ser
385 390 395 400
Val Gly Ala Thr Gln Gly Val Ser Pro Glu Thr Ala Ala Ala Phe Ser
405 410 415
Ser Gly Gly Phe Ser Asn Val Phe Gly Ile Pro Ser Tyr Gln Ala Ser
420 425 430
Ala Val Ser Gly Tyr Leu Ser Ala Leu Gly Ser Thr Asn Ser Gly Lys
435 440 445
Phe Asn Arg Ser Gly Arg Gly Phe Pro Asp Val Ser Thr Gln Gly Val
450 455 460
Asp Phe Gln Ile Val Ser Gly Gly Gln Thr Ile Gly Val Asp Gly Thr
465 470 475 480
Ser Cys Ala Ser Pro Thr Phe Ala Ser Val Ile Ser Leu Val Asn Asp
485 490 495
Arg Leu Ile Ala Ala Gly Lys Ser Pro Leu Gly Phe Leu Asn Pro Phe
500 505 510
Leu Tyr Ser Ser Ala Gly Lys Ala Ala Leu Asn Asp Val Thr Ser Gly
515 520 525
Ser Asn Pro Gly Cys Ser Thr Asn Gly Phe Pro Ala Lys Ala Gly Trp
530 535 540
Asp Pro Val Thr Gly Leu Gly Thr Pro Asn Phe Ala Lys Leu Leu Thr
545 550 555 560
Ala Val Gly Leu
<210> 2
<211> 366
<212> PRT
<213> 大型亚灰树花菌
<400> 2
Ala Ile Pro Ala Ser Cys Ala Ser Thr Ile Thr Pro Ala Cys Leu Gln
1 5 10 15
Ala Ile Tyr Gly Ile Pro Thr Thr Lys Ala Thr Gln Ser Ser Asn Lys
20 25 30
Leu Ala Val Ser Gly Phe Ile Asp Gln Phe Ala Asn Lys Ala Asp Leu
35 40 45
Lys Ser Phe Leu Ala Gln Phe Arg Lys Asp Ile Ser Ser Ser Thr Thr
50 55 60
Phe Ser Leu Gln Thr Leu Asp Gly Gly Glu Asn Asp Gln Ser Pro Ser
65 70 75 80
Glu Ala Gly Ile Glu Ala Asn Leu Asp Ile Gln Tyr Thr Val Gly Leu
85 90 95
Ala Thr Gly Val Pro Thr Thr Phe Ile Ser Val Gly Asp Asp Phe Gln
100 105 110
Asp Gly Asn Leu Glu Gly Phe Leu Asp Ile Ile Asn Phe Leu Leu Gly
115 120 125
Glu Ser Asn Pro Pro Gln Val Leu Thr Thr Ser Tyr Gly Gln Asn Glu
130 135 140
Asn Thr Ile Ser Ala Lys Leu Ala Asn Gln Leu Cys Asn Ala Tyr Ala
145 150 155 160
Gln Leu Gly Ala Arg Gly Thr Ser Ile Leu Phe Ala Ser Gly Asp Gly
165 170 175
Gly Val Ser Gly Ser Gln Ser Ala His Cys Ser Asn Phe Val Pro Thr
180 185 190
Phe Pro Ser Gly Cys Pro Phe Met Thr Ser Val Gly Ala Thr Gln Gly
195 200 205
Val Ser Pro Glu Thr Ala Ala Ala Phe Ser Ser Gly Gly Phe Ser Asn
210 215 220
Val Phe Gly Ile Pro Ser Tyr Gln Ala Ser Ala Val Ser Gly Tyr Leu
225 230 235 240
Ser Ala Leu Gly Ser Thr Asn Ser Gly Lys Phe Asn Arg Ser Gly Arg
245 250 255
Gly Phe Pro Asp Val Ser Thr Gln Gly Val Asp Phe Gln Ile Val Ser
260 265 270
Gly Gly Gln Thr Ile Gly Val Asp Gly Thr Ser Cys Ala Ser Pro Thr
275 280 285
Phe Ala Ser Val Ile Ser Leu Val Asn Asp Arg Leu Ile Ala Ala Gly
290 295 300
Lys Ser Pro Leu Gly Phe Leu Asn Pro Phe Leu Tyr Ser Ser Ala Gly
305 310 315 320
Lys Ala Ala Leu Asn Asp Val Thr Ser Gly Ser Asn Pro Gly Cys Ser
325 330 335
Thr Asn Gly Phe Pro Ala Lys Ala Gly Trp Asp Pro Val Thr Gly Leu
340 345 350
Gly Thr Pro Asn Phe Ala Lys Leu Leu Thr Ala Val Gly Leu
355 360 365
<210> 3
<211> 412
<212> PRT
<213> 强烈火球菌
<400> 3
Ala Glu Leu Glu Gly Leu Asp Glu Ser Ala Ala Gln Val Met Ala Thr
1 5 10 15
Tyr Val Trp Asn Leu Gly Tyr Asp Gly Ser Gly Ile Thr Ile Gly Ile
20 25 30
Ile Asp Thr Gly Ile Asp Ala Ser His Pro Asp Leu Gln Gly Lys Val
35 40 45
Ile Gly Trp Val Asp Phe Val Asn Gly Arg Ser Tyr Pro Tyr Asp Asp
50 55 60
His Gly His Gly Thr His Val Ala Ser Ile Ala Ala Gly Thr Gly Ala
65 70 75 80
Ala Ser Asn Gly Lys Tyr Lys Gly Met Ala Pro Gly Ala Lys Leu Ala
85 90 95
Gly Ile Lys Val Leu Gly Ala Asp Gly Ser Gly Ser Ile Ser Thr Ile
100 105 110
Ile Lys Gly Val Glu Trp Ala Val Asp Asn Lys Asp Lys Tyr Gly Ile
115 120 125
Lys Val Ile Asn Leu Ser Leu Gly Ser Ser Gln Ser Ser Asp Gly Thr
130 135 140
Asp Ala Leu Ser Gln Ala Val Asn Ala Ala Trp Asp Ala Gly Leu Val
145 150 155 160
Val Val Val Ala Ala Gly Asn Ser Gly Pro Asn Lys Tyr Thr Ile Gly
165 170 175
Ser Pro Ala Ala Ala Ser Lys Val Ile Thr Val Gly Ala Val Asp Lys
180 185 190
Tyr Asp Val Ile Thr Ser Phe Ser Ser Arg Gly Pro Thr Ala Asp Gly
195 200 205
Arg Leu Lys Pro Glu Val Val Ala Pro Gly Asn Trp Ile Ile Ala Ala
210 215 220
Arg Ala Ser Gly Thr Ser Met Gly Gln Pro Ile Asn Asp Tyr Tyr Thr
225 230 235 240
Ala Ala Pro Gly Thr Ser Met Ala Thr Pro His Val Ala Gly Ile Ala
245 250 255
Ala Leu Leu Leu Gln Ala His Pro Ser Trp Thr Pro Asp Lys Val Lys
260 265 270
Thr Ala Leu Ile Glu Thr Ala Asp Ile Val Lys Pro Asp Glu Ile Ala
275 280 285
Asp Ile Ala Tyr Gly Ala Gly Arg Val Asn Ala Tyr Lys Ala Ile Asn
290 295 300
Tyr Asp Asn Tyr Ala Lys Leu Val Phe Thr Gly Tyr Val Ala Asn Lys
305 310 315 320
Gly Ser Gln Thr His Gln Phe Val Ile Ser Gly Ala Ser Phe Val Thr
325 330 335
Ala Thr Leu Tyr Trp Asp Asn Ala Asn Ser Asp Leu Asp Leu Tyr Leu
340 345 350
Tyr Asp Pro Asn Gly Asn Gln Val Asp Tyr Ser Tyr Thr Ala Tyr Tyr
355 360 365
Asp Phe Glu Lys Val Gly Tyr Tyr Asn Pro Thr Asp Gly Thr Trp Thr
370 375 380
Ile Lys Val Val Ser Tyr Ser Gly Ser Ala Asn Tyr Gln Val Asp Val
385 390 395 400
Val Ser Asp Gly Ser Leu Ser Gln Pro Gly Ser Ser
405 410
<210> 4
<211> 542
<212> PRT
<213> 米曲霉
<400> 4
Met Arg Val Leu Pro Ala Thr Leu Leu Val Gly Ala Ala Ser Ala Ala
1 5 10 15
Val Pro Pro Leu Gln Gln Val Leu Gly Arg Pro Glu Glu Gly Met Ser
20 25 30
Phe Ser Lys Pro Leu His Ala Phe Gln Glu Gln Leu Lys Thr Leu Ser
35 40 45
Glu Asp Ala Arg Lys Leu Trp Asp Glu Val Ala Asn Tyr Phe Pro Asp
50 55 60
Ser Met Asp His Ser Pro Ile Phe Ser Leu Pro Lys Lys His Thr Arg
65 70 75 80
Arg Pro Asp Ser His Trp Asp His Ile Val Arg Gly Ser Asp Val Gln
85 90 95
Lys Ile Trp Val Asn Asn Ala Asp Gly Glu Lys Glu Arg Glu Ile Asp
100 105 110
Gly Lys Leu Glu Ala Tyr Asp Leu Arg Ile Lys Lys Ala Asp Pro Ser
115 120 125
Ala Leu Gly Ile Asp Pro Asn Val Lys Gln Tyr Thr Gly Tyr Leu Asp
130 135 140
Asp Asn Gly Asn Asp Lys His Leu Phe Tyr Trp Phe Phe Glu Ser Arg
145 150 155 160
Asn Asp Pro Lys Asn Asp Pro Val Val Leu Trp Leu Asn Gly Gly Pro
165 170 175
Gly Cys Ser Ser Leu Thr Gly Leu Phe Met Glu Leu Gly Pro Ser Ser
180 185 190
Ile Asp Glu Asn Ile Lys Pro Val Tyr Asn Asp Phe Ser Trp Asn Ser
195 200 205
Asn Ala Ser Val Ile Phe Leu Asp Gln Pro Val Asn Val Gly Tyr Ser
210 215 220
Tyr Ser Gly Ser Ala Val Ser Asp Thr Val Ala Ala Gly Lys Asp Val
225 230 235 240
Tyr Ala Leu Leu Ser Leu Phe Phe Lys Gln Phe Pro Glu Tyr Ala Glu
245 250 255
Gln Asp Phe His Ile Ala Gly Glu Ser Tyr Ala Gly His Tyr Ile Pro
260 265 270
Val Phe Ala Ser Glu Ile Leu Ala His Lys Asn Arg Asn Ile Asn Leu
275 280 285
Lys Ser Val Leu Ile Gly Asn Gly Leu Thr Asp Gly Leu Thr Gln Tyr
290 295 300
Gly Tyr Tyr Arg Pro Met Gly Cys Gly Glu Gly Gly Tyr Lys Ala Val
305 310 315 320
Leu Asp Glu Ala Thr Cys Glu Ser Met Asp Asn Ala Leu Pro Arg Cys
325 330 335
Arg Ser Met Ile Glu Ser Cys Tyr Asn Ser Glu Ser Ala Trp Val Cys
340 345 350
Val Pro Ala Ser Ile Tyr Cys Asn Asn Ala Leu Ile Gly Pro Tyr Gln
355 360 365
Arg Thr Gly Gln Asn Val Tyr Asp Val Arg Ser Lys Cys Glu Asp Glu
370 375 380
Ser Asn Leu Cys Tyr Lys Gly Met Gly Tyr Val Ser Glu Tyr Leu Asn
385 390 395 400
Lys Ala Glu Val Arg Glu Ala Val Gly Ala Glu Val Gly Gly Tyr Asp
405 410 415
Ser Cys Asn Phe Asp Ile Asn Arg Asn Phe Leu Phe His Gly Asp Trp
420 425 430
Met Lys Pro Tyr His Arg Leu Val Pro Gly Leu Leu Glu Gln Ile Pro
435 440 445
Val Leu Ile Tyr Ala Gly Asp Ala Asp Tyr Ile Cys Asn Trp Leu Gly
450 455 460
Asn Lys Ala Trp Thr Glu Ala Leu Glu Trp Pro Gly Gln Lys Glu Tyr
465 470 475 480
Ala Ser Ala Glu Leu Glu Asp Leu Lys Ile Glu Gln Asn Glu His Thr
485 490 495
Gly Lys Lys Ile Gly Gln Val Lys Ser His Gly Asn Phe Thr Phe Met
500 505 510
Arg Leu Tyr Gly Gly Gly His Met Val Pro Met Asp Gln Pro Glu Ala
515 520 525
Ser Leu Glu Phe Phe Asn Arg Trp Leu Gly Gly Glu Trp Phe
530 535 540
<210> 5
<211> 419
<212> PRT
<213> 米曲霉
<400> 5
Lys Ala Asp Pro Ser Ala Leu Gly Ile Asp Pro Asn Val Lys Gln Tyr
1 5 10 15
Thr Gly Tyr Leu Asp Asp Asn Gly Asn Asp Lys His Leu Phe Tyr Trp
20 25 30
Phe Phe Glu Ser Arg Asn Asp Pro Lys Asn Asp Pro Val Val Leu Trp
35 40 45
Leu Asn Gly Gly Pro Gly Cys Ser Ser Leu Thr Gly Leu Phe Met Glu
50 55 60
Leu Gly Pro Ser Ser Ile Asp Glu Asn Ile Lys Pro Val Tyr Asn Asp
65 70 75 80
Phe Ser Trp Asn Ser Asn Ala Ser Val Ile Phe Leu Asp Gln Pro Val
85 90 95
Asn Val Gly Tyr Ser Tyr Ser Gly Ser Ala Val Ser Asp Thr Val Ala
100 105 110
Ala Gly Lys Asp Val Tyr Ala Leu Leu Ser Leu Phe Phe Lys Gln Phe
115 120 125
Pro Glu Tyr Ala Glu Gln Asp Phe His Ile Ala Gly Glu Ser Tyr Ala
130 135 140
Gly His Tyr Ile Pro Val Phe Ala Ser Glu Ile Leu Ala His Lys Asn
145 150 155 160
Arg Asn Ile Asn Leu Lys Ser Val Leu Ile Gly Asn Gly Leu Thr Asp
165 170 175
Gly Leu Thr Gln Tyr Gly Tyr Tyr Arg Pro Met Gly Cys Gly Glu Gly
180 185 190
Gly Tyr Lys Ala Val Leu Asp Glu Ala Thr Cys Glu Ser Met Asp Asn
195 200 205
Ala Leu Pro Arg Cys Arg Ser Met Ile Glu Ser Cys Tyr Asn Ser Glu
210 215 220
Ser Ala Trp Val Cys Val Pro Ala Ser Ile Tyr Cys Asn Asn Ala Leu
225 230 235 240
Ile Gly Pro Tyr Gln Arg Thr Gly Gln Asn Val Tyr Asp Val Arg Ser
245 250 255
Lys Cys Glu Asp Glu Ser Asn Leu Cys Tyr Lys Gly Met Gly Tyr Val
260 265 270
Ser Glu Tyr Leu Asn Lys Ala Glu Val Arg Glu Ala Val Gly Ala Glu
275 280 285
Val Gly Gly Tyr Asp Ser Cys Asn Phe Asp Ile Asn Arg Asn Phe Leu
290 295 300
Phe His Gly Asp Trp Met Lys Pro Tyr His Arg Leu Val Pro Gly Leu
305 310 315 320
Leu Glu Gln Ile Pro Val Leu Ile Tyr Ala Gly Asp Ala Asp Tyr Ile
325 330 335
Cys Asn Trp Leu Gly Asn Lys Ala Trp Thr Glu Ala Leu Glu Trp Pro
340 345 350
Gly Gln Lys Glu Tyr Ala Ser Ala Glu Leu Glu Asp Leu Lys Ile Glu
355 360 365
Gln Asn Glu His Thr Gly Lys Lys Ile Gly Gln Val Lys Ser His Gly
370 375 380
Asn Phe Thr Phe Met Arg Leu Tyr Gly Gly Gly His Met Val Pro Met
385 390 395 400
Asp Gln Pro Glu Ala Ser Leu Glu Phe Phe Asn Arg Trp Leu Gly Gly
405 410 415
Glu Trp Phe
<210> 6
<211> 473
<212> PRT
<213> 简青霉
<400> 6
Met Arg His Gln Lys Trp Leu Leu Pro Leu Leu Ala Ala Gly Ala Arg
1 5 10 15
Ala Ala Pro Ala Ser Thr Ala Lys Asp Ser Val Ser Ser Val Val Lys
20 25 30
Asn Gly Val Lys Tyr Thr Val Phe Glu His Ala Ala Thr Gly Ala Lys
35 40 45
Met Glu Phe Val Lys Asn Ser Gly Ile Cys Glu Thr Thr Pro Gly Val
50 55 60
Asn Gln Tyr Ser Gly Tyr Leu Ser Val Gly Ser Asn Met Asn Met Trp
65 70 75 80
Phe Trp Phe Phe Glu Ala Arg Asn Asn Pro Gln Gln Ala Pro Leu Ala
85 90 95
Ala Trp Phe Asn Gly Gly Pro Gly Cys Ser Ser Met Ile Gly Leu Phe
100 105 110
Gln Glu Asn Gly Pro Cys His Phe Val Asn Gly Asp Ser Thr Pro Ser
115 120 125
Leu Asn Glu Tyr Ser Trp Asn Asn Tyr Ala Asn Met Leu Tyr Val Asp
130 135 140
Gln Pro Ile Gly Val Gly Phe Ser Tyr Gly Thr Asp Asp Val Thr Ser
145 150 155 160
Thr Val Thr Ala Ala Pro Tyr Val Trp Lys Leu Leu Gln Ala Phe Tyr
165 170 175
Ala Gln Phe Pro Glu Tyr Glu Ser Arg Asp Phe Ala Ile Phe Thr Glu
180 185 190
Ser Tyr Gly Gly His Tyr Gly Pro Glu Phe Ala Ser Tyr Ile Gln Glu
195 200 205
Gln Asn Ser Ala Ile Lys Thr Gly Ser Ile Ser Gly Glu Asn Ile Asn
210 215 220
Leu Val Ala Leu Gly Val Asn Asn Gly Trp Ile Asp Ser Thr Ile Gln
225 230 235 240
Glu Lys Ala Tyr Ile Asp Phe Ser Tyr Asn Asn Ser Tyr Gln Gln Leu
245 250 255
Ile Asp Asp Ser Gln Arg Thr Ser Leu Leu Ser Ala Tyr Asn Ser Gln
260 265 270
Cys Leu Pro Ala Ile Gln Lys Cys Thr Lys Ser Gly Ser Asn Ser Asp
275 280 285
Cys Gln Asn Ala Asp Ser Val Cys Tyr Asn Lys Ile Glu Gly Pro Ile
290 295 300
Ser Ser Ser Gly Asp Trp Asp Val Tyr Asp Ile Arg Glu Pro Ser Asn
305 310 315 320
Asp Pro Tyr Pro Pro Ser Thr Tyr Ser Thr Tyr Leu Ser Asn Ala Asp
325 330 335
Val Val Lys Ala Ile Gly Ala Gln Ser Ser Tyr Gln Glu Cys Pro Asn
340 345 350
Gly Pro Tyr Asn Lys Phe Ala Ser Thr Gly Asp Asn Pro Arg Ser Phe
355 360 365
Leu Ser Thr Leu Ser Ser Val Val Lys Ser Gly Ile Asn Val Leu Val
370 375 380
Trp Ala Gly Asp Ala Asp Trp Ile Cys Asn Trp Leu Gly Asn Tyr Glu
385 390 395 400
Val Ala Asn Ala Val Asp Phe Ser Gly His Thr Glu Phe Ser Ala Lys
405 410 415
Asp Leu Ala Pro Tyr Thr Val Asn Gly Thr Glu Lys Gly Met Phe Lys
420 425 430
Asn Val Ala Asn Phe Ser Phe Leu Lys Val Tyr Gly Ala Gly His Glu
435 440 445
Val Pro Tyr Tyr Gln Pro Asp Thr Ala Leu Gln Val Phe Glu Gln Val
450 455 460
Leu Gln Asn Lys Pro Ile Phe Ser Thr
465 470
<210> 7
<211> 428
<212> PRT
<213> 简青霉
<400> 7
Gly Ala Lys Met Glu Phe Val Lys Asn Ser Gly Ile Cys Glu Thr Thr
1 5 10 15
Pro Gly Val Asn Gln Tyr Ser Gly Tyr Leu Ser Val Gly Ser Asn Met
20 25 30
Asn Met Trp Phe Trp Phe Phe Glu Ala Arg Asn Asn Pro Gln Gln Ala
35 40 45
Pro Leu Ala Ala Trp Phe Asn Gly Gly Pro Gly Cys Ser Ser Met Ile
50 55 60
Gly Leu Phe Gln Glu Asn Gly Pro Cys His Phe Val Asn Gly Asp Ser
65 70 75 80
Thr Pro Ser Leu Asn Glu Tyr Ser Trp Asn Asn Tyr Ala Asn Met Leu
85 90 95
Tyr Val Asp Gln Pro Ile Gly Val Gly Phe Ser Tyr Gly Thr Asp Asp
100 105 110
Val Thr Ser Thr Val Thr Ala Ala Pro Tyr Val Trp Lys Leu Leu Gln
115 120 125
Ala Phe Tyr Ala Gln Phe Pro Glu Tyr Glu Ser Arg Asp Phe Ala Ile
130 135 140
Phe Thr Glu Ser Tyr Gly Gly His Tyr Gly Pro Glu Phe Ala Ser Tyr
145 150 155 160
Ile Gln Glu Gln Asn Ser Ala Ile Lys Thr Gly Ser Ile Ser Gly Glu
165 170 175
Asn Ile Asn Leu Val Ala Leu Gly Val Asn Asn Gly Trp Ile Asp Ser
180 185 190
Thr Ile Gln Glu Lys Ala Tyr Ile Asp Phe Ser Tyr Asn Asn Ser Tyr
195 200 205
Gln Gln Leu Ile Asp Asp Ser Gln Arg Thr Ser Leu Leu Ser Ala Tyr
210 215 220
Asn Ser Gln Cys Leu Pro Ala Ile Gln Lys Cys Thr Lys Ser Gly Ser
225 230 235 240
Asn Ser Asp Cys Gln Asn Ala Asp Ser Val Cys Tyr Asn Lys Ile Glu
245 250 255
Gly Pro Ile Ser Ser Ser Gly Asp Trp Asp Val Tyr Asp Ile Arg Glu
260 265 270
Pro Ser Asn Asp Pro Tyr Pro Pro Ser Thr Tyr Ser Thr Tyr Leu Ser
275 280 285
Asn Ala Asp Val Val Lys Ala Ile Gly Ala Gln Ser Ser Tyr Gln Glu
290 295 300
Cys Pro Asn Gly Pro Tyr Asn Lys Phe Ala Ser Thr Gly Asp Asn Pro
305 310 315 320
Arg Ser Phe Leu Ser Thr Leu Ser Ser Val Val Lys Ser Gly Ile Asn
325 330 335
Val Leu Val Trp Ala Gly Asp Ala Asp Trp Ile Cys Asn Trp Leu Gly
340 345 350
Asn Tyr Glu Val Ala Asn Ala Val Asp Phe Ser Gly His Thr Glu Phe
355 360 365
Ser Ala Lys Asp Leu Ala Pro Tyr Thr Val Asn Gly Thr Glu Lys Gly
370 375 380
Met Phe Lys Asn Val Ala Asn Phe Ser Phe Leu Lys Val Tyr Gly Ala
385 390 395 400
Gly His Glu Val Pro Tyr Tyr Gln Pro Asp Thr Ala Leu Gln Val Phe
405 410 415
Glu Gln Val Leu Gln Asn Lys Pro Ile Phe Ser Thr
420 425
<210> 8
<211> 1422
<212> DNA
<213> 简青霉
<400> 8
atgcggcatc aaaagtggct actacctcta ctggcagccg gggctagagc tgctcccgca 60
agcacagcca aagatagcgt ctcgtctgtg gtcaaaaacg gcgtcaagta taccgtgttt 120
gagcatgcag cgaccggagc aaagatggag ttcgtcaaga actcgggcat ctgcgaaact 180
acccccgggg taaatcagta ctcaggatat ctgtctgttg ggagcaacat gaatatgtgg 240
ttctggttct tcgaagcacg gaataacccc caacaagctc ctctggctgc ctggtttaat 300
ggcggtcctg gatgctcttc catgatcggc ctgttccagg aaaatggccc ttgtcacttt 360
gtcaacgggg acagcactcc ctctttaaat gagtacagct ggaacaacta cgccaacatg 420
ctatacgttg accagcccat cggtgttggc ttttcctatg gtaccgacga tgtgactagc 480
acagtcactg ctgcgccata tgtctggaaa ctcctacaag cattctacgc acaattccca 540
gagtacgaaa gtcgcgattt cgccatattc accgagtctt atggtgggca ctatggcccc 600
gaattcgcct cgtacatcca agaacagaat tccgccatca agaccggatc tatctcggga 660
gaaaacatca acctggtcgc cctcggcgtt aacaacggct ggatcgactc cacaatccaa 720
gaaaaggcat atatcgattt cagttacaac aactcgtacc aacaactcat cgacgactcc 780
cagcgcacca gcctcctgag cgcctacaat agccaatgtc tccctgctat ccaaaagtgc 840
acaaaatcag gaagtaactc cgactgccag aatgcggata gtgtctgcta caataagatc 900
gagggaccga ttagtagttc gggtgactgg gacgtctatg atattcgtga gccgtcgaat 960
gatccctatc caccttcaac atactcgacc tatctctcca atgccgatgt tgtgaaggct 1020
attggtgcgc agtccagcta ccaggaatgt ccgaatgggc cgtataataa gtttgcgtca 1080
actggtgata accctcgatc tttcctctct acactctcca gcgtggtaaa atccggtatc 1140
aatgtgctag tctgggcggg tgacgccgac tggatctgca actggctcgg caactacgag 1200
gtcgccaacg cagtggactt ctcgggacat acagaattca gcgcaaagga cctggcgcca 1260
tacaccgtta atggcactga aaagggcatg ttcaagaatg tggctaattt ctcgttcttg 1320
aaggtgtatg gggcggggca tgaggttcct tactatcaac ccgacacggc gctgcaggtg 1380
tttgagcagg ttctccagaa taagccaatc ttctcgactt ga 1422
<210> 9
<211> 583
<212> PRT
<213> 人工
<220>
<223> 杂合α-淀粉酶
<400> 9
Ala Thr Ser Asp Asp Trp Lys Gly Lys Ala Ile Tyr Gln Leu Leu Thr
1 5 10 15
Asp Arg Phe Gly Arg Ala Asp Asp Ser Thr Ser Asn Cys Ser Asn Leu
20 25 30
Ser Asn Tyr Cys Gly Gly Thr Tyr Glu Gly Ile Thr Lys His Leu Asp
35 40 45
Tyr Ile Ser Gly Met Gly Phe Asp Ala Ile Trp Ile Ser Pro Ile Pro
50 55 60
Lys Asn Ser Asp Gly Gly Tyr His Gly Tyr Trp Ala Thr Asp Phe Tyr
65 70 75 80
Gln Leu Asn Ser Asn Phe Gly Asp Glu Ser Gln Leu Lys Ala Leu Ile
85 90 95
Gln Ala Ala His Glu Arg Asp Met Tyr Val Met Leu Asp Val Val Ala
100 105 110
Asn His Ala Gly Pro Thr Ser Asn Gly Tyr Ser Gly Tyr Thr Phe Gly
115 120 125
Asp Ala Ser Leu Tyr His Pro Lys Cys Thr Ile Asp Tyr Asn Asp Gln
130 135 140
Thr Ser Ile Glu Gln Cys Trp Val Ala Asp Glu Leu Pro Asp Ile Asp
145 150 155 160
Thr Glu Asn Ser Asp Asn Val Ala Ile Leu Asn Asp Ile Val Ser Gly
165 170 175
Trp Val Gly Asn Tyr Ser Phe Asp Gly Ile Arg Ile Asp Thr Val Lys
180 185 190
His Ile Arg Lys Asp Phe Trp Thr Gly Tyr Ala Glu Ala Ala Gly Val
195 200 205
Phe Ala Thr Gly Glu Val Phe Asn Gly Asp Pro Ala Tyr Val Gly Pro
210 215 220
Tyr Gln Lys Tyr Leu Pro Ser Leu Ile Asn Tyr Pro Met Tyr Tyr Ala
225 230 235 240
Leu Asn Asp Val Phe Val Ser Lys Ser Lys Gly Phe Ser Arg Ile Ser
245 250 255
Glu Met Leu Gly Ser Asn Arg Asn Ala Phe Glu Asp Thr Ser Val Leu
260 265 270
Thr Thr Phe Val Asp Asn His Asp Asn Pro Arg Phe Leu Asn Ser Gln
275 280 285
Ser Asp Lys Ala Leu Phe Lys Asn Ala Leu Thr Tyr Val Leu Leu Gly
290 295 300
Glu Gly Ile Pro Ile Val Tyr Tyr Gly Ser Glu Gln Gly Phe Ser Gly
305 310 315 320
Gly Ala Asp Pro Ala Asn Arg Glu Val Leu Trp Thr Thr Asn Tyr Asp
325 330 335
Thr Ser Ser Asp Leu Tyr Gln Phe Ile Lys Thr Val Asn Ser Val Arg
340 345 350
Met Lys Ser Asn Lys Ala Val Tyr Met Asp Ile Tyr Val Gly Asp Asn
355 360 365
Ala Tyr Ala Phe Lys His Gly Asp Ala Leu Val Val Leu Asn Asn Tyr
370 375 380
Gly Ser Gly Ser Thr Asn Gln Val Ser Phe Ser Val Ser Gly Lys Phe
385 390 395 400
Asp Ser Gly Ala Ser Leu Met Asp Ile Val Ser Asn Ile Thr Thr Thr
405 410 415
Val Ser Ser Asp Gly Thr Val Thr Phe Asn Leu Lys Asp Gly Leu Pro
420 425 430
Ala Ile Phe Thr Ser Ala Thr Gly Gly Thr Thr Thr Thr Ala Thr Pro
435 440 445
Thr Gly Ser Gly Ser Val Thr Ser Thr Ser Lys Thr Thr Ala Thr Ala
450 455 460
Ser Lys Thr Ser Thr Ser Thr Ser Ser Thr Ser Cys Thr Thr Pro Thr
465 470 475 480
Ala Val Ala Val Thr Phe Asp Leu Thr Ala Thr Thr Thr Tyr Gly Glu
485 490 495
Asn Ile Tyr Leu Val Gly Ser Ile Ser Gln Leu Gly Asp Trp Glu Thr
500 505 510
Ser Asp Gly Ile Ala Leu Ser Ala Asp Lys Tyr Thr Ser Ser Asp Pro
515 520 525
Leu Trp Tyr Val Thr Val Thr Leu Pro Ala Gly Glu Ser Phe Glu Tyr
530 535 540
Lys Phe Ile Arg Ile Glu Ser Asp Asp Ser Val Glu Trp Glu Ser Asp
545 550 555 560
Pro Asn Arg Glu Tyr Thr Val Pro Gln Ala Cys Gly Thr Ser Thr Ala
565 570 575
Thr Val Thr Asp Thr Trp Arg
580
<210> 10
<211> 556
<212> PRT
<213> 瓣环栓菌
<400> 10
Gln Ser Ser Ala Ala Asp Ala Tyr Val Ala Ser Glu Ser Pro Ile Ala
1 5 10 15
Lys Ala Gly Val Leu Ala Asn Ile Gly Pro Ser Gly Ser Lys Ser Asn
20 25 30
Gly Ala Lys Ala Gly Ile Val Ile Ala Ser Pro Ser Thr Ser Asn Pro
35 40 45
Asn Tyr Leu Tyr Thr Trp Thr Arg Asp Ser Ser Leu Val Phe Lys Ala
50 55 60
Leu Ile Asp Gln Phe Thr Thr Gly Glu Asp Thr Ser Leu Arg Thr Leu
65 70 75 80
Ile Asp Glu Phe Thr Ser Ala Glu Ala Ile Leu Gln Gln Val Pro Asn
85 90 95
Pro Ser Gly Thr Val Ser Thr Gly Gly Leu Gly Glu Pro Lys Phe Asn
100 105 110
Ile Asp Glu Thr Ala Phe Thr Asp Ala Trp Gly Arg Pro Gln Arg Asp
115 120 125
Gly Pro Ala Leu Arg Ala Thr Ala Ile Ile Thr Tyr Ala Asn Trp Leu
130 135 140
Leu Asp Asn Lys Asn Thr Thr Tyr Val Thr Asn Thr Leu Trp Pro Ile
145 150 155 160
Ile Lys Leu Asp Leu Asp Tyr Val Ala Ser Asn Trp Asn Gln Ser Thr
165 170 175
Phe Asp Leu Trp Glu Glu Ile Asn Ser Ser Ser Phe Phe Thr Thr Ala
180 185 190
Val Gln His Arg Ala Leu Arg Glu Gly Ala Thr Phe Ala Asn Arg Ile
195 200 205
Gly Gln Thr Ser Val Val Ser Gly Tyr Thr Thr Gln Ala Asn Asn Leu
210 215 220
Leu Cys Phe Leu Gln Ser Tyr Trp Asn Pro Thr Gly Gly Tyr Ile Thr
225 230 235 240
Ala Asn Thr Gly Gly Gly Arg Ser Gly Lys Asp Ala Asn Thr Val Leu
245 250 255
Thr Ser Ile His Thr Phe Asp Pro Ala Ala Gly Cys Asp Ala Val Thr
260 265 270
Phe Gln Pro Cys Ser Asp Lys Ala Leu Ser Asn Leu Lys Val Tyr Val
275 280 285
Asp Ala Phe Arg Ser Ile Tyr Ser Ile Asn Ser Gly Ile Ala Ser Asn
290 295 300
Ala Ala Val Ala Thr Gly Arg Tyr Pro Glu Asp Ser Tyr Met Gly Gly
305 310 315 320
Asn Pro Trp Tyr Leu Thr Thr Ser Ala Val Ala Glu Gln Leu Tyr Asp
325 330 335
Ala Leu Ile Val Trp Asn Lys Leu Gly Ala Leu Asn Val Thr Ser Thr
340 345 350
Ser Leu Pro Phe Phe Gln Gln Phe Ser Ser Gly Val Thr Val Gly Thr
355 360 365
Tyr Ala Ser Ser Ser Ser Thr Phe Lys Thr Leu Thr Ser Ala Ile Lys
370 375 380
Thr Phe Ala Asp Gly Phe Leu Ala Val Asn Ala Lys Tyr Thr Pro Ser
385 390 395 400
Asn Gly Gly Leu Ala Glu Gln Tyr Ser Arg Ser Asn Gly Ser Pro Val
405 410 415
Ser Ala Val Asp Leu Thr Trp Ser Tyr Ala Ala Ala Leu Thr Ser Phe
420 425 430
Ala Ala Arg Ser Gly Lys Thr Tyr Ala Ser Trp Gly Ala Ala Gly Leu
435 440 445
Thr Val Pro Thr Thr Cys Ser Gly Ser Gly Gly Ala Gly Thr Val Ala
450 455 460
Val Thr Phe Asn Val Gln Ala Thr Thr Val Phe Gly Glu Asn Ile Tyr
465 470 475 480
Ile Thr Gly Ser Val Pro Ala Leu Gln Asn Trp Ser Pro Asp Asn Ala
485 490 495
Leu Ile Leu Ser Ala Ala Asn Tyr Pro Thr Trp Ser Ile Thr Val Asn
500 505 510
Leu Pro Ala Ser Thr Thr Ile Glu Tyr Lys Tyr Ile Arg Lys Phe Asn
515 520 525
Gly Ala Val Thr Trp Glu Ser Asp Pro Asn Asn Ser Ile Thr Thr Pro
530 535 540
Ala Ser Gly Thr Phe Thr Gln Asn Asp Thr Trp Arg
545 550 555
<210> 11
<211> 591
<212> PRT
<213> 埃默森篮状菌
<400> 11
Ala Thr Gly Ser Leu Asp Ser Phe Leu Ala Thr Glu Thr Pro Ile Ala
1 5 10 15
Leu Gln Gly Val Leu Asn Asn Ile Gly Pro Asn Gly Ala Asp Val Ala
20 25 30
Gly Ala Ser Ala Gly Ile Val Val Ala Ser Pro Ser Arg Ser Asp Pro
35 40 45
Asn Tyr Phe Tyr Ser Trp Thr Arg Asp Ala Ala Leu Thr Ala Lys Tyr
50 55 60
Leu Val Asp Ala Phe Ile Ala Gly Asn Lys Asp Leu Glu Gln Thr Ile
65 70 75 80
Gln Gln Tyr Ile Ser Ala Gln Ala Lys Val Gln Thr Ile Ser Asn Pro
85 90 95
Ser Gly Asp Leu Ser Thr Gly Gly Leu Gly Glu Pro Lys Phe Asn Val
100 105 110
Asn Glu Thr Ala Phe Thr Gly Pro Trp Gly Arg Pro Gln Arg Asp Gly
115 120 125
Pro Ala Leu Arg Ala Thr Ala Leu Ile Ala Tyr Ala Asn Tyr Leu Ile
130 135 140
Asp Asn Gly Glu Ala Ser Thr Ala Asp Glu Ile Ile Trp Pro Ile Val
145 150 155 160
Gln Asn Asp Leu Ser Tyr Ile Thr Gln Tyr Trp Asn Ser Ser Thr Phe
165 170 175
Asp Leu Trp Glu Glu Val Glu Gly Ser Ser Phe Phe Thr Thr Ala Val
180 185 190
Gln His Arg Ala Leu Val Glu Gly Asn Ala Leu Ala Thr Arg Leu Asn
195 200 205
His Thr Cys Ser Asn Cys Val Ser Gln Ala Pro Gln Val Leu Cys Phe
210 215 220
Leu Gln Ser Tyr Trp Thr Gly Ser Tyr Val Leu Ala Asn Phe Gly Gly
225 230 235 240
Ser Gly Arg Ser Gly Lys Asp Val Asn Ser Ile Leu Gly Ser Ile His
245 250 255
Thr Phe Asp Pro Ala Gly Gly Cys Asp Asp Ser Thr Phe Gln Pro Cys
260 265 270
Ser Ala Arg Ala Leu Ala Asn His Lys Val Val Thr Asp Ser Phe Arg
275 280 285
Ser Ile Tyr Ala Ile Asn Ser Gly Ile Ala Glu Gly Ser Ala Val Ala
290 295 300
Val Gly Arg Tyr Pro Glu Asp Val Tyr Gln Gly Gly Asn Pro Trp Tyr
305 310 315 320
Leu Ala Thr Ala Ala Ala Ala Glu Gln Leu Tyr Asp Ala Ile Tyr Gln
325 330 335
Trp Lys Lys Ile Gly Ser Ile Ser Ile Thr Asp Val Ser Leu Pro Phe
340 345 350
Phe Gln Asp Ile Tyr Pro Ser Ala Ala Val Gly Thr Tyr Asn Ser Gly
355 360 365
Ser Thr Thr Phe Asn Asp Ile Ile Ser Ala Val Gln Thr Tyr Gly Asp
370 375 380
Gly Tyr Leu Ser Ile Val Glu Lys Tyr Thr Pro Ser Asp Gly Ser Leu
385 390 395 400
Thr Glu Gln Phe Ser Arg Thr Asp Gly Thr Pro Leu Ser Ala Ser Ala
405 410 415
Leu Thr Trp Ser Tyr Ala Ser Leu Leu Thr Ala Ser Ala Arg Arg Gln
420 425 430
Ser Val Val Pro Ala Ser Trp Gly Glu Ser Ser Ala Ser Ser Val Pro
435 440 445
Ala Val Cys Ser Ala Thr Ser Ala Thr Gly Pro Tyr Ser Thr Ala Thr
450 455 460
Asn Thr Val Trp Pro Ser Ser Gly Ser Gly Ser Ser Thr Thr Thr Ser
465 470 475 480
Ser Ala Pro Cys Thr Thr Pro Thr Ser Val Ala Val Thr Phe Asp Glu
485 490 495
Ile Val Ser Thr Ser Tyr Gly Glu Thr Ile Tyr Leu Ala Gly Ser Ile
500 505 510
Pro Glu Leu Gly Asn Trp Ser Thr Ala Ser Ala Ile Pro Leu Arg Ala
515 520 525
Asp Ala Tyr Thr Asn Ser Asn Pro Leu Trp Tyr Val Thr Val Asn Leu
530 535 540
Pro Pro Gly Thr Ser Phe Glu Tyr Lys Phe Phe Lys Asn Gln Thr Asp
545 550 555 560
Gly Thr Ile Val Trp Glu Asp Asp Pro Asn Arg Ser Tyr Thr Val Pro
565 570 575
Ala Tyr Cys Gly Gln Thr Thr Ala Ile Leu Asp Asp Ser Trp Gln
580 585 590
<210> 12
<211> 555
<212> PRT
<213> 血红密孔菌
<400> 12
Gln Ser Ser Ala Val Asp Ala Tyr Val Ala Ser Glu Ser Pro Ile Ala
1 5 10 15
Lys Gln Gly Val Leu Asn Asn Ile Gly Pro Asn Gly Ser Lys Ala His
20 25 30
Gly Ala Lys Ala Gly Ile Val Val Ala Ser Pro Ser Thr Glu Asn Pro
35 40 45
Asp Tyr Leu Tyr Thr Trp Thr Arg Asp Ser Ser Leu Val Phe Lys Leu
50 55 60
Leu Ile Asp Gln Phe Thr Ser Gly Asp Asp Thr Ser Leu Arg Gly Leu
65 70 75 80
Ile Asp Asp Phe Thr Ser Ala Glu Ala Ile Leu Gln Gln Val Ser Asn
85 90 95
Pro Ser Gly Thr Val Ser Thr Gly Gly Leu Gly Glu Pro Lys Phe Asn
100 105 110
Ile Asp Glu Thr Ala Phe Thr Gly Ala Trp Gly Arg Pro Gln Arg Asp
115 120 125
Gly Pro Ala Leu Arg Ala Thr Ser Ile Ile Arg Tyr Ala Asn Trp Leu
130 135 140
Leu Asp Asn Gly Asn Thr Thr Tyr Val Ser Asn Thr Leu Trp Pro Val
145 150 155 160
Ile Gln Leu Asp Leu Asp Tyr Val Ala Asp Asn Trp Asn Gln Ser Thr
165 170 175
Phe Asp Leu Trp Glu Glu Val Asp Ser Ser Ser Phe Phe Thr Thr Ala
180 185 190
Val Gln His Arg Ala Leu Arg Glu Gly Ala Thr Phe Ala Ser Arg Ile
195 200 205
Gly Gln Ser Ser Val Val Ser Gly Tyr Thr Thr Gln Ala Asp Asn Leu
210 215 220
Leu Cys Phe Leu Gln Ser Tyr Trp Asn Pro Ser Gly Gly Tyr Val Thr
225 230 235 240
Ala Asn Thr Gly Gly Gly Arg Ser Gly Lys Asp Ser Asn Thr Val Leu
245 250 255
Thr Ser Ile His Thr Phe Asp Pro Ala Ala Gly Cys Asp Ala Ala Thr
260 265 270
Phe Gln Pro Cys Ser Asp Lys Ala Leu Ser Asn Leu Lys Val Tyr Val
275 280 285
Asp Ala Phe Arg Ser Ile Tyr Thr Ile Asn Asn Gly Ile Ala Ser Asn
290 295 300
Ala Ala Val Ala Thr Gly Arg Tyr Pro Glu Asp Ser Tyr Met Gly Gly
305 310 315 320
Asn Pro Trp Tyr Leu Thr Thr Ser Ala Val Ala Glu Gln Leu Tyr Asp
325 330 335
Ala Leu Tyr Val Trp Asp Gln Leu Gly Gly Leu Asn Val Thr Ser Thr
340 345 350
Ser Leu Ala Phe Phe Gln Gln Phe Ala Ser Gly Leu Ser Thr Gly Thr
355 360 365
Tyr Ser Ala Ser Ser Ser Thr Tyr Ala Thr Leu Thr Ser Ala Ile Arg
370 375 380
Ser Phe Ala Asp Gly Phe Leu Ala Ile Asn Ala Lys Tyr Thr Pro Ala
385 390 395 400
Asp Gly Gly Leu Ala Glu Gln Tyr Ser Arg Asn Asp Gly Thr Pro Leu
405 410 415
Ser Ala Val Asp Leu Thr Trp Ser Tyr Ala Ala Ala Leu Thr Ala Phe
420 425 430
Ala Ala Arg Glu Gly Lys Thr Tyr Gly Ser Trp Gly Ala Ala Gly Leu
435 440 445
Thr Val Pro Ala Ser Cys Ser Gly Gly Gly Gly Ala Thr Val Ala Val
450 455 460
Thr Phe Asn Val Gln Ala Thr Thr Val Phe Gly Glu Asn Ile Tyr Ile
465 470 475 480
Thr Gly Ser Val Ala Ala Leu Gln Asn Trp Ser Pro Asp Asn Ala Leu
485 490 495
Ile Leu Ser Ala Ala Asn Tyr Pro Thr Trp Ser Ile Thr Val Asn Leu
500 505 510
Pro Ala Asn Thr Val Val Gln Tyr Lys Tyr Ile Arg Lys Phe Asn Gly
515 520 525
Gln Val Thr Trp Glu Ser Asp Pro Asn Asn Gln Ile Thr Thr Pro Ser
530 535 540
Gly Gly Ser Phe Thr Gln Asn Asp Val Trp Arg
545 550 555
<210> 13
<211> 556
<212> PRT
<213> 篱边粘褶菌
<400> 13
Gln Ser Val Asp Ser Tyr Val Ser Ser Glu Gly Pro Ile Ala Lys Ala
1 5 10 15
Gly Val Leu Ala Asn Ile Gly Pro Asn Gly Ser Lys Ala Ser Gly Ala
20 25 30
Ser Ala Gly Val Val Val Ala Ser Pro Ser Thr Ser Asp Pro Asp Tyr
35 40 45
Trp Tyr Thr Trp Thr Arg Asp Ser Ser Leu Val Phe Lys Ser Leu Ile
50 55 60
Asp Gln Tyr Thr Thr Gly Ile Asp Ser Thr Ser Ser Leu Arg Thr Leu
65 70 75 80
Ile Asp Asp Phe Val Thr Ala Glu Ala Asn Leu Gln Gln Val Ser Asn
85 90 95
Pro Ser Gly Thr Leu Thr Thr Gly Gly Leu Gly Glu Pro Lys Phe Asn
100 105 110
Val Asp Glu Thr Ala Phe Thr Gly Ala Trp Gly Arg Pro Gln Arg Asp
115 120 125
Gly Pro Ala Leu Arg Ser Thr Ala Leu Ile Thr Tyr Gly Asn Trp Leu
130 135 140
Leu Ser Asn Gly Asn Thr Ser Tyr Val Thr Ser Asn Leu Trp Pro Ile
145 150 155 160
Ile Gln Asn Asp Leu Gly Tyr Val Val Ser Tyr Trp Asn Gln Ser Thr
165 170 175
Tyr Asp Leu Trp Glu Glu Val Asp Ser Ser Ser Phe Phe Thr Thr Ala
180 185 190
Val Gln His Arg Ala Leu Arg Glu Gly Ala Ala Phe Ala Thr Ala Ile
195 200 205
Gly Gln Thr Ser Gln Val Ser Ser Tyr Thr Thr Gln Ala Asp Asn Leu
210 215 220
Leu Cys Phe Leu Gln Ser Tyr Trp Asn Pro Ser Gly Gly Tyr Ile Thr
225 230 235 240
Ala Asn Thr Gly Gly Gly Arg Ser Gly Lys Asp Ala Asn Thr Leu Leu
245 250 255
Ala Ser Ile His Thr Tyr Asp Pro Ser Ala Gly Cys Asp Ala Ala Thr
260 265 270
Phe Gln Pro Cys Ser Asp Lys Ala Leu Ser Asn Leu Lys Val Tyr Val
275 280 285
Asp Ser Phe Arg Ser Val Tyr Ser Ile Asn Ser Gly Val Ala Ser Asn
290 295 300
Ala Ala Val Ala Thr Gly Arg Tyr Pro Glu Asp Ser Tyr Gln Gly Gly
305 310 315 320
Asn Pro Trp Tyr Leu Thr Thr Phe Ala Val Ala Glu Gln Leu Tyr Asp
325 330 335
Ala Leu Asn Val Trp Glu Ser Gln Gly Ser Leu Glu Val Thr Ser Thr
340 345 350
Ser Leu Ala Phe Phe Gln Gln Phe Ser Ser Gly Val Thr Ala Gly Thr
355 360 365
Tyr Ser Ser Ser Ser Ser Thr Tyr Ser Thr Leu Thr Ser Ala Ile Lys
370 375 380
Asn Phe Ala Asp Gly Phe Val Ala Ile Asn Ala Lys Tyr Thr Pro Ser
385 390 395 400
Asn Gly Gly Leu Ala Glu Gln Tyr Ser Lys Ser Asp Gly Ser Pro Leu
405 410 415
Ser Ala Val Asp Leu Thr Trp Ser Tyr Ala Ser Ala Leu Thr Ala Phe
420 425 430
Glu Ala Arg Asn Asn Thr Gln Phe Ala Gly Trp Gly Ala Ala Gly Leu
435 440 445
Thr Val Pro Ser Ser Cys Ser Gly Asn Ser Gly Gly Pro Thr Val Ala
450 455 460
Val Thr Phe Asn Val Asn Ala Glu Thr Val Trp Gly Glu Asn Ile Tyr
465 470 475 480
Leu Thr Gly Ser Val Asp Ala Leu Glu Asn Trp Ser Ala Asp Asn Ala
485 490 495
Leu Leu Leu Ser Ser Ala Asn Tyr Pro Thr Trp Ser Ile Thr Val Asn
500 505 510
Leu Pro Ala Ser Thr Ala Ile Glu Tyr Lys Tyr Ile Arg Lys Asn Asn
515 520 525
Gly Ala Val Thr Trp Glu Ser Asp Pro Asn Asn Ser Ile Thr Thr Pro
530 535 540
Ala Ser Gly Ser Thr Thr Glu Asn Asp Thr Trp Arg
545 550 555
<210> 14
<211> 559
<212> PRT
<213> 密粘褶菌
<400> 14
Gln Ser Val Asp Ser Tyr Val Gly Ser Glu Gly Pro Ile Ala Lys Ala
1 5 10 15
Gly Val Leu Ala Asn Ile Gly Pro Asn Gly Ser Lys Ala Ser Gly Ala
20 25 30
Ala Ala Gly Val Val Val Ala Ser Pro Ser Lys Ser Asp Pro Asp Tyr
35 40 45
Trp Tyr Thr Trp Thr Arg Asp Ser Ser Leu Val Phe Lys Ser Leu Ile
50 55 60
Asp Gln Tyr Thr Thr Gly Ile Asp Ser Thr Ser Ser Leu Arg Ser Leu
65 70 75 80
Ile Asp Ser Phe Val Ile Ala Glu Ala Asn Ile Gln Gln Val Ser Asn
85 90 95
Pro Ser Gly Thr Leu Thr Thr Gly Gly Leu Gly Glu Pro Lys Phe Asn
100 105 110
Val Asp Glu Thr Ala Phe Thr Gly Ala Trp Gly Arg Pro Gln Arg Asp
115 120 125
Gly Pro Ala Leu Arg Ala Thr Ala Leu Ile Thr Tyr Gly Asn Trp Leu
130 135 140
Leu Ser Asn Gly Asn Thr Thr Trp Val Thr Ser Thr Leu Trp Pro Ile
145 150 155 160
Ile Gln Asn Asp Leu Asn Tyr Val Val Gln Tyr Trp Asn Gln Thr Thr
165 170 175
Phe Asp Leu Trp Glu Glu Val Asn Ser Ser Ser Phe Phe Thr Thr Ala
180 185 190
Val Gln His Arg Ala Leu Arg Glu Gly Ala Ala Phe Ala Thr Lys Ile
195 200 205
Gly Gln Thr Ser Ser Val Ser Ser Tyr Thr Thr Gln Ala Ala Asn Leu
210 215 220
Leu Cys Phe Leu Gln Ser Tyr Trp Asn Pro Thr Ser Gly Tyr Ile Thr
225 230 235 240
Ala Asn Thr Gly Gly Gly Arg Ser Gly Lys Asp Ala Asn Thr Leu Leu
245 250 255
Ala Ser Ile His Thr Tyr Asp Pro Ser Ala Gly Cys Asp Ala Thr Thr
260 265 270
Phe Gln Pro Cys Ser Asp Lys Ala Leu Ser Asn Leu Lys Val Tyr Val
275 280 285
Asp Ser Phe Arg Ser Val Tyr Ser Ile Asn Ser Gly Ile Ala Ser Asn
290 295 300
Ala Ala Val Ala Thr Gly Arg Tyr Pro Glu Asp Ser Tyr Gln Gly Gly
305 310 315 320
Asn Pro Trp Tyr Leu Thr Thr Phe Ala Val Ala Glu Gln Leu Tyr Asp
325 330 335
Ala Leu Asn Val Trp Ala Ala Gln Gly Ser Leu Asn Val Thr Ser Ile
340 345 350
Ser Leu Pro Phe Phe Gln Gln Phe Ser Ser Ser Val Thr Ala Gly Thr
355 360 365
Tyr Ala Ser Ser Ser Thr Thr Tyr Thr Thr Leu Thr Ser Ala Ile Lys
370 375 380
Ser Phe Ala Asp Gly Phe Val Ala Ile Asn Ala Gln Tyr Thr Pro Ser
385 390 395 400
Asn Gly Gly Leu Ala Glu Gln Phe Ser Arg Ser Asn Gly Ala Pro Val
405 410 415
Ser Ala Val Asp Leu Thr Trp Ser Tyr Ala Ser Ala Leu Thr Ala Phe
420 425 430
Glu Ala Arg Asn Asn Thr Gln Phe Ala Gly Trp Gly Ala Val Gly Leu
435 440 445
Thr Val Pro Thr Ser Cys Ser Ser Asn Ser Gly Gly Gly Gly Gly Ser
450 455 460
Thr Val Ala Val Thr Phe Asn Val Asn Ala Gln Thr Val Trp Gly Glu
465 470 475 480
Asn Ile Tyr Ile Thr Gly Ser Val Asp Ala Leu Ser Asn Trp Ser Pro
485 490 495
Asp Asn Ala Leu Leu Leu Ser Ser Ala Asn Tyr Pro Thr Trp Ser Ile
500 505 510
Thr Val Asn Leu Pro Ala Ser Thr Ala Ile Gln Tyr Lys Tyr Ile Arg
515 520 525
Lys Asn Asn Gly Ala Val Thr Trp Glu Ser Asp Pro Asn Asn Ser Ile
530 535 540
Thr Thr Pro Ala Ser Gly Ser Val Thr Glu Asn Asp Thr Trp Arg
545 550 555
<210> 15
<211> 515
<212> PRT
<213> 嗜热脂肪芽孢杆菌
<400> 15
Ala Ala Pro Phe Asn Gly Thr Met Met Gln Tyr Phe Glu Trp Tyr Leu
1 5 10 15
Pro Asp Asp Gly Thr Leu Trp Thr Lys Val Ala Asn Glu Ala Asn Asn
20 25 30
Leu Ser Ser Leu Gly Ile Thr Ala Leu Trp Leu Pro Pro Ala Tyr Lys
35 40 45
Gly Thr Ser Arg Ser Asp Val Gly Tyr Gly Val Tyr Asp Leu Tyr Asp
50 55 60
Leu Gly Glu Phe Asn Gln Lys Gly Thr Val Arg Thr Lys Tyr Gly Thr
65 70 75 80
Lys Ala Gln Tyr Leu Gln Ala Ile Gln Ala Ala His Ala Ala Gly Met
85 90 95
Gln Val Tyr Ala Asp Val Val Phe Asp His Lys Gly Gly Ala Asp Gly
100 105 110
Thr Glu Trp Val Asp Ala Val Glu Val Asn Pro Ser Asp Arg Asn Gln
115 120 125
Glu Ile Ser Gly Thr Tyr Gln Ile Gln Ala Trp Thr Lys Phe Asp Phe
130 135 140
Pro Gly Arg Gly Asn Thr Tyr Ser Ser Phe Lys Trp Arg Trp Tyr His
145 150 155 160
Phe Asp Gly Val Asp Trp Asp Glu Ser Arg Lys Leu Ser Arg Ile Tyr
165 170 175
Lys Phe Arg Gly Ile Gly Lys Ala Trp Asp Trp Glu Val Asp Thr Glu
180 185 190
Asn Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Leu Asp Met Asp His
195 200 205
Pro Glu Val Val Thr Glu Leu Lys Asn Trp Gly Lys Trp Tyr Val Asn
210 215 220
Thr Thr Asn Ile Asp Gly Phe Arg Leu Asp Ala Val Lys His Ile Lys
225 230 235 240
Phe Ser Phe Phe Pro Asp Trp Leu Ser Tyr Val Arg Ser Gln Thr Gly
245 250 255
Lys Pro Leu Phe Thr Val Gly Glu Tyr Trp Ser Tyr Asp Ile Asn Lys
260 265 270
Leu His Asn Tyr Ile Thr Lys Thr Asn Gly Thr Met Ser Leu Phe Asp
275 280 285
Ala Pro Leu His Asn Lys Phe Tyr Thr Ala Ser Lys Ser Gly Gly Ala
290 295 300
Phe Asp Met Arg Thr Leu Met Thr Asn Thr Leu Met Lys Asp Gln Pro
305 310 315 320
Thr Leu Ala Val Thr Phe Val Asp Asn His Asp Thr Glu Pro Gly Gln
325 330 335
Ala Leu Gln Ser Trp Val Asp Pro Trp Phe Lys Pro Leu Ala Tyr Ala
340 345 350
Phe Ile Leu Thr Arg Gln Glu Gly Tyr Pro Cys Val Phe Tyr Gly Asp
355 360 365
Tyr Tyr Gly Ile Pro Gln Tyr Asn Ile Pro Ser Leu Lys Ser Lys Ile
370 375 380
Asp Pro Leu Leu Ile Ala Arg Arg Asp Tyr Ala Tyr Gly Thr Gln His
385 390 395 400
Asp Tyr Leu Asp His Ser Asp Ile Ile Gly Trp Thr Arg Glu Gly Val
405 410 415
Thr Glu Lys Pro Gly Ser Gly Leu Ala Ala Leu Ile Thr Asp Gly Pro
420 425 430
Gly Gly Ser Lys Trp Met Tyr Val Gly Lys Gln His Ala Gly Lys Val
435 440 445
Phe Tyr Asp Leu Thr Gly Asn Arg Ser Asp Thr Val Thr Ile Asn Ser
450 455 460
Asp Gly Trp Gly Glu Phe Lys Val Asn Gly Gly Ser Val Ser Val Trp
465 470 475 480
Val Pro Arg Lys Thr Thr Val Ser Thr Ile Ala Arg Pro Ile Thr Thr
485 490 495
Arg Pro Trp Thr Gly Glu Phe Val Arg Trp Thr Glu Pro Arg Leu Val
500 505 510
Ala Trp Pro
515
<210> 16
<211> 177
<212> PRT
<213> 嗜热子囊菌
<400> 16
Thr Arg Ile Ser Ser Cys Ser Gly Ser Arg Gln Ser Ala Leu Thr Thr
1 5 10 15
Ala Leu Arg Asn Ala Ala Ser Leu Ala Asn Ala Ala Ala Asp Ala Ala
20 25 30
Gln Ser Gly Ser Ala Ser Lys Phe Ser Glu Tyr Phe Lys Thr Thr Ser
35 40 45
Ser Ser Thr Arg Gln Thr Val Ala Ala Arg Leu Arg Ala Val Ala Arg
50 55 60
Glu Ala Ser Ser Ser Ser Ser Gly Ala Thr Thr Tyr Tyr Cys Asp Asp
65 70 75 80
Pro Tyr Gly Tyr Cys Ser Ser Asn Val Leu Ala Tyr Thr Leu Pro Ser
85 90 95
Tyr Asn Ile Ile Ala Asn Cys Asp Ile Phe Tyr Thr Tyr Leu Pro Ala
100 105 110
Leu Thr Ser Thr Cys His Ala Gln Asp Gln Ala Thr Thr Ala Leu His
115 120 125
Glu Phe Thr His Ala Pro Gly Val Tyr Ser Pro Gly Thr Asp Asp Leu
130 135 140
Ala Tyr Gly Tyr Gln Ala Ala Met Gly Leu Ser Ser Ser Gln Ala Val
145 150 155 160
Met Asn Ala Asp Thr Tyr Ala Leu Tyr Ala Asn Ala Ile Tyr Leu Gly
165 170 175
Cys
<210> 17
<211> 595
<212> PRT
<213> 草酸青霉菌
<400> 17
Arg Pro Asp Pro Lys Gly Gly Asn Leu Thr Pro Phe Ile His Lys Glu
1 5 10 15
Gly Glu Arg Ser Leu Gln Gly Ile Leu Asp Asn Leu Gly Gly Arg Gly
20 25 30
Lys Lys Thr Pro Gly Thr Ala Ala Gly Leu Phe Ile Ala Ser Pro Asn
35 40 45
Thr Glu Asn Pro Asn Tyr Tyr Tyr Thr Trp Thr Arg Asp Ser Ala Leu
50 55 60
Thr Ala Lys Cys Leu Ile Asp Leu Phe Glu Asp Ser Arg Ala Lys Phe
65 70 75 80
Pro Ile Asp Arg Lys Tyr Leu Glu Thr Gly Ile Arg Asp Tyr Lys Ser
85 90 95
Ser Gln Ala Ile Leu Gln Ser Val Ser Asn Pro Ser Gly Thr Leu Lys
100 105 110
Asp Gly Ser Gly Leu Gly Glu Pro Lys Phe Glu Ile Asp Leu Asn Pro
115 120 125
Phe Ser Gly Ala Trp Gly Arg Pro Gln Arg Asp Gly Pro Ala Leu Arg
130 135 140
Ala Thr Ala Met Ile Thr Tyr Ala Asn Tyr Leu Ile Ser His Gly Gln
145 150 155 160
Lys Ser Asp Val Ser Gln Val Met Trp Pro Ile Ile Ala Asn Asp Leu
165 170 175
Ala Tyr Val Gly Gln Tyr Trp Asn Asn Thr Gly Phe Asp Leu Trp Glu
180 185 190
Glu Val Asp Gly Ser Ser Phe Phe Thr Ile Ala Val Gln His Arg Ala
195 200 205
Leu Val Glu Gly Ser Gln Leu Ala Lys Lys Leu Gly Lys Ser Cys Asp
210 215 220
Ala Cys Asp Ser Gln Pro Pro Gln Ile Leu Cys Phe Leu Gln Ser Phe
225 230 235 240
Trp Asn Gly Lys Tyr Ile Thr Ser Asn Ile Asn Thr Gln Ala Ser Arg
245 250 255
Ser Gly Ile Asp Leu Asp Ser Val Leu Gly Ser Ile His Thr Phe Asp
260 265 270
Pro Glu Ala Ala Cys Asp Asp Ala Thr Phe Gln Pro Cys Ser Ala Arg
275 280 285
Ala Leu Ala Asn His Lys Val Tyr Val Asp Ser Phe Arg Ser Ile Tyr
290 295 300
Lys Ile Asn Ala Gly Leu Ala Glu Gly Ser Ala Ala Asn Val Gly Arg
305 310 315 320
Tyr Pro Glu Asp Val Tyr Gln Gly Gly Asn Pro Trp Tyr Leu Ala Thr
325 330 335
Leu Gly Ala Ser Glu Leu Leu Tyr Asp Ala Leu Tyr Gln Trp Asp Arg
340 345 350
Leu Gly Lys Leu Glu Val Ser Glu Thr Ser Leu Ser Phe Phe Lys Asp
355 360 365
Phe Asp Ala Thr Val Lys Ile Gly Ser Tyr Ser Arg Asn Ser Lys Thr
370 375 380
Tyr Lys Lys Leu Thr Gln Ser Ile Lys Ser Tyr Ala Asp Gly Phe Ile
385 390 395 400
Gln Leu Val Gln Gln Tyr Thr Pro Ser Asn Gly Ser Leu Ala Glu Gln
405 410 415
Tyr Asp Arg Asn Thr Ala Ala Pro Leu Ser Ala Asn Asp Leu Thr Trp
420 425 430
Ser Phe Ala Ser Phe Leu Thr Ala Thr Gln Arg Arg Asp Ala Val Val
435 440 445
Pro Pro Ser Trp Gly Ala Lys Ser Ala Asn Lys Val Pro Thr Thr Cys
450 455 460
Ser Ala Ser Pro Val Val Gly Thr Tyr Lys Ala Pro Thr Ala Thr Phe
465 470 475 480
Ser Ser Lys Thr Lys Cys Val Pro Ala Lys Asp Ile Val Pro Ile Thr
485 490 495
Phe Tyr Leu Ile Glu Asn Thr Tyr Tyr Gly Glu Asn Val Phe Met Ser
500 505 510
Gly Asn Ile Thr Ala Leu Gly Asn Trp Asp Ala Lys Lys Gly Phe Pro
515 520 525
Leu Thr Ala Asn Leu Tyr Thr Gln Asp Gln Asn Leu Trp Phe Ala Ser
530 535 540
Val Glu Phe Ile Pro Ala Gly Thr Pro Phe Glu Tyr Lys Tyr Tyr Lys
545 550 555 560
Val Glu Pro Asn Gly Asp Ile Thr Trp Glu Lys Gly Pro Asn Arg Val
565 570 575
Phe Val Ala Pro Thr Gly Cys Pro Val Gln Pro His Ser Asn Asp Val
580 585 590
Trp Gln Phe
595
<210> 18
<211> 1618
<212> DNA
<213> 简青霉
<400> 18
atgcggcatc aaaagtggct actacctcta ctggcagccg gggctagagc tgctcccgca 60
agcacagcca aagatagcgt ctcgtctgtg gtcaaaaacg gcgtcaagta taccgtgttt 120
gagcatgcag cgaccggagc aaagatggag ttcgtcaaga actcgggcat ctgcgaaact 180
acccccgggg taaatcagta ctcaggatat ctgtctgttg ggagcaacat gaatatgtgg 240
ttctggtagg tatcatcgtc acttaaacct tccccttttt tttatctaaa ctagataggt 300
tcttcgaagc acggaataac ccccaacaag ctcctctggc tgcctggttt aatggcggtc 360
ctggatgctc ttccatgatc ggcctgttcc aggaaaatgg cccttgtcac tttgtcaacg 420
gggacagcac tccctcttta aatgagtaca gctggaacaa ctacgccaac atgctatacg 480
ttgaccagcc catcggtgtt ggcttttcct atggtaccga cgatgtgact agcacagtca 540
ctgctgcgcc atatgtctgg aaactcctac aagcattcta cgcacaattc ccagagtacg 600
aaagtcgcga tttcgccata ttcaccgagg taagtcatca tcccaagtcc acagaccaat 660
gctaatttat cagtcttatg gtgggcacta tggccccgaa ttcgcctcgt acatccaaga 720
acagaattcc gccatcaaga ccggatctat ctcgggagaa aacatcaacc tggtcgccct 780
cggcgttaac aacggctgga tcgactccac aatccaagaa aaggcatata tcgatttcag 840
ttacaacaac tcgtaccaac aactcatcga cgactcccag cgcaccagcc tcctgagcgc 900
ctacaatagc caatgtctcc ctgctatcca aaagtgcaca aaatcaggaa gtaactccga 960
ctgccagaat gcggatagtg tctgctacaa taagatcgag ggaccgatta gtagttcggg 1020
tgactgggac gtctatgata ttcgtgagcc gtcgaatgat ccctatccac cttcaacata 1080
ctcgacctat ctctccaatg ccgatgttgt gaaggctatt ggtgcgcagt ccagctacca 1140
ggaatgtccg aatgggccgt ataataagtt tgcgtcaact ggtgatagta agtccgcgtc 1200
ttcacttgct tatctcaatg caggaactaa caagatagac cctcgatctt tcctctctac 1260
actctccagc gtggtaaaat ccggtatcaa tgtgctagtc tgggcgggtg acgccgactg 1320
gatctgcaac tggctcggca actacgaggt cgccaacgca gtggacttct cgggacatac 1380
agaattcagc gcaaaggacc tggcgccata caccgttaat ggcactgaaa agggcatgtt 1440
caagaatgtg gctaatttct cgttcttgaa ggtgtatggg gcggggcatg aggttcctta 1500
ctatcgtgag tttctcgtct gatcataatg tgaatgattg ctaattgatg tagaacccga 1560
cacggcgctg caggtgtttg agcaggttct ccagaataag ccaatcttct cgacttga 1618
<210> 19
<211> 600
<212> PRT
<213> 米曲霉
<400> 19
Met Phe Phe Ser Arg Gly Ala Leu Ser Leu Ala Val Leu Ser Leu Leu
1 5 10 15
Ser Ser Ser Ala Ala Gly Glu Ala Phe Glu Lys Leu Ser Ala Val Pro
20 25 30
Lys Gly Trp His Tyr Ser Ser Thr Pro Lys Gly Asn Thr Glu Val Cys
35 40 45
Leu Lys Ile Ala Leu Ala Gln Lys Asp Ala Ala Gly Phe Glu Lys Thr
50 55 60
Val Leu Glu Met Ser Asp Pro Asp His Pro Ser Tyr Gly Gln His Phe
65 70 75 80
Thr Thr His Asp Glu Met Lys Arg Met Leu Leu Pro Arg Asp Asp Thr
85 90 95
Val Asp Ala Val Arg Gln Trp Leu Glu Asn Gly Gly Val Thr Asp Phe
100 105 110
Thr Gln Asp Ala Asp Trp Ile Asn Phe Cys Thr Thr Val Asp Thr Ala
115 120 125
Asn Lys Leu Leu Asn Ala Gln Phe Lys Trp Tyr Val Ser Asp Val Lys
130 135 140
His Ile Arg Arg Leu Arg Thr Leu Gln Tyr Asp Val Pro Glu Ser Val
145 150 155 160
Thr Pro His Ile Asn Thr Ile Gln Pro Thr Thr Arg Phe Gly Lys Ile
165 170 175
Ser Pro Lys Lys Ala Val Thr His Ser Lys Pro Ser Gln Leu Asp Val
180 185 190
Thr Ala Leu Ala Ala Ala Val Val Ala Lys Asn Ile Ser His Cys Asp
195 200 205
Ser Ile Ile Thr Pro Thr Cys Leu Lys Glu Leu Tyr Asn Ile Gly Asp
210 215 220
Tyr Gln Ala Asp Ala Asn Ser Gly Ser Lys Ile Ala Phe Ala Ser Tyr
225 230 235 240
Leu Glu Glu Tyr Ala Arg Tyr Ala Asp Leu Glu Asn Phe Glu Asn Tyr
245 250 255
Leu Ala Pro Trp Ala Lys Gly Gln Asn Phe Ser Val Thr Thr Phe Asn
260 265 270
Gly Gly Leu Asn Asp Gln Asn Ser Ser Ser Asp Ser Gly Glu Ala Asn
275 280 285
Leu Asp Leu Gln Tyr Ile Leu Gly Val Ser Ala Pro Leu Pro Val Thr
290 295 300
Glu Phe Ser Thr Gly Gly Arg Gly Pro Leu Val Pro Asp Leu Thr Gln
305 310 315 320
Pro Asp Pro Asn Ser Asn Ser Asn Glu Pro Tyr Leu Glu Phe Phe Gln
325 330 335
Asn Val Leu Lys Leu Asp Gln Lys Asp Leu Pro Gln Val Ile Ser Thr
340 345 350
Ser Tyr Gly Glu Asn Glu Gln Glu Ile Pro Glu Lys Tyr Ala Arg Thr
355 360 365
Val Cys Asn Leu Ile Ala Gln Leu Gly Ser Arg Gly Val Ser Val Leu
370 375 380
Phe Ser Ser Gly Asp Ser Gly Val Gly Glu Gly Cys Met Thr Asn Asp
385 390 395 400
Gly Thr Asn Arg Thr His Phe Pro Pro Gln Phe Pro Ala Ala Cys Pro
405 410 415
Trp Val Thr Ser Val Gly Ala Thr Phe Lys Thr Thr Pro Glu Arg Gly
420 425 430
Thr Tyr Phe Ser Ser Gly Gly Phe Ser Asp Tyr Trp Pro Arg Pro Glu
435 440 445
Trp Gln Asp Glu Ala Val Ser Ser Tyr Leu Glu Thr Ile Gly Asp Thr
450 455 460
Phe Lys Gly Leu Tyr Asn Ser Ser Gly Arg Ala Phe Pro Asp Val Ala
465 470 475 480
Ala Gln Gly Met Asn Phe Ala Val Tyr Asp Lys Gly Thr Leu Gly Glu
485 490 495
Phe Asp Gly Thr Ser Ala Ser Ala Pro Ala Phe Ser Ala Val Ile Ala
500 505 510
Leu Leu Asn Asp Ala Arg Leu Arg Ala Gly Lys Pro Thr Leu Gly Phe
515 520 525
Leu Asn Pro Trp Leu Tyr Lys Thr Gly Arg Gln Gly Leu Gln Asp Ile
530 535 540
Thr Leu Gly Ala Ser Ile Gly Cys Thr Gly Arg Ala Arg Phe Gly Gly
545 550 555 560
Ala Pro Asp Gly Gly Pro Val Val Pro Tyr Ala Ser Trp Asn Ala Thr
565 570 575
Gln Gly Trp Asp Pro Val Thr Gly Leu Gly Thr Pro Asp Phe Ala Glu
580 585 590
Leu Lys Lys Leu Ala Leu Gly Asn
595 600
<210> 20
<211> 400
<212> PRT
<213> 米曲霉
<400> 20
Ala Lys Asn Ile Ser His Cys Asp Ser Ile Ile Thr Pro Thr Cys Leu
1 5 10 15
Lys Glu Leu Tyr Asn Ile Gly Asp Tyr Gln Ala Asp Ala Asn Ser Gly
20 25 30
Ser Lys Ile Ala Phe Ala Ser Tyr Leu Glu Glu Tyr Ala Arg Tyr Ala
35 40 45
Asp Leu Glu Asn Phe Glu Asn Tyr Leu Ala Pro Trp Ala Lys Gly Gln
50 55 60
Asn Phe Ser Val Thr Thr Phe Asn Gly Gly Leu Asn Asp Gln Asn Ser
65 70 75 80
Ser Ser Asp Ser Gly Glu Ala Asn Leu Asp Leu Gln Tyr Ile Leu Gly
85 90 95
Val Ser Ala Pro Leu Pro Val Thr Glu Phe Ser Thr Gly Gly Arg Gly
100 105 110
Pro Leu Val Pro Asp Leu Thr Gln Pro Asp Pro Asn Ser Asn Ser Asn
115 120 125
Glu Pro Tyr Leu Glu Phe Phe Gln Asn Val Leu Lys Leu Asp Gln Lys
130 135 140
Asp Leu Pro Gln Val Ile Ser Thr Ser Tyr Gly Glu Asn Glu Gln Glu
145 150 155 160
Ile Pro Glu Lys Tyr Ala Arg Thr Val Cys Asn Leu Ile Ala Gln Leu
165 170 175
Gly Ser Arg Gly Val Ser Val Leu Phe Ser Ser Gly Asp Ser Gly Val
180 185 190
Gly Glu Gly Cys Met Thr Asn Asp Gly Thr Asn Arg Thr His Phe Pro
195 200 205
Pro Gln Phe Pro Ala Ala Cys Pro Trp Val Thr Ser Val Gly Ala Thr
210 215 220
Phe Lys Thr Thr Pro Glu Arg Gly Thr Tyr Phe Ser Ser Gly Gly Phe
225 230 235 240
Ser Asp Tyr Trp Pro Arg Pro Glu Trp Gln Asp Glu Ala Val Ser Ser
245 250 255
Tyr Leu Glu Thr Ile Gly Asp Thr Phe Lys Gly Leu Tyr Asn Ser Ser
260 265 270
Gly Arg Ala Phe Pro Asp Val Ala Ala Gln Gly Met Asn Phe Ala Val
275 280 285
Tyr Asp Lys Gly Thr Leu Gly Glu Phe Asp Gly Thr Ser Ala Ser Ala
290 295 300
Pro Ala Phe Ser Ala Val Ile Ala Leu Leu Asn Asp Ala Arg Leu Arg
305 310 315 320
Ala Gly Lys Pro Thr Leu Gly Phe Leu Asn Pro Trp Leu Tyr Lys Thr
325 330 335
Gly Arg Gln Gly Leu Gln Asp Ile Thr Leu Gly Ala Ser Ile Gly Cys
340 345 350
Thr Gly Arg Ala Arg Phe Gly Gly Ala Pro Asp Gly Gly Pro Val Val
355 360 365
Pro Tyr Ala Ser Trp Asn Ala Thr Gln Gly Trp Asp Pro Val Thr Gly
370 375 380
Leu Gly Thr Pro Asp Phe Ala Glu Leu Lys Lys Leu Ala Leu Gly Asn
385 390 395 400
<210> 21
<211> 612
<212> PRT
<213> 里氏木霉
<400> 21
Met Ala Lys Leu Ser Thr Leu Arg Leu Ala Ser Leu Leu Ser Leu Val
1 5 10 15
Ser Val Gln Val Ser Ala Ser Val His Leu Leu Glu Ser Leu Glu Lys
20 25 30
Leu Pro His Gly Trp Lys Ala Ala Glu Thr Pro Ser Pro Ser Ser Gln
35 40 45
Ile Val Leu Gln Val Ala Leu Thr Gln Gln Asn Ile Asp Gln Leu Glu
50 55 60
Ser Arg Leu Ala Ala Val Ser Thr Pro Thr Ser Ser Thr Tyr Gly Lys
65 70 75 80
Tyr Leu Asp Val Asp Glu Ile Asn Ser Ile Phe Ala Pro Ser Asp Ala
85 90 95
Ser Ser Ser Ala Val Glu Ser Trp Leu Gln Ser His Gly Val Thr Ser
100 105 110
Tyr Thr Lys Gln Gly Ser Ser Ile Trp Phe Gln Thr Asn Ile Ser Thr
115 120 125
Ala Asn Ala Met Leu Ser Thr Asn Phe His Thr Tyr Ser Asp Leu Thr
130 135 140
Gly Ala Lys Lys Val Arg Thr Leu Lys Tyr Ser Ile Pro Glu Ser Leu
145 150 155 160
Ile Gly His Val Asp Leu Ile Ser Pro Thr Thr Tyr Phe Gly Thr Thr
165 170 175
Lys Ala Met Arg Lys Leu Lys Ser Ser Gly Val Ser Pro Ala Ala Asp
180 185 190
Ala Leu Ala Ala Arg Gln Glu Pro Ser Ser Cys Lys Gly Thr Leu Val
195 200 205
Phe Glu Gly Glu Thr Phe Asn Val Phe Gln Pro Asp Cys Leu Arg Thr
210 215 220
Glu Tyr Ser Val Asp Gly Tyr Thr Pro Ser Val Lys Ser Gly Ser Arg
225 230 235 240
Ile Gly Phe Gly Ser Phe Leu Asn Glu Ser Ala Ser Phe Ala Asp Gln
245 250 255
Ala Leu Phe Glu Lys His Phe Asn Ile Pro Ser Gln Asn Phe Ser Val
260 265 270
Val Leu Ile Asn Gly Gly Thr Asp Leu Pro Gln Pro Pro Ser Asp Ala
275 280 285
Asn Asp Gly Glu Ala Asn Leu Asp Ala Gln Thr Ile Leu Thr Ile Ala
290 295 300
His Pro Leu Pro Ile Thr Glu Phe Ile Thr Ala Gly Ser Pro Pro Tyr
305 310 315 320
Phe Pro Asp Pro Val Glu Pro Ala Gly Thr Pro Asn Glu Asn Glu Pro
325 330 335
Tyr Leu Gln Tyr Tyr Glu Phe Leu Leu Ser Lys Ser Asn Ala Glu Ile
340 345 350
Pro Gln Val Ile Thr Asn Ser Tyr Gly Asp Glu Glu Gln Thr Val Pro
355 360 365
Arg Ser Tyr Ala Val Arg Val Cys Asn Leu Ile Gly Leu Leu Gly Leu
370 375 380
Arg Gly Ile Ser Val Leu His Ser Ser Gly Asp Glu Gly Val Gly Ala
385 390 395 400
Ser Cys Val Ala Thr Asn Ser Thr Thr Pro Gln Phe Asn Pro Ile Phe
405 410 415
Pro Ala Thr Cys Pro Tyr Val Thr Ser Val Gly Gly Thr Val Ser Phe
420 425 430
Asn Pro Glu Val Ala Trp Ala Gly Ser Ser Gly Gly Phe Ser Tyr Tyr
435 440 445
Phe Ser Arg Pro Trp Tyr Gln Gln Glu Ala Val Gly Thr Tyr Leu Glu
450 455 460
Lys Tyr Val Ser Ala Glu Thr Lys Lys Tyr Tyr Gly Pro Tyr Val Asp
465 470 475 480
Phe Ser Gly Arg Gly Phe Pro Asp Val Ala Ala His Ser Val Ser Pro
485 490 495
Asp Tyr Pro Val Phe Gln Gly Gly Glu Leu Thr Pro Ser Gly Gly Thr
500 505 510
Ser Ala Ala Ser Pro Val Val Ala Ala Ile Val Ala Leu Leu Asn Asp
515 520 525
Ala Arg Leu Arg Glu Gly Lys Pro Thr Leu Gly Phe Leu Asn Pro Leu
530 535 540
Ile Tyr Leu His Ala Ser Lys Gly Phe Thr Asp Ile Thr Ser Gly Gln
545 550 555 560
Ser Glu Gly Cys Asn Gly Asn Asn Thr Gln Thr Gly Ser Pro Leu Pro
565 570 575
Gly Ala Gly Phe Ile Ala Gly Ala His Trp Asn Ala Thr Lys Gly Trp
580 585 590
Asp Pro Thr Thr Gly Phe Gly Val Pro Asn Leu Lys Lys Leu Leu Ala
595 600 605
Leu Val Arg Phe
610
<210> 22
<211> 415
<212> PRT
<213> 里氏木霉
<400> 22
Gln Glu Pro Ser Ser Cys Lys Gly Thr Leu Val Phe Glu Gly Glu Thr
1 5 10 15
Phe Asn Val Phe Gln Pro Asp Cys Leu Arg Thr Glu Tyr Ser Val Asp
20 25 30
Gly Tyr Thr Pro Ser Val Lys Ser Gly Ser Arg Ile Gly Phe Gly Ser
35 40 45
Phe Leu Asn Glu Ser Ala Ser Phe Ala Asp Gln Ala Leu Phe Glu Lys
50 55 60
His Phe Asn Ile Pro Ser Gln Asn Phe Ser Val Val Leu Ile Asn Gly
65 70 75 80
Gly Thr Asp Leu Pro Gln Pro Pro Ser Asp Ala Asn Asp Gly Glu Ala
85 90 95
Asn Leu Asp Ala Gln Thr Ile Leu Thr Ile Ala His Pro Leu Pro Ile
100 105 110
Thr Glu Phe Ile Thr Ala Gly Ser Pro Pro Tyr Phe Pro Asp Pro Val
115 120 125
Glu Pro Ala Gly Thr Pro Asn Glu Asn Glu Pro Tyr Leu Gln Tyr Tyr
130 135 140
Glu Phe Leu Leu Ser Lys Ser Asn Ala Glu Ile Pro Gln Val Ile Thr
145 150 155 160
Asn Ser Tyr Gly Asp Glu Glu Gln Thr Val Pro Arg Ser Tyr Ala Val
165 170 175
Arg Val Cys Asn Leu Ile Gly Leu Leu Gly Leu Arg Gly Ile Ser Val
180 185 190
Leu His Ser Ser Gly Asp Glu Gly Val Gly Ala Ser Cys Val Ala Thr
195 200 205
Asn Ser Thr Thr Pro Gln Phe Asn Pro Ile Phe Pro Ala Thr Cys Pro
210 215 220
Tyr Val Thr Ser Val Gly Gly Thr Val Ser Phe Asn Pro Glu Val Ala
225 230 235 240
Trp Ala Gly Ser Ser Gly Gly Phe Ser Tyr Tyr Phe Ser Arg Pro Trp
245 250 255
Tyr Gln Gln Glu Ala Val Gly Thr Tyr Leu Glu Lys Tyr Val Ser Ala
260 265 270
Glu Thr Lys Lys Tyr Tyr Gly Pro Tyr Val Asp Phe Ser Gly Arg Gly
275 280 285
Phe Pro Asp Val Ala Ala His Ser Val Ser Pro Asp Tyr Pro Val Phe
290 295 300
Gln Gly Gly Glu Leu Thr Pro Ser Gly Gly Thr Ser Ala Ala Ser Pro
305 310 315 320
Val Val Ala Ala Ile Val Ala Leu Leu Asn Asp Ala Arg Leu Arg Glu
325 330 335
Gly Lys Pro Thr Leu Gly Phe Leu Asn Pro Leu Ile Tyr Leu His Ala
340 345 350
Ser Lys Gly Phe Thr Asp Ile Thr Ser Gly Gln Ser Glu Gly Cys Asn
355 360 365
Gly Asn Asn Thr Gln Thr Gly Ser Pro Leu Pro Gly Ala Gly Phe Ile
370 375 380
Ala Gly Ala His Trp Asn Ala Thr Lys Gly Trp Asp Pro Thr Thr Gly
385 390 395 400
Phe Gly Val Pro Asn Leu Lys Lys Leu Leu Ala Leu Val Arg Phe
405 410 415
<210> 23
<211> 614
<212> PRT
<213> 嗜热嗜热子囊菌
<400> 23
Met Leu Ser Ser Leu Leu Gly Arg Gly Ala Ala Ser Leu Ala Ile Ile
1 5 10 15
Ser Leu Phe Thr Pro Ser Val Ala Gly Glu Val Phe Glu Arg Leu Arg
20 25 30
Ala Val Pro Glu Gly Trp Arg Phe Ser Ala Thr Pro Ser Asp Asp Gln
35 40 45
Pro Ile Arg Leu Gln Ile Ala Leu Gln Gln His Asp Val Glu Gly Phe
50 55 60
Glu Arg Ala Val Leu Asp Met Ser Thr Pro Ser Ser Pro Asn Tyr Gly
65 70 75 80
Lys His Phe Gln Ser His Asp Glu Met Lys Arg Met Leu Leu Pro Ser
85 90 95
Asp Asp Ala Val Asp Ala Val Leu Asp Trp Leu Gln Ser Ala Gly Ile
100 105 110
Thr Asp Ile Glu Glu Asp Ala Asp Trp Ile Asn Phe Arg Thr Thr Val
115 120 125
Gly Val Ala Asn Glu Leu Leu Asp Thr Gln Phe Gln Trp Phe Val Ser
130 135 140
Glu Thr Ser Ser His Val Arg Arg Leu Arg Ala Leu Glu Tyr Ser Ile
145 150 155 160
Pro Glu Ser Val Thr Pro His Ile His Met Val Gln Pro Thr Thr Arg
165 170 175
Phe Gly Gln Ile Gly Arg His His Thr Thr Ser Arg Glu Lys Pro Ile
180 185 190
Val Ser Gly Ala Asp Ile His Ala Ser Ile Ala Gly Ala Asn Asn Gln
195 200 205
Thr Thr Gly Thr Asp Cys Asn Thr Glu Ile Thr Pro Lys Cys Leu Gln
210 215 220
Asp Leu Tyr Lys Phe Gly Gly Tyr Lys Ala Ser Ala Asn Ser Gly Ser
225 230 235 240
Lys Val Gly Phe Cys Ser Tyr Leu Glu Glu Tyr Ala Arg Tyr Asp Asp
245 250 255
Leu Ala Leu Phe Glu Glu Ala Leu Ala Pro Tyr Ala Ala Gly Gln Asn
260 265 270
Phe Ser Val Ile Thr Tyr Asn Gly Gly Leu Asn Asp Gln His Ser Ser
275 280 285
Ser Asp Ser Gly Glu Ala Asn Leu Asp Leu Gln Tyr Ile Val Gly Val
290 295 300
Ser Ala Pro Leu Pro Val Thr Glu Phe Ser Thr Gly Gly Arg Gly Glu
305 310 315 320
Leu Val Pro Asp Leu Asp Gln Pro Asn Pro Ala Asp Asn Ser Asn Glu
325 330 335
Pro Tyr Leu Asp Phe Leu Gln Asn Val Leu Lys Leu Asp Gln Lys Asp
340 345 350
Leu Pro Gln Val Ile Ser Thr Ser Tyr Gly Glu Asn Glu Gln Ser Val
355 360 365
Pro Glu Lys Tyr Ala Arg Ser Val Cys Asn Leu Phe Met Gln Leu Gly
370 375 380
Ser Arg Gly Val Ser Val Ile Phe Ser Ser Gly Asp Ser Gly Val Gly
385 390 395 400
Ser Ala Cys Leu Thr Asn Asp Gly Lys Asn Gln Thr Arg Phe Met Pro
405 410 415
Gln Phe Pro Ala Ser Cys Pro Trp Val Thr Ser Val Gly Ser Thr Gln
420 425 430
His Ile Ala Pro Glu Glu Ala Thr Tyr Phe Ser Ser Gly Gly Phe Ser
435 440 445
Asp Leu Trp Pro Met Pro Asp Tyr Gln Lys Ser Ala Val Gly Glu Tyr
450 455 460
Leu Asp Arg Leu Gly Ser Lys Trp Ala Gly Leu Tyr Asn Pro Gln Gly
465 470 475 480
Arg Gly Phe Pro Asp Val Ala Ala Gln Gly Val Asn Phe Asn Val Tyr
485 490 495
Asp Lys Gly Ser Leu Lys Arg Phe Asp Gly Thr Ser Cys Ser Ala Pro
500 505 510
Thr Phe Ala Gly Val Ile Ala Leu Leu Asn Asp Ala Arg Leu Arg Ala
515 520 525
Arg Gln Pro Pro Met Gly Phe Leu Asn Pro Trp Leu Tyr Gly Ala Gly
530 535 540
Lys Gly Gly Leu Asn Asp Ile Val Asn Gly Gly Ser Thr Gly Cys Asp
545 550 555 560
Gly Asn Ala Arg Phe Gly Gly Ala Pro Asn Gly Ser Pro Val Val Pro
565 570 575
Phe Ala Ser Trp Asn Ala Thr Gln Gly Trp Asp Pro Val Ser Gly Leu
580 585 590
Gly Thr Pro Asp Phe Ser Arg Leu Leu Lys Leu Ala Val Pro Ser Arg
595 600 605
Val Gly Gly Arg Leu Ala
610
<210> 24
<211> 403
<212> PRT
<213> 嗜热嗜热子囊菌
<400> 24
Thr Asp Cys Asn Thr Glu Ile Thr Pro Lys Cys Leu Gln Asp Leu Tyr
1 5 10 15
Lys Phe Gly Gly Tyr Lys Ala Ser Ala Asn Ser Gly Ser Lys Val Gly
20 25 30
Phe Cys Ser Tyr Leu Glu Glu Tyr Ala Arg Tyr Asp Asp Leu Ala Leu
35 40 45
Phe Glu Glu Ala Leu Ala Pro Tyr Ala Ala Gly Gln Asn Phe Ser Val
50 55 60
Ile Thr Tyr Asn Gly Gly Leu Asn Asp Gln His Ser Ser Ser Asp Ser
65 70 75 80
Gly Glu Ala Asn Leu Asp Leu Gln Tyr Ile Val Gly Val Ser Ala Pro
85 90 95
Leu Pro Val Thr Glu Phe Ser Thr Gly Gly Arg Gly Glu Leu Val Pro
100 105 110
Asp Leu Asp Gln Pro Asn Pro Ala Asp Asn Ser Asn Glu Pro Tyr Leu
115 120 125
Asp Phe Leu Gln Asn Val Leu Lys Leu Asp Gln Lys Asp Leu Pro Gln
130 135 140
Val Ile Ser Thr Ser Tyr Gly Glu Asn Glu Gln Ser Val Pro Glu Lys
145 150 155 160
Tyr Ala Arg Ser Val Cys Asn Leu Phe Met Gln Leu Gly Ser Arg Gly
165 170 175
Val Ser Val Ile Phe Ser Ser Gly Asp Ser Gly Val Gly Ser Ala Cys
180 185 190
Leu Thr Asn Asp Gly Lys Asn Gln Thr Arg Phe Met Pro Gln Phe Pro
195 200 205
Ala Ser Cys Pro Trp Val Thr Ser Val Gly Ser Thr Gln His Ile Ala
210 215 220
Pro Glu Glu Ala Thr Tyr Phe Ser Ser Gly Gly Phe Ser Asp Leu Trp
225 230 235 240
Pro Met Pro Asp Tyr Gln Lys Ser Ala Val Gly Glu Tyr Leu Asp Arg
245 250 255
Leu Gly Ser Lys Trp Ala Gly Leu Tyr Asn Pro Gln Gly Arg Gly Phe
260 265 270
Pro Asp Val Ala Ala Gln Gly Val Asn Phe Asn Val Tyr Asp Lys Gly
275 280 285
Ser Leu Lys Arg Phe Asp Gly Thr Ser Cys Ser Ala Pro Thr Phe Ala
290 295 300
Gly Val Ile Ala Leu Leu Asn Asp Ala Arg Leu Arg Ala Arg Gln Pro
305 310 315 320
Pro Met Gly Phe Leu Asn Pro Trp Leu Tyr Gly Ala Gly Lys Gly Gly
325 330 335
Leu Asn Asp Ile Val Asn Gly Gly Ser Thr Gly Cys Asp Gly Asn Ala
340 345 350
Arg Phe Gly Gly Ala Pro Asn Gly Ser Pro Val Val Pro Phe Ala Ser
355 360 365
Trp Asn Ala Thr Gln Gly Trp Asp Pro Val Ser Gly Leu Gly Thr Pro
370 375 380
Asp Phe Ser Arg Leu Leu Lys Leu Ala Val Pro Ser Arg Val Gly Gly
385 390 395 400
Arg Leu Ala
<210> 25
<211> 594
<212> PRT
<213> 疏棉状嗜热丝孢菌
<400> 25
Met Cys Arg Leu Arg Pro Leu Val Gly Phe Leu Ala Leu Ser Leu Ser
1 5 10 15
Leu Val Asn Ala Leu Ala Ala Pro Phe Gln Val Val Glu Arg Leu Ser
20 25 30
Ala Pro Pro Asp Gly Trp Ile Lys Lys Glu Lys Ala Ala Pro Ser Ala
35 40 45
Gln Ile Gln Phe Arg Leu Gly Leu Pro Gln Gln Asn Ser Glu Gln Leu
50 55 60
Glu Gln Leu Ala Leu Asn Ile Ala Thr Pro Gly His Glu Leu Tyr Arg
65 70 75 80
Lys His Leu Lys Arg Asp Glu Ile Lys Ala Leu Val Arg Pro Leu Ala
85 90 95
Ser Val Ser Glu Lys Val Leu Ala Trp Leu Arg Asp Glu Gly Val Pro
100 105 110
Glu Asp Arg Ile His Asp Asp Gly Ala Trp Ile Lys Phe Thr Val Pro
115 120 125
Val Ser Thr Ala Glu Lys Leu Leu Asn Thr Glu Phe Phe Val Phe His
130 135 140
Asn Glu Arg Thr Gly Ala Glu Gln Ile Arg Thr Leu Glu Tyr Ser Val
145 150 155 160
Pro Gln Asp Ile His Ser Leu Val Lys Phe Ile Gln Pro Thr Thr His
165 170 175
Phe Ser Ser Leu Gly Pro Gln Val Arg Arg Val Val Pro Leu Asp Val
180 185 190
Leu Pro Lys Leu Arg Ile Thr Leu Glu Asp Cys Asn Lys Lys Ile Thr
195 200 205
Pro Asp Cys Leu Lys Gln Leu Tyr Lys Ile Gly Asp Tyr Val Ala Pro
210 215 220
Glu Asp Pro Arg Asn Arg Ile Gly Ile Ser Gly Tyr Leu Glu Gln Phe
225 230 235 240
Ala Arg Tyr Ala Asp Phe Glu Glu Phe Leu Glu Ser Tyr Ala Pro Asp
245 250 255
Arg Thr Asp Ala Asn Phe Thr Val Val Ser Ile Asn Gly Gly Arg Asn
260 265 270
Asp Gln Asn Ser Thr Leu Asp Ser Thr Glu Ala Ser Leu Asp Ile Asp
275 280 285
Tyr Ala Val Thr Leu Ser Tyr Lys Thr Gln Ala Val Tyr Tyr Thr Thr
290 295 300
Ala Gly Arg Gly Pro Leu Val Pro Asp Glu Ser Gln Pro Asp Pro Asn
305 310 315 320
Glu Val Ser Asn Glu Pro Tyr Met Glu Gln Leu Gln Phe Leu Leu Asp
325 330 335
Leu Pro Asp Glu Glu Leu Pro Thr Val Leu Thr Thr Ser Tyr Gly Glu
340 345 350
Asn Glu Gln Ser Leu Pro Gly Ser Tyr Ala Asp Glu Thr Cys Asn Met
355 360 365
Phe Arg Leu Leu Gly Met Arg Gly Val Ser Val Ile Phe Ser Ser Gly
370 375 380
Asp Trp Gly Thr Gly Ile Val Cys Lys Ala Asn Asp Gly Ser Glu Arg
385 390 395 400
Ile Lys Phe Asp Pro Val Tyr Pro Ala Ser Cys Pro Tyr Val Thr Ser
405 410 415
Val Gly Gly Thr Thr Gly Val Asn Pro Glu Arg Ala Val Glu Phe Ser
420 425 430
Ser Gly Gly Phe Ser Asp Arg Phe Pro Arg Pro Lys Tyr Gln Asp Glu
435 440 445
Ala Val Arg Ser Tyr Leu Thr Lys Leu Gly Asp His Trp Lys Gly Leu
450 455 460
Tyr Asn Glu Ser Gly Arg Ala Phe Pro Asp Val Ala Ala Gln Ala Asp
465 470 475 480
Asn Phe Val Val Arg Asp Gln Gly Gln Trp Val Ser Val Gly Gly Thr
485 490 495
Ser Ala Ser Ala Pro Val Phe Ala Ala Ile Ile Ala Asn Val Asn Ala
500 505 510
Glu Leu Leu Lys Ala Gly Lys Pro Pro Leu Gly Phe Leu Asn Pro Trp
515 520 525
Leu Tyr Gly Leu Lys Gly Arg Gly Phe Thr Asp Val Val His Gly Gly
530 535 540
Ser Thr Gly Cys Pro Gly Thr Val Pro Trp Thr Gly Leu Pro Ala Gly
545 550 555 560
His Val Pro Tyr Ala Ser Trp Asn Ala Thr Glu Gly Trp Asp Pro Val
565 570 575
Thr Gly Leu Gly Thr Pro Leu Tyr Asp Glu Leu Val Lys Ala Ala Leu
580 585 590
Gly Lys
<210> 26
<211> 392
<212> PRT
<213> 疏棉状嗜热丝孢菌
<400> 26
Cys Asn Lys Lys Ile Thr Pro Asp Cys Leu Lys Gln Leu Tyr Lys Ile
1 5 10 15
Gly Asp Tyr Val Ala Pro Glu Asp Pro Arg Asn Arg Ile Gly Ile Ser
20 25 30
Gly Tyr Leu Glu Gln Phe Ala Arg Tyr Ala Asp Phe Glu Glu Phe Leu
35 40 45
Glu Ser Tyr Ala Pro Asp Arg Thr Asp Ala Asn Phe Thr Val Val Ser
50 55 60
Ile Asn Gly Gly Arg Asn Asp Gln Asn Ser Thr Leu Asp Ser Thr Glu
65 70 75 80
Ala Ser Leu Asp Ile Asp Tyr Ala Val Thr Leu Ser Tyr Lys Thr Gln
85 90 95
Ala Val Tyr Tyr Thr Thr Ala Gly Arg Gly Pro Leu Val Pro Asp Glu
100 105 110
Ser Gln Pro Asp Pro Asn Glu Val Ser Asn Glu Pro Tyr Met Glu Gln
115 120 125
Leu Gln Phe Leu Leu Asp Leu Pro Asp Glu Glu Leu Pro Thr Val Leu
130 135 140
Thr Thr Ser Tyr Gly Glu Asn Glu Gln Ser Leu Pro Gly Ser Tyr Ala
145 150 155 160
Asp Glu Thr Cys Asn Met Phe Arg Leu Leu Gly Met Arg Gly Val Ser
165 170 175
Val Ile Phe Ser Ser Gly Asp Trp Gly Thr Gly Ile Val Cys Lys Ala
180 185 190
Asn Asp Gly Ser Glu Arg Ile Lys Phe Asp Pro Val Tyr Pro Ala Ser
195 200 205
Cys Pro Tyr Val Thr Ser Val Gly Gly Thr Thr Gly Val Asn Pro Glu
210 215 220
Arg Ala Val Glu Phe Ser Ser Gly Gly Phe Ser Asp Arg Phe Pro Arg
225 230 235 240
Pro Lys Tyr Gln Asp Glu Ala Val Arg Ser Tyr Leu Thr Lys Leu Gly
245 250 255
Asp His Trp Lys Gly Leu Tyr Asn Glu Ser Gly Arg Ala Phe Pro Asp
260 265 270
Val Ala Ala Gln Ala Asp Asn Phe Val Val Arg Asp Gln Gly Gln Trp
275 280 285
Val Ser Val Gly Gly Thr Ser Ala Ser Ala Pro Val Phe Ala Ala Ile
290 295 300
Ile Ala Asn Val Asn Ala Glu Leu Leu Lys Ala Gly Lys Pro Pro Leu
305 310 315 320
Gly Phe Leu Asn Pro Trp Leu Tyr Gly Leu Lys Gly Arg Gly Phe Thr
325 330 335
Asp Val Val His Gly Gly Ser Thr Gly Cys Pro Gly Thr Val Pro Trp
340 345 350
Thr Gly Leu Pro Ala Gly His Val Pro Tyr Ala Ser Trp Asn Ala Thr
355 360 365
Glu Gly Trp Asp Pro Val Thr Gly Leu Gly Thr Pro Leu Tyr Asp Glu
370 375 380
Leu Val Lys Ala Ala Leu Gly Lys
385 390
<210> 27
<211> 1803
<212> DNA
<213> 米曲霉
<400> 27
atgttcttca gtcgtggagc gctttcgctc gcagtgcttt cactgctcag ctcctccgcc 60
gcaggggagg cttttgagaa gctgtctgcc gttccaaagg gatggcacta ttctagtacc 120
cctaaaggca acactgaggt ttgtctgaag atcgccctcg cgcagaagga tgctgctggg 180
ttcgaaaaga ccgtcttgga gatgtcggat cccgaccacc ccagctacgg ccagcacttc 240
accacccacg acgagatgaa gcgcatgctt cttcccagag atgacaccgt tgatgccgtt 300
cgacaatggc tcgaaaacgg cggcgtgacc gactttaccc aggatgccga ctggatcaac 360
ttctgtacta ccgtcgatac cgcgaacaaa ctcttgaatg cccagttcaa atggtacgtc 420
agcgatgtga agcacatccg ccgtctcaga acactgcagt acgacgtccc cgagtcggtc 480
acccctcaca tcaacaccat ccaaccgacc acccgttttg gcaagattag ccccaagaag 540
gccgttaccc acagcaagcc ctcccagttg gacgtgaccg cccttgctgc cgctgtcgtt 600
gcaaagaaca tctcgcactg tgattctatc attaccccca cctgtctgaa ggagctttac 660
aacattggtg attaccaggc cgatgcaaac tcgggcagca agatcgcctt cgccagctat 720
ctggaggagt acgcgcgcta cgctgacctg gagaactttg agaactacct tgctccctgg 780
gctaagggcc agaacttctc cgttaccacc ttcaacggcg gtctcaatga tcagaactcc 840
tcgtccgata gcggtgaggc caacctggac ctgcagtaca ttcttggtgt cagcgctcca 900
ctgcccgtta ctgaattcag caccggaggc cgtggtcccc tcgttcctga tctgacccag 960
ccggatccca actctaacag caatgagccg taccttgagt tcttccagaa tgtgttgaag 1020
ctcgaccaga aggacctccc ccaggtcatc tcgacctcct atggagagaa cgaacaggaa 1080
atccccgaaa agtacgctcg caccgtctgc aacctgatcg ctcagcttgg cagccgcggt 1140
gtctccgttc tcttctcctc cggtgactct ggtgttggcg agggctgcat gaccaacgac 1200
ggcaccaacc ggactcactt cccaccccag ttccccgccg cttgcccgtg ggtcacctcc 1260
gtcggcgcca ccttcaagac cactcccgag cgcggcacct acttctcctc gggcggtttc 1320
tccgactact ggccccgtcc cgaatggcag gatgaggccg tgagcagcta cctcgagacg 1380
atcggcgaca ctttcaaggg cctctacaac tcctccggcc gtgctttccc cgacgtcgca 1440
gcccagggca tgaacttcgc cgtctacgac aagggcacct tgggcgagtt cgacggcacc 1500
tccgcctccg ccccggcctt cagcgccgtc atcgctctcc tgaacgatgc ccgtctccgc 1560
gccggcaagc ccactctcgg cttcctgaac ccctggttgt acaagaccgg ccgccagggt 1620
ctgcaagata tcaccctcgg tgctagcatt ggctgcaccg gtcgcgctcg cttcggcggc 1680
gcccctgacg gtggtcccgt cgtgccttac gctagctgga acgctaccca gggctgggat 1740
cccgtcactg gtctcggaac tcccgatttc gccgagctca agaagcttgc ccttggcaac 1800
taa 1803
<210> 28
<211> 1839
<212> DNA
<213> 里氏木霉
<400> 28
atggcaaagt tgagcactct ccggcttgcg agccttcttt cccttgtcag tgtgcaggta 60
tctgcctctg tccatctatt ggagagtctg gagaagctgc ctcatggatg gaaagcagct 120
gaaaccccga gcccttcgtc tcaaatcgtc ttgcaggttg ctctgacgca gcagaacatt 180
gaccagcttg aatcgaggct cgcagctgta tccacaccca cttctagcac ctacggcaaa 240
tacttggatg tagacgagat caacagcatc ttcgctccaa gtgatgctag cagttctgcc 300
gtcgagtctt ggcttcagtc ccacggagtg acgagttaca ccaagcaagg cagcagcatt 360
tggtttcaaa caaacatctc cactgcaaat gcgatgctca gcaccaattt ccacacgtac 420
agcgatctca ccggcgcgaa gaaggtgcgc actctcaagt actcgatccc ggagagcctc 480
atcggccatg tcgatctcat ctctcccacg acctattttg gcacgacaaa ggccatgagg 540
aagttgaaat ccagtggcgt gagcccagcc gctgatgctc tagccgctcg ccaagaacct 600
tccagctgca aaggaactct agtctttgag ggagaaacgt tcaatgtctt tcagccagac 660
tgtctcagga ccgagtatag tgttgatgga tacaccccgt ctgtcaagtc tggcagcaga 720
attgggtttg gttcctttct caatgagagc gcaagcttcg cagatcaagc actctttgag 780
aagcacttca acatccccag tcaaaacttc tccgttgtcc tgatcaacgg tggaacggat 840
ctccctcagc cgccttctga cgccaacgat ggcgaagcca acctggacgc tcaaaccatt 900
ttgaccatcg cacatcctct ccccatcacc gaattcatca ccgccggcag tccgccatac 960
ttccccgatc cagttgaacc tgcgggaaca cccaacgaga acgagcctta tttacagtat 1020
tacgaatttc tgttgtccaa gtccaacgct gaaattccgc aagtcattac caactcctac 1080
ggcgacgagg agcaaactgt gccgcggtca tatgccgttc gagtttgcaa tctgattggt 1140
ctgctaggac tacgcggtat ctctgtcctt cattcctcgg gcgacgaggg tgtgggcgcc 1200
tcttgcgttg ctaccaacag caccacgcct cagtttaacc ccatctttcc tgctacatgt 1260
ccttatgtta caagtgttgg cggaaccgtg agcttcaatc ccgaggttgc ctgggctggt 1320
tcatctggag gtttcagcta ctacttctct agaccctggt accagcagga agctgtgggt 1380
acttaccttg agaaatatgt cagtgctgag acaaagaaat actatggacc ttatgtcgat 1440
ttctccggac gaggtttccc cgatgttgca gcccacagcg tcagccccga ctatcctgtg 1500
tttcagggcg gtgaactcac cccaagcgga ggcacttcag cagcctctcc tgtcgtagca 1560
gccatcgtgg cgctgttgaa cgatgcccgt ctccgcgaag gaaaacccac gcttggattt 1620
ctcaatccgc tgatttacct acacgcctcc aaagggttca ccgacatcac ctcgggccaa 1680
tctgaagggt gcaacggcaa taacacccag acgggcagtc ctctcccagg agccggcttc 1740
attgcaggcg cacactggaa cgcgaccaag ggatgggacc cgacgactgg atttggtgtt 1800
ccaaacctca aaaagctcct cgcacttgtc cggttctaa 1839
<210> 29
<211> 1845
<212> DNA
<213> 嗜热嗜热子囊菌
<400> 29
atgttgtcgt cccttcttgg ccggggcgcc gcgtcgctcg cgatcatttc gctctttaca 60
ccgtcagttg caggcgaggt ttttgagaga ttgcgcgcgg ttccagaagg ctggaggttc 120
tccgcaacac cgagcgatga ccagccaatt cggctgcaga ttgcgctcca acagcacgat 180
gtggagggct tcgagagggc ggttctggat atgtccacgc cgtctagccc caactatggc 240
aagcactttc agtcccacga cgagatgaag aggatgctcc tccccagcga cgatgcggtg 300
gacgctgtcc tggattggct gcagtccgcc gggatcaccg acatcgaaga agacgccgac 360
tggatcaact tccgcacgac cgtcggagtt gccaacgagc tcttggatac ccagttccag 420
tggttcgtca gcgagaccag cagccatgta cgccggctcc gggccctcga gtactccatc 480
ccagagtctg tgactccgca tatccacatg gtccagccta caacccgttt cgggcagatc 540
ggtcgacacc acaccacctc ccgcgagaaa cccattgtct ctggtgctga tatccacgcc 600
tcgatcgccg gggctaataa tcaaaccacc ggcactgact gtaacacgga gatcacgccc 660
aagtgtctgc aggatctgta caagttcgga ggctacaagg caagtgctaa cagcggcagc 720
aaggtcggct tctgcagcta cctcgaggag tacgctcgct acgacgatct tgccctgttc 780
gaagaggcgc ttgctcctta tgccgcaggg caaaatttct ccgtgatcac atacaacggt 840
ggtctcaacg accagcactc ctccagtgac agtggcgaag caaatctcga tctgcagtac 900
attgtcggag tgagcgctcc gctccctgtc accgagttca gcaccggtgg acgcggtgag 960
ctggtcccgg atctcgacca gccaaacccg gccgacaatt ccaacgagcc gtatctggac 1020
ttcctgcaga acgtgctgaa gctggaccag aaggatcttc ctcaggtcat ttctacctca 1080
tatggtgaaa acgagcagag cgttccggag aaatacgccc gttcggtctg caacctgttc 1140
atgcagctgg gaagtcgtgg cgtatccgtc atcttctcca gcggtgactc cggggttggc 1200
tcagcttgtc tgaccaacga tggcaagaac cagacccgtt tcatgccgca gtttccagcc 1260
tcctgcccct gggtgacctc cgtcggctcg acgcagcaca tcgcccccga agaagccacc 1320
tacttctcct ccggcggctt ctcggacctc tggcccatgc cggactacca gaagtctgcc 1380
gtgggcgagt atctcgacag gctcggcagc aagtgggccg gtctgtacaa ccctcaaggc 1440
cgcggcttcc ccgacgtcgc cgctcaaggc gtgaacttca acgtctatga caagggctca 1500
ctcaagcggt tcgacggcac gtcctgctcc gcgcccacat ttgccggtgt catcgccctc 1560
ctgaacgatg cccgtctccg agcccgccag cctccgatgg gcttcctgaa cccctggctc 1620
tacggcgctg gcaagggcgg tcttaacgac atcgtcaacg gcggtagcac tgggtgcgac 1680
ggcaacgctc gctttggcgg tgcgccgaac ggcagcccgg tggttccctt cgcgagctgg 1740
aacgcgacgc aggggtggga tcccgtcagc gggctgggga cgccggactt ttccaggctg 1800
ctgaagctgg ccgttccctc gagggttgga gggcgcttgg cgtaa 1845
<210> 30
<211> 1785
<212> DNA
<213> 疏棉状嗜热丝孢菌
<400> 30
atgtgtaggt tacggccctt ggtcggcttc ctggccctgt ctctctcctt ggtgaatgcc 60
ctcgcggccc cgttccaggt cgttgagcgg ctgtcagcac ccccagatgg ctggatcaag 120
aaggagaagg cggccccgtc cgcgcagatt cagttccgct tgggcctgcc acagcagaat 180
tcagagcaac tcgagcaatt ggctctgaat attgcgaccc cgggccatga gctgtaccgg 240
aaacacctga agcgcgacga aatcaaggct ctggtgcgcc cattggcttc cgtgtcggaa 300
aaggttttgg catggctccg agatgagggc gttccagaag accgcattca tgacgatggt 360
gcttggatca agtttaccgt accggtcagc acggccgaga agttgctgaa caccgagttc 420
ttcgtgttcc acaacgagag gacgggcgcc gagcagattc ggaccctgga gtactcggtg 480
ccccaggata tccactcatt ggtcaagttc attcagccga cgacacactt cagcagcctg 540
ggtccccaag tgcgccgcgt ggtccccctg gatgtgcttc cgaagttgag gatcactttg 600
gaggattgca acaagaagat cacgcccgac tgcctgaagc aactgtacaa gattggcgat 660
tatgtggccc ccgaagatcc gcgaaacagg attggcatct cgggctatct ggagcagttt 720
gctcggtatg ctgactttga ggagttcctg gagtcgtatg cccccgatcg gaccgatgcc 780
aacttcaccg tcgtgtccat caatggcggc aggaacgacc agaactcgac gctcgacagc 840
acggaagcat ccctggatat cgactacgca gtgacgctgt cctacaagac gcaagccgta 900
tactatacaa ccgcgggacg tggccccctg gtgcccgacg agagccagcc cgatcccaat 960
gaggtgtcca atgagcctta catggagcag ctgcagttcc tgttggattt gccggatgag 1020
gagctgccga cggtgctcac gacgtcgtac ggagagaatg agcagtcctt gcctgggtcc 1080
tacgccgatg agacatgcaa catgttccgt ttgctgggca tgcgcggggt ctcggtcatc 1140
ttcagcagcg gcgactgggg caccgggatt gtgtgcaagg caaatgacgg ttccgagcgc 1200
atcaagttcg accctgtcta cccggcaagc tgcccgtatg tgacttcggt cggcggcacg 1260
actggggtca acccggagcg cgccgttgag ttctcctcgg gcggattttc cgaccggttc 1320
ccgcgtccca agtaccagga cgaagcggtg cggtcgtatc tgaccaaatt gggtgatcat 1380
tggaagggcc tgtacaacga aagcggccgt gcattccccg atgtggctgc gcaggcggac 1440
aactttgtcg ttcgtgacca gggccagtgg gtcagcgttg gtggaacgag tgcctctgcc 1500
ccggtcttcg ccgcgatcat tgccaacgtg aacgcggagc tgctgaaggc aggcaagcct 1560
ccgctcgggt tcttgaaccc gtggctctac ggactgaaag gtcgtggctt cacggatgtt 1620
gtgcatggtg gttcgactgg ctgccctgga actgttccgt ggactggact gccagccgga 1680
cacgtgccat acgcgagctg gaacgcaacc gagggttggg atccagtgac gggattgggt 1740
actcctctgt acgacgagct ggtgaaggct gctttgggaa agtaa 1785
<210> 31
<211> 417
<212> PRT
<213> 黑曲霉
<400> 31
Lys Lys Thr Asp Pro Gly Ser Leu Gly Ile Asp Pro Gly Val Lys Gln
1 5 10 15
Tyr Thr Gly Tyr Leu Asp Asp Asn Glu Asn Asp Lys His Leu Phe Tyr
20 25 30
Trp Phe Phe Glu Ser Arg Asn Asp Pro Glu Asn Asp Pro Val Val Leu
35 40 45
Trp Leu Asn Gly Gly Pro Gly Cys Ser Ser Leu Thr Gly Leu Phe Met
50 55 60
Glu Leu Gly Pro Ser Ser Ile Asn Lys Lys Ile Gln Pro Val Tyr Asn
65 70 75 80
Asp Tyr Ala Trp Asn Ser Asn Ala Ser Val Ile Phe Leu Asp Gln Pro
85 90 95
Val Asn Val Gly Tyr Ser Tyr Ser Asn Ser Ala Val Ser Asp Thr Val
100 105 110
Ala Ala Gly Lys Asp Val Tyr Ala Leu Leu Thr Leu Phe Phe Lys Gln
115 120 125
Phe Pro Glu Tyr Ala Lys Gln Asp Phe His Ile Ala Gly Glu Ser Tyr
130 135 140
Ala Gly His Tyr Ile Pro Val Phe Ala Ser Glu Ile Leu Ser His Lys
145 150 155 160
Lys Arg Asn Ile Asn Leu Gln Ser Val Leu Ile Gly Asn Gly Leu Thr
165 170 175
Asp Gly Tyr Thr Gln Tyr Glu Tyr Tyr Arg Pro Met Ala Cys Gly Asp
180 185 190
Gly Gly Tyr Pro Ala Val Leu Asp Glu Ser Ser Cys Gln Ser Met Asp
195 200 205
Asn Ala Leu Pro Arg Cys Gln Ser Met Ile Glu Ser Cys Tyr Ser Ser
210 215 220
Glu Ser Ala Trp Val Cys Val Pro Ala Ser Ile Tyr Cys Asn Asn Ala
225 230 235 240
Leu Leu Ala Pro Tyr Gln Arg Thr Gly Gln Asn Val Tyr Asp Val Arg
245 250 255
Gly Lys Cys Glu Asp Ser Ser Asn Leu Cys Tyr Ser Ala Met Gly Tyr
260 265 270
Val Ser Asp Tyr Leu Asn Lys Pro Glu Val Ile Glu Ala Val Gly Ala
275 280 285
Glu Val Asn Gly Tyr Asp Ser Cys Asn Phe Asp Ile Asn Arg Asn Phe
290 295 300
Leu Phe His Gly Asp Trp Met Lys Pro Tyr His Arg Leu Val Pro Gly
305 310 315 320
Leu Leu Glu Gln Ile Pro Val Leu Ile Tyr Ala Gly Asp Ala Asp Phe
325 330 335
Ile Cys Asn Trp Leu Gly Asn Lys Ala Trp Thr Glu Ala Leu Glu Trp
340 345 350
Pro Gly Gln Ala Glu Tyr Ala Ser Ala Glu Leu Glu Asp Leu Val Ile
355 360 365
Val Asp Asn Glu His Thr Gly Lys Lys Ile Gly Gln Val Lys Ser His
370 375 380
Gly Asn Phe Thr Phe Met Arg Leu Tyr Gly Gly Gly His Met Val Pro
385 390 395 400
Met Asp Gln Pro Glu Ser Ser Leu Glu Phe Phe Asn Arg Trp Leu Gly
405 410 415
Gly
<210> 32
<211> 575
<212> PRT
<213> 黑曲霉
<400> 32
Ile Val His Glu Lys Leu Ala Ala Val Pro Ser Gly Trp His His Val
1 5 10 15
Glu Asp Ala Gly Ser Asp His Gln Ile Ser Leu Ser Ile Ala Leu Ala
20 25 30
Arg Lys Asn Leu Asp Gln Leu Glu Ser Lys Leu Lys Asp Leu Ser Thr
35 40 45
Pro Gly Glu Ser Gln Tyr Gly Gln Trp Leu Asp Gln Glu Asp Val Asp
50 55 60
Thr Leu Phe Pro Val Ala Ser Asp Lys Ala Val Ile Asn Trp Leu Arg
65 70 75 80
Ser Ala Asn Ile Thr His Ile Ser Arg Gln Gly Ser Leu Val Asn Phe
85 90 95
Ala Thr Thr Val Asp Lys Val Asn Lys Leu Leu Asn Ala Thr Phe Ala
100 105 110
Tyr Tyr Gln Ser Gly Ser Ser Gln Arg Leu Arg Thr Thr Glu Tyr Ser
115 120 125
Ile Pro Asp Asp Leu Val Asp Ser Ile Asp Leu Ile Ser Pro Thr Thr
130 135 140
Phe Phe Gly Lys Glu Lys Thr Thr Ala Gly Leu Asn Gln Arg Ala Gln
145 150 155 160
Lys Ile Asp Thr His Val Ala Lys Arg Ser Asn Ser Ser Ser Cys Ala
165 170 175
Asp Val Ile Thr Leu Ser Cys Leu Lys Glu Met Tyr Asn Phe Gly Asn
180 185 190
Tyr Thr Pro Ser Ala Ser Ser Gly Ser Lys Leu Gly Phe Gly Ser Phe
195 200 205
Leu Asn Glu Ser Ala Ser Tyr Ser Asp Leu Ala Lys Phe Glu Lys Leu
210 215 220
Phe Asn Leu Pro Ser Gln Ser Phe Ser Val Glu Leu Val Asn Gly Gly
225 230 235 240
Val Asn Asp Gln Asn Gln Ser Thr Ala Ser Leu Thr Glu Ala Asp Leu
245 250 255
Asp Val Glu Leu Leu Val Gly Val Ala His Pro Leu Pro Val Thr Glu
260 265 270
Phe Ile Thr Ser Gly Glu Pro Pro Phe Ile Pro Asp Pro Asp Glu Pro
275 280 285
Ser Ala Ala Asp Asn Glu Asn Glu Pro Tyr Leu Gln Tyr Tyr Glu Tyr
290 295 300
Leu Leu Ser Lys Pro Asn Ser Ala Leu Pro Gln Val Ile Ser Asn Ser
305 310 315 320
Tyr Gly Asp Asp Glu Gln Thr Val Pro Glu Tyr Tyr Ala Lys Arg Val
325 330 335
Cys Asn Leu Ile Gly Leu Val Gly Leu Arg Gly Ile Ser Val Leu Glu
340 345 350
Ser Ser Gly Asp Glu Gly Ile Gly Ser Gly Cys Arg Thr Thr Asp Gly
355 360 365
Thr Asn Arg Thr Gln Phe Asn Pro Ile Phe Pro Ala Thr Cys Pro Tyr
370 375 380
Val Thr Ala Val Gly Gly Thr Met Ser Tyr Ala Pro Glu Ile Ala Trp
385 390 395 400
Glu Ala Ser Ser Gly Gly Phe Ser Asn Tyr Phe Glu Arg Ala Trp Phe
405 410 415
Gln Lys Glu Ala Val Gln Asn Tyr Leu Ala His His Ile Thr Asn Glu
420 425 430
Thr Lys Gln Tyr Tyr Ser Gln Phe Ala Asn Phe Ser Gly Arg Gly Phe
435 440 445
Pro Asp Val Ala Ala His Ser Phe Glu Pro Ser Tyr Glu Val Ile Phe
450 455 460
Tyr Gly Ala Arg Tyr Gly Ser Gly Gly Thr Ser Ala Ala Cys Pro Leu
465 470 475 480
Phe Ser Ala Leu Val Gly Met Leu Asn Asp Ala Arg Leu Arg Ala Gly
485 490 495
Lys Ser Thr Leu Gly Phe Leu Asn Pro Leu Leu Tyr Ser Lys Gly Tyr
500 505 510
Arg Ala Leu Thr Asp Val Thr Gly Gly Gln Ser Ile Gly Cys Asn Gly
515 520 525
Ile Asp Pro Gln Asn Asp Glu Thr Val Ala Gly Ala Gly Ile Ile Pro
530 535 540
Trp Ala His Trp Asn Ala Thr Val Gly Trp Asp Pro Val Thr Gly Leu
545 550 555 560
Gly Leu Pro Asp Phe Glu Lys Leu Arg Gln Leu Val Leu Ser Leu
565 570 575

Claims (41)

1.一种用于从含淀粉材料产生发酵产物的方法,所述方法包括:
a)使用产碳水化合物源的酶在低于所述含淀粉材料的初始糊化温度的温度使所述含淀粉材料糖化;以及
b)使用发酵生物进行发酵;
其中步骤a)和/或b)在内切蛋白酶和外切蛋白酶混合物存在下进行,并且其中所述外切蛋白酶以总蛋白酶酶蛋白为基础构成所述蛋白酶混合物的至少5%(w/w)。
2.一种用于从含淀粉材料产生发酵产物的方法,所述方法包括以下步骤:
(a)在高于所述含淀粉材料的初始糊化温度的温度,在α-淀粉酶存在下,液化所述含淀粉材料;
(b)使用产碳水化合物源的酶来使步骤(a)中获得的液化材料糖化;
(c)使用发酵生物进行发酵;
其中步骤b)和/或c)在内切蛋白酶和外切蛋白酶混合物存在下进行,并且其中所述外切蛋白酶以总蛋白酶酶蛋白为基础构成所述蛋白酶混合物的至少5%(w/w)。
3.根据权利要求1或2所述的方法,其中糖化和发酵同时进行。
4.根据前述权利要求中任一项所述的方法,其中所述外切蛋白酶以总蛋白酶酶蛋白为基础构成所述蛋白酶混合物的至少10%(w/w),例如至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、特别地至少75%、更特别地所述外切蛋白酶以总蛋白酶酶蛋白为基础构成组合物中所述蛋白酶混合物的从5%至95%(w/w)、特别地10%至80%(w/w)、特别地15%至70%(w/w)、更特别地20%至60%(w/w)、以及甚至更特别地25%至50%(w/w)。
5.根据前述权利要求中任一项所述的方法,其中所述内切蛋白酶和外切蛋白酶以5:2微克酶蛋白(EP)/g干固体(DS)的比例存在,特别地是5:3,更特别地是5:4。
6.根据权利要求1-5中任一项所述的方法,其中所述内切蛋白酶源自属于S53、S8、M35、A1家族的蛋白酶。
7.根据权利要求1-5中任一项所述的方法,其中所述外切蛋白酶源自属于S10、S53、M14、M28家族的蛋白酶。
8.如权利要求6所述的方法,其中所述S53蛋白酶源自亚灰树花菌属的菌株,更特别地大型亚灰树花菌。
9.如权利要求6所述的方法,其中所述S8蛋白酶源自火球菌属、高温球菌属的菌株,特别地强烈火球菌和嗜热高温球菌。
10.根据权利要求7所述的方法,其中所述S53外切蛋白酶来源于曲霉属、木霉属、嗜热子囊菌属或嗜热真菌属的菌株,特别是米曲霉、黑曲霉、里氏木霉、嗜热嗜热子囊菌或疏棉状嗜热丝孢菌。
11.如前述权利要求中任一项所述的方法,其中在糖化和/或发酵过程中存在和/或添加α-淀粉酶。
12.根据权利要求11所述的方法,其中所述α-淀粉酶是酸性α-淀粉酶,优选地是酸性真菌α-淀粉酶。
13.根据权利要求12所述的方法,其中所述α-淀粉酶是源自曲霉属,特别是土曲霉、黑曲霉、米曲霉、泡盛曲霉、或白曲霉的菌株;或者源自根毛霉属,优选是微小根毛霉的菌株;或者源自亚灰树花菌属,优选是大型亚灰树花菌的菌株。
14.如权利要求11-13中任一项所述的方法,其中所述α-淀粉酶以0.001至10AFAU/gDS,优选地0.01至5AFAU/g DS,特别地0.3至2AFAU/g DS或0.001至1FAU-F/g DS,优选地0.01至1FAU-F/g DS的量存在。
15.如权利要求1-14中任一项所述的方法,其中所述产碳水化合物源的酶选自下组,该组由以下组成:葡糖淀粉酶、α-葡糖苷酶、麦芽糖淀粉酶、支链淀粉酶和β-淀粉酶。
16.如权利要求1-15中任一项所述的方法,其中所述产碳水化合物源的酶是葡糖淀粉酶,并且以0.001至10AGU/g DS,优选地0.01至5AGU/g DS、特别地0.1至0.5AGU/g DS的量存在。
17.如权利要求11-16中任一项所述的方法,其中当糖化和发酵同时进行时,所述α-淀粉酶和葡糖淀粉酶以在0.1和100AGU/FAU-F之间,优选地在2和50AGU/FAU-F之间,特别地在10和40AGU/FAU-F之间的比率添加。
18.如权利要求11-17中任一项所述的方法,其中所述葡糖淀粉酶源自曲霉属的菌株,优选黑曲霉或泡盛曲霉,篮状菌属的菌株,特别是埃默森篮状菌;或阿太菌属的菌株,特别是罗耳阿太菌;栓菌属的菌株,优选瓣环栓菌;粘褶菌属的菌株,如篱边粘褶菌或密粘褶菌的菌株;密孔菌属的菌株,如血红密孔菌的菌株;或其混合物。
19.如权利要求1-18中任一项所述的方法,其中所述发酵产物是醇,优选乙醇,特别是燃料乙醇、饮用乙醇和/或工业乙醇。
20.如权利要求1-19中任一项所述的方法,其中所述发酵生物是酵母,优选酵母属的菌株,特别是酿酒酵母的菌株。
21.如权利要求1-20中任一项所述的方法,其中发酵在3和7之间,优选从3.5至6,或更优选从4至5的范围内的pH进行。
22.如权利要求1-21中任一项所述的方法,其中所述含淀粉材料的干固体含量是在从10-55w/w-%,优选地25-45w/w-%,更优选地30-40w/w-%的范围。
23.如权利要求3所述的方法,其中同时糖化和发酵期间的温度是在25℃和40℃之间,如在28℃和35℃之间,如在30℃和34℃之间,如约32℃。
24.如权利要求3所述的方法,其中同时糖化和发酵期间的pH选自范围3-7,优选4.0-6.5,更特别地4.5-5.5,例如pH 5.0。
25.如权利要求2-24中任一项所述的方法,其中液化在pH 4.0-6.5,优选在pH从4.5至5.5,例如pH 5.0进行。
26.如权利要求2-25中任一项所述的方法,其中液化温度为从70℃-95℃的范围,优选80℃-90℃,例如约85℃。
27.一种组合物,所述组合物包括内切蛋白酶和外切蛋白酶的混合物,并且其中所述外切蛋白酶以总蛋白酶酶蛋白为基础构成所述混合物中蛋白酶的至少5%(w/w),例如至少10%、至少15%、至少20%、至少25%、至少30%、至少35%、至少40%、至少45%、至少50%、至少55%、至少60%、至少65%、至少70%、特别地至少75%、更特别地所述外切蛋白酶以总蛋白酶酶蛋白为基础构成所述混合物中蛋白酶的从5%至95%(w/w)、特别地10%至80%(w/w)、特别地15%至70%(w/w)、更特别地20%至60%(w/w)、并且甚至更特别地以总蛋白酶酶蛋白为基础构成所述组合物中蛋白酶混合物的25%至50%(w/w)。
28.如权利要求27所述的组合物,其中所述内切蛋白酶源自属于S53、S8、M35或A1家族的蛋白酶,并且所述外切蛋白酶源自属于S10、S53、M14或M28家族的蛋白酶。
29.根据权利要求28所述的组合物,其中所述内切蛋白酶是来自大型亚灰树花菌的S53并且所述外切蛋白酶是来自米曲霉、黑曲霉或简青霉的S10。
30.根据权利要求28所述的组合物,其中所述S53外切蛋白酶来源于曲霉属、木霉属、嗜热子囊菌属或嗜热真菌属的菌株,特别是米曲霉、黑曲霉、里氏木霉、嗜热嗜热子囊菌或疏棉状嗜热丝孢菌。
31.如权利要求27-30中任一项所述的组合物,所述组合物进一步包含选自下组的产碳水化合物源的酶,该组由以下组成:葡糖淀粉酶、α-葡糖苷酶、麦芽糖淀粉酶和β-淀粉酶。
32.如权利要求31所述的组合物,其中所述产碳水化合物源的酶选自下组的葡糖淀粉酶,所述组的葡糖淀粉酶源自:曲霉属的菌株,优选黑曲霉或泡盛曲霉,木霉属的菌株,特别是里氏木霉,篮状菌属的菌株,特别是埃默森篮状菌;或阿太菌属的菌株,特别是罗耳阿太菌;栓菌属的菌株,优选瓣环栓菌;粘褶菌属的菌株,如篱边粘褶菌或密粘褶菌的菌株;密孔菌属的菌株,如血红密孔菌的菌株;或其混合物。
33.如权利要求27-32中任一项所述的组合物,所述组合物进一步包含选自下组的α-淀粉酶,该组由源自以下的真菌α-淀粉酶组成:优选地曲霉属,特别是土曲霉、黑曲霉、米曲霉、泡盛曲霉或白曲霉的菌株;或者根毛霉属的菌株,优选是微小根毛霉的菌株;或者亚灰树花菌属,优选是大型亚灰树花菌的菌株。
34.根据权利要求27-33中任一项所述的组合物在含淀粉材料的糖化中的用途。
35.一种具有丝氨酸蛋白酶活性并且属于S10家族的多肽,所述多肽选自由以下组成的组:
(a)多肽,所述多肽与SEQ ID NO:6的成熟多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性;
(b)由多核苷酸编码的多肽,所述多核苷酸与SEQ ID NO:8的成熟多肽编码序列具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性;
(c)(a)、或(b)的多肽的片段,所述片段具有丝氨酸蛋白酶活性。
36.一种具有丝氨酸蛋白酶活性并且属于S53家族的多肽,所述多肽选自由以下组成的组:
(a)多肽,所述多肽与SEQ ID NO:23的成熟多肽具有至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性;或
(b)由多核苷酸编码的多肽,所述多核苷酸与SEQ ID NO:29的成熟多肽编码序列具有至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性;或
(c)(a)、或(b)的多肽的片段,所述片段具有丝氨酸蛋白酶活性。
37.一种具有丝氨酸蛋白酶活性并且属于S53家族的多肽,所述多肽选自由以下组成的组:
(a)多肽,所述多肽与SEQ ID NO:25的成熟多肽具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性;或
(b)由多核苷酸编码的多肽,所述多核苷酸与SEQ ID NO:30的成熟多肽编码序列具有至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性;或
(c)(a)、或(b)的多肽的片段,所述片段具有丝氨酸蛋白酶活性。
38.一种多核苷酸,所述多核苷酸编码如权利要求35-37中任一项所述的多肽。
39.一种核酸构建体或表达载体,所述核酸构建体或表达载体包含如权利要求38所述的多核苷酸,所述多核苷酸可操作地连接至指导在表达宿主内产生所述多肽的一个或多个控制序列。
40.一种重组宿主细胞,所述重组宿主细胞包含如权利要求39所述的异源多核苷酸,所述多核苷酸可操作地连接至指导所述多肽的产生的一个或多个控制序列。
41.一种产生如权利要求35-37中任一项所述的多肽的方法,所述方法包括:在有益于产生所述多肽的条件下培养如权利要求90所述的宿主细胞。
CN201780012025.5A 2016-03-01 2017-03-01 在ssf方法中组合使用至少一种内切蛋白酶和至少一种外切蛋白酶以改善乙醇产量 Pending CN108884478A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201662301848P 2016-03-01 2016-03-01
US62/301,848 2016-03-01
CN2016089605 2016-07-11
CNPCT/CN2016/089605 2016-07-11
PCT/CN2017/075326 WO2017148389A1 (en) 2016-03-01 2017-03-01 Combined use of at least one endo-protease and at least one exo-protease in an ssf process for improving ethanol yield

Publications (1)

Publication Number Publication Date
CN108884478A true CN108884478A (zh) 2018-11-23

Family

ID=59742566

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201780012025.5A Pending CN108884478A (zh) 2016-03-01 2017-03-01 在ssf方法中组合使用至少一种内切蛋白酶和至少一种外切蛋白酶以改善乙醇产量

Country Status (6)

Country Link
US (1) US20200165591A1 (zh)
EP (1) EP3423584A4 (zh)
CN (1) CN108884478A (zh)
CA (1) CA3012508A1 (zh)
MX (1) MX2018009493A (zh)
WO (1) WO2017148389A1 (zh)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2018275794A1 (en) * 2017-06-02 2019-12-05 Novozymes A/S Improved yeast for ethanol production
CN111148841A (zh) * 2017-08-30 2020-05-12 诺维信公司 M35家族的内切蛋白酶和s53家族的外切蛋白酶在淀粉发酵中的组合使用
WO2020160126A1 (en) * 2019-01-31 2020-08-06 Novozymes A/S Polypeptides having xylanase activity and use thereof for improving the nutritional quality of animal feed
CA3143527A1 (en) * 2019-08-06 2021-02-11 Novozymes A/S Fusion proteins for improved enzyme expression
CN112680371A (zh) * 2019-10-18 2021-04-20 广东利世康低碳科技有限公司 一种水解餐厨垃圾中蛋白成分的产朊假丝酵母双基因共表达菌株及其构建方法
EP4087936A1 (en) * 2020-01-07 2022-11-16 Danisco US Inc. Methods and compositions for enhanced ethanol production

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101959425A (zh) * 2008-03-05 2011-01-26 诺维信公司 饲料产品中黄曲霉毒素的解毒
CN102083991A (zh) * 2008-06-23 2011-06-01 诺维信公司 生产发酵产物的方法
CN103987850A (zh) * 2011-10-11 2014-08-13 诺维信北美公司 用于产生发酵产物的方法
WO2015078372A1 (en) * 2013-11-26 2015-06-04 Novozymes A/S Milling process
CN104694595A (zh) * 2005-02-07 2015-06-10 诺维信北美公司 发酵产品产生方法
CN104812905A (zh) * 2012-11-30 2015-07-29 诺维信公司 用于生产发酵产物的方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20080227166A1 (en) * 2004-01-16 2008-09-18 Novozymes A/S Fermentation Processes
WO2014205198A1 (en) * 2013-06-20 2014-12-24 Novozymes A/S Fermentation processes with reduced foaming
WO2015143324A1 (en) * 2014-03-21 2015-09-24 Novozymes A/S Processes for producing ethanol and yeast

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104694595A (zh) * 2005-02-07 2015-06-10 诺维信北美公司 发酵产品产生方法
CN101959425A (zh) * 2008-03-05 2011-01-26 诺维信公司 饲料产品中黄曲霉毒素的解毒
CN102083991A (zh) * 2008-06-23 2011-06-01 诺维信公司 生产发酵产物的方法
CN103987850A (zh) * 2011-10-11 2014-08-13 诺维信北美公司 用于产生发酵产物的方法
CN104812905A (zh) * 2012-11-30 2015-07-29 诺维信公司 用于生产发酵产物的方法
WO2015078372A1 (en) * 2013-11-26 2015-06-04 Novozymes A/S Milling process

Also Published As

Publication number Publication date
CA3012508A1 (en) 2017-09-08
MX2018009493A (es) 2018-09-05
US20200165591A1 (en) 2020-05-28
EP3423584A4 (en) 2020-02-26
EP3423584A1 (en) 2019-01-09
WO2017148389A1 (en) 2017-09-08

Similar Documents

Publication Publication Date Title
CN103781910B (zh) α淀粉酶变体及其编码多核苷酸
CN108884478A (zh) 在ssf方法中组合使用至少一种内切蛋白酶和至少一种外切蛋白酶以改善乙醇产量
US10472617B2 (en) Thermostable asparaginase variants and polynucleotides encoding same
CN105339494A (zh) 普鲁兰酶嵌合体以及编码它们的多核苷酸
US11447763B2 (en) Serine protease variants and polynucleotides encoding same
US10724054B2 (en) Use of serine proteases for improving ethanol yield
CN105164253A (zh) 葡糖淀粉酶变体和编码它们的多核苷酸
CN105960457A (zh) 普鲁兰酶变体以及编码它们的多核苷酸
CN106795505A (zh) 葡糖淀粉酶变体和编码它们的多核苷酸
CN108368528A (zh) 葡糖淀粉酶变体和编码它们的多核苷酸
EP3487995B1 (en) Serine protease variants and polynucleotides encoding same
CN110651048A (zh) 葡糖淀粉酶变体和编码它们的多核苷酸
CN106170545A (zh) α‑淀粉酶变体以及对其进行编码的多核苷酸
CN112105729B (zh) 具有α-淀粉酶活性的多肽以及编码它们的多核苷酸
CN105121638A (zh) 葡糖淀粉酶变体和编码它们的多核苷酸
CN103764670A (zh) 具有葡糖淀粉酶活性的多肽和编码它的多核苷酸
CN110072997A (zh) 具有蛋白酶活性的多肽和编码其的多核苷酸

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20181123