CN108350444A - 丝氨酸蛋白酶用于改进乙醇产量的用途 - Google Patents

丝氨酸蛋白酶用于改进乙醇产量的用途 Download PDF

Info

Publication number
CN108350444A
CN108350444A CN201680054930.2A CN201680054930A CN108350444A CN 108350444 A CN108350444 A CN 108350444A CN 201680054930 A CN201680054930 A CN 201680054930A CN 108350444 A CN108350444 A CN 108350444A
Authority
CN
China
Prior art keywords
polypeptide
seq
sequence
sequence identity
protease
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201680054930.2A
Other languages
English (en)
Inventor
郭新颜
N.E.克里尔
J.江普
M.C.胡斯
M.罗伯茨
小伯纳多.维达尔
K.詹森
H.弗里斯纳
T.霍夫
刘晔
汤岚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Novo Nordisk AS
Original Assignee
Novo Nordisk AS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Novo Nordisk AS filed Critical Novo Nordisk AS
Publication of CN108350444A publication Critical patent/CN108350444A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P7/00Preparation of oxygen-containing organic compounds
    • C12P7/02Preparation of oxygen-containing organic compounds containing a hydroxy group
    • C12P7/04Preparation of oxygen-containing organic compounds containing a hydroxy group acyclic
    • C12P7/06Ethanol, i.e. non-beverage
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/50Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/50Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
    • C12N9/52Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from bacteria or Archaea
    • C12N9/54Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from bacteria or Archaea bacteria being Bacillus
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/50Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
    • C12N9/58Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from fungi
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/50Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
    • C12N9/58Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from fungi
    • C12N9/62Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from fungi from Aspergillus
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01001Alpha-amylase (3.2.1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y304/00Hydrolases acting on peptide bonds, i.e. peptidases (3.4)
    • C12Y304/14Dipeptidyl-peptidases and tripeptidyl-peptidases (3.4.14)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y304/00Hydrolases acting on peptide bonds, i.e. peptidases (3.4)
    • C12Y304/21Serine endopeptidases (3.4.21)
    • CCHEMISTRY; METALLURGY
    • C13SUGAR INDUSTRY
    • C13KSACCHARIDES OBTAINED FROM NATURAL SOURCES OR BY HYDROLYSIS OF NATURALLY OCCURRING DISACCHARIDES, OLIGOSACCHARIDES OR POLYSACCHARIDES
    • C13K1/00Glucose; Glucose-containing syrups
    • C13K1/06Glucose; Glucose-containing syrups obtained by saccharification of starch or raw materials containing starch
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P2203/00Fermentation products obtained from optionally pretreated or hydrolyzed cellulosic or lignocellulosic material as the carbon source
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E50/00Technologies for the production of fuel of non-fossil origin
    • Y02E50/10Biofuels, e.g. bio-diesel

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Genetics & Genomics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Biochemistry (AREA)
  • General Health & Medical Sciences (AREA)
  • Biotechnology (AREA)
  • Microbiology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Mycology (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Emergency Medicine (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

提供了S53蛋白酶以及S53蛋白酶在用于将淀粉转化为乙醇的方法中的用途。

Description

丝氨酸蛋白酶用于改进乙醇产量的用途
序列表的引用
本申请含有计算机可读形式的序列表。将该计算机可读形式通过引用结合在此。
技术领域
本发明涉及用于由经糊化的和/或未经糊化的含淀粉材料生产发酵产物的方法。
背景技术
从含淀粉材料生产发酵产物,例如,乙醇,是本领域中熟知的。通常使用两种不同种类的方法。最常使用的方法通常被称作“传统方法”,包括在高温下典型地使用细菌α-淀粉酶液化经糊化的淀粉,随后在葡糖淀粉酶和发酵生物体的存在下进行同时糖化和发酵。另一种熟知的方法通常被称作“生淀粉水解”-方法(RSH方法),包括典型地在酸性真菌α-淀粉酶和葡糖淀粉酶的存在下在低于初始糊化温度处将颗粒淀粉同时糖化和发酵。
美国专利号5,231,017-A披露了在乙醇发酵期间在包含用α-淀粉酶液化经糊化的淀粉的方法中酸性真菌蛋白酶的用途。
WO 2003/066826披露了生淀粉水解方法(RSH方法),该生淀粉水解方法在真菌葡糖淀粉酶、α-淀粉酶和真菌蛋白酶的存在下,在非煮熟的醪液上进行。
WO 2007/145912披露了用于产生乙醇的方法,该方法包括在3.5至7.0的pH下并且在低于淀粉糊化温度处,将包含获得自植物材料的颗粒状淀粉的浆料与能够溶解颗粒状淀粉的α-淀粉酶接触持续5分钟至24小时的时间;获得包含大于20%葡萄糖的基质,并且在发酵生物体和淀粉水解酶的存在下,在10℃和40℃之间的温度处,发酵该基质持续10小时至250小时的时间。在接触步骤期间添加的另外的酶可以包括蛋白酶。
WO 2010/008841披露了通过使用至少葡糖淀粉酶和金属蛋白酶糖化淀粉材料并使用酵母生物体发酵,用于从经糊化的连同未经糊化的含淀粉材料产生发酵产物(如乙醇)的方法。具体地,该金属蛋白酶源自嗜热子囊菌的菌株。
WO 2014/037438披露了源自大型亚灰树花菌、变色栓菌、和污叉丝孔菌的丝氨酸蛋白酶及其在动物饲料中的用途。
WO 2015/078372披露了在淀粉湿碾磨方法中使用的源自大型亚灰树花菌、变色栓菌、和污叉丝孔菌的丝氨酸蛋白酶。
S53蛋白酶是本领域已知的。来自多叶奇果菌的S53肽,登录号为MER078639。来自褐腐菌(Uniprot:B8PMI5)的S53蛋白酶由Martinez等人,在“Genome,transcriptome,andsecretome analysis of wood decay fungus Postia placenta supports uniquemechanisms of lignocellulose conversion[支持木质纤维素转化的独特机制的木材腐朽菌真菌褐腐菌的基因组、转录组和分泌物分析]”,2009,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]106:1954-1959中进行了分离。
Vanden Wymelenberg等人在“Computational analysis of the Phanerochaetechrysosporium v2.0genome database and mass spectrometry identification ofpep-tides in ligninolytic cultures reveal complex mixtures of secretedproteins[揭示了所分泌的蛋白质的复杂混合物的黄孢原毛平革菌v2.0基因组数据库的计算分析和木质素溶解培养物中肽的质谱鉴定]”,2006,Fungal Genet.Biol.[真菌遗传学与生物学]43:343-356中已经分离了S53蛋白酶(Uniprot:Q281W2)。来自褐腐菌(Uniprot:B8P431)的另一个S53多肽由Martinez等人,在“Genome,transcriptome,and secretomeanalysis of wood decay fungus Postia placenta supports unique mechanisms oflignocellulose conversion[支持木质纤维素转化的独特机制的木材腐朽菌真菌褐腐菌的基因组、转录组和分泌物分析]”,2009,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]106:1954-1959中进行了鉴定。
Floudas等人在“The Paleozoic origin of enzymatic lignin decompositionre-constructed from 31fungal genomes[从31个真菌基因组重构的酶木质素分解的古生代来源]”,2012,Science[科学],336:1715-1719中已经公开了S53蛋白酶的序列。Fernandez-Fueyo等人在“Comparative genomics of Ceriporiopsis subvermispora andPhanerochaete chrysosporium provide insight into selective lig-ninolysis[提供了对选择性木质溶解的洞察的虫拟蜡菌和黄孢原毛平革菌的比较基因组学]”,2012,ProcNatl Acad Sci USA.[美国国家科学院院刊]109:5458-5463中已经公开了三个丝氨酸蛋白酶的序列(Uniprot:M2QQ01、Uniprot:M2QWH2、Uniprot:M2RD67)。
本发明的目的是当在糖化和/或发酵过程中添加/存在蛋白酶时,鉴定在淀粉至乙醇过程中将导致乙醇产量增加的所述蛋白酶。
发明内容
在第一方面,本发明提供了一种用于从含淀粉材料产生发酵产物的方法,该方法包括使用产碳水化合物源的酶和发酵生物体,在低于所述含淀粉材料的初始糊化温度的温度处,在属于S53家族的丝氨酸蛋白酶的存在下将含淀粉材料同时糖化和发酵。
在第二方面,本发明提供了一种用于从含淀粉材料产生发酵产物的方法,该方法包括以下步骤:
(a)在α-淀粉酶存在下使含淀粉材料液化;
(b)使用产碳水化合物源的酶来使步骤(a)中获得的液化材料糖化;
(c)使用发酵生物体体进行发酵;
其中属于家族53的丝氨酸蛋白酶在步骤b)和/或c)期间存在。
在另一方面,本发明提供了一种具有丝氨酸蛋白酶活性多肽,该多肽选自下组,该组由以下组成:
(a)多肽,该多肽与SEQ ID NO:12的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;
(b)由多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:10的成熟多肽编码序列具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
在另一方面,本发明提供了一种具有丝氨酸蛋白酶活性多肽,该多肽选自下组,该组由以下组成:
(a)多肽,该多肽与SEQ ID NO:15的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;
(b)由多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:13的成熟多肽编码序列具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
在另一方面,本发明提供了一种具有丝氨酸蛋白酶活性多肽,该多肽选自下组,该组由以下组成:
(a)多肽,该多肽与SEQ ID NO:27的多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;
(b)由多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:25的成熟多肽编码序列具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
在另一方面,本发明提供了一种具有丝氨酸蛋白酶活性多肽,该多肽选自下组,该组由以下组成:
(a)多肽,该多肽与SEQ ID NO:31的多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;
(b)由多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:29的成熟多肽编码序列具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
在另一方面,本发明提供了一种具有丝氨酸蛋白酶活性多肽,该多肽选自下组,该组由以下组成:
(a)多肽,该多肽与SEQ ID NO:38的成熟多肽,如SEQ ID NO:38的氨基酸195至560或SEQ ID NO:38的氨基酸190至560具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
在另一方面,本发明提供了一种具有丝氨酸蛋白酶活性多肽,该多肽选自下组,该组由以下组成:
(a)多肽,该多肽与SEQ ID NO:39的成熟多肽,如SEQ ID NO:39的氨基酸226至647或SEQ ID NO:39的氨基酸221至647具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
在另一方面,本发明涉及丝氨酸蛋白酶,具体是S53蛋白酶,在将经糊化的和/或未经糊化的含淀粉材料发酵为发酵产物中的用途。
在另一方面,本发明涉及一种组合物,该组合物包含S53蛋白酶和产碳水化合物源的酶、以及任选地α-淀粉酶。
在另一方面,本发明涉及编码本发明的多肽的多核苷酸。
在另一方面,本发明涉及一种核酸构建体或表达载体,该核酸构建体或表达载体包含本发明的多核苷酸,该多核苷酸有效地连接至指导该多肽在表达宿主中的产生的一个或多个控制序列。
在另一方面,本发明涉及一种重组宿主细胞,该重组宿主细胞包含本发明的多核苷酸,该多核苷酸有效地连接至指导该多肽的产生的一个或多个控制序列。
定义
S53蛋白酶:术语“S53”意指选自以下的蛋白酶活性:
(a)属于EC 3.4.21酶组的蛋白酶;和/或
(b)属于EC 3.4.14酶组的蛋白酶;和/或
(c)肽酶家族S53的丝氨酸蛋白酶,其包含两种不同类型的肽酶:三肽基氨肽酶(外切型)和内切肽酶;如在1993,Biochem.J.[生物化学杂志]290:205-218和在MEROPS蛋白酶数据库,发行9.4(2011年1月31日)(www.merops.ac.uk)中所述的。该数据库描述于Rawlings,N.D.,Barrett,A.J.和Bateman,A.,2010,“MEROPS:肽酶数据库(MEROPS:thepepti-dase database)”,Nucl.Acids Res.[核酸研究]38:D227-D233中。
为了确定给定蛋白酶是否为丝氨酸蛋白酶和S53家族的蛋白酶,可参考上述手册和其中述及的原理。可以对所有类型的蛋白酶进行这样的确定,而不论其是天然存在的或野生型蛋白酶;还是基因工程化的或合成的蛋白酶。
在一方面,该S53蛋白酶具有SEQ ID NO:3的成熟多肽的至少20%,例如,至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、或至少100%的蛋白酶活性。
在一方面,该S53蛋白酶具有SEQ ID NO:6的成熟多肽的至少20%,例如,至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、或至少100%的蛋白酶活性。
在一方面,该S53蛋白酶具有SEQ ID NO:9的成熟多肽的至少20%,例如,至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、或至少100%的蛋白酶活性。
在一方面,该S53蛋白酶具有SEQ ID NO:12的成熟多肽的至少20%,例如,至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、或至少100%的蛋白酶活性。
在一方面,该S53蛋白酶具有SEQ ID NO:15的成熟多肽的至少20%,例如,至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、或至少100%的蛋白酶活性。
在一方面,该S53蛋白酶具有SEQ ID NO:27的成熟多肽的至少20%,例如,至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、或至少100%的蛋白酶活性。
在一方面,该S53蛋白酶具有SEQ ID NO:31的成熟多肽的至少20%,例如,至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、或至少100%的蛋白酶活性。
在一方面,该S53蛋白酶具有SEQ ID NO:35的成熟多肽的至少20%,例如,至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、或至少100%的蛋白酶活性。
在一方面,该S53蛋白酶具有SEQ ID NO:38的成熟多肽的至少20%,例如,至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、或至少100%的蛋白酶活性。
在一方面,该S53蛋白酶具有SEQ ID NO:39的成熟多肽的至少20%,例如,至少40%、至少50%、至少60%、至少70%、至少80%、至少90%、至少95%、或至少100%的蛋白酶活性。
等位基因变体:术语“等位基因变体”意指占用同一染色体基因座的基因的两个或更多个替代形式中的任一者。等位基因变异通过突变天然产生,并且可能导致群体内的多态性。基因突变可以是沉默的(在所编码的多肽中没有改变)或可编码具有改变的氨基酸序列的多肽。多肽的等位基因变体是由基因的等位基因变体编码的多肽。
催化结构域:术语“催化结构域”意指酶的含有该酶的催化机构的区域。
cDNA:术语“cDNA”意指可以通过从获得自真核或原核细胞的成熟的剪接的mRNA分子进行反转录而制备的DNA分子。cDNA缺乏可存在于对应基因组DNA中的内含子序列。最初的初级RNA转录物是mRNA的前体,其在呈现为成熟的剪接的mRNA之前要通过一系列的步骤(包括剪接)进行加工。
编码序列:术语“编码序列”意指直接指定多肽的氨基酸序列的多核苷酸。编码序列的边界一般由开放阅读框决定,该开放阅读框架从起始密码子(如ATG、GTG或TTG)开始并且以终止密码子(如TAA、TAG或TGA)结束。编码序列可为基因组DNA、cDNA、合成DNA或其组合。
控制序列:术语“控制序列”意指对于表达编码本发明的成熟多肽的多核苷酸所必需的核酸序列。每个控制序列对于编码该多肽的多核苷酸来说可以是天然的(即来自相同基因)或外源的(即来自不同基因),或相对于彼此是天然的或外源的。此类控制序列包括但不限于前导子、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。在最低限度上,控制序列包括启动子、以及转录和翻译终止信号。出于引入有利于将这些控制序列与编码多肽的多核苷酸的编码区连接的特异性限制性酶切位点的目的,这些控制序列可以提供有多个接头。
内切蛋白酶:具有蛋白酶活性的多肽或蛋白酶有时还被指定为肽酶、朊酶、肽水解酶或蛋白水解酶。蛋白酶可以是始于任一端的水解肽的外切型蛋白酶(外肽酶)或在多肽链内部发挥作用的内切型蛋白酶(内肽酶)。
表达:术语“表达”包括涉及多肽产生的任何步骤,包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。
表达载体:术语“表达载体”意指线状或环状DNA分子,该分子包含编码多肽的多核苷酸并且该多核苷酸有效地连接至供用于其表达的控制序列。
片段:术语“片段”意指从成熟多肽或结构域的氨基和/或羧基末端缺失一个或多个(例如,若干个)氨基酸的多肽;其中该片段具有丝氨酸蛋白酶活性。
宿主细胞:术语“宿主细胞”意指易于用包含本发明的多核苷酸的核酸构建体或表达载体转化、转染、转导等的任何细胞类型。术语“宿主细胞”涵盖由于复制过程中发生的突变与亲本细胞不同的亲本细胞的任何后代。
分离的:术语“分离的”意指处于自然界中不存在的形式或环境中的物质。分离的物质的非限制性实例包括(1)任何非天然存在的物质,(2)包括但不限于任何酶、变体、核酸、蛋白质、肽或辅因子的任何物质,该物质至少部分地从与其天然相关的一种或多种或所有天然存在的组分中去除;(3)相对于自然界中发现的物质通过人工修饰的任何物质;或(4)通过相对于与其天然相关的其他组分增加物质的量而修饰的任何物质(例如,宿主细胞中的重组产生;编码该物质的基因的多个拷贝;以及使用比与编码该物质的基因天然相关的启动子更强的启动子)。分离的物质可以存在于发酵液样品中;例如,宿主细胞可以经遗传修饰以表达本发明的多肽。来自该宿主细胞的发酵液将包含分离的多肽。
成熟多肽:术语“成熟多肽”意指在翻译和任何翻译后修饰如N-末端加工、C-末端截短、糖基化作用、磷酸化作用等之后处于其最终形式的多肽。在一方面,成熟多肽是SEQID NO:2的氨基酸199至564。SEQ ID NO:2的氨基酸1至17是信号肽。在一方面,成熟多肽是SEQ ID NO:5的氨基酸200至565。SEQ ID NO:5的氨基酸1至17是信号肽。在一方面,成熟多肽是SEQ ID NO:8的氨基酸203至567。SEQ ID NO:8的氨基酸1至17是信号肽。在一方面,成熟多肽是SEQ ID NO:11的氨基酸202至567。SEQ ID NO:11的氨基酸1至18是信号肽。在一方面,成熟多肽是SEQ ID NO:14的氨基酸200至565。SEQ ID NO:14的氨基酸1至17是信号肽。在一方面,成熟多肽是SEQ ID NO:26的氨基酸203至565。SEQ ID NO:26的氨基酸1至17是信号肽。在一方面,成熟多肽是SEQ ID NO:30的氨基酸199至565。SEQ ID NO:30的氨基酸1至18是信号肽。在一方面,成熟多肽是SEQ ID NO:34的氨基酸209至639。SEQ ID NO:34的氨基酸1至28是信号肽。在一方面,成熟多肽是SEQ ID NO:38的氨基酸195至560。在另一方面,成熟多肽是SEQ ID NO:38的氨基酸190至560。SEQ ID NO:38的氨基酸1至19是信号肽。在一方面,成熟多肽是SEQ ID NO:39的氨基酸226至647。在另一方面,成熟多肽是SEQ ID NO:39的氨基酸221至647。SEQ ID NO:39的氨基酸1至16是信号肽。根据本发明使用的成熟S53多肽的N-末端基于EDMAN N-末端测序数据和完整的MS数据经实验证实。成熟多肽还包括SEQ IDNO:3(来自大型亚灰树花菌的成熟S53蛋白酶3)、SEQ ID NO:6(来自变色栓菌的成熟S53蛋白酶)、SEQ ID NO:9(污叉丝孔菌的成熟S53蛋白酶)、SEQ ID NO:12(来自漏斗多孔菌的成熟S53蛋白酶)、SEQ ID NO:15(来自桦革褶菌的成熟S53蛋白酶)、SEQ ID NO:27(来自灵芝的成熟S53蛋白酶)、SEQ ID NO:31(来自洁丽香菇(Neolentinu lepideus)的成熟S53蛋白酶)、和SEQ ID NO:35(来自芽孢杆菌属物种19138的成熟S53蛋白酶)。
在本领域中已知的是,宿主细胞可以产生由相同多核苷酸表达的两种或更多种不同的成熟多肽(即,具有不同的C-末端和/或N-末端氨基酸)的混合物。本领域还已知,不同的宿主细胞不同地加工多肽,并且因此一个表达多核苷酸的宿主细胞当与另一个表达相同多核苷酸的宿主细胞相比时可以产生一种不同的成熟多肽(例如,具有一个不同的C-末端和/或N-末端氨基酸)。
成熟多肽编码序列:术语“成熟多肽编码序列”意指编码具有丝氨酸蛋白酶活性的成熟多肽的多核苷酸。在一方面,成熟多肽编码序列是SEQ ID NO:10的核苷酸604至1701,并且SEQ ID NO:10的核苷酸1至54编码信号肽。在一方面,成熟多肽编码序列是SEQ ID NO:13的核苷酸598至1695,并且SEQ ID NO:13的核苷酸1至51编码信号肽。
核酸构建体:术语“核酸构建体”意指单链或双链的核酸分子,该核酸分子是从天然存在的基因中分离的,或以本来不存在于自然界中的方式被修饰成含有核酸的区段,或是合成的,该核酸分子包含一个或多个控制序列。
有效地连接:术语“有效地连接”意指将控制序列相对于多核苷酸的编码序列安置在适当位置这样使得该控制序列指导该编码序列的表达的构型。
蛋白酶活性:术语“蛋白酶活性”意指蛋白水解活性(EC 3.4)。存在若干种蛋白酶活性类型,例如在Arg和Lys残基的羧基末端侧切割的胰蛋白酶样蛋白酶以及在疏水性氨基酸残基的羧基末端侧切割的糜蛋白酶样蛋白酶。本发明的蛋白酶是具有酸性最适pH(最适pH<pH 7)的丝氨酸内肽酶(EC 3.4.21)。
可以使用任何测定来测量蛋白酶活性,其中采用一种底物,该底物包括与所讨论的蛋白酶的特异性相关的肽键。测定pH和测定温度同样适用于所讨论的蛋白酶。测定pH值的实例是pH 2、3、4、5、6、7、8、9、10、11或12。测定温度的实例是15℃、20℃、25℃、30℃、35℃、37℃、40℃、45℃、50℃、55℃、60℃、65℃、70℃、80℃、90℃、或95℃。普通蛋白酶底物的实例是酪蛋白、牛血清白蛋白以及血红蛋白。在经典的Anson和Mirsky方法中,将变性的血红蛋白用作底物并且在用所讨论的蛋白酶孵育测定后,确定三氯乙酸可溶的血红蛋白的量用作蛋白酶活性的量度(Anson,M.L.和Mirsky,A.E.,1932,J.Gen.Physiol.[普通生理学杂志]16:59以及Anson,M.L.,1938,J.Gen.Physiol.[普通生理学杂志]22:79)。
出于本发明的目的,使用描述于“材料与方法”中的测定确定蛋白酶活性,如动力学Suc-AAPF-pNA测定、普罗塔酶AK(Protazyme AK)测定、动力学Suc-AAPX-pNA测定以及邻苯二甲醛(OPA)。对于普罗塔酶AK测定,当用该蛋白酶孵育时,不可溶普罗塔酶AK(天青精-交联的酪蛋白)底物释放蓝色并且确定该颜色作为蛋白酶活性的量度。对于Suc-AAPF-pNA测定,当用该蛋白酶孵育时,无色的Suc-AAPF-pNA底物释放黄色的对硝基苯胺并且确定该黄色作为蛋白酶活性的量度。
序列一致性:用参数“序列一致性”来描述两个氨基酸序列之间或两个核苷酸序列之间的相关性。
出于本发明的目的,使用如在EMBOSS包(EMBOSS:欧洲分子生物学开放软件套件(The European Molecular Biology Open Software Suite),Rice等人,2000,TrendsGenet.[遗传学趋势]16:276-277)(优选5.0.0版本或更新版本)的Needle程序中所实施的Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.[分子生物学杂志]48:443-453)来确定两个氨基酸序列之间的序列一致性。使用的这些参数是空位开放罚分10、空位延伸罚分0.5,以及EBLOSUM62(BLOSUM62的EMBOSS版本)取代矩阵。将标记为“最长一致性”的Needle输出(使用-非简化(-nobrief)选项获得)用作百分比一致性并且是如下计算的:
(一致的残基×100)/(比对长度-比对中的空位总数)
出于本发明的目的,使用如在EMBOSS包(EMBOSS:欧洲分子生物学开放软件套件,Rice等人,2000,见上文)(优选5.0.0版或更新版本)的Needle程序中所实施的Needleman-Wunsch算法(Needleman和Wunsch,1970,见上文)来确定两个脱氧核糖核苷酸序列之间的序列一致性。所使用的参数是空位开放罚分10,空位延伸罚分0.5,以及EDNAFULL(NCBINUC4.4的EMBOSS版)取代矩阵。将标记为“最长一致性”的Needle输出(使用-非简化(-nobrief)选项获得)用作百分比一致性并且是如下计算的:
(一致的脱氧核糖核苷酸x 100)/(比对长度-比对中的空位总数)
严格条件:术语“非常低严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃处在5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和25%甲酰胺中预杂交和杂交12至24小时。最后在45℃处使用2X SSC、0.2%SDS将载体材料洗涤三次,每次15分钟。
术语“低严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃处在5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和25%甲酰胺中预杂交和杂交12至24小时。最后在50℃处使用2X SSC、0.2%SDS将载体材料洗涤三次,每次15分钟。
术语“中严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃处在5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和35%甲酰胺中预杂交和杂交12至24小时。最后在55℃处使用2X SSC、0.2%SDS将载体材料洗涤三次,每次15分钟。
术语“中-高严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃处在5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和35%甲酰胺中预杂交和杂交12至24小时。最后在60℃处使用2X SSC、0.2%SDS将载体材料洗涤三次,每次15分钟。
术语“高严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃处在5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和50%甲酰胺中预杂交和杂交12至24小时。最后在65℃处使用2X SSC、0.2%SDS将载体材料洗涤三次,每次15分钟。
术语“非常高严格条件”意指对于长度为至少100个核苷酸的探针而言,遵循标准DNA印迹程序,在42℃处在5X SSPE、0.3%SDS、200微克/ml剪切并变性的鲑鱼精子DNA和50%甲酰胺中预杂交和杂交12至24小时。最后在70℃处使用2X SSC、0.2%SDS将载体材料洗涤三次,每次15分钟。
子序列:术语“子序列”意指从成熟多肽编码序列的5'端和/或3'端缺失一个或多个(例如,若干个)核苷酸的多核苷酸;其中该子序列编码具有蛋白酶活性的片段。
变体:术语“变体”意指在一个或多个(例如,若干个)位置处包括改变(即,取代、插入和/或缺失)的具有蛋白酶活性的多肽。取代意指用不同的氨基酸置换占用某一位置的氨基酸;缺失意指去除占用某一位置的氨基酸;并且插入意指在邻接并且紧随占用某一位置的氨基酸之后添加氨基酸。
具体实施方式
本发明涉及属于家族53的丝氨酸蛋白酶,并且涉及使用发酵生物体,从经糊化的连同未经糊化的含淀粉材料产生发酵产物(如乙醇)的方法。
诸位发明人已经发现,当使用家族S53的丝氨酸蛋白酶,具体是内切蛋白酶,如来自亚灰树花菌属、栓菌属、叉丝孔菌属、多孔菌属、革褶菌属、灵芝属、香菇属、蜡蚧菌属、篮状菌属或芽孢杆菌属,更具体地大型亚灰树花菌、变色栓菌、污叉丝孔菌、漏斗多孔菌、桦革褶菌、灵芝、洁丽香菇、蜡蚧菌属物种WMM742、解蛋白篮状菌或芽孢杆菌属物种19138的S53蛋白酶时,在从含淀粉材料产生乙醇的方法中,当经糊化的或未经糊化的淀粉之一的糖化和/或发酵的期间存在/或添加S53蛋白酶时,乙醇产量得到提高。
用于本发明的方法的蛋白酶选自下组,该组由以下组成:
(a)属于EC 3.4.21酶组的蛋白酶;和/或
(b)属于EC 3.4.14酶组的蛋白酶;和/或
(c)肽酶家族S53的丝氨酸蛋白酶,其包含两种不同类型的肽酶:三肽基氨肽酶(外切型)和内切肽酶;如在1993,Biochem.J.[生物化学杂志]290:205-218和在MEROPS蛋白酶数据库,发行9.4(2011年1月31日)(www.merops.ac.uk)中所述的。该数据库描述于Rawlings,N.D.,Barrett,A.J.和Bateman,A.,2010,“MEROPS:肽酶数据库(MEROPS:thepepti-dase database)”,Nucl.Acids Res.[核酸研究]38:D227-D233中。
为了确定给定蛋白酶是否为丝氨酸蛋白酶和S53家族的蛋白酶,可参考上述手册和其中述及的原理。可以对所有类型的蛋白酶进行这样的确定,而不论其是天然存在的或野生型蛋白酶;还是基因工程化的或合成的蛋白酶。
S53肽酶家族含有酸起作用的内肽酶和三肽基-肽酶。催化三联体的残基是Glu、Asp、Ser,并且在氧阴离子穴中存在一个另外的酸性残基Asp。这些残基的次序是Glu、Asp、Asp、Ser。该Ser残基在枯草杆菌蛋白酶的Asp、His、Ser三联体中是等价于Ser的亲核体,并且该三联体的Glu是枯草杆菌蛋白酶中的广义碱基His的一个代替物。
该S53家族的肽酶倾向于在酸性pH下最有活性(不像同源的枯草杆菌蛋白酶),并且这可归因于羧基残基(尤其是Asp)在氧阴离子穴中的功能重要性。这些氨基酸序列不与家族S8(即丝氨酸内肽酶枯草杆菌蛋白酶和同系物)中的那些密切相似,并且这一点与完全不同的活性位点残基以及关于最大活性的所得的较低的pH一起,为该家族提供了实质性差异。肽酶单元的蛋白质折叠对于这个家族的成员来说与枯草杆菌蛋白酶的类似,具有氏族类型SB。
用于本发明的方法中的蛋白酶是肽酶家族S53的丝氨酸蛋白酶。
用于本发明的方法中的蛋白酶是酸性蛋白酶,其中在P1位置中偏好疏水性氨基酸残基,例如Leu、Tyr、Phe和Met。这些蛋白酶在一个宽的从2-5的pH范围下对Suc-Ala-Ala-Pro-Leu-pNA和Suc-Ala-Ala-Pro-Phe-pNA具有活性,并在经受低至3的pH持续2小时之后保留多于95%的活性。
在一个实施例中,使用描述于以下“材料与方法”部分中的测定确定蛋白酶活性,如动力学Suc-AAPF-pNA测定、普罗塔酶AK测定、动力学Suc-AAPX-pNA测定以及邻苯二甲醛(OPA)。对于普罗塔酶AK测定,当用该蛋白酶孵育时,不可溶普罗塔酶AK(天青精-交联的酪蛋白)底物释放蓝色并且确定该颜色作为蛋白酶活性的量度。对于Suc-AAPF-pNA测定,当用该蛋白酶孵育时,无色的Suc-AAPF-pNA底物释放黄色的对硝基苯胺并且确定该黄色作为蛋白酶活性的量度。
具有S53蛋白酶活性的多肽
具有蛋白酶活性的多肽或蛋白酶有时还被指定为肽酶、朊酶、肽水解酶或蛋白水解酶。蛋白酶可以是始于任一端的水解肽的外切型蛋白酶或在多肽链内部发挥作用的内切型蛋白酶(内肽酶)。内肽酶对N-和C-末端被封闭的肽底物显示出活性,这些底物与所讨论的蛋白酶的特异性有关。出于本发明的目的,具体地,S53家族的内切蛋白酶是优选的。
术语“蛋白酶”在此被定义为水解肽键的酶。蛋白酶的定义也适用于如在此使用的术语“亲本蛋白酶”和“蛋白酶变体”的蛋白酶部分。术语“蛋白酶”包括属于EC 3.4酶组(包括其十八个亚类中的每一个)的任何酶。EC编号参考加利福尼亚州的圣迭戈的NC-IUBMB学术出版社(Academic Press)的1992年酶命名法,分别包括出版于1994,Eur.J.Biochem.[欧洲生物化学杂志]223:1-5;1995,Eur.J.Biochem.[欧洲生物化学杂志]232:1-6;1996,Eur.J.Biochem.[欧洲生物化学杂志]237:1-5;1997,Eur.J.Biochem.[欧洲生物化学杂志]250:1-6;以及1999,Eur.J.Biochem.[欧洲生物化学杂志]264:610-650的增刊1-5。命名会定期得以增补和更新;参见例如万维网(WWW)于http://www.chem.qmw.ac.uk/iubmb/enzyme/index.html。
该S53家族的肽酶倾向于在酸性pH下最有活性(不像同源的枯草杆菌蛋白酶),并且这可归因于羧基残基(尤其是Asp)在氧阴离子穴中的功能重要性。这些氨基酸序列不与家族S8(即丝氨酸内肽酶枯草杆菌蛋白酶和同系物)中的那些密切相似,并且这一点与完全不同的活性位点残基以及关于最大活性的所得的较低的pH一起,为该家族提供了实质性差异。肽酶单元的蛋白质折叠对于这个家族的成员来说与枯草杆菌蛋白酶的类似,具有氏族类型SB。
在一个实施例中,本发明涉及与SEQ ID NO:12的多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,这些多肽具有蛋白酶活性。在一方面,这些多肽与SEQID NO:12的多肽相差多达10个(例如1个、2个、3个、4个、5个、6个、7个、8个、9个、或10个)氨基酸。
在具体的实施例中,本发明涉及与SEQ ID NO:12的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:12的多肽的至少70%的蛋白酶活性。
在具体的实施例中,本发明涉及与SEQ ID NO:12的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:12的多肽的至少75%的蛋白酶活性。
在具体实施例中,本发明涉及与SEQ ID NO:12的多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:12的成熟多肽的至少80%的蛋白酶活性。
在具体的实施例中,本发明涉及与SEQ ID NO:12的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:12的多肽的至少85%的蛋白酶活性。
在具体的实施例中,本发明涉及与SEQ ID NO:12的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:12的多肽的至少90%的蛋白酶活性。
在具体实施例中,本发明涉及与SEQ ID NO:12的多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:12的多肽的至少95%的蛋白酶活性。
在具体实施例中,本发明涉及与SEQ ID NO:12的多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:12的多肽的至少100%的蛋白酶活性。
在一个实施例中,本发明涉及与SEQ ID NO:15的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,这些多肽具有蛋白酶活性。在一方面,这些多肽与SEQ ID NO:15的多肽相差多达10个(例如1个、2个、3个、4个、5个、6个、7个、8个、9个、或10个)氨基酸。
在具体的实施例中,本发明涉及与SEQ ID NO:15的成熟多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:15的多肽的至少70%的蛋白酶活性。
在具体的实施例中,本发明涉及与SEQ ID NO:15的成熟多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:15的多肽的至少75%的蛋白酶活性。
在具体的实施例中,本发明涉及与SEQ ID NO:15的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:15的成熟多肽的至少80%的蛋白酶活性。
在具体的实施例中,本发明涉及与SEQ ID NO:15的成熟多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:15的多肽的至少85%的蛋白酶活性。
在具体的实施例中,本发明涉及与SEQ ID NO:15的成熟多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:15的多肽的至少90%的蛋白酶活性。
在具体的实施例中,本发明涉及与SEQ ID NO:15的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:15的多肽的至少95%的蛋白酶活性。
在具体的实施例中,本发明涉及与SEQ ID NO:15的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:15的多肽的至少100%的蛋白酶活性。
在一个实施例中,本发明涉及与SEQ ID NO:27的多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,这些多肽具有蛋白酶活性。在一方面,这些多肽与SEQID NO:27的多肽相差多达10个(例如1个、2个、3个、4个、5个、6个、7个、8个、9个、或10个)氨基酸。
在具体的实施例中,本发明涉及与SEQ ID NO:27的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:27的多肽的至少70%的蛋白酶活性。
在具体的实施例中,本发明涉及与SEQ ID NO:27的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:27的多肽的至少75%的蛋白酶活性。
在具体实施例中,本发明涉及与SEQ ID NO:27的多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:27的成熟多肽的至少80%的蛋白酶活性。
在具体的实施例中,本发明涉及与SEQ ID NO:27的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:27的多肽的至少85%的蛋白酶活性。
在具体的实施例中,本发明涉及与SEQ ID NO:27的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:27的多肽的至少90%的蛋白酶活性。
在具体实施例中,本发明涉及与SEQ ID NO:27的多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:27的多肽的至少95%的蛋白酶活性。
在具体实施例中,本发明涉及与SEQ ID NO:27的多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:27的多肽的至少100%的蛋白酶活性。
在一个实施例中,本发明涉及与SEQ ID NO:31的多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,这些多肽具有蛋白酶活性。在一方面,这些多肽与SEQID NO:31的多肽相差多达10个(例如1个、2个、3个、4个、5个、6个、7个、8个、9个、或10个)氨基酸。
在具体的实施例中,本发明涉及与SEQ ID NO:31的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:31的多肽的至少70%的蛋白酶活性。
在具体的实施例中,本发明涉及与SEQ ID NO:31的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:31的多肽的至少75%的蛋白酶活性。
在具体实施例中,本发明涉及与SEQ ID NO:31的多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:31的成熟多肽的至少80%的蛋白酶活性。
在具体的实施例中,本发明涉及与SEQ ID NO:31的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:31的多肽的至少85%的蛋白酶活性。
在具体的实施例中,本发明涉及与SEQ ID NO:31的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:31的多肽的至少90%的蛋白酶活性。
在具体实施例中,本发明涉及与SEQ ID NO:31的多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:31的多肽的至少95%的蛋白酶活性。
在具体实施例中,本发明涉及与SEQ ID NO:31的多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:31的多肽的至少100%的蛋白酶活性。
在具体的实施例中,本发明涉及与SEQ ID NO:38的氨基酸195至560或氨基酸190至560的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:38的氨基酸195至560或SEQ ID NO:38的氨基酸190至560的多肽的至少70%的蛋白酶活性。
在具体的实施例中,本发明涉及与SEQ ID NO:38的氨基酸195至560或氨基酸190至560的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:38的氨基酸195至560或SEQ ID NO:38的氨基酸190至560的多肽的至少75%的蛋白酶活性。
在具体的实施例中,本发明涉及与SEQ ID NO:38的氨基酸195至560或氨基酸190至560的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:38的氨基酸195至560或SEQ ID NO:38的氨基酸190至560的多肽的至少80%的蛋白酶活性。
在具体的实施例中,本发明涉及与SEQ ID NO:38的氨基酸195至560或氨基酸190至560的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:38的氨基酸195至560或SEQ ID NO:38的氨基酸190至560或SEQ ID NO:38的氨基酸190至560的多肽的至少85%的蛋白酶活性。
在具体的实施例中,本发明涉及与SEQ ID NO:38的氨基酸195至560或氨基酸190至560的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:38的氨基酸195至560或SEQ ID NO:38的氨基酸190至560的多肽的至少90%的蛋白酶活性。
在具体的实施例中,本发明涉及与SEQ ID NO:38的氨基酸195至560或氨基酸190至560的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:38的氨基酸195至560或SEQ ID NO:38的氨基酸190至560的多肽的至少95%的蛋白酶活性。
在具体的实施例中,本发明涉及与SEQ ID NO:38的氨基酸195至560或氨基酸190至560的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:38的氨基酸195至560或SEQ ID NO:38的氨基酸190至560的多肽的至少100%的蛋白酶活性。
在具体的实施例中,本发明涉及与SEQ ID NO:39的氨基酸226至647或氨基酸221至647的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:39的氨基酸226至647或SEQ ID NO:39的氨基酸221至647的多肽的至少70%的蛋白酶活性。
在具体的实施例中,本发明涉及与SEQ ID NO:39的氨基酸226至647或氨基酸221至647的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:39的氨基酸226至647或SEQ ID NO:39的氨基酸221至647的多肽的至少75%的蛋白酶活性。
在具体的实施例中,本发明涉及与SEQ ID NO:39的氨基酸226至647或氨基酸221至647的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:39的氨基酸226至647或SEQ ID NO:39的氨基酸221至647的多肽的至少80%的蛋白酶活性。
在具体的实施例中,本发明涉及与SEQ ID NO:39的氨基酸226至647或氨基酸221至647的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:39的氨基酸226至647或SEQ ID NO:39的氨基酸221至647的多肽的至少85%的蛋白酶活性。
在具体的实施例中,本发明涉及与SEQ ID NO:39的氨基酸226至647或氨基酸221至647的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:39的氨基酸226至647或SEQ ID NO:39的氨基酸221至647的多肽的至少90%的蛋白酶活性。
在具体的实施例中,本发明涉及与SEQ ID NO:39的氨基酸226至647或氨基酸221至647的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:39的氨基酸226至647或SEQ ID NO:39的氨基酸221至647的多肽的至少95%的蛋白酶活性。
在具体的实施例中,本发明涉及与SEQ ID NO:39的氨基酸226至647或氨基酸221至647的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:39的氨基酸226至647或SEQ ID NO:39的氨基酸221至647的多肽的至少100%的蛋白酶活性。
在一个实施例中,该多肽已经被分离。本发明的多肽优选地包含SEQ ID NO:11的氨基酸序列或其等位基因变体或由其组成;或是其具有蛋白酶活性的片段。在另一方面,该多肽包含SEQ ID NO:11的成熟多肽或由其组成。在另一方面,该多肽包含SEQ ID NO:11的氨基酸202至567或由其组成。
在一个实施例中,该多肽已经被分离。本发明的多肽优选地包含SEQ ID NO:14的氨基酸序列或其等位基因变体或由其组成;或是其具有蛋白酶活性的片段。在另一方面,该多肽包含SEQ ID NO:14的成熟多肽或由其组成。在另一方面,该多肽包含SEQ ID NO:14的氨基酸200至565或由其组成。
在一个实施例中,该多肽已经被分离。本发明的多肽优选地包含SEQ ID NO:26的氨基酸序列或其等位基因变体或由其组成;或是其具有蛋白酶活性的片段。在另一方面,该多肽包含SEQ ID NO:26的成熟多肽或由其组成。在另一方面,该多肽包含SEQ ID NO:26的氨基酸203至565或由其组成。
在一个实施例中,该多肽已经被分离。本发明的多肽优选地包含SEQ ID NO:38的氨基酸序列或其等位基因变体或由其组成;或是其具有蛋白酶活性的片段。在另一方面,该多肽包含SEQ ID NO:38的成熟多肽或由其组成。在另一方面,该多肽包含SEQ ID NO:38的氨基酸195至560或由其组成。
在一个实施例中,该多肽已经被分离。本发明的多肽优选地包含SEQ ID NO:39的氨基酸序列或其等位基因变体或由其组成;或是其具有蛋白酶活性的片段。在另一方面,该多肽包含SEQ ID NO:39的成熟多肽或由其组成。在另一方面,该多肽包含SEQ ID NO:39的氨基酸226至647或由其组成。
在一个实施例中,该多肽已经被分离。本发明的多肽优选地包含SEQ ID NO:30的氨基酸序列或其等位基因变体或由其组成;或是其具有蛋白酶活性的片段。在另一方面,该多肽包含SEQ ID NO:30的成熟多肽或由其组成。在另一方面,该多肽包含SEQ ID NO:34的氨基酸209至639或由其组成。在另一个实施例中,本发明涉及由以下多核苷酸编码的具有蛋白酶活性的多肽,该多核苷酸在非常低严格条件、低严格条件、中严格条件、中-高严格条件、高严格条件、或非常高严格条件下与以下各项杂交:(i)SEQ ID NO:10的成熟多肽编码序列,(ii)或(i)的全长互补体(Sambrook等人,1989,Molecular Cloning,A LaboratoryManual[分子克隆实验指南],第二版,冷泉港,纽约)。在一个实施例中,该多肽已经被分离。
在另一个实施例中,本发明涉及由以下多核苷酸编码的具有蛋白酶活性的多肽,该多核苷酸在非常低严格条件、低严格条件、中严格条件、中-高严格条件、高严格条件、或非常高严格条件下与以下各项杂交:(i)SEQ ID NO:13的成熟多肽编码序列,(ii)或(i)的全长互补体(Sambrook等人,1989,Molecular Cloning,A Laboratory Manual[分子克隆实验指南],第二版,冷泉港,纽约)。在一个实施例中,该多肽已经被分离。
SEQ ID NO:10、13、25、29的多核苷酸或其子序列,连同SEQ ID NO:11、14、26、30的多肽或其片段可根据本领域熟知的方法用于设计核酸探针以鉴定和克隆来自不同属或种的菌株的、编码具有蛋白酶活性的多肽的DNA。具体而言,此类探针可以遵循标准DNA印迹程序用于与感兴趣的细胞的基因组DNA或cDNA杂交,以便鉴定和分离其中相应的基因。此类探针可以明显短于完整序列,但是长度应为至少15,例如至少25、至少35、或至少70个核苷酸。优选地,该核酸探针的长度为至少100个核苷酸,例如长度为至少200个核苷酸、至少300个核苷酸、至少400个核苷酸、至少500个核苷酸、至少600个核苷酸、至少700个核苷酸、至少800个核苷酸、或至少900个核苷酸。可以使用DNA和RNA探针两者。典型地将探针进行标记(例如,用32P、3H、35S、生物素、或抗生物素蛋白),以检测相应的基因。
可以筛选由此类其他菌株制备的基因组DNA或cDNA文库的与上述探针杂交并编码具有蛋白酶活性的多肽的DNA。来自此类其他菌株的基因组DNA或其他DNA可通过琼脂糖或聚丙烯酰胺凝胶电泳或其他分离技术来分离。可将来自文库的DNA或分离的DNA转移到并固定在硝化纤维素或其他适合的载体材料上。为了鉴定与SEQ ID NO:1、4、7、10、13或其子序列杂交的克隆或DNA,将载体材料用于DNA印迹中。
出于本发明的目的,杂交是指,多核苷酸杂交到对应于以下的标记的核酸探针上:(i)SEQ ID NO:1、4、7、10、13;或(ii)SEQ ID NO:1、4、7、10、13的成熟多肽编码序列;(iii)其全长互补体;或(iv)其子序列;杂交是在非常低的至非常高的严格条件下进行。可以使用例如X-射线胶片或本领域已知的任何其他检测手段来检测在这些条件下核酸探针杂交的分子。
在另一个实施例中,本发明涉及具有蛋白酶活性的多肽,该多肽由与SEQ ID NO:10的成熟多肽编码序列具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多核苷酸编码。在另外的实施例中,该多肽已经被分离。
在另一个实施例中,本发明涉及具有蛋白酶活性的多肽,该多肽由与SEQ ID NO:13的成熟多肽编码序列具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多核苷酸编码。在另外的实施例中,该多肽已经被分离。
在另一个实施例中,本发明涉及具有蛋白酶活性的多肽,该多肽由与SEQ ID NO:25的成熟多肽编码序列具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多核苷酸编码。在另外的实施例中,该多肽已经被分离。
在另一个实施例中,本发明涉及具有蛋白酶活性的多肽,该多肽由与SEQ ID NO:29的成熟多肽编码序列具有至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多核苷酸编码。在另外的实施例中,该多肽已经被分离。
在另一个实施例中,本发明涉及在一个或多个(例如,若干个)位置处包括取代、缺失和/或插入的SEQ ID NO:12、15、27、31的多肽的变体。在一个实施例中,引入SEQ ID NO:12、15、27、31的多肽中的氨基酸取代、缺失和/或插入的数目多达10个,例如1、2、3、4、5、6、7、8、9或10个。这些氨基酸改变可以具有微小性质,即,不会显著地影响蛋白的折叠和/或活性的保守氨基酸取代或插入;小缺失,典型地为1-30个氨基酸;小的氨基或羧基-末端延伸,如氨基末端的甲硫氨酸残基;多至20-25个残基的小接头肽;或通过改变净电荷或另外的功能促进纯化的小的延伸,如聚组氨酸段、抗原表位或结合结构域。
保守取代的实例是在下组之内:碱性氨基酸(精氨酸、赖氨酸及组氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、极性氨基酸(谷氨酰胺和天冬酰胺)、疏水性氨基酸(亮氨酸、异亮氨酸及缬氨酸)、芳香族氨基酸(苯丙氨酸、色氨酸及酪氨酸)及小氨基酸(甘氨酸、丙氨酸、丝氨酸、苏氨酸及甲硫氨酸)。一般不会改变比活性的氨基酸取代是本领域已知的并且例如由H.Neurath和R.L.Hill,1979,于The Proteins[蛋白质],学术出版社(Academic Press),纽约中描述。常见取代为Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly。
可以根据本领域中已知的程序,如定点诱变或丙氨酸扫描诱变(Cunningham和Wells,1989,Science[科学]244:1081-1085)来鉴定多肽中的必需氨基酸。在后一项技术中,在该分子中的每个残基处引入单个丙氨酸突变,并且测试所得分子的[酶]活性以鉴定对于该分子的活性关键的氨基酸残基。还参见Hilton等人,1996,J.Biol.Chem.[生物化学杂志]271:4699-4708。酶或其他生物学相互作用的活性位点还可以通过对结构的物理分析来确定,如通过这样的技术确定:如核磁共振、晶体学、电子衍射或光亲和标记,连同对推定的接触位点氨基酸进行突变。参见,例如de Vos等人,1992,Science[科学]255:306-312;Smith等人,1992,J.Mol.Biol.[分子生物学杂志]224:899-904;Wlodaver等人,1992,FEBSLett.[欧洲生物化学学会联盟通讯]309:59-64。还可以从与相关多肽的比对来推断必需氨基酸的身份。
可以做出单个或多个氨基酸取代、缺失和/或插入并且使用已知的诱变、重组和/或改组方法进行测试,随后进行有关筛选程序,如由Reidhaar-Olson和Sauer,1988,Science[科学]241:53-57;Bowie和Sauer,1989,Proc.Natl.Acad.Sci.USA[美国科学院院报]86:2152-2156;WO 95/17413;或WO 95/22625所披露的那些。其他可以使用的方法包括易错PCR、噬菌体展示(例如Lowman等人,1991,Biochemistry[生物化学]30:10832-10837;美国专利号5,223,409;WO 92/06204)以及区域定向诱变(Derbyshire等人,1986,Gene[基因]46:145;Ner等人,1988,DNA 7:127)。
该多肽可以是一种杂交多肽,其中一个多肽的一个区域融合在另一个多肽的一个区域的N-末端或C-末端。
该多肽可以是一种融合多肽或可裂解的融合多肽,其中另一个多肽是在本发明多肽的N-末端或C-末端处融合。通过将编码另一种多肽的多核苷酸与本发明多核苷酸融合而产生融合多肽。用于产生融合多肽的技术是本领域已知的,且包括连接编码多肽的编码序列使得它们符合读框,而且融合多肽的表达处于相同的启动子和终止子的控制之下。还可以使用内含肽技术构建融合多肽,在该内含肽技术中在翻译后产生融合多肽(Cooper等人,1993,EMBO J.[欧洲分子生物学学会杂志]12:2575-2583;Dawson等人,1994,Science[科学]266:776-779)。
融合多肽可进一步包含两个多肽之间的切割位点。在融合蛋白分泌之时,该位点被切割而释放所述两个多肽。切割位点的实例包括但不限于以下文献中披露的位点:Martin等人,2003,J.Ind.Microbiol.Biotechnol.[工业微生物学与生物技术杂志]3:568-576;Svetina等人,2000,J.Biotechnol.[生物技术杂志]76:245-251;Rasmussen-Wilson等人,1997,Appl.Environ.Micro-biol.[应用环境微生物学]63:3488-3493;Ward等人,1995,Biotechnology[生物技术]13:498-503;以及Contreras等人,1991,Biotechnology[生物技术],9:378-381;Eaton等人,1986,Biochemistry[生物化学]25:505-512;Collins-Racie等人,1995,Biotechnology[生物技术],13:982-987;Carter等人,1989,Proteins:Structure,Function,and Genetics[蛋白质:结构、功能和遗传学]6:240-248;以及Stevens,2003,Drug Discovery World[世界药物发现]4:35-48。
具有丝氨酸蛋白酶活性的多肽的来源
在一方面,该多肽来自以下属的菌株:亚灰树花菌属、栓菌属、叉丝孔菌属、多孔菌属、革褶菌属、灵芝属、香菇属或芽孢杆菌属,更具体地大型亚灰树花菌、变色栓菌、污叉丝孔菌、漏斗多孔菌、桦革褶菌、灵芝、洁丽香菇、或芽孢杆菌属物种19138。
将理解的是,对于以上提到的物种,本发明涵盖完全状态和不完全状态(perfectand imperfect states)二者、以及其他分类学等效物,例如无性型,而不管它们已知的物种名称。本领域的技术人员将容易地识别适当等效物的身份。
这些物种的菌株可容易地在许多培养物保藏中心为公众所获得,如美国典型培养物保藏中心(ATCC)、德国微生物和细胞培养物保藏中心(Deutsche Sammlung vonMikroorganismen und Zellkulturen GmbH,DSMZ)、荷兰菌种保藏中心(CentraalbureauVoor Schimmelcultures,CBS)以及美国农业研究服务专利培养物保藏中心北方地区研究中心(Agricultural Research Service Patent Culture Collection,NorthernRegional Research Center,NRRL)。
可使用以上提到的探针从其他来源,包括从自然界(例如,土壤、堆肥、水等)分离的微生物或直接从天然材料(例如,土壤、堆肥、水等)获得的DNA样品鉴定和获得该多肽。用于从天然生境中直接分离微生物和DNA的技术是本领域已知的。然后可通过类似地筛选另一微生物的基因组DNA或cDNA文库或混合的DNA样品来获得编码该多肽的多核苷酸。一旦已经用探针检测到编码多肽的多核苷酸,则可通过利用本领域普通技术人员所知的技术(参见,例如Sambrook等,1989,见上文)分离或克隆多核苷酸。
多核苷酸
本发明还涉及编码本发明的多肽的多核苷酸,如本申请中所述。在一个实施例中,该多核苷酸已经被分离。
用于分离或克隆多核苷酸的技术是本领域中已知的且包括从基因组DNA或cDNA或其组合进行分离。可例如通过使用熟知的聚合酶链反应(PCR)或表达文库的抗体筛选以检测具有共有结构特征的克隆的DNA片段,来实现从基因组DNA克隆多核苷酸。参见例如,Innis等人,1990,PCR:A Guide to Methods and Application[PCR:方法和应用指南],学术出版社(Academic Press),纽约。可使用其他核酸扩增程序如连接酶链式反应(LCR)、连接活化的转录(LAT)和基于多核苷酸的扩增(NASBA)。这些多核苷酸可以克隆自[属]的菌株或相关生物体,并且因此,例如可以是该多核苷酸多肽编码区的等位基因变体或物种变体。
核酸构建体
本发明还涉及核酸构建体,这些核酸构建体包含有效地连接至一个或多个控制序列的本发明的多核苷酸,在与控制序列相容的条件下,这个或这些控制序列指导编码序列在适合的宿主细胞中的表达。在具体的实施例中,至少一种控制序列是外源的于与编码本发明的S53家族蛋白酶的天然存在的基因序列正常相关的至少一个控制序列。
可用许多方式操作所述多核苷酸以提供多肽的表达。取决于表达载体,在多核苷酸插入载体之前对其进行操作可为合意的或必需的。用于利用重组DNA方法修饰多核苷酸的技术是本领域已知的。
该控制序列可为启动子,即,被宿主细胞识别用于表达编码本发明多肽的多核苷酸的多核苷酸。该启动子含有转录控制序列,其介导该多肽的表达。该启动子可为在宿主细胞中显示出转录活性的任何多核苷酸,包括变体、截短的及杂合的启动子,并可从编码与该宿主细胞同源或异源的细胞外或细胞内多肽的基因获得。
在丝状真菌宿主细胞中,用于指导本发明的核酸构建体的转录的合适启动子的实例是获得自以下酶的基因的启动子:构巢曲霉乙酰胺酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉葡萄糖淀粉酶(glaA)、米曲霉TAKA淀粉酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、尖镰孢胰蛋白酶-样蛋白酶(WO 96/00787)、镶片镰孢淀粉葡糖苷酶(WO 00/56900)、镶片镰孢Daria(WO 00/56900)、镶片镰孢菌Quinn(WO 00/56900)、米黑根毛霉脂肪酶、米黑根毛霉天冬氨酸蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶,以及里氏木霉翻译延长因子,以及NA2tpi启动子(来自曲霉属中性α-淀粉酶基因的经修饰的启动子,其中未翻译的前导序列已经用来自曲霉属丙糖磷酸异构酶基因的未翻译的前导序列替换;非限制性实例包括来自编码中性α-淀粉酶的黑曲霉基因的修饰的启动子,其中已经用来自编码丙糖磷酸异构酶的构巢曲霉或米曲霉基因的未翻译的前导子替换未翻译的前导子);及其变体、截短型及杂合型启动子。其他启动子在美国专利号6,011,147中描述。
控制序列也可为由宿主细胞识别以终止转录的转录终止子。该终止子有效地连接到编码该多肽的多核苷酸的3'-末端。在该宿主细胞中起作用的任何终止子都可以用于本发明中。
用于丝状真菌宿主细胞的优选终止子是从以下各项的基因获得:构巢曲霉乙酰胺酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶、尖镰孢胰蛋白酶样蛋白酶、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉木聚糖酶III、里氏木霉β-木糖苷酶以及里氏木霉翻译延长因子。
该控制序列还可以是前导序列,对宿主细胞翻译很重要的非翻译mRNA区域。该前导序列有效地连接到编码该多肽的多核苷酸的5'-末端。可使用在宿主细胞中有功能的任何前导序列。
用于丝状真菌宿主细胞的优选前导序列是从米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶的基因获得的。
该控制序列还可以是一个聚腺苷酸化序列,一种有效地连接到多核苷酸的3'-末端的序列,并且当转录时被宿主细胞识别为将聚腺苷酸残基添加到转录的mRNA的一个信号。可使用在宿主细胞中有功能的任何聚腺苷酸化序列。
用于丝状真菌宿主细胞的优选聚腺苷酸化序列是从以下酶的基因获得的:构巢曲霉邻氨基苯甲酸合酶、黑曲霉葡糖淀粉酶、黑曲霉α-葡糖苷酶、米曲霉TAKA淀粉酶和尖镰孢胰蛋白酶-样蛋白酶。
控制序列也可以是编码与多肽的N-端连接并指导多肽进入细胞的分泌通路的信号肽的信号肽编码区。多核苷酸的编码序列的5'端可以固有地含有在翻译阅读框架中与编码多肽的编码序列的区段天然地连接的一个信号肽编码序列。可替代地,编码序列5’端可以含有对于该编码序列是外源的信号肽编码序列。在编码序列天然地不含有信号肽编码序列的情况下,可能需要外源信号肽编码序列。可替代地,外源信号肽编码序列可以单纯地替代天然信号肽编码序列以便增强多肽的分泌。然而,可以使用指导已表达多肽进入宿主细胞的分泌途径的任何信号肽编码序列。
用于丝状真菌宿主细胞的有效信号肽编码序列是从黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、米曲霉TAKA淀粉酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶V、柔毛腐质霉脂肪酶和米黑根毛霉天冬氨酸蛋白酶的基因获得的信号肽编码序列。
控制序列也可为编码处于多肽的N-末端的前肽的前肽编码序列。生成的多肽被称为前体酶(proenzyme)或多肽原(或在一些情况下被称为酶原(zymogen))。多肽原通常是无活性的并且可以通过催化切割或自身催化切割来自多肽原的前肽而转化为活性多肽。可以从枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、嗜热毁丝霉漆酶(WO95/33836)、米黑根毛霉天冬氨酸蛋白酶和酿酒酵母α-因子的基因获得前肽编码序列。
在信号肽序列和前肽序列二者都存在的情况下,该前肽序列位于紧邻多肽的N-末端且该信号肽序列位于紧邻该前肽序列的N-末端。
也可为合意的是添加调节序列,所述调节序列调节相对于宿主细胞的生长的多肽的表达。调节序列的实例是引起基因的表达响应于化学或物理刺激(包括调节化合物的存在)而开启或关闭的那些。在丝状真菌中,可以使用黑曲霉葡糖淀粉酶启动子、米曲霉TAKAα-淀粉酶启动子和米曲霉葡糖淀粉酶启动子、里氏木霉纤维二糖水解酶I启动子以及里氏木霉纤维二糖水解酶II启动子。调控序列的其他实例是那些允许基因扩增的序列。在真核系统中,这些调控序列包括在甲氨蝶呤存在下被扩增的二氢叶酸还原酶基因以及用重金属扩增的金属硫蛋白基因。在这些情况中,编码多肽的多核苷酸将与调控序列有效地连接。
表达载体
本发明还涉及包含本发明的多核苷酸、启动子、以及转录和翻译终止信号的重组表达载体。多个核苷酸和控制序列可连接在一起以产生重组表达载体,其可包括一个或多个便利的限制位点以允许编码该多肽的多核苷酸在这些位点处的插入或取代。可替代地,多核苷酸可通过将该多核苷酸或包含该多核苷酸的核酸构建体插入用于表达的适当载体中来表达。在产生该表达载体时,该编码序列位于该载体中,这样使得该编码序列与该用于表达的适当控制序列有效地连接。
重组表达载体可以是任何载体(例如,质粒或病毒),其能够方便地进行重组DNA程序,并且能够引起多核苷酸的表达。载体的选择将典型地取决于该载体与有待引入该载体的宿主细胞的相容性。该载体可以是线状或闭合的环状质粒。
载体可以是自主复制载体,即,作为染色体外实体存在的载体,其复制独立于染色体复制,例如,质粒、染色体外元件、微染色体或人工染色体。载体可以含有用于确保自我复制的任何装置。可替代地,载体可以是这样的载体,当它引入宿主细胞中时整合入基因组中并与其中已整合了它的染色体一起复制。此外,可以使用单独的载体或质粒或两个或更多个载体或质粒,其共同含有待引入宿主细胞基因组的总DNA,或可以使用转座子。
载体优选地含有一个或多个选择性标记,所述标记容许容易地选择转化细胞、转染细胞、转导细胞等。选择性标记是这样的基因,其产物提供了杀生物剂抗性或病毒抗性、重金属抗性、营养缺陷型的原养型等。
用于在丝状真菌宿主细胞中使用的选择性标记包括但不限于:adeA(磷酸核糖酰氨基咪唑-琥珀羧胺合酶)、adeB(磷酸核糖酰-氨基咪唑合酶)、amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草丁膦乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清酸核苷-5'磷酸脱羧酶)、sC(硫酸腺苷基转移酶)、以及trpC(邻氨基苯甲酸合酶)、连同其等效物。优选用于曲霉属细胞中的是构巢曲霉或米曲霉amdS和pyrG基因和吸水链霉菌bar基因。优选用于木霉属细胞中的是adeA、adeB、amdS、hph和pyrG基因。
选择性标记可为双选择性标记系统,如WO 2010/039889中描述的。在一方面,双选择性标记是hph-tk双选择性标记系统。
载体优选含有允许载体整合到宿主细胞的基因组中或载体在细胞中独立于基因组自主复制的元件。
对于整合入该宿主细胞基因组中,载体可依靠编码多肽的多核苷酸序列或者用于通过同源或非同源重组整合入基因组中的该载体的任何其他元件。可替代地,该载体可以含有用于指导通过同源重组而整合到宿主细胞基因组中的染色体中的精确位置的另外的多核苷酸。为了增加在精确位置整合的可能性,这些整合的元件应含有足够数量的核酸,如100至10,000个碱基对、400至10,000个碱基对、以及800至10,000个碱基对,这些碱基对与相应的靶序列具有高度的序列一致性以提高同源重组的可能性。整合元件可以是与宿主细胞基因组内的靶序列同源的任何序列。此外,整合元件可以是非编码多核苷酸或编码多核苷酸。另一方面,载体可以通过非同源重组整合入宿主细胞的基因组中。
对于自主复制,载体可以进一步含有使载体能够在所讨论的宿主细胞中自主地进行复制的复制起点。复制起点可以是在细胞中起作用的介导自主复制的任何质粒复制子。术语“复制起点(origin of replication)”或“质粒复制子(plasmid replicator)”意指使得质粒或载体能够在体内复制的多核苷酸。
在丝状真菌细胞中有用的复制起点的实例是AMA1和ANS1(Gems等人,1991,Gene[基因]98:61-67;Cullen等人,1987,Nucleic Acids Res.[核酸研究]15:9163-9175;WO00/24883)。可根据WO 00/24883中公开的方法完成AMA1基因的分离和包含该基因的质粒或载体的构建。
可以将本发明多核苷酸的一个以上的拷贝插入宿主细胞以增加多肽的产生。多核苷酸拷贝数的增加可通过如下获得:将序列的至少一个额外拷贝整合入宿主细胞基因组,或包括与多核苷酸一起的可扩增的选择性标记基因,其中可通过在合适的选择剂(selectable agent)存在下培养细胞来选择含有选择性标记基因的扩增拷贝,且由此含有多核苷酸的额外拷贝的细胞。
用于连接以上所描述的元件以构建本发明的重组表达载体的程序是本领域的普通技术人员熟知的(参见,例如,Sambrook等人,1989,见上文)。
宿主细胞
本发明还涉及重组宿主细胞(非天然存在),其包含本发明的多核苷酸,该多核苷酸有效地连接于一个或多个控制序列,这个或这些控制序列指导本发明的多肽的产生。将包含本发明的多核苷酸的核酸构建体或表达载体引入宿主细胞中,这样使得该构建体或载体作为染色体整合体或作为自主复制的染色体外载体维持,如较早前所述。术语“宿主细胞”涵盖由于复制过程中发生的突变与亲本细胞不同的亲本细胞的任何后代。宿主细胞的选择在很大程度上取决于编码该多肽的基因及其来源。
宿主细胞还可以是真核生物,例如哺乳动物、昆虫、植物或真菌细胞。
宿主细胞可以是真菌细胞。如在此使用的“真菌”包括子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)和接合菌门(Zygomycota)以及卵菌门(Oomycota)和所有有丝分裂孢子真菌(如由Hawksworth等人所定义的,在:Ainsworth andBisby’s Dictionary of The Fungi[Ainsworth和Bisby的真菌大词典],第8版,1995,国际CAB,大学出版社,剑桥,英国)。
真菌宿主细胞可为酵母细胞。如本申请中使用的“酵母”包括产子嚢酵母(内孢霉目)、产担子酵母和属于半知菌类(芽孢纲)的酵母。由于酵母的分类可在将来变化,出于本发明的目的,酵母应当如Biology and Activities of Yeast[酵母的生物学与活性](Skinner,Passmore和Davenport编辑,Soc.App.Bacteriol.Symposium Series No.9[应用细菌学学会专题论文集系列9],1980)中所描述的那样定义。
酵母宿主细胞可为假丝酵母属、汉逊酵母属、克鲁维酵母属、毕赤酵母属、酵母属、裂殖酵母属、或耶氏酵母属细胞,如乳酸克鲁弗酵母(Kluyveromyces lactis)、卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母、卵形酵母或解脂耶氏酵母(Yarrowia lipolytica)细胞。
真菌宿主细胞可为丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门(Oomycota)的亚门的所有丝状形式(如由Hawksworth等人所定义的,1995,见上文)。丝状真菌通常的特征在于由几丁质、纤维素、葡聚糖、壳多糖、甘露聚糖、以及其他复杂多糖构成的菌丝体壁。营养生长是通过菌丝延伸,而碳分解代谢是专性需氧的。相反,酵母(如酿酒酵母)的营养生长是通过单细胞菌体的出芽(budding),且碳分解代谢可以是发酵性的。
丝状真菌宿主细胞可以是枝顶孢霉属、曲霉属、短梗霉属、烟管霉属(Bjerkandera)、拟腊菌属、金孢子菌属、鬼伞属、革盖菌属(Coriolus)、隐球菌属、线黑粉菌科(Filibasidium)、镰孢菌属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新美鞭菌属、链孢菌属、拟青霉属、青霉属、平革菌属、射脉菌属(Phlebia)、梨囊鞭菌属、侧耳属(Pleurotus)、裂褶菌属、篮状菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属(Trametes)或木霉属细胞。
例如,丝状真菌宿主细胞可以是泡盛曲霉、臭曲霉、烟曲霉、日本曲霉、构巢曲霉、黑曲霉、米曲霉、黑刺烟管菌(Bjerkandera adusta)、干拟蜡菌(Ceriporiopsisaneirina)、卡内基拟蜡菌(Ceriporiopsis caregiea)、浅黄拟蜡孔菌(Ceriporiopsisgilvescens)、潘诺希塔拟蜡菌(Ceriporiopsis pan-nocinta)、环带拟蜡菌(Ceriporiopsis rivulosa)、微红拟蜡菌(Ceriporiopsis subrufa)、虫拟蜡菌(Ceriporiopsis subvermispora)、狭边金孢子菌(Chrysosporium inops)、嗜角质金孢子菌、卢克诺文思金孢子菌(Chrysosporium lucknowense)、粪状金孢子菌(Chrysosporiummerdarium)、租金孢子菌、女王杜香金孢子菌(Chrysosporium queenslandi-cum)、热带金孢子菌、褐薄金孢子菌(Chrysosporium zonatum)、灰盖鬼伞(Coprinus cinereus)、毛革盖菌(Coriolus hirsutus)、杆孢状镰孢菌、谷类镰孢菌、库威镰孢菌、大刀镰孢菌、禾谷镰孢菌、禾赤镰孢菌、异孢镰孢菌、合欢木镰孢菌、尖孢镰孢菌、多枝镰孢菌、粉红镰孢菌、接骨木镰孢菌、肤色镰孢菌、拟分枝孢镰孢菌、硫色镰孢菌、圆镰孢菌、拟丝孢镰孢菌、镶片镰孢菌、特异腐质霉、柔毛腐质霉、米黑毛霉、嗜热毁丝霉、粗糙脉孢菌、产紫青霉、黄孢原毛平革菌、射脉菌(Phlebia radiata)、刺芹侧耳(Pleurotus eryngii)、土生梭孢壳霉、长域毛栓菌(Trametes villosa)、变色栓菌(Trametes versicolor)、哈茨木霉、康宁木霉、长枝木霉、里氏木霉、或绿色木霉细胞。
可以将真菌细胞通过涉及原生质体形成、原生质体转化、以及细胞壁再生的方法以本身已知的方式转化。用于转化曲霉属和木霉属宿主细胞的适合程序描述于以下文献中:EP 238023,Yelton等人,1984,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]81:1470-1474以及Christensen等人,1988,Bio/Technology[生物/技术]6:1419-1422。用于转化镰刀菌属物种的适合方法在Malardier等人,1989,Gene[基因]78:147-156和WO 96/00787中描述。可以使用由如以下文献描述的程序转化酵母:Becker和Guarente,在Abelson,J.N.和Simon,M.I.编辑,Guide to Yeast Genetics and Molecular Biology[酵母遗传学与分子生物学指南],Methods in Enzymology[酶学方法],第194卷,第182-187页,学术出版社有限公司(Academic Press,Inc.),纽约;Ito等人,1983,J.Bacteriol.[细菌学杂志]153:163;以及Hinnen等人,1978,Proc.Natl.Acad.Sci.USA[美国科学院院报]75:1920。
产生方法
本发明还涉及产生本发明多肽的方法,该方法包括:(a)在有益于产生该多肽的条件下培养本发明的重组宿主细胞;并且任选地(b)回收该多肽。
这些宿主细胞是在适合于使用本领域中已知的方法产生该多肽的一种营养介质中培养的。例如,可以通过摇瓶培养、或在实验室或工业发酵罐中小规模或大规模发酵(包括连续、分批、补料分批或固态发酵)培养细胞,所述培养在适合的介质中并且在允许表达和/或分离多肽的条件下进行。使用本领域中已知的程序,培养发生在包括碳和氮来源及无机盐的适合的营养介质中。适合的培养基可以从商业供应商获得或可以根据公开的组成(例如,在美国典型培养物保藏中心(American Type Culture Collection)的目录中)制备。如果多肽被分泌到营养介质中,那么可直接从介质中回收多肽。如果多肽不分泌,那么其可从细胞裂解液中进行回收。
可以使用本领域已知的方法检测该多肽,该方法特异性针对多肽[根据多肽的生物学活性编辑]。这些检测方法包括但不限于:特异性抗体的使用、酶产物的形成或酶底物的消失。例如,可使用酶测定法来确定多肽的活性。
可使用本领域已知的方法来回收多肽。例如,可通过常规方法,包括但不限于:收集、离心、过滤、提取、喷雾干燥、蒸发或沉淀,从营养介质回收多肽。在一方面,回收包含多肽的发酵液。
可以通过本领域已知的多种程序纯化多肽,这些程序包括但不限于:色谱(例如,离子交换色谱法、亲和色谱法、疏水色谱法、聚焦色谱法、和大小排阻色谱法)、电泳方法(例如,制备性等电聚焦)、差异性溶解(例如,硫酸铵沉淀)、SDS-PAGE、或提取(参见,例如,Protein Purification[蛋白质纯化],Janson和Ryden编辑,VCH出版公司,纽约,1989),以便获得基本上纯的多肽。
在替代性方面,不回收多肽,而是使用表达该多肽的本发明宿主细胞作为多肽的来源。
酶组合物
本发明还涉及包含S53蛋白酶的组合物。优选地,所述组合物富含这种多肽。术语“富含”指示该组合物的支链淀粉酶活性已经增加,例如,富集因子为至少1.1。
这些组合物可以包含S53蛋白酶作为主要酶组分,例如单组分组合物。可替代地,这些组合物可以包含多种酶活性,如S53蛋白酶以及一种或多种(例如,若干种)选自下组的酶,该组由以下组成:水解酶、异构酶、连接酶、裂解酶、氧化还原酶、或转移酶,例如,α-半乳糖苷酶、α-葡糖苷酶、氨肽酶、α-淀粉酶、β-淀粉酶、β-半乳糖苷酶、β-葡糖苷酶、β-木糖苷酶、糖酶、羧肽酶、过氧化氢酶、纤维二糖水解酶、纤维素酶、壳多糖酶、角质酶、环糊精葡萄糖基转移酶、脱氧核糖核酸酶、内切葡聚糖酶、酯酶、葡糖淀粉酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、变聚糖酶、氧化酶、果胶分解酶、过氧化物酶、植酸酶、多酚氧化酶、蛋白酶、核糖核酸酶、转谷氨酰胺酶、或木聚糖酶。在一个实施例中,该组合物包含S53蛋白酶和产碳水化合物源的酶以及任选地α-淀粉酶。在一个具体的实施例中,该组合物包含S53蛋白酶和葡糖淀粉酶。优选地,包含于组合物中的这些酶活性选自S53蛋白酶以及一种或多种选自下组的酶,该组由以下组成:葡糖淀粉酶、α-蛋白酶。
在一个具体的实施例中,该S53蛋白酶选自源自以下属的菌株的蛋白酶:亚灰树花菌属、栓菌属、叉丝孔菌属、多孔菌属、革褶菌属、灵芝属、香菇属或芽孢杆菌属,更具体地大型亚灰树花菌、变色栓菌、污叉丝孔菌、漏斗多孔菌、桦革褶菌、灵芝、洁丽香菇、或芽孢杆菌属物种19138。
更具体地,该S53蛋白酶选自下组,该组由以下组成:
-与SEQ ID NO:3的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:3的多肽的至少70%的蛋白酶活性。
-与SEQ ID NO:3的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:3的多肽的至少75%的蛋白酶活性。
-与SEQ ID NO:3的多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:3的成熟多肽的至少80%的蛋白酶活性。
-与SEQ ID NO:3的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:3的多肽的至少85%的蛋白酶活性。
-与SEQ ID NO:3的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:3的多肽的至少90%的蛋白酶活性。
-与SEQ ID NO:3的多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:3的多肽的至少95%的蛋白酶活性。
-与SEQ ID NO:3的多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:3的多肽的至少100%的蛋白酶活性。
-与SEQ ID NO:6的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:6的多肽的至少70%的蛋白酶活性。
-与SEQ ID NO:6的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:6的多肽的至少75%的蛋白酶活性。
-与SEQ ID NO:6的多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:6的成熟多肽的至少80%的蛋白酶活性。
-与SEQ ID NO:6的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:6的多肽的至少85%的蛋白酶活性。
-与SEQ ID NO:6的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:6的多肽的至少90%的蛋白酶活性。
-与SEQ ID NO:6的多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:6的多肽的至少95%的蛋白酶活性。
-与SEQ ID NO:6的多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:6的多肽的至少100%的蛋白酶活性。
-与SEQ ID NO:9的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:9的多肽的至少70%的蛋白酶活性。
-与SEQ ID NO:9的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:9的多肽的至少75%的蛋白酶活性。
-与SEQ ID NO:9的多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:9的成熟多肽的至少80%的蛋白酶活性。
-与SEQ ID NO:9的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:9的多肽的至少85%的蛋白酶活性。
-与SEQ ID NO:9的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:9的多肽的至少90%的蛋白酶活性。
-与SEQ ID NO:9的多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:9的多肽的至少95%的蛋白酶活性。
-与SEQ ID NO:9的多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:9的多肽的至少100%的蛋白酶活性。
-与SEQ ID NO:12的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:12的多肽的至少70%的蛋白酶活性。
-与SEQ ID NO:12的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:12的多肽的至少75%的蛋白酶活性。
-与SEQ ID NO:12的多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:12的成熟多肽的至少80%的蛋白酶活性。
-与SEQ ID NO:12的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:12的多肽的至少85%的蛋白酶活性。
-与SEQ ID NO:12的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:12的多肽的至少90%的蛋白酶活性。
-与SEQ ID NO:12的多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:12的多肽的至少95%的蛋白酶活性。
-与SEQ ID NO:12的多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:12的多肽的至少100%的蛋白酶活性。
-与SEQ ID NO:15的成熟多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:15的多肽的至少70%的蛋白酶活性。
-与SEQ ID NO:15的成熟多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:15的多肽的至少75%的蛋白酶活性。
-与SEQ ID NO:15的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:15的成熟多肽的至少80%的蛋白酶活性。
-与SEQ ID NO:15的成熟多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:15的多肽的至少85%的蛋白酶活性。
-与SEQ ID NO:15的成熟多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:15的多肽的至少90%的蛋白酶活性。
-与SEQ ID NO:15的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:15的多肽的至少95%的蛋白酶活性。
-与SEQ ID NO:15的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:15的多肽的至少100%的蛋白酶活性。
-与SEQ ID NO:38的氨基酸195至560或190至560的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:38的氨基酸195至560或190至560的多肽的至少70%的蛋白酶活性。
-与SEQ ID NO:38的氨基酸195至560或190至560的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:38的氨基酸195至560或190至560的多肽的至少75%的蛋白酶活性。
-与SEQ ID NO:38的氨基酸195至560或190至560的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:38的氨基酸195至560或190至560的多肽的至少80%的蛋白酶活性。
-与SEQ ID NO:38的氨基酸195至560或190至560的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:38的氨基酸195至560或190至560的多肽的至少85%的蛋白酶活性。
-与SEQ ID NO:38的氨基酸195至560或190至560的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:38的氨基酸195至560或190至560的多肽的至少90%的蛋白酶活性。
-与SEQ ID NO:38的氨基酸195至560或190至560的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:38的氨基酸195至560或190至560的多肽的至少95%的蛋白酶活性。
-与SEQ ID NO:38的氨基酸195至560或190至560的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:38的氨基酸195至560或190至560的多肽的至少100%的蛋白酶活性。
-与SEQ ID NO:39的氨基酸226至647或221至647的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:39的氨基酸195至560或221至647的多肽的至少70%的蛋白酶活性。
-与SEQ ID NO:39的氨基酸226至647或221至647的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:39的氨基酸226至647或221至647的多肽的至少75%的蛋白酶活性。
-与SEQ ID NO:39的氨基酸226至647或221至647的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:39的氨基酸226至647或221至647的多肽的至少80%的蛋白酶活性。
-与SEQ ID NO:39的氨基酸226至647或221至647的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:39的氨基酸226至647或221至647的多肽的至少85%的蛋白酶活性。
-与SEQ ID NO:39的氨基酸226至647或221至647的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:39的氨基酸226至647或221至647的多肽的至少90%的蛋白酶活性。
-与SEQ ID NO:39的氨基酸226至647或221至647的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:39的氨基酸226至647或221至647的多肽的至少95%的蛋白酶活性。
-与SEQ ID NO:39的氨基酸226至647或221至647的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:39的氨基酸226至647或221至647的多肽的至少100%的蛋白酶活性。
在一个具体的实施例中,该组合物包含S53蛋白酶,和选自葡糖淀粉酶、α-葡糖苷酶、麦芽糖淀粉酶、或β-淀粉酶的产碳水化合物源酶。
在一个实施例中,包含在组合物中的葡糖淀粉酶是真菌来源的,优选地来自曲霉属的菌株,优选黑曲霉、泡盛曲霉或米曲霉;或木霉属的菌株,优选里氏木霉;或篮状菌属的菌株,优选埃默森篮状菌;或栓菌属的菌株,优选瓣环栓菌(T.cingulata);或密孔菌属的菌株,优选血红密孔菌;或粘褶菌属的菌株,如篱边粘褶菌或密粘褶菌;或黑层孔属(Nigrofomes)的菌株。
在一个实施例中,该葡糖淀粉酶是源自栓菌属,如瓣环栓菌的菌株,如示于在此的SEQ ID NO:17中的菌株。
在一个实施例中,葡糖淀粉酶选自下组,该组由以下组成:
(i)包含在此的SEQ ID NO:17的多肽的葡糖淀粉酶;
(ii)包含以下氨基酸序列的葡糖淀粉酶,该氨基酸序列与在此的SEQ ID NO:17的多肽具有至少60%、至少70%,例如至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的一致性。
在一个实施例中,葡糖淀粉酶是源自篮状菌属,如埃默森篮状菌的菌株,如示于在此的SEQ ID NO:18中的菌株。
在一个实施例中,葡糖淀粉酶选自下组,该组由以下组成:
(i)包含在此的SEQ ID NO:18的多肽的葡糖淀粉酶;
(ii)包含以下氨基酸序列的葡糖淀粉酶,该氨基酸序列与在此的SEQ ID NO:18的多肽具有至少60%、至少70%,例如至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的一致性。
在一个实施例中,葡糖淀粉酶是源自密孔菌属的菌株,特别是描述于WO 2011/066576中的血红密孔菌的菌株(SEQ ID NO 2、4或6),如示为WO 2011/066576中的SEQ IDNO:4的菌株。
在一个实施例中,葡糖淀粉酶选自下组,该组由以下组成:
(i)包含在此的SEQ ID NO:19的多肽的葡糖淀粉酶;
(ii)包含以下氨基酸序列的葡糖淀粉酶,该氨基酸序列与在此的SEQ ID NO:19的多肽具有至少60%、至少70%,例如至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的一致性。
在一个实施例中,葡糖淀粉酶是源自粘褶菌属的菌株,如篱边粘褶菌或密粘褶菌的菌株,特别是如在WO 2011/068803中描述的粘褶菌属的菌株(SEQ ID NO:2、4、6、8、10、12、14或16)。在一个优选的实施例中,该葡糖淀粉酶是示于WO 2011/068803中的SEQ IDNO:2或在此的SEQ ID NO:20中的篱边粘褶菌。
在一个实施例中,葡糖淀粉酶是源自篱边粘褶菌,如示于在此的SEQ ID NO:20中的菌株。在一个实施例中,葡糖淀粉酶选自下组,该组由以下组成:
(i)包含在此的SEQ ID NO:20的多肽的葡糖淀粉酶;
(ii)包含以下氨基酸序列的葡糖淀粉酶,该氨基酸序列与在此的SEQ ID NO:20的多肽具有至少60%、至少70%,例如至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的一致性。
在另一个实施例中,葡糖淀粉酶源自密粘褶菌,如示于在此的SEQ ID NO:21中的密粘褶菌。在一个实施例中,葡糖淀粉酶选自下组,该组由以下组成:
(i)包含在此的SEQ ID NO:21的多肽的葡糖淀粉酶;
(ii)包含以下氨基酸序列的葡糖淀粉酶,该氨基酸序列与在此的SEQ ID NO:21的多肽具有至少60%、至少70%,例如至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的一致性。
在一个实施例中,葡糖淀粉酶源自黑层孔属(Nigrofomes)的菌株,具体是披露于WO 2012/064351中的黑层孔属物种的菌株。
在一个实施例中,葡糖淀粉酶能以如下量添加到糖化和/或发酵中:0.0001-20AGU/g DS,优选0.001-10AGU/g DS,尤其是0.01-5AGU/g DS之间,如0.1-2AGU/g DS。
包含葡糖淀粉酶的可商购组合物包括AMG 200L;AMG 300L;SANTM SUPER、SANTMEXTRA L、SPIRIZYMETM PLUS、SPIRIZYMETM FUEL、SPIRIZYMETM B4U、SPIRIZYMETM ULTRA、SPIRIZYMETM EXCEL和AMGTM E(来自诺维信公司(Novozymes A/S));OPTIDEXTM 300、GC480、GC417(来自杜邦公司(DuPont.));AMIGASETM和AMIGASETM PLUS(来自DSM公司);G-ZYMETMG900、G-ZYMETM和G990ZR(来自杜邦公司)。
除了葡糖淀粉酶之外,该组合物可以进一步包含α-淀粉酶。具体地,该α-淀粉酶是酸性真菌α-淀粉酶。真菌酸性稳定的α-淀粉酶是在3.0至7.0的pH范围内,并且优选地在3.5至6.5的范围内具有活性的α-淀粉酶,包括在约4.0、4.5、5.0、5.5、和6.0的pH下的活性。
优选地,酸性真菌α-淀粉酶源自曲霉属,具体是土曲霉、黑曲霉、米曲霉、泡盛曲霉、或白曲霉的菌株;或者源自毛霉属,优选地微小根毛霉的菌株;或亚灰树花菌属,优选地大型亚灰树花菌的菌株。
在一个优选的实施例中,该α-淀粉酶源自根毛霉属的菌株,优选的是菌株微小根毛霉,例如示于WO 2013/006756中的SEQ ID NO:3中的一种,例如具有黑曲霉连接子和淀粉结合域的微小根毛霉α-淀粉酶杂合体,例如示于在此的SEQ ID NO:16中的一种,或其变体。
在一个实施例中,该α-淀粉酶选自下组,该组由以下组成:
(i)包含在此的SEQ ID NO:16的多肽的α-淀粉酶;
(ii)包含以下氨基酸序列的α-淀粉酶,该氨基酸序列与在此的SEQ ID NO:16的多肽具有至少60%、至少70%,例如至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的一致性。
在一个优选的实施例中,该α-淀粉酶是示于SEQ ID NO:16中的具有以下取代或取代的组合中的至少一个的α-淀粉酶的变体:D165M;Y141W;Y141R;K136F;K192R;P224A;P224R;S123H+Y141W;G20S+Y141W;A76G+Y141W;G128D+Y141W;G128D+D143N;P219C+Y141W;N142D+D143N;Y141W+K192R;Y141W+D143N;Y141W+N383R;Y141W+P219C+A265C;Y141W+N142D+D143N;Y141W+K192R V410A;G128D+Y141W+D143N;Y141W+D143N+P219C;Y141W+D143N+K192R;G128D+D143N+K192R;Y141W+D143N+K192R+P219C;G128D+Y141W+D143N+K192R;或G128D+Y141W+D143N+K192R+P219C(使用SEQ ID NO:16进行编号)。
在一个实施例中,α-淀粉酶源自具有黑曲霉葡糖淀粉酶连接体和淀粉结合结构域(SBD)的微小根毛霉,优选地披露为在此的SEQ ID NO:16,优选地具有以下取代的一个或多个:G128D、D143N、优选是G128D+D143N(使用SEQ ID NO:16进行编号),并且其中该α-淀粉酶变体与在此的SEQ ID NO:16的多肽具有至少75%一致性、优选地至少80%、更优选地至少85%、更优选地至少90%、更优选地至少91%、更优选地至少92%、甚至更优选地至少93%、最优选地至少94%、并且甚至最优选地至少95%,如甚至至少96%、至少97%、至少98%、至少99%,但小于100%一致性。
在一个优选实施例中,在糖化和/或发酵过程中存在的和/或添加的葡糖淀粉酶与α-淀粉酶之间的比率优选地可以在500:1至1:1,如从250:1至1:1、如从100:1至1:1、如从100:2至100:50、如从100:3至100:70的范围内。
组合物可以根据本领域已知的方法制备,并且可以是液体或干燥组合物的形式。例如,组合物可以处于颗粒或微颗粒的形式。可以根据本领域已知的方法将变体稳定化。
组合物可以根据本领域已知的方法制备,并且可以是液体或干燥组合物的形式。可以根据本领域中已知的方法稳定这些组合物。
本发明的酶组合物可为任何适于使用的形式,例如像,去除或未去除细胞的粗发酵液,含或不含细胞碎片的细胞裂解物,半纯化或纯化的酶组合物,或宿主细胞,作为酶的来源。
该酶组合物可为干粉或颗粒,无粉尘的颗粒,液体,稳定化液体或稳定化受保护的酶。可以根据已建立的方法例如通过添加稳定剂(如糖、糖醇或其他多元醇)、和/或乳酸或另一种有机酸,对液体酶组合物进行稳定化。
淀粉加工
天然淀粉由室温下不溶于水的微观颗粒组成。加热水性淀粉浆料时,颗粒膨胀并且最后破裂,将淀粉分子分散至溶液中。在高达约50℃至75℃的温度处,膨胀可以是可逆的。然而,在更高温度处,开始不可逆膨胀,称为“胶凝化”。在此“凝胶化(gelatinization)”过程中,粘度有显著地增加。有待加工的颗粒状淀粉可以具有高度精制的淀粉质量,优选地至少90%、至少95%、至少97%或至少99.5%纯,或它可以为含更粗糙的淀粉的材料,这些材料包含(例如,经碾磨的)全谷物,全谷物包括非淀粉部分,如胚芽残留物和纤维。该原材料(如全谷物)可以例如经过碾磨减少粒度,以便展开结构并且允许进一步加工。在干式碾磨中,整个谷粒被碾磨并且使用。湿磨使胚芽与粗粉(淀粉颗粒和蛋白质)很好分离并且时常应用于在例如糖浆的生产中使用淀粉水解物的场所。干式和湿式碾磨两者是本领域中熟知的淀粉加工法并且可以用于本发明的方法中。用于减少该含淀粉材料的粒度的方法为本领域的普通技术人员所已知。
由于典型工业过程中的固体水平为30%-40%,因此不得不稀释或“液化”淀粉以使其能够被适当加工。在当前商业做法中,粘度的这种降低主要通过酶法降解来实现。
在α-淀粉酶,优选细菌α-淀粉酶和/或酸性真菌α-淀粉酶的存在下进行液化。在一个实施例中,在液化过程中还存在植酸酶。在一个实施例中,在液化期间,还存在降粘酶例如木聚糖酶和/或β-葡聚糖酶。
在液化过程中,α-淀粉酶将长链淀粉降解为支链以及线性的较短单元(麦芽糊精)。液化可以作为一个三步热浆料方法进行。将浆料加热至60℃-95℃之间(例如70℃-90℃,例如77℃-86℃、80℃-85℃、83℃-85℃)并且添加α-淀粉酶以开始液化(稀释)。
在一个实施例中,可以将浆料在95℃-140℃(例如,105℃-125℃)之间喷射蒸煮约1-15分钟,例如约3-10分钟,尤其是5分钟左右。然后,将浆料冷却至60℃-95℃并且添加更多的α-淀粉酶,以获得最终水解(二次液化)。在pH 4.5-6.5下,典型地在5与6之间的pH下进行喷射蒸煮过程。可以例如在喷射蒸煮之前,将α-淀粉酶以单一剂量添加。
在70℃-95℃之间,例如80℃-90℃,例如85℃左右,将液化过程进行约10分钟至5小时,典型地是1-2小时。pH在4与7之间,例如在4.5与5.5之间。为了确保这些条件下最佳的酶稳定性,可以任选地添加钙(以提供1-60ppm游离钙离子,例如约40ppm游离钙离子)。如此处理之后,液化淀粉将典型地具有10-15的“右旋糖当量”(DE)。
通常,液化和液化条件在本领域是熟知的。
用于液化中的α-淀粉酶优选是细菌酸稳定型α-淀粉酶。具体地,α-淀粉酶来自微小杆菌属物种或芽孢杆菌属物种(例如像嗜热脂肪芽孢杆菌或地衣芽孢杆菌)。
在一个实施例中,α-淀粉酶来自芽孢杆菌属,如嗜热脂肪芽孢杆菌菌株,特别是嗜热脂肪芽孢杆菌α-淀粉酶的变体,如WO 99/019467中的SEQ ID NO:3或在此的SEQ ID NO:22中所示的α-淀粉酶。
在一个实施例中,嗜热脂肪芽孢杆菌α-淀粉酶在从位置179至位置182的区域中具有两个氨基酸的双缺失,更具体地在位置I181+G182、R179+G180、G180+I181、R179+I181或G180+G182(优选I181+G182)处的双缺失,和任选地N193F取代(使用SEQ ID NO:22进行编号)。
在一个实施例中,嗜热脂肪芽孢杆菌α-淀粉酶在位置S242处具有取代,优选S242Q取代。
在一个实施例中,嗜热脂肪芽孢杆菌α-淀粉酶在位置E188处具有取代,优选E188P取代。
在一个实施例中,α-淀粉酶选自嗜热脂肪芽孢杆菌α-淀粉酶变体的组,所述变体具有以下突变:
-I181*+G182*+N193F+E129V+K177L+R179E;
-I181*+G182*+N193F+V59A+Q89R+E129V+K177L+R179E+H208Y+K220P+N224L+Q254S;
-I181*+G182*+N193F+V59A Q89R+E129V+K177L+R179E+Q254S+M284V;以及
-I181*+G182*+N193F+E129V+K177L+R179E+K220P+N224L+S242Q+Q254S(使用SEQID NO:22进行编号)。
在一个实施例中,该α-淀粉酶变体与SEQ ID NO:22的多肽具有至少75%一致性,优选地至少80%,更优选地至少85%,更优选地至少90%,更优选地至少91%,更优选地至少92%,甚至更优选地至少93%,最优选地至少94%,并且甚至最优选地至少95%,如甚至至少96%、至少97%、至少98%、至少99%,但小于100%一致性。
应理解的是,当提及嗜热脂肪芽孢杆菌α-淀粉酶及其变体时,它们通常以截短的形式产生。具体地,截短可以为这样使得WO 99/19467中的SEQ ID NO:3或在此的SEQ IDNO:22中所示的嗜热脂肪芽孢杆菌α-淀粉酶或其变体在C-末端截短以优选地具有约490个氨基酸,如从482-493个氨基酸。优选地,嗜热脂肪芽孢杆菌变体α-淀粉酶优选地在SEQ IDNO:22的位置484之后,特别是在位置485之后,特别是在位置486之后,特别是在位置487之后,特别是在位置488之后,特别是在位置489之后,特别是在位置490之后,特别是在位置491之后,特别是在位置492之后,更特别是在位置493之后被截短。
可以使用本领域熟知的条件,用产碳水化合物源的酶,具体是葡糖淀粉酶或β-淀粉酶以及任选地去分支酶(例如异淀粉酶或支链淀粉酶)进行糖化。例如,全部糖化步骤可以持续从约24至约72小时。然而,常见地在30℃-65℃之间的温度(典型地约60℃)下进行典型地40-90分钟的预糖化,随后在同时糖化和发酵过程(SSF)中,在发酵期间进行完全糖化。典型地在20℃-75℃的范围内的温度(例如,25℃-65℃和40℃-70℃,典型地60℃左右)下,并且在约4与5之间的pH下,一般在约pH 4.5下进行糖化。
糖化步骤和发酵步骤可以依序或同时进行。在一个实施例中,糖化和发酵是同时进行的(称为“SSF”)。然而,通常,在30℃至65℃、典型地约60℃的温度处执行一个预糖化步骤约30分钟至2小时(例如,30至90分钟),随后在被称为同时糖化和发酵(SSF)的发酵期间进行一个完全糖化。pH通常在4.2-4.8之间,例如,pH 4.5。在同时糖化和发酵(SSF)过程中,没有糖化的保持阶段,而实际上是,酵母和酶一起添加。
在典型糖化过程中,通过添加葡糖淀粉酶以及去分支酶,如异淀粉酶(美国专利号4,335,208)或支链淀粉酶,来将液化期间产生的麦芽糊精转化成右旋糖。添加葡糖淀粉酶以及去分支酶之前使温度降低至60℃。糖化过程进行24-72小时。在添加糖化酶之前,使pH降低至低于4.5,同时维持高温(高于95℃),以便使液化α-淀粉酶失活。此过程减少了称为“潘糖前体”的短低聚糖的形成,这种短低聚糖不能通过去分支酶来适当水解。正常地,约0.2%-0.5%的糖化产物是分支三糖潘糖(Glc pα1-6Glc pα1-4Glc),它不能由支链淀粉酶降解。如果糖化过程中仍然存在得自液化步骤的活性淀粉酶(即未变性),潘糖的量可以高至1%-2%,这是高度不希望的,因为它显著降低了糖化产率。
其他发酵产物可以在本领域的普通技术人员熟知的、适于所讨论的发酵生物体的条件和温度处发酵。
可以通过本领域熟知的方法(例如,通过蒸馏)回收发酵产物。在下面的“酶”部分中披露了产碳水化合物源的酶的实例。
在具体实施例中,本发明的方法在将含淀粉材料转化为糖/糊精之前进一步包含以下步骤:
(x)减少该含淀粉材料的粒度;以及
(y)形成一种包含该含淀粉材料和水的浆料。
在一个实施例中,将该含淀粉材料碾磨,以减少粒度。在一个实施例中,该粒度被减少至0.05-3.0mm,优选0.1-0.5mm之间,或使得至少30%,优选至少50%,更优选至少70%,甚至更优选至少90%的含淀粉材料适合通过一个具有0.05-3.0mm筛网,优选0.1-0.5mm筛网的筛子。
该水性浆料可以含有含淀粉材料的从10-55wt.%干固体(DS),优选25-45wt.%干固体(DS),更优选30-40wt.%干固体(DS)。
常规淀粉转化过程如液化以及糖化过程描述于例如美国专利号3,912,590、EP252730以及EP 063909中,这些专利通过引用结合在此。
在一个实施例中,转化方法将淀粉降解为较低分子量的碳水化合物成分,如糖或脂肪替代物,该方法包括一个脱支步骤。
当将淀粉转化为糖时,淀粉被解聚。这类解聚过程由例如预处理步骤以及两个或三个连续过程步骤组成,即,液化过程、糖化过程并且取决于所需最终产物,任选的异构化过程。
当所需的最终糖产物是例如高果糖糖浆时,右旋糖糖浆可被转化为果糖。糖化过程之后,将pH值增加至6-8范围内的值,例如pH 7.5,并且通过离子交换除去钙。然后,使用例如固定化葡萄糖异构酶将右旋糖糖浆转化成高果糖糖浆。
发酵产物的生产
可发酵的糖类(例如,糊精类、单糖类,尤其是葡萄糖)由酶法糖化产生。这些可发酵的糖类可进一步纯化和/或转化成有用的糖产物。另外,这些糖可在微生物发酵过程中用作发酵进料来产生最终产物,如醇(例如,乙醇以及丁醇)、有机酸(例如,丁二酸,3-HP以及乳酸)、糖醇(例如,甘油)、抗坏血酸中间物(例如,葡萄糖酸盐、2-酮基-D-葡萄糖酸盐、2,5-二酮基-D-葡萄糖酸盐以及2-酮基-L-古洛糖酸)、氨基酸(例如,赖氨酸)、蛋白质(例如,抗体及其片段)。
在一个实施例中,液化过程步骤期间获得的可发酵的糖用于产生醇,并且尤其是乙醇。在乙醇生产中,通常使用SSF过程,其中糖化酶以及发酵生物体(例如,酵母)一起添加,并且然后在30℃-40℃温度处执行。
发酵中所使用的生物体取决于所需最终产物。典型地,如果乙醇是所需最终产物,则将酵母用作发酵生物体。在一些优选实施例中,产乙醇微生物是酵母,并且尤其是酵母属如酿酒酵母菌株(美国专利号4,316,956)。各种酿酒酵母是可商购的并且这些包括但不限于:FALI(弗莱希曼酵母(Fleischmann'sYeast))、SUPERSTART(奥泰公司(Alltech))、FERMIOL(帝斯曼公司(DSM Specialties))、RED STAR(乐斯福公司(Lesaffre))以及Angel醇酵母(天使酵母公司(Angel Yeast Company),中国(China))。这些方法中所使用的起始酵母的量是在合适时间内有效产生商业上有效量乙醇的量(例如,在小于72小时内从具有25%-40%之间DS的底物产生至少10%乙醇)。酵母细胞总体上以约104至约1012、并且优选地从约107至约1010活酵母计数/mL发酵液的量来供应。在将酵母添加至醪液之后,使它典型地经受发酵约24-96小时,例如,35-60小时。温度在约26℃-34℃之间,典型地约32℃,并且pH是从pH 3-6,例如,约pH 4-5。
除了发酵微生物(例如,酵母)以外,发酵还可包括营养物以及额外酶,这些额外酶包括植酸酶。酵母在发酵中的使用在本领域中是熟知的。
在另外的实施例中,如本领域中已知的,适当发酵微生物的使用可产生发酵最终产物,包括例如甘油、1,3-丙二醇、葡萄糖酸盐、2-酮基-D-葡萄糖酸盐、2,5-二酮基-D-葡萄糖酸盐、2-酮基-L-古洛糖酸、丁二酸、乳酸、氨基酸及其衍生物。更具体地说,当乳酸是所需最终产物时,可使用乳酸杆菌属物种(干酪乳杆菌(L.casei));当甘油或1,3-丙二醇是所需最终产物时,可使用大肠杆菌;并且当2-酮基-D-葡萄糖酸盐、2,5-二酮基-D-葡萄糖酸盐以及2-酮基-L-古洛糖酸是所需最终产物时,柠檬泛菌可用作发酵微生物。以上列举的列表只是实例并且本领域技术人员知道可用于获得所需最终产物的许多发酵微生物。
由含经未经糊化的淀粉的材料生产发酵产物的工艺
本发明涉及在含淀粉材料没有糊化(即,没有蒸煮)的情况下从含淀粉材料生产发酵产物的方法(通常被称为“粗淀粉水解”方法)。可在不使包含含淀粉材料以及水的水性浆料液化的情况下生产发酵产物如乙醇。在一个实施例中,本发明的方法包括:在低于初始糊化温度处、优选地在α-淀粉酶和/或产碳水化合物源的酶的存在下将(例如碾磨的)含淀粉材料(例如颗粒状淀粉)糖化,以产生可以通过适合的发酵生物体发酵成发酵产物的多种糖。在此实施例中,所希望的发酵产物例如乙醇是从未经糊化的(即,未蒸煮),优选地经碾磨的谷粒如玉米中产生的。
因此,在一方面,本发明涉及用于从含淀粉材料产生发酵产物的方法,该方法包括使用产碳水化合物源的酶和发酵生物体,在低于所述含淀粉材料的初始糊化温度的温度处,在属于S53家族的丝氨酸蛋白酶的存在下将含淀粉材料同时糖化和发酵。糖化和发酵还可以是分开的。因而,在另一方面,本发明涉及生产发酵产物的方法,包括以下步骤:
(i)在低于初始糊化温度的温度处使用产碳水化合物源的酶(例如葡糖淀粉酶)糖化含淀粉材料;以及
(ii)使用发酵生物体进行发酵;
其中使用至少葡糖淀粉酶、和属于S53家族的丝氨酸蛋白酶进行步骤(i)。
具体地,S53家族蛋白酶是内切蛋白酶。
在一个具体的实施例中,该S53蛋白酶选自源自以下属的菌株的蛋白酶:亚灰树花菌属、栓菌属、叉丝孔菌属、多孔菌属、革褶菌属、灵芝属、香菇属或芽孢杆菌属,更具体地大型亚灰树花菌、变色栓菌、污叉丝孔菌、漏斗多孔菌、桦革褶菌、灵芝、洁丽香菇、或芽孢杆菌属物种19138。
更具体地,该S53蛋白酶选自下组,该组由以下组成:
-与SEQ ID NO:3的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:3的多肽的至少70%的蛋白酶活性。
-与SEQ ID NO:3的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:3的多肽的至少75%的蛋白酶活性。
-与SEQ ID NO:3的多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:3的成熟多肽的至少80%的蛋白酶活性。
-与SEQ ID NO:3的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:3的多肽的至少85%的蛋白酶活性。
-与SEQ ID NO:3的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:3的多肽的至少90%的蛋白酶活性。
-与SEQ ID NO:3的多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:3的多肽的至少95%的蛋白酶活性。
-与SEQ ID NO:3的多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:3的多肽的至少100%的蛋白酶活性。
-与SEQ ID NO:6的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:6的多肽的至少70%的蛋白酶活性。
-与SEQ ID NO:6的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:6的多肽的至少75%的蛋白酶活性。
-与SEQ ID NO:6的多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:6的成熟多肽的至少80%的蛋白酶活性。
-与SEQ ID NO:6的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:6的多肽的至少85%的蛋白酶活性。
-与SEQ ID NO:6的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:6的多肽的至少90%的蛋白酶活性。
-与SEQ ID NO:6的多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:6的多肽的至少95%的蛋白酶活性。
-与SEQ ID NO:6的多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:6的多肽的至少100%的蛋白酶活性。
-与SEQ ID NO:9的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:9的多肽的至少70%的蛋白酶活性。
-与SEQ ID NO:9的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:9的多肽的至少75%的蛋白酶活性。
-与SEQ ID NO:9的多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:9的成熟多肽的至少80%的蛋白酶活性。
-与SEQ ID NO:9的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:9的多肽的至少85%的蛋白酶活性。
-与SEQ ID NO:9的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:9的多肽的至少90%的蛋白酶活性。
-与SEQ ID NO:9的多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:9的多肽的至少95%的蛋白酶活性。
-与SEQ ID NO:9的多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:9的多肽的至少100%的蛋白酶活性。
-与SEQ ID NO:12的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:12的多肽的至少70%的蛋白酶活性。
-与SEQ ID NO:12的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:12的多肽的至少75%的蛋白酶活性。
-与SEQ ID NO:12的多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:12的成熟多肽的至少80%的蛋白酶活性。
-与SEQ ID NO:12的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:12的多肽的至少85%的蛋白酶活性。
-与SEQ ID NO:12的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:12的多肽的至少90%的蛋白酶活性。
-与SEQ ID NO:12的多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:12的多肽的至少95%的蛋白酶活性。
-与SEQ ID NO:12的多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:12的多肽的至少100%的蛋白酶活性。
-与SEQ ID NO:15的成熟多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:15的多肽的至少70%的蛋白酶活性。
-与SEQ ID NO:15的成熟多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:15的多肽的至少75%的蛋白酶活性。
-与SEQ ID NO:15的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:15的成熟多肽的至少80%的蛋白酶活性。
-与SEQ ID NO:15的成熟多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:15的多肽的至少85%的蛋白酶活性。
-与SEQ ID NO:15的成熟多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:15的多肽的至少90%的蛋白酶活性。
-与SEQ ID NO:15的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:15的多肽的至少95%的蛋白酶活性。
-与SEQ ID NO:15的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:15的多肽的至少100%的蛋白酶活性。
-与SEQ ID NO:27的成熟多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:27的多肽的至少70%的蛋白酶活性。
-与SEQ ID NO:27的成熟多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:27的多肽的至少75%的蛋白酶活性。
-与SEQ ID NO:27的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:27的成熟多肽的至少80%的蛋白酶活性。
-与SEQ ID NO:27的成熟多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:27的多肽的至少85%的蛋白酶活性。
-与SEQ ID NO:27的成熟多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:27的多肽的至少90%的蛋白酶活性。
-与SEQ ID NO:27的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:27的多肽的至少95%的蛋白酶活性。
-与SEQ ID NO:27的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:27的多肽的至少100%的蛋白酶活性。
-与SEQ ID NO:31的成熟多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:31的多肽的至少70%的蛋白酶活性。
-与SEQ ID NO:31的成熟多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:31的多肽的至少75%的蛋白酶活性。
-与SEQ ID NO:31的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:31的成熟多肽的至少80%的蛋白酶活性。
-与SEQ ID NO:31的成熟多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:31的多肽的至少85%的蛋白酶活性。
-与SEQ ID NO:31的成熟多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:31的多肽的至少90%的蛋白酶活性。
-与SEQ ID NO:31的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:31的多肽的至少95%的蛋白酶活性。
-与SEQ ID NO:31的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:31的多肽的至少100%的蛋白酶活性。
-与SEQ ID NO:35的成熟多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:35的多肽的至少70%的蛋白酶活性。
-与SEQ ID NO:35的成熟多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:35的多肽的至少75%的蛋白酶活性。
-与SEQ ID NO:35的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:35的成熟多肽的至少80%的蛋白酶活性。
-与SEQ ID NO:35的成熟多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:35的多肽的至少85%的蛋白酶活性。
-与SEQ ID NO:35的成熟多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:35的多肽的至少90%的蛋白酶活性。
-与SEQ ID NO:35的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:35的多肽的至少95%的蛋白酶活性。
-与SEQ ID NO:35的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:35的多肽的至少100%的蛋白酶活性。
-与SEQ ID NO:38的氨基酸195至560或190至560的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:38的氨基酸195至560或190至560的多肽的至少70%的蛋白酶活性。
-与SEQ ID NO:38的氨基酸195至560或190至560的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:38的氨基酸195至560或190至560的多肽的至少75%的蛋白酶活性。
-与SEQ ID NO:38的氨基酸195至560或190至560的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:38的氨基酸195至560或190至560的多肽的至少80%的蛋白酶活性。
-与SEQ ID NO:38的氨基酸195至560或190至560的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:38的氨基酸195至560或190至560的多肽的至少85%的蛋白酶活性。
-与SEQ ID NO:38的氨基酸195至560或190至560的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:38的氨基酸195至560或190至560的多肽的至少90%的蛋白酶活性。
-与SEQ ID NO:38的氨基酸195至560或190至560的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:38的氨基酸195至560或190至560的多肽的至少95%的蛋白酶活性。
-与SEQ ID NO:38的氨基酸195至560或190至560的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:38的氨基酸195至560或190至560的多肽的至少100%的蛋白酶活性。
-与SEQ ID NO:39的氨基酸226至647或221至647的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:39的氨基酸195至560或221至647的多肽的至少70%的蛋白酶活性。
-与SEQ ID NO:39的氨基酸226至647或221至647的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:39的氨基酸226至647或221至647的多肽的至少75%的蛋白酶活性。
-与SEQ ID NO:39的氨基酸226至647或221至647的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:39的氨基酸226至647或221至647的多肽的至少80%的蛋白酶活性。
-与SEQ ID NO:39的氨基酸226至647或221至647的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:39的氨基酸226至647或221至647的多肽的至少85%的蛋白酶活性。
-与SEQ ID NO:39的氨基酸226至647或221至647的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:39的氨基酸226至647或221至647的多肽的至少90%的蛋白酶活性。
-与SEQ ID NO:39的氨基酸226至647或221至647的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:39的氨基酸226至647或221至647的多肽的至少95%的蛋白酶活性。
-与SEQ ID NO:39的氨基酸226至647或221至647的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:39的氨基酸226至647或221至647的多肽的至少100%的蛋白酶活性。
在一个实施例中,在步骤(i)中还添加α淀粉酶。可以同时进行步骤(i)和(ii)。
发酵之后,可以任选地例如通过蒸馏来回收发酵产物(例如乙醇)。典型地,在发酵期间存在一种或多种淀粉酶如葡糖淀粉酶、和/或其他产碳水化合物源的酶、和/或一种或多种α-淀粉酶。葡糖淀粉酶以及其他产碳水化合物源的酶的实例包括使原料淀粉水解的葡糖淀粉酶。一种或多种α-淀粉酶的实例包括酸性α-淀粉酶如酸性真菌α-淀粉酶。发酵生物体的实例包括酵母例如,酿酒酵母的菌株。术语“初始糊化温度”意指淀粉的糊化发生的最低温度。通常,在水中加热的淀粉在约50℃与75℃之间开始糊化;糊化的准确温度依赖于具体的淀粉,并能够由本领域的技术人员容易地确定。因此,初始糊化温度可根据植物种类、植物种类的具体品种、以及生长条件而变化。在本发明的上下文中,给定的含淀粉材料的初始糊化温度是使用Gorinstein和Lii,1992,[淀粉]44(12):461-466所描述的方法,使5%的淀粉颗粒丧失双折射的温度。在开始该方法之前,可以制备具有10-55w/w%干固体(DS)、优选25-45w/w%干固体、更优选30-40w/w%干固体的含淀粉材料(例如颗粒状淀粉)的浆料。该浆料可以包括水和/或工艺用水,如釜馏物(逆流)、洗涤器水、蒸发器冷凝物或馏出物、由蒸馏得到的侧流汽提器水,或来自其他发酵产物设备的工艺用水。由于本发明的方法是在低于该初始糊化温度处进行的并且因此没有发生显著的粘度增加,所以如果希望的话,可以使用高水平的釜馏物。在一个实施例中,水性浆料含有约1vol.%至约70vol.%、优选15vol.%-60vol.%、尤其是约30vol.%至50vol.%的水和/或工艺用水,如釜馏物(逆流)、洗涤器水、蒸发器冷凝物或馏出物、由蒸馏得到的侧线汽提器水,或来自其他发酵产物设备的工艺用水,或其组合等。含淀粉材料可优选地通过干式或湿式碾磨来减少粒度至0.05至3.0mm,优选地0.1-0.5mm而制备。在经受本发明的方法之后,含淀粉材料中至少85%、至少86%、至少87%、至少88%、至少89%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、或优选地至少99%的干固体被转化成可溶的淀粉水解产物。本发明此方面的方法是在低于初始糊化温度的温度处进行的,意味着温度典型地在30℃-75℃之间、优选地在45℃-60℃之间的范围内。在一个优选的实施例中,该方法在从25℃至40℃,如从28℃至35℃,如从30℃至34℃,优选地约32℃的温度处进行。在一个实施例中,执行该方法以使得糖水平,如葡萄糖水平保持在低水平,如低于6w/w%,如低于约3w/w%,如低于约2w/w%,如低于约1w/w%,如低于约0.5w/w%,或低于0.25w/w%,如低于约0.1w/w%。通过简单地采用调整量的酶和发酵生物体就可以实现这样的低水平的糖。本领域的普通技术人员可容易地确定有待使用的酶和发酵生物体的剂量/数量。还可以选择酶和发酵生物体的所采用的量以在发酵液中维持低麦芽糖浓度。例如,麦芽糖水平可保持低于约0.5w/w%,如低于约0.2w/w%。本发明的方法可以在从约3与7之间、优选地从pH 3.5到6、或更优选地从pH 4到5的pH下进行。在一个实施例中,发酵进行6至120小时,尤其是24至96小时。
由含经糊化的淀粉的材料生产发酵产物的方法
在这一方面,本发明涉及由含淀粉材料生产发酵产物、尤其是乙醇的方法,这些方法包括:液化步骤,以及依序地或同时地进行的糖化和发酵步骤。因此,本发明涉及一种用于从含淀粉材料产生发酵产物的方法,该方法包括以下步骤:
(a)在α-淀粉酶存在下使含淀粉材料液化;
(b)使用产碳水化合物源的酶来使步骤(a)中获得的液化材料糖化;
(c)使用发酵生物体体进行发酵;
其中属于家族53的丝氨酸蛋白酶在步骤b)或c)期间存在。
具体地,S53家族蛋白酶是内切蛋白酶。
在一个具体的实施例中,该S53蛋白酶选自源自以下属的菌株的蛋白酶:亚灰树花菌属、栓菌属、叉丝孔菌属、多孔菌属、革褶菌属、灵芝属、香菇属或芽孢杆菌属,更具体地大型亚灰树花菌、变色栓菌、污叉丝孔菌、漏斗多孔菌、桦革褶菌、灵芝、洁丽香菇、或芽孢杆菌属物种19138。
更具体地,该S53蛋白酶选自下组,该组由以下组成:
-与SEQ ID NO:3的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:3的多肽的至少70%的蛋白酶活性。
-与SEQ ID NO:3的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:3的多肽的至少75%的蛋白酶活性。
-与SEQ ID NO:3的多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:3的成熟多肽的至少80%的蛋白酶活性。
-与SEQ ID NO:3的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:3的多肽的至少85%的蛋白酶活性。
-与SEQ ID NO:3的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:3的多肽的至少90%的蛋白酶活性。
-与SEQ ID NO:3的多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:3的多肽的至少95%的蛋白酶活性。
-与SEQ ID NO:3的多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:3的多肽的至少100%的蛋白酶活性。
-与SEQ ID NO:6的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:6的多肽的至少70%的蛋白酶活性。
-与SEQ ID NO:6的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:6的多肽的至少75%的蛋白酶活性。
-与SEQ ID NO:6的多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:6的成熟多肽的至少80%的蛋白酶活性。
-与SEQ ID NO:6的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:6的多肽的至少85%的蛋白酶活性。
-与SEQ ID NO:6的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:6的多肽的至少90%的蛋白酶活性。
-与SEQ ID NO:6的多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:6的多肽的至少95%的蛋白酶活性。
-与SEQ ID NO:6的多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:6的多肽的至少100%的蛋白酶活性。
-与SEQ ID NO:9的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:9的多肽的至少70%的蛋白酶活性。
-与SEQ ID NO:9的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:9的多肽的至少75%的蛋白酶活性。
-与SEQ ID NO:9的多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:9的成熟多肽的至少80%的蛋白酶活性。
-与SEQ ID NO:9的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:9的多肽的至少85%的蛋白酶活性。
-与SEQ ID NO:9的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:9的多肽的至少90%的蛋白酶活性。
-与SEQ ID NO:9的多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:9的多肽的至少95%的蛋白酶活性。
-与SEQ ID NO:9的多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:9的多肽的至少100%的蛋白酶活性。
-与SEQ ID NO:12的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:12的多肽的至少70%的蛋白酶活性。
-与SEQ ID NO:12的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:12的多肽的至少75%的蛋白酶活性。
-与SEQ ID NO:12的多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:12的成熟多肽的至少80%的蛋白酶活性。
-与SEQ ID NO:12的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:12的多肽的至少85%的蛋白酶活性。
-与SEQ ID NO:12的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:12的多肽的至少90%的蛋白酶活性。
-与SEQ ID NO:12的多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:12的多肽的至少95%的蛋白酶活性。
-与SEQ ID NO:12的多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:12的多肽的至少100%的蛋白酶活性。
-与SEQ ID NO:15的成熟多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:15的多肽的至少70%的蛋白酶活性。
-与SEQ ID NO:15的成熟多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:15的多肽的至少75%的蛋白酶活性。
-与SEQ ID NO:15的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:15的成熟多肽的至少80%的蛋白酶活性。
-与SEQ ID NO:15的成熟多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:15的多肽的至少85%的蛋白酶活性。
-与SEQ ID NO:15的成熟多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:15的多肽的至少90%的蛋白酶活性。
-与SEQ ID NO:15的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:15的多肽的至少95%的蛋白酶活性。
-与SEQ ID NO:15的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:15的多肽的至少100%的蛋白酶活性。
-与SEQ ID NO:27的成熟多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:27的多肽的至少70%的蛋白酶活性。
-与SEQ ID NO:27的成熟多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:27的多肽的至少75%的蛋白酶活性。
-与SEQ ID NO:27的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:27的成熟多肽的至少80%的蛋白酶活性。
-与SEQ ID NO:27的成熟多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:27的多肽的至少85%的蛋白酶活性。
-与SEQ ID NO:27的成熟多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:27的多肽的至少90%的蛋白酶活性。
-与SEQ ID NO:27的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:27的多肽的至少95%的蛋白酶活性。
-与SEQ ID NO:27的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:27的多肽的至少100%的蛋白酶活性。
-与SEQ ID NO:31的成熟多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:31的多肽的至少70%的蛋白酶活性。
-与SEQ ID NO:31的成熟多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:31的多肽的至少75%的蛋白酶活性。
-与SEQ ID NO:31的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:31的成熟多肽的至少80%的蛋白酶活性。
-与SEQ ID NO:31的成熟多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:31的多肽的至少85%的蛋白酶活性。
-与SEQ ID NO:31的成熟多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:31的多肽的至少90%的蛋白酶活性。
-与SEQ ID NO:31的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:31的多肽的至少95%的蛋白酶活性。
-与SEQ ID NO:31的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:31的多肽的至少100%的蛋白酶活性。
-与SEQ ID NO:35的成熟多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:35的多肽的至少70%的蛋白酶活性。
-与SEQ ID NO:35的成熟多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:35的多肽的至少75%的蛋白酶活性。
-与SEQ ID NO:35的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:35的成熟多肽的至少80%的蛋白酶活性。
-与SEQ ID NO:35的成熟多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:35的多肽的至少85%的蛋白酶活性。
-与SEQ ID NO:35的成熟多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:35的多肽的至少90%的蛋白酶活性。
-与SEQ ID NO:35的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:35的多肽的至少95%的蛋白酶活性。
-与SEQ ID NO:35的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%的序列一致性的多肽,并且其中该多肽具有SEQ ID NO:35的多肽的至少100%的蛋白酶活性。
-与SEQ ID NO:38的氨基酸195至560或190至560的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:38的氨基酸195至560或190至560的多肽的至少70%的蛋白酶活性。
-与SEQ ID NO:38的氨基酸195至560或190至560的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:38的氨基酸195至560或190至560的多肽的至少75%的蛋白酶活性。
-与SEQ ID NO:38的氨基酸195至560或190至560的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:38的氨基酸195至560或190至560的多肽的至少80%的蛋白酶活性。
-与SEQ ID NO:38的氨基酸195至560或190至560的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:38的氨基酸195至560或190至560的多肽的至少85%的蛋白酶活性。
-与SEQ ID NO:38的氨基酸195至560或190至560的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:38的氨基酸195至560或190至560的多肽的至少90%的蛋白酶活性。
-与SEQ ID NO:38的氨基酸195至560或190至560的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:38的氨基酸195至560或190至560的多肽的至少95%的蛋白酶活性。
-与SEQ ID NO:38的氨基酸195至560或190至560的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:38的氨基酸195至560或190至560的多肽的至少100%的蛋白酶活性。
-与SEQ ID NO:39的氨基酸226至647或221至647的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:39的氨基酸195至560或221至647的多肽的至少70%的蛋白酶活性。
-与SEQ ID NO:39的氨基酸226至647或221至647的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:39的氨基酸226至647或221至647的多肽的至少75%的蛋白酶活性。
-与SEQ ID NO:39的氨基酸226至647或221至647的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:39的氨基酸226至647或221至647的多肽的至少80%的蛋白酶活性。
-与SEQ ID NO:39的氨基酸226至647或221至647的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:39的氨基酸226至647或221至647的多肽的至少85%的蛋白酶活性。
-与SEQ ID NO:39的氨基酸226至647或221至647的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:39的氨基酸226至647或221至647的多肽的至少90%的蛋白酶活性。
-与SEQ ID NO:39的氨基酸226至647或221至647的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:39的氨基酸226至647或221至647的多肽的至少95%的蛋白酶活性。
-与SEQ ID NO:39的氨基酸226至647或221至647的多肽具有至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性的多肽,并且其中该多肽具有SEQ ID NO:39的氨基酸226至647或221至647的多肽的至少100%的蛋白酶活性。
发酵产物,如尤其是乙醇,可以可任选地在发酵之后,例如通过蒸馏来回收。发酵生物体优选地是酵母,优选地是酿酒酵母菌株。在具体实施例中,本发明的方法在步骤(a)之前进一步包括以下步骤:
x)优选地通过研磨(例如,使用锤磨机)来减小含淀粉材料的粒径;
y)形成一种包含该含淀粉材料和水的浆料。
在一个实施例中,粒度是小于#7筛,例如#6筛。#7筛通常用于常规现有技术过程中。水性浆料可含有从10-55,例如25-45以及30-40的w/w%干固体(DS)的含淀粉材料。将浆料加热至高于糊化温度并且可添加α-淀粉酶变体以开始液化(稀释)。在一个实施例中,在步骤(a)中经受α-淀粉酶之前可以喷射蒸煮该浆料以进一步使该浆料经糊化。在一个实施例中,液化可作为三步骤热浆料方法来执行。在pH 4-6、优选地4.5-5.5下,将浆料加热至60℃-95℃之间、优选地70℃-90℃之间、如优选地80℃-85℃之间,并且任选地连同支链淀粉酶和/或蛋白酶、优选地金属蛋白酶一起添加α-淀粉酶变体以开始液化(稀释)。在一个实施例中,然后,可将浆料在95℃-140℃、优选地100℃-135℃、如105℃-125℃之间的温度处喷射蒸煮约1-15分钟、优选地约3-10分钟、尤其是约5分钟。浆料冷却至60℃-95℃并且添加更多α-淀粉酶变体以及任选地支链淀粉酶变体和/或蛋白酶、优选地金属蛋白酶,以完成水解(二次液化)。通常在pH 4.0-6、特别是在从4.5至5.5之间的pH下进行液化过程。可使用本领域熟知的条件来进行糖化步骤(b)。例如,全部糖化过程可以持续从约24到约72小时,然而,通常仅在介于30℃到65℃之间的温度处,典型地约60℃处进行典型地40-90分钟的预糖化,随后在同时糖化和发酵过程(SSF过程)中,在发酵期间进行完全糖化。糖化典型地在从20℃-75℃、优选地从40℃-70℃,典型地约60℃的温度处并且在4与5之间的pH下、一般在约pH4.5下进行。在发酵产物,尤其是乙醇的生产中最广泛使用的方法是同时糖化和发酵(SSF)方法,在该方法中,该糖化不存在保持阶段,意味着发酵生物体(如酵母)和酶可以一起添加。SSF可典型地在从25℃至40℃、如从28℃至35℃、如从30℃至34℃、优选地约32℃的温度处执行。在一个实施例中,发酵进行6至120小时,尤其是24至96小时。
在糖化和/或发酵中存在的和/或添加的葡糖淀粉酶
在一个实施例中,在糖化期间存在的产碳水化合物源的酶可以是葡糖淀粉酶。在本发明的方法中,在糖化和/或发酵,优选同时糖化和发酵(SSF)(即,未经糊化的或经糊化的淀粉材料的糖化和发酵)中,存在和/或添加葡糖淀粉酶。
在一个实施例中,在糖化和/或发酵中存在的和/或添加的葡糖淀粉酶是真菌来源的,优选地来自曲霉属的菌株,优选黑曲霉、泡盛曲霉或米曲霉;或木霉属的菌株,优选里氏木霉;或篮状菌属的菌株,优选埃默森篮状菌;或栓菌属的菌株,优选瓣环栓菌(T.cingulata);或密孔菌属的菌株,优选是血红密孔菌;或粘褶菌属的菌株,如篱边粘褶菌或密粘褶菌;或黑层孔属(Nigrofomes)的菌株。
在一个实施例中,葡糖淀粉酶是源自篮状菌属,如埃默森篮状菌的菌株,如示于在此的SEQ ID NO:18中的菌株。
在一个实施例中,葡糖淀粉酶选自下组,该组由以下组成:
(i)包含在此的SEQ ID NO:18的多肽的葡糖淀粉酶;
(ii)包含以下氨基酸序列的葡糖淀粉酶,该氨基酸序列与在此的SEQ ID NO:18的多肽具有至少60%、至少70%,例如至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的一致性。
在一个实施例中,葡糖淀粉酶是源自密孔菌属的菌株,特别是描述于WO 2011/066576中的血红密孔菌的菌株(SEQ ID NO 2、4或6),如示为WO 2011/066576中的SEQ IDNO:4的菌株。
在一个实施例中,葡糖淀粉酶是源自粘褶菌属的菌株,如篱边粘褶菌或密粘褶菌的菌株,特别是如在WO 2011/068803中描述的粘褶菌属的菌株(SEQ ID NO:2、4、6、8、10、12、14或16)。在一个优选的实施例中,该葡糖淀粉酶是示于WO 2011/068803中的SEQ IDNO:2或在此的SEQ ID NO:20中的篱边粘褶菌。
在一个实施例中,葡糖淀粉酶是源自篱边粘褶菌,如示于在此的SEQ ID NO:20中的菌株。在一个实施例中,葡糖淀粉酶选自下组,该组由以下组成:
(i)包含在此的SEQ ID NO:20的多肽的葡糖淀粉酶;
(ii)包含以下氨基酸序列的葡糖淀粉酶,该氨基酸序列与在此的SEQ ID NO:20的多肽具有至少60%、至少70%,例如至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的一致性。
在另一个实施例中,葡糖淀粉酶源自密粘褶菌,如示于在此的SEQ ID NO:21中的密粘褶菌。在一个实施例中,葡糖淀粉酶选自下组,该组由以下组成:
(i)包含在此的SEQ ID NO:21的多肽的葡糖淀粉酶;
(ii)包含以下氨基酸序列的葡糖淀粉酶,该氨基酸序列与在此的SEQ ID NO:21的多肽具有至少60%、至少70%,例如至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的一致性。
在一个实施例中,葡糖淀粉酶源自黑层孔属(Nigrofomes)的菌株,具体是披露于WO 2012/064351中的黑层孔属物种的菌株。
在一个实施例中,葡糖淀粉酶能以如下量添加到糖化和/或发酵中:0.0001-20AGU/g DS,优选0.001-10AGU/g DS,尤其是0.01-5AGU/g DS之间,如0.1-2AGU/g DS。
包含葡糖淀粉酶的可商购组合物包括AMG 200L;AMG 300L;SANTM SUPER、SANTMEXTRA L、SPIRIZYMETM PLUS、SPIRIZYMETM FUEL、SPIRIZYMETM B4U、SPIRIZYMETM ULTRA、SPIRIZYMETM EXCEL和AMGTM E(来自诺维信公司(Novozymes A/S));OPTIDEXTM 300、GC480、GC417(来自杜邦公司(DuPont.));AMIGASETM和AMIGASETM PLUS(来自DSM公司);G-ZYMETMG900、G-ZYMETM和G990ZR(来自杜邦公司)。
根据本发明的一个优选实施例,在糖化和/或发酵中,葡糖淀粉酶是与α-淀粉酶相结合存在的和/或添加的。下面描述了适合的α-淀粉酶的实例。
在糖化和/或发酵中存在和/或添加的α-淀粉酶
在一个实施例中,在本发明的方法中,在糖化和/或发酵中存在和/或添加的α-淀粉酶。在一个优选实施例中,α-淀粉酶是真菌或细菌来源的。在一个优选实施例中,α-淀粉酶是真菌酸稳定的α-淀粉酶。真菌酸性稳定的α-淀粉酶是在3.0至7.0的pH范围内,并且优选地在3.5至6.5的范围内具有活性的α-淀粉酶,包括在约4.0、4.5、5.0、5.5、和6.0的pH下的活性。
在一个优选实施例中,在糖化和/或发酵中存在的和/或添加的α-淀粉酶是源自根毛霉属的菌株,优选菌株微小根毛霉,如示于WO 2013/006756中的SEQ ID NO:3中的菌株,如具有黑曲霉连接子和淀粉结合结构域的微小根毛霉α-淀粉酶杂合体,如示于在此的SEQID NO:16中的杂合体或其变体。
在一个实施例中,在糖化和/或发酵中存在的和/或添加的α-淀粉酶选自下组,该组由以下组成:
(i)包含在此的SEQ ID NO:16的多肽的α-淀粉酶;
(ii)包含以下氨基酸序列的α-淀粉酶,该氨基酸序列与在此的SEQ ID NO:16的多肽具有至少60%、至少70%,例如至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的一致性。
在一个优选的实施例中,该α-淀粉酶是示于SEQ ID NO:16中的具有以下取代或取代的组合中的至少一个的α-淀粉酶的变体:D165M;Y141W;Y141R;K136F;K192R;P224A;P224R;S123H+Y141W;G20S+Y141W;A76G+Y141W;G128D+Y141W;G128D+D143N;P219C+Y141W;N142D+D143N;Y141W+K192R;Y141W+D143N;Y141W+N383R;Y141W+P219C+A265C;Y141W+N142D+D143N;Y141W+K192R V410A;G128D+Y141W+D143N;Y141W+D143N+P219C;Y141W+D143N+K192R;G128D+D143N+K192R;Y141W+D143N+K192R+P219C;G128D+Y141W+D143N+K192R;或G128D+Y141W+D143N+K192R+P219C(使用SEQ ID NO:16进行编号)。
在一个实施例中,α-淀粉酶源自具有黑曲霉葡糖淀粉酶连接体和淀粉结合结构域(SBD)的微小根毛霉,优选地披露为在此的SEQ ID NO:16,优选地具有以下取代的一个或多个:G128D、D143N、优选是G128D+D143N(使用SEQ ID NO:16进行编号),并且其中在糖化和/或发酵中存在和/或添加的该α-淀粉酶变体与在此的SEQ ID NO:16的多肽具有至少75%一致性、优选地至少80%、更优选地至少85%、更优选地至少90%、更优选地至少91%、更优选地至少92%、甚至更优选地至少93%、最优选地至少94%、并且甚至最优选地至少95%,如甚至至少96%、至少97%、至少98%、至少99%,但小于100%一致性。
在一个优选实施例中,在糖化和/或发酵过程中存在的和/或添加的葡糖淀粉酶与α-淀粉酶之间的比率优选地可以在500:1至1:1,如从250:1至1:1、如从100:1至1:1、如从100:2至100:50、如从100:3至100:70的范围内。
含淀粉材料
可以在本发明的方法中使用任何适合的含淀粉起始材料。通常基于所希望的发酵产物来选择起始材料。适于在本发明的方法中使用的含淀粉起始材料的实例包括大麦、豆类、树薯(cassava)、谷物、玉米、买罗高梁(milo)、豌豆、马铃薯、稻、黑麦、西米、高粱、甘薯、木薯(tapioca)、小麦以及全谷物或其任何混合物。该含淀粉材料还可以是蜡质或非蜡质类型的玉米和大麦。在一个优选的实施例中,该含淀粉材料是玉米。在一个优选的实施例中,该含淀粉材料是小麦。
发酵产物
术语“发酵产物”意指通过包括使用发酵生物体进行发酵的方法或过程生产的产物。发酵产物包括醇(例如,乙醇、甲醇、丁醇);有机酸(例如,柠檬酸、乙酸、衣康酸、乳酸、丁二酸、葡糖酸);酮(例如,丙酮);氨基酸(例如,谷氨酸);气体(例如,H2和CO2);抗生素(例如,青霉素和四环素);酶;维生素(例如,核黄素、B12、β-胡萝卜素);和激素。在一个优选实施例中,该发酵产物是乙醇,例如燃料乙醇;饮用乙醇,即中性饮用酒精;或用于消费性醇工业(例如,啤酒和酒)、乳品工业(例如,发酵的乳制品)、皮革工业和烟草工业的工业乙醇或产物。优选的啤酒类型包括爱尔啤酒(ale)、烈性黑啤酒(stout)、波特啤酒(porter)、拉格啤酒(lager)、苦啤酒(bitter)、麦芽酒(malt liquor)、低麦芽啤酒(happoushu)、高醇啤酒、低醇啤酒、低热量啤酒或清淡啤酒。在优选的实施例中,该发酵产物是乙醇。
以釜馏物加工淀粉浆料
碾磨的含淀粉材料与水以及回收的稀釜馏物合并以产生水性浆料。浆料可包含15至55%ds w/w之间(例如20%至50%、25%至50%、25%至45%、25%至40%、20%至35%以及30%-36%ds)。在一些实施例中,回收的稀釜馏物(逆流)在约10%至70%v/v(例如10%至60%、10%至50%、10%至40%、10%至30%、10%至20%、20%至60%、20%至50%、20%至40%以及还有20%至30%范围内)。
一旦经碾磨的含淀粉材料与水以及逆流合并,不调整浆料中的pH。此外,在将植酸酶以及任选地α-淀粉酶添加至浆料之后,不调整pH。在一个实施例中,浆料的pH是在约pH4.5至小于约6.0范围内(例如pH 4.5至5.8、pH 4.5至5.6、pH 4.8至5.8、pH 5.0至5.8、pH5.0至5.4、pH 5.2至5.5以及pH 5.2至5.9)。取决于添加至浆料的稀釜馏物的量以及包含稀釜馏物的材料的类型,浆料的pH可在约pH 4.5与5.2之间。例如,稀釜馏物的pH可在pH 3.8与pH 4.5之间。
在乙醇生产期间,可添加酸以降低啤酒池中的pH,以减少在蒸馏之前的微生物污染的风险。
在一些实施例中,将植酸酶添加至浆料。在其他实施例中,除了植酸酶以外,将α-淀粉酶添加至浆料。在一些实施例中,将植酸酶以及α-淀粉酶依序添加至浆料。在其他实施例中,同时添加植酸酶以及α-淀粉酶。在一些实施例中,将包含植酸酶以及任选地α-淀粉酶的浆料孵育(预处理)约5分钟至约8小时(例如,5分钟至6小时、5分钟至4小时、5分钟至2小时以及15分钟至4小时)的时间。在其他实施例中,在约40℃至115℃(例如,45℃至80℃、50℃至70℃、50℃至75℃、60℃至110℃、60℃至95℃、70℃至110℃、70℃至85℃以及77℃至86℃)范围内的温度处孵育浆料。
在其他实施例中,在比含淀粉材料的淀粉糊化温度低约0℃至约30℃(例如,0至25℃、0至20℃、0至15℃、0至10℃以及0至5℃)的温度处孵育浆料。在一些实施例中,温度是低于约68℃、低于约65℃、低于约62℃、低于约60℃以及低于约55℃。在一些实施例中,温度是高于约45℃、高于约50℃、高于约55℃以及高于约60℃。在一些实施例中,在低于淀粉糊化温度的温度处孵育包含植酸酶以及α-淀粉酶的浆料被称为主要(1°)液化。
在一个实施例中,经碾磨的含淀粉材料是玉米或高粱。浆料包含25%至40%DS,pH在4.8至5.2范围内,并且浆料与植酸酶以及任选地α-淀粉酶在60℃至75℃范围内的温度处孵育5分钟至2小时。
在另外的液化步骤中,在约4.0至5.5的pH下,孵育或预处理的含淀粉材料经历比含淀粉材料的淀粉糊化温度(例如,70℃至120℃、70℃至110℃以及70℃至90℃)高的温度增加,如约0℃至约45℃,持续约2分钟至约6小时的时间(例如,2分钟至4小时、90分钟、140分钟以及90至140分钟),更优选地1小时与2小时之间。温度可通过常规高温喷射蒸煮系统来增加一段较短时间,例如,1至15分钟。然后,淀粉可进一步在从约75℃至95℃(例如,80℃至90℃以及80℃至85℃)范围内的温度处水解约15至150分钟(例如,30至120分钟)的时间。在一个优选的实施例中,pH在这些过程步骤期间未调整,并且液化的醪液的pH在约pH 4.0至pH 5.8(例如pH 4.5至5.8、pH 4.8至5.4以及pH 5.0至5.2)范围内。在一些实施例中,将第二剂量的热稳定的α-淀粉酶添加至二次液化步骤,但是在其他实施例中没有额外剂量的α-淀粉酶。
可在孵育以及液化步骤之后进行本领域中熟知的糖化以及发酵步骤。
蒸馏
任选地,在发酵之后,可例如通过蒸馏以及任选地随后进行一个或多个过程步骤来萃取醇(例如,乙醇)。
在一些实施例中,通过在此提供的方法来生产的乙醇的产率是至少8%、至少10%、至少12%、至少14%、至少15%、至少16%、至少17%以及至少18%(v/v)以及至少23%v/v。根据在此提供的方法来获得的乙醇可用作例如燃料乙醇、饮用乙醇,即可饮用的酒精,或工业乙醇。
副产物
来自发酵的剩余物是酒糟,它典型地用于液体或干燥形式的动物饲料。在另外的实施例中,最终产物可包括可用作例如动物饲料的发酵副产物如干酒糟(DDG)以及含可溶物的干酒糟(DDGS)。
关于如何完成液化、糖化、发酵、蒸馏以及回收乙醇的进一步细节是本领域技术人员熟知的。
根据在此提供的方法,糖化以及发酵可同时或单独地执行。
发酵生物体
术语“发酵生物体”是指适于生产所希望的发酵产物的任何生物体,包括细菌和真菌生物体,例如酵母和丝状真菌。适合的发酵生物体能够将可发酵糖(如阿拉伯糖、果糖、葡萄糖、麦芽糖、甘露糖或木糖)直接或间接地发酵(即,转化)为所希望的发酵产物。
发酵生物体的实例包括真菌生物体,例如酵母。优选酵母包括酵母属的菌株,特别是酿酒酵母或葡萄汁酵母;毕赤酵母属的菌株,特别是树干毕赤酵母,例如树干毕赤酵母CBS 5773或巴斯德毕赤酵母;假丝酵母属的菌株,特别是阿拉伯糖发酵假丝酵母(Candidaarabinofermentans)、博伊丁假丝酵母、迪丹斯假丝酵母(Candida diddensii)、休哈塔假丝酵母、萨纳瑞西斯假丝酵母(Candida sonorensis)、假热带假丝酵母(Candidatropicalis)或产朊假丝酵母。其他发酵生物体包括汉逊酵母属的菌株,特别是异常汉森酵母或多形汉逊酵母;克鲁弗酵母属的菌株,特别是脆壁克鲁弗酵母或马克斯克鲁弗酵母(Kluyveromyces marxianus);以及裂殖酵母属的菌株,特别是粟酒裂殖酵母。
优选的细菌发酵生物体包括埃希氏菌属的菌株,特别是大肠杆菌;发酵单胞菌属的菌株,特别是运动发酵单胞菌;发酵杆菌属的菌株,特别是棕榈科发酵杆菌(Zymobactorpalmae);克雷伯菌属的菌株,特别是产酸克雷伯菌;明串珠菌属的菌株,特别是肠膜状明串珠菌;梭菌属的菌株,特别是丁酸梭菌;肠杆菌属的菌株,特别是产气肠杆菌;以及高温厌氧杆菌属的菌株,特别是高温厌氧杆菌BG1L1(应用微生物学与生物技术(Appl.Micro-biol.Biotech.)77:61-86)、产乙醇高温厌氧杆菌(Thermoanarobacter ethano-licus)、产甲烷高温厌氧杆菌(Thermoanaerobacter mathranii)或热解糖高温厌氧杆菌(Thermoanaerobacter thermosaccharolyticum)。乳杆菌属的菌株也被预期,如谷氨酸棒状杆菌R、嗜热葡糖苷酶芽孢杆菌(Bacillus thermoglu-cosidaisus)和嗜热葡糖苷酶土芽孢杆菌(Geobacillus thermoglucosidasius)的菌株。
在一个实施例中,该发酵生物体是C6糖发酵生物体,如例如酿酒酵母的菌株。
在一个实施例中,该发酵生物体是C5糖发酵生物体,如例如酿酒酵母的菌株。
在一个实施例中,将该发酵生物体添加至发酵介质中,这样使得每mL的发酵介质的活发酵生物体(如酵母)计数在从105至1012个的范围内,优选从107至1010个,尤其是约5x107个。
酵母是用于乙醇发酵的优选发酵生物体。优选的是酵母属的菌株,尤其是酿酒酵母种的菌株,优选是对高水平的乙醇(即,直到例如约10、12、15或20vol.%或更多的乙醇)耐受的菌株。
在一个实施例中,利用C5的酵母是披露于WO 2004/085627中的酿酒酵母菌株。
在一个实施例中,发酵生物体是WO 2010/074577(内达尔科(Nedalco))中关注的C5真核微生物细胞。
在一个实施例中,发酵生物体是披露于US 2008/0014620中的能够直接将木糖同分异构化为木酮糖的经转化C5真核细胞。
在一个实施例中,发酵生物体是披露于WO 2009/109633中的C5糖发酵细胞。
可商购的酵母包括LNF SA-1、LNF BG-1、LNF PE-2和LNF CAT-1(可获得自巴西的LNF),RED STARTM和ETHANOL REDTM酵母(可获得自富酶泰斯/乐斯富(Fermentis/Lesaffre),美国),FALI(可获得自弗莱施曼酵母(Fleischmann’s Yeast),美国),SUPERSTART和THERMOSACCTM新鲜酵母(可获得自乙醇技术(Ethanol Technology),威斯康星州,美国),BIOFERM AFT和XR(可获得自NABC-北美生物产品集团(NABC-North AmericanBioproducts Corporation),佐治亚州,美国),GERT STRAND(可获得自格特·斯特兰德AB公司(Gert Strand AB),瑞典)以及FERMIOL(可获得自帝斯曼食品配料部(DSMSpecialties))。
能够从可发酵糖生产所希望的发酵产物的发酵生物体优选在精确条件条件下以具体生长速率生长。当将该发酵生物体引入进/添加至发酵介质中时,接种的发酵生物体经过多个阶段。不出现原始生长。此时期称为“停滞期”并且可以被认为是适应时期。在称为“对数期”的接下来的阶段过程中,生长速率逐渐增加。在最大生长期间后,速率停止并且发酵生物体进入“静止期”。在另外的时间段后,发酵生物体进入“死亡期”,其中活细胞的数目下降。
发酵
基于例如植物材料的种类、可获得的可发酵糖、一种或多种发酵生物体和/或所希望的发酵产物确定发酵条件。本领域的普通技术人员可以容易地确定适合的发酵条件。发酵可以在常规使用的条件下进行。优选的发酵过程是厌氧过程。
例如,发酵可以在高达75℃,例如40℃-70℃之间,如50℃-60℃之间的温度处进行。然而,还已知的是细菌具有低至室温左右(20℃左右)的显著较低的最适温度。适合的发酵生物体的实例可以发现于上面的“发酵生物体”部分中。
对于使用酵母生产乙醇,发酵可以持续24至96小时,特别是持续35至60小时。在一个实施例中,在20℃至40℃,优选26℃至34℃之间,特别是32℃左右的温度处进行发酵。在一个实施例中,pH是从pH 3至6,优选pH 4至5左右。
其他发酵产物可以在本领域的普通技术人员已知的、适于所讨论的发酵微生物的温度处发酵。
典型地在3与7之间的范围内的pH,优选从pH 3.5至6,如pH 5左右下进行发酵。发酵典型地持续6-96小时。
本发明的方法可以作为分批过程或作为连续过程进行。发酵可以在超滤系统中进行,其中将渗余物在固体、水和发酵生物体的存在下保持在再循环之下,并且其中渗透物是含有所希望的发酵产物的液体。同样考虑的是在具有超滤膜的连续膜反应器中执行的方法/工艺,并且其中将渗余物在固体、水和一种或多种发酵生物体的存在下保持在再循环之下,并且其中渗透物是含有发酵产物的液体。
发酵后,可以将发酵生物体与发酵的浆料分开并再循环。
发酵介质
短语“发酵介质(fermentation media)”或“发酵介质(fermentation medium)”是指进行发酵的环境并且包括发酵底物,即被一种或多种发酵生物体代谢的碳水化合物来源。
发酵介质可以包括针对一种或多种发酵生物体的其他营养素和一种或多种生长刺激剂。营养物和生长刺激剂在发酵领域中广泛使用,且包括氮源如氨;维生素和矿物质或其组合。
回收
继发酵之后,可以将发酵产物与发酵介质分开。可以将发酵介质蒸馏以提取所希望的发酵产物或可以通过微滤或膜过滤技术从发酵介质中提取所希望的发酵产物。可替代地,可以通过汽提回收发酵产物。回收方法在本领域中是熟知的。
本发明进一步由下述编号的实施例描述:
实施例1.一种用于从含淀粉材料产生发酵产物的方法,该方法包括使用产碳水化合物源的酶和发酵生物体,在低于所述含淀粉材料的初始糊化温度的温度处,在属于S53家族的丝氨酸蛋白酶的存在下将含淀粉材料同时糖化和发酵。
实施例2.一种用于从含淀粉材料产生发酵产物的方法,该方法包括以下步骤:
(a)在α-淀粉酶存在下使含淀粉材料液化;
(b)使用产碳水化合物源的酶来使步骤(a)中获得的液化材料糖化;
(c)使用发酵生物体体进行发酵;
其中属于家族53的丝氨酸蛋白酶在步骤b)和/或c)期间存在。
实施例3.如实施例1或2所述的方法,其中该S53蛋白酶源自以下属的菌株:亚灰树花菌属、栓菌属、叉丝孔菌属、多孔菌属、革褶菌属、灵芝属、香菇属、蜡蚧菌属、篮状菌属或芽孢杆菌属,更具体是大型亚灰树花菌、变色栓菌、污叉丝孔菌、漏斗多孔菌、桦革褶菌、灵芝、洁丽香菇、蜡蚧菌属物种WMM742、解蛋白篮状菌或芽孢杆菌属物种19138。
实施例4.如实施例1或2所述的方法,其中该S53蛋白酶是具有丝氨酸蛋白酶活性的多肽,该多肽选自下组,该组由以下组成:
(a)多肽,该多肽与SEQ ID NO:3的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;
(b)由多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:1的成熟多肽编码序列具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
实施例5.如实施例1或2所述的方法,其中该S53蛋白酶是具有丝氨酸蛋白酶活性的多肽,该多肽选自下组,该组由以下组成:
(a)多肽,该多肽与SEQ ID NO:6的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;
(b)由多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:4的成熟多肽编码序列具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
实施例6.如实施例1或2所述的方法,其中该S53蛋白酶是具有丝氨酸蛋白酶活性的多肽,该多肽选自下组,该组由以下组成:
(a)多肽,该多肽与SEQ ID NO:9的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;
(b)由多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:7的成熟多肽编码序列具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
实施例7.如实施例1或2所述的方法,其中该S53蛋白酶是具有丝氨酸蛋白酶活性的多肽,该多肽选自下组,该组由以下组成:
(a)多肽,该多肽与SEQ ID NO:12的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;
(b)由多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:10的成熟多肽编码序列具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
实施例8.如实施例1或2所述的方法,其中该S53蛋白酶是具有丝氨酸蛋白酶活性的多肽,该多肽选自下组,该组由以下组成:
(a)多肽,该多肽与SEQ ID NO:15的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;
(b)由多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:13的成熟多肽编码序列具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
实施例9.如实施例1或2所述的方法,其中该S53蛋白酶是具有丝氨酸蛋白酶活性的多肽,该多肽选自下组,该组由以下组成:
(a)多肽,该多肽与SEQ ID NO:26的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;
(b)多肽,该多肽由多核苷酸编码,该多核苷酸与SEQ ID NO:25的成熟多肽编码序列具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
实施例10.如实施例1或2所述的方法,其中该S53蛋白酶是具有丝氨酸蛋白酶活性的多肽,该多肽选自下组,该组由以下组成:
(a)多肽,该多肽与SEQ ID NO:30的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;
(b)由多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:29的成熟多肽编码序列具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
实施例11.如实施例1或2所述的方法,其中该S53蛋白酶是具有丝氨酸蛋白酶活性的多肽,该多肽选自下组,该组由以下组成:
(a)多肽,该多肽与SEQ ID NO:34的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;
(b)由多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:33的成熟多肽编码序列具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
实施例12.如实施例1或2所述的方法,其中该S53蛋白酶是具有丝氨酸蛋白酶活性的多肽,该多肽选自下组,该组由以下组成:
(a)多肽,该多肽与SEQ ID NO:38的成熟多肽,如SEQ ID NO:38的氨基酸195至560具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
实施例13.如实施例1或2所述的方法,其中该S53蛋白酶是具有丝氨酸蛋白酶活性的多肽,该多肽选自下组,该组由以下组成:
(a)多肽,该多肽与SEQ ID NO:39的成熟多肽,如SEQ ID NO:39的氨基酸226至649具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
实施例14.如实施例1-13中任一项所述的方法,其中在糖化和/或发酵期间存在或添加α-淀粉酶。
实施例15.如实施例14所述的方法,其中该α-淀粉酶是酸性α-淀粉酶,优选是酸性真菌α-淀粉酶。
实施例16.如实施例15所述的方法,其中该α-淀粉酶是源自曲霉属,具体是土曲霉、黑曲霉、米曲霉、泡盛曲霉、或白曲霉的菌株;或者毛霉属的菌株,优选是微小根毛霉的菌株;或者亚灰树花菌属,优选是大型亚灰树花菌的菌株。
实施例17.根据实施例16所述的方法,其中在糖化和/或发酵中存在的该α-淀粉酶是源自根毛霉属的菌株,优选微小根毛霉的菌株,如具有黑曲霉连接子和淀粉结合结构域的微小根毛霉α-淀粉酶杂合体,如示于SEQ ID NO:16中的杂合体。
实施例18.如实施例17所述的方法,其中在糖化和/或发酵中存在的该α-淀粉酶选自下组,该组由以下组成:
(i)包含SEQ ID NO:16的多肽的α-淀粉酶;
(ii)包含以下氨基酸序列的α-淀粉酶,该氨基酸序列与SEQ ID NO:16的多肽具有至少60%、至少70%,例如至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的一致性。
实施例19.如实施例18所述的方法,其中该α-淀粉酶是源自具有黑曲霉葡糖淀粉酶连接子和淀粉结合域(SBD)的微小根毛霉,优选披露为SEQ ID NO:16,优选具有以下取代中的一个或多个:G128D、D143N,优选G128D+D143N。
实施例20.如实施例14-19中任一项所述的方法,其中该α-淀粉酶以0.001至10AFAU/g DS,优选地0.01至5AFAU/g DS,特别地0.3至2AFAU/g DS或0.001至1FAU-F/g DS,优选地0.01至1FAU-F/g DS的量存在。
实施例21.如实施例1-20中任一项所述的方法,其中该产碳水化合物源的酶选自下组,该组由以下组成:葡糖淀粉酶、α-葡糖苷酶、麦芽糖淀粉酶、和β-淀粉酶。
实施例22.如实施例1-21中任一项所述的方法,其中产碳水化合物源的酶是葡糖淀粉酶,并且以0.001至10AGU/g DS的量存在,优选地从0.01至5AGU/g DS、特别地0.1中0.5AGU/g DS。
实施例23.如实施例14-22中任一项所述的方法,其中当步骤(a)和(b)同时进行时,α-淀粉酶和葡糖淀粉酶以在0.1和100AGU/FAU-F之间,优选地在2和50AGU/FAU-F之间,特别地在10和40AGU/FAU-F之间的比率添加。
实施例24.如实施例21-23所述的方法,其中该葡糖淀粉酶是源自曲霉属(优选地黑曲霉或泡盛曲霉)的菌株、篮状菌属(特别地埃默森篮状菌)的菌株、阿太菌属(Athelia)(特别地白绢病(Athelia rolfsii))的菌株、栓菌属(优选地瓣环栓菌)的菌株;粘褶菌属的菌株(例如篱边粘褶菌或密粘褶菌的菌株);密孔菌属的菌株(例如血红密孔菌的菌株);或其混合物。
实施例25.如实施例24所述的方法,其中该葡糖淀粉酶是源自栓菌属,如瓣环栓菌的菌株,如示于SEQ ID NO:17中的菌株。
实施例26.如实施例25所述的方法,其中该葡糖淀粉酶选自下组,该组由以下组成:
(i)包含SEQ ID NO:17的多肽的葡糖淀粉酶;
(ii)包含以下氨基酸序列的葡糖淀粉酶,该氨基酸序列与SEQ ID NO:17的多肽具有至少60%、至少70%,例如至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的一致性。
实施例27.如实施例24所述的方法,其中该葡糖淀粉酶源自篮状菌属,如埃默森篮状菌的菌株,如示于SEQ ID NO:18的菌株。
实施例28.如实施例27所述的方法,其中该葡糖淀粉酶选自下组,该组由以下组成:
(i)包含SEQ ID NO:18的多肽的葡糖淀粉酶;
(ii)包含以下氨基酸序列的葡糖淀粉酶,该氨基酸序列与SEQ ID NO:18的多肽具有至少60%、至少70%,例如至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的一致性。
实施例29.如实施例24所述的方法,其中该葡糖淀粉酶源自密孔菌属的菌株,如血红密孔菌的菌株,如示于SEQ ID NO:19中的菌株。
实施例30.如实施例29所述的方法,其中该葡糖淀粉酶选自下组,该组由以下组成:
(i)包含SEQ ID NO:19的多肽的葡糖淀粉酶;
(ii)包含以下氨基酸序列的葡糖淀粉酶,该氨基酸序列与SEQ ID NO:19的多肽具有至少60%、至少70%,例如至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的一致性。
实施例31.如实施例24所述的方法,其中该葡糖淀粉酶源自粘褶菌属的菌株,如示于SEQ ID NO:20中的篱边粘褶菌的菌株。
实施例32.如实施例3所述的方法,其中该葡糖淀粉酶选自下组,该组由以下组成:
(i)包含在此的SEQ ID NO:20的多肽的葡糖淀粉酶;
(ii)包含以下氨基酸序列的葡糖淀粉酶,该氨基酸序列与在此的SEQ ID NO:20的多肽具有至少60%、至少70%,例如至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的一致性。
实施例33.如实施例24所述的方法,其中该葡糖淀粉酶源自粘褶菌属的菌株,如密粘褶菌的菌株,如示于SEQ ID NO:21中的菌株。
实施例34.如实施例33所述的方法,其中该葡糖淀粉酶选自下组,该组由以下组成:
(i)包含SEQ ID NO:21的多肽的葡糖淀粉酶;
(ii)包含以下氨基酸序列的葡糖淀粉酶,该氨基酸序列与SEQ ID NO:21的多肽具有至少60%、至少70%,例如至少75%、至少80%、至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、至少95%、至少96%、至少97%、至少98%或至少99%的一致性。
实施例35.如实施例1-34中任一项所述的方法,其中在发酵之后回收该发酵产物。
实施例36.如实施例1-35中任一项所述的方法,其中该发酵产物是醇,优选乙醇,尤其是燃料乙醇、饮用乙醇和/或工业乙醇。
实施例37.如实施例1-36中任一项所述的方法,其中该发酵生物体体是酵母,优选酵母属的菌株,尤其是酿酒酵母的菌株。
实施例38.如实施例1中任一项所述的方法,其中该含淀粉材料是颗粒状淀粉。
实施例39.如实施例1-35中任一项所述的方法,其中该含淀粉材料源自全谷物。
实施例40.如实施例1-37中任一项所述的方法,其中该含淀粉材料源自玉米、小麦、大麦、黑麦、蜀黍、西米、木薯、木薯淀粉、高粱、稻或马铃薯。
实施例41.如实施例1-40中任一项所述的方法,其中发酵是在3和7之间、优选从3.5至6、或更优选从4至5的范围内的pH下进行的。
实施例42.如实施例1-41中任一项所述的方法,其中该方法进行1至96小时,优选地从6至72小时。
实施例43.如实施例1-42中任一项所述的方法,其中含淀粉材料的干固体含量是在从20-55w/w-%,优选地25-40w/w-%,更优选地30-35w/w-%的范围。
实施例44.如实施例1-43中任一项所述的方法,其中该含淀粉材料通过将含淀粉材料的颗粒尺寸减小至0.1-0.5mm的颗粒尺寸来制备。
实施例45.如实施例1-44中任一项所述的方法,其中在同时糖化和发酵期间的温度是在25℃和40℃之间,如在28℃和35℃之间,如在30℃和34℃之间,如约32℃。
实施例46.如实施例2-45中任一项所述的方法,其中步骤(a)在pH 4.0-6.5,优选地下从4.5至5.5的pH下进行。
实施例47.如实施例2所述的方法,其中连续或同时进行步骤(b)和(c)(即,SSF方法)。
实施例48.如实施例2所述的方法,该方法在步骤(a)之前进一步包括以下步骤:
x)减少含淀粉材料的粒度;
y)形成一种包含该含淀粉材料和水的浆料。
实施例49.如实施例2-48中任一项所述的方法,其中i)在发酵期间,和/或ii)在液化之前、期间、和/或之后存在支链淀粉酶。
实施例50.一种组合物,该组合物包含S53蛋白酶和产碳水化合物源的酶、以及任选地α-淀粉酶。
实施例51.如实施例50所述的组合物,其中该S53蛋白酶源自以下属的菌株:亚灰树花菌属、栓菌属、叉丝孔菌属、多孔菌属、革褶菌属、灵芝属、香菇属、蜡蚧菌属、篮状菌属或芽孢杆菌属,更具体是大型亚灰树花菌、变色栓菌、污叉丝孔菌、漏斗多孔菌、桦革褶菌、灵芝、洁丽香菇、蜡蚧菌属物种WMM742、解蛋白篮状菌或芽孢杆菌属物种19138。
实施例52.如实施例50-51中任一项所述的组合物,其中该S53蛋白酶是具有丝氨酸蛋白酶活性的多肽,该多肽选自下组,该组由以下组成:
(a)多肽,该多肽与SEQ ID NO:3的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;
(b)由多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:1的成熟多肽编码序列具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
实施例53.如实施例50-51中任一项所述的组合物,其中该S53蛋白酶是具有丝氨酸蛋白酶活性的多肽,该多肽选自下组,该组由以下组成:
(a)多肽,该多肽与SEQ ID NO:6的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;
(b)由多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:4的成熟多肽编码序列具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
实施例54.如实施例50-51中任一项所述的组合物,其中该S53蛋白酶是具有丝氨酸蛋白酶活性的多肽,该多肽选自下组,该组由以下组成:
(a)多肽,该多肽与SEQ ID NO:9的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;
(b)由多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:7的成熟多肽编码序列具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
实施例55.如实施例50-51中任一项所述的组合物,其中该S53蛋白酶是具有丝氨酸蛋白酶活性的多肽,该多肽选自下组,该组由以下组成:
(a)多肽,该多肽与SEQ ID NO:12的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;
(b)由多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:10的成熟多肽编码序列具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
实施例56.如实施例50-51中任一项所述的组合物,其中该S53蛋白酶是具有丝氨酸蛋白酶活性的多肽,该多肽选自下组,该组由以下组成:
(a)多肽,该多肽与SEQ ID NO:15的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;
(b)由多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:13的成熟多肽编码序列具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
实施例57.如实施例50-51中任一项所述的组合物,其中该S53蛋白酶是具有丝氨酸蛋白酶活性的多肽,该多肽选自下组,该组由以下组成:
(a)多肽,该多肽与SEQ ID NO:26的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;
(b)由多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:25的成熟多肽编码序列具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
实施例58.如实施例50-51中任一项所述的组合物,其中该S53蛋白酶是具有丝氨酸蛋白酶活性的多肽,该多肽选自下组,该组由以下组成:
(a)多肽,该多肽与SEQ ID NO:30的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;
(b)由多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:29的成熟多肽编码序列具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
实施例59.如实施例50-51中任一项所述的组合物,其中该S53蛋白酶是具有丝氨酸蛋白酶活性的多肽,该多肽选自下组,该组由以下组成:
(a)多肽,该多肽与SEQ ID NO:34的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;
(b)由多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:33的成熟多肽编码序列具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
实施例60.如实施例50-51中任一项所述的组合物,其中该S53蛋白酶是具有丝氨酸蛋白酶活性的多肽,该多肽选自下组,该组由以下组成:
(a)多肽,该多肽与SEQ ID NO:38的成熟多肽,如SEQ ID NO:38的氨基酸195至560或190至560具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
实施例61.如实施例50-51中任一项所述的组合物,其中该S53蛋白酶是具有丝氨酸蛋白酶活性的多肽,该多肽选自下组,该组由以下组成:
(a)多肽,该多肽与SEQ ID NO:39的成熟多肽,如SEQ ID NO:39的氨基酸226至647或221至647具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
实施例62.如实施例50-61中任一项所述的组合物,其中该产碳水化合物源的酶选自下组,该组由以下组成:葡糖淀粉酶、α-葡糖苷酶、麦芽糖淀粉酶、和β-淀粉酶。
实施例63.如实施例62所述的组合物,其中该产碳水化合物源的酶选自下组,该组由源自以下的葡糖淀粉酶组成:曲霉属(优选是黑曲霉或泡盛曲霉)的菌株、木霉属(特别是里氏木霉)的菌株、篮状菌属(特别地埃默森篮状菌)的菌株、或阿太菌属(Athelia)(特别是白绢病(Athelia rolfsii))的菌株、栓菌属(优选是瓣环栓菌)的菌株、粘褶菌属的菌株(例如,篱边黏褶菌或密粘褶菌的菌株)、密孔菌属的菌株(例如血红密孔菌属的菌株)、或其混合物。
实施例64.如实施例50-63中任一项所述的组合物,其中该α-淀粉酶选自下组,该组由源自以下的真菌α-淀粉酶组成:曲霉属,具体是土曲霉、黑曲霉、米曲霉、泡盛曲霉、或白曲霉的菌株;或者毛霉属的菌株,优选是微小根毛霉的菌株;或者亚灰树花菌属,优选是大型亚灰树花菌的菌株。
实施例65.丝氨酸蛋白酶,具体是S53蛋白酶,在将经糊化的和/或未经糊化的含淀粉材料发酵为发酵产物中的用途。
实施例66.一种具有丝氨酸蛋白酶活性多肽,该多肽选自下组,该组由以下组成:
(a)多肽,该多肽与SEQ ID NO:12的多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;
(b)由多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:10的成熟多肽编码序列具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
实施例67.一种具有丝氨酸蛋白酶活性多肽,该多肽选自下组,该组由以下组成:
(a)多肽,该多肽与SEQ ID NO:15的多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;
(b)由多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:13的成熟多肽编码序列具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
实施例68.一种具有丝氨酸蛋白酶活性多肽,该多肽选自下组,该组由以下组成:
(a)多肽,该多肽与SEQ ID NO:27的多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;
(b)由多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:25的成熟多肽编码序列具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
实施例69.一种具有丝氨酸蛋白酶活性多肽,该多肽选自下组,该组由以下组成:
(a)多肽,该多肽与SEQ ID NO:31的多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;
(b)由多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:29的成熟多肽编码序列具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
实施例70.一种具有丝氨酸蛋白酶活性多肽,该多肽选自下组,该组由以下组成:
(a)多肽,该多肽与SEQ ID NO:38的成熟多肽,如SEQ ID NO:38的氨基酸195至560或190至560具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
实施例71.一种具有丝氨酸蛋白酶活性多肽,该多肽选自下组,该组由以下组成:
(a)多肽,该多肽与SEQ ID NO:39的成熟多肽,如SEQ ID NO:39的氨基酸226至647或221至647具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
实施例72.如实施例66-71中任一项所述的多肽,该多肽包含SEQ ID NO:12、SEQID NO:15、SEQ ID NO:27、或SEQ ID NO:31、SEQ ID NO:38的氨基酸195至560或190至560、SEQ ID NO:39的氨基酸226至647或221至647,或由其组成。
实施例73.如实施例66-72中任一项所述的多肽,该多肽是SEQ ID NO:12、SEQ IDNO:15、SEQ ID NO:27、或SEQ ID NO:31的片段,其中该片段具有蛋白酶活性。
实施例74.一种编码实施例66-73中任一项所述的多肽的多核苷酸。
实施例75.一种核酸构建体或表达载体,该核酸构建体或表达载体包含如实施例74所述的多核苷酸,该多核苷酸有效地连接至指导该多肽在表达宿主中的产生的一个或多个控制序列。
实施例76.一种重组宿主细胞,该重组宿主细胞包含如实施例74所述的多核苷酸,该多核苷酸有效地连接至指导该多肽的产生的一个或多个控制序列。
实施例77.根据实施例1-2中任一项所述的方法、或根据实施例50所述的组合物、或根据实施例65所述的用途,其中该S53蛋白酶是内切蛋白酶。
实例
酶测定
对于葡糖淀粉酶活性的测定
葡糖淀粉酶单位,AGU
葡糖淀粉酶单位(AGU)被定义为在标准条件下(37℃,pH 4.3,底物:100mM麦芽糖,缓冲液:乙酸盐0.1M,反应时间:6分钟,如以下葡糖淀粉酶孵育中所说明的)每分钟水解1微摩尔麦芽糖由此产生葡萄糖的酶的量。
葡糖淀粉酶孵育:
底物: 麦芽糖100mM
缓冲液: 乙酸盐0.1M
pH: 4.30±0.05
孵育温度: 37℃±1
反应时间: 6分钟
酶工作范围: 0.5-4.0AGU/mL
通过3个反应步骤描述分析原理:
步骤1是一个酶反应:
葡糖淀粉酶(AMG)EC 3.2.1.3(外-α-1,4-葡聚糖-葡糖淀粉酶)水解麦芽糖以形成α-D-葡萄糖。孵育之后,用NaOH来停止该反应。
步骤2和步骤3引起一个终点反应。
在由己糖激酶催化的一个反应中,葡萄糖被ATP磷酸化。形成的葡萄糖-6-磷酸被葡萄糖-6-磷酸脱氢酶氧化成6-磷酸葡萄糖酸。在这个相同的反应中,等摩尔量的NAD+被还原成NADH,导致在340nm处的吸光度增加。可以使用自动分析仪系统例如Konelab 30分析仪(赛默飞世尔科技公司(Thermo Fisher Scientific))。
酸性α-淀粉酶活性
当根据本发明使用时,可以AFAU(酸性真菌α-淀粉酶单位)或FAU-F来测量酸性α-淀粉酶的活性。
酸性α-淀粉酶活性(AFAU)
能以AFAU(酸性真菌α-淀粉酶单位)测量酸性α-淀粉酶活性,其相对于酶标准品确定。1AFAU定义为在下述标准条件下每小时降解5.260mg淀粉干物质的酶量。
酸性α-淀粉酶,其为内切α-淀粉酶(1,4-α-D-葡聚糖-葡聚糖水解酶,E.C.3.2.1.1),水解淀粉分子内部区域中的α-1,4-葡糖苷键以形成具有不同链长的寡糖和糊精。与碘形成的颜色的强度和淀粉浓度成正比。使用反向比色法在指定的分析条件下确定淀粉浓度的降低作为酶活性。
λ=590nm
蓝色/紫色 t=23sec 脱色
标准条件/反应条件:
更详细地描述这种分析方法的文件夹EB-SM-0259.02/01可从丹麦的诺维信公司索取得到,在此将该文件夹通过引用特此结合。
FAU-F的确定
相对于具有声明强度的酶标准品测量FAU-F真菌α-淀粉酶单位(真菌淀粉(Fungamyl))。
更详细描述这种分析方法的文件夹(EB-SM-0216.02)可以从丹麦的诺维信公司索取得到,通过引用将该文件夹特此包括。
葡糖淀粉酶共混物A:包含以下的共混物:WO 99/28448中披露为SEQ ID NO:34以及在此披露为SEQ ID NO:18的埃默森篮状菌葡糖淀粉酶、WO 06/69289中披露为SEQ IDNO:2以及披露为SEQ ID NO:17的瓣环栓菌葡糖淀粉酶、以及在此的SEQ ID NO:16中披露的具有黑曲霉葡糖淀粉酶接头和淀粉结合结构域(SBD)的微小根毛霉α-淀粉酶,其具有以下取代:G128D+D143N(使用SEQ ID NO:16进行编号)(以AGU:AGU:FAU-F表示的活性比为约29:8:1)。
实例1S53蛋白酶在常规EtOH产生中的用途
用从1g/L储液添加的3ppm青霉素制备工业液化醪液,使用40%v/v H2SO4将pH调节至5.0。没有额外的尿素被添加到醪液中。两种醪液制品的干固体含量均在Mettler-ToledoHB43-S水分天平上测量。将约5g的每种制备的醪液等分入预先称重的15mL掀盖式管(飞世尔公司)中,其中在盖上钻出1/64”孔用于排气。将醪样品与稀释的葡糖淀粉酶公共混物A(0.019AGU/μL)一起加入至0.6AGU/g DS的酶浓度,如以下等式计算。
从1至15的每个处理(表1)以3次重复进行。
表1.对于0和200ppm尿素液化醪液的每种处理的酶和剂量。
蛋白酶 剂量 单位 酶家族
1 对照 0 μg/gDS
2 AP025 2 μg/gDS M35
3 AP025 5 μg/gDS M35
4 PfuS 2 μg/gDS S8
5 PfuS 5 μg/gDS S8
6 SEQ ID NO:3 2 μg/gDS S53
7 SEQ ID NO:3 5 μg/gDS S53
8 SEQ ID NO:9 2 μg/gDS S53
9 SEQ ID NO:9 5 μg/gDS S53
10 SEQ ID NO:6 2 μg/gDS S53
11 SEQ ID NO:6 5 μg/gDS S53
12 SEQ ID NO:15 2 μg/gDS S53
13 SEQ ID NO:15 5 μg/gDS S53
14 SEQ ID NO:12 2 μg/gDS S53
15 SEQ ID NO:12 5 μg/gDS S53
包括两种现有技术的蛋白酶用于比较。AP025是来自嗜热子囊菌的金属蛋白酶,披露为SEQ ID NO:36,并且PfuS是来自强烈火球菌的丝氨酸蛋白酶,披露为SEQ ID NO:37。
将水加入每个样品中,使得每个样品的酶和水的总添加体积相等。通过称量放置在50mL 32℃自来水中持续30分钟的2.75g酵母使乙醇红星酵母(Ethanol Red Staryeast)再水化。所有样品均加入100μL酵母溶液,涡旋,并置于32℃的水浴中。在发酵54小时后,向每个样品加入50μL的40%硫酸,涡旋,并以3000x g离心10分钟,然后通过0.45μm过滤器(沃特曼公司(Whatman))过滤到HPLC小瓶中。在具有化学工作站(Chemstation)软件的安捷伦(Agilent)1100/1200系列上分析样品。具有阳离子H保护柱的Bio-Rad HPX-87H离子排阻柱300mm x 7.8mm。将样品在5mM H2SO4流动相的存在下在65℃处以0.6ml/min的流速运行。RI检测器温度设定在55℃处。该方法使用针对糊精(DP4+)、麦芽三糖、麦芽糖、葡萄糖、果糖、乙酸、乳酸、甘油以及乙醇的校准标准品对若干种分析物进行定量。使用4点校准(包括来源)。结果显示于表2中(对照=无酶)。
表2.与对照样品相比,在用不含尿素并且添加2.0或5.0μg ep/g DS剂量的蛋白酶发酵54小时后乙醇效价和百分比变化,对照=不添加蛋白酶。
结论
发现添加S53蛋白酶SEQ ID NO:3、SEQ ID NO:6、SEQ ID NO:9、SEQ ID NO:12、SEQID NO:15在将玉米发酵成乙醇时(在2或5μg ep/g DS的一致的剂量下)增加乙醇产量超过其他蛋白酶家族。
实例2:S53蛋白酶在常规EtOH产生中的用途
用来自200g/L储液中添加的200ppm尿素,来自1g/L储液中添加的3ppm青霉素制备工业液化醪液,并使用40%v/v H2SO4调节至pH 5.0。两种醪液制品的干固体含量均在Mettler-Toledo HB43-S水分天平上测量。将约5g的每种制备的醪液等分入预先称重的15mL掀盖式管(飞世尔公司)中,其中在盖上钻出1/64”孔用于排气。将醪样品与稀释的葡糖淀粉酶公共混物A(0.019AGU/μL)一起加入至0.6AGU/g DS的酶浓度,如以下等式计算。
从1至15的每个处理(表3)以3次重复进行。
表3.对于200ppm尿素液化的醪液的每种处理的酶和剂量。
包括两种现有技术的蛋白酶用于比较。AP025是来自嗜热子囊菌的金属蛋白酶,在此披露为SEQ ID NO:36,并且PfuS是来自强烈火球菌的丝氨酸蛋白酶,在此披露为SEQ IDNO:37。
将水加入每个样品中,使得每个样品的酶和水的总添加体积相等。通过称量放置在50mL 32℃自来水中持续30分钟的2.75g酵母使乙醇红星酵母(Ethanol Red Staryeast)再水化。所有样品均加入100μL酵母溶液,涡旋,并置于32℃的水浴中。在发酵54小时后,向每个样品加入50μL的40%硫酸,涡旋,并以3000x g离心10分钟,然后通过0.45μm过滤器(沃特曼公司(Whatman))过滤到HPLC小瓶中。在具有化学工作站(Chemstation)软件的安捷伦(Agilent)1100/1200系列上分析样品。具有阳离子H保护柱的Bio-Rad HPX-87H离子排阻柱300mm x 7.8mm。将样品在5mM H2SO4流动相的存在下在65℃处以0.6ml/min的流速运行。RI检测器温度设定在55℃处。该方法使用针对糊精(DP4+)、麦芽三糖、麦芽糖、葡萄糖、果糖、乙酸、乳酸、甘油以及乙醇的校准标准品对若干种分析物进行定量。使用4点校准(包括来源)。结果显示于表4中(对照=无酶)。
表4.与对照样品相比,在添加200ppm尿素并添加2.0或5.0μg ep/g DS剂量的蛋白酶发酵54小时后乙醇效价和百分比变化,对照=不添加蛋白酶。
结论
添加S53蛋白酶SEQ ID NO:3、SEQ ID NO:6、SEQ ID NO:9、SEQ ID NO:12、SEQ IDNO:15在将玉米发酵成乙醇时显示增加乙醇产量超过其他蛋白酶家族。
实例3:S53蛋白酶在生淀粉水解和发酵中的用途
将干固体水平为34.51%的研磨玉米补充3ppm的lactrol和200ppm的尿素。用40%H2SO4将浆料调节至pH 4.5。将约70g的该浆料添加到125mL管Wheaton烧瓶中,该管Wheaton烧瓶具有在盖上钻出的1/16”孔用于排气。根据表5,用酶加入每个烧瓶,随后浆料的每个罐子加入450μL的再水化酵母(100mL H2O中5.5g富酶泰斯(Fermentis)乙醇红酵母,在32℃处孵育30min)。所用的葡糖淀粉酶是源自血红密孔菌的野生型葡糖淀粉酶,并且示于SEQ IDNO:19表示为PsAMG,并且所使用的α-淀粉酶是具有黑曲霉葡糖淀粉酶连接体和淀粉结合域(SBD)的变体微小根毛霉α-淀粉酶,在此披露于SEQ ID NO:16,具有以下取代G128D+D143N,使用SEQ ID NO:16进行编号,并表示为PE096。包括现有技术的蛋白酶(AP025)用于比较。AP025是来自嗜热子囊菌的金属蛋白酶,并在此披露在WO 2003/048353和在SEQ ID NO:36中。
将水加入每个样品中,使得每个样品的酶和水的总添加体积相等。根据以下公式,实际酶剂量是基于每个管中玉米浆料的准确重量:
表5显示了7种不同的酶处理,酶处理具有两个重复/处理。
将烧瓶在早上和晚上漩涡。为了收集样品,在24、48和72小时时间点除去约4克醪液。HPLC制备由以下组成:通过添加10μL的40%H2SO4/克醪液(总共40μL)停止反应,在1462xg下离心10min,并通过0.45μm过滤器(沃特曼公司(Whatman))过滤。在具有化学工作站(Chemstation)软件的安捷伦(Agilent)1100/1200系列上分析样品。具有阳离子H保护柱的Bio-Rad HPX-87H离子排阻柱300mm x 7.8mm。在5mM H2SO4流动相的存在下在0.6ml/min的流速在65℃处运行样品。RI检测器温度设定在55℃处。该方法使用针对糊精(DP4+)、麦芽三糖、麦芽糖、葡萄糖、果糖、乙酸、乳酸、甘油以及乙醇的校准标准品对若干种分析物进行定量。使用4点校准(包括来源)。结果显示在以下表6中。
表6.针对每个样品显示了表明乙醇(g/L)产量和百分比变化的条形图。
24&48小时
数据表明,使用蛋白酶有利于早期发酵,通过改进酵母代谢来增加动力学。
S53蛋白酶SEQ ID NO:3、SEQ ID NO:6、SEQ ID NO:9、SEQ ID NO:12、SEQ ID NO:15超过AP025。
72小时
与对照(0.5PsAMG-没有蛋白酶)和AP025相比,蛋白酶SEQ ID NO:3、SEQ ID NO:6、SEQ ID NO:9、SEQ ID NO:12、SEQ ID NO:15产生更多乙醇。
实例4:S53蛋白酶在常规EtOH产生中的用途
用来自200g/L储液中添加的200ppm尿素,来自1g/L储液中添加的3ppm青霉素制备工业液化醪液,并使用40%v/v H2SO4调节至pH 5.0。两种醪液制品的干固体含量均在Mettler-Toledo HB43-S水分天平上测量。将约5g的每种制备的醪液等分入预先称重的15mL掀盖式管(飞世尔公司)中,其中在盖上钻出1/64”孔用于排气。将醪样品与稀释的葡糖淀粉酶公共混物A(0.019AGU/μL)一起加入至0.6AGU/g DS的酶浓度,如以下等式计算。
从1至6的每个处理(表1)以3次重复进行。
表1.对于200ppm尿素液化的醪液的每种处理的酶和剂量。
蛋白酶 剂量 单位 酶家族
1 对照 0 μg/gDS
2 Mg proIII 2.5 μg/gDS S53
3 Mg proIII 5 μg/gDS S53
4 SEQ ID NO:35 5 μg/gDS S53
5 SEQ ID NO:27 5 μg/gDS S53
6 SEQ ID NO:31 5 μg/gDS S53
包括一种现有技术的蛋白酶用于比较。Mg ProIII是来自大型亚灰树花菌的S53蛋白酶,在此披露为SEQ ID NO:3。
将水加入每个样品中,使得每个样品的酶和水的总添加体积相等。通过称量放置在50mL 32℃自来水中持续30分钟的2.75g酵母使乙醇红星酵母(Ethanol Red Staryeast)再水化。所有样品均加入100μL酵母溶液,涡旋,并置于32℃的水浴中。在发酵54小时后,向每个样品加入50μL的40%硫酸,涡旋,并以3000x g离心10分钟,然后通过0.45μm过滤器(沃特曼公司(Whatman))过滤到HPLC小瓶中。在具有化学工作站(Chemstation)软件的安捷伦(Agilent)1100/1200系列上分析样品。具有阳离子H保护柱的Bio-Rad HPX-87H离子排阻柱300mm x 7.8mm。将样品在5mM H2SO4流动相的存在下在65℃处以0.6ml/min的流速运行。RI检测器温度设定在55℃处。该方法使用针对糊精(DP4+)、麦芽三糖、麦芽糖、葡萄糖、果糖、乙酸、乳酸、甘油以及乙醇的校准标准品对若干种分析物进行定量。使用4点校准(包括来源)。结果显示于表2中(对照=无酶)。
表2.与对照样品相比,在添加200ppm尿素并添加2.5或5.0μg ep/g DS剂量的蛋白酶发酵54小时后乙醇效价和百分比变化,对照=不添加蛋白酶。
结论
添加来自芽孢杆菌属物种19138(SEQ ID NO:35)、灵芝(SEQ ID NO:27)、和洁丽香菇(SEQ ID NO:31)的S53蛋白酶在将玉米发酵成乙醇时显示增加乙醇产量超过其他蛋白酶家族。
在类似的设置中,如上所述测试两个另外的S53蛋白酶,一个来自蜡蚧菌属物种(Lecanicillium sp.)WMM742(SEQ ID NO:38)并且另一个来自解蛋白篮状菌(Talaromycesproteolyticus)(SEQ ID NO:39)。结果和剂量显示在以下表3中。
表3.与对照样品相比,在添加200ppm尿素并添加2.5或5.0μg ep/g DS剂量的蛋白酶发酵54小时后乙醇效价和百分比变化,对照=不添加蛋白酶。
结论
与MgProIII蛋白酶对照相比,添加来自蜡蚧菌属物种(Lecanicillium sp)WMM742(SEQ ID NO:38)和来自解蛋白篮状菌(Talaromyces proteolyticus)(SEQ ID NO:39)的S53蛋白酶显示出在将玉米发酵成乙醇时增加乙醇产量。
实例5:在实例中使用的S53蛋白酶的克隆和表达。
WO 2014/037438披露了源自大型亚灰树花菌、变色栓菌、和污叉丝孔菌的丝氨酸蛋白酶(S53)的克隆和表达。
来自漏斗多孔菌的S53蛋白酶的克隆和表达:
基因
S53蛋白酶多肽的基因组DNA序列在漏斗多孔菌的完整基因组中鉴定,其最近在JGI Genome Portal上公开可得(能源部联合基因组研究所的基因组门户(The GenomePortal of the Department of Energy Joint Genome Institute),Grigoriev IV、Nordberg H、Shabalov I、Aerts A、Cantor M、Goodstein D、Kuo A、Minovitsky S、NikitinR、Ohm RA、Otillar R、Poliakov A、Ratnere I、Riley R、Smirnova T、Rokhsar D、DubchakI,Nucleic Acids Res.[核酸研究]2012年1月;40(数据库问题):D26-32)。1943个核苷酸的基因组DNA序列含有68bp的(核苷酸262至329)、61bp(核苷酸933至993)、55bp(核苷酸1194至1248)、和55bp(核苷酸1387至1441)的4个内含子。该基因组DNA片段编码具有567个氨基酸的多肽。没有设计用于编码漏斗多孔菌S53蛋白酶的内含子以及优化用于在米曲霉中表达的密码子的合成基因购自GeneArt(英杰公司(Invitrogen))并显示为SEQ ID NO:23。
表达载体
曲霉属表达载体pDau109(WO 2005/042735)由以下组成:基于与构巢曲霉磷酸甘油醛异构酶非翻译前导序列(Pna2/tpl)融合的部分重复的黑曲霉中性淀粉酶II(NA2)启动子和黑曲霉淀粉转葡糖苷酶终止子(Tamg)。载体上还存在来自构巢曲霉的曲霉选择标记amdS和氨苄青霉素抗性基因(β内酰胺酶),该曲霉选择标记amdS能够在作为唯一氮源的乙酰胺上生长,并且该氨苄青霉素抗性基因(β内酰胺酶)允许使用商业上可获得的和高度感受态的菌株在通常使用的LB氨苄西林板上容易地选择阳性重组大肠杆菌克隆。pDau109含有位于启动子区域和终止子之间的多克隆位点,允许在启动子区域前插入感兴趣的基因。
表达克隆
使用独特的限制性位点BamHI和HindIII将编码漏斗多孔菌S53蛋白酶的合成基因克隆至pDau109曲霉属表达载体,并转化到大肠杆菌(Top10,英杰公司(Invitrogen))中。将含有插入的表达质粒从大肠杆菌转化体中纯化出来,并用载体引物和基因特异性引物进行测序以便确定没有PCR错误的代表性质粒表达克隆。将质粒表达克隆转化到米曲霉中,并使含有整合表达构建体的重组米曲霉克隆在液体培养基中生长。将含有酶的上清液无菌过滤并用于进一步表征。
来自桦革褶菌的S53蛋白酶的克隆和表达:
基因
分离真菌菌株并基于分类为桦革褶菌的形态和分子特性两者(ITS测序)。桦革褶菌菌株注释为桦革褶菌菌株NN042749(在丹麦24.07.2013收集的环境样品)并进行全基因组测序。将S53蛋白酶多肽编码序列的基因组DNA序列在桦革褶菌菌株NN042749的基因组中鉴定。2093核苷酸的基因组DNA序列含有59bp(核苷酸259至317)、52bp(核苷酸584至635)、61bp(核苷酸859至919)、55bp(核苷酸1031至1085)、53bp(核苷酸1286至1338)、56bp(核苷酸1477至1532)、和59bp(核苷酸1978至2036)的7个内含子。该基因组DNA片段编码具有565个氨基酸的多肽。没有设计用于编码桦革褶菌S53蛋白酶的内含子以及优化用于在米曲霉中表达的密码子的合成基因购自GeneArt(英杰公司(Invitrogen))并显示在SEQ ID NO:24中。
表达载体
曲霉属表达载体pDau109(WO 2005/042735)由以下组成:基于与构巢曲霉磷酸甘油醛异构酶非翻译前导序列(Pna2/tpl)融合的部分重复的黑曲霉中性淀粉酶II(NA2)启动子和黑曲霉淀粉转葡糖苷酶终止子(Tamg)。载体上还存在来自构巢曲霉的曲霉选择标记amdS和氨苄青霉素抗性基因(β内酰胺酶),该曲霉选择标记amdS能够在作为唯一氮源的乙酰胺上生长,并且该氨苄青霉素抗性基因(β内酰胺酶)允许使用商业上可获得的和高度感受态的菌株在通常使用的LB氨苄西林板上容易地选择阳性重组大肠杆菌克隆。pDau109含有位于启动子区域和终止子之间的多克隆位点,允许在启动子区域前插入感兴趣的基因。
表达克隆
使用独特的限制性位点BamHI和HindIII将编码桦革褶菌S53蛋白酶的合成基因克隆至pDau109曲霉属表达载体,并转化到大肠杆菌(Top10,英杰公司(Invitrogen))中。将含有插入的表达质粒从大肠杆菌转化体中纯化出来,并用载体引物和基因特异性引物进行测序以便确定没有PCR错误的代表性质粒表达克隆。将质粒表达克隆转化到米曲霉中,并使含有整合表达构建体的重组米曲霉克隆在液体培养基中生长。将含有酶的上清液无菌过滤并用于进一步表征。
来自灵芝Xiangnog 1号的S53蛋白酶的克隆和表达,披露为SEQ ID NO:25基因
S53蛋白酶多肽的基因组DNA序列在灵芝的完整基因组中鉴定,其由Liu D.、GongJ.、Dai W.、Kang X.、Huang Z.、Zhang H.M.、Liu W.、Liu L.、Ma J.、Xia Z.、Chen Y.、ChenY.、Wang D.、Ni P.、Guo A.Y.、Xiong X.(2012)等人公开。灵芝的基因组提供了三萜类生物合成和木材降解的见解(The Genome of Ganderma lucidum Provide Insights intoTriterpense Biosynthe-sis and Wood Degradation),PLoS ONE[公共科学图书馆综合],7(5),e36146。
http://doi.org/10.1371/journal.pone.0036146。灵芝S53蛋白酶多肽编码序列的基因组DNA序列和诱导的氨基酸序列分别显示在SEQ ID NO:25和SEQ ID NO:26中。1880核苷酸的基因组DNA序列含有66bp(核苷酸259至324)、64bp(核苷酸820至883)、和52bp(核苷酸1192至1243)的3个内含子。该基因组DNA片段编码具有565个氨基酸的多肽。没有设计用于编码灵芝S53蛋白酶的内含子以及优化用于在米曲霉中表达的密码子的合成基因购自GeneArt(英杰公司(Invitrogen)),SEQ ID NO:28。
表达载体
曲霉属表达载体pDau109(WO 2005/042735)由以下组成:基于与构巢曲霉磷酸甘油醛异构酶非翻译前导序列(Pna2/tpl)融合的部分重复的黑曲霉中性淀粉酶II(NA2)启动子和黑曲霉淀粉转葡糖苷酶终止子(Tamg)。载体上还存在来自构巢曲霉的曲霉选择标记amdS和氨苄青霉素抗性基因(β内酰胺酶),该曲霉选择标记amdS能够在作为唯一氮源的乙酰胺上生长,并且该氨苄青霉素抗性基因(β内酰胺酶)允许使用商业上可获得的和高度感受态的菌株在通常使用的LB氨苄西林板上容易地选择阳性重组大肠杆菌克隆。pDau109含有位于启动子区域和终止子之间的多克隆位点,允许在启动子区域前插入感兴趣的基因。
表达克隆
使用独特的限制性位点BamHI和HindIII将编码灵芝S53蛋白酶(SEQ ID NO:28)的合成基因克隆至pDau109曲霉属表达载体,并转化到大肠杆菌(Top10,英杰公司(Invitrogen))中。将含有插入的表达质粒从大肠杆菌转化体中纯化出来,并用载体引物和基因特异性引物进行测序以便确定没有PCR错误的代表性质粒表达克隆。将质粒表达克隆转化到米曲霉中,并使含有整合表达构建体的重组米曲霉克隆在液体培养基中生长。将含有酶的上清液无菌过滤并用于进一步表征。
来自洁丽香菇的S53蛋白酶的克隆和表达,披露为SEQ ID NO:29
基因
分离真菌菌株并基于分类为洁丽香菇的形态和分子特性两者(ITS测序)。洁丽香菇菌株注释为洁丽香菇菌株NN055916(在丹麦14.07.2008收集的环境样品NN055916)并进行全基因组测序。S53蛋白酶多肽编码序列的基因组DNA序列在洁丽香菇菌株NN055916的基因组中鉴定,并且基因组DNA序列和诱导的氨基酸序列分别显示在SEQ ID NO:29和SEQ IDNO:30中。2048核苷酸的基因组DNA序列含有56bp(核苷酸262至317)、60bp(核苷酸584至643)、68bp(核苷酸972至1039)、53bp(核苷酸1240至1292)、53bp(核苷酸1434至1486)、和60bp(核苷酸1876至1935)的6个内含子。该基因组DNA片段编码具有565个氨基酸的多肽。没有设计用于编码洁丽香菇S53蛋白酶的内含子以及优化用于在米曲霉中表达的密码子的合成基因购自GeneArt(英杰公司(Invitrogen)),SEQ ID NO:32。
表达载体
曲霉属表达载体pDau109(WO 2005/042735)由以下组成:基于与构巢曲霉磷酸甘油醛异构酶非翻译前导序列(Pna2/tpl)融合的部分重复的黑曲霉中性淀粉酶II(NA2)启动子和黑曲霉淀粉转葡糖苷酶终止子(Tamg)。载体上还存在来自构巢曲霉的曲霉选择标记amdS和氨苄青霉素抗性基因(β内酰胺酶),该曲霉选择标记amdS能够在作为唯一氮源的乙酰胺上生长,并且该氨苄青霉素抗性基因(β内酰胺酶)允许使用商业上可获得的和高度感受态的菌株在通常使用的LB氨苄西林板上容易地选择阳性重组大肠杆菌克隆。pDau109含有位于启动子区域和终止子之间的多克隆位点,允许在启动子区域前插入感兴趣的基因。
表达克隆
使用独特的限制性位点BamHI和HindIII将编码洁丽香菇S53蛋白酶(SEQ ID NO:32)的合成基因克隆至pDau109曲霉属表达载体,并转化到大肠杆菌(Top10,英杰公司(Invitrogen))中。将含有插入的表达质粒从大肠杆菌转化体中纯化出来,并用载体引物和基因特异性引物进行测序以便确定没有PCR错误的代表性质粒表达克隆。将质粒表达克隆转化到米曲霉中,并使含有整合表达构建体的重组米曲霉克隆在液体培养基中生长。将含有酶的上清液无菌过滤并用于进一步表征。
实例6:确定披露为SEQ ID NO:12、SEQ ID NO:15、SEQ ID NO:27、和SEQ ID NO:31的蛋白酶的蛋白酶活性。
使用动力学Suc-AAPL-pNA测定来获得pH活性曲线。
使用终点Suc-AAPL-pNA测定以获得在pH 4.0下的pH稳定性曲线和温度曲线。对于pH-稳定性曲线,将蛋白酶在测定缓冲液中稀释7x,并在37℃处孵育2小时。在孵育之后,通过在pH 4测定缓冲液中稀释,将蛋白酶转化至与残余活性测定之前相同的pH。
测定
蛋白酶测定
对于pH-活性曲线的动力学Suc-AAPL-pNA测定:
pNA底物:Suc-AAPL-pNA(巴亨公司(Bachem)L-1390)。
温度:室温(25℃)
测定缓冲液:100mM琥珀酸,100mM HEPES,100mM CHES,100mM CABS,1mM CaCl2,150mM KCl,0.01%Triton X-100,用HCl或NaOH调节至pH值2.0、3.0、4.0、5.0、6.0、7.0、8.0、9.0、10.0、及11.0。
将20μl蛋白酶(稀释于0.01%Triton X-100中)与100μl测定缓冲液混合。通过添加100μl pNA底物(50mg,溶解在1.0ml DMSO中,并进一步地用0.01%Triton X-100稀释45倍)开始进行测定。监测OD405的增加作为蛋白酶活性的量度。
温度曲线和pH稳定性曲线的终点分析:
pNA底物:Suc-AAPL-pNA(巴亨公司(Bachem)L-1390)。
温度:未控制的。
测定缓冲液:100mM琥珀酸,100mM HEPES,100mM CHES,100mM CABS,1mM CaCl2,150mM KCl,0.01%Triton X-100,用HCl或NaOH调节至pH值2.0、3.0、4.0、5.0、6.0、7.0、8.0、9.0、10.0、及11.0。
将200μl pNA底物(50mg,溶解在1.0ml DMSO中,并进一步地用测定缓冲液稀释50x)用移液管移至Eppendorf管中并置于冰上。添加20μl肽酶样品(稀释在0.01%TritonX-100中)。通过将Eppendorf管转移至设定为测定温度的Eppendorf恒温混匀仪中来启动测定。将管在Eppendorf恒温混匀仪上在最高振摇速率(1400rpm)下孵育15分钟(针对pH-稳定性曲线为1小时)。通过转移该管返回至冰浴并添加600μl 500mM H3BO3/NaOH(pH 9.7)停止孵育。将200μl上清液转移至微量滴定板中。读取OD405作为肽酶活性的量度。在测定中包括空白缓冲液(buffer blind)(代替酶)。
结果:
披露为SEQ ID NO:12(漏斗多孔菌)的蛋白酶显示在从pH 3-4的范围具有优的活性,在pH 3-6具有最优的pH稳定性曲线,并且在pH 4在约50℃处具有温度最优。
披露为SEQ ID NO:15(桦革褶菌)的蛋白酶显示在约pH 3具有最优活性,在pH 3-5具有最优的pH稳定性曲线,并且在pH 4在约50℃处具有温度最优。
披露为SEQ ID NO:27(灵芝Xiangnong编号1)的蛋白酶显示在约pH 4具有最优活性,在pH 4-5具有最优的pH稳定性曲线,并且在pH 4在约50℃处具有温度最优。
披露为SEQ ID NO:31洁丽香菇的蛋白酶在pH 3-4显示最优活性,在pH3-5具有最优的pH稳定性曲线,并且在pH 4在约50℃处具有温度最优。
实例7:成熟多肽的N-末端的确定
基于EDMAN N-末端测序数据和完整MS数据的成熟序列确定为SEQ ID NO:11的氨基酸202-567(在此披露为SEQ ID NO:12)。
如通过SDS-PAGE所确定的相对分子量约是Mr=48kDa。
基于EDMAN N-末端测序数据和完整MS数据的成熟序列确定为SEQ ID NO:14的氨基酸200-565(在此披露为SEQ ID NO:15)。
如通过SDS-PAGE所确定的相对分子量约是Mr=43kDa。
序列表
<110> 诺维信公司
<120> 丝氨酸蛋白酶用于改进乙醇产量的用途
<130> 13030-WO-PCT[2]
<160> 39
<170> PatentIn版本3.5
<210> 1
<211> 1695
<212> DNA
<213> 大型亚灰树花菌
<400> 1
atggtcgcca ccagcttgct cgttgcctcc ctattcacgc tcgccctcgg cacgccgacg 60
ggtcgcaacc tcaagctgca cgaggcgcgc gaagaccttc ctgccggttt ctcgctgcgc 120
ggcgccgcct cgcccgacac gacgctgaag ctccgcatcg cgctcgtgca gaacaacttc 180
gccgagctcg aagacaagct ctacgacgtc agcacaccgt ccagcgccaa ctacggcaac 240
cacctctcga aggaagaggt tgagcagtac attgctccgg ctcccgagag cgtgaaagcc 300
gtgaatgcct ggctcaccga gaacggactc gacgcgcaca ccatttcgcc cgccggcgac 360
tggctcgcat tcgaggtccc cgtcagcaag gcgaatgagc tcttcgacgc cgacttctcc 420
gtgtttaccc acgatgagtc cggcctcgag gctatccgga cgctggccta ctccatccct 480
gctgagcttc agggacacct cgaccttgtt caccccaccg tcacgttccc gaaccccaat 540
gcgcacctgc ccgtcgtgcg ctccacccag cccatccgga acctgaccgg acgtgctata 600
ccggcctctt gcgcgagcac catcacccct gcgtgcttgc aggccatcta cggtatcccc 660
accaccaagg ctactcagtc ctcgaacaag ctcgctgtca gcggcttcat cgaccagttt 720
gcgaacaagg ctgacctgaa gtcattcctg gcccagttcc gcaaagacat ctcatcctcc 780
acgactttct cgcttcagac tctcgatggt ggagagaacg accagagccc tagcgaggcg 840
ggtatcgagg ctaacttgga tatccagtac accgtcggcc tcgccacggg cgtccctacc 900
acgttcatct ccgtcggcga cgacttccag gatggcaact tggagggctt cctggacatc 960
atcaacttct tgctcggcga gagcaacccg ccgcaggtcc tcaccaccag ttacggccag 1020
aacgagaaca cgatctcggc caagcttgct aaccaacttt gcaatgcgta cgctcagctc 1080
ggcgcgcgcg gcacctctat cctcttcgcg tcgggtgatg gcggtgtgtc cggctcgcag 1140
tccgcgcact gcagcaattt tgtcccgaca ttcccctccg gctgcccctt catgacttcc 1200
gtcggcgcga cgcagggcgt cagccccgag actgccgccg ccttctcatc cggcggcttc 1260
tcgaacgtgt tcggcatccc gtcgtaccag gcttccgcgg tcagcggcta cctgtccgcg 1320
ctcggaagca cgaactcggg caagttcaac cgcagcggac gcggattccc cgacgtctcc 1380
acgcaaggcg tggacttcca gatcgtcagc ggcggccaga cgatcggcgt cgacggcacg 1440
agctgcgcca gcccgacgtt cgcgagcgtc atctcgctgg taaacgaccg cctcatcgcg 1500
gccggcaaga gcccgctcgg cttcctgaac cccttcctgt actcgtcggc gggcaaggcc 1560
gcgctcaacg acgtcacgag tggctcgaac cctggctgca gcacgaacgg cttccccgct 1620
aaggccggct gggacccggt cactggtctt ggcacgccca actttgccaa gctcctcacc 1680
gcggtcggcc tgtga 1695
<210> 2
<211> 564
<212> PRT
<213> 大型亚灰树花菌
<400> 2
Met Val Ala Thr Ser Leu Leu Val Ala Ser Leu Phe Thr Leu Ala Leu
1 5 10 15
Gly Thr Pro Thr Gly Arg Asn Leu Lys Leu His Glu Ala Arg Glu Asp
20 25 30
Leu Pro Ala Gly Phe Ser Leu Arg Gly Ala Ala Ser Pro Asp Thr Thr
35 40 45
Leu Lys Leu Arg Ile Ala Leu Val Gln Asn Asn Phe Ala Glu Leu Glu
50 55 60
Asp Lys Leu Tyr Asp Val Ser Thr Pro Ser Ser Ala Asn Tyr Gly Asn
65 70 75 80
His Leu Ser Lys Glu Glu Val Glu Gln Tyr Ile Ala Pro Ala Pro Glu
85 90 95
Ser Val Lys Ala Val Asn Ala Trp Leu Thr Glu Asn Gly Leu Asp Ala
100 105 110
His Thr Ile Ser Pro Ala Gly Asp Trp Leu Ala Phe Glu Val Pro Val
115 120 125
Ser Lys Ala Asn Glu Leu Phe Asp Ala Asp Phe Ser Val Phe Thr His
130 135 140
Asp Glu Ser Gly Leu Glu Ala Ile Arg Thr Leu Ala Tyr Ser Ile Pro
145 150 155 160
Ala Glu Leu Gln Gly His Leu Asp Leu Val His Pro Thr Val Thr Phe
165 170 175
Pro Asn Pro Asn Ala His Leu Pro Val Val Arg Ser Thr Gln Pro Ile
180 185 190
Arg Asn Leu Thr Gly Arg Ala Ile Pro Ala Ser Cys Ala Ser Thr Ile
195 200 205
Thr Pro Ala Cys Leu Gln Ala Ile Tyr Gly Ile Pro Thr Thr Lys Ala
210 215 220
Thr Gln Ser Ser Asn Lys Leu Ala Val Ser Gly Phe Ile Asp Gln Phe
225 230 235 240
Ala Asn Lys Ala Asp Leu Lys Ser Phe Leu Ala Gln Phe Arg Lys Asp
245 250 255
Ile Ser Ser Ser Thr Thr Phe Ser Leu Gln Thr Leu Asp Gly Gly Glu
260 265 270
Asn Asp Gln Ser Pro Ser Glu Ala Gly Ile Glu Ala Asn Leu Asp Ile
275 280 285
Gln Tyr Thr Val Gly Leu Ala Thr Gly Val Pro Thr Thr Phe Ile Ser
290 295 300
Val Gly Asp Asp Phe Gln Asp Gly Asn Leu Glu Gly Phe Leu Asp Ile
305 310 315 320
Ile Asn Phe Leu Leu Gly Glu Ser Asn Pro Pro Gln Val Leu Thr Thr
325 330 335
Ser Tyr Gly Gln Asn Glu Asn Thr Ile Ser Ala Lys Leu Ala Asn Gln
340 345 350
Leu Cys Asn Ala Tyr Ala Gln Leu Gly Ala Arg Gly Thr Ser Ile Leu
355 360 365
Phe Ala Ser Gly Asp Gly Gly Val Ser Gly Ser Gln Ser Ala His Cys
370 375 380
Ser Asn Phe Val Pro Thr Phe Pro Ser Gly Cys Pro Phe Met Thr Ser
385 390 395 400
Val Gly Ala Thr Gln Gly Val Ser Pro Glu Thr Ala Ala Ala Phe Ser
405 410 415
Ser Gly Gly Phe Ser Asn Val Phe Gly Ile Pro Ser Tyr Gln Ala Ser
420 425 430
Ala Val Ser Gly Tyr Leu Ser Ala Leu Gly Ser Thr Asn Ser Gly Lys
435 440 445
Phe Asn Arg Ser Gly Arg Gly Phe Pro Asp Val Ser Thr Gln Gly Val
450 455 460
Asp Phe Gln Ile Val Ser Gly Gly Gln Thr Ile Gly Val Asp Gly Thr
465 470 475 480
Ser Cys Ala Ser Pro Thr Phe Ala Ser Val Ile Ser Leu Val Asn Asp
485 490 495
Arg Leu Ile Ala Ala Gly Lys Ser Pro Leu Gly Phe Leu Asn Pro Phe
500 505 510
Leu Tyr Ser Ser Ala Gly Lys Ala Ala Leu Asn Asp Val Thr Ser Gly
515 520 525
Ser Asn Pro Gly Cys Ser Thr Asn Gly Phe Pro Ala Lys Ala Gly Trp
530 535 540
Asp Pro Val Thr Gly Leu Gly Thr Pro Asn Phe Ala Lys Leu Leu Thr
545 550 555 560
Ala Val Gly Leu
<210> 3
<211> 366
<212> PRT
<213> 大型亚灰树花菌
<400> 3
Ala Ile Pro Ala Ser Cys Ala Ser Thr Ile Thr Pro Ala Cys Leu Gln
1 5 10 15
Ala Ile Tyr Gly Ile Pro Thr Thr Lys Ala Thr Gln Ser Ser Asn Lys
20 25 30
Leu Ala Val Ser Gly Phe Ile Asp Gln Phe Ala Asn Lys Ala Asp Leu
35 40 45
Lys Ser Phe Leu Ala Gln Phe Arg Lys Asp Ile Ser Ser Ser Thr Thr
50 55 60
Phe Ser Leu Gln Thr Leu Asp Gly Gly Glu Asn Asp Gln Ser Pro Ser
65 70 75 80
Glu Ala Gly Ile Glu Ala Asn Leu Asp Ile Gln Tyr Thr Val Gly Leu
85 90 95
Ala Thr Gly Val Pro Thr Thr Phe Ile Ser Val Gly Asp Asp Phe Gln
100 105 110
Asp Gly Asn Leu Glu Gly Phe Leu Asp Ile Ile Asn Phe Leu Leu Gly
115 120 125
Glu Ser Asn Pro Pro Gln Val Leu Thr Thr Ser Tyr Gly Gln Asn Glu
130 135 140
Asn Thr Ile Ser Ala Lys Leu Ala Asn Gln Leu Cys Asn Ala Tyr Ala
145 150 155 160
Gln Leu Gly Ala Arg Gly Thr Ser Ile Leu Phe Ala Ser Gly Asp Gly
165 170 175
Gly Val Ser Gly Ser Gln Ser Ala His Cys Ser Asn Phe Val Pro Thr
180 185 190
Phe Pro Ser Gly Cys Pro Phe Met Thr Ser Val Gly Ala Thr Gln Gly
195 200 205
Val Ser Pro Glu Thr Ala Ala Ala Phe Ser Ser Gly Gly Phe Ser Asn
210 215 220
Val Phe Gly Ile Pro Ser Tyr Gln Ala Ser Ala Val Ser Gly Tyr Leu
225 230 235 240
Ser Ala Leu Gly Ser Thr Asn Ser Gly Lys Phe Asn Arg Ser Gly Arg
245 250 255
Gly Phe Pro Asp Val Ser Thr Gln Gly Val Asp Phe Gln Ile Val Ser
260 265 270
Gly Gly Gln Thr Ile Gly Val Asp Gly Thr Ser Cys Ala Ser Pro Thr
275 280 285
Phe Ala Ser Val Ile Ser Leu Val Asn Asp Arg Leu Ile Ala Ala Gly
290 295 300
Lys Ser Pro Leu Gly Phe Leu Asn Pro Phe Leu Tyr Ser Ser Ala Gly
305 310 315 320
Lys Ala Ala Leu Asn Asp Val Thr Ser Gly Ser Asn Pro Gly Cys Ser
325 330 335
Thr Asn Gly Phe Pro Ala Lys Ala Gly Trp Asp Pro Val Thr Gly Leu
340 345 350
Gly Thr Pro Asn Phe Ala Lys Leu Leu Thr Ala Val Gly Leu
355 360 365
<210> 4
<211> 1698
<212> DNA
<213> 变色栓菌
<400> 4
atggtcgcca ccagcttgct cgttgcctcc ctgttcacgc ttgtcctcgg caccccgacg 60
gctcgcaacc tcaagctgca tgagtctcgc gaggagatcc ccgccggctt ctcgctgagc 120
ggcgccgcct cgcccgacac gacgctgaag ctccgcctcg cgctcgttca gagcaacttc 180
gccgagcttg aggacaagct ctacgacgtc agcaccccgt cgagcgcgaa ctacggccag 240
cacctctcca aggaggaggt cgagcaactc gtcgctccca gtgccgcgtc tgtcgccgct 300
gtcaacgcct ggctcaccga gaacggtctc actgcgcaga ccatctcgcc ggccggcgat 360
tggttggcgt tcgaggtgcc cgtcagccag gccaacgagc tcttcgacgc cgacttctcc 420
gtgttcaccc acgacgaatc cggtctccag gctgtccgga ctctcgcgta ctccatcccc 480
gctgagctgc agggtcacct ggacctcgtc caccccacga tcacgttccc gaaccctaac 540
tcgcaccttc ccgtcgtgcg ctcgcccgtg aagcccattc agaacctcac ctcgcgcgcc 600
gtcccggctt cgtgcgctag caccatcacc cctgcgtgcc tgcaggcgct ctacggcatc 660
cccaccacca aggccaccca gtcctcgaac aagctcgctg tcagcggctt catcgaccag 720
ttcgccaact ccgccgactt gaagaccttc ctcggcaagt tccgcaccga catctcgtcg 780
tcgacgacct tcaccctcca gaccctcgac ggtggatcca acagccagtc cagcagccag 840
gctggtgttg aggctaactt ggacgtccag tacgctatcg gcatcgccac gggcgtccct 900
accaccttca tctccgtcgg tgacgacttc caggacggtg acctcgaggg cttcctcgac 960
atcatcaact tcctcctcaa cgaaagcgcg cccccgcagg tgctcacgac cagctacggc 1020
cagaacgaga acaccatctc cgccaagctt gccaaccaac tctgcaacgc atacgctcag 1080
ctcggcgcgc gtggcacctc catcctcttc gcgtccggcg acggtggtgt tgccggctcg 1140
cagacctcca gctgcaccaa gttcctgccg accttcccct cgggctgccc cttcatgacc 1200
tccgtcggcg cgacgcaggg catcaacccg gagaccgccg ccgacttctc ctccggcggc 1260
ttctcaaacg tcttcgcccg cccctcgtac cagtctaccg ccgtcagcag ctacctgacc 1320
gcgctcggca gcaccaactc gggcaagttc aacacctccg gccgcgcgtt ccccgacatc 1380
gccacccagg gtgtcgactt cgagatcgtc gttggcggcc gcactgaggg cgtcgacggc 1440
actagctgcg ccagcccgac gcttgccgcg atcatctcgc tcctgaacga ccgcctcatc 1500
gcggccggca agagccccct tggcttcctc aaccccttcc tgtactcggc ggcgggcgcc 1560
gcggcactca ccgacatcac gtctggctcg aaccccggtt gcggcaccaa cggcttcccc 1620
gcgaaggctg gctgggaccc ggtcaccggt cttggcacgc ccaacttcgc caagctgctc 1680
actgctgttg gcctgtaa 1698
<210> 5
<211> 565
<212> PRT
<213> 变色栓菌
<400> 5
Met Val Ala Thr Ser Leu Leu Val Ala Ser Leu Phe Thr Leu Val Leu
1 5 10 15
Gly Thr Pro Thr Ala Arg Asn Leu Lys Leu His Glu Ser Arg Glu Glu
20 25 30
Ile Pro Ala Gly Phe Ser Leu Ser Gly Ala Ala Ser Pro Asp Thr Thr
35 40 45
Leu Lys Leu Arg Leu Ala Leu Val Gln Ser Asn Phe Ala Glu Leu Glu
50 55 60
Asp Lys Leu Tyr Asp Val Ser Thr Pro Ser Ser Ala Asn Tyr Gly Gln
65 70 75 80
His Leu Ser Lys Glu Glu Val Glu Gln Leu Val Ala Pro Ser Ala Ala
85 90 95
Ser Val Ala Ala Val Asn Ala Trp Leu Thr Glu Asn Gly Leu Thr Ala
100 105 110
Gln Thr Ile Ser Pro Ala Gly Asp Trp Leu Ala Phe Glu Val Pro Val
115 120 125
Ser Gln Ala Asn Glu Leu Phe Asp Ala Asp Phe Ser Val Phe Thr His
130 135 140
Asp Glu Ser Gly Leu Gln Ala Val Arg Thr Leu Ala Tyr Ser Ile Pro
145 150 155 160
Ala Glu Leu Gln Gly His Leu Asp Leu Val His Pro Thr Ile Thr Phe
165 170 175
Pro Asn Pro Asn Ser His Leu Pro Val Val Arg Ser Pro Val Lys Pro
180 185 190
Ile Gln Asn Leu Thr Ser Arg Ala Val Pro Ala Ser Cys Ala Ser Thr
195 200 205
Ile Thr Pro Ala Cys Leu Gln Ala Leu Tyr Gly Ile Pro Thr Thr Lys
210 215 220
Ala Thr Gln Ser Ser Asn Lys Leu Ala Val Ser Gly Phe Ile Asp Gln
225 230 235 240
Phe Ala Asn Ser Ala Asp Leu Lys Thr Phe Leu Gly Lys Phe Arg Thr
245 250 255
Asp Ile Ser Ser Ser Thr Thr Phe Thr Leu Gln Thr Leu Asp Gly Gly
260 265 270
Ser Asn Ser Gln Ser Ser Ser Gln Ala Gly Val Glu Ala Asn Leu Asp
275 280 285
Val Gln Tyr Ala Ile Gly Ile Ala Thr Gly Val Pro Thr Thr Phe Ile
290 295 300
Ser Val Gly Asp Asp Phe Gln Asp Gly Asp Leu Glu Gly Phe Leu Asp
305 310 315 320
Ile Ile Asn Phe Leu Leu Asn Glu Ser Ala Pro Pro Gln Val Leu Thr
325 330 335
Thr Ser Tyr Gly Gln Asn Glu Asn Thr Ile Ser Ala Lys Leu Ala Asn
340 345 350
Gln Leu Cys Asn Ala Tyr Ala Gln Leu Gly Ala Arg Gly Thr Ser Ile
355 360 365
Leu Phe Ala Ser Gly Asp Gly Gly Val Ala Gly Ser Gln Thr Ser Ser
370 375 380
Cys Thr Lys Phe Leu Pro Thr Phe Pro Ser Gly Cys Pro Phe Met Thr
385 390 395 400
Ser Val Gly Ala Thr Gln Gly Ile Asn Pro Glu Thr Ala Ala Asp Phe
405 410 415
Ser Ser Gly Gly Phe Ser Asn Val Phe Ala Arg Pro Ser Tyr Gln Ser
420 425 430
Thr Ala Val Ser Ser Tyr Leu Thr Ala Leu Gly Ser Thr Asn Ser Gly
435 440 445
Lys Phe Asn Thr Ser Gly Arg Ala Phe Pro Asp Ile Ala Thr Gln Gly
450 455 460
Val Asp Phe Glu Ile Val Val Gly Gly Arg Thr Glu Gly Val Asp Gly
465 470 475 480
Thr Ser Cys Ala Ser Pro Thr Leu Ala Ala Ile Ile Ser Leu Leu Asn
485 490 495
Asp Arg Leu Ile Ala Ala Gly Lys Ser Pro Leu Gly Phe Leu Asn Pro
500 505 510
Phe Leu Tyr Ser Ala Ala Gly Ala Ala Ala Leu Thr Asp Ile Thr Ser
515 520 525
Gly Ser Asn Pro Gly Cys Gly Thr Asn Gly Phe Pro Ala Lys Ala Gly
530 535 540
Trp Asp Pro Val Thr Gly Leu Gly Thr Pro Asn Phe Ala Lys Leu Leu
545 550 555 560
Thr Ala Val Gly Leu
565
<210> 6
<211> 366
<212> PRT
<213> 变色栓菌
<400> 6
Ala Val Pro Ala Ser Cys Ala Ser Thr Ile Thr Pro Ala Cys Leu Gln
1 5 10 15
Ala Leu Tyr Gly Ile Pro Thr Thr Lys Ala Thr Gln Ser Ser Asn Lys
20 25 30
Leu Ala Val Ser Gly Phe Ile Asp Gln Phe Ala Asn Ser Ala Asp Leu
35 40 45
Lys Thr Phe Leu Gly Lys Phe Arg Thr Asp Ile Ser Ser Ser Thr Thr
50 55 60
Phe Thr Leu Gln Thr Leu Asp Gly Gly Ser Asn Ser Gln Ser Ser Ser
65 70 75 80
Gln Ala Gly Val Glu Ala Asn Leu Asp Val Gln Tyr Ala Ile Gly Ile
85 90 95
Ala Thr Gly Val Pro Thr Thr Phe Ile Ser Val Gly Asp Asp Phe Gln
100 105 110
Asp Gly Asp Leu Glu Gly Phe Leu Asp Ile Ile Asn Phe Leu Leu Asn
115 120 125
Glu Ser Ala Pro Pro Gln Val Leu Thr Thr Ser Tyr Gly Gln Asn Glu
130 135 140
Asn Thr Ile Ser Ala Lys Leu Ala Asn Gln Leu Cys Asn Ala Tyr Ala
145 150 155 160
Gln Leu Gly Ala Arg Gly Thr Ser Ile Leu Phe Ala Ser Gly Asp Gly
165 170 175
Gly Val Ala Gly Ser Gln Thr Ser Ser Cys Thr Lys Phe Leu Pro Thr
180 185 190
Phe Pro Ser Gly Cys Pro Phe Met Thr Ser Val Gly Ala Thr Gln Gly
195 200 205
Ile Asn Pro Glu Thr Ala Ala Asp Phe Ser Ser Gly Gly Phe Ser Asn
210 215 220
Val Phe Ala Arg Pro Ser Tyr Gln Ser Thr Ala Val Ser Ser Tyr Leu
225 230 235 240
Thr Ala Leu Gly Ser Thr Asn Ser Gly Lys Phe Asn Thr Ser Gly Arg
245 250 255
Ala Phe Pro Asp Ile Ala Thr Gln Gly Val Asp Phe Glu Ile Val Val
260 265 270
Gly Gly Arg Thr Glu Gly Val Asp Gly Thr Ser Cys Ala Ser Pro Thr
275 280 285
Leu Ala Ala Ile Ile Ser Leu Leu Asn Asp Arg Leu Ile Ala Ala Gly
290 295 300
Lys Ser Pro Leu Gly Phe Leu Asn Pro Phe Leu Tyr Ser Ala Ala Gly
305 310 315 320
Ala Ala Ala Leu Thr Asp Ile Thr Ser Gly Ser Asn Pro Gly Cys Gly
325 330 335
Thr Asn Gly Phe Pro Ala Lys Ala Gly Trp Asp Pro Val Thr Gly Leu
340 345 350
Gly Thr Pro Asn Phe Ala Lys Leu Leu Thr Ala Val Gly Leu
355 360 365
<210> 7
<211> 1704
<212> DNA
<213> 污叉丝孔菌
<400> 7
atggttgcct ccggcttgtt cctcgcatcg ctcatcgctc tcgccttggg caagcccacc 60
gcccgcaacc tcaagctgca cgagtctcgc cccagcgccc cgaacggatt ctcgctcgta 120
ggctctgcgg actccaaccg gactctgaag ctgcgtcttg ctcttgccga gagcaacttc 180
tctgagcttg agcgcaagct gtatgatgtc agcacgccga agagtgctaa ctacggcaag 240
cacctctcca aggcggaggt acagcagctt gttgctcctg ggcaggacag catcgacgct 300
gtcaatgctt ggctgaagga gaacgacatc actgcgaaga cgatctcctc tactggcgag 360
tggatctcct tcgaggttcc tgtcagcaag gcgaacgatc tcttcgacgc cgacttctct 420
gtcttcaagc acgatgacac cggcgtggag gcgatccgca ccctttcgta ctctattccg 480
gcagagcttc agggccacct cgatctcgtc caccctacgg tgacattccc taatccgtac 540
agccacctcc cggtcttcca gtcgcccgtc aagaagacgg ctgaaatcca gaacttcacc 600
gccggtgcta tcccctcgtc gtgttcgagc acgatcactc ctgcttgtct tcaggccatc 660
tacaacatcc ctaccacagc tgcgaccgag tcgtcaaacc agctgggtgt gactggcttt 720
atcgaccagt acgccaacaa gaaagacctc aagactttct tgaagaagta ccgcaccgac 780
atctcttcga gcaccacctt caccctgcag accctcgatg gcggttccaa ctcgcagacg 840
ggtagcaagg ccggtgtcga ggctaacctc gacattcagt acactgtcgg cgttgccact 900
ggtgtcccga ctacctttat ctccgttgga gatgacttcc aggacggtga cctcgagggc 960
ttcctcgatg tcatcaacgc cctcctcgat gaggacgctc ctccttcggt cttgacgact 1020
tcatatggcc aggacgagag taccatctct cgtgccctcg cagttaaact ctgtaacgcg 1080
tatgctcagc ttggtgctcg tggtgtttct atcctcttcg cctcgggtga cggtggtgtc 1140
tccggctcgc agtctgccag ctgctccaaa tttgttccta ccttcccatc cggctgcccc 1200
tacatgacct ccgtcggcgc cacccagggt gtaaaccccg agaccgcggc tgacttctcc 1260
tccggcggct tctccaacta ctggggcgtc ccggactacc agagcgacgc tgtcagcacc 1320
tacctctccg cgctcggcaa gacgaactcc ggcaagtaca acgcctccgg ccgtggtttc 1380
cctgatgtgt ctacccaagg tgtgagcttc gaggtcgtcg tcgatggctc cgtagaggcg 1440
gtcgacggta cctcctgcgc gtcccccacg ttcgcgtcca tcatttccct cgtcaacgac 1500
aagctcgtcg cggcaggcaa gagtccgctc ggcttcctca accccttcct atactctgac 1560
ggcgtcgccg ccctcaacga catcacgtca ggctccaacc ctggctgcaa caccaacggc 1620
ttccctgcga agaagggttg ggaccctgtt actggtcttg gtacccctga cttcaagaag 1680
ctcctcaccg cagtcggcct gtga 1704
<210> 8
<211> 567
<212> PRT
<213> 污叉丝孔菌
<400> 8
Met Val Ala Ser Gly Leu Phe Leu Ala Ser Leu Ile Ala Leu Ala Leu
1 5 10 15
Gly Lys Pro Thr Ala Arg Asn Leu Lys Leu His Glu Ser Arg Pro Ser
20 25 30
Ala Pro Asn Gly Phe Ser Leu Val Gly Ser Ala Asp Ser Asn Arg Thr
35 40 45
Leu Lys Leu Arg Leu Ala Leu Ala Glu Ser Asn Phe Ser Glu Leu Glu
50 55 60
Arg Lys Leu Tyr Asp Val Ser Thr Pro Lys Ser Ala Asn Tyr Gly Lys
65 70 75 80
His Leu Ser Lys Ala Glu Val Gln Gln Leu Val Ala Pro Gly Gln Asp
85 90 95
Ser Ile Asp Ala Val Asn Ala Trp Leu Lys Glu Asn Asp Ile Thr Ala
100 105 110
Lys Thr Ile Ser Ser Thr Gly Glu Trp Ile Ser Phe Glu Val Pro Val
115 120 125
Ser Lys Ala Asn Asp Leu Phe Asp Ala Asp Phe Ser Val Phe Lys His
130 135 140
Asp Asp Thr Gly Val Glu Ala Ile Arg Thr Leu Ser Tyr Ser Ile Pro
145 150 155 160
Ala Glu Leu Gln Gly His Leu Asp Leu Val His Pro Thr Val Thr Phe
165 170 175
Pro Asn Pro Tyr Ser His Leu Pro Val Phe Gln Ser Pro Val Lys Lys
180 185 190
Thr Ala Glu Ile Gln Asn Phe Thr Ala Gly Ala Ile Pro Ser Ser Cys
195 200 205
Ser Ser Thr Ile Thr Pro Ala Cys Leu Gln Ala Ile Tyr Asn Ile Pro
210 215 220
Thr Thr Ala Ala Thr Glu Ser Ser Asn Gln Leu Gly Val Thr Gly Phe
225 230 235 240
Ile Asp Gln Tyr Ala Asn Lys Lys Asp Leu Lys Thr Phe Leu Lys Lys
245 250 255
Tyr Arg Thr Asp Ile Ser Ser Ser Thr Thr Phe Thr Leu Gln Thr Leu
260 265 270
Asp Gly Gly Ser Asn Ser Gln Thr Gly Ser Lys Ala Gly Val Glu Ala
275 280 285
Asn Leu Asp Ile Gln Tyr Thr Val Gly Val Ala Thr Gly Val Pro Thr
290 295 300
Thr Phe Ile Ser Val Gly Asp Asp Phe Gln Asp Gly Asp Leu Glu Gly
305 310 315 320
Phe Leu Asp Val Ile Asn Ala Leu Leu Asp Glu Asp Ala Pro Pro Ser
325 330 335
Val Leu Thr Thr Ser Tyr Gly Gln Asp Glu Ser Thr Ile Ser Arg Ala
340 345 350
Leu Ala Val Lys Leu Cys Asn Ala Tyr Ala Gln Leu Gly Ala Arg Gly
355 360 365
Val Ser Ile Leu Phe Ala Ser Gly Asp Gly Gly Val Ser Gly Ser Gln
370 375 380
Ser Ala Ser Cys Ser Lys Phe Val Pro Thr Phe Pro Ser Gly Cys Pro
385 390 395 400
Tyr Met Thr Ser Val Gly Ala Thr Gln Gly Val Asn Pro Glu Thr Ala
405 410 415
Ala Asp Phe Ser Ser Gly Gly Phe Ser Asn Tyr Trp Gly Val Pro Asp
420 425 430
Tyr Gln Ser Asp Ala Val Ser Thr Tyr Leu Ser Ala Leu Gly Lys Thr
435 440 445
Asn Ser Gly Lys Tyr Asn Ala Ser Gly Arg Gly Phe Pro Asp Val Ser
450 455 460
Thr Gln Gly Val Ser Phe Glu Val Val Val Asp Gly Ser Val Glu Ala
465 470 475 480
Val Asp Gly Thr Ser Cys Ala Ser Pro Thr Phe Ala Ser Ile Ile Ser
485 490 495
Leu Val Asn Asp Lys Leu Val Ala Ala Gly Lys Ser Pro Leu Gly Phe
500 505 510
Leu Asn Pro Phe Leu Tyr Ser Asp Gly Val Ala Ala Leu Asn Asp Ile
515 520 525
Thr Ser Gly Ser Asn Pro Gly Cys Asn Thr Asn Gly Phe Pro Ala Lys
530 535 540
Lys Gly Trp Asp Pro Val Thr Gly Leu Gly Thr Pro Asp Phe Lys Lys
545 550 555 560
Leu Leu Thr Ala Val Gly Leu
565
<210> 9
<211> 365
<212> PRT
<213> 污叉丝孔菌
<400> 9
Ala Ile Pro Ser Ser Cys Ser Ser Thr Ile Thr Pro Ala Cys Leu Gln
1 5 10 15
Ala Ile Tyr Asn Ile Pro Thr Thr Ala Ala Thr Glu Ser Ser Asn Gln
20 25 30
Leu Gly Val Thr Gly Phe Ile Asp Gln Tyr Ala Asn Lys Lys Asp Leu
35 40 45
Lys Thr Phe Leu Lys Lys Tyr Arg Thr Asp Ile Ser Ser Ser Thr Thr
50 55 60
Phe Thr Leu Gln Thr Leu Asp Gly Gly Ser Asn Ser Gln Thr Gly Ser
65 70 75 80
Lys Ala Gly Val Glu Ala Asn Leu Asp Ile Gln Tyr Thr Val Gly Val
85 90 95
Ala Thr Gly Val Pro Thr Thr Phe Ile Ser Val Gly Asp Asp Phe Gln
100 105 110
Asp Gly Asp Leu Glu Gly Phe Leu Asp Val Ile Asn Ala Leu Leu Asp
115 120 125
Glu Asp Ala Pro Pro Ser Val Leu Thr Thr Ser Tyr Gly Gln Asp Glu
130 135 140
Ser Thr Ile Ser Arg Ala Leu Ala Val Lys Leu Cys Asn Ala Tyr Ala
145 150 155 160
Gln Leu Gly Ala Arg Gly Val Ser Ile Leu Phe Ala Ser Gly Asp Gly
165 170 175
Gly Val Ser Gly Ser Gln Ser Ala Ser Cys Ser Lys Phe Val Pro Thr
180 185 190
Phe Pro Ser Gly Cys Pro Tyr Met Thr Ser Val Gly Ala Thr Gln Gly
195 200 205
Val Asn Pro Glu Thr Ala Ala Asp Phe Ser Ser Gly Gly Phe Ser Asn
210 215 220
Tyr Trp Gly Val Pro Asp Tyr Gln Ser Asp Ala Val Ser Thr Tyr Leu
225 230 235 240
Ser Ala Leu Gly Lys Thr Asn Ser Gly Lys Tyr Asn Ala Ser Gly Arg
245 250 255
Gly Phe Pro Asp Val Ser Thr Gln Gly Val Ser Phe Glu Val Val Val
260 265 270
Asp Gly Ser Val Glu Ala Val Asp Gly Thr Ser Cys Ala Ser Pro Thr
275 280 285
Phe Ala Ser Ile Ile Ser Leu Val Asn Asp Lys Leu Val Ala Ala Gly
290 295 300
Lys Ser Pro Leu Gly Phe Leu Asn Pro Phe Leu Tyr Ser Asp Gly Val
305 310 315 320
Ala Ala Leu Asn Asp Ile Thr Ser Gly Ser Asn Pro Gly Cys Asn Thr
325 330 335
Asn Gly Phe Pro Ala Lys Lys Gly Trp Asp Pro Val Thr Gly Leu Gly
340 345 350
Thr Pro Asp Phe Lys Lys Leu Leu Thr Ala Val Gly Leu
355 360 365
<210> 10
<211> 1704
<212> DNA
<213> 漏斗多孔菌
<400> 10
atggttgcca cccgcgggtt gttcttcgtc tcgctctttg ccctcgcctt gggaaagccc 60
atggcgcgca gcatgaagct gcatgagtcc cgcgagggca ttcccgaagg cttctcgctg 120
cgcggtgctg ctcagccgga gcagaccatc aagcttcgtc ttgcactcgt gcagagcaac 180
ttcgccgagc tcgagcgcaa gctgatggac gtcagcacgc cgtcgagcgc gaactacggg 240
aagcacctat cgaaggcaga ggtccagcaa ctcgttgccc ccactcagga cagcgtcgac 300
gccgtcaagt cttggttgaa ggagaacgac atcagtgcga agacgatctc cgccaccggt 360
gattggctct cgttcgaggt ccccgtcagc aaggcgaacg agctattcga tgccgacttc 420
tccatctaca cgcacgacga gaccggcacg gaagccgtcc gcaccctctc ctactctatc 480
ccggccgaac tccagggaca ccttgacctc gtgcacccga cggtcacttt cccaaacccc 540
agaggccttc ctccggtctt cactgcgccc atcaaggctg aggctcagaa cctgacgtcg 600
cgcgcgacga tcccctcgtc gtgcgcacgc accatcacac ccgcgtgcct gcaggcgatc 660
tacaacatac cttcgacgcc ggccaccgag tcgtcgaaca agctcgctgt caccggcttc 720
atcgagcagt tcgccaacaa ggccgacctc aaaaccttct tgacccggtt ccgcacagac 780
atctcgtcct cgacgagctt tactcttcag acgctcgatg gcggctcgaa cccacaaagc 840
agcagcgagg ctggcgtcga ggctaacctt gacatccagt acaccgtcgg tgttgccacc 900
ggcgttccca ccgtgttcat ctccgttggc gaagacttcc aggacggtga cctcgagggg 960
ttcctcgatg tcgtcaactc cctcctcgac gaggacacgc cccctttcgt catgaccacg 1020
agctacggcc agaacgaaaa cacgatctct cgcaacctcg ccaacaactt gtgcaatgcg 1080
tacgcgcagc ttggggcccg gggtgtctcc atcctgttcg cctctggtga cggtggcgtc 1140
gctggctctc agtccgccag ctgcagcaag ttcgttccga cgttcccctc tggctgccct 1200
ttcatgactt ccgtcggggc cacccaaggc ttcagccccg agactgctgc cgacttctcg 1260
tccggcggct tctccaacta ctttgccatc cccgactacc agaccagtgc cgtctcgggc 1320
tacatcaagg ccctcggtaa caccaactct ggcaagtaca acgcgaccgg ccgcggcttc 1380
cccgacatcg ccacgcaggg cgtcaacttc gaagttgtcg tcggtggcca atctggcacc 1440
gtcgagggga cgagctgctc gagtccgacg cttgccagca tcatctccct cttgaacgac 1500
cgcctcatcg ctgctgggaa gagccccctc gggttcctga accccttcct gtactcgact 1560
gggacgtcgg ccctcaacga catcacctct ggctcgaatc ccggctgcaa cacgaacggg 1620
ttcccggcga aggctggctg ggatcctgtc actggtctcg gtacgcccga cttcaacaag 1680
ctgctctcgg ctgtcggctt gtaa 1704
<210> 11
<211> 567
<212> PRT
<213> 漏斗多孔菌
<400> 11
Met Val Ala Thr Arg Gly Leu Phe Phe Val Ser Leu Phe Ala Leu Ala
1 5 10 15
Leu Gly Lys Pro Met Ala Arg Ser Met Lys Leu His Glu Ser Arg Glu
20 25 30
Gly Ile Pro Glu Gly Phe Ser Leu Arg Gly Ala Ala Gln Pro Glu Gln
35 40 45
Thr Ile Lys Leu Arg Leu Ala Leu Val Gln Ser Asn Phe Ala Glu Leu
50 55 60
Glu Arg Lys Leu Met Asp Val Ser Thr Pro Ser Ser Ala Asn Tyr Gly
65 70 75 80
Lys His Leu Ser Lys Ala Glu Val Gln Gln Leu Val Ala Pro Thr Gln
85 90 95
Asp Ser Val Asp Ala Val Lys Ser Trp Leu Lys Glu Asn Asp Ile Ser
100 105 110
Ala Lys Thr Ile Ser Ala Thr Gly Asp Trp Leu Ser Phe Glu Val Pro
115 120 125
Val Ser Lys Ala Asn Glu Leu Phe Asp Ala Asp Phe Ser Ile Tyr Thr
130 135 140
His Asp Glu Thr Gly Thr Glu Ala Val Arg Thr Leu Ser Tyr Ser Ile
145 150 155 160
Pro Ala Glu Leu Gln Gly His Leu Asp Leu Val His Pro Thr Val Thr
165 170 175
Phe Pro Asn Pro Arg Gly Leu Pro Pro Val Phe Thr Ala Pro Ile Lys
180 185 190
Ala Glu Ala Gln Asn Leu Thr Ser Arg Ala Thr Ile Pro Ser Ser Cys
195 200 205
Ala Arg Thr Ile Thr Pro Ala Cys Leu Gln Ala Ile Tyr Asn Ile Pro
210 215 220
Ser Thr Pro Ala Thr Glu Ser Ser Asn Lys Leu Ala Val Thr Gly Phe
225 230 235 240
Ile Glu Gln Phe Ala Asn Lys Ala Asp Leu Lys Thr Phe Leu Thr Arg
245 250 255
Phe Arg Thr Asp Ile Ser Ser Ser Thr Ser Phe Thr Leu Gln Thr Leu
260 265 270
Asp Gly Gly Ser Asn Pro Gln Ser Ser Ser Glu Ala Gly Val Glu Ala
275 280 285
Asn Leu Asp Ile Gln Tyr Thr Val Gly Val Ala Thr Gly Val Pro Thr
290 295 300
Val Phe Ile Ser Val Gly Glu Asp Phe Gln Asp Gly Asp Leu Glu Gly
305 310 315 320
Phe Leu Asp Val Val Asn Ser Leu Leu Asp Glu Asp Thr Pro Pro Phe
325 330 335
Val Met Thr Thr Ser Tyr Gly Gln Asn Glu Asn Thr Ile Ser Arg Asn
340 345 350
Leu Ala Asn Asn Leu Cys Asn Ala Tyr Ala Gln Leu Gly Ala Arg Gly
355 360 365
Val Ser Ile Leu Phe Ala Ser Gly Asp Gly Gly Val Ala Gly Ser Gln
370 375 380
Ser Ala Ser Cys Ser Lys Phe Val Pro Thr Phe Pro Ser Gly Cys Pro
385 390 395 400
Phe Met Thr Ser Val Gly Ala Thr Gln Gly Phe Ser Pro Glu Thr Ala
405 410 415
Ala Asp Phe Ser Ser Gly Gly Phe Ser Asn Tyr Phe Ala Ile Pro Asp
420 425 430
Tyr Gln Thr Ser Ala Val Ser Gly Tyr Ile Lys Ala Leu Gly Asn Thr
435 440 445
Asn Ser Gly Lys Tyr Asn Ala Thr Gly Arg Gly Phe Pro Asp Ile Ala
450 455 460
Thr Gln Gly Val Asn Phe Glu Val Val Val Gly Gly Gln Ser Gly Thr
465 470 475 480
Val Glu Gly Thr Ser Cys Ser Ser Pro Thr Leu Ala Ser Ile Ile Ser
485 490 495
Leu Leu Asn Asp Arg Leu Ile Ala Ala Gly Lys Ser Pro Leu Gly Phe
500 505 510
Leu Asn Pro Phe Leu Tyr Ser Thr Gly Thr Ser Ala Leu Asn Asp Ile
515 520 525
Thr Ser Gly Ser Asn Pro Gly Cys Asn Thr Asn Gly Phe Pro Ala Lys
530 535 540
Ala Gly Trp Asp Pro Val Thr Gly Leu Gly Thr Pro Asp Phe Asn Lys
545 550 555 560
Leu Leu Ser Ala Val Gly Leu
565
<210> 12
<211> 366
<212> PRT
<213> 漏斗多孔菌
<400> 12
Ala Thr Ile Pro Ser Ser Cys Ala Arg Thr Ile Thr Pro Ala Cys Leu
1 5 10 15
Gln Ala Ile Tyr Asn Ile Pro Ser Thr Pro Ala Thr Glu Ser Ser Asn
20 25 30
Lys Leu Ala Val Thr Gly Phe Ile Glu Gln Phe Ala Asn Lys Ala Asp
35 40 45
Leu Lys Thr Phe Leu Thr Arg Phe Arg Thr Asp Ile Ser Ser Ser Thr
50 55 60
Ser Phe Thr Leu Gln Thr Leu Asp Gly Gly Ser Asn Pro Gln Ser Ser
65 70 75 80
Ser Glu Ala Gly Val Glu Ala Asn Leu Asp Ile Gln Tyr Thr Val Gly
85 90 95
Val Ala Thr Gly Val Pro Thr Val Phe Ile Ser Val Gly Glu Asp Phe
100 105 110
Gln Asp Gly Asp Leu Glu Gly Phe Leu Asp Val Val Asn Ser Leu Leu
115 120 125
Asp Glu Asp Thr Pro Pro Phe Val Met Thr Thr Ser Tyr Gly Gln Asn
130 135 140
Glu Asn Thr Ile Ser Arg Asn Leu Ala Asn Asn Leu Cys Asn Ala Tyr
145 150 155 160
Ala Gln Leu Gly Ala Arg Gly Val Ser Ile Leu Phe Ala Ser Gly Asp
165 170 175
Gly Gly Val Ala Gly Ser Gln Ser Ala Ser Cys Ser Lys Phe Val Pro
180 185 190
Thr Phe Pro Ser Gly Cys Pro Phe Met Thr Ser Val Gly Ala Thr Gln
195 200 205
Gly Phe Ser Pro Glu Thr Ala Ala Asp Phe Ser Ser Gly Gly Phe Ser
210 215 220
Asn Tyr Phe Ala Ile Pro Asp Tyr Gln Thr Ser Ala Val Ser Gly Tyr
225 230 235 240
Ile Lys Ala Leu Gly Asn Thr Asn Ser Gly Lys Tyr Asn Ala Thr Gly
245 250 255
Arg Gly Phe Pro Asp Ile Ala Thr Gln Gly Val Asn Phe Glu Val Val
260 265 270
Val Gly Gly Gln Ser Gly Thr Val Glu Gly Thr Ser Cys Ser Ser Pro
275 280 285
Thr Leu Ala Ser Ile Ile Ser Leu Leu Asn Asp Arg Leu Ile Ala Ala
290 295 300
Gly Lys Ser Pro Leu Gly Phe Leu Asn Pro Phe Leu Tyr Ser Thr Gly
305 310 315 320
Thr Ser Ala Leu Asn Asp Ile Thr Ser Gly Ser Asn Pro Gly Cys Asn
325 330 335
Thr Asn Gly Phe Pro Ala Lys Ala Gly Trp Asp Pro Val Thr Gly Leu
340 345 350
Gly Thr Pro Asp Phe Asn Lys Leu Leu Ser Ala Val Gly Leu
355 360 365
<210> 13
<211> 1698
<212> DNA
<213> 桦革褶菌
<400> 13
atggtcgcca ccagcttgtt tgtcgccgct ctcatcacgc tcgccgtcgg caagccgatg 60
ggccgcaacc tcaaggtgca cgaggcccgc gaggagatcc cagacgggtt ctctctgcaa 120
ggctcggcgg cgcccgacac cacgctcaag ctgcgcatcg cgctggtgca gagcaacttc 180
gccgagctcg aacagaagct ctacgacgtc agcaccccgt ccagccccaa ctacggtgct 240
cacctctcaa aggaggaggt cgagcagctc gtcgctccct ccgcggacag cgtagacgcc 300
gtgaatgcgt ggctcaagga gaacgatctc agcgcgcaga ctatttcccc cgccggagac 360
tggctggcgt tcgaggtccc cgtcagcaag gcgaacgagc tcttcgacgc cgacttctct 420
gttttcaccc acgatcagac cggcctggag gctatccgca ccatgtcgta ctcgatcccg 480
gccgagctcc agggccacct tgacctcgtc catcccaccg tcactttccc taacccgtac 540
tcccacctgc cggttgttcg ctctcccatc aaggcctccc agaacctgac ctcacgtgcc 600
acgatcccgg cttcctgcgc cagcaccatc actcccgcat gcctgcagga catttacggc 660
atccctacga ctaaggccac ccagtcttcc aacaagcttg ccgtcagcgg cttcatcgac 720
cagtttgcta actcggctga cttggcgacc ttcttgaaga agttccgtac cgacatctcg 780
tctaccacga ccttcgccct ccagaccctc gatggcggtt cgaacagcca gagcggcagc 840
caggccggtg ttgaggctaa cctcgacatt caatacactg tcggtctcgc ctcaggcgtc 900
cccgtcacgt tcatctccgt tggtgacaac ttccaggatg gtgacctcga gggcttcctt 960
gacatcatca acttcctcct cgccgagagc gcgccccctc aggtgcttac gaccagctac 1020
ggccagaacg agaacaccat ctccgtcaag ctcgccaacc aactctgcaa cgcatacgct 1080
cagctcggtg ctcgtggcac ctccatcctg ttcgcctccg gtgacggcgg tgtgtccggt 1140
tcgcagtcct ccagctgctc caaattcgtc ccgactttcc cctctggctg ccccttcatg 1200
acctccgtcg gtgccaccca gggcgtcaac cccgagaccg cggccgactt ctcctccggc 1260
ggcttctcga actacttcgg catcccgtcg taccaggcca ccgcggtgaa gacctacctg 1320
accgcgctcg gcaccaccaa ctcgggcaag ttcaacacca gcggccgcgc gttccctgac 1380
gtgtccaccc agggtgtcga cttcgagatc gtcgttgacg gccggaccga gggcgtcgac 1440
ggcacctcgt gcgcgagccc cacgttcgcg gccatcatct cgctcgtcaa cgacaagctc 1500
atcgctgctg gcaagagccc gctcggcttc ctcaacccct tcctgtactc gaccggcgcc 1560
agcgcgttca ccgacatcac ctccggctcg aaccctggct gcaacaccaa aggcttcccc 1620
gcgaaggctg gctgggaccc cgtcactggt ctcggcacgc ccaacttcgc caagctcctc 1680
gcggccgcgg gcgtgtaa 1698
<210> 14
<211> 565
<212> PRT
<213> 桦革褶菌
<400> 14
Met Val Ala Thr Ser Leu Phe Val Ala Ala Leu Ile Thr Leu Ala Val
1 5 10 15
Gly Lys Pro Met Gly Arg Asn Leu Lys Val His Glu Ala Arg Glu Glu
20 25 30
Ile Pro Asp Gly Phe Ser Leu Gln Gly Ser Ala Ala Pro Asp Thr Thr
35 40 45
Leu Lys Leu Arg Ile Ala Leu Val Gln Ser Asn Phe Ala Glu Leu Glu
50 55 60
Gln Lys Leu Tyr Asp Val Ser Thr Pro Ser Ser Pro Asn Tyr Gly Ala
65 70 75 80
His Leu Ser Lys Glu Glu Val Glu Gln Leu Val Ala Pro Ser Ala Asp
85 90 95
Ser Val Asp Ala Val Asn Ala Trp Leu Lys Glu Asn Asp Leu Ser Ala
100 105 110
Gln Thr Ile Ser Pro Ala Gly Asp Trp Leu Ala Phe Glu Val Pro Val
115 120 125
Ser Lys Ala Asn Glu Leu Phe Asp Ala Asp Phe Ser Val Phe Thr His
130 135 140
Asp Gln Thr Gly Leu Glu Ala Ile Arg Thr Met Ser Tyr Ser Ile Pro
145 150 155 160
Ala Glu Leu Gln Gly His Leu Asp Leu Val His Pro Thr Val Thr Phe
165 170 175
Pro Asn Pro Tyr Ser His Leu Pro Val Val Arg Ser Pro Ile Lys Ala
180 185 190
Ser Gln Asn Leu Thr Ser Arg Ala Thr Ile Pro Ala Ser Cys Ala Ser
195 200 205
Thr Ile Thr Pro Ala Cys Leu Gln Asp Ile Tyr Gly Ile Pro Thr Thr
210 215 220
Lys Ala Thr Gln Ser Ser Asn Lys Leu Ala Val Ser Gly Phe Ile Asp
225 230 235 240
Gln Phe Ala Asn Ser Ala Asp Leu Ala Thr Phe Leu Lys Lys Phe Arg
245 250 255
Thr Asp Ile Ser Ser Thr Thr Thr Phe Ala Leu Gln Thr Leu Asp Gly
260 265 270
Gly Ser Asn Ser Gln Ser Gly Ser Gln Ala Gly Val Glu Ala Asn Leu
275 280 285
Asp Ile Gln Tyr Thr Val Gly Leu Ala Ser Gly Val Pro Val Thr Phe
290 295 300
Ile Ser Val Gly Asp Asn Phe Gln Asp Gly Asp Leu Glu Gly Phe Leu
305 310 315 320
Asp Ile Ile Asn Phe Leu Leu Ala Glu Ser Ala Pro Pro Gln Val Leu
325 330 335
Thr Thr Ser Tyr Gly Gln Asn Glu Asn Thr Ile Ser Val Lys Leu Ala
340 345 350
Asn Gln Leu Cys Asn Ala Tyr Ala Gln Leu Gly Ala Arg Gly Thr Ser
355 360 365
Ile Leu Phe Ala Ser Gly Asp Gly Gly Val Ser Gly Ser Gln Ser Ser
370 375 380
Ser Cys Ser Lys Phe Val Pro Thr Phe Pro Ser Gly Cys Pro Phe Met
385 390 395 400
Thr Ser Val Gly Ala Thr Gln Gly Val Asn Pro Glu Thr Ala Ala Asp
405 410 415
Phe Ser Ser Gly Gly Phe Ser Asn Tyr Phe Gly Ile Pro Ser Tyr Gln
420 425 430
Ala Thr Ala Val Lys Thr Tyr Leu Thr Ala Leu Gly Thr Thr Asn Ser
435 440 445
Gly Lys Phe Asn Thr Ser Gly Arg Ala Phe Pro Asp Val Ser Thr Gln
450 455 460
Gly Val Asp Phe Glu Ile Val Val Asp Gly Arg Thr Glu Gly Val Asp
465 470 475 480
Gly Thr Ser Cys Ala Ser Pro Thr Phe Ala Ala Ile Ile Ser Leu Val
485 490 495
Asn Asp Lys Leu Ile Ala Ala Gly Lys Ser Pro Leu Gly Phe Leu Asn
500 505 510
Pro Phe Leu Tyr Ser Thr Gly Ala Ser Ala Phe Thr Asp Ile Thr Ser
515 520 525
Gly Ser Asn Pro Gly Cys Asn Thr Lys Gly Phe Pro Ala Lys Ala Gly
530 535 540
Trp Asp Pro Val Thr Gly Leu Gly Thr Pro Asn Phe Ala Lys Leu Leu
545 550 555 560
Ala Ala Ala Gly Val
565
<210> 15
<211> 366
<212> PRT
<213> 桦革褶菌
<400> 15
Ala Thr Ile Pro Ala Ser Cys Ala Ser Thr Ile Thr Pro Ala Cys Leu
1 5 10 15
Gln Asp Ile Tyr Gly Ile Pro Thr Thr Lys Ala Thr Gln Ser Ser Asn
20 25 30
Lys Leu Ala Val Ser Gly Phe Ile Asp Gln Phe Ala Asn Ser Ala Asp
35 40 45
Leu Ala Thr Phe Leu Lys Lys Phe Arg Thr Asp Ile Ser Ser Thr Thr
50 55 60
Thr Phe Ala Leu Gln Thr Leu Asp Gly Gly Ser Asn Ser Gln Ser Gly
65 70 75 80
Ser Gln Ala Gly Val Glu Ala Asn Leu Asp Ile Gln Tyr Thr Val Gly
85 90 95
Leu Ala Ser Gly Val Pro Val Thr Phe Ile Ser Val Gly Asp Asn Phe
100 105 110
Gln Asp Gly Asp Leu Glu Gly Phe Leu Asp Ile Ile Asn Phe Leu Leu
115 120 125
Ala Glu Ser Ala Pro Pro Gln Val Leu Thr Thr Ser Tyr Gly Gln Asn
130 135 140
Glu Asn Thr Ile Ser Val Lys Leu Ala Asn Gln Leu Cys Asn Ala Tyr
145 150 155 160
Ala Gln Leu Gly Ala Arg Gly Thr Ser Ile Leu Phe Ala Ser Gly Asp
165 170 175
Gly Gly Val Ser Gly Ser Gln Ser Ser Ser Cys Ser Lys Phe Val Pro
180 185 190
Thr Phe Pro Ser Gly Cys Pro Phe Met Thr Ser Val Gly Ala Thr Gln
195 200 205
Gly Val Asn Pro Glu Thr Ala Ala Asp Phe Ser Ser Gly Gly Phe Ser
210 215 220
Asn Tyr Phe Gly Ile Pro Ser Tyr Gln Ala Thr Ala Val Lys Thr Tyr
225 230 235 240
Leu Thr Ala Leu Gly Thr Thr Asn Ser Gly Lys Phe Asn Thr Ser Gly
245 250 255
Arg Ala Phe Pro Asp Val Ser Thr Gln Gly Val Asp Phe Glu Ile Val
260 265 270
Val Asp Gly Arg Thr Glu Gly Val Asp Gly Thr Ser Cys Ala Ser Pro
275 280 285
Thr Phe Ala Ala Ile Ile Ser Leu Val Asn Asp Lys Leu Ile Ala Ala
290 295 300
Gly Lys Ser Pro Leu Gly Phe Leu Asn Pro Phe Leu Tyr Ser Thr Gly
305 310 315 320
Ala Ser Ala Phe Thr Asp Ile Thr Ser Gly Ser Asn Pro Gly Cys Asn
325 330 335
Thr Lys Gly Phe Pro Ala Lys Ala Gly Trp Asp Pro Val Thr Gly Leu
340 345 350
Gly Thr Pro Asn Phe Ala Lys Leu Leu Ala Ala Ala Gly Val
355 360 365
<210> 16
<211> 583
<212> PRT
<213> 微小根毛霉
<400> 16
Ala Thr Ser Asp Asp Trp Lys Gly Lys Ala Ile Tyr Gln Leu Leu Thr
1 5 10 15
Asp Arg Phe Gly Arg Ala Asp Asp Ser Thr Ser Asn Cys Ser Asn Leu
20 25 30
Ser Asn Tyr Cys Gly Gly Thr Tyr Glu Gly Ile Thr Lys His Leu Asp
35 40 45
Tyr Ile Ser Gly Met Gly Phe Asp Ala Ile Trp Ile Ser Pro Ile Pro
50 55 60
Lys Asn Ser Asp Gly Gly Tyr His Gly Tyr Trp Ala Thr Asp Phe Tyr
65 70 75 80
Gln Leu Asn Ser Asn Phe Gly Asp Glu Ser Gln Leu Lys Ala Leu Ile
85 90 95
Gln Ala Ala His Glu Arg Asp Met Tyr Val Met Leu Asp Val Val Ala
100 105 110
Asn His Ala Gly Pro Thr Ser Asn Gly Tyr Ser Gly Tyr Thr Phe Gly
115 120 125
Asp Ala Ser Leu Tyr His Pro Lys Cys Thr Ile Asp Tyr Asn Asp Gln
130 135 140
Thr Ser Ile Glu Gln Cys Trp Val Ala Asp Glu Leu Pro Asp Ile Asp
145 150 155 160
Thr Glu Asn Ser Asp Asn Val Ala Ile Leu Asn Asp Ile Val Ser Gly
165 170 175
Trp Val Gly Asn Tyr Ser Phe Asp Gly Ile Arg Ile Asp Thr Val Lys
180 185 190
His Ile Arg Lys Asp Phe Trp Thr Gly Tyr Ala Glu Ala Ala Gly Val
195 200 205
Phe Ala Thr Gly Glu Val Phe Asn Gly Asp Pro Ala Tyr Val Gly Pro
210 215 220
Tyr Gln Lys Tyr Leu Pro Ser Leu Ile Asn Tyr Pro Met Tyr Tyr Ala
225 230 235 240
Leu Asn Asp Val Phe Val Ser Lys Ser Lys Gly Phe Ser Arg Ile Ser
245 250 255
Glu Met Leu Gly Ser Asn Arg Asn Ala Phe Glu Asp Thr Ser Val Leu
260 265 270
Thr Thr Phe Val Asp Asn His Asp Asn Pro Arg Phe Leu Asn Ser Gln
275 280 285
Ser Asp Lys Ala Leu Phe Lys Asn Ala Leu Thr Tyr Val Leu Leu Gly
290 295 300
Glu Gly Ile Pro Ile Val Tyr Tyr Gly Ser Glu Gln Gly Phe Ser Gly
305 310 315 320
Gly Ala Asp Pro Ala Asn Arg Glu Val Leu Trp Thr Thr Asn Tyr Asp
325 330 335
Thr Ser Ser Asp Leu Tyr Gln Phe Ile Lys Thr Val Asn Ser Val Arg
340 345 350
Met Lys Ser Asn Lys Ala Val Tyr Met Asp Ile Tyr Val Gly Asp Asn
355 360 365
Ala Tyr Ala Phe Lys His Gly Asp Ala Leu Val Val Leu Asn Asn Tyr
370 375 380
Gly Ser Gly Ser Thr Asn Gln Val Ser Phe Ser Val Ser Gly Lys Phe
385 390 395 400
Asp Ser Gly Ala Ser Leu Met Asp Ile Val Ser Asn Ile Thr Thr Thr
405 410 415
Val Ser Ser Asp Gly Thr Val Thr Phe Asn Leu Lys Asp Gly Leu Pro
420 425 430
Ala Ile Phe Thr Ser Ala Thr Gly Gly Thr Thr Thr Thr Ala Thr Pro
435 440 445
Thr Gly Ser Gly Ser Val Thr Ser Thr Ser Lys Thr Thr Ala Thr Ala
450 455 460
Ser Lys Thr Ser Thr Ser Thr Ser Ser Thr Ser Cys Thr Thr Pro Thr
465 470 475 480
Ala Val Ala Val Thr Phe Asp Leu Thr Ala Thr Thr Thr Tyr Gly Glu
485 490 495
Asn Ile Tyr Leu Val Gly Ser Ile Ser Gln Leu Gly Asp Trp Glu Thr
500 505 510
Ser Asp Gly Ile Ala Leu Ser Ala Asp Lys Tyr Thr Ser Ser Asp Pro
515 520 525
Leu Trp Tyr Val Thr Val Thr Leu Pro Ala Gly Glu Ser Phe Glu Tyr
530 535 540
Lys Phe Ile Arg Ile Glu Ser Asp Asp Ser Val Glu Trp Glu Ser Asp
545 550 555 560
Pro Asn Arg Glu Tyr Thr Val Pro Gln Ala Cys Gly Thr Ser Thr Ala
565 570 575
Thr Val Thr Asp Thr Trp Arg
580
<210> 17
<211> 556
<212> PRT
<213> 瓣环栓菌
<400> 17
Gln Ser Ser Ala Ala Asp Ala Tyr Val Ala Ser Glu Ser Pro Ile Ala
1 5 10 15
Lys Ala Gly Val Leu Ala Asn Ile Gly Pro Ser Gly Ser Lys Ser Asn
20 25 30
Gly Ala Lys Ala Gly Ile Val Ile Ala Ser Pro Ser Thr Ser Asn Pro
35 40 45
Asn Tyr Leu Tyr Thr Trp Thr Arg Asp Ser Ser Leu Val Phe Lys Ala
50 55 60
Leu Ile Asp Gln Phe Thr Thr Gly Glu Asp Thr Ser Leu Arg Thr Leu
65 70 75 80
Ile Asp Glu Phe Thr Ser Ala Glu Ala Ile Leu Gln Gln Val Pro Asn
85 90 95
Pro Ser Gly Thr Val Ser Thr Gly Gly Leu Gly Glu Pro Lys Phe Asn
100 105 110
Ile Asp Glu Thr Ala Phe Thr Asp Ala Trp Gly Arg Pro Gln Arg Asp
115 120 125
Gly Pro Ala Leu Arg Ala Thr Ala Ile Ile Thr Tyr Ala Asn Trp Leu
130 135 140
Leu Asp Asn Lys Asn Thr Thr Tyr Val Thr Asn Thr Leu Trp Pro Ile
145 150 155 160
Ile Lys Leu Asp Leu Asp Tyr Val Ala Ser Asn Trp Asn Gln Ser Thr
165 170 175
Phe Asp Leu Trp Glu Glu Ile Asn Ser Ser Ser Phe Phe Thr Thr Ala
180 185 190
Val Gln His Arg Ala Leu Arg Glu Gly Ala Thr Phe Ala Asn Arg Ile
195 200 205
Gly Gln Thr Ser Val Val Ser Gly Tyr Thr Thr Gln Ala Asn Asn Leu
210 215 220
Leu Cys Phe Leu Gln Ser Tyr Trp Asn Pro Thr Gly Gly Tyr Ile Thr
225 230 235 240
Ala Asn Thr Gly Gly Gly Arg Ser Gly Lys Asp Ala Asn Thr Val Leu
245 250 255
Thr Ser Ile His Thr Phe Asp Pro Ala Ala Gly Cys Asp Ala Val Thr
260 265 270
Phe Gln Pro Cys Ser Asp Lys Ala Leu Ser Asn Leu Lys Val Tyr Val
275 280 285
Asp Ala Phe Arg Ser Ile Tyr Ser Ile Asn Ser Gly Ile Ala Ser Asn
290 295 300
Ala Ala Val Ala Thr Gly Arg Tyr Pro Glu Asp Ser Tyr Met Gly Gly
305 310 315 320
Asn Pro Trp Tyr Leu Thr Thr Ser Ala Val Ala Glu Gln Leu Tyr Asp
325 330 335
Ala Leu Ile Val Trp Asn Lys Leu Gly Ala Leu Asn Val Thr Ser Thr
340 345 350
Ser Leu Pro Phe Phe Gln Gln Phe Ser Ser Gly Val Thr Val Gly Thr
355 360 365
Tyr Ala Ser Ser Ser Ser Thr Phe Lys Thr Leu Thr Ser Ala Ile Lys
370 375 380
Thr Phe Ala Asp Gly Phe Leu Ala Val Asn Ala Lys Tyr Thr Pro Ser
385 390 395 400
Asn Gly Gly Leu Ala Glu Gln Tyr Ser Arg Ser Asn Gly Ser Pro Val
405 410 415
Ser Ala Val Asp Leu Thr Trp Ser Tyr Ala Ala Ala Leu Thr Ser Phe
420 425 430
Ala Ala Arg Ser Gly Lys Thr Tyr Ala Ser Trp Gly Ala Ala Gly Leu
435 440 445
Thr Val Pro Thr Thr Cys Ser Gly Ser Gly Gly Ala Gly Thr Val Ala
450 455 460
Val Thr Phe Asn Val Gln Ala Thr Thr Val Phe Gly Glu Asn Ile Tyr
465 470 475 480
Ile Thr Gly Ser Val Pro Ala Leu Gln Asn Trp Ser Pro Asp Asn Ala
485 490 495
Leu Ile Leu Ser Ala Ala Asn Tyr Pro Thr Trp Ser Ile Thr Val Asn
500 505 510
Leu Pro Ala Ser Thr Thr Ile Glu Tyr Lys Tyr Ile Arg Lys Phe Asn
515 520 525
Gly Ala Val Thr Trp Glu Ser Asp Pro Asn Asn Ser Ile Thr Thr Pro
530 535 540
Ala Ser Gly Thr Phe Thr Gln Asn Asp Thr Trp Arg
545 550 555
<210> 18
<211> 591
<212> PRT
<213> 埃默森篮状菌
<400> 18
Ala Thr Gly Ser Leu Asp Ser Phe Leu Ala Thr Glu Thr Pro Ile Ala
1 5 10 15
Leu Gln Gly Val Leu Asn Asn Ile Gly Pro Asn Gly Ala Asp Val Ala
20 25 30
Gly Ala Ser Ala Gly Ile Val Val Ala Ser Pro Ser Arg Ser Asp Pro
35 40 45
Asn Tyr Phe Tyr Ser Trp Thr Arg Asp Ala Ala Leu Thr Ala Lys Tyr
50 55 60
Leu Val Asp Ala Phe Ile Ala Gly Asn Lys Asp Leu Glu Gln Thr Ile
65 70 75 80
Gln Gln Tyr Ile Ser Ala Gln Ala Lys Val Gln Thr Ile Ser Asn Pro
85 90 95
Ser Gly Asp Leu Ser Thr Gly Gly Leu Gly Glu Pro Lys Phe Asn Val
100 105 110
Asn Glu Thr Ala Phe Thr Gly Pro Trp Gly Arg Pro Gln Arg Asp Gly
115 120 125
Pro Ala Leu Arg Ala Thr Ala Leu Ile Ala Tyr Ala Asn Tyr Leu Ile
130 135 140
Asp Asn Gly Glu Ala Ser Thr Ala Asp Glu Ile Ile Trp Pro Ile Val
145 150 155 160
Gln Asn Asp Leu Ser Tyr Ile Thr Gln Tyr Trp Asn Ser Ser Thr Phe
165 170 175
Asp Leu Trp Glu Glu Val Glu Gly Ser Ser Phe Phe Thr Thr Ala Val
180 185 190
Gln His Arg Ala Leu Val Glu Gly Asn Ala Leu Ala Thr Arg Leu Asn
195 200 205
His Thr Cys Ser Asn Cys Val Ser Gln Ala Pro Gln Val Leu Cys Phe
210 215 220
Leu Gln Ser Tyr Trp Thr Gly Ser Tyr Val Leu Ala Asn Phe Gly Gly
225 230 235 240
Ser Gly Arg Ser Gly Lys Asp Val Asn Ser Ile Leu Gly Ser Ile His
245 250 255
Thr Phe Asp Pro Ala Gly Gly Cys Asp Asp Ser Thr Phe Gln Pro Cys
260 265 270
Ser Ala Arg Ala Leu Ala Asn His Lys Val Val Thr Asp Ser Phe Arg
275 280 285
Ser Ile Tyr Ala Ile Asn Ser Gly Ile Ala Glu Gly Ser Ala Val Ala
290 295 300
Val Gly Arg Tyr Pro Glu Asp Val Tyr Gln Gly Gly Asn Pro Trp Tyr
305 310 315 320
Leu Ala Thr Ala Ala Ala Ala Glu Gln Leu Tyr Asp Ala Ile Tyr Gln
325 330 335
Trp Lys Lys Ile Gly Ser Ile Ser Ile Thr Asp Val Ser Leu Pro Phe
340 345 350
Phe Gln Asp Ile Tyr Pro Ser Ala Ala Val Gly Thr Tyr Asn Ser Gly
355 360 365
Ser Thr Thr Phe Asn Asp Ile Ile Ser Ala Val Gln Thr Tyr Gly Asp
370 375 380
Gly Tyr Leu Ser Ile Val Glu Lys Tyr Thr Pro Ser Asp Gly Ser Leu
385 390 395 400
Thr Glu Gln Phe Ser Arg Thr Asp Gly Thr Pro Leu Ser Ala Ser Ala
405 410 415
Leu Thr Trp Ser Tyr Ala Ser Leu Leu Thr Ala Ser Ala Arg Arg Gln
420 425 430
Ser Val Val Pro Ala Ser Trp Gly Glu Ser Ser Ala Ser Ser Val Pro
435 440 445
Ala Val Cys Ser Ala Thr Ser Ala Thr Gly Pro Tyr Ser Thr Ala Thr
450 455 460
Asn Thr Val Trp Pro Ser Ser Gly Ser Gly Ser Ser Thr Thr Thr Ser
465 470 475 480
Ser Ala Pro Cys Thr Thr Pro Thr Ser Val Ala Val Thr Phe Asp Glu
485 490 495
Ile Val Ser Thr Ser Tyr Gly Glu Thr Ile Tyr Leu Ala Gly Ser Ile
500 505 510
Pro Glu Leu Gly Asn Trp Ser Thr Ala Ser Ala Ile Pro Leu Arg Ala
515 520 525
Asp Ala Tyr Thr Asn Ser Asn Pro Leu Trp Tyr Val Thr Val Asn Leu
530 535 540
Pro Pro Gly Thr Ser Phe Glu Tyr Lys Phe Phe Lys Asn Gln Thr Asp
545 550 555 560
Gly Thr Ile Val Trp Glu Asp Asp Pro Asn Arg Ser Tyr Thr Val Pro
565 570 575
Ala Tyr Cys Gly Gln Thr Thr Ala Ile Leu Asp Asp Ser Trp Gln
580 585 590
<210> 19
<211> 555
<212> PRT
<213> 血红密孔菌
<400> 19
Gln Ser Ser Ala Val Asp Ala Tyr Val Ala Ser Glu Ser Pro Ile Ala
1 5 10 15
Lys Gln Gly Val Leu Asn Asn Ile Gly Pro Asn Gly Ser Lys Ala His
20 25 30
Gly Ala Lys Ala Gly Ile Val Val Ala Ser Pro Ser Thr Glu Asn Pro
35 40 45
Asp Tyr Leu Tyr Thr Trp Thr Arg Asp Ser Ser Leu Val Phe Lys Leu
50 55 60
Leu Ile Asp Gln Phe Thr Ser Gly Asp Asp Thr Ser Leu Arg Gly Leu
65 70 75 80
Ile Asp Asp Phe Thr Ser Ala Glu Ala Ile Leu Gln Gln Val Ser Asn
85 90 95
Pro Ser Gly Thr Val Ser Thr Gly Gly Leu Gly Glu Pro Lys Phe Asn
100 105 110
Ile Asp Glu Thr Ala Phe Thr Gly Ala Trp Gly Arg Pro Gln Arg Asp
115 120 125
Gly Pro Ala Leu Arg Ala Thr Ser Ile Ile Arg Tyr Ala Asn Trp Leu
130 135 140
Leu Asp Asn Gly Asn Thr Thr Tyr Val Ser Asn Thr Leu Trp Pro Val
145 150 155 160
Ile Gln Leu Asp Leu Asp Tyr Val Ala Asp Asn Trp Asn Gln Ser Thr
165 170 175
Phe Asp Leu Trp Glu Glu Val Asp Ser Ser Ser Phe Phe Thr Thr Ala
180 185 190
Val Gln His Arg Ala Leu Arg Glu Gly Ala Thr Phe Ala Ser Arg Ile
195 200 205
Gly Gln Ser Ser Val Val Ser Gly Tyr Thr Thr Gln Ala Asp Asn Leu
210 215 220
Leu Cys Phe Leu Gln Ser Tyr Trp Asn Pro Ser Gly Gly Tyr Val Thr
225 230 235 240
Ala Asn Thr Gly Gly Gly Arg Ser Gly Lys Asp Ser Asn Thr Val Leu
245 250 255
Thr Ser Ile His Thr Phe Asp Pro Ala Ala Gly Cys Asp Ala Ala Thr
260 265 270
Phe Gln Pro Cys Ser Asp Lys Ala Leu Ser Asn Leu Lys Val Tyr Val
275 280 285
Asp Ala Phe Arg Ser Ile Tyr Thr Ile Asn Asn Gly Ile Ala Ser Asn
290 295 300
Ala Ala Val Ala Thr Gly Arg Tyr Pro Glu Asp Ser Tyr Met Gly Gly
305 310 315 320
Asn Pro Trp Tyr Leu Thr Thr Ser Ala Val Ala Glu Gln Leu Tyr Asp
325 330 335
Ala Leu Tyr Val Trp Asp Gln Leu Gly Gly Leu Asn Val Thr Ser Thr
340 345 350
Ser Leu Ala Phe Phe Gln Gln Phe Ala Ser Gly Leu Ser Thr Gly Thr
355 360 365
Tyr Ser Ala Ser Ser Ser Thr Tyr Ala Thr Leu Thr Ser Ala Ile Arg
370 375 380
Ser Phe Ala Asp Gly Phe Leu Ala Ile Asn Ala Lys Tyr Thr Pro Ala
385 390 395 400
Asp Gly Gly Leu Ala Glu Gln Tyr Ser Arg Asn Asp Gly Thr Pro Leu
405 410 415
Ser Ala Val Asp Leu Thr Trp Ser Tyr Ala Ala Ala Leu Thr Ala Phe
420 425 430
Ala Ala Arg Glu Gly Lys Thr Tyr Gly Ser Trp Gly Ala Ala Gly Leu
435 440 445
Thr Val Pro Ala Ser Cys Ser Gly Gly Gly Gly Ala Thr Val Ala Val
450 455 460
Thr Phe Asn Val Gln Ala Thr Thr Val Phe Gly Glu Asn Ile Tyr Ile
465 470 475 480
Thr Gly Ser Val Ala Ala Leu Gln Asn Trp Ser Pro Asp Asn Ala Leu
485 490 495
Ile Leu Ser Ala Ala Asn Tyr Pro Thr Trp Ser Ile Thr Val Asn Leu
500 505 510
Pro Ala Asn Thr Val Val Gln Tyr Lys Tyr Ile Arg Lys Phe Asn Gly
515 520 525
Gln Val Thr Trp Glu Ser Asp Pro Asn Asn Gln Ile Thr Thr Pro Ser
530 535 540
Gly Gly Ser Phe Thr Gln Asn Asp Val Trp Arg
545 550 555
<210> 20
<211> 556
<212> PRT
<213> 篱边粘褶菌
<400> 20
Gln Ser Val Asp Ser Tyr Val Ser Ser Glu Gly Pro Ile Ala Lys Ala
1 5 10 15
Gly Val Leu Ala Asn Ile Gly Pro Asn Gly Ser Lys Ala Ser Gly Ala
20 25 30
Ser Ala Gly Val Val Val Ala Ser Pro Ser Thr Ser Asp Pro Asp Tyr
35 40 45
Trp Tyr Thr Trp Thr Arg Asp Ser Ser Leu Val Phe Lys Ser Leu Ile
50 55 60
Asp Gln Tyr Thr Thr Gly Ile Asp Ser Thr Ser Ser Leu Arg Thr Leu
65 70 75 80
Ile Asp Asp Phe Val Thr Ala Glu Ala Asn Leu Gln Gln Val Ser Asn
85 90 95
Pro Ser Gly Thr Leu Thr Thr Gly Gly Leu Gly Glu Pro Lys Phe Asn
100 105 110
Val Asp Glu Thr Ala Phe Thr Gly Ala Trp Gly Arg Pro Gln Arg Asp
115 120 125
Gly Pro Ala Leu Arg Ser Thr Ala Leu Ile Thr Tyr Gly Asn Trp Leu
130 135 140
Leu Ser Asn Gly Asn Thr Ser Tyr Val Thr Ser Asn Leu Trp Pro Ile
145 150 155 160
Ile Gln Asn Asp Leu Gly Tyr Val Val Ser Tyr Trp Asn Gln Ser Thr
165 170 175
Tyr Asp Leu Trp Glu Glu Val Asp Ser Ser Ser Phe Phe Thr Thr Ala
180 185 190
Val Gln His Arg Ala Leu Arg Glu Gly Ala Ala Phe Ala Thr Ala Ile
195 200 205
Gly Gln Thr Ser Gln Val Ser Ser Tyr Thr Thr Gln Ala Asp Asn Leu
210 215 220
Leu Cys Phe Leu Gln Ser Tyr Trp Asn Pro Ser Gly Gly Tyr Ile Thr
225 230 235 240
Ala Asn Thr Gly Gly Gly Arg Ser Gly Lys Asp Ala Asn Thr Leu Leu
245 250 255
Ala Ser Ile His Thr Tyr Asp Pro Ser Ala Gly Cys Asp Ala Ala Thr
260 265 270
Phe Gln Pro Cys Ser Asp Lys Ala Leu Ser Asn Leu Lys Val Tyr Val
275 280 285
Asp Ser Phe Arg Ser Val Tyr Ser Ile Asn Ser Gly Val Ala Ser Asn
290 295 300
Ala Ala Val Ala Thr Gly Arg Tyr Pro Glu Asp Ser Tyr Gln Gly Gly
305 310 315 320
Asn Pro Trp Tyr Leu Thr Thr Phe Ala Val Ala Glu Gln Leu Tyr Asp
325 330 335
Ala Leu Asn Val Trp Glu Ser Gln Gly Ser Leu Glu Val Thr Ser Thr
340 345 350
Ser Leu Ala Phe Phe Gln Gln Phe Ser Ser Gly Val Thr Ala Gly Thr
355 360 365
Tyr Ser Ser Ser Ser Ser Thr Tyr Ser Thr Leu Thr Ser Ala Ile Lys
370 375 380
Asn Phe Ala Asp Gly Phe Val Ala Ile Asn Ala Lys Tyr Thr Pro Ser
385 390 395 400
Asn Gly Gly Leu Ala Glu Gln Tyr Ser Lys Ser Asp Gly Ser Pro Leu
405 410 415
Ser Ala Val Asp Leu Thr Trp Ser Tyr Ala Ser Ala Leu Thr Ala Phe
420 425 430
Glu Ala Arg Asn Asn Thr Gln Phe Ala Gly Trp Gly Ala Ala Gly Leu
435 440 445
Thr Val Pro Ser Ser Cys Ser Gly Asn Ser Gly Gly Pro Thr Val Ala
450 455 460
Val Thr Phe Asn Val Asn Ala Glu Thr Val Trp Gly Glu Asn Ile Tyr
465 470 475 480
Leu Thr Gly Ser Val Asp Ala Leu Glu Asn Trp Ser Ala Asp Asn Ala
485 490 495
Leu Leu Leu Ser Ser Ala Asn Tyr Pro Thr Trp Ser Ile Thr Val Asn
500 505 510
Leu Pro Ala Ser Thr Ala Ile Glu Tyr Lys Tyr Ile Arg Lys Asn Asn
515 520 525
Gly Ala Val Thr Trp Glu Ser Asp Pro Asn Asn Ser Ile Thr Thr Pro
530 535 540
Ala Ser Gly Ser Thr Thr Glu Asn Asp Thr Trp Arg
545 550 555
<210> 21
<211> 559
<212> PRT
<213> 密粘褶菌
<400> 21
Gln Ser Val Asp Ser Tyr Val Gly Ser Glu Gly Pro Ile Ala Lys Ala
1 5 10 15
Gly Val Leu Ala Asn Ile Gly Pro Asn Gly Ser Lys Ala Ser Gly Ala
20 25 30
Ala Ala Gly Val Val Val Ala Ser Pro Ser Lys Ser Asp Pro Asp Tyr
35 40 45
Trp Tyr Thr Trp Thr Arg Asp Ser Ser Leu Val Phe Lys Ser Leu Ile
50 55 60
Asp Gln Tyr Thr Thr Gly Ile Asp Ser Thr Ser Ser Leu Arg Ser Leu
65 70 75 80
Ile Asp Ser Phe Val Ile Ala Glu Ala Asn Ile Gln Gln Val Ser Asn
85 90 95
Pro Ser Gly Thr Leu Thr Thr Gly Gly Leu Gly Glu Pro Lys Phe Asn
100 105 110
Val Asp Glu Thr Ala Phe Thr Gly Ala Trp Gly Arg Pro Gln Arg Asp
115 120 125
Gly Pro Ala Leu Arg Ala Thr Ala Leu Ile Thr Tyr Gly Asn Trp Leu
130 135 140
Leu Ser Asn Gly Asn Thr Thr Trp Val Thr Ser Thr Leu Trp Pro Ile
145 150 155 160
Ile Gln Asn Asp Leu Asn Tyr Val Val Gln Tyr Trp Asn Gln Thr Thr
165 170 175
Phe Asp Leu Trp Glu Glu Val Asn Ser Ser Ser Phe Phe Thr Thr Ala
180 185 190
Val Gln His Arg Ala Leu Arg Glu Gly Ala Ala Phe Ala Thr Lys Ile
195 200 205
Gly Gln Thr Ser Ser Val Ser Ser Tyr Thr Thr Gln Ala Ala Asn Leu
210 215 220
Leu Cys Phe Leu Gln Ser Tyr Trp Asn Pro Thr Ser Gly Tyr Ile Thr
225 230 235 240
Ala Asn Thr Gly Gly Gly Arg Ser Gly Lys Asp Ala Asn Thr Leu Leu
245 250 255
Ala Ser Ile His Thr Tyr Asp Pro Ser Ala Gly Cys Asp Ala Thr Thr
260 265 270
Phe Gln Pro Cys Ser Asp Lys Ala Leu Ser Asn Leu Lys Val Tyr Val
275 280 285
Asp Ser Phe Arg Ser Val Tyr Ser Ile Asn Ser Gly Ile Ala Ser Asn
290 295 300
Ala Ala Val Ala Thr Gly Arg Tyr Pro Glu Asp Ser Tyr Gln Gly Gly
305 310 315 320
Asn Pro Trp Tyr Leu Thr Thr Phe Ala Val Ala Glu Gln Leu Tyr Asp
325 330 335
Ala Leu Asn Val Trp Ala Ala Gln Gly Ser Leu Asn Val Thr Ser Ile
340 345 350
Ser Leu Pro Phe Phe Gln Gln Phe Ser Ser Ser Val Thr Ala Gly Thr
355 360 365
Tyr Ala Ser Ser Ser Thr Thr Tyr Thr Thr Leu Thr Ser Ala Ile Lys
370 375 380
Ser Phe Ala Asp Gly Phe Val Ala Ile Asn Ala Gln Tyr Thr Pro Ser
385 390 395 400
Asn Gly Gly Leu Ala Glu Gln Phe Ser Arg Ser Asn Gly Ala Pro Val
405 410 415
Ser Ala Val Asp Leu Thr Trp Ser Tyr Ala Ser Ala Leu Thr Ala Phe
420 425 430
Glu Ala Arg Asn Asn Thr Gln Phe Ala Gly Trp Gly Ala Val Gly Leu
435 440 445
Thr Val Pro Thr Ser Cys Ser Ser Asn Ser Gly Gly Gly Gly Gly Ser
450 455 460
Thr Val Ala Val Thr Phe Asn Val Asn Ala Gln Thr Val Trp Gly Glu
465 470 475 480
Asn Ile Tyr Ile Thr Gly Ser Val Asp Ala Leu Ser Asn Trp Ser Pro
485 490 495
Asp Asn Ala Leu Leu Leu Ser Ser Ala Asn Tyr Pro Thr Trp Ser Ile
500 505 510
Thr Val Asn Leu Pro Ala Ser Thr Ala Ile Gln Tyr Lys Tyr Ile Arg
515 520 525
Lys Asn Asn Gly Ala Val Thr Trp Glu Ser Asp Pro Asn Asn Ser Ile
530 535 540
Thr Thr Pro Ala Ser Gly Ser Val Thr Glu Asn Asp Thr Trp Arg
545 550 555
<210> 22
<211> 515
<212> PRT
<213> 嗜热脂肪芽孢杆菌
<400> 22
Ala Ala Pro Phe Asn Gly Thr Met Met Gln Tyr Phe Glu Trp Tyr Leu
1 5 10 15
Pro Asp Asp Gly Thr Leu Trp Thr Lys Val Ala Asn Glu Ala Asn Asn
20 25 30
Leu Ser Ser Leu Gly Ile Thr Ala Leu Trp Leu Pro Pro Ala Tyr Lys
35 40 45
Gly Thr Ser Arg Ser Asp Val Gly Tyr Gly Val Tyr Asp Leu Tyr Asp
50 55 60
Leu Gly Glu Phe Asn Gln Lys Gly Thr Val Arg Thr Lys Tyr Gly Thr
65 70 75 80
Lys Ala Gln Tyr Leu Gln Ala Ile Gln Ala Ala His Ala Ala Gly Met
85 90 95
Gln Val Tyr Ala Asp Val Val Phe Asp His Lys Gly Gly Ala Asp Gly
100 105 110
Thr Glu Trp Val Asp Ala Val Glu Val Asn Pro Ser Asp Arg Asn Gln
115 120 125
Glu Ile Ser Gly Thr Tyr Gln Ile Gln Ala Trp Thr Lys Phe Asp Phe
130 135 140
Pro Gly Arg Gly Asn Thr Tyr Ser Ser Phe Lys Trp Arg Trp Tyr His
145 150 155 160
Phe Asp Gly Val Asp Trp Asp Glu Ser Arg Lys Leu Ser Arg Ile Tyr
165 170 175
Lys Phe Arg Gly Ile Gly Lys Ala Trp Asp Trp Glu Val Asp Thr Glu
180 185 190
Asn Gly Asn Tyr Asp Tyr Leu Met Tyr Ala Asp Leu Asp Met Asp His
195 200 205
Pro Glu Val Val Thr Glu Leu Lys Asn Trp Gly Lys Trp Tyr Val Asn
210 215 220
Thr Thr Asn Ile Asp Gly Phe Arg Leu Asp Ala Val Lys His Ile Lys
225 230 235 240
Phe Ser Phe Phe Pro Asp Trp Leu Ser Tyr Val Arg Ser Gln Thr Gly
245 250 255
Lys Pro Leu Phe Thr Val Gly Glu Tyr Trp Ser Tyr Asp Ile Asn Lys
260 265 270
Leu His Asn Tyr Ile Thr Lys Thr Asn Gly Thr Met Ser Leu Phe Asp
275 280 285
Ala Pro Leu His Asn Lys Phe Tyr Thr Ala Ser Lys Ser Gly Gly Ala
290 295 300
Phe Asp Met Arg Thr Leu Met Thr Asn Thr Leu Met Lys Asp Gln Pro
305 310 315 320
Thr Leu Ala Val Thr Phe Val Asp Asn His Asp Thr Glu Pro Gly Gln
325 330 335
Ala Leu Gln Ser Trp Val Asp Pro Trp Phe Lys Pro Leu Ala Tyr Ala
340 345 350
Phe Ile Leu Thr Arg Gln Glu Gly Tyr Pro Cys Val Phe Tyr Gly Asp
355 360 365
Tyr Tyr Gly Ile Pro Gln Tyr Asn Ile Pro Ser Leu Lys Ser Lys Ile
370 375 380
Asp Pro Leu Leu Ile Ala Arg Arg Asp Tyr Ala Tyr Gly Thr Gln His
385 390 395 400
Asp Tyr Leu Asp His Ser Asp Ile Ile Gly Trp Thr Arg Glu Gly Val
405 410 415
Thr Glu Lys Pro Gly Ser Gly Leu Ala Ala Leu Ile Thr Asp Gly Pro
420 425 430
Gly Gly Ser Lys Trp Met Tyr Val Gly Lys Gln His Ala Gly Lys Val
435 440 445
Phe Tyr Asp Leu Thr Gly Asn Arg Ser Asp Thr Val Thr Ile Asn Ser
450 455 460
Asp Gly Trp Gly Glu Phe Lys Val Asn Gly Gly Ser Val Ser Val Trp
465 470 475 480
Val Pro Arg Lys Thr Thr Val Ser Thr Ile Ala Arg Pro Ile Thr Thr
485 490 495
Arg Pro Trp Thr Gly Glu Phe Val Arg Trp Thr Glu Pro Arg Leu Val
500 505 510
Ala Trp Pro
515
<210> 23
<211> 1704
<212> DNA
<213> 漏斗多孔菌
<400> 23
atggtggcaa ctaggggttt gttcttcgtg tccttgttcg cattggccct cggtaagccc 60
atggccaggt cgatgaagct ccacgaatcg cgagagggta tccctgaagg cttctccttg 120
aggggagcag cccagcctga gcagacgatc aagctccgtt tggcgttggt gcagtccaac 180
ttcgccgagt tggagcggaa gttgatggac gtgtcgacgc cgtcgtcggc gaactatggc 240
aagcacttgt ccaaggccga ggtccagcag ttggtggcac ctacccagga ctccgtggat 300
gccgtgaagt cgtggctcaa agaaaacgat atctcggcca agacgatctc ggcaaccgga 360
gattggttgt ccttcgaggt ccccgtctcg aaggccaacg agttgttcga cgcagatttc 420
tcgatctaca cccacgacga aaccggtacc gaagccgtgc gcacattgtc ctactccatt 480
cctgccgaac tccagggtca cttggatctc gtccacccca cagtgacttt ccccaaccct 540
cgcggattgc ctcctgtgtt cacagcaccc atcaaagcag aagcccagaa cttgacatcc 600
agggcgacca ttccgtcctc gtgtgccagg acaatcacac cggcatgtct ccaggcaatc 660
tacaacatcc cttcgacccc tgccacagag tcgtccaaca agttggcagt caccggattc 720
atcgaacagt tcgccaacaa ggcggacttg aaaactttct tgacacgatt caggaccgac 780
atctcctcgt ccacctcgtt cacactccag acactcgatg gtggctccaa ccctcagtcc 840
tcgtccgaag caggagtcga agccaacttg gatatccagt acaccgtggg cgtggcaaca 900
ggtgtcccca ccgtgttcat ctcggtggga gaggacttcc aggatggtga tttggaggga 960
ttcttggatg tcgtcaactc gttgttggac gaggatacac ctccgttcgt gatgacgacc 1020
tcgtacggcc agaacgagaa cacgatctcg aggaacctcg ccaacaactt gtgtaacgca 1080
tacgcgcagt tgggagcgcg tggcgtgtcc atcttgttcg cgtccggaga tggaggcgtc 1140
gcaggttcgc agtccgcgtc gtgttcgaag ttcgtgccta cattcccctc cggttgtccc 1200
ttcatgacct cggtcggagc cactcaggga ttctcgcctg agactgcagc cgatttctcc 1260
tcgggtggtt tctcgaacta cttcgccatc ccggattacc agacctcggc agtctcggga 1320
tacatcaagg cgctcggtaa caccaactcg ggcaagtaca acgcaaccgg tcgaggattc 1380
ccggatatcg caacccaggg cgtcaacttc gaggtggtgg tcggtggcca gtcgggcacg 1440
gtggagggca cctcctgttc ctcgcccact ctcgcatcga tcatctccct cctcaacgac 1500
cgattgattg cggcaggtaa atcgcctctc ggtttcttga accccttcct ctattccacg 1560
ggcacttccg cactcaacga cattacatcg ggatcgaacc ctggctgtaa cacgaacgga 1620
ttccctgcaa aagccggatg ggacccggtc accggcttgg gcacacccga cttcaacaag 1680
ctcttgtcgg cagtgggcct ctaa 1704
<210> 24
<211> 1698
<212> DNA
<213> 桦革褶菌
<400> 24
atggtggcaa cgtccttgtt cgtggcagcc ctcatcacct tggcagtggg caagcccatg 60
ggacggaact tgaaggtgca cgaagcacgc gaagagatcc cggacggttt ctcgctccag 120
ggttccgcag cacccgacac tacactcaaa ctcaggatcg cattggtcca gtcgaacttc 180
gcagaattgg agcagaagct ctacgacgtc tccaccccct cctcgccgaa ctatggagcg 240
catttgtcga aggaggaggt ggagcagttg gtggcacctt cggcagattc ggtcgacgcc 300
gtgaacgcct ggttgaagga aaacgatttg tcggcacaga ccatctcgcc tgcaggagat 360
tggctcgcgt tcgaggtccc tgtctcgaaa gcaaacgaac tcttcgatgc cgacttctcg 420
gtcttcacac atgatcagac cggattggaa gcgatcagga caatgtcgta ctcgattccg 480
gcagagttgc agggtcattt ggatctcgtc caccctacag tcaccttccc caacccttac 540
tcgcacctcc ctgtcgtgcg ctcgcccatc aaggcctcgc agaacctcac ctccagggca 600
acgatccctg cctcctgtgc atccacaatt actcctgcct gtctccagga tatctatggc 660
atcccgacaa ctaaggccac gcagtcctcg aacaagctcg ccgtctccgg cttcatcgac 720
cagttcgcaa actccgcaga tttggcaacc ttcctcaaga agttcaggac agatatctcg 780
tccaccacta cgttcgcact ccagaccctc gacggaggtt ccaactcgca gtccggctcc 840
caggcaggag tggaagccaa cctcgatatc cagtataccg tgggcttggc ctcgggagtg 900
cccgtcacgt tcatttccgt gggcgataac ttccaggacg gtgatttgga gggtttcttg 960
gacatcatta acttcttgtt ggccgaatcg gcacctcccc aggtcctcac gacctcctac 1020
ggacagaacg agaacactat ctcggtgaaa ttggccaacc agttgtgtaa cgcctacgcg 1080
cagctcggag cacgcggtac ttcgatcctc ttcgcctcgg gagacggtgg agtgtccggt 1140
tcgcagtcgt cctcgtgttc caaattcgtg cctacattcc cttccggttg tccgttcatg 1200
acatcggtgg gagcaaccca gggcgtgaac cccgagacag ccgcagattt ctcgtcggga 1260
ggattctcca actacttcgg tatcccttcc taccaggcaa ccgcagtcaa gacgtacttg 1320
acggccttgg gaacaacgaa ctccggaaag ttcaacactt cgggacgagc cttccccgat 1380
gtgtcgactc agggcgtcga cttcgaaatc gtcgtcgatg gtcgaactga gggagtcgat 1440
ggaacttcct gtgcatcccc cacgttcgca gcgatcatct cgctcgtcaa cgacaaactc 1500
attgccgcag gcaagtcgcc tctcggattc ctcaacccct tcctctattc cacaggcgca 1560
tcggcattca ccgacattac ctcgggttcc aaccctggct gtaacaccaa gggcttccct 1620
gcgaaagccg gttgggaccc tgtcacagga ctcggcacac ccaacttcgc gaagctcctc 1680
gcagcagcag gcgtctaa 1698
<210> 25
<211> 1880
<212> DNA
<213> 灵芝
<400> 25
atggttgcct ccggcttgct ccttgcttcc ctcgtcaccc ttgccttggg caagaccgcc 60
actcgcaacc tcaagctcca tgagacaagc cagggcgctc ccagcggctt ctctctcact 120
ggctctgcgg accccgacca gaccttgaag ttgcgtctcg ccctcgtcca gggcaacgtc 180
gccgagcttg agcgcaggct ctacgacgtc agcacaccat caagtccgaa ctacggcaag 240
cacctgtcga agtctgaggt attattccgt tgccgttacc ctcattctaa tgttctctct 300
ctaatctgtt tgcgtcacac acaggtacaa cagctcgttg cccccgcaca agatagcatc 360
gatgctatca atgcgtggct taaggagaac gggatctcgg ctaagacgac ctccgccacc 420
ggcgattggc tctcgttcga ggtccctgtc agcaaggcca acgagctctt cgacgccgac 480
ttctcagtgt acaagcacca tgacaccggc atggaggttg tccgcaccct ctcgtactcg 540
attccggccg aactccaggc ccacctcgac cttgtccacc cgacggtgac gttcccgaac 600
ccgaagggcc accctccggt cttccaagca ccggccatga tcaccaatga tgttcagaac 660
ttcagcgccg gggccgttcc gtcatcgtgc tcgagccgca tcactcctgc ttgcctgcag 720
gctctttaca acatcccgtc ggacccggca acacagccgt caaacaagct cgccgtcact 780
ggttatattg agcagtacgc taatcaggat gaccttgcgg tacgcttacg ccattcaaat 840
ctggtaccat caacccaata ctgatcgatt tacctgccgt caggtcttct tgaaggagta 900
tcgtgccgac atgtcatcga acacgacctt caccctccag acactcgatg gtggcgttaa 960
ctctcaaacg gacgaggctg gtatcgaagc gaaccttgac gttcagtaca cggtcggtat 1020
cgccactggt gtcccgacgg tcttcatctc tgtcggtgat cagtaccagg acggcaacct 1080
cgagggcttc ctcgacgttg tcaacttcct ccttgacgaa gatacccctc cctatgttat 1140
gacaacttcc tacggccagg acgaacacac catgtcgcgg aaactcgcgc agtgcgtaca 1200
tctcatcttc ctatgagcgg tcgctcacgc atctcgcttg caggaacctt tgcaacgcat 1260
acgcccagct cggcgctcgc ggtgtgtcca tcctcttcgc ctccggtgat ggcggcgtcg 1320
caggctcgcg gtcctccagc tgctccaagt tcgtccccac cttcccctcg ggctgcccct 1380
acatgacctc cgtcggcgcc acccaaggtg tgcccgagac cgcggccgac ttctcctccg 1440
gcggcttctc caactacttc ggcatccccg actaccaggc ctccgccgtc agcggctacc 1500
tctccgcgct cgggcacacg aacaagggca agtacaacgc gtcgggccgt ggattccctg 1560
acgtgtccac gcagggcgtc aacttcgaag tcatggtcga cggcgcgctc gagggcgtct 1620
cgggcacttc cgccgcgtcg cccacgttcg cggctgttgt tgcgctcctc aatgacaggc 1680
tcatcgcggc gggcaagagc ccccttgggt tcctcaaccc tttcctgtac tcgaagggcg 1740
tgtccgcgct caacgacatc acgtccggct ccaacccggg ctgcaggacg aacggcttcc 1800
cagcgaagga gggctgggac ccggtcaccg gtcttggtac gcccgacttc cagaagctcg 1860
cgtctgccgc tggcctctaa 1880
<210> 26
<211> 565
<212> PRT
<213> 灵芝
<400> 26
Met Val Ala Ser Gly Leu Leu Leu Ala Ser Leu Val Thr Leu Ala Leu
1 5 10 15
Gly Lys Thr Ala Thr Arg Asn Leu Lys Leu His Glu Thr Ser Gln Gly
20 25 30
Ala Pro Ser Gly Phe Ser Leu Thr Gly Ser Ala Asp Pro Asp Gln Thr
35 40 45
Leu Lys Leu Arg Leu Ala Leu Val Gln Gly Asn Val Ala Glu Leu Glu
50 55 60
Arg Arg Leu Tyr Asp Val Ser Thr Pro Ser Ser Pro Asn Tyr Gly Lys
65 70 75 80
His Leu Ser Lys Ser Glu Val Gln Gln Leu Val Ala Pro Ala Gln Asp
85 90 95
Ser Ile Asp Ala Ile Asn Ala Trp Leu Lys Glu Asn Gly Ile Ser Ala
100 105 110
Lys Thr Thr Ser Ala Thr Gly Asp Trp Leu Ser Phe Glu Val Pro Val
115 120 125
Ser Lys Ala Asn Glu Leu Phe Asp Ala Asp Phe Ser Val Tyr Lys His
130 135 140
His Asp Thr Gly Met Glu Val Val Arg Thr Leu Ser Tyr Ser Ile Pro
145 150 155 160
Ala Glu Leu Gln Ala His Leu Asp Leu Val His Pro Thr Val Thr Phe
165 170 175
Pro Asn Pro Lys Gly His Pro Pro Val Phe Gln Ala Pro Ala Met Ile
180 185 190
Thr Asn Asp Val Gln Asn Phe Ser Ala Gly Ala Val Pro Ser Ser Cys
195 200 205
Ser Ser Arg Ile Thr Pro Ala Cys Leu Gln Ala Leu Tyr Asn Ile Pro
210 215 220
Ser Asp Pro Ala Thr Gln Pro Ser Asn Lys Leu Ala Val Thr Gly Tyr
225 230 235 240
Ile Glu Gln Tyr Ala Asn Gln Asp Asp Leu Ala Val Phe Leu Lys Glu
245 250 255
Tyr Arg Ala Asp Met Ser Ser Asn Thr Thr Phe Thr Leu Gln Thr Leu
260 265 270
Asp Gly Gly Val Asn Ser Gln Thr Asp Glu Ala Gly Ile Glu Ala Asn
275 280 285
Leu Asp Val Gln Tyr Thr Val Gly Ile Ala Thr Gly Val Pro Thr Val
290 295 300
Phe Ile Ser Val Gly Asp Gln Tyr Gln Asp Gly Asn Leu Glu Gly Phe
305 310 315 320
Leu Asp Val Val Asn Phe Leu Leu Asp Glu Asp Thr Pro Pro Tyr Val
325 330 335
Met Thr Thr Ser Tyr Gly Gln Asp Glu His Thr Met Ser Arg Lys Leu
340 345 350
Ala Gln Asn Leu Cys Asn Ala Tyr Ala Gln Leu Gly Ala Arg Gly Val
355 360 365
Ser Ile Leu Phe Ala Ser Gly Asp Gly Gly Val Ala Gly Ser Arg Ser
370 375 380
Ser Ser Cys Ser Lys Phe Val Pro Thr Phe Pro Ser Gly Cys Pro Tyr
385 390 395 400
Met Thr Ser Val Gly Ala Thr Gln Gly Val Pro Glu Thr Ala Ala Asp
405 410 415
Phe Ser Ser Gly Gly Phe Ser Asn Tyr Phe Gly Ile Pro Asp Tyr Gln
420 425 430
Ala Ser Ala Val Ser Gly Tyr Leu Ser Ala Leu Gly His Thr Asn Lys
435 440 445
Gly Lys Tyr Asn Ala Ser Gly Arg Gly Phe Pro Asp Val Ser Thr Gln
450 455 460
Gly Val Asn Phe Glu Val Met Val Asp Gly Ala Leu Glu Gly Val Ser
465 470 475 480
Gly Thr Ser Ala Ala Ser Pro Thr Phe Ala Ala Val Val Ala Leu Leu
485 490 495
Asn Asp Arg Leu Ile Ala Ala Gly Lys Ser Pro Leu Gly Phe Leu Asn
500 505 510
Pro Phe Leu Tyr Ser Lys Gly Val Ser Ala Leu Asn Asp Ile Thr Ser
515 520 525
Gly Ser Asn Pro Gly Cys Arg Thr Asn Gly Phe Pro Ala Lys Glu Gly
530 535 540
Trp Asp Pro Val Thr Gly Leu Gly Thr Pro Asp Phe Gln Lys Leu Ala
545 550 555 560
Ser Ala Ala Gly Leu
565
<210> 27
<211> 363
<212> PRT
<213> 灵芝
<400> 27
Ala Val Pro Ser Ser Cys Ser Ser Arg Ile Thr Pro Ala Cys Leu Gln
1 5 10 15
Ala Leu Tyr Asn Ile Pro Ser Asp Pro Ala Thr Gln Pro Ser Asn Lys
20 25 30
Leu Ala Val Thr Gly Tyr Ile Glu Gln Tyr Ala Asn Gln Asp Asp Leu
35 40 45
Ala Val Phe Leu Lys Glu Tyr Arg Ala Asp Met Ser Ser Asn Thr Thr
50 55 60
Phe Thr Leu Gln Thr Leu Asp Gly Gly Val Asn Ser Gln Thr Asp Glu
65 70 75 80
Ala Gly Ile Glu Ala Asn Leu Asp Val Gln Tyr Thr Val Gly Ile Ala
85 90 95
Thr Gly Val Pro Thr Val Phe Ile Ser Val Gly Asp Gln Tyr Gln Asp
100 105 110
Gly Asn Leu Glu Gly Phe Leu Asp Val Val Asn Phe Leu Leu Asp Glu
115 120 125
Asp Thr Pro Pro Tyr Val Met Thr Thr Ser Tyr Gly Gln Asp Glu His
130 135 140
Thr Met Ser Arg Lys Leu Ala Gln Asn Leu Cys Asn Ala Tyr Ala Gln
145 150 155 160
Leu Gly Ala Arg Gly Val Ser Ile Leu Phe Ala Ser Gly Asp Gly Gly
165 170 175
Val Ala Gly Ser Arg Ser Ser Ser Cys Ser Lys Phe Val Pro Thr Phe
180 185 190
Pro Ser Gly Cys Pro Tyr Met Thr Ser Val Gly Ala Thr Gln Gly Val
195 200 205
Pro Glu Thr Ala Ala Asp Phe Ser Ser Gly Gly Phe Ser Asn Tyr Phe
210 215 220
Gly Ile Pro Asp Tyr Gln Ala Ser Ala Val Ser Gly Tyr Leu Ser Ala
225 230 235 240
Leu Gly His Thr Asn Lys Gly Lys Tyr Asn Ala Ser Gly Arg Gly Phe
245 250 255
Pro Asp Val Ser Thr Gln Gly Val Asn Phe Glu Val Met Val Asp Gly
260 265 270
Ala Leu Glu Gly Val Ser Gly Thr Ser Ala Ala Ser Pro Thr Phe Ala
275 280 285
Ala Val Val Ala Leu Leu Asn Asp Arg Leu Ile Ala Ala Gly Lys Ser
290 295 300
Pro Leu Gly Phe Leu Asn Pro Phe Leu Tyr Ser Lys Gly Val Ser Ala
305 310 315 320
Leu Asn Asp Ile Thr Ser Gly Ser Asn Pro Gly Cys Arg Thr Asn Gly
325 330 335
Phe Pro Ala Lys Glu Gly Trp Asp Pro Val Thr Gly Leu Gly Thr Pro
340 345 350
Asp Phe Gln Lys Leu Ala Ser Ala Ala Gly Leu
355 360
<210> 28
<211> 1698
<212> DNA
<213> 灵芝
<400> 28
atggtcgcat ccggcttgtt gctcgcatcc ctcgtcacac tcgcgctcgg aaagacggcc 60
actcggaacc tcaaactcca tgagacctcc cagggagcac cctcgggatt ctcgttgacg 120
ggctccgcag atccggatca gacgctcaag ctcaggttgg cgctcgtgca gggcaacgtc 180
gcagagctcg agcgacgcct ctacgatgtg tccacgccct cctcgcccaa ctacggaaag 240
cacttgtcga aatcggaggt ccagcagttg gtcgcacctg cgcaggactc gatcgacgcg 300
atcaacgcat ggttgaagga aaacggcatc tcggccaaga caacctcggc aacaggcgat 360
tggctctcgt tcgaagtgcc tgtgtcgaag gcaaacgagc tcttcgacgc cgatttctcc 420
gtgtacaaac accatgatac aggcatggag gtcgtccgca cattgtccta ctccattcct 480
gcggaactcc aggcccattt ggatctcgtc catcccaccg tcacattccc caaccccaaa 540
ggacaccctc ccgtgttcca ggcacccgca atgattacca acgatgtgca gaacttctcc 600
gcaggagcag tcccgtcgtc ctgttcctcg cgcatcactc ctgcgtgtct ccaggcattg 660
tataacattc cttccgatcc tgcgacccag ccttcgaaca agctcgcagt gactggctat 720
atcgaacagt acgccaacca ggacgacttg gccgtcttct tgaaggagta tcgagccgac 780
atgtcgtcga acacaacctt cactctccag actctcgatg gaggcgtgaa ctcccagacg 840
gacgaagcag gcatcgaagc caacctcgac gtgcagtaca ccgtgggcat cgcaacaggc 900
gtccccaccg tgttcatctc cgtgggcgat cagtatcagg acggtaacct cgagggattc 960
ctcgatgtcg tcaacttctt gttggacgaa gatactcctc cttatgtgat gacgacgtcc 1020
tacggccagg atgaacatac tatgtcccgg aaattggcac agaacttgtg taacgcctat 1080
gcccagttgg gagcacgagg cgtgtccatc ctcttcgcct ccggagacgg aggcgtcgca 1140
ggttcccgat cgtcgtcgtg ttcgaaattc gtccccacgt tcccgtccgg ctgtccttac 1200
atgacttccg tcggagcaac acagggcgtg cctgagactg cagccgactt ctcctcgggt 1260
ggtttctcga actatttcgg aattcccgac taccaggcat cggcagtgtc gggatacttg 1320
tcggccttgg gccacacgaa caagggcaag tacaacgcat cgggcagggg cttcccggat 1380
gtctcgacac agggcgtgaa cttcgaagtg atggtcgatg gtgcattgga aggagtgtcg 1440
ggtacttcgg cagcatcccc cacgttcgca gcggtcgtcg ccctcttgaa cgatcgactc 1500
attgcagcag gcaaatcccc cttgggattc ctcaacccct tcttgtattc caagggagtg 1560
tcggcattga acgacatcac atcgggttcc aaccctggct gtcggaccaa cggcttccct 1620
gcgaaagagg gctgggaccc ggtcactgga ttgggaacac cggacttcca gaaattggcc 1680
tcggcagcag gcctctaa 1698
<210> 29
<211> 2048
<212> DNA
<213> 洁丽香菇
<400> 29
atggttgcgc tctctaccgc ccttcttgcc tcacttgtgg ctctggcatg cgcgggtccc 60
gctcctcgca acctcgtcct gcacgagtcg cgcgatggag tccccgaagg cttcgtcaag 120
tcgagcaccg cgtctcctga cactacactc aagctgcgta ttgcccttgt tcagggtgat 180
atggccagcc ttgagaaggc actgtacgac gtcagcgtgc cttcaagccc gctctacggg 240
caacacctat cgaagcagga ggtatgccac atatgctcct gttctgaaga gttatgcagc 300
taattacttg ctgttaggtt gaggagtacg tgaagcccac gcaggagtcg gtagacgccg 360
taaaccagtg gctctcgtcc gaggggatta cggcgaacac catctcacct gccggcgact 420
ggctccaatt ttccgttcct gtcagcaagg cgaacgagat gtttgacgca gacttcagtg 480
tgttcaccca cactgagtct ggccagcaag ctatcaggac actctcctat tccattccca 540
aggagctcgt gggtcacctt gacctggtac accctaccat cacgtacgtt ccataatccc 600
aacctccttc ggactgaatg tatcactgac cctttcgttg tagtttcccc aacccgtact 660
cccacctgcc cgtggtctct tccccggcgc ccaggaacct cacgatcgat gcttctgttc 720
cctcatcctg tggctcgacg atcactccca cttgtctaca ggatctgtac ggcattccaa 780
ctactgccgc cacacagtca tccaacaagc tcgctgtctc tggtttcatt gatcagtatg 840
caaacaaagc tgacctcaag tccttcttga ccacgtaccg caaggacatt tcgtcttcga 900
cgacgtttac tctggagacc atcgatggtg gtgagaaccc ccaggacggg agcgatgctg 960
gtgtcgaagc tgtgagctgg ttttactttt gctctgtcaa atgaaatgcg attggtatga 1020
ctgactgacc gaatcataga accttgacac ccagtacact gtcggccttg ctaccggtgt 1080
cccgacctac ttcatctccg tcggagatga ctaccaggat ggtgaccttg aagggttctt 1140
ggacattgtc aactacctcc tcagcatgga ccagccgcag caagtcttga ccacctcgta 1200
cggccagaac gagaacacca tgtccagatc cttggcgaag tatgtagtaa agagattgtt 1260
accgggattc gcgactaaag attcgattgc agcaatcttt gtaatgctta catgcagctt 1320
ggcgctcgcg gcacctccat cctgtttgcc tctggtgacg gtggtgtctc tggctcacag 1380
tccggcagct gcggcagcaa gttcgtgccc acattcccct ctggatgccc ctagtaagac 1440
cttccccctc tcatcctcct ttcgattact aacatatcgt actcagcctg acctccgttg 1500
gtgcaacgac cggcatcaac ccggaggtcg cagcctcctt ctcctcgggc gggttcagca 1560
actactgggg tgtgccatcg taccagcagt ccgttgtttc ttcgtacatc agcggcctag 1620
gctcgacgaa caagggcaag tataacagct ccggccgtgg gttccccgat gtctccgcgc 1680
agggcgagaa cgtcgaaatt gtcgtcgacg gttcaactga gggggtagat ggaacgagct 1740
gctcgagccc catctttgcc agtatcgttt cgcttctgaa cgacgagctg attgcagccg 1800
ggaagagccc gcttgggttc ttgaacccct tcttgtactc tgatggcgcc tcggctttca 1860
atgatattac ttctggtgag cgtcgctgtt tgagagtgaa gtttatggat gctgatctac 1920
tttcgaaata cttaggtgac aatccaggct gcaacaccaa tggtttctct gcgaaatcag 1980
gctgggaccc cgtcaccggt cttggtactc ccaactacgc aaaactgagg accgctgtcg 2040
gcttctga 2048
<210> 30
<211> 565
<212> PRT
<213> 洁丽香菇
<400> 30
Met Val Ala Leu Ser Thr Ala Leu Leu Ala Ser Leu Val Ala Leu Ala
1 5 10 15
Cys Ala Gly Pro Ala Pro Arg Asn Leu Val Leu His Glu Ser Arg Asp
20 25 30
Gly Val Pro Glu Gly Phe Val Lys Ser Ser Thr Ala Ser Pro Asp Thr
35 40 45
Thr Leu Lys Leu Arg Ile Ala Leu Val Gln Gly Asp Met Ala Ser Leu
50 55 60
Glu Lys Ala Leu Tyr Asp Val Ser Val Pro Ser Ser Pro Leu Tyr Gly
65 70 75 80
Gln His Leu Ser Lys Gln Glu Val Glu Glu Tyr Val Lys Pro Thr Gln
85 90 95
Glu Ser Val Asp Ala Val Asn Gln Trp Leu Ser Ser Glu Gly Ile Thr
100 105 110
Ala Asn Thr Ile Ser Pro Ala Gly Asp Trp Leu Gln Phe Ser Val Pro
115 120 125
Val Ser Lys Ala Asn Glu Met Phe Asp Ala Asp Phe Ser Val Phe Thr
130 135 140
His Thr Glu Ser Gly Gln Gln Ala Ile Arg Thr Leu Ser Tyr Ser Ile
145 150 155 160
Pro Lys Glu Leu Val Gly His Leu Asp Leu Val His Pro Thr Ile Thr
165 170 175
Phe Pro Asn Pro Tyr Ser His Leu Pro Val Val Ser Ser Pro Ala Pro
180 185 190
Arg Asn Leu Thr Ile Asp Ala Ser Val Pro Ser Ser Cys Gly Ser Thr
195 200 205
Ile Thr Pro Thr Cys Leu Gln Asp Leu Tyr Gly Ile Pro Thr Thr Ala
210 215 220
Ala Thr Gln Ser Ser Asn Lys Leu Ala Val Ser Gly Phe Ile Asp Gln
225 230 235 240
Tyr Ala Asn Lys Ala Asp Leu Lys Ser Phe Leu Thr Thr Tyr Arg Lys
245 250 255
Asp Ile Ser Ser Ser Thr Thr Phe Thr Leu Glu Thr Ile Asp Gly Gly
260 265 270
Glu Asn Pro Gln Asp Gly Ser Asp Ala Gly Val Glu Ala Asn Leu Asp
275 280 285
Thr Gln Tyr Thr Val Gly Leu Ala Thr Gly Val Pro Thr Tyr Phe Ile
290 295 300
Ser Val Gly Asp Asp Tyr Gln Asp Gly Asp Leu Glu Gly Phe Leu Asp
305 310 315 320
Ile Val Asn Tyr Leu Leu Ser Met Asp Gln Pro Gln Gln Val Leu Thr
325 330 335
Thr Ser Tyr Gly Gln Asn Glu Asn Thr Met Ser Arg Ser Leu Ala Asn
340 345 350
Asn Leu Cys Asn Ala Tyr Met Gln Leu Gly Ala Arg Gly Thr Ser Ile
355 360 365
Leu Phe Ala Ser Gly Asp Gly Gly Val Ser Gly Ser Gln Ser Gly Ser
370 375 380
Cys Gly Ser Lys Phe Val Pro Thr Phe Pro Ser Gly Cys Pro Tyr Leu
385 390 395 400
Thr Ser Val Gly Ala Thr Thr Gly Ile Asn Pro Glu Val Ala Ala Ser
405 410 415
Phe Ser Ser Gly Gly Phe Ser Asn Tyr Trp Gly Val Pro Ser Tyr Gln
420 425 430
Gln Ser Val Val Ser Ser Tyr Ile Ser Gly Leu Gly Ser Thr Asn Lys
435 440 445
Gly Lys Tyr Asn Ser Ser Gly Arg Gly Phe Pro Asp Val Ser Ala Gln
450 455 460
Gly Glu Asn Val Glu Ile Val Val Asp Gly Ser Thr Glu Gly Val Asp
465 470 475 480
Gly Thr Ser Cys Ser Ser Pro Ile Phe Ala Ser Ile Val Ser Leu Leu
485 490 495
Asn Asp Glu Leu Ile Ala Ala Gly Lys Ser Pro Leu Gly Phe Leu Asn
500 505 510
Pro Phe Leu Tyr Ser Asp Gly Ala Ser Ala Phe Asn Asp Ile Thr Ser
515 520 525
Gly Asp Asn Pro Gly Cys Asn Thr Asn Gly Phe Ser Ala Lys Ser Gly
530 535 540
Trp Asp Pro Val Thr Gly Leu Gly Thr Pro Asn Tyr Ala Lys Leu Arg
545 550 555 560
Thr Ala Val Gly Phe
565
<210> 31
<211> 367
<212> PRT
<213> 洁丽香菇
<400> 31
Ala Ser Val Pro Ser Ser Cys Gly Ser Thr Ile Thr Pro Thr Cys Leu
1 5 10 15
Gln Asp Leu Tyr Gly Ile Pro Thr Thr Ala Ala Thr Gln Ser Ser Asn
20 25 30
Lys Leu Ala Val Ser Gly Phe Ile Asp Gln Tyr Ala Asn Lys Ala Asp
35 40 45
Leu Lys Ser Phe Leu Thr Thr Tyr Arg Lys Asp Ile Ser Ser Ser Thr
50 55 60
Thr Phe Thr Leu Glu Thr Ile Asp Gly Gly Glu Asn Pro Gln Asp Gly
65 70 75 80
Ser Asp Ala Gly Val Glu Ala Asn Leu Asp Thr Gln Tyr Thr Val Gly
85 90 95
Leu Ala Thr Gly Val Pro Thr Tyr Phe Ile Ser Val Gly Asp Asp Tyr
100 105 110
Gln Asp Gly Asp Leu Glu Gly Phe Leu Asp Ile Val Asn Tyr Leu Leu
115 120 125
Ser Met Asp Gln Pro Gln Gln Val Leu Thr Thr Ser Tyr Gly Gln Asn
130 135 140
Glu Asn Thr Met Ser Arg Ser Leu Ala Asn Asn Leu Cys Asn Ala Tyr
145 150 155 160
Met Gln Leu Gly Ala Arg Gly Thr Ser Ile Leu Phe Ala Ser Gly Asp
165 170 175
Gly Gly Val Ser Gly Ser Gln Ser Gly Ser Cys Gly Ser Lys Phe Val
180 185 190
Pro Thr Phe Pro Ser Gly Cys Pro Tyr Leu Thr Ser Val Gly Ala Thr
195 200 205
Thr Gly Ile Asn Pro Glu Val Ala Ala Ser Phe Ser Ser Gly Gly Phe
210 215 220
Ser Asn Tyr Trp Gly Val Pro Ser Tyr Gln Gln Ser Val Val Ser Ser
225 230 235 240
Tyr Ile Ser Gly Leu Gly Ser Thr Asn Lys Gly Lys Tyr Asn Ser Ser
245 250 255
Gly Arg Gly Phe Pro Asp Val Ser Ala Gln Gly Glu Asn Val Glu Ile
260 265 270
Val Val Asp Gly Ser Thr Glu Gly Val Asp Gly Thr Ser Cys Ser Ser
275 280 285
Pro Ile Phe Ala Ser Ile Val Ser Leu Leu Asn Asp Glu Leu Ile Ala
290 295 300
Ala Gly Lys Ser Pro Leu Gly Phe Leu Asn Pro Phe Leu Tyr Ser Asp
305 310 315 320
Gly Ala Ser Ala Phe Asn Asp Ile Thr Ser Gly Asp Asn Pro Gly Cys
325 330 335
Asn Thr Asn Gly Phe Ser Ala Lys Ser Gly Trp Asp Pro Val Thr Gly
340 345 350
Leu Gly Thr Pro Asn Tyr Ala Lys Leu Arg Thr Ala Val Gly Phe
355 360 365
<210> 32
<211> 1698
<212> DNA
<213> 洁丽香菇
<400> 32
atggtggccc tctcgacagc cttgttggca tcgctcgtcg cactcgcatg tgcaggccct 60
gcacctcgaa acttggtcct ccatgaatcc agggatggcg tccctgaagg tttcgtgaag 120
tcctccacgg cctcccctga taccacattg aaattgagga tcgcgctcgt ccagggagat 180
atggcgtccc tcgaaaaggc gctctatgac gtgtcggtcc cgtcctcgcc tctctatggc 240
cagcacctct cgaagcagga ggtcgaagag tacgtcaagc ctactcagga atccgtcgac 300
gccgtgaacc agtggctctc ctccgaaggc attacagcga acactatttc gcctgcagga 360
gactggctcc agttctcggt gcccgtctcg aaggcgaacg agatgttcga cgccgacttc 420
tccgtcttca cccacaccga gtcgggacag caggccatcc ggacattgtc gtattccatt 480
cctaaggagc tcgtcggtca tctcgacttg gtccatccta ctatcacttt ccccaacccg 540
tactcgcatc tccctgtcgt ctcgtcccct gcccctagga acttgacgat tgatgcgtcc 600
gtgccttcct cgtgtggatc gactatcaca cctacgtgtt tgcaggatct ctacggtatc 660
ccgactacag cagccactca gtcctccaac aagttggccg tgtcgggctt catcgatcag 720
tacgccaaca aggcagactt gaaatccttc ctcacaacct accggaagga tatctcctcc 780
tccacaacct tcaccctcga gaccatcgat ggtggcgaaa acccgcagga tggctcggat 840
gcaggcgtcg aagccaactt ggatacacag tacaccgtgg gtttggcaac tggcgtcccc 900
acctatttca tctcggtcgg tgatgactac caggatggcg acctcgaagg tttcctcgat 960
attgtcaact acttgttgtc catggaccag ccccagcagg tcctcacgac gtcgtatggt 1020
cagaacgaaa acacaatgtc gcggtcgttg gcgaacaacc tctgtaacgc atacatgcag 1080
ctcggagcac gaggcacctc catcctcttc gcgtccggag atggaggcgt ctcgggctcc 1140
cagtccggct cctgtggttc gaaattcgtc cccacattcc cctccggatg tccttacttg 1200
acatcggtcg gtgcaacaac cggcatcaac ccggaggtgg cagcatcgtt ctcgtccggt 1260
ggcttctcca actattgggg tgtgccctcc tatcagcagt cggtggtctc gtcgtacatc 1320
tccggactcg gctccaccaa caagggcaaa tacaactcct cgggcagggg cttcccggat 1380
gtgtccgcac agggcgaaaa cgtcgagatc gtggtcgacg gctccacaga gggcgtggac 1440
ggcacgtcgt gttcgtcccc catcttcgca tccatcgtct cgctcctcaa cgacgagctc 1500
attgcggcag gcaaatcccc gttgggcttc ttgaacccgt tcctctactc cgatggcgca 1560
tcggcattca acgacatcac ttcgggagat aaccctggat gtaacaccaa cggattctcc 1620
gccaagtcgg gctgggaccc ggtgacaggt ctcggcactc ccaactacgc caagctcagg 1680
actgccgtcg gcttctaa 1698
<210> 33
<211> 2317
<212> DNA
<213> 芽孢杆菌属物种-19138
<400> 33
aagcacagcg catgtgatta aaccaaagaa atcaagatta aatatgaaaa acagcaactc 60
tattgatttt cacactcaga tcaagtataa ttccgacaag agaatacacg aaagattcag 120
cctaaacaga aaatatatac tccgcaatct tttgtggatc cgaaatttgc aagttccaga 180
aaaaaaggag gcttttcaaa atgaaaaaat taagtaaaaa attgcttgcc gtagctgcgg 240
caggtacgct gttgcttgca accgtgccaa gcattgcctt tgcagacact gcgcaagaaa 300
tcccccaagg cgtaggttcc ggtgtgctgt ccaacgtcga ctatttcggt ggtctcgatc 360
caagcactgt ggtaacggtt gatatcgtca tgaaaatcca aaacaaatac gacttggcca 420
actacatcaa ggaaacgacc tctccgggta gcaacaccta ccataaatac ctgacaccga 480
cgcaattcaa agccaaatac gcaccttctc cagcgagcgt caatgcgatt actcactatc 540
tctcgtccta tggcatcacg tcttccgttt acccggacaa cctgatcatc acagcgaccg 600
gcaccgtcgg tcaattcaac aacgcgttca acgtcaccat tgaacgtgcc caatacaaag 660
gcaagagctt ccatgcatcc aaaaccaacc ctaaagcacc ggctgccatc gccgactcca 720
tcctgtgcat tttgggcatc agcaactact ccaacttcac ttcgcacatt gcgaaacagc 780
agccgctcga cagcagccaa tccacagcga acgtcacgcc gaacccgacc ggccgcatga 840
ccaacgactt ggtgtcccgt tacaacgtac aacccttgta caccaaagga gccaacggtt 900
ccggtcaaac gatcggcatc gtgacgctgg ctgatttcaa cccgagtgat gcctactcgt 960
actggcagta caacaacatc aacgtcaacc cgaaccgcat caccaaaatc aacgtggacg 1020
gtggttccgg cctgagtgaa gatgccggtt cagacgaaac atcgctcgac gtggaacaat 1080
ccggagctct ggcaccgggc gcaaacctca atgtctatgt cggcccgaac accgatacag 1140
ggtttgtgga tgcgtacgca aaagcgatca acgacaacgt cgcacaccag atctccgcaa 1200
gctggggcga atccgaatcg ctgattaatt actacgtcca acagcaaatg gaaacacctg 1260
agtatgcgga aacattcaac caactcttca tgcaagcagc ggcacaggga acttcgatgt 1320
tcgcgtcggc tggtgactcc ggtgcctatg atgcttccgg tgacctcaac acgtacgatc 1380
tctccgtcga caatccggct gacagcccgt acatcacggc ggccggcggc accaccgtgc 1440
cgtttaccta tacgtcgacg caatacaacc tgtcgattac cgtaccgcaa gaacgcgcat 1500
ggggctggga ttatctctac ccgctgtttg acgcacgcgg cttgaacaac ccgaccggct 1560
gggcacaacg ttactttgtc ggcggcggcg gcggtttcag ccaactcttc gcaacacctg 1620
actaccaaac cggcgtatcc ggcgtgaaca gctacaccgc tgtccaccaa tggactccga 1680
gttccgactt cacctcggtc actcgtgacg cacaaccgac catcgtcacc ggcacaggca 1740
ccggccgtaa cctgcctgac ctgtcgatga acgccgaccc gtacaccggc tactccgtgt 1800
acttcaactt gccgaccacg aacggtgcga cgacagtaga ctccggctgg gcaacgtacg 1860
gcggtacttc ctttgtagca ccgcaattgg caggtctcag cgcgttgatc aacagtgcaa 1920
acggcagcga agcaggcttc tggaaccctc agctctaccg ttttgcacaa agcaatcact 1980
cgccgttgca cccgctcaac accgcaggcg catccaacga caacgtcttc tattccggca 2040
ctccgggcgc catctacaac caagcaaccg gtcttggcac gcccgacgtg acggcacttg 2100
cacaagcgtt tggcaaataa gttcttttgc tcccccttac acaaaccaaa gaccactcga 2160
ctcccgagtg gtctttggtt tgatgctcag cgactgtagt tcacgttgat tctgccattc 2220
ttgctgatca agcggatggg aatttctccc gttcccacca ctataagtca actggttttg 2280
caacccggat gtgacaactg gcaacacatc tccgcga 2317
<210> 34
<211> 639
<212> PRT
<213> 芽孢杆菌属物种19138
<400> 34
Met Lys Lys Leu Ser Lys Lys Leu Leu Ala Val Ala Ala Ala Gly Thr
1 5 10 15
Leu Leu Leu Ala Thr Val Pro Ser Ile Ala Phe Ala Asp Thr Ala Gln
20 25 30
Glu Ile Pro Gln Gly Val Gly Ser Gly Val Leu Ser Asn Val Asp Tyr
35 40 45
Phe Gly Gly Leu Asp Pro Ser Thr Val Val Thr Val Asp Ile Val Met
50 55 60
Lys Ile Gln Asn Lys Tyr Asp Leu Ala Asn Tyr Ile Lys Glu Thr Thr
65 70 75 80
Ser Pro Gly Ser Asn Thr Tyr His Lys Tyr Leu Thr Pro Thr Gln Phe
85 90 95
Lys Ala Lys Tyr Ala Pro Ser Pro Ala Ser Val Asn Ala Ile Thr His
100 105 110
Tyr Leu Ser Ser Tyr Gly Ile Thr Ser Ser Val Tyr Pro Asp Asn Leu
115 120 125
Ile Ile Thr Ala Thr Gly Thr Val Gly Gln Phe Asn Asn Ala Phe Asn
130 135 140
Val Thr Ile Glu Arg Ala Gln Tyr Lys Gly Lys Ser Phe His Ala Ser
145 150 155 160
Lys Thr Asn Pro Lys Ala Pro Ala Ala Ile Ala Asp Ser Ile Leu Cys
165 170 175
Ile Leu Gly Ile Ser Asn Tyr Ser Asn Phe Thr Ser His Ile Ala Lys
180 185 190
Gln Gln Pro Leu Asp Ser Ser Gln Ser Thr Ala Asn Val Thr Pro Asn
195 200 205
Pro Thr Gly Arg Met Thr Asn Asp Leu Val Ser Arg Tyr Asn Val Gln
210 215 220
Pro Leu Tyr Thr Lys Gly Ala Asn Gly Ser Gly Gln Thr Ile Gly Ile
225 230 235 240
Val Thr Leu Ala Asp Phe Asn Pro Ser Asp Ala Tyr Ser Tyr Trp Gln
245 250 255
Tyr Asn Asn Ile Asn Val Asn Pro Asn Arg Ile Thr Lys Ile Asn Val
260 265 270
Asp Gly Gly Ser Gly Leu Ser Glu Asp Ala Gly Ser Asp Glu Thr Ser
275 280 285
Leu Asp Val Glu Gln Ser Gly Ala Leu Ala Pro Gly Ala Asn Leu Asn
290 295 300
Val Tyr Val Gly Pro Asn Thr Asp Thr Gly Phe Val Asp Ala Tyr Ala
305 310 315 320
Lys Ala Ile Asn Asp Asn Val Ala His Gln Ile Ser Ala Ser Trp Gly
325 330 335
Glu Ser Glu Ser Leu Ile Asn Tyr Tyr Val Gln Gln Gln Met Glu Thr
340 345 350
Pro Glu Tyr Ala Glu Thr Phe Asn Gln Leu Phe Met Gln Ala Ala Ala
355 360 365
Gln Gly Thr Ser Met Phe Ala Ser Ala Gly Asp Ser Gly Ala Tyr Asp
370 375 380
Ala Ser Gly Asp Leu Asn Thr Tyr Asp Leu Ser Val Asp Asn Pro Ala
385 390 395 400
Asp Ser Pro Tyr Ile Thr Ala Ala Gly Gly Thr Thr Val Pro Phe Thr
405 410 415
Tyr Thr Ser Thr Gln Tyr Asn Leu Ser Ile Thr Val Pro Gln Glu Arg
420 425 430
Ala Trp Gly Trp Asp Tyr Leu Tyr Pro Leu Phe Asp Ala Arg Gly Leu
435 440 445
Asn Asn Pro Thr Gly Trp Ala Gln Arg Tyr Phe Val Gly Gly Gly Gly
450 455 460
Gly Phe Ser Gln Leu Phe Ala Thr Pro Asp Tyr Gln Thr Gly Val Ser
465 470 475 480
Gly Val Asn Ser Tyr Thr Ala Val His Gln Trp Thr Pro Ser Ser Asp
485 490 495
Phe Thr Ser Val Thr Arg Asp Ala Gln Pro Thr Ile Val Thr Gly Thr
500 505 510
Gly Thr Gly Arg Asn Leu Pro Asp Leu Ser Met Asn Ala Asp Pro Tyr
515 520 525
Thr Gly Tyr Ser Val Tyr Phe Asn Leu Pro Thr Thr Asn Gly Ala Thr
530 535 540
Thr Val Asp Ser Gly Trp Ala Thr Tyr Gly Gly Thr Ser Phe Val Ala
545 550 555 560
Pro Gln Leu Ala Gly Leu Ser Ala Leu Ile Asn Ser Ala Asn Gly Ser
565 570 575
Glu Ala Gly Phe Trp Asn Pro Gln Leu Tyr Arg Phe Ala Gln Ser Asn
580 585 590
His Ser Pro Leu His Pro Leu Asn Thr Ala Gly Ala Ser Asn Asp Asn
595 600 605
Val Phe Tyr Ser Gly Thr Pro Gly Ala Ile Tyr Asn Gln Ala Thr Gly
610 615 620
Leu Gly Thr Pro Asp Val Thr Ala Leu Ala Gln Ala Phe Gly Lys
625 630 635
<210> 35
<211> 431
<212> PRT
<213> 芽孢杆菌属物种19138
<400> 35
Pro Thr Gly Arg Met Thr Asn Asp Leu Val Ser Arg Tyr Asn Val Gln
1 5 10 15
Pro Leu Tyr Thr Lys Gly Ala Asn Gly Ser Gly Gln Thr Ile Gly Ile
20 25 30
Val Thr Leu Ala Asp Phe Asn Pro Ser Asp Ala Tyr Ser Tyr Trp Gln
35 40 45
Tyr Asn Asn Ile Asn Val Asn Pro Asn Arg Ile Thr Lys Ile Asn Val
50 55 60
Asp Gly Gly Ser Gly Leu Ser Glu Asp Ala Gly Ser Asp Glu Thr Ser
65 70 75 80
Leu Asp Val Glu Gln Ser Gly Ala Leu Ala Pro Gly Ala Asn Leu Asn
85 90 95
Val Tyr Val Gly Pro Asn Thr Asp Thr Gly Phe Val Asp Ala Tyr Ala
100 105 110
Lys Ala Ile Asn Asp Asn Val Ala His Gln Ile Ser Ala Ser Trp Gly
115 120 125
Glu Ser Glu Ser Leu Ile Asn Tyr Tyr Val Gln Gln Gln Met Glu Thr
130 135 140
Pro Glu Tyr Ala Glu Thr Phe Asn Gln Leu Phe Met Gln Ala Ala Ala
145 150 155 160
Gln Gly Thr Ser Met Phe Ala Ser Ala Gly Asp Ser Gly Ala Tyr Asp
165 170 175
Ala Ser Gly Asp Leu Asn Thr Tyr Asp Leu Ser Val Asp Asn Pro Ala
180 185 190
Asp Ser Pro Tyr Ile Thr Ala Ala Gly Gly Thr Thr Val Pro Phe Thr
195 200 205
Tyr Thr Ser Thr Gln Tyr Asn Leu Ser Ile Thr Val Pro Gln Glu Arg
210 215 220
Ala Trp Gly Trp Asp Tyr Leu Tyr Pro Leu Phe Asp Ala Arg Gly Leu
225 230 235 240
Asn Asn Pro Thr Gly Trp Ala Gln Arg Tyr Phe Val Gly Gly Gly Gly
245 250 255
Gly Phe Ser Gln Leu Phe Ala Thr Pro Asp Tyr Gln Thr Gly Val Ser
260 265 270
Gly Val Asn Ser Tyr Thr Ala Val His Gln Trp Thr Pro Ser Ser Asp
275 280 285
Phe Thr Ser Val Thr Arg Asp Ala Gln Pro Thr Ile Val Thr Gly Thr
290 295 300
Gly Thr Gly Arg Asn Leu Pro Asp Leu Ser Met Asn Ala Asp Pro Tyr
305 310 315 320
Thr Gly Tyr Ser Val Tyr Phe Asn Leu Pro Thr Thr Asn Gly Ala Thr
325 330 335
Thr Val Asp Ser Gly Trp Ala Thr Tyr Gly Gly Thr Ser Phe Val Ala
340 345 350
Pro Gln Leu Ala Gly Leu Ser Ala Leu Ile Asn Ser Ala Asn Gly Ser
355 360 365
Glu Ala Gly Phe Trp Asn Pro Gln Leu Tyr Arg Phe Ala Gln Ser Asn
370 375 380
His Ser Pro Leu His Pro Leu Asn Thr Ala Gly Ala Ser Asn Asp Asn
385 390 395 400
Val Phe Tyr Ser Gly Thr Pro Gly Ala Ile Tyr Asn Gln Ala Thr Gly
405 410 415
Leu Gly Thr Pro Asp Val Thr Ala Leu Ala Gln Ala Phe Gly Lys
420 425 430
<210> 36
<211> 177
<212> PRT
<213> 嗜热子囊菌
<400> 36
Thr Arg Ile Ser Ser Cys Ser Gly Ser Arg Gln Ser Ala Leu Thr Thr
1 5 10 15
Ala Leu Arg Asn Ala Ala Ser Leu Ala Asn Ala Ala Ala Asp Ala Ala
20 25 30
Gln Ser Gly Ser Ala Ser Lys Phe Ser Glu Tyr Phe Lys Thr Thr Ser
35 40 45
Ser Ser Thr Arg Gln Thr Val Ala Ala Arg Leu Arg Ala Val Ala Arg
50 55 60
Glu Ala Ser Ser Ser Ser Ser Gly Ala Thr Thr Tyr Tyr Cys Asp Asp
65 70 75 80
Pro Tyr Gly Tyr Cys Ser Ser Asn Val Leu Ala Tyr Thr Leu Pro Ser
85 90 95
Tyr Asn Ile Ile Ala Asn Cys Asp Ile Phe Tyr Thr Tyr Leu Pro Ala
100 105 110
Leu Thr Ser Thr Cys His Ala Gln Asp Gln Ala Thr Thr Ala Leu His
115 120 125
Glu Phe Thr His Ala Pro Gly Val Tyr Ser Pro Gly Thr Asp Asp Leu
130 135 140
Ala Tyr Gly Tyr Gln Ala Ala Met Gly Leu Ser Ser Ser Gln Ala Val
145 150 155 160
Met Asn Ala Asp Thr Tyr Ala Leu Tyr Ala Asn Ala Ile Tyr Leu Gly
165 170 175
Cys
<210> 37
<211> 412
<212> PRT
<213> 强烈火球菌
<400> 37
Ala Glu Leu Glu Gly Leu Asp Glu Ser Ala Ala Gln Val Met Ala Thr
1 5 10 15
Tyr Val Trp Asn Leu Gly Tyr Asp Gly Ser Gly Ile Thr Ile Gly Ile
20 25 30
Ile Asp Thr Gly Ile Asp Ala Ser His Pro Asp Leu Gln Gly Lys Val
35 40 45
Ile Gly Trp Val Asp Phe Val Asn Gly Arg Ser Tyr Pro Tyr Asp Asp
50 55 60
His Gly His Gly Thr His Val Ala Ser Ile Ala Ala Gly Thr Gly Ala
65 70 75 80
Ala Ser Asn Gly Lys Tyr Lys Gly Met Ala Pro Gly Ala Lys Leu Ala
85 90 95
Gly Ile Lys Val Leu Gly Ala Asp Gly Ser Gly Ser Ile Ser Thr Ile
100 105 110
Ile Lys Gly Val Glu Trp Ala Val Asp Asn Lys Asp Lys Tyr Gly Ile
115 120 125
Lys Val Ile Asn Leu Ser Leu Gly Ser Ser Gln Ser Ser Asp Gly Thr
130 135 140
Asp Ala Leu Ser Gln Ala Val Asn Ala Ala Trp Asp Ala Gly Leu Val
145 150 155 160
Val Val Val Ala Ala Gly Asn Ser Gly Pro Asn Lys Tyr Thr Ile Gly
165 170 175
Ser Pro Ala Ala Ala Ser Lys Val Ile Thr Val Gly Ala Val Asp Lys
180 185 190
Tyr Asp Val Ile Thr Ser Phe Ser Ser Arg Gly Pro Thr Ala Asp Gly
195 200 205
Arg Leu Lys Pro Glu Val Val Ala Pro Gly Asn Trp Ile Ile Ala Ala
210 215 220
Arg Ala Ser Gly Thr Ser Met Gly Gln Pro Ile Asn Asp Tyr Tyr Thr
225 230 235 240
Ala Ala Pro Gly Thr Ser Met Ala Thr Pro His Val Ala Gly Ile Ala
245 250 255
Ala Leu Leu Leu Gln Ala His Pro Ser Trp Thr Pro Asp Lys Val Lys
260 265 270
Thr Ala Leu Ile Glu Thr Ala Asp Ile Val Lys Pro Asp Glu Ile Ala
275 280 285
Asp Ile Ala Tyr Gly Ala Gly Arg Val Asn Ala Tyr Lys Ala Ile Asn
290 295 300
Tyr Asp Asn Tyr Ala Lys Leu Val Phe Thr Gly Tyr Val Ala Asn Lys
305 310 315 320
Gly Ser Gln Thr His Gln Phe Val Ile Ser Gly Ala Ser Phe Val Thr
325 330 335
Ala Thr Leu Tyr Trp Asp Asn Ala Asn Ser Asp Leu Asp Leu Tyr Leu
340 345 350
Tyr Asp Pro Asn Gly Asn Gln Val Asp Tyr Ser Tyr Thr Ala Tyr Tyr
355 360 365
Asp Phe Glu Lys Val Gly Tyr Tyr Asn Pro Thr Asp Gly Thr Trp Thr
370 375 380
Ile Lys Val Val Ser Tyr Ser Gly Ser Ala Asn Tyr Gln Val Asp Val
385 390 395 400
Val Ser Asp Gly Ser Leu Ser Gln Pro Gly Ser Ser
405 410
<210> 38
<211> 560
<212> PRT
<213> 蜡蚧菌属物种WMM742
<400> 38
Met Val Ser Phe Ser Lys Ile Cys Phe Ala Ala Val Ser Ala Gly Ser
1 5 10 15
Val Leu Ala Ala Pro Ala Pro His Gly Pro Leu Val Lys Phe Gly Glu
20 25 30
Ile Thr Lys Leu Pro Ser Lys Trp Ile Ala Thr Gly Ala Ala Asp Ser
35 40 45
Asp Ala Val Ile Lys Ala Gln Ile Gly Ile Lys Gln Asn Asn Ile Lys
50 55 60
Gly Leu Gln Asp Lys Leu Ala Asp Ile Ala Asp Pro Asn Ser Pro Asn
65 70 75 80
Tyr Gly Gln Trp Leu Ser Lys Glu Glu Val Asp Lys Tyr Ser Ala Pro
85 90 95
Ala Ala Ala Asp Val Ala Ala Val Lys Ala Trp Leu Ala Ser Ser Gly
100 105 110
Ile Thr Asp Val Thr Met Pro Thr Asn Asp Trp Ile Glu Phe Ser Val
115 120 125
Pro Val Ser Lys Met Glu Ser Leu Leu Gly Ser Lys Tyr Glu Trp Phe
130 135 140
Val His Leu Glu Thr Gly Glu Lys Val Pro Arg Thr Lys Gln Phe Ser
145 150 155 160
Val Pro Gln Asn Leu His Asp Leu Ile Asp Val Val Thr Pro Thr Thr
165 170 175
Val Leu Tyr His Asn Met Gly Pro His Ala His Ala Ser Pro Gln Ala
180 185 190
Ala Asp Ala Ser Gly Leu Thr Ser Pro Ala Ser Ile Lys Ser Ala Tyr
195 200 205
Asn Val Asp Tyr Lys Gly Thr Gly Asn Thr Leu Val Gly Thr Thr Gly
210 215 220
Phe Leu Gly Val Gly Ala Ser His Gln Asp Tyr Ala Asn Phe Ala Arg
225 230 235 240
Gln Phe Ser Pro Gly Leu Thr Asp Phe Lys Asp Val Ser Ile Asn Gly
245 250 255
Gly Ser Asn Ser Gly Asp Gly Ser Ala Leu Glu Gly Asn Leu Asp Thr
260 265 270
Gln Tyr Cys Gly Ala Leu Ala Ala Pro Asn Pro Ser Glu Tyr Leu Ala
275 280 285
His Ala Pro Glu Gly Ser Asp Gly Ser Ser Phe Asn Asp Ala Met Leu
290 295 300
Ala Phe Gly Asn Tyr Leu Asn Ala Asn Ser Asn Pro Pro Ser Ala Val
305 310 315 320
Ser Thr Ser Tyr Gly Gly Glu Glu Asp Gly Thr Asp Pro Asn Tyr Met
325 330 335
Asp Arg Ile Cys Asn Glu Phe Met Lys Ala Gly Ser Arg Gly Val Ser
340 345 350
Ile Phe Phe Ser Ser Gly Asp Asn Gly Val Gly Gly Asn Gly Glu Ser
355 360 365
Ser Cys Tyr Asn Gly Tyr Tyr Pro Leu Trp Pro Ala Ser Cys Pro Tyr
370 375 380
Val Thr Thr Val Gly Gly Thr Glu Phe Asp Gly Ser Gly Arg Glu Val
385 390 395 400
Val Ala Asn Phe Glu Gln Tyr Asn Lys Asn Val Lys Ser Pro Gly Gly
405 410 415
Gly Phe Ser Asn His Phe Pro Ala Pro Ser Tyr Asn Lys Asn Val Thr
420 425 430
Thr Ala Tyr Ala Asn Ser Leu Ser Ala Ala Gln Lys Gln Arg Leu Asn
435 440 445
Pro Asn Gly Arg Gly Phe Pro Asp Ile Ala Leu Val Ser Val Lys Tyr
450 455 460
Gln Val Asn Val Asn Gly Gln Ile Ser Gln Val Leu Gly Thr Ser Ala
465 470 475 480
Ser Ser Pro Ser Met Ala Gly Leu Val Gly Leu Leu Asn Asp Tyr Arg
485 490 495
Lys Thr Gln Gly Lys Pro Asn Leu Gly Phe Ile Asn Pro Leu Leu Tyr
500 505 510
Ser Asp Lys Val Lys Pro Ala Leu Arg Asp Val Thr Ser Gly Ala Asn
515 520 525
Lys Gly Cys Asp Ser Ser Gly Leu Pro Ala Lys Thr Gly Trp Asp Ala
530 535 540
Ala Ser Gly Leu Gly Ser Phe Asp Phe Ala Lys Leu Arg Thr Leu Val
545 550 555 560
<210> 39
<211> 649
<212> PRT
<213> 解蛋白篮状菌
<400> 39
Met Lys Ser Ser Val Leu Leu Leu Ser Leu Ala Ala Ser Ala Leu Ala
1 5 10 15
Val Pro Ala Pro Ser Lys Arg His Val Val His Glu Arg Arg Asp Ala
20 25 30
Leu Pro His Ser Trp Ser Glu Pro Arg Arg Val Asp Gly Arg Thr Gln
35 40 45
Leu Pro Val Arg Ile Gly Leu Thr Gln Ser Asn Ile Asp Glu Ser His
50 55 60
Asp Met Leu Met Asp Ile Ala Ser Pro Ser Ser Pro Asn Tyr Arg Lys
65 70 75 80
Tyr Met Thr Val His Glu Val Asn Glu Leu Phe Ala Pro Ala Gly Glu
85 90 95
Ala Val Ser Ala Val Arg Asp Trp Leu Glu Ser Ala Gly Ile Ala Ala
100 105 110
Glu Arg Val Thr Gln Ser Ala Asn Lys Gln Trp Leu Gln Phe Asp Gly
115 120 125
Asp Ala Ala Glu Val Glu Ser Leu Leu Gly Ala Glu Tyr Tyr Ile Tyr
130 135 140
Thr His Asp Thr Asn Gly Arg Ser His Met Gly Cys Glu Lys Tyr His
145 150 155 160
Val Pro Glu His Ile Ser His His Ile Asp Tyr Ile Ile Pro Gly Val
165 170 175
Lys Ser Leu Glu Val Arg Glu Pro Gln Pro Ala Glu Leu Glu Lys Arg
180 185 190
Thr Phe Gly Phe Arg Lys Pro Gln Pro Pro Leu Phe Lys Ala Leu Pro
195 200 205
Glu Ser Leu Glu Thr Ile Ile Asn Ser Ile Leu Gly Gly Leu Leu Asp
210 215 220
Leu Cys Ser Thr Val Ile Thr Pro Ser Cys Ile Lys Thr Leu Tyr Asn
225 230 235 240
Ile Thr Glu Gly Thr Thr Ala Thr Lys Gly Asn Glu Leu Gly Ile Phe
245 250 255
Glu Asp Leu Gly Asp Tyr Tyr Ser Gln Thr Asp Leu Asp Leu Phe Phe
260 265 270
Thr Leu Phe Tyr Ser Gln Ile Pro Ala Gly Thr Gly Pro Thr Leu Lys
275 280 285
Gly Ile Asp Gly Ala Gln Ala Pro Thr Gln Thr Leu Thr Gln Ala Gly
290 295 300
Pro Glu Ser Asp Leu Asp Phe Gln Val Ser Tyr Pro Ile Ile Trp Pro
305 310 315 320
Gln Asn Ser Ile Leu Phe Gln Thr Asp Asp Ala Asn Tyr Glu Ala Asn
325 330 335
Tyr Thr Phe Asn Gly Phe Leu Asn Asn Phe Leu Asp Ala Ile Asp Gly
340 345 350
Ser Tyr Cys Thr Tyr Ser Ala Phe Gly Ile Asp Gly Asn Thr Ala Asp
355 360 365
Asp Pro Pro Tyr Pro Asp Pro Ala Ser Asn Gly Tyr Lys Gly Ser Leu
370 375 380
Gln Cys Gly Val Tyr Glu Pro Thr Asn Val Ile Ser Ile Ser Tyr Gly
385 390 395 400
Gly Asp Glu Ala Gly Leu Ser Val Asn Tyr Gln Lys Arg Gln Cys Asn
405 410 415
Glu Tyr Lys Lys Leu Gly Leu Gln Gly Val Ser Val Val Val Ser Ser
420 425 430
Gly Asp Ser Gly Val Ala Gly Ala Asp Gly Cys Leu Gly Gly Gly Lys
435 440 445
Ile Phe Asn Pro Asp Phe Pro Ala Gly Cys Pro Tyr Ile Thr Thr Val
450 455 460
Gly Ala Thr Tyr Leu Pro Ser Gly Ala Ser Ser Thr Ser Asp Ser Glu
465 470 475 480
Val Ala Val Ser Arg Phe Pro Ser Gly Gly Gly Phe Ser Asn Ile Tyr
485 490 495
Ser Gln Pro Ser Tyr Gln Ser Asp Ala Val Asn Thr Tyr Leu Thr Gln
500 505 510
His Thr Pro Pro Tyr Pro Ala Tyr Glu Thr Ser Asp Asn Ser Ser Val
515 520 525
Gly Ala Asn Gly Gly Ile Tyr Asn Lys Ala Gly Arg Gly Tyr Pro Asp
530 535 540
Val Ala Ala Val Gly Asp Asn Ile Val Ile Phe Asn Ala Gly Ala Pro
545 550 555 560
Thr Leu Ile Gly Gly Thr Ser Ala Ser Ala Pro Ile Phe Ala Ser Ile
565 570 575
Leu Thr Arg Ile Asn Glu Val Leu Leu Ala Lys Lys Gly Thr Thr Val
580 585 590
Gly Phe Val Asn Pro Thr Leu Tyr Ala Asn Pro Asp Ala Phe His Asp
595 600 605
Ile Thr Ser Gly Asp Asn Pro Gly Cys Ser Thr Asn Gly Phe Ser Thr
610 615 620
Ala Pro Gly Trp Asp Pro Val Thr Gly Leu Gly Thr Pro Asn Tyr Pro
625 630 635 640
Ala Leu Leu Lys Val Phe Leu Gly Glu
645

Claims (31)

1.一种用于从含淀粉材料产生发酵产物的方法,该方法包括使用产碳水化合物源的酶和发酵生物体,在低于所述含淀粉材料的初始糊化温度的温度处,在属于S53家族的丝氨酸蛋白酶的存在下将含淀粉材料同时糖化和发酵。
2.一种用于从含淀粉材料产生发酵产物的方法,该方法包括以下步骤:
(a)在α-淀粉酶存在下使含淀粉材料液化;
(b)使用产碳水化合物源的酶来使步骤(a)中获得的液化材料糖化;
(c)使用发酵生物体体进行发酵;
其中属于家族53的丝氨酸蛋白酶在步骤b)和/或c)期间存在。
3.如权利要求1或2所述的方法,其中该S53蛋白酶源自以下属的菌株:亚灰树花菌属、栓菌属、叉丝孔菌属、多孔菌属、革褶菌属、灵芝属、香菇属、蜡蚧菌属、篮状菌属或芽孢杆菌属,更具体是大型亚灰树花菌、变色栓菌、污叉丝孔菌、漏斗多孔菌、桦革褶菌、灵芝、洁丽香菇、蜡蚧菌属物种WMM742、解蛋白篮状菌或芽孢杆菌属物种19138。
4.如权利要求1或2所述的方法,其中该S53蛋白酶是具有丝氨酸蛋白酶活性的多肽,该多肽选自下组,该组由以下组成:
(a)多肽,该多肽与SEQ ID NO:3的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;
(b)由多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:1的成熟多肽编码序列具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
5.如权利要求1或2所述的方法,其中该S53蛋白酶是具有丝氨酸蛋白酶活性的多肽,该多肽选自下组,该组由以下组成:
(a)多肽,该多肽与SEQ ID NO:6的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;
(b)由多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:4的成熟多肽编码序列具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
6.如权利要求1或2所述的方法,其中该S53蛋白酶是具有丝氨酸蛋白酶活性的多肽,该多肽选自下组,该组由以下组成:
(a)多肽,该多肽与SEQ ID NO:9的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;
(b)由多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:7的成熟多肽编码序列具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
7.如权利要求1或2所述的方法,其中该S53蛋白酶是具有丝氨酸蛋白酶活性的多肽,该多肽选自下组,该组由以下组成:
(a)多肽,该多肽与SEQ ID NO:12的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;
(b)由多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:10的成熟多肽编码序列具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
8.如权利要求1或2所述的方法,其中该S53蛋白酶是具有丝氨酸蛋白酶活性的多肽,该多肽选自下组,该组由以下组成:
(a)多肽,该多肽与SEQ ID NO:15的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;
(b)由多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:13的成熟多肽编码序列具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
9.如权利要求1或2所述的方法,其中该S53蛋白酶是具有丝氨酸蛋白酶活性的多肽,该多肽选自下组,该组由以下组成:
(a)多肽,该多肽与SEQ ID NO:26的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;
(b)多肽,该多肽由多核苷酸编码,该多核苷酸与SEQ ID NO:25的成熟多肽编码序列具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
10.如权利要求1或2所述的方法,其中该S53蛋白酶是具有丝氨酸蛋白酶活性的多肽,该多肽选自下组,该组由以下组成:
(a)多肽,该多肽与SEQ ID NO:30的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;
(b)由多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:29的成熟多肽编码序列具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
11.如权利要求1或2所述的方法,其中该S53蛋白酶是具有丝氨酸蛋白酶活性的多肽,该多肽选自下组,该组由以下组成:
(a)多肽,该多肽与SEQ ID NO:34的成熟多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;
(b)由多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:33的成熟多肽编码序列具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
12.如权利要求1或2所述的方法,其中该S53蛋白酶是具有丝氨酸蛋白酶活性的多肽,该多肽选自下组,该组由以下组成:
(a)多肽,该多肽与SEQ ID NO:38的成熟多肽,如SEQ ID NO:38的氨基酸195至560或190至560具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
13.如权利要求1或2所述的方法,其中该S53蛋白酶是具有丝氨酸蛋白酶活性的多肽,该多肽选自下组,该组由以下组成:
(a)多肽,该多肽与SEQ ID NO:39的成熟多肽,如SEQ ID NO:39的氨基酸226至647或221至647具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
14.如权利要求1-13中任一项所述的方法,其中在糖化和/或发酵期间存在或添加α-淀粉酶。
15.如权利要求1-14中任一项所述的方法,其中该产碳水化合物源的酶选自下组,该组由以下组成:葡糖淀粉酶、α-葡糖苷酶、麦芽糖淀粉酶、和β-淀粉酶。
16.如权利要求1-15中任一项所述的方法,其中在发酵之后回收该发酵产物。
17.如权利要求1-16中任一项所述的方法,其中该发酵产物是醇,优选乙醇,尤其是燃料乙醇、饮用乙醇和/或工业乙醇。
18.一种组合物,该组合物包含S53蛋白酶和产碳水化合物源的酶、以及任选地α-淀粉酶。
19.如权利要求18所述的组合物,其中该S53蛋白酶源自以下属的菌株:亚灰树花菌属、栓菌属、叉丝孔菌属、多孔菌属、革褶菌属、灵芝属、香菇属、蜡蚧菌属、篮状菌属或芽孢杆菌属,更具体是大型亚灰树花菌、变色栓菌、污叉丝孔菌、漏斗多孔菌、桦革褶菌、灵芝、洁丽香菇、蜡蚧菌属物种WMM742、解蛋白篮状菌或芽孢杆菌属物种19138。
20.丝氨酸蛋白酶,具体是S53蛋白酶,在将经糊化的和/或未经糊化的含淀粉材料发酵为发酵产物中的用途。
21.一种具有丝氨酸蛋白酶活性多肽,该多肽选自下组,该组由以下组成:
(a)多肽,该多肽与SEQ ID NO:12的多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;
(b)由多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:10的成熟多肽编码序列具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
22.一种具有丝氨酸蛋白酶活性多肽,该多肽选自下组,该组由以下组成:
(a)多肽,该多肽与SEQ ID NO:15的多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;
(b)由多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:13的成熟多肽编码序列具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
23.一种具有丝氨酸蛋白酶活性多肽,该多肽选自下组,该组由以下组成:
(a)多肽,该多肽与SEQ ID NO:27的多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;
(b)由多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:25的成熟多肽编码序列具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
24.一种具有丝氨酸蛋白酶活性多肽,该多肽选自下组,该组由以下组成:
(a)多肽,该多肽与SEQ ID NO:31的多肽具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性;
(b)由多核苷酸编码的多肽,该多核苷酸与SEQ ID NO:29的成熟多肽编码序列具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
25.一种具有丝氨酸蛋白酶活性多肽,该多肽选自下组,该组由以下组成:
(a)多肽,该多肽与SEQ ID NO:38的成熟多肽,如SEQ ID NO:38的氨基酸195至560或190至560具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
26.一种具有丝氨酸蛋白酶活性多肽,该多肽选自下组,该组由以下组成:
(a)多肽,该多肽与SEQ ID NO:39的成熟多肽,如SEQ ID NO:39的氨基酸226至647或221至647具有至少85%、至少90%、至少91%、至少92%、至少93%、至少94%、95%、至少96%、至少97%、至少98%、至少99%、或100%序列一致性。
27.如权利要求21-26中任一项所述的多肽,该多肽包含SEQ ID NO:12、SEQ ID NO:15、SEQ ID NO:27、或SEQ ID NO:31、SEQ ID NO:38的氨基酸195至560或190至560、SEQ ID NO:39的氨基酸226至647或221至647,或由其组成。
28.一种编码如权利要求19-22中任一项所述的多肽的多核苷酸。
29.一种核酸构建体或表达载体,该核酸构建体或表达载体包含如权利要求24所述的多核苷酸,该多核苷酸有效地连接至指导该多肽在表达宿主中的产生的一个或多个控制序列。
30.一种重组宿主细胞,该重组宿主细胞包含如权利要求24所述的多核苷酸,该多核苷酸有效地连接至指导该多肽的产生的一个或多个控制序列。
31.根据权利要求1-2中任一项所述的方法、或根据权利要求16所述的组合物、或根据权利要求18所述的用途,其中该S53蛋白酶是内切蛋白酶。
CN201680054930.2A 2015-09-25 2016-09-26 丝氨酸蛋白酶用于改进乙醇产量的用途 Pending CN108350444A (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US201562232903P 2015-09-25 2015-09-25
US62/232,903 2015-09-25
CN2016088143 2016-07-01
CNPCT/CN2016/088143 2016-07-01
PCT/CN2016/100090 WO2017050291A1 (en) 2015-09-25 2016-09-26 Use of serine proteases for improving ethanol yield

Publications (1)

Publication Number Publication Date
CN108350444A true CN108350444A (zh) 2018-07-31

Family

ID=58385682

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201680054930.2A Pending CN108350444A (zh) 2015-09-25 2016-09-26 丝氨酸蛋白酶用于改进乙醇产量的用途

Country Status (6)

Country Link
US (2) US10724054B2 (zh)
EP (1) EP3353292A4 (zh)
CN (1) CN108350444A (zh)
CA (1) CA2995423A1 (zh)
MX (1) MX2018003449A (zh)
WO (1) WO2017050291A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111320266A (zh) * 2020-02-28 2020-06-23 江苏大学 一种低碳源成本的染料厌氧生物脱色体系及方法

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11891645B2 (en) 2016-07-21 2024-02-06 Novozymes A/S Serine protease variants and polynucleotides encoding same
CN109642225A (zh) * 2016-07-21 2019-04-16 诺维信公司 丝氨酸蛋白酶变体以及对其进行编码的多核苷酸
CN111148841A (zh) * 2017-08-30 2020-05-12 诺维信公司 M35家族的内切蛋白酶和s53家族的外切蛋白酶在淀粉发酵中的组合使用
BR112021014873A2 (pt) * 2019-01-31 2021-10-05 Novozymes A/S Polipeptídeo, combinação de enzimas, polinucleotídeo, construto de ácido nucleico ou vetor de expressão recombinante, célula hospedeira recombinante, método de produção de um polipeptídeo, e, processo de produção de um produto de fermentação
KR102316445B1 (ko) * 2019-11-29 2021-10-26 씨제이제일제당 주식회사 신규 세린 프로테아제 변이체
CN114908073B (zh) * 2020-02-27 2023-07-07 天津科技大学 糖化酶突变体及其应用
WO2023225459A2 (en) 2022-05-14 2023-11-23 Novozymes A/S Compositions and methods for preventing, treating, supressing and/or eliminating phytopathogenic infestations and infections

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102083991A (zh) * 2008-06-23 2011-06-01 诺维信公司 生产发酵产物的方法
CN104024408A (zh) * 2011-12-28 2014-09-03 诺维信公司 具有蛋白酶活性的多肽
WO2014205198A1 (en) * 2013-06-20 2014-12-24 Novozymes A/S Fermentation processes with reduced foaming
WO2015031477A1 (en) * 2013-08-30 2015-03-05 Novozymes A/S Enzyme composition and uses thereof
WO2015078372A1 (en) * 2013-11-26 2015-06-04 Novozymes A/S Milling process
CN104884615A (zh) * 2012-09-05 2015-09-02 诺维信公司 具有蛋白酶活性的多肽

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5231017A (en) 1991-05-17 1993-07-27 Solvay Enzymes, Inc. Process for producing ethanol
AU2003217338A1 (en) 2002-02-08 2003-09-02 Genencor International, Inc. Methods for producing ethanol from carbon substrates
WO2006073839A2 (en) * 2004-12-30 2006-07-13 Genencor International, Inc. Acid fungal proteases
US7968318B2 (en) 2006-06-06 2011-06-28 Genencor International, Inc. Process for conversion of granular starch to ethanol

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102083991A (zh) * 2008-06-23 2011-06-01 诺维信公司 生产发酵产物的方法
CN104024408A (zh) * 2011-12-28 2014-09-03 诺维信公司 具有蛋白酶活性的多肽
CN104884615A (zh) * 2012-09-05 2015-09-02 诺维信公司 具有蛋白酶活性的多肽
WO2014205198A1 (en) * 2013-06-20 2014-12-24 Novozymes A/S Fermentation processes with reduced foaming
WO2015031477A1 (en) * 2013-08-30 2015-03-05 Novozymes A/S Enzyme composition and uses thereof
WO2015078372A1 (en) * 2013-11-26 2015-06-04 Novozymes A/S Milling process

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
LUIS HENRIQUE SOUZA GUIMARÃES: ""Carbohydrates from Biomass: Sources and Transformation by Microbial Enzymes"", 《CARBOHYDRATES-COMPREHENSIVE STUDIES ON GLYCOBIOLOGY AND GLYCOTECHNOLOGY》 *
WIBBERG,DANIEL ET AL.,: ""hypothetical protein PISL3812_08620 [Talaromyces islandicus],Accession No:CRG91570.1"", 《GENBANK》 *
ZHENG,P ET AL.,: ""family S53 protease-like protein [Cordyceps militaris CM01],Accession No:XP_006668287.1"", 《GENBANK》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111320266A (zh) * 2020-02-28 2020-06-23 江苏大学 一种低碳源成本的染料厌氧生物脱色体系及方法

Also Published As

Publication number Publication date
US20200308608A1 (en) 2020-10-01
CA2995423A1 (en) 2017-03-30
EP3353292A1 (en) 2018-08-01
US20180340191A1 (en) 2018-11-29
EP3353292A4 (en) 2019-04-03
WO2017050291A1 (en) 2017-03-30
US10724054B2 (en) 2020-07-28
MX2018003449A (es) 2018-06-06

Similar Documents

Publication Publication Date Title
CN108350444A (zh) 丝氨酸蛋白酶用于改进乙醇产量的用途
CN103298932B (zh) 具有葡糖淀粉酶活性的多肽和编码该多肽的多核苷酸
CN102869771B (zh) 具有葡糖淀粉酶活性的多肽和编码该多肽的多核苷酸
CN105339494A (zh) 普鲁兰酶嵌合体以及编码它们的多核苷酸
CN101443447A (zh) 具有葡糖淀粉酶活性的多肽和编码该多肽的多核苷酸
US11447763B2 (en) Serine protease variants and polynucleotides encoding same
CN106795505A (zh) 葡糖淀粉酶变体和编码它们的多核苷酸
CN108884478A (zh) 在ssf方法中组合使用至少一种内切蛋白酶和至少一种外切蛋白酶以改善乙醇产量
CN105960457A (zh) 普鲁兰酶变体以及编码它们的多核苷酸
CN108368528A (zh) 葡糖淀粉酶变体和编码它们的多核苷酸
US20230108132A1 (en) Variant g6p g7p glucoamylase compositions and methods
EP3487995B1 (en) Serine protease variants and polynucleotides encoding same
CN102869770B (zh) 具有葡糖淀粉酶活性的多肽和编码该多肽的多核苷酸
CN110651048A (zh) 葡糖淀粉酶变体和编码它们的多核苷酸
CN112105729B (zh) 具有α-淀粉酶活性的多肽以及编码它们的多核苷酸
CN109312320A (zh) 2g16葡糖淀粉酶组合物和方法
CN103298359B (zh) 具有葡糖淀粉酶活性的多肽和编码该多肽的多核苷酸
CN103764670A (zh) 具有葡糖淀粉酶活性的多肽和编码它的多核苷酸
US10035997B2 (en) G24 glucoamylase compositions and methods
CN102933596B (zh) 具有葡糖淀粉酶活性的多肽和编码该多肽的多核苷酸

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20180731

WD01 Invention patent application deemed withdrawn after publication