CN101460616A - 具有内切葡聚糖酶活性的多肽和编码该多肽的多核苷酸 - Google Patents

具有内切葡聚糖酶活性的多肽和编码该多肽的多核苷酸 Download PDF

Info

Publication number
CN101460616A
CN101460616A CNA2007800193163A CN200780019316A CN101460616A CN 101460616 A CN101460616 A CN 101460616A CN A2007800193163 A CNA2007800193163 A CN A2007800193163A CN 200780019316 A CN200780019316 A CN 200780019316A CN 101460616 A CN101460616 A CN 101460616A
Authority
CN
China
Prior art keywords
seq
polypeptide
sequence
mature polypeptide
polynucleotide
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2007800193163A
Other languages
English (en)
Inventor
保罗·哈罗斯
埃琳娜·维拉森科
马库斯·S·考皮南
伊丽莎白·扎雷特斯基
萨拉·泰特
金伯利·布朗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Novo Nordisk AS
Novozymes Inc
Original Assignee
Novo Nordisk AS
Novozymes Biotech Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Novo Nordisk AS, Novozymes Biotech Inc filed Critical Novo Nordisk AS
Publication of CN101460616A publication Critical patent/CN101460616A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/435Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from animals; from humans
    • C07K14/52Cytokines; Lymphokines; Interferons
    • C07K14/54Interleukins [IL]
    • C07K14/5431IL-11
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2434Glucanases acting on beta-1,4-glucosidic bonds
    • C12N9/244Endo-1,3(4)-beta-glucanase (3.2.1.6)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/11DNA or RNA fragments; Modified forms thereof; Non-coding nucleic acids having a biological activity
    • C12N15/113Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing
    • C12N15/1137Non-coding nucleic acids modulating the expression of genes, e.g. antisense oligonucleotides; Antisense DNA or RNA; Triplex- forming oligonucleotides; Catalytic nucleic acids, e.g. ribozymes; Nucleic acids used in co-suppression or gene silencing against enzymes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2434Glucanases acting on beta-1,4-glucosidic bonds
    • C12N9/2437Cellulases (3.2.1.4; 3.2.1.74; 3.2.1.91; 3.2.1.150)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/02Monosaccharides
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/14Preparation of compounds containing saccharide radicals produced by the action of a carbohydrase (EC 3.2.x), e.g. by alpha-amylase, e.g. by cellulase, hemicellulase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P21/00Preparation of peptides or proteins
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01004Cellulase (3.2.1.4), i.e. endo-1,4-beta-glucanase
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61KPREPARATIONS FOR MEDICAL, DENTAL OR TOILETRY PURPOSES
    • A61K38/00Medicinal preparations containing peptides
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02ATECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE
    • Y02A50/00TECHNOLOGIES FOR ADAPTATION TO CLIMATE CHANGE in human health protection, e.g. against extreme weather
    • Y02A50/30Against vector-borne diseases, e.g. mosquito-borne, fly-borne, tick-borne or waterborne diseases whose impact is exacerbated by climate change
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02EREDUCTION OF GREENHOUSE GAS [GHG] EMISSIONS, RELATED TO ENERGY GENERATION, TRANSMISSION OR DISTRIBUTION
    • Y02E50/00Technologies for the production of fuel of non-fossil origin
    • Y02E50/10Biofuels, e.g. bio-diesel

Abstract

本发明涉及具有内切葡聚糖酶活性的分离的多肽和编码所述多肽的分离的多核苷酸。本发明还涉及包含所述多核苷酸的核酸构建体、载体和宿主细胞,以及用于制备和使用所述多肽的方法。

Description

具有内切葡聚糖酶活性的多肽和编码该多肽的多核苷酸
涉及序列表
本申请包含计算机可读形式的序列表。该计算机可读形式通过引用并入本文。
涉及生物材料的保藏
本申请包含对生物材料的保藏的涉及,所述保藏已经依据布达佩斯条约在北区研究中心(Northern Regional Research Center)(NRRL)进行,并指定了登录号NRRL B-30896、NRRL B-30897和NRRL B-30899,所述微生物保藏通过引用并入本文。
发明背景
发明领域
本发明涉及具有内切葡聚糖酶活性的分离的多肽和编码所述多肽的分离的多核苷酸。本发明还涉及包含所述多核苷酸的核酸构建体、载体和宿主细胞,以及用于产生和使用所述多肽的方法。
相关领域描述
纤维素是单糖葡萄糖通过β-1,4-键共价连接的聚合物。许多微生物产生水解β-连接的葡聚糖的酶。这些酶包括内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶。内切葡聚糖酶在随机位置消化纤维素聚合物,将其打开(opening it)以受到纤维二糖水解酶攻击(attack)。纤维二糖水解酶继而从纤维素聚合物的末端释放纤维二糖的分子。纤维二糖水解酶I是1,4-D-葡聚糖纤维二糖水解酶(E.C.3.2.1.91)活性,其催化纤维素、纤维四糖(cellotetriose)或任何含有β-1,4-连接的葡萄糖的聚合物中1,4-β-D-糖苷键的水解,从链的还原性末端释放纤维二糖。纤维二糖水解酶II是1,4-β-D-葡聚糖纤维二糖水解酶(E.C.3.2.1.91)活性,其催化纤维素、纤维四糖或任何含有β-1,4-连接的葡萄糖的聚合物中1,4-β-D-糖苷键的水解,从链的非还原性末端释放纤维二糖。纤维二糖是水溶性的β-1,4-连接的葡萄糖二聚体。β-葡糖苷酶将纤维二糖水解成葡萄糖。
将含纤维素原料(cellulosic feedstock)转化为乙醇具有以下优势:大量原料现成可用,避免燃烧或填埋材料的合意性和乙醇燃料的清洁性。木材、农业残余物、草本作物和城市固体废物被认为是用于乙醇生产的原料。这些材料主要由纤维素、半纤维素和木质素组成。一旦将纤维素转化成葡萄糖,葡萄糖将容易地由酵母发酵成乙醇。
Kvesitadaze等,1995,Applied Biochemistry and Biotechnology 50:137-143描述了来自土生梭孢霉(Thielavia terrestris)嗜热突变菌株的热稳定内切葡聚糖酶的分离和性质。Gilbert等,1992,Bioresource Technology 39:147-154描述了对土生梭孢霉255B的纤维素体系中存在的酶的表征。Breuil等,1986,Biotechnology Letters 8:673-676描述了来自土生梭孢霉菌株C464和NRRL8126的纤维素酶和β-葡糖苷酶的产生和定位。Kumar等,2000,BioresourceTechnology 75:95-97公开了用Cladorrhinum foecundissimum生产内切-1,4-β-葡聚糖酶。
本领域中有利的是鉴定新的具有改进性质的内切葡聚糖酶,例如改进的水解速率、更好的热稳定性、对木质素的吸附减少,和除水解纤维素之外水解生物质的非纤维素成分例如半纤维素的能力。对半纤维素具有广泛副活性(side activity)的内切葡聚糖酶能够特别有益于改进复杂的、富含半纤维素的生物质底物的总水解产率。
本发明的目的是提供改进的具有内切葡聚糖酶活性的多肽和编码该多肽的多核苷酸。
发明概述
本发明涉及具有内切葡聚糖酶活性的分离的多肽,其选自下组:
(a)包含氨基酸序列的多肽,所述氨基酸序列与SEQ ID NO:2的成熟多肽具有至少80%的同一性,与SEQ ID NO:4的成熟多肽具有至少70%的同一性,或与SEQ ID NO:6的成熟多肽具有至少85%的同一性;
(b)由多核苷酸编码的多肽,所述多核苷酸在至少高严紧条件下与下列杂交:(i)SEQ ID NO:1或SEQ ID NO:5的成熟多肽编码序列,(ii)包含于SEQID NO:1或SEQ ID NO:5的成熟多肽编码序列中的cDNA序列,或(iii)(i)或(ii)的互补链,或者在至少中-高严紧条件下与下列杂交:(i)SEQ ID NO:3的成熟多肽编码序列,(ii)包含SEQ ID NO:3的成熟多肽编码序列的基因组DNA序列,或(iii)(i)或(ii)的互补链;
(c)由包含核苷酸序列的多核苷酸编码的多肽,所述核苷酸序列与SEQID NO:1的成熟多肽编码序列具有至少80%同一性,与SEQ ID NO:3的成熟多肽编码序列具有至少70%同一性,或者与SEQ ID NO:5的成熟多肽编码序列具有至少85%同一性;和
(d)包含一个或几个氨基酸的取代、缺失和/或插入的SEQ ID NO:2、SEQID NO:4或SEQ ID NO:6的成熟多肽的变体。
本发明还涉及编码具有内切葡聚糖酶活性的多肽的分离的多核苷酸,所述多核苷酸选自下组:
(a)编码多肽的多核苷酸,该多肽包含:与SEQ ID NO:2的成熟多肽具有至少80%同一性、与SEQ ID NO:4的成熟多肽具有至少70%同一性、与SEQ ID NO:6的成熟多肽具有至少85%同一性的氨基酸序列;
(b)多核苷酸,其在至少高严紧条件下与以下序列杂交:(i)SEQ ID NO:1或SEQ ID NO:5的成熟多肽编码序列,(ii)包含于SEQ ID NO:1或SEQ IDNO:5的成熟多肽编码序列中的cDNA序列,或(iii)(i)或(ii)的互补链;或者其由在至少中-高严紧条件下与以下序列杂交:(i)SEQ ID NO:3的成熟多肽编码序列,(ii)包含SEQ ID NO:3的成熟多肽编码序列的基因组DNA序列,或(iii)(i)或(ii)的互补链;
(c)包含核苷酸序列的多核苷酸,所述核苷酸序列与SEQ ID NO:1的成熟多肽编码序列具有至少80%同一性、与SEQ ID NO:3的成熟多肽编码序列具有至少70%同一性,或与SEQ ID NO:5的成熟多肽编码序列具有至少85%同一性;和
(d)多核苷酸,其编码包含一个或几个氨基酸的取代、缺失和/或插入的SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:6的成熟多肽变体。
在优选的方面,所述成熟多肽是SEQ ID NO:2的氨基酸23至464。在另一优选的方面,所述成熟多肽是SEQ ID NO:4的氨基酸20至423。在另一优选的方面,所述成熟多肽是SEQ ID NO:6的氨基酸19至440。在另一优选的方面,所述成熟多肽编码序列是SEQ ID NO:1的核苷酸79至1461。在另一优选的方面,所述成熟多肽编码序列是SEQ ID NO:3的核苷酸74至1349。在另一优选的方面,所述成熟多肽编码序列是SEQ ID NO:5的核苷酸107至1372。
本发明还涉及包含所述多核苷酸的核酸构建体、重组表达载体和重组宿主细胞,和产生具有内切葡聚糖酶活性的多肽的方法。
本发明还涉及抑制所述多肽在细胞中表达的方法,其包括:对细胞施用双链RNA(dsRNA)分子或在细胞中表达双链RNA(dsRNA)分子,其中dsRNA包括本发明的多核苷酸的亚序列。本发明还涉及这种双链抑制性RNA(dsRNA)分子,其中任选地dsRNA是siRNA或miRNA分子。
本发明还涉及在纤维素到葡萄糖和各种物质的转化中使用具有内切葡聚糖酶活性的多肽的方法。
本发明还涉及包含分离的多核苷酸的植物,所述多核苷酸编码这样的具有内切葡聚糖酶活性的多肽。
本发明还涉及用于产生这样的具有内切葡聚糖酶活性的多肽的方法,其包括:(a)在有益于产生该多肽的条件下培养包含多核苷酸的转基因植物或植物细胞,所述多核苷酸编码这样的具有内切葡聚糖酶的多肽;和(b)回收所述多肽。
本发明进一步涉及包含编码蛋白质的基因的核酸构建体,其中所述基因可操作地连接至编码信号肽的核苷酸序列,所述信号肽包含SEQ ID NO:2的氨基酸1至22、SEQ ID NO:4的氨基酸1至19或SEQ ID NO:6的氨基酸1至18或由SEQ ID NO:2的氨基酸1至22、SEQ ID NO:4的氨基酸1至19或SEQ ID NO:6的氨基酸1至18组成,其中所述基因相对于所述核苷酸序列来说是外源的。
附图简述
图1显示pPH32的限制图谱。
图2显示pPH37的限制图谱。
图3显示pPH50的限制图谱。
图4显示pPH38的限制图谱。
图5A和5B显示土生梭孢霉NRRL 8126 CEL7C内切葡聚糖酶的基因组DNA序列和推导的氨基酸序列(分别为SEQ ID NO:1和2)。
图6A和6B显示土生梭孢霉NRRL 8126 CEL7E内切葡聚糖酶的基因组序列和推导的氨基酸序列(分别为SEQ ID NO:3和4)。
图7显示pAlLo1的限制图谱。
图8显示pBANe10的限制图谱。
图9显示pAlLo2的限制图谱。
图10显示pEJG109的限制图谱。
图11显示pAlLo25的限制图谱。
图12显示pPH46的限制图谱。
图13A和13B显示Cladorrhinum foecundissimum ATCC 62373 CEL7A内切葡聚糖酶的cDNA序列和推导的氨基酸序列(分别为SEQ ID NO:5和6)。
图14显示在pH5.0和50℃,土生梭孢霉CEL7C内切葡聚糖酶(5mg蛋白质每g固体)水解不同底物(5mg/ml)的时间进程(time course)。
图15显示在pH5.5和60℃水解2小时之后,β-葡聚糖(1%w/v)的相对转化率。
图16显示在pH5.5和60℃水解24小时之后,β-葡聚糖(1%w/v)的相对转化率。
定义
内切葡聚糖酶活性:术语“内切葡聚糖酶活性”在本文中定义为内切-1,4-β-D-葡聚糖4-葡聚糖水解酶(endo-1,4-β-D-glucan4-glucanohydrolase)(E.C.No.3.2.1.4),其催化纤维素、纤维素衍生物(例如羧甲基纤维素和羟乙基纤维素)、木质纤维素、木质纤维素衍生物、地衣淀粉(lichenin)中的1,4-β-D-糖苷键、混合的β-1,3葡聚糖例如谷类β-D-葡聚糖或木葡聚糖中的β-1,4键和含有纤维素成分的其它植物材料的内水解(endohydrolysis)。就本发明而言,根据Ghose,1987,Pure and Appl.Chem.59:257-268的方法,使用羧甲基纤维素(CMC)水解来测定内切葡聚糖酶活性。将一单位的内切葡聚糖酶活性定义为:在50℃、pH5.0,每分钟产生1.0微摩尔还原糖。
在优选的方面,具有内切葡聚糖酶活性的本发明的多肽还对选自下组的一种或多种底物具有酶活性:木聚糖、木葡聚糖(xyloglucan)、阿拉伯木聚糖(arabinoxylan)、1,4-β-D-甘露聚糖和半乳甘露聚糖(galactomannan)。将具有内切葡聚糖酶活性的多肽对于这些多糖底物的活性测定为:将所述底物(5mg每升)与本发明的具有内切葡聚糖酶活性的多肽(5mg蛋白质每g底物)一起在pH5.0(50mM乙酸钠)和50℃及间歇搅拌温育24小时之后,底物水解为还原糖的百分比。水解混合物中的还原糖通过对羟基苯甲酸酰肼(PHBAH)方法确定。
在更优选的方面,本发明具有内切葡聚糖酶活性的多肽进一步对木聚糖具有酶活性。在另一个更优选的方面,本发明具有内切葡聚糖酶活性的多肽进一步对木葡聚糖具有酶活性。在另一个更优选的方面,本发明具有内切葡聚糖酶活性的多肽进一步对阿拉伯木聚糖具有酶活性。在另一个更优选的方面,本发明具有内切葡聚糖酶活性的多肽进一步对1,4-β-D-甘露聚糖具有酶活性。在另一个更优选的方面,本发明具有内切葡聚糖酶活性的多肽进一步对半乳甘露聚糖具有酶活性。在另一个更优选的方面,本发明具有内切葡聚糖酶活性的多肽进一步对木聚糖、木葡聚糖、阿拉伯木聚糖、1,4-β-D-甘露聚糖和/或半乳甘露聚糖具有酶活性。
本发明的多肽具有SEQ ID NO:2或SEQ ID NO:4或SEQ ID NO:6的成熟多肽的内切葡聚糖酶活性的至少20%,优选至少40%,更优选至少50%,更优选至少60%,更优选至少70%,更优选至少80%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少100%。
家族7糖苷水解酶或家族GH7:术语“家族7糖苷水解酶”或“家族GH7”在本文中定义为根据Henrissat B.,1991,A classification of glycosylhydrolases based on amino-acid sequence similarities,Biochem.J.280:309-316,及Henrissat B.,和Bairoch A.,1996,Updating the sequence-based classificationof glycosyl hydrolases,Biochem.J.316:695-696属于糖苷水解酶家族7的多肽。
分离的多肽:术语“分离的多肽”用于本文中指,如通过SDS-PAGE测定的,其为至少20%纯,优选至少40%纯,更优选至少60%纯,甚至更优选至少80%纯,最优选至少90%纯,并且甚至最优选至少95%纯的多肽。
基本上纯的多肽:术语“基本上纯的多肽”在本文表示多肽制备物,所述多肽制备物含有按重量计至多10%,优选至多8%,更优选至多6%,更优选至多5%,更优选至多4%,更优选至多3%,甚至更优选至多2%,最优选至多1%,并且甚至最优选至多0.5%的与其天然或重组结合的(associated)的其它多肽材料。因此,优选所述基本上纯的多肽是按存在于制备物中的全部多肽材料的重量计至少92%纯,优选至少94%纯,更优选至少95%纯,更优选至少96%纯,更优选至少96%纯,更优选至少97%纯,更优选至少98%纯,甚至更优选至少99%纯,最优选至少99.5%纯,并且甚至最优选100%纯。
本发明的多肽优选是基本上纯的形式。具体而言,优选所述多肽是“基本上(essentially)纯的形式”,即,所述多肽制备物基本上(essentially)不含与其天然或重组结合的其它多肽材料。例如,这能够通过以下实现:通过公知的重组方法或由经典纯化方法制备多肽。
在本文中,术语“基本上纯的多肽”与术语“分离的多肽”和“分离形式的多肽”同义。
成熟多肽:术语“成熟多肽”在本文中定义为具有内切葡聚糖酶活性的多肽,所述多肽以其在翻译和任何翻译后修饰之后的最终形式存在,所述修饰例如N-末端加工、C-末端截断、糖基化等。
成熟多肽编码序列:术语“成熟多肽编码序列”在本文中定义为编码具有内切葡聚糖酶活性的成熟多肽的核苷酸序列。
同一性:参数“同一性”描述两个氨基酸序列之间或两个核苷酸序列之间的相关性。
就本发明而言,两个氨基酸序列之间的同一性程度通过Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48:443-453)使用EMBOSS的Needle程序来测定,使用缺口罚分(gap penalty)10,缺口延伸罚分(gap extension penalty)0.5和EBLOSUM62矩阵。使用Needle标记为“最高同一性(longest identity)”的输出结果作为同一性百分比,并计算如下:
(同样的残基×100)/(比对长度-比对中缺口的数目)
就本发明而言,两个核苷酸序列之间的同一性程度通过Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48:443-453)使用EMBOSS的Needle程序来测定,使用参数缺口罚分10,缺口延伸罚分0.5和EDNAFULL矩阵。使用Needle标记为“最高同一性”的输出结果作为同一性百分比,并计算如下:
(同样的残基×100)/(比对长度-比对中缺口的数目)
同源序列:术语“同源序列”在本文中定义为用土生梭孢霉CEL7C或CEL7E内切葡聚糖酶(分别为SEQ ID NO:2或SEQ ID NO:4)或Cladorrhinumfoecundissimum CEL7A内切葡聚糖酶(SEQ ID NO:6)作为查询序列,在fasta检索(Pearson,W.R.,1999,于Bioinformatics Methods and Protocols中,S.Misener和S.A.Krawetz,ed.,pp.185-219)中给出小于0.001的E值(或预期分数)的预测蛋白质。
多肽片段:术语“多肽片段”本文定义为从SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:6或其同源序列的成熟多肽的氨基和/或羧基末端缺失了一个或几个氨基酸的多肽;其中所述片段具有内切葡聚糖酶活性。在优选的方面,片段包含SEQ ID NO:2或其同源序列的成熟多肽的至少380个氨基酸残基、更优选至少400个氨基酸残基、最优选至少420个氨基酸残基。在另一优选的方面,片段包含SEQ ID NO:4或其同源序列的成熟多肽的至少340个氨基酸残基、更优选至少360个氨基酸残基、最优选至少380个氨基酸残基。在另一优选的方面,片段包含SEQ ID NO:6或其同源序列的成熟多肽的至少360个氨基酸残基、更优选至少380个氨基酸残基、最优选至少400个氨基酸残基。
亚序列:术语“亚序列(subsequence)”在本文中定义为从SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5或其同源序列的成熟多肽编码序列的5′和/或3′端缺失了一个或几个核苷酸的核苷酸序列;其中所述亚序列编码具有内切葡聚糖酶活性的多肽片段。在优选的方面,亚序列包含SEQ ID NO:1或其同源序列的成熟多肽编码序列的至少1140个核苷酸,更优选至少1200个核苷酸,最优选至少1260个核苷酸。在另一优选的方面,亚序列包含SEQ ID NO:3或其同源序列的成熟多肽编码序列的至少1020个核苷酸,更优选至少1080个核苷酸,最优选至少1140个核苷酸。在另一优选的方面,亚序列包含SEQID NO:5或其同源序列的成熟多肽编码序列的至少1080个核苷酸,更优选至少1140个核苷酸,最优选至少1200个核苷酸。
等位变体(allelic variant):术语“等位变体”在本文中表示占据相同染色体基因座的基因的任何两种或两种以上可选形式。等位变异通过突变天然地发生,并且可导致种群内的多态性。基因突变可以是沉默的(在编码的多肽中无变化)或可以编码具有改变的氨基酸序列的多肽。多肽的等位变体是由基因的等位变体编码的多肽。
分离的多核苷酸:术语“分离的多核苷酸”用于本文中指,如通过琼脂糖电泳测定的,其为至少20%纯,优选至少40%纯,更优选至少60%纯,甚至更优选至少80%纯,最优选至少90%纯,并且甚至最优选至少95%纯的多核苷酸。
基本上纯的多核苷酸:术语“基本上纯的多核苷酸”用于本文指不含其它外来的或不期望的核苷酸的多核苷酸制备物,并且所述多核苷酸制备物处于适合于在遗传工程的蛋白质生产体系中使用的形式。因此,基本上纯的多核苷酸含有按重量计至多10%,优选至多8%,更优选至多6%,更优选至多5%,更优选至多4%,更优选至多3%,甚至更优选至多2%,最优选至多1%,并且甚至最优选至多0.5%的与其天然或重组结合的其它多核苷酸材料。然而,基本上纯的多核苷酸可以包括天然存在的5’和3’非翻译区,例如启动子和终止子。优选基本上纯的多核苷酸是按重量计至少90%纯,优选至少92%纯,更优选至少94%纯,更优选至少95%纯,更优选至少96%纯,更优选至少97%纯,甚至更优选至少98%纯,最优选至少99%,并且甚至最优选至少99.5%纯的。本发明所述多核苷酸优选为基本上纯的形式。具体而言,优选在本文公开的多核苷酸是“基本上(essentially)纯的形式”,即,所述多核苷酸制备物基本上不含与其天然或重组结合的其它多核苷酸材料。在本文中,术语“基本上纯的多核苷酸”与术语“分离的多核苷酸”和“分离形式的多核苷酸”同义。所述多核苷酸可以是基因组、cDNA、RNA、半合成、合成来源的,或它们的任何组合。
编码序列:当用于本文时术语“编码序列”的意思是直接指定其蛋白产物的氨基酸序列的核苷酸序列。编码序列的边界通常由开读框决定,所述开读框通常以ATG起始密码子或可供选择的起始密码子例如GTG和TTG开始,并且以终止密码子例如TAA、TAG和TGA结束。编码序列可以是DNA、cDNA或重组核苷酸序列。
成熟多肽编码序列:术语“成熟多肽编码序列”在本文中定义为核苷酸序列,其编码具有内切葡聚糖酶活性的成熟多肽。
cDNA:术语“cDNA”在本文中定义为能够通过反转录从得自真核细胞的成熟的、已剪接的mRNA分子制备的DNA分子。cDNA缺少通常存在于相应基因组DNA中的内含亚序列。起始的(initial)、初级的RNA转录物是mRNA的前体,其通过一系列的步骤加工然后作为成熟的已剪接的mRNA出现。这些步骤包括通过称为剪接的过程去除内含亚序列。因而源自mRNA的cDNA没有任何内含亚序列。
核酸构建体:术语“核酸构建体”用于本文指单链或双链的核酸分子,所述核酸分子分离自天然存在的基因,或将所述核酸分子以本来不存在于(not otherwise exist)自然界中的方式修饰以含有核酸的区段。当所述核酸构建体含有表达本发明的编码序列所需的调控序列时,术语核酸构建体与术语“表达盒”同义。
调控序列(control sequence):术语“调控序列”在本文定义为包括对编码本发明多肽的多核苷酸表达是必需的或有利的所有成分。各个调控序列对于编码所述多肽的核苷酸序列可以是天然的或外源的,或各个调控序列对于彼此可以是天然的或外源的。这些调控序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。最少的情况,调控序列包括启动子和转录和翻译的终止信号。调控序列可以和用于引入特异性限制位点的接头一起提供,所述特异性限制位点促进调控序列与编码多肽的核苷酸序列编码区的连接。
可操作地连接:术语“可操作地连接”在本文表示这样的构型,其中将调控序列置于相对于多核苷酸序列的编码序列的适当位置,使得调控序列指导多肽编码序列的表达。
表达:术语“表达”包括涉及多肽产生的任何步骤,其包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。
表达载体:术语“表达载体”在本文定义为线性的或环状的DNA分子,其包含编码本发明多肽的多核苷酸,并且所述多核苷酸与提供用于其表达的额外核苷酸可操作地连接。
宿主细胞:如本文中所使用的术语“宿主细胞”包括任何细胞类型,所述细胞类型对于使用包含本发明多核苷酸的核酸构建体或表达载体的转化、转染、转导等是易感的(susceptible)。
修饰:术语“修饰”在本文的意思是,对由SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:6的成熟多肽组成的多肽或其同源序列的任何化学修饰,以及对编码所述多肽的DNA的遗传操作。所述修饰可以是一个或几个氨基酸的取代、缺失和/或插入,以及一个或几个氨基酸侧链的置换。
人工变体:当用在本文时,术语“人工变体”的意思是具有内切葡聚糖酶活性的多肽,所述多肽由表达SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5的成熟多肽编码序列或其同源序列的修饰的核苷酸序列的生物体产生。所述修饰的核苷酸序列通过人为干预(human intervention),通过修饰公开于SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5或它们的同源序列的核苷酸序列来获得。
发明详述
具有内切葡聚糖酶活性的多肽
在第一个方面,本发明涉及包含下述氨基酸序列的分离的多肽,所述氨基酸序列与SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:6的成熟多肽具有至少60%,优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%、97%、98%或99%的同一性程度,所述多肽具有内切葡聚糖酶活性(下文中的“同源多肽”)。在优选的方面,所述同源多肽具有的氨基酸序列与SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:6的成熟多肽相差十个氨基酸,优选相差五个氨基酸,更优选相差四个氨基酸,甚至更优选相差三个氨基酸,最优选相差两个氨基酸,并且甚至最优选相差一个氨基酸。
本发明的多肽优选包含SEQ ID NO:2的氨基酸序列或其等位变体;或它们的具有内切葡聚糖酶活性的片段。在优选的方面,多肽包含SEQ ID NO:2的氨基酸序列。在另一优选方面,多肽包含SEQ ID NO:2的成熟多肽。在另一优选方面,多肽包含SEQ ID NO:2的氨基酸23至464,或其等位变体;或它们的具有内切葡聚糖酶活性的片段。在另一优选方面,多肽包含SEQ IDNO:2的氨基酸23至464。在另一优选方面,多肽由SEQ ID NO:2的氨基酸序列或其等位变体,或它们的具有内切葡聚糖酶活性的片段组成。在另一优选方面,多肽由SEQ ID NO:2的氨基酸序列组成。在另一优选方面,多肽由SEQ ID NO:2的成熟多肽组成。在另一优选方面,多肽由SEQ ID NO:2的氨基酸23至464或其等位变体,或它们的具有内切葡聚糖酶活性的片段组成。在另一优选方面,多肽由SEQ ID NO:2的氨基酸23至464组成。
本发明的多肽还优选包含SEQ ID NO:4的氨基酸序列或其等位变体;或其具有内切葡聚糖酶活性的片段。在优选的方面,多肽包含SEQ ID NO:4的氨基酸序列。在另一优选的方面,多肽包含SEQ ID NO:4的成熟多肽。在另一优选的方面,多肽包含SEQ ID NO:4的氨基酸20至423,或其等位变体;或它们的具有内切葡聚糖酶活性的片段。在另一优选的方面,多肽包含SEQ ID NO:4的氨基酸20至423。在另一优选的方面,多肽由SEQ ID NO:4的氨基酸序列或其等位变体,或它们的具有内切葡聚糖酶活性的片段组成。在另一优选的方面,多肽由SEQ ID NO:4的氨基酸序列组成。在另一优选的方面,多肽由SEQ ID NO:4的成熟多肽组成。在另一优选的方面,多肽由SEQ ID NO:4的氨基酸20至423或其等位变体,或它们的具有内切葡聚糖酶活性的片段组成。在另一优选的方面,多肽由SEQ ID NO:4的氨基酸20至423组成。
本发明的多肽还优选包含SEQ ID NO:6的氨基酸序列或其等位变体;或它们的具有内切葡聚糖酶活性的片段。在优选的方面,多肽包含SEQ IDNO:6的氨基酸序列。在另一优选的方面,多肽包含SEQ ID NO:6的成熟多肽。在另一优选的方面,多肽包含SEQ ID NO:6的氨基酸19至440或其等位变体;或它们的具有内切葡聚糖酶活性的片段。在另一优选的方面,多肽包含SEQ ID NO:6的氨基酸19至440。在另一优选的方面,多肽由SEQ IDNO:6的氨基酸序列或其等位变体,或它们的具有内切葡聚糖酶活性的片段组成。在另一优选的方面,多肽由SEQ ID NO:6的氨基酸序列组成。在另一优选的方面,多肽由SEQ ID NO:6的成熟多肽组成。在另一优选的方面,多肽由SEQ ID NO:6的氨基酸19至440或其等位变体,或它们的具有内切葡聚糖酶活性的片段组成。在另一优选的方面,多肽由SEQ ID NO:6的氨基酸19至440组成。
在第二个方面,本发明涉及具有内切葡聚糖酶活性的分离的多肽,所述分离的多肽由多核苷酸编码,所述多核苷酸在非常低严紧条件下,优选低严紧条件下,更优选中严紧条件下,更优选中-高严紧条件下,甚至更优选高严紧条件下,并且最优选非常高严紧条件下,与以下序列杂交:(i)SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5的成熟多肽编码序列,(ii)包含于SEQ ID NO:1或SEQ ID NO:5的成熟多肽编码序列中的cDNA序列或者包含SEQ ID NO:1的成熟多肽编码序列的基因组DNA序列,(iii)(i)或(ii)的亚序列,或(iv)(i)、(ii)或(iii)的互补链(J.Sambrook,E.F.Fritsch,和T.Maniatis,1989,MolecularCloning,ALaboratory Manual,2d edition,Cold Spring Harbor,New York)。SEQID NO:1、SEQ ID NO:3或SEQ ID NO:5的成熟多肽编码序列的亚序列含有至少100个连续的核苷酸或优选至少200个连续的核苷酸。此外,所述亚序列可编码具有内切葡聚糖酶活性的多肽片段。在优选的方面,所述成熟多肽编码序列是SEQ ID NO:1的核苷酸79至1461。在另一优选的方面,所述成熟多肽编码序列是SEQ ID NO:3的核苷酸74至1349。在另一优选的方面,所述成熟多肽编码序列是SEQ ID NO:5的核苷酸107至1372。在另一优选的方面,所述互补链是SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5的成熟多肽编码序列的全长互补链。
SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5的核苷酸序列或其亚序列;以及SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:6的氨基酸序列或其片段,可用于设计核酸探针,以根据本领域内公知的方法从不同属和种的菌株鉴定和克隆编码具有内切葡聚糖酶活性的多肽的DNA。具体而言,根据标准的Southern印迹方法,可将这些探针用于与感兴趣的属或种的基因组或cDNA杂交,以鉴定和从其中分离相应的基因。这些探针可明显短于完整序列,但长度上应为至少14,优选至少25,更优选至少35,并且最优选至少70个核苷酸。然而,优选所述核酸探针是至少100个核苷酸长度。例如,所述核酸探针长度上可以是至少200个核苷酸,优选至少300个核苷酸,更优选至少400个核苷酸,或最优选至少500个核苷酸。甚至可以使用更长的探针,例如,长度是至少600个核苷酸,至少优选至少700个核苷酸,更优选至少800个核苷酸,或最优选至少900个核苷酸的核酸探针。DNA和RNA探针二者均可使用。通常将探针标记以探测相应的基因(例如,用32P、3H、35S、生物素或抗生物素蛋白(avidin)标记)。将这些探针包含于本发明中。
因而,可从由这些其它菌株制备的基因组DNA或cDNA文库中筛选DNA,所述DNA与上述探针杂交并且编码具有内切葡聚糖酶活性的多肽。可以通过琼脂糖或聚丙烯酰胺凝胶电泳,或通过其它分离技术分离来自这些其它菌株的基因组或其它DNA。可以将来自文库的DNA或分离的DNA转移至硝化纤维素(nitrocellulose)或其它合适的载体材料并且固定于其上。为了鉴定与SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5或其亚序列同源的克隆或DNA,将所述载体材料优选用在Sounthern印迹中。
就本发明而言,杂交表示核苷酸序列在非常低至非常高的严紧条件下与标记的核酸探针杂交,所述核酸探针对应于SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5的成熟多肽编码序列;包含于SEQ ID NO:1或SEQ ID NO:5的成熟多肽编码序列中的cDNA序列;包含SEQ ID NO:3的成熟多肽编码序列的基因组DNA序列;它的互补链或其亚序列。可使用例如X射线片(X-rayfilm)检测在这些条件下与核酸探针杂交的分子。
在优选的方面,核酸探针是SEQ ID NO:1的成熟多肽编码序列。在另一优选方面,核酸探针是SEQ ID NO:1的核苷酸79至1461。在另一优选方面,核酸探针是编码SEQ ID NO:2的多肽的多核苷酸序列,或其亚序列。在另一优选方面,核酸探针是SEQ ID NO:1。在另一优选方面,核酸探针是包含在大肠杆菌(E.coli)NRRL B-30899中的质粒pPH50中含有的多核苷酸序列,其中所述其多核苷酸序列编码具有内切葡聚糖酶活性的多肽。在另一优选方面,核酸探针是包含在大肠杆菌NRRL B-30899中的质粒pPH50中含有的成熟多肽编码区。
在另一个优选的方面,核酸探针是SEQ ID NO:3的成熟多肽编码序列。在另一优选方面,核酸探针是SEQ ID NO:3的核苷酸74至1349。在另一优选方面,核酸探针是编码SEQ ID NO:4的多肽的多核苷酸序列,或其亚序列。在另一优选方面,核酸探针是SEQ ID NO:3。在另一优选方面,核酸探针是包含在大肠杆菌NRRL B-30896中的质粒pPH38中含有的多核苷酸序列,其中所述其多核苷酸序列编码具有内切葡聚糖酶活性的多肽。在另一优选方面,核酸探针是包含在大肠杆菌NRRL B-30896中的质粒pPH38中含有的成熟多肽编码区。
在另一个优选的方面,核酸探针是SEQ ID NO:5的成熟多肽编码序列。在另一优选方面,核酸探针是SEQ ID NO:5的核苷酸107至1372。在另一优选方面,核酸探针是编码SEQ ID NO:6的多肽的多核苷酸序列,或其亚序列。在另一优选方面,核酸探针是SEQ ID NO:5。在另一优选方面,核酸探针是包含在大肠杆菌NRRL B-30897中的质粒pPH46中含有的多核苷酸序列,其中所述其多核苷酸序列编码具有内切葡聚糖酶活性的多肽。在另一优选方面,核酸探针是包含在大肠杆菌NRRL B-30897中的质粒pPH46中含有的成熟多肽编码区。
对于长度至少100个核苷酸的长探针,将非常低至非常高的严紧条件定义为在42℃,在5X SSPE、0.3%SDS、200μg/ml已剪切并且变性的鲑精DNA中,并且对于非常低和低严紧性为25%的甲酰胺、对于中和中-高严紧性为35%的甲酰胺、或对于高和非常高严紧性为50%的甲酰胺,根据标准的Southern印迹法进行预杂交和杂交最佳12至24小时。
对于长度为至少100个核苷酸的长探针,使用2X SSC、0.2% SDS优选至少在45℃(非常低严紧性),更优选至少在50℃(低严紧性),更优选至少在55℃(中严紧性),更优选至少在60℃(中-高严紧性),甚至更优选至少在65℃(高严紧性),并且最优选至少在70℃(非常高严紧性)将载体材料最终洗涤三次,每次15分钟。
对于长度大约15个核苷酸至大约70个核苷酸的短探针,将严紧条件定义为在比根据Bolton和McCarthy计算法(1962,Proceedings of the NationalAcademy of Sciences USA 48:1390)得出的Tm低大约5℃至大约10℃,在0.9MNaCl,0.09M Tris-HCl pH7.6,6mM EDTA,0.5% NP-40,1×Denhardt溶液,1mM焦磷酸钠(sodium pyrophosphate),1mM磷酸二氢钠(sodium monobasicphosphate),0.1mM ATP和0.2mg每ml的酵母RNA中,根据标准的Southern印迹步骤进行预杂交、杂交和杂交后洗涤最佳12至24小时。
对于长度大约15个核苷酸至大约70个核苷酸的短探针,将所述载体材料在6×SSC加0.1% SDS中洗涤一次15分钟,并用6×SSC在比计算的Tm低5℃至10℃的温度洗涤两次,每次15分钟。
在第三个方面,本发明涉及由多核苷酸编码的分离的多肽,所述多核苷酸包含与SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5的成熟多肽编码序列具有至少60%、优选至少65%、更优选至少70%、更优选至少75%、更优选至少80%、更优选至少85%、更优选至少90%、甚至更优选至少95%、最优选至少97%同一性程度的核苷酸序列或由所述核苷酸序列组成,其编码活性多肽。在优选的方面,所述成熟多肽编码序列是SEQ ID NO:1的核苷酸79至1461。在另一优选的方面,所述成熟多肽编码序列是SEQ ID NO:3的核苷酸74至1349。在另一优选的方面,所述成熟多肽编码序列是SEQ ID NO:5的核苷酸107至1372。参见本文多核苷酸部分。
在第四个方面,本发明涉及人工变体,所述人工变体涉及包含取代、缺失和/或插入一个或多个(或几个)氨基酸的SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:6的成熟多肽;或其同源序列。优选地,氨基酸改变对性质是较不重要的(of a minor nature),即保守的氨基酸取代或插入,其不显著影响蛋白质的折叠和/或活性;通常为1至大约30个氨基酸的小缺失;小的氨基或羧基末端延伸,例如氨基末端甲硫氨酸残基;多至大约20-25个残基的小接头肽;或通过改变净电荷或其它功能来促进纯化的小延伸,如多组氨酸序列(poly histidine tract)、抗原表位(antigenic epitope)或结合域(binding domain)。
保守取代的实例是在以下组之内:碱性氨基酸组(精氨酸、赖氨酸和组氨酸)、酸性氨基酸组(谷氨酸和天冬氨酸)、极性氨基酸组(谷氨酰胺和天冬酰胺)、疏水性氨基酸组(亮氨酸、异亮氨酸和缬氨酸)、芳族氨基酸组(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸组(甘氨酸、丙氨酸、丝氨酸、苏氨酸和甲硫氨酸)。通常不改变比活性(specific activity)的氨基酸取代是本领域已知的,并且由例如H.Neurath和R.L.Hill,1979,于The Proteins,Academic Press,NewYork中描述。最普遍发生的交换是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu和Asp/Gly。
除了20个基本氨基酸,非基本氨基酸(例如4-羟脯氨酸、6-N-甲基赖氨酸、2-氨基异丁酸、异缬氨酸和α-甲基丝氨酸)可以取代野生型多肽的氨基酸残基。有限数量的非保守氨基酸、不由遗传密码编码的氨基酸和非天然氨基酸可以取代氨基酸残基。“非天然氨基酸”在蛋白质合成后已经过修饰,和/或在它们的侧链具有不同于基本氨基酸的化学结构。非天然氨基酸能够以化学方法合成,并且优选是商业上能够获得的,包括六氢吡啶羧酸(pipecolicacid)、噻唑烷羧酸(thiazolidine carboxylic acid)、脱氢脯氨酸、3-和4-甲基脯氨酸,和3,3-二甲基脯氨酸。
可供选择的是,氨基酸改变具有这样的性质以使多肽的物理化学性质改变。例如,氨基酸改变可改进多肽的热稳定性,改变底物特异性,改变最适pH等。
能够根据本领域已知的方法,例如定位诱变或丙氨酸分区诱变法(Cunningham和Wells,1989,Science 244:1081-1085)来鉴定亲本多肽中的必需氨基酸。在后一技术中,将单一丙氨酸突变引入到分子中的每个残基,并且测试所得突变分子的生物活性(即,内切葡聚糖酶活性)以鉴定对于所述分子的活性关键的氨基酸残基。同样参见Hilton等,1996,J.Biol.Chem.271:4699-4708。酶的活性部位或其它的生物相互作用也能够通过结构的物理分析而测定,如通过以下这些技术:如核磁共振、晶体学、电子衍射或光亲和标记,连同推定的接触位点氨基酸的突变来测定。参见例如de Vos等,1992,Science 255:306-312;Smith等,1992,J.Mol.Biol.224:899-904;Wlodaver等,1992,FEBS Lett.309:59-64。必需氨基酸的同一性也能够从与多肽的同一性分析来推断,所述多肽与根据本发明的多肽相关。
能够使用已知的诱变、重组和/或改组(shuffling)方法,然后是有关的筛选方法,例如那些由Reidhaar-Olson和Sauer,1988,Science 241:53-57;Bowie和Sauer,1989,Proc.Natl.Acad.Sci.USA 86:2152-2156;WO 95/17413;或WO95/22625公开的那些方法来进行并测试单个或多个氨基酸取代、缺失、和/或插入。能够使用的其它方法包括易错PCR、噬菌体展示(例如,Lowman等,1991,Biochem.30:10832-10837;美国专利号5,223,409;WO92/06204)和区域定向的诱变(Derbyshire等,1986,Gene 46:145;Ner等,1988,DNA7:127)。
诱变/改组方法能够与高通量、自动化的筛选方法组合以检测由宿主细胞表达的克隆的、诱变的多肽的活性(Ness等,1999,Nature Biotechnology 17:893-896)。能够从宿主细胞回收编码活性多肽的诱变的DNA分子,并且使用本领域内标准方法快速测序。这些方法允许快速测定感兴趣的多肽中单个氨基酸残基的重要性,并且能够应用于未知结构的多肽。
SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:6的成熟多肽例如SEQ IDNO:2的氨基酸23至464、SEQ ID NO:4的氨基酸20至423、SEQ ID NO:6的氨基酸19至440的氨基酸取代、缺失和/或插入的总数是10,优选9,更优选8,更优选7,更优选至多6,更优选5,更优选4,甚至更优选3,最优选2,并且甚至最优选1。
具有内切葡聚糖酶活性的多肽的来源
本发明的多肽可以获得自任何属的微生物。就本发明而言,用于本文与给定的来源有关的术语“获得自”,意思是核苷酸序列编码的多肽由所述来源产生,或由其中插入了来自所述来源的核苷酸序列的菌株产生。在优选的方面,获得自给定来源的多肽是胞外分泌的。
本发明具有内切葡聚糖酶活性的多肽可以是细菌多肽。例如,所述多肽可以是革兰氏阳性细菌多肽例如芽孢杆菌属(Bacillus)、链球菌属(Streptococcus)、链霉菌属(Streptomyces)、葡萄球菌属(Staphylococcus)、肠球菌属(Enterococcus)、乳酸菌属(Lactobacillus)、乳球菌属(Lactococcus)、梭菌属(Clostridium)、Geobacillus或Oceanobacillus多肽,所述多肽具有内切葡聚糖酶活性;或革兰氏阴性细菌多肽,如大肠杆菌(E.coli)、假单胞菌(Pseudomonas)、沙门氏菌(Salmonella)、弯曲杆菌属(Campylobacter)、螺杆菌(Helicobacter)、黄杆菌属(Flavobacterium)、梭杆菌属(Fusobacterium)、泥杆菌属(Ilyobacter)、奈瑟氏菌属(Neisseria)或脲原体属(Ureaplasma)属多肽,其具有内切葡聚糖酶活性。
在优选方面,所述多肽是嗜碱芽孢杆菌(Bacillus alkalophilus)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、短芽孢杆菌(Bacillus brevis)、环状芽孢杆菌(Bacillus circulans)、克劳氏芽孢杆菌(Bacillus clausii)、凝结芽孢杆菌(Bacillus coagulans)、坚强芽孢杆菌(Bacillus firmus)、灿烂芽孢杆菌(Bacilluslautus)、迟缓芽孢杆菌(Bacillus lentus)、地衣芽孢杆菌(Bacillus licheniformis)、巨大芽孢杆菌(Bacillus megaterium)、短小芽孢杆菌(Bacillus pumilus)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)、枯草芽孢杆菌(Bacillus subtilis)或苏云金芽孢杆菌(Bacillus thuringiensis)具有内切葡聚糖酶活性的多肽。
在另一个优选的方面,所述多肽是具有内切葡聚糖酶活性的似马链球菌(Streptococcus equisimilis)、酿脓链球菌(Streptococcus pyogenes)、乳房链球菌(Streptococcus uberis)或马链球菌兽瘟亚种(Streptococcus equi subsp.Zooepidemicus)多肽。
在另一个优选的方面,所述多肽是不产色链霉菌(Streptomycesachromogenes)、阿维链霉菌(Streptomyces avermitilis)、天蓝链霉菌(Streptomyces coelicolor)、灰色链霉菌(Streptomyces griseus)或浅青紫链霉菌(Streptomyces lividans)多肽,其具有内切葡聚糖酶活性。
本发明具有内切葡聚糖酶活性的多肽也可以是真菌多肽,并且更优选酵母多肽如念珠菌属(Candida)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)或西洋蓍霉属(Yarrowia)多肽,其具有内切葡聚糖酶活性;或更优选丝状真菌多肽如枝顶孢霉属(Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、金孢子菌属(Chrysosporium)、隐球菌属(Cryptococcus)、Filibasidium、镰孢属(Fusarium)、腐质霉属(Humicola)、梨孢菌属(Magnaporthe)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、新考玛脂霉属(Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、瘤胃壶菌属(Piromyces)、裂褶菌属(Schizophyllum)、踝节菌属(Talaromyces)、热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)或木霉属(Trichoderma)多肽,其具有内切葡聚糖酶活性。
在优选的方面,所述多肽是卡尔酵母(Saccharomyces carlsbergensis)、酿酒酵母(Saccharomyces cerevisiae)、糖化酵母(Saccharomyces diastaticus)、道格拉氏酵母(Saccharomyces douglasii)、克鲁弗酵母(Saccharomyces kluyveri)、诺地酵母(Saccharomyces norbensis)或卵形酵母(Saccharomyces oviformis)多肽,其具有内切葡聚糖酶活性。
在另外的优选方面,所述多肽是棘孢曲霉(Aspergillus aculeatus)、泡盛曲霉(Aspergillus awamori)、烟曲霉(Aspergillus fumigatus)、臭曲霉(Aspergillusfoetidus)、日本曲霉(Aspergillus japonicus)、构巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillus niger)、米曲霉(Aspergillus oryzae)、嗜角质金孢子菌(Chrysosporium keratinophilum)、Chrysosporium lucknowense、热带金孢子菌(Chrysosporium tropicum)、Chrysosporium merdarium、Chrysosporium inops、毡金孢子菌(Chrysosporium pannicola)、Chrysosporium queenslandicum、Chrysosporium zonatum、杆孢状镰孢(Fusarium bactridioides)、禾谷镰孢(Fusarium cerealis)、库威镰孢(Fusarium crookwellense)、大刀镰孢(Fusariumculmorum)、禾本科镰孢(Fusarium graminearum)、禾赤镰孢(Fusariumgraminum)、异孢镰孢(Fusarium heterosporum)、合欢木镰孢(Fusariumnegundi)、尖镰孢(Fusarium oxysporum)、多枝镰孢(Fusarium reticulatum)、粉红镰孢(Fusarium roseum)、接骨木镰孢(Fusarium sambucinum)、肤色镰孢(Fusarium sarcochroum)、拟分枝孢镰孢(Fusarium sporotrichioides)、硫色镰孢(Fusarium sulphureum)、圆镰孢(Fusarium torulosum)、拟丝孢镰孢(Fusariumtrichothecioides)、镶片镰孢(Fusarium venenatum)、特异腐质霉(Humicolainsolens)、疏棉状腐质霉(Humicola lanuginosa)、米黑毛霉(Mucormiehei)、嗜热毁丝霉(Myceliophthora thermophila)、粗糙脉孢菌(Neurospora crassa)、巴西青霉(Penicillium brasilianum)、沙门柏干酪青霉(Penicillium camembertii)、胶囊青霉(Penicillium capsulatum)、产黄青霉(Penicillium chrysogenum)、Penicillium citreonigrum、桔青霉(Penicillium citrinum)、棒形青霉(Penicilliumclaviforme)、顶青霉(Penicillium corylophilum)、皮落青霉(Penicillium crustosum)、指状青霉(Penicillium digitatum)、Penicilliumexpansum、Penicillium funiculosum、平滑青霉(Penicillium glabrum)、粒状青霉(Penicillium granulatum)、灰黄青霉(Penicillium griseofulvum)、岛青霉(Penicillium islandicum)、意大利青霉(Penicillium italicum)、微紫青霉(Penicillium janthinellum)、铅色青霉(Penicillium lividum)、大孢青霉(Penicillium megasporum)、梅林青霉(Penicillium melinii)、特异青霉(Penicilliumnotatum)、草酸青霉(Penicillium oxalicum)、软毛青霉(Penicillium puberulum)、变紫青霉(Penicillium purpurescens)、产紫青霉(Penicillium purpurogenum)、娄地青霉(Penicillium roquefortii)、皱褶青霉(Penicillium rugulosum)、小刺青霉(Penicillium spinulosum)、瓦克曼青霉(Penicillium waksmanii)、哈茨木霉(Trichoderma harzianum)、康宁木霉(Trichoderma koningii)、长枝木霉(Trichoderma longibrachiatum)、里氏木霉(Trichoderma reesei)或绿色木霉(Trichoderma viride)多肽,其具有内切葡聚糖酶活性。
在另一优选的方面,所述多肽是Thielavia achromatica、Thielaviaalbomyces、Thielavia albopilosa、Thielavia australeinsis、Thielavia fimeti、小孢梭孢壳(Thielavia microspora)、Thielavia ovispora、Thielavia peruviana、瘤孢梭孢壳(Thielavia spededonium)、毛梭孢壳(Thielavia setosa)、Thielaviasubthermophila、土生梭孢霉(Thielavia terrestris)、栖土梭孢壳(Thielaviaterricola)、嗜热梭孢壳(Thielavia thermophila)、Thielavia variospora或Thielaviawareingii多肽,其具有内切葡聚糖酶活性。
在更优选的方面,所述多肽是土生梭孢霉多肽,并且最优选是土生梭孢霉NRRL8126多肽,例如SEQ ID NO:2或SEQ ID NO:4的多肽或其成熟多肽。
在另一更优选的方面,所述多肽是Cladorrhinum foecundissimum多肽,最优选是Cladorrhinum foecundissimum ATCC 62373多肽,例如,SEQ ID NO:6的多肽或其成熟多肽。
可理解的是对于前述的种,本发明包含完全和不完全阶段(perfect andimperfect states),和其它分类学的等同物(equivalent),例如无性型(anamorph),而无论它们已知的种名。本领域熟练技术人员将容易地识别适合的等同物的同一性。
这些种的菌株在许多培养物保藏中心对于公众能够容易地取得,所述保藏中心诸如美国典型培养物保藏中心(the American Type Culture Collection)(ATCC)、德意志微生物和细胞培养物保藏中心(Deutsche Sammlung vonMikroorganismen und Zellkulturen GmbH)(DSM)、真菌菌种保藏中心(Centraalbureau Voor Schimmelcultures)(CBS)和农业研究机构专利培养物保藏中心北区研究中心(Agricultural Research Service Patent Culture Collection,Northern Regional Research Center)(NRRL)。
此外,可以使用上述的探针从其它来源,包括从自然界(例如,土壤、堆肥、水等)分离的微生物鉴定和获得这些多肽。用于从天然生境(habitat)分离微生物的技术是本领域内公知的。随后可通过相似地筛选这种微生物的基因组或cDNA文库来获得所述多核苷酸。一旦用所述探针检测到编码多肽的多核苷酸序列,就能够使用本领域普通技术人员熟知的技术将所述多核苷酸分离或克隆(参见,例如,Sambrook等,1989,见上文)。
本发明的多肽还包括融合多肽或可切割的融合多肽,其中将另外的多肽融合到所述多肽或其片段的N末端或C末端。通过将编码另一个多肽的核苷酸序列(或其部分)融合于本发明的核苷酸序列(或其部分)来产生融合的多肽。产生融合多肽的技术是本领域已知的,并包括连接编码多肽的编码序列以使它们在阅读框中,并且使融合多肽的表达在相同启动子和终止子的控制下。
融合多肽还可以包括切割位点。一旦分泌了融合多肽,就切割所述位点,从融合蛋白质释放具有内切葡聚糖酶活性的多肽。
切割位点的实例包括,但不限于,编码二肽Lys-Arg的Kex2位点(Martin等,2003,J.Ind.Microbiol.Biotechnol.3:568-76;Svetina等,2000,J.Biotechnol.76:245-251;Rasmussen-Wilson等,1997,Appl.Environ.Microbiol.63:3488-3493;Ward等,1995,Biotechnology 13:498-503;和Contreras等,1991,Biotechnology 9:378-381);Ile-(Glu或Asp)-Gly-Arg位点,其在精氨酸残基后通过Factor Xa蛋白酶切割(Eaton等,1986,Biochem.25:505-512);Asp-Asp-Asp-Asp-Lys位点,其在赖氨酸后通过肠激酶切割(Collins-Racie等,1995,Biotechnology 13:982-987);His-Tyr-Glu位点或His-Tyr-Asp位点,其通过Genenase I切割(Carter等,1989,Proteins:Structure,Function,and Genetics 6:240-248);Leu-Val-Pro-Arg-Gly-Ser位点,其在Arg后通过凝血酶切割(Stevens,2003,Drug Discovery World 4:35-48);Glu-Asn-Leu-Tyr-Phe-Gln-Gly位点,其在Gln后通过TEV蛋白酶切割(Stevens,2003,见上文);和Leu-Glu-Val-Leu-Phe-Gln-Gly-Pro位点,其在Gln后通过基因工程形式的人鼻病毒3C蛋白酶切割(Stevens,2003,见上文)。
多核苷酸
本发明还涉及分离的多核苷酸,其包含编码本发明具有内切葡聚糖酶活性的多肽的核苷酸序列,或由编码本发明具有内切葡聚糖酶活性的多肽的核苷酸序列组成。
在优选的方面,核苷酸序列包含SEQ ID NO:1或由SEQ ID NO:1组成。在另一更优选的方面,核苷酸序列包含大肠杆菌NRRL B-30899中所含质粒pPH50中的序列,或由该序列其组成。在另一优选方面,核苷酸序列包含SEQID NO:1的成熟多肽编码区或由SEQ ID NO:1的成熟多肽编码区组成。在另一优选方面,核苷酸序列包含SEQ IDNO:1的核苷酸79至1461或由SEQ IDNO:1的核苷酸79至1461组成。在另一更优选的方面,核苷酸序列包含大肠杆菌NRRL B-30899中所含质粒pPH50中的成熟多肽编码区或由大肠杆菌NRRL B-30899中所含质粒pPH50中的成熟多肽编码区组成。本发明还包含编码多肽的核苷酸序列,所述多肽包含SEQ ID NO:2的氨基酸序列或其成熟多肽,或由SEQ ID NO:2的氨基酸序列或其成熟多肽组成;由于遗传密码的简并性,所述核苷酸序列不同于SEQ ID NO:1或其成熟多肽编码序列。本发明还涉及SEQ ID NO:1的亚序列,所述亚序列编码具有内切葡聚糖酶活性的SEQ ID NO:2的片段。
在另一优选的方面,核苷酸序列包含SEQ ID NO:3或由SEQ ID NO:3组成。在另一更优选的方面,核苷酸序列包含大肠杆菌NRRL B-30896中所含质粒pPH38中的序列,或由该序列其组成。在另一优选的方面,核苷酸序列包含SEQ ID NO:3的成熟多肽编码区或由SEQ ID NO:3的成熟多肽编码区组成。在另一的优选方面,核苷酸序列包含SEQ ID NO:3的核苷酸74至1349或由SEQ ID NO:3的核苷酸74至1349组成。在另一的更优选的方面,核苷酸序列包含大肠杆菌NRRL B-30896中所含质粒pPH38中的成熟多肽编码区或由大肠杆菌NRRL B-30896中所含质粒pPH38中的成熟多肽编码区组成。本发明还包含编码多肽的核苷酸序列,所述多肽包含SEQ ID NO:4的氨基酸序列或其成熟多肽,或由SEQ ID NO:4的氨基酸序列或其成熟多肽组成;由于遗传密码的简并性,所述核苷酸序列不同于SEQ ID NO:3或其成熟多肽编码序列。本发明还涉及SEQ ID NO:3的亚序列,所述亚序列编码具有内切葡聚糖酶活性的SEQ ID NO:4的片段。
在另一优选的方面,核苷酸序列包含SEQ ID NO:5或由SEQ ID NO:5组成。在另一更优选的方面,核苷酸序列包含大肠杆菌NRRL B-30897中所含质粒pPH46中的序列,或由该序列其组成。在另一优选方面,核苷酸序列包含SEQ ID NO:5的成熟多肽编码区或由SEQ ID NO:5的成熟多肽编码区组成。在另一优选方面,核苷酸序列包含SEQ ID NO:5的核苷酸107至1372或由SEQ ID NO:5的核苷酸107至1372组成。在另一更优选的方面,核苷酸序列包含大肠杆菌NRRL B-30897中所含质粒pPH46中的成熟多肽编码区或由大肠杆菌NRRL B-30897中所含质粒pPH46中的成熟多肽编码区组成。本发明还包含编码下述多肽的核苷酸序列,所述多肽包含SEQ ID NO:6的氨基酸序列或其成熟多肽,或由SEQ ID NO:6的氨基酸序列或其成熟多肽组成;由于遗传密码的简并性,所述核苷酸序列不同于SEQ ID NO:5或其成熟多肽编码序列。本发明还涉及SEQ ID NO:5的亚序列,所述亚序列编码具有内切葡聚糖酶活性的SEQ ID NO:6的片段。
本发明还涉及突变多核苷酸,所述突变多核苷酸在SEQ ID NO:1、SEQID NO:3或SEQ ID NO:5的成熟多肽编码序列中包含至少一个突变或由具有至少一个突变的SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5的成熟多肽编码序列组成,其中所述突变核苷酸序列编码SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:6的成熟多肽。在优选的方面,所述成熟多肽是SEQ ID NO:2的氨基酸23至464。在另一优选的方面,所述成熟多肽是SEQ ID NO:4的氨基酸20至423。在另一优选的方面,所述成熟多肽是SEQ ID NO:6的氨基酸19至440。
用于分离或克隆编码多肽的多核苷酸的技术是本领域内已知的,包括从基因组DNA分离,从cDNA制备,或其组合。可通过例如使用熟知的聚合酶链式反应(PCR)或表达文库的抗体筛选来检测具有共有结构特性的克隆DNA片段,从而实现从这种基因组DNA克隆本发明的多核苷酸。参见,例如,Innis等,1990,PCR:AGuide to Methodsand Application,Academic Press,New York。可以使用其它核酸扩增方法,如连接酶链式反应(LCR)、连接活化转录(ligated activated transcription;LAT)和基于核苷酸序列的扩增(NASBA)。可以从嗜热毁丝霉CBS 117.65、担子菌CBS 494.95或担子菌CBS495.95菌株,或其它或相关生物体克隆多核苷酸,并且因此可以是例如所述核苷酸序列的多肽编码区的等位基因变体或种变体(species variant)。
本发明还涉及分离的多核苷酸,其包含下述核苷酸序列或由其组成,所述核苷酸序列与SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5的成熟多肽编码序列具有至少60%,优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,更优选至少85%,更优选至少90%,甚至更优选至少95%,并且最优选至少97%同一性的同一性程度,所述多核苷酸编码活性多肽。在优选的方面,所述成熟多肽编码序列是SEQ ID NO:1的核苷酸79至1461。在另一优选的方面,所述成熟多肽编码序列是SEQ ID NO:3的核苷酸74至1349。在另一优选的方面,所述成熟多肽编码序列是SEQ ID NO:5的核苷酸107至1372。
修饰编码本发明多肽的核苷酸序列对于合成与所述多肽基本上相似的多肽可为必需的。术语与所述多肽“基本上相似”指多肽的非天然存在的形式。这些多肽可能以一些工程改造的方式而不同于从其天然来源分离的多肽,例如,比活性、热稳定性、最适pH等方面不同的人工变体。可以在作为SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5的多肽编码区存在的核苷酸序列,例如其亚序列的基础上,和/或通过引入如下核苷酸取代来构建变体序列:所述取代不产生由核苷酸序列编码的多肽的另外的氨基酸序列,但是符合意欲产生酶的宿主生物体的密码子选择;或者所述取代可产生不同的氨基酸序列。关于核苷酸取代的概述,参见,例如,Ford等,1991,Protein Expressionand Purification 2:95-107。
对于本领域技术人员显而易见的是,这些取代能够在对于分子功能重要的区域之外进行,并且仍然产生活性多肽。对于由本发明的分离的多核苷酸编码的多肽活性关键的并且因此优选不进行取代的氨基酸残基,可以根据本领域公知的方法,例如定位诱变或丙氨酸分区诱变法(参见,例如,Cunningham和Wells,1989,见上文)来鉴定。在后一技术中,将突变引入到分子中的每个荷正电的残基处,并且测试所得突变分子的内切葡聚糖酶活性,以鉴定对于所述分子的活性关键的氨基酸残基。底物-酶相互作用的位点也能够通过分析三维结构测定,通过如核磁共振分析、晶体学或光亲和标记这样的技术来测定(参见,例如,deVos等,1992,见上文;Smith等,1992,见上文;Wlodaver等,1992,见上文)。
本发明还涉及编码本发明多肽的分离的多核苷酸,所述分离的多核苷酸在非常低严紧条件下,优选低严紧条件,更优选中等严紧条件,更优选中-高严紧条件,甚至更优选高严紧条件,并且最优选非常高的严紧条件下,与以下序列杂交:(i)SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5的成熟多肽编码序列,(ii)包含于SEQ ID NO:1或SEQ ID NO:5的成熟多肽编码序列中的cDNA序列或者包含SEQ ID NO:3的成熟多肽编码序列的基因组DNA序列,或(iii)(i)或(ii)的互补链;或它们的等位变体和亚序列(Sambrook等,1989,同上),如本文所定义的。在优选的方面,所述成熟多肽编码序列是SEQ ID NO:1的核苷酸79至1461。在另一优选的方面,所述成熟多肽编码序列是SEQ ID NO:3的核苷酸74至1349。在另一优选的方面,所述成熟多肽编码序列是SEQ ID NO:5的核苷酸107至1372。在另一优选的方面,所述互补链是SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5的成熟多肽编码序列的全长互补链。
本发明还涉及分离的多核苷酸,所述分离的多核苷酸通过以下方法获得:(a)在非常低、低、中、中-高、高或非常高严紧条件下,将DNA的群体与以下杂交:(i)SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5的成熟多肽编码序列,(ii)包含于SEQ ID NO:1或SEQ ID NO:5的成熟多肽编码序列中的cDNA序列或者包含SEQ ID NO:3的成熟多肽编码序列的基因组DNA序列,或(iii)(i)或(ii)的互补链;和(b)分离杂交的多核苷酸,其编码具有内切葡聚糖酶活性的多肽。在优选的方面,所述成熟多肽编码序列是SEQ ID NO:1的核苷酸79至1461。在另一优选的方面,所述成熟多肽编码序列是SEQ IDNO:3的核苷酸74至1349。在另一优选的方面,所述成熟多肽编码序列是SEQ ID NO:5的核苷酸107至1372。在另一优选的方面,所述互补链是SEQID NO:1、SEQ ID NO:3或SEQ ID NO:5的成熟多肽编码序列的全长互补链。
核酸构建体
本发明还涉及包含本发明的分离的多核苷酸的核酸构建体,所述分离的多核苷酸与一个或几个调控序列可操作地连接,所述调控序列在合适的宿主细胞中在与该调控序列相容的条件下指导编码序列的表达。
可以用许多方式操作编码本发明多肽的分离的多核苷酸以提供多肽的表达。依赖于表达载体,在将多核苷酸的序列插入载体之前对其进行操作可能是理想的或必需的。使用重组DNA方法修饰多核苷酸序列的技术是本领域熟知的。
调控序列可以是适当的启动子序列,其是由用于表达编码本发明多肽的多核苷酸的宿主细胞识别的核苷酸序列。启动子序列含有介导多肽的表达的转录调控序列。启动子可以是在所选的宿主细胞中显示转录活性的任何核苷酸序列,包括突变的、截断的和杂合的启动子,并且可以从编码与宿主细胞同源或异源的胞外或胞内多肽的基因获得。
用于指导本发明的核酸构建体转录,特别是在细菌宿主细胞中转录的合适启动子的实例是从下述获得的启动子:大肠杆菌lac操纵子、天蓝色链霉菌(Streptomyces coelicolor)琼脂糖酶基因(dagA)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌α-淀粉酶基因(amyL)、嗜热脂肪芽孢杆菌产麦芽淀粉酶基因(amyM)、解淀粉芽孢杆菌α-淀粉酶基因(amyQ)、地衣芽孢杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因和原核β-内酰胺酶基因(Villa-Kamaroff等,1978,Proceedings of the National Academy of Sciences USA75:3727-3731),以及tac启动子(DeBoer等,1983,Proceedings of the NationalAcademy of Sciences USA 80:21-25)。另外的启动子在"Useful proteins fromrecombinant bacteria"于Scientific American,1980,242:74-94中;和在Sambrook等,1989,见上文中描述。
用于指导本发明的核酸构建体在丝状真菌宿主细胞中转录的合适启动子的实例是从下列酶的基因获得的启动子:米曲霉TAKA淀粉酶、曼赫根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、曼赫根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、构巢曲霉乙酰胺酶、镶片镰孢淀粉葡糖苷酶(WO 00/56900)、镶片镰孢Daria(WO 00/56900)、镶片镰孢Quinn(WO 00/56900)、尖镰孢胰蛋白酶样蛋白酶(WO 96/00787)、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶IV、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉β-木糖苷酶,以及NA2-tpi启动子(来自黑曲霉中性α-淀粉酶基因和米曲霉丙糖磷酸异构酶基因的启动子的杂合体);和它们的突变的、截断的和杂合的启动子。
在酵母宿主中,有用的启动子从如下酶的基因获得:酿酒酵母烯醇化酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH1,ADH2/GAP)、酿酒酵母丙糖磷酸异构酶(TPI)、酿酒酵母金属硫蛋白(CUP1)和酿酒酵母3-磷酸甘油酸激酶。对于酵母宿主细胞其它有用的启动子由Romanos等,1992,Yeast 8:423-488描述。
调控序列也可以是合适的转录终止子序列,是由宿主细胞识别以终止转录的序列。所述终止子序列与编码所述多肽的核苷酸序列的3’末端可操作地连接。可以将在所选宿主细胞中有功能的任何终止子用在本发明中。
对于丝状真菌宿主细胞优选的终止子从如下酶的基因获得:米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉α-葡糖苷酶和尖镰孢胰蛋白酶样蛋白酶。
对于酵母宿主细胞优选的终止子从如下酶的基因获得:酿酒酵母烯醇化酶、酿酒酵母细胞色素C(CYC1)和酿酒酵母甘油醛-3-磷酸脱氢酶。对于酵母宿主细胞其它有用的终止子由Romanos等,1992,见上文描述。
调控序列还可以是合适的前导序列,其是对于宿主细胞的翻译重要的mRNA非翻译区。前导序列可操作地连接于编码多肽的核苷酸序列的5’-末端。可以将在所选宿主细胞中有功能的任何前导序列用在本发明中。
对于丝状真菌宿主细胞优选的前导序列从如下酶的基因获得:米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶。
对于酵母宿主细胞合适的前导序列从如下酶的基因获得:酿酒酵母烯醇化酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α因子和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。
调控序列也可以是聚腺苷酸化序列,其是与核苷酸序列的3’末端可操作地连接的序列,并且在转录时,宿主细胞将其识别为信号以将聚腺苷残基添加至转录的mRNA。可以将在所选宿主细胞中有功能的任何聚腺苷酸化序列在本发明中使用。
对于丝状真菌宿主细胞优选的聚腺苷酸化序列从如下酶的基因获得:米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖镰孢胰蛋白酶样蛋白酶和黑曲霉α-葡糖苷酶。
对于酵母宿主细胞有用的聚腺苷酸化序列由Guo和Sherman,1995,Molecular Cellular Biology 15:5983-5990描述。
调控序列还可以是信号肽编码区,其编码与多肽的氨基末端相连的氨基酸序列,并且指导编码的多肽进入细胞分泌途径。核苷酸序列的编码序列5’端可固有地包含信号肽编码区,其与编码分泌多肽的编码区片段一起天然地连接在翻译阅读框中。可供选择的是,编码序列5’端可含有对于所述编码序列异源的信号肽编码区。异源信号肽编码区在编码序列不天然地含有信号肽编码区时可为必需的。或者,外源信号肽编码区可以简单地取代天然信号肽编码区以增强多肽的分泌。然而,指导表达的多肽进入所选宿主细胞的分泌途径(即,分泌至培养基中)的任何信号肽编码区可在本发明中使用。
对于细菌宿主细胞有效的信号肽编码区是从如下酶的基因获得的信号肽编码区:芽孢杆菌属NCIB 11837产麦芽糖淀粉酶、嗜热脂肪芽孢杆菌α-淀粉酶、地衣芽孢杆菌枯草蛋白酶(subtilisin)、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT,nprS,nprM)和枯草芽孢杆菌prsA。另外的信号肽由Simonen和Palva,1993,Microbiological Reviews 57:109-137描述。
对于丝状真菌宿主细胞有效的信号肽编码区是从如下酶的基因获得的信号肽编码区:米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、曼赫根毛霉天冬氨酸蛋白酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶V和疏棉状腐质霉脂肪酶。
对于酵母宿主细胞有用的信号肽从酿酒酵母α因子和酿酒酵母转化酶的基因获得。其它有用的信号肽编码区由Romanos等,1992,见上文描述。
在优选的方面,信号肽是SEQ ID NO:2的氨基酸1至22。在另一优选的方面,信号肽编码区是SEQ ID NO:1的核苷酸13至79。
在另一优选的方面,信号肽是SEQ ID NO:4的氨基酸1至19。在另一优选的方面,信号肽编码区是SEQ ID NO:3的核苷酸17至73。
在另一优选的方面,信号肽是SEQ ID NO:6的氨基酸1至18。在另一优选的方面,信号肽编码区是SEQ ID NO:5的核苷酸53至106。
调控序列还可以是前肽编码区,其编码位于多肽氨基末端的氨基酸序列。所得多肽称为酶原(proenzyme)或前多肽(propolypeptide)(或在某些情况下称为酶原(zymogen))。前多肽通常是无活性的并且能够通过前肽的催化或自催化切割从前多肽转化为成熟活性多肽。可以从枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、酿酒酵母α因子、曼赫根毛霉天冬氨酸蛋白酶和嗜热毁丝霉漆酶(WO 95/33836)的基因获得前肽编码区。
当信号肽和前肽区二者均出现在多肽的氨基末端时,将前肽区置于紧接着(next to)多肽氨基末端,并且将信号肽区置于紧接着前肽区的氨基末端。
同样理想的是添加调节序列,其允许相对于宿主细胞的生长来调节多肽的表达。调节系统的实例是引起基因表达响应化学或物理刺激物,包括调节化合物的存在而开启或关闭的那些系统。原核系统中的调节系统包括lac、tac和trp操纵基因系统。在酵母中,可以使用ADH2系统或GAL1系统。在丝状真菌中,可以使用TAKAα-淀粉酶启动子、黑曲霉葡糖淀粉酶启动子和米曲霉葡糖淀粉酶启动子作为调节序列。调节序列的其它实例是那些允许基因扩增的序列。在真核系统中,这些序列包括在氨甲蝶呤(methotrexate)存在下扩增的二氢叶酸还原酶基因,和以重金属(with heavy metal)扩增的金属硫蛋白基因。在这些情况下,编码多肽的核苷酸序列将与调节序列可操作地连接。
表达载体
本发明还涉及重组表达载体,所述重组表达载体包含本发明的多核苷酸、启动子和转录和翻译终止信号。本文所述的多种核酸和调控序列可以结合在一起以产生重组表达载体,所述表达载体可以包括一个或几个方便的限制位点以允许在这些位点插入或取代编码多肽的核苷酸序列。可供选择的是,可以通过在适当的用于表达的载体中插入包含所述序列的核苷酸序列或核酸构建体来表达本发明的核苷酸序列。在制备表达载体的过程中,将编码序列置于载体中,从而将该编码序列与适当的表达调控序列可操作地连接。
重组表达载体可以是任何载体(例如,质粒或病毒),其能够方便地进行重组DNA步骤,并且能够产生核苷酸序列的表达。载体的选择将通常依赖于载体与将引入该载体的宿主细胞的相容性。载体可以是线状或闭合环状质粒。
载体可以是自主复制载体,即,作为染色体外实体(entity)存在的载体,其复制独立于染色体复制,例如,质粒、染色体外元件、微型染色体(minichromosome)或人工染色体。载体可以含有任何用于确保自复制的手段(means)。或者,载体可以是一种当被引入宿主细胞中时,整合到基因组中并且与整合了该载体的染色体一起复制的载体。此外,可以使用单独的载体或质粒或两个或更多个载体或质粒,其共同含有待引入宿主细胞基因组的完整DNA(total DNA),或可以使用转座子(transposon)。
本发明的载体优选地含有一个或几个选择性标记,其允许简单选择经转化、转染、转导等的细胞。选择性标记是基因,其产物提供杀生物剂或病毒抗性、对重金属的抗性、对营养缺陷型的原养性(prototrophy to auxotrophs)等。
细菌选择性标记的实例是来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因,或赋予抗生素抗性的标记,所述抗生素抗性例如氨苄青霉素、卡那霉素、氯霉素或四环素抗性。对于酵母宿主细胞合适的标记是ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于丝状真菌宿主细胞的选择性标记包括但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草铵膦(phosphinothricin)乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)(nitrate reductase)、pyrG(乳清酸核苷-5’-磷酸脱羧酶)(orotidine-5’-phosphatedecarboxylase)、sC(硫酸腺苷酰转移酶)和trpC(邻氨基苯甲酸合酶(anthranilate synthase))以及它们的等价物。优选用在曲霉属细胞中的是构巢曲霉或米曲霉的amdS和pyrG基因和吸水链霉菌(Streptomyces hygroscopicus)的bar基因。
本发明的载体优选含有元件,其允许载体整合入宿主细胞基因组或载体在细胞中独立于基因组的自主复制。
为了整合入宿主细胞基因组,载体可依赖编码多肽的多核苷酸的序列或用于通过同源或非同源重组整合入基因组的任何其它载体元件。或者,载体可以含有额外的核苷酸序列,用于指导通过同源重组整合入宿主细胞基因组染色体中的精确位置。为了增加在精确位置整合的可能性,整合元件应优选含有足够数量的核酸,如100至10,000碱基对,优选400至10,000碱基对,并且最优选800至10,000碱基对,其与相应的目标序列具有高度同一性以增强同源重组的概率。整合元件可以是任何序列,其与宿主细胞基因组中的目标序列同源。此外,整合元件可以是非编码或编码的核苷酸序列。另一方面,可以将载体通过非同源重组整合到宿主细胞的基因组中。
为了自主复制,载体可以还包含复制起点,其使载体能够在所述的宿主细胞中自主地复制。复制起点可以是介导自主复制的任何质粒复制子(replicator),其在细胞中发挥功能。术语“复制起点”或“质粒复制子”在本文定义为能够使质粒或载体体内复制的核苷酸序列。
细菌复制起点的实例是允许在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177和pACYC184的复制起点,和允许在芽孢杆菌属中复制的质粒pUB110、pE194、pTA1060和pAMβ1的复制起点。
用于酵母宿主细胞中的复制起点的实例是2微米复制起点,ARS1,ARS4,ARS1和CEN3的组合,和ARS4和CEN6的组合。
在丝状真菌细胞中有用的复制起点的实例是AMA1和ANS1(Gems等,1991,Gene 98:61-67;Cullen等,1987,Nucleic Acids Research 15:9163-9175;WO 00/24883)。分离AMA1基因和构建包含该基因的质粒或载体能够根据公开于WO 00/24883中的方法完成。
可以将多于一个拷贝的本发明的多核苷酸插入宿主细胞以增加基因产物的产生。多核苷酸拷贝数的增加可通过如下方法获得:将至少一个额外拷贝的序列整合入宿主细胞基因组,或将可扩增的选择性标记基因包括于多核苷酸,其中可通过在合适的选择剂(selectable agent)存在下培养细胞来选择含有选择性标记基因的扩增拷贝的细胞,和由此得到多核苷酸的额外拷贝。
用于连接上述元件以构建本发明的重组表达载体的方法是本领域技术人员熟知的(参见,例如,Sambrook等,1989,见上文)。
宿主细胞
宿主细胞可以是在本发明的多肽的重组产生中有用的任何细胞,例如,原核或真核细胞。
原核宿主细胞可以是任何革兰氏阳性细菌或革兰氏阴性细菌。革兰氏阳性细菌包括但不限于,芽孢杆菌属、链球菌属、链霉菌属、葡萄球菌属、肠球菌属、乳酸菌属、乳球菌属、梭菌属、Geobacillus和Oceanobacillus。革兰氏阴性细菌包括但不限于,大肠杆菌、假单胞菌属、沙门氏菌属、弯曲杆菌属、螺杆菌属、黄杆菌属、梭杆菌属、泥杆菌属、奈瑟氏菌属和脲原体属。
细菌宿主细胞可以是任何芽孢杆菌属细胞。在本发明的实施中有用的芽孢杆菌属细胞包括但不限于,嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌和苏云金芽孢杆菌细胞。
在优选的方面,细菌宿主细胞是解淀粉芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、嗜热脂肪芽孢杆菌或枯草芽孢杆菌细胞。在更优选的方面,细菌宿主细胞是解淀粉芽孢杆菌细胞。在另一个更优选的方面,细菌宿主细胞是克劳氏芽孢杆菌细胞。在另一个更优选的方面,细菌宿主细胞是地衣芽孢杆菌细胞。在另一个更优选的方面,细菌宿主细胞是枯草芽孢杆菌细胞。
细菌宿主细胞还可以是任何链球菌细胞。在本发明的实施中有用的链球菌细胞包括但不限于,似马链球菌、酿脓链球菌、乳房链球菌和马链球菌兽瘟亚种。
在优选的方面,细菌宿主细胞是似马链球菌细胞。在另一个优选的方面,细菌宿主细胞是酿脓链球菌细胞。在另一个优选的方面,细菌宿主细胞是乳房链球菌细胞。在另一个优选的方面,细菌宿主细胞是马链球菌兽瘟亚种细胞。
细菌宿主细胞还可以是任何链霉菌细胞。在本发明的实施中有用的链霉菌细胞包括但不限于,不产色链霉菌、阿维链霉菌、天蓝链霉菌、灰色链霉菌和浅青紫链霉菌。
在优选的方面,细菌宿主细胞是不产色链霉菌细胞。在另一个优选的方面,细菌宿主细胞是阿维链霉菌细胞。在另一个优选的方面,细菌宿主细胞是天蓝链霉菌细胞。在另一个优选的方面,细菌宿主细胞是灰色链霉菌细胞。在另一个优选的方面,细菌宿主细胞是浅青紫链霉菌细胞。
可通过如下方法实现将DNA引入到芽孢杆菌属细胞:例如原生质体转化(参见,例如,Chang和Cohen,1979,Molecular General Genetics 168:111-115),使用感受态细胞(参见,例如,Young和Spizizen,1961,Journal ofBacteriology 81:823-829或Dubnau和Davidoff-Abelson,1971,Journal ofMolecular Biology 56:209-221),电穿孔(参见,例如,Shigekawa和Dower,1988,Biotechniques 6:742-751)或接合(参见,例如,Koehler和Thorne,1987,Journalof Bacteriology 169:5771-5278)。可通过如下方法实现将DNA引入到大肠杆菌细胞:例如原生质体转化(参见,例如,Hanahan,1983,J.Mol.Biol.166:557-580)或电穿孔(参见,例如,Dower等,1988,Nucleic Acids Res.16:6127-6145)。可通过如下方法实现将DNA引入到链霉菌细胞:例如原生质体转化和电穿孔(参见,例如,Gong等,2004,Folia Microbiol.(Praha)49:399-405),接合(参见,例如,Mazodier等,1989,J.Bacteriol.171:3583-3585),或转导(参见,例如,Burke等,2001,Proc.Natl.Acad.Sci.USA 98:6289-6294)。可通过如下方法实现将DNA引入到假单胞菌细胞:例如电穿孔(参见,例如,Choi等,2006,J.Microbiol.Methods 64:391-397)或接合(参见,例如,Pinedo和Smets,2005,Appl.Environ.Microbiol.71:51-57)。可通过如下方法实现将DNA引入到链球菌细胞:例如天然感受态(natural competence)(参见,例如,Perry和Kuramitsu,1981,Infect.Immun.32:1295-1297),原生质体转化(参见,例如,Catt和Jollick,1991,Microbios.68:189-2070),电穿孔(参见,例如,Buckley等,1999,Appl.Environ.Microbiol.65:3800-3804)或接合(参见,例如,Clewell,1981,Microbiol.Rev.45:409-436)。然而,可以使用任何已知的将DNA引入宿主细胞的方法。
宿主细胞还可以是真核生物,如哺乳动物、昆虫、植物或真菌细胞。
在优选的方面,宿主细胞是真菌细胞。“真菌”用在本文包括以下门:子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)和接合菌门(Zygomycota)(如由Hawksworth等,于AinsworthandBisby’sDictionary of The Fungi,8th edition,1995,CAB International,University Press,Cambridge,UK中所定义)以及卵菌门(Oomycota)(如Hawksworth等,1995,见上,171页中所引用),和所有有丝分裂孢子真菌(mitosporic fungi)(Hawksworth等,1995,见上)。
在更优选的方面,真菌宿主细胞是酵母细胞。“酵母”用在本文包括产子囊酵母(ascosporogenous yeast)(内孢霉目(Endomycetales))、产担子酵母(basidiosporogenous yeast)和属于半知菌类(Fungi Imperfecti)(芽孢纲(Blastomycetes))的酵母。由于酵母的分类在未来可能改变,就本发明而言,将酵母定义为如Biologyand Activities of Yeast(Skinner,F.A.,Passmore,S.M.,和Davenport,R.R.,eds,Soc.App.Bacteriol.Symposium Series No.9,1980)中所述。
在甚至更加优选的方面,酵母宿主细胞是念珠菌属、汉逊酵母属(Hansenula)、克鲁维酵母属、毕赤酵母属、酵母属、裂殖酵母属或西洋蓍霉属细胞。
在最优选的方面,酵母宿主细胞是卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母或卵形酵母细胞。在另一个最优选的方面,酵母宿主细胞是乳酸克鲁维酵母(Kluyveromyces lactis)细胞。在另一个最优选的方面,酵母宿主细胞是Yarrowia lipolytica细胞。
在另一个更优选的方面,真菌宿主细胞是丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门的亚门(如由Hawksworth等,1995,见上文,所定义)的所有丝状形式。丝状真菌通常的特征在于由壳多糖(chitin)、纤维素、葡聚糖、壳聚糖(chitosan)、甘露聚糖和其它复杂多糖组成的菌丝体壁。通过菌丝延伸进行营养生长,而碳分解代谢是专性需氧的。相反,酵母例如酿酒酵母的营养生长通过单细胞菌体的出芽生殖(budding)进行,而碳分解代谢可以是发酵的。
在甚至更优选的方面,丝状真菌宿主细胞是枝顶孢霉属、曲霉属、短梗霉属、烟管霉属(Bjerkandera)、Ceriporiopsis、金孢子菌属、鬼伞属(Coprinus)、革盖菌属(Coriolus)、隐球菌属、Filibasidium、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新考玛脂霉属、脉孢菌属、拟青霉属、青霉属、平革菌属(Phanerochaete)、射脉菌属(Phlebia)、瘤胃壶菌属、侧耳属(Pleurotus)、裂褶菌属、踝节菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属(Trametes)或木霉属细胞。
在最优选的方面,丝状真菌宿主细胞是泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉或米曲霉细胞。在另一个最优选方面,丝状真菌宿主细胞是杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢或镶片镰孢细胞。在另一个最优选的方面,丝状真菌宿主细胞是黑刺烟管菌(Bjerkanderaadusta)、Ceriporiopsis aneirina、Ceriporiopsis aneirina、Ceriporiopsis caregiea、Ceriporiopsis gilvescens、Ceriporiopsis pannocinta、Ceriporiopsis rivulosa、Ceriporiopsissubrufa、Ceriporiopsis subvermispora、嗜角质金孢子菌、Chrysosporium lucknowense、热带金孢子菌、Chrysosporium merdarium、Chrysosporium inops、毡金孢子菌、Chrysosporium queenslandicum、Chrysosporium zonatum、灰盖鬼伞(Coprinus cinereus)、毛革盖菌(Coriolushirsutus)、特异腐质霉、疏棉状腐质霉、米黑毛霉、嗜热毁丝霉、粗糙脉孢菌、巴西青霉、产紫青霉、黄孢平革菌(Phanerochaete chrysosporium)、辐射射脉菌(Phlebia radiata)、Pleurotus eryngii、土生梭孢霉、Trametes villosa、Trametes versicolor、哈茨木霉、康宁木霉、长枝木霉、里氏木霉或绿色木霉细胞。
可以将真菌细胞通过涉及原生质体形成、原生质体转化和细胞壁重建的方法以本身公知的方式转化。用于转化曲霉属和木霉属宿主细胞的合适方法在EP 238 023和Yelton等,1984,Proceedings of the National Academy ofSciences USA 81:1470-1474中描述。用于转化镰孢属菌种的合适方法由Malardier等,1989,Gene78:147-156和WO 96/00787描述。可以使用由如下文献描述的方法转化酵母:Becker和Guarente,于Abelson,J.N.和Simon,M.I.(编者),Guide to Yeast Genetics and Molecular Biology,Methods inEnzymology,Volume 194,pp182-187,Academic Press,Inc.,New York;Ito等,1983,Journal of Bacteriology 153:163;和Hinnen等,1978,Proceedings of theNational Academy of Sciences USA 75:1920。
产生方法
本发明还涉及用于产生本发明多肽的方法,其包括:(a)在有益于产生多肽的条件下培养细胞,所述细胞以其野生型形式产生所述多肽;和(b)回收所述多肽。在优选的方面,所述细胞是梭孢壳属的细胞。在另一优选的方面,所述细胞是枝鼻菌属(Cladorrhinum)属细胞。在更优选的方面,所述细胞是土生梭孢霉。在另一更优选的方面,所述细胞是Cladorrhinumfoecundissimum。在最优选的方面,所述细胞是土生梭孢霉NRRL8126。在另一最优选的方面,所述细胞是Cladorrhinum foecundissimum ATCC 62373。
本发明还涉及用于产生本发明的多肽的方法,其包括:(a)在有益于产生多肽的条件下培养宿主细胞;和(b)回收所述多肽。
本发明还涉及用于产生本发明的多肽的方法,包括:(a)在有益于产生多肽的条件下培养宿主细胞,其中所述宿主细胞包含突变核苷酸序列,其在SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5的成熟多肽编码序列中具有至少一个突变,其中所述突变核苷酸序列编码多肽,所述多肽包含SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:6的成熟多肽或由该成熟多肽组成,和(b)回收所述多肽。
在优选的方面,所述成熟多肽是SEQ ID NO:2的氨基酸23至464。在另一优选的方面,所述成熟多肽是SEQ ID NO:4的氨基酸20至423。在另一优选的方面,所述成熟多肽是SEQ ID NO:6的氨基酸19至440。在另一优选的方面,所述成熟多肽编码序列是SEQ ID NO:1的核苷酸79至1461。在另一优选的方面,所述成熟多肽编码序列是SEQ ID NO:3的核苷酸74至1349。在另一优选的方面,所述成熟多肽编码序列是SEQ ID NO:5的核苷酸107至1372。
在本发明的产生方法中,使用本领域熟知的方法在适合于产生所述多肽的营养培养基中培养细胞。例如,可以通过在合适培养基中和允许表达和/或分离所述多肽的条件下进行的摇瓶培养,和实验室或工业发酵罐中的小规模或大规模发酵(包括连续、分批、补料分批或固态发酵)来培养细胞。使用本领域已知的方法在合适的营养培养基中进行培养,所述营养培养基包含碳源和氮源和无机盐。合适的培养基能够从商业供应商获得或可以根据公开的组成制备(例如,在美国典型培养物保藏中心的目录中)。如果多肽分泌到营养培养基中,该多肽能够从所述培养基中直接回收。如果多肽不分泌到培养基中,其能够从细胞裂解物(lysate)回收。
可以使用本领域已知的对于所述多肽是特异性的方法来检测多肽。这些检测方法可包括特异性抗体的使用、酶产物的形成或酶底物的消失。例如,酶试验(enzyme assay)可用于测定如本文所述的多肽的活性。
所得多肽可以使用本领域已知的方法回收。例如,多肽可以通过常规方法从营养培养基中回收,所述常规方法包括但不限于离心、过滤、提取、喷雾干燥、蒸发或沉淀。
本发明的多肽可以通过多种本领域已知的方法纯化以获得基本上纯的多肽,所述方法包括但不限于层析(例如,离子交换、亲和、疏水、层析聚焦和大小排阻)、电泳方法(例如,制备型(preparative)等电聚焦)、差示溶解度(例如,硫酸铵沉淀)、SDS-PAGE或提取(参见,例如,Protein Purification,J.-C.Janson和Lars Ryden,editors,VCH Publishers,New York,1989)。
植物
本发明还涉及植物,例如,转基因植物、植物部分或植物细胞,其包含分离的多核苷酸,所述多核苷酸编码本发明具有内切葡聚糖酶活性的多肽,从而以可回收的量表达和产生所述多肽。多肽可从植物或植物部分回收。或者,同样可以将含有该重组多肽的植物或植物部分用于改进食品或饲料的质量,例如,改进营养价值、适口性(palatability)和流变性质(rheologicalproperties),或用于破坏抗营养因子。
转基因植物可以是双子叶的(双子叶植物)或单子叶的(单子叶植物)。单子叶植物的实例是草(grasses),如草地早熟禾(meadow grass)(蓝草(blue grass),早熟禾属(Poa));饲用牧草(forage grass)如羊茅属(Festuca)、黑麦草属(Lolium);寒地型牧草(temperate grass),如Agrostis(翦股颖属);和谷类,例如,小麦、燕麦、黑麦、大麦、稻(rice)、高粱和玉蜀黍(maize)(玉米)。
双子叶植物的实例是烟草(tobacco),豆类(legumes),如羽扇豆(lupins),马铃薯,糖甜菜(sugar beet),豌豆,豆(bean)和大豆(soybean)和十字花科的(cruciferous)植物(十字花科(family Brassicaceae)),如花椰菜(cauliflower),油菜籽(rape seed)和紧密相关的模型生物体拟南芥(Arabidopsis thaliana)。
植物部分的实例是茎(stem)、愈伤组织(callus)、叶(leaf)、根(root)、果实(fruit)、种子(seed)和块茎(tuber),以及包含这些部分的独立组织,例如,表皮(epidermis)、叶肉(mesophyll)、薄壁组织(parenchyme)、维管组织(vasculartissue)、分生组织(meristem)。具体的植物细胞区室(compartments),如叶绿体(chloroplast)、质外体(apoplast)、线粒体(mitochondria)、液泡(vacuole)、过氧化物酶体(peroxisome)和细胞质(cytoplasm)也被认为是植物部分。此外,任何植物细胞,无论什么组织来源,都被认为是植物部分。同样地,植物部分,如分离以促进本发明的应用的具体组织和细胞也被认为是植物部分,例如胚(embryo)、胚乳(endosperm)、糊粉(aleurone)和种皮(seed coat)。
同样包含于本发明范围内的还有这些植物、植物部分和植物细胞的子代。
表达本发明多肽的转基因植物或植物细胞可以依照本领域已知方法构建。简而言之,通过如下方法构建所述植物或植物细胞:将编码本发明多肽的一个或几个表达构建体并入植物宿主基因组或叶绿体基因组,并且将所得的修饰植物或植物细胞繁殖为转基因植物或植物细胞。
表达载体便利地是包含编码本发明多肽的多核苷酸的核酸构建体,所述多核苷酸与在选择的植物或植物部分中表达该多核苷酸序列所需的适当的调节序列可操作地连接。此外,表达构建体可以包含对于鉴定宿主细胞有用的选择性标记,在所述宿主细胞中整合了表达构建体和将该构建体引入到所述植物中所必需的DNA序列(后者依赖于使用的DNA引入方法)。
调节序列的选择,例如启动子和终止子序列和任选地信号或转运序列的选择,举例来说,基于期望何时、何处以及如何表达多肽而确定。例如,编码本发明多肽的基因的表达可以是组成型的或诱导型的,或可以是发育、阶段或组织特异性的,并且基因产物可以靶向特定的组织或植物部分例如种子或叶。调节序列由例如Tague等,1988,Plant Physiology 86:506所述。
对于组成性表达,可以使用35S-CaMV、玉米泛素1和稻肌动蛋白1启动子(Franck等,1980,Cell 21:285-294,Christensen等,1992,Plant Mo.Biol.18:675-689;Zhang等,1991,Plant Cell 3:1155-1165)。器官特异性启动子可以是例如来自贮藏库组织(storage sink tissue)例如种子、马铃薯块茎和果实的启动子(Edwards & Coruzzi,1990,Ann.Rev.Genet.24:275-303),或来自代谢库组织(metabolic sink tissue)例如分生组织的启动子(Ito等,1994,Plant Mol.Biol.24:863-878),种子特异性启动子诸如来自稻的谷蛋白(glutelin)、醇溶蛋白(prolamin)、球蛋白(globulin)或白蛋白(albumin)启动子(Wu等,1998,Plant andCell Physiology 39:885-889),来自豆球蛋白(legumin)B4和蚕豆(Viciafaba)的未知的种子蛋白基因的蚕豆启动子(Conrad等,1998,Journal of PlantPhysiology 152:708-711)、来自种子油体蛋白(oil body protein)的启动子(Chen等,1998,Plant and Cell Physiology 39:935-941),来自欧洲油菜(Brassica napus)的贮藏蛋白napA启动子,或本技术领域公知的任何其他种子特异性的启动子,例如,在WO 91/14772中所描述的。此外,启动子可为叶特异性的启动子,如来自稻或番茄的rbcs启动子(Kyozuka等,1993,Plant Physiology 102:991-1000),小球藻病毒(chlorella virus)腺嘌呤甲基转移酶(adeninemethyltransferase)基因启动子(Mitra和Higgins,1994,Plant Molecular Biology26:85-93),或来自稻的aldP基因启动子(Kagaya等,1995,Molecular andgeneral genetics 248:668-674),或伤口诱导的启动子,如马铃薯pin2启动子(Xu等,1993,Plant Molecular Biology 22:573-588)。同样地,所述启动子可通过非生物的处理诱导,所述非生物的处理诸如温度、干旱或盐度变化,或通过外源施加的激活所述启动子的物质诱导,例如乙醇、雌激素(oestrogens)、植物激素(plant hormones)如乙烯、脱落酸(abscisic acid)和赤霉酸(gibberellicacid),和重金属。
启动子增强子元件也可以用于实现本发明多肽在植物中的较高表达。例如,启动子增强子元件可以是内含子,其置于启动子和编码本发明多肽的核苷酸序列之间。例如Xu等,1993,见上,公开了使用稻肌动蛋白1基因的第一内含子以增强表达。
选择性标记基因和表达构建体的任何其它部分可以选自本领域内可用的那些。
将核酸构建体根据本领域已知的常规技术并入植物基因组,所述常规技术包括土壤杆菌属(Agrobacterium)介导的转化、病毒介导的转化、显微注射(microinjection)、粒子轰击、生物射弹转化和电穿孔(Gasser等,1990,Science244:1293;Potrykus,1990,Bio/Technology 8:535;Shimamoto等,1989,Nature338:274)。
目前,根癌土壤杆菌(Agrobacterium tumefaciens)介导的基因转移(genetransfer),是产生转基因双子叶植物的优选方法(为了参考,见Hooykas和Schilperoort,1992,Plant Molecular Biology 19:15-38),而且它也可以用于转化单子叶植物,虽然对于这些植物其他的转化方法是常用的。目前,产生转基因单子叶植物的优选的方法,是用粒子(用转化DNA涂覆的微观的金或钨粒子)轰击胚愈伤组织(embryonic calli)或发育中的胚(developing embryos)(Christou,1992,Plant Journal 2:275-281;Shimamoto,1994,Current OpinionBiotechnology 5:158-162;Vasil等,1992,Bio/Technology 10:667-674)。转化单子叶植物的可供选择的方法是基于原生质体转化,如由Omirulleh等,1993,Plant Molecular Biology 21:415-428所描述的。
转化之后,根据本领域熟知的方法选择具有并入的表达构建体的转化体并且再生成为完整植物。通常设计转化方法用于通过如下方法在再生期间或在后续世代中选择性消除选择基因:例如,使用带有两种独立的T-DNA构建体的共转化或通过特异性重组酶位点特异性地切除选择基因。
本发明还涉及用于产生本发明多肽的方法,其包括:(a)在有益于产生所述多肽的条件下培养包含多核苷酸的转基因植物或植物细胞,所述多核苷酸编码本发明具有内切葡聚糖酶活性的多肽;和(b)回收所述多肽。
去除或减少内切葡聚糖酶活性
本发明还涉及用于产生亲本细胞突变体的方法,其包括破坏或缺失编码本发明的多肽的多核苷酸序列或其部分,所述方法导致在相同条件下培养时,与亲本细胞相比突变的细胞产生较少的所述多肽。
可以使用本领域熟知的方法通过减少或消除编码本发明多肽的核苷酸序列的表达,所述方法例如,插入、破坏、替代或缺失来构建突变细胞。在优选的方面,所述核苷酸序列是失活的。待修饰或失活的核苷酸序列可以是,例如,编码区或其对活性关键的部分,或表达编码区所需的调节元件。这种调节或调控序列的实例可以是启动子序列或其功能部分,即,足以影响核苷酸序列表达的部分。用于可能的修饰的其它调控序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、信号肽序列、转录终止子和转录激活子。
可以通过向亲本细胞施以诱变,并且选择其中已将所述核苷酸序列的表达减少或消除的突变细胞来进行核苷酸序列的修饰或失活。诱变可能是特异性的或随机的,可以通过例如使用合适的物理或化学诱变剂进行,通过使用合适的寡核苷酸进行,或通过将所述DNA序列进行PCR产生的诱变。此外,可以通过使用这些诱变剂的任何组合来进行诱变。
适合于本发明目的的物理或化学诱变剂的实例包括紫外线(UV)照射、羟胺、N-甲基-N′-硝基-N-亚硝基胍(MNNG)、O-甲基羟胺、亚硝酸、乙基甲烷磺酸酯(ethyl methane sulphonate)(EMS)、亚硫酸氢钠、甲酸和核苷酸类似物。
当使用这些试剂时,通常通过如下方法来进行所述诱变:在合适条件下存在优选的诱变剂时温育待诱变的亲本细胞,并筛选和/或选择显示基因表达减少的或无基因表达的突变体细胞。
通过导入、取代或去除基因中的一个或几个核苷酸或其转录或翻译所需的调控元件可以实现所述核苷酸序列的修饰或失活。例如,可以插入或去除核苷酸从而导致引入终止密码子,去除起始密码子,或改变开放阅读框。按照本领域已知的方法通过定位诱变或PCR产生的诱变可以实现这种修饰或失活。尽管在理论上所述修饰可以在体内进行,即,直接在表达待修饰核苷酸序列的细胞上进行,但优选如下面所示例的那样在体外进行所述修饰。
消除或减少核苷酸序列通过细胞表达的便利方式的例子是基于基因取代,基因缺失,或基因破坏的技术。例如,在基因破坏方法中,将相应于内源核苷酸序列的核酸序列在体外进行诱变以产生缺陷性的核酸序列,随后将其转化入亲本细胞中以产生缺陷基因。通过同源重组,所述缺陷性核酸序列替代了内源性核苷酸序列。理想的是所述缺陷性核苷酸序列还编码标记,其可用于选择其中核苷酸序列被修饰或破坏的转化子。在特别优选的方面,用可选择的标记(如本文所述的那些)来破坏所述核苷酸序列。
或者,可以使用与所述核苷酸序列互补的序列通过确定的反义或RNAi技术来进行所述核苷酸序列的修饰或失活。更具体地,通过导入与所述基因的核苷酸序列互补的序列可以减少或消除所述核苷酸序列通过细胞的表达,所述序列可以在细胞中转录并且能够与细胞中产生的mRNA杂交。在允许所述互补反义核苷酸序列与mRNA杂交的条件下,由此减少或消除翻译的蛋白质的量。
本发明进一步涉及亲本细胞的突变体细胞,其包含编码多肽的核苷酸序列或其调控序列的破坏或缺失,这导致与亲本细胞相比突变体细胞产生更少的多肽或不产生多肽。
这样生成的多肽缺陷型突变细胞作为表达同源和/或异源多肽的宿主细胞特别有用。所以,本发明进一步涉及生产同源或异源多肽的方法,其包括:(a)在有益于生产多肽的条件下培养突变细胞;和(b)回收所述多肽。术语“异源多肽”在本文中定义为对宿主细胞不是天然的多肽,进行了修饰以改变天然序列的天然蛋白,或作为通过重组DNA技术对宿主细胞操作的结果其表达在量上改变的天然蛋白。
在另一方面,本发明涉及通过发酵可产生本发明的多肽以及目标蛋白产物的细胞来生产基本上无内切葡聚糖酶活性的蛋白质产品的方法:在发酵之前、之中或发酵完成之后向发酵液(fermentation broth)中添加有效量的能够抑制内切葡聚糖酶活性的试剂,从发酵液中回收目标产物,并且任选地将回收的产物进行进一步纯化。
在另一方面,本发明涉及如下生产基本上无内切葡聚糖酶活性的蛋白质产品的方法:在允许产物表达的条件下培养细胞,将得到的培养液进行组合的pH和温度处理以基本上减少内切葡聚糖酶活性,和从发酵液中回收产物。或者,可以将从培养液回收的酶制备物进行组合的pH和温度处理。所述组合的pH和温度处理可任选地与内切葡聚糖酶抑制剂处理组合使用。
依照本发明的这个方面,可能去除至少60%,优选至少75%,更优选至少85%,还更优选至少95%,并且最优选至少99%的内切葡聚糖酶活性。可使用此方法获得内切葡聚糖酶活性的完全去除。
组合的pH和温度处理优选在2-3或10-11范围内的pH和至少75-85℃范围内的温度进行一段足够的时间以达到期望的效果,通常1至3小时是足够的。
用于培养和纯化感兴趣的产物的方法可以通过本领域已知的方法进行。
用于产生基本上无内切葡聚糖酶产物的本发明的方法在真核多肽,特别是真菌蛋白质例如酶的产生中是特别令人有兴趣的。所述酶可以选自,例如,淀粉分解酶(amylolytic enzyme)、脂肪分解酶、蛋白水解酶、纤维素分解酶(cellulolytic enzyme)、氧化还原酶或植物细胞壁降解酶。这些酶的实例包括氨肽酶、淀粉酶、淀粉葡糖苷酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶(chitinase)、角质酶(cutinase)、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、葡糖氧化酶、葡糖苷酶、卤素过氧化酶、半纤维素酶、转化酶、异构酶、漆酶、连接酶、脂肪酶、裂合酶、甘露糖苷酶、氧化酶、果胶分解酶、过氧化物酶、肌醇六磷酸酶、酚氧化酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转移酶、转谷氨酰胺酶或木聚糖酶。内切葡聚糖酶缺陷细胞也可以用于表达在制药上引起兴趣的异源蛋白质例如激素、生长因子、受体等。
可理解的是术语“真核多肽”不仅包括天然多肽,也包括多肽例如酶,其通过氨基酸取代、缺失或添加或其它这样的修饰而被修饰以增强活性、热稳定性、pH耐受性等。
在另外的方面,本发明涉及基本上无内切葡聚糖酶活性的蛋白质产物,其通过本发明的方法产生。
抑制多肽表达的方法
本发明还涉及抑制多肽在细胞中表达的方法,其包括对细胞施用双链RNA(dsRNA)分子或者在细胞中表达双链RNA(dsRNA)分子,其中dsRNA包含本发明多核苷酸的亚序列或部分。在优选的方面,dsRNA长约15、16、17、18、19、20、21、22、23、24、25或更多的双链体核苷酸。在另一个优选的方面,多肽具有内切葡聚糖活性。
dsRNA优选是小干扰RNA(siRNA)或微RNA(miRNA)。在优选的方面,dsRNA是用于抑制转录的小干扰RNA(siRNA)。在另一个优选的方面,dsRNA是用于抑制翻译的微RNA(miRNA)。
本发明还涉及用于抑制细胞中多肽表达的这些双链RNA(dsRNA)分子,其中dsRNA包含编码SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:6的成熟多肽的多核苷酸的亚序列或部分。本发明不受到任何特定作用机制的限制,dsRNA能进入细胞,并引起相似或相同序列的单链RNA(ssRNA)的降解,所述RNA包括内源mRNA。当细胞接触dsRNA时,来自同源基因的mRNA选择性地受到称为RNA干扰(RNAi)的过程的降解。
本发明的dsRNA可以用于基因沉默疗法。在一个方面,本发明提供使用本发明的dsRNAi选择性地降解RNA的方法。所述过程可以在体外、在活体外(ex vivo)或在体内进行。在一个方面,dsRNA分子能够用于产生细胞、器官或动物中的功能缺失突变(loss-of-function mutation)。制备或使用选择性降解RNA的dsRNA分子的方法在本领域中公知,参见,例如,美国专利号6,506,559;美国专利号6,511,824;美国专利号6,515,109;和美国专利号6,489,127。
组合物
本发明还涉及包含本发明的多肽的组合物。优选地,所述组合物富含这种多肽。术语“富含”表示所述组合物的内切葡聚糖酶活性,例如,以至少1.1的富集因数(enrichment factor)增加。
所述组合物可以包含本发明的多肽作为主要酶成分,例如,单成分组合物。或者,所述组合物可以包含多种酶活性,例如氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、卤素过氧化物酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、氧化酶、果胶分解酶、肽谷氨酰胺酶(peptidoglutaminase)、过氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶或木聚糖酶。额外的酶可以通过例如属于以下属或种的微生物产生:曲霉属,优选棘孢曲霉、泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉或米曲霉;镰孢属,优选杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢或镶片镰孢;腐质霉属,优选特异腐质霉或疏棉状腐质霉;或木霉属,优选哈茨木霉、康宁木霉、长枝木霉、里氏木霉或绿色木霉。
可以依照本领域内已知的方法制备多肽组合物,并且可以是液体或干组合物的形式。例如,所述多肽组合物可以是颗粒(granulate)或微粒(microgranulate)的形式。可以依照本领域内已知方法将包括于所述组合物中的多肽稳定化。
下面给出的是本发明多肽组合物的优选的用途的实例。本发明的多肽组合物的剂量和使用该组合物的其它条件可以基于本领域内已知的方法确定。
用途
本发明还涉及降解或转化含纤维素物质的方法,其包括:用组合物处理含纤维素物质,所述组合物包含有效量的本发明具有内切葡聚糖酶活性的多肽。在优选方面,所述方法还包括回收已降解或转化的含纤维素物质。
本发明的多肽和宿主细胞可用于单糖、二糖和多糖的生产中,所述糖类作为来自含纤维素生物质的化学或发酵原料用于产生乙醇、塑料或其它产品或中间物。包含具有内切葡聚糖酶活性的多肽的组合物可以是去除或不去除细胞的粗发酵液形式,或是半纯化或纯化的酶制剂形式。或者,组合物可以包含本发明的宿主细胞,所述宿主细胞在使用生物质的发酵方法中作为具有内切葡聚糖酶活性的多肽的来源。宿主细胞还可以包含编码在生物质加工中有用的上述其它蛋白质和酶的天然或异源基因。具体地,本发明的多肽和宿主细胞可以通过部分或全部降解纤维素或半纤维素而增加加工残余物(干燥的蒸馏残渣、酿酒酒糟、甘蔗渣等)的价值。组合物还可以包含在处理生物质中有用的其它蛋白质和酶,例如,纤维二糖水解酶、β-葡糖苷酶、半纤维素分解酶、增强剂(WO 2005/074647,WO 2005/074656)等。
在本发明的方法中,可以使用任何含纤维素物质,如生物质。在本文中可理解的是,术语“含纤维素物质”包括木质纤维素。生物质可以包括但不限于木材资源、城市固体废物、废纸、作物和作物残余物(参见,例如Wiselogel等,1995,在Handbook on Bioethanol(编者Charles E.Wyman)中,第105-118页,Taylor & Francis,Washington D.C.;Wyman,1994,Bioresource Technology50:3-16;Lynd,1990,Applied Biochemistry and Biotechnology 24/25:695-719;Mosier等,1999,Recent Progress in Bioconversion of Lignocellulosics,在Advances in Biochemical Engineering/Biotechnology中,总编T.Scheper,第65卷,第23-40页,Springer-Verlag,New York)。
生物质初生细胞壁(primary cell wall)中的主要多糖是纤维素,其次最丰富的是半纤维素,而第三是果胶。次生细胞壁(secondary cell wall)在细胞停止生长后产生,其同样含有多糖并通过聚合木质素共价交联至半纤维素而加强。纤维素是脱水纤维二糖的均聚物,并且因此是线性β-(1-4)-D-葡聚糖,而半纤维素包括多种化合物,例如木聚糖、木葡聚糖(xyloglucan)、阿拉伯木聚糖和甘露聚糖,具有系列取代基的复杂分支结构。尽管通常是多形的,存在于植物组织中的纤维素主要作为平行葡聚糖链的不溶晶体基质。半纤维素通常与纤维素以及其它半纤维素以氢键相连,其帮助稳定细胞壁基质。
将三种主要类别的酶用于分解含纤维素生物质:
(1)“内切-1,4-β-葡聚糖酶”或1,4-β-D-葡聚糖-4-葡聚糖水解酶(EC3.2.1.4),其随机作用于可溶和不溶的1,4-β-葡聚糖底物。
(2)“外切-1,4-β-葡聚糖酶”包括1,4-β-D-葡聚糖葡糖水解酶(EC 3.2.1.74),其从1,4-β-D-葡聚糖释放D-葡萄糖并且缓慢水解D-纤维二糖;和纤维二糖水解酶(1,4-β-D-葡聚糖纤维二糖水解酶,EC 3.2.1.91),其从1,4-β-葡聚糖释放D-纤维二糖。
(3)“β-D-葡糖苷酶”或β-D-葡糖苷葡糖水解酶(EC 3.2.1.21),其作用于从纤维二糖和可溶的纤维糊精以及一系列糖苷释放D-葡萄糖单位。
本发明具有内切葡聚糖酶活性的多肽可以与其它纤维素分解蛋白质,例如,外切-1,4-β-D-葡聚糖酶和β-D-葡糖苷酶,一同使用以降解生物质底物的纤维素成分(参见,例如,Brigham等,1995,于Handbook on Bioethanol(编者Charles E.Wyman)中,第119-141页,Taylor & Francis,Washington D.C.;Lee,1997,Journal of Biotechnology 56:1-24)。术语“纤维素分解蛋白质”在本文中定义为显示出能够在测试条件下水解或转化或降解纤维素的那些蛋白质或蛋白质的混合物。
外切-1,4-β-D-葡聚糖酶和β-D-葡糖苷酶可以通过本领域已知的任何已知方法产生(参见,例如,Bennett,J.W.和LaSure,L.(编者),More GeneManipulations in Fungi,Academic Press,CA,1991)。
具有内切葡聚糖酶活性的多肽和其它纤维素分解蛋白质的最适量取决于几个因素,其包括但不限于,组分纤维素分解蛋白质的混合物、含纤维素底物、含纤维素底物的浓度、含纤维素底物的预处理、温度、时间、pH和包括发酵生物体(例如,同步糖化和发酵的酵母)。
在优选的方面,每克含纤维素物质的具有内切葡聚糖酶活性的多肽的量是约0.5至约50mg,优选约0.5至约40mg,更优选约0.5至约25mg,更优选约0.75至约20mg,更优选约0.75至约15mg,甚至更优选约0.5至约10mg,并且最优选约2.5至约10mg每g含纤维素物质。
在另一个优选的方面,每克含纤维素物质的纤维素分解蛋白质的量是约0.5至约50mg,优选约0.5至约40mg,更优选约0.5至约25mg,更优选约0.75至约20mg,更优选约0.75至约15mg,甚至更优选约0.5至约10mg,并且最优选约2.5至约10mg每g含纤维素物质。
在本发明的方法中,组合物可补充一种或几种的其它酶活性,以促进含纤维素物质的降解。优选的其它酶是半纤维素酶、酯酶(例如,脂肪酶、磷脂酶和/或角质酶)、蛋白酶、漆酶、过氧化物酶或它们的混合物。
在本发明的方法中,可以在发酵前或过程中(包括在发酵微生物的繁殖的过程中或之后)加入其它酶。
酶可以源自或获得自任何合适的来源,包括细菌、真菌、酵母或哺乳动物来源。术语“获得”在本文中表示酶可以从自然地产生所述酶作为天然酶的生物体分离。术语“获得”在本文中还表示酶可以在宿主生物体中重组产生,其中重组产生的酶对宿主生物体是天然或外源的,或具有修饰的氨基酸序列,例如,具有缺失的、插入的和/或取代的一个或几个氨基酸,即,突变的重组产生的酶和/或天然氨基酸序列的片段或由本领域已知的核苷酸改组方法产生的酶。天然酶的意义中包含天然变体,而外源酶的意义中包含通过重组获得的变体,如通过定向诱变或改组。
还可以将酶纯化。本文中使用的术语“纯化”包括不含来自其所源自的生物体中其它成分的酶。术语“纯化”还包括不含来自其所获得自的天然生物体的组分的酶。可将酶纯化,仅存在少量的其它蛋白质。表述“其它蛋白质”具体涉及其它酶。本文使用的术语“纯化”还指去除其它组分,特别是存在于本发明的酶的起源细胞中的其它蛋白质,最特别是存在于本发明的酶的起源细胞中的其它酶。酶可为“基本上纯的”,即,不含来自产生所述酶的生物体的其它组分,即,例如,用于重组产生酶的宿主生物体。在优选的方面,酶是至少75%(w/w)纯,优选至少80%纯,更优选至少85%纯,更优选至少90%纯,更优选至少95%纯,更优选至少96%纯,更优选至少97%纯,甚至更优选至少98%纯的,或者最优选至少99%纯。在另一个优选的方面,酶是100%纯的。
本发明使用的酶可以是示于本文所述方法的任何形式,如,例如,含有或者不含细胞的粗发酵液、干粉或颗粒、无粉尘颗粒、液体、稳定化的液体或受保护的酶。颗粒可以通过,例如美国专利号4,106,991和4,661,452中公开的方法产生,或者可任选地通过本领域已知的方法包覆。可以,例如,根据已确立的方法通过加入稳定剂(如糖、糖醇或另一种多羟基化合物(polyol),和/或乳酸或另一种有机酸)将液体酶制剂稳定化。受保护的酶可以根据EP238,216中公开的方法制备。
可以使用本发明的方法将含纤维素物质处理成为很多有用的有机产品、化学品和燃料。除乙醇外,一些可以由纤维素产生的用品和专门化学品包括木糖、丙酮、乙酸、甘氨酸、赖氨酸、有机酸(例如,乳酸)、1,3-丙二醇、丁二醇、甘油、乙二醇、糠醛、多羟基链烷酸(polyhydroxyalkanoates)、顺式、顺式-粘康酸和动物饲料(Lynd,L.R.,Wyman,C.E.,和Gerngross,T.U.,1999,Biocommodity Engineering,Biotechnol.Prog.,15:777-793;Philippidis,G.P.,1996,Cellulos ebioconversion technology,于Handbook on Bioethanol:Production and Utilization中,Wyman,C.E.,编,Taylor & Francis,Washington,DC,179-212;及Ryu,D.D.Y.,和Mandels,M.,1980,Cellulases:biosynthesis andapplications,Enz.Microb.Technol.,2:91-102)。可能的共生产有助于扩展从可发酵糖合成的多种有机产物的范围。生物处理后残留的富含木质素的残余物可以转化成木质素衍生的化学品,或者用于产生能量。
根据本发明的方法处理含纤维素物质使用的常规方法为本领域那些技术人员充分理解。可以使用任何常规生物质处理设备来实施本发明的方法,所述设备设定为根据本发明操作。
这种设备可以包括批式搅拌反应器、具有超滤的连续流搅拌反应器、连续活塞流柱式反应器(Gusakov,A.V.,和Sinitsyn,A.P.,1985,Kinetics of theenzymatic hydrolysis of cellulose:1.A mathematical model for a batch reactorprocess,Enz.Microb.Technol.7:346-352)、研磨反应器(Ryu,S.K.,和Lee,J.M.,1983,Bioconversion of waste cellulose by using an attrition bioreactor,Biotechnol.Bioeng.25:53-65),或者具有由电磁场引起的强烈搅拌的反应器(Gusakov,A.V.,Sinitsyn,A.P.,Davydkin,I.Y.,Davydkin,V.Y.,Protas,O.V.,1996,Enhancement of enzymatic cellulose hydrolysis using a novel type ofbioreactor with intensive stirring induced by electromagnetic field,Appl.Biochem.Biotechnol.56:141-153)。
常规方法包括但不限于,糖化、发酵、分离的水解和发酵(SHF)、同步糖化和发酵(SSF)、同步糖化和共发酵(SSCF)、混合的水解和发酵(HHF),和直接微生物转化(DMC)。
SHF使用分离的处理步骤,首先将纤维素用酶水解为葡萄糖,然后将葡萄糖发酵成为乙醇。在SSF中,纤维素的酶水解和葡萄糖到乙醇的发酵组合在一个步骤中(Philippidis,G.P.,1996,Cellulose bioconversion technology,inHandbook on Bioethanol:Production and Utilization,Wyman,C.E.,ed.,Taylor&Francis,Washington,DC,179-212)。SSCF包括多种糖的共发酵(Sheehan,J.,和Himmel,M.,1999,Enzymes,energy and the environment:A strategicperspectiveon the U.S.Department of Energy’s research and developmentactivities for bioethanol,Biotechnol.Prog.15:817-827)。HHF包括在同一个反应器但不同的温度进行的两个分开的步骤,即,高温酶糖化,然后在发酵菌株能够耐受的较低温度进行SSF。DMC在一个步骤中组合了所有三个过程(纤维素酶产生、纤维素水解和发酵)(Lynd,L.R.,Weimer,P.J.,van Zyl,W.H.,和Pretorius,I.S.,2002,Microbial cellulose utilization:Fundamentals andbiotechnology,Microbiol.Mol.Biol.Reviews 66:506-577)。
“发酵”或“发酵过程”指任何发酵过程或包含发酵步骤的任何过程。发酵过程无限制地包括,用于产生发酵产品的发酵过程,所述发酵产品包括醇(例如,阿拉伯醇、丁醇、乙醇、甘油、甲醇、1,3-丙二醇、山梨醇和木糖醇);有机酸(例如,乙酸、丙酮酸、己二酸、抗坏血酸、柠檬酸、2,5-二酮-D-葡萄糖酸、蚁酸、反丁烯二酸、葡萄糖二酸、葡糖酸、葡糖醛酸、戊二酸、3-羟基丙酸、衣康酸、乳酸、苹果酸、丙二酸、草酸、丙酸、丁二酸和木质酸);酮(例如,丙酮);氨基酸(例如,天冬氨酸、谷氨酸、甘氨酸、赖氨酸、丝氨酸和苏氨酸);气体(例如,甲烷、氢气(H2)、二氧化碳(CO2)和一氧化碳(CO))。发酵过程还包括在消费品醇工业(例如,啤酒和酒)、乳制品业(例如,发酵乳制品)、皮革业和烟草业中使用的发酵过程。
本发明进一步涉及产生物质的方法,其包括:(a)用组合物糖化含纤维素物质,所述组合物包含有效量的具有内切葡聚糖酶活性的多肽;(b)用一种或几种(more)的发酵微生物发酵步骤(a)的糖化的含纤维素物质;和(c)从发酵回收物质。包含具有内切葡聚糖酶活性的多肽的组合物可以是去除或不去除细胞的粗发酵液的形式,或者是半纯化或纯化的酶制剂形式,或者组合物可以包含本发明的宿主细胞,作为具有生物质的发酵过程中有内切葡聚糖酶活性的多肽的来源。
物质可以是任何源自发酵的物质。在优选的实施方案中,物质是醇。可理解的是,术语“醇”包括包含一个或几个羟基基团的物质。在更优选的实施方案中,所述醇是阿拉伯醇。在另一个更优选的实施方案中,所述醇是丁醇。在另一个更优选的实施方案中,所述醇是乙醇。在另一个更优选的实施方案中,所述醇是甘油。在另一个更优选的实施方案中,所述醇是甲醇。在另一个更优选的实施方案中,所述醇是1,3-丙二醇。在另一个更优选的实施方案中,所述醇是山梨醇。在另一个更优选的实施方案中,所述醇是木糖醇。参见,例如,Gong,C.S.,Cao,N.J.,Du,J.,和Tsao,G.T.,1999,Ethanolproduction from renewable resources,in Advances in BiochemicalEngineering/Biotechnology,Scheper,T.,ed.,Springer-Verlag Berlin Heidelberg,Germany,65:207-241;Silveira,M.M.,和Jonas,R.,2002,The biotechnologicalproduction of sorbitol,Appl.Microbiol.Biotechnol.59:400-408;Nigam,P.,和Singh,D.,1995,Processes for fermentative production of xylitol-a sugarsubstitute,Process Biochemistry 30(2):117-124;Ezeji,T.C.,Qureshi,N.和Blaschek,H.P.,2003,Production of acetone,butanol and ethanol by Clostridiumbeijerinckii BA101 and in situ recovery by gas stripping,World Journal ofMicrobiology and Biotechnology 19(6):595-603。
在另一个优选的实施方案中,所述物质是有机酸。在另一个更优选的实施方案中,所述有机酸是乙酸。在另一个更优选的实施方案中,所述有机酸是丙酮酸。在另一个更优选的实施方案中,所述有机酸是己二酸。在另一个更优选的实施方案中,所述有机酸是抗坏血酸。在另一个更优选的实施方案中,所述有机酸是柠檬酸。在另一个更优选的实施方案中,所述有机酸是2,5-二酮-D-葡糖酸。在另一个更优选的实施方案中,所述有机酸是蚁酸。在另一个更优选的实施方案中,所述有机酸是反丁烯二酸。在另一个更优选的实施方案中,所述有机酸是葡萄糖二酸。在另一个更优选的实施方案中,所述有机酸是葡糖酸。在另一个更优选的实施方案中,所述有机酸是葡糖醛酸。在另一个更优选的实施方案中,所述有机酸是戊二酸。在另一个优选的实施方案中,所述有机酸是3-羟基丙酸。在另一个更优选的实施方案中,所述有机酸是衣康酸。在另一个更优选的实施方案中,所述有机酸是乳酸。在另一个更优选的实施方案中,所述有机酸是苹果酸。在另一个更优选的实施方案中,所述有机酸是丙二酸。在另一个更优选的实施方案中,所述有机酸是草酸。在另一个更优选的实施方案中,所述有机酸是丙酸。在另一个更优选的实施方案中,所述有机酸是丁二酸。在另一个更优选的实施方案中,所述有机酸是木质酸。参见,例如,Chen,R.,和Lee,Y.Y.,1997,Membrane-mediatedextractive fermentation for lactic acid production from cellulosic biomass,Appl.Biochem.Biotechnol.63-65:435-448。
在另一个优选的实施方案中,所述物质是酮。可理解的是术语“酮”包括含有一个或几个酮基的物质。在另一个更优选的方面,所述酮是丙酮。参见,例如,Qureshi和Blaschek,2003,见上文。
在另一个优选的实施方案中,所述物质是氨基酸。在另一个更优选的实施方案中,所述有机酸是天冬氨酸。在另一个更优选的实施方案中,所述氨基酸是谷氨酸。在另一个更优选的实施方案中,所述氨基酸是甘氨酸。在另一个更优选的实施方案中,所述氨基酸是赖氨酸。在另一个更优选的实施方案中,所述氨基酸是丝氨酸。在另一个更优选的实施方案中,所述氨基酸是苏氨酸。参见,例如,Richard,A.,和Margaritis,A.,2004,Empirical modeling ofbatch fermentation kinetics for poly(glutamic acid)production and othermicrobial biopolymers,Biotechnology and Bioengineering 87(4):501-515。
在另一个优选的实施方案中,所述物质是气体。在另一个更优选的实施方案中,所述气体是甲烷。在另一个更优选的实施方案中,所述气体是H2。在另一个更优选的实施方案中,所述气体是CO2。在另一个更优选的实施方案中,所述气体是CO。参见,例如,Kataoka,N.,A.Miya,和K.Kiriyama,1997,Studies on hydrogen production by continuous culture system ofhydrogen-producing anaerobic bacteria,Water Science and Technology 36(6-7):41-47;和Gunaseelan V.N.in Biomass and Bioenergy,Vol.13(1-2),pp.83-114,1997,Anaerobic digestion of biomass for methane production:A review。
从含纤维素物质产生物质通常需要四个主要步骤。这四个步骤是预处理、酶水解、发酵和回收。下面示例的是产生乙醇的过程,但可理解的是,可以使用相似的过程产生其它物质,例如,上述物质。
预处理。在预处理或预水解步骤中,将含纤维素物质加热以分解木质素和碳水化合物结构,溶解大部分半纤维素,并使纤维素分解酶能够到达纤维素部分。加热或者直接用蒸汽进行,或者在浆料中进行,可以向物质加入催化剂以加速反应的进行。催化剂包括强酸,如硫酸和SO2,或碱,如氢氧化钠。预处理阶段的目的是促进酶和微生物的渗透。含纤维素生物质还可以经过热蒸汽喷发的预处理(参见美国专利申请号20020164730)。
糖化。在酶水解步骤中,所述步骤也称作糖化,将本文所述酶加入预处理的物质中,将纤维素部分转化成葡萄糖和/或其它糖。糖化通常在搅拌釜反应器或发酵罐中,在控制pH、温度和混合条件下进行。糖化步骤可以持续长达200小时。糖化可以在约30℃至约65℃,特别是约50℃的温度,和在约4-约5,尤其是约pH4.5的pH进行。为了产生能由酵母代谢的葡萄糖,通常在存在β-葡糖苷酶时进行水解。
发酵。在发酵步骤中,作为预处理和酶水解步骤的结果从含纤维素物质释放的糖,通过发酵生物体(如酵母)发酵成为乙醇。发酵还可与酶水解在同一个容器中,同样在控制pH、温度和混合条件下同时进行。当糖化和发酵在同一个容器中同时进行时,过程通常称作同步的糖化和发酵或SSF。
在本发明的发酵过程中可以使用任何合适的含纤维素底物或原材料。通常根据理想的发酵产品(即,要从发酵获得的物质)和使用的方法来选择底物,如本领域中所公知。适用于本发明的方法中的底物的实例包括含纤维素物质,如木材或植物残渣或获得自能够由发酵微生物代谢的经处理的含纤维素物质的低分子量糖DP1-3,所述物质可以通过直接向发酵培养基中加入而提供。
术语“发酵培养基”可理解为指加入发酵微生物之前的培养基,如,由糖化过程产生的培养基,以及同步的糖化和发酵过程(SSF)中使用的培养基。
“发酵微生物”指适用于理想的发酵过程中的任何微生物。根据本发明的合适的发酵微生物能将糖(如葡萄糖、木糖、阿拉伯糖、甘露糖、半乳糖或寡糖)直接或间接地发酵(即,转化)成理想的发酵产品。发酵微生物的实例包括真菌生物体,如酵母。优选的酵母包括酵母属菌种,且具体为酿酒酵母。商业上可得到的酵母包括,例如Red Star
Figure A200780019316D0058083723QIETU
/TM/Lesaffre Ethanol Red(可从RedStar/Lesaffre,USA获得)、FALI(可从Fleischmann’s Yeast,Burns Philp Food Inc.,USA的部门获得)、SUPERSTART(可从Alltech获得)、GERT STRAND(可从Gert Strand AB,Sweden获得)和FERMIOL(可从DSM Specialties获得)。
在优选的实施方案中,所述酵母是酵母属。在更优选的实施方案中,所述酵母是酿酒酵母。在另一个更优选的实施方案中,所述酵母是糖化酵母(Saccharomyces distaticus)。在另一个更优选的实施方案中,所述酵母是Saccharomyces uvarum。在另一个优选的实施方案中,所述酵母是克鲁维酵母。在另一个更优选的实施方案中,所述酵母是Kluyveromyces marxianus。在另一个更优选的实施方案中,所述酵母是Kluyveromyces fragilis。在另一个优选的实施方案中,所述酵母是念珠菌属。在另一个更优选的实施方案中,所述酵母是假热带念珠菌(Candida pseudotropicalis)。在另一个更优选的实施方案中,所述酵母是Candida brassicae。在另一个优选的实施方案中,所述酵母是Clavispora。在另一个更优选的实施方案中,所述酵母是Clavisporalusitaniae。在另一个更优选的实施方案中,所述酵母是Clavispora opuntiae。在另一个优选的实施方案中,所述酵母是管囊酵母属(Pachysolen)。在另一个更优选的实施方案中,所述酵母是管囊酵母(Pachysolen tannophilus)。在另一个优选的实施方案中,所述酵母是酒香酵母属(Bretannomyces)。在另一个更优选的实施方案中,所述酵母是克劳森酒香酵母(Bretannomyces clausenii)(Philippidis,G.P.,1996,Cellulose bioconversion technology,in Handbook onBioethanol:Production and Utilization,Wyman,C.E.,ed.,Taylor & Francis,Washington,DC,179-212)。
可以有效地将葡萄糖发酵成乙醇的细菌包括,例如,运动发酵单胞菌(Zymomonas mobilis)和热纤维梭菌(Clostridium thermocellum)(Philippidis,1996,见上文)。
在本领域中公知上述生物体还能用于产生其它物质,如本文所述。
在酿酒酵母(Chen,Z.,Ho,N.W.Y.,1993,Cloning and improving theexpress ion of Pichia stipitis xylose reductase gene in Saccharomyces cerevisiae,Appl.Biochem.Biotechnol.39-40:135-147;Ho,N.W.Y.,Chen,Z,Brainard,A.P.,1998,Genetically engineered Saccharomyces yeast capable of effectivelycofermenting glucose and xylose,Appl.Environ.Microbiol.64:1852-1859)或细菌如大肠杆菌(Beall,D.S.,Ohta,K.,Ingram,L.O.,1991,Parametric studies ofethanol production from xylose and other sugars by recombinant Escherichia coli,Biotech.Bioeng.38:296-303)、产酸克雷伯氏菌(Klebsiella oxytoca)(Ingram,L.O.,Gomes,P.F.,Lai,X.,Moniruzzaman,M.,Wood,B.E.,Yomano,L.P.,York,S.W.,1998,Metabolic engineering of bacteria for ethanol production,Biotechnol.Bioeng.58:204-214)和运动发酵单胞菌(Zhang,M.,Eddy,C.,Deanda,K.,Finkelstein,M.,和Picataggio,S.,1995,Metabolic engineering of a pentosemetabolism pathway in ethanologenic Zymomonas mobilis,Science 267:240-243;Deanda,K.,Zhang,M.,Eddy,C.,和Picataggio,S.,1996,Development of anarabinose-fermenting Zymomonas mobilis strain by metabolic pathwayengineering,Appl.Environ.Microbiol.62:4465-4470)中克隆异源基因导致构建能将己糖和戊糖转化成乙醇(共发酵)的生物体。
通常向降解的纤维素或水解产物中加入酵母或另一种微生物,进行约24至96小时的发酵,如约35至约60小时。温度通常在约26℃-约40℃,特别是约32℃,并在约pH3至约pH6,特别是约pH4-5进行。
在优选的实施方案中,将酵母或另一种微生物施用于降解的纤维素或水解产物,发酵进行约24至约96小时,如通常35-60小时。在优选的实施方案中,温度通常在约26至约40℃之间,特别是约32℃,而pH通常在约pH3至约pH6,优选约pH4-5。优选以大约105至1012,优选大约107至1010,特别是大约5×107活菌数每ml发酵液的量加入酵母或另一种微生物。在乙醇产生过程阶段中,酵母细胞计数应该优选在大约107至1010,尤其是约2×108的范围中。关于使用酵母进行发酵的其它指导可见于例如“The AlcoholTextbook”(Editors K.Jacques,T.P.Lyons和D.R.Kelsall,Nottingham UniversityPress,United Kingdom 1999)中,所述文献通过引用并入本文。
本领域最广泛使用的方法是同步的糖化和发酵(SSF)方法,其中没有糖化的保留阶段,意味着酵母和酶一起添加。
对于乙醇产生,在发酵后蒸馏醪(mash)以提取乙醇。根据本发明的方法获得的乙醇可以用作,例如燃料乙醇;饮料乙醇,即,中性饮料酒,或工业乙醇。
发酵刺激剂可以与本文所述的任何酶过程结合使用,以进一步改进发酵过程,而且特定地,改进发酵微生物的性能,如,速率增加和乙醇得率。“发酵刺激剂”指用于发酵微生物(特别是酵母)生长的刺激剂。优选的用于生长的发酵刺激剂包括维生素和矿物质。维生素的实例包括多种维生素、生物素、泛酸、烟酸、内消旋肌醇(meso-inositol)、硫胺、维生素B6(pyridoxine)、对氨基苯甲酸、叶酸、核黄素和维生素A、B、C、D和E。参见,例如,Alfenore等,Improving ethanol production and viability of Saccharomyces cerevisiae by avitamin feeding strategy duringfed-batch process,Springer-Verlag(2002),其通过引用并入本文。矿物质的实例包括能够提供营养的矿物质和矿物质盐,所述营养包括P、K、Mg、S、Ca、Fe、Zn、Mn和Cu。
回收 从发酵的含纤维素物质中分离醇,并通过蒸馏的常规方法纯化。能够获得纯度高达约96vol.%的乙醇,其可以用作,例如,燃料乙醇、饮料乙醇(即,中性饮料酒)或工业乙醇。
对于其它物质,可以使用本领域已知的任何方法,所述方法包括但不限于层析(例如,离子交换、亲和、疏水、层析聚焦和大小排阻)、电泳方法(例如,制备型等电聚焦)、差示溶解度(例如,硫酸铵沉淀)、SDS-PAGE、蒸馏或提取。
在本发明的方法中,可以向具有内切葡聚糖酶活性的多肽和其它纤维素分解蛋白质补充一种或几种其它酶活性,以改进含纤维素物质的降解。优选的其它酶是半纤维素酶、酯酶(例如,脂肪酶、磷脂酶和/或角质酶)、蛋白酶、漆酶、过氧化物酶,或它们的混合物。
在本发明的方法中,可以在发酵前或发酵过程中(包括在繁殖发酵微生物的过程中或之后)加入其它酶。
信号肽
本发明还涉及核酸构建体,所述核酸构建体包含编码蛋白质的基因,其中所述基因与编码信号肽的核苷酸序列可操作地连接,所述信号肽包含SEQID NO:2的氨基酸1至22、SEQ ID NO:6的氨基酸1至19或SEQ ID NO:8的氨基酸1至18,或由SEQ ID NO:2的氨基酸1至22、SEQ ID NO:6的氨基酸1至19或SEQ ID NO:8的氨基酸1至18组成,其中所述基因对于该核苷酸序列是外源的。
在优选的方面,所述核苷酸序列包括SEQ ID NO:1的核苷酸13至79或由SEQ ID NO:1的核苷酸13至79组成。在另一优选的方面,所述核苷酸序列包括SEQ ID NO:3的核苷酸17至73或由SEQ ID NO:3的核苷酸17至73组成。在另一优选的方面,所述核苷酸序列包括SEQ ID NO:5的核苷酸53至106或由SEQ ID NO:5的核苷酸53至106组成。
本发明还涉及包含这种核酸构建体的重组表达载体和重组宿主细胞。
本发明还涉及用于产生蛋白质的方法,包括:(a)在适合于产生所述蛋白质的条件下培养这样的重组细胞;和(b)回收所述蛋白质。
所述蛋白质对于宿主细胞可以是天然的或异源的。术语“蛋白质”在本文的意思不是指特定长度的编码产物,并且因此包含肽、寡肽和蛋白质。术语“蛋白质”还包含组合以形成编码产物的两种或两种以上多肽。所述蛋白质还包括杂合多肽,其包含部分或全部多肽序列的组合,所述多肽序列从至少两种不同的蛋白质获得,其中一个或几个对于宿主细胞可以是异源或天然的。蛋白质进一步包括上述蛋白质和杂合蛋白质天然存在的等位基因变异和工程的变异。
优选蛋白质是激素或其变体、酶、受体或其部分、抗体或其部分,或报告蛋白(reporter)。在更优选的方面,所述蛋白质是氧化还原酶、转移酶、水解酶、裂合酶(lyase)、异构酶或连接酶。在更加优选的方面,所述蛋白质是氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、转化酶、漆酶、另外的脂肪酶、甘露糖苷酶、变位酶(mutanase)、氧化酶、果胶分解酶、过氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶或木聚糖酶。
基因可以从任何原核、真核或其它来源获得。
通过以下实施例进一步对本发明进行描述,但不应将其理解为对本发明范围的限制。
实施例
材料
作为缓冲液和底物使用的化学品是至少试剂等级的商业产品。
菌株
将土生梭孢霉NRRL 8126和Cladorrhinum foecundissimum ATCC 62373用作具有内切葡聚糖酶活性的糖基水解酶家族7(CEL7)多肽的来源。米曲霉JaL250菌株(WO 99/61651)用于从土生梭孢霉表达CEL7多肽,米曲霉菌株HowB104(α-淀粉酶阴性)用于表达来自cladorrhinum foecundissimum的CEL7多肽。
培养基
YEG培养基由0.5%酵母提取物和2%葡萄糖组成。
马铃薯右旋糖(dextrose)培养基每升由39克马铃薯右旋糖(Difco)组成。
PDA平板由每升39克马铃薯右旋糖琼脂组成。
M400培养基由每升50g麦芽糖糊精、2g MgSO4·7H2O、2g KH2PO4、4g柠檬酸、8g酵母提取物、2g尿素、0.5ml AMG痕量金属溶液和0.5g氯化钙组成。
MDU2BP培养基由每升45g麦芽糖、1g MgSO4·7H2O、1g NaCl、2gK2SO4、12g KH2PO4、7g酵母提取物、2g尿素和0.5ml AMG痕量金属溶液组成,pH调至5.0。
AMG痕量金属溶液由如下组成:每升14.3g ZnSO4·7H2O、2.5gCuSO4·5H2O、0.5g NiCl2·6H2O、13.8g FeSO4·7H2O、8.5g MnSO4·7H2O和3g柠檬酸。
NNCYPmod培养基由如下物质组成:每升1.0g NaCl、5.0g NH4NO3、0.2g MgSO4·7H2O、0.2g CaCl2、2.0g柠檬酸、1.0g细菌用蛋白胨、5.0g酵母提取物、COVE痕量金属溶液,和足够的K2HPO4以达到最终pH大约5.4。
COVE痕量金属溶液由如下物质组成:每升0.04g Na2B4O7·10H2O、0.4gCuSO4·5H2O、1.2g FeSO4·7H2O、0.7g MnSO4·H2O、0.8g Na2MoO2·2H2O和10g ZnSO4·7H2O。
LB培养基由如下物质组成:每升10g胰蛋白胨、5g酵母提取物和5g氯化钠。
LB平板由如下物质组成:每升10g胰蛋白胨、5g酵母提取物、5g氯化钠和15g细菌用琼脂(Bacto Agar)。
SOC培养基由如下物质组成:2%胰蛋白胨、0.5%酵母提取物、10mMNaCl、2.5mM KCl、10mM MgCl2、10mM MgSO4,高压灭菌后添加过滤除菌的葡萄糖至20mM。
冷冻培养基由60%SOC培养基和40%甘油组成。
2X YT培养基由如下物质组成:每升16g胰蛋白胨、10g酵母提取物、5g NaCl和15g细菌用琼脂。
含纤维素的PD培养基由每升24克马铃薯右旋糖(Difco)和30克Solcafloc(Diacel,可由Dicalie-Europe-Nord,Gent,Belgium获得)组成。
每升SC-琼脂由SC-URA培养基(含有指定的葡萄糖或半乳糖)和20g琼脂组成。
每升含有半乳糖的0.1%AZCL HE纤维素SC琼脂平板由含半乳糖的SC-URA培养基、20g琼脂和0.1%AZCL HE纤维素(Megazyme,Wicklow,Ireland)组成。
实施例1:鉴定来自土生梭孢霉NRRL 8126的CEL7C内切葡聚糖酶
将来自生长于添加有1%Sigmacell(Sigma Chemical Co.,St.Louis,MO,USA)的NNCYPmod培养基上的土生梭孢霉NRRL 8126的新鲜平板的琼脂糖圆柱状样本(plug)接种到添加有1%葡萄糖的50ml NNCYPmod培养基中,并在45℃和200rpm温育25个小时。将两ml的这种培养物用于接种添加有2%Sigmacell-20的15 x 100ml(500ml烧瓶)和2x50ml(250ml烧瓶)的NNCYPmod培养基并在45℃、200rpm温育4天。汇集培养物,3000 x g离心10分钟,通过Nalgene 281-5000玻璃纤维预滤器(Nalge Nunc Int’l.,Rochester,NY,USA)过滤上清。滤液冷却至4℃用于存储。
然后将滤液进一步过滤(GP Express膜、聚醚砜(polyethersulfone),0.22μm,Millipore,Bedford,MA,USA),用50mM乙酸钠pH5.0(Pall Filtron,NorthBorough,MA,10kDa聚醚砜膜,大约10-20psi)进行缓冲液交换,用Amicon超滤装置(Millipore,Bedford,MA,10kDa,40psi,4℃)浓缩。将浓缩样品脱盐,通过流经用20mMTris-HCl pH8.2平衡和操作的10DG EconoPAC柱(Bio-Rad,Hercules,CA,USA)来进行缓冲液交换。使用BCA蛋白质测试试剂盒(Pierce,Rockford,IL,USA)测定蛋白质浓度,在该试剂盒中将牛血清白蛋白用作标准蛋白质。将含蛋白质的级分上样到用20mMTris-HCl,pH8.2平衡的5-ml Hi Trap Q SepharoseTM Fast Flow柱(Amersham Pharmacia,UppsalaSweden)上,在AKTA FPLC系统(Amersham Pharmacia,Uppsala Sweden)中以2ml每分钟的流速操作。洗脱前,用五个柱体积的起始缓冲液冼涤柱子。用20mMTris-HCl pH8.2中0至1.0M NaCl(20个柱子体积;2ml级份)的线性梯度洗脱结合的物质。根据280nm的UV谱,汇集各级分用于进一步分析。如上所述,用Amicon装置浓缩所汇集的在大约10-210mM NaCl之间洗脱的级分。将此物质的等分试样在8-16% Tris-Glycine SDS-PAGE凝胶(BioRadLaboratories,Hercules,CA,USA)上电泳,200V电泳1小时。包含精确的分子量标准(BioRad,Hercules,CA,USA)用于分子量测定。依照制造商建议的规程,采用Biosafe考马斯染料(Coomassie Stain)(BioRad,Hercules,CA,USA)用于凝胶的蛋白质染色。
从凝胶切下迁移至大约61kDa的条带,进行凝胶内消化(in-gel digestion)并用串联质谱法(tandem mass spectrometry)从头测序。
用于肽测序的多肽凝胶内消化。用MultiPROBE
Figure A200780019316D0058083723QIETU
 II Liquid HandlingRobot(PerkinElmer Life and Analytical Sciences,Boston,MA,USA)进行凝胶内消化。含目标多肽的二维凝胶斑在室温用溶于100mM碳酸氢铵pH8.0中的50μl 10mM二硫苏糖醇(DTT)还原30分钟。还原后,用溶于100mM碳酸氢铵pH8.0中的50μl 55mM碘乙酰胺将凝胶片烷基化20分钟。将干燥的凝胶片在室温在胰蛋白酶消化溶液(溶于50mM碳酸氢铵pH8中的6ng/μl测序级胰蛋白酶(Promega,Madison,WI,USA))中溶胀30分钟,之后在40℃消化8小时。每个所述反应步骤后都按照制造商的标准规程用适当的溶液进行多次冼涤和预冼涤。在反应之间用50μl的乙腈将凝胶脱水,并在步骤之间将凝胶片风干。肽用HPLC级水中的1%甲酸/2%乙腈提取两次,30分钟。将肽提取溶液转移到96孔带缘的(skirted)PCR型平板(PCR type plate)(ABGene,Rochester,NY,USA),所述带缘的PCR型平板已经冷却至10-15℃并用96孔平板盖(PerkinElmer Life and Analytical Sciences,Boston,MA,USA)覆盖以防蒸发。再次于4℃存储平板,直至可以进行质谱分析。
通过串联质谱法进行肽测序。为了通过串联质谱法进行肽测序,使用Q-Tof microTM混成正交式四极飞行时间质谱仪(hybrid orthogonal quadrupoletime-of-flight mass spectrometer)(Waters 
Figure A200780019316D0065084345QIETU
MS Technologies,Milford,MA,USA)进行LC-MS/MS分析。Q-TofmicroTM质谱仪装配有UltimateTM毛细管和纳米流(nano-flow)HPLC系统(Dionex,Sunnyvale,CA,USA),其已经与FAMOS微型自动进样器(Dionex,Sunnyvale,CA,USA)和Switchos II柱转换装置(Dionex,Sunnyvale,CA,USA)偶联,用于浓缩样品并对样品脱盐。将6μl由凝胶内消化回收的肽溶液上样到装配在注射环(injection loop)中的保护柱(guard column)(300μm ID  x 5cm,C18 PepMapTM)(Dionex,Sunnyvale,CA,USA)上,并用Switchos II泵(Dionex,Sunnyvale,CA,USA)以40μl/分钟用溶于水中的0.1%甲酸洗涤2分钟。在75μm ID x 15cm、C18、3μm、100
Figure A200780019316D0065084416QIETU
PepMapTM纳米流融合的毛细管柱(Dionex,Sunnyvale,CA,USA)上,用NAN-75校准器(Dionex,Sunnyvale,CA,USA)自175μl/分钟的分流(split flow)以175nl/分钟的流速分离肽。在45分钟的时间施加的线性洗脱梯度为溶于0.1%甲酸中的5%至60%乙腈。于215nm监测柱洗脱液,并通过装配有nanospray界面的电喷雾离子源将其导入到Q-TofmicroTM质谱仪。Q-TofmicroTM质谱仪完全是用MassLynxTM软件3.5版(Waters 
Figure A200780019316D0065084447QIETU
MSTechnologies,Milford,MA,USA)控制的微处理器。以测量扫描(survey scan)模式并从50至2000 m/z的质量范围以MS至MS/MS的切换标准(switchingcriteria)获得数据,以包括大于10.0计数/秒的离子强度和+2、+3和+4的电荷状态。可以获得多至4个共洗脱类别的分析谱,扫描时间为1.9秒,扫描间期(inter-scan time)为0.1秒。通常使用65伏的锥形电压(cone voltage),并对碰撞能量进行编程使之根据洗脱肽的质量和电荷状态而变化,且处于10-60伏的范围内。获得的谱是组合的、平滑的且以自动方式居中的,并产生峰列表。用ProteinLynxTM Global Server 1.1软件(Waters 
Figure A200780019316D0065084447QIETU
 MSTechnologies,Milford,MA,USA)针对选择的数据库检索产生的峰列表。评估ProteinLynxTM检索的结果,进一步通过评估每个感兴趣离子的MS/MS谱来分析未鉴定的蛋白质,通过鉴定y和b离子系列并将质量差异与适当的氨基酸进行匹配来测定从头序列。
对于大约61kDa的多肽凝胶条带,从几个多电荷离子通过质谱分析由从头测序获得土生梭孢霉CEL7C内切葡聚糖酶的肽序列。双倍荷电的933.49m/z胰蛋白酶肽离子(tryptic peptide ion)测定为Phe-[Ile或Leu]-Thr-Asp-Asp-Gly-Thr-Thr-Ser-Gly-Thr-[Ile-Leu]-Asn-[Gln-Lys]-[Ile-Leu]-[Gln-Lys]-Arg(SEQID NO:2的氨基酸256至272)。第二个双倍带电的1108.58胰蛋白酶肽离子也进行从头测序,且部分序列测定为Tyr-Gly-Pro-Gly-[Ile-Leu]-Thr-Val-Asp-Thr-Ser-[Lys-Gln](SEQ ID NO:2的氨基酸238至248)。
实施例2:土生梭孢霉NRRL8126基因组DNA提取
土生梭孢霉NRRL8126于37℃、250rpm在25ml YEG培养基中培养24小时。然后通过MiraclothTM(Calbiochem,La Jolla,CA,USA)过滤收集菌丝体并用25ml的10mM Tris-1mM EDTA(TE)缓冲液洗涤一次。从菌丝体制备物排干多余的缓冲液,随后冷冻在液氮中。在电动咖啡磨碎机中将冰冻的菌丝体制备物粉碎为细粉,将粉末添加到含有20ml TE缓冲液和5ml20%w/v十二烷基硫酸钠(SDS)的一次性(disposable)塑料离心管。混合物轻轻颠倒数次以确保混合,用等体积苯酚:氯仿:异戊醇(25:24:1 v/v/v)提取两次。向提取的样品添加乙酸钠(3M溶液)至终浓度0.3M,之后添加2.5体积的冰冷乙醇以沉淀DNA。将管在15,000xg离心30分钟以使DNA沉淀(pellet)。在将DNA沉淀风干30分钟然后重悬在0.5ml TE缓冲液中。被无脱氧核糖核酸酶的核糖核酸酶A添加到重悬的DNA沉淀至100μg每ml的浓度,然后将混合物于37℃温育30分钟。添加蛋白酶K(200μg/ml),将管于37℃再温育一小时。最后,将样品于12,000xg离心15分钟,将上清加到Qiaprep
Figure A200780019316D0066084613QIETU
8Manifold(QIAGEN Inc.,Valencia,CA,USA)。柱子在真空下用1ml PB(QIAGEN In c.,Valencia,CA,USA)和1ml PE(QIAGEN Inc.,Valencia,CA,USA)洗涤两次。用100μl TE缓冲液洗脱分离的DNA,用乙醇沉淀,用70%乙醇洗涤,真空下干燥,重悬于TE缓冲液中,4℃存储。
为了产生用于PCR扩增的基因组DNA,在带挡板的摇瓶中在添加有1%葡萄糖的50ml NNCYP培养基中,在42℃和200rpm将土生梭孢霉NRRL8126培养24小时。通过过滤收获菌丝体,在TE缓冲液中洗涤两次,液氮冷冻。将豌豆大小的冷冻菌丝体小块悬浮在0.7ml溶于TE缓冲液中的1%十二烷基硫酸锂中,在FastPrep FP120(ThermoSavant,Holbrook,NY,USA)中用等体积的0.1mm氧化锆/二氧化硅珠(Biospec Products,Inc.,Bartlesville,OK,USA)搅动45秒将其破碎。通过在13,000xg离心10分钟去除碎片,将澄清的上清加至2.5M乙酸铵并在冰上温育20分钟。温育期后,通过添加2体积的乙醇沉淀核酸。在微型离心机中在4℃离心15分钟后,在70%乙醇中洗涤沉淀并风干。将DNA重悬在120μl的0.1X TE缓冲液中,在37℃与1μl无脱氧核糖核酸酶的核糖核酸酶A一起温育20分钟。添加乙酸铵至2.5M,用2体积的乙醇沉淀DNA。在70%乙醇中洗涤沉淀,风干,重悬在TE缓冲液中。
实施例3:从土生梭孢霉NRRL8126克隆编码CEL7C内切葡聚糖酶的基因
如实施例1所述的质谱分析显示质量为933.49的双倍带电的肽的部分序列是TDDGTTSGT[I/L]NQ[I/L]QR(SEQ ID NO:2的氨基酸258至272)。对上面以粗体显示的部分序列(SEQ ID NO:2的氨基酸259至267)设计反义链寡核苷酸CODEHOP引物(Rose等,1998,Nucleic Acids Res.26:1628-35)。引物序列如下所示。
5’-AGGGTGCCGCTGGTNGTNCCRTCRTC-3’(SEQ ID NO:7)
根据存在于家族7的许多糖基水解酶中的保守序列(特别是AGAKYGTGYCD(SEQ ID NO:2的氨基酸164至173;发现以粗体显示的残基在CEL7C中是保守的))设计第二个CODEHOP有义链引物。引物序列如下所示。
5’-AGCTGGTGCTAAATATGGTACTGGNTAYTGYGA-3’(SEQ ID NO:8)
在含1X AmpliTaq缓冲液(Applied Biosystems,Inc.,Foster City,CA,USA)、1.5单位的AmpliTaq DNA聚合酶(Applied Biosystems,Inc.,Foster City,CA,USA)、有义和反义引物各1μM、和大约1μg来自土生梭孢霉NRRL8126的基因组DNA的30μl体积中进行PCR扩增。在RoboCycler
Figure A200780019316D0066084613QIETU
(Stratagene,LaJolla,CA,USA)中进行扩增,程序为:96℃ 3分钟、72℃ 3分钟(在此期间添加DNA聚合酶)的一个循环;35个循环,每个循环为94℃ 45秒、52℃、55℃或58℃ 45秒、72℃ 1分钟;之后在72℃最终延伸7分钟。
用40mM Tris碱-20mM乙酸钠-1mM EDTA二钠(TAE)缓冲液通过3%琼脂糖凝胶电泳对反应产物进行分级,切下大约300bp的条带,用QIAEX
Figure A200780019316D0066084613QIETU
II凝胶提取试剂盒(QIAGEN Inc.,Valencia,CA,USA)纯化,用TOPO TA试剂盒(Invitrogen,Carlsbad,CA,USA)亚克隆。对来自一个大肠杆菌转化体的质粒测序,发现含有编码预测的糖基水解酶家族7蛋白(CEL7C)的315bp插入。该质粒被命名为pPH32(图1)。
实施例4:鉴定来自土生梭孢霉NRRL8126的CEL7E内切葡聚糖酶
将来自在添加有1% Sigmacell的NNCYPmod培养基上培养的土生梭孢霉NRRL8126的新鲜平板的琼脂糖圆柱状样本(plug)接种到添加有2%Sigmacell的25ml NNCYPmod培养基中,并在42℃和150rpm温育3天。通过Nalgene 281-5000玻璃纤维预滤器过滤培养液。滤液冷却至4℃以储存。
二维聚丙烯酰胺凝胶电泳。通过添加30μl β-巯基乙醇和300μl饱和三氯乙酸(4℃的饱和水溶液)在冰上温育10分钟,之后添加30ml冰冷的丙酮,并进一步在冰上温育30分钟,来沉淀来自实施例1中所述的汇集的培养物的三毫升滤液。沉淀的溶液于4℃,10,000xg离心10分钟,倾析上清,将沉淀用冰冷的丙酮漂洗两次并风干。将干燥的沉淀溶解在0.2ml等电聚焦(IEF)样品缓冲液(9.0M尿素、3.0%(wt/v)3-[(3-胆酰胺丙基)二甲基-铵]-1-丙烷磺酸盐(CHAPS,Pierce Chemical Co.Rockford,IL,USA)、1%(v/v)pH4-7两性电解质(ampholyte)、1% β-巯基乙醇和0.005%溴酚蓝,溶于蒸馏水中)中。用来自BioRad实验室(Hercules,CA,USA)的AG501-X8(D)、20-5-筛目(mesh)、混合床树脂对尿素储液去离子化。将去离子化的溶液储存于-20℃。在LabQuakeTM摇床(Lab Industries,Berkeley,CA,USA)上以轻柔混合使所得混合物溶解(solubilize)几小时。在IPG复水托盘(Amersham Biosciences,Piscataway,NJ,USA)中,将样品缓冲液-蛋白混合物施加于11cm IPG条带(strip)(BioRad Laboratories,Hercules,CA,USA)。在20℃,将750μl的等份干燥-条带包封液体(Amersham Biosciences,Piscataway,NJ,USA)层叠在IPG条带上,以阻止蒸发并使之复水12小时,同时用IPGPhor等电聚焦单元(Isoelectric Focusing Unit)(Amersham Biosciences,Piscataway,NJ,USA)施加30伏电压。将IPGPhor单元设置为恒定电压但每个条带最大电流为50μA。复水12小时后,等电聚焦条件如下:200伏1小时,500伏1小时和1000伏1小时。然后施加1000伏至8000伏的梯度30分钟,设定等电聚焦使之在8000伏运行,当达到>30,000伏小时时完成。在第二维分析(seconddimension analysis)之前,通过如下将IPG凝胶条带还原并烷基化:首先在100mg二硫苏糖醇每10ml SDS-平衡缓冲液(50mM Tris HCl pH8.8、6.0M尿素、2%(w/v)十二烷基硫酸钠(SDS)、30%甘油、和0.002%(w/v)溴酚蓝)中还原15分钟,之后在250mg碘乙酰胺每10ml缓冲液的平衡缓冲液中在黑暗中烷基化15分钟。在SDS-PAGE电泳缓冲液(Invitrogen/Novex,Carlsbad,CA,USA)中快速漂洗IPG条带,放置在11cm、1孔8-16% Tris-甘氨酸SDS-PAGE凝胶(BioRad Laboratories,Hercules,CA,USA)上用Criterion电泳单元(BioRadLaboratories,Hercules,CA,USA)于50伏电泳,直至样品进入凝胶,然后将电压增加到200伏,使之运行直至溴酚蓝染料到达凝胶的底部。
多肽检测。用荧光SYPRO Orange Protein Stain(Molecular Probes,Eugene,OR,USA)对二维凝胶染色。荧光染色法由Malone等,2001,Electrophoresis,22,919-932优化和改编而来。将SDS-PAGE凝胶在40%乙醇、2%乙酸和0.0005%SDS中在平台摇移器(platform rocker)上固定1小时至过夜。采用由2%乙酸和0.0005%SDS组成的三个重复洗涤步骤去除和替换固定液,每次30分钟。黑暗中用2%乙酸、0.0005%SDS和0.02%SYPRO Orange Protein染料对凝胶染色1.5小时至过夜。在Hoefer Processor Plus Staining Unit(AmershamBiosciences,Piscataway,NJ,USA)上进一步优化染色和脱色以改进再现性和自动化程度。利用蓝色荧光和200μm像素尺寸(pixel size)和800V的光电倍增管增益(gain),通过在Molecular Dynamics STORM 860成像系统(AmershamBiosciences,Piscataway,NJ,USA)上扫描来获得荧光染色的SDS-PAGE凝胶的图像。利用ImageQuant软件5.0版(Amersham Biosciences,Piscataway,NJ,USA)观察并修正图像。在Dark Reader Blue transilluminator上用橙色滤镜(Clare Chemical Co,Denver,CO,USA)进一步显示凝胶。用2mm Acu-Punch活组织切片冲床(Acuderm Inc.,Ft.Lauderdale,FL,USA)切下观察到的蛋白凝胶斑点并保存在96孔平板中,所述平板用60%乙腈中的0.1%三氟乙酸(TFA)预洗涤然后用HPLC级水再洗涤两次。在-20℃,将染色的二维凝胶斑保存在预洗涤过的平板中25-50μl的水中直至消化。
用胰蛋白酶凝胶内消化相应于分子量约为50kDa且等电点约为5.0的2D凝胶斑并进行从头测序,如实施例1所述。将双倍荷电的1114.516m/z胰蛋白酶肽离子测定为Ser-Pro-Leu-Asn-Pro-Ala-Gly-Ala-Thr-Tyr-Gly-Thr-Gly-Tyr-Cam-Asp-Ala-Gln-Cam-Pro-Lys(SEQ ID NO:5的氨基酸156至176,其中Cam是羧基氨基甲基半胱氨酸(carboxyamidomethylcysteine)。
针对上面以粗体显示的序列部分设计有义链寡核苷酸CODEHOP引物(SEQ ID NO:4的168至176)。引物序列如下所示。
5’-GGCTACTGCGACGCCCARTGYCNAA-3’(SEQ ID NO:9)
根据存在于许多家族7糖基水解酶中的保守序列(特别是CCNEMDIWEAN)(随后发现所有氨基酸在CEL7E中在SEQ ID NO:4的193至203都是保守的)设计第二个CODEHOP反义链引物。所述引物序列是:
5’-CCTCCCAGATRTCCATYTCGTTRCARCA-3’(SEQ ID NO:10)
在包含1X AmpliTaq缓冲液、1.5单位的Taq DNA聚合酶(New EnglandBiolabs,Ipswich,MA,USA)、有义和反义引物各1μM和大约1μg的来自土生梭孢霉NRRL8126的基因组DNA(如实施例2所述制备)的30μl体积中进行PCR。在Stratagene RoboCycler
Figure A200780019316D0066084613QIETU
中进行扩增,程序为:96℃ 3分钟、72℃3分钟(在此期间添加DNA聚合酶)的一个循环;35个循环,每个循环94℃45秒、53℃、56℃或59℃ 45秒、72℃ 1分钟;之后在72℃最终延伸7分钟。
用TAE缓冲液在3%琼脂糖凝胶上对反应产物分级,切下大约180bp的条带,用QIAEX
Figure A200780019316D0066084613QIETU
II凝胶提取试剂盒(QIAGEN Inc.,Valencia,CA,USA)纯化,并使用TOPO TA试剂盒(Invitrogen,Carlsbad,CA,USA)亚克隆。对来自一个大肠杆菌转化体的质粒测序,发现含有编码预测的糖基水解酶家族7蛋白(CEL7E)的169bp插入。该质粒被命名为pPH37(图2)。
实施例5:土生梭孢霉NRRL8126基因组DNA文库构建
利用噬菌体克隆载体λZipLox(Life Technologies,Gaithersburg,MD,USA)构建基因组DNA文库,以大肠杆菌Y1090ZL细胞(Life Technologies,Gaithersburg,MD,USA)作为宿主用于重组噬菌体的涂布和纯化,大肠杆菌DH10Bzip(Life Technologies,Gaithersburg,MD,USA)用于含GH61B基因的单个pZL1克隆的切除。
用Tsp509I部分消化如实施例2所述制备的土生梭孢霉NRRL8126基因组DNA并用TAE缓冲液在1%琼脂糖凝胶上进行大小分级。切下在3-7kb大小范围内迁移的DNA片段,并使用Prep-a-Gene试剂(BioRad Laboratories,Hercules,CA,USA)将其从凝胶洗脱。将洗脱的DNA片段与Eco RI-切割且去磷酸化的λZipLox载体臂(Life Technologies,Gaithersburg,MD,USA)连接在一起,用商业包装提取物(Stratagene,La Jolla,CA,USA)将连接混合物包装。涂布包装的DNA文库并在大肠杆菌Y1090ZL细胞中扩增。未扩增的基因组DNA文库含3.1 X 106pfu/ml(无DNA的背景效价为2.0 X 104pfu/ml)。
实施例6:鉴定土生梭孢霉NRRL 8126cel7c和cel7e克隆如下所示,利用与TOPO载体同源的引物和
Figure A200780019316D00711
 DNA聚合酶(Stratagene,La Jolla,CA,USA)分别从pPH32和pPH37扩增土生梭孢霉cel7c和cel7e基因探针片段。
5′-CTTGGTACCGAGCTCGGATCCACTA-3′(SEQ ID NO:11)
5′-ATAGGGCGAATTGGGCCCTCTAGAT-3′(SEQ ID NO:12)
PCR反应物中每种引物使用50皮摩尔,所述反应物在50μl的最终体积中含10ng pPH32或pPH37、1X扩增缓冲液(Stratagene,La Jolla,CA,USA)、1μl 10mM dATP、dTTP、dGTP和dCTP的混合物、以及2.5单位的
Figure A200780019316D00713
 DNA聚合酶。在Stratagene 
Figure A200780019316D00714
中进行扩增,程序为:94℃ 1分钟的1个循环;20个循环,每个循环94℃ 30秒、55℃ 30秒和72℃ 1分钟。然后加热块进入4℃的保温循环(soak cycle)。用TAE缓冲液在1.0%琼脂糖凝胶上分离反应产物,其中从凝胶切下三个<400bp的产物条带,根据制造商的说明用
Figure A200780019316D00715
凝胶提取试剂盒(QIAGEN Inc.,Valencia,CA,USA)将其纯化。利用
Figure A200780019316D00716
 II试剂盒(Stratagene,La Jolla,CA,USA)以32P放射性标记25ng的每个片段。
使用两个标记的PCR片段作为探针,通过噬菌斑杂交从实施例5所述的文库筛选大约90,000个噬菌斑。利用UV Stratalinker(Stratagene,La Jolla,CA,USA)将DNA交联到膜(Hybond N+,Amersham,Arlington Heights,IL,USA)上。添加氢氧化钠至终浓度0.1M使每个32P放射性标记的基因片段变性,添加到活性为约1 x 106cpm每ml杂交溶液的含6X SSPE、7% SDS的杂交溶液。每种混合物于55℃在振荡水浴中温育过夜。温育后,将所述膜于65℃在含0.1% SDS的0.2X SSC中洗涤3次,15分钟。将所述膜在吸水纸上干燥15分钟,包裹在SaranWrapTM中,在70℃以增光屏(Kodak,Rochester,NY,USA)暴露于X射线片过夜。
基于与上述探针产生的强杂交信号,选择几个噬菌斑用于进一步研究。噬菌斑在大肠杆菌Y1090ZL细胞中纯化两次,随后通过大肠杆菌DH10BZL细胞(Life Technologies,Gaithersburg,MD,USA)的感染用体内切除法从λZipLox载体切除插入的基因和pZL1质粒作为pZL1-衍生物(D’Alessio等,1992,Focus
Figure A200780019316D0066084613QIETU
 14:76)。将菌落接种到添加有50μg氨苄青霉素每ml的3ml LB培养基,并在37℃培养过夜。用BioRobot 9600(QIAGEN Inc.,Valencia,CA,USA)从每种这些培养物制备Miniprep DNA。通过DNA测序显示命名为pPH50的克隆(图3)包含cel7c的全长基因组基因,通过DNA测序显示命名为pPH38的克隆(图4)包含cel7e的全长基因。
包含质粒pPH50(图3)的大肠杆菌PaHa50和包含质粒pPH38(图4)的大肠杆菌PaHa38保藏在农业研究机构专利培养物保藏中心(AgriculturalResearch Service Patent Culture Collection)北区研究中心,1815 UniversityStreet,Peoria,Illinois,61604,分别为NRRL B-30899和NRRL B-30896,保藏日期为2006年2月23日。
实施例7:表征编码CEL7C和CEL7E内切葡聚糖酶的土生梭孢霉基因组序列
利用3.1版BigDyeTM终止子化学和dGTP化学(Applied Biosystems,Inc.,Foster City,CA,USA)和引物步移(primer walking)策略,用Applied Biosystems3700型自动DNA测序仪对土生梭孢霉cel7c和cel7e基因组克隆进行DNA测序。仔细检查核苷酸序列数据质量,在PHRED/PHRAP软件(University ofWashington,Seattle,WA,USA)的辅助下,将所有序列相互比较。
根据与来自里氏木霉(登录号Q5BMS5)和尖镰孢(登录号P46237)的同源基因的相似性,构建了土生梭孢霉cel7c和cel7e基因组DNA序列的基因模型。
土生梭孢霉cel7C基因的核苷酸序列(SEQ ID NO:1)和推导的氨基酸序列(SEQ ID NO:2)如图5A和5B所示。编码序列为1452bp,包括终止密码子,被57bp的内含子所打断。编码的预测蛋白为464个氨基酸。所述基因的编码序列的%G+C为63.7%,成熟多肽编码序列的%G+C为63.8%。用SignalP程序(Nielsen等,1997,Protein Engineering 10:1-6)预测到22个残基的信号肽。预测的成熟蛋白包含442个氨基酸,分子量为46.5kDa。用InterProScan程序(Zdobnov和Apweiler,2001,Bioinformatics 17:847-848)分析cel7c基因推导的氨基酸序列,显示CEL7C多肽含有糖苷水解酶家族7的结构域标记(domain signature)(InterPro登录号IPR001722),其为成熟多肽的大约氨基酸2到376。CEL7C还包含真菌纤维素结合结构域的序列标记。发现称为Prosite模式PS00562(Sigrist等,2002,Brief Bioinform.3:265-274)的该序列标记为成熟多肽的大约氨基酸414到441。
使用Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48:443-453)如在具有缺口开放罚分10、缺口延伸罚分0.5和EBLOSUM62矩阵的EMBOSS的Needle软件中所实施的,来确定氨基酸序列的比较配对全局比对(comparative pairwise global alignment)。比对显示,编码具有内切葡聚糖酶活性的CEL7C成熟多肽的土生梭孢霉基因的推导的氨基酸序列与来自烟曲霉和里氏木霉的两个糖基水解酶家族7蛋白的推导的氨基酸序列(登录号分别为Q4WCM9和P07981)分别共享76%和70%同一性(缺口除外)。
土生梭孢霉cel7e基因的核苷酸序列(SEQ ID NO:3)和推导的氨基酸序列(SEQ ID NO:4)如图6A和6B所示。编码序列为1336bp,包括终止密码子,被64bp的内含子所打断。编码的预测蛋白为423个氨基酸。所述基因的编码序列的%G+C为66.6%,成熟多肽编码序列的%G+C为66.5%。利用SignalP程序(Nielsen等,1997,同上)预测到了19个残基的信号肽。预测的成熟蛋白包含404个氨基酸,分子量为43.4kDa。用InterProScan程序(Zdobnov和Apweiler,2001,同上)分析cel7e基因的推导的氨基酸序列,显示CEL7E多肽含有糖苷水解酶家族7的结构域标记(InterPro登录号IPR001722),其为成熟多肽的大约氨基酸2到400。
使用Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48:443-453)如在具有缺口开放罚分10、缺口延伸罚分0.5和EBLOSUM62矩阵的EMBOSS的Needle软件中所实施的,来确定氨基酸序列的比较配对全局比对。比对显示,编码具有内切葡聚糖酶活性的CEL7E成熟多肽的土生梭孢霉基因的推导的氨基酸序列与来自粗糙脉孢菌、Talaromyces emersonii和米曲霉(登录号分别为Q7RXC7、CAC94521.1和O13455)的三个糖基水解酶家族7蛋白分别共享65%、63%和59%的同一性(缺口除外)。
实施例8:pAlLo2表达载体的构建
通过修饰pBANe6(美国专利6,461,837)构建表达载体pAlLo1,pBANe6包含来自黑曲霉中性α-淀粉酶和米曲霉磷酸丙糖异构酶的基因启动子的杂合体(NA2-tpi启动子)、黑曲霉淀粉葡萄糖苷酶终止子序列(AMG终止子)和构巢曲霉乙酰胺酶基因(amdS)。用Big-DyeTM终止子化学(Applied Biosystems,Inc.,Foster City,CA,USA)通过测序验证所有诱变步骤。通过定点诱变,首先从amdS选择标记去除位置2051、2722和3397bp处的三个Nco I限制位点,来进行pBANe6的修饰。将所有改变都设计为“沉默的”,使amdS基因产物的实际蛋白质序列不变。利用下述引物(加下划线的核苷酸代表改变的碱基),根据制造商的说明用GeneEditorTM体外定点诱变试剂盒(Promega,Madison,WI,USA)同时进行这三个位点的去除:
AMDS3NcoMut(2050):
5’-GTGCCCCATGATACGCCTCCGG-3’(SEQ ID NO:13)
AMDS2NcoMut(2721):
5’-GAGTCGTATTTCCAAGGCTCCTGACC-3’(SEQ ID NO:14)
AMDS1NcoMut(3396):
5’-GGAGGCCATGAAGTGGACCAACGG-3’(SEQ ID NO:15)
然后用QuickChangeTM定点诱变试剂盒(Stratagene,La Jolla,CA,USA)对包含所有三个预期序列改变的质粒进行定点诱变,以去除在AMG终止子末端在位点1643的Nco I限制位点。下述引物(加下划线的核苷酸代表改变的碱基)用于诱变:
用于诱变AMG终止子序列的上游引物:
5’-CACCGTGAAAGCCATGCTCTTTCCTTCGTGTAGAAGACCAGACAG-3’(SEQ IDNO:16)
用于诱变AMG终止子序列的下游引物:
5’-CTGGTCTTCTACACGAAGGAAAGAGCATGGCTTTCACGGTGTCTG-3’(SEQID NO:17)
pBANe6修饰的最后步骤是用QuickChangeTM定点诱变试剂盒和以下引物(加下划线的核苷酸代表改变的碱基)在多接头(polylinker)的起始处添加新的Nco I限制位点,以得到pAlLo1(图7)。
用于诱变NA2-tpi启动子的上游引物:
5’-CTATATACACAACTGGATTTACCATGGGCCCGCGGCCGCAGATC-3’(SEQ ID NO:18)
用于诱变NA2-tpi启动子的下游引物:
5’-GATCTGCGGCCGCGGGCCCATGGTAAATCCAGTTGTGTATATAG-3’(SEQ ID NO:19)
将pAlLo1的amdS基因与构巢曲霉pyrG基因交换(swap)。质粒pBANe10(图8)用作作为选择标记的pyrG基因的来源。分析pBANe10的序列显示pyrG标记包含在Nsi I限制片段之内,且不包含Nco I或Pac I限制位点。由于NsiI限制位点也位于amdS的侧翼,因而转换选择标记的策略是Nsi I限制片段的简单交换。用限制酶Nsi I消化来自pAlLo1和pBANe10的质粒DNA,通过琼脂糖凝胶电泳纯化产物。将来自含pyrG基因的pBANe10的NsiI片段连接到pAlLo1的骨架以替换含amdS基因的原始的Nsi I DNA片段。通过限制酶消化分析重组克隆,以确定它们具有正确插入序列及其方向。选择pyrG基因以逆时针方向转录的克隆。新质粒命名为pAlLo2(图9)。
实施例9:土生梭孢霉NRRL8126cel7c和cel7e基因的米曲霉表达载体的构建
设计了如下所示的两个合成的寡核苷酸引物,用于从基因组克隆PCR扩增土生梭孢霉NRRL 8126 cel7c基因。用InFusion克隆试剂盒(BDBiosciences,Palo Alto,CA,USA)将所述片段直接克隆到表达载体pAILo2中,而无需限制消化和连接。
正向引物:
5’-ACTGGATTACCATGGGCCAGAAGACGCTG-3’(SEQ ID NO:20)
反向引物:
5’-AGTCACCTCTAGTTAGAGGCACTGGTAGTAC-3’(SEQ ID NO:21)
粗体字母代表编码序列。其余序列与pAlLo2的插入位点同源。
PCR反应物中使用50皮摩尔的上述每种引物,所述反应物在50μl的最终体积中包含100ng的土生梭孢霉基因组DNA(如实施例2所述制备)、1XPfx扩增缓冲液、dATP、dTTP、dGTP和dCTP的10mM混合物1.5μl、2.5单位的Platinum Pfx DNA聚合酶(Invitrogen,Carlsbad,CA,USA)、1μl的50mM MgSO4和5μl的10X pCRx增强剂溶液(Invitrogen,Carlsbad,CA,USA)。在Stratagene Robocycler
Figure A200780019316D0066084613QIETU
中进行扩增,程序为:94℃ 2分钟的1个循环;和30个循环,每个循环94℃ 15秒、55℃ 30秒和68℃ 3分钟。然后加热模块进入4℃保温循环。
用TAE缓冲液在1.0%琼脂糖凝胶上分离反应产物,从凝胶切下约3kb的产物条带,根据制造商的说明用QIAquick凝胶提取试剂盒纯化。
然后用InFusion克隆试剂盒将所述片段克隆到pAlLo2中。用Nco I和PacI消化所述载体(使用制造商指定的条件)。通过用TAE缓冲液进行1%琼脂糖凝胶电泳和QIAquick凝胶纯化试剂盒纯化所述片段。在反应中将所述基因片段和经消化的载体连接在一起,产生表达质粒pEJG109(图10),其中cel7c基因的转录处于NA2-tpi启动子的控制之下。连接反应物(20μl)由如下组成:1X InFusion缓冲液(BD Biosciences,Palo Alto,CA,USA)、1X BSA(BDBiosciences,Palo Alto,CA,USA)、1μl InFusion酶(1:10稀释)(BD Biosciences,Palo Alto,CA)、用Nco I和Pac I消化的100ng的pAlLo2和100ng土生梭孢霉cel7c纯化的PCR产物。反应物在室温下温育30分钟。用1μl所述反应物转化大肠杆菌XL10 Solopac Gold细胞(Stratagene,La Jolla,CA,USA)。通过用XhoI限制酶消化检测含pEJG109(cel7c基因)的大肠杆菌转化体,并用QIAGEN BioRobot 9600制备质粒DNA。
利用下述引物,以与上述相同的方式得到土生梭孢霉cel7e基因的表达构建体。
In-Fusion正向引物:
5’-ACTGGATTACCATGGCGCCCAAGTCTACAGTTCTGG-3’(SEQID NO:22)
In-Fusion反向引物:
5’-TCACCTCTAGTTAATTAACTAGTGGCTGCACTCGCTCT-3’(SEQID NO:23)
粗体字母代表编码序列。其余序列与pAlLo2的插入位点同源。
用TAE缓冲液和每ml0.1μg的溴化乙锭在0.8% GTG-琼脂糖凝胶(Cambrex B ioproducts One Meadowlands Plaza East Rutherford,New Jersey07073)上分离1.3kb的PCR反应产物。借助于Dark ReaderTM(Clare ChemicalResearch,Dolores,CO)显示DNA条带,以避免UV-诱导的突变。根据制造商的说明,用一次性刀片切下1.3kb的DNA条带,用Ultrafree-DA旋杯(spin cup)(Millipore,Billerica,MA)纯化。如上所述,用In-Fusion克隆试剂盒(BDBiosciences,Palo Alto,CA)将纯化的PCR片段克隆入线性化且纯化的pAlLo2载体中,以产生pAlLo25(图11)。
通过限制酶消化分析鉴定含pAlLo25的大肠杆菌转化体,并用QIAGENBioRobot9600制备质粒DNA。
实施例10:编码CEL7C和CEL7E内切葡聚糖酶的土生梭孢霉NRRL8126基因在米曲霉JaL250中的表达
根据Christensen等,1988,Bio/Technology 6:1419-1422的方法制备米曲霉JaL250原生质体。用5μg的pEJG109(同时将pAlLo2作为载体对照)转化米曲霉JaL250(WO99/61651)。
用pEJG109(cel7c基因)转化米曲霉JaL250得到约100个转化体。将十个转化体分离至单独的PDA平板。
用5ml0.01%Tween80洗涤5个转化体的汇合的PDA平板,各别接种到125ml玻璃摇瓶中25ml的MDU2BP培养基中,在34℃、200rpm温育。温育5天后,根据制造商的说明,用8-16% Tris-甘氨酸SDS-PAGE凝胶(Invitrogen,Carlsbad,CA,USA)分析来自每种培养物的5μl上清样品。培养物上清的SDS-PAGE谱显示在5个转化体中,5个都具有新的约74kDa的主带。
用10ml0.01%Tween20洗涤转化体10(培养在PDA上)汇合的平板,接种到含500ml MDU2BP培养基的2升Fernbach中,以产生发酵液用于酶的表征。在第5天收获烧瓶,用0.22μm GP Express plus膜(Millipore,Bedford,MA,USA)过滤。
用如上所述的相同规程在米曲霉JaL250中表达质粒pAlLo25(cel7e基因)。转化米曲霉Jal250得到约35个转化体。将八个转化体分离至单独的PDA平板,34℃温育5天。培养物上清的SDS-PAGE谱显示,八个pAlLo25转化体中八个都具有新的约55kDa的弥散蛋白质条带。选择#4转化体用于进一步研究,命名为米曲霉JaL250 pAlLo25。
实施例11:编码CEL7A内切葡聚糖酶的Cladorrhinum foecundissimumATCC62373的克隆和表达
将Cladorrhinum foecundissimum ATCC 62373在200ml含纤维素的PD培养基中在30℃、200rpm培养五天。将内容物通过衬有MiraclothTM的漏斗过滤,以收获来自摇瓶培养的菌丝体。然后将菌丝体夹在两个MiraclothTM片之间,用吸水纸巾吸干。然后将菌丝团转移到Falcon
Figure A200780019316D0066084613QIETU
 1059塑料离心管(BDBiosciences,Palo Alto,CA,USA),并冷冻在液氮中。将冷冻的菌丝体存储在-80℃冰箱中直至使用。
用硫氰酸胍(guanidinium thiocyanate)提取总RNA,之后通过5.7M CsCl缓冲(cushion)超速离心,并用WO 94/14953中所述的方法通过寡(dT)-纤维素亲和层析分离多聚(A)+RNA。
通过RNase(核糖核酸酶)H法(Gubler和Hoffman,1983,Gene25:263-269,Sambrook等,1989,Molecular cloning:A laboratory manual,ColdSpring Harbor lab.,Cold Spring Harbor,NY)由5μg多聚(A)+RNA合成双链cDNA。将多聚(A)+RNA(5μl DEPC(0.1%焦碳酸二乙酯)-处理过的水中5μg)在预硅化的无核糖核酸酶Eppendorf
Figure A200780019316D0066084613QIETU
管中在70℃加热8分钟,在冰上淬火,与逆转录酶缓冲液组合在50μl的最终体积中,所述逆转录酶缓冲液由下列组成:50mM Tris-HCl,pH8.3、75mM KCl、3mM MgCl2、10mM二硫苏糖醇(DTT)(Bethesda Research Laboratories,Bethesda,MD,USA)、1mM的dATP、dGTP和dTTP、0.5mM的5-甲基-dCTP(Pharmacia,Uppsala,Sweden)、40个单位的人胎盘核糖核酸酶抑制剂(RNasin,Promega,Madison,WI,USA)、1.45μg的寡(dT)18-Not I引物(Pharmacia,Uppsala,Sweden)和1000个单位的SuperScript
Figure A200780019316D0066084613QIETU
 II RNase H逆转录酶(Bethesda Research Laboratories,Bethesda,MD,USA)。通过将反应混合物于45℃温育1小时来合成第一链cDNA。合成后,根据制造商的说明通过MicroSpin S-400HR旋转柱(Pharmacia,Uppsala,Sweden)凝胶过滤mRNA:cDNA杂合体混合物。
凝胶过滤后,将杂合体稀释于250μl含200μM的每种dNTP、60个单位的大肠杆菌DNA聚合酶I(Pharmacia,Uppsala,Sweden)、5.25个单位的RNase H(Promega,Madison,WI,USA)和15个单位的大肠杆菌DNA连接酶(Boehringer Mannheim,Manheim,Germany)的第二链缓冲液(20mM Tris-HCl,pH7.4、90mM KCl、4.6mM MgCl2、10mM(NH4)2SO4、0.16mM NAD)。通过将反应管在16℃温育2小时,在25℃再温育15分钟来合成第二链cDNA。添加EDTA至终浓度20mM以终止反应,之后用苯酚和氯仿提取。
通过添加2体积的96%乙醇和0.2体积的10M乙酸铵以将双链cDNA在-20℃沉淀12小时,通过在13,000xg离心回收,在70%乙醇中洗涤,干燥,并重悬于含25个单位的绿豆核酸酶(Pharmacia,Uppsala,Sweden)的30μl绿豆核酸酶缓冲液(30mM乙酸钠pH4.6、300mM NaCl、1mM ZnSO4、0.35mMDTT、2%甘油)。通过如下方法修剪单链发夹DNA:将所述反应物于30℃温育30分钟,之后添加70μl的10mM Tris-HCl-1mM EDTA pH7.5,苯酚提取,并用2体积的96%乙醇和0.1体积的3M乙酸钠pH5.2在冰上沉淀30分钟。
通过在13,000xg离心回收双链cDNA,并通过将所述反应混合物于16℃温育1小时以将其在含0.5mM的每种dNTP和5个单位的T4DNA聚合酶(New England Biolabs,Ipswich,MA,USA)的30μl T4DNA聚合酶缓冲液(20mM Tris-乙酸,pH7.9、10mM乙酸镁、50mM乙酸钾、1mM DTT)中末端钝化。添加EDTA至终浓度20mM以终止反应,之后进行苯酚和氯仿提取,并通过添加2体积的96%乙醇和0.1体积的3M乙酸钠pH5.2在-20℃沉淀12小时。
所述填充反应之后,通过在13,000xg离心回收cDNA,在70%乙醇中洗涤,并干燥。将cDNA沉淀重悬在含2.5μg如下所示的非回文(non-palindromic)Bst XI衔接头(Invitrogen,Carlsbad,CA,USA)和30个单位的T4连接酶(Promega,Madison,WI,USA)的25μl连接缓冲液(30mMTris-HCl,pH7.8、10mM MgCl2、10mM DTT、0.5mM ATP)中,然后16℃温育12小时。通过在65℃加热20分钟以终止反应,然后在冰上冷却5分钟。
5′-CTTTCCAGCACA-3′(SEQ ID NO:24)
3′-GAAAGGTC-5′
用Not I消化修饰的(adapted)cDNA,之后在37℃温育2.5小时。通过在65℃加热10分钟以终止反应。通过如下方法对cDNA进行大小分级:在44mM Tris碱、44mM硼酸、0.5mM EDTA(TBE)缓冲液中,在0.8%SeaPlaque
Figure A200780019316D0066084613QIETU
 GTG低熔解温度琼脂糖凝胶(Cambrex Corporation,EastRutherford,NJ,USA)上进行凝胶电泳以分离未连接的衔接头和小cDNA。以0.7kb为截止点(cut-off)根据大小选择(size-selected)cDNA,根据制造商的说明利用β-琼脂糖酶(New England Biolabs,Ipswich,MA,USA Biolabs)从凝胶挽救(rescue)所述cDNA,并通过添加两个体积的96%乙醇和0.1体积的3M乙酸钠pH5.2将其在-20℃沉淀12小时。
通过在13,000xg离心回收根据方向、大小选择的cDNA,在70%乙醇中洗涤,干燥,然后重悬在30μl的10mM Tris-HCl-1mM EDTA pH7.5中。根据制造商的说明,通过经MicroSpin S-300 HR旋转柱凝胶过滤将所述cDNAs脱盐。在含有5μl双链cDNA(#1和#2反应管)、15个单位的T4连接酶、30ng(#1管)、40ng(#2管)、和40ng(#3管,载体背景对照)Bst XI-NotI切割的pYES2.0载体(Invitrogen,Carlsbad,CA,USA)的10μl连接缓冲液(30mM Tris-HCl,pH7.8、10mM MgCl2、10mM DTT、0.5mM ATP)中进行三个检验连接。通过在16℃温育12小时,然后在70℃加热20分钟,最后向每管添加10μl水来进行连接反应。如Sambrook等,1989,同上所述,将1μl的每种连接混合物电穿孔到40μl电感受态(electrocompetent)大肠杆菌DH10B细胞(Bethesda Research Laboratories,Bethesda,MD,USA)中。
将Cladorrhinum foecundissimum ATCC 62373 cDNA文库建立为大肠杆菌DH10B中的汇集物(pool)。通过在添加有100μg氨苄青霉素每ml的LB平板上涂布转化的大肠杆菌来制备每个汇集物,在37℃温育24小时后得到15,000-30,000菌落/平板。向平板添加20ml补充有100μg氨苄青霉素每ml的LB培养基,并将细胞悬浮于其中。将细胞悬液在37℃在50ml管中在100rpm摇动1小时。
所得Cladorrhinum foecundissimum ATCC 62373 cDNA文库由约106个单一克隆组成,具有1%的载体背景。根据制造商的说明,利用Plasmid Midi试剂盒(QIAGEN Inc.,Valencia,CA,USA)从一些文库汇集物分离质粒DNA,并储存于-20℃。
通过电穿孔(Becker和Guarante,1991,Methods Enzymol.194:182-187)将来自一些文库汇集物(实施例1)的1ml等份纯化质粒DNA(100ng/ml)转化到酿酒酵母W3124中,将转化体涂布在含2%葡萄糖的SC琼脂上并在30℃温育。共计从每个汇集物获得含250-400酵母菌落的50-100个平板。
温育3-5天后,将所述SC琼脂平板复制涂布(replica plate)到一组含半乳糖的0.1%AZCL HE纤维素SC URA琼脂平板上。将平板在30℃温育2-4天,将由蓝色晕圈环绕的菌落鉴定为内切葡聚糖酶阳性菌落。
将表达内切葡聚糖酶的酵母菌落接种到50ml玻璃试管中的20ml YPD培养基中。将试管在30℃在200rpm摇动2天。通过在具有75002252转子的Heraeus Megafuge 1.0R离心机(Hanau,Germany)中在3000rpm离心10分钟来收获细胞。
依照WO 94/14953分离DNA,并将其溶解在50μl去离子水中。通过根据Sambrook等,1989,同上的标准方法将DNA转化到大肠杆菌DH10B细胞中。随后显示一个大肠杆菌转化体含有Cladorrhinum foecundissimum ATCC62373 cel7a基因,该菌株中的质粒命名为pCIC521。
实施例12:Cladorrhinum foecundissimum ATCC 62373 cel7a基因在米曲霉中的表达
利用标准方法(Sambrook等,1989,同上)用Bam HI和XbaI从pCIC521切下Cladorrhinum foecundissiumum ATCC 62373 cel7a基因,并连接到曲霉属表达载体pHD464(Dalboge和Heldt-Hansen,1994,Molecular and GeneralGenetics 243:253-260)中。所得质粒命名为pA2CIC521。
如WO 95/02043所述制备米曲霉HowB104的原生质体。将100μl的原生质体悬浮液与5-25μg的曲霉属表达载体pA2CIC521在10μl STC中混合,STC由1.2M山梨醇、10mM Tris-HCl,pH7.5、10mM CaCl2组成,并进一步与5-25μg携带构巢曲霉amdS基因的质粒p3SR2(Christensen等,1988,Bio/Technology 6:1419-1422)混合。将混合物在室温下放置25分钟。添加200μl60%PEG 4000(BDH,Poole,England)(聚乙二醇,分子量4,000)、10mMCaCl2和10mM Tris-HCl pH7.5,轻轻混合,最后添加0.85ml的相同溶液,轻轻混合。将所述混合物在室温下放置25分钟,在2,500xg离心15分钟,将沉淀重悬在2ml的1.2M山梨醇中。重复该沉积过程,将原生质体涂布在COVE平板上。在37℃温育4-7天后,挑选并涂布孢子以分离单菌落。重复该过程,在第二次再分离后储存单菌落的孢子。
将每个转化体接种在10ml的YPM培养基中。在30℃、200rpm温育2-5天后去除上清。通过将20μl培养液添加到在0.1% AZCL HE纤维素SC-琼脂平板中穿出的4mm直径孔,并在30℃温育过夜,来鉴定内切葡聚糖酶活性。内切葡聚糖酶活性的存在在菌落周围产生蓝色晕圈。几个转化体培养液具有的内切葡聚糖酶活性明显大于来自未转化的米曲霉背景对照的培养液,这显示来自Cladorrhinum foecundissimum ATCC 62373的CEL7A内切葡聚糖酶在米曲霉中有效表达。将一个米曲霉转化体命名为A2.11C5214/3。
实施例13:米曲霉A2.11C521 4/3基因组DNA提取
用带挡板的摇瓶将表达Cladorrhinum foecundissimum的CEL7A蛋白的米曲霉菌株A2.11C5214/3在300ml培养体积中的M400培养基中在34℃200rpm培养7天。将生物物质在液氮中冷冻并用研钵和杵粉碎为粉末。将粉末悬浮在15ml的0.1M CAPS-NaOH pH11.0、1mM EDTA、0.5%十二烷基硫酸锂中,通过倒转以周期性混合在60℃温育60分钟。添加等体积的中和苯酚,并将管于37℃轻轻摇动1hr。添加5ml的氯仿,并用力搅动试管1分钟。在1300xg离心10分钟后,用等体积苯酚:氯仿(1:1)通过搅动5分钟来再次提取上部水相。重复离心,将水相转到2.5M乙酸铵,并在-20℃储存20分钟。在4℃17,000xg离心20分钟后,通过添加0.7体积的异丙醇来沉淀上清中的上清核酸。在17,000xg离心10分钟后,倾析上清并用70%乙醇漂洗沉淀,风干。将沉淀溶解在950μl去离子水中,之后添加50μl的Promega细胞重悬液(Promega Corporation,Madison WI,USA),室温下温育5分钟。添加乙酸铵至1.0M,并通过添加2体积的乙醇沉淀核酸。在13,000xg离心10分钟后,将沉淀溶解在300μl的1mM Tris-HCl、0.1mM EDTA,pH8.0中,储存于-20℃。
实施例14:从米曲霉表达菌株A2.11C5214/3的基因组DNA PCR扩增Cladorrhinum foecundissimum cel7a cDNA
为了测序和克隆保藏物,从米曲霉菌株A2.11C521 4/3基因组DNA扩增cel7a cDNA。设计了与pHD464表达载体同源的两个合成寡核苷酸引物,用于从米曲霉菌株A2.11C521 4/3基因组DNAPCR扩增cel7a基因。
正向引物:
5’-CCACACTTCTCTTCCTTCCTC-3’(SEQ ID NO:25)
反向引物:
5’-CCCCATCCTTTAACTATAGCG-3’(SEQ ID NO:26)
PCR反应物中使用17皮摩尔的上述每种引物,所述反应物在50μl的最终体积中包含100ng的米曲霉A2.11C5214/3基因组DNA(如实施例13所述制备)、1X Pfx扩增缓冲液(Invitrogen,Carlsbad CA,USA)、1.7μl的dATP、dTTP、dGTP和dCTP的10mM混合物、2.5个单位的Platinum PfxDNA聚合酶和1μl的50mM MgSO4。在Stratagene Robocycler
Figure A200780019316D0066084613QIETU
中进行扩增,程序编制为96℃ 3分钟和72℃ 3分钟(在此期间添加DNA聚合酶)的1个循环;和35个循环,每个循环94℃ 50秒、5℃ 50秒、68℃ 2分钟;之后为在68℃最终延伸7分钟。
用TAE缓冲液在1.0%琼脂糖凝胶上分离反应产物,从凝胶切下约1.7kb的产物条带,根据制造商的说明用QIAEX
Figure A200780019316D0066084613QIETU
 II凝胶提取试剂盒纯化。
用Zero Blunt TOPO PCR克隆试剂盒将1.7kb片段克隆到pCR-BluntII-TOPO载体中,并根据制造商的说明(Invitrogen,Carlsbad CA,USA)转化到大肠杆菌TOP10细胞中。用QIAGEN BioRobot 9600从几个转化体制备质粒DNA。对来自两个转化体的质粒测序,发现是相同的且包含cel7a cDNA。将一个质粒命名为pPH46(图12)。
将含有质粒pPH46(图12)的大肠杆菌PaHa46保藏于农业研究机构专利培养物保藏中心北区研究中心,1815 University Street,Peoria,Illinois,61604,保藏号为NRRL B-30897,保藏日期为2006年2月23日。
实施例15:编码CEL7A内切葡聚糖酶的Cladorrhinum foecundissimumATCC 62373 cDNA序列的表征
利用3.1版BigDyeTM终止子化学和dGTP化学和引物步移策略,用3700型Applied Biosystems自动DNA测序仪对质粒pPH46中的Cladorrhinumfoecundissimum ATCC62373 cel7a cDNA进行DNA测序。仔细检查核苷酸序列数据质量,在PHRED/PHRAP软件(University of Washington,Seattle,WA,USA)的辅助下,将所有序列相互比较。
Cladorrhinum foecundissimum cel7a cDNA的核苷酸序列(SEQ ID NO:5)和推导的氨基酸序列(SEQ ID NO:6)如图13A和13B所示。所述编码序列为1323bp,包含终止密码子。编码的预测蛋白为440个氨基酸。所述基因的编码序列的%G+C为59.2%,成熟多肽编码序列的%G+C为59.0%。利用SignalP程序(Nielsen等,1897,同上)预测了18个残基的信号肽。预测的成熟蛋白包含422个氨基酸,分子量为45.7kDa。用InterProScan程序(Zdobnov和Apweiler,2001,同上)分析cel7a基因的推导的氨基酸序列,显示CEL7A多肽含有糖苷水解酶家族7的结构域标签(InterPro登录号IPR001722),其为成熟多肽的大约氨基酸2到405。
使用Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48:443-453)如在具有缺口开放罚分10、缺口延伸罚分0.5和EBLOSUM62矩阵的EMBOSS的Needle软件中所实施的,来确定氨基酸序列的比较配对全局比对。比对显示,编码具有内切葡聚糖酶活性的CEL7A成熟多肽的Cladorrhinum foecundissimum cDNA的推导的氨基酸序列与来自粗糙脉孢菌(登录号为Q7RXC7)和Talaromyces emersonii(登录号为CAC94521.1)的两个糖基水解酶家族7蛋白的推导的氨基酸序列分别共享79%和55%的同一性(缺口除外)。其也分别与土生梭孢霉CEL7E和CEL7C成熟多肽共享64%和57%同一性。
如实施例1所述,通过10-20% Tris-Glycine SDS-PAGE分离含有Cladorrhinum foecundissimum家族7A的培养液。如实施例1中所述,利用串联质谱法将约50kDa的凝胶条带凝胶内消化并从头测序。
将来自701.85m/z序列的双倍荷电的胰蛋白肽离子的部分序列测定为Gly-Thr-Val-Val-Pro-Glu-Ser-His-Pro-Lys,其对应于序列GTVVPESHPK(SEQID NO:6的氨基酸22至31)。将来自第二个739.35的双倍荷电的胰蛋白肽离子的部分序列测定为Gly-Glu-Ala-Asn-[Ile或Leu]-Asp-[Gln或Lys]-Lys,其中Xaa为任何的氨基酸,其对应于序列GEANIDQK(SEQ ID NO:6的氨基酸202至209)。将第三个919.83的双倍荷电的电胰蛋白肽离子测定为[CAM(羧基氨基甲基半胱氨酸)或Phe]-Glu-Gly-Glu-Asp-Glu-[Cam或Phe]-Gly-[Gln或Lys]-Pro-Val-Gly-Val-[Cam或Phe]-Asp-Lys,其对应于序列CEGEDECGQPVGVCDK(SEQ ID NO:6的氨基酸242至257)。将第四个970.45的双倍荷电的胰蛋白肽离子部分序列测定为Pro-Ser-Thr-Pro-Cam-Val-Val-Gly-Gly-Pro-[Ile或Leu]-Cam-Pro-Asp-Ala-Lys,其对应于序列PSTPCVVGGPLCPDAK(SEQ ID NO:6的氨基酸65至80)。
实施例16:从Cladorrhinum foecundissimum ATCC 62373和土生梭孢霉NRRL8126制备重组内切葡聚糖酶
用基本上如Otzen等,1999,Protein Sci.8:1878-87所述的规程,将如实施例12所述在米曲霉中重组产生的Cladorrhinum foecundissimum CEL7内切葡聚糖酶纯化至均质。
以来自宿主米曲霉表达的培养液的形式检测如实施例10所述在米曲霉中重组产生的土生梭孢霉CEL7C和土生梭孢霉CEL7E内切葡聚糖酶。用带有Biomax-5聚醚砜膜(5000NMWL)的Centricon Plus-20离心滤器(Millipore,Bedford,MA,USA)浓缩培养液并交换至50mM乙酸钠缓冲液pH5.0。
根据制造商对BCA蛋白测试试剂盒(Pierce Chemical Co.,Rockford,IL,USA)的说明,用二金鸡纳酸(Bicinchoninic Acid)(BCA)微板测试测定酶制备物中的蛋白质浓度。
在每个试验之前从储存于-20℃的储备酶溶液新鲜制备酶稀释液。
实施例17:底物的制备
由美国能源部可再生能源国家实验室(NREL,Golden,CO,USA)利用稀硫酸制备预处理的玉米秸(PCS)。使用下述条件进行预处理:1.4wt%硫酸、在165℃和10psi进行8分钟。在NREL进行组成分析。用NREL标准分析方法#002通过二阶段硫酸水解及随后通过高效液相层析(HPLC)分析糖来测定纤维素和半纤维素。用硫酸水解纤维素和半纤维素级分后,以重量分析法测定木质素(NREL标准分析方法#003)。将预处理的玉米秸(PCS)中不溶于水的固体测定为56.5%纤维素、4.6%半纤维素和28.4%木质素。
用粗孔隙玻璃滤器(Fisher Scientific,Pittsburg,PA,USA)在Kimax漏斗上用大量去离子水洗涤PCS。在咖啡磨碎机中磨碎水洗涤过的PCS,在具有6PExpress Membrane的22μm Millipore Filter(Millipore,Bedford,MA,USA)上再次用去离子水洗涤。磨碎的PCS的干重为32.4%。
用下述方法制备溶于去离子水中的10mg/ml磷酸溶胀纤维素(PASC)储存悬浮液。将150ml冰冷的85%o-磷酸添加到用水润湿的5gAvicel(艾维素)PH101(FMC Corp.,Philadelphia,PA,USA)。悬浮液在冰浴中缓慢搅动一小时,在恒定搅动时将100ml冰冷的丙酮添加到所述悬浮液。把浆料转到具有粗孔隙玻璃滤器的Kimax漏斗,用100ml冰冷的丙酮洗涤三次,在每次洗涤后尽可能完全排干。最后用500ml水将所述浆料洗涤两次,每次洗涤后同样尽可能完全排干。将PASC与水混合至总体积500ml。添加叠氮化钠至终浓度0.02%以阻止微生物生长。用搅拌器将浆料均质化,并在4℃储存多至一个月。
从Hercules Inc.,Wilmington,DE,USA的Aqualon Division获得平均取代度(DS)为0.7的羧甲基纤维素(CMC,钠盐,7L2型)。通过将CMC缓慢加到用力搅动的缓冲液来制备溶于50mM乙酸钠pH5.0中的6.25mg/ml CMC溶液。在持续搅动下把浆料加热到约60℃,直至CMC完全溶解。
从Sigma,St.Louis,MO,USA获得对硝基苯基-β-D-纤维二糖糖苷(PNPC)和对硝基苯基-β-D-乳糖苷(PNPL)。
如Boisset等,1999,Biochemical Journal,340:829-835中所述,由食品级商业纤维素Nata de Coco(Fujicco Co.,Kobe,Japan)制备细菌纤维素(BC)。在4℃保存溶于含0.01%(w/v)叠氮钠的去离子水中的1mg/ml细菌纤维素悬浮液。
Avicel PH101从FMC Corporation,Philadelphia,PA,USA获得。
来自桦木的木聚糖从Sigma,St.Louis,MO获得。来自罗望子种子的木葡聚糖(淀粉状,lot 00401)、小麦阿拉伯木聚糖(中粘度,27cSt,lot 90601)、1,4-β-D-甘露聚糖(氢硼化物还原的,Man:Gal=97:3,聚合度DP~15,lot90302)、和角豆(carob)半乳甘露聚糖(低粘度,氢硼化物还原的,lot 90301)从Megazyme,Bray,Ireland获得。
实施例18:用于测定还原糖的对羟苯甲酸酰肼测试
通过对羟苯甲酸酰肼(PHBAH)测试(Lever,1972,Anal.Biochem.47,273-279)测定还原糖(RS),该测试方法适合于96-孔微板阵列。
将稀释样品的90-μl等分试样置于96-孔锥底微板(Costar,透明聚碳酸酯,Corning Inc.,Acton,MA)的每个孔中。通过将60μl溶于2%氢氧化钠中的1.25% PHBAH添加到每个孔中来启动所述测试。未覆盖的平板于95℃在定制的加热块上加热10分钟。加热之后将微板冷却至室温,向每个孔添加35μl去离子水。从每个孔取出100μl等分试样,并转移到平底96-孔平板(Costar,中等结合聚苯乙烯,Corning Inc.,Acton,MA)。用SpectraMAX微板读数器(Molecular Devices,Sunnyvale,CA)测量410nm处的吸光度(A410)。用标准曲线将A410值折算为葡萄糖当量。
用六个葡萄糖标准(0.005、0.010、0.025、0.050、0.075和0.100mg/ml)获得所述标准曲线,对其进行与样品类似的处理。通过用去离子水稀释10mg/ml储备葡萄糖溶液来制备葡萄糖标准。
对于除木聚糖和阿拉伯木聚糖之外的所有底物,利用下述等式计算转化的程度(%):
转化率(%)=RS(mg/ml) x 100 x 162/(起始底物浓度(mg/ml) x 180)
          =RS(mg/ml) x 100/(起始底物浓度(mg/ml) x 1.111)
对于木聚糖和阿拉伯木聚糖,用下述等式计算底物水解为RS的百分数:
转化率(%)=RS(mg/ml) x 100 x 132/(起始底物浓度(mg/ml) x 150)
          =RS(mg/ml) x 100/(起始底物浓度(mg/ml) x 1.136)
在这些等式中,RS是以葡萄糖当量测量的溶液中还原糖的浓度(mg/ml),因数1.111和1.136反映在相应的多糖至己糖(MW180)或戊糖(MW150)糖转化中的重量增加。
实施例19:Cladorrhinum foecundissimum ATCC 62373 CEL7A 内切葡聚糖酶对不同底物的相对活性
Cladorrhinum foecundissimum ATCC 62373 CEL7A内切葡聚糖酶对四种底物的相对活性示于表1。将相对活性显示为Cladorrhinum foecundissimumCEL7A内切葡聚糖酶对羧甲基纤维素(CMC)的活性的百分数。通过测量产物浓度随时间线性增加范围内水解的初始速率来测定活性。稀释Cladorrhinumfoecundissimum CEL7A内切葡聚糖酶以给出酶浓度与测得的活性之间的线性关系。
通过测量在50℃在50mM乙酸钠pH5.0中水解30分钟后自CMC(5mg/ml)产生的还原糖(RS)的浓度来测定Cladorrhinum foecundissimum CEL7A内切葡聚糖酶对于羧甲基纤维素(CMC)的可溶性钠盐的活性。在存在0.5mg/ml牛血清白蛋白(BSA)且不搅动的情况下进行水解。利用实施例18中描述的对羟苯甲酸酰肼(PHBAH)测试方法测定还原糖。
通过测量在50℃、50mM乙酸钠pH5.0中磷酸溶胀纤维素(PASC)(2mg/ml)的初始水解期间释放的还原糖(RS)的浓度来测定Cladorrhinumfoecundissimum CEL7A内切葡聚糖酶对PASC的活性。在存在0.5mg/ml BSA且不搅动的情况下进行水解。将酶稀释以使在水解的最初30至90分钟期间RS浓度会线性增加,在此期间PASC转化的程度将不超过2%。利用实施例18中描述的对羟苯甲酸酰肼(PHBAH)测试方法测定还原糖。
利用修饰为96-孔微板形式的Deshpande等的方法(Deshpande等,1984,Anal.Biochem.138,481-487)测定内切葡聚糖酶对于产色底物对硝基苯基-β-D-纤维二糖糖苷(PNPC)和对硝基苯基-β-D-乳糖苷(PNPL)的活性。PNPC(2.5mM)或PNPL(2.5mM)在40℃在50mM乙酸钠pH5.0中水解30-分钟后,通过分光光度测量于405nm处测定对硝基苯酚(PNP)。水解前,将酶稀释在50mM乙酸钠pH5.0中,在指定条件下两种底物均得到小于8%的转化率。
表1.在pH5.0和50℃ Cladorrhimun foecundissimum CEL7A纤维素酶的相对活性
 
底物 相对活性,%
羧甲基纤维素(CMC) 100
磷酸溶胀纤维素(PASC) 14.5
对硝基苯基-β-D-纤维二糖糖苷(PNPC) 0.58
对硝基苯基-β-D-乳糖苷(PNPL) 0.77
实施例20:Cladorrhinum foecundissimum ATCC 62373 CEL7A内切葡聚糖酶的热稳定性
通过将酶溶液在五个温度(40℃、50℃、60℃、70℃和80℃)温育并测量对于羧甲基纤维素(CMC)的残余活性,从而测定纯化的Cladorrhinumfoecundissimum CEL7内切葡聚糖酶的热稳定性。
将酶在含3.0mg/ml BSA的50mM乙酸钠pH5.0中稀释,并在以8x12微板形式(Pierce,Rockford,IL)放置的1.1-ml ImmunoWare微型试管(Microtubes)中温育3小时。添加BSA以防止酶可能吸附在微型试管的塑料壁上。选择温育混合物中的蛋白质浓度使得在随后的CMCase活性测试中获得小于1%的CMC转化率。
温育3小时后,用8-通道移液管取出15μl的等份试样,添加到96-孔锥底微板(Costar,透明聚碳酸酯,Corning Inc.,Acton,MA)中的75μl CMC溶液(在50mM乙酸钠pH5.0中6mg/ml)。然后如实施例19所述测量残留的CMCase活性,并将其表示为初始CMCase活性的百分数(表2)。
温育3小时后,Cladorrhinum foecundissimum CEL7A内切葡聚糖酶在40℃和50℃保留了超过90%的初始CMCase活性,在60℃保留了初始CMCase活性的三分之一,在70℃和80℃保留了初始CMC-ase活性的0%。
表2.在pH5.0温育三个小时后Cladorrhinum foecundissimum CEL7内切葡聚糖酶的残留CMCase活性
 
温度,℃ 残留CMCase活性,初始活性的%
40℃ 95.0
50℃ 92.9
60℃ 29.2
70℃ 0.0
80℃ 0.0
实施例21:Cladorrhinum foecundissimum ATCC 62373和土生梭孢霉NRRL 8126内切葡聚糖酶对不同多糖底物的表征
在pH5.0(50mM乙酸钠缓冲液)和50℃,在不同多糖的水解中评估Cladorrhinum foecundissimum ATCC 62373 CEL7和土生梭孢霉NRR8126CEL7C内切葡聚糖酶。将结果与重组里氏木霉CEL7B(EGI)内切葡聚糖酶的结果相比较。重组里氏木霉CEL7B(EGI)内切葡聚糖酶可以根据包括本文的参考文献制备。
多糖包括预处理的玉米秸(PCS)、磷酸溶胀纤维素(PASC)、羧甲基纤维素(CMC)、细菌纤维素(BC)、Avicel、木聚糖、木葡聚糖、阿拉伯木聚糖、甘露聚糖和半乳甘露聚糖。除细菌纤维素以0.9mg/ml使用之外,所有底物都以5mg/ml使用。
在覆盖有Eppendorf
Figure A200780019316D0066084613QIETU
 96Deep Well Mats(VWR Scientific,West Chester,PA,USA)的Eppendorf
Figure A200780019316D0066084613QIETU
 96Deep Well平板(1.2ml,VWR Scientific,WestChester,PA,USA)中在间歇搅动的情况下以1ml的初始体积进行24小时反应。除非另有说明,酶以每g固体5mg蛋白质装载。
24小时后,用8-通道移液器从水解反应中移出20μl的等份试样,添加到MultiScreen HV 96-孔过滤平板(Millipore,Bedford,MA,USA)中180μl的102mM Na2CO3-58mM NaHCO3以终止水解。将样品真空过滤到平底微板中。适当稀释后,如实施例18所述用对羟苯甲酸酰肼(PHBAH)测试分析滤液的还原糖。
表3显示24-小时温育后内切葡聚糖酶对不同多糖的相对转化率该相对转化率计算为用土生梭孢霉CEL7C内切葡聚糖酶水解磷酸溶胀纤维素(PASC)24-小时后获得的转化率的百分数。表3的结果显示三种内切葡聚糖酶对木聚糖、木葡聚糖和阿拉伯木聚糖均具有相对高的活性,但对甘露聚糖和半乳甘露聚糖的活性低。内切葡聚糖酶显示对PASC(不溶性未取代无定形纤维素)的水解好于对CMC(可溶性取代的纤维素衍生物)的水解。内切葡聚糖酶对具有高结晶度的不溶性底物具有低活性:细菌纤维素、Avicel和PCS。
表3.内切葡聚糖酶(每g固体5mg蛋白质)对不同多糖底物(5mg/ml)的相对转化率;pH5.0,50℃,24小时
 
底物 CladorrhinumfoecundissimumCEL7A 土生梭孢霉CEL7C 里氏木霉CEL7B
预处理的玉米秸(PCS) 5.2 ND 8.7
磷酸溶胀纤维素(PASC) 21.1** 100.0 32.4
羧甲基纤维素(CMC) 13.2** 22.5 11.6
细菌纤维素(BC)* 1.3 8.1*** 3.9
Avicel(微晶纤维素) 1.4 6.4 4.2
桦木木聚糖 14.2 35.8 42.8
罗望子木葡聚糖 40.0 67.5 73.0
小麦阿拉伯木聚糖 47.5 42.5 68.2
1,4-β-D-甘露聚糖 0.5 1.4 1.8
角豆半乳甘露聚糖 0.9 1.4 2.6
*细菌纤维素的初始浓度为0.9mg/ml
**水解PASC和CMC时以每g固体0.25mg蛋白质使用Cladorrhinumfoecundissimum CEL7A
***水解细菌纤维素时以每g固体25mg蛋白质使用土生梭孢霉CEL7C
实施例22:在50℃用土生梭孢霉NRRL 8126 CEL7C水解不同多糖
重复实施例21的方法,只是将水解进行71个小时且于不同的时间点从反应物获取等份试样以跟踪水解的时间进程。用八种多糖检测了土生梭孢霉NRRL 8126 CEL7C内切葡聚糖酶。多糖的相对转化程度作为水解时间的函数示于图14。将相对转化率显示为磷酸溶胀纤维素(PASC)71-小时水解后获得的转化率百分数。所有反应中底物浓度均为5mg/ml,且酶载荷为每g固体5mg蛋白质。
土生梭孢霉CEL7C内切葡聚糖酶对PASC、木聚糖、木葡聚糖和阿拉伯木聚糖显示出高活性,但对甘露聚糖和半乳甘露聚糖显示出低活性。与不溶性未取代的纤维素(PASC)相比,土生梭孢霉CEL7C内切葡聚糖酶对可溶性取代的纤维素(CMC)具有低得多的活性。对微晶纤维素(Avicel)的活性明显低于对无定形纤维素(PASC)的活性。
实施例23:用Cladorrhinum foecundissimum ATCC 62373土生梭孢霉NRRL8126内切葡聚糖酶从大麦水解可溶性β-葡聚糖
在pH5.5(含0.02%叠氮钠的50mM乙酸钠)和60℃测定Cladorrhinumfoecundissimum ATCC 62373 CEL7A和土生梭孢霉NRRL 8126 CEL7C和CEL7E内切葡聚糖酶对来自大麦的可溶性β-葡聚糖(中粘度,230kDa,Megazyme International Ireland Ltd.,Bray,Ireland)的活性。将该结果与里氏木霉CEL7B(EGI)内切葡聚糖酶的那些结果相比较。重组里氏木霉CEL7B(EGI)内切葡聚糖酶可以如实施例21所述制备。
水解反应中β-葡聚糖的初始浓度为1.0%(w/v)。不搅动的情况下在Eppendorf
Figure A200780019316D0066084613QIETU
 96DeepWell平板(1.2ml,VWR Scientific,West Chester,PA)中进行1ml反应。以三个蛋白质负载0.05、0.1和0.2mg每g葡聚糖使用酶。在对照反应中,用含0.02%叠氮钠的50mM乙酸钠pH5.5(缓冲液对照)或用不含重组表达的酶的浓缩并缓冲交换的米曲霉Jal250培养液(米曲霉Jal250对照)代替内切葡聚糖酶。
在2小时和24小时从水解反应物移出等份试样,用去离子水稀释,并用如实施例18所述的对羟苯甲酸酰肼(PHBAH)测试分析还原糖。在两个温育时间(2小时和24小时)β-葡聚糖的相对转化率作为蛋白质负载的函数分别示于图15和16。将相对转化率显示为用Cladorrhinum foecundissimum CEL7A内切葡聚糖酶(每g葡聚糖0.2mg蛋白质)水解β-葡聚糖24-小时后所获得的转化率的百分数。
与其它内切葡聚糖酶相比,里氏木霉CEL7B内切葡聚糖酶显示低的β-葡聚糖转化率,水解2小时后还原糖浓度几乎没有额外的增加。相比之下,超过2小时温育时间后,Cladorrhinum foecundissimum CEL7A、土生梭孢霉CEL7C和土生梭孢霉CEL7E内切葡聚糖酶继续产生新的还原性端基。与土生梭孢霉CEL7C和土生梭孢霉CEL7E内切葡聚糖酶相比,在水解β-葡聚糖方面Cladorrhinum foecundissimum CEL7A内切葡聚糖酶显示出更好的性能。
生物材料保藏
依据布达佩斯条约的条款,下述的生物材料已经保藏于农业研究机构专利培养物保藏中心(Agricultural Research Service Patent Culture Collection),北区研究中心(Northern Regional Research Center),1815 University Street,Peoria,Illinois,61604,并给予下述的登录号:
保藏物                 保藏号             保藏日期
大肠杆菌PaHa50         NRRL B-30899       2006年2月23日
大肠杆菌PaHa38         NRRL B-30896       2006年2月23日
大肠杆菌PaHa46         NRRL B-30897       2006年2月23日
所述菌株于下述条件下保藏:确保在本专利申请未决期间,由专利与商标委员依据37 C.F.R.§1.14和35 U.S.C.§122授权的人能够获得所述培养物。所述保藏物为所保藏菌株的基本上纯的培养物。在提交了该申请的副本,或其后续文本的国家,依据该外国专利法律的要求,可以获得所述保藏物。然而,应当理解,保藏物的获得并不构成对实施本发明的许可,实施本发明是对政府行为所授予的专利权的侵犯。
本文描述和要求保护的本发明并不受限于本文所公开的具体方面的范围,因为这些方面意欲作为本发明几个方面的说明。任何等价的方面意欲在本发明的范围之内。实际上,从前面的说明中,除本文所显示和描述的之外,本发明的多种修改对于本领域的技术人员来说是显而易见的。这些修改也意欲落入所附的权利要求的范围内。在冲突的情况下,将以包括定义部分的本公开为准。
本文引用了多篇参考文献,其公开的内容通过引用整体并入。
序列表
<110>诺维信股份有限公司(Novozymes,Inc.)
诺维信公司(Novozymes A/S)
<120>具有内切葡聚糖酶活性的多肽和编码该多肽的多核苷酸
<130>10892.204-CN
<150>60/788,389
<151>2006-03-30
<150>PCT/US2007/065682
<151>2007-03-30
<160>26
<170>PatentIn version 3.5
<210>1
<211>1501
<212>DNA
<213>土生梭孢霉(Thielavia terrestris)
<400>1
Figure A200780019316D00931
<210>2
<211>464
<212>PRT
<213>土生梭孢霉
<400>2
Figure A200780019316D00951
<210>3
<211>1368
<212>DNA
<213>土生梭孢霉
<400>3
<210>4
<211>423
<212>PRT
<213>土生梭孢霉
<400>4
Figure A200780019316D00961
<210>5
<211>1480
<212>DNA
<213>Cladorrhinum foecundissimum
<400>5
<210>6
<211>440
<212>PRT
<213>Cladorrhinum foecundissimum
<400>6
Figure A200780019316D00973
Figure A200780019316D00981
<210>7
<211>26
<212>DNA
<213>土生梭孢霉
<220>
<221>misc_feature
<222>(15)..(15)
<223>N=A,C,G或T
<220>
<221>misc_feature
<222>(18)..(18)
<223>N=A,C,G或T
<220>
<221>misc_feature
<222>(21)..(21)
<223>R=A或G
<220>
<221>misc_feature
<222>(24)..(24)
<223>R=A或G
<400>7
Figure A200780019316D00991
<210>8
<211>33
<212>DNA
<213)土生梭孢霉
<220>
<221>misc_feature
<222>(25)..(25)
<223>N=A,C,G或T
<220>
<221>misc_feature
<222>(28)..(28)
<223>Y=T或C
<220>
<221>misc_feature
<222>(31)..(31)
<223>Y=T或C
<400>8
<210>9
<211>25
<212>DNA
<213>土生梭孢霉
<220>
<221>misc_feature
<222>(18)..(18)
<223>R=A或G
<220>
<221>misc_feature
<222>(21)..(21)
<223>Y=T或C
<220>
<221>misc_feature
<222>(23)..(23)
<223>N=A,C,G或T
<400>9
<210>10
<211>28
<212>DNA
<213>土生梭孢霉
<220>
<221>misc_feature
<222>(11)..(11)
<223>R=A或G
<220>
<221>misc_feature
<222>(17)..(17)
<223>Y=T或C
<220>
<221>misc_feature
<222>(23)..(23)
<223>R=A或G
<220>
<221>misc_feature
<222>(26)..(26)
<223>R=A或G
<400>10
Figure A200780019316D01002
<210>11
<211>25
<212>DNA
<213>土生梭孢霉
<400>11
Figure A200780019316D01003
<210>12
<211>25
<212>DNA
<213>土生梭孢霉
<400>12
Figure A200780019316D01004
<210>13
<211>22
<212>DNA
<213>构巢曲霉(Aspergillus nidulans)
<400>13
Figure A200780019316D01005
<210>14
<211>26
<212>DNA
<213>构巢曲霉
<400>14
Figure A200780019316D01006
<210>15
<211>24
<212>DNA
<213>构巢曲霉
<400>15
Figure A200780019316D01011
<210>16
<211>45
<212>DNA
<213>黑曲霉(Aspergillus niger)
<400>16
Figure A200780019316D01012
<210>17
<211>45
<212>DNA
<213>黑曲霉
<400>17
Figure A200780019316D01013
<210>18
<211>44
<212>DNA
<213>黑曲霉
<400>18
Figure A200780019316D01014
<210>19
<211>44
<212>DNA
<213>黑曲霉
<400>19
Figure A200780019316D01015
<210>20
<211>29
<212>DNA
<213>米曲霉(Aspergillus oryzae)
<400>20
Figure A200780019316D01016
<210>21
<211>31
<212>DNA
<213>米曲霉
<400>21
<210>22
<211>36
<212>DNA
<213>土生梭孢霉
<400>22
Figure A200780019316D01018
<210>23
<211>38
<212>DNA
<213>土生梭孢霉
<400>23
Figure A200780019316D01019
<210>24
<211>12
<212>DNA
<213>Cladorrhinum foecundissimum
<400>24
Figure A200780019316D01021
<210>25
<211>21
<212>DNA
<213>Cladorrhinum foecundissimum
<400>25
Figure A200780019316D01022
<210>26
<211>21
<212>DNA
<213>Cladorrhinum foecundissimum
<400>26
Figure A200780019316D01023

Claims (53)

1.具有内切葡聚糖酶活性的分离的多肽,其选自下组:
(a)包含氨基酸序列的多肽,所述氨基酸序列与SEQ ID NO:2的成熟多肽具有至少80%的同一性,与SEQ ID NO:4的成熟多肽具有至少70%的同一性,或与SEQ ID NO:6的成熟多肽具有至少85%的同一性;
(b)由多核苷酸编码的多肽,所述多核苷酸在至少高严紧条件下与下列杂交:(i)SEQ ID NO:1或SEQ ID NO:5的成熟多肽编码序列,(ii)包含于SEQ ID NO:1或SEQ ID NO:5的成熟多肽编码序列中的cDNA序列,或(iii)(i)或(ii)的互补链,或者在至少中-高严紧条件下与下列杂交:(i)SEQ ID NO:3的成熟多肽编码序列,(ii)包含SEQ ID NO:3的成熟多肽编码序列的基因组DNA序列,或(iii)(i)或(ii)的互补链;
(c)由包含核苷酸序列的多核苷酸编码的多肽,所述核苷酸序列与SEQID NO:1的成熟多肽编码序列具有至少80%同一性,与SEQ ID NO:3的成熟多肽编码序列具有至少70%同一性,或者与SEQ ID NO:5的成熟多肽编码序列具有至少85%同一性;和
(d)包含一个或几个氨基酸的取代、缺失和/或插入的SEQ ID NO:2、SEQID NO:4或SEQ ID NO:6的成熟多肽的变体。
2.权利要求1的多肽,其包含:与SEQ ID NO:2的成熟多肽具有优选至少80%同一性、更优选至少85%同一性、甚至更优选至少90%同一性、最优选至少95%同一性的氨基酸序列;与SEQ ID NO:4的成熟多肽具有优选至少70%同一性、更优选至少75%同一性、甚至更优选至少80%同一性、甚至更优选至少85%同一性、最优选至少90%同一性的氨基酸序列、甚至最优选至少95%同一性的氨基酸序列;或与SEQ ID NO:6的成熟多肽具有优选至少85%同一性、更优选至少90%同一性、最优选至少95%同一性的氨基酸序列。
3.权利要求1的多肽,其包含SEQ ID NO:2、SEQ ID NO:4或SEQ IDNO:6的氨基酸序列,或其具有内切葡聚糖酶活性的片段;或由SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:6的氨基酸序列,或其具有内切葡聚糖酶活性的片段组成。
4.权利要求3的多肽,其包含SEQ ID NO:2、SEQ ID NO:4或SEQ IDNO:6的氨基酸序列或由SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:6的氨基酸序列组成。
5.权利要求3的多肽,其包含SEQ ID NO:2、SEQ ID NO:4或SEQ IDNO:6的成熟多肽或由SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:6的成熟多肽组成。
6.权利要求1的多肽,其由多核苷酸所编码,所述多核苷酸在至少高严紧条件与下列杂交:(i)SEQ ID NO:1或SEQ ID NO:5的成熟多肽编码序列,(ii)包含于SEQ ID NO:1或SEQ ID NO:5的成熟多肽编码序列中的cDNA序列,或(iii)(i)或(ii)的互补链,或者在优选至少中-高严紧条件和更优选至少高严紧条件下与下列杂交:(i)SEQ ID NO:3的成熟多肽编码序列,(ii)包含SEQ ID NO:3的成熟多肽编码序列的基因组DNA序列,或(iii)(i)或(ii)的互补链。
7.权利要求1的多肽,其由包含如下核苷酸序列的多核苷酸所编码:与SEQ ID NO:1的成熟多肽编码序列具有优选至少80%同一性、更优选至少85%同一性、甚至更优选至少90%同一性、最优选至少95%同一性的核苷酸序列;与SEQ ID NO:3的成熟多肽编码序列具有优选至少70%同一性、更优选至少75%同一性、甚至更优选至少80%同一性、甚至更优选至少85%同一性、最优选至少90%同一性、甚至最优选至少95%同一性的氨基酸序列;或者与SEQ ID NO:5的成熟多肽编码序列具有优选至少85%同一性、更优选至少90%同一性、最优选至少95%同一性的氨基酸序列。
8.权利要求1的多肽,其由多核苷酸所编码,所述多核苷酸包含SEQ IDNO:1、SEQ ID NO:3或SEQ ID NO:5,或其编码具有内切葡聚糖酶活性的多肽片段的亚序列;或由SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5,或其编码具有内切葡聚糖酶活性的多肽片段的亚序列组成。
9.权利要求8的多肽,其由多核苷酸所编码,所述多核苷酸包含SEQ IDNO:1、SEQ ID NO:3或SEQ ID NO:5或由SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5组成。
10.权利要求8的多肽,其由多核苷酸所编码,所述多核苷酸包含SEQ IDNO:1、SEQ ID NO:3或SEQ ID NO:5的成熟多肽编码序列或由SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5的成熟多肽编码序列组成。
11.权利要求1的多肽,其中所述多肽为包含一个或几个氨基酸的取代、缺失和/或插入的SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:6的成熟多肽的变体。
12.权利要求1的多肽,其由包含于质粒pPH50、pPH38或pPH46中的多核苷酸所编码,其中质粒pPH50包含于大肠杆菌NRRL B-30899,pPH38包含于大肠杆菌NRRL B-30896,pPH46包含于大肠杆菌NRRL B-30897。
13.权利要求1、2、5或11的多肽,其中所述成熟多肽是SEQ ID NO:2的氨基酸23至464、SEQ ID NO:4的氨基酸20至423或SEQ ID NO:6的氨基酸19至440。
14.权利要求1、6、7或10的多肽,其中所述成熟多肽编码序列是SEQ IDNO:1的核苷酸79至1461、SEQ ID NO:3的核苷酸74至1349或SEQ ID NO:5的核苷酸107至1372。
15.权利要求1-14任一项的多肽,进一步具有针对选自下组的一种或多种底物的酶活性:木聚糖、木葡聚糖、阿拉伯木聚糖、1,4-β-D-甘露聚糖和半乳甘露聚糖。
16.包含核苷酸序列的分离的多核苷酸,所述核苷酸序列编码权利要求1-15中任一项的多肽。
17.权利要求16的分离的多核苷酸,其在SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5的成熟多肽编码序列中包含至少一个突变,其中所述突变的核苷酸序列分别编码SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:6的成熟多肽。
18.权利要求17的分离的多核苷酸,其中所述成熟多肽编码序列是SEQID NO:1的核苷酸79至1461、SEQ ID NO:3的核苷酸74至1349或SEQ ID NO:5的核苷酸107至1372,所述成熟多肽是SEQ ID NO:2的氨基酸23至464、SEQID NO:4的氨基酸20至423或SEQ ID NO:6的氨基酸19至440。
19.包含权利要求16-18中任一项的多核苷酸的核酸构建体,所述多核苷酸可操作地连接到一个或几个调控序列,所述调控序列指导多肽在表达宿主中产生。
20.重组表达载体,其包含权利要求19的核酸构建体。
21.重组宿主细胞,其包含权利要求19的核酸构建体。
22.产生权利要求1-15中任一项的多肽的方法,其包括:(a)在有益于产生所述多肽的条件下培养细胞,所述细胞以其野生型形式产生所述多肽;和(b)回收所述多肽。
23.产生权利要求1-15中任一项的多肽的方法,其包括:(a)在有益于产生所述多肽的条件下培养包含核酸构建体的宿主细胞,所述核酸构建体含有编码所述多肽的核苷酸序列;和(b)回收所述多肽。
24.产生亲本细胞的突变体的方法,其包括破坏或缺失编码权利要求1-15中任一项的多肽的核苷酸序列,得到与亲本细胞相比产生更少所述多肽的突变体。
25.由权利要求24的方法产生的突变细胞。
26.权利要求25的突变细胞,其还包含编码天然或异源蛋白质的基因。
27.产生蛋白质的方法,其包括:(a)在有益于产生所述蛋白质的条件下培养权利要求26的突变细胞;和(b)回收所述蛋白质。
28.权利要求16-18中任一项的分离的多核苷酸,其通过如下获得:(a)在至少高严紧条件下将DNA群体与下列杂交:(i)SEQ ID NO:1或SEQ IDNO:5的成熟多肽编码序列,(ii)包含于SEQ ID NO:1或SEQ ID NO:5的成熟多肽编码序列中的cDNA序列,或(iii)(i)或(ii)的互补链,或者在优选至少中-高严紧条件和更优选至少高严紧条件下将DNA群体与下列杂交:(i)SEQ IDNO:3的成熟多肽编码序列,(ii)包含SEQ ID NO:3的成熟多肽编码序列的基因组DNA序列,或(iii)(i)或(ii)的互补链杂交;和(b)分离杂交的多核苷酸,其编码具有内切葡聚糖酶活性的多肽。
29.权利要求28的分离的多核苷酸,其中所述成熟多肽编码序列是SEQID NO:1的核苷酸79至1461、SEQ ID NO:3的核苷酸74至1349或SEQ ID NO:5的核苷酸107至1372。
30.产生包含突变的核苷酸序列的多核苷酸的方法,所述突变的核苷酸序列编码具有内切葡聚糖酶活性的多肽,所述方法包括:(a)将至少一个突变引入到SEQ ID NO:1、SEQ ID NO:3或SEQ ID NO:5的成熟多肽编码序列中,其中所述突变的核苷酸序列编码由SEQ ID NO:2、SEQ ID NO:4或SEQID NO:6的成熟多肽组成的多肽;和(b)回收包含所述突变的核苷酸序列的多核苷酸。
31.权利要求30的方法,其中所述成熟多肽编码序列是SEQ ID NO:1的核苷酸79至1461、SEQ ID NO:3的核苷酸74至1349或SEQ ID NO:5的核苷酸107至1372,所述成熟多肽是SEQ ID NO:2的氨基酸23至464、SEQ ID NO:4的氨基酸20至423或SEQ ID NO:6的氨基酸19至440。
32.由权利要求30或31的方法所产生的突变的多核苷酸。
33.产生多肽的方法,其包括:(a)在有益于产生所述多肽的条件下培养包含权利要求32的突变的多核苷酸的细胞,所述突变的多核苷酸编码所述多肽;和(b)回收所述多肽。
34.核酸构建体,其包含可操作地连接到编码信号肽的核苷酸序列的编码蛋白质的基因,所述信号肽包含SEQ ID NO:2的氨基酸1到22、SEQ IDNO:4的氨基酸1到19、SEQ ID NO:6的氨基酸1到18或由SEQ ID NO:2的氨基酸1到22、SEQ ID NO:4的氨基酸1到19、SEQ ID NO:6的氨基酸1到18组成,其中所述基因对于所述核苷酸序列来说是外源的。
35.重组表达载体,其包含权利要求34的核酸构建体。
36.重组宿主细胞,其包含权利要求34的核酸构建体。
37.产生蛋白质的方法,其包括:(a)在有益于产生所述蛋白质的条件下培养权利要求36的重组宿主细胞;和(b)回收所述蛋白质。
38.产生权利要求1-15中任一项的多肽的方法,其包括:(a)在有益于产生所述多肽的条件下培养转基因植物或植物细胞,所述转基因植物或植物细胞包含编码所述具有内切葡聚糖酶活性的多肽的多核苷酸;和(b)回收所述多肽。
39.转基因植物、植物部分或植物细胞,其已经用编码权利要求1-15中任一项的多肽的多核苷酸转化。
40.降解或转化纤维素材料的方法,其包括:用组合物处理所述纤维素材料,所述组合物包含有效量的权利要求1-15中任一项的具有内切葡聚糖酶活性的多肽或权利要求20的宿主细胞。
41.权利要求40的方法,其中所述组合物还包含有效量的内切-1,4-β-葡聚糖酶、外切-1,4-β-D-葡聚糖酶和/或β-D-葡萄糖苷酶。
42.权利要求40或41的方法,其中所述组合物还包含有效量的选自下组的一种或多种酶:半纤维素酶、酯酶、蛋白酶、漆酶和过氧化物酶。
43.权利要求40-42中任一项的方法,其中所述方法是预处理方法;同时糖化和发酵方法(SSF)中的步骤;或杂合水解和发酵方法(HHF)中的步骤。
44.权利要求40-43中任一项的方法,进一步包括回收经降解或经转化的纤维素材料。
45.产生物质的方法,其包括:(a)用组合物糖化纤维素材料,所述组合物包含有效量的权利要求1-15中任一项的具有内切葡聚糖酶活性的多肽或权利要求20的宿主细胞,(b)用一种或多种发酵微生物对步骤(a)的经糖化的纤维素材料进行发酵;和(c)自发酵回收所述物质。
46.权利要求45的方法,其中所述组合物还包含有效量的内切-1,4-β-葡聚糖酶、外切-1,4-β-D-葡聚糖酶和/或β-D-葡萄糖苷酶。
47.权利要求45或46的方法,其中所述组合物还包含有效量的选自下组的一种或多种酶:半纤维素酶、酯酶、蛋白酶、漆酶和过氧化物酶。
48.权利要求45-47中任一项的方法,其中在同时糖化和发酵中同时实施步骤(a)和(b)。
49.权利要求45-48中任一项的方法,其中所述物质是醇、有机酸、酮、氨基酸或气体。
50.抑制多肽在细胞中表达的方法,其包括将双链RNA(dsRNA)分子施用于所述细胞或者在所述细胞中表达双链RNA(dsRNA)分子,其中所述dsRNA包含编码SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:6的成熟多肽的多核苷酸的亚序列或部分。
51.权利要求50的方法,其中所述dsRNA长度为大约15、16、17、18、19、20、21、22、23、24、25或更多个双链体核苷酸。
52.用于抑制多肽在细胞中表达的双链RNA(dsRNA)分子,其中所述dsRNA包含编码SEQ ID NO:2、SEQ ID NO:4或SEQ ID NO:6的成熟多肽的多核苷酸的亚序列或部分。
53.权利要求52的双链RNA(dsRNA)分子,其长度为大约15、16、17、18、19、20、21、22、23、24、25或更多个双链体核苷酸。
CNA2007800193163A 2006-03-30 2007-03-30 具有内切葡聚糖酶活性的多肽和编码该多肽的多核苷酸 Pending CN101460616A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US78838906P 2006-03-30 2006-03-30
US60/788,389 2006-03-30

Publications (1)

Publication Number Publication Date
CN101460616A true CN101460616A (zh) 2009-06-17

Family

ID=38441527

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2007800193163A Pending CN101460616A (zh) 2006-03-30 2007-03-30 具有内切葡聚糖酶活性的多肽和编码该多肽的多核苷酸

Country Status (5)

Country Link
US (4) US8063267B2 (zh)
EP (2) EP2004817A2 (zh)
CN (1) CN101460616A (zh)
BR (1) BRPI0710217A2 (zh)
WO (1) WO2007115201A2 (zh)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103562384A (zh) * 2011-01-26 2014-02-05 诺维信公司 具有内切葡聚糖酶活性的多肽及其编码多核苷酸
CN104136608A (zh) * 2011-12-15 2014-11-05 诺维信股份有限公司 具有内切葡聚糖酶活性的多肽和编码该多肽的多核苷酸
CN106414733A (zh) * 2014-06-03 2017-02-15 帝斯曼知识产权资产管理有限公司 脯氨酸特异性内切蛋白酶及其用途
CN107607642A (zh) * 2017-09-06 2018-01-19 上海烟草集团有限责任公司 一种鉴定烟草中蛋白与蛋白组的多维液相色谱质谱联用法
CN108165542A (zh) * 2009-09-30 2018-06-15 诺维信股份有限公司 具有纤维素分解增强活性的多肽和编码该多肽的多核苷酸

Families Citing this family (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BRPI0812042A2 (pt) * 2007-06-01 2014-10-14 Sapphire Energy Uso de organismos geneticamente modificados para gerar enzimas de degradação de biomassa
NZ583701A (en) * 2007-09-11 2012-03-30 Sapphire Energy Inc Molecule production by photosynthetic organisms
CA2707796A1 (en) 2007-12-05 2009-08-27 Novozymes A/S Polypeptides having endoglucanase activity and polynucleotides encoding same
WO2010005553A1 (en) * 2008-07-07 2010-01-14 Mascoma Corporation Isolation and characterization of schizochytrium aggregatum cellobiohydrolase i (cbh 1)
WO2010120557A1 (en) * 2009-03-31 2010-10-21 Codexis, Inc. Improved endoglucanases
BR112013006315A2 (pt) * 2010-09-15 2017-07-04 Univ California mutantes termofílicos da endoglicanase i de trichoderma reesei
MX337942B (es) 2011-01-26 2016-03-29 Novozymes As Polipeptidos que tienen actividad de endoglucanasa y polinucleotidos que codifican los mismos.
US9708591B2 (en) 2011-11-18 2017-07-18 Novozymes Inc. Polypeptides having endoglucanase activity and polynucleotides encoding same
EP2780362A4 (en) * 2011-11-18 2015-10-14 Novozymes Inc POLYPEPTIDES HAVING ENDOGLUCANASE ACTIVITY AND POLYNUCLEOTIDES ENCODING SAID POLYPEPTIDES
WO2013090918A2 (en) * 2011-12-16 2013-06-20 Alliance For Sustainable Energy, Llc Enhanced processive cellulases
WO2013096244A1 (en) * 2011-12-20 2013-06-27 Codexis, Inc. Endoglucanase 1b (eg1b) variants
ES2650274T3 (es) * 2011-12-21 2018-01-17 Asahi Group Holdings, Ltd. Fertilizante reductor
FI124476B (en) * 2012-05-24 2014-09-15 Roal Oy Improved endoglucanases for handling cellulosic material
US8975058B2 (en) 2012-05-24 2015-03-10 Roal Oy Endoglucanases for treatment of cellulosic material
US8771993B1 (en) * 2013-02-12 2014-07-08 Novozymes A/S Polypeptides having endoglucanse activity and polynucleotides encoding same
US8778639B1 (en) * 2013-02-12 2014-07-15 Novozymes Inc. Polypeptides having endoglucanase activity and polynucleotides encoding same
WO2014140167A1 (en) 2013-03-14 2014-09-18 Dsm Ip Assets B.V. Cell wall deconstruction enzymes of malbranchea cinnamomea and uses thereof
JP6552098B2 (ja) * 2015-08-20 2019-07-31 本田技研工業株式会社 超耐熱性エンドグルカナーゼ
JP6244597B2 (ja) * 2015-08-21 2017-12-13 本田技研工業株式会社 超耐熱性エンドグルカナーゼ
EP3416740B1 (en) 2016-02-19 2021-01-06 Intercontinental Great Brands LLC Processes to create multiple value streams from biomass sources
CN113481103B (zh) * 2020-10-16 2023-05-23 吉林省农业科学院 一种灰黄青霉

Family Cites Families (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB1590432A (en) 1976-07-07 1981-06-03 Novo Industri As Process for the production of an enzyme granulate and the enzyme granuate thus produced
DK263584D0 (da) 1984-05-29 1984-05-29 Novo Industri As Enzymholdige granulater anvendt som detergentadditiver
EG18543A (en) 1986-02-20 1993-07-30 Albright & Wilson Protected enzyme systems
DK122686D0 (da) 1986-03-17 1986-03-17 Novo Industri As Fremstilling af proteiner
US5223409A (en) 1988-09-02 1993-06-29 Protein Engineering Corp. Directed evolution of novel binding proteins
PT97110B (pt) 1990-03-23 1998-11-30 Gist Brocades Nv Processo para catalisar reaccoes acelaraveis por enzimas, mediante adicao ao meio reaccional de sementes de plantas transgenicas e para obtencao das referidas sementes
DK115890D0 (da) * 1990-05-09 1990-05-09 Novo Nordisk As Enzym
IL99552A0 (en) 1990-09-28 1992-08-18 Ixsys Inc Compositions containing procaryotic cells,a kit for the preparation of vectors useful for the coexpression of two or more dna sequences and methods for the use thereof
DE69333067T2 (de) 1992-12-23 2004-05-13 Novozymes A/S Enzym mit endoglukanase wirkung
DK81293D0 (da) 1993-07-06 1993-07-06 Novo Nordisk As Enzym
US5861271A (en) * 1993-12-17 1999-01-19 Fowler; Timothy Cellulase enzymes and systems for their expressions
US7005128B1 (en) * 1993-12-17 2006-02-28 Genencor International, Inc. Enzyme feed additive and animal feed including it
DE4343591A1 (de) 1993-12-21 1995-06-22 Evotec Biosystems Gmbh Verfahren zum evolutiven Design und Synthese funktionaler Polymere auf der Basis von Formenelementen und Formencodes
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
DK0765394T3 (da) 1994-06-03 2001-12-10 Novozymes As Oprensede Myceliopthora-laccaser og nukleinsyrer der koder for disse
AU2705895A (en) 1994-06-30 1996-01-25 Novo Nordisk Biotech, Inc. Non-toxic, non-toxigenic, non-pathogenic fusarium expression system and promoters and terminators for use therein
AU716471B2 (en) * 1995-10-13 2000-02-24 Gist-Brocades B.V. Fungal cellulases
WO1997014804A1 (en) * 1995-10-17 1997-04-24 Röhn Enzyme Finland OY Cellulases, the genes encoding them and uses thereof
US5811381A (en) * 1996-10-10 1998-09-22 Mark A. Emalfarb Cellulase compositions and methods of use
US6506559B1 (en) 1997-12-23 2003-01-14 Carnegie Institute Of Washington Genetic inhibition by double-stranded RNA
CN1307642A (zh) 1998-05-27 2001-08-08 诺沃诺尔迪斯克生物技术有限公司 通过改变基因拷贝数制备多肽的方法
US6501008B1 (en) * 1998-06-10 2002-12-31 The Regents Of The University Of California Maize endo-1,3;1,4-β-glucanase nucleic acid
AU6188599A (en) 1998-10-26 2000-05-15 Novozymes A/S Constructing and screening a dna library of interest in filamentous fungal cells
US6511824B1 (en) 1999-03-17 2003-01-28 Exelixis, Inc. Nucleic acids and polypeptides of invertebrate TWIK channels and methods of use
CN100532561C (zh) 1999-03-22 2009-08-26 诺沃奇梅兹有限公司 新的葡糖淀粉酶及编码它的核酸序列
US6531644B1 (en) 2000-01-14 2003-03-11 Exelixis, Inc. Methods for identifying anti-cancer drug targets
ES2166316B1 (es) 2000-02-24 2003-02-16 Ct Investig Energeticas Ciemat Procedimiento de produccion de etanol a partir de biomasa lignocelulosica utilizando una nueva levadura termotolerante.
AU2001262116A1 (en) * 2000-03-20 2001-10-03 Dsm N.V. Talaromyces emersonii beta-glucanases
AU2002211665B2 (en) 2000-10-12 2005-10-20 Exelixis, Inc. Human Ect2 and methods of use
EP2295544B1 (en) * 2001-06-26 2016-06-22 Novozymes A/S Polypeptides having cellobiohydrolase I activity and polynucleotides encoding same
US6481837B1 (en) 2001-08-01 2002-11-19 Benjamin Alan Askren Ink delivery system
DK1713825T3 (da) * 2004-01-30 2012-11-05 Novozymes Inc Polypeptider med cellulolytisk forøgende aktivitet og polynukleotider der koder for samme
BRPI0507431B1 (pt) 2004-02-06 2021-07-27 Novozymes, Inc Célula hospedeira microbiana recombinante, construto de ácido nucleico, vetor de expressão recombinante, composição detergente, e, métodos para produzir o polipeptídeo gh61, para degradar um material celulósico e para produzir um produto de fermentação
SI3219806T1 (sl) * 2004-03-25 2020-08-31 Novoyzmes, Inc. Postopki za degradiranje ali pretvorbo polisaharidov rastlinske celične stene
CN101253263B (zh) * 2005-04-27 2014-07-02 诺维信股份有限公司 具有内切葡聚糖酶活性的多肽和编码该多肽的多核苷酸
CN103436509A (zh) * 2007-05-31 2013-12-11 诺维信股份有限公司 提高多肽的纤维素分解增强活性的方法

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108165542A (zh) * 2009-09-30 2018-06-15 诺维信股份有限公司 具有纤维素分解增强活性的多肽和编码该多肽的多核苷酸
CN103562384A (zh) * 2011-01-26 2014-02-05 诺维信公司 具有内切葡聚糖酶活性的多肽及其编码多核苷酸
CN103562384B (zh) * 2011-01-26 2017-01-18 诺维信公司 具有内切葡聚糖酶活性的多肽及其编码多核苷酸
CN104136608A (zh) * 2011-12-15 2014-11-05 诺维信股份有限公司 具有内切葡聚糖酶活性的多肽和编码该多肽的多核苷酸
CN106414733A (zh) * 2014-06-03 2017-02-15 帝斯曼知识产权资产管理有限公司 脯氨酸特异性内切蛋白酶及其用途
CN106414733B (zh) * 2014-06-03 2021-04-23 帝斯曼知识产权资产管理有限公司 脯氨酸特异性内切蛋白酶及其用途
CN107607642A (zh) * 2017-09-06 2018-01-19 上海烟草集团有限责任公司 一种鉴定烟草中蛋白与蛋白组的多维液相色谱质谱联用法
CN107607642B (zh) * 2017-09-06 2020-12-29 上海烟草集团有限责任公司 一种鉴定烟草中蛋白与蛋白组的多维液相色谱质谱联用法

Also Published As

Publication number Publication date
WO2007115201A8 (en) 2009-08-06
WO2007115201A3 (en) 2008-03-06
US8258370B2 (en) 2012-09-04
US8791328B2 (en) 2014-07-29
US20090328259A1 (en) 2009-12-31
EP2374877A3 (en) 2012-11-07
US20120023626A1 (en) 2012-01-26
US20140322753A1 (en) 2014-10-30
US8063267B2 (en) 2011-11-22
US20120309059A1 (en) 2012-12-06
EP2374877A2 (en) 2011-10-12
WO2007115201A2 (en) 2007-10-11
EP2004817A2 (en) 2008-12-24
BRPI0710217A2 (pt) 2011-08-02

Similar Documents

Publication Publication Date Title
US8791328B2 (en) Polypeptides having endoglucanase activity and polynucleotides encoding same
CN101874109B (zh) 具有纤维二糖水解酶活性的多肽和编码该多肽的多核苷酸
US9428742B2 (en) Polypeptides having endoglucanase activity and polynucleotides encoding same
US8044264B2 (en) Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
CN101952420A (zh) 具有纤维素分解增强活性的多肽和编码该多肽的多核苷酸
CN101952304A (zh) 具有纤维素分解增强活性的多肽和编码该多肽的多核苷酸
CN101945889A (zh) 具有纤维素分解增强活性的多肽和编码该多肽的多核苷酸
CN101970471A (zh) 具有纤维素分解增强活性的多肽和编码该多肽的多核苷酸
CN101287751A (zh) 具有β-葡糖苷酶活性的多肽和编码该多肽的多核苷酸
CN101952421A (zh) 具有内切葡聚糖酶活性的多肽和编码所述多肽的多核苷酸
CN101137750A (zh) 具有纤维二糖水解酶活性的多肽和编码它的多核苷酸
CN101253263A (zh) 具有内切葡聚糖酶活性的多肽和编码该多肽的多核苷酸
CN102016016A (zh) 具有β-葡糖苷酶活性的多肽和编码该多肽的多核苷酸
US8268589B2 (en) Polypeptides having endoglucanase activity and polynucleotides encoding same
CN102016017A (zh) 具有内切葡聚糖酶活性的多肽和编码该多肽的多核苷酸

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20090617