CN101454444A - 具有内切葡聚糖酶活性的多肽和编码该多肽的多核苷酸 - Google Patents

具有内切葡聚糖酶活性的多肽和编码该多肽的多核苷酸 Download PDF

Info

Publication number
CN101454444A
CN101454444A CNA2007800182046A CN200780018204A CN101454444A CN 101454444 A CN101454444 A CN 101454444A CN A2007800182046 A CNA2007800182046 A CN A2007800182046A CN 200780018204 A CN200780018204 A CN 200780018204A CN 101454444 A CN101454444 A CN 101454444A
Authority
CN
China
Prior art keywords
seq
polypeptide
sequence
mature polypeptide
identity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2007800182046A
Other languages
English (en)
Inventor
保罗·哈里斯
克里斯琴·B·R·M·克罗
埃琳娜·弗拉森科
索伦·F·拉森
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Novo Nordisk AS
Novozymes Inc
Original Assignee
Novo Nordisk AS
Novozymes Biotech Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Family has litigation
First worldwide family litigation filed litigation Critical https://patents.darts-ip.com/?family=38523152&utm_source=google_patent&utm_medium=platform_link&utm_campaign=public_patent_search&patent=CN101454444(A) "Global patent litigation dataset” by Darts-ip is licensed under a Creative Commons Attribution 4.0 International License.
Application filed by Novo Nordisk AS, Novozymes Biotech Inc filed Critical Novo Nordisk AS
Publication of CN101454444A publication Critical patent/CN101454444A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2434Glucanases acting on beta-1,4-glucosidic bonds
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2434Glucanases acting on beta-1,4-glucosidic bonds
    • C12N9/2437Cellulases (3.2.1.4; 3.2.1.74; 3.2.1.91; 3.2.1.150)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12PFERMENTATION OR ENZYME-USING PROCESSES TO SYNTHESISE A DESIRED CHEMICAL COMPOUND OR COMPOSITION OR TO SEPARATE OPTICAL ISOMERS FROM A RACEMIC MIXTURE
    • C12P19/00Preparation of compounds containing saccharide radicals
    • C12P19/14Preparation of compounds containing saccharide radicals produced by the action of a carbohydrase (EC 3.2.x), e.g. by alpha-amylase, e.g. by cellulase, hemicellulase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01004Cellulase (3.2.1.4), i.e. endo-1,4-beta-glucanase

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Genetics & Genomics (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • General Chemical & Material Sciences (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Detergent Compositions (AREA)

Abstract

本发明涉及具有内切葡聚糖酶活性的分离的多肽和编码所述多肽的分离的多核苷酸。本发明还涉及包含所述多核苷酸的核酸构建体、载体和宿主细胞,以及用于制备和使用所述多肽的方法。

Description

具有内切葡聚糖酶活性的多肽和编码该多肽的多核苷酸
涉及序列表
本申请包含计算机可读形式的序列表。该计算机可读形式通过引用并入本文。
涉及生物材料的保藏
本申请包含对生物材料的保藏的涉及,所述保藏已经依据布达佩斯条约在北区研究中心(Northern Regional Research Center)(NRRL)进行,并指定了登录号NRRL B-30900N、NRRL B-30902、NRRL B-30903和NRRL B-30904,所述微生物保藏通过引用并入本文。
发明背景
发明领域
本发明涉及具有内切葡聚糖酶活性的分离的多肽和编码所述多肽的分离的多核苷酸。本发明还涉及包含所述多核苷酸的核酸构建体、载体和宿主细胞,以及用于产生和使用所述多肽的方法。
相关领域描述
纤维素是单糖葡萄糖通过β-1,4-键共价连接的聚合物。许多微生物产生水解β-连接的葡聚糖的酶。这些酶包括内切葡聚糖酶、纤维二糖水解酶和β-葡糖苷酶。内切葡聚糖酶在随机位置消化纤维素聚合物,将其打开(opening it)以受到纤维二糖水解酶攻击(attack)。纤维二糖水解酶继而从纤维素聚合物的末端释放纤维二糖的分子。纤维二糖水解酶I是1,4-D-葡聚糖纤维二糖水解酶(E.C.3.2.1.91)活性,其催化纤维素、纤维四糖(cellotetriose)或任何含有β-1,4-连接的葡萄糖的聚合物中1,4-β-D-糖苷键的水解,从链的还原性末端释放纤维二糖。纤维二糖水解酶II是1,4-D-葡聚糖纤维二糖水解酶(E.C.3.2.1.91)活性,其催化纤维素、纤维四糖或任何含有β-1,4-连接的葡萄糖的聚合物中1,4-β-D-糖苷键的水解,从链的非还原性末端释放纤维二糖。纤维二糖是水溶性的β-1,4-连接的葡萄糖二聚体。β-葡糖苷酶将纤维二糖水解成葡萄糖。
将含纤维素原料(cellulosic feedstock)转化为乙醇具有以下优势:大量原料现成可用,避免燃烧或填埋材料的合意性和乙醇燃料的清洁性。木材、农业残余物、草本作物和城市固体废物被认为是用于乙醇生产的原料。这些材料主要由纤维素、半纤维素和木质素组成。一旦将纤维素转化成葡萄糖,葡萄糖将容易地由酵母发酵成乙醇。
Roy等,1990,Journal of General Microbiology 136:1967-1972公开了来自嗜热毁丝霉(Myceliophthora thermophila)ATCC 48104的胞外内切葡聚糖酶的纯化和性质。Chernoglazov等,1988,Biokhimiya 53:475-482公开了来自嗜热毁丝霉的内切葡聚糖酶的分离、纯化和底物特异性。Klyosov等,1988,Biotechnology Letters 10:351-354公开了来自嗜热毁丝霉的热稳定性内切葡聚糖酶。Guzhova和Loginova,1987,Prikladnaya Biokhimiya I Mikrobiologiya 23:820-825公开了来自嗜热毁丝霉的纤维素分解酶。Rabinovich等,1986,Bioorganicheskaya Khimiya 12:1549-1560公开了来自嗜热毁丝霉的内切葡聚糖酶的纯化和表征。Svistova等,1986,Mikrobiologiya 55:49-54公开了嗜热毁丝霉中纤维素生物合成的调控。Bhat和Maheshwari,1987,Applied andEnvironmental Microbiology 53:2175-2182公开了嗜热毁丝霉的胞外纤维素系统中组分的活性。Klyosov等,1987,Prikladnaya Biokhimiya I Mikrobiologiya 23:44-50公开了来自嗜热毁丝霉的热稳定内切葡聚糖酶。Jorgensen等,2003,Enzyme and Microbial Technology 32:851-861和Thygesen等,2003,Enzyme andMicrobial Technology 32:606-615公开了来自巴西青霉(Penicillium brasilianum)IBT 20888的纤维素降解酶。
本领域中有利的是鉴定新的具有改进性质的内切葡聚糖酶,例如改进的水解速率、更好的热稳定性、对木质素的吸附减少,和除水解纤维素之外水解生物质的非纤维素成分例如半纤维素的能力。对半纤维素具有广泛副活性(side activity)的内切葡聚糖酶能够特别有益于改进复杂的、富含半纤维素的生物质底物的总水解产率。
本发明的目的是提供改进的具有内切葡聚糖酶活性的多肽和编码该多肽的多核苷酸。
发明概述
本发明涉及具有内切葡聚糖酶活性的分离的多肽,所述多肽选自下组中的一种或多种:
(a)包含氨基酸序列的多肽,所述氨基酸序列与SEQ ID NO:4或SEQ IDNO:10的成熟多肽具有至少80%同一性,与SEQ ID NO:6的成熟多肽具有至少85%同一性,或与SEQ ID NO:8的成熟多肽具有至少75%同一性;
(b)由多核苷酸编码的多肽,所述多核苷酸在至少高严紧条件下与以下杂交:(i)SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9的成熟多肽编码序列,(ii)包含于SEQ ID NO:3或SEQ ID NO:9的成熟多肽编码序列中的cDNA序列,或包含SEQ ID NO:5或SEQ ID NO:7的成熟多肽编码序列的基因组DNA序列,或(iii)(i)或(ii)的全长互补链;
(c)由多核苷酸编码的多肽,所述多核苷酸与SEQ ID NO:3或SEQ IDNO:9的成熟多肽编码序列具有至少80%同一性,与SEQ ID NO:5的成熟多肽编码序列具有至少85%同一性,或与SEQ ID NO:7的成熟多肽编码序列具有至少75%同一性;和
(d)变体,其包含取代、缺失和/或插入一个或几个氨基酸的SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8或SEQ ID NO:10的成熟多肽。
本发明还涉及编码具有内切葡聚糖酶活性的多肽的分离的多核苷酸,所述多核苷酸选自下组中的一种或多种:
(a)编码包含氨基酸序列的多肽的多核苷酸,所述氨基酸序列与SEQ IDNO:4或SEQ ID NO:10的成熟多肽具有至少80%同一性,与SEQ ID NO:6的成熟多肽具有至少85%同一性,或与SEQ ID NO:8的成熟多肽具有至少75%同一性;
(b)多核苷酸,其在至少高严紧条件下与以下杂交:(i)SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9的成熟多肽编码序列,(ii)包含于SEQ ID NO:3或SEQ ID NO:9的成熟多肽编码序列中的cDNA序列,或包含SEQ ID NO:5或SEQ ID NO:7的成熟多肽编码序列的基因组DNA序列,或(iii)(i)或(ii)的互补链;
(c)多核苷酸,其与SEQ ID NO:3或SEQ ID NO:9的成熟多肽编码序列具有至少80%同一性,与SEQ ID NO:5的成熟多肽编码序列具有至少85%同一性,或与SEQ ID NO:7的成熟多肽编码序列具有至少75%同一性;和
(d)编码变体的多核苷酸,所述变体包含取代、缺失和/或插入一个或几个氨基酸的SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8或SEQ ID NO:10的成熟多肽。
在优选的方面,所述成熟多肽是SEQ ID NO:4的氨基酸17至389。在另一个优选的方面,所述成熟多肽是SEQ ID NO:6的氨基酸16至397。在另一个优选的方面,所述成熟多肽是SEQ ID NO:8的氨基酸22至429。在另一个优选的方面,所述成熟多肽是SEQ ID NO:10的氨基酸25至421。在另一个优选的方面,所述成熟多肽编码序列是SEQ ID NO:3的核苷酸67至1185。在另一个优选的方面,所述成熟多肽编码序列是SEQ ID NO:5的核苷酸84至1229。在另一个优选的方面,所述成熟多肽编码序列是SEQ ID NO:7的核苷酸77至1300。在另一个优选的方面,所述成熟多肽编码序列是SEQ ID NO:9的核苷酸73至1468。
本发明还涉及包含所述多核苷酸的核酸构建体、重组表达载体和重组宿主细胞,和产生具有内切葡聚糖酶活性的多肽的方法。
本发明还涉及抑制所述多肽在细胞中表达的方法,其包括:对细胞施用双链RNA(dsRNA)分子或在细胞中表达双链RNA(dsRNA)分子,其中dsRNA包括本发明的多核苷酸的亚序列。本发明还涉及这种双链抑制性RNA(dsRNA)分子,其中任选地dsRNA是siRNA或miRNA分子。
本发明还涉及在纤维素到葡萄糖和各种物质的转化中使用具有内切葡聚糖酶活性的多肽的方法。
本发明还涉及包含分离的多核苷酸的植物,所述多核苷酸编码这样的具有内切葡聚糖酶活性的多肽。
本发明还涉及用于产生这样的具有内切葡聚糖酶活性的多肽的方法,其包括:(a)在有益于产生该多肽的条件下培养包含多核苷酸的转基因植物或植物细胞,所述多核苷酸编码这样的具有内切葡聚糖酶的多肽;和(b)回收所述多肽。
本发明进一步涉及包含编码蛋白质的基因的核酸构建体,其中将所述基因可操作地连接于编码信号肽的第一核苷酸序列和编码前肽(propeptide)的第二核苷酸序列,所述信号肽包含SEQ ID NO:4的氨基酸1至16,SEQ ID NO:6的氨基酸1至15,SEQ ID NO:8的氨基酸1至21,或SEQ ID NO:10的氨基酸1至16或由SEQ ID NO:4的氨基酸1至16,SEQ ID NO:6的氨基酸1至15,SEQ ID NO:8的氨基酸1至21,或SEQ ID NO:10的氨基酸1至16组成,且所述前肽包含SEQ ID NO:10的氨基酸17至24或由SEQ ID NO:10的氨基酸17至24组成,其中所述基因对于第一和第二核苷酸序列是外源的。
附图简述
图1显示pCIC161的限制图谱(restriction map)。
图2显示嗜热毁丝霉CBS 117.65内切葡聚糖酶的基因组DNA序列和推导的氨基酸序列(分别为SEQ ID NO:3和4)。
图3显示pA2C161的限制图谱。
图4显示pCIC453的限制图谱。
图5显示pA2C453的限制图谱。
图6显示担子菌(basidiomycete)CBS 495.95内切葡聚糖酶的cDNA序列和推导的氨基酸序列(分别为SEQ ID NO:5和6)。
图7显示pCIC486的限制图谱。
图8显示pA2C486的限制图谱。
图9显示担子菌CBS 494.95内切葡聚糖酶的cDNA序列和推导的氨基酸序列(分别为SEQ ID NO:7和8)。
图10A和10B显示巴西青霉菌株IBT 20888内切葡聚糖酶的基因组DNA序列和推导的氨基酸序列(分别为SEQ ID NO:9和10)。
图11显示pKBK03的限制图谱。
图12显示pPBCel5C的限制图谱。
图13显示在不同的pH值和50℃,巴西青霉IBT 20888 CEL5C内切葡聚糖酶的比活性(n=2)。
图14显示在不同的温度和pH 4.8,巴西青霉IBT 20888 CEL5C内切葡聚糖酶的比活性(n=2)。
图15显示在不同的pH值和25℃和50℃温育20小时之后(n=2),巴西青霉IBT 20888 CEL5C内切葡聚糖酶的残余活性(n=2)。
图16显示在pH5.0,担子菌CBS 494.95和担子菌CBS 495.95对于PASC(2mg/ml)的相对活性作为温度的函数。
图17显示在pH5.0,担子菌CBS 494.95和担子菌CBS 495.95(0.5mg蛋白质每g PASC)水解45小时之后,PASC(2mg/ml)的相对转化率作为温度的函数。
图18显示来自嗜热毁丝霉CBS 117.65、担子菌CBS 494.95、担子菌CBS495.95和里氏木霉的内切葡聚糖酶在pH 5.5和60℃水解反应2小时之后,从β-葡聚糖(1% w/v)产生还原糖的比较。
图19显示来自嗜热毁丝霉CBS 117.65、担子菌CBS 494.95、担子菌CBS495.95和里氏木霉的内切葡聚糖酶在pH 5.5和60℃水解反应2小时之后,从β-葡聚糖(1% w/v)产生还原糖的比较。
定义
内切葡聚糖酶活性:术语“内切葡聚糖酶活性”在本文中定义为内切-1,4-β-D-葡聚糖4-葡聚糖水解酶(endo-1,4-β-D-glucan 4-glucanohydrolase)(E.C.No.3.2.1.4),其催化纤维素、纤维素衍生物(例如羧甲基纤维素和羟乙基纤维素)、地衣淀粉(lichenin)中的1,4-β-D-糖苷键、混合的β-1,3葡聚糖例如谷类β-D-葡聚糖或木葡聚糖中的β-1,4键和含有纤维素成分的其它植物材料的内水解(endohydrolysis)。就本发明而言,根据Ghose,1987,Pure and Appl.Chem.59:257-268的方法,使用羧甲基纤维素(CMC)水解来测定内切葡聚糖酶活性。将一单位的内切葡聚糖酶活性定义为:在50℃、pH 4.8,每分钟产生1.0微摩尔还原糖。
在优选的方面,具有内切葡聚糖酶活性的本发明的多肽还对选自下组的一种或多种底物具有酶活性:木聚糖、木葡聚糖(xyloglucan)、阿拉伯木聚糖(arabinoxylan)、1,4-β-D-甘露聚糖和半乳甘露聚糖(galactomannan)。将具有内切葡聚糖酶活性的多肽对于这些多糖底物的活性测定为:将所述底物(5mg每升)与本发明的具有内切葡聚糖酶活性的多肽(5mg蛋白质每g底物)一起在pH 5.0(50mM乙酸钠)和50℃及间歇搅拌温育24小时之后,底物水解为还原糖的百分比。水解混合物中的还原糖通过对羟基苯甲酸酰肼(PHBAH)方法确定。
在更优选的方面,本发明具有内切葡聚糖酶活性的多肽进一步对木聚糖具有酶活性。在另一个更优选的方面,本发明具有内切葡聚糖酶活性的多肽进一步对木葡聚糖具有酶活性。在另一个更优选的方面,本发明具有内切葡聚糖酶活性的多肽进一步对阿拉伯木聚糖具有酶活性。在另一个更优选的方面,本发明具有内切葡聚糖酶活性的多肽进一步对1,4-β-D-甘露聚糖具有酶活性。在另一个更优选的方面,本发明具有内切葡聚糖酶活性的多肽进一步对半乳甘露聚糖具有酶活性。在另一个更优选的方面,本发明具有内切葡聚糖酶活性的多肽进一步对木聚糖、木葡聚糖、阿拉伯木聚糖、1,4-β-D-甘露聚糖和/或半乳甘露聚糖具有酶活性。
本发明的多肽具有SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8或SEQ IDNO:10的成熟多肽的内切葡聚糖酶活性的至少20%,优选至少40%,更优选至少50%,更优选至少60%,更优选至少70%,更优选至少80%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少100%。
家族5糖苷水解酶或家族GH5:术语“家族5糖苷水解酶”或“家族GH5”在本文中定义为根据Henrissat B.,1991,A classification of glycosylhydrolases based on amino-acid sequence similarities,Biochem.J.280:309-316,及Henrissat B.,和Bairoch A.,1996,Updating the sequence-based classification ofglycosyl hydrolases,Biochem.J.316:695-696属于糖苷水解酶家族5的多肽。
分离的多肽:术语“分离的多肽”用于本文中指,如通过SDS-PAGE测定的,其为至少20%纯,优选至少40%纯,更优选至少60%纯,甚至更优选至少80%纯,最优选至少90%纯,并且甚至最优选至少95%纯的多肽。
基本上纯的多肽:术语“基本上纯的多肽”在本文表示多肽制备物,所述多肽制备物含有按重量计至多10%,优选至多8%,更优选至多6%,更优选至多5%,更优选至多4%,更优选至多3%,甚至更优选至多2%,最优选至多1%,并且甚至最优选至多0.5%的与其天然或重组结合的(associated)的其它多肽材料。因此,优选所述基本上纯的多肽是按存在于制备物中的全部多肽材料的重量计至少92%纯,优选至少94%纯,更优选至少95%纯,更优选至少96%纯,更优选至少96%纯,更优选至少97%纯,更优选至少98%纯,甚至更优选至少99%纯,最优选至少99.5%纯,并且甚至最优选100%纯。
本发明的多肽优选是基本上纯的形式。具体而言,优选所述多肽是“基本上(essentially)纯的形式”,即,所述多肽制备物基本上(essentially)不含与其天然或重组结合的其它多肽材料。例如,这能够通过以下实现:通过公知的重组方法或由经典纯化方法制备多肽。
在本文中,术语“基本上纯的多肽”与术语“分离的多肽”和“分离形式的多肽”同义。
成熟多肽:术语“成熟多肽”在本文中定义为具有内切葡聚糖酶活性的多肽,所述多肽以其在翻译和任何翻译后修饰之后的最终形式存在,所述修饰例如N-末端加工、C-末端截断、糖基化等。
成熟多肽编码序列:术语“成熟多肽编码序列”在本文中定义为编码具有内切葡聚糖酶活性的成熟多肽的核苷酸序列。
同一性:参数“同一性”描述两个氨基酸序列之间或两个核苷酸序列之间的相关性。
就本发明而言,两个氨基酸序列之间的同一性程度通过Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48:443-453)使用EMBOSS的Needle程序来测定,使用缺口罚分(gap penalty)10,缺口延伸罚分(gap extension penalty)0.5和EBLOSUM62矩阵。使用Needle标记为“最高同一性(longest identity)”的输出结果作为同一性百分比,并计算如下:
(同样的残基×100)/(比对长度-比对中缺口的数目)
就本发明而言,两个核苷酸序列之间的同一性程度通过Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48:443-453)使用EMBOSS的Needle程序来测定,使用参数缺口罚分10,缺口延伸罚分0.5和EDNAFULL矩阵。使用Needle标记为“最高同一性”的输出结果作为同一性百分比,并计算如下:
(同样的残基×100)/(比对长度-比对中缺口的数目)
同源序列:术语“同源序列”在本文中定义为在用SEQ ID NO:4、SEQ IDNO:6、SEQ ID NO:8或SEQ ID NO:10的成熟内切葡聚糖酶进行的fasta搜索(Pearson,W.R.,1999,于Bioinformatics Methods and Protocols中,S.Misener和S.A.Krawetz,ed.,pp.185-219)中E值(或期望值)小于0.001的预测蛋白质。
多肽片段:术语“多肽片段”在本文中定义为从SEQ ID NO:4、SEQ IDNO:6、SEQ ID NO:8或SEQ ID NO:10的成熟多肽的氨基和/或羧基末端缺失一个或几个氨基酸的多肽,或其同源序列;其中所述片段具有内切葡聚糖酶活性。在优选方面,片段含有SEQ ID NO:4的成熟多肽或其同源序列的至少295个氨基酸残基,更优选至少315个氨基酸残基,并且最优选至少335个氨基酸残基。在另一个优选的方面,片段含有SEQ ID NO:6的成熟多肽或其同源序列的至少320个氨基酸残基,更优选至少340个氨基酸残基,并且最优选至少360个氨基酸残基。在另一个优选的方面,片段含有SEQ ID NO:8的成熟多肽或其同源序列的至少325个氨基酸残基,更优选至少345个氨基酸残基,并且最优选至少365个氨基酸残基。在另一个优选方面,片段含有SEQ ID NO:10的成熟多肽或其同源序列的至少335个氨基酸残基,更优选至少355个氨基酸残基,并且最优选至少375个氨基酸残基。
亚序列:术语“亚序列(subsequence)”在本文中定义为从SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9的5’和/或3’端缺失一个或几个核苷酸的核苷酸序列,或其同源序列;其中所述亚序列编码具有内切葡聚糖酶活性的多肽片段。在优选方面,亚序列含有SEQ ID NO:3的成熟多肽编码序列或其同源序列的至少885个核苷酸,更优选至少945个核苷酸,并且最优选至少1005个核苷酸。在另一个优选方面,亚序列含有SEQ ID NO:5的成熟多肽编码序列或其同源序列的至少960个核苷酸,更优选至少1020个核苷酸,并且最优选至少1080个核苷酸。在另一个优选方面,亚序列含有SEQ ID NO:7的成熟多肽编码序列或其同源序列的至少975个核苷酸,更优选至少1035个核苷酸,并且最优选至少1095个核苷酸。在另一个优选方面,亚序列含有SEQ ID NO:9的成熟多肽编码序列或其同源序列的至少1005个核苷酸,更优选至少1065个核苷酸,并且最优选至少1125个核苷酸。
等位变体(allelic variant):术语“等位变体”在本文中表示占据相同染色体基因座的基因的任何两种或两种以上可选形式。等位变异通过突变天然地发生,并且可导致种群内的多态性。基因突变可以是沉默的(在编码的多肽中无变化)或可以编码具有改变的氨基酸序列的多肽。多肽的等位变体是由基因的等位变体编码的多肽。
分离的多核苷酸:术语“分离的多核苷酸”用于本文中指,如通过琼脂糖电泳测定的,其为至少20%纯,优选至少40%纯,更优选至少60%纯,甚至更优选至少80%纯,最优选至少90%纯,并且甚至最优选至少95%纯的多核苷酸。
基本上纯的多核苷酸:术语“基本上纯的多核苷酸”用于本文指不含其它外来的或不期望的核苷酸的多核苷酸制备物,并且所述多核苷酸制备物处于适合于在遗传工程的蛋白质生产体系中使用的形式。因此,基本上纯的多核苷酸含有按重量计至多10%,优选至多8%,更优选至多6%,更优选至多5%,更优选至多4%,更优选至多3%,甚至更优选至多2%,最优选至多1%,并且甚至最优选至多0.5%的与其天然或重组结合的其它多核苷酸材料。然而,基本上纯的多核苷酸可以包括天然存在的5’和3’非翻译区,例如启动子和终止子。优选基本上纯的多核苷酸是按重量计至少90%纯,优选至少92%纯,更优选至少94%纯,更优选至少95%纯,更优选至少96%纯,更优选至少97%纯,甚至更优选至少98%纯,最优选至少99%,并且甚至最优选至少99.5%纯的。本发明所述多核苷酸优选为基本上纯的形式。具体而言,优选在本文公开的多核苷酸是“基本上(essentially)纯的形式”,即,所述多核苷酸制备物基本上不含与其天然或重组结合的其它多核苷酸材料。在本文中,术语“基本上纯的多核苷酸”与术语“分离的多核苷酸”和“分离形式的多核苷酸”同义。所述多核苷酸可以是基因组、cDNA、RNA、半合成、合成来源的,或它们的任何组合。
编码序列:当用于本文时术语“编码序列”的意思是直接指定其蛋白产物的氨基酸序列的核苷酸序列。编码序列的边界通常由开读框决定,所述开读框通常以ATG起始密码子或可供选择的起始密码子例如GTG和TTG开始,并且以终止密码子例如TAA、TAG和TGA结束。编码序列可以是DNA、cDNA或重组核苷酸序列。
成熟多肽编码序列:术语“成熟多肽编码序列”在本文中定义为核苷酸序列,其编码具有内切葡聚糖酶活性的成熟多肽。
cDNA:术语“cDNA”在本文中定义为能够通过反转录从得自真核细胞的成熟的、已剪接的mRNA分子制备的DNA分子。cDNA缺少通常存在于相应基因组DNA中的内含子序列。起始的(initial)、初级的RNA转录物是mRNA的前体,其通过一系列的步骤加工然后作为成熟的已剪接的mRNA出现。这些步骤包括通过称为剪接的过程去除内含子序列。因而源自mRNA的cDNA没有任何内含子序列。
核酸构建体:术语“核酸构建体”用于本文指单链或双链的核酸分子,所述核酸分子分离自天然存在的基因,或将所述核酸分子以本来不存在于(nototherwise exist)自然界中的方式修饰以含有核酸的区段。当所述核酸构建体含有表达本发明的编码序列所需的调控序列时,术语核酸构建体与术语“表达盒”同义。
调控序列(control sequence):术语“调控序列”在本文定义为包括对编码本发明多肽的多核苷酸表达是必需的或有利的所有成分。各个调控序列对于编码所述多肽的核苷酸序列可以是天然的或外源的,或各个调控序列对于彼此可以是天然的或外源的。这些调控序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、启动子、信号肽序列和转录终止子。最少的情况,调控序列包括启动子和转录和翻译的终止信号。调控序列可以和用于引入特异性限制位点的接头一起提供,所述特异性限制位点促进调控序列与编码多肽的核苷酸序列编码区的连接。
可操作地连接:术语“可操作地连接”在本文表示这样的构型,其中将调控序列置于相对于多核苷酸序列的编码序列的适当位置,使得调控序列指导多肽编码序列的表达。
表达:术语“表达”包括涉及多肽产生的任何步骤,其包括但不限于转录、转录后修饰、翻译、翻译后修饰和分泌。
表达载体:术语“表达载体”在本文定义为线性的或环状的DNA分子,其包含编码本发明多肽的多核苷酸,并且所述多核苷酸与提供用于其表达的额外核苷酸可操作地连接。
宿主细胞:如本文中所使用的术语“宿主细胞”包括任何细胞类型,所述细胞类型对于使用包含本发明多核苷酸的核酸构建体或表达载体的转化、转染、转导等是易感的(susceptible)。
修饰:术语“修饰”在本文的意思是,对由SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8或SEQ ID NO:10的成熟多肽组成的多肽或其同源序列的任何化学修饰,以及对编码所述多肽的DNA的遗传操作。所述修饰可以是一个或几个氨基酸的取代、缺失和/或插入,以及一个或几个氨基酸侧链的置换。
人工变体:当用在本文时,术语“人工变体”的意思是具有内切葡聚糖酶活性的多肽,所述多肽由表达SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9的成熟多肽编码序列或其同源序列的修饰的核苷酸序列的生物体产生。所述修饰的核苷酸序列通过人为干预(human intervention),通过修饰公开于SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9或它们的同源序列的核苷酸序列来获得。
发明详述
具有内切葡聚糖酶活性的多肽
在第一个方面,本发明涉及包含氨基酸序列的分离的多肽,所述氨基酸序列与SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8或SEQ ID NO:10的成熟多肽具有至少60%,优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,更优选至少85%,甚至更优选至少90%,最优选至少95%,并且甚至最优选至少96%、97%、98%或99%的同一性程度,所述多肽具有内切葡聚糖酶活性(下文中的“同源多肽”)。在优选的方面,所述同源多肽具有氨基酸序列,其与SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8或SEQ IDNO:10的成熟多肽相差十个氨基酸,优选相差五个氨基酸,更优选相差四个氨基酸,甚至更优选相差三个氨基酸,最优选相差两个氨基酸,并且甚至最优选相差一个氨基酸。
本发明的多肽优选包含SEQ ID NO:4的氨基酸序列或其等位变体;或它们的具有内切葡聚糖酶活性的片段。在优选的方面,多肽包含SEQ ID NO:4的氨基酸序列。在另一个优选方面,多肽包含SEQ ID NO:4的成熟多肽。在另一个优选方面,多肽包含SEQ ID NO:4的氨基酸17至389,或其等位变体;或它们的具有内切葡聚糖酶活性的片段。在另一个优选方面,多肽包含SEQID NO:4的氨基酸17至389。在另一个优选方面,多肽由SEQ ID NO:4的氨基酸序列或其等位变体;或它们的具有内切葡聚糖酶活性的片段组成。在另一个优选方面,多肽由SEQ ID NO:4的氨基酸序列组成。在另一个优选方面,多肽由SEQ ID NO:4的成熟多肽组成。在另一个优选方面,多肽由SEQ ID NO:4的氨基酸17至389或其等位变体;或它们的具有内切葡聚糖酶活性的片段组成。在另一个优选方面,多肽由SEQ ID NO:4的氨基酸17至389组成。
本发明的多肽优选还包含SEQ ID NO:6的氨基酸序列或其等位变体;或它们的具有内切葡聚糖酶活性的片段。在优选的方面,多肽包含SEQ ID NO:6的氨基酸序列。在另一个优选方面,多肽包含SEQ ID NO:6的成熟多肽。在另一个优选方面,多肽包含SEQ ID NO:6的氨基酸16至397,或其等位变体;或它们的具有内切葡聚糖酶活性的片段。在另一个优选方面,多肽包含SEQ ID NO:6的氨基酸16至397。在另一个优选方面,多肽由SEQ ID NO:6的氨基酸序列或其等位变体;或它们的具有内切葡聚糖酶活性的片段组成。在另一个优选方面,多肽由SEQ ID NO:6的氨基酸序列组成。在另一个优选方面,多肽由SEQ ID NO:6的成熟多肽组成。在另一个优选方面,多肽由SEQ ID NO:6的氨基酸16至397或其等位变体;或它们的具有内切葡聚糖酶活性的片段组成。在另一个优选方面,多肽由SEQ ID NO:6的氨基酸16至397组成。
本发明的多肽优选还包含SEQ ID NO:8的氨基酸序列或其等位变体;或它们的具有内切葡聚糖酶活性的片段。在优选的方面,多肽包含SEQ ID NO:8的氨基酸序列。在另一个优选方面,多肽包含SEQ ID NO:8的成熟多肽。在另一个优选方面,多肽包含SEQ ID NO:8的氨基酸22至429,或其等位变体;或它们的具有内切葡聚糖酶活性的片段。在另一个优选方面,多肽包含SEQ ID NO:8的氨基酸22至429。在另一个优选方面,多肽由SEQ ID NO:8的氨基酸序列或其等位变体;或它们的具有内切葡聚糖酶活性的片段组成。在另一个优选方面,多肽由SEQ ID NO:8的氨基酸序列组成。在另一个优选方面,多肽由SEQ ID NO:8的成熟多肽组成。在另一个优选方面,多肽由SEQ ID NO:8的氨基酸22至429或其等位变体;或它们的具有内切葡聚糖酶活性的片段组成。在另一个优选方面,多肽由SEQ ID NO:8的氨基酸22至429组成。
本发明的多肽优选还包含SEQ ID NO:10的氨基酸序列或其等位变体;或其具有内切葡聚糖酶活性的片段。在优选的方面,多肽包含SEQ ID NO:10的氨基酸序列。在另一个优选方面,多肽包含SEQ ID NO:10的成熟多肽。在另一个优选方面,多肽包含SEQ ID NO:10的氨基酸25至421,或其等位变体;或它们的具有内切葡聚糖酶活性的片段。在另一个优选方面,多肽包含SEQ ID NO:10的氨基酸25至421。在另一个优选方面,多肽由SEQ ID NO:10的氨基酸序列或其等位变体;或它们的具有内切葡聚糖酶活性的片段组成。在另一个优选方面,多肽由SEQ ID NO:10的氨基酸序列组成。在另一个优选方面,多肽由SEQ ID NO:10的成熟多肽组成。在另一个优选方面,多肽由SEQ ID NO:10的氨基酸25至421或其等位变体;或它们的具有内切葡聚糖酶活性的片段组成。在另一个优选方面,多肽由SEQ ID NO:10的氨基酸25至421组成。
在第二个方面,本发明涉及具有内切葡聚糖酶活性的分离的多肽,所述分离的多肽由多核苷酸编码,所述多核苷酸在非常低严紧条件下,优选低严紧条件下,更优选中严紧条件下,更优选中-高严紧条件下,甚至更优选高严紧条件下,并且最优选非常高严紧条件下,与以下杂交:(i)SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9的成熟多肽编码序列,(ii)包含于SEQ ID NO:3或SEQ ID NO:9的成熟多肽编码序列中的cDNA序列,或包含SEQ ID NO:5或SEQ ID NO:7的成熟多肽编码序列的基因组DNA序列,(iii)(i)或(ii)的亚序列,或(iv)(i)、(ii)或(iii)的互补链(J.Sambrook,E.F.Fritsch,和T.Maniatis,1989,Molecular Cloning,A Laboratory Manual,2d edition,Cold Spring Harbor,New York)。SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9的成熟多肽编码序列的亚序列含有至少100个连续的核苷酸或优选至少200个连续的核苷酸。此外,所述亚序列可编码具有内切葡聚糖酶活性的多肽片段。在优选的方面,所述成熟多肽编码序列是SEQ ID NO:3的核苷酸67至1185。在另一个优选的方面,所述成熟多肽编码序列是SEQ IDNO:5的核苷酸84至1229。在另一个优选的方面,所述成熟多肽编码序列是SEQ ID NO:7的核苷酸77至1300。在另一个优选的方面,所述成熟多肽编码序列是SEQ ID NO:9的核苷酸73至1468。在另一个优选的方面,所述互补链是SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9的成熟多肽编码序列的全长互补链。
SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9的核苷酸序列或其亚序列,以及SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8或SEQID NO:10的氨基酸序列或其片段,可用于设计核酸探针,以根据本领域内公知的方法从不同属和种的菌株鉴定和克隆编码具有内切葡聚糖酶活性的多肽的DNA。具体而言,根据标准的Southern印迹方法,可将这些探针用于与感兴趣的属或种的基因组或cDNA杂交,以鉴定和从其中分离相应的基因。这些探针可明显短于完整序列,但长度上应为至少14,优选至少25,更优选至少35,并且最优选至少70个核苷酸。然而,优选所述核酸探针是至少100个核苷酸长度。例如,所述核酸探针的长度可为至少200个核苷酸,优选至少300个核苷酸,更优选至少400个核苷酸,或最优选至少500个核苷酸。甚至可以使用更长的探针,例如,长度是至少600个核苷酸,至少优选至少700个核苷酸,更优选至少800个核苷酸,或最优选至少900个核苷酸的核酸探针。DNA和RNA探针二者均可使用。通常将探针标记以探测相应的基因(例如,用32P、3H、35S、生物素或抗生物素蛋白(avidin)标记)。将这些探针包含于本发明中。
因而,可从由这些其它生物体制备的基因组DNA或cDNA文库中筛选DNA,所述DNA与上述探针杂交并且编码具有内切葡聚糖酶活性的多肽。可以通过琼脂糖或聚丙烯酰胺凝胶电泳,或通过其它分离技术分离来自这些其它生物体的基因组或其它DNA。可以将来自文库的DNA或分离的DNA转移至硝化纤维素(nitrocellulose)或其它合适的载体材料并且固定于其上。为了鉴定与SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9或其亚序列同源的克隆或DNA,将所述载体材料优选用在Sounthern印迹中。
就本发明而言,杂交表示核苷酸序列在非常低至非常高的严紧条件下与标记的核酸探针杂交,所述核酸探针对应于SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9的成熟多肽编码序列;包含于SEQ ID NO:3或SEQ ID NO:9的成熟多肽编码序列中的cDNA序列,或包含SEQ ID NO:5或SEQ ID NO:7的基因组DNA序列;其互补链;或它们的亚序列。可使用例如X射线片(X-ray film)检测在这些条件下与核酸探针杂交的分子。
在优选的方面,核酸探针是SEQ ID NO:3的成熟多肽编码序列。在另一个优选方面,核酸探针是SEQ ID NO:3的核苷酸67至1185。在另一个优选方面,核酸探针是编码SEQ ID NO:4的多肽的多核苷酸序列,或其亚序列。在另一个优选方面,核酸探针是SEQ ID NO:3。在另一个优选方面,核酸探针是包含在大肠杆菌(E.coli)NRRL B-30902中的质粒pCIC161中含有的多核苷酸序列,其中所述其多核苷酸序列编码具有内切葡聚糖酶活性的多肽。在另一个优选方面,核酸探针是包含在大肠杆菌NRRL B-30902中的质粒pCIC161中含有的成熟多肽编码序列区域。
在另一个优选的方面,核酸探针是SEQ ID NO:5的成熟多肽编码序列。在另一个优选方面,核酸探针是SEQ ID NO:5的核苷酸84至1229。在另一个优选方面,核酸探针是编码SEQ ID NO:6的多肽的多核苷酸序列,或其亚序列。在另一个优选方面,核酸探针是SEQ ID NO:5。在另一个优选方面,核酸探针是包含在大肠杆菌NRRL B-30903中的质粒pCIC453中含有的多核苷酸序列,其中所述其多核苷酸序列编码具有内切葡聚糖酶活性的多肽。在另一个优选方面,核酸探针是包含在大肠杆菌NRRL B-30903中的质粒pCIC453中含有的成熟多肽编码区。
在另一个优选的方面,核酸探针是SEQ ID NO:7的成熟多肽编码序列。在另一个优选方面,核酸探针是SEQ ID NO:7的核苷酸77至1300。在另一个优选方面,核酸探针是编码SEQ ID NO:8的多肽的多核苷酸序列,或其亚序列。在另一个优选方面,核酸探针是SEQ ID NO:7。在另一个优选方面,核酸探针是包含在大肠杆菌NRRL B-30904中的质粒pCIC486中含有的多核苷酸序列,其中所述其多核苷酸序列编码具有内切葡聚糖酶活性的多肽。在另一个优选方面,核酸探针是包含在大肠杆菌NRRL B-30904中的质粒pCIC486中含有的成熟多肽编码区。
在另一个优选的方面,核酸探针是SEQ ID NO:9的成熟多肽编码序列。在另一个优选方面,核酸探针是SEQ ID NO:9的核苷酸73至1468。在另一个优选方面,核酸探针是编码SEQ ID NO:10的多肽的多核苷酸序列,或其亚序列。在另一个优选方面,核酸探针是SEQ ID NO:9。在另一个优选方面,核酸探针是包含在大肠杆菌NRRL B-30900N中的质粒pPBCel5C中含有的多核苷酸序列,其中所述其多核苷酸序列编码具有内切葡聚糖酶活性的多肽。在另一个优选方面,核酸探针是包含在大肠杆菌NRRL B-30900N中的质粒pPBCel5C中含有的成熟多肽编码区。
对于长度至少100个核苷酸的长探针,将非常低至非常高的严紧条件定义为在42℃,在5X SSPE、0.3% SDS、200μg/ml已剪切并且变性的鲑精DNA中,并且对于非常低和低严紧性为25%的甲酰胺、对于中和中-高严紧性为35%的甲酰胺、或对于高和非常高严紧性为50%的甲酰胺,根据标准的Southern印迹法进行预杂交和杂交最佳12至24小时。
对于长度为至少100个核苷酸的长探针,使用2X SSC、0.2% SDS优选至少在45℃(非常低严紧性),更优选至少在50℃(低严紧性),更优选至少在55℃(中严紧性),更优选至少在60℃(中-高严紧性),甚至更优选至少在65℃(高严紧性),并且最优选至少在70℃(非常高严紧性)将载体材料最终洗涤三次,每次15分钟。
对于长度大约15个核苷酸至大约70个核苷酸的短探针,将严紧条件定义为在比根据Bolton和McCarthy计算法(1962,Proceedings of the NationalAcademy of Sciences USA 48:1390)得出的Tm低大约5℃至大约10℃,在0.9MNaCl,0.09M Tris-HCl pH 7.6,6mM EDTA,0.5% NP-40,1×Denhardt溶液,1mM焦磷酸钠(sodium pyrophosphate),1mM磷酸二氢钠(sodium monobasicphosphate),0.1mM ATP和0.2mg每ml的酵母RNA中,根据标准的Southern印迹步骤进行预杂交、杂交和杂交后洗涤最佳12至24小时。
对于长度大约15个核苷酸至大约70个核苷酸的短探针,将所述载体材料在6×SSC加0.1% SDS中洗涤一次15分钟,并用6×SSC在比计算的Tm低5℃至10℃的温度洗涤两次,每次15分钟。
在第三个方面,本发明涉及由包含核苷酸序列或由核苷酸序列组成的多核苷酸编码的分离的多肽,所述核苷酸序列与SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9的成熟多肽编码序列具有至少60%,优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,更优选至少85%,更优选至少90%,甚至更优选至少95%,并且甚至优选至少97%同一性的同一性程度,其编码活性多肽。在优选方面,所述成熟多肽编码序列是SEQ IDNO:3的核苷酸67至1185。在另一个优选的方面,所述成熟多肽编码序列是SEQ ID NO:5的核苷酸84至1229。在另一个优选的方面,所述成熟多肽编码序列是SEQ ID NO:7的核苷酸77至1300。在另一个优选的方面,所述成熟多肽编码序列是SEQ ID NO:9的核苷酸73至1468。参见本文的多核苷酸部分。
在第四个方面,本发明涉及人工变体,所述人工变体包含取代、缺失和/或插入一个或几个氨基酸的SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8或SEQ ID NO:10的成熟多肽;或其同源序列。优选地,氨基酸改变对性质是较不重要的(of a minor nature),即保守的氨基酸取代或插入,其不显著影响蛋白质的折叠和/或活性;通常为1至大约30个氨基酸的小缺失;小的氨基或羧基末端延伸,例如氨基末端甲硫氨酸残基;多至大约20-25个残基的小接头肽;或通过改变净电荷或其它功能来促进纯化的小延伸,如多组氨酸序列(polyhistidine tract)、抗原表位(antigenic epitope)或结合域(binding domain)。
保守取代的实例是在以下组之内:碱性氨基酸组(精氨酸、赖氨酸和组氨酸)、酸性氨基酸组(谷氨酸和天冬氨酸)、极性氨基酸组(谷氨酰胺和天冬酰胺)、疏水性氨基酸组(亮氨酸、异亮氨酸和缬氨酸)、芳族氨基酸组(苯丙氨酸、色氨酸和酪氨酸)和小氨基酸组(甘氨酸、丙氨酸、丝氨酸、苏氨酸和甲硫氨酸)。通常不改变比活性(specific activity)的氨基酸取代是本领域已知的,并且由例如H.Neurath和R.L.Hill,1979,于The Proteins,Academic Press,New York中描述。最普遍发生的交换是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Lcu/Ile、Lcu/Val、Ala/Glu和Asp/Gly。
除了20个基本氨基酸,非基本氨基酸(例如4-羟脯氨酸、6-N-甲基赖氨酸、2-氨基异丁酸、异缬氨酸和α-甲基丝氨酸)可以取代野生型多肽的氨基酸残基。有限数量的非保守氨基酸、不由遗传密码编码的氨基酸和非天然氨基酸可以取代氨基酸残基。“非天然氨基酸”在蛋白质合成后已经过修饰,和/或在它们的侧链具有不同于基本氨基酸的化学结构。非天然氨基酸能够以化学方法合成,并且优选是商业上能够获得的,包括六氢吡啶羧酸(pipecolicacid)、噻唑烷羧酸(thiazolidine carboxylic acid)、脱氢脯氨酸、3-和4-甲基脯氨酸,和3,3-二甲基脯氨酸。
可供选择的是,氨基酸改变具有这样的性质以使多肽的物理化学性质改变。例如,氨基酸改变可改进多肽的热稳定性,改变底物特异性,改变最适pH等。
能够根据本领域已知的方法,例如定位诱变或丙氨酸分区诱变法(Cunningham和Wells,1989,Science 244:1081-1085)来鉴定亲本多肽中的必需氨基酸。在后一技术中,将单一丙氨酸突变引入到分子中的每个残基,并且测试所得突变分子的生物活性(即,内切葡聚糖酶活性)以鉴定对于所述分子的活性关键的氨基酸残基。同样参见Hilton等,1996,J.Biol.Chem.271:4699-4708。酶的活性部位或其它的生物相互作用也能够通过结构的物理分析而测定,如通过以下这些技术:如核磁共振、晶体学、电子衍射或光亲和标记,连同推定的接触位点氨基酸的突变来测定。参见例如de Vos等,1992,Science 255:306-312;Smith等,1992,J.Mol.Biol.224:899-904;Wlodaver等,1992,FEBS Lett.309:59-64。必需氨基酸的同一性也能够从与多肽的同一性分析来推断,所述多肽与根据本发明的多肽相关。
能够使用已知的诱变、重组和/或改组(shuffling)方法,然后是有关的筛选方法,例如那些由Reidhaar-Olson和Sauer,1988,Science 241:53-57;Bowie和Sauer,1989,Proc.Natl.Acad.Sci.USA 86:2152-2156;WO 95/17413;或WO95/22625公开的那些方法来进行并测试单个或多个氨基酸取代。能够使用的其它方法包括易错PCR、噬菌体展示(例如,Lowman等,1991,Biochem.30:10832-10837;美国专利号5,223,409;WO 92/06204)和区域定向的诱变(Derbyshire等,1986,Gene 46:145;Ner等,1988,DNA 7:127)。
诱变/改组方法能够与高通量、自动化的筛选方法组合以检测由宿主细胞表达的克隆的、诱变的多肽的活性(Ness等,1999,Nature Biotechnology 17:893-896)。能够从宿主细胞回收编码活性多肽的诱变的DNA分子,并且使用本领域内标准方法快速测序。这些方法允许快速测定感兴趣的多肽中单个氨基酸残基的重要性,并且能够应用于未知结构的多肽。
SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8或SEQ ID NO:10的成熟多肽,如SEQ ID NO:2的氨基酸17至389、SEQ ID NO:6的氨基酸16至397、SEQ ID NO:8的氨基酸22至429,或SEQ ID NO:10的氨基酸25至421的氨基酸取代、缺失和/或插入的总数是10,优选9,更优选8,更优选7,更优选至多6,更优选5,更优选4,甚至更优选3,最优选2,并且甚至最优选1。
具有内切葡聚糖酶活性的多肽的来源
本发明的多肽可以获得自任何属的微生物。就本发明而言,用于本文与给定的来源有关的术语“获得自”,意思是核苷酸序列编码的多肽由所述来源产生,或由其中插入了来自所述来源的核苷酸序列的菌株产生。在优选的方面,获得自给定来源的多肽是胞外分泌的。
本发明具有内切葡聚糖酶活性的多肽可以是细菌多肽。例如,所述多肽可以是革兰氏阳性细菌多肽例如芽孢杆菌属(Bacillus)、链球菌属(Streptococcus)、链霉菌属(Streptomyces)、葡萄球菌属(Staphylococcus)、肠球菌属(Enterococcus)、乳酸菌属(Lactobacillus)、乳球菌属(Lactococcus)、梭菌属(Clostridium)、Geobacillus或Oceanobacillus多肽,所述多肽具有[酶]活性;或革兰氏阴性细菌多肽,如大肠杆菌(E.coli)、假单胞菌(Pseudomonas)、沙门氏菌(Salmonella)、弯曲杆菌属(Campylobacter)、螺杆菌(Helicobacter)、黄杆菌属(Flavobacterium)、梭杆菌属(Fusobacterium)、泥杆菌属(Ilyobacter)、奈瑟氏菌属(Neisseria)或脲原体属(Ureaplasma)属多肽,其具有内切葡聚糖酶活性。
在优选方面,所述多肽是嗜碱芽孢杆菌(Bacillus alkalophilus)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、短芽孢杆菌(Bacillus brevis)、环状芽孢杆菌(Bacillus circulans)、克劳氏芽孢杆菌(Bacillus clausii)、凝结芽孢杆菌(Bacillus coagulans)、坚强芽孢杆菌(Bacillus firmus)、灿烂芽孢杆菌(Bacilluslautus)、迟缓芽孢杆菌(Bacillus lentus)、地衣芽孢杆菌(Bacillus licheniformis)、巨大芽孢杆菌(Bacillus megaterium)、短小芽孢杆菌(Bacillus pumilus)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)、枯草芽孢杆菌(Bacillus subtilis)或苏云金芽孢杆菌(Bacillus thuringiensis)具有内切葡聚糖酶活性的多肽。
在另一个优选的方面,所述多肽是具有内切葡聚糖酶活性的似马链球菌(Streptococcus equisimilis)、酿脓链球菌(Streptococcus pyogenes)、乳房链球菌(Streptococcus uberis)或马链球菌兽瘟亚种(Streptococcus equi subsp.Zooepidem icus)多肽。
在另一个优选的方面,所述多肽是不产色链霉菌(Streptomycesachromogenes)、阿维链霉菌(Streptomyces avermitilis)、天蓝链霉菌(Streptomycescoelicolor)、灰色链霉菌(Streptomyces griseus)或浅青紫链霉菌(Streptomyceslividans)多肽,其具有内切葡聚糖酶活性。
本发明具有内切葡聚糖酶活性的多肽也可以是真菌多肽,并且更优选酵母多肽如念珠菌属(Candida)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)或西洋蓍霉属(Yarrowia)多肽,其具有内切葡聚糖酶活性;或更优选丝状真菌多肽如枝顶孢霉属(Acremonium)、曲霉属(Aspergillus)、短梗霉属(Aureobasidium)、金孢子菌属(Chrysosporium)、隐球菌属(Cryptococcus)、Filibasidium、镰孢属(Fusarium)、腐质霉属(Humicola)、梨孢菌属(Magnaporthe)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、新考玛脂霉属(Neocallimastix)、脉孢菌属(Neurospora)、拟青霉属(Paecilomyces)、青霉属(Penicillium)、瘤胃壶菌属(Piromyces)、裂褶菌属(Schizophyllum)、踝节菌属(Talaromyces)、热子囊菌属(Thermoascus)、梭孢壳属(Thielavia)、弯颈霉属(Tolypocladium)或木霉属(Trichoderma)多肽,其具有内切葡聚糖酶活性。
在优选的方面,所述多肽是卡尔酵母(Saccharomyces carlsbergensis)、酿酒酵母(Saccharomyces cerevisiae)、糖化酵母(Saccharomyces diastaticus)、道格拉氏酵母(Saccharomyces douglasii)、克鲁弗酵母(Saccharomyces kluyveri)、诺地酵母(Saccharomyces norbensis)或卵形酵母(Saccharomyces oviformis)多肽,其具有内切葡聚糖酶活性。
在另外的优选方面,所述多肽是棘孢曲霉(Aspergillus aculeatus)、泡盛曲霉(Aspergillus awamori)、烟曲霉(Aspergillus fumigatus)、臭曲霉(Aspergillusfoetidus)、日本曲霉(Aspergillus japonicus)、构巢曲霉(Aspergillus nidulans)、黑曲霉(Aspergillus niger)、米曲霉(Aspergillus oryzae)、嗜角质金孢子菌(Chrysosporium keratinophilum)、Chrysosporium lucknowense、热带金孢子菌(Chrysosporium tropicum)、Chrysosporium merdarium、Chrysosporium inops、毡金孢子菌(Chrysosporium pannicola)、Chrysosporium queenslandicum、Chrysosporium zonatum、杆孢状镰孢(Fusarium bactridioides)、禾谷镰孢(Fusarium cerealis)、库威镰孢(Fusarium crookwellense)、大刀镰孢(Fusariumculmorum)、禾本科镰孢(Fusarium graminearum)、禾赤镰孢(Fusariumgraminum)、异孢镰孢(Fusarium heterosporum)、合欢木镰孢(Fusariumnegundi)、尖镰孢(Fusarium oxysporum)、多枝镰孢(Fusarium reticulatum)、粉红镰孢(Fusarium roseum)、接骨木镰孢(Fusarium sambucinum)、肤色镰孢(Fusarium sarcochroum)、拟分枝孢镰孢(Fusarium sporotrichioides)、硫色镰孢(Fusarium sulphureum)、圆镰孢(Fusarium torulosum)、拟丝孢镰孢(Fusariumtrichothecioides)、镶片镰孢(Fusarium venenatum)、特异腐质霉(Humicolainsolens)、疏棉状腐质霉(Humicola lanuginosa)、米黑毛霉(Mucor miehei)、嗜热毁丝霉(Myceliophthora thermophila)、粗糙脉孢菌(Neurospora crassa)、Thielavia achromatica、Thielavia albomyces、Thielavia albopilosa、Thielaviaaustraleinsis、Thielavia fimeti、Thielavia microspora、Thielavia ovispora、Thielavia peruviana、Thielavia spededonium、毛梭孢壳(Thielavia setosa)、Thielavia subthermophila、土生梭孢霉(Thielavia terrestris)、哈茨木霉(Trichoderma harzianum)、康宁木霉(Trichoderma koningii)、长枝木霉(Trichoderma longibrachiatum)、里氏木霉(Trichoderma reesei)或绿色木霉(Trichoderma viride)多肽,其具有内切葡聚糖酶活性。
在另外的优选方面,所述多肽是巴西青霉、沙门柏干酪青霉(Penicilliumcamembertii)、胶囊青霉(Penicillium capsulatum)、产黄青霉(Penicilliumchrysogenum)、Penicillium citreonigrum、桔青霉(Penicillium citrinum)、棒形青霉(Penicilliumclaviforme)、顶青霉(Penicillium corylophilum)、皮落青霉(Penicillium crustosum)、指状青霉(Penicillium digitatum)、Penicilliumexpansum、Penicillium funiculosum、平滑青霉(Penicillium glabrum)、粒状青霉(Penicillium granulatum)、灰黄青霉(Penicillium griseofulvum)、岛青霉(Penicillium islandicum)、意大利青霉(Penicillium italicum)、微紫青霉(Penicillium janthinellum)、铅色青霉(Penicillium lividum)、大孢青霉(Penicilliummegasporum)、梅林青霉(Penicillium melinii)、特异青霉(Penicillium notatum)、草酸青霉(Penicillium oxalicum)、软毛青霉(Penicillium puberulum)、变紫青霉(Penicillium purpurescens)、产紫青霉(Penicillium purpurogenum)、娄地青霉(Penicillium roquefortii)、皱褶青霉(Penicillium rugulosum)、小刺青霉(Penicillium spinulosum)、瓦克曼青霉(Penicillium waksmanii)或青霉属菌种多肽,其具有内切葡聚糖酶活性。
在更优选的方面,所述多肽是嗜热毁丝霉(Myceliophthora thermophila)多肽,并且最优选嗜热毁丝霉CBS 111.65多肽,例如SEQ ID NO:4的多肽,或其成熟多肽。
在另一个更优选的方面,所述多肽是担子菌CBS 495.95多肽,例如SEQID NO:6的多肽,或其成熟多肽。
在另一个更优选的方面,所述多肽是担子菌CBS 494.95多肽,例如SEQID NO:8的多肽,或其成熟多肽。
在另一个更优选的方面,所述多肽是巴西青霉多肽,并且最优选巴西青霉IBT 20888多肽,例如SEQ ID NO:10的多肽或其成熟多肽。
可理解的是对于前述的种,本发明包含完全和不完全阶段(perfect andimperfect states),和其它分类学的等同物(equivalent),例如无性型(anamorph),而无论它们已知的种名。本领域熟练技术人员将容易地识别适合的等同物的同一性。
这些种的菌株在许多培养物保藏中心对于公众能够容易地取得,所述保藏中心诸如美国典型培养物保藏中心(the American Type Culture Collection)(ATCC)、德意志微生物和细胞培养物保藏中心(Deutsche Sammlung vonMikroorganismen und Zellkulturen GmbH)(DSM)、真菌菌种保藏中心(Centraalbureau Voor Schimmelcultures)(CBS)和农业研究机构专利培养物保藏中心北区研究中心(Agricultural Research Service Patent Culture Collection,Northern Regional Research Center)(NRRL)。
此外,可以使用上述的探针从其它来源,包括从自然界(例如,土壤、堆肥、水等)分离的微生物鉴定和获得这些多肽。用于从天然生境(habitat)分离微生物的技术是本领域内公知的。随后可通过相似地筛选这种微生物的基因组或cDNA文库来获得所述多核苷酸。一旦用所述探针检测到编码多肽的多核苷酸序列,就能够使用本领域普通技术人员熟知的技术将所述多核苷酸分离或克隆(参见,例如,Sambrook等,1989,见上文)。
本发明的多肽还包括融合多肽或可切割的融合多肽,其中将另外的多肽融合到所述多肽或其片段的N末端或C末端。通过将编码另一个多肽的核苷酸序列(或其部分)融合于本发明的核苷酸序列(或其部分)来产生融合的多肽。产生融合多肽的技术是本领域已知的,并包括连接编码多肽的编码序列以使它们在阅读框中,并且使融合多肽的表达在相同启动子和终止子的控制下。
融合多肽还可以包括切割位点。一旦分泌了融合多肽,就切割所述位点,从融合蛋白质释放具有内切葡聚糖酶活性的多肽。
切割位点的实例包括,但不限于,编码二肽Lys-Arg的Kex2位点(Martin等,2003,J.Ind.Microbiol.Biotechnol.3:568-76;Svetina等,2000,J.Biotechnol.76:245-251;Rasmussen-Wilson等,1997,Appl.Environ.Microbiol.63:3488-3493;Ward等,1995,Biotechnology 13:498-503;和Contreras等,1991,Biotechnology 9:378-381);Ile-(Glu或Asp)-Gly-Arg位点,其在精氨酸残基后通过Factor Xa蛋白酶切割(Eaton等,1986,Biochem.25:505-512);Asp-Asp-Asp-Asp-Lys位点,其在赖氨酸后通过肠激酶切割(Collins-Racie等,1995,Biotechnology 13:982-987);His-Tyr-Glu位点或His-Tyr-Asp位点,其通过Genenase I切割(Carter等,1989,Proteins:Structure,Function,and Genetics 6:240-248);Leu-Val-Pro-Arg-Gly-Ser位点,其在Arg后通过凝血酶切割(Stevens,2003,Drug Discovery World 4:35-48);Glu-Asn-Leu-Tyr-Phe-Gln-Gly位点,其在Gln后通过TEV蛋白酶切割(Stevens,2003,见上文);和Leu-Glu-Val-Leu-Phe-Gln-Gly-Pro位点,其在Gln后通过基因工程形式的人鼻病毒3C蛋白酶切割(Stevens,2003,见上文)。
多核苷酸
本发明还涉及分离的多核苷酸,其包含编码本发明具有内切葡聚糖酶活性的多肽的核苷酸序列,或由编码本发明具有内切葡聚糖酶活性的多肽的核苷酸序列组成。
在优选的方面,核苷酸序列包含SEQ ID NO:3或由SEQ ID NO:3组成。在另一个更优选的方面,核苷酸序列包含大肠杆菌NRRL B-30902中所含质粒pCIC161中所含的序列,或由大肠杆菌NRRL B-30902中所含质粒pCIC161中所含的序列组成。在另一个优选方面,核苷酸序列包含SEQ ID NO:3的成熟多肽编码区或由SEQ ID NO:3的成熟多肽编码区组成。在另一个优选方面,核苷酸序列包含SEQ ID NO:3的核苷酸67至1185或由SEQ ID NO:3的核苷酸67至1185组成。在另一个更优选的方面,核苷酸序列包含大肠杆菌NRRL B-30902中所含质粒pCIC161中所含的成熟多肽编码区或由大肠杆菌NRRL B-30902中所含质粒pCIC161中所含的成熟多肽编码区组成。本发明还包含编码多肽的核苷酸序列,所述多肽包含SEQ ID NO:4的氨基酸序列或其成熟多肽,或由SEQ ID NO:4的氨基酸序列或其成熟多肽组成;由于遗传密码的简并性,所述核苷酸序列不同于SEQ ID NO:3或其成熟多肽编码序列。本发明还涉及SEQ ID NO:3的亚序列,所述亚序列编码具有内切葡聚糖酶活性的SEQ ID NO:4的片段。
在另一个优选的方面,核苷酸序列包含SEQ ID NO:5或由SEQ ID NO:5组成。在另一个更优选的方面,核苷酸序列包含大肠杆菌NRRL B-30903中所含质粒pCIC453中所含的序列,或由大肠杆菌NRRL B-30903中所含质粒pCIC453中所含的序列组成。在另一个优选方面,核苷酸序列包含SEQ ID NO:5的成熟多肽编码区或由SEQ ID NO:5的成熟多肽编码区组成。在另一个优选方面,核苷酸序列包含SEQ ID NO:5的核苷酸84至1229或由SEQ ID NO:5的核苷酸84至1229组成。在另一个更优选的方面,核苷酸序列包含大肠杆菌NRRL B-30903中所含质粒pCIC453中所含的成熟多肽编码区或由大肠杆菌NRRL B-30903中所含质粒pCIC453中所含的成熟多肽编码区组成。本发明还包含编码多肽的核苷酸序列,所述多肽包含SEQ ID NO:6的氨基酸序列或其成熟多肽,或由SEQ ID NO:6的氨基酸序列或其成熟多肽组成;由于遗传密码的简并性,所述核苷酸序列不同于SEQ ID NO:5或其成熟多肽编码序列。本发明还涉及SEQ ID NO:5的亚序列,所述亚序列编码具有内切葡聚糖酶活性的SEQ ID NO:6的片段。
在另一个优选的方面,核苷酸序列包含SEQ ID NO:7或由SEQ ID NO:7组成。在另一个更优选的方面,核苷酸序列包含大肠杆菌NRRL B-30904中所含质粒pCIC486中所含的序列,或由大肠杆菌NRRL B-30904中所含质粒pCIC486中所含的序列组成。在另一个优选方面,核苷酸序列包含SEQ ID NO:7的成熟多肽编码区或由SEQ ID NO:7的成熟多肽编码区组成。在另一个优选方面,核苷酸序列包含SEQ ID NO:7的核苷酸77至1300或由SEQ ID NO:7的核苷酸77至1300组成。在另一个更优选的方面,核苷酸序列包含大肠杆菌NRRL B-30904中所含质粒pCIC486中所含的成熟多肽编码区或由大肠杆菌NRRL B-30904中所含质粒pCIC486中所含的成熟多肽编码区组成。本发明还包含编码多肽的核苷酸序列,所述多肽包含SEQ ID NO:8的氨基酸序列或其成熟多肽,或由SEQ ID NO:8的氨基酸序列或其成熟多肽组成;由于遗传密码的简并性,所述核苷酸序列不同于SEQ ID NO:7或其成熟多肽编码序列。本发明还涉及SEQ ID NO:7的亚序列,所述亚序列编码具有内切葡聚糖酶活性的SEQ ID NO:8的片段。
在另一个优选的方面,核苷酸序列包含SEQ ID NO:9或由SEQ ID NO:9组成。在另一个更优选的方面,核苷酸序列包含大肠杆菌NRRL B-30900N中所含质粒pPBCel5C中所含的序列,或由大肠杆菌NRRL B-30900N中所含质粒pPBCel5C中所含的序列组成。在另一个优选方面,核苷酸序列包含SEQ IDNO:9的成熟多肽编码区或由SEQ ID NO:9的成熟多肽编码区组成。在另一个优选方面,核苷酸序列包含SEQ ID NO:9的核苷酸73至1468或由SEQ IDNO:9的核苷酸73至1468组成。在另一个更优选的方面,核苷酸序列包含大肠杆菌NRRL B-30900N中所含质粒pPBCel5C中所含的成熟多肽编码区或由大肠杆菌NRRL B-30900N中所含质粒pPBCel5C中所含的成熟多肽编码区组成。本发明还包含编码多肽的核苷酸序列,所述多肽包含SEQ ID NO:10的氨基酸序列或其成熟多肽,或由SEQ ID NO:10的氨基酸序列或其成熟多肽组成;由于遗传密码的简并性,所述核苷酸序列不同于SEQ ID NO:9或其成熟多肽编码序列。本发明还涉及SEQ ID NO:9的亚序列,所述亚序列编码具有内切葡聚糖酶活性的SEQ ID NO:10的片段。
本发明还涉及突变多核苷酸,所述突变多核苷酸在SEQ ID NO:3、SEQID NO:5、SEQ ID NO:7或SEQ ID NO:9的成熟多肽编码序列中包含至少一个突变,或由在SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9的成熟多肽编码序列中具有至少一个突变的核苷酸组成,其中所述突变核苷酸序列编码SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8或SEQ ID NO:10的成熟多肽。在优选的方面,所述成熟多肽是SEQ ID NO:4的氨基酸17至389。在另一个优选的方面,所述成熟多肽是SEQ ID NO:6的氨基酸16至397。在另一个优选的方面,所述成熟多肽是SEQ ID NO:8的氨基酸22至429。在另一个优选的方面,所述成熟多肽是SEQ ID NO:10的氨基酸25至421。
用于分离或克隆编码多肽的多核苷酸的技术是本领域内已知的,包括从基因组DNA分离,从cDNA制备,或其组合。可通过例如使用熟知的聚合酶链式反应(PCR)或表达文库的抗体筛选来检测具有共有结构特性的克隆DNA片段,从而实现从这种基因组DNA克隆本发明的多核苷酸。参见,例如,Innis等,1990,PCR:AGuide to Methods and Application,Academic Press,New York。可以使用其它核酸扩增方法,如连接酶链式反应(LCR)、连接活化转录(ligated activated transcription;LAT)和基于核苷酸序列的扩增(NASBA)。可以从嗜热毁丝霉CBS 117.65、担子菌CBS 494.95或担子菌CBS 495.95菌株,或其它或相关生物体克隆多核苷酸,并且因此可以是例如所述核苷酸序列的多肽编码区的等位基因变体或种变体(species variant)。
本发明还涉及包含核苷酸序列或由核苷酸序列组成的分离的多核苷酸,所述核苷酸序列与SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9的成熟多肽编码序列具有至少60%,优选至少65%,更优选至少70%,更优选至少75%,更优选至少80%,更优选至少85%,更优选至少90%,甚至更优选至少95%,并且最优选至少97%同一性的同一性程度,其编码活性多肽。在优选的方面,所述成熟多肽编码序列是SEQ ID NO:3的核苷酸67至1185。在另一个优选的方面,所述成熟多肽编码序列是SEQ ID NO:5的核苷酸84至1229。另一个优选的方面,所述成熟多肽编码序列是SEQ ID NO:7的核苷酸77至1300。另一个优选的方面,所述成熟多肽编码序列是SEQ IDNO:9的核苷酸73至1468。
修饰编码本发明多肽的核苷酸序列对于合成与所述多肽基本上相似的多肽可为必需的。术语与所述多肽“基本上相似”指多肽的非天然存在的形式。这些多肽可能以一些工程改造的方式而不同于从其天然来源分离的多肽,例如,比活性、热稳定性、最适pH等方面不同的人工变体。可以在作为SEQ IDNO:3、SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9的多肽编码区存在的核苷酸序列,例如其亚序列的基础上,和/或通过引入如下核苷酸取代来构建变体序列:所述取代不产生由核苷酸序列编码的多肽的另外的氨基酸序列,但是符合意欲产生酶的宿主生物体的密码子选择;或者所述取代可产生不同的氨基酸序列。关于核苷酸取代的概述,参见,例如,Ford等,1991,ProteinExpression and Purification 2:95-107。
对于本领域技术人员显而易见的是,这些取代能够在对于分子功能重要的区域之外进行,并且仍然产生活性多肽。对于由本发明的分离的多核苷酸编码的多肽活性关键的并且因此优选不进行取代的氨基酸残基,可以根据本领域公知的方法,例如定位诱变或丙氨酸分区诱变法(参见,例如,Cunningham和Wells,1989,见上文)来鉴定。在后一技术中,将突变引入到分子中的每个荷正电的残基处,并且测试所得突变分子的内切葡聚糖酶活性,以鉴定对于所述分子的活性关键的氨基酸残基。底物-酶相互作用的位点也能够通过分析三维结构测定,通过如核磁共振分析、晶体学或光亲和标记这样的技术来测定(参见,例如,de Vos等,1992,见上文;Smith等,1992,见上文;Wlodaver等,1992,见上文)。
本发明还涉及编码本发明多肽的分离的多核苷酸,所述分离的多核苷酸在非常低严紧条件下,优选低严紧条件,更优选中等严紧条件,更优选中-高严紧条件,甚至更优选高严紧条件,并且最优选非常高的严紧条件下,与以下序列杂交:(i)SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9的成熟多肽编码序列,(ii)包含于SEQ ID NO:3或SEQ ID NO:9的成熟多肽编码序列中的cDNA序列或包含SEQ ID NO:5或SEQ ID NO:7的成熟多肽编码序列的基因组DNA序列,或(iii)(i)或(ii)的互补链;或它们的等位变体和亚序列(Sambrook等,1989,见上文),如本文所定义的。在优选的方面,SEQ IDNO:3的所述成熟多肽编码序列是核苷酸67至1185。在另一个优选的方面,SEQ ID NO:5的所述成熟多肽编码序列是核苷酸84至1229。在另一个优选的方面,SEQ ID NO:7的所述成熟多肽编码序列是核苷酸77至1300。在另一个优选的方面,SEQ ID NO:9的所述成熟多肽编码序列是核苷酸73至1768。
本发明还涉及分离的多核苷酸,所述分离的多核苷酸通过以下方法获得:(a)在非常低、低、中、中-高、高或非常高严紧条件下,将DNA的群体与以下序列杂交:(i)SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9的成熟多肽编码序列,(ii)包含于SEQ ID NO:3或SEQ ID NO:9的成熟多肽编码序列中的cDNA序列或包含SEQ ID NO:5或SEQ ID NO:7的成熟多肽编码序列的基因组DNA序列,或(iii)(i)或(ii)的互补链;和(b)分离杂交的多核苷酸,其编码具有内切葡聚糖酶活性的多肽。在优选的方面,SEQ ID NO:3的所述成熟多肽编码序列是核苷酸67至1185。在另一个优选的方面,SEQID NO:5的所述成熟多肽编码序列是核苷酸84至1229。在另一个优选的方面,SEQ ID NO:7的所述成熟多肽编码序列是核苷酸77至1300。在另一个优选的方面,SEQ ID NO:9的所述成熟多肽编码序列是核苷酸73至1768。
核酸构建体
本发明还涉及包含本发明的分离的多核苷酸的核酸构建体,所述分离的多核苷酸与一个或几个调控序列可操作地连接,所述调控序列在合适的宿主细胞中在与该调控序列相容的条件下指导编码序列的表达。
可以用许多方式操作编码本发明多肽的分离的多核苷酸以提供多肽的表达。依赖于表达载体,在将多核苷酸的序列插入载体之前对其进行操作可能是理想的或必需的。使用重组DNA方法修饰多核苷酸序列的技术是本领域熟知的。
调控序列可以是适当的启动子序列,其是由用于表达编码本发明多肽的多核苷酸的宿主细胞识别的核苷酸序列。启动子序列含有介导多肽的表达的转录调控序列。启动子可以是在所选的宿主细胞中显示转录活性的任何核苷酸序列,包括突变的、截断的和杂合的启动子,并且可以从编码与宿主细胞同源或异源的胞外或胞内多肽的基因获得。
用于指导本发明的核酸构建体转录,特别是在细菌宿主细胞中转录的合适启动子的实例是从下述获得的启动子:大肠杆菌lac操纵子、天蓝色链霉菌(Streptomyces coelicolor)琼脂糖酶基因(dagA)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌α-淀粉酶基因(amyL)、嗜热脂肪芽孢杆菌产麦芽淀粉酶基因(amyM)、解淀粉芽孢杆菌α-淀粉酶基因(amyQ)、地衣芽孢杆菌青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因和原核β-内酰胺酶基因(Villa-Kamaroff等,1978,Proceedings of the National Academy of Sciences USA75:3727-3731),以及tac启动子(DeBoer等,1983,Proceedings of the NationalAcademy of Sciences USA 80:21-25)。另外的启动子在"Useful proteins fromrccombinant bacteria"于Scientific American,1980,242:74-94中;和在Sambrook等,1989,见上文中描述。
用于指导本发明的核酸构建体在丝状真菌宿主细胞中转录的合适启动子的实例是从下列酶的基因获得的启动子:米曲霉TAKA淀粉酶、曼赫根毛霉(Rhizomucor miehei)天冬氨酸蛋白酶、黑曲霉中性α-淀粉酶、黑曲霉酸稳定性α-淀粉酶、黑曲霉或泡盛曲霉葡糖淀粉酶(glaA)、曼赫根毛霉脂肪酶、米曲霉碱性蛋白酶、米曲霉丙糖磷酸异构酶、构巢曲霉乙酰胺酶、镶片镰孢淀粉葡糖苷酶(WO 00/56900)、镶片镰孢Daria(WO 00/56900)、镶片镰孢Quinn(WO00/56900)、尖镰孢胰蛋白酶样蛋白酶(WO 96/00787)、里氏木霉β-葡糖苷酶、里氏木霉纤维二糖水解酶I、里氏木霉纤维二糖水解酶II、里氏木霉内切葡聚糖酶I、里氏木霉内切葡聚糖酶II、里氏木霉内切葡聚糖酶III、里氏木霉内切葡聚糖酶IV、里氏木霉内切葡聚糖酶V、里氏木霉木聚糖酶I、里氏木霉木聚糖酶II、里氏木霉β-木糖苷酶,以及NA2-tpi启动子(来自黑曲霉中性α-淀粉酶基因和米曲霉丙糖磷酸异构酶基因的启动子的杂合体);和它们的突变的、截断的和杂合的启动子。
在酵母宿主中,有用的启动子从如下酶的基因获得:酿酒酵母烯醇化酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH1,ADH2/GAP)、酿酒酵母丙糖磷酸异构酶(TPI)、酿酒酵母金属硫蛋白(CUP1)和酿酒酵母3-磷酸甘油酸激酶。对于酵母宿主细胞其它有用的启动子由Romanos等,1992,Yeast 8:423-488描述。
调控序列也可以是合适的转录终止子序列,是由宿主细胞识别以终止转录的序列。所述终止子序列与编码所述多肽的核苷酸序列的3’末端可操作地连接。可以将在所选宿主细胞中有功能的任何终止子用在本发明中。
对于丝状真菌宿主细胞优选的终止子从如下酶的基因获得:米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、黑曲霉α-葡糖苷酶和尖镰孢胰蛋白酶样蛋白酶。
对于酵母宿主细胞优选的终止子从如下酶的基因获得:酿酒酵母烯醇化酶、酿酒酵母细胞色素C(CYC1)和酿酒酵母甘油醛-3-磷酸脱氢酶。对于酵母宿主细胞其它有用的终止子由Romanos等,1992,见上文描述。
调控序列还可以是合适的前导序列,其是对于宿主细胞的翻译重要的mRNA非翻译区。前导序列可操作地连接于编码多肽的核苷酸序列的5’-末端。可以将在所选宿主细胞中有功能的任何前导序列用在本发明中。
对于丝状真菌宿主细胞优选的前导序列从如下酶的基因获得:米曲霉TAKA淀粉酶和构巢曲霉丙糖磷酸异构酶。
对于酵母宿主细胞合适的前导序列从如下酶的基因获得:酿酒酵母烯醇化酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α因子和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)。
调控序列也可以是聚腺苷酸化序列,其是与核苷酸序列的3’末端可操作地连接的序列,并且在转录时,宿主细胞将其识别为信号以将聚腺苷残基添加至转录的mRNA。可以将在所选宿主细胞中有功能的任何聚腺苷酸化序列在本发明中使用。
对于丝状真菌宿主细胞优选的聚腺苷酸化序列从如下酶的基因获得:米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖镰孢胰蛋白酶样蛋白酶和黑曲霉α-葡糖苷酶。
对于酵母宿主细胞有用的聚腺苷酸化序列由Guo和Sherman,1995,Molecular Cellular Biology 15:5983-5990描述。
调控序列还可以是信号肽编码区,其编码与多肽的氨基末端相连的氨基酸序列,并且指导编码的多肽进入细胞分泌途径。核苷酸序列的编码序列5’端可固有地包含信号肽编码区,其与编码分泌多肽的编码区片段一起天然地连接在翻译阅读框中。可供选择的是,编码序列5’端可含有对于所述编码序列异源的信号肽编码区。异源信号肽编码区在编码序列不天然地含有信号肽编码区时可为必需的。或者,外源信号肽编码区可以简单地取代天然信号肽编码区以增强多肽的分泌。然而,指导表达的多肽进入所选宿主细胞的分泌途径(即,分泌至培养基中)的任何信号肽编码区可在本发明中使用。
对于细菌宿主细胞有效的信号肽编码区是从如下酶的基因获得的信号肽编码区:芽孢杆菌属NCIB 11837产麦芽糖淀粉酶、嗜热脂肪芽孢杆菌α-淀粉酶、地衣芽孢杆菌枯草蛋白酶(subtilisin)、地衣芽孢杆菌β-内酰胺酶、嗜热脂肪芽孢杆菌中性蛋白酶(nprT,nprS,nprM)和枯草芽孢杆菌prsA。另外的信号肽由Simonen和Palva,1993,Microbiological Reviews 57:109-137描述。
对于丝状真菌宿主细胞有效的信号肽编码区是从如下酶的基因获得的信号肽编码区:米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、曼赫根毛霉天冬氨酸蛋白酶、特异腐质霉纤维素酶、特异腐质霉内切葡聚糖酶V和疏棉状腐质霉脂肪酶。
对于酵母宿主细胞有用的信号肽从酿酒酵母α因子和酿酒酵母转化酶的基因获得。其它有用的信号肽编码区由Romanos等,1992,见上文描述。
在优选的方面,信号肽包含SEQ ID NO:4的氨基酸1至16,或者由SEQID NO:4的氨基酸1至16组成。在另一个优选方面,信号肽编码区是SEQ IDNO:3的核苷酸19至69。
在另一个优选方面,信号肽包含SEQ ID NO:6的氨基酸1至15,或者由SEQ ID NO:6的氨基酸1至15组成。在另一个优选方面,信号肽编码区包含SEQ ID NO:5的核苷酸39至83,或者由SEQ ID NO:5的核苷酸39至83组成。
在另一个优选方面,信号肽包含SEQ ID NO:8的氨基酸1至21,或者由SEQ ID NO:8的氨基酸1至21组成。在另一个优选方面,信号肽编码区包含SEQ ID NO:7的核苷酸14至76,或者由SEQ ID NO:7的核苷酸14至76组成。
在另一个优选方面,信号肽包含SEQ ID NO:10的氨基酸1至16,或者由SEQ ID NO:10的氨基酸1至16组成。在另一个优选方面,信号肽编码区包含SEQ ID NO:9的核苷酸1至48,或者由SEQ ID NO:9的核苷酸1至48组成。
调控序列还可以是前肽编码区,其编码位于多肽氨基末端的氨基酸序列。所得多肽称为酶原(proenzyme)或前多肽(propolypeptide)(或在某些情况下称为酶原(zymogen))。前多肽通常是无活性的并且能够通过前肽的催化或自催化切割从前多肽转化为成熟活性多肽。可以从枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、酿酒酵母α因子、曼赫根毛霉天冬氨酸蛋白酶和嗜热毁丝霉漆酶(WO 95/33836)的基因获得前肽编码区。
在优选的方面,前肽包含SEQ ID NO:10的氨基酸17至24,或者由SEQID NO:10的氨基酸17至24组成。在另一个优选方面,前肽编码区包含SEQID NO:9的核苷酸49至72,或者由SEQ ID NO:9的核苷酸49至72组成。
当信号肽和前肽区二者均出现在多肽的氨基末端时,将前肽区置于紧接着(next to)多肽氨基末端,并且将信号肽区置于紧接着前肽区的氨基末端。
同样理想的是添加调节序列,其允许相对于宿主细胞的生长来调节多肽的表达。调节系统的实例是引起基因表达响应化学或物理刺激物,包括调节化合物的存在而开启或关闭的那些系统。原核系统中的调节系统包括lac、tac和trp操纵基因系统。在酵母中,可以使用ADH2系统或GAL1系统。在丝状真菌中,可以使用TAKA α-淀粉酶启动子、黑曲霉葡糖淀粉酶启动子和米曲霉葡糖淀粉酶启动子作为调节序列。调节序列的其它实例是那些允许基因扩增的序列。在真核系统中,这些序列包括在氨甲蝶呤(methotrexate)存在下扩增的二氢叶酸还原酶基因,和以重金属(with heavy metal)扩增的金属硫蛋白基因。在这些情况下,编码多肽的核苷酸序列将与调节序列可操作地连接。
表达载体
本发明还涉及重组表达载体,所述重组表达载体包含本发明的多核苷酸、启动子和转录和翻译终止信号。本文所述的多种核酸和调控序列可以结合在一起以产生重组表达载体,所述表达载体可以包括一个或几个方便的限制位点以允许在这些位点插入或取代编码多肽的核苷酸序列。可供选择的是,可以通过在适当的用于表达的载体中插入包含所述序列的核苷酸序列或核酸构建体来表达本发明的核苷酸序列。在制备表达载体的过程中,将编码序列置于载体中,从而将该编码序列与适当的表达调控序列可操作地连接。
重组表达载体可以是任何载体(例如,质粒或病毒),其能够方便地进行重组DNA步骤,并且能够产生核苷酸序列的表达。载体的选择将通常依赖于载体与将引入该载体的宿主细胞的相容性。载体可以是线状或闭合环状质粒。
载体可以是自主复制载体,即,作为染色体外实体(entity)存在的载体,其复制独立于染色体复制,例如,质粒、染色体外元件、微型染色体(minichromosome)或人工染色体。载体可以含有任何用于确保自复制的手段(means)。或者,载体可以是一种当被引入宿主细胞中时,整合到基因组中并且与整合了该载体的染色体一起复制的载体。此外,可以使用单独的载体或质粒或两个或更多个载体或质粒,其共同含有待引入宿主细胞基因组的完整DNA(total DNA),或可以使用转座子(transposon)。
本发明的载体优选地含有一个或几个选择性标记,其允许简单选择经转化、转染、转导等的细胞。选择性标记是基因,其产物提供杀生物剂或病毒抗性、对重金属的抗性、对营养缺陷型的原养性(prototrophy to auxotrophs)等。
细菌选择性标记的实例是来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因,或赋予抗生素抗性的标记,所述抗生素抗性例如氨苄青霉素、卡那霉素、氯霉素或四环素抗性。对于酵母宿主细胞合适的标记是ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。用于丝状真菌宿主细胞的选择性标记包括但不限于amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(草铵膦(phosphinothricin)乙酰转移酶)、hph(潮霉素磷酸转移酶)、niaD(硝酸还原酶)(nitrate reductase)、pyrG(乳清酸核苷-5’-磷酸脱羧酶)(orotidine-5’-phosphatedccarboxylase)、sC(硫酸腺苷酰转移酶)和trpC(邻氨基苯甲酸合酶(anthranilatesynthase))以及它们的等价物。优选用在曲霉属细胞中的是构巢曲霉或米曲霉的amdS和pyrG基因和吸水链霉菌(Streptomyces hygroscopicus)的bar基因。
本发明的载体优选含有元件,其允许载体整合入宿主细胞基因组或载体在细胞中独立于基因组的自主复制。
为了整合入宿主细胞基因组,载体可依赖编码多肽的多核苷酸的序列或用于通过同源或非同源重组整合入基因组的任何其它载体元件。或者,载体可以含有额外的核苷酸序列,用于指导通过同源重组整合入宿主细胞基因组染色体中的精确位置。为了增加在精确位置整合的可能性,整合元件应优选含有足够数量的核酸,如100至10,000碱基对,优选400至10,000碱基对,并且最优选800至10,000碱基对,其与相应的目标序列具有高度同一性以增强同源重组的概率。整合元件可以是任何序列,其与宿主细胞基因组中的目标序列同源。此外,整合元件可以是非编码或编码的核苷酸序列。另一方面,可以将载体通过非同源重组整合到宿主细胞的基因组中。
为了自主复制,载体可以进一步包含复制起点,其使载体能够在所述的宿主细胞中自主地复制。复制起点可以是介导自主复制的任何质粒复制子(replicator),其在细胞中发挥功能。术语“复制起点”或“质粒复制子”在本文定义为能够使质粒或载体体内复制的核苷酸序列。
细菌复制起点的实例是允许在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177和pACYC184的复制起点,和允许在芽孢杆菌属中复制的质粒pUB110、pE194、pTA1060和pAMβ1的复制起点。
用于酵母宿主细胞中的复制起点的实例是2微米复制起点,ARS1,ARS4,ARS1和CEN3的组合,和ARS4和CEN6的组合。
在丝状真菌细胞中有用的复制起点的实例是AMA1和ANS1(Gems等,1991,Gene 98:61-67;Cullen等,1987,Nucleic Acids Research 15:9163-9175;WO 00/24883)。分离AMA1基因和构建包含该基因的质粒或载体能够根据公开于WO 00/24883中的方法完成。
可以将多于一个拷贝的本发明的多核苷酸插入宿主细胞以增加基因产物的产生。多核苷酸拷贝数的增加可通过如下方法获得:将至少一个额外拷贝的序列整合入宿主细胞基因组,或将可扩增的选择性标记基因包括于多核苷酸,其中可通过在合适的选择剂(selectable agent)存在下培养细胞来选择含有选择性标记基因的扩增拷贝的细胞,和由此得到多核苷酸的额外拷贝。
用于连接上述元件以构建本发明的重组表达载体的方法是本领域技术人员熟知的(参见,例如,Sambrook等,1989,见上文)。
宿主细胞
宿主细胞可以是在本发明的多肽的重组产生中有用的任何细胞,例如,原核或真核细胞。
原核宿主细胞可以是任何革兰氏阳性细菌或革兰氏阴性细菌。革兰氏阳性细菌包括但不限于,芽孢杆菌属、链球菌属、链霉菌属、葡萄球菌属、肠球菌属、乳酸菌属、乳球菌属、梭菌属、Geobacillus和Oceanobacillus。革兰氏阴性细菌包括但不限于,大肠杆菌、假单胞菌属、沙门氏菌属、弯曲杆菌属、螺杆菌属、黄杆菌属、梭杆菌属、泥杆菌属、奈瑟氏菌属和脲原体属。
细菌宿主细胞可以是任何芽孢杆菌属细胞。在本发明的实施中有用的芽孢杆菌属细胞包括但不限于,嗜碱芽孢杆菌、解淀粉芽孢杆菌、短芽孢杆菌、环状芽孢杆菌、克劳氏芽孢杆菌、凝结芽孢杆菌、坚强芽孢杆菌、灿烂芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、巨大芽孢杆菌、短小芽孢杆菌、嗜热脂肪芽孢杆菌、枯草芽孢杆菌和苏云金芽孢杆菌细胞。
在优选的方面,细菌宿主细胞是解淀粉芽孢杆菌、迟缓芽孢杆菌、地衣芽孢杆菌、嗜热脂肪芽孢杆菌或枯草芽孢杆菌细胞。在更优选的方面,细菌宿主细胞是解淀粉芽孢杆菌细胞。在另一个更优选的方面,细菌宿主细胞是克劳氏芽孢杆菌细胞。在另一个更优选的方面,细菌宿主细胞是地衣芽孢杆菌细胞。在另一个更优选的方面,细菌宿主细胞是枯草芽孢杆菌细胞。
细菌宿主细胞还可以是任何链球菌细胞。在本发明的实施中有用的链球菌细胞包括但不限于,似马链球菌、酿脓链球菌、乳房链球菌和马链球菌兽瘟亚种。
在优选的方面,细菌宿主细胞是似马链球菌细胞。在另一个优选的方面,细菌宿主细胞是酿脓链球菌细胞。在另一个优选的方面,细菌宿主细胞是乳房链球菌细胞。在另一个优选的方面,细菌宿主细胞是马链球菌兽瘟亚种细胞。
细菌宿主细胞还可以是任何链霉菌细胞。在本发明的实施中有用的链霉菌细胞包括但不限于,不产色链霉菌、阿维链霉菌、天蓝链霉菌、灰色链霉菌和浅青紫链霉菌。
在优选的方面,细菌宿主细胞是不产色链霉菌细胞。在另一个优选的方面,细菌宿主细胞是阿维链霉菌细胞。在另一个优选的方面,细菌宿主细胞是天蓝链霉菌细胞。在另一个优选的方面,细菌宿主细胞是灰色链霉菌细胞。在另一个优选的方面,细菌宿主细胞是浅青紫链霉菌细胞。
可通过如下方法实现将DNA引入到芽孢杆菌属细胞:例如原生质体转化(参见,例如,Chang和Cohen,1979,Molecular General Genetics 168:111-115),使用感受态细胞(参见,例如,Young和Spizizen,1961,Journal of Bacteriology81:823-829或Dubnau和Davidoff-Abelson,1971,Journal of Molecular Biology56:209-221),电穿孔(参见,例如,Shigekawa和Dower,1988,Biotechniques 6:742-751)或接合(参见,例如,Koehler和Thorne,1987,Journal of Bacteriology169:5771-5278)。可通过如下方法实现将DNA引入到大肠杆菌细胞:例如原生质体转化(参见,例如,Hanahan,1983,J.Mol.Biol.166:557-580)或电穿孔(参见,例如,Dower等,1988,Nucleic Acids Res.16:6127-6145)。可通过如下方法实现将DNA引入到链霉菌细胞:例如原生质体转化和电穿孔(参见,例如,Gong等,2004,Folia Microbiol.(Praha)49:399-405),接合(参见,例如,Mazodier等,1989,J.Bacteriol.171:3583-3585),或转导(参见,例如,Burke等,2001,Proc.Natl.Acad.Sci.USA 98:6289-6294)。可通过如下方法实现将DNA引入到假单胞菌细胞:例如电穿孔(参见,例如,Choi等,2006,J.Microbiol.Methods 64:391-397)或接合(参见,例如,Pinedo和Smets,2005,Appl.Environ.Microbiol.71:51-57)。可通过如下方法实现将DNA引入到链球菌细胞:例如天然感受态(natural competence)(参见,例如,Perry和Kuramitsu,1981,Infect.Immun.32:1295-1297),原生质体转化(参见,例如,Catt和Jollick,1991,Microbios.68:189-2070),电穿孔(参见,例如,Buckley等,1999,Appl.Environ.Microbiol.65:3800-3804)或接合(参见,例如,Clewell,1981,Microbiol.Rev.45:409-436)。然而,可以使用任何已知的将DNA引入宿主细胞的方法。
宿主细胞还可以是真核生物,如哺乳动物、昆虫、植物或真菌细胞。
在优选的方面,宿主细胞是真菌细胞。“真菌”用在本文包括以下门:子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)和接合菌门(Zygomycota)(如由Hawksworth等,于Ainsworth and Bisby’sDictionary of The Fungi,8th edition,1995,CAB International,University Press,Cambridge,UK中所定义)以及卵菌门(Oomycota)(如Hawksworth等,1995,见上,171页中所引用),和所有有丝分裂孢子真菌(mitosporic fungi)(Hawksworth等,1995,见上)。
在更优选的方面,真菌宿主细胞是酵母细胞。“酵母”用在本文包括产子囊酵母(ascosporogenous yeast)(内孢霉目(Endomycetales))、产担子酵母(basidiosporogenous yeast)和属于半知菌类(Fungi Imperfecti)(芽孢纲(Blastomycetes))的酵母。由于酵母的分类在未来可能改变,就本发明而言,将酵母定义为如Biology and Activities of Yeast(Skinner,F.A.,Passmore,S.M.,和Davenport,R.R.,eds,Soc.App.Bacteriol.Symposium Series No.9,1980)中所述。
在甚至更加优选的方面,酵母宿主细胞是念珠菌属、汉逊酵母属(Hansenula)、克鲁维酵母属、毕赤酵母属、酵母属、裂殖酵母属或西洋蓍霉属细胞。
在最优选的方面,酵母宿主细胞是卡尔酵母、酿酒酵母、糖化酵母、道格拉氏酵母、克鲁弗酵母、诺地酵母或卵形酵母细胞。在另一个最优选的方面,酵母宿主细胞是乳酸克鲁维酵母(Kluyveromyces lactis)细胞。在另一个最优选的方面,酵母宿主细胞是Yarrowia lipolytica细胞。
在另一个更优选的方面,真菌宿主细胞是丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门的亚门(如由Hawksworth等,1995,见上文,所定义)的所有丝状形式。丝状真菌通常的特征在于由壳多糖(chitin)、纤维素、葡聚糖、壳聚糖(chitosan)、甘露聚糖和其它复杂多糖组成的菌丝体壁。通过菌丝延伸进行营养生长,而碳分解代谢是专性需氧的。相反,酵母例如酿酒酵母的营养生长通过单细胞菌体的出芽生殖(budding)进行,而碳分解代谢可以是发酵的。
在甚至更优选的方面,丝状真菌宿主细胞是枝顶孢霉属、曲霉属、短梗霉属、烟管霉属(Bjerkandera)、Ceriporiopsis、金孢子菌属、鬼伞属(Coprinus)、革盖菌属(Coriolus)、隐球菌属、Filibasidium、镰孢属、腐质霉属、梨孢菌属、毛霉属、毁丝霉属、新考玛脂霉属、脉孢菌属、拟青霉属、青霉属、平革菌属(Phanerochaete)、射脉菌属(Phlebia)、瘤胃壶菌属、侧耳属(Pleurotus)、裂褶菌属、踝节菌属、嗜热子囊菌属、梭孢壳属、弯颈霉属、栓菌属(Trametes)或木霉属细胞。
在最优选的方面,丝状真菌宿主细胞是泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉或米曲霉细胞。在另一个最优选方面,丝状真菌宿主细胞是杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、拟分枝孢镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢或镶片镰孢细胞。在另一个最优选的方面,丝状真菌宿主细胞是黑刺烟管菌(Bjerkanderaadusta)、Ceriporiopsis aneirina、Ceriporiopsis aneirina、Ceriporiopsis caregiea、Ceriporiopsis gilvescens、Ceriporiopsis pannocinta、Ceriporiopsis rivulosa、Ceriporiopsis subrufa、Ceriporiopsis subvermispora、嗜角质金孢子菌、Chrysosporium lucknowense、热带金孢子菌、Chrysosporium merdarium、Chrysosporium inops、毡金孢子菌、Chrysosporium queenslandicum、Chrysosporium zonatum、灰盖鬼伞(Coprinus cinereus)、毛革盖菌(Coriolushirsutus)、特异腐质霉、疏棉状腐质霉、米黑毛霉、嗜热毁丝霉、粗糙脉孢菌、巴西青霉、产紫青霉、黄孢平革菌(Phanerochaete chrysosporium)、辐射射脉菌(Phlebia radiata)、Pleurotus eryngii、土生梭孢霉、Trametes villosa、Trametesversicolor、哈茨木霉、康宁木霉、长枝木霉、里氏木霉或绿色木霉细胞。
可以将真菌细胞通过涉及原生质体形成、原生质体转化和细胞壁重建的方法以本身公知的方式转化。用于转化曲霉属和木霉属宿主细胞的合适方法在EP 238 023和Yelton等,1984,Proceedings of the National Academy ofSciences USA 81:1470-1474中描述。用于转化镰孢属菌种的合适方法由Malardier等,1989,Gene 78:147-156和WO 96/00787描述。可以使用由如下文献描述的方法转化酵母:Becker和Guarente,于Abelson,J.N.和Simon,M.I.(编者),Guide to Yeast Genetics and Molecular Biology,Methods inEnzymology,Volume 194,pp 182-187,Academic Press,Inc.,New York;Ito等,1983,Journal of Bacteriology 153:163;和Hinnen等,1978,Proceedings of theNational Academy of Sciences USA 75:1920。
产生方法
本发明还涉及用于产生本发明多肽的方法,其包括:(a)在有益于产生多肽的条件下培养细胞,所述细胞以其野生型形式能够产生所述多肽;和(b)回收所述多肽。在优选的方面,所述细胞是毁丝霉属的细胞。在更优选的方面,所述细胞是嗜热毁丝霉。在最优选的方面,所述细胞是嗜热毁丝霉CBS117.65。在另一个优选的方面,细胞是担子菌CBS 494.95。在另一个优选的方面,细胞是担子菌CBS 495.95。在另一个优选的方面,细胞是青霉属的。在另一个更优选的方面,细胞是巴西青霉。在另一个最优选的方面,细胞是巴西青霉IBT 20888。
本发明还涉及用于产生本发明的多肽的方法,其包括:(a)在有益于产生多肽的条件下培养宿主细胞;和(b)回收所述多肽。
本发明还涉及用于产生本发明的多肽的方法,包括:(a)在有益于产生多肽的条件下培养宿主细胞,其中所述宿主细胞包含突变核苷酸序列,其在SEQID NO:3、SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9的成熟多肽编码序列中具有至少一个突变,其中所述突变核苷酸序列编码多肽,该多肽包含SEQID NO:4、SEQ ID NO:6、SEQ ID NO:8或SEQ ID NO:10的成熟多肽或由SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8或SEQ ID NO:10的成熟多肽组成,和(b)回收所述多肽。
在优选的方面,SEQ ID NO:4的成熟多肽是氨基酸17至389。在另一个优选的方面,SEQ ID NO:6的成熟多肽是氨基酸16至397。在另一个优选的方面,SEQ ID NO:8的成熟多肽是氨基酸22至429。在另一个优选的方面,SEQ ID NO:10的成熟多肽是氨基酸25至421。在另一个优选的方面,成熟多肽编码序列是SEQ ID NO:3的核苷酸67至1185。在另一个优选的方面,成熟多肽编码序列是SEQ ID NO:5的核苷酸84至1229。在另一个优选的方面,成熟多肽编码序列是SEQ ID NO:7的核苷酸77至1300。在另一个优选的方面,成熟多肽编码序列是SEQ ID NO:9的核苷酸73至1468。
在本发明的产生方法中,使用本领域熟知的方法在适合于产生所述多肽的营养培养基中培养细胞。例如,可以通过在合适培养基中和允许表达和/或分离所述多肽的条件下进行的摇瓶培养,和实验室或工业发酵罐中的小规模或大规模发酵(包括连续、分批、补料分批或固态发酵)来培养细胞。使用本领域已知的方法在合适的营养培养基中进行培养,所述营养培养基包含碳源和氮源和无机盐。合适的培养基能够从商业供应商获得或可以根据公开的组成制备(例如,在美国典型培养物保藏中心的目录中)。如果多肽分泌到营养培养基中,该多肽能够从所述培养基中直接回收。如果多肽不分泌到培养基中,其能够从细胞裂解物(lysate)回收。
可以使用本领域已知的对于所述多肽是特异性的方法来检测多肽。这些检测方法可包括特异性抗体的使用、酶产物的形成或酶底物的消失。例如,酶试验(enzyme assay)可用于测定如本文所述的多肽的活性。
所得多肽可以使用本领域已知的方法回收。例如,多肽可以通过常规方法从营养培养基中回收,所述常规方法包括但不限于离心、过滤、提取、喷雾干燥、蒸发或沉淀。
本发明的多肽可以通过多种本领域已知的方法纯化以获得基本上纯的多肽,所述方法包括但不限于层析(例如,离子交换、亲和、疏水、层析聚焦和大小排阻)、电泳方法(例如,制备型(preparative)等电聚焦)、差示溶解度(例如,硫酸铵沉淀)、SDS-PAGE或提取(参见,例如,Protein Purification,J.-C.Janson和Lars Ryden,editors,VCH Publishers,New York,1989)。
植物
本发明还涉及植物,例如,转基因植物、植物部分或植物细胞,其包含分离的多核苷酸,所述多核苷酸编码本发明具有内切葡聚糖酶活性的多肽,从而以可回收的量表达和产生所述多肽。多肽可从植物或植物部分回收。或者,同样可以将含有该重组多肽的植物或植物部分用于改进食品或饲料的质量,例如,改进营养价值、适口性(palatability)和流变性质(rheologicalproperties),或用于破坏抗营养因子。
转基因植物可以是双子叶的(双子叶植物)或单子叶的(单子叶植物)。单子叶植物的实例是草(grasses),如草地早熟禾(meadow grass)(蓝草(blue grass),早熟禾属(Poa));饲用牧草(forage grass)如羊茅属(Festuca)、黑麦草属(Lolium);寒地型牧草(temperate grass),如Agrostis(翦股颖属);和谷类,例如,小麦、燕麦、黑麦、大麦、稻(rice)、高粱和玉蜀黍(maize)(玉米)。
双子叶植物的实例是烟草(tobacco),豆类(legumes),如羽扇豆(lupins),马铃薯,糖甜菜(sugar beet),豌豆,豆(bean)和大豆(soybean)和十字花科的(cruciferous)植物(十字花科(family Brassicaceae)),如花椰菜(cauliflower),油菜籽(rape seed)和紧密相关的模型生物体拟南芥(Arabidopsis thaliana)。
植物部分的实例是茎(stem)、愈伤组织(callus)、叶(leaf)、根(root)、果实(fruit)、种子(seed)和块茎(tuber),以及包含这些部分的独立组织,例如,表皮(cpidermis)、叶肉(mesophyll)、薄壁组织(parenchyme)、维管组织(vasculartissue)、分生组织(meristem)。具体的植物细胞区室(compartments),如叶绿体(chloroplast)、质外体(apoplast)、线粒体(mitochondria)、液泡(vacuole)、过氧化物酶体(peroxisome)和细胞质(cytoplasm)也被认为是植物部分。此外,任何植物细胞,无论什么组织来源,都被认为是植物部分。同样地,植物部分,如分离以促进本发明的应用的具体组织和细胞也被认为是植物部分,例如胚(cmbryo)、胚乳(endosperm)、糊粉(aleurone)和种皮(seed coat)。
同样包含于本发明范围内的还有这些植物、植物部分和植物细胞的子代。
表达本发明多肽的转基因植物或植物细胞可以依照本领域已知方法构建。简而言之,通过如下方法构建所述植物或植物细胞:将编码本发明多肽的一个或几个表达构建体并入植物宿主基因组或叶绿体基因组,并且将所得的修饰植物或植物细胞繁殖为转基因植物或植物细胞。
表达载体便利地是包含编码本发明多肽的多核苷酸的核酸构建体,所述多核苷酸与在选择的植物或植物部分中表达该多核苷酸序列所需的适当的调节序列可操作地连接。此外,表达构建体可以包含对于鉴定宿主细胞有用的选择性标记,在所述宿主细胞中整合了表达构建体和将该构建体引入到所述植物中所必需的DNA序列(后者依赖于使用的DNA引入方法)。
调节序列的选择,例如启动子和终止子序列和任选地信号或转运序列的选择,举例来说,基于期望何时、何处以及如何表达多肽而确定。例如,编码本发明多肽的基因的表达可以是组成型的或诱导型的,或可以是发育、阶段或组织特异性的,并且基因产物可以靶向特定的组织或植物部分例如种子或叶。调节序列由例如Tague等,1988,Plant Physiology 86:506所述。
对于组成性表达,可以使用35S-CaMV、玉米泛素1和稻肌动蛋白1启动子(Franck等,1980,Cell 21:285-294,Christensen等,1992,Plant Mo.Biol.18:675-689;Zhang等,1991,Plant Cell 3:1155-1165)。器官特异性启动子可以是例如来自贮藏库组织(storage sink tissue)例如种子、马铃薯块茎和果实的启动子(Edwards & Coruzzi,1990,Ann.Rev.Genet.24:275-303),或来自代谢库组织(metabolic sink tissue)例如分生组织的启动子(Ito等,1994,Plant Mol.Biol.24:863-878),种子特异性启动子诸如来自稻的谷蛋白(glutelin)、醇溶蛋白(prolamin)、球蛋白(globulin)或白蛋白(albumin)启动子(Wu等,1998,Plant andCell Physiology 39:885-889),来自豆球蛋白(legumin)B4和蚕豆(Vicia faba)的未知的种子蛋白基因的蚕豆启动子(Conrad等,1998,Journal of PlantPhysiology 152:708-711)、来自种子油体蛋白(oil body protein)的启动子(Chen等,1998,Plant and Cell Physiology 39:935-941),来自欧洲油菜(Brassica napus)的贮藏蛋白napA启动子,或本技术领域公知的任何其他种子特异性的启动子,例如,在WO 91/14772中所描述的。此外,启动子可为叶特异性的启动子,如来自稻或番茄的rbcs启动子(Kyozuka等,1993,Plant Physiology 102:991-1000),小球藻病毒(chlorella virus)腺嘌呤甲基转移酶(adeninemethyltransferase)基因启动子(Mitra和Higgins,1994,Plant Molecular Biology26:85-93),或来自稻的aldP基因启动子(Kagaya等,1995,Molecular andgeneralgenetics 248:668-674),或伤口诱导的启动子,如马铃薯pin2启动子(Xu等,1993,Plant Molecular Biology 22:573-588)。同样地,所述启动子可通过非生物的处理诱导,所述非生物的处理诸如温度、干旱或盐度变化,或通过外源施加的激活所述启动子的物质诱导,例如乙醇、雌激素(oestrogens)、植物激素(plant hormones)如乙烯、脱落酸(abscisic acid)和赤霉酸(gibberellic acid),和重金属。
启动子增强子元件也可以用于实现本发明多肽在植物中的较高表达。例如,启动子增强子元件可以是内含子,其置于启动子和编码本发明多肽的核苷酸序列之间。例如Xu等,1993,见上,公开了使用稻肌动蛋白1基因的第一内含子以增强表达。
选择性标记基因和表达构建体的任何其它部分可以选自本领域内可用的那些。
将核酸构建体根据本领域已知的常规技术并入植物基因组,所述常规技术包括土壤杆菌属(Agrobacterium)介导的转化、病毒介导的转化、显微注射(microinjection)、粒子轰击、生物射弹转化和电穿孔(Gasser等,1990,Science244:1293;Potrykus,1990,Bio/Technology 8:535;Shimamoto等,1989,Nature338:274)。
目前,根癌土壤杆菌(Agrobacterium tumefaciens)介导的基因转移(genetransfer),是产生转基因双子叶植物的优选方法(为了参考,见Hooykas和Schilperoort,1992,Plant Molecular Biology 19:15-38),而且它也可以用于转化单子叶植物,虽然对于这些植物其他的转化方法是常用的。目前,产生转基因单子叶植物的优选的方法,是用粒子(用转化DNA涂覆的微观的金或钨粒子)轰击胚愈伤组织(embryonic calli)或发育中的胚(developing embryos)(Christou,1992,Plant Journal 2:275-281;Shimamoto,1994,Current OpinionBiotechnology 5:158-162;Vasil等,1992,Bio/Technology 10:667-674)。转化单子叶植物的可供选择的方法是基于原生质体转化,如由Omirulleh等,1993,Plant Molecular Biology 21:415-428所描述的。
转化之后,根据本领域熟知的方法选择具有并入的表达构建体的转化体并且再生成为完整植物。通常设计转化方法用于通过如下方法在再生期间或在后续世代中选择性消除选择基因:例如,使用带有两种独立的T-DNA构建体的共转化或通过特异性重组酶位点特异性地切除选择基因。
本发明还涉及用于产生本发明多肽的方法,其包括:(a)在有益于产生多肽的条件下培养包含多核苷酸的转基因植物或植物细胞,所述多核苷酸编码本发明具有内切葡聚糖酶活性的多肽;和(b)回收所述多肽。
去除或减少内切葡聚糖酶活性
本发明还涉及用于产生亲本细胞突变体的方法,其包括破坏或缺失编码本发明的多肽的多核苷酸序列或其部分,所述方法导致在相同条件下培养时,与亲本细胞相比突变的细胞产生较少的所述多肽。
可以使用本领域熟知的方法通过减少或消除编码本发明多肽的核苷酸序列的表达,所述方法例如,插入、破坏、替代或缺失来构建突变细胞。在优选的方面,所述核苷酸序列是失活的。待修饰或失活的核苷酸序列可以是,例如,编码区或其对活性关键的部分,或表达编码区所需的调节元件。这种调节或调控序列的实例可以是启动子序列或其功能部分,即,足以影响核苷酸序列表达的部分。用于可能的修饰的其它调控序列包括但不限于前导序列、聚腺苷酸化序列、前肽序列、信号肽序列、转录终止子和转录激活子。
可以通过向亲本细胞施以诱变,并且选择其中已将所述核苷酸序列的表达减少或消除的突变细胞来进行核苷酸序列的修饰或失活。诱变可能是特异性的或随机的,可以通过例如使用合适的物理或化学诱变剂进行,通过使用合适的寡核苷酸进行,或通过将所述DNA序列进行PCR产生的诱变。此外,可以通过使用这些诱变剂的任何组合来进行诱变。
适合于本发明目的的物理或化学诱变剂的实例包括紫外线(UV)照射、羟胺、N-甲基-N′-硝基-N-亚硝基胍(MNNG)、O-甲基羟胺、亚硝酸、乙基甲烷磺酸酯(ethyl methane sulphonate)(EMS)、亚硫酸氢钠、甲酸和核苷酸类似物。
当使用这些试剂时,通常通过如下方法来进行所述诱变:在合适条件下存在优选的诱变剂时温育待诱变的亲本细胞,并筛选和/或选择显示基因表达减少的或无基因表达的突变体细胞。
通过导入、取代或去除基因中的一个或几个核苷酸或其转录或翻译所需的调控元件可以实现所述核苷酸序列的修饰或失活。例如,可以插入或去除核苷酸从而导致引入终止密码子,去除起始密码子,或改变开放阅读框。按照本领域已知的方法通过定位诱变或PCR产生的诱变可以实现这种修饰或失活。尽管在理论上所述修饰可以在体内进行,即,直接在表达待修饰核苷酸序列的细胞上进行,但优选如下面所示例的那样在体外进行所述修饰。
消除或减少核苷酸序列通过细胞表达的便利方式的例子是基于基因取代,基因缺失,或基因破坏的技术。例如,在基因破坏方法中,将相应于内源核苷酸序列的核酸序列在体外进行诱变以产生缺陷性的核酸序列,随后将其转化入亲本细胞中以产生缺陷基因。通过同源重组,所述缺陷性核酸序列替代了内源性核苷酸序列。理想的是所述缺陷性核苷酸序列还编码标记,其可用于选择其中核苷酸序列被修饰或破坏的转化子。在特别优选的方面,用可选择的标记(如本文所述的那些)来破坏所述核苷酸序列。
或者,可以使用与所述核苷酸序列互补的序列通过确定的反义或RNAi技术来进行所述核苷酸序列的修饰或失活。更具体地,通过导入与所述基因的核苷酸序列互补的序列可以减少或消除所述核苷酸序列通过细胞的表达,所述序列可以在细胞中转录并且能够与细胞中产生的mRNA杂交。在允许所述互补反义核苷酸序列与mRNA杂交的条件下,由此减少或消除翻译的蛋白质的量。
本发明进一步涉及亲本细胞的突变体细胞,其包含编码多肽的核苷酸序列或其调控序列的破坏或缺失,这导致与亲本细胞相比突变体细胞产生更少的多肽或不产生多肽。
这样生成的多肽缺陷型突变细胞作为表达同源和/或异源多肽的宿主细胞特别有用。所以,本发明进一步涉及生产同源或异源多肽的方法,其包括:(a)在有益于生产多肽的条件下培养突变细胞;和(b)回收所述多肽。术语“异源多肽”在本文中定义为对宿主细胞不是天然的多肽,进行了修饰以改变天然序列的天然蛋白,或作为通过重组DNA技术对宿主细胞操作的结果其表达在量上改变的天然蛋白。
在另一方面,本发明涉及通过发酵可产生本发明的多肽以及目标蛋白产物的细胞来生产基本上无内切葡聚糖酶活性的蛋白质产品的方法:在发酵之前、之中或发酵完成之后向发酵液(fermentation broth)中添加有效量的能够抑制内切葡聚糖酶活性的试剂,从发酵液中回收目标产物,并且任选地将回收的产物进行进一步纯化。
在另一方面,本发明涉及如下生产基本上无内切葡聚糖酶活性的蛋白质产品的方法:在允许产物表达的条件下培养细胞,将得到的培养液进行组合的pH和温度处理以基本上减少内切葡聚糖酶活性,和从发酵液中回收产物。或者,可以将从培养液回收的酶制备物进行组合的pH和温度处理。所述组合的pH和温度处理可任选地与内切葡聚糖酶抑制剂处理组合使用。
依照本发明的这个方面,可能去除至少60%,优选至少75%,更优选至少85%,还更优选至少95%,并且最优选至少99%的内切葡聚糖酶活性。可使用此方法获得内切葡聚糖酶活性的完全去除。
组合的pH和温度处理优选在2-3或10-11范围内的pH和至少75-85℃范围内的温度进行一段足够的时间以达到期望的效果,通常1至3小时是足够的。
用于培养和纯化感兴趣的产物的方法可以通过本领域已知的方法进行。
用于产生基本上无内切葡聚糖酶产物的本发明的方法在真核多肽,特别是真菌蛋白质例如酶的产生中是特别令人有兴趣的。所述酶可以选自,例如,淀粉分解酶(amylolytic enzyme)、脂肪分解酶、蛋白水解酶、纤维素分解酶(cellulolytic enzyme)、氧化还原酶或植物细胞壁降解酶。这些酶的实例包括氨肽酶、淀粉酶、淀粉葡糖苷酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶(chitinase)、角质酶(cutinase)、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、葡糖氧化酶、葡糖苷酶、卤素过氧化酶、半纤维素酶、转化酶、异构酶、漆酶、连接酶、脂肪酶、裂合酶、甘露糖苷酶、氧化酶、果胶分解酶、过氧化物酶、肌醇六磷酸酶、酚氧化酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转移酶、转谷氨酰胺酶或木聚糖酶。内切葡聚糖酶缺陷细胞也可以用于表达在制药上引起兴趣的异源蛋白质例如激素、生长因子、受体等。
可理解的是术语“真核多肽”不仅包括天然多肽,也包括多肽例如酶,其通过氨基酸取代、缺失或添加或其它这样的修饰而被修饰以增强活性、热稳定性、pH耐受性等。
在另外的方面,本发明涉及基本上无内切葡聚糖酶活性的蛋白质产物,其通过本发明的方法产生。
抑制多肽表达的方法
本发明还涉及抑制多肽在细胞中表达的方法,其包括对细胞施用双链RNA(dsRNA)分子或者在细胞中表达双链RNA(dsRNA)分子,其中dsRNA包含本发明多核苷酸的亚序列或部分。在优选的方面,dsRNA长约15、16、17、18、19、20、21、22、23、24、25或更多的双链体核苷酸。在另一个优选的方面,多肽具有内切葡聚糖活性。
dsRNA优选是小干扰RNA(siRNA)或微RNA(miRNA)。在优选的方面,dsRNA是用于抑制转录的小干扰RNA(siRNA)。在另一个优选的方面,dsRNA是用于抑制翻译的微RNA(miRNA)。
本发明还涉及用于抑制细胞中多肽表达的这些双链RNA(dsRNA)分子,其中dsRNA包含编码SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8或SEQ IDNO:10的成熟多肽的多核苷酸的亚序列或部分。本发明不受到任何特定作用机制的限制,dsRNA能进入细胞,并引起相似或相同序列的单链RNA(ssRNA)的降解,所述RNA包括内源mRNA。当细胞接触dsRNA时,来自同源基因的mRNA选择性地受到称为RNA干扰(RNAi)的过程的降解。
本发明的dsRNA可以用于基因沉默疗法。在一个方面,本发明提供使用本发明的dsRNAi选择性地降解RNA的方法。所述过程可以在体外、在活体外(ex vivo)或在体内进行。在一个方面,dsRNA分子能够用于产生细胞、器官或动物中的功能缺失突变(loss-of-function mutation)。制备或使用选择性降解RNA的dsRNA分子的方法在本领域中公知,参见,例如,美国专利号6,506,559;美国专利号6,511,824;美国专利号6,515,109;和美国专利号6,489,127。
组合物
本发明还涉及包含本发明的多肽的组合物。优选地,所述组合物富含这种多肽。术语“富含”表示所述组合物的内切葡聚糖酶活性,例如,以至少1.1的富集因数(enrichment factor)增加。
所述组合物可以包含本发明的多肽作为主要酶成分,例如,单成分组合物。或者,所述组合物可以包含多种酶活性,例如氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、卤素过氧化物酶、转化酶、漆酶、脂肪酶、甘露糖苷酶、氧化酶、果胶分解酶、肽谷氨酰胺酶(peptidoglutaminase)、过氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶或木聚糖酶。额外的酶可以通过例如属于以下属或种的微生物产生:曲霉属,优选棘孢曲霉、泡盛曲霉、烟曲霉、臭曲霉、日本曲霉、构巢曲霉、黑曲霉或米曲霉;镰孢属,优选杆孢状镰孢、禾谷镰孢、库威镰孢、大刀镰孢、禾本科镰孢、禾赤镰孢、异孢镰孢、合欢木镰孢、尖镰孢、多枝镰孢、粉红镰孢、接骨木镰孢、肤色镰孢、硫色镰孢、圆镰孢、拟丝孢镰孢或镶片镰孢;腐质霉属,优选特异腐质霉或疏棉状腐质霉;或木霉属,优选哈茨木霉、康宁木霉、长枝木霉、里氏木霉或绿色木霉。
可以依照本领域内已知的方法制备多肽组合物,并且可以是液体或干组合物的形式。例如,所述多肽组合物可以是颗粒(granulate)或微粒(microgranulate)的形式。可以依照本领域内已知方法将包括于所述组合物中的多肽稳定化。
下面给出的是本发明多肽组合物的优选的用途的实例。本发明的多肽组合物的剂量和使用该组合物的其它条件可以基于本领域内已知的方法确定。
用途
本发明还涉及降解或转化含纤维素物质的方法,其包括:用组合物处理含纤维素物质,所述组合物包含有效量的本发明具有内切葡聚糖酶活性的多肽。在优选方面,所述方法还包括回收已降解或转化的含纤维素物质。
本发明的多肽和宿主细胞可用于单糖、二糖和多糖的生产中,所述糖类作为来自含纤维素生物质的化学或发酵原料用于产生乙醇、塑料或其它产品或中间物。包含具有内切葡聚糖酶活性的多肽的组合物可以是去除或不去除细胞的粗发酵液形式,或是半纯化或纯化的酶制剂形式。组合物还可以包含在处理生物质中有用的其它蛋白质和酶,例如,纤维二糖水解酶、β-葡糖苷酶、半纤维素分解酶、增强剂(WO 2005/074647,WO 2005/074656)等。或者,组合物可以包含本发明的宿主细胞,所述宿主细胞在使用生物质的发酵方法中作为具有内切葡聚糖酶活性的多肽的来源。具体地,本发明的多肽和宿主细胞可以通过部分或全部降解纤维素或半纤维素而增加加工残余物(干燥的蒸馏残渣、酿酒酒糟、甘蔗渣等)的价值。宿主细胞还可以包含编码在生物质加工中有用的上述其它蛋白质和酶的天然或异源基因。
在本发明的方法中,可以使用任何含纤维素物质,如生物质。在本文中可理解的是,术语“含纤维素物质”包括木质纤维素。生物质可以包括但不限于木材资源、城市固体废物、废纸、作物和作物残余物(参见,例如Wiselogel等,1995,在Handbook on Bioethanol(编者Charles E.Wyman)中,第105-118页,Taylor & Francis,Washington D.C.;Wyman,1994,Bioresource Technology 50:3-16;Lynd,1990,Applied Biochemistry and Biotechnology 24/25:695-719;Mosier等,1999,Recent Progress in Bioconversion of Lignocellulosics,在Advances in Biochemical Engineering/Biotechnology中,总编T.Scheper,第65卷,第23-40页,Springer-Verlag,New York)。
生物质初生细胞壁(primary cell wall)中的主要多糖是纤维素,其次最丰富的是半纤维素,而第三是果胶。次生细胞壁(secondary cell wall)在细胞停止生长后产生,其同样含有多糖并通过聚合木质素共价交联至半纤维素而加强。纤维素是脱水纤维二糖的均聚物,并且因此是线性β-(1-4)-D-葡聚糖,而半纤维素包括多种化合物,例如木聚糖、木葡聚糖(xyloglucan)、阿拉伯木聚糖和甘露聚糖,具有系列取代基的复杂分支结构。尽管通常是多形的,存在于植物组织中的纤维素主要作为平行葡聚糖链的不溶晶体基质。半纤维素通常与纤维素以及其它半纤维素以氢键相连,其帮助稳定细胞壁基质。
将三种主要类别的酶用于分解含纤维素生物质:
(1)“内切-1,4-β-葡聚糖酶”或1,4-β-D-葡聚糖-4-葡聚糖水解酶(EC3.2.1.4),其随机作用于可溶和不溶的1,4-β-葡聚糖底物。
(2)“外切-1,4-β-葡聚糖酶”包括1,4-β-D-葡聚糖葡糖水解酶(EC 3.2.1.74),其从1,4-β-D-葡聚糖释放D-葡萄糖并且缓慢水解D-纤维二糖;和纤维二糖水解酶(1,4-β-D-葡聚糖纤维二糖水解酶,EC 3.2.1.91),其从1,4-β-葡聚糖释放D-纤维二糖。
(3)“β-D-葡糖苷酶”或β-D-葡糖苷葡糖水解酶(EC 3.2.1.21),其作用于从纤维二糖和可溶的纤维糊精以及一系列糖苷释放D-葡萄糖单位。
本发明具有内切葡聚糖酶活性的多肽可以与其它纤维素分解蛋白质,例如,外切-1,4-β-D-葡聚糖酶和β-D-葡糖苷酶,一同使用以降解生物质底物的纤维素成分(参见,例如,Brigham等,1995,于Handbook on Bioethanol(编者Charles E.Wyman)中,第119-141页,Taylor & Francis,Washington D.C.;Lee,1997,Journal of Biotechnology 56:1-24)。
外切-1,4-β-D-葡聚糖酶和β-D-葡糖苷酶可以通过本领域已知的任何已知方法产生(参见,例如,Bennett,J.W.和LaSure,L.(编者),More GeneManipulations in Fungi,Academic Press,CA,1991)。
具有内切葡聚糖酶活性的多肽和其它纤维素分解蛋白质的最适量取决于几个因素,其包括但不限于,组分纤维素分解蛋白质的混合物、含纤维素底物、含纤维素底物的浓度、含纤维素底物的预处理、温度、时间、pH和包括发酵生物体(例如,同步糖化和发酵的酵母)。术语“纤维素分解蛋白质”在本文中定义为显示出能够在测试条件下水解或转化或降解纤维素的那些蛋白质或蛋白质的混合物。
在优选的方面,每克含纤维素物质的具有内切葡聚糖酶活性的多肽的量是约0.5至约50mg,优选约0.5至约40mg,更优选约0.5至约25mg,更优选约0.75至约20mg,更优选约0.75至约15mg,甚至更优选约0.5至约10mg,并且最优选约2.5至约10mg每g含纤维素物质。
在另一个优选的方面,每克含纤维素物质的纤维素分解蛋白质的量是约0.5至约50mg,优选约0.5至约40mg,更优选约0.5至约25mg,更优选约0.75至约20mg,更优选约0.75至约15mg,甚至更优选约0.5至约10mg,并且最优选约2.5至约10mg每g含纤维素物质。
在本发明的方法中,组合物可补充一种或几种的其它酶活性,以促进含纤维素物质的降解。优选的其它酶是半纤维素酶、酯酶(例如,脂肪酶、磷脂酶和/或角质酶)、蛋白酶、漆酶、过氧化物酶或它们的混合物。
在本发明的方法中,可以在发酵前或过程中(包括在发酵微生物的繁殖的过程中或之后)加入其它酶。
酶可以源自或获得自任何合适的来源,包括细菌、真菌、酵母或哺乳动物来源。术语“获得”在本文中表示酶可以从自然地产生所述酶作为天然酶的生物体分离。术语“获得”在本文中还表示酶可以在宿主生物体中重组产生,其中重组产生的酶对宿主生物体是天然或外源的,或具有修饰的氨基酸序列,例如,具有缺失的、插入的和/或取代的一个或几个氨基酸,即,突变的重组产生的酶和/或天然氨基酸序列的片段或由本领域已知的核苷酸改组方法产生的酶。天然酶的意义中包含天然变体,而外源酶的意义中包含通过重组获得的变体,如通过定向诱变或改组。
还可以将酶纯化。本文中使用的术语“纯化”包括不含来自其所源自的生物体中其它成分的酶。术语“纯化”还包括不含来自其所获得自的天然生物体的组分的酶。可将酶纯化,仅存在少量的其它蛋白质。表述“其它蛋白质”具体涉及其它酶。本文使用的术语“纯化”还指去除其它组分,特别是存在于本发明的酶的起源细胞中的其它蛋白质,最特别是存在于本发明的酶的起源细胞中的其它酶。酶可为“基本上纯的”,即,不含来自产生所述酶的生物体的其它组分,即,例如,用于重组产生酶的宿主生物体。在优选的方面,酶是至少75%(w/w)纯,优选至少80%纯,更优选至少85%纯,更优选至少90%纯,更优选至少95%纯,更优选至少96%纯,更优选至少97%纯,甚至更优选至少98%纯的,或者最优选至少99%纯。在另一个优选的方面,酶是100%纯的。
本发明使用的酶可以是示于本文所述方法的任何形式,如,例如,含有或者不含细胞的粗发酵液、干粉或颗粒、无粉尘颗粒、液体、稳定化的液体或受保护的酶。颗粒可以通过,例如美国专利号4,106,991和4,661,452中公开的方法产生,或者可任选地通过本领域已知的方法包覆。可以,例如,根据已确立的方法通过加入稳定剂(如糖、糖醇或另一种多羟基化合物(polyol),和/或乳酸或另一种有机酸)将液体酶制剂稳定化。受保护的酶可以根据EP238,216中公开的方法制备。
可以使用本发明的方法将含纤维素物质处理成为很多有用的有机产品、化学品和燃料。除乙醇外,一些可以由纤维素产生的用品和专门化学品包括木糖、丙酮、乙酸、甘氨酸、赖氨酸、有机酸(例如,乳酸)、1,3-丙二醇、丁二醇、甘油、乙二醇、糠醛、多羟基链烷酸(polyhydroxyalkanoates)、顺式、顺式-粘康酸和动物饲料(Lynd,L.R.,Wyman,C.E.,和Gerngross,T.U.,1999,Biocommodity Engineering,Biotechnol.Prog.,15:777-793;Philippidis,G.P.,1996,Cellulose bioconversion technology,于Handbook on Bioethanol:Production and Utilization中,Wyman,C.E.,编,Taylor & Francis,Washington,DC,179-212;及Ryu,D.D.Y.,和Mandels,M.,1980,Cellulases:biosynthesis andapplications,Enz.Microb.Technol.,2:91-102)。可能的共生产有助于扩展从可发酵糖合成的多种有机产物的范围。生物处理后残留的富含木质素的残余物可以转化成木质素衍生的化学品,或者用于产生能量。
根据本发明的方法处理含纤维素物质使用的常规方法为本领域那些技术人员充分理解。可以使用任何常规生物质处理设备来实施本发明的方法,所述设备设定为根据本发明操作。
这种设备可以包括批式搅拌反应器、具有超滤的连续流搅拌反应器、连续活塞流柱式反应器(Gusakov,A.V.,和Sinitsyn,A.P.,1985,Kinetics of thecnzymatic hydrolysis of cellulose:1.A mathematical model for a batch reactorprocess,Enz.Microb.Technol.7:346-352)、研磨反应器(Ryu,S.K.,和Lee,J.M.,1983,Bioconversion of waste cellulose by using an attrition bioreactor,Biotechnol.Bioeng.25:53-65),或者具有由电磁场引起的强烈搅拌的反应器(Gusakov,A.V.,Sinitsyn,A.P.,Davydkin,I.Y.,Davydkin,V.Y.,Protas,O.V.,1996,Enhancement of enzymatic cellulose hydrolysis using a novel type of bioreactorwith intensive stirring induced by electromagnetic field,Appl.Biochem.Biotechnol.56:141-153)。
常规方法包括但不限于,糖化、发酵、分离的水解和发酵(SHF)、同步糖化和发酵(SSF)、同步糖化和共发酵(SSCF)、混合的水解和发酵(HHF),和直接微生物转化(DMC)。
SHF使用分离的处理步骤,首先将纤维素用酶水解为葡萄糖,然后将葡萄糖发酵成为乙醇。在SSF中,纤维素的酶水解和葡萄糖到乙醇的发酵组合在一个步骤中(Philippidis,G.P.,1996,Cellulose bioconversion technology,inHandbook on Bioethanol:Production and Utilization,Wyman,C.E.,ed.,Taylor& Francis,Washington,DC,179-212)。SSCF包括多种糖的共发酵(Sheehan,J.,和Himmel,M.,1999,Enzymes,energy and the environment:A strategicperspective on the U.S.Department of Energy’s research and developmentactivities for bioethanol,Biotechnol.Prog.15:817-827)。HHF包括在同一个反应器但不同的温度进行的两个分开的步骤,即,高温酶糖化,然后在发酵菌株能够耐受的较低温度进行SSF。DMC在一个步骤中组合了所有三个过程(纤维素酶产生、纤维素水解和发酵)(Lynd,L.R.,Weimer,P.J.,van Zyl,W.H.,和Pretorius,I.S.,2002,Microbial cellulose utilization:Fundamentals andbiotechnology,Microbiol.Mol.Biol.Reviews 66:506-577)。
“发酵”或“发酵过程”指任何发酵过程或包含发酵步骤的任何过程。发酵过程无限制地包括,用于产生发酵产品的发酵过程,所述发酵产品包括醇(例如,阿拉伯醇、丁醇、乙醇、甘油、甲醇、1,3-丙二醇、山梨醇和木糖醇);有机酸(例如,乙酸、丙酮酸、己二酸、抗坏血酸、柠檬酸、2,5-二酮-D-葡萄糖酸、蚁酸、反丁烯二酸、葡萄糖二酸、葡糖酸、葡糖醛酸、戊二酸、3-羟基丙酸、衣康酸、乳酸、苹果酸、丙二酸、草酸、丙酸、丁二酸和木质酸);酮(例如,丙酮);氨基酸(例如,天冬氨酸、谷氨酸、甘氨酸、赖氨酸、丝氨酸和苏氨酸);气体(例如,甲烷、氢气(H2)、二氧化碳(CO2)和一氧化碳(CO))。发酵过程还包括在消费品醇工业(例如,啤酒和酒)、乳制品业(例如,发酵乳制品)、皮革业和烟草业中使用的发酵过程。
本发明进一步涉及产生物质的方法,其包括:(a)用组合物糖化含纤维素物质,所述组合物包含有效量的具有内切葡聚糖酶活性的多肽;(b)用一种或几种(more)的发酵微生物发酵步骤(a)的糖化的含纤维素物质;和(c)从发酵回收物质。包含具有内切葡聚糖酶活性的多肽的组合物可以是去除或不去除细胞的粗发酵液的形式,或者是半纯化或纯化的酶制剂形式,或者组合物可以包含本发明的宿主细胞,作为具有生物质的发酵过程中有内切葡聚糖酶活性的多肽的来源。
物质可以是任何源自发酵的物质。在优选的实施方案中,物质是醇。可理解的是,术语“醇”包括包含一个或几个羟基基团的物质。在更优选的实施方案中,所述醇是阿拉伯醇。在另一个更优选的实施方案中,所述醇是丁醇。在另一个更优选的实施方案中,所述醇是乙醇。在另一个更优选的实施方案中,所述醇是甘油。在另一个更优选的实施方案中,所述醇是甲醇。在另一个更优选的实施方案中,所述醇是1,3-丙二醇。在另一个更优选的实施方案中,所述醇是山梨醇。在另一个更优选的实施方案中,所述醇是木糖醇。参见,例如,Gong,C.S.,Cao,N.J.,Du,J.,和Tsao,G.T.,1999,Ethanolproduction from renewable resources,in Advances in BiochemicalEngineering/Biotechnology,Scheper,T.,ed.,Springer-Verlag Berlin Heidelberg,Germany,65:207-241;Silveira,M.M.,和Jonas,R.,2002,The biotechnologicalproduction of sorbitol,Appl.Microbiol.Biotechnol.59:400-408;Nigam,P.,和Singh,D.,1995,Processes for fermentative production of xylitol-a sugarsubstitute,Process Biochemistry 30(2):117-124;Ezeji,T.C.,Qureshi,N.和Blaschek,H.P.,2003,Production of acetone,butanol and ethanol by Clostridiumbeijerinckii BA101 and in situ recovery by gas stripping,World Journal ofMicrobiology and Biotechnology 19(6):595-603。
在另一个优选的实施方案中,所述物质是有机酸。在另一个更优选的实施方案中,所述有机酸是乙酸。在另一个更优选的实施方案中,所述有机酸是丙酮酸。在另一个更优选的实施方案中,所述有机酸是己二酸。在另一个更优选的实施方案中,所述有机酸是抗坏血酸。在另一个更优选的实施方案中,所述有机酸是柠檬酸。在另一个更优选的实施方案中,所述有机酸是2,5-二酮-D-葡糖酸。在另一个更优选的实施方案中,所述有机酸是蚁酸。在另一个更优选的实施方案中,所述有机酸是反丁烯二酸。在另一个更优选的实施方案中,所述有机酸是葡萄糖二酸。在另一个更优选的实施方案中,所述有机酸是葡糖酸。在另一个更优选的实施方案中,所述有机酸是葡糖醛酸。在另一个更优选的实施方案中,所述有机酸是戊二酸。在另一个优选的实施方案中,所述有机酸是3-羟基丙酸。在另一个更优选的实施方案中,所述有机酸是衣康酸。在另一个更优选的实施方案中,所述有机酸是乳酸。在另一个更优选的实施方案中,所述有机酸是苹果酸。在另一个更优选的实施方案中,所述有机酸是丙二酸。在另一个更优选的实施方案中,所述有机酸是草酸。在另一个更优选的实施方案中,所述有机酸是丙酸。在另一个更优选的实施方案中,所述有机酸是丁二酸。在另一个更优选的实施方案中,所述有机酸是木质酸。参见,例如,Chen,R.,和Lee,Y.Y.,1997,Membrane-mediatedextractive fermentation for lactic acid production from cellulosic biomass,Appl.Biochem.Biotechnol.63-65:435-448。
在另一个优选的实施方案中,所述物质是酮。可理解的是术语“酮”包括含有一个或几个酮基的物质。在另一个更优选的方面,所述酮是丙酮。参见,例如,Qureshi和Blaschek,2003,见上文。
在另一个优选的实施方案中,所述物质是氨基酸。在另一个更优选的实施方案中,所述有机酸是天冬氨酸。在另一个更优选的实施方案中,所述氨基酸是谷氨酸。在另一个更优选的实施方案中,所述氨基酸是甘氨酸。在另一个更优选的实施方案中,所述氨基酸是赖氨酸。在另一个更优选的实施方案中,所述氨基酸是丝氨酸。在另一个更优选的实施方案中,所述氨基酸是苏氨酸。参见,例如,Richard,A.,和Margaritis,A.,2004,Empirical modeling ofbatch fermentation kinetics for poly(glutamic acid)production and other microbialbiopolymers,Biotechnology and Bioengineering 87(4):501-515。
在另一个优选的实施方案中,所述物质是气体。在另一个更优选的实施方案中,所述气体是甲烷。在另一个更优选的实施方案中,所述气体是H2。在另一个更优选的实施方案中,所述气体是CO2。在另一个更优选的实施方案中,所述气体是CO。参见,例如,Kataoka,N.,A.Miya,和K.Kiriyama,1997,Studies on hydrogen production by continuous culture system ofhydrogen-producing anaerobic bacteria,Water Science and Technology 36(6-7):41-47;和Gunaseelan V.N.in Biomass and Bioenergy,Vol.13(1-2),pp.83-114,1997,Anaerobic digestion of biomass for methane production:A review。
从含纤维素物质产生物质通常需要四个主要步骤。这四个步骤是预处理、酶水解、发酵和回收。下面示例的是产生乙醇的过程,但可理解的是,可以使用相似的过程产生其它物质,例如,上述物质。
预处理。在预处理或预水解步骤中,将含纤维素物质加热以分解木质素和碳水化合物结构,溶解大部分半纤维素,并使纤维素分解酶能够到达纤维素部分。加热或者直接用蒸汽进行,或者在浆料中进行,可以向物质加入催化剂以加速反应的进行。催化剂包括强酸,如硫酸和SO2,或碱,如氢氧化钠。预处理阶段的目的是促进酶和微生物的渗透。含纤维素生物质还可以经过热蒸汽喷发的预处理(参见美国专利申请号20020164730)。
糖化。在酶水解步骤中,所述步骤也称作糖化,将本文所述酶加入预处理的物质中,将纤维素部分转化成葡萄糖和/或其它糖。糖化通常在搅拌釜反应器或发酵罐中,在控制pH、温度和混合条件下进行。糖化步骤可以持续长达200小时。糖化可以在约30℃至约65℃,特别是约50℃的温度,和在约4-约5,尤其是约pH4.5的pH进行。为了产生能由酵母代谢的葡萄糖,通常在存在β-葡糖苷酶时进行水解。
发酵。在发酵步骤中,作为预处理和酶水解步骤的结果从含纤维素物质释放的糖,通过发酵生物体(如酵母)发酵成为乙醇。发酵还可与酶水解在同一个容器中,同样在控制pH、温度和混合条件下同时进行。当糖化和发酵在同一个容器中同时进行时,过程通常称作同步的糖化和发酵或SSF。
在本发明的发酵过程中可以使用任何合适的含纤维素底物或原材料。通常根据理想的发酵产品(即,要从发酵获得的物质)和使用的方法来选择底物,如本领域中所公知。适用于本发明的方法中的底物的实例包括含纤维素物质,如木材或植物残渣或获得自能够由发酵微生物代谢的经处理的含纤维素物质的低分子量糖DP1-3,所述物质可以通过直接向发酵培养基中加入而提供。
术语“发酵培养基”可理解为指加入发酵微生物之前的培养基,如,由糖化过程产生的培养基,以及同步的糖化和发酵过程(SSF)中使用的培养基。
“发酵微生物”指适用于理想的发酵过程中的任何微生物。根据本发明的合适的发酵微生物能将糖(如葡萄糖、木糖、阿拉伯糖、甘露糖、半乳糖或寡糖)直接或间接地发酵(即,转化)成理想的发酵产品。发酵微生物的实例包括真菌生物体,如酵母。优选的酵母包括酵母属菌种,且具体为酿酒酵母。商业上可得到的酵母包括,例如Red Star
Figure A200780018204D0060174310QIETU
/TM/Lesaffre Ethanol Red(可从RedStar/Lesaffre,USA获得)、FALI(可从Fleischmann’s Yeast,Burns Philp Food Inc.,USA的部门获得)、SUPERSTART(可从Alltech获得)、GERT STRAND(可从Gert Strand AB,Sweden获得)和FERMIOL(可从DSM Specialties获得)。
在优选的实施方案中,所述酵母是酵母属。在更优选的实施方案中,所述酵母是酿酒酵母。在另一个更优选的实施方案中,所述酵母是糖化酵母(Saccharomyces distaticus)。在另一个更优选的实施方案中,所述酵母是Saccharomyces uvarum。在另一个优选的实施方案中,所述酵母是克鲁维酵母。在另一个更优选的实施方案中,所述酵母是Kluyveromyces marxianus。在另一个更优选的实施方案中,所述酵母是Kluyveromyces fragilis。在另一个优选的实施方案中,所述酵母是念珠菌属。在另一个更优选的实施方案中,所述酵母是假热带念珠菌(Candida pseudotropicalis)。在另一个更优选的实施方案中,所述酵母是Candida brassicae。在另一个优选的实施方案中,所述酵母是Clavispora。在另一个更优选的实施方案中,所述酵母是Clavisporalusitaniae。在另一个更优选的实施方案中,所述酵母是Clavispora opuntiae。在另一个优选的实施方案中,所述酵母是管囊酵母属(Pachysolen)。在另一个更优选的实施方案中,所述酵母是管囊酵母(Pachysolen tannophilus)。在另一个优选的实施方案中,所述酵母是酒香酵母属(Bretannomyces)。在另一个更优选的实施方案中,所述酵母是克劳森酒香酵母(Bretannomyces clausenii)(Philippidis,G.P.,1996,Cellulose bioconversion technology,in Handbook onBioethanol:Production and Utilization,Wyman,C.E.,ed.,Taylor & Francis,Washington,DC,179-212)。
可以有效地将葡萄糖发酵成乙醇的细菌包括,例如,运动发酵单胞菌(Zymomonas mobilis)和热纤维梭菌(Clostridium thermocellum)(Philippidis,1996,见上文)。
在本领域中公知上述生物体还能用于产生其它物质,如本文所述。
在酿酒酵母(Chen,Z.,Ho,N.W.Y.,1993,Cloning and improving theexpress ion of Pichia stipitis xylose reductase gene in Saccharomyces cerevisiae,Appl.Biochem.Biotechnol.39-40:135-147;Ho,N.W.Y.,Chen,Z,Brainard,A.P.,1998,Genetically engineered Saccharomyces yeast capable of effectivelycofermenting glucose and xylose,Appl.Environ.Microbiol.64:1852-1859)或细菌如大肠杆菌(Beall,D.S.,Ohta,K.,Ingram,L.O.,1991,Parametric studies ofethanol production from xylose and other sugars by recombinant Escherichia coli,Biotech.Bioeng.38:296-303)、产酸克雷伯氏菌(Klebsiella oxytoca)(Ingram,L.O.,Gomes,P.F.,Lai,X.,Moniruzzaman,M.,Wood,B.E.,Yomano,L.P.,York,S.W.,1998,Metabolic engineering of bacteria for ethanol production,Biotechnol.Bioeng.58:204-214)和运动发酵单胞菌(Zhang,M.,Eddy,C.,Deanda,K.,Finkelstein,M.,和Picataggio,S.,1995,Metabolic engineering of a pentosemetabolism pathway in ethanologenic Zymomonas mobilis,Science 267:240-243;Deanda,K.,Zhang,M.,Eddy,C.,和Picataggio,S.,1996,Development of anarabinose-fermenting Zymomonas mobilis strain by metabolic pathwayengineering,Appl.Environ.Microbiol.62:4465-4470)中克隆异源基因导致构建能将己糖和戊糖转化成乙醇(共发酵)的生物体。
通常向降解的纤维素或水解产物中加入酵母或另一种微生物,进行约24至96小时的发酵,如约35至约60小时。温度通常在约26℃-约40℃,特别是约32℃,并在约pH 3至约pH 6,特别是约pH 4-5进行。
在优选的实施方案中,将酵母或另一种微生物施用于降解的纤维素或水解产物,发酵进行约24至约96小时,如通常35-60小时。在优选的实施方案中,温度通常在约26至约40℃之间,特别是约32℃,而pH通常在约pH 3至约pH 6,优选约pH 4-5。优选以大约105至1012,优选大约107至1010,特别是大约5×107活菌数每ml发酵液的量加入酵母或另一种微生物。在乙醇产生过程阶段中,酵母细胞计数应该优选在大约107至1010,尤其是约2×108的范围中。关于使用酵母进行发酵的其它指导可见于例如“The AlcoholTextbook”(Editors K.Jacques,T.P.Lyons和D.R.Kelsall,Nottingham UniversityPress,United Kingdom 1999)中,所述文献通过引用并入本文。
本领域最广泛使用的方法是同步的糖化和发酵(SSF)方法,其中没有糖化的保留阶段,意味着酵母和酶一起添加。
对于乙醇产生,在发酵后蒸馏醪(mash)以提取乙醇。根据本发明的方法获得的乙醇可以用作,例如燃料乙醇;饮料乙醇,即,中性饮料酒,或工业乙醇。
发酵刺激剂可以与本文所述的任何酶过程结合使用,以进一步改进发酵过程,而且特定地,改进发酵微生物的性能,如,速率增加和乙醇得率。“发酵刺激剂”指用于发酵微生物(特别是酵母)生长的刺激剂。优选的用于生长的发酵刺激剂包括维生素和矿物质。维生素的实例包括多种维生素、生物素、泛酸、烟酸、内消旋肌醇(meso-inositol)、硫胺、维生素B6(pyridoxine)、对氨基苯甲酸、叶酸、核黄素和维生素A、B、C、D和E。参见,例如,Alfenore等,Improving ethanol production and viability of Saccharomyces cerevisiae by avitamin feeding strategy during fed-batch process,Springer-Verlag(2002),其通过引用并入本文。矿物质的实例包括能够提供营养的矿物质和矿物质盐,所述营养包括P、K、Mg、S、Ca、Fe、Zn、Mn和Cu。
回收从发酵的含纤维素物质中分离醇,并通过蒸馏的常规方法纯化。能够获得纯度高达约96vol.%的乙醇,其可以用作,例如,燃料乙醇、饮料乙醇(即,中性饮料酒)或工业乙醇。
对于其它物质,可以使用本领域已知的任何方法,所述方法包括但不限于层析(例如,离子交换、亲和、疏水、层析聚焦和大小排阻)、电泳方法(例如,制备型等电聚焦)、差示溶解度(例如,硫酸铵沉淀)、SDS-PAGE、蒸馏或提取。
在本发明的方法中,可以向具有内切葡聚糖酶活性的多肽和其它纤维素分解蛋白质补充一种或几种其它酶活性,以改进含纤维素物质的降解。优选的其它酶是半纤维素酶、酯酶(例如,脂肪酶、磷脂酶和/或角质酶)、蛋白酶、漆酶、过氧化物酶,或它们的混合物。
在本发明的方法中,可以在发酵前或发酵过程中(包括在繁殖发酵微生物的过程中或之后)加入其它酶。
前肽和信号肽
本发明还涉及核酸构建体,所述核酸构建体包含编码蛋白质的基因,该基因与第一核苷酸序列和第二核苷酸序列中的一个或两个可操作地连接,其中第一核苷酸序列编码信号肽,所述信号肽包含SEQ ID NO:4的氨基酸1至16、SEQ ID NO:6的氨基酸1至15、SEQ ID NO:8的氨基酸1至21,或SEQID NO:10的氨基酸1至16;或由SEQ ID NO:4的氨基酸1至16、SEQ ID NO:6的氨基酸1至15、SEQ ID NO:8的氨基酸1至21,或SEQ ID NO:10的氨基酸1至16组成;而第二核苷酸序列编码前肽,所述前肽包含SEQ ID NO:10的氨基酸17至24或由SEQ ID NO:10的氨基酸17至24组成,其中基因对于第一个和第二核苷酸序列是外源的。
在优选的方面,第一核苷酸序列包含SEQ ID NO:3的核苷酸19至69,或者由SEQ ID NO:3的核苷酸19至69组成。在另一个优选的方面,第一核苷酸序列包含SEQ ID NO:5的核苷酸39至83,或者由SEQ ID NO:5的核苷酸39至83组成。在另一个优选的方面,第一核苷酸序列包含SEQ ID NO:7的核苷酸14至76,或者由SEQ ID NO:7的核苷酸14至76组成。在另一个优选的方面,第一核苷酸序列包含SEQ ID NO:9的核苷酸1至48,或者由SEQ ID NO:9的核苷酸1至48组成。在另一个优选的方面,第二核苷酸序列包含SEQ ID NO:9的核苷酸49至72,或者由SEQ ID NO:9的核苷酸49至72组成。
本发明还涉及包含这种核酸构建体的重组表达载体和重组宿主细胞。
本发明还涉及用于产生蛋白质的方法,包括:(a)在适合于产生所述蛋白质的条件下培养这样的重组细胞;和(b)回收所述蛋白质。
所述蛋白质对于宿主细胞可以是天然的或异源的。术语“蛋白质”在本文的意思不是指特定长度的编码产物,并且因此包含肽、寡肽和蛋白质。术语“蛋白质”还包含组合以形成编码产物的两种或两种以上多肽。所述蛋白质还包括杂合多肽,其包含部分或全部多肽序列的组合,所述多肽序列从至少两种不同的蛋白质获得,其中一个或几个对于宿主细胞可以是异源或天然的。蛋白质进一步包括上述蛋白质和杂合蛋白质天然存在的等位基因变异和工程的变异。
优选蛋白质是激素或其变体、酶、受体或其部分、抗体或其部分,或报告蛋白(reporter)。在更优选的方面,所述蛋白质是氧化还原酶、转移酶、水解酶、裂合酶(lyase)、异构酶或连接酶。在更加优选的方面,所述蛋白质是氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、转化酶、漆酶、另外的脂肪酶、甘露糖苷酶、变位酶(mutanase)、氧化酶、果胶分解酶、过氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶或木聚糖酶。
基因可以从任何原核、真核或其它来源获得。
通过以下实施例进一步对本发明进行描述,但不应将其理解为对本发明范围的限制。
实施例
材料
作为缓冲液和底物使用的化学品是至少试剂等级的商业产品。
菌株
将嗜热毁丝霉CBS 117.65、担子菌CBS 494.95、担子菌CBS 495.95和巴西青霉菌株IBT 20888(IBT真菌保藏中心,丹麦科技大学,哥本哈根,丹麦)用作内切葡聚糖酶基因的来源。将酿酒酵母菌株W3124(MATa;ura 3-52;leu2-3,112;his 3-D200;pep 4-1137;prc1::HIS3;prb1::LEU2;cir+)用于筛选嗜热毁丝霉CBS 117.65的内切葡聚糖酶活性表达库。米曲霉HowB104(α-淀粉酶阴性)用于表达cel5a基因。
培养基和溶液
LB培养基由如下物质组成:每升10g胰蛋白胨、5g酵母提取物和5g氯化钠。
LB氨苄青霉素培养基由如下物质组成:每升10g胰蛋白胨、5g酵母提取物、5g氯化钠和每毫升50μg氨苄青霉素(过滤器灭菌,高压灭菌后加入)。
LB氨苄青霉素平板由如下物质组成:每升LB氨苄青霉素培养基和15g细菌用琼脂(Bacto Agar)。
YPD培养基由如下物质组成:1%酵母提取物、2%蛋白胨和高压灭菌后加入的过滤灭菌的2%葡萄糖。
YPM培养基由如下物质组成:1%酵母提取物、2%蛋白胨和高压灭菌后加入的过滤灭菌的2%麦芽糖糊精。
含有半乳糖的SC-URA培养基由如下物质组成:每升100ml 10×Basal盐、28ml 20%不含维生素的酪蛋白氨基酸、10ml 1%色氨酸、3.6ml 5%苏氨酸(过滤灭菌,高压灭菌后加入),和100ml 20%半乳糖(过滤灭菌,高压灭菌后加入)。
含有葡萄糖的SC-URA培养基由如下物质组成:每升100ml 10×Basal盐溶液、28ml 20%不含维生素的酪蛋白氨基酸、10ml 1%色氨酸、3.6ml 5%苏氨酸(过滤灭菌,高压灭菌后加入),和100ml 20%葡萄糖(过滤灭菌,高压灭菌后加入)。
10×Basal盐溶液由下述物质组成:每升75g酵母氮碱基(yeast nitrogenbase)、113g丁二酸和68g NaOH。
SC-琼脂由下述物质组成:每升SC-URA培养基(如上所述含有葡萄糖或半乳糖)和20g琼脂。
含有半乳糖的0.1% AZCL HE纤维素SC琼脂平板由下述物质组成:每升含有半乳糖的SC-URA培养基,20g琼脂和0.1% AZCL HE纤维素(Megazyme,Wicklow,Ireland)。
BA培养基由下述物质组成:每升10g玉米浆干物质、10g NH4NO3、10g KH2PO4、0.75g MgSO4-7H2O、0.1ml普卢兰尼克(pluronic)和0.5g CaCO3。高压灭菌前将pH调至6.5。
COVE平板由下述物质组成:每升342.3g蔗糖、25g Noble琼脂、20mlCOVE盐溶液、10mM乙酰胺和20mM CsCl。高压灭菌前将溶液调至pH7.0。
COVE盐溶液由下述物质组成:每升26g KCl、26g MgSO4·7H2O、76gKH2PO4和50ml COVE痕量金属。
Cove痕量金属溶液由如下物质组成:每升0.04g Na2B4O7·10H2O、0.4gCuSO4·5H2O、1.2g FeSO4·7H2O、0.7g MnSO4·H2O、0.8g Na2MoO2·2H2O和10g ZnSO4·7H2O。
TE由10mMTris pH 7.4和0.1mM EDTA组成。
实施例1:酿酒酵母中嗜热毁丝霉CBS 117.65 cDNA表达文库的构建
将嗜热毁丝霉CBS 117.65在200ml BA培养基中,在30℃、200rpm培养5天。通过经衬以MiraclothTM(CalBiochem,San Diego,CA,USA)的漏斗过滤内容物,来收获来自所述摇瓶培养物的菌丝体。然后将菌丝体夹在两片MiraclothTM中间,并用吸水纸巾吸干。然后将菌丝体团转移至Falcon 1059塑料离心管并在液氮中冷冻。将冷冻的菌丝体保存于-80℃冰箱中直至使用。
用硫氰酸胍进行总RNA提取,然后通过5.7M CsCl缓冲(cushion)超速离心,并使用WO 94/14953中所述的方法,通过oligo(dT)-纤维素亲和层析来进行poly(A)+RNA的分离。
通过RNase H方法(Gubler和Hoffman,1983,Gene 25:263-269,Sambrook等,1989,Molecular cloning:A laboratory manual,Cold Spring Harbor lab.,ColdSpring Harbor,NY,USA)从5μg poly(A)+RNA合成双链cDNA。在预先硅化、不含RNase的Eppendorf管中,将poly(A)+RNA(5μg于5μl DEPC(0.1%焦碳酸二乙酯(diethylpyrocarbonate))处理过的水中)在70℃加热8分钟,在冰上冷淬,并与反转录酶缓冲液混合,终体积为50μl,所述反转录酶缓冲液由下述物质组成:50mM Tris-HCl,pH 8.3,75mM KCl,3mM MgCl2,10mM二硫苏糖醇(DTT)(Bethesda Research Laboratories,Bethesda,MD,USA),1mMdATP、dGTP和dTTP,和0.5mM 5-甲基-dCTP(Pharmacia,Uppsala,Sweden),40单位的人胎盘核糖核酸酶抑制剂(RNasin,Promega,Madison,WI,USA),1.45μg oligo(dT)18-Not I引物(Pharmacia),和1000单位的SuperScript II RNaseH反转录酶(Bethesda Research Laboratories)。通过在45℃将反应混合物温育1小时而合成第一链cDNA。合成后,根据制造商的说明书,通过MicroSpinS-400HR旋转柱(Pharmacia)将mRNA:cDNA杂合混合物凝胶过滤。
凝胶过滤后,在250μl第二链缓冲液(20mM Tris-HCl,pH 7.4,90mM KCl,4.6mM MgCl2,10mM(NH4)2SO4,0.16mM NAD)中稀释杂合物,所述缓冲液包含200μM每种dNTP,60单位大肠杆菌DNA聚合酶(Pharmacia),5.25单位RNase H(Promega),和15单位大肠杆菌DNA连接酶(Boehringer Mannheim,Manheim,Germany)。通过将反应管在16℃温育2小时和在25℃再温育15分钟,进行第二链cDNA合成。通过加入EDTA至终浓度20mM而终止反应,然后进行苯酚和氯仿提取。
通过加入2体积96%乙醇和0.2体积10M乙酸铵,在-20℃将双链cDNA沉淀20小时,然后13,000×g离心,用70%乙醇清洗,干燥,并在30μl绿豆(Mung bean)核酸酶缓冲液(30mM乙酸钠pH 4.6,300mM NaCl,1mMZnSO4,0.35mM DTT,2%甘油)中重悬,所述缓冲液包含25单位绿豆核酸酶(Pharmacia)。通过在30℃将反应物温育30分钟,使单链发夹DNA形成发夹结构(clip),然后加入70μl 10mM Tris-HCl-1mM EDTA pH 7.5,酚提取,并用2体积96%乙醇和0.1体积3M乙酸钠pH 5.2在冰上沉淀30分钟。
通过在13,000×g离心回收双链cDNA,并通过将反应混合物在16℃温育1小时,在30μl T4 DNA聚合酶缓冲液(20mM Tris-乙酸,pH 7.9,10mM乙酸镁,50mM乙酸钾,1mM DTT)中将cDNA平端化,所述缓冲液中包含0.5mM每种dNTP和5单位T4DNA聚合酶(New England Biolabs,Ipswich,MA,USA)。通过加入EDTA至终浓度20mM而终止反应,然后进行苯酚和氯仿提取,并通过加入2体积96%乙醇和0.1体积3M乙酸钠pH 5.2,在-20℃沉淀12小时。
填充反应后,通过在13,000×g离心而回收cDNA,在70%乙醇中清洗,并干燥。将cDNA沉淀重悬于25μl包含下面所示2.5μg非-回文Bst XI衔接头(Invitrogen,Carlsbad,CA,USA)和30单位T4连接酶(Promega)的连接缓冲液(30mM Tris-HCl,pH 7.8,10mM MgCl2,10mM DTT,0.5mM ATP)中,然后在16℃温育12小时。通过在65℃加热20分钟而终止反应,然后在冰上冷却5分钟。
5′-CTTTCCAGCACA-3′(SEQ ID NO:1)
3′-GAAAGGTC-5′(SEQ ID NO:2)
将连接的cDNA用Not I消化,然后在37℃温育2.5小时。通过在65℃加热10分钟而终止反应。通过在44mM Tris碱、44mM硼酸、0.5mM EDTA(TBE)缓冲液中的0.8% SeqPlaque GTG低熔点琼脂凝胶(Cambrex Corporation,East Rutherford,NJ,USA)上进行凝胶电泳而将cDNA按大小分级,从而分离未连接的衔接头。用0.7kb为截止点选择cDNA的大小,并根据制造商的说明书,通过使用β-琼脂糖(New England Biolabs,Ipswich,MA,USA)将cDNA从凝胶中回收(rescue),并通过加入2体积96%乙醇和0.1体积3M乙酸钠pH5.2,在-20℃沉淀12小时。
通过在13,000×g离心而回收定向的大小经过选择的cDNA,在70%乙醇中清洗,干燥,然后重悬于30μl 10mM Tris-HCl-1mM EDTA pH 7.5中。根据制造商的说明书,通过MicroSpin S-300HR旋转柱,用凝胶过滤将cDNA脱盐。在10μl连接缓冲液(30mM Tris-HCl,pH 7.8,10mM MgCl2,10mM DTT,0.5mM ATP)中进行三个测试连接,所述缓冲液包含5μl双链cDNA(反应管#1和#2)、15单位的T4连接酶(Promega)和30ng(管#1)、40ng(管#2)和40ng(管#3,载体背景对照)的经Bst XI-Not I切割的pYES2.0载体(Invitrogen,Carlsbad,CA,USA)。通过在16℃温育12小时而进行连接反应,然后在70℃加热20分钟,最后向每管中加入10μl水。如Sambrook等,1989,见上文所述,将1μl每个连接混合物电穿孔入40μl大肠杆菌DH10B电感受态细胞(Bethesda Research Laboratories)中。
在由汇集物(pool)组成的大肠杆菌DH10B中建立嗜热毁丝霉CBS 117.65cDNA文库。通过下述制备汇集物:将转化的大肠杆菌涂布于LB氨苄青霉素平板上,在37℃温育24小时后,得率为15,000-30,000菌落/平板。向平板加入20ml LB氨苄青霉素培养基,并将细胞悬浮于其中。在50ml管中,在100rpm、37℃将细胞悬浮液振荡1小时。
得到的嗜热毁丝霉CBS 117.65 cDNA文库由约106个单独克隆组成,载体背景占1%。根据制造商的说明书,使用Plasmid Midi Kit(QIAGEN Inc.,Valencia,CA,USA)分离来自一些文库汇集物的质粒DNA,并在-20℃保存。
实施例2:筛选嗜热毁丝霉CBS 117.65表达文库的内切葡聚糖酶活性
将来自一些文库汇集物的纯化的质粒DNA(100ng/ml)的1ml等分试样(实施例1)通过电穿孔(Becker和Guarante,1991,Methods Enzymol.194:182-187)转化入酿酒酵母W3124,将转化子涂布到包含2%葡萄糖的SC琼脂上,并在30℃温育。总体地,从每个汇集物中获得包含250-400个酵母克隆的50-100个平板。
在3-5天温育后,将SC琼脂平板影印到含有半乳糖的一组0.1% AZCLHE纤维素SC URA琼脂平板上。在30℃温育平板2-4天,并将被蓝色晕圈环绕的菌落鉴定为内切葡聚糖酶阳性的克隆。
实施例3:表征嗜热毁丝霉CBS 117.65 cel5a基因
将表达内切葡聚糖酶的酵母菌落接种到50ml玻璃试管中的20ml YPD培养基中。在30℃、200rpm,将试管振荡培养2天。在具有75002252转子(Hanau,Germany)的Heraeus Megafuge 1.0R离心机中,通过3000rpm离心10分钟收获细胞。
根据WO 94/14953分离DNA,并将DNA溶于50μl去离子水中。根据Sambrook等,1989,见上文,使用标准程序将DNA转化到大肠杆菌DH10B细胞中。随后将显示出包含嗜热毁丝霉CBS 117.65 cel5a基因的大肠杆菌转化子命名为pCIC161(图1),并用作生物材料保藏的材料。将大肠杆菌菌株pCIC161于2006年2月23日保藏为大肠杆菌NRRL B-30902。
根据Sambrook等,1989,见上文,使用标准程序从大肠杆菌转化子中分离质粒DNA。根据制造商的说明书,用Taq DyeDeoxy Terminator CycleSequencing Kit(Perkin Elmer,Wellesley,MA,USA),用Applied Biosystems ABIPRISMTM 377 DNA Sequencer(ABI,Foster City,CA,USA)和合成的寡核苷酸引物,将来自嗜热毁丝霉CBS 117.65的cel5a基因的全长cDNA序列测序。
嗜热毁丝霉cel5a基因的核苷酸序列(SEQ ID NO:3)和推导的氨基酸序列(SEQ ID NO:4)示于图2中。编码序列1170bp,其中包括终止密码子。编码的预计蛋白质包含389个氨基酸。基因的编码区域的%G+C是63.6%,而成熟多肽编码区域的%G+C是63.6%。使用第三版的SignalP程序(Nielsen等,1997,Protein Engineering 10:1-6)预测了16个残基的信号肽。预测的成熟蛋白质包含373个氨基酸,分子量为40.9kDa。
用Interproscan程序(Zdobnov和Apweiler,2001,Bioinformatics 17:847-848)分析cel5a基因的推导的氨基酸序列,显示CEL5A蛋白质包含家族5糖基水解酶的核心序列类型,从约氨基酸残基77延伸至预测的成熟多肽的残基350。CEL5A蛋白质还包含I型真菌纤维素结合域(CBMI)的序列标记。这个称为Prosite型PS00562(Sigrist等,2002,Brief Bioinform.3:265-274)的序列标记存在于预测的成熟多肽的氨基酸残基8至残基35。
使用Needleman-Wunsch算法(Needleman和Wunsch,1970,J.Mol.Biol.48:443-453)如在具有缺口开放罚分10、缺口延伸罚分0.5和EBLOSUM62矩阵EMBOSS的Needle软件中所实施的,来确定氨基酸序列的比较配对全局比对(comparative pairwise global alignment)。比对显示,编码CEL5A成熟多肽的嗜热毁丝霉基因的推导氨基酸序列与来自粗糙脉孢菌和特异腐质霉的两个家族5糖基水解酶蛋白的推导氨基酸序列(登录号分别为Q7SDR1和Q12624)分别具有75%和72%的同一性(缺口除外)。
实施例4:在米曲霉中表达嗜热毁丝霉CBS 117.65 cel5a基因
使用Hind III和XbaI,将嗜热毁丝霉CBS 117.65 cel5a基因从pYES2.0载体上切下,使用标准方法(Sambrook等,,见上文)连接到曲霉属表达载体pHD414(EP 238 023,WO 93/11249)中。曲霉属表达载体pHD414是p775(EP238023)的衍生物。得到的质粒命名为pA2C161(图3)。
如WO 95/02043所述制备米曲霉HowB104的原生质体。将一百微升原生质体悬浮液与10μl STC中的5-25μg曲霉属表达载体pA2C161混合,所述STC由1.2M山梨醇、10mM Tris-HCl,pH 7.5、10mM CaCl2组成;进一步与5-25μg携带构巢曲霉amdS基因的质粒p3SR2混合(Christensen等,1988,Bio/Technology 6:1419-1422)。将混合物在室温放置25分钟。加入两百微升60% PEG 4000(BDH,Poole,England)(聚乙二醇,分子量4000)、10mM CaCl2,和10mM Tris-HCl pH 7.5,温和混合,最后加入0.85ml同样的溶液并温和混合。将混合物在室温放置25分钟,以2,500×g离心15分钟,并将沉淀重悬于2ml 1.2M山梨醇中。重复沉淀过程,并将原生质体涂布于COVE平板上。在37℃温育4-7天后,挑选孢子并涂布,以分离单菌落。重复这个过程,并保存第二次重分离之后的单菌落孢子。
在10ml YPM培养基中接种每个转化子。在30℃、200rpm温育2-5天后,去除上清液。通过下述方法鉴定内切葡聚糖酶活性:向0.1% AZCL HE纤维素SC-琼脂平板中打孔形成的4mm直径的孔施加20μl培养液,并在30℃过夜温育。然后通过菌落周围的蓝色晕圈鉴定内切葡聚糖酶活性。几个转化子培养液具有的内切葡聚糖酶活性显著高于来自未转化米曲霉背景对照的培养液的活性,这证明来自嗜热毁丝霉CBS 117.65的CEL5A内切葡聚糖酶在米曲霉中有效表达。
实施例5:在酿酒酵母中构建担子菌CBS 495.95 cDNA表达文库
如实施例1中所述,在大肠杆菌中构建来自担子菌CBS 495.95由约106个单独克隆组成的cDNA文库,具有1%的载体背景。
实施例6:筛选担子菌CBS 495.95 cDNA表达文库的内切葡聚糖酶活性
如实施例2所述进行cDNA文库(实施例5)的筛选。
实施例7:表征来自担子菌CBS 495.95的CEL5A编码基因
如实施例3所述从担子菌CBS 495.95克隆cel5a基因。然后将显示出包含cel5a基因的一个大肠杆菌转化子命名为pCIC453(图4),并用作生物材料保藏的材料。将大肠杆菌菌株pCIC453于2006年2月23日保藏为大肠杆菌NRRL B-30903。
使用Hind III和Xba I将担子菌CBS 495.95 cel5a基因从pCIC453剪切下来,并连接到曲霉属表达载体pHD414中。将得到的质粒命名为pA2C453(图5)。
图6中显示了CBS 495.95 cel5a基因的核苷酸序列(SEQ ID NO:5)和推定的氨基酸序列(SEQ ID NO:6)。编码序列为1194bp,其中包括终止密码子。所述基因的编码区域的%G+C是59.8%,而成熟多肽编码区域的%G+C是60.1%。编码的预测蛋白质包含397个氨基酸。使用第三版的SignalP软件(Nielsen等,1997,见上文)预测了15个残基的信号肽。预测的成熟蛋白质包含382个氨基酸,分子量为40.1kDa。
用Interproscan程序(Zdobnov和Apweiler,2001,见上文)分析cel5a基因的推导的氨基酸序列,显示CEL5A蛋白质包含家族5糖基水解酶的核心序列类型,从预测的成熟多肽的约残基81延伸至残基359。CEL5A蛋白质还包含I型真菌纤维素结合域(CBMI)的序列标记。这个称为Prosite型PS00562(Sigrist等,2002,见上文)的序列标记存在于预测的成熟多肽的氨基酸残基8至残基36。
使用Needleman-Wunsch算法(Needleman和Wunsch,1970,见上文)如在具有缺口开放罚分10、缺口延伸罚分0.5和EBLOSUM62矩阵的EMBOSS的Needle程序中所实施的来确定氨基酸序列的比较配对全局比对。比对显示,编码CEL5A成熟多肽的CBS 495.95基因的推导的氨基酸序列与来自Irpexlacteus和Trametes hirsuta的两个家族5糖基水解酶蛋白的推导氨基酸序列(登录号分别为Q5W7K4和Q75UV6)分别具有82%和79%的同一性(缺口除外)。
实施例8:来自担子菌CBS 495.95的cel5a基因在米曲霉中表达
如实施例4中所述,表达来自担子菌CBS 495.95的cel5a基因,并进行内切葡聚糖酶活性的分析。
实施例9:在酿酒酵母中构建担子菌CBS 494.95 cDNA表达文库
如实施例1中所述,在大肠杆菌中构建来自担子菌CBS 494.95由约106个单独的克隆组成的cDNA文库,载体背景为1%。
实施例10:筛选担子菌CBS 494.95 cDNA表达文库的内切葡聚糖酶活性
如实施例2中所述,进行cDNA文库(实施例9)的筛选。
实施例11:来自担子菌CBS 494.95的CEL5B编码基因的表征
如实施例3中所述,进行来自担子菌CBS 494.95的cel5b基因的克隆。然后将显示出包含CBS 494.95 cel5b基因的一个大肠杆菌转化子命名为pCIC486(图7),并用作生物材料保藏的材料。将大肠杆菌菌株pCIC486于2006年2月23日保藏为大肠杆菌NRRL B-30904。
使用Kpn I和Xho I将担子菌CBS 494.95 cel5b基因从pYES2.0剪切下来,并连接到曲霉属表达载体pHD423中(Lassen等,2001,Appl EnvironMicrobiol 67:4701-4707),所述载体是在多接头中具有Kpn I位点的pHD414衍生物。将获得的质粒命名为pA2C486(图8)。图9中显示了CBS 494.95 cel5b基因的核苷酸序列(SEQ ID NO:7)和推导的氨基酸序列(SEQ ID NO:8)。编码序列为1290bp,其中包括终止密码子。所述基因的编码区域的%G+C是56.0%,而成熟多肽编码区域的%G+C是56.1%。编码的预测蛋白质包含429个氨基酸。使用第三版的SignalP软件(Nielsen等,1997,见上文)预测了21个残基的信号肽。预测的成熟蛋白质包含408个氨基酸,分子量为43.1kDa。
用Interproscan程序(Zdobnov和Apweiler,2001,见上文)分析cel5b基因的推导的氨基酸序列,显示CEL5B蛋白质包含核心序列类型的家族5糖基水解酶,从预测的成熟多肽的约氨基酸残基106延伸至残基385。CEL5A蛋白质还包含I型真菌纤维素结合域(CBMI)的序列标记。这个称为Prosite型PS00562(Sigrist等,2002,见上文)的序列标记存在于预测的成熟多肽的氨基酸残基7至残基34。
使用Needleman-Wunsch算法(Needleman和Wunsch,1970,见上文)如在具有缺口开放罚分10、缺口延伸罚分0.5和EBLOSUM62矩阵的EMBOSS的Needle程序中所实施的来确定氨基酸序列的比较配对全局比对。比对显示,编码CEL5A成熟多肽的CBS 495.95基因的推导氨基酸序列与来自Irpexlacteus和Trametes hirsuta的两个家族5糖基水解酶蛋白的推导的氨基酸序列(登录号分别为Q5W7K4和Q75UV6)分别具有69%和67%的同一性(缺口除外)。
实施例12:在米曲霉中表达来自担子菌CBS 494.95的CEL5B
如实施例4中所述,进行来自担子菌CBS 494.94的cel5B基因的表达,和内切葡聚糖酶活性的分析。
实施例13:来自嗜热毁丝霉CBS 117.65、担子菌CBS 494.95和担子菌CBS 495.95的重组内切葡聚糖酶的纯化
使用基本如Otzen等,1999,Protein Sci.8:1878-87所述的规程,将如实施例4、8和12中所述,在米曲霉中重组产生的来自嗜热毁丝霉CBS 117.65、担子菌CBS 494.95和担子菌CBS 495.95的内切葡聚糖酶纯化成为均质。
根据BCA Protein Assay Reagent Kit(Pierce Chemical Co.,Rockford,IL,USA)的制造商的说明,使用双辛可宁酸(Bicinchoninic acid)(BCA)微孔板试验确定酶制剂中的蛋白质浓度。
在每次实验前,从保存的酶溶液中新鲜制备酶稀释液,所述保存的酶溶液在-20℃保存。
实施例14:从巴西青霉IBT 20888分离基因组DNA
根据Carlsen,1994,Ph.D.thesis,Department of Biotechnology,TheTechnical University of Denmark,以稻繁殖巴西青霉菌株IBT 20888的孢子。用20ml 0.1% Tween 20回收孢子,并以1×106孢子每毫升的浓度接种入100mlMandels和Weber培养基(Mandels和Weber,1969,Adv.Chem.Ser.95:394-414)中,所述培养基在500ml带挡板的摇瓶中包含1%葡萄糖,每升补充0.25g酵母提取物和0.75g细菌用蛋白胨。在30℃、150rpm好氧生长24小时后收获真菌菌丝体。
通过Nalgene DS0281-5000过滤器(Nalge Nunc International Corporation,Rochester,NY,USA)过滤收集菌丝体,直到干燥并在液氮中冻存。在干冰冷冻研磨臼中将冷冻的菌丝体研磨成粉,并分配于有螺旋帽的管中。将粉悬浮于总体积40ml的50mM CAPS(3-(环己基氨基)-1-丙磺酸)-NaOH pH 11缓冲液中,所述缓冲液包含0.5%十二烷基硫酸锂和0.5mM EDTA。将悬浮液在60℃放置2小时,定时地倒置重悬。向悬浮液中加入用0.1M Tris碱中和的等体积苯酚:氯仿(1:1体积比),将管在转轮上在37℃混合2小时。在Sorvall H1000B转头中在2500rpm离心10分钟后,用苯酚:氯仿(1:1体积比)重新萃取水相(上层相),并在15,000×g离心5分钟。在第二次萃取得到的水相中加入2.5M乙酸铵(10M储液),并置于-20℃至冷冻。融化后,在冷冻转头中15,000×g将萃取液(extract)离心20分钟。去除沉淀(主要是rRNA),通过加入0.7体积的异丙醇使上清液中的核酸沉淀。15,000×g离心15分钟后,用5ml 70%乙醇将沉淀冲洗三次(不重悬),几乎完全风干,并溶于1.0ml 0.1×TE中。将溶解的沉淀转移至两个1.5ml的微离心管中。通过加入乙酸铵(0.125ml)至2.0M和乙醇至63%(1.07ml),使核酸沉淀,并在Sorvall MC 12V微离心机(KendroLaboratory Products,Asheville,NC,USA)中以最大速度离心10分钟。用70%乙醇冲洗沉淀两次,完全风干,并溶于500μl 0.1×TE中。
实施例15:制备巴西青霉IBT 20888的基因组DNA文库
使用TOPO Shotgun Subcloning Kit(Invitrogen,Carlsbad,CA,USA)构建基因组文库。简而言之,在10psi氮气中将总细胞DNA通过雾化(nebulization)进行15秒剪切,并使用40mM Tris碱-20mM乙酸钠-1mM EDTA二钠(TAE)缓冲液,在1%琼脂糖凝胶上进行大小分级(size-fractionate)。将在大小范围3-6kb迁移的DNA片段剪切并使用MiniEluteTM Gel Extraction Kit(QIAGEN Inc,Valencia,CA,USA)洗脱。使用如上的1%琼脂糖将洗脱的片段再次进行大小分级,将在大小范围3-6kb中迁移的DNA片段剪切并使用MiniEluteTM GelExtraction Kit洗脱。
使用虾碱性磷酸酶(Roche Applied Science,Manheim,Germany),将洗脱的DNA片段平端修复并去磷酸化。根据制造商的说明书,将平端DNA片段克隆到pCR4Blunt-TOPO载体(Invitrogen,Carlsbad,CA,USA)中,通过电穿孔转化到电感受态大肠杆菌TOP10细胞中,并涂布于LB氨苄青霉素平板上。电穿孔得到15,300个克隆。
实施例16:来自巴西青霉IBT 20888的天然CEL5C内切葡聚糖酶的纯化
等,2003(Enzyme Microb.Technol.32:851-861)所述,将内切葡聚糖酶纯化并进行实验。底物是氮-羧甲基纤维素(azo-carboxymethylcellulose)(Megazyme International Ireland Ltd.,Bray,Ireland),培育时间是15分钟。将纯化的酶在-20℃冻存。
实施例17:来自巴西青霉IBT 20888的CEL5C内切葡聚糖酶的N端测序
将巴西青霉CEL5C内切葡聚糖酶的纯化样品(实施例16)解冻。将样品的100μl等份试样加入Eppendorf管中的100μl SDS-PAGE样品缓冲液(4ml 0.5M TRIS-HCl,pH 6.8,20ml 10% SDS,20ml甘油(87%),56ml Milli-Q
Figure A200780018204D0075182513QIETU
超纯水和15粒溴酚蓝),并加热至95℃4分钟。加热后,将稀释样品的四个20μl等份试样分别施用于预制的4-20% SDS聚丙烯酰胺凝胶(Invitrogen,Carlsbad,CA,USA)。除了四个包含样品的泳道外,还将Mark 12蛋白质标准混合物(Invitrogen,Carlsbad,CA,USA)施加于凝胶。
在Xcell SureLockTM凝胶设备(Invitrogen,Carlsbad,CA,USA)中跑胶90分钟,起始的能量设定为40mA于最大135V。电泳后,在印迹溶液中将凝胶温育5分钟,所述溶液由包含6%甲醇的10mM CAPS pH 11组成。将ProBlott膜(Applied Biosystems,Foster City,CA,USA)在纯甲醇中浸湿1分钟,然后在印迹溶液中放置5分钟从而用含6%甲醇的10mM CAPS pH 11使膜饱和。
如下在Semi Dry Blotter II设备(KemEnTec,Copenhagen,DK)中进行电印迹。将在印迹溶液中浸湿的六张Whatman 1号纸置于印迹设备的阳极上,然后加入ProBlott膜、聚丙烯酰胺凝胶和六张在印迹溶液中浸湿的Whatman 1号纸。因此使阴性电极接触上层Whatman 1号纸,从而组装印迹设备。在印迹设备顶端放置11.3kg的重量。在175mA的电流进行180分钟的电印迹。
电印迹后,将ProBlott膜在溶于60%甲醇、1%乙酸、39%水的0.1%(重量/体积)考马斯亮蓝R-250中染色1分钟。在40%含水的甲醇中进行ProBlott膜脱色5分钟,然后在去离子水中冲洗膜。最后,将ProBlott膜风干。
对于N端氨基酸测序,剪出由65kDa条带组成的两片ProBlott膜,并置于Applied Biosystems Procise Protein Sequencer(Applied Biosystems,Foster City,CA,USA)的印迹筒中。根据制造商的说明书,使用用于PVDF膜样品(脉冲液体PVDF)的方法操作文件(method run file)进行N端测序。
通过比较色谱图中峰的保留时间和标准色谱图中PTH-氨基酸的保留时间,从得到的色谱图推定N端氨基酸序列。
使用Procise 494 HT Sequencing System(Applied Biosystems,Foster City,CA,USA),直接确定纯化的巴西青霉CEL5C内切葡聚糖酶的N端氨基酸序列。将N端序列确定为Ala-Ser-Ser-Phe-Val-Trp-Phe-Gly-Thr-Ser-Glu-Ser-Gly-Ala-Glu-Phe-Gly-Asn-Gln-Asn(SEQ ID NO:10的氨基酸25至44)。
实施例18:来自巴西青霉IBT 20888的cel5c内切葡聚糖酶基因的PCR扩增
根据纯化的巴西青霉内切葡聚糖酶的N端氨基酸序列,使用CODEHOP策略(Rose等,1998,Nucleic Acids Res.26:1628-35)设计正向引物。从关于其它内切葡聚糖酶的数据库信息,使用CODEHOP策略设计如下所示两个反向引物。
正向引物,Fwd:
5′-TTCGGTACCTCTGAGTCTGGNGCNGARTT-3′(SEQ ID NO:11)
反向引物,Rev1:
5′-TGATCCATATCGTGGTACTCGTTRTTNGTRTCRAA-3′(SEQ ID NO:12)
反向引物,Rev2:
5′-CCGTTGTAGCGACCGTARTTRTGNGGRTC-3′(SEQ ID NO:13)
其中R=A或G,Y=C或T,K=G或T,并且N=A、C、G或T
使用约1μg巴西青霉基因组DNA作为模板制备扩增反应物(30μl)。此外,每个反应包含下述组分:30pmol正向引物,30pmol反向引物,200μMd ATP、dCTP、dGTP和dTTP,1×AmpliTaq聚合酶缓冲液(Applied Biosystems,Foster City,CA,USA),和0.5单位AmpliTaq聚合酶(5.0U/μl,AppliedB iosystems,Foster City,CA,USA)。在Robocycler(Stratagene,La Jolla,CA,USA)中温育反应物,程序为:96℃ 3分钟和72℃ 3分钟的1个循环;34个循环,每个循环为95℃ 0.5分钟,56℃ 0.5分钟,和72℃ 1.5分钟;72℃ 7分钟的1个循环;和6℃的浸入循环(soak cycle)。在第一个循环中于72℃加入Taq聚合酶。
使用TAE缓冲液,在2%琼脂糖凝胶(Amresco,Solon,OH,USA)上分离PCR反应产物。从凝胶上切下约650bp的条带(Fwd和Rev1引物)和约320和380bp的条带(Fwd和Rev2引物),并根据制造商的说明使用MiniEluteTMGel Extraction Kit(QIAGEN Inc.,Valencia,CA,USA)将其纯化。然后通过DNA测序分析纯化的PCR产物。发现320bp的产物编码部分糖基水解酶家族5多肽,所述多肽命名为CEL5C。
实施例19:筛选巴西青霉IBT 20888的基因组文库
进行实施例15所述文库的菌落转移检测(colony lift)(Maniatis等,1982,Molecular Cloning,A Laboratory Manual,Cold Spring Harbor Press,Cold SpringHarbor,New York),并在80℃将DNA交联到Hybond N+膜(Amersham,Arlington Heights,IL,USA)上2小时。使用0.2×SSC(30mM NaCl,3mM柠檬酸钠)、0.2% SDS将来自菌落转移检测的膜预润湿。将预润湿的过滤器置于烧杯中,每个过滤器使用7.5ml 6×SSPE(0.9M NaCl,0.06M NaH2PO4,和6mM EDTA)和7% SDS,在振荡水浴中在68℃放置30分钟。
根据制造商的说明书,使用Stratagene Prime-It II Kit(Stratagene,La Jolla,CA),将实施例18中所述的约40ng PCR产物用随机引物标记。使用MinElutePCR Purification Kit(QIAGEN Inc.,Valencia,CA,USA),将放射性标记的基因片段与未并入的核苷酸分离。
通过加入5.0M NaOH至终浓度0.5M,使放射性探针变性,并将所述探针以约0.5 x 106cpm每毫升杂交溶液的活性加入杂交溶液中。将混合物在振荡水浴中68℃温育10小时。温育后,在0.2×SSC、0.2% SDS中在68℃清洗膜三次。然后在印迹纸上将膜干燥15分钟,包上SaranWrapTM,并用增强屏(Kodak,Rochester,NY,USA)在-80℃X射线过夜照射。
将与探针产生杂交信号的克隆接种到1ml LB氨苄青霉素培养基中,并在37℃过夜培养。产生每个溶液的稀释液,并将100μl涂布于LB氨苄青霉素平板上。选择在每个平板上产生约40个菌落的每个阳性的稀释液进行二次转移检测(secondary lift)。如上制备、杂交并用探针筛选。将来自每个阳性平板的两个菌落接种到3ml LB氨苄青霉素培养基中,并在37℃过夜培养。
根据制造商的说明书,使用Bio Robot 9600(QIAGEN Inc,Valencia,CA,USA)从每个菌落制备微量DNA。通过EcoRI限制酶切和琼脂糖凝胶电泳确定每个插入物的大小。两个克隆中,每个都包含约5.5kb的插入物。测序结果表明,两个克隆是同一的,因此将它们称作pKKAH1(参见实施例20)。
实施例20:来自巴西青霉IBT 20888的编码CEL5C内切葡聚糖酶的cel5c基因组序列的表征
使用引物步移技术及染料-终止子化学(Giesecke等,1992,J.Virol.Methods 38:47-60),用Applied Biosystems Model 3700 Automated DNASequencer(Applied Biosystems,Foster City,CA,USA)进行来自pKKAH1的巴西青霉内切葡聚糖酶基因的DNA测序。
图10A和10B显示了巴西青霉cel5c基因的核苷酸序列(SEQ ID NO:9)和推导的氨基酸序列(SEQ ID NO:10)。1471bp的基因组编码序列(包括终止密码子)编码421个氨基酸的多肽,其中插入51bp(89-139bp)、47bp(352-398bp)、55bp(464-518bp)和52bp(617-668bp)的4个内含子。所述基因的编码区域的%G+C含量是51.2%,而成熟多肽编码区域的%G+C含量是50.8%。使用SignalP软件程序(Nielsen等,1997,Protein Engineering 10:1-6)预测了16个残基的信号肽。根据内切葡聚糖酶的N端序列,残基17到24看起来组成前区域(pro-region),所述区域在成熟过程中通过蛋白水解而被切割。预测的成熟蛋白质包含397个氨基酸,预测的分子量为42.6kDa。
用Interproscan程序(Zdobnov和Apweiler,2001,见上文)分析cel5c基因的推导氨基酸序列,显示CEL5C蛋白质包含核心序列类型的家族5糖基水解酶,从预测的全长多肽的大约残基32延伸至残基307。CEL5C蛋白质还包含I型真菌纤维素结合域(CBMI)的序列标记。这个称为Prosite类型的PS00562(Sigrist等,2002,见上文)的序列标记存在于预测多肽的氨基酸残基393至残基420。
使用Needleman-Wunsch算法(Needleman和Wunsch,1970,见上文)如在具有缺口开放罚分10、缺口延伸罚分0.5和EBLOSUM62矩阵的EMBOSS的Needle程序中所实施的来确定公共数据库中氨基酸序列的比较配对全局比对。比对显示,编码CEL5C成熟多肽的巴西青霉cel5c基因的推导氨基酸序列与来自Neosartorya fischeri和烟曲霉的两个预测的家族5糖基水解酶蛋白的推导氨基酸序列(登录号分别为A1DAP7和Q4WM09)分别共有74.9%和74.5%的同一性(缺口除外)。
实施例21:构建来自巴西青霉IBT 20888的cel5c内切葡聚糖酶基因的米曲霉表达质粒
曲霉表达质粒pJaL721(WO 03/008575)由表达盒组成,所述表达盒基于与构巢曲霉磷酸丙糖异构酶未翻译前导序列(NA2-tpi)融合的黑曲霉中性淀粉酶II启动子和黑曲霉淀粉葡糖苷酶终止子。质粒上还存在来自构巢曲霉的选择性标记amdS,其能以乙酰胺作为唯一氮源生长,和来自酿酒酵母的URA3标记,其能使pyrF缺陷的大肠杆菌菌株DB6507(ATCC 35673)生长。如下所述,使用酿酒酵母URA3基因作为选择性标记进行大肠杆菌DB6507的转化。
通过Mandel和Higa,1970,J.Mol.Biol.45:154的方法将大肠杆菌DB6507制成感受态。在固体M9培养基上选择转化子(J.Sambrook,E.F.Fritsch,和T.Maniatis,1989,Molecular Cloning,A Laboratory Manual,2d edition,ColdSpring Harbor,New York),所述培养基每升补充1g酪蛋白氨基酸、500μg硫胺素(thiamine)和10mg卡那霉素。
如下所述将内切葡聚糖酶基因克隆到pJaL721中。使用下述两个寡核苷酸引物通过PCR扩增来自巴西青霉的cel5c内切葡聚糖酶基因:
正向引物:
5’-AATTGGATCCACCATGAAATACCCTCTACTCCTGGCAAC-3’(SEQID NO:14)
反向引物:
5’-TTAACTCGAGTTACAGACACTGCGAATAATACGCATTC-3’(SEQID NO:15)
为了促进克隆,在每个引物的5’端插入限制性酶切位点,其中正向引物包含BamHI位点,而反向引物包含XhoI位点。
在PCR反应中使用如实施例14中制备的基因组DNA作为模板。反应在50μl的体积中进行,其中包含1.0单位Phusion(Finnzymes Oy,Espoo,Finland),1×Phusion缓冲液HF(Finnzymes Oy,Espoo,Finland),500ng基因组,250μM每种dNTP,和50pmol上述两种引物的每种。在PTC-220 DNA Engine DyadPeltier Thermal Cycler(MJ Research,Inc.,Waltham,MA,USA)中进行扩增,程序为:95℃ 5分钟的1个循环;24个循环,每个循环为94℃ 0.5分钟、58℃ 0.5分钟和68℃ 4.0分钟;和68℃ 15分钟的1个循环。使用热启动PCR技术(Chou等,1992,Nucleic Acids Res.20:1717),并在第一个循环1分钟后加入Phusion聚合酶。
PCR反应产生长约1500bp的单DNA片段。将所述片段用BamHI和XhoI消化,并通过琼脂糖凝胶电泳分离,将其纯化,并克隆到用BamHI和XhoI消化的pJaL721中,得到的质粒命名为pKBK03(图11)。通过用AppliedBiosystems 3730xl DNA Analyzer测序,确认pKBK03中内切葡聚糖酶基因的序列。
为了产生用于生物材料保藏的质粒,用BamHI和XhoI消化pKBK03并纯化。使用Klenow酶(Roche Applied Science,Manheim,Germany)在25℃对片段进行平端修复30分钟。用SmaI消化质粒pUC13,并用小牛肠蛋白酶(RocheApplied Science,Manheim,Germany;CIP)在37℃去磷酸化1小时,通过将样品加热至80℃ 15分钟而使CIP失活。
使用T4DNA连接酶(Roche Applied Science,Manheim,Germany),将平端修复的片段和去磷酸化的pUC13片段在16℃过夜连接。将连接产物的0.25μg样品转化到大肠杆菌DH5α(Invitrogen,Carlsbad,CA,USA)中。在LB氨苄青霉素平板上在37℃过夜培养后,将转化子转移到2ml LB培养基,并在37℃培养。使用Jetquick Plasmid Miniprep(Genomed,
Figure A200780018204D0080183845QIETU
Germany)纯化命名为pPBCel5C的质粒(图12)。通过用Applied Biosystems 3730xl DNA Analyzer测序确认内切葡聚糖酶基因的序列。将包含质粒pPBCel5C的大肠杆菌TOP10细胞(Invitrogen,Carlsbad,CA)(菌株名PBCel5C)作为NRRL B-30900N保藏于农业研究机构保藏中心北区研究中心(Agricultural Research Service PatentCulture Collection,Northern Regional Research Center),1815 University Street,Peoria,Illinois,61604,保藏日为2006年2月23日。
实施例22:在米曲霉中表达巴西青霉IBT 20088 CEL5C内切葡聚糖酶
如Christensen等,1988,Biotechnology 6:1419-1422所述,用5μg pKBK03转化米曲霉BECh2(WO 00/30322)。
在50ml管中,于30℃、10ml YPM培养基中将转化子培养4天。在12,100×g离心全培养液并去除上清。根据制造商的说明书,使用XT MES缓冲液(BioRad Laboratories,Hercules,CA,USA)中的Criterion XT Precast Gel、10%Bis-Tris凝胶,通过SDS-PAGE分析上清液。将10μl体积的上清液与9μl样品缓冲液(0.125M Tris-HCl pH6.8,20%甘油和4.6% SDS)和1μl 1M二硫苏糖醇混合,并加热至96℃ 5分钟。在20份上清液中的16份中,通过SDS-PAGE,可以在标准品35kDa至150kDa范围中见到约65kDa的一个条带。SDS-PAGE后得到可见条带的上清液还包含内切葡聚糖酶活性,如实施例3中所测定。所述条带的强度越高,同样的上清液中测得的内切葡聚糖酶活性就越高。
将一个转化子命名为米曲霉KBK03。
实施例23:重组巴西青霉IBT 20888 CEL5C内切葡聚糖酶的产生和纯化
米曲霉转化子KBK03在20个500ml摇瓶中生长,摇瓶中含有200mlYPM培养基。
通过离心和过滤从4.0升发酵液中去除生物质。如实施例9中所述进行SDS-PAGE分析。将内切葡聚糖酶溶液加载于XK50柱(Amersham Biosciences,Uppsala,Sweden),该柱包含110g Avicel Ph 101(Merck KGaA,Darmstadt,Germany),其在加载前用25mM Tris pH7.5预平衡,并用25mM Tris、1%三乙醇胺在pH 11.6洗脱结合的酶。在280nm监测内切葡聚糖酶的洗脱液。立即汇集包含洗脱蛋白质的级分,并将pH调至7.5。汇集包含内切葡聚糖酶的级分。
由280nm处的吸光度和由内切葡聚糖酶一级结构计算的消光系数,确定蛋白质含量。
纯化之后进行SDS-PAGE。将样品与同样体积的2×样品缓冲液和1/5体积的1% PMSF煮沸2分钟,并加载于4-20% Tris-甘氨酸凝胶(Invitrogen,Carlsbad,CA,USA)上。用GelCode Blue Stain Reagent(Pierce,Rockford,IL,USA)将凝胶染色,并用水脱色。SDS-PAGE显示一条约65kDa的条带。
实施例24:纯化的重组巴西青霉IBT 20888 CEL5C内切葡聚糖酶的表征
用最适pH、最适温度和温度稳定性表征实施例23中所述的纯化的重组巴西青霉CEL5C内切葡聚糖酶。如实施例16中所述,在从20℃到80℃的温度和3.0至10.0的pH值测定内切葡聚糖酶活性。在Milli-Q
Figure A200780018204D0082184054QIETU
超纯水(Millipore,Billerica,MA,USA)中稀释纯化的内切葡聚糖酶,以确保活性在标准曲线范围内。对于最适pH,将底物溶于调至理想pH的Britton-Robinson缓冲液(50mM硼酸、50mM乙酸、50mM磷酸)中。在4.0至6.0的pH范围内在50℃确定温度稳定性20小时。所有实验重复两次进行。
最适pH的确定结果示于图13中。在50℃时最适pH接近4.0,而在pH 3.0活性非常小,在pH 5.0为峰活性的约80%。
最适温度的确定结果示于图14中。pH 4.8时的最适温度为约70℃,从60℃至80℃为峰活性的超过75%。
温度稳定性的测定结果示于图15中。从4.0至6.0的pH范围中在25℃和50℃在不存在底物时预培育20小时,内切葡聚糖酶保留其起始活性的超过80%。
实施例25:底物的制备
使用稀释的硫酸,由美国能源部国家可再生能源实验室(U.S.Departmentof Energy National Renewable Energy Laboratory,NREL)制备经过预处理的玉米秸(PCS)。使用下述条件进行预处理:按重量计1.4%硫酸,在165℃和107psi,8分钟。在NREL进行组成分析。通过两阶段硫酸水解测定纤维素和半纤维素,然后使用NREL标准分析程序#002,通过高效液相色谱(HPLC)进行糖分析。在用硫酸水解纤维素和半纤维素部分(NREL标准分析程序#003)后,通过重量测定木质素。确定经预处理的玉米秸(PCS)中不溶于水的固体为56.5%纤维素、4.6%半纤维素和28.4%木质素。
用大体积的去离子水在具有粗糙孔隙的玻璃滤纸(Fisher Scientific,Pittsburg,PA,USA)的Kimax漏斗上洗涤PCS。将水洗过的PCS在咖啡磨具中碾磨,并又用去离子水在具有6P Express Membrane(Millipore,Bedford,MA,USA)的22μm Millipore Filter上洗涤。碾磨的PCS的干重是32.4%。
使用下述步骤制备去离子水中磷酸-溶胀纤维素(PASC)的10mg/ml储存悬浮液。向用水浸湿的5g Avicel PH101(FMC Corp.,Philadelphia,PA,USA)中加入一百五十毫升冰冻的85% o-磷酸。将悬浮液在冰浴中缓慢搅拌一小时,在恒定搅拌中向悬浮液加入100ml冰冻的丙酮。将浆料转移至具有粗糙孔隙的玻璃滤纸的Kimax漏斗中,用100ml冰冻的丙酮清洗三次,每次清洗后尽可能完全排干。最后,用500ml水清洗浆料两次,仍然在每次清洗后尽可能排干。将PASC与水混合至总体积500ml。加入叠氮化钠(sodium azide)至终浓度0.02%以防止微生物生长。使用混合器将浆料均质化,并在4℃储存多至一个月。
从Aqualon Division of Hercules Inc.,Wilmington,DE,USA获得平均取代度(DS)为0.7的羧甲基纤维素(CMC,钠盐,7L2型)。通过向剧烈搅拌的缓冲液中缓慢加入CMC,制备50mM乙酸钠pH 5.0中的6.25mg/ml CMC溶液。在连续搅拌下将浆料加热至约60℃,直至CMC完全溶解。
如Boisset等,1999,Biochemical Journal,340:829-835中所述,从Nata deCoco,一种食品级的商品纤维素(Fujicco Co.,Kobe,Japan)制备细菌纤维素(BC)。将含有0.01%(w/v)叠氮化钠的去离子水中的1mg/ml细菌纤维素悬浮液在4℃储存。
Avicel PH101获得自FMC Corporation,Philadelphia,PA,USA。
来自桦树(birchwood)的木聚糖获得自Sigma,St.Louis,MO,USA。来自罗望子种子(Tamarind seed)的木葡聚糖(淀粉质,货号00401)、小麦阿拉伯木聚糖(中等粘度,27cSt,货号90601),1,4-β-D-甘露聚糖(硼氢化物还原,Man:Gal=97:3,聚合度DP~15,货号90302)和长角豆(carob)半乳甘露聚糖(低粘度,硼氢化物还原,货号90301)获得自Megazyme,Bray,Ireland。
实施例26:用于测定还原糖的对羟基苯甲酸酰阱法
通过对羟基苯甲酸酰阱(PHBAH)法(Lever,1972,Anal.Biochem.47:273-279)测定还原糖(RS),所述方法适合于96孔微孔板形式。
将90μl等分试样的稀释样品置于96孔锥形底微孔板(Costar,clearpolycarbonate,Corning Inc.,Acton,MA,USA)的每个孔中。通过向每个孔中加入60μl的2%氢氧化钠中的1.25% PHBAH而开始测定。将未加盖的板在定制的加热块上在95℃加热10分钟。加热后,将微孔板冷却至室温,并向每个孔中加入35μl去离子水。从每个孔移出100μl等分试样的样品,并转移至平底的96孔板(Costar,medium binding polystyrene,Corning Inc.,Acton,MA,USA)。使用SpectraMAX Microplate Reader(Molecular Devices,Sunnyvale,CA,USA)测定在410nm处的吸光度(A410)。使用标准曲线将A410值转换成葡萄糖当量。
用六个葡萄糖标准品(0.005、0.010、0.025、0.050、0.075和0.100mg/ml)获得标准曲线,用与处理样品相似的方法处理标准品。通过用去离子水稀释10mg/ml葡萄糖储存溶液而制备葡萄糖标准品。
对于除了木聚糖和阿拉伯木聚糖之外的所有底物,使用下述公式计算转化的程度(%):
转化率(%)=RS(mg/ml)×100×162/(起始底物浓度(mg/ml)×180)=
            RS(mg/ml)×100/(起始底物浓度(mg/ml)×1.111)
对于木聚糖和阿拉伯木聚糖,使用下述公式计算水解成RS的底物的百分数:
转化率(%)=RS(mg/ml)×100×132/(起始底物浓度(mg/ml)×150)=
            RS(mg/ml)×100/(起始底物浓度(mg/ml)×1.136)
在这些公式中,RS是以葡萄糖当量(mg/ml)测定的溶液中还原糖的浓度,而因子1.111和1.136反映的是将相应的多糖转化成己糖(MW 180)或戊糖(MW 150)引起的重量增加。
实施例27:在50℃内切葡聚糖酶对羧甲基纤维素的相对活性
表1显示来自嗜热毁丝霉CBS 117.65、担子菌CBS 494.95和担子菌CBS495.95的纯化内切葡聚糖酶对于羧甲基纤维素(CMC)的可溶钠盐的相对活性。相对活性以担子菌CBS 495.95内切葡聚糖酶活性的百分数显示。通过50℃在50mM乙酸钠pH 5.0中水解30分钟后测定从CMC(5mg/ml)产生的还原糖(RS)的浓度来测定活性。在存在0.5mg/ml牛血清白蛋白(BSA,Sigma,St.Louis,MO,USA)的情况下无需搅拌而进行水解。使用实施例26中所述的对羟基苯甲酸酰阱(PHBAH)试验法测定还原糖。
表1.在pH 5.0和50℃内切葡聚糖酶对于羧甲基纤维素(5mg/ml)的相对活性
 
内切葡聚糖酶 对CMC的活性,%
嗜热毁丝霉Cel5A 28
担子菌CBS 494.95 Cel5B 44
担子菌CBS 495.95 Cel5A 100
实施例28:内切葡聚糖酶在40℃-80℃的热稳定性
通过下述方法测定来自嗜热毁丝霉CBS 117.65、担子菌CBS 494.95和担子菌CBS 495.95的纯化内切葡聚糖酶的热稳定性:在五个温度(40℃,50℃,60℃,70℃和80℃)培育酶溶液,并测定酶对羧甲基纤维素(CMC)的残余活性。
在50mM乙酸钠pH 5.0中稀释酶,所述乙酸钠中包含3.0mg/ml BSA,并将酶在以8×12微孔板形式(Pierce,Rockford,IL,USA)放置的1.1-mlImmuno Ware Microtubes中培育3小时。加入BSA以防止微管的塑料壁上可能的酶吸收。选择培育混合物中的蛋白质浓度,使每种酶在随后对于CMC酶(CMCase)活性的实验中CMC的转化率小于1%。
在3小时培育后,使用8道移液器移出15μl的等份试样,并将其加入96孔锥形底微孔板(Costar,透明的聚碳酸酯,Corning Inc.,Acton,MA,USA)的75μl CMC溶液(50mM乙酸钠pH 5.0中6mg/ml)中。然后如实施例27所述测定残余的CMC酶活性,并表示为起始CMC酶活性的百分数(表2)。
在40℃和50℃,3小时培育后,全部三种内切葡聚糖酶都是稳定的,并保留有起始CMC酶活性的98-100%。在60℃和70℃,嗜热毁丝霉Cel5A表现出的稳定性优于另外两种内切葡聚糖酶,3小时培育后分别保留起始CMC酶活性的100%和49.3%。在80℃所有内切葡聚糖酶都不稳定。
表2.在pH 5.0和40-80℃培育3小时后,内切葡聚糖酶的残余CMC酶活性
 
40℃ 50℃ 60℃ 70℃ 80℃
嗜热毁丝霉Cel5A 100 100 100 49.3 3.8
担子菌CBS 494.95 Cel5B 100 98 28.0 5.0 4.1
担子菌CBS 495.95 Cel5A 100 99 6.4 2.4 0.8
实施例29:在40-70℃内切葡聚糖酶对于磷酸-溶胀纤维素的相对活性
通过测定在50mM乙酸钠pH 5.0中PASC(2mg/ml)的起始水解过程中释放的还原糖(RS)的浓度,确定来自担子菌CBS 494.95和担子菌CBS 495.95的纯化内切葡聚糖酶对于磷酸-溶胀纤维素(PASC)的活性。在存在0.5mg/ml牛血清白蛋白(BSA,Sigma,St.Louis,MO,USA)的情况下无搅拌而进行水解。将酶稀释使得RS浓度在水解的最初30至90分钟过程中线性增加,而这段时间中,PASC转化程度不超过2%。使用实施例26中所述的对羟基苯甲酸酰阱(PHBAH)实验法测定还原糖。
相对活性作为来自担子菌CBS 494.95和担子菌CBS 495.95的内切葡聚糖酶的温度的函数,示于图16中。将活性表示为在60℃来自担子菌CBS495.95的内切葡聚糖酶活性的百分数。对于两种内切葡聚糖酶,在Topt.=60℃对于PASC的活性达到最大值。
实施例30:在40-70℃磷酸-溶胀纤维素的长期水解
在四个温度,40℃、50℃、60℃和70℃,在包含0.5mg/ml BSA的50mM乙酸钠pH 5.0中由来自担子菌CBS 494.95和担子菌CBS 495.95的纯化内切葡聚糖酶对磷酸-溶胀纤维素(PASC,2mg/ml)进行45小时的水解。在三种蛋白质负载使用内切葡聚糖酶:0.056、0.167或0.5mg每g PASC。在以8×12微孔板形式(Pierce,Rockford,IL,USA)放置的1.1-ml ImmunoWare Microtube中无搅拌地以1ml的初始体积进行反应。
在不同时间点(1、1.5、3、6、21、27和45小时),使用8道的移液器从反应物中移出一百微升等分试样,并将其加入到MultiScreen HV 96孔过滤板(Millipore,Bedford,MA,USA)中的25μl 2% NaOH中。收集的样品通过真空过滤入平底微孔板中,以去除PASC残余物。通过实施例26中所述的对羟基苯甲酸酰阱(PHBAH)试验法分析过滤液的还原糖。
图17显示与来自担子菌CBS 494.95和担子菌CBS 495.95的内切葡聚糖酶(0.5mg蛋白质每g PASC)温育45小时后,PASC的相对转化率作为温度的函数。相对转化率显示为在50℃与担子菌CBS 495.95温育45小时后获得的转化率的百分数。在两种其它蛋白质负载(0.056和0.167mg蛋白质每g PASC)获得的温度曲线具有相似的形状。对于两种内切葡聚糖酶,PASC长期水解的最优温度是50℃。
实施例31:在50℃内切葡聚糖酶对各种多糖底物的表征
在pH 5.0(50mM乙酸钠缓冲液)和50℃在各种多糖的水解中评价来自嗜热毁丝霉CBS 117.65、担子菌CBS 494.95和担子菌CBS 495.95的纯化的内切葡聚糖酶。将结果与重组里氏木霉Cel7B(EGI)内切葡聚糖酶比较。由米曲霉产生的重组里氏木霉Cel7B(EGI)内切葡聚糖酶可以根据Takashima等,1998,Journal of Bacteriology 65:163-171制备。
多糖包括预处理的玉米秸(PCS)、磷酸-溶胀纤维素(PASC)、羧甲基纤维素(CMC)、细菌纤维素(BC)、Avicel、木聚糖、木葡聚糖、阿拉伯木聚糖、甘露聚糖和半乳甘露聚糖。所有底物以5mg/ml使用,除了细菌纤维素,其在0.9mg/ml使用。
在用Eppendorf 96深孔板盖(VWR Scientific,West Chester,PA,USA)封盖的Eppendorf 96深孔板(1.2ml,VWR Scientific,West Chester,PA,USA)中间歇搅拌,以1ml的初始体积进行24小时的反应。除非另外指出,酶以5mg蛋白质每g固体的量载入。
在24小时后,使用8道移液器从水解反应物中移出20μl的等分试样,并将其加入MultiScreen HV 96孔过滤板(Millipore,Bedford,MA,USA)中的180μl 102mM Na2CO3-58mM NaHCO3中以终止水解。将样品通过真空过滤加入平底微孔板中。在适当的稀释后,使用如实施例26中所述的对羟基苯甲酸酰阱(PHBAH)试验法分析过滤液中的还原糖。
表3显示24小时培育后内切葡聚糖酶对各种多糖的相对转化率。将相对转化率计算为担子菌CBS 495.95 Cel5A内切葡聚糖酶水解1,4-β-D-甘露聚糖24小时后获得的转化率的百分数。来自糖苷水解酶(GH)家族5的内切葡聚糖酶对甘露聚糖和半乳甘露聚糖具有相对高的活性,但是对于木聚糖、木葡聚糖和阿拉伯木聚糖的活性低。相反,里氏木霉Cel7B对木聚糖、木葡聚糖和阿拉伯木聚糖具有相对高的活性,但是对甘露聚糖和半乳甘露聚糖的活性低。GH5内切葡聚糖酶显示对PASC(不溶的未取代无定形纤维素)的水解优于对CMC(可溶取代纤维素衍生物)的水解。GH5内切葡聚糖酶对具有高度结晶的不溶底物(细菌纤维素、Avicel和PCS)具有低活性。
表3.内切葡聚糖酶(5mg蛋白质每g固体)对各种多糖底物的相对转化率;pH 5.0,50℃,24小时
 
底物 嗜热毁丝霉Cel5A 担子菌CBS494.95 Cel5B 担子菌CBS495.95 Cel5A 里氏木霉Cel7B
 
预处理的玉米秸(PCS) 2 6 6 10
磷酸-溶胀纤维素(PASC)** 10 40 70 38
羧甲基纤维素(CMC)** 12 12 12 14
细菌纤维素(BC)* 1 5 5 5
Avicel(微晶纤维素) 1 2 3 5
桦树木聚糖 0 3 2 51
罗望子木葡聚糖 0 1 1 87
小麦阿拉伯木聚糖 6 7 8 81
1,4-β-D-甘露聚糖 70 73 100 2
长角豆半乳甘露聚糖 52 54 62 3
*细菌纤维素的初始浓度是0.9mg/ml
**所有用于PASC和CMC水解的内切葡聚糖酶以0.25mg蛋白质每g固体的量使用
实施例32:在60℃由内切葡聚糖酶水解来自大麦的可溶β-葡聚糖
在pH 5.5(含有0.02%叠氮化钠的50mM乙酸钠)和60℃,确定来自嗜热毁丝霉CBS 117.65、担子菌CBS 494.95和担子菌CBS 495.95的内切葡聚糖酶对于来自大麦的可溶β-葡聚糖(中等粘度,230kDa,Megazyme InternationalIreland Ltd.,Bray,Ireland)的活性。将结果与里氏木霉Cel7B(EGI)内切葡聚糖酶的结果比较。可以如实施例31所述制备重组里氏木霉Cel7B(EGI)内切葡聚糖酶。
在水解反应中β-葡聚糖的初始浓度是1.0%(w/v)。在Eppendorf 96深孔板(1.2ml,VWR Scientific,West Chester,PA,USA)中无搅拌进行一毫升体积的反应。以三个蛋白质负载使用酶:0.05、0.1和0.2mg每g葡聚糖。在缓冲液对照中,用包含0.02%叠氮化钠的50mM乙酸钠pH5.5代替内切葡聚糖酶。
在2小时和24小时从水解反应物中移出等份试样,将其用去离子水稀释,并使用如实施例26中所述的对羟基苯甲酸酰阱(PHBAH)试验法分析还原糖。β-葡聚糖的相对转化率作为两个温育时间(2小时和24小时)的蛋白质负载的函数,分别示于图18和19中。将相对转化率显示为用嗜热毁丝霉CBS 117.65Cel5A内切葡聚糖酶(0.2mg蛋白质每g葡聚糖)水解β-葡聚糖24小时后获得的转化率的百分数。
来自担子菌CBS 494.95和担子菌CBS 495.95的内切葡聚糖酶在水解β-葡聚糖时显示相似的性能,并在2小时水解后没有产生还原糖浓度的额外增加。相反,来自嗜热毁丝霉和里氏木霉的内切葡聚糖酶在2小时培育时间后继续产生新的还原性端基。嗜热毁丝霉内切葡聚糖酶在水解β-葡聚糖时显示比担子菌CBS 494.95 Cel5B内切葡聚糖酶和担子菌CBS 495.95 Cel5A内切葡聚糖酶更优的性能。
生物材料的保藏
依据布达佩斯条约的条款,下述的生物材料已经保藏于农业研究机构专利培养物保藏中心(Agricultural Research Service Patent Culture Collection),北区研究中心(Northern Regional Research Center),1815 University Street,Peoria,Illinois,61604,并给予下述的登录号:
保藏物                   登录号             保藏日期
大肠杆菌菌株PBCel5C      NRRL B-30900N       2006年2月23日
大肠杆菌菌株pCIC161      NRRL B-30902        2006年2月23日
大肠杆菌菌株pCIC453      NRRL B-30903        2006年2月23日
大肠杆菌菌株pCIC486      NRRL B-30904        2006年2月23日
所述菌株于下述条件下保藏:确保在本专利申请未决期间,由专利与商标委员依据37 C.F.R.§1.14和35 U.S.C.§122授权的人能够获得所述培养物。所述保藏物为所保藏菌株的基本上纯的培养物。在提交了该申请的副本,或其后续文本的国家,依据该外国专利法律的要求,可以获得所述保藏物。然而,应当理解,保藏物的获得并不构成对实施本发明的许可,实施本发明是对政府行为所授予的专利权的侵犯。
本文描述和要求保护的本发明并不受限于本文所公开的具体方面的范围,因为这些方面意欲作为本发明几个方面的说明。任何等价的方面意欲在本发明的范围之内。实际上,从前面的说明中,除本文所显示和描述的之外,本发明的多种修改对于本领域的技术人员来说是显而易见的。这些修改也意欲落入所附的权利要求的范围内。在冲突的情况下,将以包括定义部分的本公开为准。
本文引用了多篇参考文献,其公开的内容通过引用整体并入。
序列表
<110>诺维信股份有限公司(Novozymes,Inc.)
     诺维信公司(Novozymes A/S)
<120>具有内切葡聚糖酶活性的多肽和编码该多肽的多核苷酸
<130>10890.204-WO
<150>60784088
<151>2006-03-20
<160>15
<170>PatentIn version 3.4
<210>1
<211>12
<212>DNA
<213>嗜热毁丝霉(Myceliophthora thermophila)
<400>1
Figure A200780018204D00901
<210>2
<211>8
<212>DNA
<213>嗜热毁丝霉
<400>2
Figure A200780018204D00902
<210>3
<211>1188
<212>DNA
<213>嗜热毁丝霉
<400>3
Figure A200780018204D00911
<210>4
<211>389
<212>PRT
<213>嗜热毁丝霉
<400>4
Figure A200780018204D00912
Figure A200780018204D00921
<210>5
<211>1232
<212>DNA
<213>担子菌(BASIDIOMYCETE)CBS 495.95
<400>5
Figure A200780018204D00922
<210>6
<211>397
<212>PRT
<213>担子菌CBS 495.95
<400>6
Figure A200780018204D00923
<210>7
<211>1303
<212>DNA
<213>担子菌CBS 494.95
<400>7
Figure A200780018204D00932
Figure A200780018204D00941
<210>8
<211>429
<212>PRT
<213>担子菌CBS 494.95
<400>8
Figure A200780018204D00942
Figure A200780018204D00951
<210>9
<211>1488
<212>DNA
<213>巴西青霉(PENICILLIUM BRASILIANUM)
<400>9
Figure A200780018204D00952
Figure A200780018204D00961
<210>10
<211>421
<212>PRT
<213>巴西青霉
<400>10
Figure A200780018204D00962
Figure A200780018204D00971
<210>11
<211>29
<212>DNA
<213>巴西青霉
<220>
<221>mise_feature
<222>(21)..(21)
<223>N=A,C,G或T
<220>
<221>misc_feature
<222>(24)..(24)
<223>N=A,C,G或T
<220>
<221>misc_feature
<222>(27)..(27)
<223>R=A或G
<400>11
Figure A200780018204D00972
<210>12
<211>35
<212>DNA
<213>巴西青霉
<220>
<221>misc_feature
<222>(24)..(24)
<223>R=A或G
<220>
<221>misc_feature
<222>(27)..(27)
<223>N=A,C,G或T
<220>
<221>mise_feature
<222>(30)..(30)
<223>R=A或G
<220>
<221>mise_feature
<222>(33)..(33)
<223>R=A或G
<400>12
Figure A200780018204D00981
<210>13
<211>29
<212>DNA
<213>巴西青霉
<220>
<221>misc_feature
<222>(18)..(18)
<223>R=A或G
<220>
<221>misc_feature
<222>(21)..(21)
<223>R=A或G
<220>
<221>misc_feature
<222>(24)..(24)
<223>N=A,C,G或T
<220>
<221>mise_feature
<222>(27)..(27)
<223>R=A或G
<400>13
<210>14
<211>39
<212>DNA
<213>巴西青霉
<400>14
<210>15
<211>38
<212>DNA
<213>巴西青霉
<400>15
Figure A200780018204D00984

Claims (55)

1.具有内切葡聚糖酶活性的分离的多肽,其选自下组中的一种或多种:
(a)包含氨基酸序列的多肽,所述氨基酸序列与SEQ ID NO:4或SEQ IDNO:10的成熟多肽具有至少80%同一性,与SEQ ID NO:6的成熟多肽具有至少85%同一性,或与SEQ ID NO:8的成熟多肽具有至少75%同一性;
(b)由多核苷酸编码的多肽,所述多核苷酸在至少高严紧条件下与以下杂交:(i)SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9的成熟多肽编码序列,(ii)包含于SEQ ID NO:3或SEQ ID NO:9的成熟多肽编码序列中的cDNA序列,或包含SEQ ID NO:5或SEQ ID NO:7的成熟多肽编码序列的基因组DNA序列,或(iii)(i)或(ii)的全长互补链;
(c)由多核苷酸编码的多肽,所述多核苷酸与SEQ ID NO:3或SEQ ID NO:9的成熟多肽编码序列具有至少80%同一性,与SEQ ID NO:5的成熟多肽编码序列具有至少85%同一性,或者与SEQ ID NO:7的成熟多肽编码序列具有至少75%同一性;和
(d)变体,其包含取代、缺失和/或插入一个或几个氨基酸的SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8或SEQ ID NO:10的成熟多肽。
2.权利要求1的多肽,其包含:与SEQ ID NO:4的成熟多肽具有优选至少80%同一性,更优选至少85%同一性,甚至更优选至少90%同一性,并且最优选至少95%同一性的氨基酸序列;与SEQ ID NO:6的成熟多肽具有优选至少85%同一性,更优选至少90%同一性,并且甚至最优选至少95%同一性的氨基酸序列;与SEQ ID NO:8的成熟多肽具有优选至少75%同一性,更优选至少80%同一性,甚至更优选至少85%同一性,最优选至少90%同一性,并且甚至最优选至少95%同一性的氨基酸序列;或者与SEQ ID NO:10的成熟多肽具有优选至少80%同一性,更优选至少85%同一性,甚至更优选至少90%同一性,并且最优选至少95%同一性的氨基酸序列。
3.权利要求1的多肽,其包含SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8或SEQ ID NO:10的氨基酸序列,或由SEQ ID NO:4、SEQ ID NO:6、SEQ IDNO:8或SEQ ID NO:10的氨基酸序列组成;或其具有内切葡聚糖酶活性的片段。
4.权利要求3的多肽,其包含SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8或SEQ ID NO:10的氨基酸序列或由SEQ ID NO:4、SEQ ID NO:6、SEQ IDNO:8或SEQ ID NO:10的氨基酸序列组成。
5.权利要求3的多肽,其包含SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8或SEQ ID NO:10的成熟多肽或由SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8或SEQ ID NO:10的成熟多肽组成。
6.权利要求1的多肽,其由多核苷酸编码,所述多核苷酸在至少高严紧条件下与以下序列杂交:(i)SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9的成熟多肽编码序列,(ii)包含于SEQ ID NO:3或SEQ ID NO:9的成熟多肽编码序列中的cDNA序列,或包含SEQ ID NO:5或SEQ ID NO:7的成熟多肽编码序列的基因组DNA序列,或(iii)(i)或(ii)的互补链。
7.权利要求1的多肽,其由如下多核苷酸编码:与SEQ ID NO:3的成熟多肽编码序列具有优选至少80%同一性,更优选至少85%同一性,甚至更优选至少90%同一性,并且最优选至少95%同一性的多核苷酸;与SEQ ID NO:5的成熟多肽编码序列具有优选至少85%同一性,更优选至少90%同一性,并且最优选至少95%同一性的多核苷酸;与SEQ ID NO:7的成熟多肽编码序列具有优选至少75%同一性,更优选至少80%同一性,甚至更优选至少85%同一性,最优选至少90%同一性,并且甚至最优选至少95%同一性的多核苷酸;或与SEQ ID NO:9的成熟多肽编码序列具有优选至少80%同一性,更优选至少85%同一性,甚至更优选至少90%同一性,并且最优选至少95%同一性的多核苷酸。
8.权利要求1的多肽,所述多肽由多核苷酸或其编码具有内切葡聚糖酶活性的多肽片段的亚序列编码,所述多核苷酸包含SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9,或由SEQ ID NO:3、SEQ ID NO:5、SEQIDNO:7或SEQ ID NO:9组成。
9.权利要求8的多肽,其由多核苷酸编码,所述多核苷酸包含SEQ IDNO:3、SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9或由SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9组成。
10.权利要求8的多肽,其由多核苷酸编码,所述多核苷酸包含SEQ IDNO:3、SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9的成熟多肽编码序列或由SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9的成熟多肽编码序列组成。
11.权利要求1的多肽,其中所述多肽是变体,该变体包含取代、缺失和/或插入一个或几个氨基酸的SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8或SEQ ID NO:10的成熟多肽。
12.权利要求1的多肽,所述多肽由下述质粒中所含的多核苷酸编码:包含在大肠杆菌NRRL B-30902中的质粒pCIC161,包含在大肠杆菌NRRLB-30903中的质粒pCIC453,包含在大肠杆菌NRRL B-30904中的质粒pCIC486,或者包含在大肠杆菌NRRLB-30900N中的质粒pPBCel5C。
13.权利要求1、2、5或11的多肽,其中所述成熟多肽是SEQ ID NO:4的氨基酸17至389,SEQ ID NO:6的氨基酸16至397,SEQ ID NO:8的氨基酸22至429,或SEQ ID NO:10的氨基酸25至421。
14.权利要求1、6、7或10的多肽,其中所述成熟多肽编码序列是SEQID NO:3的核苷酸67至1185,SEQ ID NO:5的核苷酸84至1229,SEQ ID NO:7的核苷酸77至1300,或SEQ ID NO:9的核苷酸73至1468。
15.权利要求1-14中任一项的多肽,其还对一种或多种选自下组的底物具有酶活性:木聚糖、木葡聚糖、阿拉伯木聚糖、1,4-β-D-甘露聚糖和半乳甘露聚糖。
16.分离的多核苷酸,其包含编码权利要求1-15中任一项的多肽的核苷酸序列。
17.权利要求16的分离的多核苷酸,其在SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9的成熟多肽编码序列中包含至少一个突变,其中突变的核苷酸序列分别编码SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8或SEQ ID NO:10的成熟多肽。
18.核酸构建体,其包含权利要求16或17的多核苷酸,所述多核苷酸与一个或几个调控序列可操作地连接,所述调控序列指导多肽在表达宿主中产生。
19.重组表达载体,其包含权利要求18的核酸构建体。
20.重组宿主细胞,其包含权利要求18的核酸构建体。
21.用于产生权利要求1-15中任一项的多肽的方法,其包括:(a)在有益于所述多肽产生的条件下培养细胞,所述细胞以其野生型形式能够产生所述多肽;和(b)回收所述多肽。
22.用于产生权利要求1-15中任一项的多肽的方法,其包括:(a)在有益于所述多肽产生的条件下培养包含核酸构建体的宿主细胞,所述核酸构建体包含编码所述多肽的核苷酸序列;和(b)回收所述多肽。
23.用于产生亲本细胞的突变体的方法,所述方法包括破坏或缺失编码权利要求1-15中任一项的多肽的核苷酸序列,其导致突变体与亲本细胞相比产生较少的所述多肽。
24.通过权利要求23的方法产生的突变细胞。
25.权利要求24的突变细胞,所述突变细胞还包含编码天然或异源蛋白质的基因。
26.用于产生蛋白质的方法,其包括:(a)在有益于所述蛋白质产生的条件下培养权利要求25的突变细胞;和(b)回收所述蛋白质。
27.通过以下方法获得的分离的多核苷酸:(a)在至少高严紧条件下将DNA的群体与以下杂交:(i)SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9的成熟多肽编码序列,(ii)包含于SEQ ID NO:3或SEQ IDNO:9的成熟多肽编码序列中的cDNA序列,或包含SEQ ID NO:5或SEQ IDNO:7的成熟多肽编码序列的基因组DNA序列,或(iii)(i)或(ii)的互补链;和(b)分离所述杂交多核苷酸,其编码具有内切葡聚糖酶活性的多肽。
28.权利要求27的分离的多核苷酸,其中所述成熟多肽编码序列是SEQIDNO:3的核苷酸67至1185,SEQ ID NO:5的核苷酸84至1229,SEQ ID NO:7的核苷酸77至1300,或SEQ ID NO:9的核苷酸73至1468。
29.用于产生包含突变核苷酸序列的多核苷酸的方法,其包括:(a)将至少一个突变引入SEQ ID NO:3、SEQ ID NO:5、SEQ ID NO:7或SEQ ID NO:9的成熟多肽编码序列中,其中所述突变的核苷酸序列编码由SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8或SEQ ID NO:10的成熟多肽组成的多肽;和(b)回收包含突变核苷酸序列的多核苷酸。
30.权利要求29的方法,其中所述成熟多肽编码序列是SEQ ID NO:3的核苷酸67至1185,SEQ ID NO:5的核苷酸84至1229,SEQ ID NO:7的核苷酸77至1300,或SEQ ID NO:9的核苷酸73至1468。
31.由权利要求29或30的方法产生的突变多核苷酸。
32.用于产生多肽的方法,其包括:(a)在有益于多肽产生的条件下培养细胞,所述细胞包含编码多肽的权利要求31的突变多核苷酸;和(b)回收所述多肽。
33.核酸构建体,其包含编码蛋白质的基因,所述基因与编码信号肽的第一核苷酸序列和编码前肽的第二核苷酸序列中的一个或两者可操作地连接,所述信号肽包含SEQ ID NO:4的氨基酸1至17,SEQ ID NO:6的氨基酸1至15,SEQ ID NO:8的氨基酸1至21,或SEQ ID NO:10的氨基酸1至16或由SEQ ID NO:4的氨基酸1至17,SEQ ID NO:6的氨基酸1至15,SEQID NO:8的氨基酸1至21,或SEQ ID NO:10的氨基酸1至16组成,所述前肽包含SEQ ID NO:10的氨基酸17至24或由SEQ ID NO:10的氨基酸17至24组成,其中所述基因对于所述核苷酸序列是外源的。
34.包含权利要求33的核酸构建体的重组表达载体。
35.包含权利要求33的核酸构建体的重组宿主细胞。
36.用于产生蛋白质的方法,其包括:(a)在有益于蛋白质产生的条件下培养权利要求35的重组宿主细胞;和(b)回收所述蛋白质。
37.用于产生权利要求1-15中任一项的多肽的方法,其包括:(a)在有益于所述多肽产生的条件下培养转基因植物或植物细胞,所述转基因植物或植物细胞包含编码具有内切葡聚糖酶活性的多肽的多核苷酸;和(b)回收所述多肽。
38.转基因植物、植物部分或植物细胞,其已经用编码权利要求1-15中任一项的多肽的多核苷酸转化。
39.降解或转化含纤维素物质的方法,其包括:用组合物处理含纤维素物质,所述组合物包含有效量的权利要求1-15中任一项的具有内切葡聚糖酶活性的多肽。
40.权利要求39的方法,其中所述组合物还包含有效量的内切-1,4-β-葡聚糖酶、外切-1,4-β-D-葡聚糖酶和/或β-D-葡糖苷酶。
41.权利要求39或40的方法,其中所述组合物还包含有效量的选自下组的一种或多种酶:半纤维素酶、酯酶、蛋白酶、漆酶和过氧化物酶。
42.权利要求39-41中任一项的方法,其中所述方法是预处理过程;同步糖化和发酵过程(SSF)中的步骤;或者混合水解和发酵过程(HHF)中的步骤。
43.权利要求39-42中任一项的方法,还包括回收已降解或已转化的含纤维素物质。
44.降解或转化含纤维素物质的方法,所述方法包括:用包含权利要求20的宿主细胞的组合物处理生物质。
45.权利要求44的方法,其中所述组合物还包含有效量的内切-1,4-β-葡聚糖酶、外切-1,4-β-D-葡聚糖酶和/或β-D-葡糖苷酶。
46.权利要求44或45的方法,其中所述组合物还包含有效量的选自下组的一种或多种酶:半纤维素酶、酯酶、蛋白酶、漆酶和过氧化物酶。
47.权利要求44-46中任一项的方法,还包括回收已降解或已转化的含纤维素物质。
48.产生物质的方法,其包括:(a)用组合物糖化含纤维素物质,所述组合物包含有效量的权利要求1-15中任一项的具有内切葡聚糖酶活性的多肽,(b)用一种或多种发酵微生物发酵步骤(a)的糖化的含纤维素物质;和(c)从发酵中回收所述物质。
49.权利要求48的方法,其中所述组合物还包含有效量的内切-1,4-β-葡聚糖酶、外切-1,4-β-D-葡聚糖酶和/或β-D-葡糖苷酶。
50.权利要求48或49的方法,其中所述组合物还包含有效量的选自下组的一种或多种酶:半纤维素酶、酯酶、蛋白酶、漆酶和过氧化物酶。
51.权利要求48-50中任一项的方法,其中步骤(a)和(b)在同步糖化和发酵中同时进行。
52.权利要求48-51中任一项的方法,其中所述物质是醇、有机酸、酮、氨基酸或气体。
53.抑制细胞中多肽的表达的方法,所述方法包括对细胞施用双链RNA(dsRNA)分子或者在细胞中表达双链RNA分子,其中所述dsRNA包含编码SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8或SEQ ID NO:10的成熟多肽的多核苷酸的亚序列或部分。
54.权利要求53的方法,其中所述dsRNA长度为约15、16、17、18、19、20、21、22、23、24、25或更多的双链体核苷酸。
55.用于抑制多肽在细胞中表达的双链RNA(dsRNA)分子,其中所述dsRNA包括编码SEQ ID NO:4、SEQ ID NO:6、SEQ ID NO:8或SEQ ID NO:10的成熟多肽的多核苷酸的亚序列或部分。
CNA2007800182046A 2006-03-20 2007-03-09 具有内切葡聚糖酶活性的多肽和编码该多肽的多核苷酸 Pending CN101454444A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US78408806P 2006-03-20 2006-03-20
US60/784,088 2006-03-20

Related Child Applications (1)

Application Number Title Priority Date Filing Date
CN201310407021.0A Division CN103740674A (zh) 2006-03-20 2007-03-09 具有内切葡聚糖酶活性的多肽和编码该多肽的多核苷酸

Publications (1)

Publication Number Publication Date
CN101454444A true CN101454444A (zh) 2009-06-10

Family

ID=38523152

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201310407021.0A Pending CN103740674A (zh) 2006-03-20 2007-03-09 具有内切葡聚糖酶活性的多肽和编码该多肽的多核苷酸
CNA2007800182046A Pending CN101454444A (zh) 2006-03-20 2007-03-09 具有内切葡聚糖酶活性的多肽和编码该多肽的多核苷酸

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN201310407021.0A Pending CN103740674A (zh) 2006-03-20 2007-03-09 具有内切葡聚糖酶活性的多肽和编码该多肽的多核苷酸

Country Status (8)

Country Link
US (4) US8143482B2 (zh)
EP (2) EP2336309A3 (zh)
CN (2) CN103740674A (zh)
AT (1) ATE513907T1 (zh)
BR (1) BRPI0708949B1 (zh)
DK (1) DK1999257T3 (zh)
ES (1) ES2368608T3 (zh)
WO (1) WO2007109441A2 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102399769A (zh) * 2011-11-16 2012-04-04 广东溢多利生物科技股份有限公司 一种优化改良的中性纤维素酶meg1及其基因和应用
WO2013087029A1 (en) * 2011-12-15 2013-06-20 Novozymes, Inc. Polypeptides having endoglucanase activity and polynucleotides encoding same
CN104136608A (zh) * 2011-12-15 2014-11-05 诺维信股份有限公司 具有内切葡聚糖酶活性的多肽和编码该多肽的多核苷酸
CN111593035A (zh) * 2009-12-01 2020-08-28 诺维信公司 具有葡糖淀粉酶活性的多肽及其编码多核苷酸

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
BRPI0908564A2 (pt) 2008-03-06 2019-09-24 Novozymes As polipeptídeo e polinucleotídeo isolados, construção de ácido nucleico, célula hospedeira recombinante, métodos para produzir o polipeptídeo, para produzir um mutante de uma célula precursora, para inibir a expressão de um polipeptídeo, para degradar ou converter um material celulósico, para produzir um produto de fermentação e para fermentar um material celulósico, planta transgênica, parte de planta ou célula de planta, e, molécula de rna inibidor de filamento duplo
CA2724638C (en) 2008-05-27 2020-02-18 Dako Denmark A/S Hybridization compositions and methods comprising a polar aprotic solvent
EP2401395A1 (en) * 2009-02-26 2012-01-04 Dako Denmark A/S Compositions and methods for rna hybridization applications
CN102947442B (zh) 2009-11-06 2016-03-09 诺维信股份有限公司 用于糖化纤维素材料的组合物
EP2496692B1 (en) 2009-11-06 2016-03-16 Novozymes, Inc. Polypeptides having xylanase activity and polynucleotides encoding same
US9493802B2 (en) 2010-08-20 2016-11-15 Codexis, Inc. Use of glycohydrolase 61 protein variants with improved thermostability for processing cellulose
US8624082B2 (en) 2010-08-30 2014-01-07 Novozymes A/S Polypeptides having xylanase activity and polynucleotides encoding same
US9303074B2 (en) 2010-08-30 2016-04-05 Novoyzmes A/S Polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
WO2012030844A1 (en) * 2010-08-30 2012-03-08 Novozymes A/S Polypeptides having endoglucanase activity and polynucleotides encoding same
WO2012030811A1 (en) 2010-08-30 2012-03-08 Novozymes A/S Polypeptides having cellobiohydrolase activity and polynucleotides encoding same
US8629325B2 (en) 2010-08-30 2014-01-14 Novozymes A/S Polypeptides having beta-glucosidase activity and polynucleotides encoding same
CA2824615A1 (en) 2010-12-21 2012-06-28 Codexis, Inc. Endoglucanase variants
US8525002B2 (en) 2011-04-20 2013-09-03 Limagrain Europe SA Inbred corn line ML9
BR112014004171A2 (pt) 2011-08-22 2018-11-06 Codexis Inc variantes da proteína glicósideo hidrolase gh61 e cofatores que aumentam a atividade de gh61
US10662465B2 (en) 2011-09-30 2020-05-26 Agilent Technologies, Inc. Hybridization compositions and methods using formamide
US11118226B2 (en) 2011-10-21 2021-09-14 Agilent Technologies, Inc. Hybridization compositions and methods
US8778639B1 (en) * 2013-02-12 2014-07-15 Novozymes Inc. Polypeptides having endoglucanase activity and polynucleotides encoding same
US9175276B2 (en) * 2013-02-12 2015-11-03 Novozymes, Inc. Polypeptides having endoglucanase activity and polynucleotides encoding same
US8771993B1 (en) * 2013-02-12 2014-07-08 Novozymes A/S Polypeptides having endoglucanse activity and polynucleotides encoding same
US20140230098A1 (en) * 2013-02-12 2014-08-14 Novozymes Inc. Polypeptides Having Endoglucanase Activity and Polynucleotides Encoding Same
FR3013731B1 (fr) 2013-11-22 2017-09-01 Ifp Energies Now Variants d'endoglucanases a activite amelioree et leurs utilisations
DK3092312T3 (en) 2014-01-07 2019-03-04 Novozymes As INSURANCE OF MAN-MADE CELLULOSE-CONTAINING MATERIALS
FR3022557B1 (fr) 2014-06-20 2019-01-25 Proteus Variants d'exoglucanases a activite amelioree et leurs utilisations
FR3022558B1 (fr) 2014-06-20 2019-01-25 Proteus Variants d'exoglucanases a activite amelioree et leurs utilisations
EP3416740B1 (en) 2016-02-19 2021-01-06 Intercontinental Great Brands LLC Processes to create multiple value streams from biomass sources
CN110846231B (zh) * 2019-12-03 2020-11-27 安徽农业大学 一株产漆酶真菌毛栓孔菌La-7及其应用

Family Cites Families (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB1590432A (en) 1976-07-07 1981-06-03 Novo Industri As Process for the production of an enzyme granulate and the enzyme granuate thus produced
DK263584D0 (da) 1984-05-29 1984-05-29 Novo Industri As Enzymholdige granulater anvendt som detergentadditiver
EG18543A (en) 1986-02-20 1993-07-30 Albright & Wilson Protected enzyme systems
DK122686D0 (da) 1986-03-17 1986-03-17 Novo Industri As Fremstilling af proteiner
US5223409A (en) 1988-09-02 1993-06-29 Protein Engineering Corp. Directed evolution of novel binding proteins
PT97110B (pt) 1990-03-23 1998-11-30 Gist Brocades Nv Processo para catalisar reaccoes acelaraveis por enzimas, mediante adicao ao meio reaccional de sementes de plantas transgenicas e para obtencao das referidas sementes
IL99552A0 (en) 1990-09-28 1992-08-18 Ixsys Inc Compositions containing procaryotic cells,a kit for the preparation of vectors useful for the coexpression of two or more dna sequences and methods for the use thereof
MX9206979A (es) 1991-12-04 1993-07-01 Novo Nordisk As Metodo de clonacion de proteinas en levaduras
US5945327A (en) * 1992-07-02 1999-08-31 Novo Nordisk A/S DNA constructs and methods of producing cellulytic enzymes
DE69333067T2 (de) 1992-12-23 2004-05-13 Novozymes A/S Enzym mit endoglukanase wirkung
DK81293D0 (da) 1993-07-06 1993-07-06 Novo Nordisk As Enzym
DE4343591A1 (de) 1993-12-21 1995-06-22 Evotec Biosystems Gmbh Verfahren zum evolutiven Design und Synthese funktionaler Polymere auf der Basis von Formenelementen und Formencodes
US5605793A (en) 1994-02-17 1997-02-25 Affymax Technologies N.V. Methods for in vitro recombination
DK0765394T3 (da) 1994-06-03 2001-12-10 Novozymes As Oprensede Myceliopthora-laccaser og nukleinsyrer der koder for disse
AU2705895A (en) 1994-06-30 1996-01-25 Novo Nordisk Biotech, Inc. Non-toxic, non-toxigenic, non-pathogenic fusarium expression system and promoters and terminators for use therein
CA2239576A1 (en) 1996-01-29 1997-08-07 Novo Nordisk A/S Process for removal or bleaching of soiling or stains from cellulosic fabric
US7883872B2 (en) 1996-10-10 2011-02-08 Dyadic International (Usa), Inc. Construction of highly efficient cellulase compositions for enzymatic hydrolysis of cellulose
US5811381A (en) * 1996-10-10 1998-09-22 Mark A. Emalfarb Cellulase compositions and methods of use
US6506559B1 (en) 1997-12-23 2003-01-14 Carnegie Institute Of Washington Genetic inhibition by double-stranded RNA
CA2345356C (en) 1998-10-06 2012-10-02 Mark Aaron Emalfarb Transformation system in the field of filamentous fungal hosts
AU6188599A (en) 1998-10-26 2000-05-15 Novozymes A/S Constructing and screening a dna library of interest in filamentous fungal cells
US6272522B1 (en) 1998-11-17 2001-08-07 Sun Microsystems, Incorporated Computer data packet switching and load balancing system using a general-purpose multiprocessor architecture
US6511824B1 (en) 1999-03-17 2003-01-28 Exelixis, Inc. Nucleic acids and polypeptides of invertebrate TWIK channels and methods of use
CN100532561C (zh) 1999-03-22 2009-08-26 诺沃奇梅兹有限公司 新的葡糖淀粉酶及编码它的核酸序列
US6531644B1 (en) 2000-01-14 2003-03-11 Exelixis, Inc. Methods for identifying anti-cancer drug targets
ES2166316B1 (es) 2000-02-24 2003-02-16 Ct Investig Energeticas Ciemat Procedimiento de produccion de etanol a partir de biomasa lignocelulosica utilizando una nueva levadura termotolerante.
AU2002211665B2 (en) 2000-10-12 2005-10-20 Exelixis, Inc. Human Ect2 and methods of use
EP2295544B1 (en) 2001-06-26 2016-06-22 Novozymes A/S Polypeptides having cellobiohydrolase I activity and polynucleotides encoding same
US7063962B2 (en) 2001-07-20 2006-06-20 Novozymes A/S DNA sequences for regulating transcription
EP1471799A2 (en) * 2002-01-25 2004-11-03 DSM IP Assets B.V. Thermostable enzyme compositions
CN102220191B (zh) 2003-12-19 2014-05-21 诺维信公司 糖化工艺
DK1713825T3 (da) 2004-01-30 2012-11-05 Novozymes Inc Polypeptider med cellulolytisk forøgende aktivitet og polynukleotider der koder for samme
BRPI0507431B1 (pt) 2004-02-06 2021-07-27 Novozymes, Inc Célula hospedeira microbiana recombinante, construto de ácido nucleico, vetor de expressão recombinante, composição detergente, e, métodos para produzir o polipeptídeo gh61, para degradar um material celulósico e para produzir um produto de fermentação
SI3219806T1 (sl) * 2004-03-25 2020-08-31 Novoyzmes, Inc. Postopki za degradiranje ali pretvorbo polisaharidov rastlinske celične stene
WO2008095033A2 (en) * 2007-01-30 2008-08-07 Verenium Corporation Enzymes for the treatment of lignocellulosics, nucleic acids encoding them and methods for making and using them
US7923236B2 (en) 2007-08-02 2011-04-12 Dyadic International (Usa), Inc. Fungal enzymes

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111593035A (zh) * 2009-12-01 2020-08-28 诺维信公司 具有葡糖淀粉酶活性的多肽及其编码多核苷酸
CN102399769A (zh) * 2011-11-16 2012-04-04 广东溢多利生物科技股份有限公司 一种优化改良的中性纤维素酶meg1及其基因和应用
CN102399769B (zh) * 2011-11-16 2013-05-01 广东溢多利生物科技股份有限公司 一种优化改良的中性纤维素酶meg1及其基因和应用
WO2013087029A1 (en) * 2011-12-15 2013-06-20 Novozymes, Inc. Polypeptides having endoglucanase activity and polynucleotides encoding same
CN104136608A (zh) * 2011-12-15 2014-11-05 诺维信股份有限公司 具有内切葡聚糖酶活性的多肽和编码该多肽的多核苷酸

Also Published As

Publication number Publication date
CN103740674A (zh) 2014-04-23
BRPI0708949B1 (pt) 2017-04-04
US9428742B2 (en) 2016-08-30
US20110047652A1 (en) 2011-02-24
US20120151633A1 (en) 2012-06-14
US20120331587A1 (en) 2012-12-27
BRPI0708949A2 (pt) 2011-06-14
WO2007109441A3 (en) 2008-03-13
US8614079B2 (en) 2013-12-24
ES2368608T3 (es) 2011-11-18
EP2336309A3 (en) 2011-08-10
US8288615B2 (en) 2012-10-16
US8143482B2 (en) 2012-03-27
EP2336309A2 (en) 2011-06-22
DK1999257T3 (da) 2011-10-31
EP1999257A2 (en) 2008-12-10
EP1999257B1 (en) 2011-06-22
ATE513907T1 (de) 2011-07-15
WO2007109441A2 (en) 2007-09-27
US20130340122A1 (en) 2013-12-19

Similar Documents

Publication Publication Date Title
US9428742B2 (en) Polypeptides having endoglucanase activity and polynucleotides encoding same
CN101874109B (zh) 具有纤维二糖水解酶活性的多肽和编码该多肽的多核苷酸
US8791328B2 (en) Polypeptides having endoglucanase activity and polynucleotides encoding same
CA2625933C (en) Polypeptides having beta-glucosidase activity and polynucleotides encoding same
CN101952420A (zh) 具有纤维素分解增强活性的多肽和编码该多肽的多核苷酸
CN101945889A (zh) 具有纤维素分解增强活性的多肽和编码该多肽的多核苷酸
CN101952421A (zh) 具有内切葡聚糖酶活性的多肽和编码所述多肽的多核苷酸
CN101952304A (zh) 具有纤维素分解增强活性的多肽和编码该多肽的多核苷酸
CN101970471A (zh) 具有纤维素分解增强活性的多肽和编码该多肽的多核苷酸
CN101784659A (zh) 具有纤维素分解增强活性的多肽和编码它的多核苷酸
CN102016016A (zh) 具有β-葡糖苷酶活性的多肽和编码该多肽的多核苷酸
US8268589B2 (en) Polypeptides having endoglucanase activity and polynucleotides encoding same
CN102016017A (zh) 具有内切葡聚糖酶活性的多肽和编码该多肽的多核苷酸

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20090610