CN101942428A - Botryosphaeria Rhodina的多肽 - Google Patents

Botryosphaeria Rhodina的多肽 Download PDF

Info

Publication number
CN101942428A
CN101942428A CN2010102613168A CN201010261316A CN101942428A CN 101942428 A CN101942428 A CN 101942428A CN 2010102613168 A CN2010102613168 A CN 2010102613168A CN 201010261316 A CN201010261316 A CN 201010261316A CN 101942428 A CN101942428 A CN 101942428A
Authority
CN
China
Prior art keywords
polypeptide
seq
specifically
sequence
identity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2010102613168A
Other languages
English (en)
Inventor
柯克·M·施诺尔
莱纳·兰格
珀尼尔·U·博尔韦格
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Novozymes AS
Original Assignee
Novozymes AS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Novozymes AS filed Critical Novozymes AS
Publication of CN101942428A publication Critical patent/CN101942428A/zh
Pending legal-status Critical Current

Links

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01032Xylan endo-1,3-beta-xylosidase (3.2.1.32), i.e. endo-1-3-beta-xylanase
    • AHUMAN NECESSITIES
    • A61MEDICAL OR VETERINARY SCIENCE; HYGIENE
    • A61PSPECIFIC THERAPEUTIC ACTIVITY OF CHEMICAL COMPOUNDS OR MEDICINAL PREPARATIONS
    • A61P43/00Drugs for specific purposes, not provided for in groups A61P1/00-A61P41/00
    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K14/00Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof
    • C07K14/37Peptides having more than 20 amino acids; Gastrins; Somatostatins; Melanotropins; Derivatives thereof from fungi
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/0004Oxidoreductases (1.)
    • C12N9/0012Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7)
    • C12N9/0044Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on other nitrogen compounds as donors (1.7)
    • C12N9/0046Oxidoreductases (1.) acting on nitrogen containing compounds as donors (1.4, 1.5, 1.6, 1.7) acting on other nitrogen compounds as donors (1.7) with oxygen as acceptor (1.7.3)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/16Hydrolases (3) acting on ester bonds (3.1)
    • C12N9/18Carboxylic ester hydrolases (3.1.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2477Hemicellulases not provided in a preceding group
    • C12N9/248Xylanases
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/48Hydrolases (3) acting on peptide bonds (3.4)
    • C12N9/50Proteinases, e.g. Endopeptidases (3.4.21-3.4.25)
    • C12N9/58Proteinases, e.g. Endopeptidases (3.4.21-3.4.25) derived from fungi
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01008Endo-1,4-beta-xylanase (3.2.1.8)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01021Beta-glucosidase (3.2.1.21)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01099Arabinan endo-1,5-alpha-L-arabinosidase (3.2.1.99)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Medicinal Chemistry (AREA)
  • Molecular Biology (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Biotechnology (AREA)
  • Mycology (AREA)
  • Gastroenterology & Hepatology (AREA)
  • Biophysics (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Nuclear Medicine, Radiotherapy & Molecular Imaging (AREA)
  • General Chemical & Material Sciences (AREA)
  • Chemical Kinetics & Catalysis (AREA)
  • Pharmacology & Pharmacy (AREA)
  • Animal Behavior & Ethology (AREA)
  • Public Health (AREA)
  • Veterinary Medicine (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)
  • Peptides Or Proteins (AREA)

Abstract

本发明涉及Botryosphaeria Rhodina的多肽,更具体地,本发明涉及自Botryosphaeria rhodina CBS 274.96分泌的功能性多肽。

Description

Botryosphaeria Rhodina的多肽
本申请是申请日为2005年08月06日、申请号为200580034120.2(国际申请号为PCT/DK2005/000519)、发明名称为“Botryosphaeria Rhodina的多肽”的发明申请的分案申请。
发明领域
本发明涉及由以保藏号CBS 274.96保藏的棉色二孢(Diplodia gossypina),异名为Botryospaeria rhodina的mRNA中包含的多核苷酸所编码的功能性多肽。本发明还涉及编码这些多肽或有助于它们表达的多核苷酸或这些多核苷酸的构建体,以及制备该多肽的方法。本发明还涉及包含该多肽的组合物和该多肽的用途。
背景技术
Botryosphaeria rhodina(Berk.&M.A.Curtis)Arx,(异名Diplodia gossypina Cooke)。目前已发表的关于这种生物的特征描述的报道非常少;Selbmann等在2003年报道了Botryosphaeria rhodina的外泌多糖(exopolysaccharide)生产(Selbmann L,Stingele F和Petruccioli M(2003).Exopolysaccharide production by filamentous fungi:the example of Botryosphaeria rhodina.Antonie van Leeuwenhoek,84:2,pp.135-145)。有单独的一篇专利涉及使用Botryosphaeria rhodina羟化β-二氢大马酮作为烟草的增香剂(CH654567-A)。通过发酵该生物还可以生产茉莉酸(EP1118672-A)。先前已报道了纤维二糖水解酶(cellobiohydrolases)(WO 03/000941-A2)和乳糖酶(WO 01/49878-A)的存在。
在新酶的探寻中,还知道通过对可能的候选物进行特定的酶测定来筛选这样的新酶。该方法受酶测定的可用性的限制,而且不能鉴定活性尚未知的功能性酶或多肽。
另外,全基因测序(whole genome sequencing)是一种获得来自特定的微生物的所有基因上的信息的已知方法,例如Fleischmann等;Whole genome sequences and assembly of Haemophilus influenzae Rd;Nature 269:496-512;(1995)描述的那样。
工业上应用的大多数酶都是被微生物分泌到介质中的酶。但是,微生物的基因组只有百分之几是编码分泌蛋白质的。例如,枯草芽孢杆菌(Bacillus subtilis)基因组或其最接近的亲缘物种只有4%是编码分泌蛋白质的。(Van Dijl等:Protein transport pathways in Bacillus subtilis:a ge-nome-based road map;于″Basillus subtilis and it′s closest relatives″-From genes to cells;p.337-355;A.L.Sonenshein编;ASM Press 2002)。
基因组测序的缺点之一是所得序列的绝大部分是编码非分泌蛋白质的。
特别地,对于真核生物例如真菌而言,基因组测序的另一个缺点是基因组的大小比细菌基因组大很多倍,从而通过这种方法来发现基因要耗费更多的成本和时间。
cDNA随机测序(表达序列标签,或称EST)是另一种可以发现分泌蛋白质的手段。一般地,就分泌蛋白的鉴定而言EST方法有两个缺点:1)取决于被测序的cDNA文库所用的诱导条件,只有很少的cDNA,通常为0.5%-15%或甚至1-5%的cDNA编码分泌蛋白质;2)所有的克隆都来自cDNA池(pool),该cDNA池是从这些在生物中与各个特定的基因成比例地存在的mRNA得来的。
另一种已知的方法是信号捕捉(signal trapping),该方法通过与自身缺少信号的胞外报道基因翻译融合,来鉴定编码信号肽的基因包括核苷酸。
发明概述
微生物的基因组包含成千上万种不同的基因,其中一些编码多肽,一些编码RNA。微生物基因组中只有有限数量的基因编码这样的功能性多肽,它们被该微生物分泌到介质中以实现其外部功能。
这些多肽能够以显著的量在连续的过程中生产,而不破坏产生这些多肽的细胞,从这一点看它们在工业上是令人感兴趣的。
本发明的目的是鉴定和提供由以保藏号CBS 274.96保藏的Botryosphaeria rhodina分泌的、对Botryosphaeria rhodina起功能性作用的多肽,因为这些多肽不仅可用于工业用途,而且可以以工业相关的过程/方法和产量生产。
本发明在第一个方面中提供分离的多肽,其选自:
(a)包含氨基酸序列的多肽,所述氨基酸序列与由SEQ ID NO:2,4,6,8,10,12,14,16,18,20,22,24,26,28,30 32,34,36,38,40和42构成的组的中所包含的成熟多肽具有至少90%的同一性;
(b)由核苷酸序列所编码的多肽,该核苷酸序列在高度严紧条件下与多核苷酸探针杂交,所述多核苷酸探针选自:
(i)核苷酸序列的互补链,所述核苷酸序列选自SEQ ID NO:1,3,5,7,9,11,13,15,17,19,21,23,25,27,39,31,33,35,37,39和41的编码成熟多肽的区域,
(ii)核苷酸序列中所包含的cDNA序列的互补链,所述核苷酸序列选自SEQ ID NO:1,3,5,7,9,11,13,15,17,19,21,23,25,27,39,31,33,35,37,39和41的编码成熟多肽的区域,
其中所述多肽具有由SEQ ID NO:2,4,6,8,10,12,14,16,18,20,22,24,26,28,30,32,34,36,38,40和42构成的组中所包含的相应成熟多肽的功能。
本发明的另一个方面涉及分离的酶,其选自:
(a)包含氨基酸序列的酶,所述氨基酸序列与选自以CBS保藏号274.96保藏的Botryosphaeria rhodina菌株所分泌的木聚糖酶、丝氨酸酯酶、过氧化物酶、GH 61A多肽、GH 61B多肽、GH 61C多肽、GH 61D多肽、β-葡糖苷酶、内切阿拉伯糖酶(endo-arabinase)和胃蛋白酶肽酶的成熟酶的氨基酸序列具有至少90%的同一性。
(b)由核苷酸序列编码的多肽,该核苷酸序列在高度严紧条件下与选自下列的多核苷酸探针杂交:
(i)核苷酸序列的互补链,所述核苷酸序列包含于以CBS保藏号274.96保藏的Botryosphaeria rhodina菌株中,并编码成熟酶,该成熟酶选自该菌株所分泌的木聚糖酶、丝氨酸酯酶、过氧化物酶、GH 61A多肽、GH 61B多肽、GH 61C多肽、GH 61D多肽、β-葡糖苷酶、内切阿拉伯糖酶和胃蛋白酶肽酶,
(ii)核苷酸序列所包含的cDNA序列的互补链,所述核苷酸序列包含于以CBS保藏号274.96保藏的Botryosphaeria rhodina菌株中,并编码成熟酶,该成熟酶选自该菌株所分泌的木聚糖酶、丝氨酸酯酶、过氧化物酶、GH 61A多肽、GH 61B多肽、GH 61C多肽、GH 61D多肽、β-葡糖苷酶、内切阿拉伯糖酶和胃蛋白酶肽酶;
其中所述酶具有选自木聚糖酶、丝氨酸酯酶、过氧化物酶、GH 61A多肽、GH 61B多肽、GH 61C多肽、GH 61D多肽、β-葡糖苷酶、内切阿拉伯糖酶和胃蛋白酶肽酶的功能。
本发明的另外的方面提供编码本发明多肽的多核苷酸;包含编码该多肽的多核苷酸的核苷酸构建体,其中所述多核苷酸与一种或多种指导该多肽在宿主细胞中生产的调控序列可操作地连接;包含本发明的核苷酸构建体的重组表达载体,和包含本发明的核苷酸构建体的重组宿主细胞。
本发明的另一个方面提供制备本发明的多肽的方法,包括:
(a)培养包含编码本发明多肽的核苷酸序列的株系以产生所述多肽,其中所述株系能够表达并分泌该多肽;及
(b)回收该多肽。
本发明的另外的方面提供包含本发明的多肽的组合物,以及制备这样的组合物的方法,包括将本发明的多肽与赋形剂混合。
本发明的另外的方面提供本发明的多肽或包含所述多肽的组合物在多种应用中的用途。
具体地,本发明还涉及如下方面:
1.选自下组的分离多肽:
(a)包含氨基酸序列的多肽,所述氨基酸序列与由SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO:18,SEQ ID NO:20,SEQ ID NO:22,SEQ ID NO:24,SEQ ID NO:26,SEQ ID NO:28,SEQ ID NO:30,SEQ ID NO:32,SEQ ID NO:34,SEQ ID NO:36,SEQ ID NO:38,SEQ ID NO:40和SEQ ID NO:42构成的组中所包含的成熟多肽的序列具有至少90%的同一性,
(b)由核苷酸序列所编码的多肽,该核苷酸序列在高度严紧条件下与选自下组多核苷酸探针杂交:
(i)核苷酸序列的互补链,所述核苷酸序列选自SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:17,SEQ ID NO:19,SEQ ID NO:21,SEQ ID NO:23,SEQ ID NO:25,SEQ ID NO:27,SEQ ID NO:29,SEQ ID NO:31,SEQ ID NO:33,SEQ ID NO:35,SEQ ID NO:37,SEQ ID NO:39和SEQ ID NO:41的编码成熟多肽的区域,
(ii)核苷酸序列中所包含的cDNA序列的互补链,所述核苷酸序列选自SEQ ID NO:1,SEQ ID NO:3,SEQ ID NO:5,SEQ ID NO:7,SEQ ID NO:9,SEQ ID NO:11,SEQ ID NO:13,SEQ ID NO:15,SEQ ID NO:17,SEQ ID NO:19,SEQ ID NO:21,SEQ ID NO:23,SEQ ID NO:25,SEQ ID NO:27,SEQ ID NO:29,SEQ ID NO:31,SEQ ID NO:33,SEQ ID NO:35,SEQ ID NO:37,SEQ ID NO:39和SEQ ID NO:41的编码成熟多肽的区域,
其中所述多肽具有由SEQ ID NO:2,SEQ ID NO:4,SEQ ID NO:6,SEQ ID NO:8,SEQ ID NO:10,SEQ ID NO:12,SEQ ID NO:14,SEQ ID NO:16,SEQ ID NO:18,SEQ ID NO:20,SEQ ID NO:22,SEQ ID NO:24,SEQ ID NO:26,SEQ ID NO:28,SEQ ID NO:30,SEQ ID NO:32,SEQ ID NO:34,SEQ ID NO:36,SEQ ID NO:38,SEQ ID NO:40和SEQ ID NO:42构成的组中所包含的相应成熟多肽的功能。
2.选自下组的分离的酶:
(a)包含氨基酸序列的酶,所述氨基酸序列与选自以CBS保藏登录号274.96保藏的Botryosphaeria rhodina菌株所分泌的木聚糖酶、丝氨酸酯酶、过氧化物酶、GH 61A多肽、GH 61B多肽、GH 61C多肽、GH 61D多肽、β-葡糖苷酶、内切阿拉伯糖酶和胃蛋白酶肽酶的成熟酶的氨基酸序列具有至少90%的同一性。
(b)由核苷酸序列编码的多肽,该核苷酸序列在高度严紧条件下与选自下列的多核苷酸探针杂交:
(i)核苷酸序列的互补链,所述核苷酸序列包含于以CBS保藏登录号274.96保藏的Botryosphaeria rhodina菌株中,并编码成熟酶,该成熟酶选自该菌株所分泌的木聚糖酶、丝氨酸酯酶、过氧化物酶、GH 61A多肽、GH 61B多肽、GH 61C多肽、GH 61D多肽、β-葡糖苷酶、内切阿拉伯糖酶和胃蛋白酶肽酶,
(ii)核苷酸序列所含cDNA序列的互补链,所述核苷酸序列包含于以CBS保藏登录号274.96保藏的Botryosphaeria rhodina菌株中,并编码成熟酶,该成熟酶选自该菌株所分泌的木聚糖酶、丝氨酸酯酶、过氧化物酶、GH 61A多肽、GH 61B多肽、GH 61C多肽、GH 61D多肽、β-葡糖苷酶、内切阿拉伯糖酶和胃蛋白酶肽酶;
其中所述酶具有选自木聚糖酶、丝氨酸酯酶、过氧化物酶、GH 61A多肽、GH 61B多肽、GH 61C多肽、GH 61D多肽、β-葡糖苷酶、内切阿拉伯糖酶和胃蛋白酶肽酶的功能。
3.项1或2的多肽,其选自:
(a)包含氨基酸序列的多肽,所述氨基酸序列与选自下列的序列具有至少90%的同一性:
SEQ ID NO:2的氨基酸1-291;SEQ ID NO:4的1-202;SEQ ID NO:6的氨基酸1-352;SEQ ID NO:8的氨基酸1-431;SEQ ID NO:10的氨基酸1-185;SEQ ID NO:12的氨基酸1-218;SEQ ID NO:14的氨基酸1-249;SEQ ID NO:16的1-255;SEQ ID NO:18的氨基酸1-205;SEQ ID NO:20的氨基酸1-243;SEQ ID NO:22的氨基酸1-415;SEQ ID NO:24的氨基酸1-377;SEQ ID NO:26的氨基酸1-259;SEQ ID NO:28的氨基酸1-248;SEQ ID NO:30的氨基酸1-149;SEQ ID NO:32的氨基酸1-202;SEQ ID NO:34的氨基酸1-603;SEQ ID NO:36的氨基酸1-301;SEQ ID NO:38的氨基酸1-438;SEQ ID NO:40的氨基酸1-396;和SEQ ID NO:42的氨基酸1-262;
(b)由核苷酸序列编码的多肽,所述核苷酸序列在高度严紧条件下与选自下列的多核苷酸杂交:
(i)核苷酸序列的互补链,所述核苷酸序列选自SEQ ID NO:1的核苷酸55-927、SEQ ID NO:3的核苷酸58-663、SEQ ID NO:5的核苷酸55-1110、SEQ ID NO:7的核苷酸55-1347、SEQ ID NO:9的核苷酸1-555、SEQ ID NO:11的核苷酸49-702、SEQ ID NO:13的核苷酸40-786、SEQ ID NO:15的核苷酸55-819、SEQ ID NO:17的核苷酸61-675、SEQ ID NO:19的核苷酸1-729、SEQ ID NO:21的核苷酸55-1299、SEQ ID NO:23的核苷酸49-1179、SEQ ID NO:25的核苷酸70-846、SEQ ID NO:27的核苷酸58-810、SEQ ID NO:31的核苷酸55-660、SEQ ID NO:33的核苷酸46-1854、SEQ ID NO:35的核苷酸64-966、SEQ ID NO:37的核苷酸55-1368、SEQ ID NO:39的核苷酸61-1248,和SEQ ID NO:41的核苷酸64-849;
(ii)核苷酸序列中所包含的cDNA序列的互补链,所述核苷酸序列选自:SEQ ID NO:1的核苷酸55-927、SEQ ID NO:3的核苷酸58-663、SEQ ID NO:5的核苷酸55-1110、SEQ ID NO:7的核苷酸55-1347、SEQ ID NO:9的核苷酸1-555、SEQ ID NO:11的核苷酸49-702、SEQ ID NO:13的核苷酸40-786、SEQ ID NO:15的核苷酸55-819、SEQ ID NO:17的核苷酸61-675、SEQ ID NO:19的核苷酸1-729、SEQ ID NO:21的核苷酸55-1299、SEQ ID NO:23的核苷酸49-1179、SEQ ID NO:25的核苷酸70-846、SEQ ID NO:27的核苷酸58-810、SEQ ID NO:31的核苷酸55-660、SEQ ID NO:33的核苷酸46-1854、SEQ ID NO:35的核苷酸64-966、SEQ ID NO:37的核苷酸55-1368、SEQ ID NO:39的核苷酸61-1248,和SEQ ID NO:41的核苷酸64-849。
4.项3的多肽,其中所述多肽是酶,所述酶选自具有这样的氨基酸序列的多肽:所述氨基酸序列与选自下列的氨基酸序列具有至少95%的同一性:SEQ ID NO:2的氨基酸1-291;SEQ ID NO:4的1-202;SEQ ID NO:6的氨基酸1-352;SEQ ID NO:8的氨基酸1-431;SEQ ID NO:10的氨基酸1-185;SEQ ID NO:12的氨基酸1-218;SEQ ID NO:14的氨基酸1-249;SEQ ID NO:16的1-255;SEQ ID NO:18的氨基酸1-205;SEQ ID NO:20的氨基酸1-243;SEQ ID NO:22的氨基酸1-415;SEQ ID NO:24的氨基酸1-377;SEQ ID NO:26的氨基酸1-259;SEQ ID NO:28的氨基酸1-248;SEQ ID NO:30的氨基酸1-149;SEQ ID NO:32的氨基酸1-202;SEQ ID NO:34的氨基酸1-603;SEQ ID NO:36的氨基酸1-301;SEQ ID NO:38的氨基酸1-438;SEQ ID NO:40的氨基酸1-396;和SEQ ID NO:42的氨基酸1-262。
5.项4的多肽,其中该多肽是酶,所述酶选自由这样的核苷酸序列所编码的多肽,所述核苷酸序列在极高严紧条件下与选自下列的多核苷酸杂交:
(i)核苷酸序列的互补链,所述核苷酸序列选自:SEQ ID NO:1的核苷酸55-927、SEQ ID NO:3的核苷酸58-663、SEQ ID NO:5的核苷酸55-1110、SEQ ID NO:7的核苷酸55-1347、SEQ ID NO:9的核苷酸1-555、SEQ ID NO:11的核苷酸49-702、SEQ ID NO:13的核苷酸40-786、SEQ ID NO:15的核苷酸55-819、SEQ ID NO:17的核苷酸61-675、SEQ ID NO:19的核苷酸1-729、SEQ ID NO:21的核苷酸55-1299、SEQ ID NO:23的核苷酸49-1179、SEQ ID NO:25的核苷酸70-846、SEQ ID NO:27的核苷酸58-810、SEQ ID NO:31的核苷酸55-660、SEQ ID NO:33的核苷酸46-1854、SEQ ID NO:35的核苷酸64-966、SEQ ID NO:37的核苷酸55-1368、SEQ ID NO:39的核苷酸61-1248,和SEQ ID NO:41的核苷酸64-849;和
(ii)核苷酸序列中所包含的cDNA序列的互补链,所述核苷酸序列选自:SEQ ID NO:1的核苷酸55-927、SEQ ID NO:3的核苷酸58-663、SEQ ID NO:5的核苷酸55-1110、SEQ ID NO:7的核苷酸55-1347、SEQ ID NO:9的核苷酸1-555、SEQ ID NO:11的核苷酸49-702、SEQ ID NO:13的核苷酸40-786、SEQ ID NO:15的核苷酸55-819、SEQ ID NO:17的核苷酸61-675、SEQ ID NO:19的核苷酸1-729、SEQ ID NO:21的核苷酸55-1299、SEQ ID NO:23的核苷酸49-1179、SEQ ID NO:25的核苷酸70-846、SEQ ID NO:27的核苷酸58-810、SEQ ID NO:31的核苷酸55-660、SEQ ID NO:33的核苷酸46-1854、SEQ ID NO:35的核苷酸64-966、SEQ ID NO:37的核苷酸55-1368、SEQ ID NO:39的核苷酸61-1248,和SEQ ID NO:41的核苷酸64-849。
6.项3的多肽,其中所述多核苷酸编码由选自下列的多肽所组成的多肽:SEQ ID NO:2的氨基酸1-291;SEQ ID NO:4的1-202;SEQ ID NO:6的氨基酸1-352;SEQ ID NO:8的氨基酸1-431;SEQ ID NO:10的氨基酸1-185;SEQ ID NO:12的氨基酸1-218;SEQ ID NO:14的氨基酸1-249;SEQ ID NO:16的1-255;SEQ ID NO:18的氨基酸1-205;SEQ ID NO:20的氨基酸1-243;SEQ ID NO:22的氨基酸1-415;SEQ ID NO:24的氨基酸1-377;SEQID NO:26的氨基酸1-259;SEQ ID NO:28的氨基酸1-248;SEQ ID NO:30的氨基酸1-149;SEQ ID NO:32的氨基酸1-202;SEQ ID NO:34的氨基酸1-603;SEQ ID NO:36的氨基酸1-301;SEQ ID NO:38的氨基酸1-438;SEQ ID NO:40的氨基酸1-396;和SEQ ID NO:42的氨基酸1-262。
7.项3的多肽,其中所述多肽是GH10木聚糖酶,所述GH10木聚糖酶包含氨基酸序列,所述氨基酸序列与可从以保藏登录号CBS 274.96保藏的Botryosphaeria rhodina获得的GH10木聚糖酶具有至少90%的同一性。
8.项3的多肽,其中该多肽是包含SEQ ID NO:2的氨基酸1-291的GH10木聚糖酶。
9.项3的多肽,其中该多肽是由SEQ ID NO:2的氨基酸1-291组成的GH10木聚糖酶。
10.项3的多肽,其中所述多肽是GH11木聚糖酶,所述GH11木聚糖酶包含氨基酸序列,所述氨基酸序列与可从以保藏登录号CBS 274.96保藏的Botryosphaeria rhodina获得的GH11木聚糖酶具有至少90%的同一性。
11.项3的多肽,其中该多肽是包含SEQ ID NO:4的氨基酸1-202的GH11木聚糖酶。
12.项3的多肽,其中该多肽是由SEQ ID NO:4的氨基酸1-202组成的GH11木聚糖酶。
13.项3的多肽,其中该多肽是丝氨酸酯酶,所述丝氨酸酯酶包含氨基酸序列,所述氨基酸序列与可从以保藏登录号CBS 274.96保藏的Botryosphaeria rhodina获得的丝氨酸酯酶具有至少90%的同一性。
14.项3的多肽,其中该多肽是包含SEQ ID NO:6的氨基酸1-352的丝氨酸酯酶。
15.项3的多肽,其中该多肽是由SEQ ID NO:6的氨基酸1-352组成的丝氨酸酯酶。
16.项3的多肽,其中该多肽是脂肪酶,所述脂肪酶包含氨基酸序列,所述氨基酸序列与可从以保藏登录号CBS 274.96保藏的Botryosphaeria rhodina获得的丝氨酸酯酶具有至少90%的同一性。
17.项3的多肽,其中该多肽是包含SEQ ID NO:8的氨基酸1-431的脂肪酶。
18.项3的多肽,其中该多肽是由SEQ ID NO:8的氨基酸1-431组成的脂肪酶。
19.项3的多肽,其中该多肽是过氧化物酶,所述过氧化物酶包含与可从以保藏登录号CBS 274.96保藏的Botryosphaeria rhodina获得的过氧化物酶具有至少90%的同一性的氨基酸序列。
20.项3的多肽,其中该多肽是包含SEQ ID NO:10的氨基酸1-185的过氧化物酶。
21.项3的多肽,其中该多肽是由SEQ ID NO:10的氨基酸1-185组成的过氧化物酶。
22.项3的多肽,其中该多肽是GH 61A多肽,所述GH 61A多肽包含氨基酸序列,所述氨基酸序列与可从以保藏登录号CBS 274.96保藏的Botryosphaeria rhodina获得的GH 61A多肽具有至少90%的同一性。
23.项3的多肽,其中该多肽是包含SEQ ID NO:12的氨基酸1-218的GH 61A多肽。
24.项3的多肽,其中该多肽是由SEQ ID NO:12的氨基酸1-218组成的GH 61A多肽。
25.项3的多肽,其中该多肽是GH 61B多肽,所述GH 61B多肽包含氨基酸序列,所述氨基酸序列与可从以保藏登录号CBS 274.96保藏的Botryosphaeria rhodina获得的GH 61B多肽具有至少90%的同一性。
26.项3的多肽,其中该多肽是包含SEQ ID NO:14的氨基酸1-249的GH 61B多肽。
27.项3的多肽,其中该多肽是由SEQ ID NO:14的氨基酸1-249组成的GH 61B多肽。
28.项3的多肽,其中该多肽是GH 61C多肽,所述GH 61C多肽包含氨基酸序列,所述氨基酸序列与可从以保藏登录号CBS 274.96保藏的Botryosphaeria rhodina获得的GH 61C多肽具有至少90%的同一性。
29.项3的多肽,其中该多肽是包含SEQ ID NO:16的氨基酸1-255的GH 61C多肽。
30.项3的多肽,其中该多肽是由SEQ ID NO:16的氨基酸1-255组成的GH 61C多肽。
31.项3的多肽,其中该多肽是GH 61D多肽,所述GH 61D多肽包含氨基酸序列,所述氨基酸序列与可从以保藏登录号CBS 274.96保藏的Botryosphaeria rhodina获得的GH 61D多肽具有至少90%的同一性。
32.项3的多肽,其中该多肽是包含SEQ ID NO:18的氨基酸1-205的GH 61D多肽。
33.项3的多肽,其中该多肽是由SEQ ID NO:18的氨基酸1-205组成的GH 61D多肽。
34.项3的多肽,其中该多肽是β-葡糖苷酶,所述β-葡糖苷酶包含氨基酸序列,所述氨基酸序列与可从以保藏登录号CBS 274.96保藏的Botryosphaeria rhodina获得的β-葡糖苷酶具有至少90%的同一性。
35.项3的多肽,其中该多肽是包含SEQ ID NO:34的氨基酸1-603的β-葡糖苷酶。
36.项3的多肽,其中该多肽是由SEQ ID NO:34的氨基酸1-603组成的β-葡糖苷酶。
37.项3的多肽,其中该多肽是内切阿拉伯糖酶,所述内切阿拉伯糖酶包含氨基酸序列,所述氨基酸序列与可从以保藏登录号CBS 274.96保藏的Botryosphaeria rhodina获得的内切阿拉伯糖酶具有至少90%的同一性。
38.项3的多肽,其中该多肽是包含SEQ ID NO:36的氨基酸1-301的内切阿拉伯糖酶。
39.项3的多肽,其中该多肽是由SEQ ID NO:36的氨基酸1-301组成的内切阿拉伯糖酶。
40.项3的多肽,其中该多肽是内切阿拉伯糖酶,所述内切阿拉伯糖酶包含氨基酸序列,所述氨基酸序列与可从以保藏登录号CBS 274.96保藏的Botryosphaeria rhodina获得的内切阿拉伯糖酶具有至少90%的同一性。
41.项3的多肽,其中该多肽是包含SEQ ID NO:38的氨基酸1-438的内切阿拉伯糖酶。
42.项3的多肽,其中该多肽是由SEQ ID NO:38的氨基酸1-438组成的内切阿拉伯糖酶。
43.项3的多肽,其中该多肽是胃蛋白酶肽酶,所述胃蛋白酶肽酶包含与可从以保藏登录号CBS 274.96保藏的Botryosphaeria rhodina获得的胃蛋白酶肽酶具有至少90%的同一性的氨基酸序列。
44.项3的多肽,其中该多肽是包含SEQ ID NO:40的氨基酸1-396的胃蛋白酶肽酶。
45.项3的多肽,其中该多肽是由SEQ ID NO:40的氨基酸1-396组成的胃蛋白酶肽酶。
46.项3的多肽,其中该多肽是胃蛋白酶肽酶,所述胃蛋白酶肽酶包含氨基酸序列,所述氨基酸序列与可从以保藏登录号CBS 274.96保藏的Botryosphaeria rhodina获得的胃蛋白酶肽酶具有至少90%的同一性。
47.项3的多肽,其中该多肽是包含SEQ ID NO:42的氨基酸1-262的胃蛋白酶肽酶。
48.项3的多肽,其中该多肽是由SEQ ID NO:42的氨基酸1-262组成的胃蛋白酶肽酶。
49.多核苷酸,其包含编码项3中所定义的多肽的核苷酸序列。
50.核酸构建体,其包含项49中定义的核苷酸序列,该核苷酸序列与一种或多种指导所述多肽在宿主细胞中生产的调控序列可操作地连接。
51.重组表达载体,其包含项50的核酸构建体。
52.重组宿主细胞,其包含项50的核酸构建体。
53.生产项3的多肽的方法,其包括:
a.培养菌株以产生所述多肽,其中所述菌株的野生型形式能够产生该多肽;及
b.回收该多肽。
54.生产项3的多肽的方法,其包括:
a.在有助于产生所述多肽的条件下,培养项52中定义的重组宿主细胞;及
b.回收该多肽。
55.组合物,其包含项3的多肽和赋形剂。
56.制备项55的组合物的方法,其包含将项1的多肽与赋形剂混合。
57.适于在电子设备中使用的存储介质,所述电子设备包含项3的多肽的氨基酸序列的信息。
58.适于在电子设备中使用的存储介质,所述电子设备包含项49的多核苷酸的核酸序列的信息。
序列表
本发明包含序列表形式的信息,其附于本申请中并在连同本申请的数据载体上提交。数据载体的内容全部通过引用并入本文。选自SEQ ID NO:1,3,5,7,9,11,13,15,17,19,21,23,25,27,29,31,33,35,37,39和41的序列的编码成熟多肽的区域,分别编码选自SEQ ID NO:2,4,6,8,10,12,14,16,18,20,22,24,26,28,30,32,34,36,38,40,42的序列的成熟多肽。因此SEQ ID NO:1的编码成熟多肽的区域编码SEQ ID NO:2中包含的成熟多肽序列,SEQ ID NO:3的编码成熟多肽的区域编码SEQ ID NO:4中包含的成熟多肽序列,依此类推。
附图说明
图1显示pSigA4的质粒图。
发明详述
定义
如以下所用的,术语“ADNA组”指由SEQ ID NO:1,3,5,7,9,11,13,15,17,19,21,23,25,27,29,31,33,35,37,39和41组成的核苷酸序列的组。因此,当提到包含于或选自由“ADNA组”组成的序列组(或包含于或选自“ADNA组”)的核苷酸序列时,是指该序列包含于或选自由SEQ ID NO:1,3,5,7,9,11,13,15,17,19,21,23,25,27,29,31,33,35,37,39和41组成的核苷酸序列的组。
如以下所用的,术语“EDNA组”指由SEQ ID NO:1,3,5,7,9,11,13,15,17,33,35,37,39和41组成的核苷酸序列的组。因此,当提到包含于或选自由“EDNA组”组成的序列组(或包含于或选自“EDNA组”)的核苷酸序列时,是指该序列包含于或选自由SEQ ID NO:1,3,5,7,9,11,13,15,17,33,35,37,39和41组成的核苷酸序列的组。
类似地,如以下所用的,术语“B多肽组”指由SEQ ID NO:2,4,6,8,10,12,14,16,18,20,22,24,26,28,30,32,34,36,38,40和42组成的多肽序列的组。因此,当提到包含于或选自由“B多肽组”组成的序列组(或包含于或选自“B多肽组”)的多肽序列时,是指该序列包含于或选自由SEQ ID NO:2,4,6,8,10,12,14,16,18,20,22,24,26,28,30,32,34,36,38,40和42组成的多肽序列的组。
类似地,如以下所用的,术语“D多肽组”指由SEQ ID NO:2,4,6,8,10,12,14,16,18,34,36,38,40和42组成的多肽序列的组。因此,当提到包含于或选自由“D多肽组”组成的序列组(或包含于或选自“D多肽组”)的多肽序列时,是指该序列包含于或选自由SEQ ID NO:2,4,6,8,10,12,14,16,18,34,36,38,40和42组成的多肽序列的组。
本文中使用的术语“同一性”理解为两条氨基酸序列或两条核苷酸序列之间的同源性。对于本发明而言,同一性程度是使用Vector NTI程序7.1版(Informax inc.,7600 Wisconsin Avenue,Suite #1100,Bethesda,MD 20814,USA)的AlignX确定的。氨基酸比对使用Clustal W算法(Thompson,J.D.,Higgins,D.G.和Gibson,T.J.(1994)CLUSTAL W:improving the sensitivity of progressive multiple sequence alignment through sequence weighting,positions-specific gap penalties and weight matrix choice.Nucleic Acids Research,22:4673-4680)来生成。还使用下面的参数:缺口生成罚分(gap opening penalty)为10,缺口延伸罚分(gap extension penalty)为0.05,缺口分离罚分范围(gap separation penalty range)为8。配对比对(pairwise alignment)参数为Ktuple=1,缺口罚分(gap penalty)=3,缺口长度生成罚分(gap length opening penalty)=10,缺口延伸罚分=0.1,窗口大小(window size)=5,对角线(diagonals)=5。两条核苷酸序列之间同一性程度的确定也是使用如上所述的相同算法和软件包,例如用下列的设定:缺口罚分为10,缺口长度罚分为10。配对比对参数为Ktuple=3,缺口罚分=3,窗口=20。
在本发明的范围内,术语“功能性多肽”(functional polypeptide)是指这样的多肽,其可被细胞表达和分泌,并且构成能够根据其按照细胞设计应实现的功能来运作的操作单元。可选地,该多肽要具备预定的功能可能需要辅因子(co-factors)。功能性多肽的一个例子是具有催化活性的多肽或酶,其帮助细胞催化细胞周围环境中的反应。另外的例子有充当信号物质的多肽。另外的例子还有行使针对环境参数(细胞周围环境中的化学物质)的传感物(受体)功能的多肽,或具有抗别的生物的活性的多肽(抗微生物(多)肽),或对细胞的结构完整性作贡献的多肽。
在本文中,关于氨基酸序列或多肽的部分使用的术语“成熟区域”(mature region)是指氨基酸序列或多肽中作为成熟的功能性多肽的部分(portion)、区域(region)、域(domain)或区段(section)。
本文中使用的术语“编码成熟多肽的核苷酸序列”是指从编码成熟多肽的第一个氨基酸的三联体算起,直到编码成熟多肽的最后一个氨基酸的三联体的区域。
在本文中,关于本发明的特定酶使用的术语“GH”,例如“GH10”,是由B.Henrissat建立的糖基水解酶(glycosyl hydrolase enzymes)的家族分类系统。GH后面的数字指不同的家族。该分类系统对本领域技术人员而言是熟知的。见Henrissat B.,A classification of glycosyl hydrolases based on amino-acid sequence similarities,Biochem.J.280:309-316(1991);Henrissat B.,Bairoch A,New families in the classification of glycosyl hydrolases based on amino acid sequence similarities,Biochem.J.293:781-788(1993);Henrissat B.,Bairoch A.,Updating the sequence-based classification of glycosyl hydrolases,Biochem.J.316:695-696(1996);Davies G.,Henrissat B.,Structures and mechanisms of glycosyl hydrolases,Structure 3:853-859(1995)。
本发明的多肽
本发明的多肽都是被Botryosphaeria rhodina CBS 274.96分泌,以为该特定细胞执行功能的多肽。
在Botryosphaeria rhodina CBS 274.96基因组中有数千个可能的基因,其中,该基因组的多核苷酸编码21种B多肽组中所包括的分泌的功能性成熟多肽,这些多肽已被鉴定为功能性的,并被所选的宿主细胞翻译成功能性多肽并分泌。
因此,Botryosphaeria rhodina CBS 274.96表达并分泌B多肽组中所包括的功能性成熟多肽,而且在该特定菌株的基因组中,ADNA组的序列的编码成熟多肽的区域,是编码B多肽组序列中所包括的成熟多肽的基因。另外在特定的实施方案中,当培养用包含ADNA组的序列的编码成熟多肽的区域的多核苷酸转化的大肠杆菌(E.coli)宿主时,所有编码B多肽组中所包括的成熟多肽的基因都可以表达,而且它们相应的成熟多肽可以被分泌。通过比较这21个多肽序列的序列与已知序列的同源性或同一性,标定了这些多肽的具体功能。这21种分泌的功能性多肽中的至少14种被确定是酶和/或类似酶。
因此,本发明提供选自下列的分离多肽:
(a)具有氨基酸序列的多肽:所述氨基酸序列与选自B多肽组中所包括的成熟多肽的氨基酸序列具有至少90%的同一性;
(b)由核苷酸序列编码的多肽:所述核苷酸序列在高度严紧条件下与选自下列的多核苷酸探针杂交:
(i)核苷酸序列的互补链,所述核苷酸序列选自ADNA组序列的编码成熟多肽的区域;
(ii)核苷酸序列所包含的cDNA序列的互补链,所述核苷酸序列选自ADNA组序列的编码成熟多肽的区域;
其中该多肽显示相应的B多肽组的成熟多肽序列的功能。
在一个具体的实施方案中,本发明的多肽选自由本发明人分离并以CBS保藏登录号(accession No.)274.96保藏的Botryosphaeria rhodina所分泌的酶,即由木聚糖酶、丝氨酸酯酶、过氧化物酶、GH 61A多肽、GH 61B多肽、GH 61C多肽、GH 61D多肽、β-葡糖苷酶、内切阿拉伯糖酶和胃蛋白酶肽酶组成的酶组。
本发明还提供选自下列的分离的酶:
(a)包含这样的氨基酸序列的酶,所述氨基酸序列与选自以CBS保藏号274.96保藏的Botryosphaeria rhodina菌株所分泌的木聚糖酶、丝氨酸酯酶、过氧化物酶、GH 61A多肽、GH 61B多肽、GH 61C多肽、GH 61D多肽、β-葡糖苷酶、内切阿拉伯糖酶和胃蛋白酶肽酶组成的组中的成熟酶的氨基酸序列具有至少90%的同一性。
(b)由核苷酸序列编码的多肽,该核苷酸序列在高度严紧条件下与选自下列的多核苷酸探针杂交:
(i)核苷酸序列的互补链,所述核苷酸序列包含于以CBS保藏号274.96保藏的Botryosphaeria rhodina菌株中,并编码成熟酶,该成熟酶选自该菌株所分泌的木聚糖酶、丝氨酸酯酶、过氧化物酶、GH 61A多肽、GH 61B多肽、GH 61C多肽、GH 61D多肽、β-葡糖苷酶、内切阿拉伯糖酶和胃蛋白酶肽酶,
(ii)核苷酸序列所含cDNA序列的互补链,所述核苷酸序列包含于以CBS保藏号274.96保藏的Botryosphaeria rhodina菌株中,并编码成熟酶,该成熟酶选自该菌株所分泌的木聚糖酶、丝氨酸酯酶、过氧化物酶、GH 61A多肽、GH 61B多肽、GH 61C多肽、GH 61D多肽、β-葡糖苷酶、内切阿拉伯糖酶和胃蛋白酶肽酶;
其中所述酶具有选自木聚糖酶、丝氨酸酯酶、过氧化物酶、GH 61A多肽、GH 61B多肽、GH 61C多肽、GH 61D多肽、β-葡糖苷酶、内切阿拉伯糖酶和胃蛋白酶肽酶的功能。
在一个具体的实施方案中,所述酶是选自下列的分离的酶:
(a)具有与下述氨基酸序列具有至少90%的同一性的氨基酸序列的酶,所述氨基酸序列选自D多肽组的序列中所包含的成熟酶;
(b)由核苷酸序列编码的酶,该核苷酸序列在高度严紧条件下与多核苷酸探针杂交,所述多核苷酸探针选自:
(i)核苷酸序列的互补链,所述核苷酸序列选自EDNA组序列的编码成熟酶的区域;
(ii)核苷酸序列所包含的cDNA序列的互补链,所述核苷酸序列选自EDNA组序列的编码成熟酶的区域;
其中该酶显示相应的D多肽组的成熟酶的功能。
本发明的多肽是分离多肽,优选地,本发明的多肽的制剂包含最多90重量%的可能与之天然地相伴随的其他多肽物质(更低百分比的其他多肽物质是优选的,例如最多80重量%,最多60重量%,最多50重量%,最多40重量%,最多30重量%,最多20重量%,最多10重量%,最多9重量%,最多8重量%,最多7重量%,最多6重量%,最多5重量%,最多4重量%,最多3重量%,最多2重量%,最多1重量%,及最多1/2重量%)。因此,优选本发明的分离多肽为92%纯,即本发明的多肽构成制剂中存在的所有多肽物质的至少92重量%,且优选更高的重量百分比,例如至少94%纯,至少95%纯,至少96%纯,至少96%纯,至少97%纯,至少98%纯,至少99%纯,及至多99.5%纯。特别地本发明的多肽优选是基本上纯的形式。具体而言,优选地,所述多肽是“基本上(essentially)纯的形式”,即多肽制备物基本上不含与该多肽天然相伴随的其它多肽物质。这可通过例如采用熟知的重组方法制备多肽来实现。
本发明的多肽可以是合成制造的,天然存在的,或其组合。在一个具体的实施方案中,本发明的多肽可以从微生物,例如原核细胞,古细菌细胞或真核细胞得到。这些细胞还可以是已通过基因工程改变的。
在一个具体的实施方案中,本发明的多肽是这样的酶,其在约10℃到约80℃,具体是在约20℃到约60℃的温度下显示最佳酶活性。
在一个具体的实施方案中,本发明的多肽是这样的酶,其在高至100℃,具体是高至80℃,更具体是高至60℃的温度下是功能上稳定的。
在一个具体的实施方案中,本发明的多肽是这样的酶,其显示选自B 组所包括的成熟酶的酶的至少20%,具体是至少40%,例如至少50%,具体是至少60%,例如至少70%,更具体是至少80%,例如至少90%,更具体是至少95%,例如至少100%的酶活性。
在一个具体的实施方案中,本发明的多肽包括,含有,或由这样的氨基酸序列组成:该氨基酸序列与选自B多肽组所包括的成熟酶的多肽序列具有至少90%的同一性,特别是至少95%,例如至少96%,例如至少97%,更具体为至少98%,例如至少99%或甚至100%的同一性。
在一个具体的实施方案中,本发明的多肽包括,含有,或由这样的氨基酸序列组成:该氨基酸序列与选自B多肽组所包括的成熟酶的多肽序列具有至少50%的同一性,具体是至少60%,具体是至少65%,具体是至少70%,具体是至少75%,具体是至少80%或更具体是至少85%的同一性。
在一个具体的实施方案中,本发明的多肽的氨基酸序列与B多肽组所包括的成熟酶具有最多10个氨基酸(例如10个氨基酸),具体是最多5个氨基酸(例如5个氨基酸),例如最多4个氨基酸(例如4个氨基酸),例如最多3个氨基酸(例如3个氨基酸),具体是最多2个氨基酸(例如2个氨基酸),例如1个氨基酸的不同。
本发明的多肽可以是从天然来源,例如Botryosphaeria rhodina CBS 274.96株或其他野生型株分离的野生型多肽,但本发明也涵盖这样的人工变体,其中本发明的多肽被突变,例如通过在保持该多肽的功能和/或其他性质的同时,对所述多肽添加,置换和/或缺失一个或多个氨基酸。
因此,本发明的多肽可以是人工变体,其中,包含由B多肽组所包括的成熟酶,或由其所组成的氨基酸序列至少发生了一个氨基酸的置换,缺失和/或插入。
本发明的多肽还包括本文所述的氨基酸序列的功能性片段和编码本文所述的氨基酸序列的功能性片段的核酸,包括如本文所述的以CBS保藏号274.96保藏的Botryosphaeria rhodina株分泌的成熟酶的片段,包括从所述以CBS保藏号274.96保藏的Botryosphaeria rhodina株分泌的木聚糖酶、丝氨酸酯酶、过氧化物酶、GH 61A多肽、GH 61B多肽、GH 61C多肽、GH 61D多肽、β-葡糖苷酶、内切阿拉伯糖酶和胃蛋白酶肽酶中选择的酶的片段。
人工变体可以使用本领域已知的标准技术构建,通常随后进行筛选和/或性质鉴定。标准技术包括经典的诱变,例如通过对细胞进行紫外照射或用化学诱变剂处理细胞,如Gerhardt等(1994)所述的;体内基因改组(shuffling),如WO 97/07205所述的,体外改组,如Stemmer,(1994)或WO95/17413所述的,随机诱变,如Eisenstadt E.等.(1994)所述的;PCR技术,例如Poulsen等(1991)所述的;家族改组(family shuffling),如J.E.Ness等,Nature Biotechnology,vol.17,pp.893-896(1999)所述的;定点诱变,如Sambrook等(1989),Molecular Cloning,A Laboratory Manual,Cold Spring Harbor,NY所述的。关于核苷酸置换的一般性描述可见Ford等,1991,Protein Expression and Purification 2,p.95-107。
这样的标准基因工程方法还可以用来从编码一种或多种本发明的亲本酶(parent enzyme)的基因制备多样性的变体核苷酸序列文库,在合适的宿主细胞中表达这些酶变体,并选择合适的变体。多样性的文库可以用多种本领域已知的方法建立(Reetz MT;Jaeger KE,于Biocatalysis-from Discovery to Application,Fessner WD编,Vol.200,pp.31-57(1999);Stemmer,Nature,vol.370,p.389-391,1994;Zhao和Arnold,Proc.Natl.Acad.ScL,USA,vol.94,pp.7997-8000,1997;或Yano等,Proc.Natl.Acad.ScL,USA,vol.95,pp 5511-5515,1998)。
在本发明的一个优选的实施方案中,(人工变体和野生型酶中的)氨基酸的改变从性质上说是轻微的,即其是:不显著影响蛋白质的折叠和/或活性的保守性的氨基酸置换;小的缺失,通常为1到大约30个氨基酸;小的氨基或羧基末端延伸,例如氨基末端的甲硫氨酸残基;长达大约20-25个残基的小接头肽;或通过改变净电荷或其他功能而有助于纯化的小段延伸(small extension),诸如多组氨酸序列段(poly-histidine tract)、抗原性表位(antigenic epitope)、或结合域(binding domain)。
下面各组中是保守性置换的例子:碱性氨基酸(精氨酸、赖氨酸和组氨酸)、酸性氨基酸(谷氨酸和天冬氨酸)、极性氨基酸(谷氨酰胺和天冬酰胺)、疏水性氨基酸(亮氨酸、异亮氨酸、缬氨酸和甲硫氨酸)、芳香族氨基酸(苯丙氨酸、色氨酸和酪氨酸)、和小氨基酸(甘氨酸、丙氨酸、丝氨酸和苏氨酸)。一般情况下不改变或损害蛋白质功能的氨基酸置换是本领域已知的,例如H.Neurath和R.L.Hill在The Proteins中所述(1979,Academic Press,New York)。最常发生的取代是Ala/Ser、Val/Ile、Asp/Glu、Thr/Ser、Ala/Gly、Ala/Thr、Ser/Asn、Ala/Val、Ser/Gly、Tyr/Phe、Ala/Pro、Lys/Arg、Asp/Asn、Leu/Ile、Leu/Val、Ala/Glu、和Asp/Gly,以及上述反向的置换。
在一个具体的实施方案中,所述氨基酸改变具有这样的性质,使得多肽的物理化学特性被改变。例如,所进行的氨基酸改变可提高酶的热稳定性、改变底物特异性、改变最佳pH等等。
具体地,在本发明的多肽,特别是选自B多肽组中所包含的成熟多肽的那些多肽中,产生人工变体的所述置换、缺失和/或插入的数目最多为10,如最多9,例如最多8,更优选最多7,例如最多6,例如最多5,最优选最多4,例如最多3,如最多2,特别是最多1。
在一个具体的实施方案中所述人工变体是这样的变体,其在包括人的动物中,与亲本酶相比,具有改变的、优选减少的免疫原性,特别是变应原性。术语“免疫原性”在本文中应理解为人工变体当被施用于动物,包括通过静脉内、皮肤、皮下、口服和气管内施用于动物时,引起改变的、特别是减少的免疫反应的能力。术语“免疫反应”在本文中指该人工变体的施用造成该动物体内免疫球蛋白例如IgE、IgG和IgM的水平的改变,或该动物体内细胞因子水平的改变。定位(mapping)蛋白质的免疫原性/抗原性表位的方法、制备具有改变的免疫原性的抗体及测量免疫反应的方法在本领域是公知的,且在例如WO 92/10755、WO 00/26230、WO 00/26354和WO 01/31989中有描述。本文中术语“变应原性”理解为该人工变体造成动物中IgE生产的改变特别是减少的能力,以及结合来自该动物的IgE的能力。特别地,由于对动物气管内使用所述多肽变体而产生的变应原性(又称呼吸性变应原性(respiratory allergenicity))是本文特别感兴趣的。
在另一个实施方案中,本发明的多肽是由这样的核苷酸序列编码的多肽,该核苷酸序列在至少高度严紧的条件,特别是极高度严紧条件下,与选自下列的多核苷酸探针杂交:
(i)核苷酸序列的互补链,所述核苷酸序列选自ADNA组序列的编码成熟多肽的区域;
(ii)核苷酸序列中所含的cDNA序列的互补链,所述核苷酸序列选自ADNA组序列的编码成熟多肽的区域;
(iii)(i)或(ii)的编码分泌多肽的片段,所述分泌多肽具有B多肽组中所包含的相应成熟多肽的功能。
(J.Sambrook,E.F.Fritsch,和T.Maniatus,1989,Molecular Cloning,A Laboratory Manual,第二版,Cold Spring Harbor,New York)。
特别地,本发明的多肽被包含这样的核苷酸序列的多核苷酸所编码,所述核苷酸序列选自:ADNA组序列的编码成熟多肽的区域,或者与其由于遗传密码的简并性而相异的序列。更具体地,本发明的多肽被由这样的核苷酸序列组成的多核苷酸所编码,所述核苷酸序列选自:ADNA组序列的编码成熟多肽的区域,或者与其由于遗传密码的简并性而相异的序列。
ADNA组的序列的编码成熟多肽的区域的核苷酸序列或其子序列,以及B多肽组中包含的成熟多肽的氨基酸序列或其片段,可以用来设计多核苷酸探针,以根据本领域熟知的方法,从不同属或种的株系中鉴定和克隆编码本发明的酶的DNA。特别地,这样的探针可以用来根据标准的Southern印迹程序与目标属或种的基因组或cDNA杂交,以鉴定和分离其中的相应基因。这样的探针可以显著地短于整个序列,但长度应该为至少15,优选至少25,更优选至少35个核苷酸,例如长度为至少70个核苷酸。但是优选该多核苷酸探针为至少100个核苷酸长。例如,该多核苷酸探针可为至少200个核苷酸长,至少300个核苷酸长,至少400个核苷酸长,或至少500个核苷酸长。还可以用更长的探针,例如至少600个核苷酸长,至少700个核苷酸长,至少800个核苷酸长,或至少900个核苷酸长的多核苷酸探针。DNA和RNA探针都可以使用。探针通常进行标记来检测相应的基因(例如用32P、3H、35S、生物素、或抗生物素蛋白)。
因此,可从这样的其它生物体制备的基因组DNA或cDNA文库中筛选与上述探针发生杂交、且编码本发明的酶的DNA。来自这样的其它生物体的基因组或其它DNA可通过琼脂糖或聚丙烯酰胺凝胶电泳或其它分离技术来分离。可将来自文库的DNA或分离的DNA转移到并固定在硝酸纤维素或其它适宜的载体材料上。为了鉴定与选自ADNA组序列中编码成熟多肽的区域的核苷酸具有所需的同源性和/或同一性,或与之同源和/或同一的克隆或DNA,在Southern印迹中使用带有固定的DNA的载体材料。
对本发明而言,“杂交”意味着所述核苷酸序列与标记的多核苷酸探针杂交,所述探针在高度到极高度严紧条件下与选自ADNA组的序列编码成熟多肽的区域的核苷酸序列杂交。在这些条件下与多核苷酸探针杂交的分子可以用X射线胶片或本领域已知的任何方法来检测。本文中无论何时使用术语“多核苷酸探针”时,应理解这样的探针含有至少15个核苷酸。
在一个感兴趣的实施方案中,所述多核苷酸探针是选自ADNA组的序列的编码成熟多肽的区域的核苷酸序列的互补链。
在另一个感兴趣的实施方案中,所述多核苷酸探针是编码选自B多肽组的酶的核苷酸序列的互补链。在另一个感兴趣的实施方案中,所述多核苷酸探针是核苷酸序列的成熟多肽编码区域的互补链,所述核苷酸序列选自ADNA组的序列的编码成熟多肽的区域。
对于长度为至少100个核苷酸的长探针来说,高度至极高度的严紧条件定义为遵循标准Southern印迹程序,于42℃,在5X SSPE、5X Darhardt’s溶液、1.0%SDS、100μg/ml经剪切且经变性的鲑精DNA中进行预杂交和杂交。优选地,所述至少100个核苷酸的长探针不含有多于1000个核苷酸。对于长度为至少100个核苷酸的长探针来说,最后在60℃下用0.1x SSC、0.1%SDS(高严紧度)洗涤3次,每次15分钟;特别是在68℃下用0.1x SSC、0.1%SDS(极高严紧度)洗涤3次,每次15分钟。
虽然不是特别优选的,还考虑可以使用更短的探针,例如长为大约15到99个核苷酸的探针,例如长为约15到约70个核苷酸。对于这样的短探针,严紧条件定义为遵循标准Southern印迹程序,在比根据Bolton和McCarthy(1962,Proceedings of the National Academy of Sciences USA 48:1390)的计算方法算得的Tm值低大约5℃至大约10℃的温度下,在0.9M NaCl、0.09M Tris-HCl pH7.6、6mM EDTA、0.5%NP-40、1X Denhardt’s溶液、1mM焦磷酸钠、1mM磷酸二氢钠(sodium monobasic phosphate)、0.1mM ATP、和0.2mg/ml酵母RNA中进行预杂交、杂交和杂交后清洗。
对于长度为大约15个核苷酸至大约99个核苷酸的短探针来说,在比Tm计算值低大约5℃至10℃的温度下,将载体材料用6X SCC加0.1%SDS洗涤1次15分钟,然后用6X SSC洗涤两次,每次15分钟。
SEQ ID NO:2木聚糖酶GH10
在一个特定的实施方案中,本发明的多肽是包含或由这样的氨基酸序列组成的GH10木聚糖酶,所述氨基酸序列与可以从Botryosphaeria rhodina,具体是以保藏号CBS 274.96保藏的Botryosphaeria rhodina菌株得到的GH10木聚糖酶,更具体是SEQ ID NO:2中包含的成熟GH10木聚糖酶具有至少90%,具体是至少95%,更具体是至少96%,更具体是至少97%,更具体是至少98%,更具体是至少99%,或最具体是100%的同一性。更具体地,所述成熟GH10木聚糖酶包含或由SEQ ID NO:2第1到291位的序列组成。在本文中,GH10木聚糖酶定义为属于EC 3.2.1.8酶活类群的酶。该类群内切水解(endohydrolyse)木聚糖中的1,4-β-D-木糖苷键。糖苷水解酶家族10(GH10)还包括具有另外两种已知活性的酶;内切-1,3-β-木聚糖酶(EC:3.2.1.32);纤维二糖水解酶(EC:3.2.1.91)。
SEQ ID NO:4木聚糖酶GH11
在一个特定的实施方案中,本发明的多肽是包含或由这样的氨基酸序列组成的GH11木聚糖酶,所述氨基酸序列与可以从Botryosphaeria rhodina,具体是以保藏号CBS 274.96保藏的Botryosphaeria rhodina菌株得到的GH11木聚糖酶,更具体是SEQ ID NO:4中包含的成熟GH11木聚糖酶具有至少90%,具体是至少95%,更具体是至少96%,更具体是至少97%,更具体是至少98%,更具体是至少99%,或最具体是100%的同一性。更具体地,所述成熟GH11木聚糖酶包含或由SEQ ID NO:4第1到202位的序列组成。在本文中,GH11木聚糖酶定义为属于EC 3.2.1.8酶活类群的酶。该类群内切水解木聚糖中的1,4-β-D-木糖苷键。糖苷水解酶家族11(GH11)包括只具有一种已知活性的酶;木聚糖酶(EC:3.2.1.8)。
SEQ ID NO:6丝氨酸酯酶
在一个特定的实施方案中,本发明的多肽是丝氨酸酯酶,具体是包含或由这样的氨基酸序列组成的角质酶或脂肪酶或羧基酯酶(carboxyesterase):所述氨基酸序列与可以从Botryosphaeria rhodina,具体是以保藏号CBS 274.96保藏的Botryosphaeria rhodina菌株得到的丝氨酸酯酶,更具体是SEQ ID NO:6中包含的成熟丝氨酸酯酶具有至少90%,具体是至少95%,更具体是至少96%,更具体是至少97%,更具体是至少98%,更具体是至少99%,或最具体是100%的同一性。更具体地,所述成熟丝氨酸酯酶包含或由SEQ ID NO:6第1到352位的序列组成。在本文中,丝氨酸酯酶定义为能够水解溶液中的可溶性酯类(非胶束(micelle)形式的酯类)的酶。更具体地,丝氨酸酯酶是充当角质酶(EC 3.1.1.50)或脂肪酶(EC.3.1.1.3)或羧基酯酶,能够水解蜡-脂类(wax-esters)、角质、三酰基脂肪(tracyl fats),油和/或脂肪酸链。具体地,所述丝氨酸酯酶含有经典的丝氨酸水解酶Ser、His、Asp三联体,例如三酰基脂肪酶/角质酶。
SEQ ID NO:8假丝酵母B型脂肪酶
在一个特定的实施方案中,本发明的多肽是假丝酵母(candida)B型脂肪酶(EC 3.1.1.3),其包含或由这样的氨基酸序列组成:所述氨基酸序列与可以从Botryosphaeria rhodina,具体是以保藏号CBS 274.96保藏的Botryosphaeria rhodina菌株得到的假丝酵母B型脂肪酶,更具体是SEQ ID NO:8中包含的假丝酵母B型脂肪酶具有至少90%,具体是至少95%,更具体是至少96%,更具体是至少97%,更具体是至少98%,更具体是至少99%,或最具体是100%的同一性。更具体地,所述成熟假丝酵母B型脂肪酶包含或由SEQ ID NO:8第1到431位的序列组成。在本文中,假丝酵母B型脂肪酶(Candida B type lipase)定义为能够将甘油三酸酯(triglycerides)水解为二酰基甘油酯(diacyl glycerides)和脂肪酸阴离子,特别是将三酰基甘油水解为二酰基甘油和脂肪酸阴离子的酶。
SEQ ID NO:10过氧化物酶
在一个特定的实施方案中,本发明的多肽是过氧化物酶,其包含或由这样的氨基酸序列组成:所述氨基酸序列与可以从Botryosphaeria rhodina,具体是以保藏号CBS 274.96保藏的Botryosphaeria rhodina菌株得到的过氧化物酶,更具体是SEQ ID NO:10中包含的过氧化物酶具有至少90%,具体是至少95%,更具体是至少96%,更具体是至少97%,更具体是至少98%,更具体是至少99%,或最具体是100%的同一性。更具体地,所述成熟过氧化物酶包含或由SEQ ID NO:10第1到185位的序列组成。在本文中,过氧化物酶定义为属于能够催化氧化-还原反应的酶类的酶。因此,它们被归类为氧化还原酶。它们的正式EC号为1.11.1。过氧化物酶将H2O2还原为水,而氧化多种底物。因此,过氧化物酶是利用H2O2作为电子受体来催化不同氧化反应的氧化还原酶。
SEQ ID NO:12 GH61A多肽
在一个特定的实施方案中,本发明的多肽是GH61A多肽,其包含或由这样的氨基酸序列组成:所述氨基酸序列与可以从Botryosphaeria rhodina,具体是以保藏号CBS 274.96保藏的Botryosphaeria rhodina菌株得到的GH61A多肽,更具体是SEQ ID NO:8中包含的GH61A多肽具有至少90%,具体是至少95%,更具体是至少96%,更具体是至少97%,更具体是至少98%,更具体是至少99%,或最具体是100%的同一性。更具体地,所述成熟GH61A多肽包含或由SEQ ID NO:12第1到218位的序列组成。在本文中,GH61A多肽定义为提供选自下列的一组或多组效应的分泌多肽或蛋白质:
1)当与纤维素酶或纤维素酶混合物联合使用时,促进纤维质(cellulosic)材料的降解。
2)增加酶的溶解性。
3)增加酶的稳定性。
4)减少酶抑制。
SEQ ID NO:14 GH61B多肽
在一个特定的实施方案中,本发明的多肽是GH61B多肽,其包含或由这样的氨基酸序列组成:所述氨基酸序列与可以从Botryosphaeria rhodina,具体是以保藏号CBS 274.96保藏的Botryosphaeria rhodina菌株得到的GH61B多肽,更具体是SEQ ID NO:14中包含的GH61B多肽具有至少90%,具体是至少95%,更具体是至少96%,更具体是至少97%,更具体是至少98%,更具体是至少99%,或最具体是100%的同一性。更具体地,所述成熟GH61B多肽包含或由SEQ ID NO:14第1到249位的序列组成。在本文中,GH61B多肽定义为提供选自下列的一组或多组效应的分泌多肽或蛋白质:
1)当与纤维素酶或纤维素酶混合物联合使用时,促进纤维质材料的降解。
2)增加酶的溶解性。
3)增加酶的稳定性。
SEQ ID NO:16 GH61C多肽
在一个特定的实施方案中,本发明的多肽是GH61C多肽,其包含或由这样的氨基酸序列组成:所述氨基酸序列与可以从Botryosphaeria rhodina,具体是以保藏号CBS 274.96保藏的Botryosphaeria rhodina菌株得到的GH61C多肽,更具体是SEQ ID NO:16中包含的GH61C多肽具有至少90%,具体是至少95%,更具体是至少96%,更具体是至少97%,更具体是至少98%,更具体是至少99%,或最具体是100%的同一性。更具体地,所述成熟GH61C多肽包含或由SEQ ID NO:16第1到255位的序列组成。在本文中,GH61C多肽定义为提供选自下列的一组或多组效应的分泌多肽或蛋白质:
1)当与纤维素酶或纤维素酶混合物联合使用时,促进纤维质材料的降解。
2)增加酶的溶解性。
3)增加酶的稳定性。
SEQ ID NO:18 GH61D多肽
在一个特定的实施方案中,本发明的多肽是GH61D多肽,其包含或由这样的氨基酸序列组成:所述氨基酸序列与可以从Botryosphaeria rhodina,具体是以保藏号CBS 274.96保藏的Botryosphaeria rhodina菌株得到的GH61D多肽,更具体是SEQ ID NO:18中包含的GH61D多肽具有至少90%,具体是至少95%,更具体是至少96%,更具体是至少97%,更具体是至少98%,更具体是至少99%,或最具体是100%的同一性。更具体地,所述成熟GH61D多肽包含或由SEQ ID NO:18第1到205位的序列组成。在本文中,GH61D多肽定义为提供选自下列的一组或多组效应的分泌多肽或蛋白质:
1)当与纤维素酶或纤维素酶混合物联合使用时,促进纤维质材料的降解。
2)增加酶的溶解性。
3)增加酶的稳定性。
SEQ ID NO:20功能性多肽
在一个特定的实施方案中,本发明的多肽是功能性多肽,其包含或由这样的氨基酸序列组成:所述氨基酸序列与SEQ ID NO:20具有至少90%,具体是至少95%,更具体是至少96%,更具体是至少97%,更具体是至少98%,更具体是至少99%,或最具体是100%的同一性。特别是与SEQ IDNO:20中包含的成熟功能性多肽。更具体地,所述成熟功能性多肽包含或由SEQ ID NO:20第1到243位的序列组成。
SEQ ID NO:22功能性多肽
在一个特定的实施方案中,本发明的多肽是功能性多肽,其包含或由这样的氨基酸序列组成:所述氨基酸序列与SEQ ID NO:22具有至少90%,具体是至少95%,更具体是至少96%,更具体是至少97%,更具体是至少98%,更具体是至少99%,或最具体是100%的同一性。特别是与SEQ IDNO:22中包含的成熟功能性多肽。更具体地,所述成熟功能性多肽包含或由SEQ ID NO:22第1到415位的序列组成。
SEQ ID NO:24功能性多肽
在一个特定的实施方案中,本发明的多肽是功能性多肽,其包含或由这样的氨基酸序列组成:所述氨基酸序列与SEQ ID NO:24具有至少90%,具体是至少95%,更具体是至少96%,更具体是至少97%,更具体是至少98%,更具体是至少99%,或最具体是100%的同一性。特别是与SEQ IDNO:24中包含的成熟功能性多肽。更具体地,所述成熟功能性多肽包含或由SEQ ID NO:24第1到377位的序列组成。
SEQ ID NO:26功能性多肽
在一个特定的实施方案中,本发明的多肽是功能性多肽,其包含或由这样的氨基酸序列组成:所述氨基酸序列与SEQ ID NO:26具有至少90%,具体是至少95%,更具体是至少96%,更具体是至少97%,更具体是至少98%,更具体是至少99%,或最具体是100%的同一性。特别是与SEQ IDNO:26中包含的成熟功能性多肽。更具体地,所述成熟功能性多肽包含或由SEQ ID NO:26第1到259位的序列组成。
SEQ ID NO:28功能性多肽
在一个特定的实施方案中,本发明的多肽是功能性多肽,其包含或由这样的氨基酸序列组成:所述氨基酸序列与SEQ ID NO:28具有至少90%,具体是至少95%,更具体是至少96%,更具体是至少97%,更具体是至少98%,更具体是至少99%,或最具体是100%的同一性。特别是与SEQ IDNO:28中包含的成熟功能性多肽。更具体地,所述成熟功能性多肽包含或由SEQ ID NO:28第1到248位的序列组成。
SEQ ID NO:30功能性多肽
在一个特定的实施方案中,本发明的多肽是功能性多肽,其包含或由这样的氨基酸序列组成:所述氨基酸序列与SEQ ID NO:30具有至少90%,具体是至少95%,更具体是至少96%,更具体是至少97%,更具体是至少98%,更具体是至少99%,或最具体是100%的同一性。特别是与SEQ IDNO:30中包含的成熟功能性多肽。更具体地,所述成熟功能性多肽包含或由SEQ ID NO:30第1到149位的序列组成。
SEQ ID NO:32功能性多肽
在一个特定的实施方案中,本发明的多肽是功能性多肽,其包含或由这样的氨基酸序列组成:所述氨基酸序列与SEQ ID NO:32具有至少90%,具体是至少95%,更具体是至少96%,更具体是至少97%,更具体是至少98%,更具体是至少99%,或最具体是100%的同一性。特别是与SEQ IDNO:32中包含的成熟功能性多肽。更具体地,所述成熟功能性多肽包含或由SEQ ID NO:32第1到202位的序列组成。
SEQ ID NO:34β-葡糖苷酶
在一个特定的实施方案中,本发明的多肽是β-葡糖苷酶,其包含或由这样的氨基酸序列组成:所述氨基酸序列与可以从Botryosphaeria rhodina,具体是以保藏号CBS 274.96保藏的Botryosphaeria rhodina菌株得到的β-葡糖苷酶,更具体是SEQ ID NO:34中包含的β-葡糖苷酶具有至少90%,具体是至少95%,更具体是至少96%,更具体是至少97%,更具体是至少98%,更具体是至少99%,或最具体是100%的同一性。更具体地,所述β-葡糖苷酶包含或由SEQ ID NO:34第1到603位的序列组成。在本文中,β-葡糖苷酶定义为这样的β-D-葡萄糖苷-葡萄糖水解酶(β-D-glucoside-glucohydrolase)(E.C.3.2.1.21),其催化末端非还原的β-D-葡萄糖残基的水解,并释放β-D-葡萄糖。对本发明而言,β-葡糖苷酶活性是根据Venturi等,2002,J.Basic Microbiol.42:55-66中描述的基本步骤来测定的,只是采用了本文所述的不同条件。1个β-葡糖苷酶活性单位定义为:在50℃,pH 5下,从100mM柠檬酸钠、0.01%Tween-20中的底物:4mM对-硝基苯基-β-D-吡喃葡萄糖苷中,每分钟产生1.0微摩尔的对-硝基酚。
SEQ ID NO:36内切阿拉伯糖酶
在一个特定的实施方案中,本发明的多肽是内切阿拉伯糖酶,其包含或由这样的氨基酸序列组成:所述氨基酸序列与可以从Botryosphaeria rhodina,具体是以保藏号CBS 274.96保藏的Botryosphaeria rhodina菌株得到的内切阿拉伯糖酶,更具体是SEQ ID NO:36中包含的内切阿拉伯糖酶具有至少90%,具体是至少95%,更具体是至少96%,更具体是至少97%,更具体是至少98%,更具体是至少99%,或最具体是100%的同一性。更具体地,所述内切阿拉伯糖酶包含或由SEQ ID NO:36第1到301位的序列组成。在本文中,内切阿拉伯糖酶(endo-arabinase)定义为能够水解阿拉伯聚糖(arabinan)的酶。
SEQ ID NO:38内切阿拉伯糖酶
在一个特定的实施方案中,本发明的多肽是内切阿拉伯糖酶,其包含或由这样的氨基酸序列组成:所述氨基酸序列与可以从Botryosphaeria rhodina,具体是以保藏号CBS 274.96保藏的Botryosphaeria rhodina菌株得到的内切阿拉伯糖酶,更具体是SEQ ID NO:36中包含的内切阿拉伯糖酶具有至少90%,具体是至少95%,更具体是至少96%,更具体是至少97%,更具体是至少98%,更具体是至少99%,或最具体是100%的同一性。更具体地,所述内切阿拉伯糖酶包含或由SEQ ID NO:38第1到438位的序列组成。在本文中,内切阿拉伯糖酶定义为能够水解阿拉伯聚糖的酶。
SEQ ID NO:40 A1胃蛋白酶肽酶
在一个特定的实施方案中,本发明的多肽是胃蛋白酶肽酶,其包含或由这样的氨基酸序列组成:所述氨基酸序列与可以从Botryosphaeria rhodina,具体是以保藏号CBS 274.96保藏的Botryosphaeria rhodina菌株得到的胃蛋白酶肽酶,更具体是SEQ ID NO:40中包含的胃蛋白酶肽酶具有至少90%,具体是至少95%,更具体是至少96%,更具体是至少97%,更具体是至少98%,更具体是至少99%,或最具体是100%的同一性。更具体地,所述胃蛋白酶肽酶包含或由SEQ ID NO:40第1到396位的序列组成。在本文中,胃蛋白酶肽酶(pepsin peptidase)定义为能够水解蛋白质或肽的酶。
SEQ ID NO:42 M43胃蛋白酶肽酶
在一个特定的实施方案中,本发明的多肽是胃蛋白酶肽酶,其包含或由这样的氨基酸序列组成:所述氨基酸序列与可以从Botryosphaeria rhodina,具体是以保藏号CBS 274.96保藏的Botryosphaeria rhodina菌株得到的胃蛋白酶肽酶,更具体是SEQ ID NO:42中包含的胃蛋白酶肽酶具有至少90%,具体是至少95%,更具体是至少96%,更具体是至少97%,更具体是至少98%,更具体是至少99%,或最具体是100%的同一性。更具体地,所述胃蛋白酶肽酶包含或由SEQ ID NO:42第1到262位的序列组成。在本文中,胃蛋白酶肽酶定义为能够水解蛋白质或肽的酶。
多核苷酸
本发明还涉及包含或由编码本发明的多肽的核苷酸序列组成的多核苷酸。在一个具体的实施方案中,所述核苷酸序列显示在ADNA组的序列中,包括与其由于遗传密码的简并性而相异的序列。在另一个实施方案中,本发明的多核苷酸是修饰的核苷酸序列,其包含或由ADNA组的序列的编码成熟多肽的区域组成,而且其与ADNA组中所包含的亲本核苷酸序列相比,包含至少一个修饰/突变。
用于分离或克隆编码多肽的多核苷酸的技术在本领域是已知的,包括从基因组DNA分离,从cDNA制备,或者两者的组合。从这些基因组DNA克隆本发明的多核苷酸序列可以通过,例如,利用公知的聚合酶链式反应(PCR),或用抗体筛选表达文库以检测出具有共同结构特征的克隆DNA片段来实现。例如参见Innis等,1990,PCR:A Guide to Methods and Application,Academic Press,New York。还可以使用其它核酸扩增程序,诸如连接酶链式反应(LCR)、连接激活转录(LAT)、和基于核苷酸序列的扩增(NASBA)。
获得所述核苷酸序列可通过基因工程中使用的标准克隆方法,将该核苷酸序列从其天然位置再定位(relocate)到该序列将被复制的其它位置。克隆方法可包括包含编码该多肽的核苷酸序列的期望片段的切割和分离、该片段向载体分子中的插入,以及重组载体向宿主细胞中的掺入,在宿主细胞中该核酸序列的多拷贝或克隆将被复制。该核酸序列可以是基因组、cDNA、RNA、半合成、合成的来源或其任意组合。
具体地,所述多核苷酸包含且优选由这样的核苷酸序列组成:该核苷酸序列与选自ADNA组的序列的编码成熟多肽的区域的核苷酸序列具有至少50%的同一性。具体地,所述核苷酸序列与选自ADNA组的序列的编码成熟多肽的区域的核苷酸序列具有至少65%的同一性,更具体为70%的同一性,更具体为80%的同一性,更具体为90%的同一性,更具体为95%的同一性,更具体为96%的同一性,更具体为97%的同一性,更具体为98%的同一性,更具体为99%的同一性,或最具体为100%的同一性。具体地,所述核苷酸序列包含选自ADNA组的序列的编码成熟多肽的区域的核苷酸序列。在更优选的实施方案中,所述核苷酸序列由选自ADNA组的序列的编码成熟多肽的区域的核苷酸序列组成。
具体地,所述多核苷酸包含并优选由这样的核苷酸序列组成:该核苷酸序列编码选自木聚糖酶、丝氨酸酯酶、过氧化物酶、GH 61A多肽、GH 61B多肽、GH 61C多肽、GH 61D多肽、β-葡糖苷酶、内切阿拉伯糖酶和胃蛋白酶肽酶的成熟酶,并且该核苷酸序列与编码本发明人分离并以CBS保藏号274.96保藏的Botryosphaeria rhodina菌株所分泌的木聚糖酶、丝氨酸酯酶、过氧化物酶、GH 61A多肽、GH 61B多肽、GH 61C多肽、GH 61D多肽、β-葡糖苷酶、内切阿拉伯糖酶和胃蛋白酶肽酶的成熟酶的核苷酸序列,具有至少50%的同一性,具体为至少65%的同一性,更具体为70%的同一性,更具体为80%的同一性,更具体为90%的同一性,更具体为95%的同一性,更具体为96%的同一性,更具体为97%的同一性,更具体为98%的同一性,更具体为99%的同一性,或最具体为100%的同一性。
在一个具体的实施方案中,所述多核苷酸包含并优选由这样的核苷酸序列组成:该核苷酸序列编码选自木聚糖酶、丝氨酸酯酶、过氧化物酶、GH 61A多肽、GH 61B多肽、GH 61C多肽、GH 61D多肽、β-葡糖苷酶、内切阿拉伯糖酶和胃蛋白酶肽酶的成熟酶,并且该核苷酸序列与编码选自D多肽组的成熟酶核苷酸序列具有至少50%的同一性,具体为至少65%的同一性,更具体为70%的同一性,更具体为80%的同一性,更具体为90%的同一性,更具体为95%的同一性,更具体为96%的同一性,更具体为97%的同一性,更具体为98%的同一性,更具体为99%的同一性,或最具体为100%的同一性。
在一个具体的实施方案中,所述多核苷酸包含并优选由这样的核苷酸序列组成:该核苷酸序列编码选自木聚糖酶、丝氨酸酯酶、过氧化物酶、GH 61A多肽、GH 61B多肽、GH 61C多肽、GH 61D多肽、β-葡糖苷酶、内切阿拉伯糖酶和胃蛋白酶肽酶的成熟酶,并且该核苷酸序列与选自EDNA组序列的核苷酸序列具有至少50%的同一性,具体为至少65%的同一性,更具体为70%的同一性,更具体为80%的同一性,更具体为90%的同一性,更具体为95%的同一性,更具体为96%的同一性,更具体为97%的同一性,更具体为98%的同一性,更具体为99%的同一性,或最具体为100%的同一性。
SEQ ID NO:1
在一个特定的实施方案中本发明的多核苷酸编码GH10木聚糖酶,并包含或由这样的核苷酸序列组成:所述核苷酸序列与SEQ ID NO:1的55到927位的核苷酸序列具有至少70%的同一性,更具体为至少80%的同一性,更具体为至少90%的同一性,更具体为至少95%的同一性,更具体为至少96%的同一性,更具体为至少97%的同一性,更具体为至少98%的同一性,更具体为至少99%的同一性,或最具体为100%的同一性。
SEQ ID NO:3
在一个特定的实施方案中本发明的多核苷酸编码GH11木聚糖酶,并包含或由这样的核苷酸序列组成:所述核苷酸序列与SEQ ID NO:3的58到663位的核苷酸序列具有至少70%的同一性,更具体为至少80%的同一性,更具体为至少90%的同一性,更具体为至少95%的同一性,更具体为至少96%的同一性,更具体为至少97%的同一性,更具体为至少98%的同一性,更具体为至少99%的同一性,或最具体为100%的同一性。
SEQ ID NO:5
在一个特定的实施方案中本发明的多核苷酸编码丝氨酸酯酶,并包含或由这样的核苷酸序列组成:所述核苷酸序列与SEQ ID NO:5的55到1110位的核苷酸序列具有至少70%的同一性,更具体为至少80%的同一性,更具体为至少90%的同一性,更具体为至少95%的同一性,更具体为至少96%的同一性,更具体为至少97%的同一性,更具体为至少98%的同一性,更具体为至少99%的同一性,或最具体为100%的同一性。
SEQ ID NO:7
在一个特定的实施方案中本发明的多核苷酸编码脂肪酶,并包含或由这样的核苷酸序列组成:所述核苷酸序列与SEQ ID NO:7的55到1347位的核苷酸序列具有至少70%的同一性,更具体为至少80%的同一性,更具体为至少90%的同一性,更具体为至少95%的同一性,更具体为至少96%的同一性,更具体为至少97%的同一性,更具体为至少98%的同一性,更具体为至少99%的同一性,或最具体为100%的同一性。
SEQ ID NO:9
在一个特定的实施方案中本发明的多核苷酸编码过氧化物酶,并包含或由这样的核苷酸序列组成:所述核苷酸序列与SEQ ID NO:9的1到555位的核苷酸序列具有至少70%的同一性,更具体为至少80%的同一性,更具体为至少90%的同一性,更具体为至少95%的同一性,更具体为至少96%的同一性,更具体为至少97%的同一性,更具体为至少98%的同一性,更具体为至少99%的同一性,或最具体为100%的同一性。
SEQ ID NO:11
在一个特定的实施方案中本发明的多核苷酸编码GH61A多肽,并包含或由这样的核苷酸序列组成:所述核苷酸序列与SEQ ID NO:11的49到702位的核苷酸序列具有至少70%的同一性,更具体为至少80%的同一性,更具体为至少90%的同一性,更具体为至少95%的同一性,更具体为至少96%的同一性,更具体为至少97%的同一性,更具体为至少98%的同一性,更具体为至少99%的同一性,或最具体为100%的同一性。
SEQ ID NO:13
在一个特定的实施方案中本发明的多核苷酸编码GH61B多肽,并包含或由这样的核苷酸序列组成:所述核苷酸序列与SEQ ID NO:13的40到786位的核苷酸序列具有至少70%的同一性,更具体为至少80%的同一性,更具体为至少90%的同一性,更具体为至少95%的同一性,更具体为至少96%的同一性,更具体为至少97%的同一性,更具体为至少98%的同一性,更具体为至少99%的同一性,或最具体为100%的同一性。
SEQ ID NO:15
在一个特定的实施方案中本发明的多核苷酸编码GH61C多肽,并包含或由这样的核苷酸序列组成:所述核苷酸序列与SEQ ID NO:15的55到819位的核苷酸序列具有至少70%的同一性,更具体为至少80%的同一性,更具体为至少90%的同一性,更具体为至少95%的同一性,更具体为至少96%的同一性,更具体为至少97%的同一性,更具体为至少98%的同一性,更具体为至少99%的同一性,或最具体为100%的同一性。
SEQ ID NO:17
在一个特定的实施方案中本发明的多核苷酸编码GH61D多肽,并包含或由这样的核苷酸序列组成:所述核苷酸序列与SEQ ID NO:17的61到675位的核苷酸序列具有至少70%的同一性,更具体为至少80%的同一性,更具体为至少90%的同一性,更具体为至少95%的同一性,更具体为至少96%的同一性,更具体为至少97%的同一性,更具体为至少98%的同一性,更具体为至少99%的同一性,或最具体为100%的同一性。
SEQ ID NO:19
在一个特定的实施方案中本发明的多核苷酸编码成熟功能性多肽,并包含或由这样的核苷酸序列组成:所述核苷酸序列与SEQ ID NO:19的1到729位的核苷酸序列具有至少70%的同一性,更具体为至少80%的同一性,更具体为至少90%的同一性,更具体为至少95%的同一性,更具体为至少96%的同一性,更具体为至少97%的同一性,更具体为至少98%的同一性,更具体为至少99%的同一性,或最具体为100%的同一性。
SEQ ID NO:21
在一个特定的实施方案中本发明的多核苷酸编码成熟功能性多肽,并包含或由这样的核苷酸序列组成:所述核苷酸序列与SEQ ID NO:21的55到1299位的核苷酸序列具有至少70%的同一性,更具体为至少80%的同一性,更具体为至少90%的同一性,更具体为至少95%的同一性,更具体为至少96%的同一性,更具体为至少97%的同一性,更具体为至少98%的同一性,更具体为至少99%的同一性,或最具体为100%的同一性。
SEQ ID NO:23
在一个特定的实施方案中本发明的多核苷酸编码成熟功能性多肽,并包含或由这样的核苷酸序列组成:所述核苷酸序列与SEQ ID NO:23的49到1179位的核苷酸序列具有至少70%的同一性,更具体为至少80%的同一性,更具体为至少90%的同一性,更具体为至少95%的同一性,更具体为至少96%的同一性,更具体为至少97%的同一性,更具体为至少98%的同一性,更具体为至少99%的同一性,或最具体为100%的同一性。
SEQ ID NO:25
在一个特定的实施方案中本发明的多核苷酸编码成熟功能性多肽,并包含或由这样的核苷酸序列组成:所述核苷酸序列与SEQ ID NO:25的70到846位的核苷酸序列具有至少70%的同一性,更具体为至少80%的同一性,更具体为至少90%的同一性,更具体为至少95%的同一性,更具体为至少96%的同一性,更具体为至少97%的同一性,更具体为至少98%的同一性,更具体为至少99%的同一性,或最具体为100%的同一性。
SEQ ID NO:27
在一个特定的实施方案中本发明的多核苷酸编码成熟功能性多肽,并包含或由这样的核苷酸序列组成:所述核苷酸序列与SEQ ID NO:27的58到801位的核苷酸序列具有至少70%的同一性,更具体为至少80%的同一性,更具体为至少90%的同一性,更具体为至少95%的同一性,更具体为至少96%的同一性,更具体为至少97%的同一性,更具体为至少98%的同一性,更具体为至少99%的同一性,或最具体为100%的同一性。
SEQ ID NO:29
在一个特定的实施方案中本发明的多核苷酸编码成熟功能性多肽,并包含或由这样的核苷酸序列组成:所述核苷酸序列与SEQ ID NO:29的157到603位的核苷酸序列具有至少70%的同一性,更具体为至少80%的同一性,更具体为至少90%的同一性,更具体为至少95%的同一性,更具体为至少96%的同一性,更具体为至少97%的同一性,更具体为至少98%的同一性,更具体为至少99%的同一性,或最具体为100%的同一性。
SEQ ID NO:31
在一个特定的实施方案中本发明的多核苷酸编码成熟功能性多肽,并包含或由这样的核苷酸序列组成:所述核苷酸序列与SEQ ID NO:31的55到660位的核苷酸序列具有至少70%的同一性,更具体为至少80%的同一性,更具体为至少90%的同一性,更具体为至少95%的同一性,更具体为至少96%的同一性,更具体为至少97%的同一性,更具体为至少98%的同一性,更具体为至少99%的同一性,或最具体为100%的同一性。
SEQ ID NO:33
在一个特定的实施方案中本发明的多核苷酸编码β-葡糖苷酶,并包含或由这样的核苷酸序列组成:所述核苷酸序列与SEQ ID NO:33的46到1854位的核苷酸序列具有至少70%的同一性,更具体为至少80%的同一性,更具体为至少90%的同一性,更具体为至少95%的同一性,更具体为至少96%的同一性,更具体为至少97%的同一性,更具体为至少98%的同一性,更具体为至少99%的同一性,或最具体为100%的同一性。
SEQ ID NO:35
在一个特定的实施方案中本发明的多核苷酸编码内切阿拉伯糖酶,并包含或由这样的核苷酸序列组成:所述核苷酸序列与SEQ ID NO:35的64到966位的核苷酸序列具有至少70%的同一性,更具体为至少80%的同一性,更具体为至少90%的同一性,更具体为至少95%的同一性,更具体为至少96%的同一性,更具体为至少97%的同一性,更具体为至少98%的同一性,更具体为至少99%的同一性,或最具体为100%的同一性。
SEQ ID NO:37
在一个特定的实施方案中本发明的多核苷酸编码内切阿拉伯糖酶,并包含或由这样的核苷酸序列组成:所述核苷酸序列与SEQ ID NO:37的55到1368位的核苷酸序列具有至少70%的同一性,更具体为至少80%的同一性,更具体为至少90%的同一性,更具体为至少95%的同一性,更具体为至少96%的同一性,更具体为至少97%的同一性,更具体为至少98%的同一性,更具体为至少99%的同一性,或最具体为100%的同一性。
SEQ ID NO:39
在一个特定的实施方案中本发明的多核苷酸编码胃蛋白酶蛋白酶(pepsin protease),并包含或由这样的核苷酸序列组成:所述核苷酸序列与SEQ ID NO:39的61到1248位的核苷酸序列具有至少70%的同一性,更具体为至少80%的同一性,更具体为至少90%的同一性,更具体为至少95%的同一性,更具体为至少96%的同一性,更具体为至少97%的同一性,更具体为至少98%的同一性,更具体为至少99%的同一性,或最具体为100%的同一性。
SEQ ID NO:41
在一个特定的实施方案中本发明的多核苷酸编码胃蛋白酶蛋白酶,并包含或由这样的核苷酸序列组成:所述核苷酸序列与SEQ ID NO:41的64到849位的核苷酸序列具有至少70%的同一性,更具体为至少80%的同一性,更具体为至少90%的同一性,更具体为至少95%的同一性,更具体为至少96%的同一性,更具体为至少97%的同一性,更具体为至少98%的同一性,更具体为至少99%的同一性,或最具体为100%的同一性。
为了合成包含相比于选自B多肽组所包含的成熟多肽的氨基酸序列具有至少一个置换、缺失和/或插入的氨基酸序列的多肽,编码本发明的多肽的核苷酸序列的修饰可能是必需的。
对本领域技术人员而言显而易见的是,可以使这些修饰保持酶的功能,即,可以在酶功能的关键区域之外进行这些修饰。对功能来说至关重要的氨基酸残基因此优选不被修饰,例如被替代。对功能来说至关重要的氨基酸残基可以通过本领域已知的程序来鉴定,诸如定点诱变或丙氨酸扫描诱变(alanine scanning mutagenesis)(例如参见Cunningham和Wells,1989,Science 244:1081-1085)。底物-酶相互作用位点可通过三维结构分析来确定,其中三维结构可由诸如核磁共振分析、晶体学、或光亲和标记等技术来测定(例如参见de Vos等,1992,Science 255:306-312;Smith等,1992,Journal of Molecular Biology 224:899-904;Wlodaver等,1992,FEBS Letters 309:59-64)。
另外,可以通过引入核苷酸置换来改变编码本发明的酶的核苷酸序列,这样的置换不会使该核苷酸序列编码产生另外的氨基酸序列,而是对应于意图用来表达酶的宿主生物的密码子使用习惯。
将一个核苷酸置换为另一个核苷酸的突变导入核苷酸序列,可以通过利用本领域已知的任何方法进行定点诱变来实现。特别有用的是利用具有目标插入片段的超螺旋双链DNA载体和两个含有所需突变的合成引物的方法。每条分别与载体的相对链互补的寡核苷酸引物借助Pfu DNA聚合酶在温度循环过程中延伸。整合入引物后,生成包含错列缺口的突变质粒。在温度循环后,用对甲基化和半甲基化DNA特异性的DpnI处理产物以消化亲代DNA模板,并选择包含突变的合成的DNA。本领域已知的其它方法也可以使用。关于核苷酸置换的一般性描述参见,例如,Ford等,1991,Protein Expression and Purification 2:95-107。
本发明还涉及包含,优选由这样的核苷酸序列组成的多核苷酸:所述核苷酸序列编码本发明的多肽并在高度严紧条件,优选极高度严紧条件下,与选自下列的多核苷酸探针杂交:
(i)核苷酸序列的互补链,所述核苷酸序列选自ADNA组序列的编码成熟多肽的区域;
(ii)核苷酸序列所包含的cDNA的互补链,所述核苷酸序列选自ADNA组序列的编码成熟多肽的区域;
(iii)(i)或(ii)的片段,其编码具有B多肽组中所包含的相应成熟多肽的功能的分泌的成熟多肽。
(J.Sambrook,E.F.Fritsch和T.Maniatus,1989,Molecular Cloning,A Laboratory Manual,第二版,Cold Spring Harbor,New York)。
可以理解的是,关于核苷酸序列杂交的细节和详情与本文中题为“本发明的多肽”部分中讨论的杂交方面的内容相同或相近。
本发明还涉及适用于电子设备的、包含本发明的多肽的氨基酸序列或本发明的多核苷酸的核苷酸序列的信息的存储介质。所述存储介质可合适地为磁盘或光盘,所述电子设备可以是计算设备,所述信息具体可以数字形式存储在存储介质上。
核酸构建体
本发明还涉及包含与一种或多种调控序列可操作地连接的本发明的多核苷酸的核酸构建体,所述调控序列在适当宿主细胞中与调控序列相容的条件下指导编码序列的表达。
可利用多种方法操作编码本发明多肽的分离多核苷酸以提供多肽的表达的条件。根据表达载体的不同,可能希望或必需在将多核苷酸序列插入载体之前对其进行操作。利用重组DNA方法修饰多核苷酸序列的技术是本领域众所周知的。
调控序列可以是适当的启动子序列,即被宿主细胞识别来表达所述核苷酸的核苷酸序列。启动子序列包含调节多肽表达的转录调控序列。启动子可以是在所选宿主细胞中表现出转录活性的任何核苷酸序列,包括突变的、截短的和杂合的启动子,而且可从编码与宿主细胞同源或异源的细胞外或细胞内多肽的基因获得。
用于指导本发明的核酸构建体转录,尤其是在细菌宿主细胞中转录的适当启动子的实例,是从大肠杆菌lac操纵子、天蓝色链霉菌(Streptomyces coelicolor)琼脂酶基因(dagA)、枯草芽孢杆菌果聚糖蔗糖酶基因(sacB)、地衣芽孢杆菌α-淀粉酶基因(amyL)、嗜热脂肪芽孢杆菌(Bacillus stearothermophilus)产麦芽糖淀粉酶(maltogenic amylase)基因(amyM)、解淀粉芽孢杆菌α-淀粉酶基因(amyQ)、地衣芽孢杆菌(Bacillus licheniformis)青霉素酶基因(penP)、枯草芽孢杆菌xylA和xylB基因、和原核生物的β-内酰胺酶基因(Villa-Kamaroff等,1978,Proceedings of the National Academy of Sciences USA 75:3727-3731)中获得的启动子,以及tac启动子(DeBoer等,1983,Proceedings of the National Academy of Sciences USA 80:21-25)。还有“Useful proteins from recombinant bacteria”,Scientific American,1980,242:74-94及Sambrook等,1989,同上中描述的其它启动子。
用于在丝状真菌宿主细胞中指导本发明的核酸构建体转录的适当启动子的实例有从米曲霉(Aspergillus oryzae)TAKA淀粉酶、Rhizomucor miehei 天冬氨酸蛋白酶、黑曲霉(Aspergillus niger)中性α-淀粉酶、黑曲霉酸稳定α-淀粉酶、黑曲霉或泡盛曲霉(Aspergillus awamori)葡糖淀粉酶(glaA)、Rhizomucor miehei脂肪酶、米曲霉碱性蛋白酶、米曲霉磷酸丙糖异构酶、构巢曲霉(Aspergillus nidulans)乙酰胺酶和尖镰孢(Fusarium oxysporum)胰蛋白酶样蛋白酶(WO 96/00787)、以及NA2-tpi启动子(来自黑曲霉中性α-淀粉酶和米曲霉磷酸丙糖异构酶基因的杂合启动子);及其突变的、截短的、和杂合的启动子。
在酵母宿主中,有用的启动子有从酿酒酵母(Saccharomyces cerevisiae)烯醇化酶(ENO-1)、酿酒酵母半乳糖激酶(GAL1)、酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH1、ADH2/GAP)和酿酒酵母3-磷酸甘油酸(phosphoglycerate)激酶基因中所获得的。还有Romanos等,1992,Yeast 8:423-488中描述了用于酵母宿主细胞的其它有用启动子。
调控序列也可以是适当的转录终止子序列,即由宿主细胞识别来终止转录的序列。终止子序列可操作地连接于编码多肽的核苷酸序列的3′端。在所选择的宿主细胞中起作用的任何终止子都可用于本发明。
对于丝状真菌宿主细胞优选的终止子是从米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸(anthranilate)合酶、黑曲霉α-葡糖苷酶、和尖镰孢胰蛋白酶样蛋白酶的基因中获得的。
对于酵母宿主细胞优选的终止子是从酿酒酵母烯醇化酶、酿酒酵母细胞色素C(CYC1)和酿酒酵母甘油醛-3-磷酸脱氢酶基因中获得的。还有Romanos等,1992,同上中描述的用于酵母宿主细胞的其它有用终止子。
调控序列还可以是适当的前导序列,即mRNA中对宿主细胞翻译重要的非翻译区。前导序列可操作地连接于编码多肽的核苷酸序列的5′端。在所选择的宿主细胞中起作用的任何前导序列都可用于本发明。
对于丝状真菌宿主细胞优选的前导序列是从米曲霉TAKA淀粉酶和构巢曲霉磷酸丙糖异构酶基因中获得的。
对于酵母宿主细胞优选的前导序列是从酿酒酵母烯醇化酶(ENO-1)、酿酒酵母3-磷酸甘油酸激酶、酿酒酵母α-因子和酿酒酵母醇脱氢酶/甘油醛-3-磷酸脱氢酶(ADH2/GAP)基因中获得的。
调控序列还可以是聚腺苷酸化序列,即可操作地连接于核苷酸序列3′端的序列,且当被转录时,作为将聚腺苷残基添加到转录出的mRNA上的信号被宿主细胞所识别。在所选择的宿主细胞中起作用的任何聚腺苷酸化序列都可用于本发明。
对于丝状真菌宿主细胞优选的聚腺苷酸化序列是从米曲霉TAKA淀粉酶、黑曲霉葡糖淀粉酶、构巢曲霉邻氨基苯甲酸合酶、尖镰孢胰蛋白酶样蛋白酶、和黑曲霉α-葡糖苷酶的基因获得的。
Guo和Sherman等,1995,Molecular Cellular Biology 15:5983-5990中描述了对酵母宿主细胞有用的聚腺苷酸化序列。
调控序列还可以是信号肽编码区,它编码连接于多肽的氨基末端,并指导编码的多肽进入细胞分泌途径的氨基酸序列。核苷酸序列的编码序列的5′端可固有地含有信号肽编码区,它在翻译读码框中与编码分泌多肽的编码区段天然连接。或者,编码序列的5′端可以含有对编码序列而言是外来的信号肽编码区。如果编码序列天然地不含信号肽编码区,则可能需要外来的信号肽编码区。或者,外来的信号肽编码区可简单地替换天然信号肽编码区以便增强多肽的分泌。然而,指导表达的多肽进入所选择宿主细胞分泌途径的任何信号肽编码区均可用于本发明。
对于细菌宿主细胞有效的信号肽编码区有从芽孢杆菌NCIB 11837的产麦芽糖淀粉酶、嗜热脂肪芽孢杆菌的α-淀粉酶、地衣芽孢杆菌的枯草杆菌蛋白酶、地衣芽孢杆菌的β-内酰胺酶、嗜热脂肪芽孢杆菌的中性蛋白酶类(nprT、nprS、nprM)、和枯草芽孢杆菌的prsA基因获得的信号肽编码区。还有Simonen和Palva,1993,Microbiological Reviews 57:109-137中描述的其它信号肽。
对于丝状真菌宿主细胞有效的信号肽编码区有从米曲霉TAKA淀粉酶、黑曲霉中性淀粉酶、黑曲霉葡糖淀粉酶、Rhizomucor miehei天冬氨酸蛋白酶、Humicola insolens纤维素酶和Humicola lanuginosa脂肪酶的基因获得的信号肽编码区。
对于酵母宿主细胞有用的信号肽是从酿酒酵母α-因子和酿酒酵母转化酶的基因获得的。Romanos等,1992,同上中描述了的其它有用的信号肽编码区。
调控序列还可以是前肽(propeptide)编码区,它编码位于多肽氨基末端的氨基酸序列。所得的多肽可称为酶原(proenzyme)或多肽原(propolypeptide)。多肽原一般是没有活性的,通过催化或自催化切割将前肽从多肽原切除后,可转变为成熟有活性的多肽。前肽编码区可从枯草芽孢杆菌碱性蛋白酶(aprE)、枯草芽孢杆菌中性蛋白酶(nprT)、酿酒酵母α-因子、Rhizomucor miehei天冬氨酸蛋白酶、和Myceliophthora thermophila漆酶(WO 95/33836)的基因获得。
当信号肽和前肽区都存在于多肽的氨基末端时,前肽区位于靠近多肽氨基末端的位置,而信号肽区位于靠近前肽区的氨基末端位置。在酵母中,可使用ADH2系统或GAL1系统。在丝状真菌中,可使用TAKA α-淀粉酶启动子、黑曲霉葡糖淀粉酶启动子、和米曲霉葡糖淀粉酶启动子作为调节序列。
调节序列的其它实例有使基因得以扩增的那些调节序列。在真核系统中,这些包括在氨甲喋呤存在时扩增的二氢叶酸还原酶基因,以及在重金属存在下扩增的金属硫蛋白基因。在这些情况中,编码多肽的核苷酸序列将与调节序列可操作地连接。
重组表达载体
本发明还涉及包含本发明的核酸构建体的重组表达载体。可以将上述述的各种核酸和调控序列连接到一起以产生重组表达载体,此载体可包括一个或多个便利的限制性位点使得在这些位点可插入或替换编码多肽的核苷酸序列。或者,本发明的核苷酸序列可通过将核苷酸序列或含有序列的核酸构建体插入适当的表达载体进行表达。构建表达载体时,将编码序列置于载体中以使编码序列与适当的表达调控可操作地连接。
重组表达载体可以是可方便的接受重组DNA操作并能引起核苷酸序列表达的任何载体(例如质粒或病毒)。载体的选择通常取决于载体与引入此载体的宿主细胞之间的相容性。载体可以是线性的或闭合环状的质粒。
载体可以是自主复制载体,即以染色体外实体的形式存在,且其复制独立于染色体的复制的载体,例如质粒、染色体外元件、微型染色体、或人工染色体。
载体可包含任何用于确保自我复制的手段。或者,载体可以是这样的载体:它在导入宿主细胞后,整合到基因组中并与其整合进入的染色体一起复制。此外,可使用单一载体或质粒,或是一起含有待引入宿主细胞基因组的全部DNA的两种或多种载体或质粒,或者转座子。
本发明载体优选包含一种或多种允许容易地选择转化细胞的选择标记。选择标记是这样的一类基因,其产物有助于产生抗微生物剂或病毒抗性、重金属抗性、营养缺陷型变成原养型(prototrophy to auxotrophs)等等。
细菌选择标记的实例有来自枯草芽孢杆菌或地衣芽孢杆菌的dal基因,或者赋予抗生素抗性诸如氨苄青霉素、卡那霉素、氯霉素或四环素抗性的标记。适于酵母宿主细胞的标记有ADE2、HIS3、LEU2、LYS2、MET3、TRP1和URA3。在丝状宿主细胞中使用的选择标记包括但不限于:amdS(乙酰胺酶)、argB(鸟氨酸氨甲酰基转移酶)、bar(膦丝菌素乙酰基转移酶)、hygB(潮霉素磷酸转移酶)、niaD(硝酸还原酶)、pyrG(乳清苷-5′-磷酸脱羧酶)、sC(硫酸腺苷酰转移酶(sulfate adenyltransferase))和trpC(邻氨基苯甲酸合酶)及其等价物。
优选用于曲霉属(Asperigillus)细胞的是构巢曲霉或米曲霉的amdS和pyrG基因以及吸水链霉菌(Streptomyces hygroscopicus)的bar基因。
本发明的载体优选包含允许载体整合到宿主细胞基因组中或者允许载体在细胞中不依赖于基因组自主复制的元件。
对整合到宿主细胞基因组而言,载体可依赖编码多肽的多核苷酸序列或任何其它载体元件通过同源或非同源重组整合到基因组中。或者,载体可包含附加的核苷酸序列,来指导通过同源重组在染色体精确位置整合进入宿主细胞基因组中。这些附加的核苷酸序列使载体可以在染色体上的精确位置整合到宿主细胞基因组中。为了提高在精确位置整合的可能性,整合元件应优选包含足够数目的与对应靶序列高度同源的核酸,诸如100-1,500个碱基对、优选400-1,500个碱基对、且最优选800-1,500个碱基对,从而提高同源重组的概率。整合元件可以是与宿主细胞基因组中的靶序列同源的任何序列。此外,整合元件可以是非编码或编码核苷酸序列。另一方面,载体可通过非同源重组整合到宿主细胞的基因组中。
对自主复制而言,载体还可包含能使载体在所述的宿主细胞中自主复制的复制起点。细菌复制起点的实例有允许在大肠杆菌中复制的质粒pBR322、pUC19、pACYC177和pACYC184的复制起点,以及允许使得在芽孢杆菌中复制的pUB110、pE194、pTA1060和pAMβ1的复制起点。用于酵母宿主细胞的复制起点的实例有2μm复制起点、ARS1、ARS4、ARS1和CEN3的组合、及ARS4和CEN6的组合。
复制起点可以具有使其在宿主细胞内的作用成为温度敏感型的突变(见,例如,Ehrlich,1978,Proceedings of the National.Academy of Sciences USA 75:1433)。
可以将多于一个拷贝的编码本发明的多肽的核酸序列插入宿主细胞中以增强该基因产物的表达。核苷酸序列拷贝数的增加可以通过下述实现:将至少核酸序列的另一个拷贝整合到宿主细胞基因组中,或者将核酸序列包含有可扩增的选择性标记基因,通过在合适的选择剂的存在下培养细胞,能筛选出含有扩增拷贝的选择性标记基因、从而也就含有所述核酸序列的更多拷贝的细胞。
用于连接上述元件以构建本发明重组表达载体的方法是本领域技术人员所熟知的(例如参见Sambrook等,1989,同上)。
重组宿主细胞
本发明还涉及包含本发明的核酸构建体的重组宿主细胞,它们可有利的用于所述多肽的重组生产。如前所述,将包含本发明核苷酸序列的载体引入宿主细胞,以使载体作为染色体的整合体或作为自主复制的染色体外载体被保持。
宿主细胞可以是单细胞微生物,例如原核生物,或非单细胞微生物,例如真核生物。
有用的单细胞微生物有细菌细胞,诸如革兰氏阳性细菌,包括但不限于芽孢杆菌属细胞,例如嗜碱芽孢杆菌(Bacillus alkaphilus)、解淀粉芽孢杆菌(Bacillus amyloliquefaciens)、短芽孢杆菌(Bacillus brevis)、环状芽孢杆菌(Bacillus circulans)、Bacillus clausii、凝结芽孢杆菌(Bacillus coagulans)、灿烂芽孢杆菌(Bacillus lautus)、迟缓芽孢杆菌(Bacillus lentus)、地衣芽孢杆菌、巨大芽孢杆菌(Bacillus megaterium)、嗜热脂肪芽孢杆菌、枯草芽孢杆菌、和苏云金芽孢杆菌(Bacillus thuringiensis);或链霉菌属(Streptomyces)细胞,例如浅青紫链霉菌(Streptomyces lividans)和鼠灰链霉菌(Streptomyces murinus),或者革兰氏阴性细菌,诸如大肠杆菌和假单胞菌种(Pseudomonas sp.)。在一个特定的实施方案中,细菌宿主细胞是迟缓芽孢杆菌、地衣芽孢杆菌、嗜热脂肪芽孢杆菌、或枯草杆菌细胞。在另一个优选的方面,芽孢杆菌属细胞是嗜碱的(alkalophilic)芽孢杆菌。
将载体导入细菌宿主细胞可通过例如原生质体转化(参见例如Chang和Cohen,1979,Molecular General Genetics 168:111-115)、使用感受态细胞(参见例如Young和Spizizen,1961,Journal of Bacteriology 81:823-829;或Dubnau和Davidoff-Abelson,1971,Journal of Molecular Biology 56:209-221)、电穿孔(参见例如Shigekawa和Dower,1988,Biotechniques 6:742-751)、或接合(参见例如Koehler和Thorne,1987,Journal of Bacteriology 169:5771-5278)来实现。
宿主细胞可以是真核细胞,诸如哺乳动物、昆虫、植物、或真菌细胞。
在一个优选的方面,宿主细胞是真菌细胞。“真菌”在用于本文时包括子囊菌门(Ascomycota)、担子菌门(Basidiomycota)、壶菌门(Chytridiomycota)、和接合菌门(Zygomycota)(如Hawksworth等,在Ainsworth and Bisby’s Dictionary of The Fungi,第八版,1995,CAB International,University Press,Cambridge,UK中所定义的),以及卵菌门(Oomycota)(如Hawksworth等,1995,同上第171页中所引用的)和所有有丝分裂孢子真菌(Hawksworth等,1995,同上)。在一个更优选的方面,真菌宿主细胞是酵母细胞。“酵母”在用于本文时包括产子囊酵母(内孢霉目Endomycetales)、产担孢子酵母、和属于半知菌类(Fungi Imperfecti)的酵母(芽孢纲Blastomycetes)。由于酵母的分类今后还会变化,对于本发明来说,酵母应该是如在Biology and Activities of Yeast(Skinner,F.A.、Passmore,S.M.和Davenport,R.R.编,Soc.App.Bacteriol.Symposium Series No.9,1980)中所定义的。
在一个更优选的方面,酵母宿主细胞是假丝酵母属、汉逊酵母属(Hansenula)、克鲁维酵母属(Kluyveromyces)、毕赤酵母属(Pichia)、糖酵母属(Saccharomyces)、裂殖酵母属(Schizosaccharomyces)、或Yarrowia属细胞。
在一个最优选的方面,酵母宿主细胞是卡尔斯伯糖酵母(Saccharomyces carlsbergensis)、酿酒酵母(Saccharomyces cerevisiae)、糖化糖酵母(Saccharomyces diastaticus)、Saccharomyces douglasii、Saccharomyces kluyveri、Saccharomyces norbensis或卵形糖酵母(Saccharomyces oviformis)细胞。在另一个最优选的方案中,酵母宿主细胞是乳酸克鲁维酵母(Kluyveromyces lactis)细胞。在另一个最优选的方案中,酵母宿主细胞是Yarrowia lipolytica细胞。
在另一个更优选的方面,真菌宿主细胞是丝状真菌细胞。“丝状真菌”包括真菌门(Eumycota)和卵菌门(Oomycota)(如Hawksworth等,1995,文献同上所定义的)所有丝状形式的亚类。丝状真菌特征在于通常由几丁质、纤维素、葡聚糖、脱乙酰壳多糖、甘露聚糖、以及其它复合多糖组成的菌丝体壁。营养生长依靠菌丝延长,且碳分解代谢是专性需氧的。相反,诸如酿酒酵母的酵母的营养生长通过单细胞原植体的芽殖进行,且碳分解代谢可以是发酵的。
在一个甚至更优选的方面,丝状真菌宿主细胞是Acremonium属、曲霉属、镰孢属(Fusarium)、腐质霉属(Humicola)、毛霉属(Mucor)、毁丝霉属(Myceliophthora)、脉孢霉属(Neurospora)、青霉属(Penicillium)、梭孢壳属(Thielavia)、Tolypocladium属、或木霉属(Trichoderma)的细胞。
在一个最优选的方面,丝状真菌宿主细胞是泡盛曲霉、臭曲霉(Aspergillus foetidus)、日本曲霉(Aspergillus japonicus)、构巢曲霉、黑曲霉、或米曲霉细胞。在另一个最优选的方案中,丝状真菌宿主细胞是杆孢状镰孢(Fusarium bactridioides)、Fusarium cerealis、Fusarium crookwellense,大刀镰孢(Fusarium culmorum)、禾谷镰孢(Fusarium graminearum)、禾赤镰孢(Fusarium graminum)、异孢镰孢(Fusarium heterosporum)、合欢木镰孢(Fusarium negundi)、尖孢镰孢(Fusarium oxysporum)、多枝镰孢(Fusarium reticulatum)、玫瑰色镰孢(Fusarium roseum)、接骨木镰孢(Fusarium sambucinum)、肤色镰孢(Fusarium sarcochroum)、拟分枝孢镰孢(Fusarium sporotrichioides)、硫色镰孢(Fusarium sulphureum)、Fusarium torulosum、Fusarium trichothecioides、Fusarium venenatum细胞。在一种最优选的实施方案中,丝状真菌亲代细胞是Fusarium venenatum(Nirenberg sp.nov.)细胞。在另一种最优选的实施方案中,丝状真菌宿主细胞是Humicola insolens、Humicola lanuginosa、Mucor miehei、Myceliophthora thermophila、粗糙脉孢霉(Neurospora crassa)、产紫青霉、Thielavia terrestris、Trichoderma harzianum、康宁木霉(Trichoderma koningii)、Trichoderma longibrachiatum、Trichoderma reesei或绿色木霉细胞。
真菌细胞可以本身已知的方式通过涉及原生质体形成、原生质体转化、和细胞壁再生的过程进行转化。EP 238 023和Yelton等,1984,Proceedings of the National Academy of Sciences USA 81:1470-1474中描述了适合曲霉属和木霉属宿主细胞转化的过程。Malardier等,1989,Gene 78:147-159和WO 96/00787中描述了适合转化镰孢属物种的方法。酵母可利用Becker和Guarente在Abelson,J.N.和Simon,M.I.编的Guide to Yeast Genetics and Molecular Biology,Methods in Enzymology,Volume.194,pp 182-187,Academic Press公司,New York;Ito等,1983,Journal of Bacteriology 153:163;及Hinnen等,1978,Proceedings of the National Academy of Sciences USA 75:1920中所描述的程序转化。
生产方法
本发明还涉及生产本发明的酶的方法,包括:(a)培养包含编码本发明的酶的核苷酸序列的生物株系,其中所述株系能表达和分泌该酶;并(b)回收所述酶。在一个具体的实施方案中,所述株系是野生型株系,例如Botryospaeria rhodina CBS 274.96,而在另一个实施方案中所述株系是如上所述的重组宿主细胞。
在本发明的生产方法中,利用本领域众所周知的方法在适于产生所述酶的培养基中培养细胞。例如,可在实验室或工业发酵罐中,在适当的培养基和可使所述多肽表达和/或分离的条件下,通过摇瓶培养、小规模或大规模发酵(包括连续、分批、补料-分批、或固态发酵)来进行细胞培养。培养使用本领域已知的程序在含有碳和氮源以及无机盐的合适营养培养基中进行。适宜的培养基可从商业供应商获得,或者可根据已公布的配方来制备(例如参见美国典型培养物保藏中心的目录)。如果酶被分泌到培养基中,那么可直接从培养基中回收酶。如果酶不分泌,那么可从细胞裂解物中进行回收。
所得的酶多肽可通过本领域已知的方法回收。例如,可通过常规程序,包括但不限于离心、过滤、萃取、喷雾干燥、蒸发、或沉淀,从培养基中回收所述酶。
本发明的多肽可通过本领域已知的多种程序纯化,包括但不限于层析(例如离子交换、亲和、疏水、层析聚焦、和大小排阻)、电泳(例如制备性等电聚焦)、差异溶解(例如硫酸铵沉淀)、SDS-PAGE、或萃取(例如参见Protein Purification,J.-C.Janson和Lars Ryden编,VCH Publishers,New York,1989。
转基因植物
本发明还涉及转基因植物、植物部分或者植物细胞,它们已被编码本发明的酶的核苷酸序列所转化,从而表达所述酶。在一个实施方案中所述植物可以用作以可回收的量生产所述酶的宿主。可以从所述植物或植物部分回收酶。或者,含有该重组酶的植物或植物部分本身可以用来提高食品或饲料的质量,例如,改善营养价值、适口性和流变学性质,或破坏抗营养因子(antinutritional factor)。具体地,表达所述酶的植物或植物部分可以作为改良的起始材料用于生产燃料酒精或生物乙醇(bio-ethanol)。
所述转基因植物可以是双子叶的(双子叶植物)或单子叶的(单子叶植物)。单子叶植物的实例是草类/禾本科(grasses),例如草地早熟禾(meadow grass)(蓝草(blue grass),早熟禾属(Poa)),饲用牧草(forage grass),例如羊茅属(festuca),黑麦草属(lolium);寒地型牧草(temperate grass),例如剪股颖属(Agrostis);和谷类(cereals),如小麦、燕麦、黑麦、大麦、稻、高粱和玉米(maize)(玉米(corn))。
双子叶植物的例子有:烟草;豆类(legumes),例如羽扇豆(lupins);马铃薯;甜菜;豌豆;菜豆(bean)和大豆,和十字花科植物(Brassicaceae),例如花椰菜、油菜籽(rape seed)和与之亲缘关系紧密的模式生物拟南芥(Arabidopsis thaliana)。
植物部分的例子有茎、愈伤组织、叶、根、果实、种子和块茎。特定的植物组织,例如叶绿体、质外体、线粒体、液泡、过氧化物酶体和细胞质,都被认为是植物部分。另外,任何植物细胞,不管其来自什么组织,都被认为是植物部分。
这些植物、植物部分和植物细胞的后代也被包括在本发明的范围之内。
所述表达本发明的酶的转基因植物或植物细胞可以根据本领域已知的方法构建。简单地说,所述植物或植物细胞这样构建的:将一个或多个编码本发明的酶的表达构建体整合入植物宿主的基因组,并使所得的修饰植物或植物细胞繁殖成为转基因植物或植物细胞。
方便地,所述表达构建体是包含核苷酸序列的核酸构建体,所述核苷酸序列编码本发明的酶,且可操作地连接于在所选植物或植物部分中表达该核苷酸序列所需的合适的调控序列。另外,该表达构建体还可以包括可用于鉴定已经整合了表达构建体的宿主细胞的可选择标记;以及将该构建体导入所述的植物所需要的DNA序列(后者取决于使用的DNA导入方法)。
选择调节序列,例如启动子和终止子序列,以及可选的信号或转运序列,是根据例如想要在何时、何处、怎样表达该酶而决定的。例如,编码本发明的酶的基因的表达可以是组成型或诱导型的,或者可为发育性、阶段或组织特异性的,而且基因产物可以被靶向于具体的组织或者植物部分例如种子或叶。对调节序列的描述有例如Tague等,1988,Plant Physiology 86:506。
对于组成性表达,可以使用35S-CaMV启动子(Franck等.,1980.Cell 21:285-294)。器官特异性的启动子可以是,例如,来自存储性贮藏组织(storage sink tissues)例如种子、马铃薯的块茎及果实的启动子(Edwards和Coruzzi,1990,Ann.Rev.Genet.24:275-303),或者来自代谢性贮藏组织(metabolic sink tissues)例如分生组织的启动子(Ito等,1994,Plant Mol.Biol.24:863-878);或者是种子特异性的启动子,例如来自稻的谷蛋白、谷醇溶蛋白、球蛋白或白蛋白启动子(Wu等,1998,Plant and Cell Physiology 39:885-889),来自蚕豆(Vicia faba)的豆球蛋白B4和未知的种子蛋白基因的蚕豆启动子(Conrad等,1998,Journal of Plant Physiology 152:708-711),来自种子油体(seed oil body)蛋白的启动子(Chen等,1998,Plant and Cell Physiology 39:935-941),来自欧洲油菜(Brassica napus)的贮存蛋白napA启动子,或任何其他本领域已知的种子特异性的启动子,例如WO 91/14772所描述的。另外,该启动子还可以是叶特异性的启动子,例如稻或西红柿的rbcs启动子(Kyozuka等,1993,Plant Physiology 102:991-1000);小球藻病毒腺嘌呤甲基转移酶基因启动子(Mitra和Higgins,1994,Plant Molecular Biology 26:85-93),或来自稻的aldP基因启动子(Kagaya等,1995,Molecular and General Genetics 248:668-674);或为创伤诱导的启动子例如马铃薯pin2启动子(Xu等,1993,Plant Molecular Biology 22:573-588)。
也可以使用启动子增强元件来获得在植物中酶的更高表达。例如,启动子增强元件可以是位于启动子和编码本发明的酶的核苷酸序列之间的内含子。例如Xu等,1993(同上)公开了稻肌动蛋白1基因的第一个内含子增强表达的用途。
可选择标记基因和表达构建体的任何其他部分都可以从本领域可用的那些中选择。
根据本领域已知的常规技术将该核酸构建体整合入植物基因组,所述技术包括农杆菌(Agrobacterium)介导的转化、病毒介导的转化、显微注射、粒子轰击、生物射弹转化(biolistic tranformation)和电穿孔(Gasser等,1990,Science 244:1293;Potrykus,1990,Bio/Technology 8:535;Shimamoto等,1989,Nature 338:274)。
目前,根瘤农杆菌(Agrobacterim tumefaciens)介导的基因转移是产生转基因双子叶植物的优选方法(见Hooykas和Schilperoort,1992,Plant Molecular Biology 19:15-38的综述)。不过该方法也可以用于转化单子叶植物,尽管单子叶植物一般优选别的转化方法。目前,产生转基因单子叶植物的优选方法是粒子(被用于转化的DNA所包被的极小金或钨粒子)轰击胚愈伤组织(embroynic calli)或发育中的胚(Christou,1992,Plant Journal 2:275-281;Shimamoto,1994,Current Opinion Biotechnology 5:158-162;Vasil 等,1992,Bio/Technology 10:667-674)。另外一种可选的转化单子叶植物的方法是基于原生质体转化,如Omirulleh等,1993,Plant Molecular Biology 21:415-428所述。
转化以后,选择整合了表达构建体的转化子,并根据本领域熟知的方使其再生为完整植株。
本发明还涉及产生本发明的酶的方法,其包括(a)在有利于生产所述酶的条件下,培养含有编码本发明的酶的核苷酸序列的转基因植物或植物细胞;和(b)回收该酶。
包含酶多肽的组合物和它们的制备方法
本发明提供包含本发明的多肽和赋形剂的组合物和制备这样的组合物的方法,该方法包括混合本发明的多肽和赋形剂。在一个具体的实施方案中,本发明的多肽是该组合物,例如单组分组合物中的主要(多肽)成分。在这里,赋形剂应理解为用于配制所述组合物的任何辅助性的试剂或化合物,包括溶剂、载体、稳定剂等。
该组合物还可以包含一种或多种其它的酶,例如氨肽酶、淀粉酶、糖酶、羧肽酶、过氧化氢酶、纤维素酶、几丁质酶、角质酶、环糊精糖基转移酶、脱氧核糖核酸酶、酯酶、α-半乳糖苷酶、β-半乳糖苷酶、葡糖淀粉酶、α-葡糖苷酶、β-葡糖苷酶、卤素过氧化物酶(haloperoxidase)、转化酶、漆酶、脂肪酶、甘露糖苷酶、氧化酶、果胶分解酶、肽谷氨酰胺酶、过氧化物酶、肌醇六磷酸酶、多酚氧化酶、蛋白水解酶、核糖核酸酶、转谷氨酰胺酶、或木聚糖酶。
所述组合物可以根据本领域已知的方法制备并可以为液体或固体组合物的形式。例如,酶组合物可以用多肽和/或药品制剂技术领域已知的方法配制,例如配制为包衣或未包衣的颗粒或微颗粒。因此本发明的多肽可以以颗粒,优选非粉化性(non-dusting)颗粒,液体,特别是稳定化的液体,浆液或被保护的多肽的形式提供。对于一定的用途,可优选将多肽固定到固态基质上。
组合物中要包含的多肽可以根据本领域已知的方法稳定化,例如通过加入抗氧化剂或还原剂以限制多肽的氧化从而稳定组合物中的多肽,或可通过加入例如PVP、PVA、PEG或其它已知对多肽在固体或液体组合物中的稳定性有益的合适的聚合物来稳定它。
在另外的实施方案中,本发明的组合物是去污剂组合物,该组合物除了本发明的多肽以外还包含表面活性剂,以及,任选地,选自增效剂(builder)例如沸石、漂白剂例如过碳酸盐、漂白促进剂(bleach enhancers)例如TAED或NOBS、抑泡剂(suds suppressors)、芳香剂等等的化合物。
在另一个实施方案中本发明的组合物是饲料组合物,其除了本发明的多肽以外还包含谷类(cereal)或谷物(grain)产品。
在另一个实施方案中本发明的组合物是包含本发明的多肽的食品组合物例如面包粉(baker’s flour)组合物、酿造产品、果汁、油或猪油产品。
在另一个实施方案中本发明的组合物是纸浆组合物,其除了本发明的多肽外还含有纸浆。
在另一个实施方案中本发明的组合物是杀生物(biocidal)组合物,其除了本发明的多肽外还含有氧化还原酶促进剂。
酶多肽和包含它们的组合物的用途
在另外的方面中,本发明提供本发明的多肽或多核苷酸,或包含所述多肽或多核苷酸的组合物在多种应用特别是(技术)过程例如工业或家庭中进行的过程中,及下面的用于商业研究的目的的用途。因此本文涵盖这样的过程,其包括在(技术的)工业、研究或家用过程中使用本发明的多肽或本发明的多核苷酸。
在一个实施方案中本发明的多肽或组合物被用来清洗纤维质织物。
在另一个实施方案中使用本发明的多肽或组合物制备食品或饲料添加剂。
在另一个实施方案中使用本发明的多肽或组合物处理木质(lignolosic)材料和纸浆。
去污剂的公开
本发明的多肽可以添加到去污剂(detergent)组合物中并因此成为其组分。
本发明的去污剂组合物可以,例如,配制为手洗或机洗衣物用去污剂组合物,其包括适用于预处理染污织物的洗衣添加剂组合物,和漂洗加入的织物软化组合物(rinse added fabric softener composition);或者可以配制为用于一般家用硬表面清洗操作的去污剂组合物,或配制为用于手洗或机洗碗碟操作。
在一个特定的方面中,本发明提供包含本发明的多肽的去污剂添加剂。该去污剂添加剂及去污剂组合物可包含一种或多种其他的酶例如蛋白酶、脂肪酶、角质酶、淀粉酶、糖酶、纤维素酶、果胶酶、甘露聚糖酶、阿拉伯糖酶(arabinase)、半乳聚糖酶、木聚糖酶、氧化酶例如漆酶和/或过氧化物酶。
一般而言,所选的酶的性质应该与所选的去污剂相容(例如最适pH、与其他酶或非酶成分的相容性等等),而且该酶应当以有效量存在。
蛋白酶:合适的蛋白酶包括动物、植物或微生物来源的那些蛋白酶。微生物来源是优选的。还包括化学修饰的或蛋白质工程改造的突变体。该蛋白质可以是丝氨酸蛋白酶或金属蛋白酶,优选地为碱性微生物蛋白酶或胰蛋白酶样(trypsin-like)蛋白酶。碱性蛋白酶的例子有枯草杆菌蛋白酶,特别是来自芽孢杆菌的那些,例如枯草杆菌蛋白酶Novo、枯草杆菌蛋白酶Carlsberg、枯草杆菌蛋白酶309、枯草杆菌蛋白酶147和枯草杆菌蛋白酶168(如WO89/06279所述)。胰蛋白酶样蛋白酶的例子有胰蛋白酶(例如猪或牛来源的)和镰孢属(Fusarium)蛋白酶,其在WO 89/06270和WO 94/25583中有描述。
有用的蛋白酶的例子有WO 92/19729、WO 98/20115、WO 98/20116和WO 98/34946中所描述的变体,特别是那些文献中所述的特定位置上有置换的变体。
优选的商业上可获得的蛋白酶包括Alcalase,Savinase,Primase
Figure BSA00000241439500513
,Duralase
Figure BSA00000241439500514
,Esperase
Figure BSA00000241439500515
,和Kannase(Novozymes A/S),Maxatase
Figure BSA00000241439500517
,Maxacal
Figure BSA00000241439500518
,Maxapem
Figure BSA00000241439500519
,Properase
Figure BSA000002414395005110
,Purafect
Figure BSA000002414395005111
,Purafect OxP
Figure BSA000002414395005112
,FN2
Figure BSA000002414395005113
,和FN3
Figure BSA000002414395005114
(Genencor International Inc.)。
脂肪酶:合适的脂肪酶包括细菌或真菌来源的那些脂肪酶。还包括化学修饰的或蛋白质工程改造的突变体。有用的脂肪酶的例子包括来自腐质霉属(Humicola,与Thermomyces同义)的脂肪酶,例如EP 258 068和EP 305 216所描述的来自H.lanuginosa(T.lanuginosus)的脂肪酶,或WO 96/13580所描述的来自H.insolens的脂肪酶,假单胞菌(Pseudomonas)脂肪酶,例如来自产碱假单胞菌(P.alcaligenes)或类产碱假单胞菌(P.pseudoalcaligenes)(EP 218 272)、洋葱假单胞菌(P.cepacia)(EP 331 376)、司徒茨假单胞菌(P.stutzeri)(GB 1,372,034)、荧光假单胞菌(P.fluorescens)、假单胞菌菌种SD705株(WO 95/06720和WO 96/27002)和P.wisconsinensis(WO 96/12012)的脂肪酶;芽孢杆菌脂肪酶,例如来自枯草芽孢杆菌(Dartois等,(1993),Biochemica et Biophysica Acta,1131,253-360)、嗜热脂肪芽孢杆菌(JP 64/744992)、或短小芽孢杆菌(B.pumilus)(WO 91/16422)的脂肪酶。
其他的例子有WO 92/05249,WO 94/01541,EP 407 225,EP 260 105,WO 95/35381,WO 96/00292,WO 95/30744,WO 94/25578,WO 95/14783,WO 95/22615,WO 97/04079和WO 97/07202中所描述的脂肪酶变体。
优选的商业上可获得的脂肪酶包括LipolaseTM,Lipolase UltraTM和LipexTM(Novozymes AJS)。
淀粉酶:合适的淀粉酶(α和/或β)包括细菌或真菌来源的那些淀粉酶。还包括化学修饰的或蛋白质工程改造的突变体。淀粉酶包括,例如,得自芽孢杆菌,例如一种特别的地衣芽孢杆菌菌株(在GB 1,296,839中有详述)的α-淀粉酶。
有用的淀粉酶的例子有WO 94/02597,WO 94/18314,WO 96/23873和WO97/43424中描述的变体,特别是那些文献中所述的特定位置上有置换的变体。
优选的商业上可获得的淀粉酶包括DuramylTM,TermamylTM,FungamylTM和BANTM(Novozymes A/S),RapidaseTM和PurastarTM(来自Genencor International Inc.)。
纤维素酶:合适的纤维素酶包括细菌或真菌来源的那些纤维素酶。还包括化学修饰的或蛋白质工程改造的突变体。合适的纤维素酶包括来自芽孢杆菌属、假单胞菌属、腐质霉属、镰孢属、梭孢壳属和Acremonium属的纤维素酶,例如在US 4,435,307,US 5,648,263,US 5,691,178,US 5,776,757和WO 89/09259中描述的、由Humicola insolens、Myceliophthora thermophila和尖镰孢产生的真菌纤维素酶。
特别合适的纤维素酶是具有护色(color care)的益处的碱性或中性纤维素酶。这样的纤维素酶的例子有EP 0 495 257,EP 0 531 372,WO 96/11262,WO 96/29397和WO 98/08940中描述的纤维素酶。其他例子有纤维素酶变体,例如WO 94/07998,EP 0 531 315,US 5,457,046,US 5,686,593,US 5,763,254,WO 95/24471,WO 98/12307和PCT/DK98/00299中描述的那些。商业上可获得的纤维素酶包括Celluzyme
Figure BSA00000241439500521
,和Carezyme
Figure BSA00000241439500522
(Novozymes),Clazinase
Figure BSA00000241439500523
,和Puradax HA
Figure BSA00000241439500524
(Genencor International Inc.),和KAC-500(B)
Figure BSA00000241439500525
(Kao Corporation)。
过氧化物酶/氧化酶:合适的过氧化物酶/氧化酶包括植物、细菌或真菌来源的那些过氧化物酶/氧化酶。还包括化学修饰的或蛋白质工程改造的突变体。有用的过氧化物酶的例子包括来自鬼伞属(Coprinus)的过氧化物酶,例如来自灰盖鬼伞(C.cinereus),及其变体,如WO 93/24618,WO 95/10602,和WO 98/15257所述的那些的过氧化物酶。
商业上可获得的过氧化物酶包括Guardzyme
Figure BSA00000241439500526
(Novozymes A/S)。
可以通过加入含有一种或多种酶的单独的添加剂,或加入包含所有酶的复合添加剂,使去污酶(detergent enzyme(s))包含在去污剂组合物中。本发明的去污剂添加剂,即单独的添加剂或复合添加剂,可以配置为例如颗粒、液体、浆液等等。优选的去污剂添加剂的剂型为颗粒,特别是非粉化性颗粒、液体,特别是稳定化的液体,或浆液。
非粉化性颗粒可以,例如,如US 4,106,991和4,661,452所公开的那样制备,任选地,还可以用本领域已知的方法来包被。蜡状(waxy)包被材料的例子有平均克分子量为1000-20000的聚(环氧乙烷)产品(聚乙二醇,PEG);具有16-50个环氧乙烷单位的乙氧基化壬基苯酚;乙氧基化脂肪醇,其中醇含12-20个碳原子,且其中有15-80个环氧乙烷单位;脂肪醇;脂肪酸;以及脂肪酸的甘油单酯、甘油二酯和甘油三酯。GB 1483591提供了适于通过流化床施用的成膜包被材料的例子。液体酶制备物可以,例如,按照已确立的方法,通过加入多元醇,如丙二醇、糖或糖醇、乳酸或硼酸来稳定化。可以根据EP 238,216所公开的方法制备被保护的酶。
本发明的去污剂组合物可以是任何方便的形式,例如条、片、粉、颗粒、糊或液体。液体去污剂可以是水性的,通常含有高达70%的水和0-30%的有机溶剂,或者可以是非水性的。
所述去污剂组合物包含一种或多种表面活性剂,表面活性剂可以是非离子型包括半极性的,和/或阴离子型的,和/或阳离子型的,和/或两性离子型的。表面活性剂典型地以0.1-60重量%的水平存在。
当被包括在其中时,所述去污剂通常含有大约1%到大约40%的阴离子表面活性剂例如线性苯磺酸烷基酯、α-烯属磺酸酯、硫酸烷基酯(脂肪醇硫酸酯)、脂肪醇乙氧基硫酸盐(ethoxysulfate)、二级链烷磺酸盐(alkanesulfonate)、α-磺基脂肪酸甲酯、烷基或烯基琥珀酸或肥皂。
当被包括在其中时,所述去污剂通常含有约0.2%到约40%的非离子表面活性剂如脂肪醇乙氧基化物、壬基苯酚乙氧基化物、烷基多苷、烷基二甲基胺氧化物、乙氧基化脂肪酸单乙醇胺、脂肪酸单乙醇胺、多羟基烷基脂肪酰胺(polyhydroxy alkyl fatty acid amide)、或葡糖胺(“葡萄糖胺”(“glucamides”))的N-酰基N-烷基衍生物。
所述去污剂可包括0-65%的洗涤增效剂(detergent builder)或络合剂(complexing agent)如沸石、二磷酸盐、三磷酸盐、膦酸盐(phosphonate)、碳酸盐、柠檬酸盐、次氮基三乙酸、乙二胺四乙酸、二亚乙基三胺五乙酸、烷基或烯基琥珀酸、可溶的硅酸盐或分层的(layered)硅酸盐(例如来自Hoechst的SKS-6)
所述去污剂可包含一种或多种聚合物。例如羧甲基纤维素、聚(乙烯吡咯烷酮)、聚(乙二醇)、聚(乙烯醇)、聚(乙烯吡啶-N-氧化物)、聚(乙烯咪唑)、聚羧酸酯如聚丙烯酸酯、马来酸/丙烯酸共聚物和甲基丙烯酸月桂酯/丙烯酸共聚物。
所述去污剂可包含漂白系统,所述系统包括H2O2源例如过硼酸盐或过碳酸盐,其可与产过酸漂白激活剂(peracid-forming bleach activator)如四乙酰基乙二胺或壬酰氧苯磺酸酯(nonanoyloxybenzenesulfonate)组合。或者,漂白系统可包括例如酰胺、二酰亚胺或砜类型的过氧酸。
本发明的去污剂组合物的酶可以用常规的稳定剂来稳定化,例如多元醇如丙二醇或丙三醇、糖或糖醇、乳酸、硼酸或硼酸衍生物,例如,芳香族硼酸酯,或苯硼酸衍生物如4-甲酰苯硼酸,并且该组合物可以如WO 92/19709和WO 92/19708中描述的那样配制。
洗涤剂溶液也可包括其他常规的洗涤剂组分,例如织物调理剂(conditioner)包括粘土,促泡剂,抑泡剂,防蚀剂,污物悬浮剂,防污物再沉淀剂,染料,杀菌剂,荧光增白剂,水溶助长剂,晦暗抑制剂,或香料。
在此考虑,在所述去污剂组合物中,任何酶,特别是本发明的酶,可以以相当于0.01-100mg酶蛋白每升洗涤液,优选0.05-5mg酶蛋白每升洗涤液,最优选0.1-1mg酶蛋白每升洗涤液的量加入。
本发明的酶还可以掺入到WO 97/07202所公开的去污剂组合物中,在此将WO 97/07202并入本文作为参考。
保藏的微生物
根据《国际承认的用于专利程序的微生物保存布达佩斯条约》,下列微生物被保藏在真菌菌种保藏中心(Centraalbureau voor Schimmelcultures),Fungal and Yeast Collection,Uppsala-laan 8,3584 CT Utrecht,P.O.Box 85167,3508 AD Utrecht,荷兰:
名称:Botryosphaeria rhodina
同义名:棉色二孢(Diplodia gossypina)(SBL 274)(Berkeley &M.A.Curtis)von Arx,von 1970,″The genera of fungi sporulating in pure culture″:143
分类:Dothideaceae,Dothideales,Dothidemycetes,子囊菌门(Ascomycota)
保藏号:CBS 274.96
保藏日期:1996年3月12日
实施例
实施例1鉴定Botryosphaeria rhodina CBS 274.96分泌的功能性多肽
培养液的酶指纹分析
通过用多种酶测定方法对培养基肉汤进行测定,获得了酶活性分布图。制备带底物的96孔微量滴定(MT)板并保存在10℃直到使用。制备了两种不同的pH变化形式:pH3和pH7。使用下面的底物:0.05%AZCL(Mazurine染色和交联的底物,Megazyme)-直链淀粉,阿拉伯聚糖,β-葡聚糖(大麦),酪蛋白,胶原,凝胶多糖,葡聚糖,半乳聚糖(马铃薯),半乳甘露聚糖(角豆)(carob),He-纤维素、支链淀粉(pullulan)、木聚糖(燕麦)和木葡聚糖(AZCL-酪蛋白不能用在pH3,因此这些板中不加入AZCL-酪蛋白)。
pH3底物的制备:
将0.1g的每种AZCL底物溶解在100ml的0.2M琥珀酸pH3+10微升Triton X-100(0.01%)中,得到0.1%AZCL的终浓度。
pH7底物的制备:
将0.1g的每种AZCL溶解在50ml的无菌H2O加10微升Triton X-100(0.01%)中。向每个50ml AZCL底物中加入50ml 0.4M MOPS pH7,得到终体积100ml,以及终浓度0.2M缓冲液,0.1%AZCL。
还包括了漆酶和脂肪酶活性的测定,底物如下制备:
漆酶底物的制备:
制备溶于0.2M磷酸盐/硼酸盐缓冲液,pH9的0.08mg/ml Chicago Sky Blue 35ml。
脂肪酶底物的制备:
通过以3∶1混合2%PVA溶液与大豆油制备聚乙烯醇(PVA)/大豆油乳液。使用ULTRA-TURRAX混合器将油乳化,并将12ml的乳液与500ml包含10mM CaCl2,pH5.5的0.2M乙酸钠缓冲液,及5ml 0.2%的结晶紫溶液混合。
使用US Sterilin 96孔MT板和Multidrop S20装板器(stacker),Titertek Instruments,Inc.,Alabama。将200微升的每种AZCL-底物和脂肪酶底物和150微升的漆酶底物分装到MT孔中,并将30-50μl培养基肉汤加入每份底物中,26℃温育过夜。如下对测定结果评分:0:无活性;1:弱活性;2:强活性。
结果表格:棉色二孢培养基肉汤的指纹分析
  底物   酶活性  pH3   pH7
  ACZL-直链淀粉   α-淀粉酶  0a   1
  ACZL-阿拉伯聚糖(去分枝)   内切-1,5-α-L-arabinanase  0   2
  ACZL-β-葡聚糖(大麦)   β-葡聚糖酶、地衣酶和纤维素酶  2   1
  ACZL-酪蛋白   蛋白酶  Ntb   2
  ACZL-胶原   蛋白酶  0   1
  ACZL-凝胶多糖   内切-1,3-β-D-葡聚糖酶  1   0
  ACZL-葡聚糖   内切-1,6-α-D-葡聚糖酶(葡聚糖酶)  0   0
  ACZL-半乳聚糖(马铃薯)   内切-1,4-β-D-半乳聚糖酶  0   2
  ACZL-半乳甘露聚糖(角豆)   内切-1,4-β-D-甘露聚糖酶  2   2
  ACZL-HE-纤维素   内切-纤维素酶  2   2
  ACZL-支链淀粉   极限糊精酶(支链淀粉酶)  0   0
  ACZL-木聚糖(Oat Spelts)   内切-1,4-β-D-木聚糖酶  2   2
  ACZL-木葡聚糖   内切纤维素酶  0   2
  Chicago Sky Blue   漆酶  0   0
  PVA/大豆油   脂肪酶  0   0
a活性测定的结果评分:0=无活性;1=弱反应;2=强反应
bnt=未测试
A.cDNA文库构建
用标准的分子生物学技术(Ausuble等1995″Current protocols in molecular biology″Publ.:John Wiley and sons)制备来自Botryosphaeria rhodina CBS 274.96的cDNA。
cDNA文库生产中使用的生物质的发酵是从在28℃下温育了7天的接种的PDA板开始的。在有Mex1培养基的摇瓶中接种数个菌丝体-PDA琼脂塞(plugs),其中Mex1培养基含有(每升):20g大豆,15g麦麸,10g微结晶纤维素(cellulose Avicel),5g麦芽糖糊精01,3g细菌用蛋白胨(bacto peptone),0.2g聚氧丙烯(pluronic)PE6100,和1g橄榄油。在26℃下150rpm振荡这些摇瓶。7日后通过Miracloth过滤收集菌丝体,并将菌丝体冷冻在液氮中,在-80℃下保存直到使用。
RNA分离:从冰冻、粉状的Botryospaeria rhodina菌丝体制备总RNA,方法是通过硫氰酸胍提取,然后通过5.7M CsCl的下层(cushion)超速离心(Chirgwin,J.M.,Przbyla,A.E.,Macdonlad,RJ.和Ruttwer W.J.,Isolation of biologically active ribonucleic acid from sources enriched in ribonuclease,Biochemistry 18,5294-5299,1979)。用寡聚(dT)-纤维素亲和色谱(Aviv,H.和Leder,P.,Purification of biologically active globin messenger RNA by chromatography on oligothymidylic acid-cellulose,Proc.Natl.Acad.Sci.USA 69(6),1408-1412,1972)分离富含多聚A的RNA。
cDNA文库的构建:根据Gubler U和Hoffman,B.J.,A simple and very efficient method for generating cDNA libraries,Gene 25(2-3),263-269,(1983);Sambrook,J.,Fritsch,E.F.和Maniantis,T.Molecular cloning:A laboratory Manual,第二版,1989,Cold Spring Harbor Laboratory,Cold Spring Harbor,New York和Kofod等(1994)的一般方法使用多聚A-Not1引物(Promega,美国)合成双链cDNA。合成以后,用绿豆核糖核酸酶处理cDNA,用T4 DNA聚合酶平末端化,然后与摩尔数过量50倍的EcoRI接头(Invitrogen,美国)连接。根据制造商的指导,用限制酶NotI(New England Biolabs,美国)切割cDNA,然后用琼脂糖凝胶电泳将cDNA按大小分级。将对应于700bp及更大的cDNA从凝胶上切下并用GFX DNA分离试剂盒(AP Biotech)纯化。然后通过连接反应将制备好的cDNA定向克隆到EcoRI-NotI切割的pMHas5中。通过电穿孔将连接混合物导入DH10B细胞(Invitrogen)后,铺到含50mg/升卡那霉素的LB琼脂上。从原先的cDNA-pMHas5载体连接产物的总共30,000个转化体制备cDNA质粒池(pool)。根据Qiagen的质粒DNA分离操作规程(Qiagen Inc.GMBH),从固体LB卡那霉素选择培养基上回收的菌落的池中直接制备质粒DNA。
用于克隆的载体是pMhas5,其在专利WO 03/044049中有记载,具有下面的特征:
特征    部位        描述
CDS     365-1156    卡那霉素抗性
CDS           2232-2387     β-半乳糖苷酶α肽
-10信号       2189-2192     SD序列
启动子        2101-2189     Lac启动子
多样性特征    626-650       BACE系统的KanP1引物
该质粒值得注意的特征是Lac启动子的SD区域附近的EcoRI-NotI限制位点。它使得带EcoRI-NotI接头的cDNA能够被克隆到载体中,且使所得的构建体在大肠杆菌宿主中能够被活跃地转录和翻译。
B.转座子的构建和制备
如WO 01/77315 A1所述的,转座子协助信号捕捉(Transposon Assisted Signal Trapping,TAST)的基本原理是,将所选的基因组中所有的基因通过转座子标签与编码无信号的β-内酰胺酶的基因相融合。这样,当在含有氨苄青霉素的培养基中培养包含通过转座子标签与编码无信号的β-内酰胺酶的基因融合的基因组的基因的宿主细胞克隆时,只有表达和分泌β-内酰胺酶的那些克隆能够生存。但是,只有在与β-内酰胺酶基因融合的基因具有能够被宿主株系识别的完整启动子和核糖体结合位点(即,在真实的生命过程中被细胞表达产生多肽的基因),而且β-内酰胺酶被这样翻译,使得合成的多肽被转运穿过细胞质膜并正确地折叠的条件下,β-内酰胺酶才会被分泌。因此,当将融合的基因插入到选择的宿主细胞时,那些氨苄青霉素抗性的克隆就含有编码功能性分泌多肽的基因。
通常,使用TAST方法时甚至不需要表达整个基因。当给基因加上转座子标签时,这些基因的N末端部分作为融合蛋白表达,就显示这些基因含有完整的转录、翻译和分泌序列。因此,通常认为这些基因的N末端部分作为融合蛋白的表达足以保证整个基因的表达和分泌。
因此可以下结论:通过TAST方法得到的基因确实编码分泌的功能性多肽。
含β-内酰胺酶报道基因的SigA4转座子的构建:
按照WO 01/77315 A1的指导,使用标准分子生物学技术构建含有无信号β-内酰胺酶基因的转座子。首先,使用具有校正活性的(proofreading)聚合酶(Pfu Turbo,Stratagene,美国)从pUC19载体PCR扩增无信号β-内酰胺酶基因。所得的PCR片段含有NotI和EcoRI限制性位点以便于克隆。含有Entranceposon和抗生素抗性标记CAT(在转座子中编码氯霉素抗性)的质粒pEntranceposon(Camr)是从Finnzymes,OY获得的(Espoo芬兰)。用限制酶NotI和EcoRI消化该质粒,凝胶纯化后与含有无信号的β-内酰胺酶的片段连接。将连接产物转化到电转化感受态(electro-competent)的DH10B细胞中,通过限制性分析鉴定含有带有所述无信号的β-内酰胺酶的质粒的大肠杆菌克隆,并命名为SigA2。
为制备转座子,构建了较小的SigA2衍生物,其缺乏编码β-内酰胺酶的bla基因:使用结合到SigA2的bla基因的起始和终止处,且方向向外的两个寡核苷酸引物SigA2NotU-P 5′-TCG CGA TCC GTT TTC GCA TTT ATC GTG AAA CGC T-3′(SEQ ID NO:43)和SigA2NotD-P 5′-CCG CAA ACG CTG GTG AAA GTA AAA GAT GCT GAA-3′(SEQ ID NO:44)来PCR扩增没有bla基因的SigA2。该PCR反应产生的大约3.6kb的扩增产物经过重新连接(relegate)后转化到合适的大肠杆菌菌株中。从能在LB氯霉素但不能在LB氨苄青霉素上生长的转化体中分离了3.6kb的质粒。该质粒保留了所有两个BglII位点并缺少活性的blg基因,被称为pSig4(图1)。
60微升浓度为0.3μg/μl的pSigA4质粒DNA制备物用BglII消化并在琼脂糖凝胶上分离。将2kb的SigA2转座子DNA条带洗脱下来,并根据供货商的指导,用“GFXTMPCR、DNA和凝胶条带纯化试剂盒”(PCR,DNA and Gel Band Purification Kit)(Amersham Pharmacia Biotech Inc.美国)纯化,用200微升EB缓冲液洗脱。这样制备的SigA2可以用于转座子协助信号捕捉(TAST,见下文)。
C.转座子标签
从pSigA4制备的转座子带有5’截短的bla基因,该基因编码除去了分泌信号的β-内酰胺酶。β-内酰胺酶只有在被分泌到周质时才能赋予大肠杆菌氨苄青霉素抗性,而β-内酰胺酶的细胞质表达不能赋予氨苄青霉素抗性。如果没有信号序列,β-内酰胺酶将不会被转运到周质中,从而克隆也就不会在含有氨苄青霉素的培养基上生长。无信号的β-内酰胺酶基因以这样的方式包含在转座子中,使得转座子的边界和β-内酰胺酶编码区域之间存在连续的开放阅读框。这样,被改变的转座子当转座到编码分泌的蛋白质的基因中时,可以导致与目标基因的共阅读框(in-frame)的融合。这样就导致分泌到大肠杆菌周质并赋予氨苄青霉素抗性的融和基因产物的产生。而如果转座子整合到编码非分泌蛋白的基因中,即使是共阅读框的,相应的宿主也不会成为氨苄青霉素抗性。
D.Botryosphaeria rhodina的转座子协助信号捕捉
关于转座子协助信号捕捉的完整描述可以在WO 01/77315中找到。从最初的cDNA-pMHas5载体连接产物的总共30,000个转化体构建了cDNA质粒池。根据Qiagen的质粒DNA分离操作规程(Qiagen Inc.),从固体LB卡那霉素选择培养基上回收的菌落的池中直接制备质粒DNA。根据转座酶制造商的指导(Finnizyme,Finland),用转座子SigA2和MuA转座酶处理质粒池。
为了给Botryosphaeria rhodina CBS 274.96 cDNA文库加转座子标签,将含有约2.6微克的DNA的SigA2转座子4或8微升,与质粒池DNA的DNA浓度的Botryosphaeria rhodina CBS 274.96 cDNA文库1微升,Finnzymes MuA转座酶2微升(0.22微克/微升),和5x缓冲液(来自Finnzymes OY,Espoo,芬兰)5微升在50微升的总体积中混合,并在30℃温育3.5小时,然后在75℃热失活10min。加入5微升3M乙酸钠pH5和110微升96%乙醇,并在20000rpm离心30min使DNA沉淀。洗涤沉淀并干燥,然后在10微升TE缓冲液中重悬。
在Biorad基因脉冲设备(50μF,20mAmp,1.8kV)中,1.5微升的加有转座子标签的质粒池通过电穿孔导入20微升的DH10B超感受态(ultra-competent)细胞,根据随该细胞提供的标准操作规程(Gibco-BRL)进行。将电穿孔的细胞在振荡下温育在SOC培养基中(28℃,2小时,250rpm),然后铺在选择培养基上。使用了3种琼脂培养基:
LB+50mg/ml卡那霉素,
LB+卡那霉素+15mg/ml氯霉素和/或
LB+卡那霉素+氯霉素+12.5mg/ml氨苄青霉素。
通过将电穿孔产物稀释并铺在LB+卡那霉素+氯霉素培养基上,确定了每份电穿孔物大约存在72,000个含有带SigA2转座子的cDNA文库质粒的菌落,且在三重选择(LB、卡那霉素、氯霉素、氨苄青霉素)下,大约回收了69个菌落。进一步进行电穿孔和铺板实验,直到在三重选择下从实验中总共回收445个菌落。根据Qiagen Qiaturbo96操作规程(Qiagen Inc.美国)对这些菌落进行质粒小量提取(miniprep)。根据国际专利申请WO 01/77315的实施例中公开的方法(第28页),用转座子正向和反向引物(引物A和B)对质粒测序。
引物A:AGCGT TTGCG GCCGC GATCC(SEQ ID NO:45)
引物B:TTATT CGGTC GAAAA GGATC C(SEQ ID NO:46)
E.序列组装和注释
用AB3700毛细管测序仪获得反应物的DNA序列。修整这些序列以去除每个质粒的载体和转座子序列及A和B引物读取结果。由此得到225个组装的序列,使用PhredPhrap程序(Brent Ewing,LaDeana Hillier,Michael C.Wendl和Phil Green;Base-calling of automated sequencer traces using phred I.Accuracy assessment;Genome Research;8:175-185;1998;Brent Ewing和Phil Green;Base-calling of automated se-quencer traces using phred II.Error probabilities;Genome Research 8:186-194;1998)将它们分为148个毗连群(contigs)。然后使用BLASTX程序2.0a19MP-WashU[1998-7-14][构建Linux-x86 18:51:44 30-Jul-1998](Gish,Warren 1994-1997-未公开;Gish,Warren和David J.States;Identification of protein coding regions by database similarity search;Nat.Genet.3:266-72;1993),将所有148个毗连群与可从标准公共DNA和蛋白质序列数据库(TrEMBL,SWALL,PDB,EnsemblPep,GeneSeqP)获得的序列比较。
所得的序列大部分是编码完整的功能性多肽的功能性基因,如上所述其从氨苄青霉素抗性克隆获得,用作人工分析的基础。
为了确认所述菌落的氨苄青霉素抗性是β-内酰胺酶活性增加的结果,在10个cDNA上转座子的到达位点(landing site)不同的信号捕捉克隆中测试了β-内酰胺酶活性。根据Invitrogen Life Technologies的操作规程将质粒DNA重新转化到One Shot Top10化学感受态大肠杆菌中,并将转化混合物涂布在带卡那霉素(50μg/ml)和氯霉素(10μg/ml)的LB琼脂上。28℃下2天后,将菌落影印铺板到LB卡那霉素、氯霉素和15(10μg/ml)氨苄青霉素的LB上。28℃下3天后,将真正生长的菌落(true growers)接种到含卡那霉素(50μg/ml)和氯霉素(10μg/ml)的10ml LB培养基中,37℃,275rpm温育过夜。将过夜培养物按1∶100稀释在新鲜的LB Kan/CAM培养基中并培养到OD600=0.5。离心收集细胞并用0.9%NaCl洗涤一次。将沉淀悬浮在超声处理缓冲液(100mM Tris-HCl,2mM EDTA,pH 8.0)中,调节细胞数到光密度OD600=0.5,用Soniprep 150(MSE)以1.5μm的振幅超声处理。将样品在15,000rpm离心10min,将上清用于β-内酰胺酶测定。在塑料比色皿中,将上清与50μl nitrocefin生色β-内酰胺酶底物(1mg/ml,于50%DMSO;0.05M PO4缓冲液中)和0.1M PO4缓冲液混合到1ml,然后用3300pro分光光度计测量Abs482。结果如下所示:
表IX:具有不同的Shine Dalgarno(SD)序列和ATG翻译起始密码子和之间的距离和转座子到达位点的克隆β-内酰胺酶活性
Figure BSA00000241439500621
上表说明了3个要点:
1)所有10个克隆中都可检测到β-内酰胺酶活性。应当强调的是,相应的含有质粒的大肠杆菌转化体对50mg/升氨苄青霉素选择有抗性。这些事实共同显示,所有10个克隆都产生由融合到β-内酰胺酶基因的带转座子标签的cDNA的一部分组成的杂合蛋白,其中以提供具有β-内酰胺酶活性的肽的方式融合。
2)由于这10个克隆的cDNA被完全测序,SigA2转座子在每个克隆中的到达位置得到了证实。这10个克隆都含有SigA2转座子,其处于正确的方向和阅读框中,以促使天然的被编码蛋白的N末端与转座子所编码的β-内酰胺酶发生杂合融合。
3)在真核cDNA中,非翻译的上游(5’UTR)前导序列的长度可在1bp到数百个碱基对之间变化。为了从大肠杆菌翻译元件例如Shine-Dalgarno区域最优地翻译cDNA,ATG起始密码子之前4到11个碱基对的最优距离是最优的。由上表可见,比最优值长得多的5’UTR还是容许表达一些cDNA杂合体-β内酰胺酶融合蛋白,因为从样品中的转化大肠杆菌中观察到了β-内酰胺酶活性。
所得的本发明的核苷酸序列是功能性基因编码完整的功能性多肽,不但由于上述原因,而且因为它们是从氨苄青霉素抗性克隆获得的。这里获得的克隆是氨苄青霉素抗性的,因为加上转座子标签后,这些基因与无信号的β-内酰胺酶基因融合,无信号的β-内酰胺酶基因只有当与具有在宿主株中可被识别的完整启动子和核糖体结合位点的基因融合时,才能被表达、翻译、转运穿过细胞质膜并正确地折叠。
因此,可以作结论,本发明的基因确实编码活性的分泌的多肽。因为16个基因的序列分析显示得到了与无信号的β-内酰胺酶基因的共阅读框融合。另外,通过测定整个核苷酸序列,确证了这些基因的开放阅读框的完整。
实施例2通过同源性确定酶活性
通过与已知功能的基因或多肽比较,可以预测基因或被编码的多肽的功能。分析了ADNA组和B多肽组序列与来自公共和内部数据库的序列之间的相似性,以确定ADNA组和B多肽组序列的功能性。序列比较是用程序BLASTX 2.0a19MP-WashU[1998-7-14]进行的。通过将ADNA组和B多肽组序列与其最接近的功能已知的序列进行仔细的人工序列比对,为预测这些基因和被编码的多肽的功能提供了可能。即使在全体氨基酸的同一性低于40%,从而可能难以作出可靠的预测的情况下,通过仔细地分析并判读催化位点和/或多肽序列的重要区域中的氨基酸残基,预测ADNA组和B多肽组序列的功能也是可能的。如果已知序列的催化位点的氨基酸也存在于本发明的多肽中,同时具有足够的全体氨基酸的同一性,就可以断定该来自Botryosphaeria rhodina CBS 274.96的多肽与所述已知序列具有同样的功能。
实施例3制备B多肽组多肽
为了从丝状真菌例如Botryosphaeria rhodina CBS 274.96的cDNA制备多肽,在酵母或另外的丝状真菌中表达该cDNA是可行的。作为非穷举性的例子,一种好的选择是在米曲霉中表达。下面给出了怎样在米曲霉中表达编码木聚糖酶的cDNA(SEQ ID No:3)。
使用表达质粒pDaU71。该质粒含有(1)构巢曲霉amdS基因,作为曲霉中的选择标记;(2)酵母URA3基因,其被氨苄青霉素抗性基因隔断,用于在大肠杆菌中选择;(3)带3个额外的amyR-位点的黑曲霉NA2启动子(中性淀粉酶)+构巢曲霉TPI启动子5′非翻译部分的重叠,用于异源表达;和(4)黑曲霉AMG终止子。作为扩增Botryosphaeria rhodina cDNA文库池的相关部分的模板,在PCR反应中使用下面的引物:
引物#166:CGCGGATCCACCATGGTCTCCTTCAAGTCGATTC(SEQ ID NO:47)
引物#167:CCGCTCGAGTTACTGCACGGTAATCGTAGC(SEQ ID NO:47)
使用下面的条件:
按照制造商的指示,使用Extensor Hi Fidelity Reddy Load DNA聚合酶PCR 混合液(ABGene,英国)。
cDNA质粒池(1纳克/微升):   5微升
引物#166                   1微升
引物#167                   1微升
PCR主混合液(master mix)    12.5微升
去离子水                   7.5微升
                                              
总体积                     25微升
将反应物转入预热到94℃的MJ Research DNA扩增仪中,然后进行下面的循环:
94℃                       2分钟
然后25个循环的:
94℃                       30秒
53℃                       30秒
72℃                       1分钟
然后
72℃                   10分钟
用1%琼脂糖凝胶分析5微升的产物以确认正确的大小并确定所得的PCR产物的量。根据制造商的指示(AP Pharma)用GFX纯化所剩的20微升混合物。用40微升纯化产物中的20微升在30微升标准的过夜消化反应体系中进行标准的BamHI-XhoI限制消化。然后再用GFX纯化限制消化的产物,再将其与经过BamHI-XhoI限制消化并纯化的pDau71进行标准的连接反应。将连接产物转化到DH10B大肠杆菌细胞中(大肠杆菌DH10B或TOP10(可从Invitrogen获得)在该表达载体的构建中可用作克隆宿主),并在LB氨苄青霉素培养基上铺板。选择10个转化体进行质粒DNA纯化,并对其测序以确定插入片段的序列完整性。选择一个无PCR错误的克隆pPFJO47用于进一步研究。
如WO 00/39322所述构建米曲霉BECh2株(BECh2得自米曲霉JaL228,该菌株是如WO 98/12300所述以保藏的菌株米曲霉IFP4177为基础构建的)。转化和培养条件根据Christiansen等,1988,Biotechnology 6,1419-1422及如WO 01/12794-A第63页所述进行。进行一轮再分离后,用来自转化体的孢子接种Nunc管中的10ml YP葡萄糖或YP麦芽糖,并将培养物在30℃下培育3天。
将来自上述10ml培养物的10微升上清样品进行SDS凝胶电泳。用SYPRO Orange Protein Gel Stain(Molecular Probes)对凝胶染色。数种曲霉转化体在SDS凝胶上具有显著的条带。通过在pH 6.0下进行AZCL-小麦阿拉伯木聚糖进一步分析这些阳性结果的木聚糖酶活性。在0.2M磷酸钠盐(Na-phosphate)缓冲液,pH 6.0+0.01%Triton-X 100中将底物即来自小麦的AZCL-阿拉伯木聚糖(Megazyme)制备为0.2%w/v的悬液。在Eppendorf热混合仪(thermomixer)中将900微升的底物预热到37℃。向底物中加入100微升来自重组宿主菌株Bech2的粗培养液上清或不同样品并在最大速度下在37℃温育15min。然后将反应混合物在冰上放置2分钟,在用20,000xG离心1min。将2x 200微升的上清转移到微量滴定板并在OD590测量。测定吸光度的增加作为活性。
实施例4测定木聚糖酶活性
活性的测定使用合适的缓冲液中的合成并分泌木聚糖酶的宿主株的培养液或细胞裂解物。将合适体积的这样的样品点到琼脂平板上,琼脂平板上含有不溶性的生色底物AZCL-Birch木聚糖(MegazymeTM)和合适的缓冲液,其pH为例如4.5-7.5。在合适的温度,例如37℃下,将平板温育合适的时间,例如一天。活性可见为点周围的蓝色的晕圈(halo)。
实施例5测定过氧化物酶活性
过氧化物酶可以使用如Ishida等:1987所述的2,4-二氯苯酚方法(Ishida,A.,N.Futamura和T.Matsusaka.1987.Detection of peroxidase acitvity and its localisation in the forespore envelopes of Bacillus cereus.J.Gen.Appl.Microbiol.33:27-32.)用分光光度法来测定。作为指示剂,可以使用100mM磷酸钾缓冲液(pH 7.0)中的1.0mM 2,4-二氯苯酚和82mM的4-氨基安替比林(aminoantipyrine)的混合物,合适的底物是100mM磷酸钾缓冲液(pH 7.0)中的50mM过氧化氢(Sigma)。
将200微升合适地稀释的培养液上清加入1ml塑料比色皿。加入200微升指示剂混合物。加入200微升过氧化氢底物启动反应。用标准的分光光度计在510nm处测量吸光度的变化。
实施例6测量对纤维素降解酶或酶混合物的纤维素降解促进作用
某些分泌的蛋白质在纤维素降解酶或其混合物存在下显示纤维素降解的协同作用(synergistic action)。这些分泌的蛋白质本身可具有或不具有水解酶活性。在专利申请号US11/046,124和相应的2005年7月30日公布的PCT申请PCT/US2005/003525中可以找到这样的分泌蛋白的例子和如何检测它们的纤维素降解促进作用,特别是使用实施例24和25-28的任一项,在此将其引入供参考。
一种测定该促进作用的方法如下:将合成并分泌纤维素酶促进性多肽的宿主株的培养液或细胞裂解物用装有截留为10kDa的PM10膜的Amicon搅拌小室(Millipore,Billerica,MA)浓缩后,用Econo-Pac 10DG柱(BioRad Laboratories,Hercules,CA)脱盐。用BCA(bicinchoninic acid,P.K.Smith等1985,Anal.Biochem.150:76)蛋白质测定试剂盒(Pierce,Rockford,IL)使用BSA作为标准测定蛋白浓度后,将这些多肽储液保存在-20℃。对这些多肽不作进一步纯化,并根据测得的总蛋白将储液添加到反应混合物中。
在美国能源部国立可再生能源实验室(U.S.Department of Energy National Renewable Energy Laboratory(NREL))用稀硫酸预处理玉米秸秆。预处理使用下面的条件:1.4wt%的硫酸,165℃和107psi下8分钟。根据NREL,预处理过的玉米秸秆(PCS)中的水不溶性固体含有56.5%纤维素,4.6%半纤维素和28.4%木质素。纤维素和半纤维素是使用NREL标准分析程序(NREL Standard Analytical Procedure)#002,进行二阶段硫酸水解后,利用高效液相色谱测定进行糖分析而测定的。木质素是使用NREL标准分析程序#003,用硫酸水解纤维素和半纤维素级分后通过测量重量而测定的。在酶促水解前,在玻璃滤器上用大体积的去离子水”ish”所述PCS;得到水“ish”过的PCS的干重。通过在咖啡磨(coffee-grinder)中粉碎,然后在22μm的Millipore滤器(6P Express Membrane,Stericup,Millipore,Bedford,MA)上用去离子水“ish”,从水“ish”过的PCS制备粉碎的PCS。
PCS的水解是用1.1ml Immunoware小管(Pierce,Rockford,IL)进行的,所用的总反应体积为1.0ml。在该操作规程中,PCS(10mg/ml于50mM乙酸钠pH5.0缓冲液中)的水解,是在纤维素蛋白加样量的3%的米曲霉β-葡糖苷酶(根据WO 02/095014在米曲霉中重组表达)的存在下,使用不同的蛋白质加样量(表示为mg的酶每克PCS)的待测的本发明的多肽或Celluclast
Figure BSA00000241439500671
1.5L样品(Novozymes A/S,Bagsvaerd,丹麦)来进行。本发明的多肽的PCS水解能力的筛选在50℃(Isotemp 10S水浴或TS Autoflow CO2夹层培养箱)下进行。通常,反应按一式四份进行并在水解过程中取等份样品。通过混合20μl等份的每份水解物和180μl 0.11M NaOH(终止试剂)来终止PCS水解反应。对每份试样作适当的连续稀释,并利用下述的适用于96孔微量培养板规格的对羟基苯甲酰肼(PHBAH,Sigma,St.Louis,MO)测定法测定还原糖含量。简单地说,将90μl等份的适当稀释的样品置于96孔圆锥底微量培养板中。向各个孔中加入2%NaOH中的1.5%(w/v)PHBAH 60μl。将板在95℃不加盖加热10分钟。让板冷却到室温(RT),然后向各个孔加入50μl蒸馏水。从每个孔转移100μl等份到平底96孔板中,并用SpectraMax Microplate Reader(Molecular Devices,Sunnyvale,CA)测量A410nm的吸光度。用葡萄糖标准品(用0.4%氢氧化钠稀释的,0.1-0.0125mg/ml)制作标准曲线以将所得的A410nm值转换为葡萄糖当量。用所得的当量计算每个反应的PCS纤维素转化百分率。
纤维素转化为还原糖的程度(转化率,%)用下面的等式计算:
转化率(%)=RS(mg/ml)*100*162/(纤维素(mg/ml)*180)=
RS(mg/ml)*100/(纤维素(mg/ml)*1.111)
在该式中,RS是以葡萄糖当量(mg/ml)量度的溶液中的还原糖浓度,因子1.111反映了纤维素转化为葡萄糖的重量增加。
为了筛选能够促进Celluclast1.5L性能的本发明的多肽,进行PCS水解反应(1.0ml的操作规程,10g PCS每升,50℃,加入总加样量的3%的米曲霉β-葡糖苷酶),其中将2.5mg酶加样量的Celluclast
Figure BSA00000241439500682
1.5L与2.5mg多肽加样量的每个样品(每个反应5mg酶加样量的总蛋白)。测量了由10mg酶加样量,5mg酶加样量和2.5mg酶加样量组成的Celluclast
Figure BSA00000241439500683
1.5L对照反应,并记录它们的PCS纤维素转化率用于比较。
实施例7测定脂肪酶活性
活性测量使用合适的缓冲液中的合成并分泌脂肪酶的宿主株的培养液或细胞裂解物。
脂肪酶测定(PNV测定):用移液器将20微升的稀释缓冲液加到96孔微量培养板的各个孔中。向该稀释缓冲液中加入5微升的样品(上清)。测试开始时,向各个孔中加入200微升的底物,并将板装到ELISA读板器(能读取96孔板的可编程的分光光度计)上。每30秒测量一次405nm的吸光度,测量10分钟。用时间对abs405曲线的斜率作为任意活性单位。
稀释缓冲液:25ml 2M Tris/HCl pH 7.5,0.50ml 2M CaCl2,2.5ml 15%Brij 35,用水调节到500ml。
底物储备溶液:将0.1295g(117微升)的戊酸对硝基苯酯(p-Nitrophenyl valerate)SIGMA N 4377(密度1.11g/ml)溶于10ml甲醇中。在冷冻装置中保存。
底物:将100微升底物储备溶液与10ml稀释缓冲液混合。
实施例8测定蛋白酶和肽酶活性
在具有选定的肽酶活性最佳的pH缓冲液中的合成并分泌肽酶和/或蛋白酶的宿主株的培养液或细胞裂解物,其所述活性可以这样测定:将合适的样品体积(例如20微升)点样在琼脂平板上,其中该琼脂平板含有不溶性生色底物AZCL-酪蛋白(MegazymeTM)或AZCL-胶原(MegazymeTM)或Azocoll(Sigma-Aldrich),例如0.1%w/w的水平。在适合于肽酶起作用的温度下,例如37℃下,将平板温育合适的时间,例如1天。活性可见为点周围的蓝色晕圈。可以用非标记的胶原或非标记的酪蛋白来代替AZCL-酪蛋白和AZCL-胶原(MegazymeTM)。在被点样到琼脂平板的非标记的胶原或非标记的酪蛋白上,有肽酶和/或蛋白酶存在时形成清楚的区域。
实施例9测定内切阿拉伯糖酶活性
在具有选定的肽酶活性最佳的pH缓冲液中的合成并分泌阿拉伯糖酶的宿主株的培养液或细胞裂解物,其所述活性可以这样测定:将合适的样品体积(例如20微升)点样在琼脂平板上,其中该琼脂平板含有不溶性生色底物AZCL-阿拉伯聚糖,例如0.1%w/w水平。在适合于阿拉伯糖酶起作用的温度下,例如37℃下,将平板温育合适的时间,例如1天。活性可见为点周围的蓝色晕圈。
该测定可以在不同的pH下进行。在酸性pH下,可以通过将0.1g AZCL-阿拉伯聚糖(Mazurine染色的交联底物,Megazyme,爱尔兰)溶于100ml 0.2M琥珀酸pH3+10微升Triton X-100(0.01%)得到0.1%AZCL-阿拉伯聚糖终浓度,来制备AZCL-阿拉伯聚糖。在中性pH下,可以通过将0.1g AZCL-阿拉伯聚糖(Mazurine染色的交联底物,Megazyme,爱尔兰)溶于50ml无菌水加10微升Triton X-100(0.01%)中来制备AZCL-阿拉伯聚糖。然后在该50ml AZCL底物中加入50ml 0.4M MOPS pH 7得到100ml的终体积,及0.2M缓冲液,0.1%AZCL的终浓度。
实施例10测定β-葡糖苷酶活性
许多β-葡糖苷酶可能对4-硝基苯基-β-D-吡喃葡萄糖苷或纤维二糖至少有一些活性,尽管这些可能不是它们的天然底物。用非常敏感的甲基伞形基(methyl-umbiliferyl)β-D-葡萄糖苷也可以发现活性。一般而言可以使用任何(1,4)-β-及(1,3)-β-寡葡萄糖苷(oligoglucosides)作为底物,通过Trinder测定系统(The Sigma Diagnostic Glucose(Trinder)Assay,Sigma,St.Louis,MO)测量释放的葡萄糖,来评估β-葡糖苷酶活性。
一种测定β-葡糖苷酶活性的方法是制备合成并分泌阿拉伯糖酶的宿主株的培养液或细胞裂解物的制剂,使所述制剂含有大约6.9X 10-6 mg/ml的总蛋白,100mM柠檬酸钠pH 5.0,0.01%Tween-20和4mM的对硝基苯基-β-D-吡喃葡萄糖苷。在50℃温育该制剂,并在0.5、1、2、3、3.75和24小时取等份试样。向各个等份试样中加入1M碳酸钠pH 10.0,然后由405nm的吸光度确定对硝基苯基阴离子的浓度。
另一种β-葡糖苷酶活性的方法是:通过首先脱盐(BioRad Econo-Pac 10DG柱),然后浓缩(Centricon Plus-20,Biomax-5,5kD截留)到0.92mg/ml的浓度(BCA测定系统),来制备合成并分泌阿拉伯糖酶的宿主株的培养液或细胞裂解物的制剂。然后将该制剂以0.037和0.0092μg/ml总蛋白与100mM柠檬酸钠pH 5.0加0.01%Tween-20中的10mM纤维二糖在65℃下温育。在0.5,1,2,3,4,6和19小时取等份试样。将等份试样煮沸6分钟以终止反应,然后使用Trinder测定系统(Sigma Chemical Co.,St.Louis,MO)和葡萄糖外标测定葡萄糖浓度。
实施例11测定酯酶活性
活性测定使用合适的缓冲液中的合成并分泌酯酶的宿主株的培养液或细胞裂解物。当选择用于测定丝氨酸酯酶活性的底物时,应当优先选择在酯酶被底物饱和时的浓度下不形成胶束的底物,以获得底物的最佳转化率。
一种测试酯酶活性的方法是测量标准条件下,例如30℃、pH7.0下,该酶水解三醋精的碱消耗,其中三醋精的浓度低于三醋精的CMC,碱消耗表示为时间的函数。酯酶水解三醋精会释放乙酸,这就需要加入碱来维持pH恒定为7.0(恒定pH法),因此维持pH在7.0所需要的碱(通常以氢氧化钠的形式)的量就是被水解的三醋精酯键的量度。
另一种测试酯酶活性的方式是测量酯酶水解PNP乙酸酯(乙酸对硝基苯酯)释放有色的PNP。用移液器将20微升的稀释缓冲液加到96孔微量滴定板的各个孔中。将5微升样品(培养液上清或过滤的细胞裂解物)加入稀释缓冲液中。在测定开始时向每个孔中加入200微升的底物并将板装到ELISA读板器(能读取96孔板的可编程的分光光度计)上。每30秒测量一次405nm的吸光度,测量10分钟。用时间对abs405曲线的斜率作为任意活性单位。
稀释缓冲液:25ml 2M Tris/HCl pH 7.5,0.50ml 2M CaCl2,2.5ml 15%Brij 35,用水调节到500ml。
底物储备溶液:将合适量的乙酸对硝基苯酯溶于10ml甲醇中。在冷冻装置中保存。
底物:将100微升底物储备溶液与10ml稀释缓冲液混合。
Figure ISA00000241439700021
Figure ISA00000241439700031
Figure ISA00000241439700041
Figure ISA00000241439700051
Figure ISA00000241439700061
Figure ISA00000241439700071
Figure ISA00000241439700081
Figure ISA00000241439700091
Figure ISA00000241439700101
Figure ISA00000241439700111
Figure ISA00000241439700121
Figure ISA00000241439700131
Figure ISA00000241439700141
Figure ISA00000241439700151
Figure ISA00000241439700161
Figure ISA00000241439700181
Figure ISA00000241439700201
Figure ISA00000241439700221
Figure ISA00000241439700231
Figure ISA00000241439700241
Figure ISA00000241439700251
Figure ISA00000241439700261
Figure ISA00000241439700271
Figure ISA00000241439700281
Figure ISA00000241439700291
Figure ISA00000241439700301
Figure ISA00000241439700311
Figure ISA00000241439700331
Figure ISA00000241439700341
Figure ISA00000241439700351
Figure ISA00000241439700361
Figure ISA00000241439700371
Figure ISA00000241439700381
Figure ISA00000241439700391
Figure ISA00000241439700401
Figure ISA00000241439700411
Figure ISA00000241439700421
Figure ISA00000241439700431
Figure ISA00000241439700441
Figure ISA00000241439700451
Figure ISA00000241439700461
Figure ISA00000241439700471
Figure ISA00000241439700481
Figure ISA00000241439700491
Figure ISA00000241439700501
Figure ISA00000241439700511
Figure ISA00000241439700521
Figure ISA00000241439700531
Figure ISA00000241439700541
Figure ISA00000241439700551
Figure ISA00000241439700561
Figure ISA00000241439700571
Figure ISA00000241439700581
Figure ISA00000241439700591
Figure ISA00000241439700611
Figure ISA00000241439700621
Figure ISA00000241439700631

Claims (13)

1.分离的木聚糖酶,其包括氨基酸序列,所述氨基酸序列与SEQ ID NO:4中所包括的成熟多肽序列具有至少90%的同一性。
2.分离的木聚糖酶,其包括氨基酸序列,所述氨基酸序列与以CBS保藏登录号274.96保藏的Botryosphaeria rhodina菌株所分泌的GH11木聚糖酶成熟酶的氨基酸序列具有至少90%的同一性。
3.权利要求1或2的木聚糖酶,其包含氨基酸序列,所述氨基酸序列与SEQ ID NO:4的氨基酸1-202具有至少90%的同一性。
4.权利要求3的木聚糖酶,其具有氨基酸序列,所述氨基酸序列与SEQID NO:4的氨基酸1-202具有至少95%的同一性。
5.权利要求3的木聚糖酶,其由SEQ ID NO:4的氨基酸1-202组成。
6.多核苷酸,其包含编码权利要求3中所定义的木聚糖酶的核苷酸序列。
7.核酸构建体,其包含权利要求6中定义的核苷酸序列,该核苷酸序列与一种或多种指导所述木聚糖酶在宿主细胞中生产的调控序列可操作地连接。
8.重组表达载体,其包含权利要求7的核酸构建体。
9.重组宿主细胞,其包含权利要求7的核酸构建体。
10.生产权利要求3的木聚糖酶的方法,其包含:
a.培养菌株以产生所述木聚糖酶,其中所述菌株的野生型形式能够产生该木聚糖酶;及
b.回收该木聚糖酶。
11.生产权利要求3的木聚糖酶的方法,其包含:
c.在有助于产生所述木聚糖酶的条件下,培养权利要求9中定义的重组宿主细胞;及
d.回收该木聚糖酶。
12.组合物,其包含权利要求3的木聚糖酶和赋形剂。
13.制备权利要求12的组合物的方法,其包含将权利要求1的木聚糖酶与赋形剂混合。
CN2010102613168A 2004-08-06 2005-08-06 Botryosphaeria Rhodina的多肽 Pending CN101942428A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
DKPA200401197 2004-08-06
DKPA200401197 2004-08-06
DKPA200401215 2004-08-11
DKPA200401215 2004-08-11

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CNA2005800341202A Division CN101052721A (zh) 2004-08-06 2005-08-06 Botryosphaeria Rhodina的多肽

Publications (1)

Publication Number Publication Date
CN101942428A true CN101942428A (zh) 2011-01-12

Family

ID=35058584

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2010102613168A Pending CN101942428A (zh) 2004-08-06 2005-08-06 Botryosphaeria Rhodina的多肽

Country Status (7)

Country Link
US (3) US7666649B2 (zh)
EP (1) EP1789556A1 (zh)
JP (1) JP2008508868A (zh)
CN (1) CN101942428A (zh)
AU (1) AU2005269084B2 (zh)
CA (1) CA2576110C (zh)
WO (1) WO2006012904A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113122521A (zh) * 2019-12-31 2021-07-16 丰益国际有限公司 具有脂肪酶活性的多肽及其用途

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU2008259986C1 (en) * 2007-05-31 2012-07-26 Novozymes, Inc. Methods of increasing the cellulolytic enhancing activity of a polypeptide
CN101945889A (zh) * 2007-12-19 2011-01-12 诺维信公司 具有纤维素分解增强活性的多肽和编码该多肽的多核苷酸
EP3141609A1 (en) 2008-12-19 2017-03-15 Novozymes, Inc. Methods for increasing hydrolysis of cellulosic material in the presence of cellobiose dehydrogenase
WO2010129287A2 (en) 2009-04-27 2010-11-11 The Board Of Trustees Of The University Of Illinois Hemicellulose-degrading enzymes
EP2496692B1 (en) 2009-11-06 2016-03-16 Novozymes, Inc. Polypeptides having xylanase activity and polynucleotides encoding same
EP2622068B1 (en) 2010-09-30 2016-07-20 Novozymes, Inc. Variants of polypeptides having cellulolytic enhancing activity and polynucleotides encoding same
WO2012049181A1 (en) * 2010-10-13 2012-04-19 Novozymes A/S Preparation of baked product from dough
CN104870640A (zh) * 2012-08-16 2015-08-26 孟加拉朱特研究所 来自菜豆壳球孢菌的纤维素和/或半纤维素降解酶及其用途
WO2014191322A1 (en) * 2013-05-28 2014-12-04 Novozymes A/S Detergent composition and use of detergent composition
US10385326B2 (en) 2014-05-30 2019-08-20 Novozymes A/S Variants of GH family 11 xylanase and polynucleotides encoding same
CN109722399A (zh) * 2019-03-15 2019-05-07 贵州大学 一种短小芽孢杆菌及其用途

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CH654567A5 (en) 1980-05-21 1986-02-28 Givaudan & Cie Sa Flavourings with a hydroxy-beta-damascone structure
EP1479765B1 (en) * 1993-03-10 2008-10-22 Novozymes A/S Enzymes with xylanase activity from aspergillus aculeatus
ATE282086T1 (de) 1997-02-26 2004-11-15 Novozymes As Mikrobielle xyloglukanendotransglykosilase (xet)
FR2786784B1 (fr) * 1998-12-04 2003-01-24 Lesaffre & Cie FRAGMENT D'ADN CODANT POUR LA XYLANASE THERMOSTABLE XynA DE THERMOASCUS
US6333180B1 (en) 1999-12-21 2001-12-25 International Flavors & Fragrances Inc. Bioprocess for the high-yield production of food flavor-acceptable jasmonic acid and methyl jasmonate
AU1996101A (en) 1999-12-30 2001-07-16 Novozymes A/S Fungal extracellular fam35 beta-galactosidases
CN1288244C (zh) 2000-04-07 2006-12-06 诺沃奇梅兹有限公司 信号序列捕获
BR0110090A (pt) 2000-04-13 2003-02-18 Mark Aaron Emalfarb Proteìna, processos para hidrolisar ligações beta-glucosìdicas e beta-xilosìdicas e para produzir um polipeptìdeo, sequência de ácido nucleico, construção de ácido nucleico, cepa microbiana recombinante, e, sonda de oligonucleotìdeo
AU2002316809A1 (en) * 2001-06-26 2003-01-08 Novozymes A/S Polypeptides having cellobiohydrolase i activity and polynucleotides encoding same

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113122521A (zh) * 2019-12-31 2021-07-16 丰益国际有限公司 具有脂肪酶活性的多肽及其用途
CN113122521B (zh) * 2019-12-31 2024-05-14 丰益国际有限公司 具有脂肪酶活性的多肽及其用途

Also Published As

Publication number Publication date
CA2576110A1 (en) 2006-02-09
US20100087379A1 (en) 2010-04-08
JP2008508868A (ja) 2008-03-27
US8143047B2 (en) 2012-03-27
WO2006012904B1 (en) 2006-04-06
US20080090280A1 (en) 2008-04-17
EP1789556A1 (en) 2007-05-30
CA2576110C (en) 2012-01-10
US20120171189A1 (en) 2012-07-05
AU2005269084A1 (en) 2006-02-09
AU2005269084B2 (en) 2010-05-27
WO2006012904A1 (en) 2006-02-09
US7666649B2 (en) 2010-02-23

Similar Documents

Publication Publication Date Title
CN101942428A (zh) Botryosphaeria Rhodina的多肽
US10006016B2 (en) Polypeptides having xylanase activity and polynucleotides thereof
US6506585B2 (en) Polypeptides having haloperoxidase activity
EP1709165B1 (en) Polypeptides of alicyclobacillus
US20060075519A1 (en) Polypeptides having cellobiase activity and ploynucleotides encoding same
US7910348B2 (en) Polypeptides of Alicyclobacillus sp. having glutamic peptidase activity
US7803590B2 (en) Family GH 61 polypeptides
EP1549745B1 (en) Family gh 61 polypeptides
CN103748219A (zh) 具有纤维素酶活性的多肽以及编码它的多核苷酸
US6509181B1 (en) Polypeptides having haloperoxide activity
CN101052721A (zh) Botryosphaeria Rhodina的多肽
US6511835B1 (en) Nucleic acids encoding polypeptides having haloperoxidase activity
US6410292B1 (en) Nucleic acids encoding polypeptides having haloperoxidase activity
US6410291B1 (en) Polypeptides having haloperoxidase activity

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20110112