CN1232506A - 来自绿色木霉的纤维素酶cbh1基因的调控序列以及利用该序列的蛋白质或多肽的大量生产体系 - Google Patents

来自绿色木霉的纤维素酶cbh1基因的调控序列以及利用该序列的蛋白质或多肽的大量生产体系 Download PDF

Info

Publication number
CN1232506A
CN1232506A CN97198453A CN97198453A CN1232506A CN 1232506 A CN1232506 A CN 1232506A CN 97198453 A CN97198453 A CN 97198453A CN 97198453 A CN97198453 A CN 97198453A CN 1232506 A CN1232506 A CN 1232506A
Authority
CN
China
Prior art keywords
sequence
gly
ser
thr
record
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN97198453A
Other languages
English (en)
Other versions
CN1198939C (zh
Inventor
渡边学
守屋达树
青柳薰
隅田奈绪美
村上健
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Meiji Seika Pharma Co Ltd
Original Assignee
Meiji Seika Kaisha Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Meiji Seika Kaisha Ltd filed Critical Meiji Seika Kaisha Ltd
Publication of CN1232506A publication Critical patent/CN1232506A/zh
Application granted granted Critical
Publication of CN1198939C publication Critical patent/CN1198939C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01091Cellulose 1,4-beta-cellobiosidase (3.2.1.91)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2405Glucanases
    • C12N9/2434Glucanases acting on beta-1,4-glucosidic bonds
    • C12N9/2437Cellulases (3.2.1.4; 3.2.1.74; 3.2.1.91; 3.2.1.150)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/80Vectors or expression systems specially adapted for eukaryotic hosts for fungi
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N9/00Enzymes; Proenzymes; Compositions thereof; Processes for preparing, activating, inhibiting, separating or purifying enzymes
    • C12N9/14Hydrolases (3)
    • C12N9/24Hydrolases (3) acting on glycosyl compounds (3.2)
    • C12N9/2402Hydrolases (3) acting on glycosyl compounds (3.2) hydrolysing O- and S- glycosyl compounds (3.2.1)
    • C12N9/2477Hemicellulases not provided in a preceding group
    • C12N9/248Xylanases
    • C12N9/2482Endo-1,4-beta-xylanase (3.2.1.8)
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01004Cellulase (3.2.1.4), i.e. endo-1,4-beta-glucanase
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12YENZYMES
    • C12Y302/00Hydrolases acting on glycosyl compounds, i.e. glycosylases (3.2)
    • C12Y302/01Glycosidases, i.e. enzymes hydrolysing O- and S-glycosyl compounds (3.2.1)
    • C12Y302/01008Endo-1,4-beta-xylanase (3.2.1.8)

Landscapes

  • Chemical & Material Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Organic Chemistry (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Zoology (AREA)
  • Wood Science & Technology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Microbiology (AREA)
  • Molecular Biology (AREA)
  • Medicinal Chemistry (AREA)
  • Mycology (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Plant Pathology (AREA)
  • Enzymes And Modification Thereof (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)
  • Preparation Of Compounds By Using Micro-Organisms (AREA)

Abstract

本发明确立了蛋白质或肽的大量生产体系、尤其是确立了于Trichoderma viride那样的霉菌中纤维素酶的大量生产体系。来自Trichoderma viride的纤维素酶cbh1基因的调控序列可使目的蛋白质高效表达。因此,利用该调控序列可以使目的蛋白质特别是纤维素酶大量表达。特别是通过该调控序列在使来自Humicola insolens的葡聚糖内切酶生产达到15g/L方面获得了成功。

Description

来自绿色木霉的纤维素酶cbh1基因的调控序列 以及利用该序列的蛋白质或多肽的大量生产体系
本发明涉及蛋白质或多肽的大量生产体系,更详细地说是涉及利用了来自绿色木霉Trichoderma viride的调控序列的生产体系,以及利用了该生产体系的蛋白质或多肽的生产技术。
霉菌能够向菌体外大量分泌蛋白质、特别是分泌酶已为人们所知。例如,Aspergillus属真菌能够分泌淀粉酶、蛋白酶、脂肪酶和纤维素酶,这些酶被用于各个领域。其生产量,就工业上利用黑曲霉Aspergillus niger情况看,每升培养液生产的葡萄糖淀粉酶在20g以上,而利用米曲霉Aspergillus oryzae生产时,通过个体培养每1kg大约生产50kg左右(五味胜也:化学与生物(1994),32,269)。
近年来,关于利用霉菌生产蛋白质的特性生产目的蛋白质的技术也正在积累着很多的知识。例如,可以通过下列各种宿主菌生产来自霉菌的异种蛋白质:以Aspergillus nidulans为宿主菌生产来自Mucor miehei的凝乳酶(G.L.Gray,等:基因(Gene)(1986),48,41)、以Aspergillus niger为宿主菌生产来自Aspergillus ficuum的植酸酶(R.E.M.van gorcom等:欧州专利申请(1991),0420358A1)、以Aspergillus oryzae为宿主菌生产来自Mucor miehei的凝乳酶(T.christensen,等:生物/技术(Bio/Technology(1988),6,1419)和脂肪酶(B.huge-Jensen,等:脂(Lipids)(1989),24,781)、以Trichoderma reesei为宿主菌生产来自Phlebia radiata的漆酶(M.Saloheimo,等:生物/技术(Bio/Technology)(1991),9,987)、以Trichoderma viride为宿主菌生产来自Aspergillus oryzae的α-淀粉酶(C.Cheng,等;农业生物化学(Agric.Biol.Chem),(1991),55,1817)、以Acremonium chrysogenum为宿主菌生产来自Fusarium属的碱性蛋白酶(森田滋等:日本农艺化学会大会讲演要旨集(1993),p.140)。另外,以Aspergillus nidulans、Aspergillus niger、Aspergillus oryzae或Trichoderma reesai为宿主菌生产来自人或马等动物的蛋白质、甚至于生产来自植物的蛋白质也已得到了证实。
如上所述,很清楚霉菌是蛋白质或多肽的优良的生产宿主菌。而且工业上利用这些宿主菌时,目的蛋白质的产率变得重要了。作为所谓左右蛋白质产率的要素有以下几点:①在宿主内表达的调节区域(例如启动子或终止子等)应对有效、且大量转录、翻译目的蛋白质进行调节,②翻译产物应呈现出表现活性的高级结构(活性型),③而且翻译产物应稳定地分泌到细胞外等。对此,已经开发出了Aspergillus属的淀粉酶基因启动子以及Trichoderma属的纤维素酶基因启动子等有效的启动子。如果按照到目前为止的看法,以Aspergillus oryzae为宿主菌,利用α-淀粉酶的启动子,每升培养液可以生产3.3g的Mucor miehei的凝乳酶。
然而,无论利用多么强的启动子,一般来说希望得到的目的蛋白质也不会超过宿主的蛋白质的产量。实际上,就上述Aspergillus oryzae的例子来说,只不过利用了30%的蛋白质生产能力。人们认为这种现象是利用的基因遗留在宿主中,翻译区的密码使用频率因菌种不同而产生的差异,分泌的机制因菌种不同而产生的差异等因素造成的,然而改进这些因素的技术还未见报道。
因此,应当考虑通过使宿主的蛋白质产量本身提高,来使目的蛋白质的收率提高。
到目前为止,已经知道属于Trichoderma属的真菌是优良的纤维素酶生产菌。尤其是Trichoderma reesei有关异种蛋白质的生产也进行了各种研究,利用据说大约占同菌分泌蛋白质70%的纤维二糖水解酶1(cbh1)基因的启动子,进行了很多异种蛋白质表达的研究(Uusitalo JM,等:生物技术杂志(J.Biotechnol.)(1991),17,35;Joutsjoki VV,et.al:现代遗传学(Curr.Genet.)(1993),24,223;Barnett CC,等:生物技术杂志(Biotechnology)(1991),9,562;Berges T,等:现代遗传学(Curr.Genet.)(1993),24,53;Saloheimo M,等:基因(Gene)(1989),85,343.Saarelainen R,等:分子遗传学和基础遗传学Mol.Gen.Genet.(1993),241,497.)。然而,有关以Trichoderma viride为宿主菌的异种蛋白质表达体系只是看到了C.Cheng等人的报告。根据C.Cheng等人的报告,以Trichoderma viride的蛋白酶缺损株为宿主菌,导入利用了cbh1启动子、信号序列的α-淀粉酶基因,每升培养液可以生产出1g的α-淀粉酶。这表明利用Trichodermaviride生产异种蛋白质的可能性,但在实际的生产规模中,生产水平从生产成本看并不令人满意。
现在,本发明人获得了来自Trichoderma viride的纤维素酶基因的调控序列可以使目的蛋白质高效表达的认识,利用该调控序列在使来自Humicola insolens的葡聚糖内切酶的生产达到15g/L中获得了成功。这样的产量在到目前为止在所报道的任何霉菌的并种蛋白质生产体系中都没有看到。本发明就是依据这些认识形成的。
因此,本发明的目的就是提供使目的蛋白质高效表达的调控序列以及利用该调控序列的蛋白质大量生产体系。
另外,提供利用上述生产体系的蛋白质或多肽大量生产方法也是本发明的目的。
而来自本发明的使目的蛋白质高效表达的调控序列是来自Trichoderma viride的纤维素酶cbh1基因的调控序列。
同时,来自本发明的蛋白质的大量生产体系是利用了来自Trichodermaviride的纤维素酶cbh1基因的调控序列的生产体系。附图的简单说明
图1是含有来自Trichoderma viride的纤维素酶cbh1基因以及它的调控序列的质粒pA01、以及使其降解片段克隆的质粒pCB1-H3、pCB1-H4、pCB1-S1、pCB1-S3、pCB1-a1、pCB1-b1、pCB1-c2、pCB1-d1、以及pCB1-e1的限制性内切酶图。
图2是质粒pCB1-MX的限制性内切酶图。
图3是质粒pCB1-M2的限制性内切酶图。
图4是质粒pCB1-M2XR的限制性内切酶图。
图5是质粒pCB1-HEgX的限制性内切酶图。
图6是质粒pCB1-Eg3X的限制性内切酶图。
图7是质粒pCB-XI′的限制性内切酶图。
微生物的保藏
用图2表示的质粒pCB1-MX转化的大肠杆菌JM109菌株保藏在通商产业省工业技术院生命工程工业技术研究所(日本国茨城县筑波市东1-1-3、以下简称为“NIBH”),保藏号为FERM BP-6044,保藏日为1996年9月9日(原保藏日)。
用图4表示的质粒pCB1-M2XR转化的大肠杆菌JM109菌株保藏在NIBH,保藏号为FERM BP-6045,保藏日为1996年9月9日(原保藏日)。
用图5表示的质粒pCB1-HEgX转化的大肠杆菌JM109菌株保藏在NIBH,保藏号为FERM BP-6046,保藏日为1996年9月9日(原保藏日)。
用图6表示的质粒pCB1-Eg3X转化的大肠杆菌菌株保藏在NIBH,保藏号为FERM BP-6043,保藏日为1997年8月11日(原保藏日)。
用图7表示的质粒pCB-XI′转化的大肠杆菌菌株保藏在NIBH,保藏号为FERM BP-6042,保藏日为1997年8月11日(原保藏日)。
根据本发明的cbh1基因以及它的调控序列的Trichoderma virideMC300-1菌株保藏在NIBH,保藏号为FERM BP-6047,保藏日为1996年9月9日(原保藏日)。
本说明书中,只要没有特别标明,蛋白质和多肽使用的含义应当是一样的。另外,本说明书中,所谓的变化序列意思是指在碱基序列或氨基酸序列中,插入、置换或缺失、或是在序列的一端或两端附加几个(例如、1~数个)碱基或氨基酸后而形成的序列。
来自Trichoderma viride的纤维素酶cbh1基因的调控序列
本发明中的调控序列是来自Trichoderma viride的调控序列。在本发明中所谓调控序列意思是指从启动子、信号序列、以及终止子组成的序列中至少选择出的一个序列。
所谓本发明中的调控序列,更具体讲是处于图1记载的质粒pA01中的cbh1基因的调控序列。
作为本发明中优选的启动子序列的例子是存在于从图1表示的质粒pA01中的cbh1基因的氨基末端到上游大约1.5kb区域内的序列,例如从质粒pA01中的cbh1基因的氨基末端到上游的HindⅢ位点的序列。
同时本发明的启动子序列中不仅包括这些区域的整个序列,也包括保持高启动子活性的其变化的序列。本发明中,所谓的高启动子活性指的是在后续的NCE4基因的表达中实现高表达的强的启动子活性,具体讲,是指实现每升培养液7~8g、优选的是15g以上的NCE4表达的启动子活性。很清楚,如果是能够给出后续实施例记载的资料、保藏的菌株以及序列1那样的序列的本领域技术人员可能容易预测那样变化序列的存在,而且可能容易制造。
而本发明中所谓的优选的信号序列的例子是序列1记载的编码-17到-1氨基酸序列的碱基序列。另外本发明中,作为其碱基序列的变化序列也包括编码依然保持信号序列活性的氨基酸序列的碱基序列。很清楚,就这样变化的序列,如果是能够给出后续实施例记载的资料、保藏的菌株、以及序列1那样的序列的本领域技术人员也可能容易预测那样变化序列的存在,而且可能容易制造。
本领域技术人员很清楚,在实际利用这些序列时,即使在上述的信号序列上附加上cbh1蛋白质的N末端一侧的几个氨基酸也是可以的。即,在利用这些信号序列时,得到的目的蛋白质即便是与cbh1蛋白质的N末端一侧的几个氨基酸组成的多肽形成的融合蛋白质,甚至是与cbh1蛋白质形成的融合蛋白质也可以。
作为本发明中优选的终止子序列是存在于从质粒pA01中的cbh1基因的羧基端到下游大约1kb的区域内的序列,例如从质粒pA01中的cbh1基因的羧基端到下游的SaⅡ位点的序列。
另外本发明的终止子序列中不仅包括这些区域的全部序列,也包括保持其终止子活性的变化序列。
这些调控序列,尤其是上述的启动子序列可以以极高的效率使NCE4表达。因此,如果按照本发明的优选实施方案,可以提供在NCE4基因的表达中优选使用的调控序列、尤其是NCE4基因的表达中优选使用的启动子序列。如果按照本发明的优选实施方案,纤维素酶NCE4的产量可达每升7~8g、优选达到大约15g。
表达载体和宿主
按照本发明,使用上述调控序列可以提供为表达目的蛋白质所需的表达载体。
本发明的表达载体,按照其第一实施方案,应当是包含上述调控序列,以及包含根据情况不同所需要的标记基因的载体。而且本发明的表达载体是在第一实施方案的表达载体中含有可操作的连接于其调控序列的编码目的蛋白质的碱基序列的载体。因此,至少含有从上述本发明的启动子、信号序列、以及终止子构成的调控序列中选择出的一种序列的表达载体也包含在本发明的范围内。
如上所述,由于本发明的启动子序列是非常有用的,按照本发明的优选状态,可以提供至少含有本发明的启动子序列的表达载体。在该表达载体中,信号序列、终止子序列即使是本发明的信号序列和终止子序列以外的也可以,但最好是使用上述的本发明的信号序列和终止子序列。作为这些载体的具体例子有从后续实施例中构建的表达载体Pcb1-MX和pCB1-M2XR。
本发明的表达载体是在为构建表达载体表达的宿主细胞中能够复制的载体,例如,以质粒为基础构建的最好。这样构建的载体是在大肠杆菌中能够复制的载体,如pUC Vector、pTV Vector、pBluescript、pBR322等。构建本发明载体所必需的手段可以采用基因重组领域中惯用的方法。
而标记基因可以根据转化体的选择手段适当地选择,例如可以利用编码耐药性的基因、营养需求互补的基因等。本发明使用的耐药性基因只要是宿主细胞表现出敏感性的药物都可以,并没有限定,例如,如果宿主使用的是Trichoderma viride时,优选使用来自Streptomycesrimofaciens的越霉素抗性基因、来自Escherichia coli的潮霉素B抗性基因、Streptococcus hindustanus的博来霉素抗性基因。
按照本发明的优选状态,最好是利用通过众所周知的方法,得到来自Aspergillus nidulans的trp C基因的启动子和终止子(Mullaney,E.J.等.,分子遗传学与基础遗传学(Mol.Gen.Genet.)199:37-45,1985),然后用这些序列将潮霉素B抗性基因作成能够表达的弹夹盒(カヤット)(Cullen,D.等,基因(Gene)(1987),57,21)。
本发明的载体可以用于各种目的蛋白质或肽的表达生产。本发明中所谓的目的蛋白质或肽不仅是指宿主细胞中不存在的所谓的外来蛋白质,也包括宿主细胞中虽然能够表达,但其表达量很微量的蛋白质。作为本发明的表达载体中编码目的蛋白质的基因,例如有编码纤维素酶、淀粉酶、脂肪酶、蛋白酶、植酸酶等产业上有用的蛋白质的基因。这些基因经人工改造后也同样可以作为编码目的蛋白质的基因。
本发明的载体只要是能够表达Trichoderma viride的cbh1基因的宿主细胞,并没有特别的限定,但最好是与作为宿主的属于Trichoderma属的微生物组合后作为表达体系。按照本发明的优选状态,可以利用作为属于Trichoderma属微生物的Trichoderma viride。
按照本发明的优选状态,最好是利用作为最优选的宿主Trichodermaviride高纤维素酶生产菌株Trichoderma viride MC300-1。
按照本发明的优选状态,利用Trichoderma reesei作为宿主细胞也是可以的。
按照本发明的优选状态,本发明的表达体系能很好地用在纤维素酶的表达上。作为纤维素酶的具体例子有来自Humicola insolens的纤维素酶NCE4或其变化的蛋白质、以及WO91/17243号公报(特表平5-509223)记载的43kD的葡聚糖内切酶、来自Trichoderma viride的葡聚糖内切酶SCE3或其变化的蛋白质、或是同样来自Trichoderma viride的木聚糖酶SXY1或其变化的蛋白质。其中所谓来自Humicola insolens的纤维素酶NCE4是指具有序列3记载的从1到284序列的蛋白质。所谓葡聚糖内切酶SEC3是指具有序列5记载的从1到397序列的蛋白质。而所谓来自Trichoderma viride的木聚糖酶SXY1是指具有序列7记载的从1到190序列的蛋白质。
而这里所谓的变化的蛋白质是指在上述蛋白质的氨基酸序列中发生了附加、插入、剔除、缺失或置换氨基酸等变化而形成的蛋白质,但该变化蛋白质依然具有其酶活性,尤其是保持着葡聚糖内切酶活性或保持木聚糖内切酶活性。
按照本发明的优选状态,作为纤维素酶NCE4表达体系的优选的载体的具体例子有后续实施例中构建的表达载体pCB1-HEgX。而作为葡聚糖内切酶SCE3或木聚糖酶SXY1表达体系的优选的载体的具体例子有后续实施例中构建的表达载体pCB1-Eg3X或pCB-XI′等。
                   目的蛋白质的生产
本发明的目的蛋白质的生产是通过将上述本发明表达载体转化的宿主细胞在适当的培养基中培养,从培养物中获得目的蛋白质或肽的过程实施的。
按照本发明的优选状态,可以提供效率极高的目的蛋白质生产体系。例如,宿主细胞为Trichoderma viride时,其每升培养液可以生产7g或8g以上、优选的大约可达15g以上的目的蛋白质。该产量与以前所报道的蛋白质表达体系的产量比较高得多。这表明,本发明的目的蛋白质的表达体系具有极高的可利用性。
例如,目的蛋白质是纤维素酶NCE4时,这些酶本来活性就很高,所以可以更大量地生产。其结果得到的好处是可能高效地生产用于含纤维素纤维细毛的除去、减量加工以及斜纹粗棉布染色中纤维素纤维的脱色加工的纤维素酶制剂。
本发明的目的蛋白质的生产方法中、转化体的培养可以在含有惯用的成分,例如碳源、氮源、无机盐、增殖因子等成分的液体培养基中利用有氧条件下的培养法、振荡培养法、电搅拌培养法或深度培养法进行,培养基的pH值例如可以是4~8左右。宿主细胞是Trichoderma viride时,培养可以在Trichoderma viride的惯用培养条件,例如20℃~37℃,优选的是26℃~28℃,培养时间为48~168小时的条件下进行。
当从培养物回收通过本发明得到的蛋白质或肽时,可以使用利用其性质的常用的分离手段,例如溶剂抽提法,离子交换树脂法、吸附或分配柱层析法、凝胶过滤法、透析法、沉淀法等,这些方法可以单独使用,或适当组合起来使用。
                   纤维素酶cbh1及其基因
成为本发明调控序列来源的纤维素酶cbh1基因是具有序列1记载的序列的一部分或全部序列的基因。而利用基因工程的惯用方法(例如定点突变等)对本基因的各个组成部分(启动子、信号序列、终止子等)和翻译区的各个组成部分(核心部位、连接部位、底物结合部位)进行附加、插入、缺失或置换等变化的序列1记载的来自Trichoderma viride的cbh1片段、就是说它的变化序列也包含在本发明中。
序列1记载的碱基序列表示来自Trichoderma viride的染色体cbh1基因的碱基序列。序列1记载的碱基序列含有开始于序列1438的ATG和终止于序列3109的终止密码子(TAA)的开放读框(可读框)。而序列1489~3108的碱基序列对应于由497残基组成的上述成熟cbh1蛋白质。另外已确认序列1的碱基序列中存在着2个内含子。
没有证据表明本发明的cbh1基因与到目前为止已经克隆、碱基序列已经清楚的任何一个纤维素酶基因是同一基因。就是说,通过与DNA数据库GenBank R96.August,1996登录的纤维素酶基因比较,已经被证实。另外,没有证据表明序列2给出的cbh1蛋白质与到目前为止已经克隆、碱基序列已经清楚的任何一个纤维素酶基因编码的蛋白质是同一个蛋白质。就是说,通过与氨基酸数据库Protein Identification Resource R48March,1996、SWISS-PRPT R33 February,1996登录的纤维素酶蛋白质比较,已经被证实。
如果给出蛋白质的氨基酸序列,很容易确定编码蛋白质的DNA序列,可以选择编码序列1记载的氨基酸序列的全部或部分序列的各种碱基序列。因此,所谓编码本发明序列1记载的氨基酸序列的一部分或全部序列的DNA序列是指加在序列2记载的一部分或全部的碱基序列上的序列,也是指编码同一氨基酸序列的但以存在简并关系的密码为碱基序列的序列。
本发明的DNA既可以是来自天然的DNA,也可以是全合成的。而即使是利用一部分来自天然的序列进行合成的也可以。作为获得DNA的典型方法有从来自Trichoderma viride的染色体文库在基因工程领域中惯用的方法,例如有利用以部分氨基酸序列信息为基础作成适当DNA探针进行筛选的方法等。另外,从上述保藏菌株获得DNA也是可能的。
另外,本发明的cbh1基因的序列明显表现出Trichoderma Viride与Trichoderma reesei菌株的差异。就是说,虽然cbh1翻译区的DNA序列的同源性大约为96%,但非翻译区(内含子)的同源性为66%、而启动子、终止子的DNA序列分别离开翻译区150bp、170bp以上时看不到同源性。这表明cbh1基因的起源即使相同,承继该基因的各个菌株的遗传的多样性相差很远。
到目前为止,霉菌的分类一般都是从形态学的特征进行的。然而近年来,根据常用的DNA分析可以明确菌株间的差异。例如,从Trichodermareesei与Trichoderma longibrachiatum的纤维二糖水解酶(cbh)2基因的Southern解析就可显示出杂化方式的差异(Meyer W,等:现代遗传学(Curr.Genet.)(1992),21,27.Morawez R,等:现代遗传学(Curr.Genet.)(1992),21,27.)。实施例1:cbh1基因的克隆(1a)cbh1蛋白质的纯化
将Trichoderma viride MC300-1菌株于P培养基(1.0%葡萄糖、4.0%乳糖、2.0%大豆糟、1.0%酵母提取液、0.5%磷酸钾、0.2%硫酸铵、0.2%碳酸钙、0.03%硫酸镁)、28℃下培养5天。将培养液离心除去菌体残渣、用Pharmacia Biotech公司制造的FPLC装置(RESOURCE Q50mM Tris-盐酸(pH7.8).0-1M氯化钠梯度)进行分级,收集氯化钠浓度大约280mM洗脱出的峰。该级分进行SDS-PAGE(テフコ公司制造SDS-PAGE mini、8%gel)分析,考马斯亮蓝R250染色,得到了几乎是一条带的分子量大约为67kda的cbh1。(1b)cbh1蛋白质的氨基酸序列解析
氨基末端的氨基酸序列的解析按照Podell,D.N等人的方法(Podell,D.N.等,生化研究通讯Bichem.Res.Commun.(1978)81:176)除去修饰氨基末端残基。即、对上述纯化的cbh1级分进行脱盐浓缩,调整到浓度大约为0.5μg/μl。在5mM二硫苏糖醇、10mM EDTA、5%甘油、0.1M磷酸缓冲液(pH8.0)中用Boehringer Mannheim公司制造的焦谷氨酸氨肽酶(测序级)使浓缩的cbh1于50℃反应6小时,除去修饰的氨基末端。然后进行SDS-PAGE,在PVDF膜(Millipore公司制造Immobilon-PSQ)上显示斑点后,水洗风干。该斑点用Perkin Elmer公司制造的蛋白质序列仪Model 492进行氨基酸序列解析。其结果为如下所示的氨基末端的氨基酸序列(10个残基)。氨基末端的氨基酸序列:Ser-Ala-Xaa-Thr-Leu-Gln-Ala-Glu-Thr-His(序列9)(1c)肽谱
将通过上述(1a)那样纯化的cbh1级分于100mM的碳酸氢铵缓冲液中(pH7.8)用1/50摩尔量的V8蛋白酶(Sigma公司制造)消化,其分解产物用Perkin Elmer公司制造的Model 172μ制备型HPLC系统进行柱层析(柱子:RP-300 Aquapor C8、220×2.1mm,0.1%TFA-0.085%TFA/35%乙腈梯度),分离出两种肽,分别取名为V8-33和V8-34。解析它们的氨基酸序列,如下所示。V8-33:Glu-Phe-Ser-Phe-Asp-Val(序列10)V8-34:Glu-Thr-His-Pro-Pro-Leu-Thr-Trp-Gln-Lys-Xaa-Ser-Ser-Gly-Gly
  -Thr-Xaa-Thr    (序列11)
这些氨基酸序列表现出与从Trichoderma reesei得到的cbh-1蛋白质的氨基酸序列(S.Shoemaker等,生物/技术(Bio/Technology)(1983),1691))的同源性。另外,因为表现出与从Trichoderma viride菌株得到的外纤维二糖水解酶(Cheng Cheng等,核酸研究(Nucleic Acids Res.)(1990)18,5559)的同一的氨基酸序列,所以编码同一蛋白质的基因的克隆使用PCR对来自Trichoderma viride菌株的外纤维二糖水解酶基因的翻译区进行扩增、扩增产物可用作探针。(1d)cbh1翻译区域的扩增
以来自Trichoderma viride MC300-1菌株的基因组DNA为模板通过PCR进行cbh1翻译区域的扩增。
基因组DNA的分离按照Horiuchi等人的方法(Hiroyuki Horiuchi等.,细菌学杂志(J.Bacteriol)(1988)170,272-278)进行。首先,将Trichodermaviride MC300-1菌株于S培养基(3.0%葡萄糖、0.1%蛋白胨、1.0%酵母提取液、0.14%硫酸铵、0.2%磷酸钾、0.03%硫酸镁pH6.8)、培养24小时,通过离心分离回收菌体。将得到的菌体冷冻干燥、悬浮于TE(10mMTris-盐酸、1mM EDTA)缓冲液、于3%SDS溶液中、60℃下进行30分钟处理后,通过TE饱和酚萃取、除去菌体残渣。萃取液经乙醇沉淀后,经核糖核酸酶A(Sigma公司制造)以及蛋白酶K(和光纯药公司制造)处理,再使用日立工机公司制造的65P-7超离心机通过氯化铯密度梯度沉降平衡法得到DNA。
PCR使用的是宝酒造公司制造的Takara Taq。作为引物使用的是如下所示的cbh1-N和cbh1-C进行94℃1分钟,50℃2分钟,72℃3分钟的40次循环反应。其结果扩增得到大约1.7kbp的DNA。以下给出的是cbh1-N和cbh1-C的序列。cbh1-N:5′-ATG TAT CAA AAG TTG GCC-3′(序列12)cbh1-C:5′-TTA CAA GCA CTG AGA GTA G-3′(序列13)
该PCR扩增片段在琼脂糖电泳后,按照Pharmacia公司制造的Bandprep试剂盒从琼脂糖回收,回收的片段用作筛选用的探针。实施例2:Trichoderma viride基因组DNA文库的制备
用Sau3AI对Trichoderma viride MC300-1菌株基因组DNA进行部分消化。使用T4连接酶(宝酒造公司制造,Lycation Kit Ver.2)将该DNA片段连接在噬菌体载体、λEMBL3克隆试剂盒(Stratagene公司制造)中的BamHⅠarm上。用乙醇沉淀后,溶解于TE缓冲液中。按照Stratagene公司制造的GigapackⅡ包装试剂盒,使上述连接后的混合物都形成噬菌体粒子。然后用得到的噬菌体感染大肠杆菌LE392菌株。使用通过这种方法得到的1.1×104个噬菌体文库进行目的基因的克隆。实施例3:cbh1基因的亚克隆(3a)利用噬斑原位杂交进行筛选
首先利用Amersham公司制造ECL Direct系统对来自外纤维二糖水解酶基因的翻译区大约1.7kb的DNA片段预先进行标记。将在实施例2中制作的噬菌体噬斑转移到杂交N+尼龙转移膜(Amersham公司制造)上,碱变性后,用5倍浓度的SSC(15mM柠檬酸三钠盐,150mM氯化钠)洗净,干燥,使DNA固定。按照试剂盒的方法,进行1小时的预杂交(42℃)后,加入先前标记的探针,进行4小时(42℃)的杂交。按照上述试剂盒的方法洗净标记物。
洗净探针的尼龙膜浸入到附带的检测液中1分钟,然后使同一公司制造的Hyperfilm-ECL感光,得到4个阳性克隆。(3b)噬菌体DNA的制备
从阳性克隆制备DNA按照Maniatis等人方法(J.Sambrook,E.F.Fritsch和T.Maniatis,《分子克隆》(Molecular Cloning),冷泉港实验室出版社1989)进行。
宿主大肠杆菌使用LE392。首先将LE392于LB-MM培养基(1%蛋白胨、0.5%酵母提取液、0.5%氯化钠、10mM硫酸镁、0.2%麦芽糖)培养过夜,感染来自单个噬斑的噬菌体溶液,于LB-MM培养基中培养过夜。然后,加入氯化钠和三氯甲烷使它们的浓度分别达到1M和0.8%,促进大肠杆菌的溶菌。通过离心分离除去菌体残渣,再经聚乙二醇(10%PEG6000)沉淀回收噬菌体粒子。噬菌体粒子在SDS存在下用蛋白酶K消化,然后经苯酚处理、乙醇沉淀后、回收噬菌体DNA。
以上回收的DNA按照Amersham公司制造ECL Direct系统进行Southern Block解析。将实施例1的PCR扩增片段与探针杂交,结果表明7kb的PstⅠ的消化片段能进行同样的杂交(图1)。
将这一共同杂交的PstⅠ片段于pUC118(宝酒造公司制造)进行亚克隆,得到质粒pA01。实施例4:cbh1基因碱基序列的确定(4a)基因组DNA碱基序列解析
碱基序列的确定按以下方式实施。碱基序列解析设备使用的是Pharmacia Biotech公制造的A.L.F.DNA序列仪Ⅱ。作为测序胶使用的是FMC公司制造的以Hyclrolink Long Ringer销售的丙烯酰胺载体。作胶用的各种试剂(N,N,N’,N’-四甲基乙二胺、尿素、过硫铵)使用的是Pharmacia Biotech公司制造A.L.F级试剂。
解读碱基序列反应使用的是Pharmacia Biotech公司制造的AutoreadSequencing Kit。凝胶制作条件、反应条件和电泳条件等参照各说明书设定。
而碱基序列解读用模板质粒(以后记作模板)制备以下那样的单链DNA和分段克隆,作为模板。
首先将pA01用HindⅢ消化、3.1kb片段克隆于pUC119的产物(pCB1-H3或pCB1-H4),或是用SaⅡ消化pA01,将2.8kb片段克隆于pUC119的(pCB1-S1或pCB1-S3)产物作为M13单链DNA制备。然后,3.1Kb片段克隆于pUC18(pCB1-2、pCB1-7)、pCB1-7用EcoRⅠ消化、4kb消化片段自身环化的产物(pCB1-b1),1.3kb消化片段克隆于pUC118(pCB1-a1)的产物,pCB1-7用SaⅡ消化、5.4kb的片段进行自身环化的产物(pCB1-c2),pCB1-2用HindⅢ和EcoRV消化、将2.2kb和0.9kb片段分别连接于pUC18的HindⅢ-HincⅡ位点并克隆的产物(pCB1-e1、pCB1-d1),共制备出9种质粒(图1)。(4b)单链DNA的制备
使pCB1-H3、pCB1-H4、pCBl-S1、pCB1-S3各个质粒转化大肠杆菌JM109,转化的菌落于含有150μg/ml的氨苄青霉素的LB培养基上预培养过夜。对该培养液用109PFU/ml的辅助噬菌体M13K07悬浊液进行等量感染。将感染后的培养液于100倍量的含有150μg/ml的氨苄青霉素和70μg/ml的卡那霉素的LB培养基中正式培养一夜。
对30ml的该培养液进行离心分离(8000rpm、10分钟)除去菌体、向离心的上清加入6ml的PEG-NaCl(20%PEG6000、2.5M氯化钠),使M13粒子沉淀。将M13的PEG沉淀悬浮于3ml的100mM Tris-盐酸(pH7.5)、10mM氯化镁溶液中,用100μg/ml的DnaseI(BoehringerMannheim公司制造)、10μg/ml的核糖核酸酶A处理、分解夹杂的大肠杆菌的核酸。然后再用PEG沉淀、悬浮于TE缓冲液后,进行TE饱和的苯酚萃取、苯酚-三氯甲烷萃取后、通过乙醇使单链DNA沉淀。(4c)测序反应和解析
首先用2M氢氧化钠将双链质粒进行碱变性后,通过使pCB1-2与试剂盒附带的Universal以及Reverse;pCB1-7与Universal以及Reverse;pCB1-a1与Universal以及Reverse;,pCB1-b1与Reverse;pCB1-c2与Reverse;pCB1-d1与Reverse;pCB1-e1与Reverse的引物分别组合使其退火,按照试剂盒进行延长反应。然后通过pCB1-2与WVCI-01、WVCI-02、WVCI-03、WVCI-04以及WVCI-06的组合进行测序反应,确定cbh1翻译区域的碱基序列。
以下,通过pCB1-H3与Universal、WVCI-07、WVCI-08、WVCI-09以及WVCB-11;pCB1-H4与WVCI-05、WVCI-15、WVCI-16以及WVCI-17;pCB1-S1与Universal、WCI-13、WVCI-14、以及WVCB-12;pCB1-S3与WVCI-06、WVCI-10、WVCI-11、以及WVCI-12的组合进行测序反应确定了象序列表中1所示的那样的cbh1的HindⅢ-SaⅡ片段的全长4176bp序列。
cbh1特异的测序引物的序列如下所示。WVCI-01:5′-TCA CTT TCC AGC AGC CCA ACG CC-3′    (序列14)WVCI-02:5′-CAA CTC TCC CAA CGC CAA GGT CG-3′    (序列15)WVCI-03:5′-CGT CGG GTA GGT AGA GTC CAG CC-3′    (序列16)WVCI-04:5′-TCT CGA ACT GAG TGA CGA CGG TC-3′    (序列17)WVCI-05:5′-CTG CCA TGT CAG AGG CGG GTG AG-3′    (序列18)WVCI-06:5′-ACT CCA ACA TCA AGT TCG GCC CC-3′    (序列19)WVCI-07:5′-AAC TCC GAG TGA GCC TTT ACG TC-3′    (序列20)WVCI-08:5′-CAA TTA AGT GGC TAA ACG TAC CG-3′    (序列21)WVCI-09:5′-GCA AAA ATA TAG TCG AAT CTG CC-3′    (序列22)WVCI-10:5′-GCT GGA ATG CTC GCT AGC TTG GC-3      (序列23)WVCI-11:5′-ACT GTT GGA GAC CAG CTT GTC CG-3′    (序列24)WVCI-12:5′-CGC AGT AGG AGA ATA GAA ACC CC-3′    (序列25)WVCI-13:5′-CTG CTG TCA ATC CCC GCT ACT GG-3′    (序列26)WVCI-14:5′-CCT TCG AGA AAA GGA GAT TCG CG-3′    (序列27)WVCI-15:5′-CAG CTC CTT GGC AAA AGC AGT GG-3′    (序列28)WVCI-16:5′-AGA TCA TCA GTT GAG GTT AGA CC-3′    (序列29)WVCI-¨:5′-TGT ATA AAA TTA GGT TCG GGT CC-3′    (序列30)WVCB-11:5′-CTA CTC ATC AAC TCA GAT CCT CC-3′    (序列31)WVCB-12:5′-GGA AGC CTC AGA AGT AGA TAC AGC-3′   (序列32)(4d)非翻译区(以下记作“内含子”)的确定
为了确定内含子、由Trichoderma viride MC300-1菌株制备mRNA、利用逆转录酶合成cDNA、将该cDNA与基因组的碱基序列比较、判断出它们的相同序列。(4d-1)总RNA的制备
将Trichoderma viride MC300-1菌株于P培养基培养2天,通过离心分离(3500rpm、10分钟),收集菌体。将该菌体用灭菌水洗净,于液氮冷冻状态下用搅拌机粉碎。然后悬浮于含有4M硫氰酸胍盐的变性溶液中(4M硫氰酸胍盐、25mM柠檬酸三钠盐、0.5%N-十二烷基肌氨酸钠、0.1M巯基乙醇)。于室温搅拌数分钟后,用2M醋酸钠(pH4.5)中和,加入TE饱和的苯酚,继续搅拌。然后加入氯仿-异戊醇(24∶1),搅拌后,通过离心分离(3500rpm、10分钟),除去苯酚变性了的菌体成分。回收上层液(水相),用异丙醇将核酸沉淀。通过离心分离(3500rpm、10分钟)从该沉淀中回收核酸,用70%乙醇通过再离心分离洗沉淀。
将该沉淀溶解于TE缓冲液中,使核酸浓度变为1mg/ml,然后用2.5M氯化锂沉淀(5℃2小时)后,经离心分离(12000rpm、10分钟),回收沉淀。用70%乙醇洗该沉淀,得到沉淀即为总RNA级分。(4d-2)PolyA尾巴+RNA(=mRNA)的制备
mRNA的制备是利用Pharmacia Biotech公司制造mRNA纯化试剂盒进行的。
首先,从上述(4d-1)中制备的总RNA中取出1mg溶解于1ml的洗脱缓冲液中,于65℃进行10分钟的热变性处理。然后于冰中骤冷后,加入0.2ml的样品缓冲液。将该总RNA溶液加到寡聚物(dT)纤维素柱上,用高盐溶液洗3次,再用低盐溶液洗3次,然后用于65℃加温的洗脱缓冲液洗脱。上述对柱子的操作反复进行2次,作为mRNA级分。(4d-3)cDNA的合成
使用Pharmacia Biotech公司制造Timesaver cDNA合成试剂盒进行cDNA合成。
首先将5μg的mRNA溶解于20μl的样品缓冲液。于65℃进行10分钟的热处理后,与二硫苏糖醇溶液以及寡聚物(dT)引物一起加到第一条链合成混合物中,于37℃反应1小时。然后再都加到第二条链合成混合物中,于12℃反应30分钟,再于22℃反应1小时,得到cDNA。(4d-4)cbh1 cDNA的扩增
cbh1 cDNA是以总cDNA为模板通过PCR扩增的。
PCR反应用的是宝酒造公司制造LA PCR试剂盒。引物用的是Mcbh1-N和Mcbh1-C,通过25次循环反应进行扩增,每一循环的反应条件都是94℃1分钟,55℃2分钟,72℃2分钟。结果大约1.6kb的DNA被扩增了。Mcbh1-N和Mcbh1-C的序列如下所示。Mcbh1-N:5′-TCG ACT ACG GAC TGC GCA TC-3'(序列33)Mcbh1-C:5′-CAA GCT TTT GCC ACA GTA CC-3′(序列34)
该PCR扩增的片段经琼脂糖电泳后,按照Pharmacia公司制造的BandPrep试剂盒从琼脂糖回收,再克隆于Novagen公司制造的pT7-blue(pCbhU),作为确定内含子的模板。(4d-5)cDNA碱基序列的解析
使用与上述一样的自动解读测序试剂盒进行测序反应。首先,质粒pCbhU用2M的氢氧化钠进行碱变性后,变性后的质粒作为模板,用T7聚合酶进行聚合反应。引物用的是试剂盒附带的Universal和Reverse,还有上述的WVCI-03和WVCI-04。
结果发现存在着1899~1965bp(IntroneⅠ)、2663~2724bp(IntroneⅡ)两个内含子。在序列表1中,非翻译开始序列以及其终止序列、内含子内部的调整序列如下所示。IntroneⅠ:1899~1904、1963~1465、1946~1952IntroneⅡ:2663~2668、2722~2724、2705~2711实施例5:Trichoderma viride用的异种蛋白质表达分泌载体的构建
为了使cbh1启动子、终止子、分泌信号肽作成可用于目的蛋白质表达分泌的形式,进行了指定部位的变异处理。(5a)表达载体pCB1-MX的构建
指定部位的变异处理使用的是Amersham公司制造的雕纹体外诱变系统(Sculpter In Vitro Mutagenesis System)。变异点是在起始密码的上游和终止密码的下游导入的。
首先,变异导入用的寡核苷酸CBn-Stu、CBc-Xho调整到浓度为0.9OD260/ml,然后使用100mM Tis-盐酸(pH8.0)、10mM氯化镁、7mM的二硫苏糖醇、1mM ATP溶液中的PNK于37℃反应15分钟,使末端磷酸化。然后再于70℃进行10分钟的热处理,使酶失活。
对于上述的pCB1-H4、pCB1-S1的单链DNA2μg分别加入CBn-Stu、CBc-Xho,并于70℃放置3分钟、然后于55℃大约500ml的热水中放置直至达到室温为止(大约2小时),使寡核苷酸退火。
使klenow片段、T4连接酶与该退火混合物反应,使异双链合成。该异双链用T5核酸外切酶将未反应的一条链分解。然后用限制酶NciⅠ导入切口,用核酸外切酶Ⅲ分解模板链。再用DNA聚合酶Ⅰ、T4连接酶将变异的链作成双链,然后用该双链转化大肠杆菌TG1。
变异DNA的检测选择出来自pCB1-H4的变异被StuⅠ切的产物(pCB1H4-19)、来自pCB1-S1的变异被XhoⅠ切的产物(pCB1S1-17)。然后用XbaⅠ和XhoⅠ消化pCB1H4-19、回收大约6kb的片段、将该片段与pCB1S1-17用XbaⅠ消化后、XhoⅠ部分切断的大约1.2kb的片段连接、连接后的质粒定为pCB1-M。pCB1-M用XbaⅠ消化、插入来自PDH25(Cullen,D.,Leong,S.A.,Wilson,L.J.和Henneer,D.J.,基因(Gene)57,21-26,1987)抗潮霉素B试剂盒,构建成pCB1-MX(图2)。CBn-Stu、CBc-Xho的序列如下所示。CBn-Stu:5′-GAT ACA TGA TGC GCA GGC CTT AGT CGA CTA GAA TGC-3′(序列35)CBc-Xho:5′-GAT CCT CAA GCT TTT GCT CGA GTA CCT TAC AAG CAC-3′(序列36)(5b)分泌载体pCB1-M2XR的构建
上述pCB1-M用SalⅠ消化、将大约2.7Kb片段克隆于pUC119(pCB1-SalM),再使其变成单链、使用雕纹体外诱变系统进行与上述(5a)同样的变异处理。在Process残基的上游和下游(CB1-SmSph)、cbh1蛋白质的连接结构中(CB1-Bam)、以及终止密码的上游部位(CB1-Pst)导入变异部位。
另外,变异基因的构建是用XbaⅠ和RcoRⅠ切pUC118、使用宝酒造公司制造的DNA Branching kit使上述DNA的末端补平。再使其自身环化(pUC118-SBN)、用SalⅠ和HindⅢ消化后、连接cbh1启动子HindⅢ~SalⅠ片段。将导入变异的cbh1翻译区域~终止子按照正向连接于上述SalⅠ部位、构建成pCB1-M2(图3)。pCB1-M2XR是pCB1-M2的XbaⅠ部位连接了上述潮霉素B抗性基因弹夹的产物(图4)。
CB1-SmSph、CB1-Bam、CB1-Pst的序列如下所示。CB1-SmSph:5′-GGA GGG TGC ATG CCG ACT GAG CCC GGG CAG TAG CC-3′(序列37)CB1-Bam:5′-GCC GGG AGA GGA TCC AGT GGA GG-3′(序列38)CB1-Pst:5′-GCT CGA GTA CCT TAC TGC AGG CAC TGA GAG-3′(序列39)实施例6:Trichoderma viride用NCE4分泌载体的构建
为了使Trichoderma viride NCE4强制分泌,通过PCR扩增来自Humicola insolens NCE4翻译区域。
首先按照Horiuchi等人的方法(Horiuchi Horiuchi等.,微生物学杂志(J.Bacteriol.),170:272-278,1988)、回收Humicola insolens的总DNA。具体来说,将Humicola insolens MN 200-1于37℃下,在(N)培养基(5.0%Avicel、2.0%酵母提取液、0.1%蛋白胨、0.03%氯化钙、0.03%硫酸镁、pH6.8)中培养。培养2天后,通过离心分离(3500rpm、10分钟)收集菌体。将得到的菌体进行苯酚处理、蛋白激酶K和核糖核酸酶A处理、再通过聚乙二醇(PEG)沉淀,得到基因组DNA。
以得到的总DNA为模板、在有HEg-mn(Sph)和HEg-c(Sal)的各个引物1μM、dNTPs200μM存在下使用Pfu聚合酶(Stratagene公司制造)进行PCR反应。PCR反应共进行25个循环,每个循环的反应条件都是94℃下热变性1分钟,55℃下退火2分钟,75℃延伸反应5分钟,使目的DNA片段扩增。
PCR扩增的片段经Pharmacia Biotech公司制造Microspine S-400HR柱层析、除去残存的引物。再经SphⅠ和SalⅠ消化、通过琼脂糖凝胶电泳、回收大约0.9kb的片段。
另外,用SphⅠ和XhoⅠ消化pCB1-M2、回收7.3kb片段。将该片段与0.9kb的消化PCR片段连接、再于XbaⅠ部位插入上述潮霉素抗性基因弹夹、构建成的质粒作为pCB1-HEgX(图5)。
而通过上述操作得到的NCE4的翻译区域的碱基序列如序列4所记载的那样。
HEg-mn(Sph)和HEg-c(Sal)的序列如下所示。Heg-mn(Sph):5′-GGG GCA TGC GCT GAT GGC AAG TCC ACC CG-3′(序列40)Heg-c(SaⅠ):5′-GGG GTC GAC TAC CTT ACA GGC ACT GAT GGT ACC-3′(序列41)实施例7:Trichoderma viride的转化
将Trichoderma viride MC300-1在(S)培养基中于28℃培养24小时后,通过3000rpm、离心分离10分钟。得到的菌体用0.5M蔗糖洗净,悬浮于经0.45μm过滤的10ml的原生质体化酶液中(5mg/ml Novozyme234、5mg/ml纤维素酶オノズカR-10、0.5M蔗糖)。于30℃振荡60~90分钟,使菌原生质体化。将该悬浊液过滤后,经2500rpm、10分钟离心分离,回收原生质体,用SUTC缓冲液(0.5M蔗糖、10mM氯化钙、10mM Tris盐酸(pH7.5))洗净。
将以上制备的原生质体悬浮于1ml的SUTC缓冲液中,向100μl该悬浮液中加入10μg的DNA(TE)溶液(10μl),静置于冰中5分钟。然后加入400μl的PEP溶液(60%PEP4000、10mM氯化钙、10mM Tris-盐酸(pH7.5)),静置于冰中20分钟后,加入10ml的SUTC缓冲液,经2500rpm、10分钟离心分离,收集原生质体。将该原生质体悬浮于1ml的SUTC缓冲液后,经4000rpm、5分钟离心分离,将原生质体最终悬浮于100μl的SUTC缓冲液中。
将经以上处理的原生质体与PD软琼脂(1.3%马铃薯葡萄糖(PD)琼脂、17.1%蔗糖)一起铺在含有潮霉素B(20μg/ml)的马铃著葡萄糖琼脂培养基(3.9%马铃薯葡萄糖琼脂、17.1%蔗糖)上,于28℃培养5天后,将形成的菌落作为转化体。实施例8:pCB1-HEgX转化体的NCE4产率的评价
象实施例7那样将质粒pCB1-HEgX导入Trichoderma viride MC300-1菌株,每1μg的DNA大约出现25株表现出潮霉素B抗性的菌株。
将这25个菌株于S培养基进行预培养,然后在P培养基上进行正式培养。该培养上清经SDS-PAGE解析,出现了新观测到预料为NCE4蛋白质的分子量大约为43kD带的菌株。
其中,预测NCE4产率更高的菌株的培养上清通过FPLC(PharmaciaBiotech公司制造)分级、测定NCE4的产量。柱子用的是RESOURCERPC 3ml、用含有0.1%三氟乙酸的5-60%乙腈的浓度梯度洗脱、收集大约在47%乙腈浓度洗脱的峰、然后脱盐、冷冻干燥后测定其收率、确认每1升培养液含有15g NCE4。实施例9:SCE3的分离纯化
将Trichoderma viride MC300-1用P培养基培养、其培养上清进行疏水层析(Phenyl-Sepharose HP16/100、Pharmacia Biotech公司制造)、用50mM醋酸缓冲液(pH5.5)中加有1-0M浓度梯度的硫酸铵溶液洗脱、分级。由于其中0.1-0M浓度梯度洗脱得到的级分能明显看到具有牛仔裤脱色活性、所以将该级分进行疏水层析(RESOURCE PHE 30mmI.D.×150mm、Pharmacia Biotech公司制造)、用50mM醋酸缓冲液(pH5.5)中加有1-0M浓度梯度的硫酸铵溶液洗脱、收集活性组份。
其中0.1-0M浓度梯度洗脱得到的级分能明显看到具有牛仔裤脱色活性。该级分进行疏水层析(Butyl-Toyopearl 6500S 22mm I.D.×200mm、东曹公司制造)、用50mM醋酸缓冲液(pH5.0)洗脱、分离到表现出明显牛仔裤脱色活性级分的纯化酶SCE3。该SCE3在SDS-PAGE中显示出大约50kD的单一一条带。实施例10:SCE3基因的克隆(10a)SCE3蛋白质氨基末端一侧氨基酸序列解析
与实施例9一样将得到的纯化的SCE3进行SDS-PAGE,然后转移到Millipore公司制造的PVDF膜(Immobilon-PSQ)上。用考马斯亮蓝染色后,将转移的目的蛋白质部分从膜中剪下。用0.5%聚乙烯吡咯烷酮、100mM醋酸溶液于37℃下处理30分钟后,洗净、然后利用宝酒造社制造的Pfu焦谷氨酸氨肽酶除去修饰的氨基末端残基。利用氨基酸测序仪Model492,确定氨基末端一侧的10个氨基酸残基序列。其序列如下所示。SCE3-N:Gln-Asp-Val-Trp-Gly-Gln-Cys-Gly-Gly-Ile(序列42)(10b)肽谱
与实施例9一样将得到的纯化的SCE3级分于50mM的碳酸氢铵缓冲液(pH7.8)中用1/50摩尔量的V8蛋白酶(Sigma公司制造)消化,使用与实施例1c一样的手法收集V8-18.5、V8-26、以及V8-42三种肽。并进行氨基酸序列解析,结果如下。V8-18.5:Thr-Pro-Thr-Gly-Ser-Gly-Asn-Ser-Trp-Thr-Asp(序列43)V8-26:Ser-Thr-Tyr-Ile-Leu-Thr-Glu(序列44)V8-42:Phe-Ala-Gly-Val-Asn-Ile-Ala-Gly-Phe-Asp-Phe-Gly-Xaa-Thr-Thr(序列45)
由于这些氨基酸序列表现出与从Trichoderma reesei得到的葡聚糖内切酶(EGⅢ)蛋白质的氨基酸序列(M.Saloheimo等,基因(Gene)(1988),63,11)的同源性,所以编码同一蛋白质的基因的克隆可以使用PCR对来自Trichoderma reesei菌株的EGⅢ基因的翻译区进行扩增、扩增产物用作探针。(10c)SCE3翻译区域的扩增
以来自Trichoderma viride MC300-1菌株的基因组DNA为模板利用PCR进行SCE3翻译区域的扩增。
扩增是用来自实施例1d的Trichoderma viride MC300-1菌株的染色体DNA为模板使用Takara Taq进行的。作为引物使用的是SCE3-N和SCE3-C、共进行20次循环反应、每个循环反应都是94℃1分钟,50℃2分钟,72℃3分钟。其结果扩增得到大约1.5kbp的DNA。
SCE3-N和SCE3-C的序列如下所示。SCE3-N:5′-ATG AAC AAG TCC GTG CCT C-3′(序列46)SCE3-C:5′-TTA CTT TCT TGC GAG ACA CGA GC-3′(序列47)
该PCR扩增片段在琼脂糖电泳后,从凝胶回收,回收的片段用作SCE3克隆用的探针。(10d)来自Trichoderma viride菌株的SCE3基因的克隆
使用通过与实施例2同样的手法制备的1.0×104个噬菌体文库进行SCE3基因的克隆。噬斑杂交的结果得到一种阳性克隆。该克隆经Southern解析,其结果显示出大约4kb的BamHⅠ片段、大约4kb的EcoRⅠ片段、以及大约3.7kb的XbaⅠ片段与染色体DNA有共同的杂交带。该XbaⅠ片段克隆于pUC118(pUC-Eg3X)。实施例11:SCE3表达载体pUC-Eg3X的构建
为了使SCE3在cbh1启动子的调控下大量表达、将SCE3的翻译区域连接在cbh1启动子的下游。
首先、以pUC-Eg3X为模板用SCE3-Stu和SCE3-Xho得到引物进行PCR反应、回收大约1.5kb的扩增片段、通过pT7-blue进行亚克隆。该质粒用StuⅠ和XhoⅠ切、将大约8.5kb的片段与大约1.5kb的StuⅠ~XhoⅠ片段连接、该质粒就作为pCB1-Eg3X(图6)。
通过上述操作得到的SCE3的翻译区域的碱基序列如序列6所示。
而SCE3-Stu和SCE3-Xho的序列如下所示。SCE3-Stu:5′-GGG AGG CCT GCG CAT CAT GGC TCC ATT GCT GCT TGC-3′(序列48)SCE3-Xho:5′-GGG CTC GAG TAC CTT ACT TCC TGG CGA GAC ACG AGC-3′(序列49)实施例12:pCB1-Eg3X转化体的SCE3产率的评价
象实施例7那样将质粒pCB1-Eg3X导入Trichoderma viride MC300-1菌株。其结果每1mg的DNA大约出现20株表现出潮霉素B抗性的菌株。将这25个菌株于S培养基进行予培养后,然后在P培养基上进行正式培养。该培养上清经SDS-PAGE解析,出现了新观测到预料为SCE3蛋白质的分子量大约为43kD带的菌株。
其中,以粗斜棉布染色含纤维素纤维的脱色活性为指标算出明显看到的50kD带的菌株(EG3D2菌株)SCE3产量。实验是在以下给出的详细的条件下进行的。
对已下水脱浆的12Ounce的蓝色牛仔裤(棉织品)按照下面的条件进行脱色处理。
试验机械:20kg洗衣机(SANYO公司制造全自动洗衣机SCW5101)
浴比:1∶40
加热:60℃
时间:30分钟
pH:4(20mM醋酸缓冲液)
脱色度用色差计COLOR ANSLYZER TOPSCAN MODELTC-1800MK2(东京电色株式会社制造)测定Lab表示计的L值(白度)。通过相对于对照的L值增加值(白度的增加)=ΔL来评价脱色,就评价脱色的各个试验区测定了5个点的ΔL值(n=5),去掉最大值和最小值,采用剩下的3点的平均值。可以算出为了使脱色达到ΔL值=4所需要的蛋白质浓度。
蛋白质浓度按照Bio-Rad公司制造的蛋白质分析试剂盒以γ球蛋白为标准进行定量。
作为亲本菌株的Trichoderma viride MC300-1菌株培养上清、牛仔裤脱色所必需的蛋白质浓度是160mg/L、实施例9中分离纯化的SCE3是32mg/L。 EG3D2菌株培养上清的牛仔裤脱色必需的蛋白质浓度与加入了占总蛋白质质量30%的纯化SCE3的Trichoderma viride MC300-1菌株培养上清的脱色所必需的蛋白质浓度一致、其浓度是80mg/L。由此可以认为1L EG3D2菌株培养上清中所含的27g总蛋白质中的30%(9g)含有(重组)SCE3。实施例13:SXY1的分离纯化
将Trichoderma viride MC300-1用P培养基培养、以木聚糖分解活性为指标纯化其培养上清。首先进行Resource Q 6ml(Pharmacia Biotech公司制造)层析、用50mM Tris-盐酸缓冲液(pH7.5)中加有0-1M浓度梯度的氯化钠溶液洗脱、回收盐浓度0M洗脱的级分。该级分再经Pharmacia Biotech公司制造的Resource HIC PHE 1ml层析、用50mMTris-盐酸缓冲液(pH7.0)中加有1.5-0M浓度梯度的硫酸铵溶液洗脱、将硫酸铵浓度大约为0.3M洗脱出的级分作为SXY1级分回收。该级分再经Pharmacia Biotech公司制造的Superdex 75(10/30)凝胶过滤层析、用含有0.1M氯化钠的0.05M磷酸缓冲液洗脱、回收SXY1级分。该SXY1在SDS-PAGE中显示出大约20kD的单一一条带。实施例14:SXY1基因的克隆(14a)SXY1蛋白质的氨基末端一侧的氨基酸序列解析
与实施例13一样将得到的纯化SCE3进行SDS-PAGE,利用与实施例10一样的方法除去氨基末端修饰残基。然后利用氨基酸测序仪Model492,确定氨基末端一侧的13个氨基酸残基序列。其序列如下所示。SXY1-N:Gln-Thr-Ile-Gly-Pro-Gly-Thr-Gly-Phe-Asn-Asn-Gly-Tyr-Phe(序列50)
由于这些氨基酸序列表现出与从Trichoderma reesei得到的木聚糖酶Ⅰ(XYLI)蛋白质的氨基酸序列(Anneli Torronen等,生物/技术(Bio/Technology)(1992),10,1461)的同源性,所以编码同一蛋白质的基因的克隆可以利用PCR对来自Trichoderma reesei菌株的XYLI基因的翻译区进行扩增、备用。(14b)SXYI翻译区域的扩增
以来自Trichoderma viride MC300-1菌株的基因组DNA为模板通过PCR进行SXYI翻译区域的扩增。
扩增是用来自实施例1d的Trichoderma viride MC300-1菌株的染色体DNA为模板使用Takara Taq进行的。作为引物使用的是SXYI-N和SXYI-C、共进行20次循环反应、每个循环反应都是94℃1分钟,50℃2分钟,72℃3分钟。其结果扩增得到大约0.7kbp的DNA。
SXYI-N和SXYI-C的序列如下所示。SXYI-N:5′-GGG AGG CCT GCG CAT CAT GGT CTC CTT CAC CTC CC-3′(序列51)SXYI-C:5′-GGG CTC GAG TAC CTT AGC TGA CGG TGA TGG AAG C-3′(序列52)
该PCR扩增片段在琼脂糖电泳后,从凝胶回收,以备以下实验用。实施例15:SXYI表达载体pCB-XI′的构建
为了使SXYI在cbh1启动子的调控下大量表达、将SXYI3的翻译区域连接在cbh1启动子的下游。
首先、与实施例14b一样进行PCR反应、回收大约0.7kb的扩增片段、亚克隆于pT7-blue。该质粒用StuⅠ和XhoⅠ切、回收大约0.Tkb的片段。另外用StuⅠ和XhoⅠ切如实施例5a那样构建的pCB1-MX、将大约8.5kb的片段与大约0.7kb的StuⅠ~XhoⅠ片段连接、该质粒就作为pCB-XI′(图7)。实施例16:pCB-XI′转化体的SXYI产率的评价
象实施例7那样将质粒pCB-XI′导入Trichoderma viride MC300-1菌株。其结果每1mg的DNA大约出现10株表现出潮霉素B抗性的菌株。将其中的46个菌株于S培养基进行予培养后,然后在P培养基上进行正式培养。该培养上清经SDS-PAGE解析,出现了新观测到预料为SXYI蛋白质的分子量大约为20kD带的菌株。
使用FPLC系统对其中明显观察到20kD的菌株(S22菌株)的SXY1产量解析定量。柱子用的是上述Resource HIC PHE 1ml、用50mM Tris-盐酸缓冲液(pH7.5)中加有1-0M浓度梯度的硫酸铵溶液洗脱。作为对照使用实施例13中得到的纯化的SXY1、SXY1产量通过硫酸铵浓度大约为0.3M洗脱出的峰面积计算出。其结果、S22菌株的SXY1产率是8.1g/L、产率是亲本菌株的13倍。
                            序列表序列号:1序列的长度:4176序列类型:核酸链数:二条链拓扑型:直链形序列种类:基因组DNA起源
生物名:Trichoderma viride MC300-1序列特征
表示特征的记号:sig peptide
存在位置:1438..1488
决定特征的方法:E
表示特征的记号:mat peptide
存在位置:1489..3108
决定特征的方法:E
表示特征的记号:内含子
存在位置:1899..1965
决定特征的方法:E
表示特征的记号:内含子
存在位置:2663..2724
决定特征的方法:E序列AAGCTTCCAT TTGGCGGCTG AATACCCTGA GAATGAAAAC ACATCAGGCT GGGTGATATC  60CATGAAGACA GGTGGTGAAT ATGTAATCAC GTCCGTTCTC CTGAAGGGAA ACCCCTTGTC 120GTGGTCACAT GCGGCTCTTT CCATGTAAGT CGGATATTCC TAAGTAGCGA TGGAGCGGCA  180GAATCAAATA GGCAATACAG CGAGTGGCTC GAACTTTTTA AATGTCGGGC GGGTTGCTGC  240GCTTCGGCAC TAGTAGACAT TGTATTCCAT ACCCCGCCCC TGTTTCCGCG ACCTCTGGGA  300TTCCCTTGAA TGATCAAATT CTCGCCTCTA CTACCTAACT CCCACTGAGC CTTTACGTCT  360TTTGCCATTC ATCCTGGTGG AAGTTATCGC GGTGTGTAGG GCTACATGCT AGGTCAACTG  420GACGTGTTGG GGCCCGGACC CGAACCTAAT TTTATACAAC GACTTTGATT CAGTCTACAG  480TAATGGGACG TCCCCATATA CAGTTGCACG TAGGGCACAA CGGTAGAGTA CGTTGGGTGA  540ATTCGATATG ATACGAGGAT AACCCCCTGA ATGTAGAGTC TCACGGCAAA CTCTGACCGC  600GCGGTGCGAC CTCACAAAAC AATACAAACG GATGGCTAAA AGTACATGAG TTAATGCCTA  660AAGATGTCAT ATACCAGCGG CTAATAATTG TACAATTAAG TGGCTAAACG TACCGTAATT  720TGCCAATGAC TTGTAGGGTT GCAGAAGCAA CAGTACAGCC CCACTTCCCC ACGTTTGCCC  780TCTTACACGC AGGTCTAACC TCAACTGATG ATCTCCCATC TAAGTTCTCT TGTTGTTGTT  840TAGTCTAAGA GGCAAGTGTT TACTTCAGGA TTTTGTAAGG CGTAGCATGT AAGAAATAAA  900CAGAAAGCAG ACGCCAAGAA GCGAGTTTCT GGATGAAGGC GTTTGAGAGA ACCTTGCAGG  960GAGTTGTCTG ACAATAGAAA AACAATGGAT TGTCGCTTCT ACTCAGGTGT CTGTAATTAA 1020ATGTTACTCC GTCCTGTACA GGCAAAAAAT ATAGTCGAAT CTGCCTAAGA TCTCGGGCCT 1080TCGGGCCTTT AAGTCTACAG GTCAGTTTGG TTATATCGGC ATTTTTGGGT GTGGTAGCAT 1140TGAGGGAACC ACTGCTTTTG CCAAGGAGCT GAACGTATGC TGTAGGCAAA GCTCTAGGTG 1200CCACTGCATT TGTGTCGAAC ATAATGTGAT GCTTGGGCAG GCATAATAGC CGCCAAAGAT 1260AGCCTCATTG AGCGGAAGTC GGCGAACAGG TGAAGAGCAG AATATCACAT ATATATATGG 1320CCCAAACGCC GTGTCCCCTT CTCCCTTTCC CCATCTACTC ATCAACTCAG ATCCTCCAGA 1380AGACTTGTAC ATCATCTTTT GGGGCATAGC ATTCTAGTCG ACTACGGACT GCGCATC    1437ATG TAT CAA AAG TTG GCC CTC ATC TCG GCC TTC TTG GCT ACT GCT CGT   1485Met Tyr Gln Lys Leu Ala Leu Ile Ser Ala Phe Leu Ala Thr Ala Arg-17     -15                 -10                  -5GCT CAG TCG GCC TGC ACC CTC CAG GCG GAA ACT CAC CCG CCT CTG ACA  1522Ala Gln Ser Ala Cys Thr Leu Gln Ala Glu Thr His Pro Pro Leu Thr
 +1               5                  10                  15TGG CAG AAA TGC TCA TCT GGT GGC ACT TGC ACC CAA CAG ACA GGC TCC  1581Trp Gln Lys Cys Ser Ser Gly Gly Thr Cys Thr Gln Gln Thr Gly Ser
             20                  25                  30GTG GTC ATC GAC GCG AAC TGG CGC TGG ACT CAC GCC ACC AAC AGC AGC  1629Val Val Ile Asp Ala Asn Trp Arg Trp Thr His Ala Thr Asn Ser Ser
         35                  40                  45ACG AAC TGC TAC GAC GGC AAT ACT TGG AGC TCA ACC CTG TGC CCT GAC  1677Thr Asn Cys Tyr Asp Gly Asn Thr Trp Ser Ser Thr Leu Cys Pro Asp
     50                  55                  60AAT GAG ACT TGC GCG AAG AAC TGC TGC TTG GAC GGT GCT GCC TAC GCG  1725Asn Glu Thr Cys Ala Lys Asn Cys Cys Leu Asp Gly Ala Ala Tyr Ala
 65                  70                  75TCC ACG TAC GGA GTC ACC ACG AGC GCT GAC AGC CTC TCC ATT GGC TTC  1773Ser Thr Tyr Gly Val Thr Thr Ser Ala Asp Ser Leu Ser Ile Gly Phe80                  85                  90                  95GTC ACT CAG TCT GCG CAA AAG AAC GTC GGC GCT CGT CTC TAC TTG ATG  1821Val Thr Gln Ser Ala Gln Lys Asn Val Gly Ala Arg Leu Tyr Leu Met
            100                 105                 110GCG AGT GAC ACG ACC TAT CAA GAA TTC ACC CTG CTT GGC AAC GAG TTC  1869Ala Ser Asp Thr Thr Tyr Gln Glu Phe Thr Leu Leu Gly Asn Glu Phe
        115                 120                 125TCT TTC GAT GTT GAT GTT TCG CAG CTG CC GTAAGTGACC AACTACACCT      1918Ser Phe Asp Val Asp Val Ser Gln Leu Pr
    130                 135CTTGATGCCA TTCTCGTATT AGTTCTCAGC TGACTAGCTT ATTTAAG A TGT GGC TTG 1975
                                                o Cys Gly Leu
                                                          140AAC GGA GCT CTT TAC TTC GTG TCC ATG GAC GCG GAT GGT GGC GTG AGC   2023Asn Gly Ala Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Val Ser
            145                 150                 155AAG TAT CCC ACC AAC ACT GCC GGT GCC AAG TAC GGC ACG GGC TAC TGT   2071Lys Tyr Pro Thr Asn Thr Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys
        160                 165                 170GAC AGC CAG TGC CCT CGT GAT CTC AAG TTC ATC AAC GGC CAG GCC AAT   2119Asp Ser Gln Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn
    175                 180                 185GTT GAG GGC TGG GAG CCG TCC TCT AAC AAT GCC AAC ACG GGC ATT GGC   2167Val Glu Gly Trp Glu Pro Ser Ser Asn Asn Ala Asn Thr Gly Ile Gly
190                 195                 200GGA CAT GGA AGC TGC TGC TCT GAG ATG GAT ATC TGG GAG GCC AAT TCC   2215Gly His Gly Ser Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Ser205                 210                 215                 220ATC TCT GAG GCT CTT ACT CCT CAT CCT TGC ACG ACC GTC GGG CAG GAA   2263Ile Ser Glu Ala Leu Thr Pro His Pro Cys Thr Thr Val Gly Gln Glu
            220                 230                 235ATT TGC GAC GGT GAC TCC TGC GGT GGA ACC TAC TCG GGT GAC CGA TAT  2311Ile Cys Asp Gly Asp Ser Cys Gly Gly Thr Tyr Ser Gly Asp Arg Tyr
        240                 245                 250GGC GGT ACT TGC GAC CCT GAT GGC TGC GAT TGG AAC CCA TAT CGC TTG  2359Gly Gly Thr Cys Asp Pro Asp Gly Cys Asp Trp Asn Pro Tyr Arg Leu
    255                 260                 265GGC AAC ACC AGC TTC TAT GGC CCC GGC TCC AGC TTC ACG CTT GAC ACC  2407Gly Asn Thr Ser Phe Tyr Gly Pro Gly Ser Ser Phe Thr Leu Asp Thr
270                 275                 280ACC AAG AAG TTG ACC GTC GTC ACT CAG TTC GAG ACT TCG GGT GCC ATC  2455Thr Lys Lys Leu Thr Val Val Thr Gln Phe Glu Thr Ser Gly Ala Ile285                 290                 295                 300AAC CGA TAC TAT GTC CAG AAT GGC GTC ACT TTC CAG CAG CCC AAC GCC  2503Asn Arg Tyr Tyr Val Gln Asn Gly Val Thr Phe Gln Gln Pro Asn Ala
            305                 310                 315GAG CTC GGT GAT TAC TCT GGC AAC TCG CTC GAC GAT GAC TAC TGC GCG  2551Glu Leu Gly Asp Tyr Ser Gly Asn Ser Leu Asp Asp Asp Tyr Cys Ala
        320                 325                 330GCT GAA GAG GCG GAG TTT GGC GGC TCC TCT TTC TCG GAC AAG GGC GGC  2599Ala Glu Glu Ala Glu Phe Gly Gly Ser Ser Phe Ser Asp Lys Gly Gly
    335                 340                 345CTT ACT CAA TTC AAG AAG GCT ACT TCC GGT GGC ATG GTC CTG GTC ATG  2647Leu Thr Gln Phe Lys Lys Ala Thr Ser Gly Gly Met Val Leu Val Met
350                 355                 360AGC CTG TGG GAT GAC GTGAGTTCAA GAATAACATT CACATTGTCA ACAGAATGAC  2702Ser Leu Trp Asp Asp365AGAACTGAC TGAGAGACGA TAG TAC TAC GCC AAC ATG CTG TGG CTG GAC TCT 2754
                     Tyr Tyr Ala Asn Met Leu Trp Leu Asp Ser
                     370                 375ACC TAC CCG ACG AAC GAG ACC TCC TCC ACC CCC GGT GCC GTG CGT GGA  2802Thr Tyr Pro Thr Asn Glu Thr Ser Ser Thr Pro Gly Ala Val Arg Gly380                 385                 390                 395AGC TGC TCC ACC AGC TCC GGT GTT CCT GCT CAG CTC GAG TCC AAC TCT  2850Ser Cys Ser Thr Ser Ser Gly Val Pro Ala Gln Leu Glu Ser Asn Ser
            400                 405                 410CCC AAC GCC AAG GTC GTA TAC TCC AAC ATC AAG TTC GGC CCC ATC GGC  2898Pro Asn Ala Lys Val Val Tyr Ser Asn Ile Lys Phe Gly Pro Ile Gly
        415                 420                 425AGC ACC GGC AAC TCT AGC GGC GGA AAC CCT CCT GGC GGA AAC CCT CCC  2946Ser Thr Gly Asn Ser Ser Gly Gly Asn Pro Pro Gly Gly Asn Pro Pro
    430                 435                 440GGC ACC ACA ACC ACC CGC CGC CCG GCT ACC TCC ACT GGA AGC TCT CCC  2994Gly Thr Thr Thr Thr Arg Arg Pro Ala Thr Ser Thr Gly Ser Ser Pro
445                 450                 455GGC CCT ACT CAG ACG CAC TAT GGC CAG TGC GGT GGA ATT GGA TAC TCG  3042Gly Pro Thr Gln Thr His Tyr Gly Gln Cys Gly Gly Ile Gly Tyr Ser460                 465                 470                 475GGC CCC ACC GTC TGC GCG AGT GGC AGC ACT TGC CAG GTC CTG AAC CCC   3090Gly Pro Thr Val Cys Ala Ser Gly Ser Thr Cys Gln Val Leu Asn Pro
            480                 485                 490TAC TAC TCT CAG TGC TTG TAA GGTACTGTG GCAAAAGCTT GAGGTACTGC       3140Tyr Tyr Ser Gln Cys Leu ***
        495TGGCTTATGG ATGAGTTCAT CTCATTATGG ACTAGATGGA GGATTTACTT TGCTGTATCT 3200ACTTCTGAGG CTTCCAATAT ATACGGTTAT TTCACCTTTG CTGGAATGCT CGCTAGCTTG 3260GCAAGCACGG CTTTCGAGAG ACGGACTGAT TCTCTGCTAA CTATGCATTA TATAAGACTG 3320AAATAGACAA AAAAGGAAAA AAGTTGCCAC TCGAATTATC TTGACGGTGT TGATTATATG 3380TATGGCATTG TAAGGGTTTT TCATTGATAT TTCTCCCGCC AATATGGTTC TACTCCCATC 3440TCCGCGAATC TCCTTTTCTC GAAGGCCGTA GTGGCACGCC AATTGGCAAC AACCCACAGG 3500GAGACGAAAA ACATGATGGC GGCAGCCGAA ATCAGTGGCG CAATGATTGA AAACACGGTG 3560AGACCGTAGC TTGCAGCCTG GAAAGCACTG TTGGAGACCA GCTTGTCCGT TGCGAGGCCG 3620ACTTGCATTG CTGTCAAGAC GATGGCAATG TAGCCGAGCA CTGTCACCAG GGACGCAAAG 3680TTGTCGCGGA TAAGGTCTCC GTAGATGGCG TAGCCAGAGA TTCGAGAATA GCCTCTCAAA 3740AGGTGGCCCT TTCGAAACCG GTAAATCTTG TTCAAGCGTC CTAGGCGCAG CTCGCCGTAC 3800CAGTAGCGGG GATTGACAGC AGAATAGCAG TGATTCTCCA GGACTTGACT GGACAATATC 3860TTCCAGTACT CCCAAGATAC AATATCCGGC AAGAGTCCCT TCTCACGTGC GAGGCGAAAG 3920TCGCTGTAGT GCGCAATGAG AGCGCAGTAG GAGAATAGAA ACCCCCTGGC ACATTGTTCT 3980ACCTCGGCGT GTAGTGGATG ACTGTCGGGC AGAATGTGCT GTCTCCAGAA TCCGATGTCT 4040AGTAGATACT CTGGCAGAGG CTTCAGGTGA ATGCCCTTGG GACCCCAGAT GAGATGCAGC 4100TCCGGATTCT CAGTAACGAC GATCTCGCGG GAGAGCACGA GTTGGTGATG AAGAGGGCGA 4160GGAGGCATGG GTCGAC                                                 4176序列号:2序列的长度:514序列类型:氨基酸拓扑型:直链形序列种类:蛋白质序列Met Tyr Gln Lys Leu Ala Leu Ile Ser Ala Phe Leu Ala Thr Ala Arg-17     -15                 -10                  -5Ala Gln Ser Ala Cys Thr Leu Gln Ala Glu Thr His Pro Pro Leu Thr
 +1              5                   10                  15Trp Gln Lys Cys Ser Ser Gly Gly Thr Cys Thr Gln Gln Thr Gly Ser
             20                  25                  30Val Val Ile Asp Ala Asn Trp Arg Trp Thr His Ala Thr Asn Ser Ser
         35                  40                  45Thr Asn Cys Tyr Asp Gly Asn Thr Trp Ser Ser Thr Leu Cys Pro Asp
     50                  55                  60Asn Glu Thr Cys Ala Lys Asn Cys Cys Leu Asp Gly Ala Ala Tyr Ala
 65                  70                  75Ser Thr Tyr Gly Val Thr Thr Ser Ala Asp Ser Leu Ser Ile Gly Phe80                  85                  90                  95Val Thr Gln Ser Ala Gln Lys Asn Val Gly Ala Arg Leu Tyr Leu Met
            100                 105                 110Ala Ser Asp Thr Thr Tyr Gln Glu Phe Thr Leu Leu Gly Asn Glu Phe
        115                 120                 125Ser Phe Asp Val Asp Val Ser Gln Leu Pro Cys Gly Leu Asn Gly Ala
    130                 135                 140Leu Tyr Phe Val Ser Met Asp Ala Asp Gly Gly Val Ser Lys Tyr Pro
145                 150                 155Thr Asn Thr Ala Gly Ala Lys Tyr Gly Thr Gly Tyr Cys Asp Ser Gln160                 165                 170                 175Cys Pro Arg Asp Leu Lys Phe Ile Asn Gly Gln Ala Asn Val Glu Gly
            180                 185              190Trp Glu Pro Ser Ser Asn Asn Ala Asn Thr Gly Ile Gly Gly His Gly
          195              200                  205Ser Cys Cys Ser Glu Met Asp Ile Trp Glu Ala Asn Ser Ile Ser Glu
    210                 215                 220Ala Leu Thr Pro His Pro Cys Thr Thr Val Gly Gln Glu Ile Cys Asp
225                 230                 235Gly Asp Ser Cys Gly Gly Thr Tyr Ser Gly Asp Arg Tyr Gly Gly Thr240                 245                 250                 255Cys Asp Pro Asp Gly Cys Asp Trp Asn Pro Tyr Arg Leu Gly Asn Thr
            260                 265                 270Ser Phe Tyr Gly Pro Gly Ser Ser Phe Thr Leu Asp Thr Thr Lys Lys
        275                 280                 285Leu Thr Val Val Thr Gln Phe Glu Thr Ser Gly Ala Ile Asn Arg Tyr
    290                 295                 300Tyr Val Gln Asn Gly Val Thr Phe Gln Gln Pro Asn Ala Glu Leu Gly
305                 310                 315Asp Tyr Ser Gly Asn Ser Leu Asp Asp Asp Tyr Cys Ala Ala Glu Glu320                 325                 330                 335Ala Glu Phe Gly Gly Ser Ser Phe Ser Asp Lys Gly Gly Leu Thr Gln
            340                 345                 350Phe Lys Lys Ala Thr Ser Gly Gly Met Val Leu Val Met Ser Leu Trp
        355                 360                 365Asp Asp Tyr Tyr Ala Asn Met Leu Trp Leu Asp Ser Thr Tyr Pro Thr
    370                 375                 380Asn Glu Thr Ser Ser Thr Pro Gly Ala Val Arg Gly Ser Cys Ser Thr
385                 390                 395Ser Ser Gly Val Pro Ala Gln Leu Glu Ser Asn Ser Pro Asn Ala Lys400                 405                 410                 415Val Val Tyr Ser Asn Ile Lys Phe Gly Pro Ile Gly Ser Thr Gly Asn
            420                 425                 430Ser Ser Gly Gly Asn Pro Pro Gly Gly Asn Pro Pro Gly Thr Thr Thr
        435                 440                 445Thr Arg Arg Pro Ala Thr Ser Thr Gly Ser Ser Pro Gly Pro Thr Gln
    450         455                         460Thr His Tyr Gly Gln Cys Gly Gly Ile Gly Tyr Ser Gly Pro Thr Val
465                 470                 475Cys Ala Ser Gly Ser Thr Cys Gln Val Leu Asn Pro Tyr Tyr Ser Gln480                 485                 490                 495Cys Leu序列号:3序列的长度:286序列类型:氨基酸拓扑型:直链形序列种类:蛋白质序列Ala Cys Ala Asp Gly Lys Ser Thr Arg Tyr Trp Asp Cys Cys Lys Pro-2      1                5                  10Ser Cys Gly Trp Ala Lys Lys Ala Pro Val Asn Gln Pro Val Phe Ser15                  20                  25                  30Cys Asn Ala Asn Phe Gln Arg Leu Thr Asp Phe Asp Ala Lys Ser Gly
             35                  40                  45Cys Glu Pro Gly Gly Val Ala Tyr Ser Cys Ala Asp Gln Thr Pro Trp
         50                  55                  60Ala Val Asn Asp Asp Phe Ala Phe Gly Phe Ala Ala Thr Ser Ile Ala
     65                  70                  75Gly Ser Asn Glu Ala Gly Trp Cys Cys Ala Cys Tyr Glu Leu Thr Phe
 80                  85                  90Thr Ser Gly Pro Val Ala Gly Lys Lys Met Val Val Gln Ser Thr Ser95                 100                 105                 110Thr Gly Gly Asp Leu Gly Ser Asn His Phe Asp Leu Asn Ile Pro Gly
            115                 120                 125Gly Gly Val Gly Ile Phe Asp Gly Cys Thr Pro Gln Phe Gly Gly Leu
        130                 135                 140Pro Gly Gln Arg Tyr Gly Gly Ile Ser Ser Arg Asn Glu Cys Asp Arg
    145                 150                 155Phe Pro Asp Ala Leu Lys Pro Gly Cys Tyr Trp Arg Phe Asp Trp Phe
160                 165                 170Lys Asn Ala Asp Asn Pro Ser Phe Ser Phe Arg Gln Val Gln Cys Pro175                 180                 185                 190Ala Glu Leu Val Ala Arg Thr Gly Cys Arg Arg Asn Asp Asp Gly Asn
            195                 200                 205Phe Pro Ala Val Gln Ile Pro Ser Ser Ser Thr Ser Ser Pro Val Gly
        210                 215                 220Gln Pro Thr Ser Thr Ser Thr Thr Ser Thr Ser Thr Thr Ser Ser Pro
    225                 230                 235Pro Val Gln Pro Thr Thr Pro Ser Gly Cys Thr Ala Glu Arg Trp Ala
240                 245                 250Gln Cys Gly Gly Asn Gly Trp Ser Gly Cys Thr Thr Cys Val Ala Gly255                 260                 265                 270Ser Thr Cys Thr Lys Ile Asn Asp Trp Tyr His Gln Cys Leu
            275                 280序列号:4序列的长度:927序列类型:核酸链数:双链拓扑型:直链形序列种类:基因组DNA起源
生物名:Humicola insolens序列特征
表示特征的记号:内含子
存在位置:297..334
确定特征的方法:E序列GCA TGC GCT GAT GGC AAG TCC ACC CGC TAC TGG GAC TGC TGC AAG CCT   48Ala Cys Ala Asp Gly Lys Ser Thr Arg Tyr Trp Asp Cys Cys Lys Pro-2       1               5                  10TCG TGC GGC TGG GCC AAG AAG GCT CCC GTG AAC CAG CCT GTC TTC TCC   96Ser Cys Gly Trp Ala Lys Lys Ala Pro Val Asn Gln Pro Val Phe Ser15                  20                  25                  30TGC AAC GCC AAC TTC CAG CGT CTC ACT GAC TTC GAC GCC AAG TCC GGC  144Cys Asn Ala Asn Phe Gln Arg Leu Thr Asp Phe Asp Ala Lys Ser Gly
             35                  40                  45TGC GAG CCG GGC GGT GTC GCC TAC TCG TGC GCC GAC CAG ACC CCA TGG  192Cys Glu Pro Gly Gly Val Ala Tyr Ser Cys Ala Asp Gln Thr Pro Trp
         50                  55                  60GCT GTG AAC GAC GAC TTC GCG TTC GGT TTT GCT GCC ACC TCT ATT GCC  240Ala Val Asn Asp Asp Phe Ala Phe Gly Phe Ala Ala Thr Ser Ile Ala
     65                  70                  75GGC AGC AAT GAG GCG GGC TGG TGC TGC GCC TGC TAC GA GTAAGCTTTG    288Gly Ser Asn Glu Ala Gly Trp Cys Cys Ala Cys Tyr Gl
 80                  85                  90GTCGCGTGTG TAACACTGTG CAGGCATAGC ACTAACCACC TCCCAG G CTC ACC    341
                                               u Leu ThrTTC ACA TCC GGT CCT GTT GCT GGC AAG AAG ATG GTC GTC CAG TCC ACC 389Phe Thr Ser Gly Pro Val Ala Gly Lys Lys Met Val Val Gln Ser Thr
 95                 100                 105AGC ACT GGC GGT GAT CTT GGC AGC AAC CAC TTC GAT CTC AAC ATC CCC 437Ser Thr Gly Gly Asp Leu Gly Ser Asn His Phe Asp Leu Asn Ile Pro110                 115                 120                 125GGC GGC GGC GTC GGC ATC TTC GAC GGA TGC ACT CCC CAG TTC GGC GGT 485Gly Gly Gly Val Gly Ile Phe Asp Gly Cys Thr Pro Gln Phe Gly Gly
            130                 135                 140CTG CCC GGC CAG CGC TAC GGC GGC ATC TCG TCC CGC AAC GAG TGC GAT 533Leu Pro Gly Gln Arg Tyr Gly Gly Ile Ser Ser Arg Asn Glu Cys Asp
        145                 150                 155CGG TTC CCC GAC GCC CTC AAG CCC GGC TGC TAC TGG CGC TTC GAC TGG 581Arg Phe Pro Asp Ala Leu Lys Pro Gly Cys Tyr Trp Arg Phe Asp Trp
    160                 165                 170TTC AAG AAC GCC GAC AAC CCG AGC TTC AGC TTC CGT CAG GTC CAA TGC 629Phe Lys Asn Ala Asp Asn Pro Ser Phe Ser Phe Arg Gln Val Gln Cys
175                 180                 185CCA GCC GAG CTC GTC GCT CGC ACC GGA TGC CGC CGC AAC GAC GAC GGC 677Pro Ala Glu Leu Val Ala Arg Thr Gly Cys Arg Arg Asn Asp Asp Gly190                 195                 200                 205AAC TTC CCT GCC GTC CAG ATC CCC TCC AGC AGC ACC AGC TCT CCG GTC 725Asn Phe Pro Ala Val Gln Ile Pro Ser Ser Ser Thr Ser Ser Pro Val
            210                 215                 220GGC CAG CCT ACC AGT ACC AGC ACC ACC TCC ACC TCC ACC ACC TCG AGC 773Gly Gln Pro Thr Ser Thr Ser Thr Thr Ser Thr Ser Thr Thr Ser Ser
        225                 230                 235CCG CCC GTC CAG CCT ACG ACT CCC AGC GGC TGC ACT GCT GAG AGG TGG 821Pro Pro Val Gln Pro Thr Thr Pro Ser Gly Cys Thr Ala Glu Arg Trp
    240                 245                 250GCT CAG TGC GGC GGC AAT GGC TGG AGC GGC TGC ACC ACC TGC GTC GCT 869Ala Gln Cys Gly Gly Asn Gly Trp Ser Gly Cys Thr Thr Cys Val Ala
255                 260                 265GGC AGC ACC TGC ACG AAG ATT AAT GAC TGG TAC CAT CAG TGC CTG TAA 917Gly Ser Thr Cys Thr Lys Ile Asn Asp Trp Tyr His Gln Cys Leu ***270                 275                 280GGTAGTCGAC                                                      927序列号:5序列的长度:418序列类型:氨基酸拓扑型:直链形序列种类:蛋白质序列Gly Gly Ala Ala Ala Gln Gln Thr Val Trp Gly Gln Cys Gly Gly Ile-5                   1               5                  10Gly Trp Ser Gly Pro Thr Ser Cys Ala Pro Gly Ser Ala Cys Ser Thr
         15                  20                  25Leu Asn Pro Tyr Tyr Ala Gln Cys Ile Pro Gly Ala Thr Ser Ile Thr
     30                  35                  40Thr Ser Thr Arg Pro Pro Ser Gly Pro Thr Thr Thr Thr Arg Ala Thr
 45                  50                  55Ser Thr Thr Ser Ser Pro Pro Pro Thr Ser Ser Gly Val Arg Phe Ala60                  65                  70                  75Gly Val Asn Ile Ala Gly Phe Asp Phe Gly Cys Thr Thr Asp Gly Thr
             80                  85                  90Cys Val Thr Ser Lys Val Tyr Pro Pro Leu Lys Asn Phe Thr Gly Ala
         95                 100                 105Asn Asn Tyr Pro Asp Gly Ile Gly Gln Met Gln His Phe Val Asn Asp
    110                 115                 120Asp Gly Met Thr Ile Phe Arg Leu Pro Val Gly Trp Gln Tyr Leu Val
125                 130                 135Asn Asn Asn Leu Gly Gly Thr Leu Asp Ser Thr Ser Ile Ser Lys Tyr140                 145                 150                 155Asp Gln Leu Val Gln Gly Cys Leu Ser Leu Gly Val Tyr Cys Ile Ile
            160                 165                 170Asp Ile His Asn Tyr Ala Arg Trp Asn Gly Gly Ile Ile Gly Gln Gly
        175                 180                 185Gly Pro Thr Asn Ala Gln Phe Thr Ser Leu Trp Ser Gln Leu Ala Ser
    190                 195                 200Lys Tyr Ala Ser Gln Ser Arg Val Trp Phe Gly Ile Met Asn Glu Pro
205                 210                 215His Asp Val Asn Ile Asn Thr Trp Ala Ala Thr Val Gln Glu Val Val220                 225                 230                 235Thr Ala Ile Arg Asn Ala Gly Ala Thr Ser Gln Tyr Ile Ser Leu Pro
            240                 245                 250Gly Asn Asp Tyr Gln Ser Ala Ala Ala Phe Ile Ser Asp Gly Ser Ala
        255             260                     265Ala Ala Leu Ser Gln Val Thr Asn Pro Asp Gly Ser Thr Thr Asn Leu
    270                 275                 280Ile Phe Asp Val His Lys Tyr Leu Asp Ser Asp Asn Ser Gly Thr His
285                 290                 295Ala Glu Cys Thr Thr Asn Asn Ile Asp Gly Ala Phe Ala Pro Leu Ala300                 305                 310                 315Thr Trp Leu Arg Gln Asn Asn Arg Gln Ala Ile Leu Thr Glu Thr Gly
            320                 325                 330Gly Gly Asn Val Gln Ser Cys Ile Gln Asp Leu Cys Gln Gln Ile Gln
        335                 340                 345Tyr Leu Asn Gln Asn Ser Asp Val Tyr Leu Gly Tyr Ala Gly Trp Gly
    350                 355                 360Ala Gly Ser Phe Asp Ser Thr Tyr Ile Leu Thr Glu Thr Pro Thr Gly
365                 370                 375Ser Gly Ash Ser Trp Thr Asp Thr Ser Leu Val Ser Ser Cys Leu Ala380                 385                 390                 395Arg Lys序列号:6序列的长度:1463序列类型:核酸链数:二条链拓扑型:直链形序列种类:基因组DNA起源
生物名:Trichoderma viride MC300-1序列特征
表示特征的记号:sig peptide
存在位置:14..76
决定特征的方法:E
表示特征的记号:mat peptide
存在位置:77..1450
决定特征的方法:E
表示特征的记号:内含子
存在位置:343..525
决定特征的方法:E序列AGGCCTGCGC ATC ATG AAC AGG ACC ATG GCT CCA TTG CTG CTT GCA GCG   49
           Met Asn Arg Thr Met Ala Pro Leu Leu Leu Ala Ala
               -20                 -15                 -10TCG ATA CTC TTC GGG GGC GCT GCT GCA CAA CAG ACT GTC TGG GGA CAG  97Ser Ile Leu Phe Gly Gly Ala Ala Ala Gln Gln Thr Val Trp Gly Gln
             -5              -1   1               5TGT GGA GGT ATT GGT TGG AGC GGA CCT ACG AGT TGT GCT CCT GGA TCA  145Cys Gly Gly Ile Gly Trp Ser Gly Pro Thr Ser Cys Ala Pro Gly Ser
     10                  15                  20GCT TGT TCT ACT CTC AAT CCT TAT TAT GCG CAA TGC ATT CCG GGG GCC  193Ala Cys Ser Thr Leu Asn Pro Tyr Tyr Ala Gln Cys Ile Pro Gly Ala
 25                  30                  35ACT AGT ATC ACC ACC TCG ACC CGA CCC CCC TCG GGT CCA ACC ACC ACC  241Thr Ser Ile Thr Thr Ser Thr Arg Pro Pro Ser Gly Pro Thr Thr Thr40                  45                  50                  55ACC AGA GCC ACC TCA ACG ACC TCA TCT CCG CCA CCG ACC AGC TCT GGA  289Thr Arg Ala Thr Ser Thr Thr Ser Ser Pro Pro Pro Thr Ser Ser Gly
             60                  65                  70GTT CGA TTT GCT GGC GTT AAC ATC GCG GGC TTT GAC TTC GGA TGT ACC  337Val Arg Phe Ala Gly Val Asn Ile Ala Gly Phe Asp Phe Gly Cys Thr
         75                  80                  85ACA GA GTATGTCTTC ATGTTGCATA GTGTTGCTGG CTGAGTATTC TGGGCGGATG    392Thr AsATTTATAGCT GTGCGGCTG CAAAACACCG CCGGTCTGCC ACTATCAAGG CATAGTTGAT 452AGGCGGCGGT GTTTTCTTCA ATCCCCTGAT TACACTCTCA AGAATCTAGT GGCTGATGGA 512TGTATGATTA CAG T GGC ACT TGC GTT ACA TCG AAG GTT TAT CCT CCG TTG  562
           P Gly Thr Cys Val Thr Ser Lys Val Tyr Pro Pro Leu
              90                  95                 100AAG AAC TTC ACT GGG GCA AAC AAC TAC CCG GAC GGT ATC GGC CAG ATG   610Lys Asn Phe Thr Gly Ala Asn Asn Tyr Pro Asp Gly Ile Gly Gln Met
        105                 110                 115CAG CAC TTC GTC AAC GAT GAT GGG ATG ACT ATT TTC CGC CTA CCC GTC   658Gln His Phe Val Asn Asp Asp Gly Met Thr Ile Phe Arg Leu Pro Val
    120                 125                 130GGA TGG CAG TAC CTC GTA AAC AAC AAT CTG GGT GGA ACT CTC GAT TCC   706Gly Trp Gln Tyr Leu Val Asn Asn Asn Leu Gly Gly Thr Leu Asp Ser
135                 140                 145ACC AGT ATC TCG AAG TAT GAT CAG CTC GTT CAG GGG TGC CTG TCT CTC   754Thr Ser Ile Ser Lys Tyr Asp Gln Leu Val Gln Gly Cys Leu Ser Leu150                 155                 160                 165GGT GTA TAC TGC ATC ATC GAC ATC CAC AAT TAT GCT CGA TGG AAC GGT   802Gly Val Tyr Cys Ile Ile Asp Ile His Asn Tyr Ala Arg Trp Asn Gly
            170                 175                 180GGA ATC ATT GGC CAG GGA GGC CCT ACA AAT GCC CAG TTT ACC AGT CTT   850Gly Ile Ile Gly Gln Gly Gly Pro Thr Asn Ala Gln Phe Thr Ser Leu
        185                 190                 195TGG TCG CAG TTG GCA TCG AAG TAC GCG TCT CAG TCG AGG GTG TGG TTC   898Trp Ser Gln Leu Ala Ser Lys Tyr Ala Ser Gln Ser Arg Val Trp Phe
    200                 205                 210GGA ATA ATG AAT GAG CCC CAC GAC GTG AAC ATC AAC ACT TGG GCT GCC   946Gly Ile Met Asn Glu Pro His Asp Val Asn Ile Asn Thr Trp Ala Ala
215                 220                 225ACG GTT CAA GAG GTC GTC ACT GCA ATC CGC AAC GCC GGT GCT ACG TCG   994Thr Val Gln Glu Val Val Thr Ala Ile Arg Asn Ala Gly Ala Thr Ser230                 235                 240                 245CAA TAC ATT TCT CTG CCT GGA AAT GAT TAT CAA TCT GCG GCA GCT TTT   1042Gln Tyr Ile Ser Leu Pro Gly Asn Asp Tyr Gln Ser Ala Ala Ala Phe
            250                 255                 260ATT TCC GAT GGC AGT GCA GCC GCC CTG TCT CAG GTA ACG AAC CCT GAT   1090Ile Ser Asp Gly Ser Ala Ala Ala Leu Ser Gln Val Thr Asn Pro Asp
        265                 270                 275GGA TCA ACA ACG AAT CTA ATC TTC GAT GTC CAC AAG TAC TTA GAC TCG   1138Gly Ser Thr Thr Asn Leu Ile Phe Asp Val His Lys Tyr Leu Asp Ser
    280                 285                 290GAC AAC TCC GGT ACT CAC GCC GAA TGC ACT ACA AAC AAC ATC GAC GGC   1186Asp Asn Ser Gly Thr His Ala Glu Cys Thr Thr Asn Asn Ile Asp Gly
295                 300                 305GCC TTT GCT CCT CTC GCC ACT TGG CTT CGA CAG AAC AAC CGC CAG GCT   1234Ala Phe Ala Pro Leu Ala Thr Trp Leu Arg Gln Asn Asn Arg Gln Ala310                 315                 320                 325ATT CTG ACG GAA ACC GGC GGT GGC AAT GTT CAG TCC TGC ATC CAA GAT   1282Ile Leu Thr Glu Thr Gly Gly Gly Asn Val Gln Ser Cys Ile Gln Asp
            330                 335                 340TTG TGC CAA CAG ATC CAG TAC CTC AAC CAG AAC TCA GAT GTC TAT CTT  1330Leu Cys Gln Gln Ile Gln Tyr Leu Asn Gln Asn Ser Asp Val Tyr Leu
        345                 350                 355GGC TAT GCT GGC TGG GGT GCC GGT TCA TTT GAT AGC ACT TAT ATT CTG  1378Gly Tyr Ala Gly Trp Gly Ala Gly Ser Phe Asp Ser Thr Tyr Ile Leu
    360                 365                 370ACG GAA ACG CCT ACT GGA AGC GGT AAC TCG TGG ACG GAC ACA TCC CTA  1426Thr Glu Thr Pro Thr Gly Ser Gly Asn Ser Trp Thr Asp Thr Ser Leu
375                 380                 385GTT AGC TCG TGT CTC GCC AGG AAG TAAGGTACTC GAG                   1463Val Ser Ser Cys Leu Ala Arg Lys390                 395序列号:7序列的长度:223序列类型:氨基酸拓扑型:直链形序列种类:蛋白质序列Met Val Ser Phe Thr Ser Leu Leu Ala Gly Val Ala Pro Ile Ser Gly-33         -30                 -25                 -20Val Leu Ala Ala Pro Ala Ala Glu Val Glu Ser Val Asp Val Glu Lys
    -15                 -10                  -5Arg Gln Thr Ile Gln Pro Gly Thr Gly Tyr Asn Asn Gly Tyr Phe Tyr-1   1               5                  10                  15Ser Tyr Trp Asn Asp Gly His Gly Gly Val Thr Tyr Thr Asn Gly Pro
             20                  25                  30Gly Gly Gln Phe Ser Val Asn Trp Ser Asn Ser Gly Asn Phe Val Gly
         35                  40                  45Gly Lys Gly Trp Gln Pro Gly Thr Lys Asn Lys Val Ile Asn Phe Ser
     50                  55                  60Gly Thr Tyr Asn Pro Asn Gly Asn Ser Tyr Leu Ser Val Tyr Gly Trp
 65                  70                  75Ser Arg Asn Pro Leu Ile Glu Tyr Tyr Ile Val Glu Asn Phe Gly Thr80                  85                  90                  95Tyr Asn Pro Ser Thr Gly Ala Thr Lys Leu Gly Glu Val Thr Ser Asp
            100                 105                 110Gly Ser Val Tyr Asp Ile Tyr Arg Thr Gln Arg Val Asn Gln Pro Ser
        115                 120                 125Ile Glu Gly Thr Ser Thr Phe Tyr Gln Tyr Trp Ser Val Arg Arg Thr
    130                 135                 140His Arg Ser Ser Gly Ser Val Asn Thr Ala Asn His Phe Asn Ala Trp
145                 150                 155Ala Ser His Gly Leu Thr Leu Gly Thr Met Asp Tyr Gln Ile Val Ala160                 165                 170                 175Val Glu Gly Tyr Phe Ser Ser Gly Ser Ala Ser Ile Thr Val Ser
            180                 185                 190序列号:8序列的长度:822序列类型:核酸链数:二条链拓扑型:直链形序列种类:基因组DNA起源
生物名:Trichoderma viride MC300-1序列特征
表示特征的记号:sig peptide
存在位置:14..112
决定特征的方法:E
表示特征的记号:mat peptide
存在位置:113..809
决定特征的方法:E
表示特征的记号:内含子
存在位置:286..412
决定特征的方法:E序列AGGCCTGCGC ATC ATG GTC TCC TTC ACC TCC CTC CTC GCC GGC GTC GCG CCC   52
           Met Val Ser Phe Thr Ser Leu Leu Ala Gly Val Ala Pro
           -33         -30                 -25ATC TCC GGA GTC TTG GCC GCT CCC GCT GCT GAG GTC GAG TCC GTG GAC      100Ile Ser Gly Val Leu Ala Ala Pro Ala Ala Glu Val Glu Ser Val Asp-20                 -15                 -10                  -5GTT GAA AAG CGC CAG ACG ATT GAG CCC GGC ACG GGC TAC AAC AAC GGC    148Val Glu Lys Arg Gln Thr Ile Gln Pro Gly Thr Gly Tyr Asn Asn Gly
         -1   1               5                  10TAC TTC TAC TCG TAC TGG AAC GAC GGC CAC GGC GGC GTG ACG TAC ACC    196Tyr Phe Tyr Ser Tyr Trp Asn Asp Gly His Gly Gly Val Thr Tyr Thr
     15                  20                  25AAT GGC CCC GGC GGC CAG TTC TCC GTC AAC TGG TCC AAC TCG GGC AAC    244Asn Gly Pro Gly Gly Gln Phe Ser Val Asn Trp Ser Asn Ser Gly Asn
 30                  35                  40TTT GTC GGC GGC AAG GGA TGG CAG CCC GGC ACC AAG AAC AA             285Phe Val Gly Gly Lys Gly Trp Gln Pro Gly Thr Lys Asn Ly45                  50                  55GTAAGACTAT ATACAACCCC ACCTTCTGAC CAAACCCCCT ATCCAACGAC AGAATATAAA  345ACCAAGGGCG TGATTATCAT GGAGAGAGAG AGTGTGTGTG ATCTAACGGT TTTGTTCTGA  405AAACAAG G GTC ATC AAC TTC TCG GGC ACC TAC AAC CCC AAC GGC AAC      452
    s Val Ile Asn Phe Ser Gly Thr Tyr Asn Pro Asn Gly Asn
           60                  65                  70AGC TAC CTC TCC GTG TAC GGC TGG TCG CGC AAC CCC CTG ATC GAG TAC    500Ser Tyr Leu Ser Val Tyr Gly Trp Ser Arg Asn Pro Leu Ile Glu Tyr
         75                  80                  85TAC ATC GTC GAG AAC TTT GGC ACC TAC AAC CCG TCC ACC GGC GCC ACC    548Tyr Ile Val Glu Asn Phe Gly Thr Tyr Asn Pro Ser Thr Gly Ala Thr
     90                  95                 100AAG CTG GGC GAG GTG ACG TCG GAC GGC AGC GTC TAC GAC ATC TAC CGC    596Lys Leu Gly Glu Val Thr Ser Asp Gly Ser Val Tyr Asp Ile Tyr Arg
105                 110                 115ACG CAG CGC GTC AAC CAG CCG TCC ATC GAG GGC ACC TCC ACC TTT TAC    644Thr Gln Arg Val Asn Gln Pro Ser Ile Glu Gly Thr Ser Thr Phe Tyr120                 125                 130                 135CAG TAC TGG TCC GTC CGC CGC ACC CAC CCC TCC AGC GGC TCC GTC AAC    692Gln Tyr Trp Ser Val Arg Arg Thr His Arg Ser Ser Gly Ser Val Asn
            140                 145                 150ACG GCG AAC CAC TTC AAC GCG TGG GCC TCG CAC GGC CTG ACG CTG GGC    740Thr Ala Asn His Phe Asn Ala Trp Ala Ser His Gly Leu Thr Leu Gly
        155                 160                 165ACC ATG GAT TAC CAG ATT GTT GCC GTG GAG GGC TAC TTT AGC TCT GGC    788Thr Met Asp Tyr Gln Ile Val Ala Val Glu Gly Tyr Phe Ser Ser Gly
    170                 175                 180TCT GCT TCC ATC ACC GTC AGC TAAGGTACTC GAG                         822Ser Ala Ser Ile Thr Val Ser
185                 190序列号:9序列的长度:10序列类型:氨基酸拓扑型:直链形片段种类:N末端片段起源
生物名:Trichoderma viride MC300-1序列Ser Ala Xaa Thr Leu Gln Ala Glu Thr His1              5                   10序列号:10序列的长度:6序列类型:氨基酸拓扑型:直链形片段种类:中间片段起源
生物名:Trichoderma viride MC300-1序列Glu Phe Ser Phe Asp Val1               5序列号:11序列的长度:18序列类型:氨基酸拓扑型:直链形片段种类:中间片段起源
生物名:Trichoderma viride MC300-1序列Glu Thr His Pro Pro Leu Thr Trp Gln Lys Xaa Ser Ser Gly Gly Thr1          5                       10                  15Xaa Thr序列号:12序列的长度:18序列类型:核酸拓扑型:直链形序列种类:其它核酸合成核酸序列ATGTATCAAA AGTTGGCC   18序列号:13序列的长度:19序列类型:核酸拓扑型:直链形序列种类:其它核酸合成核酸序列TTACAAGCAC TGAGAGTAG  19序列号:14序列的长度:23序列类型:核酸拓扑型:直链形序列种类:其它核酸合成核酸序列TCACTTTCCA GCAGCCCAAC GCC序列号:15序列的长度:23序列类型:核酸拓扑型:直链形序列种类:其它核酸合成核酸序列CAACTCTCCC AACGCCAAGG TCG序列号:16序列的长度:23序列类型:核酸拓扑型:直链形序列种类:其它核酸合成核酸序列CGTCGGGTAG GTAGAGTCCA GCC序列号:17序列的长度:23序列类型:核酸拓扑型:直链形序列种类:其它核酸合成核酸序列TCTCGAACTG AGTGACGACG GTC序列号:18序列的长度:23序列类型:核酸拓扑型:直链形序列种类:其它核酸合成核酸序列CTGCCATGTC AGAGGCGGGT GAG序列号:19序列的长度:23序列类型:核酸拓扑型:直链形序列种类:其它核酸合成核酸序列ACTCCAACAT CAAGTTCGGC CCC序列号:20序列的长度:23序列类型:核酸拓扑型:直链形序列种类:其它核酸合成核酸序列AACTCCCACT GAGCCTTTAC GTC序列号:21序列的长度:23序列类型:核酸拓扑型:直链形序列种类:其它核酸合成核酸序列CAATTAAGTG GCTAAACGTA CCG序列号:22序列的长度:23序列类型:核酸拓扑型:直链形序列种类:其它核酸合成核酸序列GCAAAAATAT AGTCGAATCT GCC序列号:23序列的长度:23序列类型:核酸拓扑型:直链形序列种类:其它核酸合成核酸序列GCTGGAATGC TCGCTAGCTT GGC序列号:24序列的长度:23序列类型:核酸拓扑型:直链形序列种类:其它核酸合成核酸序列ACTGTTGGAG ACCAGCTTGT CCG序列号:25序列的长度:23序列类型:核酸拓扑型:直链形序列种类:其它核酸合成核酸序列CGCAGTAGGA GAATAGAAAC CCC序列号:26序列的长度:23序列类型:核酸拓扑型:直链形序列种类:其它核酸合成核酸序列CTGCTGTCAA TCCCCGCTAC TGG序列号:27序列的长度:23序列类型:核酸拓扑型:直链形序列种类:其它核酸合成核酸序列CCTTCGAGAA AAGGAGATTC GCG序列号:28序列的长度:23序列类型:核酸拓扑型:直链形序列种类:其它核酸合成核酸序列CAGCTCCTTG GCAAAAGCAG TGG序列号:29序列的长度:23序列类型:核酸拓扑型:直链形序列种类:其它核酸合成核酸序列AGATCATCAG TTGAGGTTAG ACC序列号:30序列的长度:23序列类型:核酸拓扑型:直链形序列种类:其它核酸合成核酸序列TGTATAAAAT TAGGTTCGGG TCC序列号:31序列的长度:23序列类型:核酸拓扑型:直链形序列种类:其它核酸合成核酸序列CTACTCATCA ACTCAGATCC TCC序列号:32序列的长度:24序列类型:核酸拓扑型:直链形序列种类:其它核酸合成核酸序列GGAAGCCTCA GAAGTAGATA CAGC序列号:33序列的长度:20序列类型:核酸拓扑型:直链形序列种类:其它核酸合成核酸序列TCGACTACGG ACTGCGCATC序列号:34序列的长度:20序列类型:核酸拓扑型:直链形序列种类:其它核酸合成核酸序列CAAGCTTTTG CCACAGTACC序列号:35序列的长度:36序列类型:核酸拓扑型:直链形序列种类:其它核酸合成核酸序列GATACATGAT GCGCAGGCCT TAGTCGACTA GAATGC序列号:36序列的长度:36序列类型:核酸拓扑型:直链形序列种类:其它核酸合成核酸序列GATCCTCAAG CTTTTGCTCG AGTACCTTAC AAGCAC序列号:37序列的长度:35序列类型:核酸拓扑型:直链形序列种类:其它核酸合成核酸序列GGAGGGTGCA TGCCGACTGA GCCCGGGCAG TAGCC序列号:38序列的长度:23序列类型:核酸拓扑型:直链形序列种类:其它核酸合成核酸序列GCCGGGAGAG GATCCAGTGG AGG序列号:39序列的长度:30序列类型:核酸拓扑型:直链形序列种类:其它核酸合成核酸序列GCTCGAGTAC CTTACTGCAG GCACTGAGAG序列号:40序列的长度:29序列类型:核酸拓扑型:直链形序列种类:其它核酸合成核酸序列GGGGCATGCG CTGATGGCAA GTCCACCCG序列号:41序列的长度:33序列类型:核酸拓扑型:直链形序列种类:其它核酸合成核酸序列GGGGTCGACT ACCTTACAGG CACTGATGGT ACC序列号:42序列的长度:10序列类型:氨基酸拓扑型:直链形片段种类:N末端片段起源
生物名:Trichoderma viride MC300-1序列Gln Asp Val Trp Gly Gln Cys Gly Gly Ile1               5                   10序列号:43序列的长度:11序列类型:氨基酸拓扑型:直链形片段种类:中间片段起源
生物名:Trichoderma viride MC300-1序列Thr Pro Thr Gly Ser Gly Asn Ser Trp Thr Asp1               5                   10序列号:44序列的长度:7序列类型:氨基酸拓扑型:直链形片段种类:中间片段起源
生物名:Trichoderma viride MC300-1序列Ser Thr Tyr Ile Leu Thr Glu1               5序列号:45序列的长度:15序列类型:氨基酸拓扑型:直链形片段种类:中间片段起源
生物名:Trichoderma viride MC300-1序列Phe Ala Gly Val Asn Ile Ala Gly Phe Asp Phe Gly Xaa Thr Thr1               5                   10                  15序列号:46序列的长度:19序列类型:核酸拓扑型:直链形序列种类:其它核酸合成核酸序列ATGAACAAGT CCGTGGCTC序列号:47序列的长度:23序列类型:核酸拓扑型:直链形序列种类:其它核酸合成核酸序列TTACTTTCTT GCGAGACACG AGC序列号:48序列的长度:36序列类型:核酸拓扑型:直链形序列种类:其它核酸合成核酸序列GGGAGGCCTG CGCATCATGG CTCCATTGCT GCTTGC序列号:49序列的长度:36序列类型:核酸拓扑型:直链形序列种类:其它核酸合成核酸序列GGGCTCGAGT ACCTTACTTC CTGGCGAGAC ACGAGC序列号:50序列的长度:14序列类型:氨基酸拓扑型:直链形片段种类:N末端片段起源
生物名:Trichoderma viride MC300-1序列Gln Thr Ile Gly Pro Gly Thr Gly Phe Asn Asn Gly Tyr Phe1               5                   10序列号:51序列的长度:35序列类型:核酸拓扑型:直链形序列种类:其它核酸合成核酸序列GGGAGGCCTG CGCATCATGG TCTCCTTCAC CTCCC序列号:52序列的长度:34序列类型:核酸拓扑型:直链形序列种类:其它核酸合成核酸序列GGGCTCGAGT ACCTTAGCTG ACGGTGATGG AAGC

Claims (34)

1.来自Trichoderma viride的纤维素酶cbh1基因调控序列。
2.质粒pA01中的cbh1基因的启动子序列。
3.权利要求2记载的启动子序列,包含从cbh1基因的氨基末端到上游大约1.5kb区域内的序列或保持高启动子活性的其变化序列。
4.权利要求3记载的启动子序列,其中cbh1基因的氨基末端到上游大约1.5kb区域内的序列是从质粒pA01中的cbh1基因的氨基末端到上游的HindⅢ位点的序列。
5.质粒pA01中的cbh1基因的信号序列。
6.权利要求5记载的信号序列,是序列1记载的编码-17到-1氨基酸序列的碱基序列或其碱基序列的变化序列、编码依然保持信号序列活性的氨基酸序列的碱基序列。
7.质粒pA01中的cbh1基因的终止子序列。
8.权利要求7记载的的终止子序列包含存在于从cbh1基因的羧基端到下游1kb的区域内的序列或保持活性的其变化序列。
9.权利要求8记载的的终止子序列,其中从cbh1基因的羧基端到下游1kb的区域内存在的序列是从质粒pA01中的cbh1基因的羧基端到下游的SalⅠ位点的序列。
10.含有权利要求1记载的来自Trichoderma viride的纤维素酶cbh1基因调控序列的表达载体。
11.权利要求10记载的表达载体,含有可操作的连接于其调控序列的编码目的蛋白质或肽的碱基序列。
12.至少含有从权利要求2~9中任一项记载的由启动子、信号序列、以及终止子中选择出的一种序列的表达载体。
13.权利要求12记载的表达载体,含有权利要求2~4中任一项记载的启动子序列。
14.权利要求12或13中任一项记载的表达载体,含有可操作的连接于上述序列的编码目的蛋白质或肽的碱基序列。
15.权利要求11~14中任一项记载的表达载体,其中,上述目的蛋白质是来自Humicola insolens的葡聚糖内切酶或其变化蛋白质。
16.权利要求15记载的表达载体,其中,来自Humicola insolens的葡聚糖内切酶是葡聚糖内切酶NCE4。
17.权利要求11~14中任一项记载的表达载体,其中,上述目的蛋白质是来自Trichoderma viride的葡聚糖内切酶或其变化蛋白质。
18.权利要求17记载的表达载体,其中,来自Trichoderma viride的葡聚糖内切酶是葡聚糖内切酶SCE3。
19.权利要求11~14中任一项记载的表达载体,其中,上述目的蛋白质是来自Trichoderma viride的木聚糖酶或其变化蛋白质。
20.权利要求19记载的表达载体,其中,来自Trichoderma viride的木聚糖酶是木聚糖酶SXY1。
21.权利要求10~20中任一项记载的表达载体,还含有选择标记。
22.权利要求21记载的表达载体,其中,选择标记是潮霉素B抗性基因。
23.表达载体pCB1-MX、pCB1-M2XR、pCB1-HEgX、pCB1-Eg3X、pCB-XI′。
24.由权利要求10~23中任一项记载的表达载体转化的宿主细胞。
25.权利要求24记载的宿主细胞,是属于Trichoderma属的微生物。
26.权利要求25记载的宿主细胞,其中属于Trichoderma属的微生物是Trichoderma viride。
27.权利要求26记载的宿主细胞,其中属于Trichoderma属的微生物是作为Trichoderma viride的纤维素酶高产菌株的Trichoderma virideMC300-1菌株或其系统。
28.目的蛋白质的生产方法,其中包括培养权利要求24~27中任一项记载的宿主细胞、从培养物中提取上述目的蛋白质的工序。
29.权利要求28记载的方法,其中每一升培养液可生产7g以上的目的蛋白质。
30.权利要求28记载的方法,其中每一升培养液可生产15g以上的目的蛋白质。
31.通过权利要求28~30中任一项记载的方法生产的蛋白质或含有该蛋白质的组成物。
32.序列2给出的序列或保持纤维素酶活性的其变化序列。
33.编码权利要求32记载的序列的碱基序列。
34.权利要求33记载的碱基序列,含有序列1给出的序列。
CNB971984530A 1996-09-13 1997-09-16 来自绿色木霉的纤维素酶cbh1基因的调控序列以及利用该序列的蛋白质或多肽的大量生产体系 Expired - Lifetime CN1198939C (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP243695/96 1996-09-13
JP24369596 1996-09-13
JP243695/1996 1996-09-13

Publications (2)

Publication Number Publication Date
CN1232506A true CN1232506A (zh) 1999-10-20
CN1198939C CN1198939C (zh) 2005-04-27

Family

ID=17107620

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB971984530A Expired - Lifetime CN1198939C (zh) 1996-09-13 1997-09-16 来自绿色木霉的纤维素酶cbh1基因的调控序列以及利用该序列的蛋白质或多肽的大量生产体系

Country Status (9)

Country Link
US (1) US6277596B1 (zh)
EP (1) EP0952223B1 (zh)
JP (1) JP3683280B2 (zh)
CN (1) CN1198939C (zh)
AT (1) ATE346942T1 (zh)
AU (1) AU4221397A (zh)
DE (1) DE69737035T2 (zh)
DK (1) DK0952223T3 (zh)
WO (1) WO1998011239A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102471764A (zh) * 2009-07-03 2012-05-23 明治制果药业株式会社 包含源自两种不同的微生物的内切葡聚糖酶的纤维素酶调制物

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
HUP0400150A2 (en) * 2001-06-06 2004-07-28 Meiji Seika Kaisha Saponin-digesting enzymes, genes thereof and soyasapogenol b mass production system
AUPR945901A0 (en) * 2001-12-13 2002-01-24 Macquarie University Gene promoters
CA2770976C (en) * 2003-03-21 2015-05-19 Genencor International, Inc. Cbh1 homologs and variant cbh1 cellulases
CA2538837C (en) * 2003-09-15 2016-02-09 Genencor International, Inc. Modified xylanases having increased thermostability and alkaline stability
CN1902315B (zh) * 2003-12-03 2012-05-02 明治制果药业株式会社 内切葡聚糖酶stce和含有内切葡聚糖酶的纤维素酶配制品
ATE522612T1 (de) * 2003-12-08 2011-09-15 Meiji Seika Pharma Co Ltd Tensid-tolerante cellulase sowie verfahren zur umwandlung davon
JP5193997B2 (ja) 2007-03-12 2013-05-08 Meiji Seikaファルマ株式会社 エンドグルカナーゼppceおよびそれを含んでなるセルラーゼ調製物
EP2256192B1 (en) 2008-02-18 2015-07-15 Meiji Seika Pharma Co., Ltd. Thermostable catalase
ES2661966T3 (es) 2009-08-20 2018-04-04 Meiji Seika Pharma Co., Ltd. Nueva proteína que tiene actividad ß-glucosidasa, y usos de la misma
EP2397491A1 (en) 2010-06-21 2011-12-21 Technische Universität Wien LeaA from Trichoderma reesei
US9394554B2 (en) 2011-11-25 2016-07-19 Mitsui Chemicals, Inc. Mutant xylanase, manufacturing method and use therefor, and method for manufacturing saccharified lignocellulose
US9540617B2 (en) 2012-05-31 2017-01-10 Meiji Seika Pharma Co., Ltd. Method for producing horseradish peroxidase recombinant protein using filamentous fungus
JPWO2014024998A1 (ja) * 2012-08-09 2016-07-25 国立大学法人広島大学 亜リン酸デヒドロゲナーゼ遺伝子をマーカーとした微生物の選択的培養方法
EP2708553A1 (en) 2012-09-18 2014-03-19 Technische Universität Wien Modified fungal cell
KR102155049B1 (ko) * 2018-06-18 2020-09-11 국민대학교산학협력단 트리코더마 속 kmf006 균주를 이용한 셀룰레이스 생산 방법
WO2023225459A2 (en) 2022-05-14 2023-11-23 Novozymes A/S Compositions and methods for preventing, treating, supressing and/or eliminating phytopathogenic infestations and infections

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2612362B2 (ja) * 1990-03-29 1997-05-21 明治製菓株式会社 トリコデルマ・ビリデ由来のdna断片
ES2068586T5 (es) * 1990-05-09 2004-12-01 Novozymes A/S Una preparacion de celulasa que comprende una enzima endoglucanasa.
EP0656943A1 (en) * 1992-08-19 1995-06-14 Alko Group Ltd. Fungal promoters active in the presence of glucose
FI932521A0 (fi) * 1993-06-02 1993-06-02 Alko Ab Oy Nytt endoglukanasenzym
US5861271A (en) * 1993-12-17 1999-01-19 Fowler; Timothy Cellulase enzymes and systems for their expressions

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102471764A (zh) * 2009-07-03 2012-05-23 明治制果药业株式会社 包含源自两种不同的微生物的内切葡聚糖酶的纤维素酶调制物
US9181537B2 (en) 2009-07-03 2015-11-10 Meiji Seika Pharma Co., Ltd. Cellulase preparation comprising endoglucanases derived from two different types of microorganisms

Also Published As

Publication number Publication date
JP3683280B2 (ja) 2005-08-17
DK0952223T3 (da) 2007-04-02
DE69737035D1 (de) 2007-01-11
EP0952223A4 (en) 2004-05-12
DE69737035T2 (de) 2007-04-26
EP0952223A1 (en) 1999-10-27
EP0952223B1 (en) 2006-11-29
AU4221397A (en) 1998-04-02
US6277596B1 (en) 2001-08-21
CN1198939C (zh) 2005-04-27
ATE346942T1 (de) 2006-12-15
WO1998011239A1 (fr) 1998-03-19

Similar Documents

Publication Publication Date Title
CN1165614C (zh) 含有木聚糖酶的动物饲料添加剂
CN1198939C (zh) 来自绿色木霉的纤维素酶cbh1基因的调控序列以及利用该序列的蛋白质或多肽的大量生产体系
CN1171993C (zh) 编码对n-乙酰基-l-膦丝菌素具有特异性的氨基酸脱乙酰酶的新基因,其分离和应用
CN1262639C (zh) 新的宿主细胞和生产蛋白质的方法
CN1311075C (zh) 表达超热稳定蛋白的系统
CN1890367A (zh) 耐表面活性剂的纤维素酶及其修饰方法
CN1154739C (zh) 利用腐质霉属微生物大量生产蛋白南或肽的体系
CN1513057A (zh) 宿主微生物
CN1051058A (zh) 微生物植酸酶的克隆及表达
CN1633496A (zh) 内切-β-1,4-葡聚糖酶
CN1154721C (zh) 葡聚糖内切酶以及含有该酶的纤维素酶制剂
CN1177929C (zh) 新型内切-β-1,4-葡聚糖酶
CN1611601A (zh) 三肽基氨肽酶
CN1152955C (zh) 生产蛋白酶的方法
CN1153831C (zh) 编码神经酰胺糖内切酶激活物的基因
CN1212011A (zh) 一种具有半乳聚糖酶活性的酶
CN1189188A (zh) 超耐热蛋白酶基因
CN1301307A (zh) 在丝状真菌突变细胞中生产多肽的方法
CN1202244C (zh) 具有天冬氨酸酶活性的蛋白和编码该蛋白的基因dna
CN1237208A (zh) 用于产朊假丝酵母转化的方法和材料
CN1086737C (zh) 超热稳定蛋白酶基因
CN1259996A (zh) 棉子糖合成酶基因、棉子糖的制备方法及其转化的植物
CN1219200A (zh) 谷氨酸脱氢酶、β-N-乙酰氨基己糖苷酶和γ-肌动蛋白基因的启动子以及它们在丝状真菌表达,分泌和反义系统中的应用
CN1708584A (zh) 具表面活性剂耐性的新型纤维素酶
CN1387566A (zh) 环状缩肽合成酶及其基因、以及环状缩肽的大规模生产系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C56 Change in the name or address of the patentee

Owner name: MEIJI SEIKA KAISHA, LTD.

Free format text: FORMER NAME: MEIJI SEIKA KAISHA, LTD. (JP) TOKYO, JAPAN

CP01 Change in the name or title of a patent holder

Address after: Tokyo, Japan

Patentee after: Meiji Seika Pharma Co., Ltd.

Address before: Tokyo, Japan

Patentee before: Meiji Seika Kaisha, Ltd.

CX01 Expiry of patent term

Granted publication date: 20050427

CX01 Expiry of patent term