CN102051370A

CN102051370A - 文蛤组织蛋白酶b基因及编码蛋白和应用

Info

Publication number: CN102051370A
Application number: CN2009102298052A
Authority: CN
Inventors: 刘保忠; 姚学良; 王晓梅; 相建海
Original assignee: Institute of Oceanology of CAS
Current assignee: Institute of Oceanology of CAS
Priority date: 2009-10-30
Filing date: 2009-10-30
Publication date: 2011-05-11

Abstract

本发明涉及分子生物学中文蛤组织蛋白酶基因克隆及体外重组表达技术。本发明利用表达序列标签(EST)技术、3’和5’末端快速扩增技术(RACE)从文蛤幼虫中克隆到组织蛋白酶B基因cDNA全长1647bp，编码框长为1014bp，3’非翻译区长624bp，发现组织蛋白酶B存在封闭环序列。本发明利用体外原核重组表达技术获得了重组文蛤组织蛋白酶B，重组产物对其特异性底物有分解作用。本发明可以为进一步研究文蛤幼体生长发育机制提供基础，并为文蛤的苗种繁育和饲料添加剂奠定基础。

Description

文蛤组织蛋白酶B基因及编码蛋白和应用

技术领域

本发明涉及文蛤组织蛋白酶B基因克隆及体外重组表达技术，具体地说是从文蛤cDNA文库中克隆出文蛤组织蛋白酶B基因的cDNA全序列并对该序列进行了原核重组表达，还涉及到该基因及其表达产物在贝类幼虫生长发育促进剂、饲料添加剂以及贝类苗种生产中的应用。

背景技术

在无脊椎动物消化营养物质的酶类中，组织蛋白酶类是人们关注的热点(Williamson et al.，2003)。其中，组织蛋白酶是一大类裂解肽键的蛋白水解酶，因其催化中心不同而分为四种类型，分别为半胱氨酸蛋白酶、丝氨酸蛋白酶、天冬氨酸蛋白酶和金属蛋白酶。其中半胱氨酸蛋白酶是十分重要的一类，组织蛋白酶B(EC 3.4.22.1)属于半胱氨酸蛋白酶之一(McGrath，1999)。组织蛋白酶B是唯一一个同时具有外切酶活性和内切酶活性的组织蛋白酶(Omar Quraishi 1999)，该特点决定了组织蛋白酶B在多肽的分解中具有重要的作用，因此以该蛋白酶主要研究对象可以成为研究在幼虫营养过程的分子机制的突破口。

文蛤是一种在东亚各国沿海和滩涂地区广泛分布的双壳贝类(Wang et al.，1993)。在我国沿海，文蛤作为一种重要的经济贝类而被广泛养殖(Liu et al.，2006)，文蛤苗种的人工繁育成为这一产业发展的关键环节之一。与众多双壳贝类发育过程相似，文蛤幼虫发育也需经过一段浮游阶段然后转入底栖生活。在贝类种苗的人工繁育过程中，早期幼虫营养状况不仅直接影响幼虫的生长发育，还会影响幼虫变态时的大小和变态后幼体的生长率及成活率(Phillips，2002)。所以，养殖业苗种培育过程中，幼虫营养状况会直接影响苗种的成活率和生产效益。组织蛋白酶B的活性特点和生物学功能，决定了其在贝类幼虫生长发育中重要的营养代谢调控功能。组织蛋白酶B作为重要的贝类幼虫营养调控酶类，对促进文蛤等贝类幼虫生长和发育，提高苗种繁育的稳定性和生产效益具有重要的应用潜力。

发明内容

本发明的目的是提供一种文蛤组织蛋白酶B基因及其编码蛋白和该基因体外重组表达的应用，本发明从文蛤中克隆到组织蛋白酶B，并对其进行原核重组及重组产物的活性鉴定，为进一步研究文蛤幼体生长发育机制提供基础，并为文蛤的苗种生产和进一步开发为饲料添加剂和医药产品奠定基础。

为实现上述目的，本发明采用的技术方案为：

利用构建cDNA文库，采用RACE技术以及体外重组表达等技术，从文蛤幼虫中克隆到组织蛋白酶B基因，cDNA(MmeCB)全长1647bp，编码框长为1014bp，3’非翻译区长624bp，发现组织蛋白酶B具有特有的封闭环序列，其对于该蛋白酶结合底物发挥外切酶活性具有重要作用，该基因在文蛤营养代谢方面发挥着重要作用。它具有SEQ ID NO.1所示的序列。

其编码的蛋白成熟肽具有SEQ ID NO.2所示的氨基酸序列，利用pGEX-4T-1表达载体在大肠杆菌BL21(DE3)重组表达了该蛋白，分子量为37.3kDa，等电点为5.50。表达产物对其特异性底物carbobenzoxy-l-arginyl-l-arginyl-7 -amino-4-trifluoromethylcoumarin(Z-Arg-Arg-AFC)有分解作用，其动力学参数Km，Vmax and kcat分别为6.11μM，0.0174μM·min^-1和277.57s^-1，kcat/Km值是45.4mM^-1·s^-1。组织蛋白酶包括2个结构域，其中L域由3个有规则的α螺旋组成，R域由C端6个延长的核苷酸链以反向平行形成β折叠，且不闭合。

本发明利用表达序列标签(EST)技术、cDNA末端快速扩增(RACE)技术从文蛤中克隆到组织蛋白酶B基因cDNA全长序列，通过PCR技术，扩增编码组织蛋白酶B成熟肽的基因片段并将其克隆到pGEX-4T-1表达载体中，在大肠杆菌BL21(DE3)实现体外重组表达。重组产物经GSTrap affinity columns纯化，并用凝血酶直接在柱子上切掉GST，获得MmeCB，对其特异性底物Z-Arg-Arg-AFC有分解作用，本发明可以为进一步研究文蛤幼体生长发育机制提供基础，并为文蛤的苗种繁育和饲料添加剂奠定基础，同时为进一步开发医药产品提供可能。

附图说明

图1：GSTrap FF柱纯化重组文蛤组织蛋白酶B，图中1：标准蛋白分子量，2：BSA(1mg/ml)，3：酶切后目的蛋白MmeCB；

图2：纯化的GST重组文蛤组织蛋白酶B酶切结果，图中1.Marker；2.酶切后的GST；3.酶切的重组文蛤组织蛋白B；

图3：双倒数作图法研究文蛤组织蛋白酶B的酶学活性，双倒数作图法求其动力学参数Km，Vmax and kcat分别为6.11μM，0.0174μM·min^-1和277.57s^-1.，kcat/Km值是45.4mM^-1s^-1。

具体实施方式

下面的实施例中将本发明作进一步阐述，但本发明不限于此。

实施例1.

一种克隆得到的文蛤组织蛋白酶B，具有SEQ ID NO.1所示的序列。本发明中的文蛤组织蛋白酶B的cDNA序列克隆包括下列步骤：

a)文蛤总RNA的提取及mRNA的纯化；

b)文蛤cDNA文库构建；

c)文蛤cDNA文库EST序列的规模测定；

d)文蛤EST序列的同源性分析及组织蛋白酶B基因片段的筛选；

e)RACE扩增获得文蛤组织蛋白酶B的全序列。

具体操作如下：

1.文蛤总RNA的提取及mRNA的纯化：利用Invitrogen公司的Trizol试剂从文蛤幼虫中中提取总RNA，利用QIAGENE公司的Oligotex mRNA纯化试剂盒纯化mRNA。

2.文蛤cDNA文库构建：利用Stratagene公司cDNA Synthesis Kit和

Synthesis Kit(Stratagene)进行cDNA的合成，双链cDNA经末端补平、EcoR I接头连接、EcoR I末端磷酸化、Xho I内切酶酶切后利用QIAGEN公司QIAEX II Agarose Gel Extraction Kit对大于100bp的酶切片段进行回收，与Invitrogen公司Uni-ZAP XR vector载体连接，利用Stratagene公司的

III Gold Cloning Kit试剂盒进行文库包装，利用Exassist Helper Phage和SOLR菌株从

XR Vector上体外切割pBluescript成为质粒文库。

3.文蛤cDNA文库EST序列的规模测定：文库中筛选阳性克隆，使用载体通用引物T3在MegaBACE1000测序仪上进行序列测定，将得到的原始峰图文件(*.abi，*.abd文件)数据经Phred程序处理转化为序列文件(*.seq)和质量文件(*.seq.qual)，依据质量文件提供的数值确定获得序列的误差概率，去除低质量的碱基，用cross-mach程序屏蔽数据中的载体序列，从得到的数据中选取连续碱基质量大于Q13(准确率大于95％)且长度大于100bp的序列作为EST数据，具体见《基因表达序列标签(EST)数据分析手册》(胡松年著，浙江大学出版社，2005年)。

4.文蛤EST序列的同源性分析及组织蛋白酶B基因片段的筛选：将获得的全部有效的EST数据进行聚类拼接，生成Contigs和Singletons，分别将所获的Contigs与Singletons在数据库中进行BLASTn和BLASTx分析，结果显示在EST序列中发现了与文昌鱼、北极虾和家蚕组织蛋白酶B相似性较高的序列，根据相似性分析结果确定了文蛤组织蛋白酶B基因的EST序列。

5.文蛤组织蛋白酶B基因cDNA全长序列的克隆：根据与组织蛋白酶B基因同源的EST序列设计特异性引物F1(5′GAGGACCCTACAACAGCC3′)和R1(5′ATCCCTGATGGCTGTTGTAG3′)，分别利用载体通用引物T3(5`ATTAACCCTCACTAAAGGGA 3`)和T7(5`TAATACGACTCACTATAGGG)进行3’和5’末端的扩增。PCR产物用1.0％琼脂糖凝胶电泳进行检测，用胶回收试剂盒(Promega，USA)进行PCR产物的回收和纯化，再与pMD-18T载体(大连宝生物工程有限公司)连接，然后转化大肠杆菌感受态细胞Top10，挑选阳性克隆用载体引物测序，所得结果经CLUSTER分析拼接，得到文蛤组织蛋白酶B基因cDNA全长序列见SEQ ID NO.1。

3’RACE扩增所用反应体系及反应条件：

25μl反应体系，包含：

扩增所用PCR反应程序：94℃变性4min，1个循环；94℃变性50s，54℃退火50s，72℃延伸1min，35个循环；72℃延伸10min，1个循环。

5’RACE扩增所用反应体系及反应条件：

25μl反应体系，包含：

扩增所用PCR反应程序：94℃变性4min，1个循环；94℃变性50s，54℃退火50s，72℃延伸1min，35个循环；72℃延伸10min，1个循环；4℃保温。

阳性克隆的PCR筛选条件为：

25μl反应体系，包含：

实施例2.

根据SEQ ID NO.1所示cDNA序列，设计含有限制性内切酶BamH I和Sal I酶切位点的特异性引物F2：(5′GCCGGATCCTACAGGTTCGACTTCCATG 3′)和R2(5′CGCGTCGAC TTATTCAAGAACCATCATTCC 3′)，通过PCR技术扩增编码组织蛋白酶B成熟肽的基因片段，反应在PTC-100中进行，反应条件为：94℃预变性5min；然后进行35循环包含94℃变性50s，54℃退火50s，72℃延伸50s；最后72℃延伸10min。然后将其克隆到pGEX-4T-1表达载体中，转化大肠杆菌BL21(DE3)，测序确认表达框与SEQ ID NO.1的序列一致，确认表达阅读框正确。接种阳性克隆到LB培养基中，37℃振荡培养至O.D.₆₀₀＝0.6-0.8，加入IPTG至终浓度为1mM诱导3h后离心收集菌体。菌体在冰浴条件下用超声波500W处理30min，每次1s，间隔2s。离心收集沉淀，用BuferA(50mmol/L Tris-HCl，5mmol/L乙二胺四乙酸，0.1％Triton X-100，pH 8.0)洗涤沉淀2次，再用Bufer B(50mmol/L Tris-HCI，5mmol/LEDTA，2mol/L urea，pH 8.0)洗涤2次，将洗涤后的沉淀溶于5mL BuferC(0.1mol/L Tris-HCl，10mmol/L二硫苏糖醇，8mol/L urea，pH 8.0)中，37℃快摇40min，用Bufer C将样品稀释到500μg/mL，在10倍体积透析液(0.1mol/L Tris-HCI，5mmol/L EDTA，5mmol/L Cysteine，pH8.0)中透析使蛋白质复性，中间换2次透析液。利用Amersham公司的GSTrap affinity columns纯化重组产物，获得纯化的GST-MmeCB融合蛋白如图1，经质谱鉴定，两段序列(SGGPLGGHAIK，DLPDTFDAR)与文蛤组织蛋白酶B的相应氨基酸序列一致，因此该重组蛋白为重组文蛤组织蛋白酶B(GST-MmeCB)，用凝血酶直接在柱子上酶切掉GST(4℃裂解过夜)，获得文蛤重组组织蛋白酶B(图2)，用于活性验证。

重组文蛤组织蛋白酶B的酶学活性验证：重组文蛤组织蛋白酶B，加入底物7-氨基-4-甲基香豆素(Z-Arg-Arg-AFC)，加入50μl反应缓冲液(Cathepsin B assay kit)，然后用双蒸水调至终体积为100μl，底物浓度在0.001--0.05mM之间。37℃孵育10min，加入1ml氯代乙酸钠(100mM，pH4.3)。F-4500荧光分光光度计在400nm激发波长下，505nm检测底物的荧光值。双倒数作图法求其动力学参数Km，Vmax and kcat分别为6.11μM，0.0174μM·min^-1和277.57s^-1.，kcat/Km值是45.4mM^-1s^-1(图3)。

本发明利用体外原核重组表达技术获得了重组的文蛤组织蛋白酶B，重组产物对其特异性底物有分解作用。本发明可以为进一步研究文蛤幼体生长发育机制提供基础，并为文蛤的苗种繁育和饲料添加剂奠定基础。

实施例3：

重组蛋白可提高文蛤幼虫的生长速度，为苗种生产中的营养调控和作为饲料添加剂研制提供基础。育苗生产中选取成熟的文蛤亲贝，放入28℃的海水中诱导排放。精子和卵子在水体中自然授精后，约20小时发育至D型幼虫。文蛤幼虫密度为5个/ml水体，海水温度为27℃，盐度为25。培育期间每日换水100％，投喂金藻2-5万细胞/ml水体。幼虫培育过程中水体中添加实施例2的表达产物重组组织蛋白酶B，能够有效促进文蛤幼虫的生长。

组织蛋白酶

SEQUENCE LISTING

<110>中国科学院海洋研究所

<120>文蛤组织蛋白酶B基因及编码蛋白和应用

<130>

<160>2

<170>PatentIn version 3.5

<210>1

<211>1647

<212>DNA

<213>文蛤(Meretrix Meretrix)

<220>

<221>CDS

<222>(55)..(1023)

<400>1

cagttcaaca tgaaggcatt actggtgctg gtgtttgttg gtgcagcctg gagt tac 57

Tyr

1

agg ttc gac ttc cat gat gac tac ttc agt gag gct ttt gta aac tac 105

Arg Phe Asp Phe His Asp Asp Tyr Phe Ser Glu Ala Phe Val Asn Tyr

5 10 15

cac aac agt cgg gat gac gtg tcc tgg aag gct act act gag aac ttc 153

His Asn Ser Arg Asp Asp Val Ser Trp Lys Ala Thr Thr Glu Asn Phe

20 25 30

aag aat gtg cca tac aag ggt agg atg gac tat gtc aag agt cta tgt 201

Lys Asn Val Pro Tyr Lys Gly Arg Met Asp Tyr Val Lys Ser Leu Cys

35 40 45

ggt gcc aat cct gct cct cca gag atg aaa ttc cct gtc aag gag att 249

Gly Ala Asn Pro Ala Pro Pro Glu Met Lys Phe Pro Val Lys Glu Ile

50 55 60 65

gaa gta ccc aag gat cta cct gat acc ttt gat gct cgt acc cag tgg 297

Glu Val Pro Lys Asp Leu Pro Asp Thr Phe Asp Ala Arg Thr Gln Trp

70 75 80

cca gac tgc ccc tct ctg aaa gaa gtt agg gat cag gga gcc tgt gga 345

Pro Asp Cys Pro Ser Leu Lys Glu Val Arg Asp Gln Gly Ala Cys Gly

85 90 95

tca tgc tgg gca ttt ggt tgt gtt gag gct gcc act gac aga ctg tgt 393

Ser Cys Trp Ala Phe Gly Cys Val Glu Ala Ala Thr Asp Arg Leu Cys

100 105 110

ata cag agc aag gga ata gta aat gca cat ctg tcg gct gaa gat ctt 441

Ile Gln Ser Lys Gly Ile Val Asn Ala His Leu Ser Ala Glu Asp Leu

115 120 125

acc tca tgt tgt cgt acc tgt gga aat ggt tgt aat ggt ggt ttc cta 489

Thr Ser Cys Cys Arg Thr Cys Gly Asn Gly Cys Asn Gly Gly Phe Leu

130 135 140 145

gag gga gct tgg aat tac ctg aaa agg gac ggt att gtt aca gga gga 537

Glu Gly Ala Trp Asn Tyr Leu Lys Arg Asp Gly Ile Val Thr Gly Gly

150 155 160

ccc tac aac agc cat cag gga tgt ctt cca tac gaa atc aaa gcc tgt 585

Pro Tyr Asn Ser His Gln Gly Cys Leu Pro Tyr Glu Ile Lys Ala Cys

165 170 175

gat cac cat gtc gtt ggg aaa ctt cag cca tgc aaa gga gat gga cct 633

Asp His His Val Val Gly Lys Leu Gln Pro Cys Lys Gly Asp Gly Pro

180 185 190

aca cca agg tgt aag aaa gag tgt gaa tct gga tat aac aat acc tac 681

Thr Pro Arg Cys Lys Lys Glu Cys Glu Ser Gly Tyr Asn Asn Thr Tyr

195 200 205

agt aag gac gaa cat cat gca aaa aca gta cac gct gtt gaa gga gta 729

Ser Lys Asp Glu His His Ala Lys Thr Val His Ala Val Glu Gly Val

210 215 220 225

gaa cag att atg aca gaa att atg aca aat ggc cct gtg gag gca gct 777

Glu Gln Ile Met Thr Glu Ile Met Thr Asn Gly Pro Val Glu Ala Ala

230 235 240

ttt acc gtt tac tca gat ttc cca act tac aag tca ggc gtc tac gag 825

Phe Thr Val Tyr Ser Asp Phe Pro Thr Tyr Lys Ser Gly Val Tyr Glu

245 250 255

cac aaa tca ggt ggt ccc ctc gga ggc cat gcc atc aag act ctc ggc 873

His Lys Ser Gly Gly Pro Leu Gly Gly His Ala Ile Lys Thr Leu Gly

260 265 270

tgg gga aat gaa gac ggc aaa gat tat tgg ctt gtt gcc aac tcc tgg 921

Trp Gly Asn Glu Asp Gly Lys Asp Tyr Trp Leu Val Ala Asn Ser Trp

275 280 285

aac ccc gac tgg gga gat aac ggt ttc ttc aag atc ctt cgt gga cga 969

Asn Pro Asp Trp Gly Asp Asn Gly Phe Phe Lys Ile Leu Arg Gly Arg

290 295 300 305

gat gag tgt ggt att gag tcc aac att gtc gct gga atg atg gtt ctt 1017

Asp Glu Cys Gly Ile Glu Ser Asn Ile Val Ala Gly Met Met Val Leu

310 315 320

gaa taa ctttgtaaaa aaaccatgtg atcatttaaa cattccttat tgaaaaaaga 1073

Glu

gtttattttt tcaaatattt aatcaaaaag accagatgat aaaaatttat gcttttttaa 1133

acaacgaata tgtatataat gaaacgtatc tcaagttttg ctcagattgt gaccaaaaaa 1193

agattgtaaa tagactattt ttctacatca gaagaaagct ttttctttct tgctttgtgt 1253

aaatcctgcc ttaggacctg ctaacacaat ctactcaaaa tatatctcct gtagcctaac 1313

acttatagtt tctggactat aaaactgaaa agcgtatctg tgagacattt gtacatagta 1373

aactttgagt cgactttcca ctgtaatccg taatcctgag gagactttat gatttaggta 1433

attacattag agcatgattc tgcggagcca tatgtaacag tattggcttt cacccttctc 1493

tgcctattaa ataattttct gacttatatc tcgaaagcaa acattctgat atatttctcc 1553

atgaaaaaaa atcttcatca ttcgaattgt gttggttaat ctattgaaaa aaaatgagag 1613

caataaattt atttttgtac aaaaaaaaaa aaaa 1647

<210>2

<211>322

<212>PRT

<213>文蛤(Meretrix Meretrix)

<400>2

Tyr Arg Phe Asp Phe His Asp Asp Tyr Phe Ser Glu Ala Phe Val Asn

1 5 10 15

Tyr His Asn Ser Arg Asp Asp Val Ser Trp Lys Ala Thr Thr Glu Asn

20 25 30

Phe Lys Asn Val Pro Tyr Lys Gly Arg Met Asp Tyr Val Lys Ser Leu

35 40 45

Cys Gly Ala Asn Pro Ala Pro Pro Glu Met Lys Phe Pro Val Lys Glu

50 55 60

Ile Glu Val Pro Lys Asp Leu Pro Asp Thr Phe Asp Ala Arg Thr Gln

65 70 75 80

Trp Pro Asp Cys Pro Ser Leu Lys Glu Val Arg Asp Gln Gly Ala Cys

85 90 95

Gly Ser Cys Trp Ala Phe Gly Cys Val Glu Ala Ala Thr Asp Arg Leu

100 105 110

Cys Ile Gln Ser Lys Gly Ile Val Asn Ala His Leu Ser Ala Glu Asp

115 120 125

Leu Thr Ser Cys Cys Arg Thr Cys Gly Asn Gly Cys Asn Gly Gly Phe

130 135 140

Leu Glu Gly Ala Trp Asn Tyr Leu Lys Arg Asp Gly Ile Val Thr Gly

145 150 155 160

Gly Pro Tyr Asn Ser His Gln Gly Cys Leu Pro Tyr GluIle Lys Ala

165 170 175

Cys Asp His His Val Val Gly Lys Leu Gln Pro Cys Lys Gly Asp Gly

180 185 190

Pro Thr Pro Arg Cys Lys Lys Glu Cys Glu Ser Gly Tyr Asn Asn Thr

195 200 205

Tyr Ser Lys Asp Glu His His Ala Lys Thr Val His Ala Val Glu Gly

210 215 220

Val Glu Gln Ile Met Thr Glu Ile Met Thr Asn Gly Pro Val Glu Ala

225 230 235 240

Ala Phe Thr Val Tyr Ser Asp Phe Pro Thr Tyr Lys Ser Gly Val Tyr

245 250 255

Glu His Lys Ser Gly Gly Pro Leu Gly Gly His Ala Ile Lys Thr Leu

260 265 270

Gly Trp Gly Asn Glu Asp Gly Lys Asp Tyr Trp Leu Val Ala Asn Ser

275 280 285

Trp Asn Pro Asp Trp Gly Asp Asn Gly Phe Phe Lys Ile Leu Arg Gly

290 295 300

Arg Asp Glu Cys Gly Ile Glu Ser Asn Ile Val Ala Gly Met Met Val

305 310 315 320

Leu Glu

Claims

1.文蛤组织蛋白酶B基因，其特征在于：具有序列表SEDIQ No.1中的碱基序列。

2.一种要求1所述的文蛤组织蛋白酶B基因编码的蛋白，其特征在于：具有序列表SEDIQ No.2中氨基酸序列。

3.一种权利要求1所述文蛤组织蛋白酶B基因的应用，其特征在于：文蛤组织蛋白酶B基因的重组表达产物在贝类幼虫生长发育促进剂、饲料添加剂以及贝类苗种生产中的应用。