CN1313609C - 一种纤维素酶及其编码基因与应用 - Google Patents

一种纤维素酶及其编码基因与应用 Download PDF

Info

Publication number
CN1313609C
CN1313609C CNB2005101091013A CN200510109101A CN1313609C CN 1313609 C CN1313609 C CN 1313609C CN B2005101091013 A CNB2005101091013 A CN B2005101091013A CN 200510109101 A CN200510109101 A CN 200510109101A CN 1313609 C CN1313609 C CN 1313609C
Authority
CN
China
Prior art keywords
cellulase
dna
sequence
ala
gly
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CNB2005101091013A
Other languages
English (en)
Other versions
CN1772888A (zh
Inventor
冯家勋
段承杰
靳振江
许跃强
庞浩
张鹏
封毅
唐纪良
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Guangxi University
Original Assignee
Guangxi University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Guangxi University filed Critical Guangxi University
Priority to CNB2005101091013A priority Critical patent/CN1313609C/zh
Publication of CN1772888A publication Critical patent/CN1772888A/zh
Application granted granted Critical
Publication of CN1313609C publication Critical patent/CN1313609C/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明公开了一种纤维素酶及其编码基因与应用。本发明提供的一种纤维素酶,是具有下述氨基酸残基序列之一的蛋白质:1)序列表中的SEQ ID №:2;2)将序列表中SEQ ID №:2的氨基酸残基序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有纤维素酶活性的蛋白质。本发明的纤维素酶及其编码基因在纤维素的降解中具有广泛的用途。

Description

一种纤维素酶及其编码基因与应用
技术领域
本发明涉及一种纤维素酶及其编码基因与应用。
背景技术
纤维素主要是植物利用二氧化碳和水在太阳能作用下通过光合作用合成的地球上最丰富的可再生的生物质(biomass)资源。据报道,全球每年通过光合作用产生的纤维素高达1.55×109吨,其中89%尚未被人类利用(Dunlap C,Chiang GC.Utilization and recycle of agriculture wastes and residues.Shuler M L.BocaRaton,Florida.USA:CRC Press Inc.1980.19)。纤维素是多个葡萄糖残基以β-1,4-糖苷键连接而成的多聚物,其基本重复单位为纤维二糖。天然纤维素的基本结构是由原纤维构成的微纤维束集合而成。原纤维是由15-40根有结晶区和非结晶区构成的纤维素分子长链所组成。纤维素的结晶部分是由纤维素分子进行非常整齐规划地折迭排列形成。在天然纤维素中,木质素和半纤维素形成牢固结合层,紧密地包围纤维素。纤维素酶是能将纤维素转化成葡萄糖的一系列酶的总称,包括三类酶即内切-β-1,4-葡聚糖酶(endo-β-1,4-glucanase,EC 3.2.1.4)、外切葡聚糖酶(exoglucanase,又叫纤维二糖水解酶cellobiohydrolase,EC3.2.1.91)和β-葡萄糖苷酶(β-glucosidase,EC3.2.1.21),这三种酶协同作用能将纤维素转化成葡萄糖。内切葡聚糖酶作用于纤维素长链分子的内部将长纤维切成短纤维,外切葡聚糖酶作用于纤维素分子的一端,以两个葡萄糖残基为单位进行切割生成纤维二糖,β-葡萄糖苷酶切割纤维二糖生成葡萄糖(Tomme P,Warren R A J,Gilkes N R.1995.Cellulose hydrolysis by bacteria and fungi.Adv.Microbiol.Physiol.,37:1-81.1995;Bhat M K,Bhat S.1997.Cellulose degrading enzymes and their potentialindustrial applications.Biotechnology Advances,15:583-620)。葡萄糖可作为重要的工业原料生产酒精、丙酮等化工产品。纤维素的利用与转化对于解决世界能源危机、粮食和饲料短缺、环境污染等问题具有重要意义。纤维素酶可广泛应用于酿酒、饲料、食品、纺织、造纸等行业。如纤维素酶作为饲料添加剂可增加饲料的可消化性,减少排泄的粪便量。纤维素酶可取代浮石进行牛仔裤的“石洗”处理,也可处理其它含纤维织物以降低粗糙度和增加光亮。纤维素酶可添加到洗涤剂中以提高洗涤剂的清洁能力(Bhat M K.2000.Cellulases and related enzymes in biotechnology.Biotechnology Advances,18:355-383)。由于纤维素酶的广泛用途以及针对不同的用途需要使用不同性质的纤维素酶,更由于纤维素酶的效率低、价格高而使以纤维素为原料生产燃料酒精的成本太高以至于无法真正实现产业化,因此,需要新的纤维素酶。
纤维素酶属于糖基水解酶类(glycosyl hydrolases),许多糖基水解酶由一个催化功能域和一个或更多个其它的功能域如碳水化合物结合组件(carbohydrate-binding modules,CBMs)组成,根据催化功能域的氨基酸序列相似性,糖基水解酶类被划分成不同的家族(families)(Davies G.,Henrissat B.1995.Structures and mechanisms of glycosyl hydrolases.Structure 3:853-859;Henrissat B.1991.A classification of glycosyl hydrolases based on amino-acidsequence similarities.Biochem.J.280:309-316;Henrissat B.,Bairoch A.1993New families in the classification of glycosyl hydrolases based on amino-acidsequence similarities.Biochem.J.293:781-788;Henrissat B.,Bairoch A.1996.Updating the sequence-based classification of glycosyl hydrolases.Biochem.J.316:695-696)。根据Cazy服务器(server)(http://afmb.cnrs-mrs.fr/CAZY/)上所列糖基水解酶类的最新清单,目前糖基水解酶类有100个家族,纤维素酶分属于糖基水解酶类家族1、3、5、6、7、8、9、10、12、26、44、45、48、51、61、74。将未知的纤维素酶与已知的纤维素酶做序列同源性比较可对其进行分类。
目前除Rees等(Rees HC,Grant S,Jones B,Grant WD,Heaphy S.2003.Detectingcellulase and esterase enzyme activities encoded by novel genes present inenvironmental DNA libraries.Extremophiles.7(5):415-421)报道从湖水和湖床沉积物未培养微生物中克隆到2个纤维素酶基因CRATCEL和HKCEL以及Voget等(Voget S,Leggewie C,Uesbeck A,Raasch C,Jaeger KE,Streit WR.2003.Prospecting for novel biocatalysts in a soil metagenome. Appl EnvironMicrobiol.,69(10):6235-6242)报道从土壤未培养微生物中克隆到2个纤维素酶基因gnuB和uvsO80外,人类所克隆的所有其它纤维素酶基因都是从人类所培养的微生物中来的,但并不是自然界中所有微生物都是可以被分离、培养的,一般认为可培养的微生物种类只占自然界中微生物种类的1%(Amann R I,Ludwig W,Schleifer K H.1995.Phylogenetic identification and in situ detection of individualmicrobial cells without cultivation.Microbiol.Rev.59:143-169),那么剩余的99%的不可培养的微生物中蕴藏着大量的基因资源。近年来从环境样品未培养微生物提取基因组DNA然后构建混合基因组DNA文库以分离基因已是成熟技术(LorenzP,Schleper C.2002.Metagenome-a challenging source of enzyme discovery.Journal of Molecular Catalysis B:Enzymatic 19-20:13-19)。由于造纸厂土壤富含大量纸浆,是纤维素被活跃降解的地方,有大量的微生物在进行纤维素、半纤维素、果胶物质等的分解,但这些分解性的微生物只有极少部分已被培养,还有极大部分未被培养。可以推测这些未培养微生物中一定含有大量的基因资源如纤维素酶基因资源,其中很可能有些就是优于目前所发现的最好的纤维素酶的高效酶的基因。通过构建土壤未培养微生物的宏基因组DNA文库,极有可能从中筛选得到比目前已知的最好的纤维素酶还要好的酶的基因。
发明内容
本发明的目的是提供一种纤维素酶及其编码基因与应用。
本发明所提供的纤维素酶,名称为Umcel6A,来源于土壤未培养细菌,是具有下述氨基酸残基序列之一的蛋白质:
1)序列表中的SEQ ID №:2;
2)将序列表中SEQ ID №:2的氨基酸残基序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有纤维素酶活性的蛋白质。
其中,序列表中的序列2由465个氨基酸残基组成。自N端的第26-48位氨基酸为跨膜功能域(transmembrane domain),自N端的第59-331位氨基酸为家族6糖基水解酶(glycosyl hydrolase)功能域,自N端的第371-463位氨基酸为碳水化合物结合组件(carbohydrate-binding modules,CBMs)。和Umcel6A催化功能域同源性最高的为嗜高温放线菌(Thermobifida fusca)的β-1,4-纤维二糖水解酶A(1,4-β-D-glucan cellobiohydrolase A)(GenBank索引号23018004)的同源性最高,两者的相似性为54%、相同性为41%。
所述一个或几个氨基酸残基的取代和/或缺失和/或添加是指不多于十个氨基酸残基的取代和/或缺失和/或添加。
上述纤维素酶编码基因(umcel6A)也属于本发明的保护范围。
上述纤维素酶的基因组基因,可具有下述核苷酸序列之一:
1)序列表中SEQ ID №:1的DNA序列;
2)编码序列表中SEQ ID №:2蛋白质序列的多核苷酸;
3)在高严谨条件下可与序列表中SEQ ID №:1限定的DNA序列杂交的核苷酸序列。
上述高严谨条件可为在0.1×SSPE(或0.1×SSC),0.1%SDS的溶液中,在65℃下杂交并洗膜。
其中,序列表中的SEQ ID №:1由1526个脱氧核苷酸组成,自5’端的第57至1454位核苷酸为umcel6A的开放阅读框(Open Reading Frame,ORF),自5’端的第57至59位核苷酸为umcel6A基因的起始密码子ATG,自5’端的第1452至1454位核苷酸为umcel6A基因的终止密码子TGA。
含有本发明基因的表达载体、细胞系及宿主菌均属于本发明的保护范围。
本发明通过构建土壤未培养微生物的宏基因组DNA文库和文库克隆的纤维素酶活性平板检测筛选法,得到了新的纤维素酶基因,可在宿主细胞中大量表达该基因以生产该纤维素酶,用于纤维素的降解。本发明所提供新的纤维素酶及其编码基因在纤维素的降解中具有广泛的用途。
附图说明
图1为从土壤样品中提取的未培养微生物的宏基因组DNA。
图2为土壤未培养微生物基因文库克隆的限制性内切酶BamHI酶切分析图。
图3为土壤未培养微生物基因文库克隆的筛选,阳性克隆EPI100/pGXNL2所在的平板图。
图4为能降解羧甲基纤维素的文库克隆质粒pGXNL2的BamHI酶切带型。
图5为初筛获得的重组质粒pGXNL2转化大肠杆菌后得到的转化子能降解羧甲基纤维素(右),而空载体pWEB::TNC转化大肠杆菌后得到的转化子不能降解羧甲基纤维素(左)。
图6为umcel6A基因部分DNA序列的PCR扩增结果。
图7为pGXNumcel6A重组质粒经BamHI和HindIII双酶切后电泳图。
图8为重组大肠杆菌M15/pGXNumcel6A能降解羧甲基纤维素(右),而含有空载体的大肠杆菌M15/pQE30不能降解羧甲基纤维素(左)。
具体实施方式
下述实施例中的实验方法,如无特别说明,均为常规方法。
下述实施例中的百分含量,如无特别说明,均为质量百分含量。
在本发明的实施例中所用到的材料包括:大肠杆菌(Escherichia coli)株系EPI100(购自Epicentre公司);大肠杆菌(Escherichia coli)株系M15(购自QIAGEN公司);大肠杆菌E.coliXL1-blue(购自Stratagene公司);柯斯质粒载体pWEB::TNC(购自Epicentre公司);文库制备试剂盒(购自Epicentre公司,pWEB::TNC cosmidcloning kit,目录号WEBC931);克隆载体pBluescript M13(+)(购自Stratagene公司);表达载体pQE-30(购自QIAGEN公司);限制性内切酶、修饰酶及聚合酶等试剂(购自Promega、Stratagene、SIGMA、QIAGEN、MBI)。
实施例1、纤维素酶Umcel6A及其编码基因的获得
一、土壤未培养微生物宏基因组文库的构建
取50g造纸厂土壤,悬浮在100ml的0.18M磷酸钾缓冲液(pH7.2)中,充分混匀后在Beckman Coulter Avanti J-E离心机(购自Beckman Coulter公司,目录号369003)JA-10转头上用600g离心力离心10分钟,收集上清液,加入40ml PVPP(聚乙烯聚吡咯烷酮,polyvinylpolypyrrolidone)溶液(购自Sigma公司,目录号P-6755)(PVPP溶液:每100mg PVPP与1ml 0.18M磷酸钾缓冲液(pH7.2)混匀),振荡30秒,再加入200μl 3M CaCl2溶液,振荡30秒后,600g离心力离心5分钟,收集上清液于另一个离心管中。再用同样的离心机、转头用8000g离心力离心15分钟收集上清液中的细菌细胞。将收集到的菌体充分悬浮在1ml TE(10mM Tris/HCl,pH8.0,1mM EDTA,pH8.0)溶液中,加入100μl溶菌酶(20mg/ml,溶于TE溶液),在37℃下作用30分钟,在Eppendorf 5417C离心机(购自Eppendorf公司,目录号19718)上以10000g离心1分钟以沉淀细胞,再将细胞充分悬浮在600μl PUREGENE公司的基因组DNA纯化试剂盒(Genomic DNA Purification Kit,目录号R-5500A)的细胞裂解缓冲液(Cell LysisSolution)中,置80℃水浴锅5分钟以裂解细胞,待样品冷却到室温后,加入200μl上述试剂盒中的蛋白质沉淀溶液(Protein Precipitation Solution),充分混匀后13000g离心3分钟,将上清液转移到一个新的1.5ml微量离心管中,加入600μl 100%异丙醇,充分混匀后即见DNA絮状沉淀析出,挑出DNA絮状沉淀,用70%乙醇洗2次DNA,干燥后将DNA溶于500μl TE溶液即得DNA粗提物。
将DNA粗提物加到含有Sephadex G200(购自Pharmacia公司,目录号17-0080-01)和2%PVPP(购自Sigma公司,目录号P-6755)的层析柱(200mm×10mm)上,用TE缓冲液洗脱,按每组分1ml分部收集洗脱液,每一组分加入100μl的3M醋酸钠溶液(pH4.8)及1ml异丙醇沉淀DNA,把沉淀物溶于TE中,合并所得DNA溶液,0.7%琼脂糖凝胶电泳后切下含30kb以上的DNA的凝胶,用电洗脱法回收纯化DNA,回收纯化的DNA如图1,其中泳道1为λDNA(48.5kb);泳道2为λDNA用EcoRI酶切(片段大小从大到小依次为:21.2kb,7.4kb,5.8kb,5.6kb,4.9kb,3.5kb);泳道3为从土壤中提取的DNA粗提物;泳道4为经过Sephadex G-200凝胶初步纯化的DNA;泳道5为经过低熔点琼脂糖凝胶回收得到的30kb以上的DNA。为了用这些纯化的DNA制作基因文库,首先对这些DNA进行末端修补以产生平头末端而和文库制备试剂盒中已处理好的同样具平头末端的pWEB::TNC载体相连,依次在冰上向一个新的灭过菌的微量离心管中加入:6μl 10×末端修补缓冲液(330mM Tris-醋酸[pH7.8],660mM醋酸钾,100mM醋酸镁,5mM DTT),6μl 2.5mM dNTP混合物(每种2.5mM),6μl 10mM ATP,40μl 30kb以上的DNA(0.2μg/μl),2μl末端修补酶混合物(T1 DNA聚合酶和T4多聚核苷酸激酶)。25℃下放置45分钟,再转移到70℃水浴锅放置10分钟以终止酶反应,1.0%低熔点琼脂糖凝胶电泳后切下含30kb-45kb的DNA的凝胶进行DNA回收,为了使回收片段与文库制备试剂盒中已处理好的具平头末端的载体在T4 DNA连接酶的作用下连接起来,依次在冰上向一个新的灭过菌的微量离心管中加入:12μl无菌水,2μl 10倍快速连接缓冲液(10×Fast-Link Ligation Buffer)(属购自Epicentre公司的文库制备试剂盒pWEB::TNC cosmid cloning kit(目录号WEBC931)的一个组分),1μl 10mM ATP,lμl pWEB::TNC载体(0.5μg),3μl低熔点琼脂糖凝胶回收的30kb-45kb的DNA(0.1μg/μl),1μl快速连接DNA连接酶(Fast-Link DNA Ligase,2单位/μl)(属购自Epicentre公司的文库制备试剂盒pWEB::TNC cosmid cloning kit(目录号WEBC931)的一个组分),混匀后在25℃下放置2个小时,再在70℃放置10分钟以终止酶反应。为了将连接反应产物用λ包装蛋白包装,将在冰上刚刚溶化的λ包装提取物(购自Epicentre公司的文库制备试剂盒pWEB::TNC cosmid cloning kit(目录号WEBC931)的一个组分)25μl立即转移到一个新的灭过菌的微量离心管中并快速置于冰上,再往其中加入10μl连接反应产物,充分混匀后置于30℃90分钟后,再往其中加入25μl溶化的λ包装提取物(属购自Epicentre公司的文库制备试剂盒pWEB::TNC cosmid cloning kit(目录号WEBC931)的一个组分),充分混匀后置于30℃ 90分钟,向其中加入500μl噬菌体稀释缓冲液(10mM Tris-HCl[pH 8.3],100mM NaCl,10mM MgCl2),再将该560μl包装反应产物加入到5.6mL的OD600=1.0的宿主大肠杆菌EPI100培养液(培养基为LB[每升含胰蛋白胨(Oxoid),10g;酵母浸出粉(Difco),5g;NaCl,5g;pH7.0]+10mM MgSO4)中,25℃下放置20分钟让上述得到的包装的λ噬菌体吸附和侵染宿主细胞E.coliEPI100,在含氨苄青霉素(100μg/mL)的LA平板(LA培养基配方为[每升含胰蛋白胨(Oxoid),10g;酵母浸出粉(Difco),5g;NaCl,5g;琼脂粉,15g]pH7.0)上筛选转化子。结果共获得约15,000个转化子,任意提取14个克隆的质粒DNA,限制性内切酶BamHI酶切后用0.7%琼脂糖凝胶进行电泳分析,结果所有质粒除都有一个5.8kb的载体片段外,都含有插入片段,且没有发现有两个质粒具有相同的酶切带型,酶切结果如图2所示,其中泳道1为λDNA用EcoRI酶切片段(片段大小从大到小依次为:21.2kb,7.4kb,5.8kb,5.6kb,4.9kb,3.5kb);泳道2为1kb ladder(片段大小从大到小依次为:10.0kb,8.0kb,6.0kb,5.0kb,4.0kb,3.5kb,3.0kb,2.5kb,2.0kb,1.5kb);其它泳道分别为使用限制性内切酶BamHI酶切的文库克隆质粒。结果表明文库含有非常随机的插入DNA片段,插入片段最大的为45kb,最小的为23kb,平均大小为36kb。说明文库的克隆容量也是相当大的,文库的质量相当好。
二、从土壤未培养微生物的宏基因组文库中筛选表达纤维素酶活性的克隆
用平板影印法将含氨苄青霉素的LA平板上得到的转化子(每平板约200个菌落左右)分别影印到含0.5%羧甲基纤维素(carboxylmethylcellulose,CMC)(购自Sigma公司,目录号C-5678)的LA平板、含氨苄青霉素(100μg/mL)的LA平板上,将平板倒置于37℃培养箱培养24小时后,将长满菌落的含氨苄青霉素的LA平板置于4℃冰箱保存,将长满菌落的含羧甲基纤维素的LA平板用0.5%刚果红溶液染色15分钟,用1M的NaCl溶液脱色15分钟,然后检测菌落周围有无水解圈,结果如图3所示,箭头所指的菌落为周围有水解圈的克隆。表明筛选到1个菌落周围有水解圈的克隆(EPI100/pGXNL2),进一步提取该克隆的质粒DNA并将其命名为pGXNL2,用限制性内切酶BamHI完全酶切pGXNL2后,进行0.7%琼脂糖凝胶电泳分析,结果如图4所示,pGXNL2除有一个5.8kb的载体片段外,还有另外5条BamHI片段,大小分别为17.0kb,14.5kb,8.2kb,4.2kb,1kb,结果表明pGXNL2含有45.2kb的插入片段。其中,泳道1为λ用EcoRI酶切后的片段(片段大小从大到小依次为:21.2kb,7.4kb,5.8kb,5.6kb,4.9kb,3.5kb);泳道2为1kb ladder(片段大小从大到小依次为:10.0kb,8.0kb,6.0kb,5.0kb,4.0kb,3.5kb,3.0kb,2.5kb,2.0kb,1.5kb);泳道3为pGXNL2/BamHI(从上至下分别为17.0kb,14.5kb,8.2kb,5.8kb,4.2kb,1kb)。为了证实pGXNL2的插入片段确实含有纤维素酶基因,用pGXNL2质粒DNA和空载体pWEB::TNC分别转化E.coli EPI100,在含氨苄青霉素(100μg/mL)的LA平板上筛选转化子,随机挑取由每个质粒转化得到的10个转化子点接到含0.5%羧甲基纤维素的LA平板上,37℃培养24小时后,用0.5%刚果红溶液染色15分钟,用1M的NaCl溶液脱色,然后观察菌落周围有无水解圈,结果表明所有10个由空载体pWEB::TNC转化得到的转化子周围都没有水解圈,所有10个由pGXNL2转化得到的转化子周围都有水解圈,其中一个转化子的检测结果如图5所示。结果表明重组质粒pGXNL2的插入片段上确实含有纤维素酶基因。
为了测定重组质粒pGXNL2上纤维素酶基因的DNA序列,采用亚克隆的方法对该基因进行定位。先后使用限制性内切酶BamHI、EcoRI及KpnI对重组质粒pGXNL2酶切:第一步,对pGXNL2用BamHI进行完全酶切,把酶切的产物抽提沉淀,然后使用T4 DNA ligase(购自Promega公司)连接,连接产物转化E.coli EPI100,在含0.5%羧甲基纤维素的LA平板上筛选菌落周围有水解圈的转化子,提取质粒并使用BamHI酶切,结果表明含有14kb外源DNA片段的转化子菌落周围有水解圈,把只含有5.8kb载体带和一条14kb外源带的质粒命名为pGXNB2;第二步,对pGXNB2用EcoRI进行完全酶切,用0.7%的琼脂糖凝胶电泳分析,发现由4条带组成:9.5kb和5kb的外源带,载体pWEB::TNC被切成3kb和2.8kb两条带。同样抽提沉淀,连接,转化E.coli EPI100,在含0.5%羧甲基纤维素的LA平板上筛选菌落周围有水解圈的转化子(同第一步),提取质粒并使用EcoRI酶切,含有9.5kb外源DNA片段的转化子菌落周围有水解圈。把只含有3kb载体带和一条9.5kb外源带的质粒命名为pGXNE1;第三步,对pGXNE1用EcoRI和KpnI双酶切,分别得到一条8kb和一条1.5kb的外源片段。将回收的8kb和1.5kb的DNA片段分别与用EcoRI和KpnI双酶切的克隆载体pBluescriptM13(+)连接,将得到的两个连接产物分别转入E.coli EPI100后,发现含1.5kb外源片段的转化子在含0.5%羧甲基纤维素的LA平板上周围有水解圈,将含1.5kb DNA片段的重组质粒命名为pGXN1500。最终将靶基因定位在用EcoRI和KpnI酶切pGXNE1得到的1.5kb的外源DNA片段上。将含有pBluescripM13(+)与1.5kb外源的重组质粒pGXN1500寄送大连宝生物工程公司采用双脱氧核苷酸法对该基因进行双向双链测序。用软件DNAStar(DNASTAR公司,版本5)对序列进行拼接,用NCBI(National Centerfor Biotechnology Information,http://www.ncbi.nlm.nih.gov)上的软件对DNA序列进行分析,如Blast(http://www.ncbi.nlm.nih.gov/BLAST)。得到纤维素酶的编码基因,该基因具有序列表中序列1的DNA序列,命名为umcel6A。序列表中序列1的DNA自5’端的第57-1454位核苷酸为基因umcel6A的开放阅读框(open readingframe,ORF),由1398个核苷酸组成,自5’端的第57-59位核苷酸为umcel6A基因的起始密码子ATG,自5’端的第1452-1454位核苷酸为umcel6A基因的终止密码子TGA。
纤维素酶基因umcel6A编码一个含465个氨基酸的蛋白质Umcel6A,用DNAStar软件预测该蛋白质的理论分子量大小为48,026.38道尔顿,等电点pI为3.98。用简单组件结构研究工具(Simple Modular Architecture Research Tool,SMART,http://smart.embl-heidelberg.de)分析纤维素酶Umcel6A的组件结构,结果是自N端的第26-48位氨基酸为跨膜功能域(transmembrane domain),自N端的第59-331位氨基酸为家族6糖基水解酶(glycosyl hydrolase)功能域,自N端的第371-463位氨基酸为碳水化合物结合组件(carbohydrate-binding modules,CBMs)。和Umcel6A催化功能域同源性最高的为嗜高温放线菌(Thermobifida fusca)的-1,4-纤维二糖水解酶A(1,4-β-D-glucan cellobiohydrolase A)(GenBank索引号23018004)的同源性最高,两者的相似性为54%、相同性为41%。
实施例2、umcel6A在大肠杆菌中的表达
1、umcel6A的开放阅读框(open reading frame,ORF)及蛋白质结构预测
使用NCBI上的ORF Finder(Open reading frame finder)对测序所获得DNA序列(序列表中的SEQ ID №:1,由1526个脱氧核苷酸组成)上可能存在的ORF进行预测,结果显示自5’端的第57至1454位核苷酸为umcel6A的开放阅读框(OpenReading Frame,ORF),自5’端的第57至59位核苷酸为umcel6A基因的起始密码子ATG,自5’端的第1452至1454位核苷酸为umcel6A基因的终止密码子TGA,纤维素酶基因umcel6A的开放阅读框全长为1.398kb,可编码465个氨基酸。使用DNAStar软件预测该蛋白质的理论分子量大小为48,026.38道尔顿,等电点pI为3.98。用简单组件结构研究工具(Simple Modular Architecture Research Tool,SMART,http://smart.embl-heidelberg.de)分析纤维素酶Umcel6A的组件结构,结果是自N端的第26-48位氨基酸为跨膜功能域(transmembrane domain),自N端的第59-331位氨基酸为家族6糖基水解酶(glycosyl hydrolase)功能域,自N端的第371-463位氨基酸为碳水化合物结合组件(carbohydrate-binding modules,CBMs)。
2、扩增umcel6A基因的PCR引物设计
带有跨膜功能域的基因在体内表达后很有可能将表达产物分泌到细胞外。为避免表达产物分泌到细胞外,只需要扩增umcel6A基因的自5′端第201位碱基到终止密码子间的序列,即umcel6A基因中除编码跨膜功能域外的DNA序列(序列1的自5′端第201位至1454位碱基),共1254bp,预计所扩增片段编码蛋白的分子量为43.176KDa,等电点pI为3.794。结合载体pQE-30上的多克隆位点,用Vector NTI软件搜索基因上的有关酶切位点,设计引物。在正向引物GX1500F2和反向引物GX1500R1的5’端的分别加上BamHI和HindIII酶切位点(GX1500F2和GX1500R1中带下划线的字母)。预计PCR反应将特异地扩增出一条大约为1254bp的DNA条带。扩增基因的PCR正向引物和反向引物分别为:
GX1500F2:5’  ACT GGATCCACGGCGTCCGCCCAAGGC 3’
GX1500R1:5’  CGT AAGCTTTCAGGCGCTGCACTCCACTGT 3’
3、umcel6A基因的PCR扩增
用pGXN1500(实施例1中制备,是载体pBluescriptM13(+)克隆有含umcel6A基因的1.5kb DNA片段的重组质粒)作模板,以GX1500F2和GX1500R1为正反向引物作PCR扩增反应。反应体系为:模板:10ng,1μl正向引物(10pmol/μl),1μl反向引物(10pmol/μl),dNTP:0.25mM,pfu buffer 2.5μl,pfu polymerase:0.4unit(购自MBI公司),加ddH2O至25μl。PCR反应程序为:第一阶段预变性95℃,5min;第二阶段变性95℃,30sec;退火55℃,30sec;延伸72℃,2min,共30个循环。第三阶段延伸,72℃延伸10分钟。PCR反应特异地扩增出一条为1254bp DNA条带,结果附图6。其中泳道1为1kb ladder(片段大小从大到小依次为:10.0kb,8.0kb,6.0kb,5.0kb,4.0kb,3.5kb,3.0kb,2.5kb,2.0kb,1.5kb);泳道2为PCR反应特异地扩增出的一条1254bp的DNA条带。将PCR产物纯化后经BamHI和HindIII分别酶切后,然后进行琼脂糖凝胶电泳分离片段,用电洗脱法回收双酶切后PCR产物。
4.pGXNumcel6A重组质粒的构建及鉴定
将双酶切后的PCR产物和同样双酶切后的载体pQE-30,用T4 DNA连接酶16℃连接过夜,连接产物转化E.coli XL1-blue,提取重组质粒进行酶切鉴定。图7是重组质粒的酶切电泳图谱,可以看到重组质粒经BamHI和HindIII双酶切后释放出一条3.4kb的载体带和一条与PCR产物同样大小1.254kb的外源插入片段。泳道1为1kbladder(片段大小从大到小依次为:10.0kb,8.0kb,6.0kb,5.0kb,4.0kb,3.5kb,3.0kb,2.5kb,2.0kb,1.5kb);泳道2为重组质粒经BamHI和HindIII双酶切后结果。把该重组质粒命名为pGXNumcel6A。
5.umcel6A基因在E.coli M15中的表达
把pGXNumcel6A转化至E.coli M15中得到转化子M15/pGXNumcel6A,挑取M15/pGXNumcel6A单菌落于LA平板上(含氨苄青霉素25μg/mL,卡那霉素25μg/ml,IPTG1.0mmol/L),同时用M15/pQE30(转入pQE30的E.coli M15)作为空白对照,37℃培养24小时。菌体经氯仿破壁后用0.5%刚果红溶液染色15分钟,用1mol/L的NaCl溶液脱色,然后观察菌落周围有无水解圈。附图8结果显示重组菌M15/pGXNumcel6A周围有水解圈,而空白对照M15/pQE30周围无水解圈,说明靶基因在E.coli M15中已经高效表达出了有纤维素降解活性的蛋白质产物。
序列表
<160>2
<210>1
<211>1526
<212>DNA
<213>未知
<220>
<223>
<400>1
gaattcgacg ccccctgtcg acatccttca gtggtagcgc taccatcaat atatcgatgt    60
atgtgaattt caccgctcgc atcggtggag tcgacaccac gaaggagcaa ctcgtgaatc    120
gaagaaagag actcgcggcg atcgccgcgg cggcgggcgc cgcgggattg gccgcggcca    180
ccgcgctcct gctggcccct acggcgtccg cccaaggcga gagcctgtgg gccgacccca    240
ctacccaggc ggccgagtgg gccgccgaga acccgaacga ctaccgggcc gaactcatcg    300
gcgagcgcat cgggcagacc ccggcgggcg tctggttcac ccagcacaac ccggtcggcg    360
gcatccaggc gcaggtcgcg aacgtcgtat cggccgccgc cgctgacggc gacacgccga    420
tcatggtcgt ctacaacatc cccgaccgcg actgcggcgg ccactccggc ggcggcgccc    480
ccagccacag cgcctaccgc gactggatcg accagttcgc cgccggcctc tcgggcccgg    540
cctacatcat cctcgaaccc gacaccctcc cgcacaactg cgccgacccc gccgagcgca    600
accagtcgct cacccacgcg gtccaggcgc tcaagtccgc ctcctcgcag gcccgcgtct    660
acctcgacat cggcaactcc gcctggctcg agcccggcga ggcggccagc cgcctccagg    720
gcgccggcat ccagtacgcc gacggcttcg cgatcaacgt ctccaactac cgcaccaccc    780
aggaggcgac ctcctacgcc caccagatcc agaacgtcgt cggctccgac aagggcgcgg    840
tgatcgacac cagccgcaac ggcaacgggc cgctcgaccc gcccgacccc aacgactggt    900
gcgacccgcc cggccgcgcc atcggggact acccgaccac ctcgaccggc gtgagcggca    960
tcgacgccta cctgtgggtc aagctccccg gcgaggccga cggctgcgcc ggctcggccg    1020
gccagttcat ccccgacctg gcctatgagc tcgccaacaa cgccggggcc gactggcccg    1080
gcgacgtccc ggtcgacccg accgacccga ccaccgaccc cgacgacccg accaccgacc    1140
ccgggaccga tccgggcacc ggcgactgca ccgccgagat cgtcgtcgtc agcgactggg    1200
gctcgggctg gcagggcgat gtgcacatca ccgccggcga cgcctccctc aacggctgga    1260
ccctcacctg gacctggaac agcggccagt ccgtctccag ctcctggaac gtcgacatct    1320
cccagtcggg gacctcggtg accgccacgg acgtcggctg gaacggcgcc atcgcgtccg    1380
gacagtcccg aaatgccttc gtttcatcg ccaacggctc cagcgcggtg ccgacagtgg     1440
agtgcagcgc ctgacccacg cctcacttca cccccggtgt ccggcctgtg tcgcagttgt    1500
gggacctaca ctgtccgtgt ggtacc                                         1526
<210>2
<211>465
<212>PRT
<213>未知
<220>
<223>
<400>2
Met Tyr Val Asn Phe Thr Ala Arg Ile Gly Gly Val Asp Thr Thr Lys
1                5                  10                  15
Glu Gln Leu Val Asn Arg Arg Lys Arg Leu Asx Ala Ile Ala Ala Ala
20                              25                  30
Ala Gly Ala Ala Gly Leu Asx Ala Ala Thr Ala Leu Leu Leu Asx Pro
35                          40                  45
Thr Ala Ser Ala Gln Gly Glu Ser Leu Trp Ala Asp Pro Thr Thr Gln
    50                  55                  60
Ala Ala Glu Trp Ala Ala Glu Asn Pro Asn Asp Tyr Arg Ala Glu Leu
65                  70                  75                  80
Ile Gly Glu Arg Ile Gly Gln Thr Pro Ala Gly Val Trp Phe Thr Gln
                85                  90                  95
His Asn Pro Val Gly Gly Ile Gln Ala Gln Val Ala Asn Val Val Ser
            100                 105                 110
Ala Ala Ala Ala Asp Gly Asp Thr Pro Ile Met Val Val Tyr Asn Ile
       115                  120                 125
Pro Asp Arg Asp Cys Gly Gly His Ser Gly Gly Gly Ala Pro Ser His
    130             135                     140
Ser Ala Tyr Arg Asp Trp Ile Asp Gln Phe Ala Ala Gly Leu Ser Gly
145                 150                 155                 160
Pro Ala Tyr Ile Ile Leu Glu Pro Asp Thr Leu Pro His Asn Cys Ala
                165                 170                 175
Asp Pro Ala Glu Arg Asn Gln Ser Leu Thr His Ala Val Gln Ala Leu
           180                 185                 190
Lys Ser Ala Ser Ser Gln Ala Arg Val Tyr Leu Asp Ile Gly Asn Ser
        195                 200                 205
Ala Trp Leu Glu Pro Gly Glu Ala Ala Ser Arg Leu Gln Gly Ala Gly
    210                 215                 220
Ile Gln Tyr Ala Asp Gly Phe Ala Ile Asn Val Ser Asn Tyr Arg Thr
225                 230                 235                 240
Thr Gln Glu Ala Thr Ser Tyr Ala His Gln Ile Gln Asn Val Val Gly
                245                 250                 255
Ser Asp Lys Gly Ala Val Ile Asp Thr Ser Arg Asn Gly Asn Gly Pro
            260                 265                 270
Leu Asp Pro Pro Asp Pro Asn Asp Trp Cys Asp Pro Pro Gly Arg Ala
        275             280                     285
Ile Gly Asp Tyr Pro Thr Thr Ser Thr Gly Val Ser Gly Ile Asp Ala
    290                 295                 300
Tyr Leu Trp Val Lys Leu Pro Gly Glu Ala Asp Gly Cys Ala Gly Ser
305                 310                 315                 320
Ala Gly Gln Phe Ile Pro Asp Leu Asx Tyr Glu Leu Asx Asn Asn Ala
                325                 330                 335
Gly Ala Asp Trp Pro Gly Asp Val Pro Val Asp Pro Thr Asp Pro Thr
            340                 345                 350
Thr Asp Pro Asp Asp Pro Thr Thr Asp Pro Gly Thr Asp Pro Gly Thr
        355                  360                365
Gly Asp Cys Thr Ala Glu Ile Val Val Val Ser Asp Trp Gly Ser Gly
    370                 375                 380
Trp Gln Gly Asp Val His Ile Thr Ala Gly Asp Ala Ser Leu Asn Gly
385                 390                 395                 400
Trp Thr Leu Thr Trp Thr Trp Asn Ser Gly Gln Ser Val Ser Ser Ser
                405                 410                 415
Trp Asn Val Asp Ile Ser Gln Ser Gly Thr Ser Val Thr Ala Thr Asp
            420                 425                 430
Val Gly Trp Asn Gly Ala Ile Ala Ser Gly Gln Ser Arg Asn Ala Phe
        435                 440                 445
Gly Phe Ile Ala Asn Gly Ser Ser Ala Val Pro Thr Val Glu Cys Ser
    450                 455                 460
Ala
465

Claims (9)

1、一种纤维素酶,是具有下述氨基酸残基序列之一的蛋白质:
1)序列表中的SEQ ID №:2;
2)将序列表中SEQ ID №:2的氨基酸残基序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有纤维素酶活性的蛋白质。
2、根据权利要求1所述的纤维素酶,其特征在于:所述纤维素酶具有序列表中序列2的氨基酸残基序列。
3、权利要求1或2所述的纤维素酶的编码基因。
4、根据权利要求3所述的编码基因,其特征在于:所述纤维素酶的编码基因具有下述核苷酸序列之一:
1)序列表中SEQ ID №:1的DNA序列;
2)编码序列表中SEQ ID №:2蛋白质序列的多核苷酸;
3)在高严谨条件下能够与序列表中SEQ ID №:1限定的DNA序列杂交的核苷酸序列。
5、含有权利要求3或4所述的纤维素酶编码基因的表达载体。
6、含有权利要求3或4所述的纤维素酶编码基因的细胞系。
7、含有权利要求3或4所述的纤维素酶编码基因的宿主菌。
8、权利要求1或2所述的纤维素酶在纤维素降解中的应用。
9、权利要求3或4所述的纤维素酶编码基因在纤维素降解中的应用。
CNB2005101091013A 2005-10-18 2005-10-18 一种纤维素酶及其编码基因与应用 Expired - Fee Related CN1313609C (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNB2005101091013A CN1313609C (zh) 2005-10-18 2005-10-18 一种纤维素酶及其编码基因与应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB2005101091013A CN1313609C (zh) 2005-10-18 2005-10-18 一种纤维素酶及其编码基因与应用

Publications (2)

Publication Number Publication Date
CN1772888A CN1772888A (zh) 2006-05-17
CN1313609C true CN1313609C (zh) 2007-05-02

Family

ID=36760028

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB2005101091013A Expired - Fee Related CN1313609C (zh) 2005-10-18 2005-10-18 一种纤维素酶及其编码基因与应用

Country Status (1)

Country Link
CN (1) CN1313609C (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101736023B (zh) * 2010-01-22 2012-05-09 南京农业大学 纤维素水解酶β-1,4葡聚糖内切酶基因
CN102816752B (zh) * 2012-08-27 2013-08-28 广西大学 一种纤维二糖水解酶Tccel7A及其编码基因及应用

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
Detecting cellulase and esterase enzyme activities encoded by novel genes present in environmental DNA libraries. Rees HC,et al,Extremophiles,Vol.7 No.5 2003 *
Detecting cellulase and esterase enzyme activities encoded by novel genes present in environmental DNA libraries. Rees HC,et al,Extremophiles,Vol.7 No.5 2003;Prospecting for novel biocatalysts in a soil metagenome S. Voget,et al,Applied and Environmental Microbiology,Vol.69 No.10 2003;ZP_00057724. Reports... [gi:23018004] GenBank 1996 *
Prospecting for novel biocatalysts in a soil metagenome S. Voget,et al,Applied and Environmental Microbiology,Vol.69 No.10 2003 *
ZP_00057724. Reports... [gi:23018004] GenBank 1996 *

Also Published As

Publication number Publication date
CN1772888A (zh) 2006-05-17

Similar Documents

Publication Publication Date Title
CN101558166B (zh) 用于酶促水解纤维素的高效纤维素酶组合物的构建
Ma et al. Screening of cellulolytic bacteria from rotten wood of Qinling (China) for biomass degradation and cloning of cellulases from Bacillus methylotrophicus
Bansal et al. A novel strain of Aspergillus niger producing a cocktail of hydrolytic depolymerising enzymes for the production of second generation biofuels
EP2013338B1 (en) Thermostable cellulase and methods of use
CN100575484C (zh) 一种β-葡萄糖苷酶及其编码基因与应用
KR101018790B1 (ko) 자일라나아제를 생산하는 신규한 페니바실러스 sp. HPL-001 균주, 이로부터 분리한 신규한 자일라나아제 효소 및 이의 생산 방법
Zhang et al. Cloning and expression of a Paecilomyces thermophila xylanase gene in E. coli and characterization of the recombinant xylanase
CN101225376A (zh) 一种内切葡聚糖酶及其编码基因与应用
CN1313609C (zh) 一种纤维素酶及其编码基因与应用
DK2855673T3 (en) IMPROVED ENDOGLUCANASES FOR TREATMENT OF CELLULOS MATERIAL
CN1778907A (zh) 一种β-葡萄糖苷酶及其编码基因与应用
CN101225377B (zh) 内切葡聚糖酶及其编码基因与应用
CN101225378B (zh) 内切葡聚糖酶和它的编码基因与应用
CN1245507C (zh) 一种高温β-葡萄糖苷酶、其编码基因及其用途
CN1272438C (zh) 一种编码糖基水解酶家族5的纤维素酶的基因及其应用
CN102174494B (zh) 一种海洋适冷内切β-木聚糖酶XynB及其表达基因xynB与应用
CN1219063C (zh) 一种耐高温木聚糖酶和编码该酶的基因
CN101338307B (zh) 一种纤维素酶和它的编码基因与应用
CN114317500A (zh) 木聚糖酶Scxyn5及其编码基因和应用
KR101163438B1 (ko) 소의 반추위 메타게놈에서 유래된 신규의 만난아제 유전자 및 이로부터 코딩되는 단백질
Fawzya et al. Identification of SGS 1609 cellulolytic bacteria isolated from Sargassum spec. and characterization of the cellulase produced
Leng et al. Gene cloning and expression of fungal lignocellulolytic enzymes from the rumen of gayal (Bos frontalis)
CN113980939B (zh) 一种耐葡萄糖的β-葡萄糖苷酶及其表达基因和应用
CN1263858C (zh) 一种编码糖基水解酶家族9的纤维素酶的基因及其应用
CN100582224C (zh) 一种纤维糊精酶及其编码基因与应用

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20070502

Termination date: 20151018

EXPY Termination of patent right or utility model