CN1313609C

CN1313609C - 一种纤维素酶及其编码基因与应用

Info

Publication number: CN1313609C
Application number: CNB2005101091013A
Authority: CN
Inventors: 冯家勋; 段承杰; 靳振江; 许跃强; 庞浩; 张鹏; 封毅; 唐纪良
Original assignee: Guangxi University
Current assignee: Guangxi University
Priority date: 2005-10-18
Filing date: 2005-10-18
Publication date: 2007-05-02
Anticipated expiration: 2025-10-18
Also published as: CN1772888A

Abstract

本发明公开了一种纤维素酶及其编码基因与应用。本发明提供的一种纤维素酶，是具有下述氨基酸残基序列之一的蛋白质：1)序列表中的SEQ ID №：2；2)将序列表中SEQ ID №：2的氨基酸残基序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有纤维素酶活性的蛋白质。本发明的纤维素酶及其编码基因在纤维素的降解中具有广泛的用途。

Description

一种纤维素酶及其编码基因与应用

技术领域

本发明涉及一种纤维素酶及其编码基因与应用。

背景技术

纤维素主要是植物利用二氧化碳和水在太阳能作用下通过光合作用合成的地球上最丰富的可再生的生物质(biomass)资源。据报道，全球每年通过光合作用产生的纤维素高达1.55×10⁹吨，其中89％尚未被人类利用(Dunlap C，Chiang GC.Utilization and recycle of agriculture wastes and residues.Shuler M L.BocaRaton，Florida.USA：CRC Press Inc.1980.19)。纤维素是多个葡萄糖残基以β-1，4-糖苷键连接而成的多聚物，其基本重复单位为纤维二糖。天然纤维素的基本结构是由原纤维构成的微纤维束集合而成。原纤维是由15-40根有结晶区和非结晶区构成的纤维素分子长链所组成。纤维素的结晶部分是由纤维素分子进行非常整齐规划地折迭排列形成。在天然纤维素中，木质素和半纤维素形成牢固结合层，紧密地包围纤维素。纤维素酶是能将纤维素转化成葡萄糖的一系列酶的总称，包括三类酶即内切-β-1，4-葡聚糖酶(endo-β-1，4-glucanase，EC 3.2.1.4)、外切葡聚糖酶(exoglucanase，又叫纤维二糖水解酶cellobiohydrolase，EC3.2.1.91)和β-葡萄糖苷酶(β-glucosidase，EC3.2.1.21)，这三种酶协同作用能将纤维素转化成葡萄糖。内切葡聚糖酶作用于纤维素长链分子的内部将长纤维切成短纤维，外切葡聚糖酶作用于纤维素分子的一端，以两个葡萄糖残基为单位进行切割生成纤维二糖，β-葡萄糖苷酶切割纤维二糖生成葡萄糖(Tomme P，Warren R A J，Gilkes N R.1995.Cellulose hydrolysis by bacteria and fungi.Adv.Microbiol.Physiol.，37：1-81.1995；Bhat M K，Bhat S.1997.Cellulose degrading enzymes and their potentialindustrial applications.Biotechnology Advances，15：583-620)。葡萄糖可作为重要的工业原料生产酒精、丙酮等化工产品。纤维素的利用与转化对于解决世界能源危机、粮食和饲料短缺、环境污染等问题具有重要意义。纤维素酶可广泛应用于酿酒、饲料、食品、纺织、造纸等行业。如纤维素酶作为饲料添加剂可增加饲料的可消化性，减少排泄的粪便量。纤维素酶可取代浮石进行牛仔裤的“石洗”处理，也可处理其它含纤维织物以降低粗糙度和增加光亮。纤维素酶可添加到洗涤剂中以提高洗涤剂的清洁能力(Bhat M K.2000.Cellulases and related enzymes in biotechnology.Biotechnology Advances，18：355-383)。由于纤维素酶的广泛用途以及针对不同的用途需要使用不同性质的纤维素酶，更由于纤维素酶的效率低、价格高而使以纤维素为原料生产燃料酒精的成本太高以至于无法真正实现产业化，因此，需要新的纤维素酶。

纤维素酶属于糖基水解酶类(glycosyl hydrolases)，许多糖基水解酶由一个催化功能域和一个或更多个其它的功能域如碳水化合物结合组件(carbohydrate-binding modules，CBMs)组成，根据催化功能域的氨基酸序列相似性，糖基水解酶类被划分成不同的家族(families)(Davies G.，Henrissat B.1995.Structures and mechanisms of glycosyl hydrolases.Structure 3：853-859；Henrissat B.1991.A classification of glycosyl hydrolases based on amino-acidsequence similarities.Biochem.J.280：309-316；Henrissat B.，Bairoch A.1993New families in the classification of glycosyl hydrolases based on amino-acidsequence similarities.Biochem.J.293：781-788；Henrissat B.，Bairoch A.1996.Updating the sequence-based classification of glycosyl hydrolases.Biochem.J.316：695-696)。根据Cazy服务器(server)(http://afmb.cnrs-mrs.fr/CAZY/)上所列糖基水解酶类的最新清单，目前糖基水解酶类有100个家族，纤维素酶分属于糖基水解酶类家族1、3、5、6、7、8、9、10、12、26、44、45、48、51、61、74。将未知的纤维素酶与已知的纤维素酶做序列同源性比较可对其进行分类。

目前除Rees等(Rees HC，Grant S，Jones B，Grant WD，Heaphy S.2003.Detectingcellulase and esterase enzyme activities encoded by novel genes present inenvironmental DNA libraries.Extremophiles.7(5)：415-421)报道从湖水和湖床沉积物未培养微生物中克隆到2个纤维素酶基因CRATCEL和HKCEL以及Voget等(Voget S，Leggewie C，Uesbeck A，Raasch C，Jaeger KE，Streit WR.2003.Prospecting for novel biocatalysts in a soil metagenome. Appl EnvironMicrobiol.，69(10)：6235-6242)报道从土壤未培养微生物中克隆到2个纤维素酶基因gnuB和uvsO80外，人类所克隆的所有其它纤维素酶基因都是从人类所培养的微生物中来的，但并不是自然界中所有微生物都是可以被分离、培养的，一般认为可培养的微生物种类只占自然界中微生物种类的1％(Amann R I，Ludwig W，Schleifer K H.1995.Phylogenetic identification and in situ detection of individualmicrobial cells without cultivation.Microbiol.Rev.59：143-169)，那么剩余的99％的不可培养的微生物中蕴藏着大量的基因资源。近年来从环境样品未培养微生物提取基因组DNA然后构建混合基因组DNA文库以分离基因已是成熟技术(LorenzP，Schleper C.2002.Metagenome-a challenging source of enzyme discovery.Journal of Molecular Catalysis B：Enzymatic 19-20：13-19)。由于造纸厂土壤富含大量纸浆，是纤维素被活跃降解的地方，有大量的微生物在进行纤维素、半纤维素、果胶物质等的分解，但这些分解性的微生物只有极少部分已被培养，还有极大部分未被培养。可以推测这些未培养微生物中一定含有大量的基因资源如纤维素酶基因资源，其中很可能有些就是优于目前所发现的最好的纤维素酶的高效酶的基因。通过构建土壤未培养微生物的宏基因组DNA文库，极有可能从中筛选得到比目前已知的最好的纤维素酶还要好的酶的基因。

发明内容

本发明的目的是提供一种纤维素酶及其编码基因与应用。

本发明所提供的纤维素酶，名称为Umcel6A，来源于土壤未培养细菌，是具有下述氨基酸残基序列之一的蛋白质：

1)序列表中的SEQ ID №：2；

2)将序列表中SEQ ID №：2的氨基酸残基序列经过一个或几个氨基酸残基的取代和/或缺失和/或添加且具有纤维素酶活性的蛋白质。

其中，序列表中的序列2由465个氨基酸残基组成。自N端的第26-48位氨基酸为跨膜功能域(transmembrane domain)，自N端的第59-331位氨基酸为家族6糖基水解酶(glycosyl hydrolase)功能域，自N端的第371-463位氨基酸为碳水化合物结合组件(carbohydrate-binding modules，CBMs)。和Umcel6A催化功能域同源性最高的为嗜高温放线菌(Thermobifida fusca)的β-1，4-纤维二糖水解酶A(1，4-β-D-glucan cellobiohydrolase A)(GenBank索引号23018004)的同源性最高，两者的相似性为54％、相同性为41％。

所述一个或几个氨基酸残基的取代和/或缺失和/或添加是指不多于十个氨基酸残基的取代和/或缺失和/或添加。

上述纤维素酶编码基因(umcel6A)也属于本发明的保护范围。

上述纤维素酶的基因组基因，可具有下述核苷酸序列之一：

1)序列表中SEQ ID №：1的DNA序列；

2)编码序列表中SEQ ID №：2蛋白质序列的多核苷酸；

3)在高严谨条件下可与序列表中SEQ ID №：1限定的DNA序列杂交的核苷酸序列。

上述高严谨条件可为在0.1×SSPE(或0.1×SSC)，0.1％SDS的溶液中，在65℃下杂交并洗膜。

其中，序列表中的SEQ ID №：1由1526个脱氧核苷酸组成，自5’端的第57至1454位核苷酸为umcel6A的开放阅读框(Open Reading Frame，ORF)，自5’端的第57至59位核苷酸为umcel6A基因的起始密码子ATG，自5’端的第1452至1454位核苷酸为umcel6A基因的终止密码子TGA。

含有本发明基因的表达载体、细胞系及宿主菌均属于本发明的保护范围。

本发明通过构建土壤未培养微生物的宏基因组DNA文库和文库克隆的纤维素酶活性平板检测筛选法，得到了新的纤维素酶基因，可在宿主细胞中大量表达该基因以生产该纤维素酶，用于纤维素的降解。本发明所提供新的纤维素酶及其编码基因在纤维素的降解中具有广泛的用途。

附图说明

图1为从土壤样品中提取的未培养微生物的宏基因组DNA。

图2为土壤未培养微生物基因文库克隆的限制性内切酶BamHI酶切分析图。

图3为土壤未培养微生物基因文库克隆的筛选，阳性克隆EPI100/pGXNL2所在的平板图。

图4为能降解羧甲基纤维素的文库克隆质粒pGXNL2的BamHI酶切带型。

图5为初筛获得的重组质粒pGXNL2转化大肠杆菌后得到的转化子能降解羧甲基纤维素(右)，而空载体pWEB::TNC转化大肠杆菌后得到的转化子不能降解羧甲基纤维素(左)。

图6为umcel6A基因部分DNA序列的PCR扩增结果。

图7为pGXNumcel6A重组质粒经BamHI和HindIII双酶切后电泳图。

图8为重组大肠杆菌M15/pGXNumcel6A能降解羧甲基纤维素(右)，而含有空载体的大肠杆菌M15/pQE30不能降解羧甲基纤维素(左)。

具体实施方式

下述实施例中的实验方法，如无特别说明，均为常规方法。

下述实施例中的百分含量，如无特别说明，均为质量百分含量。

在本发明的实施例中所用到的材料包括：大肠杆菌(Escherichia coli)株系EPI100(购自Epicentre公司)；大肠杆菌(Escherichia coli)株系M15(购自QIAGEN公司)；大肠杆菌E.coliXL1-blue(购自Stratagene公司)；柯斯质粒载体pWEB::TNC(购自Epicentre公司)；文库制备试剂盒(购自Epicentre公司，pWEB::TNC cosmidcloning kit，目录号WEBC931)；克隆载体pBluescript M13(+)(购自Stratagene公司)；表达载体pQE-30(购自QIAGEN公司)；限制性内切酶、修饰酶及聚合酶等试剂(购自Promega、Stratagene、SIGMA、QIAGEN、MBI)。

实施例1、纤维素酶Umcel6A及其编码基因的获得

一、土壤未培养微生物宏基因组文库的构建

取50g造纸厂土壤，悬浮在100ml的0.18M磷酸钾缓冲液(pH7.2)中，充分混匀后在Beckman Coulter Avanti J-E离心机(购自Beckman Coulter公司，目录号369003)JA-10转头上用600g离心力离心10分钟，收集上清液，加入40ml PVPP(聚乙烯聚吡咯烷酮，polyvinylpolypyrrolidone)溶液(购自Sigma公司，目录号P-6755)(PVPP溶液：每100mg PVPP与1ml 0.18M磷酸钾缓冲液(pH7.2)混匀)，振荡30秒，再加入200μl 3M CaCl₂溶液，振荡30秒后，600g离心力离心5分钟，收集上清液于另一个离心管中。再用同样的离心机、转头用8000g离心力离心15分钟收集上清液中的细菌细胞。将收集到的菌体充分悬浮在1ml TE(10mM Tris/HCl，pH8.0，1mM EDTA，pH8.0)溶液中，加入100μl溶菌酶(20mg/ml，溶于TE溶液)，在37℃下作用30分钟，在Eppendorf 5417C离心机(购自Eppendorf公司，目录号19718)上以10000g离心1分钟以沉淀细胞，再将细胞充分悬浮在600μl PUREGENE公司的基因组DNA纯化试剂盒(Genomic DNA Purification Kit，目录号R-5500A)的细胞裂解缓冲液(Cell LysisSolution)中，置80℃水浴锅5分钟以裂解细胞，待样品冷却到室温后，加入200μl上述试剂盒中的蛋白质沉淀溶液(Protein Precipitation Solution)，充分混匀后13000g离心3分钟，将上清液转移到一个新的1.5ml微量离心管中，加入600μl 100％异丙醇，充分混匀后即见DNA絮状沉淀析出，挑出DNA絮状沉淀，用70％乙醇洗2次DNA，干燥后将DNA溶于500μl TE溶液即得DNA粗提物。

将DNA粗提物加到含有Sephadex G200(购自Pharmacia公司，目录号17-0080-01)和2％PVPP(购自Sigma公司，目录号P-6755)的层析柱(200mm×10mm)上，用TE缓冲液洗脱，按每组分1ml分部收集洗脱液，每一组分加入100μl的3M醋酸钠溶液(pH4.8)及1ml异丙醇沉淀DNA，把沉淀物溶于TE中，合并所得DNA溶液，0.7％琼脂糖凝胶电泳后切下含30kb以上的DNA的凝胶，用电洗脱法回收纯化DNA，回收纯化的DNA如图1，其中泳道1为λDNA(48.5kb)；泳道2为λDNA用EcoRI酶切(片段大小从大到小依次为：21.2kb，7.4kb，5.8kb，5.6kb，4.9kb，3.5kb)；泳道3为从土壤中提取的DNA粗提物；泳道4为经过Sephadex G-200凝胶初步纯化的DNA；泳道5为经过低熔点琼脂糖凝胶回收得到的30kb以上的DNA。为了用这些纯化的DNA制作基因文库，首先对这些DNA进行末端修补以产生平头末端而和文库制备试剂盒中已处理好的同样具平头末端的pWEB::TNC载体相连，依次在冰上向一个新的灭过菌的微量离心管中加入：6μl 10×末端修补缓冲液(330mM Tris-醋酸[pH7.8]，660mM醋酸钾，100mM醋酸镁，5mM DTT)，6μl 2.5mM dNTP混合物(每种2.5mM)，6μl 10mM ATP，40μl 30kb以上的DNA(0.2μg/μl)，2μl末端修补酶混合物(T₁ DNA聚合酶和T₄多聚核苷酸激酶)。25℃下放置45分钟，再转移到70℃水浴锅放置10分钟以终止酶反应，1.0％低熔点琼脂糖凝胶电泳后切下含30kb-45kb的DNA的凝胶进行DNA回收，为了使回收片段与文库制备试剂盒中已处理好的具平头末端的载体在T₄ DNA连接酶的作用下连接起来，依次在冰上向一个新的灭过菌的微量离心管中加入：12μl无菌水，2μl 10倍快速连接缓冲液(10×Fast-Link Ligation Buffer)(属购自Epicentre公司的文库制备试剂盒pWEB::TNC cosmid cloning kit(目录号WEBC931)的一个组分)，1μl 10mM ATP，lμl pWEB::TNC载体(0.5μg)，3μl低熔点琼脂糖凝胶回收的30kb-45kb的DNA(0.1μg/μl)，1μl快速连接DNA连接酶(Fast-Link DNA Ligase，2单位/μl)(属购自Epicentre公司的文库制备试剂盒pWEB::TNC cosmid cloning kit(目录号WEBC931)的一个组分)，混匀后在25℃下放置2个小时，再在70℃放置10分钟以终止酶反应。为了将连接反应产物用λ包装蛋白包装，将在冰上刚刚溶化的λ包装提取物(购自Epicentre公司的文库制备试剂盒pWEB::TNC cosmid cloning kit(目录号WEBC931)的一个组分)25μl立即转移到一个新的灭过菌的微量离心管中并快速置于冰上，再往其中加入10μl连接反应产物，充分混匀后置于30℃90分钟后，再往其中加入25μl溶化的λ包装提取物(属购自Epicentre公司的文库制备试剂盒pWEB::TNC cosmid cloning kit(目录号WEBC931)的一个组分)，充分混匀后置于30℃ 90分钟，向其中加入500μl噬菌体稀释缓冲液(10mM Tris-HCl[pH 8.3]，100mM NaCl，10mM MgCl₂)，再将该560μl包装反应产物加入到5.6mL的OD₆₀₀＝1.0的宿主大肠杆菌EPI100培养液(培养基为LB[每升含胰蛋白胨(Oxoid)，10g；酵母浸出粉(Difco)，5g；NaCl，5g；pH7.0]+10mM MgSO4)中，25℃下放置20分钟让上述得到的包装的λ噬菌体吸附和侵染宿主细胞E.coliEPI100，在含氨苄青霉素(100μg/mL)的LA平板(LA培养基配方为[每升含胰蛋白胨(Oxoid)，10g；酵母浸出粉(Difco)，5g；NaCl，5g；琼脂粉，15g]pH7.0)上筛选转化子。结果共获得约15,000个转化子，任意提取14个克隆的质粒DNA，限制性内切酶BamHI酶切后用0.7％琼脂糖凝胶进行电泳分析，结果所有质粒除都有一个5.8kb的载体片段外，都含有插入片段，且没有发现有两个质粒具有相同的酶切带型，酶切结果如图2所示，其中泳道1为λDNA用EcoRI酶切片段(片段大小从大到小依次为：21.2kb，7.4kb，5.8kb，5.6kb，4.9kb，3.5kb)；泳道2为1kb ladder(片段大小从大到小依次为：10.0kb，8.0kb，6.0kb，5.0kb，4.0kb，3.5kb，3.0kb，2.5kb，2.0kb，1.5kb)；其它泳道分别为使用限制性内切酶BamHI酶切的文库克隆质粒。结果表明文库含有非常随机的插入DNA片段，插入片段最大的为45kb，最小的为23kb，平均大小为36kb。说明文库的克隆容量也是相当大的，文库的质量相当好。

二、从土壤未培养微生物的宏基因组文库中筛选表达纤维素酶活性的克隆

用平板影印法将含氨苄青霉素的LA平板上得到的转化子(每平板约200个菌落左右)分别影印到含0.5％羧甲基纤维素(carboxylmethylcellulose，CMC)(购自Sigma公司，目录号C-5678)的LA平板、含氨苄青霉素(100μg/mL)的LA平板上，将平板倒置于37℃培养箱培养24小时后，将长满菌落的含氨苄青霉素的LA平板置于4℃冰箱保存，将长满菌落的含羧甲基纤维素的LA平板用0.5％刚果红溶液染色15分钟，用1M的NaCl溶液脱色15分钟，然后检测菌落周围有无水解圈，结果如图3所示，箭头所指的菌落为周围有水解圈的克隆。表明筛选到1个菌落周围有水解圈的克隆(EPI100/pGXNL2)，进一步提取该克隆的质粒DNA并将其命名为pGXNL2，用限制性内切酶BamHI完全酶切pGXNL2后，进行0.7％琼脂糖凝胶电泳分析，结果如图4所示，pGXNL2除有一个5.8kb的载体片段外，还有另外5条BamHI片段，大小分别为17.0kb，14.5kb，8.2kb，4.2kb，1kb，结果表明pGXNL2含有45.2kb的插入片段。其中，泳道1为λ用EcoRI酶切后的片段(片段大小从大到小依次为：21.2kb，7.4kb，5.8kb，5.6kb，4.9kb，3.5kb)；泳道2为1kb ladder(片段大小从大到小依次为：10.0kb，8.0kb，6.0kb，5.0kb，4.0kb，3.5kb，3.0kb，2.5kb，2.0kb，1.5kb)；泳道3为pGXNL2/BamHI(从上至下分别为17.0kb，14.5kb，8.2kb，5.8kb，4.2kb，1kb)。为了证实pGXNL2的插入片段确实含有纤维素酶基因，用pGXNL2质粒DNA和空载体pWEB::TNC分别转化E.coli EPI100，在含氨苄青霉素(100μg/mL)的LA平板上筛选转化子，随机挑取由每个质粒转化得到的10个转化子点接到含0.5％羧甲基纤维素的LA平板上，37℃培养24小时后，用0.5％刚果红溶液染色15分钟，用1M的NaCl溶液脱色，然后观察菌落周围有无水解圈，结果表明所有10个由空载体pWEB::TNC转化得到的转化子周围都没有水解圈，所有10个由pGXNL2转化得到的转化子周围都有水解圈，其中一个转化子的检测结果如图5所示。结果表明重组质粒pGXNL2的插入片段上确实含有纤维素酶基因。

为了测定重组质粒pGXNL2上纤维素酶基因的DNA序列，采用亚克隆的方法对该基因进行定位。先后使用限制性内切酶BamHI、EcoRI及KpnI对重组质粒pGXNL2酶切：第一步，对pGXNL2用BamHI进行完全酶切，把酶切的产物抽提沉淀，然后使用T₄ DNA ligase(购自Promega公司)连接，连接产物转化E.coli EPI100，在含0.5％羧甲基纤维素的LA平板上筛选菌落周围有水解圈的转化子，提取质粒并使用BamHI酶切，结果表明含有14kb外源DNA片段的转化子菌落周围有水解圈，把只含有5.8kb载体带和一条14kb外源带的质粒命名为pGXNB2；第二步，对pGXNB2用EcoRI进行完全酶切，用0.7％的琼脂糖凝胶电泳分析，发现由4条带组成：9.5kb和5kb的外源带，载体pWEB::TNC被切成3kb和2.8kb两条带。同样抽提沉淀，连接，转化E.coli EPI100，在含0.5％羧甲基纤维素的LA平板上筛选菌落周围有水解圈的转化子(同第一步)，提取质粒并使用EcoRI酶切，含有9.5kb外源DNA片段的转化子菌落周围有水解圈。把只含有3kb载体带和一条9.5kb外源带的质粒命名为pGXNE1；第三步，对pGXNE1用EcoRI和KpnI双酶切，分别得到一条8kb和一条1.5kb的外源片段。将回收的8kb和1.5kb的DNA片段分别与用EcoRI和KpnI双酶切的克隆载体pBluescriptM13(+)连接，将得到的两个连接产物分别转入E.coli EPI100后，发现含1.5kb外源片段的转化子在含0.5％羧甲基纤维素的LA平板上周围有水解圈，将含1.5kb DNA片段的重组质粒命名为pGXN1500。最终将靶基因定位在用EcoRI和KpnI酶切pGXNE1得到的1.5kb的外源DNA片段上。将含有pBluescripM13(+)与1.5kb外源的重组质粒pGXN1500寄送大连宝生物工程公司采用双脱氧核苷酸法对该基因进行双向双链测序。用软件DNAStar(DNASTAR公司，版本5)对序列进行拼接，用NCBI(National Centerfor Biotechnology Information，http://www.ncbi.nlm.nih.gov)上的软件对DNA序列进行分析，如Blast(http://www.ncbi.nlm.nih.gov/BLAST)。得到纤维素酶的编码基因，该基因具有序列表中序列1的DNA序列，命名为umcel6A。序列表中序列1的DNA自5’端的第57-1454位核苷酸为基因umcel6A的开放阅读框(open readingframe，ORF)，由1398个核苷酸组成，自5’端的第57-59位核苷酸为umcel6A基因的起始密码子ATG，自5’端的第1452-1454位核苷酸为umcel6A基因的终止密码子TGA。

纤维素酶基因umcel6A编码一个含465个氨基酸的蛋白质Umcel6A，用DNAStar软件预测该蛋白质的理论分子量大小为48,026.38道尔顿，等电点pI为3.98。用简单组件结构研究工具(Simple Modular Architecture Research Tool，SMART，http://smart.embl-heidelberg.de)分析纤维素酶Umcel6A的组件结构，结果是自N端的第26-48位氨基酸为跨膜功能域(transmembrane domain)，自N端的第59-331位氨基酸为家族6糖基水解酶(glycosyl hydrolase)功能域，自N端的第371-463位氨基酸为碳水化合物结合组件(carbohydrate-binding modules，CBMs)。和Umcel6A催化功能域同源性最高的为嗜高温放线菌(Thermobifida fusca)的-1，4-纤维二糖水解酶A(1，4-β-D-glucan cellobiohydrolase A)(GenBank索引号23018004)的同源性最高，两者的相似性为54％、相同性为41％。

实施例2、umcel6A在大肠杆菌中的表达

1、umcel6A的开放阅读框(open reading frame，ORF)及蛋白质结构预测

使用NCBI上的ORF Finder(Open reading frame finder)对测序所获得DNA序列(序列表中的SEQ ID №：1，由1526个脱氧核苷酸组成)上可能存在的ORF进行预测，结果显示自5’端的第57至1454位核苷酸为umcel6A的开放阅读框(OpenReading Frame，ORF)，自5’端的第57至59位核苷酸为umcel6A基因的起始密码子ATG，自5’端的第1452至1454位核苷酸为umcel6A基因的终止密码子TGA，纤维素酶基因umcel6A的开放阅读框全长为1.398kb，可编码465个氨基酸。使用DNAStar软件预测该蛋白质的理论分子量大小为48,026.38道尔顿，等电点pI为3.98。用简单组件结构研究工具(Simple Modular Architecture Research Tool，SMART，http://smart.embl-heidelberg.de)分析纤维素酶Umcel6A的组件结构，结果是自N端的第26-48位氨基酸为跨膜功能域(transmembrane domain)，自N端的第59-331位氨基酸为家族6糖基水解酶(glycosyl hydrolase)功能域，自N端的第371-463位氨基酸为碳水化合物结合组件(carbohydrate-binding modules，CBMs)。

2、扩增umcel6A基因的PCR引物设计

带有跨膜功能域的基因在体内表达后很有可能将表达产物分泌到细胞外。为避免表达产物分泌到细胞外，只需要扩增umcel6A基因的自5′端第201位碱基到终止密码子间的序列，即umcel6A基因中除编码跨膜功能域外的DNA序列(序列1的自5′端第201位至1454位碱基)，共1254bp，预计所扩增片段编码蛋白的分子量为43.176KDa，等电点pI为3.794。结合载体pQE-30上的多克隆位点，用Vector NTI软件搜索基因上的有关酶切位点，设计引物。在正向引物GX1500F2和反向引物GX1500R1的5’端的分别加上BamHI和HindIII酶切位点(GX1500F2和GX1500R1中带下划线的字母)。预计PCR反应将特异地扩增出一条大约为1254bp的DNA条带。扩增基因的PCR正向引物和反向引物分别为：

GX1500F2：5’ ACT GGATCCACGGCGTCCGCCCAAGGC 3’

GX1500R1：5’ CGT AAGCTTTCAGGCGCTGCACTCCACTGT 3’

3、umcel6A基因的PCR扩增

用pGXN1500(实施例1中制备，是载体pBluescriptM13(+)克隆有含umcel6A基因的1.5kb DNA片段的重组质粒)作模板，以GX1500F2和GX1500R1为正反向引物作PCR扩增反应。反应体系为：模板：10ng，1μl正向引物(10pmol/μl)，1μl反向引物(10pmol/μl)，dNTP：0.25mM，pfu buffer 2.5μl，pfu polymerase：0.4unit(购自MBI公司)，加ddH₂O至25μl。PCR反应程序为：第一阶段预变性95℃，5min；第二阶段变性95℃，30sec；退火55℃，30sec；延伸72℃，2min，共30个循环。第三阶段延伸，72℃延伸10分钟。PCR反应特异地扩增出一条为1254bp DNA条带，结果附图6。其中泳道1为1kb ladder(片段大小从大到小依次为：10.0kb，8.0kb，6.0kb，5.0kb，4.0kb，3.5kb，3.0kb，2.5kb，2.0kb，1.5kb)；泳道2为PCR反应特异地扩增出的一条1254bp的DNA条带。将PCR产物纯化后经BamHI和HindIII分别酶切后，然后进行琼脂糖凝胶电泳分离片段，用电洗脱法回收双酶切后PCR产物。

4.pGXNumcel6A重组质粒的构建及鉴定

将双酶切后的PCR产物和同样双酶切后的载体pQE-30，用T4 DNA连接酶16℃连接过夜，连接产物转化E.coli XL1-blue，提取重组质粒进行酶切鉴定。图7是重组质粒的酶切电泳图谱，可以看到重组质粒经BamHI和HindIII双酶切后释放出一条3.4kb的载体带和一条与PCR产物同样大小1.254kb的外源插入片段。泳道1为1kbladder(片段大小从大到小依次为：10.0kb，8.0kb，6.0kb，5.0kb，4.0kb，3.5kb，3.0kb，2.5kb，2.0kb，1.5kb)；泳道2为重组质粒经BamHI和HindIII双酶切后结果。把该重组质粒命名为pGXNumcel6A。

5.umcel6A基因在E.coli M15中的表达

把pGXNumcel6A转化至E.coli M15中得到转化子M15/pGXNumcel6A，挑取M15/pGXNumcel6A单菌落于LA平板上(含氨苄青霉素25μg/mL，卡那霉素25μg/ml，IPTG1.0mmol/L)，同时用M15/pQE30(转入pQE30的E.coli M15)作为空白对照，37℃培养24小时。菌体经氯仿破壁后用0.5％刚果红溶液染色15分钟，用1mol/L的NaCl溶液脱色，然后观察菌落周围有无水解圈。附图8结果显示重组菌M15/pGXNumcel6A周围有水解圈，而空白对照M15/pQE30周围无水解圈，说明靶基因在E.coli M15中已经高效表达出了有纤维素降解活性的蛋白质产物。

序列表

<160>2

<210>1

<211>1526

<212>DNA

<213>未知

<220>

<223>

<400>1

gaattcgacg ccccctgtcg acatccttca gtggtagcgc taccatcaat atatcgatgt 60

atgtgaattt caccgctcgc atcggtggag tcgacaccac gaaggagcaa ctcgtgaatc 120

gaagaaagag actcgcggcg atcgccgcgg cggcgggcgc cgcgggattg gccgcggcca 180

ccgcgctcct gctggcccct acggcgtccg cccaaggcga gagcctgtgg gccgacccca 240

ctacccaggc ggccgagtgg gccgccgaga acccgaacga ctaccgggcc gaactcatcg 300

gcgagcgcat cgggcagacc ccggcgggcg tctggttcac ccagcacaac ccggtcggcg 360

gcatccaggc gcaggtcgcg aacgtcgtat cggccgccgc cgctgacggc gacacgccga 420

tcatggtcgt ctacaacatc cccgaccgcg actgcggcgg ccactccggc ggcggcgccc 480

ccagccacag cgcctaccgc gactggatcg accagttcgc cgccggcctc tcgggcccgg 540

cctacatcat cctcgaaccc gacaccctcc cgcacaactg cgccgacccc gccgagcgca 600

accagtcgct cacccacgcg gtccaggcgc tcaagtccgc ctcctcgcag gcccgcgtct 660

acctcgacat cggcaactcc gcctggctcg agcccggcga ggcggccagc cgcctccagg 720

gcgccggcat ccagtacgcc gacggcttcg cgatcaacgt ctccaactac cgcaccaccc 780

aggaggcgac ctcctacgcc caccagatcc agaacgtcgt cggctccgac aagggcgcgg 840

tgatcgacac cagccgcaac ggcaacgggc cgctcgaccc gcccgacccc aacgactggt 900

gcgacccgcc cggccgcgcc atcggggact acccgaccac ctcgaccggc gtgagcggca 960

tcgacgccta cctgtgggtc aagctccccg gcgaggccga cggctgcgcc ggctcggccg 1020

gccagttcat ccccgacctg gcctatgagc tcgccaacaa cgccggggcc gactggcccg 1080

gcgacgtccc ggtcgacccg accgacccga ccaccgaccc cgacgacccg accaccgacc 1140

ccgggaccga tccgggcacc ggcgactgca ccgccgagat cgtcgtcgtc agcgactggg 1200

gctcgggctg gcagggcgat gtgcacatca ccgccggcga cgcctccctc aacggctgga 1260

ccctcacctg gacctggaac agcggccagt ccgtctccag ctcctggaac gtcgacatct 1320

cccagtcggg gacctcggtg accgccacgg acgtcggctg gaacggcgcc atcgcgtccg 1380

gacagtcccg aaatgccttc gtttcatcg ccaacggctc cagcgcggtg ccgacagtgg 1440

agtgcagcgc ctgacccacg cctcacttca cccccggtgt ccggcctgtg tcgcagttgt 1500

gggacctaca ctgtccgtgt ggtacc 1526

<210>2

<211>465

<212>PRT

<213>未知

<220>

<223>

<400>2

Met Tyr Val Asn Phe Thr Ala Arg Ile Gly Gly Val Asp Thr Thr Lys

1 5 10 15

Glu Gln Leu Val Asn Arg Arg Lys Arg Leu Asx Ala Ile Ala Ala Ala

20 25 30

Ala Gly Ala Ala Gly Leu Asx Ala Ala Thr Ala Leu Leu Leu Asx Pro

35 40 45

Thr Ala Ser Ala Gln Gly Glu Ser Leu Trp Ala Asp Pro Thr Thr Gln

50 55 60

Ala Ala Glu Trp Ala Ala Glu Asn Pro Asn Asp Tyr Arg Ala Glu Leu

65 70 75 80

Ile Gly Glu Arg Ile Gly Gln Thr Pro Ala Gly Val Trp Phe Thr Gln

85 90 95

His Asn Pro Val Gly Gly Ile Gln Ala Gln Val Ala Asn Val Val Ser

100 105 110

Ala Ala Ala Ala Asp Gly Asp Thr Pro Ile Met Val Val Tyr Asn Ile

115 120 125

Pro Asp Arg Asp Cys Gly Gly His Ser Gly Gly Gly Ala Pro Ser His

130 135 140

Ser Ala Tyr Arg Asp Trp Ile Asp Gln Phe Ala Ala Gly Leu Ser Gly

145 150 155 160

Pro Ala Tyr Ile Ile Leu Glu Pro Asp Thr Leu Pro His Asn Cys Ala

165 170 175

Asp Pro Ala Glu Arg Asn Gln Ser Leu Thr His Ala Val Gln Ala Leu

180 185 190

Lys Ser Ala Ser Ser Gln Ala Arg Val Tyr Leu Asp Ile Gly Asn Ser

195 200 205

Ala Trp Leu Glu Pro Gly Glu Ala Ala Ser Arg Leu Gln Gly Ala Gly

210 215 220

Ile Gln Tyr Ala Asp Gly Phe Ala Ile Asn Val Ser Asn Tyr Arg Thr

225 230 235 240

Thr Gln Glu Ala Thr Ser Tyr Ala His Gln Ile Gln Asn Val Val Gly

245 250 255

Ser Asp Lys Gly Ala Val Ile Asp Thr Ser Arg Asn Gly Asn Gly Pro

260 265 270

Leu Asp Pro Pro Asp Pro Asn Asp Trp Cys Asp Pro Pro Gly Arg Ala

275 280 285

Ile Gly Asp Tyr Pro Thr Thr Ser Thr Gly Val Ser Gly Ile Asp Ala

290 295 300

Tyr Leu Trp Val Lys Leu Pro Gly Glu Ala Asp Gly Cys Ala Gly Ser

305 310 315 320

Ala Gly Gln Phe Ile Pro Asp Leu Asx Tyr Glu Leu Asx Asn Asn Ala

325 330 335

Gly Ala Asp Trp Pro Gly Asp Val Pro Val Asp Pro Thr Asp Pro Thr

340 345 350

Thr Asp Pro Asp Asp Pro Thr Thr Asp Pro Gly Thr Asp Pro Gly Thr

355 360 365

Gly Asp Cys Thr Ala Glu Ile Val Val Val Ser Asp Trp Gly Ser Gly

370 375 380

Trp Gln Gly Asp Val His Ile Thr Ala Gly Asp Ala Ser Leu Asn Gly

385 390 395 400

Trp Thr Leu Thr Trp Thr Trp Asn Ser Gly Gln Ser Val Ser Ser Ser

405 410 415

Trp Asn Val Asp Ile Ser Gln Ser Gly Thr Ser Val Thr Ala Thr Asp

420 425 430

Val Gly Trp Asn Gly Ala Ile Ala Ser Gly Gln Ser Arg Asn Ala Phe

435 440 445

Gly Phe Ile Ala Asn Gly Ser Ser Ala Val Pro Thr Val Glu Cys Ser

450 455 460

Ala

465

Claims

1、一种纤维素酶，是具有下述氨基酸残基序列之一的蛋白质：

1)序列表中的SEQ ID №：2；

2、根据权利要求1所述的纤维素酶，其特征在于：所述纤维素酶具有序列表中序列2的氨基酸残基序列。

3、权利要求1或2所述的纤维素酶的编码基因。

4、根据权利要求3所述的编码基因，其特征在于：所述纤维素酶的编码基因具有下述核苷酸序列之一：

1)序列表中SEQ ID №：1的DNA序列；

2)编码序列表中SEQ ID №：2蛋白质序列的多核苷酸；

3)在高严谨条件下能够与序列表中SEQ ID №：1限定的DNA序列杂交的核苷酸序列。

5、含有权利要求3或4所述的纤维素酶编码基因的表达载体。

6、含有权利要求3或4所述的纤维素酶编码基因的细胞系。

7、含有权利要求3或4所述的纤维素酶编码基因的宿主菌。

8、权利要求1或2所述的纤维素酶在纤维素降解中的应用。

9、权利要求3或4所述的纤维素酶编码基因在纤维素降解中的应用。