CN113416734A

CN113416734A - 一种提高gfap蛋白表达量的基因及其可溶性表达方法

Info

Publication number: CN113416734A
Application number: CN202110607070.3A
Authority: CN
Inventors: 赵恒�; 张敏; 江海波
Original assignee: Suzhou Shunyouxin Intelligent Technology Co ltd
Current assignee: Suzhou Shunyouxin Intelligent Technology Co ltd
Priority date: 2021-06-01
Filing date: 2021-06-01
Publication date: 2021-09-21

Abstract

本发明涉及一种提高GFAP蛋白表达量的基因及其可溶性表达方法，通过对胶质纤维酸性蛋白GFAP基因碱基序列进行优化，得到优化后的GFAP‑opt基因序列SEQ ID NO.2，有效的使胶质纤维酸性蛋白在大肠杆菌中大量表达。通过进一步对pGEX‑4T‑2载体进行改造，增加了OmpA信号肽，所述信号肽序列为SEQ ID NO.3。本研究通过融合OmpA信号肽，使胶质纤维酸性蛋白在大肠杆菌中的分泌增加，有效改善了胶质纤维酸性蛋白包涵体形式的表达。

Description

一种提高GFAP蛋白表达量的基因及其可溶性表达方法

技术领域

本发明涉及生物制药领域，具体涉及一种提高GFAP蛋白表达量的基因及其可溶性表达方法。

背景技术

胶质纤维酸性蛋白(GFAP)是中枢神经系统所独有的特异性细胞骨架蛋白，是星形胶质细胞唯一表达的一种标志性蛋白，星形胶质细胞广泛分布于中枢神经系统各个部位，约占正常成年人脑细胞总数的40％。GFAP则是星形胶质细胞和星形胶质细胞源性肿瘤的标志蛋白，对神经元起支撑和营养作用，参与星形胶质细胞的许多生物学功能，包括细胞的增殖与分裂、维护血脑屏障的正常生理功能、自噬、维持神经递质的平衡等。GFAP是星形胶质细胞特有的中间丝蛋白，是胶质瘤的标志蛋白。在正常情况下，细胞胞质内的GFAP循环降解，血液中GFAP水平较稳定；而病理条件下，如病人的中枢神经系统受到损伤，其星形胶质细胞遭受破伤或坏死时，GFAP从胶质细胞中流出，穿过血脑屏障进入血液中，使GFAP浓度上调，因此GFAP在恶性胶质瘤中表现出异常过度表达。GFAP表达水平异常与多种遗传病和精神病相关，如亚历山大病、唐氏综合征、精神分裂症、情感型双极性疾患和抑郁症。目前，GFAP表达水平已经作为中风、脑外损伤、星型细胞源性胶质瘤等多种疾病的诊断标志之一。另外GFAP主要用于星型胶质瘤，包括星型细胞瘤，星型母细胞瘤，混合胶质瘤，多形性胶质母细胞瘤和非星型细胞瘤，包括部分少数胶质细胞瘤，多数室管膜瘤等中枢神经系统肿瘤的诊断和鉴别诊断。

在胶质纤维酸性蛋白抗原制备过程中，采取pGEX-4T-2载体对其全长基因进行表达，发现其原序列在大肠杆菌中不好表达。此外表达的蛋白都以包涵体形式存在。一方面增加纯化成本，另一方面纯化过程可能造成蛋白失活。

为了解决上述技术难题，本发明提供了一种提高GFAP蛋白表达量的基因GFAP-opt及其表达方法。

发明内容

本发明在一个方面，提供了一种GFAP-opt基因，其序列如SEQ.ID.No.2所示。

在另一个方面，本发明提供了一种所述GFAP-opt基因在提高GFAP蛋白表达量中的作用。

在一个实施例中，本发明提供了一种pGEX-4T-2表达载体，其表达所述的GFAP-opt基因，命名为pGEX-4T-2-GFAP-opt。

在一个或多个实施例中，所述载体其进一步包括OmpA信号肽，构建得到pGEX-4T-2-OmpA-GFAP-opt重组质粒。

在一实施例中，所述OmpA信号肽的序列如SEQ.ID.No.3所示。

在一个方面，本发明提供了一种所述pGEX-4T-2-opma-GFAP-opt载体在提高GFAP蛋白可溶性表达中的作用。

在另一个方面，本发明提供了一种提高GFAP蛋白表达量的方法，其特征在于：使用pGEX-4T-2-GFAP-opt载体表达GFAP蛋白。

在本发明的一个方面，提供了一种提高GFAP蛋白可溶性表达的方法，其特征在于：使用pGEX-4T-2-OmpA-GFAP-opt重组质粒表达GFAP蛋白。

在一个实施例中，本发明提供了一种提高GFAP蛋白表达量的方法，其特征在于：用软件OptimumGeneTM分析编码GFAP蛋白的基因序列SEQ ID NO.1，找出其密码子使用偏好以及大肠杆菌使用偏好不同的位点，对于使用偏好不同的密码子位点，用大肠杆菌偏好的密码子替代，设计出密码子优化的GFAP蛋白基因序列SEQ ID NO.2.上述密码子优化的基因序列所编码的蛋白氨基酸序列与原有的氨基酸序列一致，上述密码子优化的基因序列由上海生工生物工程有限公司合成，装入载体pGEX-4T-2，构建成重组质粒pGEX-4T-2-GFAP-opt并表达。

在另一个实施例中，本发明提供了一种提高GFAP蛋白可溶性表达的方法，其特征在于，提供OmpA信号肽序列：SEQ ID NO.3

(MKKTAIAIAVALAGFVTVAQA)，用引物OmpA-F

(GATCCATGAAAAAGACAGCTATCGCGATTGCAGTGGCACTGGCAGGTTTCGTCACCGTCGCTCAGGCTGG)和OmpA-R(AATTCCAGCCTGAGCGACGGTGACGAAACCTGCCAGTGCCACTGCAATCGCGATAGCTGTCTTTTTCTG)经过退火合成DNA片段，并将所述pGEX-4T-2-GFAP-opt用限制性内切酶BamHI和EcoR1进行双酶切，获得线性化的pGEX-4T-2-GFAP-opt线性片段作为插入载体，酶切反应体系为：10×酶切Buffer 2μl，pGEX-4T-2-GFAP-opt质粒1μg，EcoRI 1μl，BamHⅠ1μl，补水至20μl，37℃，1h，构建成重组质粒pGEX-4T-2-OmpA-GFAP-opt并表达。

附图说明

为了更清楚地说明本发明的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其它附图。

图1为pGEX-4T-2-OmpA-GFAP-opt质粒构建流程图。

图2为pGEX-4T-2-OmpA-GFAP-opt质粒双酶切验证结果。

图3为GFAP蛋白表达鉴定的聚丙烯酰胺凝胶电泳图。pGEX-4T-2-GFAP为

GFAP原始序列；pGEX-4T-2-GFAP-opt为GFAP优化后的序列；

pGEX-4T-2-OmpA-GFAP-opt在优化了GFAP序列之后加入OmpA信号肽。

具体实施方式

本文中，“基因”又可称为遗传因子，是产生一条多肽链或功能RNA所需的全部核苷酸序列。基因支持着生命的基本构造和性能。储存着生命的种族、血型、孕育、生长、凋亡等过程的全部信息。环境和遗传的互相依赖，演绎着生命的繁衍、细胞分裂和蛋白质合成等重要生理过程。生物体的生、长、衰、病、老、死等一切生命现象都与基因有关。它也是决定生命健康的内在因素。因此，基因具有双重属性：物质性(存在方式)和信息性(根本属性)。带有遗传信息的DNA片段称为基因，其他的DNA序列，有些直接以自身构造发挥作用，有些则参与调控遗传信息的表现。组成简单生命最少要265到350个基因。

下面通过具体实施方式来进一步说明本发明的技术方案。本领域技术人员应知晓实施例仅仅是帮助理解本发明，不应视为对本发明的具体限制。

本发明基于大肠杆菌来源优化密码子的胶质纤维酸性蛋白基因在大肠杆菌中表达的平台，通过改造信号肽实现胶质纤维酸性蛋白在大肠杆菌中高效表达，以期能够提高胶质纤维酸性蛋白在大肠杆菌中的分泌能力。

因此，本发明首先提供了一种大肠杆菌密码子优化的胶质纤维酸性蛋白碱基序列，序列为SEQ ID NO.2，有效的使胶质纤维酸性蛋白在大肠杆菌中大量表达。进一步的对pGEX-4T-2载体进行改造，增加了OmpA信号肽，信号肽序列为SEQ ID NO.3。本发明通过融合OmpA信号肽，使胶质纤维酸性蛋白在大肠杆菌中的分泌增加，改善胶质纤维酸性蛋白包涵体形式的表达。

GFAP-opt基因

在一个方面，为了提高GFAP蛋白的表达量，用软件分析编码GFAP蛋白的原始基因序列SEQ ID NO.1，找出潜在的有效突变位点。所述位点影响GFAP蛋白的表达量。

在一个或多个实施例中，所述软件是OptimumGeneTM。

在一个或多个实施例中，所述位点数量可以是1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20或者更多个。

在一个或多个实施例中，所述位点是其原始密码子使用偏好与大肠杆菌使用偏好不同的位点。

在另一个方面，对潜在位点进行突变，设计出优化的GFAP蛋白基因序列SEQ IDNO.2。将上述优化的基因序列合成，装入载体，构建成重组质粒。经测序证实合成的序列正确。

在一个或多个实施例中，所述突变优化后的GFAP基因命名为GFAP-opt基因，其序列如SEQ.ID.No.2所示，其可以有效的使胶质纤维酸性蛋白在大肠杆菌中大量表达。

pGEX-4T-2-GFAP-opt重组质粒

在另一个方面，设计出优化的GFAP蛋白基因序列。将上述优化的基因序列合成，装入载体，构建成重组质粒。

在一个或多个实施例中，所述载体为原核载体、真核载体或病毒载体。

原核表达的优点在于能够短时间内获得基因表达产物，而且所需的成本相对比较低廉。方法也比较简单，可以表达的蛋白也比较多，但缺点是表达出来的蛋白没有经过修饰，不一定具有天然的活性，且表达系统无法对表达时间及表达水平进行调控，有些基因持续表达会对宿主细胞产生毒害作用，过量表达可能导致非生理反应，目前蛋白常以包涵体形式表达，也会导致产物纯化困难。可用于抗体制备或检测，但应避免做功能试验。

真核表达常用酵母、昆虫、动物和哺乳类细胞等表达系统。其优点是根据原核生物蛋白与靶DNA作用的高度特异性设计，不存在基因的非特异性激活或抑制。能诱导基因高效表达，可达105倍。能严格调控基因表达。

目前的表达系统有优点也有不足，但一般理想的表达系统符合以下几点：首先是特异性，该系统不受其他内源因素的影响，仅能被外源的非毒性药物所活化。二是非干扰性，对细胞通路无干扰。及可诱导性，诱导剂的生物利用率，可塑性和剂量依赖性。

因此选择表达系统时，必须充分考虑各种因素，如蛋白性质、实验条件、生产成本、表达水平及安全性等。权衡利弊后再选择相应的表达系统。

在一个或多个实施例中，本发明的所述载体为载体为pGEX-4T-2。

在一个或多个实施例中，所述优化后的重组质粒命名为

pGEX-4T-2-GFAP-opt。其可以有效的提高胶质纤维酸性蛋白在大肠杆菌中的表达量。

pGEX-4T-2-OmpA-GFAP-opt重组质粒

在一个方面，为了使胶质纤维酸性蛋白在大肠杆菌中的分泌增加，改善胶质纤维酸性蛋白包涵体形式的表达，在重组质粒上，融合信号肽。

信号肽是引导新合成的蛋白质向分泌通路转移的短(长度5-30个氨基酸)肽链。常指新合成多肽链中用于指导蛋白质的跨膜转移(定位)的N-末端的氨基酸序列(有时不一定在N端)。

在起始密码子后，有一段编码疏水性氨基酸序列的RNA区域，该氨基酸序列就被称为信号肽序列，它负责把蛋白质引导到细胞含不同膜结构的亚细胞器内。

外源蛋白在宿主菌，如大肠杆菌中的表达形式多为细胞内不溶性表达(包涵体)，少数为细胞外分泌表达。利用信号肽来引导外源蛋白定位分泌到细胞特定区间，提高可溶性，可避免因包涵体复性带来的困难。

在一个或多个实施例中，本发明采用的信号肽来自表达系统自身的信号序列或外源信号序列，或两者兼而有之。

在一个或多个实施例中，本发明外源基因的表达系统为原核表达系统，优选的，为如大肠杆菌、L型细菌、芽孢杆菌和乳酸杆菌，进一步优选的，为大肠杆菌表达系统。

在一个或多个实施例中，本发明外援基因的表达系统为真核表达系统，优选的，为毕赤酵母和昆虫杆状病毒表达系统。

在一个或多个实施例中，所述信号肽为OmpA信号肽，优选地，所述OmpA信号肽的核苷酸序列如SEQ IN NO.3所示。

在一个或多个实施例中，融合了信号肽的重组质粒命名为pGEX-4T-2-OmpA-GFAP-opt重组质粒。

本发明的外源基因连接上信号肽后，在原核表达系统，如大肠杆菌中得到了分泌表达；本研究通过融合OmpA信号肽，使胶质纤维酸性蛋白在大肠杆菌中的分泌增加，改善胶质纤维酸性蛋白包涵体形式的表达。

在一个方面，本发明构建了带有OmpA信号肽的pGEX-4T-2的表达载体

在另一个方面，本发明提供了一种针对大肠杆菌进行密码子优化的GFAP碱基序列，具有很强的表达活性，能实现外源基因在大肠杆菌中的高表达。

在一个或多个实施例中，本发明通过融合信号肽，可以使GFAP的分泌量增加，改善GFAP抗原制备过程中包涵体的问题，为后续的纯化带来很大的便利。

实施例

实施例1.密码子优化的胶质纤维酸性蛋白基因序列的设计与合成

用软件OptimumGeneTM分析编码GFAP蛋白的基因序列SEQ ID NO.1，找出其密码子使用偏好以及大肠杆菌使用偏好不同的位点。对于使用偏好不同的密码子位点，用大肠杆菌偏好的密码子替代，设计出密码子优化的GFAP蛋白基因序列SEQ ID NO.2.上述密码子优化的基因序列所编码的蛋白氨基酸序列与原有的氨基酸序列一致。上述密码子优化的基因序列由上海生工生物工程有限公司合成，装入载体pGEX-4T-2，构建成重组质粒pGEX-4T-2-GFAP-opt。经测序证实合成的序列正确。

为了明确显示进行密码子优化的位点，现将密码子优化后的核酸序列GFAP-opt与密码子优化前的核酸序列GFAP进行对比。比较结果如下(*为终止密码子)

优化前ATG GAG AGG AGA CGC ATC ACC TCC GCT GCT CGC CGC TCC TAC GTC

优化后ATG GAA CGT CGT CGT ATC ACC TCC GCT GCG CGT CGT AGC TAC GTT

氨基酸M E R R R I T S A A R R S Y V

优化前TCC TCA GGG GAG ATG ATG GTG GGG GGC CTG GCT CCT GGC CGC CGT

优化后TCC AGC GGT GAA ATG ATG GTT GGT GGC CTG GCG CCG GGT CGT CGT

氨基酸S S G E M M V G G L A P G R R

优化前CTG GGT CCT GGC ACC CGC CTC TCC CTG GCT CGA ATG CCC CCT CCA

优化后CTG GGT CCG GGC ACC CGT CTG AGC CTG GCG CGTATG CCG CCGCCG

氨基酸L G P G T R L S L A R M P P P

优化前CTC CCG ACC CGG GTG GAT TTC TCC CTG GCT GGG GCA CTC AAT GCT

优化后CTG CCG ACC CGC GTT GAT TTC TCT CTG GCC GGC GCG CTGAAC GCT

氨基酸L P T R V D F S L A G A L N A

优化前GGC TTC AAG GAG ACC CGG GCC AGT GAG CGG GCA GAG ATG ATG GAG

优化后GGC TTC AAA GAA ACC CGT GCT TCT GAA CGT GCG GAA ATG ATG GAA

氨基酸G F K E T R A S E R A E M M E

优化前CTC AAT GAC CGC TTT GCC AGC TAC ATC GAG AAG GTT CGC TTC CTG

优化后CTGAAC GAT CGT TTC GCA AGC TATATC GAA AAA GTT CGT TTC CTG

氨基酸L N D R F A S Y I E K V R F L

优化前GAA CAG CAA AAC AAG GCG CTG GCT GCT GAG CTG AAC CAG CTGCGG

优化后GAA CAG CAG AAC AAA GCC CTG GCG GCC GAA CTG AAC CAG CTG CGT

氨基酸E Q Q N K A L A A E L N Q L R

优化前GCC AAG GAG CCC ACC AAG CTG GCA GAC GTC TAC CAG GCT GAG CTG

优化后GCA AAA GAA CCG ACC AAA CTG GCA GAC GTT TAC CAG GCG GAA CTG

氨基酸A K E P T K L A D V Y Q A E L

优化前GA GAG CTG CGG CTG CGG CTC GAT CAA CTC ACC GCC AAC AGC GCC

优化后CGC GAA CTG CGT CTG CGT CTG GAC CAG CTG ACC GCA AAC AGT GCG

氨基酸R E L R L R L D Q L T A N S A

优化前CGG CTG GAG GTT GAG AGG GAC AAT CTG GCA CAG GAC CTG GCC ACT

优化后CGC CTG GAA GTT GAA CGT GAT AAC CTG GCG CAA GAT CTG GCG ACT

氨基酸R L E V E R D N L A Q D L A T

优化前GTG AGG CAG AAG CTC CAG GAT GAA ACC AAC CTG AGG CTG GAA GCC

优化后GTT CGT CAG AAA CTG CAG GAC GAA ACT AAC CTG CGT CTG GAA GCG

氨基酸V R Q K L Q D E T N L R L E A

优化前GAG AAC AAC CTG GCT GCC TAT AGA CAG GAA GCA GAT GAA GCC ACC

优化后GAA AAC AAC CTG GCG GCG TAC CGC CAG GAA GCT GAC GAA GCCACT

氨基酸E N N L A A Y R Q E A D E A T

优化前CTG GCC CGT CTG GAT CTG GAG AGG AAG ATT GAG TCG CTG GAGGAG

优化后CTG GCG CGC CTG GAT CTG GAA CGT AAA ATC GAA AGC CTG GAA GAA

氨基酸L A R L D L E R K I E S L E E

优化前GAG ATC CGG TTC TTG AGG AAG ATC CAC GAG GAG GAG GTT CGG GAA

优化后GAA ATC CGT TTC CTG CGT AAA ATC CAC GAA GAA GAA GTG CGT GAA

氨基酸E I R F L R K I H E E E V R E

优化前CTC CAG GAG CAG CTG GCC CGA CAG CAG GTC CAT GTG GAG CTT GAC

优化后CTG CAG GAA CAG CTG GCC CGT CAG CAG GTT CAC GTT GAA CTG GAT

氨基酸L Q E Q L A R Q Q V H V E L D

优化前GTG GCC AAG CCA GAC CTC ACC GCA GCC CTG AAA GAG ATC CGC ACG

优化后GTA GCT AAA CCG GAT CTG ACC GCG GCT CTG AAA GAAATC CGT ACC

氨基酸V A K P D L T A A L K E I R T

优化前CAG TAT GAG GCA ATG GCG TCC AGC AAC ATG CAT GAA GCC GAA GAG

优化后CAG TAT GAA GCG ATG GCATCC AGC AAC ATG CAC GAA GCG GAA GAA

氨基酸Q Y E A M A S S N M H E A E E

优化前TGG TAC CGC TCC AAG TTT GCA GAC CTG ACA GAC GCT GCT GCC CGC

优化后TGG TAT CGC TCT AAA TTC GCG GAC CTG ACT GAT GCG GCT GCG CGT

氨基酸W Y R S K F A D L T D A A A R

优化前AAC GCG GAG CTG CTC CGC CAG GCC AAG CAC GAA GCC AAC GAC TAC

优化后AAC GCG GAA CTG CTG CGC CAG GCG AAA CAC GAA GCG AAC GAT TAC

氨基酸N A E L L R Q A K H E A N D Y

优化前CGG CGC CAG TTG CAG TCC TTG ACC TGC GAC CTG GAG TCT CTG CGC

优化后CGT CGT CAG CTG CAG TCT CTG ACC TGC GAT CTG GAA TCT CTG CGT

氨基酸R R Q L Q S L T C D L E S L R

优化前GGC ACG AAC GAG TCC CTG GAG AGG CAG ATG CGC GAG CAG GAG GAG

优化后GGT ACC AAC GAA TCC CTG GAA CGT CAG ATG CGT GAA CAA GAA

GAA

氨基酸G T N E S L E R Q M R E Q E E

优化前CGG CAC GTG CGG GAG GCG GCC AGT TAT CAG GAG GCG CTG GCG CGG

优化后CGT CAC GTT CGT GAA GCA GCG TCC TAC CAG GAA GCG CTG GCG CGT

氨基酸R H V R E A A S Y Q E A L A R

优化前CTG GAG GAA GAG GGG CAG AGC CTC AAG GAC GAG ATG GCC CGC CAC

优化后CTG GAA GAA GAA GGT CAG AGC CTG AAA GAT GAA ATG GCG CGT CAC

氨基酸L E E E G Q S L K D E M A R H

优化前TTG CAG GAG TAC CAG GAC CTG CTC AAT GTC AAG CTG GCC CTG GAC

优化后CTG CAG GAA TAC CAG GAT CTG CTG AAC GTT AAA CTG GCG CTG GAT

氨基酸L Q E Y Q D L L N V K L A L D

优化前ATC GAG ATC GCC ACC TAC AGG AAG CTG CTA GAG GGC GAG GAG AAC

优化后ATT GAA ATC GCG ACC TAC CGT AAA CTG CTG GAA GGT GAA GAA AAC

氨基酸I E I A T Y R K L L E G E E N

优化前CGG ATC ACC ATT CCC GTG CAG ACC TTC TCC AAC CTG CAG ATT CGA

优化后CGTATC ACC ATC CCG GTT CAG ACC TTC AGC AAC CTG CAG ATC CGC

氨基酸R I T I P V Q T F S N L Q I R

优化前GAA ACC AGC CTG GAC ACC AAG TCT GTG TCA GAA GGC CAC CTC AAG

优化后GAA ACC TCC CTG GAT ACC AAA AGC GTT TCT GAA GGC CAC CTG AAA

氨基酸E T S L D T K S V S E G H L K

优化前AGG AAC ATC GTG GTG AAG ACC GTG GAG ATG CGG GAT GGA GAGGTC

优化后CGT AAC ATC GTA GTT AAA ACC GTT GAA ATG CGT GAC GGT GAA GTT

氨基酸R N I V V K T V E M R D G E V

优化前ATT AAG GAG TCC AAG CAG GAG CAC AAG GAT GTG ATG TGA

优化后ATC AAA GAA TCT AAA CAG GAA CAC AAA GAT GTG ATG TAA

氨基酸I K E S K Q E H K D V M*

上述密码子优化的GFAP蛋白基因序列与野生型序列比较密码子偏好性发生了改变。与野生型基因序列相比，密码子优化的基因中大肠杆菌偏好的密码子出现频率增加，但是它们所编码的氨基酸序列不变，从而使GFAP蛋白更适于在大肠杆菌中的蛋白表达。

实施例2pGEX-4T-2-OmpA-GFAP-opt质粒构建

2.1OmpA信号肽片段和载体的获得

本发明提供的OmpA信号肽序列：MKKTAIAIAVALAGFVTVAQA，用引物

OmpA-FGATCCATGAAAAAGACAGCTATCGCGATTGCAGTGGCACTGGCAGGTTTCGTCACCGTCGCTCAGGCTGG)和OmpA-R(AATTCCAGCCTGAGCGACGGTGACGAAACCTGCCAGTGCCACTGCAATCGCGATAGCTGTCTTTTTCTG)经过退火合成DNA片段，并将pGEX-4T-2-GFAP-opt用限制性内切酶BamHI和EcoR1进行双酶切,获得线性化的pGEX-4T-2-GFAP-opt线性片段作为插入载体。酶切反应体系为：10×酶切Buffer 2μl，pGEX-4T-2-GFAP-opt质粒1μg，EcoRI 1μl，BamHⅠ1μl，补水至20μl，37℃，1h。

2.1酶切产物纯化

TAE缓冲液制作1％琼脂糖凝胶，酶切产物进行电泳，120V，1h；称重空1.5mlEp管，紫外灯下切下含目的DNA的凝胶置入Ep管；切碎胶块，分析天平称胶块的质量，按100mg＝100μl进行计算胶块的体积；加入至少1倍等体积的Binding Buffer；把混合物置于60℃水浴中温浴7min至凝胶完全融化，其间每隔2-3分钟混匀一次；转移700μl冷却的DNA-琼脂糖溶液到一个Spin Columns CB2 DNA柱子，室温下，12,000×g离心1min，弃去液体；将柱子重新套回收集管中，加入600μl漂洗液PW至Spin Columns CB2 DNA柱子中，室温下，12,000×g离心1分钟，弃滤出液；重复洗涤一次，将空柱子重新套回收集管中，12,000×g离心1min以甩干柱基质残余的液体；把柱子装在一个干净的1.5ml离心管上，加入30～50μl洗脱液或灭菌水上柱子膜上，12,000×g离心1分钟，离心管中的溶液就是纯化的DNA产物，测定DNA浓度并保存于-20℃。

2.2连接反应

用T4 DNA连接酶将OmpA DNA片段与pGEX-4T-2-GFAP-opt酶切片段连接，得到pGEX-4T-2-OmpA-GFAP-opt重组表达质粒。连接反应体系为：10×T4 DNA Ligase Buffer 1μl，线性化的pGEX-4T-2-GFAP-opt 1μl，退火相关目的片段7μl，T4 DNA Ligase 1μl，混匀，4℃放置16h。连接物转化DH5α感受态细胞，提取质粒。

用限制性内切酶BamHI和XhoI酶切pGEX-4T-2-OmpA-GFAP-opt质粒，验证用酶切体系为：质粒1μL，BamHI 0.3μL，EcoR10.3μL，10×Hbuffer 1μL，加入双蒸水至10μL；回收用酶切体系为：质粒DNA 16μL，BamHI 1μL，EcoR1 1μL，10×Hbuffer 2μL。进行1％琼脂糖凝胶电泳检测酶切产物。酶切验证，酶切验证结果如图2所示，酶切成功的序列由上海生工生物工程有限公司进行测序，测序结果正确，从而得到pGEX-4T-2-OmpA-GFAP-opt重组质粒。过程如图1所示。

实施例3蛋白表达

测序正确的重组质粒转化至宿主菌Rosetta感受态细胞中转化制备pGEX-4T-2-GFAP/pGEX-4T-2-GFAP-opt/pGEX-4T-2-OmpA-GFAP-opt表达菌并保种。(具体步骤如下：1.将1μL溶解的0.2μg/μL的重组质粒加入制备好30μL的Rosetta细菌感受态细胞中，冰上放置30min；2.将此混合液于42℃水浴中热击45s；3.再放在冰上2min；4.往此混合液中加入700μL不含抗生素的LB培养基；5.将混合液置于37℃、200rpm恒温培养振荡器中培养1h；6.取培养好的混合液200μL涂布于50μg/mL卡那霉素抗性LB固体平板培养基上，37℃恒温培养箱正置培养30min后，倒置平板培养12-16h。)挑取阳性单克隆菌落，接种于5mL含50mg/L氨苄抗性的试管LB培养基中，37℃培养过夜后将此培养液接种于200ml含有50mg/L氨苄抗性的三角瓶LB培养基中扩培，37℃，200rpm/min培养至菌液OD值达到0.6-0.8，加入终浓度为0.5mM的IPTG，37℃继续培6h，离心收集菌体并进行超声破碎。图3为GFAP蛋白表达鉴定的聚丙烯酰胺凝胶电泳图.如图我们可以看到，GFAP基因序列经过密码子优化后为GPAP-opt，构建的pGEX-4T-2-GPAP-opt蛋白可以成功被诱导出来，菌体破碎后主要在包涵体中，于是在GFAP-opt序列前加入OmpA信号肽后构建的pGEX-4T-2-OmpA-GPAP-opt表达载体，GFAP可以成功被诱导表达，并且在菌体破碎后的上清中，这有利于后续的纯化。

核苷酸序列

SEQ ID NO.1(GFAP基因核苷酸序列)

ATGGAGAGGAGACGCATCACCTCCGCTGCTCGCCGCTCCTACGTCTCCTCAGGGGAGATGATGGTGGGGGGCCTGGCTCCTGGCCGCCGTCTGGGTCCTGGCACCCGCCTCTCCCTGGCTCGAATGCCCCCTCCACTCCCGACCCGGGTGGATTTCTCCCTGGCTGGGGCACTCAATGCTGGCTTCAAGGAGACCCGGGCCAGTGAGCGGGCAGAGATGATGGAGCTCAATGACCGCTTTGCCAGCTACATCGAGAAGGTTCGCTTCCTGGAACAGCAAAACAAGGCGCTGGCTGCTGAGCTGAACCAGCTGCGGGCCAAGGAGCCCACCAAGCTGGCAGACGTCTACCAGGCTGAGCTGCGAGAGCTGCGGCTGCGGCTCGATCAACTCACCGCCAACAGCGCCCGGCTGGAGGTTGAGAGGGACAATCTGGCACAGGACCTGGCCACTGTGAGGCAGAAGCTCCAGGATGAAACCAACCTGAGGCTGGAAGCCGAGAACAACCTGGCTGCCTATAGACAGGAAGCAGATGAAGCCACCCTGGCCCGTCTGGATCTGGAGAGGAAGATTGAGTCGCTGGAGGAGGAGATCCGGTTCTTGAGGAAGATCCACGAGGAGGAGGTTCGGGAACTCCAGGAGCAGCTGGCCCGACAGCAGGTCCATGTGGAGCTTGACGTGGCCAAGCCAGACCTCACCGCAGCCCTGAAAGAGATCCGCACGCAGTATGAGGCAATGGCGTCCAGCAACATGCATGAAGCCGAAGAGTGGTACCGCTCCAAGTTTGCAGACCTGACAGACGCTGCTGCCCGCAACGCGGAGCTGCTCCGCCAGGCCAAGCACGAAGCCAACGACTACCGGCGCCAGTTGCAGTCCTTGACCTGCGACCTGGAGTCTCTGCGCGGCACGAACGAGTCCCTGGAGAGGCAGATGCGCGAGCAGGAGGAGCGGCACGTGCGGGAGGCGGCCAGTTATCAGGAGGCGCTGGCGCGGCTGGAGGAAGAGGGGCAGAGCCTCAAGGACGAGATGGCCCGCCACTTGCAGGAGTACCAGGACCTGCTCAATGTCAAGCTGGCCCTGGACATCGAGATCGCCACCTACAGGAAGCTGCTAGAGGGCGAGGAGAACCGGATCACCATTCCCGTGCAGACCTTCTCCAACCTGCAGATTCGAGAAACCAGCCTGGACACCAAGTCTGTGTCAGAAGGCCACCTCAAGAGGAACATCGTGGTGAAGACCGTGGAGATGCGGGATGGAGAGGTCATTAAGGAGTCCAAGCAGGAGCACAAGGATGTGATGTGA

SEQ ID NO.2(GFAP-opt基因核苷酸序列)

ATGGAACGTCGTCGTATCACCTCCGCTGCGCGTCGTAGCTACGTTTCCAGCGGTGAAATGATGGTTGGTGGCCTGGCGCCGGGTCGTCGTCTGGGTCCGGGCACCCGTCTGAGCCTGGCGCGTATGCCGCCGCCGCTGCCGACCCGCGTTGATTTCTCTCTGGCCGGCGCGCTGAACGCTGGCTTCAAAGAAACCCGTGCTTCTGAACGTGCGGAAATGATGGAACTGAACGATCGTTTCGCAAGCTATATCGAAAAAGTTCGTTTCCTGGAACAGCAGAACAAAGCCCTGGCGGCCGAACTGAACCAGCTGCGTGCAAAAGAACCGACCAAACTGGCAGACGTTTACCAGGCGGAACTGCGCGAACTGCGTCTGCGTCTGGACCAGCTGACCGCAAACAGTGCGCGCCTGGAAGTTGAACGTGATAACCTGGCGCAAGATCTGGCGACTGTTCGTCAGAAACTGCAGGACGAAACTAACCTGCGTCTGGAAGCGGAAAACAACCTGGCGGCGTACCGCCAGGAAGCTGACGAAGCCACTCTGGCGCGCCTGGATCTGGAACGTAAAATCGAAAGCCTGGAAGAAGAAATCCGTTTCCTGCGTAAAATCCACGAAGAAGAAGTGCGTGAACTGCAGGAACAGCTGGCCCGTCAGCAGGTTCACGTTGAACTGGATGTAGCTAAACCGGATCTGACCGCGGCTCTGAAAGAAATCCGTACCCAGTATGAAGCGATGGCATCCAGCAACATGCACGAAGCGGAAGAATGGTATCGCTCTAAATTCGCGGACCTGACTGATGCGGCTGCGCGTAACGCGGAACTGCTGCGCCAGGCGAAACACGAAGCGAACGATTACCGTCGTCAGCTGCAGTCTCTGACCTGCGATCTGGAATCTCTGCGTGGTACCAACGAATCCCTGGAACGTCAGATGCGTGAACAAGAAGAACGTCACGTTCGTGAAGCAGCGTCCTACCAGGAAGCGCTGGCGCGTCTGGAAGAAGAAGGTCAGAGCCTGAAAGATGAAATGGCGCGTCACCTGCAGGAATACCAGGATCTGCTGAACGTTAAACTGGCGCTGGATATTGAAATCGCGACCTACCGTAAACTGCTGGAAGGTGAAGAAAACCGTATCACCATCCCGGTTCAGACCTTCAGCAACCTGCAGATCCGCGAAACCTCCCTGGATACCAAAAGCGTTTCTGAAGGCCACCTGAAACGTAACATCGTAGTTAAAACCGTTGAAATGCGTGACGGTGAAGTTATCAAAGAATCTAAACAGGAACACAAAGATGTGATGTAA

SEQ ID NO.3(信号肽OmpA核苷酸序列)

ATGAAAAAGACAGCTATCGCGATTGCAGTGGCACTGGCAGGTTTCGTCACCGTCGCTCAGGCT

以上所揭露的仅为本发明的几个较佳实施例而已，当然不能以此来限定本发明之权利范围，因此依本发明权利要求所作的等同变化，仍属本发明所涵盖的范围。

序列表

<110> 苏州顺友芯智能科技有限公司

<120> 一种提高GFAP蛋白表达量的基因及其可溶性表达方法

<160> 3

<170> SIPOSequenceListing 1.0

<210> 1

<211> 1299

<212> DNA

<213> 人工序列(2 Ambystoma laterale x Ambystoma jeffersonianum)

<400> 1

atggagagga gacgcatcac ctccgctgct cgccgctcct acgtctcctc aggggagatg 60

atggtggggg gcctggctcc tggccgccgt ctgggtcctg gcacccgcct ctccctggct 120

cgaatgcccc ctccactccc gacccgggtg gatttctccc tggctggggc actcaatgct 180

ggcttcaagg agacccgggc cagtgagcgg gcagagatga tggagctcaa tgaccgcttt 240

gccagctaca tcgagaaggt tcgcttcctg gaacagcaaa acaaggcgct ggctgctgag 300

ctgaaccagc tgcgggccaa ggagcccacc aagctggcag acgtctacca ggctgagctg 360

cgagagctgc ggctgcggct cgatcaactc accgccaaca gcgcccggct ggaggttgag 420

agggacaatc tggcacagga cctggccact gtgaggcaga agctccagga tgaaaccaac 480

ctgaggctgg aagccgagaa caacctggct gcctatagac aggaagcaga tgaagccacc 540

ctggcccgtc tggatctgga gaggaagatt gagtcgctgg aggaggagat ccggttcttg 600

aggaagatcc acgaggagga ggttcgggaa ctccaggagc agctggcccg acagcaggtc 660

catgtggagc ttgacgtggc caagccagac ctcaccgcag ccctgaaaga gatccgcacg 720

cagtatgagg caatggcgtc cagcaacatg catgaagccg aagagtggta ccgctccaag 780

tttgcagacc tgacagacgc tgctgcccgc aacgcggagc tgctccgcca ggccaagcac 840

gaagccaacg actaccggcg ccagttgcag tccttgacct gcgacctgga gtctctgcgc 900

ggcacgaacg agtccctgga gaggcagatg cgcgagcagg aggagcggca cgtgcgggag 960

gcggccagtt atcaggaggc gctggcgcgg ctggaggaag aggggcagag cctcaaggac 1020

gagatggccc gccacttgca ggagtaccag gacctgctca atgtcaagct ggccctggac 1080

atcgagatcg ccacctacag gaagctgcta gagggcgagg agaaccggat caccattccc 1140

gtgcagacct tctccaacct gcagattcga gaaaccagcc tggacaccaa gtctgtgtca 1200

gaaggccacc tcaagaggaa catcgtggtg aagaccgtgg agatgcggga tggagaggtc 1260

attaaggagt ccaagcagga gcacaaggat gtgatgtga 1299

<210> 2

<211> 1299

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 2

atggaacgtc gtcgtatcac ctccgctgcg cgtcgtagct acgtttccag cggtgaaatg 60

atggttggtg gcctggcgcc gggtcgtcgt ctgggtccgg gcacccgtct gagcctggcg 120

cgtatgccgc cgccgctgcc gacccgcgtt gatttctctc tggccggcgc gctgaacgct 180

ggcttcaaag aaacccgtgc ttctgaacgt gcggaaatga tggaactgaa cgatcgtttc 240

gcaagctata tcgaaaaagt tcgtttcctg gaacagcaga acaaagccct ggcggccgaa 300

ctgaaccagc tgcgtgcaaa agaaccgacc aaactggcag acgtttacca ggcggaactg 360

cgcgaactgc gtctgcgtct ggaccagctg accgcaaaca gtgcgcgcct ggaagttgaa 420

cgtgataacc tggcgcaaga tctggcgact gttcgtcaga aactgcagga cgaaactaac 480

ctgcgtctgg aagcggaaaa caacctggcg gcgtaccgcc aggaagctga cgaagccact 540

ctggcgcgcc tggatctgga acgtaaaatc gaaagcctgg aagaagaaat ccgtttcctg 600

cgtaaaatcc acgaagaaga agtgcgtgaa ctgcaggaac agctggcccg tcagcaggtt 660

cacgttgaac tggatgtagc taaaccggat ctgaccgcgg ctctgaaaga aatccgtacc 720

cagtatgaag cgatggcatc cagcaacatg cacgaagcgg aagaatggta tcgctctaaa 780

ttcgcggacc tgactgatgc ggctgcgcgt aacgcggaac tgctgcgcca ggcgaaacac 840

gaagcgaacg attaccgtcg tcagctgcag tctctgacct gcgatctgga atctctgcgt 900

ggtaccaacg aatccctgga acgtcagatg cgtgaacaag aagaacgtca cgttcgtgaa 960

gcagcgtcct accaggaagc gctggcgcgt ctggaagaag aaggtcagag cctgaaagat 1020

gaaatggcgc gtcacctgca ggaataccag gatctgctga acgttaaact ggcgctggat 1080

attgaaatcg cgacctaccg taaactgctg gaaggtgaag aaaaccgtat caccatcccg 1140

gttcagacct tcagcaacct gcagatccgc gaaacctccc tggataccaa aagcgtttct 1200

gaaggccacc tgaaacgtaa catcgtagtt aaaaccgttg aaatgcgtga cggtgaagtt 1260

atcaaagaat ctaaacagga acacaaagat gtgatgtaa 1299

<210> 3

<211> 63

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 3

atgaaaaaga cagctatcgc gattgcagtg gcactggcag gtttcgtcac cgtcgctcag 60

gct 63

Claims

1.一种GFAP-opt基因，其核苷酸序列如SEQ.ID.No.2所示。

2.权利要求1所述基因在提高GFAP蛋白表达量中的作用。

3.一种pGEX-4T-2表达载体，其表达权利要求1所述的基因。

4.权利要求3中的载体，其进一步包括OmpA信号肽。

5.权利要求4中的载体，所述OmpA信号肽的核苷酸序列如SEQ.ID.No.3所示。

6.权利要求4或5中的载体在提高GFAP蛋白可溶性表达中的作用。

7.一种提高GFAP蛋白表达量的方法，其特征在于：使用权利要求3中的载体表达GFAP蛋白。

8.一种提高GFAP蛋白可溶性表达的方法，其特征在于：使用权利要求5中的载体表达GFAP蛋白。

9.一种提高GFAP蛋白表达量的方法，其特征在于：用软件OptimumGeneTM分析编码GFAP蛋白的基因序列SEQ ID NO.1，找出其密码子使用偏好以及大肠杆菌使用偏好不同的位点，对于使用偏好不同的密码子位点，用大肠杆菌偏好的密码子替代，设计出密码子优化的GFAP蛋白基因序列SEQ ID NO.2，上述密码子优化的基因序列所编码的蛋白氨基酸序列与原有的氨基酸序列一致，上述密码子优化的基因序列由上海生工生物工程有限公司合成，装入载体pGEX-4T-2，构建成重组质粒pGEX-4T-2-GFAP-opt并表达。

10.一种提高GFAP蛋白可溶性表达的方法，其特征在于，提供OmpA信号肽序列：SEQ IDNO.3(MKKTAIAIAVALAGFVTVAQA)，用引物OmpA-F(GATCCATGAAAAAGACAGCTATCGCGATTGCAGTGGCACTGGCAGGTTTCGTCACCGTCGCTCAGGCTGG)和OmpA-R(AATTCCAGCCTGAGCGACGGTGACGAAACCTGCCAGTGCCACTGCAATCGCGATAGCTGTCTTTTTCTG)经过退火合成DNA片段，并将所述pGEX-4T-2-GFAP-opt用限制性内切酶BamHI和EcoR1进行双酶切，获得线性化的pGEX-4T-2-GFAP-opt线性片段作为插入载体，酶切反应体系为：10×酶切Buffer 2μl，pGEX-4T-2-GFAP-opt质粒1μg，EcoRI 1μl，BamHⅠ1μl，补水至20μl，37℃，1h，构建得到重组质粒pGEX-4T-2-OmpA-GFAP-opt并表达。