一种CHO细胞中重组糖蛋白高水平表达的载体系统pGN
技术领域
本发明涉及基因工程领域。更具体地,本发明涉及一种CHO细胞中重组糖蛋白高水平表达的载体系统pGN。本发明还提供了特别适合在动物细胞中高效表达IFNβ的表达载体。
背景技术
目前已发展了多种蛋白质表达系统来生产生物体的外源蛋白,比如大肠埃希氏菌表达系统,酵母表达系统,高等真核细胞表达系统等,但这些系统仍存在某些有待改进的缺陷。如何应用这些新的表达系统来高效表达所需目的基因,也是本领域中急需摸索和研究的问题。
例如大肠杆菌作为宿主可表达多种蛋白,但是其存在(1)缺少真核生物的蛋白翻译后的修饰和加工,如剪切、糖基化、形成二硫键等;(2)表达的蛋白多形成不溶性包涵体,需要经过复杂的复性才能恢复构象和活性;(3)菌体蛋白较不利于纯化等缺点。
而酿酒酵母系统也具有局限性:(1)产量通常较低;(2)表达质粒易于丢失;(3)缺乏强有力的受严格调控的启动子;(4)外源蛋白过度糖基化修饰会严重的改变蛋白质的免疫原性、降低活性、缩短滞留时间;(5)分泌效率差,纯化困难。
综上所述,目前人类的糖基化蛋白质在动物细胞中表达存在表达量较低、生产成本高,或在细菌中表达时活性较低的技术难点。因此,本领域迫切需要开发一种在动物细胞中高效表达人类糖基化蛋白(尤其是IFNβ)的方法。
发明内容
本发明的目的就是提供一种在动物细胞中高效表达人类糖基化蛋白(尤其是IFNβ)的方法。
在本发明的第一方面,提供了一种可用于在动物细胞内表达外源蛋白的表达载体,其特征在于,所述的载体含有表达外源蛋白的表达盒,所述的表达盒从5’至3’依次具有以下元件:
(a)第一启动子,所述的第一启动子选自:CMV启动子;
(b)多克隆位点以及任选的位于多克隆位点之中、之前或之后的外源蛋白的编码序列;
(c)第一polyA序列,所述的第一polyA序列选自:牛生长因子polyA(bovine growth factor hormone polyA);
(d)第二启动子,所述的第二启动子选自:β-肌动蛋白启动子、和SV40早期启动子、;
(e)选择标记基因,所述的选择标记基因选自:DHFR基因;和
(f)第二polyA信号序列,所述的第二polyA信号序列选自:SV40 polyA信号序列。
在另一优选例中,第二启动子是鸡的β-肌动蛋白(chicken β-actin)启动子。
在另一优选例中,所述的表达载体还含有增强子。
在另一优选例中,所示的表达载体在元件(a)和(b)之间还具有用于mRNA测序的T7启动子序列。
在另一优选例中,所述的增强子位于外源蛋白的编码序列的上游。
在另一优选例中,所述的外源蛋白的编码序列和所述选择标记基因含有起始密码子ATG和终止密码子。
在另一优选例中,所述的外源蛋白选自下组:促红细胞生成素、粒细胞集落刺激因子、粒-巨噬细胞集落刺激因子、垂体肽激素、绝经期促性腺激素、胰岛素样生长因子(如生长调节素-C)、角化细胞生长因子、神经胶质细胞系产生的神经营养因子、血栓调节蛋白、碱性纤维母细胞生长因子、胰岛素、因子VII、因子VIII、生长激素、骨形态形成蛋白-2、血小板产生的生长因子、水蛭素、及它们突变蛋白、片段、可溶性形式、功能性衍生物、融合蛋白。
在另一优选例中,所述的外源蛋白是β干扰素。
在另一优选例中,所述的β干扰素来源于人。
在另一优选例中,所述的β干扰素具有天然序列、变异序列或重组序列。更佳地,所述的β干扰素具有SEQ ID NO:1所述的核苷酸序列
在另一优选例中,所述的抗性基因选自:腺苷脱氨酶(ADA)、新霉素(neo)、二氢叶酸还原酶(DHFR)、潮霉素B磷酸转移酶(HPH)、胸苷激酶(tk)、黄嘌呤-鸟嘌呤磷酸核糖转移酶(gpt)、多重耐药基因(MDR)、鸟氨酸脱羧酶(ODC)和N-(磷酸乙酰)-L-天冬氨酸抗性(CAD)、或嘌呤霉素-乙酰转移酶(PAC)
在另一优选例中,所述的标记基因是二氢叶酸还原酶基因(DHFR)。
在另一优选例中,所述的标记基因具有SEQ ID NO:2所示的核苷酸序列。
在另一优选例中,所述的载体还含有用于在大肠杆菌中扩增载体的复制起点(pUC)、以及用于在大肠杆菌中进行筛选的另一筛选基因。其中,所述的筛选基因、所述的标记基因和所述的编码外源蛋白的基因各不相同。
在另一优选例中,所述的表达载体是包含序列如SEQ ID NO:1所示外源蛋白编码序列和序列如SEQ ID NO:2所示的标记基因的表达载体(pGN/IFNβ)。
在本发明的第二方面,提供了由本发明第一方面中任一所述的表达载体所转化的宿主细胞。
在另一优选例中,所述的宿主细胞是动物细胞。
在另一优选例中,所述的宿主细胞选自中国仓鼠卵巢细胞(CHO)、小鼠细胞(NIH/3T3)、猴细胞(COS-1细胞)或人细胞(Hela细胞)。
在另一优选例中,所述的宿主细胞中具有3-20个所述的表达载体、3-20个所述的表达盒、或、3-20个拷贝的所述外源基因的编码序列。
在另一优选例中,所述的宿主细胞表达外源蛋白的速度≥1.5pg/细胞/天,较佳地≥2.0pg/细胞/天,更佳地≥3.0pg/细胞/天,更佳地≥4.0pg/细胞/天,≥5.0pg/细胞/天。
在本发明的第三方面,提供了一种制备外源蛋白的方法,其特征在于,所述的方法包括:
(a)培养本发明第二方面中所述的宿主细胞,从而表达所述的外源蛋白;
(b)分离出表达的所述的外源蛋白。
应理解,在本发明范围内中,本发明的上述各技术特征和在下文(如实施例)中具体描述的各技术特征可以互相组合,从而构成新的或优选的技术方案。例如,就某一大范围(如10-100)的上限可以与另一优选的较小范围(如20-80)的下限20进行组合,从而构成另一范围(例如20-100),反之亦然。限于篇幅,在此不再一一累述。
附图说明
图1:pGN载体和pGN/IFNβ载体构建过程示意图。
其中,各元件如下:
元件 |
功能 |
pCMV(CMV启动子) |
转录起始 |
pT7(T7启动子) |
体外mRNA测序起始 |
MCS(多克隆酶切位点) |
克隆目的基因所用 |
BGH PolyA(牛生长因子polyA位点) |
转录终止和转录后RNA加工信号 |
chicken β-actin启动子 |
启动DHFR选择标记基因的表达 |
DHFR基因 |
用于细胞株筛选的选择标记基因 |
ColE1 |
在大肠杆菌中扩增载体的复制起点 |
图2:pGN/IFNβ酶切图谱。
图3:pGN/IFNβ转化动物细胞所得高表达细胞株的免疫活性结果,后者采用的抗体是鼠源抗人IFNβ的单克隆抗体。
具体实施方式
在重组蛋白表达领域,要获得高表达量的表达载体更是取决于众多因素。例如所采用的表达方式有关、所采用的表达盒中的各元件、各元件的组合位置、基因拷贝数等。
本发明人经过广泛而深入的研究,首次开发了将待表达的外源基因与一抗性的标记基因偶联(或配对连接),从而构成一“偶联的”、整体性的双基因表达盒。在该表达盒中,外源基因的翻译和标记基因(如DHFR)的翻译是相对独立,但又有联系。在宿主细胞的培养(或筛选)条件下,标记基因的表达是为了保证外源基因的表达,从而使外源基因随选择标记基因拷贝数在基因扩增过程中的增加而增加,从而获得高表达外源蛋白的细胞株。在此基础上完成了本发明。
外源蛋白
如本文所用,术语“外源蛋白的编码序列”、“异源编码序列”、“异源基因序列”、“异源基因”、“重组基因”、“感兴趣的基因”、“目的基因”和“转基因”可互换使用。这些术语用于DNA序列时指编码重组或异源基因产物的DNA序列。所述异源基因序列在宿主细胞中天然不存在而且来自不同种的生物。可使本发明的重组或异源基因产物在哺乳动物细胞中表达和大量收集。所述基因产物可以是肽或多肽,可以是任何感兴趣的蛋白质,如治疗蛋白质(如白介素)或酶或多聚蛋白质的亚单元(如抗体或其片段)。所述重组产物的基因可包含信号序列,其编码的信号肽可使宿主生产细胞表达的多肽分泌出来的。在本发明的进一步优选的实施方式中,产物蛋白是为分泌蛋白质。
代表性的外源蛋白包括(但并不限于):促红细胞生成素、粒细胞集落刺激因子、粒-巨噬细胞集落刺激因子、垂体肽激素、绝经期促性腺激素、胰岛素样生长因子(如生长调节素-C)、角化细胞生长因子、神经胶质细胞系产生的神经营养因子、血栓调节蛋白、碱性纤维母细胞生长因子、胰岛素、因子VII、因子VIII、生长激素、骨形态形成蛋白-2、血小板产生的生长因子、水蛭素、及它们突变蛋白、片段、可溶性形式、功能性衍生物、融合蛋白。
一种特别优选外源蛋白是β干扰素,尤其是人β干扰素。
如本文所用,术语“人β干扰素基因”、“人IFNβ基因”可互换使用,均指包含本发明SEQ ID NO:1所示的序列,且可表达产生本发明的人β干扰素的核苷酸序列。该术语还包括IFN β基因的天然序列、变异序列或重组序列。
在本发明的一个实施方式中,可通过常规分子生物学方法获得所述的外源基因(例如人β干扰素基因),所述方法可按照常规条件如Sambrook等人,《分子克隆:实验室指南》(New York:Cold Spring Harbor Laboratory Press,1989)中所述的条件进行,或者按照CN200710045279.5中所述的方法进行。
其他元件
在本发明中,可使用的标记基因没有特别限制,代表性的标记基因选自下组:二氢叶酸还原酶、新霉素抗性以及绿色荧光蛋白(GFP),或用于大肠杆菌的四环素或氨苄青霉素抗性基因。
在本发明中,可使用的启动子(包括第一启动子和第二启动子)没有特别限制,代表性的启动子选自(但并不限于):大肠杆菌的lac或trp启动子;λ噬菌体PL启动子;真核启动子包括CMV立即早期启动子、HSV胸苷激酶启动子、早期和晚期SV40启动子、反转录病毒的LTRs和其他一些已知的可控制基因在原核或真核细胞或其病毒中表达的启动子。特别优选的第一启动子是CMV启动子。
在本发明中,可以选用各种常规的多克隆位点(MCS),以便插入外源蛋白的编码序列。当然,插入的外源蛋白的编码序列可以位于在多克隆位点之中、之前或之后。
在本发明中,可使用的polyA序列(包括第一polyA序列和第二polyA序列)没有特别限制,代表性的polyA序列选自(但并不限于):牛生长因子polyA(bovine growth factor hormone polyA),SV40早期启动子、β-肌动蛋白启动子。
优选的第一polyA序列是牛生长因子polyA。
优选的第二启动子是β-肌动蛋白启动子。
如本文所用,术语“间隔序列”指位于各元件之间的起到间隔作用的序列。在本发明中,优选地,间隔序列位于元件外源蛋白的编码序列和β-肌动蛋白启动子之间。间隔序列可以源自天然序列或人工合成的序列。源自天然序列的间隔序列的例子是基因的非翻译区,代表性的例子包括:Histone H3.3 putative transcription pause site的非翻译区,和脑心肌炎病毒(Encephalo Mycardiatis Virus,EMCV)的5’非翻译区等。
当用于在CHO细胞中表达时,优选脑心肌炎病毒(Encephalo Mycardiatis Virus,EMCV)的5’非翻译区。
本发明的外源基因以及其他元件(如启动子、标记基因、polyA序列、间隔序列)的核苷酸全长序列通常可以用PCR扩增法、重组法或人工合成的方法获得。以外源基因为例,对于PCR扩增法,可根据本发明所公开的有关核苷酸序列,尤其是开放阅读框序列来设计引物,并用市售的cDNA库或按本领域技术人员已知的常规方法所制备的cDNA库作为模板,扩增而得有关序列片段。然后再将各次扩增出的片段按正确次序拼接在一起。
术语“重组表达载体”指本领域熟知的细菌质粒、酵母质粒、植物细胞病毒、或其他载体。只要能在宿主体内复制和稳定,任何质粒和载体都可以用。
通常,将获得的用于构成本发明表达盒的各元件,按正确的顺序连接在一起,就可形成本发明的表达盒。然后,将本发明的表达盒插入常规的或市售的表达载体,即可形成本发明的表达载体。
本发明的适合在动物细胞中高效表达人类糖基化蛋白(尤其是IFNβ)的载体,可以用于转化适当的宿主细胞,以使其能够表达蛋白质。
宿主细胞可以是原核细胞,如细菌细胞;或是高等真核细胞,如哺乳动物细胞。代表性例子有:大肠杆菌,CHO、COS、293细胞、或Bowes黑素瘤细胞的动物细胞等。优选的宿主细胞是肝细胞、肾细胞、CHO。更佳地,宿主细胞是CHO细胞。
用重组DNA转化宿主细胞可用本领域技术人员熟知的常规技术进行。当宿主为原核生物如大肠杆菌时,能吸收DNA的感受态细胞可在指数生长期后收获,用CaCl2法处理,所用的步骤在本领域众所周知。另一种方法是使用MgCl2。如果需要,转化也可用电穿孔的方法进行。当宿主是真核生物,可选用如下的DNA转染方法:磷酸钙共沉淀法,常规机械方法如显微注射、电穿孔、脂质体包装等。
获得的转化子可以用常规方法培养,表达本发明的基因所编码的多肽。根据所用的宿主细胞,培养中所用的培养基可选自各种常规培养基。在适于宿主细胞生长的条件下进行培养。当宿主细胞生长到适当的细胞密度后,用合适的方法(如温度转换或化学诱导)诱导选择的启动子,将细胞再培养一段时间。
哺乳动物细胞系的合适培养液和培养方法是本领域熟知的,例如可见US5,633,162中的描述。用于实验室烧瓶培养或低密度细胞培养可满足特定类型细胞需要的标准细胞培养液的例子包括但不限于:Roswell Park Memorial Institute(RPMI)1640培养液(Morre,G,The journal of the American Medical Association,199:519,1967)、L-15培养液(Leibovitz,A等,Amer.J.of Hygiene,78:173,1963)、Dulbecco改良Eagle培养液、Eagle最简单基础培养液(Eagle’s minimal essential medium,MEM)、Ham F12培养液(Ham,R等,Proc.Natl.Acad.Sc.53:288,1965)或缺少白蛋白、运铁蛋白和卵磷脂的Iscoves改良DMEM(Iscoves等,J.Exp.med.1:923,1978)。例如,Ham F10或F12培养液是专门为CHO细胞培养设计的。特别适合于CHO细胞培养的其它培养液见EP-481791中所述。已知此类培养液中可增添胎牛血清(FBS,也称为胎小牛血清FCS),后者提供了天然来源的丰富激素和生长因子。目前哺乳动物细胞的培养是常规操作,在科学教科书和手册中有全面的描述,细节可参见R.Ian Fresney,《动物细胞的培养》(Culture of Animal cells),手册,第4版,Wiley-Liss/N.Y.,2000。
在上面的方法中的重组多肽可在细胞内、或在细胞膜上表达、或分泌到细胞外。如果需要,可利用其物理的、化学的和其它特性通过各种分离方法分离和纯化重组的蛋白。这些方法是本领域技术人员所熟知的。这些方法的例子包括但并不限于:常规的复性处理、用蛋白沉淀剂处理(盐析方法)、离心、渗透破菌、超处理、超离心、分子筛层析(凝胶过滤)、吸附层析、离子交换层析、高效液相层析(HPLC)和其它各种液相层析技术及这些方法的结合。
在本发明的一个优选例中,提供了一种pGN/IFNβ表达载体。在该载体中,外源基因和作为选择的标记基因(二氢叶酸还原酶,DHFR)这两个基因由脑心肌炎病毒(Encephalo Mycardiatis Virus,EMCV)的5’非翻译区相互连接。在该非翻译区之后还含有另外一个β-肌动蛋白启动子,保证目的基因的翻译和DHFR的翻译是独立进行的。DHFR基因的表达是为了保证目的基因的表达。表达载体pGN/IFNβ表达动物细胞分泌型的人IFNβ,所分泌表达重组的人IFNβ具有同天然的人IFNβ相同的氨基酸序列,并具有足够临床使用的效价,因此适用于商业化。
本发明的主要优点包括:
(i)使外源基因随选择标记基因拷贝数在基因扩增过程中的增加而增加,从而获得高表达外源蛋白的细胞株。
(ii)可以快速地获得高表达外源蛋白的细胞株。
(iii)所获得的表达外源蛋白的细胞株的表达速度高。通常,所述的细胞株表达外源蛋白的速度≥2.0pg/细胞/天,甚至≥5.0pg/细胞/天。
下面结合具体实施例,进一步阐述本发明。应理解,这些实施例仅用于说明本发明而不用于限制本发明的范围。下列实施例中未注明具体条件的实验方法,通常按照常规条件,例如Sambrook等人,分子克隆:实验室手册(New York:Cold Spring Harbor Laboratory Press,1989)中所述的条件,或按照制造厂商所建议的条件。除非另外说明,否则百分比和份数按重量计。
除非另行定义,文中所使用的所有专业与科学用语与本领域熟练人员所熟悉的意义相同。此外,任何与所记载内容相似或均等的方法及材料皆可应用于本发明中。文中所述的较佳实施方法与材料仅作示范之用。
实施例1
pGN载体和pGN/IFNβ载体构建
参见图1,先用常规PCR方法获得IFNβ基因以及下表中所示的各元件:
元件 |
功能 |
pCMV(CMV启动子) |
转录起始 |
pT7(T7启动子) |
体外mRNA测序起始 |
MCS(多克隆酶切位点) |
克隆目的基因所用 |
BGH PolyA(牛生长因子polyA位点) |
转录终止和转录后RNA加工信号 |
chicken β-actin启动子 |
启动DHFR选择标记基因的表达 |
DHFR基因 |
用于细胞株筛选的选择标记基因 |
SV40 polyA位点 |
转录终止和转录后RNA加工信号 |
将pCMV(CMV启动子)、pT7(T7启动子)、MCS(多克隆酶切位点)、BGHPolyA(牛生长因子polyA位点)、chicken β-actin启动子、DHFR基因、和SV40polyA位点用连接酶依次连接,形成表达盒。
然后,将表达盒插入含ColE1和Amp(R)抗性基因的质粒,形成表达载体pGN。
将IFNβ基因插入用表达载体pGN的多克隆位点,形成质粒pGN/IFNβ。
pGN/IFNβ的酶切图谱结果如图2所示,显示质粒构建正确。
接着,将表达载体pGN/IFNβ用常规方法转化CHO动物细胞,用在DHFR筛选培养,获得了多株高表达β干扰素的细胞株。
对于所得高表达β干扰素的细胞株,用常规方法(ELISA)进行免疫活性检测,其中采用的抗体是鼠源抗人IFNβ的单克隆抗体。
结果如图3所示,转化的IFNβ细胞株培养24小时后取上清500倍稀释ELISA测量,并计数其细胞数量,计算表达量为5.64pg/细胞/天。
在本发明提及的所有文献都在本申请中引用作为参考,就如同每一篇文献被单独引用作为参考那样。此外应理解,在阅读了本发明的上述讲授内容之后,本领域技术人员可以对本发明作各种改动或修改,这些等价形式同样落于本申请所附权利要求书所限定的范围。
序列表
<110>苏州泽璟生物制药有限公司
<120>一种CHO细胞中重组糖蛋白高水平表达的载体系统pGN
<130>093122
<160>2
<170>PatentIn version 3.5
<210>1
<211>564
<212>DNA
<213>智人(Homo sapiens)
<400>1
atgaccaaca agtgtctcct ccaaattgct ctcctgttgt gcttctccac gacagctctt 60
tccatgagct acaacttgct tggattccta caaagaagca gcaattgtca gtgtcagaag 120
ctcctgtggc aattgaatgg gaggcttgaa tactgcctca aggacaggag gaactttgac 180
atccctgagg agattaagca gctgcagcag ttccagaagg aggacgccgc agtgaccatc 240
tatgagatgc tccagaacat ctttgctatt ttcagacaag attcatcgag cactggctgg 300
aatgagacta ttgttgagaa cctcctggct aatgtctatc atcagagaaa ccatctgaag 360
acagtcctgg aagaaaaact ggagaaagaa gatttcacca ggggaaaacg catgagcagt 420
ctgcacctga aaagatatta tgggaggatt ctgcattacc tgaaggccaa ggaggacagt 480
cactgtgcct ggaccatagt cagagtggaa atcctaagga acttttacgt cattaacaga 540
cttacaggtt acctccgaaa ctga 564
<210>2
<211>554
<212>DNA
<213>人工序列
<220>
<221>misc_feature
<223>DHFR抗性基因
<400>2
atggttcgac cattgaactg catcgtcgcc gtgtcccaag atatggggat tggcaagaac 60
ggagacctac cctggcctcc gctcaggaac gagttcaagt acttccaaag aatgaccaca 120
acctcttcag tggaaggtaa acagattctg gtgattatgg gtaggaaaac ctggttctcc 180
attcctgaga agaatcgacc tttaaaggac agaattaata tagttctcag tagagaactc 240
aaagaaccac cacgaggagc tcattttctt gccaaaagtt tggatgatgc cttaagactt 300
attgaacaac cggaattggc aagtaaagta gacatggttt ggatagtcgg aggcagttct 360
gtttaccagg aagccatgaa tcaaccaggc cacctcagac tctttgtgac aaggatcatg 420
caggaatttg aaagtgacac gtttttccca gaaattgatt tggggaaata taaacttctc 480
ccagaatacc caggcgtcct ctctgaggtc caggaggaaa aaggcatcaa gtataagttt 540
gaagtctacg agaa 554