重组人血清白蛋白的生产方法
技术领域
本发明涉及以重组DNA技术生产人血清白蛋白的方法,特别是涉及合成的由酵母偏性密码子组成的并经过适当修饰的人血清白蛋白基因,携带所说的基因的重组表达载体和用所说的载体转化的酵母宿主细胞,以及由所说的酵母宿主,特别是甲基营养型酵母宿主以可分泌形式生产人血清白蛋白的方法。
技术背景
人血清白蛋白(HSA)是人血浆的主要组成性蛋白质,其含量约占血浆总蛋白质的50%以上。在人的正常生理条件下,人血浆白蛋白具有维持血浆胶体渗透压、营养和促进伤口愈合的作用,而且其作为载体物质,参与诸多疏水性生物分子如激素、生物学活性物质及药物等在血液中的运输。基于人血清白蛋白的这些重要生理学功能,该蛋白质在临床上具有十分重要的治疗应用价值,可用于治疗各种以血浆白蛋白丢失或白蛋白合成减少为基本特征之一的疾病,例如治疗各种创伤、烧伤、外科手术过程中或手术后失血,以及许多慢性消耗性疾病。
迄今为止,临床上使用的HSA和相关制剂主要是以供血者的血液或胎盘组织为来源,经提取和分离制备得到的。使用天然提取的HSA的主要缺点在于,一方面受到血液有限供应的限制,即有限的血液来源难以满足大量生产HSA和其相关制品的需要;另一方面,由于对供血者选择不当,常常可能造成血源污染,例如,肝炎病毒,甚至爱滋病毒的污染。因此,人们一直在试图建立商品化生产HSA可替代方法。随着重组DNA技术的进展,目前已有可能用这一技术大批量生产HSA。
Lawn等人(Nucleic Acids Research 9:6105,(1981))和Dugaiczyk等人(Proc.Natl.Acad.Sci.USA79:71,(1982)分别分离了编码人血清白蛋白的基因并测定了其核苷酸序列。根据所测得的核苷酸序列推断的HSA氨基酸序列,成熟的HSA是由585个氨基酸组成的,分子量约66000道尔顿,等电点为Ip4.7的单链非糖基化蛋白质。该蛋白质最初产生时的是以前原蛋白质的形式存在的,在由细胞分泌和加工过程中分别除去信号肽和前原序列。得到成熟的HSA分子。成熟的HSA分子呈椭圆形三维空间结构,且含有多个二硫键。在分离得到HSA的DAN编码序列后,许多研究人员试图利用各种不同的表达系统中以重组DNA技术大批量生产有相对较高纯度的HSA。例如,Barns描述了从正常人肝细胞中分离HSA的mRNA,并使用该mRNA作为模板,借助反转录酶、Klenow片段及SI核酸酶合成编码前HSA的全长cDNA(参见欧洲专利申请0206733),并描述了携带该cDNA的质粒及其在大肠杆菌中的表达。然而,由于人血清白蛋白的分子量较大,构型复杂,所以使用原核生物大肠杆菌(Latta,M.etal.,Bio/Technology,5:1309-1314,(1987))和枯草芽抱杆菌(Saunders,C.W.et al,J.Bacteriol.169:2917-2925,(1987))等原核表达系统很难得到正确折迭的表达产物。另外,由于在分泌表达产物往往存在难以去除的菌体内毒素及其他蛋白质污染物,所以也很难以得到适于以大剂量临床应用的HSA产物。
使用哺乳动物细胞如CHO细胞,COS细胞及昆虫细胞表达系统,虽然能产生有正确空间构型的蛋白质产物,但培养这些细胞的营养条件要求较高,其传代时间远比微生物长,以致须经过长时间培养才能达到足够高的细胞浓度,而且一般情况下也难以对这些细胞进行必要的改良。因此,从经济角度考虑,使用这些真核生物体生产HSA是不适宜的。
因为所有真核生物体都具有表达遗传信息的机制,所以可望在真核宿主中能够比原核生物体(例如大肠杆菌)中更为有效地表达真核基因。近年来,一些实验室使用低等真核生物体,特别是酵母表达人血清白蛋白已取得了突破性进展。例如欧洲专利申请0344459描述了构建含有转录单元的质粒,将此携带处于AOXI启动子控制下之HSA基因的质粒导入适当宿主,特别是毕赤属酵母菌株(GTS115)的AOXI基因区以得到转化体细胞,然后在含有适当浓度(0.1-5%)甲醇的培养基中培养该转化体细胞,得到以甲醇为唯一碳源的突变体菌株并在培养基分泌产生HSA。有人对毕赤酵母表达产生的重组HSA的理化性质、空间结构及药理学特性与天然HSA进行了一系列比较实验,结果表明两者几乎完全相同(参见Kazuo Ikegayc,Anal,Chem,69:1986-1991,(1997))。另外,欧洲专利申请0339455、0123544、0248637和0251744也分别公开了利用酵母宿主表达人血清白蛋白的方法及相应的产物纯化方法。因此,这些研究成果使得人们利用重组DNA技术以高产量生产高纯度HSA成为可能。
为了进一步提高HSA在酵母细胞中的表达产率,一些实验室还对HSA的信号肽、启动子序列,以及HSA基因的拷贝数等进行了一系列深入研究。例如,欧洲专利申请0329127和0319641分别公开了合成的HSA信号肽核苷酸编码序列。将这些信号肽核苷酸编码序列连接到启动子(例如AOXI、AOX2、或GALI,10)序列编码前原HSA的DNA序列之间,以提高酵母宿主表达和分泌HSA的能力。欧洲专利申请0506040公开了在天然AOX2启动子碱基序列中造成部分缺失或取代,或在其中加入新的碱基序列所得到的突变体AOX2启动子。
另一方面,在努力提高酵母细胞或其他宿主系统表达效力的同时,还着重就重组产生的HSA的纯化方法进行了深入的研究。例如,在培养HSA生产菌方面,还公开了向培养基中添加脂肪酸(欧洲专利申请0504823)、葡萄糖(日本专利公开JP-A219561/1989)、组氨酸(美国专利5612197)以提高生产菌的生长速率并改善HSA产率的方法;在乙酰色氨酸(1-100mM)或其他羧酸盐存在下,加热(50-70℃)处理含HSA的培养物上清以纯化HSA的方法(美国专利5132404);联合使用超滤、加热处理、酸处理和超滤,然后在用阳离子交换剂、疏水层析载体和阴离子交换剂处理,并经盐析得到纯的HSA的方法(美国专利5440018);另外,还公开了在胺类化合物的存在下培养表达HSA的重组体宿主细胞,以抑制重组HSA(rHSA)产物的颜色生成的方法(美国专利5369020);以及用还原剂(如巯基化合物),或用阳离子交换剂除去游离多糖,然后再经热处理以使rHSA脱色的方法(欧洲专利申请0658569)。
如前所述,酵母细胞表达系统,特别使甲基营养型酵母表达系统是用于大批量发酵生产HSA的优选表达系统。尽管现有技术中针对重组载体的构建、用于基因表达的调控元件的修饰及重组体细胞的培养条件等作了多方面的改良,但迄今尚未见到的有关对HSA编码序列进行必要的修饰,通过改变HSA的基因结构以进一步提高其在甲基营养型酵母中表达效率和水平的报导。
发明内容
因此,本发明的一个目的是提供基本上由酵母偏性密码子组成并经过适当修饰的合成的编码人血清白蛋白的核苷酸序列及其功能等同物。
根据本发明这一目的的一个优选实施方案,其中对所说的修饰包括对HSA编码序列的内含子的剪接位点、非转录终止区的转录终止序列、长的重组序列、内部启动子序列及核糖体结合位点的修饰。
根据本发明这一个目的的一个优选方案,其中说的HSA编码序列是经分别合成三组各8个核苷酸链,然后以基于聚合酶链反应的合成技术拼接成三个核苷酸片段,再经克隆和纠正个别碱基错误后彼此串联连接而得到的。
根据本发明这一个目的的一个优选方案,其中所说的HSA编码序列具有如图1A(SEQ ID NO 1)所示的核苷酸序列。
本发明的另一个目的是提供包含上述HSA编码序列的重组表达载体。
根据本发明这一个目的的一个优选方案,其中所说的重组表达载体包括一个或多个由(1)甲基营养型酵母之甲醇反应性基因的启动子区域,(2)编码啤酒酵母α交配因子(AMF)前原序列和编码HSA的核苷酸序列,(3)在甲基营养型酵母中有功能活性的转录终止子的,以及(4)至少一个可选择标志基因和细菌复制原点组成的表达盒。
本发明的再一目的是提供上述携带HSA编码序列的重组表达载体转化的甲基营养型酵母细胞。
根据本发明这一目的的一个优选实施方案,其中所说的甲基营养型酵母是巴斯德毕赤酵母细胞。
根据本发明这一目的的一个优选方案,其中所说的酵母细胞可以是具有Mut+或Mut-表型的。
本发明再一个目的是提供以重组DNA技术生产人血清白蛋白的方法,该方法包括在适于表达所需的蛋白质的条件下培养按上述方法制备的包含编码人血清白蛋白之核苷酸序列的酵母宿主细胞,然后从培养物中回收并纯化所需的人血清白蛋白。
本发明再一个目的提供按上述方法生产的,基本上具有SEQ ID NO:2所示氨基酸序列的人血清白蛋白。
就以DNA重组技术生产异源蛋白质,特别是对纯度要求极高且分子中富含巯基的人血清白蛋白来说,酵母的最突出的优点之一是其能够向培养基中分泌异源蛋白质产物。因此,使用酵母表达系统能够以较高的起始纯度得到被分泌的产物,从而可简化纯化步骤。特别是对于富含巯基的HSA来说,建立能够向培养基中分泌表达产物的酵母表达系统的另一个具有说服力的理由在于HSA产物更易于通过二硫键形成来维持其准确的四维结构。细胞和细胞外介质的分泌途径是能够支持二硫键形成的氧化环境(Smith,et al.,Science 229:1219(1985))。相反,胞浆则是一个不能形成二硫键的还原环境。细胞破碎后,如果二硫键形成过快,可导致随机二硫键的生成。因此,最好是通过分泌途径生产富含二硫键的蛋白质,如HSA。
为了克服某些与啤酒酵母有关的问题,例如质粒选择标志的丢失以及在高密度发酵条件下的质粒分配、拷贝数和稳定性等问题,进而建立了基于甲基营养酵母,如巴斯德毕赤酵母的酵母表达系统。这一系统的一个关键性特征是其利用衍生于巴斯德毕赤酵母的甲醇调节的醇氧化酶-1(AOXI)基因作为启动子,驱动外源基因的表达(参见欧洲专利申请183071)。该表达系统的另一个特征是可将表达盒稳定的整合到细胞染色体中,从而显著降低载体的丢失的机会。
在本发明之前,不仅已使用巴斯德毕赤酵母成功的生产了例如乙型肝炎表面抗原(Cregg et al.,Bio/Technology 5:479(1987))、溶菌酶和转化酶(Digan et al.Developments in Industrial Microbiology 29:59(1988);Tschopp et al.,Bio/Technology5:1305(1987)),以及表皮生长因子(国际专利WO90/10697),而且也已在甲基营养酵母,特别是巴斯德毕赤酵母中成功的表达了人血清白蛋白(欧洲专利申请0344459)。现有技术中使用的HSA基因序列基本上是基于Lawn等人和Dugaiczyk等人前已分离并测序的HSA基因序列。然而,本发明人的早期研究发现,虽然HSA基因更适于在真核生物体包括在酵母中表达,但考虑到人细胞与低等真核生物体如酵母细胞在结构和蛋白质的生物合成机制例如密码子的使用频率、基因转录的启动与转录效率、RNA的剪切与翻译效率以及翻译产物的分泌等方面存在很大差异,因而有必要对天然HSA基因进行某些修饰,使之更适于在酵母系统,特别是毕赤酵母细胞中稳定地存在,并更为有效的转录和转译。
另外,一些研究表明,不同生物体在密码子使用频率上存在很大差异,从而直接影响转译效率和表达水平。如果对异源基因进行适当的改造,使待表达基因的密码子更适合于所选择的表达系统的密码子使用频率,必将有利于提高外源基因的总体表达效率。Kerlak等人(Bio/Technology 8:939-42,(1990))按照双子叶植物的密码子使用频率修饰苏云金牙孢杆菌(B.t)β内毒素基因,并将该基因转化到双子叶植物如棉花细胞中表达,结果导致该修饰的B.t内毒素基因在棉花中的表达水平比天然B.t内毒素基因的表达水平提高50-100倍。相反,Hoekeman等人将磷酸甘油激酶基因克隆到酵母表达载体中,并将其5′端的部分酵母偏性密码子用稀有密码子取代,结果使之在酵母细胞内表达效率降低了大约10倍。
本发明人充分考虑了密码子使用频率对基因表达的影响和天然HSA编码序列的可能存在的不利因素,全面修饰并重新合成了HSA基因。为此,首先按照在密码子使用频率上基本上与毕赤酵母相同的啤酒酵母的密码子使用频率,重新设计并合成了全长度人血清白蛋白核苷酸编码序列。与天然HSA基因序列相比较,本发明合成的基因序列中有155个碱基被其它碱基所取代,并因此而导致141个密码子的改变,本发明合成的HSA基因的密码子使用频率如下列表1所示。
表1:合成的HSA基因的密码子使用频率
密码子 |
氨基酸 |
使用频率 |
密码子 |
氨基酸 |
使用频率 |
密码子 |
氨基酸 |
使用频率 |
密码子 |
氨基酸 |
使用频率 |
TTTTTCTTATTGCTTCTCCTACTGATTATCATAATGGTTGTCGTAGTG |
phephelouleuleuleuleuleuileileilemetvalvalvalval |
1913121810110114416159611 |
TCTTCCTCATCGCCTCCCCCACCGACTACCACAACGGCTGCCGCAGCG |
serserserserproproproprothrthrthrthralaalaalaala |
854183112117732715164 |
TATTACTAATAGCATCACCAACAGAATAACAAAAAGGATGACGAAGAG |
tyrtyrOCHAMBhishisglnglnasnasnlyslysaspaspgluglu |
991111514698322826114221 |
TGTTGCTGATGGCGTCGCCGACGGAGTAGCAGAAGGGGTGGCGGAGGG |
cyscysOPAtrpargargargargserserargargglyglyglygly |
2213-1312152145923- |
为了便于将本发明的合成的HSA基因连接到各不同的克隆载体或表达载体上,我们在其5′和3′端分别加入两个单一酶切位点,即5′端加入BamHI和XhoI酶切位点,3′端加入EcoRI和ClaI酶切位点,其中BamHI和ClaI切点用于连接克隆载体,而XhoI和EcoRI则用于连接表达载体。另外,为了确保酶切位点的有效利用,我们分别在合成的基因序列的5′和3′端加入3个保护性碱基(分别是GGC和AGG)。再者,为了便于将合成的HSA基因连接到信号肽的C末端上,还在该基因的N末端附加了氨基酸序列作为信号肽识别和切割位点。作为HSA基因的必要调控元件,其C末端带有一个重复的终止密码子序列,借以确保mRNA转译过程的正确终止。上述这些修饰导致本发明合成的HSA基因序列总长度约为1797bp。
另一方面,为了进一步提高本发明合成的HSA基因在甲基营养型酵母,特别是巴斯德毕赤酵母中的表达效率,还对基因之核苷酸序列的下述几个可能对基因转录和/或转译效率带来不利影响的序列或其他部分进行了必要的修饰、改动、置换或删除。
1、内含子剪接序列:真核生物具有对基因转录产物进行剪接加工以形成不带内含子的mRNA的能力。现已知道,内含子的剪接是由特殊序列介导的,如果DNA序列中存在相应的剪接位点,则这样的序列即可在基因转录过程中被作为内含子从序列中切掉,以致产生不完全的转录产物。因此,在基因的设计和合成中,有必要检查并排除这样的碱基序列。
2、转录终止序列:如果在全长度基因序列内部非转录终止部位存在额外的转录终止序列,便有可能导致转录的提前或错误终止,以致产生不完整的mRNA,在酵母表达系统中,已知与转录终止相关的序列包括:(1)ATTATTTTAT;(2)TTTTTATA;(3)TAG…(富含T)…TA(T)GT…(富含AT)…TTT。因此,在设计并合成HSA基因时,必须排除这些序列,特别富含AT的序列。
3、长的重复序列:重复序列,特别是长的重复序列(包括正向和反向重复序列)有可能形成强的二级结构,从而不利于基因转录和转译的顺利进行,而且有可能给全长基因的拼接造成困难。因此,当序列中出现七个以上碱基的重复序列时,需在不改变其所编码的氨基酸的前提下通过改变所牵连的密码子而排除之。
4、内部启动子序列和核糖体结合位点:基因序列的内部可能含有不期望存在的驱动基因内部转录过程的启动子序列,这些序列有可能干扰全长度基因的正常转录,因此必须予以除去。另外,如果基因内部存在多余的核糖体结合位点,也有可能启动基因内部的转译过程,以致产生不完整的蛋白质表达产物。因此,在本发明的合成HSA基因序列中排除了TATA框启动子序列和GGAGG核糖体结合位点。
此外,为了便于拼接预合成的多核苷酸片段,并便于将串联拼接的全长度基因序列在适当的酶切位点处与其他基因转录和/或转译调控元件拼接或方便的插入到选择的表达载体中,还有必要在基因序列中适当的核苷酸位置上加入若干个酶切位点或接头序列。因此,除上文提到的5’端的BamHI和XhoI酶切位点,以及3’端EcoRI和ClaI酶切位点外,还在核苷酸位置509和1109处分别加入了HindIII和PstI位点(图1B)。
因此,本发明的第一个目的是提供按上述原则合成的编码人血清白蛋白的核苷酸序列,为了得到如图1A中所示的编码人血清白蛋白的全长度核苷酸序列,合成了3个核苷酸长度分别为612bp、562bp和705bp并分别定名为HSA-I、HSA-II和HSA-III的片段。其中每个片段均由8条较短的寡核苷酸连接而成,并且各片段的两端均分别带有用于在适当的克隆载体中直接连接并克隆的BamHI和ClaI酶切位点。
可以按照本领域技术人员已知的常规方法分别化学合成相对短的寡核苷酸序列的互补链,并经变性后退火得到相应的双链DNA分子。但从经济和方便的角度考虑,最好采用本发明人改进的基于PCR技术的DNA序列合成方法合成本发明的HSA基因序列(参见实施例1)。按照这种方法,两条互补链之间只保留≤20个碱基对的重叠互补区,即足可以一条模板链为基础,合成长达120个碱基的双股寡核苷酸序列。这样,经一次的拼接即可的得到正确连接的长达大约900bp的DNA片段。
由于在利用Oligo4.0计算机软件设计各寡核苷酸链时,充分分析了相邻两条寡核苷酸链上的重叠区序列,从而有效的避免了所说的重叠区内发夹结构和强二级结构的形成,增加了重叠区序列的特异性的分子内部稳定性。一般说来,可通过改变重叠区内的个别碱基或造成总体重叠区的位移达到这一目的。
图2图解显示了本发明的HSA核苷酸编码序列的合成策略。简单的说,首先合成3个分别定名为HSA-I、HSA-II和HSA-III的长度分别为612bp、362bp和705bp的DNA片段(参见图3、5和7)。这些片段各自均由8个寡核苷酸序列组成。然后将这三个片段分别克隆到携带M13噬菌体DNA复制原点、氨苄青霉素抗性基因及多克隆位点,并且在多克隆位点两侧分别含有T3及T7噬菌体启动子的pBKS质粒载体中,得到分别定名为pBKS/HSA-I、pBKS/HSA-II和pBKS/HSA-III的3个重组质粒(参见图4、6和8)。从这些质粒中提取DNA并分别测定核苷酸序列后,按上述原则以适当方法纠正个别碱基的错误。待确定各个片段的碱基序列后,利用各片段两端预先设定的HindIII和PstI酶切位点将它们连接到利用BamHI和ClaI切割后线性化的质粒pBKS中,在T4DNA酶作用下重新环化后得到重组质粒pBKS/HSA(图9)。转化到大肠杆菌DH5α中进行多次传代后,从增殖的细菌细胞中提取DNA,并以双脱氧链终止法测定全长度HSA基因的核苷序列,结果表明本发明合成的HSA可稳定保留在继代培养的大肠肝菌细胞中并且没有发生任何序列突变和/或缺失。
用于表达本发明合成的HSA基因的表达载体可以是携带适于在酵母中表达外源基因之表达调控元件,并可在酵母特别是甲基营养型酵母中以高拷贝数插人的任何载体,例如pPIC9(Invitrogen)、pPIC3(Invitrogen)、PHIL-D2(Invitrogen)、yYJ32(NRRL B-15891)、pJDB207(Amershan)、pJDB219(Amershan)、PG4.0(NRRL B-15868)、为本发明的目的,其中优选的是pPIC9。
例如可用EcoRI和XhoI双酶消化,将PPIC9质粒切成线性,并与用同样双酶切后从PBK/HSA中得到的HSA基因片断连接,然后用所得连接混合物转化适当的大肠杆菌细胞。在LB培养基平板上37℃培养并筛选被转化的重组体细胞后,从中提取质粒DNA并根据片断大小鉴定重组质粒。
因此,本发明进一步涉及至少含有一个表达盒的重组表达裁体,其中所说表达盒在转录的读框方向上依次含有下列DNA序列:
(i)甲基营养型酵母之甲醇反应性基因的启动子区域;
(ii)编码啤酒酵母α交配因子(AMF)前原序列和编码HSA多肽序列的DNA序列,以及
(iii)在甲基营养型酵母中有功能活性的转录终止子。
可将此DNA片断作为侧翼接有与靶基因有足够同源性之DNA序列的线性片段转化到甲基营养型酵母如巴斯德毕赤酵母中,以实现所说的DNA片断在酵母染色体中的整合。在这种情况下,整合是通过重组表达裁体中的同源序列在酵母靶基因组的适当位点处与酵母靶基因组发生同源重组而实现的。或者所说的DNA片段可以是环形质粒的一部分,可将其切成线性以有利于整合,并且可以在宿主和质粒序列间的同源性位点处加入该片段进而实现其在宿主基因组中的整合。载体的线性化将有利于外源基因的整合,并且常常在线性化位点处插入宿主染色体内。
用于转化甲基营养型酵母细胞的表达盒,除含有甲基营养型酵母甲醇反应性启动子和HSA编码DNA序列(HSA基因)外,还含有编码读码内啤酒酵母前原序列切割识别位点(即Glu-Lys-Arg编码序列),以及可在甲基营养型酵母中发挥功能的转录终止子序列。
用于驱动HSA基因表达的优选启动子区衍生于巴斯德毕赤酵母的甲醇诱导或调节的醇氧化酶(AOX)基因,已知巴斯德毕赤酵母含有醇氧化酶I(AOXI)和醇氧化酶II(AOXII)基因,两个AOX基因的编码部分在DNA和推断的氨基酸序列水平上有很大同源性,并具有共同的限制性酶切位点,由两基因启动表达的蛋白质有相似的酶学性质,但其中AOXI基因的启动子更为有效,因此,为表达HSA的目的,优选的是使用AOXI(Ellis et al.,Mol.Cell.Biol.5:1111(1985)).
酵母α交配因子或称α因子是由“α”交配型的细胞分泌的含13个氨基酸的肽,其作用于相对“a”交配型的细胞,以促进两种类型的细胞之间的有效接合,从而形成“α-a”二倍体细胞(Thomer et al.,The Molecular Biology ofThe YeastSaccharomyced,Cold Spring Harbor Laboratory,Cold SpringHarbor,143(1981)).AMF前原序列是包含在AMF前体中的前导序列并包括有蛋白质水解加工和分泌所需的Glu-Lys-Arg编码序列。AMF前原序列(包括Glu-Lys-Arg编码序列)是一个258bp的片段。
根据本发明在甲基营养型酵母中表达的HSA的表达盒还含有转录终止子,其具有一个编码多聚腺苷酸信号和聚腺苷酸化位点的亚片段,和/或为从启动子起始转录提供转录终止信号的亚片段。
上述用于本发明的HSA表达和分泌的功能性调节序列(非结构基因调控元件)一般均已包括在本发明为表达HSA目的所选用表达载体pPIC9(Invitrogen)中,并且其中转录终止子与启动子的来源可以是相同或不同的。
根据本发明的表达载体,其中还可包括可在甲基营养型酵母如巴斯德毕赤酵母中发挥功能的选择标志基因。为此,所说的选择标志基因可以是任何赋予甲基营养型酵母如巴斯德毕赤酵母以某种表型,从而得以鉴定它们并使之获得未被转化的细胞所不具有的生长能力的基因。例如,适当的选择标志基因包括由营养缺陷型突变体巴斯德毕赤酵母宿主菌株和弥补宿主缺陷的野生型生物合成基因组成的选择标志系统。例如当转化HIS4-巴斯德毕赤酵母菌株时,可利用啤酒酵母或巴斯德毕赤酵母HIS4-基因。
如果用含有处于巴斯德毕赤酵母基因启动子调节下之HSA基因和加工与分泌所需之AMF序列的线性DNA片段转化为酵母宿主,则上述表达盒将通过已知的一步骤或二步骤置换技术(如参见Rothstein,MethodsEnzymol.101:202(1983);Sherer and Davis,Proc.Natl.Acad.Sci.,USA,76:4951(1979))被整合到宿主基因组中,可借助与靶基因有足够同源性的侧翼DNA序列将线性DNA片段导向特定的座位,以实现DNA片段在其中的整合。
如果含有本发明合成的HSA编码序列的DNA片段包含在表达载体如环形质粒内,则可在基因组的相同或不同座位上整合一个或多个质粒拷贝。在含有本发明合成的HSA编码序列的DNA片段被整合前或整合后,其中表达盒的各部分是彼此可操作地连接的。对于启动子、编码啤酒酵母AMF加工位点的DNA序列及转录终止子来说,编码HSA的DNA序列是位于其功能性位置和方向上的,因此HSA编码序列可在启动子区的控制下被转录成能够在转译后产生所需的HSA的转录物。因为表达载体内存在AMF前原序列。所以可从培养基中分离得到作为被分泌的整体的HSA产物。由于含有本发明合成的HSA基因序列的DNA片段包括允许其在细菌特别是大肠杆菌中复制的序列,所以可在细菌中大量产生该DNA片段。
根据本发明这一目的的一个优选实施方案,可将按本发明上述方法合成的编码HSA的DNA序列可操作地连接到可从市场上购得的,携带适于在甲基营养型酵母中表达和分泌外源蛋白质的功能性调控序列(非结构基因调控元件)的表达载体,例如可购自Invitrogen公司的pPIC9中,该质粒含有5′AOX1启动子片段、α-因子分泌信号、多克隆位点区、3′AOXI转录终止片段、HIS4 ORF、3′AOXI片段、COLEI复制原点及氨苄青霉素抗性基因。转化甲基营养型酵母例如巴斯德毕赤酵母的方法,以及用于培养其基因组中含有编码外源蛋白质之基因的甲基营养型酵母,例如巴斯德毕赤酵母的方法是本技术领域中已知的。根据本发明,可用Cregg等人(Mol.Cell.Biol.55:3376(1985))所述的原生质体技术或全细胞氯化锂酵母转化系统(ITO,et al.Agric.Biol.Chem.48:341(1984))以及电穿孔技术将表达载体转化到甲基营养型酵母细胞中。在使用单转录单位的情况下,较好选用电穿孔转化技术。
用Southern印迹分析法(Sambrook et al.,Molecular Cloning,2nded.,Chapter9,Cold Spring Harbor Laboratory Press,Cold Spring,NY,USA,1989)分析DNA整合位点,并用Northern印迹法(Sambrook等人,上述文献,第7章)分析甲醇反应性HSA基因表达,以进一步鉴定阳性转化体细胞。
本发明进一步提供利用甲基营养型酵母表达系统生产重组HSA的方法,该方法包括在适于表达所需的蛋白质的条件下培养按上述方法制备的包含编码HSA之核苷酸序列的酵母宿主细胞,然后从培养物中回收并纯化所说的HSA。为此,在发酵器中培养带有预期的表型和基因型的被转化的菌株。为了由甲基营养型酵母如巴斯德毕赤酵母大规模生产基于重组DNA技术的产品,一般可采用三阶段高密度分批发酵系统。第一阶段即生长阶段是在以过量甘油作为碳源的培养基中培养宿主细胞。在这种碳源上生长时,酵母宿主中的异源基因的表达受到限制,从而使细胞在没产生异源蛋白质的情况下增殖。然后是较短时间的甘油限制生长阶段。在甘油限制生长阶段以后,加入甲醇诱导所需的异源蛋白质的表达,即为生长阶段(第三阶段)。图13显示了本发明合成的HSA基因在巴斯德毕赤酵母中表达的时间过程。
根据本发明的一个优选实施方案,用于生产HSA的异源蛋白质表达系统利用了衍生于巴斯德毕赤酵母的甲醇调节之AOXI基因的启动子,该启动子可有效地启动基因的表达并严格接受外源营养因子的调节,所说的基因也可以是转录终止子的来源。本发明优选的表达盒包括可操作地彼此连接的巴斯德毕赤酵母AOXI启动子、编码啤酒酵母AMF前原序列(或称α因子)的DNA、按本文前述原则全合成的编码成熟HSA的DNA序列,以及衍生于巴斯德毕赤酵母AOXI基因的转录终止子。在一个DNA片段上最好含有两个或多个头尾连接的这样的表达盒,以在单一连续DNA片段上产生多表达盒。
如前所述,为了提高HSA基因序列在巴斯德毕赤酵母中的表达效率和表达水平,本发明人充分考虑了天然存在HSA编码序列的某些结构特征及其可能存在的对表达效率的不利影响,全面修饰并重新合成了所说的HSA基因。这些修饰包括用酵母偏性密码子取代天然HSA基因中的所有非酵母偏性密码子、加入适当的便于片段连接与重组的核酸内切酶位点、粘端加入必要的保护性碱基和信号肽识别序列与切割位点,以及附加的终止密码子,另一方面,本发明还针对HSA基因序列中内含子剪接序列、转录终止序列中长的重复序列、内部启动子序列及核糖体结合位点等可能对基因转录和/或转译效率带来不利影响的部分进行了必要的碱基修饰、改动和置换。
可将本发明的按上述原则合成的HSA基因序列插入适当的表达载体如pPIC9中,并用所得重组载体转化适当的大肠杆菌细胞。从被转化的大肠杆菌中分离质粒DNA并进行序列分析。分析结果显示本发明合成的HSA被正确地连接到表达载体所携带的AOX1基因的5′启动子序列和3′转录终止子序列之间,并以5′端直接连接到包括AMF前原序列(α因子编码序列)之蛋白水解加工位点Glu-Lys-Arg的3′编码序列上(参见图11)
上述合成基因对天然HSA编码序列的修饰和改动以及其在适当表达载体中的正确连接,充分保证了基因表达的有效启动、顺利转录和转录终止,同时也确保了转录产物之转译过程的顺利进行。
可用上述表达盒转化的优选的宿主细胞是具有可用存在于转化DNA片段上的标志基因弥补的至少一种突变的巴斯德毕赤酵母细胞,最好是利用HIS4-(GS115)或ARG4-(GS190)营养缺陷型突变体巴斯德毕赤酵母菌株。将含有一个或多个表达盒的DNA片段插入到含有弥补宿主之缺陷的标志基因质粒中。本发明优选的表达载体是质粒PAO815或pPIC9,特别是pPIC9。
为了建立巴斯德毕赤酵母的Mut-表达菌株,可用一步骤基因置换技术将含有表达盒的转化DNA整合到宿主基因组中,用适当的核酸内切酶消化表达载体以产生两末端同源于AOXI座位的线形DNA片段(借助侧翼同源序列),经这样的基因置换即得到Mut-菌株。这里所说的Mut是指甲醇利用表型。在Mut-菌株中,AOX基因被表达盒所取代,因而降低了菌株利用甲醇的能力。在这种情况下,酵母菌株便通过AOX2基因产物的表达来维持其在甲醇上的缓慢生长。可根据补偿基因的存在来鉴定其中表达盒已通过位点特异性重组而整合到AOX1座位中的转化株。
为了建立表达HSA的Mut+菌株,最好用包括表达盒的环形质粒转化宿主细胞,使包括一个或多个表达盒的DNA片段整合到宿主基因组中。在这种情况下,整合是通过在与转化载体上的一个或多个序列有同源性的座位上加入来实现的。为了鉴定阳性转化株,可以用Southern印迹法分析DNA整合的位点,用Northern印迹法分析甲醇反应性HSA基因的表达,并通过检测培养基中的HSA产物来证实HSA蛋白质的分泌表达,可用Southern印迹法鉴定在预期的位点整合了一个或多个表达盒的巴斯德毕赤酵母菌株。可用Northem印迹法和蛋白质产物分析法鉴定提高了HSA分泌产率的酵母菌株(参见图14)。
在发酵罐中,例如在改良的YNB或YPD液体培养基中,于大约30℃的温度下培养已证明具有预期的基因型和表型的甲基营养型酵母转化株。可使用典型的三阶段生产方法发酵生产HSA,首先使细胞生长在抑制性碳源,最好是在过量甘油上。这个阶段是在没有表达的情况下产生细胞群体。然后使细胞在限制甘油供应条件下生长,当甘油消耗后,向培养器内加入单一甲醇或有限量甘油+甲醇,以导致由甲醇反应性启动子驱动HSA基因的表达。为了以高细胞密度发酵并提高产物的表达水平,可在此阶段以补料分批培养的方法加入少量的高浓度蔗糖和葡萄糖以避免高浓度底物对细胞生长的抑制,必要时亦可以向培养基中加入脂肪酸如6-18个碳原子的脂肪酸来改善HSA产物的产率。
分离和收获HSA的方法可包括加热处理上述培养物上清以灭活蛋白酶,并使用选自阳离子交换剂、疏水载体及活性炭的至少一种材料将HSA与着色成分分离开,以抑制产物的颜色生成。可以在培养期间向培养基中加适当的胺如甲胺、乙胺或丙胺以抑制HSA的颜色。
可使用选自加热处理、超滤、亲和层析、阳离子交换层析、疏水层析、阴离子交换层析、盐析、和螯合树脂处理的至少五种组合方法纯化得到高纯度HSA。为了适当地简化纯化步骤,尽可能地在保证HSA产物纯度的前提下降低生产成本,较好选用依次加热处理、超滤、疏水层析和阴离子交换层析或高压液相层析的连续纯化方法。按本发明方法生产的HSA产率一般约为3.5g/升培养液,产物纯度基本可达到99.99%。
附图说明
图1A显示合成的编码全长度人血清白蛋白的核苷酸序列及由之推断的人血清白蛋白的氨基酸序列;
图1B显示图1A中所示全长度人血清白蛋白的核苷酸编码序列中的单一核酸内切酶酶切位点;
图2显示编码人血清白蛋白的核苷酸序列的合成策略;
图3显示HSA-I片段的核苷序列(上行)及由之推断的氨基酸序列(下行);
图4显示重组质粒pBKS/HSA-I的构建;
图5显示HSA-II片段的核苷酸序列(上行)及由之推断的氨基酸序列(下行);
图6显示重组质粒pBKS/HSA-II的构建;
图7显示HSA-III片段的核苷酸序列(上行)及由之推断的氨基酸序列(下行);
图8显示重组质粒pBKS/HSA-III的构建;
图9显示重组表达载体pBKS/HSA的构建;
图10显示重组表达载体pPIC9/HSA的构建;
图11显示HSA核苷酸编码序列与表达载体pPIC9连接的连接区序列;
图12显示HSA-I、HSA-II、HSA-III片段及全长度HSA DNA片段的1%琼脂糖凝胶电泳图谱;
图13显示合成的HSA基因在巴斯德毕赤酵母菌株GS115中表达的时间过程,其中泳道1-8分别显示在培养毕赤酵母转化体细胞的培养基中加入甲醇诱导HSA表达后0、24、48、72、96、120和148小时收集培养物上清并在10%聚丙烯酰胺凝胶上进行分析的结果;
图14显示对HSA表达产物所作的免疫印迹分析的结果,其中各泳道加样材料分别为A:天然HSA;B:不携带重组质粒GS115酵母细胞的培养物上清;C:用pPIC9/HSA转化的GS115酵母细胞的培养物上清。
具体实施方式
下列实施例旨在进一步举例描述本发明,但这些实施例均不以任何方式构成对本发明待批权利要求之范围的限制。实施例1:HSA基因全长序列的合成与克隆
本实施例描述编码HSA的全长度核苷酸序列的合成。鉴于全长HSA基因的核苷酸序列相对较长,一次合成可能遇到操作上的困难,因此将全长基因序列分成三个较大的核苷酸片段分别合成。这三个片段分别称为HSA-I(612bp),HSA-II(562bp),和HSA-III(705bp),并且它们每个都由8个寡核苷酸片段拼接而成。
1.HSA-I片段的合成与克隆(1)为了合成长度为612bp的包括HSA基因之5’侧的片段HSA-I,首先使用ABI394型DNA自动合成仪(Appiled Biosystem Inc.)按仪器制造商推荐的步骤在1000固相载体上合成有下示序列的8个寡核苷酸链:OA-1GGCGGATCCCTCGAGAAAAGAGATGCACACAAGAGTGAGGTTGCTCATCGGTTTAAAGATTTGGGTGAGGAAAATTTCAAAGCCTTAGTGTTAATOA-2GCGAACTCAGTGACCTCGTTAACCAACTTTACATGATCCTCAAATGGACATTGCTGAAGATATTGGGCAAAAGCAATTAACACTAAGGCTTTGOA-3CGAGGTCACTGAGTTCGCTAAAACTTGTGTTGCAGACGAATCTGCTGAAAATTGTGATAAGTCTCTGCATACCCTATTTGGTGACAAATTGTGCOA-4GCATTCGTTTCTGCCAGGTTCTTGCTTTGCACAGCAGTCGGCCATTTCACCGTAAGTTTCTCGAAGGGTAGCCGACTGTGCACAATTTGTCACCAAAOA-5CCTGGCAGAAACGAATGCTTTTTGCAGCACAAACATGACAACCCTAATCTTCCACGTTTAGTGAGACCTGAAGTTGATGTGATGOA-6TATGGGTGCCTTCTTGCAATTTCATATAAGTACTTCTTCAAAAAAGTTTCTTCATTATCATGGAAGGCTGTACACATCACATTCAACTTCAGGOA-7GCAAGAAGGCACCCATACTTCTATGCCCCGGAGCTACTGTTCTTTGCTAAACGTTATAAAGCTGCATTCACAGAATGTTGCCAAGCOA-8CCTATCGATGGCAGAAGAAGCTTTACCCTCATCTCTTAATTCGTCTAGCTTTGGCAACAGACAAGCTGCCTTATCGGCAGCTTGGCAACATTCTGTG
将分别合成的寡核苷酸(OA-1至OA-8)从固相载体柱上洗脱并用含7M尿素的10%聚丙烯酰胺凝胶电泳纯化后,分别回收之。
按照图2所示的合成策略,使用PCR反应介导的DNA合成技术,由上述8个寡核苷酸经三步骤PCR扩增得到HSA-I片段。具体地说,首先在四个PCR反应试管中分别加入OA-1和OA-2(各10μl)、OA-3和OA-4(各个10μl)、OA-5和OA-6(各个10μl)以及OA-7和OA-8(各10μl)。然后向总反应体积为50μl的各管内分别加入约50μl 1×PCR缓冲液,200μM dNTP(各50μM),1.5mM MgCl2和2.5单位Taq DNA聚合酶。在94℃,10秒;55℃,30秒;72℃,1分种的PCR反应条件下,经15次PCR循环得到8条寡核苷酸链两两连接的4个双链DNA片段:片段A、B、C、和D。然后将片段A和B、C和D分别混合在两个反应容器内,再次按上述条件进行PCR反应,分别得到进一步融合并扩增的片段E和F。最后,使用寡核苷酸OA-1和OA-8作为两末端引物,再次对如上得到的片段E和F的混合物进行PCR反应,从而得到代表HSA基因的5’端的片段HSA-I。用1.5%琼脂糖凝胶分离并纯化该片段后,置-70℃下保存备用。
(2)将携带质粒pBKS的大肠杆菌DH5α菌株接种于50ml LB培养基中,37℃振荡培养15小时。培养后离心(5000rpm,5分钟)收集细胞,并以碱裂解法制备用于克隆合成的HSA片段的质粒pBKS。为此,首先将细胞沉淀物悬浮于5ml溶液I(50mM蔗糖,25mM Tris,10mMEDTA,pH8.0)中,然后向悬液中加入10ml新鲜的溶液II(0.2NaOH,1%SDS),混匀并置冰水浴中放置10分钟后再加入7.5ml溶液III(3MKAc,pH4.8),再次混匀于冰浴中放置15分钟,离心(12000rpm,10分钟)收集沉淀物。用70%乙醇洗细胞沉淀物并重新悬浮于1ml TE缓冲液中。向所得溶液内加入RNA酶A(Promega)(200μg/ml)并于37℃保温30分钟。然后依次用苯酚;酚∶氯仿(1∶1)和氯仿∶异戊醇(24∶1)抽提,并向提取液内加入1/10体积的3M NaAc(pH4.8)和两倍体积的无水乙醇以沉淀之。离心后用70%乙醇洗涤沉淀物并重新溶解于0.1ml TE缓冲液中,从而得到pBKS质粒DNA。最后用限制性核酸内切酶BamHI和ClaI(各2单位)消化该质粒DNA,用1%琼脂糖电泳分离并回收所得的3.0Kb的酶切产物,得到纯化的线性化pBKS载体。
(3)用BamHI和ClaI双酶(各1单位)酶切如前制备的的HSA-I片段(4μg),将此HSA-I片段的酶切产物(1μg)与如上同样酶切的pBKS质粒(约4μg)混合,在T4 DNA连接酶(3单位)存在下,于16℃水浴中反应17小时。反应完成后按常规方法用所得连接混合物转化感受态大肠杆菌DH5α菌株的细胞悬液(OD600约为0.6)。转化反应中使用pBKS空质粒作为阴性对照。将细菌细胞悬液铺敷在添加氨苄青霉素(100μg/ml)的固体LB平板上,37C保温过夜后,筛选出被转化的阳性菌落,并制备质粒DNA。用BamHI和ClaI酶切该DNA,根据所得DNA片段的大小初步鉴定以正确方向连接有HSA-I片段的重组质粒pBKS/HSA-I。
(3)在添加氨苄青霉素(100μg/ml)的固体培养基上培养经初步鉴定的携带重组质粒pBKS/HSA-I的阳性菌株,并按上述方法从中制备DNA并以此DNA作为下述测序反应的模板。按已知方法对模板DNA(2μg)进行变性处理,然后向其中加入测序引物和退火缓冲液(各2μl)以完成退火反应,并按已知的Sanger双脱氧链终止法(Sambrook et al.,MolecularCloning,2nd Edition Chapter 13,Cold Spring Harbor laboratory Press,ColdSpring,NY,USA,1989)检测变性的双链DNA模板的核苷酸序列,测序结果显示所有五个克隆均包括有数目不等的碱基缺失和置换。为此利用HSA-I系列中的适当位置上存在的酶切位点,切出没有碱基错误的小片段并与其他克隆中带有正确序列的小片段重新连接后得到去除了错误碱基的HSA-I片段。在纠正HSA-I片段的碱基错误中,选择使用了两个内部单一酶切位点即核苷酸位置282处的HaeIII和核苷酸位置431处的ScaI位点。2.HSA-II片段的合成与克隆
按照上文1(1)中所述合成HSA-I片段的相似方法,首先合成具有下示8个寡核苷酸:OA-9GGCGGATCCGAGGGTAAAGCTTCTTCTGCCAAACAAAGATTGAAGTGCGCTAGTCTACAGAAATOA-10AAACTCGGCTTTGGGAAATCTCTGGCTCAGGCGAGCTACAGCCCATGCCTTAAAAGCTCTTTCTCCAAATTTCTGTAGACTAGCGOA-11TTCCCAAAGCCGAGTTTGCAGAAGTTTCCAAGTTAGTGACGGATTTGACCAAAGTCCATACGGAATGTTGCCATGAGATTTGCTTGAATGTGCOA-12CTTCAGTTTACTGGAGATCGAATCTTGATTTTCACAGATATACTTGGCCAAGTCCGCCCTGTCATCAGCACATTCAAGCAAATCTCCOA-13CGATCTCCAGTAAACTGAAGGAATGTTGTTAAAAACCTCTTTTGGAAAAATCCCACTGCATTGCCGAAGTGGAAAACGATGAGATGCCOA-14CCTTTGCCTCAGCGTAGTTTTTGCAAACATCCTTACTTTCAACAAAATCAGCAGCTAATGATGGCAAGTCAGCAGGCATCTCATCGTTTTCCOA-15CTACGCTGAGGCAAAGGATGTCTTCTTGGGCATGTTTTTGTATGAATACGCAAGAAGGCATCCAGATTACTCTGTCGTGCTGTTCCCCCGCTGAOA-16CCTATCGATACATTCATGAGGATCTGCAGCGGCACAGCACTTCTCTAGAGTGGTTTCATATGTCTTGGCAAGTCTCAGCAACAGACCACA
然后按上文1(1)中所述的方法经三次PCR扩增将此8个寡核苷酸(OA-9至OA-16)连接成带有5’端BamHI和3’端ClaI酶切位点,长度为564bp的双链HSA-II片段。该片段代表了HSA基因序列的中间部分。同样,按上文1(2)和中所述方法纯化和克隆所合成的HSA-II片段,并制备含有HSA-II的重组克隆载体pBKS/HSA-II。图6中图解显示了用于克隆和鉴定目的的重组克隆载体pBKS/HSA的构建。然后按上文1(3)中所述的方法,同样取5个携带pBKS/HSA-II的大肠杆菌克隆,分离DNA并进行序列分析。序列分析结果显示所分析的5个克隆中只有一个克隆的碱基序列带有单个碱基错误,但该错误并未导致氨基酸序列的改变。3.HSA-III片段的合成与克隆
按照上文1(1)所述的合成HSA-I片段的方法,首先合成具有下示序列的8个寡核苷酸:OA-17CGCGGATCCGTGCCGCTGCAGATCCTCATGAATGTTATGCCAAAGTTTTCGATGAATTTAAACCTCTTGTGGAAGAGCCACAAAATTTAATTAAACAAAATTGTGAGOA-18GGAGTTGACACTTGGGGTACTTTCTTGGTGTAACGAACTAACAGCGCATTCTGGAATTTGTATTCACCAAGTTGCTCAAAGCTCACAATTTTGTTTAATOA-19CCCCAAGTGTCAACTCCAACTTTGGTAGAGGTCTCAAGAAACCTAGGTAAAGTGGGTAGCAAGTGTTTGTAAACATCCTGAAGCAAAAAGAATGCOA-20GACTCTGTCACTTACTGGCGTTTTCTCATGCAACACACATAACTGGTTCAGGACAACGGATAGATAGTCTTCTGCACATGGCATTCTTTTTGCTTCAGGOA-21CCAGTAAGTGACAGAGTCACCAAGTGCTGCACAGAATCTTTGGTTAACAGGCGACCATGCTTTTCAGCTCTGGAAGTCGATGAAACATACGTTCCCAAAGAGTTTAATGCOA-22GTGTTTCACTAGCTCAACTAGTGCAGTTTGTTTCTTGATTTGTCTTTCCTTCTCAGAAAGTGTACATATATCTGCATGGAAGGTGAAAGTTTCAGCATTAAACTCTTTGGGOA-23GTTGAGCTAGTGAAACACAAGCCGAAGGCGACTAAAGAACAACTGAAAGCTGTTATGGATGGATGATTTTCGCGGCTTTTGTAGAAAAGTGTTGTAATGCTGACGOA-24CCTATCGATCAAGAATTCCTATTATAAACCTAAGGCAGCTTGAGATGCAGCAACTAGTTTCTTACCTTCCTCGGCAAAGCAAGTTTCCTTATCGTCAGCCTTAGAAGAC
然后按上文1(1)中所述方法经三次PCR扩增将此8个寡核苷酸链(AO-17至OA-24)连接成带有5’端BamHI和3’端ClaI酶切位点,长度为705bp的双链HSA-III片段。该片段代表了HSA基因序列的3’端部分。同样按上述1(2)中所述的相似方法纯化并克隆所合成的HSA-III片段,并制备含有HSA-III的重组克隆载体pBKS/HSA-III。图8中图解显示了用于纯化、克隆和鉴定目的的重组载体pBKS/HSA-III的构建。然后按上文1(3)中所述方法,同样取5个携带pBKS/HSA-III的大肠杆菌克隆,分离DNA并进行序列分析。序列分析结果显示,所有5个克隆均存在个别错误碱基。为此,按上文1(3)中所述方法用带有正确碱基的亚片段取代带有错误碱基的片段。在纠正HSA-III片段的碱基错误中,借助核苷酸位置216处的StyI位点和核苷酸位置373处的Hap-I位点将三个亚片段重新连接成完整的HSA-III片段。4.全长度HSA基因的制备与克隆
基本上按照如上文所说的克隆HSA编码序列中各片段的方法制备携带全长HSA基因序列的重组克隆载体。首先分别用BamHI和HindIII,HindIII和PstI,以及PstI和ClaI从相应的重组质粒pBKS/HSA-I,pBKS/HSA-II和pBKS/HSA-III中切出片段HSA-I、HSA-II和HSA-III。纯化各片段后,将它们以相等的量混合在一起,然后向所得各片段的混合物中加入用BamHI和ClaI双酶切成线性的质粒pBKS。图12显示了HSA-I、HSA-II、HSA-III片段和全长度HSA DNA片段的1%琼脂糖凝胶电泳图谱。按上述反应条件完成4个片段的连接,重新环化并经筛选和序列分析后,得到定名为pBKS/HSA的重组质粒。进一步地全长度序列分析表明,所得的HSA基因序列具有如图1所示的全长度核苷酸序列。
遗传稳定性实验结果显示,按上述方法制得的重组质粒pBKS/HSA的DH5α菌株在继式培养后,所得10个单克隆中携带的质粒DNA具有与原始克隆完全相同的DNA序列,表明本发明合成的HSA基因序列具有良好的遗传稳定性。
实施例2:重组表达载体的构建
本实施例描述用于在甲基营养型酵母中表达HSA的重组表达载体的构建。一般说来,可按本领域中已知的标准方法完成用于本发明目的的表达载体的构建(如参见Sambrook et al,Molecular Cloning,A LaboratoryManual,2nd ed.,Cold Spring Harbor Laboratory Press,1989)。可按照欧洲专利申请0344459和国际专利申请WO90/10697中所述的方法构建用于表达本发明的全合成HSA基因的重组载体。
为了方便起见,作为一种可供选择的方法,我们利用可从市场上购得的适用于甲基营养型酵母系统的质粒pPIC9(Invitrogen)构建用于分泌表达HSA的重组表达载体。质粒pPIC9含有适于在甲基营养型酵母中表达和分泌外源蛋白质的必要调控序列(非结构基因调控元件),其中包括AOX1启动子片段、α因子分泌信号(AMF前原序列)、多克隆位点、3’AOX1转录终止片段、HIS4-ORF、3’AOX1片段、ColE1复制原点以及氨苄青霉素抗性基因。使用该载体还具有更便于检验本发明合成的HSA基因在甲基营养型酵母中分泌表达的优点。
为此,首先将携带质粒pPIC19的大肠杆菌37℃振荡培养15小时,培养后离心(5000rpm,5分钟)收集细胞沉淀物并以碱裂解法制备质粒DNA(参见实施例1有关pPKS的制备方法)。然后用EcoRI和XhoI(各3单位)消化该质粒DNA。在1%琼脂糖凝胶上电泳分离并回收长度约8.0Kb的线性DNA片段。
将按上述方法(参见实施例1)制备的pBKS/HSA质粒DNA与2μl多用酶切缓冲液(Promega)及EcoRI和XhoI(各3单位)混合并于37℃保温1.5小时后,在1%琼脂糖凝胶上电泳分离并回收HSA基因片段。将大约2μg(10μl)所得HSA基因片段与用同样酶切的pPIC9酶切产物混合,于T4 DNA连接酶(3单位)存在下,在16℃水浴中保温17小时,完成连接反应。
用所得到的连接混合物转化经过0.1M CaCl2处理的感受态大肠杆菌DH5α细胞。然后在含有氨苄青霉素的LB平板上选择有氨苄青霉素抗性(AmpR)的转化菌落,并从中提取质粒DNA。用BamHI和ClaI消化所得质粒DNA并以SDS-PAGE法初步鉴定后,再经DNA序列分析筛选出在正确位置上以正确方向插入了含有HSA基因的重组质pPIC9/HSA。实施例3:酵母宿主菌株的转化和阳性转化株的筛选
本实施例描述用上述方法制备的重组表达载体pPIC9/HSA转化巴斯德毕赤酵母细胞,以得到稳定表达和分泌HSA的重组体细胞的方法。
用碱裂解法从携带pPIC9/HSA质粒的大肠杆菌DH5 α中分离得到重组质粒pPIC9/HSA。经苯酚/氯仿提取,并用无水乙醇沉淀后,得到经过纯化的可用于转化巴斯德毕赤酵母菌株的pPIC9/HSA的质粒DNA。用SalI(5单位)于37℃水浴中消化10μg pPIC9/HSA,将其切成线性DNA。直接用此酶切反应混合物转化巴斯德毕赤酵母GS115(HIS-)菌株(NRRLY-15851)。SalI切割的pPIC9/HSA可整合到毕赤酵母染色体中的组氨醇脱氢酶基因中,而不破坏AOX1基因。由于pPIC9/HSA携带有HIS基因,故可基于HIS+表型选择所得到的转化株。
将巴斯德毕赤酵母GS115〔NRRL Y-15851〕接种于约10ml YPD培养基(1%酵母提取物,2%蛋白胨,2%葡萄糖)中,30℃振荡培养过夜。然后取1ml过夜培养物,于500ml新鲜YPD培养基中培养约12-14小时,至OD600=1.3-1.5离心(3000rpm,5分钟,4℃)收集细胞,并重新悬浮于用冰浴预冷的无菌水中。用无菌水将细胞再洗涤两次后,重新悬浮于1M山梨醇溶液中。
将10μg线性化的pPIC9/HSA质粒DNA加入80μl上述的GS115细胞悬液中,混匀后,转移到预冷却的电转移槽内,冰浴5分钟。使用电穿孔仪(Invitrogen),按仪器制造商推荐的条件(电场强度1500V/cm,)10毫秒以电穿孔法转化毕赤酵母细胞。施加电脉冲后,立即向电转移槽中加入1ml用冰浴预冷的1M山梨醇溶液,并将内容物转移到微量离心管中。取200ul细胞悬液铺敷于MD平板(1.34%YNB,4×10-5%生物素,0.5%甲醇)和MD(1.34%YNB,4×10-5%生物素,1%右旋糖)平板的相同位置上。同时在MD和MM平板上分别接种携带HSA基因的GS115-Albumin(HIS+Muts)半乳糖苷酶的GS115(GS115-β-gal)和携带(HIS+Mut+)菌株作为对照以筛选具有HIS+Mut+表型的带有pPIC9/HSA重组质粒的阳性转化株。为此将上述制备的平板于30C培养两天,其中具有HIS+Mut+表型的菌株在MM培养基和MD培养基上均能正常生长,所得菌株大小与对照菌株相似。具有HIS+Muts表型的菌株能够在MD培养基上正常生长,但在MM培养基上生长很慢或几乎不能生长。
将按上述方法筛选到的50个HIS+Mut+单克隆菌株分别接种3mlYPD液体培养基中,30℃振荡培养24小时,然后离心收集细胞。将细胞沉淀重新悬浮于120μl无菌水中,各加0.4g经无菌处理的玻璃珠,剧烈振荡3分钟破碎细胞。离心去除细胞沉淀后,按前述方法依次用苯酚/氯仿(1∶1,总体积100μl)和氯仿/异戊醇(24∶1,总体积100μl),提取染色体DNA。
可用PCR方法检测如上述制备的染色体DNA,以进一步筛选出携带有本发明合成的HSA基因的阳性转化株。为此,将1μg(5μl)上述被转化细胞的基因组DNA分别加入到由下列成分组成的PCR反应体系中:10X PCR反应缓冲液(5μl)、基因组DNA(1μg)约5ul;100mM dNTPs(1μl);5’AOX1引物(0.1μg/μl约5μl);3’AOX1引物(0.1μg/μl约5μl);补加无菌水至总体积为50μl。再加入0.25μl Taq DNA聚合酶(5U/μl),其中5’AOX1引物,3’AOX1引物均购自Invitrogen公司。
PCR反应条件是:94℃热变性2分钟,然后按下述条件进行25次循环:94℃变性(40秒),55℃复性(90秒),72℃延伸(1分钟),最后72℃延伸7分钟。PCR反应完成后,将PCR反应产物于1%琼脂糖凝胶电泳上电泳,观察是否有扩增的HSA基因片段,以进一步筛选出含有HSA基因的转化株。该细胞株已按照用于专利程序的国际公认微生物保藏布达佩斯条约的规定,携带重组质粒pPIC9/HSA的毕赤氏酵母GS115菌株将保藏于中国微生物菌种保藏管理委员会普通微生物保藏中心(CGMCC),其保藏登记号为CGMCC NO.0354。实施例4:HSA基因在GS115酵母中的表达及蛋白质产物的免疫印迹分析
本实施例描述本发明合成的HSA基因在巴斯德毕赤酵母GS115菌株中的表达和分泌,以及对培养物上清中的表达产物的免疫印迹分析。将按实施例3中所述方法鉴定的阳性菌株接种于BMG培养基(100mM磷酸钾,1.34%YNB,4×10-5%生物素,1%甘油)中,30℃振荡培养18小时。离心收集细胞后重新悬浮于BMM培养基(100mM磷酸钾,1.34%YNB,4×10-5%生物素,0.5%甲醇)中30℃继续振荡培养,分别于0、24、48、96、120、144小时取样,对所有样品进行SDS-PAGE分析。结果显示,除0小时外,其余各时间的样品均显现出分子量约66KD的条带,且在此时间内随表达时间延长条带由浅变深,表明表达量逐渐增加(图13)。
以Western免疫印迹法检测按上述方法制备并纯化的HSA蛋白质产物,并使用市售的重组HSA(上海生物制品所提供)作为阳性对照,用携带有pPIC9质粒的GS115细胞48小时发酵培养上清液作为阴性对照。
对实验样品和对照样品进行十二烷基磺酸钠-聚丙烯酰胺凝胶电泳(SDS-PAGE)分离,然后将凝胶上的蛋白质电转移到硝酸纤维滤膜上,将该硝酸纤维膜素膜用含5%脱脂奶粉的PBS溶液于室温下封闭2小时并用PBS洗涤3次后,将滤膜与羊抗HSA抗血清(华美公司)(1∶50稀释)37℃保温1.5小时。再次用PBS将滤膜洗涤3次并用脱脂奶粉封闭后,使滤膜与辣根过氧化物酶偶联的猴抗羊卯二抗体(Cooper Biomedical Inc.)(1∶3000稀释)混合并于37℃下温育1.5小时。然后用50mM Tris-HCl,pH6.8溶液洗涤3次,最后加入底物溶液邻苯二胺(DNB)显色5-10分钟后,滤膜上出现棕色条带。从图14所示的结果可以看出,本发明合成的HSA基因能够在巴斯德毕赤宿主中表达并分泌与天然HSA具有相同免疫学特征的蛋白质。实施例5:HSA表达产物的纯化
将pPIC9/HSA转化的GS115菌株在50ml含改良的BMGY培养基的培养瓶中30℃振荡培养约48小时,使细胞培养物的OD600值达到4.0。然后收集细胞并在无菌条件下接种到含700ml BMGY培养基的两升发酵罐内,于30℃下通气发酵。通过调节通气速度(5升/分钟)和搅拌速度(1500rpm)使罐内溶解氧保持在20%以上空气饱和度。在整个发酵过程中,定时加入市售的Struktol J673消泡剂以控制过多的气泡生成。当甘油逐渐消耗后,向罐内泵入含0.5%甲醇但不含甘油的BMMY培养基(700ml),30℃下继续进行补料分批培养。此培养阶段内发酵罐中的甲醇浓度始终保持在0.3%-0.7%。发酵后20小时开始收集培养物,以天然HSA标准品作为对照,经10%聚丙烯酰胺凝胶电泳并染色后检测光密度,估测发酵培养物HSA的浓度为4.5g/L。发酵完成后,离心(10,000rpm,15分钟)收集培养物上清液,于70℃加热处理20分钟,然后快速冷却到15℃,离心(15,000rpm,20分钟)去除包括微量蛋白酶在内的热变性杂质后使离心上清液通过孔径为0.45μ的微孔滤膜(Millipore)过滤。过滤后再用截留分子量为30,000的超滤膜(Millipore)将此上清液到浓缩至大约0.5L体积。然后用乙酸将溶液pH调节到4.5左右,通过预先用50mM醋酸钠缓冲液(pH4.5)平衡过的RBO2脱色树脂(5×25cm,柱床体积约500ml)进行脱色,向所得澄清透明洗出液内加入硫酸铵,使其终浓度为10%.然后经预先用50mM磷酸盐+10%(NH4)2SO4,PH6.8缓冲液平衡过的phenyl Sepharose柱吸附,用一倍柱床体积平衡的上述预平衡缓冲液洗涤柱,最后用洗脱缓冲液(200mM PB+30%异丙醇缓冲液,pH6.8)洗脱并收集280nM吸收峰的洗脱部分。进一步将该洗脱液经G-25凝胶层析柱脱盐后得到基本上适于临床应用的高纯度HSA产物。
序列表(1)、一般信息(I)申请人:上海海济生物工程有限公司(II)发明名称:重组人血清白蛋白的生产方法(III)序列数:2(IV)通讯地址:
(A)联系人:李绍极
(B)街道:太原路192号
(C)城市:上海
(D)国家:中华人民共和国
(E)邮编:200031(V)计算机可读形式:
(A)介体类型:3.5英寸软盘
(B)计算机:AST Pentium III+4/66d
(C)操作系统:Windows 95
(D)软件:Word 97(VI)电讯信息:
(A)电话:86-21-64735898
(B)电传:86-21-64674742(2)SEQ ID NO:1的信息(I)序列特征:
(A)长度:1758个碱基对
(B)类型:核酸
(C)链型:双链
(D)拓扑结构:线性(II)分子类型:DNA(III)序列描述:SEQ ID NO:11GATGCACACA AGAGTGAGGT GCTCATCGG TTTAAAGATT TGGGTGAGGA51AAATTTCAAA GCCTTAGTGT TAATTGCTTT TGCCCAATAT CTTCAGCAAT101GTCCATTTGA GGATCATGTA AAGTTGGTTA ACGAGGTCAC TGAGTTCGCT151AAAACTTGTG TTGCAGACGA ATCTGCTGAA AATTGTGATA AGTCTCTGCA201TACCCTATTT GGTGACAAAT TGTGCACAGT CGCTACCCTT CGAGAAACTT251ACGGTGAAAT GGCCGACTGC TGTGCAAAGC AAGAACCTGA GAGAAACGAA301TGCTTTTTGC AGCACAAAGA TGACAACCCT AATCTTCCAC GTTTAGTGAG351ACCTGAAGTT GATGTAATGT GTACAGCCTT CCATGATAAT GAAGAAACTT401TTTTGAAGAA GTACTTATAT GAAATTGCAA GAAGGCACCC ATACTTCTAT451GCCCCGGAGC TACTGTTCTT TGCTAAACGT TATAAAGCTG CATTCACAGA501ATGTTGCCAA GCTGCCGATA AGGCAGCTTG TCTGTTGCCA AAGCTAGACG551AATTAAGAGA TGAGGGTAAA GCTTCTTCTG CCAAACAAAG ATTGAAGTGC601GCTAGTCTAC AGAAATTTGG AGAAAGAGCT TTTAAGGCAT GGGCTGTAGC651GCGCCTGAGC CAGAGATTTC CCAAAGCCGA GTTTGCAGAA GTTTCCAAGT701TAGTGACGGA TTTGACCAAA GTCCATACGG AATGTTGCCA TGGAGATTTG751CTTGAATGTG CTGATGACAG GGCGGACTTG GCCAAGTATA TCTGTGAAAA801TCAAGATTCG ATCTCCAGTA AACTGAAGGA ATGTTGTGAA AAACCTCTTT851TGGAAAAATC CCACTGCATT GCCGAAGTGG AAAACGATGA GATGCCTGCT901GACTTGCCAT CATTAGCTGC TGATTTTGTT GAAAGTAAGG ATGTTTGCAA951AAACTACGCT GAGGCAAAGG ATGTCTTCTT GGGCATGTTT TTGTATGAAT1001ACGCAAGAAG GCATCCAGAT TACTCTGTCG TGCTGTTGCT GAGACTTGCC1051AAGACATATG AAACCACTCT AGAGAAGTGC TGTGCCGCTG CAGATCCTCA1101TGAATGTTAT GCCAAAGTTT TCGATGAATT TAAACCTCTT GTGGAAGAGC1151CACAAAATTT AATTAAACAA AATTGTGAGC TTTTTGAGCA ACTTGGTGAA1201TACAAATTCC AGAATGCGCT GTTAGTTCGT TACACCAAGA AAGTACCCCA1251AGTGTCAACT CCAACTTTGG TAGAGGTCTC AAGAAACCTA GGTAAAGTGG1301GTACCAAGTG TTGTAAACAT CCTGAAGCAA AAAGAATGCC ATGTGCAGAA1351GACTATCTAT CCGTTGTCCT GAACCAGTTA TGTGTGTTGC ATGAGAAAAC1401GCCAGTAAGT GACAGAGTCA CCAAGTGCTG CACAGAATCT TTGGTTAACA1451GGCGACCATG CTTTTCAGCT CTGGAAGTCG ATGAAACATA CGTTCCCAAA1501GAGTTTAATG CTGAAACTTT CACCTTCCAT GCAGATATAT GTACACTTTC1551TGAGAAGGAA AGACAAATCA AGAAACAAAC TGCACTAGTT GAGCTAGTGA1601AACACAAGCC GAAGGCGACT AAAGAACAAC TGAAAGCTGT TATGGATGAT1651TTCGCGGCTT TTGTAGAAAA GTGTTGTAAG GCTGACGATA AGGAAACTTG1701CTTTGCCGAG GAAGGTAAGA AACTAGTTGC TGCATCTCAA GCTGCCTTAG1751GTTTATAA(3)SEQ ID NO:2的信息(I)序列特征:
(A)长度:585个氨基酸
(B)类型:氨基酸
(C)链型: 单链
(D)拓扑结构:线性(II)分子类型:蛋白质(III)序列描述:SEQ lD NO:21Asp Ala His Lys Ser Glu Val Ala His Arg Phe Lys Asp Leu Gly Glu Glu18Asn Phe Lys Ala Lcu Val Lcu Ile Ala Phe Ala Gln Tyr Leu Gln Gln Cys35pro Phe Glu Asp His Val Lys Leu Val Asn Glu Val Thr Glu Phe Ala Lys52Thr Cys Val Ala Asp Glu Ser Ala Glu Asn Cys Asp Lys Ser Leu His Thr69Lcu Phe Gly Asp Lys Lcu Cys Thr Val Ala Thr Leu Arg Glu Thr Tyr Gly86Glu Met Ala Asp Cys Cys Ala Lys Gln Glu Pro Glu Arg Asn Glu Cys Phe103Leu Gln His Lys Asp Asp Asn Pro Asn Leu Pro Arg Leu Val Arg Pro Glu120Val Asp Val Met Cys Thr Ala Phe His Asp Asn Glu Glu Thr Phe Leu Lys137Lys Tyr Leu Tyr Glu Ile Ala Arg Arg His Pro Tyr Phe Tyr Ala Pro Glu154Leu Lcu Phe Phe Ala Lys Arg Tyr Lys Ala Ala Phe Thr Glu Cys Cys Gln171Ala Ala Asp Lys Ala Ala Cys Leu Leu Pro Lys Leu Asp Glu Leu Arg Asp188Glu Gly Lys Ala Ser Ser Ala Lys Gln Arg Leu Lys Cys Ala Ser Leu Gln205Lys Phe Gly Glu Arg Ala Phe Lys Ala Trp Ala Val Ala Arg Leu Ser Gln222Arg Phe Pro Lys Ala Glu Phe Ala Glu Val Ser Lys Leu Val Thr Asp Leu239Thr Lys Val His Thr Glu Cys Cys His Gly Asp Leu Leu Glu Cys Ala Asp256Asp Arg Ala Asp Leu Ala Lys Tyr Ile Cys Glu Asn Gln Asp Ser Ile Ser273Ser Lys Leu Lys Glu Cys Cys Glu Lys Pro Leu Leu Glu Lys Ser His Cys290Ile Ala Glu Val Glu Asn Asp Glu Met Pro Ala Asp Leu Pro Ser Leu Ala307Ala Asp Phe Val Glu Ser Lys Asp Val Cys Lys Asn Tyr Ala Glu Ala Lys324Asp Val Phe Leu Gly Met Phe Leu Tyr Glu Tyr Ala Arg Arg His Pro Asp341Tyr Ser Val Val Leu Leu Leu Arg Leu Ala Lys Thr Tyr Ghu Thr Thr Leu358Glu Lys Cys Cys Ala Ala Ala Asp Pro His Glu Cys Tyr Ala Lys Val Phe375Asp Glu Phe Lys Pro Leu Val Glu Glu Pro Gln Asn Leu Ile Lys Gln Asn392Cys Glu Leu Phe Glu Gln Leu Gly Glu tyr Lys Phe Gln Asn Ala Leu Leu409Val Arg Tyr Thu Lys Lys Val Pro Gln Val Ser Thr Pro Thr Leu Val Glu426Val Ser Arg Asn Leu Gly Lys Val Gly Ser Lys Cys Cys Lys His Pro Glu443Ala Lys Arg Met Pro Cys Ala Glu Asp Tyr Leu Ser Val Val Leu Asn Gln460Leu Cys Val Leu His Glu Lys Thr Pro Val Ser Asp Arg Val Thr Lys Cys477Cys Thr Glu Ser Leu Val Asn Arg Arg Pro Cys Phe Ser Ala Leu Glu Val494Asp Glu Thr Tyr Val Pro Lys Glu Phe Asn Ala Glu Thr Phe Thr Phe His511Ala Asp Ile Cys Thr Leu Ser Glu Lys Glu Arg Gln Ile Lys Lys Gln Thr528Ala Leu Val Glu Leu Val Lys His Lys Pro Lys Ala Thr Lys Glu Gln Leu545Lys Ala Val Met Asp Asp Phe Ala Ala Phe Val Glu Lys cys Cys Lys Ala562Asp Asp Lys Glu Thr Cys Phe Ala Glu Glu Gly Lys Lys Leu Val Ala Ala579 585Ser Gln Ala Ala Leu Gly Leu