CN115851656A - 一种乙肝病毒聚合酶的制备方法 - Google Patents

一种乙肝病毒聚合酶的制备方法 Download PDF

Info

Publication number
CN115851656A
CN115851656A CN202111120740.5A CN202111120740A CN115851656A CN 115851656 A CN115851656 A CN 115851656A CN 202111120740 A CN202111120740 A CN 202111120740A CN 115851656 A CN115851656 A CN 115851656A
Authority
CN
China
Prior art keywords
leu
ser
fusion protein
ala
pro
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111120740.5A
Other languages
English (en)
Inventor
欧先金
陈瑜涛
李雪梅
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Biophysics of CAS
Original Assignee
Institute of Biophysics of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Biophysics of CAS filed Critical Institute of Biophysics of CAS
Priority to CN202111120740.5A priority Critical patent/CN115851656A/zh
Publication of CN115851656A publication Critical patent/CN115851656A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Peptides Or Proteins (AREA)

Abstract

本公开涉及一种乙肝病毒聚合酶的制备方法,其包括以下步骤:(a)构建表达融合蛋白的重组表达载体,其中,所述融合蛋白包含MBP和HBV聚合酶;(b)将所述重组表达载体转入宿主细胞培养,得到融合蛋白;(c)提取所述融合蛋白;(d)利用变性剂对提取的所述融合蛋白进行变性,得到变性后的融合蛋白;(e)对变性后的所述融合蛋白进行复性,得到复性后的融合蛋白;(f)对复性后的所述融合蛋白进行酶切,得到HBV聚合酶。

Description

一种乙肝病毒聚合酶的制备方法
技术领域
本公开属于蛋白质制备领域,尤其涉及一种乙肝病毒聚合酶的制备方法。
背景技术
全球累积有近20亿乙肝病毒感染者,目前仍然有2.57乙肝病毒感染者(乙肝病毒表面抗性为阳性),我国有过亿乙肝感染者,是全球感染人数最多的国家,乙肝病毒及其对应疾病成为危害人类公共健康的重要疾病之一。
DNA是遗传信息的携带载体,蛋白质则是生物功能的执行者,所以对蛋白质的功能结构的研究有助于对病毒全面认识,并开发对应的预防和治疗方案。目前蛋白质研究通常需要先重组表达和纯化,制备大量正确折叠、足够纯度的蛋白质样品,再做后续相应的科学研究(比如三维空间结构研究)。目前除了核心抗原蛋白质能够通过重组表达制备,满足科学研究需求的蛋白质样品之外,其他3个蛋白质目前都很难通过重组表达方式得到合格的蛋白质样品。
乙肝病毒是一种小型的DNA病毒,全长约3200核苷酸碱基对,编码4个蛋白质:表面抗原蛋白质、核心抗原蛋白质、聚合酶蛋白质和X蛋白质。乙肝病毒的聚合酶有843个氨基酸残基,不同病毒来源的聚合酶序列稍有不同,但都由末端蛋白质(TP)、RT和RH三个结构域组成。聚合酶的分子量较大,且含有较多的半胱氨酸,容易形成内部二硫键,不合适在传统原核表达系统(如大肠杆菌)进行重组表达,通常结果是不表达或以不可溶的包涵体形式存在。即使尝试把上述三个结构域分开,单独重组构建在目前流行pet重组载体进行表达,都是以不可溶性的包涵体形式存在(任鹏程,等.乙肝病毒P蛋白在大肠杆菌中的分段表达及纯化[J].中国生物制品学杂志,2009,22(11):1080-1083)。即使在折叠系统更高的昆虫表达系统,主要也以包涵体形式存在(Lanford R E,et al.Nucleotide priming andreverse transcriptase activity of hepatitis B virus polymerase expressed ininsect cells[J].Journal of virology,1995,69(7):4431-4439)。有报道在酵母表达系统中聚合酶能够可溶性表达,但是稳定性很差,也没法得到足量的完整蛋白质样品(ChoiJ,et al.Expression of the active human and duck hepatitis B virus polymerasesin heterologous system of Pichia methanolica[J].Antiviral research,2002,55(2):279-290)。
蛋白质的重组表达效果好坏具有很大的个体差异性,没有通用的万能方法。乙肝病毒的聚合酶的个体特性导致其重组表达十分困难:容易形成包涵体和降解。由于聚合酶样品制备的困难导致其三维结构一直没法得到解析,不能更好地认识病毒。同时,没有足量的高质量聚合酶样品,也不方便开展抑制剂药物筛选等相关研究工作。
目标基因序列直接连接在原核重组表达载体的启动子之后,然后直接诱导表达,通常因为后续目的基因序列的个体差异性和特殊性会导致其表达量的差异性很大。比如乙肝病毒聚合酶直接构建在载体启动子之后,其表达量水平会很低。同时,乙肝病毒聚合酶在细胞内环节的稳定性较差,容易自发降解成小片段蛋白质。
综上所述,目前需要研发一种大量表达可溶性乙肝病毒聚合酶的方法。
发明内容
为了解决现有技术的问题,本公开提供了一种乙肝病毒聚合酶的制备方法,所述方法包括:
1.一种HBV聚合酶的制备方法,其包括以下歩骤:
(a)构建表达融合蛋白的重组表达载体,其中,所述融合蛋白包含MBP和HBV聚合酶;
(b)将所述重组表达载体转入宿主细胞培养,得到融合蛋白;
(c)提取所述融合蛋白;
(d)利用变性剂对提取的所述融合蛋白进行变性,得到变性后的融合蛋白;
(e)对变性后的所述融合蛋白进行复性,得到复性后的融合蛋白;
(f)对复性后的所述融合蛋白进行酶切,得到HBV聚合酶。
本公开通过在重组表达载体启动子和目标基因序列之间添加一个已验证过的表达性能很好的辅助蛋白质序列,带来了两个改善效果:增加后续目标基因的表达量和可溶性。本公开进一步采用蛋白质的变性-复性方法,首先对表达后菌体进行粗提取处理,使所有蛋白质都变性(包括导致聚合酶降解的各种蛋白酶),从而避免聚合酶被降解,然后对变性后的样品进行亲和纯化,通过对纯化后的变性聚合酶样品进行复性即得到可溶性融合蛋白质,再进行蛋白酶酶切把辅助蛋白质和聚合酶切割分开,相比现有技术减少了HBV聚合酶蛋白的降解。
附图说明
图1为转入重组表达载体的重组大肠杆菌加入诱导物前后融合蛋白表达量的示意图,诱导后相对于诱导前有明显的融合蛋白表达。
图2为变性的融合蛋白相比于未变性蛋白没有降解且纯化率高的示意图。
图3为融合蛋白被Precission酶切割成聚合酶和MBP两个独立蛋白质的示意图。
具体实施方式
在本公开中,除非另有说明,否则本文中使用的科学和技术名词具有本领域技术人员所通常理解的含义。并且,本文中所用的蛋白质和核酸化学、分子生物学、细胞和组织培养、微生物学、免疫学相关术语和实验室操作步骤均为相应领域内广泛使用的术语和常规步骤。同时,为了更好地理解本公开,下面提供相关术语的定义和解释。
如本文使用的和除非另作说明,术语“约”或“大约”是指在给定值或范围的加或减10%之内。在需要整数的情况下,该术语是指在给定值或范围的加或减10%之内、向上或向下舍入到最接近的整数。
如本文使用的和除非另作说明,术语“包含”、“包括”、“具有”、“含有”、包括其语法上的等同形式,通常应当理解为开放式且非限制性的,例如,不排除其他未列举的要素或步骤。
术语“MBP”是指大肠杆菌的麦芽糖结合蛋白。可以将一部分麦芽糖结合蛋白添加到目的蛋白中,以产生融合蛋白;当在细菌宿主中表达时,一部分麦芽糖结合蛋白可能仅增强所得融合蛋白的溶解性。另一方面,一部分麦芽糖结合蛋白可以允许融合蛋白在直链淀粉树脂上的亲和纯化。
术语“融合蛋白”是指具有通过共价键相互结合的两个部分的多肽,各部分具有不同的特性。该特性例如可以是体外或体内活性等生物学性质。此外,该特性甚至还可以是单一的化学或物理性质、例如与对象抗原的结合、反应的催化等。这两个部分可以通过单一的肽键直接结合、或者经由包含1个或多个氨基酸残基的肽接头进行结合。通常,这两个部分和接头存在于相同的读取框中。优选多肽的两个部分由异种或不同的多肽获得。
术语“变性剂”是指将引起蛋白质的可逆解折叠的任何化合物或材料。变性试剂或变性剂的强度由具体变性试剂或变性剂的性质和浓度两者确定。例如,变性试剂或变性剂包括但不限于离液剂(chaotropes)、洗涤剂、与水混溶的有机溶剂、磷脂或其组合。离液剂的非限制性实例包括但不限于尿素、胍和硫氰酸钠。洗涤剂的非限制性实例包括但不限于强洗涤剂例如十二烷基硫酸钠或聚氧乙烯醚(比如Tween或Triton洗涤剂)、N-十二烷基肌氨酸钠(Sarkosyl);温和非离子型洗涤剂(例如毛地黄皂苷);温和离子型洗涤剂(例如胆酸钠或去氧胆酸钠)或两性离子洗涤剂包括但不限于:N-2,3-(二油酰氧基)-丙基-N,N,N-三甲铵、磺酸甜菜碱(Zwiftergent)、3-(3-胆酰氨基丙基)二甲基铵基-1-丙烷硫酸盐(CHAPS)以及3-(3-胆酰氨基丙基)二甲基铵基-2-羟基-1-丙烷磺酸盐(CHAPSO)。与水混溶的有机溶剂的非限制性实例包括但不限于乙腈、低级烷醇(尤其是C2-C4烷醇,例如乙醇或异丙醇)或低级烷二醇(C2-C4烷二醇,例如乙二醇)。磷脂的非限制性实例包括但不限于天然存在的磷脂,例如磷脂酰乙醇胺、磷脂酰胆碱、磷脂酰丝氨酸和磷脂酰肌醇,或合成的磷脂衍生物或变体,例如二己酰磷脂酰胆碱或二庚酰磷脂酰胆碱。
在一方面,本公开提供了一种HBV聚合酶的制备方法,其包括以下歩骤:
(a)构建表达融合蛋白的重组表达载体,其中,所述融合蛋白包含MBP和HBV聚合酶;
(b)将所述重组表达载体转入宿主细胞培养,得到融合蛋白;
(c)提取所述融合蛋白;
(d)利用变性剂对提取的所述融合蛋白进行变性,得到变性后的融合蛋白;
(e)对变性后的所述融合蛋白进行复性,得到复性后的融合蛋白;
(f)对复性后的所述融合蛋白进行酶切,得到HBV聚合酶。
在一些实施方式中,其中步骤(a)中所述重组表达载体为原核生物表达载体或真核生物表达载体;
在一些实施方式中,所述原核表达载体选自pET-28a、pET-30a、pET-31b、pET-34b、pET-35b、pET22b或pET-43.1。
在一些实施方式中,所述真核表达载体选自pPICZαA、pPICZαB、pPICZαC、pPIC9、pHIL-S1、pPIC9K。
在一些实施方式中,其中步骤(a)包括在MBP的基因序列之后直接连接Precission蛋白酶识别位点序列,然后连接HBV聚合酶的基因序列,通过由商业公司全合成的方式完成片段连接,获得编码融合蛋白的基因序列,再将所述融合蛋白的基因序列连接到pET-28a载体的BamH I和Xhol酶切位点之间,得到表达融合蛋白的重组载体。
在一些实施方式中,其中步骤(a)中,所述HBV聚合酶的氨基酸序列包含与SEQ IDNO2所示氨基酸序列具有80%或以上同一性的氨基酸序列,优选具有85%、90%、95%、96%、97%、98%、99%以上同一性的氨基酸序列,更优选具有98%或99%以上同一性的氨基酸序列;更优选地,所述HBV聚合酶的氨基酸序列如SEQ ID NO.2所示。
在一些实施方式中,所述HBV聚合酶的编码核酸包含与SEQ ID NO:1所示核苷酸序列具有80%或以上同一性的核苷酸序列,优选具有85%、90%、95%、96%、97%、98%、99%以上同一性的核苷酸列,更优选具有98%或99%以上同一性的核苷酸序列;更优选地,所述HBV聚合酶的编码核酸如SEQ ID NO.1所示。
在一些实施方式中,所述MBP的氨基酸序列包含与SEQ ID NO 4所示氨基酸序列具有80%或以上同一性的氨基酸序列,优选具有85%、90%、95%、96%、97%、98%、99%以上同一性的氨基酸序列,更优选具有98%或99%以上同一性的氨基酸序列;更优选地,所述HBV聚合酶的氨基酸序列如SEQ ID NO.4所示。
在一些实施方式中,所述MBP的编码核酸包含与SEQ ID NO:3所示核苷酸序列具有80%或以上同一性的核苷酸序列,优选具有85%、90%、95%、96%、97%、98%、99%以上同一性的核苷酸列,更优选具有98%或99%以上同一性的核苷酸序列;更优选地,所述HBV聚合酶的编码核酸如SEQ ID NO.3所示。
在一些实施方式中,其中步骤(a)中所述融合蛋白还包含Precission蛋白酶识别位点和/或组氨酸标签。
在一些实施方式中,所述Precission蛋白酶识别位点的氨基酸序列如SEQ IDNo.6所示。
在一些实施方式中,所述Precission蛋白酶识别位点的核苷酸序列如SEQ IDNo.5所示。
在一些实施方式中,所述融合蛋白的氨基酸序列包含与SEQ ID NO 8所示氨基酸序列具有80%或以上同一性的氨基酸序列,优选具有85%、90%、95%、96%、97%、98%、99%以上同一性的氨基酸序列,更优选具有98%或99%以上同一性的氨基酸序列;更优选地,所述HBV聚合酶的氨基酸序列如SEQ ID No.8所示。
在一些实施方式中,所述融合蛋白的编码核酸包含与SEQ ID NO:7所示核苷酸序列具有80%或以上同一性的核苷酸序列,优选具有85%、90%、95%、96%、97%、98%、99%以上同一性的核苷酸列,更优选具有98%或99%以上同一性的核苷酸序列;更优选地,所述HBV聚合酶的编码核酸如SEQ ID No.7所示。
在一些实施方式中,其中步骤(b)中所述宿主细胞是原核细胞或真核细胞或昆虫细胞。
在一些实施方式中,所述原核细胞选自芽孢杆菌属,梭菌属,肠球菌属,土芽孢杆菌属,乳杆菌属,乳球菌属,海洋芽孢杆菌属,葡萄球菌属,链球菌属,链霉菌属,弯曲杆菌,大肠杆菌,黄杆菌属,梭杆菌属,螺杆菌属,泥杆菌属,奈瑟氏菌属,假单胞菌属,沙门氏菌属和脲原体属;更优选地,所述原核细胞是大肠杆菌;更优选地,所述大肠杆菌是BL21(De3)。
在一些实施方式中,所述真核细胞选自酵母细胞,例如,假丝酵母属,汉逊酵母属,克鲁维酵母属,毕赤酵母属,酵母属,裂殖酵母属或耶氏酵母属细胞,如乳酸克鲁维酵母,卡尔酵母,酿酒酵母,糖化酵母,道格拉氏酵母,克鲁弗酵母,诺地酵母,卵形酵母或解脂耶氏酵母细胞。
在一些实施方式中,所述昆虫细胞选自sf9细胞,sf21细胞,Hi5细胞。
在一些实施方式中,在步骤(b)中所述培养的过程中通过加入0.3-0.7nM的异丙基-β-D-硫代半乳糖苷(IPTG)作为诱导剂来诱导宿主细胞表达融合蛋白,诱导表达的温度为37℃,诱导表达的时间为3h~5h。
在一些实施方式中,其中步骤(c)所述提取包括冰浴超声波破碎,反复冻融,裂解液处理。
在一些实施方式中,步骤(c)的所述提取是冰浴超声破碎,所述冰浴超声破碎的功率为200W,4秒破碎4秒间隔休息,总破碎时间30分钟。
在一些实施方式中,其中步骤(d)中所述变性剂包括离液剂、洗涤剂、与水混溶的有机溶剂、磷脂或其组合。
在一些实施方式中,所述离液剂选自:尿素、胍和硫氰酸钠;更优选地,所述离液剂为尿素。
在一些实施方式中,所述洗涤剂选自:十二烷基硫酸钠或聚氧乙烯醚(比如Tween或Triton洗涤剂)、N-十二烷基肌氨酸钠(Sarkosyl);温和非离子型洗涤剂(例如毛地黄皂苷);温和离子型洗涤剂(例如胆酸钠或去氧胆酸钠)或两性离子洗涤剂包括但不限于:N-2,3-(二油酰氧基)-丙基-N,N,N-三甲铵、磺酸甜菜碱(Zwiftergent)、3-(3-胆酰氨基丙基)二甲基铵基-1-丙烷硫酸盐(CHAPS)以及3-(3-胆酰氨基丙基)二甲基铵基-2-羟基-1-丙烷磺酸盐(CHAPSO)。
在一些实施方式中,所述与水混溶的有机溶剂选自:乙腈、低级烷醇(尤其是C2-C4烷醇,例如乙醇或异丙醇)或低级烷二醇(C2-C4烷二醇,例如乙二醇)。
在一些实施方式中,所述磷脂选自:天然存在的磷脂,例如磷脂酰乙醇胺、磷脂酰胆碱、磷脂酰丝氨酸和磷脂酰肌醇,或合成的磷脂衍生物或变体,例如二己酰磷脂酰胆碱或二庚酰磷脂酰胆碱。
在一些实施方式中,所述融合蛋白变性后再进行纯化,优选进行亲和纯化。
在一些实施方式中,其中在步骤(d)中所述亲和纯化所使用的洗脱液成分为0-80mM咪唑,50mM Tris,100mM NaCl,pH=8.0。
在一些实施方式中,其中步骤(e)中所述复性选自低温处理、透析复性和稀释复性,
优选地,所述低温处理在4℃~10℃的环境中进行。
在一些实施方式中,所述透析复性通过将4℃过夜的10mL液体10000r/min离心15min,取上清,加入20%PEG 4000至终浓度为0.2%,同时加入50mmol/L的氧化性谷胱甘肽至终浓度为1mmol/L,加入100mmol/L还原性谷胱甘肽至终浓度为2mmol/L,4℃静置2h。
在一些实施方式中,在步骤(f)中所述酶切是通过加入Precission蛋白酶酶切所述融合蛋白,从而得到HBV聚合酶。
为了达到清楚和简洁描述的目的,本文中作为相同的或分开的一些实施方案的一部分来描述特征,然而,将要理解的是,本公开的范围可包括具有所描述的所有或一些特征的组合的一些实施方案。
实施例
实施例1:重组载体构建和蛋白质表达
本实施例构建了融合蛋白的表达载体,并将表达载体进行蛋白表达。其中,所述融合蛋白从N端至C端依次包含以下片段:MBP、Precission蛋白酶识别位点、乙肝病毒聚合酶以及组氨酸标签,所述融合蛋白的核苷酸序列如SEQ ID No.7所示,其氨基酸序列如SEQ IDNo.8所示。
载体构建及蛋白表达的具体步骤如下:
步骤1.重组载体构建
在MBP的基因序列(其核苷酸序列如SEQ ID No.3所示,其编码的氨基酸序列如SEQID No.4所示)之后直接连接Precission蛋白酶识别位点序列(其核苷酸序列如SEQ IDNo.5所示,其编码的氨基酸序列如SEQ ID No.6所示),然后连接目标蛋白(乙肝病毒聚合酶)的基因序列(其核苷酸序列如SEQ ID No.1所示),通过由商业公司全合成的方式完成片段连接,获得编码融合蛋白的基因序列(其核苷酸序列如SEQ ID No.7所示),再将所述融合蛋白的基因序列连接到pET-28a载体的BamH I和Xhol酶切位点之间,得到表达融合蛋白的重组载体,并将所述重组载体进行全长测序验证。验证正确的重组载体再转入BL21(DE3),作为重组表达的重组菌。
步骤2.重组菌的蛋白质表达
第一天下午,将重组菌接种到含有10mL LB培养基的试管,其中,卡那抗生素的终浓度为50μg/mL,放置摇床过夜培养,培养条件是37摄氏度和200转/分钟。第二天上午,取生长正常的过夜培养物10ml接种于含有1000mL LB培养基的2L摇瓶,卡那抗生素的终浓度为50μg/mL,然后放置摇床培养,培养条件是37摄氏度和200转/分钟。大约3-6小时后,当培养液的OD600nm约0.6-0.8时,取1mL培养液作为诱导前样品,然后添加终浓度为0.5mM的诱导物异丙基-β-D-硫代半乳糖苷(IPTG),继续培养4小时,之后取1mL作为诱导后样品。最后把诱导前和诱导后样品进行常规的蛋白质变性电泳验证重组载体的表达情况,结果见图1,“3”是蛋白质Marker,分子量由大到小分别是130、95、70和60千道尔顿,诱导后样品(图1中“1”)相对诱导前样品(图1中“2”)有明显的表达带(图1种箭头所示)。
实施例2:重组融合蛋白的变性亲和纯化
用50mL常规tris缓冲液(50mM Tris,100mM NaCl,pH=8.0)重悬实施例1获得的重组菌,再用冰浴超声波破碎,条件是功率200w,4秒破碎,4秒间隔休息,总破碎时间30分钟。破碎液用16000g离心力离心30分钟,丢弃上清,沉淀部分用50mL变性缓冲液(8M尿素,10mMβ-巯基乙醇,50mM Tris,100mM NaCl,pH=8.0)重悬并室温放置进行蛋白质变性。2-3小时后,充分变性的样品液用16000g离心力离心30分钟,从上清取50uL作为“变性液样品”,剩余上清液进行常规的6个组氨酸标签的亲和纯化。装有3mL镍介质的重力柱用变性缓冲液(8M尿素,10mMβ-巯基乙醇,50mM Tris,100mM NaCl,pH=8.0)预平衡后,将剩余上清液导入柱中,由于重力驱动上清液流经镍介质,含有6个组氨酸标签的聚合酶蛋白质被镍介质吸附,其他杂蛋白质流穿。然后再用不同咪唑浓度(0mM,30mM和60mM)的tris缓冲液梯度洗脱,具体操作如下:用50mL含0mM咪唑的tris缓冲液冲洗吸附后的镍介质柱后,封住下端堵头再添加2mL变性缓冲液(8M尿素,10mMβ-巯基乙醇,50mM Tris,100mM NaCl,pH=8.0)重悬镍介质,然后取出50μL悬浮介质作为“0mM后介质样品”。然后再用50mL含30mM咪唑的tris缓冲液冲洗后,封住下端堵头再添加2mL缓冲液(8M尿素,10mMβ-巯基乙醇,50mM Tris,100mMNaCl,pH=8.0)重悬镍介质,然后取出50μL悬浮介质作为“30mM后介质样品”。再用50mL含60mM咪唑的tris缓冲液冲洗后,封住下端堵头后再添加2mL缓冲液(8M尿素,10mMβ-巯基乙醇,50mM Tris,100mM NaCl,pH=8.0)重悬镍介质,然后取出50μL悬浮介质作为“60mM后介质样品”。把变性液样品和上述3个样品(0mM后介质样品、30mM后介质样品、60mM后介质样品)进行常规的蛋白质变性电泳胶实验,结果见图2。图2中“1”是蛋白质Marker,分子量由大到小分别是130、95、70和60千道尔顿,“2”、“3”、“4”和“5”分别是变性液样品、0mM后介质样品、30mM后介质样品和60mM后介质样品。实验结果表明:(1)变性的融合蛋白得到很好的纯化,(2)可用含10-30mM咪唑的tris缓冲液洗杂蛋白质,然后用60mM咪唑缓冲液洗脱融合蛋白,(3)变性状态的融合蛋白没有降解。
实施例3:复性后重组融合蛋白的蛋白酶酶切
收集实施例2中从含60mM咪唑的tirs缓冲液洗脱下来的融合蛋白样品,并浓缩到一定体积,然后在低温环境下缓慢稀释进行复性,得到复性后融合蛋白样品液约80mL。通过50kd分子量截留值的浓缩管(50mL)进行浓缩换液,多次循环浓缩换液,缓冲液为10mMbeta-巯基乙醇,50mM Tris,100mM NaCl,pH=8.0,然后定容至2mL体积,再添加约100μgPrecission protease(简称pp酶)进行16摄氏度过夜静止酶切。酶切前后各取50μl样品进行常规的蛋白质变性电泳实验。结果如图3所示,“1”是蛋白质Marker,分子量由大到小分别是130、95、70和60千道尔顿,“2”过夜切割后,“3”是切割前,结果显示融合蛋白被切割成聚合酶(图3中黑色箭头所示)和MBP两个独立的蛋白质条带。
序列表
<110> 中国科学院生物物理研究所
<120> 一种乙肝病毒聚合酶的制备方法
<130> MTI21210
<160> 8
<170> SIPOSequenceListing 1.0
<210> 1
<211> 2532
<212> DNA
<213> Hepatitis B virus
<400> 1
atgcctttgt cttaccagca cttccgaaaa ttgctgttgc tcgacgaaga ggccggccca 60
ttggaagagg aattgcctag gttggctgac gagggtttga accgtagagt ggctgaggac 120
ctgaacctcg gaaacctgaa cgtgtctatc ccctggaccc acaaggtcgg caacttcacc 180
ggattgtaca gctcaactgt gccatgcttc aaccctaagt ggcagactcc ttcattcccc 240
gacatccact tgcaagagga catcgtcgat agatgcaagc agttcgtcgg ccctctgacc 300
gtgaacgaga acaggcgttt gaagttgatc atgccagctc gtttctaccc aaacgtgact 360
aagtacctcc cattggacaa gggaatcaag ccttactacc ccgagtatgt agtgaaccac 420
tacttccaga ctagacacta cctgcacact ctgtggaagg ctggaatctt gtacaagaga 480
gagtctactc gtagcgcttc attctgcggt agcccttaca gctgggagca ggacttgcaa 540
cacggtagat tggtgttcca gactagcaag aggcacggcg acaagtcatt ctgccctcag 600
agccccggta tcctgcctag gtctagcgtg ggtccttgca tccagtccca gttgagaaag 660
tcacgcctcg gtcctcagcc cgctcagggt cagttggccg gtaggcagca gggcggttct 720
ggatcaatca gggctagggt gcacccatct ccgtggggca ctgtcggcgt cgagccaagc 780
ggaagcggtc caactcacaa ctgcgcatct tcatcatcta gctgcttgca ccagagcgcc 840
gtgagaaagg ccgcttactc attgatctct acttcaaagg gacactctag ctccggtcac 900
gccgtggagc tgcaccactt ccccccaaac agctcccgct ctcagtcaca gggaccagtg 960
ttgtcatgtt ggtggttaca attccgtaac agcgagccat gctccgagta ctgcttgtgc 1020
cacatcgtca acctgatcga ggactggggc ccatgcaccg agcacggcga gcacagaatc 1080
cgtaccccta ggactcccgc tcgcgtgacc ggcggcgtgt tcttggttga taagaaccca 1140
cacaacacta ccgagtcacg tttggtggtt gatttcagcc agttctcacg cggtaacact 1200
agagtgtcat ggccaaagtt cgctgtgcca aaccttcaat ctttgactaa cctcctgtcg 1260
tcaaacctga gctggttgtc attggacgtg agcgccgctt tctaccacct gcctttgcac 1320
cccgccgcta tgccacactt gctggttggt tcaagcggat tgtctcgtta cgtcgcccgt 1380
ctgtcctcta acagccgtat catcaacaac cagcacagga ctatgcagaa cttgcacaac 1440
tcatgctctc gcaacctgta tgtatctctg atgttgctct acaagactta cggtagaaag 1500
ctccacttgt actcacaccc tatcatcctc ggattccgta agatccctat gggagtcgga 1560
ttgagccctt tcttgctggc ccagttcact agcgctatct gctctgtggt gagacgcgct 1620
ttccctcact gcctggcttt ctcatacatg gacgacgtcg tgttgggagc taagtcagtg 1680
cagcaccttg agtccctcta cgccgctgtg actaacttcc tcctgtcttt gggcatccac 1740
ctgaacccac acaagactaa gagatggggt tactcattga acttcatggg atatgttatc 1800
ggaagctggg gtactctccc tcaagagcac atcgtccaga agatcaagat gtgcttccgt 1860
aagctccccg tgaacagacc aatcgactgg aaggtgtgcc agcgtatcgt cggtttgctc 1920
ggattcgccg ctccattcac tcagtgcgga taccccgcct tgatgcctct gtacgcttgc 1980
atccaggcta agcaggcttt cactttcagc cctacttaca aggctttctt gtcaaagcag 2040
tacctgaacc tgtaccccgt ggctaggcag agacccggtt tgtgccaggt gttcgctgac 2100
gctactccta ccggatgggg tttggctatc ggtcaccagc gtatgagagg tactttcgtg 2160
agcccattgc caatccacac cgccgagttg ttggccgcct gcttcgctag atcacgttct 2220
ggtgctaagt tgatcggaac tgacaactca gtggtcctgt ctcgcaagta cacttctttc 2280
ccctggttgt tgggatgcgc cgctaactgg atcttgcgcg gcacttcatt cgtctacgtc 2340
ccttccgcct tgaaccccgc cgacgaccca tctcgcggaa gattgggttt gtacaggcct 2400
ttgttgcgtt tgttgtacag accaactacc ggtagaactt ctctgtacgc cgactctcca 2460
tctgtgccta gccacctccc cgaccgcgtc cacttcgctt ccccattgca cgtcgcctgg 2520
cgtcctccct ga 2532
<210> 2
<211> 843
<212> PRT
<213> Hepatitis B virus
<400> 2
Met Pro Leu Ser Tyr Gln His Phe Arg Lys Leu Leu Leu Leu Asp Glu
1 5 10 15
Glu Ala Gly Pro Leu Glu Glu Glu Leu Pro Arg Leu Ala Asp Glu Gly
20 25 30
Leu Asn Arg Arg Val Ala Glu Asp Leu Asn Leu Gly Asn Leu Asn Val
35 40 45
Ser Ile Pro Trp Thr His Lys Val Gly Asn Phe Thr Gly Leu Tyr Ser
50 55 60
Ser Thr Val Pro Cys Phe Asn Pro Lys Trp Gln Thr Pro Ser Phe Pro
65 70 75 80
Asp Ile His Leu Gln Glu Asp Ile Val Asp Arg Cys Lys Gln Phe Val
85 90 95
Gly Pro Leu Thr Val Asn Glu Asn Arg Arg Leu Lys Leu Ile Met Pro
100 105 110
Ala Arg Phe Tyr Pro Asn Val Thr Lys Tyr Leu Pro Leu Asp Lys Gly
115 120 125
Ile Lys Pro Tyr Tyr Pro Glu Tyr Val Val Asn His Tyr Phe Gln Thr
130 135 140
Arg His Tyr Leu His Thr Leu Trp Lys Ala Gly Ile Leu Tyr Lys Arg
145 150 155 160
Glu Ser Thr Arg Ser Ala Ser Phe Cys Gly Ser Pro Tyr Ser Trp Glu
165 170 175
Gln Asp Leu Gln His Gly Arg Leu Val Phe Gln Thr Ser Lys Arg His
180 185 190
Gly Asp Lys Ser Phe Cys Pro Gln Ser Pro Gly Ile Leu Pro Arg Ser
195 200 205
Ser Val Gly Pro Cys Ile Gln Ser Gln Leu Arg Lys Ser Arg Leu Gly
210 215 220
Pro Gln Pro Ala Gln Gly Gln Leu Ala Gly Arg Gln Gln Gly Gly Ser
225 230 235 240
Gly Ser Ile Arg Ala Arg Val His Pro Ser Pro Trp Gly Thr Val Gly
245 250 255
Val Glu Pro Ser Gly Ser Gly Pro Thr His Asn Cys Ala Ser Ser Ser
260 265 270
Ser Ser Cys Leu His Gln Ser Ala Val Arg Lys Ala Ala Tyr Ser Leu
275 280 285
Ile Ser Thr Ser Lys Gly His Ser Ser Ser Gly His Ala Val Glu Leu
290 295 300
His His Phe Pro Pro Asn Ser Ser Arg Ser Gln Ser Gln Gly Pro Val
305 310 315 320
Leu Ser Cys Trp Trp Leu Gln Phe Arg Asn Ser Glu Pro Cys Ser Glu
325 330 335
Tyr Cys Leu Cys His Ile Val Asn Leu Ile Glu Asp Trp Gly Pro Cys
340 345 350
Thr Glu His Gly Glu His Arg Ile Arg Thr Pro Arg Thr Pro Ala Arg
355 360 365
Val Thr Gly Gly Val Phe Leu Val Asp Lys Asn Pro His Asn Thr Thr
370 375 380
Glu Ser Arg Leu Val Val Asp Phe Ser Gln Phe Ser Arg Gly Asn Thr
385 390 395 400
Arg Val Ser Trp Pro Lys Phe Ala Val Pro Asn Leu Gln Ser Leu Thr
405 410 415
Asn Leu Leu Ser Ser Asn Leu Ser Trp Leu Ser Leu Asp Val Ser Ala
420 425 430
Ala Phe Tyr His Leu Pro Leu His Pro Ala Ala Met Pro His Leu Leu
435 440 445
Val Gly Ser Ser Gly Leu Ser Arg Tyr Val Ala Arg Leu Ser Ser Asn
450 455 460
Ser Arg Ile Ile Asn Asn Gln His Arg Thr Met Gln Asn Leu His Asn
465 470 475 480
Ser Cys Ser Arg Asn Leu Tyr Val Ser Leu Met Leu Leu Tyr Lys Thr
485 490 495
Tyr Gly Arg Lys Leu His Leu Tyr Ser His Pro Ile Ile Leu Gly Phe
500 505 510
Arg Lys Ile Pro Met Gly Val Gly Leu Ser Pro Phe Leu Leu Ala Gln
515 520 525
Phe Thr Ser Ala Ile Cys Ser Val Val Arg Arg Ala Phe Pro His Cys
530 535 540
Leu Ala Phe Ser Tyr Met Asp Asp Val Val Leu Gly Ala Lys Ser Val
545 550 555 560
Gln His Leu Glu Ser Leu Tyr Ala Ala Val Thr Asn Phe Leu Leu Ser
565 570 575
Leu Gly Ile His Leu Asn Pro His Lys Thr Lys Arg Trp Gly Tyr Ser
580 585 590
Leu Asn Phe Met Gly Tyr Val Ile Gly Ser Trp Gly Thr Leu Pro Gln
595 600 605
Glu His Ile Val Gln Lys Ile Lys Met Cys Phe Arg Lys Leu Pro Val
610 615 620
Asn Arg Pro Ile Asp Trp Lys Val Cys Gln Arg Ile Val Gly Leu Leu
625 630 635 640
Gly Phe Ala Ala Pro Phe Thr Gln Cys Gly Tyr Pro Ala Leu Met Pro
645 650 655
Leu Tyr Ala Cys Ile Gln Ala Lys Gln Ala Phe Thr Phe Ser Pro Thr
660 665 670
Tyr Lys Ala Phe Leu Ser Lys Gln Tyr Leu Asn Leu Tyr Pro Val Ala
675 680 685
Arg Gln Arg Pro Gly Leu Cys Gln Val Phe Ala Asp Ala Thr Pro Thr
690 695 700
Gly Trp Gly Leu Ala Ile Gly His Gln Arg Met Arg Gly Thr Phe Val
705 710 715 720
Ser Pro Leu Pro Ile His Thr Ala Glu Leu Leu Ala Ala Cys Phe Ala
725 730 735
Arg Ser Arg Ser Gly Ala Lys Leu Ile Gly Thr Asp Asn Ser Val Val
740 745 750
Leu Ser Arg Lys Tyr Thr Ser Phe Pro Trp Leu Leu Gly Cys Ala Ala
755 760 765
Asn Trp Ile Leu Arg Gly Thr Ser Phe Val Tyr Val Pro Ser Ala Leu
770 775 780
Asn Pro Ala Asp Asp Pro Ser Arg Gly Arg Leu Gly Leu Tyr Arg Pro
785 790 795 800
Leu Leu Arg Leu Leu Tyr Arg Pro Thr Thr Gly Arg Thr Ser Leu Tyr
805 810 815
Ala Asp Ser Pro Ser Val Pro Ser His Leu Pro Asp Arg Val His Phe
820 825 830
Ala Ser Pro Leu His Val Ala Trp Arg Pro Pro
835 840
<210> 3
<211> 1101
<212> DNA
<213> Escherichia coli
<400> 3
atgaaaatcg aagaaggtaa actggtaatc tggattaacg gcgataaagg ctataacggt 60
ctcgctgaag tcggtaagaa attcgagaaa gataccggaa ttaaagtcac cgttgagcat 120
ccggataaac tggaagagaa attcccacag gttgcggcaa ctggcgatgg ccctgacatt 180
atcttctggg cacacgaccg ctttggtggc tacgctcaat ctggcctgtt ggctgaaatc 240
accccggaca aagcgttcca ggacaagctg tatccgttta cctgggatgc cgtacgttac 300
aacggcaagc tgattgctta cccgatcgct gttgaagcgt tatcgctgat ttataacaaa 360
gatctgctgc cgaacccgcc aaaaacctgg gaagagatcc cggcgctgga taaagaactg 420
aaagcgaaag gtaagagcgc gctgatgttc aacctgcaag aaccgtactt cacctggccg 480
ctgattgctg ctgacggggg ttatgcgttc aagtatgaaa acggcaagta cgacattaaa 540
gacgtgggcg tggataacgc tggcgcgaaa gcgggtctga ccttcctggt tgacctgatt 600
aaaaacaaac acatgaatgc agacaccgat tactccatcg cagaagctgc ctttaataaa 660
ggcgaaacag cgatgaccat caacggcccg tgggcatggt ccaacatcga caccagcaaa 720
gtgaattatg gtgtaacggt actgccgacc ttcaagggtc aaccatccaa accgttcgtt 780
ggcgtgctga gcgcaggtat taacgccgcc agtccgaaca aagagctggc aaaagagttc 840
ctcgaaaact atctgctgac tgatgaaggt ctggaagcgg ttaataaaga caaaccgctg 900
ggtgccgtag cgctgaagtc ttacgaggaa gagttggcga aagatccacg tattgccgcc 960
actatggaaa acgcccagaa aggtgaaatc atgccgaaca tcccgcagat gtccgctttc 1020
tggtatgccg tgcgtactgc ggtgatcaac gccgccagcg gtcgtcagac tgtcgatgaa 1080
gccctgaaag acgcgcagac t 1101
<210> 4
<211> 367
<212> PRT
<213> Escherichia coli
<400> 4
Met Lys Ile Glu Glu Gly Lys Leu Val Ile Trp Ile Asn Gly Asp Lys
1 5 10 15
Gly Tyr Asn Gly Leu Ala Glu Val Gly Lys Lys Phe Glu Lys Asp Thr
20 25 30
Gly Ile Lys Val Thr Val Glu His Pro Asp Lys Leu Glu Glu Lys Phe
35 40 45
Pro Gln Val Ala Ala Thr Gly Asp Gly Pro Asp Ile Ile Phe Trp Ala
50 55 60
His Asp Arg Phe Gly Gly Tyr Ala Gln Ser Gly Leu Leu Ala Glu Ile
65 70 75 80
Thr Pro Asp Lys Ala Phe Gln Asp Lys Leu Tyr Pro Phe Thr Trp Asp
85 90 95
Ala Val Arg Tyr Asn Gly Lys Leu Ile Ala Tyr Pro Ile Ala Val Glu
100 105 110
Ala Leu Ser Leu Ile Tyr Asn Lys Asp Leu Leu Pro Asn Pro Pro Lys
115 120 125
Thr Trp Glu Glu Ile Pro Ala Leu Asp Lys Glu Leu Lys Ala Lys Gly
130 135 140
Lys Ser Ala Leu Met Phe Asn Leu Gln Glu Pro Tyr Phe Thr Trp Pro
145 150 155 160
Leu Ile Ala Ala Asp Gly Gly Tyr Ala Phe Lys Tyr Glu Asn Gly Lys
165 170 175
Tyr Asp Ile Lys Asp Val Gly Val Asp Asn Ala Gly Ala Lys Ala Gly
180 185 190
Leu Thr Phe Leu Val Asp Leu Ile Lys Asn Lys His Met Asn Ala Asp
195 200 205
Thr Asp Tyr Ser Ile Ala Glu Ala Ala Phe Asn Lys Gly Glu Thr Ala
210 215 220
Met Thr Ile Asn Gly Pro Trp Ala Trp Ser Asn Ile Asp Thr Ser Lys
225 230 235 240
Val Asn Tyr Gly Val Thr Val Leu Pro Thr Phe Lys Gly Gln Pro Ser
245 250 255
Lys Pro Phe Val Gly Val Leu Ser Ala Gly Ile Asn Ala Ala Ser Pro
260 265 270
Asn Lys Glu Leu Ala Lys Glu Phe Leu Glu Asn Tyr Leu Leu Thr Asp
275 280 285
Glu Gly Leu Glu Ala Val Asn Lys Asp Lys Pro Leu Gly Ala Val Ala
290 295 300
Leu Lys Ser Tyr Glu Glu Glu Leu Ala Lys Asp Pro Arg Ile Ala Ala
305 310 315 320
Thr Met Glu Asn Ala Gln Lys Gly Glu Ile Met Pro Asn Ile Pro Gln
325 330 335
Met Ser Ala Phe Trp Tyr Ala Val Arg Thr Ala Val Ile Asn Ala Ala
340 345 350
Ser Gly Arg Gln Thr Val Asp Glu Ala Leu Lys Asp Ala Gln Thr
355 360 365
<210> 5
<211> 24
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
ctggaagttc tgttccaggg gccc 24
<210> 6
<211> 8
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 6
Leu Glu Val Leu Phe Gln Gly Pro
1 5
<210> 7
<211> 3675
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
atgaaaatcg aagaaggtaa actggtaatc tggattaacg gcgataaagg ctataacggt 60
ctcgctgaag tcggtaagaa attcgagaaa gataccggaa ttaaagtcac cgttgagcat 120
ccggataaac tggaagagaa attcccacag gttgcggcaa ctggcgatgg ccctgacatt 180
atcttctggg cacacgaccg ctttggtggc tacgctcaat ctggcctgtt ggctgaaatc 240
accccggaca aagcgttcca ggacaagctg tatccgttta cctgggatgc cgtacgttac 300
aacggcaagc tgattgctta cccgatcgct gttgaagcgt tatcgctgat ttataacaaa 360
gatctgctgc cgaacccgcc aaaaacctgg gaagagatcc cggcgctgga taaagaactg 420
aaagcgaaag gtaagagcgc gctgatgttc aacctgcaag aaccgtactt cacctggccg 480
ctgattgctg ctgacggggg ttatgcgttc aagtatgaaa acggcaagta cgacattaaa 540
gacgtgggcg tggataacgc tggcgcgaaa gcgggtctga ccttcctggt tgacctgatt 600
aaaaacaaac acatgaatgc agacaccgat tactccatcg cagaagctgc ctttaataaa 660
ggcgaaacag cgatgaccat caacggcccg tgggcatggt ccaacatcga caccagcaaa 720
gtgaattatg gtgtaacggt actgccgacc ttcaagggtc aaccatccaa accgttcgtt 780
ggcgtgctga gcgcaggtat taacgccgcc agtccgaaca aagagctggc aaaagagttc 840
ctcgaaaact atctgctgac tgatgaaggt ctggaagcgg ttaataaaga caaaccgctg 900
ggtgccgtag cgctgaagtc ttacgaggaa gagttggcga aagatccacg tattgccgcc 960
actatggaaa acgcccagaa aggtgaaatc atgccgaaca tcccgcagat gtccgctttc 1020
tggtatgccg tgcgtactgc ggtgatcaac gccgccagcg gtcgtcagac tgtcgatgaa 1080
gccctgaaag acgcgcagac tctggaagtt ctgttccagg ggcccatgcc tttgtcttac 1140
cagcacttcc gaaaattgct gttgctcgac gaagaggccg gcccattgga agaggaattg 1200
cctaggttgg ctgacgaggg tttgaaccgt agagtggctg aggacctgaa cctcggaaac 1260
ctgaacgtgt ctatcccctg gacccacaag gtcggcaact tcaccggatt gtacagctca 1320
actgtgccat gcttcaaccc taagtggcag actccttcat tccccgacat ccacttgcaa 1380
gaggacatcg tcgatagatg caagcagttc gtcggccctc tgaccgtgaa cgagaacagg 1440
cgtttgaagt tgatcatgcc agctcgtttc tacccaaacg tgactaagta cctcccattg 1500
gacaagggaa tcaagcctta ctaccccgag tatgtagtga accactactt ccagactaga 1560
cactacctgc acactctgtg gaaggctgga atcttgtaca agagagagtc tactcgtagc 1620
gcttcattct gcggtagccc ttacagctgg gagcaggact tgcaacacgg tagattggtg 1680
ttccagacta gcaagaggca cggcgacaag tcattctgcc ctcagagccc cggtatcctg 1740
cctaggtcta gcgtgggtcc ttgcatccag tcccagttga gaaagtcacg cctcggtcct 1800
cagcccgctc agggtcagtt ggccggtagg cagcagggcg gttctggatc aatcagggct 1860
agggtgcacc catctccgtg gggcactgtc ggcgtcgagc caagcggaag cggtccaact 1920
cacaactgcg catcttcatc atctagctgc ttgcaccaga gcgccgtgag aaaggccgct 1980
tactcattga tctctacttc aaagggacac tctagctccg gtcacgccgt ggagctgcac 2040
cacttccccc caaacagctc ccgctctcag tcacagggac cagtgttgtc atgttggtgg 2100
ttacaattcc gtaacagcga gccatgctcc gagtactgct tgtgccacat cgtcaacctg 2160
atcgaggact ggggcccatg caccgagcac ggcgagcaca gaatccgtac ccctaggact 2220
cccgctcgcg tgaccggcgg cgtgttcttg gttgataaga acccacacaa cactaccgag 2280
tcacgtttgg tggttgattt cagccagttc tcacgcggta acactagagt gtcatggcca 2340
aagttcgctg tgccaaacct tcaatctttg actaacctcc tgtcgtcaaa cctgagctgg 2400
ttgtcattgg acgtgagcgc cgctttctac cacctgcctt tgcaccccgc cgctatgcca 2460
cacttgctgg ttggttcaag cggattgtct cgttacgtcg cccgtctgtc ctctaacagc 2520
cgtatcatca acaaccagca caggactatg cagaacttgc acaactcatg ctctcgcaac 2580
ctgtatgtat ctctgatgtt gctctacaag acttacggta gaaagctcca cttgtactca 2640
caccctatca tcctcggatt ccgtaagatc cctatgggag tcggattgag ccctttcttg 2700
ctggcccagt tcactagcgc tatctgctct gtggtgagac gcgctttccc tcactgcctg 2760
gctttctcat acatggacga cgtcgtgttg ggagctaagt cagtgcagca ccttgagtcc 2820
ctctacgccg ctgtgactaa cttcctcctg tctttgggca tccacctgaa cccacacaag 2880
actaagagat ggggttactc attgaacttc atgggatatg ttatcggaag ctggggtact 2940
ctccctcaag agcacatcgt ccagaagatc aagatgtgct tccgtaagct ccccgtgaac 3000
agaccaatcg actggaaggt gtgccagcgt atcgtcggtt tgctcggatt cgccgctcca 3060
ttcactcagt gcggataccc cgccttgatg cctctgtacg cttgcatcca ggctaagcag 3120
gctttcactt tcagccctac ttacaaggct ttcttgtcaa agcagtacct gaacctgtac 3180
cccgtggcta ggcagagacc cggtttgtgc caggtgttcg ctgacgctac tcctaccgga 3240
tggggtttgg ctatcggtca ccagcgtatg agaggtactt tcgtgagccc attgccaatc 3300
cacaccgccg agttgttggc cgcctgcttc gctagatcac gttctggtgc taagttgatc 3360
ggaactgaca actcagtggt cctgtctcgc aagtacactt ctttcccctg gttgttggga 3420
tgcgccgcta actggatctt gcgcggcact tcattcgtct acgtcccttc cgccttgaac 3480
cccgccgacg acccatctcg cggaagattg ggtttgtaca ggcctttgtt gcgtttgttg 3540
tacagaccaa ctaccggtag aacttctctg tacgccgact ctccatctgt gcctagccac 3600
ctccccgacc gcgtccactt cgcttcccca ttgcacgtcg cctggcgtcc tccctgacat 3660
catcatcatc atcat 3675
<210> 8
<211> 1224
<212> PRT
<213> 人工序列(Artificial Sequence)
<400> 8
Met Lys Ile Glu Glu Gly Lys Leu Val Ile Trp Ile Asn Gly Asp Lys
1 5 10 15
Gly Tyr Asn Gly Leu Ala Glu Val Gly Lys Lys Phe Glu Lys Asp Thr
20 25 30
Gly Ile Lys Val Thr Val Glu His Pro Asp Lys Leu Glu Glu Lys Phe
35 40 45
Pro Gln Val Ala Ala Thr Gly Asp Gly Pro Asp Ile Ile Phe Trp Ala
50 55 60
His Asp Arg Phe Gly Gly Tyr Ala Gln Ser Gly Leu Leu Ala Glu Ile
65 70 75 80
Thr Pro Asp Lys Ala Phe Gln Asp Lys Leu Tyr Pro Phe Thr Trp Asp
85 90 95
Ala Val Arg Tyr Asn Gly Lys Leu Ile Ala Tyr Pro Ile Ala Val Glu
100 105 110
Ala Leu Ser Leu Ile Tyr Asn Lys Asp Leu Leu Pro Asn Pro Pro Lys
115 120 125
Thr Trp Glu Glu Ile Pro Ala Leu Asp Lys Glu Leu Lys Ala Lys Gly
130 135 140
Lys Ser Ala Leu Met Phe Asn Leu Gln Glu Pro Tyr Phe Thr Trp Pro
145 150 155 160
Leu Ile Ala Ala Asp Gly Gly Tyr Ala Phe Lys Tyr Glu Asn Gly Lys
165 170 175
Tyr Asp Ile Lys Asp Val Gly Val Asp Asn Ala Gly Ala Lys Ala Gly
180 185 190
Leu Thr Phe Leu Val Asp Leu Ile Lys Asn Lys His Met Asn Ala Asp
195 200 205
Thr Asp Tyr Ser Ile Ala Glu Ala Ala Phe Asn Lys Gly Glu Thr Ala
210 215 220
Met Thr Ile Asn Gly Pro Trp Ala Trp Ser Asn Ile Asp Thr Ser Lys
225 230 235 240
Val Asn Tyr Gly Val Thr Val Leu Pro Thr Phe Lys Gly Gln Pro Ser
245 250 255
Lys Pro Phe Val Gly Val Leu Ser Ala Gly Ile Asn Ala Ala Ser Pro
260 265 270
Asn Lys Glu Leu Ala Lys Glu Phe Leu Glu Asn Tyr Leu Leu Thr Asp
275 280 285
Glu Gly Leu Glu Ala Val Asn Lys Asp Lys Pro Leu Gly Ala Val Ala
290 295 300
Leu Lys Ser Tyr Glu Glu Glu Leu Ala Lys Asp Pro Arg Ile Ala Ala
305 310 315 320
Thr Met Glu Asn Ala Gln Lys Gly Glu Ile Met Pro Asn Ile Pro Gln
325 330 335
Met Ser Ala Phe Trp Tyr Ala Val Arg Thr Ala Val Ile Asn Ala Ala
340 345 350
Ser Gly Arg Gln Thr Val Asp Glu Ala Leu Lys Asp Ala Gln Thr Leu
355 360 365
Glu Val Leu Phe Gln Gly Pro Met Pro Leu Ser Tyr Gln His Phe Arg
370 375 380
Lys Leu Leu Leu Leu Asp Glu Glu Ala Gly Pro Leu Glu Glu Glu Leu
385 390 395 400
Pro Arg Leu Ala Asp Glu Gly Leu Asn Arg Arg Val Ala Glu Asp Leu
405 410 415
Asn Leu Gly Asn Leu Asn Val Ser Ile Pro Trp Thr His Lys Val Gly
420 425 430
Asn Phe Thr Gly Leu Tyr Ser Ser Thr Val Pro Cys Phe Asn Pro Lys
435 440 445
Trp Gln Thr Pro Ser Phe Pro Asp Ile His Leu Gln Glu Asp Ile Val
450 455 460
Asp Arg Cys Lys Gln Phe Val Gly Pro Leu Thr Val Asn Glu Asn Arg
465 470 475 480
Arg Leu Lys Leu Ile Met Pro Ala Arg Phe Tyr Pro Asn Val Thr Lys
485 490 495
Tyr Leu Pro Leu Asp Lys Gly Ile Lys Pro Tyr Tyr Pro Glu Tyr Val
500 505 510
Val Asn His Tyr Phe Gln Thr Arg His Tyr Leu His Thr Leu Trp Lys
515 520 525
Ala Gly Ile Leu Tyr Lys Arg Glu Ser Thr Arg Ser Ala Ser Phe Cys
530 535 540
Gly Ser Pro Tyr Ser Trp Glu Gln Asp Leu Gln His Gly Arg Leu Val
545 550 555 560
Phe Gln Thr Ser Lys Arg His Gly Asp Lys Ser Phe Cys Pro Gln Ser
565 570 575
Pro Gly Ile Leu Pro Arg Ser Ser Val Gly Pro Cys Ile Gln Ser Gln
580 585 590
Leu Arg Lys Ser Arg Leu Gly Pro Gln Pro Ala Gln Gly Gln Leu Ala
595 600 605
Gly Arg Gln Gln Gly Gly Ser Gly Ser Ile Arg Ala Arg Val His Pro
610 615 620
Ser Pro Trp Gly Thr Val Gly Val Glu Pro Ser Gly Ser Gly Pro Thr
625 630 635 640
His Asn Cys Ala Ser Ser Ser Ser Ser Cys Leu His Gln Ser Ala Val
645 650 655
Arg Lys Ala Ala Tyr Ser Leu Ile Ser Thr Ser Lys Gly His Ser Ser
660 665 670
Ser Gly His Ala Val Glu Leu His His Phe Pro Pro Asn Ser Ser Arg
675 680 685
Ser Gln Ser Gln Gly Pro Val Leu Ser Cys Trp Trp Leu Gln Phe Arg
690 695 700
Asn Ser Glu Pro Cys Ser Glu Tyr Cys Leu Cys His Ile Val Asn Leu
705 710 715 720
Ile Glu Asp Trp Gly Pro Cys Thr Glu His Gly Glu His Arg Ile Arg
725 730 735
Thr Pro Arg Thr Pro Ala Arg Val Thr Gly Gly Val Phe Leu Val Asp
740 745 750
Lys Asn Pro His Asn Thr Thr Glu Ser Arg Leu Val Val Asp Phe Ser
755 760 765
Gln Phe Ser Arg Gly Asn Thr Arg Val Ser Trp Pro Lys Phe Ala Val
770 775 780
Pro Asn Leu Gln Ser Leu Thr Asn Leu Leu Ser Ser Asn Leu Ser Trp
785 790 795 800
Leu Ser Leu Asp Val Ser Ala Ala Phe Tyr His Leu Pro Leu His Pro
805 810 815
Ala Ala Met Pro His Leu Leu Val Gly Ser Ser Gly Leu Ser Arg Tyr
820 825 830
Val Ala Arg Leu Ser Ser Asn Ser Arg Ile Ile Asn Asn Gln His Arg
835 840 845
Thr Met Gln Asn Leu His Asn Ser Cys Ser Arg Asn Leu Tyr Val Ser
850 855 860
Leu Met Leu Leu Tyr Lys Thr Tyr Gly Arg Lys Leu His Leu Tyr Ser
865 870 875 880
His Pro Ile Ile Leu Gly Phe Arg Lys Ile Pro Met Gly Val Gly Leu
885 890 895
Ser Pro Phe Leu Leu Ala Gln Phe Thr Ser Ala Ile Cys Ser Val Val
900 905 910
Arg Arg Ala Phe Pro His Cys Leu Ala Phe Ser Tyr Met Asp Asp Val
915 920 925
Val Leu Gly Ala Lys Ser Val Gln His Leu Glu Ser Leu Tyr Ala Ala
930 935 940
Val Thr Asn Phe Leu Leu Ser Leu Gly Ile His Leu Asn Pro His Lys
945 950 955 960
Thr Lys Arg Trp Gly Tyr Ser Leu Asn Phe Met Gly Tyr Val Ile Gly
965 970 975
Ser Trp Gly Thr Leu Pro Gln Glu His Ile Val Gln Lys Ile Lys Met
980 985 990
Cys Phe Arg Lys Leu Pro Val Asn Arg Pro Ile Asp Trp Lys Val Cys
995 1000 1005
Gln Arg Ile Val Gly Leu Leu Gly Phe Ala Ala Pro Phe Thr Gln Cys
1010 1015 1020
Gly Tyr Pro Ala Leu Met Pro Leu Tyr Ala Cys Ile Gln Ala Lys Gln
1025 1030 1035 1040
Ala Phe Thr Phe Ser Pro Thr Tyr Lys Ala Phe Leu Ser Lys Gln Tyr
1045 1050 1055
Leu Asn Leu Tyr Pro Val Ala Arg Gln Arg Pro Gly Leu Cys Gln Val
1060 1065 1070
Phe Ala Asp Ala Thr Pro Thr Gly Trp Gly Leu Ala Ile Gly His Gln
1075 1080 1085
Arg Met Arg Gly Thr Phe Val Ser Pro Leu Pro Ile His Thr Ala Glu
1090 1095 1100
Leu Leu Ala Ala Cys Phe Ala Arg Ser Arg Ser Gly Ala Lys Leu Ile
1105 1110 1115 1120
Gly Thr Asp Asn Ser Val Val Leu Ser Arg Lys Tyr Thr Ser Phe Pro
1125 1130 1135
Trp Leu Leu Gly Cys Ala Ala Asn Trp Ile Leu Arg Gly Thr Ser Phe
1140 1145 1150
Val Tyr Val Pro Ser Ala Leu Asn Pro Ala Asp Asp Pro Ser Arg Gly
1155 1160 1165
Arg Leu Gly Leu Tyr Arg Pro Leu Leu Arg Leu Leu Tyr Arg Pro Thr
1170 1175 1180
Thr Gly Arg Thr Ser Leu Tyr Ala Asp Ser Pro Ser Val Pro Ser His
1185 1190 1195 1200
Leu Pro Asp Arg Val His Phe Ala Ser Pro Leu His Val Ala Trp Arg
1205 1210 1215
Pro Pro His His His His His His
1220

Claims (10)

1.一种HBV聚合酶的制备方法,其包括以下歩骤:
(a)构建表达融合蛋白的重组表达载体,其中,所述融合蛋白包含MBP和HBV聚合酶;
(b)将所述重组表达载体转入宿主细胞培养,得到融合蛋白;
(c)提取所述融合蛋白;
(d)利用变性剂对提取的所述融合蛋白进行变性,得到变性后的融合蛋白;
(e)对变性后的所述融合蛋白进行复性,得到复性后的融合蛋白;
(f)对复性后的所述融合蛋白进行酶切,得到HBV聚合酶。
2.根据权利要求1所述的方法,其中步骤(a)中所述重组表达载体为原核生物表达载体或真核生物表达载体;
优选地,所述原核表达载体选自pET-28a、pET-30a、pET-31b、pET-34b、pET-35b、pET22b或pET-43.1;
优选地,所述真核表达载体选自pPICZαA、pPICZαB、pPICZαC、pPIC9、pHIL-S1、pPIC9K。
3.根据权利要求1或2所述的方法,其中步骤(a)中,所述HBV聚合酶的氨基酸序列包含与SEQ ID NO 2所示氨基酸序列具有80%或以上同一性的氨基酸序列,优选具有85%、90%、95%、96%、97%、98%、99%以上同一性的氨基酸序列,更优选具有98%或99%以上同一性的氨基酸序列;更优选地,所述HBV聚合酶的氨基酸序列如SEQ ID NO.2所示;
优选地,所述HBV聚合酶的编码核酸包含与SEQ ID NO:1所示核苷酸序列具有80%或以上同一性的核苷酸序列,优选具有85%、90%、95%、96%、97%、98%、99%以上同一性的核苷酸列,更优选具有98%或99%以上同一性的核苷酸序列;更优选地,所述HBV聚合酶的编码核酸如SEQ ID NO.1所示;
优选地,所述MBP的氨基酸序列包含与SEQ ID NO 4所示氨基酸序列具有80%或以上同一性的氨基酸序列,优选具有85%、90%、95%、96%、97%、98%、99%以上同一性的氨基酸序列,更优选具有98%或99%以上同一性的氨基酸序列;更优选地,所述HBV聚合酶的氨基酸序列如SEQ ID NO.4所示;
优选地,所述MBP的编码核酸包含与SEQ ID NO:3所示核苷酸序列具有80%或以上同一性的核苷酸序列,优选具有85%、90%、95%、96%、97%、98%、99%以上同一性的核苷酸列,更优选具有98%或99%以上同一性的核苷酸序列;更优选地,所述HBV聚合酶的编码核酸如SEQ ID NO.3所示。
4.根据权利要求1-3任一项所述的方法,其中步骤(a)中所述融合蛋白还包含Precission蛋白酶识别位点和/或组氨酸标签;
优选地,所述Precission蛋白酶识别位点的氨基酸序列如SEQ ID No.6所示;
优选地,所述Precission蛋白酶识别位点的核苷酸序列如SEQ ID No.5所示;
优选地,所述融合蛋白的氨基酸序列包含与SEQ ID NO 8所示氨基酸序列具有80%或以上同一性的氨基酸序列,优选具有85%、90%、95%、96%、97%、98%、99%以上同一性的氨基酸序列,更优选具有98%或99%以上同一性的氨基酸序列;更优选地,所述HBV聚合酶的氨基酸序列如SEQ ID No.8所示;
优选地,所述融合蛋白的编码核酸包含与SEQ ID NO:7所示核苷酸序列具有80%或以上同一性的核苷酸序列,优选具有85%、90%、95%、96%、97%、98%、99%以上同一性的核苷酸列,更优选具有98%或99%以上同一性的核苷酸序列;更优选地,所述HBV聚合酶的编码核酸如SEQ ID No.7所示。
5.根据权利要求1-4任一项所述的方法,其中步骤(b)中所述宿主细胞是原核细胞或真核细胞或昆虫细胞;
优选地,所述原核细胞选自芽孢杆菌属,梭菌属,肠球菌属,土芽孢杆菌属,乳杆菌属,乳球菌属,海洋芽孢杆菌属,葡萄球菌属,链球菌属,链霉菌属,弯曲杆菌,大肠杆菌,黄杆菌属,梭杆菌属,螺杆菌属,泥杆菌属,奈瑟氏菌属,假单胞菌属,沙门氏菌属和脲原体属;更优选地,所述原核细胞是大肠杆菌;更优选地,所述大肠杆菌是BL21(De3);
优选地,所述真核细胞选自酵母细胞,例如,假丝酵母属,汉逊酵母属,克鲁维酵母属,毕赤酵母属,酵母属,裂殖酵母属或耶氏酵母属细胞,如乳酸克鲁维酵母,卡尔酵母,酿酒酵母,糖化酵母,道格拉氏酵母,克鲁弗酵母,诺地酵母,卵形酵母或解脂耶氏酵母细胞;
优选地,所述昆虫细胞选自sf9细胞,sf21细胞,Hi5细胞。
6.根据权利要求1-5任一项所述的方法,在步骤(b)中所述培养的过程中通过加入0.3-0.7nM的异丙基-β-D-硫代半乳糖苷(IPTG)作为诱导剂来诱导宿主细胞表达融合蛋白,诱导表达的温度为37℃,诱导表达的时间为3h~5h。
7.根据权利要求1-6任一项所述的方法,其中步骤(c)所述提取包括冰浴超声波破碎,反复冻融,裂解液处理;
优选地,步骤(c)的所述提取是冰浴超声破碎,所述冰浴超声破碎的功率为200W,4秒破碎4秒间隔休息,总破碎时间30分钟。
8.根据权利要求1-7任一项所述的方法,其中步骤(d)中所述变性剂包括离液剂、洗涤剂、与水混溶的有机溶剂、磷脂或其组合;
优选地,所述离液剂选自:尿素、胍和硫氰酸钠;更优选地,所述离液剂为尿素;
优选地,所述洗涤剂选自:十二烷基硫酸钠或聚氧乙烯醚(比如Tween或Triton洗涤剂)、N-十二烷基肌氨酸钠(Sarkosyl);温和非离子型洗涤剂(例如毛地黄皂苷);温和离子型洗涤剂(例如胆酸钠或去氧胆酸钠)或两性离子洗涤剂包括但不限于:N-2,3-(二油酰氧基)-丙基-N,N,N-三甲铵、磺酸甜菜碱、3-(3-胆酰氨基丙基)二甲基铵基-1-丙烷硫酸盐(CHAPS)以及3-(3-胆酰氨基丙基)二甲基铵基-2-羟基-1-丙烷磺酸盐(CHAPSO);
优选地,所述与水混溶的有机溶剂选自:乙腈、低级烷醇(尤其是C2-C4烷醇,例如乙醇或异丙醇)或低级烷二醇(C2-C4烷二醇,例如乙二醇);
优选地,所述磷脂选自:天然存在的磷脂,例如磷脂酰乙醇胺、磷脂酰胆碱、磷脂酰丝氨酸和磷脂酰肌醇,或合成的磷脂衍生物或变体,例如二己酰磷脂酰胆碱或二庚酰磷脂酰胆碱;
优选地,所述融合蛋白变性后再进行纯化,优选进行亲和纯化。
9.根据权利要求8所述的方法,其中在步骤(d)中所述亲和纯化所使用的洗脱液成分为0-80mM咪唑,50mM Tris,100mM NaCl,pH=8.0。
10.根据权利要求1-9任一项所述的方法,其中步骤(e)中所述复性选自低温处理、透析复性和稀释复性,
优选地,所述低温处理在4℃~10℃的环境中进行;
优选地,所述透析复性通过将4℃过夜的10mL液体10000r/min离心15min,取上清,加入20%PEG 4000至终浓度为0.2%,同时加入50mmol/L的氧化性谷胱甘肽至终浓度为1mmol/L,加入100mmol/L还原性谷胱甘肽至终浓度为2mmol/L,4℃静置2h;
优选地,在步骤(f)中所述酶切是通过加入Precission蛋白酶酶切所述融合蛋白,从而得到HBV聚合酶。
CN202111120740.5A 2021-09-24 2021-09-24 一种乙肝病毒聚合酶的制备方法 Pending CN115851656A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202111120740.5A CN115851656A (zh) 2021-09-24 2021-09-24 一种乙肝病毒聚合酶的制备方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111120740.5A CN115851656A (zh) 2021-09-24 2021-09-24 一种乙肝病毒聚合酶的制备方法

Publications (1)

Publication Number Publication Date
CN115851656A true CN115851656A (zh) 2023-03-28

Family

ID=85653128

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111120740.5A Pending CN115851656A (zh) 2021-09-24 2021-09-24 一种乙肝病毒聚合酶的制备方法

Country Status (1)

Country Link
CN (1) CN115851656A (zh)

Similar Documents

Publication Publication Date Title
Zuo et al. Enhanced expression and purification of membrane proteins by SUMO fusion in Escherichia coli
KR20170085129A (ko) 펩티드 생산용 융합 파트너
JP6238967B2 (ja) 組み換え熱帯熱マラリア原虫スポロゾイト周囲タンパク質を精製するプロセス
US20220372074A1 (en) Production and Purification Method for Polypeptide
JP2023502335A (ja) スプリットインテインシステムを使用したタンパク質精製
MX2014010092A (es) Escision enzimatica en columna.
Stojković et al. Coliphage N4 N-acetylmuramidase defines a new family of murein hydrolases
CN106834324B (zh) 一种能促进蛋白可溶性表达及提高表达量的重组表达载体
WO2019062709A1 (zh) 一种重组牛血清蛋白成熟肽及其制备方法和应用
CN115605604A (zh) 用于靶肽产生的融合多肽
KR101527528B1 (ko) 가용성 재조합 단백질의 생산, 추출 및 정제 방법
JP4088584B2 (ja) 融合タンパク質から目的タンパク質を分離する方法。
US11267863B2 (en) N-terminal fusion partner for producing recombinant polypeptide, and method for producing recombinant polypeptide using same
CN109952149A (zh) 改进的色谱树脂、其生产和应用
CN111019926B (zh) Tev蛋白酶变体、其融合蛋白及制备方法和用途
CN115851656A (zh) 一种乙肝病毒聚合酶的制备方法
CN107629129B (zh) 生产和纯化多肽的方法
Paal et al. A novel Ecotin-Ubiquitin-Tag (ECUT) for efficient, soluble peptide production in the periplasm of Escherichia coli
EP1981978B1 (en) Affinity polypeptide for purification of recombinant proteins
CN115851794A (zh) 一种乙肝病毒x蛋白质的制备方法
Chevalier et al. [31] Purification and properties of BiP
CN113493780A (zh) 一种利用sumo融合表达系统制备重组肝素酶ii的方法及其所制备的sumo_肝素酶ii融合蛋白
EP4079845A1 (en) Method for enhancing water solubility of target protein by whep domain fusion
WO2024119434A1 (zh) 一种提高重组蛋白表达效率的酸性表面助溶短肽标签
CN113481230B (zh) 一种利用抗冻蛋白-内含肽作为纯化标签实现重组蛋白纯化的方法和应用

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination