CN1810969A - 获得具有独立结构/功能蛋白片段的方法 - Google Patents

获得具有独立结构/功能蛋白片段的方法 Download PDF

Info

Publication number
CN1810969A
CN1810969A CN 200610058019 CN200610058019A CN1810969A CN 1810969 A CN1810969 A CN 1810969A CN 200610058019 CN200610058019 CN 200610058019 CN 200610058019 A CN200610058019 A CN 200610058019A CN 1810969 A CN1810969 A CN 1810969A
Authority
CN
China
Prior art keywords
gene
tstu
protein
function
fragment
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 200610058019
Other languages
English (en)
Inventor
林章凛
李爽
陈勇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN 200610058019 priority Critical patent/CN1810969A/zh
Publication of CN1810969A publication Critical patent/CN1810969A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Peptides Or Proteins (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明公开了一种获得具有独立结构/功能蛋白片段的方法。该蛋白片段的获得方法,包括以下步骤:1)随机切割编码蛋白的多核苷酸序列,然后再进行重组,得到不同长度的多核苷酸随机片段;2)将步骤1)获得的多核苷酸随机片段连接入含有报告蛋白基因的表达载体中,再将所述重组表达载体导入宿主,培养宿主,得到具有独立结构/功能的蛋白片段。本发明不具有基因/蛋白的特异性,筛选方法简单易行,将在具有独立结构/功能的蛋白片段的筛选,以及制备病毒抗原和病毒疫苗中发挥巨大作用。

Description

获得具有独立结构/功能蛋白片段的方法
技术领域
本发明涉及分子生物领域中具有独立结构/功能蛋白片段的获得方法。
背景技术
普遍认为蛋白质的多肽骨架是由具有一定结构、功能的小片段组成的。序列和结构分析表明,这些小片段的集合能够折叠成相对独立的结构域(domain)(Doolittle,R.F.,The multiplicity of domains in proteins.Annu.Rev.Biochem.1995,64:287-314;Thornton,J.M.,Orengo,C.A.,Todd,A.E.&Pearl,F.M.,Protein folds,functions and evolution.J.Mol.Biol.1999,293:333-342;Apic,G.,Gough,J.&Teichmann,S.A.,Domain combinations in archaeal,eubacterial and eukaryotic proteomes.J.Mol.Biol.2001,310:311-325.)。在某特定位点对蛋白质(酶)进行操作,如将其分为两部分、环状排列蛋白序列(circular permutation)或者插入外源蛋白片段等,蛋白质(酶)依然能够保持活性,上述结果也表明蛋白质是小多肽的集合(Regan,L.,Protein redesign.Curr.Opin.Struct.Biol.1999,9:494-499.)。这些研究引起了人们寻找这些特殊位点,即寻找具有一定结构、功能蛋白片段的关注,因为这对研究蛋白质的结构功能关系以及蛋白质的折叠机理等具有重要意义。现有的研究方法多是通过在经预选确定的位点进行基因操作,或者利用蛋白酶进行定点切割。一方面由于人们对蛋白质结构和功能间的关系了解有限,另外由于筛选库比较小、且操作复杂、耗时费力,因此现有方法不具有通用性。Hiraga K.等人利用色氨酸合成酶α亚基的N端和C端的功能互补以及通过色氨酸合成酶的酶活选择方法,获得了该蛋白的结构功能单元(Hiraga,K.,Yamagishi,A.,and Oshima,T.,Mapping of unit boundaries of a protein:exhaustive search for permissive sites for duplication by complementationanalysis of random fragment libraries of tryptophan synthase αsubunit.J.Mol.Biol.2004,335:1093-1104)。此外,由于很多研究者感兴趣的蛋白并不具有方便选择的功能或活性,而且不限于N端和C端,因此该方法的应用也受到限制。
在宿主细胞(尤其是大肠杆菌)内,蛋白质大量表达经常会引起蛋白质的错误折叠甚至聚集沉淀。尽管在蛋白质体外复性方面已经进行了大量的研究工作,但目前还没有行之有效的方法。Geoffrey等人构建了含有蛋白质正确折叠报告蛋白的载体,即在绿色荧光蛋白(Green Fluorescent Protein,GFP)的N-端通过连接肽(linker)序列与测试蛋白相连(Geoffrey S.W.,Blake M.S.,Joel B.,Thomas C.T.,Rapidprotein-folding assay using green fluorescent protein,Nature Biotechnology,1999,17:691-695)。由于绿色荧光蛋白的折叠(和荧光)依赖于外源蛋白的正确折叠,因此它提供了一个良好的折叠报告体系。通过测试20种外源蛋白表明,大肠杆菌的荧光表达与GFP基因上游的外源蛋白区域能够独立、大量的表达相互依赖。以GFP作为外源蛋白正确折叠的报告蛋白,由于绿色荧光检测方便,且不需要对目的蛋白进行结构分析,即能有效的判断外源蛋白的功能表达特性,因此该项技术为大规模筛选能够独立折叠的蛋白片段提供了有效的技术手段。
发明内容
本发明的目的是提供一种获得具有独立结构/功能蛋白片段的方法。
本发明所提供的获得具有独立结构/功能蛋白片段的方法,包括以下步骤:
1)随机切割编码蛋白的多核苷酸序列,然后再进行重组,得到不同长度的多核苷酸随机片段;
2)将步骤1)获得的多核苷酸随机片段连接入含有报告蛋白基因的表达载体中,再将所述重组表达载体导入宿主,培养宿主,得到具有独立结构/功能的蛋白片段。
在上述方法中,步骤1)中编码蛋白的多核苷酸序列为DNA或RNA,优选为双链DNA;切割编码蛋白的多核苷酸序列的方法为酶法、物理法(如利用超声波等)或化学法,其中酶法采用的酶可为DNaseI、RNase或内切酶等;所述蛋白的选择是任意的,如色氨酸合成酶α亚基(tryptophan synthase α subunit,TSα)、gp120、二氢叶酸还原酶(dihydrofolate reductase,DHFR)或胰凝乳蛋白酶抑制剂(chemotrypsininhibitor)等;可用自身引导(self-priming)的聚合酶反应(polymerase reaction)对经随机切割的编码蛋白的多核苷酸序列进行重组。
在所述步骤2)中的表达载体中,多核苷酸随机片段与报告蛋白基因可由连接肽编码序列相连,且多核苷酸随机片段位于报告蛋白基因的上游;所述连接肽可具有序列表中序列1的氨基酸残基序列;所述报告蛋白基因可为绿色荧光蛋白基因、半乳糖苷酶基因或荧光素酶基因等;用于构建含有报告蛋白基因及连接肽编码序列的重组载体的出发载体可为任意一种可在大肠杆菌中表达外源基因的原核表达载体,如pET系列载体(如pET30(a)、pET-22b)、pUC18或pUC19等,优选为pET30(a)。其中,以pET30(a)为出发载体,构建的含有绿色荧光蛋白基因及连接肽编码序列的重组载体为pET30(a)-linker-GFP,该载体可作为筛选能够独立折叠的蛋白片段的通用载体使用。
将含有报告蛋白基因及双链DNA片段的融合表达载体转化宿主菌的方法可为生物工程领域中常用的转化方法,如热激法、电转化法、接合转化法、PEG介导的原生质体转化法等。所述宿主菌可为适于蛋白表达的大肠杆菌、枯草芽孢杆菌、酵母、昆虫细胞或动物细胞,优选为大肠杆菌,如E.coli BL21(DE3)、E.coli XL-1 blue或E.coliDH5α等,尤其优选为E.coli BL21(DE3)。
本发明提供了一种基于基因随机切割技术获得具有独立结构/功能的蛋白片段的方法。该方法不具有基因/蛋白的特异性,适用范围广,筛选方法简单易行,因此是寻找具有独立结构功能的蛋白片段简单、有效的通用方法。用该方法获得的具有独立结构/功能的蛋白片段可作为抗原用于制备病毒(如艾滋病病毒HIV-1等)抗体和病毒疫苗。本发明将在具有独立结构/功能的蛋白片段的筛选中发挥巨大作用。
以下结合具体实施例对本发明作进一步详细说明。
附图说明
图1为pET30(a)-linker-GFP的部分物理图谱
图2为筛选到的TSα片段与全长序列的位置比较结果
图3A为GFP基因分别与TStu-10和TStu-13多肽基因形成的融合基因的表达产物的SDS-PAGE检测结果
图3B为TStu-10和TStu-13多肽基因的表达产物的SDS-PAGE检测结果
图4为添加有组氨酸标签序列的TStu-10-H和TStu-13-H表达产物的SDS-PAGE检测结果
图5A为TStu-10-H的镍柱亲和纯化的洗脱曲线
图5B为TStu-13-H的镍柱亲和纯化的洗脱曲线
图6A为TStu-10-H纯化产物的SDS-PAGE检测结果
图6B为TStu-13-H纯化产物的SDS-PAGE检测结果
图7为经纯化的TStu-10-H和TStu-13-H多肽的园二色光谱图
图8为筛选到的gp120片段与全长序列的位置比较结果
具体实施方式
下述实施例中所用方法如无特别说明均为常规方法,所有引物合成均由大连宝生物(TakaRa)或上海生工完成,测序工作由上海生工或北京三博远志公司完成,所有百分比浓度均为质量百分比浓度。
实施例1、具有独立结构/功能的蛋白片段的获得
现以色氨酸合成酶α亚基(tryptophan synthase α subunit,TSα)为例,用本发明的方法得到具有独立结构/功能的蛋白片段,具体过程包括以下步骤:
一、构建含有绿色荧光蛋白基因及连接肽(linker)编码序列的重组载体
1、绿色荧光蛋白基因的扩增
以含有GFP基因的质粒pQB-2(Kimata,Y.,Iwaki,M.,Lim,C.R.,and Kohno,K.,A novel mutation which enhances the fluorescence of green fluorescentprotein at high temperatures.Biochem.Biophys.Res.Commun.1997,232:69-7)为模板,在正向引物
P1:5’-CATCGTT ATTAATG
Figure A20061005801900061
-3’(方框内碱基为连接肽编码序列,编码序列表中序列3的氨基酸残基序列,其中带下划线碱基为限制性内切酶EcoR I识别位点;方框外带下划线碱基为限制性内切酶Vsp I识别位点)和反向引物P2:5’-TAG AAGCTTAGCTAATTCAGCTTGGCTGC-3’(带下划线碱基为限制性内切酶HindIII识别位点)的引导下,用常规的PCR方法扩增GFP基因,并在GFP基因上游引入连接肽编码序列,在其两端分别引入限制性内切酶Vsp I和Hind III识别位点。
2、含有绿色荧光蛋白基因及连接肽编码序列的重组载体的获得
用限制性内切酶Nde I和Hind III对载体pET30(a)(Novagen)进行双酶切,用限制性内切酶Vsp I和Hind III对步骤1扩增的GFP基因进行双酶切后,将两种酶切产物用T4DNA连接酶连接,再将连接产物转化E.coli BL21(DE3)感受态细胞,筛选阳性重组子,提质粒,得到含有绿色荧光蛋白基因及连接肽编码序列的重组质粒,命名为pET30(a)-linker-GFP,其部分物理图谱如图1所示(其余部分与pET30(a)相同),该载体可作为筛选能够独立折叠的蛋白片段的通用载体使用。
二、TSα基因的扩增
以TSα基因的cDNA(GenBank号:946204)为模板,在正向引物P3:5’-CTATGGAACGCTACGAATCTCT-3’和反向引物P4:5’-AACTGCGCGTCGCCGCTTTCATC-3’的引导下,用常规的PCR方法扩增TSα基因,该PCR反应的退火温度(AnnealingTemperature)为45℃,反应结束后,对PCR扩增产物进行10%琼脂糖凝胶电泳检测,回收约800bp的目的片段,用Qiagen公司的DNA片段纯化试剂盒对其进行纯化。
三、TSα基因的随机切割
1)取步骤二中纯化的TSα基因0.1-5μg,加入反应管中,再向反应管中添加以下试剂:1M Tris-Cl(pH7.5)2.5μl,50mM MnCl2 10μl,用双蒸水补充反应体系至50μl。然后15℃保温10min,再加入1.5μl DNase I(5U/μl,使用前用50mM Tris-ClpH7.5按1∶100比例进行稀释)到反应管中,15℃反应4min;
2)加入EDTA至终浓度为50mM用以终止反应;
3)加热至90℃,保温10min使DNase I失活;
4)用颇尔公司(Pall Ltd.)Nanosep系列纯化柱回收并纯化长度为50-100bp的双链DNA片段。
四、TSα基因的重组
采用自身引导(self-priming)的聚合酶反应(polymerase reaction),即不加入引物的聚合酶反应对步骤三获得的TSα基因随机切割片段进行重组,具体步骤如下:取TSα基因随机切割片段0.1-5μg,先加热到94-95℃,再冷却到45-55℃,然后在60-72℃下用1-50U/μg的Taq聚合酶进行聚合酶反应0.5-2分钟,用颇尔公司Nanosep系列纯化柱回收并纯化长度为50-1000bp的双链DNA片段。
五、含有绿色荧光蛋白基因及50-1000bp双链DNA片段的融合表达载体的构建
1)用限制性内切酶EcoR I对质粒pET30(a)-linker-GFP进行酶切;
2)按常规方法对步骤三经重组的长度为50-1000bp的TSα基因随机切割片段和经单酶切后的线性质粒进行平末端化处理,具体方法为:加入T4DNA聚合酶(2U/μgDNA),12℃保温10-40min,然后加热至75℃ 20min使酶失活;
3)将经平末端化处理的长度为50-1000bp的TSα基因随机切割片段和经单酶切后的线性质粒用T4DNA连接酶连接,再将连接产物转化E.coli BL21(DE3)感受态细胞,筛选阳性重组子,提质粒,得到含有绿色荧光蛋白基因及经重组的50-1000bp TSα基因随机切割片段的融合表达载体。
六、E.coli BL21(DE3)的转化及表达
将融合表达载体用热激法转化E.coli BL21(DE3),将转化细胞涂于卡那霉素(Kanamycine)LB抗性平板(每升培养基含:胰蛋白胨10.0g,酵母浸膏粉5.0g,NaCl 10.0g,琼脂15.0g,pH7.0,50μg/mL卡那霉素)上,于37℃下培养12-24小时,然后将平板转移至23℃继续培养20小时。
七、大规模(large-scale)筛选能够独立表达并具有稳定三级结构的TSα(蛋白片段
在紫外灯下检测荧光,挑选发绿色荧光的菌株,以此为模板,在P5:5’-TAAGAAGGAGATATACATAATG-3’和P6:5’-CTAGGAGAACCAGCAGCACTCGAGCCA-3’的引导下,按常规的菌落PCR方法检测插入的TSα基因片段,挑选具有插入片段的菌株,测序、分析插入片段的氨基酸结构、功能特征。将通过表达、筛选到的TSα多肽片段与全长序列的比较结果如图2所示(多肽片段相应名称标示于多肽片段上方,相对于原始全长基因的起始终点位置标在相应片段的下方;其中F73,G170和R189表示文献报道可能的灵活位点),有文献报道TSα蛋白的N端和C端蛋白(R189处断开)能够独立表达(Higgins,W.,Fairwell,T.&Miles,E.W.An active proteolytic derivativeof theαsubunit of tryptophan synthase.Identification of the site of cleavageand characterization of the fragments.Biochemistry,1979,18:4827-4835),也有文献报道在F73和G170两个位置断开形成的三个蛋白片段(1-72,73-170和171-268)也能够独立表达(Hiraga,K.,Yamagishi,A.,and Oshima,T.,Mapping ofunit boundaries of a protein:exhaustive search for permissive sites forduplication by complementation analysis of random fragment libraries oftryptophans αsubunit J.Mol.Biol.2004,335:1093-1104)。本实施例筛选获得的蛋白片段多数位于文献报道的片段附近。
八、TSα蛋白片段TStu-10和TStu-13的进一步表征分析
现用下述方法对步骤八筛选到的蛋白片段TStu-10(序列表中的序列2)和TStu-13(序列表中的序列3)做进一步表征分析:
1、不含GFP的TSα多肽TStu-10和TStu-13基因的表达
1)PCR扩增TStu-10和TStu-13多肽基因
以含有TStu-10多肽基因的重组菌的基因组DNA为模板,在通用正向引物PF:5’-CGAATAACAATTCCCC TCTAGAAAT-3’(带下划线碱基为限制性内切酶Xba I识别位点)和TStu-10的反向引物TStu-10R:5’-AGCC AAGCTTTTAGATGAAGATAGGTGCGACATTA-3’(带下划线碱基为限制性内切酶Hind III识别位点)的引导下,PCR扩增不含GFP基因的TStu-10多肽基因片段;同时以含有TStu-13多肽基因的重组菌的基因组DNA为模板,在通用正向引物PF和TStu-13的反向引物TStu-13R:5’-AACC AAGCTTTTAGGGTAACGCGGCGCGGTTT-3’(带下划线碱基为限制性内切酶Hind III识别位点)的引导下,PCR扩增不含GFP基因的TStu-13多肽基因片段。上述PCR反应的退火温度分别为57℃和59℃。反应结束对两种PCR扩增产物进行10%琼脂糖凝胶电泳检测,经PCR扩增分别获得了约470bp和600bp的DNA片段,与预期结果相符。
2)构建TStu-10和TStu-13多肽基因的重组表达载体
用限制性内切酶Xba I和Hind III对载体pET30(a)和步骤1)的两种PCR扩增产物进行双酶切,回收三种酶切产物并用Qiagen公司的DNA片段纯化试剂盒对其进行纯化,然后将经酶切的TStu-10和TStu-13多肽基因分别与线性化的pET30(a)质粒连接,将连接产物转化E.coli BL21(DE3),筛选阳性重组子,提质粒,得到TStu-10基因的重组表达载体,命名为pET30(a)-TStu-10,以及TStu-13基因的重组表达载体,命名为pET30(a)-TStu-13。
3)TStu-10和TStu-13多肽基因的表达
将pET30(a)-TStu-10和pET30(a)-TStu-13分别用热激法转化E.coli BL21(DE3),将转化细胞涂于含50μg/mL卡那霉素LB抗性平板上,筛选阳性转化子,将其接种于含0.2mM IPTG的LB液体培养基中,在23℃下诱导TStu-10和TStu-13多肽基因的表达,以含有GFP基因的融合基因的表达为参照。表达结束后,对表达产物进行12%SDS-PAGE检验,含有GFP基因的融合基因的表达产物的检测结果如图3A所示(“G”:带GFP的融合蛋白;“in”:不可溶部分;M为蛋白标准分子量;C为对照,GFP为GFP蛋白),TStu-10和TStu-13多肽基因的表达产物如图3B所示(“p”:不可溶部分;“s”:可溶部分;M为蛋白标准分子量;BL21(DE3)为E.coli BL21(DE3)),表明TStu-10和TStu-13蛋白片段在没有GFP蛋白作为融合蛋白的情况下,其可溶表达比例大大提高。
2、C端添加6×His编码序列的TStu-10和TStu-13多肽基因及其表达
1)PCR扩增C端添加6×His(组氨酸标签,His-tag)编码序列的TStu-10和TStu-13多肽基因
以含有TStu-10多肽基因的重组菌的基因组DNA为模板,在通用正向引物PF:5’-CGAATAACAATTCCCC TCTAGAAAT-3’(带下划线碱基为限制性内切酶Xba I识别位点)和反向引物6×TStu-10R:5’-TAGCG AAGCTTTGAGATGAAGATAGGTGCG-3’(带下划线碱基为限制性内切酶Hind III识别位点)的引导下,PCR扩增不含GFP基因且C端添加6×His编码序列的TStu-10多肽基因片段;同时以含有TStu-13多肽基因的重组菌的基因组DNA为模板,在通用正向引物PF和反向引物6×TStu-13R:5’-TTATA AAGCTTTGAGGGTAACGCGGCGCGG-3’(带下划线碱基为限制性内切酶Hind III识别位点)的引导下,PCR扩增不含GFP基因且C端添加6×His编码序列的TStu-13多肽基因片段。上述PCR反应的退火温度分别为43℃和53℃。反应结束对两种PCR扩增产物进行10%琼脂糖凝胶电泳检测,经PCR扩增分别获得了500bp和610bp的DNA片段,与预期结果相符,将C端添加6×His编码序列的TStu-10和TStu-13多肽基因分别命名为TStu-10-H和TStu-13-H。
2)构建TStu-10-H和TStu-13-H多肽基因的重组表达载体
用限制性内切酶Xba I和Hind III对载体pET30(a)、TStu-10-H和TStu-13-H进行双酶切,回收三种酶切产物并用Qiagen公司的DNA片段纯化试剂盒对其进行纯化,然后将经酶切的TStu-10-H和TStu-13-H多肽基因分别与线性化的pET30(a)质粒连接,将连接产物转化E.coli BL21(DE3),筛选阳性重组子,提质粒,得到TStu-10-H的重组表达载体,命名为pET30(a)-TStu-10-H,以及TStu-13-H的重组表达载体,命名为pET30(a)-TStu-13-H。
3)TStu-10-H和TStu-13-H的表达
将pET30(a)-TStu-10-H和pET30(a)-TStu-13-H分别用热激法转化E.coliBL21(DE3),将转化细胞涂于含50μg/mL卡那霉素LB抗性平板上,筛选阳性转化子,将其接种子含0.2mM IPTG的LB液体培养基中,在23℃下诱导TStu-10-H和TStu-13-H多肽基因表达。表达结束后,对表达产物进行12%SDS-PAGE检验,检测结果如图4所示(a图为表达的TStu-10-H,b图为表达的TStu-13-H;泳道M为蛋白分子量标准,泳道P为不可溶部分,泳道S为可溶部分,其中不可溶部分上样量是可溶部分的5倍),根据图4计算可知,TStu-10-H和TStu-13-H可溶表达约占50%。
4)TStu-10-H和TStu-13-H的镍柱亲和纯化
采用镍柱亲和纯化方法对步骤3)表达的TStu-10-H和TStu-13-H多肽进行纯化,具体方法为:用安玛西亚(Amersham Biosciences)公司的HitrapTM Chelating HP 1mL柱子,采用镍离子作为亲和离子,用含不同咪唑浓度的缓冲液A(0.02M磷酸缓冲溶液,0.5M NaCl,0.03M咪唑,pH7.4)和缓冲液B(0.02M磷酸缓冲溶液,0.5M NaCl,0.5M咪唑,pH7.4)洗脱目的蛋白,洗脱曲线如图5A和图5B所示(标号为收集管号)。洗脱后,对纯化产物进行12%SDS-PAGE检验,TStu-10-H和TStu-13-H纯化产物的检测结果分别如图6A和图6B所示(标号为收集管号,“un”为未纯化样品,M为蛋白分子量标准),表明经纯化获得了纯度较高的TStu-10-H和TStu-13-H。
5)经纯化的TStu-10-H和TStu-13-H多肽的圆二色光谱(CD spectrum)检测
先将经纯化后的TStu-10-H和TStu-13-H多肽置于10mM磷酸缓冲溶液(pH7.4)中,然后按常规方法测定园二色光谱,光谱图如图7所示,表明TStu-10-H和TStu-13-H具有稳定的二级结构,证明用本发明的方法可得到具有独立结构/功能的蛋白片段。
实施例2、制备能够独立表达的艾滋病病毒HIV-1表面抗原gp120多肽片段
一、筛选能够独立折叠的蛋白片段的通用载体pET30(a)-linker-GFP的构建构建方法与实施例1相同。
二、gp120基因的扩增
用基因重组合成方法扩增gp120基因。首先根据gp120蛋白的核苷酸序列,用DNAWorks(Hoover,D.M.&Lubkowski,J.DNAWORKS:an automated method fordesigning oligonucleotides for PCR-based gene synthesis.Nucleic Acids Res.30,e43-e43(2002))软件设计用来无引物扩增gp120基因的寡核苷酸链,结果共合成66个寡核苷酸链,序列如表1所示:
         表1用来无引物扩增gp120基因的寡核苷酸链序列
1  ATGACCGAAAAACTGTGGGTGA
2  CCGTGTATTATGGCGTGCCAGTGTGGAAAGAGGCGACC
3  ACCACCCTGTTTTGCGCCAGCGATGCCAAAGCCTATG
4  ATACCGAGGTTCACAATGTTTGGGCGACCCATGCGTG
5  CGTTCCGACCGACCCGAACCCGCAGGAAGTTGTG
6  TTAGTGAATGTGACGGAAAACTTCAACATGTGGAAGAACGACATGGTTGAA
7  CAAATGCATGAAGATATTATTAGCTTATGGGACCAGAGCTTAAAGCCGTGCG
8  TGAAACTGACCCCATTATGTGTTTCTCTGAAGTGTACGGATCTGAAGAATGA
9  CACGAATACCAATAGCTCTAGCGGCCGCATGATCATGGAAAAAG
10 GTGAGATTAAGAATTGTAGCTTCAATATTAGCACCAGCATCCGTGGCAAGG
11 TTCAAAAAGAGTACGCGTTCTTCTATAAGTTAGATATCATCCCAATCGACAATGACAC
12 CACGTCTTACAAGTTAACGTCTTGCAACACCTCTGTGATTACCCAGG
13 CCTGCCCGAAAGTTTCTTTTGAGCCAATTCCAATCCACTATTGTGCG
14 CCAGCGGGTTTCGCGATTCTGAAATGTAACAATAAAACCTTCAACGG
15 CACCGGCCCATGTACCAATGTTTCTACGGTGCAATGTACC
16 CATGGCATCCGTCCGGTGGTGTCTACCCAGTTACTGCTG
17 AACGGTTCTTTAGCCGAAGAAGAGGTTGTTATTCGTAGCGTGAATTTCA
18 CCGATAACGCCAAAACGATTATCGTGCAGTTAAACACGTCTGTTGAGAT
19 CAATTGTACGCGTCCGAATAATAACACCCGTAAACGCATTCGCATT
20 CAGCGCGGCCCAGGCCGTGCCTTCGTTACG
21 ATCGGTAAAATCGGTAATATGCGTCAGGCCCACTGCAACATCAG
22 CCGTGCGAAATGGAACAATACGTTAAAGCAGATTGCGTCTAAACTG
23 CGCGAGCAATTTGGCAATAATAAAACCATTATTTTTAAGCAATCTAGCGGTGGT
24 GACCCGGAGATCGTTACCCATAGCTTCAACTGTGGTGGC
25 GAATTCTTTTACTGCAATTCTACGCAGTTATTCAATTCTACGTGGTTCAATAGCACC
26 TGGTCTACGGAAGGCTCTAATAACACGGAGGGCTCTGATACGATC
27 ACCCTGCCGTGCCGTATCAAACAGATTATTAATATGTGGCAGAAGGT
28 GGGCAAGGCGATGTACGCCCCACCAATCTCTGGTCAAAT
29 CCGTTGCTCTAGCAACATTACGGGCTTACTGTTAACCCGTGATG
30 GCGGTAACAGCAACAACGAGTCTGAAATCTTTCGCCCAGG
31 TGGCGGCGACATGCGTGATAATTGGCGCAGCGAA
32 CTGTACAAGTACAAAGTTGTTAAAATCGAACCGTTAGGCGTGGCGCC
33 AACGAAGGCCAAGCGCCGTGTTGTTCAACGTGAGAAG
34 GCGCTTCTCACGTTGAACAACACG
35 GCGCTTGGCCTTCGTTGGCGCCACGCCTAAC
36 GGTTCGATTTTAACAACTTTGTACTTGTACAGTTCGCTGCGCCAATTATCAC
37 GCATGTCGCCGCCACCTGGGCGAAAGATTTCAGAC
38 TCGTTGTTGCTGTTACCGCCATCACGGGTTAACAGTAAGCC
39 CGTAATGTTGCTAGAGCAACGGATTTGACCAGAGATTGGTGGGG
40 CGTACATCGCCTTGCCCACCTTCTGCCACATATTAATAATCTGTTTGATAC
41 GGCACGGCAGGGTGATCGTATCAGAGCCCTCCG
42 TGTTATTAGAGCCTTCCGTAGACCAGGTGCTATTGAACCACGTAGAATTG
43 AATAACTGCGTAGAATTGCAGTAAAAGAATTCGCCACCACAGTTGAAGCTAT
44 GGGTAACGATCTCCGGGTCACCACCGCTAGATTGCTTAAAAATAATG
45 GTTTTATTATTGCCAAATTGCTCGCGCAGTTTAGACGCAATCTGCTTTAAC
46 GTATTGTTCCATTTCGCACGGCTGATGTTGCAGTGGGCC
47 TGACGCATATTACCGATTTTACCGATCGTAACGAAGGCACGGC
48 CTGGGCCGCGCTGAATGCGAATGCGTTTACGGG
49 TGTTATTATTCGGACGCGTACAATTGATCTCAACAGACGTGTTTAACTGCA
50 CGATAATCGTTTTGGCGTTATCGGTGAAATTCACGCTACGAATAACAACC
51 TCTTCTTCGGCTAAAGAACCGTTCAGCAGTAACTGGGTAGACACC
52 ACCGGACGGATGCCATGGGTACATTGCACCGTAGAAACAT
53 TGGTACATGGGCCGGTGCCGTTGAAGGTTTTATTGTTACATTTCAGAAT
54 CGCGAAACCCGCTGGCGCACAATAGTGGATTGGAATTGG
55 CTCAAAAGAAACTTTCGGGCAGGCCTGGGTAATCACAGAGGTGTT
56 GCAAGACGTTAACTTGTAAGACGTGGTGTCATTGTCGATTGGGATGATATC
57 TAACTTATAGAAGAACGCGTACTCTTTTTGAACCTTGCCACGGATGCTG
58 GTGCTAATATTGAAGCTACAATTCTTAATCTCACCTTTTTCCATGATCATGCGGC
59 CGCTAGAGCTATTGGTATTCGTGTCATTCTTCAGATCCGTACACTTCAG
60 AGAAACACATAATGGGGTCAGTTTCACGCACGGCTTTAAGCTCTG
61 GTCCCATAAGCTAATAATATCTTCATGCATTTGTTCAACCATGTCGTTCTTCCACAT
62 GTTGAAGTTTTCCGTCACATTCACTAACACAACTTCCTGCGGGTTC
63 GGGTCGGTCGGAACGCACGCATGGGTCGC
64 CCAAACATTGTGAACCTCGGTATCATAGGCTTTGGCATCGCTG
65 GCGCAAAACAGGGTGGTGGTCGCCTCTTTCCACACT
66 GGCACGCCATAATACACGGTCACCCACAGTTTTTCGGTCA
然后采用文献(Hoover,D.M.,and Lubkowski,J.DNAWorks:an automated methodfor designing oligonucleotides for PCR-based gene synthesis.Nucleic AcidsRes.2002,30:e43-e43)中报道的基因重组合成方法合成gp120全基因,其中退火温度为55℃。
三、gp120基因的随机切割
方法与实施例1相同,得到长度为50-100bp的gp120基因随机切割片段。
四、gp120基因的重组
方法与实施例1相同,得到长度为50-1000bp的gp120基因随机切割片段。
五、含有绿色荧光蛋白基因及50-1000bp gp120双链DNA片段的融合表达载体的构建
方法与实施例1相同,得到含有绿色荧光蛋白基因及经重组的50-1000bp gp120基因随机切割片段的融合表达载体。
六、E.coli BL21(DE3)的转化及表达
方法与实施例1相同,使转化有绿色荧光蛋白基因及经重组的50-1000bp gp120基因随机切割片段的融合表达载体的重组E.coli BL21(DE3)转化子中绿色荧光蛋白基因及50-1000bp双链DNA片段融合基因获得表达。
七、大规模(large-scale)筛选能够独立表达并具有稳定三级结构的gp120(蛋白片段
在紫外灯下检测荧光,挑选发荧光的菌株,以此为模板,在P5:5’-TAAGAAGGAGATATACATAATG-3’和P6:5’-CTAGGAGAACCAGCAGCACTCGAGCCA-3’的引导下,按常规的菌落PCR方法检测插入的gp120基因片段,挑选具有不同大小的插入片段的菌株,测序、分析插入片段的氨基酸结构、功能特征。将通过表达、筛选到的gp120多肽片段与全长序列进行比较,结果如图8所示(多肽片段相应名称标示于多肽片段上方,相对于原始全长基因的起始终点位置标在相应片段的下方),再将筛选到的蛋白多肽片段与文献(Kwong,P.D.,Wyatt,R.,Robinson,J.,Sweet,R.W.,Sodroski,J.,and Hendrickson,W.A.,Structure of an HIV gp120 envelopeglycoprotein in complex with the CD4 receptor and a neutralizing human antibody.Nature 1998,393:648-659)中报道的HIV-1 gp120蛋白晶体结构相对照,与之对应的三维结构如表2所示,图8和表2的比较结果表明本实施例中筛选到的多肽片段,绝大部分位于gp120蛋白中具有免疫作用的关键位点区域,可能具有独立结构/功能,有可能作为抗原,用于制备艾滋病病毒的病毒抗体及病毒疫苗。
表2筛选到的gp120片段在gp120蛋白三级结构中的相应结构分析结果
  片段编号   氨基酸残基数  在gp120蛋白三级结构中的位置
  Hgtu-1Hgtu-4Hgtu-9Hgtu-15Hgtu-18Hgtu-20Hgtu-22Hgtu-31   60122727751659051  β19-loop(β24~α5)loopB-β16loop(β3~β4)-β9loopV4-α5loop(β3~β4)-loopBβ17-β23α4-α5loopV5-C terminus
                               序列表
<160>3
<210>1
<211>10
<212>PRT
<213>人工序列
<220>
<223>
<400>1
Gly Asn Ser Ala Gly Ser Ser Ala Ala Gly
1               5                   10
<210>2
<211>153
<212>PRT
<213>人工序列
<220>
<223>
<400>2
Met Glu Arg Tyr Glu Ser Leu Phe Ala Gln Leu Lys Glu Arg Lys
1               5                   10                  15
Glu Gly Ala Phe Val Pro Phe Val Thr Leu Gly Asp Pro Gly Ile
                20                  25                  30
Glu Gln Ser Leu Lys Ile Ile Asp Thr Leu Ile Glu Ala Gly Ala
                35                  40                  45
Asp Ala Leu Glu Leu Gly Ile Pro Phe Ser Asp Pro Leu Ala Asp
                50                  55                  60
Gly Pro Thr Ile Gln Asn Ala Thr Leu Arg Ala Phe Ala Ala Gly
                65                  70                  75
Val Thr Pro Ala Gln Cys Phe Glu Met Leu Ala Leu Ile Arg Gln
                80                  85                  90
Lys His Pro Thr Ile Pro Ile Gly Leu Leu Met Tyr Ala Asn Leu
                95                  100                 105
Val Phe Asn Lys Gly Ile Asp Glu Phe Tyr Ala Gln Cys Glu Lys
                110                 115                 120
Val Gly Val Asp Ser Val Leu Val Ala Asp Val Pro Val Glu Glu
                125                 130                 135
Ser Ala Pro Phe Arg Gln Ala Ala Leu Arg His Asn Val Ala Pro
                140                 145                 150
Ile Phe Ile
<210>3
<211>192
<212>PRT
<213>人工序列
<220>
<223>
<400>3
Met Glu Arg Tyr Glu Ser Leu Phe Ala Gln Leu Lys Glu Arg Lys
1               5                   10                  15
Glu Gly Ala Phe Val Pro Phe Val Thr Leu Gly Asp Pro Gly Ile
                20                  25                  30
Glu Gln Ser Leu Lys Ile Ile Asp Thr Leu Ile Glu Ala Gly Ala
                35                  40                  45
Asp Ala Leu Glu Leu Gly Ile Pro Phe Ser Asp Pro Leu Ala Asp
                50                  55                  60
Gly Pro Thr Ile Gln Asn Ala Thr Leu Arg Ala Phe Ala Ala Gly
                65                  70                  75
Val Thr Pro Ala Gln Cys Phe Glu Met Leu Ala Leu Ile Arg Gln
                80                  85                  90
Lys His Pro Thr Ile Pro Ile Gly Leu Leu Met Tyr Ala Asn Leu
                95                  100                 105
Val Phe Asn Lys Gly Ile Asp Glu Phe Tyr Ala Gln Cys Glu Lys
                110                 115                 120
Val Gly Val Asp Ser Val Leu Val Ala Asp Val Pro Val Glu Glu
                125                 130                 135
Ser Ala Pro Phe Arg Gln Ala Ala Leu Arg His Asn Val Ala Pro
                140                 145                 150
Ile Phe Ile Cys Pro Pro Asn Ala Asp Asp Asp Leu Leu Arg Gln
                155                 160                 165
Ile Ala Ser Tyr Gly Arg Gly Tyr Thr Tyr Leu Leu Ser Arg Ala
                170                 175                 180
Gly Val Thr Gly Ala Glu Asn Arg Ala Ala Leu Pro
                185                 190

Claims (11)

1、一种获得具有独立结构/功能的蛋白片段的方法,包括以下步骤:
1)随机切割编码蛋白的多核苷酸序列,然后再进行重组,得到不同长度的多核苷酸随机片段;
2)将步骤1)获得的多核苷酸随机片段连接入含有报告蛋白基因的表达载体中,再将所述重组表达载体导入宿主,培养宿主,得到具有独立结构/功能的蛋白片段。
2、根据权利要求1所述的方法,其特征在于:所述步骤1)中编码蛋白的多核苷酸序列为DNA或RNA。
3、根据权利要求1所述的方法,所述步骤1)中切割编码蛋白的多核苷酸序列的方法为酶法、物理法或化学法;所述重组方法为自身引导的聚合酶反应。
4、根据权利要求3所述的方法,其特征在于:所述酶法采用的酶为DNaseI、RNase或内切酶。
5、根据权利要求1所述的方法,其特征在于:所述步骤2)中的报告蛋白基因为绿色荧光蛋白基因、半乳糖苷酶基因或荧光素酶基因。
6、根据权利要求1所述的方法,其特征在于:所述步骤2)中用于构建含有报告蛋白基因的表达载体的出发载体为pET、pUC18或pUC19。
7、根据权利要求6所述的方法,其特征在于:所述含有报告蛋白基因的表达载体为pET30(a)-linker-GFP。
8、根据权利要求1所述的方法,其特征在于:所述步骤2)中的宿主为大肠杆菌、枯草芽孢杆菌、酵母、昆虫细胞或动物细胞。
9、根据权利要求8所述的方法,其特征在于:所述宿主为E.coli BL21(DE3)、E.coli XL-1 blue、或E.coli DH5α。
10、用权利要求1-9所述方法得到的具有独立结构/功能的蛋白片段。
11、权利要求10所述的蛋白片段在制备病毒抗原和病毒疫苗中的应用。
CN 200610058019 2006-02-24 2006-02-24 获得具有独立结构/功能蛋白片段的方法 Pending CN1810969A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 200610058019 CN1810969A (zh) 2006-02-24 2006-02-24 获得具有独立结构/功能蛋白片段的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 200610058019 CN1810969A (zh) 2006-02-24 2006-02-24 获得具有独立结构/功能蛋白片段的方法

Publications (1)

Publication Number Publication Date
CN1810969A true CN1810969A (zh) 2006-08-02

Family

ID=36844088

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 200610058019 Pending CN1810969A (zh) 2006-02-24 2006-02-24 获得具有独立结构/功能蛋白片段的方法

Country Status (1)

Country Link
CN (1) CN1810969A (zh)

Similar Documents

Publication Publication Date Title
CN1249784A (zh) 一种体外构建dna文库的方法
CN1529757A (zh) 用于向细菌培养物上清液中分泌目的蛋白质的融合蛋白质
CN1511849A (zh) 新型α干扰素突变体及其制备方法
CN1880460A (zh) 大肠杆菌自裂解方法及其专用载体与应用
CN1766107A (zh) 一种重组人角质细胞生长因子的生产方法
CN1732387A (zh) 一种分析蛋白质与底物肽之间相互作用的蛋白质芯片
CN1724686A (zh) 用于检测肺炎支原体的靶序列和试剂盒
CN1657102A (zh) 基于表位的SARS-Cov基因疫苗及其构建
CN1810969A (zh) 获得具有独立结构/功能蛋白片段的方法
CN1572872A (zh) 重组生产多肽的改进方法
CN1171998C (zh) 中国对虾抗菌肽基因与克隆技术
CN1185254C (zh) 丙型肝炎病毒第一高变区抗原及其融合抗原
CN1736490A (zh) 结核杆菌嵌合基因疫苗及其制备方法
CN100335632C (zh) 牦牛的七种乳蛋白基因序列
CN1084565A (zh) 具有腈水合酶活性的新型蛋白和编码该蛋白的基因
CN1184232C (zh) 人肿瘤坏死因子相关凋亡诱导配体突变蛋白、其制法及其药物组合物
CN1806045A (zh) 新型功能性肽核酸及其产生方法
CN1821401A (zh) 一种获得具有独立结构/功能蛋白片段的方法
CN101058805A (zh) 突变羧肽酶原b及突变羧肽酶b的生产方法
CN1204252C (zh) 肿瘤坏死因子受体可溶部分的重组基因,及其融合基因与产物
CN100351378C (zh) 乙醛-乙醇脱氢酶基因
CN1800409A (zh) 一种Exiguobacterium sp. MY02菌株的嘧啶核苷磷酸化酶基因及其制备方法
CN1873008A (zh) 基因启动子
CN1234855C (zh) 重组Flt3配体基因,及其融合基因与产物
CN1721540A (zh) T载体及其构建方法与其前t载体

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Open date: 20060802