发明内容
本发明要解决的技术问题为:分子克隆需采用多种生物工程酶,对于同一基因克隆到不同表达载体需要不同的生物工程酶,插入位置不尽相同,没有通用性,导致无法实现快速构建同一基因不同表达载体的问题。
本发明解决上述技术问题的技术方案为:提供一种高通量构建同一基因不同表达载体的方法。该方法包括以下步骤:
a、设计合成载体改造正向引物MF和载体改造反向引物MR,在载体中插入统一的36~48bp的碱基序列;
b、设计合成目的基因正向引物IF和目的基因反向引物IR,载体扩增正向引物VF和载体扩增反向引物VR;
c、进行PCR,分别获得线性目的基因和线性目的载体DNA;
d、将两次PCR产物混合放置,使线性目的基因和线性目的载体DNA自发连接成环状,得到含有目的基因的载体。
进一步的,上述方法中,还包括步骤e:以步骤d所得产物转化细菌。
更进一步的,上述方法还包括步骤f:挑选单克隆菌落进行菌液PCR验证,提取质粒并测序鉴定,得到含有相同目的基因的不同重组载体。
其中,上述方法步骤a中所述插入的36~48bp的碱基序列中,当插入的碱基序列为36bp时,插入的核苷酸序列如SEQ ID NO:1所示;当插入的碱基序列超过36bp时,插入的核苷酸序列为在SEQ ID NO:1序列的5’端或3’端增加随机的1~12个碱基。
SEQ ID NO:1插入的36bp碱基序列
CTGGTGCCGCGCGGCAGCGGAGGAGGAATCATCATC。
所述的SEQ ID NO:1是由SEQ ID NO:2(CTGGTGCCGCGCGGCAGC)和SEQ ID NO:3(GGAGGAGGAATCATCATC)组成。
进一步的,步骤a所述的载体改造正向引物MF由18~33bp Overlap和25~40bp与载体插入位置相同的序列组成,载体改造反向引物MR由18~33bp Overlap和25~40bp与载体插入位置反向互补的序列组成;所述MF≤59bp,MR≤59bp。
具体的,步骤a所述的两对载体改造引物设计方法如图1所示。
其中,上述方法中,步骤b所述IF和IR由与载体统一36~48bp碱基序列同源重组的Overlap和与目的基因互补结合区域组成;步骤b所述VF和VR分别结合36~48bp中心对称分布的下游18~24bp序列和上游18~24bp序列。
其中,上述方法中,步骤b所述目的基因正向引物IF和目的基因反向引物IR中,目的基因正向引物IF含有Overlap I1和I2两部分,Overlap I1的序列与目的载体插入位置的5’端的18~24bp的序列相同,I2的序列与目的基因5’端20~30bp的序列相同;IR同样含有两个部分,分别为Overlap I3和I4,Overlap I3的序列与载体插入位置3’端序列18~24bp序列反向互补,I4的序列与目的基因3’端20~30bp的序列反向互补,其中I1与I3碱基数量相等。
优选的,I1与I3均含有18个碱基;更优选的,I1的核苷酸序列与SEQ ID NO:2(CTGGTGCCGCGCGGCAGC)相同,I3的核苷酸序列与SEQ ID NO:3(GGAGGAGGAATCATCATC)反向互补,即SEQ ID NO:4(GATGATGATTCCTCCTCC)。
具体而言,上述方法中,步骤b所述载体正向引物VF和载体反向引物VR是以载体的5’至3’方向为参考,VF和VR引物结合区域为改造后载体统一的36~48bp碱基序列,36bp核苷酸序列如SEQ ID NO:1所示。
VF与载体待插入位置3’端的18个碱基序列SEQ ID NO:3相同,VR与载体待插入位置5’端18个碱基序列SEQ ID NO:2反向互补,为SEQ ID NO:5(GCTGCCGCGCGGCACCAG)。
其中,上述方法步骤c是分别进行两次PCR。分别是将目的基因正向引物IF和目的基因反向引物IR与目的基因的模板进行PCR扩增得到线性的目的基因;载体扩增正向引物VF和载体扩增反向引物VR与环状质粒载体模板进行PCR扩增得到线性化的目的载体DNA。
其中,上述方法步骤c所述的目的基因引物和载体扩增引物设计合成的方法如图4所示。
其中,上述方法中的细菌为大肠杆菌。优选为DMT感受态大肠杆菌。
其中,上述方法步骤d所述的混合放置为在37℃下进行,时间为30~90分钟。进一步的,所述的混合放置的时间30~60分钟。
其中,上述方法中所述的载体为质粒。
本发明的有益效果为:
本发明提供了一种构建同一基因不同表达载体的分子克隆方法,与传统的分子克隆技术相比较,具有高速、高效、低成本,随机误差低等优点。本发明通过快速分子克隆方法对载体进行统一改造,使不同用途的表达载体具备统一的DNA序列,从而实现高通量构建同一基因的不同表达载体,加快筛选表达载体对蛋白表达的影响。此外本发明方法的过程极为简便、高效、经济,具有广阔的应用前景。
具体实施方式
本发明方法具体而言可按以下方式实现:
a、载体改造的突变引物设计和合成:对目的载体插入统一36~48bp的碱基序列,载体改造正向引物MF和载体改造反向引物MR主要包括插入序列和载体互补结合区域组成;
用引物MF和MR进行PCR,线性化待改造的目的载体,加入DpnI酶进行37℃孵育酶切得到连接产物;
b、扩增基因和线性化载体的引物设计和合成;
目的基因正向引物IF和目的基因反向引物IR均由插入载体的与36~48bp碱基序列同源重组的Overlap和与目的基因互补结合区域组成;载体扩增正向引物VF和载体扩增反向引物VR分别结合插入载体的36~48bp的下游18~24bp序列和上游18~24bp序列;
c、对目的基因和改造后载体进行PCR,分别获得线性目的基因和线性目的载体DNA;
d、将两次PCR产物混合放置,使线性目的基因和线性目的载体DNA自发连接成环状,得到含有目的基因的载体。
改造载体过程中,本发明还包括步骤e。所述步骤e的具体操作为:将a中所得的连接产物转化到细菌Transgene5α,第二天随机挑取单克隆菌落接种提取质粒送公司测序鉴定是成功插入36bp序列。
进一步的,根据快速克隆工作的要求,本发明方法还可以包括步骤f。所述步骤f的具体操作为:以步骤d所得连接产物转化细菌Transgene5α。第二天挑取单克隆菌落溶于2uL超纯水作为PCR模板,在预混的Taq Mix体系中加入扩增目的基因正向引物IF和反向IR,再分别加入菌液模板,根据基因片段大小设定延伸时间,进行PCR扩增。PCR结束后将PCR产物进行1%琼脂糖凝胶电泳,对于在理论分子量大小位置出现单一的DNA条带视为阳性菌落,可进行下一步接种提取质粒再送公司测序。
本发明方法的关键之处在于步骤a和b。本发明的改造载体引物和的方法和工作原理可参见图1和图4。
具体而言,步骤a中所述插入的36~48bp的碱基序列中,当插入的碱基序列为36bp时,插入的核苷酸序列如SEQ ID NO:1所示;当插入的碱基序列超过36bp时,插入的核苷酸序列为在SEQ ID NO:1序列的5’端或3’端增加随机的1~12个碱基。
进一步的,当插入碱基超过36bp时,可以在36bp(SEQ ID NO:8)基础上两端随机增加1~12bp,但是随着碱基数目的增加引物成本也增加,同时需要并且确保蛋白质翻译过程不出现移码现象。
为了高效经济插入成功36bp序列,可按下述两种情况进行插入:
1)对于载体已有Thrombin酶切位点的:正向引物MF1由18bp overlap“GGAGGAGGAATCATCATC(SEQ ID NO:3)”和25bp与载体插入位置(即Thrombin酶切位点序列3’端后)相同的序列组成;反向引物MR1由18bp overlap“GATGATGATTCCTCCTCC(SEQ ID NO:4)”和25bp与载体插入位置(即Thrombin酶切位点序列3’端前)反向互补的序列组成。
2)对于载体没有Thrombin酶切位点的:正向引物MF1由27bp overlap“CGCGGCAGCGGAGGAGGAATCATCATC(SEQ ID NO:6)”和25bp与载体插入位置相同的序列组成;反向引物MR2由27bp overlap“TCCTCCTCCGCTGCCGCGCGGCACCAG(SEQ ID NO:7)”和25bp与载体插入位置反向互补的序列组成。
其中Trombinm酶切位点可以提供有效的去除重组蛋白亲和标签的方式。
对于插入超过36bp的碱基,需要将MF和MR的引物的Overlap扩展为27~33bp。
具体而言,步骤b所述目的基因正向引物IF和目的基因反向引物IR中,目的基因正向引物IF含有Overlap I1和I2两部分,Overlap I1的序列与目的载体插入位置的5’端的18bp的序列(CTGGTGCCGCGCGGCAGC,SEQ ID NO:2)相同,I2的序列与目的基因5’端20~30bp的序列相同;IR同样含有两个部分,分别为Overlap I3和I4,Overlap I3的序列与载体插入位置3’端序列18bp SEQ ID NO:3(GGAGGAGGAATCATCATC)反向互补,即(GGAGGAGGAATCATCATC,SEQ ID NO:4),I4的序列与目的基因3’端20~30bp的序列反向互补,其中I1与I3碱基数量相等。
具体而言,上述方法步骤b所述载体正向引物VF和载体反向引物VR是以载体的5’至3’方向为参考,VF和VR引物结合区域为改造后载体统一的36bp碱基序列(CTGGTGCCGCGCGGCAGCGGAGGAGGAATCATCATC,SEQ ID NO:1)。VF与载体待插入位置3’端的18个碱基序列(GGAGGAGGAATCATCATC,SEQ ID NO:3)相同,VR与载体待插入位置5’端18个碱基序列(CTGGTGCCGCGCGGCAGC,SEQ ID NO:2)反向互补,即(GCTGCCGCGCGGCACCAG,SEQ ID NO:5)。
其中,上述方法步骤c是分别进行两次PCR。分别是将目的基因正向引物IF和目的基因反向引物IR与目的基因的模板进行PCR扩增得到线性的目的基因;载体扩增正向引物VF和载体扩增反向引物VR和线性化的载体模板进行PCR扩增得到线性化的目的载体DNA。
其中,上述方法中的细菌为大肠杆菌Transgene5α。优选为DMT感受态大肠杆菌。
其中,上述方法步骤d所述的混合放置为在37℃下进行,时间为30~90分钟。进一步的,所述的混合放置的时间30~60分钟。
其中,上述方法中所述的载体为质粒。
为了验证本发明方法适用于同一目的基因快速构建不同类型的载体,进行了下述的验证试验。
实施例1使用本发明方法进行基因IDH2的不同表达载体的分子克隆
本实施例中使用的引物序列见表1,各目的基因信息见表2。使用的载体分别有质粒载体:pETDuet1H,pGEX6p-1H,pRSETH,pET15bH,pET22bH,pET32aH,pET28aH,pET28aMBPH,pET28aMBPCH。各种试剂和载体均为常规市售。其中,MCLab DNAPolymerase Mix来自成都擎科梓熙生物技术有限公司,Utaq DNAPolymerase Mix来自成北京庄盟生物科技有限公司,DpnI限制性内切酶来自宝生物工程(大连)有限公司,Transgen 5α感受态细胞来自北京全式金生物技术有限公司。
表1实施例1使用的各种引物序列
表2实施例1使用的目的基因的信息
具体的过程为:
1、改造载体。根据公开的待使用的载体的序列,,按本发明方法设计和合成得到本发明方法所需的各种引物MF和MR,具体见表1。引物的设计原理参见图1。
各次实验利用表2中记载的相应的引物对待改造的目的载体进行PCR,线性化待改造的目的载体,将PCR产物加入DpnI酶进行37℃孵育酶切。
PCR反应体系由如下成分组成:1)0.5μL MF(20μM)和MR(20μM);2)3ng含有目的载体的DNA模板;3)12μL MCLAB DNAPolymerase Mix;4)12μL超纯水。
PCR反应条件为:98℃预变性2min;98℃变性10s,退火温度55℃,延伸温度为72℃,持续时间按15bp/min设定;循环数为25。
酶切反应体系:载体线性DNA 44μL+DpnI 1μL+DpnI Buffer 5μL,温度37℃,时间:1h
常规方法吸取5μL反应产物转化感受态的大肠杆菌Transgen 5α。
第二天,随机挑取单克隆,接种到5mLLB培养基中,然后提取质粒送公司测序验证插入统一目的DNA序列是否成功。
2、根据改造后的载体序列和表2中待扩增的目的基因片段,按本发明方法设计和合成得到本发明方法所需的各种引物IF、IR和VF、VR,具体见表1。引物的设计原理参见图4。
3、各次实验利用表2中记载的相应的引物对IF、IR和VF、VR分别进行两次PCR,获得线性目的基因和线性目的载体DNA片段。
各次试验的PCR反应体系分别由如下成分组成:1)0.5μL IF(20μM)和0.5μL IR(20μM)[或者VF(20μM)和VR(20μM)],2)3ng含有目的基因(或者目的载体)的DNA模板,3)12μLMCLAB DNAPolymerase Mix,4)12μL超纯水。
PCR反应条件为:98℃预变性2min;98℃变性10s,退火温度55℃,延伸温度为72℃,持续时间按15bp/min设定;循环数为18。
扩增目的基因和扩增目改造后的载体的PCR产物琼脂糖凝胶电泳结果如图2:泳道1和泳道2为用引物IDH2-HF&IDH2-HR和引物IDH2-HF&IDH2-HCR分别扩增得到构建在亲和标签N端和C端的PCR产物;泳道3、泳道4、泳道5、泳道6、泳道7、泳道8、泳道9、泳道10、泳道11分别为线性化的目的载体pETDuet1H,pGEX6p-1H,pRSETH,pET15bH,pET22bH,pET32aH,pET28aH,pET28aMBPH,pET28aMBPCH。
4、两次PCR产物混合孵育:
酶切反应体系:目的基因22μL+载体线性DNA22μL+DpnI 1μL+DpnI Buffer 5μL,温度37℃,时间:1h。
5、常规方法吸取5μL反应产物转化感受态的大肠杆菌Transgen 5α。
6、第二天,常规方法挑取单克隆菌落溶于2μL超纯水作为菌液PCR模板,每个平板挑选4个菌落,进行高通量菌液PCR验证。在预混的20μL UTaq-Mix酶体系中加入扩增目的基因0.2μL正向引物IF(20μM)和0.2μL(20μM)反向引物IR,再分别加入2μL菌液模板,根据基因片段大小设定延伸时间,循环数设置为30,进行PCR扩增。PCR结束后将PCR产物进行1%琼脂糖凝胶电泳,对于在理论分子量大小位置出现单一的DNA条带视为阳性菌落。对于PCR验证成功的阳性菌落,接种5mL LB培养基中,第三天提取质粒送公司测序鉴定,获得重组成功的含有IDH2基因的不同表达载体质粒,如图3所示。
7、由实验结果可知:经过本发明方法改造后的载体,可以通过HighF&HighF一对引物对所有载体进行PCR线性化载体,大大提高了PCR的效率,除了pRSETH和pET15b两个载体出现了非特异性条带外,其他载体都是单一的、高纯度的线性化载体,有利于提高克隆效率。
对于菌液PCR结果,克隆阳性率很高。其中pETDuet1H,pRSETH,pET15bH,pET32aH,pET28aH,pET28aMBPH,pET28aMBPCH阳性率高达100%,而pGEX6p-1H和pET22bH阳性率为25%,在实际操作过程中我们可以根据工作量适当增加挑选克隆数目,尽可能在一轮菌液PCR验证中拿到所有不同重组载体的阳性克隆。后续经过测序确认,我们在一轮分子克隆中拿到同一基因不同表达载体的重组质粒,实现了高通量构建同一基因不同表达载体。
序列表
<110> 四川大学
<120> 构建同一基因不同表达载体的分子克隆方法
<130> A180261K(序)
<141> 2018-04-27
<160> 29
<170> SIPOSequenceListing 1.0
<210> 1
<211> 36
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
ctggtgccgc gcggcagcgg aggaggaatc atcatc 36
<210> 2
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
ctggtgccgc gcggcagc 18
<210> 3
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
ggaggaggaa tcatcatc 18
<210> 4
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
gatgatgatt cctcctcc 18
<210> 5
<211> 18
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 5
gctgccgcgc ggcaccag 18
<210> 6
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 6
cgcggcagcg gaggaggaat catcatc 27
<210> 7
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 7
tcctcctccg ctgccgcgcg gcaccag 27
<210> 8
<211> 38
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 8
ctggtgccgc gcggcagcat gttcagacaa gtgacaaa 38
<210> 9
<211> 38
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 9
gatgatgatt cctcctcctt acaagttttt aatgactt 38
<210> 10
<211> 38
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 10
gatgatgatt cctcctccca agtttttaat gacttctt 38
<210> 11
<211> 52
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 11
cgcggcagcg gatccgaatt cgagctcaag cttgcggccg cataatgctt aa 52
<210> 12
<211> 52
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 12
ttcggatccg ctgccgcgcg gcaccagcgc cgagctcgaa ttcggatcct gg 52
<210> 13
<211> 52
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 13
cgcggcagcg gaggaggaat catcatcgga tccccggaat tcccgggtcg ac 52
<210> 14
<211> 51
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 14
tcctcctccg ctgccgcgcg gcaccagggg cccctggaac agaacttcca g 51
<210> 15
<211> 52
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 15
cgcggcagcg gaggaggaat catcatcggt atggctagca tgactggtgg ac 52
<210> 16
<211> 52
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
tcctcctccg ctgccgcgcg gcaccagatg atgatgatga tgatgagaac cc 52
<210> 17
<211> 42
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
ggaggaggaa tcatcatcca tatgctcgag gatccggctg ct 42
<210> 18
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 18
gatgatgatt cctcctccgc tgccgcgcgg caccaggccg ctg 43
<210> 19
<211> 51
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
cgcggcagcg gaggaggaat catcatccac caccaccacc accactgaga t 51
<210> 20
<211> 51
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
tcctcctccg ctgccgcgcg gcaccagctc gagtgcggcc gcaagcttgt c 51
<210> 21
<211> 51
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
cgcggcagcg gaggaggaat catcatcggt atgaaagaaa ccgctgctgc t 51
<210> 22
<211> 52
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
tcctcctccg ctgccgcgcg gcaccaggct accgcgtggc accagaccag aa 52
<210> 23
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
ggaggaggaa tcatcatcca tatggctagc atgactggtg gac 43
<210> 24
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
gatgatgatt cctcctccgc tgccgcgcgg caccaggccg ctg 43
<210> 25
<211> 52
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
cgcggcagcg gaggaggaat catcatcgat ccggaattca aaggcctacg tc 52
<210> 26
<211> 52
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
tcctcctccg ctgccgcgcg gcaccagcat ggcgccctga aaatacaggt tt 52
<210> 27
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
ggaggaggaa tcatcatcca tatgaaaatc gaagaaggta aac 43
<210> 28
<211> 43
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 28
gatgatgatt cctcctccgc tgccgcgcgg caccaggccg ctg 43
<210> 29
<211> 1110
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 29
atgttcagac aagtgacaaa atcagctcca gttatcagaa ccacccaaag actttttgct 60
agatcctaca ttgccggtca attcaccggt agcaagggat cagacggtaa atatactgtt 120
actttgattg aaggtgacgg tattgggcca gaaatttccc aagccgttaa agatatttac 180
gctgctgctg atgtgccaat tcactgggaa ccagtcgatg tcactccatt gttgattgac 240
ggtaagacca ccttgccaca accagctgtt gactccgtca acaagaactt ggttgccttg 300
aaaggtccat tagccacccc agttggtaaa ggtcacactt ccatgaactt gactttgaga 360
agaactttca acttgtttgc caacgttcgt ccatgtaaat ccattgttgg ttacgaaact 420
ccctacgaaa atgtcgatac agttttgatc agagaaaaca ccgaaggaga atactccggt 480
attgaacata ctattgttcc aggtgttgtc caatccatta agttgattac caagccagct 540
tccgaaaaag tcattagata cgcttttgag tacgctaaat ctatcaacaa accacacgtt 600
cttgttgtcc acaaagcctc cattatgaaa ttgtctgatg gtttgtttgt caacactgct 660
aaagaagttg ctcaagaata cccagatgtt tctttagact ttgaattgtt ggacaacact 720
tcattaagat taactgccga cccatctcaa tacaagaacg ttgtcatggt tatgccaaac 780
ttgtacggtg atatcatgtc cgatttgtcc tccggtttga ttggtggttt gggtttgacc 840
ccatccggta acatgggtaa caaggtttct attttcgaag ctgtccatgg ttctgctcca 900
gatattgctg gtaaaggttt ggccaaccct actgccttat tattgtcatc ctgtatgatg 960
ttgagacata tgtctttgaa ctccgacgcc gacagaattg aaaatgctgt gttgaagact 1020
attgcttccg gtccagaaaa cagaactggt gacttgaaag gtaccgctac cactacacgt 1080
ttcactgaag aagtcattaa aaacttgtaa 1110