CN117165613A - 一种表达载体及其构建方法和应用 - Google Patents

一种表达载体及其构建方法和应用 Download PDF

Info

Publication number
CN117165613A
CN117165613A CN202210594038.0A CN202210594038A CN117165613A CN 117165613 A CN117165613 A CN 117165613A CN 202210594038 A CN202210594038 A CN 202210594038A CN 117165613 A CN117165613 A CN 117165613A
Authority
CN
China
Prior art keywords
fluorescent protein
gene
val
gly
glu
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210594038.0A
Other languages
English (en)
Inventor
科瑞欧
斯特瑞尼·帕帕达吉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Westlake University
Original Assignee
Westlake University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Westlake University filed Critical Westlake University
Priority to CN202210594038.0A priority Critical patent/CN117165613A/zh
Publication of CN117165613A publication Critical patent/CN117165613A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明涉及一种用于细菌和哺乳动物细胞中的基因表达的表达载体及其构建方法和应用。所述表达载体包括:细菌和哺乳动物表达盒,其包括CMV启动子、L‑鼠李糖诱导的rhaB启动子、Shine‑Dalgarno(SD)序列、靶荧光蛋白基因、细菌rrnB T1终止子和SV40poly‑A尾;参照基因表达盒,其包括:SV40启动子、参照FP基因和HSV‑TK poly(A)尾。其结合了高通量筛选大型细菌库的速度及便利性与用于胞内亮度及光稳定性的基于哺乳动物细胞的高内涵筛选,同时无需重新克隆的步骤。

Description

一种表达载体及其构建方法和应用
技术领域
本发明属于基因工程技术领域,具体而言,涉及一种用于细菌和哺乳动物细胞中的基因表达的表达载体及其构建方法和应用。
背景技术
在过去的几十年里,随着人们对完整的生物系统中的多种亚细胞和细胞结构同时进行高内涵成像(high-content imaging)的需求越来越大,荧光蛋白(FP)的光谱多样性为多重成像提供了一种直接方法,包括对培养细胞和各种模式生物中不同亚细胞和细胞结构进行多重成像。在为大多数体内应用选择基因编码的FP时,其主要标准之一是荧光亮度。FPbase(https://www.fpbase.org/)中有多种可用的高分子亮度FP,主要发射青色、绿色、黄色和红色荧光。
然而,现有的FP并不能满足应用的各种各样的要求,需要开发新的FP。表达载体在FP的筛选中具有重要作用,因此,需要开发新的表达载体以满足上述要求。
发明内容
为了提高定向分子进化优化荧光蛋白(FP)的细胞内亮度的效率,需要将高通量筛选大肠杆菌中表达的大型基因文库与快速测定哺乳动物细胞中选定克隆的细胞内亮度相结合。实现这一目标的最佳表达载体将会提供目标基因在常见细菌菌株和哺乳动物细胞中的高效表达。此外,细菌细胞中的表达应严格调节以防止负向选择,并且与蛋白质表达兼容的细菌菌株应提供可用于测序和直接转染哺乳动物细胞的足够产量的高质量DNA。
为了满足这些要求,本发明人设计了一个简单的克隆质粒系统,命名为pHybrid,用于大肠杆菌和哺乳动物细胞中的基因表达。所述克隆质粒系统是通过结合用于在大肠杆菌和哺乳动物细胞中均可高效表达和纯化蛋白质的细菌特异性和哺乳动物特异性序列而开发出的双表达系统。其结合了高通量筛选大型细菌库的速度及便利性与用于胞内亮度及光稳定性的基于哺乳动物细胞的高内涵筛选,同时无需重新克隆的步骤。
本发明一个目的是提供一种用于细菌和哺乳动物细胞中的基因表达的表达载体。
本发明另一个目的是提供所述表达载体的构建方法。
本发明另一个目的是提供所述表达载体的用途。
一方面,本发明提供了一种用于细菌和哺乳动物细胞中的基因表达的表达载体,其包括:
细菌和哺乳动物表达盒,其包括CMV启动子、L-鼠李糖诱导的rhaB启动子、Shine-Dalgarno(SD)序列、靶荧光蛋白基因(Target FP基因)、细菌rrnB T1终止子和SV40 poly-A尾;
参照基因表达盒,其包括:SV40启动子、参照FP基因(Reference FP基因,如mScarlet基因)和HSV-TK poly(A)尾。
在一个实施方式中,本发明的表达载体是具有复制起点(如丝状噬菌体f1复制起点)和抗生素抗性基因(如氨苄西林抗性基因)的高拷贝数质粒。
在一个实施方式中,本发明的表达载体中,所述细菌和哺乳动物表达盒还包括His标签和Kozak序列元件。在进一步的实施方式中,本发明的表达载体的细菌和哺乳动物表达盒中,在Shine-Dalgarno序列和靶荧光蛋白基因之间具有组氨酸标签(6x-HisTag)序列。在进一步的实施方式中,本发明的表达载体的细菌和哺乳动物表达盒中,Kozak序列可以位于组氨酸标签和靶荧光蛋白基因之间。
在一个实施方式中,本发明的表达载体中,所述参照基因表达盒位于所述细菌和哺乳动物表达盒的SV40 poly(A)尾之后。
在一个实施方式中,本发明的表达载体中,所述参照基因表达盒还包括Kozak序列元件。
在一个实施方式中,本发明的表达载体还包含CMV增强子。
在一个实施方式中,本发明的表达载体具有如下的结构:在pCI载体的骨架上,在CMV启动子之后且SV40 poly(A)尾之前,切除intron内含子-T7-MCS片段,引入L-鼠李糖诱导的rhaB启动子、Shine-Dalgarno(SD)序列、组氨酸标签、Kozak序列元件、靶荧光蛋白基因和细菌rrnB T1终止子,以及在SV40 poly(A)尾下游插入SV40启动子、参照荧光蛋白基因和HSV-TK poly(A)尾。
在一个实施方式中,上述细菌可以是,例如,大肠杆菌;所述哺乳动物细胞可以是,例如,HEK细胞,Hela细胞等,但本发明不限于此。
本发明的表达载体可以用于表达任何靶荧光蛋白基因,只要相应地选择合适的参照荧光蛋白基因即可。
特别地,所述靶荧光蛋白和参照荧光蛋白可以各自独立地选自红色荧光蛋白(RFP)、绿色荧光蛋白(GFP)、蓝色荧光蛋白(BFP)或者其他颜色的荧光蛋白,也即是说,所述靶荧光蛋白可以选自红色荧光蛋白、绿色荧光蛋白、蓝色荧光蛋白或者其他颜色的荧光蛋白,所述参照荧光蛋白可以选自红色荧光蛋白、绿色荧光蛋白、蓝色荧光蛋白或者其他颜色的荧光蛋白。具体靶荧光蛋白和参照荧光蛋白的选择可以根据表达载体的预期应用领域而确定。
在一些实施方式中,本发明的表达载体用于荧光蛋白的开发和筛选。此时需要有效评估荧光蛋白在不同实验条件下的特异性特征。为了实现并正确评价突变体的性能,需要确保参照蛋白不能在与靶蛋白相同的波长下被激发,同时参照蛋白的发射谱不会交叉渗透到靶蛋白荧光检测过滤器中。因此,优选靶荧光蛋白和参照荧光蛋白为不同类型的荧光蛋白。特别地,所述靶荧光蛋白可以为蓝色荧光蛋白,所述参照荧光蛋白可以为红色荧光蛋白,或者所述靶荧光蛋白可以为红色荧光蛋白,所述参照荧光蛋白可以为蓝色荧光蛋白。
在另一些实施方式中,本发明的表达载体用于合成其他的表达载体。此时,对于靶荧光蛋白和参照荧光蛋白没有特别限制,两者可以相同或不同。
特别地,所述参照荧光蛋白可以为mScarlet。
在一个实施方式中,本发明的表达载体基本上具有如图3所示的结构。
另一方面,本发明提供了上述表达载体的构建方法,其为如下方法之一:
方法一,包括以下步骤:
以pCI载体为骨架分两步组装,首先,将包括L-鼠李糖诱导的rhaB启动子、Shine-Dalgarno(SD)序列、靶荧光蛋白基因和细菌rrnB T1终止子的鼠李糖诱导的表达盒插入CMV启动子和SV40 poly(A)序列之间,然后,在SV40 poly(A)序列后克隆包括SV40启动子、参照荧光蛋白基因(例如mScarlet基因)和HSV-TK poly(A)尾的SV40表达盒;
方法二:
通过替换靶荧光蛋白基因和/或参照荧光蛋白基因从根据本发明的一种表达载体得到另一种表达载体。
在一个实施方式中,在靶荧光蛋白基因的起始位点设置有Kozak序列元件。在一个实施方式中,在参照荧光蛋白基因的起始位点设置有Kozak序列元件。
在本发明公开内容,特别是公开的序列和构建方法的基础上,本领域技术人员基于本领域的现有技术(包括本领域的公知常识)可以预期其他适合的构建本发明的表达载体的方法。因此,本发明的表达载体的构建方法不限于此。
再一方面,本发明提供本发明的表达载体用于在细菌和哺乳动物细胞中表达荧光蛋白的用途。
再一方面,本发明提供一种在细菌和哺乳动物细胞中表达荧光蛋白的方法,所述方法包括:
用要表达的荧光蛋白基因替换本发明的表达载体上的靶荧光蛋白基因,和/或用要表达的参照荧光蛋白基因替换本发明的表达载体上的参照荧光蛋白基因得到pHybrid质粒;
将所得到的pHybrid质粒转化到细菌细胞(例如TOP10大肠杆菌宿主细胞)或转染到哺乳动物细胞(例如HEK细胞,Hela细胞等)中并培养。
再一方面,本发明提供了一种筛选荧光蛋白的方法,包括:
将待筛选的荧光蛋白的基因文库亚克隆到根据本发明的表达载体中;
将所得表达载体转化到细菌细胞(例如TOP10大肠杆菌宿主细胞),由此将待筛选的基因文库表达在细菌细胞中;
对转化后的细菌细胞进行培养,然后在荧光显微镜下筛选菌落,分选出1个或多个最佳菌落。
在实施方式中,待筛选的荧光蛋白的基因文库可以是定点突变的文库,随机突变的文库或者二者的结合。
在实施方式中,本发明的筛选荧光蛋白的方法可以重复进行多次,例如2次以上,例如2、3、4、5、6、7次等,但不限于此。
在实施方式中,所述最佳菌落可以是具有最亮荧光的菌落,或者通过选自体外亮度、细胞内亮度、光稳定性等中的一个或多个参数选择的菌落,例如通过细胞内亮度和体外亮度,细胞内标准化亮度和光稳定性的乘积等,但不限于此。在筛选进行多轮的情况下,每轮采用的筛选标准可以相同或不同。
在实施方式中,根据本发明的筛选荧光蛋白的方法还可以包括:
将分选出的最佳菌落进行培养,优选在有利于质粒提取的环境下进行培养,并提取质粒;
将提取的质粒在哺乳动物细胞(例如HEK细胞,Hela细胞等)中表达并测定细胞内亮度和/或光稳定性;
和/或
将分选出的最佳菌落进行培养,优选在有利于蛋白表达的环境下进行培养,并提取蛋白;
表征蛋白的光谱,例如吸收光谱和/或发射光谱。
有益效果
例如,利用相似的哺乳动物和细菌启动子来驱动靶基因表达的pDRESS载体应与E.cloni5α细菌菌株一起使用,以得到高产量的蛋白质和高质量的质粒DNA,而pHybrid可以与市售的TOP10细菌菌株一起使用。此外,pHybrid具有用于靶基因和参照基因(鼠李糖和SV40表达盒)的独立表达盒,仅能够使用标准Ni-NTA柱从细菌培养物中纯化靶向蛋白。纯化的目标蛋白可以直接用于光谱表征,消除来自参照蛋白的光谱干扰,而荧光蛋白N端的6xHis-tag先前已有报道可提高细菌中的蛋白产量(Park,W.J.et al.ActaBiochim.Biophys.Sin.(Shanghai).47,488–495(2015))。此外,与pDual-GC载体中使用的T7启动子相比,pHybrid中使用的鼠李糖启动子能够实现更严格的基因表达调节。引入的筛选方法成功地用于BFP变体的开发和优化,仅从明亮的红色荧光蛋白(RFP)mRuby3开始进行了两轮定向分子进化即可得到高性能的BFP变体。我们相信,pHybrid质粒作为双表达载体可以得到广泛的应用,所提出的分级筛选方法可以用于蛋白质工程。
附图说明
图1显示pCI载体的质粒图谱。
图2显示pCI载体的多克隆位点序列和图谱。
图3显示根据本发明一个实施方式的pHybrid载体的矢量图,其中以mScarlet作为参照荧光蛋白基因。
图4显示根据本发明一个实施方式的pHybrid载体基本特征的线性图谱。
图5显示,在根据本发明的实施例2中,用pHybrid-mBlueberry2/mScarlet(mBlueberry2)、pHybrid-EBFP2/mScarlet(EBFP2)和pHybrid-mTagBFP2/mScarlet(mTagBFP2)表达载体转化的大肠杆菌在蓝色通道(顶部)和红色(底部)通道中的荧光图像(成像条件:蓝色荧光蛋白为403nm/456nm激发/发射,mScarlet为激发/发射561nm/594nm)。
图6显示,在根据本发明的实施例2中,用pHybrid-mBlueberry2/mScarlet(mBlueberry2)、pHybrid-EBFP2/mScarlet(EBFP2)和pHybrid-mTagBFP2/mScarlet(mTagBFP2)表达载体转染的HEK细胞在蓝色通道(顶部)、红色通道(中间)和叠加(底部)的荧光图像(成像条件:BFP为403nm激发,456nm发射;mScarlet为561nm激发,594nm发射,功率为0.91mW/mm2;标尺为50μm)。所有图像的动态范围均独立调整,以便于可视化。
具体实施方式
为了使本发明的目的和技术方案及优点更加清楚明白,以下作详细示例说明本发明。此处所描述的具体实施例仅用于解释本发明,并不用于限定本发明。
实施例
下述实施例所使用的实验方法如无特殊说明,均为常规方法。
下述实施例所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
pCI载体全称为pCI哺乳动物表达载体(pCI Mammalian Expression Vector),由Promega公司生产,含有人巨细胞病毒(CMV)的主要及时早期基因增强子/启动子区域(immediate-early gene enhancer/promoter region)。图1显示pCI载体的质粒图谱,图2显示pCI载体的多克隆位点序列和图谱。
pCI载体序列参考点如下:
Cytomegalovirus immediate-early enhancer/promoter region 1-742
Chimeric intron 857-989
T7-EEV sequencing primer binding site 1020-1041
T7 RNA Polymerase Promoter(-17to+2) 1034-1052
T7 promoter transcription start site 1051
Multiple cloning region 1052-1104
SV40late polyadenylation signal 1111-1332
Phage f1 region 1422-1877
β-lactamase(Ampr)coding region 2314-3174
ColEl-derived origin of replication 3936
用于克隆的合成DNA寡核苷酸购自擎科生物科技有限公司。
使用PrimeStar Max master mix(Clontech)进行高保真PCR扩增。
用Mini-Prep试剂盒(Qiagen)进行质粒DNA的提取小规模分离。
使用GenElute HP无内毒素质粒Maxiprep试剂盒(Sigma-Aldrich)进行大规模质粒DNA质粒纯化。
纯化质粒和细菌菌落的测序采用桑格(Sanger)法(中国杭州有康生物科技有限公司(Healthy Creatures Hangzhou,China))进行。
使用GeneJET凝胶提取试剂盒(Thermo Scientific K0691)试剂盒按照制造商说明进行凝胶电泳。
使用SnapGene进行电脑模拟克隆(in silico cloning)和DNA序列分析。
除非另有说明,在整个实验过程中使用NIS Elements Advance Research软件进行目标区域(Region of Interest,ROI)的手动选择和平均荧光强度值(MeanFluorescence Intensity,MFI)提取。死亡或不健康的细胞被排除在分析之外。对于每个视场(field of view,FOV),从相应通道的所有MFI值中减去通道背景。
根据所使用的构建体,以蓝-红荧光强度的形式计算比值。
除了标准化体外亮度和细胞内亮度与光稳定性的标准化乘积使用Excel(Microsoft)以外,所有亮度和光稳定性图以及统计分析均在OriginPro(OriginLab,Northampton,MA)上进行和生成。
实施例1pHybrid质粒的构建
pHybrid质粒以pCI载体(Promega)为骨架分两步组装。首先,从pWA23h质粒[Piatkevich,K.D.et al.Nat.Chem.Biol.14,352–360(2018)]中PCR扩增鼠李糖诱导的表达盒,并将其插入CMV启动子和SV40 poly(A)序列之间。然后,在SV40 poly(A)序列后克隆由SV40启动子、mScarlet基因和HSV-TK poly(A)尾组成的SV40表达盒。
具体过程如下:
步骤1:用于靶荧光蛋白基因(mRuby3基因)表达的相关目的片段的扩增
从pWA23h质粒[Piatkevich,K.D.et al.Nat.Chem.Biol.14,352–360(2018)]中PCR扩增rhaB启动子,通过凝胶电泳收集PCR产物。PCR中使用的正向引物中具有HindIII酶识别位点AAGCTT。具体引物如下:
扩增的rhaB启动子序列如下:(SEQ ID NO:3)
CCGTCAGATCACTAGAAGCTTCACCACAATTCAGCAAATTGTGAACATCATCACGTTCATCTTTCCCTGGTTGCCAATGGCCCATTTTCCTGTCAGTAACGAGAAGGTCGCGAATTCAGGCGCTTTTTAGACTGGTCGTAACCCGTTTTTGGCTAACAGGAGGAATTAACC
从pWA23h质粒中PCR扩增rrnB T1终止子,通过凝胶电泳收集PCR产物。PCR中使用的正向引物具有XbaI酶识别位点TCTAGA,反向引物具有NotI酶识别位点GCGGCCGC(用于与rrnB T1–SV40 poly(A)重组)。具体引物如下:
扩增的rrnB T1终止子序列如下:(SEQ ID NO:6)
TCTAGAGTCGACCCAGGCATCAAATAAAACGAAAGGCTCAGTCGAAAGACTGGGCCTTTCGTTTTATCTGTTGTTTGTCGGTGAACGCTCTCCTGAGTAGGACAAATGCGGCCGCTTCGAGCAGACATGATAAGATACATTGATG
PCR扩增mRuby3基因,通过凝胶电泳收集PCR产物。PCR中使用的正向引物具有SD序列AGGAG,6xHisTag序列CACCATCACCATCACCAT(用于提高金属亲和色谱产率),KpnI酶识别位点GGTACC(用于后续克隆)和Kozak序列GCCACCATGG,反向引物具有XbaI酶识别位点TCTAGA。具体引物如下:
扩增的rmRuby3基因序列如下:(SEQ ID NO:9)
CAGGAGGAATTAACCATGGGGAGCCACCATCACCATCACCATGCTAGCCTCGAGAATTCACGCGTGGTACCAGCCACCATGGTGTCTAAGGGCGAAGAGCTGATCAAGGAAAATATGCGTATGAAGGTGGTCATGGAAGGTTCGGTCAACGGCCACCAATTCAAATGCACAGGTGAAGGAGAAGGCAGACCGTACGAGGGAGTGCAAACCATGAGGATCAAAGTCATCGAGGGAGGACCCCTGCCATTTGCCTTTGACATTCTTGCCACGTCGTTCATGTATGGCAGCCGTACCTTTATCAAGTACCCGGCCGACATCCCTGATTTCTTTAAACAGTCCTTTCCTGAGGGTTTTACTTGGGAAAGAGTTACGAGATACGAAGATGGTGGAGTCGTCACCGTCACGCAGGACACCAGCCTTGAGGATGGCGAGCTCGTCTACAACGTCAAGGTCAGAGGGGTAAACTTTCCCTCCAATGGTCCCGTGATGCAGAAGAAGACCAAGGGTTGGGAGCCTAATACAGAGATGATGTATCCAGCAGATGGTGGTCTGAGAGGATACACTGACATCGCACTGAAAGTTGATGGTGGTGGCCATCTGCACTGCAACTTCGTGACAACTTACAGGTCAAAAAAGACCGTCGGGAACATCAAGATGCCCGGTGTCCATGCCGTTGATCACCGCCTGGAAAGGATCGAGGAGAGTGACAATGAAACCTACGTAGTGCAAAGAGAAGTGGCAGTTGCCAAATACAGCAACCTTGGTGGTGGCATGGACGAGCTGTACAAGTAATCTAGAGTCGACCCAGGCATC
步骤2:pCI载体的消化
将pCI载体作为质粒骨架以HindIII(在pCI载体中的位置为CMV promoter之后)与NotI(在pCI载体中的位置为SV40 poly(A)尾前)限制性核酸内切酶(新英格兰生物实验室(New England BioLabs))根据制造商的使用说明进行消化,得到线性载体。消化后的pCI质粒被切去原始载体的内含子-T7-MCS片段。线性化载体后对消化产物进行琼脂糖凝胶电泳,使用GeneJET凝胶提取试剂盒(Thermo Scientific K0691)收集目的线性载体。
步骤3:中间重组载体的制备
使用Plus One Step Cloning Kit(Novoprotein)按照制造商的说明将步骤1扩增得到的rhaB启动子,mRuby3基因和rrnB T1终止子与步骤2所得线性载体进行一步重组,形成中间重组载体。
所述中间重组载体相对于pCI载体的变化为:原始pCI载体的内含子-T7-MCS片段被切除,引入rhaB启动子-mRuby3基因-rrnB T1终止子片段。
步骤4:用于表达参照荧光蛋白基因(mScarlet基因)的目的片段扩增
以pEGFP-N1质粒(Clontech)为模板,使用下表所示的引物扩增SV40启动子,通过凝胶电泳收集PCR产物。其中,正向引物中具有HpaI酶识别位点GTTAAC和MfeI酶识别位点CAATTG。这里引入MfeI识别位点,以便未来在需要时进行额外分子工程步骤。
扩增的SV40启动子序列如下:(SEQ ID NO:12)
ACAAGTTAACAACAACAATTGGGTGTGGAAAGTCCCCAGGCTCCCCAGCAGGCAGAAGTATGCAAAGCATGCATCTCAATTAGTCAGCAACCATAGTCCCGCCCCTAACTCCGCCCATCCCGCCCCTAACTCCGCCCAGTTCCGCCCATTCTCCGCCCCATGGCTGACTAATTTTTTTTATTTATGCAGAGGCCGAGGCCGCCTCGGCCTCTGAGCTATTCCAGAAGTAGTGAGGAGGCTTTTTTGGAGGCCTAGGCTTTTGCAAAGCCACCATGGTGAGCAAGGGCGAGGCAG
从Addgene获得编码mScarlet的质粒EB3-mScarlet-I(Addgene#98826)。使用EB3-mScarlet-I作为模板使用下表所示的引物扩增mScarlet基因,通过凝胶电泳收集PCR产物。其中,反向引物中具有BamHI识别位点GGATCC以及HSV-TK poly(A)尾序列GAACAAACGACCCAACACCGTGCGTTTTATTCTGTCTTTTTATTGCCG(SEQ ID NO:13)。
扩增的mScarlet基因序列如下:(SEQ ID NO:16)
ATGGTGAGCAAGGGCGAGGCAGTGATCAAGGAGTTCATGCGGTTCAAGGTGCACATGGAGGGCTCCATGAACGGCCACGAGTTCGAGATCGAGGGCGAGGGCGAGGGCCGCCCCTACGAGGGCACCCAGACCGCCAAGCTGAAGGTGACCAAGGGTGGCCCCCTGCCCTTCTCCTGGGACATCCTGTCCCCTCAGTTCATGTACGGCTCCAGGGCCTTCATCAAGCACCCCGCCGACATCCCCGACTACTATAAGCAGTCCTTCCCCGAGGGCTTCAAGTGGGAGCGCGTGATGAACTTCGAGGACGGCGGCGCCGTGACCGTGACCCAGGACACCTCCCTGGAGGACGGCACCCTGATCTACAAGGTGAAGCTCCGCGGCACCAACTTCCCTCCTGACGGCCCCGTAATGCAGAAGAAGACAATGGGCTGGGAAGCGTCCACCGAGCGGTTGTACCCCGAGGACGGCGTGCTGAAGGGCGACATTAAGATGGCCCTGCGCCTGAAGGACGGCGGCCGCTACCTGGCGGACTTCAAGACCACCTACAAGGCCAAGAAGCCCGTGCAGATGCCCGGCGCCTACAACGTCGACCGCAAGTTGGACATCACCTCCCACAACGAGGACTACACCGTGGTGGAACAGTACGAACGCTCCGAGGGCCGCCACTCCACCGGCGGCATGGACGAGCTGTACAAGTGACCGGCAATAAAAAGACAGAATAAAACGCACGGTGTTGGGTCGTTTGTTCGGATCCGGGCTGGCGTAATAGC
步骤5:步骤3得到的中间重组载体的消化
将步骤3得到的中间重组载体用HpaI/BamHI(均位于SV40 poly(A)尾下游)限制性核酸内切酶(NEB)根据制造商的使用说明进行消化,形成线性载体。HpaI/BamI限制性核酸内切酶组合用于产生粘性末端。
使用GeneJET凝胶提取试剂盒(Thermo Scientific K0691)试剂盒通过凝胶电泳收集目的线性载体。
步骤6:pHybrid重组载体的制备
使用Plus One Step Cloning Kit按照制造商的说明将步骤4扩增得到的SV40启动子,mScarlet基因和HSV-TK poly(A)尾与步骤5得到的线性载体进行一步重组。由此将包括SV40启动子、mScarlet基因和HSV-TK poly(A)尾的参照基因表达盒插入步骤5得到的线性载体的SV40 poly(A)序列之后,得到一种pHybrid重组载体(即pHybrid表达载体),命名为pHybrid-mRuby3/mScarlet。
根据本发明的pHybrid表达载体是具有丝状噬菌体f1复制起点和氨苄西林(Amp+)抗性的高拷贝数质粒。在Shine-Dalgarno序列(用于协助翻译)后面克隆带有组氨酸标签(用于蛋白纯化)和短氨基酸连接子(即Kozak序列元件,是翻译起始位点的核酸序列元件)的靶荧光蛋白基因,用于有效的细菌翻译[Chen,H.et al.Nucleic Acids Res.22,4953–4957(1994)]和使用金属亲和层析纯化(6xHis标签在目标蛋白的N端表达,提高金属亲和色谱)。
图3显示根据本发明的pHybrid表达载体的矢量图,其中利用mScarlet作为参照荧光蛋白基因,引入一种新的杂交载体用于目标基因的细菌和哺乳动物表达。图4显示根据本发明的利用mScarlet作为参照荧光蛋白基因的pHybrid表达载体基本特征的线性图谱:(上图)复制起点,在用于分别在哺乳动物细胞和大肠杆菌中表达的CMV启动子和rhaB启动子下的靶荧光蛋白基因(例如上面的mRuby3基因),然后是rrnB T1终止子和SV40poly(A)尾,在SV40启动子调控下的mScarlet,然后是HSV TK poly(A)尾;(底部)靶荧光蛋白基因前面的SD、His标签和Kozak序列元件的核苷酸序列。在其他实施方式中,mScarlet可以用其他参照荧光蛋白基因替换。
因此,根据本发明的pHybrid表达载体结合了细菌和哺乳动物表达盒,包括CMV启动子、L-鼠李糖诱导的rhaB启动子、Shine-Dalgarno序列、细菌rrnB T1终止子和SV40poly(A)尾。此外,它包含用于参照FP的哺乳动物表达的带有SV40启动子的独立表达盒,以标准化目标基因的总体表达水平。
实施例2:pHybrid表达载体对单个蛋白质的表达
2.1细胞成像
采用由NIS Elements软件控制的配备有Spectra III光引擎(LumenCore)、ORCA-Flash 4.0V3 sCMOS摄像头(Hamamatsu)和20×/0.75物镜的尼康Ti2-E宽视野显微镜。
2.2 pHybrid质粒在TOP10大肠杆菌细胞中的表达
为了验证实施例1制备的新的pHybrid表达载体,首先在TOP10大肠杆菌细胞中表达靶荧光蛋白基因mBlueberry2[Ai,H.W.et al.Biochemistry 46,5904–5910(2007)]、EBFP2[Subach,O.M.et al.Chem.Biol.15,1116–1124(2008);Ai,H.W.et al.Biochemistry46,5904–5910(2007)]和mTagBFP2[Subach,O.M.et al.PLoS One 6,(2011)]蛋白,它们由CMV-rhaB启动子调控。具体操作如下。
从Addgene分别获得编码EBFP2和mTagBFP2的质粒pEBFP2-N1(Addgene#54595)和pmTagBFP2-H3.3-N-14(Addgene#55302)。
2.2.1pmBlueberry2-N1质粒的构建
mBlueberry2基因由擎科生物科技有限公司(Tsingke Biotechnology Co.,Ltd.)根据原始出版物[Ai,H.W.,et al.Biochemistry 46,5904–5910(2007)]中报告的序列从头合成。
然后,将从头合成的mBlueberry2基因克隆入pN1质粒得到pmBlueberry2-N1质粒。具体操作如下。
将从头合成的mBlueberry2基因使用以下引物进行PCR扩增:
正向引物:
CGCGGGCCCGGGATCCACCGGTCGCCACCATGGTGAGCAAGGGCGAGG(SEQ ID NO:17,其中具有AgeI限制性核酸内切酶识别位点ACCGGTC)
反向引物:
GGCTGATTATGATCTAGAGTCGCGCCCCTTTACTTGTACCTCGTCTCCATGC(SEQ ID NO:18,其中具有NotI限制性核酸内切酶识别位点GCGCCCCT)
然后,将得到的PCR产物进行凝胶电泳纯化。
使用pEBFP2-N1(Addgene#54595)按照制造商的使用说明,使用AgeI和NotI限制性核酸内切酶进行消化,得到线性载体并进行凝胶纯化。
将PCR扩增得到的mBlueberry2 PCR产物与使用pEBFP2-N1质粒得到的线性载体使用Plus One Step Cloning Kit按照制造商的说明进行一步重组克隆,得到pmBlueberry2-N1质粒。
2.2.2靶荧光蛋白基因mBlueberry2、EBFP2和mTagBFP2的扩增
分别以pmBlueberry2-N1质粒、pEBFP2-N1质粒和pmTagBFP2-H3.3-N-14质粒为模板,使用下表所列引物分别进行PCR扩增。其中,PCR中使用的正向引物具有KpnI酶识别位点GGTACC,反向引物具有XbaI酶识别位点TCTAGA
扩增的mBlueberry2蛋白基因序列如下:(SEQ ID NO:23)
CCTCGAGAATTCACGCGTGGTACCAGCCACCATGGTGAGCAAGGGCGAGGAGAACAACGTGGCCATCATCAAGGAGTTCATGAGATTCAAGGTGCACATGGAGGGCAGCGTGAACGGCCACGAGTTCGAGATCGAGGGCGAGGGCGAGGGCAGACCCTACGAGGGCACCCAGACCGCCAAGCTGAAGGTGACCAAGGGCGGCCCCCTGCCCTTCGCCTGGGACATCCTGAGCCCCCAGTTCCTGTTCGGCAGCAAGGTGTACATCAAGCACCCCGCCGACATCCCCGACTACTTCAAGCTGAGCTTCCCCGAGGGCTTCAAGTGGGAGAGAGTGATGAACTTCGAGGACGGCGGCGTGGTGACCGTGACCCAGGACAGCAGCCTGCAGGACGGCGTGTTCATCTACAAGGTGAAGCTGAGAGGCACCAACTTCCCCAGCGACGGCCCCGTGATGCAGAAGAAGACCATGGGCTGGGAGGCCTTCAGCGAGAGAATGTACCCCGAGGACGGCGCCCTGAAGAGCGAGATCAAGACCAGACTGAAGCTGAAGGACGGCGGCCACTACGACGCCGAGGTGAAGACCACCTACAAGGCCAAGAAGCCCGTGCAGCTGCCCGGCGCCTACAACGTGAACATCAAGCTGGACATCGTGAGCCACAACGAGGACTACACCATCGTGGAGCAGTACGAGAGAGCCGAGGGCAGACACAGCACCGGCGGCATGGACGAGCTGTACAAGTAATCTAGAGTCGACCCAGGCATCAAA
扩增的EBFP2蛋白基因序列如下:(SEQ ID NO:24)
CCTCGAGAATTCACGCGTGGTACCAGCCACCATGGTGAGCAAGGGCGAGGAGAACAACGTGGCCATCATCAAGGAGTTCATGAGATTCAAGGTGCACATGGAGGGCAGCGTGAACGGCCACGAGTTCGAGATCGAGGGCGAGGGCGAGGGCAGACCCTACGAGGGCACCCAGACCGCCAAGCTGAAGGTGACCAAGGGCGGCCCCCTGCCCTTCGCCTGGGACATCCTGAGCCCCCAGTTCCTGTTCGGCAGCAAGGTGTACATCAAGCACCCCGCCGACATCCCCGACTACTTCAAGCTGAGCTTCCCCGAGGGCTTCAAGTGGGAGAGAGTGATGAACTTCGAGGACGGCGGCGTGGTGACCGTGACCCAGGACAGCAGCCTGCAGGACGGCGTGTTCATCTACAAGGTGAAGCTGAGAGGCACCAACTTCCCCAGCGACGGCCCCGTGATGCAGAAGAAGACCATGGGCTGGGAGGCCTTCAGCGAGAGAATGTACCCCGAGGACGGCGCCCTGAAGAGCGAGATCAAGACCAGACTGAAGCTGAAGGACGGCGGCCACTACGACGCCGAGGTGAAGACCACCTACAAGGCCAAGAAGCCCGTGCAGCTGCCCGGCGCCTACAACGTGAACATCAAGCTGGACATCGTGAGCCACAACGAGGACTACACCATCGTGGAGCAGTACGAGAGAGCCGAGGGCAGACACAGCACCGGCGGCATGGACGAGCTGTACAAGTAATCTAGAGTCGACCCAGGCATCAAA
扩增的mTagBFP2蛋白基因序列如下:(SEQ ID NO:25)
CCTCGAGAATTCACGCGTGGTACCAGCCACCATGAGCGAGCTGATTAAGGAGAACATGCACATGAAGCTGTACATGGAGGGCACCGTGGACAACCATCACTTCAAGTGCACATCCGAGGGCGAAGGCAAGCCCTACGAGGGCACCCAGACCATGAGAATCAAGGTGGTCGAGGGCGGCCCTCTCCCCTTCGCCTTCGACATCCTGGCTACTAGCTTCCTCTACGGCAGCAAGACCTTCATCAACCACACCCAGGGCATCCCCGACTTCTTCAAGCAGTCCTTCCCTGAGGGCTTCACATGGGAGAGAGTCACCACATACGAAGACGGGGGCGTGCTGACCGCTACCCAGGACACCAGCCTCCAGGACGGCTGCCTCATCTACAACGTCAAGATCAGAGGGGTGAACTTCACATCCAACGGCCCTGTGATGCAGAAGAAAACACTCGGCTGGGAGGCCTTCACCGAGACGCTGTACCCCGCTGACGGCGGCCTGGAAGGCAGAAACGACATGGCCCTGAAGCTCGTGGGCGGGAGCCATCTGATCGCAAACGCCAAGACCACATATAGATCCAAGAAACCCGCTAAGAACCTCAAGATGCCTGGCGTCTACTATGTGGACTACAGACTGGAAAGAATCAAGGAGGCCAACAACGAGACCTACGTCGAGCAGCACGAGGTGGCAGTGGCCAGATACTGCGACCTCCCTAGCAAACTGGGGCACAAGCTTAATTAATCTAGAGTCGACCCAGGCATCAAA
2.2.3表达mBlueberry2、EBFP2和mTagBFP2蛋白的pHybrid质粒的构建
首先对实施例1中获得的pHybrid-mRuby3/mScarlet质粒以KpnI/XbaI限制性核酸内切酶进行消化,以线性化载体的同时删除mRuby3片段。线性化的载体使用凝胶电泳进行纯化。
获得线性载体后,使用Plus One Step Cloning Kit(Novoprotein)按照制造商的说明,将2.2.2中得到的上述3个PCR产物分别与所得线性载体进行一步重组,由此分别得到表达mBlueberry2、EBFP2和mTagBFP2蛋白的pHybrid质粒,即pHybrid-mBlueberry2/mScarlet(mBlueberry2)、pHybrid-EBFP2/mScarlet(EBFP2)和pHybrid-mTagBFP2/mScarlet(mTagBFP2)。
2.2.4 mBlueberry2、EBFP2和mTagBFP2蛋白在TOP10大肠杆菌细胞中的表达
将2.2.3中得到的pHybrid质粒转化到TOP10大肠杆菌细胞中。具体而言,将TOP10大肠杆菌感受态细胞从-80℃中取出,在冰上解冻(约20-30分钟);从4℃冷藏箱中取出琼脂培养皿(含有抗生素氨苄西林),升温至室温,然后(可选)在37℃培养箱中孵育。将1-5μlpHybrid质粒DNA(通常为10pg-100ng)混合到微量离心管中的50μL感受态细胞中,将感受态细胞/DNA混合物在冰上孵育5分钟。接着,将混合物试管放入42℃水浴中热激转化管45秒,将管子放回冰上2分钟,向离心管中加入1ml LB培养基(不含抗生素)并在37℃振荡培养箱中培养45分钟后,在4500rpm下离心10分钟并弃去600μlLB上清液。使用剩余的LB培养基轻柔重悬细胞沉淀。最后,将50-100μl的含有细菌的LB培养基混悬液铺在含有抗生素氨苄西林的琼脂培养皿上,在37℃下孵育过夜。
在转化后进行单菌落培养,在具有氨苄抗性与添加鼠李糖的琼脂糖培养皿上画菌落划线后,在室温下进行蛋白质表达24小时,在双通道的立体显微镜下成像以验证靶基因的表达,培养皿上生长的单菌落被挑出进行桑格(Sanger)测序确认重组质粒是否构建成功。
图5为用pHybrid-mBlueberry2/mScarlet(mBlueberry2)、pHybrid-EBFP2/mScarlet(EBFP2)和pHybrid-mTagBFP2/mScarlet(mTagBFP2)表达载体转化的大肠杆菌在蓝色通道(顶部)和红色(底部)通道中的荧光图像(成像条件:蓝色荧光蛋白为403nm/456nm激发/发射,mScarlet为激发/发射561nm/594nm)。
图5表明目标基因的表达水平足以用于在荧光显微镜下筛选菌落,同时在大肠杆菌细胞中未观察到参照基因mScarlet的表达。
2.3 pHybrid质粒在HEK细胞中的表达
HEK293FT细胞(Invitrogen)用含10%胎牛血清(FBS)和1%青霉素/链霉素(PS)的杜氏改良培养基(Dulbecco’s Modified Eagle Medium,DMEM)于37℃/5%CO2培养箱中进行培养,在有Matrixgel(BD Biosciences,356235)涂层的24-玻璃底孔板(Cellvis,CatNo:P24-0-N)或35mm MatTek培养皿(MatTek Life Sciences,P35G-1.5-14-C)中以细胞密度为80-90%进行铺板(即细胞接种)。根据制造商的使用说明,使用Hieff Trans脂质体转染试剂(Yeasen Biotechnology,40802ES02)将前述得到的表达mBlueberry2、EBFP2和mTagBFP2蛋白的pHybrid质粒分别瞬时转染细胞,转染之后培养36小时进行成像。
图6为用pHybrid-mBluebery2/mScarlet(mBluebery2)、pHybrid-EBFP2/mScarlet(EBFP2)和pHybrid-mTagBFP2/mScarlet(mTagBFP2)表达载体转染的HEK293FT细胞在蓝色通道(顶部)、红色通道(中间)和叠加(底部)的荧光图像(成像条件:BFP为403nm激发,456nm发射;mScarlet为561nm激发,594nm发射,功率为0.91mW/mm2;标尺为50μm)。
图6表明从TOP10细胞纯化的质粒DNA可以使得靶基因和参照基因在HEK细胞中高效共表达。
虽然pHybrid在大肠杆菌和哺乳动物细胞中进行了测试,但我们相信其应用不限于这两种,它可用于在可以识别该载体中使用的启动子的任何菌株/细胞系中表达。
实施例3:pHybrid表达载体用于大规模基因文库的高通量筛选
在验证了pHybrid表达载体对单个蛋白质的表达后,我们将其用于大规模基因文库的高通量筛选。
3.1合成mRuby3的定点文库
mRuby3的定点文库被从头合成为gBlocks(EpochLifescience),简并位于以下氨基酸位置的密码子:67、68、71、84、147、162、176、178、201。
3.2生成pHybrid重组质粒文库
用引物通过PCR扩增gBlocks,并将其亚克隆到pHybrid表达载体中得到pHybrid重组质粒文库并扩增。具体操作如下。
3.2.1pHybrid载体的消化
将实施例1的pHybrid-mRuby3/mScarlet原始质粒使用KpnI和XbaI限制性核酸内切酶消化,使其线性化并除去mRuby3基因,使用凝胶电泳纯化所得线性载体。
3.2.2gBlocks的PCR扩增
gBlocks使用以下引物进行PCR扩增,其中正向引物具有KpnI酶识别位点GGTACC,反向引物具有XbaI酶识别位点TCTAGA,使用凝胶电泳收集PCR产物:
正向引物:CCTCGAGAATTCACGCGTGGTACC AGCCACCATGGTGTCTAAGGG(SEQ ID NO:26)
反向引物:SEQ ID NO:8。
PCR扩增产物的序列为(展示了限制性核酸内切酶识别位点,其中KpnI酶识别位点GGTACC,XbaI酶识别位点TCTAGA):
CCTCGAGAATTCACGCGTGGTACCAGCCACCATGGTGTCTAAGGGCGAAGAGCTGATCAAGGAAAATATGCGTATGAAGGTGGTCATGGAAGGTTCGGTCAACGGCCACCAATTCAAATGCACAGGTGAAGGAGAAGGCAGACCGTACGAGGGAGTGCAAACCATGAGGATCAAAGTCATCGAGGGAGGACCCCTGCCATTTGCCTTTGACATTCTTGCCACGTCGTTCMTGYWCGGCAGCARGACCTTTATCAAGTACCCGGCCGACATCCCTGATTTCTKSAAACAGTCCTTTCCTGAGGGTTTTACTTGGGAAAGAGTTACGAGATACGAAGATGGTGGAGTCGTCACCGTCACGCAGGACACCAGCCTTGAGGATGGCGAGCTCGTCTACAACGTCAAGGTCAGAGGGGTAAACTTTCCCTCCAATGGTCCCGTGATGCAGAAGAAGACCAAGGGTTGGGAGCCTWWCACAGAGATGATGTATCCAGCAGATGGTGGTCTGAGAGGATACAHCGACATCGCACTGAAAGTTGATGGTGGTGGCCATCTGCACKSCAACNTCGTGACAACTTACAGGTCAAAAAAGACCGTCGGGAACATCAAGATGCCCGGTGTCCATGCCGTTGATHWCCGCCTGGAAAGGATCGAGGAGAGTGACAATGAAACCTACGTAGTGCAAAGAGAAGTGGCAGTTGCCAAATACAGCAACCTTGGTGGTGGCATGGACGAGCTGTAGAAGTAATCTAGAGTCGACCCAGGCATC(SEQ ID NO:27)
上面序列中非AGCT的字母的含义如下:
3.2.3 pHybrid重组质粒文库的制备
将3.2.3的PCR扩增产物使用KpnI/XbaI限制性核酸内切酶暴露粘性末端后,使用T4连接酶(NEB)按照制造商的说明与3.2.1所得线性载体连接,从而将gBlock亚克隆到pHybrid表达载体中,得到重组质粒文库。
3.2.4 pHybrid重组质粒文库的扩增
将生成的重组质粒文库转化至大肠杆菌细胞中进行扩增。
3.3生成随机质粒文库
将在3.2得到的重组质粒文库进行易错PCR以生成由约106-107个独立克隆组成的随机文库,其中使用GeneMorph II随机突变试剂盒(Stratagene)在能够使得每1000个碱基对高达15个突变的突变频率条件下进行随机突变。
然后,除了使用所得随机文库代替gBlocks以外,重复3.2的过程,得到pHybrid随机质粒文库。
3.4:转化
将3.3得到的pHybrid随机质粒文库电穿孔到TOP10大肠杆菌宿主细胞(Biomed)中。然后将TOP10大肠杆菌宿主细胞在含有氨苄青霉素和0.02%(w/v)L-鼠李糖(生工生物工程(上海)股份有限公司(Sangon Biotech(Shanghai)Co.,Ltd.))的LB(生工生物工程(上海)股份有限公司(Sangon Biotech(Shanghai)Co.,Ltd.))中在37℃培养过夜。由此将生成的pHybrid随机质粒文库表达在TOP10大肠杆菌宿主细胞中。
将连续稀释(10-4和10-5)的电穿孔细胞接种在含氨苄西林的琼脂培养基上,以评估电穿孔和克隆效率。每个文库随机选择20个克隆进行测序,以评估含有目标基因的克隆的比例和突变率。
3.5:荧光变体筛选
首先使用荧光激活细胞分选仪(FACS)进行筛选,然后使用荧光立体显微镜在培养皿(Petri dish)上选择蓝色荧光菌落,最后进行体外亮度和细胞内亮度筛选以分选出最佳克隆。这里,分选出的最佳克隆的数目可以调整,可以减少或增加,因此本发明对此不做特别限定。
具体操作如下:
3.5.1 FACS筛选
在FACS之前,TOP10大肠杆菌宿主细胞用磷酸盐缓冲液(PBS)洗涤,然后用PBS稀释至600nm处的光密度为0.02。使用BD FACS Melody细胞分选仪(BD Biosciences)蓝色通道(激发405nm,发射448/45nm)进行FACS筛选。FACS分类的细胞数量是获得文库中独立克隆数量的约10倍,在其中分选出高荧光的细菌细胞。这里,分选出的高荧光的细菌细胞可能有成千上万种,因此对其不做限定。
3.5.2荧光立体显微镜筛选
将3.5.1分选出的高荧光细菌细胞在于37℃的富SOC培养基中培养1小时,然后接种到补充有含氨苄西林(Amp+)(0.1mg/ml)和L-鼠李糖(0.02%w/v)的LB琼脂板上。在配备有SPECTRAIII光引擎(Lumencor)和彩色CCD相机(BGIMAGING)的Olympus SZX16立体显微镜下分析菌落,选择在蓝色通道(激发390/22nm;发射420nm)中具有最高荧光的约100个克隆大肠杆菌菌落。这里,分选出的最亮克隆的数目可以调整,可以减少或增加,因此本发明不限于此。
3.5.3体外亮度和细胞内亮度筛选
将3.5.2分选出的菌落细胞在具有用于质粒提取的4ml LB氨苄西林和用于蛋白质表达的LB氨苄西林/鼠李糖的平行的24深孔板(Invitrogen,CS15124)中分别生长(在37℃和200rpm下过夜)。
使用B-PERTM(ThermoFischer Scientific,78248)进行总蛋白提取。简而言之,在-80℃下进行3个循环的细菌细胞沉淀冷冻和解冻,然后与B-PERTM一起孵育。
使用VarioSkanTM Lux多模式酶标仪(ThermoFischer Scientific)测量提取的蛋白质的吸收光谱,范围分别为350nm至500nm,步长为1nm;对于蛋白质发射光谱的测量,测量范围为420nm至500nm,步长为1nm。
对于每种变体,将积分发射强度对400nm处的相应吸光度进行标准化,以计算相对亮度(有时也称为标准化发射强度或体外亮度)。
此外,还将筛选的变体在HEK细胞中表达以测定细胞内亮度。HEK细胞内的蛋白表达与2.3所述方法相同。在由NIS Elements软件控制的配备有Spectra III光引擎(LumenCore)、ORCA-Flash 4.0V3 sCMOS摄像头(Hamamatsu)和20×/0.75物镜的尼康Ti2-E宽视野显微镜下使用BFP(激发390/22nm,发射457/50nm)、GFP(激发475/28nm,发射535/46nm)、RFP(激发555/28nm,594/40nm)通道进行细胞内亮度测量。
对于每种变体,将蓝色荧光强度对红色荧光强度进行标准化,以计算标准化细胞内亮度(或称为标准化的蓝-红荧光比)。由于本发明的载体带有参照红色荧光蛋白mScarlet基因,因此在HEK细胞内同时具有蓝色荧光蛋白变体和参照红色荧光蛋白mScarlet,可以确保在相同的环境条件下得到蓝色荧光强度对红色荧光强度,消除环境条件对于荧光强度的影响,从而确保结果更加可靠。
根据它们的标准化发射强度,将所选变体基于体外亮度从高到低进行排序,并与标准化的在HEK细胞内的蓝-红荧光比相关联。例如,以体外亮度为横坐标,以细胞内蓝-红荧光比为纵坐标进行皮尔逊相关分析。
选择体外亮度和细胞内亮度都较高的变体作为最佳克隆。例如,在皮尔逊相关分析图中选择落入右上方范围内的变体(大约对应于体外亮度与标准化的蓝-红荧光比的乘积较高的变体)作为最佳克隆。
分选出约10个最亮克隆。这里,分选出的最亮克隆的数目可以调整,可以减少或增加,因此本发明不限于此。
3.6:重复定向进化和最终筛选
使用3.5分选出的约10个最佳克隆重复进行如上3.2至3.5的定向进化,共进行两轮。这里,定向进化的轮次可以调整,可以减少或增加,因此本发明不限于此。
在存在下轮进化时,从上轮中选择约10个最佳克隆进行进一步进化。
在最后一轮筛选中,最终筛选出67个独特变体,并测量了这些变体在HEK细胞内的光稳定性(即光漂白半衰期)。在由NIS Elements软件控制的配备有Spectra III光引擎(LumenCore)、ORCA-Flash 4.0V3 sCMOS摄像头(Hamamatsu)和20×/0.75物镜的尼康Ti2-E宽视野显微镜下使用BFP(激发390/22nm,发射457/50nm)、GFP(激发475/28nm,发射535/46nm)、RFP(激发555/28nm,594/40nm)通道进行光稳定性测量。在HEK细胞在4.25mW/mm2的光功率下,在连续宽场照明下进行细胞内光稳定性测量。
然后,根据细胞内标准化亮度(即细胞内蓝红荧光比)和光稳定性的乘积选择了7个乘积结果最大的变体,确认观察到的改善在统计学上是显著的。两个表现最好的变体分别被相应地命名为Electra1和Electra2。编码这两种新荧光蛋白的基因已存放在GenBank中(登录号:Electra1为OL631606,Electra2为OL631607)。Electra1和Electra2的荧光光谱非常相似,激发最大值分别为402和403nm,发射光谱相同,最大值为456nm。与其他选定克隆相比,两个变种的得分至少高出30%。
7个变异体的氨基酸序列如下:
Electra1(SEQ ID NO:28)
MVSKGEELIEENMRMKVVMEGSVNGHQFKCTGEGEGRPYEGVQTMRIKVIEGGPLPFAFDILATSFLFGSKTFIKYPADIPDFFKQSFPEGFTWERVTRYEDGGVVTVTQDTSLEDGGLVYNVKVRGVNFPSNGPVMQKKTEGWEPFTEMMYPANGGLRGYTDIALKVDGDGHLHANIVTTYRSKKTVGDIKMPGVHAVDYRLERVEESDNETYVVLREVAVAKYSNLGGGMDELYK
Electra2(SEQ ID NO:29)
MVSKGEELIEENMRMKVVMEGSVNGHQFKCTGEGEGRPYEGVQTMRIKVIEGGPLPFAFDILATSFLFGSKTFIKYPADIPDFFEQSFPEGFTWERVTRYEDGGVVTVTQDTSLEDGGLVYNVKVRGVNFHSKGPVMQKKTEGWEPFTEMMYPADGGLRGYTDIALKVDGGGHLHANIVTTYRSKKTVGNIKMPGVHAVDYRLERIEESDNETYVVLREVAVAKYSNLGGGMDELFK
Mutant1(SEQ ID NO:30)
MVSKGEELIEENMRMKVVMEGSVNGHQFKCTGEGEGRPYEGVQIMRIKVIEGGPLPFAFDILATSFLFGSKTFIKYPADIPDFFKQSFPEGFTWERVTRYEDGGVVTVTQDTSLVDGGLVYNVKVRGVNFPSDGPVMQKKTEGWEPFTEMMYPADGGLRGYTDIALKVDGGGHLHANIVTTYRSKKTVGNIKMPGVHAVDYRLERIEESDNETYVVLREVAVAKYSNLGGGMDELYK
Mutant2(SEQ ID NO:31)
MVSKGEELIKENMRMKVVMEGSVNGHQFKCTGEGEGRPYEGVQTMRIKVVEGGPLPFAFDILATSFLYGSKTFIKYPADIPDFFKQSFPVGFTWERVTSYEDGGVVTVTQDTSLEDGGLVYNVKVRGVNFPSNGPVMQKKTEGWEPFAEMMYPADGGLRGYTDIALKVDGGGHQHANIVTTYRSKKTVRNIKMPGVHAVDYCLERIEESGNETYVVLREVAVAKYSNLGGGMDELYK
Mutant3(SEQ ID NO:32)
MVSKGEELIEENMRMKVVMEGSVNGHQFKCTGEGEGRPYEGVQTMRIKVIEGGPLPFAFDILATSFLFGSKTFIKYPADIPDFFKQSFPEGFTWERVTRYEDGGVVTVSQDTSLEDGGLVYNVKVGGVNFPSNGPVMQKKTEGWEPFTEMMYPADGGLRGYTDIALKVDGGGHLHANIVTTYRSKKTVGNIKMPGVHAVDYRLERIAESDNETYVVLREVAVAKYSNLGGGMDELYK
Mutant4(SEQ ID NO:33)
MVSKGEELIEENMRMKVVMEGSVNGHQFKCTGEGEGRPYEGVQTMRIKVIEGGPLPFAFDILATSFLFGSKTFIKYPADIPDFFKQSFPEGFTWERVTRYEDGGVVTVSQDTSLEDGGLVYNVKVGGVNFPSNGPVMQKKTEGWEPFTEMMYPADGGLRGYTDIALKVDGGGHLHANIVTTYRSKKTVGNIKMPGVHAVDYRLERIAESDNETYVVLREVAVAKYSNLGGGMDELYK
Mutant5(SEQ ID NO:34)
MVSKGEELIEENMRMKVVMEGSVNGHQFKCTGEGEGRPYEGVQTMRIKVIEGGPLPFAFDILATSFLFGSKTFIKYPADIPDFFKQSFPEGFTWERVTRYEDGGVVTVSQDTSLEDGGLVYNVKVGGVNFPSNGPVMQKKTEGWEPFTEMMYPADGGLRGYTDIALKVDGGGHLHANIVTTYRSKKTVGNIKMPGVHAVDYRLERIAESDNETYVVLREVAVAKYSNLGGGMDELYK
亲本蛋白mRuby3和mTagBFP2的氨基酸序列
mRuby3(SEQ ID NO:35)
MVSKGEELIKENMRMKVVMEGSVNGHQFKCTGEGEGRPYEGVQTMRIKVIEGGPLPFAFDILATSFMYGSRTFIKYPADIPDFFKQSFPEGFTWERVTRYEDGGVVTVTQDTSLEDGELVYNVKVRGVNFPSNGPVMQKKTKGWEPNTEMMYPADGGLRGYTDIALKVDGGGHLHCNFVTTYRSKKTVGNIKMPGVHAVDHRLERIEESDNETYVVQREVAVAKYSNLGGGMDELYK
mTagBFP2(SEQ ID NO:36)
MVSKGEELIKENMHMKLYMEGTVDNHHFKCTSEGEGKPYEGTQTMRIKVVEGGPLPFAFDILATSFLYGSKTFINHTQGIPDFFKQSFPEGFTWERVTTYEDGGVLTATQDTSLQDGCLIYNVKIRGVNFTSNGPVMQKKTLGWEAFTETLYPADGGLEGRNDMALKLVGGSHLIANAKTTYRSKKPAKNLKMPGVYYVDYRLERIKEANNETYVEQHEVAVARYCDLPSKLGHKLN
与亲本mRuby3蛋白相比,Electra1和Electra2具有下面的共同突变K10E/M67L/Y68F/R71K/E118G/K142E/N147F/C176A/F178I/H201Y/Q217L以及下面的独特突变:D155N/G171D/N190D/I206V和K85E/P131H/N133K/Y236F(基于mRuby3序列的编号)。
这些结果确认pHybrid系统可用于在细菌和哺乳动物细胞中进行分级筛选。
SEQUENCE LISTING
<110> 西湖大学
<120> 一种表达载体及其构建方法和应用
<130> DI22-0314-XC91
<160> 36
<170> PatentIn version 3.5
<210> 1
<211> 43
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 1
ccgtcagatc actagaagct tcaccacaat tcagcaaatt gtg 43
<210> 2
<211> 51
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 2
ggttaattcc tcctgttagc caaaaacggg ttacgaccag tctaaaaagc g 51
<210> 3
<211> 171
<212> DNA
<213> 人工序列
<220>
<223> 扩增的rhaB启动子序列
<400> 3
ccgtcagatc actagaagct tcaccacaat tcagcaaatt gtgaacatca tcacgttcat 60
ctttccctgg ttgccaatgg cccattttcc tgtcagtaac gagaaggtcg cgaattcagg 120
cgctttttag actggtcgta acccgttttt ggctaacagg aggaattaac c 171
<210> 4
<211> 41
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 4
tctagagtcg acccaggcat caaataaaac gaaaggctca g 41
<210> 5
<211> 59
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 5
catcaatgta tcttatcatg tctgctcgaa gcggccgcat ttgtcctact caggagagc 59
<210> 6
<211> 145
<212> DNA
<213> 人工序列
<220>
<223> 扩增的rrnB T1终止子序列
<400> 6
tctagagtcg acccaggcat caaataaaac gaaaggctca gtcgaaagac tgggcctttc 60
gttttatctg ttgtttgtcg gtgaacgctc tcctgagtag gacaaatgcg gccgcttcga 120
gcagacatga taagatacat tgatg 145
<210> 7
<211> 91
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 7
caggaggaat taaccatggg gagccaccat caccatcacc atgctagcct cgagaattca 60
cgcgtggtac cagccaccat ggtgtctaag g 91
<210> 8
<211> 42
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 8
gatgcctggg tcgactctag attacttgta cagctcgtcc at 42
<210> 9
<211> 813
<212> DNA
<213> 人工序列
<220>
<223> 扩增的rmRuby3 基因序列
<400> 9
caggaggaat taaccatggg gagccaccat caccatcacc atgctagcct cgagaattca 60
cgcgtggtac cagccaccat ggtgtctaag ggcgaagagc tgatcaagga aaatatgcgt 120
atgaaggtgg tcatggaagg ttcggtcaac ggccaccaat tcaaatgcac aggtgaagga 180
gaaggcagac cgtacgaggg agtgcaaacc atgaggatca aagtcatcga gggaggaccc 240
ctgccatttg cctttgacat tcttgccacg tcgttcatgt atggcagccg tacctttatc 300
aagtacccgg ccgacatccc tgatttcttt aaacagtcct ttcctgaggg ttttacttgg 360
gaaagagtta cgagatacga agatggtgga gtcgtcaccg tcacgcagga caccagcctt 420
gaggatggcg agctcgtcta caacgtcaag gtcagagggg taaactttcc ctccaatggt 480
cccgtgatgc agaagaagac caagggttgg gagcctaata cagagatgat gtatccagca 540
gatggtggtc tgagaggata cactgacatc gcactgaaag ttgatggtgg tggccatctg 600
cactgcaact tcgtgacaac ttacaggtca aaaaagaccg tcgggaacat caagatgccc 660
ggtgtccatg ccgttgatca ccgcctggaa aggatcgagg agagtgacaa tgaaacctac 720
gtagtgcaaa gagaagtggc agttgccaaa tacagcaacc ttggtggtgg catggacgag 780
ctgtacaagt aatctagagt cgacccaggc atc 813
<210> 10
<211> 64
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 10
ccattataag ctgcaataaa caaacaagtt aacaacaaca attgggtgtg gaaagtcccc 60
aggc 64
<210> 11
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 11
ctgcctcgcc cttgctcacc atggtggctt tgcaaaagcc taggcctcca 50
<210> 12
<211> 294
<212> DNA
<213> 人工序列
<220>
<223> 扩增的SV40启动子
<400> 12
acaagttaac aacaacaatt gggtgtggaa agtccccagg ctccccagca ggcagaagta 60
tgcaaagcat gcatctcaat tagtcagcaa ccatagtccc gcccctaact ccgcccatcc 120
cgcccctaac tccgcccagt tccgcccatt ctccgcccca tggctgacta atttttttta 180
tttatgcaga ggccgaggcc gcctcggcct ctgagctatt ccagaagtag tgaggaggct 240
tttttggagg cctaggcttt tgcaaagcca ccatggtgag caagggcgag gcag 294
<210> 13
<211> 48
<212> DNA
<213> 人工序列
<220>
<223> HSV-TK poly(A)尾序列
<400> 13
gaacaaacga cccaacaccg tgcgttttat tctgtctttt tattgccg 48
<210> 14
<211> 31
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 14
atggtgagca agggcgaggc agtgatcaag g 31
<210> 15
<211> 94
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 15
gctattacgc cagcccggat ccgaacaaac gacccaacac cgtgcgtttt attctgtctt 60
tttattgccg gtcacttgta cagctcgtcc atgc 94
<210> 16
<211> 770
<212> DNA
<213> 人工序列
<220>
<223> 扩增的mScarlet基因序列
<400> 16
atggtgagca agggcgaggc agtgatcaag gagttcatgc ggttcaaggt gcacatggag 60
ggctccatga acggccacga gttcgagatc gagggcgagg gcgagggccg cccctacgag 120
ggcacccaga ccgccaagct gaaggtgacc aagggtggcc ccctgccctt ctcctgggac 180
atcctgtccc ctcagttcat gtacggctcc agggccttca tcaagcaccc cgccgacatc 240
cccgactact ataagcagtc cttccccgag ggcttcaagt gggagcgcgt gatgaacttc 300
gaggacggcg gcgccgtgac cgtgacccag gacacctccc tggaggacgg caccctgatc 360
tacaaggtga agctccgcgg caccaacttc cctcctgacg gccccgtaat gcagaagaag 420
acaatgggct gggaagcgtc caccgagcgg ttgtaccccg aggacggcgt gctgaagggc 480
gacattaaga tggccctgcg cctgaaggac ggcggccgct acctggcgga cttcaagacc 540
acctacaagg ccaagaagcc cgtgcagatg cccggcgcct acaacgtcga ccgcaagttg 600
gacatcacct cccacaacga ggactacacc gtggtggaac agtacgaacg ctccgagggc 660
cgccactcca ccggcggcat ggacgagctg tacaagtgac cggcaataaa aagacagaat 720
aaaacgcacg gtgttgggtc gtttgttcgg atccgggctg gcgtaatagc 770
<210> 17
<211> 48
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 17
cgcgggcccg ggatccaccg gtcgccacca tggtgagcaa gggcgagg 48
<210> 18
<211> 52
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 18
ggctgattat gatctagagt cgcgcccctt tacttgtacc tcgtctccat gc 52
<210> 19
<211> 44
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 19
cctcgagaat tcacgcgtgg taccagccac catggtgagc aagg 44
<210> 20
<211> 48
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 20
tttgatgcct gggtcgactc tagattactt gtacagctcg tccatgcc 48
<210> 21
<211> 50
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 21
cctcgagaat tcacgcgtgg taccagccac catgagcgag ctgattaagg 50
<210> 22
<211> 55
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 22
tttgatgcct gggtcgactc tagattaatt aagcttgtgc cccagtttgc taggg 55
<210> 23
<211> 766
<212> DNA
<213> 人工序列
<220>
<223> 扩增的mBlueberry2蛋白基因序列
<400> 23
cctcgagaat tcacgcgtgg taccagccac catggtgagc aagggcgagg agaacaacgt 60
ggccatcatc aaggagttca tgagattcaa ggtgcacatg gagggcagcg tgaacggcca 120
cgagttcgag atcgagggcg agggcgaggg cagaccctac gagggcaccc agaccgccaa 180
gctgaaggtg accaagggcg gccccctgcc cttcgcctgg gacatcctga gcccccagtt 240
cctgttcggc agcaaggtgt acatcaagca ccccgccgac atccccgact acttcaagct 300
gagcttcccc gagggcttca agtgggagag agtgatgaac ttcgaggacg gcggcgtggt 360
gaccgtgacc caggacagca gcctgcagga cggcgtgttc atctacaagg tgaagctgag 420
aggcaccaac ttccccagcg acggccccgt gatgcagaag aagaccatgg gctgggaggc 480
cttcagcgag agaatgtacc ccgaggacgg cgccctgaag agcgagatca agaccagact 540
gaagctgaag gacggcggcc actacgacgc cgaggtgaag accacctaca aggccaagaa 600
gcccgtgcag ctgcccggcg cctacaacgt gaacatcaag ctggacatcg tgagccacaa 660
cgaggactac accatcgtgg agcagtacga gagagccgag ggcagacaca gcaccggcgg 720
catggacgag ctgtacaagt aatctagagt cgacccaggc atcaaa 766
<210> 24
<211> 766
<212> DNA
<213> 人工序列
<220>
<223> 扩增的EBFP2蛋白基因序列
<400> 24
cctcgagaat tcacgcgtgg taccagccac catggtgagc aagggcgagg agaacaacgt 60
ggccatcatc aaggagttca tgagattcaa ggtgcacatg gagggcagcg tgaacggcca 120
cgagttcgag atcgagggcg agggcgaggg cagaccctac gagggcaccc agaccgccaa 180
gctgaaggtg accaagggcg gccccctgcc cttcgcctgg gacatcctga gcccccagtt 240
cctgttcggc agcaaggtgt acatcaagca ccccgccgac atccccgact acttcaagct 300
gagcttcccc gagggcttca agtgggagag agtgatgaac ttcgaggacg gcggcgtggt 360
gaccgtgacc caggacagca gcctgcagga cggcgtgttc atctacaagg tgaagctgag 420
aggcaccaac ttccccagcg acggccccgt gatgcagaag aagaccatgg gctgggaggc 480
cttcagcgag agaatgtacc ccgaggacgg cgccctgaag agcgagatca agaccagact 540
gaagctgaag gacggcggcc actacgacgc cgaggtgaag accacctaca aggccaagaa 600
gcccgtgcag ctgcccggcg cctacaacgt gaacatcaag ctggacatcg tgagccacaa 660
cgaggactac accatcgtgg agcagtacga gagagccgag ggcagacaca gcaccggcgg 720
catggacgag ctgtacaagt aatctagagt cgacccaggc atcaaa 766
<210> 25
<211> 757
<212> DNA
<213> 人工序列
<220>
<223> 扩增的mTagBFP2蛋白基因序列
<400> 25
cctcgagaat tcacgcgtgg taccagccac catgagcgag ctgattaagg agaacatgca 60
catgaagctg tacatggagg gcaccgtgga caaccatcac ttcaagtgca catccgaggg 120
cgaaggcaag ccctacgagg gcacccagac catgagaatc aaggtggtcg agggcggccc 180
tctccccttc gccttcgaca tcctggctac tagcttcctc tacggcagca agaccttcat 240
caaccacacc cagggcatcc ccgacttctt caagcagtcc ttccctgagg gcttcacatg 300
ggagagagtc accacatacg aagacggggg cgtgctgacc gctacccagg acaccagcct 360
ccaggacggc tgcctcatct acaacgtcaa gatcagaggg gtgaacttca catccaacgg 420
ccctgtgatg cagaagaaaa cactcggctg ggaggccttc accgagacgc tgtaccccgc 480
tgacggcggc ctggaaggca gaaacgacat ggccctgaag ctcgtgggcg ggagccatct 540
gatcgcaaac gccaagacca catatagatc caagaaaccc gctaagaacc tcaagatgcc 600
tggcgtctac tatgtggact acagactgga aagaatcaag gaggccaaca acgagaccta 660
cgtcgagcag cacgaggtgg cagtggccag atactgcgac ctccctagca aactggggca 720
caagcttaat taatctagag tcgacccagg catcaaa 757
<210> 26
<211> 45
<212> DNA
<213> 人工序列
<220>
<223> 引物
<400> 26
cctcgagaat tcacgcgtgg taccagccac catggtgtct aaggg 45
<210> 27
<211> 766
<212> DNA
<213> 人工序列
<220>
<223> PCR扩增产物的序列
<220>
<221> misc_feature
<222> (563)..(563)
<223> n 是 a, c, g, 或 t
<400> 27
cctcgagaat tcacgcgtgg taccagccac catggtgtct aagggcgaag agctgatcaa 60
ggaaaatatg cgtatgaagg tggtcatgga aggttcggtc aacggccacc aattcaaatg 120
cacaggtgaa ggagaaggca gaccgtacga gggagtgcaa accatgagga tcaaagtcat 180
cgagggagga cccctgccat ttgcctttga cattcttgcc acgtcgttcm tgywcggcag 240
cargaccttt atcaagtacc cggccgacat ccctgatttc tksaaacagt cctttcctga 300
gggttttact tgggaaagag ttacgagata cgaagatggt ggagtcgtca ccgtcacgca 360
ggacaccagc cttgaggatg gcgagctcgt ctacaacgtc aaggtcagag gggtaaactt 420
tccctccaat ggtcccgtga tgcagaagaa gaccaagggt tgggagcctw wcacagagat 480
gatgtatcca gcagatggtg gtctgagagg atacahcgac atcgcactga aagttgatgg 540
tggtggccat ctgcacksca acntcgtgac aacttacagg tcaaaaaaga ccgtcgggaa 600
catcaagatg cccggtgtcc atgccgttga thwccgcctg gaaaggatcg aggagagtga 660
caatgaaacc tacgtagtgc aaagagaagt ggcagttgcc aaatacagca accttggtgg 720
tggcatggac gagctgtaga agtaatctag agtcgaccca ggcatc 766
<210> 28
<211> 237
<212> PRT
<213> 人工序列
<220>
<223> Electra1
<400> 28
Met Val Ser Lys Gly Glu Glu Leu Ile Glu Glu Asn Met Arg Met Lys
1 5 10 15
Val Val Met Glu Gly Ser Val Asn Gly His Gln Phe Lys Cys Thr Gly
20 25 30
Glu Gly Glu Gly Arg Pro Tyr Glu Gly Val Gln Thr Met Arg Ile Lys
35 40 45
Val Ile Glu Gly Gly Pro Leu Pro Phe Ala Phe Asp Ile Leu Ala Thr
50 55 60
Ser Phe Leu Phe Gly Ser Lys Thr Phe Ile Lys Tyr Pro Ala Asp Ile
65 70 75 80
Pro Asp Phe Phe Lys Gln Ser Phe Pro Glu Gly Phe Thr Trp Glu Arg
85 90 95
Val Thr Arg Tyr Glu Asp Gly Gly Val Val Thr Val Thr Gln Asp Thr
100 105 110
Ser Leu Glu Asp Gly Gly Leu Val Tyr Asn Val Lys Val Arg Gly Val
115 120 125
Asn Phe Pro Ser Asn Gly Pro Val Met Gln Lys Lys Thr Glu Gly Trp
130 135 140
Glu Pro Phe Thr Glu Met Met Tyr Pro Ala Asn Gly Gly Leu Arg Gly
145 150 155 160
Tyr Thr Asp Ile Ala Leu Lys Val Asp Gly Asp Gly His Leu His Ala
165 170 175
Asn Ile Val Thr Thr Tyr Arg Ser Lys Lys Thr Val Gly Asp Ile Lys
180 185 190
Met Pro Gly Val His Ala Val Asp Tyr Arg Leu Glu Arg Val Glu Glu
195 200 205
Ser Asp Asn Glu Thr Tyr Val Val Leu Arg Glu Val Ala Val Ala Lys
210 215 220
Tyr Ser Asn Leu Gly Gly Gly Met Asp Glu Leu Tyr Lys
225 230 235
<210> 29
<211> 237
<212> PRT
<213> 人工序列
<220>
<223> Electra2
<400> 29
Met Val Ser Lys Gly Glu Glu Leu Ile Glu Glu Asn Met Arg Met Lys
1 5 10 15
Val Val Met Glu Gly Ser Val Asn Gly His Gln Phe Lys Cys Thr Gly
20 25 30
Glu Gly Glu Gly Arg Pro Tyr Glu Gly Val Gln Thr Met Arg Ile Lys
35 40 45
Val Ile Glu Gly Gly Pro Leu Pro Phe Ala Phe Asp Ile Leu Ala Thr
50 55 60
Ser Phe Leu Phe Gly Ser Lys Thr Phe Ile Lys Tyr Pro Ala Asp Ile
65 70 75 80
Pro Asp Phe Phe Glu Gln Ser Phe Pro Glu Gly Phe Thr Trp Glu Arg
85 90 95
Val Thr Arg Tyr Glu Asp Gly Gly Val Val Thr Val Thr Gln Asp Thr
100 105 110
Ser Leu Glu Asp Gly Gly Leu Val Tyr Asn Val Lys Val Arg Gly Val
115 120 125
Asn Phe His Ser Lys Gly Pro Val Met Gln Lys Lys Thr Glu Gly Trp
130 135 140
Glu Pro Phe Thr Glu Met Met Tyr Pro Ala Asp Gly Gly Leu Arg Gly
145 150 155 160
Tyr Thr Asp Ile Ala Leu Lys Val Asp Gly Gly Gly His Leu His Ala
165 170 175
Asn Ile Val Thr Thr Tyr Arg Ser Lys Lys Thr Val Gly Asn Ile Lys
180 185 190
Met Pro Gly Val His Ala Val Asp Tyr Arg Leu Glu Arg Ile Glu Glu
195 200 205
Ser Asp Asn Glu Thr Tyr Val Val Leu Arg Glu Val Ala Val Ala Lys
210 215 220
Tyr Ser Asn Leu Gly Gly Gly Met Asp Glu Leu Phe Lys
225 230 235
<210> 30
<211> 237
<212> PRT
<213> 人工序列
<220>
<223> Mutant1
<400> 30
Met Val Ser Lys Gly Glu Glu Leu Ile Glu Glu Asn Met Arg Met Lys
1 5 10 15
Val Val Met Glu Gly Ser Val Asn Gly His Gln Phe Lys Cys Thr Gly
20 25 30
Glu Gly Glu Gly Arg Pro Tyr Glu Gly Val Gln Ile Met Arg Ile Lys
35 40 45
Val Ile Glu Gly Gly Pro Leu Pro Phe Ala Phe Asp Ile Leu Ala Thr
50 55 60
Ser Phe Leu Phe Gly Ser Lys Thr Phe Ile Lys Tyr Pro Ala Asp Ile
65 70 75 80
Pro Asp Phe Phe Lys Gln Ser Phe Pro Glu Gly Phe Thr Trp Glu Arg
85 90 95
Val Thr Arg Tyr Glu Asp Gly Gly Val Val Thr Val Thr Gln Asp Thr
100 105 110
Ser Leu Val Asp Gly Gly Leu Val Tyr Asn Val Lys Val Arg Gly Val
115 120 125
Asn Phe Pro Ser Asp Gly Pro Val Met Gln Lys Lys Thr Glu Gly Trp
130 135 140
Glu Pro Phe Thr Glu Met Met Tyr Pro Ala Asp Gly Gly Leu Arg Gly
145 150 155 160
Tyr Thr Asp Ile Ala Leu Lys Val Asp Gly Gly Gly His Leu His Ala
165 170 175
Asn Ile Val Thr Thr Tyr Arg Ser Lys Lys Thr Val Gly Asn Ile Lys
180 185 190
Met Pro Gly Val His Ala Val Asp Tyr Arg Leu Glu Arg Ile Glu Glu
195 200 205
Ser Asp Asn Glu Thr Tyr Val Val Leu Arg Glu Val Ala Val Ala Lys
210 215 220
Tyr Ser Asn Leu Gly Gly Gly Met Asp Glu Leu Tyr Lys
225 230 235
<210> 31
<211> 237
<212> PRT
<213> 人工序列
<220>
<223> Mutant2
<400> 31
Met Val Ser Lys Gly Glu Glu Leu Ile Lys Glu Asn Met Arg Met Lys
1 5 10 15
Val Val Met Glu Gly Ser Val Asn Gly His Gln Phe Lys Cys Thr Gly
20 25 30
Glu Gly Glu Gly Arg Pro Tyr Glu Gly Val Gln Thr Met Arg Ile Lys
35 40 45
Val Val Glu Gly Gly Pro Leu Pro Phe Ala Phe Asp Ile Leu Ala Thr
50 55 60
Ser Phe Leu Tyr Gly Ser Lys Thr Phe Ile Lys Tyr Pro Ala Asp Ile
65 70 75 80
Pro Asp Phe Phe Lys Gln Ser Phe Pro Val Gly Phe Thr Trp Glu Arg
85 90 95
Val Thr Ser Tyr Glu Asp Gly Gly Val Val Thr Val Thr Gln Asp Thr
100 105 110
Ser Leu Glu Asp Gly Gly Leu Val Tyr Asn Val Lys Val Arg Gly Val
115 120 125
Asn Phe Pro Ser Asn Gly Pro Val Met Gln Lys Lys Thr Glu Gly Trp
130 135 140
Glu Pro Phe Ala Glu Met Met Tyr Pro Ala Asp Gly Gly Leu Arg Gly
145 150 155 160
Tyr Thr Asp Ile Ala Leu Lys Val Asp Gly Gly Gly His Gln His Ala
165 170 175
Asn Ile Val Thr Thr Tyr Arg Ser Lys Lys Thr Val Arg Asn Ile Lys
180 185 190
Met Pro Gly Val His Ala Val Asp Tyr Cys Leu Glu Arg Ile Glu Glu
195 200 205
Ser Gly Asn Glu Thr Tyr Val Val Leu Arg Glu Val Ala Val Ala Lys
210 215 220
Tyr Ser Asn Leu Gly Gly Gly Met Asp Glu Leu Tyr Lys
225 230 235
<210> 32
<211> 237
<212> PRT
<213> 人工序列
<220>
<223> Mutant3
<400> 32
Met Val Ser Lys Gly Glu Glu Leu Ile Glu Glu Asn Met Arg Met Lys
1 5 10 15
Val Val Met Glu Gly Ser Val Asn Gly His Gln Phe Lys Cys Thr Gly
20 25 30
Glu Gly Glu Gly Arg Pro Tyr Glu Gly Val Gln Thr Met Arg Ile Lys
35 40 45
Val Ile Glu Gly Gly Pro Leu Pro Phe Ala Phe Asp Ile Leu Ala Thr
50 55 60
Ser Phe Leu Phe Gly Ser Lys Thr Phe Ile Lys Tyr Pro Ala Asp Ile
65 70 75 80
Pro Asp Phe Phe Lys Gln Ser Phe Pro Glu Gly Phe Thr Trp Glu Arg
85 90 95
Val Thr Arg Tyr Glu Asp Gly Gly Val Val Thr Val Ser Gln Asp Thr
100 105 110
Ser Leu Glu Asp Gly Gly Leu Val Tyr Asn Val Lys Val Gly Gly Val
115 120 125
Asn Phe Pro Ser Asn Gly Pro Val Met Gln Lys Lys Thr Glu Gly Trp
130 135 140
Glu Pro Phe Thr Glu Met Met Tyr Pro Ala Asp Gly Gly Leu Arg Gly
145 150 155 160
Tyr Thr Asp Ile Ala Leu Lys Val Asp Gly Gly Gly His Leu His Ala
165 170 175
Asn Ile Val Thr Thr Tyr Arg Ser Lys Lys Thr Val Gly Asn Ile Lys
180 185 190
Met Pro Gly Val His Ala Val Asp Tyr Arg Leu Glu Arg Ile Ala Glu
195 200 205
Ser Asp Asn Glu Thr Tyr Val Val Leu Arg Glu Val Ala Val Ala Lys
210 215 220
Tyr Ser Asn Leu Gly Gly Gly Met Asp Glu Leu Tyr Lys
225 230 235
<210> 33
<211> 237
<212> PRT
<213> 人工序列
<220>
<223> Mutant4
<400> 33
Met Val Ser Lys Gly Glu Glu Leu Ile Glu Glu Asn Met Arg Met Lys
1 5 10 15
Val Val Met Glu Gly Ser Val Asn Gly His Gln Phe Lys Cys Thr Gly
20 25 30
Glu Gly Glu Gly Arg Pro Tyr Glu Gly Val Gln Thr Met Arg Ile Lys
35 40 45
Val Ile Glu Gly Gly Pro Leu Pro Phe Ala Phe Asp Ile Leu Ala Thr
50 55 60
Ser Phe Leu Phe Gly Ser Lys Thr Phe Ile Lys Tyr Pro Ala Asp Ile
65 70 75 80
Pro Asp Phe Phe Lys Gln Ser Phe Pro Glu Gly Phe Thr Trp Glu Arg
85 90 95
Val Thr Arg Tyr Glu Asp Gly Gly Val Val Thr Val Ser Gln Asp Thr
100 105 110
Ser Leu Glu Asp Gly Gly Leu Val Tyr Asn Val Lys Val Gly Gly Val
115 120 125
Asn Phe Pro Ser Asn Gly Pro Val Met Gln Lys Lys Thr Glu Gly Trp
130 135 140
Glu Pro Phe Thr Glu Met Met Tyr Pro Ala Asp Gly Gly Leu Arg Gly
145 150 155 160
Tyr Thr Asp Ile Ala Leu Lys Val Asp Gly Gly Gly His Leu His Ala
165 170 175
Asn Ile Val Thr Thr Tyr Arg Ser Lys Lys Thr Val Gly Asn Ile Lys
180 185 190
Met Pro Gly Val His Ala Val Asp Tyr Arg Leu Glu Arg Ile Ala Glu
195 200 205
Ser Asp Asn Glu Thr Tyr Val Val Leu Arg Glu Val Ala Val Ala Lys
210 215 220
Tyr Ser Asn Leu Gly Gly Gly Met Asp Glu Leu Tyr Lys
225 230 235
<210> 34
<211> 237
<212> PRT
<213> 人工序列
<220>
<223> Mutant5
<400> 34
Met Val Ser Lys Gly Glu Glu Leu Ile Glu Glu Asn Met Arg Met Lys
1 5 10 15
Val Val Met Glu Gly Ser Val Asn Gly His Gln Phe Lys Cys Thr Gly
20 25 30
Glu Gly Glu Gly Arg Pro Tyr Glu Gly Val Gln Thr Met Arg Ile Lys
35 40 45
Val Ile Glu Gly Gly Pro Leu Pro Phe Ala Phe Asp Ile Leu Ala Thr
50 55 60
Ser Phe Leu Phe Gly Ser Lys Thr Phe Ile Lys Tyr Pro Ala Asp Ile
65 70 75 80
Pro Asp Phe Phe Lys Gln Ser Phe Pro Glu Gly Phe Thr Trp Glu Arg
85 90 95
Val Thr Arg Tyr Glu Asp Gly Gly Val Val Thr Val Ser Gln Asp Thr
100 105 110
Ser Leu Glu Asp Gly Gly Leu Val Tyr Asn Val Lys Val Gly Gly Val
115 120 125
Asn Phe Pro Ser Asn Gly Pro Val Met Gln Lys Lys Thr Glu Gly Trp
130 135 140
Glu Pro Phe Thr Glu Met Met Tyr Pro Ala Asp Gly Gly Leu Arg Gly
145 150 155 160
Tyr Thr Asp Ile Ala Leu Lys Val Asp Gly Gly Gly His Leu His Ala
165 170 175
Asn Ile Val Thr Thr Tyr Arg Ser Lys Lys Thr Val Gly Asn Ile Lys
180 185 190
Met Pro Gly Val His Ala Val Asp Tyr Arg Leu Glu Arg Ile Ala Glu
195 200 205
Ser Asp Asn Glu Thr Tyr Val Val Leu Arg Glu Val Ala Val Ala Lys
210 215 220
Tyr Ser Asn Leu Gly Gly Gly Met Asp Glu Leu Tyr Lys
225 230 235
<210> 35
<211> 237
<212> PRT
<213> 人工序列
<220>
<223> mRuby3
<400> 35
Met Val Ser Lys Gly Glu Glu Leu Ile Lys Glu Asn Met Arg Met Lys
1 5 10 15
Val Val Met Glu Gly Ser Val Asn Gly His Gln Phe Lys Cys Thr Gly
20 25 30
Glu Gly Glu Gly Arg Pro Tyr Glu Gly Val Gln Thr Met Arg Ile Lys
35 40 45
Val Ile Glu Gly Gly Pro Leu Pro Phe Ala Phe Asp Ile Leu Ala Thr
50 55 60
Ser Phe Met Tyr Gly Ser Arg Thr Phe Ile Lys Tyr Pro Ala Asp Ile
65 70 75 80
Pro Asp Phe Phe Lys Gln Ser Phe Pro Glu Gly Phe Thr Trp Glu Arg
85 90 95
Val Thr Arg Tyr Glu Asp Gly Gly Val Val Thr Val Thr Gln Asp Thr
100 105 110
Ser Leu Glu Asp Gly Glu Leu Val Tyr Asn Val Lys Val Arg Gly Val
115 120 125
Asn Phe Pro Ser Asn Gly Pro Val Met Gln Lys Lys Thr Lys Gly Trp
130 135 140
Glu Pro Asn Thr Glu Met Met Tyr Pro Ala Asp Gly Gly Leu Arg Gly
145 150 155 160
Tyr Thr Asp Ile Ala Leu Lys Val Asp Gly Gly Gly His Leu His Cys
165 170 175
Asn Phe Val Thr Thr Tyr Arg Ser Lys Lys Thr Val Gly Asn Ile Lys
180 185 190
Met Pro Gly Val His Ala Val Asp His Arg Leu Glu Arg Ile Glu Glu
195 200 205
Ser Asp Asn Glu Thr Tyr Val Val Gln Arg Glu Val Ala Val Ala Lys
210 215 220
Tyr Ser Asn Leu Gly Gly Gly Met Asp Glu Leu Tyr Lys
225 230 235
<210> 36
<211> 237
<212> PRT
<213> 人工序列
<220>
<223> mTagBFP2
<400> 36
Met Val Ser Lys Gly Glu Glu Leu Ile Lys Glu Asn Met His Met Lys
1 5 10 15
Leu Tyr Met Glu Gly Thr Val Asp Asn His His Phe Lys Cys Thr Ser
20 25 30
Glu Gly Glu Gly Lys Pro Tyr Glu Gly Thr Gln Thr Met Arg Ile Lys
35 40 45
Val Val Glu Gly Gly Pro Leu Pro Phe Ala Phe Asp Ile Leu Ala Thr
50 55 60
Ser Phe Leu Tyr Gly Ser Lys Thr Phe Ile Asn His Thr Gln Gly Ile
65 70 75 80
Pro Asp Phe Phe Lys Gln Ser Phe Pro Glu Gly Phe Thr Trp Glu Arg
85 90 95
Val Thr Thr Tyr Glu Asp Gly Gly Val Leu Thr Ala Thr Gln Asp Thr
100 105 110
Ser Leu Gln Asp Gly Cys Leu Ile Tyr Asn Val Lys Ile Arg Gly Val
115 120 125
Asn Phe Thr Ser Asn Gly Pro Val Met Gln Lys Lys Thr Leu Gly Trp
130 135 140
Glu Ala Phe Thr Glu Thr Leu Tyr Pro Ala Asp Gly Gly Leu Glu Gly
145 150 155 160
Arg Asn Asp Met Ala Leu Lys Leu Val Gly Gly Ser His Leu Ile Ala
165 170 175
Asn Ala Lys Thr Thr Tyr Arg Ser Lys Lys Pro Ala Lys Asn Leu Lys
180 185 190
Met Pro Gly Val Tyr Tyr Val Asp Tyr Arg Leu Glu Arg Ile Lys Glu
195 200 205
Ala Asn Asn Glu Thr Tyr Val Glu Gln His Glu Val Ala Val Ala Arg
210 215 220
Tyr Cys Asp Leu Pro Ser Lys Leu Gly His Lys Leu Asn
225 230 235

Claims (10)

1.一种用于细菌和哺乳动物细胞中的基因表达的表达载体,其包括:
细菌和哺乳动物表达盒,其包括CMV启动子、L-鼠李糖诱导的rhaB启动子、Shine-Dalgarno(SD)序列、靶荧光蛋白基因、细菌rrnB T1终止子和SV40 poly-A尾;
参照基因表达盒,其包括:SV40启动子、参照荧光蛋白基因和HSV-TK poly(A)尾。
2.根据权利要求1所述的表达载体,其中,
所述细菌和哺乳动物表达盒还包括组氨酸标签和Kozak序列元件;
特别地,在Shine-Dalgarno序列和靶荧光蛋白基因之间具有组氨酸标签序列;
特别地,Kozak序列位于组氨酸标签和靶荧光蛋白基因之间;和/或
所述参照基因表达盒位于SV40 poly-A尾之后;和/或
所述参照基因表达盒还包括Kozak序列元件;和/或
所述表达载体还包含CMV增强子。
3.根据权利要求1所述的表达载体,其中,所述表达载体具有如下的结构:在pCI载体的骨架上,在CMV启动子之后且SV40 poly-A尾之前,切除intron内含子-T7-MCS片段,引入L-鼠李糖诱导的rhaB启动子、Shine-Dalgarno(SD)序列、组氨酸标签、Kozak序列元件、靶荧光蛋白基因和细菌rrnB T1终止子,以及在SV40 poly-A尾下游插入SV40启动子、参照荧光蛋白基因和HSV-TK poly(A)尾。
4.根据权利要求1所述的表达载体,其中,
所述靶荧光蛋白和参照荧光蛋白各自独立地选自红色荧光蛋白、绿色荧光蛋白或者蓝色荧光蛋白;
特别地,所述靶荧光蛋白和参照荧光蛋白为不同类型的荧光蛋白,更特别地,所述靶荧光蛋白为蓝色荧光蛋白,所述参照荧光蛋白为红色荧光蛋白,或者所述靶荧光蛋白为红色荧光蛋白,所述参照荧光蛋白为蓝色荧光蛋白;
特别地,所述参照荧光蛋白为mScarlet。
5.权利要求1-4任一项所述的表达载体的构建方法,其为如下方法之一:
方法一,包括以下步骤:
以pCI载体为骨架分两步组装,首先,将包括L-鼠李糖诱导的rhaB启动子、Shine-Dalgarno(SD)序列、靶荧光蛋白基因和细菌rrnB T1终止子的鼠李糖诱导的表达盒插入CMV启动子和SV40 poly(A)序列之间,然后,在SV40 poly(A)序列后克隆包括SV40启动子、参照荧光蛋白基因和HSV-TK poly(A)尾的SV40表达盒;
方法二:
通过替换靶荧光蛋白基因和/或参照荧光蛋白基因从权利要求1-4任一项所述的一种表达载体得到另一种表达载体。
6.权利要求5所述的构建方法,其中,
在靶荧光蛋白基因的起始位点设置Kozak序列元件,和/或
在参照荧光蛋白基因的起始位点设置Kozak序列元件。
7.权利要求1-4任一项所述的表达载体用于在细菌和哺乳动物细胞中表达荧光蛋白的用途。
8.一种在细菌和哺乳动物细胞中表达荧光蛋白的方法,所述方法包括:
用要表达的荧光蛋白基因替换权利要求1-4任一项所述的表达载体上的靶荧光蛋白基因,和/或用要表达的参照荧光蛋白基因替换权利要求1-4任一项所述的表达载体上的参照荧光蛋白基因得到pHybrid质粒;
将所构建的pHybrid质粒转化到细菌细胞或转染到哺乳动物细胞中表达。
9.一种筛选荧光蛋白的方法,包括:将待筛选的荧光蛋白的基因文库亚克隆到权利要求1-4任一项所述的表达载体中;
将所得表达载体转化到细菌细胞,由此将待筛选的基因文库表达在细菌细胞中;
对转化后的细菌细胞进行培养,然后在荧光显微镜下筛选菌落,分选出1个或多个最佳菌落。
10.根据权利要求9所述的方法,其还包括:
将分选出的最佳菌落进行培养并提取质粒;
将提取的质粒在哺乳动物细胞中表达并测定细胞内亮度和/或光稳定性;
和/或
将分选出的最佳菌落进行培养并提取蛋白;
表征蛋白的光谱。
CN202210594038.0A 2022-05-27 2022-05-27 一种表达载体及其构建方法和应用 Pending CN117165613A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210594038.0A CN117165613A (zh) 2022-05-27 2022-05-27 一种表达载体及其构建方法和应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210594038.0A CN117165613A (zh) 2022-05-27 2022-05-27 一种表达载体及其构建方法和应用

Publications (1)

Publication Number Publication Date
CN117165613A true CN117165613A (zh) 2023-12-05

Family

ID=88941878

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210594038.0A Pending CN117165613A (zh) 2022-05-27 2022-05-27 一种表达载体及其构建方法和应用

Country Status (1)

Country Link
CN (1) CN117165613A (zh)

Similar Documents

Publication Publication Date Title
CN102648288B (zh) 基于抑制的对细胞克隆的高通量筛选方法
CN114380922A (zh) 在细胞内产生点突变的融合蛋白、其制备及用途
JP2002531146A (ja) Anthozoa綱の非生物発光性種由来の蛍光タンパク質、そのようなタンパク質をコードする遺伝子、およびそれらの使用
US20080293068A1 (en) Methods for engineering polypeptide variants via somatic hypermutation and polypeptide made thereby
CN114058625B (zh) 一种cho细胞基因nw_003613781.1内稳定表达蛋白质的位点及其应用
CN114085841B (zh) 一种cho细胞基因nw_003614092.1内稳定表达蛋白质的位点及其应用
US10202656B2 (en) Dividing of reporter proteins by DNA sequences and its application in site specific recombination
CN111850096B (zh) 一种基于n端编码序列改造调控蛋白质表达的方法
JP2023062130A (ja) 標的タンパク質への検出可能なタグのCRISPR/Cas制御組み込みに基づく細胞の選択方法
CN113969284B (zh) 一种cho细胞基因nw_003614889.1内稳定表达蛋白质的位点及其应用
CN113969283B (zh) 一种cho细胞基因nw_003613756.1内稳定表达蛋白质的位点及其应用
CN112813049B (zh) 用于活细胞rna标记的融合蛋白及应用
CN110330558B (zh) 一种黄色荧光蛋白及其应用
CN117165613A (zh) 一种表达载体及其构建方法和应用
KR101947869B1 (ko) 차세대 시퀀싱 기반 재조합 단백질 발현을 위한 세포 내 핫스팟 영역 탐색 방법
CN112877309B (zh) 一种N端延长型PTEN亚型PTENζ蛋白及其编码基因和应用
US20230045187A1 (en) Compositions comprising a nuclease and uses thereof
CN109402096B (zh) 一种aid酶突变体及其应用
KR101599138B1 (ko) 재조합 단백질 발현 증진을 위한 유전자 절편을 포함하는 벡터 및 이의 용도
CN108659110B (zh) 一种改进的红色荧光蛋白及其应用
CN111254143A (zh) 具有优良胁迫耐受性的简单节杆菌工程菌株的构建方法、菌株及其应用
CN108191979B (zh) 一种荧光互补检测人趋化因子生物学活性的方法
KR102210877B1 (ko) 형광세기가 향상된 애기장대 유래 플라빈 모노뉴클레오타이드 결합 단백질 변이체들
CN115261363B (zh) Apobec3a的rna脱氨酶活性测定方法及rna高活性的apobec3a变体
RU2714763C1 (ru) Генотерапевтический ДНК-вектор для таргетной генной терапии, способ его получения (варианты), штамм для его производства, способ его получения

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication