CN115873125A - 用于哺乳动物体系的嵌合型别构转录因子、调控元件组和诱导表达系统 - Google Patents

用于哺乳动物体系的嵌合型别构转录因子、调控元件组和诱导表达系统 Download PDF

Info

Publication number
CN115873125A
CN115873125A CN202111150967.4A CN202111150967A CN115873125A CN 115873125 A CN115873125 A CN 115873125A CN 202111150967 A CN202111150967 A CN 202111150967A CN 115873125 A CN115873125 A CN 115873125A
Authority
CN
China
Prior art keywords
sequence
domain
chimeric
nuclear localization
promoter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202111150967.4A
Other languages
English (en)
Inventor
娄春波
项延会
王卫军
李婷婷
陈茜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Institute of Advanced Technology of CAS
Original Assignee
Shenzhen Institute of Advanced Technology of CAS
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Institute of Advanced Technology of CAS filed Critical Shenzhen Institute of Advanced Technology of CAS
Priority to CN202111150967.4A priority Critical patent/CN115873125A/zh
Priority to PCT/CN2022/071023 priority patent/WO2023050644A1/zh
Publication of CN115873125A publication Critical patent/CN115873125A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • CCHEMISTRY; METALLURGY
    • C07ORGANIC CHEMISTRY
    • C07KPEPTIDES
    • C07K19/00Hybrid peptides, i.e. peptides covalently bound to nucleic acids, or non-covalently bound protein-protein complexes
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N15/00Mutation or genetic engineering; DNA or RNA concerning genetic engineering, vectors, e.g. plasmids, or their isolation, preparation or purification; Use of hosts therefor
    • C12N15/09Recombinant DNA-technology
    • C12N15/63Introduction of foreign genetic material using vectors; Vectors; Use of hosts therefor; Regulation of expression
    • C12N15/79Vectors or expression systems specially adapted for eukaryotic hosts
    • C12N15/85Vectors or expression systems specially adapted for eukaryotic hosts for animal cells
    • CCHEMISTRY; METALLURGY
    • C12BIOCHEMISTRY; BEER; SPIRITS; WINE; VINEGAR; MICROBIOLOGY; ENZYMOLOGY; MUTATION OR GENETIC ENGINEERING
    • C12NMICROORGANISMS OR ENZYMES; COMPOSITIONS THEREOF; PROPAGATING, PRESERVING, OR MAINTAINING MICROORGANISMS; MUTATION OR GENETIC ENGINEERING; CULTURE MEDIA
    • C12N5/00Undifferentiated human, animal or plant cells, e.g. cell lines; Tissues; Cultivation or maintenance thereof; Culture media therefor
    • C12N5/10Cells modified by introduction of foreign genetic material
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks

Landscapes

  • Health & Medical Sciences (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Genetics & Genomics (AREA)
  • Engineering & Computer Science (AREA)
  • Chemical & Material Sciences (AREA)
  • Organic Chemistry (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Biotechnology (AREA)
  • Biomedical Technology (AREA)
  • Wood Science & Technology (AREA)
  • Zoology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biochemistry (AREA)
  • General Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Microbiology (AREA)
  • Plant Pathology (AREA)
  • Physiology (AREA)
  • Proteomics, Peptides & Aminoacids (AREA)
  • Cell Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Medical Informatics (AREA)
  • Spectroscopy & Molecular Physics (AREA)
  • Theoretical Computer Science (AREA)
  • Medicinal Chemistry (AREA)
  • Micro-Organisms Or Cultivation Processes Thereof (AREA)

Abstract

本发明涉及用于对哺乳动物细胞中感兴趣的基因进行调控的嵌合型别构转录因子以及包含所述嵌合型别构转录因子的调控元件组和诱导表达系统,所述嵌合型别构转录因子包含调控结构域以及转录激活结构域;其中,所述调控结构域选自于由RpaR、BjaR以及BraR所组成的组;所述转录激活结构域选自于P65、VP16、VP64、VTR1、VTR2以及VTR3;所述嵌合型别构转录因子以天然氨基酸衍生的酰基高丝氨酸内酯作为诱导剂;所述天然氨基酸衍生的酰基高丝氨酸内酯选自于由如下化合物所组成的组:对香豆酰基‑高丝氨酸内酯(pC‑HSL)、异戊酰基‑高丝氨酸内酯(IV‑HSL)以及肉桂酰基‑高丝氨酸内酯(Cinn‑HSL)。该系统能以模块化的方式用于多种哺乳动物细胞、组织或生物体,对感兴趣基因的表达进行调控。

Description

用于哺乳动物体系的嵌合型别构转录因子、调控元件组和诱 导表达系统
技术领域
本发明属于合成生物学和生物工程领域,涉及能够对哺乳动物体系中基因表达进行调控的嵌合型别构转录因子、调控元件组和诱导表达系统。具体而言,本发明涉及使用天然氨基酸衍生的酰基高丝氨酸内酯作为诱导剂来调控宿主细胞中感兴趣基因的转录。
背景技术
对哺乳动物宿主中基因表达的精确调控对于基因功能分析、生物制药、疫苗制备、动物模型设计以及基因治疗等均极为重要。本领域已报道了多种用于哺乳动物的基因表达调控系统,例如用免疫抑制剂或类固醇激素作为诱导剂,来调控目标基因的转录。然而,这些系统普遍存在诱导剂浓度难以控制或者对宿主基因网络造成干扰等问题。为构建与宿主基因调控网络正交的诱导表达系统,已尝试对原核细胞来源的调控元件进行改造并将其转用于真核体系,来诱导表达真核宿主中的基因。例如,可将天蓝色链霉菌(Streptomycescoelicolor)群体感应受体ScbR或始旋链霉菌(Streptomyces pristinaespiralis)转录因子SpbR与单纯疱疹病毒(herpes simplex virus)的真核转录激活结构域VP16融合作为转录激活因子,并将相应的操纵序列组装至CMVmini启动子5’端,构建以丁内酯类化合物为诱导剂的哺乳动物诱导表达系统[1]。然而上述表达系统均为正控阻遏系统,即,在小分子存在下别构转录因子与DNA脱离。WO2007058527A2报道了将原核细胞来源的Tet调控系统转用于哺乳动物体系。在大肠杆菌中,阻遏蛋白TetR与其操纵序列tetO特异性结合抑制下游基因转录,而四环素或强力霉素(dox)与TetR的结合触发构象改变,释放启动子区,开启基因转录。对于真核宿主,可将VP16与TetR融合构建别构转录因子tTA,对包含tetO序列的真核启动子进行调控。然而,四环素或dox与tTA的结合使得该转录因子与启动子区脱离,该系统仍为正控阻遏系统。作为改进,可将TetR部分氨基酸突变,使其与诱导剂结合后与DNA结合,这种负控系统能够被较低浓度的诱导剂(例如44ng/ml强力霉素)激活。
群体感应系统是存在于细菌体内并响应菌群密度信号的系统,通过对信号分子进行合成、分泌、检测以及群体水平应答来实现细胞间通讯,从而协调群体内基因表达。该过程与生物发光、抗生素合成和菌膜形成等密切相关。不同种属的细菌分泌的信号分子在化学结构上具有差异,从而为构建与哺乳动物宿主基因调控网络正交的人工表达系统提供了更多选择。例如,变形菌的群体感应系统利用酰基高丝氨酸内酯(N-acyl homoserinelactone,AHL)作为信号分子,由LuxR家族别构转录因子作为受体对信号分子的浓度信息进行转导。本领域已报道将LuxR家族别构转录因子与真核反式激活域NF-κB p65或VP16融合,构建嵌合转录因子;并将操纵序列添加至CMVmini启动子,构建响应AHL的诱导型启动子[2]-[3]。目前本领域已报道的此类哺乳动物诱导系统的EC50的量级均在10μM以上,且诱导剂仅限于3-氧代-辛酰基-L-高丝氨酸内酯(3OC8)或3-氧代-己酰基-L-高丝氨酸内酯(3OC6);这两种直链脂肪酸型AHL的酰基侧链相似度较高,因此基于此类AHL的多通道通讯系统在信号水平和启动子水平上均存在广泛的串扰。
在本发明中,通过对原核生物中以天然氨基酸衍生的酰基高丝氨酸内酯作为诱导剂的群体感应系统进行数据挖掘,识别相应的别构转录因子和操纵序列,并与真核转录调控系统进行整合,构建了用于哺乳动物细胞的新型诱导表达系统。
发明内容
在第一方面,本发明提供了一种用于对哺乳动物细胞中感兴趣的基因进行调控的嵌合型别构转录因子,所述嵌合型别构转录因子包含调控结构域以及转录激活结构域;其中,所述调控结构域选自于由RpaR、BjaR以及BraR所组成的组;所述转录激活结构域选自于P65、VP16、VP64、VTR1、VTR2以及VTR3;所述嵌合型别构转录因子以天然氨基酸衍生的酰基高丝氨酸内酯作为诱导剂;所述天然氨基酸衍生的酰基高丝氨酸内酯选自于由如下化合物所组成的组:对香豆酰基-高丝氨酸内酯(pC-HSL)、异戊酰基-高丝氨酸内酯(IV-HSL)以及肉桂酰基-高丝氨酸内酯(Cinn-HSL)。
在第二方面,本发明提供了一种以天然氨基酸衍生的酰基高丝氨酸内酯作为诱导剂的调控元件组,所述天然氨基酸衍生的酰基高丝氨酸内酯选自于由如下化合物所组成的组:对香豆酰基-高丝氨酸内酯(pC-HSL)、异戊酰基-高丝氨酸内酯(IV-HSL)以及肉桂酰基-高丝氨酸内酯(Cinn-HSL);所述调控元件组包含:
嵌合型别构转录因子,所述嵌合型别构转录因子包含调控结构域以及转录激活结构域;其中,所述调控结构域选自于由RpaR、BjaR以及BraR所组成的组;所述转录激活结构域选自于P65、VP16、VP64、VTR1、VTR2以及VTR3;以及
在哺乳动物细胞中具有活性的诱导型启动子,所述诱导型启动子包含核心序列以及与所述嵌合型别构转录因子相互作用的至少一对操纵位点对。
在第三方面,本发明提供了一种对哺乳动物中感兴趣的基因进行诱导表达的系统,所述诱导表达系统利用天然氨基酸衍生的酰基高丝氨酸内酯作为诱导剂,所述天然氨基酸衍生的酰基高丝氨酸内酯选自于由如下化合物所组成的组:对香豆酰基-高丝氨酸内酯(pC-HSL)、异戊酰基-高丝氨酸内酯(IV-HSL)以及肉桂酰基-高丝氨酸内酯(Cinn-HSL);所述诱导表达系统包含:
第一基因表达盒,所述第一基因表达盒包含第一启动子序列以及嵌合型别构转录因子的编码序列,其中,所述嵌合型别构转录因子包含调控结构域以及转录激活结构域;所述调控结构域选自于由RpaR、BjaR以及BraR所组成的组;所述转录激活结构域选自于P65、VP16、VP64、VTR1、VTR2以及VTR3;以及
第二基因表达盒,所述第二基因表达盒包含诱导型启动子序列以及所述感兴趣的基因的编码序列,所述诱导型启动子序列包含与所述嵌合型别构转录因子相互作用的至少一对操纵位点对。
在第四方面,本发明提供了第一方面所述的嵌合型别构转录因子、第二方面所述的调控元件组、第三方面所述的诱导表达系统在构建单细胞或多细胞信号通讯系统以及人类疾病模型中的用途。
有益效果
在细菌中,天然氨基酸衍生的酰基高丝氨酸内酯与LuxR家族转录激活因子RpaR、BjaR或BraR的相互作用使得此类转录激活因子构象改变,进而能够结合至DNA上相应的操纵序列并激活下游基因转录。在本发明中,通过对上述转录因子的操纵序列进行识别与表征,并将该操纵序列添加至真核启动子,构建能够在哺乳动物宿主中响应pC-HSL、IV-HSL和/或Cinn-HSL的诱导型启动子;另一方面,将真核反式激活因子作为转录激活结构域融合至LuxR家族的上述转录激活因子,构建能够在真核宿主中调控基因表达的嵌合型别构转录因子。由于pC-HSL、IV-HSL以及Cinn-HSL能够自由扩散进出细胞,本发明构建的嵌合型别构转录因子的调控结构域与上述诱导剂结合使得其构象改变,从而能够与DNA上相应的操纵序列结合,将所述嵌合型别构转录因子的转录激活结构域定位至包含相应操纵序列的启动子,对该启动子控制的基因进行诱导表达。而不存在诱导剂时,嵌合型别构转录因子从DNA上脱离,从而关闭基因转录。这是本领域首次报道在哺乳动物细胞中利用天然氨基酸衍生的酰基高丝氨酸内酯作为诱导剂对感兴趣的基因进行诱导。该诱导系统能够以模块化的方式用于多种类型的哺乳动物细胞、组织或者生物体,对感兴趣的基因的表达进行调控。
事实上,在哺乳动物宿主中,由于转录调控位点难以被100%占据,以阻遏蛋白作为转录调控因子时转录不能被完全关闭。因此,基于阻遏蛋白的诱导系统不但需要胞内表达较高浓度的转录因子,增大了宿主细胞的代谢负担,而且难以提高信噪比以及实现快速诱导。本发明的嵌合型别构转录因子为转录激活因子,不存在上述系统性缺陷。另一方面,哺乳动物细胞中不存在与原核AHL相关的信号通路,因此在将本发明的嵌合型别构转录因子或诱导表达系统导入哺乳动物宿主时,该嵌合型别构转录因子高度特异地与相应的操纵序列结合,不存在不期望的多效性(pleiotropic)。目前已报道的以直链脂肪酸型AHL作为诱导剂的诱导系统借助VP16-TraR融合蛋白对3OC8信号进行应答,该系统的半最大有效浓度EC50为7-14μM[3],而本发明的pC-HSL以及Cinn-HSL诱导系统的EC50分别为0.8μM和1.25nM。与3OC8诱导系统相比,本发明的诱导系统可实现超灵敏应答。由于可在较低的工作浓度下诱导,有效降低了诱导剂对细胞的细胞毒性。此外,3OC8诱导系统的最大诱导倍数约为20倍,而本发明的pC-HSL诱导系统的最大诱导倍数可达100倍,信噪比更高。此外,由于本发明的诱导系统与直链脂肪酸型AHL诱导系统不存在信号串扰[5],可将本发明的诱导系统与直链脂肪酸型AHL诱导系统组合使用,在哺乳动物宿主中构建具有多重信号的复杂调控网络或基因线路。
在优选的实施方式中,所述嵌合型别构转录因子进一步包含多聚化结构域CarH。不希望被理论所限地,在别构转录因子中添加多聚化结构域使得启动子附近空间位阻增大,增加诱导曲线的陡峭度(steepness),降低本底表达,并使得诱导阈值变高,实现更好的转录开关性能。在例如疫苗生产过程中,过高的本底表达会导致诱导剂依赖性丧失,进而产生过量的免疫原性,因此降低的本底表达极为重要。如实施例所展示的,融合CarH多聚化结构域能够将pC诱导系统的灵敏度提高5倍以上。
本领域已知的是,线性化能够降低电路中放大器的信号失真并提高线性度,这对于尖峰频率适应以及将非线性瞬时触发信号转换为稳定线性应答非常重要。在基因线路中,可通过在调控网络中添加负反馈,降低表达的异质性并改变S型应答曲线的形状,实现报告子水平的线性变换。在本发明优选的实施方式中,通过添加基于TetR的负反馈系统来扩大诱导表达系统的动态范围,从而在较大范围内诱导物浓度与目的蛋白的表达量呈线性关系。此类调控元件线性化对于调控网络的理性设计而言至关重要。
附图说明
图1显示本发明诱导系统的设计原理和表征。(A)嵌合型别构转录因子的设计原理以及包含所述嵌合型别构转录因子的诱导系统的工作原理。(B)根据本发明实施例的pC诱导系统、Cinn诱导系统以及IV诱导系统的诱导剂、嵌合型别构转录因子的调控结构域以及诱导曲线的EC50和动态范围。(C)利用流式细胞术测定的pC诱导系统、Cinn诱导系统以及IV诱导系统的诱导曲线,所使用的诱导剂分别为pC-HSL、Cinn-HSL以及IV-HSL。
图2显示Cinn诱导系统操纵序列的识别和优化。(A)为借助BLAST对四种慢生根瘤菌BTAi1(NC)、ORS285(ORS)、Bradyrhizobium oligotrophicum S58(APO)以及ORS278(CUL以及CUS)中推定的BraI启动子区域的序列进行比对的结果。方框框出推定的操纵位点braO。(B)流式细胞术测定的包含启动子PCUS-TRE3G、PCUL-TRE3、PORS-TRE3G、PAPO-TRE3G以及PNC-TRE3G的Cinn诱导系统的诱导曲线。其中,启动子PCUS-TRE3G、PCUL-TRE3、PORS-TRE3G、PAPO-TRE3G以及PNC-TRE3G分别包含一对CUS、CUL、ORS、APO以及NC操纵位点。(C)对于慢生根瘤菌ORS278菌株的操纵序列CUS(wt),分别从上游或下游截短,得到操纵序列F1、F2、F4、F7(5’端截短),以及R1、R4、R6、R7、R8(3’端截短)。(D)借助流式细胞术测定在0和10-6mol/L的Cinn-HSL下包含(C)中各操纵序列的诱导系统中报告子的荧光强度。(E)借助流式细胞术测定的包含启动子P2XR8-TRE3G或PCUS-TRE3G的Cinn诱导系统的诱导曲线。(F)示出对应于(A)中CUL、NC、ORS、APO以及CUS的最小操纵序列。
图3显示流式细胞术测定的包含转录激活结构域VTR3或VP64的Cinn诱导系统的诱导曲线。
图4显示多聚化结构域对于诱导系统性能的影响。(A)显示包含多聚化结构域CarH的嵌合型别构转录因子VTR3-CarH-RpaR的设计原理以及包含该别构转录因子的pC诱导系统的工作原理。(B)流式细胞术测定包含别构转录因子VTR3-CarH-RpaR或VTR3-RpaR的pC诱导系统的诱导曲线。
图5显示在诱导系统中添加负反馈能够使得应答线性化。(a)诱导剂pC-HSL和别构转录因子VTR3-RpaR对双输入启动子pC-dox调控的工作原理,其中,所述pC-dox启动子包含一对rpaO和一对tetO操纵位点。(b)诱导剂dox和别构转录因子TetR对双输入启动子pC-dox调控的工作原理。(c)流式细胞术测定pC-dox诱导系统的诱导曲线。所给出的数据均为三次重复实验的平均荧光值。
图6显示pC诱导系统与Cinn诱导系统间的信号串扰。(A)借助流式细胞术测定各pC-HSL(ORS-pC)或Cinn-HSL(ORS-Cinn)浓度下,Cinn诱导系统的剂量响应曲线。(B)借助流式细胞术测定各pC-HSL(RpaO-pC)或Cinn-HSL(RpaO-Cinn)浓度下,pC诱导系统的剂量响应曲线。
图7显示利用本发明的Cinn诱导系统构建哺乳动物细胞间通讯。(A)哺乳动物细胞通讯系统B4YP-2XR8的基因线路图。(B)阴性对照模块2XR8的基因线路图。(C)各接种密度下细胞中Citrine和mCherry的表达。从左至右分别为FITC通道、ECD通道、明场以及三者的叠加图。荧光显微镜的放大倍数为20×,比例尺为150μm。
图1-图4以及图6中,所给出的数据均为三次重复实验的平均荧光值,误差线对应于各测量的标准差。
具体实施方式
针对现有哺乳动物诱导系统普遍存在的诱导水平低和漏表达等问题,本发明提出使用天然氨基酸衍生的酰基高丝氨酸内酯作为诱导剂,以剂量依赖和可逆的方式对哺乳细胞中的基因表达进行调控。
如图1A所示,本发明的嵌合型别构转录因子具有原核来源的调控结构域以及真核来源的转录激活结构域,这种异源融合使得别构转录因子能够对异源信号做出应答:由调控结构域实现对诱导剂的应答,由转录激活结构域控制哺乳动物中基因的转录。具体而言,所述调控结构域为群体感应应答蛋白RpaR、BjaR或BraR,所述调控结构域与天然氨基酸衍生的酰基高丝氨酸内酯pC-HSL、Cinn-HSL或IV-HSL结合后产生构象改变,结合至DNA上的操纵序列,从而将转录激活结构域定位至包含该操纵序列的启动子,因此可通过诱导剂浓度来调控目标基因的表达水平。
在细菌群体感应系统中,通常由自诱导物合成酶LuxI和应答蛋白LuxR介导信号分子的产生和应答。LuxI在体内催化以S-腺苷甲硫氨酸和酰基载体蛋白(ACP)为底物生成信号分子AHL,此类信号分子可自由扩散穿过细胞膜;别构转录因子LuxR能够与扩散进入细菌的AHL结合,来调控群体感应依赖型基因的转录。在细菌的基因组上LuxI和LuxR基因的位置通常临近[6],且LuxI的启动子包含能够被LuxR和AHL调控的操纵位点,使得AHL的合成通路包含正反馈,因此细菌能够在短时间内较快合成信号分子。在本发明中,将群体感应别构转录因子作为结构域调控与真核来源的转录激活结构域融合,并将该别构转录因子的操纵序列添加至真核启动子,构建在真核细胞中响应于群体感应信号的调控元件组和诱导系统。
在本发明中,将所述嵌合型别构转录因子包含RpaR作为调控结构域、所述诱导型启动子包含rpaO作为操纵位点的诱导系统称为pC诱导系统,一般而言,该系统的诱导剂为对香豆酰基-高丝氨酸内酯(pC-HSL)。在本发明中,将所述嵌合型别构转录因子包含BraR作为调控结构域、所述诱导型启动子包含braO作为操纵位点的诱导系统称为Cinn诱导系统,一般而言,该系统的诱导剂为肉桂酰基-高丝氨酸内酯(Cinn-HSL)。在本发明中,将所述嵌合型别构转录因子包含BjaR作为调控结构域、所述诱导型启动子包含bjaO作为操纵位点的诱导系统称为IV诱导系统,一般而言,该系统的诱导剂为异戊酰基-高丝氨酸内酯(IV-HSL)。在本发明中,术语“诱导系统”以及“诱导表达系统”、“基因表达系统”可互换使用。
本文中的术语“诱导剂”、“诱导物”、“信号分子”、“信号小分子”可互换使用,是指自身能够调控别构转录因子与操纵序列结合的化学小分子,可为外源输入或宿主自身合成。已发现的细菌群体感应系统大多以直链脂肪酸型AHL作为信号分子,其酰基侧链决定信号的特异性。本发明使用的诱导剂天然氨基酸衍生的酰基高丝氨酸内酯目前仅在与植物共生的细菌中发现,这些小分子参与细菌-植物相互作用。在天然宿主体内,直链脂肪酸型AHL由LuxI型N-酰基高丝氨酸内酯合酶催化生成,该反应的底物为S-腺苷甲硫氨酸和酰基-酰基载体蛋白(Acyl-ACP)。而在天然氨基酸衍生的AHL的生物合成途径中,LuxI型合酶RpaI、BraI和BjaI的底物为酰基-辅酶A(Acyl-CoA)而非酰基-酰基载体蛋白。ACP和辅酶A具有相似的化学性质,两者都与羧化底物形成加合物并将这些底物呈递给酶。ACP的功能通常在于生物合成和转移脂肪酸底物;而CoA与结构更加多样的羧化底物相关:辅酶A修饰的化合物通常为生物合成途径和生物降解途径的中间体[5]。天然氨基酸衍生的酰基高丝氨酸内酯能够自由扩散进入真核细胞,在细胞中可稳定存在,且不能由真核生物的自身代谢途径合成,这种异源诱导物能够有效降低本底表达。
在本发明的嵌合型别构转录因子中,利用LuxR同源蛋白作为调控结构域,对信号分子进行检测和应答。其结构包含与诱导物结合的结构域以及与启动子操纵序列结合的结构域。调控结构域与小分子的结合造成构象改变,使得由该启动子控制的下游基因转录水平改变。一般而言,与DNA的结合触发或增强目标基因转录的别构转录因子称为激活因子,反之称为阻遏蛋白。本发明的嵌合型别构转录因子其功能为激活因子。诱导型启动子包含能够与调控结构域相互作用的操纵序列。操纵序列一般位于感兴趣基因的转录起始位点附近,或者空间上与转录起始位点邻近。本文中,术语“操纵位点”、“操纵序列”以及“转录调控位点”可互换使用。不希望被理论所限地,在本发明中,诱导型启动子可包含一对或多对操纵序列,该操纵位点对可均位于转录起始位点的上游或下游,或分别位于转录起始位点的两侧。
术语“启动子”指的是驱动核酸序列表达或转录的DNA区域,位于基因转录起始位点的同义链上游。在启动子处RNA聚合酶以及转录因子能够与DNA结合。诱导型启动子一般包含转录调控区、RNA聚合酶识别区和转录起始位点。本领域已知的是,将感兴趣基因的编码序列可操作地连接至诱导型启动子的下游,并在所需时机添加诱导物,可动态开启或关闭该基因的转录。术语“最小启动子”或“启动子的核心序列”指的是在真核细胞中能够触发转录的最小转录控制单元,例如仅包含RNA聚合酶识别区和转录起始位点的启动子核心区域。可将至少一对操纵位点添加至最小启动子的上游和/或下游,构造开关性能优异的诱导型启动子。在本发明优选的实施方式中,所述诱导型启动子的核心序列可选自于CMV1启动子(SEQ ID NO:1)、CMVmini启动子(SEQ ID NO:2)、TRE3G启动子(SEQ ID NO:3)、EF1a核心启动子(SEQ ID NO:4)或hEF1a启动子(SEQ ID NO:40);优选地,所述核心序列为CMV1启动子或TRE3G启动子。
在一些实施方式中,所述诱导系统为pC诱导系统。其中,所述诱导剂为pC-HSL,所述嵌合型别构转录因子的调控结构域为RpaR,所述诱导型启动子包含的操纵序列为rpaO(表1)。pC群体感应系统的天然宿主为与植物共生的池沼红假单胞菌(Rhodopseudomonaspalustris),其群体感应系统包含LuxI家族的RpaI和LuxR家族的RpaR。RpaI的转录由pC-HSL和RpaR共同激活。在池沼红假单胞菌RCB100菌株中,RpaR的编码序列为其全基因组序列(NCBI登录号为WP_011155889.1)反义链第348672-349403bp。在池沼红假单胞菌培养物中,pC-HSL的浓度在1-10μM量级,该细菌可在nM量级的pC-HSL存在下出现群体感应现象[7]。此外,包含rpaO操纵序列的RpaI启动子不能被直链脂肪酸型AHL激活,表明工作浓度下pC群体感应系统与直链脂肪酸型AHL群体感应系统存在良好的正交性。可将该系统与直链脂肪酸型AHL诱导系统(例如以3OC6或3OC8作为诱导剂)组合使用,构建多重诱导系统。如本发明实施例所展示的,也可使用Cinn-HSL作为诱导剂调控pC诱导系统。就本发明的嵌合型别构转录因子、调控元件组以及诱导系统在构建细胞间信号通讯系统中的用途而言,池沼红假单胞菌中存在的pC-HSL合成途径并不完整,需要在培养基中添加对香豆酸盐才能实现pC-HSL的生物合成。在本发明中,可利用酪氨酸解氨酶TAL、4-香豆酸辅酶A连接酶4CL以及对香豆酰基-高丝氨酸内酯合成酶RpaI催化由酪氨酸合成对香豆酰基-高丝氨酸内酯[8]
在一些实施方式中,所述诱导系统为Cinn诱导系统。其中,所述诱导剂为Cinn-HSL,所述嵌合型别构转录因子的调控结构域为BraR,所述诱导型启动子包含的操纵序列为braO(表1)。在本发明中,将能够响应Cinn-HSL和BraR的操纵序列统称为braO,braO例如可为本发明识别的NC(SEQ ID NO:5)、ORS(SEQ ID NO:6)、APO(SEQ ID NO:7)、CUS(SEQ IDNO:8)、CUL(SEQ ID NO:9)、R1(SEQ ID NO:10)、R4(SEQ ID NO:11)、R7(SEQ ID NO:12)或R8(SEQ ID NO:13)(图2),优选为R8。如上所述,在与植物共生的池沼红假单胞菌中仅存在完整的群体感应信号检测和应答模块,其pC-HSL信号的生成需要外加对香豆酸盐。研究表明,光合异养的慢生根瘤菌(Bradyrhizobium)分泌的小分子Cinn-HSL能够激发池沼红假单胞菌的群体感应。在慢生根瘤菌中,由LuxI的同源蛋白BraI(NCBI登录号:CAL74857.1)催化Cinn-HSL的生物合成,并由LuxR同源蛋白BraR检测该信号分子。例如,在BradyrhizobiumORS278中,BraR的编码序列为其基因组(NCBI登录号:CU234118.1)反义链第1004717-1005442bp),BraI的编码序列为其基因组反义链第1004631-1003951bp。在慢生根瘤菌报告菌株中,实现半饱和群体感应应答所需Cinn-HSL的浓度可低至10pM,而实现半饱和群体感应应答所需的直链脂肪酸型AHL的浓度为104-107pM,表明工作浓度下Cinn群体感应系统与直链脂肪酸型AHL群体感应系统存在良好的正交性。可通过降低Cinn-HSL的浓度,将该系统与直链脂肪酸型AHL诱导系统(例如以3OC6或3OC8作为诱导剂)组合使用,构建多重诱导系统。在池沼红假单胞菌中,较高浓度的Cinn-HSL也能够激活包含rpaO操纵序列的RpaI启动子,可通过调整Cinn-HSL的浓度,对同时包含pC诱导系统和Cinn诱导系统的宿主细胞进行时空特异性调控。就本发明的嵌合型别构转录因子、调控元件组以及诱导系统在构建细胞间信号通讯系统中的用途而言,虽然慢生根瘤菌生物合成Cinn-HSL不需要添加肉桂酸盐,然而Cinn-HSL的产量仅有20nM。考虑到BraI催化由S-腺苷甲硫氨酸和活性形式的肉桂酸盐生成Cinn-HSL,可通过导入肉桂酸盐生物合成通路提高中间产物肉桂酸盐的产量,进而增加Cinn-HSL的产量。本领域已知的是,苯丙氨酸解氨酶催化由苯丙氨酸脱氨生成肉桂酸。苯丙氨酸解氨酶例如可来自于马里蒂姆链霉菌(Streptomyces maritimus)或圆红冬孢酵母菌。在本发明中,利用苯丙氨酸解氨酶PAL、4-香豆酸辅酶A连接酶4CL以及BraI催化由苯丙氨酸合成肉桂酰基-高丝氨酸内酯[9]
在一些实施方式中,所述诱导系统为IV诱导系统。其中,所述诱导剂为IV-HSL,所述嵌合型别构转录因子的调控结构域为BjaR,所述诱导型启动子包含的操纵序列为bjaO(表1)。IV应答元件存在于多种慢生根瘤菌中,例如日本慢生根瘤菌(Bradyrhizobiumjaponicum)、扩大重氮根瘤菌(Bradyrhizobium diazoefficiens)、Bradyrhizobiumniftali、辽宁慢生根瘤菌(Bradyrhizobium liaoningense)等。在最早发现的天然宿主日本慢生根瘤菌中,其群体感应系统包含LuxI家族的BjaI和LuxR家族的BjaR。BjaI的转录由IV-HSL和BjaR共同激活。在日本慢生根瘤菌中BjaI-lacZ报告子能够对低至10pM量级的IV-HSL产生应答,而产生群体感应信号所需的直链脂肪酸型AHL的浓度为nM量级,表明工作浓度下IV诱导系统与直链脂肪酸型AHL诱导系统存在较好的正交性[5]。在扩大重氮根瘤菌中,BjaR的编码序列为其基因组(110spc4菌株的全基因组NCBI登录号:NZ_CP032617.1)正义链第1105945-1106673bp。就本发明的嵌合型别构转录因子、调控元件组以及诱导系统在构建细胞间信号通讯系统的用途而言,可由支链α-酮酸脱氢酶复合物BCDH和异戊酰-高丝氨酸内酯合成酶BjaI催化由异亮氨酸合成IV-HSL[8]
表1pC、Cinn和IV诱导系统的各元件
Figure BDA0003287150500000071
Figure BDA0003287150500000081
本领域已知的是,可将原核来源的转录调控因子与真核转录激活结构域融合,对真核细胞中基因表达进行调控。US8383364B2公开了将单纯疱疹病毒的VP16激活域与原核阻遏蛋白TetR融合制备转录激活因子tTA,在真核细胞中tTA调控含有tetO的启动子Ptet的转录活性。Neddermann等将LuxR家族别构转录因子TraR与真核转录激活结构域p65融合,该转录因子TraR-p65可对哺乳动物的基因进行诱导表达[3]。此外,可将四个重复串联的VP16(即VP64)、p65[10]或SAM[11]等真核转录激活结构域融合至dCas9,由sgRNA引导靶基因激活。Ma等将已知的真核转录激活结构域p65、RTA和VP64融合,构建一系列VTR结构域,其与dCas9的融合蛋白能够用于调控真核基因转录[12]。可用作本发明嵌合型别构转录因子的转录激活结构域包括但不限于上述p65、VP16、VP64、VTR1、VTR2以及VTR3,优选VP64或VTR3。
本领域公知的是,如果核酸分子(如DNA)包含含有转录和翻译调控信息的核苷酸序列、而且这样的序列“可操作地连接”至编码多肽的核苷酸序列,则该核酸分子(如DNA)被称为“能够表达”所述多肽。可操作的连接是调控DNA序列与各结构域的编码序列通过“允许基因以可回收的量表达为肽或蛋白”的方式相连接的连接。就将调控结构域可操作地连接至转录激活结构域而言,只要不破坏调控结构域以及转录激活结构域的功能,可将调控结构域直接连接至转录激活结构域的N端或C端,或使用连接肽将调控结构域连接至转录激活结构域的N端或C端。连接肽为柔性,不包含任何活性结构域,优选由甘氨酸和/或丝氨酸组成。事实上连接肽的长度对嵌合蛋白的影响极其有限,并可为任意长度。在一个实施方式中,连接肽为20-60bp。在一个实施方式中,连接肽的序列为GGAGGAGGCGGCTCCGGAGGCGGAGGAAGC(SEQ ID NO:16)。
在优选的实施方式中,本发明的嵌合型别构转录因子还可包含核定位信号肽(NLS),所述核定位信号肽将别构转录因子定位至真核细胞的核内。事实上,在最初的报道中,是否添加NLS对于Tet诱导系统的性能影响不大;然而在将Tet用于腺病毒表达系统时,加入的NLS极大提高了诱导系统的性能(US 7745592 B2)。此外,将TraR-p65连接区域中包含的NLS删除对嵌合蛋白的性能影响不大[3]。本发明的嵌合型别构转录因子可包含核定位信号肽,所述核定位信号肽包含1-4个核定位序列,各核定位序列的两端可具有5-40bp的侧翼序列,所述侧翼序列为柔性。各侧翼序列的长度可相同或不同。事实上,侧翼序列对于嵌合蛋白的功能影响极其有限,可为任意序列。所述核定位信号肽可位于所述嵌合型别构转录因子的N端或C端,或者位于调控结构域与转录激活结构域之间。在优选的实施方式中,所述核定位信号肽位于调控结构域与转录激活结构域之间,所述核定位信号肽具有2个核定位序列,在核定位序列的两端和之间具有5-20bp的侧翼序列。可用于本发明的核定位序列包括:具有PKKKRKV的氨基酸序列的SV40病毒大T抗原的NLS;衍生于核质蛋白的NLS(例如具有KRPAATKKAGQAKKKK序列的双分型核质蛋白NLS);具有PAAKRVKLD或RQRRNELKRSP氨基酸序列的c-myc的NLS;具有氨基酸序列NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY的hRNPA1M9的NLS;输入蛋白(importin-α)衍生的IBB结构域的序列RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV;肌瘤T蛋白的序列VSRKRPRP和PPKKARED;人p53的序列POPKKKPL;小鼠c-abl IV的序列SALIKKKKKMAP;流感病毒NS1的序列DRLRR和PKQKKRK;丁型肝炎抗原的序列RKLKKKIKKL;小鼠Mx1蛋白的序列REKKKFLKRR;人多聚(ADP-核糖)聚合酶的序列KRKGDEVDGVDEVAKKKSKK;或者类固醇激素受体糖皮质激素序列RKCLQAGMNLEARKTKK,但不限于此。在优选的实施方式中,所述核定位序列为gctgaccccaagaagaagaggaaggtg(SEQ IDNO:17)。
在优选的实施方式中,本发明的嵌合型别构转录因子还可包含多聚化结构域,使得嵌合型别构转录因子能够发生多聚化。这种多聚化的能力并不依赖于调控结构域或转录激活结构域的结构,且并不影响调控结构域与相应操纵位点的相互作用。如本发明实施例所展示的,即便在启动子区上仅存在一对操纵位点,别构转录因子中包含多聚化结构域的诱导系统开关性能也更优。在一些实施方式中,所述多聚化结构域为CarH(SEQ ID NO:18)。CarH是一种辅酶B12依赖的细菌光受体蛋白,可对光产生应答而控制类胡萝卜素合成。在黑暗中与辅酶B12结合后单体CarH可形成四聚体,而光照后四聚体分解。本领域已报道利用CarH的四聚化性质,将其C端腺苷钴胺素结合域用于制备凝胶[13]。就本发明而言,在嵌合型别构转录因子的调控结构域和转录激活结构域之间添加多聚化结构域能够增加诱导曲线的陡峭度(steepness),并降低本底表达。在一些实施方式中,所述多聚化域位于所述调控结构域与所述转录激活结构域之间。优选地,利用连接肽将调控结构域、多聚化结构域与转录激活结构域相连。在优选的实施方式中,所述嵌合型别构转录因子还包含核定位信号肽,所述核定位信号肽可位于嵌合型别构转录因子的N端或C端;或者位于调控结构域与多聚化结构域之间、或者位于转录激活结构域与多聚化结构域之间。连接肽与核定位信号肽的特征如上文所述。
本领域技术人员能够理解的是,可根据所需的转录因子表达量选择本发明诱导系统的第一启动子(即,驱动嵌合型别构转录因子表达的启动子)。第一启动子可为常用于哺乳动物的启动子,可为组成型启动子、诱导型启动子,也可为组织特异性启动子。在本发明中,第一启动子可与驱动感兴趣的基因表达的所述诱导型启动子相同或不同。在一些实施方式中,第一启动子选自于CMV1启动子、CMVmini启动子、TRE3G启动子、EF1a核心启动子或hEF1a启动子。
在优选的实施方式中,在本发明的调控元件组以及诱导系统中添加负反馈,能够实现报告子水平的线性变换。在无负反馈的设计中,剂量响应曲线表现为S型,即,在诱导物浓度升高时报告基因表达量迅速达到饱和。而在添加负反馈后,剂量响应曲线在较宽的诱导物浓度范围内均表现为线性,且动态范围增大。不希望被理论所限地,线性化基因线路的结构类似于由阻遏蛋白调控的细菌操纵子。然而,由于在细菌中效应蛋白的功能通常在于催化生化反应,或者效应蛋白编码影响诱导物水平的运载蛋白,会产生其它反馈,因此在天然的基因线路中几乎不存在完全线性的应答[14]。考虑到原核基因线路与真核宿主的信号通路正交,可在本发明的诱导系统中增加负反馈,将S型(sigmoidal)剂量响应曲线线性化并降低双峰(bimodal)状态,从而获得具有较大线性范围的诱导系统。这些线性诱导系统对于构建复杂转录调控网络是有益的。在此类实施方式中,本发明的调控元件组进一步包含阻遏蛋白(例如TetR(US8383364B2)或CymR(WO2019175600A1))以及调控该阻遏蛋白的第三启动子,所述第三启动子包含与所述阻遏蛋白相互作用的第二操纵位点(例如tetO或cymO)。此外,所述诱导型启动子除包含与嵌合型别构转录因子相互作用的操纵位点外,进一步包含与阻遏蛋白相互作用的第二操纵位点。第二操纵位点可为一个或多个,可位于转录起始位点的上游或下游,或者多个第二操纵位点分布于转录起始位点的上游或下游。在此类实施方式中,本发明的诱导表达系统进一步包含第三基因表达盒,所述第三基因表达盒包含第三启动子序列以及阻遏蛋白的编码序列,用于在宿主细胞中表达所述阻遏蛋白,所述第三启动子序列包含核心序列以及与所述阻遏蛋白相互作用的第二操纵位点;所述诱导型启动子序列除包含与嵌合型别构转录因子相互作用的操纵位点外,进一步包含与阻遏蛋白相互作用的第二操纵位点。在一个优选的实施方式中,所述阻遏蛋白为TetR,所述第二操纵位点为tetO。所述TetR及其操纵序列tetO参见例如US8383364B2。在本发明的实施方式中,tetO为tccctatcagtgatagaga(SEQ ID NO:37的第173-191位核苷酸)。TetR的基因序列为如文献[17]所述。在一个实施方式中,所述阻遏蛋白为CymR,所述第二操纵位点为cymO。所述CymR及其操纵序列cymO例如参见CN107344962A。
鉴于本发明的嵌合型别构转录因子中调控结构域来源于群体感应系统的信号检测和应答蛋白,可将本发明的诱导系统用作细胞间通讯系统的信号接收模块。具体而言,将信号分子的生物合成基因表达盒作为信号发送元件整体置于一种细胞,使得信号发送细胞表达该信号分子体内合成所需的全部酶。另一方面,将本发明的诱导系统作为信号接收元件置于另一种细胞,从而利用信号分子作为“电线”偶联信号发送模块和信号接收模块,构建多细胞基因线路。也可模仿原核群体感应系统,将信号发送模块与本发明的诱导系统导入相同的哺乳动物细胞内,调控哺乳动物细胞在群体水平的功能。与pC、Cinn和IV诱导系统相对应的信号发送模块(信号分子的完整生物合成通路)如上文所述,并总结于表2中。
表2 pC、Cinn和IV信号发送模块
Figure BDA0003287150500000101
/>
Figure BDA0003287150500000111
由于其正交性、模块化、可调性和可组合性,可将本发明的嵌合型别构转录因子、调控元件组以及诱导系统瞬时或稳定转染至哺乳动物细胞,对宿主的基因表达进行调控。瞬时转染和稳定转染的方法为本领域公知。基于此,本发明的嵌合型别构转录因子、调控元件组以及诱导系统在构建人工组织、人工器官、人类疾病的动物模型,以及基因功能分析、生物制药、疫苗制备、基因治疗等方面也是有利的。
本领域技术人员能够理解的是,就本发明的蛋白而言,也可采用与上述催化信号分子生物合成的酶以及别构转录因子基本同源的蛋白。术语“基本同源”是指蛋白序列水平至少95%、至少98%或至少99%相同。同源序列可以是不同物种中的功能相同的序列本发明的基因或蛋白的同源物可由本领域技术人员容易地确定。此外,可基于蛋白序列对密码子进行人源化优化,提高蛋白在异源宿主中的表达强度,这是本领域公知的。
本文使用的术语“表达盒(expression cassette)”是指由一个或多个基因及控制该基因表达的序列组成的DNA片段,从而该基因编码的蛋白能够在期望的宿主细胞(即,真核细胞)中表达。本领域已知的是,表达盒中包含的控制表达的序列任选包含启动子序列、3’非编码区、转录终止位点以及多聚腺苷酸等。在本发明中,包含启动子和编码序列的表达盒可被整合至基因组或存在于质粒载体。
本文所述各方面的实施方式可由如下编号的段落说明:
1.一种用于对哺乳动物细胞中感兴趣的基因进行调控的嵌合型别构转录因子,所述嵌合型别构转录因子包含调控结构域以及转录激活结构域;其中,所述调控结构域选自于由RpaR、BjaR以及BraR所组成的组;所述转录激活结构域选自于P65、VP16、VP64、VTR1、VTR2以及VTR3;所述嵌合型别构转录因子以天然氨基酸衍生的酰基高丝氨酸内酯作为诱导剂;所述天然氨基酸衍生的酰基高丝氨酸内酯选自于由如下化合物所组成的组:对香豆酰基-高丝氨酸内酯(pC-HSL)、异戊酰基-高丝氨酸内酯(IV-HSL)以及肉桂酰基-高丝氨酸内酯(Cinn-HSL)。
2.如段落1所述的嵌合型别构转录因子,其中,所述转录激活结构域为VTR3。
3.如段落1或2所述的嵌合型别构转录因子,其中,所述调控结构域为RpaR,所述诱导剂为pC-HSL或Cinn-HSL;优选地,所述诱导剂为pC-HSL。
4.如段落1或2所述的嵌合型别构转录因子,其中,所述调控结构域BjaR,所述诱导剂为IV-HSL。
5.如段落1或2所述的嵌合型别构转录因子,其中,所述调控结构域为BraR,所述诱导剂为Cinn-HSL。
6.如段落1-5中任一项所述的嵌合型别构转录因子,其中,使用连接肽将所述调控结构域与所述转录激活结构域相连;优选地,所述连接肽的长度为20-60bp;优选地,所述连接肽具有SEQ ID NO:16的序列。
7.如段落1-5中任一项所述的嵌合型别构转录因子,其中,所述嵌合型别构转录因子进一步包含核定位信号肽,其中,所述核定位信号肽位于所述嵌合型别构转录因子的N端或C端或位于所述调控结构域与所述转录激活结构域之间,所述核定位信号肽包含1-4个核定位序列;优选地,各核定位序列的5’端和3’端独立地具有5-40bp的侧翼序列;优选地,所述核定位信号肽位于所述调控结构域与所述转录激活结构域之间;优选地,所述核定位信号肽包含2个核定位序列,各核定位序列的5’端和3’端独立地具有5-20bp的侧翼序列;优选地,所述核定位序列具有SEQ ID NO:17的序列。
8.如段落1-5中任一项所述的嵌合型别构转录因子,其中,所述嵌合型别构转录因子进一步包含多聚化结构域,优选地,所述多聚化结构域为CarH。
9.如段落8所述的嵌合型别构转录因子,其中,使用连接肽将所述调控结构域、所述多聚化结构域与所述转录激活结构域相连;优选地,所述连接肽的长度为20-60bp;优选地,所述连接肽具有SEQ ID NO:16的序列。
10.如段落8所述的嵌合型别构转录因子,其中,所述嵌合型别构转录因子进一步包含核定位信号肽,其中,所述核定位信号肽位于所述嵌合型别构转录因子的N端或C端,或者位于所述调控结构域与所述多聚化结构域之间、或者位于所述转录激活结构域与所述多聚化结构域之间,所述核定位信号肽包含1-4个核定位序列;优选地,各核定位序列的5’端和3’端独立地具有5-40bp的侧翼序列;优选地,所述核定位信号肽包含2个核定位序列,各核定位序列的5’端和3’端独立地具有5-20bp的侧翼序列;优选地,所述核定位序列具有SEQID NO:17的序列;优选地,所述核定位信号肽位于所述调控结构域与所述多聚化结构域之间、或者位于所述转录激活结构域与所述多聚化结构域之间;优选地,所述多聚化结构域的5’端和3’端进一步包含连接肽,优选地,所述连接肽各自具有20-60bp的长度;优选地,所述连接肽具有SEQ ID NO:16的序列。
11.如段落1-10中任一项所述的嵌合型别构转录因子,其中,所述哺乳动物细胞为人细胞。
12.如段落1-10中任一项所述的嵌合型别构转录因子,其中,所述哺乳动物细胞为永生化细胞、原代细胞或干细胞。
13.一种以天然氨基酸衍生的酰基高丝氨酸内酯作为诱导剂的调控元件组,所述天然氨基酸衍生的酰基高丝氨酸内酯选自于由如下化合物所组成的组:对香豆酰基-高丝氨酸内酯(pC-HSL)、异戊酰基-高丝氨酸内酯(IV-HSL)以及肉桂酰基-高丝氨酸内酯(Cinn-HSL);所述调控元件组包含:
嵌合型别构转录因子,所述嵌合型别构转录因子包含调控结构域以及转录激活结构域;其中,所述调控结构域选自于由RpaR、BjaR以及BraR所组成的组;所述转录激活结构域选自于P65、VP16、VP64、VTR1、VTR2以及VTR3;以及
在哺乳动物细胞中具有活性的诱导型启动子,所述诱导型启动子包含核心序列以及与所述嵌合型别构转录因子相互作用的至少一对操纵位点对。
14.如段落13所述的调控元件组,其中,所述嵌合型别构转录因子的转录激活结构域为VTR3。
15.如段落13或14所述的调控元件组,其中,所述嵌合型别构转录因子的调控结构域为RpaR,所述诱导型启动子的操纵位点为rpaO,所述诱导剂为pC-HSL或Cinn-HSL;优选地,所述诱导剂为pC-HSL。
16.如段落13或14所述的调控元件组,其中,所述嵌合型别构转录因子的调控结构域为BjaR,所述诱导型启动子的操纵位点为bjaO,所述诱导剂为IV-HSL。
17.如段落13或14所述的调控元件组,其中,所述嵌合型别构转录因子的调控结构域为BraR,所述诱导型启动子的操纵位点为braO、优选为R8;所述诱导剂为Cinn-HSL。
18.如段落13-17中任一项所述的调控元件组,其中,使用连接肽将所述嵌合型别构转录因子中的所述调控结构域与所述转录激活结构域相连;优选地,所述连接肽的长度为20-60bp;优选地,所述连接肽具有SEQ ID NO:16的序列。
19.如段落13-17中任一项所述的调控元件组,其中,所述嵌合型别构转录因子进一步包含核定位信号肽,其中,所述核定位信号肽位于所述嵌合型别构转录因子的N端或C端或位于所述调控结构域与所述转录激活结构域之间,所述核定位信号肽包含1-4个核定位序列;优选地,各核定位序列的5’端和3’端独立地具有5-40bp的侧翼序列;优选地,所述核定位信号肽位于所述调控结构域与所述转录激活结构域之间;优选地,所述核定位信号肽包含2个核定位序列,各核定位序列的5’端和3’端独立地具有5-20bp的侧翼序列;优选地,所述核定位序列具有SEQ ID NO:17的序列。
20.如段落13-19中任一项所述的调控元件组,其中,所述嵌合型别构转录因子进一步包含多聚化结构域,优选地,所述多聚化结构域为CarH。
21.如段落20所述的调控元件组,其中,使用连接肽将所述嵌合型别构转录因子中的所述调控结构域、所述多聚化结构域与所述转录激活结构域相连;优选地,所述连接肽各自具有20-60bp的长度;优选地,所述连接肽具有SEQ ID NO:16的序列。
22.如段落20所述的调控元件组,其中,所述嵌合型别构转录因子进一步包含核定位信号肽,其中,所述核定位信号肽位于所述嵌合型别构转录因子的N端或C端,或者位于所述调控结构域与所述多聚化结构域之间、或者位于所述转录激活结构域与所述多聚化结构域之间,所述核定位信号肽包含1-4个核定位序列;优选地,各核定位序列的5’端和3’端独立地具有5-40bp的侧翼序列;优选地,所述核定位信号肽包含2个核定位序列,各核定位序列的5’端和3’端独立地具有5-20bp的侧翼序列;优选地,所述核定位序列具有SEQ ID NO:17的序列;优选地,所述核定位信号肽位于所述调控结构域与所述多聚化结构域之间、或者位于所述转录激活结构域与所述多聚化结构域之间;优选地,所述多聚化结构域的5’端和3’端进一步包含连接肽,优选地,所述连接肽的各自具有20-60bp的长度;优选地,所述连接肽具有SEQ ID NO:16的序列。
23.如段落13-22中任一项所述的调控元件组,其中,所述诱导型启动子的核心序列选自于CMV1启动子、CMVmini启动子、TRE3G启动子、EF1a核心启动子或hEF1a启动子;优选地,所述核心序列为CMV1启动子或TRE3G启动子。
24.如段落13-23中任一项所述的调控元件组,其中,所述操纵位点对为1对或多对;优选地,所述操纵位点对为1对;优选地,各操纵位点分别位于转录起始位点的上游和下游。
25.如段落13-24中任一项所述的调控元件组,所述调控元件组进一步包含阻遏蛋白以及第三启动子,其中,所述第三启动子驱动所述阻遏蛋白的表达,所述第三启动子包含与所述阻遏蛋白相互作用的第二操纵位点;其中,所述诱导型启动子进一步包含所述第二操纵位点。
26.如段落25所述的调控元件组,其中,所述阻遏蛋白为TetR,所述第二操纵位点为tetO;或者,所述阻遏蛋白为CymR,所述第二操纵位点为cymO。
27.如段落13-26中任一项所述的调控元件组,其中,所述哺乳动物细胞为人细胞。
28.如段落13-26中任一项所述的调控元件组,其中,所述哺乳动物细胞为永生化细胞、原代细胞或干细胞。
29.一种对哺乳动物细胞中感兴趣的基因进行诱导表达的系统,所述诱导表达系统利用天然氨基酸衍生的酰基高丝氨酸内酯作为诱导剂,所述天然氨基酸衍生的酰基高丝氨酸内酯选自于由如下化合物所组成的组:对香豆酰基-高丝氨酸内酯(pC-HSL)、异戊酰基-高丝氨酸内酯(IV-HSL)以及肉桂酰基-高丝氨酸内酯(Cinn-HSL);所述诱导表达系统包含:
第一基因表达盒,所述第一基因表达盒包含第一启动子序列以及嵌合型别构转录因子的编码序列,其中,所述嵌合型别构转录因子包含调控结构域以及转录激活结构域;所述调控结构域选自于由RpaR、BjaR以及BraR所组成的组;所述转录激活结构域选自于P65、VP16、VP64、VTR1、VTR2以及VTR3;以及
第二基因表达盒,所述第二基因表达盒包含诱导型启动子序列以及所述感兴趣的基因的编码序列,所述诱导型启动子序列包含与所述嵌合型别构转录因子相互作用的至少一对操纵位点对。
30.如段落29所述的诱导表达系统,其中,所述第一基因中所述嵌合型别构转录因子的转录激活结构域为VTR3。
31.如段落29或30所述的诱导表达系统,其中,所述第一基因中所述嵌合型别构转录因子的调控结构域为RpaR,所述第二基因中所述诱导型启动子的操纵位点为rpaO,所述诱导剂为pC-HSL或Cinn-HSL;优选地,所述诱导剂为pC-HSL。
32.如段落29或30所述的诱导表达系统,其中,所述第一基因中所述嵌合型别构转录因子的调控结构域为BjaR,所述第二基因中所述诱导型启动子的操纵位点为bjaO,所述诱导剂为IV-HSL。
33.如段落29或30所述的诱导表达系统,其中,所述第一基因中所述嵌合型别构转录因子的调控结构域为BraR,所述第二基因中所述诱导型启动子的操纵位点为braO、优选R8,所述诱导剂为Cinn-HSL。
34.如段落29-33中任一项所述的诱导表达系统,其中,在所述第一基因中,使用连接肽将所述调控结构域与所述转录激活结构域相连;优选地,所述连接肽的长度为20-60bp;优选地,所述连接肽具有SEQ ID NO:16的序列。
35.如段落29-33中任一项所述的诱导表达系统,其中,所述第一基因的所述嵌合型别构转录因子进一步包含核定位信号肽,其中,所述核定位信号肽位于所述嵌合型别构转录因子的N端或C端或位于所述调控结构域与所述转录激活结构域之间,所述核定位信号肽包含1-4个核定位序列;优选地,各核定位序列的5’端和3’端独立地具有5-40bp的侧翼序列;优选地,所述核定位信号肽位于所述调控结构域与所述转录激活结构域之间;优选地,所述核定位信号肽包含2个核定位序列,各核定位序列的5’端和3’端独立地具有5-20bp的侧翼序列;优选地,所述核定位序列具有SEQ ID NO:17的序列。
36.如段落29-35中任一项所述的诱导表达系统,其中,所述第一基因的所述嵌合型别构转录因子进一步包含多聚化结构域,优选地,所述多聚化结构域为CarH。
37.如段落36所述的诱导表达系统,其中,使用连接肽将所述嵌合型别构转录因子中的所述调控结构域、所述多聚化结构域与所述转录激活结构域相连;优选地,所述连接肽各自具有20-60bp的长度;优选地,所述连接肽具有SEQ ID NO:16的序列。
38.如段落36所述的诱导表达系统,其中,所述嵌合型别构转录因子进一步包含核定位信号肽,其中,所述核定位信号肽位于所述嵌合型别构转录因子的N端或C端,或者位于所述调控结构域与所述多聚化结构域之间、或者位于所述转录激活结构域与所述多聚化结构域之间,所述核定位信号肽包含1-4个核定位序列;优选地,各核定位序列的5’端和3’端独立地具有5-40bp的侧翼序列;优选地,所述核定位信号肽包含2个核定位序列,各核定位序列的5’端和3’端独立地具有5-20bp的侧翼序列;优选地,所述核定位序列具有SEQ IDNO:17的序列;优选地,所述核定位信号肽位于所述调控结构域与所述多聚化结构域之间、或者位于所述转录激活结构域与所述多聚化结构域之间;优选地,所述多聚化结构域的5’端和3’端进一步包含连接肽,优选地,所述连接肽各自具有20-60bp的长度;优选地,所述连接肽具有SEQ ID NO:16的序列。
39.如段落29-38中任一项所述的诱导表达系统,其中,所述第一基因中所述第一启动子为组成型启动子或诱导型启动子。
40.如段落29-39中任一项所述的诱导表达系统,其中,所述第二基因中所述诱导型启动子的核心序列选自于CMV1启动子、CMVmini启动子、TRE3G启动子、EF1a核心启动子或hEF1a启动子;优选地,所述核心序列为CMV1启动子或TRE3G启动子。
41.如段落29-40中任一项所述的诱导表达系统,其中,所述第二基因中所述操纵位点对为1对或多对;优选地,所述操纵位点对为1对;优选地,各操纵位点分别位于转录起始位点的上游和下游。
42.如段落29-41中任一项所述的诱导表达系统,所述诱导表达系统进一步包含第三基因表达盒,其中,所述第三基因表达盒包含第三启动子序列以及阻遏蛋白的编码序列,用于在宿主细胞中表达所述阻遏蛋白,所述第三启动子序列包含第二操纵位点,所述第二操纵位点与所述阻遏蛋白相互作用;所述第二基因的诱导型启动子序列进一步包含第二操纵位点。
43.如段落42所述的诱导表达系统,其中,所述阻遏蛋白为TetR,所述第二操纵位点为tetO;或者,所述阻遏蛋白为CymR,所述第二操纵位点为cymO。
44.如段落42或43所述的诱导表达系统,其中,所述第三基因中所述第三启动子的核心序列选自于CMV1启动子、CMVmini启动子、TRE3G启动子、EF1a核心启动子或hEF1a启动子;优选地,所述核心序列为CMV1启动子或TRE3G启动子。
45.如段落29-44中任一项所述的诱导表达系统,其中,所述哺乳动物细胞为人细胞。
46.如段落29-44中任一项所述的诱导表达系统,其中,所述哺乳动物细胞为永生化细胞、原代细胞或干细胞。
47.段落1-12中任一项所述的嵌合型别构转录因子、段落13-28中任一项所述的调控元件组、段落29-46中任一项所述的诱导表达系统在构建单细胞或多细胞信号通讯系统中的用途,其中,所述信号通讯系统包含信号发送元件和信号接收元件,所述信号接收元件包含嵌合型别构转录因子以及在哺乳动物细胞中具有活性的诱导型启动子。
48.如段落47所述的用途,其中,所述信号通讯系统的信号分子为pC-HSL;所述嵌合型别构转录因子中所述调控结构域为RpaR,所述诱导型启动子包含核心序列以及至少一对rpaO;所述信号发送元件包含TAL、4CL以及RpaI。
49.如段落47所述的用途,其中,所述信号通讯系统的信号分子为Cinn-HSL;所述嵌合型别构转录因子中所述调控结构域为BraR,所述诱导型启动子包含核心序列以及至少一对braO;所述信号发送元件包含PAL、4CL以及BraI。
50.如段落47所述的用途,其中,所述信号通讯系统的信号分子为IV-HSL;所述嵌合型别构转录因子中所述调控结构域为BjaR,所述诱导型启动子包含核心序列以及至少一对bjaO;所述信号发送元件包含支链α-酮酸脱氢酶复合物BCDH以及BjaI。
51.段落1-12中任一项所述的嵌合型别构转录因子、段落13-28中任一项所述的调控元件组、段落29-46中任一项所述的诱导表达系统在基因功能分析、构建人类疾病模型、人造组织或人造器官方面的用途。
52如段落51所述的用途,其中,将所述嵌合型别构转录因子、所述调控元件组或所述诱导表达系统稳定转染至哺乳动物细胞。
53如段落51所述的用途,其中,将所述嵌合型别构转录因子、所述调控元件组或所述诱导表达系统瞬时转染至哺乳动物细胞。
实施例
如图1A所示,本发明的嵌合型别构转录因子具有原核来源的调控结构域和真核来源的转录激活结构域,由调控结构域实现对诱导剂的应答,由转录激活结构域触发哺乳动物细胞中基因的转录。
Cinn诱导系统操纵序列的识别和优化
在慢生根瘤菌(Bradyrhizobium)中,由LuxI的同源蛋白BraI催化Cinn-HSL的生物合成,并由LuxR同源蛋白BraR检测该信号。在群体感应系统中,为实现对群体密度的应答,诱导物小分子通常能够对自诱导物合成酶LuxI的转录进行正调控,换言之,LuxI的启动子区应包含LuxR的操纵位点,LuxI的转录由AHL和LuxR共同激活。酰基高丝氨酸内酯依赖型基因的启动子区通常具有18-20bp的倒置重复序列,然而,未能根据上述特征在BraI启动子区识别到与BraR相互作用的操纵位点[5]
针对这一问题,我们利用BLAST方法比较了四种慢生根瘤菌BTAi1、ORS285、Bradyrhizobium oligotrophicum S58以及ORS278的BraR-BraI操纵子区域(NCBI序列号分别为CP000494.1、LT859959.1、AP012603.1以及CU234118)的序列相似度。图2A显示了BTAi1、ORS285、Bradyrhizobium oligotrophicum S58以及ORS278四种慢生根瘤菌中BraR终止子至BraI启动子-10区之间的区域(分别以NC、ORS、APO以及CUS表示),我们推测该序列包含与BraR相互作用的操纵位点braO。此外,为确保操纵位点完全包括在推定区域内,进一步测试了CUL序列,其为包含上游45bp的CUS。将NC、ORS、APO、CUS以及CUL分别成对插入至TRE3G核心启动子的上游,并在下游连接Citrine黄色荧光蛋白编码序列作为报告基因,利用Cinn-HSL对上述各诱导系统进行诱导发现,其灵敏度和动态范围差别不大(图2B,EC50为1.1-1.4nM,动态范围为18.5-37.7),表明不同慢生根瘤菌的Bra操纵序列性能相近。在进一步的实施例中,基于CUS序列进行进一步优化。
如图2C所示,从不同位置将CUS截短。其中,F1、F2、F4、F7从5’端截短;R1、R4、R6、R7以及R8从3’端截短。将上述操纵序列插入TRE3G核心启动子的上游构建诱导型启动子,并进行诱导表达。在0和10-6mol/L的Cinn-HSL诱导条件下,上述9种启动子下游报告基因的荧光强度改变如图2D所示。包含F2、F4和F7启动子的诱导系统不响应Cinn-HSL的诱导,表明其Bra操纵位点被破坏,而由R1、R4、R7以及R8诱导的荧光强度改变不大,表明它们几乎完全保留了操纵序列。如图2E所示,包含一对R8操纵序列的启动子P2XR8-TRE3G与包含一对全长CUS操纵序列的启动子PCUS-TRE3G诱导性能相近(EC50分别为4.9nM和9.3nM,动态范围分别为35.5和74.1)。综合考虑操纵序列长度和诱导强度,将R8作为最小操纵序列(18bp)。在进一步的实施方式中,对于Cinn诱导系统,将包含两个R8操纵序列的P2XR8-TRE3G启动子用作诱导型启动子;将真核转录激活结构域VTR3与调控结构域BraR融合构建VTR3-BraR嵌合型别构转录因子,借助流式细胞术检测各Cinn-HSL浓度下的剂量响应曲线。
pC与IV诱导系统的设计
对于pC诱导系统,将真核转录激活结构域VTR3与调控结构域RpaR融合构建VTR3-RpaR嵌合型别构转录因子;将两个rpaO操纵序列插入至TRE3G核心启动子的上游,构建获得PrpaO-TRE3G启动子;并在下游连接Citrine黄色荧光蛋白编码序列作为报告基因。诱导剂pC-HSL不存在的情况下,VTR3-RpaR不能与rpaO结合,报告基因的表达处于关闭状态。pC-HSL与VTR3-RpaR的结合将该嵌合型别构转录因子引导至PrpaO-TRE3G启动子的rpaO位点处,转录激活结构域VTR3触发报告基因Citrine的转录,借助流式细胞术检测各诱导物浓度下该系统的剂量响应曲线。对于IV诱导系统,将真核转录激活结构域VTR3与调控结构域BjaR融合构建VTR3-BjaR嵌合型别构转录因子;将两个bjaO操纵序列插入至TRE3G核心启动子的上游,构建获得PbjaO-TRE3G启动子;并在下游连接Citrine黄色荧光蛋白编码序列作为报告基因。诱导剂IV-HSL不存在的情况下,VTR3-BjaR不能与bjaO结合,报告基因的表达处于关闭状态。IV-HSL与VTR3-BjaR的结合将该嵌合型别构转录因子引导至PbjaO-TRE3G启动子的bjaO位点处,转录激活结构域VTR3触发报告基因Citrine的转录,借助流式细胞术检测各诱导物浓度下该系统的剂量响应曲线。
各诱导系统的表征
对于各诱导系统,测定其在一系列诱导浓度下报告子的荧光强度(图1C)。利用希尔方程对诱导曲线进行拟合来计算EC50值,即半最大有效浓度,从而对诱导系统的灵敏度进行定量。如图1B和1C所示,pC、Cinn和IV诱导系统的EC50分别为8×10-7mol/L、1×10- 9mol/L、2.5×10-5mol/L。不希望被理论所限地,较低的EC50值对应于较高的灵敏度。这种信号超敏和极低的诱导物工作浓度并未在已知的其它基于AHL的哺乳动物诱导系统中发现。目前已报道的直链脂肪酸型AHL诱导系统利用VP16-TraR融合蛋白对3OC8信号进行应答,该系统的EC50为7-14μM[3],而本发明的Cinn-HSL诱导系统的EC50为1.25nM,比现有技术降低3个量级。由于可在较低的工作浓度下诱导,有效降低了诱导剂对细胞的细胞毒性。此外,3OC8诱导系统的最大诱导倍数约为20倍,而本发明的pC-HSL诱导系统的最大诱导倍数可达100倍,信噪比更高。虽然本发明的IV诱导系统本底表达较高,因此灵敏度方面不如pC诱导系统和Cinn诱导系统,然而IV诱导系统与pC诱导系统以及Cinn诱导系统的串扰均较小,可将IV诱导系统与pC或Cinn诱导系统组合使用。此外,由于本发明的诱导系统与直链脂肪酸型AHL诱导系统不存在信号串扰[5],可将本发明的诱导系统与直链脂肪酸型AHL诱导系统组合使用,在哺乳动物宿主中构建多重信号复杂调控网络或基因线路。
不同的转录激活结构域对调控性能的影响
本领域已报道能够将转录调控因子VP16、VP64、p65、SAM、VTR等作为转录激活结构域与调控结构域融合,对真核细胞中基因表达进行调控。为了比较不同转录激活结构域的效率,我们构建了VP64-BraR和VTR3-BraR两种Cinn诱导系统的别构转录因子。其中,VP64为四个重复串联的VP16,所述VP16为单纯疱疹病毒的真核转录激活结构域(WO2007058527A2)。VTR3是一种优化的VTR系列结构域。具体而言,首先将VP64、p65和RTA融合为真核转录激活结构域VTR;作为改进,第一步删除p65 N端的DNA结合域(VTR1),降低与基因组的非靶向作用;进而对于p65 C端的两个反式激活域TA1和TA2,仅保留完整TA2和部分TA1(VTR2),以便减小该结构域的尺寸;在VTR2的基础上,进一步删除部分RTA结构域,获得仅0.8kb的VTR3激活域。在哺乳动物细胞中,dCas9-VTR3的激活效率为dCas9-VP64的10倍[12]。就本发明的Cinn诱导系统而言,如图3所示,在转录因子分别为VTR3-BraR以及VP64-BraR的情况下,Cinn-HSL信号对P2XR8-TRE3G启动子激活的EC50分别为3.8×10-9mol/L和1×10-8mol/L,动态范围分别为32.2和9.5。在Cinn诱导系统中,VTR3作为转录激活结构域能够实现更好的转录开关效果。
多聚化对调控性能的影响
在原核宿主中,将多聚化结构域与阻遏蛋白融合并在启动子处设置一对或多对操纵位点,可增强调控元件的阻遏性能(CN107344962A)。为了研究在本发明的正控诱导系统中是否可采取类似的策略,我们利用连接肽将多聚化结构域CarH连接至转录因子VTR3-RpaR的转录激活结构域和调控结构域间之间,构建VTR3-CarH-RpaR嵌合转录因子。如图4B所示,在不包含多聚化结构域的情况下,pC诱导系统的EC50为8.7×10-7mol/L、动态范围为52.6;而转录因子包含CarH结构域时,pC诱导系统的EC50为1×10-7mol/L、动态范围为30.8,表明多聚化带来的协同性提高了诱导系统的灵敏度,降低诱导物的工作浓度。本领域已知的是,在负控阻遏系统中,由于阻遏蛋白多聚化后,与该阻遏蛋白相互作用的启动子序列附近的空间位阻增大,对RNA聚合酶构成的竞争性抑制更大,RNA聚合酶结合的概率减小,因而通过增加操纵位点对的个数,能够有效地降低漏表达(CN107344962A)。我们发现在TRE3G启动子上游和/或下游分别插入1对至7对rpaO操纵序列其诱导性能差别不大,表明在正控诱导系统中增加操纵位点的数量未明显提高调控元件组的诱导性能。此外,发明人还尝试利用多聚化结构域CI434构造可多聚化的转录因子,然而该设计不能提高pC诱导系统的灵敏度。
调控系统的线性化
本领域已知的是,在诱导系统中添加负反馈能够实现报告子水平的线性变换。在本发明中,将启动子区包含负反馈(包含tetO的Ptet-CMV D2i启动子)的TetR表达盒导入宿主细胞,并在诱导型启动子PrpaO-CMV1的上游和下游分别插入一个tetO操纵位点,构建双输入启动子pC-dox,该启动子能够对pC-HSL和强力霉素双重信号产生应答。如图5A和5B所示,阻遏蛋白TetR与tetO的结合封闭了pC-dox的rpaO操纵位点,阻抑报告基因的转录;在dox存在下TetR从tetO上脱离,暴露操纵位点rpaO,从而与pC-HSL结合的RpaR能够结合至rpaO,进而募集RNA聚合酶,报告基因表达;由于Ptet-CMV D2i启动子也包含tetO,dox对TetR表达的负调控使得在每一个dox浓度下都出现TetR的自适应(adaptation),因此报告基因的表达量随dox和pC-HSL的升高线性化。如图5C所示,该诱导系统在较宽的诱导物浓度范围下(0-100ng/mL的dox,10nM-10μM的pC-HSL)保持线性化应答,动态范围高达500,能够实现基因表达的精细调控。
诱导系统的正交性
由于pC-HSL与Cinn-HSL的化学结构差别仅在芳香环上的一个羟基,在天然宿主中由pC-HSL与Cinn-HSL介导的群体感应存在串扰。然而,只要同一诱导剂针对两种系统的工作浓度差异较大,就可通过降低诱导剂浓度的方式使得仅较灵敏的系统被诱导,从而将两个信号通路的正交化。为检验在哺乳动物体系下这两种诱导系统的串扰程度,我们分别以pC-HSL和Cinn-HSL作为诱导剂,对pC和Cinn两种诱导系统的信号水平串扰进行研究。如图6A所示,在pC-HSL和Cinn-HSL诱导下,Cinn信号系统的EC50分别为0.1μM和1.3nM。如图6B所示,在pC-HSL和Cinn-HSL诱导下,pC信号系统的EC50分别为0.7μM和6μM。可见,较低的Cinn-HSL浓度仅能成功诱导Cinn系统,因此可通过调节Cinn-HSL的浓度,对同时存在pC诱导系统和Cinn诱导系统的细胞或组织进行时空特异性调控。当同时存在pC和Cinn诱导系统时,采用pC-HSL作为诱导剂将导致两个系统发生信号串扰。然而,对于pC诱导系统,采用Cinn-HSL作为诱导剂能够在较低诱导剂浓度下获得更强的应答,因此也可单独使用Cinn-HSL来调控pC诱导系统。
哺乳动物细胞间通讯系统
作为一个应用实例,我们在哺乳动物细胞中重构了群体感应信号系统。如上文所述,细菌的群体感应系统利用可自由扩散的AHL为信号分子,该信号分子由LuxI家族蛋白催化合成(信号发送),并由转录因子LuxR家族蛋白检测并转导(信号接收)。类似地,本发明构建的哺乳动物细胞通讯系统中包含用于生成信号分子的信号发送模块和响应信号的信号接收模块(图7A)。其中,信号发送模块B4YP由苯丙氨酸解氨酶PAL[9]、4-香豆酸辅酶A连接酶4CL[9]以及LuxI家族蛋白BraI组成。信号接收模块2XR8为本发明的Cinn诱导系统。其中,第一基因包含启动子hEF1a以及嵌合型别构转录因子VTR3-BraR的编码序列,第二基因包含诱导型启动子P2XR8-TRE3G以及报告基因Citrine。阴性对照为仅包含信号接收模块2XR8(图7B)。如图7C的FITC通道所示,包含该通讯系统的哺乳动物细胞中报告基因的表达表现为密度依赖性质。接种密度较低(104细胞/mL)的哺乳动物细胞群体中,单个细胞中报告基因的表达明显低于接种密度较高(106细胞/mL)的群体,而作为转染标记的mCherry的表达量不随接种密度变化(ECD通道)。由于不能合成信号分子,仅包含接收模块的对照细胞不表达Citrine,仅表达转染标记mCherry(ECD通道)。
方法
表3实施例中涉及的诱导系统
Figure BDA0003287150500000191
Figure BDA0003287150500000201
上述诱导系统中的报告基因均为Citrine[15]
质粒的构建
对于pC诱导系统,首先将VTR3(SEQ ID NO:41)连接至核定位信号肽(SEQ ID NO:38)的5’端并将RpaR(NCBI登录号为WP_011155889.1反义链第348672-349403bp)连接至该核定位信号肽的3’端,来构建别构转录因子VTR3-RpaR的编码序列。该核定位信号肽包含两个核定位序列(SEQ ID NO:17),在两个核定位序列之间、5’端以及3’端各具有20bp随机序列。将两个rpaO操纵序列插入至TRE3G核心启动子的上游,获得PrpaO-TRE3G启动子;并在下游连接Citrine黄色荧光蛋白编码序列作为报告基因。包含VTR3-RpaR以及诱导型启动子-报告基因的质粒还组成型表达mCherry红色荧光蛋白,以便对质粒转染进行内部监控。当pC-HSL存在时,VTR3-RpaR能够与rpaO结合从而激活Citrine报告基因的表达。具体而言,利用Gibson assembly按照以下顺序将各元件组装到pcDNA3.1(+)质粒(Invitrogen,catalog#V790-20)上:PrpaO-TRE3G启动子;Citrine报告基因[15];hEF1a启动子(来自人克隆RP11-505P46号染色体DNA(NCBI登录号AL603910.6)的114743-113562bp区段);VTR3-RpaR;EF1启动子[8];mCherry报告基因[16]。其中,每个蛋白编码序列之后都带有poly(A)序列。
就具有多聚化结构域的别构转录因子VTR3-CarH-RpaR而言,其5’端至3’端分别是VTR3(SEQ ID NO:41)、核定位信号肽(SEQ ID NO:38)、连接肽(SEQ ID NO:16)、CarH(SEQID NO:18)、连接肽(SEQ ID NO:16)以及RpaR(NCBI登录号为WP_011155889.1反义链第348672-349403bp)。
就IV诱导系统而言,嵌合型别构转录因子VTR3-BjaR的5’端至3’端分别是VTR3(SEQ ID NO:41)、核定位信号肽(SEQ ID NO:38)以及BjaR(SEQ ID NO:43)。其中,BjaR为根据BjaR蛋白序列(WP_011083882.1)经人源密码子优化获得。类似于pC诱导系统的构建,利用Gibson assembly按照以下顺序将各元件组装到pcDNA3.1(+)质粒(Invitrogen,catalog#V790-20)上:PbjaO-TRE3G启动子;Citrine报告基因;hEF1a启动子;VTR3-BjaR;EF1启动子;mCherry报告基因,得到IV诱导系统质粒。
对于Cinn诱导系统,嵌合型别构转录因子VTR3-BraR的5’端至3’端分别是VTR3(SEQ ID NO:41)、核定位信号肽(SEQ ID NO:38)以及BraR(SEQ ID NO:42)。其中,BraR为根据BraR蛋白序列(CAL74858.1)经人源密码子优化获得。利用Gibson assembly按照以下顺序将各元件组装到pcDNA3.1(+)质粒(Invitrogen,catalog#V790-20)上:Cinn-HSL诱导型启动子;Citrine报告基因;hEF1a启动子;VTR3-BraR或VP64-BraR(VP64的NCBI登录号:ASW25882.1);EF1启动子;mCherry报告基因,得到Cinn诱导系统质粒。其中,Cinn-HSL诱导型启动子为其操纵序列来自于不同菌株的启动子PCUS-TRE3G、PAPO-TRE3G、PNC-TRE3G、PORS-TRE3G、PCUL-TRE3G;上游截短的启动子PF1-TRE3G、PF2-TRE3G、PF4-TRE3G、PF7-TRE3G;下游截短的启动子PR1-TRE3G、PR4-TRE3G、PR6-TRE3G、PR7-TRE3G、PR8-TRE3G以及优化后的启动子P2XR8-TRE3G
对于pC-dox双诱导系统,首先通过反向PCR将pC诱导系统的PRpaO-TRE3G启动子换成PRpaO-CMV1启动子(SEQ ID NO:39),然后用反向PCR在PRpaO-CMV1启动子的转录起始位点(Inr)上下游各加入一个tetO,得到能够同时响应pC-HSL和dox信号的pC-dox诱导型启动子。用反向PCR去除质粒pDN-D2irTNG4kwh(addgen#44722)上的GFP编码区域,然后PCR扩增该质粒整个TetR表达元件(从CMV enhancer开始到bGH poly A结束,该表达元件包含启动子Ptet-CMV D2i)。接下来通过NotI单酶切,将PCR扩增的两端带有NotI位点的TetR表达元件插入含有pC-dox启动子的pC诱导系统中,构建成最终的pC-dox诱导系统的接收器。
B4YP-2XR8信号通讯系统:如图7所示,该信号通讯系统的信号接收模块2XR8为Cinn诱导系统(诱导型启动子为P2XR8-TRE3G)。该信号通讯系统的信号发送模块B4YP包含BraI、4CL及PAL三个基因。利用Gibson assembly将PB载体(PB513B-1)上的CMV启动子到SV40为止整个基因表达框序列替换为EF1a核心启动子(SEQ ID NO:40)、BraI(SEQ ID NO:44)和hGH-PA(polyA区),得到EF1a-BraI表达质粒。类似地,利用Gibson assembly将PB载体上的CMV启动子到SV40为止整个基因表达框序列替换为EF1a核心启动子(SEQ ID NO:40)、4CL(NCBI登录号:CP066699.1第1990899-1992794bp)和hGH-PA,得到EF1a-4CL表达质粒。利用Gibson assembly将PB载体上的CMV启动子到SV40为止整个基因表达框序列替换为EF1a核心启动子(SEQ ID NO:40)、PAL(SEQ ID NO:45)和hGH-PA,得到EF1a-PAL表达质粒。其中,BraI为根据BraR蛋白序列(CAL74857.1)经人源密码子优化获得;PAL为根据PAL蛋白序列(XP_016272209.1)经人源密码子优化获得。就三个表达质粒的组装而言,首先构建ES质粒:在PB质粒5’绝缘子和CMV启动子之间插入RFP表达盒作为细菌筛选标记,在SV40 PA和3’绝缘子之间插入EF1启动子、mCherry和SV40PA作为哺乳动物筛选标记,表达元件两端的酶切位点为I-CeuI和I-SceI;同时删除PB载体上从CMV启动子开始到SV40 PA止的整段序列。对于表达质粒EF1a-BraI、EF1a-4CL以及EF1a-PAL,通过PCR扩增得到EF1a-BraI-hGH-PA、EF1a-4CL-hGH-PA以及EF1a-PAL-hGH-PA和三个片段,将这三个片段按照BraI-4CL-PAL的顺序通过golden gate组装整合在ES载体上,最终得到PB-EF1a-BraI-EFa-4cl-EF1a-PAL(B4YP)。就信号发送和接收模块的组装而言,扩增2XR8模块的Citrine/VTR3-BraR/mCherry表达盒并在两端添加I-CeuI和I-SceI酶切位点。对上述扩增产物和质粒pEF1a-B4YP进行I-CeuI和I-SceI双酶切并用T4 DNA连接酶连接,即得到单质粒的细胞通讯系统p2XR8-B4YP。
哺乳动物细胞的培养及转染
小分子诱导物pC-HSL购自Sigma(货号7077),Cinn-HSL和IV-HSL为由深圳乾延药物研发科技有限公司合成。
在37℃、5%CO2的培养条件下,将人胚胎肾细胞系293T(HEK-293T,ATCC:CRL-11268)接种于添加有10%胎牛血清(Gibco)和1%青链霉素(Hyclone)的DMEM高糖培养基(Hyclone,含丙酮酸钠)中进行培养。在24孔细胞培养板的各孔中按照2×105细胞/ml接种,培养1天后使用Lipofectamine(Thermo)标准方案实施转染:将1μg质粒DNA与25μl DMEM混匀,然后加入2μl P3000混匀,将混匀后的DNA/P3000/DMEM加入混有2μlLipofectamine3000的25μl DMEM中,室温孵育15min。将孵育好的DNA/Lipofectamine复合物滴加入培养有293T细胞的24孔板各孔中,将细胞放回培养箱继续培养。在转染6h后向细胞加入不同浓度的小分子诱导物,在5%CO2、37℃培养箱中诱导40h左右后收集样品进行流式分析。就包含多聚化结构域的pC诱导系统而言,在转染后6h向细胞加入不同浓度的pC-HSL并同时加入终浓度为15nM的维生素B12。
流式样品的收集及数据处理
对于经诱导的细胞,用PBS缓冲液清洗两次除去残留的培养基后,在各孔中加入25μl0.25%的胰酶(Gibco)室温孵育1min,随后加入150μl DMEM完全培养基,反复吹打细胞使其成为单细胞状态。在96孔板中加入经分散处理的细胞悬液,1000rpm离心5min,吸去130μl上清,用110μl 4%多聚甲醛固定液(博士德)重悬细胞,随后用Beckman CytoFLEX S流式细胞仪的FITC通道和ECD通道检测全部样品的荧光信号。
使用Beckman CytoFLEX S流式细胞仪自带软件CytExpert对流式数据进行分析,基于未转染的293T细胞的荧光强度设门。将ECD+群体的平均FITC作为各样品的输出值。对于pC-dox诱导系统,减掉背景自发荧光。本文示出的全部流式细胞数据为至少三次重复的平均值,S.D.为各次测量的标准差。
显微镜观察
按照本文所述的Lipofectamine转染方法将p2XR8-B4YP转染至293T细胞,转染24h后用PBS缓冲液清洗两次除去残留的培养基,用胰酶消化法使细胞从孔板底部脱落。随后按照104细胞/mL或106细胞/mL将细胞接种至24孔板,加入新鲜DMEM完全培养基培养,24h后用荧光显微镜EVOS7000(Thermo)检测接收器报告基因Citrine的表达。
诱导系统灵敏度的定量拟合
为了确定各诱导系统的灵敏度和动态范围,利用如下的希尔方程对实验测得的剂量响应曲线进行拟合。
Figure BDA0003287150500000221
/>
其中,y是报告子Citrine的荧光强度(输出),ymin为输出的最小值,ymax为输出的最大值。拟合得到的K为当输出值为半最大值时的输入信号浓度,即EC50理论值。该诱导曲线的动态范围为ymax/ymin
参考文献
1Weber W.,et.al.,NAR 2003 31(14)e71,https://doi.org/10.1093/nar/gng071.
2.Shiner E.,et.al.,Biol.Proced.Online 2004;6(1):268-276,doi:10.1251/bpo98.
3.Neddermann P.,et.al.,EMBO reports Vol 4,NO 2,2003.
4.Loew R.,et al.,BMC Biotechnology 2010,10:81.
5.Lindemann A.,et.al.,PNAS 2011 108(40)16765-16770.
6.Fuqua C.,et.al.,Annu Rev Microbiol.1996;50:727-51.doi:10.1146/annurev.micro.50.1.727.
7.Ahlgren N.,et.al.,PNAS 2011 108(17)7183-7188.
8.Du P.,et.al.,Nature Communications Vol 11,Article number:4226(2020)
9.Jiang H.,et.al.,Appl Environ Microbiol.2005;71(6):2962–2969.
10.Gilbert L.,et.al.,Cell 2013;154:442-451.
11.Chavez A.,et.al.,Nat Methods.2015;12(4):326-8.
12.Ma D.,et.al.,ACS Synth.Biol.2018,7,978-985.
13.Wang R.,et.al.,PNAS 2017;114(23):5912–5917.
14.Nevozhay D.,et.al.,PNAS 2009 106(13)5123-5128.
15 Ahmed,A.,et.al.,PNAS 97(22)11996-12001;https://doi.org/10.1073/pnas.97.22.11996(2000).16.Shaner NC.,et.al.,Nat Biotechnol.2004;22(12):1567-72.
17.Stanton,BC.,et al.,Nat Chem Biol 10,99-105,doi:10.1038/nchembio.1411(2014).
序列表
<110> 中国科学院深圳先进技术研究院
<120> 用于哺乳动物体系的嵌合型别构转录因子、调控元件组和诱导表达系统
<160> 45
<170> SIPOSequenceListing 1.0
<210> 1
<211> 172
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 1
ctcgagagct cggtacccgg gtcgaggtag gcgtgtacgg tgggaggcct atataagcag 60
agctcgttta gtgaaccgtc agatcgcctg gagacgccat ccacgctgtt ttgacctcca 120
tagaagacac cgggaccgat ccagcctccg cggcaaactt atcgatgcca cc 172
<210> 2
<211> 39
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 2
ggtaggcgtg tacggtggga ggcctatata agcagagct 39
<210> 3
<211> 152
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 3
ctcgagagcc tcggtacccg ggtcgaggta ggcgtgtacg gtgggcgcct ataaaagcag 60
agctcgttta gtgaaccgtc agatcgcctg gagcaattcc acaacacttt tgtcttatac 120
caactttccg taccacttcc taccctcgta aa 152
<210> 4
<211> 1299
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 4
ggaatcccag ggaccgtcgt taaactccca ctaacgtaga acccagagat cgctgcgttc 60
ccgccccctc acccgcccgc tctcgtcatc actgaggtgg agaagagcat gcgtgaggct 120
ccggtgcccg tcagtgggca gagcgcacat cgcccacagt ccccgagaag ttggggggag 180
gggtcggcaa ttgaaccggt gcctagagaa ggtggcgcgg ggtaaactgg gaaagtgatg 240
tcgtgtactg gctccgcctt tttcccgagg gtgggggaga accgtatata agtgcagtag 300
tcgccgtgaa cgttcttttt cgcaacgggt ttgccgccag aacacaggta agtgccgtgt 360
gtggttcccg cgggcctggc ctctttacgg gttatggccc ttgcgtgcct tgaattactt 420
ccacgcccct ggctgcagta cgtgattctt gatcccgagc ttcgggttgg aagtgggtgg 480
gagagttcga ggccttgcgc ttaaggagcc ccttcgcctc gtgcttgagt tgaggcctgg 540
cttgggcgct ggggccgccg cgtgcgaatc tggtggcacc ttcgcgcctg tctcgctgct 600
ttcgataagt ctctagccat ttaaaatttt tgatgacctg ctgcgacgct ttttttctgg 660
caagatagtc ttgtaaatgc gggccaagat ctgcacactg gtatttcggt ttttggggcc 720
gcgggcggcg acggggcccg tgcgtcccag cgcacatgtt cggcgaggcg gggcctgcga 780
gcgcggccac cgagaatcgg acgggggtag tctcaagctg gccggcctgc tctggtgcct 840
ggcctcgcgc cgccgtgtat cgccccgccc tgggcggcaa ggctggcccg gtcggcacca 900
gttgcgtgag cggaaagatg gccgcttccc ggccctgctg cagggagctc aaaatggagg 960
acgcggcgct cgggagagcg ggcgggtgag tcacccacac aaaggaaaag ggcctttccg 1020
tcctcagccg tcgcttcatg tgactccacg gagtaccggg cgccgtccag gcacctcgat 1080
tagttctcga gcttttggag tacgtcgtct ttaggttggg gggaggggtt ttatgcgatg 1140
gagtttcccc acactgagtg ggtggagact gaagttaggc cagcttggca cttgatgtaa 1200
ttctccttgg aatttgccct ttttgagttt ggatcttggt tcattctcaa gcctcagaca 1260
gtggttcaaa gtttttttct tccatttcag gtgtcgtga 1299
<210> 5
<211> 46
<212> DNA
<213> 慢生根瘤菌BTAi1(bradyrhizobium sp.BTAi1)
<400> 5
tctggcgttt ttgccactgg aacaatcatt ggacatcggc aatctg 46
<210> 6
<211> 46
<212> DNA
<213> 慢生根瘤菌OS285(Bradyrhizobium sp. OS285)
<400> 6
tctggctttt ttgccactgg atcaagtcga gcacatcagc aatctg 46
<210> 7
<211> 46
<212> DNA
<213> Bradyrhizobium oligotrophicum(Bradyrhizobium oligotrophicum)
<400> 7
tctggcgttt tttccactgg atcaatcgaa cagcatcagc aatctg 46
<210> 8
<211> 46
<212> DNA
<213> 慢生根瘤菌ORS278(Bradyrhizobium sp. ORS278)
<400> 8
tctggctttt ctcccactgg atcatttcga gtacatcggc aaattc 46
<210> 9
<211> 90
<212> DNA
<213> 慢生根瘤菌ORS278(Bradyrhizobium sp. ORS278)
<400> 9
cgaccgttgc gaccgctctt gtcaacggcg agatctcgat ctgatctggc ttttctccca 60
ctggatcatt tcgagtacat cggcaaattc 90
<210> 10
<211> 38
<212> DNA
<213> 慢生根瘤菌ORS278(Bradyrhizobium sp. ORS278)
<400> 10
tctggctttt ctcccactgg atcatttcga gtacatcg 38
<210> 11
<211> 26
<212> DNA
<213> 慢生根瘤菌ORS278(Bradyrhizobium sp. ORS278)
<400> 11
tctggctttt ctcccactgg atcatt 26
<210> 12
<211> 20
<212> DNA
<213> 慢生根瘤菌ORS278(Bradyrhizobium sp. ORS278)
<400> 12
tctggctttt ctcccactgg 20
<210> 13
<211> 18
<212> DNA
<213> 慢生根瘤菌ORS278(Bradyrhizobium sp. ORS278)
<400> 13
tctggctttt ctcccact 18
<210> 14
<211> 20
<212> DNA
<213> 沼泽红假单胞菌(Rhodopseudomonas palustris)
<400> 14
acctgtccga tcggacagtt 20
<210> 15
<211> 20
<212> DNA
<213> 扩大重氮根瘤菌(bradyrhizobium diazoefficiens)
<400> 15
tactgggaaa tttcccaatt 20
<210> 16
<211> 30
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 16
ggaggaggcg gctccggagg cggaggaagc 30
<210> 17
<211> 27
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 17
gctgacccca agaagaagag gaaggtg 27
<210> 18
<211> 618
<212> DNA
<213> 嗜热栖热菌(Thermus thermophilus)
<400> 18
cccgaggatc tgggcaccgg actgctggaa gctctgctga gaggagatct ggctggcgct 60
gaggctctgt ttaggagagg actgaggttt tggggccccg agggcgtgct ggaacatctg 120
ctgctgcccg tgctgagaga ggtgggagag gcttggcata gaggcgaaat cggcgtggcc 180
gaagaacatc tggcctccac ctttctgaga gccagactgc aagagctgct ggacctcgcc 240
ggatttcctc ccggccctcc cgtgctggtg accacccccc ccggcgagag acacgagatc 300
ggagccatgc tggccgccta ccatctgagg agaaagggcg tgcccgctct gtatctggga 360
cccgacaccc ctctgcccga tctgagagct ctcgccagaa gactgggcgc tggagctgtg 420
gtgctgtccg ccgtgctgag cgaacctctg agggctctgc ccgacggcgc tctgaaagat 480
ctggctccta gagtgtttct gggaggacaa ggcgccggac ccgaggaggc cagaaggctg 540
ggcgccgagt acatggaaga tctgaaggga ctggctgagg ctctgtggct gcctagaggc 600
cccgagaagg aggccatt 618
<210> 19
<211> 198
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 19
acctgtccga tcggacagtt gatatcacct gtccgatcgg acagttctcg agagcctcgg 60
tacccgggtc gaggtaggcg tgtacggtgg gcgcctataa aagcagagct cgtttagtga 120
accgtcagat cgcctggagc aattccacaa cacttttgtc ttataccaac tttccgtacc 180
acttcctacc ctcgtaaa 198
<210> 20
<211> 198
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 20
tactgggaaa tttcccaatt gatatctact gggaaatttc ccaattctcg agagcctcgg 60
tacccgggtc gaggtaggcg tgtacggtgg gcgcctataa aagcagagct cgtttagtga 120
accgtcagat cgcctggagc aattccacaa cacttttgtc ttataccaac tttccgtacc 180
acttcctacc ctcgtaaa 198
<210> 21
<211> 250
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 21
tctggctttt ctcccactgg atcatttcga gtacatcggc aaattcgata tctctggctt 60
ttctcccact ggatcatttc gagtacatcg gcaaattcct cgagagcctc ggtacccggg 120
tcgaggtagg cgtgtacggt gggcgcctat aaaagcagag ctcgtttagt gaaccgtcag 180
atcgcctgga gcaattccac aacacttttg tcttatacca actttccgta ccacttccta 240
ccctcgtaaa 250
<210> 22
<211> 250
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 22
tctggcgttt tttccactgg atcaatcgaa cagcatcagc aatctggata tctctggcgt 60
tttttccact ggatcaatcg aacagcatca gcaatctgct cgagagcctc ggtacccggg 120
tcgaggtagg cgtgtacggt gggcgcctat aaaagcagag ctcgtttagt gaaccgtcag 180
atcgcctgga gcaattccac aacacttttg tcttatacca actttccgta ccacttccta 240
ccctcgtaaa 250
<210> 23
<211> 250
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 23
tctggcgttt ttgccactgg aacaatcatt ggacatcggc aatctggata tctctggcgt 60
ttttgccact ggaacaatca ttggacatcg gcaatctgct cgagagcctc ggtacccggg 120
tcgaggtagg cgtgtacggt gggcgcctat aaaagcagag ctcgtttagt gaaccgtcag 180
atcgcctgga gcaattccac aacacttttg tcttatacca actttccgta ccacttccta 240
ccctcgtaaa 250
<210> 24
<211> 250
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 24
tctggctttt ttgccactgg atcaagtcga gcacatcagc aatctggata tctctggctt 60
ttttgccact ggatcaagtc gagcacatca gcaatctgct cgagagcctc ggtacccggg 120
tcgaggtagg cgtgtacggt gggcgcctat aaaagcagag ctcgtttagt gaaccgtcag 180
atcgcctgga gcaattccac aacacttttg tcttatacca actttccgta ccacttccta 240
ccctcgtaaa 250
<210> 25
<211> 338
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 25
cgaccgttgc gaccgctctt gtcaacggcg agatctcgat ctgatctggc ttttctccca 60
ctggatcatt tcgagtacat cggcaaattc gatatccgac cgttgcgacc gctcttgtca 120
acggcgagat ctcgatctga tctggctttt ctcccactgg atcatttcga gtacatcggc 180
aaattcctcg agagcctcgg tacccgggtc gaggtaggcg tgtacggtgg gcgcctataa 240
aagcagagct cgtttagtga accgtcagat cgcctggagc aattccacaa cacttttgtc 300
ttataccaac tttccgtacc acttcctacc ctcgtaaa 338
<210> 26
<211> 195
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 26
ggcttttctc ccactggatc atttcgagta catcggcaaa ttcctcgaga gcctcggtac 60
ccgggtcgag gtaggcgtgt acggtgggcg cctataaaag cagagctcgt ttagtgaacc 120
gtcagatcgc ctggagcaat tccacaacac ttttgtctta taccaacttt ccgtaccact 180
tcctaccctc gtaaa 195
<210> 27
<211> 193
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 27
cttttctccc actggatcat ttcgagtaca tcggcaaatt cctcgagagc ctcggtaccc 60
gggtcgaggt aggcgtgtac ggtgggcgcc tataaaagca gagctcgttt agtgaaccgt 120
cagatcgcct ggagcaattc cacaacactt ttgtcttata ccaactttcc gtaccacttc 180
ctaccctcgt aaa 193
<210> 28
<211> 187
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 28
tcccactgga tcatttcgag tacatcggca aattcctcga gagcctcggt acccgggtcg 60
aggtaggcgt gtacggtggg cgcctataaa agcagagctc gtttagtgaa ccgtcagatc 120
gcctggagca attccacaac acttttgtct tataccaact ttccgtacca cttcctaccc 180
tcgtaaa 187
<210> 29
<211> 185
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 29
ccactggatc atttcgagta catcggcaaa ttcctcgaga gcctcggtac ccgggtcgag 60
gtaggcgtgt acggtgggcg cctataaaag cagagctcgt ttagtgaacc gtcagatcgc 120
ctggagcaat tccacaacac ttttgtctta taccaacttt ccgtaccact tcctaccctc 180
gtaaa 185
<210> 30
<211> 190
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 30
tctggctttt ctcccactgg atcatttcga gtacatcgct cgagagcctc ggtacccggg 60
tcgaggtagg cgtgtacggt gggcgcctat aaaagcagag ctcgtttagt gaaccgtcag 120
atcgcctgga gcaattccac aacacttttg tcttatacca actttccgta ccacttccta 180
ccctcgtaaa 190
<210> 31
<211> 178
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 31
tctggctttt ctcccactgg atcattctcg agagcctcgg tacccgggtc gaggtaggcg 60
tgtacggtgg gcgcctataa aagcagagct cgtttagtga accgtcagat cgcctggagc 120
aattccacaa cacttttgtc ttataccaac tttccgtacc acttcctacc ctcgtaaa 178
<210> 32
<211> 175
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 32
tctggctttt ctcccactgg atcctcgaga gcctcggtac ccgggtcgag gtaggcgtgt 60
acggtgggcg cctataaaag cagagctcgt ttagtgaacc gtcagatcgc ctggagcaat 120
tccacaacac ttttgtctta taccaacttt ccgtaccact tcctaccctc gtaaa 175
<210> 33
<211> 172
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 33
tctggctttt ctcccactgg ctcgagagcc tcggtacccg ggtcgaggta ggcgtgtacg 60
gtgggcgcct ataaaagcag agctcgttta gtgaaccgtc agatcgcctg gagcaattcc 120
acaacacttt tgtcttatac caactttccg taccacttcc taccctcgta aa 172
<210> 34
<211> 170
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 34
tctggctttt ctcccactct cgagagcctc ggtacccggg tcgaggtagg cgtgtacggt 60
gggcgcctat aaaagcagag ctcgtttagt gaaccgtcag atcgcctgga gcaattccac 120
aacacttttg tcttatacca actttccgta ccacttccta ccctcgtaaa 170
<210> 35
<211> 198
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 35
tctggctttt ctcccactga taagaaattc tggcttttct cccactctcg agagcctcgg 60
tacccgggtc gaggtaggcg tgtacggtgg gcgcctataa aagcagagct cgtttagtga 120
accgtcagat cgcctggagc aattccacaa cacttttgtc ttataccaac tttccgtacc 180
acttcctacc ctcgtaaa 198
<210> 36
<211> 1379
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 36
gacattgatt attgactagt tattaatagt aatcaattac ggggtcatta gttcatagcc 60
catatatgga gttccgcgtt acataactta cggtaaatgg cccgcctggc tgaccgccca 120
acgacccccg cccattgacg tcaataatga cgtatgttcc catagtaacg ccaataggga 180
ctttccattg acgtcaatgg gtggagtatt tacggtaaac tgcccacttg gcagtacatc 240
aagtgtatca tatgccaagt acgcccccta ttgacgtcaa tgacggtaaa tggcccgcct 300
ggcattatgc ccagtacatg accttatggg actttcctac ttggcagtac atctacgtat 360
tagtcatcgc tattaccatg gtgatgcggt tttggcagta catcaatggg cgtggatagc 420
ggtttgactc acggggattt ccaagtctcc accccattga cgtcaatggg agtttgtttt 480
ggcaccaaaa tcaacgggac tttccaaaat gtcgtaacaa ctccgcccca ttgacgcaaa 540
tgggcggtag gcgtgtacgg tgggaggtct atataagcat ccctatcagt gatagagatc 600
agatctccct atcagtgata gagagctgtt ttgacctcca tagaagacac cgggaccgat 660
ccagcctccg gactctagcg tttaaactta agcttggtac ccggggatcc tctagggcct 720
ctgagctatt ccagaagtag tgaagaggct tttttggagg cctaggcttt tgcaaaaagc 780
tccggatcga tcctgagaac ttcagggtga gtttggggac ccttgattgt tctttctttt 840
tcgctattgt aaaattcatg ttatatggag ggggcaaagt tttcagggtg ttgtttagaa 900
tgggaagatg tcccttgtat caccatggac cctcatgata attttgtttc tttcactttc 960
tactctgttg acaaccattg tctcctctta ttttcttttc attttctgta actttttcgt 1020
taaactttag cttgcatttg taacgaattt ttaaattcac ttttgtttat ttgtcagatt 1080
gtaagtactt tctctaatca cttttttttc aaggcaatca gggtatatta tattgtactt 1140
cagcacagtt ttagagaaca attgttataa ttaaatgata aggtagaata tttctgcata 1200
taaattctgg ctggcgtgga aatattctta ttggtagaaa caactacatc ctggtcatca 1260
tcctgccttt ctctttatgg ttacaatgat atacactgtt tgagatgagg ataaaatact 1320
ctgagtccaa accgggcccc tctgctaacc atgttcatgc cttcttcttt ttcctacag 1379
<210> 37
<211> 306
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 37
ggcctccacg gccactagta ggcgtatcac gaggcagaat ttcaggtacc acctgtccga 60
tcggacagtt gatatcacct gtccgatcgg acagttctcg agagctcggt acccgggtcg 120
aggtaggcgt gtacggtggg aggcctatat aagcagagct cgtttagtga actccctatc 180
agtgatagag acgtcagatc cctatcagtg atagagatcg cctggagacg ccatccacgc 240
tgttttgacc tccatagaag acaccgggac cgatccagcc tccgcggcaa acttatcgat 300
gccacc 306
<210> 38
<211> 114
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 38
aagggcacta gtagagctga ccccaagaag aagaggaagg tggaggccag cggttccaag 60
ggcagagctg accccaagaa gaagaggaag gtggaggcca gcggttccgg acgg 114
<210> 39
<211> 218
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 39
acctgtccga tcggacagtt gatatcacct gtccgatcgg acagttctcg agagctcggt 60
acccgggtcg aggtaggcgt gtacggtggg aggcctatat aagcagagct cgtttagtga 120
accgtcagat cgcctggaga cgccatccac gctgttttga cctccataga agacaccggg 180
accgatccag cctccgcggc aaacttatcg atgccacc 218
<210> 40
<211> 212
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 40
gggcagagcg cacatcgccc acagtccccg agaagttggg gggaggggtc ggcaattgaa 60
ccggtgccta gagaaggtgg cgcggggtaa actgggaaag tgatgtcgtg tactggctcc 120
gcctttttcc cgagggtggg ggagaaccgt atataagtgc agtagtcgcc gtgaacgttc 180
tttttcgcaa cgggtttgcc gccagaacac ag 212
<210> 41
<211> 879
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 41
ggttccggac gggctgacgc attggacgat tttgatctgg atatgctggg aagtgacgcc 60
ctcgatgatt ttgaccttga catgcttggt tcggatgccc ttgatgactt tgacctcgac 120
atgctcggca gtgacgccct tgatgatttc gacctggaca tgctgattaa ctctgccctt 180
ctgcaactcc aatttgacga tgaggacctc ggagcacttc ttggcaattc aacggacccc 240
gcagtattta ctgatcttgc cagcgtggac aattccgaat ttcaacagct cctgaaccag 300
ggaatcccgg tggctcccca tacgacagag cccatgctca tggagtaccc ggaggccatt 360
acacgccttg tgacgggcgc acagcgaccc cctgacccgg caccggctcc cttgggggct 420
cctgggcttc ccaacgggtt gctgtcaggc gacgaggact ttagctcaat cgccgacatg 480
gattttagcg ccctgttgag ccaaatcagc agcggtagcg gaagtcaacc tctcgaccct 540
gctccggcgg ttacgccaga agcaagccac cttttggagg acccggacga agaaacaagc 600
caggcggtaa aggcgctccg cgaaatggcc gacaccgtga taccccagaa ggaggaagcc 660
gccatttgcg gccaaatgga cctttcccac cctccaccac gcggccacct ggacgagctg 720
acgaccaccc tggaaagcat gaccgaggat ttgaatctgg acagcccgtt gacccccgaa 780
ttgaacgaaa tcctggacac gttcctgaat gatgagtgtt tgttgcacgc tatgcacatc 840
agcaccgggc ttagtatatt tgacacaagt ttgtttgct 879
<210> 42
<211> 726
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 42
atcgacgctt actggggaag aagggctctg gactatgtgg atgccatcga ggcctccaaa 60
acctccgcta gcgtgatcac ccagttcgag aagatgatct gcgatctggg attccacgcc 120
tacatcatgg ctggcgtgcc cgcccccggc caatctctgc agcagaccat tctggccaac 180
ggatggccta gagagtggtt cgagatgtac gctagagagc agttccacag atgcgaccct 240
atccctagac actgtgtgag cacactgaac cctttcgctt ggagcgaggt gccttacgat 300
agagaagacg accccggagc tcacgaggtg atgatgaggg ctagagactt tagactgaat 360
gagggctttt gtgtgcccat ccactacgac gatgccgtgg gcgctgtgag cattgccgga 420
gagcacccta atctggcccc cgatgctaga ggcgctctgc atctgatcag catcttcaca 480
cactctagac tgagagctct ggctagagcc acagccggca accccggcag aagactgagc 540
agaatcgagg ccgaagtgct gagctgggcc gctagaggca aaacagcttg ggagacagcc 600
agaattctgg gagtgagcga gaggaatgtg agatggcatc tggaggaagc ccagagaaag 660
ctcgccacca agaacaagac cgccaccgtg gccacagctc tggtgaatgg cgagatcagc 720
atctag 726
<210> 43
<211> 726
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 43
agtgcggtgg attatggccg tgaagccctg gactttatcg aaggcctggg tgtctaccgc 60
aaagtgccgg atgctatgaa cgcgctggaa gcggcctttg gccgttttgg tttcgaaacc 120
attatcgtca cgggcctgcc gaacccggat cagcgtttcg ctcaaatggt gctggcaaaa 180
cgttggccgg ccggttggtt taatctgtat acccagaaca attacgatcg tttcgacccg 240
gtggttcgtc tgtgccgcca aagtgttaac ccgtttgaat ggtccgaagc cccgtatgat 300
gcagaactgg aaccgagcgc agctgaagtt atgaatcgcg caggcgactt tcgtatgtct 360
cgcggtttca ttgtcccgat ccatggcctg accggttacg aagcggccgt ttcactgggc 420
ggtgtccacc tggatctgaa tccgcgttcg aaaccggcac tgcatctgat ggctatgtat 480
ggcttcgacc acatccgtcg cctgctggaa ccgacgccgt acccgtccac ccgtctgacg 540
ccgcgtgaac gcgaagtgat tagctgggca tctcagggca aaagcgcttg ggaaattggt 600
gaaatcctgc atattaccca acgtacggcg gaagaacacc tggccaccgc agctcgtaaa 660
ctgggtgccg tgaaccgcac gcatgcggtt gccctggcaa ttcgccacaa aattatcaat 720
ccgtaa 726
<210> 44
<211> 684
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 44
atgcccgaga tccacgtcgt gagaaaggac aatagggctc tgtacgagaa gtacttcgac 60
ccctactata ggctgaggca cgagatctac gtgaagcaga ggaagtggat ggatctggac 120
agacccgacg gaagagagat cgaccagttc gacaccgagg acgccgtgta tctgttctgc 180
atcgacaacg gccagctgat cggctccatg agagccgtgc ctaccgtgct gcccacactg 240
atgagcgaca tcttccccta tctgaatctg aggggacccg tgcagaggcc cgacgtgtac 300
gagctgtcta gaatcttcgt gatccccgag agaagaggag agcacgccgg acctaggatc 360
gacatgctgc tgctgaccgc catcatggag tacggcatct ccatcggact gaccggcttc 420
tccatcgtgc tggagagctg gtggctgccc agattcgaaa agtgcggctg gaaagctagg 480
cctctgggcg tgcctcacat catggacggc atgtccgtgc tggccgtgct ggtggattgc 540
gacgagacaa catggaagtc tctgtgcacc cagatcggac tgacaagacc tacactgaca 600
tggcaaggac tggaagaggt gtctagacaa gccctccccg atatctttct gcatctgcct 660
cccgccgtgc agcccgccca gtga 684
<210> 45
<211> 2139
<212> DNA
<213> 人工序列(Artificial Sequence)
<400> 45
atggcacctt cacttgattc aatctcacac tcatttgcaa acggagtggc atcagcaaag 60
caagctgtaa atggcgcttc aacaaacctt gcagtggcag gatcacacct tcctacaaca 120
caagtgacac aagtggatat cgtggagaag atgttggccg cacctactga ctcaacactt 180
gaacttgatg gatactcact taaccttgga gatgtggtgt cagcagcaag gaaaggaaga 240
ccagtgagag tgaaagattc agatgaaatc agatcaaaga ttgacaaatc agtggaattt 300
cttagatcac aactttcaat gtcagtgtac ggagtgacaa caggatttgg aggatcagca 360
gatacaagaa cagaagatgc tataagctta cagaaggcac ttcttgaaca ccaactttgc 420
ggagtgcttc cttcatcatt tgattcattt agacttggaa gaggacttga gaatagcctt 480
cctcttgaag tggtgagagg agcaatgaca atcagagtta attcactcac gcgagggcat 540
tcagcagtga gacttgtggt gcttgaagca cttacaaact ttcttaacca cggaatcaca 600
cctatcgtgc ctcttagagg aacaatctca gcatcaggag atctttcacc tctttcatac 660
attgccgccg ctataagtgg acaccctgat tcaaaggtac atgtggtgca cgagggaaaa 720
gagaagatcc tgtatgcgcg tgaggcaatg gcactcttca atctagaacc tgtggtgctt 780
ggacctaaag aaggcctggg cctggttaat ggaacagcag tgtcagcatc aatggcaaca 840
cttgcacttc acgatgcaca catgttatcg ctcttgagcc agtcacttac cgctatgact 900
gtcgaggcaa tggtgggaca cgcaggatca tttcaccctt tcctgcatga tgtgacaaga 960
cctcacccta cacaaatcga agtggcagga aacatcagaa agctattgga aggatcaaga 1020
tttgcagtgc accacgaaga agaagtgaaa gtgaaagatg atgaaggaat ccttagacaa 1080
gatagatacc ctcttagaac atcacctcaa tggcttggac ctcttgtgtc agatcttatc 1140
cacgcacacg cagtgcttac aatcgaagca ggacaatcaa caacagataa ccctcttatc 1200
gatgtggaga ataagacatc acaccacgga ggaaactttc aagcagcagc agtggcaaac 1260
acaatggaga agacgcgtct agggctcgcg cagatcggaa agctgaattt cactcagctt 1320
acagaaatgc ttaacgcagg aatgaacaga ggacttcctt catgccttgc agcagaagat 1380
ccttccctct cctatcattg taaaggactt gatattgccg ccgcggcgta tacatcagaa 1440
cttggacacc ttgcaaaccc tgtgacaaca cacgtgcaac ctgcagaaat ggcaaaccag 1500
gccgtgaact ctttagcctt gatctcagca agaagaacaa cagaatcaaa cgatgtcctc 1560
tctttactac tcgccacaca cctttactgc gtgcttcaag caatcgatct tagagcaatc 1620
gaatttgaat ttaagaagca gttcggacct gcaatcgtgt cacttatcga tcaacacttt 1680
ggaagtgcca tgactggctc gaaccttaga gatgaacttg tggagaaggt aaataagacg 1740
ctggcaaagc gcctcgaaca aacaaactca tacgatcttg tgcctagatg gcacgatgca 1800
ttctcgttcg cagcaggaac agtggtggaa gtgctttcat caacatcact ttcacttgca 1860
gcagtgaacg catggaaagt ggcagcagca gaatcagcta tatcacttac aagacaggtc 1920
agagaaacat tctggtctgc agcatcaaca tcatcacctg ctttatcgta tttatcgcct 1980
agaacacaga tattgtatgc tttcgtcaga gaagaacttg gagtgaaagc aagaagagga 2040
gatgtgtttc ttggaaagca ggaggtgaca atcggatcaa acgtgtcaaa gatatatgaa 2100
gcaatcaaat caggaagaat caacaacgtg cttcttaag 2139

Claims (10)

1.一种用于对哺乳动物细胞中感兴趣的基因进行调控的嵌合型别构转录因子,所述嵌合型别构转录因子包含调控结构域以及转录激活结构域;其中,所述调控结构域选自于由RpaR、BjaR以及BraR所组成的组;所述转录激活结构域选自于P65、VP16、VP64、VTR1、VTR2以及VTR3;所述嵌合型别构转录因子以天然氨基酸衍生的酰基高丝氨酸内酯作为诱导剂;所述天然氨基酸衍生的酰基高丝氨酸内酯选自于由如下化合物所组成的组:对香豆酰基-高丝氨酸内酯(pC-HSL)、异戊酰基-高丝氨酸内酯(IV-HSL)以及肉桂酰基-高丝氨酸内酯(Cinn-HSL)。
2.如权利要求1所述的嵌合型别构转录因子,其中,所述转录激活结构域为VTR3;
优选地,所述调控结构域为RpaR,所述诱导剂为pC-HSL或Cinn-HSL;优选地,所述诱导剂为pC-HSL;
优选地,所述调控结构域BjaR,所述诱导剂为IV-HSL;
优选地,所述调控结构域为BraR,所述诱导剂为Cinn-HSL;
优选地,使用连接肽将所述调控结构域与所述转录激活结构域相连;优选地,所述连接肽的长度为20-60bp;优选地,所述连接肽具有SEQ ID NO:16的序列;
优选地,所述嵌合型别构转录因子进一步包含核定位信号肽,其中,所述核定位信号肽位于所述嵌合型别构转录因子的N端或C端、或位于所述调控结构域与所述转录激活结构域之间,所述核定位信号肽包含1-4个核定位序列;优选地,所述核定位序列的5’端和3’端各自独立地具有5-40bp的侧翼序列;优选地,所述核定位信号肽位于所述调控结构域与所述转录激活结构域之间;优选地,所述核定位信号肽包含2个核定位序列,所述核定位序列的5’端和3’端各自独立地具有5-20bp的侧翼序列;优选地,所述核定位序列具有SEQ ID NO:17的序列;
优选地,所述嵌合型别构转录因子进一步包含多聚化结构域,优选地,所述多聚化结构域为CarH;优选地,使用连接肽将所述调控结构域、所述多聚化结构域与所述转录激活结构域相连;优选地,所述连接肽各自具有20-60bp的长度;优选地,所述连接肽具有SEQ ID NO:16的序列;优选地,所述嵌合型别构转录因子进一步包含核定位信号肽,其中,所述核定位信号肽位于所述嵌合型别构转录因子的N端或C端、或者位于所述调控结构域与所述多聚化结构域之间、或者位于所述转录激活结构域与所述多聚化结构域之间,所述核定位信号肽包含1-4个核定位序列;优选地,所述核定位序列的5’端和3’端各自独立地具有5-40bp的侧翼序列;优选地,所述核定位信号肽包含2个核定位序列,所述核定位序列的5’端和3’端各自独立地具有5-20bp的侧翼序列;优选地,所述核定位序列具有SEQ ID NO:17的序列;优选地,所述核定位信号肽位于所述调控结构域与所述多聚化结构域之间、或者位于所述转录激活结构域与所述多聚化结构域之间;优选地,所述多聚化结构域的5’端和3’端进一步包含连接肽,优选地,所述连接肽的各自独立地具有20-60bp的长度;优选地,所述连接肽具有SEQ ID NO:16的序列;
优选地,所述哺乳动物细胞为人细胞;
优选地,所述哺乳动物细胞为永生化细胞、原代细胞或干细胞。
3.一种以天然氨基酸衍生的酰基高丝氨酸内酯作为诱导剂的调控元件组,所述天然氨基酸衍生的酰基高丝氨酸内酯选自于由如下化合物所组成的组:对香豆酰基-高丝氨酸内酯(pC-HSL)、异戊酰基-高丝氨酸内酯(IV-HSL)以及肉桂酰基-高丝氨酸内酯(Cinn-HSL);所述调控元件组包含:
嵌合型别构转录因子,所述嵌合型别构转录因子包含调控结构域以及转录激活结构域;其中,所述调控结构域选自于由RpaR、BjaR以及BraR所组成的组;所述转录激活结构域选自于P65、VP16、VP64、VTR1、VTR2以及VTR3;以及
在哺乳动物细胞中具有活性的诱导型启动子,所述诱导型启动子包含核心序列以及与所述嵌合型别构转录因子相互作用的至少一对操纵位点对。
4.如权利要求3所述的调控元件组,其中,所述嵌合型别构转录因子的转录激活结构域为VTR3;
优选地,所述嵌合型别构转录因子的调控结构域为RpaR,所述诱导型启动子的操纵位点为rpaO,所述诱导剂为pC-HSL或Cinn-HSL;优选地,所述诱导剂为pC-HSL;
优选地,所述嵌合型别构转录因子的调控结构域为BjaR,所述诱导型启动子的操纵位点为bjaO,所述诱导剂为IV-HSL;
优选地,所述嵌合型别构转录因子的调控结构域为BraR,所述诱导型启动子的操纵位点为braO、优选为R8;所述诱导剂为Cinn-HSL;
优选地,使用连接肽将所述嵌合型别构转录因子中的所述调控结构域与所述转录激活结构域相连;优选地,所述连接肽的长度为20-60bp;优选地,所述连接肽具有SEQ ID NO:16的序列;
优选地,所述嵌合型别构转录因子进一步包含核定位信号肽,其中,所述核定位信号肽位于所述嵌合型别构转录因子的N端或C端、或位于所述调控结构域与所述转录激活结构域之间,所述核定位信号肽包含1-4个核定位序列;优选地,所述核定位序列的5’端和3’端各自独立地具有5-40bp的侧翼序列;优选地,所述核定位信号肽位于所述调控结构域与所述转录激活结构域之间;优选地,所述核定位信号肽包含2个核定位序列,所述核定位序列的5’端和3’端各自独立地具有5-20bp的侧翼序列;优选地,所述核定位序列具有SEQ ID NO:17的序列;
优选地,所述嵌合型别构转录因子进一步包含多聚化结构域,优选地,所述多聚化结构域为CarH;
优选地,使用连接肽将所述嵌合型别构转录因子中的所述调控结构域、所述多聚化结构域与所述转录激活结构域相连;优选地,所述连接肽各自独立地具有20-60bp的长度;优选地,所述连接肽具有SEQ ID NO:16的序列;
优选地,所述嵌合型别构转录因子进一步包含核定位信号肽,其中,所述核定位信号肽位于所述嵌合型别构转录因子的N端或C端、或者位于所述调控结构域与所述多聚化结构域之间、或者位于所述转录激活结构域与所述多聚化结构域之间,所述核定位信号肽包含1-4个核定位序列;优选地,所述核定位序列的5’端和3’端各自独立地具有5-40bp的侧翼序列;优选地,所述核定位信号肽包含2个核定位序列,所述核定位序列的5’端和3’端各自独立地具有5-20bp的侧翼序列;优选地,所述核定位序列具有SEQ ID NO:17的序列;优选地,所述核定位信号肽位于所述调控结构域与所述多聚化结构域之间、或者位于所述转录激活结构域与所述多聚化结构域之间;优选地,所述多聚化结构域的5’端和3’端进一步包含连接肽,优选地,所述连接肽各自独立地具有20-60bp的长度;优选地,所述连接肽具有SEQ ID NO:16的序列;
优选地,所述诱导型启动子的核心序列选自于CMV1启动子、CMVmini启动子、TRE3G启动子、EF1a核心启动子或hEF1a启动子;优选地,所述核心序列为CMV1启动子或TRE3G启动子;
优选地,所述操纵位点对为1对或多对;优选地,所述操纵位点对为1对;优选地,各操纵位点独立地位于转录起始位点的上游和下游;
优选地,所述调控元件组进一步包含阻遏蛋白以及第三启动子,其中,所述第三启动子驱动所述阻遏蛋白的表达,所述第三启动子包含与所述阻遏蛋白相互作用的第二操纵位点;其中,所述诱导型启动子进一步包含所述第二操纵位点;
优选地,所述阻遏蛋白为TetR,所述第二操纵位点为tetO;或者,所述阻遏蛋白为CymR,所述第二操纵位点为cymO;
优选地,所述哺乳动物细胞为人细胞;
优选地,所述哺乳动物细胞为永生化细胞、原代细胞或干细胞。
5.一种对哺乳动物中感兴趣的基因进行诱导表达的系统,所述诱导表达系统利用天然氨基酸衍生的酰基高丝氨酸内酯作为诱导剂,所述天然氨基酸衍生的酰基高丝氨酸内酯选自于由如下化合物所组成的组:对香豆酰基-高丝氨酸内酯(pC-HSL)、异戊酰基-高丝氨酸内酯(IV-HSL)以及肉桂酰基-高丝氨酸内酯(Cinn-HSL);所述诱导表达系统包含:
第一基因表达盒,所述第一基因表达盒包含第一启动子序列以及嵌合型别构转录因子的编码序列,其中,所述嵌合型别构转录因子包含调控结构域以及转录激活结构域;所述调控结构域选自于由RpaR、BjaR以及BraR所组成的组;所述转录激活结构域选自于P65、VP16、VP64、VTR1、VTR2以及VTR3;以及
第二基因表达盒,所述第二基因表达盒包含诱导型启动子序列以及所述感兴趣的基因的编码序列,所述诱导型启动子序列包含与所述嵌合型别构转录因子相互作用的至少一对操纵位点对。
6.如权利要求5所述的诱导表达系统,其中,所述第一基因中所述嵌合型别构转录因子的转录激活结构域为VTR3;
优选地,所述第一基因中所述嵌合型别构转录因子的调控结构域为RpaR,所述第二基因中所述诱导型启动子的操纵位点为rpaO,所述诱导剂为pC-HSL或Cinn-HSL;优选地,所述诱导剂为pC-HSL;
优选地,所述第一基因中所述嵌合型别构转录因子的调控结构域为BjaR,所述第二基因中所述诱导型启动子的操纵位点为bjaO,所述诱导剂为IV-HSL;
优选地,所述第一基因中所述嵌合型别构转录因子的调控结构域为BraR,所述第二基因中所述诱导型启动子的操纵位点为braO、优选R8,所述诱导剂为Cinn-HSL;
优选地,在所述第一基因中,使用连接肽将所述调控结构域与所述转录激活结构域相连;优选地,所述连接肽的长度为20-60bp;优选地,所述连接肽具有SEQ ID NO:16的序列;
优选地,所述第一基因的所述嵌合型别构转录因子进一步包含核定位信号肽,其中,所述核定位信号肽位于所述嵌合型别构转录因子的N端或C端、或位于所述调控结构域与所述转录激活结构域之间,所述核定位信号肽包含1-4个核定位序列;优选地,所述核定位序列的5’端和3’端各自独立地具有5-40bp的侧翼序列;优选地,所述核定位信号肽位于所述调控结构域与所述转录激活结构域之间;优选地,所述核定位信号肽包含2个核定位序列,所述核定位序列的5’端和3’端各自独立地具有5-20bp的侧翼序列;优选地,所述核定位序列具有SEQ ID NO:17的序列;
优选地,所述第一基因的所述嵌合型别构转录因子进一步包含多聚化结构域,优选地,所述多聚化结构域为CarH;
优选地,使用连接肽将所述嵌合型别构转录因子中的所述调控结构域、所述多聚化结构域与所述转录激活结构域相连;优选地,所述连接肽各自独立地具有20-60bp的长度;优选地,所述连接肽具有SEQ ID NO:16的序列;
优选地,所述嵌合型别构转录因子进一步包含核定位信号肽,其中,所述核定位信号肽位于所述嵌合型别构转录因子的N端或C端、或者位于所述调控结构域与所述多聚化结构域之间、或者位于所述转录激活结构域与所述多聚化结构域之间,所述核定位信号肽包含1-4个核定位序列;优选地,所述核定位序列的5’端和3’端各自独立地具有5-40bp的侧翼序列;优选地,所述核定位信号肽包含2个核定位序列,所述核定位序列的5’端和3’端各自独立地具有5-20bp的侧翼序列;优选地,所述核定位序列具有SEQ ID NO:17的序列;优选地,所述核定位信号肽位于所述调控结构域与所述多聚化结构域之间、或者位于所述转录激活结构域与所述多聚化结构域之间;优选地,所述多聚化结构域的5’端和3’端进一步包含连接肽,优选地,所述连接肽各自独立地具有20-60bp的长度;优选地,所述连接肽具有SEQ ID NO:16的序列;
优选地,所述第一基因中所述第一启动子为组成型启动子或诱导型启动子;
优选地,所述第二基因中所述诱导型启动子的核心序列选自于CMV1启动子、CMVmini启动子、TRE3G启动子、EF1a核心启动子或hEF1a启动子;优选地,所述核心序列为CMV1启动子或TRE3G启动子;
优选地,所述第二基因中所述操纵位点对为1对或多对;优选地,所述操纵位点对为1对;优选地,各操纵位点独立地位于转录起始位点的上游和下游;
优选地,所述诱导表达系统进一步包含第三基因表达盒,其中,所述第三基因表达盒包含第三启动子序列以及阻遏蛋白的编码序列,用于在宿主细胞中表达所述阻遏蛋白,所述第三启动子序列包含第二操纵位点,所述第二操纵位点与所述阻遏蛋白相互作用;所述第二基因的诱导型启动子序列进一步包含第二操纵位点;
优选地,所述阻遏蛋白为TetR,所述第二操纵位点为tetO;或者,所述阻遏蛋白为CymR,所述第二操纵位点为cymO;
优选地,所述第三基因中所述第三启动子的核心序列选自于CMV1启动子、CMVmini启动子、TRE3G启动子、EF1a核心启动子或hEF1a启动子;优选地,所述核心序列为CMV1启动子或TRE3G启动子;
优选地,所述哺乳动物细胞为人细胞;
优选地,所述哺乳动物细胞为永生化细胞、原代细胞或干细胞。
7.权利要求1或2所述的嵌合型别构转录因子、权利要求3或4所述的调控元件组、权利要求5或6所述的诱导表达系统在构建单细胞或多细胞信号通讯系统中的用途,其中,所述信号通讯系统包含信号发送元件和信号接收元件,所述信号接收元件包含嵌合型别构转录因子以及在哺乳动物细胞中具有活性的诱导型启动子。
8.如权利要求7所述的用途,其中,所述信号通讯系统的信号分子为pC-HSL;所述嵌合型别构转录因子中所述调控结构域为RpaR,所述诱导型启动子包含核心序列以及至少一对rpaO;所述信号发送元件包含TAL、4CL以及RpaI;
优选地,所述信号通讯系统的信号分子为Cinn-HSL;所述嵌合型别构转录因子中所述调控结构域为BraR,所述诱导型启动子包含核心序列以及至少一对braO;所述信号发送元件包含PAL、4CL以及BraI;
优选地,所述信号通讯系统的信号分子为IV-HSL;所述嵌合型别构转录因子中所述调控结构域为BjaR,所述诱导型启动子包含核心序列以及至少一对bjaO;所述信号发送元件包含支链α-酮酸脱氢酶复合物BCDH以及BjaI。
9.权利要求1或2所述的嵌合型别构转录因子、权利要求3或4所述的调控元件组、权利要求5或6所述的诱导表达系统在基因功能分析、或者构建人类疾病模型、人造组织或人造器官方面的用途。
10.如权利要求9所述的用途,其中,将所述嵌合型别构转录因子、所述调控元件组或所述诱导表达系统稳定转染至哺乳动物细胞;
优选地,将所述嵌合型别构转录因子、所述调控元件组或所述诱导表达系统瞬时转染至哺乳动物细胞。
CN202111150967.4A 2021-09-29 2021-09-29 用于哺乳动物体系的嵌合型别构转录因子、调控元件组和诱导表达系统 Pending CN115873125A (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN202111150967.4A CN115873125A (zh) 2021-09-29 2021-09-29 用于哺乳动物体系的嵌合型别构转录因子、调控元件组和诱导表达系统
PCT/CN2022/071023 WO2023050644A1 (zh) 2021-09-29 2022-01-10 用于哺乳动物体系的嵌合型别构转录因子、调控元件组和诱导表达系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202111150967.4A CN115873125A (zh) 2021-09-29 2021-09-29 用于哺乳动物体系的嵌合型别构转录因子、调控元件组和诱导表达系统

Publications (1)

Publication Number Publication Date
CN115873125A true CN115873125A (zh) 2023-03-31

Family

ID=85756104

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202111150967.4A Pending CN115873125A (zh) 2021-09-29 2021-09-29 用于哺乳动物体系的嵌合型别构转录因子、调控元件组和诱导表达系统

Country Status (2)

Country Link
CN (1) CN115873125A (zh)
WO (1) WO2023050644A1 (zh)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB9817704D0 (en) * 1998-08-13 1998-10-07 Zeneca Ltd Gene switch
WO2008066658A2 (en) * 2006-11-03 2008-06-05 The Trustees Of Princeton University Engineered cellular pathways for programmed autoregulation of differentiation
WO2019003228A1 (en) * 2017-06-27 2019-01-03 Technion Research & Development Foundation Limited NETWORK OF ARTIFICIAL NEURONS BASED ON DNA

Also Published As

Publication number Publication date
WO2023050644A1 (zh) 2023-04-06

Similar Documents

Publication Publication Date Title
AU2020200256B2 (en) A three-component CRISPR/Cas complex system and uses thereof
JP4585435B2 (ja) 条件複製起点をもつ環状dna分子、それらの製造方法、及び、遺伝子治療におけるそれらの使用
US6287813B1 (en) Antibiotic-based gene regulation system
CN113166738A (zh) 经改造的Cas9蛋白及其用途
WO2023227028A1 (zh) 新型Cas效应蛋白、基因编辑系统及用途
Hu et al. A combination of derepression of the lac operator-repressor system with positive induction by glucocorticoid and metal ions provides a high-level-inducible gene expression system based on the human metallothionein-IIA promoter
CN110551753B (zh) 构建强力霉素/米非司酮诱导过表达的带有荧光蛋白标记基因的双诱导表达载体
US20110003883A1 (en) Allosteric trans-splicing group i ribozyme whose activity of target-specific rna replacement is controlled by theophylline
CN117120602A (zh) 分裂的cas12系统及其使用方法
KR20220128644A (ko) 게놈 변형을 위한 높은 충실도 SpCas9 뉴클라제
Gossen et al. Tetracyclines in the control of gene expression in eukaryotes
CA2405768A1 (en) Self-extinguishing recombinases, nucleic acids encoding them and methods of using the same
CN115873125A (zh) 用于哺乳动物体系的嵌合型别构转录因子、调控元件组和诱导表达系统
WO2008116931A2 (en) Polynucleotides for enhancing expression of a polynucleotide of interest
US7273723B2 (en) Antibiotic-based gene regulation system
CN109207517B (zh) 用于基因组编辑和转录调控的药物诱导型CRISPR/Cas9系统
US20220112509A1 (en) Gene knock-in method, gene knock-in cell fabrication method, gene knock-in cell, malignant transformation risk evaluation method, cancer cell production method, and kit for use in these
EP1533375B1 (en) Method of transferring mutation into target nucleic acid
US20040231006A1 (en) Self-extinguishing recombinases, nucleic acids encoding them and methods of using the same
Renzl Aptamer-mediated transactivation of transcription utilizing CRISPR/Cas9 and a photoreceptor
WO2022197693A2 (en) System of stable gene expression in cell lines and methods of making and using the same
CN103289971A (zh) 分离的多肽及其用途
CN110724711A (zh) 一种联合调控系统及其应用
JP2011072320A (ja) 遺伝子発現抑制機能を有するdna塩基配列
KR20030033782A (ko) 캔디다 알비칸스에서 유전자 조작의 효율적 연구를 위한일련의 재조합 벡터

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination