CN114585741A

CN114585741A - 转录中继系统

Info

Publication number: CN114585741A
Application number: CN202080054299.2A
Authority: CN
Inventors: 利昂·彦-利·陈; 亚伦·罗斯·库珀; 亨利·陈
Original assignee: Okotant
Current assignee: Okotant
Priority date: 2019-05-28
Filing date: 2020-05-27
Publication date: 2022-06-03
Also published as: CA3140902A1; US20220177897A1; AU2020283935A1; EP3976795A1; MA56037A; KR20220015443A; WO2020243164A1; JP2022536257A

Abstract

本文描述的是用于在蛋白表达测定和报道测定中降低背景信号的转录中继系统。这些系统利用核酸系统，其中启动子序列控制激活报道分子转录的合成转录因子的表达。

Description

转录中继系统

交叉引用

本申请要求于2019年5月28日提交的第62/853,637号美国临时申请的权益，该申请通过引用方式以全文并入于此。

发明内容

本文描述了用于探测细胞信号传导通路响应、筛选细胞信号传导通路的拮抗剂或激动剂或发现新的细胞信号传导通路的核酸、系统和方法。本领域中先前已知的方法是利用编码报道分子的核酸近端的内源性应答元件调控的启动子。由于细胞中内源性应答元件结合启动子的“泄露”性质，因此这些方法受到报道分子高强度背景信号的困扰。此外，这些方法还存在高变异系数的问题。最后，此类方法还受到报道子激活的低绝对值的影响，导致低信噪比。本公开的核酸和系统通过使用对合成转录因子结合位点具有高度选择性的非内源性合成转录因子，来降低生物变异水平，提高报道信号的信噪比，并减少背景信号。因此，该报道分子的转录不是由内源性转录因子启动的，这有助于降低背景信号并提高报道子的信噪比。这些核酸和系统可用于筛选信号传导通路的小分子或生物激动剂或拮抗剂，如G蛋白偶联受体、受体酪氨酸激酶、离子通道和核受体。在一个广泛的方面，该系统包含编码以下的核酸：a)位于合成转录因子阅读框5’端的近端的应答元件调控的启动子；和b)能够被该合成转录因子结合的启动子元件，所述启动子元件位于报道基因阅读框5’端的近端。在此系统中，报道基因可以包含独特分子标识符(UMI)，以允许报道测定的多重化。

一方面，本文描述的是一种转录中继系统，其包括：转录因子核酸，该转录因子核酸包含应答元件调控的启动子核苷酸序列和编码合成转录因子的核苷酸序列，其中所述应答元件调控的启动子核苷酸序列位于编码所述合成转录因子的所述核苷酸序列的5’侧；和报道核酸，该报道核酸包含合成转录因子启动子核苷酸序列和编码报道子的核苷酸序列，其中所述合成转录因子启动子核苷酸序列位于编码所述报道子的所述核苷酸序列的5’侧，并且其中所述合成转录因子启动子核苷酸序列能够被所述合成转录因子结合。在某些实施方案中，所述应答元件调控的启动子核苷酸序列包含cAMP应答元件核苷酸序列、NFAT转录因子应答元件核苷酸序列、FOS启动子核苷酸序列或血清应答元件核苷酸序列。在某些实施方案中，所述合成转录因子包含来自第一转录因子的DNA结合域和来自第二转录因子的转录激活域。在某些实施方案中，所述DNA结合域来自Gal4、PPR1、Lac9或LexA。在某些实施方案中，所述DNA结合域包含与SEQ ID NO:1所示的序列具有至少约90％同一性的氨基酸序列。在某些实施方案中，所述DNA结合域包含与SEQ ID NO:1所示的序列具有至少约95％同一性的氨基酸序列。在某些实施方案中，所述DNA结合域包含SEQ ID NO:1所示的氨基酸序列。在某些实施方案中，所述DNA结合域包含SEQ ID NO:1的氨基酸序列变体。在某些实施方案中，所述转录激活域包含VP64、p65和Rta。在某些实施方案中，所述转录激活域包含与SEQID NO:14所示的序列具有至少约90％同一性的氨基酸序列。在某些实施方案中，所述转录激活域包含与SEQ ID NO:14所示的序列具有至少约95％同一性的氨基酸序列。在某些实施方案中，所述转录激活域包含SEQ ID NO:14所示的氨基酸序列。在某些实施方案中，所述转录激活域包含SEQ ID NO:14的氨基酸序列变体，其中所述序列变体增加或减少转录激活。在某些实施方案中，所述合成转录因子包含SEQ ID NO:10所示的氨基酸序列变体。在某些实施方案中，所述合成转录因子包含使所述合成转录因子去稳定化的多肽序列。在某些实施方案中，使所述合成转录因子去稳定化的所述多肽序列包含PEST或CL1多肽序列。在某些实施方案中，所述合成转录因子启动子核苷酸序列包含能够被Gal4、PPR1、Lac9或LexA结合的核苷酸序列。在某些实施方案中，报道子包括荧光蛋白、萤光素酶蛋白、β-半乳糖苷酶、β-葡糖醛酸糖苷酶、氯霉素乙酰转移酶、分泌型胎盘碱性磷酸酶或独特分子标识符。在某些实施方案中，所述报道子包括荧光蛋白、萤光素酶蛋白、β-半乳糖苷酶、β-葡糖醛酸糖苷酶、氯霉素乙酰转移酶或分泌型胎盘碱性磷酸酶，和UMI。在某些实施方案中，所述独特分子标识符对于测试多肽是特有的，其中所述测试多肽由所述报道核酸编码。在某些实施方案中，所述转录因子核酸包含位于所述应答元件调控的启动子核苷酸序列近端的核苷酸序列，所述核苷酸序列可以被转录阻遏子结合。在某些实施方案中，所述转录因子核酸包含位于所述应答元件调控的启动子核苷酸序列近端的核苷酸序列，所述核苷酸序列延伸由编码合成转录因子的所述核苷酸序列编码的mRNA的5’非翻译区。在某些实施方案中，其中由编码合成转录因子的所述核苷酸序列编码的mRNA的所述5’非翻译区包含一个或多个减少所述合成转录因子的翻译的序列。在某些实施方案中，所述转录因子核酸和所述报道核酸是单一核酸的组分。在某些实施方案中，如本文所述的是包含所述中继系统的细胞。在某些实施方案中，所述细胞包括真核细胞。在某些实施方案中，所述细胞包括哺乳动物细胞。在某些实施方案中，转录因子核酸、报道核酸或转录因子核酸和报道核酸二者作为单一拷贝整合到细胞基因组中。在某些实施方案中，如本文所述的是包含所述中继系统的细胞群。在某些实施方案中，所述细胞群包括真核细胞群。在某些实施方案中，所述细胞群包括哺乳动物细胞群。在某些实施方案中，细胞或细胞群包含高基础报道活性。在某些实施方案中，细胞或细胞群包括其中高基础报道活性比背景高至少约30倍，其中背景是针对不包含该报道子的亲本细胞或细胞系所观察到的报道活性水平。在某些实施方案中，细胞或细胞群包含报道活性的低生物变异系数。在某些实施方案中，细胞或细胞群包括其中报道活性的低生物变异系数低于约0.5。

在某些实施方案中，如本文所述的是一种用于检测测试试剂对应答元件调控的启动子的活性的影响的方法，其包括使细胞或细胞群与所述测试物质接触。在某些实施方案中，所述测试试剂是化学品。

附图说明

图1A描绘了转录中继系统的示意图，其示出了转录因子核酸(左)和报道核酸(右)。

图1B描绘了编码报道子的核酸序列，其中所述报道子包含独特RNA序列。

图2示出了携带单一整合的CRE-萤光素酶的细胞(灰色)和携带单一整合的UAS-萤光素酶伴随多个拷贝的半随机整合的CRE-Gal4-VPR的细胞(黑色)的报道输出。

图3示出了图2中描绘的每个样品的变异系数，这是三次重复操作的结果。

图4示出了Gal4-VPR启动子核苷酸序列上的去稳定化序列标签(降解决定子(degron)标签)对转录中继系统的倍数诱导的影响。

图5示出了从NFAT中继等克隆(isoclonal)细胞系产生的细胞文库。用阳性对照化合物对细胞系进行筛选，以确定其检测Gq偶联GPCR的NFAT中继报道活性的能力。产生错误发现率(FDR)低于0.001或最大Q值高于3的信号的受体-化合物组合被视为显著命中(significant hit)。在本次筛选中，文库cb29和cb37产生了最多的显著命中。

图6示出了用于产生细胞文库的等克隆细胞系的变异与基础活性。

具体实施方式

一方面，本文描述的是一种转录中继系统，其包括：(a)转录因子核酸，该转录因子核酸包含应答元件调控的启动子核苷酸序列和编码合成转录因子的核苷酸序列，其中所述应答元件调控的启动子核苷酸序列位于编码所述合成转录因子的所述核苷酸序列的5’侧；和(b)报道核酸，该报道核酸包含合成转录因子启动子核苷酸序列和编码报道子的核苷酸序列，其中所述合成转录因子启动子核苷酸序列位于编码所述报道子的所述核苷酸序列的5’侧，并且其中所述合成转录因子启动子核苷酸序列能够被所述合成转录因子结合。

另一方面，本文描述的是一种测定测试物质对应答元件调控的启动子的活性的影响的方法，其包括：(a)使细胞与测试物质接触，所述细胞包含(i)转录因子核酸，该转录因子核酸包含应答元件调控的启动子核苷酸序列和编码合成转录因子的核苷酸序列，其中所述应答元件调控的启动子核苷酸序列位于编码所述合成转录因子的所述核苷酸序列的5’侧；和(ii)报道核酸，该报道核酸包含合成转录因子启动子核苷酸序列和编码报道子的核苷酸序列，其中所述合成转录因子启动子核苷酸序列位于编码所述报道子的所述核苷酸序列的5’侧，并且其中所述合成转录因子启动子核苷酸序列能够被所述合成转录因子结合；和(b)进行至少一次测定，该测定测量所述报道子的转录。

在以下描述中，阐述了某些特定细节以提供对各种实施方案的透彻理解。然而，本领域技术人员将理解，可以在没有这些细节的情况下实践所提供的实施方案。除非上下文另有要求，否则在整个说明书和随后的权利要求书中，词语“包含”及其变体，诸如“包括”应被解释为开放、包容性的，即“包括但不限于”。除非上下文另有明确规定，否则如在本说明书和所附权利要求书中所用的，单数形式“一”、“一个”和“该”包括复数指代。还应注意，除非上下文另有明确规定，否则术语“或”通常采用其包括“和/或”的含义。此外，本文提供的标题仅为方便起见，并不解释要求保护的实施方案的范围或含义。

如本文所用的，术语“约”是指与所陈述的量相差10％以内的量。

术语“多肽”和“蛋白质”可互换使用以指氨基酸残基的聚合物并且不限最小长度。多肽(包括所提供的多肽链和其他肽，诸如接头和结合肽)可以包括氨基酸残基，包括天然和/或非天然氨基酸残基。该术语还包括多肽的表达后修饰，例如糖基化、唾液酸化、乙酰化、磷酸化等。在一些方面，只要蛋白质保持期望的活性，多肽可以含有对于原生或天然序列的修饰。这些修饰可以是有意的(如通过定点诱变)，也可以是偶然的(诸如通过产生蛋白质的宿主的突变或由于PCR扩增而产生的错误)。

相对于参考多肽序列的序列同一性百分比(％)是在比对序列并引入空位(如果必要)以达到最大的序列同一性百分比之后，并且在不将任何保守性置换认定为序列同一性的一部分的情况下，候选序列中的氨基酸残基与参考多肽序列中的氨基酸残基相同的百分比。可以通过各种已知的方式实现用于确定氨基酸序列同一性百分比的目的的比对，例如使用公开可用的计算机软件，诸如BLAST、BLAST-2、ALIGN或Megalign(DNASTAR)软件。可以确定用于比对序列的适当参数，包括在被比较序列的全长上实现最大比对所需的算法。然而，出于本文的目的，使用序列比较计算机程序ALIGN-2产生氨基酸序列同一性值％。ALIGN-2序列比较计算机程序由Genentech,Inc.编写，并且源代码已与用户文档一起提交至美国版权局(Washington D.C.,20559)以美国版权注册号TXU510087注册。ALIGN-2程序可从Genentech,Inc.(South San Francisco,Calif.)公开获得，或者可以从源代码编译。应当编译ALIGN-2程序以在UNIX操作系统(包括数字UNIX V4.0D)上使用。所有序列比较参数均由ALIGN-2程序设置并且不改变。

在采用ALIGN-2进行氨基酸序列比较的情况下，给定氨基酸序列A对/与/相对于给定氨基酸序列B的氨基酸序列同一性％(或者，也可以表述为给定氨基酸序列A与/对/相对于给定氨基酸序列B具有/包含一定的氨基酸序列同一性％)计算如下：100乘以分数X/Y，其中X是序列比对程序ALIGN-2在该程序的A和B比对中评分为相同匹配的氨基酸残基数目，并且其中Y是B中氨基酸残基的总数。应当理解，当氨基酸序列A的长度不等于氨基酸序列B的长度时，A对B的氨基酸序列同一性％将不等于B对A的氨基酸序列同一性％。除非另外特别说明，否则本文所用的所有氨基酸序列同一性％值均如前一段所述使用ALIGN-2计算机程序获得。

在本文中用于描述相对于参照序列的核酸序列时，术语“同一性”、“相同的”或“同一性百分比”，可以使用Karlin和Altschul描述的公式来确定(Proc.Natl.Acad.Sci.USA87:2264-2268,1990，Proc.Natl.Acad.Sci.USA 90:5873-5877,1993中有改进)。这样的公式被并入Altschul等人(J.Mol.Biol.215:403-410,1990)的基本局部比对搜索工具(BLAST)程序中。截止到本申请的申请日，序列的同一性百分比可以使用最新版本的BLAST来确定。

本文所述系统的多肽可由核酸编码。核酸是一种包含两个或更多个核苷酸碱基的多核苷酸。在某些实施方案中，核酸是可用于将编码多肽的多核苷酸转运到细胞中的载体的组分。如本文所用的，术语“载体”是指能够转运与其连接的另一核酸的核酸分子。一种类型的载体是基因组整合载体或“整合载体”，其可以整合到宿主细胞的染色体DNA中。另一种类型的载体是“附加型”载体，例如，能够进行染色体外复制的核酸。能够指导与其可操作地连接的基因的表达的载体在本文中称为“表达载体”。合适的载体包括质粒、细菌人工染色体、酵母人工染色体、病毒载体等。在表达载体中，用于控制转录的启动子、增强子、聚腺苷酸化信号等调控元件可以衍生自哺乳动物、微生物、病毒或昆虫的基因。附加地，可以并入在宿主中复制的能力(通常由复制起点赋予)以及促进转化体识别的选择基因。可以采用衍生自诸如慢病毒、逆转录病毒、腺病毒、腺相关病毒等病毒的载体。可将质粒载体线性化以用于整合到染色体位置。载体可以包含指导向基因组中的位点特异性整合限定的位置或受限位点组的序列(例如，AttP-AttB重组)。附加地，载体可以包含衍生自用于整合的转座元件的序列。

如本文所用的术语“转染”或“转染的”是指通过实验室常用的方法有意地将外源核酸引入细胞的方法。转染可以通过例如脂质转染、磷酸钙沉淀、病毒转导或电穿孔实现。转染可以是瞬时的或稳定的。

如本文所用的术语“转染效率”是指细胞群并入外源核酸的范围或程度。转染效率可以测量为与系统中细胞总数相比，给定群体中并入外源核酸的细胞百分比(％)。可以在瞬时和稳定转染的细胞中测量转染效率。

如本文所用的，术语“生物激活多肽”是指由调节基因表达的细胞表达的多肽。通过经由一个或多个中间分子或多肽对刺激作出响应的信号传导，或通过任何其他机制，生物激活多肽可以直接调节基因表达。生物激活多肽可以是跨膜多肽(如，受体或通道蛋白)、胞内多肽(如，信号转导中间体)、胞外多肽或分泌型多肽。

如本文所用的，“报道活性”是指报道子的实验性读数。例如，当与合适的底物一起温育时，萤光素酶报道子将具有发光读数。其他报道子如荧光蛋白可能不需要底物，而是可以通过例如显微镜或荧光读板仪进行测量。

系统概述

本文描述的系统、核酸和方法可用于筛选应答元件结合启动子的存在和/或激活水平。本文描述的核酸、系统和方法允许以比传统报道系统更低水平的背景信号激活转录。在某些实施方案中，应答元件结合启动子在细胞信号传导级联的末端被激活。在某些实施方案中，可以在外部刺激例如物理或化学刺激之前和之后测量应答元件结合启动子的存在，或者将应答元件结合启动子的存在与平行操作的对照条件进行比较。化学刺激可以是激动性或拮抗性小分子或生物分子。在某些实施方案中，该系统可用于药物发现目的的筛选。该系统至少包含核酸，该核酸包含应答元件调控的启动子、合成转录因子启动子、合成转录因子和报道子。应答元件调控的启动子位于合成转录因子的5’侧，并且当应答元件结合启动子存在时，激活合成转录因子的转录。翻译后，合成转录因子可以随后与合成转录因子启动子结合，该启动子位于编码报道子的核酸序列的5’侧。当结合时，合成转录因子启动子激活编码报道子的核酸序列的转录。在某些实施方案中，报道子是多肽。在某些实施方案中，报道子是UMI。该系统的其他任选特征包括位于应答元件调控的启动子核苷酸序列近端的核苷酸序列，该核苷酸序列可以被转录阻遏子结合。在某些实施方案中，位于应答元件调控的启动子核苷酸序列近端的该核苷酸序列延伸由编码合成转录因子的核苷酸序列编码的mRNA的5’非翻译区。在某些实施方案中，由编码合成转录因子的核苷酸序列编码的mRNA的5’非翻译区具有一个或多个减少合成转录因子翻译的序列。

图1A中示出了本发明的一个非限制性实施方案。左图显示的是转录因子核酸100。转录因子核酸100上存在应答元件调控的启动子核酸102，其位于编码合成转录因子104的核苷酸序列的5’位置。右图是报道核酸110，它包含位于编码报道子114的核苷酸序列的5’侧的合成转录因子启动子核苷酸序列112。在某些实施方案中，转录因子核酸和报道核酸存在于不同的核酸分子上，例如不同的质粒或病毒载体上。在某些实施方案中，转录因子核酸和报道核酸是线性的。在某些实施方案中，转录因子核酸和报道核酸存在于同一核酸上，该核酸可以是质粒、病毒载体、线性或任何其他构型。

图1B中示出了编码报道子的核苷酸序列的一个非限制性实施方案。编码报道子114的核苷酸序列包含编码报道多肽122的核酸序列以及编码UMI 124的核酸序列。序列124也被称为独特分子标识符(UMI)。UMI可以标识特定的生物激活多肽，该生物激活多肽导致102处的应答元件调控的启动子核酸的激活。作为非限制性示例，该生物激活多肽可以包含特定的G蛋白偶联受体，其中已知的有数百种。因此，UMI元件允许以多重化形式对多种不同生物激活多肽的信号传导进行简易和快捷的探测。此外，所提供的中继系统通过应答元件调控的启动子降低背景信号传导。在针对可激活生物激活多肽的化合物的任何多重化筛选中，这可以使定量更加准确，并减少假阳性测试化合物的数量。在某些实施方案中，编码报道多肽的核酸序列不存在。在某些实施方案中，编码UMI的核酸序列不存在。在某些实施方案中，编码UMI的核酸序列位于编码报道多肽的核酸序列的5’侧。在某些实施方案中，编码报道多肽的核酸序列位于编码UMI的核酸序列的5’侧。

在某些实施方案中，编码报道子的核酸编码报道多肽。在某些实施方案中，所述报道多肽能够被直接检测。在某些实施方案中，基于蛋白质对底物的酶活性，所述报道多肽产生可检测信号。在某些实施方案中，报道多肽的检测可以定量完成。在某些实施方案中，所述报道多肽包含萤光素酶蛋白、β-半乳糖苷酶、β-葡糖醛酸糖苷酶、氯霉素乙酰转移酶、分泌型胎盘碱性磷酸酶或其组合。在某些实施方案中，其中所述报道多肽是萤光素酶蛋白，底物的非限制性示例包括萤火虫萤光素、肩棘螺萤光素(latia luciferin)、细菌萤光素、腔肠素、甲藻萤光素(dinoflagellate luciferin)、海萤荧光素(vargulin)和3-羟基牛奶树碱(3-hydroxy hispidin)。

在某些实施方案中，编码报道子的核酸编码UMI。所述UMI包含核酸特有的短核苷酸序列。所述UMI的长度可以是8、9、10、11、12、13、14、15、16、17、18、19、20或更多个核苷酸。所述UMI能够以允许确定所述UMI序列的任何合适的方式进行检测，例如通过下一代测序方法。检测所述UMI的方法可以是定量的，并且包括下一代测序方法。

在某些实施方案中，本文描述了部署用于药物发现的系统的方法，该系统包含编码转录因子核酸和报道核酸的核酸。在某些实施方案中，该方法包括在足以使核酸被细胞内化和表达(例如，转染)的条件下使核酸与细胞或细胞群接触；使细胞与物理或化学刺激接触；以及通过一个或多个测定确定报道元件的激活。在某些实施方案中，该方法包括接触包含编码转录因子核酸和报道核酸的核酸的细胞或细胞群；以及通过一个或多个测定确定报道元件的激活。

应答元件调控的启动子

应答元件是基因启动子区域内的短DNA序列，能够结合特定转录因子并调节基因转录。某些应答元件对某些启动子是特异性的。一些应答元件能够被内源性转录因子结合。同一应答元件的多个拷贝可以位于核苷酸序列的不同部分，对相同刺激作出响应而激活不同的基因。可以并入本文所述系统的应答元件的非限制性示例包括cAMP应答元件(CRE)、B识别元件、AhR-、二噁英或生物异源物质应答元件、HIF应答元件、激素应答元件、血清应答元件、视黄酸应答元件、过氧化物酶体增殖物激素应答元件、金属应答元件、DNA损伤应答元件、IFN刺激应答元件、ROR应答元件、糖皮质激素应答元件、钙应答元件CaRE1、抗氧化应答元件、p53应答元件、甲状腺激素应答元件、生长激素应答元件、固醇应答元件、多梳蛋白(polycomb)应答元件和维生素D应答元件。

应答元件调控的启动子核苷酸序列是含有一个或多个应答元件的核酸区域，这些应答元件有助于募集启动子和其他分子来调节基因的转录。细胞含有许多应答元件调控的核苷酸序列，这些序列利用内源性蛋白质来调节基因的转录。在内源性应答元件调控的启动子核苷酸序列直接调节报道子转录的情况下，由于内源性启动子的存在，因此存在高水平的背景信号。与使用内源性转录因子调节报道子转录的系统相比，使用非内源性的转录因子来调节报道子转录的系统(该非内源性是相对于含有所述系统的细胞)具有优势。这种系统的一个优势是所述报道子产生的背景少。

在某些实施方案中，本发明的转录中继系统包含转录因子核酸，其包含应答元件调控的启动子核苷酸序列和编码合成转录因子的核苷酸序列，其中所述应答元件调控的启动子核苷酸序列位于编码所述合成转录因子的所述核苷酸序列的5’侧。所述应答元件调控的启动子核苷酸序列用于控制由所述合成转录因子核苷酸序列编码的合成转录因子的表达。在某些实施方案中，所述应答元件调控的启动子核苷酸序列包含cAMP应答元件核苷酸序列、NFAT转录因子应答元件核苷酸序列、FOS启动子核苷酸序列、血清应答元件核苷酸序列或其组合。在某些实施方案中，所述应答元件调控的启动子核苷酸序列包含cAMP应答元件核苷酸序列。在某些实施方案中，所述应答元件调控的启动子核苷酸序列包含NFAT转录因子应答元件核苷酸序列。在某些实施方案中，所述应答元件调控的启动子核苷酸序列包含FOS启动子核苷酸序列。在某些实施方案中，所述应答元件调控的启动子核苷酸序列包含血清应答元件核苷酸序列。在某些实施方案中，所述应答元件调控的启动子核苷酸序列包括cAMP应答元件核苷酸序列、NFAT转录因子应答元件核苷酸序列、FOS启动子核苷酸序列和/或血清应答元件核苷酸序列的任意组合。

在某些实施方案中，所述应答元件调控的启动子能够被转录因子结合。常见转录因子的非限制性示例包括LexA、Gal4、VP16(来自单纯疱疹病毒)、热休克因子(HSF)、NFAT、CREB或其组合。本文所述的系统与报道测定中通常或潜在可用的任何转录因子或其任何组合相容。

在某些实施方案中，所述应答元件调控的启动子被内源性转录因子结合。内源性转录因子是生物体、组织或细胞中天然存在的转录因子。内源性转录因子的存在将取决于其中存在所述转录中继的系统。在某些实施方案中，所述内源性转录因子以背景速率促进合成转录因子的转录。

在某些实施方案中，所述转录因子核酸包含位于所述应答元件调控的启动子核酸序列近端的核苷酸序列，所述核苷酸序列可以被转录阻遏子结合。转录阻遏子抑制远端核苷酸序列的转录。常见转录阻遏子的非限制性示例包括TetR、lac阻遏子、KRAB阻遏子及其组合。本文所述的系统与报道测定中通常或潜在可用的任何阻遏子或其组合相容。

在某些实施方案中，所述转录因子核酸包含位于所述应答元件调控的启动子核苷酸序列近端的核苷酸序列，所述核苷酸序列延伸由编码合成转录因子的所述核苷酸序列编码的mRNA的5’非翻译区。在某些实施方案中，由编码合成转录因子的所述核苷酸序列编码的mRNA的所述5’非翻译区包含一个或多个减少所述合成转录因子的翻译的序列。在某些实施方案中，减少所述合成转录因子的翻译的所述一个或多个序列包含减少所述合成转录因子的翻译的二级结构。在某些实施方案中，减少所述合成转录因子的翻译的所述一个或多个序列包含影响RNA结合蛋白的结合的序列。在某些实施方案中，减少所述合成转录因子的翻译的所述一个或多个序列包含上游开放阅读框。

测定方法

可以使用多种方法有效地利用上述系统。该系统可用于在稳态下以及响应于物理或化学刺激下探测细胞信号传导通路的活性的方法。当报道元件包含与特定报道元件配对的UMI序列时，可将该系统部署在多重测定中。

在一个非限制性的说明性示例中，将多个细胞在多孔板的一个孔中温育。用包含合成转录因子启动子核苷酸序列和编码报道子的核苷酸序列的报道子核酸转染多个细胞。细胞可以已经包含转录因子核酸，该转录因子核酸包含应答元件调控的启动子核苷酸序列和编码合成转录因子的核苷酸序列，或者可以用所述转录因子核酸转染细胞。然后，使转染的细胞与化学刺激接触。在允许报道基因表达的足够时间后，收获细胞裂解物并对所述报道基因的激活进行定量。在本示例中，存在增加的报道基因表明化学刺激导致结合所述应答元件调控的启动子的转录因子的活性增强。在某些实施方案中，在细胞信号传导级联反应后，与所述应答元件调控的启动子结合的所述转录因子的活性增强。

在其中所述报道基因包含在与底物相互作用时产生可检测信号的酶的实施方案中，可以利用本领域中已知的标准测定法来定量所述报道基因的激活。在其中所述报道基因包含荧光分子的实施方案中，所述报道基因的激活可以通过荧光显微术或荧光读板仪来测量，并且可能不需要细胞裂解。所述荧光分子可用于测量活细胞中的报道子激活。在其中所述报道基因包含UMI的实施方案中，对mRNA进行反转录，并通过下一代测序技术对UMI进行测序。

在某些实施方案中，测定以多孔格式诸如6、12、24、48、96或384孔格式进行。在某些实施方案中，向每个孔提供不同的测试化学品，或者测试化学品以一式两孔、三孔或四孔提供。测定还可以包括一个或多个阳性或阴性对照孔。

合成转录因子

合成转录因子是能够靶向和调节基因表达的人工蛋白质。一些合成转录因子是包含来自多个不同基因的域的嵌合蛋白。在某些实施方案中，合成转录因子包含来自一个基因的DNA结合域和来自另一个基因的转录调控域。

在本文所述的方法、核酸和系统中，转录激活多肽是在转录因子核酸上编码的。在某些实施方案中，所述转录激活多肽是合成转录因子。在某些实施方案中，所述合成转录因子是嵌合蛋白。在某些实施方案中，所述合成转录因子包含来自第一转录因子的DNA结合域。在某些实施方案中，所述合成转录因子包含来自第二转录因子的转录激活域。在某些实施方案中，所述第一转录因子不同于所述第二转录因子。

在某些实施方案中，与任何内源性转录因子相比，所述合成转录因子对于合成转录因子启动子核苷酸序列具有更高的特异性。在某些实施方案中，所述合成转录因子与不能被内源启动子结合的合成转录因子启动子核苷酸序列结合。在某些实施方案中，与使用内源性转录因子相比，所述合成转录因子导致报道子的背景产生更少。

在某些实施方案中，所述DNA结合域对于含有本发明的转录中继系统的细胞是非内源的。在某些实施方案中，来自第一转录因子的所述DNA结合域来自Gal 4、PPR1、LexA、Lac9或其组合。在某些实施方案中，所述DNA结合域包含如下所示的氨基酸序列：

MKLLSSIEQACDICRLKKLKCSKEKPKCAKCLKNNWECRYSPKTKRSPLTRAHLTEVESRLERLEQLFLLIFPREDLDMILKMDSLQDIKALLTGLFVQDNVNKDAVTDRLASVETDMPLTLRQHRISATSSSEESSNKGQRQLTVS，SEQ ID NO:1。在某些实施方案中，所述DNA结合域包含如下所示的氨基酸序列：

MKKKNSKKSNRTDSKRGDSNGSKSRTACKRCRKKKCDSCKRCAKVCVSDATGKDVRSYVDRAVMMRVKYGVDTKRGNATSDDDKKYSSVSS，SEQ ID NO:2。在某些实施方案中，所述DNA结合域包含如下所示的氨基酸序列：

MKSRTACKRCRLKKIKCDQEFPSCKRCAKLEVPCYSPKTKRSPLTRAHLTEVESRLERLEQLFLLIFPREDLDMILKMDSLQDIKALLTGLFVQDNVNKDAVTDRLASVETDMPLTLRQHRISATSSSEESSNKGQRQLTVS，SEQ ID NO:3。在某些实施方案中，所述DNA结合域包含如下所示的氨基酸序列：

MKSRTACKRCRLKKIKCDQEFPSCKRCAKLEVPCVSSPKTKRSPLTRAHLTEVESRLERLEQLFLLIFPREDLDMILKMDSLQDIKALLTGLFVQDNVNKDAVTDRLASVETDMPLTLRQHRISATSSSEESSNKGQRQLTVS，SEQ ID NO:4。在某些实施方案中，所述DNA结合域包含如下所示的氨基酸序列：

MNKKSSEVMHQACDACRKKKWKCSKTVPTCTNCLKYNLDCVYSPQVVRTPLTRAHLTEMENRVAELEQFLKELFPVWDIDRLLQQKDTYRIRELLTMGSTNTVPGLASNNIDSSLEQPVAFGTAQPAQSLSTDPAVQSQAYPMQPV，SEQ ID NO:5。在某些实施方案中，所述DNA结合域包含如下所示的氨基酸序列：

MNKKSSEVMHQACVECRQQKSKCDAHERAPEPCTKCAKKNVPCIVYSPQVVRTPLTRAHLTEMENRVAELEQFLKELFPVWDIDRLLQQKDTYRIRELLTMGSTNTVPGLASNNIDSSLEQPVAFGTAQPAQSLSTDPAVQSQAYPMQPV，SEQ ID NO:6。在某些实施方案中，所述DNA结合域包含如下所示的氨基酸序列：

MNKKSSEVMHQACKRCRLKKIKCDQEFPSCKRCLKYNLDCVYSPQVVRTPLTRAHLTEMENRVAELEQFLKELFPVWDIDRLLQQKDTYRIRELLTMGSTNTVPGLASNNIDSSLEQPVAFGTAQPAQSLSTDPAVQSQAYPMQPV，SEQ ID NO:7。在某些实施方案中，所述DNA结合域包含如下所示的氨基酸序列：

MNKKSSEVMHQACKRCRLKKIKCDQEFPSCKRCAKLEVPCVYSPQVVRTPLTRAHLTEMENRVAELEQFLKELFPVWDIDRLLQQKDTYRIRELLTMGSTNTVPGLASNNIDSSLEQPVAFGTAQPAQSLSTDPAVQSQAYPMQPV，SEQ ID NO:8。

在某些实施方案中，所述DNA结合域包含SEQ ID NO:1的氨基酸序列变体。在某些实施方案中，SEQ ID NO:1的氨基酸序列变体是R15W、K23P、K23T、K23W、K23M、K23N、F68R、F68Q、L69P、L70P、Q9E、Q9A、Q9N、R15K、R15A、R15M、K18R、K18A、K18M、K23R、K23A、K23M或其组合。在某些实施方案中，SEQ ID NO:1的氨基酸序列变体是R15W。在某些实施方案中，SEQ IDNO:1的氨基酸序列变体是K23P。在某些实施方案中，SEQ ID NO:1的氨基酸序列变体是K23T。在某些实施方案中，SEQ ID NO:1的氨基酸序列变体是K23W。在某些实施方案中，SEQID NO:1的氨基酸序列变体是K23M。在某些实施方案中，SEQ ID NO:1的氨基酸序列变体是K23N。在某些实施方案中，SEQ ID NO:1的氨基酸序列变体是F68R。在某些实施方案中，SEQID NO:1的氨基酸序列变体是F68Q。在某些实施方案中，SEQ ID NO:1的氨基酸序列变体是L69P。在某些实施方案中，SEQ ID NO:1的氨基酸序列变体是L70P。在某些实施方案中，SEQID NO:1的氨基酸序列变体是Q9E。在某些实施方案中，SEQ ID NO:1的氨基酸序列变体是Q9A。在某些实施方案中，SEQ ID NO:1的氨基酸序列变体是Q9N。在某些实施方案中，SEQ IDNO:1的氨基酸序列变体是R15K。在某些实施方案中，SEQ ID NO:1的氨基酸序列变体是R15A。在某些实施方案中，SEQ ID NO:1的氨基酸序列变体是R15M。在某些实施方案中，SEQID NO:1的氨基酸序列变体是K18R。在某些实施方案中，SEQ ID NO:1的氨基酸序列变体是K18A。在某些实施方案中，SEQ ID NO:1的氨基酸序列变体是K18M。在某些实施方案中，SEQID NO:1的氨基酸序列变体是K23R。在某些实施方案中，SEQ ID NO:1的氨基酸序列变体是K23A。在某些实施方案中，SEQ ID NO:1的氨基酸序列变体是K23M。

在一些实施方案中，来自第二转录因子的所述转录激活域来自VP64、p65和Rta及其组合。在某些实施方案中，所述转录激活域包含如下所示的氨基酸序列：

RAGKPIPNPLLGLDSTDALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLGSPKKKRKVGSQYLPDTDDRHRIEEKRKRTYETFKSIMKKSPFSGPTDPRPPPRRIAVPSRSSASVPKPAPQPYPFTSSLSTINYDEFPTMVFPSGQISQASALAPAPPQVLPQAPAPAPAPAMVSALAQAPAPVPVLAPGPPQAVAPPAPKPTQAGEGTLSEALLQLQFDDEDLGALLGNSTDPAVFTDLASVDNSEFQQLLNQGIPVAPHTTEPMLMEYPEAITRLVTGAQRPPDPAPAPLGAPGLPNGLLSGDEDFSSIADMDFSALLSQISSGSGSGSRDSREGMFLPKPEAGSAISDVFEGREVCQPKRIRPFHPPGSPWANRPLPASLAPTPTGPVHEPVGSLTPAPVPQPLDPAPAVTPEASHLLEDPDEETSQAVKALREMADTVIPQKEEAAICGQMDLSHPPPRGHLDELTTTLESMTEDLNLDSPLTPELNEILDTFLNDECLLHAMHISTGLSIFDTSLF，SEQ ID NO:14。

在某些实施方案中，本文所述的核酸编码具有VPR氨基酸序列的转录因子，该VPR氨基酸序列与SEQ ID NO:14所示的氨基酸序列具有至少90％、95％、97％、98％、99％或100％同一性。在某些实施方案中，本文所述的核酸编码具有VPR氨基酸序列的转录因子，该VPR氨基酸序列与SEQ ID NO:14所示的氨基酸序列具有至少90％同一性。在某些实施方案中，本文所述的核酸编码具有VPR氨基酸序列的转录因子，该VPR氨基酸序列与SEQ ID NO:14所示的氨基酸序列具有至少95％同一性。在某些实施方案中，本文所述的核酸编码具有VPR氨基酸序列的转录因子，该VPR氨基酸序列与SEQ ID NO:14所示的氨基酸序列具有至少97％同一性。在某些实施方案中，本文所述的核酸编码具有VPR氨基酸序列的转录因子，该VPR氨基酸序列与SEQ ID NO:14所示的氨基酸序列具有至少98％同一性。在某些实施方案中，本文所述的核酸编码具有VPR氨基酸序列的转录因子，该VPR氨基酸序列与SEQ ID NO:10所示的氨基酸序列具有至少99％同一性。在某些实施方案中，本文所述的核酸编码具有VPR氨基酸序列的转录因子，该VPR氨基酸序列与SEQ ID NO:14所示的氨基酸序列具有100％同一性。

在某些实施方案中，合成转录因子上的转录激活域包含增加或减少转录激活的氨基酸序列变体。在某些实施方案中，包含增加或减少转录激活的氨基酸序列变体的所述转录激活域是SEQ ID NO:14的序列变体。

在某些实施方案中，由转录因子核酸的核酸序列编码的合成转录因子包含使所述合成转录因子去稳定化的多肽序列，也称为“降解决定子”。在某些实施方案中，使所述转录因子去稳定化的所述多肽序列包括PEST多肽序列。PEST多肽序列是含有多个氨基酸的多肽序列，其中所述多肽序列富含脯氨酸、谷氨酸、丝氨酸和/或苏氨酸。在某些实施方案中，使所述转录因子去稳定化的所述多肽序列包括CL1多肽序列。CL1多肽序列可充当降解信号，导致所产生的合成转录因子的半衰期缩短。在某些实施方案中，使所述合成转录因子去稳定化的所述多肽序列有助于降低报道子的背景信号。

在某些实施方案中，所述合成转录因子包括GAL4-VP16嵌合转录因子。在某些实施方案中，转录因子包括GAL4-VPR嵌合转录因子。Gal4-VPR嵌合转录因子的序列由以下所示的序列给出：

MKLLSSIEQACDICRLKKLKCSKEKPKCAKCLKNNWECRYSPKTKRSPLTRAHLTEVESRLERLEQLFLLIFPREDLDMILKMDSLQDIKALLTGLFVQDNVNKDAVTDRLASVETDMPLTLRQHRISATSSSEESSNKGQRQLTVSASGSGRAGKPIPNPLLGLDSTDALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLGSPKKKRKVGSQYLPDTDDRHRIEEKRKRTYETFKSIMKKSPFSGPTDPRPPPRRIAVPSRSSASVPKPAPQPYPFTSSLSTINYDEFPTMVFPSGQISQASALAPAPPQVLPQAPAPAPAPAMVSALAQAPAPVPVLAPGPPQAVAPPAPKPTQAGEGTLSEALLQLQFDDEDLGALLGNSTDPAVFTDLASVDNSEFQQLLNQGIPVAPHTTEPMLMEYPEAITRLVTGAQRPPDPAPAPLGAPGLPNGLLSGDEDFSSIADMDFSALLSQISSGSGSGSRDSREGMFLPKPEAGSAISDVFEGREVCQPKRIRPFHPPGSPWANRPLPASLAPTPTGPVHEPVGSLTPAPVPQPLDPAPAVTPEASHLLEDPDEETSQAVKALREMADTVIPQKEEAAICGQMDLSHPPPRGHLDELTTTLESMTEDLNLDSPLTPELNEILDTFLNDECLLHAMHISTGLSIFDTSLF，SEQ ID NO:10。在某些实施方案中，本文所述的核酸编码氨基酸序列与SEQ ID NO:10所示的氨基酸序列具有至少90％、95％、97％、98％、99％或100％同一性的转录因子。在某些实施方案中，本文所述的核酸编码氨基酸序列与SEQ ID NO:10所示的氨基酸序列具有至少90％同一性的转录因子。在某些实施方案中，本文所述的核酸编码氨基酸序列与SEQ ID NO:10所示的氨基酸序列具有至少95％同一性的转录因子。在某些实施方案中，本文所述的核酸编码氨基酸序列与SEQ ID NO:10所示的氨基酸序列具有至少97％同一性的转录因子。在某些实施方案中，本文所述的核酸编码氨基酸序列与SEQ ID NO:10所示的氨基酸序列具有至少98％同一性的转录因子。在某些实施方案中，本文所述的核酸编码氨基酸序列与SEQ ID NO:10所示的氨基酸序列具有至少99％同一性的转录因子。在某些实施方案中，本文所述的核酸编码氨基酸序列与SEQ ID NO:10所示的氨基酸序列具有100％同一性的转录因子。

在某些实施方案中，所述合成转录因子包含由SEQ ID NO:1中列出的氨基酸序列给出的Gal4 DNA结合域。在某些实施方案中，所述合成转录因子包含氨基酸序列与SEQ IDNO:1所示的氨基酸序列具有至少90％、95％、97％、98％、99％或100％同一性的DNA结合域。在某些实施方案中，所述合成转录因子包含氨基酸序列与SEQ ID NO:1所示的氨基酸序列具有至少90％同一性的DNA结合域。在某些实施方案中，所述合成转录因子包含氨基酸序列与SEQ ID NO:1所示的氨基酸序列具有至少95％同一性的DNA结合域。在某些实施方案中，所述合成转录因子包含氨基酸序列与SEQ ID NO:1所示的氨基酸序列具有至少97％同一性的DNA结合域。在某些实施方案中，所述合成转录因子包含氨基酸序列与SEQ ID NO:1所示的氨基酸序列具有至少98％同一性的DNA结合域。在某些实施方案中，所述合成转录因子包含氨基酸序列与SEQ ID NO:1所示的氨基酸序列具有至少99％同一性的DNA结合域。在某些实施方案中，所述合成转录因子包含氨基酸序列与SEQ ID NO:1所示的氨基酸序列具有100％同一性的DNA结合域。

在某些实施方案中，所述合成转录因子包含来自VP64的转录激活域，由以下列出的氨基酸序列给出：

RAGKPIPNPLLGLDSTDALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLGSDALDDFDLDMLGSPKKKRKV，SEQ ID NO:11。在某些实施方案中，所述合成转录因子包含氨基酸序列与SEQ IDNO:11所示的氨基酸序列具有至少90％、95％、97％、98％、99％或100％同一性的转录激活域。在某些实施方案中，所述合成转录因子包含氨基酸序列与SEQ ID NO:11所示的氨基酸序列具有至少90％同一性的转录激活域。在某些实施方案中，所述合成转录因子包含氨基酸序列与SEQ ID NO:11所示的氨基酸序列具有至少95％同一性的转录激活域。在某些实施方案中，所述合成转录因子包含氨基酸序列与SEQ ID NO:11所示的氨基酸序列具有至少97％同一性的转录激活域。在某些实施方案中，所述合成转录因子包含氨基酸序列与SEQID NO:11所示的氨基酸序列具有至少98％同一性的转录激活域。在某些实施方案中，所述合成转录因子包含氨基酸序列与SEQ ID NO:11所示的氨基酸序列具有至少99％同一性的转录激活域。在某些实施方案中，所述合成转录因子包含氨基酸序列与SEQ ID NO:11所示的氨基酸序列具有100％同一性的转录激活域。

在某些实施方案中，所述合成转录因子包含来自p65的转录激活域，由以下列出的氨基酸序列给出：

QYLPDTDDRHRIEEKRKRTYETFKSIMKKSPFSGPTDPRPPPRRIAVPSRSSASVPKPAPQPYPFTSSLSTINYDEFPTMVFPSGQISQASALAPAPPQVLPQAPAPAPAPAMVSALAQAPAPVPVLAPGPPQAVAPPAPKPTQAGEGTLSEALLQLQFDDEDLGALLGNSTDPAVFTDLASVDNSEFQQLLNQGIPVAPHTTEPMLMEYPEAITRLVTGAQRPPDPAPAPLGAPGLPNGLLSGDEDFSSIADMDFSALLSQISS，SEQ ID NO:12。在某些实施方案中，所述合成转录因子包含氨基酸序列与SEQ ID NO:12所示的氨基酸序列具有至少90％、95％、97％、98％、99％或100％同一性的转录激活域。在某些实施方案中，所述合成转录因子包含氨基酸序列与SEQ ID NO:12所示的氨基酸序列具有至少90％同一性的转录激活域。在某些实施方案中，所述合成转录因子包含氨基酸序列与SEQ ID NO:12所示的氨基酸序列具有至少95％同一性的转录激活域。在某些实施方案中，所述合成转录因子包含氨基酸序列与SEQ ID NO:12所示的氨基酸序列具有至少97％同一性的转录激活域。在某些实施方案中，所述合成转录因子包含氨基酸序列与SEQ ID NO:12所示的氨基酸序列具有至少98％同一性的转录激活域。在某些实施方案中，所述合成转录因子包含氨基酸序列与SEQ ID NO:12所示的氨基酸序列具有至少99％同一性的转录激活域。在某些实施方案中，所述合成转录因子包含氨基酸序列与SEQ ID NO:12所示的氨基酸序列具有100％同一性的转录激活域。

在某些实施方案中，所述合成转录因子包含来自Rta的转录激活域，由以下列出的氨基酸序列给出：

RDSREGMFLPKPEAGSAISDVFEGREVCQPKRIRPFHPPGSPWANRPLPASLAPTPTGPVHEPVGSLTPAPVPQPLDPAPAVTPEASHLLEDPDEETSQAVKALREMADTVIPQKEEAAICGQMDLSHPPPRGHLDELTTTLESMTEDLNLDSPLTPELNEILDTFLNDECLLHAMHISTGLSIFDTSLF，SEQ ID NO:13。在某些实施方案中，所述合成转录因子包含氨基酸序列与SEQ ID NO:13所示的氨基酸序列具有至少90％、95％、97％、98％、99％或100％同一性的转录激活域。在某些实施方案中，所述合成转录因子包含氨基酸序列与SEQ ID NO:13所示的氨基酸序列具有至少90％同一性的转录激活域。在某些实施方案中，所述合成转录因子包含氨基酸序列与SEQ ID NO:13所示的氨基酸序列具有至少95％同一性的转录激活域。在某些实施方案中，所述合成转录因子包含氨基酸序列与SEQ ID NO:13所示的氨基酸序列具有至少97％同一性的转录激活域。在某些实施方案中，所述合成转录因子包含氨基酸序列与SEQ ID NO:13所示的氨基酸序列具有至少98％同一性的转录激活域。在某些实施方案中，所述合成转录因子包含氨基酸序列与SEQ ID NO:13所示的氨基酸序列具有至少99％同一性的转录激活域。在某些实施方案中，所述合成转录因子包含氨基酸序列与SEQ ID NO:13所示的氨基酸序列具有100％同一性的转录激活域。

合成转录因子启动子核苷酸序列

合成转录因子启动子核苷酸序列是能够被合成转录因子结合的核酸序列。在某些实施方案中，所述合成转录因子核苷酸序列不被内源性转录因子结合。所述合成转录因子启动子核苷酸序列有助于募集所述合成转录因子，以便激活报道分子的转录。所述报道分子在位于所述合成转录因子启动子核苷酸序列3’侧的核酸上编码。

在本文描述的方法、核酸和系统中，合成转录因子启动子核苷酸序列是在报道核酸上编码的。所述合成转录因子启动子核苷酸序列能够被在转录因子核酸上编码的合成转录因子结合。所述合成转录因子启动子核苷酸序列位于编码报道子的核苷酸序列的5’侧。在某些实施方案中，所述合成转录因子启动子核苷酸序列不被内源性转录因子结合。在某些实施方案中，所述合成转录因子对所述合成转录因子启动子核苷酸序列具有高度特异性。

在某些实施方案中，所述合成转录因子启动子核苷酸序列能够被Gal4、PPR1、Lac9或LexA结合。在某些实施方案中，所述合成转录因子能够被包含SEQ ID NO:1所示氨基酸序列的多肽结合。

在某些实施方案中，所述合成转录因子启动子核苷酸序列能够被Gal4、PPR1、Lac9或LexA的氨基酸序列变体结合。在某些实施方案中，所述合成转录因子启动子核苷酸序列能够被SEQ ID NO:1的氨基酸序列变体结合。

报道元件

报道核酸至少包含能够被合成转录因子结合的调控元件和编码报道子的核苷酸序列。编码报道子的所述核苷酸序列位于能够被所述合成转录因子结合的所述调控元件的下游。所述合成转录因子调节所述报道子的表达。

在某些实施方案中，编码报道子的核苷酸序列包含报道基因。在某些实施方案中，所述报道基因编码报道子，该报道子选自荧光蛋白、萤光素酶蛋白、β-半乳糖苷酶、β-葡糖醛酸糖苷酶、氯霉素乙酰转移酶和分泌型胎盘碱性磷酸酶。可以测定这些报道蛋白的特定酶活性，或者在荧光报道子的情况下，可以测定荧光发射。在某些实施方案中，荧光蛋白包括绿色荧光蛋白(GFP)、红色荧光蛋白(RFP)、黄色荧光蛋白(YFP)或青色荧光蛋白(CFP)。

在某些实施方案中，编码报道基因的核苷酸序列包含编码独特序列标识符(UMI)的核苷酸序列。在某些实施方案中，所述UMI对于测试多肽是特有的，其中所述测试多肽由所述报道核酸编码。一般来说，所述UMI的长度介于8和20个核苷酸之间，但也可能更长。在某些实施方案中，所述UMI的长度为8、9、10、11、12、13、14、15、16、17、18、19、20或更多个核苷酸。在某些实施方案中，所述UMI的长度为8个核苷酸。在某些实施方案中，所述UMI的长度为9个核苷酸。在某些实施方案中，所述UMI的长度为10个核苷酸。在某些实施方案中，所述UMI的长度为11个核苷酸。在某些实施方案中，所述UMI的长度为12个核苷酸。在某些实施方案中，所述UMI的长度为13个核苷酸。在某些实施方案中，所述UMI的长度为14个核苷酸。在某些实施方案中，所述UMI的长度为15个核苷酸。在某些实施方案中，所述UMI的长度为16个核苷酸。在某些实施方案中，所述UMI的长度为17个核苷酸。在某些实施方案中，所述UMI的长度为18个核苷酸。在某些实施方案中，所述UMI的长度为19个核苷酸。在某些实施方案中，所述UMI的长度为20个核苷酸。在某些实施方案中，所述UMI的长度为超过20个核苷酸。

本文描述的系统可以利用许多不同的调控序列，这些序列通过合成转录因子结合而控制报道基因的激活。调控序列是可被合成转录因子多肽结合的序列。通常，将配置使得调控序列在UMI、报道基因或两者的5’侧。在某些实施方案中，调控序列包含Gal4、PPR1-或LexA-UAS，其能够被合成转录因子结合。

在某些实施方案中，报道子包括荧光蛋白、萤光素酶蛋白、β-半乳糖苷酶、β-葡糖醛酸糖苷酶、氯霉素乙酰转移酶或分泌型胎盘碱性磷酸酶，和UMI。在某些实施方案中，所述UMI在荧光蛋白、萤光素酶蛋白、β-半乳糖苷酶、β-葡糖醛酸糖苷酶、氯霉素乙酰转移酶或分泌型胎盘碱性磷酸酶的5’侧的报道核酸上编码。在某些实施方案中，编码荧光蛋白、萤光素酶蛋白、β-半乳糖苷酶、β-葡糖醛酸糖苷酶、氯霉素乙酰转移酶或分泌型胎盘碱性磷酸酶的核苷酸序列位于所述UMI的5’侧。

UMI允许在同一测定中对不同的转录中继系统进行多重化，因为UMI的转录将表明特定的中继系统与报道子的关联。UMI可以是允许充分多样性的任何长度，以允许在同一测定中对不同转录中继系统进行多重化测定。所述长度应当足以区分至少100、500、1,000、2,000、3,000、4,000、5,000、6,000、7,000、8,000、9,000或10,000个转录中继靶标。在某些实施方案中，所述不同转录中继系统会存在于不同的细胞中。在某些实施方案中，所述不同转录中继系统会存在于同一细胞中。

报道元件还可以包含5’UTR、3’UTR或二者。UTR可能与报道元件异源。

报道子激活

使用标准测定法检测萤光素酶蛋白、β-半乳糖苷酶蛋白、β-葡糖醛酸糖苷酶蛋白、氯霉素乙酰转移酶蛋白、分泌型胎盘碱性磷酸酶蛋白，可以确定报道分子的激活。通常，这些是酶测定，其中基于蛋白质对底物的酶活性产生可检测信号。例如，萤光素酶表达可以在萤光素酶底物的存在下通过光度计测量。荧光报道子不需要底物，并且可以通过荧光显微术或荧光读板仪测量信号。荧光报道子尤其可用于测量活细胞中的报道子激活。

在其中报道分子包含独特RNA序列的实施方案中，报道子的激活可以用任何合适的方式来测量，只要该方式允许对独特RNA序列进行序列测定，优选允许以多重化方式进行序列测定的方法。此类方法包括高通量测序方法，其可以在24小时内产生至少约100,000、1,000,000、10,000,000或100,000,000个DNA或RNA碱基上的信息。在某些实施方案中，使用下一代测序技术来确定独特RNA序列的序列。下一代测序包括许多种测序，诸如焦磷酸测序、合成测序、单分子测序、第二代测序、纳米孔测序、连接测序或杂交测序。下一代测序平台包括可从Illumina(RNA-Seq)和Helicos(数字基因表达或“DGE”)商购获得的平台。下一代测序方法包括但不限于由以下公司商业化的方法：1)454/Roche Lifesciences，包括但不限于在Margulies等人,Nature(2005)437:376-380(2005)；以及美国专利号7,244,559；7,335,762；7,211,390；7,244,567；7,264,929；7,323,305中描述的方法和装置；2)HelicosBiosciences Corporation(Cambridge,MA)，如在美国申请序列号11/167046和美国专利号7501245；7491498；7,276,720；以及在美国专利申请公开号US20090061439；US20080087826；US20060286566；US2006002471 1；US20060024678；US20080213770；和US20080103058中描述的；3)Applied Biosystems(例如，SOLiD测序)；4)Dover Systems(例如，Polonator G.007测序)；5)Illumina,Inc.，如在美国专利号5,750,341；6,306,597；和5,969,119中描述的；以及6)Pacific Biosciences，如在美国专利号7,462,452；7,476,504；7,405,281；7,170,050；7,462,468；7,476,503；7,315,019；7,302,146；7,313,308；和美国申请公开号US20090029385；US20090068655；US20090024331；和US20080206764中描述的。这样的方法和装置在此通过示例的方式提供并且不旨在进行限制。

标志物

在某些实施方案中，本文所述的核酸还包含编码选择多肽或标记多肽的一个或多个附加基因。在某些实施方案中，本文所述的核酸还包含编码赋予转染细胞以抗生素抗性的多肽的一个或多个附加基因。例如，核酸可以包含选择性标志物，诸如赋予新霉素/G418抗性、嘌呤霉素抗性、博来霉素抗性或杀稻瘟素抗性的抗生素抗性基因。在某些实施方案中，本文所述的核酸还包含编码多肽的一个或多个附加基因，该多肽包括在细胞表面上表达的表位标签。这使得能够进行亲和纯化或细胞分选以收集已用所述核酸转染的细胞。在某些实施方案中，表位标签包括c-Myc标签、血凝素(HA)标签、组氨酸标签、V5标签或FLAG标签。在某些实施方案中，本文所述的核酸还包含编码荧光多肽的一个或多个附加的无启动子基因。当转染旨在引起整合并靶向特定位置或着陆区(landing pad)时，这样的基因是有用的。在这些情况下，细胞基因组中的“着陆区”包含启动子，该启动子可以补充无启动子基因中启动子的缺失，并且只有在被整合到预期的基因组位置时才导致无启动子基因的表达。可以通过流式细胞术和细胞分选来选择具有正确整合的细胞。这种类型的标志物还可以确保预期核酸的仅单个拷贝被整合到基因组中，并有助于避免异位过表达。在某些实施方案中，编码诱饵多肽的核酸包含：编码赋予转染细胞以抗生素抗性的多肽的基因；编码包括在细胞表面上表达的表位标签的多肽的基因；或编码荧光多肽的无启动子基因。

细胞

可用于本文所述的方法的细胞通常是能够容易地用编码合成转录因子和报道元件的外源核酸使其变得转基因的细胞。可以使用本领域已知的方法将编码合成转录因子和报道元件的系统核酸转染或转导到合适的细胞系中，诸如磷酸钙转染、脂质体介导转染(例如，

或

HD)、电穿孔或病毒转导。细胞也可以是在合适的组织培养容器中生长至汇合或接近汇合的相同类型的细胞群。

在某些实施方案中，所用细胞包含编码合成转录因子的核酸、包含报道元件的核酸或两者的稳定整合。可以使用线性化质粒的随机整合、病毒或转座子定向整合或定向整合(例如使用AttP和AttB位点之间的位点特异性重组)来制备稳定的细胞系。在某些实施方案中，这两种核酸中的任一种在安全着陆位点(safe landing site)例如AAVS1位点处编码。

在某些实施方案中，在系统中使用的细胞或细胞群是真核细胞。在某些实施方案中，细胞或细胞群是哺乳动物细胞。在某些实施方案中，细胞或细胞群是人类细胞。在某些实施方案中，细胞或细胞群是SH-SY5Y，人神经母细胞瘤；Hep G2，白种人肝细胞癌；293(也称为HEK 293)，人胚肾；RAW 264.7，小鼠单核巨噬细胞；HeLa，人宫颈上皮样癌；MRC-5(PD19)，人胎肺；A2780，人卵巢癌；CACO-2，白种人结肠腺癌；THP 1，人单核细胞白血病；A549，白种人肺癌；MRC-5(PD 30)，人胎肺；MCF7，白种人乳腺癌；SNL 76/7，小鼠SIM品系胚胎成纤维细胞；C2C12，小鼠C3H肌肉成肌细胞；Jurkat E6.1，人白血病T细胞淋巴母细胞；U937，白种人组织细胞淋巴瘤；L929，小鼠C3H/An结缔组织；3T3 L1，小鼠胚胎；HL60，白种人早幼粒细胞白血病；PC-12，大鼠肾上腺嗜铬细胞瘤；HT29，白种人结肠腺癌；OE33，白种人食管癌；OE19，白种人食管癌；NIH 3T3，Swiss鼠NIH胚胎；MDA-MB-231，白种人乳腺癌；K562，白种人慢性粒细胞白血病；U-87MG，人胶质母细胞瘤星形细胞瘤；MRC-5(PD 25)，人胎肺；A2780cis，人卵巢癌；B9，小鼠B细胞杂交瘤；CHO-K1，中国仓鼠卵巢；MDCK，可卡犬肾；1321N1，人脑星形细胞瘤；A431，人鳞癌；ATDC5，小鼠129畸胎癌AT805衍生；RCC4 PLUSVECTOR ALONE，用赋予新霉素抗性的空表达载体pcDNA3稳定转染的肾细胞癌细胞系RCC4；HUVEC(S200-05n)，人预筛选的脐静脉内皮细胞(HUVEC)；新生儿；Vero，非洲绿猴肾；RCC4PLUS VHL，用pcDNA3-VHL稳定转染的肾细胞癌细胞系RCC4；Fao，大鼠肝癌；J774A.1，小鼠BALB/c单核巨噬细胞；MC3T3-E1，小鼠C57BL/6颅盖；J774.2，小鼠BALB/c单核巨噬细胞；PNT1A，人正常青春期后前列腺，用SV40永生化；U-2OS，人骨肉瘤；HCT 116，人结肠癌；MA104，非洲绿猴肾；BEAS-2B，人正常支气管上皮细胞；NB2-11，大鼠淋巴瘤；BHK 21(克隆13)，叙利亚仓鼠肾；NS0，小鼠骨髓瘤；Neuro 2a，小鼠白化神经母细胞瘤；SP2/0-Ag14，小鼠x小鼠骨髓瘤，非生产性；T47D，人乳腺肿瘤；1301，人T细胞白血病；MDCK-II，可卡犬肾；PNT2，人正常前列腺，用SV40永生化；PC-3，白种人前列腺癌；TF1，人红白血病；COS-7，非洲绿猴肾，SV40转化；MDCK，可卡犬肾；HUVEC(200-05n)，人脐静脉内皮细胞(HUVEC)；新生儿；NCI-H322，白种人细支气管肺泡癌；SK.N.SH，白种人神经母细胞瘤；LNCaP.FGC，白种人前列腺癌；OE21，白种人食管鳞状细胞癌；PSN1，人胰腺癌；ISHIKAWA，亚洲人子宫内膜腺癌；MFE-280，白种人子宫内膜腺癌；MG-63，人骨肉瘤；RK 13，兔肾，BVDV阴性；EoL-1细胞，人嗜酸性粒细胞白血病；VCaP，人前列腺癌转移；tsA201，人胚肾，SV40转化；CHO，中国仓鼠卵巢；HT1080，人纤维肉瘤；PANC-1，白种人胰腺；Saos-2，人原发性成骨性肉瘤；成纤维细胞生长培养基(116K-500)，成纤维细胞生长培养基试剂盒；ND7/23，小鼠神经母细胞瘤x大鼠神经元杂合体；SK-OV-3，白种人卵巢腺癌；COV434，人卵巢颗粒细胞瘤；Hep 3B，人肝细胞癌；Vero(WHO)，非洲绿猴肾；Nthy-ori 3-1，人甲状腺滤泡上皮细胞；U373 MG(Uppsala)，人胶质母细胞瘤星形细胞瘤；A375，人恶性黑色素瘤；AGS，白种人胃腺癌；CAKI 2，白种人肾癌；COLO205，白种人结肠腺癌；COR-L23，白种人肺大细胞癌；IMR 32，白种人神经母细胞瘤；QT 35，日本鹌鹑纤维肉瘤；WI 38，白种人胎肺；HMVII，人阴道恶性黑色素瘤；HT55，人结肠癌；TK6，人淋巴母细胞，胸苷激酶杂合子；SP2/0-AG14(AC-FREE)，小鼠x小鼠杂交瘤不分泌、无血清、无动物成分(AC)；AR42J，或大鼠胰腺外分泌肿瘤，或其任何组合。

本文描述的是包含转录因子核酸的细胞和细胞系，该转录因子核酸包含应答元件调控的启动子核苷酸序列和编码合成转录因子的核苷酸序列，其中所述应答元件调控的启动子核苷酸序列位于编码所述合成转录因子的所述核苷酸序列的5’侧。在某些实施方案中，细胞系是哺乳动物细胞系。在某些实施方案中，应答元件调控的启动子是cAMP应答元件核苷酸序列、NFAT转录因子应答元件核苷酸序列、FOS启动子核苷酸序列或血清应答元件核苷酸序列。在某些实施方案中，应答元件调控的启动子是NFAT应答元件调控的启动子。在某些实施方案中，细胞系包含报道核酸，所述报道核酸包含合成转录因子启动子核苷酸序列和编码报道子的核苷酸序列，其中所述合成转录因子启动子核苷酸序列位于编码所述报道子的所述核苷酸序列的5’侧，并且其中所述合成转录因子启动子核苷酸序列能够被所述合成转录因子结合。

在某些实施方案中，细胞系包含高基础报道活性。在某些实施方案中，高基础报道活性比背景高至少约5％、10％、20％、25％、30％、40％、50％、60％、70％、80％、90％、100％、200％、300％、400％、500％，其中背景是针对不包含该报道子的细胞或细胞系所观察到的报道活性水平。对于此类比较，通常用作参比物的细胞或细胞系会是包含报道子的细胞系的亲本(例如，包含报道子的HEK293对比不含报道子的HEK293)。

在某些实施方案中，细胞系包含高基础报道活性。在某些实施方案中，高基础报道活性比背景高至少约2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、15倍、20倍、25倍、30倍、32倍、50倍、75倍、100倍、200倍、500倍、750倍、1,000倍、2,000倍、5,000倍、10,000倍或20,000倍，其中背景是针对不包含该报道子的细胞或细胞系所观察到的报道活性水平。在某些实施方案中，细胞系包含高基础报道活性。在某些实施方案中，高基础报道活性比背景高至少约30倍，其中背景是针对不包含该报道子的细胞或细胞系所观察到的报道活性水平。在某些实施方案中，高基础报道活性比背景高至少约32倍，其中背景是针对不包含该报道子的细胞或细胞系所观察到的报道活性水平。对于此类比较，通常用作参比物的细胞或细胞系会是包含报道子的细胞系的亲本(例如，包含报道子的HEK293对比不含报道子的HEK293)。

在某些实施方案中，细胞系包含基础报道活性的低变异性。在某些实施方案中，基础报道活性的低变异性是指生物变异系数小于约0.6。在某些实施方案中，基础报道活性的低变异性是指生物变异系数小于约0.5。在某些实施方案中，基础报道活性的低变异性是指生物变异系数小于约0.4。在某些实施方案中，基础报道活性的低变异性是指生物变异系数小于约0.3。在某些实施方案中，基础报道活性的低变异性是指生物变异系数小于约0.2。在某些实施方案中，基础报道活性的低变异性是指生物变异系数小于约0.1。

在不受理论束缚的情况下，通过选择包括至少2、3、4、5或更多个包含转录因子核酸的拷贝的克隆细胞系，可以获得变异性的降低和高水平的基础活性，所述转录因子核酸包含应答元件调控的启动子核苷酸序列和编码合成转录因子的核苷酸序列，其中所述应答元件调控的启动子核苷酸序列位于编码所述合成转录因子的所述核苷酸序列的5’侧。在某些实施方案中，应答元件调控的启动子是cAMP应答元件核苷酸序列、NFAT转录因子应答元件核苷酸序列、FOS启动子核苷酸序列或血清应答元件核苷酸序列。在某些实施方案中，应答元件调控的启动子是NFAT应答元件调控的启动子。在某些实施方案中，细胞系仅包含1个拷贝的报道核酸，该报道核酸包含合成转录因子启动子核苷酸序列和编码报道子的核苷酸序列。在某些实施方案中，细胞系仅包含2个拷贝的报道核酸，该报道核酸包含合成转录因子启动子核苷酸序列和编码报道子的核苷酸序列。在某些实施方案中，细胞系包含报道核酸，该报道核酸包含合成转录因子启动子核苷酸序列和编码保持未整合或附加体状态的报道子的核苷酸序列。在某些实施方案中，细胞系还包含编码细胞信号传导蛋白的cDNA或其他无内含子形式的核酸。在某些实施方案中，细胞信号传导蛋白是GPCR或GPCR亚基。

在某些实施方案中，细胞包含编码G蛋白偶联受体家族成员的核酸。G蛋白偶联受体(GPCR)，也称为七(穿)跨膜域受体，是配体结合细胞表面信号传导蛋白。当配体与GPCR结合时，它会导致GPCR的构象变化，从而使其充当鸟嘌呤核苷酸交换因子(GEF)。然后GPCR可以通过将与G蛋白结合的GDP交换为GTP来激活相关的G蛋白。然后，与结合的GTP一起，G蛋白的α亚基可以与β和γ亚基解离，以进一步影响直接依赖于α亚基类型的细胞内信号传导蛋白或靶向功能蛋白(Gαs、Gαi/o、Gαq/11、Gα12/13)。人类基因组中编码有至少约800种GPCR，大致分为A、B和C类，它们都可与本文中的系统一起使用。在某些实施方案中，可以将编码G蛋白偶联受体家族成员的核酸整合到基因组中。在某些实施方案中，可以将编码G蛋白偶联受体家族成员的核酸保持附加体状态。

在某些实施方案中，细胞包含编码受体酪氨酸激酶家族成员的核酸。受体酪氨酸激酶(RTK)是对于许多多肽生长因子、细胞因子和激素具有高亲和力的细胞表面受体。受体酪氨酸激酶已被证明不仅是正常细胞过程的关键调控物，而且在许多类型癌症的发展和进展中也具有关键作用。存在许多种类的RTK，其中任何成员都可以在本文所述系统中使用。在某些实施方案中，RTK包含I类RTK(EGF受体家族)(ErbB家族)；II类RTK(胰岛素受体家族)；III类RTK(PDGF受体家族)；IV类RTK(VEGF受体家族)；V类RTK(FGF受体家族)；VI类RTK(CCK受体家族)；VII类RTK(NGF受体家族)；VIII类RTK(HGF受体家族)；IX类RTK(Eph受体家族)；X类RTK(AXL受体家族)；XI类RTK(TIE受体家族)；XII类RTK(RYK受体家族)；XIII类RTK(DDR受体家族)；XIV类RTK(RET受体家族)；XV类RTK(ROS受体家族)；XVI类RTK(LTK受体家族)；XVII类RTK(ROR受体家族)；XVIII类RTK(MuSK受体家族)；XIX类RTK(LMR受体)；或XX类RTK(未确定)的成员。在某些实施方案中，可以将编码RTK家族成员的核酸整合到基因组中。在某些实施方案中，可以将编码RTK家族成员的核酸保持附加体状态。

本文还描述了包含NFAT应答元件的哺乳动物细胞系。在某些实施方案中，包含NFAT应答元件的哺乳动物细胞系包括cb29。

本文还描述了包含NFAT应答元件的哺乳动物细胞系。在某些实施方案中，包含NFAT应答元件的哺乳动物细胞系包括cb37。

使用系统的方法

本发明的多核苷酸序列可以在转染到细胞中时使用。转染可以通过多种转染剂来完成，包括但不限于脂转染、磷酸钙沉淀、病毒转导或电穿孔。转染可以是瞬时的或稳定的。在转染稳定的实施方案中，可以将稳定转染的细胞冷冻或储存起来供以后使用。

在某些实施方案中，将单一核酸中继系统转染到细胞群中。在某些实施方案中，将1、2、3、4、5、10、100或更多种核酸中继系统转染到细胞群中。在某些实施方案中，将2种核酸中继系统转染到细胞群中。在某些实施方案中，将3种核酸中继系统转染到细胞群中。在某些实施方案中，将4种核酸中继系统转染到细胞群中。在某些实施方案中，将5种核酸中继系统转染到细胞群中。在用多种核酸中继系统转染细胞群的某些实施方案中，所述多种核酸中继系统包含不同的应答元件调控的启动子。在其中所述多种核酸中继系统包含不同的应答元件调控的启动子的某些实施方案中，所述多种核酸中继系统包含不同的报道子。在某些实施方案中，所述不同的报道子包含UMI。

用本发明的核酸转染的细胞群可以是任何容量。在某些实施方案中，细胞群包含1,000、10,000、100,000、1,000,000、10,000,000或更多个细胞。在某些实施方案中，用一种或多种转录中继系统转染至少约1,000或更多个细胞。在某些实施方案中，用一种或多种转录中继系统转染至少约10,000或更多个细胞。在某些实施方案中，用一种或多种转录中继系统转染至少约100,000或更多个细胞。在某些实施方案中，用一种或多种转录中继系统转染至少约1,000,000或更多个细胞。在某些实施方案中，用一种或多种转录中继系统转染至少约10,000,000或更多个细胞。

在某些实施方案中，可以将本发明的核酸系统用于多孔板实验中。与本发明的核酸中继系统相容的多孔板的非限制性示例包括6、12、24、48、96、384或1,536孔板。在某些实施方案中，多孔板的每个孔包含用单一转录中继系统转染的细胞群。在某些实施方案中，多孔板的每个孔包含用多种转录中继系统转染的细胞群。在某些实施方案中，每个孔包含多个细胞群，每个细胞群用单一核酸中继系统转染。在某些实施方案中，每个孔包含多个细胞群，每个细胞群用多种核酸中继系统转染。

在某些实施方案中，将测试试剂应用于用本发明的转录中继系统转染的细胞。在某些实施方案中，在使所述测试试剂与所述细胞接触之后，测量报道分子转录的激活水平。在某些实施方案中，所述测试试剂是化学品、小分子、生物分子、多肽、多核苷酸、适配体或其任意组合。在某些实施方案中，将单一测试试剂应用于细胞群。在某些实施方案中，将多种测试试剂应用于细胞群。

在某些实施方案中，本发明的转录中继系统适用于测量GPCR对测试试剂的响应。本发明的核酸系统可适用于与任何GPCR受体一起使用。在某些实施方案中，通过利用cAMP应答元件调控的启动子，所述转录中继系统适用于与GPCR受体一起使用。GPCR的非限制性示例包括5-羟色胺受体、乙酰胆碱受体、腺苷受体、肾上腺素受体、血管紧张素受体、爱帕琳肽(apelin)受体、胆汁酸受体、铃蟾肽受体、缓激肽受体、大麻素受体、趋化素(chemerin)受体、趋化因子受体、胆囊收缩素受体、多巴胺受体、内皮素受体、甲酰肽受体、游离脂肪酸受体、甘丙肽受体、胃饥饿素受体、糖蛋白激素受体、促性腺激素释放激素受体、GPR18、GPR55、GPR119、G蛋白偶联的雌激素受体、组胺受体、羟基羧酸受体、吻素(kisspeptin)受体、白三烯受体、LPA受体、S1P受体、黑色素聚集激素受体、黑皮质素受体、褪黑素受体、胃动素受体、神经介肽U受体、神经肽FF/神经肽AF受体、神经肽S受体、神经肽W/神经肽B受体、神经肽Y受体、神经降压素受体、阿片样物质受体、视蛋白受体、食欲肽受体、酮戊二酸受体、P2Y受体、血小板活化因子受体、前动力蛋白受体、催乳素释放肽受体、前列腺素类激素受体、蛋白酶激活受体、QRFP受体、松弛素家族肽受体、生长抑素受体、琥珀酸受体、速激肽受体、促甲状腺素释放激素受体、痕量胺受体、硬骨鱼紧张肽受体、血管升压素和催产素受体、降钙素受体、促肾上腺皮质激素释放因子受体、胰高血糖素受体家族、甲状旁腺激素受体、VIP和PACAP受体、钙敏感受体、GABA_B受体、代谢型谷氨酸受体、味觉受体第一家族、卷曲类受体、粘附类GPCR、孤儿受体，以及它们的任意组合。

本发明的核酸与本领域中常见的许多载体相容。载体的非限制性示例包括基因组整合载体、附加型载体、质粒、病毒载体、粘粒、细菌人工染色体和酵母人工染色体。与本发明的核酸相容的病毒载体的非限制性示例包括来源于慢病毒、逆转录病毒、腺病毒和腺相关病毒的载体。在某些实施方案中，本发明的核酸存在于载体上，该载体包含引导位点特异性整合到基因组中的固定位置或一组限定位点的序列(例如AttP-AttB重组)。

在某些实施方案中，将本文所述的转录中继系统并入单一载体中。在某些实施方案中，将所述单一载体瞬时转染到细胞中。在某些实施方案中，将所述单一载体稳定转染到细胞中。

在某些实施方案中，将所述转录中继系统划分入两个载体。在某些实施方案中，将包含应答元件调控的启动子核苷酸序列和编码合成转录因子的核苷酸序列的转录因子核酸并入第一载体，并将包含合成转录因子启动子核苷酸序列和编码报道子的核苷酸序列的报道核酸并入第二载体。在某些实施方案中，将所述第一载体和所述第二载体瞬时转染到细胞中。在某些实施方案中，将所述第一载体和所述第二载体稳定转染到细胞中。在某些实施方案中，将所述第一载体稳定转染到细胞中，并将所述第二载体瞬时转染到细胞中。在某些实施方案中，将所述第一载体瞬时转染到细胞中，并将所述第二载体稳定转染到细胞中。

可以使用许多众所周知的分子生物学技术来构建包含本文所述的转录中继系统或其部分的载体。许多此类程序的详细方案(包括扩增、克隆、诱变、转化等)描述于例如Ausubel等人，Current Protocols in Molecular Biology(supplemented through 2012)John Wiley&Sons,New York 10(“Ausubel”)；Sambrook等人，Molecular Cloning–ALaboratory Manual(4th Ed.),Vol.1-3,Cold Spring Harbor Laboratory,Cold SpringHarbor,New York,2012(“Sambrook”)；和Abelson等人，Guide to Molecular CloningTechniques(Methods in Enzymology)volume 152Academic Press,Inc.,San Diego,CA(“Abelson”)中。

实施例

以下说明性实施例代表本文所述的组合物和方法的实施方案并且不意味着以任何方式进行限制。

实施例1-针对CRE激活的示例GPCR受体筛选

在本实施例中，如图1A和1B所配置，包含核酸的转录中继系统用于筛选诱导GPCR信号传导的潜在化合物。对于该实施例，图1A的核酸包括cAMP应答元件(CRE)激活，其导致合成转录因子Gal4-VPR(包含Gal4 DNA结合域和嵌合激活域VP64-p65-Rta)的表达。图1B的核酸包含能够被Gal4-VPR合成转录因子结合和激活的启动子，这导致包含萤光素酶基因和编码UMI的基因的报道元件的表达。所用的细胞包含编码图1A和1B的系统的稳定整合核酸，以及给定的GPCR。每个UMI都与给定的GPCR相关联，从而允许CRE表达与特定的GPCR相映射。这样就可以实现测定的多重化。

在第1天，在DMEM中以35,000个细胞/孔将细胞铺在96孔测定板内。在第2天，将培养基换成0.5％FBS+DMEM。在第3天，移除培养基，并以所需浓度加入在25uL Opti-mem中的测试化合物。约4小时后，移除培养基并替换为裂解缓冲液用于进行RNA提取。使用标准方法或试剂盒提取RNA，并随后通过标准测定法进行定量。测序文库制备后，在Illumina MiSeq上进行RNAseq。

实施例2-针对NFAT激活的示例GPCR受体筛选

在本实施例中，如图1A和1B所配置，包含核酸的转录中继系统用于筛选诱导GPCR信号传导的潜在化合物。对于该实施例，图1A的核酸包括活化T细胞核因子应答元件(NFAT)激活，其导致合成转录因子Gal4-VPR(包含Gal4 DNA结合域和嵌合激活域VP64-p65-Rta)的表达。图1B的核酸包含能够被Gal4-VPR合成转录因子结合和激活的启动子，这导致包含萤光素酶基因和编码UMI的基因的报道元件的表达。所用的细胞包含编码图1A和1B的系统的稳定整合核酸，以及给定的GPCR。每个UMI都与给定的GPCR相关联，从而允许CRE表达与特定的GPCR相映射。这样就可以实现测定的多重化。

实施例3-针对多种GPCR的CRE激活的示例GPCR受体筛选

在本实施例中，将各自如图1A和1B所配置的100种或更多种包含核酸的转录中继系统用于筛选诱导GPCR信号传导的潜在化合物。对于该实施例，图1A的每种核酸包括cAMP应答元件(CRE)激活，其导致合成转录因子Gal4-VPR(包含Gal4 DNA结合域和嵌合激活域VP64-p65-Rta)的表达。图1B的每种核酸包含能够被Gal4-VPR合成转录因子结合和激活的启动子，这导致包含萤光素酶基因和编码UMI的基因的报道元件的表达。所用的细胞群各自包含编码图1A和1B的系统的稳定整合核酸，以及给定的单一GPCR。将多个100种或更多种细胞群混合在一起以形成混合细胞群，每个细胞群编码单一独特GPCR。每个UMI都与给定的GPCR相关联，从而允许CRE表达与特定的GPCR相映射。这样就可以实现测定的多重化。

在第1天，在DMEM中以35,000个细胞/孔将所述混合细胞群铺在96孔测定板内。在第2天，将培养基换成0.5％FBS+DMEM。在第3天，移除培养基，并以所需浓度加入在25uLOpti-mem中的测试化合物。约4小时后，移除培养基并替换为裂解缓冲液用于进行RNA提取。使用标准方法或试剂盒提取RNA，并随后通过标准测定法进行定量。测序文库制备后，在Illumina MiSeq上进行RNAseq。

实施例4-使用转录中继放大报道输出

本实施例中的实验表明，与没有转录中继的系统相比，当使用转录中继系统时，萤光素酶信号增加，且萤光素酶信号的变异系数降低。以30,000个细胞/孔，将携带单一整合的CRE-萤光素酶的HEK293来源的细胞或携带单一整合的UAS-萤光素酶伴随多个拷贝的半随机整合的CRE-Gal4-VPR的细胞铺在白壁多聚-L-赖氨酸包被的96孔板中的100μL DMEM+10％FBS内。在细胞顶部加入50μL含有45ng多西环素的Opti-mem。24小时后，加入DMSO。在指定的时间段内，用DMSO处理细胞。在指定的温育时间后，吸出培养基并替换为35μLDMEM，然后按照制造商的说明书，使用Bright-Glo萤光素酶测定试剂盒[Promega]对细胞进行测定。图2示出了携带单一整合的CRE-萤光素酶的细胞(灰色)和携带单一整合的UAS-萤光素酶伴随多个拷贝的半随机整合的CRE-Gal4-VPR的细胞(黑色)由此表达的萤光素酶活性。实验按照在技术上重复3次来进行，并且每个样品的变异系数计算如图3所示。

实施例5-使用Gal4-VPR上的降解决定子标签增强转录中继的倍数诱导

本实施例中的实验表明，当转录中继系统中的Gal4-VPR上包含降解决定子标签时，萤光素酶信号的倍数诱导增加。以30,000个细胞/孔，将携带单一整合的TRE-CHRM3::UAS-萤光素酶双基因盒和多个半随机整合的FOS-Gal4-VPR-CP(降解决定子)或FOS-Gal4-VPR(无降解决定子)的HEK293来源的细胞铺在白壁多聚-L-赖氨酸包被的96孔板中的100μLDMEM+10％FBS内。在细胞顶部加入50μL含有45ng多西环素的Opti-mem。24小时后，用DMSO或1M卡巴胆碱处理细胞8小时。在指定的温育时间后，吸出培养基并替换为35μLDMEM，然后按照制造商的说明书，使用Bright-Glo萤光素酶测定试剂盒[Promega]对细胞进行测定。由此产生的卡巴胆碱中的萤光素酶活性与DMSO中的萤光素酶活性的比值绘制在图4中。

实施例6-包含NFAT应答元件的细胞系

本实施例中描述的细胞系具有NFAT应答元件转录中继(驱动合成转录因子转录的NFAT启动子)的整合拷贝。就拷贝数和整合位点而言，这些细胞系是作为遗传异源池而产生的。从该池中分离出单细胞克隆，并进行扩增。将这些细胞系进一步用于整合GPCR和UAS-萤光素酶-条形码报道子，以测试它们在多重化中检测NFAT信号传导的能力。从这10个细胞文库中，鉴定出两个能够检测到针对对照激动剂的最高数值的不同GPCR命中的细胞文库：cb29(由克隆c713构建)和cb37(由克隆c708构建)，如图5所示。

重要的是，我们发现产生这两个细胞文库的等克隆细胞系具有两个共同的特性。首先，这些细胞系在未受刺激状态下显示出最高量的报道表达(见图6，“基础活性-反向转染”)。其次，两个相应的细胞文库可能以依赖性的方式显示出最低水平的变异(见图6，“BCV”)。

虽然本文已经示出和描述了本发明的优选实施方案，但是对于本领域技术人员显而易见的是，这些实施方案仅通过示例的方式提供。在不脱离本发明的情况下，本领域技术人员现在将想到许多变体、变化和替换。应当理解，本文所述本发明实施方案的各种替代方案可用于实施本发明。

本说明书中提及的所有出版物、专利申请、授权专利和其他文件均通过引用并入本文，如同明确和单独地指出每个单独的出版物、专利申请、授权专利或其他文件均通过引用以其整体并入。通过引用并入的文本中包含的定义在与本公开内容中的定义相矛盾时则被排除在外。

Claims

1.一种转录中继系统，其包括：

a)转录因子核酸，所述转录因子核酸包含应答元件调控的启动子核苷酸序列和编码合成转录因子的核苷酸序列，其中所述应答元件调控的启动子核苷酸序列位于编码所述合成转录因子的所述核苷酸序列的5’侧；和

b)报道核酸，所述报道核酸包含合成转录因子启动子核苷酸序列和编码报道子的核苷酸序列，其中所述合成转录因子启动子核苷酸序列位于编码所述报道子的所述核苷酸序列的5’侧，并且其中所述合成转录因子启动子核苷酸序列能够被所述合成转录因子结合。

2.根据权利要求1所述的转录中继系统，其中所述应答元件调控的启动子核苷酸序列包含cAMP应答元件核苷酸序列、NFAT转录因子应答元件核苷酸序列、FOS启动子核苷酸序列或血清应答元件核苷酸序列。

3.根据权利要求1或2所述的转录中继系统，其中所述合成转录因子包含来自第一转录因子的DNA结合域和来自第二转录因子的转录激活域。

4.根据权利要求3所述的转录中继系统，其中所述DNA结合域来自Gal4、PPR1、Lac9或LexA。

5.根据权利要求4所述的转录中继系统，其中所述DNA结合域包含与SEQ ID NO:1所示的序列具有至少约90％同一性的氨基酸序列。

6.根据权利要求4所述的转录中继系统，其中所述DNA结合域包含与SEQ ID NO:1所示的序列具有至少约95％同一性的氨基酸序列。

7.根据权利要求4所述的转录中继系统，其中所述DNA结合域包含与SEQ ID NO:1所示的序列相同的氨基酸序列。

8.根据权利要求5所述的转录中继系统，其中所述DNA结合域包含SEQ ID NO:1的氨基酸序列变体。

9.根据权利要求3所述的转录中继系统，其中所述转录激活域包含VP64、p65和Rta。

10.根据权利要求9所述的转录中继系统，其中所述转录激活域包含与SEQ ID NO:14所示的序列具有至少约90％同一性的氨基酸序列。

11.根据权利要求9所述的转录中继系统，其中所述转录激活域包含与SEQ ID NO:14所示的序列具有至少约95％同一性的氨基酸序列。

12.根据权利要求9所述的转录中继系统，其中所述转录激活域包含与SEQ ID NO:14所示的序列相同的氨基酸序列。

13.根据权利要求10所述的转录中继系统，其中所述转录激活域包含SEQ ID NO:14的氨基酸序列变体，其中所述序列变体增加或减少转录激活。

14.根据权利要求1至13中任一项所述的转录中继系统，其中所述合成转录因子包含与SEQ ID NO:10所示的序列具有至少约90％同一性的氨基酸序列。

15.根据权利要求1至13中任一项所述的转录中继系统，其中所述合成转录因子包含与SEQ ID NO:10所示的序列具有至少约95％同一性的氨基酸序列。

16.根据权利要求1至13中任一项所述的转录中继系统，其中所述合成转录因子包含与SEQ ID NO:10所示的序列相同的氨基酸序列。

17.根据权利要求1至16中任一项所述的转录中继系统，其中所述合成转录因子包含使所述合成转录因子去稳定化的多肽序列。

18.根据权利要求17所述的转录中继系统，其中使所述合成转录因子去稳定化的所述多肽序列包含PEST或CL1多肽序列。

19.根据权利要求1至18中任一项所述的转录中继系统，其中所述合成转录因子启动子核苷酸序列包含能够被Gal4、PPR1、Lac9或LexA结合的核苷酸序列。

20.根据权利要求1至19中任一项所述的转录中继系统，其中所述报道子包括荧光蛋白、萤光素酶蛋白、β-半乳糖苷酶、β-葡糖醛酸糖苷酶、氯霉素乙酰转移酶、分泌型胎盘碱性磷酸酶或独特分子标识符。

21.根据权利要求20所述的转录中继系统，其中所述报道子包括荧光蛋白、萤光素酶蛋白、β-半乳糖苷酶、β-葡糖醛酸糖苷酶、氯霉素乙酰转移酶或分泌型胎盘碱性磷酸酶，和独特分子标识符。

22.根据权利要求20或21所述的转录中继系统，其中所述独特分子标识符对于测试多肽是特有的，其中所述测试多肽由所述报道核酸编码。

23.根据权利要求1至22中任一项所述的转录中继系统，其中所述转录因子核酸包含位于所述应答元件调控的启动子核苷酸序列近端的核苷酸序列，所述核苷酸序列可以被转录阻遏子结合。

24.根据权利要求23所述的转录中继系统，其中所述转录因子核酸包含位于所述应答元件调控的启动子核苷酸序列近端的核苷酸序列，所述核苷酸序列延伸由编码所述合成转录因子的所述核苷酸序列编码的mRNA的5’非翻译区。

25.根据权利要求24所述的转录中继系统，其中由编码所述合成转录因子的所述核苷酸序列编码的mRNA的所述5’非翻译区包含一个或多个减少所述合成转录因子的翻译的序列。

26.根据权利要求1至25中任一项所述的转录中继系统，其中所述转录因子核酸和所述报道核酸是单一核酸的组分。

27.一种包含权利要求1至26中任一项的所述中继系统的细胞。

28.根据权利要求27所述的细胞，其中所述细胞包括真核细胞。

29.根据权利要求27所述的细胞，其中所述细胞包括哺乳动物细胞。

30.根据权利要求27至29中任一项所述的细胞，其中所述转录因子核酸、所述报道核酸或所述转录因子核酸和所述报道核酸二者作为单一拷贝整合到所述细胞的基因组中。

31.一种包含权利要求1至26中任一项的所述中继系统的细胞群。

32.根据权利要求30所述的细胞群，其中所述细胞群包括真核细胞群。

33.根据权利要求30所述的细胞群，其中所述细胞群包括哺乳动物细胞群。

34.根据权利要求32或33所述的细胞群，其中所述转录因子核酸、所述报道核酸或所述转录因子核酸和所述报道核酸二者作为单一拷贝整合到所述细胞群的基因组中。

35.根据权利要求27至34中任一项所述的细胞或细胞群，其中所述细胞或细胞群包含高基础报道活性。

36.根据权利要求27至34中任一项所述的细胞或细胞群，其中所述高基础报道活性比背景高至少约30倍，其中背景是针对不包含所述报道子的亲本细胞或细胞系所观察到的报道活性水平。

37.根据权利要求27至34中任一项所述的细胞或细胞群，其中所述细胞或细胞群包含报道活性的低生物变异系数。

38.根据权利要求27至34中任一项所述的细胞或细胞群，其中所述报道活性的低生物变异系数低于约0.5。

39.一种用于检测测试试剂对应答元件调控的启动子的活性的影响的方法，其包括使根据权利要求27-38中任一项所述的细胞或细胞群与测试物质接触。

40.根据权利要求39所述的方法，其中所述测试试剂是小分子化学品。