CN109072233A

CN109072233A - 可扩展的重组酶级联

Info

Publication number: CN109072233A
Application number: CN201780026091.8A
Authority: CN
Inventors: 卢冠达
Original assignee: Massachusetts Institute of Technology
Current assignee: Massachusetts Institute of Technology
Priority date: 2016-04-26
Filing date: 2017-04-26
Publication date: 2018-12-21
Also published as: EP3448996A1; US20170306336A1; WO2017189683A1; JP2019514377A; US10752904B2

Abstract

本文中提供了包含基因扰动盒的遗传构建体和使用其来评估基因表达之时机和顺序的方法。

Description

可扩展的重组酶级联

相关申请

本申请依据35U.S.C.§119(e)要求于2016年4月26日提交的美国临时申请号62/327,479的权益，其通过引用整体并入本文。

技术领域

本发明涉及用于依次、多重且可扩展的基因扰动(gentic perturbation)的方法和遗传构建体。

背景技术

由于有限数量的诱导型系统和诱导物分子，包含诱导型组件的常规遗传工具的复杂性受到限制。此外，这样的工具仅提供基因调节的有限视角，并且缺乏对基因调节的时空动态以及这如何转换为细胞中生物功能的理解。

发明概述

本发明的一些方面提供了包含多个基因扰动盒的遗传构建体，其中所述多个基因扰动盒包含：第一类型的基因扰动盒，其包含编码以下的第一核酸：重组酶活性由第一诱导物诱导的第一诱导型重组酶、第一基因元件、第一终止子，以及在第一重组酶、第一基因元件和第一终止子侧翼的第一对重组酶识别位点，其中第一重组酶能够在第一对重组识别位点的每个重组酶识别位点与第一核酸结合并对其进行切割；以及第二类型的基因扰动盒，其包含编码以下的第二核酸：重组酶活性由第二诱导物诱导的第二诱导型重组酶、第二基因元件、第二终止子，以及在第二重组酶、第二基因元件和第二终止子侧翼的第二对重组酶识别位点，其中第二重组酶能够在第二对重组识别位点的每个重组酶识别位点与第二核酸结合并对其进行切割。在一些实施方案中，所述多个基因扰动盒包含与一个或更多个第二类型的基因扰动盒交替的一个或更多个第一类型的基因扰动盒。

在一些实施方案中，遗传构建体还包含第三类型的基因扰动盒，其包含编码以下的第三核酸：重组酶活性由第三诱导物诱导的第三诱导型重组酶、第三基因元件、第三终止子，以及在第三重组酶、第三基因元件和第三终止子侧翼的第三对重组酶识别位点，其中第三重组酶能够在第三对重组识别位点的每个重组酶识别位点与第三核酸结合并对其进行切割。

在一些实施方案中，遗传构建体还包含位于第一类型的基因扰动盒上游的启动子。在一些实施方案中，启动子是细胞特异性启动子或细胞状态特异性启动子。

在一些实施方案中，编码第一基因元件的核酸位于编码第一诱导型重组酶的核酸的3’非翻译区内和/或编码第二基因元件的核酸位于编码第二诱导型重组酶的核酸的3’非翻译区内。在一些实施方案中，编码第一基因元件的核酸位于编码第一诱导型重组酶的核酸的内含子内和/或编码第二基因元件的核酸位于编码第二诱导型重组酶的核酸的内含子内。在一些实施方案中，基因元件是编码蛋白质的核酸、RNA、gRNA、miRNA或shRNA。

在一些实施方案中，第一诱导型重组酶和/或第二诱导型重组酶是酪氨酸重组酶。在一些实施方案中，第一诱导型重组酶和/或第二诱导型重组酶是丝氨酸重组酶。在一些实施方案中，第一诱导型重组酶和/或第二诱导型重组酶是断裂重组酶(splitrecombinase)。在一些实施方案中，断裂重组酶包含该断裂重组酶的第一部分和第二部分。

在一些实施方案中，多个基因扰动盒中的一个或更多个基因扰动盒包含一个或更多个核酶序列。在一些实施方案中，多个基因扰动盒中的每个基因扰动盒包含一个或更多个核酶序列。在一些实施方案中，多个基因扰动盒中的一个或更多个基因扰动盒包含一个或更多个核糖核酸酶识别序列。在一些实施方案中，多个基因扰动盒中的每个基因扰动盒包含一个或更多个核糖核酸酶识别序列。在一些实施方案中，所述一个或更多个核糖核酸酶识别序列是Cas6/Csy4识别序列。

在一些实施方案中，多个基因扰动盒中的一个或更多个基因扰动盒包含一个或更多个自切割肽序列。在一些实施方案中，所述一个或更多个自切割肽序列是P2A序列。

在一些实施方案中，任何诱导物是小分子诱导物。在一些实施方案中，小分子诱导物是激素。在一些实施方案中，激素是赤霉素(gibberellin，GIB)或脱落酸(abscisicacid，ABA)。在一些实施方案中，小分子诱导物是抗生素。在一些实施方案中，抗生素是甲氧苄啶(trimethoprim)。在一些实施方案中，小分子诱导物是合成配体。在一些实施方案中，合成配体是4-羟基他莫昔芬或Shield-1配体。

本发明的一些方面提供了包含本文中所述的任何遗传构建体的载体。本发明的另一些方面提供了重组细胞，其包含本文中所述的任何遗传构建体或含有本文中所述的任何遗传构建体的载体。在一些实施方案中，重组细胞还包含Cas6/Csy4核糖核酸酶。在一些实施方案中，重组细胞还包含Cas9内切核酸酶。

在一些实施方案中，重组细胞是细菌细胞、真菌细胞、酵母细胞、昆虫细胞、植物细胞、动物细胞或人细胞。在一些实施方案中，重组细胞是干细胞。在一些实施方案中，干细胞是胚胎干细胞或诱导多能干细胞(induced pluripotent stem cell，iPS)。

本文中还提供了包含本文中所述的任何重组细胞的转基因生物。在一些实施方案中，转基因生物是转基因非人生物。

本发明的另一些方面提供了用于评估细胞中基因表达的方法，其包括：(i)向细胞提供包含多个基因扰动盒的遗传构建体，其中所述多个基因扰动盒包含：(a)第一类型的基因扰动盒，其包含编码以下的核酸：重组酶活性由第一诱导物诱导的第一诱导型重组酶、第一基因元件、第一终止子，以及在第一重组酶、第一基因元件和第一终止子侧翼的第一对重组酶识别位点，其中第一重组酶能够在第一对重组识别位点的每个重组酶识别位点与第一核酸结合并对其进行切割；以及(b)第二类型的基因扰动盒，其包含编码以下的第二核酸：重组酶活性由第二诱导物诱导的第二诱导型重组酶、第二基因元件、第二终止子，以及在第二重组酶、第二基因元件和第二终止子侧翼的第二对重组酶识别位点，其中第二重组酶能够在第二对重组识别位点的每个重组酶识别位点与第二核酸结合并对其进行切割；(ii)在其中第一基因扰动盒被表达并且基因元件从核酸上切割的条件下孵育(i)的细胞；以及(iii)评估基因元件的一个或更多个靶标的输出。

在一些实施方案中，多个基因扰动盒还包含第三类型的基因扰动盒，其包含编码以下的第三核酸：重组酶活性由第三诱导物诱导的第三诱导型重组酶、第三基因元件、第三终止子，以及在第三重组酶、第三基因元件和第三终止子侧翼的第三对重组酶识别位点，其中第三重组酶能够在第三对重组识别位点的每个重组酶识别位点与第三核酸结合并对其进行切割。

在一些实施方案中，第一、第二和/或第三基因元件的一个或更多个靶标的输出包括评估所述一个或更多个靶标的表达。

参照本发明的附图和详细描述，本发明的这些及其他方面及其多个实施方案将变得更加明显。

本发明的每项限制可涵盖本发明的多个实施方案。因此，预期涉及任意一个元件或元件组合的本发明的每项限制可被包括在本发明的每个方面中。本发明的应用不限于以下描述中阐述的或附图中举例说明的组件的构造和布置的细节。本发明能够具有其他实施方案并且能够以多种方式实施或进行。

附图简述

附图不旨在按比例绘制。为清楚起见，并非每个组件在每个附图中都会标记。在附图中：

图1A至1C示出了用于依次、多重且可扩展的原位基因扰动的示例性在时空上受调节的级联的示意图。图1A示出了在时空上受调节的级联，其包括细胞类型特异性启动子(P_特异性)和三个基因扰动盒(Genetic Perturbation Cassette，GPC)，每个基因扰动盒由以下组成：诱导型重组酶(rec)、当与CRISPR-Cas转录因子一起使用时可以以多重方式调节下游靶标的gRNA、以及转录终止子(Term)，其所有都侧接在同源重组酶识别位点(R1)之间。重组酶1(Rec1)(包括gRNA1在内)在P_特异性的控制之下表达。诱导物1激活Recl活性，其使用相应的重组酶位点(R1，由括号示出)自切除第一GPC。图1B示出了重组酶2(Rec2)(包括gRNA2在内)的表达。gRNA2使用CRISPR-Cas转录因子调节下游靶标。诱导物2激活Rec2活性，其使用相应的重组酶位点(R2，由三角形示出)自切除第二GPC。图1C示出了重组酶3(Rec3)(包括gRNA3在内)的表达。gRNA3使用CRISPR-Cas转录因子调节下游靶标。诱导物1激活Rec3活性，其使用相应的重组酶位点(R3，由箭头示出)自切除第三GPC。

图2示出了使用断裂重组酶的一个示例性盒的示意图。与诱导物赤霉素(GIB)或脱落酸(ABA)的结合结构域和报道子荧光蛋白(mCherry)融合的重组酶的N端片段和C端片段(断裂-N(Split-N)和断裂-C(Split-C))以重组酶的识别序列(由三角形标示)为侧翼。诱导物(GIB或ABA)的添加诱导断裂重组酶盒的二聚化和激活以切除基因扰动盒并且触发下游基因(BFP)的表达。

图3A和3B示出了包含断裂重组酶的基因扰动盒在细胞培养中的使用的验证。将293T细胞用指定的断裂重组酶盒瞬时转染并用载剂(乙醇，EtOH)或诱导物(GIB或ABA)处理。由通过流式细胞术检测的BFP表达(y轴)来评估重组酶介导的盒切除。图3A示出了用载剂或药物处理之后96小时的代表性流式细胞术图。图3B示出了图3A中分析的样品的切除效率的定量图。按照(％BFP阳性)/(％BFP或mCherry阳性)计算切除效率。

图4A和4B示出了本文中所述的可扩展重组酶级联用于建立肿瘤发生模型的示例性用途。图4A示出了由正常上皮通过APC、KRS、p53和Smad4的依次突变发生结直肠癌的示意图(改编自Walther等Nat.Rev.Cancer.(2009)9(7)：489-99)。图4B示出了包括四个基因扰动盒的可扩展重组酶级联的示意图。第一基因扰动盒编码重组酶(recl)和导致APC突变的gRNA，其以该重组酶的识别序列(由括号标示)为侧翼。第二基因扰动盒编码重组酶(rec2)，其以该重组酶的识别序列(由三角形标示)为侧翼。第三基因扰动盒编码重组酶(rec3)和导致Smad4突变的gRNA，其以该重组酶的识别序列(由箭头标示)为侧翼。第四基因扰动盒编码重组酶(rec4)和导致p53突变的gRNA，其以该重组酶的识别序列(由半圆标示)为侧翼。

图5A和5B示出了本文中所述的可扩展重组酶级联用于使祖细胞(progenitorcell)分化成特定细胞类型的示例性用途。图5A示出了细胞分化的示意图，其包括该过程涉及的转录因子的子集(改编自Pagliuca和Melton，Development(2013)140(12)：2472-83)。图5B示出了包括四个基因扰动盒的可扩展重组酶级联的示意图。第一基因扰动盒编码重组酶(rec1)和导致细胞分化成定形内胚层的gRNA，其以该重组酶的识别序列(由括号标示)为侧翼。第二基因扰动盒编码重组酶(rec2)和导致细胞分化成胰腺内胚层的gRNA，其以该重组酶的识别序列(由三角形标示)为侧翼。第三基因扰动盒编码重组酶(rec3)和导致细胞分化成内分泌祖细胞的gRNA，其以该重组酶的识别序列(由箭头标示)为侧翼。第四基因扰动盒编码重组酶(rec4)和导致细胞分化成胰腺β细胞的gRNA，其以该重组酶的识别序列(由半圆标示)为侧翼。

发明详述

常规的重组表达工具允许并行地可诱导控制多个基因，例如使用CRISPR-Cas转录因子，并且允许在特定组织中或在限定时间诱导遗传改变，例如使用重组酶系统如Cre-LoxP系统。可相对于彼此正交地使用的诱导型系统的有限可用性限制了可在单个细胞中实现的基因扰动的时间复杂性。本文中提供了包含一系列基因扰动盒的合成遗传构建体，其用于多组内源基因的可扩展、依次且可控的扰动。基因扰动构建体(例如本文中所述的那些)可用于评价基因表达的时空调节，例如时空基因表达如何影响发生和/或疾病进展，例如在癌症模型、代谢疾病和神经退行性疾病中。

本文中所述的遗传构建体的设计允许在诱导至少两种不同重组酶的两种不同诱导物之间切换(交替)，提供了诱导广泛多个依次且组合的基因程序的潜力。本文中所述的遗传构建体包含至少两种类型的基因扰动盒，每种基因扰动盒包含重组酶、基因元件、终止子和一对重组酶识别位点。这样的遗传构建体允许细胞中多组基因的依次的且受调节的扰动控制，使诱导物的数量最小化(例如，仅使用两种诱导物)。此外，在每个基因扰动盒的3’末端存在终止子序列允许一次表达一种重组酶并且可用于被诱导物激活。如本文中所述，重组酶的激活导致与重组酶识别位点对结合，切除相应的基因扰动盒，使DNA主链重组，从而使下一个基因扰动盒表达。

本公开内容的一些方面涉及遗传构建体、包含遗传构建体的载体、编码遗传构建体的重组细胞和使用所述遗传构建体的方法。如本文中所用，“遗传构建体”是指一个或更多个包含两个或更多个基因扰动盒的DNA元件。术语“基因扰动盒”(GPC)是指包含诱导型重组酶、基因元件、终止子和一对重组酶识别位点的核酸序列。遗传构建体还可编码在第一基因扰动盒上游的允许以依次方式表达基因扰动盒的启动子。本文中所述的遗传构建体允许通过交替遗传构建体中基因扰动盒的类型的顺序在两种诱导物之间切换(交替)。例如，如图1A中所示，遗传构建体的第一GPC(最5′GPC)可以是由第一诱导物(诱导物1)诱导的第一类型的GPC；接着是第二GPC，其是第二类型的GPC并且由第二诱导物(诱导物2)诱导；然后是第三GPC，其是第一类型的GPC并且由第一诱导物(诱导物1)诱导。在一些实施方案中，第一诱导物可用于激活重组酶1、3、5等，而第二诱导物可用于激活重组酶2、4、6等。在一些实施方案中，遗传构建体包含至少2、3、4、5、6、7、8、9、10个或更多个基因扰动盒。

在一些实施方案中，本文中所述的任何遗传构建体可包含第三类型的基因扰动盒，其包含诱导型重组酶、基因元件、终止子和重组酶识别位点对。在一些实施方案中，第三类型的基因扰动盒的重组酶由不同于第一和第二诱导物的诱导物诱导。

本公开内容的一些方面提供了诱导型重组酶，其当激活时从遗传构建体切除其相应的基因扰动盒。介导其自身切除的这样的重组酶或编码这样的重组酶的盒可被称为自杀型重组酶或自杀型盒。

如本文中所用，“诱导型重组酶”是指具有可诱导的重组酶活性(即，能够催化双链DNA的重组)的蛋白质。术语“诱导物”是指触发或诱导重组酶的激活的分子或信号。在一些实施方案中，重组酶活性的诱导物是小分子的存在和/或结合。在一些实施方案中，诱导物是小分子的不存在或去除。作为替代或补充，重组酶的活性由宿主细胞内的信号诱导。在一些实施方案中，诱导物通过诱导蛋白质二聚化来促进重组酶活性的激活。在一些实施方案中，诱导物通过蛋白质转位来促进重组酶活性的激活。

本领域中已知的任何诱导物均可与本文中所述的基因扰动盒相容。诱导物的一些实例包括但不限于甲醇、IPTG、铜、抗生素(例如四环素或甲氧苄啶)、碳源、光和激素。在一些实施方案中，本文中所述的任何诱导物可以是小分子，例如小分子抑制剂或小分子激活剂。如本文中所用，“小分子”是指低分子量(即，低于900道尔顿)的化合物。在一些实施方案中，诱导物是激素。激素诱导物的一些实例包括赤霉素(GIB)和脱落酸(ABA)。在一些实施方案中，诱导物是外源性分子。在一些实施方案中，诱导物是抗生素。在一些实施方案中，诱导物是由细胞产生的内源性分子，例如在特定的发育阶段期间。

在一些实施方案中，诱导物是合成配体。如本文中所用，术语“合成配体”是指可直接或间接地诱导或激活重组酶的任何非天然存在的配体。在一些实施方案中，合成配体与重组酶相互作用(结合)并且激活其酶活性。在一些实施方案中，合成配体与结合结构域或其一部分相互作用以激活重组酶的酶活性。在一些实施方案中，合成配体是4-羟基他莫昔芬。在一些实施方案中，合成配体是Shield-1配体。

调节重组酶活性的诱导物的浓度将取决于以下因素，例如诱导型系统的任何组件和期望的重组酶活性水平。在一些实施方案中，诱导物的浓度为0.001至50μM、0.05至10μM、0.01至5μM、0.05至1μM、或0.1至1μM。在一些实施方案中，诱导物的浓度为至少0.01μM、0.02μM、0.03μM、0.04μM、0.05μM、0.06μM、0.07μM、0.08μM、0.09μM、0.1μM、0.15μM、0.2μM、0.3μM、0.425μM、0.5μM、0.6μM、0.7μM、0.8μM、0.9μM、1.0μM、1.1μM、1.2μM、1.3μM、1.4μM、1.5μM或更高。

应理解，一些重组酶可需要一种或更多种另外的辅因子和/或辅助蛋白以介导遗传构建体的重组。在一些实施方案中，诱导型重组酶获自或来源于细菌重组酶、真菌重组酶、酵母重组酶或噬菌体重组酶。多种重组酶组合可用于本文中所述的遗传构建体。

通常来说，重组酶基于蛋白质的保守亲核性氨基酸残基可分类为酪氨酸重组酶或丝氨酸重组酶。在一些实施方案中，任意一种或更多种诱导型重组酶可以是酪氨酸重组酶。本领域中已知的酪氨酸重组酶的一些实例包括Cre重组酶、Flp重组酶、XerC重组酶、XerD重组酶、λ整合酶、HP1整合酶、或者其衍生物或变体。在一些实施方案中，任意一种或更多种诱导型重组酶可以是丝氨酸重组酶。本领域中已知的丝氨酸重组酶的一些实例包括γδ、ParA、Tn3、Gin、BxbI和R4。本文中所述的遗传构建体可包含酪氨酸重组酶、丝氨酸重组酶、或酪氨酸重组酶和丝氨酸重组酶二者的组合。用于本文中所述的遗传构建体的重组酶的另外的实例包括但不限于KD、B2、B3、R和Dre重组酶，以及大丝氨酸型噬菌体整合酶。

其中在编码重组酶的核酸序列中产生一个或更多个突变的重组酶衍生物或变体也在本公开内容的范围内。例如，可产生这样的突变(包括缺失、插入和/或替换突变)以改变重组酶的活性、改变诱导重组酶活性的机制和/或改善重组酶的表达。在一些实施方案中，在编码重组酶的核酸序列中产生一个或更多个突变以使重组酶的活性可诱导。在一些实施方案中，重组酶是合成或人工的重组酶。

在一些实施方案中，重组酶与结合结构域融合，该结合结构域与诱导物分子相互作用从而调节重组酶的酶活性。

在一些实施方案中，诱导物分子结合结构域与重组酶的融合允许通过诱导物的存在来调节重组酶的稳定性。使重组酶稳定从而提高重组酶活性的诱导物的一些实例包括但不限于4-羟基他莫昔芬、Shield-1配体和甲氧苄啶。

4-羟基他莫昔芬的结合结构域是ER^T2，其是雌激素受体配体结合结构域的点突变体。在一些实施方案中，ER^T2或其一部分与重组酶或重组酶的一部分(例如具有重组酶活性的重组酶蛋白部分或者断裂重组酶的N端或C端部分)融合。Shield-1的结合结构域是去稳定化结构域(destabilization domain，DD)，其是FKBP12结构域的点突变体。在一些实施方案中，DD或其一部分与重组酶或重组酶的一部分融合。甲氧苄啶的结合结构域是来自大肠杆菌(E.coli)的二氢叶酸还原酶的点突变体。在一些实施方案中，甲氧苄啶结合结构域或其一部分与重组酶或重组酶的一部分融合。

在一些实施方案中，诱导物结合结构域与全长重组酶的N端融合。在一些实施方案中，诱导物结合结构域与全长重组酶的C端融合。

断裂重组酶也在本发明的范围内。通常来说，断裂重组酶是已被表达为该酶的两个或更多个独立部分的重组酶。例如，重组酶可被表达为两个或更多个(例如2、3、4个或更多个)部分。在一些实施方案中，重组酶的每个独立部分各自与结合结构域(例如，诱导物结合结构域)的一部分融合。在一些实施方案中，结合结构域的部分与诱导物的相互作用导致重组酶的部分相互作用(例如，二聚化)以重构酶活性，从而调节重组酶的活性。本领域中已知的任何重组酶均可在本文中所述的基因扰动盒中用作断裂重组酶。

在一些实施方案中，断裂重组酶被表达为重组酶的N端部分和C端部分。术语“N端部分”在本文中用于指从蛋白质的第一个氨基酸残基(N端)延伸的重组酶部分。在一些实施方案中，N端部分为全长重组酶的约5％、10％、15％、20％、25％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％或更多。还如本文中所用，术语“C端部分”是指包含蛋白质的最后一个氨基酸残基(C端)的重组酶部分。在一些实施方案中，C端部分为全长重组酶的约5％、10％、15％、20％、25％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％或更多。

在一些实施方案中，重组酶是Cre重组酶并且被表达为包含N端部分和C端部分的断裂重组酶。在一些实施方案中，重组酶是断裂Cre重组酶，并且包含为全长Cre重组酶的75％的N端部分和为全长Cre重组酶的25％的C端部分。

在一些实施方案中，重组酶是FlpO重组酶并且被表达为包含N端部分和C端部分的断裂重组酶。在一些实施方案中，重组酶是断裂FlpO重组酶，并且包含为全长FlpO重组酶的95％的N端部分和为全长FlpO重组酶的5％的C端部分。

在一些实施方案中，重组酶是重组酶并且被表达为包含N端部分和C端部分的断裂重组酶。在一些实施方案中，断裂重组酶包含为全长重组酶的40％的N端部分和为全长重组酶的60％的C端部分。

如本文中所述，断裂重组酶的每个部分可与结合结构域(例如诱导物结合结构域)的一部分融合，使得与相应的诱导物的相互作用允许重组酶的部分之间相互作用。在一些实施方案中，诱导物结合结构域可分为两个部分，例如结合结构域的N端部分和C端部分。在一些实施方案中，断裂重组酶的N端部分可与诱导物结合结构域的N端部分融合。在一些实施方案中，断裂重组酶的N端部分可与诱导物结合结构域的C端部分融合。在一些实施方案中，断裂重组酶的C端部分可与诱导物结合结构域的C端部分融合。在一些实施方案中，断裂重组酶的C端部分可与诱导物结合结构域的N端部分融合。

如本文中所用，关于诱导物结合结构域的“N端部分”意指从该结构域的第一个氨基酸残基(N端)延伸的诱导物结合结构域部分。在一些实施方案中，N端部分为全长结合结构域的约5％、10％、15％、20％、25％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％或更多。还如本文中所用，关于诱导物结合结构域的术语“C端部分”意指包含该结构域的最后一个氨基酸残基(C端)的诱导物结合结构域部分。在一些实施方案中，C端部分为全长结合结构域的约5％、10％、15％、20％、25％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％或更多。

与相应的诱导物相互作用的任何结合结构域都可用于本文中所述的构建体。例如，在一些实施方案中，诱导物是赤霉素，并且结合结构域是与赤霉素相互作用的蛋白质结构域。在一些实施方案中，诱导物是赤霉素，并且结合结构域是可与赤霉素结合的赤霉素不敏感矮化蛋白1(Gibberellin Insensitive Dwarfl，GID1)或其一部分，以及可与赤霉素结合的赤霉素不敏感蛋白(Gibberellin Insensitive，GAI)或其一部分。在一些实施方案中，诱导物是脱落酸，并且结合结构域是与脱落酸相互作用的蛋白质结构域。在一些实施方案中，诱导物是脱落酸，并且结合结构域是可与脱落酸结合的脱落酸不敏感蛋白(abscisicacid insensitive，ABI)或其一部分，以及可与脱落酸结合的PYL ABI受体或其一部分。

在一些实施方案中，在断裂重组酶的部分和结合结构域的部分之间可存在接头序列。如本领域技术人员所理解的，接头序列可用于允许适当的蛋白质折叠、酶活性和/或与配体(诱导物)和/或断裂重组酶的其他部分的相互作用。

本文中所述的基因扰动盒各自包含在该基因扰动盒的重组酶、基因元件和启动子组件侧翼的重组酶识别位点对。在重组酶激活之后，重组酶能够识别其同源重组酶识别位点并与其结合，导致切除位于重组酶识别位点之间的遗传物质(例如，编码重组酶、基因元件和终止子的核酸)。重组酶识别位点通常是由同源重组酶识别的短的(即，约30至40个核苷酸)DNA序列。重组酶识别位点可包含回文序列或回文区。

本文中所述的遗传构建体的每对重组酶识别位点是独特的，使得重组酶的激活导致切除编码该重组酶的基因扰动盒。例如，遗传构建体的第一基因扰动盒的重组酶的激活允许该重组酶识别并结合在第一基因扰动盒侧翼的同源重组酶识别位点，而不是在其他基因扰动盒(即，第二基因扰动盒、第三基因扰动盒等)侧翼的重组酶识别位点。

当第一组件位于另一些遗传元件之间并且与之紧邻时，认为遗传构建体的一个或更多个组件以另一些遗传元件为“侧翼”。例如，图1A示出了包含三个基因扰动盒的遗传构建体的示意图，每个基因扰动盒以重组酶识别位点对(一个在每个基因扰动盒的5’且一个在每个基因扰动盒的3’)为侧翼。

本公开内容的一些方面涉及包含基因元件的基因扰动盒。如本文中所用，“基因元件”是指其表达和/或活性可被评估的任何核酸序列。基因元件可包括但不限于蛋白质编码序列(基因)、RNA、微RNA、shRNA或gRNA。应理解，每个基因扰动盒可具有相同或不同类型的基因元件。例如，多个基因扰动盒中的一个基因扰动盒可包含gRNA，并且一个或更多个其他的基因扰动盒可包含另一类型的基因元件(例如，基因、RNA、微RNA或shRNA)。在一些实施方案中，多个基因扰动盒中的每个基因扰动盒可包含相同类型的基因元件，例如，多个中的所有基因扰动盒都可包含gRNA。

在一些实施方案中，基因元件是基因，例如蛋白质编码序列。对于本领域中已知的任何基因的表达或活性可进行评估以确定基因扰动盒的表达。在一些实施方案中，可评估由基因编码的产物的活性以确定基因扰动盒的表达。在一些实施方案中，基因编码转录因子，例如参与控制细胞命运的细胞分化网络的转录因子。在一些实施方案中，基因编码报道蛋白，例如酶(例如，半乳糖苷酶、荧光、萤光素酶或碱性磷酸酶)。在一些实施方案中，基因编码荧光蛋白，例如红色荧光蛋白(red fluorescent protein，RFP)、黄色荧光蛋白(yellow fluorescent protein，YFP)、蓝色荧光蛋白(blue fluorescent protein，BFP)。

在一些实施方案中，基因元件是微RNA。术语“微RNA”和“miRNA”可在全文中互换使用，并且是指短的、非编码的、单链RNA分子。本公开内容的miRNA可以是天然存在的或合成的(例如，人工的)。miRNA通常通过与见于所靶向mRNA的3′UTR(非翻译区)内的靶位点结合来诱导基因沉默。这种相互作用通过抑制蛋白质合成和/或通过启动mRNA降解来防止蛋白质产生。mRNA上的大部分靶位点与其相应的微RNA具有仅部分的碱基互补性，因此，单独微RNA可靶向100种不同的mRNA或更多。此外，单独mRNA可包含针对不同miRNA的多个结合位点，导致复杂的调节网络。在一些实施方案中，miRNA的长度为10至50个核苷酸。例如，miRNA的长度可以是10至40、10至30、10至20、20至50、20至40或20至30个核苷酸。在一些实施方案中，miRNA的长度为10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个核苷酸。在一些实施方案中，miRNA的长度为22个核苷酸。

在一些实施方案中，基因元件是shRNA。通常来说，shRNA是形成或能够形成发夹结构的短的RNA分子。本公开内容的shRNA可以是天然存在的或合成的(例如，人工的)。shRNA与靶mRNA的结合通常导致该mRNA的降解。在一些实施方案中，shRNA的长度为50至120个核苷酸。例如，siRNA的长度可以是50至100、50至90、50至80、60至120、60至100或70至90个核苷酸。在一些实施方案中，siRNA的长度为60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、018、109、110、111、112、113、114、115、116、117、118、119或120个核苷酸。

在一些实施方案中，基因元件是gRNA。术语“gRNA”、“指导RNA”和“CRISPR指导序列”可在全文中互换使用，并且是指包含决定CRISPR/Cas系统的Cas DNA结合蛋白的特异性的序列的核酸。在一些实施方案中，编码gRNA的基因扰动盒用于：用CRISPR/Cas系统敲除一个或更多个基因；用CRISPR激活系统激活一个或更多个基因；或用CRISPR抑制系统抑制一个或更多个基因。gRNA与宿主细胞中的靶核酸序列互补。与靶核酸互补的gRNA或其部分的长度可以是15至25个核苷酸、18至22个核苷酸、或19至21个核苷酸。在一些实施方案中，与靶核酸互补的gRNA序列的长度为15、16、17、18、19、20、21、22、23、24或25个核苷酸。在一些实施方案中，与靶核酸互补的gRNA序列的长度为20个核苷酸。除与靶核酸互补的序列之外，在一些实施方案中，gRNA还包含支架序列。编码支架序列和与靶核酸互补的序列二者的gRNA的表达具有与靶核酸结合(杂交)和将内切核酸酶募集至靶核酸的双重功能，这可导致位点特异性的CRISPR活性。在一些实施方案中，这样的嵌合gRNA可被称为单指导RNA(single guide RNA，sgRNA)。

如本文中所用，“支架序列”，也被称为tracrRNA，是指将内切核酸酶募集至与互补gRNA序列结合(杂交)的靶核酸的核酸序列。包含至少一个茎环结构并且募集内切核酸酶的任何支架序列都可用于本文中所述的基因元件和载体。示例性支架序列对于本领域技术人员而言将是明显的，并且可见于例如Jinek，等Science(2012)337(6096)：816-821；Ran，等Nature Protocols(2013)8∶2281-2308；PCT申请No.WO2014/093694；以及PCT申请No.WO2013/176772中。

在一些实施方案中，gRNA序列不包含支架序列，并且支架序列作为独立的转录物表达。在一些实施方案中，基因扰动盒也编码支架序列。在这样的一些实施方案中，gRNA序列还包含与支架序列的一部分互补并且用于结合支架序列(与其杂交)和将内切核酸酶募集至靶核酸的另外的序列。

应理解，如果gRNA序列能够与宿主细胞中的靶核酸杂交，则该gRNA序列或其一部分与该靶核酸互补。在一些实施方案中，gRNA序列与靶核酸至少50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、96％、97％、98％、99％、或至少100％互补(还参见美国专利8,697,359，其由于其gRNA序列与靶多核苷酸序列的互补性的教导而通过引用并入)。已经示出，CRISPR指导序列与靶核酸之间在靶核酸的3’末端附近的的错配可消除核酸酶切割活性(UpadhVay，等Genes Genome Genetics(2013)3(12)：2233-2238)。在一些实施方案中，gRNA序列与靶核酸的3’末端(例如，靶核酸的3’末端的最后5、6、7、8、9或10个核苷酸)至少50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、96％、97％、98％、99％、或至少100％互补。

gRNA序列可从本领域中已知的任何来源获得。例如，gRNA序列可以是存在于宿主细胞的核酸(例如，基因组核酸和/或基因组外核酸)中的指定长度的任何核酸序列。在一些实施方案中，可设计和合成gRNA序列以靶向期望的核酸，例如编码转录因子、信号传导蛋白、转运蛋白的核酸等。

在一些实施方案中，本公开内容的gRNA的长度为10至500个核苷酸。在一些实施方案中，gRNA的长度为10至20个核苷酸、10至30个核苷酸、10至40个核苷酸、10至50个核苷酸、10至60个核苷酸、10至70个核苷酸、10至80个核苷酸、10至90个核苷酸、10至100个核苷酸、20至30个核苷酸、20至40个核苷酸、20至50个核苷酸、20至60个核苷酸、20至70个核苷酸、20至80个核苷酸、20至90个核苷酸、20至100个核苷酸、30至40个核苷酸、30至50个核苷酸、30至60个核苷酸、30至70个核苷酸、30至80个核苷酸、30至90个核苷酸、30至100个核苷酸、40至50个核苷酸、40至60个核苷酸、40至70个核苷酸、40至80个核苷酸、40至90个核苷酸、40至100个核苷酸、50至60个核苷酸、50至70个核苷酸、50至80个核苷酸、50至90个核苷酸或50至100个核苷酸。在一些实施方案中，gRNA的长度为10至200个核苷酸、10至250个核苷酸、10至300个核苷酸、10至350个核苷酸、10至400个核苷酸或10至450个核苷酸。在一些实施方案中，gRNA的长度为多于500个核苷酸。在一些实施方案中，gRNA的长度为10、15、20、15、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、110、120、130、140、150、160、170、180、190、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、450、460、470、480、490、500个或更多个核苷酸。

术语“靶核酸”、“靶位点”和“靶序列”可在全文中互换使用，并且是指宿主细胞中可通过本文中所述的gRNA序列靶向的任何核酸序列。靶位点也可称为gRNA的“下游靶标”。靶核酸在3’侧以前间隔区邻近基序(protospacer adjacent motif，PAM)为侧翼，所述PAM可与内切核酸酶相互作用并且进一步参与将内切核酸酶活性靶向至靶核酸。通常认为在靶核酸侧翼的PAM序列取决于内切核酸酶和从中得到内切核酸酶的来源。例如，对于来源于化脓性链球菌(Streptococcus pyogenes)的Cas9内切核酸酶，PAM序列是NGG。对于来源于金黄色葡萄球菌(Staphylococcus aureus)的Cas9内切核酸酶，PAM序列是NNGRRT。对于来源于脑膜炎奈瑟菌(Neisseria meningitidis)的Cas9内切核酸酶，PAM序列是NNNNGATT。对于来源于嗜热链球菌(Streptococcus thermophilus)的Cas9内切核酸酶，PAM序列是NNAGAA。对于来源于齿垢密螺旋体(Treponema denticola)的Cas9内切核酸酶，PAM序列是NAAAAC。对于Cpfl核酸酶，PAM序列是TTN。

在另一些实施方案中，重组酶和基因元件被转录为独立的mRNA转录物。在一些实施方案中，基因扰动盒的重组酶和基因元件被转录为单mRNA转录物。在一些实施方案中，编码基因元件的核酸在编码重组酶的核酸内。如本文中所用，如果第一核酸序列插入在第二核酸序列的两个核苷酸之间，或者如果第一核酸序列替换第二核酸序列的一段连续核苷酸，则一个核酸序列被认为在另一核酸序列内。在一些实施方案中，编码基因元件的核酸在重组酶的非蛋白质编码部分(例如重组酶的非翻译区)内。在一些实施方案中，编码基因元件的核酸在重组酶的3’UTR序列内。在一些实施方案中，基因元件编码在重组酶核酸序列的内含子内。用于编码基因元件和从另一基因(例如本文中所述的重组酶)的一部分内去除基因元件的方法是本领域中已知的。参见例如Nissim等Mol.Cell(2014)54：1-13。

在一些实施方案中，编码基因元件的核酸在重组酶的3’UTR序列内，并且基因元件在转录之后从重组酶的序列中去除。在一些实施方案中，本公开内容的基因元件以核糖核酸酶识别位点为侧翼。核糖核酸酶(缩写为RNase)是催化RNA水解的核酸酶。核糖核酸酶可以是内切核糖核酸酶或外切核糖核酸酶。内切核糖核酸酶切割单链或双链RNA。外切核糖核酸酶通过从RNA的5’末端或3’末端去除末端核苷酸来降解RNA。在一些实施方案中，本公开内容的基因元件(例如gRNA)以Csy核糖核酸酶识别位点(例如，Csy4核糖核酸酶识别位点)为侧翼。Csy4是识别特定的RNA序列，切割RNA并且保持与上游片段结合的内切核糖核酸酶。在一些实施方案中，Csy核糖核酸酶(例如，Csy4核糖核酸酶)用于从核酸转录物释放基因元件。因此，在一些实施方案中，包含本文中所述的包含以Csy4或另外Cas6核糖核酸酶识别位点为侧翼的基因元件的任何遗传构建体的细胞还包含编码Csy4或另外Cas6核糖核酸酶的核酸。在一些实施方案中，Csy4或另外Cas6核糖核酸酶的活性可通过一个或更多个诱导物分子的存在诱导或调节，使得以核糖核酸酶识别位点为侧翼的基因元件仅在核糖核酸酶存在诱导物时被切割。Csy4或另外Cas6核糖核酸酶用于切除基因元件的用途是本领域中已知的，参见例如PCT申请No.WO 2015/153940。

在一些实施方案中，细胞可稳定地表达或被修饰以稳定地表达Csy4或另外Cas6核糖核酸酶。在一些实施方案中，Csy核糖核酸酶(例如，Csy4核糖核酸酶)来自铜绿假单胞菌(Pseudomonas aeruginosa)、表皮葡萄球菌(Staphylococcus epidermidis)、激烈火球菌(Pyrococcus furiosus)或硫磺矿硫化叶菌(Sulfolobus solfataricus)。本文中考虑了其他核糖核酸酶和核糖核酸酶识别位点(参见，例如Mojica，F.J.M.等，CRISPR-Cas Systems，RNA-mediated Adaptive Immunity in Bacteria and Archaea，Barrangou，Rodolphe，vander Oost，John(Eds.)，2013，ISBN 978-3-642-34657-6，其中与核糖核酸酶/识别位点有关的主题通过引用并入本文)。

在一些实施方案中，核糖核酸酶识别位点(例如，Csy4核糖核酸酶识别位点)的长度为10至50个核苷酸。例如，Csy核糖核酸酶识别位点的长度可以是10至40、10至30、10至20、20至50、20至40或20至30个核苷酸。在一些实施方案中，Csy核糖核酸酶识别位点的长度为10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50个核苷酸。在一些实施方案中，Csy核糖核酸酶识别位点(例如，Csy4核糖核酸酶识别位点)的长度为28个核苷酸。在一些实施方案中，编码核糖核酸酶识别位点的核苷酸序列包含SEQ ID NO：1(GTTCACTGCCGTATAGGCAGCTAAGAAA)。本文还考虑了Csy同源物(参见，例如Mojica，F.J.M.等，CRISPR-Cas Systems，RNA-mediated Adaptive Immunity in Bacteria and Archaea，Barrangou，Rodolphe，van der Oost，John(Eds.)，2013，ISBN 978-3-642-34657-6，其中与核糖核酸酶/识别位点有关的主题通过引用并入本文)。

本公开内容的一些方面涉及包含编码以核酶为侧翼的基因元件的序列的基因扰动盒。核酶是能够催化特定生化反应的RNA分子，类似于蛋白质酶的作用。顺式作用核酶通常是自形成的并且能够自切割。顺式作用核酶可介导基因元件(例如gRNA、shRNA或微RNA)由RNA pol II启动子的功能性表达。相比之下，反式作用核酶不进行自切割。自切割是指分子内催化的过程，其中包含核酶的RNA分子自身切割。根据本公开内容使用的顺式作用核酶的一些实例包括但不限于锤头型(hammerhead，HH)核酶和丁型肝炎病毒(Hepatitis deltavirus，HDV)核酶。根据本公开内容使用的反式作用核酶的一些实例包括但不限于见于烟草环斑病毒卫星RNA(satellite RNA of tobacco ringspot virus，sTRSV)、菊苣黄斑驳病毒卫星RNA(satellite RNA of chicory yellow mottle virus，sCYMV)和南芥菜花叶病毒卫星RNA(satellite RNA of arabis mosaic virus，sARMV)中的发夹型核酶的天然和人工形式。在一些实施方案中，核酶的活性是组成型的。

本公开内容的一些方面涉及包含编码重组酶的以下核酸的基因扰动盒，所述核酸包含3’RNA稳定化序列，例如形成三螺旋结构(或“三链体”)的RNA序列。在一些实施方案中，编码基因元件的核酸序列存在于重组酶的序列(例如重组酶的3’UTR)内。在这样的一些实施方案中，从转录物中切除基因元件可导致编码重组酶的mRNA缺少聚-(A)尾。在一些实施方案中，从转录物中切除基因元件降低编码重组酶的转录物的稳定性。3’RNA稳定化序列是被添加至编码产物的核酸序列3’末端以补充聚-(A)尾之缺失的序列。因此，3’RNA稳定化序列(例如形成三螺旋结构的那些)在一些实施方案中使得能够高效地翻译缺少聚-(A)尾的mRNA。三螺旋结构是例如由富含腺嘌呤和尿苷的基序形成的二级或三级RNA结构。在一些实施方案中，3’RNA稳定化序列来自核酸的3’非翻译区(untranslated region，UTR)。

在一些实施方案中，基因扰动盒包含自切割肽，例如2A肽(P2A)。通常来说，2A肽的长度为约18至22个氨基酸，并且其允许由单信使RNA(messenger RNA，mRNA)产生多种蛋白质。在一些实施方案中，2A肽是T2A肽(EGRGSLLTCGDVEENPGP(SEQ ID NO：2))、P2A(ATNFSLLKQAGDVEENPGP(SEQ ID NO：3))、E2A(QCTNYALLKLAGDVESNPGP(SEQ ID NO：4))或F2A(VKQTLNFDLLKLAGDVESNPGP(SEQ ID NO：5))。在一些实施方案中，编码重组酶的核苷酸序列可通过编码2A肽的核苷酸序列与编码基因元件的核苷酸序列分开。在一些实施方案中，编码断裂重组酶的第一部分的核苷酸序列可通过编码2A肽的核苷酸序列与编码断裂重组酶第二部分的核苷酸序列分开。每个基因扰动构建体还包含终止子序列。如本文中所用，“终止子”序列是指向RNA聚合酶发信号以停止转录DNA的核酸序列。终止子还可触发新转录的mRNA分子从转录机器(transcription machinery)释放和/或RNA聚合酶从DNA解离。应理解，合适的终止子的选择将取决于例如欲在其中使用遗传构建体的细胞或细胞类型。每个本文中所述的基因扰动盒在该盒的3’末端包含终止子序列，允许一次仅转录最接近启动子的基因扰动盒，并且一次产生一种可用于通过诱导物激活的重组酶。

在一些实施方案中，本公开内容的遗传构建体包含在基因扰动盒上游的启动子。启动子序列可与相邻的基因扰动盒可操作地连接。“启动子”是核酸的一个控制区，核酸的其余部分的转录的启动和速率在此被控制。启动子还可包含可结合调节蛋白和调节分子(例如RNA聚合酶和其他转录因子)的子区域。当启动子和/或任何另外的调节序列以例如将编码序列的表达或转录置于调节序列的影响或控制之下的方式共价连接时，认为其与另一核酸序列(例如基因扰动盒)“可操作地”连接。如果期望编码序列被翻译成功能性蛋白质，则如果诱导在5’调节序列中的启动子导致编码序列的转录和如果两个DNA序列之间连接的性质不会：(1)导致引入移码突变、(2)干扰启动子区指导编码序列转录的能力、或(3)干扰相应RNA转录物被翻译成蛋白质的能力，则认为这两个DNA序列可操作地连接。因此，如果启动子区能够实现DNA序列的转录使得所得转录物可被翻译成期望的蛋白质或多肽，则该启动子区与编码序列可操作地连接。

启动子可以是组成型的、诱导型的、激活型的、阻遏型的、组织特异性的、细胞特异性的、细胞状态特异性的、或其任意组合。在一些实施方案中，启动子是组成型活性启动子，例如来自酵母磷酸甘油酸激酶(phosphoglycerate kinase，pPGK)的启动子。在一些实施方案中，启动子是组织特异性启动子，意指启动子在特定类型的组织中具有活性。在一些实施方案中，启动子是细胞特异性启动子。使用组织特异性或细胞特异性启动子允许将遗传构建体的活性局限于限定的细胞组群中。如本文中所用，“细胞特异性启动子”是在特定类型的细胞中具有活性导致相邻基因扰动盒转录的启动子序列。细胞特异性启动子的一些实例包括但不限于在巨噬细胞、淋巴细胞、中性粒细胞、树突细胞、内皮细胞、上皮细胞、肌细胞、神经元细胞、给定组织的细胞(例如，肾细胞)中具有活性的启动子。作为替代或补充，启动子可以是细胞状态特异性启动子，其当细胞处于特定状态(例如发育状态、激活状态或疾病状态)时具有活性。启动子的一些实例包括但不限于细胞发育阶段特异性启动子、细胞状态特异性启动子、NFκB特异性启动子和工程细胞特异性启动子。

在一些实施方案中，本文中还考虑了RNA pol II和RNA pol III启动子。通过RNA聚合酶II指导转录的准确启动的启动子被称为RNA pol II启动子。根据本公开内容使用的RNApol II启动子的一些实例包括但不限于人巨细胞病毒启动子、人泛素启动子、人组蛋白H2A1启动子和人炎性趋化因子CXCL1启动子。本文中还考虑了其他RNA pol II启动子。通过RNA聚合酶III指导转录的准确启动的启动子被称为RNApol III启动子。根据本公开内容使用的RNA pol III启动子的一些实例包括但不限于U6启动子、H1启动子以及转移RNA、5S核糖体RNA(ribosomal RNA，rRNA)和信号识别颗粒7SL RNA的启动子。

本领域中已知的任何启动子都可用于本文中所述的遗传构建体，并且包括天然存在的启动子序列和合成或经遗传修饰的启动子序列。在一些实施方案中，启动子是人工启动子。

在一些实施方案中，遗传构建体可靶向并且插入DNA基因座(被称为宿主细胞的“着陆垫(1anding pad)”)中。在一些实施方案中，着陆垫在宿主细胞的基因组中。在一些实施方案中，着陆垫位于宿主细胞中的基因组外DNA基因座中，例如位于质粒或载体上。在一些实施方案中，遗传构建体存在于转导到宿主细胞中的载体上。通常来说，着陆垫是被认为是基因组(或基因组外DNA)的中性位点的核酸区域或在该核酸区域中，意指预期插入遗传构建体在所测试条件下不会对宿主细胞产生影响(负面或正面的)。用于插入本文中所述的遗传构建体的着陆垫或基因座的一些实例包括但不限于H11、AAVS1、CCR5和ROSA26基因座。在一些实施方案中，着陆垫在人或哺乳动物人工染色体上。

本文中还提供了包含本文中所述的任何遗传构建体的重组细胞。细胞的一些实例包括但不限于细菌细胞、藻类细胞、植物细胞、昆虫细胞、真菌细胞、酵母细胞、非人哺乳动物细胞和人细胞。在一些实施方案中，细胞是细菌细胞。

在一些实施方案中，细胞是真核细胞，例如哺乳动物细胞。例如，在一些实施方案中，基因扰动盒在人细胞、灵长类细胞(例如，Vero细胞)、大鼠细胞(例如，GH3细胞、OC23细胞)或小鼠细胞(例如，MC3T3细胞)中表达。存在多种人细胞系，包括但不限于HEK细胞、HeLa细胞、来自国家癌症研究所的60种癌细胞系(NCI60)的癌细胞、DU145(前列腺癌)细胞、Lncap(前列腺癌)细胞、MCF-7(乳腺癌)细胞、MDA-MB-438(乳腺癌)细胞、PC3(前列腺癌)细胞、T47D(乳腺癌)细胞、THP-1(急性髓细胞白血病)细胞、U87(胶质母细胞瘤)细胞、SHSY5Y人神经母细胞瘤细胞(克隆白骨髓瘤)和Saos-2(骨癌)细胞。在一些实施方案中，经改造构建体在人胚肾(human embryonic kidney，HEK)细胞(例如，HEK293或HEK 293T细胞)中表达。在一些实施方案中，基因扰动盒在干细胞(例如，人干细胞)例如多能干细胞(例如，胚胎干细胞或诱导多能干细胞(induced pluripotent stem cell，iPSC))中表达。

在另一些实施方案中，细胞是真菌细胞，例如酵母细胞，例如酵母属(Saccharomyces spp.)、裂殖酵母属(Schizosaccharomyces spp.)、毕赤酵母属(Pichiaspp.)、法夫酵母属(Phaffia spp.)、克鲁维酵母属(Kluyveromyces spp.)、假丝酵母属(Candida spp.)、踝节菌属(Talaromyces spp.)、酒香酵母属(Brettanomyces spp.)、管囊酵母属(Pachysolen spp.)、德巴利酵母属(Debaryomyces spp.)、耶氏酵母属(Yarrowiaspp.)和工业多倍体酵母菌株。优选地，酵母菌株是酿酒酵母(S.cerevisiae)菌株。真菌的另一些实例包括曲霉属(Aspergillus spp.)、青霉属(Penicillium spp.)、镰孢属(Fusarium spp.)、根霉属(Rhizopus spp.)、支顶孢属(Acremonium spp.)、链孢霉属(Neurospora spp.)、粪壳菌属(Sordaria spp.)、稻瘟菌属(Magnaporthe spp.)、异水霉属(Allomyces spp.)、黑粉菌属(Ustilago spp.)、葡萄孢属(Botrytis spp.)和木霉属(Trichoderma spp.)。

在一些实施方案中，细胞是细菌细胞，例如埃希氏菌属(Escherichia spp.)、链霉菌属(Streptomyces spp.)、发酵单孢菌属(Zymonas spp.)、醋杆菌属(Acetobacterspp.)、柠檬酸杆菌属(Citrobacter spp.)、集胞藻属(Synechocystis spp.)、根瘤菌属(Rhizobium spp.)、梭菌属(Clostridium spp.)、棒状杆菌属(Corynebacterium spp.)、链球菌属(Streptococcus spp.)、黄单胞菌属(Xanthomonas spp.)、乳杆菌属(Lactobacillus spp.)、乳球菌属(Lactococcus spp.)、芽孢杆菌属(Bacillus spp.)、产碱菌属(Alcaligenes spp.)、假单胞菌属(Pseudomonas spp.)、气单胞菌属(Aeromonasspp.)、固氮菌属(Azotobacter spp.)、丛毛单胞菌属(Comamonas spp.)、分枝杆菌属(Mycobacterium spp.)、红球菌属(Rhodococcus spp.)、葡糖杆菌属(Gluconobacterspp.)、罗尔斯通氏菌属(Ralstonia spp.)、酸硫杆状菌属(Acidithiobacillus spp.)、小月菌属(Microlunatus spp.)、地杆菌属(Geobacter spp.)、地芽孢杆菌属(Geobacillusspp.)、节杆菌属(Arthrobacter spp.)、黄杆菌属(Flavobacterium spp.)、沙雷氏菌属(Serratia spp.)、糖多孢菌属(Saccharopolyspora spp.)、栖热菌属(Thermus spp.)、寡养单胞菌属(Stenotrophomonas spp.)、色杆菌属(Chromobacterium spp.)、中华根瘤菌属(Sinorhizobium spp.)、糖多孢菌属、农杆菌属(Agrobacterium spp.)和泛菌属(Pantoeaspp.)。细菌细胞可以是革兰氏阴性细胞，例如大肠杆菌(Escherichia coli(E.coli))细胞，或革兰氏阳性细胞，例如芽孢杆菌属物种。

包含含有本文中所述遗传构建体的细胞的转基因生物也在本发明的范围内。本领域中已知的常规方法可用于产生包含含有本文中所述遗传构建体的细胞的转基因生物。在一些实施方案中，细胞是在多细胞生物，例如植物或哺乳动物中。在一些实施方案中，转基因生物是转基因非人哺乳动物。在一些实施方案中，哺乳动物是啮齿动物，例如小鼠或大鼠。

在一些实施方案中，在其中表达遗传构建体的细胞可表达一个或更多个另外的组件，例如一个或更多个CRISPR组件，例如内切核酸酶。在一些实施方案中，重组细胞天然地编码Cas9酶。在一些实施方案中，重组细胞被改造以编码Cas9酶或其变体。在一些实施方案中，宿主细胞也表达内切核酸酶，例如Cas9内切核酸酶。在一些实施方案中，宿主细胞表达来源于化脓性链球菌、金黄色葡萄球菌、脑膜炎奈瑟菌、嗜热链球菌或齿垢密螺旋体的Cas9内切核酸酶。在一些实施方案中，编码Cas9内切核酸酶的核苷酸序列可以是经密码子优化的以在宿主细胞或生物体中表达。在一些实施方案中，内切核酸酶是Cas9同源物或直向同源物。

在一些实施方案中，还对编码Cas9内切核酸酶的核苷酸序列进行修饰以改变蛋白质的活性。在一些实施方案中，Cas9内切核酸酶是无催化活性的Cas9。例如，dCas9包含催化活性残基(D10和H840)的突变，并且不具有核酸酶活性。作为替代或补充，Cas9内切核酸酶可与其他蛋白质或其一部分融合。在一些实施方案中，dCas9与阻遏物结构域(例如KRAB结构域)融合。在一些实施方案中，这样的dCas9融合蛋白与本文中所述的构建体一起用于多重基因抑制(例如，CRISPR干扰(CRISPRi))。在一些实施方案中，dCas9与激活物结构域(例如VP64或VPR)融合。包含与转录因子或结构域融合的dCas9的CRISPR蛋白由此通常被称为CRISPR-TF或CRISPR-转录因子。变体CRISPR-TF也是本领域中已知的，并且与包含例如dCas9-VP64的CRISPR-TF相比可赋予基因更强的转录激活。参见，例如Chavez等Nat.Methods 5(2015)12：326-328；Farzadfard等，ACS Synth.Biol.(2015)517：583-588；Tanenbaum Cell(2014)159：635-646。

在一些实施方案中，这样的dCas9融合蛋白与本文中所述的构建体一起用于多重基因激活(例如，CRISPR激活(CRISPRa))。参见，例如Gilbert等Cell(2014)159(3)：647-661。在一些实施方案中，dCas9与表观遗传调节结构域(例如组蛋白脱甲基酶结构域或组蛋白乙酰转移酶结构域)融合。在一些实施方案中，dCas9与LSD1或p300或者其一部分融合。在一些实施方案中，dCas9融合用于基于CRISPR的表观遗传调节。在一些实施方案中，dCas9或Cas9与Fokl核酸酶结构域融合。在一些实施方案中，与Fok1核酸酶结构域融合的Cas9或dCas9用于多重基因编辑。在一些实施方案中，Cas9或dCas9与荧光蛋白(例如，GFP、RFP、BFP、mCherry等)融合。在一些实施方案中，与荧光蛋白融合的Cas9/dCas9蛋白用于基因组基因座的多重标记和/或可视化。

作为替代或补充，内切核酸酶是Cpfl核酸酶。在一些实施方案中，宿主细胞表达来源于普氏菌属(Provetella spp.)或弗朗西斯菌属(Francisella spp.)的Cpfl核酸酶。在一些实施方案中，编码Cpfl核酸酶的核苷酸序列可以是经密码子优化的以在宿主细胞或生物体中表达。

在一些实施方案中，本公开内容的细胞是经修饰的并且可被称为重组细胞。经修饰的细胞或重组细胞是含有外源核酸或天然不存在的核酸的细胞。在一些实施方案中，重组细胞含有独立复制的外源核酸(例如，存在于附加体型载体上的遗传构建体)。在一些实施方案中，通过将外来或外源核酸引入到细胞中来产生重组细胞。可通过常规的方法将核酸引入到细胞中，例如如电穿孔、化学转染、病毒转导、噬菌体转导、与含有重组质粒的细菌原生质体融合、或显微注射。在一些实施方案中，遗传构建体在质粒或载体上引入到细胞中。在一些实施方案中，遗传构建体通过病毒(例如慢病毒或腺病毒)引入到细胞中。表达核酸分子也可通过将核酸分子整合到基因组中来实现。

在一些实施方案中，在重组表达载体上提供本文中所述的遗传构建体。如本文中所用，“载体”可以是可在其中插入期望的序列的许多核酸中的任一种，例如通过限制性酶切消化和连接或通过重组插入以在不同遗传环境之间转运或在宿主细胞中表达。载体通常由DNA构成，但是RNA载体也是可用的。载体包括但不限于：质粒、F黏粒(fosmid)、噬菌粒、病毒基因组和人工染色体。在一些实施方案中，载体是慢病毒载体。在一些实施方案中，在同一重组表达载体上表达编码两个或三个微RNA之组合的基因中的每一个。在一些实施方案中，在载体上提供编码内切核酸酶(例如CRISPR内切核酸酶(例如，Cas9酶))的基因。在一些实施方案中，编码内切核酸酶(例如CRISPR内切核酸酶)的基因与本文中所述的遗传构建体在同一载体上提供。在一些实施方案中，在与包含本文中所述遗传构建体的载体不同的载体上提供编码内切核酸酶(例如CRISPR内切核酸酶)的基因。

载体还可包含一个或更多个适用于鉴定已经或尚未被载体转化或转染的细胞的标记序列。标记包括例如，编码提高或降低对抗生素或其他化合物的抗性或敏感性的蛋白质的基因、编码其活性可通过本领域中已知的标准测定检测的酶(例如，半乳糖苷酶、荧光、萤光素酶或碱性磷酸酶)的基因、以及明显地影响经转化或转染的细胞、宿主、菌落或噬斑的表型的基因(例如，绿色荧光蛋白、红色荧光蛋白)。优选的载体是能够自主复制和表达存在于与所述载体可操作地连接的DNA区段中的结构基因产物的那些。

用于评估细胞中基因表达的方法也在本公开内容的范围内，该方法涉及向细胞提供本文中所述的遗传构建体并在其中第一基因扰动盒(最接近启动子的基因扰动盒)被表达的条件下孵育细胞。在一些实施方案中，该条件允许基因元件也被表达。在其中编码基因元件的核酸在编码重组酶的核酸序列内的一些实施方案中，将细胞在其中基因元件从重组酶转录物中切除或切割的条件下孵育。例如，可使用常规的细胞培养方法培养(例如，维持在细胞培养物中)包含本公开内容的遗传构建体的细胞。例如，可在细胞培养箱中在合适的温度和气体混合物(例如，对于哺乳动物细胞，37℃、5％CO₂)下培养并维持细胞。在一些实施方案中，可在特定的条件下孵育细胞以诱导期望的细胞状态，例如发育状态、激活或疾病状态。对每种细胞类型而言，培养条件可不同。例如，细胞生长培养基可在pH、葡萄糖浓度、生长因子和其他营养物的存在方面变化。用于补充培养基的生长因子通常来源于动物血液的血清，例如胎牛血清(fetal bovine serum，FBS)、小牛血清、马血清和/或猪血清。在一些实施方案中，如本文中提供使用的培养基可以是市售的和/或已充分描述的(参见例如Birch J.R.，R.G.Spier(Ed.)Encyclopedia of Cell Technology，Wiley.411-424，2000；Keen M.J.Cytotechnology 17：125-132，1995；Zang，等Bio/Technology.13：389-392，1995)。在一些实施方案中，使用化学限定的培养基。

可通过评估每个基因扰动盒的基因元件的输出来评价每个基因扰动盒的时间和依次诱导。在一些实施方案中，基因元件的输出包括评估基因元件的表达或活性。评估基因元件的表达的方法对本领域技术人员而言将是明显的，并且包括例如qRT-PCR、微阵列分析、Northern印迹和RNA-Seq。在一些实施方案中，基因元件是基因，并且通过量化基因产物的量来评价该基因的表达。作为替代或补充，可评估基因元件的活性，例如，通过测量由基因元件的活性产生的产物的量，和/或测量基因元件的靶标(例如靶基因)的表达。

本发明的应用不限于在说明书中阐述的或在附图中举例说明的组件的构造和布置的细节。本发明能够具有其他实施方案并且能够以多种方式实施或进行。此外，本文中所用的措辞和术语是为了描述的目的，并且不应被视为限制。本文中“包括”、“包含”或“具有”、“含有”、“涉及”及其变化形式的使用意在涵盖其后列出的项目及其等同物以及另外的项目。

通过以下实施例进一步举例说明本发明，这些实施例决不应被解释为进一步限制。在本申请通篇引用的所有参考文献(包括著作文献、授权专利、公开的专利申请和共同未决的专利申请)的全部内容在此通过引用明确地并入，特别是对于本文中引用的教导。

实施例

实施例1

当存在于宿主细胞中时，遗传构建体的第一基因扰动盒在位于该构建体的第一基因扰动盒上游的启动子的控制之下表达(图1A)。基因扰动盒的表达允许产生无活性的重组酶(无活性的Recl)和使用CRISPR-Cas转录因子对下游靶标发挥作用的gRNA基因元件。无活性的Rec1由诱导物1激活，导致第一基因扰动盒使用同源重组酶位点(R1)自切除。与重组酶识别位点对(R1)的重组允许去除第一基因扰动盒并且产生单个R1位点。在除去第一基因扰动盒之后，第二基因扰动盒最接近启动子，允许该盒的表达以及无活性重组酶2(Rec2)和gRNA2的产生(图1B)。gRNA2使用CRISPR-Cas转录因子调节下游靶标。诱导物2激活Rec2活性，其使用相应的重组酶识别位点(R2)自切除第二基因扰动盒，导致第三基因扰动盒变成最接近启动子的基因扰动盒。然后，第三基因扰动盒被表达，产生无活性的重组酶3(Rec3)和gRNA3(图1C)。gRNA3使用CRISPR-Cas转录因子调节下游靶标。诱导物1激活Rec3活性，其使用相应的重组酶识别位点(R3)自切除第三GPC。

评估gRNA的下游靶标的扰动(激活或抑制的程度)以确定基因表达的时机(timing)和顺序。

实施例2

根据图2中示出的一般示意图产生基因扰动盒。该盒包含表达为各自与结合结构域的一部分融合的N端部分(Split-N)和C端部分(Split-C)的断裂重组酶，所述结合结构域与诱导物(例如，赤霉素(GIB)或脱落酸(ABA))特异性结合。具体地，编码断裂Cre重组酶的基因扰动盒包含为全长Cre重组酶的75％的N端部分和为全长Cre重组酶的25％的C端部分。编码断裂FlpO重组酶的基因扰动盒包含为FlpO重组酶的95％的N端部分和是全长FlpO重组酶的5％的C端部分。

通常来说，在不存在诱导物的情况下，断裂重组酶的各部分和mCherry被表达。然而，在存在诱导物的情况下，断裂重组酶的各部分二聚化以重构并且激活重组酶。编码mCherry的基因扰动盒的切除允许表达编码蓝色荧光蛋白(BFP)的基因。

三个示例性基因扰动盒如下产生：FlpO表达为与与ABA相互作用的结合结构域融合的断裂重组酶；Cre表达为与与GIB相互作用的结合蛋白融合的断裂重组酶；并且FlpO表达为与与GIB相互作用的结合结构域融合的断裂重组酶。将293T细胞用示例性基因扰动盒瞬时转染并用载剂(乙醇)或诱导物(例如，重组酶二聚化药物：GIB或ABA)处理。通过流式细胞术分析在处理之后96小时评估mCherry和BFP的表达(图3A)。数据还表示为以BFP细胞/总细胞(BFP阳性或mCherry阳性)百分比计算的基因扰动盒切除(导致BFP表达)的频率(图3B)。

如图3A和3B中所示，用合适的诱导物处理细胞导致基因扰动盒的切除提高，导致下游基因BFP的表达。

实施例3

基因扰动盒的可扩展重组酶级联可用于建立其中癌症的因果突变依次累积的肿瘤发生模型。例如，结直肠癌的四步肿瘤发生由腺瘤性息肉病蛋白(AdenomatousPolyposis Coli，APC)、p53、KRAS和Smad4的突变限定，如图4A中所示。这可使用基因扰动盒进行建模，每个基因扰动盒编码可驱动致瘤性突变(例如APC、Smad4或p53突变)的gRNA，或表达突变癌基因，例如KRAS突变体。

如图4B中所示，第一基因扰动盒的表达导致诱导APC突变的一个或更多个gRNA的表达。与第一诱导物接触导致第一基因扰动盒的切除，允许第二基因扰动盒的表达。与第二诱导物接触导致第二基因扰动盒的切除，允许活性KRAS突变体和包含诱导Smad4突变的一个或更多个gRNA的第三基因扰动盒的表达。与第三诱导物接触导致第三扰动盒的切除，允许包含诱导p53突变的一个或更多个gRNA的第四基因扰动盒的表达。癌症的发生(例如，一种或更多种癌症标志物)可在与一种或更多种诱导物接触之前、期间和/或之后使用本领域中已知的方法进行评估。

实施例4

基因扰动盒的可扩展重组酶级联可用于建立高效的定向细胞分化。依次基因扰动可模拟具有治疗价值的特定细胞类型的自然发育过程。如图5A中所示，细胞分化涉及许多转录因子的协调表达，在该图中示出了所述转录因子的子集(来自Pagliuca和Melton，Development(2013)140(12)：2472-83)。

使用编码以下gRNA的基因扰动盒可实现将祖细胞定向分化成产生胰岛素的胰腺β细胞，所述gRNA激活关键转录因子的表达，使得能够将细胞分化成定形内胚层、胰腺内胚层、内分泌祖细胞、以及随后的胰腺β细胞(图5B)。如图5B中所示，第一基因扰动盒的表达导致一个或更多个gRNA的表达，其激活参与将细胞分化成定形内胚层的一种或更多种转录因子的表达。与第一诱导物接触导致第一基因扰动盒的切除，允许包含一个或更多个gRNA的第二基因扰动盒的表达，所述gRNA激活参与将细胞分化成胰腺内胚层的一种或更多种转录因子的表达。与第二诱导物接触导致第二基因扰动盒的切除，允许包含一个或更多个gRNA的第三基因扰动盒的表达，所述gRNA激活参与将细胞分化成内分泌祖细胞的一种或更多种转录因子的表达。与第三诱导物接触导致第三扰动盒的切除，允许包含一个或更多个gRNA的第四基因扰动盒的表达，所述gRNA激活参与将细胞分化为胰腺β细胞的一种或更多种转录因子的表达。细胞分化或细胞状态(例如，一种或更多种细胞标志物)可在与一种或更多种诱导物接触之前、期间和/或之后使用本领域中已知的方法进行评估。

虽然已经如此描述了本发明的至少一个实施方案的数个方面，应理解，本领域技术人员将容易想到多种变化、修改和改进。这样的变化、修改和改进旨在成为本公开内容的一部分，并且旨在落入本发明的精神和范围内。因此，前面的描述和附图仅是示例性的。

等同方案

虽然本文中已描述并说明了本发明的数个实施方案，但是本领域普通技术人员将容易预见用于执行本文中所述的功能和/或获得本文中所述的结果和/或一个或更多个优点的多种其他手段和/或结构，并且每个这样的变化和/或修改被视为在本文中所述的本发明实施方案的范围之内。此外，如果这样的特征、系统、制品、材料、套件和/或方法不相互不一致，则两个或更多个这样的特征、系统、制品、材料、套件和/或方法的任意组合也包括在本公开内容的发明范围内。

本文公开的所有参考文献、专利和专利申请根据其各自被引用的主题通过引用并入，所述主题在一些情况下可涵盖整个文件。

除非明确指出相反，否则如本文中在说明书和权利要求书中使用的没有数量词修饰的名词应理解为意指“至少一个/种”。

如本文中在说明书和权利要求书中使用的短语“和/或”应被理解为是指如此连接的要素(即，在一些情况下联合存在而另一些情况下分开存在的要素)中的“任一或二者”。用“和/或”列出的多个要素应以相同的方式解释，即如此连接的要素中的“一个或更多个”。除通过由“和/或”子句所具体确定的要素之外，其他要素也可任选地存在，无论是否与具体确定的那些要素相关。因此，作为一个非限制性实例，当与开放式语言(例如“包含/包括”)联合使用时对“A和/或B”的提及在一个实施方案中可以指仅A(任选地包括除B之外的要素)；在另一个实施方案中，可以指仅B(任选地包括除A之外的要素)；在另一个实施方案中，可以指A和B二者(任选地包括其他要素)；等。

如本文中在说明书和权利要求书中使用的“或/或者”应被理解为与如上所定义“和/或”具有相同的含义。例如，当分离列表中的项目时，“或/或者”或“和/或”应被解释为包括性的，即包括多个要素或要素列表中的至少一个，但是也包括多于一个，并且任选地包括另外的未列出项目。只有明确指出相反的术语(例如“仅之一”或“正好之一”，或者，在权利要求书中使用时，“由......组成”)才将指包括多个要素或要素列表中的恰好一个要素。一般而言，当之前有排他性的术语(例如“任一”、“之一”、“仅之一”或“恰好之一”)时，本文中所使用的术语“或/或者”应仅解释为表示排他性的替代选择(即，“一个或另一个但不是二者”)。当在权利要求书中使用时，“基本上由……组成”应具有其在专利法领域中所使用的通常含义。

如本文中在说明书和权利要求书中使用的，关于一个或更多个要素的列表的短语“至少一个”应理解为意指选自要素列表中任意一个或更多个要素中的至少一个要素，但是不一定包括要素列表内具体列出的各个要素和每个要素中的至少一个，并且不排除要素列表中要素的任意组合。该定义还允许可除短语“至少一个”所指在要素列表内明确指出的要素之外任选地存在其他要素，不论与那些明确指出的要素是否相关。因此，作为一个非限制性实例，“A和B中的至少一个”(或等同地，“A或B中的至少一个”，或等同地，“A和/或B中的至少一个”)在一个实施方案中可以指，至少一个A，任选地包括多于一个A，而不存在B(且任选地包括除B之外的要素)；在另一个实施方案中，可以指至少一个B，任选地包括多于一个B，而不存在A(且任选地包括除A之外的要素)；在另一个实施方案中，可以指至少一个A，任选地包括多于一个A，以及至少一个B，任选地包括多于一个B(且任选地包括其他要素)；等。

还应理解，除非明确地指出相反，否则在包括多于一个步骤或动作的本文中所要求保护的任何方法中，该方法的步骤或动作的顺序不必限于该方法的步骤或动作被记载的顺序。本文中公开的所有参考文献、专利和专利申请根据其各自被引用的主题通过引用并入，所述主题在一些情况下可涵盖整个文件。

在权利要求书以及在上述说明书中，所有的连接词(例如“包含”、“包括”、“携带”、“具有”、“含有”、“涉及”、“容置”、“由…构成”等)应理解为是开放式的，即意指包括但不限于。仅连接词“由......组成”和“基本上由…组成”应分别是封闭式或半封闭式连接词，如美国专利局专利审查程序手册2111.03部分中所述。

序列表

<110> 麻省理工学院

<120> 可扩展的重组酶级联

<130> M0656.70381WO00

<140> 尚未转让

<141> 与此同时

<150> US 62/327,479

<151> 2016-04-26

<160> 5

<170> PatentIn version 3.5

<210> 1

<211> 28

<212> DNA

<213> 人工序列

<220>

<223> 合成的多核苷酸

<400> 1

gttcactgcc gtataggcag ctaagaaa 28

<210> 2

<211> 18

<212> PRT

<213> 人工序列

<220>

<223> 合成的多肽

<400> 2

Glu Gly Arg Gly Ser Leu Leu Thr Cys Gly Asp Val Glu Glu Asn Pro

1 5 10 15

Gly Pro

<210> 3

<211> 19

<212> PRT

<213> 人工序列

<220>

<223> 合成的多肽

<400> 3

Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn

1 5 10 15

Pro Gly Pro

<210> 4

<211> 20

<212> PRT

<213> 人工序列

<220>

<223> 合成的多肽

<400> 4

Gln Cys Thr Asn Tyr Ala Leu Leu Lys Leu Ala Gly Asp Val Glu Ser

1 5 10 15

Asn Pro Gly Pro

20

<210> 5

<211> 22

<212> PRT

<213> 人工序列

<220>

<223> 合成的多肽

<400> 5

Val Lys Gln Thr Leu Asn Phe Asp Leu Leu Lys Leu Ala Gly Asp Val

1 5 10 15

Glu Ser Asn Pro Gly Pro

20

Claims

1.遗传构建体，其包含：

多个基因扰动盒，

其中所述多个基因扰动盒包含：

(a)第一类型的基因扰动盒，其包含编码以下的第一核酸：

重组酶活性由第一诱导物诱导的第一诱导型重组酶，

第一基因元件，

第一终止子，以及

在所述重组酶、所述第一基因元件和所述第一终止子侧翼的第一对重组酶识别位点，其中所述第一重组酶能够在该第一对重组识别位点的每个重组酶识别位点与所述第一核酸结合并对其进行切割；以及

(b)第二类型的基因扰动盒，其包含编码以下的第二核酸：

重组酶活性由第二诱导物诱导的第二诱导型重组酶，

第二基因元件，

第二终止子，以及

在所述第二重组酶、所述第二基因元件和所述第二终止子侧翼的第二对重组酶识别位点，其中所述第二重组酶能够在该第二对重组识别位点的每个重组酶识别位点与所述第二核酸结合并对其进行切割。

2.权利要求1所述的遗传构建体，其还包含位于所述第一类型的基因扰动盒上游的启动子。

3.权利要求1或2所述的遗传构建体，其中编码所述第一基因元件的核酸位于编码所述第一诱导型重组酶的核酸的3’非翻译区内，和/或编码所述第二基因元件的核酸位于编码所述第二诱导型重组酶的核酸的3’非翻译区内。

4.权利要求1或2所述的遗传构建体，其中编码所述第一基因元件的核酸位于编码所述第一诱导型重组酶的核酸的内含子内，和/或编码所述第二基因元件的核酸位于编码所述第二诱导型重组酶的核酸的内含子内。

5.权利要求1至4中任一项所述的遗传构建体，其中所述基因元件是编码蛋白质的核酸、gRNA、miRNA或shRNA。

6.权利要求1至5中任一项所述的遗传构建体，其中所述第一诱导型重组酶和/或所述第二诱导型重组酶是酪氨酸重组酶。

7.权利要求1至5中任一项所述的遗传构建体，其中所述第一诱导型重组酶和/或所述第二诱导型重组酶是丝氨酸重组酶。

8.权利要求1至5中任一项所述的遗传构建体，其中所述第一诱导型重组酶和/或所述第二诱导型重组酶是断裂重组酶。

9.权利要求8所述的遗传构建体，其中所述断裂重组酶包含所述断裂重组酶的第一部分和第二部分。

10.权利要求1至9中任一项所述的遗传构建体，其中所述多个基因扰动盒中的一个或更多个基因扰动盒包含一个或更多个核酶序列。

11.权利要求1至10中任一项所述的遗传构建体，其中所述多个基因扰动盒中的一个或更多个基因扰动盒包含一个或更多个核糖核酸酶识别序列。

12.权利要求11所述的遗传构建体，其中所述一个或更多个核糖核酸酶识别序列是Cas6/Csy4识别序列。

13.权利要求1至12中任一项所述的遗传构建体，其中所述多个基因扰动盒中的一个或更多个基因扰动盒包含一个或更多个自切割肽序列。

14.权利要求13所述的遗传构建体，其中所述一个或更多个自切割肽序列是P2A序列。

15.权利要求1至14中任一项所述的遗传构建体，其中所述多个基因扰动盒包含与一个或更多个所述第二类型的基因扰动盒交替的一个或更多个所述第一类型的基因扰动盒。

16.权利要求1至15中任一项所述的遗传构建体，其中所述多个基因扰动盒还包含(c)第三类型的基因扰动盒，其包含编码以下的第三核酸：

重组酶活性由第三诱导物诱导的第三诱导型重组酶，

第三基因元件，

第三终止子，以及

在所述重组酶、所述第三基因元件和所述第三终止子侧翼的第三对重组酶识别位点，其中所述第三重组酶能够在该第三对重组识别位点的每个重组酶识别位点与所述第三核酸结合并对其进行切割。

17.权利要求2至16中任一项所述的遗传构建体，其中所述启动子是细胞特异性启动子或细胞状态特异性启动子。

18.权利要求1至17中任一项所述的遗传构建体，其中所述第一和/或第二诱导物是小分子诱导物。

19.权利要求18所述的遗传构建体，其中所述小分子诱导物是激素。

20.权利要求19所述的遗传构建体，其中所述激素是赤霉素(GIB)或脱落酸(ABA)。

21.权利要求18所述的遗传构建体，其中所述小分子诱导物是抗生素。

22.权利要求21所述的遗传构建体，其中所述抗生素是甲氧苄啶。

23.权利要求19所述的遗传构建体，其中所述小分子诱导物是合成配体。

24.权利要求23所述的遗传构建体，其中所述合成配体是Shield-1或4-羟基他莫昔芬。

25.载体，其包含权利要求1至24中任一项所述的遗传构建体。

26.重组细胞，其包含权利要求1至24中任一项所述的遗传构建体或权利要求25所述的载体。

27.权利要求26所述的重组细胞，其还包含Cas6/Csy4核糖核酸酶。

28.权利要求26或27所述的重组细胞，其还包含Cas9内切核酸酶。

29.权利要求26至28中任一项所述的重组细胞，其中所述细胞是细菌细胞、真菌细胞、酵母细胞、昆虫细胞、植物细胞、动物细胞或人细胞。

30.权利要求29所述的重组细胞，其中所述细胞是干细胞。

31.权利要求30所述的重组细胞，其中所述干细胞是胚胎干细胞或诱导多能干细胞(iPS)。

32.转基因生物，其包含权利要求26至31中任一项所述的重组细胞。

33.用于评估细胞中基因表达的方法，其包括：

(i)向细胞提供包含多个基因扰动盒的遗传构建体，

其中所述多个基因扰动盒包含：

(a)第一类型的基因扰动盒，其包含编码以下的核酸：

重组酶活性由第一诱导物诱导的第一诱导型重组酶，

基因元件，

终止子，以及

在所述第一重组酶、所述第一基因元件和所述第一终止子侧翼的第一对重组酶识别位点，其中所述第一重组酶能够在该第一对重组识别位点的每个重组酶识别位点与所述核酸结合并对其进行切割；以及

(b)第二类型的基因扰动盒，其包含编码以下的核酸：

重组酶活性由第二诱导物诱导的第二诱导型重组酶，

第二基因元件，

第二终止子，以及

在所述第二重组酶、所述第二基因元件和所述第二终止子侧翼的第二对重组酶识别位点，其中所述第二重组酶能够在该第二对重组识别位点的每个重组酶识别位点与所述核酸结合并对其进行切割；

(ii)在其中第一基因扰动盒被表达并且所述基因元件从所述核酸上切割的条件下孵育(i)所述的细胞；以及

(iii)评估所述基因元件的一个或更多个靶标的输出。

34.权利要求33所述的方法，其中所述多个基因扰动盒还包含：

(c)第三类型的基因扰动盒，其包含编码以下的核酸：

重组酶活性由第一诱导物诱导的第三诱导型重组酶，

第三基因元件，

第三终止子，以及

在所述第三重组酶、所述第三基因元件和所述第三终止子侧翼的第三对重组酶识别位点，其中所述第三重组酶能够在该第三对重组识别位点的每个重组酶识别位点与所述核酸结合并对其进行切割。

35.权利要求33或34所述的方法，其中所述第一、第二和/或第三基因元件的一个或更多个靶标的所述输出包括评估所述一个或更多个靶标的表达。