CN108290933A

CN108290933A - 降低脱靶效应的crispr酶突变

Info

Publication number: CN108290933A
Application number: CN201680035804.2A
Authority: CN
Inventors: 张锋; 高林译; B·蔡澈; I·斯雷梅克
Original assignee: Massachusetts Institute of Technology; Broad Institute Inc
Current assignee: Massachusetts Institute of Technology; Broad Institute Inc
Priority date: 2015-06-18
Filing date: 2016-06-17
Publication date: 2018-07-17
Also published as: KR20230132877A; EP3929287A3; MX2017016289A; JP7107683B2; SG10201912329YA; WO2016205613A1; KR102575342B1; JP2019022512A; IL293323B1; US12123032B2; EP3929287A2; EP3129393A1; RU2018101710A; IL284808A; US20190010471A1; IL293323A; IL256368B; CN109536474A; US10494621B2; JP2018522546A

Abstract

在此披露并且要求保护CRISPR酶、例如Cas酶比如Cas9的一个或多个突变或一种或多种修饰，这些突变或修饰就含有或包括这样的经突变或修饰的Cas或CRISPR酶或Cas9的CRISPR‑Cas或CRISPR酶或者CRISPR‑Cas9系统或复合物的脱靶效应而言获得改进，例如降低脱靶效应。还披露并且要求保护用于制备和使用这样的含有这些突变或修饰的经突变或修饰的Cas或CRISPR酶或Cas9和系统或复合物的方法和这样的含有这些突变或修饰的经突变或修饰的Cas或CRISPR酶或Cas9和系统或复合物的用途以及来自这样的方法和用途的产物。

Description

降低脱靶效应的CRISPR酶突变

交叉引用/通过引用并入

参考提交于2015年6月18日的美国临时申请序列号62/181,453，提交于2015年8月19日的美国临时申请序列号62/207,312，提交于2015年10月5日的美国临时申请序列号62/237,360，提交于2015年11月13日的美国临时申请序列号62/255,256以及提交于2015年12月18日的美国临时申请序列号62/269,876。

前述一个或多个申请以及在本文中引用或参考的所有文献(“本文引用的文献”)、以及在本文中引用的文献中引用或参考的所有文献，连同针对在本文中提及或通过引用结合在本文中的任何文献中的任何产品的任何制造商的说明书、说明、产品规格、和产品表，特此通过引用并入本文，并且可以在本发明的实践中采用。更具体地说，所有参考的文献均通过引用并入本文，其程度如同每个单独的文献被确切地并单独地指明通过引用而并入本文。

关于联邦资助研究的声明

本发明是根据由美国国立卫生研究院(National Institutes of Health)授予的授权号MH100706和MH110049在美国政府支持下完成的。美国政府享有本发明的某些权利。

发明领域

本发明总体上涉及规律间隔成簇短回文重复(CRISPR)、CRISPR酶(例如，Cas或Cas9)、CRISPR-Cas或CRISPR系统或CRISPR-Cas复合物、其组分、核酸分子(例如，包括它的载体)以及前述所有项的用途等方面。

发明背景

如何在真核细胞中制备和使用CRISPR-Cas系统的授权披露的首发公开是丛(Cong)等人，《科学》(Science)2013；339:819-823(在线公开于2013年1月3日)。如何在真核细胞中制备和使用CRISPR-Cas系统的授权披露的首发专利申请是提交于2012年12月12日的张(Zhang)等人的美国临时申请序列号61/736,527，许多专利申请要求该临时申请的优先权，包括已经发展成为对未来有影响的美国专利号8,999,641、8,993,233、8,945,839、8,932,814、8,906,616、8,895,308、8,889,418、8,889,356、8,871,445、8,865,406、8,795,965、8,771,945和8,697,359的那些。

发明概述

与提供了使得能够在真核细胞中使用CRISPR-Cas系统的突破性进展一致，博德研究所(Broad Institute)的张(Zhang)等人的实验室意识到仍需要改进的CRISPR酶，该酶用于在实现对靶座位的修饰中使用但是降低或消除朝向脱靶的活性。迫切需要用于降低CRISPR酶当与指导RNA复合时的脱靶活性的替代且稳健的系统和技术。还迫切需要用于增加CRISPR酶当与指导RNA复合时的活性的替代且稳健的系统和技术。

已经开发了若干增强Cas9特异性的策略，包括减少细胞中的Cas9量、使用Cas9切口酶突变体产生一对并列的单链DNA切口、截短5'端的指导序列、以及使用一对各自融合至FokI核酸酶结构域的无催化活性的Cas9核酸酶。

诸位发明人已经出人意料地确定，可以对CRISPR酶做出修饰，这些经修饰的CRISPR酶相比于未修饰的CRISPR酶赋予降低的脱靶活性和/或相比于未修饰的CRISPR酶赋予增加的靶标活性。因此，本文提供了可以在范围广泛的基因修饰应用中具有效用的改进的CRISPR酶。本文还提供了CRISPR复合物、组合物和系统，连同方法和用途，全部都包含本文披露的修饰的CRISPR酶。CRISPR-Cas9是优选的，包括但不限于SaCas9、SpCas9和直向同源物。

在一个方面，提供了工程化的CRISPR蛋白，其中该蛋白与包含RNA的核酸分子复合以形成CRISPR复合物，其中当在该CRISPR复合物中时，该核酸分子靶向一个或多个靶多核苷酸座位，该蛋白相比于未修饰的CRISPR包括至少一种修饰，并且其中包含经修饰蛋白的CRISPR复合物相比于包含未修饰的CRISPR蛋白的复合物具有改变的活性。CRISPR-Cas9是优选的，包括但不限于SaCas9、SpCas9和直向同源物。CRISPR蛋白包括具有酶活性(例如核酸酶活性)的那些。

在一个方面，该工程化的CRISPR蛋白的改变的活性包括就包含RNA的核酸分子或靶多核苷酸座位而言的改变的结合特性、就包含RNA的核酸分子或靶多核苷酸座位而言的改变的结合动力学、或就包含RNA的核酸分子或靶多核苷酸座位(相比于脱靶多核苷酸座位)而言的改变的结合特异性。

在某些实施例中，该工程化的CRISPR蛋白的改变的活性包括增加的靶向效率或减少的脱靶结合。在某些实施例中，该工程化的CRISPR蛋白的改变的活性包括修饰的切割活性。

在某些实施例中，改变的活性包括就靶多核苷酸座位而言的增加的切割活性。在某些实施例中，改变的活性包括就靶多核苷酸座位而言的降低的切割活性。在某些实施例中，改变的活性包括就脱靶多核苷酸座位而言的降低的切割活性。在某些实施例中，改变的活性包括就脱靶多核苷酸座位而言的增加的切割活性。因此，在某些实施例中，与脱靶多核苷酸座位相比，对靶多核苷酸座位有增加的特异性。在其他实施例中，与脱靶多核苷酸座位相比，对靶多核苷酸座位有降低的特异性。

在本发明的一个方面，该工程化的CRISPR蛋白的改变的活性包括改变的解旋酶动力学。

在本发明的一个方面，该工程化的CRISPR蛋白包含修饰，该修饰改变该蛋白与包含RNA的核酸分子、或靶多核苷酸座位的链、或脱靶多核苷酸座位的链的缔合。在本发明的一个方面，该工程化的CRISPR蛋白包含改变CRISPR复合物形成的修饰。

本发明提供了：

非天然存在的CRISPR酶，其中

该酶与指导RNA复合以形成CRISPR复合物，

当在该CRISPR复合物中时，该指导RNA靶向一个或多个靶多核苷酸座位并且该酶改变这些多核苷酸座位，并且

该酶包括至少一种修饰，

由此与未修饰的酶相比该CRISPR复合物中的酶具有降低的修饰一个或多个脱靶座位的能力，和/或由此与未修饰的酶相比该CRISPR复合物中的酶具有增加的修饰一个或多个靶座位的能力。

在任何这样的非天然存在的CRISPR酶中，修饰可以包括该酶的一个或多个氨基酸残基的修饰。

在任何这样的非天然存在的CRISPR酶中，修饰可以包括位于区域中的一个或多个氨基酸残基的修饰，该区域包含在未修饰的酶中带正电的残基。

在任何这样的非天然存在的CRISPR酶中，修饰可以包括一个或多个氨基酸残基的修饰，这些氨基酸残基在未修饰的酶中是带正电的。

在任何这样的非天然存在的CRISPR酶中，修饰可以包括一个或多个氨基酸残基的修饰，这些氨基酸残基在未修饰的酶中是不带正电的。

修饰可以包括一个或多个氨基酸残基的修饰，这些氨基酸残基在未修饰的酶中是不带电的。

修饰可以包括一个或多个氨基酸残基的修饰，这些氨基酸残基在未修饰的酶中是带负电的。

修饰可以包括一个或多个氨基酸残基的修饰，这些氨基酸残基在未修饰的酶中是疏水的。

修饰可以包括一个或多个氨基酸残基的修饰，这些氨基酸残基在未修饰的酶中是极性的。

在任何以上描述的非天然存在的CRISPR酶中，该酶可以包括II型CRISPR酶。该酶可以包括Cas9酶。

在某些以上描述的非天然存在的CRISPR酶中，修饰可以包括位于区域中的一个或多个残基的修饰，该区域在RuvC结构域与HNH结构域之间。RuvC结构域可以包括RuvCII结构域或RuvCIII结构域。修饰可以包括位于沟槽中的一个或多个残基的修饰。

在某些以上描述的非天然存在的CRISPR酶中，修饰可以包括位于RuvC结构域与HNH结构域之间的区域外、或沟槽外的一个或多个残基的修饰。

在某些以上描述的非天然存在的CRISPR酶中，修饰可以包括区域中的一个或多个残基的修饰，该区域包含：

化脓链球菌Cas9(SpCas9)的残基R63至K1325或K775至K1325或另一Cas9直向同源物中的相应区域；或者

金黄色葡萄球菌Cas9(SaCas9)的残基K37至K736或另一Cas9直向同源物中的相应区域。

在某些以上描述的非天然存在的CRISPR酶中，修饰包括一个或多个残基的修饰，其中这一个或多个残基包括精氨酸、组氨酸或赖氨酸。

在任何以上描述的非天然存在的CRISPR酶中，可以通过突变所述一个或多个残基来修饰该酶。

在某些以上描述的非天然存在的CRISPR酶中，通过突变所述一个或多个残基来修饰该酶，并且其中该突变包括用丙氨酸残基取代未修饰的酶中的残基。

在某些以上描述的非天然存在的CRISPR酶中，通过突变所述一个或多个残基来修饰该酶，并且其中该突变包括用天冬氨酸或谷氨酸取代未修饰的酶中的残基。

在某些以上描述的非天然存在的CRISPR酶中，通过突变所述一个或多个残基来修饰该酶，并且其中该突变包括用丝氨酸、苏氨酸、天冬酰胺或谷氨酰胺取代未修饰的酶中的残基。

在某些以上描述的非天然存在的CRISPR酶中，通过突变所述一个或多个残基来修饰该酶，并且其中该突变包括用丙氨酸、甘氨酸、异亮氨酸、亮氨酸、甲硫氨酸、苯丙氨酸、色氨酸、酪氨酸或缬氨酸取代未修饰的酶中的残基。

在某些以上描述的非天然存在的CRISPR酶中，通过突变所述一个或多个残基来修饰该酶，并且其中该突变包括用极性氨基酸残基取代未修饰的酶中的残基。

在某些以上描述的非天然存在的CRISPR酶中，通过突变所述一个或多个残基来修饰该酶，并且其中该突变包括用不是极性氨基酸残基的氨基酸残基取代未修饰的酶中的残基。

在某些以上描述的非天然存在的CRISPR酶中，通过突变所述一个或多个残基来修饰该酶，并且其中该突变包括用带负电的氨基酸残基取代未修饰的酶中的残基。

在某些以上描述的非天然存在的CRISPR酶中，通过突变所述一个或多个残基来修饰该酶，并且其中该突变包括用不是带负电的氨基酸残基的氨基酸残基取代未修饰的酶中的残基。

在某些以上描述的非天然存在的CRISPR酶中，通过突变所述一个或多个残基来修饰该酶，并且其中该突变包括用不带电的氨基酸残基取代未修饰的酶中的残基。

在某些以上描述的非天然存在的CRISPR酶中，通过突变所述一个或多个残基来修饰该酶，并且其中该突变包括用不是不带电的氨基酸残基的氨基酸残基取代未修饰的酶中的残基。

在某些以上描述的非天然存在的CRISPR酶中，通过突变所述一个或多个残基来修饰该酶，并且其中该突变包括用疏水氨基酸残基取代未修饰的酶中的残基。

在某些以上描述的非天然存在的CRISPR酶中，通过突变所述一个或多个残基来修饰该酶，并且其中该突变包括用不是疏水氨基酸残基的氨基酸残基取代未修饰的酶中的残基。

该非天然存在的CRISPR酶可以是SpCas9或SpCas9的直向同源物，并且其中：

通过突变列于表1-7的任一项中的SpCas9或SaCas9残基中的任一项或Cas9直向同源物中的相应残基来修饰该酶，或者该酶包括修饰，例如包括通过突变列于表1-7的任一项中的SpCas9或SaCas9残基中的任一项或Cas9直向同源物中的相应残基进行的修饰、基本上由其组成或由其组成；或者

该酶包括根据贯穿本申请的披露(包括但不限于在概述中和/或在附图简要说明中和/或在详细说明中和/或在任何实例中和/或在任何图中)的任何一个(单)、两个(双)、三个(三)、四个(四)或更多个位置、或Cas9直向同源物中的相应残基或位置中的修饰、基本上由其组成或由其组成，例如，包括叙述于任何概述中和/或附图简要说明中和/或详细说明中和/或任何实例中和/或任何图中或本文的其他地方的Cas9残基中的任一项、或Cas9直向同源物中的相应残基或位置中的修饰、基本上由其组成或由其组成的酶。在这样一种酶中，可以通过用丙氨酸残基取代来修饰每个残基。

在某些以上描述的非天然存在的CRISPR酶中，通过突变一个或多个残基(包括但不限于位置12、13、63、415、610、775、779、780、810、832、848、855、861、862、866、961、968、974、976、982、983、1000、1003、1014、1047、1060、1107、1108、1109、1114、1129、1240、1289、1296、1297、1300、1311和1325，参考SpCas9的氨基酸位置编号)来修饰该酶。

在某些以上描述的非天然存在的CRISPR酶中，通过突变修饰该酶并且该酶在残基(包括但不限于位置63、415、775、779、780、810、832、848、855、861、862、866、961、968、974、976、982、983、1000、1003、1014、1047、1060、1107、1108、1109、1114、1129、1240、1289、1296、1297、1300、1311或1325，参考SpCas9的氨基酸位置编号)处包括一个或多个丙氨酸取代。

在某些以上描述的非天然存在的CRISPR酶中，通过突变修饰该酶并且该酶包括K775A、E779L、Q807A、R780A、K810A、R832A、K848A、K855A、K862A、K866A、K961A、K968A、K974A、R976A、H982A、H983A、K1000A、K1014A、K1047A、K1060A、K1003A、K1107A、S1109A、H1240A、K1289A、K1296A、H1297A、K1300A、H1311A或K1325A的一个或多个取代。

在某些以上描述的非天然存在的CRISPR酶中，通过突变修饰该酶并且该酶包括两个或更多个取代，其中这两个或更多个取代包括但不限于R783A和A1322T、或R780A和K810A、或ER780A和K855A、或R780A和R976A、或K848A和R976A、或K855A和R976A，和R780A和K848A、或K810A和K848A、或K848A和K855A、或K810A和K855A、或H982A和R1060A、或H982A和R1003A、或K1003A和R1060A、或R780A和H982A、或K810A和H982A、或K848A和H982A、或K855A和H982A、或R780A和K1003A、或K810A和R1003A、或K848A和K1003A、或K848A和K1007A、或R780A和R1060A、或K810A和R1060A、或K848A和R1060A、或R780A和R1114A、或K848A和R1114A、或R63A和K855A、或R63A和H982A、或H415A和R780A、或H415A和K848A、或K848A和E1108A、或K810A和K1003A、或R780A和R1060A、K810A和R1060A、或K848A和R1060A。

在某些以上描述的非天然存在的CRISPR酶中，通过突变修饰该酶并且该酶包括三个或更多个取代，其中这三个或更多个取代包括但不限于H982A、K1003A和K1129E，或R780A、K1003A和R1060A，或K810A、K1003A和R1060A，或K848A、K1003A和R1060A，或K855A、K1003A和R1060A，或H982A、K1003A和R1060A，或R63A、K848A和R1060A，或T13I、R63A和K810A，或G12D、R63A和R1060A。

在某些以上描述的非天然存在的CRISPR酶中，通过突变修饰该酶并且该酶包括四个或更多个取代，其中这四个或更多个取代包括但不限于R63A、E610G、K855A和R1060A，或R63A、K855A、R1060A和E610G。

在一个优选实施例中，该非天然存在的CRISPR酶中的突变不是列于表B中的突变。在进一步优选的实施例中，该非天然存在的CRISPR酶中的突变不是R63A、K866A、H982A、H983A、K1107A、K1107A、KES1107-1109AG或KES1107-1109GG(参考SpCas9的氨基酸位置编号)。在进一步优选的实施例中，该非天然存在的CRISPR酶不是通过选自R63A、K866A、H982A、H983A、K1107A和K1107A的单突变修饰的酶或通过选自KES1107-1109AG和KES1107-1109GG的突变修饰的酶(参考SpCas9的氨基酸位置编号)。

在优选实施例中，通过突变一个或多个残基(包括但不限于位置12、13、415、610、775、779、780、810、832、848、855、861、862、961、968、974、976、1000、1003、1014、1047、1060、1114、1129、1240、1289、1296、1297、1300、1311和1325，参考SpCas9的氨基酸位置编号)来修饰以上描述的非天然存在的CRISPR酶。

在进一步优选的实施例中，通过突变修饰以上描述的非天然存在的CRISPR酶并且该酶在残基(包括但不限于位置415、775、779、780、810、832、848、855、861、862、961、968、974、976、1000、1003、1014、1047、1060、1114、1129、1240、1289、1296、1297、1300、1311或1325，参考SpCas9的氨基酸位置编号)处包括一个或多个丙氨酸取代。

在进一步优选的实施例中，通过突变修饰以上描述的非天然存在的CRISPR酶并且该酶包括K775A、E779L、Q807A、R780A、K810A、R832A、K848A、K855A、K862A、K961A、K968A、K974A、R976A、K1000A、K1014A、K1047A、K1060A、K1003A、S1109A、H1240A、K1289A、K1296A、H1297A、K1300A、H1311A或K1325A的一个或多个取代。

在任何非天然存在的CRISPR酶中：

可以在靶标与一个或多个脱靶座位的对应序列之间存在单个错配；和/或

可以在靶标与一个或多个脱靶座位的对应序列之间存在两个、三个或四个或更多个错配，和/或

其中在(ii)中，所述两个、三个或四个或更多个错配是连续的。

在任何非天然存在的CRISPR酶中，与未修饰的酶相比该CRISPR复合物中的酶可以具有降低的修饰一个或多个脱靶座位的能力，并且其中与未修饰的酶相比该CRISPR复合物中的酶具有增加的修饰所述靶座位的能力。

在任何非天然存在的CRISPR酶中，当在该CRISPR复合物中时，与未修饰的酶的相对差异相比，该酶在靶标与至少一个脱靶座位之间的修饰能力的相对差异可以是增加的。

在任何非天然存在的CRISPR酶中，该CRISPR酶可以包括一个或多个另外的突变，其中这一个或多个另外的突变在一个或多个催化活性结构域之中。

在此类非天然存在的CRISPR酶中，与缺乏所述一个或多个另外的突变的酶相比，该CRISPR酶可以具有降低的或消除的核酸酶活性。

在一些这样的非天然存在的CRISPR酶中，该CRISPR酶并不指导一条或另一条DNA链在靶序列位置处的切割。

在一些这样的非天然存在的CRISPR酶中，这一个或多个另外的突变包括SpCas9的D10、SpCas9的E762、SpCas9的H840、SpCas9的N854、SpCas9的N863和/或SpCas9的D986或者其他Cas9直向同源物的相应残基的突变。

在一些这样的非天然存在的CRISPR酶中，这一个或多个另外的突变包括SpCas9的D10A、E762A、H840A、N854A、N863A和/或D986A或者其他Cas9直向同源物的相应残基。

在一些这样的非天然存在的CRISPR酶中，这一个或多个另外的突变包括两个另外的突变。这两个另外的突变可以包括D10A SpCas9和H840A SpCas9，或另一Cas9直向同源物的相应残基。在一些这样的非天然存在的CRISPR酶中，该CRISPR酶可以不指导任一条DNA链在靶序列位置处的切割。

在该CRISPR酶在一个或多个催化活性结构域中包括一个或多个另外的突变的情况下，这一个或多个另外的突变可以在CRISPR酶的包括RuvCI、RuvCII或RuvCIII的催化活性结构域之中。

不受理论所束缚，在本发明的一个方面，所描述的方法和突变提供了增强Cas9结构域向导致中靶位点处的切割并且避免脱靶位点处的那些构象状态的位置的构象重排。Cas9通过一系列协调的步骤切割靶DNA。首先，PAM相互作用结构域识别靶DNA的5’的PAM序列。PAM结合之后，针对sgRNA:DNA互补性对靶序列的前10-12个核苷酸(种子序列)取样，一个依赖于DNA双链体分离的过程。如果种子序列核苷酸与sgRNA互补，则将DNA的其余部分解旋并且使全长的sgRNA与靶DNA链杂交。RuvC与HNH结构域之间的nt-沟槽使非靶向的DNA链稳定化并且通过与DNA磷酸骨架的正电荷的非特异性相互作用有助于解旋。RNA:cDNA和Cas9:ncDNA相互作用驱动DNA解旋与cDNA:ncDNA再杂交的竞争。其他Cas9结构域也影响核酸酶结构域的构象，例如连接HNH与RuvCII和RuvCIII的接头。因此，所提供的方法和突变涵盖但不限于RuvCI、RuvCIII、RuvCIII和HNH结构域以及接头。通过靶DNA结合(包括种子序列相互作用)导致Cas9的构象变化，并且与靶DNA链和非靶DNA链的相互作用决定了这些结构域是否被定位以触发核酸酶活性。因此，本文提供的突变和方法证实并且允许超出PAM识别和RNA-DNA碱基配对的修饰。

在一个方面，本发明提供了Cas9核酸酶，这些核酸酶当牵涉在中靶相互作用中时包括朝向与切割活性相关的构象的改进的平衡和/或当牵涉在脱靶相互作用中时包括远离与切割活性相关的构象的改进的平衡。在一个方面，本发明提供了具有改进的校对功能的Cas9核酸酶，即采取在中靶位点处包括核酸酶活性的构象的Cas9核酸酶，并且该构象在脱靶位点处具有增加的不利性。斯腾伯格(Sternberg)等人(《自然》(Nature)527(7576):110-3，doi:10.1038/nature15544，在线公开于2015年10月28日，电子版2015年10月28日)使用荧光共振能量转移(FRET)实验检测当与中靶和脱靶DNA缔合时Cas9催化结构域的相对方向。

本发明进一步提供了用于使用修饰的指导RNA调节核酸酶活性和/或特异性的方法和突变。如所讨论的，可以增加或降低中靶核酸酶活性。同样地，可以增加或降低脱靶核酸酶活性。此外，就中靶活性与脱靶活性而言的特异性可以增加或降低。修饰的指导RNA包括但不限于截短的指导RNA、失活的指导RNA、经化学修饰的指导RNA、与功能结构域相关的指导RNA、包含功能结构域的修饰的指导RNA、包含适配体的修饰的指导RNA、包含衔接蛋白的修饰的指导RNA、以及包含添加的或修饰的环的指导RNA。

在一个方面，本发明还提供了用于调节Cas9结合活性和/或结合特异性的方法和突变。在某些实施例中，使用缺乏核酸酶活性的Cas9蛋白。在某些实施例中，采用促进Cas9核酸酶的结合活性但不促进其核酸酶活性的修饰的指导RNA。在此类实施例中，可以增加或减少中靶结合。同样地，在此类实施例中，可以增加或减少脱靶结合。此外，就中靶结合与脱靶结合而言的特异性可以增加或降低。

可以按不同组合采用以便增加或降低中靶与脱靶活性的活性和/或特异性或者增加或降低中靶与脱靶结合的结合和/或特异性的方法和突变可以用来补偿或增强用以促进其他效应的突变或修饰。用以促进其他效应的此类突变或修饰包括对Cas9的突变或修饰和或对指导RNA做出的突变或修饰。在某些实施例中，将这些方法和突变与经化学修饰的指导RNA一起使用。指导RNA化学修饰的实例包括但不限于在一个或多个末端核苷酸处掺入2′-O-甲基(M)、2′-O-甲基3′硫代磷酸酯(MS)、或2′-O-甲基3′硫代PACE(MSP)。与未修饰的指导RNA相比，此类经化学修饰的指导RNA可以包括增加的稳定性和增加的活性，但是中靶与脱靶特异性是不可预测的。(参见，亨德尔(Hendel)，2015，《自然生物技术》(NatBiotechnol.)33(9):985-9，doi:10.1038/nbt.3290，在线公开于2015年6月29日)。经化学修饰的指导RNA进一步包括但不限于具有硫代磷酸酯键的RNA和在核糖环的2′和4′碳之间包含亚甲桥的锁核酸(LNA)核苷酸。使用本发明的方法和突变调节Cas9核酸酶活性和/或与经化学修饰的指导RNA的结合。

在一个方面，本发明提供了用于调节Cas9蛋白的结合和/或结合特异性的方法和突变，这些蛋白包含功能结构域，如核酸酶、转录激活因子、转录阻遏因子等。例如，可以通过在核酸酶结构域RuvC和HNH中引入突变(如D10A、D839A、H840A和N863A)使得Cas9蛋白的核酸酶无效。核酸酶缺陷型Cas9蛋白可用于功能结构域的RNA指导的靶序列依赖性递送。本发明提供了用于调节Cas9蛋白的结合的方法和突变。在一个实施例中，功能结构域包括VP64，从而提供RNA指导的转录因子。在另一个实施例中，功能结构域包括Fok I，从而提供RNA指导的核酸酶活性。提及的是美国专利公开2014/0356959、美国专利公开2014/0342456、美国专利公开2015/0031132、以及在线公开于2013年1月3日的玛丽，P(Mali,P.)等人，2013，《科学》(Science)339(6121):823-6，doi:10.1126/science.1232033，并且通过本文的传授，本发明包括与本文的传授结合应用的这些文献的方法和材料。在某些实施例中，中靶结合是增加的。在某些实施例中，脱靶结合是降低的。在某些实施例中，中靶结合是降低的。在某些实施例中，脱靶结合是增加的。因此，本发明还提供了增加或降低功能化Cas9结合蛋白的中靶结合与脱靶结合的特异性。

将Cas9用作RNA指导的结合蛋白并不限于核酸酶无效的Cas9。当与某些指导RNA一起使用时，包括核酸酶活性的Cas9酶还可以充当RNA指导的结合蛋白。例如，短指导RNA和包含与靶标错配的核苷酸的指导RNA可以促进与靶序列的RNA引导的Cas9结合，并且靶标有很少或没有切割。(参见例如，达尔曼(Dahlman)，2015，《自然生物技术》(Nat Biotechnol.)33(11):1159-1161，doi:10.1038/nbt.3390，在线公开于2015年10月05日)。在一个方面，本发明提供了用于调节Cas9蛋白的结合的方法和突变，这些蛋白包括核酸酶活性。在某些实施例中，中靶结合是增加的。在某些实施例中，脱靶结合是降低的。在某些实施例中，中靶结合是降低的。在某些实施例中，脱靶结合是增加的。在某些实施例中，中靶结合与脱靶结合的特异性是增加的或降低的。在某些实施例中，还调节指导RNA-Cas9酶的核酸酶活性。

RNA-DNA异源双链体形成对于整个靶区域的切割活性和特异性而言是重要的，不仅仅是最靠近PAM的种子区序列。因此，截短的指导RNA显示出降低的切割活性和特异性。在一个方面，本发明提供了用于使用改变的指导RNA增加切割活性和特异性的方法和突变。

本发明还证实了Cas9核酸酶特异性的修饰可以与靶向范围的修饰配合进行。可以设计具有增加的靶标特异性并且在PAM识别中适应修饰的Cas9突变体，例如通过选择改变PAM特异性的突变并且将那些突变与增加(或如果希望的话，降低)对中靶序列与脱靶序列的特异性的nt-沟槽突变组合。在一个这样的实施例中，将PI结构域残基突变以适应所希望的PAM序列的识别，同时将一个或多个nt-沟槽氨基酸突变以改变靶标特异性。克莱因史迪维尔(Kleinstiver)涉及SpCas9和SaCas9核酸酶，其中某些PI结构域残基被突变并且识别替代性PAM序列(参见，克莱因史迪维尔等人，《自然》(Nature)523(7561):481-5doi:10.1038/nature14592，在线公开于2015年6月22日；克莱因史迪维尔等人，《自然生物技术》(Nature Biotechnology)，doi:10.1038/nbt.3404，在线公开于2015年11月2日)。本文描述的Cas9方法和修饰可以用于对抗由PAM识别改变导致的特异性损失、增强由PAM识别改变导致的特异性增益、对抗由PAM识别改变导致的特异性增益、或增强由PAM识别改变导致的特异性损失。

这些方法和突变可以与具有改变的PAM识别的任何Cas9酶一起使用。PAM的非限制性实例包括NGG、NNGRRT、NN[A/C/T]RRT、NGAN、NGCG、NGAG、NGNG、NGC、以及NGA。

在另外的实施例中，这些方法和突变使用经修饰的蛋白。

在任何非天然存在的CRISPR酶中，该CRISPR酶可以包括一个或多个异源功能结构域。

这一个或多个异源功能结构域可以包括一个或多个核定位信号(NLS)结构域。这一个或多个异源功能结构域可以包括至少两个或更多个NLS。

在本发明的某些实施例中，至少一个核定位信号(NLS)附接到编码Cas9效应蛋白的核酸序列。在优选实施例中，至少一个或多个C-末端或N-末端NLS被附接(并且因此编码Cas9效应蛋白的一个或多个核酸分子可以包括对一个或多个NLS的编码，这样使得表达产物的一个或多个NLS被附接或连接)。在优选实施例中，C-末端NLS被附接，用于在真核细胞(优选人类细胞)中进行最佳表达和核靶向。在优选实施例中，密码子优化的效应蛋白是SpCas9或SaCas9并且指导RNA的间隔子长度是从15至35nt。在某些实施例中，指导RNA的间隔子长度是至少16个核苷酸，如至少17个核苷酸。在某些实施例中，间隔子长度是从15至17nt、从17至20nt、从20至24nt(例如20、21、22、23或24nt)、从23至25nt(例如23、24或25nt)、从24至27nt、从27-30nt、从30-35nt、或35nt或更长。在本发明的某些实施例中，密码子优化的效应蛋白是SpCas9或SaCas9并且指导RNA的同向重复长度是至少16个核苷酸。在某些实施例中，密码子优化的效应蛋白是FnCpf1p并且指导RNA的同向重复长度是从16至20nt，例如16、17、18、19、或20个核苷酸。在某些优选实施例中，指导RNA的同向重复长度是19个核苷酸。

这一个或多个异源功能结构域包括一个或多个转录激活结构域。转录激活结构域可以包括VP64。

这一个或多个异源功能结构域包括一个或多个转录阻遏结构域。转录阻遏结构域可以包括KRAB结构域或SID结构域。

这一个或多个异源功能结构域可以包括一个或多个核酸酶结构域。这一个或多个核酸酶结构域可以包括Fok1。

这一个或多个异源功能结构域可以具有一种或多种以下活性：甲基酶活性、脱甲基酶活性、转录激活活性、转录阻遏活性、转录释放因子活性、组蛋白修饰活性、核酸酶活性、单链RNA切割活性、双链RNA切割活性、单链DNA切割活性、双链DNA切割活性以及核酸结合活性。

这至少一个或多个异源功能结构域可以在该酶的氨基-末端处或附近和/或在该酶的羧基-末端处或附近。

这一个或多个异源功能结构域可以融合至该CRISPR酶，或系栓至该CRISPR酶，或通过接头部分连接至该CRISPR酶。

在任何非天然存在的CRISPR酶中，该CRISPR酶可以包括来自以下属的生物的CRISPR酶，包括链球菌属、弯曲杆菌属、Nitratifractor、葡萄球菌属、细小棒菌属(Parvibaculum)、罗氏菌属(Roseburia)、奈瑟氏菌属、葡糖醋杆菌属、固氮螺菌属、Sphaerochaeta、乳杆菌属、真杆菌属或棒状杆菌属。

在任何非天然存在的CRISPR酶中，该CRISPR酶可以包括嵌合Cas9酶，该嵌合Cas9酶包含来自第一Cas9直向同源物的第一片段和来自第二Cas9直向同源物的第二片段，并且该第一和第二Cas9直向同源物是不同的。该第一和第二Cas9直向同源物中至少一者可以包括来自以下生物的Cas9，包括链球菌属、弯曲杆菌属、Nitratifractor、葡萄球菌属、细小棒菌属、罗氏菌属、奈瑟氏菌属、葡糖醋杆菌属、固氮螺菌属、Sphaerochaeta、乳杆菌属、真杆菌属或棒状杆菌属。

在任何非天然存在的CRISPR酶中，编码该CRISPR酶的核苷酸序列经密码子优化以便在真核生物中表达。

在任何非天然存在的CRISPR酶中，该细胞可以是真核细胞或原核细胞；其中该CRISPR复合物在该细胞中是有效的，并且由此与未修饰的酶相比该CRISPR复合物的酶具有降低的修饰该细胞的一个或多个脱靶座位的能力，和/或由此与未修饰的酶相比该CRISPR复合物中的酶具有增加的修饰一个或多个靶座位的能力。

本发明还提供了非天然存在的、工程化的组合物，该组合物包含CRISPR-Cas复合物，该复合物包含以上描述的任何非天然存在的CRISPR酶。

本发明还提供了非天然存在的、工程化的组合物，该组合物包含：

递送系统，该递送系统被有效地配置为将CRISPR-Cas复合物组分或者包含或编码所述组分的一个或多个多核苷酸序列递送到细胞中，并且其中所述CRISPR-Cas复合物在该细胞中是有效的，

CRISPR-Cas复合物组分或编码这些CRISPR-Cas复合物组分在细胞中的转录和/或翻译的一个或多个多核苷酸序列，这些复合物组分或多核苷酸序列包含：

(I)根据以上权利要求中任一项所述的非天然存在的CRISPR酶；

(II)CRISPR-Cas复合物RNA，其包含：

指导序列，

tracr配对序列，和

tracr序列，

其中：

在该细胞中：

该tracr配对序列杂交到该tracr序列上；

形成CRISPR复合物；

该指导RNA靶向靶多核苷酸座位并且该酶改变这些多核苷酸座位，并且

与未修饰的酶相比该CRISPR复合物中的酶具有降低的修饰一个或多个脱靶座位的能力，和/或由此与未修饰的酶相比该CRISPR复合物中的酶具有增加的修饰一个或多个靶座位的能力。

在任何这样的组合物中，该递送系统可以包括酵母系统、脂转染系统、显微注射系统、基因枪系统、病毒体、脂质体、免疫脂质体、聚阳离子、脂质:核酸缀合物或人工病毒粒子。

在任何这样的组合物中，该递送系统可以包括载体系统，该载体系统包含一种或多种载体，并且其中组分(II)包括有效作地连接至多核苷酸序列的第一调节组件，该多核苷酸序列包含指导序列、tracr配对序列和tracr序列，并且其中组分(I)包括有效作地连接至编码CRISPR酶的多核苷酸序列的第二调节组件。在此类组合物中，该指导RNA或CRISPR-Cas复合物RNA可以包括嵌合RNA。

在任何这样的组合物中，该递送系统可以包括载体系统，该载体系统包含一种或多种载体，并且其中组分(II)包括有效作地连接至指导序列和tracr配对序列的第一调节组件、和有效作地连接至tracr序列的第三调节组件，并且其中组分(I)包括有效作地连接至编码CRISPR酶的多核苷酸序列的第二调节组件。

在任何这样的组合物中，该组合物可以包含多于一种指导RNA，并且每种指导RNA具有不同靶标，由此存在多元性。

在任何这样的组合物中，一个或多个多核苷酸序列可以在一个载体上。

本发明还提供了工程化的、非天然存在的规律间隔成簇短回文重复(CRISPR)-CRISPR相关(Cas)(CRISPR-Cas)载体系统，该载体系统包含一种或多种载体，这一种或多种载体包含：

a)第一调节组件，该第一调节组件有效作地连接至核苷酸序列，该核苷酸序列编码在此发明的构建体的任一项的非天然存在的CRISPR酶；和

b)第二调节组件，该第二调节组件有效作地连接至一个或多个编码指导RNA中的一个或多个的核苷酸序列，该指导RNA包含指导序列、tracr序列、和tracr配对序列，

其中：

组分(a)和(b)位于相同或不同载体上，

该tracr配对序列杂交到该tracr序列上；

形成CRISPR复合物；

在这样一种系统中，组分(II)可以包括有效作地连接至多核苷酸序列的第一调节组件，该多核苷酸序列包含指导序列、tracr配对序列和tracr序列，并且其中组分(II)可以包括有效作地连接至编码CRISPR酶的多核苷酸序列的第二调节组件。在这样一种系统中，该指导RNA可以包括嵌合RNA。

在这样一种系统中，组分(I)可以包括有效作地连接至指导序列和tracr配对序列的第一调节组件、和有效作地连接至tracr序列的第三调节组件，并且其中组分(II)可以包括有效作地连接至编码CRISPR酶的多核苷酸序列的第二调节组件。这样一种系统可以包含多于一种指导RNA，并且每种指导RNA具有不同靶标，由此存在多元性。组分(a)和(b)可以在同一载体上。

在任何这样的包含载体的系统中，这一种或多种载体可以包括一种或多种病毒载体，如一种或多种逆转录病毒、慢病毒、腺病毒、腺相关病毒或单纯疱疹病毒。

在任何这样的包含调节组件的系统中，所述调节组件中至少一者可以包括组织特异性启动子。组织特异性启动子可以指导在哺乳动物血细胞中的、在哺乳动物肝细胞中的或在哺乳动物眼中的表达。

在任何以上描述的组合物或系统中，该tracr序列可以包括一个或多个蛋白质相互作用RNA适配体。这一个或多个适配体可以位于tracr序列的四核苷酸环(tetraloop)和/或茎环2中。这一个或多个适配体可以能够结合MS2噬菌体外壳蛋白。

在任何以上描述的组合物或系统中，该tracr序列在长度上可以是30或更多个核苷酸。

在任何以上描述的组合物或系统中，该细胞可以是真核细胞或原核细胞；其中该CRISPR复合物在该细胞中是有效的，并且由此与未修饰的酶相比该CRISPR复合物的酶具有降低的修饰该细胞的一个或多个脱靶座位的能力，和/或由此与未修饰的酶相比该CRISPR复合物中的酶具有增加的修饰一个或多个靶座位的能力。

本发明还提供了任何以上描述的组合物的或来自任何以上描述的系统的CRISPR复合物。

本发明还提供了用于在治疗中使用的根据本发明的工程化的CRISPR蛋白、复合物、组合物、系统、载体、细胞或细胞系。

本发明还提供了修饰细胞中的感兴趣的座位的方法，该方法包括使该细胞与任何以上描述的组合物或任何以上描述的系统接触，或者其中该细胞包含存在于该细胞内的任何以上描述的CRISPR复合物。在这样的方法中，该细胞可以是真核细胞。在这样的方法中，生物可以包含该细胞。在这样的方法中，该生物可以不是人或其他动物。本发明还提供了用于在修饰细胞中的感兴趣的座位中使用的根据本发明的工程化的CRISPR蛋白、复合物、组合物、系统、载体、细胞或细胞系。所述修饰优选包括使该细胞与任何以上描述的组合物或任何以上描述的系统接触。本发明还提供了根据本发明的工程化的CRISPR蛋白、复合物、组合物、系统、载体、细胞或细胞系在制备用于修饰细胞中的感兴趣的座位的药剂中的用途。

任何这样的方法可以是离体的或在体外。

在任何这样的方法中，所述修饰可以包括调节基因表达。所述调节基因表达可以包括激活基因表达和/或阻遏基因表达。

本发明还提供了用于在修饰细胞中的感兴趣的座位中使用的根据本发明的工程化的CRISPR蛋白、复合物、组合物、系统、载体、细胞或细胞系。本发明还提供了根据本发明的工程化的CRISPR蛋白、复合物、组合物、系统、载体、细胞或细胞系在制备用于修饰细胞中的感兴趣的座位的药剂中的用途。所述修饰优选包括使该细胞与以上描述的任何组合物或以上描述的任何系统接触。本发明还提供了治疗对其有需要的个体的疾病、障碍或感染的方法，该方法包括给予有效量的以上描述的任何组合物、系统或CRISPR复合物。该疾病、障碍或感染可以包括病毒感染。该病毒感染可以是HBV。

本发明还提供了用于在治疗对其有需要的个体的疾病、障碍或感染中使用的根据本发明的工程化的CRISPR蛋白、复合物、组合物、系统、载体、细胞或细胞系。该疾病、障碍或感染可以包括病毒感染。该病毒感染可以是HBV。本发明还提供了根据本发明的工程化的CRISPR蛋白、复合物、组合物、系统、载体、细胞或细胞系在制备用于治疗对其有需要的个体的疾病、障碍或感染的药剂中的用途。该疾病、障碍或感染可以包括病毒感染。

本发明还提供了以上描述的任何组合物、系统或CRISPR复合物用于基因或基因组编辑的用途。

本发明还提供了用于用作治疗剂的以上描述的任何组合物、系统或CRISPR复合物。该治疗剂可以用于基因或基因组编辑、或基因治疗。

在一个方面，本发明提供了通过操纵HSC的感兴趣的基因组座位中的靶序列来修饰生物或非人类生物的方法，例如其中该感兴趣的基因组座位与和异常蛋白质表达或和疾病状况或状态相关联的突变相关，该方法包括：

向HSC递送非天然存在的或工程化的组合物，例如经由使HSC与含有非天然存在的或工程化的组合物的粒子接触，该组合物包含：

I.CRISPR-Cas系统嵌合RNA(chiRNA)多核苷酸序列，该多核苷酸序列包含：

(a)指导序列，该指导序列能够杂交到HSC中的靶序列上，

(b)tracr配对序列，和

(c)tracr序列，以及

II.CRISPR酶，该CRISPR酶任选地包含至少一个或多个核定位序列，

其中该tracr配对序列杂交到该tracr序列上，并且该指导序列引导CRISPR复合物与该靶序列的序列特异性结合，并且

其中该CRISPR复合物包含与(1)杂交到该靶序列上的指导序列、和(2)杂交到该tracr序列上的tracr配对序列复合的CRISPR酶；并且

该方法还可以任选地包括递送HDR模板，例如经由使该粒子与含有该HDR模板的HSC接触或使该HSC与另一种含有该HDR模板的粒子接触，其中该HDR模板提供该蛋白的正常或较不异常形式的表达；其中“正常”是就野生型而论，并且“异常”是引起病症或疾病状态的蛋白质表达；并且

任选地该方法可以包括从该生物或非人类生物分离或获得HSC，任选地扩增该HSC群，使一种或多种粒子与该HSC进行接触以获得修饰的HSC群，任选地扩增修饰的HSC群，并且任选地向该生物或非人类生物给予修饰的HSC。

本发明还提供了用于在通过操纵HSC的感兴趣的基因组座位中的靶序列来修饰生物或非人类生物中使用的根据本发明的工程化的CRISPR蛋白、复合物、组合物、系统、载体、细胞或细胞系。所述修饰优选包括

(a)指导序列，该指导序列能够杂交到HSC中的靶序列上，

(b)tracr配对序列，和

(c)tracr序列，以及

其中该CRISPR复合物包含与(1)杂交到该靶序列上的指导序列、和(2)杂交到该tracr序列上的tracr配对序列复合的CRISPR酶。所述修饰进一步任选地包括递送HDR模板，例如经由使该粒子与含有该HDR模板的HSC接触或使该HSC与另一种含有该HDR模板的粒子接触，其中该HDR模板提供该蛋白的正常或较不异常形式的表达；其中“正常”是就野生型而论，并且“异常”是引起病症或疾病状态的蛋白质表达。所述修饰进一步任选地包括从该生物或非人类生物分离或获得HSC，任选地扩增该HSC群，使一种或多种粒子与该HSC进行接触以获得修饰的HSC群，任选地扩增修饰的HSC群，并且任选地向该生物或非人类生物给予修饰的HSC。

在一个方面，本发明提供了通过操纵HSC的感兴趣的基因组座位中的靶序列来修饰生物或非人类生物的方法，例如其中该感兴趣的基因组座位与和异常蛋白质表达或和疾病状况或状态相关联的突变相关，该方法包括：向HSC递送非天然存在的或工程化的组合物，例如经由使HSC与含有非天然存在的或工程化的组合物的粒子接触，该组合物包含：I.(a)能够杂交到HSC中的靶序列上的指导序列、和(b)至少一种或多种tracr配对序列，II.任选地具有一个或多个NLS的CRISPR酶，以及III.包含tracr序列的多核苷酸序列，其中该tracr配对序列杂交到该tracr序列上并且该指导序列引导CRISPR复合物与该靶序列的序列特异性结合，并且其中该CRISPR复合物包含与(1)杂交到该靶序列上的指导序列、和(2)杂交到该tracr序列上的tracr配对序列复合的CRISPR酶；并且

任选地该方法可以包括从该生物或非人类生物分离或获得HSC，任选地扩增该HSC群，使一种或多种粒子与该HSC进行接触以获得修饰的HSC群，任选地扩增修饰的HSC群，并且任选地向该生物或非人类生物给予修饰的HSC。本发明还提供了用于在通过操纵HSC的感兴趣的基因组座位中的靶序列来这样修饰生物或非人类生物中使用的根据本发明的工程化的CRISPR蛋白、复合物、组合物、系统、载体、细胞或细胞系，例如其中该感兴趣的基因组座位与和异常蛋白质表达或和疾病状况或状态相关联的突变相关。

可以递送编码任何一种或多种或所有CRISPR-复合物的一种或多种多核苷酸，这一种或多种多核苷酸有利地连接至一种或多种调节组件用于例如经由一种或多种粒子在体内表达，这一种或多种粒子包含含有有效作地连接至这一种或多种调节组件的一种或多种多核苷酸的载体。编码CRISPR酶的多核苷酸序列、指导序列、tracr配对序列或tracr序列的任一者或全部可以是RNA。应当理解的是，在提及作为RNA并且被认为‘包含’这样tracr配对序列的特征的多核苷酸的情况下，该RNA序列包括该特征。在该多核苷酸是DNA并且被认为包含这样tracr配对序列的特征的情况下，该DNA序列被或者可以被转录成包括该讨论中的特征的RNA。在该特征是蛋白质的情况下，如CRISPR酶，所提及的该DNA或RNA序列被或者可以被翻译(以及在DNA首先被转录的情况下)。

在某些实施例中，本发明提供了通过操纵HSC的感兴趣的基因组座位中的靶序列来修饰生物(例如，哺乳动物，包括人类或非人类哺乳动物或生物)的方法，例如其中该感兴趣的基因组座位与和异常蛋白质表达或和疾病状况或状态相关联的突变相关，该方法包括递送非天然存在的或工程化的组合物，例如经由使非天然存在的或工程化的组合物与该HSC接触，其中该组合物包含一种或多种粒子，这一种或多种粒子包含一种或多种有效地编码组合物用于其表达的病毒、质粒或核酸分子载体(例如RNA)，其中该组合物包含：(A)I.第一调节组件，该第一调节组件有效作地连接到CRISPR-Cas系统嵌合RNA(chiRNA)多核苷酸序列上，其中该多核苷酸序列包含(a)能够杂交到真核细胞中的靶序列上的指导序列、(b)tracr配对序列、和(c)tracr序列，以及II.第二调节组件，该第二调节组件有效作地连接到编码CRISPR酶的酶编码序列上，该CRISPR酶包含至少一个或多个核定位序列(或者任选地至少一个或多个核定位序列，因为在一些实施例中可能不涉及NLS)，其中(a)、(b)和(c)以5’到3’方向排列，其中组分I和II位于该系统的相同或不同载体上，其中在转录时，该tracr配对序列杂交到该tracr序列上，并且该指导序列引导CRISPR复合物与该靶序列的序列特异性结合，并且其中该CRISPR复合物包含与(1)杂交到该靶序列上的指导序列、和(2)杂交到该tracr序列上的tracr配对序列复合的CRISPR酶，或者(B)非天然存在的或工程化的组合物，该组合物包含载体系统，该载体系统包含一种或多种载体，这一种或多种载体包含I.第一调节组件，该第一调节组件有效作地连接到(a)能够杂交到真核细胞中的靶序列上的指导序列、和(b)至少一种或多种tracr配对序列，II.第二调节组件，该第二调节组件有效作地连接到编码CRISPR酶的酶编码序列上，以及III.第三调节组件，该第三调节组件有效作地连接到tracr序列上，其中组分I、II和III位于该系统的相同或不同载体上，其中在转录时，该tracr配对序列杂交到该tracr序列上，并且该指导序列引导CRISPR复合物与该靶序列的序列特异性结合，并且其中该CRISPR复合物包含与(1)杂交到该靶序列上的指导序列、和(2)杂交到该tracr序列上的tracr配对序列复合的CRISPR酶；该方法还可以任选地包括递送HDR模板，例如经由使该粒子与含有该HDR模板的HSC接触或使该HSC与另一种含有该HDR模板的粒子接触，其中该HDR模板提供该蛋白的正常或较不异常形式的表达；其中“正常”是就野生型而论，并且“异常”是引起病症或疾病状态的蛋白质表达；并且任选地该方法可以包括从该生物或非人类生物分离或获得HSC，任选地扩增该HSC群，使一种或多种粒子与该HSC进行接触以获得修饰的HSC群，任选地扩增修饰的HSC群，并且任选地向该生物或非人类生物给予修饰的HSC。在一些实施例中，组分I、II和III位于相同载体上。在其他实施例中，组分I和II位于相同载体上，而组分III位于另一种载体上。在其他实施例中，组分I和III位于相同载体上，而组分II位于另一种载体上。在其他实施例中，组分II和III位于相同载体上，而组分I位于另一种载体上。在其他实施例中，组分I、II和III各自位于不同的载体上。本发明还提供了如本文所述的病毒或质粒载体系统。本发明还提供了用于在通过操纵HSC的感兴趣的基因组座位中的靶序列来这样修饰生物(例如，哺乳动物，包括人类或非人类哺乳动物或生物)中使用的根据本发明的工程化的CRISPR蛋白、复合物、组合物、系统、载体、细胞或细胞系，例如其中该感兴趣的基因组座位与和异常蛋白质表达或和疾病状况或状态相关联的突变相关，包括递送非天然存在的或工程化的组合物，例如经由使非天然存在的或工程化的组合物与该HSC接触。

通过操纵靶序列，申请人还打算靶序列的表观遗传操纵。这可以是靶序列的染色质状态的操纵，如借助于修饰靶序列的甲基化状态(即，甲基化或甲基化模式或CpG岛的添加或去除)、组蛋白修饰，从而增加或降低靶序列的可及性，或者借助于3D折叠。应当理解的是，在提及通过操纵在感兴趣的基因组座位中的靶序列来修饰生物或哺乳动物(包括人类或非人类哺乳动物或生物)的方法的情况下，这可适用于作为整体的生物(或哺乳动物)或者仅仅是来自这种生物的单个细胞或细胞群(如果该生物是多细胞的话)。在人类的情况下，例如，申请人特别地设想到单个细胞或细胞群，并且这些细胞可以优选地进行离体修饰，进而重新引入。在这种情况下，活组织检查或其他组织或生物流体样品可以必要的。在这方面，干细胞也是特别优选的。但是，当然还设想了体内实施例。并且本发明就HSC而言是尤其有利的。

在一些实施例中，本发明包括通过操纵HSC中的感兴趣的基因组座位中的DNA双链体的相对链上的第一靶序列和第二靶序列来修饰生物或非人类生物的方法，例如其中该感兴趣的基因组座位与和异常蛋白质表达或和疾病状况或状态相关联的突变相关，该方法包括例如通过使HSC与一种或多种包含非天然存在的或工程化的组合物的粒子接触来递送，该组合物包含：

I.第一CRISPR-Cas系统嵌合RNA(chiRNA)多核苷酸序列，其中该第一多核苷酸序列包含：

(a)第一指导序列，该第一指导序列能够杂交到该第一靶序列上，

(b)第一tracr配对序列，和

(c)第一tracr序列，

II.第二CRISPR-Cas系统chiRNA多核苷酸序列，其中该第二多核苷酸序列包含：

(a)第二指导序列，该第二指导序列能够杂交到该第二靶序列上，

(b)第二tracr配对序列，和

(c)第二tracr序列，并且

III.编码CRISPR酶的多核苷酸序列，该CRISPR酶包含至少一个或多个核定位序列并且包含一个或多个突变，其中(a)、(b)和(c)以5’到3’方向排列；或者

IV.I.至III.中的一者或多者(例如，该第一tracr配对序列和该第二tracr配对序列)的一种或多种表达产物，该CRISPR酶；

其中当转录时，该第一tracr配对序列和该第二tracr配对序列分别杂交到该第一tracr序列和第二tracr序列上并且该第一指导序列和该第二指导序列分别指导第一CRISPR复合物和第二CRISPR复合物与该第一靶序列和第二靶序列的序列特异性结合，其中该第一CRISPR复合物包含与(1)杂交到该第一靶序列上的第一指导序列、和(2)杂交到该第一tracr序列上的第一tracr配对序列复合的CRISPR酶，其中该第二CRISPR复合物包含与(1)杂交到该第二靶序列上的第二指导序列、和(2)杂交到该第二tracr序列上的第二tracr配对序列复合的CRISPR酶，其中编码CRISPR酶的多核苷酸序列是DNA或RNA，并且其中该第一指导序列指导邻近该第一靶序列的DNA双链体的一条链的切割并且该第二指导序列指导邻近该第二靶序列的另一条链的切割，从而诱导双链断裂，由此修饰该生物或该非人类生物；并且该方法还可以任选地包括递送HDR模板，例如经由使该粒子与含有该HDR模板的HSC接触或使该HSC与另一种含有该HDR模板的粒子接触，其中该HDR模板提供该蛋白的正常或较不异常形式的表达；其中“正常”是就野生型而论，并且“异常”是引起病症或疾病状态的蛋白质表达；并且任选地该方法可以包括从该生物或非人类生物分离或获得HSC，任选地扩增该HSC群，使一种或多种粒子与该HSC进行接触以获得修饰的HSC群，任选地扩增修饰的HSC群，并且任选地向该生物或非人类生物给予修饰的HSC。在本发明的一些方法中，编码CRISPR酶的多核苷酸序列、该第一和第二指导序列、该第一和第二tracr配对序列或该第一和第二tracr序列中的任一者或全部是RNA。在本发明另外的实施例中，编码CRISPR酶的编码序列的多核苷酸、该第一和第二指导序列、该第一和第二tracr配对序列或该第一和第二tracr序列是RNA，并且是经由脂质体、纳米粒子、外排体、微囊泡、或基因枪递送的；但是，有利的是经由粒子递送。在本发明的某些实施例中，该第一和第二tracr配对序列共享100％的一致性和/或该第一和第二tracr序列共享100％的一致性。在一些实施例中，这些多核苷酸可以被包含在含有一种或多种载体的载体系统中。在本发明的优选实施例中，该CRISPR酶是Cas9酶，例如SpCas9。在本发明的一个方面，该CRISPR酶在催化结构域中包含一个或多个突变，其中关于SpCas9，这一个或多个突变选自下组，该组由以下各项组成：D10A、E762A、H840A、N854A、N863A和D986A，例如D10A突变。在优选的实施例中，该第一CRISPR酶具有一个或多个突变，使得该酶是互补链切口酶，并且该第二CRISPR酶具有一个或多个突变，使得该酶是非互补链切口酶。可替代地，该第一酶可以是非互补链切口酶，而该第二酶可以是互补链切口酶。在本发明的优选方法中，该第一指导序列引导邻近该第一靶序列的DNA双链体的一条链的切割并且该第二指导序列引导邻近该第二靶序列的另一条链的切割从而产生5’突出端。在本发明的实施例中，该5’突出端具有至多200个碱基对、优选至多100个碱基对、或更优选至多50个碱基对。在本发明的实施例中，该5’突出端具有至少26个碱基对、优选至少30个碱基对、或更优选34-50个碱基对。本发明还提供了用于在通过操纵HSC中的感兴趣的基因组座位中的DNA双链体的相对链上的第一靶序列和第二靶序列来这样修饰生物或非人类生物中使用的根据本发明的工程化的CRISPR蛋白、复合物、组合物、系统、载体、细胞或细胞系，例如其中该感兴趣的基因组座位与和异常蛋白质表达或和疾病状况或状态相关联的突变相关，包括例如通过使HSC与一种或多种包含非天然存在的或工程化的组合物的粒子接触来递送。

I.第一调节组件，该第一调节组件有效作地连接至

(a)第一指导序列，该第一指导序列能够杂交到该第一靶序列上，和

(b)至少一种或多种tracr配对序列，

II.第二调节组件，该第二调节组件有效作地连接至

(a)第二指导序列，该第二指导序列能够杂交到该第二靶序列上，和

(b)至少一种或多种tracr配对序列，

III.第三调节组件，该第三调节组件有效作地连接至编码CRISPR酶的酶编码序列，以及

IV.第四调节组件，该第四调节组件有效作地连接至tracr序列，

V.I.至IV.中的一者或多者(例如，该第一tracr配对序列和该第二tracr配对序列)的一种或多种表达产物，该CRISPR酶；

其中组分I、II、III和IV位于该系统的相同或不同载体上，在转录时，该tracr配对序列杂交到该tracr序列上，并且该第一和第二指导序列分别指导第一和第二CRISPR复合物与该第一和第二靶序列的序列特异性结合，其中该第一CRISPR复合物包含与(1)杂交到该第一靶序列上的第一指导序列、和(2)杂交到该tracr序列上的该tracr配对序列复合的CRISPR酶，其中该第二CRISPR复合物包含与(1)杂交到该第二靶序列上的第二指导序列、和(2)杂交到该tracr序列上的该tracr配对序列复合的CRISPR酶，其中编码CRISPR酶的多核苷酸序列是DNA或RNA，并且其中该第一指导序列指导邻近该第一靶序列的DNA双链体的一条链的切割，并且该第二指导序列指导邻近该第二靶序列的另一条链的切割，从而诱导双链的断裂，由此修饰该生物或非人类生物；并且该方法还可以任选地包括递送HDR模板，例如经由使该粒子与含有该HDR模板的HSC接触或使该HSC与另一种含有该HDR模板的粒子接触，其中该HDR模板提供该蛋白的正常或较不异常形式的表达；其中“正常”是就野生型而论，并且“异常”是引起病症或疾病状态的蛋白质表达；并且任选地该方法可以包括从该生物或非人类生物分离或获得HSC，任选地扩增该HSC群，使一种或多种粒子与该HSC进行接触以获得修饰的HSC群，任选地扩增修饰的HSC群，并且任选地向该生物或非人类生物给予修饰的HSC。本发明还提供了用于在通过操纵HSC中的感兴趣的基因组座位中的DNA双链体的相对链上的第一靶序列和第二靶序列来这样修饰生物或非人类生物中使用的根据本发明的工程化的CRISPR蛋白、复合物、组合物、系统、载体、细胞或细胞系，例如其中该感兴趣的基因组座位与和异常蛋白质表达或和疾病状况或状态相关联的突变相关，包括例如通过使HSC与一种或多种包含非天然存在的或工程化的组合物的粒子接触来递送。

本发明还提供了如本文所述的载体系统。该系统可以包含一种、二种、三种或四种不同的载体。组分I、II、III和IV因此可以被定位在一种、两种、三种或四种不同的载体上，并且在此设想了针对这些组分的可能位置的所有组合，例如：组分I、II、III和IV可以位于相同载体上；组分I、II、III和IV可以各自位于不同的载体上；组分I、II、III和IV可以位于总计两种或三种不同载体上，其中设想了位置的所有组合，等。在本发明的一些方法中，编码CRISPR酶的多核苷酸序列、该第一指导序列和该第二指导序列、该第一tracr配对序列和该第二tracr配对序列或该第一tracr序列和该第二tracr序列中的任一者或全部是RNA。在本发明另外的实施例中，该第一和第二tracr配对序列共享100％的一致性和/或该第一和第二tracr序列共享100％的一致性。在本发明的优选实施例中，该CRISPR酶是Cas9酶，例如SpCas9。在本发明的一个方面，该CRISPR酶在催化结构域中包含一个或多个突变，其中关于SpCas9，这一个或多个突变选自下组，该组由以下各项组成：D10A、E762A、H840A、N854A、N863A和D986A；例如，D10A突变。在优选的实施例中，该第一CRISPR酶具有一个或多个突变，使得该酶是互补链切口酶，并且该第二CRISPR酶具有一个或多个突变，使得该酶是非互补链切口酶。可替代地，该第一酶可以是非互补链切口酶，而该第二酶可以是互补链切口酶。在本发明的一个另外的实施例中，这些病毒载体的一种或多种可以经由脂质体、纳米粒子、外排体、微囊泡、或基因枪进行递送；但是，粒子递送是有利的。

在本发明的优选方法中，第一指导序列引导邻近该第一靶序列的DNA双链体的一条链的切割并且第二指导序列引导邻近该第二靶序列的另一条链的切割从而产生5’突出端。在本发明的实施例中，该5’突出端具有至多200个碱基对、优选至多100个碱基对、或更优选至多50个碱基对。在本发明的实施例中，该5’突出端具有至少26个碱基对、优选至少30个碱基对、或更优选34-50个碱基对。

在一些实施例中，本发明包括修饰HSC中的感兴趣的基因组座位的方法，例如其中该感兴趣的基因组座位与和异常蛋白质表达或和疾病状况或状态相关联的突变相关，通过引入该HSC中，例如通过使HSC与一种或多种粒子接触，这一种或多种粒子包含具有一个或多个突变和两种指导RNA的Cas蛋白，这两种指导RNA分别靶向该HSC中的DNA分子的第一链和第二链，由此这些指导RNA靶向该DNA分子并且该Cas蛋白使该DNA分子的第一链和第二链的每一者产生切口，由此改变该HSC中的靶标；并且，其中该Cas蛋白和这两种指导RNA并不天然地一起存在，并且该方法还可以任选地包括递送HDR模板，例如经由使该粒子与含有该HDR模板的HSC接触或使该HSC与另一种含有该HDR模板的粒子接触，其中该HDR模板提供该蛋白的正常或较不异常形式的表达；其中“正常”是就野生型而论，并且“异常”是引起病症或疾病状态的蛋白质表达；并且任选地该方法可以包括从该生物或非人类生物分离或获得HSC，任选地扩增该HSC群，使一种或多种粒子与该HSC进行接触以获得修饰的HSC群，任选地扩增修饰的HSC群，并且任选地向该生物或非人类生物给予修饰的HSC。在本发明的优选方法中，该Cas蛋白使该DNA分子的第一链和第二链的每一者产生切口导致5’突出端。在本发明的实施例中，该5’突出端具有至多200个碱基对、优选至多100个碱基对、或更优选至多50个碱基对。在本发明的实施例中，该5’突出端具有至少26个碱基对、优选至少30个碱基对、或更优选34-50个碱基对。本发明的实施例还包括包含融合到tracr配对序列和tracr序列上的指导序列的指导RNA。在本发明的一个方面，该Cas蛋白经密码子优化以便在真核细胞，优选哺乳动物细胞或人类细胞中表达。在本发明另外的实施例中，该Cas蛋白是II型CRISPR-Cas蛋白，例如Cas 9蛋白。在一个高度优选的实施例中，该Cas蛋白是Cas9蛋白，例如SpCas9或SaCas9。在本发明的方面中，就SpCas9而言，该Cas蛋白具有一个或多个选自下组的突变，该组由以下各项组成：D10A、E762A、H840A、N854A、N863A和D986A；例如，D10A突变。本发明的方面涉及被减少的基因产物或被进一步引入到编码基因产物的DNA分子中的模板多核苷酸或通过允许两个5’突出端重新退火并连接而被精确切断的间插序列的表达、或被改变的基因产物的活性或功能、或被增加的基因产物的表达。在本发明的一个实施例中，该基因产物是蛋白质。

在一些实施例中，本发明包括修饰HSC中的感兴趣的基因组座位的方法，例如其中该感兴趣的基因组座位与和异常蛋白质表达或和疾病状况或状态相关联的突变相关，通过引入该HSC中，例如通过使HSC与一种或多种粒子接触，这一种或多种粒子包含，

a)第一调节组件，该第一调节组件有效作地连接到两种CRISPR-Cas系统指导RNA的每一者，这两种指导RNA分别靶向该HSC的双链DNA分子的第一链和第二链，和

b)第二调节组件，该第二调节组件有效作地连接至Cas蛋白，或

c)a)或b)的一种或多种表达产物，

其中组分(a)和(b)位于该系统的相同或不同载体上，由此这些指导RNA靶向该HSC的DNA分子，并且该Cas蛋白使该HSC的DNA分子的第一链和第二链的每一者产生切口；并且，其中该Cas蛋白和这两个指导RNA并不天然地一起存在；并且该方法还可以任选地包括递送HDR模板，例如经由使该粒子与含有该HDR模板的HSC接触或使该HSC与另一种含有该HDR模板的粒子接触，其中该HDR模板提供该蛋白的正常或较不异常形式的表达；其中“正常”是就野生型而论，并且“异常”是引起病症或疾病状态的蛋白质表达；并且任选地该方法可以包括从该生物或非人类生物分离或获得HSC，任选地扩增该HSC群，使一种或多种粒子与该HSC进行接触以获得修饰的HSC群，任选地扩增修饰的HSC群，并且任选地向该生物或非人类生物给予修饰的HSC。在本发明的方面中，这些指导RNA可包含融合到tracr配对序列和tracr序列上的指导序列。在本发明的一个实施例中，该Cas蛋白是II型CRISPR-Cas蛋白。在本发明的一个方面，该Cas蛋白经密码子优化以便在真核细胞，优选哺乳动物细胞或人类细胞中表达。在本发明另外的实施例中，该Cas蛋白是II型CRISPR-Cas蛋白，例如Cas 9蛋白。在一个高度优选的实施例中，该Cas蛋白是Cas9蛋白，例如SpCas9或SaCas9。在本发明的方面中，关于SpCas9，该Cas蛋白具有一个或多个选自下组的突变，该组由以下各项组成：D10A、E762A、H840A、N854A、N863A和D986A；例如，D10A突变。本发明的方面涉及被减少的基因产物或被进一步引入到编码基因产物的DNA分子中的模板多核苷酸或通过允许两个5’突出端重新退火并连接而被精确切断的间插序列的表达、或被改变的基因产物的活性或功能、或被增加的基因产物的表达。在本发明的一个实施例中，该基因产物是蛋白质。在本发明的优选实施例中，该系统的这些载体是病毒载体。在一个另外的实施例中，该系统的这些载体经由脂质体、纳米粒子、外排体、微囊泡、或基因枪进行递送；并且粒子是优选的。在一个方面，本发明提供了修饰HSC中的靶多核苷酸的方法。在一些实施例中，该方法包括允许CRISPR复合物结合到该靶多核苷酸上以实施所述靶多核苷酸的切割，由此修饰该靶多核苷酸，其中该CRISPR复合物包括与杂交到在所述靶多核苷酸内的靶序列上的指导序列复合的CRISPR酶，其中所述指导序列连接到tracr配对序列上，该tracr配对序列进而杂交到tracr序列上。在一些实施例中，所述切割包括通过所述CRISPR酶切割在该靶序列位置的一条或两条链。在一些实施例中，所述切割导致靶基因的转录降低。在一些实施例中，该方法进一步包括通过与外源模板多核苷酸同源重组修复所述切割的靶多核苷酸，其中所述修复导致突变，包括所述靶多核苷酸的一个或多个核苷酸的插入、缺失、或取代。在一些实施例中，所述突变导致在从包含该靶序列的基因表达的蛋白质中的一个或多个氨基酸改变。在一些实施例中，该方法进一步包括将一种或多种载体或其一种或多种表达产物例如经由一种或多种粒子递送到所述HSC中，其中这一种或多种载体驱动下列一者或多者的表达：该CRISPR酶、连接到该tracr配对序列上的指导序列、和该tracr序列。在一些实施例中，所述载体被递送到受试者体内的HSC中。在一些实施例中，所述修饰发生在细胞培养物中的所述HSC中。在一些实施例中，该方法进一步包括在所述修饰之前从受试者体内分离所述HSC。在一些实施例中，该方法进一步包括使所述HSC和/或从中衍生的细胞返回到所述受试者体内。

在一个方面，本发明提供了产生包含突变的疾病基因的HSC的方法。在一些实施例中，疾病基因是与患有或产生疾病的风险的增加相关联的任何基因。在一些实施例中，该方法包括(a)将一种或多种载体或其一种或多种表达产物例如经由一种或多种粒子引入HSC中，其中这一种或多种载体驱动下列一者或多者的表达：CRISPR酶、连接到tracr配对序列上的指导序列、和tracr序列；并且(b)允许CRISPR复合物结合到靶多核苷酸上以实施在所述疾病基因内的该靶多核苷酸的切割，其中该CRISPR复合物包含与(1)杂交到该靶多核苷酸内的靶序列上的指导序列、和(2)杂交到该tracr上的tracr配对序列复合的CRISPR酶，由此产生包含突变的疾病基因的HSC。在一些实施例中，所述切割包括通过所述CRISPR酶切割在该靶序列位置的一条或两条链。在一些实施例中，所述切割导致靶基因的转录降低。在一些实施例中，该方法进一步包括通过与外源模板多核苷酸同源重组修复所述切割的靶多核苷酸，其中所述修复导致突变，包括所述靶多核苷酸的一个或多个核苷酸的插入、缺失、或取代。在一些实施例中，所述突变导致在从包含该靶序列的基因表达的蛋白质中的一个或多个氨基酸改变。在一些实施例中，向动物给予该修饰的HSC，以由此产生动物模型。

在一个方面，本发明提供了修饰HSC中的靶多核苷酸的方法。还提供了用于在修饰HSC中的靶多核苷酸中使用的根据本发明的工程化的CRISPR蛋白、复合物、组合物、系统、载体、细胞或细胞系。在一些实施例中，该方法包括允许CRISPR复合物结合到该靶多核苷酸上以实施所述靶多核苷酸的切割，由此修饰该靶多核苷酸，其中该CRISPR复合物包括与杂交到在所述靶多核苷酸内的靶序列上的指导序列复合的CRISPR酶，其中所述指导序列连接到tracr配对序列上，该tracr配对序列进而杂交到tracr序列上。在其他实施例中，本发明提供了修饰多核苷酸在真核细胞中的表达的方法，该真核细胞产生自HSC。该方法包括通过使用结合到多核苷酸上的CRISPR复合物增加或降低靶多核苷酸在该HSC中的表达；有利地，该CRISPR复合物经由一种或多种粒子递送。

在一些方法中，可以使靶多核苷酸失活以实施HSC中的表达的修饰。例如，当CRISPR复合物结合到细胞中的靶序列上时，该靶多核苷酸失活，这样使得该序列不被转录，该编码蛋白不被产生，或者该序列不会像野生型序列一样起作用。

在一些实施例中，可以修饰该CRISPR-Cas系统的RNA，例如指导或sgRNA；例如以包括适配体或功能结构域。适配体是结合至特定靶分子的合成寡核苷酸；例如已经通过重复循环的体外选择或SELEX(指数富集配体系统进化法)被工程化为结合至不同分子靶标(如小分子、蛋白质、核酸)以及甚至细胞、组织和生物的核酸分子。适配体是有用的，因为它们提供与抗体的分子识别竞争的分子识别特性。除了其有差别的识别之外，适配体提供优于抗体的优点，包括它们在治疗性应用中引起很少或不引起免疫原性。因此，在本发明的实践中，该酶或该RNA中的任一者或二者可以包括功能结构域。

在一些实施例中，该功能结构域是转录激活结构域，优选VP64。在一些实施例中，该功能结构域是转录阻遏结构域，优选KRAB。在一些实施例中，该转录阻遏结构域是SID、或SID的多联体(例如SID4X)。在一些实施例中，该功能结构域是表观遗传修饰结构域，从而提供了表观遗传修饰酶。在一些实施例中，该功能结构域是激活结构域，其可以是P65激活结构域。在一些实施例中，该功能结构域包括核酸酶活性。在一个这样的实施例中，该功能结构域包括Fok1。

本发明还提供了体外或离体细胞，该细胞包含以上描述的任何经修饰的CRISPR酶、组合物、系统或复合物，或来自以上描述的任何方法。该细胞可以是真核细胞或原核细胞。本发明还提供了此类细胞的子代。本发明还提供了任何这样的细胞或任何这样的子代的产物，其中该产物是如通过CRISPR复合物的经修饰的CRISPR酶修饰的所述一个或多个靶座位的产物。该产物可以是肽、多肽或蛋白质。可以通过该CRISPR复合物的经修饰的CRISPR酶来修饰一些这样的产物。在一些这样的经修饰的产物中，靶座位的产物与所述靶座位的产物在物理性质上不同，所述靶座位尚未通过所述经修饰的CRISPR酶进行修饰。

本发明还提供了包含编码以上描述的任何非天然存在的CRISPR酶的多核苷酸序列的多核苷酸分子。

任何这样的多核苷酸都可以进一步包含一种或多种调节组件，这一种或多种调节组件有效作地连接至编码该非天然存在的CRISPR酶的多核苷酸序列。

在包含一种或多种调节组件的任何这样的多核苷酸中，这一种或多种调节组件可以被有效地配置用于在真核细胞中表达该非天然存在的CRISPR酶。该真核细胞可以是人类细胞。该真核细胞可以是啮齿动物细胞，任选地是小鼠细胞。该真核细胞可以是酵母细胞。该真核细胞可以是中国仓鼠卵巢(CHO)细胞。该真核细胞可以是昆虫细胞。

在包含一种或多种调节组件的任何这样的多核苷酸中，这一种或多种调节组件可以被有效地配置用于在原核细胞中表达该非天然存在的CRISPR酶。

在包含一种或多种调节组件的任何这样的多核苷酸中，这一种或多种调节组件可以被有效地配置用于在体外系统中表达该非天然存在的CRISPR酶。

本发明还提供了包含以上描述的任何多核苷酸分子的表达载体。本发明还提供了一种或多种这样的多核苷酸分子(例如被有效地配置成表达蛋白的这样的多核苷酸分子)和/或一种或多种核酸组分，以及一种或多种这样的载体。

本发明进一步提供了对Cas9或作为SaCas9和/或SpCas9的直向同源物的突变的或修饰的Cas9作出突变的方法，该方法包括确定该直向同源物中的可能很靠近或可能触碰核酸分子(例如，DNA、RNA、sgRNA等)的一个或多个氨基酸、和/或供修饰和/或突变的类似于或对应于本文鉴定的SaCas9和/或SpCas9中的一个或多个氨基酸的一个或多个氨基酸，并且合成或制备或表达该直向同源物，该直向同源物包括如本文讨论的一种或多种修饰和/或一个或多个突变、由其组成或基本上由其组成，例如将中性氨基酸修饰(例如，改变或突变)为带电的(例如，带正电的)氨基酸，例如从丙氨酸到例如赖氨酸。如此修饰的直向同源物可以用在CRISPR-Cas系统中；并且表达它的一种或多种核酸分子可以用在递送分子或编码如本文讨论的CRISPR-Cas系统组分的载体或其他递送系统中。

本发明还提供了用于在对Cas9或作为SaCas9和/或SpCas9的直向同源物的突变的或修饰的Cas9作出突变中使用的根据本发明的工程化的CRISPR蛋白、复合物、组合物、系统、载体、细胞或细胞系，包括确定该直向同源物中的可能很靠近或可能触碰核酸分子(例如，DNA、RNA、sgRNA)的一个或多个氨基酸、和/或供修饰和/或突变的类似于或对应于本文鉴定的SaCas9和/或SpCas9中的一个或多个氨基酸的一个或多个氨基酸，并且合成或制备或表达该直向同源物，该直向同源物包括如本文讨论的一种或多种修饰和/或一个或多个突变、由其组成或基本上由其组成，例如将中性氨基酸修饰(例如，改变或突变)为带电的(例如，带正电的)氨基酸，例如从丙氨酸到例如赖氨酸。

在一个方面，本发明提供了有效的中靶活性并且最小化了脱靶活性。在一个方面，本发明提供了由CRISPR蛋白进行的有效的中靶切割并且最小化了由该CRISPR蛋白进行的脱靶切割。在一个方面，本发明提供了CRISPR蛋白在基因座位处的指导特异性结合而没有DNA切割。在一个方面，本发明提供了CRISPR蛋白在基因座位处的有效的指导引导的中靶结合并且最小化了该CRISPR蛋白的脱靶结合。因此，在一个方面，本发明提供了靶标特异性基因调节。在一个方面，本发明提供了CRISPR酶在基因座位处的指导特异性结合而没有DNA切割。因此，在一个方面，本发明使用单一CRISPR酶提供了一个基因座位处的切割和不同基因座位处的基因调节。在一个方面，本发明使用一种或多种CRISPR蛋白和/或酶提供了多个靶标的正交激活和/或抑制和/或切割。

在另一个方面，本发明提供了离体地或在体内对细胞池的基因组中的基因进行功能筛选的方法，该方法包括给予或表达包含多种CRISPR-Cas系统指导RNA(sgRNA)的文库，并且其中该筛选进一步包括使用CRISPR酶，其中该CRISPR复合物被修饰成包括异源功能结构域。在一个方面，本发明提供了用于筛选基因组的方法，该方法包括向宿主给予文库或在宿主的体内表达文库。在一个方面，本发明提供了如本文讨论的方法，该方法进一步包括给予该宿主的或在该宿主中表达的激活因子。在一个方面，本发明提供了如本文讨论的方法，其中该激活因子附接至CRISPR蛋白。在一个方面，本发明提供了如本文讨论的方法，其中该激活因子附接至该CRISPR蛋白的N末端或C末端。在一个方面，本发明提供了如本文讨论的方法，其中该激活因子附接至sgRNA环。在一个方面，本发明提供了如本文讨论的方法，该方法进一步包括给予该宿主的或在该宿主中表达的阻遏因子。在一个方面，本发明提供了如本文讨论的方法，其中该筛选包括在该座位中影响并检测基因激活、基因抑制、或切割。

在一个方面，本发明提供了如本文讨论的方法，其中该宿主是真核细胞。在一个方面，本发明提供了如本文讨论的方法或用途，其中该宿主是哺乳动物细胞。在一个方面，本发明提供了如本文讨论的方法，其中该宿主是非人类真核生物细胞。在一个方面，本发明提供了如本文讨论的方法，其中该非人类真核生物细胞是非人类哺乳动物细胞。在一个方面，本发明提供了如本文讨论的方法，其中该非人类哺乳动物细胞可以是包括但不限于灵长类动物的、牛的、绵羊的、猪的、犬的、啮齿动物的、兔科的，如猴、奶牛、绵羊、猪、狗、兔、大鼠或小鼠细胞。在一个方面，本发明提供了如本文讨论的方法或用途，该细胞可以是非哺乳动物真核细胞，如家禽(例如，鸡)、脊椎鱼类(例如，鲑鱼)或贝类(例如，牡蛎、蛤蜊、龙虾、虾)细胞。在一个方面，本发明提供了如本文讨论的方法或用途，该非人类真核生物细胞是植物细胞。该植物细胞可以属于单子叶植物或双子叶植物或者属于作物或谷物植物，如木薯、玉米、高粱、大豆、小麦、燕麦或水稻。该植物细胞还可以属于藻类、树木或生产植物、水果或蔬菜(例如，树木，如柑橘树，例如橙树、葡萄柚树或柠檬树；桃树或油桃树；苹果树或梨树；坚果树，如杏仁树或胡桃树或阿月浑子树；茄属植物；芸薹属的植物；莴苣属的植物；菠菜属的植物；辣椒属的植物；棉花、烟草、芦笋、胡萝卜、卷心菜、西兰花、花椰菜、西红柿、茄子、胡椒、莴苣、菠菜、草莓、蓝莓、覆盆子、黑莓、葡萄、咖啡、可可等)。

在一个方面，本发明提供了如本文讨论的方法，该方法包括递送CRISPR-Cas复合物或其一种或多种组分或对其进行编码的一种或多种核酸分子，其中所述一种或多种核酸分子被操作性地连接至一个或多个调节序列并且在体内进行表达。在一个方面，本发明提供了如本文讨论的方法，其中该体内表达是经由慢病毒、腺病毒、或AAV。在一个方面，本发明提供了如本文讨论的方法，其中该递送是经由粒子、纳米粒子、脂质或细胞穿透肽(CPP)。

在一个方面，本发明提供了一对CRISPR-Cas复合物，各自包含指导RNA(sgRNA)，该sgRNA包含能够杂交到细胞中的感兴趣的基因组座位中的靶序列上的指导序列，其中每个sgRNA的至少一个环通过插入一个或多个不同的RNA序列而被修饰，这一个或多个RNA序列结合至一种或多种衔接蛋白，并且其中该衔接蛋白与一个或多个功能结构域缔合，其中每个CRISPR-Cas的每个sgRNA都包含具有DNA切割活性的功能结构域。在一个方面，本发明提供了如本文讨论的成对的CRISPR-Cas复合物，其中DNA切割活性是由于Fok1核酸酶。

在一个方面，本发明提供了用于切割感兴趣的基因组座位中的靶序列的方法，该方法包括向细胞递送CRISPR-Cas复合物或其一种或多种组分或对其进行编码的一种或多种核酸分子，其中所述一种或多种核酸分子被操作性地连接至一个或多个调节序列并且在体内进行表达。在一个方面，本发明提供了如本文讨论的方法，其中该递送是经由慢病毒、腺病毒、或AAV。在一个方面，本发明提供了如本文讨论的方法或如本文讨论的成对的CRISPR-Cas复合物，其中该对复合物的第一复合物的靶序列在双链DNA的第一链上，并且该对复合物的第二复合物的靶序列在双链DNA的第二链上。在一个方面，本发明提供了如本文讨论的方法或如本文讨论的成对的CRISPR-Cas复合物，其中该第一和第二复合物的靶序列彼此邻近，这样使得以有助于同源定向修复的方式切割该DNA。在一个方面，本文的方法可以进一步包括向该细胞中引入模板DNA。在一个方面，可以涉及本文的方法或本文的成对的CRISPR-Cas复合物，其中每个CRISPR-Cas复合物都具有突变的CRISPR酶，这样使得它具有不超过约5％的未被突变的CRISPR酶的核酸酶活性。

在一个方面，本发明提供了如本文讨论的文库、方法或复合物，其中该sgRNA被修饰成具有至少一个非编码功能环，例如其中这至少一个非编码功能环是阻遏性的；例如，其中这至少一个非编码功能环包含Alu。

在一个方面，本发明提供了用于改变或修饰基因产物表达的方法。所述方法可以包括向含有并表达编码该基因产物的DNA分子的细胞中引入工程化的、非天然存在的CRISPR-Cas系统，该系统包含Cas蛋白和靶向该DNA分子的指导RNA，由此该指导RNA靶向编码该基因产物的DNA分子，并且该Cas蛋白切割编码该基因产物的DNA分子，由此改变该基因产物的表达；并且，其中该Cas蛋白和该指导RNA并不天然地一起存在。本发明包括含有融合到tracr序列上的指导序列的指导RNA。本发明进一步包括经密码子优化以便在真核细胞中表达的Cas蛋白。在一个优选实施例中，该真核细胞是哺乳动物细胞，并且在一个更优选的实施例中，该哺乳动物细胞是人类细胞。在本发明的一个另外的实施例中，该基因产物的表达被降低。

本发明还提供了用于在改变哺乳动物细胞中的感兴趣的基因组座位的表达中使用的如本文定义的工程化的CRISPR蛋白、复合物、组合物、系统、载体、细胞或细胞系。本发明还提供了工程化的CRISPR蛋白、复合物、组合物、系统、载体、细胞或细胞系用于制备改变哺乳动物细胞中的感兴趣的基因组座位的表达的药剂的用途。所述改变优选包括使该细胞与本发明的工程化的CRISPR蛋白、复合物、组合物、系统、载体、细胞或细胞系接触并且由此递送载体并且允许形成CRISPR-Cas复合物并结合至靶标。所述改变进一步优选包括确定该基因组座位的表达是否已发生改变。

在一个方面，本发明提供了经改变的细胞和那些细胞的子代，以及由这些细胞制成的产品。使用本发明的CRISPR-Cas9蛋白和系统来产生包含经修饰的靶座位的细胞。在一些实施例中，该方法可以包括允许靶向核酸的复合物结合到靶DNA或RNA以实现所述靶DNA或RNA的切割，由此修饰该靶DNA或RNA，其中靶向核酸的该复合物包含与指导RNA复合的靶向核酸的效应蛋白，该指导RNA杂交到所述靶DNA或RNA内的靶序列上。在一个方面，本发明提供了修复细胞中的基因座位的方法。在另一个方面，本发明提供了修饰DNA或RNA在真核细胞中的表达的方法。在一些实施例中，该方法包括允许靶向核酸的复合物结合至该DNA或RNA，这样使得所述结合导致所述DNA或RNA的表达增加或降低；其中靶向核酸的该复合物包含与指导RNA复合的靶向核酸的效应蛋白。类似的考虑因素和条件适用如上文针对修饰靶DNA或RNA的方法。事实上，这些取样、培养和重新引入选择跨本发明的多个方面而适用。在一个方面，本发明提供了修饰真核细胞中的靶DNA或RNA的方法，这些方法可以在体内、离体地或在体外。在一些实施例中，该方法包括对来自人或非人动物的细胞或细胞群进行取样，并且修饰该细胞或这些细胞。培养可以发生在离体的任何阶段。此类细胞可以是但不限于植物细胞，动物细胞，任何生物的特定细胞类型，包括干细胞、免疫细胞、T细胞、B细胞、树突细胞、心血管细胞、上皮细胞、干细胞等。这些细胞可以根据本发明进行修饰，以产生例如受控量的基因产物，取决于用途，这些量可以是增加的或减少的，和/或进行突变。在某些实施例中，修复该细胞的基因座位。该细胞或这些细胞甚至可以被重新引入该非人动物或植物中。对于重新引入的细胞，可以优选的是这些细胞是干细胞。

在一个方面，本发明提供了暂时包含CRISPR系统或组分的细胞。例如，为细胞暂时提供CRISPR蛋白或酶和核酸并且改变基因座位，随后该CRISPR系统的一种或多种组分的量是下降的。随后，已经获得了CRISPR介导的遗传改变的细胞、细胞的子代和包含这些细胞的生物包括减少的量的一种或多种CRISPR系统组分，或不再含有这一种或多种CRISPR系统组分。一个非限制性实例是自行失活性CRISPR-Cas系统，如本文进一步描述的。因此，本发明提供了以下细胞、和生物、以及这些细胞和生物的子代，它们包括一个或多个经CRISPR-Cas系统改变的基因座位，但是实质上缺乏一种或多种CRISPR系统组分。在某些实施例中，基本上不含这些CRISPR系统组分。此类细胞、组织和生物有利地包括希望的或选择的遗传改变，但是已经丢失CRISPR-Cas组分或其残余物，这些组分或其残余物可能潜在地非特异性地起作用、导致安全性问题、或阻碍监管部门批准。同样地，本发明提供了由这些细胞、生物、和这些细胞和生物的子代制成的产品。

本发明进一步提供了通过提供根据本发明的工程化的CRISPR蛋白来改进CRISPR系统的特异性的方法。优选地，工程化的CRISPR蛋白，其中

该蛋白与包含RNA的核酸分子复合，以形成CRISPR复合物，

其中当在该CRISPR复合物中时，该核酸分子靶向一个或多个靶多核苷酸座位，

该蛋白与未修饰的蛋白相比包括至少一种修饰，

其中与包含未修饰的蛋白的复合物相比，包含经修饰的蛋白的CRISPR复合物具有改变的活性。所述至少一种修饰优选在如本文描述的RuvC和/或HNH结构域中或在HNH与RuvC结构域之间的结合沟槽中。优选的修饰是如本文描述的突变。

本发明进一步提供了根据本发明的工程化的CRISPR蛋白改进CRISPR系统的特异性的用途。优选地，工程化的CRISPR蛋白

其中该蛋白与包含RNA的核酸分子复合，以形成CRISPR复合物，

其中该蛋白与未修饰的蛋白相比被修饰成包括至少一种修饰，

附图简述

本发明的新颖特征在所附权利要求书中具体提出。通过参考提出说明性实施例的以下详细说明，将获得对本发明的特征和优点的更好理解，在这些实施例中利用了本发明的原理，并且在这些附图中：

图1A-1B提供了示意图概述，对其应理解一位或多位申请人/发明人不必受本文或在任何具体图(包括图1)中列出的任何具体理论的束缚。该图讨论了结合至非靶向的gDNA链的带正电的残基的突变，由此改进特异性。示意性概述表中的数据如下并且是就SpCas9的突变而言的：

参考SpCas9的编号，图1A展示了沿着非靶向链沟槽分布的改进特异性的丙氨酸突变，例如Arg780、Lys810、Lys855、Lys848、Lys1003、Arg1060、Arg976、His982。不希望受任何一种具体理论的束缚，提议的机制是核酸酶活性是无活性的，直到非靶向的DNA链在空间上触发HNH构象变化；结合到HNH与RuvC之间的沟槽的非靶向的链取决于RNA:DNA配对；突变该沟槽中的DNA结合残基对适当的RNA:DNA配对提出了更多能量需求(图1B)。使用本文的(包括图1中的)信息，本领域技术人员可以容易地制备展现出改进的或降低的脱靶效应的其他Cas9(例如，不同于SpCas9)的突变体。例如，本文引用的文献提供了关于本文示例的SpCas9和SaCas9的众多直向同源物的信息。从该信息(包括那些其他Cas9的序列信息)，本领域普通技术人员可以通过本披露的信息容易地制备在除本文示例的SpCas9和SaCas9之外的Cas9直向同源物中具有减少的脱靶效应的类似突变体。另外，本文的文献提供了关于Cas9(例如，SpCas9)的晶体结构信息；并且可以容易地在晶体结构之间进行结构比较，例如在SpCas9的晶体结构与其直向同源物的晶体结构之间，以便在不进行过度实验的情况下同样容易地获得在除SpCas9之外的Cas9直向同源物中具有减少的脱靶效应的类似突变体。因此，本发明广泛适用于不同Cas9直向同源物中的一种或多种修饰或一个或多个突变，以减少脱靶效应，包括但不限于SpCas9和SaCas9。如本文进一步讨论的，可以容易地实现对以上描述的Cas9酶的另外的或进一步的修饰，由此与未修饰的酶相比，该CRISPR复合物中的酶具有增加的修饰一个或多个靶座位的能力。

图2A示出了经修饰的SpCas9酶的活性，如通过％INDEL形成所测量的。描绘了SpCas9的49种点突变体。EMX1.3的靶序列是EMX1基因的序列并且将活性与相关脱靶序列(OT 46)进行比较。

图2B示出了经修饰的SpCas9酶的活性，如通过％INDEL形成所测量的。描绘了SpCas9的49种点突变体。靶序列是VEGFA基因的序列并且将活性与两个相关脱靶序列(OT 1和OT 2)进行比较。

图2C示出了经修饰的SpCas9酶的活性，如通过％INDEL形成所测量的。靶序列是VEGFA基因的序列并且将活性与三个相关脱靶序列(OT 1、OT 4和OT 18)进行比较。

图3示出了经修饰的SpCas9酶的活性，如通过％INDEL形成所测量的。描绘了相对于脱靶序列展示出特异性的点突变体。靶序列是EMX1和VEGFA基因的序列并且将活性与九个相关脱靶序列进行比较。

图4A示出了经修饰的SpCas9酶的活性，如通过％INDEL形成所测量的。描绘了SpCas9的双突变体。靶序列是EMX1基因的序列并且将活性与两个相关脱靶序列进行比较。

图4B示出了经修饰的SpCas9酶的活性，如通过％INDEL形成所测量的。描绘了SpCas9的双突变体。靶序列是VEGFA基因的序列并且将活性与三个相关脱靶序列进行比较。

图5示出了经修饰的SpCas9酶的活性，如通过％INDEL形成所测量的。描绘了SpCas9的14种三突变体。靶序列是EMX1和VEGFA基因的序列并且将活性与四个相关脱靶序列(OT 46、OT 1、OT 4和OT 18)进行比较。

图6示出了经修饰的SaCas9酶的活性，如通过％INDEL形成所测量的。靶序列EMX101是EMX1基因的序列并且将活性与三个相关脱靶序列(OT1、OT2和OT3)进行比较。

图7示出了经修饰的SaCas9酶的活性，如通过％INDEL形成所测量的。EMX101的靶序列是EMX1的序列并且将活性与相关脱靶序列(OT3)进行比较。

图8A-8D示出了Cas基因的系统发生树；通过本文的传授和本领域的知识，所示例的SpCas9和SaCas9的一个或多个突变或一种或多种修饰可以应用于其他Cas9。

图9A-9F示出了揭示五个Cas9家族的系统发生分析，这五个家族包括三组大的Cas9(约1400个氨基酸)和两组小的Cas9(约1100个氨基酸)；通过本文的传授和本领域的知识，所示例的SpCas9和SaCas9的一个或多个突变或一种或多种修饰可以应用于其他Cas9(并且因此，跨图9的Cas9以及Cas9家族和组，本发明包括如本文所示例的就SpCas9和SaCas9而言的一种或多种修饰或一个或多个突变)。

图10A-10D示出了经修饰的SpCas9酶的活性，如通过％INDEL形成所测量的。图10A-C示出了靶序列EMX101、EMX1.1、EMX1.2、EMX1.3、EMX1.8、EMX1.10、DNMT1.1、DNMT1.2、DNMT1.4、DNMT1.7、VEGFA4、VEGFA5、和VEGFA3的活性。图10D示出了与脱靶序列OT4相比的VEGFA3活性。

图11A-11D示出了经修饰的SpCas9酶的活性，如通过％INDEL形成所测量的。图11A-C示出了靶序列EMX101、EMX1.1、EMX1.2、EMX1.3、EMX1.8、EMX1.10、DNMT1.1、DNMT1.2、DNMT1.4、DNMT1.7、VEGFA4、VEGFA5、和VEGFA3的活性。图11D示出了与脱靶序列OT4相比的VEGFA3活性。

图12示出了经修饰的SpCas9酶的活性，如通过％INDEL形成所测量的。靶序列是VEGFA3并且将活性与四个相关脱靶序列(OT1、OT2、OT4和OT18)进行比较。

图13示出了经修饰的SpCas9酶的活性，如通过％INDEL形成所测量的。靶序列是VEGFA3并且将活性与四个相关脱靶序列(OT1、OT2、OT4和OT18)进行比较。

图14示出了经修饰的SpCas9酶的活性，如通过％INDEL形成所测量的。描绘了SpCas9的14种点突变体。靶序列是EMX1.3并且将活性与五个相关脱靶序列(OT14、OT23、OE35、OT46和OT53)进行比较。

图15A-15F示出了SpCas9的结构方面和改进的特异性。图A是靶标解旋模型。RuvC(水鸭色)与HNH(品红色)结构域之间的nt-沟槽通过与非互补链的非特异性DNA相互作用而使DNA解旋稳定化。RNA:cDNA和Cas9:ncDNA相互作用驱动DNA解旋(顶部箭头)与cDNA:ncDNA再杂交(底部箭头)的竞争。图B：SpCas9(PDB ID 4UN3)的结构，示出了位于HNH(品红色)与RuvC(水鸭色)结构域之间的nt-沟槽。将非靶标DNA链(红色)手动地建模为nt-沟槽(插图)。图C：针对特异性改进，对丙氨酸点突变体的筛选。图D：在另外的脱靶座位处对靠前的点突变体的评估。将靠前的五种赋予特异性的突变体以红色突出显示。图E：与单点突变体相比，组合突变体改进特异性。eSpCas9(1.0)和eSpCas9(1.1)以红色突出显示。图F：对10个靶座位处的靠前的点突变体和组合突变体的针对中靶切割效率的筛选。SpCas9(K855A)、eSpCas9(1.0)、和eSpCas9(1.1)以红色突出显示。

图16A-16C示出了spCas9突变体对中靶效率的维持。图A示出了与针对被靶向9个基因组座位的24种sgRNA的SpCas9相比，SpCas9突变体的中靶切割效率的评估。图B是突变体SpCas9(K855A)、eSpCas9(1.0)和eSpCas9(1.1)的归一化的中靶indel形成的图基(Tukey)图。图C是使用抗SpCas9抗体的SpCas9和突变体的Western印迹。

图17A-17C示出了spCas9以及突变体K855A、eSpCas9(1.0)和eSpCas9(1.1)对指导RNA与靶DNA之间的单碱基和双碱基错配的敏感性。图A描绘了针对VEGFA靶标的错配的指导序列。图B提供了spCas9和三种突变体的热图，示出了用具有单碱基错配的指导序列产生的indel％。图C示出了用含有连续颠换错配的指导序列产生的indel形成。与野生型相比：eSpCas9(1.0)包括K810A、K1003A、R1060A；eSpCas9(1.1)包括K848A、K1003A、R1060A。

图18A-18F示出了突变体SpCas9(K855A)和eSpCas9(1.1)的无偏全基因组脱靶谱。图A是BLESS(直接原位断裂标记，在链霉亲和素上富集和下一代测序)工作流程的示意性提纲。图B示出了被映射到基因组的正向(红色)和反向(蓝色)读数的代表性BLESS测序。与DSB热点相比，映射在Cas9切割位点处的读数具有不同的形状。图C和D示出了使用靶向EMX1(1)(图C)和VEGFA(1)(图D)的指导物的由每种SpCas9突变体产生的全基因组DSB簇的曼哈顿(Manhattan)图。图E和F描绘了在BLESS中鉴定的脱靶位点的靶向的深度测序验证。脱靶位点按DSB得分排序(蓝色热图)。绿色热图指示了靶序列与脱靶序列之间的序列相似性。

图19示出了sgRNA指导的靶向和DNA解旋的示意图。Cas9通过一系列协调的步骤切割靶DNA。首先，PAM相互作用结构域识别靶DNA的5’的NGG序列。PAM结合之后，针对sgRNA:DNA互补性对靶序列的前10-12个核苷酸(种子序列)取样，一个依赖于DNA双链体分离的过程。如果种子序列核苷酸与sgRNA互补，则将DNA的其余部分解旋并且使全长的sgRNA与靶DNA链杂交。在这个模型中，RuvC(水鸭色)与HNH(品红色)结构域之间的nt-沟槽使非靶向的DNA链稳定化并且通过与DNA磷酸骨架的正电荷的非特异性相互作用有助于解旋。RNA:cDNA和Cas9:ncDNA相互作用驱动DNA解旋(顶部箭头)与cDNA:ncDNA再杂交(底部箭头)的竞争。

图20描绘了揭示出非靶标链沟槽的SpCas9的静电学。(A)与sgRNA和靶DNA配对的SpCas9的通过静电势着色以突出显示带正电的区域的晶体结构(4UN3)。标度是从-10至1keV。(B)与图(A)相同，其中HNH结构域被去除，以揭示sgRNA:DNA异源双链体。(C)通过以下结构域着色的晶体结构(与(A)处于相同的方向)：HNH(品红色)、RuvC(水鸭色)、和PAM相互作用(PI)(米色)。

图21A-21D示出了所产生的突变体的脱靶分析。产生了二十九种SpCas9点突变体并且针对在(A)EMX1靶位点和(B)两个VEGFA靶位点处的特异性对其进行测试。在(C)EMX1和(D)VEGFA处对组合了改进特异性的靠前的残基的突变体进行进一步测试。

图22A-22C提供了带注释的SpCas9氨基酸序列。改变非靶向的链沟槽电荷的SpCas9的突变主要在RuvC和HNH结构域(以黄色突出显示)之中。RuvC(青色)、桥螺旋(BH，绿色)、REC(灰色)、HNH(品红色)、和PI(米色)结构域是如在尼施马苏(Nishmasu)等人中所注释的。

图23示出了K855A、eSpCas9(1.0)和eSpCas9(1.1)与截短的sgRNA的特异性比较，并且指示SpCas9(1.0)和eSpCas9(1.1)作为用于改进特异性的策略胜过截短的sgRNA。在主要注释的并且预测的脱靶位点处对三个座位(EMX1(1)、VEGFA(1)和VEGFA(5))处的indel频率进行测试。对于两个VEGFA靶位点，tru-sgRNA增加一些脱靶位点处的indel频率，并且在野生型中未观察到的脱靶处产生indel。将每种SpCas9突变体的可通过NGS检测的脱靶位点的数目列在热图下方。

图24显示增加nt-沟槽中的正电荷可以导致脱靶位点处的切割增加。在EMX1(1)靶位点处，点突变体SpCas9(S845K)和SpCas9(L847R)展现出低于野生型SpCas9的特异性。

图25A-25D描绘了通过nt-沟槽的诱变来产生eSaCas9。与eSpCas9类似地产生SaCas9的改进的特异性形式。(A,B)针对减少的脱靶切割对RuvC与HNH结构域之间的沟槽中的残基的单氨基酸和双氨基酸突变体进行筛选。(C)将具有改进的特异性的突变体组合，以制备在EMX位点7处维持中靶切割并且具有显着减少的脱靶切割的SaCas9变体。(D)SaCas9的晶体结构，示出了HNH与RuvC结构域之间的沟槽。

图26示出了某些特异性增强的突变体的中靶效率的表征。PI结构域中的磷酸锁环处的三种SpCas9突变体(Lys1107、Glu1108、Ser1109)为邻近于PAM的sgRNA的碱基1和2赋予特异性。这些突变体由点突变体(K1107A)和其中的Lys-Glu-Ser序列分别被二肽Lys-Gly(KG)和Gly-Gly(GG)替换的两种突变体组成。我们的数据指示这些突变体可以大幅降低中靶切割效率。

图27显示eSpCas9(1.1)对人类细胞没有细胞毒性。将HEK293T细胞用WT或eSpCas9(1.1)转染并且孵育72小时，之后使用CellTiter-Glo测定测量细胞存活，在该测定中响应于由活细胞进行的ATP产生而发荧光。

图28示出了具有截短的指导RNA的Nt-沟槽突变体的分析。将截短的指导RNA(Tru)与单氨基酸SpCas9突变体组合并且靶向(A)EMX1(1)或(B)VEGFA(1)。虽然大多数被靶向EMX1的具有18nt指导物的突变体保留了中靶效率，但是被靶向VEGFA(1)的具有17nt指导物的那些严重受损。

图29A-29B示出了所选择的单氨基酸和双氨基酸突变体。如在SpCas9中，非靶向链沟槽中的正电荷的减少增强特异性。正电荷的减少可以通过用中性或带负电荷的氨基酸取代带正电荷的氨基酸(A)或通过除去沟槽内的带正电荷的氨基酸位置(B)来实现。感兴趣的突变体是K572，

图30示出了所选择的突变体的改进的特异性。CM2在脱靶活性方面展现出强烈降低，然而保留了完全的中靶活性。CM1：R499A；Q500K；K572A。CM2：R499A；Q500K；R654A；G655R。CM3：K572A；R654A；G655R。

图31示出了长度15bp、17bp和20bp的spCas9或spCas9突变体指导物的复合物对γ珠蛋白HBG1座位的激活。Cas9(px165)是未经突变的spCas9。dCas9指示无活性spCas9。描绘的单突变体(“SM”)是R780A、K810A、和K848A。描绘的双突变体(“DM”)是R780A/K810A、和R780A/K855A。

图32示出了不同的可编程核酸酶平台的比较。

图33示出了治疗性基因组修饰的类型。特定类型的基因组编辑治疗取决于引起疾病的突变的性质。a，在基因破坏中，通过用NHEJ靶向该座位使蛋白的致病功能沉默。在感兴趣的基因上形成indel常常导致移码突变，这些移码突变产生提前终止密码子和非功能性蛋白产物或无义介导的转录物衰变，从而抑制基因功能。b，HDR基因校正可以用来校正有害突变。在外源提供的校正HDR模板的存在下，DSB被靶向突变位点附近。通过外源模板对断裂位点进行HDR修复校正了该突变，从而恢复基因功能。c，基因校正的替代方案是基因添加。这种模式的处理将治疗性转基因引入基因组中的安全港(safe-harbor)座位中。DSB被靶向该安全港座位并且与断裂位点具有同源性、含有启动子和转基因的HDR模板被引入细胞核中。HDR修复将启动子-转基因盒拷贝到安全港座位中，从而恢复基因功能，尽管对基因表达没有真实的生理控制。

图34示出了离体与体内编辑治疗。在离体编辑治疗中，从患者体内取出细胞，编辑并且然后重新植入(顶部图)。为了使得这种治疗模式成功，靶细胞必须能够在体外存活并且在移植后能够归巢回到靶组织中。体内治疗涉及原位细胞基因组编辑(底部图)。对于体内全身性治疗，与细胞身份或状态相对无关的递送剂用来实现在范围广泛的组织类型中进行编辑。尽管这种模式的编辑治疗在将来是可能的，但是目前不存在足够有效使这可行的递送系统。在向患者给予对特定器官系统具有向性的递送剂的情况下，使用临床上相关的病毒载体的体内靶向治疗是可行的。

图35A-35B示出了经由Cas9同源重组(HR)载体进行的基因治疗的示意性表示。

图36呈现了用于定向递送蛋白质或指导物的糖附接(尤其是与GalNac)的示意图。

图37A、37B、和37C一起展示了SaCas9和SpCas9的序列比对。这两种蛋白质的RUVC和HNH结构域注释也被示于这三个图中。

本文的这些图仅仅是出于说明性的目的，并且不一定是按比例绘制的。

本发明的详细说明

在描述本发明的方法之前，应理解的是本发明不限于描述的具体方法、组分、产品或组合，因为这些方法、组分、产品和组合当然可以改变。还应理解的是，本文使用的术语并不旨在是限制性的，因为本发明的范围将仅由所附权利要求书限制。

如本文使用的，单数形式“一个/种(a，an)”和“该(the)”包括单数和复数指示物两者，除非上下文另外明确地指明。

如本文使用的术语“包括了(comprising)”、“包括(comprises)”和“由……构成(comprised of)”与“包含了(including)”、“包含(includes)”或“含有(containing)”、“含有(contains)”同义，并且是包容性或开放式的并且不排除另外的、未列举的成员、元素或方法步骤。应当理解的是，如本文使用的术语“包括了(comprising)”、“包括(comprises)”和“由……构成(comprised of)”包括术语“由……组成(consisting of)”、“组成为(consists)”和“由……组成(consists of)”，以及术语“基本上由……组成(consistingessentially of)”、“组成基本上为(consists essentially)”和“基本上由……组成(consists essentially of)”。应注意，在本披露并且特别是在权利要求书和/或段落中，术语如“包括(comprise)”、“包括的(comprised)”、“包括了(comprising)”等等可具有在美国专利法中属于它的含义；例如，它们可以表示“包含(includes)”、“包含的(included)”、“包含了(including)”等等；并且这些术语如“基本上由……组成(consistingessentially of)”和“基本上由……组成(consists essentially of)”具有在美国专利法中归于它们的含义，例如，它们允许未被明确叙述的要素，但是排除在现有技术中发现或者影响本发明的基本或新颖特征的要素。可以有利的是，在本发明的实践中符合条款53(c)EPC以及条例28(b)和(c)EPC。此处旨在没有任何承诺。

通过端点对数值范围的陈述包括所有数字和包含在对应的范围内的分数，以及所列举的端点。

当涉及可测量的值(如参数、量、短暂的持续时间等)时，如本文使用的术语“约(about)”或“大约(approximately)”意在包括指定值的和远离指定值的+/-20％或更少，优选+/-10％或更少，更优选+/-5％或更少，并且仍更优选+/-1％或更少的变化，在这些变化适于在所披露的发明中执行的情况下。应理解的是，还确切地且优选地披露了修饰语“约”或“大约”所涉及的值本身。

鉴于术语“一个/种或多个/种(one or more)”或“至少一个/种(at least one)”(如一组成员的一个或多个或至少一个成员)本身是清楚的，通过进一步示例的方式，该术语尤其包括对所述成员中的任一者、或对所述成员中的任两者或更多者的提及，例如像所述成员的任何≥3、≥4、≥5、≥6或≥7者等，并且直到所有所述成员。

在本说明书中引用的所有参考文献都通过引用以其全部内容而特此结合。具体而言，在本文中具体提及的所有参考文献的传授都通过引用而结合。

除非另外定义，在披露本发明中使用的所有术语(包括技术术语和科学术语)具有如本发明所属领域内的普通技术人员通常所理解的含义。通过进一步指导的方式，包括术语定义以便更好地理解本发明的传授。

在下面的段落中，更加详细地定义本发明的不同方面。除非明确地指出相反，如此定义的每个方面都可以与任何其他一个或多个方面组合。具体而言，被指示为优选或有利的任何特征都可以与被指示为优选或有利的任何其他一个或多个特征组合。

阐述重组DNA技术总则的标准参考著作包括《分子克隆：实验室手册》(MolecularCloning:A Laboratory Manual)，第2版，第1-3卷，编辑萨姆布鲁克(Sambrook)等人，冷泉港实验室出版社(Cold Spring Harbor Laboratory Press)，冷泉港，纽约，1989；《分子生物学实验指南》(Current Protocols in Molecular Biology)，编辑奥苏贝尔(Ausubel)等人，格林出版和威利国际科学(Greene Publishing and Wiley-Interscience)，纽约，1992(连同周期性更新)(“奥苏贝尔等人1992”)；《酶学方法》(Methods in Enzymology)系列(学术出版社公司(Academic Press,Inc.))；因尼斯(Innis)等人，《PCR方案：方法与应用指南》(PCR Protocols:A Guide to Methods and Applications)，学术出版社(AcademicPress)：圣地亚哥，1990；《PCR 2：实用方法》(PCR 2:A Practical Approach)(M.J.麦克弗森(MacPherson)、B.D.哈梅斯(Hames)和G.R.泰勒(Taylor)编辑(1995)；哈洛(Harlow)和拉内(Lane)编辑(1988)《抗体：实验室手册》(Antibodies,a Laboratory Manual)；以及《动物细胞培养》(Animal Cell Culture)(R.I.福瑞施尼(Freshney)编辑(1987)。微生物学总则阐述于例如戴维斯(Davis)，B.D.等人，《微生物学》(Microbiology)，第3版，哈珀&罗出版商(Harper&Row,publishers)，费城，宾夕法尼亚州(1980)。

贯穿本说明书对“一个实施例”或“实施例”的提及意指结合该实施例所描述的具体特征、结构或特性被包括在本发明的至少一个实施例中。因此，贯穿本说明书短语“在一个实施例中”或“在实施例中”在各处的出现并不必然全部是指同一实施例，但可以是指同一实施例。此外，在一个或多个实施例中，具体特征、结构或特性可以按任何合适的方式组合，这对于本领域普通技术人员而言根据本披露是显而易见的。此外，如本领域的技术人员应理解的，虽然本文所描述的一些实施例包括一些特征但不包括其他实施例中所包括的其他特征，但是不同实施例的特征的组合意在落入本发明的范围内，并且构成不同实施例。例如，在所附权利要求书中，任何所要求的实施例都可以按任何组合来使用。

在本发明的说明书中参考了附图，这些附图构成本说明书的一部分，并且在附图中仅以说明方式示出了能够实践本发明的特定实施例。应理解的是，在不背离本发明范围的情况下，可以利用其他实施例并且可以进行结构或逻辑变化。因此，本说明书不应以限制性意义来理解，并且本发明的范围仅由所附权利要求书限定。

本发明的目的在于，在本发明中不涵盖任何先前已知的产品、制造该产品的过程、或使用该产品的方法，使得申请人保留和特此公开放弃任何先前已知的产品、过程、或方法的权利。进一步指出的是，在本发明的范围之内，本发明并不旨在涵盖任何产品、过程、或该产品的制造或使用该产品的方法，其不符合USPTO(35 U.S.C.§112，第一段)或EPO(EPC的第83条)的书面说明和可实施性要求，使得申请人保留和特此公开放弃任何先前描述的产品、制造该产品的过程、或使用该产品的方法的权利。

在下文设定了本发明的优选陈述(特征)和实施例。除非明确地指出相反，如此定义的本发明的每个陈述和实施例都可以与任何其他陈述和/或实施例组合。具体而言，被指示为优选或有利的任何特征都可以与被指示为优选或有利的任何其他一个或多个特征或陈述组合。

如本文使用的，术语“非人类生物”或“非人类细胞”是指不同于智人或不是源自智人的生物或细胞。如本文使用的，术语“非人类真核生物”或“非人类真核细胞”是指不同于智人或不是源于智人的真核生物或细胞。在优选实施例中，这样的真核生物(细胞)是非人类动物(细胞)，如非人类哺乳动物、非人类灵长类动物、有蹄动物、啮齿动物(优选小鼠或大鼠)、兔、犬、狗、奶牛、牛、绵羊(sheep，ovine)、山羊、猪、家禽(fowl，poultry)、鸡、鱼、昆虫、或节肢动物，优选哺乳动物，如啮齿动物，特别是小鼠(的细胞或细胞群)。在本发明的一些实施例中，该生物或受试者或细胞可以是节肢动物，例如，昆虫或线虫(源于它的细胞或细胞群)。在本发明的一些方法中，该生物或受试者或细胞是植物(细胞)。在本发明的一些方法中，该生物或受试者或细胞是(源于)藻类(包括微藻)、或真菌。本领域技术人员应当理解的是，可以根据如本文提及的方法被移植或引入非人类真核生物中的真核细胞优选源于或源自与它们移植至其中的真核生物相同的物种。例如，在某个实施例中，根据如本文描述的本发明的方法，将小鼠细胞植入小鼠体内。在某些实施例中，该真核生物是免疫受损的真核生物，即免疫系统部分或完全关闭的真核生物。例如，可以将免疫受损的小鼠用于根据如本文描述的本发明的方法中。免疫受损的小鼠的实例包括但不限于裸鼠、RAG-/-小鼠、SCID(严重受损免疫缺陷)小鼠、SCID-Beige小鼠、NOD(非肥胖性糖尿病)-SCID小鼠、NOG或NSG小鼠等。

应理解的是，如本文描述的CRISPR-Cas系统在所述细胞中是非天然存在的，即对于所述细胞而言是工程化的或外源的。如本文提及的CRISPR-Cas系统已经被引入所述细胞中。用于将CRISPR-Cas系统引入细胞的方法在本领域是已知的，并且在本文的其他地方进一步描述。根据本发明的包含CRISPR-Cas系统或引入了CRISPR-Cas系统的细胞包含或能够表达用于建立功能性CRISPR复合物的CRISPR-Cas系统的单独组分，该复合物能够修饰(如切割)靶DNA序列。因此，如本文提及的，包含CRISPR-Cas系统的细胞可以是包含用于建立功能性CRISPR复合物的CRISPR-Cas系统的单独组分的细胞，该复合物能够修饰(如切割)靶DNA序列。可替代地，如本文提及的，并且优选地，包含CRISPR-Cas系统的细胞可以是包含编码该CRISPR-Cas系统的单独组分的一种或多种核酸分子的细胞，这些组分可以在该细胞中表达以建立能够修饰(如切割)靶DNA序列的功能性CRISPR复合物。

如本文使用的，术语V型或VI型CRISPR-Cas座位效应蛋白的“crRNA”或“指导RNA”或“单个指导RNA”或“sgRNA”或“一种或多种核酸组分”包括与靶核酸序列具有足够互补性以与该靶核酸序列杂交并且引导靶向核酸的复合物与该靶核酸序列的序列特异性结合的任何多核苷酸序列。在一些实施例中，当使用适合的比对算法进行最佳比对时，互补程度是约或多于约50％、60％、75％、80％、85％、90％、95％、97.5％、99％、或更多。可以使用用于比对序列的任何适合的算法来确定最佳比对，其非限制性实例包括史密斯-沃特曼(Smith-Waterman)算法、尼德曼-翁施(Needleman-Wunsch)算法、基于伯罗斯-惠勒变换(Burrows-Wheeler Transform)的算法(例如，伯罗斯-惠勒比对工具(Burrows Wheeler Aligner))、ClustalW、Clustal X、BLAT、Novoalign(Novocraft技术公司；在www.novocraft.com可获得)、ELAND(亿明达公司(Illumina)，圣地亚哥，加利福尼亚州)、SOAP(在soap.genomics.org.cn可获得)、以及Maq(在maq.sourceforge.net可获得)。可以通过任何适合的测定来评估指导序列(在靶向核酸的指导RNA内)引导靶向核酸的复合物与靶核酸序列的序列特异性结合的能力。例如，足以形成靶向核酸的复合物的靶向核酸的CRISPR系统的组分(包括有待测试的指导序列)可以如通过用编码靶向核酸的该复合物的组分的载体进行转染而被提供到具有相应靶核酸序列的宿主细胞中，随后如通过如本文描述的Surveyor测定来评估在该靶核酸序列内的优先靶向(例如，切割)。类似地，通过提供靶核酸序列、靶向核酸的复合物的组分(包括有待测试的指导序列)和不同于该测试指导序列的对照指导序列，并且比较在该测试指导序列与对照指导序列反应之间的靶序列处的结合或切割率，可以在试管中评估该靶核酸序列的切割。其他测定法是可能的，并且将由本领域技术人员想到。指导序列可以被选择为靶向任何靶核酸序列，并且因此靶向核酸的指导RNA也可以。该靶序列可以是DNA。该靶序列可以是任何RNA序列。在一些实施例中，该靶序列可以是选自下组的RNA分子内的序列，该组由以下各项组成：信使RNA(mRNA)、pre-mRNA、核糖体RNA(rRNA)、转移RNA(tRNA)、微小RNA(miRNA)、小干扰RNA(siRNA)、核小RNA(snRNA)、核仁小RNA(snoRNA)、双链RNA(dsRNA)、非编码RNA(ncRNA)、长链非编码RNA(lncRNA)、以及胞质小RNA(scRNA)。在一些优选实施例中，该靶序列可以是选自下组的RNA分子内的序列，该组由以下各项组成：mRNA、pre-mRNA、和rRNA。在一些优选实施例中，该靶序列可以是选自下组的RNA分子内的序列，该组由以下各项组成：ncRNA、和lncRNA。在一些更优选的实施例中，该靶序列可以是mRNA分子或pre-mRNA分子内的序列。

在一些实施例中，靶向核酸的指导RNA被选择为降低在靶向RNA的该指导RNA内的二级结构水平。在一些实施例中，在最佳地折叠时，靶向核酸的该指导RNA的约或少于约75％、50％、40％、30％、25％、20％、15％、10％、5％、1％、或更少的核苷酸参与自我互补碱基配对。可以通过任何适合的多核苷酸折叠算法来确定最佳折叠。一些算法是基于计算最小吉布斯(Gibbs)自由能。一种这样的算法的实例是mFold，正如祖克(Zuker)和施蒂格勒(Stiegler)所描述的(《核酸研究》(Nucleic Acids Res.)9(1981)，133-148)。折叠算法的另一个实例是使用质心结构预测算法的由维也纳大学(University of Vienna)的理论化学研究所(Institute for Theoretical Chemistry)研发的在线网络服务器RNAfold(参见例如，A.R.格鲁伯(Gruber)等人，2008，《细胞》(Cell)106(1):23-24；以及PA卡尔(Carr)和GM丘奇(Church)，2009，《自然生物技术》(Nature Biotechnology)27(12):1151-62)。

在某些实施例中，指导RNA或crRNA可以包括同向重复(DR)序列和指导序列或间隔子序列、基本上由其组成、或由其组成。在某些实施例中，该指导RNA或crRNA可以包括融合至或连接至指导序列或间隔子序列的同向重复序列、基本上由其组成、或由其组成。在某些实施例中，该同向重复序列可以位于该指导序列或间隔子序列的上游(即，5')。在其他实施例中，该同向重复序列可以位于该指导序列或间隔子序列的下游(即，3')。

在某些实施例中，该crRNA包括茎环，优选单个茎环。在某些实施例中，该同向重复序列形成茎环，优选单个茎环。

在某些实施例中，该指导RNA的间隔子长度是从15至35nt。在某些实施例中，该指导RNA的间隔子长度是至少15个核苷酸。在某些实施例中，间隔子长度是从15至17nt(例如，15、16或17nt)、从17至20nt(例如，17、18、19或20nt)、从20至24nt(例如，20、21、22、23或24nt)、从23至25nt(例如，23、24或25nt)、从24至27nt(例如，24、25、26或27nt)、从27-30nt(例如，27、28、29或30nt)、从30-35nt(例如，30、31、32、33、34或35nt、或35nt)或更长。

“tracrRNA”序列或类似术语包括与crRNA序列具有足够互补性以便杂交的任何多核苷酸序列。在一些实施例中，在进行最佳比对时，在tracrRNA序列与crRNA序列之间沿着这两者的较短者的长度的互补程度是约或多于约25％、30％、40％、50％、60％、70％、80％、90％、95％、97.5％、99％、或更高。在一些实施例中，该tracr序列在长度上为约或多于约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、40、50个、或更多个核苷酸。在一些实施例中，该tracr序列和crRNA序列被包含在单个转录物中，使得在这两者之间的杂交产生具有二级结构(如发夹)的转录物。在本发明的一个实施例中，该转录物或转录的多核苷酸序列具有至少两个或更多个发夹。在优选的实施例中，该转录物具有两个、三个、四个或五个发夹。在本发明的一个另外的实施例中，该转录物具有至多五个发夹。在一个发夹结构中，在该环的最终“N”和上游的序列5’的部分相应于该tracr配对序列，并且该环的序列3’的部分相应于该tracr序列。

一般而言，该CRISPR-Cas、CRISPR-Cas9或CRISPR系统可以是如在前述文献(如WO2014/093622(PCT/US 2013/074667))中所使用的并且总共是指转录物和涉及CRISPR相关(“Cas”)基因的表达或引导其活性的其他组件，包括编码Cas基因(特别地，在CRISPR-Cas9的情况下是Cas9基因)的序列、tracr(反式激活CRISPR)序列(例如tracrRNA或活性部分tracrRNA)、tracr配对序列(涵盖“同向重复”和在内源CRISPR系统背景下的tracrRNA加工的部分同向重复)、指导序列(在内源CRISPR系统背景下也称为“间隔子(spacer)”)、或如本文使用的术语“RNA”(例如，指导Cas9的RNA，例如，CRISPR RNA和反式激活(tracr)RNA或单一指导RNA(sgRNA)(嵌合RNA))或来自CRISPR座位的其他序列和转录物。一般而言，CRISPR系统的特征为促进在靶序列的位点处的CRISPR复合物(在内源CRISPR系统的背景下也称为原型间隔子)的形成的组件。在CRISPR复合物形成的背景下，“靶序列”是指指导序列被设计为对其具有互补性的序列，其中在靶序列与指导序列之间的杂交促进CRISPR复合物的形成。通过其与靶序列的互补性对于切割活性而言重要的指导序列区段在本文被称为种子序列。靶序列可以包含任何多核苷酸，如DNA或RNA多核苷酸。在一些实施例中，靶序列位于细胞的细胞核或细胞质中，并且可以包括存在于该细胞中的线粒体、细胞器、囊泡、脂质体或粒子中的或来自其中的核酸。在一些实施例中，尤其是对于非核用途，NLS不是优选的。在一些实施例中，可以通过计算机搜索重复基序来鉴定同向重复，其满足下列标准的任一项或全部：1.发现在II型CRISPR座位侧翼的基因组序列的2Kb窗口；2.跨从20到50bp；以及3.以20到50bp间隔开。在一些实施例中，可以使用这些标准中的2条，例如1和2、2和3、或1和3。在一些实施例中，可以使用所有这3条标准。

在本发明的实施例中，术语指导序列和指导RNA(即能够将Cas导向靶基因组座位的RNA)可互换地使用，如在前述引用文献(如WO 2014/093622(PCT/US 2013/074667))中。一般而言，指导序列是与靶多核苷酸序列具有足够互补性以便与该靶序列杂交并且引导CRISPR复合物与该靶序列的序列特异性结合的任何多核苷酸序列。在一些实施例中，当使用适合的比对算法进行最佳比对是，在指导序列与其相应的靶序列之间的互补程度是约或多于约50％、60％、75％、80％、85％、90％、95％、97.5％、99％、或更多。可以使用用于比对序列的任何适合的算法来确定最佳比对，其非限制性实例包括史密斯-沃特曼算法、尼德曼-翁施算法、基于伯罗斯-惠勒变换的算法(例如伯罗斯-惠勒比对工具)、ClustalW、Clustal X、BLAT、Novoalign(Novocraft技术公司；在www.novocraft.com可获得)、ELAND(亿明达公司，圣地亚哥，加利福尼亚州)、SOAP(在soap.genomics.org.cn可获得)、以及Maq(在maq.sourceforge.net可获得)。在一些实施例中，指导序列在长度上为约或多于约5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75个、或更多个核苷酸。在一些实施例中，指导序列在长度上为少于约75、50、45、40、35、30、25、20、15、12个、或更少的核苷酸。优选地，该指导序列是10-30个核苷酸长。可以通过任何适合的测定法来评估指导序列引导CRISPR复合物与靶序列的序列特异性结合的能力。例如，足以形成CRISPR复合物的CRISPR系统的组分，包括有待测试的指导序列在内，可以例如通过用编码该CRISPR序列的组分的载体进行转染而被提供到具有相应靶序列的宿主细胞中，随后通过如本文所述的Surveyor测定来评估在该靶序列之内的优先切割。类似地，通过提供该靶序列、包括有待测试的指导序列在内的CRISPR复合物的组分、和不同于该测试指导序列的对照指导序列，并且比较在该测试指导序列与该对照指导序列反应之间的靶序列处的结合或切割率，可以在试管中评估靶多核苷酸序列的切割。其他测定法是可能的，并且将由本领域技术人员想到。

在CRISPR-Cas系统的一些实施例中，在指导序列与其相应的靶序列之间的互补程度可以是约或多于约50％、60％、75％、80％、85％、90％、95％、97.5％、99％、或100％；指导或RNA或sgRNA在长度上可以为约或多于约5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75个、或更多个核苷酸；或者指导物或RNA或sgRNA在长度上可以为少于约75、50、45、40、35、30、25、20、15、12个、或更少的核苷酸；并且有利地，tracrRNA在长度上为30或50个核苷酸。然而，本发明的一个方面在于减少脱靶相互作用，例如减少与具有低互补性的靶序列的相互作用的指导。的确，在这些实例中，显示本发明涉及突变，这些突变产生能够将具有大于80％至约95％互补性(例如，83％-84％或88％-89％或94％-95％互补性)的靶序列与脱靶序列区分开(例如，将具有18个核苷酸的靶标与具有1、2或3个错配的18个核苷酸的脱靶区分开)的CRISPR-Cas系统。因此，在本发明的背景下，在指导序列与其相应的靶序列之间的互补程度大于94.5％或95％或95.5％或96％或96.5％或97％或97.5％或98％或98.5％或99％或99.5％或99.9％，或是100％。脱靶小于100％或99.9％或99.5％或99％或99％或98.5％或98％或97.5％或97％或96.5％或96％或95.5％或95％或94.5％或94％或93％或92％或91％或90％或89％或88％或87％或86％或85％或84％或83％或82％或81％或80％的该序列与该指导物之间的互补性，其中有利的是脱靶是100％或99.9％或99.5％或99％或99％或98.5％或98％或97.5％或97％或96.5％或96％或95.5％或95％或94.5％的该序列与该指导物之间的互补性。

在根据本发明的特别优选的实施例中，该指导RNA(能够将Cas导向靶座位)可以包含(1)能够杂交到真核细胞中的基因组靶座位上的指导序列；(2)tracr序列；以及(3)tracr配对序列。所有(1)至(3)可以位于单个RNA(即sgRNA)中(以5’到3’方向排列)，或者tracrRNA可以是不同于含有指导序列和tracr序列的RNA的RNA。该tracr杂交到tracr配对序列上并且将CRISPR/Cas复合物引导至靶序列。

如本文描述的根据本发明的方法包括在真核细胞中(在体外，即在分离的真核细胞中)诱导一个或多个如本文讨论的突变，包括向细胞递送如本文讨论的载体。这一个或多个突变可以包括经由一种或多种指导、一种或多种RNA或一种或多种sgRNA在一个或多个细胞的每个靶序列处引入、缺失、或取代一个或多个核苷酸。这些突变可以包括经由一种或多种指导、一种或多种RNA或一种或多种sgRNA在所述一个或多个细胞的每个靶序列处引入、缺失、或取代1-75个核苷酸。这些突变可以包括经由一种或多种指导、一种或多种RNA或一种或多种sgRNA在所述一个或多个细胞的每个靶序列处引入、缺失、或取代1、5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、或75个核苷酸。这些突变可以包括经由一种或多种指导、一种或多种RNA或一种或多种sgRNA在所述一个或多个细胞的每个靶序列处引入、缺失、或取代5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、或75个核苷酸。这些突变包括经由一种或多种指导、一种或多种RNA或一种或多种sgRNA在所述一个或多个细胞的每个靶序列处引入、缺失、或取代10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、或75个核苷酸。这些突变可以包括经由一种或多种指导、一种或多种RNA或一种或多种sgRNA在所述一个或多个细胞的每个靶序列处引入、缺失、或取代20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、或75个核苷酸。这些突变可以包括经由一种或多种指导、一种或多种RNA或一种或多种sgRNA在所述一个或多个细胞的每个靶序列处引入、缺失、或取代40、45、50、75、100、200、300、400或500个核苷酸。

为了将毒性和脱靶效应最小化，考虑了控制所递送的Cas mRNA和指导RNA的浓度。Cas mRNA和指导RNA的最佳浓度可以通过在细胞或非人类真核生物动物模型中测试不同的浓度并且使用深度测序分析在潜在的脱靶基因组座位处的修饰的范围而确定。可替代地，为了将毒性水平和脱靶效应最小化，可以用一对靶向感兴趣位点的指导RNA来递送Cas切口酶mRNA(例如，具有D10A突变的化脓链球菌Cas9)。将毒性和脱靶效应最小化的指导序列和策略可以是如在WO 2014/093622(PCT/US 2013/074667)中的；或者，经由如本文的突变。

典型地，在内源CRISPR系统的背景下，CRISPR复合物(包含杂交到靶序列上并且与一种或多种Cas蛋白复合的指导序列)的形成导致在该靶序列中或其附近(例如在1、2、3、4、5、6、7、8、9、10、20、50、或更多个碱基对之内)的一条链或两条链的切割。不希望受到理论的束缚，该tracr序列(其可以包含或其组成为野生型tracr序列的全部或部分(例如野生型tracr序列的约或多于约20、26、32、45、48、54、63、67、85个、或更多个核苷酸))也可以形成CRISPR复合物的一部分，如通过沿着该tracr序列的至少一部分杂交到与该指导序列有效作地连接的tracr配对序列的全部或部分上。

RuvCI、RuvCII、RuvCIII和HNH结构域的位置示于图22A-C中。如本文使用的，术语“RuvCI结构域”优选是指包含化脓链球菌Cas9(SpCas9)的氨基酸1-60或另一Cas9直向同源物或不同于Cas9的CRISPR核酸酶中的相应区域的结构域。如本文使用的，术语“RuvCII结构域”优选是指包含化脓链球菌Cas9(SpCas9)的氨基酸718-775或另一Cas9直向同源物或不同于Cas9的CRISPR核酸酶中的相应区域的结构域。如本文使用的，术语“RuvCIII结构域”优选是指包含化脓链球菌Cas9(SpCas9)的氨基酸909-1099或另一Cas9直向同源物或不同于Cas9的CRISPR核酸酶中的相应区域的结构域。如本文使用的，术语“HNH结构域”优选是指包含化脓链球菌Cas9(SpCas9)的氨基酸776-908或另一Cas9直向同源物或不同于Cas9的CRISPR核酸酶中的相应区域的结构域。RuvC与HNH结构域之间的沟槽是指在如本文描述的非天然存在的CRISPR酶的三维结构中的这些结构域之间的沟槽。图25D示出了SaCas9的晶体结构，其中示出了在SaCas9的三维结构中的HNH与RuvC结构域之间的沟槽。

适配体

一种具有第一适配体/RNA结合蛋白对的指导物可以连接至或融合至激活因子，同时具有第二适配体/RNA结合蛋白对的第二指导可以连接至或融合至阻遏因子。这些指导物是针对不同的靶标(座位)，所以这允许一个基因被激活而一个基因被阻遏。例如，以下示意图示出了这样一种方法：

指导物1-MS2适配体-------MS2RNA结合蛋白-------VP64激活因子；和

指导物2-PP7适配体-------PP7RNA结合蛋白-------SID4x阻遏因子。

本发明还涉及正交PP7/MS2基因靶向。在这个实例中，用不同RNA环修饰靶向不同座位的sgRNA，以便募集MS2-VP64或PP7-SID4X，它们分别激活和阻遏其靶座位。PP7是噬菌体假单胞菌属的RNA结合外壳蛋白。像MS2一样，它结合特定的RNA序列和二级结构。PP7的RNA识别基序不同于MS2的RNA识别基序。因此，PP7和MS2可以被多元化，以同时在不同基因组座位处介导不同效应。例如，可以用MS2环修饰靶向座位A的sgRNA，从而募集MS2-VP64激活因子，同时可以用PP7环修饰靶向座位B的另一sgRNA，从而募集PP7-SID4X阻遏结构域。在同一细胞中，dCas9因此可以介导正交的、座位特异性修饰。这个原理可以扩展到掺入其他正交RNA结合蛋白，如Q-β。

正交阻遏的替代选择包括向指导中掺入具有反向激活阻遏功能的非编码RNA环(在被掺入该指导物中的MS2/PP7环的类似位置处或在该指导物的3'末端处)。例如，用非编码(但已知是阻遏性的)RNA环设计指导物(例如，使用干扰哺乳动物细胞中的RNA聚合酶II的Alu阻抑因子(在RNA中))。将Alu RNA序列定位：代替如本文使用的MS2RNA位置(例如在四核苷酸环和/或茎环2处)；和/或在该指导物的3'末端处。这给出了MS2、PP7或Alu在四核苷酸环和/或茎环2位置处的可能的组合，以及任选地，Alu在该指导物的3'端处的添加(用或不用接头)。

两种不同适配体(不同的RNA)的使用允许使用激活因子-衔接蛋白融合和阻遏因子-衔接蛋白融合与不同指导物，以激活一个基因的表达，同时阻抑另一个基因的表达。可以在多元方法中一起或基本上一起给予它们连同其不同指导物。可以同时使用大量的这样的经修饰的指导物，例如10种或20种或30种等，同时待递送仅一种(或至少最小数目的)Cas9，因为相对较小数目的Cas9可以与大量的经修饰的指导物一起使用。衔接蛋白可以与一种或多种激活因子或一种或多种阻遏因子相缔合(优选连接至或融合至它们)。例如，衔接蛋白可以与第一激活因子和第二激活因子相缔合。该第一和第二激活因子可以是相同的，但是优选地它们是不同的激活因子。例如，一者可能是VP64，同时另一者可能是p65，但是这些仅是实例并且设想了其他转录激活因子。可以使用三种或更多种或甚至四种或更多种激活因子(或阻遏因子)，但是包装尺寸可以将数目限制高于5个不同的功能结构域。在直接融合至衔接蛋白中优选使用接头，其中两个或更多个功能结构域与该衔接蛋白相关。适合的接头可以包括GlySer接头。

还可以设想的是，该酶-指导复合物整体上可以与两个或更多个功能结构域相缔合。例如，可以存在两个或更多个与该酶相关的功能结构域，或者可以存在两个或更多个与该指导相关的功能结构域(经由一种或多种衔接蛋白)，或者可以存在一个或多个与该酶相关的功能结构域和一个或多个与该指导相关的功能结构域(经由一种或多种衔接蛋白)。

衔接蛋白与激活因子或阻遏因子之间的融合可以包括接头。例如，可以使用GlySer接头GGGS。根据需要，它们可以按3个((GGGGS)₃)或6、9或甚至12个或更多个的重复使用，以提供适合的长度。接头可以用在RNA结合蛋白与功能结构域(激活因子或阻抑因子)之间，或CRISPR酶(Cas9)与功能结构域(激活因子或阻抑因子)之间。使用这些接头来工程化适当量的“机械柔性”。

失活的指导物：包含失活的指导序列的指导RNA可以用在本发明中

在一个方面，本发明提供了按以下方式修饰的指导序列，该方式允许形成CRISPR复合物并且成功地结合至靶标，但同时不允许成功的核酸酶活性(即没有核酸酶活性/没有indel活性)。出于解释的原因，这样的经修饰的指导序列被称为“失活的指导物”或“失活的指导序列”。就核酸酶活性而言，这些失活的指导物或失活的指导序列可以被认为是无催化活性的或无构象活性的。核酸酶活性可以使用如本领域通常使用的surveyor分析或深度测序(优选surveyor分析)来测量。类似地，就促进催化活性的能力或区分中靶和脱靶结合活性的能力而言，失活的指导序列并不可以足够地参与富有成效的碱基配对。简单地说，surveyor测定涉及纯化和扩增基因的CRISPR靶位点并且与扩增该CRISPR靶位点的引物形成异源双链体。重退火之后，遵循制造商的推荐方案，将产物用SURVEYOR核酸酶和SURVEYOR增强子S(转基因组学公司(Transgenomics))处理，在凝胶上进行分析，并且基于相对带强度进行量化。

因此，在一个相关方面，本发明提供了非天然存在的或工程化的组合物Cas9CRISPR-Cas系统，该系统包含如本文描述的功能性Cas9、和指导RNA(gRNA)，其中该gRNA包含失活的指导序列，由此该gRNA能够杂交到靶序列上，这样使得该Cas9 CRISPR-Cas系统被引导至细胞中的感兴趣基因组座位，而没有由该系统的非突变型Cas9酶的核酸酶活性得到的可检测的indel活性，如通过SURVEYOR测定所检测的。出于简写的目的，包含失活的指导序列的gRNA(由此该gRNA能够杂交到靶序列上，这样使得该Cas9 CRISPR-Cas系统被引导至细胞中的感兴趣基因组座位，而没有由该系统的非突变型Cas9酶的核酸酶活性得到的可检测的indel活性，如通过SURVEYOR测定所检测的)在本文被称为“失活的gRNA”。应理解的是，如在本文的其他地方描述的根据本发明的任何gRNA都可以用作失活的gRNA/包含如在下文描述的失活的指导序列的gRNA。如在本文的其他地方描述的任何方法、产品、组合物和用途都同样地适用于如下文进一步详述的失活的gRNA/包含如在下文描述的失活的指导序列的gRNA。通过进一步指导的方式，提供了以下具体方面和实施例。

可以通过任何适合的测定法来评估失活的指导序列引导CRISPR复合物与靶序列的序列特异性结合的能力。例如，足以形成CRISPR复合物的CRISPR系统的组分(包括有待测试的失活的指导序列)可以例如通过用编码该CRISPR序列的组分的载体进行转染而被提供到具有相应靶序列的宿主细胞中，随后通过如本文所述的Surveyor测定来评估在该靶序列之内的优先切割。类似地，通过提供靶序列、CRISPR复合物的组分(包括有待测试的失活的指导序列)和不同于该测试失活的指导序列的对照指导序列，并且比较在该测试指导序列与对照指导序列反应之间的靶序列处的结合或切割率，可以在试管中评估靶多核苷酸序列的切割。其他测定法是可能的，并且将由本领域技术人员想到。失活的指导序列可以被选择为靶向任何靶序列。在一些实施例中，该靶序列是在细胞的基因组内的序列。

如本文进一步解释的，若干结构参数允许适当的框架到达这样的失活的指导物处。失活的指导序列短于对应的指导序列，这导致活跃的Cas9特异性indel形成。失活的指导物比被引导至相同Cas9的对应的指导物短5％、10％、20％、30％、40％、50％，从而引起活跃的Cas9特异性indel形成。

如下文解释的并且本领域已知的，gRNA-Cas9特异性的一个方面是同向重复序列，它有待被适当地连接至这样的指导物。具体而言，这意味着该同向重复序列的设计取决于Cas9的来源。因此，可用于经验证的失活的指导序列的结构数据可以用于设计Cas9特异性等效物。例如两种或更多种Cas9效应蛋白的直向同源核酸酶结构域RuvC之间的结构相似性可以用于迁移设计等效失活的指导物。因此，可以在长度和序列上对本文的失活的指导物进行适当修饰，以反映这样的Cas9特异性等效物，从而允许形成CRISPR复合物并且成功地结合至靶标，而同时不允许成功的核酸酶活性。

失活的指导物在本文以及现有技术背景下的使用为体外、离体和体内应用两者中的网络生物学和/或系统生物学提供了令人惊讶且出乎意料的平台，从而允许多元基因靶向，并且特别是双向多元基因靶向。在失活的指导物的使用之前，处理多个靶标(例如用于基因活性的激活、阻遏和/或沉默)一直具有挑战性并且在一些情况下是不可能的。通过使用失活的指导物，可以例如在同一细胞中、在同一动物体内、或在同一患者体内处理多个靶标，并且因此处理多种活性。这种多元化可以同时发生或交错发生持续希望的时间段。

例如，失活的指导物现在允许初次使用gRNA作为基因靶向工具，而不是核酸酶活性的结果，并且同时提供激活或阻遏的引导工具。包含失活的指导物的指导RNA可以按一定方式被修饰为进一步包括以下组件，这些组件允许激活或阻遏基因活性，特别是如在本文的其他地方描述的允许功能性放置基因效应子(例如基因活性的激活因子或阻遏因子)的蛋白衔接子(例如适配体)。一个实例是掺入适配体，如在本文和在现有技术中所解释的。通过工程化包含失活的指导物的gRNA以掺入蛋白相互作用适配体(库娜曼妮(Konermann)等人，“通过CRISPR-Cas9复合物进行的基因组范围内的转录激活(Genome-scaletranscription activation by an engineered CRISPR-Cas9complex)”，doi:10.1038/nature14136，通过引用并入本文)，可以组装由多个不同的效应结构域组成的合成转录激活复合物。在天然转录激活过程之后可以将其模式化。例如，选择性地结合效应子(例如激活因子或阻遏因子；作为与激活因子或阻遏因子的融合蛋白的二聚化的MS2噬菌体外壳蛋白)的适体、或自身结合效应子(例如激活因子或阻遏因子)的蛋白质可以被附于失活的gRNA四核苷酸环和/或茎环2。在MS2的情况下，融合蛋白MS2-VP64结合至四核苷酸环和/或茎环2并且转而介导例如Neurog2的转录上调。其他转录激活因子是例如VP64、P65、HSF1、以及MyoD1。通过仅仅示例这个概念，PP7相互作用茎环对MS2茎环的替换可以用来募集阻遏性组件。

因此，一个方面是本发明的gRNA，该gRNA包含失活的指导物，其中该gRNA进一步包括修饰，这些修饰提供基因激活或阻遏，如本文所描述的。该失活的gRNA可以包含一种或多种适配体。这些适配体对于基因效应子、基因激活因子或基因阻遏因子而言可以是特异性的。可替代地，这些适配体对于蛋白质而言可以是特异性的，该蛋白质转而对特异性基因效应子、基因激活因子或基因阻遏因子而言是特异性的并且募集/结合特异性基因效应子、基因激活因子或基因阻遏因子。如果存在多个激活因子或阻遏因子募集位点，优选的是这些位点对于激活因子或阻遏因子而言是特异性的。如果存在多个激活因子或阻遏因子结合位点，这些位点对于相同的激活因子或相同的阻遏因子而言可以是特异性的。这些位点对于不同激活因子或不同阻遏因子而言也可以是特异性的。基因效应子、基因激活因子、基因阻遏因子可以按融合蛋白的形式存在。

在一个实施例中，如本文描述的失活的gRNA或如本文描述的Cas9 CRISPR-Cas复合物包括非天然存在的或工程化的组合物，该组合物包含两种或更多种衔接蛋白，其中每种蛋白都与一个或多个功能性结构域相缔合并且其中该衔接蛋白结合至被插入该失活的gRNA的至少一个环中的一个或多个不同的RNA序列。

因此，一个方面提供了非天然存在的或工程化的组合物，该组合物包含指导RNA(gRNA)，其包含能够杂交到细胞中的感兴趣的基因组座位中的靶序列上的失活的指导序列，其中该失活的指导序列是如本文所定义的；Cas9，其包含至少一个或多个核定位序列，其中该Cas9任选地包括至少一个突变，其中该失活的gRNA的至少一个环通过插入结合至一种或多种衔接蛋白的一个或多个不同的RNA序列而被修饰，并且其中该衔接蛋白与一个或多个功能结构域相缔合；或者，其中该失活的gRNA被修饰成具有至少一个非编码功能环，并且其中该组合物包含两种或更多种衔接蛋白，其中每种蛋白都与一个或多个功能结构域相缔合。

在某些实施例中，该衔接蛋白是包含功能结构域的融合蛋白，该融合蛋白在衔接蛋白与功能结构域之间任选地包含接头，该接头任选地包括GlySer接头。

在某些实施例中，该失活的gRNA的至少一个环未通过插入结合至两种或更多种衔接蛋白的一个或多个不同的RNA序列而被修饰。

在某些实施例中，与衔接蛋白相缔合的这一个或多个功能结构域是转录激活结构域。

在某些实施例中，与衔接蛋白相缔合的这一个或多个功能结构域是转录激活结构域，包括VP64、p65、MyoD1、HSF1、RTA或SET7/9。

在某些实施例中，与衔接蛋白相缔合的这一个或多个功能结构域是转录阻抑结构域。

在某些实施例中，该转录阻抑结构域是KRAB结构域。

在某些实施例中，该转录阻抑物结构域是NuE结构域、NcoR结构域、SID结构域或SID4X结构域。

在某些实施例中，与衔接蛋白相缔合的这一个或多个功能结构域中的至少一者具有一种或多种活性，包括甲基酶活性、脱甲基酶活性、转录激活活性、转录阻遏活性、转录释放因子活性、组蛋白修饰活性、DNA整合活性、RNA切割活性、DNA切割活性或核酸结合活性。

在某些实施例中，该DNA切割活性是由于Fok1核酸酶。

在某些实施例中，修饰该失活的gRNA，使得失活的gRNA结合衔接蛋白并且进一步结合至Cas9和靶标之后，功能结构域处于允许该功能结构域以其属性化功能发挥作用的空间取向。

在某些实施例中，该失活的gRNA的至少一个环是四元环和/或环2。在某些实施例中，通过插入一个或多个不同的RNA序列来修饰该失活的gRNA的四元环和环2。

在某些实施例中，结合至一种或多种衔接蛋白的一个或多个不同的RNA序列的插入物是适配体序列。在某些实施例中，该适配体序列是对同一衔接蛋白具有特异性的两个或更多个适配体序列。在某些实施例中，该适配体序列是对不同衔接蛋白具有特异性的两个或更多个适配体序列。

在某些实施例中，该衔接蛋白包括MS2、PP7、Qβ、F2、GA、fr、JP501、M12、R17、BZ13、JP34、JP500、KU1、M11、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、φCb5、φCb8r、φCb12r、φCb23r、7s、PRR1。

在某些实施例中，该细胞是真核细胞。在某些实施例中，该真核细胞是哺乳动物细胞，任选地是小鼠细胞。在某些实施例中，该哺乳动物细胞是人类细胞。

在某些实施例中，第一衔接蛋白与p65结构域相缔合并且第二衔接蛋白与HSF1结构域相缔合。

在某些实施例中，该组合物包含Cas9 CRISPR-Cas复合物，该复合物具有至少三个功能结构域，其中的至少一个与Cas9相缔合并且其中的至少两个与失活的gRNA相缔合。

在某些实施例中，该组合物进一步包含第二gRNA，其中该第二gRNA是能够杂交到第二靶序列上的活gRNA，这样使得第二Cas9 CRISPR-Cas系统被引导至细胞中的第二感兴趣的基因组座位，其中在该第二基因组座位处的由该系统的Cas9酶的核酸酶活性得到的indel活性是可检测的。

在某些实施例中，该组合物进一步包含多种失活的gRNA和/或多种活gRNA。

本发明的一个方面是利用gRNA支架的模块性和可定制性来建立一系列具有不同结合位点(特别是适配体)的用于以正交方式募集不同类型的效应子的gRNA支架。再次，出于示例和说明较为宽泛的概念的原因，PP7相互作用茎环对MS2茎环的替换可以用来结合/募集阻遏性组件，从而使得能够进行多元双向转录控制。因此，通常，包含失活的指导物的gRNA可以用于提供多元转录控制和优选的双向转录控制。这种转录控制最优选地是基因的。例如，包含一种或多种失活的指导物的一种或多种gRNA可以用于靶向一个或多个靶基因的激活。同时，包含一种或多种失活的指导物的一种或多种gRNA可以用于靶向一个或多个靶基因的阻遏。这样一种序列可以按多种不同的组合应用，例如这些靶基因首先被阻遏，并且然后在适当的时间，其他靶标被激活，或者所选基因被阻遏同时所选基因被激活，随后进行进一步激活和/或阻遏。其结果是，一种或多种生物系统的多种组分可以有利地被一起处理。

在一个方面，本发明提供了编码如本文描述的失活的gRNA或Cas9 CRISPR-Cas复合物或组合物的一种或多种核酸分子。

在一个方面，本发明提供了载体系统，该载体系统包含：编码如本文定义的失活的指导RNA的核酸分子。在某些实施例中，该载体系统进一步包含编码Cas9的一种或多种核酸分子。在某些实施例中，该载体系统进一步包含编码(活)gRNA的一种或多种核酸分子。在某些实施例中，该核酸分子或该载体进一步包含在真核细胞中有效的一种或多种调节组件，这些调节组件有效作地连接至编码该指导序列(gRNA)的核酸分子和/或编码Cas9的核酸分子和/或一个或多个任选的核定位序列。

在另一个方面，结构分析还可以用于研究失活的指导物与使得能够进行DNA结合、但是不能进行DNA切割的活性Cas9核酸酶之间的相互作用。以此方式，确定对于Cas9的核酸酶活性而言重要的氨基酸。此类氨基酸的修饰允许用于基因编辑的改进的Cas9酶。

一个另外的方面是将如本文解释的失活的指导物的使用与如本文解释的并且本领域已知的CRISPR的其他应用组合。例如，包含一种或多种失活的指导物的用于靶向的多元基因激活或阻遏或靶向的多元双向基因激活/阻遏的gRNA可以与包含维持核酸酶活性的指导物的gRNA组合，如本文所解释的。包含维持核酸酶活性的指导物的这样的gRNA可以或可以不进一步包括允许阻遏基因活性的修饰(例如适配体)。包含维持核酸酶活性的指导物的这样的gRNA可以或可以不进一步包括允许激活基因活性的修饰(例如适配体)。以这样一种方式，介绍了另一种多元基因控制手段(例如可以与具有核酸酶活性的基因靶向的阻遏同时地或组合地提供没有核酸酶活性/没有indel活性的多元基因靶向的激活)。

例如，1)使用一种或多种gRNA(例如，1-50、1-40、1-30、1-20种，优选1-10种，更优选1-5种)，其包含一种或多种失活的指导物、被靶向一个或多个基因并且用适当的适配体进一步修饰用于募集基因激活因子；2)可以与一种或多种gRNA(例如，1-50、1-40、1-30、1-20种，优选1-10种，更优选1-5种)组合，这些gRNA包含一种或多种失活的指导物、被靶向一个或多个基因并且用适当的适配体进一步修饰用于募集基因阻遏因子。1)和/或2)然后可以与3)被靶向一个或多个基因的一种或多种gRNA(例如，1-50、1-40、1-30、1-20种，优选1-10种，更优选1-5种)组合。然后可以用1)+2)+3)与4)一种或多种gRNA(例如，1-50、1-40、1-30、1-20种，优选1-10种，更优选1-5种)按次序进行这种组合，这些gRNA被靶向一个或多个基因并且用适当的适配体进一步修饰用于募集基因激活因子。然后可以用1)+2)+3)+4)与5)一种或多种gRNA(例如，1-50、1-40、1-30、1-20种，优选1-10种，更优选1-5种)按次序进行这种组合，这些gRNA被靶向一个或多个基因并且用适当的适配体进一步修饰用于募集基因阻遏因子。其结果是，多种用途和组合被包括在本发明之中。例如，组合1)+2)；组合1)+3)；组合2)+3)；组合1)+2)+3)；组合1)+2)+3)+4)；组合1)+3)+4)；组合2)+3)+4)；组合1)+2)+4)；组合1)+2)+3)+4)+5)；组合1)+3)+4)+5)；组合2)+3)+4)+5)；组合1)+2)+4)+5)；组合1)+2)+3)+5)；组合1)+3)+5)；组合2)+3)+5)；组合1)+2)+5)。

在一个方面，本发明提供了用于设计、评价或选择失活的指导RNA靶向序列(失活的指导序列)的算法，该序列用于将Cas9 CRISPR-Cas系统引导至靶基因座位。具体而言，已经确定失活的指导RNA特异性与i)GC含量和ii)靶向序列长度有关并且可以通过改变i)GC含量和ii)靶向序列长度进行优化。在一个方面，本发明提供了用于设计或评价失活的指导RNA靶向序列的算法，该序列使该失活的指导RNA的脱靶结合或相互作用最小化。在本发明的一个实施例中，用于选择将CRISPR系统引导至生物体内的基因座位的失活的指导RNA靶向序列的算法包括a)在该基因座位中定位一个或多个CRISPR基序，分析每个CRISPR基序下游的20nt序列，通过i)确定该序列的GC含量；并且ii)确定在该生物的基因组中是否存在离该CRISPR基序最近的15个下游核苷酸的脱靶匹配，并且c)如果该序列的GC含量是70％或更低并且没有鉴定到脱靶匹配，则选择该15核苷酸序列用于在失活的指导RNA中使用。在一个实施例中，如果GC含量是60％或更低，则该序列被选择为靶向序列。在某些实施例中，如果GC含量是55％或更低、50％或更低、45％或更低、40％或更低、35％或更低或30％或更低，则该序列被选择为靶向序列。在一个实施例中，对该基因座位的两个或更多个序列加以分析，并且选择具有最低GC含量、或次最低GC含量、或次最低GC含量的序列。在一个实施例中，如果在该生物的基因组中没有鉴定到脱靶匹配，则该序列被选择为靶向序列。在一个实施例中，如果在基因组的调节序列中没有鉴定到脱靶匹配，则选择该靶向序列。

在一个方面，本发明提供了选择用于将功能化的CRISPR系统引导至生物体内的基因座位的失活的指导RNA靶向序列的方法，该方法包括：a)在该基因座位中定位一个或多个CRISPR基序；b)分析每个CRISPR基序下游的20nt序列，通过：i)确定该序列的GC含量；并且ii)确定在该生物的基因组中是否存在该序列的前15nt的脱靶匹配；c)如果该序列的GC含量是70％或更低并且没有鉴定到脱靶匹配，则选择该序列用于在指导RNA中使用。在一个实施例中，如果GC含量是50％或更低，则选择该序列。在一个实施例中，如果GC含量是40％或更低，则选择该序列。在一个实施例中，如果GC含量是30％或更低，则选择该序列。在一个实施例中，对两个或更多个序列加以分析，并且选择具有最低GC含量的序列。在一个实施例中，在该生物的调节序列中确定脱靶匹配。在一个实施例中，该基因座位是调节区。一个方面提供了失活的指导RNA，其包含根据上述方法所选择的靶向序列。

在一个方面，本发明提供了用于将功能化的CRISPR系统靶向生物体内的基因座位的失活的指导RNA。在本发明的一个实施例中，该失活的指导RNA包含靶向序列，其中该靶序列的CG含量是70％或更低，并且该靶向序列的前15nt与该生物体内的另一个基因座位的调节序列中的CRISPR基序下游的脱靶序列不匹配。在某些实施例中，该靶向序列的GC含量是60％或更低、55％或更低、50％或更低、45％或更低、40％或更低、35％或更低或30％或更低。在某些实施例中，该靶向序列的GC含量是从70％至60％或从60％至50％或从50％至40％或从40％至30％。在一个实施例中，该靶向序列在该座位的潜在靶向序列之中具有最低的CG含量。

在本发明的一个实施例中，该失活的指导物的前15nt与该靶序列匹配。在另一个实施例中，该失活的指导物的前14nt与该靶序列匹配。在另一个实施例中，该失活的指导物的前13nt与该靶序列匹配。在另一个实施例中，该失活的指导物的前12nt与该靶序列匹配。在另一个实施例中，该失活的指导物的前11nt与该靶序列匹配。在另一个实施例中，该失活的指导物的前10nt与该靶序列匹配。在本发明的一个实施例中，该失活的指导物的前15nt与另一个基因座位的调节区中的CRISPR基序下游的脱靶序列不匹配。在其他实施例中，该失活的指导物的前14nt或前13nt、或该指导物的前12nt、或该失活的指导物的前11nt、或该失活的指导物的前10nt与另一个基因座位的调节区中的CRISPR基序下游的脱靶序列不匹配。在其他实施例中，该失活的指导物的前15nt、或14nt、或13nt、或12nt、或11nt与该基因组中的CRISPR基序下游的脱靶序列不匹配。

在某些实施例中，该失活的指导RNA在3'-端包括与靶序列不匹配的另外的核苷酸。因此，包括CRISPR基序下游的前15nt、或14nt、或13nt、或12nt、或11nt的失活的指导RNA在3'端的长度可以延长至12nt、13nt、14nt、15nt、16nt、17nt、18nt、19nt、20nt、或更长。

本发明提供了用于将Cas9 CRISPR-Cas系统(包括但不限于失活Cas9(dCas9)或功能化的Cas9系统(其可以包含功能化的Cas9或功能化的指导))引导至基因座位的方法。在一个方面，本发明提供了用于选择失活的指导RNA靶向序列并且将功能化的CRISPR系统引导至生物体内的基因座位的方法。在一个方面，本发明提供了用于选择失活的指导RNA靶向序列并且通过功能化的Cas9 CRISPR-Cas系统实现靶基因座位的基因调节的方法。在某些实施例中，该方法用于实现靶基因调节同时最小化脱靶效应。在一个方面，本发明提供了用于选择两个或更多个失活的指导RNA靶向序列并且通过功能化的Cas9 CRISPR-Cas系统实现两个或更多个靶基因座位的基因调节的方法。在某些实施例中，该方法用于实现两个或更多个靶基因座位的调节同时最小化脱靶效应。

在一个方面，本发明提供了选择用于将功能化的Cas9引导至生物体内的基因座位的失活的指导RNA靶向序列的方法，该方法包括：a)在该基因座位中定位一个或多个CRISPR基序；b)分析每个CRISPR基序下游的序列，通过：i)选择邻近于该CRISPR基序的10至15nt，ii)确定该序列的GC含量；并且c)如果该序列的GC含量是40％或更高，则选择该10至15nt序列作为用于在指导RNA中使用的靶向序列。在一个实施例中，如果GC含量是50％或更高，则选择该序列。在一个实施例中，如果GC含量是60％或更高，则选择该序列。在一个实施例中，如果GC含量是70％或更高，则选择该序列。在一个实施例中，对两个或更多个序列加以分析，并且选择具有最高GC含量的序列。在一个实施例中，该方法进一步包括向该序列的3'端添加核苷酸，这些核苷酸与该CRISPR基序下游的序列不匹配。一个方面提供了失活的指导RNA，其包含根据上述方法所选择的靶向序列。

在一个方面，本发明提供了用于将功能化的CRISPR系统引导至生物体内的基因座位的失活的指导RNA，其中该失活的指导RNA的靶向序列由邻近于该基因座位的CRISPR基序的10至15个核苷酸组成，其中该靶序列的CG含量是50％或更高。在某些实施例中，该失活的指导RNA进一步包含添加至该靶向序列的3'端的核苷酸，这些核苷酸与该基因座位的CRISPR基序下游的序列不匹配。

在一个方面，本发明提供了有待被引导至一个或多个、或两个或更多个基因座位的单个效应子。在某些实施例中，该效应子与Cas9相缔合，并且一种或多种、或两种或更多种失活的指导RNA被用来将Cas9相关效应子引导至一个或多个、或两个或更多个所选的靶基因座位。在某些实施例中，该效应子与一种或多种、或两种或更多种所选的失活的指导RNA相缔合，当与Cas9酶复合时，每种所选的失活的指导RNA都导致其相缔合的效应子定位至该失活的指导RNA靶标。这样的CRISPR系统的一个非限制性实例调节一个或多个、或两个或更多个易受同一转录调节因子调节的基因座位的活性。

在一个方面，本发明提供了有待被引导至一个或多个基因座位的两种或更多种效应子。在某些实施例中，采用两种或更多种失活的指导RNA，这两种或更多种效应子中的每者都与所选的失活的指导RNA相缔合，其中这两种或更多种效应子中的每者都被定位至其失活的指导RNA的所选靶标。这样的CRISPR系统的一个非限制性实例调节一个或多个、或两个或更多个易受不同转录调节因子调节的基因座位的活性。因此，在一个非限制性实施例中，两种或更多种转录因子被定位至单个基因的不同调节序列。在另一个非限制性实施例中，两种或更多种转录因子被定位至不同基因的不同调节序列。在某些实施例中，一种转录因子是激活因子。在某些实施例中，一种转录因子是抑制因子。在某些实施例中，一种转录因子是激活因子并且另一种转录因子是抑制因子。在某些实施例中，调节表达同一调节途径的不同组分的基因座位。在某些实施例中，调节表达不同调节途径的组分的基因座位。

在一个方面，本发明还提供了用于设计和选择失活的指导RNA的方法和算法，这些指导RNA对由活性Cas9 CRISPR-Cas系统介导的靶DNA切割或靶标结合和基因调节具有特异性。在某些实施例中，该Cas9 CRISPR-Cas系统使用活性Cas9提供了正交基因控制，该活性Cas9在一个基因座位处切割靶DNA同时结合至另一基因座位并且促进其调节。

在一个方面，本发明提供了选择用于在不进行切割的情况下将功能化的Cas9引导至生物体内的基因座位的失活的指导RNA靶向序列的方法，该方法包括：a)在该基因座位中定位一个或多个CRISPR基序；b)分析每个CRISPR基序下游的序列，通过i)选择邻近于该CRISPR基序的10至15nt，ii)确定该序列的GC含量；并且c)如果该序列的GC含量是30％或更高、40％或更高，则选择该10至15nt序列作为用于在失活的指导RNA中使用的靶向序列。在某些实施例中，该靶向序列的GC含量是35％或更高、40％或更高、45％或更高、50％或更高、55％或更高、60％或更高、65％或更高、或70％或更高。在某些实施例中，该靶向序列的GC含量是从30％至40％或从40％至50％或从50％至60％或从60％至70％。在本发明的一个实施例中，对基因座位中的两个或更多个序列加以分析，并且选择具有最高GC含量的序列。

在本发明的一个实施例中，评价了其GC含量的该靶向序列的部分是离PAM最近的15个靶核苷酸中的10至15个连续核苷酸。在本发明的一个实施例中，评价了其GC含量的该指导物的部分是离PAM最近的15个核苷酸中的10至11个核苷酸或11至12个核苷酸或12至13个核苷酸或13、或14、或15个连续核苷酸。

在一个方面，本发明进一步提供了用于鉴定失活的指导RNA的算法，这些指导RNA促进CRISPR系统基因座位切割同时避免功能激活或抑制。观察到16至20个核苷酸的失活的指导RNA中的增加的GC含量与增加的DNA切割和减少的功能激活相一致。

本文还证实到，可以通过向指导RNA的3'端增加核苷酸来增加功能化的Cas9的效率，这些核苷酸与CRISPR基序下游的靶序列不匹配。例如，关于在长度上为11至15nt的失活的指导RNA，较短的指导物可能不太可能促进靶标切割，但是在促进CRISPR系统结合和功能控制方面的效率也是较低的。在某些实施例中，向失活的指导RNA的3'端添加与靶序列不匹配的核苷酸提高激活效率而不增加不希望的靶标切割。在一个方面，本发明还提供了用于鉴定改进的失活的指导RNA的方法和算法，这些指导RNA有效地促进DNA结合和基因调节中的CRISPRP系统功能而不促进DNA切割。因此，在某些实施例中，本发明提供了包括CRISPR基序下游的前15nt、或14nt、或13nt、或12nt、或11nt并且通过与靶标错配的核苷酸将3'端的长度延长至12nt、13nt、14nt、15nt、16nt、17nt、18nt、19nt、20nt、或更长的失活的指导RNA。

在一个方面，本发明提供了用于实现选择性正交基因控制的方法。如将从本文的披露所理解的，根据本发明的失活的指导物选择(考虑了指导长度和GC含量)提供了由功能性Cas9 CRISPR-Cas系统进行的有效的且具选择性的转录控制，例如通过激活或抑制来调节基因座位的转录并且使脱靶效应最小化。因此，通过提供单独靶座位的有效调节，本发明还提供了两个或更多个靶座位的有效正交调节。

在某些实施例中，正交基因控制是通过激活或抑制两个或更多个靶座位。在某些实施例中，正交基因控制是通过激活或抑制一个或多个靶座位并且切割一个或多个靶座位。

在一个方面，本发明提供了包含非天然存在的Cas9 CRISPR-Cas系统的细胞，该系统包含所披露的或根据本文描述的方法或算法制备的一种或多种失活的指导RNA，其中一种或多种基因产物的表达已经被改变。在本发明的一个实施例中，两种或更多种基因产物在该细胞中的表达已发生改变。本发明还提供了来自这样一种细胞的细胞系。

在一个方面，本发明提供了包含一种或多种细胞的多细胞生物，这一种或多种细胞包含非天然存在的Cas9 CRISPR-Cas系统，该系统包含所披露的或根据本文描述的方法或算法制备的一种或多种失活的指导RNA。在一个方面，本发明提供了来自包含非天然存在的Cas9 CRISPR-Cas系统的细胞、细胞系、或多细胞生物的产品，该系统包含所披露的或根据本文描述的方法或算法制备的一种或多种失活的指导RNA。

本发明的一个另外的方面是使用包含如本文描述的一种或多种失活的指导物的gRNA，任选地与包含如本文描述的或现有技术中的一种或多种指导物的gRNA组合，与被工程化用于过表达Cas9或优选敲入Cas9中的系统(例如细胞、转基因动物、转基因小鼠、诱导型转基因动物，诱导型转基因小鼠)组合。其结果是，单系统(例如转基因动物、细胞)可以作为系统/网络生物学中的多元基因修饰的基础。由于这些失活的指导物，现在这在体外、离体和在体内均是可能的。

例如，一旦提供了Cas9，则可以提供一种或多种失活的gRNA，以引导多元基因调节，并且优选多元双向基因调节。如果必要或希望的话，可以按在空间和时间上适当的方式提供这一种或多种失活的gRNA(例如Cas9表达的组织特异性诱导)。由于在感兴趣的细胞、组织、动物中提供(例如表达)转基因/诱导型Cas9，包含失活的指导物的gRNA或包含指导物的gRNA两者是同样有效的。同样地，本发明的一个另外的方面是使用包含如本文描述的一种或多种失活的指导物的gRNA，任选地与包含如本文描述的或现有技术中的一种或多种指导物的gRNA组合，与被工程化用于敲除Cas9 CRISPR-Cas的系统(例如细胞、转基因动物、转基因小鼠、诱导型转基因动物，诱导型转基因小鼠)组合。

其结果是，如本文描述的失活的指导物与如本文描述的CRISPR应用和本领域已知的CRISPR应用的组合产生了高效且精确的系统(例如网络生物学)多元筛选工具。这样的筛选允许例如鉴定基因活性的特定组合，用于鉴定负责疾病(特别是基因相关疾病)的基因(例如开/关组合)。这样的筛选的优选应用是癌症。同样地，用于治疗此类疾病的筛选被包括在本发明之中。细胞或动物可暴露于导致疾病或疾病样效应的异常条件。可以提供候选组合物并且针对在所希望的多元环境中的效果对其进行筛选。例如，可以针对哪些基因组合将使得患者的癌细胞死亡对其进行筛选，并且然后使用这个信息来建立适当的疗法。

在一个方面，本发明提供了试剂盒，该试剂盒包括在此所述的组分中的一种或多种。该试剂盒可以包括如本文描述的失活的指导物，与或不与如本文描述的指导物一起。

本文提供的结构信息允许探询失活的gRNA与靶DNA和Cas9的相互作用，从而允许工程化或改变失活的gRNA的结构，以便优化整个Cas9 CRISPR-Cas系统的功能性。例如，可以在不与Cas9蛋白冲突的情况下通过插入可以结合至RNA的衔接蛋白来扩展失活的gRNA的环。这些衔接蛋白可以进一步募集效应蛋白或融合，这些效应蛋白或融合包括一个或多个功能结构域。

在一些优选实施例中，该功能结构域是转录激活结构域，优选VP64。在一些实施例中，该功能结构域是转录阻遏结构域，优选KRAB。在一些实施例中，该转录阻遏结构域是SID、或SID的多联体(例如SID4X)。在一些实施例中，该功能结构域是表观遗传修饰结构域，从而提供了表观遗传修饰酶。在一些实施例中，该功能结构域是激活结构域，其可以是P65激活结构域。

本发明的一个方面是上述组件被包含在单个组合物中或被包含在单独的组合物中。这些组合物可以有利地被应用于宿主，以在基因组水平上引出功能效应。

一般而言，按以下方式修饰失活的gRNA，该方式为衔接蛋白提供了结合用的特异性结合位点(例如适配体)，这些衔接蛋白包括一个或多个功能结构域(例如经由融合蛋白)。修饰经修饰的失活的gRNA，使得一旦该失活的gRNA形成CRISPR复合物(即结合至失活的gRNA和靶标的Cas9)，则这些衔接蛋白结合，并且衔接蛋白上的功能结构域被定位为有利于属性化功能有效的空间取向。例如，如果该功能结构域是转录激活因子(例如VP64或p65)，则该转录激活因子被放置为允许它影响靶标转录的空间取向。同样地，转录阻遏因子将被有利地定位为影响靶标的转录，并且核酸酶(例如Fok1)将被有利地定位为切割或部分裂解该靶标。

本领域技术人员应理解，对失活的gRNA的允许衔接子+功能结构域的结合但不允许衔接子+功能结构域的正确定位(例如由于CRISPR复合物的三维结构内的位阻)的修饰是并非预期的修饰。可以在如本文描述的四元环、茎环1、茎环2、或茎环3处，优选在四元环或茎环2处，并且最优选在四元环和茎环2两者处对这一种或多种经修饰的失活的gRNA进行修饰。

如本文所解释的，这些功能结构域可以是例如来自下组的一个或多个结构域，该组由以下各项组成：甲基酶活性、脱甲基酶活性、转录激活活性、转录阻遏活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性、DNA切割活性、核酸结合活性、以及分子开关(例如光诱导型)。在一些情况下，有利的是另外提供至少一个NLS。在一些情况下，有利的是将该NLS定位在N末端。当包括超过一个功能结构域时，这些功能结构域可以是相同的或不同的。

该失活的gRNA可以被设计成包括多个对相同或不同衔接蛋白具有特异性的结合识别位点(例如适配体)。该失活的gRNA可以被设计成结合至转录起始位点(即TSS)上游的启动区-1000-+1个核酸，优选-200个核酸。这种定位改进了影响基因激活(例如转录激活因子)或基因抑制(例如转录阻遏因子)的功能结构域。该经修饰的失活的gRNA可以是被靶向一个或多个靶座位、包含在组合物中的一种或多种修饰的失活的gRNA(例如至少1种gRNA、至少2种gRNA、至少5种gRNA、至少10种gRNA、至少20种gRNA、至少30种gRNA、至少50种gRNA)。

该衔接蛋白可以是任何数目的蛋白质，其结合至被引入经修饰的失活的gRNA中的适配体或识别位点并且一旦该失活的gRNA已经被掺入CRISPR复合物中，则允许一个或多个功能结构域的正确定位，以便影响具有属性化功能的靶标。如在本申请中所详细解释的，这些可以是外壳蛋白，优选噬菌体外壳蛋白。与这样的衔接蛋白(例如呈融合蛋白的形式)相缔合缔合的功能结构域可以包括例如来自下组的一个或多个结构域，该组由以下各项组成：甲基酶活性、脱甲基酶活性、转录激活活性、转录阻遏活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性、DNA切割活性、核酸结合活性、以及分子开关(例如光诱导型)。优选的结构域是Fok1、VP64、P65、HSF1、MyoD1。在该功能结构域是转录激活因子或转录阻抑因子的情况下，有利的是另外提供至少一个NLS并且优选在N末端处。当包括超过一个功能结构域时，这些功能结构域可以是相同的或不同的。该衔接蛋白可以利用已知接头来附接这样的功能结构域。

因此，该经修饰的失活的gRNA、该(失活的)Cas9(具有或不具有功能结构域)、以及具有一个或多个功能结构域的结合蛋白可以各自独立地被包含在组合物中并且被单独地或共同地给予至宿主。可替代地，这些组分可以被提供在用于给予至宿主的单个组合物中。可以经由本领域技术人员已知的或本文描述的用于递送到宿主的病毒载体(例如慢病毒载体、腺病毒载体、AAV载体)进行向宿主的给予。如本文所解释的，使用不同的选择标记(例如用于慢病毒gRNA选择)和gRNA浓度(例如取决于是否使用多种gRNA)对于引出改进的效果而言可以是有利的。

在这个概念的基础上，若干变化适于引出基因组座位事件，包括DNA切割、基因激活、或基因失活。使用所提供的组合物，本领域的普通技术人员可以有利地且特异性地靶向具有相同或不同功能结构域的单个或多个座位，以引出一个或多个基因组座位事件。这些组合物可以按多种多样的方法应用，用于在细胞中筛选文库和在体内进行功能建模(例如lincRNA的基因激活和功能鉴定；功能获得建模；功能缺失建模；使用本发明的组合物建立用于优化和筛选目的的细胞系和转基因动物)。

本发明包括本发明的组合物用于建立和利用条件型或诱导型CRISPR转基因细胞/动物的用途，这在本发明或本申请之前是不可信的。例如，该靶细胞条件性地或诱导性地包含Cas9(例如呈Cre依赖性构建体的形式)和/或条件性地或诱导性地包含衔接蛋白，并且在表达被引入该靶细胞中的载体之后，该载体表达该Cas9和/或衔接蛋白，这在该靶细胞中诱导或产生Cas9表达和/或衔接子表达的条件。通过应用本发明的传授和组合物与产生CRISPR复合物的已知方法，受功能结构域影响的诱导型基因组事件也是本发明的一个方面。一个实例是产生CRISPR敲入/条件型转基因动物(例如包含例如Lox-Stop-polyA-Lox(LSL)盒的小鼠)并且随后递送一种或多种组合物，这一种或多种组合物提供如本文描述的一种或多种经修饰的失活的gRNA(例如感兴趣的靶基因的TSS的-200个核苷酸，用于基因激活目的)(例如具有一种或多种由外壳蛋白例如MS2识别的适配体的经修饰的失活的gRNA)、一种或多种如本文描述的衔接蛋白(连接至一个或多个VP64的MS2结合蛋白)以及用于诱导条件型动物的工具(例如用于使得Cas9表达可诱导的Cre重组酶)。可替代地，该衔接蛋白可以被提供为具有条件型或诱导型Cas9的条件型或诱导型组件，以便提供用于筛选目的的有效模型，这有利地仅需要最少的设计和给予特异性失活的gRNA用于广泛的应用。

在另一个方面，这些失活的指导物被进一步修饰为改进特异性。可以合成受保护的失活的指导物，由此将二级结构引入该失活的指导物的3'端，以改进其特异性。受保护的指导RNA(pgRNA)包含能够杂交到细胞中的感兴趣的基因组座位中的靶序列上的指导序列和保护性链，其中该保护性链任选地与该指导序列互补并且其中该指导序列可以与该保护性链是部分可杂交的。该pgRNA任选地包括延伸序列。pgRNA-靶DNA杂交的热力学是由指导RNA与靶DNA之间的互补碱基的数目决定的。通过采用‘热力学保护’，可以通过添加保护性序列来改进失活的gRNA的特异性。例如，一种方法向失活的gRNA内的指导序列的3'端添加不同长度的互补保护性链。其结果是，该保护性链被结合到该失活的gRNA的至少一部分并且提供受保护的gRNA(pgRNA)。进而，本文的失活的gRNA参考物可以使用所描述的实施例容易地进行保护，从而产生pgRNA。该保护性链可以是单独的RNA转录物或链或者连接到失活的gRNA指导序列的3'端的嵌合形式。

串联指导物和在多元(串联)靶向方法中的用途

诸位发明人已经表明如本文定义的CRISPR酶可以采用多于一种RNA指导物而不会失去活性。这使得能够使用如本文定义的CRISPR酶、系统或复合物靶向多个DNA靶标、基因或基因座位，用如本文定义的单个酶、系统或复合物。这些指导RNA可以串联地排列，任选地由核苷酸序列(如本文定义的同向重复)隔开。串联的不同指导RNA的位置不影响活性。应注意，术语“CRISPR-Cas系统”、“CRISP-Cas复合物”、“CRISPR复合物”和“CRISPR系统”是可互换使用的。同样地，术语“CRISPR酶”、“Cas酶”或“CRISPR-Cas酶”可以是可互换使用的。在优选实施例中，所述CRISPR酶、CRISP-Cas酶或Cas酶是Cas9、或如在本文的其他地方描述的经修饰的或经突变的其变体中的任一种。

在一个方面，本发明提供了用于串联或多元靶向的非天然存在的或工程化的CRISPR酶，优选2类CRISPR酶，优选如本文描述的V型或VI型CRISPR酶，如但不限于如在本文的其他地方描述的Cas9。应理解的是，如在本文的其他地方描述的根据本发明的任何CRISPR(或CRISPR-Cas或Cas)酶、复合物、或系统都可以用于这样一种方法中。如在本文的其他地方描述的任何方法、产品、组合物和用途都同样适用于下文进一步详述的多元或串联靶向方法。通过进一步指导的方式，提供了以下具体方面和实施例。

在一个方面，本发明提供了如本文定义的Cas9酶、复合物或系统用于靶向多个基因座位的用途。在一个实施例中，这可以通过使用多个(串联或多元)指导RNA(gRNA)序列建立。

在一个方面，本发明提供了使用如本文定义的Cas9酶、复合物或系统的一种或多种组件用于串联或多元靶向的方法，其中所述CRISP系统包含多个指导RNA序列。优选地，所述gRNA序列由核苷酸序列(像如在本文的其他地方定义的同向重复)隔开。

如本文定义的Cas9酶、系统或复合物为修饰多个靶多核苷酸提供了有效工具。如本文定义的Cas9酶、系统或复合物具有多种多样的实用性，包括修饰(例如，缺失、插入、转位、失活、激活)多种细胞类型中的一个或多个靶多核苷酸。因此，如本文定义的本发明的Cas9酶、系统或复合物在例如基因治疗、药物筛选、疾病诊断、和预后中具有广谱应用，包括靶向单个CRISPR系统内的多个基因座位。

在一个方面，本发明提供了如本文定义的Cas9酶、系统或复合物，即具有以下项的Cas9CRISPR-Cas复合物：具有至少一个与其相关的去稳定结构域的Cas9蛋白、和靶向多个核酸分子(例如DNA分子)的多种指导RNA，由此所述多种指导RNA中每者都特异性地靶向其相应的核酸分子(例如DNA分子)。每个核酸分子靶标(例如，DNA分子)都可以编码基因产物或包括基因座位。因此使用多种指导RNA使得能够靶向多个基因座位或多个基因。在一些实施例中，该Cas9酶可以切割编码该基因产物的DNA分子。在一些实施例中，改变该基因产物的表达。该Cas9蛋白和这些指导RNA并不天然地一起存在。本发明包括包含串联排列的指导序列的指导RNA。本发明进一步包括经密码子优化以便在真核细胞中表达的Cas9蛋白的编码序列。在一个优选实施例中，该真核细胞是哺乳动物细胞、植物细胞或酵母细胞，并且在一个更优选的实施例中，该哺乳动物细胞是人类细胞。该基因产物的表达可以被降低。该Cas9酶可以构成CRISPR系统或复合物的一部分，该系统或复合物进一步包含串联排列的指导RNA(gRNA)，这些指导RNA包含一连串的2、3、4、5、6、7、8、9、10、15、25、25、30个、或超过30个指导序列，每个指导序列都能够特异性地杂交到细胞中的感兴趣的基因组座位中的靶序列上。在一些实施例中，该功能性Cas9 CRISPR系统或复合物结合至这多个靶序列。在一些实施例中，该功能性CRISPR系统或复合物可以编辑这多个靶序列，例如这些靶序列可以包括基因组座位，并且在一些实施例中，可以存在基因表达的改变。在一些实施例中，该功能性CRISPR系统或复合物可以进一步包括功能结构域。在一些实施例中，本发明提供了用于改变或修饰多种基因产物表达的方法。该方法可以包括引入含有所述靶核酸(例如，DNA分子)、或含有和表达靶核酸(例如，DNA分子)的细胞中；例如，这些靶核酸可以编码基因产物或提供基因产物(例如，调节序列)的表达。

在优选实施例中，用于多元靶向的CRISPR酶是Cas9，或者该CRISPR系统或复合物包含Cas9。在一些实施例中，用于多元靶向的CRISPR酶是AsCas9，或者用于多元靶向的CRISPR系统或复合物包含AsCas9。在一些实施例中，该CRISPR酶是LbCas9，或者该CRISPR系统或复合物包含LbCas9。在一些实施例中，用于多元靶向的Cas9酶切割DNA的两条链，以产生双链断裂(DSB)。在一些实施例中，用于多元靶向的CRISPR酶是切口酶。在一些实施例中，用于多元靶向的Cas9酶是双切口酶。在一些实施例中，用于多元靶向的Cas9酶是Cas9酶，像如在本文的其他地方定义的DD Cas9酶。

在实施例中，该Cas9可以配对，例如作为一对切口酶，例如SaCas9切口酶(eSaCas9切口酶)。此外，该Cas9可以用一种或两种或更多种指导物在AAV载体上进行包装。这可以如在弗里德兰(Friedland)AE等人，金黄色葡萄球Cas9的表征：用于一体化腺相关病毒递送和配对切口酶应用的较小的Cas9(Characterization of Staphylococcus aureus Cas9:asmaller Cas9 for all-in-one adeno-associated virus delivery and pairednickase applications)，基因组生物学(Genome Biol.)2015年11月24日；16:257.doi:10.1186/s13059-015-0817-8中描述的进行，将其披露通过引用而特此结合。

在一些普通实施例中，用于多元靶向的Cas9酶与一个或多个功能结构域相缔合。在一些更具体的实施例中，用于多元靶向的CRISPR酶是如在本文的其他地方定义的失活的Cas9。

在一个方面，本发明提供了递送用于在多靶向中使用的如本文定义的Cas9酶、系统或复合物或者本文定义的多核苷酸的工具。此类递送工具的非限制性实例是例如递送该复合物的一种或多种组分的一种或多种粒子、包含本文讨论的一种或多种多核苷酸的一种或多种载体(例如，编码该CRISPR酶、提供编码该CRISPR复合物的核苷酸)。在一些实施例中，该载体可以是质粒或病毒载体(如AAV或慢病毒)。用质粒瞬时转染进例如HEK细胞中可以是有利的，尤其是考虑到AAV的尺寸限制，并且在将Cas9装配进AAV中时用另外的指导RNA的情况下AAV可以达到上限。

还提供了模型，该模型组成性地表达用于在多元靶向中使用的如本文使用的Cas9酶、复合物或系统。该生物可以是转基因的，并且可以已经用本发明载体转染或者可以是这样转染的生物的后代。在一个另外的方面，本发明提供了组合物，这些组合物包含如本文定义的CRISPR酶、系统和复合物或本文描述的多核苷酸或载体。还提供了包含多种指导RNA(优选处于串联排列形式)的Cas9 CRISPR系统或复合物。所述不同的指导RNA可以由核苷酸序列(如同向重复)隔开。

还提供了治疗受试者(例如，对其有需要的受试者)的方法，该方法包括通过用编码该Cas9CRISPR系统或复合物的多核苷酸或本文描述的任何多核苷酸或载体转化该受试者而诱导基因编辑并且向该受试者给予它们。还可以提供适合的修复模板，例如通过包含所述修复模板的载体递送该修复模板。还提供了治疗受试者(例如，对其有需要的受试者)的方法，该方法包括通过用本文描述的多核苷酸或载体转化该受试者而诱导多个靶基因座位的转录激活或阻遏，其中所述多核苷酸或载体编码或包含该Cas9酶、复合物或系统，其包含优选串联排列的多种指导RNA。在任何处理离体地(例如在细胞培养物中)发生的情况下，则应当理解的是，术语‘受试者’可以由短语“细胞或细胞培养物”替换。

还提供了包含Cas9酶、复合物或系统(其包含优选串联排列的多种指导RNA)的组合物，或编码或包含所述Cas9酶、复合物或系统(其包含优选串联排列的多种指导RNA)的多核苷酸或载体，用于在如在本文的其他地方定义的处理方法中使用。可以提供包括这样的组合物的药盒。还提供了所述组合物在用于这样的治疗方法的药剂的制造中的用途。本发明还提供了Cas9 CRISPR系统在筛选(例如，功能获得筛选)中的用途。人为地强行过表达基因的细胞能够例如通过负反馈回路随时间下调该基因(重建平衡)。到筛选开始的时候，未经调节的基因可能再次被减少。使用诱导型Cas9激活因子允许正好在筛选之前诱导转录并且因此使假阴性命中的机会最小化。因此，通过在筛选(例如，功能获得筛选)中使用本发明，可以使假阴性结果的机会最小化。

在一个方面，本发明提供了工程化的、非天然存在的CRISPR系统，该系统包含Cas9蛋白和各自特异性地靶向在细胞中编码基因产物的DNA分子的多种指导RNA，由此这多种指导RNA各自靶向编码该基因产物的其特异性DNA分子，并且该Cas9蛋白切割编码该基因产物的靶DNA分子，由此改变该基因产物的表达；并且，其中该CRISPR蛋白和这些指导RNA并不天然地一起存在。本发明包括包含多个指导序列的多种指导RNA，这些指导序列优选由核苷酸序列(如同向重复)隔开并且任选地融合至tracr序列。在本发明的一个实施例中，该CRISPR蛋白是V型或VI型CRISPR-Cas蛋白，并且在一个更优选的实施例中，该CRISPR蛋白是Cas9蛋白。本发明进一步包括经密码子优化以便在真核细胞中表达的Cas9蛋白。在一个优选实施例中，该真核细胞是哺乳动物细胞，并且在一个更优选的实施例中，该哺乳动物细胞是人类细胞。在本发明的一个另外的实施例中，该基因产物的表达被降低。

在另一个方面，本发明提供了工程化的、非天然存在的载体系统，该载体系统包含一种或多种载体，这一种或多种载体包含第一调节组件和第二调节组件，该第一调节组件有效作地连接至多种Cas9CRISPR系统指导RNA，这些指导RNA各自特异性地靶向编码基因产物的DNA分子，该第二调节组件有效作地连接、编码CRISPR蛋白。两种调节组件可以位于该系统的相同载体上或位于不同载体上。这多种指导RNA靶向在细胞中编码多种基因产物的多个DNA分子，并且该CRISPR蛋白可以切割编码这些基因产物的多个DNA分子(它可以切割一条链或两条链或者基本上没有核酸酶活性)，由此改变这多种基因产物的表达；并且，其中该CRISPR蛋白和这多种指导RNA并不天然地一起存在。在一个优选实施例中，该CRISPR蛋白是Cas9蛋白，任选地经密码子优化以便在真核细胞中表达。在一个优选实施例中，该真核细胞是哺乳动物细胞、植物细胞或酵母细胞，并且在一个更优选的实施例中，该哺乳动物细胞是人类细胞。在本发明的一个另外的实施例中，这多种基因产物各自的表达被改变，优选被降低。

在一个方面，本发明提供了包含一种或多种载体的载体系统。在一些实施例中，该系统包含：(a)第一调节组件，该第一调节组件有效作地连接到同向重复序列和一个或多个插入位点，这一个或多个插入位点用于在该同向重复序列的上游或下游(以适用者为准)插入一个或多个指导序列，其中在表达时，这一个或多个指导序列引导该CRISPR复合物与真核细胞中的一个或多个靶序列的序列特异性结合，其中该CRISPR复合物包含Cas9酶，该酶与杂交到这一个或多个靶序列上的一个或多个指导序列复合；和(b)第二调节组件，该第二调节组件有效作地连接至编码所述Cas9酶的酶编码序列，该Cas9酶优选包括至少一个核定位序列和/或至少一个NES；其中组分(a)和(b)位于该系统的相同或不同载体上。在适用的情况下，还可以提供tracr序列。在一些实施例中，组分(a)进一步包括有效作地连接到该第一调节组件的两个或更多个指导序列，其中当表达时，这两个或更多个指导序列中的每者都引导Cas9 CRISPR复合物与真核细胞中的不同靶序列的序列特异性结合。在一些实施例中，该CRISPR复合物包括一个或多个核定位序列和/或一个或多个NES，其具有足够强度来在真核细胞的细胞核中或细胞核外驱动所述Cas9 CRISPR复合物以可检测的量积聚。在一些实施例中，该第一调节组件是聚合酶III启动子。在一些实施例中，该第二调节组件是聚合酶II启动子。在一些实施例中，这些指导序列中的每者在长度上是至少16、17、18、19、20、25个核苷酸，或16-30个之间、或16-25个之间、或16-20个之间的核苷酸。

重组表达载体可以包含处于适合于在宿主细胞中表达核酸的形式的编码用于在多靶向中使用的如本文定义的Cas9酶、系统或复合物的多核苷酸，这意味着这些重组表达载体包括基于待用于表达的宿主细胞而选择的一种或多种调节组件，所述调节组件有效作地连接至待表达的核酸序列。在重组表达载体内，“有效作地连接”旨在表示感兴趣的核苷酸序列以允许该核苷酸序列的表达的方式被连接至这一种或多种调节组件(例如，处于体外转录/翻译系统中或当该载体被引入宿主细胞中时，处于该宿主细胞中)。

在一些实施例中，用一种或多种载体瞬时或非瞬时转染宿主细胞，这一种或多种载体包含编码用于在多靶向中使用的如本文定义的Cas9酶、系统或复合物的多核苷酸。在一些实施例中，当细胞天然地出现在受试者体内时将其转染。在一些实施例中，被转染的细胞取自受试者。在一些实施例中，该细胞来源于取自受试者的细胞，如细胞系。用于组织培养的多种多样的细胞系在本领域是已知的并且在本文的其他地方示例。细胞系可获得自本领域的技术人员已知的多种来源(参见例如，美国典型培养物保藏中心(American TypeCulture Collection)(ATCC)(马纳萨斯(Manassus)，弗吉尼亚州))。在一些实施例中，使用用一种或多种载体转染的细胞建立包括一个或多个载体来源的序列的新细胞系，这一种或多种载体包含编码用于在多靶向中使用的如本文定义的Cas9酶、系统或复合物的多核苷酸。在一些实施例中，使用用如本文描述的用于在多靶向中使用的Cas9 CRISPR系统或复合物的组分转染(如通过用一种或多种载体进行瞬时转染、或用RNA进行转染)并且通过Cas9CRISPR系统或复合物的活性修饰的细胞建立新细胞系，该新细胞系包含以下细胞，这些细胞含有修饰但是缺少任何其他外源序列。在一些实施例中，在评估一种或多种测试化合物中使用用一种或多种载体瞬时或非瞬时转染的细胞，这一种或多种载体包含编码用于在多靶向中使用的如本文定义的Cas9酶、系统或复合物的多核苷酸。

术语“调节组件”是如在本文的其他地方所定义的。

有利的载体包括慢病毒以及腺相关病毒，并且也可选择此类型的载体以靶向具体类型的细胞。

在一个方面，本发明提供了真核宿主细胞，该真核宿主细胞包含(a)第一调节组件，该第一调节组件有效作地连接到同向重复序列和一个或多个插入位点，这一个或多个插入位点用于在该同向重复序列的上游或下游(以适用者为准)插入一个或多个指导RNA序列，其中在表达时，这一个或多个指导序列引导该Cas9 CRISPR复合物与真核细胞中的一个或多个对应靶序列的序列特异性结合，其中该Cas9CRISPR复合物包含Cas9酶，该酶与杂交到这一个或多个对应靶序列上的一个或多个指导序列复合；和/或(b)第二调节组件，该第二调节组件有效作地连接至编码所述Cas9酶的酶编码序列，该Cas9酶优选包括至少一个核定位序列和/或NES。在一些实施例中，该宿主细胞包括组分(a)以及(b)。在适用的情况下，还可以提供tracr序列。在一些实施例中，组分(a)、组分(b)、或组分(a)和(b)稳定地整合到该宿主真核细胞的基因组中。在一些实施例中，组分(a)进一步包括有效作地连接到该第一调节组件并且任选地由同向重复隔开的两个或更多个指导序列，其中当表达时，这两个或更多个指导序列中的每者都引导Cas9 CRISPR复合物与真核细胞中的不同靶序列的序列特异性结合。在一些实施例中，该Cas9酶包括一个或多个核定位序列和/或核输出序列或NES，其具有足够强度来在真核细胞的细胞核中和/或细胞核外驱动所述CRISPR酶以可检测的量积聚。

在一些实施例中，该Cas9酶是V型或VI型CRISPR系统酶。在一些实施例中，该Cas9酶是Cas9酶。在一些实施例中，该Cas9酶衍生自土拉热弗朗西丝菌1、土拉热弗朗西丝菌新凶手亚种(Francisella tularensis subsp.novicida)、易北河普氏菌(Prevotellaalbensis)、毛螺菌科细菌MC2017 1、分解蛋白丁酸弧菌(Butyrivibrioproteoclasticus)、Peregrinibacteria细菌GW2011_GWA2_33_10、Parcubacteria细菌GW2011_GWC2_44_17、密斯氏菌属(Smithella sp.)SCADC、氨基酸球菌属BV3L6、毛螺菌科细菌MA2020、Candidatus Methanoplasma termitum、挑剔真杆菌(Eubacterium eligens)、牛莫拉氏菌(Moraxella bovoculi)237、稻田钩端螺旋体(Leptospira inadai)、毛螺菌科细菌ND2006、狗口腔卟啉单胞菌(Porphyromonas crevioricanis)3、狄氏普氏菌(Prevotelladisiens)、或猕猴卟啉单胞菌(Porphyromonas macacae)Cas9，并且可以进一步包括如在本文的其他地方定义的该Cas9的改变或突变，并且可以是嵌合Cas9。在一些实施例中，该Cas9酶经密码子优化以便在真核细胞中表达。在一些实施例中，该CRISPR酶引导在该靶序列位置处的一条或两条链的切割。在一些实施例中，该第一调节组件是聚合酶III启动子。在一些实施例中，该第二调节组件是聚合酶II启动子。在一些实施例中，这一个或多个指导序列在长度上是(各自是)至少16、17、18、19、20、25个核苷酸，或16-30个之间、或16-25个之间、或16-20个之间的核苷酸。当使用多种指导RNA时，它们优选地由同向重复序列隔开。在一个方面，本发明提供了非人类真核生物；优选多细胞真核生物，包含根据所描述的实施例中任一项的真核宿主细胞。在其他方面，本发明提供了真核生物；优选多细胞真核生物，包含根据所描述的实施例中任一项的真核宿主细胞。在这些方面的一些实施例中，该生物可以是动物；例如哺乳动物。另外，该生物可以是节肢动物，如昆虫。该生物也可以是植物。另外，该生物可以是真菌。

在一个方面，本发明提供了试剂盒，该试剂盒包括在此所述的组分中的一种或多种。在一些实施例中，该试剂盒包括载体系统以及用于使用该试剂盒的说明书。在一些实施例中，该载体系统包含(a)第一调节组件，该第一调节组件有效作地连接到同向重复序列和一个或多个插入位点，这一个或多个插入位点用于在该同向重复序列的上游或下游(以适用者为准)插入一个或多个指导序列，其中在表达时，该指导序列引导Cas9 CRISPR复合物与真核细胞中的靶序列的序列特异性结合，其中该Cas9 CRISPR复合物包含Cas9酶，该酶与杂交到该靶序列上的指导序列复合；和/或(b)第二调节组件，该第二调节组件有效作地连接至编码所述Cas9酶的酶编码序列，该Cas9酶包含核定位序列。在适用的情况下，还可以提供tracr序列。在一些实施例中，该试剂盒包括位于该系统的相同或不同载体上的组分(a)和(b)。在一些实施例中，组分(a)进一步包括有效作地连接到该第一调节组件的两个或更多个指导序列，其中当表达时，该两个或更多个指导序列中的每个引导CRISPR复合物在真核细胞中与不同靶序列的序列特异性结合。在一些实施例中，该Cas9酶包括一个或多个核定位序列，其具有足够强度来在真核细胞的细胞核中驱动所述CRISPR酶以可检测的量积聚。在一些实施例中，该CRISPR酶是V型或VI型CRISPR系统酶。在一些实施例中，该CRISPR酶是Cas9酶。在一些实施例中，该Cas9酶衍生自土拉热弗朗西丝菌1、土拉热弗朗西丝菌新凶手亚种、易北河普氏菌、毛螺菌科细菌MC2017 1、分解蛋白丁酸弧菌、Peregrinibacteria细菌GW2011_GWA2_33_10、Parcubacteria细菌GW2011_GWC2_44_17、密斯氏菌属(Smithellasp.)SCADC、氨基酸球菌属BV3L6、毛螺菌科细菌MA2020、Candidatus Methanoplasmatermitum、挑剔真杆菌、牛莫拉氏菌237、稻田钩端螺旋体、毛螺菌科细菌ND2006、狗口腔卟啉单胞菌3、狄氏普氏菌、或猕猴卟啉单胞菌Cas9(例如，被修饰成具有至少一个DD或与其相缔合)，并且可以进一步包括该Cas9的改变或突变，并且可以是嵌合Cas9。在一些实施例中，该DD-CRISPR酶经密码子优化以便在真核细胞中表达。在一些实施例中，该DD-CRISPR引导在该靶序列位置处的一条或两条链的切割。在一些实施例中，该DD-CRISPR酶缺少或基本上缺少DNA链切割活性(例如，与野生型酶或没有降低核酸酶活性的突变或改变的酶相比，不超过5％核酸酶活性)。在一些实施例中，该第一调节组件是聚合酶III启动子。在一些实施例中，该第二调节组件是聚合酶II启动子。在一些实施例中，该指导序列在长度上是至少16、17、18、19、20、25个核苷酸，或16-30个之间、或16-25个之间、或16-20个之间的核苷酸。

在一个方面，本发明提供了修饰宿主细胞(如真核细胞)中的多个靶多核苷酸的方法。在一些实施例中，该方法包括允许Cas9 CRISPR复合物结合到多个靶多核苷酸上，例如以实施所述多个靶多核苷酸的切割，由此修饰多个靶多核苷酸，其中该Cas9 CRISPR复合物包含Cas9酶，该酶与各自杂交到所述靶多核苷酸内的特定靶序列上的多个指导序列复合，其中所述多个指导序列连接到同向重复序列。在适用的情况下，还可以提供tracr序列(例如以提供单个指导RNA，sgRNA)。在一些实施例中，所述切割包括通过所述Cas9酶切割在每个靶序列位置处的一条或两条链。在一些实施例中，所述切割导致这多个靶基因的转录降低。在一些实施例中，该方法进一步包括通过与外源模板多核苷酸同源重组修复所述经切割的靶多核苷酸中的一者或多者，其中所述修复导致突变，包括所述靶多核苷酸中的一者或多者的一个或多个核苷酸的插入、缺失、或取代。在一些实施例中，所述突变导致在从包含这一个或多个靶序列中的一者或多者的基因表达的蛋白质中的一个或多个氨基酸改变。在一些实施例中，该方法进一步包括将一种或多种载体递送到所述真核细胞，其中这一种或多种载体驱动下列一者或多者的表达：该Cas9酶和连接到同向重复序列的这多个指导RNA序列。在适用的情况下，还可以提供tracr序列。在一些实施例中，所述载体被递送到受试者内的真核细胞中。在一些实施例中，所述修饰发生在细胞培养物中的所述真核细胞中。在一些实施例中，该方法进一步包括在所述修饰之前从受试者中分离所述真核细胞。在一些实施例中，该方法进一步包括使所述真核细胞和/或从中衍生的细胞返回到所述受试者中。

在一个方面，本发明提供了修饰多个多核苷酸在真核细胞中的表达的方法。在一些实施例中，该方法包括允许Cas9 CRISPR复合物结合到多个多核苷酸上，这样使得所述结合导致所述多核苷酸的表达增加或降低；其中该Cas9 CRISPR复合物包含Cas9酶，该酶与各自特异性地杂交到所述多核苷酸内的其自身靶序列上的多个指导序列复合，其中所述指导序列连接到同向重复序列。在适用的情况下，还可以提供tracr序列。在一些实施例中，该方法进一步包括将一种或多种载体递送到所述真核细胞，其中这一种或多种载体驱动下列一者或多者的表达：该Cas9酶和连接到同向重复序列的这多个指导序列。在适用的情况下，还可以提供tracr序列。

在一个方面，本发明提供了重组多核苷酸，该重组多核苷酸包含同向重复序列上游或下游(以适用者为准)的多个指导RNA序列，其中当表达时这些指导序列中的每者都引导Cas9 CRISPRR复合物与存在于真核细胞中的其对应的靶序列的序列特异性结合。在一些实施例中，该靶序列是存在于真核细胞中的病毒序列。在适用的情况下，还可以提供tracr序列。在一些实施例中，该靶序列是原癌基因或癌基因。

本发明的方面包括非天然存在的或工程化的组合物，该组合物可以包含指导RNA(gRNA)，该指导RNA包含能够杂交到细胞中的感兴趣的基因组座位中的靶序列上的指导序列，以及如本文定义的Cas9酶，该酶可以包括至少一个或多个核定位序列。

本发明的一个方面包括通过向细胞中引入本文描述的任何组合物来修饰感兴趣的基因组座位以改变该细胞中的基因表达的方法。

如本文使用的，术语“指导RNA”或“gRNA”具有如在本文的其他地方使用的含义，并且包括与靶核酸序列具有足够互补性以与该靶核酸序列杂交并且引导靶向核酸的复合物与该靶核酸序列的序列特异性结合的任何多核苷酸序列。每种gRNA都可以被设计成包括多个对相同或不同衔接蛋白具有特异性的结合识别位点(例如，适配体)。每种gRNA都可以被设计成结合至转录起始位点(即TSS)上游的启动区-1000-+1个核酸，优选-200个核酸。这种定位改进了影响基因激活(例如，转录激活因子)或基因抑制(例如，转录阻遏因子)的功能结构域。该经修饰的gRNA可以是被靶向一个或多个靶座位、包含在组合物中的一种或多种修饰的gRNA(例如，至少1种gRNA、至少2种gRNA、至少5种gRNA、至少10种gRNA、至少20种gRNA、至少30种gRNA、至少50种gRNA)。所述多个gRNA序列可以是串联排列的并且优选由同向重复隔开。

因此，如本文定义的gRNA、CRISPR酶可以各自独立地被包含在组合物中并且被单独地或共同地给予至宿主。可替代地，这些组分可以被提供在用于给予至宿主的单个组合物中。可以经由本领域技术人员已知的或本文描述的用于递送到宿主的病毒载体(例如，慢病毒载体、腺病毒载体、AAV载体)进行向宿主的给予。如本文所解释的，使用不同的选择标记(例如，用于慢病毒sgRNA选择)和gRNA浓度(例如，取决于是否使用多种gRNA)对于引出改进的效果而言可以是有利的。在这个概念的基础上，若干变化适于引出基因组座位事件，包括DNA切割、基因激活、或基因失活。使用所提供的组合物，本领域的普通技术人员可以有利地且特异性地靶向具有相同或不同功能结构域的单个或多个座位，以引出一个或多个基因组座位事件。这些组合物可以按多种多样的方法应用，用于在细胞中筛选文库和在体内进行功能建模(例如，lincRNA的基因激活和功能鉴定；功能获得建模；功能缺失建模；使用本发明的组合物建立用于优化和筛选目的的细胞系和转基因动物)。

本发明包括本发明的组合物用于建立和利用条件型或诱导型CRISPR转基因细胞/动物的用途；参见例如，普莱特(Platt)等人，《细胞》(Cell)(2014)，159(2):440-455，或者本文引用的PCT专利出版物，如WO 2014/093622(PCT/US 2013/074667)。例如，细胞或动物(如非人类动物，例如脊椎动物或哺乳动物，如啮齿动物例如小鼠、大鼠，或其他实验室或田间动物例如猫、狗、绵羊等)可以是‘敲入的’，由此类似于普莱特(Platt)等人，该动物条件性地或诱导性地表达Cas9。该靶细胞或动物因此条件性地或诱导性地包含CRISPR酶(例如，Cas9)(例如，呈Cre依赖性构建体的形式)，在表达被引入该靶细胞中的载体之后，该载体表达该CRISPR酶(例如，Cas9)，这在该靶细胞中诱导或产生该CRISPR酶(例如，Cas9)表达的条件。通过应用如本文定义的传授和组合物与产生CRISPR复合物的已知方法，诱导型基因组事件也是本发明的一个方面。这样的诱导型事件的实例已经在本文的其他地方进行了描述。

在一些实施例中，当靶向遗传疾病时，尤其是在治疗方法中，并且优选在提供修复模板以校正或改变表型的情况下，表型改变优选是基因组修饰的结果。

在一些实施例中，可以被靶向的疾病包括与引起疾病的剪接缺陷有关的那些。

在一些实施例中，细胞靶标包括造血干细胞/祖细胞(CD34+)；人类T细胞；以及眼(视网膜细胞)-例如光感器前体细胞。

在一些实施例中，基因靶标包括：人类β珠蛋白-HBB(用于治疗镰状细胞贫血，包括通过刺激基因转换(使用密切相关的HBD基因作为内源模板))；CD3(T细胞)；以及CEP920-视网膜(眼)。

在一些实施例中，疾病靶标还包括：癌症；镰状细胞贫血(基于点突变)；HBV、HIV；β-地中海贫血；以及眼科或眼部疾病-例如引起莱伯(Leber)先天性黑朦(LCA)的剪接缺陷。

在一些实施例中，递送方法包括：酶-指导复合物(核糖核蛋白)的阳离子脂质介导的“直接”递送和质粒DNA的电穿孔。

在此描述的方法、产物和用途可以用于非治疗目的。此外，在此描述的方法中的任一项可以体外或离体应用。

在一个方面，提供了非天然存在的或工程化的组合物，该组合物包含：

I.两个或更多个CRISPR-Cas系统多核苷酸序列，其包含

(a)第一指导序列，该第一指导序列能够杂交到多核苷酸座位中的第一靶序列上，

(b)第二指导序列，该第二指导序列能够杂交到多核苷酸座位中的第二靶序列上，

(c)同向重复序列，

以及

II.Cas9酶或编码它的第二多核苷酸序列，

其中在转录时，该第一指导序列和该第二指导序列分别引导第一Cas9 CRISPR复合物和第二Cas9CRISPR复合物与该第一靶序列和第二靶序列的序列特异性结合，

其中该第一CRISPR复合物包含与可杂交到该第一靶序列上的第一指导序列复合的Cas9酶，

其中该第二CRISPR复合物包含与可杂交到该第二靶序列上的第二指导序列复合的Cas9酶，并且

其中该第一指导序列引导邻近该第一靶序列的DNA双链体的一条链的切割，并且该第二指导序列引导邻近该第二靶序列的另一条链的切割，从而诱导双链断裂，由此修饰该生物或该非人类或非动物生物。类似地，可以设想包含多于两种指导RNA的组合物，例如这些指导RNA各自对一种靶标具有特异性，并且被串联地排列在如本文描述的组合物或CRISPR系统或复合物中。

在另一个实施例中，该Cas9作为蛋白质递送到该细胞中。在另一个并且特别优选的实施例中，该Cas9作为蛋白质或作为编码它的核苷酸序列递送到该细胞中。作为蛋白质递送至细胞可以包括核糖核蛋白(RNP)复合物的递送，在该复合物中该蛋白质与这多种指导物复合。

在一个方面，提供了通过本发明的组合物、系统或经修饰的酶修饰的或包含本发明的组合物、系统或经修饰的酶的宿主细胞和细胞系，包括干细胞及其子代。

在一个方面，提供了细胞治疗方法，在这些方法中，例如对单个细胞或细胞群进行取样或培养，其中该细胞或这些细胞如本文描述地进行离体修饰或已经如本文描述地进行离体修饰，并且然后被重新引入(取样的细胞)或引入(培养的细胞)该生物体内。干细胞(无论是胚胎干细胞还是诱导型多能或全能干细胞)在这一点上也是特别优选的。但是，当然还设想了体内实施例。

本发明方法可以进一步包括递送模板，如修复模板，它们可以是dsODN或ssODN，参见下文。模板的递送可以经由与任何或所有CRISPR酶或指导RNA的递送同时的或分开的递送并且经由相同或不同的递送机制。在一些实施例中，优选的是一起递送该模板与这些指导RNA，并且优选地还有该CRISPR酶。实例可以是AAV载体，其中该CRISPR酶是AsCas9或LbCas9。

本发明方法可以进一步包括：(a)向该细胞递送双链寡脱氧核苷酸(dsODN)，该双链寡脱氧核苷酸包含与通过所述双链断裂产生的突出端互补的突出端，其中所述dsODN被整合进该感兴趣的座位中；或-(b)向该细胞递送单链寡脱氧核苷酸(ssODN)，其中所述ssODN充当所述双链断裂的同源定向修复的模板。本发明的方法可以用于预防或治疗个体的疾病，任选地其中所述疾病是由所述感兴趣座位中的缺陷引起。本发明的方法可以是在该个体的体内进行或针对取自该个体的细胞离体地进行，任选地其中将所述细胞返回到该个体。

本发明还包括通过使用如本文定义的用于在串联或多靶向中使用的CRISPR酶或Cas酶或Cas9酶或CRISPR-CRISPR酶或CRISPR-Cas系统或CRISPR-Cas9系统获得的产品。

根据本发明的、Cas9 CRISPR-Cas系统的受护航的指导物

在一个方面，本发明提供了受护航的Cas9 CRISPR-Cas系统或复合物，尤其是涉及受护航的Cas9 CRISPR-Cas系统指导物的这样一种系统。所谓“受护航的”意指该Cas9CRISPR-Cas系统或复合物或指导物被递送到细胞内的所选时间和地点，这样使得在空间上或在时间上控制该Cas9 CRISPR-Cas系统或复合物或指导物的活性。例如，可以通过护航性RNA适配体序列控制该Cas9 CRISPR-Cas系统或复合物或指导物的活性和目的地，该护航性RNA适配体序列对适配体配体(如，细胞表面蛋白或其他局部化细胞组分)具有结合亲和力。可替代地，该护航性适配体可以例如响应于该细胞上或该细胞中的适配体效应子，如瞬态效应子，如在特定时间施加到该细胞的外部能源。

这些受护航的Cas9 CRISPR-Cas系统或复合物具有功能结构被设计成改进gRNA结构、架构、稳定性、遗传表达、或其任何组合的gRNA。这样一种结构可以包括适配体。

适配体是可以被设计或选择为紧密地结合至其他配体的生物分子，例如使用称为指数富集配体系统进化法(SELEX；蒂尔克(Tuerk)C、戈尔德(Gold)L：“指数富集配体系统进化法：噬菌体T4 DNA聚合酶的RNA配体(Systematic evolution of ligands byexponential enrichment:RNA ligands to bacteriophage T4 DNA polymerase)”.《科学》(Science)1990，249:505-510)的技术。核酸适配体可以例如选自对范围广泛的生物医学相关靶标具有高结合亲和力和特异性的随机序列寡核苷酸池，从而暗示了适配体的范围广泛的治疗实用性(基夫，安东尼(Keefe,Anthony)D.、塞博利亚帕伊(Supriya Pai)、和安德鲁艾灵顿(Andrew Ellington).“作为治疗剂的适配体(Aptamers as therapeutics)”.《自然评论药物发现》(Nature Reviews Drug Discovery)9.7(2010):537-550)。这些特征还暗示了适配体作为药物递送运载体的范围广泛的用途(列维-尼森鲍姆，艾加(Levy-Nissenbaum,Etgar)等人，“纳米技术与适配体：在药物递送中的应用(Nanotechnology andaptamers:applications in drug delivery)”.《生物技术趋势》(Trends inbiotechnology)26.8(2008):442-449；以及黑科(Hicke)BJ、史蒂芬斯(Stephens)AW.“护航性适配体：诊断和治疗用的递送服务(Escort aptamers:a delivery service fordiagnosis and therapy)”.《临床研究杂志》(J Clin Invest)2000，106:923-928)。还可以通过改变特性来构建充当响应于que的分子开关的适配体，如结合荧光团以模拟绿色荧光蛋白的活性的RNA适配体(佩奇，杰里米(Paige,Jeremy)S.、凯伦Y.吴(Karen Y.Wu)、和萨米R.贾弗里(Samie R.Jaffrey).“绿色荧光蛋白的RNA模拟物(RNA mimics of greenfluorescent protein)”.《科学》(Science)333.6042(2011):642-646)。还已经表明，适配体可以用作靶向的siRNA治疗性递送系统的组分，例如靶向细胞表面蛋白(周杰华(Zhou,Jiehua)和约翰J.罗西(John J.Rossi).“适配体靶向的细胞特异性RNA干扰(Aptamer-targeted cell-specific RNA interference)”.《沉默》(Silence)1.1(2010):4)。

因此，本文提供了例如通过一种或多种适配体修饰的gRNA，这一种或多种适配体被设计成改进gRNA递送，包括跨细胞膜到胞内区室的递送、或细胞核的递送。除了这一种或多种适配体之外或没有这样的一种或多种适配体，这样的一种结构可以包括一种或多种部分，以便使得该指导可递送、可诱导或响应于所选效应子。本发明因此包括响应于正常或病理生理条件的gRNA，包括但不限于pH、低氧、O₂浓度、温度、蛋白质浓度、酶浓度、脂质结构、光暴露、机械破坏(例如超声波)、磁场、电场、或电磁辐射。

本发明的一个方面提供了非天然存在的或工程化的组合物，该组合物包含受护航的指导RNA(egRNA)，该受护航的指导RNA包含：

RNA指导序列，该RNA指导序列能够杂交到细胞中的感兴趣的基因组座位中的靶序列上；以及，

护航性RNA适配体序列，其中该护航性适配体对该细胞上或该细胞中的适配体配体具有结合亲和力，或者该护航性适配体响应于该细胞上或该细胞中的局部化适配体效应子，其中该适配体配体或效应子在该细胞上或该细胞中的存在在空间上或在时间上是受限的。

该护航性适配体可以例如响应于与该细胞中的适配体配体或效应子的相互作用而改变构象。

该护航性适配体可以对该适配体配体具有特异性结合亲和力。

该适配体配体可以位于该细胞中的位置或区室，例如在该细胞的细胞膜上或细胞膜中。该护航性适配体与该适配体配体的结合可以因此将该egRNA引导至该细胞中的感兴趣的位置，如通过结合至作为细胞表面配体的适配体配体的方式而到该细胞的内部。以此方式，可以靶向该细胞内的多个空间上受限的位置，如细胞核或线粒体。

一旦已经引入预期的改变，如通过在细胞基因组中编辑预期的基因拷贝，便不再需要在该细胞中继续CRISPR/Cas9表达。的确，持续表达在非预期基因组位点处存在脱靶效应的某些酪蛋白情况下等是不希望的。因此，限时表达是有用的。诱导型表达提供了一种方法，但是此外申请人已经工程化自行失活性Cas9 CRISPR-Cas系统，该系统依赖于在该CRISPR载体本身内使用非编码指导靶序列。因此，表达开始后，该CRISPR系统将导致其自身的破坏，但是在破坏完成之前，它将有时间编辑靶基因的基因组拷贝(在二倍体细胞中具有正常点突变的情况下，需要至多两个编辑)。简单地，该自行失活性Cas9 CRISPR-Cas系统包括另外的RNA(即，指导RNA)，其靶向CRISPR酶自身的编码序列或靶向与存在于下列一项或多项中的独特序列互补的非编码指导靶序列：(a)在驱动非编码RNA组件的表达的启动子内，(b)在驱动Cas9基因的表达的启动子内，(c)在Cas9编码序列中的100bp的ATG翻译起始密码子内，(d)在病毒递送载体的反向末端重复(iTR)内(例如，在AAV基因组中)。

该egRNA可以包括RNA适配体连接序列，其有效地将护航RNA序列连接至RNA指导序列。

在实施例中，该egRNA可以包括一个或多个光不稳定的键或非天然存在的残基。

在一个方面，该护航性RNA适配体序列可以与靶miRNA互补，该靶miRNA可以或可以不存在于细胞内，这样使得仅当存在该靶miRNA时，才存在该护航性RNA适配体序列与该靶miRNA的结合，这使得该egRNA被该细胞内的RNA诱导沉默复合体(RISC)切割。

在实施例中，该护航性RNA适配体序列在长度上可以例如是从10至200个核苷酸，并且该egRNA可以包括多于一个护航性RNA适配体序列。

应理解的是，如在本文的其他地方描述的任何RNA指导序列都可以用在本文描述的egRNA中。在本发明的某些实施例中，该指导RNA或成熟crRNA包括同向重复序列和指导序列或间隔子序列、基本上由其组成、或由其组成。在某些实施例中，该指导RNA或成熟crRNA包括连接至指导序列或间隔子序列的同向重复序列、基本上由其组成、或由其组成。在某些实施例中，该指导RNA或成熟crRNA包括19nt的部分同向重复，之后是23-25nt的指导序列或间隔子序列。在某些实施例中，该效应蛋白是FnCas9效应蛋白并且需要至少16nt的指导序列来实现可检测的DNA切割以及最少17nt的指导序列来实现有效的体外DNA切割。在某些实施例中，该同向重复序列位于该指导序列或间隔子序列的上游(即，5')。在一个优选实施例中，该FnCas9指导RNA的种子序列(即，对于识别和/或杂交到靶座位处的序列而言必需、关键的序列)大约在该指导序列或间隔子序列的5'端上的前5nt内。

该egRNA可以与Cas9一起被包括在非天然存在的或工程化的Cas9 CRISPR-Cas复合物组合物中，该Cas9可以包括至少一个突变，例如使得该Cas9具有不超过5％的没有这至少一个突变的Cas9的核酸酶活性的突变，例如与没有这至少一个突变的Cas9相比，具有减弱至少97％、或100％的核酸酶活性。该Cas9还可以包括一个或多个核定位序列。在本文的其他地方描述了具有经调节的活性(如减弱的核酸酶活性)的经突变的Cas9酶。

该工程化的Cas9 CRISPR-Cas组合物可以被提供在细胞(如真核细胞、哺乳动物细胞、或人类细胞)中。

在实施例中，本文描述的组合物包含Cas9 CRISPR-Cas复合物，该复合物具有至少三个功能结构域，其中的至少一个与Cas9相缔合并且其中的至少两个与egRNA相缔合。

本文描述的组合物可以用于将基因组座位事件引入宿主细胞(如真核细胞，特别是哺乳动物细胞)中、或非人类真核生物(特别是非人类哺乳动物，如小鼠)体内。该基因组座位事件可以包括影响座位中的基因激活、基因抑制、或切割。本文描述的组合物还可以用于修饰感兴趣的基因组座位，以改变细胞中的基因表达。在本文的其他地方详细描述了使用本文提供的Cas9酶在宿主细胞中引入基因组座位事件的方法。该组合物的递送可以例如通过以下方式：递送编码该组合物的一种或多种核酸分子，这一种或多种核酸分子操作性地连接到一个或多个调节序列，并且体内地表达这一种或多种核酸分子，例如通过慢病毒、腺病毒，或AAV的方式。

本发明提供了通过其可以调整gRNA介导的基因编辑活性的组合物和方法。本发明提供了gRNA二级结构，这些结构通过增加gRNA和/或增加递送到该细胞中的RNA的量而改进切割效率。该gRNA可以包括光不稳定型或诱导型核苷酸。

为了增加gRNA(例如通过病毒或非病毒技术递送的gRNA)的有效性，申请人将二级结构添加进该gRNA中，这些结构增强其稳定性并且改进基因编辑。分开地，为了克服有效递送的缺乏，申请人用细胞渗透RNA适配体修饰了gRNA；这些适配体结合至细胞表面受体并且促进该gRNA进入细胞中。值得注意地，这些细胞渗透适配体可以被设计成靶向特定细胞受体，以便介导细胞特异性递送。申请人还已经创造了可诱导的指导物。

可以经由隐花色素-2和CIB1的激活和结合来实现诱导型系统的光反应性。蓝光刺激在隐花色素-2中诱导激活性构象变化，从而导致募集其结合配偶体CIB1。这种结合是快速且可逆的，从而在脉冲刺激后<15sec内实现饱和并且在刺激结束后<15min内返回基线。这些快速结合动力学产生这样一种系统，其仅暂时受转录/翻译和转录物/蛋白质降解的速度的约束，而不受诱导剂的摄取和清除的约束。隐花色素-2激活也是高度敏感的，从而允许使用低的光强度刺激并且缓解光毒性的风险。另外，在如完整的哺乳动物脑的背景下，可以使用可变的光强度来控制刺激区域的尺寸，从而允许比单独的载体递送可以提供的大的精度。

本发明考虑了用于诱导该指导物的能源，如电磁辐射、声能或热能。有利地，电磁辐射是可见光的成分。在一个优选实施例中，光是波长为约450至约495nm的蓝光。在一个尤其优选的实施例中，波长是约488nm。在另一个优选实施例中，光刺激是经由脉冲。光功率的范围可以是从约0-9mW/cm²。在一个优选实施例中，低至0.25sec/15sec的刺激范例应该引起最大激活。

本发明的实践中所涉及的细胞可以是原核细胞或真核细胞，有利地是动物细胞、植物细胞或酵母细胞，更有利地是哺乳动物细胞。

该化学或能量敏感型指导可以在通过结合化学源或通过允许它充当指导并且具有Cas9CRISPR-Cas系统或复合物功能的能源诱导之后经历构象变化。本发明可以涉及应用该化学源或能量，以便具有该指导功能和该Cas9 CRISPR-Cas系统或复合物功能；并且任选地进一步确定该基因组座位的表达被改变。

这种化学诱导型系统存在若干不同设计：1.可通过脱落酸(ABA)诱导的基于ABI-PYL的系统(参见例如，http://stke.sciencemag.org/cgi/content/abstract/sigtrans；4/164/rs2)，2.可通过雷帕霉素(或基于雷帕霉素的相关化学品)诱导的基于FKBP-FRB的系统(参见例如，http://www.nature.com/nmeth/journal/v2/n6/full/nmeth763.html)，3.可通过赤霉素(GA)诱导的基于GID1-GAI的系统(参见例如，http://www.nature.com/nchembio/journal/v8/n5/full/nchembio.922.html)。

由本发明所考虑的另一种系统是基于亚细胞定位变化的化学诱导型系统。申请人还开发了这样一种系统，在该系统中该多肽包括DNA结合结构域，该结构域包括至少五个或更多个转录激活因子样效应子(TALE)单体，并且至少一半或多于一半的被特异性地要求对连接到至少一个或多个效应子结构域上的感兴趣基因组座位进行靶向的单体被进一步连接到化学或能量敏感型蛋白。当化学或能量传递物与该化学或能量敏感型蛋白结合时，这种蛋白将导致整个多肽的亚细胞定位变化(即将整个多肽从细胞质运输到细胞的细胞核)。整个多肽从一个亚细胞区室或细胞器(在其中由于缺乏效应子结构域的底物，其活性被封存)向另一个亚细胞区室或细胞器(在其中存在该底物)的这种运输将允许整个多肽与其希望的底物(即哺乳动物细胞核中的基因组DNA)相接触并且导致靶基因表达的激活或阻遏。

当该效应子结构域是核酸酶时，这种类型的系统还可以用于诱导细胞中的感兴趣的基因组座位的切割。

化学诱导型系统可以是可通过4-羟基他莫昔芬(4OHT)诱导的基于雌激素受体(ER)的系统(参见例如，http://www.pnas.org/content/104/3/1027.abstract)。当结合4-羟基他莫昔芬时，称为ERT2的雌激素受体的经突变的配体结合结构域易位到细胞的细胞核中。在本发明的另外的实施例中，任何核受体、甲状腺激素受体、视黄酸受体、雌激素受体、雌激素相关受体、糖皮质激素受体、孕酮受体、雄激素受体的任何天然存在的或工程化的衍生物都可以用在与基于ER的诱导型系统类似的诱导型系统中。

另一种诱导型系统是基于使用可通过能量、热或无线电波诱导的基于瞬时受体电势(TRP)离子通道的系统的设计(参见例如，http://www.sciencemag.org/content/336/6081/604)。这些TRP家族蛋白响应于不同刺激，包括光和热。当这种蛋白被光或热激活时，该离子通道将打开并且允许离子如钙进入质膜中。这种离子流入将结合至连接到多肽上的细胞内离子相互作用配偶体，该多肽包括该Cas9 CRISPR-Cas复合物或系统的指导和其他组分，并且该结合将诱导该多肽的亚细胞定位的变化，从而使得整个多肽进入细胞的细胞核。一旦在细胞核内，该Cas9 CRISPR-Cas复合物的指导蛋白和其他组分将是具活性的并且调节细胞中的靶基因表达。

这种类型的系统还可以用于诱导细胞中的感兴趣的基因组座位的切割；并且在此方面，应指出的是该Cas9酶是核酸酶。光可以通过激光或其他形式的能源产生。热可以通过提高温度来产生，温度的提高是由能源造成的、或由在从以无线电波形式递送的能源吸收能量之后释放热的纳米粒子造成的。

虽然光激活可以是一个有利的实施例，但是有时它可能是不利的，尤其是对于光可以不穿透皮肤或其他器官的体内应用而言。在这种情况下，考虑了能量激活的其他方法，特别是具有类似作用的电场能和/或超声。

电场能优选地基本上如本领域所描述地给予，在体内条件下使用从约1伏特/cm至约10千伏特/cm的一个或多个电脉冲。代替脉冲或除脉冲之外，电场可以按连续方式递送。电脉冲可以施加1μs与500毫秒之间，优选1μs与100毫秒之间。电场可以连续地或按脉冲方式施加约5分钟。

如本文使用的，‘电场能’是细胞所暴露的电能。优选地，在体内条件下，电场具有从约1伏特/cm至约10千伏特/cm或更高的强度(参见WO 97/49450)。

如本文使用的，术语“电场”包括电容和电压可变的一个或多个脉冲，并且包括指数波和/或方波和/或调制波和/或调制方波形式。对电场和电的提及应被视为包括在细胞环境中电势差的存在的提及。这样一种环境可以通过静电、交流电(AC)、直流电(DC)等的方式来建立，如本领域已知的。电场可以是均匀的、不均匀的或其他方式的，并且可以按时间依赖性方式在强度和/或方向上变化。

按任何顺序并且按任何组合单次或多次施加电场、以及单次或多次施加超声也是可能的。超声和/或电场可以作为单次或多次连续施加、或作为脉冲(脉冲式递送)进行递送。

电穿孔已经用在体外和体内两种程序中，以便向活细胞中引入外来材料。对于体外应用，将活细胞样品首先与感兴趣的试剂混合并且放置在电极(如平行板)之间。然后，这些电极向该细胞/植入物混合物施加电场。执行体外电穿孔的系统的实例包括ElectroCell Manipulator ECM600产品、和Electro Square Porator T820，两者均由BTXDivision of Genetronics公司制造(参见美国专利号5,869,326)。

已知的电穿孔技术(体外和体内两者)通过向定位在处理区域周围的电极施加短暂的高压脉冲起作用。电极之间产生的电场导致细胞膜暂时变为多孔的，此时感兴趣试剂的分子进入细胞。在已知的电穿孔应用中，这个电场包括大约1000V/cm、大约约100.mu.s持续时间的单脉冲方波。这样一个脉冲可以例如在Electro Square Porator T820的已知应用中产生。

优选地，在体外条件下，电场具有从约1V/cm至约10kV/cm的强度。因此，电场可以具有1V/cm、2V/cm、3V/cm、4V/cm、5V/cm、6V/cm、7V/cm、8V/cm、9V/cm、10V/cm、20V/cm、50V/cm、100V/cm、200V/cm、300V/cm、400V/cm、500V/cm、600V/cm、700V/cm、800V/cm、900V/cm、1kV/cm、2kV/cm、5kV/cm、10kV/cm、20kV/cm、50kV/cm或更高的强度。更优选地，在体外条件下从约0.5kV/cm至约4.0kV/cm。优选地，在体内条件下，电场具有从约1V/cm至约10kV/cm的强度。然而，在增加递送到靶位点的脉冲数的情况下，可以降低电场强度。因此，设想了较低场强的电场的脉冲式递送。

优选地，电场的施加是以多脉冲的形式，如强度和电容相同的双脉冲或强度和/或电容变化的顺序脉冲。如本文使用的，术语“脉冲”包括电容和电压可变的一个或多个电脉冲，并且包括指数波和/或方波和/或调制波/方波形式。

优选地，电脉冲作为选自以下各项的波形进行递送：指数波形、方波形、调制波形以及调制方波形。

一个优选实施例采用低电压下的直流电。因此，申请人披露了以1V/cm与20V/cm之间的场强使用施加至细胞、组织或组织块的电场，持续100毫秒或更长，优选15分钟或更长的时间。

超声有利地以从约0.05W/cm²至约100W/cm²的功率级给予。可以使用诊断超声或治疗超声、或其组合。

如本文使用的，术语“超声”是指由机械振动组成的能量形式，机械振动的频率非常高，它们在人类听觉范围之上。超声频谱的下限频率通常可以被认为是约20kHz。超声的大多数诊断应用采用范围1和15MHz的频率(来自临床诊断中的超声学(Ultrasonics inClinical Diagnosis)，P.N.T.威尔斯(Wells)编辑，第2版，丘吉尔利文斯顿出版社(Publ.Churchill Livingstone)[爱丁堡、伦敦&纽约，1977])。

超声已经被用于诊断和治疗应用两者中。当被用作诊断工具(“诊断超声”)时，典型地以高达约100mW/cm²(FDA推荐)的能量密度范围使用超声，但是已经使用了高达750mW/cm²的能量密度。在物理疗法中，超声典型地被以高达约3至4W/cm²的范围(WHO推荐)用作能源。在其他治疗应用中，可以采用更高的超声强度，例如，100W/cm直到1kW/cm²(或甚至更高)、持续短时间内的HIFU。如在本说明书中使用的术语“超声”旨在包括诊断超声、治疗超声和聚焦超声。

聚焦超声(FUS)允许在没有侵入性探针的情况下递送热能(参见摩洛克孜(Morocz)等人1998《磁共振成像杂志》(Journal of Magnetic Resonance Imaging)第8卷，第1期，第136-142页)。另一种形式的聚焦超声是高强度聚焦超声(HIFU)，它由慕斯萨多(Moussatov)等人在《超声学》(Ultrasonics)(1998)第36卷，第8期，第893-900页以及德兰胡华(TranHuuHue)等人在《声学》(Acustica)(1997)第83卷，第6期，第1103-1106页进行了综述。

优选地，采用诊断超声和治疗超声的组合。这种组合并不旨在是限制性的，然而，并且本领域的读者应当理解的是可以使用超声的任何多种组合。此外，超声的能量密度、频率以及暴露时间可以变化。

优选地，对超声能源的暴露是在从约0.05至约100Wcm^-2的功率密度下。甚至更优选地，对超声能源的暴露是在从约1至约15Wcm^-2的功率密度下。

优选地，对超声能源的暴露是在从约0.015至约10.0MHz的频率下。更优选地，对超声能源的暴露是在从约0.02至约5.0MHz或约6.0MHz的频率下。最优选地，以3MHz的频率施加超声。

优选地，暴露持续从约10毫秒至约60分钟的时间。优选地，暴露持续从约1秒至约5分钟的时间。更优选地，施加超声持续约2分钟。然而，取决于有待破坏的具体靶细胞，暴露可以持续更长的持续时间，例如持续15分钟。

有利地，靶组织被暴露于声功率密度从约0.05Wcm^-2至约10Wcm^-2的、频率范围从约0.015至约10MHz的超声能源(参见WO 98/52609)。然而，替代方案也是可能的，例如暴露于声功率密度高于100Wcm^-2的超声能源，但是持续减少的时间段，例如1000Wcm^-2持续毫秒范围或更短的时间。

优选地，超声的施加是以多脉冲的形式；因此，连续波和脉冲波(超声的脉冲式递送)两者都可以按任何组合来采用。例如，可以施加连续波超声，随后施加脉冲波超声，反之亦然。可以按任何顺序和组合将其重复任何次数。可以在连续波超声的背景下施加脉冲波超声，并且可以按任何组数使用任何数目的脉冲。

优选地，超声可以包括脉冲波超声。在一个高度优选的实施例中，以0.7Wcm^-2或1.25Wcm^-2的功率密度作为连续波施加超声。如果使用脉冲波超声，则可以采用更高的功率密度。

使用超声是有利的，因为像光一样，它可以被准确地聚焦在靶标上。此外，超声是有利的，因为与光不同，它可以被更深地聚焦进组织。因此它更好地适合于全组织渗透(如但不限于肝叶)或全器官(如但不限于整个肝或整个肌肉，如心脏)治疗。另一个重要的优势在于超声是非侵入性刺激，它被用于多种多样的诊断和治疗应用中。通过举例，超声在医学成像技术中，并且另外在整形治疗中是熟知的。此外，适于向受试者脊椎动物施加超声的仪器是广泛可用的并且其使用在本领域是众所周知的。

本发明的快速转录应答和内源靶向导致了用于研究转录动力学的理想系统。例如，本发明可以用于研究在靶基因的诱导表达时变体产生的动力学。在转录循环的另一端，mRNA降解研究通常响应于强细胞外刺激来进行，强细胞外刺激导致种类繁多的基因的表达水平发生变化。本发明可以用于可逆地诱导内源靶标的转录，在此之后可以停止刺激，并且可以追踪独特靶标的降解动力学。

本发明的时间精度可以为时间遗传调节提供与实验干预一致的动力。例如，在长时程增强(LTP)中具有可疑牵涉的靶标可以在器官型或解剖的神经元培养物中调节，但仅在刺激期间以诱导LTP，以便避免干扰这些细胞的正常发育。类似地，在展现出疾病表型的细胞模型中，怀疑牵涉在特定疗法的有效性中的靶标可以仅在治疗期间调节。相反，遗传靶标可以仅在病理刺激期间调节。其中遗传线索对外部实验刺激的定时具有相关性的任何数目的实验都可以潜在地从本发明的实用性中受益。

体内背景为本发明控制基因表达提供了同样丰富的机会。光诱导性提供了空间精度的潜力。利用光极技术的发展，可以将刺激光纤导线置于精确的脑区中。然后可以通过光强度调谐刺激区域尺寸。这可以与本发明的Cas9 CRISPR-Cas系统或复合物的递送结合完成，或者在转基因Cas9动物的情况下，可以递送本发明的指导RNA，并且光极技术可以允许调节精确脑区中的基因表达。可以向透明的表达Cas9的生物给予本发明的指导RNA，并且然后可以存在极其精确的激光诱导的局部基因表达变化。

用于培养宿主细胞的培养基包括通常用于组织培养的培养基，如M199-earlebase、Eagle MEM(E-MEM)、Dulbecco MEM(DMEM)、SC-UCM102、UP-SFM(GIBCO BRL)、EX-CELL302(日冷公司(Nichirei))、EX-CELL293-S(日冷公司)、TFBM-01(日冷公司)、ASF104等。用于特定细胞类型的适合的培养基可以发现于美国典型培养物保藏中心(ATCC)或欧洲细胞培养物保藏中心(ECACC)。培养基可以补充有氨基酸(如L-谷氨酰胺)、盐、抗真菌剂或抗细菌剂(如)、青霉素-链霉素、动物血清等。细胞培养基可以任选地是无血清的。

本发明还可以提供在体内有价值的时间精度。本发明可以用于改变特定发育阶段期间的基因表达。本发明可以用于将遗传线索定时至特定实验窗。例如，牵连在学习中的基因可以仅在完整的啮齿动物或灵长类动物脑的精确区域中在学习刺激期间过表达或阻遏。另外，本发明可以用于仅在疾病发展的特定阶段期间诱导基因表达变化。例如，癌基因可以仅在肿瘤达到特定尺寸或转移阶段后才过表达。相反，在阿尔茨海默病发展中可疑的蛋白质可以仅在动物生命的限定时间点且在特定脑区内敲低。尽管这些实例并未穷尽性地列出本发明的潜在应用，但是它们突出显示了本发明在其中可以是有力技术的一些领域。

受保护的指导物：根据本发明的酶可以与受保护的指导RNA组合使用

在一个方面，本发明的一个目的在于通过热力学调谐指导RNA至靶DNA的结合特异性来进一步增强Cas9给定的单独指导RNA的特异性。这是引入指导序列的错配、延伸或截短的通用方法，以增加/减少在基因组靶标与其潜在脱靶座位之间共享的互补碱基与错配碱基的数目，以便向靶向的基因组座位给出优于基因组脱靶的热力学优势。

在一个方面，本发明提供了通过二级结构修饰的指导序列，以增加该Cas9CRISPR-Cas系统的特异性，并且由此该二级结构可以保护免受外切核酸酶活性影响并且允许将3’添加到该指导序列。

在一个方面，本发明提供使“保护性RNA”杂交到指导序列，其中该“保护性RNA”是与该指导RNA(gRNA)的5'端互补的RNA链，以由此产生部分双链的gRNA。在本发明的一个实施例中，用完全互补的保护性序列保护错配碱基降低了靶DNA结合至3'端处的错配碱基对的可能性。在本发明的实施例中，还可以存在包含伸长长度的另外的序列。

与基因组靶标匹配的指导RNA(gRNA)延伸提供gRNA保护并且增强特异性。设想了用在间隔子种子端的远端的针对单独基因组靶标的匹配序列延伸gRNA，以提供增强的特异性。已经在没有截短的情况下在细胞中观察到增强特异性的匹配gRNA延伸。伴随这些稳定的长度延伸的gRNA结构的预测已经显示，稳定形式产生自保护状态，在这些保护状态中由于间隔子延伸和间隔子种子中的互补序列，延伸与gRNA种子形成闭环。这些结果证实，受保护的指导物概念还包括与20mer间隔子结合区远端的基因组靶序列匹配的序列。可以使用热力学预测来预测产生受保护的gRNA状态的完全匹配或部分匹配指导延伸。这将受保护的gRNA的概念扩展至X与Z之间的相互作用，其中X的长度通常是17-20nt并且Z的长度是1-30nt。可以使用热力学预测来确定Z的最佳延伸状态，从而潜在地在Z中引入小数目的错配，以促进在X与Z之间形成受保护的构象。贯穿本申请，术语“X”和种子长度(SL)与术语外露长度(EpL)(其表示可为靶DNA结合所用的核苷酸的数目)可互换地使用；术语“Y”和保护长度(PL)可互换地使用，代表保护子的长度；并且术语“Z”、“E”、“E’”和EL可互换地使用，对应于术语伸长长度(ExL)，其代表靶序列延伸所靠的核苷酸的数目。

对应于伸长长度(ExL)的延伸序列可以任选地被直接附接至受保护的指导序列的3'端处的指导序列。该延伸序列在长度上可以是2至12个核苷酸。优选地，ExL在长度上可以被表示为0、2、4、6、8、10或12个核苷酸。在一个优选实施例中，ExL在长度上被表示为0或4个核苷酸。在一个更优选的实施例中，ExL在长度上为4个核苷酸。该延伸序列可以或可以不与靶序列互补。

延伸序列可以进一步任选地被直接附接至受保护的指导序列的5'端处的指导序列并且附接至保护性序列的3'端。其结果是，该延伸序列充当受保护的序列与保护性序列之间的连接序列。不希望受到理论的束缚，这样一种连接可以将保护性序列定位在受保护的序列附近，用于改进保护性序列与受保护的序列的结合。

向gRNA的远端添加gRNA错配可以展示增强的特异性。在Y中引入未受保护的远端错配或用远侧错配(Z)延伸gRNA可以展示增强的特异性。所提及的这个概念限于受保护的gRNA中所用的X、Y、和Z组分。未受保护的错配概念可以被进一步推广到针对受保护的指导RNA描述的X、Y、和Z的概念。

Cas9Cas9在一个方面，本发明提供了增强的Cas9Cas9特异性，其中受保护的指导RNA(pgRNA)的双链3'端允许两种可能的结果：(1)将发生指导RNA-保护性RNA至指导RNA-靶DNA的链交换并且该指导将完全结合该靶标，或(2)该指导RNA将不能完全结合该靶标并且因为Cas9靶标切割是需要指导RNA:靶DNA结合以激活Cas9催化的DSB的多步骤动力学反应，其中如果该指导RNA不适当地结合，则不会发生Cas9切割。根据具体实施例，与天然存在的CRISPR-Cas系统相比，受保护的指导RNA改进靶标结合特异性。根据具体实施例，与天然存在的CRISPR-Cas相比，受保护的经修饰的指导RNA改进稳定性。根据具体实施例，该保护性序列具有3与120个核苷酸之间的长度并且包括3个或更多个与指导或保护子的另一序列互补的连续核苷酸。根据具体实施例，该保护性序列形成发夹。根据具体实施例，该指导RNA进一步包括受保护的序列和外露序列。根据具体实施例，该外露序列是1至19个核苷酸。更具体地说，该外露序列至少75％、至少90％或约100％与该靶序列互补。根据具体实施例，该指导序列至少90％或约100％与保护性链互补。根据具体实施例，该指导序列至少75％、至少90％或约100％与该靶序列互补。根据具体实施例，该指导RNA进一步包括延伸序列。更具体地说，该延伸序列有效作地连接到受保护的指导序列的3'端，并且任选地直接连接到受保护的指导序列的3'端。根据具体实施例，该延伸序列是1-12个核苷酸。根据具体实施例，该延伸序列有效作地连接到受保护的指导序列的3'端处的指导序列和保护性链的5'端，并且任选地直接连接到受保护的指导序列的3'端和保护性链的3'端，其中该延伸序列是受保护的序列与保护性链之间的连接序列。根据具体实施例，该延伸序列100％不与保护性链互补，任选地至少95％、至少90％、至少80％、至少70％、至少60％、或至少50％不与保护性链互补。根据具体实施例，该指导序列进一步包括附于指导序列端的错配，其中这些错配在热力学上优化特异性。

在一个方面，本发明提供了工程化的、非天然存在的CRISPR-Cas系统，该系统包含Cas9蛋白和靶向在细胞中编码基因产物的DNA分子的受保护的指导RNA，由此该受保护的指导RNA靶向编码该基因产物的DNA分子，并且该Cas9蛋白切割编码该基因产物的DNA分子，由此改变该基因产物的表达；并且，其中该Cas9蛋白和该受保护的指导RNA并不天然地一起存在。本发明包括包含融合3’到同向重复序列上的指导序列的受保护的指导RNA。本发明进一步包括经密码子优化以便在真核细胞中表达的Cas9蛋白。在一个优选实施例中，该真核细胞是哺乳动物细胞、植物细胞或酵母细胞，并且在一个更优选的实施例中，该哺乳动物细胞是人类细胞。在本发明的一个另外的实施例中，该基因产物的表达被降低。在一些实施例中，该Cas9酶是氨基酸球菌属BV3L6、毛螺菌科细菌或新凶手弗朗西丝菌Cas9，并且可以包括来源于这些生物的经突变的Cas9。该酶可以是另外的Cas9同系物或直向同源物。在一些实施例中，编码Cfp1酶的核苷酸序列经密码子优化以便在真核细胞中表达。在一些实施例中，该Cas9酶引导在该靶序列位置处的一条或两条链的切割。在一些实施例中，该第一调节组件是聚合酶III启动子。在一些实施例中，该第二调节组件是聚合酶II启动子。通常，并且贯穿本说明书，术语“载体”是指一种核酸分子，它能够运送与其连接的另一种核酸分子。载体包括但不限于，单链、双链、或部分双链的核酸分子；包括一个或多个自由端、无自由端(例如，环状的)的核酸分子；包括DNA、RNA、或两者的核酸分子；以及本领域已知的其他多种多样的多核苷酸。一种类型的载体是“质粒”，其是指其中可以例如通过标准分子克隆技术插入另外的DNA片段的环状双链DNA环。另一种类型的载体是病毒载体，其中病毒衍生的DNA或RNA序列存在于用于包装进病毒(例如，逆转录病毒、复制缺陷型逆转录病毒、腺病毒、复制缺陷型腺病毒、以及腺相关病毒)的载体中。病毒载体还包含由用于转染到宿主细胞中的病毒携带的多核苷酸。某些载体(例如，具有细菌复制起点的细菌载体和附加型哺乳动物载体)能够在它们被导入的宿主细胞中自主复制。其他载体(例如，非附加型哺乳动物载体)在引入宿主细胞后整合到该宿主细胞的基因组中，并且由此与该宿主基因组一起复制。而且，某些载体能够指导它们有效连接的基因的表达。这样的载体在此被称为“表达载体”。在重组DNA技术中使用的普通表达栽体通常是质粒形式。

重组表达载体可包含处于适合于在宿主细胞中的核酸表达的形式的本发明的核酸，这意味着这些重组表达载体包含基于待用于表达的宿主细胞而选择的一种或多种调节组件，所述调节组件有效作地连接至待表达的核酸序列。在重组表达载体内，“有效作地连接”旨在表示感兴趣的核苷酸序列以允许该核苷酸序列的表达的方式被连接至这一种或多种调节组件(例如，处于体外转录/翻译系统中或当该载体被引入宿主细胞中时，处于该宿主细胞中)。

在一个方面，本发明提供了真核宿主细胞，该真核宿主细胞包含(a)第一调节组件，该第一调节组件有效作地连接到同向重复序列和一个或多个插入位点，这一个或多个插入位点用于在该同向重复序列的下游插入一个或多个指导序列，其中当表达时，该指导序列引导CRISPR复合物与真核细胞中的靶序列的序列特异性结合，其中该CRISPR复合物包含与包含杂交到该靶序列上的指导序列的指导RNA复合的CRISPR酶，和/或(b)第二调节组件，该第二调节组件有效作地连接到编码所述Cas9酶的酶编码序列，该酶包括核定位序列。在一些实施例中，该宿主细胞包括组分(a)以及(b)。在一些实施例中，组分(a)、组分(b)、或组分(a)和(b)稳定地整合到该宿主真核细胞的基因组中。在一些实施例中，组分(a)进一步包括有效作地连接到该第一调节组件的两个或更多个指导序列，其中当表达时，该两个或更多个指导序列中的每个引导CRISPR复合物在真核细胞中与不同靶序列的序列特异性结合。在一些实施例中，该Cas9酶引导在该靶序列位置处的一条或两条链的切割。在一些实施例中，该Cas9酶缺少DNA链切割活性。在一些实施例中，该第一调节组件是聚合酶III启动子。在一些实施例中，该第二调节组件是聚合酶II启动子。

在一个方面，本发明提供了非人类真核生物；优选多细胞真核生物，包含根据所描述的实施例中任一项的真核宿主细胞。在其他方面，本发明提供了真核生物；优选多细胞真核生物，包含根据所描述的实施例中任一项的真核宿主细胞。在这些方面的一些实施例中，该生物可以是动物；例如哺乳动物。另外，该生物可以是节肢动物，如昆虫。该生物也可以是植物或酵母。另外，该生物可以是真菌。

在一个方面，本发明提供了试剂盒，该试剂盒包括在上文描述的组分中的一种或多种。在一些实施例中，该试剂盒包括载体系统以及用于使用该试剂盒的说明书。在一些实施例中，该载体系统包含(a)第一调节组件，该第一调节组件有效作地连接到同向重复序列和一个或多个插入位点，这一个或多个插入位点用于在该同向重复序列的下游插入一个或多个指导序列，其中当表达时，该指导序列引导Cas9CRISPR复合物与真核细胞中的靶序列的序列特异性结合，其中该CRISPR复合物包含与包含杂交到该靶序列上的指导序列的受保护的指导RNA复合的Cas9酶，和/或(b)第二调节组件，该第二调节组件有效作地连接到编码所述Cas9酶的酶编码序列，该酶包括核定位序列。在一些实施例中，该试剂盒包括位于该系统的相同或不同载体上的组分(a)和(b)。在一些实施例中，组分(a)进一步包括有效作地连接到该第一调节组件的两个或更多个指导序列，其中当表达时，该两个或更多个指导序列中的每个引导CRISPR复合物在真核细胞中与不同靶序列的序列特异性结合。在一些实施例中，该Cas9酶包括一个或多个核定位序列，其具有足够强度来在真核细胞的细胞核中驱动所述Cas9酶以可检测的量积聚。在一些实施例中，该Cas9酶是氨基酸球菌属BV3L6、毛螺菌科细菌MA2020或土拉热弗朗西丝菌1新凶手(Francisella tularensis 1 Novicida)Cas9，并且可以包括来源于这些生物的经突变的Cas9。该酶可以是Cas9同系物或直向同源物。在一些实施例中，该CRISPR酶是密码子优化的以便在真核细胞中表达。在一些实施例中，该CRISPR酶引导在该靶序列位置处的一条或两条链的切割。在一些实施例中，该CRISPR酶缺少DNA链切割活性。在一些实施例中，该第一调节组件是聚合酶III启动子。在一些实施例中，该第二调节组件是聚合酶II启动子。

在一个方面，本发明提供了修饰在真核细胞中的靶多核苷酸的方法。在一些实施例中，该方法包括允许CRISPR复合物结合到该靶多核苷酸上以实施所述靶多核苷酸的切割，由此修饰该靶多核苷酸，其中该CRISPR复合物包含与受保护的指导RNA复合的Cas9酶，该受保护的指导RNA包含杂交到所述靶多核苷酸内的靶序列上的指导序列。在一些实施例中，所述切割包括通过所述Cas9酶切割在靶序列位置处的一条或两条链。在一些实施例中，所述切割导致靶基因的转录降低。在一些实施例中，该方法进一步包括通过基于非同源末端连接(NHEJ)的基因插入机制(更具体地与外源模板多核苷酸)修复所述切割的靶多核苷酸，其中所述修复导致突变，包括所述靶多核苷酸的一个或多个核苷酸的插入、缺失、或取代。在一些实施例中，所述突变导致在从包含该靶序列的基因表达的蛋白质中的一个或多个氨基酸改变。在一些实施例中，该方法进一步包括将一种或多种载体递送到所述真核细胞，其中这一种或多种载体驱动下列一者或多者的表达：该Cas9酶、包含连接到同向重复序列的指导序列的受保护的指导RNA。在一些实施例中，所述载体被递送到受试者内的真核细胞中。在一些实施例中，所述修饰发生在细胞培养物中的所述真核细胞中。在一些实施例中，该方法进一步包括在所述修饰之前从受试者中分离所述真核细胞。在一些实施例中，该方法进一步包括使所述真核细胞和/或从中衍生的细胞返回到所述受试者中。

在一个方面，本发明提供了修饰多核苷酸在真核细胞中的表达的方法。在一些实施例中，该方法包括允许Cas9 CRISPR复合物结合到该多核苷酸上，这样使得所述结合导致所述多核苷酸的表达增加或降低；其中该CRISPR复合物包含与受保护的指导RNA复合的Cas9酶，该受保护的指导RNA包含杂交到所述多核苷酸内的靶序列上的指导序列。在一些实施例中，该方法进一步包括将一种或多种载体递送到所述真核细胞，其中这一种或多种载体驱动下列一者或多者的表达：该Cas9酶和该受保护的指导RNA。

在一个方面，本发明提供了产生包含经突变的疾病基因的模式真核细胞的方法。在一些实施例中，疾病基因是与患有或产生疾病的风险的增加相关联的任何基因。在一些实施例中，该方法包括(a)向真核细胞中引入一种或多种载体，其中这一种或多种载体驱动下列一者或多者的表达：Cas9酶和包含连接到同向重复序列的指导序列的受保护的指导RNA；并且(b)允许CRISPR复合物结合到靶多核苷酸上以实施在所述疾病基因内的该靶多核苷酸的切割，其中该CRISPR复合物包含与包含杂交到该靶多核苷酸内的靶序列上的指导序列的指导RNA复合的Cas9酶，由此产生包含经突变的疾病基因的模式真核细胞。在一些实施例中，所述切割包括通过所述Cas9酶切割在靶序列位置处的一条或两条链。在一些实施例中，所述切割导致靶基因的转录降低。在一些实施例中，该方法进一步包括通过与外源模板多核苷酸的基于非同源末端连接(NHEJ)的基因插入机制修复所述切割的靶多核苷酸，其中所述修复导致突变，包括所述靶多核苷酸的一个或多个核苷酸的插入、缺失、或取代。在一些实施例中，所述突变导致在从包含该靶序列的基因表达的蛋白质中的一个或多个氨基酸改变。

在一个方面，本发明提供了用于研发生物活性剂的方法，该生物活性剂调制与疾病基因相关的细胞信号传导事件。在一些实施例中，疾病基因是与患有或产生疾病的风险的增加相关联的任何基因。在一些实施例中，该方法包括(a)使测试化合物与所描述实施例中任一项的模式细胞接触；并且(b)检测读数变化，该变化指示与所述疾病基因的所述突变关联的细胞信号传导事件的减少或增加，由此开发调节与所述疾病基因关联的所述细胞信号传导事件的所述生物活性剂。

在一个方面，本发明提供了包含同向重复序列下游的受保护的指导序列的重组多核苷酸，其中当表达时，该受保护的指导序列引导CRISPR复合物与存在于真核细胞中的对应的靶序列的序列特异性结合。在一些实施例中，该靶序列是存在于真核细胞中的病毒序列。在一些实施例中，该靶序列是原癌基因或癌基因。

在一个方面，本发明提供了通过在一种或多种细胞的基因中引入一个或多个突变来选择一种或多种细胞的方法，该方法包括：将一种或多种载体引入这一种或多种细胞中，其中这一种或多种载体驱动下列一者或多者的表达：Cas9酶、包含指导序列的受保护的指导RNA、和编辑模板；其中该编辑模板包含消除Cas9酶切的一个或多个突变；允许该编辑模板与该靶多核苷酸在有待筛选的这一种或多种细胞中的基于非同源末端连接(NHEJ)的基因插入机制；允许CRISPR复合物结合到靶多核苷酸上以实施在所述基因内的该靶多核苷酸的切割，其中该CRISPR复合物包含与受保护的指导RNA复合的Cas9酶，该受保护的指导RNA包含杂交到该靶多核苷酸内的靶序列上的指导序列，其中该CRISPR复合物与该靶多核苷酸的结合诱导细胞死亡，由此允许选择其中已经引入一个或多个突变的一种或多种细胞。在本发明的一个优选实施例中，该有待选择的细胞可以是真核细胞。本发明的方面允许选择特异细胞，而不需要选择标记或可能包括反选择系统的两步法。

关于该Cas9酶的突变，当该酶不是FnCas9时，突变可以是如在本文的其他地方所描述的；还设想了任何这些置换氨基酸的保守性取代。在一个方面，本发明提供了本文讨论的任何或每个或所有实施例，其中该CRISPR酶包括至少一个或多个、或至少两个或更多个突变，其中这至少一个或多个突变或这至少两个或更多个突变选自在本文的其他地方描述的那些。

在一个另外的方面，本发明涉及用于鉴定或设计适合在CRISPR-Cas9系统或其功能部分内的或结合到CRISPR-Cas9系统或其功能部分的潜在的化合物的计算机辅助方法、或反之亦然(用于鉴定或设计结合到所希望的化合物的潜在的CRISPR-Cas9系统或其功能部分的计算机辅助方法)、或用于鉴定或设计潜在的CRISPR-Cas9系统的计算机辅助方法(例如，就预测能够被操纵的CRISPR-Cas9系统的区域而言—例如，基于晶体结构数据或基于Cas9直向同源物的数据，或就官能团(如激活因子或阻遏因子)可以附接至该CRISPR-Cas9系统的何处而言，或就Cas9截短而言或就设计切口酶而言)，所述方法包括：

使用计算机系统，例如包括处理器、数据存储系统、输入装置、和输出装置的编程计算机，以下步骤：

(a)通过所述输入装置将数据输入到该编程计算机中，该数据包括来自CRISPR-Cas9晶体结构的或与其有关的原子子集的三维坐标，例如在CRISPR-Cas9系统结合结构域中、或可替代地或另外地在基于Cas9直向同源物之间的或关于Cas9的或关于切口酶的或关于官能团的差异而变化的结构域中，任选地连同来自一种或多种CRISPR-Cas9系统复合物的结构信息，由此产生数据集；

(b)使用所述处理器比较所述数据集与储存在所述计算机数据存储系统中的计算机结构数据库，例如结合到或推定结合到或希望结合到CRISPR-Cas9系统的化合物的、或关于Cas9直向同源物的(例如，关于Cas9的或关于在Cas9直向同源物之间变化的结构域或区域的)、或关于CRISPR-Cas9晶体结构的、或关于切口酶的或关于官能团的结构；

(c)使用计算机方法从所述数据库中选择一种或多种结构—例如，可以结合到所希望的结构的CRISPR-Cas9结构、可以结合到某些CRISPR-Cas9结构的所希望的结构、可以被操纵的CRISPR-Cas9系统的部分，例如基于来自CRISPR-Cas9晶体结构的其他部分的和/或来自Cas9直向同源物、截短的Cas9、新颖的切口酶或特定的官能团、或用于附接官能团或官能团-CRISPR-Cas9系统的位置的数据；

(d)使用计算机方法构建所选一种或多种结构的模型；并且

(e)将所选一种或多种结构输出至所述输出装置；

并且任选地合成所选一种或多种结构中的一者或多者；

并且进一步任选地作为CRISPR-Cas9系统或在其中测试所述合成的所选一种或多种结构；

或者，所述方法包括：提供该CRISPR-Cas9晶体结构的至少两个原子的坐标，例如本文的CRISPR-Cas9晶体结构的晶体结构表的至少两个原子或该CRISPR-Cas9晶体结构的至少一个子结构域的坐标(“所选坐标”)；提供包含结合分子的候选物的或可以被操纵的该CRISPR-Cas9系统的部分的结构，例如基于来自该CRISPR-Cas9晶体结构的其他部分的和/或来自Cas9直向同源物的数据，或官能团的结构，并且将该候选物的结构与所选坐标匹配，以由此获得产品数据，该产品数据包括可以结合到所希望的结构的CRISPR-Cas9结构，可以结合到某些CRISPR-Cas9结构的所希望的结构、可以被操纵的CRISPR-Cas9系统的部分、截短的Cas9、新颖的切口酶或特定的官能团、或用于附接官能团或官能团-CRISPR-Cas9系统的位置，并且将其输出；并且任选地从所述产品数据合成一种或多种化合物并且进一步任选地包括作为CRISPR-Cas9系统或在其中测试所述合成的一种或多种化合物。

该测试可以包括对由所述合成的所选一种或多种结构产生的CRISPR-Cas9系统进行分析，例如相对于结合、或执行所希望的功能。

前述方法中的输出可以包括数据传输，例如经由电信、电话、视讯会议、公众通讯(例如演示，如计算机演示(例如POWERPOINT))、因特网、电子邮件、文献交流(如计算机程序(例如WORD))文件等进行的信息传输。因此，本发明还包括含有以下项的计算机可读介质：根据本文引用的晶体结构的原子坐标数据，所述数据限定了CRISPR-Cas9或其至少一个子结构域的三维结构，或针对CRISPR-Cas9的结构因子数据，所述结构因子数据可衍生自本文引用的晶体结构的原子坐标数据。该计算机可读介质还可以含有前述方法的任何数据。本发明进一步包括用于产生或执行如在前述方法中的合理设计的方法、计算机系统，含有以下任一项：根据本文引用的晶体结构的原子坐标数据，所述数据限定了CRISPR-Cas9或其至少一个子结构域的三维结构，或针对CRISPR-Cas9的结构因子数据，所述结构因子数据可衍生自本文引用的晶体结构的原子坐标数据。本发明进一步包括经商方法，该方法包括向用户提供该计算机系统或该介质或CRISPR-Cas9或其至少一个子结构域的三维结构、或针对CRISPR-Cas9的结构因子数据(所述结构列于本文引用的晶体结构的原子坐标数据中并且所述结构因子数据可衍生自本文引用的晶体结构的原子坐标数据)、或本文的计算机介质或本文的数据传输。

“结合位点”或“活性位点”包括结合腔或区域中的位点(如原子、氨基酸残基的官能团或多个这样的原子和/或基团)或基本上由其组成或由其组成，该结合腔或区域可以结合至化合物(如核酸分子)，所述化合物涉及在结合中。

所谓“匹配(fitting)”意指通过自动或半自动手段确定候选分子的一个或多个原子与本发明结构的至少一个原子之间的相互作用，并且计算这样的相互作用稳定的程度。相互作用包括由电荷、空间因素等引起的吸引和排斥。进一步描述了匹配用的各种基于计算机的方法。

所谓“均方根(或rms)偏差”，我们意指离均差的平方的算术平均数的平方根。

所谓“计算机系统”意指用于分析原子坐标数据的硬件装置、软件装置和数据存储装置。本发明的基于计算机的系统的最低硬件装置典型地包括中央处理器(CPU)、输入装置、输出装置以及数据存储装置。合意地，提供显示器或监测器用于可视化结构数据。数据存储装置可以是RAM或用于存取本发明的计算机可读介质的装置。这样的系统的实例是运行Unix、Windows或Apple操作系统的计算机和平板设备。

所谓“计算机可读介质”意指可以被计算机直接或间接读取并且存取，例如使得该介质适于在以上提到的计算机系统中使用的任何一种或多种介质。这样的介质包括但不限于：磁存储介质，如软盘、硬盘存储介质和磁带；光存储介质，如光盘或CD-ROM；电存储介质，如RAM和ROM；拇指驱动设备；云存储设备以及这些类别的混合体，如磁/光存储介质。

本发明包括在本文描述的经优化的功能性CRISPR-Cas酶系统中使用在上文描述的受保护的指导物。

通过指导工程化形成RISC

在一些实施例中，该指导可以是如本文描述的受保护的指导物(例如pgRNA)或受护航的指导(例如esgRNA)。在一些实施例中，这两者都利用RISC。RISC是RNAi的关键组分。RISC(RNA诱导沉默复合体)是一种多蛋白，确切地说是核糖核蛋白复合体，它掺入了双链RNA(dsRNA)片段的一条链，如小干扰RNA(siRNA)或微小RNA(miRNA)，该链充当RISC的模板用于识别互补信使RNA(mRNA)转录物。mRNA因此被RISC的组分之一切割。

因此，在一些实施例中，RISC的形成是有利的。根据本发明的不同方面的指导RNA(包括但不限于受保护的和/或受护航的指导RNA)可以被适配成包括促进RISC形成的RNA核苷酸，例如与可以被提供于细胞中的或可以例如已经被表达于细胞中的siRNA或miRNA组合。这例如作为用于清除或降解该指导物的自行失活性系统可以是有用的。

因此，该指导RNA可以包括与靶miRNA或siRNA互补的序列，该靶miRNA或siRNA可以或可以不存在于细胞内。以此方式，只有当例如通过表达(通过该细胞或通过人为干涉)存在该miRNA或siRNA时，才存在RNA序列与该miRNA或siRNA的结合，这然后导致该指导RNA被该细胞内的RNA诱导沉默复合体(RISC)切割。因此，在一些实施例中，该指导RNA包括与靶miRNA或siRNA互补的RNA序列，并且该指导RNA序列与该靶miRNA或siRNA的结合导致该指导RNA被该细胞内的RNA诱导沉默复合体(RISC)切割。

下文具体参考受保护的和受护航的指导物对其进行进一步解释。

通过使用受保护的指导物的RISC形成

例如，可以在以下方面中描述受保护的指导物：工程化的、非天然存在的组合物，该组合物包含规律间隔成簇短回文重复(CRISPR)-CRISPR相关(Cas)(CRISPR-Cas)系统，该系统具有受保护的指导RNA(pgRNA)多核苷酸序列，该多核苷酸序列包括(a)保护性序列、(b)能够杂交到真核细胞中的靶序列上的指导序列、(c)tracr配对序列、和(d)tracr序列，其中(a)、(b)、(c)和(d)以5’到3’方向排列，其中该保护性序列包括两个或更多个与该靶序列不互补的核苷酸，其中在转录时，该tracr配对序列杂交到该tracr序列上，并且该指导序列引导CRISPR复合物与该靶序列的序列特异性结合，其中该CRISPR复合物包含与(1)杂交到该靶序列上的指导序列、和(2)杂交到该tracr序列上的tracr配对序列复合的II型Cas9蛋白，并且其中在该多核苷酸序列中，该指导序列、tracr序列和tracr配对序列中的一者或多者被修饰。

在一个方面，这种受保护的指导物系统被用于该sgRNA的5'延伸的二级结构保护。例如，申请人延伸了该sgRNA，这样使得引入了miRNA结合位点，以便仅当该miRNA结合位点被RISC复合体机器加工且切割时，才使该sgRNA具有活性。这在不进行二级结构保护的情况下是不可能的，因为外切核酸酶加工将从5’端开始并且朝该sgRNA回切。通过向添加的miRNA位点的5’添加小二级结构环，则可以保护miRNA免于被外切核酸酶嚼回。

通过使用受护航的指导物的RISC形成

在另一个实例中，可以描述受护航的指导物。具体而言，设想了miRNA诱导型esgRNA。这里，该护航性RNA适配体序列与靶miRNA互补，这样使得当该靶miRNA存在于掺入了该RNA诱导沉默复合体(RISC)的细胞中时，存在该护航性RNA适配体序列与该靶miRNA的结合，这使得该esgRNA被该细胞内的RNA诱导沉默复合体(RISC)切割。

在替代性实施例中，可以在该esgRNA的5’端提供多种多样的一级和二级结构，这些结构被设计为使得该RISC复合体能够接近该miRNA结合位点。esgRNA可以在保护性序列的5’具有第一和第二接头序列。在替代性实施例中，接头1和2可以例如各自独立地是0、1、2、3、或4个核苷酸长，其中保护性序列在长度上为0、1或2个核苷酸。

在一个示例性实施例中，可以使用miR-122在HEK.293细胞系统中展示esgRNA靶向的诱导，在这些细胞中miR-122并不天然地表达。在不存在外源miR-122下，受保护的esgRNA并不介导靶向的EMX1.3核酸酶活性。当添加外源miR-122(100ng/孔)时，观察到靶向的EMX1.3切割(作为在凝胶上的电泳变种可见的不同切割伪像)。这证实了可以在提供遗传诱导型sgRNA的系统中利用高度表达的内源miRNA。可以使用具有容易确定的相应序列的任何miRNA代替miRNA122。

例如，sgRNA可以连接至与源靶miRNA互补的“护航”RNA适配体序列。该靶miRNA可以在该细胞内形成RNA诱导沉默复合体(RISC)。当该靶miRNA存在于细胞中时，存在该护航性RNA适配体序列与该靶miRNA的结合，这使得该esgRNA被该细胞内的RNA诱导沉默复合体(RISC)切割。该护航物的切割释放活性sgRNA。

例如，可以在以下方面中描述受保护的指导物：非天然存在的或工程化的组合物，该组合物包含受护航的单个CRISPR-Cas9指导RNA(esgRNA)，该指导RNA包含：

RNA指导序列，该RNA指导序列能够杂交到细胞中的感兴趣的基因组座位中的靶序列上，以及，

护航性RNA适配体序列，

其中该护航性RNA适配体序列包括对该细胞上或该细胞中的适配体配体的结合亲和力，或者该护航性RNA适配体序列响应于该细胞上或该细胞中的局部化适配体效应子，

其中该适配体配体或效应子在该细胞上或该细胞中的存在在空间上或在时间上是受限的。

该护航性RNA适配体序列可以与靶miRNA互补，该靶miRNA可以或可以不存在于细胞内，这样使得仅当存在该靶miRNA时，才存在该护航性RNA适配体序列与该靶miRNA的结合，这使得该esgRNA被该细胞内的RNA诱导沉默复合体(RISC)切割。因此，在一些实施例中，该护航性RNA适配体序列与靶miRNA互补，并且该护航性RNA适配体序列与该靶miRNA的结合导致该esgRNA被该细胞内的RNA诱导沉默复合体(RISC)切割。

根据本发明，编码所述指导RNA或Cas蛋白中的至少一者的核苷酸序列在该细胞内与包含感兴趣基因的启动子的调节组件有效作地连接，由此至少一种CRISPR-Cas系统组分的表达由该感兴趣基因的启动子驱动。“有效作地连接”旨在意指编码该指导RNA和/或该Cas的核苷酸序列按允许表达该核苷酸序列的方式连接至这一种或多种调节组件，还如在本文的其他地方所提及的。在本文的其他地方还描述了术语“调节组件”。根据本发明，该调节组件包括感兴趣基因的启动子，如优选感兴趣的内源基因的启动子。在某些实施例中，该启动子在其内源基因组位置处。在这样的实施例中，编码该CRISPR和/或Cas的核酸处于在其天然基因组位置处的感兴趣基因的启动子的转录控制之下。在某些其他实施例中，该启动子被提供在(单独的)核酸分子上，例如载体或质粒，或其他染色体外核酸，即该启动子未被提供在其天然基因组位置处。在某些实施例中，该启动子被基因组整合在非天然基因组位置处。

在某些实施例中，编码该指导RNA的核酸在该细胞内与包含感兴趣基因的启动子的调节组件有效作地连接。在某些实施例中，编码该Cas的核酸在该细胞内与包含感兴趣基因的启动子的调节组件有效作地连接。在某些实施例中，编码该指导RNA的核酸在该细胞内与包含感兴趣基因的启动子的调节组件有效作地连接，并且编码该Cas的核酸在该细胞内与包含感兴趣基因的启动子的调节组件有效作地连接。在后一种情况下，驱动该指导RNA和该Cas的表达的启动子可以是相同的或可以是不同的。在某些实施例中，编码该指导RNA和/或Cas的核酸被基因组整合。在某些实施例中，编码该指导RNA和/或Cas的核酸是染色体外的或附加型的。编码该指导RNA的核酸和编码该Cas的核酸可以位于相同的或不同的核酸分子上。

被根据本发明的一种或多种指导RNA靶向的所选DNA序列可以是内源DNA序列或外源DNA序列。被根据本发明的一种或多种指导RNA靶向的所选DNA序列(如外源DNA序列)可以是基因组整合的或可以是染色体外的(例如被提供在质粒或载体上)。在某些实施例中，如本文描述的方法包括通过如在本文的其他地方描述的、本领域已知的手段在该细胞中引入载体或质粒，所述载体或质粒包含所述选择的DNA序列，并且所述方法包括检测所述选择的DNA序列在所述载体上的修饰。应理解的是，所述载体或质粒、或包含在其中的至少所选DNA序列可以是基因组整合的，如随机整合或经由同源重组。当该所选靶DNA序列是内源序列时，优选的是这样选择该序列，使得其修饰对该细胞的(正常)功能没有影响或具有最小影响。本领域技术人员通过常规分析或实验应容易地鉴别这样的序列。在任何情况下，优选的是这样的所选内源靶DNA序列并不位于基因的编码序列或ORF中和/或并不位于基因的调节序列(如启动子、增强子、沉默子等)中。

如在本文的其他地方所描述的，该所选靶DNA序列通过功能性CRISPR复合物(即与该Cas蛋白复合的指导RNA，其中该指导RNA按5’到3'方向包括该指导序列、tracr配对序列和tracr序列，其中该tracr序列可以或可以不在与该指导序列和tracr配对序列相同的核酸分子上)的作用进行修饰。如本文使用的，“修饰的”基本上对应于突变的，即该靶DNA序列的核酸序列被改变，如在本文的其他地方描述的，如包括一个或多个核苷酸的点突变、缺失、取代、或插入。

然而，如在本文的其他地方所描述的，还应显而易见的是在某些实施例中，“修饰的”对应于靶座位的改变，如基因的转录的激活或阻遏、CpG位点的甲基化或脱甲基化等，它们可以不需要一个或多个核苷酸的点突变、缺失、取代、或插入。此外，如在本文的其他地方所描述的，还应显而易见的是，称CRISPR-Cas酶“改变”或“修饰”一个或多个靶多核苷酸座位包括直接改变或修饰，例如经由该酶本身的催化活性；但是还包括间接改变或修饰，例如经由与CRISPR-Cas酶(如异源功能结构域，例如转录激活结构域)相关联的催化活性。另外，如应当理解的，意图在于通过CRISPR-Cas酶的作用被“改变”或“修饰”的这一个或多个靶多核苷酸座位可以被包含在与指导RNA的指导序列部分互补的多核苷酸序列中或与其邻近，例如在该改变或修饰是通过该CRISPR-Cas酶本身的催化活性(例如通过该CRISPR-Cas酶的核酸酶活性切割DNA)实现的实施例中。然而，还包括有待“改变”或“修饰”的一个或多个靶座位在不同于与该指导RNA的指导序列部分互补的序列位置处的实施例，例如在该改变或修饰是经由与该CRISPR-Cas酶相缔合的异源功能结构域(例如基因的转录的激活或阻遏)实现的实施例中。因此，靶座位的“改变”或“修饰”(或类似术语)意指经由该CRISPR-Cas酶的直接或间接作用，并且此外，有待改变或修饰的“靶座位”和与该指导RNA的指导序列部分互补的“靶序列”可以是相同的或可以不是相同的。

在某些实施例中，在如本文描述的根据本发明的方法中，该CRISPR-Cas系统是多元化的，即可以提供多种不同的指导RNA。每种指导RNA都可以靶向不同的所选DNA靶标(即与其杂交)。这些不同指导RNA的表达可以由不同的感兴趣基因的启动子驱动。因此，在某些实施例中，如本文描述的本发明的方法是用于确定多于一个(如至少两个)感兴趣的基因在细胞中的表达的方法，这些方法包括提供包含CRISPR-Cas系统的细胞，所述CRISPR-Cas系统包含多于一种(如至少两种)靶向不同所选DNA序列的指导RNA和能够修饰所选DNA序列的Cas蛋白；由此每种指导RNA都在该细胞内与包含不同感兴趣基因的启动子的调节组件有效作地连接；并且基于所述对应的所选DNA序列的修饰的检测来确定所述感兴趣的基因的表达。在某些实施例中，超过一种不同的指导RNA可以在该细胞内与包含同一感兴趣基因的启动子的调节组件有效作地连接。这些不同的指导RNA可以被提供在不同的核酸分子上或被提供在同一核酸分子上。这些对应的指导RNA可以被设计成这样，使得仅第一所选靶DNA的修饰产生或破坏第二所选靶DNA。

在某些实施例中，该CRISPR-Cas系统的组分中的一种或多种可以在该细胞中条件性地(例如组织或细胞类型特异性的)和/或诱导性地(例如，化学诱导型)表达。在本文的其他地方描述了诱导型和条件型表达系统。在具体实施例中，这些指导RNA中的一种或多种可以在该细胞中条件性地和/或诱导性地表达。在特别优选的实施例中，该Cas可以在该细胞中条件性地和/或诱导性地表达。

如本文使用的，术语所选DNA序列的“靶向”意指指导RNA能够与所选DNA序列杂交。如本文使用的，“杂交(hybridization或hybridizing)”是指其中一个或多个多核苷酸反应形成复合物的反应，该复合物经由这些核苷酸残基的碱基之间的氢键键合而稳定化。氢键键合可以借助于沃森-克里克碱基配对、Hoogstein结合或以任何其他序列特异性方式而发生。该复合物可包含形成双链体的两条链、形成多链复合物的三条或多条链、单个自我杂交链、或这些的任何组合。杂交反应可以构成更广泛的过程(如PCR的开始、或经由酶的多核苷酸的切割)中的步骤。能够与给定序列杂交的序列被称为该给定序列的“互补物”。

如本文使用的，“表达(expression或expressing)”是指藉此从DNA模板转录成多核苷酸(如转录成mRNA或其他RNA转录物)的过程和/或转录的mRNA随后藉此翻译成肽、多肽或蛋白质的过程。转录物和编码的多肽可以总称为“基因产物”。如果多核苷酸来源于基因组DNA，则表达可以包括真核细胞中mRNA的剪接。如本文使用的基因或核酸的“表达”不仅涵盖细胞基因表达，而且涵盖在克隆系统中或在任何其他背景下的一个或多个核酸的转录和翻译。

术语“多肽”、“肽”和“蛋白质”在本文可互换地使用，是指具有任何长度的氨基酸的聚合物。该聚合物可以是可以是直链或支链的，它可以包含修饰的氨基酸，并且它可以被非氨基酸中断。这些术语还涵盖已经被修饰的氨基酸聚合物；这些修饰例如二硫键形成、糖基化、脂化(lipidation)、乙酰化、磷酸化、或任何其他操纵，如与标记组分的缀合。如本文使用的，术语“氨基酸”包括天然的和/或非天然的或者合成的氨基酸，包括甘氨酸以及D或I旋光异构体、以及氨基酸类似物和肽模拟物。

术语“受试者”、“个体”和“患者”在本文中是可互换地使用的，是指脊椎动物，优选哺乳动物，更优选人。哺乳动物包括但不限于鼠类、猴、人、农畜、体育用动物和宠物。也包括体内获得或体外培养的生物实体的组织、细胞及其子代。

在某些实施例中，如本文描述的根据本发明的方法和细胞可以在治疗剂的筛选方法中、和/或在诊断方法中使用。候选治疗剂可以具有不同的时间表达谱效应，这可以根据如本文描述的方法读出。

术语“治疗剂”、“能够用于治疗的试剂”或“处理剂”是可互换地使用的，并且是指在给予受试者时赋予某种有益影响的分子或化合物。该有益影响包括诊断确定的实现；改善疾病、症状、障碍、或病理学病况；减少或预防疾病、症状、障碍或病况的发作；以及总体上对抗疾病、症状、障碍或病理学病况。

如本文使用的，“治疗”或“进行治疗”、或“减轻”或“改善”是可互换地使用的。这些术语是指如下途径，该途径用于获得有益或希望的结果，包括但不限于治疗益处和/或预防益处。治疗益处意指治疗中的一种或多种疾病、病况、或症状上的任何治疗上相关的改进或对其的影响。对于预防益处，该组合物可给予至处于发展具体的疾病、病况、或症状的风险的受试者，或给予至报告了疾病的一个或多个生理学症状的受试者，尽管该疾病、病况、或症状可能还没有体现出来。

如本文使用的，术语“嵌合RNA”、“嵌合指导RNA”、“指导RNA”、“单个指导RNA”以及“合成指导RNA”是指包括指导序列、tracr序列和tracr配对序列的多核苷酸序列。术语“指导序列”是指在指定靶位点的指导RNA内约20bp的序列，并且可与术语“指导”或“间隔子”互换地使用。术语“tracr配对序列”也可与术语“(一个或多个)同向重复”互换地使用。该指导序列、tracr、和tracr配对序列可以被提供在单个核酸分子上。可替代地，该指导和tracr配对序列可以被提供在单个核酸分子上，而该tracr被提供在分开的核酸分子上。

一般而言，该CRISPR-Cas或CRISPR系统是如在上述文献(如WO 2014/093622(PCT/US2013/074667))中使用的，并且共同地是指转录物和涉及CRISPR相关(“Cas”)基因的表达或指导其活性的其他组件，包括编码Cas基因的序列、tracr(反式激活CRISPR)序列(例如tracrRNA或活性部分tracrRNA)、tracr配对序列(涵盖“同向重复”和在内源CRISPR系统背景下的tracrRNA加工的部分同向重复)、指导序列(在内源CRISPR系统背景下也称为“间隔子(spacer)”)或如该术语在本文中使用的“一个或多个RNA”(例如，指导Cas(如Cas9)的一个或多个RNA，例如CRISPR RNA和反式激活(tracr)RNA或单个指导RNA(sgRNA)(嵌合RNA))或来自CRISPR座位的其他序列和转录物。一般而言，CRISPR系统的特征为促进在靶序列的位点处的CRISPR复合物(在内源CRISPR系统的背景下也称为原型间隔子)的形成的组件。在CRISPR复合物形成的背景下，“靶序列”是指指导序列被设计为对其具有互补性的序列，其中在靶序列与指导序列之间的杂交促进CRISPR复合物的形成。靶序列可以包含任何多核苷酸，如DNA或RNA多核苷酸。在一些实施例中，靶序列位于细胞的细胞核或细胞质中。在一些实施例中，可以通过计算机搜索重复基序来鉴定同向重复，其满足下列标准的任一项或全部：1.发现在II型CRISPR座位侧翼的基因组序列的2Kb窗口；2.跨从20到50bp；以及3.以20到50bp间隔开。在一些实施例中，可以使用这些标准中的2条，例如1和2、2和3、或1和3。在一些实施例中，可以使用所有这3条标准。

指导序列(即能够将Cas导向基因组靶座位的RNA)可以被选择为靶向任何靶序列。在一些实施例中，该靶序列是在细胞的基因组内的序列。示例性靶序列包括在靶基因组中为独特的那些。例如，对于化脓链球菌Cas9，在基因组中的独特靶序列可以包括形式MMMMMMMMNNNNNNNNNNNNXGG的Cas9靶位点，其中NNNNNNNNNNNNXGG(N是A、G、T、或C；并且X可以是任何物)在该基因组中单次出现。在基因组中的独特靶序列可以包括形式MMMMMMMMMNNNNNNNNNNNXGG的化脓链球菌Cas9靶位点，其中NNNNNNNNNNNXGG(N是A、G、T、或C；并且X可以是任何物)在该基因组中单次出现。对于嗜热链球菌CRISPR1 Cas9，在基因组中的独特靶序列可以包括形式MMMMMMMMNNNNNNNNNNNNXXAGAAW的Cas9靶位点，其中NNNNNNNNNNNNXXAGAAW(N是A、G、T、或C；X可以是任何物；并且W是A或T)在该基因组中单次出现。在基因组中的独特靶序列可以包括形式MMMMMMMMMNNNNNNNNNNNXXAGAAW的嗜热链球菌CRISPR1 Cas9靶位点，其中NNNNNNNNNNNXXAGAAW(N是A、G、T、或C；X可以是任何物；并且W是A或T)在该基因组中单次出现。对于化脓链球菌Cas9，在基因组中的独特靶序列可以包括形式MMMMMMMMNNNNNNNNNNNNXGGXG的Cas9靶位点，其中NNNNNNNNNNNNXGGXG(N是A、G、T、或C；并且X可以是任何物)在该基因组中单次出现。在基因组中的独特靶序列可以包括形式MMMMMMMMMNNNNNNNNNNNXGGXG的化脓链球菌Cas9靶位点，其中NNNNNNNNNNNXGGXG(N是A、G、T、或C；并且X可以是任何物)在该基因组中单次出现。在这些序列的每一个中，“M”可以是A、G、T、或C，并且在序列鉴定中不必考虑为是独特的。在一些实施例中，指导序列被选择为降低在该指导序列内的二级结构程度。在一些实施例中，在最佳地折叠时，该指导序列的约或少于约75％、50％、40％、30％、25％、20％、15％、10％、5％、1％、或更少的核苷酸参与自我互补碱基配对。可以通过任何适合的多核苷酸折叠算法来确定最佳折叠。一些算法是基于计算最小吉布斯(Gibbs)自由能。一种这样的算法的实例是mFold，正如祖克(Zuker)和施蒂格勒(Stiegler)所描述的(《核酸研究》(Nucleic Acids Res.)9(1981)，133-148)。折叠算法的另一个实例是使用质心结构预测算法的由维也纳大学(University of Vienna)的理论化学研究所(Institute for Theoretical Chemistry)研发的在线网络服务器RNAfold(参见例如，A.R.格鲁伯(Gruber)等人，2008，《细胞》(Cell)106(1):23-24；以及PA卡尔(Carr)和GM丘奇(Church)，2009，《自然生物技术》(Nature Biotechnology)27(12):1151-62)。

一般而言，tracr配对序列包括与tracr序列具有足够互补性以促进下列一项或多项的任何序列：(1)侧翼于tracr配对序列的指导序列在含有相应的tracr序列的细胞中的切除；和(2)CRISPR复合物在靶序列处的形成，其中该CRISPR复合物包含杂交到该tracr序列上的tracr配对序列。通常，互补程度是就tracr配对序列与tracr序列沿着这两个序列的较短者的长度的最佳比对而言。可以通过任何适合的比对算法来确定最佳比对，并且可以可以进一步对二级结构做出解释，如在该tracr序列或tracr配对序列之内的自我互补性。在一些实施例中，在进行最佳比对时，在该tracr序列与tracr配对序列之间沿着这两者的较短者的长度的互补程度是约或多于约25％、30％、40％、50％、60％、70％、80％、90％、95％、97.5％、99％、或更高。在一些实施例中，该tracr序列在长度上为约或多于约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、40、50个、或更多个核苷酸。在一些实施例中，该tracr序列和tracr配对序列被包含在单个转录物中，使得在这两者之间的杂交产生具有二级结构(如发夹)的转录物。在本发明的一个实施例中，该转录物或转录的多核苷酸序列具有至少两个或更多个发夹。在优选的实施例中，该转录物具有两个、三个、四个或五个发夹。在本发明的一个另外的实施例中，该转录物具有至多五个发夹。在发夹结构中，在该环的最终“N”和上游的序列5’的部分对应于该tracr配对序列，并且该环的序列3’的部分对应于该tracr序列。另外的包含指导序列、tracr配对序列、和tracr序列的单个多核苷酸的非限制性实例如下(列出为5’到3’)，其中“N”代表指导序列的碱基，小写字体的第一区代表tracr配对序列，且小写字体的第二区代表tracr序列，并且最后的多聚T序列代表转录终止子：(1)NNNNNNNNNNNNNNNNNNNNgtttttgtactctcaagatttaGAAAtaaatcttgcagaagctacaaagataaggcttcatgccgaaatcaacaccctgtcattttatggcagggtgttttcgttatttaaTTTTTT(SEQ IDNO:X)；(2)NNNNNNNNNNNNNNNNNNNNgtttttgtactctcaGAAAtgcagaagctacaaagataaggcttcatgccgaaatcaacaccctgtcattttatggcagggtgttttcgttatttaaTTTTTT(SEQ ID NO:X)；(3)NNNNNNNNNNNNNNNNNNNNgtttttgtactctcaGAAAtgcagaagctacaaagataaggcttcatgccgaaatcaacaccctgtcattttatggcagggtgtTTTTTT(SEQ ID NO:X)；(4)NNNNNNNNNNNNNNNNNNNNgttttagagctaGAAAtagcaagttaaaataaggctagtccgttatcaacttgaaaaagtggcaccgagtcggtgcTTTTTT(SEQ ID NO:X)；(5)NNNNNNNNNNNNNNNNNNNNgttttagagctaGAAATAGcaagttaaaataaggctagtccgttatcaacttgaaaaagtgTTTTTTT；(SEQ ID NO:X)以及(6)NNNNNNNNNNNNNNNNNNNNgttttagagctagAAATAGcaagttaaaataaggctagtccgttatcaTTTTTTTT(SEQ ID NO:X)。在一些实施例中，序列(1)到(3)与来自嗜热链球菌CRISPR1的Cas9结合使用。在一些实施例中，序列(4)到(6)与来自化脓链球菌的Cas9结合使用。在一些实施例中，该tracr序列是与包含该tracr配对序列的转录物分开的转录物。

在一些实施例中，随后可以通过满足下列标准的任一项或全部的序列来预测候选tracrRNA：1.与同向重复同源的序列(在Geneious中搜索的具有高达18-bp错配的基序)；2.在转录方向上的预测的不依赖Rho的转录终止子的存在；以及3.在tracrRNA与同向重复之间的稳定发夹二级结构。在一些实施例中，可以使用这些标准中的2条，例如1和2、2和3、或1和3。在一些实施例中，可以使用所有这3条标准。

在一些实施例中，嵌合的合成指导RNA(sgRNA)设计可以在同向重复与tracrRNA之间掺入至少12bp的双链体结构。

指导Cas(如Cas9)的RNA可以包括CRISPR RNA和反式激活(tracr)RNA。可以将该tracr配对序列和该tracr序列连接以形成反式激活(tracr)序列。该tracr配对序列和该tracr序列可以任选地被设计成形成单个指导RNA(sgRNA)。的确，有利的是指导Cas的RNA可以包括嵌合的单个指导RNA(sgRNA)。在进行最佳比对时，该tracr序列与tracr配对序列沿着这两者的较短者的长度可以是约或多于约25％、30％、40％、50％、60％、70％、80％、90％、95％、97.5％、99％、或更高。该tracr序列在长度上可以为约或多于约5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、40、50个、或更多个核苷酸。

在经典CRISPR-Cas系统中，在指导序列与其相应的靶序列之间的互补程度可以是约或多于约50％、60％、75％、80％、85％、90％、95％、97.5％、99％、或100％；指导或RNA或sgRNA在长度上可以为约或多于约5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75个、或更多个核苷酸；或者指导或RNA或sgRNA在长度上可以为少于约75、50、45、40、35、30、25、20、15、12个、或更少的核苷酸；并且有利地，tracrRNA在长度上为30或50个核苷酸。然而，本发明的一个方面在于减少脱靶相互作用，例如减少与具有低互补性的靶序列的相互作用的指导。的确，在这些实例中，显示本发明涉及突变，这些突变产生能够将具有大于80％至约95％互补性(例如，83％-84％或88％-89％或94％-95％互补性)的靶序列与脱靶序列区分开(例如，将具有18个核苷酸的靶标与具有1、2或3个错配的18个核苷酸的脱靶区分开)的CRISPR-Cas系统。因此，在本发明的背景下，在指导序列与其相应的靶序列之间的互补程度大于94.5％或95％或95.5％或96％或96.5％或97％或97.5％或98％或98.5％或99％或99.5％或99.9％，或是100％。脱靶小于100％或99.9％或99.5％或99％或99％或98.5％或98％或97.5％或97％或96.5％或96％或95.5％或95％或94.5％或94％或93％或92％或91％或90％或89％或88％或87％或86％或85％或84％或83％或82％或81％或80％的该序列与该指导物之间的互补性，其中有利的是脱靶是100％或99.9％或99.5％或99％或99％或98.5％或98％或97.5％或97％或96.5％或96％或95.5％或95％或94.5％的该序列与该指导物之间的互补性。

为了将毒性和脱靶效应最小化，重要的是控制所递送的Cas mRNA和指导RNA的浓度。Cas mRNA和指导RNA的最佳浓度可以通过在细胞或非人类真核生物动物模型中测试不同的浓度并且使用深度测序分析在潜在的脱靶基因组座位处的修饰的范围而确定。可替代地，为了将毒性水平和脱靶效应最小化，可以用一对靶向感兴趣位点的指导RNA来递送Cas切口酶mRNA(例如，具有D10A突变的化脓链球菌Cas9)。将毒性和脱靶效应最小化的指导序列和策略可以是如在WO 2014/093622(PCT/US 2013/074667)中的；或者，经由如本文的突变。

在一些实施例中，该CRISPR系统有利地衍生自II型CRISPR系统。在一些实施例中，CRISPR系统的一种或多种组件来源于包含内源CRISPR系统的特殊生物，如化脓链球菌。在本发明的优选实施例中，该CRISPR系统是II型CRISPR系统，并且该Cas酶是Cas9，其催化DNA切割。Cas蛋白的非限制性实例包括：Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8，Cas9(也称为Csn1和Csx12)、Cas10、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4、其同源物、或其修饰形式。优选的Cas酶可以被鉴定为Cas9，因为这可以是指与来自II型CRISPR系统的具有多个核酸酶结构域的最大核酸酶共享同源性的酶的通用类别。最优选地，该Cas9酶来自或衍生自SpCas9或SaCas9。应当理解的是，SpCas9或SaCas9是来自或衍生自化脓链球菌或金黄色葡萄球菌Cas9的那些。所谓衍生，申请人意指该衍生的酶在很大程度上是基于与野生型酶具有高度序列同源性的含义，但是如本文描述的它在某些方面已经被突变(修饰)。应当理解的是，术语Cas和CRISPR酶在本文中通常可互换地使用，除非另外显而易见的。该Cas酶可以是例如任何天然存在的细菌Cas9以及任何嵌合体、突变体、同源物或直向同源物。本文中使用的许多残基编号是指来自化脓链球菌中的II型CRISPR座位的Cas9酶(可替代地称为SpCas9或spCas9)。然而，应当理解的是，本发明包括更多的来自其他微生物物种的Cas9，例如SpCas9的直向同源物，或衍生自除化脓链球菌之外的微生物的Cas9，例如衍生自金黄色葡萄球菌的SaCas9、衍生自嗜热链球菌的St1Cas9等等。本领域技术人员应能够通过比较相关氨基酸序列而确定在除了SpCas9之外的Cas9酶中的适当的相应残基。因此，在特异性氨基酸置换是指使用SpCas9编号的情况下，那么，除非上下文清楚说明，这并不预期是指其他Cas9酶，本披露预期涵盖在其他Cas9酶中的相应修饰。

在一些实施例中，未经修饰的Cas(如Cas9)具有DNA切割活性。在一些实施例中，该Cas引导在靶序列位置处(例如在该靶序列之内和/或在该靶序列的互补物之内)的一条链或两条链的切割。在一些实施例中，该Cas引导距离靶序列的第一个或最后一个核苷酸约1、2、3、4、5、6、7、8、9、10、15、20、25、50、100、200、500个、或更多个碱基对之内的一条链或两条链的切割。在一些实施例中，载体编码相对于相应的野生型酶被突变的Cas，使得该突变的Cas缺乏切割含有靶序列的靶多核苷酸的一条链或两条链的能力。例如，在来自化脓链球菌的Cas9的RuvC I催化结构域中的天冬氨酸到丙氨酸取代(D10A)将Cas9从切割两条链的核酸酶转化成切口酶(切割单条链)。致使Cas9为切口酶的其他突变实例包括而不限于H840A、N854A、和N863A。作为一个另外的实例，Cas9的两个或更多个催化结构域(RuvC I、RuvC II、和RuvC III或该HNH结构域)可以被突变为产生实质上缺乏所有DNA切割活性的突变的Cas9。在一些实施例中，D10A突变与H840A、N854A、或N863A突变的一者或多者相组合，以便产生实质上缺乏所有DNA切割活性的Cas9酶。在一些实施例中，当该突变的酶的DNA切割活性不多于该酶的非突变形式的DNA切割活性的约25％、10％、5％、1％、0.1％、0.01％、或更少时，则Cas被考虑为实质上缺乏所有DNA切割活性；一个实例可以是当突变形式的DNA切割活性与非突变形式相比是零或可忽略不计时。因此，该Cas可以包括一个或多个突变，并且可以用作具有或不具有与功能结构域融合的通用DNA结合蛋白。这些突变可以是人工引入的突变或获得性和丢失性功能突变。这些突变可以包括但不限于分别在RuvC和HNH催化结构域中的催化结构域(例如，D10和H840)之一中的突变；或者该CRISPR酶可以包括一个或多个选自下组的突变，该组由以下各项组成：D10A、E762A、H840A、N854A、N863A或D986A，和/或该Cas的RuvC1或HNH结构域中的一个或多个突变，或者具有如本文另外讨论的突变。在本发明的一个方面，该Cas酶可以融合至蛋白质(例如TAG)、和/或诱导型/控制型结构域(如化学诱导型/控制型结构域)。在本发明中，该Cas可以是嵌合Cas蛋白；例如，由于作为嵌合体而具有增强的功能的Cas。嵌合Cas蛋白可以是含有来自一种以上的天然存在的Cas的片段的新Cas。这些可以包括一种Cas9同源物的一个或多个N-末端片段与另一种Cas同源物的一个或多个C-末端片段的融合。该Cas可以按mRNA的形式递送到细胞中。Cas的表达可以处于诱导型启动子的控制之下。在该酶不是SpCas9的情况下，可以在相应于SpCas9的位置10、762、840、854、863和/或986的任何或所有残基处进行突变(其可以例如通过标准序列比较工具进行确定)。具体地说，在SpCas9中的任何或所有下列突变是优选的：D10A、E762A、H840A、N854A、N863A和/或D986A；并且还设想了这些置换氨基酸中的任何的保守性取代。在其他Cas9中的相应位置处的相同取代(或这些突变的保守性取代)也是优选的。特别优选的是在SpCas9中的D10和H840。然而，在其他Cas9中，相应于SpCas9 D10和H840的残基也是优选的。明确地，避免对已知突变的阅读是本发明的一个目的。也就是说，在本领域中已知导致Cas9成为切口酶或导致Cas9变得“失活”(例如，与非突变的Cas9相比，具有很少或没有，例如5％或不到5％，例如不到4％、3％、2％或1％的核酸酶活性)的突变并不旨在落入减少或消除指导与脱靶核酸分子之间的相互作用的Cas9突变的范围内，但是申请人保留利用附带条件来排除这样的已知的产生“切口酶”-或-“失活”-Cas9的突变的权利。的确，短语“由此与未修饰的酶相比该CRISPR复合物中的酶具有降低的修饰一个或多个脱靶座位的能力和/或由此与未修饰的酶相比该CRISPR复合物中的酶具有增加的修饰一个或多个靶座位的能力”(或类似表述)并不旨在对仅产生失活Cas9的切口酶的突变或已知Cas9突变进行阅读。然而，这并不是说，本发明的一种或多种修饰或一个或多个突变“由此与未修饰的酶相比该CRISPR复合物中的酶具有降低的修饰一个或多个脱靶座位的能力和/或由此与未修饰的酶相比该CRISPR复合物中的酶具有增加的修饰一个或多个靶座位的能力”(或类似表述)不能与使得该酶成为切口酶或使得该酶失活的突变组合。这样一种失活酶可以是增强的核酸分子结合物。并且这样一种切口酶可以是增强的切口酶。例如，将沟槽中的和/或沟槽附近的一个或多个中性氨基酸和/或Cas9中的其他位置中的与核酸(例如，DNA、cDNA、RNA、sgRNA)非常接近的其他带电的残基变为一个或多个带正负的氨基酸可以导致“由此与未修饰的酶相比该CRISPR复合物中的酶具有降低的修饰一个或多个脱靶座位的能力和/或由此与未修饰的酶相比该CRISPR复合物中的酶具有增加的修饰一个或多个靶座位的能力”，例如，更具切割性。因为这既可以是增强的中靶切割又可以是增强的脱靶切割(超级切割Cas9)，将其与本领域中称为tru-指导或tru-sgRNA(参见例如，付(Fu)等人，“使用截短的指导RNA改进CRISPR-Cas核酸酶特异性(Improving CRISPR-Cas nuclease specificity usingtruncated guide RNAs)”，《自然生物技术》(Nature Biotechnology)32，279-284(2014)doi:10.1038/nbt.2808收稿于2013年11月17日，接收于2014年1月06日，在线公开于2014年1月26日，在线修正于2014年1月29日)的一起使用，以便具有增强的中靶活性而没有较高的脱靶切割、或者用于制备超级切割切口酶、或者用于与使得Cas9失活的突变组合为超级结合物。

SpCas9的直向同源物可以用于本发明的实践中。Cas酶可以被鉴定为Cas9，因为这可以是指与来自II型CRISPR系统的具有多个核酸酶结构域的最大核酸酶共享同源性的酶的通用类别。最优选地，该Cas9酶来自或衍生自spCas9(化脓链球菌Cas9)或saCas9(金黄色葡萄球菌Cas9)。“StCas9”是指来自嗜热链球菌的野生型Cas9，其蛋白质序列在登录号G3ECR1下给出于SwissProt数据库中。类似地，化脓链球菌Cas9或spCas9在登录号Q99ZW2下被包括在SwissProt中。关于衍生，申请人意指该衍生的酶在很大程度上是基于与野生型酶具有高度序列同源性的含义，但是如本文所述它在某些方面已经被突变(修饰)。应当理解的是，术语Cas和CRISPR酶在本文中通常可互换地使用，除非另外说明。如上提及的，在本文中使用的许多残基编号是指来自化脓链球菌中的II型CRISPR座位的Cas9酶。然而，应当理解的是，本发明包括更多的来自其他微生物物种的Cas9s，如SpCas9、SaCa9、St1Cas9等等。通过来源于化脓链球菌或Cas9或任何密切相关的Cas9的酶促作用，产生了在靶位点序列处的双链断裂，所述靶位点序列杂交到该指导序列的20个核苷酸上并且具有在该靶序列的20个核苷酸之后的原型间隔子相邻基序(PAM)序列(实例包括NGG/NRG或可以如本文所述进行确定的PAM)。经由Cas9的对于位点特异性DNA识别和切割的CRISPR活性是由该指导序列、部分杂交到该指导序列上的tracr序列以及该PAM序列定义的。不希望被理论所束缚，据信该靶序列应该与PAM(原型间隔子邻近基序)相关；也就是说，与由CRISPR复合物识别的短序列相关。对PAM的精确序列和长度要求取决于使用的Cas而不同，但是PAM典型地是临近原型间隔子(也就是说，靶序列)的2-5个碱基对序列。在一些实施例中，该方法包括允许CRISPR复合物结合到该靶多核苷酸上以实施所述靶多核苷酸的切割，由此修饰该靶多核苷酸，其中该CRISPR复合物包含与杂交到在所述靶多核苷酸内的靶序列上的指导序列复合的Cas，其中所述指导序列连接到tracr配对序列上，该tracr配对序列进而杂交到tracr序列上。该CRISPR系统的更多方面在卡吉诺夫(Karginov)和汉农(Hannon)的“CRISPR系统：在细菌和古细菌中的小RNA指导的防御”(The CRISPR system:small RNA-guided defence inbacteria and archaea)，《分子细胞学杂志》(Mole Cell)2010年1月15日；37(1):7中。II型CRISPR座位来自化脓链球菌SF370，该座位含有四个基因Cas9、Cas1、Cas2和Csn1的聚簇以及两个非编码RNA组件tracrRNA和由非重复序列的短段(间隔子，每个约30bp)间隔开的重复序列(同向重复)的特征性阵列。在此系统中，以四个连续步骤产生靶向的DNA双链断裂(DSB)。第一步，从CRISPR座位转录两个非编码RNA前-crRNA阵列和tracrRNA。第二步，将tracrRNA杂交到前-crRNA的同向重复上，然后将其加工成含有单独的间隔子序列的成熟crRNA。第三步，该成熟crRNA:tracrRNA复合物经由在crRNA的间隔子区与原型间隔子DNA之间形成异源双链体而引导Cas到由原型间隔子和对应的PAM组成的DNA靶标。最后，Cas介导PAM上游的靶DNA的切割，以在原型间隔子内产生DSB。由单个间隔子组成的前-crRNA阵列，该单个间隔子侧翼为两个同向重复(DR，还被术语“tracr配对序列”所涵盖)。在某些实施例中，Cas可以组成性地存在或诱导性地存在或条件性地存在或给予或递送。Cas优化可以用来增强功能或者用来开发新的功能，可以产生嵌合Cas蛋白。并且Cas可以用作通用的DNA结合蛋白。

在本披露中，术语“Cas”可以意指“Cas9”或CRISPR酶。在本发明的背景下，Cas9或Cas或CRISPR酶被突变或修饰，“由此与未修饰的酶相比该CRISPR复合物中的酶具有降低的修饰一个或多个脱靶座位的能力”(或类似表述)；并且，当阅读本说明书时，术语“Cas9”或“Cas”或“CRISPR酶”等意在包括根据本发明的经突变或经修饰的Cas9或Cas或CRISPR酶，即“由此与未修饰的酶相比该CRISPR复合物中的酶具有降低的修饰一个或多个脱靶座位的能力”(或类似表述)。

用于表达Cas蛋白的密码子优化和密码子使用

编码Cas的核酸分子有利地是经密码子优化的Cas。密码子优化序列的一个实例在这种情形下是针对在真核生物(例如，人类)中表达(即，针对在人类中表达进行优化)或针对如本文讨论的另一种真核生物、动物或哺乳动物进行优化的序列；参见，例如，WO 2014/093622(PCT/US 2013/074667)中的SaCas9人类密码子优化序列。虽然这是优选的，但是应当理解的是，其他实例也是可能的，并且针对除人类之外的宿主物种的密码子优化或针对具体器官的密码子优化是已知的。在一些实施例中，编码Cas的酶编码序列经密码子优化，以便在特定的细胞(如真核细胞)中表达。这些真核细胞可以是特定生物的那些或来源于特定生物，如哺乳动物，包括但不限于人、或如本文讨论的非人类真核生物或动物或哺乳动物，例如，小鼠、大鼠、兔、狗、牲畜、或非人类哺乳动物或灵长类动物。在一些实施例中，对于人类或动物而言很可能使得他们(它们)受苦而没有任何实质性医学益处的用于修饰人类的种系遗传同一性的方法和/或用于修饰动物的遗传同一性的方法、以及还有作为这样的方法的结果的动物，可以被排除在外。一般而言，密码子优化是指通过用在宿主细胞的基因中更频繁地或者最频繁地使用的密码子代替天然序列的至少一个密码子(例如约或多于约1、2、3、4、5、10、15、20、25、50个、或更多个密码子同时维持该天然氨基酸序列而修饰核酸序列以便增强在感兴趣宿主细胞中的表达的方法。不同的物种对于具有特定氨基酸的某些密码子展示出特定的偏好。密码子偏好性(在生物之间的密码子使用的差异)经常与信使RNA(mRNA)的翻译效率相关，而该翻译效率则被认为依赖于(除其他之外)被翻译的密码子的性质和特定的转运RNA(tRNA)分子的可用性。细胞内选定的tRNA的优势一般反映了最频繁用于肽合成的密码子。因此，可以将基因定制为基于密码子优化在给定生物中的最佳基因表达。密码子利用率表可以容易地获得，例如在www.kazusa.orjp/codon/上可获得的密码子使用数据库(“Codon Usage Database”)中，并且这些表可以通过不同的方式调整适用。参见，中村(Nakamura)Y.等人，“从国际DNA序列数据库中制表的密码子使用：2000年的状态(Codon usage tabulated from the international DNA sequence databases:statusfor the year2000)”《核酸研究》(Nucl.Acids Res.)28:292(2000)。用于密码子优化特定的序列以便在特定的宿主细胞中表达的计算机算法也是可得的，如基因制造(Gene Forge)(Aptagen公司；雅各布布斯(Jacobus)，宾夕法尼亚州)，也是可得的。在一些实施例中，在编码Cas的序列中的一个或多个密码子(例如1、2、3、4、5、10、15、20、25、50个、或更多个、或所有密码子)对应于对于特定氨基酸最频繁使用的密码子。

在某些实施例中，如本文描述的方法可以包括提供Cas转基因细胞，在其中编码一种或多种指导RNA的一个或多个核酸被提供或被引入，在该细胞中与包含一个或多个感兴趣基因的启动子的调节组件有效作地连接。如本文使用的，术语“Cas转基因细胞”是指其中已经基因组整合了Cas基因的细胞，如真核细胞。根据本发明，该细胞的性质、类型、或来源不是特别受限的。而且，该Cas转基因被引入该细胞中的方式可以变化并且可以是如本领域中已知的任何方法。在某些实施例中，通过将该Cas转基因引入分离的细胞中来获得该Cas转基因细胞。在某些其他实施例中，通过从Cas转基因生物中分离细胞来获得该Cas转基因细胞。通过举例的方式并且不受限，如本文提及的Cas转基因细胞可以来源于Cas转基因真核生物(如Cas敲入真核生物)。参考通过引用并入本文的WO 2014/093622(PCT/US13/74667)。可以修饰针对靶向Rosa座位的、转让给桑加莫生物科学公司(SangamoBioSciences，Inc.)的美国专利公开号20120017290和20110265198的方法，以便利用本发明的CRISPR Cas系统。也可以修饰针对靶向Rosa座位的、转让给Cellectis公司的美国专利公开号20130236946的方法，以便利用本发明的CRISPR Cas系统。通过进一步举例的方式，参考普莱特(Platt)等人(《细胞》((Cell)；159(2):440-455(2014))，描述了Cas9敲入小鼠，将其通过引用并入本文。该Cas转基因可以进一步包括Lox-Stop-polyA-Lox(LSL)盒，由此赋予可通过Cre重组酶诱导的Cas表达。可替代地，可以通过将该Cas转基因引入分离的细胞中来获得该Cas转基因细胞。转基因的递送系统在本领域是熟知的。通过举例的方式，该Cas转基因可以借助载体(例如，AAV、腺病毒、慢病毒)和/或粒子和/或纳米粒子递送而被递送到例如真核细胞中，还如在本文的其他地方所描述的。

本领域技术人员应理解的是，如本文提及的细胞(如Cas转基因细胞)除了具有整合的Cas基因之外还可以包括另外的基因组改变、或当与能够将Cas导向靶座位的RNA复合时由Cas的序列特异性作用产生的突变，例如像一个或多个致癌突变，例如像但不限于描述于普莱特(Platt)等人(2014)、陈(Chen)等人(2014)或库马尔(Kumar)等人(2009)中的。

具有一个或多个NLS的Cas蛋白

在一些实施例中，该Cas序列融合至一个或多个核定位序列(NLS)，如约或多于约1、2、3、4、5、6、7、8、9、10个、或更多个NLS。在一些实施例中，该Cas包括在或接近于氨基-末端的约或多于约1、2、3、4、5、6、7、8、9、10个、或更多个NLS，在或接近于羧基-末端约或多于约1、2、3、4、5、6、7、8、9、10个、或更多个NLS，或这些的组合(例如在氨基-末端的零个或至少一个或多个NLS以及在羧基-末端的零个或至少一个或多个NLS)。当存在多于一个NLS时，每一个可以被选择为不依赖于其他NLS，使得在多于一个拷贝中可以存在单个NLS和/或与在一个或多个拷贝中存在一个或多个其他NLS相组合。在本发明的一个优选实施例中，该Cas包括至多6个NLS。在一些实施例中，当NLS的最近的氨基酸是在从N-末端或C-末端沿着该多肽链的约1、2、3、4、5、10、15、20、25、30、40、50个、或更多个氨基酸之内时，NLS可以被视为接近该N-末端或C-末端。NLS的非限制性实例包括来源于以下项的NLS序列：SV40病毒大T抗原的NLS，其具有氨基酸序列PKKKRKV(SEQ ID NO:X)；来自核质蛋白的NLS(例如，具有序列KRPAATKKAGQAKKKK的核质蛋白二分NLS)(SEQ ID NO:X)；c-myc NLS，其具有氨基酸序列PAAKRVKLD(SEQ ID NO:X)或RQRRNELKRSP(SEQ ID NO:X)；hRNPA1M9NLS，其具有序列NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(SEQ ID NO:X)；来自输入蛋白-α的IBB结构域的序列RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(SEQ ID NO:X)；肌瘤T蛋白的序列VSRKRPRP(SEQ ID NO:X)和PPKKARED(SEQ ID NO:X)；人p53的序列POPKKKPL(SEQ ID NO:X)；小鼠c-abl IV的序列SALIKKKKKMAP(SEQ ID NO:X)；流感病毒NS1的序列DRLRR(SEQ IDNO:X)和PKQKKRK(SEQ ID NO:X)；肝炎病毒δ抗原的序列RKLKKKIKKL(SEQ ID NO:X)；小鼠Mx1蛋白的序列REKKKFLKRR(SEQ ID NO:X)；人聚(ADP-核糖)聚合酶的序列KRKGDEVDGVDEVAKKKSKK(SEQ ID NO:X)；以及类固醇激素受体(人)糖皮质激素的序列RKCLQAGMNLEARKTKK(SEQ ID NO:X)。一般而言，这一个或多个NLS具有足够的强度，以便在真核细胞的细胞核中驱动该Cas以可检测的量积聚。一般而言，核定位活性的强度可以由在该Cas中的NLS的数目、所使用的一个或多个特定的NLS、或这些因素的组合导出。可以通过任何适合的技术进行细胞核中积聚的检测。例如，检测标记可以融合到该Cas上，使得细胞内的位置可以被可视化，如与检测细胞核的位置的手段(例如，对于细胞核特异的染料，如DAPI)相结合。还可以将细胞核从细胞中分离出来，然后可以通过任何适合的用于检测蛋白质的方法分析其内容物，如免疫组织化学、Western印迹或酶活性测定。如通过测定CRISPR复合物形成的作用(例如，测定在靶序列处的DNA切割或突变、或测定由于CRISPR复合物形成和/或Cas酶活性的影响而改变的基因表达活性)，与没有暴露于该Cas或复合物、或暴露于缺乏这一个或多个NLS的Cas的对照相比较，还可以间接地确定细胞核中的积聚。在一些实施例中，不存在添加至或融合至该Cas蛋白的NLS。

CRISPR系统的递送

根据本披露和本领域的知识，可以通过在本文一般性地和详细地描述的递送系统来递送CRISPR-Cas系统(确切地说是本文描述的新颖的CRISPR系统)、或其组分或其核酸分子(包括，例如HDR模板)或编码或提供其组分的核酸分子。

关于载体的一般信息

通常，并且贯穿本说明书，术语“载体”是指一种核酸分子，它能够运送与其连接的另一种核酸分子。载体包括但不限于，单链、双链、或部分双链的核酸分子；包括一个或多个自由端、无自由端(例如，环状的)的核酸分子；包括DNA、RNA、或两者的核酸分子；以及本领域已知的其他多种多样的多核苷酸。一种类型的载体是“质粒”，其是指其中可以例如通过标准分子克隆技术插入另外的DNA片段的环状双链DNA环。另一种类型的载体是病毒载体，其中病毒衍生的DNA或RNA序列存在于用于包装进病毒(例如，逆转录病毒、复制缺陷型逆转录病毒、腺病毒、复制缺陷型腺病毒、以及腺相关病毒)的载体中。病毒载体还包含由用于转染到宿主细胞中的病毒携带的多核苷酸。某些载体(例如，具有细菌复制起点的细菌载体和附加型哺乳动物载体)能够在它们被导入的宿主细胞中自主复制。其他载体(例如，非附加型哺乳动物载体)在引入宿主细胞后整合到该宿主细胞的基因组中，并且由此与该宿主基因组一起复制。而且，某些载体能够指导它们有效连接的基因的表达。这样的载体在此被称为“表达载体”。用于在真核细胞中表达并且导致在真核细胞中表达的载体在本文可以被称为“真核表达载体”。在重组DNA技术中使用的普通表达栽体通常是质粒形式。

术语“调节组件”旨在包括启动子、增强子、内部核糖体进入位点(IRES)、以及其他表达控制组件(例如，转录终止信号，如多聚腺苷酸化信号和多聚U序列)。这样的调节序列例如描述于戈德尔(Goeddel)，《基因表达技术：酶学方法》(GENE EXPRESSION TECHNOLOGY:METHODS IN ENZYMOLOGY)185，学术出版社(Academic Press)，圣地亚哥(San Diego)，加利福尼亚州(1990)中。调节组件包括指导一个核苷酸序列在许多类型的宿主细胞中的组成型表达的那些序列以及指导该核苷酸序列只在某些宿主细胞中表达的那些序列(例如，组织特异型调节序列)。组织特异性启动子可主要引导在感兴趣的期望组织中的表达，所述组织例如肌肉、神经元、骨、皮肤、血液、特定的器官(例如，肝、胰腺)、或特殊的细胞类型(例如，淋巴细胞)。调节组件还可以时序依赖性方式(如以细胞周期依赖性或发育阶段依赖性方式)指导表达，该方式可以是或者可以不是组织或细胞类型特异性的。在一些实施例中，载体包括一个或多个pol III启动子(例如，1、2、3、4、5个、或更多个pol III启动子)、一个或多个pol II启动子(例如，1、2、3、4、5个、或更多个pol II启动子)、一个或多个pol I启动子(例如，1、2、3、4、5个、或更多个pol I启动子)、或其组合。pol III启动子的实例包括但不限于U6和H1启动子。pol II启动子的实例包括但不限于逆转录劳斯肉瘤病毒(RSV)LTR启动子(任选地具有RSV增强子)、巨细胞病毒(CMV)启动子(任选地具有CMV增强子)[参见，例如，波沙特(Boshart)等人，《细胞》(Cell)41:521-530(1985)]、SV40启动子、二氢叶酸还原酶启动子、β-肌动蛋白启动子、磷酸甘油激酶(PGK)启动子、和EF1α启动子。还被术语“调节组件”涵盖的是增强子组件，如WPRE；CMV增强子；在HTLV-I的LTR中的R-U5’片段(《分子细胞生物学》(Mol.Cell.Biol.)，第8(1)卷，第466-472页，1988)；SV40增强子；以及在兔β-珠蛋白的外显子2与3之间的内含子序列(《美国国家科学院院刊》(Proc.Natl.Acad.Sci.USA.)，第78(3)卷，第1527-31页，1981)。本领域的普通技术人员应当理解的是，表达载体的设计可取决于比如待转化的宿主细胞的选择、所希望的表达水平等因素。载体可以被引入到宿主细胞中而由此产生转录物、蛋白质、或肽，包括由如本文描述的核酸编码的融合蛋白或肽(例如，规律间隔成簇短回文重复(CRISPR)转录物、蛋白质、酶、其突变体形式、其融合蛋白等)。

在一些实施例中，将驱动靶向核酸的系统的一个或多个组件的表达的一种或多种载体引入宿主细胞中，使得靶向核酸的该系统的这些组件的表达在一个或多个靶位点引导靶向核酸的复合物的形成。例如，靶向核酸的效应酶和靶向核酸的指导RNA可以各自有效作地连接到分开的载体上的分开的调节组件上。可以将靶向核酸的该系统的一种或多种RNA递送到转基因的靶向核酸的效应蛋白的动物或哺乳动物，例如组成性地或诱导性地或条件性地表达靶向核酸的效应蛋白的动物或哺乳动物；或以其他方式表达靶向核酸的效应蛋白或具有含有靶向核酸的效应蛋白的细胞的动物或哺乳动物，如通过向其先前给予编码并且在体内表达靶向核酸的效应蛋白的一种或多种载体的方式。可替代地，从相同或不同调节组件表达的两个或更多个组件可以结合在单个载体中，其中提供靶向核酸的该系统的任何组分的一种或多种另外的载体不包括在该第一载体中。结合在单个载体中的靶向核酸的系统组件可以按照任何适合的方向排列，如一个组件相对于第二组件位于5'(“上游”)或3'(“下游”)。一个组件的编码序列可以位于第二组件的编码序列的同一条链或相对链上，并且取向为相同或相对的方向。在一些实施例中，单个启动子驱动编码靶向核酸的效应蛋白的转录物以及嵌入在一个或多个内含子序列之内(例如，各自在不同的内含子中、两个或更多个在至少一个内含子中、或全部在单个内含子中)的靶向核酸的指导RNA的表达。在一些实施例中，靶向核酸的该效应蛋白和靶向核酸的该指导RNA可以有效作地连接至同一启动子并且从其中表达。用于表达靶向核酸的系统的一个或多个组件的递送运载体、载体、粒子、纳米粒子、配制品及其组分是如在前述文献(如WO 2014/093622(PCT/US 2013/074667))中使用的。在一些实施例中，载体包括一个或多个插入位点，如限制性内切核酸酶识别序列(也称为“克隆位点”)。在一些实施例中，一个或多个插入位点(例如，约或多于约1、2、3、4、5、6、7、8、9、10个、或更多个插入位点)位于一种或多种载体的一个或多个序列组件的上游和/或下游。在一些实施例中，载体包括在tracr配对序列的上游，并且任选地在有效作地连接到该tracr配对序列上的调节组件的下游的插入位点，使得在将指导序列插入到该插入位点中之后并且在表达时，该指导序列引导靶向核酸的复合物与真核细胞中的靶序列的序列特异性结合。在一些实施例中，载体包括两个或更多个插入位点，从而允许在每个位点插入指导序列。在这样一种安排中，两个或更多个指导序列可以包含单个指导序列的两个或更多个拷贝、两个或更多个不同的指导序列、或这些的组合。当使用多个不同的指导序列时，可以使用单个表达构建体使靶向核酸的活性靶向到细胞内的多个不同的相应靶序列。例如，单个载体可以包括约或多于约1、2、3、4、5、6、7、8、9、10、15、20个、或更多个指导序列。在一些实施例中，可以提供约或多于约1、2、3、4、5、6、7、8、9、10个、或更多种这样的含有靶序列的载体，并且任选地将其递送到细胞中。在一些实施例中，载体包括有效作地连接到编码靶向核酸的效应蛋白的酶编码序列上的调节组件。靶向核酸的效应蛋白或靶向核酸的指导RNA或一种或多种RNA可以分开地递送；并且有利地，这些中的至少一者经由粒子或纳米粒子复合物递送。靶向核酸的效应蛋白mRNA可以在靶向核酸的指导RNA之前递送，以给靶向核酸的效应蛋白的表达留出时间。可以在给予靶向核酸的指导RNA之前1-12小时(优选约2-6小时)给予靶向核酸的效应蛋白mRNA。可替代地，可以一起给予靶向核酸的效应蛋白mRNA和靶向核酸的指导RNA。有利地，可以在初始给予靶向核酸的效应蛋白mRNA+指导RNA之后1-12小时(优选约2-6小时)给予指导RNA的第二加强剂量。为了实现基因组修饰的最有效水平，另外给予靶向核酸的效应蛋白mRNA和/或指导RNA可以是有用的。

关于载体递送的一般信息

在某些方面，本发明涉及载体，这些载体例如用于将Cas和/或能够将Cas导向靶座位的RNA(即指导RNA)递送或引入细胞中，而且还用于繁殖这些组分(例如在原核细胞中)。如本文使用的，“载体”是允许或促进一个实体从一个环境转移到另一个环境中的工具。它是复制子，如质粒、噬菌体、或粘粒，另一个DNA片段可以插入其中，从而引起该插入的片段的复制。通常，当与适当的控制组件缔合时，载体能够复制。一般而言，术语“载体”是指一种核酸分子，其能够运送与其连接的另一种核酸分子。载体包括但不限于，单链、双链、或部分双链的核酸分子；包括一个或多个自由端、无自由端(例如环状的)的核酸分子；包括DNA、RNA、或两者的核酸分子；以及本领域已知的其他多种多样的多核苷酸。一种类型的载体是“质粒”，其是指其中可以例如通过标准分子克隆技术插入另外的DNA片段的环状双链DNA环。另一种类型的载体是病毒载体，其中病毒衍生的DNA或RNA序列存在于用于包装病毒(例如，逆转录病毒、复制缺陷型逆转录病毒、腺病毒、复制缺陷型腺病毒、以及腺相关病毒(AAV))的载体中。病毒载体还包含由用于转染到宿主细胞中的病毒携带的多核苷酸。某些载体(例如，具有细菌复制起点的细菌载体和附加型哺乳动物载体)能够在它们被导入的宿主细胞中自主复制。其他载体(例如，非附加型哺乳动物载体)在引入宿主细胞后整合到该宿主细胞的基因组中，并且由此与该宿主基因组一起复制。而且，某些载体能够指导它们有效连接的基因的表达。这样的载体在此被称为“表达载体”。在重组DNA技术中使用的普通表达栽体通常是质粒形式。

重组表达载体可包含处于适合于在宿主细胞中的核酸表达的形式的本发明的核酸，这意味着这些重组表达载体包含基于待用于表达的宿主细胞而选择的一种或多种调节组件，所述调节组件有效作地连接至待表达的核酸序列。在重组表达载体内，“有效作地连接”旨在表示感兴趣的核苷酸序列以允许该核苷酸序列的表达的方式被连接至该一种或多种调节组件(例如，处于体外转录/翻译系统中或当该载体被引入到宿主细胞中时，处于该宿主细胞中)。关于重组和克隆方法，提及2004年9月2日以US 2004-0171156A1公开的美国专利申请10/815,730，该专利的内容通过引用以其全文并入本文。

这一种或多种载体可以包括一种或多种调节组件，例如一种或多种启动子。这一种或多种载体可以包括Cas编码序列，和/或单个指导RNA编码序列，但是可能地，还可以包括至少3或8或16或32或48或50个指导RNA(例如，sgRNA)编码序列，如1-2、1-3、1-4、1-5、3-6、3-7、3-8、3-9、3-10、3-8、3-16、3-30、3-32、3-48、3-50种RNA(例如，sgRNA)。在单个载体中，有利地当存在高达约16种RNA(例如，sgRNA)时，可以存在启动子针对每种RNA(例如，sgRNA)；并且，当单个载体提供多于16种RNA(例如，sgRNA)时，一种或多种启动子可以驱动这一种或多种RNA(例如，sgRNA)中的多于一种的表达，例如当存在32种RNA(例如，sgRNA)，每种启动子都可以驱动两种RNA(例如，sgRNA)的表达，并且当存在48种RNA(例如，sgRNA)时，每种启动子都可以驱动三种RNA(例如，sgRNA)的表达。通过简单的算术以及良好建立的克隆方案和本披露的传授，本领域的普通技术人员可以容易地就一种或多种RNA(例如，适合的示例性载体如AAV的一种或多种sgRNA，和适合的启动子如U6启动子，例如U6-sgRNA)而言实践本发明。例如，AAV的包装极限是约4.7kb。单个U6-sgRNA(加克隆用的限制酶切位点)的长度是361bp。因此，本领域技术人员可以容易地将约12-16个(例如，13个)U6-sgRNA盒装配进单个载体中。这可以通过任何合适的手段进行组装，如用于TALE组装的金门(goldengate)策略(http://www.genome-engineering.org/taleffectors/)。本领域技术人员还可以使用串联指导策略将U6-sgRNA的数目增加大约1.5倍，例如从12-16个(例如，13个)增加到大约18-24个(例如，约19个)U6-sgRNA。因此，本领域的普通技术人员可以在单个载体(例如，AAV载体)中容易地达到大约18-24个(例如，约19个)启动子-RNA(例如，U6-sgRNA)。用于增加载体中的启动子和RNA(例如，一种或多种sgRNA)的数目的另一种手段是使用单个启动子(例如，U6)来表达一系列由可切割的序列隔开的RNA(例如，sgRNA)。并且用于增加载体中的启动子-RNA(例如，sgRNA)的数目的又另一种手段是在编码序列或基因的内含子中表达一系列由可切割的序列隔开的启动子-RNA(例如，sgRNA)；并且，在这种情况下，有利的是使用聚合酶II启动子，它可以具有增加的表达并且按组织特异性方式使得长RNA能够转录。(参见例如，http://nar.oxfordjournals.org/content/34/7/e53.short，http://www.nature.com/mt/journal/v16/n9/abs/mt2008144a.html)。在一个有利的实施例中，AAV可以包装靶向高达约50个基因的U6串联sgRNA。因此，根据本领域的知识以及本披露的传授，本领域技术人员可以容易地制备和使用一种或多种载体(例如，单个载体)，这一种或多种载体在操作性地或功能性地连接的一种或多种启动子的控制下表达多种RNA或指导或sgRNA—尤其是就本文讨论的RNA或指导物或sgRNA的数目而言，而无需进行任何过度的实验。

这一种或多种指导RNA(例如，一种或多种sgRNA)的编码序列和/或Cas编码序列可以功能性地或操作性地连接至一种或多种调节组件并且因此这一种或多种调节组件驱动表达。这一种或多种启动子可以是一种或多种组成型启动子和/或一种或多种条件型启动子和/或一种或多种诱导型启动子和/或一种或多种组织特异性启动子。该启动子可以选自下组，该组由以下各项组成：RNA聚合酶、pol I、pol II、pol III、T7、U6、H1、逆转录劳斯肉瘤病毒(RSV)LTR启动子、巨细胞病毒(CMV)启动子、SV40启动子、二氢叶酸还原酶启动子、β-肌动蛋白启动子、磷酸甘油激酶(PGK)启动子、以及EF1α启动子。一种有利的启动子是启动子U6。

载体递送

载体递送，例如质粒、病毒递送：该CRISPR酶，例如Cas9，和/或本发明的任何RNA，例如指导RNA，可以使用任何适合载体，例如，质粒或病毒载体，如腺相关病毒(AAV)、慢病毒、腺病毒或其他病毒载体类型、或其组合进行递送。Cas9以及一种或多种指导RNA可以被包装到一种或多种载体(例如，质粒或病毒载体)中。在一些实施例中，病毒(例如，质粒或病毒载体)可以例如通过肌肉注射递送到感兴趣的组织中，而有时经由静脉内、经皮、鼻内、经口、粘膜、或其他递送方法进行递送。这样的递送可以经由单剂量或多剂量来进行。本领域技术人员理解的是，本文有待递送的实际剂量可以在很大程度上取决于多种因素而变化，如载体选择、靶细胞、生物、或组织、有待治疗的受试者的一般状况、所寻求的转化/修饰的程度、给药途径、给药方式、所寻求的转化/修饰的类型，等等。

这样的剂量可以进一步含有，例如，载体(水、盐水、乙醇、甘油、乳糖、蔗糖、磷酸钙、明胶、葡聚糖、琼脂、果胶、花生油、芝麻油，等等)、稀释剂、药学上可接受的载体(例如，磷酸盐缓冲盐水)、药学上可接受的赋形剂、和/或本领域已知的其他化合物。该剂型可以进一步含有一种或多种药学上可接受的盐，例如像，无机酸盐如盐酸盐、氢溴酸盐、磷酸盐、硫酸盐、等等；以及有机酸盐，如乙酸盐、丙酸盐、丙二酸盐、苯甲酸盐等等。另外，在本文也可以存在辅助物质，如润湿剂或乳化剂、pH缓冲物质、凝胶或胶凝材料、调味剂、着色剂、微球体、聚合物、悬浮剂等等。另外，也可以存在一种或多种其他常规药用成分，如防腐剂、保湿剂、悬浮剂、表面活性剂、抗氧化剂、抗结剂、填充剂、螯合剂、包衣剂、化学稳定剂等等，尤其是该剂型是可复原形式时。适合的示例性成分包括微晶纤维素、羧甲基纤维素钠、聚山梨酯80、苯乙醇、三氯叔丁醇、山梨酸钾、抗坏血酸、二氧化硫、没食子酸丙酯、对羟基苯甲酸酯、乙基香兰素、甘油、苯酚、对氯酚、明胶、白蛋白和它们的组合。药学上可接受的赋形剂的彻底论述可获自《雷明顿药物科学》(REMINGTON'S PHARMACEUTICAL SCIENCES)(马克出版公司，纽约，1991)，通过引用将其并入本文。

在本文的一个实施例中，递送是经由腺病毒进行的，其可以是含有至少1x 10⁵个腺病毒载体粒子(也称为粒子单位，pu)的单次加强剂量。在本文的一个实施例中，该剂量优选地是该腺病毒载体的至少约1x 10⁶个粒子(例如，约1x 10⁶-1x 10¹²个粒子)，更优选至少约1x 10⁷个粒子，更优选至少约1x 10⁸个粒子(例如，约1x 10⁸-1x 10¹¹个粒子或约1x 10⁸-1x 10¹²个粒子)，并且最优选至少约1x 10⁰个粒子(例如，约1x 10⁹-1x 10¹⁰个粒子或约1x10⁹-1x 10¹²个粒子)，或者甚至至少约1x 10¹⁰个粒子(例如，约1x 10¹⁰-1x 10¹²个粒子)。可替代地，该剂量包含不多于约1x 10¹⁴个粒子，优选不多于约1x 10¹³个粒子，甚至更优选不多于约1x 10¹²个粒子，甚至更优选不多于约1x 10¹¹个粒子，并且最优选不多于约1x 10¹⁰个粒子(例如，不多于约1x 10⁹个粒子)。因此，该剂量可以含有单剂量的腺病毒载体，其具有例如，约1x 10⁶粒子单位(pu)，约2x 10⁶pu、约4x 10⁶pu、约1x 10⁷pu、约2x 10⁷pu、约4x10⁷pu、约1x 10⁸pu、约2x 10⁸pu、约4x 10⁸pu、约1x 10⁹pu、约2x 10⁹pu、约4x 10⁹pu、约1x10¹⁰pu、约2x 10¹⁰pu、约4x 10¹⁰pu、约1x 10¹¹pu、约2x 10¹¹pu、约4x 10¹¹pu、约1x 10¹²pu、约2x 10¹²pu、或约4x 10¹²pu的腺病毒载体。参见例如，在2013年6月4日授权的授予纳贝尔(Nabel)等人的美国专利号8,454,972B2中的腺病毒载体(通过引用并入本文)以及在其第29栏第36-58行的剂型。在本文的一个实施例中，该腺病毒是经由多剂量递送的。

在本文的一个实施例中，该递送是经由AAV进行的。用于针对人类的AAV的体内递送的治疗有效剂量被认为处于含有从约1x 10¹⁰到约1x 10¹⁰个功能AAV/ml溶液的从约20到约50ml的盐水溶液的范围内。该剂量可以调整以便使治疗益处相对于任何副作用的平衡。在本文的一个实施例中，AAV剂量大致处于从约1x 10⁵到1x 10⁵⁰个基因组AAV、从约1x 10⁸到1x 10²⁰个基因组AAV、从约1x 10¹⁰到约1x 10¹⁶个基因组、或约1x 10¹¹到约1x 10¹⁶个基因组AAV的浓度范围内。人类剂量可以是约1x 10¹³个基因组AAV。这样的浓度能以从约0.001ml到约100ml、约0.05到约50ml、或约10到约25ml的载体溶液进行递送。通过建立剂量反应曲线的常规试验，本领域普通技术人员可以容易地确立其他有效剂量。参见，例如，2013年3月26日授权的授予哈加(Hajjar)等人的美国专利号8,404,658B2，在第27栏第45-60行。

一般包装和启动子

介导体内基因组修饰的、将Cas9编码核酸分子例如DNA包装到载体，例如，病毒载体中的方式包括：

为了实现NHEJ介导的基因敲除：

单病毒载体：

●含有两个或更多个表达盒的载体：

●启动子-Cas9编码核酸分子-终止子

●启动子-gRNA1-终止子

●启动子-gRNA2-终止子

●启动子-gRNA(N)-终止子(一直到载体的大小限制)

双病毒载体：

●含有一个用于驱动Cas9表达的表达盒的载体1

●启动子-Cas9编码核酸分子-终止子

●含有一个或多个用于驱动一个或多个指导RNA表达的表达盒的载体2

●启动子-gRNA1-终止子

●启动子-gRNA(N)-终止子(一直到载体的大小限制)

为了介导同源定向修复。

●除了上述单和双病毒载体途径之外，另外的载体可以用来递送同源定向修复模板。

用来驱动Cas9编码核酸分子表达的启动子可以包括：

●AAV ITR可以用作启动子：这对于消除另外的启动子组件(可在载体中占用空间)的需要是有利的。空出来的另外的空间可以用来驱动另外的组件的表达(gRNA，等等)。同样，ITR活性是较弱的，因此可以用来降低由于Cas9的过表达所致的潜在毒性。

●对于遍存表达，可以使用启动子CMV、CAG、CBh、PGK、SV40、铁蛋白重链或轻链，等等。

●对于脑或其他CNS表达，可以使用启动子：用于所有神经元的突触蛋白I、用于兴奋性神经元的CaMKIIα、用于GABA能神经元的GAD67或GAD65或VGAT，等等。

●对于肝脏表达，可以使用白蛋白启动子。

●对于肺表达，可以使用SP-B。

●对于内皮细胞，可以使用ICAM。

●对于造血细胞，可以使用IFNβ或CD45。

●对于成骨细胞，可以使用OG-2。

用来驱动指导RNA的启动子可以包括：

●Pol III启动子，如U6或H1

●使用Pol II启动子和内含子盒来表达gRNA

CRISPR-Cas9的结晶和结构

CRISPR-Cas9的结晶和晶体结构的表征：这些晶体可以通过蛋白质结晶学的技术(包括分批、液桥、透析、蒸汽扩散和悬滴法)获得。通常，这些晶体通过将基本上纯的CRISPR-Cas9和它所结合的核酸分子以刚好低于沉淀所需的浓度溶解于含有沉淀剂的水性缓冲液中来生长。通过受控蒸发去除水，以产生沉淀条件，维持沉淀条件直至晶体生长停止。参见尼施玛素(Nishimasu)等人

晶体的用途、晶体结构和原子结构坐标(Uses of the Crystals,CrystalStructure and Atomic Structure Co-Ordinates)：这些晶体并且特别是由其获得的原子结构坐标具有多种多样的用途。晶体和结构坐标特别有用于鉴定与CRISPR-Cas9结合的化合物(核酸分子)以及可以与具体化合物(核酸分子)结合的CRISPR-Cas9。因此，本文描述的结构坐标可以在确定另外的合成的或突变的CRISPR-Cas9、Cas9、切口酶、结合结构域的晶体结构中用作定相模型。提供与核酸分子复合的CRISPR-Cas9的晶体结构可以为本领域的技术人员提供对CRISPR-Cas9的了解。这种了解提供了用于设计修饰的CRISPR-Cas9的手段，如通过向其附接官能团(如阻遏因子或激活因子)。虽然人们可以将官能团(如阻遏因子或激活因子)附接至CRISPR-Cas9的N末端或C末端，但是晶体结构证明N末端似乎被遮蔽或隐藏，而C末端更易于为官能团(如阻遏因子或激活因子)获得。此外，晶体结构证明大约在CRISPR-Cas9(化脓链球菌)的残基534-676之间存在挠性环，该环适于附接官能团(如激活因子或阻遏因子)。附接可以经由接头，例如挠性甘氨酸-丝氨酸(GlyGlyGlySer)或(GGGS)3，或者刚性α-螺旋接头如(Ala(GluAlaAlaAlaLys)Ala)。除挠性环之外，还存在核酸酶或H3区域、H2区域和螺旋区域。所谓“螺旋(helix)”或“螺旋的(helical)”意指如本领域已知的螺旋，包括但不限于α-螺旋。另外，术语螺旋或螺旋的还可以用于指示具有N-末端转角的c-末端螺旋组件。

提供与核酸分子复合的CRISPR-Cas9的晶体结构允许药物或化合物发现、鉴定和设计可以与CRISPR-Cas9结合的化合物的新颖方法，并且因此本披露提供了在诊断、治疗或预防多细胞生物的病症或疾病中有用的工具，这些多细胞生物是例如藻类、植物、无脊椎动物、鱼、两栖动物、爬行动物、禽类、哺乳动物；例如家养植物、动物(例如，生产动物如猪、牛、鸡；伴侣动物如猫、犬、啮齿动物(兔、沙鼠、仓鼠)；实验动物如小鼠、大鼠)以及人类。因此，本披露提供了合理设计CRISPR-Cas9复合物的基于计算机的方法。这种合理设计可以包括：提供CRISPR-Cas9复合物的结构，如通过晶体结构表的和/或在关于晶体结构的一个或多个图中的一些或全部(例如结构的至少2个或更多个，例如至少5个，有利地至少10个，更有利地至少50个并且甚至更有利地至少100个原子)坐标所限定的；参见尼施玛素(Nishimasu)等人；提供希望的核酸分子的结构，就所希望的CRISPR-Cas9复合物而言；并且使如通过一些或全部坐标所限定的CRISPR-Cas9复合物的结构与希望的核酸分子匹配，在所述匹配中包括获得如通过一些或全部坐标所限定的CRISPR-Cas9复合物的一种或多种推定修饰，用于使所述希望的核酸分子约束涉及希望的核酸分子的一种或多种CRISPR-Cas9复合物。该方法或该方法的匹配可以使用CRISPR-Cas9复合物的感兴趣的原子的坐标，如通过一些或全部坐标所限定的，这些坐标在活性位点或结合区附近(例如结构的至少2个或更多个，例如至少5个，有利地至少10个，更有利地至少50个并且甚至更有利地至少100个原子)，以便在活性位点或结合区附近建模。这些坐标可以用于限定空间，然后针对希望的或候选核酸分子对所述空间进行“经由计算机模拟”筛选。因此，本披露提供了合理设计CRISPR-Cas9复合物的基于计算机的方法。这种方法可以包括：提供晶体结构表的至少两个原子的坐标(“选定的坐标”)；参见尼施玛素(Nishimasu)等人；提供候选或希望的核酸分子的结构；并且使候选物的结构与选定的坐标匹配。以这种方式，熟练人员还可以匹配官能团和候选或希望的核酸分子。例如，提供CRISPR-Cas9复合物的结构，如通过一些或全部(例如结构的至少2个或更多个，例如至少5个，有利地至少10个，更有利地至少50个并且甚至更有利地至少100个原子)坐标所限定的；提供希望的核酸分子的结构，就所希望的CRISPR-Cas9复合物而言；使CRISPR-Cas9复合物的结构，如通过晶体结构表中的和/或关于晶体结构的图中的一些或全部坐标所限定的，与参见尼施玛素(Nishimasu)等人；希望的核酸分子匹配，在所述匹配中包括获得如所限定的CRISPR-Cas9复合物的一种或多种推定修饰，用于使所述希望的核酸分子约束涉及希望的核酸分子的一种或多种CRISPR-Cas9复合物；选择一种或多种推定匹配CRISPR-Cas9—希望的核酸分子复合物，使这样一种或多种推定匹配CRISPR-Cas9—希望的核酸分子复合物与官能团(例如，激活因子、阻遏因子)匹配，例如就用于安放官能团的位置(例如，挠性环内的位置)和/或用于产生安放官能团的位置的这一种或多种推定匹配CRISPR-Cas9—希望的核酸分子复合物的推定修饰而言。

然而，SpCas9晶体结构的知识(参见尼施玛素(Nishimasu)等人)不可能预测通过本发明的突变所实现的脱靶效应的减少；或特定突变可以实现脱靶效应的减少，如本文所披露的。但是，既然根据本披露存在着提供或实现脱靶效应减少的突变的知识，熟练人员可以容易地应用本文的传授，与SpCas9晶体结构的知识和Cas9序列的知识结合，来制备序列并且跨Cas9进行结构分析，以获得可以按与本文类似的方式突变或修饰的类似氨基酸，以便获得另外的经突变的或经修饰的Cas9，其中该突变或修饰导致减少的脱靶效应。

因此，可以使用在本文披露的一个或多个突变或一种或多种修饰附近的或在定位成邻近于这样一个或多个突变或一种或多种修饰的活性位点或结合区附近的坐标连同SpCas9晶体的信息实践本披露；并且因此，确定SpCas9的另外的突变或修饰或Cas9直向同源物中的类似突变或修饰的方法可以采用例如对比考虑CRISPR-Cas9复合物的一个或多个感兴趣的子结构域的考虑。确定SpCas9的另外的突变或修饰或Cas9直向同源物中的类似突变或修饰的方法可以使用结构域或子结构域的坐标来实践。这些方法可以任选地包括由“经由计算机模拟”输出合成候选或希望的核酸分子和/或CRISPR-Cas9系统，并且测试“湿式(wet)”或实际突变或修饰的结合和/或活性和/或脱靶效应的减少。包括突变或修饰的CRISPR-Cas9系统可以任选地包括官能团。这些方法可以包括观察细胞或含有该细胞的生物的希望的反应，例如症状或病症或疾病的减少，有利地包括脱靶效应的减少。提供候选核酸分子的结构可以涉及通过计算机筛选含有核酸分子数据(例如，关于病症或疾病的此类数据)的数据库来选择化合物。候选核酸分子的结合的3-D描述符可以衍生自来源于来自晶体结构的的CRISPR-Cas9复合物或其结构域或区域的构造和化学性质的几何和功能约束，考虑到如本文披露的突变或修饰。实际上，描述符可以是本文的CRISPR-Cas9复合物晶体结构的一种或多种虚拟修饰类型，用于将CRISPR-Cas9结合至候选或希望的核酸分子。然后可以使用具有推定的良好绑定的描述符和核酸分子进行本文的“湿式”步骤。

“匹配(fitting)”可以意指通过自动或半自动手段确定候选物的至少一个原子与CRISPR-Cas9复合物的至少一个原子之间的相互作用并且计算这样一种相互作用稳定的程度。相互作用可以包括由电荷、空间因素等引起的吸引、排斥。“子结构域”可以意指二级结构的至少一个(例如，一个、两个、三个或四个)完整组件。CRISPR-Cas9的具体区域或结构域包括在晶体结构表和与其对应的图中鉴定的那些；参见尼施玛素(Nishimasu)等人。

在任何情况下，CRISPR-Cas9(例如化脓链球菌Cas9；参见尼施玛素(Nishimasu)等人)复合物的三维结构在本发明的背景下提供了用于鉴定Cas9的直向同源物中的另外的突变的另外的工具，因为基于使用CRISPR-SpCas9复合物的晶体结构的序列和结构位置比较，本文鉴定的突变/修饰的位置可以应用于Cas9的直向同源物。晶体结构还可以作为新的且特异性的Cas9的设计基础，例如具有本文的一个或多个突变或一种或多种修饰并且包括或具有融合配偶体或具有连接至其上的任何一个或多个不同官能团的那些，这些官能团是例如转录阻抑因子、转录激活因子、核酸酶结构域、DNA甲基转移酶、蛋白乙酰转移酶、蛋白脱乙酰酶、蛋白甲基转移酶、蛋白脱氨酶、蛋白激酶、以及蛋白磷酸酶；并且，在一些方面，功能结构域是表观遗传调节剂；参见例如，张(Zhang)等人，美国专利号8,507,272，并且再次指出的是它和本文引用的所有文献以及本文引用的所有申请文献特此通过引用并入本文)相互作用，通过修饰Cas9的方式，通过新颖切口酶的方式。根据本披露并且了解CRISPR-Cas9(化脓链球菌Cas9)晶体结构的三维结构，可以使用计算机建模程序来设计或鉴定预期与可能的或确认的位点(如结合位点)相互作用的不同分子或者CRISPR-Cas9系统(例如，化脓链球菌Cas9)的其他结构或功能特征。可以通过使用计算机建模(使用对接程序)检査潜在结合的化合物(“结合物(binder)”)。对接程序是已知的；例如GRAM、DOCK或AUTODOCK(参见沃尔特斯(Walters)等人《今日药物发现》(Drug Discovery Today)，第3卷，第4期(1998)，160-178；和邓恩布拉克(Dunbrack)等人《折叠与设计》(Folding and Design)2(1997)，27-42)。这种程序可以包括潜在结合物的计算机匹配，以确定该潜在结合物的形状和化学结构在多大程度上与CRISPR-Cas9系统(例如，化脓链球菌Cas9)绑定。可以进行CRISPR-Cas9系统(例如，化脓链球菌Cas9)的活性位点或结合位点的计算机辅助手动检查。程序(如GRID(P.戈德福德(Goodford)，《药物化学杂志》(J.Med.Chem)，1985，28，849-57)-一种确定具有不同官能团的分子之间的可能相互作用位点的程序)还可以用于分析活性位点或结合位点以预测结合化合物的部分结构。计算机程序可以用于估计例如以下两种结合配偶体的吸引、排斥或位阻，CRISPR-Cas9系统(例如，化脓链球菌Cas9)和候选核酸分子或者核酸分子和候选CRISPR-Cas9系统(例如，化脓链球菌Cas9)；并且与此一起，CRISPR-Cas9晶体结构(化脓链球菌Cas9)允许此类方法。通常，匹配越紧，位阻越小，并且吸引力越大，潜在的结合物越有效，因为这些特性与较紧的结合常数一致。此外，候选CRISPR-Cas9系统(例如，化脓链球菌Cas9)的设计越具特异性，越可能的是它也将不与脱靶分子相互作用。并且，本发明允许“湿式”方法。例如，在一个方面，本披露提供了用于确定候选CRISPR-Cas9系统(例如，化脓链球菌Cas9)的结合至该候选CRISPR-Cas9系统(例如，化脓链球菌Cas9)的结合物(例如，靶核酸分子)的结构的方法，所述方法包括(a)提供根据本披露的候选CRISPR-Cas9系统(化脓链球菌Cas9)的第一晶体或候选物候选CRISPR-Cas9系统(例如，化脓链球菌Cas9)的第二晶体，(b)使该第一晶体或第二晶体与所述结合物在可以形成复合物的条件下接触；并且(c)确定所述候选物(例如，CRISPR-Cas9系统(例如，化脓链球菌Cas9))或CRISPR-Cas9系统(化脓链球菌Cas9)复合物的结构。第二晶体可以具有在本文讨论的基本上相同的坐标，然而由于CRISPR-Cas9系统的次要变化(例如，来自作为例如化脓链球菌Cas9与作为化脓链球菌Cas9的这样一种系统的Cas9，其中“例如化脓链球菌Cas9”指示该Cas9是Cas9并且可以属于或来源于化脓链球菌或其直向同源物)，该晶体可以按不同的空间群形成。代替或除“经由计算机模拟”方法之外，本披露进一步涉及其他“湿式”方法，包括结合物(例如，靶核酸分子)和候选CRISPR-Cas9系统(例如，化脓链球菌Cas9)、或候选结合物(例如，靶核酸分子)和CRISPR-Cas9系统(例如，化脓链球菌Cas9)、或候选结合物(例如，靶核酸分子)和候选CRISPR-Cas9系统(例如，化脓链球菌Cas9)的高通量筛选(前述一种或多种CRISPR-Cas9系统具有或不具有一个或多个官能团)，以便选择具有结合活性的化合物。可以对那些显示出结合活性的结合物和CRISPR-Cas9系统进行选择并且进一步用具有本文的结构的CRISPR-Cas9晶体进行结晶，例如通过共结晶或通过浸泡，用于X-射线分析。已经通过基于本文的结合物和CRISPR-Cas9对的晶体结构数据对具有有利的匹配特性(例如，预测的强吸引)的那些进行确定而设计、鉴定或选择了可能的结合物和CRISPR-Cas9系统对，然后可以通过“湿式”方法筛选这些可能的对的活性。因此，在一个方面，本发明可以涉及：获得或合成这些可能的对；并且使结合物(例如，靶核酸分子)和候选CRISPR-Cas9系统(例如，化脓链球菌Cas9)接触、或使候选结合物(例如，靶核酸分子)和CRISPR-Cas9系统(例如，化脓链球菌Cas9)接触、或使候选结合物(例如，靶核酸分子)和候选CRISPR-Cas9系统(例如，化脓链球菌Cas9)接触(前述一种或多种CRISPR-Cas9系统具有或不具有一个或多个官能团)，以便确定结合能力。在后一步中，接触有利地在确定功能的条件下。代替或除进行这样一种测定之外，本披露可以包括：由一种或多种复合物的所述接触和分析获得或合成这一种或多种复合物，例如通过X射线衍射或NMR或其他手段，以便确定结合或相互作用的能力。然后可以获得关于结合的详细结构信息，并且根据这个信息，可以对候选CRISPR-Cas9系统或其组分的结构或功能进行调节。可以重复和再次重复这些步骤，如必要的话。可替代地或另外地，来自或在前述方法中的潜在CRISPR-Cas9系统可以与核酸分子一起在体内，包括但不限于通过向生物(包括非人类动物和人类)给予的方式，以便确定或确认功能，包括是否由其导致了希望的结果(例如，症状的减少、治疗)。

本披露进一步涉及通过使用本文讨论的文献的结构坐标(尤其是如果关于本文讨论的一种或多种修饰或一个或多个突变进行调整的)确定具有未知结构的一种或多种CRISPR-cas系统或复合物的三维结构的方法。例如，如果提供了具有未知晶体结构的CRISPR-Cas系统或复合物的X射线晶体或NMR光谱数据，则CRISPR-Cas9复合物的结构可以用于解释该数据，以便通过如在X射线晶体学的情况下的定相建模等技术提供未知系统或复合物的可能结构。因此，方法可以包括：将具有未知晶体结构的CRISPR-Cas系统或复合物的表示与具有本文引用的文献的晶体结构的CRISPR-Cas9系统和复合物的类似表示(有利地关于本文的一种或多种修饰或一个或多个突变进行调整的)进行比对，以匹配同源或类似区域(例如，同源或类似序列)；为具有未知晶体结构的CRISPR-Cas系统或复合物的匹配的同源或类似区域(例如，序列)的结构建模；并且，确定基本上保留了所述匹配的同源区域的结构的未知晶体结构的构象(例如考虑到，应当形成有利的相互作用，这样使得形成低能量构象)。就氨基酸而言，“同源区域”描述了例如相同的或具有类似的(例如脂肪族、芳香族、极性、带负电荷或带正电荷的)侧链化学基团的两个序列中的氨基酸残基。就核酸分子而言，同源区域可以包括至少85％或86％或87％或88％或89％或90％或91％或92％或93％或94％或95％或96％或97％或98％或99％的同源性或一致性。相同和类似区域有时被本领域的普通技术人员分别描述为“不变的”和“保守的”。有利地，通过计算机建模进行第一和第三步骤。同源建模是本领域的普通技术人员熟知的一项技术(参见例如，格里尔(Greer)，《科学》(Science)第228卷(1985)1055；和布伦代尔(Blundell)等人《欧洲生物化学杂志》(Eur J Biochem)第172卷(1988)，513)。本文的CRISPR-Cas9晶体结构的保守区和具有未知晶体结构的CRISPR-Cas系统的保守区的计算机表示有助于预测和确定具有未知晶体结构的CRISPR-Cas系统的晶体结构。仍进一步地，本发明的采用经由计算机模拟的CRISPR-Cas9晶体结构的方面同样可以应用于本文的新的一个或多个突变或一种或多种修饰和CRISPR-Cas晶体结构。以这种方式，可以获得CRISPR-Cas晶体结构的文库。因此本披露提供了合理的CRISPR-Cas系统设计。例如，已经通过本文描述的方法(包括考虑到来自本文引用的文献的本领域的知识)确定了CRISPR-Cas系统或复合物的构象或晶体结构，这样一种构象可以用于本文的基于计算机的方法中，用于确定晶体结构仍未知的其他CRISPR-Cas系统或复合物的构象或晶体结构。来自所有这些晶体结构的数据可以在数据库中，并且本文的方法可以通过使本文涉及的晶体结构或其部分相对于文库中的一种或多种晶体结构而在此进行的比较而更稳健。本披露进一步提供了旨在产生CRISPR-cas系统或复合物的结构和/或进行其合理设计的系统(如计算机系统)。该系统可以含有：本文的或由其衍生(例如，通过建模)的原子坐标数据，所述数据限定了CRISPR-cas系统或复合物或其至少一个结构域或子结构域的三维结构，或针对其的结构因子数据，所述结构因子数据可衍生自原子坐标数据。本披露还涉及具有以下项的计算机可读介质：原子坐标数据，所述数据限定了CRISPR-cas系统或复合物或其至少一个结构域或子结构域的三维结构，或针对其的结构因子数据。“计算机可读介质”是指可以由计算机直接读取和访问的任何介质，并且包括但不限于：磁存储介质；光存储介质；电存储介质；云存储以及这些类别的混合型。通过提供此类计算机可读介质，可以常规访问原子坐标数据用于建模或其他“经由计算机模拟”方法。本披露进一步包括通过提供对此类计算机可读介质的访问营商的方法，例如在订购的基础上，经由互联网或全球通信/计算机网络；或者，在订购的基础上，该计算机系统可以供用户使用。“计算机系统”是指用于分析本发明的原子坐标数据的硬件装置、软件装置和数据存储装置。本发明的基于计算机的系统的最低硬件装置包括中央处理器(CPU)、输入装置、输出装置以及数据存储装置。合意地，提供显示器或监测器用于可视化结构数据。本披露进一步包括传输本文的或在本文描述的任何方法或其步骤中获得的信息的方法，例如经由电信、电话、大众通讯、大众媒体、图像、互联网，电子邮件等。可以对本披露的晶体结构进行分析以产生CRISPR-cas系统或复合物的一张或多张傅立叶电子密度图；可以基于X射线衍射图计算傅立叶电子密度图。然后可以将这些图用于确定结合或其他相互作用的方面。可以使用已知程序计算电子密度图，如来自CCP4计算机包(协同计算项目(Collaborative ComputingProject)，第4期.CCP4套件：用于蛋白质晶体学的项目(The CCP4Suite:Programs forProtein Crystallography)，《晶体学报》(Acta Crystallographica)，D50，1994，760-763)的那些。用于图可视化和模型建立，可以使用程序如“QUANTA”(1994，圣地亚哥，加利福尼亚州：分子模拟(Molecular Simulations)，琼斯(Jones)等人，《晶体学学报》(ActaCrystallography A47)(1991)，110-119)。

本文引用的晶体结构给出了CRISPR-Cas9(化脓链球菌)的原子坐标数据，并且列出了每个原子(通过唯一编号)；每个氨基酸残基的化学元素及其位置(如通过电子密度图和抗体序列比较确定的)，元素所在的氨基酸残基，链标识符，残基的编号，相对于晶轴限定了对应原子的原子位置(以埃计)的坐标(例如，X、Y、Z)，原子在对应位置中的占位，“B”，负责原子围绕其原子中心移动的各向同性位移参数(以埃²计)以及原子序数。

在本发明的具体实施例中，CRISPR-Cas9系统或该CRISPR-Cas9的组分的晶体结构的构象变化提供了关于蛋白质结构区域相对于对CRISPR-Cas系统功能而言重要的核苷酸(RNA或DNA)结构区域的挠性或移动的重要且关键的信息。针对作为本申请中的CRISPR酶的Cas9(例如化脓链球菌Cas9：与指导RNA和靶DNA复合的cas9的晶体结构(Crystalstructure of cas9in complex with guide RNA and target DNA).尼施玛素(Nishimasu)，H.、兰(Ran)，FA.、徐(Hsu)，PD.、科纳曼(Konermann)，S.、舍哈塔(Shehata)，SI.、多米耶(Dohmae)，N.、石谷(Ishitani)，R.、张(Zhang)，F.、努尔基(Nureki)，O.《细胞》(Cell)2月27日.(2014).156(5):935-49；或Sa Cas9：金黄色葡萄球菌Cas9的晶体结构(Crystal Structure of Staphylococcus aureus Cas9)，尼施玛素等人，《细胞》162，1113-1126(2015年8月27日))提供的结构信息可以用于进一步工程化和优化CRISPR-Cas系统并且这也可以被外推用于探询其他CRISPR酶系统中的结构-功能关系。本发明的一个方面涉及分辨率下的与sgRNA及其靶DNA复合的化脓链球菌Cas9的晶体结构。该结构揭示了由靶识别和核酸酶叶片组成的两叶片构造，其将sgRNA:DNA双链体容纳在它们的界面处的带正电荷的沟槽中。识别叶片对于sgRNA和DNA结合是至关重要的，并且核酸酶叶片包含HNH和RuvC核酸酶结构域，这些结构域适合地被定位为分别用于靶DNA的互补和非互补链的切割。本文提供的这种高分辨结构和功能分析阐明了通过Cas9靶向RNA指导的DNA的分子机制，并且提供了用于产生优化的CRISPR-Cas系统及其组分的丰富信息。

在本发明的具体实施例中，晶体结构提供了用于理解通过Cas9进行的RNA指导的DNA靶向的分子机制的关键步骤。本文的结构和功能分析为合理工程化基于Cas9的基因组调节技术提供了有用的舞台，并且可以提供关于Cas9介导的靶DNA上的PAM序列识别或sgRNA:DNA双链体之间的错配耐受性的指导。本发明的方面还涉及截短突变体，例如化脓链球菌Cas9截短突变体可以促进将Cas9包装到尺寸受约束的病毒载体中用于体内和治疗应用。类似地，PAM相互作用(PI)结构域的工程化可以允许对PAM特异性编程，改善靶位点识别保真性，并且增加Cas9基因组工程化平台的多能性。另外，PAM相互作用(PI)结构域的工程化可以允许对PAM特异性编程，改善靶位点识别保真性，并且增加Cas(例如Cas9)基因组工程化平台的多能性。Cas蛋白(如Cas9蛋白)可以被工程化为改变其PAM特异性，例如如描述于克莱因史迪维尔(Kleinstiver)BP等人具有改变的PAM特异性的工程化的CRISPR-Cas9核酸酶(Engineered CRISPR-Cas9nucleases with altered PAM specificities)。《自然》(Nature).2015年7月23日；523(7561):481-5.doi:10.1038/nature14592。

本发明包括经优化的功能性CRISPR-Cas酶系统。具体而言，该CRISPR酶包括一个或多个将它转化为DNA结合蛋白的突变，展现出感兴趣的功能的功能结构域可以被募集或附于或插入或附接至该DNA结合蛋白。在某些实施例中，该CRISPR酶包括一个或多个突变，这一个或多个突变包括但不限于D10A、E762A、H840A、N854A、N863A或D986A(基于化脓链球菌Cas9的氨基酸位置编号)，和/或这一个或多个突变在该CRISPR酶的RuvC1或HNH结构域中或者为如本文另外讨论的突变。在一些实施例中，该CRISPR酶具有一个或多个在催化结构域中的突变，其中在转录时，该tracr配对序列杂交到该tracr序列上，并且该指导序列指导CRISPR复合物与该靶序列的序列特异性结合，并且其中该酶进一步包含功能结构域。

本文提供的结构信息允许探询sgRNA(或嵌合RNA)与靶DNA和CRISPR酶(例如Cas9)的相互作用，从而允许工程化或改变sgRNA的结构，以便优化整个CRISPR-Cas系统的功能性。例如，可以在不与Cas9蛋白冲突的情况下通过插入一个或多个不同的RNA环或一个或多个不同的序列来扩展sgRNA的环，这一个或多个不同的RNA环或一个或多个不同的序列可以募集可以结合至这一个或多个不同的RNA环或一个或多个不同的序列的衔接蛋白。

本发明的酶的功能变体

在实施例中，如本文提及的Cas9蛋白还包括功能变体。如本文使用的蛋白质的“功能变体”是指这样的蛋白质的至少部分地保留该蛋白质的活性的变体。功能变体可以包括突变体(其可以是插入、缺失、或置换突变体)，包括多晶型物等。还包括在功能变体内的是这样的蛋白质与另一种通常不相关的核酸、蛋白质、多肽或肽的融合产物。功能变体可以是天然存在的或可以是人造的。有利的实施例可以涉及工程化或非天然存在的靶向II型RNA的效应蛋白，例如Cas9或其直向同源物或同系物。

关于根据本发明的蛋白质突变的一般信息

本发明包括CRISPR Cas复合物，该复合物包含CRISPR酶和指导RNA(sgRNA)，其中该CRISPR酶包括至少一个突变，这样使得该CRISPR酶没有或具有不超过5％的没有这至少一个突变的CRISPR酶的核酸酶活性，以及任选地至少一个或多个核定位序列；该RNA指导(sgRNA)包括能够杂交到细胞中的感兴趣的基因组座位中的靶序列上的指导序列；并且其中：该CRISPR酶与两个或更多个功能结构域相缔合；或者通过插入结合至一种或多种衔接蛋白的一个或多个不同RNA序列来修饰该sgRNA的至少一个环，并且其中该衔接蛋白与两个或更多个功能结构域相缔合；或者该CRISPR酶与一个或多个功能结构域相缔合，并且通过插入结合至一种或多种衔接蛋白的一个或多个不同RNA序列来修饰该sgRNA的至少一个环，并且其中该衔接蛋白与一个或多个功能结构域相缔合。

功能结构域和衔接蛋白；适配体

衔接蛋白可以包括但不限于存在于各种噬菌体外壳蛋白内的正交RNA结合蛋白/适配体组合。这样的外壳蛋白的列表包括但不限于：Qβ、F2、GA、fr、JP501、M12、R17、BZ13、JP34、JP500、KU1、M11、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、φCb5、φCb8r、φCb12r、φCb23r、7s以及PRR1。这些衔接蛋白或正交RNA结合蛋白可以进一步募集效应蛋白或融合物，这些效应蛋白或融合物包括一个或多个功能结构域。在一些实施例中，功能结构域可以选自下组，该组由以下各项组成：转座酶结构域、整合酶结构域、重组酶结构域、游离酶结构域、转化酶结构域、蛋白酶结构域、DNA甲基转移酶结构域、DNA羟甲基酶结构域、DNA脱甲基酶结构域、脱氨酶、组蛋白乙酰酶结构域、组蛋白脱乙酰酶结构域、核酸酶结构域、阻遏因子结构域、激活因子结构域、核定位信号结构域、转录调节蛋白(或转录复合体募集)结构域、细胞摄取活性相关结构域、核酸结合结构域、抗体呈递结构域、组蛋白修饰酶、组蛋白修饰酶的募集物；组蛋白修饰酶、组蛋白甲基转移酶、组蛋白脱甲基酶、组蛋白激酶、组蛋白磷酸酶、组蛋白核糖基酶、组蛋白脱核糖基酶、组蛋白泛素酶、组蛋白脱泛素酶、组蛋白生物素酶和组蛋白尾部蛋白酶的抑制剂。

在一些优选实施例中，该功能结构域是转录激活结构域，优选VP64。在一些实施例中，该功能结构域是转录阻遏结构域，优选KRAB。在一些实施例中，该转录阻遏结构域是SID、或SID的多联体(例如SID4X)。在一些实施例中，该功能结构域是表观遗传修饰结构域，从而提供了表观遗传修饰酶。在一些实施例中，该功能结构域是激活结构域，其可以是P65激活结构域。在一些实施例中，该功能结构域是脱氨酶，如胞苷脱氨酶。胞苷脱氨酶可以被引导至靶核酸的它引导胞苷转化成尿苷的地方，从而导致C向T的取代(在互补链上是G向A的取代)。在这样一个实施例中，可以在不进行DNA切割的情况下实现核苷酸取代。

在一个方面，使用surveyor分析来鉴定indel活性/核酸酶活性。一般而言，surveyor分析包括提取基因组DNA、PCR扩增CRISPR靶位点侧翼的基因组区域、纯化产物、重退火以允许异源双链体形成。重退火之后，遵循制造商的推荐方案，将产物用SURVEYOR核酸酶和SURVEYOR增强子S(转基因组学公司(Transgenomics))处理。可以根据已知方法用聚丙烯酰胺凝胶进行分析。量化可以基于相对条带强度。***诱导酶和分割型酶(“分割型-Cas9”)

在一个方面，本发明提供了非天然存在的或工程化的诱导型Cas9 CRISPR-Cas系统，该系统包含：

第一Cas9融合构建体，其附接至诱导型二聚体的第一个一半，和

第二Cas9融合构建体，其附接至该诱导型二聚体的第二个一半，

其中该第一Cas9融合构建体有效作地连接至一个或多个核定位信号，

其中该第二Cas9融合构建体有效作地连接至一个或多个核输出信号，

其中与诱导物能量源接触使该诱导型二聚体的该第一个一半和该第二个一半聚到一起，

其中使该诱导型二聚体的该第一个一半和该第二个一半聚到一起允许该第一Cas9融合构建体和该第二Cas9融合构建体构成功能性Cas9 CRISPR-Cas系统，

其中该Cas9 CRISPR-Cas系统包含指导RNA(gRNA)，该指导RNA包含能够杂交到细胞中的感兴趣的基因组座位中的靶序列上的指导序列，并且

其中该功能性Cas9 CRISPR-Cas系统结合至该靶序列，并且任选地，编辑该基因组座位以改变基因表达。

在本发明的一个方面，在该诱导型Cas9 CRISPR-Cas系统中，该诱导型二聚体是或包含诱导型异二聚体或基本上由其组成或由其组成。在一个方面，在诱导型Cas9 CRISPR-Cas系统中，该诱导型异二聚体的第一个一半或第一部分或第一片段是或包含FKBP(任选地是FKBP12)或由其组成或基本上由其组成。在本发明的一个方面，在该诱导型Cas9 CRISPR-Cas系统中，该诱导型异二聚体的第二个一半或第二部分或第二片段是或包含FRB或由其组成或基本上由其组成。在本发明的一个方面，在该诱导型Cas9 CRISPR-Cas系统中，该第一Cas9融合构建体的安排是或包含N’末端Cas9部分-FRB-NES或由其组成或基本上由其组成。在本发明的一个方面，在该诱导型Cas9 CRISPR-Cas系统中，该第一Cas9融合构建体的安排是或包含NES-N’末端Cas9部分-FRB-NES或由其组成或基本上由其组成。在本发明的一个方面，在该诱导型Cas9 CRISPR-Cas系统中，该第二Cas9融合构建体的安排是或包含C’末端Cas9部分-FKBP-NLS或基本上由其组成或由其组成。在一个方面，本发明提供了在该诱导型Cas9 CRISPR-Cas系统中，该第二Cas9融合构建体的安排是或包含NLS-C’末端Cas9部分-FKBP-NLS或由其组成或基本上由其组成。在一个方面，在诱导型Cas9 CRISPR-Cas系统中可以存在将该Cas9部分与该诱导型二聚体的一半或部分或片段分开的接头。在一个方面，在该诱导型Cas9 CRISPR-Cas系统中，该诱导物能量源是或包含雷帕霉素或基本上由其组成或由其组成。在一个方面，在诱导型Cas9 CRISPR-Cas系统中，该诱导型二聚体是诱导型同二聚体。在一个方面，在诱导型Cas9 CRISPR-Cas系统中，该Cas9是FnCas9。在一个方面，在该诱导型Cas9 CRISPR-Cas系统中，一个或多个功能结构域与该Cas9的一个或两个部分缔合，例如，这些功能结构域任选地包括转录激活因子、转录或核酸酶(如Fok1核酸酶)。在一个方面，在该诱导型Cas9 CRISPR-Cas系统中，该功能性Cas9 CRISPR-Cas系统结合至靶序列并且该酶是失活的Cas9，该失活的Cas9当与不具有至少一个突变的Cas9相比时任选地具有降低至少97％或100％的核酸酶活性(或不超过3％并且有利地0％的核酸酶活性)。本发明进一步包括并且本发明的一个方面提供了编码如在本文讨论的诱导型Cas9 CRISPR-Cas系统的多核苷酸。

在一个方面，本发明提供了用于递送如在本文讨论的附接至诱导型二聚体的第一个一半或第一部分或片段并且有效作地连接至一个或多个核定位信号的第一Cas9融合构建体的载体。在一个方面，本发明提供了用于递送附接至诱导型二聚体的第二个一半或第二部分或片段并且有效作地连接至一个或多个核输出信号的该第二Cas9融合构建体的载体。

在一个方面，本发明提供了用于递送以下两者的载体：如在本文讨论的附接至诱导型二聚体的第一个一半或第一部分或片段并且有效作地连接至一个或多个核定位信号的第一Cas9融合构建体；以及如在本文讨论的附接至诱导型二聚体的第二个一半或第二部分或片段并且有效作地连接至一个或多个核输出信号的第二Cas9融合构建体。

在一个方面，该载体可以是单个质粒或表达盒。

在一个方面，本发明提供了用本文讨论的载体中的任一个转化的或表达如在本文讨论的诱导型Cas9 CRISPR-Cas系统的真核宿主细胞或细胞系。

在一个方面，本发明提供了用本文讨论的载体中的任一个转化的或表达本文讨论的诱导型Cas9 CRISPR-Cas系统的转基因生物或其子代。在一个方面，本发明提供了组成性地表达如在本文讨论的诱导型Cas9 CRISPR-Cas系统的模式生物。

第一Cas9融合构建体，其附接至诱导型异二聚体的第一个一半，和

第二Cas9融合构建体，其附接至该诱导型异二聚体的第二个一半，

其中该第二Cas9融合构建体有效作地连接至核输出信号，

其中与诱导物能量源接触使该诱导型异二聚体的该第一个一半和该第二个一半聚到一起，

其中使该诱导型异二聚体的该第一个一半和该第二个一半聚到一起允许该第一Cas9融合构建体和该第二Cas9融合构建体构成功能性Cas9 CRISPR-Cas系统，

其中该功能性Cas9 CRISPR-Cas系统编辑该基因组座位以改变基因表达。

在一个方面，本发明提供了治疗对其有需要的受试者的方法，该方法包括通过用如本文讨论的多核苷酸或本文讨论的载体中的任一个转化该受试者而诱导基因编辑并且向该受试者给予诱导物能量源。本发明包括这种多核苷酸或载体在药剂的制造中的用途，例如，这种药剂用于治疗受试者或用于治疗受试者的这样一种方法。本发明包括用于在治疗对其有需要的受试者的方法中使用的如本文讨论的多核苷酸或本文讨论的载体中的任一个，该方法包括诱导基因编辑，其中该方法进一步包括向该受试者给予诱导物能量源。在一个方面，在该方法中还提供了修复模板，例如通过包含所述修复模板的载体递送该修复模板。

本发明还提供了治疗对其有需要的受试者的方法，该方法包括通过用本文讨论的多核苷酸或本文讨论的载体中的任一个转化该受试者而诱导转录激活或阻遏，其中所述多核苷酸或载体编码或包含无催化活性的Cas9和如本文讨论的缔合的一个或多个功能结构域；该方法进一步包括向该受试者给予诱导物能量源。本发明还提供了用于在治疗对其有需要的受试者的方法中使用的本文讨论的多核苷酸或本文讨论的载体中的任一个，该方法包括诱导转录激活或阻遏，其中该方法进一步包括向该受试者给予诱导物能量源。

因此，本发明尤其包括同二聚体连同异二聚体，失活的Cas9或基本上没有核酸酶活性的Cas9(例如，通过突变)，其中存在一个或多个NLS和/或一个或多个NES的系统或复合物；连接至分割型Cas9的一个或多个功能结构域；方法(包括治疗方法)以及用途。

应当理解的是，在本文提及Cas9、Cas9蛋白或Cas9酶的情况下，这包括本发明的分割型Cas9。在一个方面，本发明提供了用于改变或修饰基因产物表达的方法。所述方法可以包括向含有并表达编码该基因产物的DNA分子的细胞中引入工程化的、非天然存在的Cas9CRISPR-Cas系统，该系统包含Cas9蛋白和靶向该DNA分子的指导RNA，由此该指导RNA靶向编码该基因产物的DNA分子，并且该Cas9蛋白切割编码该基因产物的DNA分子，由此改变该基因产物的表达；并且，其中该Cas9蛋白和该指导RNA并不天然地一起存在。本发明包括包含连接至同向重复(DR)序列上的指导序列的指导RNA。本发明进一步包括经密码子优化以便在真核细胞中表达的Cas9蛋白。在一个优选实施例中，该真核细胞是哺乳动物细胞，并且在一个更优选的实施例中，该哺乳动物细胞是人类细胞。在本发明的一个另外的实施例中，该基因产物的表达被降低。

在一个方面，本发明提供了工程化的、非天然存在的Cas9 CRISPR-Cas系统，该系统包含Cas9蛋白和靶向在细胞中编码基因产物的DNA分子的指导RNA，由此该指导RNA靶向编码该基因产物的DNA分子，并且该Cas9蛋白切割编码该基因产物的DNA分子，由此改变该基因产物的表达；并且，其中该Cas9蛋白和该指导RNA并不天然地一起存在；这包括本发明的分割型Cas9。本发明包括包含连接至DR序列上的指导序列的指导RNA。本发明进一步包括经密码子优化以便在真核细胞中表达的Cas9蛋白。在一个优选实施例中，该真核细胞是哺乳动物细胞，并且在一个更优选的实施例中，该哺乳动物细胞是人类细胞。在本发明的一个另外的实施例中，该基因产物的表达被降低。

在另一个方面，本发明提供了工程化的、非天然存在的载体系统，该载体系统包含一种或多种载体，这一种或多种载体包含第一调节组件以及第二调节组件，该第一调节组件有效作地连接至Cas9CRISPR-Cas系统的指导RNA，该指导RNA靶向编码基因产物的DNA分子，该第二调节组件有效作地连接至Cas9蛋白；这包括本发明的分割型Cas9。组分(a)和(b)可以位于该系统的相同或不同载体上。该指导RNA靶向在细胞中编码该基因产物的DNA分子，并且该Cas9蛋白切割编码该基因产物的DNA分子，由此改变该基因产物的表达；并且，其中该Cas9蛋白和该指导RNA并不天然地一起存在。本发明包括包含连接至DR序列上的指导序列的指导RNA。本发明进一步包括经密码子优化以便在真核细胞中表达的Cas9蛋白。在一个优选实施例中，该真核细胞是哺乳动物细胞，并且在一个更优选的实施例中，该哺乳动物细胞是人类细胞。在本发明的一个另外的实施例中，该基因产物的表达被降低。

在一个方面，本发明提供了包含一种或多种载体的载体系统。在一些实施例中，该系统包含：(a)第一调节组件，该第一调节组件有效作地连接到DR序列和一个或多个插入位点，这一个或多个插入位点用于在该DR序列的下游插入一个或多个指导序列，其中在表达时，该指导序列引导Cas9 CRISPR-Cas复合物与真核细胞中的靶序列的序列特异性结合，其中该Cas9 CRISPR-Cas复合物包含与(1)杂交到该靶序列上的指导序列、和(2)该DR序列复合的Cas9；以及(b)第二调节组件，该第二调节组件有效作地连接至编码所述Cas9酶的酶编码序列，该Cas9酶包含核定位序列；其中组分(a)和(b)位于该系统的相同或不同载体上；这包括本发明的分割型Cas9。在一些实施例中，组分(a)进一步包括有效作地连接到该第一调节组件的两个或更多个指导序列，其中当表达时，这两个或更多个指导序列中的每者都引导Cas9 CRISPR-Cas复合物与真核细胞中的不同靶序列的序列特异性结合。

在一些实施例中，该Cas9 CRISPR-Cas复合物包括一个或多个核定位序列，其具有足够强度来在真核细胞的细胞核中驱动所述Cas9 CRISPR-Cas复合物以可检测的量积聚。不希望被理论所束缚，认为核定位序列对于真核生物中的Cas9 CRISPR-Cas复合物活性不是必要的，但包括此类序列增强该系统的活性，尤其对于靶向细胞核中的核酸分子而言。

在一些实施例中，该Cas9酶是选自下组的细菌物种的Cas9，该组由以下各项组成：土拉热弗朗西丝菌1、土拉热弗朗西丝菌新凶手亚种、易北河普氏菌、毛螺菌科细菌MC20171、分解蛋白丁酸弧菌、Peregrinibacteria细菌GW2011_GWA2_33_10、Parcubacteria细菌GW2011_GWC2_44_17、密斯氏菌属SCADC、氨基酸球菌属BV3L6、毛螺菌科细菌MA2020、Candidatus Methanoplasma termitum、挑剔真杆菌、牛莫拉氏菌237、稻田钩端螺旋体、毛螺菌科细菌ND2006、狗口腔卟啉单胞菌3、狄氏普氏菌、以及猕猴卟啉单胞菌，并且可以包括来源于这些生物的经突变的Cas9。该酶可以是Cas9同系物或直向同源物。在一些实施例中，该Cas9经密码子优化以便在真核细胞中表达。在一些实施例中，该Cas9引导在该靶序列位置处的一条或两条链的切割。在一个优选实施例中，该链断裂是具有5'突出端的交错切割。在一些实施例中，该第一调节组件是聚合酶III启动子。在一些实施例中，该第二调节组件是聚合酶II启动子。在一些实施例中，该同向重复具有16nt的最小长度和单个茎环。在另外的实施例中，该同向重复具有长于16nt，优选多于17nt的长度，并且具有多于一个茎环或经优化的二级结构。

在一个方面，本发明提供了真核宿主细胞，该真核宿主细胞包含(a)第一调节组件，该第一调节组件有效作地连接到同向重复序列和一个或多个插入位点，这一个或多个插入位点用于在该DR序列的下游插入一个或多个指导序列，其中在表达时，该指导序列引导Cas9 CRISPR-Cas复合物与真核细胞中的靶序列的序列特异性结合，其中该Cas9CRISPR-Cas复合物包含与(1)杂交到该靶序列上的指导序列、和(2)该DR序列复合的Cas9；和/或(b)第二调节组件，该第二调节组件有效作地连接至编码所述Cas9酶的酶编码序列，该Cas9酶包含核定位序列。在一些实施例中，该宿主细胞包含组分(a)和(b)；这包括本发明的分割型Cas9。在一些实施例中，组分(a)、组分(b)、或组分(a)和(b)稳定地整合到该宿主真核细胞的基因组中。在一些实施例中，组分(a)进一步包括有效作地连接到该第一调节组件的两个或更多个指导序列，其中当表达时，这两个或更多个指导序列中的每者都引导Cas9 CRISPR-Cas复合物与真核细胞中的不同靶序列的序列特异性结合。在一些实施例中，该Cas9经密码子优化以便在真核细胞中表达。在一些实施例中，该Cas9引导在该靶序列位置处的一条或两条链的切割。在一个优选实施例中，该链断裂是具有5'突出端的交错切割。在一些实施例中，该Cas9缺少DNA链切割活性。在一些实施例中，该第一调节组件是聚合酶III启动子。在一些实施例中，该同向重复具有16nt的最小长度和单个茎环。在另外的实施例中，该同向重复具有长于16nt，优选多于17nt的长度，并且具有多于一个茎环或经优化的二级结构。在一个方面，本发明提供了非人类真核生物；优选多细胞真核生物，包含根据所描述的实施例中任一项的真核宿主细胞。在其他方面，本发明提供了真核生物；优选多细胞真核生物，包含根据所描述的实施例中任一项的真核宿主细胞。在这些方面的一些实施例中，该生物可以是动物；例如哺乳动物。另外，该生物可以是节肢动物，如昆虫。该生物也可以是植物。另外，该生物可以是真菌。

在一个方面，本发明提供了试剂盒，该试剂盒包括在此所述的组分中的一种或多种。在一些实施例中，该试剂盒包括载体系统以及用于使用该试剂盒的说明书。在一些实施例中，该载体系统包含(a)第一调节组件，该第一调节组件有效作地连接到同向重复序列和一个或多个插入位点，这一个或多个插入位点用于在该DR序列的下游插入一个或多个指导序列，其中在表达时，该指导序列引导Cas9 CRISPR-Cas复合物与真核细胞中的靶序列的序列特异性结合，其中该Cas9 CRISPR-Cas复合物包含与(1)杂交到该靶序列上的指导序列、和(2)该DR序列复合的Cas9；和/或(b)第二调节组件，该第二调节组件有效作地连接至编码所述Cas9酶的酶编码序列上，该Cas9酶包含核定位序列，并且有利地这包括本发明的分割型Cas9。在一些实施例中，该试剂盒包括位于该系统的相同或不同载体上的组分(a)和(b)。在一些实施例中，组分(a)进一步包括有效作地连接到该第一调节组件的两个或更多个指导序列，其中当表达时，这两个或更多个指导序列中的每者都引导Cas9 CRISPR-Cas复合物与真核细胞中的不同靶序列的序列特异性结合。在一些实施例中，该Cas9包括一个或多个核定位序列，其具有足够强度来在真核细胞的细胞核中驱动所述Cas9以可检测的量积聚。在一些实施例中，该Cas9酶是选自下组的细菌物种的Cas9，该组由以下各项组成：土拉热弗朗西丝菌1、土拉热弗朗西丝菌新凶手亚种、易北河普氏菌、毛螺菌科细菌MC2017 1、分解蛋白丁酸弧菌、Peregrinibacteria细菌GW2011_GWA2_33_10、Parcubacteria细菌GW2011_GWC2_44_17、密斯氏菌属SCADC、氨基酸球菌属BV3L6、毛螺菌科细菌MA2020、CandidatusMethanoplasma termitum、挑剔真杆菌、牛莫拉氏菌237、稻田钩端螺旋体、毛螺菌科细菌ND2006、狗口腔卟啉单胞菌3、狄氏普氏菌、以及猕猴卟啉单胞菌，并且可以包括来源于这些生物的经突变的Cas9。该酶可以是Cas9同系物或直向同源物。在一些实施例中，该Cas9经密码子优化以便在真核细胞中表达。在一些实施例中，该Cas9引导在该靶序列位置处的一条或两条链的切割。在一个优选实施例中，该链断裂是具有5'突出端的交错切割。在一些实施例中，该CRISPR酶缺少DNA链切割活性。在一些实施例中，该同向重复具有16nt的最小长度和单个茎环。在另外的实施例中，该同向重复具有长于16nt，优选多于17nt的长度，并且具有多于一个茎环或经优化的二级结构。

在一个方面，本发明提供了修饰在真核细胞中的靶多核苷酸的方法。在一些实施例中，该方法包括允许Cas9 CRISPR-Cas复合物结合到该靶多核苷酸上以实施所述靶多核苷酸的切割，由此修饰该靶多核苷酸，其中该Cas9 CRISPR-Cas复合物包含与杂交到在所述靶多核苷酸内的靶序列上的指导序列复合的Cas9，其中所述指导序列连接到同向重复序列上。在一些实施例中，所述切割包括通过所述Cas9切割在靶序列位置处的一条或两条链；这包括本发明的分割型Cas9。在一些实施例中，所述切割导致靶基因的转录降低。在一些实施例中，该方法进一步包括通过与外源模板多核苷酸同源重组修复所述切割的靶多核苷酸，其中所述修复导致突变，包括所述靶多核苷酸的一个或多个核苷酸的插入、缺失、或取代。在一些实施例中，所述突变导致在从包含该靶序列的基因表达的蛋白质中的一个或多个氨基酸改变。在一些实施例中，该方法进一步包括将一种或多种载体递送到所述真核细胞，其中这一种或多种载体驱动下列一者或多者的表达：该Cas9、和连接到该DR序列的指导序列。在一些实施例中，所述载体被递送到受试者内的真核细胞中。在一些实施例中，所述修饰发生在细胞培养物中的所述真核细胞中。在一些实施例中，该方法进一步包括在所述修饰之前从受试者中分离所述真核细胞。在一些实施例中，该方法进一步包括使所述真核细胞和/或从中衍生的细胞返回到所述受试者中。

在一个方面，本发明提供了修饰多核苷酸在真核细胞中的表达的方法。在一些实施例中，该方法包括允许Cas9 CRISPR-Cas复合物结合到该多核苷酸上，这样使得所述结合导致所述多核苷酸的表达增加或降低；其中该Cas9 CRISPR-Cas复合物包含与杂交到所述多核苷酸内的靶序列上的指导序列复合的Cas9，其中所述指导序列连接到同向重复序列；这包括本发明的分割型Cas9。在一些实施例中，该方法进一步包括将一种或多种载体递送到所述真核细胞，其中这一种或多种载体驱动下列一者或多者的表达：该Cas9、和连接到该DR序列的指导序列。

在一个方面，本发明提供了产生包含经突变的疾病基因的模式真核细胞的方法。在一些实施例中，疾病基因是与患有或产生疾病的风险的增加相关联的任何基因。在一些实施例中，该方法包括(a)向真核细胞中引入一种或多种载体，其中这一种或多种载体驱动下列一者或多者的表达：Cas9、和连接到同向重复序列的指导序列；并且(b)允许Cas9CRISPR-Cas复合物结合到靶多核苷酸上以实施在所述疾病基因内的该靶多核苷酸的切割，其中该Cas9 CRISPR-Cas复合物包含与(1)杂交到该靶多核苷酸内的靶序列上的指导序列、和(2)该DR序列复合的Cas9，由此产生包含经突变的疾病基因的模式真核细胞；这包括本发明的分割型Cas9。在一些实施例中，所述切割包括通过所述Cas9切割在靶序列位置处的一条或两条链。在一个优选实施例中，该链断裂是具有5'突出端的交错切割。在一些实施例中，所述切割导致靶基因的转录降低。在一些实施例中，该方法进一步包括通过与外源模板多核苷酸同源重组修复所述切割的靶多核苷酸，其中所述修复导致突变，包括所述靶多核苷酸的一个或多个核苷酸的插入、缺失、或取代。在一些实施例中，所述突变导致在从包含该靶序列的基因表达的蛋白质中的一个或多个氨基酸改变。

在一个方面，本发明提供了包含同向重复序列下游的指导序列的重组多核苷酸，其中当表达时，该指导序列引导Cas9 CRISPR-Cas复合物与存在于真核细胞中的对应的靶序列的序列特异性结合。在一些实施例中，该靶序列是存在于真核细胞中的病毒序列。在一些实施例中，该靶序列是原癌基因或癌基因。

在一个方面，本发明提供了通过在一种或多种细胞的基因中引入一个或多个突变来选择一种或多种细胞的方法，该方法包括：将一种或多种载体引入这一种或多种细胞中，其中这一种或多种载体驱动下列一者或多者的表达：Cas9、连接至同向重复序列上的指导序列、和编辑模板；其中该编辑模板包含消除Cas9切割的一个或多个突变；允许该编辑模板与靶多核苷酸在有待筛选的一种或多种细胞中进行同源重组；允许Cas9 CRISPR-Cas复合物结合到靶多核苷酸上以实施在所述基因内的该靶多核苷酸的切割，其中该Cas9 CRISPR-Cas复合物包含与(1)杂交到该靶多核苷酸内的靶序列上的指导序列、和(2)该同向重复序列复合的Cas9，其中该Cas9 CRISPR-Cas复合物与该靶多核苷酸的结合诱导细胞死亡，由此允许选择其中已经引入一个或多个突变的一种或多种细胞；这包括本发明的分割型Cas9。在本发明的另一个优选实施例中，该有待选择的细胞可以是真核细胞。本发明的方面允许选择特异细胞，而不需要选择标记或可能包括反选择系统的两步法。

在本文，存在短语“这包括本发明的分割型Cas9”或类似文本；并且，这是表明在本文的实施例中的Cas9可以是如本文讨论的分割型Cas9。

在一个方面，本发明涉及非天然存在的或工程化的诱导型Cas9 CRISPR-Cas系统，该系统包含附接至诱导型异二聚体的第一个一半的第一Cas9融合构建体和附接至该诱导型异二聚体的第二个一半的第二Cas9融合构建体，其中该第一Cas9融合构建体有效作地连接至一个或多个核定位信号，其中该第二Cas9融合构建体有效作地连接至核输出信号，其中与诱导物能量源接触使该诱导型异二聚体的第一个一半和第二个一半聚到一起，其中使该诱导型异二聚体的第一个一半和第二个一半聚到一起允许该第一Cas9融合构建体和该第二Cas9融合构建体构成功能性Cas9 CRISPR-Cas系统，其中该Cas9 CRISPR-Cas系统包含指导RNA(gRNA)，该指导RNA包含能够杂交到细胞中的感兴趣的基因组座位中的靶序列上的指导序列，并且其中该功能性Cas9 CRISPR-Cas系统编辑该基因组座位以改变基因表达。在本发明的一个实施例中，该诱导型异二聚体的第一个一半是FKBP12并且该诱导型异二聚体的第二个一半是FRB。在本发明的另一个实施例中，该诱导物能量源是雷帕霉素。

诱导物能量源可以被简单地认为是诱导物或二聚化剂。出于一致性，本文始终使用术语‘诱导物能量源’。该诱导物能量源(或诱导物)用以重构Cas9。在一些实施例中，该诱导物能量源通过诱导型二聚体的两个一半的作用使Cas9的两个部分聚到一起。因此诱导型二聚体的两个一半在诱导物能量源的存在下被聚到一起。二聚体的两个一半在没有诱导物能量源的情况下将不形成到二聚体(二聚化)。

因此，诱导型二聚体的两个一半与诱导物能量源协作，以二聚化该二聚体。这进而通过使Cas9的第一部分和第二部分聚到一起而重构Cas9。

CRISPR酶融合构建体各自包含分割型Cas9的一部分。这些构建体优选地经由接头(如本文描述的GlySer接头)融合至该二聚体的两个一半之一。该二聚体的两个一半可以是基本上相同的一起形成同二聚体的两种单体，或者它们可以是不同的一起形成异二聚体的单体。因此，两种单体可以被认为是整个二聚体的一半。

在Cas9酶的两个部分实质上包含功能化Cas9的意义上，该Cas9是分割型的。该Cas9可以充当基因组编辑酶(当与靶DNA和指导物形成复合物时)，如切口酶或核酸酶(切割DNA的两条链)，或者它可以是基本上作为具有非常少的或没有催化活性的DNA结合蛋白的失活的Cas9，这典型地是由于其催化结构域中的一个或多个突变。

分割型Cas9的两个部分可以被认为是该分割型Cas9的N’末端部分和C’末端部分。融合典型地是在Cas9的分割点。换言之，分割型Cas9的C’末端或N’末端部分融合至二聚体两个一半之一，同时N’末端的C’末端部分融合至二聚体的另一半。

在断裂是新产生的意义上，Cas9不一定是分割型的。典型地经由计算机模拟设计分割点并将其克隆到构建体中。总之，分割型Cas9的两个部分(N’末端和C’末端部分)形成完整的Cas9，优选地包含至少70％或更多的野生型氨基酸(或编码它们的核苷酸)，优选至少80％或更多、优选至少90％或更多、优选至少95％或更多并且最优选至少99％或更多的野生型氨基酸(或编码它们的核苷酸)。一些修剪是可能的，并且设想了突变体。可以完全去除非功能结构域。重要的是，这两个部分可以被聚到一起并且所希望的Cas9功能被恢复或重构。

该二聚体可以是同二聚体或异二聚体。

可以在与第一Cas9构建体的有效连接中使用一个或多个(优选两个)NLS。可以在与第一Cas9构建体的有效连接中使用一个或多个(优选两个)NES。NLS和/或NES优选地在分割型Cas9-二聚体(即，半二聚体)融合的侧翼，即，一个NLS可以定位在第一Cas9构建体的N’末端并且一个NLS可以定位在第一Cas9构建体的C’末端。类似地，一个NES可以定位在第二Cas9构建体的N’末端并且一个NES可以定位在第二Cas9构建体的C’末端。当提及N’或C’末端时，应当理解的是，这些末端对应于相应核苷酸序列中的5’端和3’端。

一种优选的安排是第一Cas9构建体被安排成5’-NLS-(N’末端Cas9部分)-接头-(二聚体的第一个一半)-NLS-3’。一种优选的安排是第二Cas9构建体被安排成5’-NES--(二聚体的第二个一半)-接头-(C’末端Cas9部分)-NES-3’。适合的启动子优选在这些构建体各自的上游。这两种构建体可以分开或一起递送。

在一些实施例中，与第二Cas9构建体的有效连接中的一个或全部NES可以被换为NLS。然而，这典型地可能不是优选的，并且在其他实施例中，与第二Cas9构建体的有效连接的定位信号是一个或多个NES。

还应当理解的是，NES可以有效作地连接至分割型Cas9的N’末端片段，并且NLS可以有效作地连接至分割型Cas9的C’末端片段。然而，可以优选的是这样的安排，其中NLS有效作地连接至分割型Cas9的N’末端片段并且NES有效作地连接至分割型Cas9的C’末端片段。

NES用以将第二Cas9融合构建体定位在细胞核外，至少直到提供诱导物能量源(例如，至少直到向诱导物提供能量源以执行其功能)。诱导物的存在刺激两种Cas9融合物在细胞质中二聚化并且使得对于二聚化的第一和第二Cas9融合物定位至细胞核而言在热力学上有价值。不被理论所束缚，申请人认为NES将第二Cas9融合物螯合到细胞质上(即，细胞核外)。第一Cas9融合物上的NLS将它定位至细胞核。在两种情况下，申请人使用NES或NLS将平衡(核运输的平衡)转向希望的方向。二聚化典型地发生细胞核外(非常小的部分可能发生在细胞核中)并且二聚化的复合物上的NLS将核运输平衡转向核定位，因此二聚化并且因此重构的Cas9进入细胞核。

有益地，申请人能够在分割型Cas9中重构功能。使用瞬时转染来证明这个概念并且二聚化在存在诱导物能量源的背景下发生。没有看到Cas9的分开片段具有活性。然后使用通过慢病毒递送的稳定表达使其显现出并且显示可以使用分割型Cas9方法。

本发明的这种分割型Cas9方法是有益的，因为它允许诱导Cas9活性，因此允许时间控制。此外，可以使用不同的定位序列(即，NES和NLS是优选的)，以减少来自自动组装复合物的背景活性。还可以使用组织特异性启动子(例如第一和第二Cas9融合构建体各自的启动子)用于组织特异性靶向，由此提供空间控制。可以使用两种不同的组织特异性启动子来发挥更好程度的控制，如果需要的话。就阶段特异性启动子而言可以使用相同的方法或者可以存在阶段和组织特异性启动子的混合物，其中第一和第二Cas9融合构建体之一处于组织特异性启动子的控制下(即有效作地连接至或包含该启动子)，同时第一和第二Cas9融合构建体中的另一者处于阶段特异性启动子的控制下(即有效作地连接至或包含该启动子)。

诱导型Cas9 CRISPR-Cas系统包含一个或多个核定位序列(NLS)，如在此所描述的，例如像有效作地连接至第一Cas9融合构建体。这些核定位序列理想地具有足够的强度，以便驱动所述第一Cas9融合构建体在真核细胞的细胞核中以可检测的量积聚。不希望被理论所束缚，认为核定位序列对于真核生物中的Cas9 CRISPR-Cas复合物活性不是必要的，但包括此类序列增强该系统的活性，尤其对于靶向细胞核中的核酸分子而言，并且帮助操作本发明的2-部分系统。

同样地，第二Cas9融合构建体有效作地连接至核输出序列(NES)。的确，它可以连接至一个或多个核输出序列。换言之，与第二Cas9融合构建体一起使用的输出序列的数目优选是1或2或3。典型地2是优选的，但是在一些实施例中1是足够的并且因此是优选的。NLS和NES的适合实例在本领域是已知的。例如，优选的核输出信号(NES)是人类蛋白酪氨酸激酶2。优选的信号将是物种特异性的。

在使用FRB和FKBP系统的情况下，FKBP的侧翼优选是核定位序列(NLS)。在使用FRB和FKBP系统的情况下，优选的安排是N’末端Cas9-FRB-NES:C’末端Cas9-FKBP-NLS。因此，第一Cas9融合构建体将包含C’末端Cas9部分并且第二Cas9融合构建体将包含N’末端Cas9部分。

本发明的另一个有益方面是它可以被快速开启，即具有快速响应。不被理论所束缚，认为Cas9活性可以通过二聚化现有(已经存在)的融合构建体(通过与诱导物能量源接触)进行诱导，这比通过表达(尤其是翻译)新的融合构建体更迅速。因此，第一和第二Cas9融合构建体可以提前在靶细胞中进行表达，即需要Cas9活性之前。然后可以在时间上控制Cas9活性并且然后通过添加诱导物能量源来快速构建，这理想地比通过表达(包括转录的诱导)由例如载体递送的Cas9更快速地起作用(以二聚化异二聚体并且由此提供Cas9活性)。

除非另外显而易见的，术语Cas9或Cas9酶和CRISPR酶在本文可互换地使用。

申请人证明Cas9可以被分割成两种组分，当被聚回到一起时其重构功能性核酸酶。采用雷帕霉素敏感型二聚化结构域，申请人产生了用于对Cas9介导的基因组编辑和转录调节进行时间控制的化学诱导型Cas9。换句话说，申请人证明通过被分割成两个片段可以使Cas9成为化学诱导型的，并且雷帕霉素敏感型二聚化结构域可以被用于Cas9的受控重组装。申请人表明重组装的Cas9可以用来介导基因组编辑(通过核酸酶/切口酶活性)以及转录调节(作为DNA结合结构域，所谓的“失活的Cas9”)。

因此，使用雷帕霉素敏感型二聚化结构域是优选的。Cas9的重组装是优选的。可以通过恢复结合活性来确定重组装。在Cas9是切口酶或诱导双链断裂的情况下，本文描述了相比于野生型的适合的比较百分比。

雷帕霉素处理可以持续12天。剂量可以是200nM。这种时间和/或摩尔剂量是针对人类胚肾293FT(HEK293FT)细胞系的适当剂量的实例并且这可以用在其他的细胞系中。这个数字可以被外推用于体内治疗应用，例如以mg/kg计。然而，还可以设想的是，这里还使用了用于向受试者给予雷帕霉素的标准剂量。所谓“标准剂量”意指在雷帕霉素的正常治疗应用或主要适应症下的剂量(即当给予雷帕霉素用于预防器官排斥时使用的剂量)。

值得注意的是，Cas9-FRB/FKBP段的优选安排是分开且无活性的，直到雷帕霉素诱导的FRB和FKBP的二聚化导致功能性全长Cas9核酸酶的重组装。因此，优选的是附接至诱导型异二聚体的第一个一半的第一Cas9融合构建体与附接至诱导型异二聚体的第二个一半的第二Cas9融合构建体分开递送和/或分开定位。

为了将Cas9(N)-FRB片段螯合在细胞质中，在细胞质中它不太可能与核定位的Cas9(C)-FKBP片段二聚化，优选的是在Cas9(N)-FRB上使用来自人类蛋白酪氨酸激酶2的单个核输出序列(NES)(Cas9(N)-FRB-NES)。在雷帕霉素的存在下，Cas9(N)-FRB-NES与Cas9(C)-FKBP-2xNLS二聚化，以重构完整的Cas9蛋白，其将核运输平衡转向核输入并且允许DNA靶向。

高剂量的Cas9可以加重脱靶(OT)序列处的indel频率，这些序列展现出与指导链的几个错配。此类序列是尤其敏感的，如果错配是非连续的和/或在指导物的种子区外的话。因此，Cas9活性的时间控制可以用于降低长期表达实验中的剂量并且因此与组成型活性的Cas9相比，产生减少的脱靶indel。

病毒递送是优选的。具体而言，设想了慢病毒或AAV递送载体。申请人产生了分割型-Cas9慢病毒构建体，类似于lentiCRISPR质粒。分割段应足够小以配合AAV的约4.7kb的尺寸限制。

申请人证明，分割型Cas9的稳定的、低拷贝表达可以用于在靶向的座位处诱导实质性indel而不在脱靶位点处引起显着的突变。申请人克隆了Cas9片段(基于本文描述的分割5的2个部分)。

还可以使用失活的Cas9，其包含VP64反式激活结构域，例如添加至Cas9(C)-FKBP-2xNLS(失活的Cas9(C)-FKBP-2xNLS-VP64)。这些片段重构无催化活性的Cas9-VP64融合物(失活的Cas9-VP64)。在雷帕霉素的存在下通过VP64诱导转录激活，以诱导Cas9(C)-FKBP融合物和Cas9(N)-FRB融合物的二聚化。换言之，申请人测试了分割型失活的Cas9-VP64的可诱导性并且显示在雷帕霉素的存在下通过分割型失活的Cas9-VP64诱导转录激活。因此，本发明的诱导型Cas9可以与一个或多个功能结构域(如转录激活因子或阻遏因子或核酸酶(如Fok1))缔合。功能结构域可以结合至或与分割型Cas9的一部分融合。

优选的安排是第一Cas9构建体被安排成5’-第一定位信号-(N’末端Cas9部分)-接头-(二聚体的第一个一半)-第一定位信号-3’并且第二Cas9构建体被安排成5’-第二定位信号--(二聚体的第二个一半)-接头-(C’末端Cas9部分)-第二定位信号-功能结构域-3’。这里，功能结构域被放置在第二Cas9构建体的3’端。可替代地，功能结构域可以被放置在第一Cas9构建体的5’端。可以在3’端或5’端或在两端使用一个或多个功能结构域。适合的启动子优选在这些构建体各自的上游。这两种构建体可以分开或一起递送。定位信号可以是NLS或NES，只要它们在每种构建体中不相互混杂即可。

在一个方面，本发明提供了诱导型Cas9 CRISPR-Cas系统，其中该Cas9当与不具有至少一个突变的Cas9酶相比时具有降低至少97％或100％的核酸酶活性。

因此，还优选的是该Cas9是失活的Cas9。理想地，分割应当始终是这样的，使得这一个或多个催化结构域不受影响。对于失活的Cas9，意图是发生DNA结合，但是不显示切割或切口酶活性。

在一个方面，本发明提供了如本文讨论的诱导型Cas9 CRISPR-Cas系统，其中一个或多个功能结构域与该Cas9缔合。这个功能结构域可以与分割型Cas9的一部分或两部分缔合(即，结合至其上或与其融合)。可以存在与分割型Cas9的两个部分各自缔合缔合的功能结构域。因此，这些功能结构域可以典型地被提供为第一和/或第二Cas9融合构建体的部分，作为该构建体内的融合物。功能结构域典型地经由接头(如GlySer接头)融合，如本文讨论的。这一个或多个功能结构域可以是转录激活结构域或阻遏因子结构域。尽管它们可以是不同的结构域，但是优选的是所有功能结构域是激活因子或阻遏因子并且不使用两者的混合物。

转录激活结构域可以包含VP64、p65、MyoD1、HSF1、RTA或SET7/9。

在一个方面，本发明提供了如本文讨论的诱导型Cas9 CRISPR-Cas系统，其中与该Cas9缔合的一个或多个功能结构域是转录阻遏结构域。

在一个方面，本发明提供了如本文讨论的诱导型Cas9 CRISPR-Cas系统，其中转录阻遏结构域是KRAB结构域。

在一个方面，本发明提供了如本文讨论的诱导型Cas9 CRISPR-Cas系统，其中转录阻遏结构域是NuE结构域、NcoR结构域、SID结构域或SID4X结构域。

在一个方面，本发明提供了如本文讨论的诱导型Cas9 CRISPR-Cas系统，其中与衔接蛋白缔合的一个或多个功能结构域具有一种或多种活性，包括甲基酶活性、脱甲基酶活性、转录激活活性、转录阻遏活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性、DNA切割活性、DNA整合活性或核酸结合活性。

在一些实施例中，组蛋白修饰结构域也是优选的。下文讨论了示例性组蛋白修饰结构域。转座酶结构域、HR(同源重组)机构结构域、重组酶结构域和/或整合酶结构域作为本发明的功能结构域也是优选的。在一些实施例中，DNA整合活性包括HR机构结构域、整合酶结构域、重组酶结构域和/或转座酶结构域。

在一个方面，本发明提供了如本文讨论的诱导型Cas9 CRISPR-Cas系统，其中DNA切割活性是由于核酸酶。

在一个方面，本发明提供了如本文讨论的诱导型Cas9 CRISPR-Cas系统，其中核酸酶包括Fok1核酸酶。

此类功能结构域(其与本发明的分割型Cas9系统是优选的)的用途还详细讨论在康纳尔曼(Konermann)等人(“用工程化的CRISPR-Cas9复合物进行的基因组范围内的转录激活(Genome-scale transcriptional activation with an engineered CRISPR-Cas9complex)”《自然》(Nature)公开于2014年12月11日)中。

本发明的系统可以与任何指导一起使用。

在某些实施例中可以使用经修饰的指导物。特别优选的是采用以上提及的康纳尔曼(Konermann)(《自然》(Nature)，2014年12月11日)论文的传授的指导物。修饰这些指导物，这样使得添加蛋白质结合RNA部分(如适配体)。这样一个或多种部分可以替换该指导物的一部分。然后相应的RNA结合蛋白结构域可以用于识别RNA并且将功能结构域(如本文描述的那些)募集到指导物。这主要用于与失活的Cas9一起使用，通过核酸酶(如Fok1)导致转录激活或阻遏或DNA切割。此类指导物与失活的Cas9结合使用是强大的，并且是尤其强大的，如果该Cas9本身还与其自身的功能结构域(如本文讨论的)缔合的话。当失活的Cas9(具有或不具有其自身的缔合缔合功能结构域)被诱导以根据本发明重构，即作为分割型Cas9，则该工具是尤其有用的。

指导RNA(gRNA)(还优选用于在本发明中)可以包含指导序列，该指导序列能够杂交到细胞中的感兴趣的基因组座位中的靶序列上，其中该gRNA通过插入一个或多个不同的RNA序列而被修饰，这一个或多个RNA序列结合至一种或多种衔接蛋白，并且其中该衔接蛋白与一个或多个功能结构域缔合。该Cas9可以包含至少一个突变，这样使得该Cas9酶具有不超过5％的不具有这至少一个突变的Cas9酶的核酸酶活性；和/或至少一个或多个核定位序列。还提供了非天然存在的或工程化的组合物，该组合物包含：一种或多种指导RNA(gRNA)，其包含能够杂交到细胞中的感兴趣的基因组座位中的靶序列上的指导序列；Cas9酶，其包含至少一个或多个核定位序列，其中该Cas9酶包含至少一个突变，这样使得该Cas9酶具有不超过5％的不具有这至少一个突变的Cas9酶的核酸酶活性，其中至少一种gRNA通过插入结合至一种或多种衔接蛋白的一个或多个不同RNA序列而被修饰，并且其中该衔接蛋白与一个或多个功能结构域缔合。

该gRNA优选地通过插入结合至一种或多种衔接蛋白的一个或多个不同RNA序列而被修饰。插入的结合至一种或多种衔接蛋白的一个或多个不同RNA序列优选是对相同的或不同的衔接蛋白具有特异性的适配体序列或者两个或更多个适配体序列。衔接蛋白优选地包括MS2、PP7、Qβ、F2、GA、fr、JP501、M12、R17、BZ13、JP34、JP500、KU1、M11、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、φCb5、φCb8r、φCb12r、φCb23r、7s、PRR1。尤其稳定表达分割型失活的Cas9的细胞系可以是有用的。

申请人证明，Cas9可以被分割成两个不同的片段，当使用化学诱导被聚回到一起时其重构功能性全长Cas9核酸酶。分割型Cas9构造将有用于多种应用。例如，分割型Cas9可以允许通过将每个片段放在不同的组织特异性启动子之下而将Cas9活性限制在交叉的细胞群的遗传策略。另外，还可以采用不同的化学诱导型二聚化结构域(如APA)和赤霉素。

该诱导物能量源优选是化学诱导。

分割位置或地点是Cas9酶的第一部分与第二部分分开的点。在一些实施例中，第一部分将包含或编码氨基酸1至X，同时第二部分将包含或编码氨基酸X+1至端点。在这个实例中，编号是连续的，但是这可能不总是必要的，因为氨基酸(或编码它们的核苷酸)可以从分割端的任一端修剪下来，其条件是保留足够的DNA结合活性和(如果需要的话)DNA切口酶或切割活性，例如相比于野生型Cas9至少40％、50％、60％、70％、80％、90％或95％的活性。

本文提供的示例性编号可以参考野生型蛋白，优选野生型FnCas9。然而，设想的是可以使用野生型Cas9的(如FnCas9蛋白的)突变体。编号还可以不完全遵循FnCas9编号，因为例如可以使用一些N’或C’末端截短或缺失，但是这可以使用标准序列比对工具解决。作为序列比对工具，直向同源物也是优选的。

因此，可以使用本领域的普通技术选择分割位置，例如基于晶体数据和/或计算结构预测。

例如，Cas9核酸酶一级结构的计算分析揭示了三个不同区域(图1)。第一个是C-末端RuvC样结构域，其是唯一的菜单征结构域。第二个是N-末端α-螺旋区域并且第三个是混合α和β区，其位于RuvC样结构域与α-螺旋区之间。在Cas9一级结构内预测出若干小段的非结构化区域。被暴露于溶剂并且在不同Cas9直向同源物内不保守的非结构化区域可以代表优选的分割侧(图2和图3)。

下表呈现了As和LbCas9内的潜在的非限制性分割区。这样一个区域内的分割位点可以是合时宜的。

分割区	AsCas9	LbCas9
			1	575-588	566-571
2	631-645	754-757
			3	653-664	-
4	818-844	-

对于Fn、As和Lb Cas9突变体，应该容易地显而易见的是例如基于序列比对，潜在的分割位点的相应位置是什么。对于非Fn、As和Lb酶，可以使用直向同源物的晶体结构，如果该直向同源物与预期Cas9之间存在相对较高程度的同源性的话，或者可以使用计算预测。

理想地，分割位置应当位于区域或环内。优选地，在氨基酸序列的中断不会引起结构特征(例如α-螺旋或-β片层)的部分或完全破坏的地方出现分割位置。非结构化区域(在晶体结构中不显现的区域，因为这些区域不足够结构化以在晶体中“冻住”)通常是优选选择。申请人可以例如在暴露于Cas9表面的非结构化区域中进行分割。

申请人可以遵循作为优选实例并且作为指南提供的以下程序。由于非结构化区域并不显现在晶体结构中，申请人交叉参考了具有Cas9的一级氨基酸序列的晶体周围的氨基酸序列。每个非结构化区域可以例如由约3至10个氨基酸构成，这并没有显现在晶体中。申请人因此在这些氨基酸之间进行分割。为了包括更多的潜在分割侧，申请人使用与非结构化区域相同的标准包括了位于Cas9外的环中的分割。

在一些实施例中，分割位置在Cas9的外侧环中。在其他优选实施例中，分割位置在Cas9的非结构化区域中。非结构化区典型地是高度挠性的外侧环，其结构不能从晶体图案中容易地确定。

一旦已经鉴定出分割位置，便可以设计适合的构建体。

典型地，NES被定位在分割氨基酸的第一部分的N’末端(或编码它的核苷酸的5’端)。那样的话，NLS被定位在分割氨基酸的第二部分的C’末端(或编码它的核苷酸的3’端)。以此方式，第一Cas9融合构建体可以有效作地连接至一个或多个核输出信号，并且第二Cas9融合构建体可以有效作地连接至核定位信号。

当然，可以提供相反的安排，其中NLS被定位在分割氨基酸的第一部分的N’末端(或编码它的核苷酸的5’端)。那样的话，NES被定位在分割氨基酸的第二部分的C’末端(或编码它的核苷酸的3’端)。因此，第一Cas9融合构建体可以有效作地连接至一个或多个核定位信号，并且第二Cas9融合构建体可以有效作地连接至核输出信号。

出于包装目的，保持两个部分(分割的两侧)长度大致相同的分割可以是有利的。例如，认为当转录物的尺寸大约相同时更易于维持两个段之间的化学计量。

在某些实例中，人类密码子优化的Cas9(如FnCas9)的N-末端和C-末端段被分别融合到FRB和FKBP二聚化结构域。这种安排可以是优选的。可以将它们进行切换(即，N’末端融合到FKBP并且C’末端融合到FRB)。

优选在本文中使用接头(如(GGGGS)₃)，以将Cas9片段与二聚化结构域分开。(GGGGS)₃是优选的，因为是相对较长的接头(15个氨基酸)。甘氨酸残基最具挠性并且丝氨酸残基提高了接头在蛋白质外的机会。(GGGGS)₆、(GGGGS)₉或(GGGGS)₁₂可以优选用作替代物。其他优选的替代物是(GGGGS)₁、(GGGGS)₂、(GGGGS)₄、(GGGGS)₅、(GGGGS)₇、(GGGGS)₈、(GGGGS)₁₀或(GGGGS)₁₁。

例如，(GGGGS)₃可以被包括在N’末端Cas9片段与FRB之间。例如，(GGGGS)₃可以被包括在FKB与C’末端Cas9片段之间。

替代接头是可获得的，但是高度挠性接头被认为最佳地起作用，以允许有最大机会将Cas9的2部分聚在一起并且因此重构Cas9活性。一种替代方案是核质蛋白的NLS可以用作接头。

接头还可以用在Cas9与任何功能结构域之间。再一次，这里可以使用(GGGGS)₃接头(或其6、9或12个重复形式)，或者核质蛋白的NLS可以用作Cas9与功能结构域之间的接头。

设想了FRB/FKBP系统的替代物。例如，ABA和赤霉素系统。

因此，FKBP家族的优选实例是以下任何一种诱导型系统。在FK506的存在下与钙调磷酸酶A(CNA)二聚化的FKBP；在FKCsA的存在下与CyP-Fas二聚化的FKBP；在雷帕霉素的存在下与FRB二聚化的FKBP；在库马霉素的存在下与GryB二聚化的GyrB；在赤霉素的存在下与GID1二聚化的GAI；或在HaXS的存在下与HaloTag二聚化的Snap-tag。

FKBP家族本身的替代物也是优选的。例如，在FK1012的存在下进行同二聚化的FKBP(即，一个FKBP与另一个FKBP二聚化)。因此，还提供了非天然存在的或工程化的诱导型Cas9 CRISPR-Cas系统，该系统包含：

第一Cas9融合构建体，其附接至诱导型同二聚体的第一个一半，和

第二Cas9融合构建体，其附接至该诱导型同二聚体的第二个一半，

其中该第二Cas9融合构建体有效作地连接至(任选地一个或多个)核输出信号，

其中与诱导物能量源接触使该诱导型同二聚体的第一个一半和第二个一半聚到一起，

其中使该诱导型同二聚体的该第一个一半和该第二个一半聚到一起允许该第一Cas9融合构建体和该第二Cas9融合构建体构成功能性Cas9 CRISPR-Cas系统，

在一个实施例中，同二聚体优选是FKBP并且诱导物能量源优选是FK1012。在另一个实施例中，同二聚体优选是GryB并且诱导物能量源优选是库马霉素。在另一个实施例中，同二聚体优选是ABA并且诱导物能量源优选是赤霉素。

在其他实施例中，该二聚体是异二聚体。异二聚体的优选实例是以下任何一种诱导型系统：在FK506的存在下与钙调磷酸酶A(CNA)二聚化的FKBP；在FKCsA的存在下与CyP-Fas二聚化的FKBP；在雷帕霉素的存在下，在库马霉素的存在下与FRB二聚化的FKBP；在赤霉素的存在下与GID1二聚化的GAI；或在HaXS的存在下与HaloTag二聚化的Snap-tag。

申请人使用FKBP/FRB，因为它被良好地表征并且两个结构域都足够小(<100个氨基酸)，以帮助包装。此外，雷帕霉素已经被使用了好久并且副作用被很好地理解。大的二聚化结构域(>300aa)也应起作用，但是可能需要更长的接头以允许Cas9重构。

保罗姆鲁甘(Paulmurugan)和甘比尔(Gambhir)(《癌症研究》(Cancer Res)，2005年8月15日65；7413)讨论了FRB/FKBP/雷帕霉素的背景。另一篇有用的论文是克拉布特里(Crabtree)等人(《化学与生物学》(Chemistry&Biology)13，99-107，2006年6月)的文章。

在一个实例中，构建了表达盒(质粒)。gRNA处于U6启动子的控制下。使用两个不同的Cas9分割物。分割型Cas9构建体是基于以下项的：第一Cas9融合构建体，其侧翼为NLS，其中FKBP经由GlySer接头融合至分割型Cas9的C末端部分；以及第二Cas9融合构建体，其侧翼为NES，其中FRB经由GlySer接头与分割型Cas9的N末端部分融合。为了分开第一和第二Cas9融合构建体，在转录分割中使用P2A。在雷帕霉素的存在下，分割型Cas9显示出与野生型类似的indel形成，但是在不存在雷帕霉素的情况下indel形成比野生型明显要低。

因此，提供了单个载体。该载体包含：

其中该功能性Cas9 CRISPR-Cas系统结合至该靶序列，并且任选地，编辑该基因组座位以改变基因表达。这些组件优选被提供在单个构建体(如表达盒)上。

第一Cas9融合构建体在每端优选地侧接至少一个核定位信号。第二Cas9融合构建体在每端优选地侧接至少一个核输出信号。

还提供了治疗对其有需要的受试者的方法，该方法包括通过用编码系统的多核苷酸或本发明的任何载体转化该受试者而诱导基因编辑并且向该受试者给予诱导物能量源。还可以提供适合的修复模板，例如通过包含所述修复模板的载体递送该修复模板。

还提供了治疗对其有需要的受试者的方法，该方法包括通过用编码本发明的系统的多核苷酸或本发明的任何载体转化该受试者而诱导转录激活或阻遏，其中所述多核苷酸或载体编码或包含无催化活性的Cas9和一个或多个缔合功能结构域；该方法进一步包括向该受试者给予诱导物能量源。

还提供了用于在所述治疗方法中使用的包含本发明的系统的组合物。还提供了本发明的系统在用于这样的治疗方法的药剂的制造中的用途。

在本文或在本文引用的文献中描述了可通过本发明的系统治疗的病症的实例。

单个载体可以包含转录物分割剂，如P2A。P2A将转录物分割为两个，以将第一和第二Cas9融合构建体分开。分割是由于“核糖体跳过”。实质上，在翻译过程中核糖体跳过氨基酸，这破坏了蛋白链并且产生两个单独的多肽/蛋白。单个载体还有用于低背景活性不是问题但是高诱导型活性是所希望的应用。

一个实例是克隆胚胎干细胞系的产生。正常程序是用编码wt Cas9或Cas9切口酶的质粒进行瞬时转染。这些质粒产生Cas9分子，这些分子保留活性持续若干天并且具有更高的脱靶活性机会。使用分割型Cas9的单个表达载体允许将“高”Cas9活性限制在较短的时间窗(例如，一个剂量的诱导物，如雷帕霉素)。在没有连续(每日)诱导物(例如雷帕霉素)处理的情况下，单个表达分割型Cas9载体的活性较低并且呈现出减少的引起不想要的脱靶效应的机会。

经诱导的Cas9活性的峰值在一些实施例中是有益的并且可以使用单个递送载体最容易地引起，但是通过双载体系统(每个载体递送分割型Cas9的一半)也是可能的。峰值可以是较高活性并且持续较短时段，典型地是诱导物的寿命。

因此，提供了用于产生克隆胚胎干细胞系的方法，该方法包括用编码本发明的系统的多核苷酸或本发明的一种载体转染一种或多种胚胎干细胞以表达本发明的分割型Cas9并且向这一种或多种干细胞给予本发明的诱导物能量源或使这一种或多种干细胞与本发明的诱导物能量源接触以诱导Cas9的重构。可以提供修复模板。

正如在本文描述的所有方法，应当理解的是将需要适合的gRNA或指导物。

在功能性结构域等与酶的一部分或其他部分“缔合”的情况下，这些是典型的融合物。这里相对于一个分子如何与另一个分子‘缔合’，例如在Cas9的部分与功能结构域之间，使用术语“与...缔合”。在这样的蛋白质-蛋白质相互作用的情况下，可以按抗体识别表位的方式就识别而论看待这种缔合。可替代地，一种蛋白可以经由这两种蛋白的融合物与另一蛋白缔合，例如一个亚基融合至另一亚基。融合典型地通过将一种蛋白的氨基酸序列添加至另一蛋白的氨基酸序列上而发生，例如经由一起剪接编码每种蛋白或亚基的核苷酸序列。可替代地，这基本上可以被视为两个分子之间的结合或直接连接，如融合蛋白。在任何情况下，融合蛋白可以在感兴趣的两个亚基之间(即酶与功能结构域之间或衔接蛋白与功能结构域之间)包括接头。因此，在一些实施例中，Cas9的部分通过结合至其上而与功能结构域缔合。在其他实施例中，Cas9任选地经由中间接头而与功能结构域缔合，因为这两者被融合到一起。接头的实例包括本文讨论的GlySer接头。

诱导物的其他实例包括光和激素。对于光，诱导型二聚体可以是异二聚体并且包括第一个一半光诱导型二聚体和第二个(并且互补的)一半光诱导型二聚体。第一个一半和第二个一半光诱导型二聚体的优选实例是CIB1和CRY2系统。CIB1结构域是光敏感型隐花色素2(CRY2)的异源二聚体结合配偶体。

在另一个实例中，可以将蓝光响应性磁体二聚化系统(pMag和nMag)融合至分割型Cas9蛋白的两个部分。响应于光刺激，pMag和nMag二聚化并且Cas9重组装。例如，此类系统结合Cas9描述于尼洪基(Nihongaki)等人(《自然生物技术》(Nat.Biotechnol.)33，755-790，2015)中。

本发明包括，该诱导物能量源可以是热、超声波、电磁能或化学品。在本发明的一个优选实施例中，该诱导物能量源可以是抗生素、小分子、激素、激素衍生物、类固醇或类固醇衍生物。在一个更优选的实施例中，该诱导物能量源可以是脱落酸(ABA)、多西环素(DOX)、cumate、雷帕霉素、4-羟基他莫西芬(4OHT)、雌激素或蜕皮激素。本发明提供了至少一种开关可以选自下组，该组由以下各项组成：基于抗生素的诱导型系统、基于电磁能的诱导型系统、基于小分子的诱导型系统、基于核受体的诱导系统以及基于激素的诱导型系统。在一个更优选的实施例中，该至少一种开关可以选自下组，该组由以下各项组成：四环素(Tet)/DOX诱导型系统、光诱导型系统、ABA诱导型系统、cumate阻遏因子/操纵子系统、4OHT/雌激素诱导型系统、基于蜕皮激素的诱导型系统以及FKBP12/FRAP(FKBP12-雷帕霉素复合物)诱导型系统。还在本文和在PCT/US 2013/051418(通过引用并入本文)中讨论了此类诱导物。

一般而言，可以使用本发明的分割型Cas9方法寻求可以由Cas9(无论是wt、切口酶还是失活的Cas9(具有或不具有缔合功能结构域))造成的任何用途。该益处仍是Cas9活性的诱导型性质。

作为一个另外的实例，可以用荧光蛋白(像GFP)制备分割型Cas9融合物。这允许使基因组座位成像(参见“通过优化的CRISPR/Cas系统使人类活细胞中的基因组座位动态成像(Dynamic Imaging of Genomic Loci in Living Human Cells by an OptimizedCRISPR/Cas System)”，陈(Chen)B等人《细胞》(Cell)2013)，但是以诱导型方式。因此，在一些实施例中，一个或多个Cas9部分可以与荧光蛋白(例如GFP)缔合(并且特别是与其融合)。

另外的实验解决了当中靶切割处于相同水平时，野生型(wt)与分割型Cas9之间是否存在脱靶切割差异。为了做到这一点，申请人使用wt和分割型Cas9质粒的瞬时转染并且在不同时间点进行收获。申请人在发现中靶切割在+/-5％内的一组样品之后寻找脱靶激活。申请人使得细胞系稳定表达wt或分割型Cas9而不表达指导物(使用慢病毒)。抗生素选择之后，将指导物用单独的慢病毒进行递送并且在不同时间点进行收获，以测量中靶/脱靶切割。

申请人将去稳定序列(PEST，参见“mRNA-和蛋白质-去稳定组件用以开发高度响应性报告系统的用途(Use of mRNA-and protein-destabilizing elements to develop ahighly responsive reporter system)”，文(Voon)DC等人《核酸研究》(Nucleic AcidsResearch)2005)引入FRB(N)Cas9-NES片段中，以促进更快的降解并且因此降低分割型失活的Cas9-VP64复合物的稳定性。

对于与分割型Cas9系统一起使用而言，如在本说明书的其他地方描述的这样的去稳定序列(包括PEST)可以是有利的。

产生了稳定表达分割型失活的Cas9-VP64和MS2-p65-HSF1+指导物的细胞系。PLX抗性筛选可以证明，不可逆的定时转录激活在药物筛选中可以是有用的。当分割型失活的Cas9-VP64不可逆时，这种方法可以是有利的。

在一个方面，本发明提供了非天然存在的或工程化的Cas9 CRISPR-Cas系统，该系统可以包含至少一种开关，其中所述Cas9 CRISPR-Cas系统的活性通过与至少一种诱导物能量源(就该开关而言)接触进行控制。在本发明的一个实施例中，就至少一种开关而言的或所述Cas9 CRISPR-Cas系统的活性的控制可以被激活、增强、终止或阻遏。与至少一种诱导物能量源接触可以产生第一效应和第二效应。第一效应可以是以下项中的一者或多者：核输入、核输出、次级组分(如效应分子)的募集、(蛋白质、DNA或RNA)的构象变化、切割、负荷物(如装笼的分子或辅因子)的释放、缔合或解离。第二效应可以是以下项中的一者或多者：就至少一种开关而言的或所述Cas9 CRISPR-Cas系统的活性的控制的激活、增强、终止或阻遏。在一个实施例中，第一效应和第二效应可以一连串地发生。

在本发明的另一个方面，该Cas9 CRISPR-Cas系统可以进一步包含至少一个或多个核定位信号(NLS)、核输出信号(NES)、功能结构域、挠性接头、突变、缺失、改变或截短。这一个或多个NLS、NES或功能结构域可以被条件性地激活或失活。在另一个实施例中，该突变可以是以下项中的一者或多者：转录因子同源区中的突变、DNA结合结构域中的突变(如突变碱性螺旋环螺旋的碱性残基)、内源NLS中的突变或内源NES中的突变。本发明包括，该诱导物能量源可以是热、超声波、电磁能或化学品。在本发明的一个优选实施例中，该诱导物能量源可以是抗生素、小分子、激素、激素衍生物、类固醇或类固醇衍生物。在一个更优选的实施例中，该诱导物能量源可以是脱落酸(ABA)、多西环素(DOX)、cumate、雷帕霉素、4-羟基他莫西芬(4OHT)、雌激素或蜕皮激素。本发明提供了至少一种开关可以选自下组，该组由以下各项组成：基于抗生素的诱导型系统、基于电磁能的诱导型系统、基于小分子的诱导型系统、基于核受体的诱导系统以及基于激素的诱导型系统。在一个更优选的实施例中，该至少一种开关可以选自下组，该组由以下各项组成：四环素(Tet)/DOX诱导型系统、光诱导型系统、ABA诱导型系统、cumate阻遏因子/操纵子系统、4OHT/雌激素诱导型系统、基于蜕皮激素的诱导型系统以及FKBP12/FRAP(FKBP12-雷帕霉素复合物)诱导型系统。

如在本申请中所详述的控制方面涉及至少一种或多种开关。如在本文使用的术语“开关(switch)”是指以协调方式起作用以影响变化的系统或一组组分，涵盖生物功能的所有方面，如该功能的激活、抑制、增强或终止。在一个方面，术语开关涵盖遗传开关，这些遗传开关包含基因调节蛋白的基础组分和这些蛋白识别的特异性DNA序列。在一个方面，开关涉及在基因调节中使用的诱导型和抑制型系统。一般而言，诱导型系统可以是关闭的，除非存在允许基因表达的某种分子(称为诱导物)。该分子被说成“诱导表达”。它发生的方式取决于控制机制以及细胞类型差异。抑制型系统是开启的，除非存在抑制基因表达的某种分子(称为辅阻遏因子(corepressor))。该分子被说成“抑制表达”。它发生的方式取决于控制机制以及细胞类型差异。如在本文使用的术语“诱导型(inducible)”可以包括开关的所有方面，不论涉及的分子机制如何。因此，如由本发明所包括的开关可以包括但不限于基于抗生素的诱导型系统、基于电磁能的诱导型系统、基于小分子的诱导型系统、基于核受体的诱导系统以及基于激素的诱导型系统。在优选实施例中，该开关可以是四环素(Tet)/DOX诱导型系统、光诱导型系统、脱落酸(ABA)诱导型系统、cumate阻遏因子/操纵子系统、4OHT/雌激素诱导型系统、基于蜕皮激素的诱导型系统或FKBP12/FRAP(FKBP12-雷帕霉素复合物)诱导型系统。

本发明的Cas9 CRISPR-Cas系统可以被设计成以时间和空间精确方式调节或改变单独内源基因的表达。该Cas9 CRISPR-Cas系统可以被设计成与感兴趣的基因的启动子序列结合以改变基因表达。该Cas9可以被一分为二，其中一半融合至隐花色素异二聚体(隐花色素-2或CIB1)的一半，同时剩余的隐花色素配偶体融合至Cas9的另一半。在一些方面，转录效应结构域也可以被包括在Cas9 CRISPR-Cas系统中。效应子结构域可以是激活因子(如VP16、VP64或p65)或阻遏因子(如KRAB、EnR或SID)。在未刺激状态下，一半Cas9-隐花色素2蛋白定位至感兴趣的基因的启动子，但是不结合至该CIB1-效应蛋白。在用蓝色光谱的光刺激后，隐花色素-2被激活，经历构象变化并且露出其结合结构域。CIB1进而结合至隐花色素-2，从而使Cas9的第二个一半定位至感兴趣的基因的启动子区并且启动基因组编辑，这可以引起基因过表达或沉默。LITE的方面进一步描述于刘(Liu)，H等人，《科学》(Science)，2008和肯尼迪(Kennedy)M等人，《自然方法》(Nature Methods)2010中，将其内容通过引用以其全文并入本文。

可以在物种、强度、机制、持续时间、尺寸或任何数量的其他参数的基础上选择可以进一步调节功能的激活因子和阻遏因子结构域。优选的效应子结构域包括但不限于转座酶结构域、整合酶结构域、重组酶结构域、解离酶结构域、转化酶结构域、蛋白酶结构域、DNA甲基转移酶结构域、DNA脱甲基酶结构域、组蛋白乙酰酶结构域、组蛋白脱乙酰酶结构域、核酸酶结构域、阻遏因子结构域、激活因子结构域、核定位信号结构域、转录蛋白募集结构域、细胞摄取活性相关结构域、核酸结合结构域或抗体呈递结构域。

也存在若干不同方式来产生化学诱导型系统：1.可通过脱落酸(ABA)诱导的基于ABI-PYL的系统(参见例如网址stke.sciencemag.org/cgi/content/abstract/sigtrans；4/164/rs2)，2.可通过雷帕霉素(或基于雷帕霉素的相关化学品)诱导的基于FKBP-FRB的系统(参见例如网址nature.com/nmeth/journal/v2/n6/full/nmeth763.html)，3.可通过赤霉素(GA)诱导的基于GID1-GAI的系统(参见例如网址nature.com/nchembio/journal/v8/n5/full/nchembio.922.html)。

由本发明所考虑的另一种系统是基于亚细胞定位变化的化学诱导型系统。申请人还包括被工程化为靶向感兴趣的基因组座位的诱导型Cas9 CRISPR-Cas系统，其中该Cas9酶被分成两个融合构建体，所述构建体被进一步连接至化学或能量敏感型蛋白的不同部分。当化学或能量传递物与该化学或能量敏感型蛋白结合时，这种化学或能量敏感型蛋白将导致Cas9酶的任一半的亚细胞定位变化(即将Cas9酶的任一半从细胞质运输到细胞的细胞核)。融合构建体从一个亚细胞区室或细胞器(在其中由于缺乏重构的Cas9CRISPR-Cas系统的底物，其活性被封存)向另一个亚细胞区室或细胞器(在其中存在该底物)的这种运输允许这些组分聚集在一起并且重构功能活性并且然后与其希望的底物(即哺乳动物细胞核中的基因组DNA)相接触并且导致靶基因表达的激活或阻遏。

考虑了其他诱导型系统，如但不限于通过以下项进行调节：重金属[梅奥(Mayo)KE等人，《细胞》(Cell)1982，29:99-108；塞尔(Searle)PF等人，《分子细胞生物学》(Mol CellBiol)1985，5:1480-1489和布尔斯特(Brinster)RL等人，《自然》(Nature)(伦敦)1982，296:39-42]，类固醇激素[海因斯(Hynes)NE等人，《美国国家科学院院刊》(Proc Natl Acad SciUSA)1981，78:2038-2042；克罗克(Klock)G等人，《自然》(伦敦)1987，329:734-736和李(Lee)F等人，《自然》(伦敦)1981，294:228-232]，热休克[努尔(Nouer)L：热休克反应(HeatShock Response).博卡拉顿，佛罗里达州：CRC；1991]以及其他已经开发的试剂[穆立克(Mullick)A、马西(Massie)B：基因表达的转录、翻译和控制(Transcription,translationand the control of gene expression)。在由斯皮尔(Speir)RE.编辑的细胞技术百科全书(Encyclopedia of Cell Technology)中，威利出版社(Wiley)；2000:1140-1164和富塞内格尔(Fussenegger)M，.《生物技术进展》(Biotechnol Prog)2001，17:1-51]。然而，这些诱导型哺乳动物启动子存在局限，如诱导物(热休克、重金属、糖皮质激素等)的“关闭”状态的“泄漏(leakiness)”和多效效应。已经提出了昆虫激素(蜕皮激素)在减少哺乳动物细胞中的细胞过程干扰的尝试中的用途[努(No)D等人，《美国国家科学院院刊》(Proc NatlAcad Sci USA)1996，93:3346-3351]。另一种极好的系统使用雷帕霉素作为诱导物[里维拉(Rivera)VM等人，《自然医学》(Nat Med)1996，2:1028-1032]，但是雷帕霉素作为免疫抑制剂的作用将其用途主要局限于体内并且因此必须找到用于控制基因表达的生物惰性化合物[赛斯(Saez)E等人，《美国国家科学院院刊》(Proc Natl Acad Sci USA)2000，97:14512-14517]。

还参见关于诱导型系统的以下章节。

去稳定化的酶：具有去稳定结构域或与其缔合的根据本发明的酶

在一个方面，本发明提供了与至少一个去稳定结构域(DD)缔合的非天然存在的或工程化的CRISPR酶，优选2类CRISPR酶，优选如本文描述的V型或VI型CRISPR酶，如优选地但不限于如在本文的其他地方描述的Cas9；并且，出于简写的目的，与至少一个去稳定结构域(DD)缔合的这样一种非天然存在的或工程化的CRISPR酶在本文被称为“DD-CRISPR酶”。应理解的是，如在本文的其他地方描述的根据本发明的任何CRISPR酶都可以用作具有如在下文描述的去稳定化结构域或者与其缔合。如在本文的其他地方描述的任何方法、产品、组合物和用途都同样适用于如下文进一步详述的与去稳定化结构域缔合的CRISPR酶。

通过进一步指导的方式，提供了以下具体方面和实施例。

当如在本章节中描述的方面和实施例涉及DD-CRISPR酶、DD-Cas、DD-Cas9Cas9、DD-CRISPR-Cas或DD-CRISPR-Cas9系统或复合物时，没有前缀“DD”的术语“CRISPR”、“Cas”、“Cas9”、“CRISPR系统”、“CRISPR复合物”、“CRISPR-Cas”、“CRISPR-Cas9”等可以被视为具有前缀DD，尤其是当该背景允许这样，使得就DD实施例阅读本披露时。因此，在一个方面，本发明提供了用于使用CRISPR系统(其可以被读为DD-CRISPR系统和/或CRISPR系统)的一种或多种组件的方法。本发明的CRISPR复合物提供了用于修饰靶多核苷酸的有效手段。本发明的CRISPR复合物具有多种多样的实用性，包括修饰(例如，缺失、插入、转位、失活、激活)多种细胞类型中的靶多核苷酸。正因为如此，本发明的CRISPR复合物在例如基因疗法、药物筛选、疾病诊断以及预后中具有广阔的应用谱。

在一个方面，本发明提供了工程化的、非天然存在的DD-CRISPR-Cas系统，该系统包含DD-CRISPR酶(例如像DD-CRISPR酶)，其中该CRISPR酶是Cas蛋白(在本文称为“DD-Cas蛋白”，即术语如“DD-CRISPR-Cas9复合物”之前的“DD”意指具有Cas9蛋白的CRISPR-Cas9复合物，该Cas9蛋白具有至少一个与其缔合的去稳定结构域)，有利地是DD-Cas蛋白，例如与至少一个去稳定结构域缔合的Cas9蛋白(在本文称为“DD-Cas9蛋白”)，以及靶向核酸分子(如DNA分子)的指导RNA，由此该指导RNA靶向该核酸分子(例如，DNA分子)。该核酸分子(例如，DNA分子)可以编码基因产物。在一些实施例中，该DD-Cas蛋白可以切割编码该基因产物的DNA分子。在一些实施例中，改变该基因产物的表达。该Cas蛋白和该指导RNA并不天然地一起存在。本发明包括包含(任选地，在适用情况下)融合到tracr序列上的指导序列的指导RNA。本发明进一步包括编码经密码子优化以便在真核细胞中表达的Cas蛋白。在一个优选实施例中，该真核细胞是哺乳动物细胞，并且在一个更优选的实施例中，该哺乳动物细胞是人类细胞。该基因产物的表达可以被降低。该CRISPR酶可以构成CRISPR-Cas系统的一部分，该系统进一步包含指导RNA(gRNA)，该指导RNA包含能够杂交到细胞中的感兴趣的基因组座位中的靶序列上的指导序列。在一些实施例中，该功能性CRISPR-Cas系统结合至该靶序列。在一些实施例中，该功能性CRISPR-Cas系统可以编辑该靶序列，例如该靶序列可以包括基因组座位，并且在一些实施例中，可以存在基因表达的改变。在一些实施例中，该功能性CRISPR-Cas系统可以进一步包括功能结构域。在一些实施例中，本发明提供了用于改变或修饰基因产物表达的方法。该方法可以包括引入含有靶核酸(例如，DNA分子)、或含有和表达靶核酸(例如，DNA分子)的细胞中；例如，该靶核酸可以编码基因产物或提供基因产物(例如，调节序列)的表达。

在一些实施例中，该DD-CRISPR酶是DD-Cas9。在一些实施例中，该DD-CRISPR酶是V-A亚型或V-B亚型CRISPR酶。在一些实施例中，该DD-CRISPR酶是Cas9。在一些实施例中，该DD-CRISPR酶是As DD-Cas9。在一些实施例中，该CRISPR酶是Lb DD-Cas9。在一些实施例中，该DD-CRISPR酶切割DNA的两条链，以产生双链断裂(DSB)。在一些实施例中，该DD-CRISPR酶是切口酶。在一些实施例中，该DD-CRISPR酶是双切口酶。在一些实施例中，该DD-CRISPR酶是失活的Cas9，例如与野生型Cas9或不具有对它的突变的Cas9相比，基本上没有核酸酶活性，例如具有不超过5％的核酸酶活性的Cas9。适合的Cas9突变描述在本文的其他地方，并且包括例如D917A、E1006A、E1028A、D1227A、D1255A、N1257A、D917A、E1006A、E1028A、D1227A、D1255A以及N1257A，参考FnCas9p RuvC结构域中的氨基酸位置；或例如N580A、N584A、T587A、W609A、D610A、K613A、E614A、D616A、K624A、D625A、K627A以及Y629A，参考如在本文的其他地方描述的推定第二核酸酶结构域。

在一些通用实施例中，该DD-CRISPR酶与一个或多个功能结构域相缔合。在一些更具体的实施例中，该DD-CRISPR酶是失活的Cas9和/或与一个或多个功能结构域相缔合。在一些实施例中，该DD-CRISPR酶包括例如α-螺旋或混合型α/β二级结构的截短。在一些实施例中，截短包括去除或用接头置换。在一些实施例中，该接头是分支的或以其他方式允许束缚DD和/或功能结构域。在一些实施例中，该CRISPR酶通过融合蛋白与该DD相缔合。在一些实施例中，该CRISPR酶融合至该DD。换言之，该DD可以通过与所述CRISPR酶融合而与该CRISPR酶相缔合。在一些实施例中，该酶可以被认为是经修饰的CRISPR酶，其中该CRISPR酶融合到至少一个去稳定结构域(DD)。在一些实施例中，该DD可以经由连接蛋白与该CRISPR酶缔合，例如使用如标记系统(如链霉亲和素-生物素系统)的系统。因此，提供了CRISPR酶与对该连接物的高亲和力配体具有特异性的连接蛋白的融合，而该DD被结合到所述高亲和力配体。例如，链霉亲和素可以是融合到CRISPR酶上的连接物，同时生物素可以被结合到该DD上。共定位后，链霉亲和素将结合至生物素，因此将该CRISPR酶连接至该DD。为了简单起见，该CRISPR酶和该DD的融合在一些实施例中是优选的。在一些实施例中，该融合包括在该DD与该CRISPR酶之间的接头。在一些实施例中，该融合可以是到CRISPR酶的N-末端。在一些实施例中，至少一个DD融合至CRISPR酶的N-末端。在一些实施例中，该融合可以是到CRISPR酶的C-末端。在一些实施例中，至少一个DD融合至CRISPR酶的C-末端。在一些实施例中，一个DD可以融合至CRISPR酶的N-末端，并且另一个DD融合至CRISPR酶的C-末端。在一些实施例中，该CRISPR酶与至少两个DD相缔合，并且其中第一DD融合至CRISPR酶的N-末端并且第二DD融合至CRISPR酶的C-末端，第一和第二DD是相同的或不同的。在一些实施例中，该融合可以是到DD的N-末端。在一些实施例中，该融合可以是到DD的C-末端。在一些实施例中，该融合可以在CRISPR酶的C-末端与DD的N-末端之间。在一些实施例中，该融合可以在DD的C-末端与CRISPR酶的N-末端之间。相比于包含至少一种C末端融合的DD，包含至少一种N-末端融合的DD观察到更少的背景。将N-末端和C-末端融合组合具有最少的背景，但是整体活性最低。有利地，通过至少一种N-末端融合或至少一种N末端融合加至少一种C-末端融合来提供DD。并且当然，可以通过至少一种C-末端融合来提供DD。

在某些实施例中，蛋白去稳定化结构域(如用于诱导型调节)可以融合至例如Cas9的N-末端和/或C-末端。此外，去稳定化结构域可以被引入例如Cas9的一级序列的溶剂暴露环中。Cas9核酸酶一级结构的计算分析揭示了三个不同区域。第一个是C-末端RuvC样结构域，其是唯一的菜单征结构域。第二个是N-末端α-螺旋区域并且第三个是混合α和β区，其位于RuvC样结构域与α-螺旋区之间。在Cas9一级结构内预测出若干小段的非结构化区域。被暴露于溶剂并且在不同Cas9直向同源物内不保守的非结构化区域是小蛋白序列的优选分割和插入侧。此外，这些侧可以用于在Cas9直向同源物之间产生嵌合蛋白。

在一些实施例中，该DD是ER50。在一些实施例中，这个DD的对应稳定化配体是4HT。因此，在一些实施例中，这至少一个DD之一是ER50并且其稳定化配体是4HT或CMP8。在一些实施例中，该DD是DHFR50。在一些实施例中，这个DD的对应稳定化配体是TMP。因此，在一些实施例中，这至少一个DD之一是DHFR50并且其稳定化配体是TMP。在一些实施例中，该DD是ER50。在一些实施例中，这个DD的对应稳定化配体是CMP8。因此，在ER50系统中，CMP8可以是4HT的替代稳定化配体。虽然也许有可能的是CMP8和4HT可以/应该以竞争性方式使用，但是一些细胞类型可能对这两种配体中的一者或另一者更加敏感，并且根据本披露和本领域的知识，熟练人员可以使用CMP8和/或4HT。

在一些实施例中，一个或两个DD可以融合至CRISPR酶的N-末端，并且一个或两个DD融合至CRISPR酶的C-末端。在一些实施例中，这至少两个DD与该CRISPR酶相缔合并且这些DD是相同的DD，即这些DD是同源的。因此，这些DD中的两个(或两个或更多个)可以是ER50DD。在一些实施例中这是优选的。可替代地，这些DD中的两个(或两个或更多个)可以是DHFR50DD。在一些实施例中这也是优选的。在一些实施例中，这至少两个DD与该CRISPR酶相缔合并且这些DD是不同的DD，即这些DD是异源的。因此，这些DD之一可以是ER50，同时这些DD中的一个或多个或任何其他DD可以是DHFR50。具有两个或更多个异源的DD可以是有利的，因为它将提供更高水平的降解控制。N末端或C-末端处的多于一个DD的串联融合可以增强降解；并且这样一种串联融合可以是例如ER50-ER50-Cas9或DHFR-DHFR-Cas9。设想的是高水平的降解将在不存在任一种稳定化配体的情况下发生，中间水平的降解将在不存在一种稳定化配体并且存在其他(或另一种)稳定化配体的情况下发生，而低水平的降解将在存在两种(或两种或更多种)稳定化配体的情况下发生。还可以通过具有N-末端ER50DD和C-末端DHFR50DD来进行控制。

在一些实施例中，该CRISPR酶与该DD的融合包括在该DD与该CRISPR酶之间的接头。在一些实施例中，该接头是GlySer接头。在一些实施例中，该DD-CRISPR酶进一步包括至少一个核输出信号(NES)。在一些实施例中，该DD-CRISPR酶包括两个或更多个NES。在一些实施例中，该DD-CRISPR酶包括至少一个核定位信号(NLS)。这可以是除了NES外还有的。在一些实施例中，该CRISPR酶包括作为该CRISPR酶与该DD之间的接头的、或作为其一部分的定位(核输入或输出)信号或基本上由其组成或由其组成。HA或Flag标签作为接头也落入本发明的范围内。申请人使用NLS和/或NES作为接头并且还使用高达(GGGGS)₃的甘氨酸丝氨酸接头作为GS。

在一个方面，本发明提供了编码该CRISPR酶和缔合DD的多核苷酸。在一些实施例中，所编码的CRISPR酶和缔合DD有效作地连接到第一调节组件。在一些实施例中，DD也被编码并且有效作地连接至第二调节组件。有利地，这里的DD将要“肃清(mop up)”稳定化配体并且所以它有利地是和与该酶(例如，如本文讨论的)缔合的DD相同的DD(即，相同类型的结构域)(其中应理解的是，术语“肃清”意为如在本文讨论的并且还可以传达执行以便有助于或终止活性)。通过用过量的不与该CRISPR酶缔合的DD肃清稳定化配体，将看到该CRISPR酶的更多降解。不受理论束缚，设想的是随着添加另外的或过量的非缔合DD，平衡将从稳定化配体复合或结合远离向与CRISPR酶缔合的DD移动，并且反而将更多的稳定化配体复合或结合朝向游离DD(即，不与CRISPR酶缔合的DD)移动。因此，当希望通过CRISPR酶的增加的降解来降低CRISPR酶活性时，提供过量的或另外的非缔合(或游离)DD是优选的。过量的游离DD将结合残余配体并且还将所结合的配体从DD-Cas融合物带走。因此，它促进DD-Cas降解并且增强Cas活性的时间控制。在一些实施例中，该第一调节组件是启动子并且可以任选地包括增强子。在一些实施例中，该第二调节组件是启动子并且可以任选地包括增强子。在一些实施例中，该第一调节组件是早期启动子。在一些实施例中，该第二调节组件是晚期启动子。在一些实施例中，该第二调节组件是或包含诱导型控制组件(任选地是tet系统)或阻遏型控制组件(任选地是tetr系统)或基本上由其组组成。诱导型启动子可以是有利的(例如rTTA)，以便在多西环素的存在下诱导tet。

附接或缔合可以经由接头，例如挠性甘氨酸-丝氨酸(GlyGlyGlySer)或(GGGS)₃，或者刚性α-螺旋接头如(Ala(GluAlaAlaAlaLys)Ala)。优选在本文中使用接头(如(GGGGS)₃)，以将蛋白质或肽结构域分开。(GGGGS)₃是优选的，因为是相对较长的接头(15个氨基酸)。甘氨酸残基最具挠性并且丝氨酸残基提高了接头在蛋白质外的机会。(GGGGS)₆、(GGGGS)₉或(GGGGS)₁₂可以优选用作替代物。其他优选的替代物是(GGGGS)₁、(GGGGS)₂、(GGGGS)₄、(GGGGS)₅、(GGGGS)₇、(GGGGS)₈、(GGGGS)₁₀或(GGGGS)₁₁。替代接头是可获得的，但是高度挠性接头被认为最佳地起作用，以允许有最大机会将Cas的2部分聚在一起并且因此重构Cas活性。一种替代方案是核质蛋白的NLS可以用作接头。例如，接头还可以用在Cas与任何功能结构域之间。再一次，这里可以使用(GGGGS)₃接头(或其6、9或12个重复形式)，或者核质蛋白的NLS可以用作Cas与功能结构域之间的接头。

在一个方面，本发明提供了用于递送本发明的DD-CRISPR-Cas复合物或本文讨论的多核苷酸的手段，例如递送该复合物的一种或多种组分的一种或多种粒子、包含本文讨论的一种或多种多核苷酸的一种或多种载体(例如，编码CRISPR酶、DD；提供CRISPR-Cas复合物的RNA)。在一些实施例中，该载体可以是质粒或病毒载体(如AAV或慢病毒)。用质粒瞬时转染进例如HEK细胞中可以是有利的，尤其是考虑到AAV的尺寸限制，并且在将Cas9装配进AAV中时用另外的编码(就与一个或多个DD的缔合而言)的情况下AAV可以达到上限。

还提供了组成性地表达CRISPR酶和缔合DD的模型。该生物可以是转基因的，并且可以已经用本发明载体转染或者可以是这样转染的生物的后代。在一个另外的方面，本发明提供了组合物，这些组合物包含本文描述的CRISPR酶和缔合DD或多核苷酸或载体。还提供了包含指导RNA的CRISPR-Cas系统。

还提供了治疗受试者(例如，对其有需要的受试者)的方法，该方法包括通过用编码系统的多核苷酸或本发明的任何载体转化该受试者而诱导基因编辑并且向该受试者给予稳定化配体。还可以提供适合的修复模板，例如通过包含所述修复模板的载体递送该修复模板。还提供了治疗受试者(例如，对其有需要的受试者)的方法，该方法包括通过用编码本发明的系统的多核苷酸或本发明的任何载体转化该受试者而诱导转录激活或阻遏，其中所述多核苷酸或载体编码或包含无催化活性的CRISPR酶和一个或多个缔合功能结构域；该方法进一步包括向该受试者给予稳定化配体。这些方法还可以包括向该受试者递送过量DD和/或表达过量DD。在任何处理离体地(例如在细胞培养物中)发生的情况下，则应当理解的是，术语‘受试者’可以由短语“细胞或细胞培养物”替换。

还提供了用于在所述治疗方法中使用的包含本发明的系统的组合物。单独的组合物可以包含稳定化配体。可以提供包括这样的组合物的药盒。还提供了本发明的系统在用于这样的治疗方法的药剂的制造中的用途。本发明还提供了本发明系统在筛选(例如，功能获得筛选)中的用途。人为地强行过表达基因的细胞能够例如通过负反馈回路随时间下调该基因(重建平衡)。到筛选开始的时候，未经调节的基因可能再次被减少。使用诱导型Cas9激活因子允许正好在筛选之前诱导转录并且因此使假阴性命中的机会最小化。因此，通过在筛选(例如，功能获得筛选)中使用本发明，可以使假阴性结果的机会最小化。

在一个方面，本发明提供了工程化的、非天然存在的CRISPR-Cas系统，该系统包含DD-Cas蛋白和靶向在细胞中编码基因产物的DNA分子的指导RNA，由此该指导RNA靶向编码该基因产物的DNA分子，并且该Cas蛋白切割编码该基因产物的DNA分子，由此改变该基因产物的表达；并且，其中该Cas蛋白和该指导RNA并不天然地一起存在。本发明包括含有融合到tracr序列上的指导序列的指导RNA。在本发明的一个实施例中，该Cas蛋白是Cas9蛋白。本发明进一步包括编码经密码子优化以便在真核细胞中表达的Cas蛋白。在一个优选实施例中，该真核细胞是哺乳动物细胞，并且在一个更优选的实施例中，该哺乳动物细胞是人类细胞。在本发明的一个另外的实施例中，该基因产物的表达被降低。

在功能性结构域等与酶的一部分或其他部分缔合的情况下，这些是典型的融合物。这里相对于一个分子如何与另一个分子‘缔合’，例如在CRISPR酶的部分与功能结构域之间，使用术语“与...缔合”。这两者可以被认为束缚至彼此。在这样的蛋白质-蛋白质相互作用的情况下，可以按抗体识别表位的方式就识别而论看待这种缔合。可替代地，一种蛋白可以经由这两种蛋白的融合物与另一蛋白缔合，例如一个亚基融合至另一亚基。融合典型地通过将一种蛋白的氨基酸序列添加至另一蛋白的氨基酸序列上而发生，例如经由一起剪接编码每种蛋白或亚基的核苷酸序列。可替代地，这基本上可以被视为两个分子之间的结合或直接连接，如融合蛋白。在任何情况下，融合蛋白可以在感兴趣的两个亚基之间(例如酶与功能结构域之间或衔接蛋白与功能结构域之间)包括接头。因此，在一些实施例中，CRISPR酶的部分通过结合至其上而与功能结构域缔合。在其他实施例中，CRISPR酶任选地经由接头而与功能结构域缔合，因为这两者被融合到一起。接头的实例包括本文讨论的GlySer接头。虽然非共价结合的DD可能能够启动缔合Cas(例如Cas9)的降解，但是蛋白酶体降解涉及蛋白链的解旋；并且，融合是优选的，因为它可以保证在降解时DD仍连接到Cas。然而，在对DD具有特异性的稳定化配体的存在下使该CRISPR酶和该DD聚到一起，形成稳定复合物。这种复合物包含结合到该DD的稳定化配体。该复合物还包含与该CRISPR酶缔合的DD。在不存在所述稳定化配体的情况下，DD及其缔合CRISPR酶的降解是受促进的。

去稳定化结构域具有普遍实用性以便为范围广泛的蛋白质赋予不稳定性；参见例如，宫崎(Miyazaki)，《化学学会杂志》(J Am Chem Soc.)2012年3月7日；134(9):3942-3945，通过引用并入本文。CMP8或4-羟基他莫昔芬可以是去稳定化结构域。更一般地说，发现哺乳动物DHFR(DHFRt)(遵循N端法则的去稳定化残基)的温度敏感型突变体在容许温度下是稳定的，但是在37℃下是不稳定的。向表达DHFRt的细胞中添加甲氨蝶呤(一种哺乳动物DHFR高亲和力配体)部分地抑制该蛋白质的降解。这是重要的证明，即小分子配体可以稳定以其他方式在细胞中被靶向而降解的蛋白质。使用雷帕霉素衍生物来稳定mTOR的FRB结构域的不稳定突变体(FRB*)并且恢复融合的激酶GSK-3β的功能。6,7这个系统证明配体依赖性稳定性代表用于调节复杂的生物环境中的特异性蛋白的功能的有吸引力的策略。当通过雷帕霉素诱导的FK506结合蛋白和FKBP12的二聚化而发生泛素补偿时，用于控制蛋白质活性的系统可以涉及变得具有功能性的DD。人类FKBP12或ecDHFR蛋白的突变体可以被工程化为分别在不存在它们的高亲和力配体Shield-1或甲氧苄啶(TMP)的情况下在代谢上是不稳定的。这些突变体是在本发明的实践中有用的可能去稳定化结构域(DD)中的一些并且作为与CRISPR酶的融合的DD的不稳定性赋予整个融合蛋白被蛋白酶体进行CRISPR蛋白降解。Shield-1和TMP以剂量依赖性方式结合至DD并且稳定该DD。雌激素受体配体结合结构域(ERLBD，ERS1的残基305-549)也可以被工程化为去稳定化结构域。由于雌激素受体信号传导途径牵涉在多种疾病(如乳腺癌)中，所以该途径已经得到广泛研究并且已经开发了雌激素受体的许多激动剂和拮抗剂。因此，ERLBD和药物的兼容对是已知的。存在结合至ERLBD的突变体但是不结合其野生型形式的配体。通过使用编码三个突变(L384M、M421G、G521R)12的这些突变型结构域之一，有可能的是使用不扰乱内源雌激素敏感性网络的配体调节ERLBD衍生的DD的稳定性。可以引入另外的突变(Y537S)，以进一步使ERLBD去稳定并且将它配置为潜在的DD候选物。这种四突变体是有利的DD发展。突变型ERLBD可以融合至CRISPR酶并且可以使用配体调节或扰乱其稳定性，由此该CRISPR酶具有DD。另一种DD可以是由Shield1配体稳定的、基于经突变的FKBP蛋白的12-kDa(107-氨基酸)标签；参见例如，《自然方法》(Nature Methods)5，(2008)。例如，DD可以是经修饰的FK506结合蛋白12(FKBP12)，其结合至合成的、生物惰性小分子Shield-1并且被Shield-1可逆地稳定；参见例如，巴那金斯基(Banaszynski)LA、陈(Chen)LC、梅纳德-史密斯(Maynard-Smith)LA、黄(Ooi)AG、万德赖斯(Wandless)TJ.使用合成小分子调节活细胞中的蛋白质功能的快速、可逆且可调的方法(A rapid,reversible,and tunable method to regulate protein function in livingcells using synthetic small molecules).《细胞》(Cell).2006；126:995-1004；巴那金斯基LA、塞尔美雅(Sellmyer)MA、康塔格(Contag)CH、万德赖斯TJ、索恩(Thorne)SH.活小鼠中的蛋白质稳定性和功能的化学控制(Chemical control of protein stability andfunction in living mice).《自然医学》(Nat Med.)2008；14:1123-1127；梅纳德-史密斯LA、陈LC、巴那金斯基LA、黄AG、万德赖斯TJ.用于使用生物沉默小分子工程化条件型蛋白质稳定性的直接方法(A directed approach for engineering conditional proteinstability using biologically silent small molecules).《生物化学杂志》(TheJournal of biological chemistry).2007；282:24866-24872；以及罗德里格斯(Rodriguez)，《生物化学》(Chem Biol.)2012年3月23日；19(3):391-398—将其全部通过引用并入本文，并且可以用在本发明的实践中，在选择有待与本发明的实践中的CRISPR酶缔合的DD中。如可以看到的，本领域中的知识包括多种DD，并且DD可以与CRISPR酶相缔合(例如，融合到其上，有利地通过接头)，由此该DD在配体的存在下可以被稳定并且当不存在该配体时该DD可以被去稳定，由此该CRISPR酶被完全去稳定，或者该DD在不存在配体下可以被稳定并且当存在该配体时该DD可以被去稳定；该DD允许调节或控制—打个譬喻说，启动或关闭—该CRISPR酶并且因此调节或控制CRISPR-Cas复合物或系统，以由此提供用于例如在体内或体外环境中调节或控制该系统的手段。例如，当感兴趣的蛋白质作为与DD标签的融合表达时，它被去稳定并且在细胞中例如被蛋白酶体迅速降解。因此，不存在稳定化配体导致D缔合的Cas被降解。当新的DD融合至感兴趣的蛋白质时，其不稳定性被赋予给该感兴趣的蛋白质，从而使得整个融合蛋白被快速降解。Cas的峰活性对于减少脱靶效应而言有时是有益的。因此，短突发的高活性是优选的。本发明能够提供这样的峰值。从一些意义上来说，该系统是可诱导的。从一些其他意义上来说，该系统在不存在稳定化配体下被阻遏，并且在存在稳定化配体下被去阻遏。不希望受任何理论束缚并且未做出任何承诺，本发明的其他益处可以包括，它是：

●可定量的(dosable)(与启动或关闭例如可允许可变的CRISPR-Cas系统或复合物活性的系统相反)。

●正交的，例如配体仅影响其同源DD，所以可以独立地操作两种或更多种系统，和/或这些CRISPR酶可以来自一种或多种直向同源物。

●可移植的，例如可以在不同细胞类型或细胞系中工作。

●快速的。

●时间受控的。

●通过允许Cas被降解而能够减少背景或脱靶Cas或Cas毒性或Cas的过量累积。

虽然DD可以在CRISPR酶的N末端和/或C末端(包括在分割(如在本文的其他地方所定义的)的一侧或多侧的DD)，但是例如，Cas9(N)-接头-DD-接头-Cas9(C)也是引入DD的方式。在一些实施例中，如果仅使用DD至有待使用的CRISPR酶的一个末端缔合，则优选的是使用ER50作为DD。在一些实施例中，如果使用N-末端和C-末端两者，则ER50和/或DHFR50任一者的使用是优选的。通过N-末端融合看到了特别好的结果，这是出人意料的。具有N末端和C末端融合两者可以是协同性的。去稳定结构域的尺寸不同，但是在尺寸上典型地是大约100-300个氨基酸。DD优选地是工程化的去稳定化蛋白质结构域。DD以及例如从高亲和力配体及其配体结合结构域制备DD的方法。本发明可以被认为是“正交的”，因为仅有特异性配体将稳定其对应的(同源)DD，它对非同源DD的稳定性没有影响。可商购的DD系统是CloneTech公司的ProteoTuner^TM系统；稳定化配体是Shield1。

在一些实施例中，稳定化配体是‘小分子’。在一些实施例中，稳定化配体是可穿透细胞的。它对其相对应的DD具有高亲和力。适合的DD-稳定化配体对在本领域是已知的。一般而言，稳定化配体可以通过以下方式去除：

●天然加工(例如，蛋白酶体降解)，例如在体内；

●肃清，例如离体/细胞培养，通过：

o提供优选的结合配偶体；或者

o提供XS底物(DD而没有Cas)，

在另一个方面，本发明提供了工程化的、非天然存在的载体系统，该载体系统包含一种或多种载体，这一种或多种载体包含第一调节组件以及第二调节组件，该第一调节组件有效作地连接至CRISPR-Cas系统的指导RNA，该指导RNA靶向编码基因产物的DNA分子，该第二调节组件有效作地连接编码DD-Cas蛋白；组分(a)和(b)可以位于该系统的相同或不同载体上。该指导RNA靶向在细胞中编码该基因产物的DNA分子，并且该DD-Cas蛋白可以切割编码该基因产物的DNA分子(它可以切割一条链或两条链或者基本上没有核酸酶活性)，由此改变该基因产物的表达；并且，其中该DD-Cas蛋白和该指导RNA并不天然地一起存在。在本发明的一个实施例中，该DD-Cas蛋白是DD-Cas9蛋白。本发明进一步包括编码经密码子优化以便在真核细胞中表达的DD-Cas蛋白。在一个优选实施例中，该真核细胞是哺乳动物细胞，并且在一个更优选的实施例中，该哺乳动物细胞是人类细胞。在本发明的一个另外的实施例中，该基因产物的表达被降低。

在一个方面，本发明提供了包含一种或多种载体的载体系统。在一些实施例中，该系统包含：(a)第一调节组件，该第一调节组件有效作地连接到同向重复序列和一个或多个插入位点，这一个或多个插入位点用于在该同向重复序列的上游或下游(以适用者为准)插入一个或多个指导序列，其中在表达时，该指导序列引导DD-CRISPR复合物与真核细胞中的靶序列的序列特异性结合，其中该CRISPR复合物包含DD-CRISPR酶，该酶与杂交到该靶序列上的指导序列复合；和(b)第二调节组件，该第二调节组件有效作地连接至编码所述DD-CRISPR酶的酶编码序列，该DD-CRISPR酶包括至少一个核定位序列和/或至少一个NES；其中组分(a)和(b)位于该系统的相同或不同载体上。在适用的情况下，还可以提供tracr序列。在一些实施例中，组分(a)进一步包括有效作地连接到该第一调节组件的两个或更多个指导序列，其中当表达时，这两个或更多个指导序列中的每者都引导DD-CRISPR复合物与真核细胞中的不同靶序列的序列特异性结合。在一些实施例中，该DD-CRISPR复合物包括一个或多个核定位序列和/或一个或多个NES，其具有足够强度来在真核细胞的细胞核中或细胞核外驱动所述CRISPR复合物以可检测的量积聚。不希望受理论束缚，认为核定位序列和/或NES对于真核生物中的DD-CRISPR复合物活性不是必要的，但包括此类序列增强该系统的活性，尤其对于靶向细胞核中的核酸分子和/或在细胞核中存在分子而言。在一些实施例中，该DD-CRISPR酶是DD-Cas9。在一些实施例中，该DD-CRISPR酶是DD-Cas9酶。在一些实施例中，该DD-Cas9酶衍生自土拉热弗朗西丝菌1、土拉热弗朗西丝菌新凶手亚种、易北河普氏菌、毛螺菌科细菌MC2017 1、分解蛋白丁酸弧菌、Peregrinibacteria细菌GW2011_GWA2_33_10、Parcubacteria细菌GW2011_GWC2_44_17、密斯氏菌属SCADC、氨基酸球菌属BV3L6、毛螺菌科细菌MA2020、Candidatus Methanoplasma termitum、挑剔真杆菌、牛莫拉氏菌237、稻田钩端螺旋体、毛螺菌科细菌ND2006、狗口腔卟啉单胞菌3、狄氏普氏菌、或猕猴卟啉单胞菌Cas9(例如这些生物之一的被修饰成具有至少一个DD或与其缔合的Cas9)，并且可以包括另外的突变或改变或者可以是嵌合Cas9。该酶可以是DD-Cas9同系物或直向同源物。在一些实施例中，该DD-CRISPR酶经密码子优化以便在真核细胞中表达。在一些实施例中，该DD-CRISPR引导在该靶序列位置处的一条或两条链的切割。在一些实施例中，该DD-CRISPR酶缺少DNA链切割活性。在一些实施例中，该第一调节组件是聚合酶III启动子。在一些实施例中，该第二调节组件是聚合酶II启动子。在一些实施例中，该指导序列在长度上是至少16、17、18、19、20、25个核苷酸，或16-30个之间、或16-25个之间、或16-20个之间的核苷酸。通常，并且贯穿本说明书，术语“载体”是指一种核酸分子，它能够运送与其连接的另一种核酸分子。载体包括但不限于，单链、双链、或部分双链的核酸分子；包括一个或多个自由端、无自由端(例如，环状的)的核酸分子；包括DNA、RNA、或两者的核酸分子；以及本领域已知的其他多种多样的多核苷酸。一种类型的载体是“质粒”，其是指其中可以例如通过标准分子克隆技术插入另外的DNA片段的环状双链DNA环。另一种类型的载体是病毒载体，其中病毒衍生的DNA或RNA序列存在于用于包装进病毒(例如，逆转录病毒、复制缺陷型逆转录病毒、腺病毒、复制缺陷型腺病毒、以及腺相关病毒)的载体中。病毒载体还包含由用于转染到宿主细胞中的病毒携带的多核苷酸。某些载体(例如，具有细菌复制起点的细菌载体和附加型哺乳动物载体)能够在它们被导入的宿主细胞中自主复制。其他载体(例如，非附加型哺乳动物载体)在引入宿主细胞后整合到该宿主细胞的基因组中，并且由此与该宿主基因组一起复制。而且，某些载体能够指导它们有效连接的基因的表达。这样的载体在此被称为“表达载体”。在重组DNA技术中使用的普通表达栽体通常是质粒形式。

在一些实施例中，用一种或多种在此描述的载体瞬时地或非瞬时地转染宿主细胞。在一些实施例中，当细胞天然地出现在受试者体内时将其转染。在一些实施例中，被转染的细胞取自受试者。在一些实施例中，该细胞来源于取自受试者的细胞，如细胞系。用于组织培养的多种多样的细胞系在本领域是已知的。细胞系的实例包括但不限于，C8161、CCRF-CEM、MOLT、mIMCD-3、NHDF、HeLa-S3、Huh1、Huh4、Huh7、HUVEC、HASMC、HEKn、HEKa、MiaPaCell、Panc1、PC-3、TF1、CTLL-2、C1R、Rat6、CV1、RPTE、A10、T24、J82、A375、ARH-77、Calu1、SW480、SW620、SKOV3、SK-UT、CaCo2、P388D1、SEM-K2、WEHI-231、HB56、TIB55、Jurkat、J45.01、LRMB、Bcl-1、BC-3、IC21、DLD2、Raw264.7、NRK、NRK-52E、MRC5、MEF、Hep G2、海拉B、海拉T4、COS、COS-1、COS-6、COS-M6A、BS-C-1猴肾上皮细胞、BALB/3T3小鼠胚胎成纤维细胞、3T3Swiss、3T3-L1、132-d5人类胎儿成纤维细胞；10.1小鼠成纤维细胞、293-T、3T3、721、9L、A2780、A2780ADR、A2780cis、A172、A20、A253、A431、A-549、ALC、B16、B35、BCP-1细胞、BEAS-2B、bEnd.3、BHK-21、BR 293、BxPC3、C3H-10T1/2、C6/36、Cal-27、CHO、CHO-7、CHO-IR、CHO-K1、CHO-K2、CHO-T、CHO Dhfr-/-、COR-L23、COR-L23/CPR、COR-L23/5010、COR-L23/R23、COS-7、COV-434、CML T1、CMT、CT26、D17、DH82、DU145、DuCaP、EL4、EM2、EM3、EMT6/AR1、EMT6/AR10.0、FM3、H1299、H69、HB54、HB55、HCA2、HEK-293、海拉、Hepa1c1c7、HL-60、HMEC、HT-29、Jurkat、JY细胞、K562细胞、Ku812、KCL22、KG1、KYO1、LNCap、Ma-Mel 1-48、MC-38、MCF-7、MCF-10A、MDA-MB-231、MDA-MB-468、MDA-MB-435、MDCK II、MDCK II、MOR/0.2R、MONO-MAC 6、MTD-1A、MyEnd、NCI-H69/CPR、NCI-H69/LX10、NCI-H69/LX20、NCI-H69/LX4、NIH-3T3、NALM-1、NW-145、OPCN/OPCT细胞系、Peer、PNT-1A/PNT 2、RenCa、RIN-5F、RMA/RMAS、Saos-2细胞、Sf-9、SkBr3、T2、T-47D、T84、THP1细胞系、U373、U87、U937、VCaP、维洛(Vero)细胞、WM39、WT-49、X63、YAC-1、YAR及其转基因变种。细胞系可获得自本领域的技术人员已知的多种来源(参见例如，美国典型培养物保藏中心(American Type Culture Collection)(ATCC)(马纳萨斯(Manassus)，弗吉尼亚州))。在一些实施例中，使用用一种或多种在此描述的载体转染的细胞建立新的细胞系，该新的细胞系包括一种或多种载体来源的序列。在一些实施例中，使用用如在此描述的CRISPR系统的组分转染(如通过用一种或多种载体进行瞬时转染或用RNA进行转染)且通过CRISPR复合物的活性修饰的细胞建立新的细胞系，该新的细胞系包括以下细胞，这些细胞包含吸水但是缺少任何其他外源序列。在一些实施例中，在评估一种或多种测试化合物中使用用一种或多种在此描述的载体瞬时或非瞬时转染的细胞或来源于这样的细胞的细胞系。

在一个方面，本发明提供了包含调节组件的载体，该调节组件有效作地连接到编码DD-CRISPR酶的酶编码序列上，该DD-CRISPR酶包含一个或多个核定位序列和/或NES。在一些实施例中，所述调节组件驱动真核细胞中DD-CRISPR酶的转录，使得所述DD-CRISPR酶以可检测的量在该真核细胞的细胞核中积聚和/或被从细胞核中输出。在一些实施例中，该调节组件是聚合酶II启动子。在一些实施例中，该DD-CRISPR酶是DD-Cas9。在一些实施例中，该DD-CRISPR酶是DD-Cas9酶。在一些实施例中，该DD-Cas9酶衍生自土拉热弗朗西丝菌1、土拉热弗朗西丝菌新凶手亚种、易北河普氏菌、毛螺菌科细菌MC2017 1、分解蛋白丁酸弧菌、Peregrinibacteria细菌GW2011_GWA2_33_10、Parcubacteria细菌GW2011_GWC2_44_17、密斯氏菌属SCADC、氨基酸球菌属BV3L6、毛螺菌科细菌MA2020、Candidatus Methanoplasmatermitum、挑剔真杆菌、牛莫拉氏菌237、稻田钩端螺旋体、毛螺菌科细菌ND2006、狗口腔卟啉单胞菌3、狄氏普氏菌、或猕猴卟啉单胞菌Cas9(例如，被修饰成具有至少一个DD或与其相缔合)，并且可以包括该Cas9的另外的改变或突变，并且可以是嵌合Cas9。在一些实施例中，该DD-CRISPR酶经密码子优化以便在真核细胞中表达。在一些实施例中，该DD-CRISPR引导在该靶序列位置处的一条或两条链的切割。在一些实施例中，该DD-CRISPR酶缺少或基本上缺少DNA链切割活性(例如，与野生型酶或没有降低核酸酶活性的突变或改变的酶相比，不超过5％核酸酶活性)。

在一个方面，本发明提供了DD-CRISPR酶，该酶包括一个或多个核定位序列和/或NES，其具有足够强度来在真核细胞的细胞核中和/或细胞核外驱动所述DD-CRISPR酶以可检测的量积聚。在一些实施例中，该DD-CRISPR酶是DD-Cas9。在一些实施例中，该DD-CRISPR酶是DD-Cas9酶。在一些实施例中，该DD-Cas9酶衍生自土拉热弗朗西丝菌1、土拉热弗朗西丝菌新凶手亚种、易北河普氏菌、毛螺菌科细菌MC2017 1、分解蛋白丁酸弧菌、Peregrinibacteria细菌GW2011_GWA2_33_10、Parcubacteria细菌GW2011_GWC2_44_17、密斯氏菌属SCADC、氨基酸球菌属BV3L6、毛螺菌科细菌MA2020、Candidatus Methanoplasmatermitum、挑剔真杆菌、牛莫拉氏菌237、稻田钩端螺旋体、毛螺菌科细菌ND2006、狗口腔卟啉单胞菌3、狄氏普氏菌、或猕猴卟啉单胞菌Cas9(例如，被修饰成具有至少一个DD或与其相缔合)，并且可以包括该Cas9的另外的改变或突变，并且可以是嵌合Cas9。在一些实施例中，该DD-CRISPR酶经密码子优化以便在真核细胞中表达。在一些实施例中，该DD-CRISPR引导在该靶序列位置处的一条或两条链的切割。在一些实施例中，该DD-CRISPR酶缺少或基本上缺少DNA链切割活性(例如，与野生型酶或没有降低核酸酶活性的突变或改变的酶相比，不超过5％核酸酶活性)。

在一个方面，本发明提供了真核宿主细胞，该真核宿主细胞包含(a)第一调节组件，该第一调节组件有效作地连接到同向重复序列和一个或多个插入位点，这一个或多个插入位点用于在该同向重复序列的上游或下游(以适用者为准)插入一个或多个指导序列，其中在表达时，该指导序列引导DD-CRISPR复合物与真核细胞中的靶序列的序列特异性结合，其中该CRISPR复合物包含DD-CRISPR酶，该酶与杂交到该靶序列上的指导序列复合；和/或(b)第二调节组件，该第二调节组件有效作地连接至编码所述DD-CRISPR酶的酶编码序列，该DD-CRISPR酶包括至少一个核定位序列和/或NES。在一些实施例中，该宿主细胞包括组分(a)以及(b)。在适用的情况下，还可以提供tracr序列。在一些实施例中，组分(a)、组分(b)、或组分(a)和(b)稳定地整合到该宿主真核细胞的基因组中。在一些实施例中，组分(a)进一步包括有效作地连接到该第一调节组件的两个或更多个指导序列，其中当表达时，这两个或更多个指导序列中的每者都引导DD-CRISPR复合物与真核细胞中的不同靶序列的序列特异性结合。在一些实施例中，该DD-CRISPR酶包括一个或多个核定位序列和/或核输出序列或NES，其具有足够强度来在真核细胞的细胞核中和/或细胞核外驱动所述CRISPR酶以可检测的量积聚。在一些实施例中，该DD-CRISPR酶是Cas9。在一些实施例中，该CRISPR酶是Cas9酶。在一些实施例中，该DD-Cas9酶衍生自土拉热弗朗西丝菌1、土拉热弗朗西丝菌新凶手亚种、易北河普氏菌、毛螺菌科细菌MC2017 1、分解蛋白丁酸弧菌、Peregrinibacteria细菌GW2011_GWA2_33_10、Parcubacteria细菌GW2011_GWC2_44_17、密斯氏菌属SCADC、氨基酸球菌属BV3L6、毛螺菌科细菌MA2020、Candidatus Methanoplasma termitum、挑剔真杆菌、牛莫拉氏菌237、稻田钩端螺旋体、毛螺菌科细菌ND2006、狗口腔卟啉单胞菌3、狄氏普氏菌、或猕猴卟啉单胞菌Cas9(例如，被修饰成具有至少一个DD或与其相缔合)，并且可以包括该Cas9的另外的改变或突变，并且可以是嵌合Cas9。在一些实施例中，该DD-CRISPR酶经密码子优化以便在真核细胞中表达。在一些实施例中，该DD-CRISPR引导在该靶序列位置处的一条或两条链的切割。在一些实施例中，该DD-CRISPR酶缺少或基本上缺少DNA链切割活性(例如，与野生型酶或没有降低核酸酶活性的突变或改变的酶相比，不超过5％核酸酶活性)。在一些实施例中，该第一调节组件是聚合酶III启动子。在一些实施例中，该第二调节组件是聚合酶II启动子。在一些实施例中，该指导序列在长度上是至少16、17、18、19、20、25个核苷酸，或16-30个之间、或16-25个之间、或16-20个之间的核苷酸。在一个方面，本发明提供了非人类真核生物；优选多细胞真核生物，包含根据所描述的实施例中任一项的真核宿主细胞。在其他方面，本发明提供了真核生物；优选多细胞真核生物，包含根据所描述的实施例中任一项的真核宿主细胞。在这些方面的一些实施例中，该生物可以是动物；例如哺乳动物。另外，该生物可以是节肢动物，如昆虫。该生物也可以是植物。另外，该生物可以是真菌。

通常关于CRISPR-Cas系统的使用，提及的是文献(包括贯穿本披露引用的专利申请、专利和专利出版物)，因为本发明的实施例可以如在那些文献中的使用。一种或多种CRISPR-Cas系统(例如，单个的或多元化的)可以与作物基因组学的最新进展结合使用。这样一种或多种CRISPR-Cas系统可以用于进行有效且具成本效益的植物基因或基因组探询或编辑或操纵—例如，用于快速研究和/或选择和/或探询和/或比较和/或操纵和/或转化植物基因或基因组；例如，以为一种或多种植物产生、鉴定、开发、优化、或赋予一种或多种性状或一种或多种特征或者以转化植物基因组。因此，可以改进植物、具有性状或特征的新组合的新植物的生产、或具有增强的性状的新植物的生产。关于定点整合(SDI)或基因编辑(GE)或任何近反向育种(Near Reverse Breeding)(NRB)或反向育种(RB)技术中的植物，可以使用这样的一种或多种CRISPR-Cas系统。关于使用植物中的CRISPR-Cas系统，提及的是亚利桑那大学网站，“CRISPR-PLANT”(http://www.genome.arizona.edu/crispr/)(由宾州州立大学(Penn State)和AGI提供支持)。本发明的实施例可以在基因组编辑中用于植物中或先前已经使用RNAi或类似基因组编辑技术的地方；参见例如，涅克拉索夫(Nekrasov)，“植物基因组编辑一点通：使用CRISPR/Cas系统在模式和作物植物中进行靶向诱变(Plantgenome editing made easy:targeted mutagenesis in model and crop plants usingthe CRISPR/Cas system)”，《植物方法》(Plant Methods)2013，9:39(doi:10.1186/1746-4811-9-39)；布鲁克斯(Brooks)，“使用CRISPR/Cas9系统在第一代西红柿中进行有效的基因编辑(Efficient gene editing in tomato in the first generation using theCRISPR/Cas9system)”，《植物生理学》(Plant Physiology)2014年9月第114.247577页；单(Shan)，“使用CRISPR-Cas系统对作物植物进行靶向基因组修饰(Targeted genomemodification of crop plants using a CRISPR-Cas system)”，《自然生物技术》(NatureBiotechnology)31，686-688(2013)；冯(Feng)，“使用CRISPR/Cas系统在植物中进行有效基因组编辑(Efficient genome editing in plants using a CRISPR/Cas system)”，《细胞研究》(Cell Research)(2013)23:1229-1232.doi:10.1038/cr.2013.114；在线公开于2013年8月20日；谢(Xie)，“使用CRISPR-Cas系统在植物中进行RNA指导的基因组编辑(RNA-guided genome editing in plants using a CRISPR-Cas system)”，《分子植物》(MolPlant.)2013年11月；6(6):1975-83.doi:10.1093/mp/sst119.电子版2013年8月17日；徐(Xu)，“使用根癌农杆菌介导的CRISPR-Cas系统在水稻中进行基因靶向(Gene targetingusing the Agrobacterium tumefaciens-mediated CRISPR-Cas system in rice)”，《水稻》(Rice)2014,7:5(2014)；周(Zhou)等人，“在异交多年生木本植物胡杨中针对双等位基因CRISPR突变开发SNP揭示了4-香豆酸：CoA连接酶特异性与冗余(Exploiting SNPs forbiallelic CRISPR mutations in the outcrossing woody perennial Populus reveals4-coumarate:CoA ligase specificity and Redundancy)”，《新植物学家》(NewPhytologist)(2015)(论坛)1-4(仅在www.newphytologist.com在线可得)；卡林多(Caliando)等人，“使用CRISPR装置在宿主基因组中稳定进行的靶向向DNA降解(TargetedDNA degradation using a CRISPR device stably carried in the host genome)”，《自然通讯》(NATURE COMMUNICATIONS)6:6989，DOI:10.1038/ncomms7989、www.nature.com/naturecommunications DOI:10.1038/ncomms7989；美国专利号6,603,061-农杆菌介导的植物转化方法(Agrobacterium-Mediated Plant Transformation Method)；美国专利号7,868,149-植物基因组序列及其用途(Plant Genome Sequences and Uses Thereof)以及US2009/0100536-转具有增强的农艺性状的基因植物(Transgenic Plants with EnhancedAgronomic Traits)，将每者的所有内容和披露通过引用以其全文结合在此。在本发明的实践中，莫雷尔(Morrell)等人“作物基因组学：进展与应用(Crop genomics:advances andapplications)”《遗传学自然评论》(Nat Rev Genet.).2011年12月29日；13(2):85-96；将其各自通过引用并入本文，包括关于本文的实施例如何可以就植物而使用。因此，加上必要的变更，本文对动物细胞的提及也可适用植物细胞，除非另外是显而易见的。

在一个方面，本发明提供了试剂盒，该试剂盒包括在此所述的组分中的一种或多种。在一些实施例中，该试剂盒包括载体系统以及用于使用该试剂盒的说明书。在一些实施例中，该载体系统包含：(a)第一调节组件，该第一调节组件有效作地连接到同向重复序列和一个或多个插入位点，这一个或多个插入位点用于在该同向重复序列的上游或下游(以适用者为准)插入一个或多个指导序列，其中在表达时，该指导序列引导CRISPR复合物与真核细胞中的靶序列的序列特异性结合，其中该CRISPR复合物包含CRISPR酶，该酶与杂交到该靶序列上的指导序列复合；和/或(b)第二调节组件，该第二调节组件有效作地连接至编码所述CRISPR酶的酶编码序列上，该CRISPR酶包含核定位序列。在适用的情况下，还可以提供tracr序列。在一些实施例中，该试剂盒包括位于该系统的相同或不同载体上的组分(a)和(b)。在一些实施例中，组分(a)进一步包括有效作地连接到该第一调节组件的两个或更多个指导序列，其中当表达时，该两个或更多个指导序列中的每个引导CRISPR复合物在真核细胞中与不同靶序列的序列特异性结合。在一些实施例中，该CRISPR酶包括一个或多个核定位序列，该一个或多个核定位序列具有足够强度来在真核细胞的细胞核中驱动所述CRISPR酶以可检测到的量积聚。在一些实施例中，该CRISPR酶是Cas9。在一些实施例中，该CRISPR酶是Cas9酶。在一些实施例中，该Cas9酶衍生自土拉热弗朗西丝菌1、土拉热弗朗西丝菌新凶手亚种、易北河普氏菌、毛螺菌科细菌MC2017 1、分解蛋白丁酸弧菌、Peregrinibacteria细菌GW2011_GWA2_33_10、Parcubacteria细菌GW2011_GWC2_44_17、密斯氏菌属(Smithella sp.)SCADC、氨基酸球菌属BV3L6、毛螺菌科细菌MA2020、CandidatusMethanoplasma termitum、挑剔真杆菌、牛莫拉氏菌237、稻田钩端螺旋体、毛螺菌科细菌ND2006、狗口腔卟啉单胞菌3、狄氏普氏菌、或猕猴卟啉单胞菌Cas9(例如，被修饰成具有至少一个DD或与其相缔合)，并且可以进一步包括该Cas9的改变或突变，并且可以是嵌合Cas9。在一些实施例中，该DD-CRISPR酶经密码子优化以便在真核细胞中表达。在一些实施例中，该DD-CRISPR引导在该靶序列位置处的一条或两条链的切割。在一些实施例中，该DD-CRISPR酶缺少或基本上缺少DNA链切割活性(例如，与野生型酶或没有降低核酸酶活性的突变或改变的酶相比，不超过5％核酸酶活性)。在一些实施例中，该第一调节组件是聚合酶III启动子。在一些实施例中，该第二调节组件是聚合酶II启动子。在一些实施例中，该指导序列在长度上是至少16、17、18、19、20、25个核苷酸，或16-30个之间、或16-25个之间、或16-20个之间的核苷酸。

在一个方面，本发明提供了修饰在真核细胞中的靶多核苷酸的方法。在一些实施例中，该方法包括允许DD-CRISPR复合物结合到该靶多核苷酸上例如以实施所述靶多核苷酸的切割，由此修饰该靶多核苷酸，其中该DD-CRISPR复合物包含与杂交到在所述靶多核苷酸内的靶序列上的指导序列复合的DD-CRISPR酶，其中所述指导序列连接到同向重复序列上。在适用的情况下，还可以提供tracr序列(例如以提供单个指导RNA，sgRNA)。在一些实施例中，所述切割包括通过所述DD-CRISPR酶切割在该靶序列位置的一条或两条链；在一些实施例中，所述切割导致靶基因的转录降低。在一些实施例中，该方法进一步包括通过与外源模板多核苷酸同源重组修复所述切割的靶多核苷酸，其中所述修复导致突变，包括所述靶多核苷酸的一个或多个核苷酸的插入、缺失、或取代。在一些实施例中，所述突变导致在从包含该靶序列的基因表达的蛋白质中的一个或多个氨基酸改变。在一些实施例中，该方法进一步包括将一种或多种载体递送到所述真核细胞，其中这一种或多种载体驱动下列一者或多者的表达：该DD-CRISPR酶和连接到该同向重复序列的指导序列。在适用的情况下，还可以提供tracr序列。在一些实施例中，所述载体被递送到受试者内的真核细胞中。在一些实施例中，所述修饰发生在细胞培养物中的所述真核细胞中。在一些实施例中，该方法进一步包括在所述修饰之前从受试者中分离所述真核细胞。在一些实施例中，该方法进一步包括使所述真核细胞和/或从中衍生的细胞返回到所述受试者中。

在一个方面，本发明提供了修饰多核苷酸在真核细胞中的表达的方法。在一些实施例中，该方法包括允许DD-CRISPR复合物结合到该多核苷酸上，这样使得所述结合导致所述多核苷酸的表达增加或降低；其中该DD-CRISPR复合物包含与杂交到所述多核苷酸内的靶序列上的指导序列复合的DD-CRISPR酶，其中所述指导序列连接到同向重复序列。在适用的情况下，还可以提供tracr序列。在一些实施例中，该方法进一步包括将一种或多种载体递送到所述真核细胞，其中这一种或多种载体驱动下列一者或多者的表达：该DD-CRISPR酶和连接到该同向重复序列的指导序列。在适用的情况下，还可以提供tracr序列。

在一个方面，本发明提供了产生包含经突变的疾病基因的模式真核细胞的方法。在一些实施例中，疾病基因是与患有或产生疾病的风险的增加相关联的任何基因。在一些实施例中，该方法包括(a)向真核细胞中引入一种或多种载体，其中这一种或多种载体驱动下列一者或多者的表达：DD-CRISPR酶、连接到同向重复序列上的指导序列(在适用的情况下，还可以提供tracr序列)；并且(b)允许DD-CRISPR复合物结合到靶多核苷酸上例如以实施在所述疾病基因内的该靶多核苷酸的切割，其中该DD-CRISPR复合物包含与杂交到该靶多核苷酸内的靶序列上的指导序列复合的DD-CRISPR酶，由此产生包含经突变的疾病基因的模式真核细胞。在一些实施例中，所述切割包括通过所述DD-CRISPR酶切割在该靶序列位置的一条或两条链；在一些实施例中，所述切割导致靶基因的转录降低。在一些实施例中，该方法进一步包括通过与外源模板多核苷酸同源重组修复所述切割的靶多核苷酸，其中所述修复导致突变，包括所述靶多核苷酸的一个或多个核苷酸的插入、缺失、或取代。在一些实施例中，所述突变导致在从包含该靶序列的基因表达的蛋白质中的一个或多个氨基酸改变。

在一个方面，本发明提供了重组多核苷酸，该重组多核苷酸包含同向重复序列上游或下游(以适用者为准)的指导序列，其中当表达时该指导序列引导DD-CRISPR复合物与存在于真核细胞中的对应的靶序列的序列特异性结合。在一些实施例中，该靶序列是存在于真核细胞中的病毒序列。在适用的情况下，还可以提供tracr序列。在一些实施例中，该靶序列是原癌基因或癌基因。

在一个方面，本发明提供了通过在一种或多种细胞的基因中引入一个或多个突变来选择一种或多种细胞的方法，该方法包括：将一种或多种载体引入这一种或多种细胞中，其中这一种或多种载体驱动下列一者或多者的表达：DD-CRISPR酶、连接到同向重复序列上的指导序列(在适用的情况下，还可以提供tracr序列)、和编辑模板；其中该编辑模板包含消除DD-CRISPR酶切的一个或多个突变；允许该编辑模板与靶多核苷酸在有待筛选的一种或多种细胞中进行同源重组；允许CRISPR复合物结合到靶多核苷酸上以实施在所述基因内的该靶多核苷酸的切割，其中该DD-CRISPR复合物包含与杂交到该靶多核苷酸内的靶序列上的指导序列复合的DD-CRISPR酶，其中该DD-CRISPR复合物与该靶多核苷酸的结合诱导细胞死亡，由此允许选择其中已经引入一个或多个突变的一种或多种细胞。在一个优选实施例中，该DD-CRISPR酶是DD-Cas9。在本发明的另一方面，该有待选择的细胞可以是真核细胞。本发明的方面允许选择特异细胞，而不需要选择标记或可能包括反选择系统的两步法。这一种或多种细胞可以是原核或真核细胞。

在一个另外的方面，本发明涉及用于鉴定或设计适合在DD-CRISPR-Cas9系统或其功能部分内的或结合到DD-CRISPR-Cas9系统或其功能部分的潜在的化合物的计算机辅助方法、或反之亦然(用于鉴定或设计结合到所希望的化合物的潜在的DD-CRISPR-Cas9系统或其功能部分的计算机辅助方法)、或用于鉴定或设计潜在的DD-CRISPR-Cas9系统的计算机辅助方法(例如，就预测能够被操纵的DD-CRISPR-Cas9系统的区域而言—例如，基于晶体结构数据或基于Cas9直向同源物的数据，或就官能团(如激活因子或阻遏因子)可以附接至该DD-CRISPR-Cas9系统的何处而言，或就Cas9截短而言或就设计切口酶而言)，所述方法包括：使用计算机系统，例如包括处理器、数据存储系统、输入装置、和输出装置的编程计算机，以下步骤：(a)通过所述输入装置将数据输入到该编程计算机中，该数据包括来自DD-CRISPR-Cas9晶体结构的或与其有关的原子子集的三维坐标，例如在DD-CRISPR-Cas9系统结合结构域中、或可替代地或另外地在基于Cas9直向同源物之间的或关于Cas9的或关于切口酶的或关于官能团的差异而变化的结构域中，任选地连同来自一种或多种CRISPR-Cas9系统复合物的结构信息，由此产生数据集；(b)使用所述处理器比较所述数据集与储存在所述计算机数据存储系统中的计算机结构数据库，例如结合到或推定结合到或希望结合到DD-CRISPR-Cas9系统的化合物的、或关于DD-Cas9直向同源物的(例如，关于Cas9的或关于在Cas9直向同源物之间变化的结构域或区域的)、或关于DD-CRISPR-Cas9晶体结构的、或关于切口酶的或关于官能团的结构；(c)使用计算机方法从所述数据库中选择一种或多种结构—例如，可以结合到所希望的结构的DD-CRISPR-Cas9结构、可以结合到某些DD-CRISPR-Cas9结构的所希望的结构、可以被操纵的DD-CRISPR-Cas9系统的部分，例如基于来自DD-CRISPR-Cas9晶体结构的其他部分的和/或来自DD-Cas9直向同源物、截短的Cas9、新颖的切口酶或特定的官能团、或用于将官能团附接至DD-CRISPR-Cas9系统或突变这些系统的位置的数据；(d)使用计算机方法构建所选一种或多种结构的模型；并且(e)将所选一种或多种结构输出至所述输出装置；并且任选地合成所选一种或多种结构中的一者或多者；并且进一步任选地作为DD-CRISPR-Cas9系统或在其中测试所述合成的所选一种或多种结构；或者，所述方法包括：提供该DD-CRISPR-Cas9晶体结构的至少两个原子的坐标，例如本文引用的材料的至少两个原子、或该DD-CRISPR-Cas9晶体结构的至少一个子结构域的坐标(“所选坐标”)；提供包含结合分子的候选物的或可以被操纵的该DD-CRISPR-Cas9系统的部分的结构，例如基于来自该DD-CRISPR-Cas9晶体结构的其他部分的和/或来自Cas9直向同源物的数据，或官能团的结构，并且将该候选物的结构与所选坐标匹配，以由此获得产品数据，该产品数据包括可以结合到所希望的结构的DD-CRISPR-Cas9结构，可以结合到某些DD-CRISPR-Cas9结构的所希望的结构、可以被操纵的CRISPR-Cas9系统的部分，截短的Cas9、新颖的切口酶、或特定的官能团、或用于附接官能团或用于突变DD-CRISPR-Cas9系统的位置，并且将其输出；并且任选地从所述产品数据合成一种或多种化合物并且进一步任选地包括作为DD-CRISPR-Cas9系统或在其中测试所述合成的一种或多种化合物。该测试可以包括对由所述合成的所选一种或多种结构产生的DD-CRISPR-Cas9系统进行分析，例如相对于结合、或执行所希望的功能。前述方法中的输出可以包括数据传输，例如经由电信、电话、视讯会议、公众通讯(例如演示，如计算机演示(例如POWERPOINT))、因特网、电子邮件、文献交流(如计算机程序(例如WORD))文件等进行的信息传输。因此，本发明还包括含有以下项的计算机可读介质：根据本文引用的材料的原子坐标数据，所述数据限定了DD-CRISPR-Cas9或其至少一个子结构域的三维结构，或针对CRISPR-Cas9的结构因子数据，所述结构因子数据可衍生自本文引用的材料。该计算机可读介质还可以含有前述方法的任何数据。本发明进一步包括用于产生或执行如在前述方法中的合理设计的方法、计算机系统，含有以下任一项：根据本文引用的材料的原子坐标数据，所述数据限定了DD-CRISPR-Cas9或其至少一个子结构域的三维结构，或针对CRISPR-Cas9的结构因子数据，所述结构因子数据可衍生自本文引用的材料的原子坐标数据。本发明进一步包括经商方法，该方法包括向用户提供该计算机系统或该介质或DD-CRISPR-Cas9或其至少一个子结构域的三维结构、或针对DD-CRISPR-Cas9的结构因子数据(所述结构列于本文引用的材料的原子坐标数据中并且所述结构因子数据可衍生自本文引用的材料的原子坐标数据)、或本文的计算机介质或本文的数据传输。

“结合位点”或“活性位点”包括结合腔或区域中的位点(如原子、氨基酸残基的官能团或多个这样的原子和/或基团)或基本上由其组成或由其组成，该结合腔或区域可以结合至化合物(如核酸分子)，所述化合物涉及在结合中。所谓“匹配(fitting)”意指通过自动或半自动手段确定候选分子的一个或多个原子与本发明结构的至少一个原子之间的相互作用，并且计算这样的相互作用稳定的程度。相互作用包括由电荷、空间因素等引起的吸引和排斥。进一步描述了匹配用的各种基于计算机的方法。所谓“均方根(或rms)偏差”，我们意指离均差的平方的算术平均数的平方根。所谓“计算机系统”意指用于分析原子坐标数据的硬件装置、软件装置和数据存储装置。本发明的基于计算机的系统的最低硬件装置典型地包括中央处理器(CPU)、输入装置、输出装置以及数据存储装置。合意地，提供显示器或监测器用于可视化结构数据。数据存储装置可以是RAM或用于存取本发明的计算机可读介质的装置。这样的系统的实例是运行Unix、Windows或Apple操作系统的计算机和平板设备。所谓“计算机可读介质”意指可以被计算机直接或间接读取并且存取，例如使得该介质适于在以上提到的计算机系统中使用的任何一种或多种介质。这样的介质包括但不限于：磁存储介质，如软盘、硬盘存储介质和磁带；光存储介质，如光盘或CD-ROM；电存储介质，如RAM和ROM；拇指驱动设备；云存储设备以及这些类别的混合体，如磁/光存储介质。

在本发明的具体实施例中，DD-CRISPR-Cas9系统或该DD-CRISPR-Cas9的组分的晶体结构的构象变化提供了关于蛋白质结构区域相对于对DD-CRISPR-Cas系统功能而言重要的核苷酸(RNA或DNA)结构区域的挠性或移动的重要且关键的信息。在本文引用的材料中针对Cas9提供的结构信息可以用于进一步工程化和优化本文的DD-CRISPR-Cas系统并且这可以被外推用于探询其他CRISPR酶，例如还用DD-CRISPR酶系统，例如其他V型或VI型CRISPRR酶系统(例如其他V型或VI型DD-CRISPR酶系统)中的结构-功能关系。本发明包括经优化的功能性DD-CRISPR-Cas酶系统。具体而言，该DD-CRISPR酶包括一个或多个将它转化为DNA结合蛋白的突变，展现出感兴趣的功能的功能结构域可以被募集或附于或插入或附接至该DNA结合蛋白。在某些实施例中，该CRISPR酶在DD-CRISPR酶的RuvC1中包括一个或多个突变和/或为如本文另外讨论的突变。在一些实施例中，该DD-CRISPR酶在催化结构域中具有一个或多个突变，其中在转录时，该指导序列引导DD-CRISPR复合物与该靶序列的序列特异性结合，并且其中该酶进一步包括功能结构域(例如，用于提供去稳定化结构域或将其促成)。在本文引用的材料中提供的结构信息允许探询指导与靶DNA和CRISPR酶(例如，Cas9；例如DD-CRISPR酶，例如DD-Cas9)的相互作用，从而允许工程化或改变sgRNA的结构，以便优化整个DD-CRISPR-Cas系统的功能性。例如，可以在不与Cas9蛋白冲突的情况下通过插入可以结合至RNA的衔接蛋白来扩展该指导的环。这些衔接蛋白可以进一步募集效应蛋白或融合，这些效应蛋白或融合包括一个或多个功能结构域。功能结构域可以包括转录激活结构域(例如VP64)、基本上由其组成或由其组成。功能结构域可以包括转录阻遏结构域(例如KRAB)、基本上由其组成。在一些实施例中，转录阻遏结构域是或包括SID、或SID的多联体(例如SID4X)或基本上由其组成。在一些实施例中，功能结构域包括表观遗传修饰结构域、基本上由其组成，从而提供了表观遗传修饰酶。在一些实施例中，功能结构域包括激活结构域、基本上由其组成，其可以是P65激活结构域。

本发明的方面包括非天然存在的或工程化的组合物，该组合物可以包含指导RNA(gRNA)，其包含能够杂交到细胞中的感兴趣的基因组座位中的靶序列上的指导序列；和DD-CRISPR酶，其可以包含至少一个或多个核定位序列，其中该DD-CRISPR酶包括一个或两个或更多个突变，这样使得该酶与野生型酶相比具有改变或降低的核酸酶活性，其中该gRNA的至少一个环通过插入结合至一种或多种衔接蛋白的一个或多个不同RNA序列而被修饰，并且其中该衔接蛋白进一步募集一个或多个异源功能结构域。在本发明的一个实施例中，该DD-CRISPR酶包括一个或两个或更多个突变。在另一个实施例中，功能结构域包括转录激活结构域(例如VP64)、基本上由其组成。在另一个实施例中，功能结构域包括转录阻遏结构域(例如，KRAB结构域、SID结构域或SID4X结构域)、基本上由其组成。在本发明的实施例中，这一个或多个异源功能结构域具有一种或多种选自下组的活性，该组包括甲基酶活性、脱甲基酶活性、转录激活活性、转录阻遏活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性以及核酸结合活性，基本上由其组成，或由其组成。在本发明的另外的实施例中，该细胞是真核细胞或哺乳动物细胞或人类细胞。在另外的实施例中，该衔接蛋白选自下组，该组包括MS2、PP7、Qβ、F2、GA、fr、JP501、M12、R17、BZ13、JP34、JP500、KU1、M11、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、φCb5、φCb8r、φCb12r、φCb23r、7s、PRR1，基本上由其组成，或由其组成。在另一个实施例中，该gRNA的至少一个环是四环和/或环2。本发明的一个方面包括通过向细胞中引入本文描述的任何组合物来修饰感兴趣的基因组座位以改变该细胞中的基因表达的方法。

一般而言，按以下方式修饰gRNA，该方式为衔接蛋白提供了结合用的特异性结合位点(例如，适配体)，这些衔接蛋白包括一个或多个功能结构域(例如，经由融合蛋白)。修饰经修饰的sgRNA，使得一旦该gRNA形成DD-CRISPR复合物(即结合至gRNA和靶标的DD-CRISPR酶)，则这些衔接蛋白结合，并且衔接蛋白上的功能结构域被定位为有利于属性化功能有效的空间取向。例如，如果该功能结构域包括转录激活因子(例如，VP64或p65)、基本上由其组成，则该转录激活因子被放置为允许它影响靶标转录的空间取向。同样地，转录阻遏因子将被有利地定位为影响靶标的转录，并且核酸酶(例如，Fok1)将被有利地定位为切割或部分切割该靶标。

本领域技术人员应理解，对gRNA的允许衔接子+功能结构域的结合但不允许衔接子+功能结构域的正确定位(例如由于CRISPR复合物的三维结构内的位阻)的修饰是并非预期的修饰。可以在如本文描述的四环、茎环1、茎环2、或茎环3处，优选在四环或茎环2处，并且最优选在四环和茎环2两者处对这一种或多种经修饰的gRNA进行修饰。

如本文所解释的，这些功能结构域可以是例如来自下组的一个或多个结构域，该组包括甲基酶活性、脱甲基酶活性、转录激活活性、转录阻遏活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性、DNA切割活性、核酸结合活性、以及分子开关(例如光诱导型)，基本上由其组成，或由其组成。在一些情况下，有利的是另外提供至少一个NLS和/或NES。在一些情况下，有利的是将该NLS和/或NES定位在N末端。当包括超过一个功能结构域时，这些功能结构域可以是相同的或不同的。

该gRNA可以被设计成包括多个对相同或不同衔接蛋白具有特异性的结合识别位点(例如，适配体)。该gRNA可以被设计成结合至转录起始位点(即TSS)上游的启动子区-1000-+1个核酸，优选-200个核酸。这种定位改进了影响基因激活(例如，转录激活因子)或基因抑制(例如，转录阻遏因子)的功能结构域。该经修饰的gRNA可以是被靶向一个或多个靶座位、包含在组合物中的一种或多种修饰的gRNA(例如，至少1种gRNA、至少2种gRNA、至少5种gRNA、至少10种gRNA、至少20种gRNA、至少30种gRNA、至少50种gRNA)。

此外，当核酸酶活性被失活时，具有降低的核酸酶活性的DD-CRISPR酶是最有效的(例如，与野生型酶相比，核酸酶失活至少70％、至少80％、至少90％、至少95％、至少97％、或100％；或换句话说，DD-Cas9酶或DD-CRISPR酶有利地具有约0％的非经突变的或野生型Cas9酶或CRISPR酶的核酸酶活性、或不超过约3％或约5％或约10％的非经突变或野生型Cas9酶或CRISPR酶的核酸酶活性)。通过向Cas9及其直向同源物的RuvC核酸酶结构域中引入突变这是可能的。失活的CRISPR酶可以具有缔合的(例如，经由融合蛋白)一个或多个功能结构域，例如至少一个去稳定化结构域；或者，例如像如在本文针对经修饰的gRNA衔接蛋白描述的那些，包括例如来自下组的一个或多个结构域，该组包括甲基酶活性、脱甲基酶活性、转录激活活性、转录阻遏活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性、DNA切割活性、核酸结合活性、以及分子开关(例如，光诱导型)，基本上由其组成，或由其组成。优选的结构域是Fok1、VP64、P65、HSF1、MyoD1。在提供Fok1的情况下，有利的是提供多个Fok1功能结构域以允许功能性二聚体，并且gRNA被设计成为功能使用(Fok1)提供适当间隔，如在蔡(Tsai)等人(《自然生物技术》(Nature Biotechnology)，第32卷，第6期，2014年6月)中具体描述的。该衔接蛋白可以利用已知接头来附接这样的功能结构域。在一些情况下，有利的是另外提供至少一个NLS或NES。在一些情况下，有利的是将该NLS或NES定位在N末端。当包括超过一个功能结构域时，这些功能结构域可以是相同的或不同的。一般而言，这一个或多个功能结构域在失活的DD-CRISPR酶上的定位是这样一种定位，其允许功能结构域的正确空间取向以影响具有属性化功能效应的靶标。例如，如果该功能结构域是转录激活因子(例如VP64或p65)，则该转录激活因子被放置为允许它影响靶标转录的空间取向。同样地，转录阻遏因子将被有利地定位为影响靶标的转录，并且核酸酶(例如，Fok1)将被有利地定位为切割或部分裂解该靶标。这可以包括除DD-CRISPR酶的N-末端/C-末端之外的位置。

衔接蛋白可以是任何数目的蛋白质，其结合至被引入经修饰的gRNA中的适配体或识别位点并且一旦该gRNA已经被掺入DD-CRISPR复合物中，则允许一个或多个功能结构域的正确定位，以便影响具有属性化功能的靶标。如在本申请中所详细解释的，这些可以是外壳蛋白，优选噬菌体外壳蛋白。与这样的衔接蛋白(例如，呈融合蛋白的形式)相缔合的功能结构域可以包括例如来自下组的一个或多个结构域，该组包括甲基酶活性、脱甲基酶活性、转录激活活性、转录阻遏活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性、DNA切割活性、核酸结合活性、以及分子开关(例如光诱导型)，基本上由其组成，或由其组成。优选的结构域是Fok1、VP64、P65、HSF1、MyoD1。在该功能结构域是转录激活因子或转录阻抑因子的情况下，有利的是另外提供至少一个NLS或NES并且优选在N末端处。当包括超过一个功能结构域时，这些功能结构域可以是相同的或不同的。该衔接蛋白可以利用已知接头来附接这样的功能结构域。这样的接头可以用于使该DD与该CRISPR酶缔合或者使得该CRISPR酶包含该DD。

因此，gRNA(例如，经修饰的gRNA)、失活的DD-CRISPR酶(具有或不具有功能结构域)、以及具有一个或多个功能结构域的结合蛋白可以各自独立地被包含在组合物中并且被单独地或共同地给予至宿主。可替代地，这些组分可以被提供在用于给予至宿主的单个组合物中。可以经由本领域技术人员已知的或本文描述的用于递送到宿主的病毒载体(例如，慢病毒载体、腺病毒载体、AAV载体)进行向宿主的给予。如本文所解释的，使用不同的选择标记(例如，用于慢病毒sgRNA选择)和gRNA浓度(例如，取决于是否使用多种gRNA)对于引出改进的效果而言可以是有利的。在这个概念的基础上，若干变化适于引出基因组座位事件，包括DNA切割、基因激活、或基因失活。使用所提供的组合物，本领域的普通技术人员可以有利地且特异性地靶向具有相同或不同功能结构域的单个或多个座位，以引出一个或多个基因组座位事件。这些组合物可以按多种多样的方法应用，用于在细胞中筛选文库和在体内进行功能建模(例如，lincRNA的基因激活和功能鉴定；功能获得建模；功能缺失建模；使用本发明的组合物建立用于优化和筛选目的的细胞系和转基因动物)。

本发明包括本发明的组合物用于建立和利用条件型或诱导型DD-CRISPR转基因细胞/动物的用途；参见例如，普莱特(Platt)等人，《细胞》(Cell)(2014)，159(2):440-455，或者本文引用的PCT专利出版物，如WO 2014/093622(PCT/US 2013/074667)。例如，细胞或动物(如非人类动物，例如脊椎动物或哺乳动物，如啮齿动物例如小鼠、大鼠，或其他实验室或田间动物例如猫、狗、绵羊等)可以是‘敲入的’，由此类似于普莱特(Platt)等人，该动物条件性地或诱导性地表达DD-Cas9。该靶细胞或动物因此条件性地或诱导性地包含DD-CRISPR酶(例如，DD-Cas9)(例如，呈Cre依赖性构建体的形式)和/或条件性地或诱导性地包含衔接蛋白或DD，并且在表达被引入该靶细胞中的载体之后，该载体表达该DD-CRISPR酶(例如，DD-Cas9)和/或衔接蛋白或DD，这在该靶细胞中诱导或产生DD-CRISPR酶(例如，DD-Cas9)表达和/或衔接子或DD表达的条件。通过应用本发明的传授和组合物与产生CRISPR复合物的已知方法，诱导型基因组事件也是本发明的一个方面。一个仅有的实例是产生CRISPR敲入/条件型转基因动物(例如，包含例如Lox-Stop-polyA-Lox(LSL)盒的小鼠)并且随后递送一种或多种组合物，这一种或多种组合物提供一种或多种经修饰的gRNA(例如感兴趣的靶基因的TSS的-200个核苷酸，用于基因激活目的；例如具有一种或多种由外壳蛋白例如MS2识别的适配体的经修饰的gRNA)、一种或多种如本文描述的衔接蛋白(连接至一个或多个VP64的MS2结合蛋白)以及用于诱导条件型动物的工具(例如，用于使得DD-Cas9表达可诱导的Cre重组酶)。可替代地，该衔接蛋白或DD可以被提供为具有条件型或诱导型CRISPR酶的条件型或诱导型组件，以便提供用于筛选目的的有效模型，这有利地仅需要最少的设计和给予特异性gRNA用于广泛的应用。

I.两个或更多个CRISPR-Cas系统多核苷酸序列，其包含

(c)同向重复序列，

(d)任选地，在适用的情况下的tracr序列；以及

II.Cas9酶或编码它的第二多核苷酸序列，

其中该Cas9酶是包含如本文描述的一个或多个DD的经修饰的酶，

其中在转录时，该第一指导序列和该第二指导序列分别引导第一CRISPR复合物和第二CRISPR复合物与该第一靶序列和第二靶序列的序列特异性结合，

其中该第一指导序列引导邻近该第一靶序列的DNA双链体的一条链的切割，并且该第二指导序列引导邻近该第二靶序列的另一条链的切割，从而诱导双链断裂，由此修饰该生物或该非人类或非动物生物。

在另一个实施例中，该Cas9作为蛋白质递送到该细胞中。在另一个并且特别优选的实施例中，该Cas9作为蛋白质或作为编码它的核苷酸序列递送到该细胞中。作为蛋白质递送至细胞可以包括核糖核蛋白(RNP)复合物的递送，在该复合物中该蛋白质与该指导复合。

本发明方法可以进一步包括递送模板，如修复模板，它们可以是dsODN或ssODN，参见下文。模板的递送可以经由与任何或所有CRISPR酶或指导的递送同时的或分开的递送并且经由相同或不同的递送机制。在一些实施例中，优选的是一起递送该模板与该指导，并且优选地还有该CRISPR酶。实例可以是AAV载体，其中该CRISPR酶是AsCas9或LbCas9。

本发明还包括通过使用本发明的CRISPR酶或Cas酶或Cas9酶或CRISPR-CRISPR酶或CRISPR-Cas系统或CRISPR-Cas9系统获得的产品。

结构同源性；同系物与直向同源物

在实施例中，如在本文提及的Cas9蛋白还包括Cas9的同系物或直向同源物，如SpCas9或eSpCas9的。术语“直向同源物”(在本文还称为“直系同源物”)和“同源物”(在本文还称为“同系物”)在本领域是众所周知的。通过进一步指导的方式，如本文使用的蛋白质的“同系物”是相同种类的、执行与作为其同系物的蛋白质相同或相似功能的蛋白质。可以通过以下方式来鉴定同系物和直向同源物：同源建模(参见例如，格里尔(Greer)，《科学》(Science)第228卷(1985)1055，和布伦代尔(Blundell)等人，《欧洲生物化学杂志》(Eur JBiochem)第172卷(1988)513)或“结构性BLAST”(戴伊(Dey)F、克利夫张(Cliff Zhang)Q、皮特瑞(Petrey)D、霍尼格(Honig)B.关于“结构性BLAST”：使用结构关系推断功能(Toward a"structural BLAST":using structural relationships to infer function).《蛋白质科学》(Protein Sci.)2013年4月；22(4):359-66.doi:10.1002/pro.2225.)。关于在CRISPR-Cas座位领域中的应用，还参见史马科夫(Shmakov)等人(2015)。同源蛋白可以不必是结构相关的，或者仅仅是部分结构相关的。如本文使用的蛋白质的“直向同源物”是不同种类的、执行与作为其直向同源物的蛋白质相同或相似功能的蛋白质。直向同源蛋白可以不必是结构相关的，或者仅仅是部分结构相关的。在具体实施例中，如在本文提及的Cas9的同系物或直向同源物与Cas9具有至少80％，更优选至少85％，甚至更优选至少90％，例如像至少95％的序列同源性或一致性。在另外的实施例中，如在本文提及的Cas9的同系物或直向同源物与野生型Cas9具有至少80％，更优选至少85％，甚至更优选至少90％，例如像至少95％的序列一致性。在具体实施例中，如在本文提及的Cas9的同系物或直向同源物与Cas9具有至少80％，更优选至少85％，甚至更优选至少90％，例如像至少95％的序列同源性或一致性。在另外的实施例中，如在本文提及的Cas9的同系物或直向同源物与野生型SpCas9具有至少80％，更优选至少85％，甚至更优选至少90％，例如像至少95％的序列一致性。在该Cas9具有一个或多个突变(经突变的)情况下，如在本文提及的所述Cas9的同系物或直向同源物与经突变的Cas9具有至少80％，更优选至少85％，甚至更优选至少90％，例如像至少95％的序列一致性。

直向同源蛋白的特定结构域是类似地相关的。在某些实施例中，如在本文提及的Cas9的直向同源结构域与Cas9具有至少60％、至少70％、至少80％、至少90％、或至少95％的序列同源性或一致性。在具体实施例中，如在本文提及的Cas9的直向同源结构域与SpCas9具有至少60％、至少70％、至少80％、至少90％、或至少95％的序列同源性或一致性。

CRISPR-Cas9复合物或其组分的递送

载体递送，例如质粒、病毒递送：该CRISPR酶，例如Cas9、Cas9直向同源物或其突变体，和/或本发明的任何RNA，例如指导RNA，可以使用任何适合载体，例如，质粒或病毒载体，如腺相关病毒(AAV)、慢病毒、腺病毒或其他病毒载体类型、或其组合进行递送。Cas9以及一种或多种指导RNA可以被包装到一种或多种载体(例如，质粒或病毒载体)中。在一些实施例中，病毒(例如，质粒或病毒载体)可以例如通过肌肉注射递送到感兴趣的组织中，而有时经由静脉内、经皮、鼻内、经口、粘膜、或其他递送方法进行递送。这样的递送可以经由单剂量或多剂量来进行。本领域技术人员理解的是，本文有待递送的实际剂量可以在很大程度上取决于多种因素而变化，如载体选择、靶细胞、生物、或组织、有待治疗的受试者的一般状况、所寻求的转化/修饰的程度、给药途径、给药方式、所寻求的转化/修饰的类型，等等。

这样的剂量可以进一步含有，例如，载体(水、盐水、乙醇、甘油、乳糖、蔗糖、磷酸钙、明胶、葡聚糖、琼脂、果胶、花生油、芝麻油，等等)、稀释剂、药学上可接受的载体(例如，磷酸盐缓冲盐水)、药学上可接受的赋形剂、和/或本领域已知的其他化合物。该剂型可以进一步含有一种或多种药学上可接受的盐，例如像，无机酸盐如盐酸盐、氢溴酸盐、磷酸盐、硫酸盐、等等；以及有机酸盐，如乙酸盐、丙酸盐、丙二酸盐、苯甲酸盐等等。另外，也可以存在辅助物质，如润湿剂或乳化剂、pH缓冲物质、凝胶或胶凝材料、调味剂、着色剂、微球体、聚合物、悬浮剂等等。另外，也可以存在一种或多种其他常规药用成分，如防腐剂、保湿剂、悬浮剂、表面活性剂、抗氧化剂、抗结剂、填充剂、螯合剂、包衣剂、化学稳定剂等等，尤其是该剂型是可复原形式时。适合的示例性成分包括微晶纤维素、羧甲基纤维素钠、聚山梨酯80、苯乙醇、三氯叔丁醇、山梨酸钾、抗坏血酸、二氧化硫、没食子酸丙酯、对羟基苯甲酸酯、乙基香兰素、甘油、苯酚、对氯酚、明胶、白蛋白和它们的组合。药学上可接受的赋形剂的彻底论述可获自《雷明顿药物科学》(REMINGTON'S PHARMACEUTICAL SCIENCES)(马克出版公司，纽约，1991)，通过引用将其并入本文。

在本文的一个实施例中，该递送是经由质粒进行的。在这样的质粒组合物中，该剂量应当是足以引出反应的质粒的量。例如，在质粒组合物中的质粒DNA的适当量可以是从约0.1到约2mg，或从约1μg到约10μg/70kg个体。本发明的质粒一般将包括(i)启动子；(ii)编码CRISPR酶的序列，任选连接到所述启动子上；(iii)选择标记；(iv)复制起点；和(v)(ii)的下游的并且有效连接到其上的转录终止子。该质粒还可以编码CRISPR复合物的RNA组分，但是这些中的一种或多种相反可以被编码到不同载体上。

本文的剂量是基于平均70kg的个体。给药频率在医学或兽医学从业者(例如医师、兽医师)或本领域熟练的科学家的范围之内。还应注意，在实验中所使用的小鼠典型地是约20g，并且从小鼠实验，一只小鼠可以扩展到70kg个体。

在一些实施例中，本发明的RNA分子在脂质体或阳离子脂质体配制品等等中进行递送并且可以通过本领域技术人员熟知的方法进行制备。这样的方法例如在美国专利号5,593,972、5,589,466和5,580,859中，将其通过引用并入本文。已经开发了专门针对增强和改进递送siRNA到哺乳动物细胞中的递送系统(参见例如，沈(Shen)等人《欧洲生化学会联合会快报》(FEBS Let.).2003,539:111-114；夏(Xia)等人，《自然生物技术》(Nat.Biotech.)2002,20:1006-1010；赖希(Reich)等人，《分子视界》(Mol.Vision.)2003,9:210-216；索伦森(Sorensen)等人，《分子生物学杂志》(J.Mol.Biol.)2003,327:761-766；刘易斯(Lewis)等人，《自然遗传学》(Nat.Gen.)2002，32:107-108以及西梅奥尼(Simeoni)等人，NAR 2003，31，11:2717-2724)并且可以将其应用于本发明。最近，siRNA已经成功用于抑制灵长类动物中的基因表达(参见例如，托伦蒂诺(Tolentino)等人，《视网膜》(Retina)24(4):660)，它也可应用于本发明。

实际上，RNA递送是有用的体内递送方法。有可能使用脂质体或粒子或纳米粒子将Cas9和gRNA(以及例如，HR修复模板)递送到细胞中。因此，CRISPR酶如Cas9的递送和/或本发明的RNA的递送可以处于RNA的形式并且经由微囊泡、脂质体或粒子或纳米粒子来进行。例如，Cas9mRNA和gRNA可以被包装到脂质体粒子中用于体内递送。脂质体转染试剂例如来自生命技术公司(Life Technologies)的lipofectamine以及市售的其他试剂可以有效地将RNA分子递送到肝脏中。

还优选的RNA递送手段包括经由粒子或纳米粒子(卓(Cho)S.、金伯格(Goldberg)M.、松(Son)S.、许(Xu)Q.、杨(Yang)F.、梅(Mei)Y.、博加特廖夫(Bogatyrev)S.、朗格(Langer)R.和安德森(Anderson)D.，“用于将小干扰RNA递送到内皮细胞的脂质样纳米粒子”(Lipid-like nanoparticles for small interfering RNA delivery toendothelial cells)，《先进功能材料》(Advanced Functional Materials)，19:3112-3118，2010)或外排体(施罗德(Schroeder)A.、莱文斯(Levins)C.、科特斯(Cortez)C.、朗格(Langer)R.、和安德森(Anderson)D.，“用于siRNA递送的基于脂质的纳米治疗剂”(Lipid-based nanotherapeutics for siRNA delivery)，《内科学杂志》(Journal of InternalMedicine)，267:9-21，2010，PMID:20059641)递送RNA。事实上，已经表明外排体在递送siRNA中特别有用，其为与CRISPR系统有一些相似之处的系统。例如，艾尔·安达卢西(El-Andaloussi)S等人(“外排体介导的体外和体内siRNA递送”(“Exosome-mediated deliveryof siRNA in vitro and in vivo”).《自然-实验手册》(Nat Protoc.)2012年12月；7(12):2112-26.doi:10.1038/nprot.2012.131.电子版2012年11月15日描述了外排体对于跨不同的生物屏障的药物递送是有希望的工具并且可以用于体外和体内递送siRNA。其途径在于通过转染包含与肽配体融合的外排体蛋白的表达载体产生靶向外排体。然后将这些外排体纯化并且从转染的细胞上清液中表征，然后将RNA加载到外排体中。根据本发明的递送或给药可以用外排体进行，尤其是但不限于脑。维生素E(α-生育酚)可以与CRISPR Cas结合并且连同高密度脂蛋白(HDL)一起递送到脑，例如以与乌诺(Uno)等人完成的用于将短干扰RNA(siRNA)递送到脑的类似方式《人类基因治疗》(HUMAN GENE THERAPY)22:711-719(2011年6月)。经由用磷酸盐缓冲盐水(PBS)或游离TocsiBACE或Toc-siBACE/HDL充满的并且与脑灌注试剂盒3(Brain Infusion Kit 3)(Alzet公司)连接的微渗透压泵(型号1007D；Alzet公司，库比蒂诺(Cupertino)，CA)灌注小鼠。将一根脑灌注导管置于在正中线的前囱的后方约0.5mm，用于灌注到背侧第三脑室中。乌诺(Uno)等人发现，通过相同的ICV灌注方法，少至3nmol的Toc-siRNA与HDL可诱导相当程度的靶减少。可以考虑结合至α-生育酚的并且与HDL共同给予靶向脑的相似剂量的CRISPR Cas用于本发明，例如，可以考虑靶向脑的约3nmol到约3μmol的CRISPR Cas。邹(Zou)等人(《人类基因治疗》(HUMAN GENE THERAPY 22:465-475(2011年4月))描述了靶向PKCγ的短发夹RNA的慢病毒介导的递送方法，其用于在大鼠脊髓中的体内基因沉默。邹(Zou)等人通过鞘内导管给予约10μl的具有1x 10⁹个转导单位(TU)/ml的滴度的重组慢病毒。在本发明中可以考虑相似剂量的在靶向脑的慢病毒载体中表达的CRISPR Cas用于人类，例如，可以考虑靶向脑的在具有1x 10⁹个转导单位(TU)/ml的滴度的慢病毒中的约10-50ml的CRISPR Cas。

就局部递送至脑部而言，这可以以各种方法实现。例如，材料可以例如通过注射递送到纹状体内。注射可以通过穿颅术定向性进行。

提高NHEJ或HR效率也有助于递送。优选的是，NHEJ效率通过共表达末端加工酶(co-expressing end-processing enzyme)如Trex2而增强(杜米特拉切(Dumitrache)等人《遗传学》(Genetics).2011年8月；188(4):787-797)。优选的是，HR效率通过瞬时抑制NHEJ机构如Ku70和Ku86而增加。HR效率也可以通过共表达原核或真核同源重组酶如RecBCD、RecA而增加。

包装和启动子

介导体内基因组修饰的、将本发明的Cas9编码核酸分子(例如，DNA)包装到载体(例如，病毒载体)中的方式包括：

●为了实现NHEJ介导的基因敲除：

●单病毒载体：

●含有两个或更多个表达盒的载体：

●启动子-Cas9编码核酸分子-终止子

●启动子-gRNA1-终止子

●启动子-gRNA2-终止子

●启动子-gRNA(N)-终止子(一直到载体的大小限制)

●双病毒载体：

●含有一个用于驱动Cas9表达的表达盒的载体1

●启动子-Cas9编码核酸分子-终止子

●启动子-gRNA1-终止子

●启动子-gRNA(N)-终止子(一直到载体的大小限制)

●为了介导同源定向修复。

用来驱动Cas9编码核酸分子表达的启动子可以包括：

—AAV ITR可以用作启动子：这对于消除另外的启动子组件(可在载体中占用空间)的需要是有利的。空出来的另外的空间可以用来驱动另外的组件的表达(gRNA，等等)。同样，ITR活性是较弱的，因此可以用来降低由于Cas9的过表达所致的潜在毒性。

—对于遍存表达，可以使用的启动子包括：CMV、CAG、CBh、PGK、SV40、铁蛋白重链或轻链等。

对于脑或其他CNS表达，可以使用启动子：用于所有神经元的突触蛋白I、用于兴奋性神经元的CaMKIIα、用于GABA能神经元的GAD67或GAD65或VGAT，等等。对于肝脏表达，可以使用白蛋白启动子。对于肺表达，可以使用SP-B。对于内皮细胞，可以使用ICAM。对于造血细胞，可以使用IFNβ或CD45。对于成骨细胞，人们可以使用OG-2。

用来驱动指导RNA的启动子可以包括：

—Pol III启动子，如U6或H1

—使用Pol II启动子和内含子盒来表达gRNA

腺相关病毒(AAV)

Cas9或Cas9突变体或直向同源物以及一种或多种指导RNA可以使用腺相关病毒(AAV)、慢病毒、腺病毒或其他质粒或病毒载体类型进行递送，尤其是，使用来自以下文献的配方和剂量：例如，美国专利号8,454,972(针对腺病毒的配方、剂量)、8,404,658(针对AAV的配方、剂量)和5,846,946(针对DNA质粒的配方、剂量)以及来自临床试验和关于涉及慢病毒、AAV、和腺病毒的临床试验的出版物。例如，对于AAV，给药途径、配方和剂量可以如美国专利号8,454,972并且如涉及AAV的临床试验。对于腺病毒，给药途径、配方和剂量可以如美国专利号8,404,658并且如涉及腺病毒的临床试验。对于质粒递送，给药途径、配方和剂量可以如美国专利号5,846,946并且如涉及质粒的临床试验。剂量可以基于或推断为平均70kg的个体(例如，男性成人)，并且可以针对患者、受试者、不同重量和物种的哺乳动物进行调整。给药频率在医学或兽医学从业者(例如，医师、兽医师)的范围之内，其取决于常规因素，包括患者或受试者的年龄、性别、一般健康状况、其他状况以及着手解决的特殊状况或症状。可以将病毒载体注射到感兴趣的组织中。对于细胞类型特异性基因组修饰，Cas9的表达可以由细胞类型特异性启动子驱动。例如，肝脏特异性表达可以使用白蛋白启动子，而神经元特异性表达(例如，用于靶向CNS障碍)可以使用突触蛋白I启动子。

就体内递送而言，AAV相比于其他病毒载体是有利的，这是由于两个原因：

低毒性(这可以是由于纯化方法不需要细胞粒子的超速离心所致，而超速离心可能激活免疫反应)；

引起插入诱变的低概率，原因在于它未整合到宿主基因组中。

AAV具有4.5或4.75Kb的包装限制。这意味着Cas9以及启动子和转录终止子必须都配合在同一个病毒载体中。大于4.5或4.75Kb的构建体将导致病毒产生的显着降低。SpCas9是相当大的，其基因自身超过4.1Kb，使其难于包装到AAV中。因此本发明的实施例包括利用更短的Cas9同源物。例如：

因此这些物种总体上是优选的Cas9物种。

关于AAV，AAV可以是AAV1、AAV2、AAV5或任何其组合。可以相对于有待被靶向的细胞而选择AAV；例如，可以选择用于靶向脑或神经元细胞的AAV血清型1、2、5或杂合衣壳AAV1、AAV2、AAV5或其任何组合；并且可以选择用于靶向心脏组织的AAV4。AAV8可用于递送到肝脏。本文的启动子和载体是单独优选的。关于这些细胞的某些AAV血清型的表格(参见格林姆(Grimm)，D.等人，《病毒学杂志》(J.Virol.)82:5887-5911(2008))如下：

细胞系	AAV-1	AAV-2	AAV-3	AAV-4	AAV-5	AAV-6	AAV-8	AAV-9
									Huh-7	13	100	2.5	0.0	0.1	10	0.7	0.0
HEK293	25	100	2.5	0.1	0.1	5	0.7	0.1
									海拉(HeLa)	3	100	2.0	0.1	6.7	1	0.2	0.1
HepG2	3	100	16.7	0.3	1.7	5	0.3	ND
									Hep1A	20	100	0.2	1.0	0.1	1	0.2	0.0
911	17	100	11	0.2	0.1	17	0.1	ND
									CHO	100	100	14	1.4	333	50	10	1.0
COS	33	100	33	3.3	5.0	14	2.0	0.5
									MeWo	10	100	20	0.3	6.7	10	1.0	0.2
NIH3T3	10	100	2.9	2.9	0.3	10	0.3	ND
									A549	14	100	20	ND	0.5	10	0.5	0.1
HT1180	20	100	10	0.1	0.3	33	0.5	0.1
									单核细胞	1111	100	ND	ND	125	1429	ND	ND
未成熟DC	2500	100	ND	ND	222	2857	ND	ND
									成熟DC	2222	100	ND	ND	333	3333	ND	ND

慢病毒

慢病毒是复杂的反转录病毒，其具有在有丝分裂细胞和有丝分裂后细胞两者中感染并表达其基因的能力。最为人熟知的慢病毒是人类免疫缺陷病毒(HIV)，其利其他病毒的包膜糖蛋白来靶向广泛范围的细胞类型。

慢病毒可以制备如下。在克隆pCasES10(含有慢病毒转移质粒骨架)之后，将处于低传代数(p＝5)的HEK293FT接种在T-75烧瓶中，直到在转染之前的一天在具有10％胎牛血清而没有抗生素的DMEM中50％汇合。在20小时之后，培养基更换为OptiMEM(无血清)培养基，并且在4小时后进行转染。细胞用10μg的慢病毒转移质粒(pCasES10)和下列包装质粒转染：5μg的pMD2.G(VSV-g假型)、和7.5μg的psPAX2(gag/pol/rev/tat)。在具有阳离子脂质递送剂(50μL的Lipofectamine 2000和100μl的Plus试剂)的4mL OptiMEM中进行转染。在6小时之后，培养基更换为具有10％胎牛血清的无抗生素的DMEM。在细胞培养过程中，这些方法使用血清，但是无血清方法是优选的。

慢病毒可以如下纯化。在48小时后收获病毒上清液。首先清除上清液的碎片并通过0.45μm的低蛋白结合(PVDF)滤膜进行过滤。然后将它们在超速离心机中以24,000rpm旋转2小时。将病毒沉淀重新悬浮在50μl的DMEM中在4C过夜。然后将它们等分，并且立即在-80℃冷冻。

在另一个实施例中，还考虑了基于马传染性贫血病毒(EIAV)的最小非灵长类慢病毒载体，尤其是对于眼基因治疗而言(参见例如，巴鲁谷安(Balagaan)，《基因医学杂志》(JGene Med)2006；8:275-285)。在另一个实施例中，还考虑了一种经由视网膜下注射用于治疗湿型的年龄相关性黄斑变性的、表达血管生成抑制蛋白(内皮抑素和血管抑素)的基于马传染性贫血病毒的慢病毒基因治疗载体(参见，例如，宾利(Binley)等人，《人类基因治疗》(HUMAN GENE THERAPY)23:980-991(2012年9月))，并且这种载体可以经修饰用于本发明的CRISPR-Cas系统。

在另一个实施例中，自灭活慢病毒载体可以用于和/或适合于本发明的CRISPR-Cas系统，该自灭活慢病毒载体具有靶向由HIV tat/rev共享的共有外显子的siRNA、核仁定位TAR诱饵、和抗CCR5特异性锤头状核酶(参见，例如，迪吉斯托(DiGiusto)等人(2010)《科学转化医学》(Sci Transl Med)2:36ra43)。可以收集最少2.5×106个CD34+细胞/每千克患者体重，并且以2×10⁶个细胞/ml的密度在X-VIVO 15培养基中(龙沙公司(Lonza))预刺激16到20个小时，该培养基含有2μmol/L-谷氨酰胺、干细胞因子(100ng/ml)、Flt-3配体(Flt-3L)(100ng/ml)、和促血小板生成素(10ng/ml)(CellGenix公司)。可以用慢病毒以感染复数5在75-cm2的包被有纤连蛋白(25mg/cm2)(重组人纤维蛋白片段(RetroNectin)，宝生物工程株式会社(Takara Bio Inc.))的组织培养瓶中转导预刺激的细胞16到24小时。

慢病毒载体还披露于帕金森病的治疗中，参见，例如，美国专利公开号20120295960以及美国专利号7303910和7351585。慢病毒载体还已经披露于眼病的治疗中，参见例如，美国专利公开号20060281180、20090007284、US 20110117189；US 20090017543；US 20070054961、US 20100317109。慢病毒载体还已经披露于递送到脑中，参见例如，美国专利公开号US 20110293571；US 20110293571、US 20040013648、US 20070025970、US20090111106以及美国专利号US 7259015。

RNA递送

RNA递送：该CRISPR酶，例如Cas9，和/或任何本发明的RNA，例如指导RNA，也可以按RNA的形式递送。可以使用体外转录产生Cas9mRNA。例如，可以使用含有下列组件的PCR盒来合成Cas9mRNA：来自β珠蛋白-polyA尾(一串120个或更多的腺嘌呤)的T7_启动子-科扎克(kozak)序列(GCCACC)-Cas9-3’UTR。该盒可以用于经由T7聚合酶的转录。也可以使用体外转录从含有T7_启动子-GG-指导RNA序列的盒来转录指导RNA。

为了增强表达并且降低可能的毒性，可以，例如，使用假-U或5-甲基-C修饰该CRISPR酶-编码序列和/或指导RNA，以包括一个或多个经修饰的核苷。

mRNA递送方法用于当前的肝脏递送是特别有希望的。

关于RNA递送的很多临床工作已经集中于RNAi或反义上，但是这些系统可以适用于递送RNA用于实现本发明。应当相应地阅读以下关于RNAi等的参考文献。实际上，RNA递送是有用的体内递送方法。有可能使用脂质体或纳米粒子将Cas9和gRNA(以及例如，HR修复模板)递送到细胞中。因此，CRISPR酶如Cas9的递送和/或本发明的RNA的递送可以处于RNA的形式并且经由微囊泡、脂质体或纳米粒子来进行。例如，Cas9mRNA和gRNA可以被包装到脂质体粒子中用于体内递送。脂质体转染试剂例如来自生命技术公司(Life Technologies)的lipofectamine以及市售的其他试剂可以有效地将RNA分子递送到肝脏中。

RNA的粒子递送

RNA的递送手段还优选包括经由纳米粒子的RNA递送(卓(Cho)S.、金伯格(Goldberg)M.、松(Son)S.、许(Xu)Q.、杨(Yang)F.、梅(Mei)Y.、博加特廖夫(Bogatyrev)S.、朗格(Langer)R.和安德森(Anderson)D.，“用于将小干扰RNA递送到内皮细胞的脂质样纳米粒子”(Lipid-like nanoparticles for small interfering RNA delivery toendothelial cells)，《先进功能材料》(Advanced Functional Materials)，19:3112-3118，2010)或外排体(施罗德(Schroeder)A.、莱文斯(Levins)C.、科特斯(Cortez)C.、朗格(Langer)R.、和安德森(Anderson)D.，“用于siRNA递送的基于脂质的纳米治疗剂”(Lipid-based nanotherapeutics for siRNA delivery)，《内科学杂志》(Journal of InternalMedicine)，267:9-21，2010，PMID:20059641)。事实上，已经表明外排体在递送siRNA中特别有用，其为与CRISPR系统有一些相似之处的系统。例如，艾尔·安达卢西(El-Andaloussi)S等人(“外排体介导的体外和体内siRNA递送”(“Exosome-mediated delivery of siRNA invitro and in vivo”).《自然-实验手册》(Nat Protoc.)2012年12月；7(12):2112-26.doi:10.1038/nprot.2012.131.电子版2012年11月15日描述了外排体对于跨不同的生物屏障的药物递送是有希望的工具并且可以用于体外和体内递送siRNA。其途径在于通过转染包含与肽配体融合的外排体蛋白的表达载体产生靶向外排体。然后将这些外排体纯化并且从转染的细胞上清液中表征，然后将RNA加载到外排体中。根据本发明的递送或给药可以用外排体进行，尤其是但不限于脑。维生素E(α-生育酚)可以与CRISPR Cas结合并且连同高密度脂蛋白(HDL)一起递送到脑，例如以与乌诺(Uno)等人完成的用于将短干扰RNA(siRNA)递送到脑的类似方式《人类基因治疗》(HUMAN GENE THERAPY)22:711-719(2011年6月)。经由用磷酸盐缓冲盐水(PBS)或游离TocsiBACE或Toc-siBACE/HDL充满的并且与脑灌注试剂盒3(Brain Infusion Kit 3)(Alzet公司)连接的微渗透压泵(型号1007D；Alzet公司，库比蒂诺(Cupertino)，CA)灌注小鼠。将一根脑灌注导管置于在正中线的前囱的后方约0.5mm，用于灌注到背侧第三脑室中。乌诺(Uno)等人发现，通过相同的ICV灌注方法，少至3nmol的Toc-siRNA与HDL可诱导相当程度的靶减少。可以考虑结合至α-生育酚的并且与HDL共同给予靶向脑的相似剂量的CRISPR Cas用于本发明，例如，可以考虑靶向脑的约3nmol到约3μmol的CRISPR Cas。邹(Zou)等人(《人类基因治疗》(HUMAN GENE THERAPY 22:465-475(2011年4月))描述了靶向PKCγ的短发夹RNA的慢病毒介导的递送方法，其用于在大鼠脊髓中的体内基因沉默。邹(Zou)等人通过鞘内导管给予约10μl的具有1x 10⁹个转导单位(TU)/ml的滴度的重组慢病毒。在本发明中可以考虑相似剂量的在靶向脑的慢病毒载体中表达的CRISPR Cas用于人类，例如，可以考虑靶向脑的在具有1x 10⁹个转导单位(TU)/ml的滴度的慢病毒中的约10-50ml的CRISPR Cas。

就局部递送至脑部而言，这可以以各种方法实现。例如，材料可以，例如，通过注射递送到纹状体内。注射可以通过穿颅术定向性进行。

质粒递送

在一些实施例中，本发明的RNA分子在脂质体或阳离子脂质体配制品等等中进行递送并且可以通过本领域技术人员熟知的方法进行制备。这样的方法描述于例如美国专利号5,593,972、5,589,466和5,580,859中，将其通过引用并入本文。已经开发了专门针对增强和改进递送siRNA到哺乳动物细胞中的递送系统(参见例如，沈(Shen)等人《欧洲生化学会联合会快报》(FEBS Let.)2003，539:111-114；夏(Xia)等人，《自然生物技术》(Nat.Biotech.)2002,20:1006-1010；赖希(Reich)等人，《分子视界》(Mol.Vision.)2003,9:210-216；索伦森(Sorensen)等人，《分子生物学杂志》(J.Mol.Biol.)2003,327:761-766；刘易斯(Lewis)等人，《自然遗传学》(Nat.Gen.)2002，32:107-108以及西梅奥尼(Simeoni)等人，NAR 2003，31，11:2717-2724)并且可以将其应用于本发明。最近，siRNA已经成功用于抑制灵长类动物中的基因表达(参见例如，托伦蒂诺(Tolentino)等人，《视网膜》(Retina)24(4):660)，它也可应用于本发明。

关于粒子递送的一般信息

此外，提及的是标题为“用于使用粒子递送组分靶向障碍和疾病的CRISPR-CAS系统和组合物的递送、用途和治疗应用(DELIVERY,USE AND THERAPEUTIC APPLICATIONS OFTHE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR TARGETING DISORDERS AND DISEASESUSING PARTICLE DELIVERY COMPONENTS)”PCT申请PCT/US 14/70057，案卷参考47627.99.2060和BI-2013/107(要求来自以下一个或多个或所有美国临时专利申请的权益：提交于2014年9月24日的62/054,490；提交于2014年6月10日的62/010,441；以及各自提交于2013年12月12日的61/915,118、61/915,215和61/915,148)(“粒子递送PCT”)，将其通过引用并入本文，关于制备含有sgRNA-和-Cas9蛋白的粒子的方法，该方法包括将包含sgRNA和Cas9蛋白(和任选地HDR模板)的混合物与以下混合物混合，该混合物包含表面活性剂、磷脂、生物可降解聚合物、脂蛋白和醇或基本上由其组成或由其组成；以及来自这样的工艺的粒子。例如，其中使Cas9蛋白和sgRNA在适合的温度(例如，15℃-30℃，例如，20℃-25℃，例如，室温)下以适合的摩尔比(例如，3:1至1:3或2:1至1:2或1:1)有利地在无菌、无核酸酶缓冲液(例如，1X PBS)中一起混合适合的时间(例如，15-45，如30分钟)。分开地，粒子组分如或包含：表面活性剂(例如，阳离子脂质(例如，1,2-二油酰基-3-三甲基铵-丙烷(DOTAP)))；磷脂(例如，二肉豆蔻磷脂酰胆碱(DMPC))；生物可降解聚合物(如乙二醇聚合物或PEG)、以及脂蛋白，如低密度脂蛋白，例如，胆固醇溶解于醇中，有利地是C1-6烷基醇，如甲醇、乙醇、异丙醇，例如100％乙醇。将这两种溶液混合在一起以形成含有Cas9-sgRNA复合物的粒子。因此，在粒子中配制整个复合物之前，可以使sgRNA与该Cas9蛋白预复合。可以制备具有不同摩尔比的不同已知组分的配制品，以促进将核酸递送到细胞(例如1,2-二油酰基-3-三甲基铵-丙烷(DOTAP)、1,2-二十四酰基-sn-甘油-3-磷酸胆碱(DMPC)、聚乙二醇(PEG)和胆固醇)。例如，DOTAP:DMPC:PEG:胆固醇摩尔比可以是DOTAP 100、DMPC 0、PEG 0、胆固醇0；或DOTAP 90、DMPC 0、PEG 10、胆固醇0；或DOTAP 90、DMPC 0、PEG 5、胆固醇5。DOTAP 100、DMPC 0、PEG 0、胆固醇0。因此，该申请包括将sgRNA、Cas9蛋白和形成粒子的组分混合；连同来自此类混合的粒子。本发明的方面可以涉及粒子；例如，使用类似于粒子递送PCT的工艺的粒子，例如通过将如在本发明中的sgRNA和/或Cas9蛋白的混合物和形成粒子的组分混合，例如如在粒子递送PCT中，以形成粒子；以及来自这样的混合的粒子(或者，当然，涉及如在本发明中的sgRNA和/或Cas9的其他粒子)。

粒子递送系统和/或配制品

已知一些类型的粒子递送系统和/或配制品在不同种类的生物医学应用中是有用的。总体上，粒子被定义为小物体，该物体在其运输和特性方面以整体单元表现。根据直径将粒子进一步分类。粗粒子涵盖在2,500与10,000纳米之间的范围。细粒子的尺寸在100与2,500纳米之间。超细粒子、或纳米粒子的大小通常是在1和100纳米之间。100-nm极限的基础是以下事实：使粒子区分于大块材料的新颖特性典型地是在100nm之下的临界长度规模下显现的。

如在此所使用的，粒子递送系统/配制品被定义为任何包括根据本发明的粒子的生物学递送系统/配制品。根据本发明的粒子是任何具有小于100微米(μm)的最大尺寸(例如直径)的实体。在一些实施例中，本发明的粒子具有小于10μm的最大尺寸。在一些实施例中，本发明的粒子具有小于2000纳米(nm)的最大尺寸。在一些实施例中，本发明的粒子具有小于1000纳米(nm)的最大尺寸。在一些实施例中，本发明的粒子具有小于900nm、800nm、700nm、600nm、500nm、400nm、300nm、200nm、或100nm的最大尺寸。典型地，本发明的粒子具有500nm或更小的最大尺寸(例如，直径)。在一些实施例中，本发明的粒子具有250nm或更小的最大尺寸(例如，直径)。在一些实施例中，本发明的粒子具有200nm或更小的最大尺寸(例如，直径)。在一些实施例中，本发明的粒子具有150nm或更小的最大尺寸(例如，直径)。在一些实施例中，本发明的粒子具有100nm或更小的最大尺寸(例如，直径)。在本发明的一些实施例中使用更小的粒子(例如，具有50nm或更小的最大尺寸)。在一些实施例中，本发明的粒子具有范围在25nm与200nm之间的最大尺寸。

粒子表征(包括，例如表征形态、尺寸、等)是使用各种不同的技术进行的。通用技术是电子显微术(TEM、SEM)、原子力显微镜(AFM)、动态光散射(DLS)、X-射线光电子光谱法(XPS)、粉末X射线衍射(XRD)、傅里叶变换红外光谱法(FTIR)、基质辅助激光解吸/电离飞行时间质谱法(MALDI-TOF)、紫外-可见光谱法、双偏振干涉法以及核磁共振(NMR)。表征(尺寸测量)可以针对天然粒子(即预加载)或在加载负荷物(在此负荷物指代例如CRISPR-Cas系统的一种或多种组分，例如CRISPR酶或mRNA或指导RNA、或其任何组合，并且可以包括另外的载体和/或赋形剂)后进行，以提供具有最适大小的粒子以用于任何本发明的体外、离体和/或体内施用的递送。在某些优选实施例中，粒子尺寸(例如，直径)表征是基于使用动态激光散射(DLS)的测量。可提及的是美国专利号8,709,843；美国专利号6,007,845；美国专利号5,855,913；美国专利号5,985,309；美国专利号5,543,158；以及詹姆斯(James)E.达尔曼(Dahlman)和卡门巴尔内斯(Carmen Barnes)等人在《自然纳米技术》(NatureNanotechnology)(2014)的公开物，在线公开于2014年5月11日，doi:10.1038/nnano.2014.84，以上文献涉及粒子、制造和使用它们的方法及其测量。

在本发明的范围内的粒子递送系统可以按任何形式提供，包括但不限于固体、半固体、乳液、或胶体粒子。这样可以将在此描述的任何递送系统，包括但不限于例如基于脂质的系统、脂质体、胶束、微泡、外排体、或基因枪，提供为在本发明的范围内的粒子递送系统。

粒子

可以使用粒子或脂质包膜同时递送CRISPR酶mRNA和指导RNA；例如，可以经由粒子递送本发明的CRISPR酶和RNA(例如，作为复合物)，如在达尔曼(Dahlman)等人，WO2015089419A2和其中引用的文献中的，如7C1(参见例如，詹姆斯(James)E.达尔曼(Dahlman)和卡门巴尔内斯(Carmen Barnes)等人《自然纳米技术》(NatureNanotechnology)(2014)在线公开于2014年5月11日，doi:10.1038/nnano.2014.84)，例如，包含脂质或类脂质和亲水聚合物(例如阳离子脂质和亲水聚合物)的递送粒子，例如其中该阳离子脂质包括1,2-二油酰基-3-三甲基铵-丙烷(DOTAP)或1,2-二十四酰基-sn-甘油-3-磷酸胆碱(DMPC)和/或其中该亲水聚合物包括乙二醇或聚乙二醇(PEG)；和/或其中该粒子进一步包含胆固醇(例如，来自以下项的粒子：配制品1＝DOTAP 100、DMPC 0、PEG 0、胆固醇0；配制品编号2＝DOTAP 90、DMPC 0、PEG 10、胆固醇0；配制品编号3＝DOTAP 90、DMPC 0、PEG 5、胆固醇5)，其中使用有效的多步方法形成粒子，其中第一步，将效应蛋白和RNA例如在无菌、不含核酸酶的1X PBS中例如在室温下以例如1:1的摩尔比在一起混合例如30分钟；并且分开地，将如适用于该配制品的DOTAP、DMPC、PEG、和胆固醇溶解于醇(例如，100％乙醇)中；并且，将这两种溶液混合在一起以形成含有这些复合物的粒子)。

例如，苏(Su)X、弗里克(Fricke)J、卡瓦纳(Kavanagh)DG、欧文(Irvine)DJ(“使用脂质包封的pH响应性聚合物纳米粒子的体外和体内mRNA递送”(“In vitro and invivomRNA delivery using lipid-enveloped pH-responsive polymernanoparticles”)《分子药理学》(Mol Pharm.)2011年6月6；8(3):774-87.doi:10.1021/mp100390w.2011年4月1日电子版)描述了生物可降解的核-壳结构粒子，其具有由磷脂双层壳包封的聚(β-氨基酯)(PBAE)核。这些被开发为用于体内mRNA递送。该pH响应性PBAE被选择为促进内体破裂，而该脂质表面层被选择为使聚阳离子核的毒性最小化。因此，这些对于递送本发明的RNA是优选的。

在一个实施例中，考虑了基于自组装生物粘附聚合物的粒子，其可应用于肽的经口递送、肽的静脉内递送以及肽的鼻递送，均递送到脑。其他实施例，还考虑了例如疏水性药物的经口吸收和眼部递送。分子包膜技术涉及被保护并递送到疾病部位的工程化聚合物包膜(参见例如，马萨(Mazza)M.等人，《ACS纳米》(ACSNano)，2013.7(2):1016-1026；秀(Siew)A.等人，《分子药理学》(Mol Pharm)，2012.9(1):14-28；拉拉特萨(Lalatsa)A.等人，《控释杂志》(J Contr Rel)，2012.161(2):523-36；拉拉特萨(Lalatsa)A.等人，《分子药理学》(Mol Pharm)，2012.9(6):1665-80；拉拉特萨(Lalatsa)A.等人，《分子药理学》(MolPharm)，2012.9(6):1764-74；加勒特(Garrett)N.L.等人，《生物光电杂志》(JBiophotonics)，2012.5(5-6):458-68；加勒特(Garrett)N.L.等人，《拉曼光谱杂志》(JRaman Spect)，2012.43(5):681-688；阿哈默德(Ahmad)S.等人，《皇家学会界面杂志》(JRoyal Soc Interface)2010.7:S423-33；乌切克布(Uchegbu)I.F.《药物递送专家评论》(Expert Opin Drug Deliv)，2006.3(5):629-40；曲(Qu)X.等人《生物大分子》(Biomacromolecules)，2006.7(12):3452-9和乌切克布(Uchegbu)I.F.等人，《国际药学杂志》(Int J Pharm)，2001.224:185-199)。考虑了约5mg/kg的剂量，呈单剂量或多剂量形式，这取决于靶组织。

在一个实施例中，可以使用由丹·安德森实验室(Dan Anderson’s lab)在MIT开发的可将RNA递送到癌细胞以便使肿瘤生长停止的粒子/并且或使其适用于本发明的CRISPR Cas系统。具体地说，安德森实验室开发了用于新生物材料和纳米制剂的合成、纯化、表征、和配制的全自动化组合系统。参见例如，阿拉比(Alabi)等人，《美国国家科学院院刊》(Proc Natl Acad Sci U S A.)2013年8月6日；110(32):12881-6；张(Zhang)等人，《先进材料》(Adv Mater.)2013年9月6日；25(33):4641-5；江(Jiang)等人，《纳米通讯》(NanoLett.)2013年3月13日；13(3):1059-64；卡拉吉安尼斯(Karagiannis)等人，《ACS纳米》(ACSNano.)2012年10月23日；6(10):8484-7；怀特海德(Whitehead)等人，《ACS纳米》(ACSNano.)2012年8月28日；6(8):6922-9和李(Lee)等人，《自然纳米技术》(Nat Nanotechnol.)2012年6月3日；7(6):389-93。

美国专利申请20110293703涉及类脂质化合物，这些化合物在多核苷酸的给药中也是特别有用的，其可适用于递送本发明的CRISPR Cas系统。在一个方面，氨基醇类脂质化合物与有待递送到细胞或受试者的药剂结合而形成微粒子、纳米粒子、脂质体、或胶束。有待通过粒子、脂质体、或胶束递送的药剂可以处于气体、液体、或固体的形式，并且该药剂可以是多核苷酸、蛋白质、肽、或小分子。这些氨基醇类脂质化合物可以与其他氨基醇类脂质化合物、聚合物(合成的或天然的)、表面活性剂、胆固醇、碳水化合物、蛋白质、脂质、等等形成粒子。然后这些粒子可以任选地与药用赋形剂结合而形成药物组合物。

美国专利公开号20110293703也提供了制备氨基醇类脂质化合物的方法。使胺的一种或多种等效物与环氧化物封端化合物的一种或多种等效物在适当条件下反应而形成本发明的氨基醇类脂质化合物。在某些实施例中，胺的所有氨基基团与环氧化物封端化合物充分反应而形成叔胺。在其他实施例中，胺的所有氨基基团未与环氧化物封端化合物完全反应形成叔胺，由此生成在氨基醇类脂质化合物中的伯胺或仲胺。这些伯胺或仲胺照原样留下或者可以与另一种亲电体如不同的环氧化物封端化合物反应。正如本领域技术人员将理解的，胺与未过量的环氧化物封端化合物反应将产生多种不同的具有不同数目的尾部的氨基醇类脂质化合物。某些胺类可以用两个环氧化物衍生的化合物尾部将其完全功能化，而其他分子用环氧化物衍生的化合物尾部将不会被完全功能化。例如，二胺或多胺可包括离开该分子的不同氨基部分的一个、二个、三个、或四个环氧化物衍生的化合物尾部，从而产生伯胺、仲胺、和叔胺。在某些实施例中，并不是所有氨基基团都被完全功能化。在某些实施例中，使用相同类型的环氧化物封端化合物中的两种。在其他实施例中，使用两种或更多种不同的环氧化物封端化合物。氨基醇类脂质化合物的合成是用或不用溶剂进行的，并且该合成可以在范围从30℃-100℃，优选在大致50℃-90℃的较高温度下进行。任选地，可以将制备的氨基醇类脂质化合物纯化。例如，可以纯化氨基醇类脂质化合物的混合物而产生具有特定数目的、环氧化物衍生的化合物尾部的氨基醇类脂质化合物。或者，该混合物可以被纯化而产生特定的立体异构体或区域异构体。也可以使用烷基卤化物(例如，碘甲烷)或其他烷化剂将这些氨基醇类脂质化合物烷化，和/或它们可以被酰化。

美国专利公开号20110293703还提供了通过发明方法制备的氨基醇类脂质化合物的文库。使用涉及液体处理器、机器人、微量滴定板、计算机等的高通量技术，可以制备和/或筛选这些氨基醇类脂质化合物。在某些实施例中，筛选了这些氨基醇类脂质化合物的将多核苷酸或其他药剂(例如，蛋白质、肽、小分子)转染到细胞中的能力。

美国专利公开号20130302401涉及已经使用组合聚合制备的一类聚(β-氨基醇)(PBAAs)。这些发明的PBAA可以在生物技术和生物医学应用中用作涂层(如用于医疗装置或植入物的薄膜或多层薄膜的涂层)、添加剂、材料、赋形剂、生物防污剂(non-biofoulingagent)、微图像化剂(micropatterning agent)、以及细胞封装剂(cellularencapsulation agent)。当用作表面涂层时，这些PBAA在体外和体内均引出不同水平的炎症，这取决于它们的化学结构。这类材料的巨大化学多样性允许我们鉴定出体外抑制巨噬细胞激活的聚合物涂层。此外，在羧化聚苯乙烯微粒的皮下移植之后，这些涂层减少了炎症细胞的募集，并且减轻了纤维化。这些聚合物可以用来形成用于细胞封装的聚电解质复合物胶囊。本发明还可具有许多其他的生物应用，如抗微生物涂层、DNA或siRNA递送、以及干细胞组织工程。美国专利公开号20130302401的传授内容可以适用于本发明的CRISPR Cas系统。在一些实施例中，可以使用基于糖的粒子，例如GalNAc，如本文所描述的，并且参考WO2014118272(通过引用并入本文)和耐尔(Nair)，JK等人，2014，《美国化学会志》(Journalof the American Chemical Society)136(49)，16958-16961以及本文的传授，尤其是就应用于所有粒子的递送而言，除非另外是显而易见的。

在另一个实施例中，考虑了脂质粒子(LNP)。抗转甲状腺素蛋白小干扰RNA已经被封装在脂质粒子中并且被递送到人体内(参见，例如，科尔贺(Coelho)等人，《新英格兰医学杂志》(N Engl J Med)2013；369:819-29)，并且这样一种系统可以适用于并且应用于本发明的CRISPR Cas系统。考虑到静脉内给予约0.01到约1mg/kg体重的剂量。考虑了降低输注相关反应的风险的用药，如考虑到地塞米松、对乙酰氨基酚(acetampinophen)、苯海拉明或西替利嗪、以及雷尼替丁。考虑了约0.3mg/千克的多剂量，每4周一次，五个剂量。

LNP已经显示在将siRNA递送到肝脏中是高度有效的(参见，例如，塔韦内罗(Tabernero)等人，《癌症发现》(Cancer Discovery)，2013年4月，第3卷，第4期，第363-470页)，并且因此被考虑用于递送编码CRISPR Cas的RNA到肝脏。考虑了6mg/kg的LNP的约四个剂量的用量，每两周一次。塔韦内罗(Tabernero)等人证明，在以0.7mg/kg给予LNP的前2个周期之后，观察到肿瘤消退，并且在6个周期结束之后，患者已经实现了部分应答，具有淋巴结转移完全消退以及肝脏肿瘤的显着萎缩。在此患者中给予40个剂量之后获得完全应答，在接受经过26个月的剂量之后其保持缓解和完全治疗。具有RCC和在用VEGF途径抑制剂进行的在先治疗之后进展的包括肾脏、肺、以及淋巴结在内的肝外部位疾病的两位患者在所有部位的疾病都保持稳定大约8到12个月，并且一位具有PNET和肝转移的患者继续在18个月(36个剂量)的延伸研究中保持疾病稳定。

然而，必须将LNP的电荷考虑在内。当阳离子脂质与带负电的脂质结合时，诱导促进细胞内递送的非双层结构。由于带电荷的LNP在静脉注射之后迅速从循环中清除，开发了具有低于7的pKa值的可电离阳离子脂质(参见，例如，罗辛(Rosin)等人，《分子治疗》(Molecular Therapy)，第19卷，第12期，第1286-2200页，2011年12月)。带负电荷的聚合物如RNA可以低pH值(例如，pH 4)加载到LNP中，在此pH时可电离脂质展示出正电荷。然而，在生理学pH值时，LNP展现出与更长的循环时间相容的低表面电荷。已经关注了四种可电离阳离子脂质，即1,2-二亚油酰基-3-二甲基铵-丙烷(DLinDAP)、1,2-二亚油基氧基-3-N,N-二甲基氨基丙烷(DLinDMA)、1,2-二亚油基氧基-酮基-N,N-二甲基-3-氨基丙烷(DLinKDMA)、以及1,2-二亚油基-4-(2-二甲基氨基乙基)-[1,3]-二氧戊环(DLinKC2-DMA)。已经表明，含有这些脂质的LNP siRNA系统在体内肝细胞中展现出显着不同的基因沉默特性，具有根据采用因子VII基因沉默模型的DLinKC2-DMA>DLinKDMA>DLinDMA>>DLinDAP系列而变化的潜能(参见，例如，罗辛(Rosin)等人，《分子治疗》(Molecular Therapy)，第19卷，第12期，第1286-2200页，2011年12月)。可以考虑LNP或者在LNP中的或与LNP相关的CRISPR-Cas RNA的1μg/ml的剂量，尤其是对于含有DLinKC2-DMA的配制品而言。

LNP的制备和CRISPR Cas封装可以使用/和或改编自罗辛(Rosin)等人的《分子治疗》(Molecular Therapy)，第19卷，第12期，第1286-2200页，2011年12月)。阳离子脂质1,2-二亚油酰基-3-二甲基铵-丙烷(DLinDAP)、1,2-二亚油基氧基-3-N,N-二甲基氨基丙烷(DLinDMA)、1,2-二亚油基氧基酮基-N,N-二甲基-3-氨基丙烷(DLinK-DMA)、1,2-二亚油基-4-(2-二甲基氨基乙基)-[1,3]-二氧戊环(DLinKC2-DMA)、(3-o-[2″-(甲氧基聚乙二醇2000)琥珀酰]-1,2-二肉豆蔻酰基-sn-二醇(PEG-S-DMG)、以及R-3-[(ω-甲氧基-聚(乙二醇)2000)氨甲酰]-1,2-二肉豆蔻酰氧基丙基-3-胺(PEG-C-DOMG)可以由Tekmira制药公司(Tekmira Pharmaceuticals)(温哥华，加拿大)提供或者合成。胆固醇可以购自西格玛公司(圣刘易斯，密苏里州)。特异性CRISPR Cas RNA可以封装在含有DLinDAP、DLinDMA、DLinK-DMA、和DLinKC2-DMA的LNP中(阳离子脂质:DSPC:CHOL:PEGS-DMG或PEG-C-DOMG的摩尔比为40:10:40:10)。在需要时，可以结合0.2％SP-DiOC18(英杰公司，伯灵顿，加拿大)来评估细胞摄取、细胞内递送、和生物分布。通过将由阳离子脂质:DSPC:胆固醇:PEG-c-DOMG(40:10:40:10摩尔比)组成的混合物溶解在乙醇中直到最终脂质浓度为10mmol/l来进行封装。可以将脂质的这种乙醇溶液逐滴加入到pH 4.0的50mmol/l柠檬酸盐中而形成多层囊泡，从而产生30％(vol/vol)乙醇的最终浓度。在使用挤出机(北方脂质公司(Northern Lipids)，温哥华，加拿大)通过两个重叠的80nm Nuclepore聚碳酸酯滤膜挤出多层囊泡之后，可以形成大的单层囊泡。可以通过如下步骤实现封装：将溶解在含有30％乙醇(vol/vol)的pH 4.0的50mmol/l柠檬酸盐中的2mg/ml的RNA逐滴加入到挤出的形成的大单层囊泡中，并且在31℃孵育30分钟，伴随持续混合直到最终的RNA/脂质重量比为0.06/1(wt/wt)。通过使用Spectra/Por 2再生纤维素透析膜在pH为7.4的磷酸盐缓冲盐水中透析16小时进行乙醇的去除以及配制缓冲液的中和。使用NICOMP 370型粒径分析仪、囊泡/强度模式、以及高斯拟合，通过动态光散射，可以测定粒度分布(Nicomp粒径分析仪公司(Nicomp ParticleSizing)，圣巴巴拉市，加利福尼亚州)。对于所有三个LNP系统的粒径可以是约70nm的直径。可以通过使用VivaPureD MiniH柱(赛多利斯斯泰迪生物技术公司(Sartorius StedimBiotech))从分析前后收集的样品中去除游离RNA来确定RNA封装效率。从洗脱的粒子提取封装的RNA并且将其在260nm定量。通过使用来自美国瓦克化学公司(Wako Chemicals USA)(里士满(Richmond)，弗吉尼亚州)的胆固醇E酶法测定法测量囊泡中的胆固醇含量，确定了RNA与脂质的比率。与本文关于LNP和PEG脂质的讨论结合，聚乙二醇化的脂质体或LNP同样适于递送CRISPR-Cas系统或其组分。

大LNP的制备可以使用/和或改编自罗辛(Rosin)等人的《分子治疗》(MolecularTherapy)，第19卷，第12期，第1286-2200页，2011年12月。可以在含有50:10:38.5的摩尔比的DLinKC2-DMA、DSPC、和胆固醇的乙醇中制备脂质预混物溶液(20.4mg/ml总脂质浓度)。可以按照0.75:1的摩尔比(乙酸钠:DLinKC2-DMA)将乙酸钠添加到脂质预混物中。随后可以通过将该混合物与1.85倍体积的柠檬酸盐缓冲液(10mmol/l，pH 3.0)在剧烈搅拌下合并而使脂质水合，从而导致在含有35％的在水性缓冲液中的自发脂质体形成。可以在37℃孵育该脂质体溶液以允许粒径的时间依赖性增加。可以通过动态光散射(纳米粒径电位分析仪(Zetasizer Nano ZS)，马尔文仪器公司(Malvern Instruments)，乌斯特郡(Worcestershire)，英国)在孵育的不同时间去除等分试样以研究脂质体大小的变化。一旦实现所希望的粒径，可以将水性PEG脂质溶液(储备溶液＝在35％(vol/vol)乙醇中的10mg/ml PEG-DMG)添加到该脂质体混合物中，以便产生3.5％总脂质的最终PEG摩尔浓度。在添加PEG-脂质之后，这些脂质体应该其大小，有效抑制进一步生长。然后以大约1:10(wt:wt)的RNA与总脂质比率将RNA添加到空脂质体，然后在37℃孵育30分钟以形成加载的LNP。随后将该混合物在PBS中透析过夜，并且用0.45-μm的注射器过滤器。

球形核酸(SNA^TM)构建体和其他粒子(尤其是金粒子)也被考虑为将CRISPR-Cas系统递送到预期靶标的手段。重要数据表明，基于核酸功能化的金粒子的AuraSense治疗性球形核酸(SNA^TM)构建体是有用的。

可以与本文的传授结合使用的文献包括：卡特勒(Cutler)人，《美国化学会志》(J.Am.Chem.Soc.)2011 133:9254-9257，郝(Hao)等人，Small.2011 7:3158-3162，张(Zhang)等人，《ACS纳米》(ACS Nano.)2011 5:6962-6970，卡特勒(Cutler)等人，《美国化学会志》(J.Am.Chem.Soc.)2012 134:1376-1391，杨(Young)等人，《纳米通讯》(Nano Lett.)2012 12:3867-71，郑(Zheng)等人，《美国国家科学院院刊》(Proc.Natl.Acad.Sci.USA.)2012 109:11975-80，米尔金(Mirkin)，《纳米医学》(Nanomedicine)2012 7:635-638张(Zhang)等人，《美国化学会志》(J.Am.Chem.Soc.)2012 134:16488-1691，因特劳布(Weintraub)，《自然》(Nature)2013 495:S14-S16，崔(Choi)等人，《美国国家科学院院刊》(Proc.Natl.Acad.Sci.USA.)2013 110(19):7625-7630，约翰逊(Jensen)等人，《科学转化医学》(Sci.Transl.Med.)5，209ra152(2013)以及米尔金(Mirkin)等人，Small，10:186-192。

具有RNA的自组装粒子可以用被聚乙二醇化的聚乙烯亚胺(PEI)进行构建，其中Arg-Gly-Asp(RGD)肽配体附接在聚乙二醇(PEG)的远端。例如，这一系统已经被用作靶向表达整合素的肿瘤新血管系统和递送抑制血管内皮生长因子受体2(VEGF R2)表达以及由此实现抑制肿瘤血管发生的siRNA的手段(参见，例如，施弗勒斯(Schiffelers)等人，《核酸研究》(Nucleic Acids Research)，2004，第32卷，第19期)。通过将等体积的阳离子聚合物水溶液和核酸水溶液混合从而产生在2到6范围上的可电离氮(聚合物)相比磷酸盐(核酸)的净摩尔过量，从而制备纳米束。在阳离子聚合物与核酸之间的静电相互作用导致聚复合物的形成，其具有约100nm的平均粒径分布，此后称为纳米束。设想了CRISPR Cas的约100到200mg的剂量，用于施弗勒斯(Schiffelers)等人的自组装粒子中的递送。

巴特利特(Bartlett)等人的纳米束(PNAS，2007年9月25日，第104卷，第39期)也可以应用于本发明。通过将等体积的阳离子聚合物水溶液和核酸水溶液混合从而产生在2到6范围上的可电离氮(聚合物)相比磷酸盐(核酸)的净摩尔过量，从而制备巴特利特(Bartlett)等人的纳米束。在阳离子聚合物与核酸之间的静电相互作用导致聚复合物的形成，其具有约100nm的平均粒径分布，此后称为纳米束。巴特利特(Bartlett)等人的DOTA-siRNA合成如下：1,4,7,10-四氮杂环十二烷-1,4,7,10-四乙酸单(N-羟基琥珀酰亚胺酯)(DOTA-NHSester)订购自Macrocyclics公司(达拉斯(Dallas)，德克萨斯州)。将碳酸盐缓冲液(pH 9)中的具有100倍摩尔过量的DOTA-NHS-酯的胺修饰的RNA有义链加入到微量离心管中。通过在室温搅拌4小时使这些内容物反应。将该DOTA-RNA有义缀合物用乙醇沉淀，重新悬浮在水中，并且退火到未修饰的反义链上而产生DOTA-siRNA。所有液体用Chelex-100(Bio-Rad，赫库斯(Hercules)，加利福尼亚州)预处理，以便去除微量金属污染物。通过使用含有环糊精的聚阳离子可以形成Tf靶向和非靶向的siRNA粒子。典型地，粒子以3(+/-)的进料比和0.5g/升的siRNA浓度在水中形成。用Tf(金刚烷-PEG-Tf)修饰在靶向粒子表面上的百分之一的金刚烷-PEG分子。将粒子悬浮在用于注射的5％(wt/vol)的葡萄糖载体溶液中。

戴维斯(Davis)等人(《自然》，第464卷，2010年4月15日)使用靶向的粒子递送系统进行了RNA临床试验(临床试验登记号NCT00689065)。在21天周期的第1、3、8和10天通过30分钟的静脉输注对患有标准护理治疗难治的实体癌的患者给予靶向粒子剂量。这些粒子由合成递送系统组成，该系统含有：(1)线性的、基于环糊精的聚合物(CDP)，(2)展示在粒子的外部上的用于接合癌细胞表面上的TF受体(TFR)的人转铁蛋白(TF)靶向配体，(3)亲水聚合物(用来促进在生物流体中的粒子稳定性的聚乙二醇(PEG))，以及(4)被设计为降低RRM2(在临床中使用的序列，先前表示为siR2B+5)表达的siRNA。TFR已经久为所知在恶性细胞中被下调，并且RRM2是确立的抗癌靶标。已经显示这些粒子(临床版本表示为CALAA-01)在非人类灵长动物中的多剂量研究中良好耐受。虽然已经通过脂质体递送向患有慢性粒细胞白血病的单一患者给予了siRNA，但是戴维斯等人的临床试验是初期人类试验，该试验用一个靶向的递送系统全身性地递送siRNA并且治疗患有实体癌的患者。为了确定该靶向的递送系统是否能够将功能性siRNA有效递送到人类肿瘤，戴维斯(Davis)等人研究了来自三个不同的剂量组群的三位患者的活组织检查；患者A、B和C均患有转移性黑素瘤并且分别接受了18、24和30mg m^-2siRNA的CALAA-01剂量。还可以针对本发明的CRISPR Cas系统考虑相似的剂量。用含有线性的基于环糊精的聚合物(CDP)、展示在粒子的外部上的用于接合癌细胞表面上的TF受体(TFR)的人转铁蛋白(TF)靶向配体和/或亲水聚合物(例如，用来促进在生物流体中的粒子稳定性的聚乙二醇(PEG))的粒子，可以实现本发明的递送。

就本发明而言，优选的是使用粒子或脂质包膜递送CRISPR复合物的一种或多种组分例如CRISPR酶或mRNA或指导RNA。其他递送系统或载体可以结合本发明的粒子方面使用。

通常，“纳米粒子”是指任何具有小于1000nm的直径的粒子。在某些优选实施例中，本发明的纳米粒子具有500nm或更小的最大尺寸(例如，直径)。在其他优选实施例中，本发明的纳米粒子具有范围在25nm与200nm之间的最大尺寸。在其他优选实施例中，本发明的纳米粒子具有100nm或更小的最大尺寸。在其他优选实施例中，本发明的纳米粒子具有范围在35nm与60nm之间的最大尺寸。

包含于本发明中的粒子可以提供为不同形式，例如提供为固体粒子(例如，金属如银、金、铁、钛，非金属，基于脂质的固体，聚合物)、粒子悬浮液、或其组合。可以制备金属粒子、介电粒子和半导体粒子连同混合结构(例如，核-壳粒子)。由半导体材料制成的粒子也可以经量子点标记，如果它们足够小(典型地低于10nm)使得电子能级的量子化发生的话。此类纳米级粒子作为药物载体或成像剂用于生物医学应用中，并且可以被适配为用于本发明中的相似目的。

半-固体和软粒子已经制造出，并且是在本发明的范围内。具有半-固体性质的原型粒子是脂质体。各种类型的脂质体粒子目前在临床上用作用于抗癌药物和疫苗的递送系统。一半亲水并且另一半疏水的粒子称为杰那斯(Janus)粒子，并且对于稳定乳液是特别有效的。它们可以在水/油界面处自组装，并且充当固体表面活性剂。

美国专利号8,709,843(通过引用结合在此)提供了用于将包含治疗剂的粒子靶向递送至组织、细胞和细胞内隔室的药物递送系统。本发明提供了包含聚合物的靶向粒子，该聚合物缀合至表面活性剂、亲水聚合物或脂类。通过引用结合在此的美国专利号6,007,845提供了以下粒子，这些粒子具有多嵌段共聚物的核，该多嵌段共聚物是通过将多官能化合物与一种或多种疏水聚合物和一种或多种亲水聚合物共价连接而形成的，并且这些粒子包含生物活性材料。通过引用并入本文的美国专利号5,855,913提供了具有空气动力学上轻的粒子的微粒组合物，这些空气动力学上轻的粒子具有小于0.4g/cm3的振实密度，其平均直径在5μm与30μm之间，将表面活性剂结合在其表面以用于将药物递送至肺部系统。通过引用并入本文的美国专利号5,985,309提供了以下粒子，这些粒子结合表面活性剂和/或带正电或负电的治疗剂或诊断剂和相反电荷带电分子的亲水或疏水复合物，以用于递送至肺部系统。通过引用并入本文的美国专利号5,543,158提供了生物可降解的可注射粒子，这些可注射粒子具有生物可降解的固体核，该固体核在表面上包含生物活性材料和聚(亚烷基二醇)部分。通过引用结合在此的WO 2012135025(也公开为US 20120251560)描述了缀合的聚乙烯亚胺(PEI)聚合物和缀合的氮杂-大环化合物(统称为“缀合的微脂体(lipomer)”或“微脂体”)。在某些实施例中，可设想此类缀合的微脂体可以在CRISPR-Cas系统的背景下使用，以实现体外、离体和体内基因组干扰以修饰基因表达，包括调节蛋白表达。

在一个实施例中，该粒子可以是环氧化物-修饰的脂质-聚合物，有利地为7C1(参见例如，詹姆斯(James)E.达尔曼(Dahlman)和卡门巴尔内斯(Carmen Barnes)等人在《自然纳米技术》(Nature Nanotechnology)(2014)的公开物，在线公开于2014年5月11日，doi:10.1038/nnano.2014.84)。C71是通过使C15环氧化物终止的脂质与PEI600以14:1摩尔比进行反应来合成，并且与C14PEG2000配制以产生在PBS溶液中稳定持续至少40天的粒子(直径在35与60nm之间)。

可以利用环氧化物-修饰的脂质-聚合物将本发明的CRISPR-Cas系统递送至肺部细胞、心血管细胞或肾细胞，然而本领域的技术人员可以调适该系统以递送到其他靶器官。设想了从约0.05至约0.6mg/kg的剂量范围。还设想了经数天或数周的剂量，其中总剂量为约2mg/kg。

外排体

外排体是转运RNA和蛋白质的并且可以向脑和其他靶器官中递送RNA的内源纳米囊泡。为了降低免疫原性，阿尔瓦雷斯-尔维蒂(Alvarez-Erviti)等人(2011，《自然生物技术》29:341)使用了用于外排体产生的自我衍生的树突细胞。通过将树突细胞工程化为表达Lamp2b(一种外泌体膜蛋白，融合到神经元特异性RVG肽上)而实现了靶向脑。通过电穿孔使纯化的外排体加载外源RNA。静脉注射的RVG靶向的外排体特异性地将GAPDH siRNA递送到脑中的神经元、小胶质细胞、少突神经胶质细胞，导致特异性的基因敲除。预暴露于RVG外排体未减弱敲低，并且在其他组织中未观察到非特异性摄取。通过BACE1的强的mRNA(60％)和蛋白质(62％)敲低证明了外排体介导的siRNA递送的治疗潜能，BACE1是一种阿尔茨海默病中的治疗靶标。

为了获得免疫惰性的外排体池，阿尔瓦雷斯-尔维蒂(Alvarez-Erviti)等人收获了来自具有同源主要组织兼容性复合体(MHC)单体型的近交C57BL/6小鼠的骨髓。由于未成熟树突细胞产生大量的缺乏T细胞激活剂如MHC-II和CD86的外排体，阿尔瓦雷斯-尔维蒂(Alvarez-Erviti)等人选择具有粒细胞/巨噬细胞集落刺激因子(GM-CSF)的树突细胞持续7天。次日，使用良好建立的超速离心方案从培养上清中纯化外排体。这些产生的外排体在物理上是同质的，具有直径为80nm的粒径分布峰，正如通过粒子跟踪分析(NTA)和电子显微镜检查所测定。阿尔瓦雷斯-尔维蒂(Alvarez-Erviti)等人获得了6-12μg的外排体(基于蛋白质浓度测量的)/每10⁶个细胞。

其次，阿尔瓦雷斯-尔维蒂(Alvarez-Erviti)等人研究了使用适用于纳米级应用的穿孔方案给修饰的外排体加载外源负荷的可能性。由于电穿孔对于纳米级的膜粒子尚未良好表征，使用非特异性Cy5标记的RNA用于电穿孔方案的经验优化。在外排体超速离心和溶解之后测定了封装的RNA的量。在400V和125μF的电穿孔导致RNA的最好保留并且用于所有的后续实验。

阿尔瓦雷斯-尔维蒂(Alvarez-Erviti)向正常C57BL/6小鼠给予被包封在150μg的RVG外排体中的150μg的每种BACE1siRNA并且将敲低效率与四个对照进行比较：未处理的小鼠、仅仅用RVG外排体注射的小鼠，用与体内阳离子脂质体试剂络合的BACE1siRNA注射的小鼠、以及用与RVG-9R络合的BACE1siRNA注射的小鼠，该RVG肽与静电结合到siRNA上的9个D-精氨酸缀合。在给药之后3天，分析皮层组织样品，并且在siRNA-RVG-9R处理的和siRNARVG外排体处理的小鼠中均观察到显着的蛋白质敲低(45％，P<0.05，相对于62％，P<0.01)，这是由于显着的BACE1mRNA水平降低(分别为66％[+或-]15％，P<0.001以及61％[+或-]13％，P<0.01)。而且，申请人证明了在RVG-外排体处理的动物中在总[β]-淀粉样蛋白1-42水平上的显着降低(55％，P<0.05)，其中β淀粉样蛋白为一种在阿尔茨海默病理学中的淀粉样斑块的主要成分。所观察到的降低大于在心室内注射BACE1抑制剂之后的正常小鼠中证明的β淀粉样蛋白1-40降低。阿尔瓦雷斯-尔维蒂(Alvarez-Erviti)在BACE1切割产物上进行了5'-cDNA末端快速扩增(RACE)，其提供了经由siRNA的RNAi介导的敲低的证据。

最后，阿尔瓦雷斯-尔维蒂(Alvarez-Erviti)等人通过评定IL-6、IP-10、TNFα和IFN-α血清浓度研究了RNA-RVG外排体是否诱导了体内免疫反应。在外排体处理之后，类似于与有力地刺激IL-6分泌的siRNA-RVG-9R相反的siRNA转染试剂处理，登记了在所有细胞因子上的非显着性变化，证实了该外排体处理的免疫惰性属性。假定外排体仅仅封装20％的siRNA，用RVG-外排体递送比RVG-9R递送显得更有效，因为用少五倍的siRNA实现了相当的mRNA敲低和更好的蛋白质敲低，而没有相应水平的免疫刺激。这个实验证明了RVG-外排体技术的治疗潜力，其潜在地适合于与神经退行性疾病相关的基因的长期沉默。阿尔瓦雷斯-尔维蒂(Alvarez-Erviti)等人的外排体递送系统可以用于将本发明的CRISPR-Cas系统递送至治疗靶标，尤其是神经退行性疾病。对于本发明可以考虑封装在约100到1000mg的RVG外排体中的约100到1000mg的CRISPR Cas的剂量。

艾尔·安达卢西(El-Andaloussi)等人(《自然－实验手册》(Nature Protocols)7,2112-2126(2012))披露了可以如何利用来源于培养的细胞的外排体用于体外和体内递送RNA。这个方案首先描述了通过转染包含与肽配体融合的外排体蛋白的表达载体的靶向外排体的产生。其次，艾尔·安达卢西(El-Andaloussi)等人解释了如何纯化和表征来自转染的细胞上清液的外排体。接着，艾尔·安达卢西(El-Andaloussi)等人详述了将RNA加载到外排体中的关键步骤。最后，艾尔·安达卢西(El-Andaloussi)等人概述了如何使用外排体有效体外递送RNA以及体内递送到小鼠脑中。还提供了预期结果的实例，其中外排体介导的RNA递送通过功能分析和成像而评估。整个方案进行约3周。根据本发明的递送或给药可以使用从自我衍生的树突细胞产生的外排体来进行。根据本文的教导，这可以在本发明的实践中采用。

在另一个实施例中，考虑了瓦尔格伦(Wahlgren)等人的血浆外排体(《核酸研究》(Nucleic Acids Research)，2012年，第40卷，第17期，e130)。外排体是由包括树突细胞(DC)、B细胞、T细胞、肥大细胞、上皮细胞和肿瘤细胞在内的许多细胞类型产生的纳米囊泡(30-90nm大小)。这些囊泡通过晚期核内体的向内出芽而形成，并且然后在与质膜融合后释放到细胞外环境中。由于外排体天然地在细胞之间运送RNA，这种特性在基因治疗中可以是有用的，并且根据本披露可以用于本发明的实践中。

来自血浆的外排体可以通过如下制备：在900g离心血沉棕黄层持续20分钟以便分离血浆，之后收获细胞上清液，在300g离心10分钟以便去除细胞，并且在16 500g离心30分钟，之后通过0.22mm过滤器进行过滤。通过在120 000g超速离心70min使外排体沉淀。根据在RNAi人/小鼠启动试剂盒(Quiagen，希尔顿(Hilden)，德国)中的制造商的说明进行siRNA到外排体中的化学转染。siRNA以终浓度2mmol/ml添加到100ml PBS中。在加入HiPerFect转染试剂之后，将该混合物在室温下孵育10分钟。为了去除过量的胶束，使用醛/硫酸盐乳胶珠再分离外排体。可以类似于siRNA进行CRISPR Cas到外排体中的化学转染。外排体可以与从健康供体的外周血中分离的单核细胞和淋巴细胞共培养。因此，可以考虑的是，可以将含有CRISPR的外排体引入人单核细胞和淋巴细胞中并且以自体方式再引入。因此，可以使用血浆外排体进行根据本发明的递送或给药。

脂质体

可以用脂质体进行根据本发明的递送或给药。脂质体是球形囊泡结构，其组成为围绕内部水性区室的单层或多层脂质双层以及相对不可渗透的外部亲脂性磷脂双层。脂质体作为药物递送载体受到了相当的重视，因为它们是生物兼容、无毒的，可以递送亲水和亲脂性药物分子，包护它们的负荷物免于被血浆酶降解，并且运送它们的负荷跨过生物膜和血脑屏障(BBB)(对于评述，参见，例如，斯普奇(Spuch)和纳瓦罗(Navarro)《药物递送杂志》(Journal of Drug Delivery)，2011卷，文献标识码469679，第12页，2011.doi:10.1155/2011/469679)。

可以从几种不同类型的脂质制造脂质体；然而，磷脂最常用来产生作为药物载体的脂质体。虽然当脂质膜与水性溶液混合时脂质体形成是自发的，但也可通过使用均质机、超声发生器、或挤出设备以振摇的形式施加力使其加速(对于评述，参见，例如，斯普奇(Spuch)和纳瓦罗(Navarro)《药物递送杂志》(Journal of Drug Delivery)，2011卷，文献标识码469679，第12页，2011.doi:10.1155/2011/469679)。

可以将几种其他的添加剂添加到脂质体，以便修饰其结构和特性。例如，可以将胆固醇或鞘磷脂添加到脂质体混合物中，以便帮助稳定脂质体结构并且防止脂质体内部负荷物的泄漏。此外，从氢化卵磷脂酰胆碱或卵磷脂酰胆碱、胆固醇、和磷酸二鲸蜡脂制备脂质体，并且脂质体的平均囊泡大小被调整到约50至100nm。(对于评述，参见，例如，斯普奇(Spuch)和纳瓦罗(Navarro)《药物递送杂志》(Journal of Drug Delivery)，2011卷，文献标识码469679，第12页，2011.doi:10.1155/2011/469679)。

脂质体配制品主要可以由天然磷脂和脂质如1,2-二硬脂酰-sn-甘油基-3-磷脂酰胆碱(DSPC)、鞘磷脂、卵磷脂酰胆碱和单唾液酸神经节苷酯构成。由于这种配制品仅仅由磷脂组成，脂质体配制品已经遇到了许多挑战，其中之一是在血浆中的不稳定性。已经作出战胜这些挑战的若干尝试，特别是在脂质膜的处理方面。这些尝试之一集中于胆固醇的处理。将胆固醇添加到常规配制品中减缓了封装的生物活性化合物到血浆中的迅速释放，或者添加1,2-二油酰基-sn-甘油基-3-磷酸乙醇胺(DOPE)增加稳定性(对于评述，参见，例如，斯普奇(Spuch)和纳瓦罗(Navarro)《药物递送杂志》(Journal of Drug Delivery)，2011卷，文献标识码469679，第12页，2011.doi:10.1155/2011/469679)。

在一个特别有利的实施例中，特洛伊木马(Trojan Horse)脂质体(也称为分子木马)是令人希望的并且方案可见于http://cshprotocols.cshlp.org/content/2010/4/pdb.prot5407.long。这些粒子允许转基因在血管内注射之后递送到整个脑。不受到限制，表面结合有特异性抗体的中性脂质粒子允许经由胞吞作用跨过血脑屏障。申请人假定利用特洛伊木马脂质体将核酸酶的CRISPR家族经由血管内注射递送到脑，这将允许全脑转基因动物，而不需要胚胎操作。对于在脂质体中的体内给药，可以考虑约1-5g的DNA或RNA。

在另一个实施例中，该CRISPR Cas系统可以在脂质体中给药，如一种稳定的核酸-脂质粒子(SNALP)(参见，例如，莫里西(Morrissey)等人，《自然生物技术》(NatureBiotechnology)，第23卷，第8期，2005年8月)。考虑了约1、3或5mg/kg/天的靶向SNALP中的特异性CRISPR Cas的每日静脉注射。日治疗可以经过约三天，然后每周治疗持续约五周。在另一个实施例中，还考虑了通过以约1或2.5mg/kg的剂量静脉注射给药的封装有特异性CRISPR Cas的SNALP(参见，例如，齐默尔曼(Zimmerman)等人，《自然通讯》(NatureLetters)，第441卷，2006年5月4日)。该SNALP配制品可含有以2:40:10:48的摩尔百分比的脂质3-N-[(w甲氧基聚(乙二醇)2000)氨甲酰]-1,2-二肉豆蔻氧基-丙胺(PEG-C-DMA)、1,2-二亚油基氧基-N,N-二甲基-3-氨基丙烷(DLinDMA)、1,2-二硬脂酰-sn-甘油基-3-磷酸胆碱(DSPC)和胆固醇，(参见，例如，齐默尔曼(Zimmerman)等人，《自然通讯》(Nature Letters)，第441卷，2006年5月4日)。

在另一个实施例中，已经证明稳定的核酸-脂质粒子(SNALP)将分子有效递送到高度血管化的HepG2-衍生的肝脏肿瘤，但是不递送到血管化不良的HCT-116衍生的肝脏肿瘤(参见，例如，李(Li)，《基因治疗》(Gene Therapy)(2012)19，775-780)。可以通过如下制备这些SNALP脂质体：使用25:1的脂质/siRNA比率和48/40/10/2的胆固醇/D-Lin-DMA/DSPC/PEG-C-DMA的摩尔比，用二硬脂酰磷脂酰胆碱(DSPC)、胆固醇和siRNA配制D-Lin-DMA和PEG-C-DMA。生成的SNALP脂质体在大小上为约80-100nm。

在又另一个实施例中，SNALP可以包含合成胆固醇(西格玛-奥德里奇公司(Sigma-Aldrich)，圣刘易斯，密苏里州，美国)、二棕榈酰磷脂酰胆碱(Avanti Polar Lipids公司，阿拉巴斯特(Alabaster)，阿拉巴马州，美国)、3-N-[(w-甲氧基聚(乙二醇)2000)氨甲酰]-1,2-二肉豆蔻氧基丙基胺、和阳离子的1,2-二亚油基氧基-3-N,N二甲基氨基丙烷(参见，例如，盖斯伯特(Geisbert)等人，《柳叶刀》(Lancet)2010；375:1896-905)。例如可以考虑静脉推注给予约2mg/kg总CRISPR Cas/剂的剂量。

在又另一个实施例中，SNALP可以包含合成胆固醇(西格玛-奥德里奇公司(Sigma-Aldrich))、1,2-二硬脂酰基-sn-甘油基-3-磷酸胆碱(DSPC；Avanti Polar Lipids公司)、PEG-cDMA以及1,2-二亚油基氧基-3-(N；N-二甲基)氨基丙烷(DLinDMA)(参见例如，贾奇(Judge)，《临床研究杂志》(J.Clin.Invest.)119:661-673(2009))。用于体内研究的配制品可包含约9:1的最终脂质/RNA质量比。

已经由阿尔尼拉姆制药公司(Alnylam Pharmaceuticals)的巴洛斯(Barros)和格罗布(Gollob)评论了RNAi纳米药物的安全性(参见，例如，《先进药物递送评论》(AdvancedDrug Delivery Reviews)64(2012)1730-1737)。稳定的核酸脂质粒子(SNALP)由四种不同的脂质构成—在低pH时为阳离子的可电离脂质(DLinDMA)、中性辅助脂质、胆固醇、和可扩散的聚乙二醇(PEG)-脂质。该粒子直径大约为80nm并且在生理pH时是电中性的。在配制过程中，该可电离脂质用于在粒子形成过程中使脂质与阴离子RNA缩合。当在渐增的酸性内体条件下带正电荷时，该可电离的脂质还介导了SNALP与内体膜的融合，从而使得能够将RNA释放到细胞质中。该PEG-脂质在配制过程中使该粒子稳定并且减少聚集，随后提供中性的亲水性外部，以改进药代动力学特性。

到目前为止，已经使用具有RNA的SNALP配制品开始两个临床项目。Tekmira制药公司最近完成了SNALP-ApoB在具有增高的LDL胆固醇的成年志愿者中的I期单剂量研究。ApoB主要在肝脏和空肠中表达，并且对于VLDL和LDL的组装和分泌是必需的。十七位受试者接受了SNALP-ApoB的单剂量(跨7个剂量水平的剂量递增)。没有肝脏毒性(预期为基于临床前研究的潜在剂量限制性毒性)的证据。处于最高剂量的(两位中的)一位受试者经历了与免疫系统刺激一致的流感样症状，于是做出结束该试验的决定。

阿尔尼拉姆制药公司(Alnylam Pharmaceuticals)已经类似地推出了ALN-TTR01，其采用上述SNALP技术并且靶向突变体和野生型TTR的肝细胞产生，从而治疗TTR淀粉样变性(ATTR)。已经描述了三个ATTR综合征：家族性淀粉样多发性神经病变(FAP)和家族性淀粉样心肌病(FAC)—两者均由TTR中的常染色体显性突变引起；以及由野生型TTR引起的老年全身性淀粉样变性(SSA)。最近在具有ATTR的患者中完成了ALN-TTR01的安慰剂对照单剂量递增I期试验。向31位患者(23位用研究药物，8位用安慰剂)在0.01到1.0mg/kg(基于siRNA)的剂量范围内以15分钟静脉内输注给予ALN-TTR01。治疗耐受良好，其中在肝功能试验中没有显着增加。在≥0.4mg/kg时在23位患者的3位中注意到输注相关反应；对所有患者均做出减慢输注速率的反应并且所有患者继续参与研究。在处于1mg/kg的最高剂量(如根据临床前和NHP研究预期的)的两位患者中注意到血清细胞因子IL-6、IP-10和IL-1ra的最小与瞬时升高。在1mg/kg时观察到ALN-TTR01的预期药理效应，即，血清TTR的降低。

在又另一个实施例中，可以通过将阳离子脂质、DSPC、胆固醇和PEG-脂质以40:10:40:10的摩尔比分别溶解在例如乙醇中来制作SNALP(参见，森普尔(Semple)等人，《自然生物技术》(Nature Niotechnology)，第28卷，第2期，2010年2月，第172-177页)。将该脂质混合物添加到水性缓冲液中(50mM柠檬酸盐，pH 4)，混合至最终的乙醇和脂质浓度分别为30％(vol/vol)和6.1mg/ml，允许在22℃平衡2分钟，然后挤出。使用Lipex挤出仪(北方脂质公司(Northern Lipids))，在22℃将水合脂质通过两层80nm孔径大小的过滤器(Nuclepore)直到获得70-90nm直径的囊泡时为止，正如通过动态光散射分析测定的。这大致需要1-3次通过。将该siRNA(溶解在50mM柠檬酸盐中，pH为4的含有30％乙醇的水溶液)以约5ml/min的速率在混合下添加到预平衡的(35℃)囊泡中。在达到0.06(wt/wt)的最终靶siRNA/脂质比率之后，将该混合物在35℃另外孵育30分钟，以允许囊泡重组和该siRNA的封装。然后去除乙醇并且通过透析或切向流渗滤用PBS(155mM NaCl、3mM Na₂HPO₄、1mMKH₂PO₄，pH 7.5)替换外部缓冲液。使用控制的逐步稀释法工艺将siRNA封装在SNALP中。KC2-SNALP的脂质组分为以57.1:7.1:34.3:1.4的摩尔比使用的DLin-KC2-DMA(阳离子脂质)、二棕榈酰磷脂酰胆碱(DPPC；Avanti Polar Lipids公司)、合成胆固醇(西格玛公司)和PEG-C-DMA。在形成加载的粒子后，将SNALP在PBS中透析并且在使用之前通过0.2μm的滤膜消毒过滤。平均粒径为75-85nm，并且将90％-95％的siRNA封装在脂质粒子内。用于体内测试的在配制品中的最终siRNA/脂质比率是大约0.15(wt/wt)。在使用之前即刻将含有因子VIIsiRNA的LNP-siRNA系统在无菌PBS中稀释到适当浓度，并且通过侧尾静脉以10ml/kg的总体积静脉内给药。这种方法和这些递送系统可以类推到本发明的CRISPR Cas系统。

其他脂质

其他阳离子脂质，如氨基脂质2,2-二亚油基-4-二甲基氨基乙基-[1,3]-二氧戊环(DLin-KC2-DMA)可以例如类似于SiRNA地用来封装CRISPR Cas或其组分或对其进行编码的一个或多个核酸分子(参见，例如，加雅拉曼(Jayaraman)，《德国应用化学》(Angew.Chem.Int.Ed.)2012，51，8529-8533)，并且因此可以在本发明的实践中采用。可以考虑具有下列脂质组成的预成型囊泡：分别处于摩尔比40/10/40/10的氨基脂质、二硬脂酰卵磷脂(DSPC)、胆固醇和(R)-2,3-双(十八烷氧基)丙基-1-(甲氧基聚(乙二醇)2000)丙基碳酸酯(PEG-脂质)，以及大约0.05(w/w)的FVII siRNA/总脂质比率。为了确保在70-90nm范围内的窄粒径分布以及0.11±0.04(n＝56)的低多分散性指数，可以在添加CRISPR CasRNA之前将粒子通过80nm的膜挤出达三次。可以使用含有高度有效的氨基脂质16的粒子，其中四种脂质组分16、DSPC、胆固醇和PEG-脂质的摩尔比(50/10/38.5/1.5)可以被进一步优化，以增强体内活性。

迈克尔S D科尔曼(Michael S D Kormann)等人(“在小鼠中递送化学修饰的mRNA之后治疗蛋白的表达”("Expression of therapeutic proteins after delivery ofchemically modified mRNA in mice):《自然生物技术》(Nature Biotechnology)，第29卷，第154-157页，(2011))描述了脂质包膜用于递送RNA的用途。脂质包膜的用途在本发明中也是优选的。

在另一个实施例中，脂质可以与本发明的CRISPR Cas系统配制在一起而形成脂质粒子(LNP)。脂质包括但不限于，DLin-KC2-DMA4、C12-200和辅助脂质二硬脂酰磷脂酰胆碱、胆固醇和PEG-DMG，可以使用自发囊泡形成程序将其与CRISPR Cas而不是siRNA一起配制(参见例如，诺沃勃兰特塞瓦(Novobrantseva)，《分子治疗-核酸》(Molecular Therapy-Nucleic Acids)(2012)1，e4；doi:10.1038/mtna.2011.3)。组分摩尔比可以是约50/10/38.5/1.5(DLin-KC2-DMA或C12-200/二硬脂酰磷脂酰胆碱/胆固醇/PEG-DMG)。在DLin-KC2-DMA和C12-200脂质粒子(LNP)的情况下，最终脂质:siRNA重量比可以分别是约12:1和9:1。配制品可以具有约80nm的平均粒径，具有>90％的包覆效率。可以考虑3mg/kg的剂量。

Tekmira公司在美国和国外具有一组针对LNP和LNP配制品的不同方面的大约95个同族专利(参见例如，美国专利号7,982,027；7,799,565；8,058,069；8,283,333；7,901,708；7,745,651；7,803,397；8,101,741；8,188,263；7,915,399；8,236,943和7,838,658以及欧洲专利号1766035；1519714；1781593和1664316)，所有这些专利均可用于和/或适用于本发明。

该CRISPR Cas系统或其组分或对其进行编码一个或多个核酸分子可以封装在PLGA微球中进行递送，例如进一步在美国公开申请20130252281和20130245107以及20130244279(转让给Moderna Therapeutics公司)中，其涉及包含修饰的核酸分子的组合物的配制品方面，所述核酸分子可以编码蛋白质、蛋白质前体、或该蛋白质或蛋白质前体的部分或完全加工形式。该配制品具有50:10:38.5:1.5-3.0(阳离子脂质:融合脂质:胆固醇:PEG脂质)的摩尔比。该PEG脂质可以选自，但不限于PEG-c-DOMG、PEG-DMG。该融合脂质可以是DSPC。还参见，施鲁姆(Schrum)等人，“工程化核酸的递送和配制”(Delivery andFormulation of Engineered Nucleic Acids)，美国公开申请20120251618。

Nanomerics公司的技术着手解决针对广泛治疗学的生物利用度挑战，包括基于低分子量疏水药物、肽以及核酸(质粒、siRNA、miRNA)的治疗学。该技术已经证明了明显优势的特异性的给药途径包括口服途径、跨血脑屏障的运送、向实体瘤以及眼部的递送。参见例如，马萨(Mazza)等人，2013，《ACS纳米》(ACS Nano.)2013年2月26日；7(2):1016-26；乌切克布(Uchegbu)和秀(Siew)，2013，《制药科学杂志》(J Pharm Sci.)102(2):305-10和拉拉特萨(Lalatsa)等人，2012，《控释杂志》(J Control Release)，2012年7月20日；161(2):523-36。

美国专利公开号20050019923描述了用于向哺乳动物身体递送生物活性分子例如多核苷酸分子、肽和多肽和/或药剂的阳离子树状聚合物。这些树状聚合物适合于将生物活性分子的递送靶向到例如肝、脾、肺、肾或心脏(或甚至脑)。树状聚合物是从简单的支化单体单元以逐步方式制备的3维大分子，其性质和功能性可以容易地进行控制和改变。经由向多功能核(发散式合成法)或朝向多功能核(收敛式合成法)重复加成结构单元(buildingblocks)而合成树状聚合物，并且结构单元的3维壳的各次加成导致更高级别的树状聚合物的形成。聚丙烯亚胺树状聚合物从二氨基丁烷核开始，通过对伯胺的丙烯腈的双迈克尔加成反应向其上添加两倍数目的氨基基团，继之为腈的氢化。这导致氨基基团的加倍。聚丙烯亚胺树状聚合物含有100％的可质子化氮以及高达64个末端氨基基团(5级，DAB 64)。可质子化基团常常为能够在中性pH时接受质子的胺基。树状聚合物作为基因递送剂的用途在很大程度上集中于聚酰胺-胺和含磷化合物的用途，其中胺/酰胺的混合物或N--P(O₂)S分别作为缀合单元，没有报道关于更低级别的聚丙烯亚胺树状聚合物用于基因递送的用途的工作。还研究了作为pH敏感的控制释放系统的聚丙烯亚胺树状聚合物，其用于药物递送以及当被外周氨基酸基团化学修饰时用于它们的客体分子的封装。还研究了聚丙烯亚胺树状聚合物的细胞毒性和与DNA的相互作用以及DAB 64的转染效力。

美国专利公开号20050019923是基于与早期报道相反的观察：阳离子树状聚合物例如聚丙烯亚胺树状聚合物展示出适当的特性，如，特异性靶向和低毒性，其用于在生物活性分子如基因材料的靶向递送中使用。另外，阳离子树状聚合物的衍生物也展示出适当的用于生物活性分子的靶向递送的特性。还参见，《生物活性聚合物》(Bioactive Polymers)、美国公开申请20080267903，其披露了不同的聚合物，包括阳离子聚胺聚合物和树枝状聚合物，其显示具有抗增殖活性，并且因此可用于治疗其特征为不希望的细胞增殖的失调，如新生物和肿瘤、炎性失调(包括自身免疫性失调)、银屑病和动脉粥样硬化。这些聚合物可以作为活性剂单独使用、或者作为其他治疗剂(如药物分子或用于基因治疗的核酸)的递送载体。在这样的情况下，这些聚合物自身固有的抗肿瘤活性可以补足有待递送的药剂的活性。这些专利公开的披露可以与本文针对递送一种或多种CRISPR Cas系统或其一种或多种组分或对其进行编码的一个或多个核酸分子的传授结合使用。

超电荷蛋白

超电荷蛋白是一类具有非常高的正或负理论净电荷的工程化的或天然存在的蛋白质并且可以用于递送一种或多种CRISPR Cas系统或其一种或多种组分或对其进行编码的一个或多个核酸分子。超负电荷蛋白和超正电荷蛋白两者都展示出显着的抵抗热诱导或化学诱导的聚集的能力。超正电荷蛋白还能够渗透哺乳动物细胞。使负荷物与这些蛋白质结合，如质粒DNA、RNA、或其他蛋白质，可使得这些大分子到体外和体内的哺乳动物细胞中的功能递送成为可能。刘大卫实验室(David Liu’s lab)在2007年报道了超电荷蛋白的建立和表征(劳伦斯(Lawrence)等人，2007，《美国化学会志》(Journal of the AmericanChemical Society)129，10110-10112)。

RNA和质粒DNA到哺乳动物细胞中的非病毒递送对于研究和治疗应用都是有价值的(阿肯克(Akinc)等人，2010，《自然生物技术》(Nat.Biotech.)26，561-569)。纯化的+36GFP蛋白(或其他超正电荷蛋白)与RNA在适当的无血清培养基中混合并且允许在添加到细胞中之前复合。在这个阶段的血清的包含将会抑制超电荷蛋白-RNA复合物的形成和降低治疗效果。已经发现以下方案对于多种细胞系是有效的(麦克诺顿(McNaughton)等人，2009，《美国国家科学院院刊》(Proc.Natl.Acad.Sci.USA)106，6111-6116)(然而，应当进行改变蛋白质和RNA剂量的先导实验来优化用于特异性细胞系的程序)：(1)在治疗前一天，以1x 10⁵个细胞/孔铺板于48孔板中。(2)在治疗当天，在无血清的培养基中稀释纯化的+36GFP蛋白直到终浓度200nM。添加RNA到50nM的终浓度。涡旋混合并且在室温孵育10分钟。(3)在孵育过程中，抽吸培养基离开细胞并且再次用PBS洗涤。(4)在孵育+36GFP和RNA之后，向细胞加入蛋白质-RNA复合物。(5)将细胞与复合物在37℃孵育4小时。(6)在孵育之后，抽出培养基并且用20U/mL的肝素PBS洗涤三次。用含血清培养基另外孵育细胞48小时或更长，这取决于用于活性的试验。(7)通过免疫印迹、qPCR、表型分析、或其他适当的方法分析细胞。

刘大卫实验室(David Liu’s lab)已经进一步发现+36GFP在一些列细胞中是一种有效的质粒递送试剂。由于质粒DNA是一种比siRNA大的负荷物，有效复合质粒需要成比例地更大的+36GFP蛋白。为了有效质粒递送，申请人已经开发了一种带有C末端HA2肽标签的+36GFP变体，这种肽是一种已知的从流感病毒血凝素蛋白衍生的内体破坏肽。下列方案在多种细胞中是有效的，但是如上所述，建议针对特异性细胞系和递送应用优化质粒DNA的超电荷蛋白的剂量：(1)在治疗前一天，以1x 10⁵/孔铺板于48孔板中。(2)在治疗当天，在无血清的培养基中稀释纯化的蛋白直到终浓度2mM。加入1mg的质粒DNA。涡旋混合并且在室温孵育10分钟。(3)在孵育过程中，抽吸培养基离开细胞并且再次用PBS洗涤。(4)在孵育和质粒DNA之后，向细胞轻轻加入蛋白质-DNA复合物。(5)将细胞与复合物在37C孵育4小时。(6)在孵育之后，抽出培养基并且用PBS洗涤。在含血清培养基中孵育细胞，并且另外孵育24-48小时。(7)在适当时分析质粒递送(例如，通过质粒驱动的基因表达)。还参见，例如，麦克诺顿(McNaughton)等人，《美国国家科学院院刊》(Proc.Natl.Acad.Sci.USA)106，6111-6116(2009)；克罗尼肯(Cronican)等人，《ACS化学生物学》(ACS ChemicalBiology)5，747-752(2010)；克罗尼肯等人，《化学与生物学》(Chemistry&Biology)18，833-838(2011)；汤普森(Thompson)等人，《酶学方法》(Methods in Enzymology)503，293-319(2012)；汤普森，D.B.，等人，《化学与生物学》(Chemistry&Biology)19(7)，831-843(2012)。超电荷蛋白的这些方法可以使用和/或适用于本发明的CRISPR Cas系统的递送。吕博士(Dr.Lui)以及与本文的教导结合的本文的文献的这些系统可以用于递送一种或多种CRISPR Cas系统或其一种或多种组分或对其进行编码的一个或多个核酸分子。

细胞穿透肽(CPP)

在又另一个实施例中，考虑了细胞穿透肽(CPP)用于递送CRISPR Cas系统。CPP是短肽，其促进细胞吸收不同分子负荷物(从纳米级粒子到小化学分子和DNA的大片段)。如在此使用的术语“负荷物”包括但不限于下组，该组由以下各项组成：治疗剂、诊断探针、肽、核酸、反义寡核苷酸、质粒、蛋白质、粒子、脂质体、发色团、小分子和放射性物质。在本发明的多个方面，该负荷物还可包括CRISPR Cas系统的任何组分或整个功能性CRISPR Cas系统。本发明的多个方面进一步提供了用于将希望的负荷物递送到受试者体内的方法，这些方法包括：(a)制备一种复合物，其包含本发明的细胞穿透肽以及希望的负荷物，并且(b)经口服、关节内、腹膜内、鞘内、动脉内(intrarterially)、鼻内、实质内、皮下、肌内、静脉内、真皮、直肠内地、或局部给予该复合物至一位受试者。负荷物是通过化学键经由共价键或通过非共价相互作用与这些肽相缔合。

CPP的功能是将该负荷物递送进入细胞，这是一种通常通过内吞作用发生的过程，其中该负荷物被递送到活体哺乳动物细胞的内体。细胞穿透肽具有不同的大小、氨基酸序列、和电荷，但所有CPP具有一种不同的特征，该特征是转位质膜并协助将各种分子量的负荷物递送到细胞质或细胞器的能力。CPP转位可以分为三个主要的进入机制：直接渗透于膜中、内吞作用-介导的进入、和通过形成暂时性结构转位。CPP已经发现在治疗不同疾病中在药物(包括癌症和病毒抑制剂)中作为药物递送剂的许多应用、连同在用于细胞标记的造影剂中的许多应用。后者的实例包括充当用于GFP、MRI造影剂、或量子点的载体。CPP具有很大的作为用于研究和医学的体外和体内递送载体的潜力。CPP典型地具有一种氨基酸组合物，该氨基酸组合物包含高相对丰度的带负电荷的氨基酸，例如赖氨酸或精氨酸，或具有包含交替模式的极性/带电荷的氨基酸和非极性疏水性氨基酸的序列。这两种类型的结构分别称为聚阳离子或两亲性的。第三类CPP是仅含有非极性残基的疏水性肽，具有低净电荷或具有对于细胞摄入关键的疏水氨基酸基团。发现的初始CPP之一是来自人类免疫缺陷病毒1(HIV-1)的反式-激活转录激活因子(Tat)，发现其高效地从周围介质被许多培养中的细胞类型摄取。从此以后，已知CPP的数目已经显着扩大，并且已经产生具有更有效蛋白转导特性的小分子合成类似物。CPP包括但不限于穿透素、Tat(48-60)、转运素(Transportan)、以及(R-AhX-R4)(Ahx＝氨基己酰基)。

美国专利8,372,951提供了来源于嗜酸性粒细胞阳离子蛋白质(ECP)的CPP，它展示出高度细胞穿透效率和低毒性。还提供了将CPP与其内负荷物递送进脊椎动物受试者中的多个方面。CPP的其他方面及其递送在美国专利8,575,305；8；614,194以及8,044,019中。CPP可以用来递送CRISPR-Cas系统或其组分。可以采用CPP递送CRISPR-Cas系统或其组分，也被提供于原稿“通过细胞穿透肽介导的对Cas9蛋白和指导RNA的递送进行的基因破坏(Gene disruption by cell-penetrating peptide-mediated delivery of Cas9protein and guide RNA)”，苏雷什罗摩克里希纳(Suresh Ramakrishna)，阿布-博恩塞拉夸库达迪(Abu-Bonsrah Kwaku Dad)，贾格迪什博卢尔(Jagadish Beloor)等人，《基因组研究》(Genome Res.)2014年4月2日，[电子出版先于印刷]，通过引用以其全文结合，其中证实了用CPP-缀合的重组Cas9蛋白和CPP-复合的指导RNA进行治疗导致在人类细胞系中的内源基因破坏。在该论文中，Cas9蛋白经由硫醚键缀合至CPP，而指导RNA与CPP复合，形成形成缩合的、带负电荷的粒子。已经显示，用修饰的Cas9和指导RNA同时和顺序地治疗人类细胞，包括胚胎干细胞、真皮成纤维细胞、HEK293T细胞、海拉(HeLa)细胞、和胚胎癌细胞，导致有效的基因破坏，伴随相对于质粒转染而言降低的脱靶突变。

可植入装置

在另一个实施例中，还考虑可植入装置用于递送该CRISPRCas系统或其一种或多种组分或对其进行编码的一个或多个核酸分子。例如，美国专利公开20110195123披露了一种可植入医用装置，其局部地并且在延长的时期内洗脱药物，包括几种类型的这种装置、实施的治疗方式和植入方法。该装置包含聚合物基材，例如，用作装置主体的基质、以及药物，并且在一些情况下包含另外的支架材料，如金属或另外的聚合物，以及增强可见度和成像的材料。可植入递送装置在提供局部的并且在延长的时期内的释放方面可以是有利的，其中药物直接释放到患病区域的细胞外基质(ECM)，所述患病区域如肿瘤、炎症、退化，或用于针对症状的目的，或者释放到受损的平滑肌细胞，或者用于预防。如上文披露的，一类药物是RNA，并且这个系统可以用于和/或适用于本发明的CRISPR Cas系统。在一些实施例中，植入方式为用于包括近距离放射疗法和针吸活组织检查在内的其他治疗的、当今开发和使用的现有植入程序。在这样的情况下，在本发明中描述的新植入物的尺寸类似于初始植入物。典型地在相同的治疗程序中植物很少的装置。

正如在美国专利公开20110195123中，提供了一种药物递送可植入或可插入系统，包括适用于空腔例如腹腔和/或其中药物递送系统未被锚定或附接的任何其他类型的给药，其包含生物稳定的和/或可降解的和/或生物可吸收的聚合物基材，其可以例如任选地是一种基质。应当指出的是术语“插入”也包括植入。该药物递送系统优选地被实施为如在美国专利公开20110195123中的“装填器(Loder)”。

聚合物或多种聚合物是生物相容的，其结合一种药剂和/或多种药剂，使得药剂以控制的速率释放，其中该聚合物基材如基质的总体积，例如在一些实施例中是任选地并且优选地不大于容许达到该药剂的治疗水平的最大体积。作为一个非限制性实例，这样的体积优选在0.1m³至1000mm³的范围内，正如该药剂负荷的体积所要求的。该装填器任选地是更大的，例如当结合有一个其大小由功能性决定的装置时，例如而不限于，膝关节、宫内节育环或子宫颈环等等。

在一些实施例中，该药物递送系统(用于递送该组合物)被设计为优选地采用可降解聚合物，其中主要释放机制是本体溶蚀(Bulk erosion)；或者在一些实施例中，使用了不可降解的、或缓慢降解的聚合物，其中主要释放机制是扩散而不是本体溶蚀，使得外部部分用作膜，而其内部部分用作储药池，该储药池在延长的时期内(例如从约一周到约几个月)实际上不受环境的影响。还可以任选地使用具有不同释放机制的不同聚合物的组合。在总药物释放期的重要时段期间，在表面处的浓度梯度优选地被维持有效地恒定，并且因此扩散速率是有效地恒定的(称为“零模式”扩散)。关于术语“恒定”，它意指优选地维持在治疗效果的低阈值以上的扩散速率，但是可以仍然任选地具有初期突释的特征和/或可以波动，例如增加和降低到一定程度。该扩散速率优选地被如此维持一个延长的时期，并且它被考虑为相对于一定的水平是恒定的，以便优化治疗有效期，例如该有效沉默期。

该药物递送系统任选地并且优选地被设计为保护基于核苷酸的治疗剂免于降解，而不论化学性质或由于受试者体内的酶和其他因素的攻击。

如在美国专利公开20110195123中的药物递送系统任选地与传感和/或激活器具相缔合，这些器具通过激活和/或加速/减速的无创和/或微创方法在该装置的植入之时和/或之后被操作，例如任选地包括但不限于热力加热和冷却、激光束和超声波，包括聚焦超声和/或RF(射频)方法或装置。

根据美国专利公开20110195123的以下实施例，用于局部递送的部位可以任选地包括其特征为高度异常的细胞增殖、受到抑制的细胞凋亡的靶部位，包括肿瘤、活动性和/或慢性炎症和感染，包括自身免疫性疾病状态、退化组织(包括肌肉和神经组织)、慢性疼痛、退行性部位，以及用于增强组织再生的骨折位置以及其他伤口位置，以及损伤的心肌、平滑肌和横纹肌。

用于植入该组合物的部位、或靶部位，优选地其特征为用于靶向局部递送的足够小的半径、面积和/或体积。例如，该靶部位任选地具有在从约0.1mm到约5cm范围内的直径。

该靶部位的位置优选地针对最大治疗效力而选择。例如，该药物递送系统的组合物(任选地与如上所述的用于植入的装置一起)任选地并且优选地被植入在肿瘤环境或与之相关的血供之内或者附近。

例如该组合物(任选地与该装置一起)任选地植入在胰脏、前列腺、乳房、肝脏之内或附近，通过乳头，在血管系统之内，等等。

靶位置任选地选自下组，该组由以下各项组成(仅仅作为非限制性实例，因为任选地在身体内的任何部位可以适合于植入装填器)：1.脑，在退行性部位，像在帕金森病或阿尔茨海默病中的基底神经节、白质和灰质；2.如在肌萎缩性脊髓侧索硬化症(ALS)的情况下的脊柱；3.子宫颈以预防HPV感染；4.活动性或慢性炎性关节；5.在银屑病情况下的真皮；6.交感神经部位和感觉神经部位用于止痛作用；7.骨内植入；8.急性和慢性感染部位；9.阴道内；10.内耳--听觉系统、内耳的迷路、前庭系统；11.气管内；12.心内；冠状动脉、心外膜；13.膀胱；14.胆道系统；15.实质组织，包括且不限于肾脏、肝脏、脾脏；16.淋巴结；17.唾液腺；18.牙龈；19.关节内(进入关节)；20.眼内；21.脑组织；22.脑室；23.空腔，包括腹腔(例如但不限于，用于卵巢癌)；24.食管内以及25.直肠内。

任选地，该系统(例如含有该组合物的装置)的插入与向在该靶部位和该部位附近的ECM注射材料有关，从而影响该靶部位和这个部位附近的ECM中的局部pH和/或温度和/或影响该药物的扩散和/或药物动力学的其他生物因素。

任选地，根据一些实施例，所述药剂的释放可以与传感和/或激活器具相缔合，这些器具通过激活和/或加速/减速的无创和/或微创方法和/或别的方法在插入之前和/或之时和/或之后被操作，所述方法包括激光束、放射、热力加热和冷却、和超声波，包括聚焦超声和/或RF(射频)方法或装置、以及化学激活剂。

根据美国专利公开20110195123的其他实施例，该药物优选地包括RNA，例如，对于局限性癌症情况，在乳房、胰脏、脑、肾脏、膀胱、肺、以及前列腺中，如下文所述。尽管用RNAi进行示例，但是许多药物可适用封装在装填器中，并且可以与本发明结合使用，只要这样的药物可以被装填器底物(例如像基质)封装即可，并且这个系统可以用于和/或适用于递送本发明的CRISPR Cas系统。

作为特殊应用的另一个实例，神经肌肉退行性疾病由于异常基因表达而发生。RNA的局部递送可以具有干扰这样的异常基因表达的治疗特性。包括小分子药物和大分子在内的抗凋亡、抗炎和抗退行性药物的局部递送也可以任选地是治疗性的。在这样的情况下，该装填器用于以恒定速率和/或通过单独植入的专用装置延长释放。这都可以用于和/或适用于本发明的CRISPR Cas系统。

作为特殊应用的又另一个实例，用基因修饰剂治疗精神和认知障碍。基因敲低是治疗选项。向中枢神经系统部位局部递送药剂的装填器是对于精神和认知障碍的治疗选项，这些精神和认知障碍包括但不限于，精神病、双极性疾病、神经性障碍和行为疾病(behavioral maladies)。这些装填器也可以在特定脑部位进行植入时局部递送包括小分子药物和大分子的药物。这都可以用于和/或适用于本发明的CRISPR Cas系统。

作为特殊应用的另一个实例，在局部部位的先天性和/或适应性免疫介质的沉默使得能够预防器官移植排斥。用植入到移植器官和/或植入部位的装填器局部递送RNA和免疫调节试剂致使经由排斥性免疫细胞(如针对移植器官而被激活的CD8)的局部免疫抑制。这都可以用于和/或适用于本发明的CRISPR Cas系统。

作为特殊应用的另一个实例，包括VEGF和血管生成素及其他在内的血管生长因子对于新血管形成是必需的。这些因子、肽、肽模拟物的局部递送或抑制它们的阻遏因子是一种重要的治疗模式；使阻遏因子沉默以及用装填器局部递送刺激血管发生的这些因子、肽、大分子和小分子药物对于周围血管疾病、全身性血管疾病和心血管疾病是治疗性的。

插入的方法，如植入，可以任选地已用于其他类型的组织植入和/或用于组织取样，任选地在这样的方法中没有修改，或者可替代地任选地仅仅具有非重点修改。这样的方法任选地包括但不限于，近距离放射治疗方法、活组织检查、用和/或不用超声的内窥镜检查如ERCP、进入脑组织的立体定向法、腹腔镜检查，包括用腹腔镜进入关节、腹腔器官、膀胱壁和体腔的植入。

在本文讨论的可植入装置技术可以与本文的教导一起使用并且因此根据本披露和本领域的知识，可以经由可植入装置递送CRISPR-Cas系统或其组分或其核酸分子或编码或提供组分的核酸分子。

气雾剂递送

针对肺病进行治疗的受试者的每一侧肺可以例如接受支气管内递送的药学上有效量的雾化AAV载体系统，同时自然地呼吸。像这样，通常对于AAV递送而言，雾化递送是优选的。腺病毒或AAV粒子可以用于递送。每一者都有效作地连接至一个或多个调节序列上的适合的基因构建体可以被克隆到递送载体中。在这种情况下，提供下列构建体作为实例：用于Cas9的Cbh或EF1a启动子、用于指导RNA的U6或H1启动子：一种优选的安排是使用靶向指导物的CFTRδ508、用于δF508突变的修复模板以及密码子优化的Cas9酶，所述酶具有任选地一个或多个核定位信号或序列(NLS)，例如，两个(2)NLS。还设想了没有NLS的构建体。

CRISPR酶mRNA和指导RNA

也可以单独递送CRISPR酶mRNA和指导RNA。可以在该指导RNA在给出时间以待CRISPR酶表达之前递送CRISPR酶mRNA。可以在给予指导RNA之前1-12小时(优选约2-6小时)给予CRISPR酶mRNA。

可替代地，可以一起给予CRISPR酶mRNA和指导RNA。有利地，可以在初始给予CRISPR酶mRNA+指导RNA之后1-12小时(优选约2-6小时)给予指导RNA的第二加强剂量。

为了实现基因组修饰的最有效水平，另外给予CRISPR酶mRNA和/或指导RNA可以是有用的。在一些实施例中，当靶向遗传病时，尤其是在治疗方法中以及优选地，其中提供修复模板用于校正或改变表型，表型改变优选地是基因组修饰的结果。

在此处关于与突变或与疾病病况相关的靶标的讨论中，此类突变或疾病病况可以是，例如血友病B、SCID、SCID-X1、ADA-SCID、遗传性酪氨酸血症、镰状细胞贫血、β-地中海贫血、伴X染色体的CGD、威斯科特-奥尔德里奇综合征、范科尼贫血、肾上腺脑白质营养不良(ALD)、异染性脑白质营养不良(MLD)、乌谢尔综合征(Usher Syndrome)、色素性视网膜炎、先天性利伯氏黑朦(Leber’s Congential Amaurosis)、囊性纤维病、HIV/AIDS、HSV-1、HSV-2；或更通常地，免疫缺陷障碍，血液病、或遗传性溶酶体贮积病。靶标可与免疫疗法(例如，癌症免疫疗法)关联。

在一些实施例中，递送方法包括：阳离子脂质介导的酶-指导复合物(核糖核蛋白)的“直接”递送和质粒DNA的电穿孔。

本发明的方法可进一步包括模板的递送，如修复模板，这些模板可以是dsODN或ssODN，参见以下。模板的递送可以经由同时或单独于递送任何或所有CRISPR酶、指导物、tracr配对或tracrRNA并且通过相同或不同的递送机构进行。在一些实施例中，优选的是，模板与指导物、tracr配对和/或tracrRNA以及，优选地，还有CRISPR酶一起递送。一个实例可以是一种AAV载体，其中该CRISPR酶是SaCas9(具有N580突变)。

本发明的方法可以进一步包括：(a)向该细胞递送双链寡脱氧核苷酸(dsODN)，该双链寡脱氧核苷酸包含与通过所述双链断裂产生的突出端互补的突出端，其中所述dsODN被整合进该感兴趣座位中；或-(b)向该细胞递送单链寡脱氧核苷酸(ssODN)，其中所述ssODN充当所述双链断裂的同源定向修复的模板。本发明的方法可以用于预防或治疗个体的疾病，任选地其中所述疾病是由所述感兴趣座位中的缺陷引起。本发明的方法可以是在该个体的体内进行或针对取自该个体的细胞离体地进行，任选地其中将所述细胞返回到该个体。

根据本发明的酶可以应用于优化的功能性CRISPR Cas系统中，该系统是功能筛选所感兴趣的；SAM筛选

在一个方面，本发明提供了非天然存在的或工程化的组合物，该组合物包含一种类型V，更具体地，包括能够杂交到细胞中感兴趣的基因组座位中靶序列上的指导序列的Cas9 CRISPR指导RNA，其中该指导RNA是通过插入结合至两种或多种衔接蛋白(例如，适配体)的一个或多个不同RNA序列而进行修饰的，并且其中每种衔接蛋白与一个或多个功能结构域缔合；或者，其中该指导RNA被修饰成具有至少一个非编码功能环。在具体实施例中，通过插入同向重复的5’、在同向重复内、或指导序列的3’的一个或多个不同RNA序列，对指导RNA进行修饰。当存在多于一个功能结构域时，这些功能结构域可以是相同或不同的，例如，两个相同或两个不同的激活因子或阻遏因子。在一个方面，本发明提供了非天然存在的或工程化的CRISPR-Cas复合物组合物，该组合物包括在此所讨论的指导RNA和CRISPR酶，该酶是一种Cas9酶，其中可任选地，该Cas9酶包括至少一个突变，这样使得该Cas9酶具有不超过5％的不具有该至少一个突变的Cas9酶的核酸酶活性，以及任选地一种或多种包含至少一个或多个核定位序列。在一个方面，本发明提供了一种在此所讨论的Cas9 CRISPR指导RNA或Cas9 CRISPR-Cas复合物，其包括一种非天然存在的或工程化的组合物，该组合物包含两种或更多种衔接蛋白，其中每种蛋白与一个或多个功能结构域缔合，并且其中该衔接蛋白结合至插入到该指导RNA中的不同RNA序列上。在具体实施例中，该指导RNA被另外地或可替代地修饰，以便仍确保Cas9 CRISPR复合物的结合，但防止被Cas9酶切割(如在本文别处所详述的)。

在一个方面，本发明提供了一种非天然存在的或工程化的组合物，该组合物包含：一种指导RNA(gRNA)，其包含一种能够杂交到细胞中感兴趣的基因组座位中靶序列上的指导序列；Cas9酶，其包含至少一个或多个核定位序列，其中该Cas9酶包括至少一个突变，这样使得该Cas9酶具有不超过5％的不具有该至少一个突变的Cas9酶的核酸酶活性，其中该指导RNA是通过插入结合至一种或多种衔接蛋白的一个或多个不同RNA序列而进行修饰的，并且其中该衔接蛋白与一个或多个功能结构域缔合；或者，其中该指导RNA被修饰成具有至少一个非编码功能环，并且其中该组合物包括两种或更多种衔接蛋白，其中每种蛋白与一个或多个功能结构域缔合。在一个方面，本发明提供了一种在此讨论的组合物，其中该Cas9酶当与不具有至少一个突变的Cas9酶相比时具有降低至少97％或100％的核酸酶活性。在一个方面，本发明提供了一种在此讨论的组合物，其中该Cas9酶包括两个或更多个突变。在一个方面，本发明提供了一种在此讨论的组合物，其中该Cas9酶与一个或多个功能结构域缔合。在一个方面，本发明提供了一种在此讨论的组合物，其中该两个或多个与衔接蛋白缔合的功能结构域各自是一个异源功能结构域。在一个方面，本发明提供了一种在此讨论的组合物，其中该一个或多个与Cas9酶缔合的功能结构域各自是一个异源功能结构域。在一个方面，本发明提供了一种在此讨论的组合物，其中该衔接蛋白是一种融合蛋白，该融合蛋白包括功能结构域，该融合蛋白任选地包括一个在衔接蛋白和功能结构域之间的接头，该接头任选地包括一种GlySer接头。在一个方面，本发明提供了一种在此讨论的组合物，其中该gRNA不是通过插入结合至两种或多种衔接蛋白的一个或多个不同RNA序列而进行修饰的。在一个方面，本发明提供了一种在此讨论的组合物，其中该一个或多个与衔接蛋白缔合的功能结构域是一个转录激活结构域。在一个方面，本发明提供了一种在此讨论的组合物，其中该一个或多个与Cas9酶缔合的功能结构域是一个转录激活结构域。在一个方面，本发明提供了一种在此讨论的组合物，其中该一个或多个与衔接蛋白缔合的功能结构域是一个包括VP64、p65、MyoD1、HSF1、RTA或SET7/9的转录激活结构域。在一个方面，本发明提供了一种在此讨论的组合物，其中该一个或多个与Cas9酶缔合的功能结构域是一个包括VP64、p65、MyoD1、HSF1、RTA或SET7/9的转录激活结构域。在一个方面，本发明提供了一种在此讨论的组合物，其中该一个或多个与衔接蛋白缔合的功能结构域是一个转录阻遏因子结构域。在一个方面，本发明提供了一种在此讨论的组合物，其中该一个或多个与Cas9酶缔合的功能结构域是一个转录阻遏因子结构域。在一个方面，本发明提供了一种在此讨论的组合物，其中该转录阻遏因子结构域是KRAB结构域。在一个方面，本发明提供了一种在此讨论的组合物，其中该转录阻遏因子结构域是NuE结构域，NcoR结构域、SID结构域或SID4X结构域。在一个方面，本发明提供了一种在此讨论的组合物，其中该一个或多个与衔接蛋白缔合的功能结构域中的至少一个具有一种或多种活性，这些活性包括甲基化酶活性、脱甲基化酶活性、转录激活活性、转录阻抑活性、转录释放因子活性、组蛋白修饰活性、DNA整合活性RNA切割活性、DNA切割活性或核酸结合活性。在一个方面，本发明提供了一种在此讨论的组合物，其中该一个或多个与Cas9酶缔合的功能结构域具有一种或多种活性，这些活性包括甲基化酶活性、脱甲基化酶活性、转录激活活性、转录阻抑活性、转录释放因子活性、组蛋白修饰活性、DNA整合活性RNA切割活性、DNA切割活性、核酸结合活性、或分子开关活性或化学可诱导性或光可诱导性。在一个方面，本发明提供了一种在此讨论的组合物，其中该DNA切割活性是由于Fok1核酸酶。在一个方面，本发明提供了一种在此讨论的组合物，其中该一个或多个功能结构域附接至该Cas9酶，这样使得当结合至该gRNA和靶标时，该功能结构域处于空间定向，从而允许该功能结构域在其属性功能中起作用；或者，可任选地，其中该一个或多个功能结构域经由接头附接至该Cas9酶，任选地GlySer接头。在一个方面，本发明提供了一种在此讨论的组合物，其中该gRNA被修饰成使得，在gRNA结合衔接蛋白并且进一步结合至该Cas9酶和靶标之后，该功能结构域处于空间定向，从而允许该功能结构域在其属性功能中起作用。在一个方面，本发明提供了一种在此讨论的组合物，其中该一个或多个与Cas9酶缔合的功能结构域被附接到Cas9的RuvC结构域上。在一个方面，本发明提供了一种在此讨论的组合物，其中该指导RNA的同向重复是通过插入一个或多个不同RNA序列而进行修饰的。在一个方面，本发明提供了一种在此讨论的组合物，其中插入的结合至一种或多种衔接蛋白的一个或多个不同RNA序列是适配体序列。在一个方面，本发明提供了一种在此讨论的组合物，其中该适配体序列是对相同衔接蛋白具有特异性的两个或更多个适配体序列。在一个方面，本发明提供了一种在此讨论的组合物，其中该适配体序列是对不同衔接蛋白具有特异性的两个或更多个适配体序列。在一个方面，本发明提供了一种在此讨论的组合物，其中该衔接蛋白包括MS2、PP7、Qβ、F2、GA、fr、JP501、M12、R17、BZ13、JP34、JP500、KU1、M11、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、φCb5、φCb8r、φCb12r、φCb23r、7s、PRR1。因此，在具体实施例中，该适配体选自一种特异性结合以上列出的任一种衔接蛋白的结合蛋白。在一个方面，本发明提供了一种在此讨论的组合物，其中该细胞是真核细胞。在一个方面，本发明提供了一种在此讨论的组合物，其中该真核细胞是哺乳动物细胞、植物细胞或酵母细胞，由此该哺乳动物细胞任选地是小鼠细胞。在一个方面，本发明提供了一种在此讨论的组合物，其中该哺乳动物细胞是人类细胞。在一个方面，本发明提供了一种在此讨论的组合物，其中第一衔接蛋白与p65结构域缔合并且第二衔接蛋白与HSF1结构域缔合。在一个方面，本发明提供了一种在此讨论的组合物，其中该组合物包括一种CRISPR-Cas复合物，该复合物具有至少三个功能结构域，其中至少一个与该Cas9酶缔合并且其中至少两个与gRNA缔合。

在一个方面，本发明提供了一种在此以上讨论的组合物，其中存在多于一个gRNA，并且这些gRNA靶向不同序列，由此当使用该组合物时，存在着多路复用。在一个方面，本发明提供了一种组合物，其中存在多于一个gRNA是通过插入结合至一种或多种衔接蛋白的一个或多个不同RNA序列而进行修饰的。

在一个方面，本发明提供了一种在此讨论的组合物，其中与一个或多个功能结构域缔合的一种或多种衔接蛋白是存在的并且结合到插入到该指导RNA中的不同的RNA序列上。

在一个方面，本发明提供了一种在此讨论的组合物，其中该一个或多个靶序列是非编码或调节序列。这些调节序列可以是一个或多个启动子、增强子或沉默子序列。

在一个方面，本发明提供了一种在此讨论的组合物，其中该指导RNA被修饰成具有至少一个非编码功能环；例如，其中该至少一个非编码功能环是抑制性的；例如，其中至少一个非编码功能环包括Alu。

在一个方面，本发明提供了一种方法，该方法用于引入一个基因组座位事件，该事件包括向宿主给予或在宿主中体内表达如在此讨论的一种或多种组合物。在一个方面，本发明提供了一种在此讨论的方法，其中该基因组座位事件包括影响该座位中的基因活化、基因抑制、或切割。

在一个方面，本发明提供了一种在此讨论的方法，其中该宿主是真核细胞。在一个方面，本发明提供了一种在此讨论的方法，其中该宿主是哺乳动物细胞，任选地是小鼠细胞或植物细胞或酵母细胞。在一个方面，本发明提供了一种在此讨论的方法，其中该宿主是非人类真核生物。在一个方面，本发明提供了一种在此讨论的方法，其中该非人类真核生物是非人哺乳动物。在一个方面，本发明提供了一种在此讨论的方法，其中该非人哺乳动物是小鼠。

在一个方面，本发明提供了一种修饰感兴趣的基因组座位的方法，以通过引入或在细胞中表达如在此讨论的组合物来改变细胞中的基因表达。在一个方面，本发明提供了一种在此讨论的方法，该方法包括递送该组合物或用于编码它的一种或多种核酸分子，其中所述一种或多种核酸分子被操作性地连接至一个或多个调节序列并且在体内进行表达。在一个方面，本发明提供了一种在此讨论的方法，其中经由慢病毒、腺病毒、或AAV进行体内表达。

在一个方面，本发明提供了一种如在此讨论的细胞的哺乳动物细胞系，其中该细胞系任选地是人细胞系或小鼠细胞系。在一个方面，本发明提供了一种转基因哺乳动物模型，任选地是小鼠，其中该模型已经用一种在此讨论的组合物进行了转化或是所述转化体的子代。

在一个方面，本发明提供一种或多种核酸分子，这些核酸分子编码指导RNA或Cas9CRISPR-Cas复合物或如在此讨论的组合物。在一个方面，本发明提供了一种载体，该载体包含：一种核酸分子，该核酸分子编码一种指导RNA(gRNA)，该指导RNA包括一种能够杂交到细胞中感兴趣的基因组座位中靶序列上的指导序列，其中该gRNA的同向重复是通过插入结合至两种或多种衔接蛋白的一个或多个不同RNA序列而进行修饰的，并且其中每种衔接蛋白与一个或多个功能结构域缔合；或者，其中该gRNA被修饰成具有至少一个非编码功能环。在一个方面，本发明提供了一种或多种载体，所述载体包括一种或多种编码以下各项的核酸分子：非天然存在的或工程化的CRISPR-Cas复合物组合物，该组合物包括在此所讨论的gRNA和一种Cas9酶，其中可任选地，该Cas9酶包括至少一个突变，这样使得该Cas9酶具有不超过5％的不具有该至少一个突变的Cas9酶的核酸酶活性，以及任选地一种或多种包含至少一个或多个核定位序列。在一个方面，一种载体可以进一步包括一种或多种可在一种真核细胞中操作的调节组件，所述调节组件操作性地连接到编码指导RNA(gRNA)的核酸分子和/或编码Cas9酶和/或任选的一个或多个核定位序列的核酸分子上。

在一个方面，本发明提供了一种试剂盒，该试剂盒包括上文所描述的一个或多个组分。在一些实施例中，该试剂盒包括一种如以上所描述的载体系统以及用于使用该试剂盒的说明书。

在一个方面，本发明提供了一种筛选功能获得(GOF)或功能缺失(LOF)或用于筛选非编码RNA或潜在调节区(例如，增强子、阻遏因子)的方法，该方法包括如在此讨论的或在此讨论的含有或表达Cas9的模型的细胞的细胞系，以及将如在此讨论的组合物引入该细胞系或模型的细胞中，由此该gRNA包括一种激活因子或一种阻遏因子，并且分别监测用于GOF或LOF，关于gRNA引入其中的那些细胞包括一种激活因子或关于gRNA引入其中的那些细胞包括一种阻遏因子。本发明的筛选被称为SAM筛选。

在一个方面，本发明提供了一种Cas9 CRISPR Cas复合物，该复合物包括一种Cas9酶和一种指导RNA(gRNA)，其中该Cas9酶包括至少一个突变，这样使得该Cas9酶具有不超过5％的不具有该至少一个突变的Cas9酶的核酸酶活性，以及任选的至少一个或多个核定位序列；该指导RNA(gRNA)包括一种能够杂交到细胞中感兴趣的基因组座位中靶序列上的指导序列；并且其中该gRNA是通过插入结合至一种或多种衔接蛋白的一个或多个不同RNA序列而进行修饰的，并且其中该衔接蛋白与两个或多个功能结构域缔合，或者，其中该gRNA被修饰成具有至少一个非编码功能环；或该Cas9酶与一个或多个功能结构域缔合，并且该gRNA是通过插入结合至一种或多种衔接蛋白的一个或多个不同RNA序列而进行修饰的，并且其中该衔接蛋白与两个或多个功能结构域缔合，或者，其中该gRNA被修饰成具有至少一个非编码功能环。

在一个方面，本发明提供了基因组广度文库，其包括多个Cas9指导RNA(gRNA)，这些指导RNA包括指导序列，这些指导序列各自都能够杂交到细胞中感兴趣的基因组座位中的靶序列上，并且由此该文库能够靶向真核细胞群中多个基因组座位中的多个靶序列，其中每个gRNA是通过插入结合至一种或多种或两种或多种衔接蛋白的一个或多个不同RNA序列而进行修饰的，并且其中该衔接蛋白与一个或多个功能结构域缔合；或者，其中该gRNA被修饰成具有至少一个非编码功能环。并且当存在多于一个功能结构域时，这些功能结构域可以是相同或不同的，例如，两个相同或两个不同的激活因子或阻遏因子。在一个方面，本发明提供了一种或多种非天然存在的或工程化的CRISPR-Cas复合物组合物的文库，该组合物包括本发明所述的gRNA和Cas9酶，其中可任选地，该Cas9酶包括至少一个突变，这样使得该Cas9酶具有不超过5％的不具有该至少一个突变的Cas9酶的核酸酶活性，以及任选地一种或多种包含至少一个或多个核定位序列。在一个方面，本发明提供了一种或多种本发明所述的gRNA或Cas9 CRISPR-Cas复合物，其包括一种非天然存在的或工程化的组合物，该组合物包含一种或两种或更多种衔接蛋白，其中每种蛋白与一个或多个功能结构域缔合，并且其中该衔接蛋白结合至插入到该gRNA的至少一个环中的不同RNA序列上。

在一个方面，本发明提供了一种非天然存在的或工程化的组合物的文库，其各自包含：一种Cas9 CRISPR指导RNA(gRNA)，其包含一种能够杂交到细胞中感兴趣的基因组座位中靶序列上的指导序列；Cas9酶，其包含至少一个或多个核定位序列，其中该Cas9酶包括至少一个突变，这样使得该Cas9酶具有不超过5％的不具有该至少一个突变的Cas9酶的核酸酶活性，其中该gRNA的至少一个环是通过插入结合至一种或多种衔接蛋白的一个或多个不同RNA序列而进行修饰的，并且其中该衔接蛋白与一个或多个功能结构域缔合，其中该组合物包括一种或多种或两种或多种衔接蛋白，其中每种蛋白与一个或多个功能结构域缔合，并且其中这些gRNA包括基因组广度文库，其包括多个Cas9指导RNA(gRNA)。在一个方面，本发明提供了一种如在此讨论的文库，其中该Cas9酶当与不具有至少一个突变的Cas9酶相比时具有降低至少97％或100％的核酸酶活性。在一个方面，本发明提供了一种如在此讨论的文库，其中该Cas9酶包括两个或更多个突变。在一个方面，本发明提供了一种如在此讨论的文库，其中该Cas9酶包括两个或更多个突变。在一个方面，本发明提供了一种如在此讨论的文库，其中该Cas9酶与一个或多个功能结构域缔合。在一个方面，本发明提供了一种如在此讨论的文库，其中一个或两个或多个与衔接蛋白缔合的功能结构域是异源功能结构域。在一个方面，本发明提供了一种如在此讨论的文库，其中一个或多个与Cas9酶缔合的功能结构域是异源功能结构域。在一个方面，本发明提供了一种如在此讨论的文库，其中该衔接蛋白是包括该功能结构域的融合蛋白。在一个方面，本发明提供了一种如在此讨论的文库，其中该gRNA不是通过插入结合至一种或两种或多种衔接蛋白的一个或多个不同RNA序列而进行修饰的。在一个方面，本发明提供了一种如在此讨论的文库，其中一个或两个或多个与衔接蛋白缔合的功能结构域是转录激活结构域。在一个方面，本发明提供了一种如在此讨论的文库，其中一个或两个或多个与Cas9酶缔合的功能结构域是转录激活结构域。在一个方面，本发明提供了一种如在此讨论的文库，其中一个或两个或多个与衔接蛋白缔合的功能结构域是包括VP64、p65、MyoD1或HSF1的转录激活结构域。在一个方面，本发明提供了一种如在此讨论的文库，其中一个或多个与Cas9酶缔合的功能结构域是包括VP64、p65、MyoD1或HSF1的转录激活结构域。在一个方面，本发明提供了一种如在此讨论的文库，其中一个或两个或多个与衔接蛋白缔合的功能结构域是转录阻遏因子结构域。在一个方面，本发明提供了一种如在此讨论的文库，其中一个或多个与Cas9酶缔合的功能结构域是转录阻遏因子结构域。在一个方面，本发明提供了一种如在此讨论的文库，其中该转录阻遏因子结构域是KRAB结构域。在一个方面，本发明提供了一种如在此讨论的文库，其中该转录阻遏因子结构域是SID结构域或SID4X结构域。在一个方面，本发明提供了一种如在此讨论的文库，其中该一个或两个或多个与衔接蛋白缔合的功能结构域中的至少一个具有一种或多种活性，这些活性包括甲基化酶活性、脱甲基化酶活性、转录激活活性、转录阻抑活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性、DNA切割活性或核酸结合活性。在一个方面，本发明提供了一种如在此讨论的文库，其中该一个或多个与Cas9酶缔合的功能结构域具有一种或多种活性，这些活性包括甲基化酶活性、脱甲基化酶活性、转录激活活性、转录阻抑活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性、DNA切割活性、核酸结合活性、或分子开关活性或化学可诱导性或光可诱导性。在一个方面，本发明提供了一种如在此讨论的文库，其中该DNA切割活性是Fok1核酸酶。在一个方面，本发明提供了一种如在此讨论的文库，其中该一个或多个功能结构域附接至该Cas9酶，这样使得当结合至该gRNA和靶标时，该功能结构域处于空间定向，从而允许该功能结构域在其属性功能中起作用。在一个方面，本发明提供了一种如在此讨论的文库，其中该gRNA被修饰成使得，在gRNA结合衔接蛋白并且进一步结合至该Cas9酶和靶标之后，该功能结构域处于空间定向，从而允许该功能结构域在其属性功能中起作用。在一个方面，本发明提供了一种如在此讨论的文库，其中该一个或多个与Cas9酶缔合的功能结构域被附接到Cas9酶的N末端上。在一个方面，本发明提供了一种如在此讨论的文库，其中该一个或多个与Cas9酶缔合的功能结构域被附接到FnCas9蛋白的RuvC或任何与这些结构域对应的直向同源物上。在一个方面，本发明提供了一种如在此讨论的文库，其中该gRNA的同向重复是通过插入不同的RNA序列而进行修饰的。在一个方面，本发明提供了一种如在此讨论的文库，其中插入的结合至一种或多种衔接蛋白的一个或多个不同RNA序列是适配体序列。在一个方面，本发明提供了一种如在此讨论的文库，其中该适配体序列是对相同衔接蛋白具有特异性的两个或更多个适配体序列。在一个方面，本发明提供了一种如在此讨论的文库，其中该适配体序列是对不同衔接蛋白具有特异性的两个或更多个适配体序列。在一个方面，本发明提供了一种如在此讨论的文库，其中该衔接蛋白包括MS2、PP7、Qβ、F2、GA、fr、JP501、M12、R17、BZ13、JP34、JP500、KU1、M11、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、φCb5、φCb8r、φCb12r、φCb23r、7s、PRR1。在一个方面，本发明提供了一种如在此讨论的文库，其中该细胞群是真核细胞群。在一个方面，本发明提供了一种如在此讨论的文库，其中该真核细胞是哺乳动物细胞、植物细胞或酵母细胞。在一个方面，本发明提供了一种如在此讨论的文库，其中该哺乳动物细胞是人类细胞。在一个方面，本发明提供了一种如在此讨论的文库，其中该细胞群是胚胎干(ES)细胞群。在一个方面，本发明提供了一种如在此讨论的文库，其中基因组座位中的靶序列是非编码序列。在一个方面，本发明提供了一种如在此讨论的文库，其中通过所述靶向来改变一种或多种基因产物的基因功能；或其中关于基因功能，存在功能获得；或其中关于基因功能，存在功能改变；或其中关于基因功能，存在功能降低；或其中筛选针对非编码RNA或潜在调节区(例如，增强子、阻遏因子)。在一个方面，本发明提供了一种如在此讨论的文库，其中所述靶向导致基因功能的敲除。在一个方面，本发明提供了一种如在此讨论的文库，其中该靶向具有约100或更多个序列。在一个方面，本发明提供了一种如在此讨论的文库，其中该靶向具有约1000或更多个序列。在一个方面，本发明提供了一种如在此讨论的文库，其中该靶向具有约20,000或更多个序列。在一个方面，本发明提供了一种如在此讨论的文库，其中该靶向具有整个基因组。在一个方面，本发明提供了一种如在此讨论的文库，其中该靶向具有一系列聚焦于相关或令人希望的途径的靶序列。在一个方面，本发明提供了一种如在此讨论的文库，其中该途径是免疫途径。在一个方面，本发明提供了一种如在此讨论的文库，其中该途径是细胞分裂途径。在一个方面，本发明提供了一种如在此讨论的文库，其中基因功能的改变包括：向细胞群中的每个细胞中引入具有一种或多种包含工程化的、非天然存在的Cas9 CRISPR-Cas系统的载体的载体系统，该系统包括：I.Cas9蛋白，和II.一种或多种类型的Cas9指导RNA，其中组分I和II可以是相同或在不同载体系统上，将组分I和II整合到每个细胞中，其中该指导序列靶向每个细胞中的独特基因，其中该Cas9蛋白有效作地连接至调节组件上，其中在转录时，包括该指导序列的指导RNA引导Cas9 CRISPR-Cas系统与该独特基因的基因组座位中的靶序列的序列特异性结合，通过该Cas9蛋白诱导该基因组座位的切割，并且证实细胞群的每个细胞中的多个独特基因中的不同突变，由此产生突变细胞文库。在一个方面，本发明提供了一种如在此讨论的文库，其中该一种或多种载体是质粒载体。在一个方面，本发明提供了一种如在此讨论的文库，其中该调节组件是诱导型启动子。在一个方面，本发明提供了一种如在此讨论的文库，其中该诱导型启动子可以是多西环素诱导型启动子。在一个方面，本发明提供了一种如在此讨论的文库，其中通过全外显子组测序来证实不同突变。在一个方面，本发明提供了一种如在此讨论的文库，其中在100或更多个独特基因中实现突变。在一个方面，本发明提供了一种如在此讨论的文库，其中在1000或更多个独特基因中实现突变。在一个方面，本发明提供了一种如在此讨论的文库，其中在20,000或更多个独特基因中实现突变。在一个方面，本发明提供了一种如在此讨论的文库，其中在整个基因组中实现突变。在一个方面，本发明提供了一种如在此讨论的文库，其中在多个独特基因中实现基因功能的改变，这些独特基因在特定生理途径或状态下发挥作用。在一个方面，本发明提供了一种如在此讨论的文库，其中该途径或状态是免疫途径或状态。在一个方面，本发明提供了一种如在此讨论的文库，其中该途径或状态是细胞分裂途径或状态。在一个方面，本发明提供了一种如在此讨论的文库，其中第一衔接蛋白与p65结构域缔合并且第二衔接蛋白与HSF1结构域缔合。在一个方面，本发明提供了一种如在此讨论的文库，其中每个Cas9CRISPR-Cas复合物具有至少三个功能结构域，其中至少一个与Cas9酶缔合并且其中至少两个与gRNA缔合。在一个方面，本发明提供了一种如在此讨论的文库，其中基因功能的改变是敲除突变。

在一个方面，本发明提供了一种用于功能筛选在离体或体内细胞池中基因组基因的方法，该方法包括给予或表达包括多个Cas9 CRISPR-Cas系统指导RNA(gRNA)的文库，并且其中该筛选进一步包括使用Cas9酶，其中该CRISPR复合物被修饰成包括异源功能结构域。在一个方面，本发明提供了一种用于筛选基因组的方法，该方法包括向宿主给予或在宿主体内表达文库。在一个方面，本发明提供了如本文讨论的方法，该方法进一步包括给予该宿主的或在该宿主中表达的激活因子。在一个方面，本发明提供了一种如在此讨论的方法，其中激活因子附接至Cas9酶上。在一个方面，本发明提供了一种如在此讨论的方法，其中激活因子附接至Cas9酶的N末端或C末端上。在一个方面，本发明提供了一种如在此讨论的方法，其中激活因子附接至Cas9 CRISPR gRNA同向重复上。在一个方面，本发明提供了一种如在此讨论的方法，该方法进一步包括向宿主给予或在宿主中表达的阻遏因子。在一个方面，本发明提供了如本文讨论的方法，其中该筛选包括在该座位中影响并检测基因激活、基因抑制、或切割。在一个方面，本发明提供了如本文讨论的方法，其中该宿主是真核细胞。在一个方面，本发明提供了一种如在此讨论的方法，其中该宿主是哺乳动物细胞、酵母细胞或植物细胞。在一个方面，本发明提供了一种如在此讨论的方法，其中该宿主是非人类真核生物。在一个方面，本发明提供了一种如在此讨论的方法，其中该非人类真核生物是非人哺乳动物。在一个方面，本发明提供了一种如在此讨论的方法，其中该非人哺乳动物是小鼠。在一个方面，本发明提供了一种如在此讨论的方法，该方法包括递送Cas9 CRISPR-Cas复合物或其一种或多种组分或用于编码它们的一种或多种核酸分子，其中所述一种或多种核酸分子被操作性地连接至一个或多个调节序列上并且在体内进行表达。在一个方面，本发明提供了一种如在此讨论的方法，其中经由慢病毒、腺病毒、或AAV进行体内表达。在一个方面，本发明提供了如本文讨论的方法，其中该递送是经由粒子、纳米粒子、脂质或细胞穿透肽(CPP)。

在一个方面，本发明提供了一对Cas9 CRISPR-Cas复合物，其各自包括Cas9指导RNA(gRNA)，该指导RNA包括能够杂交到细胞中感兴趣的基因组座位中靶序列上的指导序列，其中所述gRNA是通过插入结合至一种或多种衔接蛋白的一个或多个不同RNA序列而进行修饰的，并且其中该衔接蛋白与一个或多个功能结构域缔合，其中每个Cas9 CRISPR-Cas的每个gRNA包括具有DNA切割活性的功能结构域。在一个方面，本发明提供了如在此讨论的成对Cas9 CRISPR-Cas复合物，其中DNA切割活性是由于Fok1核酸酶。

在本文方法和组合物的具体实施例中，使用编码经密码子优化以用于在真核细胞中表达的Cas9蛋白的核苷酸序列。在一个优选实施例中，该真核细胞是哺乳动物细胞，并且在一个更优选的实施例中，该哺乳动物细胞是人类细胞、酵母细胞或植物细胞。可替代地，该真核细胞是植物细胞。在本发明的一个另外的实施例中，该基因产物的表达被降低。

在本文提供的方法和组合物的一些实施例中，该Cas9酶是氨基酸球菌属BV3L6、毛螺菌科(Lachnospiraceae)细菌MA2020或新杀手土拉热弗朗西丝菌1(Francisellatularensis 1Novicida)Cas9，并且可以包括衍生自这些生物的突变Cas9。该酶可以是一种Cas9同系物或直向同源物。

在一个方面，本发明提供了产生包含具有修饰的表达的基因的模式真核细胞的方法。在一些实施例中，疾病基因是与患有或产生一种疾病的风险的增加相关联的任何基因。在一些实施例中，该方法包括(a)向真核细胞中引入上文所述的一种或多种载体，以及(b)允许CRISPR复合物结合到靶多核苷酸上以便修饰遗传基因座，由此产生包含修饰的遗传基因座的模式真核细胞。

在一个方面，本发明提供了一种用于研发生物活性剂的方法，该生物活性剂调制与疾病基因相关的细胞信号传导事件。在一些实施例中，疾病基因是与患有或产生疾病的风险的增加相关联的任何基因。在一些实施例中，该方法包括(a)使测试化合物与所述实施例中的任一项的模式细胞接触；并且(b)检测读数变化，该变化指示与所述疾病基因的所述突变关联的细胞信号传导事件的减少或增加，从而开发调制与所述疾病基因关联的所述细胞信号传导事件的所述生物活性剂。

本发明包括优化的功能性CRISPR-Cas Cas9酶系统，尤其是结合本发明修饰的指导物，并且另外其中该Cas9酶还与功能结构域缔合。具体而言，该Cas9酶包括使其转化成DNA结合蛋白的一个或多个突变，展现出感兴趣的功能的功能结构域可以募集或附加或插入或附接至其上。在某些实施例中，该Cas9酶包含一个或多个突变和/或一个或多个突变在该Cas9的RuvC1结构域中或者为如本文另外论述的突变。在一些实施例中，该Cas9酶具有一个或多个在催化结构域中的突变，其中在转录时，该指导序列指导CRISPR复合物与该靶序列的序列特异性结合，并且其中该酶进一步包含一个功能结构域。在一些实施例中，根据FnCas9蛋白的在E1006处的突变是优选的。

本文提供的结构信息允许探询指导RNA与靶DNA和Cas9酶的相互作用，从而允许工程化或改变指导RNA结构，以优化整个Cas9 CRISPR-Cas系统的功能性。例如，通过插入可结合至RNA上的衔接蛋白，可以扩展指导RNA的环，而不与Cas9蛋白冲突。这些衔接蛋白可以进一步募集包括一个或多个功能结构域的效应蛋白或融合。

一般来说，以为包括一个或多个功能结构域(例如，经由融合蛋白)的衔接蛋白提供其结合的特异性结合位点(例如，适配体)的方式对指导RNA进行修饰。对修饰的指导RNA进行修饰，这样使得一旦该指导RNA形式CRISPR复合物(即，Cas9酶结合至指导RNA和靶)，衔接蛋白结合并且，衔接蛋白上的功能结构域被定位成空间定向，这有利于属性功能起效。例如，如果该功能结构域是转录激活因子(例如，VP64或p65)，该转录激活因子被置于空间定向，这允许它能够影响靶标的转录。同样地，转录阻遏因子将被有利地定位为影响靶标的转录，并且核酸酶(例如Fok1)将被有利地定位为切割或部分裂解该靶标。

本领域技术人员理解的是，对指导RNA进行允许结合衔接子+功能结构域但不适当定位该衔接子+功能结构域(例如，由于CRISPR复合物三维结构的位阻)的修饰不是预期的修饰。通过引入同向重复的5’、在同向重复内、或指导序列的3’的一个或多个不同RNA序列，可以对一个或多个修饰的指导RNA进行修饰。

如在此解释的，这些功能结构域可以是，例如，来自下组的一个或多个结构域，该组由以下各项组成：甲基化酶活性、脱甲基化酶活性、转录激活活性、转录阻抑活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性、DNA切割活性、核酸结合活性、以及分子开关(例如，光诱导型)。在一些情况下，有利的是另外提供至少一个NLS。在一些情况下，有利的是将该NLS定位在N末端。当包括超过一个功能结构域时，这些功能结构域可以是相同的或不同的。

指导RNA可以被设计成包括对相同或不同衔接蛋白具有特异性的多个结合识别位点(例如，适配体)。Cas9酶的指导RNA的特征在于，它典型地是37-43个核苷酸，并且在于它仅包含一个茎环。指导RNA可以被设计成结合至转录起始位点(即TSS)上游启动区-1000-+1个核酸，优选-200个核酸。这种定位改进了影响基因活化(例如，转录激活因子)或基因抑制(例如，转录阻抑物)的功能结构域。修饰的指导RNA可以是靶向包含在组合物中的一个或多个靶座位(例如，至少1个指导RNA、至少2个指导RNA、至少5个指导RNA，至少10个指导RNA、至少20个指导RNA、至少30个指导RNA、至少50个指导RNA)的一个或多个修饰的指导RNA。

另外，当使核酸酶活性失活(例如，与野生型酶相比，核酸酶失活至少70％、至少80％、至少90％、至少95％、至少97％、或100％；或者换句话说，有利地具有非突变或野生型Cas9酶约0％的核酸酶活性、或非突变或野生型Cas9酶不超过约3％或约5％或约10％的核酸酶活性的Cas9酶)时，具有降低的核酸酶活性的Cas9酶是最有效的。通过将突变引入到FnCas9或其直向同源物的RuvC核酸酶结构域中，这是可能的。例如，利用选自下组的残基突变，该组由以下各项组成：如在FnCas9中的D917A、E1006A、E1028A、D1227A，D1255A或N1257，并且更优选地，引入选自下组的一种或多种突变，该组由以下各项组成：FnCas9或对应的直向同源物的位置D917A、E1006A、E1028A、D1227A、D1255A、N1257A、D917A、E1006A、E1028A、D1227A、D1255A以及N1257。在具体实施例中，突变是具有在FnCas9中的E1006A的D917A。

失活的Cas9酶可以与一个或多个功能结构域相缔合(例如，经由融合蛋白)，像例如，如在此对于修饰的指导RNA衔接蛋白所描述的，包括例如，来自下组的一个或多个结构域，该组由以下各项组成：甲基化酶活性、脱甲基化酶活性、转录激活活性、转录阻抑活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性、DNA切割活性、核酸结合活性、以及分子开关(例如，光诱导型)。优选的结构域是Fok1、VP64、P65、HSF1、MyoD1。在提供Fok1的事件中，有利的是提供多个Fok1功能结构域以允许功能性二聚体，以及指导RNA被设计为针对功能用途(Fok1)提供适当间隔，如具体描述于蔡(Tsai)等人，《自然生物技术》(NatureBiotechnology)，第32卷，第6期，2014年6月)中。衔接蛋白可以利用已知的接头来附接此类功能结构域。在一些情况下，有利的是另外提供至少一种NLS。在一些情况下，有利的是将该NLS定位在N末端。当包括超过一个功能结构域时，这些功能结构域可以是相同的或不同的。

一般来说，一个或多个功能结构域定位在灭活的Cas9酶上允许正确的空间定向，使得功能结构域影响具有属性功能效应的靶标。例如，如果该功能结构域是转录激活因子(例如，VP64或p65)，该转录激活因子被置于空间定向，这允许它能够影响靶标的转录。同样地，转录阻抑物将被有利地定位以影响靶标的转录，并且核酸酶(例如，Fok1)将被有利地定位以切割或部分切割该靶标。这可以包括除Cas9酶的N-/C-末端之外的位置。

衔接蛋白可以是结合至引入到修饰的指导RNA中的适配体或识别位点上并且允许正确定位一个或多个功能结构域的任何数量的蛋白质，一旦该指导RNA已经被结合到CRISPR复合物中，以影响具有属性功能的靶标。如在本申请中所详细解释的，此类可以是外壳蛋白，优选噬菌体外壳蛋白。与这样的衔接蛋白(例如呈融合蛋白的形式)相缔合的功能结构域可以包括例如来自下组的一个或多个结构域，该组由以下各项组成：甲基酶活性、脱甲基酶活性、转录激活活性、转录阻遏活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性、DNA切割活性、核酸结合活性、以及分子开关(例如光诱导型)。优选的结构域是Fok1、VP64、P65、HSF1、MyoD1。在该功能结构域是转录激活因子或转录阻抑因子的情况下，有利的是另外提供至少一个NLS并且优选在N末端处。当包括超过一个功能结构域时，这些功能结构域可以是相同的或不同的。该衔接蛋白可以利用已知接头来附接这样的功能结构域。

因此，修饰的指导RNA、失活的Cas9酶(具有或不具有功能结构域)、以及具有与一个或多个功能结构域的结合蛋白，可以各自单独包含在组合物中并单独地或共同地给予至宿主。可替代地，可以将这些组分提供于单一组合物中用于给予至宿主。可以经由本领域技术人员已知的或本文描述的用于递送到宿主的病毒载体(例如慢病毒载体、腺病毒载体、AAV载体)进行向宿主的给予。如本文所解释的，使用不同的选择标记(例如用于慢病毒gRNA选择)和gRNA浓度(例如取决于是否使用多种gRNA)对于引出改进的效果而言可以是有利的。

本发明包括本发明的组合物用于建立和利用条件型或诱导型CRISPR转基因细胞/动物的用途。(参见，例如，普莱特(Platt)等人，《细胞》(Cell)(2014)，http://dx.doi.org/10.1016/j.cell.2014.09.014，或本文引用的PCT专利公开，如WO 2014/093622(PCT/US2013/074667)，其被认为不是先于本发明或申请)。例如，靶细胞有条件性地或诱导性地包括Cas9 CRISPR酶(例如，以Cre依赖性构建体的形式)和/或有条件性地或诱导性地包括衔接蛋白并且，在表达被引入进靶细胞中的载体时，该载体表达的是诱导或产生在靶细胞中Cas9酶表达和/或接合体表达的条件。通过将该教授内容和本发明的组合物与已知用于产生CRISPR复合物的方法一起应用，受功能结构域影响的诱导型基因组事件也是本发明的一个方面。这个方面的一个单单的实例是产生CRISPR敲入/条件型转基因动物(例如，包括例如Lox-终止-polyA-Lox(LSL)盒的小鼠)，并且随后递送提供如在此所描述的(例如，用被外壳蛋白(例如，MS2)识别的一种或多种适配体修饰的指导RNA)一种或多种修饰的指导RNA(例如，-200个核苷酸至感兴趣的靶基因的TSS用于基因活化目的)、如在此所描述的一种或多种衔接蛋白(连接至一个或多个VP64上的MS2结合蛋白)、以及用于诱导条件型动物的手段(例如，用于使得Cas9表达为诱导型的Cre重组酶)的一种或多种组合物。可替代地，衔接蛋白可以作为条件型或诱导型组件与条件型或诱导型Cas9酶提供，以便提供用于筛选目的的有效模型，这有利地对于大量应用仅需要最小限度的设计和特异gRNA给予。

钝化的/失活的Cas蛋白

当Cas9蛋白具有核酸酶活性时，该Cas9蛋白可以被修饰以便具有降低的核酸酶活性，例如，与野生型酶相比，核酸酶失活至少70％、至少80％、至少90％、至少95％、至少97％、或100％；或者换句话说，有利地具有非突变或野生型Cas9酶或CRISPR酶约0％的核酸酶活性、或非突变或野生型Cas9酶(例如，非突变或野生型化脓链球菌Cas9酶或CRISPR酶)不超过约3％或约5％或约10％的核酸酶活性的Cas9酶。通过将突变引入到Cas9及其直向同源物的核酸酶结构域中，这是可能的。

失活的Cas9 CRISPR酶可以与一个或多个功能结构域相缔合(例如，经由融合蛋白)，包括例如，来自下组的一个或多个结构域，该组包括以下各项、基本上由其组成、或由其组成：甲基化酶活性、脱甲基化酶活性、转录激活活性、转录阻抑活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性、DNA切割活性、核酸结合活性、以及分子开关(例如，光诱导型)。优选的结构域是Fok1、VP64、P65、HSF1、MyoD1。在提供Fok1的事件中，有利的是提供多个Fok1功能结构域以允许功能性二聚体，以及sgRNA被设计为针对功能用途(Fok1)提供适当间隔，如具体描述于蔡(Tsai)等人，《自然生物技术》(Nature Biotechnology)，第32卷，第6期，2014年6月)中。该衔接蛋白可以利用已知接头来附接这样的功能结构域。在一些情况下，有利的是另外提供至少一种NLS。在一些情况下，有利的是将该NLS定位在N末端。当包括超过一个功能结构域时，这些功能结构域可以是相同的或不同的。

一般来说，一个或多个功能结构域定位在灭活的Cas9酶上允许正确的空间定向，使得功能结构域影响具有属性功能效应的靶标。例如，如果该功能结构域是转录激活因子(例如，VP64或p65)，该转录激活因子被置于空间定向，这允许它能够影响靶标的转录。同样地，转录阻抑物将被有利地定位以影响靶标的转录，并且核酸酶(例如，Fok1)将被有利地定位以切割或部分切割该靶标。这可以包括除CRISPR酶的N-/C-末端之外的位置。

在一个实施例中，Cas9可以包括一个或多个突变(并且因此编码其的一个或多个核酸分子可以具有一个或多个突变)。该突变可以是人工引入的突变并且可包括但不限于催化结构域中的一个或多个突变。关于Cas9酶的催化结构域的实例可包括但不限于RuvCI、RuvC II、RuvC III以及HNH域。

在一个实施例中，该Cas9可以包括一个或多个突变。该突变可以是人工引入的突变并且可包括但不限于催化结构域中的一个或多个突变，例如，以提供一种切口酶。关于Cas酶的催化结构域的实例可包括但不限于RuvC I、RuvC II、RuvC III以及HNH域。

在一个实施例中，Cas9可以用作融合至或有效作地连接至功能结构域上的通用核酸结合蛋白。示例性的功能结构域可以包括但不限于：翻译引发剂、翻译激活因子、翻译阻遏因子、核酸酶，特别是核糖核酸酶、剪接体、珠粒、光诱导型/可控型结构域或化学诱导型/可控型结构域。

在一些实施例中，靶向未改性的核酸的效应蛋白可以具有切割活性。在一些实施例中，该靶向RNA的效应蛋白可以指导在靶序列位置处或附近(例如在该靶序列之内和/或在该靶序列的互补物之内或在与该靶序列缔合的序列处)的一条或两条核酸(DNA或RNA)链的切割。在一些实施例中，靶向核酸的Cas9蛋白可指导距离靶序列的第一个或最后一个核苷酸约1、2、3、4、5、6、7、8、9、10、15、20、25、50、100、200、500个、或更多个碱基对之内的一条或两条DNA或RNA链的切割。在一些实施例中，切割可以是平的，即由此产生平端。在一些实施例中，切割可以是交错的，即由此产生黏性末端。在一些实施例中，切割可以是具有5’突出端(例如，1至5个核苷酸的5’突出端)的交错切口。在一些实施例中，切割可以是具有3’突出端(例如，1至5个核苷酸的3’突出端)的交错切口。在一些实施例中，载体编码可相对于相应的野生型酶被突变的靶向核酸的Cas蛋白，使得该突变的靶向核酸的Cas蛋白缺乏切割含有靶序列的靶多核苷酸的一条或两条DNA或RNA链的能力。作为一个另外的实例，Cas的两个或更多个催化结构域(RuvC I、RuvC II、和RuvC III或该HNH结构域)可以被突变为产生实质上缺乏所有RNA切割活性的突变的Cas。如在此描述的，Cas9效应蛋白的对应催化结构域还可以被突变为产生缺乏所有DNA切割活性或具有实质上降低的DNA切割活性的突变的Cas9。在一些实施例中，当该突变的酶的RNA切割活性不多于该酶的非突变形式的核酸切割活性的约25％、10％、5％、1％、0.1％、0.01％、或更少时，则靶向核酸的效应蛋白可被考虑为实质上缺乏所有RNA切割活性；一个实例可以是当突变形式的核酸切割活性与非突变形式相比是零或可忽略不计时。可以参考与来自II型CRISPR系统的具有多个核酸酶结构域的最大核酸酶共享同源性的酶的通用类别来鉴定一种效应蛋白。最优选地，该效应蛋白是II型蛋白，如Cas9。关于衍生，申请人意指该衍生的酶在很大程度上是基于与野生型酶具有高度序列同源性的含义，但是如本领域已知或如本文所述它在某些方面已经被突变(修饰)。

再一次，应当理解的是，术语Cas和CRISPR酶和CRISPR蛋白和Cas蛋白通常可互换地使用，并且在此参考的各方面同样是指本申请中进一步描述的新颖的CRISPR效应蛋白，除非另外显而易见的，如通过具体参考Cas9。如上提及的，在本文中使用的许多残基编号是指来自II型CRISPR座位的效应蛋白。然而，应当理解的是，本发明包括更多的来自其他微生物物种的效应蛋白。

作为Cas蛋白的可能来源的生物的列表

Cas蛋白可以包括来自以下属的生物的Cas蛋白，该属包括链球菌、弯曲杆菌、Nitratifractor、葡萄球菌、细小棒菌属(Parvibaculum)、罗氏菌属、奈瑟菌属、葡糖醋杆菌属、固氮螺菌属、Sphaerochaeta、乳杆菌属、真杆菌属或棒状杆菌属。

Cas9蛋白可以包括来自以下属的生物的Cas9蛋白，该属包括链球菌、弯曲杆菌、Nitratifractor、葡萄球菌、细小棒菌属(Parvibaculum)、罗氏菌属、奈瑟菌属、葡糖醋杆菌属、固氮螺菌属、Sphaerochaeta、乳杆菌属、真杆菌属或棒状杆菌属。

优选的实例包括化脓链球菌、金黄色葡萄球菌。

在一个实施例中，Cas9蛋白可以是以下属的生物的一种直向同源物，该属包括但不限于棒状杆菌属、萨特氏菌属、军团菌属、密螺旋体属、产线菌属、真杆菌属、链球菌属、乳杆菌属、支原体属、拟杆菌属、类杆菌属、Flaviivola、黄质菌属、Sphaerochaeta、固氮螺菌属、葡糖醋杆菌属、奈瑟菌属、罗氏菌属、细小棒菌属(Parvibaculum)、葡萄球菌属、Nitratifractor、支原体属以及弯曲杆菌属。这样一种属的生物的物种可以是如本文另外论述的。

一些鉴定CRISPR-Cas系统酶的直向同源物的方法可涉及鉴定感兴趣的基因组中的tracr序列。鉴定tracr序列可涉及以下步骤：在一个数据库中搜索这些同向重复或tracr配对序列以鉴定包括一种CRISPR酶的一个CRISPR区域。在该CRISPR酶有义和反义两个方向的侧翼的CRISPR区域中搜索同源序列。寻找转录终止子以及二级结构。将不是一个同向重复或一种tracr配对序列但与tracr配对序列的同向重复具有超过50％一致性的任何序列鉴定为一个可能的tracr序列。取该可能的tracr序列并且分析与其相关的转录终止子序列。

应当理解的是，可以将在此描述的任何功能性工程化到来自其他直向同源物的CRISPR酶中，包括包含来自多个直向同源物的片段的嵌合酶。此类直向同源物的实例是在此其他地方所述的。因此，嵌合酶可以包括以下生物的CRISPR酶直向同源物的片段，该生物包括但不限于棒状杆菌属、萨特氏菌属、军团菌属、密螺旋体属、产线菌属、真杆菌属、链球菌属、乳杆菌属、支原体属、拟杆菌属、类杆菌属、Flaviivola、黄质菌属、Sphaerochaeta、固氮螺菌属、葡糖醋杆菌属、奈瑟菌属、罗氏菌属、细小棒菌属(Parvibaculum)、葡萄球菌属、Nitratifractor、支原体属以及弯曲杆菌属。嵌合酶可以包括第一片段和第二片段，并且这些片段可以是本文提到的属的生物的CRISPR酶直向同源物或本文提到的物种的片段；有利的是，这些片段来自不同物种的CRISPR酶直向同源物。

为了将毒性和脱靶效应降低到最低限度，重要的是控制所递送的CRISPR酶mRNA和指导RNA的浓度。CRISPR酶mRNA和指导RNA的最佳浓度可以通过在细胞或动物模型中测试不同的浓度并且使用深度测序分析在潜在的脱靶基因组座位处的修饰的范围而确定。例如，对于靶向人类基因组的EMX1基因中的5’-GAGTCCGAGCAGAAGAAGAA-3’的指导序列，可以使用深度测序来评定在下列两个脱靶位点处的修饰水平，1：5’-GAGTCCTAGCAGGAGAAGAA-3’和2：5’-GAGTCTAAGCAGAAGAAGAA-3’。对于体内递送，应当选择产生最高的中靶修饰水平同时使脱靶修饰水平最小化的浓度。

递送：用于DNA/RNA或DNA/DNA或RNA/RNA或蛋白/RNA的选项

在一些实施例中，CRISPR系统的组分可以不同形式进行递送，如DNA/RNA或RNA/RNA或蛋白RNA的组合。例如，Cas9可以作为编码DNA的多核苷酸或编码RNA的多核苷酸或作为蛋白进行递送。指导物可以作为编码DNA的多核苷酸或RNA进行递送。设想了所有可能的组合，包括混合形式的递送。

在一些实施例中，所有此类组合(DNA/RNA或DNA/DNA或RNA/RNA或蛋白/RNA)。

在一些实施例中，当以蛋白质形式递送Cas9时，有可能将其与一种或多种指导物进行预装配。

递送：纳米线团(nanoclew)

另外，可以使用纳米线团(nanoclew)递送CRISPR系统，例如如描述于孙(Sun)W等人，用于抗癌药递送的茧样自降解的DNA线团(Cocoon-like self-degradable DNAnanoclew for anticancer drug delivery.)，《美国化学会志》(J Am Chem Soc.)2014年10月22日；136(42):14722-5.doi:10.1021/ja5088024.电子版2014年10月13日中；或在孙(Sun)W等人，用于有效递送用于基因组编辑的CRISPR-Cas9的自组装的DNA线团(Self-Assembled DNA Nanoclews for the Efficient Delivery of CRISPR-Cas9 for GenomeEditing.)，《德国应用化学英文国际版》(Angew Chem Int Ed Engl.)，2015年10月5日；54(41):12029-33.doi:10.1002/anie.201506030.电子版2015年8月27日中。

递送-GalNAc

CRISPR复合物组分可以通过与运输部分缀合或缔合进行递送(例如从披露于美国专利号8,106,022；8,313,772中的方法改适的，其通过引用结合在此)。核酸递送策略可以例如用于改进指导RNA、或信使RNA或编码CRISPR复合物组分的编码DNA(包括CRISPR蛋白)的递送。例如，RNA可以结合修饰的RNA核苷酸以改进稳定性、减少免疫刺激、和/或改进特异性(参见德利维(Deleavey)，格伦(Glen)F.等人，2012，《化学与生物学》(Chemistry&Biology)，第19卷，第8期，937-954；扎利平斯(Zalipsky)，1995，《先进药物递送评论》(Advanced Drug Delivery Reviews)16:157-182；凯里萨提(Caliceti)和维罗纳(Veronese)，2003，《先进药物递送评论》(Advanced Drug Delivery Reviews)，55:1261-1277)。已经描述了不同构建体可以用于修饰核酸(如gRNA)，以便更有效的递送，如可以适用于修饰gRNA的可逆的电荷中和磷酸三酯骨架修饰，从而使得更加疏水并且非阴离子化，由此改善细胞进入(米德(Meade)BR等人，2014，《自然生物技术》(Nature Biotechnology)32,1256-1261)。在另外的替代实施例中，所选择的RNA基序可以用于介导细胞转染(麦哲伦M等人，《分子治疗》(Molecular Therapy)(2012)；203,616-624)。类似地，适配体可以被适配成用于递送CRISPR复合物组分，例如通过将适配体附加到gRNA上(谭(Tan)W等人，2011，《生物技术趋势》(Trends in Biotechnology)，2011年12月，第29卷，第12期)。

在一些实施例中，将三分支N-乙酰半乳糖胺(GalNAc)缀合至寡核苷酸组分可以用于改进递送，例如递送至选择细胞类型(例如肝细胞)(参见WO 2014118272，其通过引用结合在此；奈尔(Nair)，JK等人，2014，《美国化学会志》(Journal of the American ChemicalSociety)，136(49),16958-16961)。这可以被认为是基于糖的粒子，并且在相应标题下在此提供了关于其他粒子递送系统和/或配制品的另外的细节。因此，GalNAc可以被认为是在本文所描述的其他粒子意义上的粒子，这样使得一般用途和其他考虑(例如，所述粒子的递送)也适用于GalNAc粒子。液相缀合策略可以例如用于将活化为PFP(五氟苯基)酯的三分支GalNAc簇(mol.wt.～2000)附接到5′-己基氨基修饰的寡核苷酸(5′-HA ASOs,mol.wt.～8000Da；奥斯德尔格等人，《生物共轭化学》(Bioconjugate Chem.)，2015，26(8)，第1451-1455页)上。类似地，已经描述聚(丙烯酸酯)聚合物用于体内核酸递送(参见WO2013158141，其通过引用结合在此)。在另外的替代实施例中，可以将CRISPR纳米粒子(或蛋白复合物)与天然存在的血清蛋白预混合使用，以便改进递送(阿肯克(Akinc)A等人，2010，《分子治疗》(Molecular Therapy)，第18卷，第7期，1357-1364)。

例如通过筛选化学品文库，筛选技术可以用来鉴别递送增强剂(吉乐朗(Gilleron)J.等人，2015，《核酸研究》(Nucl.Acids Res.)43(16)：7984-8001)。多种方法也已被描述用于评估递送载体的效率，如脂质纳米粒子，其可以用于鉴别用于CRISPR组分的有效递送载体(参见沙海(Sahay)G.等人，2013，《自然生物技术》(Nature Biotechnology)，31，653-658)。

在一些实施例中，可以通过将功能肽添加至蛋白质(例如，改变蛋白疏水性的肽)来促进蛋白CRISPR组分的递送，例如以便改进体内功能性。CRISPR复合物组分蛋白可以类似地被修饰以便促进随后的化学反应。例如，可以将氨基酸添加到具有经历点击化学的基团的蛋白上(尼克奇I.等人，2015，《自然工具》(Nature Protocols)，10，780-791)。在这种类型的实施例中，然后点击化学基团可以用于添加多种多样的替代结构(如聚(乙二醇))以用于稳定性、细胞穿透肽、RNA适配体、脂质、或碳水化合物(如GalNAc)。在另外的替代方案中，例如通过将细胞穿透肽添加到蛋白上，CRISPR复合物组分蛋白可以被修饰以使蛋白适配成用于细胞进入(参见斯万森(Svensen)等人，2012，《药理学趋势》(Trends inPharmacological Sciences)，第33卷，第4期)(参见考夫曼(Kauffman)，W.伯克利(Berkeley)等人，2015，《生物化学趋势》(Trends in Biochemical Sciences)，第40卷，第12册，749-764；科伦(Koren)和特其林(Torchilin)，2012，《分子医学趋势》(Trends inMolecular Medicine)，第18卷，第7期)。在另外的替代实施例中，可以用有助于稍后递送CRISPR复合物组分的化合物或配制品预处理患者或受试者。

可诱导系统

在一些实施例中，CRISPR酶可以形成可诱导系统的组分。该系统的诱导性质将允许该系统利用一种能量形式对基因编辑或基因表达进行时空控制。该能量形式可以包括但不限于，电磁辐射、声能、化学能和热能。可诱导系统的实例包括四环素诱导型启动子(Tet-开(Tet-On)或Tet-关(Tet-Off))、小分子双杂交体转录激活系统(FKBP、ABA等)或光可诱导系统(光敏素、LOV结构域或隐花色素)。在一个实施例中，该CRISPR酶可以是以序列特异性方式指导转录活性的变化的光诱导的转录效应因子(LITE)的一部分。光的组分可以包括CRISPR酶、光响应细胞色素异二聚体(例如，来自拟南芥)、以及转录激活/抑制结构域。诱导型DNA结合蛋白和关于使用它们的方法的其他实例提供在US 61/736,465、US 61/721,283以及WO 2014/018423中，特此通过引用以其全文并入。

自行失活性系统

一旦在细胞的基因组中一种基因的所有拷贝已经被编辑，在该细胞中CRISRP/Cas9继续表达不再是必需的。事实上，持续表达在未预期的基因组位点等处的脱靶效应的情况下会是不令人希望的。因此时间限制性表达会是有用的。诱导型表达提供了一种方法，但是此外申请人已经工程化自行失活性CRISPR-Cas9系统，该系统依赖于在该CRISPR载体本身内使用非编码指导靶序列。因此，表达开始后，该CRISPR系统将导致其自身的破坏，但是在破坏完成之前，它将有时间编辑靶基因的基因组拷贝(在二倍体细胞中具有正常点突变的情况下，需要至多两个编辑)。简单地，该自行失活性CRISPR-Cas系统包括另外的RNA(即指导RNA)，该RNA靶向CRISPR酶本身的编码序列或者靶向与存在于以下项的一个或多个中的独特序列互补的一种或多种非编码指导靶序列：

(a)在驱动非编码RNA组件的表达的启动子内，

(b)在驱动Cas9基因的表达的启动子内，

(c)在Cas9编码序列中的ATG翻译起始密码子的100bp内，

(d)在病毒递送载体的例如AAV基因组中的反向末端重复(iTR)内。

另外，该RNA可以经由载体递送，例如编码CRISPR复合物的单独的载体或相同的载体。当由单独的载体提供时，靶向Cas表达的CRISPR RNA可以顺序地或同时地给予。当顺序给予时，靶向Cas表达的CRISPR RNA是在旨在用于例如基因编辑或基因工程的CRISPR RNA之后被递送。此时期可以是数分钟时期(例如5分钟，10分钟，20分钟，30分钟，45分钟，60分钟)。此时期可以是数小时时期(例如2小时，4小时，6小时，8小时，12小时，24小时)。此时期可以是数天时期(例如2天，3天，4天，7天)。此时期可以是数周时期(例如2周，3周，4周)。此时期可以是数月时期(例如2个月，4个月，8个月，12个月)。此时期可以是数年时期(例如2年，3年，4年)。以此方式，Cas酶与能够杂交到第一靶标(例如一个基因组座位或多个感兴趣座位)上的第一gRNA/chiRNA缔合，并且承担CRISPR-Cas系统的所希望的一种或多种功能(例如基因工程)；并且随后该Cas酶可以然后与能够杂交到包含Cas或CRISPR盒的至少部分的序列上的第二gRNA/chiRNA缔合。在gRNA/chiRNA靶向编码Cas蛋白的表达的序列的情况下，该酶变得受阻碍并且该系统变为自行失活性。以相同方式，经由例如如在此解释的脂质体、脂质转染、粒子、微囊泡来应用的靶向Cas表达的CRISPR RNA可以顺序地或同时地给予。类似地，自失活可以用于用以靶向一种或多种靶标的一种或多种指导RNA的失活。

在一些方面，提供单一gRNA，该单一gRNA能够杂交到CRISPR酶起始密码子的序列下游，借此在一段时间之后CRISPR酶表达有损失。在一些方面，提供一种或多种gRNA，所述gRNA能够杂交到编码CRISPR-Cas系统的多核苷酸的一种或多种编码区或非编码区，借此在一段时间之后CRISPR-Cas系统的一种或多种或者在一些情况下全部失活。在该系统的一些方面，并且不受理论限制，该细胞可以包含多种CRISPR-Cas复合物，其中CRISPR复合物的第一子集包含能够靶向有待编辑的一个或多个基因组座位的第一chiRNA，并且CRISPR复合物的第二子集包含能够靶向编码CRISPR-Cas系统的多核苷酸的至少一种第二chiRNA，其中CRISPR-Cas复合物的第一子集介导对靶向的一个或多个基因组座位的编辑，并且CRISPR复合物的第二子集最终使CRISPR-Cas系统失活，由此使细胞中进一步的CRISPR-Cas表达失活。

因此，本发明提供了一种CRISPR-Cas系统，包括一种或多种用于递送至真核细胞的载体，其中该一种或多种载体编码：(i)CRISPR酶；(ii)第一指导RNA，该第一指导RNA能够杂交到细胞中的靶序列上；(iii)第二指导RNA，该第二指导RNA能够杂交到编码CRISPR酶的载体中的一种或多种靶序列上；(iv)至少一种tracr配对序列；以及(v)至少一种tracr序列，该第一和第二复合物可以使用相同的tracr和tracr配对，因此区别仅在于指导序列，其中当在细胞内表达时：该第一指导RNA引导第一CRISPR复合物与细胞中的靶序列的序列特异性结合；该第二指导RNA引导第二CRISPR复合物与编码CRISPR酶的载体中的靶序列的序列特异性结合；这些CRISPR复合物包含(a)杂交到tracr序列上的该tracr配对序列，以及(b)结合到该指导RNA上的CRISPR酶，使得指导RNA可以结合到其靶序列上；并且该第二CRISPR复合物使CRISPR-Cas系统失活以防止该细胞对CRISPR酶继续表达。

在本文中的其他地方披露了该一种或多种载体、该编码的酶、该指导序列等的另外特征。例如，一种或多种指导序列的一者或两者可以是chiRNA序列的部分，该chiRNA序列在单RNA内提供了指导、tracr配对和tracr序列，这样使得该系统可以编码(i)CRISPR酶；(ii)第一chiRNA，其包含能够杂交到细胞中的第一靶序列上的序列、第一tracr配对序列、和第一tracr序列；(iii)第二指导RNA，其能够杂交到编码CRISPR酶、第二tracr配对序列、和第二tracr序列的载体上。类似地，该酶可以包括一个或多个NLS等。

这些不同的编码序列(CRISPR酶、指导RNA、tracr和tracr配对)可以被包括在单一载体上或多种载体上。例如，有可能在一个载体上编码该酶，并且在另一个载体上编码不同的RNA序列，或者有可能在一个载体上编码该酶并且编码一个chiRNA，并且在另一个载体上编码其余chiRNA，或者任何其他排列。总体上，使用总计一种或两种不同载体的系统是优选的。

在使用多种载体的情况下，有可能以不等数目递送它们，并且理想地采用相对于第二指导RNA而言的过量的编码第一指导RNA的载体，由此有助于延迟CRISPR系统的最终失活，直至基因组编辑已经具有发生的机会。

该第一指导RNA可以靶向基因组内的任何感兴趣靶序列，如在此其他地方所述。该第二指导RNA靶向编码CRISPR Cas9酶的载体内的序列，并且由此使来自该载体的酶表达失活。因此在载体中的靶序列必须能够使表达失活。适合的靶序列可以是例如接近Cas9编码序列的翻译起始密码子或在其内，在驱动非编码RNA组件的表达的启动子中的非编码序列中，在驱动Cas9基因的表达的启动子内，在Cas9编码序列中的ATG翻译起始密码子的100bp内，和/或在病毒递送载体的例如在AAV基因组中的反向末端重复(iTR)内。在此区附近的双链断裂可以诱导Cas9编码序列中的移码，导致蛋白表达的损失。“自行失活性”指导RNA的可替代靶序列目的在于编辑/失活多个表达CRISPR-Cas9系统所需的或者载体稳定性所需的调节区/序列。例如，如果Cas9编码序列的启动子被破坏，则转录可以被抑制或阻止。类似地，如果载体包括用于复制、维持或稳定性的序列，则有可能靶向这些。例如，在AAV载体中，有用的靶序列是在iTR内。其他用以靶向的有用序列可以是启动子序列、聚腺苷酸化位点等。

另外，如果指导RNA以阵列形式表达，同时靶向两种启动子的“自行失活性”指导RNA将导致从CRISPR-Cas表达构建体切除间插核苷酸，有效地导致其完全失活。类似地，在指导RNA靶向两种ITR或同时靶向两种或更多种其他CRISPR-Cas组分的情况下，间插核苷酸的切除将产生。总体上如在此解释的自失活采用用以提供CRISPR-Cas9的调节的CRISPR-Cas9系统是可应用的。例如，如在此解释的自失活可以应用至突变例如扩增障碍的CRISPR修复，如在此解释的。作为该自失活的结果，CRISPR修复仅是瞬时有活性的。

将非靶向核苷酸添加至“自行失活性”指导RNA的5’端(例如1-10个核苷酸，优选1-5个核苷酸)可以用于延迟其加工和/或修饰其效力，作为确保在CRISPR-Cas9停止之前在靶向的基因组座位处进行编辑的手段。

在自行失活性AAV-CRISPR-Cas9系统的一个方面，共表达靶向感兴趣基因组序列(例如1-2、1-5、1-10、1-15、1-20、1-30)的一种或多种sgRNA的质粒可以用“自行失活性”sgRNA建立，所述“自行失活性”sgRNA靶向在工程化的ATG起始位点处或附近(例如，在5个核苷酸内，在15个核苷酸内，在30个核苷酸内，在50个核苷酸内，在100个核苷酸内)的SpCas9序列。在U6启动子区中的调节序列还可以用sgRNA靶向。U6驱动的sgRNA可以按阵列形式设计，使得多种sgRNA序列可以同时释放。当首次递送到靶组织/细胞(左细胞)中，sgRNA开始累积，同时在细胞核中的Cas9水平上升。Cas9复合所有sgRNA以介导CRISPR-Cas9质粒的基因组编辑和自失活。

自行失活性CRISPR-Cas9系统的一个方面是表达单一或来自1至4个或更多个不同指导序列(例如高达约20个或约30个指导序列)的串联阵列形式。每个单独的自行失活性指导序列可以靶向不同的靶标。这些可以从例如一个嵌合pol3转录物加工。可以使用Pol3启动子例如U6或H1启动子。Pol2启动子，例如在此遍及全文提及的那些。反向末端重复(iTR)序列可以在Pol3启动子-sgRNA(s)-Pol2启动子-Cas9的侧翼。

嵌合串联阵列转录物的一个方面是一种或多种指导物编辑一种或多种靶标，同时一种或多种自行失活性指导物使CRISPR/Cas9系统失活。因此，例如用于修复扩增障碍的描述的CRISPR-Cas9系统可以直接与在此描述的自行失活性CRISPR-Cas9系统组合。这种系统可以例如具有针对用于修复的靶区域的两种指导物，以及针对CRISPR-Cas9的自我失活的至少一种第三指导物。参考申请序列号PCT/US2014/069897，标题为“Crispr-Cas系统在核苷酸重复障碍中使用的组合物和方法(Compositions And Methods Of Use Of Crispr-Cas Systems In Nucleotide Repeat Disorders)”，公开于2014年12月12日作为WO/2015/089351。

试剂盒

在一个方面，本发明提供了以下试剂盒，这些试剂盒包含披露于以上方法和组合物中的组件中的任何一个或多个。组件可以单独地或组合地提供，并且可以被提供于任何适合的容器中，如小瓶、瓶子或管。在一些实施例中，该试剂盒包括一种或多种语言，例如多于一种语言的说明书。

在一些实施例中，试剂盒包括一种或多种用于在利用在此描述的组件中的一种或多种的方法中使用的试剂。试剂可以被提供于任何适合的容器中。例如，试剂盒可以提供一种或多种反应或存储缓冲液。可以按在具体测定中可用的形式或按在使用之前需要添加一种或多种其他组分的形式(例如按浓缩或冻干形式)提供试剂。缓冲液可以是任何缓冲液，包括但不限于碳酸钠缓冲液、碳酸氢钠缓冲液、硼酸盐缓冲液、Tris缓冲液、MOPS缓冲液、HEPES缓冲液及其组合。在一些实施例中，该缓冲液是碱性的。在一些实施例中，该缓冲液具有从约7至约10的pH。在一些实施例中，该试剂盒包括一个或多个寡核苷酸，该一个或多个寡核苷酸对应于一个用于插入进载体中的指导序列，以便有效作地连接该指导序列和一个调节组件。在一些实施例中，该试剂盒包括一个同源重组模板多核苷酸。在一些实施例中，该试剂盒包括在此描述的载体中的一个或多个和/或在此描述的多核苷酸中的一个或多个。该试剂盒可以有利地允许提供本发明的系统的所有组件。

靶向核酸的系统和方法

术语“靶向核酸的系统”，其中核酸是DNA或RNA，并且在一些方面还可以指DNA-RNA杂合体或其衍生物，总共是指转录物和涉及靶向DNA或RNA的CRISPR相关(“Cas”)基因的表达或指导其活性的其他组件，其可以包括编码靶向DNA或RNA的Cas蛋白的序列、和包括CRISPR RNA(crRNA)序列和(在一些但不是所有系统中)反式激活CRISPR/Cas系统RNA(tracrRNA)序列的靶向DNA或RNA的指导RNA、或来自靶向DNA或RNA的CRISPR座位的其他序列和转录物。一般来说，靶向RNA的系统的特征为促进在靶DNA或RNA序列的位点处形成靶向DNA或RNA的复合物的组件。在靶向DNA或RNA的复合物形成的背景下，“靶序列”是指靶向DNA或RNA的指导RNA被设计为对其具有互补性的DNA或RNA序列，其中在靶序列与靶向RNA的指导RNA之间的杂交促进靶向RNA的复合物的形成。在一些实施例中，靶序列位于细胞的细胞核或细胞质中。

在本发明的一个方面，新型的靶向DNA的系统还称为靶向DNA的CRISPR/Cas，或本申请的CRISPR-Cas靶向DNA的系统基于不要求产生用以靶向特异性DNA序列的定制蛋白的鉴定出的Cas9蛋白，而是单个效应蛋白或酶可以通过RNA分子被编程为识别特异性DNA靶标，换言之，使用所述RNA分子可以将该酶募集到特异性DNA靶标上。本发明的方面特别涉及靶向DNA的RNA指导的SpCas9 CRISPR系统。

在一个方面，本发明提供了用于使用靶向核酸的系统的一个或多个组件的方法。本发明的的靶向核酸的复合物提供了用于修饰靶DNA或RNA(单链或双链、直链或超螺旋的)的有效手段。本发明的靶向核酸的复合物具有多种多样的实用性，包括修饰(例如，缺失、插入、转位、失活、激活)多种细胞类型中的靶DNA或RNA。正因为如此，本发明的靶向核酸的复合物在例如基因疗法、药物筛选、疾病诊断以及预后中具有广阔的应用谱。示例性的靶向核酸的复合物包括与杂交到感兴趣的靶座位内的靶序列上的指导RNA复合的靶向DNA或RNA的效应蛋白。

在此描述的这些靶向核酸的系统、载体系统、载体和组合物可以用于各种靶向核酸的应用中，由此改变或修饰基因产物的合成，如蛋白、核酸切割、核酸编辑、核酸剪接；靶核酸的运输、靶核酸的追踪、靶核酸的分离、靶核酸的可视化等。

本发明的方面还涵盖在此描述的组合物和系统在基因组工程，例如用于改变或操纵一个或多个基因或一种或多种基因产物在原核或真核细胞体内、体外或离体表达的方法和用途。

在一个实施例中，本发明提供了一种切割靶DNA的方法。该方法可以包括使用靶向核酸的复合物修饰靶DNA，该复合物结合到该靶DNA上并且实施所述靶DNA的切割。在一个实施例中，当被引入进细胞中时，本发明的靶向核酸的复合物在RNA序列中可产生断裂(例如，单链或双链断裂)。例如，可以使用该方法切割细胞中的疾病RNA。例如，可将外源RNA模板引入进细胞中，该外源RNA模板包括有待整合的、侧翼为上游序列和下游序列的序列。上游和下游序列与RNA中的整合位点的任一侧都具有序列相似性。在希望的情况下，供体RNA可以是mRNA。该外源RNA模板包括有待整合的序列(例如，突变的RNA)。供整合的序列可以是对细胞而言内源或外源的序列。有待整合的序列的实例包括编码蛋白质的RNA或非编码RNA(例如，微小RNA)。因此，供整合的序列可以有效作地连接到一个或多个适当的控制序列上。可替代地，有待整合的序列可以提供一种调节功能。选择外源RNA模板中的上游和下游序列，以促进感兴趣的RNA序列与供体RNA之间的重组。该上游序列是一个与供整合的靶向位点的上游的RNA序列具有序列相似性的RNA序列。类似地，该下游序列是一个与供整合的靶向位点的RNA序列下游具有序列相似性的RNA序列。外源RNA模板中的上游和下游序列与靶向的RNA序列可以具有75％、80％、85％、90％、95％或100％序列一致性。优选地，外源RNA模板中的上游和下游序列与靶向的RNA序列具有约95％、96％、97％、98％、99％或100％序列一致性。在一些方法中，外源RNA模板中的上游和下游序列与靶向的RNA序列具有约99％或100％序列一致性。上游或下游序列可以包括从约20bp至约2500bp，例如约50、100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400或2500bp。在一些方法中，示例性上游或下游序列具有约200bp至约2000bp、约600bp至约1000bp或更具体地约700bp至约1000bp。在一些方法中，该外源RNA模板可以进一步包括一种标记。这样的一种标记使得容易地筛选靶向的整合。适合的标记的实例包括限制性位点、荧光蛋白或选择性标记。可以使用重组技术构建本发明的外源RNA模板(参见例如，萨姆布鲁克(Sambrook)等人，2001和奥苏贝尔(Ausubel)等人，1996)。在一种用于通过整合外源DNA模板而修饰靶DNA的方法中，通过靶向核酸的复合物将一个断裂(例如，双链或单链断裂)引入进DNA序列中，通过用外源DNA模板进行同源重组而修复该断裂，这样使得将该模板整合进DNA靶标中。双链断裂的存在促进模板的整合。在其他实施例中，本发明提供了一种修饰RNA在真核细胞中的表达的方法。该方法包括通过使用结合到编码RNA(例如，mRNA或pre-mRNA)的DNA上的靶向核酸的复合物增加或降低靶多核苷酸的表达。在一些方法中，可以使靶DNA失活以实施细胞中的表达的修饰。例如，当靶向DNA的复合物结合到细胞中的一个靶序列上时，该靶DNA失活，这样使得该序列不被转录，该编码蛋白不被产生，或者该序列不会像野生型序列一样起作用。例如，可以使蛋白质或微小RNA编码序列失活，这样使得该蛋白质或微小RNA或前-微小RNA转录物不被产生。靶向DNA的复合物的靶DNA可以是对真核细胞而言内源或外源的任何DNA。例如，该靶DNA可以是一种驻留在真核细胞的细胞核中的DNA。靶DNA可以是编码编码基因产物(例如，蛋白)的基因产物(例如，mRNA或pre-mRNA)的序列或非编码序列(例如，ncRNA、lncRNA、tRNA、或rRNA)。靶DNA的实例包括与信号传导生化途径相关的序列，例如信号传导生化途径相关DNA。靶DNA的实例包括疾病相关DNA。“疾病相关”DNA是指与非疾病对照的组织或细胞相比，在来源于疾病影响的组织的细胞中以异常水平或以异常形式产生转录产物的任何DNA。在改变的表达与疾病的出现和/或进展相关的情况下，它可以是从一个以异常高的水平被表达的基因转录的DNA；它可以是从一个以异常低的水平被表达的基因转录的DNA。疾病相关DNA还指从具有一个或多个突变或直接负责或与一个或多个负责疾病的病因学的基因连锁不平衡的遗传变异的基因转录的DNA。翻译的产物可以是已知的或未知的，并且可以处于正常或异常水平。靶向DNA的复合物的靶DNA可以是对真核细胞而言内源或外源的任何DNA。例如，该靶DNA可以是一种驻留在真核细胞的细胞核中的DNA。靶DNA可以是编码基因产物(例如，mRNA、pre-mRNA、蛋白)的序列或非编码序列(例如，ncRNA、lncRNA、tRNA、或rRNA)。

在一些实施例中，该方法可以包括允许靶向核酸的复合物结合到靶DNA上，以实现所述靶DNA的切割，由此修饰靶DNA，其中该靶向核酸的复合物包括与杂交到所述靶DNA内的靶序列上的指导RNA复合的靶向核酸的效应蛋白。在一个方面，本发明提供了修饰DNA或RNA在真核细胞中的表达的方法。在一些实施例中，该方法包括允许靶向核酸的复合物结合到该DNA上，这样使得所述结合导致所述DNA的表达增加或降低；其中该靶向核酸的复合物包括与指导RNA复合的靶向核酸的效应蛋白。类似的考虑因素和条件适用如上文针对修饰靶DNA的方法。事实上，这些取样、培养和重新引入选择跨本发明的多个方面而适用。在一个方面，本发明提供了修饰真核细胞中的靶DNA的方法，这些方法可以在体内、离体或在体外。在一些实施例中，该方法包括对来自人或非人动物的细胞或细胞群进行取样，并且修饰该细胞或这些细胞。培养可以发生在离体的任何阶段。该细胞或这些细胞甚至可以被重新引入该非人动物或植物中。对于重新引入的细胞，特别优选的是这些细胞是干细胞。

的确，在本发明的任何方面，靶向核酸的复合物可以包括与杂交到靶序列上的指导RNA复合的靶向核酸的效应蛋白。

本发明涉及用于控制涉及序列靶向的基因表达的系统、方法、和组合物的工程化和优化，该序列靶向涉及靶向核酸的系统及其组分。本发明方法的一个优点在于，该CRISPR系统最小化或避免了脱靶结合及其所产生的副作用。这是通过使用被安排为具有针对靶DNA的高度序列特异性的系统而实现的。

相对于靶向核酸的复合物或系统，优选地，该tracr序列具有一个或多个发夹结构，并且长度是30个或更多个核苷酸，长度是40个或更多个核苷酸，或长度是50或更多个核苷酸；该crRNA序列的长度在10至30个核苷酸之间，该靶向核酸的效应蛋白是II型Cas9效应蛋白。

编辑与修饰

在一个方面，本发明提供了用于使用CRISPR系统的一个或多个组件的方法。本发明的CRISPR复合物提供了用于修饰靶多核苷酸的有效手段。本发明的CRISPR复合物具有多种多样的实用性，包括修饰(例如，缺失、插入、转位、失活、激活)多种细胞类型中的靶多核苷酸。正因为如此，本发明的CRISPR复合物在例如基因疗法、药物筛选、疾病诊断以及预后中具有广阔的应用谱。示例性CRISPR复合物包括与指导序列复合的CRISPR酶，该指导序列与靶多核苷酸内的靶序列杂交。在某些实施例中，将同向重复序列连接到指导序列上。

DNA切割和修复

该方法包括使用CRISPR复合物修饰靶多核苷酸，该CRISPR复合物结合到该靶多核苷酸上并且实施所述靶多核苷酸的切割。典型地，当被引入进细胞中时，本发明的CRISPR复合物在基因组序列中产生一个断裂(例如，单链或双链断裂)。例如，可以使用该方法切割细胞中的疾病基因。由该CRISPR复合物产生的断裂可以通过修复过程进行修复，如易出错的非同源末端连接(NHEJ)途径或高保真同源定向修复(HDR)。在这些修复过程期间，可以将外源多核苷酸模板引入进基因组序列中。在一些方法中，该HDR过程被用于修饰基因组序列。例如，将外源多核苷酸模板引入进细胞中，该外源多核苷酸模板包括有待整合的、侧翼为上游序列和下游序列的序列。上游和下游序列与染色体中的整合位点的任一侧都具有序列相似性。在希望的情况下，供体多核苷酸可以是DNA，例如DNA质粒、细菌人工染色体(BAC)、酵母人工染色体(YAC)、病毒载体、一段线性DNA、PCR片段、裸核酸或与递送赋形剂(如脂质体或泊洛沙姆)复合的核酸。该外源多核苷酸模板包括有待整合的序列(例如，突变的基因)。供整合的序列可以是对细胞而言内源或外源的序列。有待整合的序列的实例包括编码蛋白质的多核苷酸或非编码RNA(例如，微小RNA)。因此，供整合的序列可以有效作地连接到一个或多个适当的控制序列上。可替代地，有待整合的序列可以提供一种调节功能。选择外源多核苷酸模板中的上游和下游序列，以促进感兴趣的染色体序列与供体多核苷酸之间的重组。该上游序列是一个与供整合的靶向位点的上游的基因组序列具有序列相似性的核酸序列。类似地，该下游序列是一个与供整合的靶向位点的染色体序列下游具有序列相似性的核酸序列。外源多核苷酸模板中的上游和下游序列与靶向的基因组序列可以具有75％、80％、85％、90％、95％或100％序列一致性。优选地，外源多核苷酸模板中的上游和下游序列与靶向的基因组序列具有约95％、96％、97％、98％、99％或100％序列一致性。在一些方法中，外源多核苷酸模板中的上游和下游序列与靶向的基因组序列具有约99％或100％序列一致性。上游或下游序列可以包括从约20bp至约2500bp，例如约50、100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400或2500bp。在一些方法中，示例性上游或下游序列具有约200bp至约2000bp、约600bp至约1000bp或更具体地约700bp至约1000bp。在一些方法中，该外源多核苷酸模板可以进一步包括标记。这样的一种标记使得容易地筛选靶向的整合。适合的标记的实例包括限制性位点、荧光蛋白或选择性标记。可以使用重组技术构建本发明的外源多核苷酸模板(参见例如，萨姆布鲁克(Sambrook)等人，2001和奥苏贝尔(Ausubel)等人，1996)。在一种用于通过整合外源多核苷酸模板而修饰靶多核苷酸的方法中，通过CRISPR复合物将双链断裂引入进基因组序列中，经由同源重组通过外源多核苷酸模板而修复该断裂，这样使得将该模板整合进基因组中。双链断裂的存在促进模板的整合。在其他实施例中，本发明提供了一种修饰多核苷酸在真核细胞中的表达的方法。该方法包括通过使用结合到多核苷酸上的CRISPR复合物增加或降低靶多核苷酸的表达。在一些方法中，可以使靶多核苷酸失活以实施细胞中的表达的修饰。例如，当CRISPR复合物结合到细胞中的靶序列上时，该靶多核苷酸失活，这样使得该序列不被转录，该编码蛋白不被产生，或者该序列不会像野生型序列一样起作用。例如，可以使蛋白质或微小RNA编码序列失活，这样使得该蛋白质或微小RNA或前-微小RNA转录物不被产生。在一些方法中，可以使控制序列失活，这样使得它不再作为控制序列起作用。如在此使用，“控制序列”是指影响核酸序列的转录、翻译或可及性的任何核酸序列。控制序列的实例包括启动子、转录终止子和增强子，它们是控制序列。CRISPR复合物的靶多核苷酸可以是对真核细胞而言内源或外源的任何多核苷酸。例如，该靶多核苷酸可以是一种驻留在真核细胞的细胞核中的多核苷酸。该靶多核苷酸可以是一个编码基因产物(例如，蛋白质)的序列或一个非编码序列(例如，调节多核苷酸或无用DNA)。靶多核苷酸的实例包括与信号传导生化途径相关的序列，例如信号传导生化途径相关基因或多核苷酸。靶多核苷酸的实例包括疾病相关基因或多核苷酸。“疾病相关”基因或多核苷酸是指与非疾病对照的组织或细胞相比，在来源于疾病影响的组织的细胞中以异常水平或以异常形式产生转录或翻译产物的任何基因或多核苷酸。在改变的表达与疾病的出现和/或进展相关的情况下，它可以是一个以异常高的水平被表达的基因；它可以是一个以异常低的水平被表达的基因。疾病相关基因还指具有一个或多个突变或直接负责或与一个或多个负责疾病的病因学的基因连锁不平衡的遗传变异的基因。转录的或翻译的产物可以是已知的或未知的，并且可以处于正常或异常水平。CRISPR复合物的靶多核苷酸可以是对真核细胞而言内源或外源的任何多核苷酸。例如，该靶多核苷酸可以是一种驻留在真核细胞的细胞核中的多核苷酸。该靶多核苷酸可以是一个编码基因产物(例如，蛋白质)的序列或一个非编码序列(例如，调节多核苷酸或无用DNA)。

基因编辑或用Cas9改变靶基因座；HDR和模板

这些链中的一条链的双链断裂或单链断裂应该有利地足够接近于靶位置使得校正发生。在一个实施例中，距离不超过50、100、200、300、350或400个核苷酸。虽然希望不受理论束缚，据信断裂应该足够接近于靶位置，这样使得断裂位于在端切除过程中经受外切核酸酶介导的去除的区域内。如果靶位置和断裂之间的距离过大，突变可能不被包括在端切除中，并且因此，可以不被校正，因为模板核酸序列仅可用于校正端切除区域内的序列。

在一个实施例中，其中出于诱导HDR介导的校正的目的，指导RNA和II型分子，特别是Cas9或其直向同源物或同系物，优选Cas9核酸酶诱导双链断裂，切割位点远离靶位置0-200bp(例如，0至175、0至150、0至125、0至100、0至75、0至50、0至25、25至200、25至175、25至150、25至125、25至100、25至75、25至50、50至200、50至175、50至150、50至125、50至100、50至75、75至200、75至175、75至150、75至1 25、75至100bp)。在一个实施例中，切割位点远离靶位置0-100bp(例如，0到75、0到50、0至25、25至100、25至75、25至50、50至100、50至75或75至100bp)。在一个另外的实施例中，出于诱导HDR介导的校正的目的，与Cas9或其直向同源物或同系物复合的两个或更多个指导RNA可以用于诱导多重断裂。

同源臂应该至少延伸远至可以发生端切除的区域，例如，以便允许所切除的单链突出端在供体模板中找到互补区。可以通过参数(如质粒大小或病毒包装限制)来限制总长度。在一个实施例中，同源臂可以不延伸到重复组件中。示例性同源臂长度包括至少50、100、250、500、750或1000个核苷酸。

如在此使用的，靶位置是指通过II型，特别是Cas9或其直向同源物或同系物，优选Cas9分子依赖性方法修饰的靶核酸或靶基因(例如，染色体)上的位点。例如，靶位置可以是靶核酸的修饰的Cas9分子裂解以及靶位置的模板核酸引导的修饰(例如，校正)。在一个实施例中，靶位置可以是在一个或多个核苷酸被添加至其中的目标核酸上的两个核苷酸(例如，相邻的核苷酸)之间的位点。靶位置可以包括通过模板核酸被改变(例如，校正)的一个或多个核苷酸。在一个实施例中，靶位置在靶序列(例如，指导RNA所结合的序列)之内。在一个实施例中，靶位置是靶序列(例如，指导RNA所结合的序列)的上游或下游。

如在此使用的术语模板核酸是指可以与II型分子，特别是Cas9或其直向同源物或同系物，优选Cas9分子和指导RNA分子结合使用以改变靶位置的结构的核酸序列。在一个实施例中，靶核酸被修饰成具有模板核酸的一些或所有序列，典型地在一个或多个切割位点处或附近。在一个实施例中，模板核酸是单链的。在一个替代实施例中，模板核酸是双链的。在一个实施例中，模板核酸是DNA(例如，双链DNA)。在一个替代实施例中，模板核酸是单链DNA。

在一个实施例中，模板核酸通过参与同源重组改变靶位置的结构。在一个实施例中，模板核酸改变靶位置的序列。在一个实施例中，模板核酸导致将修饰的或非天然存在的碱基掺入到靶核酸中。

模板序列可以经过断裂介导的或用靶序列催化的重组。在一个实施例中，模板核酸可以包括对应于通过Cas9介导的切割事件而被切割的靶序列上的位点的序列。在一个实施例中，模板核酸可以包括对应于在第一Cas9介导的事件中被切割的靶序列上的第一位点，以及在第二Cas9介导的事件中被切割的靶序列上的第二位点两者的序列。

在某些实施例中，模板核酸可以包括导致所翻译序列的编码序列发生改变的序列，例如，导致蛋白产物中一种氨基酸取代另一种氨基酸的序列，例如，将突变体等位基因转化为野生型等位基因、将野生型等位基因转化为突变体等位基因、和/或引入终止密码子、插入氨基酸残基，缺失氨基酸残基、或无意义突变。在某些实施例中，模板核酸可以包括导致非编码序列发生改变的序列，例如，在外显子或在5'或3'非翻译区或非转录区中的改变。此类改变包括控制组件(例如，启动子、增强子)的改变，以及顺式作用或反式作用控制组件的改变。

与靶基因的靶位置具有同源性的模板核酸可以用于改变靶序列的结构。模板序列可以用于改变不想要的结构，例如，不想要的或突变型核苷酸。模板核酸可以包括当整合时导致以下效果的序列：降低正控制组件的活性；增加正控制组件的活性；降低负控制组件的活性；增加负控制组件的活性；降低基因表达；增加基因表达；增加对障碍或疾病的抗性；增加对病毒进入的抗性；校正突变或改变赋予、增加，消除或减少基因产物的生物学特性的不想要的氨基酸残基，例如，增加酶的酶活性、或增加基因产物与另一种分子相互作用的能力。

模板核酸可以包括导致具有靶序列的1、2、3、4、5、6、7、8、9、10、11、12或更多个核苷酸的序列发生变化的序列。在一个实施例中，该模板核酸长度可以是20+/-10、30+/-10、40+/-10、50+/-10、60+/-10、70+/-10、80+/-10、90+/-10、100+/-10、110+/-10、120+/-10、130+/-10、140+/-10、150+/-10、160+/-10、170+/-10、180+/-10、190+/-10、200+/-10、210+/-10、或220+/-10个核苷酸。在一个实施例中，该模板核酸长度可以是30+/-20、40+/-20、50+/-20、60+/-20、70+/-20、80+/-20、90+/-20、100+/-20、110+/-20、120+/-20、130+/-20、140+/-20、I 50+/-20、160+/-20、170+/-20、180+/-20、190+/-20、200+/-20、210+/-20、或220+/-20个核苷酸。在一个实施例中，该模板核酸长度是10至1,000、20至900、30至800、40至700、50至600、50至500、50至400、50至300、50至200、或50至100个核苷酸。

模板核酸包括以下组分：[5'同源臂]-[置换序列]-[3'同源臂]。这些同源臂提供进入染色体中的重组，因此用置换序列替换所不希望的组件(例如，突变或标签)。在一个实施例中，这些同源臂在最远端切割位点的侧翼。在一个实施例中，5'同源臂的3'端是紧邻置换序列的5'端的位置。在一个实施例中，5'同源臂可以从置换序列的5'端的5’至少延伸10、20、30、40、50、100、200、300、400、500、600、700、800、900、1000、1500、或2000个核苷酸。在一个实施例中，3'同源臂的5'端是紧邻置换序列的3'端的位置。在一个实施例中，3'同源臂可以从置换序列的3'端的3’至少延伸10、20、30、40、50、100、200、300、400、500、600、700、800、900、1000、1500、或2000个核苷酸。

在某些实施例中，可以将一条或两条同源臂缩短以避免包括某些序列重复组件。例如，可以将5'同源臂缩短以避免序列重复组件。在其他实施例中，可以将3'同源臂缩短以避免序列重复组件。在一些实施例中，可以将5'和3'同源臂二者缩短以避免包括某些序列重复组件。

在某些实施例中，用于校正突变的模板核酸可以被设计用作单链寡核苷酸。当使用单链寡核苷酸时，5'和3'同源臂的长度范围可以高达约200个碱基对(bp)，例如，长度至少是25、50、75、100、125、150、175、或200bp。

DNA修复和NHEJ

在某些实施例中，核酸酶诱导的非同源末端联接(NHEJ)可以用于靶基因特异性敲除。核酸酶诱导的NHEJ还可以用于去除(例如，缺失)感兴趣的基因的序列。通常，NHEJ通过将两个末端连接在一起来修复DNA的双链断裂；然而，通常，只有两个兼容末端(完全如它们通过双链断裂所形成的)是完全连接的，原始序列才被恢复。双链断裂的DNA末端的经常是酶处理的对象，由此导致在重新连接这些末端之前，在一条链或两条链上添加或去除核苷酸。这导致在NHEJ修复位点处的DNA序列中存在插入和/或缺失(indel)突变。典型地，这些突变中的三分之二改变阅读框并且，因此，产生非功能蛋白。另外，维持阅读框但插入或缺失大量序列的突变可破坏蛋白的功能性。这是部位依赖性的，因为关键功能结构域中的突变比蛋白的非关键区中的突变可能更不耐受。通过NHEJ产生的indel突变本质上是不可预测的；然而，在给定的断裂位点，某些indel序列是有利的并且在群体中是过度表达的，这可能归因于微同源性的小区域。缺失的长度可以广泛地变化；最常见在1-50bp范围内，但它们可以轻易地大于50bp，例如，它们可以轻易地达到大于约100-200bp。插入倾向于较短，并且经常包括直接围绕断裂位点的序列的短的复制。然而，有可能获得大的插入，并且在这些情况下，插入序列经常被跟踪至基因组的其他区域或至存在于细胞中的质粒DNA。

因为NHEJ是诱变过程，它还可以用于缺失小的序列基序，只要不需要产生特异最终序列。如果双链断裂被靶向至短靶序列附近，由NHEJ修复引起的缺失突变经常跨越，并且因此除去不想要的核苷酸。对于较大DNA区段的缺失，将两个双链断裂各自引入序列两侧可以导致末端之间的NHEJ，去除整个插入序列。这两种方法都可以用于缺失特异性DNA序列；然而，NHEJ的易错性质仍然可以在修复位点处产生indel突变。

切割两条双链的II型分子，特别是Cas9或其直向同源物或同系物，优选Cas9分子和单链、或切口酶，II型分子，特别是Cas9或其直向同源物或同系物，优选Cas9分子可以用于在此描述的方法和组合物中，以产生NHEJ介导的indel。靶向基因(例如，编码区(例如，感兴趣的基因的早期编码区))的NHEJ介导的indel可以用于敲除感兴趣的基因(即，消除其表达)。例如，感兴趣的基因的早期编码区包括紧接着转录起始位点的序列，其在编码序列的第一外显子之内、或在转录起始位点的500bp之内(例如，小于500、450、400、350、300、250、200、150、100或50bp)。

在一个实施例中，其中出于诱导NHEJ介导的indel的目的，指导RNA以及II型分子，特别是Cas9或其直向同源物或同系物，优选Cas9核酸酶产生双链断裂，指导RNA可以被配置为将双链断裂定位在极接近于靶位置的核苷酸之处。在一个实施例中，切割位点可以远离靶位置0-500bp(例如，远离靶位置小于500、400、300、200、100、50、40、30、25、20、15、10、9、8、7、6、5、4、3、2或1bp)。

在一个实施例中，其中出于诱导NHEJ介导的indel的目的，与II型分子，特别是Cas9或其直向同源物或同系物，优选Cas9核酸酶复合的两个指导RNA诱导两个单链断裂，两个指导RNA可以被配置为将两个单链断裂定位以便为NHEJ修复提供靶位置的核苷酸。

功能性效应子的递送

不像CRISPR-Cas介导的基因敲除，其通过在DNA水平上使基因突变而永久消除表，CRISPR-Cas敲减允许通过使用人工转录因子暂时降低基因表达。使Cas9蛋白的两个DNA切割结构域中的关键残基突变导致产生无催化活性Cas9。无催化活性Cas9与指导RNA复合并且定位至由指导RNA的靶向结构域指定的DNA序列，然而，它不切割靶DNA。无活性Cas9蛋白与效应子结构域(例如，转录阻遏结构域)的融合能使得将效应子募集至由指导RNA指定的任何DNA位点。在某些实施例中，Cas9可以融合至转录阻遏结构域并募集至基因的启动区。尤其针对基因阻遏，在此考虑到的是阻断内源转录因子的结合部位将有助于下调基因表达。在另一个实施例中，无活性Cas9可以融合到染色质修饰蛋白上。改变染色质状态可以导致靶基因的表达降低。

在一个实施例中，指导RNA分子可以被靶向至已知的转录应答组件(例如，启动子、增强子等)、已知的上游激活序列、和/或疑似能够控制靶DNA表达、具有未知或已知功能的序列。

在一些方法中，可以使靶多核苷酸失活以实施细胞中的表达的修饰。例如，当CRISPR复合物结合到细胞中的一个靶序列上时，该靶多核苷酸失活，这样使得该序列不被转录，该编码蛋白不被产生，或者该序列不会像野生型序列一样起作用。例如，可以使蛋白质或微小RNA编码序列失活，这样使得该蛋白质不被产生。

在某些实施例中，该CRISPR酶包含一个或多个选自下组的突变，该组由以下各项组成：D917A、E1006A和D1225A和/或该一个或多个突变在该CRISPR酶的RuvC结构域中或者为如本文另外论述的突变。在一些实施例中，该CRISPR酶具有一个或多个在催化结构域中的突变，其中在转录时，该同向重复序列形成单个茎环，并且该指导序列指导CRISPR复合物与该靶序列的序列特异性结合，并且其中该酶进一步包含功能结构域。在一些实施例中，该功能结构域是转录激活结构域，优选VP64。在一些实施例中，该功能结构域是转录阻遏结构域，优选KRAB。在一些实施例中，该转录阻遏结构域是SID、或SID的多联体(例如SID4X)。在一些实施例中，该功能结构域是表观遗传修饰结构域，从而提供了表观遗传修饰酶。在一些实施例中，该功能结构域是激活结构域，其可以是P65激活结构域。

功能性效应子(结构域)

可以用本发明的Cas9进行基因编辑。可以使Cas9失活并融合到一个或多个功能性结构域(效应子)上。

在一些实施例中，该功能结构域可以选自下组，该组由以下各项组成：转座酶结构域、整合酶结构域、重组酶结构域、解离酶结构域、转化酶结构域、蛋白酶结构域、DNA甲基转移酶结构域、DNA羟甲基化酶结构域、DNA脱甲基酶结构域、组蛋白乙酰酶结构域、组蛋白脱乙酰酶结构域、核酸酶结构域、阻遏因子结构域、激活因子结构域、核定位信号结构域、转录调节蛋白(或转录复合体募集)结构域、细胞摄取活性相关结构域、核酸结合结构域、抗体呈递结构域、组蛋白修饰酶、组蛋白修饰酶的募集物；组蛋白修饰酶的抑制剂、组蛋白甲基转移酶、组蛋白脱甲基化酶、组蛋白激酶、组蛋白磷酸酶、组蛋白核糖基酶、组蛋白脱核糖基酶、组蛋白泛素化酶、组蛋白去泛素化酶、组蛋白生物素化酶和组蛋白尾蛋白酶。

非分裂细胞中(神经元和肌肉)中的基因靶向

非分裂(尤其是非分裂、完全分化)细胞类型，包括肌细胞以及尤其是神经元，提出了关于基因靶向或基因组工程的问题，例如因为同源重组(HR)总体上在G1细胞周期阶段受抑制。然而，尽管研究了细胞控制正常DNA修复系统的机制，奥斯文(Orthwein)等人已经报道了使非分裂细胞中的HR保持“关闭”的先前未知的开关，并且他们设计了策略以拨动这个开关重新开启。奥斯文(Orthwein)等人(加拿大渥太华西奈山医院(Mount SinaiHospital)的丹尼尔迪罗谢(Daniel Durocher)实验室报告于自然(Nature)16142中，在线公开于2015年12月9日)已经显示，可以解除对HR的抑制并且基因靶向在肾(293T)以及骨肉瘤(U2OS)细胞二者中成功完成。已知肿瘤抑制基因、BRCA1、PALB2以及BRAC2能通过HR促进DNA DSB修复。他们发现BRCA1与PALB2-BRAC2复合物的形成受PALB2上的泛素位点支配，这样使得通过E3泛素连接酶对该位点起作用。这种E3泛素连接酶由与滞蛋白-3(CUL3)-RBX1复合的KEAP1(PALB2相互作用蛋白)构成。PALB2泛素化抑制它与BRCA1的相互作用并且被去泛素化酶USP11抵消，其本身处于细胞周期控制之下。与DNA端切除的活化组合的BRCA1-PALB2相互作用的恢复足以诱导G1中的同源重组，如通过多种方法所测量的，包括针对USP11或KEAP1、基于CRISPR-Cas9的基因靶向测定(表达自pX459载体)。然而，当使用KEAP1消耗或表达PALB2-KR突变型使BRCA1-PALB2相互作用在切除感受态G1细胞中恢复时，检测出基因打靶事件的稳健增加。

因此，在一些实施例中，细胞(尤其是非分裂、完全分化的细胞类型，包括肌细胞以及尤其是神经元)中的HR复活是优选的。在一些实施例中，在一些实施例中，促进BRCA1-PALB2相互作用是优选的。在一些实施例中，靶细胞是非分裂细胞。在一些实施例中，靶细胞是神经元或肌细胞。在一些实施例中，在体内靶向靶细胞。在一些实施例中，细胞处于G1并且HR受抑制。

在一些实施例中，使用KEAP1耗尽，例如抑制KEAP1活性的表达，是优选的。KEAP1消耗可以通过siRNA实现，例如，如奥斯文(Orthwein)等人中所示。可替代地，PALB2-KR突变体(在BRCA1相互作用结构域中缺乏所有八个Lys残基)的表达是优选的，与KEAP1消耗相结合或单独地。

不管细胞周期位置，PALB2-KR与BRCA1相互作用。因此，在一些实施例中，促进或恢复BRCA1-PALB2相互作用(尤其是在G1细胞中)是优选的，尤其是其中靶细胞是非分裂的，或其中去除和返回(离体基因靶向)是有问题的，例如神经元或肌细胞。KEAP1siRNA是优选的并且可购自赛默飞世尔(ThermoFischer)。

在一些实施例中，BRCA1-PALB2复合物可以作为蛋白络合物、融合蛋白、编码BRCA1和PALB2的多核苷酸或编码BRCA1-PALB2融合蛋白的多核苷酸被递送到G1细胞中。此类多核苷酸可以在适合的启动子的控制之下，例如，并且如在此描述的，同时并任选地在与CRISPR蛋白相同的载体或载体系统中、或单独地进行递送。促进在非分裂、完全分化的)细胞类型，包括肌细胞以及尤其是神经元中的HR的其他可能性可以包括PALB2的直接递送(使用融合至对PALB2亲和的分子的Cas9)；和/或BRCA2的直接递送(使用融合至对BRCA2亲和的分子的Cas9)。

在一些实施例中，可以例如通过增加去泛素化酶USP11的表达或活性来促进PALB2脱泛素化。如此，在一些实施例中，设想的是可以提供构建体以促进或上调去泛素化酶USP11的表达或活性。

CRL4的敲低还可以用于使得KEAP1失活或降低它的活性。例如，可以使用CRL4siRNA。可替代地，MLN4924(泛CRL酶抑制剂)还可以用于使KEAP1失活。

特别优选的是还提供了53BP的敲除，因为表明这需要活化HDR(在奥斯文(Orthwein)等人中所示)。53BP的敲除还可以通过siRNA实现。

活化DNA的切除(在DNA双链断裂的任一侧产生3’突出端)对活化G1中的HR也是必要的。通过以下方式做到这一点：对基因CtIP(或SAE2)的ORF与模拟活化磷酸化作用的突变(T847E)进行递送。诸位申请人现在假定可以通过使用Cas9双切口酶以引入3’突出端(徐(Hsu)等人)来避免这个要求。因此，在靶向非分裂、完全分化的)细胞类型，包括肌细胞以及尤其是神经元中这样使用Cas9双切口酶以引入3’突出端是优选的。

在一个实施例中，本发明提供了一种切割靶多核苷酸的方法。该方法包括使用CRISPR复合物，该CRISPR复合物结合到该靶多核苷酸上并且实施所述靶多核苷酸的切割。典型地，当被引入进细胞中时，本发明的CRISPR复合物在基因组序列中产生断裂(例如，单链或双链断裂)。例如，可以使用该方法切割细胞中的疾病基因。

由该CRISPR复合物产生的断裂可以通过修复过程进行修复，如易出错的非同源末端连接(NHEJ)途径或高保真同源定向修复(HDR)。在这些修复过程期间，可以将外源多核苷酸模板引入进基因组序列中。在一些方法中，该HDR过程被用于修饰基因组序列。例如，将外源多核苷酸模板引入进细胞中，该外源多核苷酸模板包括有待整合的、侧翼为上游序列和下游序列的序列。上游和下游序列与染色体中的整合位点的任一侧都具有序列相似性。

在希望的情况下，供体多核苷酸可以是DNA，例如DNA质粒、细菌人工染色体(BAC)、酵母人工染色体(YAC)、病毒载体、一段线性DNA、PCR片段、裸核酸或与递送赋形剂(如脂质体或泊洛沙姆)复合的核酸。

该外源多核苷酸模板包括有待整合的序列(例如，突变的基因)。供整合的序列可以是对细胞而言内源或外源的序列。有待整合的序列的实例包括编码蛋白质的多核苷酸或非编码RNA(例如，微小RNA)。因此，供整合的序列可以有效作地连接到一个或多个适当的控制序列上。可替代地，有待整合的序列可以提供一种调节功能。

选择外源多核苷酸模板中的上游和下游序列，以促进感兴趣的染色体序列与供体多核苷酸之间的重组。该上游序列是一个与供整合的靶向位点的上游的基因组序列具有序列相似性的核酸序列。类似地，该下游序列是一个与供整合的靶向位点的染色体序列下游具有序列相似性的核酸序列。外源多核苷酸模板中的上游和下游序列与靶向的基因组序列可以具有75％、80％、85％、90％、95％或100％序列一致性。优选地，外源多核苷酸模板中的上游和下游序列与靶向的基因组序列具有约95％、96％、97％、98％、99％或100％序列一致性。在一些方法中，外源多核苷酸模板中的上游和下游序列与靶向的基因组序列具有约99％或100％序列一致性。

上游或下游序列可以包括从约20bp至约2500bp，例如约50、100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400或2500bp。在一些方法中，示例性上游或下游序列具有约200bp至约2000bp、约600bp至约1000bp或更具体地约700bp至约1000bp。

在一些方法中，该外源多核苷酸模板可以进一步包括标记。这样的一种标记使得容易地筛选靶向的整合。适合的标记的实例包括限制性位点、荧光蛋白或选择性标记。可以使用重组技术构建本发明的外源多核苷酸模板(参见例如，萨姆布鲁克(Sambrook)等人，2001和奥苏贝尔(Ausubel)等人，1996)。

在一种用于通过整合外源多核苷酸模板而修饰靶多核苷酸的示例性方法中，通过CRISPR复合物将双链断裂引入进基因组序列中，经由同源重组一个外源多核苷酸模板而修复该断裂，这样使得将该模板整合进基因组中。双链断裂的存在促进模板的整合。

在其他实施例中，本发明提供了一种修饰多核苷酸在真核细胞中的表达的方法。该方法包括通过使用结合到多核苷酸上的CRISPR复合物增加或降低靶多核苷酸的表达。

在一些方法中，可以使控制序列失活，这样使得它不再作为控制序列起作用。如在此使用，“控制序列”是指影响核酸序列的转录、翻译或可及性的任何核酸序列。控制序列的实例包括启动子、转录终止子和增强子，它们是控制序列。失活的靶序列可以包括缺失突变(即，缺失一个或多个核苷酸)、插入突变(即，插入一个或多个核苷酸)或无义突变(即，用另一个核苷酸取代一个单核苷酸，这样使得引入终止密码子)。在一些方法中，靶序列的失活导致该靶序列的“敲除”。

使用CRISPR Cas系统的示例性方法

本发明提供了非天然存在的或工程化的组合物、或编码所述组合物的组分的一种或多种多核苷酸、或包含对所述组合物的组分进行编码的一种或多种多核苷酸的载体或递送系统，其用于体内、离体或体外修饰靶细胞，并且是以改变细胞使得一旦被修饰则CRISPR修饰的细胞的子代或细胞系保留改变的表型的方式进行。这些修饰的细胞和子代可以是多细胞生物例如植物或动物的部分，其中在离体或体内向希望的细胞型应用CRISPR系统。CRISPR发明可以是治疗的疗法。该治疗的疗法可以包括基因或基因组编辑、或基因疗法。

用CRISPR-Cas系统或复合物修饰靶标

在一个方面，本发明提供了修饰真核细胞中的靶多核苷酸的方法，这些方法可以在体内、离体或在体外。在一些实施例中，该方法包括对来自人或非人动物的细胞或细胞群进行取样，并且修饰该细胞或这些细胞。培养可以发生在离体的任何阶段。该细胞或这些细胞甚至可以被重新引入该非人动物或植物中。对于重新引入的细胞，特别优选的是这些细胞是干细胞。

在一些实施例中，该方法包括允许CRISPR复合物结合到该靶多核苷酸上以实施所述靶多核苷酸的切割，由此修饰该靶多核苷酸，其中该CRISPR复合物包括与杂交或可杂交到在所述靶多核苷酸内的靶序列上的指导序列复合的CRISPR酶，其中所述指导序列连接到tracr配对序列上，该tracr配对序列进而杂交到tracr序列上。

在一个方面，本发明提供了修饰多核苷酸在真核细胞中的表达的方法。在一些实施例中，该方法包括允许CRISPR复合物结合到该多核苷酸上，这样使得所述结合导致所述多核苷酸的表达增加或降低；其中该CRISPR复合物包括与杂交或可杂交到在所述多核苷酸内的靶序列上的指导序列复合的CRISPR酶，其中所述指导序列连接到tracr配对序列上，该tracr配对序列进而杂交到tracr序列上。类似的考虑因素和条件适用如上文针对修饰靶多核苷酸的方法。事实上，这些取样、培养和重新引入选择跨本发明的多个方面而适用。

确实，在本发明的任何方面，该CRISPR复合物可以包括与杂交或可杂交到靶序列上的指导序列复合的CRISPR酶，其中所述指导序列可以连接到tracr配对序列上，该tracr配对序列进而可以杂交到tracr序列上。类似的考虑因素和条件适用如上文针对修饰靶多核苷酸的方法。

因此，在此描述的、非天然存在的CRISPR酶中的任何一种包括至少一个修饰，并且由此该酶具有某些改进的能力。具体地，这些酶中的任一种能够与指导RNA形成CRISPR复合物。当这种复合物形成时，该指导RNA能够结合至靶多核苷酸序列上，并且该酶能够改变靶座位。此外，与未修饰的酶相比，在该CRISPR复合物中的酶具有降低的修饰一个或多个脱靶座位的能力。

此外，与未修饰的酶相比，本文描述的修饰的CRISPR酶包含这样的酶，由此其在CRISPR复合物中该酶具有增加的修饰一个或多个靶座位的能力。这种功能可以单独或与降低的修饰一个或多个脱靶位点的能力的上述功能组合提供。任何此类酶可以被提供为具有对如本文描述的CRISPR酶的任一种另外修饰，例如与由一种或多种相关异源功能结构域提供的任何活性、用以降低核酸酶活性的任何另外突变等相组合。

在本发明的有利的实施例中，经修饰的CRISPR酶被提供为与未修饰的酶相比具有降低的修饰一个或多个脱靶位点的能力，并且与未修饰的酶相比具有增加的修饰一个或多个靶座位的能力。与对酶的另外修饰相组合，可以实现显着增强特异性。例如，提供了此类有利实施例与一种或多种另外的突变的组合，其中该一种或多种另外的突变是在一个或多个催化活性结构域中。此类另外的催化突变可以赋予切口酶如本文其他处详细描述的切口酶功能性。在此类酶中，可以由于在酶活性方面改进的特异性实现增强的特异性。

如以上所述用以降低脱靶效应和/或增强靶标效应的修饰可以被制成位于带正电荷的区域/凹槽中的氨基酸残基，该带正电荷的区域/凹槽位于RuvC-III和HNH之间。应当理解的是，可以通过修饰上述凹槽内的氨基酸，但还要通过修饰邻近于该凹槽或其外部的氨基酸来实现上述任何功能性作用。

可以被工程化到如在此描述的经修饰的CRISPR酶中的另外的功能性包括以下这些。1.经修饰的CRISPR酶，其破坏DNA：蛋白质相互作用而不影响蛋白质三级或二级结构。这包括接触RNA：DNA双链体任何部分的残基。2.经修饰的CRISPR酶，其弱化蛋白内相互作用，该蛋白内相互作用使Cas9保持响应于DNA结合(靶标或脱靶)的核酸酶切割所必需的构象。例如：轻度抑制、但仍然允许HNH结构域(定位在易切断的磷酸酯处)的核酸酶构象的修饰。3.经修饰的CRISPR酶，其强化蛋白内相互作用，该蛋白内相互作用使Cas9保持对响应于DNA结合(靶标或脱靶)的核酸酶活性进行抑制的构象。例如：将HNH结构域稳定在远离易切断的磷酸酯的构象中的修饰。任何此类另外的功能增强可以与对如本文中其他地方所详细描述的CRISPR酶进行的任何其他修饰组合提供。

任何在此描述的改进的功能性可以被制成任何CRISPR酶(如Cas9酶)。在此描述的Cas9酶衍生自来自化脓链球菌和金黄色葡萄球菌的Cas9酶。然而，应当理解的是，可以将在此描述的任何功能性工程化到来自其他直向同源物的Cas9酶中，包括包含来自多个直向同源物的片段的嵌合酶。此类直向同源物的实例可以见于例如图8和图9中，如在此描述的。

本发明使用核酸来结合靶TDNA序列。这是有利的，因为产生核酸比产生蛋白质容易且价廉得多，并且特异性可以根据其中寻求同源性的拉伸长度而变化。例如多指的复杂3-D复杂定位是不需要的。术语“多核苷酸”、“核苷酸”、“核苷酸序列”、“核酸”和“寡核苷酸”可互换地使用。它们是指具有任何长度的核苷酸的聚合形式，是脱氧核糖核苷酸或核糖核苷酸、或其类似物。多核苷酸可具有任何三维结构，并且可以执行已知或未知的任何功能。以下是多核苷酸的非限制性实例：基因或基因片段的编码区或非编码区、根据连接分析定义的多个座位(一个座位)、外显子、内含子、信使RNA(mRNA)、转运RNA、核糖体RNA、短干扰RNA(siRNA)、短发夹RNA(shRNA)、micro-RNA(miRNA)、核酶、cDNA、重组多核苷酸、分支多核苷酸、质粒、载体、任何序列的分离的DNA、任何序列的分离的RNA、核酸探针、和引物。该术语还涵盖具有合成骨架的核酸样结构，参见，例如，埃克斯坦(Eckstein)，1991；巴塞加(Baserga)等人，1992；米利根(Milligan)，1993；WO 97/03211；WO 96/39154；马塔(Mata)，1997；施特劳斯-绍库普(Strauss-Soukup)，1997；和扎姆斯塔(Samstag)，1996。多核苷酸可以包含一个或多个经修饰的核苷酸，如甲基化的核苷酸和核苷酸类似物。如果存在，可以在聚合物组装之前或之后进行核苷酸结构的修饰。核苷酸的序列可以被非核苷酸组分中断。多核苷酸可以在聚合后，如通过与标记的组分缀合来进一步修饰。如本文所用的术语“野生型”是本领域技术人员所理解的术语，并且表示生物、菌株、基因的典型形式或者当它在自然界存在时区别于突变体或变体形式的特征。“野生型”可以是基线。如本文所用的术语“变体”应当被理解为表示具有衍生自在自然界中存在的模式的性质的展示。术语“非天然存在的”或“工程化的”可互换地使用并且表面人工的参与。这些术语，当指核酸分子或多肽时，表示该核酸分子或多肽至少基本上从它们在自然界中或如发现于自然界中的与其结合的至少另一种组分游离出来。“互补性”是指核酸与另一个核酸序列借助于传统的沃森-克里克碱基配对或其他非传统类型形成一个或多个氢键的能力。互补百分比表示一个核酸分子中可与一个第二核酸序列形成氢键(例如，沃森-克里克碱基配对)的残基的百分比(例如，10个之中有5、6、7、8、9、10个即为50％、60％、70％、80％、90％、和100％互补)。“完全互补”表示一个核酸序列的所有连续残基与一个第二核酸序列中的相同数目的连续残基形成氢键。如本文使用的“基本上互补”是指在一个具有8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50个或更多个核苷酸的区域上至少为60％、65％、70％、75％、80％、85％、90％、95％、97％、98％、99％、或100％的互补程度，或者是指在严格条件下杂交的两个核酸。如本文使用的对于杂交的“严格条件”是指与靶序列具有互补性的一个核酸主要地与该靶序列杂交并且基本上不杂交到非靶序列上的条件。严格条件通常是序列依赖性的，并且取决于许多因素而变化。一般而言，该序列越长，则该序列特异性地杂交到其靶序列上的温度就越高。严格条件的非限制性实例在蒂森(Tijssen)(1993)的《生物化学和分子生物学中的实验室技术-核酸探针杂交》(Laboratory Techniques InBiochemistry And Molecular Biology-Hybridization With Nucleic Acid Probes)，第I部分，第二章，“杂交原理概述和核酸探针分析策略”(“Overview of principles ofhybridization and the strategy of nucleic acid probe assay”)，爱思唯尔(Elsevier)，纽约，中有详述。在提及一个多核苷酸序列时，那么也设想了互补的或部分互补的序列。能够在高严格条件下杂交到参考序列上的这些序列是优选的。通常，为了使杂交率最大化，选择了相对低严格性的杂交条件：低于热熔点(T_m)约20℃到25℃。T_m是50％的特异性靶序列在具有规定的离子强度和pH的溶液中杂交到完全互补的探针上的温度。通常，为了要求杂交序列的至少约85％的核苷酸互补性，高严格洗涤条件被选择为低于T_m约5℃到15℃。为了要求杂交序列的至少约70％的核苷酸互补性，中等严格洗涤条件被选择为低于T_m约15℃到30℃。高容许(极低严格性)洗涤条件可以低至在T_m之下50℃，从而允许在杂交序列之间的高水平错配。本领域技术人员将认识到，在杂交和洗涤阶段中的其他物理和化学参数也可以改变，从而影响来自在靶序列与探针序列之间的特定同源性水平的可检测杂交信号的结果。优选的高严格条件包括在50％甲酰胺、5×SSC、和1％SDS中在42℃孵育，或者在5×SSC和1％SDS中在65℃孵育，在0.2×SSC和0.1％SDS中在65℃洗涤。“杂交”是指其中一个或多个多核苷酸反应形成一种复合物的反应，该复合物经由这些核苷酸残基之间的碱基的氢键键合而稳定化。氢键键合可以借助于沃森-克里克碱基配对、Hoogstein结合或以任何其他序列特异性方式而发生。该复合物可包含形成一个双链体的两条链、形成多链复合物的三条或多条链、单个自我杂交链、或这些的任何组合。杂交反应可以构成更广泛的过程(如PCR的开始、或经由一种酶的多核苷酸的切割)中的步骤。能够与给定序列杂交的序列被称为该给定序列的“互补物”。如本文使用的，术语“基因组座位(locus)”或“座位(locus)”(复数是座位(loci))是在染色体上的基因或DNA序列的特定位置。“基因”是指编码多肽或RNA链的DNA或RNA的段(stretch)，其在生物中发挥功能作用并且因此是活生物体遗传的分子单元。出于本发明的目的，可以考虑包括调节基因产物的产生的区域的基因，而不论这样的调节序列是否接近编码和/或转录的序列。因此，基因包括而不必限于，启动子序列、终止子、翻译调节序列(如核糖体结合位点和内部核糖体进入位点)、增强子、沉默子、隔离子、边界组件、复制起点、核基质附着位点和座位控制区。如本文使用的“基因组座位的表达”或“基因表达”是藉此在功能性基因产物的合成中使用来自基因的信息的过程。基因表达的产物常常是蛋白质，但是在非蛋白质编码基因如rRNA基因或tRNA基因中，产物是功能性RNA。基因表达的过程由所有已知的生物利用-产生功能性产物以便存活的真核生物(包括多细胞生物)、原核生物(细菌和古细菌)以及病毒。如本文使用的基因或核酸的“表达”不仅涵盖细胞基因表达，而且涵盖在克隆系统中或在任何其他背景下的一个或多个核酸的转录和翻译。如本文使用的“表达”是指藉此从DNA模板转录成多核苷酸(如转录成mRNA或其他RNA转录物)的过程和/或转录的mRNA随后藉此翻译成肽、多肽或蛋白质的过程。转录物和编码的多肽可以总称为“基因产物”。如果多核苷酸来源于基因组DNA，表达可以包括真核细胞中mRNA的剪接。术语“多肽”、“肽”和“蛋白质”在本文可互换地使用，是指具有任何长度的氨基酸的聚合物。该聚合物可以是可以是直链或支链的，它可以包含修饰的氨基酸，并且它可以被非氨基酸中断。这些术语还涵盖已经被修饰的氨基酸聚合物；这些修饰例如二硫键形成、糖基化、脂化(lipidation)、乙酰化、磷酸化、或任何其他操纵，如与标记组分的缀合。如本文使用的术语“氨基酸”包括天然的和/或非天然的或者合成的氨基酸，包括甘氨酸以及D和L旋光异构体、以及氨基酸类似物和肽模拟物。如本文使用的，术语“结构域”或“蛋白质结构域”是指可以独立于该蛋白质链的其余部分而存在并且起作用的蛋白质序列的一部分。正如在本发明的多个方面中所描述，序列一致性与序列同源性有关。可以通过肉眼、更通常地借助于可得的序列比较程序来进行同源性比较。这些可商购的计算机程序可以计算在两个或更多个序列之间的同源性的百分比(％)并且还可以计算由两个或更多个氨基酸或核酸序列共享的序列一致性。在一些优选的实施例中，本文描述的dTALE的封端区具有与本文提供的封端区氨基酸序列至少95％一致性或共享一致性的序列。可以通过本领域已知的许多计算机程序(例如BLAST或FASTA等等)来生成序列同源性。用于进行这样的比对的适合的计算机程序是GCG威斯康星Bestfit软件包(威斯康星大学，美国；德弗罗(Devereux)等人，1984，《核酸研究》(Nucleic Acids Research)12：387)。可以进行序列比较的其他软件的实例包括但不限于，BLAST软件包(参见奥苏贝尔(Ausubel)等人，1999，出处同上-第18章)、FASTA(阿尔丘尔(Atschul)等人，1990，《分子生物学杂志》(J.Mol.Biol.)，403-410)以及GENEWORKS系列比较工具。BLAST和FASTA均可用于离线和在线搜索(参见奥苏贝尔(Ausubel)等人，1999，出处同上，7-58页到7-60页)。然而，优选使用GCG Bestfit程序。可以计算在连续序列上的序列同源性百分比(％)，即，将一个序列与另一个序列比对，并且将一个序列中的每个氨基酸或核苷酸与另一个序列中的相应氨基酸或核苷酸直接进行比较，一次比较一个残基。这被称为“无空位”比对。典型地，这样的无空位比对仅仅在较少数目的残基上进行。虽然这是一种非常简单和一致的方法，但是它未能考虑的是，例如，在其他方面完全相同的序列对中，一个插入或缺失可以引起随后的氨基酸残基被排除在比对之外，因此当进行全局比对时可能导致在同源性％上的大幅降低。因此，大多数序列比较方法被设计为产生考虑到可能的插入和缺失的优化比对，而没有过度地使总体同源性或一致性评分不利。这是通过在序列比对中插入“空位”来实现的，以便试图将局部同源性或一致性最大化。然而，这些更复杂的方法向出现在该比对中的每个空位分配“空位罚分”，从而对于相同数目的一致的氨基酸而言，具有尽可能少的空位的序列比对-反映了在这两个比较的序列之间的更高关联性-可以比具有许多空位者实现更高的得分。“亲合空位成本”(“Affinity gap costs”)典型地用于对空位的存在要求相对高的成本并对空位中的每个后续残基施加较小的罚分。这是最常用的空位评分系统。高空位罚分当然将产生具有更少空位的最佳比对。大多数比对程序允许修改空位罚分。然而，当使用这种序列比较软件时优选使用默认值。例如当使用GCG威斯康星Bestfit软件包时，氨基酸序列的默认空位罚分为对于每个空位的-12，以及对于每个延伸的-4。因此计算最大同源性％首先要求产生最佳比对，考虑空位罚分。用于进行这样的比对的适合的计算机程序是GCG威斯康星Bestfit软件包(德弗罗(Devereux)等人，1984，《核酸研究》(Nuc.Acids Research)12p387)。可以进行序列比较的其他软件的实例包括但不限于，BLAST软件包(参见奥苏贝尔(Ausubel)等人，1999《精编分子生物学实验指南》(Short Protocols in MolecularBiology)，第4次编辑-第18章)、FASTA(阿尔丘尔(Altschul)等人，1990《分子生物学杂志》(J.Mol.Biol.403-410)以及GENEWORKS系列比较工具。BLAST和FASTA均可用于离线和在线搜索(参见奥苏贝尔(Ausubel)等人，1999，《精编分子生物学实验指南》(Short Protocolsin Molecular Biology)，7-58页到7-60页)。然而，对于一些应用，优选使用GCG Bestfit程序。一种新的工具，称为BLAST 2序列，也可用于比较蛋白质和核苷酸序列(参见《欧洲微生物学会联合会微生物学快报》(FEMS Microbiol Lett.)1999 174(2):247-50；FEMSMicrobiol Lett.1999 177(1):187-8以及在国立卫生研究院的网址的国家生物技术信息中心的网址)。虽然最终同源性％可以按照一致性进行测量，但是比对过程自身典型地不是基于全或无配对比较(all-or-nothing pair comparison)。相反，通常使用尺度相似性评分矩阵(scaled similarity score matrix)，基于化学相似性或进化距离对各个成对比较评分。通常使用的这种矩阵的实例为BLOSUM62矩阵-BLAST系列程序的默认矩阵。GCG威斯康星程序通常使用公开的默认值或自定义符号比较表(更多细节详见用户手册)。对于一些应用，优选使用GCG软件包的公共默认值，或在其他软件情况下的默认矩阵，如BLOSUM62。可替代地，可以基于类似于CLUSTAL(希金斯DG(Higgins DG)和夏普PM(Sharp PM)(1988)，《基因》(Gene)73(1)，237-244)的一种算法，使用在DNASISTM(日立软件公司(HitachiSoftware))中的多重比对特征来计算同源性百分比。一旦软件已经产生最佳比对，就有可能计算同源性％，优选序列一致性％。软件典型地这样进行，作为序列比较的一部分，并且产生数字结果。这些序列也可以具有氨基酸残基的缺失、插入或取代，其产生沉默变化并生成功能上等同的物质。可以基于氨基酸特性(如残基的极性、电荷、可溶性、疏水性、亲水性、和/或两亲性)的相似性做出有意氨基酸取代，并且因此它在将氨基酸集合成官能团中是有用的。可以仅仅基于氨基酸的侧链特性将它们集合在一起。然而，包括突变数据同样是更有用的。出于结构原因，如此衍生的氨基酸的集合很有可能是保守性的。这些集合可以被描述为文氏图形式(Venn diagram)(利文斯敦C.D.(Livingstone C.D.)和巴顿G.J.(BartonG.J.)(1993)“蛋白质序列比对：用于残基保守些的分级分析的策略”(“Protein sequencealignments:a strategy for the hierarchical analysis of residue conservation”)《生物科学计算应用》(Comput.Appl.Biosci.)9:745-756)(泰勒(Taylor)W.R.(1986)“氨基酸保守性的分类”(“The classification of amino acid conservation”)《理论生物学杂志》(J.Theor.Biol.)119；205-218)。例如可以根据下表做出保守性取代，该表描述了普遍接受的氨基酸的文氏图分组。

本发明的实施例包括可包含同源取代(本文使用取代和置换两者来表示现有氨基酸残基或核苷酸与替代残基和核苷酸之间的互换)的序列(多核苷酸或多肽两者)，该同源取代，即，在氨基酸的情况下发生同类取代(like-for-like substitution)，如碱性对碱性、酸性对酸性、极性对极性。也可以发生非同源取代，即，从一类残基到另一类残基，或者可替代地涉及包含非天然氨基酸如鸟氨酸(在下文称为Z)、二氨基丁酸鸟氨酸(在下文称为B)、正亮氨酸鸟氨酸(在下文称为O)、吡啶基丙氨酸、噻吩基丙氨酸、萘基丙氨酸和苯基甘氨酸。变体氨基酸序列可以包括适合的可插入在该序列的任何两个氨基酸残基之间的间隔基团，包括除了氨基酸间隔物(如甘氨酸或β-丙氨酸残基)之外的烷基基团，如甲基、乙基或丙基基团。。一个另外的变化形式，其涉及处于类肽形式的一个或多个氨基酸残基的存在，也是本领域技术人员熟知的。为避免疑义，“该类肽形式”用来指代变体氨基酸残基，其中该α-碳取代基在该残基的氮原子上，而不是在该α-碳上。用于制备处于该类肽形式的肽的方法是本领域已知的，例如西蒙RJ(Simon RJ)等人，PNAS(1992)89(20)，9367-9371和豪威尔DC(Horwell DC)，《生物技术趋势》(Trends Biotechnol.)(1995)13(4)，132-134。

同源建模：其他Cas9直向同源物中的相应残基可以通过张(Zhang)等人，2012(《自然》(Nature)；490(7421)：556-60)和陈(Chen)等人，2015(《PLoS计算生物学》(PLoS ComputBiol)；11(5)：E1004248)的方法进行鉴定—计算蛋白质-蛋白质相互作用(PPI)方法用以预测由结构域-基序界面介导的相互作用。PrePPI(预测PPI)，一种基于结构的PPI预测方法，使用贝叶斯统计框架(Bayesian statistical framework)将结构证据与非结构证据相结合。该方法涉及取一对查询蛋白并使用结构比对以便鉴别与它们实验确定的结构或同源性模型相对应的结构代表。通过考虑总体和局部几何关系，将结构比对进一步用于鉴别接近和遥远的结构邻居。每当结构代表的两个邻居形成报道于蛋白质数据库(Protein DataBank)中的复合物，这限定了用于建模两个查询蛋白之间相互作用的模板。通过将代表性结构叠加在模板中它们对应的结构邻居上来产生复合物的模型。此途径在戴伊(Dey)等人，2013(《蛋白质科学》(Prot Sci)；22：359-66)中。

出于本发明的目的，扩增意指利用引物和聚合酶的能够以合理的保真度复制靶序列的任何方法。可以通过天然或重组DNA聚合酶，如TaqGold^TM、T7 DNA聚合酶、大肠杆菌DNA聚合酶的Klenow片段以及逆转录酶进行扩增。一种优选的扩增方法是PCR。

在某些方面，本发明涉及载体。如本文使用的，“载体”是一种允许或促进一个实体从一个环境转移到另一个环境中的工具。它是复制子，如质粒、噬菌体、或粘粒，另一个DNA片段可以插入其中，从而引起该插入的片段的复制。通常，当与适当的控制组件缔合时，载体能够复制。一般而言，术语“载体”是指一种核酸分子，其能够运送与其连接的另一种核酸分子。载体包括但不限于，单链、双链、或部分双链的核酸分子；包括一个或多个自由端、无自由端(例如环状的)的核酸分子；包括DNA、RNA、或两者的核酸分子；以及本领域已知的其他多种多样的多核苷酸。一种类型的载体是“质粒”，其是指其中可以例如通过标准分子克隆技术插入另外的DNA片段的环状双链DNA环。另一种类型的载体是病毒载体，其中病毒衍生的DNA或RNA序列存在于用于包装病毒(例如，逆转录病毒、复制缺陷型逆转录病毒、腺病毒、复制缺陷型腺病毒、以及腺相关病毒(AAV))的载体中。病毒载体还包含由用于转染到宿主细胞中的病毒携带的多核苷酸。某些载体(例如，具有细菌复制起点的细菌载体和附加型哺乳动物载体)能够在它们被导入的宿主细胞中自主复制。其他载体(例如，非附加型哺乳动物载体)在引入宿主细胞后整合到该宿主细胞的基因组中，并且由此与该宿主基因组一起复制。而且，某些载体能够指导它们有效连接的基因的表达。这样的载体在此被称为“表达载体”。在重组DNA技术中使用的普通表达栽体通常是质粒形式。

重组表达载体可包含处于适合于在宿主细胞中的核酸表达的形式的本发明的核酸，这意味着这些重组表达载体包含基于待用于表达的宿主细胞而选择的一种或多种调节组件，所述调节组件有效作地连接至待表达的核酸序列。在重组表达载体内，“有效作地连接”旨在表示感兴趣的核苷酸序列以允许该核苷酸序列的表达的方式被连接至该一种或多种调节组件(例如，处于体外转录/翻译系统中或当该载体被引入到宿主细胞中时，处于该宿主细胞中)。关于重组和克隆方法，提及2004年9月2日以US 2004-0171156 A1公开的美国专利申请10/815,730，该专利的内容通过引用以其全文并入本文。

本发明的多个方面涉及用于嵌合的RNA与经修饰的或突变的CRISPR酶(例如，Cas9)的双顺反子载体。用于嵌合的RNA与经修饰的或突变的CRISPR酶的双顺反子表达载体是优选的。一般而言并且特别地，在这个实施例中，经修饰的或突变的CRISPR酶优选由CBh启动子驱动。嵌合RNA可以优选地由Pol III启动子(如U6启动子)驱动。理想地，将这两者结合。嵌合的指导RNA典型地由20bp指导序列(N)组成并且这可以接合到tracr序列上(从下链的第一个“U”到该转录物的结尾)。该tracr序列可以在如指示的不同位置被截短。指导序列和tracr序列被该tracr配对序列隔开，该tracr配对序列可以是GUUUUAGAGCUA。这之后可以是如所示的环序列GAAA。这两者都是优选的实例。申请人已经通过SURVEYOR测定证明了在人EMX1和PVALB座位处的Cas9介导的indel。ChiRNA由其“+n”标志指示，并且crRNA是指指导序列和tracr序列被表达为分开的转录物的杂交体RNA。贯穿本申请，嵌合RNA也可以被称为单指导、或合成指导RNA(sgRNA)。该环优选地是GAAA，但是并并限于这个序列或者实际上在长度上仅仅为4bp。实际上，用于在发夹结构中使用的优选环形成序列在长度上为四个核苷酸，并且最优选地具有序列GAAA。然而，可以使用更长或更短的环序列，正如可替代的序列。这些序列优选地包括三联体(例如，AAA)、和另外的核苷酸(例如C或G)。环形成序列的实例包括CAAA和AAAG。在实践在此披露的任何方法中，可以经由本领域已知的一种或多种方法将适合的载体引入进细胞或胚胎中，这些方法包括但不限于，显微注射、电穿孔、声致穿孔、基因枪、磷酸钙介导的转染、阳离子转染、脂质体转染、树枝状聚合物转染、热休克转染、核转染、磁转染、脂转染、刺穿转染(impalefection)、光学转染、专有剂增强的核酸摄取以及经由脂质体、免疫脂质体、病毒颗粒或人工病毒体进行递送。在一些方法中，通过显微注射将该载体引入进胚胎中。可以将这个或这些载体显微注射进胚胎的细胞核或细胞质中。在一些方法中，通过核转染将这个或这些载体引入进细胞中。

术语“调节组件”旨在包括启动子、增强子、内部核糖体进入位点(IRES)、和其他表达控制组件(例如转录终止信号，如多聚腺苷酸化信号和多聚U序列)。这样的调节组件在例如戈德尔(Goeddel)，《基因表达技术：酶学方法》(GENE EXPRESSION TECHNOLOGY:METHODSIN ENZYMOLOGY)185，学术出版社(Academic Press)，圣地亚哥(San Diego)，加利福尼亚州(1990)中。调节组件包括指导一个核苷酸序列在许多类型的宿主细胞中的组成型表达的那些序列以及指导该核苷酸序列只在某些宿主细胞中表达的那些序列(例如，组织特异型调节序列)。组织特异型启动子可主要指导在感兴趣的期望组织中的表达，所述组织例如肌肉、神经元、骨、皮肤、血液、特定的器官(例如肝脏、胰腺)、或特殊的细胞类型(例如淋巴细胞)。调节组件还可以时序依赖性方式(如以细胞周期依赖性或发育阶段依赖性方式)指导表达，该方式可以是或者可以不是组织或细胞类型特异性的。在一些实施例中，一个载体包含一个或多个pol III启动子(例如1、2、3、4、5、或更多个pol III启动子)、一个或多个polII启动子(例如1、2、3、4、5、或更多个pol II启动子)、一个或多个pol I启动子(例如1、2、3、4、5、或更多个pol I启动子)、或其组合。pol III启动子的实例包括但不限于U6和H1启动子。pol II启动子的实例包括但不限于逆转录劳斯肉瘤病毒(RSV)LTR启动子(任选地具有RSV增强子)、巨细胞病毒(CMV)启动子(任选地具有CMV增强子)[参见，例如，波沙特(Boshart)等人，《细胞》(Cell)41:521-530(1985)]、SV40启动子、二氢叶酸还原酶启动子、β-肌动蛋白启动子、磷酸甘油激酶(PGK)启动子、和EF1α启动子。还被术语“调节组件”涵盖的是增强子组件，如WPRE；CMV增强子；在HTLV-I的LTR中的R-U5’片段(《分子细胞生物学》(Mol.Cell.Biol.)，第8(1)卷，第466-472页，1988)；SV40增强子；以及在兔β-珠蛋白的外显子2与3之间的内含子序列(《美国国家科学院院刊》(Proc.Natl.Acad.Sci.USA.)，第78(3)卷，第1527-31页，1981)。本领域的普通技术人员应当理解的是，表达载体的设计可取决于比如待转化的宿主细胞的选择、所希望的表达水平等因素。载体可以被引入到宿主细胞中而由此产生转录物、蛋白质、或肽，包括由如本文描述的核酸编码的融合蛋白或肽(例如，规律间隔成簇短回文重复(CRISPR)转录物、蛋白质、酶、其突变体形式、其融合蛋白等)。关于调节序列，提及美国专利申请10/491,026，该专利的内容通过引用以其全文并入本文。关于启动子，提及PCT公开WO 2011/028929和美国申请12/511,940，这些专利的内容通过引用以其全文并入本文。

载体可以被设计为用于在原核或真核细胞中表达CRISPR转录物(例如核酸转录物、蛋白质、或酶)。例如，CRISPR转录物可表达于例如大肠杆菌的细菌细胞、昆虫细胞(使用杆状病毒表达载体)、酵母细胞、或哺乳动物细胞中。适合的宿主细胞进一步讨论于Goeddel(戈德尔)，《基因表达技术：酶学方法》(GENE EXPRESSION TECHNOLOGY:METHODS INENZYMOLOGY)185，学术出版社(Academic Press)，圣地亚哥(San Diego)，加利福尼亚州(Calif.)(1990年)中。可替代地，重组表达载体可在体外例如使用T7启动子调节序列和T7聚合酶来转录和翻译。

载体可以被引入原核生物或原核细胞中并且在其中增殖。在一些实施例中，原核生物用来扩增有待引入真核细胞中的载体的多个拷贝，或者作为有待引入真核细胞中的载体的产生中的中间载体(例如，扩增质粒作为病毒载体包装系统的一部分)。在一些实施例中，原核生物用来扩增一个载体的多个拷贝并且表达一种或多种核酸，如提供用于递送到宿主细胞或宿主生物中的一种或多种蛋白质的来源。蛋白质在原核生物中的表达最经常在大肠杆菌中用含有指导融合或非融合蛋白的表达的组成型或诱导型启动子的载体来进行。融合载体将多个氨基酸添加到在其中编码的蛋白质上，如该重组蛋白的氨基端上。这样的融合载体可以用于一个或多个目的，如：(i)增加重组蛋白的表达；(ii)增加重组蛋白的溶解性；以及(iii)通过在亲和纯化中充当配体来辅助重组蛋白的纯化。通常，在融合表达载体中，将蛋白切割位点引入至融合部分与重组蛋白的接合处以使得能够在纯化融合蛋白之后将重组蛋白与融合部分分离。这类酶以及它们的同源识别序列包括因子Xa、凝血酶以及肠激酶。示例性融合表达载体包括pGEX(发玛西亚生物技术有限公司(Pharmacia BiotechInc)；史密斯和约翰逊，1988.《基因》(Gene)67:31-40)、pMAL(纽英伦生物技术公司(NewEngland Biolabs)，贝弗利(Beverly)，马萨诸塞州(Mass.))以及pRIT5(发玛西亚公司，皮斯卡塔韦(Piscataway)，新泽西州(N.J.))，它们分别将谷胱甘肽S-转移酶(GST)、麦芽糖E结合蛋白或蛋白A融合至靶重组蛋白。适合的诱导型非融合大肠杆菌表达载体的实例包括pTrc(阿姆兰(Amrann)等人，(1988)《基因》(Gene)69:301-315)以及pET 11d(斯图迪尔(Studier)等人，《基因表达技术：酶学方法》(GENE EXPRESSION TECHNOLOGY:METHODS INENZYMOLOGY)185，学术出版社(Academic Press)，圣地亚哥(San Diego)，加利福尼亚州(Calif.)(1990)60-89)。在一些实施例中，载体是酵母表达载体。用于在酵母酿酒中表达的载体的实例包括pYepSec1(巴尔戴利(Baldari)等人，1987，《欧洲分子生物学学会杂志》(EMBO J)6:229-234)、pMFa(库尔坚(Kurjan)和赫斯库伍特兹(Herskowitz)，1982，《细胞》(Cell)30:933-943)、pJRY88(舒尔茨(Schultz)等人，1987，Gene 54:113-123),pYES2(Invitrogen Corporation(英杰公司)，San Diego(圣地亚哥)，Calif(加利福尼亚州))、以及picZ(Invitrogen Corp(英杰公司)，San Diego(圣地亚哥)，Calif(加利福尼亚州))。在一些实施例中，使用杆状病毒载体，载体驱动昆虫细胞中的蛋白质表达。可用于在培养的昆虫细胞(例如，SF9细胞)中表达蛋白质的杆状病毒载体包括pAc系列(史密斯(Smith)等人，1983，Mol.Cell.Biol.)3:2156-2165)和pVL系列(拉克瑙(Lucklow)和萨莫斯(Summers)，1989，《病毒学》(Virology)170:31-39)。

在一些实施例中，使用哺乳动物表达载体，载体能够驱动一种或多种序列在哺乳动物细胞中表达。哺乳动物表达载体的实例包括pCDM8(锡德(Seed)，1987，《自然》(Nature)329:840)和pMT2PC(考夫曼(Kaufman)等人，1987，《欧洲分子生物学学会杂志》(EMBO J.)6:187-195)。当用于哺乳动物细胞中时，表达载体的控制功能典型地由一种或多种调节组件提供。例如，常用的启动子来源于多瘤、腺病毒2、巨细胞病毒、猿猴病毒40、以及本文所述和本领域已知的其他病毒。对于用于原核细胞和真核细胞两者的其他适合的表达系统参见例如萨姆布鲁克(Sambrook)等人的《分子克隆实验指南》(Molecular Cloning：A LaboratoryManual.)(第2版)的第16和第17章，冷泉港实验室(Cold Spring Harbor Laboratory)，冷泉港实验室出版社(Cold Spring Harbor Laboratory Press)，冷泉港(Cold SpringHarbor)，纽约，1989。

在一些实施例中，重组哺乳动物表达载体能够指导核酸优先在特定细胞类型中表达(例如，使用组织特异型调节组件来表达核酸)。组织特异型调节组件是本领域中已知的。适合的组织特异型启动子的非限制性实例包括白蛋白启动子(肝脏特异性的；平克特(Pinkert)等人，1987.Genes Dev.1:268-277)，淋巴特异性启动子(卡里曼(Calame)和伊顿(Eaton)，1988.Adv.Immunol.43:235-275)，特别是T细胞受体的启动子(维纳图(Winoto)和巴尔迪莫(Baltimore)，1989.《欧洲分子生物学学会杂志》(EMBO J.)8:729-733)和免疫球蛋白(巴纳吉(Baneiji)等人，1983.《细胞》(Cell)33:729-740；奎恩(Queen)和巴尔迪莫(Baltimore)，1983.《细胞》(Cell)33:741-748)，神经元特异性启动子(例如，神经丝启动子；伯尔尼(Byrne)和鲁德尔(Ruddle)，1989.Proc.Natl.Acad.Sci.USA)86:5473-5477)，胰腺特异性启动子(艾德兰德(Edlund)等人，1985.《科学》(Science)230:912-916)，以及乳腺特异性启动子(例如，乳清启动子；美国专利号4,873,316和欧洲申请公开号264,166)。还涵盖发育型调节启动子，例如，鼠科动物同源框蛋白(hox)启动子凯赛尔((Kessel)和格鲁斯(Gruss)，1990.《科学》(Science)249:374-379)和α-甲胎蛋白启动子(卡姆皮斯(Campes)和蒂尔曼(Tilghman)，1989.Genes Dev.3:537-546)。关于这些原核和真核载体，提及美国专利6,750,059，该专利的内容通过引用以其全文并入本文。本发明的其他实施例可涉及病毒载体的使用，关于它提及美国专利申请13/092,085，该专利的内容通过引用以其全文并入本文。组织特异型调节组件是本领域中已知的，并且在这个方面提及美国专利7,776,321，该专利的内容通过引用以其全文并入本文。在一些实施例中，调节组件有效作地连接至CRISPR系统的一个或多个组件，从而驱动该CRISPR系统的该一个或多个组件的表达。一般而言，CRISPR(规律间隔成簇短回文重复)，也称为SPIDR(SPacer间隔开的同向重复)，构成通常对于特定细菌物种而言特异性的DNA基因座的家族。该CRISPR座位包含在大肠杆菌中被识别的间隔开的短序列重复(SSR)的一个不同类(石野(Ishino)等人，《细菌学杂志》(J.Bacteriol.)，169:5429-5433[1987]；和中田(Nakata)等人，《细菌学杂志》(J.Bacteriol.)，171:3553-3556[1989])、以及相关基因。类似的间隔开的SSR已经鉴定于地中海富盐菌(Haloferax mediterranei)、化脓链球菌、鱼腥藻属、和结核分枝杆菌中(参见，格鲁恩(Groenen)等人，《分子微生物学》(Mol.Microbiol.)，10:1057-1065[1993]；霍(Hoe)等人，《新发感染性疾病》(Emerg.Infect.Dis.)，5:254-263[1999]；马斯波尔(Masepohl)等人，《生物化学与生物物理学学报》(Biochim.Biophys.Acta)1307:26-30[1996]；and Mojica et al.,Mol.Microbiol.)，17:85-93[1995])。这些CRISPR座位典型地不同于其他SSR的重复结构，这些重复已被称为规律间隔的短重复(SRSR)(约翰逊(Janssen)等人，《OMICS：整合生物学杂志》(OMICS J.Integ.Biol.)，6:23-33[2002]；以及莫吉卡(Mojica)等人，《分子微生物学》(Mol.Microbiol.)，36:244-246[2000])。一般而言，这些重复是以簇存在的短组件，其被具有基本上恒定长度的独特间插序列规律地间隔开(莫吉卡(Mojica)等人，[2000]，同上)。虽然重复序列在菌株之间是高度保守的，许多间隔开的重复和这些间隔区的序列一般在菌株与菌株之间不同(冯·埃姆登(van Embden)等人，《细菌学杂志》(J.Bacteriol.)，182:2393-2401[2000])。已经在40种以上的原核生物中鉴定出CRISPR座位(参见，例如，约翰逊(Janssen)等人，《分子微生物学》(Mol.Microbiol.)，43:1565-1575[2002]；以及莫吉卡(Mojica)等人，[2005])，包括但不限于：气火菌属(Aeropyrum)、热棒菌属(Pyrobaculum)、硫化叶菌属(Sulfolobus)、古球菌属(Archaeoglobus)、盐盒菌属(Halocarcula)、甲烷杆菌属(Methanobacterium)、甲烷球菌属(Methanococcus)、甲烷八叠球菌属(Methanosarcina)、甲烷火菌属(Methanopyrus)、焦球菌属(Pyrococcus)、嗜酸菌属(Picrophilus)、热原体属(Thermoplasma)、棒状杆菌属(Corynebacterium)、分枝杆菌属(Mycobacterium)、链霉菌属(Streptomyces)、产水菌属(Aquifex)、紫单胞菌属(Porphyromonas)、绿菌属(Chlorobium)、栖热菌属(Thermus)、芽孢杆菌属(Bacillus)、利斯特菌属(Listeria)、葡萄球菌属(Staphylococcus)、梭菌属(Clostridium)、好热厌氧杆菌属(Thermoanaerobacter)、支原体属(Mycoplasma)、梭杆菌属(Fusobacterium)、固氮弓菌属(Azarcus)、色杆菌属(Chromobacterium)、奈瑟菌属(Neisseria)、亚硝化单胞菌属(Nitrosomonas)、脱硫弧菌属(Desulfovibrio)、地杆菌属(Geobacter)、粘球菌属(Myxococcus)、弯曲杆菌属(Campylobacter)、类杆菌属(Wolinella)、不动杆菌属(Acinetobacter)、欧文菌属(Erwinia)、埃希菌属(Escherichia)、军团杆菌属(Legionella)、甲基球菌属(Methylococcus)、巴斯德菌属(Pasteurella)、发光细菌属(Photobacterium)、沙门菌属(Salmonella)、黄单胞菌属(Xanthomonas)、耶尔森菌属(Yersinia)、密螺旋体属(Treponema)以及栖热袍菌属(Thermotoga)。

在一些实施例中，该CRISPR酶是包含一个或多个异源蛋白结构域(例如除了该CRISPR酶之外的约或多于约1、2、3、4、5、6、7、8、9、10个、或更多个结构域)的融合蛋白的一部分。CRISPR酶融合蛋白可以包含任何其他蛋白质，以及任选地在任何两个结构域之间的连接序列。可以融合到CRISPR酶上的蛋白质结构域的实例包括但不限于，表位标签、报告基因序列、以及具有下列活性的一者或多者的蛋白质结构域：甲基酶活性、脱甲基酶活性、转录激活活性、转录阻遏活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性和核酸结合活性。表位标签的非限制性实例包括组氨酸(His)标签、V5标签、FLAG标签、流感病毒血凝素(HA)标签、Myc标签、VSV-G标签、和硫氧还蛋白(Trx)标签。报告基因的实例包括，但不限于，谷胱甘肽-S-转移酶(GST)、辣根过氧化物酶(HRP)、氯霉素乙酰转移酶(CAT)、β-半乳糖苷酶、β-葡糖醛酸糖苷酶、萤光素酶、绿色荧光蛋白(GFP)、HcRed、DsRed、青荧光蛋白(CFP)、黄色荧光蛋白(YFP)、以包括蓝色荧光蛋白(BFP)的自发荧光蛋白。CRISPR酶可以融合到编码蛋白质或蛋白质片段的基因序列上，所述蛋白质或蛋白质片段结合DNA分子或结合其他细胞分子，其包括，但不限于，麦芽糖结合蛋白(MBP)、S-tag、Lex A DNA结合结构域(DBD)融合物、GAL4 DNA结合结构域融合物、以及单纯疱疹病毒(HSV)BP16蛋白融合物。可以形成包含CRISPR酶的融合蛋白的一部分的另外的结构域在US 20110059502中，通过引用将其并入本文。在一些实施例中，使用标记的CRISPR酶来鉴定靶序列的位置。

除非另有说明，本发明的实践采用免疫学、生物化学、化学、分子生物学、微生物学、细胞生物学、基因组学和重组DNA的常规技术，这些在本领域的技能之内。参见萨姆布鲁克(Sambrook)、弗里奇(Fritsch)和马尼亚蒂斯(Maniatis)，《分子克隆：实验室手册》(MOLECULAR CLONING:A LABORATORY MANUAL)，第2次编辑(1989)；《当代分子生物学实验手册》(CURRENT PROTOCOLS IN MOLECULAR BIOLOGY)(F.M.奥苏贝尔(F.M.Ausubel)等人编辑，(1987))；《酶学方法》(METHODS IN ENZYMOLOGY)系列(学术出版公司)：《PCR 2：实用方法》(PCR 2:A PRACTICAL APPROACH)(M.J.麦克弗森(M.J.MacPherson,B.D.Hames)和G.R.泰勒(Taylor)编辑(1995))、哈洛(Harlow)和拉内(Lane)编辑(1988)《抗体：实验室手册》(ANTIBODIES,A LABORATORY MANUAL)，以及《动物细胞培养》(ANIMAL CELL CULTURE)(R.I.弗雷谢尼(R.I.Freshney)编辑(1987))。

遗传以及表观遗传状况的模型

可以使用本发明的方法产生可以用作疾病模型的植物、动物或细胞。如在此使用，“疾病”是指受试者的疾病、障碍或适应症。例如，可以使用本发明的方法产生以下动物或细胞，该动物或细胞在一个或多个与疾病相关的核酸序列中包括修饰，或以下植物、动物或细胞，一个或多个与疾病相关的核酸序列的表达在该植物、动物或细胞中被改变。这样的核酸序列可以编码疾病相关蛋白序列或可以是疾病相关控制序列。因此，应该理解的是在本发明的实施例中，植物、受试者、患者、生物或细胞可以是非人受试者、患者、生物或细胞。因此，本发明提供了由本发明方法产生的植物、动物或细胞或其子代。该子代可以是产生的植物或动物的克隆或可以通过与同一物种的其他个体杂交而由有性繁殖产生，以在其后代中基因渗入另外的令人希望的性状。在多细胞生物(特别是动物或植物)的情况下，该细胞可以是在体内或离体的。在该细胞处于培养中的情况下，如果满足适当的培养条件并且优选地，如果该细胞适合地适于此目的(例如，干细胞)，则可以建立细胞系。还设想了通过本发明产生的细菌细胞系。因此，还设想了细胞系。

在一些方法中，可以使用疾病模型研究突变对动物或细胞的影响以及使用在疾病研究中常用的措施对疾病的发展和/或进展的影响。可替代地，这样的一种疾病模型有用于研究药物活性化合物对疾病的影响。

在一些方法中，可以使用疾病模型评估潜在的基因疗法策略的效力。也就是说，可以将疾病相关基因或多核苷酸进行修饰，这样使得疾病发展和/或进展被抑制或减少。具体而言，该方法包括修饰疾病相关基因或多核苷酸，这样使得产生一种改变的蛋白质，其结果是，该动物或细胞具有改变的反应。因此，在一些方法中，可以将基因修饰动物与易患该疾病的动物进行比较，这样使得可以评估基因疗法事件的效果。

在另一个实施例中，本发明提供了一种研发生物活性剂的方法，该生物活性剂调制与疾病基因相关的细胞信号传导事件。该方法包括使测试化合物与细胞接触，该细胞包括一种或多种载体，这一种或多种载体驱动CRISPR酶、连接到tracr配对序列上的指导序列和tracr序列中的一种或多种的表达；并且检测读出的变化，该变化指示与例如包含在该细胞中的疾病基因的突变相关的细胞信号传导事件的减少或增加。

可以与用于筛选细胞功能变化的本发明的方法组合构建细胞模型或动物模型。可以使用这样的一种模型研究由本发明的CRISPR复合物修饰的基因组序列对感兴趣的细胞功能的影响。例如，可以使用细胞功能模型研究修饰的基因组序列对细胞内信号传导或细胞外信号传导的影响。可替代地，可以使用细胞功能模型研究修饰的基因组序列对感知觉的影响。在一些这样的模型中，修饰一个或多个与该模型中的信号传导生化学途径相关的基因组序列。

已经具体研究了若干疾病模型。这些疾病模型包括新生(de novo)自闭症风险基因CHD8、KATNAL2和SCN2A；以及综合征性自闭症(安格曼综合征(Angelman Syndrome))基因UBE3A。这些基因以及所得的自闭症模型当然是优选的，但用于显示本发明的跨基因和对应的模型的广阔的适用性。

可以通过当将测试模型细胞和对照细胞与候选试剂接触时，测定它们之间的对应的基因的mRNA水平差异而确定一个或多个与信号传导生化途径相关的基因组序列的改变的表达。可替代地，通过检测编码的多肽或基因产物的水平差异而确定与信号传导生化途径相关的序列的差异表达。

为了在mRNA转录物或对应的多核苷酸水平上测定试剂诱导的变化，首先根据本领域的标准方法提取包含在样品中的核酸。例如，可以根据陈述于萨姆布鲁克(Sambrook)等人(1989)中的程序使用各种水解酶分离mRNA或遵循由制造商提供的随附说明书通过核酸结合树脂提取mRNA。然后，根据本领域广泛已知的方法或基于在此示例的方法，通过扩增程序或常规的杂交测定(例如Northern印迹分析)检测包含在提取的核酸样品中的mRNA。

出于本发明的目的，扩增意指利用引物和聚合酶的能够以合理的保真度复制靶序列的任何方法。可以通过天然或重组DNA聚合酶，如TaqGold^TM、T7 DNA聚合酶、大肠杆菌DNA聚合酶的Klenow片段以及逆转录酶进行扩增。一种优选的扩增方法是PCR。具体而言，可以使分离的RNA经受逆转录测定，该测定与定量聚合酶链式反应(RT-PCR)耦合，以便定量与信号传导生化途径相关的序列的表达水平。

在扩增测定中可以实时地执行基因表达水平的检测。在一个方面，可以用荧光DNA结合剂直接使扩增产物可视化，这些荧光DNA结合剂包括但不限于DNA嵌入剂和DNA沟结合剂。因为掺入进双链DNA分子中的嵌入剂的量典型地与扩增DNA产物的量成比例，可以常规地通过使用本领域的常规光学系统定量嵌入的染料的荧光而确定扩增产物的量。适于本申请的DNA结合染料包括SYBR绿、SYBR蓝、DAPI、碘化丙锭、Hoeste、SYBR金、溴化乙锭、吖啶、原黄素、吖啶橙、吖啶黄、氟香豆素(fluorcoumanin)、玫瑰树碱、道诺霉素、氯喹、偏端霉素D、色霉素、乙菲啶(homidium)、光辉霉素、多吡啶钌、安曲霉素等。

在另一个方面，可以在扩增反应中利用其他荧光标记物(如序列特异的探针)，以促进扩增产物的检测和定量。基于探针的定量扩增依赖于希望的扩增产物的序列特异的检测。它利用荧光的靶标特异的探针(例如，探针)，从而导致增加的特异性和敏感性。用于进行基于探针的定量扩增的方法本领域是确立的并且教导于美国专利号5,210,015中。

在又另一个方面，可以使用与以下序列具有序列同源性的杂交探针进行常规的杂交测定，这些序列与信号传导生化途径相关。典型地，在杂交反应中，允许探针和与信号传导生化途径相关的序列形成稳定的复合物，这些序列被包含在来源于测试受试者的生物样品内。本领域的技术人员应该意识到的是，在将反义核酸用作探针核酸的情况下，提供于样品中的靶多核苷酸被选择为与该反义核酸的序列互补。相反地，在核苷酸探针是有义核酸的情况下，该靶多核苷酸被选择为与该有义核酸的序列互补。

可以在不同严格度条件下进行杂交。用于实践本发明的适合的杂交条件是这样的，使得探针和与信号传导生化途径相关的序列之间的识别相互作用既是充分特异的又是充分稳定的。增加杂交反应的严格度的条件在本领域是广泛已知且公开的。参见例如，(萨姆布鲁克(Sambrook)等人，(1989)；非放射性原位杂交应用手册(Nonradioactive In SituHybridization Application Manual)，宝灵曼公司(Boehringer Mannheim)，第二版)。可以使用固定在任何固体支持物上的探针进行杂交测定，所述固体支持物包括但不限于硝化纤维、玻璃、硅以及多种基因阵列。如在美国专利号5,445,934中，在高密度基因芯片上执行优选的杂交测定。

对于在杂交测定过程中形成的探针-靶标复合物的常规检测，将核苷酸探针络合至可检测标记物上。适于在本发明中使用的可检测标记物包括通过光化学、生物化学、光谱学、免疫化学、电学、光学或化学手段可检测的任何组合物。多种多样的适当的可检测标记物在本领域是已知的，包括荧光或化学发光标记物、放射性同位素标记物、酶或其他配体。在优选的实施例中，可能希望的是利用荧光标记物或酶标签，如地高辛、β-半乳糖苷酶、脲酶、碱性磷酸酶或过氧化物酶、亲和素/生物素复合物。

用于检测或定量杂交强度的检测方法将典型地取决于以上选择的标记物。例如，可以使用照相底片或感光成像仪检测放射性标记物。可以使用检测发射光的光检测器检测并定量荧光标记物。典型地通过为酶提供底物并测量由酶对底物的作用而产生的反应产物来检测酶标记物；并且最后，通过简单地使着色的标记物可视化而检测比色标记物。

还可以通过检查对应的基因产物确定与信号传导生化途径相关的序列的试剂诱导的表达变化。确定蛋白质水平典型地涉及a)使包含在生物样品中的蛋白质与特异性结合到与信号传导生化途径相关的蛋白质上的试剂接触；并且(b)鉴定这样形成的任何试剂:蛋白质复合物。在此实施例的一个方面，特异性结合与信号传导生化途径相关的蛋白质的该试剂是一种抗体，优选单克隆抗体。

通过在将允许在该试剂和与信号传导生化途径相关的蛋白质之间形成复合物的条件下，通过使该试剂与来源于测试样品的与信号传导生化途径相关的蛋白质的样品接触而进行该反应。可以根据本领域中的标准程序直接地或间接地检测复合物的形成。在直接检测方法中，这些试剂提供有可检测的标记物并且未反应的试剂可以从复合物中除去；由此剩余的标记物的量指示形成的复合物的量。对于这样的方法，优选的是选择即使在严格洗涤条件过程中仍附接至这些试剂上的标记物。优选的是，该标记物不干扰结合反应。在替代方案中，间接检测程序可以使用包含用化学方法或酶方法引入的标记物的试剂。令人希望的标记物通常不干扰所得的试剂:多肽复合物的结合或稳定性。然而，标记物典型地被设计成是用于有效结合并且因此产生可检测的信号的抗体可及的。

适于检测蛋白质水平的多种多样的标记物在本领域是已知的。非限制性实例包括放射性同位素、酶、胶体金属、荧光化合物、生物发光化合物以及化学发光化合物。

可以通过标准定量测定定量在结合反应过程中形成的试剂:多肽复合物的量。如上所示，可以通过仍留在结合位点处的标记物的量直接测量试剂:多肽复合物的形成。在一个替代方案中，测试与信号传导生化途径相关的蛋白质与标记的类似物结合特定试剂上的位点的竞争能力。在此竞争测定中，捕获的标记物的量与存在于测试样品中的与信号传导生化途径相关的蛋白质序列的量成反比。

多种用于蛋白质分析的基于以上概括的总则的技术在本领域是可获得的。它们包括但不限于放射免疫测定、ELISA(酶联免疫放射测定)、“夹层免疫测定、免疫放射测定、原位免疫测定(使用例如，胶体金、酶或放射性同位素标记物)、蛋白质印迹分析、免疫沉淀测定、免疫荧光测定以及SDS-PAGE。

特异性识别或结合到与信号传导生化途径相关的蛋白质上的抗体对于执行前述蛋白质分析而言是优选的。在希望的情况下，可以使用识别特定类型的翻译后修饰(例如，信号传导生化途径诱导的修饰)的抗体。翻译后修饰包括但不限于糖基化、脂化、乙酰化以及磷酸化。这些抗体可以购自商业供应商。例如，特异性识别酪氨酸磷酸化蛋白质的抗磷酸酪氨酸抗体可以获得自多个供应商，包括英杰公司和珀金埃尔默公司(Perkin Elmer)。抗磷酸酪氨酸抗体在检测响应于ER应激而在其酪氨酸残基上存在差异磷酸化的蛋白质中是特别有用的。这样的蛋白质包括但不限于真核翻译起始因子2α(eIF-2α)。可替代地，可以通过用展示出希望的翻译后修饰的靶蛋白免疫宿主动物或抗体产生细胞而使用常规的多克隆或单克隆抗体技术产生这些抗体。

在实践主题方法中，可以令人希望的是，在不同身体组织中、在不同细胞类型中和/或在不同亚细胞结构中辨别与信号传导生化途径相关的蛋白质的表达谱。可以通过使用能够结合到优先表达于某些组织、细胞类型或亚细胞结构中的蛋白质标记的组织特异的、细胞特异的或亚细胞结构特异的抗体进行这些研究。

还可以通过检查基因产物相对于对照细胞的活性变化而确定与信号传导生化途径相关的基因的改变的表达。与信号传导生化途径相关的蛋白质的试剂诱导的活性变化的测定将取决于处于研究之下的生物活性和/或信号传导途径。例如，在该蛋白质是一种激酶的情况下，可以通过本领域已知的多种测定确定它磷酸化一种或多种下游底物的能力的变化。代表性测定包括但不限于用抗体进行免疫印迹和免疫沉淀，这些抗体是如识别磷酸化蛋白质的抗磷酸酪氨酸抗体。此外，可以通过高通量化学发光测定检测激酶活性，如AlphaScreen^TM(可获得自珀金埃尔默公司)和eTag^TM测定(陈-辉(Chan-Hui)等人(2003)《临床免疫学》(Clinical Immunology)111:162-174)。

在与信号传导生化途径相关的蛋白质是使得细胞内pH条件波动的信号传导级联的一部分的情况下，可以将pH敏感的分子(如荧光pH染料)用作报道分子。在与信号传导生化途径相关的蛋白质是一种离子通道的另一个实例中，可以监测膜电位和/或细胞内离子浓度的波动。多种商业试剂盒和高通量装置特别适于快速且稳健地筛选离子通道调节剂。代表性仪器包括FLIPRTM(分子设备公司(Molecular Devices,Inc.))和VIPR(奥罗拉生物科学公司(Aurora Biosciences)))。这些仪器能够同时检测微板的1000多个样品孔中的反应，并且能够提供一秒内或甚至一毫秒内的实时测量和功能数据。

在实践在此披露的任何方法中，可以经由本领域已知的一种或多种方法将适合的载体引入进细胞或胚胎中，这些方法包括但不限于，显微注射、电穿孔、声致穿孔、基因枪、磷酸钙介导的转染、阳离子转染、脂质体转染、树枝状聚合物转染、热休克转染、核转染、磁转染、脂转染、刺穿转染(impalefection)、光学转染、专有剂增强的核酸摄取以及经由脂质体、免疫脂质体、病毒颗粒或人工病毒体进行递送。在一些方法中，通过显微注射将该载体引入进胚胎中。可以将这个或这些载体显微注射进胚胎的细胞核或细胞质中。在一些方法中，通过核转染将这个或这些载体引入进细胞中。

靶座位，靶多核苷酸；PAM序列

CRISPR复合物的靶多核苷酸可以是对真核细胞而言内源或外源的任何多核苷酸。例如，该靶多核苷酸可以是一种驻留在真核细胞的细胞核中的多核苷酸。该靶多核苷酸可以是一个编码基因产物(例如，蛋白质)的序列或一个非编码序列(例如，调节多核苷酸或无用DNA)。该靶可以是调控组件或调节组件或启动子或增强子或沉默子。在一些实施例中，该启动子可以在+200bp左右或甚至来自TTS的+1000bp。在一些实施例中，该调节区可以是增强子。该增强子典型地大于来自TTS的+1000bp。更具体地，真核蛋白编码基因的表达通常是通过多个顺式作用转录调控区进行调节的。一些控制组件位于起始位点(启动子近侧组件)附近，而其他组件位置更远(增强子以及沉默子)。启动子决定转录起始位点以及RNA聚合酶II的直接结合。已经在真核DNA中鉴定出三种类型的启动子序列。最常见的TATA盒在迅速转录基因中是普遍的。在一些基因中很少发现起始启动子，并且CpG岛是转录基因所特有的。启动子近侧组件存在于起始位点≈200碱基对内。若干此类包含高达≈20个碱基对的组件可以帮助调节具体基因。长度通常为≈100-200个碱基对的增强子包含多个8-至20-bp控制组件。它们可以位于启动子上游或下游、在内含子内、或在基因的最终外显子下游从200个碱基对到成千上万个碱基。启动子近侧组件和增强子可以是细胞类型特异性的，仅在特定分化细胞类型中发挥作用。然而，这些区域中的任何区域可以是靶序列并且被以下概念所涵盖：该靶可以是调控组件或调节组件或启动子或增强子或沉默子。

典型地，在内源核酸靶向系统的背景下，核酸靶向复合物(包含杂交到靶序列上并且与一种或多种核酸靶向效应蛋白复合的指导RNA)的形成导致在该靶序列中或其附近(例如在1、2、3、4、5、6、7、8、9、10、20、50、或更多个碱基对之内)的一条链或两条DNA或RNA链的切割。如在此使用的，术语“一个或多个与感兴趣的靶座位缔合的序列”是指在靶序列附近的序列(例如，离靶序列1、2、3、4、5、6、7、8、9、10、20、50、或更多个碱基对之内，其中该靶序列被包括在感兴趣的靶座位中)。

不希望被理论所束缚，据信该靶序列应该与PAM(原型间隔子邻近基序)相关；也就是说，与由CRISPR复合物识别的短序列相关。对PAM的精确序列和长度要求取决于使用的CRISPR酶而不同，但是PAM典型地是临近原型间隔子(也就是说，靶序列)的2-5个碱基对序列。在以下实例部分中给出PAM序列的实例，并且熟练人员将能够鉴定与给定的CRISPR酶一起使用的另外的PAM序列。另外，PAM相互作用(PI)结构域的工程化可以允许对PAM特异性编程，改善靶位点识别保真性，并且增加Cas(例如，Cas9)基因组工程化平台的多能性。Cas蛋白(如Cas9蛋白)可以被工程化来改变它们的PAM特异性，例如，如描述于克莱因史蒂夫(Kleinstiver)BP等人，具有改变PAM特异性的工程化CRISPR-Cas9核酸酶(EngineeredCRISPR-Cas9 nucleases with altered PAM specificities.)《自然》(Nature).2015年7月23日；523(7561):481-5.doi:10.1038/nature14592。在一些实施例中，该方法包括允许CRISPR复合物结合到该靶多核苷酸上以实施所述靶多核苷酸的切割，由此修饰该靶多核苷酸，其中该CRISPR复合物包括与杂交到在所述靶多核苷酸内的靶序列上的指导序列复合的CRISPR酶，其中所述指导序列连接到tracr配对序列上，该tracr配对序列进而杂交到tracr序列上。在一个方面，本发明提供了修饰多核苷酸在真核细胞中的表达的方法。在一些实施例中，该方法包括允许CRISPR复合物结合到该多核苷酸上，这样使得所述结合导致所述多核苷酸的表达增加或降低；其中该CRISPR复合物包括与杂交到在所述多核苷酸内的靶序列上的指导序列复合的CRISPR酶，其中所述指导序列连接到tracr配对序列上，该tracr配对序列进而杂交到tracr序列上。类似的考虑因素和条件适用如上文针对修饰靶多核苷酸的方法。事实上，这些取样、培养和重新引入选择跨本发明的多个方面而适用。在一个方面，本发明提供了修饰真核细胞中的靶多核苷酸的方法，这些方法可以在体内、离体或在体外。在一些实施例中，该方法包括对来自人或非人动物的细胞或细胞群进行取样，并且修饰该细胞或这些细胞。培养可以发生在离体的任何阶段。该细胞或这些细胞甚至可以被重新引入该非人动物或植物中。对于重新引入的细胞，特别优选的是这些细胞是干细胞。

确实，在本发明的任何方面，该CRISPR复合物可以包括与杂交到靶序列上的指导序列复合的CRISPR酶，其中所述指导序列可以连接到tracr配对序列上，该tracr配对序列进而可以杂交到tracr序列上。

本发明涉及用于控制涉及序列靶向的基因表达的系统、方法、和组合物的工程化和优化，该序列靶向例如涉及CRISPR-Cas系统及其组分的基因组干扰或基因编辑。该Cas酶是Cas9。本发明方法的一个优点在于，该CRISPR系统最小化或避免了脱靶结合及其所产生的副作用。这是通过使用被安排为具有针对靶DNA的高度序列特异性的系统而实现的。

相对于CRISPR-Cas复合物或系统，优选地，该tracr序列具有一个或多个发夹结构，并且长度是30个或更多个核苷酸，长度是40个或更多个核苷酸，或长度是50或更多个核苷酸；该指导序列的长度在10至30个核苷酸之间，该CRISPR/Cas酶是II型Cas9酶。

CRISPR复合物的靶多核苷酸可以包括多个疾病相关基因和多核苷酸以及信号传导生化途径相基因和多核苷酸，如分别提交于2012年12月12日和2013年1月2日、标题均为用于序列操纵的系统方法和组合物(SYSTEMS METHODS AND COMPOSITIONS FOR SEQUENCEMANIPULATION)的分别具有博德(Broad)参考号BI-2011/008/WSGR案卷号44063-701.101和BI-2011/008/WSGR案卷号44063-701.102的美国临时专利申请61/736,527和61/748,427中所列举，将所有这些申请的内容通过引用以其全文结合在此。

靶多核苷酸的实例包括与信号传导生化途径相关的序列，例如信号传导生化途径相关基因或多核苷酸。靶多核苷酸的实例包括疾病相关基因或多核苷酸。“疾病相关”基因或多核苷酸是指与非疾病对照的组织或细胞相比，在来源于疾病影响的组织的细胞中以异常水平或以异常形式产生转录或翻译产物的任何基因或多核苷酸。在改变的表达与疾病的出现和/或进展相关的情况下，它可以是一个以异常高的水平被表达的基因；它可以是一个以异常低的水平被表达的基因。疾病相关基因还指具有一个或多个突变或直接负责或与一个或多个负责疾病的病因学的基因连锁不平衡的遗传变异的基因。转录的或翻译的产物可以是已知的或未知的，并且可以处于正常或异常水平。

基因组广度敲除筛选

可以将在此描述的CRISPR-Cas蛋白和系统用于进行有效并且且符合成本效益的功能基因组筛选。此类筛选可以利用CRISPR-Cas基因组广度文库。此类筛选和文库可以提供确定基因的功能，涉及的细胞路径基因，以及任何基因表达的改变是如何能够产生一个具体生物过程的。本发明的一个优点在于，该CRISPR系统避免了脱靶结合及其所产生的副作用。这是通过使用被安排为具有针对靶DNA的高度序列特异性的系统而实现的。

基因组广度文库可以包括多个CRISPR-Cas系统指导RNA，如在此描述的，其包括能够靶向真核细胞群中多个基因组座位中多个靶序列的指导序列。这些细胞群可以是胚胎干(ES)细胞群。基因组座位中的靶序列可以是非编码序列。该非编码序列可以是内含子、调节序列、剪接位点、3’UTR、5’UTR、或多聚腺苷酸化信号。可以通过所述靶向来改变一种或多种基因产物的基因功能。该靶向可导致基因功能的敲除。基因产物的靶向可以包括多于一种指导RNA。一种基因产物可以被2、3、4、5、6、7、8、9、或10种指导RNA靶向，优选地每个基因3至4种。可以使脱靶修饰最小化(参见，例如，RNA指导的Cas9核酸酶的DNA靶向特异性(DNAtargeting specificity of RNA-guided Cas9 nucleases)徐(Hsu)，P.、斯科特(Scott)，D.、温斯坦(Weinstein)，J.、兰(Ran)，FA.、科纳曼(Konermann)，S.、阿格瓦拉(Agarwala)，V.、李(Li)，Y.、法恩(Fine)，E.、吴(Wu)，X.、沙勒姆(Shalem)，O.、克拉迪克(Cradick)，TJ.、马拉菲尼(Marraffini)，LA.、包(Bao)，G.、&张(Zhang)，F.《自然生物技术》(NatBiotechnol)doi:10.1038/nbt.2647(2013))，通过引用结合在此。该靶向可以具有约100或更多个序列。该靶向可以具有约1000或更多个序列。该靶向可以具有约20,000或更多个序列。该靶向可以具有整个基因组。该靶向可以具有一系列聚焦于相关或令人希望的途径的靶序列。该途径可以是免疫途径。该途径可以是细胞分裂途径。

本发明的一个方面包括基因组广度文库，该基因组广度文库可以包括多个CRISPR-Cas系统指导RNA，这些指导RNA可以包括能够靶向多个基因组座位中多个靶序列的指导序列，其中所述靶向导致基因功能的敲除。该文库可以潜在包括靶向生物基因组中各个和每个基因的指导RNA。

在本发明的一些实施例中，该生物或受试者是真核生物(包括人类在内的哺乳动物)或非人类真核生物或非人类动物或非人类哺乳动物。在一些实施例中，该生物或受试者是非人类动物，并且可以是节肢动物例如昆虫，或者可以是线虫。在本发明的一些方法中，该生物或受试者是植物。在本发明的一些方法中，该生物或受试者是哺乳动物或非人类哺乳动物。非人类哺乳动物可以是例如啮齿动物(优选小鼠或大鼠)、有蹄动物、或灵长动物。在本发明的一些方法中，该生物或受试者是包括微藻在内的藻类，或者是真菌。

基因功能的敲除可以包括：向细胞群中的每个细胞中引入具有一种或多种包含工程化的、非天然存在的CRISPR-Cas系统的载体的载体系统，该系统包括：I.Cas蛋白，和II.一种或多种指导RNA，其中组分I和II可以是相同或在不同载体系统上，将组分I和II整合到每个细胞中，其中该指导序列靶向每个细胞中的独特基因，其中该Cas蛋白有效作地连接至调节组件上，其中在转录时，包括该指导序列的指导RNA引导CRISPR-Cas系统与该独特基因的基因组座位中的靶序列的序列特异性结合，通过该Cas蛋白诱导该基因组座位的切割，并且证实细胞群的每个细胞中的多个独特基因中的不同敲除突变，由此产生基因敲除细胞文库。本发明包括，该细胞群是真核细胞群，并且在一个优选实施例中，该细胞群是胚胎干(ES)细胞群。

该一种或多种载体可以是质粒载体。该载体可以是单个载体，其包括Cas9、sgRNA，以及任选地，进入靶细胞中的选择性标记。不被理论所束缚，通过单个载体同时递送Cas9和sgRNA的能力使得能够应用于任何感兴趣的细胞类型，而不需要首先产生表达Cas9的细胞系。该调节组件可以是诱导型启动子。该诱导型启动子可以是多西环素诱导型启动子。在本发明的一些方法中，该指导序列的表达是在T7启动子控制下并且是由T7聚合酶的表达驱动的。可以通过全外显子组测序证实不同敲除突变。可以在100或更多个独特基因中实现敲除突变。可以在1000或更多个独特基因中实现敲除突变。可以在20,000或更多个独特基因中实现敲除突变。可以在整个基因组中实现敲除突变。可以在多个独特基因中实现基因功能的敲除，这些独特基因在特定生理途径或状态下发挥作用。该途径或状态可以是免疫途径或状态。该途径或状态可以是细胞分裂途径或状态。

本发明还提供了试剂盒，其包括在此提及的基因组广度文库。该试剂盒可以包括单个容器，该容器包括包含本发明所述文库的载体或质粒。该试剂盒还可以包括面板，该面板包括具有包括来自本发明所述文库的指导序列的独特CRISPR-Cas系统指导RNA的选择，其中该选择指示特定的生理条件。本发明包括，该靶向具有约100或更多个序列、约1000或更多个序列或约20,000或更多个序列或整个基因组。此外，一系列靶序列可以聚焦于相关或令人希望的途径，如免疫路径或细胞分裂。

在本发明的另外方面，Cas9酶可以包含一个或多个突变，并且可以用作具有或不具有与功能结构域融合的通用DNA结合蛋白。这些突变可以是人工引入的突变或获得性和丢失性功能突变。这些突变可以包括但不限于分别在RuvC和HNH催化结构域中的催化结构域(D10和H840)之一中的突变。已经表征了其他的突变。在本发明的一个方面，该功能结构域可以是转录激活结构域，其可以是VP64。在本发明的其他方面，该功能结构域可以是转录阻遏因子结构域，其可以是KRAB或SID4X。本发明的其他方面涉及融合到结构域上的突变的Cas 9酶，这些结构域包括但不限于，转录激活剂、阻遏因子、重组酶、转座酶、组蛋白重塑剂(histone remodeler)、脱甲基酶、DNA甲基转移酶、隐花色素、光可诱导/可控制结构域或化学可诱导/可控制结构域。本发明的一些方法可以包括诱导靶向基因的表达。在一个实施例中，通过利用功能结构域来通过靶向真核细胞群中多个基因组座位中多个靶序列诱导表达。

在本发明的实践中是有用的，参考：

在人类细胞中基因组规模CRISPR-Cas9敲除筛选(Genome-Scale CRISPR-Cas9Knockout Screening in Human Cells)沙勒姆(Shalem)，O.、桑耶纳(Sanjana)，NE.、哈尔特宁(Hartenian)，E.、史(Shi)，X.、斯科特(Scott)，DA.、迈克尔森(Mikkelson)，T.、赫克尔(Heckl)，D.、埃伯特(Ebert)，BL.、罗特(Root)，DE.、登奇(Doench)，JG.、张(Zhang)，F.《科学》(Science)12月12日.(2013).[电子版先于印刷版]；以最终编辑形式公开，如：《科学》(Science)2014年1月3日；343(6166):84-87。

沙勒姆(Shalem)等人涉及新的在基因组广度范围上探询基因功能的方式。他们的研究显示，递送基因组范围的CRISPR-Cas9敲除(GeCKO)文库利用64,751个独特的指导序列靶向18,080个基因，这些指导序列使得在人类细胞中阴性和阳性选择筛选两者成为可能。首先，这些作者显示，使用该GeCKO文库来鉴定癌症和多能干细胞中对于细胞活力至关重要的基因。接着，在黑色素瘤模型中，这些作者针对基因进行筛选，这些基因的损失涉及对维罗非尼(一种抑制突变体蛋白激酶BRAF的治疗剂)的抗性。他们的研究显示，最高级候选物包括先前验证的基因NF1和MED12连同新颖的命中物NF2、CUL3、TADA2B、和TADA1。这些作者观察到在靶向相同基因的独立指导RNA之间的高水平的一致性以及高比率的命中确认，并且因此证实了采用Cas9进行基因组范围筛选的前景。

还参考美国专利公开号US 20140357530；以及PCT专利公开WO 2014093701，通过引用特此结合于此。

功能改变和筛选

在一些实施例中，一个或多个功能结构域与CRISPR酶(例如，II型Cas9酶)缔合。

在一些实施例中，一个或多个功能结构域与衔接蛋白缔合，例如，如与康纳曼(Konnerman)等人的修饰指导一起使用的衔接蛋白(《自然》(Nature)517,583-588，2015年1月29日)。

在一些实施例中，一个或多个功能结构域与死sgRNA(dRNA)缔合。在一些实施例中，dRNA复合物与活性cas9通过在基因座处的功能结构域指导基因调控，而sgRNA通过在另一个基因座处的活性cas9指导DNA切割，例如，如在达尔曼(Dahlman)，‘用催化活性Cas9核酸酶进行正交基因控制(Orthogonal gene control with a catalytically activeCas9nuclease)’(出版中)。在一些实施例中，相比于脱靶调节，dRNA被选择为最大化针对感兴趣的基因座位的调节的选择性。在一些实施例中，dRNA被选择为最大化靶基因调节和最小化靶切割。

出于以下讨论的目的，参考功能结构域可以是与CRISPR酶缔合的功能结构域或与衔接蛋白缔合的功能结构域。

在本发明的实践中，通过插入可募集可结合至一个或多个不同RNA环或一个或多个不同序列上的衔接蛋白的一个或多个不同RNA环或一个或多个不同序列，可以扩展sgRNA的环，而不与Cas9蛋白冲突。该衔接蛋白可以包括但不限于存在于噬菌体外壳蛋白的多样性内的正交RNA结合蛋白/适配体组合。此类外壳蛋白的列表包括但不限于：Qβ、F2、GA、fr、JP501、M12、R17、BZ13、JP34、JP500、KU1、M11、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、φCb5、φCb8r、φCb12r、φCb23r、7s以及PRR1。这些衔接蛋白或正交RNA结合蛋白可以进一步募集包括一个或多个功能结构域的效应蛋白或融合。在一些实施例中，该功能结构域可以选自下组，该组由以下各项组成：转座酶结构域、整合酶结构域、重组酶结构域、解离酶结构域、转化酶结构域、蛋白酶结构域、DNA甲基转移酶结构域、DNA羟甲基化酶结构域、DNA脱甲基酶结构域、组蛋白乙酰酶结构域、组蛋白脱乙酰酶结构域、核酸酶结构域、阻遏因子结构域、激活因子结构域、核定位信号结构域、转录调节蛋白(或转录复合体募集)结构域、细胞摄取活性相关结构域、核酸结合结构域、抗体呈递结构域、组蛋白修饰酶、组蛋白修饰酶的募集物；组蛋白修饰酶的抑制剂、组蛋白甲基转移酶、组蛋白脱甲基化酶、组蛋白激酶、组蛋白磷酸酶、组蛋白核糖基酶、组蛋白脱核糖基酶、组蛋白泛素化酶、组蛋白去泛素化酶、组蛋白生物素化酶和组蛋白尾蛋白酶。在一些优选实施例中，该功能结构域是一个转录激活结构域，例如但不限于，VP64、p65、MyoD1、HSF1、RTA、SET7/9或组蛋白乙酰转移酶。在一些实施例中，该功能结构域一个转录阻遏结构域，优选KRAB。在一些实施例中，该转录阻遏结构域是SID、或SID的多联体(例如SID4X)。在一些实施例中，该功能结构域是表观遗传修饰结构域，从而提供了表观遗传修饰酶。在一些实施例中，该功能结构域是激活结构域，其可以是P65激活结构域。

在一些实施例中，该一个或多个功能结构域是NLS(核定位序列)或NES(核输出信号)。在一些实施例中，该一个或多个功能结构域是转录激活结构域，其包括VP64、p65、MyoD1、HSF1、RTA、SET7/9和组蛋白乙酰转移酶。就与CRISPR酶缔合的那些而言，在此其他对激活(或激活因子)结构域的参考文献包括任何已知的转录激活结构域，并且确切地为VP64、p65、MyoD1、HSF1、RTA、SET7/9或组蛋白乙酰转移酶。

在一些实施例中，该一个或多个功能结构域是转录阻抑物结构域。在一些实施例中，该转录阻抑物结构域是KRAB结构域。在一些实施例中，该转录阻遏因子结构域是NuE结构域，NcoR结构域、SID结构域或SID4X结构域。

在一些实施例中，一个或多个功能结构域具有一种或多种活性，包括甲基酶活性、脱甲基酶活性、转录激活活性、转录抑制活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性、DNA切割活性、DNA整合活性或核酸结合活性。

在一些实施例中，组蛋白修饰结构域也是优选的。下文讨论了示例性组蛋白修饰结构域。转座酶结构域、HR(同源重组)机构结构域、重组酶结构域和/或整合酶结构域作为本发明的功能结构域也是优选的。在一些实施例中，DNA整合活性包括HR机构结构域、整合酶结构域、重组酶结构域和/或转座酶结构域。在一些实施例中，组蛋白乙酰转移酶是优选的。

在一些实施例中，DNA切割活性是由于核酸酶。在一些实施例中，核酸酶包括Fok1核酸酶。参见，“用于高度特异性基因组编辑的二聚体CRISPR RNA-指导的FokI核酸酶(Dimeric CRISPR RNA-guided FokI nucleases for highly specific genomeediting)”，辛达尔(Shengdar)Q.蔡(Tsai)，尼古拉斯维尼肯斯(Nicolas Wyvekens)，赛德凯特尔(Cyd Khayter)，詹尼弗A.福登(Jennifer A.Foden)，维沙尔撒帕尔(VishalThapar)，迪帕克瑞昂(Deepak Reyon)，马修J.古德温(Mathew J.Goodwin)，马丁J.阿里耶(Martin J.Aryee)，J.基思庄(J.Keith Joung)《自然生物学技术》(NatureBiotechnology)32(6):569-77(2014)，涉及识别延伸的序列并且可以在人类细胞中高效编辑内源基因的二聚体RNA-指导的FokI核酸酶。

在一些实施例中，该一个或多个功能结构域附接至该CRISPR酶，这样使得当结合至该sgRNA和靶标时，该功能结构域处于空间定向，从而允许该功能结构域在其属性功能中起作用。

在一些实施例中，该一个或多个功能结构域附接至该衔接蛋白，这样使得当该CRISPR酶结合至该sgRNA和靶标时，该功能结构域处于空间定向，从而允许该功能结构域在其属性功能中起作用。

在一个方面，本发明提供了如本文讨论的组合物，其中该一个或多个功能结构域经由接头(如本文讨论的GlySer接头)附接至该CRISPR酶或衔接蛋白。

经常通过染色质修饰酶(如组蛋白甲基转移酶(HMT)和脱乙酰基酶(HDAC))介导内源转录阻遏。阻遏组蛋白效应子结构域是已知的，并且下面提供了示例性列表。在该示例性列表中，优选小尺寸的蛋白和功能性截短，以促进有效的病毒包装(例如经由AAV)。一般来说，然而，这些结构域可以包括HDAC、组蛋白甲基转移酶(HMT)、和组蛋白乙酰转移酶(HAT)抑制剂，连同HDAC和HMT募集蛋白。该功能结构域可以是或包括，在一些实施例中，HDAC效应子结构域、HDAC募集物效应子结构域(HDAC Recruiter Effector Domain)、组蛋白甲基转移酶(HMT)效应子结构域、组蛋白甲基转移酶(HMT)募集物效应子结构域、或组蛋白乙酰转移酶抑制剂效应子结构域。

HDAC效应子结构域

因此，本发明所述阻遏因子结构域可以选自组蛋白甲基转移酶(HMT)、组蛋白脱乙酰酶(HDAC)、组蛋白乙酰转移酶(HAT)抑制剂、连同HDAC和HMT募集蛋白。

该HDAC结构域可以是上表那些中的任何一项，即：HDAC8、RPD3、MesoLo4、HDAC11、HDT1、SIRT3、HST2、CobB、HST2、SIRT5、Sir2A、或SIRT6。。

在一些实施例中，该功能结构域可以是HDAC募集物效应子结构域。优选的实例包括在下表中的那些，即：MeCP2、MBD2b、Sin3a、NcoR、SALL1、RCOR1。在本发明实例中示例了NcoR，并且尽管优选，但是设想该类别中的其他也是有用的。

HDAC募集物效应子结构域的表

在一些实施例中，该功能结构域可以是甲基转移酶(HMT)效应子结构域。优选的实例包括在下表中的那些，即：NUE、vSET、EHMT2/G9A、SUV39H1、dim-5、KYP、SUVR4、SET4、SET1、SETD8、以及TgSET8。在本发明实例中示例了NUE，并且尽管优选，但是设想该类别中的其他也是有用的。

组蛋白甲基转移酶(HMT)效应子结构域的表

在一些实施例中，该功能结构域可以是组蛋白甲基转移酶(HMT)募集物效应子结构域。优选的实例包括在下表中的那些，即：Hp1a、PHF19、以及NIPP1。

组蛋白甲基转移酶(HMT)募集物效应子结构域的表

在一些实施例中，该功能结构域可以是组蛋白乙酰转移酶抑制剂效应子结构域。优选的实例包括在下表中列出的SET/TAF-1β。

组蛋白乙酰转移酶抑制剂效应子结构域的表

除了启动子或启动子近侧组件之外，还优选的是靶向内源(调节)控制组件(如增强子以及沉默子)。因此，除了靶向启动子之外，本发明还可以用于靶向内源控制组件(包括增强子以及沉默子)。这些控制组件可以位于转录起始位点(TSS)的上游和下游，从距离TSS200bp开始至100kb。对已知控制组件的靶向可以用于活化或阻遏感兴趣的基因。在一些情况下，单个控制组件可以影响多个靶基因的转录。对单个控制组件的靶向因此可以用于同时控制多个基因的转录。

另一方面，对假定的控制组件的靶向(例如，通过对假定的控制组件连同该组件周围200bp直至100kB的区域进行铺瓦(tiling))可以用作一种验证此类组件(通过测量感兴趣的基因的转录)或检测新颖控制组件(例如，通过对感兴趣的基因的TSS上游和下游的100kb进行铺瓦)的手段。此外，对假定的控制组件的靶向在理解疾病的遗传原因的情况下可以是有用的。与疾病表型关联的许多突变和常见的SNP变体位于编码区之外。用本文描述的活化或阻遏系统对此类区域靶向后可以接着读出a)一组假定的靶标(例如，一组位于非常接近于控制组件处的基因)或b)通过例如RNAseq或微阵列进行全转录组读出的转录。这将允许鉴定疾病表型中所涉及的可能候选基因。此类候选基因可以用作新颖的药物靶标。

本文中提及了组蛋白乙酰转移酶(HAT)抑制剂。然而，在一些实施例中，一种替代方案是，该一个或多个功能结构域包括乙酰转移酶，优选组蛋白乙酰转移酶。这些在表观基因组学领域中是有用的，例如在探询表观基因组的方法中。探询表观基因组的方法可以包括，例如，靶向表观基因组序列。靶向表观基因组序列可以包括该指导被引导至表观基因组靶序列。表观基因组靶序列可以包括，在一些实施例中，包括启动子、沉默子或增强子序列。

连接到如在此描述的CRISPR-Cas酶，优选失活的Cas，更优选失活的Cas9，上的功能结构域靶向表观基因组序列的用途可以用于活化或阻遏启动子、沉默子或增强子。

乙酰转移酶的实例是已知的，但在一些实施例中，可以包括组蛋白乙酰转移酶。在一些实施例中，组蛋白乙酰转移酶可以包括人类乙酰转移酶p300的催化核心(哲帕斯卡尔(Gerbasch)和雷迪(Reddy)，《自然生物技术》(Nature Biotech)2015年4月6日)。

在一些优选实施例中，该功能结构域连接到失活的Cas9酶上以靶向并且活化表观基因组序列，如启动子或增强子。还可以提供针对此类启动子或增强子的一种或多种指导来引导CRISPR酶与此类启动子或增强子的结合。

在此相对于功能结构域与CRISPR酶或衔接蛋白的缔合使用术语“与……缔合”。关于一种分子相对于另一种分子如何“缔合”，例如在衔接蛋白与功能结构域之间、或在CRISPR酶与功能结构域之间进行使用。在这样的蛋白质-蛋白质相互作用的情况下，可以按抗体识别表位的方式就识别而论看待这种缔合。可替代地，一种蛋白可以经由这两种蛋白的融合物与另一蛋白缔合，例如一个亚基融合至另一亚基。融合典型地通过将一种蛋白的氨基酸序列添加至另一蛋白的氨基酸序列上而发生，例如经由一起剪接编码每种蛋白或亚基的核苷酸序列。可替代地，这基本上可以被视为两个分子之间的结合或直接连接，如融合蛋白。在任何情况下，融合蛋白可以在感兴趣的两个亚基之间(即酶与功能结构域之间或衔接蛋白与功能结构域之间)包括接头。因此，在一些实施例中，CRISPR酶或衔接蛋白通过结合至其上而与功能结构域缔合。在其他实施例中，CRISPR酶或衔接蛋白任选地经由接头而与功能结构域缔合，因为这两者被融合到一起。

功能结构域或融合蛋白的附接可以经由接头，例如挠性甘氨酸-丝氨酸(GlyGlyGlySer)或(GGGS)₃，或者刚性α-螺旋接头如(Ala(GluAlaAlaAlaLys)Ala)。优选在本文中使用接头(如(GGGGS)3)，以将蛋白或肽结构域分开。(GGGGS)₃是优选的，因为是相对较长的接头(15个氨基酸)。甘氨酸残基最具挠性并且丝氨酸残基提高了接头在蛋白质外的机会。(GGGGS)₆、(GGGGS)₉或(GGGGS)₁₂可以优选用作替代物。其他优选的替代物是(GGGGS)₁、(GGGGS)₂、(GGGGS)₄、(GGGGS)₅、(GGGGS)₇、(GGGGS)₈、(GGGGS)₁₀或(GGGGS)₁₁。替代接头是可获得的，但是高度挠性接头被认为最佳地起作用，以允许有最大机会将Cas9的2部分聚在一起并且因此重构Cas9活性。一种替代方案是核质蛋白的NLS可以用作接头。例如，接头还可以用在Cas9与任何功能结构域之间。再一次，这里可以使用(GGGGS)₃接头(或其6、9或12个重复形式)，或者核质蛋白的NLS可以用作Cas9与功能结构域之间的接头。

饱和诱变

关于通常使用的CRISPR-Cas系统，提及的是包括专利申请、专利在内的文献，并且可以如在那些文献中使用本披露通篇引用作为本发明实施例的专利公开。可以将一种或多种CRISPR-Cas系统用于进行基因组座位的饱和或深度扫描诱变结合细胞表型—例如用于确定关键最小特征和基因表达、抗药性、以及疾病逆转所需的功能组件的离散脆弱性。通过饱和或深度扫描诱变意指将基因组座位之内的每个或基本上每个DNA碱基切割。可以将CRISPR-Cas指导RNA的文库引入细胞群中。可以引入该文库，这样使得每个细胞接收到单个指导RNA(sgRNA)。在通过转导如在此所描述的病毒载体而引入该文库的情况下，使用低的感染复数(MOI)。该文库可以包括靶向基因组座位(原型间隔子邻近基序)(PAM)序列上游的每个序列的sgRNA。对于该基因组座位内每1000个碱基对，该文库可以包括PAM序列上游的至少100个不重叠基因组序列。该文库可以包括靶向至少一种不同PAM序列上游序列的sgRNA。该一种或多种CRISPR-Cas系统可以包括多于一种Cas蛋白。可以使用如在此所描述的任何Cas蛋白，包括直系同源物或识别不同PAM序列的工程化Cas蛋白。对于sgRNA的脱靶位点的频率可以小于500。可以产生脱靶得分来选择具有最少脱靶位点的sgRNA。可以通过使用在单个实验中靶向相同部位的sgRNA来确认确定为与在sgRNA靶部位处的切割关联的任何表型。还可以通过使用如在此所描述的切口酶Cas9，以及靶向感兴趣的基因组位点的两个sgRNA进行靶部位的验证。不被理论所束缚，如果在验证实验中观察到表型发生变化，那么靶部位是真正命中。

该基因组座位可以包括至少一个连续基因组区域。该至少一个连续基因组区域可以包括高达整个基因组。该至少一个连续基因组区域可以包括基因组的功能组件。该功能组件可以是在非编码区、编码基因、内含子区域、启动子、或增强子内。该至少一个连续基因组区域可以包括至少1kb、优选至少50kb的基因组DNA。该至少一个连续基因组区域可以包括转录因子结合位点。该至少一个连续基因组区域可以包括DNase I超敏反应的区域。该至少一个连续基因组区域可以包括转录增强子或抑制子组件。该至少一个连续基因组区域可以包括富集了表观遗传标签的位点。该至少一个连续基因组DNA区域可以包括表观遗传隔离子。该至少一个连续基因组区域可以包括两个或更多个以物理方式相互作用的连续基因组区域。可以通过‘4C技术’来确定相互作用的基因组区域。4C技术允许以对于以物理方式与选择的DNA片段相互作用的DNA区段的无偏性方式筛选整个基因组，如在赵(Zhao)等人，((2006)《自然遗传学》(Nat Genet)38,1341-7)和在美国专利8,642,295中，将两者通过引用以其全文结合在此。该表观遗传标签可以是组蛋白乙酰化、组蛋白甲基化、组蛋白泛素化、组蛋白磷酸化、DNA甲基化、或对其缺乏。

用于饱和或深度扫描诱变的一种或多种CRISPR-Cas系统可以用于细胞群中。该一种或多种CRISPR-Cas系统可以用于真核细胞中，包括但不限于哺乳动物以及植物细胞。该细胞群可以是原核细胞。该真核细胞群可以是胚胎干(ES)细胞、神经元细胞、上皮细胞、免疫细胞、内分泌细胞、肌细胞、红细胞、淋巴细胞、植物细胞、或酵母细胞群。

在一个方面，本发明提供了用于筛选与表型变化关联的功能组件的方法。可以将该文库引入到被适配成包含Cas蛋白的细胞群中。基于表型，可以将这些细胞分选进至少两个组。表型可以是基因的表达、细胞生长、或细胞活力。对存在于每个组中的指导RNA的相对表示进行确定，由此通过存在于每个组中的指导RNA的表示来确定与表型变化关联的基因组位点。表型变化可以是感兴趣的基因表达的变化。可以是上调、下调、或敲除感兴趣的基因。可以将这些细胞分选进高表达组和低表达组。该细胞群可以包括用于确定表型的报告基因构建体。该报告基因构建体可以包括检测标记。可以通过使用检测标记分选细胞。

在另一个方面，本发明提供了用于筛选与对化合物的抗性关联的基因组位点的方法。该化合物可以是药物或杀有害生物剂。可以将该文库引入到被适配成包含Cas蛋白的细胞群中，其中每个细胞群包含不多于一种指导RNA；用该化合物处理该细胞群；并且相比于早期时间点，在用该化合物处理之后稍后的时间点确定指导RNA的表示，由此通过指导RNA的富集来确定与对该化合物的抗性关联的基因组位点。可以通过深度测序方法来确定sgRNA的表示。

在本发明的实践中是有用的，参考：标题为通过Cas9介导的在原位饱和诱变的BCL11A增强子分解(BCL11A enhancer dissection by Cas9-mediated in situsaturating mutagenesis)的文章，康沃尔(Canver)，M.C.、史密斯(Smith)，E.C.、谢尔(Sher)，F.、皮内洛(Pinello)，L.、山加纳(Sanjana)，N.E.、沙勒姆(Shalem)，O.、陈(Chen)，D.D.、斯库普(Schupp)，P.G.、维嘉穆(Vinjamur)，D.S.、加西亚(Garcia)，S.P.、卢克(Luc)，S.、栗田(Kurita)，R.、中村(Nakamura)，Y.、藤原(Fujiwara)，Y.、梅达(Maeda)，T.、袁(Yuan)，G.、张(Zhang)，F.、奥尔金(Orkin)，S.H.、和鲍尔(Bauer)，D.E.DOI:10.1038/nature15521，在线公开于2015年9月16日，该文章通过引用结合在此，并且简要讨论如下：

康沃尔(Canver)等人描述了新颖的合并CRISPR-Cas9指导RNA文库以进行人类和小鼠BCL11A红系增强子的原位饱和诱变，这些增强子先前被鉴定为与胎儿血红蛋白(HbF)水平相关的增强子，并且其小鼠直向同源物是红系BCL11A表达所必要的。这种方法揭示了关键最小特征和这些增强子的离散脆弱性。通过原代人类祖细胞和小鼠基因转移的编辑，诸位作者验证了BCL11A红系增强子作为针对HbF再诱导的靶标。诸位作者生成了告知治疗性基因组编辑的详细增强子图。

使用CRISPR-Cas系统以修饰细胞或生物体的方法

在一些实施例中，本发明包括一种修饰细胞或生物体的方法。该细胞可以是原核细胞或真核细胞。该细胞可以是哺乳动物细胞。该哺乳动物细胞可以是非人类灵长动物、牛、猪、啮齿动物或小鼠细胞。该细胞可以是非哺乳动物真核细胞，如家禽、鱼类或虾。该细胞还可以是植物细胞。该植物细胞可以是作物植物(如木薯、玉米、高粱、小麦、或水稻)的细胞。该植物细胞还可以是藻类、乔木或蔬菜的细胞。通过本发明引入到细胞中的修饰可以使得细胞和细胞子代被改变以便改进生物制品(如抗体、淀粉、醇或其他所希望的细胞产出)的生产。通过本发明引入到细胞中的修饰可以使得细胞和细胞子代包括改变所生产的生物制品的变化。

该系统可以包含一种或多种不同的载体。在本发明的一个方面，该Cas蛋白经密码子优化以便在所希望的细胞类型，优先真核细胞，优选哺乳动物细胞或人类细胞中表达。

CRISPR系统可以用于植物中

一种或多种CRISPR-Cas系统(例如，单个或多重)可以与作物基因组学的最新进展结合使用。这样的一种或多种CRISPR-Cas系统可以用于进行有效并且且符合成本效益的植物基因或基因组探询或编辑或操纵，例如，以便快速研究和/或选择和/或探询和/或比较和/或操纵和/或转化植物基因或基因组；例如，以为一种或多种植物产生、鉴定、开发、优化、或赋予一种或多种性状或一种或多种特征或者以转化植物基因组。因此，可以改进植物、具有性状或特征的新组合的新植物的生产、或具有增强的性状的新植物的生产。关于定点整合(SDI)或基因编辑(GE)或任何近反向育种(Near Reverse Breeding)(NRB)或反向育种(RB)技术中的植物，可以使用这样的一种或多种CRISPR-Cas系统。关于使用植物中的CRISPR-Cas系统，提及的是亚利桑那大学网站，“CRISPR-PLANT”(http://www.genome.arizona.edu/crispr/)(由宾州州立大学(Penn State)和AGI提供支持)。本发明的实施例可以用于植物中的基因组编辑，或其中RNAi或类似基因组编辑技术先前已经被使用；参见，例如，涅克拉索夫(Nekrasov)，“植物基因组编辑变得容易：使用CRISPR/Cas系统在模式和作物植物中的靶定诱变(Plant genome editing made easy:targetedmutagenesis in model and crop plants using the CRISPR/Cas system)”，植物方法(Plant Methods)，2013,9:39(doi:10.1186/1746-4811-9-39)；布鲁克斯(Brooks)，“使用CRISPR/Cas系统在第一代西红柿在有效基因编辑(Efficient gene editing in tomatoin the first generation using the CRISPR/Cas9system)”，《植物生理学》(PlantPhysiology)，2014年9月，pp 114.247577；单(Shan)，“使用CRISPR-Cas系统对作物植物进行定向基因组修饰(Targeted genome modification of crop plants using a CRISPR-Cas system)”，《自然生物技术》(Nature Biotechnology)，31,686-688(2013)；冯(Feng)，“使用CRISPR/Cas系统在植物中的有效基因组编辑(Efficient genome editing inplants using a CRISPR/Cas system)”，《细胞研究》(Cell Research)(2013)23:1229-1232.doi:10.1038/cr.2013.114；在线公开于2013年8月20日；谢(Xie)，“使用CRISPR-Cas系统在植物中RNA指导的基因组编辑(RNA-guided genome editing in plants using aCRISPR-Cas system)”，《分子植物》(Mol Plant.).2013年11月；6(6):1975-83.doi:10.1093/mp/sst119。电子版20138月17日；徐(Xu)，“使用根癌农杆菌介导的CRISPR-Cas系统在水稻中进行基因靶向(Gene targeting using the Agrobacterium tumefaciens-mediated CRISPR-Cas system in rice)”，《水稻》(Rice)2014,7:5(2014)；周(Zhou)等人，“在异交多年生木本植物胡杨中针对双等位基因CRISPR突变开发SNP揭示了4-香豆酸：CoA连接酶特异性与冗余(Exploiting SNPs for biallelic CRISPR mutations in theoutcrossing woody perennial Populus reveals4-coumarate:CoA ligase specificityand Redundancy)”，《新植物学家》(New Phytologist)(2015)(论坛)1-4(仅在www.newphytologist.com在线可得)；卡林多(Caliando)等人，“使用CRISPR装置在宿主基因组中稳定进行的靶向向DNA降解(Targeted DNA degradation using a CRISPR devicestably carried in the host genome)”，《自然通讯》(NATURE COMMUNICATIONS)6:6989，DOI:10.1038/ncomms7989、www.nature.com/naturecommunications DOI:10.1038/ncomms7989；美国专利号6,603,061-农杆菌介导的植物转化方法(Agrobacterium-Mediated Plant Transformation Method)；美国专利号7,868,149-植物基因组序列及其用途(Plant Genome Sequences and Uses Thereof)以及US 2009/0100536-转具有增强的农艺性状的基因植物(Transgenic Plants with Enhanced Agronomic Traits)，将每者的所有内容和披露通过引用以其全文结合在此。在本发明的实践中，莫雷尔(Morrell)等人“作物基因组学：进展与应用(Crop genomics:advances and applications)”，《遗传学自然评论》(Nat Rev Genet.).2011年12月29日；13(2):85-96；将其各自通过引用并入本文，包括关于本文的实施例如何可以就植物而使用。因此，加上必要的变更，此处对动物细胞的提及也可适用植物细胞，除非另外是显然的；并且，可以将具有降低的脱靶效应的本文所述的酶和采用此类酶的系统在植物应用中使用，包括在此提及的那些。

菅野(Sugano)等人，《植物细胞生理学》(Plant Cell Physiol.2014年3月；55(3):475-81.doi:10.1093/pcp/pcu014。电子版2014年1月18日)报道了将CRISPR/Cas9应用于苔类地钱L.(Marchantia polymorpha L.)的靶向诱变中，其已经被作为用于研究陆生植物进化的模式物种。对地钱(M.polymorpha)的U6启动子进行鉴定并克隆以表达gRNA。该gRNA的靶序列被设计为破坏编码地钱(M.polymorpha)的植物生长素响应因子1(ARF1)的基因。使用土壤杆菌介导的转化，菅野(Sugano)等人在地钱(M.polymorpha)的配子体世代中分离了稳定的突变体。使用花椰菜花叶病毒35S或地钱(M.polymorpha)EF1α启动子，来实现基于CRISPR/Cas9的体内定点诱变，以表达Cas9。显示出植物生长素抗性表型的分离的突变个体不是嵌合的。此外，通过无性繁殖T1植物来产生稳定的突变体。使用基于CRIPSR/Cas9的靶向诱变，易于建立多个arf1等位基因。菅野(Sugano)等人的这些方法可以应用于本发明的CRISPR Cas系统。

卡巴迪(Kabadi)等人(《核酸研究》(Nucleic Acids Res.)2014年10月29日；42(19):e147.doi:10.1093/nar/gku749。电子版2014年8月13日)开发了单个慢病毒系统以表达Cas9变体，报告基因以及多至四个来自通过方便的金门(Golden Gate)克隆方法并入到载体中的独立RNA聚合酶III启动子的sgRNA。每个sgRNA充分表达并且可以介导在永生化和原代人类细胞中的多重基因编辑和持续转录活化。卡巴迪(Kabadi)等人的这些方法可以应用于本发明的CRISPR Cas系统。

林(Ling)等人，(《BMC植物生物学》(BMC Plant Biology)，2014,14:327)开发了基于pGreen或pCAMBIA骨架连同gRNA设定的CRISPR/Cas9二元载体。除了BsaI以外，这种工具箱(toolkit)不需要限制性内切酶以产生具有玉米密码子优化的Cas9以及在少至一个克隆步骤中高效率的一种或多种gRNA的最终构建体。使用玉米原生质体、转基因玉米株系、和转基因拟南芥属株系，对该工具箱进行验证并且显示其展示出高效率和特异性。更重要的是，使用这种工具箱，在T1代的转基因幼苗中检测出三个拟南芥基因的定向突变。此外，该多重基因突变可以被下一代遗传。(指导RNA)模块载体作为工具箱设置用于植物的多元基因组编辑。林(Lin)等人的工具箱可以应用于本发明的CRISPR Cas系统。

用于经由CRISPR/Cas9靶向植物基因组编辑的方案也可以在系列分子生物学方法(Methods in Molecular Biology)的第1284卷，第239-255页(2015年2月10日)中获得。涉及用于设计、构建、并且评估使用拟南芥和本氏烟原生质体作为模式细胞系统、用于植物密码子优化的Cas9(pcoCas9)介导的基因组编辑的双gRNA的详细程序。也讨论了将该CRISPR/Cas9系统应用于在全株中产生靶向的基因组修饰的策略。该章节中的方案可以适用于本发明的CRISPR Cas系统。

马(Ma)等人(《分子植物》(Mol Plant.)2015年8月，3；8(8):1274-84.doi:10.1016/j.molp.2015.04.007)报道了稳健的CRISPR/Cas9载体系统，其利用植物密码子优化的Cas9基因，以便在单子叶植物和双子叶植物中进行方便和高效的多元基因组编辑。马(Ma)等人设计了基于PCR的程序以迅速产生多个sgRNA表达盒，其可以通过金门(GoldenGate)连接或吉布森组装在一轮克隆中装配进二元CRISPR/Cas9载体中。使用这种系统，马(Ma)等人编辑了稻的46靶位点，突变率为平均85.4％，主要在双等位基因和纯合状态中。马(Ma)等人提供了通过同时靶向基因家族的多个(多达八个)成员、生物合成途径中的多基因、或单个基因中的多个位点，T0稻和T1拟南芥属植物中功能缺失基因突变的实例。马(Ma)等人这些方法可以适用于本发明的CRISPR Cas系统。

洛德(Lowder)等人(《植物生理学》(Plant Physiol.2015年8月21日，pii:pp.00636.2015)还开发了使得能够在植物中多元基因组编辑和转录调控表达、沉默或非编码基因的CRISPR/Cas9工具箱。该工具箱为研究者提供了方案和试剂以便使用金门和通路(Gatewayge)克隆方法，为单子叶植物和双子叶植物快速并且有效地组装功能性CRISPR/Cas9T-DNA构建体。它伴随一整套能力发生，包括植物内源基因的多元基因编辑以及转录激活或阻遏。基于T-DNA的转化技术是对现代植物生物技术、遗传学、分子生物学以及生理学很重要。因此，申请人开发了一种用于组装Cas9(WT、切口酶或dCas9)和一种或多种gRNA进入感兴趣的T-DNA目的载体中的方法。该组装方法基于金门(Golden Gate)组装和多位点Gateway重组二者。组装需要三种模块。第一模块是Cas9入门载体，其包含无启动子Cas9或其衍生物基因，其侧翼为attL1和attR5位点。第二模块是gRNA入门载体，其包含入门gRNA表达盒，其侧翼为attL5和attL2位点。第三模块包括包含attR1-attR2的目的T-DNA载体，其提供用于Cas9表达的启动子的选择。洛德(Lowder)等人的工具箱可以应用于本发明的CRISPRCas系统。

彼得森(Petersen)(“对于精确乙二醇工程化植物(Towards precisely glycolengineered plants)”，2015年丹麦植物生物技术年会(Plant Biotech Denmark Annualmeeting 2015)，哥本哈根，丹麦)开发了一种使用CRISPR/Cas9以工程化拟南芥中的基因组改变，例如，以乙二醇工程化拟南芥以便产生具有所希望的翻译后修饰的蛋白和产品的方法。赫布尔斯达普(Hebelstrup)等人(《植物科学前沿》(Front Plant Sci.)2015年4月23日；6:247)概述了在植物中淀粉生物工程，由此提供表达淀粉修饰酶并直接产生通常是通过工业化学和/或物理处理淀粉制成的产品的作物。彼得森(Petersen)和赫布尔斯达普(Hebelstrup)的方法可以应用于本发明的CRISPR-Cas9系统。

在一个有利的实施例中，植物可以是树。本发明还可以利用在此披露的CRISPRCas系统以用于草本系统(参见，例如，贝勒哈吉(Belhaj)等人，《植物方法》(PlantMethods)，9:39，以及哈里森(Harrison)等人，《基因&发育》(Genes&Development)，28:1859-1872)。在一个特别有利的实施例中，本发明的CRISPR Cas系统可以靶向树的单核苷酸多态性(SNP)(参见，例如，周(Zhou)等人，《新植物学家》(New Phytologist)，第208卷第2期，第298-301页，2015年10月)。在周(Zhou)等人的研究中，诸位作者使用4-香豆酸：辅酶A连接酶(4CL)基因家族作为案例研究在木本多年生杨属植物中应用CRISPR Cas系统，并且对于两个被靶向的4CL基因实现了100％突变效率，检查了携带双等位基因修饰的每个转化子。在周(Zhou)等人的研究中，CRISPR/Cas9系统对单核苷酸多态性(SNP)高度敏感，因为用于第三4CL基因的切割由于靶序列中的SNP而被消除。

周(Zhou)等人(《新植物学家》(New Phytologist)，第208卷第2期，第298-301页，2015年10月)的这些方法可以适用于如下的本发明。与木质素和类黄酮生物合成关联的两个4CL基因(4CL1和4CL2)分别被靶向用于CRISPR/Cas9编辑。常规地用于转化的欧洲山杨×阿尔巴(alba)克隆717-1B4与基因组测序的毛果杨不同。因此，就由参考基因组设计的4CL1和4CL2gRNA用内部717RNA-Seq数据进行探询，以确保不存在SNP，这可以限制Cas效率。针对4CL5设计的第三gRNA，4CL1的基因组重复，也包括在内。对应的717序列在每个等位基因附近/在PAM之内具有一个SNP，据期两者均通过4CL5-gRNA消除靶向。所有三种gRNA靶位点被定位在第一外显子之内。对于717转化，gRNA从苜蓿属U6.6启动子中表达，连同在二元载体的CaMV 35S启动子的控制下的人类密码子优化的Cas。用仅Cas载体进行的转化可以充当对照。使随机选择的4CL1和4CL2株系均经受扩增子测序。然后，加工数据，并且在所有情况下证实双等位基因突变。

在植物中，病原体常常是宿主特异性的。例如，西红柿尖镰孢菌西红柿专化型(Fusarium oxysporum f.sp.lycopersici)引起西红柿枯萎病，而且只攻击西红柿，并且香石竹尖镰孢禾柄锈菌小麦专化型(F.oxysporum f.dianthii Puccinia graminisf.sp.tritici)只攻击小麦。植物具有抵抗大多数病原体的现有的和诱导性的防御。跨植物代的突变和重组事件导致产生敏感性的遗传变异性，特别是当病原体以比植物更高的频率繁殖时。在植物中可以存在非宿主抗性，例如，该宿主和病原体是不相容的。还可以存在水平抗性，例如典型地由许多基因控制的针对所有种的病原体的部分抗性，以及垂直抗性，例如典型地由很少的基因控制的针对病原体的某些种而不是其他种的完全抗性。在基因对基因水平中，植物和病原体一起演化，并且在一者中的遗传变化使在另一者中的变化平衡。因此，使用自然变异，育种者针对产率、质量、均匀性、耐性、抗性将最有用的基因进行结合。抗性基因的来源包括天然或外来品种、传家宝品种(Heirloom Varieties)、近缘野生植物、以及诱导的突变，例如用诱变剂处理植物材料。利用本发明，向植物育种者提供了一种新的诱导突变的工具。因此，本领域的技术人员可以分析抗性基因的来源的基因组，并且在具有所希望的特征或性状的品种方面，采用本发明来诱导抗性基因的发生，这样具有比先前的诱变剂更好的精确性，并且因此加速并改良植物育种计划。

应用于植物和酵母菌；应用于生物燃料

将Cas9-CRISPR系统应用于植物和酵母菌

定义：

一般来说，术语“植物”涉及植物界中任何不同的光合、真核、单细胞或多细胞生物，其特征性地通过细胞分裂生长，包含叶绿体，并且具有由纤维素组成的细胞壁。术语植物涵盖单子叶植物和双子叶植物。确切地说，这些植物旨在包括但不限于被子植物和裸子植物，如阿拉伯树胶、苜蓿、苋菜、苹果、杏、朝鲜蓟、白蜡树、芦笋、鳄梨、香蕉、大麦、豆类、甜菜、桦树、山毛榉、黑莓、蓝莓、西兰花、抱子甘蓝、卷心菜、油菜、哈密瓜、胡萝卜、木薯、花椰菜、雪松、谷类、芹菜、栗子、樱桃、大白菜、柑橘、克莱门氏小柑橘、三叶草、咖啡、玉米、棉花、豇豆、黄瓜、柏树、茄子、榆树、菊苣、桉树、茴香、无花果、冷杉、天竺葵、葡萄、葡萄柚、落花生、地樱桃、树胶铁杉、山核桃木、羽衣甘蓝、奇异果、甘蓝、落叶松、莴苣、韭、柠檬、青柠、洋槐、松树、孔雀草、玉米、芒果、枫树、甜瓜、粟、蘑菇、芥菜、坚果、橡树、燕麦、油棕、秋葵、洋葱、橙、观赏植物或花或树木、木瓜、棕榈、荷兰芹、欧洲防风草、豌豆、桃、花生、梨、泥炭(peat)、胡椒、柿子、木豆、松树、菠萝、大蕉、李子、石榴、马铃薯、南瓜、菊苣、萝卜、油菜籽、覆盆子、稻、黑麦、高粱、红花、黄华柳、大豆、菠菜、云杉、南瓜属植物果实、草莓、糖甜菜、甘蔗、向日葵、甘薯、甜玉米、橘子、茶、烟草、西红柿、树类、黑小麦、草坪草、芜菁、藤本植物、胡桃、豆瓣菜、西瓜、小麦、山药、紫杉、以及西葫芦。术语植物还涵盖藻类，藻类主要是光能自养生物，它们主要一致缺少根、叶以及其他表征高等植物的器官。

使用如在此描述的CRISPR/Cas9系统用于基因组编辑的方法可以用于赋予基本上任何植物所希望的性状。针对所希望的生理学以及农学特征，可以使用本披露的核酸构建体和以上所述的各种转化方法对多种多样的植物和植物细胞系统进行工程化。在优选的实施例中，用于工程化的靶植物和植物细胞包括，但不限于，那些单子叶植物和双子叶植物，例如作物(包括谷类作物(例如，小麦、玉米、稻、粟、大麦)、果实作物(例如，西红柿、苹果、梨、草莓、橙)、饲料作物(例如，苜蓿)、根用蔬菜作物(例如，胡萝卜、马铃薯、甜菜、山药)、叶类蔬菜作物(例如，莴苣、菠菜)；开花植物(例如，矮牵牛、玫瑰、菊花)、松柏植物以及松树(例如，松杉、云杉)；植物除污中所使用的植物(例如，重金属累积植物)；油料作物(例如，向日葵、油菜种子)和用于实验目的的植物(例如，拟南芥属)。因此，这些方法和CRISPR-Cas系统可以用于遍及广泛范围的植物，像例如与属于以下目的双子叶植物：木兰目(Magniolales)、八角茴香目(Illiciales)、樟目(Laurales)、胡椒目(Piperales)、马览铃目(Aristochiales)、睡莲目(Nymphaeales)、毛茛目(Ranunculales)、Papeverales、瓶子草科(Sarraceniaceae)、昆蓝树目(Trochodendrales)、金缕梅目(Hamamelidales)、Eucomiales、莱脱纳目(Leitneriales)、杨梅目(Myricales)、壳斗目(Fagales)、木麻黄目(Casuarinales)、石竹目(Caryophyllales)、肉穗果目(Batales)、蓼目(Polygonales)、蓝雪目(Plumbaginales)、五桠果目(Dilleniales)、山茶目(Theales)、锦葵目(Malvales)、荨麻目(Urticales)、玉蕊目(Lecythidales)、紫堇目(Violales)、杨柳目(Salicales)、白花菜目(Capparales)、欧石楠目(Ericales)、Diapensales、柿树目(Ebenales)、报春花目(Primulales)、蔷薇目(Rosales)、豆目(Fabales)、川苔草目(Podostemales)、小二仙草目(Haloragales)、桃金娘目(Myrtales)、山茱萸目(Cornales)、睡莲目(Proteales)、檀香目(San tales)、大花草目(Rafflesiales)、卫矛目(Celastrales)、大戟目(Euphorbiales)、鼠李目(Rhamnales)、无患子目(Sapindales)、胡桃目(Juglandales)、牻牛儿苗目(Geraniales)、远志目(Polygalales)、伞形目(Umbellales)、龙胆目(Gentianales)、花葱目(Polemoniales)、唇形目(Lamiales)、车前草目(Plantaginales)、玄参目(Scrophulariales)、桔梗目(Campanulales)、茜草目(Rubiales)、川绿断目(Dipsacales)、以及菊目(Asterales)；这些方法和CRISPR-Cas系统可以与单子叶植物一起使用，如属于以下目的那些植物：泽泻目(Alismatales)、水鳖目(Hydrocharitales)、茨藻目(Najadales)、霉草目(Triuridales)、鸭跖草目(Commelinales)、谷精草目(Eriocaulales)、帚灯草目(Restionales)、禾本目(Poales)、灯芯草目(Juncales)、莎草科(Cyperales)、香蒲目(Typhales)、凤梨目(Bromeliales)、姜目(Zingiberales)、槟榔目(Arecales)、环花目(Cyclanthales)、露兜树目(Pandanales)、天南星目(Arales)、(Lilliales)、以及兰目(Orchid ales)，或与属于裸子植物的植物一起使用，例如属于以下目的那些植物：松目(Pinales)、银杏目(Ginkgoales)、苏铁目(Cycadales)、南洋杉目(Araucariales)、Cupressales以及麻黄目(Gnetales)。

在此描述的CRISPR/Cas9系统和使用方法可以用于遍及广泛范围的植物物种，这些植物物种包括在以下双子叶植物、单子叶植物或裸子植物属的非限制性列表：颠茄属(Atropa)、油丹属(Alseodaphne)、槚如树属(Anacardium)、落花生属(Arachis)、琼楠属(Beilschmiedia)、芸苔属(Brassica)、红花属(Carthamus)、木防己属(Cocculus)、巴豆属(Croton)、黄瓜属(Cucumis)、柑橘属(Citrus)、西瓜属(Citrullus)、辣椒属(Capsicum)、长春花属(Catharanthus)、椰子属(Cocos)、咖啡属(Coffea)、南瓜属(Cucurbita)、胡萝卜属(Daucus)、杜氏木属(Duguetia)、花菱草属(Eschscholzia)、无花果属(Ficus)、草莓属(Fragaria)、海罂粟属(Glaucium)、大豆属(Glycine)、棉属(Gossypium)、向日葵属(Helianthus)、橡胶树属(Hevea)、天仙子属(Hyoscyamus)、莴苣属(Lactuca)、卷枝藤属(Landolphia)、亚麻属(Linum)、木姜子属(Litsea)、西红柿属(Lycopersicon)、羽扇豆属(Lupinus)、木薯属(Manihot)、马郁兰属(Majorana)、苹果属(Malus)、苜蓿属(Medicago)、烟草属(Nicotiana)、齐墩果属(Olea)、银胶菊属(Parthenium)、罂粟属(Papaver)、鳄梨属(Persea)、菜豆属(Phaseolus)、黄连木属(Pistacia)、豌豆属(Pisum)、梨属(Pyrus)、李属(Prunus)、萝卜属(Raphanus)、蓖麻属(Ricinus)、千里光属(Senecio)、汉防己属(Sinomenium)、千金藤属(Stephania)、欧白芥属(Sinapis)、茄属(Solanum)、可可属(Theobroma)、三叶草属(Trifolium)、胡芦巴属(Trigonella)、蚕豆属(Vicia)、长春花属(Vinca)、葡萄属(Vilis)、以及豇豆属(Vigna)；以及以下属：葱属(Allium)、须芒草属(Andropogon)、画眉草属(Aragrostis)、天门冬属(Asparagus)、燕麦属(Avena)、狗牙根属(Cynodon)、油棕属(Elaeis)、羊茅属(Festuca)、黑麦草属(Festulolium)、Heterocallis、大麦属(Hordeum)、浮萍属(Lemna)、黑麦草属(Lolium)、芭蕉属(Musa)、稻属(Oryza)、黍属(Panicum)、Pannesetum、梯牧草属(Phleum)、早熟禾属(Poa)、黑麦属(Secale)、高粱(Sorghum)、小麦属(Triticum)、玉蜀黍属(Zea)、冷杉属(Abies)、杉木属(Cunninghamia)、麻黄属(Ephedra)、云杉属(Picea)、松属(Pinus)、以及黄杉属(Pseudotsuga)。

这些CRISPR/Cas9系统和使用方法还可以用于遍及广泛范围的“藻类”或“藻类细胞”；包括例如选自若干真核生物门的藻类，其包括红藻植物门(Rhodophyta)(红藻)、绿藻门(Chlorophyta)(绿藻)、褐藻门(Phaeophyta)(褐藻)、硅藻门(Bacillariophyta)(硅藻)、真眼点藻纲(Eustigmatophyta)以及沟鞭藻类连同原核门蓝藻门(Cyanobacteria)(蓝绿藻)。术语“藻类”包括例如选自下述的藻类：双眉藻属(Amphora)、鱼腥藻属(Anabaena)、Anikstrodesmis、丛粒藻属(Botryococcus)、角毛藻属(Chaetoceros)、衣藻属(Chlamydomonas)、小球藻属(Chlorella)、绿球藻属(Chlorococcum)、小环藻属(Cyclotella)、筒柱藻属(Cylindrotheca)、杜氏藻属(Dunaliella)、Emiliana、眼虫属(Euglena)、血球菌属(Hematococcus)、等边金藻属(Isochrysis)、单鞭金藻属(Monochrysis)、单针藻属(Monoraphidium)、微绿球藻属(Nannochloris)、微绿球藻(Nannnochloropsis)、舟形藻属(Navicula)、肾鞭藻属(Nephrochloris)、肾丬藻属(Nephroselmis)、菱形藻属(Nitzschia)、节球藻属(Nodularia)、念珠藻属(Nostoc)、Oochromonas、卵囊藻属(Oocystis)、颤藻属(Oscillartoria)、巴夫藻属(Pavlova)、褐指藻属(Phaeodactylum)、扁藻属(Playtmonas)、颗石藻属(Pleurochrysis)、紫菜属(Porhyra)、假鱼腥藻属(Pseudoanabaena)、塔胞藻属(Pyramimonas)、裂丝藻属(Stichococcus)、聚球藻属(Synechococcus)、集胞藻属(Synechocystis)、四丬藻属(Tetraselmis)、海链藻属(Thalassiosira)、以及束毛藻属(Trichodesmium)。

可以根据本发明的方法处理植物的一部分，即“植物组织”以产生改良的植物。植物组织还包括植物细胞。如在此使用的术语“植物细胞”是指活的植物的个人单位，不论在完整的全植物中或以离体组织培养、在培养基或琼脂上、悬浮于生长培养基或缓冲液中生长分离形式、或作为高等组织化个体的一部分，例如像，植物组织、植物器官、或全植物。

“原生质体”是指已使用例如机械或酶手段完全或部分地去除防卫细胞壁的植物细胞，由此形成可以改造它们的细胞壁、增殖并在适当的生长条件下再生长成全植物的活的植物的完整的生物化学感受态单位。

术语“转化”广义上是指以下过程，通过该过程借助农杆菌(Agrobacteria)或多种化学或物理方法中的一种通过引入DNA对植物宿主进行基因修饰。如在此所使用的，术语“植物宿主”是指植物，包括任何细胞、组织、器官、或植物子代。许多适合的植物组织或植物细胞可以被转化并且包括，但不局限于，原生质体、体细胞胚、花粉、叶、幼苗、茎、愈伤组织、匍匐茎、试管块茎、以及嫩枝。植物组织还指此种植物、种子、子代、不管有性还是无性生殖的繁殖体、以及这些中任一项所述的后代(例如插条或种子)的任何克隆。

如在此使用的术语“转化的”是指其中已经引入外源DNA分子(如构建体)的细胞、组织、器官、或生物。所引入的DNA分子可以被整合到受体细胞、组织、器官、或生物的基因组DNA中，这样使得所引入的DNA分子被传递至该后续子代。在这些实施例中，“转化的”或“转基因的”细胞或植物还可以包括细胞或植物的子代以及产自采用这种转化的植株作为杂交的亲本的育种计划并且展示出由存在所引入的DNA分子导致的改变的表型的子代。优选地，转基因植物是能育的并且能够将所引入的DNA通过有性生殖传递给子代。

术语“子代”，如转基因植物的子代，出生自、产生自、或衍生自植物或转基因植物。所引入的DNA分子也可以被瞬时引入到受体细胞中，这样使得所引入的DNA分子不被后续子代遗传并且因此不被认为是转基因的。因此，如在此使用的，“非转基因”植物或植物细胞是不包含稳定整合到其基因组中的外源DNA的植物。

如在此所使用的术语“植物启动子”是能够启动植物细胞转录的启动子，无论其是否来源自植物细胞。示例性的适合植物启动子包括但不局限于，那些获得自植物、植物病毒、以及细菌(如包含在植物细胞中表达的基因的土壤杆菌属(Agrobacterium)或根瘤菌属)的启动子。

如在此使用的，“真菌细胞”是指真菌界内任何类型的真核细胞。真菌界内的门包括菌门子囊菌亚门(Ascomycota)、担子菌门(Basidiomycota)、芽枝霉门(Blastocladiomycota)、壶菌门(Chytridiomycota)、球囊菌门(Glomeromycota)、微孢子虫目(Microsporidia)、以及新美鞭菌门(Neocallimastigomycota)。真菌细胞可以包括酵母菌、霉菌、和丝状真菌。在一些实施例中，真菌细胞是酵母细胞。

如在此所使用的，术语“酵母细胞”是指以下门内的任何真菌细胞：子囊菌亚门和担子菌门。酵母细胞可以包括芽殖酵母细胞、裂殖酵母细胞、以及霉菌细胞。不限于这些生物，在实验室和工业设置中使用的许多类型的酵母菌是门子囊菌亚门(Ascomycota)的部分。在一些实施例中，酵母细胞是酿酒酵母(S.cerervisiae)、马克思克鲁维酵母(Kluyveromyces marxianus)、或东方伊萨酵母(Issatchenkia orientalis)细胞。其他酵母细胞可以包括但不限于假丝酵母属(Candida spp.)(例如，白色念珠菌(Candidaalbicans))、亚罗酵母属(Yarrowia spp.)(例如，亚罗解脂酵母(Yarrowia lipolytica))、毕赤酵母属(Pichia spp.)(例如，巴斯德毕赤酵母(Pichia pastoris))、克鲁维酵母菌属(Kluyveromyces spp.)(例如，产乳糖酶酵母(Kluyveromyces lactis)和马克思克鲁维酵母(Kluyveromyces marxianus))、脉孢菌属(Neurospora spp.)(例如，粗糙脉孢菌(Neurospora crassa))、镰刀菌属(Fusarium spp.)(例如，尖孢镰刀菌(Fusariumoxysporum))、以及伊萨酵母属(Issatchenkia spp.)(例如，东方伊萨酵母(Issatchenkiaorientalis)，又称为库德里阿兹威毕赤酵母(Pichia kudriavzevii)以及Candidaacidothermophilum)。在一些实施例中，真菌细胞是丝状真菌细胞。如在此所使用的术语“丝状真菌细胞”是指以丝状体(即菌丝或菌丝体)生长的任何类型的真菌细胞。丝状真菌细胞的实例可以包括但不限于曲霉属(Aspergillus spp.)(例如，黑曲霉(Aspergillusniger))、木霉属(Trichoderma spp.)(例如，里氏木霉(Trichoderma reesei))、根霉(Rhizopus spp.)(例如，米根霉(Rhizopus oryzae))、和被孢霉属(Mortierella spp.)(例如，深黄被孢霉(Mortierella isabellina))。

在一些实施例中，真菌细胞是工业菌株。如在此使用的，“工业菌株”是指工业工艺(例如，以商业或工业规模生产产品)中使用的或从中分离的任何真菌细胞菌株。工业菌株可以是指典型地在工业工艺中使用的真菌物种，或者它可以是指也可用于非工业目的(例如，实验室研究)的真菌物种的隔离群。工业工艺的实例可以包括发酵(例如，在食品或饮料产品的生产中)、蒸馏、生物燃料生产、化合物生产、以及多肽生产。工业菌株的实例可以包括但不限于，JAY270和ATCC4124。

在一些实施例中，真菌细胞是多倍体细胞。如在此使用的，“多倍体”细胞可以是指其基因组存在于多于一个拷贝中的任何细胞。多倍体细胞可以是指天然地发现处于多倍体状态的细胞类型、或者它可以是指已被诱导以多倍体状态存在的细胞(例如，通过减数分裂、胞质分裂、或DNA复制的特定调节、改变、失活、活化、或修饰)。多倍体细胞可以是指其整个基因组是多倍体的细胞、或者它可以是指感兴趣的具体基因组座位是多倍体的细胞。不希望被理论所束缚，据认为指导RNA的丰度在多倍体细胞的基因组工程化中比在单倍体细胞中可以更经常地是限速组分，并且因此使用在此描述的CRISPR/Cas9系统的方法可以利用某种真菌细胞类型。

在一些实施例中，真菌细胞是二倍体细胞。如在此使用的，“二倍体”细胞可以是指其基因组存在于两个拷贝中的任何细胞。二倍体细胞可以是指天然地发现处于二倍体状态的细胞类型、或者它可以是指已被诱导以二倍体状态存在的细胞(例如，通过减数分裂、胞质分裂、或DNA复制的特定调节、改变、失活、活化、或修饰)。例如，酿酒酵母菌株S228C可以维持处于单倍体或二倍体状态。二倍体细胞可以是指其整个基因组是二倍体的细胞、或者它可以是指感兴趣的具体基因组座位是二倍体的细胞。在一些实施例中，真菌细胞是单倍体细胞。如在此使用的，“单倍体”细胞可以是指其基因组存在于一个拷贝中的任何细胞。单倍体细胞可以是指天然地发现处于单倍体状态的细胞类型、或者它可以是指已被诱导以单倍体状态存在的细胞(例如，通过减数分裂、胞质分裂、或DNA复制的特定调节、改变、失活、活化、或修饰)。例如，酿酒酵母菌株S228C可以维持处于单倍体或二倍体状态。单倍体细胞可以是指其整个基因组是单倍体的细胞、或者它可以是指感兴趣的具体基因组座位是单倍体的细胞。

如在此使用的，“酵母表达载体”是指包含编码RNA和/或多肽的一个或多个序列的核酸，并且可以进一步包含控制一种或多种核酸表达的任何所希望的组件，连同能够使得表达载体在酵母细胞内部复制和维持的任何组件。许多适合的酵母表达载体及其特征是本领域中已知的；例如，不同载体和技术在酵母菌实验室手册(Yeast Protocols)，第2版，肖(Xiao)，W.编辑，(胡玛纳出版社(Humana Press)，纽约，2007)以及巴克哥尔茨(Buckholz)，R.G.和格利森(Gleeson)，M.A.(1991)，生物技术(Biotechnology)(NY)9(11):1067-72中示出。酵母载体可以包含但不限于着丝粒(CEN)序列、自主复制序列(ARS)、有效作地连接到感兴趣的序列或基因上的启动子(如RNA聚合酶III启动子)、终止子(例如，RNA聚合酶III终止子)、复制原点、和标记基因(例如，营养缺陷型、抗生素、或其他选择性标记)。在酵母菌中使用的表达载体的实例可以包括质粒、酵母人工染色体、2μ质粒、酵母整合型质粒、酵母复制型质粒、穿梭载体、和游离型质粒。

CRISPR/Cas9系统组分在植物和植物细胞基因组中的稳定整合

在具体实施例中，设想的是引入编码CRISPR/Cas9系统的组分的多核苷酸以便稳定整合进植物细胞的基因组中。在这些实施例中，可以依据该chi/sgRNA和/或Cas9基因在何时、何处及在何条件下表达，对转化载体或表达系统的设计进行调节。

在具体实施例中，设想了将CRISPR/Cas9系统的组分稳定地引入到植物细胞的基因组DNA中。另外地或可替代地，设想了引入CRISPR/Cas9系统的组分以便稳定整合到植物细胞器的DNA中，例如但不局限于质体、线粒体或叶绿体。

用于稳定整合到植物细胞基因组中的表达系统可以包含以下组件中的一个或多个：可以用来在植物细胞中表达RNA和/或Cas9酶的启动子组件；增强表达的5’非翻译区；进一步增强在某些细胞(如单子叶植物细胞)中表达的内含子组件；为插入该chi/sgRNA和/或Cas9基因序列以及其他所希望的组件提供方便的限制位点的多克隆位点；以及为所表达的转录物提供有效终止的3’非翻译区。

表达系统的这些组件可以是圆形(如质粒或转化载体)或非圆形(如直链双链DNA)的一种或多种表达构建体。

在一个具体实施例中，CRISPR-Cas9表达系统包括至少：

(a)编码与植物靶序列杂交的指导或chi/sgRNA的核苷酸序列，并且其中该指导或chi/sgRNA包括指导序列和同向重复序列，以及

(b)编码Cas9蛋白的核苷酸序列，

其中组分(a)或(b)位于相同或不同的构建体上，并且由此不同的核苷酸序列可以在植物细胞中有效的相同或不同调节组件的控制之下。

含有CRISPR/Cas9系统的这些组分的一种或多种DNA构建体，并且，在适用的情况下，可以通过各种各样的常规技术将模板序列引入到植物、植物部分、或植物细胞基因组中。该方法通常包括以下步骤：选择适合的宿主细胞或宿主组织，将一种或多种构建体引入到宿主细胞或宿主组织中、并且从中再生植物细胞或植物。

在具体实施例中，可以使用诸如但不限于电穿孔、微注射、植物细胞原生质体的气溶胶束注入的技术将DNA构建体引入到植物细胞中，或者可以使用如DNA粒子轰击的基因枪法直接将这些DNA构建体引入到植物组织中(还参见付(Fu)等人，转基因研究(TransgenicRes.)2000年2月；9(1):11-9)。粒子轰击的基础是使涂覆有感兴趣的基因的颗粒加速朝向细胞，由此导致颗粒穿透原生质并且典型地稳定整合到基因组中。(参见，例如，克莱因(Klein)等人，《自然》(Nature)(1987)，克莱因等人，《生物/技术》(Bio/Technology)(1992)，卡萨斯(Casas)等人，《美国国家科学院院刊》(Proc.Natl.Acad.Sci.USA)(1993))。

在具体实施例中，可以通过土壤杆菌介导的转化将包含CRISPR/Cas9系统的组分的DNA构建体引入到植物中。这些DNA构建体可以与适合的T-DNA侧翼区结合并且被引入到常规根瘤土壤杆菌(Agrobacterium tumefaciens)宿主载体中。通过感染植物或通过用土壤杆菌属细菌(含有一种或多种Ti(根瘤诱导)质粒)培育植物原生质体，可以将外源DNA结合到植物基因组中。(参见，例如，弗莱里(Fraley)等人，(1985)；罗杰斯(Rogers)等人，(1987)以及美国专利号5,563,055)。

植物启动子

为了确保在植物细胞中适当表达，典型地将在此描述的CRISPR/Cas9系统的组分置于植物启动子(即在植物细胞中有效的启动子)的控制下。设想了使用不同类型的启动子。

组成型植物启动子是能够在所有或几乎所有植物组织的所有或几乎所有植物发育阶段表达开放读码框(ORF)的启动子(称为“组成型表达”)。组成型启动子的一个非限制性实例是花椰菜花叶病毒35S启动子。“调节启动子”是指非组成型地、但是以暂时和/或空间调节方式指导基因表达的启动子，并且包括组织特异性、组织优选型及诱导型启动子。不同启动子可以指导在不同组织或细胞类型中、或在不同发育阶段、或响应于不同环境条件的基因表达。在具体实施例中，CRISPR/Cas9组分中的一个或多个在组成型启动子(如花椰菜花叶病毒35S启动子)的控制之下表达。组织优选型启动子可以用于靶向具体植物组织中某些细胞类型的增强的表达，例如，叶或根的维管细胞或在种子的特异性细胞中。在CRISPR/Cas9系统中使用的具体启动子的实例发现于川俣(Kawamata)等人，(1997)《植物细胞生理学》(Plant Cell Physiol)38:792-803；山本(Yamamoto)等人，(1997)《植物杂志》(Plant J)12:255-65；伊尔(Hire)等人，(1992)《植物分子生物学》(Plant Mol Biol)20:207-18、库斯特(Kuster)等人，(1995)《植物分子生物学》29:759-72、以及凯帕纳(Capana)等人(1994)《植物分子生物学》25:681-91中。

可诱导并且允许对基因编辑或基因表达进行时空控制的启动子的实例可以利用一种能量形式。该能量形式可以包括但不限于，声能、电磁辐射、化学能和/或热能。可诱导系统的实例包括四环素诱导型启动子(Tet-开(Tet-On)或Tet-关(Tet-Off))、小分子双杂交体转录激活系统(FKBP、ABA等)或光可诱导系统(光敏素、LOV结构域或隐花色素)，如以序列特异性方式指导转录活性的变化的光诱导的转录效应因子(LITE)。光诱导型系统的组分可以包括CRISPR/Cas9酶、光响应细胞色素异二聚体(例如，来自拟南芥)、以及转录激活/抑制结构域。诱导型DNA结合蛋白和关于使用它们的方法的其他实例提供在US 61/736465和US61/721,283中，特此通过引用以其全文并入。

在具体实施例中，瞬时或诱导型表达可以通过使用例如化学调节型促进剂(即，由此应用外源化学制品诱导基因表达)来实现。也可以通过化学阻抑型启动子来获得对基因表达的调节，其中应用化学制品阻抑基因表达。化学诱导型启动子包括但不限于：由苯磺酰胺除草剂安全剂(德维尔德(De Veylder)等人(1997)(《植物细胞生理学》(Plant CellPhysiol)38:568-77)激活的玉米ln2-2启动子、由用作萌前除草剂的疏水性亲电子化合物激活的玉米GST启动子(GST-ll-27，WO 93/01294)、以及由水杨酸激活的烟草PR-1a启动子(奥诺(Ono)等人，(2004)《生物科学、生物技术、生物化学》(Biosci Biotechnol Biochem)，68:803-7))。还可以在此使用由抗生素(如四环素诱导型和四环素阻抑型启动子(加茨(Gatz)等人，(1991)《分子遗传学与普通遗传学》(Mol Gen Genet)227:229-37；美国专利号5,814,618和5,789,156)调节的启动子。

易位至和/或在特定植物细胞器中表达

该表达系统可以包括用于易位至和/或在特定植物细胞器中表达的组件。

叶绿体靶向

在具体实施例中，设想的是将CRISPR/Cas9系统用于特异性修饰叶绿体基因或以确保叶绿体中的表达。为此目的，使用叶绿体转化方法或将CRISPR/Cas9系统组分区室化至叶绿体。例如，向质体基因组中引入遗传修饰可以减少生物安全性问题，如通过花粉的基因流。

叶绿体转化的方法是本领域中已知的并且包括粒子轰击法、PEG处理、以及微注射。此外，可以如在WO 2010061186中所描述的来使用涉及将转化盒从核基因组易位至质体的方法。

可替代地，设想了将CRISPR/Cas9系统组分中的一个或多个靶向植物叶绿体。这是通过将编码叶绿体转运肽(CTP)或质体转运肽的序列结合到有效作地连接到编码Cas9蛋白的序列的5’区上的表达构建体中实现的。在处理步骤中的易位至叶绿体中的过程中去除CTP。表达蛋白的叶绿体靶向是本领域技术人员所熟知的(参见例如蛋白质转运到叶绿体中(Protein Transport into Chloroplasts)，2010，《植物生物学年度综述》(Annual Reviewof Plant Biology)，第61卷：157-180)。在此类实施例中，还希望将chi/sgRNA靶向植物叶绿体。借助叶绿体定位序列可以用于将chi/sgRNA易位到叶绿体中的方法和构建体描述于例如US 20040142476中，其通过引用结合在此。可以将构建体的此类变化结合到本发明的表达系统中以有效易位Cas9-chi/sgRNA。

将编码CRISPR-Cas9系统的多核苷酸引入藻类细胞中。

转基因藻类或其他植物，如油菜，可以在植物油或生物燃料像醇类(尤其是甲醇和乙醇)或其他产品的生产中特别有用。这些可以被工程化为表达或过表达高水平的油或醇类，以供在油或生物燃料行业中使用。

US 8945839描述了一种使用Cas9用于工程化微藻(莱氏衣藻细胞)物种)的方法。类似地，可以将在此描述的CRISPR/Cas9系统应用于衣藻属物种及其他藻类。在具体实施例中，将Cas9和chi/sgRNA引入到使用在组成型启动子(如Hsp70A-Rbc S2或β2-微管蛋白)的控制之下表达Cas9的载体进行表达的藻类中。任选地，使用含有T7启动子的载体对chi/sgRNA进行递送。可替代地，可以将Cas9mRNA和体外转录的chi/sgRNA递送至藻类细胞中。电穿孔方案可由本领域技术人员获得，如来自GeneArt Chlamydomonas Engineering试剂盒的标准推荐方案。

在具体实施例中，在此使用的内切核酸酶是分离Cas9酶。对于靶向的基因组修饰，分离Cas9酶优先用于藻类中，如已经描述于WO 2015086795中。Cas9分离系统的用途特别适合用于基因组靶向的诱导型方法并且避免了在藻类细胞中Cas9过量表达的潜在毒性效应。在具体实施例中，可以将所述Cas9分离结构域(RuvC和HNH结构域)同时地或顺序地引入细胞中，这样使得所述一个或多个分离Cas9结构域处理藻类细胞中的靶核酸序列。相比于野生型Cas9，分离Cas9的尺寸缩小允许通过其他方法将CRISPR系统递送到细胞中，如使用如在此描述的细胞穿透肽。这种方法用于产生经基因修饰的藻类是特别有意义的。

将编码Cas9组分的多核苷酸引入酵母细胞中

在具体实施例中，本发明涉及CRISPR/Cas9系统用于酵母细胞的基因组编辑的用途。可以用于引入编码CRISPR/Cas9系统组分的多核苷酸的用于转化酵母细胞的方法是本领域技术人员所熟知的，并且由河合(Kawai)等人，2010，《生物工程与昆虫》(BioengBugs.)2010年11月-12月；1(6):395-403)进行了概述。非限制性实例包括通过醋酸锂处理(其可以进一步包括载体DNA和PEG处理)、轰击或通过电穿孔来转化酵母细胞。

在植物和植物细胞中瞬时表达Cas9 CRISP系统组分

在具体实施例中，设想的是在植物细胞中瞬时表达chi/sgRNA和/或Cas9基因。在这些实施例中，仅当细胞中存在chi/sgRNA和Cas9蛋白二者时，CRISPR/Cas9系统可以确保靶基因的修饰，这样使得可以进一步控制基因组修饰。因为Cas9酶的表达是瞬时的，再生自此类植物细胞的植物典型地不含外源DNA。在具体实施例中，Cas9酶由植物细胞稳定表达，并且瞬时表达指导序列。

在具体实施例中，使用植物病毒载体可以将CRISPR/Cas9系统组分引入到植物细胞中(斯科瑟夫(Scholthof)等人，1996，《植物病理学年鉴》(Annu Rev Phytopathol.)1996；34:299-323)。在另外的具体实施例中，所述病毒载体是来自DNA病毒的载体。例如，双生病毒(例如，卷心菜叶曲病毒、豆黄矮病毒、小麦矮小病毒、西红柿曲叶病毒、玉米条纹病毒、烟草曲叶病毒、或西红柿金色花叶病毒)或矮缩病毒(nanovirus)(例如，蚕豆坏死黄化病毒)。在其他具体实施例中，所述病毒载体是来自RNA病毒的载体。例如，烟草脆裂病毒组(例如，烟草脆裂病毒、烟草镶崁病毒)、马铃薯X病毒组(例如，马铃薯X病毒)、或大麦病毒(例如，大麦条纹花叶病毒)。植物病毒的复制基因组是非整合载体。

在具体实施例中，用于瞬时表达CRISPR/Cas9构建体的载体是例如pEAQ载体，其被定制为在原生质体中用于农杆菌介导的瞬时表达(塞恩思伯里(Sainsbury)F.等人，《植物生物技术杂志》(Plant Biotechnol J.)2009年9月；7(7):682-93)。使用修饰的卷心菜叶曲病毒(CaLCuV)载体以在表达CRISPR酶的稳定转基因植物中表达gRNA证明了基因组位置的精确靶向(《科技报告》(Scientific Reports)5，文章号：14926(2015),doi:10.1038/srep14926)。

在具体实施例中，可以将编码chi/sgRNA和/或Cas9基因的双链DNA片段瞬时引入到植物细胞中。在此类实施例中，以足以修饰细胞但在经过预期的时间段之后或在一次或多次细胞分裂之后不持续的量提供所引入的双链DNA片段。用于在植物中直接DNA转移的方法是本领域技术人员已知的(参见例如戴维(Davey)等人，《植物分子生物学》(Plant MolBiol.)1989年9月；13(3):273-85)。

在其他实施例中，将编码Cas9蛋白的RNA多核苷酸引入到植物细胞中，然后它被以足以修饰细胞但在经过预期的时间段之后或在一次或多次细胞分裂之后不持续的量产生蛋白(在至少一种chi/sgRNA的存在下)的宿主细胞翻译并加工。用于将mRNA引入到植物原生质体中以便瞬时表达的方法是本领域技术人员已知的(参见例如在加利耶(Gallie)，《植物细胞报告》(Plant Cell Reports)(1993)，13；119-122中)。

还设想了上述不同方法的组合。

将CRISPR/Cas9组分递送到植物细胞中

在具体实施例中，感兴趣的是将CRISPR/Cas9系统的一种或多种组分直接递送至植物细胞中。对于产生非转基因植物，这是尤其感兴趣的(参见下文)。在具体实施例中，在植物或植物细胞外部制备Cas9组分中的一个或多个并将其递送到细胞中。例如，在具体实施例中，在引入到植物细胞中之前，在体外制备Cas9蛋白。Cas9蛋白可以通过本领域技术人员已知的不同方法进行制备并且包括重组生产。在表达之后，将Cas9蛋白分离，如果需要的话进行再折叠，进行纯化和任选地进行处理以除去任何纯化标签(如His标签)。一旦获得未加工、部分纯化、或更完全纯化的Cas9蛋白，可以将蛋白引入到植物细胞中。

在具体实施例中，将Cas9蛋白与靶向感兴趣的基因的chi/sgRNA进行混合，以形成预先装配的核糖核蛋白。

经由电穿孔、通过用Cas9缔合的基因产物包衣的颗粒轰击、通过化学转染或通过跨细胞膜运输的一些其他手段，可以将这些单独的组分或预先装配的核糖核蛋白引入到植物细胞中。例如，用预先装配的CRISPR核糖核蛋白对植物原生质体进行转染已经证实能确保植物基因组的定向修饰(如吴(Woo)等人，《自然生物技术》(Nature Biotechnology)，2015；DOI:10.1038/nbt.3389所描述)。

在具体实施例中，使用纳米粒子将CRISPR/Cas9系统组分引入到植物细胞中。可以将这些组分，作为蛋白或核酸或以其组合，上载到或包装在纳米粒子中并将其施用到植物上(例如，如描述于WO 2008042156和US 20130185823中)。具体地，本发明的实施例包括纳米粒子，用编码Cas9蛋白的一种或多种DNA分子、编码chi/sgRNA和/或如描述于WO2015089419中的分离的chi/sgRNA的DNA分子上载或填充该纳米粒子。

用于将CRISPR/Cas9系统的一种或多种组分引入到植物细胞中的其他手段通过使用细胞穿透肽(CPP)进行。因此，具体地，本发明的实施例包括组合物，该组合物包括连接到Cas9蛋白上的细胞穿透肽。在本发明的具体实施例中，Cas9蛋白和/或chi/sgRNA被连接到一个或多个CPP上，以便有效地将它们运输至植物原生质体内(如See comment in PubMedCommons below罗摩克里希纳(Ramakrishna)所描述(2014《基因组研究》(Genome Res.)2014年6月；24(6):1020-7针对人类细胞中的Cas9)。在其他实施例中，Cas9基因和/或chi/sgRNA是由一个或多个环状或非环状DNA分子所编码的，其被连接到一个或多个CPP上以便进行植物原生质体递送。然后，将这些植物原生质体再生成为植物细胞并且进一步成为植物。通常将CPP描述为具有少于35个氨基酸的短肽，这些氨基酸衍生自蛋白或衍生自嵌合序列，其能够以非受体依赖性方式跨细胞膜运输生物分子。CPP可以是阳离子肽、具有疏水序列的肽、两亲性肽、具有富含脯氨酸及抗微生物序列的肽、以及嵌合或二分肽(博客(Pooga)和朗热尔(Langel)2005)。CPP能够穿透生物膜，并且如此触发不同生物分子跨细胞膜移动到细胞质中，并能改进它们的细胞内通路，并且因此促进生物分子与靶标的相互作用。CPP的实例尤其包括：Tat(通过HIV 1型进行病毒复制所需的核转录激活蛋白)、穿透素、卡波济(Kaposi)成纤维细胞增长因子(FGF)信号肽序列、整联蛋白β3信号肽序列；聚精氨酸肽Arg序列、富含鸟嘌呤的分子转运体、甜箭头肽(sweet arrow peptide)等。

使用CRISPR/Cas9系统以制成遗传修饰的非转基因植物

在具体实施例中，将在此描述的方法用于修饰内源基因或用于修饰它们的表达而不向植物基因组中永久性引入任何外源基因，包括那些编码CRISPR组分的基因，以便避免植物基因组中存在外源DNA。这可以是有意义的，因为针对非转基因植物的法规要求不那么严格。

在具体实施例中，这通过CRISPR/Cas9组分的瞬时表达来确保。在具体实施例中，CRISPR组分中的一个或多个在一种或多种病毒载体上进行表达，该一种或多种病毒载体产生充足的Cas9蛋白和chi/sgRNA，以便根据在此描述的方法，持续稳定地确保对感兴趣的基因的修饰。

在具体实施例中，在植物原生质体中确保了CRISPR/Cas9构建体的瞬时表达，并且因此未将其整合进基因组中。这种有限的表达时机可以足以允许CRISPR/Cas9系统确保对如在此描述的靶基因进行修饰。

在具体实施例中，在递送分子的微粒(如纳米粒子或如以上在此描述的CPP分子)的辅助下，将CRISPR/Cas9系统的不同组分单独地或混合引入植物细胞、原生质体或植物组织中。

通过Cas9核酸酶的直接活性以及任选地引入模板DNA或通过对使用如在此描述的CRISPR/Cas9系统所靶向的基因进行修饰，CRISPR/Cas9组分的表达可以诱导基因组的定向修饰。以上在此描述的不同策略允许Cas9介导的定向基因组编辑，而无需将CRISPR/Cas9组分引入到植物基因组中。典型地，在杂交时将瞬时引入到植物细胞中的组分去除。

检测植物基因组中的修饰-选择性标记

在具体实施例中，其中该方法涉及对植物基因组的内源靶基因进行修饰，可以使用任何适合的方法以确定，在用CRISPR/Cas9系统感染或转染植物、植物部分或植物细胞之后，靶位点处是否已经发生基因靶向或靶向诱变。其中该方法涉及引入转基因，针对转基因的存在或针对由转基因编码的性状，可以通过选择或筛选工程化的植物材料来鉴定和分离转化的植物细胞、愈伤组织、组织或植物。物理和生物化学方法可以用于鉴定含有插入的基因构建体或内源DNA修饰的植物或植物细胞转化体。这些方法包括但不限于：1)Southern分析或PCR扩增用于检测以及确定重组DNA插入片段或修饰的内源基因的结构；2)Northern印迹、S1RNA酶保护、引物延伸或逆转录酶-PCR扩增用于检测以及检查基因构建体的RNA转录物；3)酶法测定用于检测酶或核酶活性，其中此类基因产物由基因构建体进行编码，或表达受遗传修饰的影响；4)蛋白凝胶电泳、Western印迹技术、免疫沉淀、或酶联免疫测定，其中基因构建体或内源基因产物是蛋白质。另外的技术(如原位杂交、酶染色、以及免疫染色)也可以用于检测重组构建体的存在或表达或用于检测对特定植物器官和组织中内源基因的修饰。这些用于进行所有这些测定的方法对于本领域技术人员而言是众所周知的。

另外地(或可替代地)，编码CRISPR/Cas9组分的表达系统典型地被设计成包括一个或多个选择性标记或检测标记，其提供了用以分离或有效选择含有和/或在早期阶段并大规模地被CRISPR/Cas9系统修饰的细胞的手段。

在土壤杆菌介导的转化的情况下，标记盒可以靠近或在侧翼T-DNA边界之间并被包含于二元载体内。在另一个实施例中，标记盒可以在T-DNA的外部。选择性标记盒还可以在与表达盒相同的T-DNA边界内或与之靠近或可以在二元载体(例如，2T-DNA系统)上第二T-DNA内的其他地方。

对于粒子轰击或用原生质体转化，表达系统可以包括一个或多个分离的线性片段或可以是更大的构建体的一部分，该更大的构建体可能包含细菌复制组件、细菌选择性标记或其他可检测组件。可以将包括编码指导物和/或Cas9的多核苷酸的一种或多种表达盒以物理方式连接到标记盒上，或可以将其与编码标记盒的第二核酸分子进行混合。标记盒由必需组件组成，以表达允许有效选择转化细胞的检测标记或选择性标记。

基于选择性标记的细胞选择程序将取决于标记基因的性质。在具体实施例中，使用选择性标记，即基于标记基因的表达，允许直接选择细胞的标记。选择性标记可以赋予阳性选择或阴性选择，并且取决于外部底物的存在是条件型或非条件型(三木(Miki)等人，2004，107(3):193-232)。最常见的是将抗生素或除草剂耐受性基因用作标记，由此通过以下方式进行选择：使工程化的植物材料在培养基上生长，该培养基含有抑制作用量的抗生素或除草剂，标记基因赋予对该抗生素或除草剂的抗性。此类基因的实例是赋予对抗生素(如潮霉素(hpt)和卡那霉素(nptII))的抗性的基因，以及赋予对除草剂的抗性(例如草丁膦(bar)并且氯磺隆(als))的基因，

还可以通过以下方法来鉴别转化的植物和植物细胞：针对可见标记的活性进行筛选，典型地为能够处理有色底物(例如，β-葡糖醛酸糖苷酶、荧光素酶、B基因或C1基因)的酶。这类选择和筛选方法对于本领域技术人员而言是众所周知的。

植物栽培与再生

在具体实施例中，可以对具有修饰的基因组并且通过在此描述的方法中的任一者产生或获得的植物细胞进行培养以再生具有经转化或修饰的基因型以及因此所希望的表型的全株。常规的再生技术对于本领域技术人员而言是众所周知的。此类再生技术的具体实例依赖于操纵组织培养生长培养基中的某些植物激素，并且典型地依赖于已经与希望的核苷酸序列一起引入的杀生物剂和/或除草剂标志物。在另外的具体实施例中，植物再生获得自培养的原生质体、植物愈伤组织，外植体、器官、花粉、胚或其部分(参见例如，埃文斯(Evans)等人，(1983)，《植物细胞培养手册》(Handbook of Plant Cell Culture)，克利(Klee)等人(1987)《植物生理学年鉴》(Ann.Rev.of Plant Phys.))。

在具体实施例中，如在此描述的经转化或改良的植物可以自体授粉以提供种子用于本发明的纯合改良的植物(对于DNA修饰是纯合的)或与非转基因植物或不同的改良的植物杂交以提供种子用于杂合植物。当将重组DNA引入到植物细胞中时，这种杂交所得的植物是对于重组DNA分子杂合的植物。通过从改良的植物杂交获得并且包括遗传修饰(其可以是重组DNA)的这两种纯合及杂合植物在此被称为“子代”。子代植物是起源于原始转基因植物并且含有基因组修饰或通过在此提供的方法引入的重组DNA分子的植物。可替代地，可以使用Cas9通过上文所述方法之一来获得转基因植物，由此没有外源DNA结合到基因组中。通过进一步育种获得的此类植物的子代也可以包含遗传修饰。通过任何常用于不同作物的育种方法进行育种(例如，阿拉德(Allard)，《植物育种原理》(Principles of PlantBreeding)，约翰威利父子公司(John Wiley&Sons)，纽约(NY)，U.of CA，戴维斯(Davis)，加州(CA)，50-98(1960)。

产生具有增强的农艺性状的植物

可以将在此提供的基于Cas9的CRISPR系统用于引入靶向的双链或单链断裂和/或用于引入基因活化剂和或阻抑物系统，并且不受限制，可以用于基因靶向、基因置换、靶向诱变、靶向缺失或插入、靶向倒位和/或靶向易位。通过共表达针对在单个细胞中实现多个修饰的多个靶向RNA，可以确保多重基因组修饰。这种技术可以用于高精度工程化具有改进特征的植物，包括增强的营养品质、对疾病增加的抗性和对生物的和非生物胁迫增加的抗性、以及增加的有商业价值的植物产品或异源化合物的生产。

在具体实施例中，将如在此描述的CRISPR/Cas9系统用于在内源DNA序列中引入靶向的双链断裂(DSB)。DSB活化细胞DNA修复途径，可以利用其在断裂位点附近实现所希望的DNA序列修饰。这是感兴趣的，其中内源基因的失活可以赋予或促成所希望的性状。在具体实施例中，在DSB位点处促进用模板序列进行的同源重组，以便引入感兴趣的基因。

在具体实施例中，CRISPR/Cas9系统可以用作融合至或有效作地连接至功能结构域上的通用核酸结合蛋白，以便活化和/或阻遏内源植物基因。示例性的功能结构域可以包括但不限于：翻译引发剂、翻译激活因子、翻译阻遏因子、核酸酶，特别是核糖核酸酶、剪接体、珠粒、光诱导型/可控型结构域或化学诱导型/可控型结构域。典型地，在这些实施例中，Cas9蛋白包含至少一个突变，这样使得它具有不超过5％的不具有该至少一个突变的Cas9蛋白的活性；该chi/sgRNA包括指导序列，该指导序列能够杂交到靶序列上。

在此描述的这些方法通常导致产生“改良的植物”，因为相比于野生型植物，它们具有一个或多个令人希望的性状。在具体实施例中，所获得的植物、植物细胞或植物部分是转基因植株，其包括结合到植物所有或部分细胞基因组中的外源DNA序列。在具体实施例中，获得了非转基因遗传修饰的植物、植物部分或细胞，因为没有外源DNA序列结合到植物任何植物细胞的基因组中。在此类实施例中，改良的植物是非转基因的。当仅确保内源基因的修饰并且没有外源基因被引入或维持在植物基因组中时，所得基因改造农作物不包含外源基因并且因此可以基本上被认为是非转基因的。以下更详细地描述了CRISPR/Cas9系统用于植物基因组编辑的这些不同应用：

a)引入一个或多个外源基因以赋予感兴趣的农艺性状

本发明提供了用于基因组编辑或修饰与感兴趣的靶座位缔合或在感兴趣的靶座位处的序列的方法，其中该方法包括：将Cas9效应蛋白复合物引入到植物细胞中，由此该Cas9效应蛋白复合物有效地起作用以将DNA插入片段(例如，编码感兴趣的外源基因)整合到植物细胞的基因组中。在优选实施例中，通过用外源引入的DNA模板或修复模板的HR来促进DNA插入片段的整合。典型地，将外源引入的DNA模板或修复模板与Cas9效应蛋白复合物或一种组分或用于表达该复合物的组分的多核苷酸载体一起进行递送。

在此提供的这些CRISPR/Cas9系统允许定向基因送递。变得越来越清楚的是表达感兴趣的基因的效率在很大程度上是由整合到基因组中的位置决定的。本发明的方法允许将外源基因靶向整合到基因组中所希望的位置中。可以基于先前产生的事件的信息对位置进行选择或者可以通过在本文中的其他地方披露的方法对位置进行选择。

在具体实施例中，在此提供的这些方法包括(a)向细胞中引入包括chi/sgRNA的CRISPR/Cas9复合物，其包括同向重复和指导序列，其中该指导序列杂交到对于植物细胞而言是内源的靶序列上；(b)当该指导序列杂交到该靶序列上并且在该指导序列所靶向的序列处或其附近诱导双链断裂时，将与chi/sgRNA复合的Cas9效应分子引入到植物细胞中；以及(c)将编码HDR修复模板的核苷酸序列引入到细胞中，该修复模板编码感兴趣的基因并且作为HDR的结果其被引入到DS断裂的位置中。在具体实施例中，引入的步骤可以包括向植物细胞递送编码Cas9效应蛋白、chi/sgRNA和修复模板的一种或多种多核苷酸。在具体实施例中，通过DNA病毒(例如，双生病毒群)或RNA病毒(例如，烟草脆裂病毒组)将这些多核苷酸递送到细胞中。在具体实施例中，引入的步骤包括向植物细胞递送含有一个或多个多核苷酸序列的T-DNA，该一个或多个多核苷酸序列编码Cas9效应蛋白、chi/sgRNA和修复模板，其中经由农杆菌进行递送。编码Cas9效应蛋白的核酸序列可以有效作地连接到启动子(如组成型启动子(例如，花椰菜花叶病毒35S启动子)、或细胞特异性或诱导型启动子)上。在具体实施例中，将多核苷酸通过微弹轰击引入。在具体实施例中，该方法进一步包括在引入的步骤之后对植物细胞进行筛选，以确定是否已经引入修复模板(即感兴趣的基因)。在具体实施例中，这些方法包括从植物细胞中再生植物的步骤。在另外的实施例中，这些方法包括对植物进行杂交育种，以获得遗传上所希望的植物谱系。下文列出了编码感兴趣的性状的外源基因的实例。

b)编辑内源基因以赋予感兴趣的农艺性状

本发明提供了用于基因组编辑或修饰与感兴趣的靶座位缔合或在感兴趣的靶座位处的序列的方法，其中该方法包括：将Cas9效应蛋白复合物引入到植物细胞中，由此该Cas9复合物修饰植物内源基因的表达。这可以通过不同方式来实现，在具体实施例中，消除内源基因的表达是令人希望的并且将CRISPR/Cas9复合物用于靶向和切割内源基因，以便修饰基因表达。在这些实施例中，在此提供的这些方法包括(a)向植物细胞中引入包括chi/sgRNA的CRISPR/Cas9复合物，其包括同向重复和指导序列，其中该指导序列杂交到植物细胞基因组中感兴趣的基因内的靶序列上；以及(b)将Cas9效应蛋白引入到细胞中，当结合到chi/sgRNA上时，其包括杂交到该靶序列上的指导序列，确保了在该指导序列所靶向的序列处或其附近的双链断裂；在具体实施例中，引入的步骤可以包括向植物细胞递送编码Cas9效应蛋白和chi/sgRNA的一种或多种多核苷酸。

在具体实施例中，通过DNA病毒(例如，双生病毒群)或RNA病毒(例如，烟草脆裂病毒组)将这些多核苷酸递送到细胞中。在具体实施例中，引入的步骤包括向植物细胞递送含有一个或多个多核苷酸序列的T-DNA，该一个或多个多核苷酸序列编码Cas9效应蛋白和chi/sgRNA，其中经由农杆菌进行递送。编码CRISPR/Cas9系统的组分的多核苷酸序列可以有效作地连接到启动子(如组成型启动子(例如，花椰菜花叶病毒35S启动子)、或细胞特异性或诱导型启动子)上。在具体实施例中，将多核苷酸通过微弹轰击引入。在具体实施例中，该方法进一步包括在引入的步骤之后对植物细胞进行筛选，以确定是否已经对感兴趣的基因表达进行了修饰。在具体实施例中，这些方法包括从植物细胞中再生植物的步骤。在另外的实施例中，这些方法包括对植物进行杂交育种，以获得遗传上所希望的植物谱系。

在上述方法的具体实施例中，通过对疾病易感性基因或编码植物防卫基因负调节物(例如，Mlo基因)的基因进行定向突变来获得抗病作物。在一个具体实施例中，通过对植物基因(如那些编码乙酰乳酸合酶(ALS)和原卟啉原氧化酶(PPO)的基因)中的特定核苷酸进行定向取代来产生除草剂耐受性作物。在具体实施例中，通过对编码非生物胁迫耐受性的负调节物的基因进行定向突变得到耐干旱和耐盐作物、通过对蜡质基因(Waxy gene)进行定向突变得到低直链淀粉谷物、通过对糊粉层中的主要脂肪酶基因进行定向突变得到具有降低的酸败性的水稻或其他谷物等。在具体实施例中。下文列出了编码感兴趣的性状的内源基因的更广泛的列表。

c)通过CRISPR/Cas9系统调节内源基因以赋予感兴趣的农艺性状

在此还提供了使用在此提供的Cas9蛋白用于调节(即活化或阻遏)内源基因表达的方法。此类方法利用一个或多个不同RNA序列，其通过Cas9复合物被靶向至植物基因组。更具体地说，一个或多个不同RNA序列结合至两种或多种衔接蛋白(例如，适配体)，由此每个衔接蛋白与一个或多个功能结构域相缔合，并且其中与衔接蛋白缔合的一个或多个功能结构域中的至少一个具有一种或多种活性，这些活性包括甲基化酶活性、脱甲基化酶活性、转录激活活性、转录阻抑活性、转录释放因子活性、组蛋白修饰活性、DNA整合活性RNA切割活性、DNA切割活性或核酸结合活性；将这些功能结构域用于调节内源植物基因的表达，以便获得所希望的性状。典型地，在这些实施例中，Cas9效应蛋白具有一个或多个突变，这样使得它具有不超过5％的不具有该至少一个突变的Cas9效应蛋白的核酸酶活性。

在具体实施例中，在此提供的这些方法包括以下步骤：(a)向细胞中引入包括chi/sgRNA的CRISPR/Cas9复合物，其包括同向重复和指导序列，其中该指导序列杂交到对于植物细胞而言是内源的靶序列上；(b)当该指导序列杂交到该靶序列上时，将与chi/sgRNA复合的Cas9效应分子引入到植物细胞中；并且其中该chi/sgRNA被修饰成包括与功能结构域结合的不同RNA序列(适配体)和/或该Cas9效应蛋白被修饰成使其连接到功能结构域上。在具体实施例中，引入的步骤可以包括向植物细胞递送编码(修饰的)Cas9效应蛋白和(修饰的)chi/sgRNA的一种或多种多核苷酸。在此其他地方描述了CRISPR/Cas9系统的组分在这些方法中使用的详细内容。

在具体实施例中，通过DNA病毒(例如，双生病毒群)或RNA病毒(例如，烟草脆裂病毒组)将这些多核苷酸递送到细胞中。在具体实施例中，引入的步骤包括向植物细胞递送含有一个或多个多核苷酸序列的T-DNA，该一个或多个多核苷酸序列编码Cas9效应蛋白和chi/sgRNA，其中经由农杆菌进行递送。编码CRISPR/Cas9系统的一种或多种组分的核酸序列可以有效作地连接到启动子(如组成型启动子(例如，花椰菜花叶病毒35S启动子)、或细胞特异性或诱导型启动子)上。在具体实施例中，将多核苷酸通过微弹轰击引入。在具体实施例中，该方法进一步包括在引入的步骤之后对植物细胞进行筛选，以确定是否已经对感兴趣的基因表达进行了修饰。在具体实施例中，这些方法包括从植物细胞中再生植物的步骤。在另外的实施例中，这些方法包括对植物进行杂交育种，以获得遗传上所希望的植物谱系。下文列出了编码感兴趣的性状的内源基因的更广泛的列表。

使用Cas9以修饰多倍体植物

许多植物是多倍体的，这意味着它们携带有其基因组的两份拷贝——有时多达六份，如在小麦中。可以使根据本发明所述利用CRISPR/Cas9效应蛋白的方法“多路复用”，以影响基因的所有拷贝、或以同时靶向数十个基因。例如，在具体实施例中，将本发明所述方法用于同时确保负责抑制对抗疾病的防御的不同基因中发生功能失去突变。在具体实施例中，将本发明所述方法用于同时抑制TaMLO-Al、TaMLO-Bl以及TaMLO-Dl核酸序列在小麦植株细胞中的表达以及从中再生小麦植株，以便确保该小麦植株对白粉病具有抗性(还参见WO 2015109752)。

赋予农艺性状的示例性基因

如以上在此描述的，在具体实施例中，本发明包括使用如在此描述的CRISPR/Cas9系统用于插入感兴趣的DNA，包括一个或多个植物可表达的基因。在另外的具体实施例中，本发明涵盖使用如在此描述的Cas9系统用于部分或完全缺失一个或多个植物表达的基因的方法和工具。在其他另外的具体实施例中，本发明涵盖使用如在此描述的Cas9系统以确保通过突变、取代、插入一个或多个核苷酸对一个或多个植物表达的基因进行修饰的方法和工具。在其他具体实施例中，本发明涵盖如在此描述的CRISPR/Cas9系统通过特异性修饰指导所述基因表达的一种或多种调节组件来确保对一个或多个植物表达的基因的表达进行修饰的用途。

在具体实施例中，本发明涵盖涉及引入外源基因和/或靶向内源基因和它们的调节组件的方法，如下所列：

1.赋予针对害虫或疾病的抗性的基因：

●植物疾病抗性基因。可以用克隆的抗性基因来转化一种植物以工程化针对特定病原体菌株具有抗性的植物。参见，例如，琼斯(Jones)等人，《科学》(Science)266:789(1994)(克隆对黄枝孢霉具有抗性的西红柿Cf-9基因(cloning of the tomato Cf-9 gene forresistance to Cladosporium fulvum))；马丁(Martin)等人，《科学》(Science)262:1432(1993)(对丁香假单胞菌西红柿致病变种具有抗性的西红柿Pto基因编码蛋白激酶(tomatoPto gene for resistance to Pseudomonas syringae pv.tomato encodes a proteinkinase))；明尊诺(Mindrinos)等人，《细胞》(Cell)78:1089(1994)(拟南芥可以是对丁香假单胞菌具有抗性的RSP2基因(Arabidopsmay be RSP2 gene for resistance toPseudomonas syringae))。

●赋予针对害虫(如大豆囊胞线虫)的抗性的基因。参见，例如，PCT申请WO 96/30517；PCT申请WO 93/19181。

●苏芸金芽胞杆菌蛋白参见，例如，盖泽(Geiser)等人，《基因》(Gene)48：109(1986)。

●凝集素，参见，例如，尚格云顿(Van Damme)等人，《植物分子生物学》(PlantMolec.Biol.)24:25(1994。

●维生素结合蛋白(如亲和素)，参见PCT申请US 93/06487，其传授了亲和素及亲和素同系物作为对抗昆虫有害生物的杀幼虫剂的用途。

●酶抑制剂，如蛋白酶或蛋白酶抑制剂或淀粉酶抑制剂。参见，例如，亚伯(Abe)等人，《生物化学杂志》(J.Biol.Chem.)262:16793(1987)，赫伯(Huub)等人，《植物分子生物学》(Plant Molec.Biol.)21:985(1993))，炭谷(Sumitani)等人，《生物科学、生物科技与生物化学》(Biosci.Biotech.Biochem.)57:1243(1993)以及美国专利号5,494,813。

●昆虫特异性激素或信息素，如蜕皮甾类或保幼激素、其变体、基于其的模拟物、或其拮抗剂或激动剂。参见，例如，哈莫克(Hammock)等人，《自然》(Nature)344：458(1990)。

●在表达时，打乱受影响的有害生物的生理学的昆虫特异性肽或神经肽。例如，里根(Regan)，《生物化学杂志》(J.Biol.Chem.269:9(1994)，以及普拉特(Pratt)等人，《生物化学与生物物理研究通讯》(Biochem.Biophys.Res.Comm.)163:1243(1989)。还参见美国专利号5,266,317。

●由蛇、胡蜂、或任何其他生物在自然界中产生昆虫特异性毒液。例如，参见庞(Pang)等人，《基因》(Gene)116：165(1992)。

●负责单萜、倍半萜、类固醇、氧肟酸、苯丙素衍生物或另一种具有杀昆虫活性的非蛋白质性的分子的超积累的酶。

●参与修饰生物活性分子的酶，包括翻译后修饰；例如，糖解酶、蛋白水解酶、脂解酶、核酸酶、环化酶、转氨酶、酯酶、水解酶、磷酸酶、激酶磷酸化酶、聚合酶、弹性酶、壳多糖酶和葡聚糖酶，无论是天然的还是合成的。参见PCT申请WO 93/02197、卡拉默(Kramer)等人，《昆虫生物化学与分子生物学》(Insect Biochem.Molec.Biol.)23:691(1993)，以及卡沃莱克(Kawalleck)等人，《植物分子生物学》(Plant Molec.Biol.)21:673(1993)。

●刺激信号转导的分子。例如，参见博特利亚(Botella)等人，《植物分子生物学》(Plant Molec.Biol.)24:757(1994)，以及格里斯(Griess)等人，《植物生理学》(PlantPhysiol.)104:1467(1994)。

●病毒侵入性蛋白或由其衍生的络合物毒素。参见比奇(Beachy)等人，《植物病理学年鉴》(Ann.rev.Phytopathol.)28:451(1990)。

●由病原体或寄生物在自然界中产生的发育停顿蛋白。参见兰姆(Lamb)等人，《生物/技术》(Bio/Technology)10:1436(1992)以及特巴特(Toubart)等人，《植物杂志》(PlantJ.)2:367(1992)。

●由植物在自然界中产生的发育停顿蛋白。例如，洛格曼(Logemann)等人，《生物/技术》(Bio/Technology)10:305(1992)。

●在植物中，病原体常常是宿主特异性的。例如，一些镰孢属物种会引起西红柿枯萎病，而且只攻击西红柿、并且其他镰孢属物种只攻击小麦。植物具有抵抗大多数病原体的现有的和诱导性的防御。跨植物代的突变和重组事件导致产生敏感性的遗传变异性，特别是当病原体以比植物更高的频率繁殖时。在植物中可以存在非宿主抗性，例如，该宿主和病原体是不兼容的，或者可以存在典型地由许多基因控制的针对所有种的病原体的部分抗性和/或还有针对病原体的某些种而不是其他种的完全抗性。这种抗性典型地由很少的基因控制。使用CRISP-Cas9系统的方法和组分，现在存在一种新工具用于预先诱导其上的特定突变。因此，人们可以分析抗性基因的来源的基因组，并且在具有所希望特征或性状的植物中，使用CRISPR/Cas9系统的方法和组分以诱导抗性基因的发生。本发明的系统能做到具有比先前的诱变剂更好的精确性，并且因此加速并改良植物育种计划。

2.参与植物疾病的基因，如在WO 2013046247中列出的那些：

●米谷病：稻瘟病菌(Magnaporthe grisea)、宫部旋孢腔菌(Cochliobolusmiyabeanus)、立枯丝核菌(Rhizoctonia solani)、藤仓赤霉(Gibberella fujikuroi)；小麦病：小麦白粉病菌(Erysiphe graminis)、禾谷镰刀菌(Fusarium graminearum)、燕麦镰刀菌(F.avenaceum)、大刀镰刀菌(F.culmorum)、雪霉叶枯菌(Microdochium nivale)、条形柄锈菌(Puccinia striiformis)、禾柄锈菌(P.Graminis)、小麦叶锈菌(P.recondita)、粉红雪腐病菌(Micronectriella nivale)、核瑚菌属(Typhula sp.)、小麦黑粉菌(Ustilagotritici)、小麦网腥黑穗病菌(Tilletia caries)、小麦基腐病菌(Pseudocercosporellaherpotrichoides)、禾生球腔菌(Mycosphaerella graminicola)、小麦壳多孢(Stagonospora nodorum)、偃麦草核腔菌(Pyrenophora tritici-repentis)；大麦病：白粉病菌(Erysiphe graminis)、禾谷镰刀菌(Fusarium graminearum)、燕麦镰刀菌(F.avenaceum)、大刀镰刀菌(F.culmorum)、雪霉叶枯菌(Microdochium nivale)、条形柄锈菌(Puccinia striiformis)、禾柄锈菌(P.graminis)、大麦柄锈菌(P.hordei)、裸黑粉菌(Ustilago nuda)、大麦云纹斑病菌(Rhynchosporium secalis)、圆核腔菌(Pyrenophorateres)、禾旋孢腔菌(Cochliobolus sativus)、麦类核腔菌(Pyrenophora graminea)、立枯丝核菌(Rhizoctonia solani)；玉米病：玉米黑粉菌(Ustilago maydis)、异旋孢腔菌(Cochliobolus heterostrophus)、高粱胶尾孢(Gloeocercospora sorghi)、多堆柄锈菌(Puccinia polysora)、玉米灰斑病菌(Cercospora zeae-maydis)、茄丝核菌(Rhizoctoniasolani)；

●柑橘病害：黒点病菌(Diaporthe citri)、疮痂病菌(Elsinoe fawcetti)、指状青霉(Penicillium digitatum)、意大利青霉(P.italicum)、不全疫霉(Phytophthoraparasitica)、柑橘褐腐疫霉(Phytophthora citrophthora)；苹果病害：Monilinia mali、苹果树腐烂病菌(Valsa ceratosperma)、白叉丝单囊壳(Podosphaera leucotricha)、互隔交链孢菌苹果致病型(Alternaria alternata apple pathotype)、苹果黑星病菌(Venturia inaequalis)、尖孢炭疽菌(Colletotrichum acutatum)、恶疫霉(Phytophtoracactorum)；

●梨病害：梨黑星病菌(Venturia nashicola)、梨黑星菌(V.Pirina)、梨黑斑病菌(Alternaria alternata Japanese pear pathotype)、梨胶锈菌(Gymnosporangiumharaeanum)、恶疫霉(Phytophtora cactorum)；

●桃病害：美澳型核果褐腐病菌(Monilinia fructicola)、桃疮痂病(Cladosporiumcarpophilum)、拟茎点霉属(Phomopsis sp.)；

●葡萄病害：葡萄痂囊腔菌(Elsinoe ampelina)、檬果炭疽病菌(Glomerellacingulata)、Uninula necator、Phakopsora ampelopsidis、葡萄球座菌(Guignardiabidwellii)、葡萄生单轴霉(Plasmopara viticola)；

●柿子病害：柿炭疽病(Gloesporium kaki)、柿角斑病(Cercospora kaki)、柿叶球腔菌(Mycosphaerela nawae)；

●瓠果病害：瓜类炭疽菌(Colletotrichum lagenarium)、黄瓜白粉病菌(Sphaerotheca fuliginea)、黄瓜蔓枯病(Mycosphaerella melonis)、尖孢镰刀菌(Fusarium oxysporum)、黄瓜霜霉病菌(Pseudoperonospora cubensis)、疫霉属(Phytophthora sp.)、腐霉属(Pythium sp.)；

●西红柿病害：茄链格孢菌(Alternaria solani)、黄枝孢霉(Cladosporium fulvum)、致病疫霉(Phytophthora infestans)；

●茄子病害：褐纹病菌(Phomopsis vexans)、二孢白粉菌(Erysiphe cichoracearum)；

●十字花科蔬菜病害：萝卜链格孢菌(Alternaria japonica)、白菜白斑病菌(Cercosporella brassicae)、芸薹根肿病菌(Plasmodiophora brassicae)、寄生霜霉(Peronospora parasitica)；

●大葱病害：葱柄锈菌(Puccinia allii)、大葱霜霉(Peronospora destructor)；

●大豆病害：菊池尾孢菌(Cercospora kikuchii)、大豆黑痘病菌(Elsinoeglycines)、菜豆间座壳大豆变种(Diaporthe phaseolorum var.sojae)、大豆壳针孢(Septoria glycines)、大豆尾孢(Cercospora sojina)、豆薯层锈菌(Phakopsorapachyrhizi)、大豆疫霉病菌(Phytophthora sojae)、茄丝核菌(Rhizoctonia solani)、多主棒孢菌(Corynespora casiicola)、核盘菌(Sclerotinia sclerotiorum)；

●菜豆病害：菜豆炭疽病菌(Colletrichum lindemthianum)；

●花生病害：球座尾孢菌(Cercospora personata)、落花生尾孢(Cercosporaarachidicola)、齐整小核菌(Sclerotium rolfsii)；

●豌豆病害豌豆：豌豆白粉菌(Erysiphe pisi)；

●马铃薯病害：茄链格孢菌(Alternaria solani)、致病疫霉(Phytophthorainfestans)、马铃薯疫霉绯腐病菌(Phytophthora erythroseptica)、马铃薯粉痂菌(Spongospora subterranean)、f.sp.Subterranean；

●草莓病害：白粉病菌(Sphaerotheca humuli)、檬果炭疽病菌(Glomerellacingulata)；

●茶病害：茶网饼病菌(Exobasidium reticulatum)、白星病(Elsinoe leucospila)、拟盘多毛孢属(Pestalotiopsis sp.)、禾口炭疽病(Colletotrichum theae-sinensis)；

●烟草病害：烟草赤星病菌(Alternaria longipes)、二孢白粉菌(Erysiphecichoracearum)、烟草炭疽病菌(Colletotrichum tabacum)、烟草霜霉(Peronosporatabacina)、烟草疫霉菌(Phytophthora nicotianae)；●油菜籽病害：核盘菌(Sclerotiniasclerotiorum)、茄丝核菌(Rhizoctonia solani)；

●棉花病害：茄丝核菌(Rhizoctonia solani)；

●甜菜病害：甜菜尾孢菌(Cercospora beticola)、水稻纹枯病菌(Thanatephoruscucumeris)、水稻纹枯病菌(Thanatephorus cucumeris)、螺壳状丝囊霉(Aphanomycescochlioides)；

●玫瑰病害：蔷薇双壳菌(Diplocarpon rosae)、蔷薇单囊壳(Sphaerothecapannosa)、霜霉菌(Peronospora sparsa)；

●菊花和菊科病害：莴苣盘枝霉(Bremia lactuca)、野菊花壳针孢属(Septoriachrysanthemi-indici)、堀病柄锈菌(Puccinia horiana)；

●不同植物的病害：瓜果腐霉(Pythium aphanidermatum)、德巴利腐霉(Pythiumdebarianum)、禾草腐霉(Pythium graminicola)、畸雌腐霉(Pythium irregulare)、终极腐霉(Pythium ultimum)、灰葡萄孢菌(Botrytis cinerea)、核盘菌(Sclerotiniasclerotiorum)；

●萝卜病害：甘蓝链格孢(Alternaria brassicicola)；

●结缕草属病害：同果核盘菌(Sclerotinia homeocarpa)、茄丝核菌(Rhizoctoniasolani)；

●香蕉病害：香蕉黑条叶斑病菌(Mycosphaerella fijiensis、香蕉黄条叶斑病菌(Mycosphaerella musicola)；

●向日葵病害：向日葵霜霉病菌(Plasmopara halstedii)；

●种子病或由曲霉属、青霉属、镰刀菌属、赤霉菌属、木霉属(Tricoderma spp.)、根串珠霉属、根霉属、毛霉属、伏革菌属、Rhoma菌属、丝核菌属、壳色单隔孢属、或类似物引起的在不同植物生长最初阶段的疾病；

由多粘杆菌属(Polymixa spp.)、油壶菌属或类似物介导的不同植物的病毒病。

3.赋予针对除草剂的抗性的基因是实例：

●针对抑制生长点或分生组织的除草剂的抗性，如咪唑啉酮或磺酰脲，例如，分别由李(Lee)等人，《欧洲分子生物学学会杂志》(EMBO J.)7:1241(1988)和三木(Miki)等人，《理论与应用遗传学》(Theor.Appl.Genet.)80:449(1990)。

●草甘膦耐受性(分别由例如，突变体5-烯醇丙酮莽草酸-3-磷酸合酶(EPSP)基因、aroA基因和草甘膦乙酰转移酶(GAT)基因赋予的抗性)，或如由草铵膦(来自链霉菌种类的草胺膦乙酰转移酶(PAT)基因，包括吸水链霉菌和绿色产色链霉菌(Streptomycesviridichromogenes))赋予的针对其他膦酰基化合物的抗性，以及由编码ACC酶抑制剂的基因赋予的针对吡啶氧或苯氧基丙酸以及环己酮的抗性。参见，例如，美国专利号4,940,835以及美国专利6,248,876、美国专利号4,769,061、EP号0 333 033以及美国专利号4,975,374。还参见EP号0242246，德格里夫(DeGreef)等人，生物/技术(Bio/Technology)7:61(1989)，马歇尔(Marshall)等人，《理论与应用遗传学》(Theor.Appl.Genet.)83:435(1992)，WO 2005012515至卡斯尔(Castle)等人，以及WO 2005107437。

●针对抑制光合作用的除草剂的抗性，如三嗪(psbA和gs+基因)或苯腈(腈水解酶基因)、和谷胱甘肽S-转移酶，在匹兹皮拉(Przibila)等人，《植物细胞》(Plant Cell)3:169(1991)，美国专利号4,810,648，和海耶斯(Hayes)等人，《生物化学杂志》(Biochem.J.)285:173(1992)中。

●编码使除草剂解毒的酶或对抑制耐受的突变型谷氨酰胺合酶的基因，例如在美国专利申请序列号11/760,602中。或者，去毒酶是编码草丁膦乙酰转移酶的酶(如来自链霉菌种类的bar或pat蛋白)。草丁膦乙酰转移酶例如描述于美国专利号5,561,236；5,648,477；5,646,024；5,273,894；5,637,489；5,276,268；5,739,082；5,908,810以及7,112,665中。

●羟基苯丙酮酸双氧化酶(HPPD)抑制剂，即天然存在的HPPD耐受性酶，或编码突变或嵌合的HPPD酶的基因，如描述于WO 96/38567、WO 99/24585、及WO 99/24586、WO 2009/144079、WO 2002/046387、或美国专利号6,768,044中。

4.参与非生物胁迫耐受性的基因的实例：

●转基因能够降低植物细胞或植物中聚(ADP核糖)聚合酶(PARP)基因的表达和/或活性，如描述于WO 00/04173或、WO/2006/045633中。

●转基因能够降低植物或植物细胞中编码PARG的基因的表达和/或活性，如描述于例如WO 2004/090140中。

●编码烟酰胺腺嘌呤二核苷酸分段合成途径的植物功能性酶的转基因，包括烟酰胺酶、烟酰酸磷酸核糖基转移酶、烟酸单核苷酸腺嘌呤转移酶、烟酰胺腺嘌呤二核苷酸合成酶或烟酰胺磷酸核糖基转移酶，如描述于例如EP 04077624.7、WO 2006/133827、PCT/EP07/002,433、EP 1999263、或WO 2007/107326中。

●参与碳水化合物生物合成的酶包括描述于以下各项中的那些酶，例如EP 0571427、WO 95/04826、EP 0719338、WO 96/15248、WO 96/19581、WO 96/27674、WO 97/11188、WO 97/26362、WO 97/32985、WO 97/42328、WO 97/44472、WO 97/45545、WO 98/27212、WO 98/40503、WO99/58688、WO 99/58690、WO 99/58654、WO 00/08184、WO 00/08185、WO 00/08175、WO 00/28052、WO 00/77229、WO 01/12782、WO 01/12826、WO 02/101059、WO 03/071860、WO2004/056999、WO 2005/030942、WO 2005/030941、WO 2005/095632、WO 2005/095617、WO2005/095619、WO 2005/095618、WO 2005/123927、WO 2006/018319、WO 2006/103107、WO2006/108702、WO 2007/009823、WO 00/22140、WO 2006/063862、WO 2006/072603、WO 02/034923、EP 06090134.5、EP 06090228.5、EP 06090227.7、EP 07090007.1、EP 07090009.7、WO 01/14569、WO 02/79410、WO 03/33540、WO 2004/078983、WO 01/19975、WO 95/26407、WO96/34968、WO 98/20145、WO 99/12950、WO 99/66050、WO 99/53072、美国专利号6,734,341、WO 00/11192、WO 98/22604、WO 98/32326、WO 01/98509、WO 01/98509、WO 2005/002359、美国专利号5,824,790、美国专利号6,013,861、WO 94/04693、WO 94/09144、WO 94/11520、WO95/35026或WO 97/20936，或参与多聚果糖(尤其是菊糖和果聚糖蔗类型)生产(如披露于EP0663956、WO 96/01904、WO 96/21023、WO 98/39460、及WO 99/24593中)、参与α-1,4-葡聚糖生产(如披露于WO 95/31553、US 2002031826、美国专利号6,284,479、美国专利号5,712,107、WO 97/47806、WO 97/47807、WO 97/47808以及WO 00/14249中)、参与α-1,6支链α-1,4-葡聚糖生产(如披露于WO2010/00/73422中)、参与alternan产生(如披露于例如WO 00/47727、WO 00/73422、EP 06077301.7、美国专利号5,908,975以及EP 0728213中)、参与透明质酸产生(如披露于例如WO 2006/032538、WO 2007/039314、WO 2007/039315、WO 2007/039316、JP 2006304779、以及WO 2005/012529中)的酶。

●改进抗旱性的基因。例如，WO 2013122472披露了功能性遍在蛋白-蛋白质连接酶蛋白(UPL)蛋白，更确切地说，UPL3的缺少或水平降低导致所述植物对水的需求降低或针对干旱的抗性改善。具有增加的耐旱性的转基因植物的其他实例披露于，例如，US 2009/0144850、US 2007/0266453、以及WO 2002/083911中。US2009/0144850描述了由于改变的DR02核酸表达，植物显示出耐旱性表型。US 2007/0266453描述了由于改变的DR03核酸表达，植物显示出耐旱性表型，并且WO 2002/08391 1描述了由于在保卫细胞中表达的ABC转运体活性降低，植物具有对干旱胁迫增加的耐受性。另一个实例是春日(Kasuga)及诸位共同作者的工作(1999)，他们描述了编码DREB1A的cDNA在转基因植物过量表达在正常生长条件下活化了许多逆境耐性基因的表达并且导致改进的耐旱性、耐盐负荷性、及耐冻性。然而，DREB1A的表达还导致了在正常生长条件下的严重生长迟缓(春日(Kasuga)(1999)《自然生物技术》(Nat Biotechnol)17(3)287-291)。

在另外的具体实施例中，可以通过影响特定植物性状来改善作物植物。例如，通过开发杀有害生物剂抗性植物、改善植物的抗病性、改善植物的昆虫和线虫抗性、改善植物对抗寄生杂草的抗性、改善植物的耐旱性、改善植物的营养价值、改善植物的逆境耐性、避免自体受粉、植物性饲料可消化性生物量、粮食产量等。以下提供了几个具体的非限制性实例。

除了对单个基因的定向突变之外，可以将Cas9CRISPR复合物设计成允许植物中多个基因的定向突变、染色体片段的缺失、转基因的位点特异性整合、体内定点诱变、以及精确的基因置换或等位基因互换。因此，在此描述的这些方法在基因发掘和验证、突变和同种基因(cisgenic)育种、以及杂交育种中具有广泛应用。这些应用有助于产生新一代具有不同改良的农艺性状的基因改造农作物，如除草剂耐受性、抗病性、非生物胁迫耐受性、高产率、以及优越的品质。

使用Cas9基因以产生雄性不育植物

相比于近交植物，杂种植物典型地具有有利的农艺性状。然而，对于自体受粉植物，产生杂种可以是挑战性的。在不同植物类型中，已经鉴定出对植物能育性，更具体是雄性能育性非常重要的基因。例如，在玉米中，已经鉴定出至少两个在能育性方面非常重要的基因(新植物育种分子技术、技术开发与规范阿米塔布莫汉蒂国际会议(Amitabh MohantyInternational Conference on New Plant Breeding Molecular TechnologiesTechnology Development And Regulation)，2014年10月9日-10日，斋蒲尔(Jaipur)，印度；斯威塔斯夫(Svitashev)等人，《植物生理学》(Plant Physiol.)2015年10月；169(2):931-45；久卡诺维奇(Djukanovic)等人，《植物杂志》(Plant J.)2013年12月；76(5):888-99)。可以将在此提供的这些方法用于靶向雄性能育性所需的基因，以便产生可以容易地进行杂交以产生杂种的雄性不育植物。在具体实施例中，将在此提供的CRISPR/Cas9系统用于靶向诱变细胞色素P450像基因(MS26)或大范围核酸酶基因(MS45)，由此赋予玉米植物雄性不育性。可以将如此遗传改变的玉米植物用于杂交育种计划中。

增加植物的生育期

在具体实施例中，将在此提供的这些方法用于延长植物(如水稻植株)的生育期。例如，可以靶向水稻生育期基因(如Ehd3)，以便产生基因突变并且可以针对延长的再生植物生育期选择小植株(如在CN 104004782中所描述的)。

使用Cas9以在感兴趣的作物中产生遗传变异

野生种质和作物植物遗传变异的可用性是作物改善计划的关键，但来自作物植物的种质的可用多样性是有限的。本发明设想用于在感兴趣的种质中产生遗传变异多样性的方法。在CRISPR/Cas9系统的该应用中提供了靶向植物基因组中不同位置的chi/sgRNA文库并且将其与Cas9效应蛋白一起引入植物细胞中。以此方式，可以产生一批基因组范围点突变和基因敲除。在具体实施例中，这些方法包括从如此获得的细胞产生植物部分或植物以及针对感兴趣的性状筛选细胞。靶基因可以包括编码及非编码区。在具体实施例中，该性状是逆境耐性并且该方法是用于产生逆境耐受性作物品种的方法。

使用Cas9以影响果实成熟

成熟是果实和蔬菜成熟过程中的正常阶段。成熟开始后仅几天就使得果实或蔬菜不可食用。这个过程给农民和消费者都带来重大损失。在具体实施例中，将本发明的方法用于减少乙烯产生。这通过确保以下各项中的一个或多个来确保：a.抑制ACC合酶基因表达。ACC(1-氨基环丙烷-1-羧酸)合酶是负责将S-腺苷甲硫氨酸(SAM)转化成ACC的酶；乙烯生物合成中的第二至最后一步。当将合酶基因的反义(“镜像(mirror-image)”)或截短的拷贝插入到植物基因组中时，酶表达受阻；b.插入ACC脱氨酶基因。编码该酶的基因获得自绿针假单胞菌(Pseudomonas chlororaphis)，一种常见的非病原性土壤细菌。它将ACC转化为不同的化合物，从而减少可供用于乙烯生产的ACC量；c.插入SAM水解酶基因。这种方法类似于ACC脱氨酶，其中当乙烯前体代谢物的量减少时，它的生产受阻；在这种情况下，SAM被转化成同型丝氨酸。编码该酶的基因获得自大肠杆菌T3噬菌体，以及d.抑制ACC氧化酶基因表达。ACC氧化酶是催化ACC氧化成乙烯的酶，乙烯生物合成途径的最后步骤。使用在此描述的方法，下调ACC氧化酶基因导致乙烯生产的抑制，由此延迟果实成熟。在具体实施例中，另外地或可替代地，对于以上描述的修饰，将在此所描述的方法用于修饰乙烯受体，以便干扰通过果实获得的乙烯信号。在具体实施例中，对编码乙烯结合蛋白的ETR1基因表达进行修饰，更具体是抑制。在具体实施例中，另外地或可替代地，对于以上描述的修饰，将在此所描述的方法用于修饰编码多聚半乳糖醛酸酶(PG)的基因表达，它是负责分解果胶的酶，该物质维持植物细胞壁的完整性。果胶分解发生在成熟过程一开始时，由此导致果实的软化。因此，在具体实施例中，将在此描述的方法用于将突变引入PG基因中或抑制PG基因的活化，以便减少所产生的PG酶量，由此延迟果胶降解。

因此，在具体实施例中，这些方法包括使用CRISPR/Cas9系统以确保如以上所描述的植物细胞基因组的一个或多个修饰，并且从中再生植物。在具体实施例中，植物是西红柿植株。

增加植物的贮存寿命

在具体实施例中，将本发明的方法用于修饰参与影响植物或植物部分贮存寿命的化合物生产的基因。更具体地说，修饰发生在防止还原糖在马铃薯块茎中累积的基因中。当高温处理时，这些还原糖与游离氨基酸反应，由此产生棕色、苦味产物和升高的丙烯酰胺水平，其中一种潜在致癌物。在具体实施例中，将在此提供的方法用于减少或抑制液泡转化酶基因(VInv)的表达，其编码将蔗糖分解为葡萄糖和果糖的蛋白(克拉森(Clasen)等人，DOI:10.1111/pbi.12370)。

使用CRISPR/Cas9系统以确保附加价值的性状

在具体实施例中，将CRISPR/Cas9系统用于产生营养改善的农作物。在具体实施例中，在此提供的这些方法被适配成产生“功能性食品”，即可以提供超出传统营养物质的健康益处的改性食品或食品成分，它包含和或“营养保健食品”，即可以被认为是食品或食品部分并且提供健康益处(包括预防和治疗疾病)的物质。在具体实施例中，营养保健食品可用于预防和/或治疗癌症、糖尿病、心血管疾病、以及高血压中的一种或多种。

营养改善的作物的实例包括(纽厄尔-麦克格洛克林(Newell-McGloughlin)，《植物生理学》(Plant Physiology)，2008年7月，第147卷，第939-953页)：

修饰的蛋白质量、含量和/或氨基酸组成，如已针对百喜草所描述的(卢西亚尼(Luciani)等人，2005，《佛罗里达遗传学会议海报》(Florida Genetics ConferencePoster))，油菜(勒斯勒尔(Roesler)等人，1997，《植物生理学》(Plant Physiol)113 75-81)，玉米(克伦威尔(Cromwell)等人，1967,1969《动物科学杂志》(J Anim Sci)26 1325-1331，奥奎因(O’Quin)等人，2000《动物科学杂志》(J Anim Sci)782144-2149，杨(Yang)等人，2002，《转基因研究》(Transgenic Res)11 11-20，扬(Young)等人，2004，《植物杂志》(Plant J)38 910-922)，马铃薯(于(Yu)J和欧(Ao)，1997《植物学报》(Acta Bot Sin)39329-334；查克拉博蒂(Chakraborty)等人，2000，《美国国家科学院院刊》(Proc NatlAcad Sci USA)973724-3729；李(Li)等人，2001)《中国科学通报》(Chin Sci Bull)46 482-484，稻(胜部(Katsube)等人，1999，《植物生理学》(Plant Physiol)120 1063-1074)，大豆(丁金斯(Dinkins)等人，2001，拉普(Rapp)2002，《体外细胞与发育生物学植物》(In VitroCell Dev Biol Plant)37 742-747)，甘薯(英格宁(Egnin)和普拉卡什(Prakash)1997，《体外细胞与发育生物学》(In Vitro Cell Dev Biol)33 52A)。

必需氨基酸含量，如已针对油菜所描述的(法尔科(Falco)等人，1995,《生物/技术》(Bio/Technology)13 577–582)，羽扇豆(怀特(White)等人，2001,《食品与农业科学杂志》(J Sci Food Agric)81 147–154)，玉米(莱(Lai)和梅辛(Messing)，2002，Agbios 2008GM作物数据库(2008年3月11日))，马铃薯(泽(Zeh)等人，2001，《植物生理学》(PlantPhysiol)127 792–802)，高粱(Sorghum)(赵(Zhao)等人，2003，克吕韦尔学术出版集团(Kluwer Academic Publishers)，多德雷赫特(Dordrecht)，荷兰(The Netherlands)，第413–416页)，大豆(法尔科(Falco)等人，1995《生物/技术》(Bio/Technology)13 577–582；加利尔(Galili)等人，2002《植物科学评论》(Crit Rev Plant Sci)21 167-204)。

如对于油菜的油和脂肪酸(迪赫斯(Dehesh)等人，(1996)《植物杂志》(Plant J)9167-172[PubMed]；德尔维齐奥(Del Vecchio)(1996)《脂肪、油和相关材料的国际新闻》(INFORM)(International News on Fats,Oils and Related Materials)7 230-243；勒斯勒尔(Roesler)等人，(1997)《植物生理学》(Plant Physiol)113 75-81[PMC免费文章][PubMed]；弗罗曼(Froman)和乌尔辛(Ursin)(2002，2003)《美国化学学会论文摘要》(Abstracts of Papers of the American Chemical Society)223U35；詹姆斯(James)等人，(2003)《美国临床营养学杂志》(Am J Clin Nutr)77 1140-1145[PubMed]；Agbios(2008，上述)；库顿(coton)(查普曼(Chapman)等人，(2001)。《美国石油化学会杂志》(J AmOil Chem Soc)78 941-947；刘(Liu)等人，(2002)《美国营养学院杂志》(J Am Coll Nutr)21 205S-211S[PubMed]；奥尼尔(O’Neill)(2007)《澳大利亚生命科学家》(AustralianLife Scientist.)http://www.biotechnews.com.au/index.php/id；866694817；fp；4；fpid；2(2008年6月17日)，亚麻籽(阿巴迪(Abbadi)等人，2004，《植物细胞》(Plant Cell)16:2734-2748)，玉米(杨(Young)等人，2004，《植物杂志》(Plant J)38 910-922)，油棕(贾兰尼(Jalani)等人，1997，《美国石油化学会杂志》(J Am Oil Chem Soc)74 1451-1455；帕尔韦兹(Parveez)，2003，AgBiotechNet 113 1-8)，稻(爱能(Anai)等人，2003，《植物细胞报告》(Plant Cell Rep)21 988-992)，大豆(雷迪(Reddy)和托马斯(Thomas)，1996，《自然生物技术》(Nat Biotechnol)14 639-642；金尼(Kinney)和沃尔顿(Kwolton)，1998，《布莱基学术及专业》(Blackie Academic and Professional)，伦敦，第193-213页)，向日葵(阿尔卡迪亚(Arcadia)，《生物科学》(Biosciences)2008)

糖类，如对于菊苣所描述的果聚糖(斯密肯斯(Smeekens)(1997)《植物科学发展趋势》(Trends Plant Sci)2 286-287，施普伦格(Sprenger)等人，(1997)《欧洲生化学会联合会快报》(FEBS Lett)400 355-358，塞维尼埃(Sévenier)等人，(1998)《自然生物技术》(NatBiotechnol)16 843-846)，玉米(凯米(Caimi)等人，(1996)《植物生理学》(Plant Physiol)110 355-363)，马铃薯(黑尔韦格(Hellwege)等人，1997《植物杂志》(Plant J)12 1057-1065)，甜菜(斯密肯斯(Smeekens)等人，1997，上述)，菊糖，如针对马铃薯所描述的(黑尔韦格(Hellewege)等人，2000，《美国国家科学院院刊》(Proc Natl Acad Sci USA)97 8699-8704)，淀粉，如针对稻所描述的(施瓦尔(Schwall)等人，(2000)《自然生物技术》(NatBiotechnol)18551-554，蒋(Chiang)等人，(2005)《分子育种》(Mol Breed)15125-143)，

维生素类和类葫萝卜素，如针对油菜所描述的(新谷(Shintani)和德拉佩纳(DellaPenna)(1998)《科学》(Science)2822098-2100)，玉米(罗契福特(Rocheford)等人，(2002)。《美国营养学院杂志》(J Am Coll Nutr)21191S-198S，卡胡恩(Cahoon)等人，(2003)《自然生物技术》(Nat Biotechnol)211082-1087，陈(Chen)等人，(2003)《美国国家科学院院刊》(Proc Natl Acad Sci USA)1003525-3530)，芥菜籽(休梅克(Shewmaker)等人，(1999)《植物杂志》(Plant J)20401-412，马铃薯(杜克莱(Ducreux)等人，2005，《实验植物学杂志》(J Exp Bot)5681-89)，稻(叶(Ye)等人，(2000)《科学》(Science)287303-305，草莓(阿吉厄斯(Agius)等人，(2003)，《自然生物技术》(Nat Biotechnol)21177-181)，西红柿(罗萨蒂(Rosati)等人，(2000)《植物杂志》(Plant J)24413-419，弗雷泽(Fraser)等人，(2001)《食品与农业科学杂志》(J Sci Food Agric)81822-827，梅塔(Mehta)等人，(2002)《自然生物技术》(Nat Biotechnol)20613-618，迪亚斯·德拉·伽兹(Díaz de la Garza)等人，(2004)《美国国家科学院院刊》(Proc Natl Acad Sci USA)10113720-13725，因芬西(Enfissi)等人，(2005)《植物生物技术杂志》(Plant Biotechnol J)317-27，德拉佩纳(DellaPenna)(2007)《美国国家科学院院刊》(Proc Natl Acad Sci USA)1043675-3676。

功能性次级代谢产物，如对于苹果所描述的(芪，斯赞科夫斯基(Szankowski)等人，(2003)《植物细胞报告》(Plant Cell Rep)22:141-149)，苜蓿(白藜芦醇，希普斯金(Hipskind)和派瓦(Paiva)(2000)《分子植物微生物相互作用》(Mol Plant MicrobeInteract)13551-562)，猕猴桃(白藜芦醇，小林(Kobayashi)等人(2000)《植物细胞报告》(Plant Cell Rep)19904-910)，玉米和大豆(黄酮类，于(Yu)等人，(2000)《植物生理学》(Plant Physiol)124781-794)，马铃薯(花青苷和生物碱糖苷，鲁卡斯瑟维克茨(Lukaszewicz)等人，(2004)《农业食品化学期刊》(J Agric Food Chem)521526-1533)，稻(黄酮类和白藜芦醇，斯塔克-洛伦森(Stark-Lorenzen)等人，(1997)《植物细胞报告》(Plant Cell Rep)16668-673，申(Shin)等人，(2006)《植物生物技术杂志》(PlantBiotechnol J)4303-315)，西红柿(+白藜芦醇、氯原酸、黄酮类、芪；罗萨蒂(Rosati)等人，(2000)上述，缪尔(Muir)等人，(2001)《自然》(Nature)19470-474，尼格威戈(Niggeweg)等人，(2004)《自然生物技术》(Nat Biotechnol)22746-754，焦维纳佐(Giovinazzo)等人，(2005)《植物生物技术杂志》(Plant Biotechnol J)357-69)，小麦(咖啡酸和阿魏酸、白藜芦醇；美国合众国际新闻社(United Press International)(2002))；以及

矿物质获取，如针对苜蓿所描述的(植酸酶，奥斯汀-菲利普斯(Austin-Phillips)等人，(1999)http://www.molecularfarming.com/nonmedical.html)，莴苣(Lettuse)(铁，戈托(Goto)等人，(2000)《理论与应用遗传学》(Theor Appl Genet)100658-664)，稻(铁，卢卡(Lucca)等人(2002)《美国营养学院杂志》(J Am Coll Nutr)21184S-190S)，玉米、大豆和小麦(植酸酶，德雷卡卡基(Drakakaki)等人，(2005)《植物分子生物学》(Plant Mol Biol)59869-880，登堡(Denbow)等人，(1998)《家禽科学》(Poult Sci)77878-881，布尔克-佩德森(Brinch-Pedersen)等人，(2000)《分子育种》(Mol Breed)6195-206)。

在具体实施例中，附加价值的性状与存在于植物中的化合物的所设想的健康益处相关。例如，在具体实施例中，通过应用本发明的方法获得附加价值的作物，以确保修饰或诱导/增加以下化合物中的一种或多种的合成：

类葫萝卜素，如存在于胡萝卜中的α-胡萝卜素，其中和可对细胞造成损害的自由基，或存在于不同果实和蔬菜中的β-胡萝卜素，其中和自由基

存在于青菜中的叶黄素，其有助于到维持健康的视力

存在于西红柿和西红柿产物的西红柿红素，其被认为能降低前列腺癌的风险

存在于柑橘和玉米中的玉米黄素，其有助于到维持健康的视力

存在于麦麸中的膳食纤维，如不溶性纤维，其可以降低乳腺癌和/或结肠癌的风险，以及存在于燕麦中的β-葡聚糖、存在于洋车前子(Psylium)和全谷类谷物中的可溶性纤维，其可以降低心血管疾病(CVD)的风险

脂肪酸，如ω-3脂肪酸，其可以降低CVD的风险并且改进心智和视觉功能，共轭亚油酸，其可以改善身体组成，可以降低某些癌症的风险，以及GLA，其可以降低癌症和CVD的炎症风险，可以改善身体组成

存在于小麦中的黄酮类，如羟基苯乙烯，其具有抗氧化剂样活性，可以降低退行性疾病的风险，存在于果实和蔬菜中的黄酮醇、儿茶素类和单宁，其中和自由基并且可以降低癌症的风险

存在于十字花科蔬菜(西兰花、羽衣甘蓝)、辣根中的芥子油苷、吲哚、异硫氰酸酯，如萝卜硫素，其中和自由基，可以降低癌症的风险

存在于葡萄中的酚类，如芪，其可以降低退行性疾病、心脏病、和癌症的风险，可具有延年益寿功效，以及存在于蔬菜和柑橘中的咖啡酸和阿魏酸，其可具有抗氧化剂样活性，其可以降低退行性疾病、心脏病、和眼病的风险，以及存在于可可豆中的表儿茶素，其具有抗氧化剂样活性，可以降低退行性疾病和心脏病的风险

存在于玉米、大豆、小麦以及木制油类中的植物甾烷醇/甾烷醇，可以通过降低血液胆固醇水平来降低冠心病的风险

存在于洋姜、胡葱、洋葱粉中的果聚糖、菊糖、低聚果糖，其可以改善胃肠道健康

存在于大豆中的皂苷类，其可以降低LDL胆固醇

存在于大豆中的大豆蛋白质，其可以降低心脏病的风险

存在于大豆中的植物雌激素，如异黄酮，其可以减少更年期症状(如热潮红)，可以减少骨质疏松症，以及存在于亚麻、黑麦和蔬菜中的CVD和木脂素类，其可以抵抗心脏病和一些癌症，可以降低LDL胆固醇、总胆固醇。

存在于洋葱、大蒜、橄榄、韭和青葱(scallon)中的硫化物和硫醇类，如烯丙基硫，以及存在于十字花科蔬菜中的烯丙基甲基三硫、二硫酚硫酮(dithiolthiones)，其可以降低LDL胆固醇、有助于维持健康的免疫系统

存在于蔓越橘、可可中的单宁，如原花色素，其可以改善泌尿道健康、可以降低CVD和高血压的风险

等。

此外，本发明的方法还设想修饰蛋白/淀粉功能、保质期、味道/美观、纤维品质、以及过敏原、抗营养素、和毒素减少性状。

在一个实施例中，植物可以是豆科植物。本发明可以利用在此披露的CRISP-Cas9系统用于探索并修饰，例如但不限于大豆、豌豆、和花生。柯廷(Curtin)等人提供了一种针对豆科植物功能基因组学的工具箱。(参见柯廷等人，“用于豆科植物功能基因组学的基因组工程工具箱(A genome engineering toolbox for legume Functional genomics)”，第22届国际植物和动物基因组会议(International Plant and Animal Genome ConferenceXXII)2014)。柯廷使用了CRISPR的遗传转化以敲除/敲低发根与全株系统中的单拷贝和复制豆科植物基因二者。选择这些靶基因中的一些以便探索和优化敲除/敲低系统的特征(例如，八氢西红柿红素不饱和酶)，而通过大豆与拟南芥切片机样基因的同源性或通过苜蓿属中结瘤的全基因组关联研究来鉴定其他靶基因。

花生过敏症以及豆科植物过敏症通常是真实并且严重的健康问题。本发明的CRISPR-Cas9效应蛋白系统可以用于鉴别并且然后编辑或沉默编码此类豆科植物的变应原性蛋白的基因。对于此类基因和蛋白没有限制，尼科拉乌(Nicolaou)等人鉴别了花生、大豆、扁豆、豌豆、羽扇豆、青豆、和绿豆中的变应原性蛋白。参见，尼科拉乌(Nicolaou)等人，变态反应学与临床免疫学当前观点(Current Opinion in Allergy and ClinicalImmunology)，2011；11(3)：222)。

因此，本发明涵盖用于生产具有附加营养价值的植物的方法，所述方法包括使用如在此描述的CRISPR/Cas9系统，向植物细胞中引入编码参与生产附加营养价值的组分的酶的基因，以及从所述植物细胞中再生植物，所述植物的特征在于附加营养价值的所述组分的表达增加。在具体实施例中，将CRISPR/Cas9系统用于间接修饰这些化合物的内源合成，例如通过修饰控制这种化合物代谢的一种或多种转录因子。以上在此描述了使用CRISPR/Cas9系统用于将感兴趣的基因引入植物细胞中和/或修饰内源基因的方法。

已经修饰为赋予附加价值性状的植物修饰的一些具体实例是：具有修饰的脂肪酸代谢的植物，例如，通过用十八烷酰-ACP脱饱和酶的反义基因转化植物以增加植物的硬脂酸含量。参见卡努赞(Knultzon)等人，《美国国家科学院院刊》(Proc.Natl.Acad.Sci.U.S.A.)89:2624(1992)。另一个实例涉及降低植酸盐含量，例如通过克隆并且然后再引入与可以负责特征为低水平植酸的玉米突变体的单个等位基因关联的DNA。参见瑞波伊(Raboy)等人，Maydica 35:383(1990)。

类似地，玉米(玉蜀黍(Zea mays))Tfs C1和R的表达，其在强启动子的控制下调节玉米糊粉层中的黄酮类的生产，导致拟南芥属(拟南芥)中花青素的高累积速率，据推测是通过活化整个途径(布鲁斯(Bruce)等人，2000，《植物细胞》(Plant Cell)12:65-80)。德拉佩纳(DellaPenna)(韦尔施(Welsch)等人，2007《植物生物学年鉴》(Annu Rev Plant Biol)57:71-738)发现了，Tf RAP2.2及其相互作用配偶体SINAT2增加了拟南芥叶子中的胡萝卜素合成。表达Tf Dof1诱导编码用于碳骨架生产的酶的基因的上调、氨基酸含量的显着增加、以及转基因拟南芥属Glc水平的降低(柳泽(Yanagisawa)，2004《植物细胞生理学》(PlantCell Physiol)45:386-391)，并且DOF Tf AtDof1.1(OBP2)上调拟南芥属中芥子油苷生物合成途径的所有步骤(斯科尔里茨(Skirycz)等人，2006，《植物杂志》(Plant J)47:10-24)。

减少植物中的过敏原

在具体实施例中，本文提供的方法用于产生具有降低水平的过敏原的植物，使得它们对于消费者更安全。在具体实施例中，这些方法包括改变促成植物过敏原的产生的一个或多个基因的表达。例如，在具体实施例中，这些方法包括下调植物细胞(例如黑麦草植物细胞)中Lol p5基因的表达，并且从其再生植物以降低所述植物的花粉的致敏性(巴拉(Bhalla)等人，1999，《美国国家科学院院刊》(Proc.Natl.Acad.Sci.USA)第96卷：11676-11680)。

感兴趣的内源基因的筛选方法

本文提供的方法进一步允许跨物种、门和植物界鉴定对具有增加的营养价值的组分的产生中涉及的酶进行编码的有价值基因，或者总体上影响感兴趣的农艺性状的基因。通过使用如本文所述的CRISPR/Cas9系统选择性地靶向例如编码植物中的代谢途径的酶的基因，可以鉴定负责植物的某些营养方面的基因。类似地，通过选择性地靶向可以影响令人希望的农艺性状的基因，可以鉴定相关的基因。因此，本发明涵盖编码以下酶的基因的筛选方法，所述酶涉及具有特定营养价值和/或农艺性状的化合物的产生。

CRISPR/Cas9系统在植物和酵母中的另外的应用

在生物燃料生产中CRISPR/Cas9系统的用途

如本文使用的术语“生物燃料”是从植物和植物衍生的资源制成的替代燃料。可再生生物燃料可以提取自已经通过固碳过程获得其能量的有机物质，或者是通过生物质的使用或转化来制得。这种生物质可以直接用于生物燃料或可以通过热转化、化学转化、和生物化学转化而转化为便利的含能量物质。这种生物质转化可以导致处于固体、液体、或气体形式的燃料。存在两种类型的生物燃料：生物乙醇和生物柴油。生物乙醇主要是通过大部分衍生自玉米和甘蔗的纤维素(淀粉)的糖发酵工艺产生。在另一方面生物柴油主要产自油料作物如油菜籽、棕榈、和大豆。生物燃料是主要用于运输。

增强用于生物燃料生产的植物特性

在具体实施例中，使用采用了如本文所述的CRISPR/Cas9系统的方法来改变细胞壁特性，以便促进由关键水解试剂的接近，以用于更有效释放用于发酵的糖。在具体实施例中，纤维素和/或木质素的生物合成被修饰。纤维素是细胞壁的主要组分。纤维素和木质素的生物合成被共调节。通过降低木质素在植物中的比例，可以增加纤维素的比例。在具体实施例中，使用本文描述的方法下调植物中的木质素生物合成，从而增加可发酵的碳水化合物。更具体地，使用本文描述的方法来下调选自下组的至少一种第一木质素生物合成基因，该组由以下各项组成：4-香豆酸3-羟化酶(C3H)、苯丙氨酸氨裂解酶(PAL)、肉桂酸4-羟化酶(C4H)、羟基肉桂酰转移酶(HCT)、咖啡酸O-甲基转移酶(COMT)、咖啡酰CoA 3-O-甲基转移酶(CCoAOMT)、阿魏酸5-羟化酶(F5H)、肉桂醇脱氢酶(CAD)、肉桂酰CoA-还原酶(CCR)、4-香豆酸-CoA连接酶(4CL)、单木质醇-特异性糖基转移酶、和醛脱氢酶(ALDH)，如WO 2008064289A2中所披露的。

在具体实施例中，使用本文描述的方法来产生植物物质，该植物物质在发酵过程中产生更低水平的乙酸(还参见WO 2010096488)。更具体地，本文披露的方法用于产生与CaslL同源的突变，以降低多糖乙酰化。

修饰酵母以用于生物燃料生产

在具体实施例中，本文提供的Cas9酶用于由重组微生物进行生物乙醇生产。例如，可以使用Cas9来改造微生物，例如酵母，以从可发酵糖产生生物燃料或生物聚合物，并且以任选地能够降解源自农业废物的植物衍生木质纤维素(作为可发酵糖的来源)。更具体地，本发明提供了以下方法，借由这些方法使用该CRISPR/Cas9复合物以将生物燃料生产所需的外源基因引入微生物中和/或修饰可干扰生物燃料合成的内源基因。更具体地，这些方法涉及将编码以下酶的一个或多个核苷酸序列引入微生物例如酵母中，这些酶涉及丙酮酸到乙醇或另一种感兴趣产物的转化。在具体实施例中，这些方法确保引入允许微生物降解纤维素的一种或多种酶，例如纤维素酶。在又另外的实施例中，使用CRISPR/Cas9复合物来修饰与生物燃料生产途径竞争的内源代谢途径。

因此，在更具体的实施例中，使用本文描述的方法如下修饰微生物：

-引入至少一种异源核酸或增加至少一种内源核酸的表达，所述核酸编码植物细胞壁降解酶，使得所述微生物能够表达所述核酸并且产生和分泌所述植物细胞降解酶；

-引入至少一种异源核酸或增加至少一种内源核酸的表达，所述核酸编码将丙酮酸转化为乙醛的酶(可任选地以上核酸与编码将乙醛转化为乙醇的酶的至少一种异源核酸组合)，使得所述宿主细胞能够表达所述核酸；和/或

-修饰对所述宿主细胞中代谢途径中的酶进行编码的至少一种核酸，其中所述途径产生除了来自丙酮酸的乙醛或来自乙醛的乙醇外的代谢物，并且其中所述修饰导致所述代谢物的降低的产生，或者引入对所述酶的抑制剂进行编码的至少一种核酸。

修饰藻类和植物以用于生产植物油或生物燃料

转基因藻类或其他植物，如油菜，可以在植物油或生物燃料例如像醇类(尤其是甲醇和乙醇)的生产中特别有用。这些可以被工程化为表达或过表达高水平的油或醇类，以供在油或生物燃料行业中使用。

US 8945839描述了使用Cas9改造微藻(莱氏衣藻细胞)物种的方法。使用类似方式，本文描述的CRISPR/Cas9系统的方法可以应用于衣藻属物种和其他藻类。在具体实施例中，在藻类中引入Cas9和chi/sgRNA，其使用在组成型启动子如Hsp70A-Rbc S2或β2-微管蛋白的控制下表达Cas9的载体进行表达。chi/sgRNA将使用含有T7启动子的载体来递送。可替代地，Cas9mRNA和体外转录的chi/sgRNA可以被递送到藻类细胞中。电穿孔方案遵循来自GeneArt Chlamydomonas Engineering试剂盒的标准推荐方案。

使用Cas9产生能够生产脂肪酸的微生物

在具体实施例中，本发明的方法用于产生基因工程化的能够产生脂肪酸酯例如脂肪酸甲酯(“FAME”)和脂肪酸乙酯(“FAEE”)的微生物。

在具体实施例中，设想特异性地修饰以下基因，这些基因涉及改变由藻类细胞产生的脂质的量和/或脂质的品质。编码涉及脂肪酸合成途径的酶的基因的实例可以编码具有例如以下酶的活性的蛋白：乙酰CoA羧化酶，脂肪酸合酶，3-酮脂酰-酰基载体蛋白合酶III，甘油-3-磷酸脱氢酶(G3PDH)，烯酰-酰基载体蛋白还原酶(烯酰-ACP-还原酶)，甘油-3-磷酸酰基转移酶，溶血磷脂酸酰基转移酶或二酰基甘油酰基转移酶，磷脂:二酰基甘油酰基转移酶，磷脂酸磷酸酶，脂肪酸硫酯酶如棕榈酰蛋白硫酯酶，或苹果酸酶。在另外的实施例中，设想产生具有增加的脂质积累的硅藻。这可以通过靶向降低脂质异化作用的基因来实现。对于用于本发明方法特别感兴趣的是涉及活化三酰甘油和游离脂肪酸两者的基因，连同直接涉及脂肪酸的β-氧化的基因，如酰基-CoA合成酶、3-酮脂酰-CoA硫解酶、酰基-CoA氧化酶活性和葡糖磷酸变位酶。本文所述的Cas9系统和方法可以用于特异性地激活硅藻中的此类基因以增加其脂质含量。

典型地，宿主细胞可以被工程化为通过表达或过表达编码硫酯酶的基因、编码酰基-CoA合酶的基因、以及编码酯合酶的基因，从存在于培养基中的碳源如醇产生脂肪酸酯。因此，本文提供的方法用于修饰微生物以过表达或引入硫酯酶基因、编码酰基-CoA合酶的基因、以及编码酯合酶的基因。在具体实施例中，该硫酯酶基因是选自tesA、'tesA、tesB、fatB、fatB2、fatB3、fatAl、或fatA。在具体实施例中，编码酰基-CoA合酶的基因是选自fadDJadK、BH3103、pfl-4354、EAV15023、fadDl、fadD2、RPC_4074、fadDD35、fadDD22、faa39、或编码具有相同特性的酶的经鉴定基因。在具体实施例中，编码酯合酶的基因是编码来自以下项的合酶/酰基-CoA:二酰基甘油酰基转移酶的基因：霍霍巴(Simmondsiachinensis)、不动杆菌属物种ADP、泊库岛食烷菌、铜绿假单胞菌、贾登思丰迪菌(Fundibacter jadensis)、拟南芥、或真养产碱杆菌(Alkaligenes eutrophus)、或其变体。另外地或可替代地，本文提供的方法用于降低编码酰基-CoA脱氢酶的基因、编码外膜蛋白受体的基因、以及编码脂肪酸生物合成的转录调节因子的基因中的至少一者在所述微生物中的表达。在具体实施例中，这些基因中的一个或多个例如通过引入突变而失活。在具体实施例中，编码酰基-CoA脱氢酶的基因是fadE。在具体实施例中，编码脂肪酸生物合成的转录调节因子的基因编码DNA转录阻遏因子，例如fabR。

另外地或可替代地，所述微生物被修饰为降低编码丙酮酸甲酸裂解酶的基因、编码乳酸脱氢酶的基因、或两者中的至少一种的表达。在具体实施例中，编码丙酮酸甲酸裂解酶的基因是pflB。在具体实施例中，编码乳酸脱氢酶的基因是是IdhA。在具体实施例中，这些基因中的一种或多种例如通过向其中引入突变而失活。

在具体实施例中，该微生物选自以下属：埃希氏菌属、芽孢杆菌属、乳杆菌属、红球菌属、聚球藻属、集胞藻属(Synechoystis)、假单胞菌属、曲霉属、木霉属、脉孢菌属、镰孢属、腐质霉属、根毛霉属、克鲁维酵母属、毕赤酵母属、毛霉属、毁丝霉属(Myceliophtora)、青霉属、显革菌属、侧耳属、栓菌属、金孢子菌属、酵母属、寡养单胞菌属(Stenotrophamonas)、裂殖酵母属、亚罗酵母属、或链霉菌属。

使用Cas9产生能够生产有机酸的微生物

本文提供的方法被进一步用于改造能够更特别地从戊糖或己糖生产有机酸的微生物。在具体实施例中，这些方法包括将外源LDH基因引入微生物。在具体实施例中，在所述微生物中的有机酸生产是另外地或可替代地通过使编码涉及内源代谢途径(该内源代谢途径产生除感兴趣有机酸之外的代谢物和/或其中该内源代谢途径消耗该有机酸)的蛋白的内源基因失活来增加。在具体实施例中，该修饰确保了除感兴趣有机酸之外的代谢物的产生得以降低。根据具体实施例，使用这些方法以引入其中消耗该有机酸的内源途径的至少一种工程化的基因缺失和/或失活，或编码涉及内源途径(该内源途径产生除感兴趣有机酸之外的代谢物)的产物的基因的缺失和/或失活。在具体实施例中，该至少一种工程化的基因缺失或失活是在编码选自下组的酶的一个或多个基因中，该组由以下各项组成：丙酮酸脱羧酶(pdc)、延胡索酸还原酶、醇脱氢酶(adh)、乙醛脱氢酶、磷酸烯醇式丙酮酸羧化酶(ppc)、D-乳酸脱氢酶(d-ldh)、L-乳酸脱氢酶(l-ldh)、乳酸2-单加氧酶。在另外的实施例中，该至少一种工程化的基因缺失和/或失活是在编码丙酮酸脱羧酶(pdc)的内源基因中。

在另外的实施例中，该微生物被工程化为产生乳酸，并且该至少一种工程化的基因缺失和/或失活是在编码乳酸脱氢酶的内源基因中。另外地或可替代地，该微生物包括以下内源基因的至少一种工程化的基因缺失或失活，该内源基因编码细胞色素依赖性乳酸脱氢酶，例如细胞色素B2-依赖性L-乳酸脱氢酶。

使用Cas9产生改进的木糖或纤维二糖利用型酵母菌株

在具体实施例中，可以应用该CRISPR/Cas9系统来选择改进的木糖或纤维二糖利用型酵母菌株。易错PCR可以用于扩增涉及木糖利用或纤维二糖利用途径的一个(或多个)基因。涉及木糖利用途径和纤维二糖利用途径的基因的实例可以包括但不限于描述于以下中的那些：哈(Ha)，S.J.等人(2011)《美国国家科学院院刊》(Proc.Natl.Acad.Sci.USA)108(2):504-9和加拉兹卡(Galazka)，J.M.等人(2010)《科学》(Science)330(6000):84-6。所得双链DNA分子文库，各自在这种所选基因中包括随机突变，可以与CRISPR/Cas9系统的组分共转化到酵母菌株(例如S288C)中，并且可以用增强的木糖或纤维二糖利用能力来选择菌株，如WO 2015138855中所述。

使用Cas9产生用于类异戊二烯生物合成的改进的酵母菌株

塔达斯贾克那(Tadas)等人描述了多元CRISPR/Cas9系统用于在一个转化步骤中在面包酵母酿酒酵母中基因组工程化高达5个不同基因组座位的成功应用(《代谢工程》(Metabolic Engineering)，第28卷，2015年3月，第213-222页)，导致具有高甲羟戊酸(为工业上重要的类异戊二烯生物合成途径的关键中间体)产生的菌株。在具体实施例中，该CRISPR/Cas9系统可以应用于如本文描述的多元基因组工程化方法中，以用于鉴定另外的用于在类异戊二烯合成中使用的高产酵母菌株。

使用Cas9产生生产乳酸的酵母菌株

在另一个实施例中，涵盖了多元CRISPR/Cas9系统的成功应用。类似于弗拉季斯拉夫斯塔威克(Vratislav Stovicek)等人(《代谢工程通讯》(Metabolic EngineeringCommunications)，第2卷，2015年12月，第13-22页)，可以按单一转化事件设计和获得改进的生产乳酸的菌株。在具体实施例中，CRISPR/Cas9系统用于同时地插入异源乳酸脱氢酶基因和破坏两个内源基因PDC1和PDC5基因。

CRISPR/Cas9系统在植物中的另外应用

在具体实施例中，CRISPR系统、并且优选本文描述的CRISPR/Cas9系统，可以用于可视化遗传组件动力学。例如，CRISPR成像可以可视化重复或非重复性基因组序列，报告端粒长度变化和端粒运动，并且监测整个细胞周期中基因座位的动力学(陈(Chen)等人，《细胞》(Cell)，2013)。这些方法还可以应用于植物。

CRISPR系统并且优选本文描述的CRISPR/Cas9系统的其他应用，是体外和体内靶向的基因破坏阳性选择筛选(马利纳(Malina)等人，《基因和发育》(Genes andDevelopment)，2013)。这些方法还可以应用于植物。

在具体实施例中，非活性Cas9内切核酸酶与组蛋白修饰酶的融合可以在复杂的表观基因组中引入定制变化(鲁斯克(Rusk)等人，《自然方法》(Nature Methods)，2014)。这些方法还可以应用于植物。

在具体实施例中，CRISPR系统并且优选本文描述的CRISPR/Cas9系统可以用于纯化染色质的特定部分并且鉴定相关蛋白，由此说明其在转录中的调节作用(沃尔德里普(Waldrip)等人，《表观遗传学》(Epigenetics)，2014)。这些方法还可以应用于植物。

在具体实施例中，本发明可以用作用于在植物系统中去除病毒的疗法，因为它能够切割病毒DNA和RNA两者。在人类系统中的先前研究已经证实了在靶向丙型肝炎单链RNA病毒(A.普里斯(Price)等人，《国家科学院院刊》(Proc.Natl.Acad.Sci)，2015)连同乙型肝炎双链DNA病毒(V.罗马南(Ramanan)等人，《科学报告》(Sci.Rep)，2015)中成功利用CRISPR。这些方法还可以被适配用于在植物中使用CRISPR/Cas9系统。

在具体实施例中，本发明可以用于改变基因组复杂性。在另外的具体实施例中，该CRISPR系统并且优选本文描述的CRISPR/Cas9系统可以用于破坏或改变染色体数目，并产生仅包含来自一个亲本的染色体的单倍体植物。此类植物可以被诱导为经历染色体复制，并且转化为仅包含纯合子等位基因的二倍体植物(卡里米-阿什蒂亚尼(Karimi-Ashtiyani)等人，PNAS，2015；安东(Anton)等人，《细胞核》(Nucleus)，2014)。这些方法还可以应用于植物。

在具体实施例中，本文描述的CRISPR/Cas9系统可以用于自我切割。如所述，Cas9酶和sgRNA的启动子是组成型启动子，并且第二sgRNA被引入在相同的转化盒中，但由诱导型启动子控制。该第二sgRNA可以被指定为诱导Cas9基因中的位点特异性切割，以便产生非官能Cas9。在另外的具体实施例中，该第二sgRNA诱导在转化盒的两端上的切割，导致盒从宿主基因组中的去除。该系统提供了细胞暴露于Cas酶的受控持续时间，并且进一步使脱靶编辑最小化。另外，对CRISPR/Cas盒的两端的切割可以用于产生具有双等位基因突变的无转基因T₀植物(例如摩尔(Moore)等人，《核酸研究》(Nucleic Acids Research)，2014；舍费尔(Schaeffer)等人，《植物科学》(Plant Science)，2015)。摩尔(Moore)等人的这些方法可以应用于本文描述的CRISPR/Cas9系统。

改进的植物

本发明还提供了通过本文提供的方法可获得和获得的植物和酵母细胞。通过本文描述的方法获得的改进的植物可以通过以下基因的表达用于食品或饲料生产中，这些基因例如确保对植物有害生物、除草剂、干旱、低温或高温、过量水等的耐受性。

通过本文描述的方法获得的改进的植物，尤其是作物和藻类可以通过表达例如比在野生型中通常所见的更高的蛋白、碳水化合物、营养素或维生素水平而用于食品或饲料生产中。在此方面，改进的植物，尤其是豆类和块茎是优选的。

改进的藻类或其他植物，如油菜，可以在植物油或生物燃料例如像醇类(尤其是甲醇和乙醇)的生产中特别有用。这些可以被工程化为表达或过表达高水平的油或醇类，以供在油或生物燃料行业中使用。

本发明还提供了植物的改进部分。植物部分包括但不限于，叶、茎、根、块茎、种子、胚乳、胚珠、以及花粉。如本文设想的植物部分可以是可存活的、不可存活的、可再生的和/或不可再生的。

还本文涵盖的是提供了根据本发明的方法产生的植物细胞和植物。通过传统育种方法产生的包括遗传修饰的植物的配子、种子、胚、合子或体细胞、子代或杂合体也包括在本发明的范围内。此类植物可以包含插入或代替靶序列的异源或外源DNA序列。可替代地，此类植物可以仅包含在一个或多个核苷酸中的改变(突变、缺失、插入、取代)。这样，此类植物与它们的祖先植物的不同之处将仅在于具体修饰的存在。

农场动物和生产动物

因此，本发明提供了由本发明方法产生的植物、动物或细胞或其子代。该子代可以是产生的植物或动物的克隆或可以通过与同一物种的其他个体杂交而由有性繁殖产生，以在其后代中基因渗入另外的令人希望的性状。在多细胞生物(特别是动物或植物)的情况下，该细胞可以是在体内或离体的。

生物体和动物；方法

本申请还可以被扩展到其他农业应用，如，例如，农场动物和生产动物。例如，猪具有使得它们作为生物医学模型(尤其是在再生医学中)引人注目的许多特征。具体地，患有重症综合性免疫缺陷(SCID)的猪可以提供用于再生药物、异种移植、和肿瘤发展的有用模型，并且将有助于开发人类SCID患者的疗法。李(Lee)等人(《美国国家科学院院刊》(ProcNatl Acad Sci U S A.)2014年5月20日；111(20):7260-5)利用报告子-指导的转录激活因子样效应核酸酶(TALEN)系统来以高效率产生体细胞中重组活化基因(RAG)2的靶向修饰，包括影响两个等位基因的一些。CRISPR Cas可以应用于类似系统。

李(Lee)等人，(《美国国家科学院院刊》(Proc Natl Acad Sci U S A.)，2014年5月20日；111(20):7260-5)的方法可以如下应用于本发明。突变的猪是通过靶向修饰在胎儿成纤维细胞中的RAG2，随后进行SCNT和胚胎转移而产生。编码CRISPR Cas的构建体以及报告子被电穿孔到胎-衍生的成纤维细胞中。在48h后，将表达绿色荧光蛋白的转染的细胞以单一细胞/孔的估计稀释分选到96孔板的单独的孔中。RAG2的靶向修饰是通过扩增在任何CRISPR Cas切割位点侧翼的基因组DNA片段、随后对PCR产物进行测序来筛选的。在筛选并确保脱靶突变的缺乏之后，将携带RAG2的靶向修饰的细胞用于SCNT。去除极体、连同卵母细胞的相邻细胞质(推测含有中期II板)的一部分，并且将供体细胞放置于卵黄周。然后将重构胚胎电穿孔以将供体细胞与卵母细胞融合并且然后进行化学活化。将活化的胚胎孵育于具有0.5μM Scriptaid(S7817；西格玛奥德里奇公司(Sigma-Aldrich))的猪合子培养基3(PZM3)中，持续14-16h。然后将胚洗涤以去除Scriptaid并且在PZM3中培养直到它们被转移到替代猪的输卵管中。

本发明还适用于修饰其他动物例如母牛的SNP。丹(Tan)等人(《美国国家科学院院刊》(Proc Natl Acad Sci U S A.)，2013年10月8日；110(41):16526-16531)使用质粒、rAAV、以及寡核苷模板扩展了家畜基因编辑工具箱，以包括转录激活因子样(TAL)效应核酸酶(TALEN)-和规律间隔成簇短回文重复序列(CRISPR)/Cas9-刺激的同源定向修复(HDR)。基因特异性gRNA序列根据其方法被克隆到丘奇(Church)实验室gRNA载体(Addgene ID:41824)中(马里(Mali)P等人(2013)经由Cas9的RNA-指导的基因组工程化(Human GenomeEngineering via Cas9.)《科学》(Science)339(6121):823-826)。通过共转染hCas9质粒(Addgene ID：41815)或从RCIScript-hCas9合成的mRNA来提供Cas9核酸酶。通过从hCas9质粒(包含hCas9cDNA)亚克隆XbaI-AgeI片段到RCIScript质粒中，来构建该RCIScript-hCas9。

许(Heo)等人(《干细胞发育》(Stem Cells Dev.)2015年2月1日；24(3):393-402.doi:10.1089/scd.2014.0278.电子出版2014年11月3日)报道在牛基因组中使用牛多能细胞和规律间隔成簇短回文重复序列(CRISPR)/Cas9核酸酶进行高效基因靶向。首先，许(Heo)等人，通过异位表达山中因子(yamanaka factor)和GSK3β及MEK抑制剂(2i)处理，产生了来自牛体细胞成纤维细胞的诱导多能干细胞(iPSC)。许(Heo)等人观察到在畸胎瘤中的基因表达和发育潜能方面，这些牛iPSC高度类似于天然多能干细胞。此外，对牛NANOG座位具有特异性的CRISPR/Cas9核酸酶示出在牛iPSC和胚胎中牛基因组的高度有效的编辑。

提供了动物例如母牛的特征分析，以进行和传递具有经济意义的经济性状的性状，例如胴体成分、胴体品质、母体和繁殖性状以及平均日增重。综合特征分析开始于DNA标记的发现(最常见的单核苷酸多态性或SNP)。在特征之后的所有标记由在研究机构(包括大学、研究组织和政府机构如USDA)的独立科学家发现。然后在在验证群体中分析了标记。使用了代表不同生产环境和生物型的多种资源群体，常常与来自牛肉产业的种畜、小牛、饲育场和/或包装区的工业伙伴一起工作以收集不是通常可获得的表型。牛基因组数据库是广泛可获得的，参见例如NAGRP牛基因组协作计划(http://www.animalgenome.org/cattle/maps/db.html)。因此，本发明可以用于靶向牛SNP。本领域的普通技术人员可以利用上述方案用于靶向SNP，并将它们应用于牛SNP，如在例如由丹(Tan)等人或许(Heo)等人所述。

邹清间(Qingjian Zou)等人(《分子细胞生物学进展通路杂志》(Journal ofMolecular Cell Biology Advance Access)，出版于2015年10月12日)证明了在狗中通过靶向狗肌生成抑制蛋白(MSTN)基因(骨骼肌质量的负调节子)的第一外显子而增加肌肉质量。首先，使用靶向MSTN的sgRNA与Cas9载体共转染到犬胚胎成纤维细胞(CEF)中，来验证sgRNA的效率。此后，通过以下方式产生MSTN KO狗：用Cas9mRNA和MSTN sgRNA的混合物显微注射具有正常形态学的胚胎，并且将合子自体移植到相同的雌性狗的输卵管中。与其野生型同窝出生的姐妹相比，敲除的狗在大腿上展示出明显的肌肉表型。

家畜-猪

在一些实施例中，在家畜中的病毒靶标可以包括例如在猪巨噬细胞上的猪CD163。CD163与PRRSv(猪繁殖和呼吸障碍综合征病毒，动脉炎病毒属)感染相关(认为是通过病毒细胞进入)。PRRSv感染，尤其是猪肺泡巨噬细胞(在肺中发现)，导致在以前不可治愈的猪综合征(“神秘猪病”或“蓝耳病”)，其引起家庭猪患病，包括繁殖失败、重量减轻和高死亡率。经常看到由于通过丢失巨噬细胞活性造成的免疫缺陷引起的机会性感染，例如地方性肺炎、脑膜炎和耳肿胀。因增加的抗生素利用和财务损失(估计每年6亿6千万美元)这还具有显着的经济学和环境反响。

如由密苏里大学的克莉丝汀(Kristin)M惠特沃思(Whitworth)和兰德尔普拉瑟博士(Dr Randall Prather)等人(《自然生物技术》(Nature Biotech)3434，在线公开于2015年12月07日)和与Genus Plc合作中所报道，CD163是使用CRISPR-Cas9来靶向，并且编辑的猪的后代在暴露于PRRSv中时是有抗性的。一个雄性创立者和一个雌性创立者二者均具有CD163的外显子7中的突变，将它们进行繁殖以产生后代。雄性创立者在一个等位基因上的外显子7中具有11-bp缺失，这导致在结构域5中氨基酸45处的移码突变和错义翻译以及后续的在氨基酸64处的提前终止密码子。其他等位基因在外显子7中具有2-bp添加，并且在前面内含子中具有377-bp缺失，其被预测为导致结构域5的前49个氨基酸的表达以及后续的在氨基酸85处的提前终止密码子。母猪具有在一个等位基因中的7bp添加，其在翻译时被预测为表达结构域5的前48个氨基酸，随后为在氨基酸70处的提前终止密码子。该母猪的其他等位基因是不可扩增的。选择的后代被预测为空动物(CD163-/-)，即CD163敲除。

因此，在一些实施例中，猪肺泡巨噬细胞可以由CRISPR蛋白来靶向。在一些实施例中，猪CD163可以由CRISPR蛋白来靶向。在一些实施例中，猪CD163可以如以下来敲除：通过诱导DSB，或通过例如靶向外显子7的缺失或修饰(包括以上所述的那些中的一个或多个)、或在基因的其他区域中例如外显子5的缺失或修饰的插入或缺失。

还设想了编辑的猪和其子代，例如CD163敲除猪。这可以用于家畜、培育或建模目的(即猪模型)。还提供了包括该基因敲除的精液。

CD163是富含半胱氨酸的清道夫受体(SRCR)超家族的成员。基于体外研究，该蛋白的SRCR结构域5是负责解包装和释放病毒基因组的结构域。这样，还可以靶向SRCR超家族的其他成员以便评估对其他病毒的抗性。PRRSV也是哺乳动物动脉炎病毒属组的一个成员，该组还包括鼠乳酸脱氢酶升高症病毒、猴出血热病毒和马动脉炎病毒。动脉炎病毒具有重要发病特性，包括巨噬细胞向性以及能够导致严重疾病和持续性感染两者。因此，例如通过猪CD163或其在其他物种中的同系物，可以靶向动脉炎病毒并且特别是鼠乳酸脱氢酶升高症病毒、猴出血热病毒和马动脉炎病毒，并且还提供了鼠类、猿以及马模型以及敲除。

事实上，该途径可被延伸至引起其他家畜疾病(其可以传播至人类)以及上述肺炎、脑膜炎和水肿的病毒或细菌，例如猪流感病毒(SIV)株，包括丙型流感和甲型流感亚型(称为H1N1、H1N2、H2N1、H3N1、H3N2、和H2N3)。

异种移植，异种移植物

本发明还考虑了使用本文描述的CRISPR-Cas系统例如Cas9效应蛋白系统来提供适于用于提供修饰的组织(用于移植)的RNA指导的DNA核酸酶。例如，RNA-指导的DNA核酸酶可以用于敲除、敲减或破坏在动物例如转基因猪(例如人类血红素加氧酶-1转基因猪品系)中的所选基因，例如通过破坏对由人类免疫系统识别的表位进行编码的基因即异种抗原基因的表达。用于破坏的候选猪基因可以例如包括α(l,3)-半乳糖基转移酶和胞苷一磷酸-N-乙酰基神经氨酸羟化酶基因(参见PCT专利公开案WO 2014/066505)。此外，可以破坏编码内源逆转录病毒的基因，例如编码全部猪内源逆转录病毒的基因(参见杨(Yang)等人，2015，猪内源逆转录病毒(PERV)的基因组范围的失活(Genome-wide inactivation of porcineendogenous retroviruses(PERVs))，《科学》(Science)2015年11月27日：第350卷第6264期，第1101-1104页)。此外，RNA-指导的DNA核酸酶可以用于靶向用于在异种移植供体动物中整合另外基因例如人类CD55基因的位点，以改进针对超急性排斥的保护。

基因驱动和应用至蚊和疟疾

本发明还考虑使用本文描述的CRISPR-Cas系统，例如Cas9效应蛋白系统，来提供RNA-指导的基因驱动，例如在与PCT专利公开案WO 2015/105928中所述的基因驱动类似的系统中。这种系统可以例如提供用于通过将一种编码RNA指导的DNA核酸酶的核酸序列和一种或多种指导RNA引入种系细胞来改变真核生物种系细胞的方法。指导RNA可以被设计成互补于种系细胞的基因组DNA上的一个或多个靶位置。编码RNA指导的DNA核酸酶的核酸序列和编码指导RNA的核酸序列可以提供在构建体上的侧翼序列之间(其中启动子被安排为使得种系细胞可以表达RNA指导的DNA核酸酶、以及指导RNA)，连同任何所希望的负荷物编码序列(也位于侧翼序列之间)一起。这些侧翼序列将典型地包括以下序列，该序列是与所选靶标染色体上的相应序列是一致的，使得侧翼序列与由构建体编码的组分一起运行以辅助外源核酸构建体序列在靶切割位点处通过例如同源重组的机制插入基因组DNA中，以使得种系细胞针对该外源核酸序列是纯合的。以此方式，基因驱动系统能够贯穿繁殖种群而种质渗入所希望的负荷物基因(甘茨(Gantz)等人，2015，高度有效的Cas9介导的基因驱动以用于疟疾载体蚊斯氏按蚊的群体修饰(Highly efficient Cas9-mediated gene drivefor population modification of the malaria vector mosquito Anophelesstephensi)，PNAS 2015，先于印刷公开，2015年11月23日，doi:10.1073/pnas.1521077112；埃斯维特(Esvelt)等人，2014，关于RNA指导的基因驱动以改变野生群体(Concerning RNA-guided gene drives for the alteration of wild populations)，eLife 2014；3:e03401)。在选择的实施例中，可以选择在基因组中具有很少潜在脱靶位点的靶序列。使用多个指导RNA靶向在靶座位内的多个位点，可以增加切割频率并阻碍驱动抗性等位基因的演变。截短的指导RNA可以减少脱靶切割。可以使用配对切口酶代替单一核酸酶，以进一步提高特异性。基因驱动构建体可以包括编码转录调节因子的负荷物序列，转录调节因子例如用以活化同源重组基因和/或抑制非同源末端连接。靶位点可以被选择在必需基因内，使得非同源末端连接事件可导致致死率而不会产生驱动抗性等位基因。基因驱动构建体可以被工程化为在一系列宿主中在一系列温度下发挥作用(卓(Cho)等人2013，使用小分子对秀丽隐杆线虫中的蛋白稳定性的快速和可调控制(Rapid and Tunable Control of ProteinStability in Caenorhabditis elegans Using a Small Molecule)，PLoS ONE 8(8):e72393.doi:10.1371/journal.pone.0072393)。

FISH和使用失活的CRISPR Cas9酶的示例性方法

在一个方面中，本发明提供了工程化的、非天然存在的CRISPR-Cas系统，该系统包括催化失活的本文所述的Cas蛋白，优选失活的Cas9(dCas9)，以及在荧光原位杂交(FISH)中该系统的用途。缺乏产生DNA双链断裂的能力的dCas9可以与荧光蛋白例如增强的绿色荧光蛋白(eEGFP)融合，并且在体内与小指导RNA共表达以靶向臂间、中心和端粒重复。该dCas9系统可以用于可视化人类基因组中的重复序列和单独基因两者。标记的dCas9CRISPR-cas系统的此类新应用在细胞成像以及研究功能性核构造(尤其是在具有小核容量或复杂3-D结构的情况下)中可以是重要的。(陈(Chen)B、吉尔伯特(Gilbert)LA、奇米尼(Cimini)BA、施米鲍尔(Schnitzbauer)J、张(Zhang)W、李(Li)GW、帕克(Park)J、布莱克本(Blackburn)EH、维斯曼(Weissman)JS、齐(Qi)LS、黄(Huang)B.2013.在人类活细胞中通过优化的CRISPR/Cas系统对基因组座位的动态成像(Dynamic imaging of genomic loci inliving human cells by an optimized CRISPR/Cas system).《细胞》(Cell)155(7):1479-91.doi:10.1016/j.cell.2013.12.001.)

用RNA指导的效应蛋白复合物进行治疗靶向

如将是显而易见的，设想的是可以使用本发明系统靶向任何感兴趣的多核苷酸序列。本发明提供了非天然存在的或工程化的组合物、或编码所述组合物的组分的一种或多种多核苷酸、或包含对所述组合物的组分进行编码的一种或多种多核苷酸的载体或递送系统，其用于体内、离体或体外修饰靶细胞，并且是以改变细胞使得一旦被修饰则CRISPR修饰的细胞的子代或细胞系保留改变的表型的方式进行。这些修饰的细胞和子代可以是多细胞生物例如植物或动物的部分，其中在离体或体内向希望的细胞型应用CRISPR系统。CRISPR发明可以是治疗的疗法。该治疗的疗法可以包括基因或基因组编辑、或基因疗法。

处理病原体，像细菌、真菌和寄生性病原体

本发明还可用于处理细菌、真菌和寄生性病原体。大多数研究工作已经集中在发展新抗生素上，然而一旦被开发，将经历相同的抗药性问题。本发明提供了解决那些难题的新颖的基于CRISPR的替代方案。此外，不像现有抗生素，基于CRISPR的处理可以被制成病原体特异性的，诱导靶病原体的细菌细胞死亡的同时回避有益细菌。

江(Jiang)等人(“使用CRISPR-Cas系统进行细菌基因组的RNA指导的编辑(RNA-guided editing of bacterial genomes using CRISPR-Cas systems)”，《自然生物技术》(Nature Biotechnology)，第31卷，233-9页，2013年3月)使用CRISPR-Cas9系统来突变或杀灭肺炎链球菌和大肠杆菌。将精确突变引入基因组中的工作依赖于在靶基因组位点处的双-RNA:Cas9-引导的切割，以杀死未突变的细胞，并且回避对选择性标记或反选择系统的需要。CRISPR系统已被用于逆转抗生素抗性并且消除菌株之间的抗性转移。皮卡德(Bickard)等人显示重编程为靶向毒力基因的Cas9杀死强毒的而并非无毒的金黄色葡萄球菌。重编程核酸酶以靶向抗生素抗性基因破坏了包含抗生素抗性基因的葡萄球菌质粒，并且针对质粒负载的抗性基因的扩张进行了免疫。(参见，皮卡德(Bikard)等人，“开发CRISPR-Cas核酸酶以产生序列特异性抗微生物剂(Exploiting CRISPR-Cas nucleases toproduce sequence-specific antimicrobials)”，《自然生物技术》(NatureBiotechnology)，第32卷，1146-1150，doi:10.1038/nbt.3043，在线公开于2014年10月05日)皮卡德(Bikard)显示在小鼠皮肤定殖模型中，CRISPR-Cas9抗微生物剂在体内发挥功能以杀死金黄色葡萄球菌。类似地，约瑟夫(Yosef)等人使用CRISPR系统来靶向编码酶的基因，该酶赋予对β-内酰胺抗生素的抗性(参见约瑟夫等人，“温和且溶胞的噬菌体被编程为敏化并杀灭抗生素抗性细菌(Temperate and lytic bacteriophages programmed tosensitize and kill antibiotic-resistant bacteria)”，《美国国家科学院院刊》(Proc.Natl.Acad.Sci.USA)，第112卷，第7267-7272页，doi:10.1073/pnas.1500107112在线公开于2015年5月18日)。

CRISPR系统可以用于编辑对其他遗传学途径有抗性的寄生虫的基因组。例如，CRISPR-Cas9系统显示将双链断裂引入约氏疟原虫基因组中(参见张(Zhang)等人，“使用CRISPR/Cas9系统对疟原虫基因组的有效编辑(Efficient Editing of Malaria ParasiteGenome Using the CRISPR/Cas9System)”，mBio.第5卷，e01414-14，2014年七月-八月)。古尔巴勒(Ghorbal)等人，(“在人类疟原虫镰状疟原虫中CRISPR-Cas9系统的基因组编辑(Genome editing in the human malaria parasite Plasmodium falciparumusing theCRISPR-Cas9 system)”，《自然生物技术》(Nature Biotechnology)，第32卷，第819-821页，doi:10.1038/nbt.2925，在线公开于2014年6月1日)修饰了两种基因orc1和kelch13的序列，这两种基因分别具有在基因沉默中和引发对青蒿素的抗性中的推定作用。尽管不存在对修饰的直接选择，在适当位点改变的寄生虫被以非常高的效率恢复，指示中性的或甚至有害的突变可以使用该系统产生。CRISPR-Cas9还用于修饰其他病原性寄生虫包括刚地弓形虫的基因组(参见沈(Shen)等人，“在刚地弓形虫的不同菌株中使用CRISPR/CAS9进行高效基因破坏(Efficient gene disruption in diverse strains of Toxoplasma gondiiusing CRISPR/CAS9)”，mBio vol.5:e01114-14,2014；以及萨迪克(Sidik)等人，“使用CRISPR/Cas9进行刚地弓形虫的高效基因组工程化(Efficient Genome Engineering ofToxoplasma gondii Using CRISPR/Cas9)”，PLoS One第9卷，e100450，doi:10.1371/journal.pone.0100450，在线公开于2014年6月27日)。

维亚斯(Vyas)等人(“白色念珠菌CRISPR系统允许必需基因和基因家族的基因工程(A Candida albicans CRISPR system permits genetic engineering of essentialgenes and gene families)”，《科学进展》(Science Advances)，第1卷，e1500248,DOI:10.1126/sciadv.1500248，2015年4月3日)采用CRISPR系统来克服在白色念珠菌中的基因工程中长期存在的障碍，并且在单一实验中有效地突变一些不同基因的两种拷贝。在其中一些机制贡献于抗药性的生物中，维亚斯(Vyas)产生了不再展示针对氟康唑或环己酰亚胺的超抗性的纯合双突突体，所述超抗性由亲本临床分离株Can90展示。维亚斯还通过创立条件型等位基因获得在白色念珠菌的必需基因中的纯合功能缺失突变。DCR1(为核糖体RNA加工所需)的无效等位基因在低温下是致命的，但在高温下是存活的。维亚斯使用引入无义突变的修复模板以及不能在16℃生长的分离的dcr1/dcr1突变体。

本发明的CRISPR系统通过破坏染色体座位用于在镰状疟原虫中使用。古尔巴勒(Ghorbal)等人(“使用CRISPR-Cas9系统在人类疟原虫镰状疟原虫中的基因组编辑(Genomeediting in the human malaria parasite Plasmodium falciparum using the CRISPR-Cas9 system)”，《自然生物技术》(Nature Biotechnology)，32，819-821(2014)，DOI:10.1038/nbt.2925，2014年6月1日)采用CRISPR系统以在疟疾基因组中引入特异性基因敲除和单一核苷酸取代。为了将CRISPR-Cas9适用于镰状疟原虫，古尔巴勒等人产生了在pUF1-Cas9附加体中的拟原生质调节组件的控制之下的表达载体，所述表达载体携带给予了对DSM1(一种镰状疟原虫二氢乳清酸脱氢酶(PfDHODH)抑制剂)的抗性的药物选择性标记ydhodh，并且对于sgRNA的转录，使用镰状疟原虫U6小核(sn)RNA调节组件，将用于同源重组修复的指导RNA和供体DNA模板放置于相同质粒pL7上。还参见，张(Zhang)C.等人(“使用CRISPR/Cas9系统对疟原虫基因组的高效编辑(Efficient editing of malaria parasitegenome using the CRISPR/Cas9system)”，MBio，2014年7月1日；5(4):E01414-14，doi:10.1128/MbIO.01414-14)以及瓦格纳(Wagner)等人(“在镰状疟原虫中高效的CRISPR-Cas9介导的基因组编辑(Efficient CRISPR-Cas9-mediated genome editing in Plasmodiumfalciparum)”，《自然方法》(Nature Methods)11,915-918(2014)，DOI:10.1038/nmeth.3063)。

处理病原体，像病毒病原体如HIV

Cas介导的基因组编辑可能用于在体细胞组织中引入保护性突变以对抗非基因疾病或复杂疾病。例如，NHEJ介导的在淋巴细胞中的CCR5受体失活(隆巴尔多(Lombardo)等人，《自然生物技术》(Nat Biotechnol.)2007年11月；25(11):1298-306)可以是用于回避HIV感染的可行策略，然而PCSK9(科恩(Cohen)等人，《自然遗传学》(Nat Genet.)2005年2月；37(2):161-5)或血管生成素(穆苏努瑞(Musunuru)等人，《新英格兰医学杂志》(N EnglJ Med.)2010年12月2日；363(23):2220-7)的缺失可以提供针对菌株抗性血胆脂醇过多或血脂过多的治疗效果。尽管这些靶标还可以使用siRNA介导的蛋白敲减来处置，NHEJ介导的基因失活的唯一优势是能够实现永久治疗益处而无需持续治疗。如与所有基因疗法伴随的，重要的当然是确立每个提出的治疗用途具有有利的收益-风险比。

编码Cas9和指导RNA的质粒DNA连同修复模板到酪氨酸血症成年小鼠模型的肝脏中的水动力递送，显示能够在约250分之1的细胞中校正突变体Fah基因并挽救该野生型Fah蛋白的表达(《自然生物技术》(Nat Biotechnol.)2014年6月；32(6):551-3)。此外，临床试验成功地使用ZF核酸酶来通过离体敲除CCR5受体对抗HIV感染。在所有患者中，HIV DNA水平降低，并且在四分之一的患者中，HIV RNA变得不可检测(达巴斯(Tebas)等人，《新英格兰医学杂志》(N Engl J Med.)2014年3月6日；370(10):901-10)。这些结果均证明了可编程的核酸酶作为一种新治疗平台的希望。

在另一个实施例中，自灭活慢病毒载体可以用于和/或适合于本发明的CRISPR-Cas9系统，该自灭活慢病毒载体具有靶向由HIV tat/rev共享的共有外显子的siRNA、核仁定位TAR诱饵、和抗CCR5特异性锤头状核酶(参见，例如，迪吉斯托(DiGiusto)等人(2010)《科学转化医学》(Sci Transl Med)2:36ra43)。可以收集最少2.5×10⁶个CD34+细胞/每千克患者体重，并且以2×10⁶个细胞/ml的密度在X-VIVO 15培养基中(龙沙公司(Lonza))预刺激16到20个小时，该培养基含有2μmol/L-谷氨酰胺、干细胞因子(100ng/ml)、Flt-3配体(Flt-3L)(100ng/ml)、和促血小板生成素(10ng/ml)(CellGenix公司)。可以用慢病毒以感染复数5在75-cm²的包被有纤连蛋白(25mg/cm²)(重组人纤维蛋白片段(RetroNectin)，宝生物工程株式会社(Takara Bio Inc.))的组织培养瓶中转导预刺激的细胞16到24小时。

根据本领域的知识和本披露的教导，就免疫缺陷病症(如HIV/AIDS)而言，本领域技术人员可以校正HSC，包括使HSC与靶向并敲除CCR5的CRISPR-Cas9系统接触。可以将靶向并敲除CCR5-和-Cas9蛋白的指导RNA(并且有利地是双指导物法，例如一对不同的指导RNA；例如，靶向原代人类CD4+ T细胞和CD34+造血干细胞和祖细胞(HSPC)中的两个临床相关基因B2M和CCR5的指导RNA)与HSC接触。可以将这样接触的细胞给予；并且任选地处理/扩增。参见卡地亚(Cartier)。还参见基姆(Kiem)，“用于HIV疾病的基于造血干细胞的基因疗法(Hematopoietic stem cell-based gene therapy for HIV disease)”，《细胞·干细胞》(Cell Stem Cell).2012年2月3日；10(2):137-147；通过引用连同其引用的文献并入本文；曼达尔(Mandal)等人，“使用CRISPR/Cas9有效消除人造血干细胞和效应细胞中的基因(Efficient Ablation of Genes in Human Hematopoietic Stem and Effector Cellsusing CRISPR/Cas9)”，《细胞·干细胞》(Cell Stem Cell)，第15卷，第5期，第643-652页，2014年11月6日；通过引用连同其引用的文献并入本文。作为另一种使用CRISPR-Cas9系统对抗HIV/AIDS的手段，还提及的是爱宾娜(Ebina)，“通过编辑HIV-1整合前病毒DNA抑制HIV-1表达的CRISPR/Cas9系统(CRISPR/Cas9system to suppress HIV-1expression byediting HIV-1integrated proviral DNA)”《科技报告》(SCIENTIFIC REPORTS)|3:2510|DOI:10.1038/srep02510，通过引用并入本文连同它引用的文献。

用于HIV治疗的基因组编辑的基本原理源于以下观察结果，即对CCR5(病毒的细胞辅助受体)的功能缺失突变纯合的个体对感染具有高度抗性并且以另外方式是健康的，从而表明通过基因组编辑模拟这种突变可以是安全且有效的治疗策略[刘(Liu)，R.等人《细胞》(Cell)86，367-377(1996)]。这一想法在临床上得到了验证，当向感染HIV的患者给予来自对功能缺失CCR5突变纯合的供体的异体骨髓移植时，产生不可检测水平的HIV以及正常CD4 T细胞计数的恢复[赫特尔(Hutter)，G.等人《新英格兰医学杂志》(The New Englandjournal of medicine)360，692-698(2009)]。尽管由于成本和潜在的移植物抗宿主疾病，骨髓移植对于大多数HIV患者而言是不现实的治疗策略，但是转化患者自己的T细胞为CCR5的HIV疗法是令人希望的。

使用ZFN和NHEJ敲除人源化HIV小鼠模型中的CCR5的早期研究显示移植CCR5编辑的CD4 T细胞提高病毒载量和CD4 T细胞计数[佩雷斯(Perez)，E.E.等人《自然生物技术》(Nature biotechnology)26，808-816(2008)]。重要的是，这些模型还显示HIV感染导致对CCR5裸细胞的选择，表明编辑赋予健康度优势并且潜在地允许小数目的经编辑的细胞产生治疗作用。

作为这项和其他有希望的临床前研究的结果，敲除患者T细胞中的CCR5的基因组编辑治疗现在已经在人类中进行测试[奥尔特(Holt)，N.等人《自然生物技术》(Naturebiotechnology)28，839-847(2010)；李(Li)，L.等人《分子疗法：美国基因治疗学会杂志》(Molecular therapy:the journal of the American Society of Gene Therapy)21，1259-1269(2013)]。在最近的I期临床试验中，从患有HIV的患者体内取出CD4+ T细胞，用被设计成敲除CCR5基因的ZFN进行编辑并且以自体方式移植回患者体内[泰巴斯(Tebas)，P.等人《新英格兰医学杂志》(The New England journal of medicine)370，901-910(2014)]。

在另一个研究中(曼达尔(Mandal)等人，《细胞·干细胞》(Cell Stem Cell，第15卷，第5期，第643-652页，2014年11月6日))，CRISPR-Cas9已经靶向人类CD4+ T细胞和CD34+造血干细胞和祖细胞(HSPC)中的两个临床相关基因B2M和CCR5。使用单一RNA指导物导致HSPC中而非T细胞中的高效诱变。一种双重指导物方法改进在两种细胞类型中的基因缺失效率。已经经历用CRISPR-Cas9进行基因组编辑的HSPC保留多向潜能。将预测的中靶和脱靶突变经由HSPC中的靶捕获测序来检验，并且仅在一个位点处观察到低水平的脱靶诱变。这些结果证明CRISPR-Cas9可以有效地以最小脱靶诱变来消融HSPC中的基因，具有用于基于造血细胞的疗法的广泛可应用性。

王(Wang)等人(PLoS One.2014年12月26日；9(12):e115987.doi:10.1371/journal.pone.0115987)经由CRISPR相关蛋白9(Cas9)和单一指导RNA(指导RNA)使CCR5沉默，其中用慢病毒载体表达Cas9和CCR5指导RNA。王(Wang)等人显示将表达Cas9和CCR5指导RNA的慢病毒载体单轮转导到HIV-1易感人类CD4+细胞中产生高频率的CCR5基因破坏。CCR5基因破坏的细胞不仅对R5-热带HIV-1(包括传递/创立者(T/F)HIV-1分离株)具有抗性，而且在R5-热带HIV-1感染期间具有超过CCR5基因未破坏的细胞的选择优势。在稳定转导的细胞中，甚至在转导后84天，通过T7内切核酸酶I测定未检测到在与这些CCR5指导RNA高度同源的潜在脱靶位点处的基因组突变。

法恩(Fine)等人(《科学报告》(Sci Rep.)2015年7月1日；5:10777.doi:10.1038/srep10777)鉴定了表达化脓链球菌Cas9(SpCas9)蛋白的片段的两盒系统，所述片段以小室剪接在一起以形成能够进行位点特异性DNA切割的功能蛋白。采用特异性CRISPR引导链，法恩(Fine)等人证明了该系统作为单一Cas9和作为一对Cas9切口酶在切割人类HEK-293T细胞中的HBB和CCR5基因中的功效。在进行标准转染时与野生型SpCas9(wtSpCas9)相比，反式剪接的SpCas9(tsSpCas9)展示出约35％的核酸酶活性，但在更低的给予水平上具有实质上降低的活性。tsSpCas9相对于wtSpCas9的大大降低的开放阅读框长度潜在地允许更复杂且更长的遗传组件被包装到包含组织特异性启动子的AAV载体中，多元指导RNA表达，以及效应子结构域与SpCas9的融合。

李(Li)等人(《遗传病毒学杂志》(J Gen Virol.)2015Aug；96(8):2381-93.doi:10.1099/vir.0.000139.电子版2015年4月8日)证明CRISPR-Cas9可以有效地介导在细胞系中CCR5座位的编辑，导致在细胞表面上CCR5表达的敲除。新一代测序揭示了各种突变被引入CCR5的预测切割位点周围。对于所分析的三个最有效的指导RNA的每一个，在15个评分靠前的潜在位点处没有检测到显着的脱靶效应。通过构建携带CRISPR-Cas9组分的嵌合Ad5F35腺病毒，李(Li)等人有效地转导初级CD4+ T-淋巴细胞，并且破坏CCR5表达，并且将阳性转导的细胞赋予HIV-1抗性。

参考WO 2015/148670，并且通过本文的传授，本发明包含结合本文的传授而应用的该文献的方法和材料。在基因疗法的一个方面，包含了涉及的或与人类免疫缺陷病毒(HIV)和获得性免疫缺陷综合症(AIDS)相关的用于编辑靶序列的方法和组合物。在一个相关方面，本文描述的本发明包含通过在C-C趋化因子受体5型(CCR5)的基因中引入一个或多个突变来预防和治疗HIV感染和AIDS。该CCR5基因还称为CKR5、CCR-5、CD195、CKR-5、CCCKR5、CMKBR5、IDDM22、和CC-CKR-5。在一个另外的方面，本文描述的本发明包含提供用于例如在已经感染的受试者中预防或降低HIV感染和/或预防或降低HIV进入宿主细胞的能力。HIV的示例性宿主细胞包括但不限于CD4细胞、T细胞、肠相关淋巴组织(GALT)、巨噬细胞、树突细胞、髓样前体细胞、以及小胶质细胞。病毒进入宿主细胞需要病毒糖蛋白gp41和gp120与CD4受体和共受体(例如CCR5)的相互作用。如果共受体，例如CCR5，不存在于宿主细胞的表面上，则病毒不能结合并进入宿主细胞。疾病的进展因此被阻止。通过敲除或敲减在宿主细胞中的CCR5，例如，通过引入保护性突变(如CCR5δ32突变)，HIV病毒进入该宿主细胞被防止。

本领域技术人员可以利用例如以下文献的上述研究：奥尔特(Holt)，N.等人《自然生物技术》(Nature biotechnology)28，839-847(2010)；李(Li)，L.等人《分子疗法：美国基因治疗学会杂志》(Molecular therapy:the journal of the American Society of GeneTherapy)21，1259-1269(2013)]；曼达尔(Mandal)等人，《细胞·干细胞》(Cell StemCell)，第15卷，第5期，第643-652页，2014年11月6日；王(Wang)等人(PLoS One.2014年12月26日；9(12):e115987.doi:10.1371/journal.pone.0115987)；法恩(Fine)等人(《科学报告》(Sci Rep.)2015年7月1日；5:10777.doi:10.1038/srep10777)以及李(Li)等人(《基因病毒杂志》(J Gen Virol.)2015年8月；96(8):2381-93.doi:10.1099/vir.0.000139.电子版2015年4月8日)，用于用本发明的CRISPR Cas9系统靶向CCR5。

处理病原体，像病毒病原体如HBV

慢性乙型肝炎病毒(HBV)感染，因在感染细胞中病毒附加体DNA(cccDNA)的持久性，是普遍、致命的，并且很少能治愈。罗马南(Ramanan)等人(罗马南V、斯洛马(Shlomai)A、考克斯(Cox)DB、史华兹(Schwartz)RE、米凯利迪斯(Michailidis)E、巴塔(Bhatta)A、斯科特(Scott)DA、张(Zhang)F、赖斯(Rice)CM、巴蒂亚(Bhatia)SN，《科学报告》(Sci Rep.)2015年6月2日；5:10833.doi:10.1038/srep10833，在线公开于2015年6月2日)显示CRISPR/Cas9系统可以特异性地靶向并切割HBV基因组中的保守区，导致病毒基因表达和复制的稳固抑制。在Cas9以及适当选择的指导RNA的持续表达时，他们证明了cccDNA由Cas9切割，并且cccDNA与病毒基因表达和复制的其他参数两者大幅降低。因此，他们先是直接靶向病毒附加体DNA是用以控制病毒并且可能治愈患者的新颖治疗途径。这还描述于以博德研究所等为名的WO 2015089465A1中，将该文献内容通过引用特此结合。

本发明还可应用于治疗B型肝炎病毒(HBV)。然而，通过例如优化剂量和序列，该CRISPR Cas系统必须适应于避免RNAi的缺点，如过度启动(overstaring)内源小RNA途径的风险(参见，例如，格林姆(Grimm)等人，《自然》第441卷，2006年5月26日)。例如，考虑例如约每人1-10x 10¹⁴个粒子的低剂量。在另一个实施例中，针对HBV的该CRISPR Cas系统可以在脂质体中给药，如一种稳定的核酸-脂质粒子(SNALP)(参见，例如，莫里西(Morrissey)等人，《自然生物技术》(Nature Biotechnology)，第23卷，第8期，2005年8月)。考虑了约1、3或5mg/kg/天的靶向SNALP中的HBV RNA的CRISPR Cas的每日静脉注射。每天治疗可以经过约三天，然后每周治疗持续约五周。在另一个实施例中，陈(Chen)等人的系统(《基因治疗》(2007)14，11-19)可以使用和/或适用于本发明的CRISPR Cas系统。陈(Chen)等人使用双链腺相关病毒8-假型载体(dsAAV2/8)来递送shRNA。在HBV转基因小鼠的肝脏中，携带HBV特异性shRNA的dsAAV2/8载体(1x 10¹²个载体基因组/小鼠)的单次给药有效抑制了HBV蛋白、mRNA和复制型DNA的稳定水平，从而导致在循环中的HBV负荷的高达2-3个log₁₀减少。在载体给药之后，显着的HBV抑制持续了至少120天。shRNA的治疗作用是靶序列依赖性的并且不涉及干扰素的激活。对于本发明，可以将针对HBV的CRISPR Cas系统克隆到AAV载体如dsAAV2/8载体中，并且给予至人，例如，以1x 10¹⁵个载体基因组到约1x 10¹⁶个载体基因组/人的剂量。在另一个实施例中，伍德尔(Wooddell)等人的方法(《分子治疗》第21卷，第5期，973-985，2013年5月)可以用于和/或适用于本发明的CRISPR Cas系统。伍德尔(Wooddell)等人表明，肝细胞靶向的、N-乙酰半乳糖胺轭合的蜂毒肽样肽(NAG-MLP)与靶向凝血因子VII(F7)的嗜肝胆固醇轭合的siRNA(chol-siRNA)的简单共注射导致在小鼠和非人类灵长动物中的有效F7敲低，而在细胞因子的临床化学或诱导上没有变化。使用HBV感染的瞬时转基因小鼠模型，伍德尔(Wooddell)等人表明，NAG-MLP与有效的靶向保守HBV序列的chol-siRNA的简单共注射导致病毒RNA、蛋白质、和病毒DNA的多对数(multilog)阻遏。对于本发明可以设想例如，约6mg/kg的NAG-MLP和6mg/k的HBV特异性CRISPR Cas的静脉内共注射。在替代方案中，约3mg/kg的NAG-MLP和3mg/kg的HBV特异性CRISPR Cas可以在第一天递送，随后在两周之后给予约2-3mg/kg的NAG-MLP和2-3mg/kg的HBV特异性CRISPR Cas。

林(Lin)等人(《分子治疗-核酸》(Mol Ther Nucleic Acids.)2014年8月19日；3:e186.doi:10.1038/mtna.2014.38)设计了针对基因型A的HBV的八种gRNA。采用HBV-特异性gRNA时，CRISPR-Cas9系统显着地降低了用HBV-表达载体转染的Huh-7细胞中HBV核心和表明蛋白的产生。在八种筛选的gRNA中，鉴定两个有效的。靶向保守HBV序列的一种gRNA针对不同的基因型发挥作用。使用流体动力学-HBV持久性小鼠模型，林(Lin)等人进一步证明该系统可以切割包含肝内HBV基因组的质粒并且促进其体内清除，导致血清表面抗原水平降低。这些数据表明该CRISPR-Cas9系统可以在体外和体内均破坏HBV-表达模板，指示它在根除持久HBV感染中的潜力。

董(Dong)等人(《抗病毒研究》(Antiviral Res.)2015年6月；118:110-7.doi:10.1016/j.antiviral.2015.03.015.电子版，2015年4月3日)使用该CRISPR-Cas9系统靶向HBV基因组，并且有效地抑制HBV感染。董(Dong)等人合成四种靶向HBV的保守区域的单一指导RNA(指导RNA)。这些指导RNA与Cas9的表达降低了Huh7细胞以及HBV-复制细胞HepG2.2.15中的病毒产生。董(Dong)等人进一步证明CRISPR-Cas9引导在被转染细胞的HBVcccDNA中发生的切割和切割介导的诱变。在携带HBV cccDNA的小鼠模型中，经由快速尾静脉注射指导RNA-Cas9质粒导致低水平的cccDNA和HBV蛋白。

刘(Liu)等人(《遗传病毒学杂志》(J Gen Virol.)2015年8月；96(8):2252-61.doi:10.1099/vir.0.000159.电子版2015年4月22日)设计了靶向不同HBV基因型的保守区域的可以显着抑制体外和体内HBV复制的八种指导RNA(gRNA)，以研究使用CRISPR-Cas9系统破坏HBV DNA模板的可能性。HBV特异性gRNA/Cas9系统可以抑制细胞中不同基因型的HBV的复制，并且病毒DNA通过单一gRNA/Cas9系统显着降低，并且通过不同的gRNA/Cas9系统的组合被清除。

王(Wang)等人(《世界胃肠病学杂志》(World J Gastroenterol.)2015年8月28日；21(32):9554-65.doi:10.3748/wjg.v21.i32.9554)设计了15种针对基因型A-D的HBV的gRNA。选择覆盖HBV调节区域的两种上述gRNA(双gRNA)的十一个组合。每个gRNA和11个双gRNA对抑制HBV(基因型A-D)复制的效率是通过测量在培养上清液中的HBV表面抗原(HBsAg)或e抗原(HBeAg)来检查的。在用双gRNA和HBV表达载体共转染的HuH7细胞中，使用聚合酶链式反应(PCR)和测序方法检查HBV-表达载体的破坏，并且在HepAD38细胞中使用KCl沉淀、质粒安全ATP依赖性DNA酶(PSAD)消化、滚环扩增和定量PCR组合方法来检查cccDNA的破坏。通过线粒体四唑测定来评估这些gRNA的细胞毒性。所有的gRNA可以显着降低培养上清液中的HBsAg或HBeAg产生，其取决于gRNA针对的区域。所有的双gRNA可以有效地抑制基因型A-D的HBV的HBsAg和/或HBeAg产生，并且当与单独使用的单一gRNA相比时，双gRNA的抑制HBsAg和/或HBeAg产生的功效显着增加。此外，通过PCR直接测序，申请人证实这些双gRNA可以通过去除在两种使用的gRNA的切割位点之间的片段特异性地破坏HBV表达模板。最重要的是，gRNA-5和gRNA-12组合不仅可以有效地抑制HBsAg和/或HBeAg产生，而且还破坏HepAD38细胞中的cccDNA库。

卡里莫夫(Karimova)等人(《科学报告》(Sci Rep.)2015年9月3日；5:13734.doi:10.1038/srep13734)鉴定了在HBV基因组的S和X区中，被靶向用于由Cas9切口酶进行特异和有效切割的交叉基因型保守的HBV序列。这种方法不仅破坏报告细胞系中附加型cccDNA和染色体整合的HBV靶位点，而且破坏了在长期和从头感染的肝癌细胞系中的HBV复制。

本领域技术人员可以利用例如以下文献的上述研究：林(Lin)等人(《分子治疗-核酸》(Mol Ther Nucleic Acids.)2014年8月19日；3:e186.doi:10.1038/mtna.2014.38)，董(Dong)等人(《抗病毒研究》(Antiviral Res.)2015年6月；118:110-7.doi:10.1016/j.antiviral.2015.03.015.电子版2015年4月3日)，刘(Liu)等人(《遗传病毒学杂志》(JGen Virol.)2015年8月；96(8):2252-61.doi:10.1099/vir.0.000159.电子版，2015年4月22日)，王(Wang)等人(《世界肠胃学杂志》(World J Gastroenterol.)2015年8月28日；21(32):9554-65.doi:10.3748/wjg.v21.i32.9554)以及卡里莫夫(Karimova)等人(《科学报告》(Sci Rep.)2015年9月3日；5:13734.doi:10.1038/srep13734)，用于用本发明的CRISPRCas系统靶向HBV。

患者特异性筛选方法

靶向核苷酸(例如三核苷酸重复)的CRISPR-Cas系统可以用于针对此类重复的存在对患者或患者样品进行筛选。这些重复可以是该CRISPR-Cas系统的RNA的靶标，并且如果被该CRISPR-Cas系统结合至其上，则可以检测到该结合，以由此指示存在这样一个重复。因此，CRISPR-Cas系统可以用于针对该重复的存在对患者或患者样品进行筛选。然后可以向该患者给予一种或多种适合的化合物以解决该病症；或者，可以向该患者给予CRISPR-Cas系统，该系统结合到并且引起插入、缺失或突变并且减轻该病症。

治疗遗传或表观遗传方面的疾病

本发明的CRISPR/Cas9系统可以用来校正基因突变，先前使用TALEN和ZFN尝试了已经被鉴定为Cas9系统的潜在靶标的这些突变，但是成功有限，包括作为在爱迪塔斯医药公司的公开申请中描述的使用Cas9系统来靶向座位以用基因疗法在治疗上解决疾病的方法，包括格卢克曼(Gluckmann)等人的WO2015/048577，CRISPR-相关方法以及组合物(CRISPR-RELATED METHODS AND COMPOSITIONS)；格卢克曼(Gluckmann)等人的WO 2015/070083，CRISPR-相关方法以及具有统治性gRNA的组合物(CRISPR-RELATED METHODS ANDCOMPOSITIONS WITH GOVERNING gRNASCRISPR-RELATED METHODS AND COMPOSITIONS WITHGOVERNING gRNAS)。

应提及的是马埃德尔(Maeder)等人的WO 2015/134812，CRISPR/CAS-相关方法以及用于治疗乌谢尔综合征和色素性视网膜炎的组合物(CRISPR/CAS-RELATED METHODS ANDCOMPOSITIONS FOR TREATING USHER SYNDROME AND RETINITIS PIGMENTOSA)。通过本文的传授，本发明包含结合本文的传授应用的这些文献的方法和材料。在眼睛和听力基因疗法的方面，用于治疗乌谢尔综合征和色素性视网膜炎的方法和组合物可以适于本发明的CRISPR-Cas系统(参见例如WO 2015/134812)。在一个实施例中，WO 2015/134812涉及通过基因编辑，例如使用CRISPR-Cas9介导的方法以校正USH2A基因中的位置2299处的鸟嘌呤缺失(例如，替代USH2A基因中的位置2299处的缺失的鸟嘌呤残基)，来治疗或延迟乌谢尔综合征IIA型(USH2A、USH11A)和色素性视网膜炎39(RP39)的发作或进展。在一个相关的方面，通过用一种或多种核酸酶、一种或多种切口酶或其组合进行切割来靶向突变，以例如用校正点突变(例如，单一核苷酸如鸟嘌呤缺失)的供体模板诱导HDR。突变体USH2A基因的改变或校正可以通过任何机制来介导。可以与突变体HSH2A基因的改变(例如校正)相关的示例性机制包括但不限于非同源末端连接、微同源性介导的末端连接(MMEJ)、同源定向修复(例如内源供体模板介导的)、SDSA(合成依赖性链退火)、单链退火或单链侵入。在一个实施例中，用于治疗乌谢尔综合征和色素性视网膜炎的方法可以包括获得由受试者携带的突变的信息，例如通过对USH2A基因的适当部分进行测序。

在一些实施例中，提供了原发性开角型青光眼(POAG)的治疗、预防或诊断。该靶标优选地是MYOC基因。这描述于WO 2015/153780中，将其披露通过引用特此结合。

还提及的是WO 2015/138510，并且通过本文的传授，本发明(使用CRISPR-Cas9系统)包含提供莱伯先天性黑朦10(LCA 10)的发作或进展的治疗或延迟。LCA 10是由CEP290基因中的突变引起，例如在CEP290基因中a c.2991+1655，腺嘌呤到鸟嘌呤突变，该突变产生内含子26中的隐蔽剪接位点。这是在CEP290的内含子26的核苷酸1655处的突变，例如A到G突变。CEP290也称为：CT87；MKS4；POC3；rd16；BBS14；JBTS5；LCAJO；NPHP6；SLSN6；以及3H11Ag(参见，例如，WO 2015/138510)。在基因疗法的一个方面，本发明涉及在CEP290基因的至少一个等位基因中，在LCA靶位置位点(例如c.2991+1655；A到G)附近处引入一个或多个断裂。改变LCA10靶位置是指(1)在LCA10靶位置(例如c.2991+1655A到G)附近或包括该位置处，断裂诱导的引入indel(在本文也称为NHEJ介导的引入indel)，或(2)断裂诱导的基因组序列(该基因组序列包括在LCA10靶位置处的突变，例如c.2991+1655A到G)缺失(在本文也称为NHEJ介导的缺失)。两种途径因在LCA 10靶位置处的突变而产生隐含剪接位点的丢失或破坏。

在一个方面中，本发明(使用CRISPR-Cas9系统)包括提供莱伯先天性黑朦10(LCA10)的发作或进展的治疗或延迟。LCA 10是由CEP290基因中的突变引起，例如在CEP290基因中a c.2991+1655，腺嘌呤到鸟嘌呤突变，该突变产生内含子26中的隐蔽剪接位点。这是在CEP290的内含子26的核苷酸1655处的突变，例如A到G突变。CEP290也称为：CT87；MKS4；POC3；rd16；BBS14；JBTS5；LCAJO；NPHP6；SLSN6；以及3H11Ag(参见，例如，WO 2015/138510)。在基因疗法的一个方面，本发明涉及在CEP290基因的至少一个等位基因中，在LCA靶位置位点(例如c.2991+1655；A到G)附近处引入一个或多个断裂。改变LCA10靶位置是指(1)在LCA10靶位置(例如c.2991+1655A到G)附近或包括该位置处，断裂诱导的引入indel(在本文也称为NHEJ介导的引入indel)，或(2)断裂诱导的基因组序列(该基因组序列包括在LCA10靶位置处的突变，例如c.2991+1655A到G)缺失(在本文也称为NHEJ介导的缺失)。两种途径因在LCA 10靶位置处的突变而产生隐含剪接位点的丢失或破坏。

研究者正在考虑基因疗法是否可以用于治疗宽范围的疾病。本发明的基于Cas9效应蛋白的CRISPR系统被设想用于此类治疗用途，包括但不限于另外的示例靶向区和具有如下的递送方法。使用本发明系统进行治疗可能是有用的病况或疾病的一些实例被包括在本文包含的基因和参考的实例中，并且当前与还提供的那些病况相关。这些示例的基因和病况并非详尽的。

治疗循环系统的疾病

本发明还考虑向血液或造血干细胞递送CRISPR-Cas9系统，特别是本文描述的新颖CRISPR效应蛋白系统。瓦尔格伦(Wahlgren)等人的血浆外泌体(《核酸研究》(NucleicAcids Research)，2012年，第40卷，第17期，e130)被较早描述并且利用为向血液递送该CRISPR Cas9系统。还考虑本发明的核酸靶向系统用来治疗血红蛋白病，如地中海贫血和镰状细胞病。参见，例如，可以被本发明的CRISPR Cas9系统靶向的潜在靶标的国际专利公开号WO 2013/126794。

德拉科波罗(Drakopoulou)，“综述文章，用于β-地中海贫血的基于造血干细胞的基因疗法的持续挑战(Review Article,The Ongoing Challenge of Hematopoietic StemCell-Based Gene Therapy forβ-Thalassemia)”，《国际干细胞》(Stem CellsInternational)，第2011卷，文章ID 987980，10页，doi:10.4061/2011/987980，通过引用并入本文连同它引用的文献，如同完整地陈述一样，讨论了使用递送β-球蛋白或γ-球蛋白的基因的慢病毒修饰HSC。与使用慢病毒相对照，根据本领域的知识和本披露的教导，就β-地中海贫血而言，本领域技术人员可以使用靶向并校正突变的CRISPR-Cas9系统来校正HSC(例如，用递送β-球蛋白或γ-球蛋白(有利地是非镰状化β-球蛋白或γ-球蛋白)的编码序列的适合的HDR模板)；确切地说，指导RNA可以靶向引起β-地中海贫血的突变，并且HDR可以为β-球蛋白或γ-球蛋白的正确表达提供编码。将靶向包含突变-和-Cas9蛋白的粒子的指导RNA与携带突变的HSC进行接触。该粒子还可以包含适合的HDR模板，以校正β-球蛋白或γ-球蛋白的适当表达的突变；或HSC可以与包含或递送HDR模板的第二粒子或载体接触。可以将这样接触的细胞给予；并且任选地处理/扩增；参见卡地亚(Cartier)。在此方面提及的是：卡瓦扎娜(Cavazzana)，“经由离体地用慢病毒β^A-T87Q-球蛋白载体转导的自体造血干细胞移植的用于重型β-地中海贫血的基因治疗的成果(Outcomes of Gene Therapy forβ-Thalassemia Major via Transplantation of Autologous Hematopoietic Stem CellsTransduced Ex Vivo with a Lentiviralβ^A-T87Q-Globin Vector)”tif2014.org/abstractFiles/Jean％20Antoine％20Ribeil_Abstract.pdf；卡瓦扎娜-卡尔沃(Cavazzana-Calvo)，“人β-地中海贫血基因治疗后的输血独立性和HMGA2激活(Transfusion independence and HMGA2activation after gene therapy of humanβ-thalassaemia)”，《自然》(Nature)467，318-322(2010年9月16日)doi:10.1038/nature09328；宁休斯(Nienhuis)，“地中海贫血基因治疗的发展(Development of GeneTherapy for Thalassemia)，《冷泉港医学展望》(Cold Spring Harbor Perpsectives inMedicine)，doi:10.1101/cshperspect.a011833(2012)，LentiGlobin BB305，含有工程化的β-球蛋白基因(βA-T87Q)的慢病毒载体(LentiGlobin BB305,a lentiviral vectorcontaining an engineeredβ-globin gene(β^A-T87Q))；以及谢(Xie)等人，“使用CRISPR/Cas9和背负式运输对患者特异性iPSC中的β-地中海贫血突变进行无缝基因校正(Seamlessgene correction ofβ-thalassaemia mutations in patient-specific iPSCs usingCRISPR/Cas9 and piggyback)”《基因组研究》(Genome Research)gr.173427.114(2014)http://www.genome.org/cgi/doi/10.1101/gr.173427.114(冷泉港实验室出版社(ColdSpring Harbor Laboratory Press))；这是卡瓦扎娜的涉及人β-地中海贫血的工作的主题和谢的工作的主题，全部通过引用并入本文，连同本文引用的或与其相关的所有文献。在本发明中，该HDR模板可以提供HSC以便表达工程化的β-球蛋白基因(例如，β^A-T87Q)，或β-球蛋白，如在谢(Xie)中的。

徐(Xu)等人(《科学报告》(Sci Rep.)2015年7月9日；5:12065.doi:10.1038/srep12065)已设计TALEN和CRISPR-Cas9以直接靶向球蛋白基因中的内含子2突变位点IVS2-654。徐(Xu)等人使用TALEN和CRISPR-Cas9观察到在IVS2-654座位处不同频率的双链断裂(DSB)，并且与CRISPR-Cas9相比，当与背负式运输转座子供体相组合时TALEN介导更高的同源基因靶向效率。此外，与TALEN相比，对于CRISPR-Cas9，观察到更明显的脱靶事件。最后，选择TALEN校正的iPSC克隆用于使用OP9共培养系统进行成红血细胞分化，并且检测到与未校正细胞相比相对较高的HBB的转录。

宋(Song)等人(《干细胞发育》(Stem Cells Dev.)2015年5月1日；24(9):1053-65.doi:10.1089/scd.2014.0347.电子版，2015年2月5日)使用CRISPR/Cas9以校正β-ThaliPSC；在人类胚胎干细胞(hESC)未显示脱靶效应时，基因校正的细胞展现正常的核型和完整的多能性。然后，宋(Song)等人评估基因校正的β-Thal iPSC的分化效率。宋(Song)等人发现在造血分化过程中，基因校正的β-Thal iPSC显示了增加的拟胚体比率和不同的造血祖细胞百分比。更重要的是，与未校正组相比，基因校正的βThal iPSC品系恢复HBB表达，并降低了活性氧种类的产生。宋(Song)等人的研究表明一旦由CRISPR-Cas9系统校正，β-ThaliPSC的造血分化效率则大大改进。类似的方法可以利用本文描述的CRISPR-Cas9系统进行，例如包括Cas9效应蛋白的系统。

参考WO 2015/148860，通过本文的传授，本发明包含结合本文的传授而应用的这些文献的方法和材料。在血液相关疾病基因疗法的方面，用于治疗β地中海贫血的方法和组合物可以适于本发明的CRISPR-Cas系统(参见例如WO 2015/148860)。在一个实施例中，WO2015/148860涉及治疗或预防β地中海贫血或其症状，例如通过改变用于B-细胞CLL/淋巴瘤11A(BCL11A)的基因。该BCL11A基因也称为B-细胞CLL/淋巴瘤11A、BCL11A-L、BCL11A-S、BCL11AXL、CTIP 1、HBFQTL5和ZNF。BCL11A编码在调节球蛋白基因表达中涉及的锌-指蛋白。通过改变BCL11A基因(例如，BCL11A基因的一个或两个等位基因)，可以增加γ球蛋白的水平。γ球蛋白可以替代血红蛋白复合物中的β球蛋白，并且有效地负载氧气到组织，由此改善β地中海贫血疾病表型。

镰状细胞贫血是一种红细胞变为镰刀形的常染色体隐性遗传疾病。它由β-球蛋白基因中的单碱基取代导致，该基因位于染色体11的短臂上。其结果是，产生缬氨酸而非谷氨酸，从而导致镰珠蛋白(HbS)的产生。这导致形成形状扭曲的红细胞。由于这种异常的形状，小血管可以被阻断，从而造成对骨、脾和皮肤组织的严重损伤。这可能导致疼痛、频繁感染、手足综合征或甚至多器官功能衰竭的发作。扭曲的红细胞对溶血也是更敏感的，溶血导致严重贫血。如在β-地中海贫血的情况下，镰状细胞贫血可以通过用该CRISPR-Cas9系统修饰HSC进行校正。该系统允许通过切割其DNA并且然后让它自我修复而对细胞的基因组进行特异性编辑。Cas9蛋白被插入并且通过RNA指导物被指导至突变点并且然后它切割该点处的DNA。同时，插入健康形式的序列。这个序列被细胞自己的修复系统用来固定诱导的切割。以此方式，该CRISPR-Cas9允许在先前获得的干细胞中校正突变。根据本领域的知识和本披露的教导，就镰状细胞贫血而言，本领域技术人员可以使用靶向并校正突变的CRISPR-Cas9系统来校正HSC(例如，用递送β-球蛋白(有利地是非镰状化β-球蛋白或)的编码序列的适合的HDR模板)；确切地说，指导RNA可以靶向引起镰状细胞贫血的突变，并且HDR可以为β-球蛋白的正确表达提供编码。将靶向包含突变-和-Cas9蛋白的粒子的指导RNA与携带突变的HSC进行接触。该粒子还可以包含适合的HDR模板，以校正β-球蛋白的适当表达的突变；或HSC可以与包含或递送HDR模板的第二粒子或载体接触。可以将这样接触的细胞给予；并且任选地处理/扩增。参见卡地亚(Cartier)。该HDR模板可以提供HSC以便表达工程化的β-球蛋白基因(例如，βA-T87Q)，或β-球蛋白，如在谢(Xie)中的。

还提及的是WO 2015/148863，并且通过本文的传授，本发明包含这些文献的方法和材料，它们可以适于本发明的CRISPR-Cas系统。在治疗和预防镰状细胞病(为一种遗传血液病)的一个方面中，WO 2015/148863包含改变BCL11A基因。通过改变BCL11A基因(例如，BCL11A基因的一个或两个等位基因)，可以增加γ球蛋白的水平。γ球蛋白可以替代血红蛋白复合物中的β球蛋白，并且有效地负载氧气到组织，由此改善镰状细胞疾病表型。

威廉姆斯(Williams)，“扩宽造血干细胞遗传疗法的适应症(Broadening theIndications for Hematopoietic Stem Cell Genetic Therapies)”，《细胞·干细胞》(Cell Stem Cell)13:263-264(2013)，通过引用并入本文连同它引用的文献，如同完整地陈述一样，报道了慢病毒介导的基因转移进入来自患有溶酶体贮积病异染性脑白质营养不良症(MLD)的患者的HSC/P细胞中，所述疾病是由芳基硫酸酯酶A(ARSA)缺陷引起的导致神经脱髓鞘的遗传疾病；以及慢病毒介导的基因转移进入患有威斯科特-奥尔德里奇综合征(WAS)的患者的HSC中(患者具有缺损WAS蛋白，该蛋白是调节血液细胞谱系中的细胞骨架功能的小GTP酶CDC42的效应子，并且因此罹患伴有复发性感染、自身免疫性症状的免疫缺陷以及具有异常小的且功能异常的血小板的血小板减少，导致大量出血并且白血病和淋巴瘤的风险增加)。与使用慢病毒相对照，根据本领域的知识和本披露的教导，就MLD(芳基硫酸酯酶A(ARSA)缺陷)而言，本领域技术人员可以使用靶向并校正突变(芳基硫酸酯酶A(ARSA)缺陷)的CRISPR-Cas9系统来校正HSC(例如，用递送ARSA的编码序列的适合的HDR模板)；确切地说，指导RNA可以靶向引起MLD(缺陷ARSA)的突变，并且HDR可以为ARSA的正确表达提供编码。将靶向包含突变-和-Cas9蛋白的粒子的指导RNA与携带突变的HSC进行接触。该粒子还可以包含适合的HDR模板，以校正ARSA的适当表达的突变；或HSC可以与包含或递送HDR模板的第二粒子或载体接触。可以将这样接触的细胞给予；并且任选地处理/扩增。参见卡地亚(Cartier)。与使用慢病毒相对照，根据本领域的知识和本披露的教导，就WAS而言，本领域技术人员可以使用靶向并校正突变(WAS蛋白缺陷)的CRISPR-Cas9系统来校正HSC(例如，用递送WAS蛋白的编码序列的适合的HDR模板)；确切地说，指导RNA可以靶向引起WAS的突变(缺陷WAS蛋白)，并且HDR可以为WAS蛋白的正确表达提供编码。将靶向包含突变-和-Cas9蛋白的粒子的指导RNA与携带突变的HSC进行接触。该粒子还可以包含适合的HDR模板，以校正WAS的适当表达的突变；或HSC可以与包含或递送HDR模板的第二粒子或载体接触。可以将这样接触的细胞给予；并且任选地处理/扩增。参见卡地亚(Cartier)。

在本发明的一个方面中，涉及编辑靶核酸序列或调节靶核酸序列的表达的方法和组合物，以及其结合癌症免疫疗法的应用，是通过适配本发明的CRISPR-Cas系统来领会。参考WO 2015/161276中的基因疗法的应用，其涉及可以用于通过改变一个或多个T细胞表达的基因，例如FAS、BID、CTLA4、PDCD1、CBLB、PTPN6、TRAC和/或TRBC基因中的一个或多个，影响T细胞增殖、存活和/或功能的方法和组合物。在一个相关方面，T细胞增殖可以通过改变一个或多个T细胞表达的基因，例如CBLB和/或PTPN6基因、FAS和/或BID基因、CTLA4和/或PDCDI和/或TRAC和/或TRBC基因，而受到影响。

在患者恶性肿瘤中嵌合抗原受体(CAR)19T-细胞展现抗白血病作用。然而，白血病患者通常不具有足够的T细胞来收集，意味着治疗必须涉及来自供体的修饰的T细胞。因此，存在建立供体T-细胞的库的兴趣。卡西姆(Qasim)等人(“在B-ALL中Talen工程化的通用CAR19T细胞的第一临床应用(First Clinical Application of Talen EngineeredUniversal CAR19T Cells in B-ALL)”ASH第57届年度会议和展览会(ASH 57th AnnualMeeting and Exposition)，2015年12月5日-8日，摘要2046(https://ash.confex.com/ash/2015/webprogram/Paper81653.html在线公开于2015年11月)讨论了修饰CAR19T细胞以通过破坏T细胞受体表达和CD52靶向来消除移植物抗宿主病的风险。此外，靶向CD52细胞，使得它们变得对阿仑单抗不敏感，并且由此允许阿仑单抗预防宿主介导的对人类白细胞抗原(HLA)不匹配的CAR19T细胞的排斥。研究者使用编码与RQR8连接的4g7 CAR19(CD19scFv-4-1BB-CD3ζ)的第三代自我失活型慢病毒载体，然后使用用于多元靶向T细胞受体(TCR)α恒定链座位和CD52基因座位两者的两对TALEN mRNA对细胞进行电穿孔。将在离体表达后仍表达TCR的细胞使用CliniMacsα/βTCR耗减进行耗减，产生T细胞产物(UCART19)，具有<1％的TCR表达，其85％表达CAR19，并且64％变为CD52阴性。给予修饰的CAR19T细胞以治疗患者的复发的急性成淋巴细胞白血病。本文提供的传授内容提供了用于修饰细胞例如以去除或调节CD52或其他靶标的有效方法，因此可以结合以下来使用：改变T细胞或其他细胞向患者的给予以治疗恶性肿瘤。

Watts，“造血干细胞扩增与基因治疗(Hematopoietic Stem Cell Expansion andGene Therapy)”《细胞疗法》(Cytotherapy)，13(10):1164-1171.doi:10.3109/14653249.2011.620748(2011)，通过引用并入本文连同它引用的文献，如同完整地陈述一样，讨论了造血干细胞(HSC)基因疗法(例如，病毒介导的HSC基因疗法)，作为许多障碍的极具吸引力的治疗选择，这些障碍包括血液学病症、免疫缺陷(包括HIV/AIDS)以及其他遗传障碍，像溶酶体贮积病，包括SCID-X1、ADA-SCID、β-地中海贫血、X连锁CGD、威斯科特-奥尔德里奇综合征、范科尼贫血、肾上腺脑白质营养不良(ALD)和异染性脑白质营养不良(MLD)。

转让给Cellectis公司的美国专利公开号20110225664、20110091441、20100229252、20090271881和20090222937，涉及CREI变体，其中两个I-CreI单体的至少一个具有至少两个取代，一个在分别位于从I-CreI的位置26到40以及44到77的LAGLIDADG核心域的两个功能性亚结构域的每一个中，能够从人白细胞介素2受体γ链(IL2RG)基因切割DNA靶序列的所述变体也称为普通细胞因子受体γ链基因或γC基因。在美国专利公开号20110225664、20110091441、20100229252、20090271881和20090222937中鉴定的靶序列可以用于本发明的核酸靶向系统。

由于在淋巴细胞T成熟方面的缺陷所致的严重联合免疫缺陷(SCID)总是与淋巴细胞B的功能缺陷相关联(卡瓦扎纳-卡尔沃(Cavazzana-Calvo)等人，《医学年鉴》(Annu.Rev.Med.)，2005，56，585-602；费舍尔(Fischer)等人，《免疫学评论》(Immunol.Rev.)，2005，203，98-109)。总发病率估计为每75 000个出生人数有1个。患有未经治疗的SCID的患者遭受多重机会性微生物感染，并且通常不能活过一年。SCID可以通过同种异体造血干细胞(来自家族供体)转移进行治疗。对于供体而言的组织兼容性可在很大程度上变化。在腺苷脱氨酶(ADA)缺陷的情况下，SCID之一形成，患者可以通过注射酶重组腺苷脱氨酶进行治疗。

由于已经显示ADA基因在SCID患者中突变(吉布勒特(Giblett)等人，《柳叶刀》(Lancet)，1972，2，1067-1069)，已经鉴定了几种其他的涉及SCID的基因(卡瓦扎纳-卡尔沃(Cavazzana-Calvo)等人，《医学年鉴》(Annu.Rev.Med.)，2005，56，585-602；费舍尔(Fischer)等人，《免疫学评论》(Immunol.Rev.)，2005，203，98-109)。对于SCID有四种主要原因：(i)最常见的SCID形式，SCID-X1(X连锁的SCID或X-SCID)，是由IL2RG基因的突变引起的，导致成熟T淋巴细胞和NK细胞的缺乏。IL2RG编码γC蛋白(野口(Noguchi)等人，《细胞》(Cell)，1993，73，147-157)，其为至少五种白细胞介素受体复合物的一种共有组分。这些受体通过JAK3激酶激活几种靶标(马基(Macchi)等人，《自然》(Nature)，1995，377，65-68)，其失活导致与γC失活相同的综合征；(ii)ADA基因的突变导致嘌呤代谢缺陷，这对于淋巴细胞前体是致命的，进而导致B、T和NK细胞的准缺乏；(iii)V(D)J重组在免疫球蛋白和T淋巴细胞受体(TCR)的成熟中是一个重要步骤。在涉及这个过程的三种基因重组活化基因1和2(RAG1和RAG2)以及阿蒂米斯(Artemis)中的突变导致成熟T和B淋巴细胞的缺乏；以及(iv)还报道了在涉及T细胞特异性信号传导的其他基因如CD45中的突变，虽然它们代表少数情形(卡瓦扎纳-卡尔沃(Cavazzana-Calvo)等人，《医学年鉴》(Annu.Rev.Med.)，2005，56，585-602；费舍尔(Fischer)等人，《免疫学评论》(Immunol.Rev.)，2005，203，98-109)。出于两个主要原因，自从它们的遗传基础已经鉴定以来，不同的SCID形式已经成为基因治疗方法的范例(费舍尔(Fischer)等人，《免疫学评论》(Immunol.Rev.)，2005，203，98-109)。首先，是由于在所有血液疾病中可以设想离体治疗。造血干细胞(HSC)可以从骨髓恢复，并且在较少的细胞分裂中保持了它们的多能性。因此，可以将它们进行体外处理，然后重新注射到患者中，它们入驻骨髓中。其次，由于淋巴细胞的成熟在SCID患者中受损，经校正的细胞具有选择性优势。因此，少量的校正细胞可恢复功能性免疫系统。这种假设借助于下列各项确认数次(i)与SCID患者中的突变的逆转相关联的免疫功能的部分恢复(赫希霍恩(Hirschhorn)等人，《自然-遗传学》(Nat.Genet.)，1996，13，290-295；斯蒂芬(Stephan)等人，《新英格兰医学杂志》(N.Engl.J.Med.)，1996，335，1563-1567；布索(Bousso)等人，《美国国家科学院院刊》(Proc.Natl.，Acad.Sci.USA)，2000，97，274-278；和田(Wada)等人，《美国国家科学院院刊》(Proc.Natl.Acad.Sci.USA)2001，98，8697-8702；西小森(Nishikomori)等人，《血液》(Blood)，2004，103，4565-4572)，(ii)在造血细胞中的体外SCID-X1缺陷的校正(坎多蒂(Candotti)等人，《血液》，1996，87，3097-3102；卡瓦扎纳-卡尔沃(Cavazzana-Calvo)等人，《血液》，1996，《血液》，88，3901-3909；泰勒(Taylor)等人，《血液》，1996，87，3103-3107；哈辛-贝(Hacein-Bey)等人，《血液》，1998，92，4090-4097)，(iii)SCID-X1的校正(苏戴斯(Soudais)等人，《血液》，2000，95，3071-3077；蔡(Tsai)等人，《血液》，2002，100，72-79)，JAK-3(邦廷(Bunting)等人，《自然医学》(Nat.Med.)，1998，4，58-64；邦廷等人，《人类基因治疗》(Hum.Gene Ther.)，2000，11，2353-2364)和RAG2(耶茨(Yates)等人，《血液》，2002，100，3942-3949)在动物模型中的体内缺陷以及(iv)基因治疗临床试验的结果(卡瓦扎纳-卡尔沃等人，《科学》，2000，288，669-672；艾尔迪(Aiuti)等人，《自然医学》(Nat.Med.)，2002；8，423-425；加斯帕(Gaspar)等人，《柳叶刀》(Lancet)，2004，364，2181-2187)。

转让给儿童医疗中心有限公司(Children’s Medical Center Corporation)和哈弗大学(President and Fellows of Harvard College)的美国专利公开号20110182867涉及经由BCL11A表达或活性抑制剂(如RNAi和抗体)在造血祖细胞中调节胎儿血红蛋白(HbF)表达的方法和用途。在美国专利公开号20110182867中披露的靶标，如BCL11A，可以被本发明的CRISPR Cas9系统靶向，以便调节胎儿血红蛋白表达。对于另外的BCL11A靶标，还参见鲍尔(Bauer)等人(《科学》(Science)2013年10月11日：第342卷，第6155期，第253-257页)和许(Xu)等人(《科学》2011年11月18日：第334卷，第6058期，第993-996页)。

采用本领域的知识和本披露中的传授，本领域技术人员可以针对遗传性血液障碍例如β-地中海贫血、血友病、或遗传性溶酶体贮积疾病来校正HSC。

治疗脑、中枢神经系统和免疫系统的疾病

本发明还考虑了向脑或神经元递送该CRISPR-Cas系统。例如，通过降低HTT(亨廷顿病的致病基因)的表达，RNA干扰(RNAi)对这种病症提供了治疗潜能(参见，例如，麦克布赖德(McBride)等人，《分子治疗》(Molecular Therapy)第19卷，第12期，2011年12月，第2152-2162页)，因此申请人假定它可以用于/或适用于该CRISPR-Cas系统。可以使用一种算法来生成该CRISPR-Cas系统，以便降低反义序列的脱靶可能性。这些CRISPR-Cas序列可以靶向小鼠、恒河猴或人类亨廷丁的外显子52中的一个序列并且表达于一种病毒载体如AAV中。可以按照约三次微量注射/半球(总共六次注射)来注射包括人类在内的动物：第一次在前连合的吻侧1mm(12μl)，并且用1e12vg/ml的AAV以约1μl/分的速率在第一次注射的尾侧间隔3mm和6mm进行其余两次注射(分别为12μl和10μl)，并且将针留在适当位置持续另外的5分钟，以允许注射物从针尖扩散。

迪费吉里亚(DiFiglia)等人(PNAS，10月23日，2007年，第104卷，第43期，17204-17209)观察到，向成熟的纹状体中单次给予靶向Htt的siRNA可以使突变体Htt沉默，减弱神经元病理，并且延迟在急骤起病的HD的病毒性转基因小鼠模型中观察到的异常行为表现。迪费吉里亚(DiFiglia)用2μl的Cy3标记的cc-siRNA-Htt或10μM的未结合的siRNA-Htt注射到小鼠的纹状体内。在本发明中对于人类可以考虑靶向Htt的CRISPR Cas的相似剂量，例如，可以将约5-10ml的10μM的靶向Htt的CRISPR Cas注射到纹状体内。

在另一个实施例中，布德罗(Boudreau)等人(《分子治疗》(Molecular Therapy)第17卷，第6期，2009年6月)将5μl的表达htt特异性RNAi病毒的重组AAV血清型2/1载体(以4x10¹²个病毒基因组/ml)注射到纹状体(straiatum)中。在本发明中对于人类可以考虑靶向Htt的CRISPR Cas的相似剂量，例如，可以将约10-20ml的4x 10¹²个病毒基因组/ml靶向Htt的CRISPR Cas注射到纹状体内。

在另一个实施例中，可以连续给予靶向HTT的CRISPR Cas(参见，例如，于(Yu)等人，《细胞》(Cell)150，895-908，8月31日，2012年)。于(Yu)等人利用递送0.25ml/小时的渗透泵(型号2004)来递送300mg/天的ss-siRNA或磷酸盐缓冲盐水(PBS)(西格玛奥德里奇公司(Sigma Aldrich)，持续28天，并且使用被设计为递送0.5μl/小时的泵(型号2002)来递送75mg/天的阳性对照MOE ASO，持续14天。用稀释在无菌PBS中的ss-siRNA或MOE充满泵(度瑞公司(Durect Corporation)，进而在植入之前将其在37C孵育24或48(型号2004)小时。用2.5％异氟烷麻醉小鼠，并且在头盖骨底部做正中切口。使用脑功能区定位导子，将套管植入右侧脑室并且用乐泰胶(Loctite adhesive)固定。将一根附接到Alzet微渗透压泵的导管附接到该套管上，并且将该泵皮下置于肩胛间区(midscapular area)中。用5.0号尼龙缝线将该切口闭合。在本发明中对于人类可以考虑靶向Htt的CRISPR Cas的相似剂量，例如，可以给予约500到1000g/天的靶向Htt的CRISPR Cas。

在连续输注的另一个实例中，斯泰尔斯(Stiles)等人(《实验神经病学》(Experimental Neurology)233(2012)463-471)将一根具有钛针尖的脑实质导管植入到右侧壳核中。将该导管连接到一个皮下植入在腹部的II泵(美敦力神经调控部门(Medtronic Neurological)，明尼阿波里斯市，明尼苏达州)上。在以6μL/天输注磷酸盐缓冲盐水7天之后，用试验品将这些泵重新充满并且编程为连续递送7天。以约0.1到0.5μL/分的变化输注速率输注约约2.3到11.52mg/d的siRNA。在本发明中对于人类可以考虑靶向Htt的CRISPR Cas的相似剂量，例如，可以给予约20到200mg/天的靶向Htt的CRISPR Cas。在另一个实施例中，转让给桑加莫(Sangamo)的美国专利公开号20130253040(WO 2013130824)的这些方法也可以适合于用于治疗亨廷顿病的从塔乐斯(TALES)到本发明的CRISPR Cas系统。在博德研究所(The Broad Institute)等名下的通过引用特此结合的WO 2015089354A1描述了亨廷顿氏病(HP)的靶标。关于亨廷顿氏病，CRISPR复合物的可能的靶基因：PRKCE；IGF1；EP300；RCOR1；PRKCZ；HDAC4；以及TGM2。

因此，以下各项中的一种或多种：PRKCE；IGF1；EP300；RCOR1；PRKCZ；HDAC4；和TGM2，在本发明的一些实施例中可以被选择作为亨廷顿氏病的靶标。

其他三核苷酸重复障碍。这些可以包括以下各项中的任一项：类别I，包括亨廷顿氏病(HD)和脊髓小脑性共济失调；类别II扩展，是表型相异的，具有在量值上通常较小并且还发现于基因的外显子中的异质扩增；以及类别III，包括脆性X综合征、强直性肌营养不良、两种脊髓小脑共济失调、青少年肌阵挛性癫痫以及弗里德赖希共济失调

本发明的一个另外的方面涉及利用CRISPR-Cas系统校正EMP2A和EMP2B基因缺陷，这些基因已经被鉴定为与拉福拉病(Lafora disease)相关。拉福拉病是一种由可以作为青年期的癫痫发作而开始的进行性肌阵挛性癫痫表征的常染色体隐性病症。该疾病的少数病可以由尚未鉴定的基因的突变引起。该疾病引起发作、肌肉痉挛、行走困难、痴呆，并且最终引起死亡。当前没有疗法被证明有效对抗疾病进展。与癫痫相关的其他遗传异常还可以靶向CRISPR-Cas系统并且基础遗传学进一步描述于由朱利亚诺阿文济尼(GiulianoAvanzini)、杰弗里L.诺贝尔斯(Jeffrey L.Noebels)编辑的《癫痫与遗传癫痫遗传学》(Genetics of Epilepsy and Genetic Epilepsies)，马里亚尼儿科神经学基金会(Mariani Foundation Paediatric Neurology)：20；2009)中。

转让给加莫生物科技公司(Sangamo BioSciences,Inc.)的美国专利公开号20110158957的涉及使T细胞受体(TCR)基因失活的方法也可以被修饰为本发明的CRISPRCas系统。在另一个实例中，转让给加莫生物科技公司的美国专利公开号20100311124和转让给Cellectis公司的美国专利公开号20110225664的方法(两者都涉及使谷氨酰胺合成酶基因表达基因失活)也可以被修饰为本发明的CRISPR Cas系统。。

治疗听力疾病

本发明还考虑了向一只或两只耳递送该CRISPR-Cas系统。

研究者正在调查基因治疗是否可以用来辅助当前的耳聋治疗—即，耳蜗植入物。耳聋常常由毛细胞的缺失或损害引起，其不能将信号传递到听觉神经元。在这样的情况下，可以使用耳蜗植入物对声音做出响应并且将电信号传输到神经细胞。但是，由于受损的毛细胞释放释放更少的生长因子，这些神经元常常退化并从耳蜗缩回。

美国专利申请20120328580描述了例如使用一个注射器(例如单剂量注射器)将一种药物组合物注射到耳中(例如，耳部施用)，如注射到耳蜗的腔(luminae)中(例如，中阶、前庭阶、和鼓阶)。例如，可以通过鼓室内注射(例如，进入中耳)、和/或注射到外耳、中耳、和/或内耳给予本文描述的一种或多种化合物。这样的方法在本领域中常规使用，例如，用于将甾体和抗生素给予到人耳中。例如，可以通过耳的圆窗或通过耳蜗囊进行注射。其他内耳施用方法是本领域已知的(参见，例如，索尔特(Salt)和普兰特克(Plontke)，《今日药物发现》(Drug Discovery Today)，10:1299-1306，2005)。

在另一种给药方式中，可以经由一根导管或泵原位施用该药物组合物。导管或泵可以，例如，将药物组合物导向到耳蜗腔或耳的圆窗和/或结肠腔中。适合于将本文所述的一种或多种化合物施用到耳(例如，人耳)中的示例性药物递送设备和方法由麦肯纳(McKenna)等人，(美国公开号2006/0030837)和雅各布布森(Jacobsen)等人，(美国专利号7,206,639)描述。在一些实施例中，可以在外科手术过程中将导管或泵定位在例如患者的耳中(例如，外耳、中耳和/或内耳)。在一些实施例中，可以将导管或泵定位在例如患者的耳中(例如，外耳、中耳和/或内耳)，而不需要外科手术。

可替代地或另外地，本文所述的一种或多种化合物可以与一种佩戴在外耳中的机械装置(如一种耳蜗植入物或助听器)联合使用。适合于与本发明一起使用的示例性耳蜗植入物由埃奇(Edge)等人(美国公开号2007/0093878)描述。

在一些实施例中，上述给药方式可以按照任何顺序组合并且可以是同时的或者散布的。

可替代地或另外地，本发明可以根据食品药品监督管理局批准的任何方法给药，例如，如描述于《CDER数据标准手册》(CDER Data Standards Manual)，版本号004(在fda.give/cder/dsm/DRG/drg00301.htm可获得)。

一般而言，在美国专利申请20120328580中描述的这些细胞治疗方法可以用来体外促进细胞向或朝向内耳的成熟细胞类型(例如，毛细胞)的完全或部分分化。从这样的方法得到的细胞然后可以移植或植入到需要这种治疗的患者中。下面描述了实践这些方法所需的细胞培养方法，包括用于鉴定和选择适当细胞类型的方法、用于促进选定细胞的完全或部分分化的方法、用于鉴定完全或部分分化的细胞类型的方法、以及用于植入完全或部分分化的细胞的方法。

适合于在本发明中使用的细胞包括但不限于，当与本文所述的一种或多种化合物例如体外接触时能够完全或部分分化成内耳的成熟细胞，例如，毛细胞(例如，内耳和/或外耳毛细胞)的细胞。能够分化成毛细胞的示例性细胞包括但不限于干细胞(例如，内耳干细胞、成体干细胞、骨髓源性干细胞、胚胎干细胞、间充质干细胞、皮肤干细胞、iPS细胞、和脂肪来源干细胞)、祖细胞(例如，内耳祖细胞)、支持细胞(例如，戴特斯细胞(Deiters'cell)、柱细胞、内指状细胞、顶盖细胞和汉森细胞)、和/或生殖细胞。干细胞用于替代内耳感觉细胞的用途描述于李(Li)等人(美国公开号2005/0287127)和李等人(美国专利序列号11/953,797)。骨髓源性干细胞用于替代内耳感觉细胞的用途描述于埃奇(Edge)等人的PCT/US2007/084654。iPS细胞描述于，例如，高桥(Takahashi)等人，《细胞》(Cell)，第131卷，第5期，第861-872页(2007)；高桥(Takahashi)和山中(Yamanaka)，《细胞》126，663-76(2006)；冲田(Okita)等人，《自然》(Nature)448，260-262(2007)；余(Yu)J.等人，《科学》(Science)318(5858):1917-1920(2007)；中川(Nakagawa)等人，《自然生物技术》(Nat.Biotechnol.)26:101-106(2008)；以及扎瑞斯(Zaehres)和肖勒(Scholer)，《细胞》131(5):834-835(2007)。可以通过分析(例如，定性或定量)一种或多种组织特异型基因的存在来鉴定这种适合的细胞。例如，可以通过检测一种或多种组织特异型基因的蛋白质产物来检测基因表达。蛋白质检测技术包括使用针对适当抗原的抗体将蛋白质染色(例如，使用细胞提取物或全细胞)。在这种情况下，该适当抗原是该组织特异型基因表达的蛋白质产物。虽然在原则上可以标记第一抗体(即，结合该抗原的抗体)，更普遍的是(并且改进可视化)使用针对该第一抗体的第二抗体(例如，一种抗IgG)。这种第二抗体与荧光染料、或适当的用于比色反应的酶、或金珠(用于电子显微镜检查)、或者与生物素-亲和素系统结合，使得该一级抗体进而该抗原的位置可以被识别。

通过将药物组合物直接应用于外耳，本发明的CRISPR Cas分子可以递送到耳，其中组合物从美国公开申请20110142917修改而来。在一些实施例中，该药物组合物应用于耳道。递送至耳还可以称为听觉或耳递送。

在一些实施例中，本发明的RNA分子在脂质体或阳离子脂质体配制品等等中进行递送并且可以通过本领域技术人员熟知的方法进行制备。这样的方法描述于，例如，美国专利号5,593,972、5,589,466、和5,580,859中，将其通过引用并入本文。

已经开发了专门针对增强和改进递送siRNA到哺乳动物细胞中的递送系统，(参见，例如，沈(Shen)等人《欧洲生化学会联合会快报》(FEBS Let.).2003,539:111-114；夏(Xia)等人，《自然生物技术》(Nat.Biotech.)2002,20:1006-1010；赖希(Reich)等人，《分子视界》(Mol.Vision.)2003,9:210-216；索伦森(Sorensen)等人，《分子生物学杂志》(J.Mol.Biol.)2003,327:761-766；刘易斯(Lewis)等人，《自然遗传学》(Nat.Gen.)2002，32:107-108以及西梅奥尼(Simeoni)等人，NAR 2003，31，11:2717-2724)并且可以将其应用于本发明。最近，siRNA已经成功用于抑制灵长动物中的基因表达(参见例如托伦蒂诺(Tolentino)等人，《视网膜》(Retina)24(4):660，它也可应用于本发明。

齐(Qi)等人披露了通过可应用于本发明的核酸靶向系统的新蛋白质递送技术经由完整圆窗到内耳的有效siRNA转染方法(参见，例如，齐(Qi)等人，《基因治疗》(GeneTherapy)(2013)，1-9)。具体地说，可将Cy3标记的siRNA经由完整圆窗渗透转染到内耳的细胞中(包括内和外毛细胞、壶腹嵴、椭圆囊斑和球囊斑)的TAT双链RNA结合结构域(TAT-DRBD)成功用于体内递送双链siRNA，用于治疗各种内耳疾病和保留听觉功能。可以考虑约40μl的10mM RNA作为施用至耳的剂量。

根据瑞嘉利(Rejali)等人(《听力研究》(Hear Res.)2007年6月；228(1-2):180-7)，耳蜗植入物的功能借助于良好保留螺旋神经节神经元而得以改善，这些神经元是经由植入物电刺激的靶标，并且先前已经表明脑源性神经营养因子(BDNF)在实验性变聋的耳中增强了螺旋神经节的存活。瑞嘉利(Rejali)等人测试了耳蜗植入物电极的改良设计，该电极包括被具有BDNF基因插入片段的病毒载体转导的成纤维细胞的涂层。为了完成这种类型的离体基因转移，瑞嘉利(Rejali)等人用具有BDNF基因盒插入片段的腺病毒转导豚鼠，并且确定这些细胞分泌BDNF，进而将BDNF分泌细胞经由琼脂糖凝胶附着在该耳蜗植入物电极上，并且将该电极植入鼓阶中。瑞嘉利(Rejali)等人确定，该BDNF表达电极与对照电极相比在植入48天之后能够保留显着更多的在耳蜗底回中的螺旋神经节神经元，并且证明了耳蜗植入物治疗与用于增强螺旋神经节神经元存活的离体基因转移相结合的可行性。这样一种系统可以应用于递送到耳的本发明的核酸靶向系统。

穆科吉(Mukherjea)等人(《抗氧化剂与氧化还原信号》(Antioxidants&RedoxSignaling)，第13卷，第5期，2010)证明，使用短干扰(si)RNA敲低NOX3消除了顺铂的耳毒性，正如保护OHC免于损害以及在听觉脑干反应(ABR)中降低的阈值位移所证明。将不同剂量的siNOX3(0.3、0.6、和0.9μg)施用至大鼠并且通过实时RT-PCR评估NOX3表达。当与序列打乱的(scrambled)siRNA的经鼓膜施用或未治疗的耳蜗比较时，使用的最低剂量的NOX3siRNA(0.3μg)未显示对NOX3mRNA的任何抑制。然而，与序列打乱的对照siRNA相比，给予更高剂量的NOX3siRNA(0.6和0.9μg)降低了NOX3表达。这样一种系统系统可应用于经鼓膜给药的本发明的CRISPR Cas系统，其中向人类给药的CRISPR Cas的剂量为约2mg到约4mg。

荣格(Jung)等人(《分子治疗》(Molecular Therapy)，第21卷，第4期，834-841，2013年4月)证明，在椭圆囊中的Hes5水平在应用siRNA之后降低，并且在这些椭圆囊中的毛细胞的数目显着大于对照处理之后的数目。这些数据表明，siRNA技术可以用于诱导内耳中的修复和再生，并且Notch信号通路对于特异性基因表达抑制是一个潜在有用的靶标。荣格(Jung)等人将通过将无菌生理盐水加入冻干siRNA而制备的8μg的Hes5siRNA以2μl体积注射到耳的前庭上皮。这样一种系统系统可应用于向耳的前庭上皮给药的本发明的核酸靶向系统，其中向人类给药的CRISPR Cas的剂量为约1到约30mg。

治疗眼睛疾病

本发明还考虑了向一只或两只眼睛递送该CRISPR-Cas9系统。

在本发明的又另一个方面，该CRISPR-Cas9系统可以用来矫正几种基因突变引起的眼部缺陷，其进一步描述于《眼的遗传疾病》(Genetic Diseases of the Eye)，第二版，由伊莱亚斯(Elias)I.特拉布勒西(Traboulsi)编辑，牛津大学出版社，2012年。

为了向眼部给药，慢病毒载体，尤其是马传染性贫血病毒(EIAV)是特别优选的。

在另一个实施例中，还考虑了基于马传染性贫血病毒(EIAV)的最小非灵长类慢病毒载体，尤其是对于眼基因治疗而言(参见，例如，巴鲁谷安(Balagaan)，《基因医学杂志》(JGene Med)2006；8:275-285，2005年11月21日在《威利在线期刊》(Wiley InterScience)(www.interscience.wiley.com)DOI:10.1002/jgm.845)。考虑这些载体具有驱动靶基因表达的巨细胞病毒(CMV)启动子。前房内、视网膜下、眼内和玻璃体内注射均予以考虑(参见，例如，巴鲁谷安(Balagaan)，《基因医学杂志》(J Gene Med)2006；8:275-285，2005年11月21日在《威利在线期刊》(Wiley Inter Science)(www.interscience.wiley.com).DOI:10.1002/jgm.845)。可以在手术显微镜的辅助下进行眼内注射。为了视网膜下和玻璃体内注射，通过轻轻指压可以使眼睛突出，并且使用接触镜系统看见眼底，该接触镜系统包含在角膜上的一滴耦合介质溶液，角膜用玻璃显微镜载玻片盖玻片覆盖。为了视网膜下注射，安装在5-μl的汉密尔顿注射器上的10-mm 34号针的尖端可以在直接可视化之下穿过巩膜赤道部上部朝向后极切向行进，直到该针的孔在视网膜下空间中可见时为止。然而，可以注射2μl的载体悬浮液以产生上部泡状视网膜脱离，从而证实视网膜下载体给药。这种方法建立了一种自我愈合的巩膜切开术，允许载体悬浮液保留在视网膜下空间中，直到它在该操作的48小时之内被RPE吸收为止。可以在半球下方重复这个操作以产生下部视网膜脱离。这种技术导致大约70％的感觉神经性视网膜和RPE暴露于该载体悬浮液。为了玻璃体内注射，针尖可以在角巩膜缘后方1mm穿过巩膜并且将2μl的载体悬浮液注射到玻璃体腔中。为了前房内注射，针尖可以通过角巩膜缘穿刺朝向中央角膜行进，并且可以注射2μl的载体悬浮液。为了前房内注射，针尖可以通过角巩膜缘穿刺朝向中央角膜行进，并且可以注射2μl的载体悬浮液。可以1.0-1.4×10¹⁰或1.0-1.4×10⁹个转导单位(TU)/ml的滴度注射这些载体。

在另一个实施例中，还考虑了一种经由视网膜下注射用于治疗湿型的年龄相关性黄斑变性的表达血管生成抑制蛋白(内皮抑素和血管抑素)的基于马传染性贫血病毒的慢病毒基因治疗载体(参见，例如，宾利(Binley)等人，《人类基因治疗》(HUMANGENE THERAPY)23:980-991(2012年9月))。这样一种载体可以改良为本发明的CRISPR-Cas9系统。每只眼可以用以1.1x 10⁵个转导单位/眼(TU/眼)以总体积100μl进行治疗。

在一个实施例中，提及WO 2015/153780，其包括通过靶向MYOC基因的编码序列提供对原发性开角型青光眼(POAG)的治疗或预防。引起POAG的一些靶突变包括但不限于P370(例如P370L)；I477(例如，I477N或I477S)；T377(例如TE77R)；Q368(Q368终止)-所有均在MYOC基因中。该靶突变还可以包括在MYOC基因中的氨基酸序列位置246-252之间的突变热点。在一个实施例中，该靶突变是在MYOC基因中的氨基酸序列位置例如氨基酸368-380、氨基酸368-370+377-380、氨基酸364-380、或氨基酸347-380之间的突变热点。在一个实施例中，该靶突变是在MYOC基因中的氨基酸序列位置423-437(例如氨基酸423-426、氨基酸423-427和氨基酸423-437)之间的突变热点。在一个实施例中，该靶突变是在MYOC基因中的氨基酸序列位置477-502之间的突变热点(参见例如WO 2015/153780)。

在另一个实施例中，对于递送至眼可以考虑E1-、部分E3-、E4-缺失的腺病毒载体。对患有晚期新生血管性年龄相关性黄斑变性(AMD)的二十八位患者给予表达人色素上皮源性因子(AdPEDF.ll)的E1-、部分E3-、E4-缺失的腺病毒载体的单次玻璃体内注射(参见，例如，坎波基亚罗(Campochiaro)等人，《人类基因治疗》(Human Gene Therapy)17:167-176(2006年2月))。研究了从10⁶到10^9.5个粒子单位(PU)范围的剂量，没有与AdPEDF.ll有关的严重不良事件且没有剂量限制性毒性(参见，例如，坎波基亚罗(Campochiaro)等人，《人类基因治疗》(Human Gene Therapy)17:167-176(2006年2月))。腺病毒载体介导的眼部基因转移显得是一种可行的用于治疗眼部病症的方法，并且可应用于该CRISPR Cas9系统。

在另一个实施例中，RXi制药公司(RXi Pharmaceuticals)的系统可以用于和/或适用于将CRISPR Cas9递送至眼。在这个系统中，3μg的sd-rxRNA的单次玻璃体内给药导致PPIB mRNA水平的序列特异性降低，持续14天。该系统可以应用于本发明的核酸靶向系统，考虑向人类给药的剂量为约3到20mg的CRISPR。

米林顿-华德(Millington-Ward)等人(《分子治疗》(Molecular Therapy)，第19卷，第4期，642-649，2011年4月)描述了腺相关病毒(AAV)载体，其用来递送基于RNA干扰(RNAi)的视紫红质抑制剂和由于在RNAi靶位点上的简并位置处的核苷酸改变而抵抗抑制的密码子修饰的视紫红质代替基因。由米林顿-华德(Millington-Ward)等人将6.0x 10⁸vp或1.8x 10¹⁰vp AAV的注射剂经视网膜下注射到眼中。米林顿-华德(Millington-Ward)等人的AAV载体可以应用于本发明的CRISPR Cas系统，考虑向人类给药的剂量为约2x 10¹¹到约6x 10¹³vp。

戴尔卡拉(Dalkara)等人(《科学转化医学》(Sci Transl Med)5，189ra76(2013))还涉及用于形成一种AAV载体的体内定向演化，该AAV载体在将野生型缺陷型基因无损伤地注射到眼的玻璃体液中之后递送至整个视网膜。戴尔卡拉(Dalkara)描述了7聚体肽展示文库和通过从AAV1、2、4、5、6、8、和9的cap基因的DNA改组构建的AAV文库。将这些rcAAV文库和在CAG或Rho启动子之下表达GFP的rAAV载体进行包装，并且通过定量PCR获得抗脱氧核糖核酸酶的基因组滴度。汇集这些文库，并且进行两轮演化，每轮演化包括初始文库多样化继之以三个体内选择步骤。在每个这样的步骤中，用2ml的碘克沙醇纯化的磷酸盐缓冲盐水(PBS)透析的文库以约1×10¹²vg/ml的基因组滴度对P30rho-GFP小鼠进行玻璃体内注射。戴尔卡拉(Dalkara)等人的AAV载体可以应用于本发明的核酸靶向系统，考虑向人类给药的剂量为约1x 10¹⁵到约1x 10¹⁶vg/ml。

在另一个实施例中，该视紫红质基因可以被靶向用于治疗色素性视网膜炎(RP)，其中转让给桑加莫生物科学公司(Sangamo BioSciences，Inc.)的美国专利公开号20120204282的系统可以依照本发明的CRISPR Cas9系统进行修饰。

在另一个实施例中，针对从人类视紫红质基因切割靶序列的方法的转让给Cellectis公司的美国专利公开号20130183282的方法也可以针对本发明的核酸靶向系统进行修改。

转让给台湾中央研究院(Academia Sinica)的美国专利公开号20130202678涉及用于治疗视网膜病变和视力威胁性眼科疾病(sight-threatening ophthalmologicdisorders)的方法，这些方法涉及向眼的视网膜下或玻璃体内空间中递送Puf-A基因(在眼组织的视网膜神经节和色素细胞中表达并且展示出独特的抗凋亡活性)。具体地说，令人希望的靶标是zgc:193933、prdm1a、spata2、tex10、rbb4、ddx3、zp2.2、Blimp-1和HtrA2，均可以由本发明的核酸靶向系统靶向。

吴(Wu)(《细胞—干细胞》(Cell Stem Cell)，13:659-62，2013)设计了一种指导RNA，其将Cas9导向到单个碱基突变，该突变在小鼠中引起白内障，其中它诱导DNA切割。然后，在突变小鼠中，使用针对接合子修复机制给予的另一种野生型等位基因或寡核苷酸(oligos)校正断裂的等位基因的序列并且校正引起白内障的基因缺陷。

美国专利公开号20120159653描述了使用锌指核酸酶基因修饰与黄斑变性(MD)相关的细胞、动物以及蛋白质。黄斑变性(MD)是老年人视力损害的主要原因，但也是儿童疾病如斯塔加特病(Stargardt disease)、索斯比基底营养不良(Sorsby fundus)、和儿童致死性神经变性疾病(在如婴儿期一般年幼的年龄就开始)的标志性症状。由于对视网膜的损害，黄斑变性导致视野中心(黄斑)的视力丧失。当前存在的动物模型并未概括该疾病的主要标志，因为它是在人类中观察到的。包含编码与MD相关的蛋白质的突变基因的可得到的动物模型也产生高度可变的表型，使得针对人类疾病和治疗开发的翻译是有问题的。

美国专利公开号20120159653的一个方面包括编辑任何编码与MD相关的蛋白质的染色体序列，这些序列可以应用于本发明核酸靶向系统。典型地，基于与MD相关的蛋白质与MD病症的实验性关联，选择与MD相关的蛋白质。例如，相对于缺乏MD病症的群体，在具有MD病症的群体中，与MD相关的蛋白质的产生率或循环浓度可以升高或降低。可以使用蛋白质组技术评估蛋白质水平差异，包括但不限于蛋白质印迹、免疫组织化学染色、酶联免疫吸附测定(ELISA)以及质谱法。可替代地，可以使用基因组技术通过获得编码这些蛋白质的基因的基因表达谱而鉴定与MD相关的蛋白质，包括但不限于DNA微阵列分析、基因表达系列分析(SAGE)以及定量实时聚合酶链式反应(Q-PCR)。

通过非限制性实例的方式，与MD相关的蛋白质包括但不限以下蛋白质：(ABCA4)ATP结合盒，亚家族A(ABC1)，成员4、ACHM1全色盲(视杆单色色盲)1、ApoE，载脂蛋白E(ApoE)、C1QTNF5(CTRP5)，C1q和肿瘤坏死因子相关蛋白5(C1QTNF5)、C2补体，补体2(C2)、C3补体，补体(C3)、CCL2，趋化因子(C-C基序)配体2(CCL2)、CCR2，趋化因子(C-C基序)受体2(CCR2)、CD36分化抗原簇36、CFB，补体受体B、CFH，补体因子CFH H、CFHR1，补体因子H相关1、CFHR3，补体因子H相关3、CNGB3环核苷酸门控通道β3、CP血浆铜蓝蛋白(CP)、CRP，C反应蛋白(CRP)、CST3半胱氨酸蛋白酶抑制剂C或半胱氨酸蛋白酶抑制剂3(CST3)、CTSD，组织蛋白酶D(CTSD)、CX3CR1，趋化因子(C-X3-C基序)受体1、ELOVL4，超长链脂肪酸延伸4、ERCC6，切除修复交叉互补啮齿动物修复缺陷，互补群6、FBLN5，抗衰老蛋白-5，FBLN5，抗衰老蛋白5、FBLN6，抗衰老蛋白6FSCN2聚束蛋白(FSCN2)、HMCN1，半椎蛋白1，HMCN1，半椎蛋白1、HTRA1，HtrA丝氨酸肽酶1(HTRA1)，HTRA1、HtrA丝氨酸肽酶1、IL-6，白细胞介素6、IL-8，白细胞介素8、LOC387715、假定蛋白、LEKHA1、含血小板白细胞C激酶底物同源性域家族A成员1(PLEKHA1)、PROM1，普罗敏蛋白1(PROM1或CD133)、PRPH2，外周蛋白-2RPGR色素性视网膜炎GTP酶调节剂、SERPING1，丝氨酸蛋白酶抑制剂肽酶抑制剂，进化枝G，成员1(C1-抑制剂)、TCOF1，糖蜜TIMP3金属蛋白酶抑制剂3(TIMP3)、TLR3Toll样受体3。

与MD相关的其染色体序列被编辑的蛋白质的一致性可以并且应该变化。在优选的实施例中，与其染色体序列被编辑的MD相关的蛋白质可以是ATP结合盒、由ABCR基因编码的亚家族A(ABC1)成员4蛋白(ABCA4)、由APOE基因编码的载脂蛋白E蛋白(APOE)、由CCL2基因编码的趋化因子(C-C基序)配体2蛋白(CCL2)、由CCR2基因编码的趋化因子(C-C基序)受体2蛋白(CCR2)、由CP基因编码的血浆铜蓝蛋白蛋白(CP)、由CTSD基因编码的组织蛋白酶D蛋白(CTSD)、或由TIMP3基因编码的金属蛋白酶抑制剂3蛋白(TIMP3)。在一个示例性实施例中，该遗传修饰的动物是大鼠，并且与编码与MD相关的蛋白质的编辑的染色体序列可以是：(ABCA4)ATP结合盒NM_000350亚家族A(ABC1)成员4、APOE载脂蛋白ENM_138828(APOE)、CCL2趋化因子(C-C NM_031530基序)配体2(CCL2)、CCR2趋化因子(C-C NM_021866基序)受体2(CCR2)、CP血浆铜蓝蛋白(CP)NM_012532、CTSD组织蛋白酶D(CTSD)NM_134334、TIMP3金属蛋白酶NM_012886抑制剂3(TIMP3)。该动物或细胞可以包括1、2、3、4、5、6、7个或更多个破坏的编码与MD相关的蛋白质的染色体序列以及零、1、2、3、4、5、6、7个或更多个编码破坏的与MD相关的蛋白质的染色体整合序列。

编辑的或整合的染色体序列可以被修饰为编码一种改变的与MD相关的蛋白质。MD相关染色体序列中的几种突变已经与MD相关。在与MD相关的染色体序列中的突变的非限制性实例包括可引起MD的那些，包括在ABCR蛋白中的：E471K(即，在位置471的谷氨酸被改变为赖氨酸)、R1129L(即，在位置1129处的精氨酸被改变为亮氨酸)、T1428M(即，在位置1428处的苏氨酸被改变为甲硫氨酸)、R1517S(即，在位置1517处的精氨酸被改变为丝氨酸)、I1562T(即，在位置1562处的异亮氨酸被改变为苏氨酸)、以及G1578R(即，在位置1578处的甘氨酸被改变为精氨酸)；在CCR2蛋白中的：V64I(即，在位置192处的缬氨酸被改变为异亮氨酸)；在CP蛋白质中的：G969B(即，在位置969处的甘氨酸被改变为天冬酰胺或天冬氨酸)；在TIMP3蛋白中的：S156C(即，在位置156处的丝氨酸被改变为半胱氨酸)、G166C(即，在位置166处的甘氨酸被改变为半胱氨酸)、G167C(即，在位置167处的甘氨酸被改变为半胱氨酸)、Y168C(即，在位置168处的酪氨酸被改变为半胱氨酸)、S170C(即，在位置170处的丝氨酸被改变为半胱氨酸)、Y172C(即，在位置172处的酪氨酸被改变为半胱氨酸)以及S181C(即，在位置181处的丝氨酸被改变为半胱氨酸)。MD相关基因和疾病的遗传变体的其他关联在本领域是已知的。

治疗循环系统和肌肉疾病

本发明还考虑了向心脏递送本文描述的CRISPR-Cas系统，例如Cas9效应蛋白系统。对于心脏，心肌热带腺相关病毒(AAVM)优选的，尤其是在心脏中显示出优先基因转移的AAVM41(参见，例如，林-扬加(Lin-Yanga)等人，PNAS，3月10日，2009年，第106卷，第10期)。给药可以是全身性的或局部的。对于全身给药可以考虑约1-10x 10¹⁴个载体基因组的剂量。还参见，例如，埃拉里奥(Eulalio)等人(2012)《自然》(Nature)492:376和索马森达拉姆(Somasuntharam)等人(2013)《生物材料》(Biomaterials)34:7790。

例如，美国专利公开号20110023139描述了使用锌指核酸酶基因修饰与心血管疾病相关的细胞、动物以及蛋白质。心血管疾病通常包括高血压、心脏病发作、心力衰竭、以及中风和TIA。涉及心血管疾病的任何染色体序列或由涉及心血管疾病的任何染色体序列编码的蛋白质都可以在本披露中描述的方法中加以利用。典型地，基于心血管相关蛋白与心血管疾病的发展的实验性关联，选择心血管相关蛋白。例如，相对于缺乏心血管障碍的群体，在具有心血管障碍的群体中，心血管相关蛋白的产生率或循环浓度可以升高或降低。可以使用蛋白质组技术评估蛋白质水平差异，包括但不限于蛋白质印迹、免疫组织化学染色、酶联免疫吸附测定(ELISA)以及质谱法。可替代地，可以使用基因组技术通过获得编码这些蛋白质的基因的基因表达谱而鉴定心血管相关蛋白，包括但不限于DNA微阵列分析、基因表达系列分析(SAGE)以及定量实时聚合酶链式反应(Q-PCR)。

作为举例，该染色体序列可以包括但不限于，IL1B(白细胞介素1，β)、XDH(黄嘌呤脱氢酶)、TP53(肿瘤蛋白p53)、PTGIS(前列腺素12(前列环素)合酶)、MB(肌红蛋白)、IL4(白细胞介素4)、ANGPT1(血管生成素1)、ABCG8(ATP结合盒，亚家族G(白)，成员8)、CTSK(组织蛋白酶K)、PTGIR(前列腺素12(前列环素)受体(IP))、KCNJ11(内向整流钾通道，亚家族J，成员11)、INS(胰岛素)、CRP(C反应蛋白，正五聚蛋白相关的)、PDGFRB(血小板源生长因子受体，β多肽)、CCNA2(细胞周期蛋白A2)、PDGFB(血小板源生长因子β多肽(猴肉瘤病毒(v-sis)癌基因同源物))、KCNJ5(内向整流钾通道，亚家族J，成员5)、KCNN3(钾中间小电导钙激活通道，亚家族N，成员3)、CAPN10(卡配因10)、PTGES(前列腺素E合酶)、ADRA2B(肾上腺素能，α-2B-，受体)、ABCG5(ATP结合盒，亚家族G(WHITE)、成员5)、PRDX2(过氧化物氧化还原酶2)、CAPN5(卡配因5)、PARP14(聚(ADP-核糖)聚合酶家族，成员14)、MEX3C(mex-3同源物C(秀丽隐杆线虫))、ACE血管紧张素I转化酶(肽基二肽酶A)1)、TNF(肿瘤坏死因子(TNF超家族，成员2))、IL6(白细胞介素6(干扰素，β2))、STN(抑制素)、SERPINE1(丝氨酸蛋白酶抑制蛋白肽酶抑制剂，进化枝E(微管连接蛋白，纤溶酶原激活物抑制剂1型)、成员1)、ALB(白蛋白)、ADIPOQ(脂联素，含C1Q和胶原蛋白域)、APOB(载脂蛋白B(包括Ag(x)抗原))、APOE(载脂蛋白E)、LEP(瘦素)、MTHFR(5,10-亚甲基四氢叶酸还原酶(NADPH))、APOA1(载脂蛋白A-I)、EDN1(内皮素1)、NPPB(利钠肽前体B)、NOS3(一氧化氮合酶3(内皮细胞))、PPARG(过氧化物酶体增殖物活化受体γ)、PLAT(纤溶酶原激活物，组织)、PTGS2(前列腺素内过氧化物合酶2(前列腺素G/H合酶和环加氧酶))、CETP(胆固醇酯转移蛋白，血浆)、AGTR1(血管紧张素II受体，1型)、HMGCR(3-羟基-3-甲基戊二酸单酰辅酶A还原酶)、IGF1(胰岛素样生长因子1(生长素调节素C))、SELE(选择素E)、REN(肾素)、PPARA(过氧化物酶体增殖物活化受体α)、PON1(对氧磷酶1)、KNG1(激肽原1)、CCL2(趋化因子(C-C基序)配体2)、LPL(脂蛋白脂酶)、VWF(冯·维勒布兰德因子)、F2(凝血因子II(凝血酶))、ICAM1(细胞间粘附分子1)、TGFB1(转化生长因子，β1)、NPPA(利钠肽前体A)、IL10(白细胞介素10)、EPO(促红细胞生成素)、SOD1(超氧化物歧化酶1，可溶性)、VCAM1(血管细胞粘附分子1)、IFNG(干扰素，γ)、LPA(脂蛋白，Lp(a))、MPO(髓过氧化物酶)、ESR1(雌激素受体1)、MAPK1(丝裂原活化蛋白激酶1)、HP(触珠蛋白)、F3(凝血因子III(促凝血酶原激酶，组织因子))、CST3(半胱氨酸蛋白酶抑制剂C)、COG2(寡聚高尔基复合体成分2)、MMP9(基质金属肽酶9(明胶酶B，92kDa明胶酶，92kDa IV型胶原酶))、SERPINC1(丝氨酸蛋白酶抑制蛋白肽酶抑制剂，进化枝C(抗凝血酶)、成员1)、F8(凝血因子VIII，促凝血成分)、HMOX1(血红素加氧酶(解环)1)、APOC3(载脂蛋白C-III)、IL8(白细胞介素8)、PROK1(前动力蛋白1)、CBS(胱硫醚-β-合酶)、NOS2(一氧化氮合酶2，诱导型)、TLR4(toll样受体4)、SELP(选择素P(颗粒膜蛋白140kDa，抗原CD62))、ABCA1(ATP结合盒，亚家族A(ABC1)、成员1)、AGT(血管紧张素原(丝氨酸蛋白酶抑制蛋白肽酶抑制剂，进化枝A，成员8))、LDLR(低密度脂蛋白受体)、GPT(谷丙转氨酶(丙氨酸转氨酶))、VEGFA(血管内皮生长因子A)、NR3C2(细胞核受体亚家族3，型C，成员2)、IL18(白细胞介素18(干扰素-γ-诱导因子))、NOS1(一氧化氮合酶1(神经元的))、NR3C1(细胞核受体亚家族3，C组，成员1(糖皮质激素受体))、FGB(纤维蛋白原β链)、HGF(肝细胞生长因子(肝细胞生长因子A；分散因子))、IL1A(白细胞介素1，α)、RETN(抵抗素)、AKT1(v-akt鼠科胸腺瘤病毒癌基因同源物1)、LIPC(脂肪酶，肝脏的)、HSPD1(热休克60kDa蛋白1(伴侣蛋白))、MAPK14(丝裂原活化蛋白激酶14)、SPP1(分泌磷蛋白1)、ITGB3(整合素，β3(血小板糖蛋白111a，抗原CD61))、CAT(过氧化氢酶)、UTS2(尾加压素2)、THBD(血栓调节蛋白)、F10(凝血因子X)、CP(血浆铜蓝蛋白(亚铁氧化酶))、TNFRSF11B(肿瘤坏死因子受体超家族，成员11b)、EDNRA(内皮素A型受体)、EGFR(表皮生长因子受体(红白血病病毒(v-erb-b)癌基因同源物，鸟类的))、MMP2(基质金属肽酶2(明胶酶A，72kDa明胶酶，72kDa IV型胶原酶))、PLG(纤维蛋白溶酶原)、NPY(神经肽Y)、RHOD(ras同源物基因家族，成员D)、MAPK8(丝裂原活化蛋白激酶8)、MYC(V-Myc骨髓细胞瘤病毒癌基因同源物(鸟类的))、FN1(纤连蛋白1)、CMA1(糜酶1，肥大细胞)、PLAU(纤溶酶原激活物，尿激酶)、GNB3(鸟嘌呤核苷酸结合蛋白(G蛋白)、β多肽3)、ADRB2(肾上腺素能，β-2-，受体，表面)、APOA5(载脂蛋白A-V)、SOD2(超氧化物歧化酶2，线粒体的)、F5(凝血因子V(促凝血球蛋白原，不稳定因子))、VDR(维生素D(1,25-二羟维生素D3)受体)、ALOX5(花生四烯酸盐5-脂氧合酶)、HLA-DRB1(主要组织兼容性复合物，I类I，DRβ1)、PARP1(聚(ADP-核糖)聚合酶1)、CD40LG(CD40配体)、PON2(对氧磷酶2)、AGER(晚期糖基化终末产物特异性受体)、IRS1(胰岛素受体底物1)、PTGS1(前列腺素内过氧化物合酶1(前列腺素G/H合酶和环加氧酶))、ECE1(内皮素转化酶1)、F7(凝血因子VII(血清凝血酶原转变加速因子))、URN(白细胞介素1受体拮抗剂)、EPHX2(环氧化物水解酶2，细胞质的)、IGFBP1(胰岛素样生长因子结合蛋白1)、MAPK10(丝裂原活化蛋白激酶10)、FAS(Fas(TNF受体超家族，成员6))、ABCB1(ATP结合盒，亚家族B(MDR/TAP)，成员1)、JUN(jun癌基因)、IGFBP3(胰岛素样生长因子结合蛋白3)、CD14(CD14分子)、PDE5A(磷酸二酯酶5A，cGMP特异性)、AGTR2(血管紧张素II受体，2型)、CD40(CD40分子，TNF受体超家族成员5)、LCAT(卵磷脂胆甾醇酰基转移酶)、CCR5(趋化因子(C-C基序)受体5)、MMP1(基质金属肽酶1(间质胶原酶))、TIMP1(TIMP金属肽酶抑制剂1)、ADM(肾上腺髓质素)、DYT10(肌张力障碍10)、STAT3(信号传导和转录激活因子3(急性期反应因子))、MMP3(基质金属肽酶3(基质溶解素1，前白明胶酶))、ELN(弹性蛋白)、USF1(上游转录因子1)、CFH(补体因子H)、HSPA4(热休克70kDa蛋白4)、MMP12(基质金属肽酶12(巨噬细胞弹性蛋白酶))、MME(膜金属肽链内切酶)、F2R(凝血因子II(凝血酶)受体)、SELL(选择素L)、CTSB(组织蛋白酶B)、ANXA5(膜联蛋白A5)、ADRB1(肾上腺素能，β-1-，受体)、CYBA(细胞色素b-245，α多肽)、FGA(纤维蛋白原α链)、GGT1(γ-谷氨酰转肽酶1)、LIPG(脂肪酶，内皮的)、HIF1A(缺氧诱导因子1，α亚基(碱性-螺旋-环-螺旋转录因子))、CXCR4(趋化因子(C-X-C基序)受体4)、PROC(蛋白C(凝血因子Va和VIIIa抑制因子)、SCARB1(清道夫受体B类，成员1)、CD79A(CD79a分子，免疫球蛋白相关α)、PLTP(磷脂转移蛋白)、ADD1(内收蛋白1(α))、FGG(纤维蛋白原γ链)、SAA1(血清淀粉样蛋白A1)、KCNH2(电压门控钾离子通道，亚家族H(触角电位相关)、成员2)、DPP4(二肽基肽酶4)、G6PD(6-磷酸葡萄糖脱氢酶)、NPR1(钠尿肽受体A/鸟苷酸环化酶A(心房钠尿肽受体A))、VTN(玻连蛋白)、KIAA0101(KIAA0101)、FOS(FBJ鼠科骨肉瘤病毒癌基因同源物)、TLR2(toll样受体2)、PPIG(肽基脯氨酰异构酶G(亲环素G))、IL1R1(白细胞介素1受体，I型)、AR(雄激素受体)、CYP1A1(细胞色素P450，家族1，亚家族A，多肽1)、SERPINA1(丝氨酸蛋白酶抑制蛋白肽酶抑制剂，进化枝A(α-1抗蛋白酶，抗胰蛋白酶)，成员1)、MTR(5-甲基四氢叶酸高半胱胺酸甲基转移酶)、RBP4(视黄醇结合蛋白4，血浆)、APOA4(载脂蛋白A-IV)、CDKN2A(细胞周期蛋白依赖性激酶抑制剂2A(黑素瘤p16，抑制CDK4))、FGF2(成纤维细胞生长因子2(碱性))、EDNRB(内皮素受体B型)、ITGA2(整合素，α2(CD49B，VLA-2受体α2亚基))、CABIN1(钙调神经磷酸酶结合蛋白1)、SHBG(性激素结合球蛋白)、HMGB1(高迁移率族1)、HSP90B2P(热休克蛋白90kDaβ(Grp94)，成员2(假基因))、CYP3A4(细胞色素P450，家族3，亚家族A，多肽4)、GJA1(间隙连接蛋白，α1，43kDa)、CAV1(小窝蛋白1，细胞质膜微囊蛋白，22kDa)、ESR2(雌激素受体2(ERβ))、LTA(淋巴毒素α(TNF超家族，成员1))、GDF15(生长分化因子15)、BDNF(脑源性神经营养因子)、CYP2D6(细胞色素P450，家族2，亚家族D，多肽6)、NGF(神经生长因子(β多肽))、SP1(Sp1转录因子)、TGIF1(TGFB-诱导因子同源框1)、SRC(v-src肉瘤(施密特-鲁平(Schmidt-Ruppin)A-2)病毒癌基因同源物(鸟类的))、EGF(表皮生长因子(β-抑胃素))、PIK3CG(磷酸肌醇-3-激酶，催化的，γ多肽)、HLA-A(主要组织兼容性复合物，I类，A)、KCNQ1(电压门控钾通道，KQT样亚家族，成员1)、CNR1(大麻素受体1(脑))、FBN1(微纤维蛋白1)、CHKA(胆碱激酶α)、BEST1(卵黄状黄斑病蛋白1)、APP(淀粉样蛋白β(A4)前体蛋白)、CTNNB1(连环蛋白(钙粘着蛋白关联蛋白)，β1，88kDa)、IL2(白细胞介素2)、CD36(CD36分子(凝血酶敏感蛋白受体))、PRKAB1(蛋白激酶，AMP活化的，β1非催化亚基)、TPO(甲状腺过氧化物酶)、ALDH7A1(醛脱氢酶7家族，成员A1)、CX3CR1(趋化因子(C-X3-C基序)受体1)、TH(酪氨酸羟化酶)、F9(凝血因子IX)、GH1(生长激素1)、TF(转铁蛋白)、HFE(血色素沉着病)、IL17A(白细胞介素17A)、PTEN(磷酸酯酶与张力蛋白同源物)、GSTM1(谷胱甘肽S-转移酶μ1)、DMD(肌营养不良蛋白)、GATA4(GATA结合蛋白4)、F13A1(凝血因子XIII，A1多肽)、TTR(转甲状腺素蛋白)、FABP4(脂肪酸结合蛋白4，脂肪细胞)、PON3(对氧磷酶3)、APOC1(载脂蛋白C-I)、INSR(胰岛素受体)、TNFRSF1B(肿瘤坏死因子受体超家族，成员1B)、HTR2A(5-羟色胺(血清素)受体2A)、CSF3(集落刺激因子3(粒细胞))、CYP2C9(细胞色素P450，家族2，亚家族C，多肽9)、TXN(硫氧还蛋白)、CYP11B2(细胞色素P450，家族11，亚家族B，多肽2)、PTH(甲状旁腺素、CSF2(集落刺激因子2(粒细胞-巨噬细胞))、KDR(激酶插入结构域受体受体(III型受体酪氨酸激酶))、PLA2G2A(磷脂酶A2，型IIA(血小板，滑液))、B2M(β-2-微球蛋白)、THBS1(凝血酶敏感蛋白1)、GCG(胰高血糖素)、RHOA(ras同源物基因家族，成员A)、ALDH2(醛脱氢酶2家族(线粒体的))、TCF7L2(转录因子7样2(T细胞特异性HMG盒))、BDKRB2(缓激肽受体B2)、NFE2L2(红细胞衍生核因子2样蛋白)、NOTCH1(Notch同源物1，易位相关的(果蝇))、UGT1A1(UDP葡糖醛酸基转移酶1家族，多肽A1)、IFNA1(干扰素，α1)、PPARD(过氧化物酶体增殖物活化受体δ)、SIRT1(长寿蛋白(沉默交配型信息调控2同源物)1(酿酒酵母))、GNRH1(促性腺素释放激素1(黄体生成素释放激素))、PAPPA(妊娠相关血浆蛋白A，冠毛素1)、ARR3(抑制蛋白3，视网膜的(X-抑制蛋白))、NPPC(利钠肽前体C)、AHSP(α血红蛋白稳定蛋白)、PTK2(PTK2蛋白酪氨酸激酶2)、IL13(白细胞介素13)、MTOR(雷帕霉素机械靶(丝氨酸/苏氨酸激酶))、ITGB2(整合素，β2(补体成分3受体3和4亚基))、GSTT1(谷胱甘肽S-转移酶θ1)、IL6ST(白细胞介素6信号传导因子(gp130，抑瘤素M受体))、CPB2(羧肽酶B2(血浆))、CYP1A2(细胞色素P450，家族1，亚家族A，多肽2)、HNF4A(肝细胞核因子4，α)、SLC6A4(溶质载体家族6(神经递质转运蛋白，血清素)，成员4)、PLA2G6(磷脂酶A2，型VI(细胞溶质的，钙依赖性))、TNFSF11(肿瘤坏死因子(配体)超家族，成员11)、SLC8A1(溶质载体家族8(钠/钙交换蛋白)，成员1)、F2RL1(凝血因子II(凝血酶)受体样1)、AKR1A1(醛酮还原酶家族1，成员A1(醛还原酶))、ALDH9A1(醛脱氢酶9家族，成员A1)、BGLAP(骨γ-羧谷氨酸(gla)蛋白)、MTTP(微粒体甘油三酯转移蛋白)、MTRR(5-甲基四氢叶酸-高半胱氨酸甲基转移酶还原酶)、SULT1A3(磺基转移酶家族，细胞溶质的，1A，酚优选，成员3)、RAGE(肾肿瘤抗原)、C4B(补体成分4B(奇都血型)、P2RY12(嘌呤能受体P2Y，G-蛋白偶联的，12)、RNLS(肾酶，FAD依赖性胺氧化酶)、CREB1(cAMP应答组件结合蛋白1)、POMC(阿黑皮素原)、RAC1(ras相关C3肉毒毒素底物1(rho家族，小GTP结合蛋白Rac1))、LMNA(核纤层蛋白NC)、CD59(CD59分子，补体调节蛋白)、SCN5A(钠通道，电压门控，V型，α亚基)、CYP1B1(细胞色素P450，家族1，亚家族B，多肽1)、MIF(巨噬细胞游走抑制因子(糖基化抑制因子))、MMP13(基质金属肽酶13(胶原酶3))、TIMP2(TIMP金属肽酶抑制剂2)、CYP19A1(细胞色素P450，家族19，亚家族A，多肽1)、CYP21A2(细胞色素P450，家族21，亚家族A，多肽2)、PTPN22(蛋白酪氨酸磷酸酶，非受体型22(淋巴样))、MYH14(肌球蛋白，重链14，非肌肉)、MBL2(甘露糖结合凝集素(蛋白C)2，可溶性(调理素缺陷))、SELPLG(选择素P配体)、AOC3(胺氧化酶，含铜3(血管粘附蛋白1))、CTSL1(组织蛋白酶L1)、PCNA(增殖细胞核抗原)、IGF2(胰岛素样生长因子2(生长素调节素A))、ITGB1(整合素，β1(纤连蛋白受体，β多肽，抗原CD29包括MDF2，MSK12))、CAST(钙蛋白酶抑制蛋白)、CXCL12(趋化因子(C-X-C基序)配体12(基质细胞衍生因子1))、IGHE(免疫球蛋白恒定区ε)、KCNE1(电压门控钾通道，Isk相关家族，成员1)、TFRC(转铁蛋白受体(p90，CD71))、COL1A1(胶原，I型，α1)、COL1A2(胶原，I型，α2)、IL2RB(白细胞介素2受体，β)、PLA2G10(磷脂酶A2，型X)、ANGPT2(血管生成素2)、PROCR(蛋白C受体，内皮的(EPCR))、NOX4(NADPH氧化酶4)、HAMP(海帕西啶抗微生物肽)、PTPN11(蛋白酪氨酸磷酸酶，非受体类型11)、SLC2A1(溶质载体家族2(易化葡萄糖转运蛋白)，成员1)、IL2RA(白细胞介素2受体，α)、CCL5(趋化因子(C-C基序)配体5)、IRF1(干扰素调节因子1)、CFLAR(CASP8和FADD样凋亡调节因子)、CALCA(降钙素相关多肽α)、EIF4E(真核翻译起始因子4E)、GSTP1(谷胱甘肽S-转移酶pi 1)、JAK2(Janus激酶2)、CYP3A5(细胞色素P450，家族3，亚家族A，多肽5)、HSPG2(类肝素硫酸蛋白聚糖2)、CCL3(趋化因子(C-C基序)配体3)、MYD88(髓性分化原发反应基因(88))、VIP(血管活性肠肽)、SOAT1(甾醇O-酰基转移酶1)、ADRBK1(肾上腺素能，β，受体激酶1)、NR4A2(细胞核受体亚家族4，型A，成员2)、MMP8(基质金属肽酶8(中性白细胞胶原酶))、NPR2(钠尿肽受体B/鸟苷酸环化酶B(心房钠尿肽受体B))、GCH1(GTP环化水解酶1)、EPRS(谷氨酰-脯氨酰-tRNA合成酶)、PPARGC1A(过氧化物酶体增殖物活化受体γ，共激活剂1α)、F12(凝血因子XII(哈格曼因子))、PECAM1(血小板/内皮细胞粘附分子)、CCL4(趋化因子(C-C基序)配体4)、SERPINA3(丝氨酸蛋白酶抑制蛋白肽酶抑制剂，进化枝A(α-1抗蛋白酶，抗胰蛋白酶)，成员3)、CASR(钙传感受体)、GJA5(间隙连接蛋白，α5，40kDa)、FABP2(脂肪酸结合蛋白2，肠)、TTF2(转录终止因子，RNA聚合酶II)、PROS1(蛋白S(α))、CTF1(心脏营养素1)、SGCB(肌聚糖，β(43kDa肌营养不良蛋白相关糖蛋白))、YME1L1(YME1样1(酿酒酵母))、CAMP(卡色力西丁抗微生物肽)、ZC3H12A(含锌指CCCH型12A)、AKR1B1(醛酮还原酶家族1，成员B1(醛糖还原酶))、DES(结蛋白)、MMP7(基质金属肽酶7(基质溶解因子，子宫的))、AHR(芳香烃受体)、CSF1(集落刺激因子1(巨噬细胞))、HDAC9(组蛋白去乙酰化酶9)、CTGF(结缔组织生长因子)、KCNMA1(大电导钙激活钾通道，亚家族M，α成员1)、UGT1A(UDP葡糖醛酸基转移酶1家族，多肽A复合体座位)、PRKCA(蛋白激酶C，α)、COMT(儿茶酚-β-甲基转移酶)、S100B(S100钙结合蛋白B)、EGR1(早期生长反应蛋白1)、PRL(催乳素)、IL15(白细胞介素15)、DRD4(多巴胺受体D4)、CAMK2G(钙-钙调蛋白依赖性蛋白激酶IIγ)、SLC22A2(溶质载体家族22(有机阳离子转运蛋白)，成员2)、CCL11(趋化因子(C-C基序)配体11)、PGF(B321胎盘生长因子)、THPO(血小板生成素)、GP6(糖蛋白VI(血小板))、TACR1(速激肽受体1)、NTS(神经降压肽)、HNF1A(HNF1同源框A)、SST(生长抑素)、KCND1(电压门控钾通道，Shal相关亚家族，成员1)、LOC646627(磷脂酶抑制剂)、TBXAS1(血栓烷A合酶1(血小板))、CYP2J2(细胞色素P450，家族2，亚家族J，多肽2)、TBXA2R(血栓烷A2受体)、ADH1C(醇脱氢酶1C(I类)，γ多肽)、ALOX12(花生四烯酸盐12-脂氧合酶)、AHSG(α-2-HS-糖蛋白)、BHMT(甜菜碱同型半胱氨酸甲基转移酶)、GJA4(间隙连接蛋白，α4,37kDa)、SLC25A4(溶质载体家族25(线粒体载体；腺嘌呤核苷酸转运蛋白)，成员4)、ACLY(ATP柠檬酸裂合酶)、ALOX5AP(花生四烯酸盐5-脂氧合酶-活化蛋白)、NUMA1(核有丝分裂器蛋白1)、CYP27B1(细胞色素P450，家族27，亚家族B，多肽1)、CYSLTR2(半胱氨酰白三烯受体2)、SOD3(超氧化物歧化酶3，细胞外的)、LTC4S(白三烯C4合酶)、UCN(尿皮质素)、GHRL(胃促生长素/肥胖抑制素前体肽)、APOC2(载脂蛋白C-II)、CLEC4A(C型凝集素结构域家族4，成员A)、KBTBD10(Kelch重复和BTB(POZ)域包含蛋白)、TNC(腱生蛋白C)、TYMS(胸苷酸合成酶)、SHCl(SHC(含Src同源物2域)转化蛋白1)、LRP1(低密度脂蛋白受体相关蛋白1)、SOCS3(细胞因子信号传导抑制因子3)、ADH1B(醇脱氢酶1B(I类)，β多肽)、KLK3(激肽释放酶相关肽酶3)、HSD11B1(羟基固醇(11-β)脱氢酶1)、VKORC1(生素K环氧化物还原酶复合体，亚基1)、SERPINB2(丝氨酸蛋白酶抑制蛋白肽酶抑制剂，进化枝B(卵清蛋白)，成员2)、TNS1(张力蛋白1)、RNF19A(环指蛋白9A)、EPOR(促红细胞生成素受体)、ITGAM(整合素，αM(补体成分3受体3亚基))、PITX2(配对样同源域2)、MAPK7(丝裂原活化蛋白激酶7)、FCGR3A(IgG的Fc片段，低亲和力111a，受体(CD16a))、LEPR(瘦素受体)、ENG(内皮糖蛋白)、GPX1(谷胱甘肽过氧化酶1)、GOT2(谷草转氨酶2，线粒体(天冬氨酸氨基转移酶2))、HRH1(组胺受体H1)、NR112(细胞核受体亚家族1，型I，成员2)、CRH(促肾上腺皮质素释放激素)、HTR1A(5-羟色胺(血清素)受体1A)、VDAC1(电压依赖性阴离子通道1)、HPSE(类肝素酶)、SFTPD(表面活性蛋白D)、TAP2(转运蛋白2，ATP结合盒，亚家族B(MDR/TAP))、RNF123(环指蛋白123)、PTK2B(PTK2B蛋白酪氨酸激酶2β)、NTRK2(神经营养酪氨酸激酶，受体，2型)、IL6R(白细胞介素6受体)、ACHE(乙酰胆碱酯酶(Yt血型))、GLP1R(胰高血糖素样肽1受体)、GHR(生长激素受体)、GSR(谷胱甘肽还原酶)、NQO1(NAD(P)H脱氢酶，醌1)、NR5A1(细胞核受体亚家族5，型A，成员1)、GJB2(间隙连接蛋白，β2，26kDa)、SLC9A1(溶质载体家族9(钠/氢交换体)、成员1)、MAOA(单胺氧化酶A)、PCSK9(前蛋白转化酶枯草杆菌蛋白酶/kexin 9型)、FCGR2A(IgG的Fc片段，低亲和力IIa，受体(CD32))、SERPINF1(丝氨酸蛋白酶抑制蛋白肽酶抑制剂，进化枝F(α-2抗纤维蛋白溶酶，色素上皮衍生因子)，成员1)、EDN3(内皮素3)、DHFR(二氢叶酸还原酶)、GAS6(生长停滞特异蛋白6)、SMPD1(鞘磷脂磷酸二酯酶1，酸溶酶体)、UCP2(解偶联蛋白2(线粒体的，质子载体))、TFAP2A(转录因子AP-2α(激活增强子结合蛋白2α))、C4BPA(补体成分4结合蛋白，α)、SERPINF2(丝氨酸蛋白酶抑制蛋白肽酶抑制剂，进化枝F(α-2抗纤维蛋白溶酶，色素上皮衍生因子)，成员2)、TYMP(胸苛酸磷酸化酶)、ALPP(碱性磷酸酶，胎盘的(Regan同工酶))、CXCR2(趋化因子(C-X-C基序)受体2)、SLC39A3(溶质载体家族39(锌转运蛋白)、成员3)、ABCG2(ATP结合盒，亚家族G(WHITE)、成员2)、ADA(腺苷脱氨酶)、JAK3(Janus激酶3)、HSPA1A(热休克70kDa蛋白1A)、FASN(脂肪酸合酶)、FGF1(成纤维细胞生长因子1(酸性))、F11(凝血因子XI)、ATP7A(ATP酶，Cu++转运的，α多肽)、CR1(补体成分(3b/4b)受体1(Knops血型))、GFAP(胶质细胞原纤维酸性蛋白)、ROCK1(Rho相关，含卷曲螺旋蛋白激酶1)、MECP2(甲基CpG结合蛋白2(雷特综合征))、MYLK(肌球蛋白轻链激酶)、BCHE(丁酰胆碱酯酶)、LIPE(脂肪酶，激素敏感的)、PRDX5(过氧化物氧化还原酶5)、ADORA1(腺苷A1受体)、WRN(维尔纳综合征，RecQ解旋酶样)、CXCR3(趋化因子(C-X-C基序)受体3)、CD81(CD81分子)、SMAD7(SMAD家族成员7)、LAMC2(层粘连蛋白，γ2)、MAP3K5(丝裂原活化蛋白激酶激酶激酶5)、CHGA(嗜铬粒蛋白A(甲状旁腺分泌蛋白1))、IAPP(胰岛淀粉样蛋白多肽)、RHO(视紫红质)、ENPP1(外核苷酸焦磷酸酶/磷酸二酯酶1)、PTHLH(甲状旁腺激素样激素)、NRG1(神经调节蛋白1)、VEGFC(血管内皮生长因子C)、ENPEP(谷氨酰基氨肽酶(氨基肽酶A))、CEBPB(CCAAT/增强子结合蛋白(C/EBP)，β)、NAGLU(N-乙酰氨基葡糖苷酶，α-)、F2RL3(凝血因子II(凝血酶)受体样3)、CX3CL1(趋化因子(C-X3-C基序)配体1)、BDKRB1(缓激肽受体B1)、ADAMTS13(具有凝血酶敏感蛋白1型基序的ADAM金属肽酶，13)、ELANE(弹性蛋白酶，嗜中性粒细胞表达的)、ENPP2(外核苷酸焦磷酸酶/磷酸二酯酶2)、CISH(细胞因子诱导的含SH2的蛋白)、GAST(胃泌素)、MYOC(肌纤蛋白，小梁网可诱导糖皮质激素应答)、ATP1A2(ATP酶，Na+/K+转运的，α2多肽)、NF1(神经纤维瘤蛋白1)、GJB1(间隙连接蛋白，β1，32kDa)、MEF2A(肌细胞增强因子2A)、VCL(纽蛋白)、BMPR2(骨形态发生蛋白受体，II型(丝氨酸/苏氨酸激酶))、TUBB(微管蛋白，β)、CDC42(细胞分裂周期42(GTP结合蛋白，25kDa))、KRT18(角蛋白18)、HSF1(热休克转录因子1)、MYB(v-myb成髓细胞瘤病毒癌基因同源物(鸟类))、PRKAA2(蛋白激酶，AMP活化的，α2催化亚基)、ROCK2(Rho关联含卷曲螺旋蛋白激酶2)、TFPI(组织因子途径抑制物(脂蛋白相关凝血抑制剂))、PRKG1(蛋白激酶，cGMP依赖性，I型)、BMP2(骨形态发生蛋白2)、CTNND1(连环蛋白(钙粘着蛋白关联蛋白)，δ1)、CTH(胱硫醚酶(胱硫醚γ-裂解酶))、CTSS(组织蛋白酶S)、VAV2(vav 2鸟苷酸交换因子)、NPY2R(神经肽Y受体Y2)、IGFBP2(胰岛素样生长因子结合蛋白2，36kDa)、CD28(CD28分子)、GSTA1(谷胱甘肽S-转移酶α1)、PPIA(肽基脯氨酰异构酶A(亲环素A))、APOH(载脂蛋白H(β-2-糖蛋白I))、S100A8(S100钙结合蛋白A8)、IL11(白细胞介素11)、ALOX15(花生四烯酸盐15-脂氧合酶)、FBLN1(腓骨蛋白1)、NR1H3(细胞核受体亚家族1，型H，成员3)、SCD(硬脂酰基-辅酶A去饱和酶(Δ-9-去饱和酶))、GIP(抑胃多肽)、CHGB(嗜铬粒蛋白B(分泌粒蛋白1))、PRKCB(蛋白激酶C，β)、SRD5A1(类固醇-5-α还原酶α多肽1(3-氧代-5α-类固醇δ4-脱氢酶α1))、HSD11B2(羟基固醇(11-β)脱氢酶2)、CALCRL(降钙素受体样)、GALNT(UDP-N-乙酰基-α-D-半乳糖胺：多肽N-乙酰半乳糖胺基转移酶2(GalNAc-T2))、ANGPTL4(血管生成素样4)、KCNN4(钾中间/小电导钙激活通道，亚家族N，成员4)、PIK3C2A(磷酸肌醇-3-激酶，2类，α多肽)、HBEGF(肝素结合EGF样生长因子)、CYP7A1(细胞色素P450，家族7，亚家族A，多肽1)、HLA-DRB5(主要组织兼容性复合物，II类，DRβ5)、BNIP3(BCL2/腺病毒E1B 19kDa相互作用蛋白3)、GCKR(葡糖激酶(己糖激酶4)调节蛋白)、S100A12(S100钙结合蛋白A12)、PADI4(肽基精氨酸脱亚氨酶，IV型)、HSPA14(热休克70kDa蛋白14)、CXCR1(趋化因子(C-X-C基序)受体1)、H19(H19，母系印记表达转录物(非蛋白质编码))、KRTAP19-3(角蛋白关联蛋白19-3)、IDDM2(胰岛素依赖型糖尿病2)、RAC2(ras相关C3肉毒毒素底物2(rho家族，小GTP结合蛋白Rac2))、RYR1(兰尼碱受体1(骨骼))、CLOCK(clock同源物(小鼠))、NGFR(神经生长因子受体(TNFR超家族，成员16))、DBH(多巴胺β-羟化酶(多巴胺β-单加氧酶))、CHRNA4(胆碱能受体，烟碱的，α4)、CACNA1C(钙通道，电压依赖性，L型，α1C亚基)、PRKAG2(蛋白激酶，AMP激活的，γ2非催化亚基)、CHAT(胆碱乙酰转移酶)、PTGDS(前列腺素D2合酶21kDa(脑))、NR1H2(细胞核受体亚家族1，型H，成员2)、TEK(TEK酪氨酸激酶，内皮的)、VEGFB(血管内皮生长因子B)、MEF2C(肌细胞增强因子2C)、MAPKAPK2(丝裂原活化的蛋白激酶活化的蛋白激酶2)、TNFRSF11A(肿瘤坏死因子受体超家族，成员11a，NFKB激活剂)、HSPA9(热休克70kDa蛋白9(致死蛋白))、CYSLTR1(半胱胺酰白三烯受体1)、MAT1A(甲硫氨酸腺苷转移酶I，α)、OPRL1(阿片受体样1)、IMPA1(肌醇(肌肉)-1(或4)-单磷酸酶1)、CLCN2(氯通道2)、DLD(二氢硫辛酰胺脱氢酶)、PSMA6(蛋白酶体(前体，巨蛋白因子)亚基，α型，6)、PSMB8(蛋白酶体(前体，巨蛋白因子)亚基，β型，8(大型多功能肽酶7))、CHI3L1(壳多糖酶3样1(软骨糖蛋白-39))、ALDH1B1(醛脱氢酶1家族，成员B1)、PARP2(聚(ADP-核糖)聚合酶2)、STAR(类固醇生成性急性期调节蛋白)、LBP(脂多糖结合蛋白)、ABCC6(ATP结合盒，亚家族C(CFTR/MRP)，成员6)、RGS2(G蛋白信号传导调节因子2，24kDa)、EFNB2(肝配蛋白-B2)、GJB6(间隙连接蛋白，β6，30kDa)、APOA2(载脂蛋白A-II)、AMPD1(腺苷单磷酸脱氨酶1)、DYSF(迪斯弗林(dysferlin)，肢带型肌营养不良2B(常染色体隐性))、FDFT1(法呢酰二磷酸酯法呢酰基转移酶1)、EDN2(内皮素2)、CCR6(趋化因子(C-C基序)受体6)、GJB3(间隙连接蛋白，β3，31kDa)、IL1RL1(白细胞介素1受体样1)、ENTPD1(外核苷三磷酸二磷酸水解酶1)、BBS4(巴-比二氏综合征(Bardet-Biedl syndrome)4)、CELSR2(钙粘着蛋白，EGF LAG七经G型受体2(火烈鸟同源物，果蝇))、F11R(F11受体)、RAPGEF3(Rap鸟苷酸交换因子(GEF)3)、HYAL1(透明质酸葡糖胺酶1)、ZNF259(锌指蛋白259)、ATOX1(ATX1抗氧化剂蛋白1同源物(酵母))、ATF6(活化转录因子6)、KHK(已酮糖激酶(果糖激酶))、SAT1(亚精胺/精胺N1-乙酰转移酶1)、GGH(γ-谷氨酰水解酶(结合酶，叶酰聚γ谷氨酰水解酶))、TIMP4(TIMP金属肽酶抑制剂4)、SLC4A4(溶质载体家族4，碳酸氢钠协同转运蛋白，成员4)、PDE2A(磷酸二酯酶2A，cGMP刺激的)、PDE3B(磷酸二酯酶3B，cGMP抑制的)、FADS1(脂肪酸去饱和酶1)、FADS2(脂肪酸去饱和酶2)、TMSB4X(胸腺素β4，X连锁的)、TXNIP(硫氧还蛋白相互作用蛋白)、LIMS1(LIM和衰老细胞抗原样域1)、RHOB(ras同源物基因家族，成员B)、LY96(淋巴细胞抗原96)、FOXO1(叉头框O1)、PNPLA2(含Patatin样磷脂酶域2)、TRH(促甲状腺激素释放激素)、GJC1(间隙连接蛋白，γ1，45kDa)、SLC17A5(溶质载体家族17(阴离子/糖转运蛋白)，成员5)、FTO(脂肪量和肥胖相关)、GJD2(间隙连接蛋白，δ2，36kDa)、PSRC1(富含脯氨酸/丝氨酸卷曲螺旋蛋白1)、CASP12(半胱天冬酶12(基因/假基因))、GPBAR1(G蛋白耦联胆汁酸受体1)、PXK(含PX域丝氨酸/苏氨酸激酶)、IL33(白细胞介素33)、TRIB1(tribbles同源物1(果蝇))、PBX4(前B细胞白血病同源框4)、NUPR1(核蛋白，转录调节子，1)、15-Sep(15kDa硒蛋白)、CILP2(软骨中间层蛋白2)、TERC(端粒酶RNA组分)、GGT2(γ-谷氨酰转肽酶2)、MT-CO1(线粒体编码细胞色素c氧化酶I)、以及UOX(尿酸氧化酶，假基因)。这些序列中的任何序列可以是对于该CRISPR-Cas系统的靶标，例如以解决突变。

在另一个实施例中，该染色体序列可以进一步选自Pon1(对氧磷酶1)、LDLR(LDL受体)、ApoE(载脂蛋白E)、Apo B-100(载脂蛋白B-100)、ApoA(载脂蛋白(a))、ApoA1(载脂蛋白A1)、CBS(胱硫醚(Cystathione)B-合酶)、糖蛋白IIb/IIb、MTHRF(5,10-亚甲基四氢叶酸还原酶(NADPH)、及其组合。在一次迭代中，这些染色体序列和由涉及心血管疾病的染色体序列编码的蛋白质可以选自Cacna1C、Sod1、Pten、Ppar(α)、Apo E、瘦素、及其组合，作为对于该CRISPR-Cas系统的靶标。

治疗肝脏和肾脏的疾病

本发明还考虑了向肝脏和/或肾脏递送本文描述的CRISPR-Cas系统，例如Cas9效应蛋白系统。诱导治疗性核酸的细胞摄取的递送策略包括物理力或载体系统，如基于病毒、脂质或复合体的递送、或纳米载体。根据具有较低可能的临床相关性的最初应用，当以全身性流体动力高压注射将核酸寻址(addressed)于肾细胞时，许多种基因治疗性病毒和非病毒载体已经被应用于体内靶向不同的动物肾脏疾病模型中的转录后事件(Csaba Révész和Péter Hamar(2011)。“靶向肾脏中的RNA的递送方法”(Delivery Methods to Target RNAsin the Kidney)，《基因治疗应用》(Gene Therapy Applications)，康春生教授(Prof.Chunsheng Kang)(编辑)，ISBN:978-953-307-541-9，印天科技(InTech)，可获自：http://www.intechopen.com/books/gene-therapy-applications/delivery-methods-to-target-rnas-in-the-kidney)。递送至肾脏的方法可以包括以下文献中描述的那些，袁(Yuan)等人(《美国生理学-肾脏生理学杂志》(Am J Physiol Renal Physiol)295:F605-F617，2008)研究了在注射链脲佐菌素的1型糖尿病小鼠模型中体内递送靶向花生四烯酸代谢的12/15-脂氧合酶(12/15-LO)途径的小干扰RNA(siRNA)是否能够改善肾损伤和糖尿病肾病(DN)。为了实现更好的体内通路以及在肾脏中的siRNA表达，袁(Yuan)等人使用与胆固醇结合的双链12/15-LO siRNA寡核苷酸。将约400μg的siRNA皮下注射到小鼠中。袁(Yuang)等人的方法可应用于本发明的CRISPR Cas系统，其中考虑将1-2g的与胆固醇结合的CRISPRCas皮下注射至人，以便递送到肾脏。

莫利托里斯(Molitoris)等人(《美国肾脏病学会杂志》(J Am Soc Nephrol)20:1754-1764，2009年)采用了近端小管细胞(PTC)作为在肾脏内的寡核苷酸再吸收部位，以便检验靶向p53(凋亡途径中的一种关键蛋白质)的siRNA的效力，从而预防肾损伤。在缺血性损伤之后4小时静脉内注射针对p53的裸露的合成siRNA最大限度地保护了PTC和肾功能。莫利托里斯(Molitoris)等人的数据表明，在静脉内给药之后siRNA被快速递送到近端小管细胞。为了剂量反应分析，用在相同的四个时间点给予的0.33、1、3、或5mg/kg剂量的siP53注射大鼠，分别产生1.32、4、12、和20mg/kg的累积剂量。与PBS处理的缺血对照大鼠相比较，所有检验的siRNA剂量在第一天产生了SCr降低作用，其中更高的剂量在经过大约五天中更有效。12和20mg/kg的累积剂量提供了最好的保护作用。莫利托里斯(Molitoris)等人的方法可应用于本发明的核酸靶向系统，其中对于人类考虑递送到肾脏的12和20mg/kg累积剂量。

汤普森(Thompson)等人(《核酸治疗学》(Nucleic Acid Therapeutics)，第22卷，第4期，2012年)报道了合成的小干扰RNA I5NP在啮齿类和非人类灵长动物中静脉内给药之后的毒理学和药代动力学特性。I5NP被设计为经由RNA干扰(RNAi)途径起作用以便暂时抑制促凋亡蛋白p53的表达并且被开发为保护细胞免于诸如急性肾损伤之类的急性缺血/再灌注损伤，急性缺血/再灌注损伤可能在重大心脏手术以及在肾移植后可能出现的移植功能延迟中发生。在啮齿类中的800mg/kg I5NP以及在非人类灵长动物中的1,000mg/kg I5NP的剂量对于引出不良作用是需要的，在猴中被分离为导向对血液的作用，包括补体的亚临床激活和凝血时间的轻度增加。在大鼠中，用I5NP的大鼠类似物未观察到另外的不良作用，表明这些作用很可能代表合成RNA双链体的类作用，而不是与I5NP的预期药理学活性有关的毒性。总之，这些数据支持用于在急性缺血/再灌注损伤之后保留肾功能的I5NP的静脉内给药的临床测试。在猴子中的无明显损害作用水平(NOAEL)是500mg/kg。在猴中，在以高达25mg/kg的剂量水平静脉内给药之后未观察到对心血管、呼吸、以及神经系统参数的影响。因此，对于向人的肾脏静脉内给予CRISPR Cas可以考虑相似的剂量。

清水(Shimizu)等人(《美国肾脏病学会杂志》(J Am Soc Nephrol)21:622-633,2010)开发了一种经由基于聚(乙二醇)-聚(L-赖氨酸)的载体将siRNA靶向递送到肾小球的系统。该siRNA/纳米载体复合物在直径上大约为10到20nm，该大小将允许它移动跨过有窗孔的内皮细胞而接近肾小球膜。在腹膜内注射荧光标记的siRNA/纳米载体复合物之后，清水(Shimizu)等人在血液循环中检测到siRNA，持续一段延长的时间。在肾小球肾炎的小鼠模型中，丝裂原活化蛋白激酶1(MAPK1)siRNA/纳米载体复合物的重复腹膜内给药抑制了肾小球MAPK1mRNA和蛋白质的表达。为了研究siRNA累积，向BALBc小鼠给予与PIC纳米载体复合的Cy5标记的siRNA(0.5ml，5nmol的siRNA含量)、裸露的Cy5标记的siRNA(0.5ml，5nmol)、或封装在HVJ-E中的Cy5标记的siRNA(0.5ml，5nmol的siRNA含量)。清水(Shimizu)等人的方法可应用于本发明的核酸靶向系统，其中考虑将约10-20μmol的与纳米载体复合的CRISPRCas以约1-2升腹膜内注射至人并且递送到肾脏。

治疗上皮和肺疾病

本发明还考虑了向一个或两个肺递送本文描述的CRISPR-Cas系统例如Cas9系统。

虽然基于AAV-2的载体最初被提议用于向CF气道的CFTR递送，但其他血清型如AAV-1、AAV-5、AAV-6、和AAV-9在肺上皮细胞的多种模型中也展示出提高的基因转移效率(参见，例如，李(Li)等人，《分子治疗》(Molecular Therapy)，第17卷，第12期，2067-2077，2009年12月)。在体外转导人气道上皮细胞上，AAV-1被证明比AAV-2和AAV-5更有效约100倍，虽然AAV-1体内转导的鼠类气管气道上皮具有与AAV-5相等的效率。其他研究已经表明，在针对体外人气道上皮(HAE)的基因递送上，AAV-5比AAV-2更有效50倍，并且在体内小鼠肺气道上皮中显着更有效。还已经表明，在体外人气道上皮细胞中以及在体内鼠类气道中，AAV-6比AAV-2更有效。8更为近期的分离物，AAV-9，显示出在体内鼠类鼻和肺泡上皮中展示了比AAV-5更好的基因转移效率，其中检测出基因表达持续超过9个月，表明AAV可使得体内长期基因表达成为可能，这是对于CFTR基因递送载体而言的理想特性。此外，证明了AAV-9可以被再次给予至鼠类的肺部，而不丧失CFTR表达并且具有最低限度的免疫后果。可以在CF和非CF HAE培养物的顶面用100μl的AAV载体接种，维持数小时(参见，例如，李(Li)等人，《分子治疗》(Molecular Therapy)，第17卷，第12期，2067-2077，2009年12月)。MOI可以从1×10³到4×10⁵个载体基因组/细胞而变化，这取决于病毒浓度和这些实验的目的。以上引用的载体被考虑用于本发明的递送和/或给药。

萨莫拉(Zamora)等人(《美国呼吸道与危重护理学杂志》(Am J Respir Crit CareMed)第183卷，第531-538页，2011年)报道了针对人类感染性疾病治疗的RNA干扰治疗法的应用以及抗病毒药物在呼吸道合胞病毒(RSV)感染的肺移植受体中的随机试验。萨莫拉(Zamora)等人进行了一项在具有RSV呼吸道感染的LTX受体中的随机化、双盲、安慰剂对照的试验。容许患者接受针对RSV的护理标准。每天给予雾化的ALN-RSV01(0.6mg/kg)或安慰剂，持续3天。这项研究证明，可以安全地向具有RSV感染的LTX受体给予靶向RSV的RNAi治疗剂。ALN-RSV01的三个每日剂量并不导致任何呼吸道症状的恶化或肺功能的损害，并且未展示任何出全身性致炎作用，如细胞因子或CRP的诱导。在吸入之后，药代动力学仅仅显示出低的短暂的全身性暴露，与临床前动物数据一致，表明静脉内或通过吸入给予的ALN-RSV01通过外切核酸酶介导的消化和肾脏排泄而从循环中迅速清除。萨莫拉(Zamora)等人的方法可以应用于本发明的核酸靶向系统，并且雾化的CRISPR Cas，例如以0.6mg/kg的剂量，可以被考虑用于本发明。

施万克(Schwank)等人(《细胞—干细胞》(Cell Stem Cell)，13:653-58，2013)使用了CRISPR-Cas9来校正在人类干细胞中的与囊性纤维化相关联的缺陷。该研究组的目标是离子通道囊性纤维化跨膜传导受体(CFTR)的基因。在CFTR中的缺失引起该蛋白质在囊性纤维化患者中的错误折叠。使用从患有囊性纤维化的两个儿童的细胞样品中发育而来的培养的肠干细胞，施万克(Schwank)等人能够利用CRISPR连同含有有待插入的修补序列的供体质粒来校正该缺陷。然后这些研究者使这些细胞生长成肠“类器官”或微型肠，并且显示它们正常地起作用。在这种情况下，约一半的克隆类器官经历正确的基因修正。

治疗肌肉系统的疾病

本发明还考虑了向一种或多种肌肉递送本文描述的CRISPR-Cas系统例如Cas9系统。

Bortolanza等人(《分子治疗》(Molecular Therapy)第19卷，第11期，2055-2064，2011年11月)表明，在面肩肱型肌营养不良(FSHD)发作之后的FRG1小鼠中，干扰RNA表达盒的全身性递送导致剂量依赖性长期FRG1敲低，而没有毒性征象。Bortolanza等人发现，单次静脉内注射5×10¹²vg的rAAV6-sh1FRG1挽救了FRG1小鼠的肌肉组织病理学和肌肉功能。详细而言，使用一个25号的泰尔茂(Terumo)注射器将200μl的含有2×10¹²或5×10¹²vg的在生理溶液中的载体注射到尾静脉中。Bortolanza等人的方法可以应用于表达CRISPR Cas的AAV，并且将其以约2×10¹⁵或2×10¹⁶vg载体的剂量注射到人体内。

Dumonceaux等人(《分子治疗》(Molecular Therapy)第18卷，第5期，881-887，2010年5月)使用针对肌肉生长抑制素受体AcvRIIb mRNA(sh-AcvRIIb)的RNA干扰技术抑制了肌肉生长抑制素途径。由矢量化(vectorized)U7外显子跳跃技术(U7-DYS)介导准肌营养不良蛋白(quasi-dystrophin)的恢复。将携带单独的sh-AcvrIIb构建体、单独的U7-DYS构建体、或这两种构建体的组合的腺相关载体注射到营养不良mdx小鼠的胫骨前肌(TA)肌肉中。以10¹¹个AAV病毒基因组进行注射。Dumonceaux等人的方法可以应用于表达CRISPR Cas的AAV，并且将其以例如约10¹⁴到10¹⁵vg载体的剂量注射到人体内。

木内(Kinouchi)等人(《基因治疗》(Gene Therapy)(2008)15，1126-1130)报道了通过未经化学修饰的siRNA与缺端胶原(ATCOL)的纳米粒子形成的到正常或患病小鼠骨骼肌的体内siRNA递送的有效性。靶向肌肉生长抑制素(一种骨骼肌生长的负调节剂)的siRNA的ATCOL介导的在小鼠骨骼肌中的局部应用或者经由静脉内在应用之后几周之内引起肌肉质量的显着增加。这些结果暗示siRNA的ATCOL介导的应用是一种强大的用于包括肌肉萎缩在内的疾病的未来治疗用途的工具。根据制造商的说明，将MstsiRNA(终浓度，10mM)与ATCOL(对于局部给药的终浓度，0.5％)(AteloGene，高研株式会社(Kohken)，东京，日本)混合。在通过戊巴比妥钠(25mg/kg，腹膜内注射)麻醉小鼠(20周大，雄性C57BL/6)之后，将Mst-siRNA/ATCOL复合物注射到咬肌和股二头肌中。木内(Kinouchi)等人的方法可以应用于CRISPR Cas，并且例如将其以40μM溶液的约500到1000ml的剂量注射到人体内。哈格斯特龙(Hagstrom)等人(《分子治疗》(Molecular Therapy)第10卷，第2期，2004年8月)描述了一种使得能够将核酸有效且可重复地递送到遍及哺乳动物四肢肌肉的肌细胞(肌纤维)的血管内、非病毒方法。该程序涉及注射裸质粒DNA或siRNA到暂时由止血带或血压袖带分离的肢体的远端静脉中。通过以足够的体积将其迅速注射，促进了向肌纤维的核酸递送，使得该核酸溶液能够溢出到肌肉组织中。在小动物和大动物中都以最低毒性实现了在骨骼肌中的高水平转基因表达。还获得了向四肢肌肉递送siRNA的证据。为了将质粒DNA静脉注射到恒河猴中，将三通旋塞连接到各自加载有单个注射器的两个注射器泵(型号PHD 2000；哈佛仪器公司(Harvard Instruments))上。在罂粟碱注射五分钟之后，以1.7或2.0ml/s的速率注射pDNA(15.5到25.7mg，在40-100ml盐水中)。对于本发明的表达CRISPR Cas的质粒DNA，这可以按比例增加，对于人类，注射在800到2000ml盐水中的约300到500mg。对于到大鼠中的腺病毒载体注射，注射在3ml的生理盐水溶液中的(NSS)2x10⁹个感染粒子。对于本发明的表达CRISPR Cas的腺病毒载体，这可以按比例增加，对于人类，注射在10升NSS中的约1x 10¹³个感染粒子。对于siRNA，以12.5μg的siRNA注射到大鼠的大隐静脉中，并且以750μg的siRNA注射到灵长动物的大隐静脉中。对于本发明的CRISPR Cas，这可以按比例增加，例如，向人的大隐静脉注射约15到约50mg。

还参见，例如，WO 2013163628 A2，《突变基因的基因校正》(Genetic Correctionof Mutated Genes)，杜克大学的公开申请，描述了例如校正一种框移突变的努力，该框移突变引起提前终止密码子和可经由核酸酶介导的非同源末端连接进行校正的截短基因产物，该基因产物如引起迪谢内肌营养不良(“DMD”)的那些，迪谢内肌营养不良是一种隐性遗传的、致命的、X连锁疾病，其导致由于肌营养不良蛋白基因突变所致的肌肉变性。引起DMD的大多数肌营养不良蛋白突变是破坏该阅读框并且引起肌营养不良蛋白基因的提前翻译终止的外显子缺失。肌营养不良蛋白是一种细胞质蛋白，其提供负责调节肌细胞完整性和功能的细胞膜肌营养不良蛋白聚糖复合物的结构稳定性。如在此可互换地使用的肌营养不良蛋白基因或“DMD基因”是在座位Xp21处的2.2兆碱基。初级转录测量了约2,400kb，其中成熟mRNA为约14kb。79个外显子编码超过3500个氨基酸的蛋白质。在DMD患者中，外显子51常常接近破坏框的缺失并且已经在临床试验中被靶向基于寡核苷酸的外显子跳跃。对于外显子51跳跃化合物依替利森(eteplirsen)的临床试验最近报道了跨48周的显着功能益处，相比于基线具有47％的肌营养不良蛋白阳性纤维。外显子51的突变理想地适合于经由基于NHEJ的基因组编辑的持久校正。

涉及从人类肌营养不良蛋白基因(DMD)切割靶序列的大范围核酸酶变体的转让给Cellectis公司的美国专利公开号20130145487的方法也可以针对本发明的核酸靶向系统进行修改。

治疗皮肤疾病

本发明还考虑了向皮肤递送本文描述的CRISPR-Cas系统，例如Cas9效应蛋白系统。

希克森(Hickerson)等人(《分子治疗—核酸》(Molecular Therapy—NucleicAcids)(2013)2，e129)涉及一种用于向人类和鼠类皮肤递送自我递送(sd)-siRNA的机动化的微针阵列皮肤递送装置。将基于siRNA的皮肤治疗剂转化到临床的主要挑战是有效递送系统的开发。在多种皮肤递送技术中已经投入了实质性的努力，但是成功有限。在其中用siRNA治疗皮肤的临床研究中，与皮下针注射相关的剧烈疼痛预先排除了试验中额外患者的纳入，这凸显了对于改进的、更为“患者友好的”(即，很少或没有疼痛)递送方法的需要。微针代表行包括siRNA在内的大的带电负荷物跨越一级屏障、角质层进行递送的有效途径，并且通常被认为比常规皮下针疼痛更少。机动化的“冲压型”微针装置，包括由希克森(Hickerson)等人使用的机动化的微针阵列(MMNA)装置，已经显示在无毛小鼠研究中是安全的并且引起很少的或没有疼痛，其证据为：(i)在美容业中广泛使用以及(ii)其中几乎所有志愿者发现使用该装置比流感疫苗针剂(flushot)疼痛少得多的有限测试，表明使用这种装置的siRNA递送将产生比使用皮下针注射的先前临床试验中所体验的少得多的疼痛。该MMNA装置(作为Triple-M或Tri-M由韩国首尔的Bomtech电子有限公司在市场上销售)适用于将siRNA递送到小鼠和人类皮肤。将sd-siRNA溶液(高达300μl的0.1mg/ml RNA)引入被设定为0.1mm深度的一次性Tri-M针盒(Bomtech)的腔室中。为了处理皮肤，在处理之前将未鉴定的皮肤(在外科手术之后立即获得)手动拉伸并且钉在软木平台上。使用具有28号0.5英寸针头的胰岛素注射器进行所有皮内注射。该MMNA装置和希克森(Hickerson)等人的方法可以用于和/或适用于，例如，以高达300μl的0.1mg/ml CRISPR Cas的剂量向皮肤递送本发明的CRISPR Cas。

里奇曼(Leachman)等人(《分子治疗》(Molecular Therapy)，第18卷，第2期，442-446，2010年2月)涉及利用基于针对皮肤的第一短干扰RNA(siRNA)的治疗剂用于治疗罕见的皮肤病症先天性厚甲(PC)的Ib期临床试验，先天性厚甲为一种常染色体显性综合征，其包括致残性的掌跖角化病。这种siRNA，称为TD101，特异性地并且有力地靶向角蛋白6a(K6a)N171K突变体mRNA，而不影响野生型K6a mRNA。

郑(Zheng)等人(PNAS，7月24日，2012年，第109卷，第30期，11975-11980)表明，球形核酸纳米粒子结合物(SNA-NC)，由高度定向的、共价固定的siRNA的致密壳围绕的金核，在应用之后数小时之内在体外自由地穿透几乎100％的角化细胞、小鼠皮肤、以及人表皮。郑(Zheng)等人证明，在人类皮肤中单次应用25nM的表皮生长因子受体(EGFR)SNA-NC持续60小时显示出有效的基因敲低。对于向皮肤给予固定在SNA-NC中的CRISPR Cas可以考虑了相似的剂量。

通用基因疗法考虑

疾病相关基因和多核苷酸以及疾病具体信息的实例可获得自约翰斯·霍普金斯大学的麦考斯克-纳森遗传医学研究所(McKusick-Nathans Institute of GeneticMedicine,Johns Hopkins University)(巴尔的摩，马里兰州)和国立医学图书馆的国家生物技术信息中心(National Center for Biotechnology Information,National Libraryof Medicine)(贝塞斯达，马里兰州)。

这些基因和途径的突变可以导致产生不当的蛋白质或以不当的量影响功能的蛋白质。通过引用而特此结合来自于2012年12月12日提交的美国临时申请61/736,527的基因、疾病和蛋白质的另外的实例。这样的基因、蛋白质和途径可以是本发明的CRISPR复合物的靶多核苷酸。

本发明的实施例还涉及与敲除基因、扩增基因以及修复与DNA重复不稳定性和神经障碍相关的具体突变有关的方法和组合物(罗伯特D.·威尔斯(Robert D.Wells)、芦沢哲夫(Tetsuo Ashizawa)，遗传不稳定性与神经疾病(Genetic Instabilities andNeurological Diseases)，第二版，学术出版社(Academic Press)，2011年10月13日-《医学》(Medical))。已经发现串联重复序列的特定方面对超过二十种人类疾病负责(重复不稳定新见：RNA·DNA杂交体的作用(New insights into repeat instability:role ofRNA·DNA hybrids).麦基弗EI(McIvor EI)、波拉克U(Polak U)、纳皮尔拉拉M(NapieralaM).《RNA生物学》(RNA Biol.)2010年9月-10月；7(5):551-8)。可以利用在此的效应蛋白系统校正基因组不稳定性缺陷。

本发明的若干另外的方面涉及校正与范围广泛的遗传性疾病相关的缺陷，这些遗传性疾病在专题小节遗传性障碍(Genetic Disorders)下被进一步描述于国立卫生研究院的网站(网址为health.nih.gov/topic/GeneticDisorders)。遗传性脑病可以包括但不限于，肾上腺脑白质营养不良、胼胝体发育不全、艾卡尔迪综合征(Aicardi Syndrome)、阿尔佩斯病(Alpers'Disease)、阿尔茨海默病、巴特综合征(Barth Syndrome)、巴藤病(BattenDisease)、CADASIL、小脑变性、费波瑞病(Fabry's Disease)、格斯特曼-施特劳斯纳病(Gerstmann-Straussler-Scheinker Disease)、亨廷顿病以及其他三联体重复障碍、莱氏病(Leigh's Disease)、莱施-奈恩综合征、门克斯病、线粒体肌病以及NINDS空洞脑(Colpocephaly)。这些疾病在小节遗传性脑部障碍(Genetic Brain Disorders)下被进一步描述于国立卫生研究院的网站。

使用CRISPR Cas系统的示例方法

用CRISPR-Cas系统或复合物修饰靶标

确实，在本发明的任何方面，该CRISPR复合物可以包括与杂交或可杂交到靶序列上的指导序列复合的CRISPR酶，其中所述指导序列可以连接到tracr配对序列上，该tracr配对序列进而可以杂交到tracr序列上。

类似的考虑因素和条件适用如上文针对修饰靶多核苷酸的方法。因此，在本文描述的非天然存在的CRISPR酶的任一种中包括至少一种修饰，并且由此该酶具有某些改进的能力。具体地，这些酶中的任一种能够与指导RNA形成CRISPR复合物。当这种复合物形成时，该指导RNA能够结合至靶多核苷酸序列上，并且该酶能够改变靶座位。此外，与未修饰的酶相比，在该CRISPR复合物中的酶具有降低的修饰一个或多个脱靶座位的能力。

可以被工程化到如在此描述的经修饰的CRISPR酶中的另外的功能性包括以下这些。1.经修饰的CRISPR酶，其破坏DNA：蛋白质相互作用而不影响蛋白质三级或二级结构。这包括接触RNA：DNA双链体任何部分的残基。2.经修饰的CRISPR酶，其弱化蛋白内相互作用，该蛋白内相互作用使Cas9保持响应于DNA结合(靶标或脱靶)的核酸酶切割所必需的构象。例如：轻度抑制、但仍然允许HNH结构域(定位在易切断的磷酸酯处)的核酸酶构象的修饰。3.经修饰的CRISPR酶，其强化蛋白内相互作用，该蛋白内相互作用使Cas9保持对响应于DNA结合(靶标或脱靶)的核酸酶活性进行抑制的构象。例如：将HNH结构域稳定在远离易切断的磷酸酯的构象中的修饰。任何这种功能增强可以提供为与如本文其他处详细描述的对CRISPR酶的任何其他修饰相组合。

任何本文描述的改进的功能性可以针对任何CRISPR酶例如Cas9酶。本文描述的Cas9酶衍生自来自化脓链球菌和金黄色葡萄球菌的Cas9酶。然而，应当理解的是本文描述的任何功能性可以被工程化到来自其他直向同源物的Cas9酶中，包括含有来自多种直向同源物的片段的嵌合酶。

核酸、氨基酸和蛋白质、调节序列、载体等

本发明使用核酸来结合靶TDNA序列。这是有利的，因为产生核酸比产生蛋白质容易且价廉得多，并且特异性可以根据其中寻求同源性的拉伸长度而变化。例如多指的复杂3-D复杂定位是不需要的。术语“多核苷酸”、“核苷酸”、“核苷酸序列”、“核酸”和“寡核苷酸”可互换地使用。它们是指具有任何长度的核苷酸的聚合形式，是脱氧核糖核苷酸或核糖核苷酸、或其类似物。多核苷酸可具有任何三维结构，并且可以执行已知或未知的任何功能。以下是多核苷酸的非限制性实例：基因或基因片段的编码区或非编码区、根据连接分析定义的多个座位(一个座位)、外显子、内含子、信使RNA(mRNA)、转运RNA、核糖体RNA、短干扰RNA(siRNA)、短发夹RNA(shRNA)、micro-RNA(miRNA)、核酶、cDNA、重组多核苷酸、分支多核苷酸、质粒、载体、任何序列的分离的DNA、任何序列的分离的RNA、核酸探针、和引物。该术语还涵盖具有合成骨架的核酸-样结构，参见，例如埃克斯坦(Eckstein)，1991；巴塞加(Baserga)等人，1992；米利根(Milligan)，1993；WO 97/03211；WO 96/39154；马塔(Mata)，1997；施特劳斯-绍库普(Strauss-Soukup)，1997；和扎姆斯塔(Samstag)，1996。多核苷酸可以包含一个或多个经修饰的核苷酸，如甲基化的核苷酸和核苷酸类似物。如果存在，可以在聚合物组装之前或之后进行核苷酸结构的修饰。核苷酸的序列可以被非核苷酸组分中断。多核苷酸可以在聚合后，如通过与标记的组分缀合来进一步修饰。如本文所用的术语“野生型”是本领域技术人员所理解的术语，并且表示生物、菌株、基因的典型形式或者当它在自然界存在时区别于突变体或变体形式的特征。“野生型”可以是基线。如本文所用的术语“变体”应当被理解为表示具有衍生自在自然界中存在的模式的性质的展示。术语“非天然存在的”或“工程化的”可互换地使用并且表面人工的参与。这些术语，当指核酸分子或多肽时，表示该核酸分子或多肽至少基本上从它们在自然界中或如发现于自然界中的与其结合的至少另一种组分游离出来。“互补性”是指核酸与另一个核酸序列借助于传统的沃森-克里克碱基配对或其他非传统类型形成一个或多个氢键的能力。互补百分比表示一个核酸分子中可与一个第二核酸序列形成氢键(例如，沃森-克里克碱基配对)的残基的百分比(例如，10个之中有5、6、7、8、9、10个即为50％、60％、70％、80％、90％、和100％互补)。“完全互补”表示一个核酸序列的所有连续残基与一个第二核酸序列中的相同数目的连续残基形成氢键。如本文使用的“基本上互补”是指在一个具有8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50个或更多个核苷酸的区域上至少为60％、65％、70％、75％、80％、85％、90％、95％、97％、98％、99％、或100％的互补程度，或者是指在严格条件下杂交的两个核酸。如本文使用的对于杂交的“严格条件”是指与靶序列具有互补性的一个核酸主要地与该靶序列杂交并且基本上不杂交到非靶序列上的条件。严格条件通常是序列依赖性的，并且取决于许多因素而变化。一般而言，该序列越长，则该序列特异性地杂交到其靶序列上的温度就越高。严格条件的非限制性实例描述于蒂森(Tijssen)(1993)的《生物化学和分子生物学中的实验室技术-核酸探针杂交》(Laboratory Techniques InBiochemistry And Molecular Biology-Hybridization With Nucleic Acid Probes)，第I部分，第二章，“杂交原理概述和核酸探针分析策略”(“Overview of principles ofhybridization and the strategy of nucleic acid probe assay”)，爱思唯尔(Elsevier)，纽约。在提及一个多核苷酸序列时，那么也设想了互补的或部分互补的序列。能够在高严格条件下杂交到参考序列上的这些序列是优选的。通常，为了使杂交率最大化，选择了相对低严格性的杂交条件：低于热熔点(T_m)约20℃到25℃。T_m是50％的特异性靶序列在具有规定的离子强度和pH的溶液中杂交到完全互补的探针上的温度。通常，为了要求杂交序列的至少约85％的核苷酸互补性，高严格洗涤条件被选择为低于T_m约5℃到15℃。为了要求杂交序列的至少约70％的核苷酸互补性，中等严格洗涤条件被选择为低于T_m约15℃到30℃高容许(极低严格性)洗涤条件可以低至在T_m之下50℃，从而允许在杂交序列之间的高水平错配。本领域技术人员将认识到，在杂交和洗涤阶段中的其他物理和化学参数也可以改变，从而影响来自在靶序列与探针序列之间的特定同源性水平的可检测杂交信号的结果。优选的高严格条件包括在50％甲酰胺、5×SSC、和1％SDS中在42℃孵育，或者在5×SSC和1％SDS中在65℃孵育，在0.2×SSC和0.1％SDS中在65℃洗涤。“杂交”是指其中一个或多个多核苷酸反应形成一种复合物的反应，该复合物经由这些核苷酸残基之间的碱基的氢键键合而稳定化。氢键键合可以借助于沃森-克里克碱基配对、Hoogstein结合或以任何其他序列特异性方式而发生。该复合物可包含形成一个双链体的两条链、形成多链复合物的三条或多条链、单个自我杂交链、或这些的任何组合。杂交反应可以构成更广泛的过程(如PCR的开始、或经由一种酶的多核苷酸的切割)中的步骤。能够与给定序列杂交的序列被称为该给定序列的“互补物”。如本文使用的，术语“基因组座位(locus)”或“座位(locus)”(复数是座位(loci))是在染色体上的基因或DNA序列的特定位置。“基因”是指编码多肽或RNA链的DNA或RNA的段(stretch)，其在生物中发挥功能作用并且因此是活生物体遗传的分子单元。出于本发明的目的，可以考虑包括调节基因产物的产生的区域的基因，而不论这样的调节序列是否接近编码和/或转录的序列。因此，基因包括而不必限于，启动子序列、终止子、翻译调节序列(如核糖体结合位点和内部核糖体进入位点)、增强子、沉默子、隔离子、边界组件、复制起点、核基质附着位点和座位控制区。如本文使用的“基因组座位的表达”或“基因表达”是藉此在功能性基因产物的合成中使用来自基因的信息的过程。基因表达的产物常常是蛋白质，但是在非蛋白质编码基因如rRNA基因或tRNA基因中，产物是功能性RNA。基因表达的过程由所有已知的生物利用-产生功能性产物以便存活的真核生物(包括多细胞生物)、原核生物(细菌和古细菌)以及病毒。如本文使用的基因或核酸的“表达”不仅涵盖细胞基因表达，而且涵盖在克隆系统中或在任何其他背景下的一个或多个核酸的转录和翻译。如本文使用的“表达”是指藉此从DNA模板转录成多核苷酸(如转录成mRNA或其他RNA转录物)的过程和/或转录的mRNA随后藉此翻译成肽、多肽或蛋白质的过程。转录物和编码的多肽可以总称为“基因产物”。如果多核苷酸来源于基因组DNA，表达可以包括真核细胞中mRNA的剪接。术语“多肽”、“肽”和“蛋白质”在本文可互换地使用，是指具有任何长度的氨基酸的聚合物。该聚合物可以是可以是直链或支链的，它可以包含修饰的氨基酸，并且它可以被非氨基酸中断。这些术语还涵盖已经被修饰的氨基酸聚合物；这些修饰例如二硫键形成、糖基化、脂化(lipidation)、乙酰化、磷酸化、或任何其他操纵，如与标记组分的缀合。如本文使用的术语“氨基酸”包括天然的和/或非天然的或者合成的氨基酸，包括甘氨酸以及D和L旋光异构体、以及氨基酸类似物和肽模拟物。如本文使用的，术语“结构域”或“蛋白质结构域”是指可以独立于该蛋白质链的其余部分而存在并且起作用的蛋白质序列的一部分。正如在本发明的多个方面中所描述，序列一致性与序列同源性有关。可以通过肉眼、更通常地借助于可得的序列比较程序来进行同源性比较。这些可商购的计算机程序可以计算在两个或更多个序列之间的同源性的百分比(％)并且还可以计算由两个或更多个氨基酸或核酸序列共享的序列一致性。

在本发明的多个方面中，术语“指导RNA”，是指包括以下项中的一种或多种的多核苷酸序列：推定或鉴定的tracr序列和推定或鉴定的crRNA序列或指导序列。在具体实施例中，“指导RNA”包括推定或鉴别的crRNA序列或指导序列。在另外的实施例中，该指导RNA不包括推定或鉴定的tracr序列。

如本文所用的术语“野生型”是本领域技术人员所理解的术语，并且表示生物、菌株、基因的典型形式或者当它在自然界存在时区别于突变体或变体形式的特征。“野生型”可以是基线。

如本文所用的术语“变体”应当被理解为表示具有衍生自在自然界中存在的模式的性质的展示。

术语“非天然存在的”或“工程化的”可互换地使用并且表面人工的参与。这些术语，当指核酸分子或多肽时，表示该核酸分子或多肽至少基本上从它们在自然界中或如发现于自然界中的与其结合的至少另一种组分游离出来。在所有方面和实施例中，无论它们是否包括这些术语，将理解的是，优选地，可以是任选的并且由此是优选包括的或不是优选不包括的。此外，术语“非天然存在的”和“工程化”可以互换地使用，并且因此可以单独或组合使用，并且一者或另一者可以替代两种一起的提及。具体地，“工程化”优选替代“非天然存在的”或“非天然存在的和/或工程化的”。

可以通过本领域已知的许多计算机程序(例如BLAST或FASTA等等)来生成序列同源性。用于进行这样的比对的适合的计算机程序是GCG威斯康星Bestfit软件包(威斯康星大学，美国；德弗罗(Devereux)等人，1984，《核酸研究》(Nucleic Acids Research)12：387)。可以进行序列比较的其他软件的实例包括但不限于，BLAST软件包(参见奥苏贝尔(Ausubel)等人，1999，出处同上-第18章)、FASTA(阿尔丘尔(Atschul)等人，1990，《分子生物学杂志》(J.Mol.Biol.)，403-410)以及GENEWORKS系列比较工具。BLAST和FASTA均可用于离线和在线搜索(参见奥苏贝尔(Ausubel)等人，1999，出处同上，7-58页到7-60页)。然而，优选使用GCG Bestfit程序。可以计算在连续序列上的序列同源性百分比(％)，即，将一个序列与另一个序列比对，并且将一个序列中的每个氨基酸或核苷酸与另一个序列中的相应氨基酸或核苷酸直接进行比较，一次比较一个残基。这被称为“无空位”比对。典型地，这样的无空位比对仅仅在较少数目的残基上进行。虽然这是一种非常简单和一致的方法，但是它未能考虑的是，例如，在其他方面完全相同的序列对中，一个插入或缺失可以引起随后的氨基酸残基被排除在比对之外，因此当进行全局比对时可能导致在同源性％上的大幅降低。因此，大多数序列比较方法被设计为产生考虑到可能的插入和缺失的优化比对，而没有过度地使总体同源性或一致性评分不利。这是通过在序列比对中插入“空位”来实现的，以便试图将局部同源性或一致性最大化。然而，这些更复杂的方法向出现在该比对中的每个空位分配“空位罚分”，从而对于相同数目的一致的氨基酸而言，具有尽可能少的空位的序列比对-反映了在这两个比较的序列之间的更高关联性-可以比具有许多空位者实现更高的得分。“亲合空位成本”(“Affinity gap costs”)典型地用于对空位的存在要求相对高的成本并对空位中的每个后续残基施加较小的罚分。这是最常用的空位评分系统。高空位罚分当然将产生具有更少空位的最佳比对。大多数比对程序允许修改空位罚分。然而，当使用这种序列比较软件时优选使用默认值。例如当使用GCG威斯康星Bestfit软件包时，氨基酸序列的默认空位罚分为对于每个空位的-12，以及对于每个延伸的-4。因此计算最大同源性％首先要求产生最佳比对，考虑空位罚分。用于进行这样的比对的适合的计算机程序是GCG威斯康星Bestfit软件包(德弗罗(Devereux)等人，1984，《核酸研究》(Nuc.AcidsResearch 12p387)。可以进行序列比较的其他软件的实例包括但不限于，BLAST软件包(参见奥苏贝尔(Ausubel)等人，1999《精编分子生物学实验指南》(Short Protocols inMolecular Biology)，第4版-第18章)、FASTA(阿尔丘尔(Altschul)等人，1990《分子生物学杂志》(J.Mol.Biol.)403-410)以及GENEWORKS系列比较工具。BLAST和FASTA均可用于离线和在线搜索(参见奥苏贝尔(Ausubel)等人，1999，《精编分子生物学实验指南》(ShortProtocols in Molecular Biology)，7-58页到7-60页)。然而，对于一些应用，优选使用GCGBestfit程序。一种新的工具，称为BLAST 2序列，也可用于比较蛋白质和核苷酸序列(参见《欧洲微生物学会联合会微生物学快报》(FEMS Microbiol Lett.)1999 174(2):247-50；FEMS Microbiol Lett.1999 177(1):187-8以及在国立卫生研究院的网址的国家生物技术信息中心的网址)。虽然最终同源性％可以按照一致性进行测量，但是比对过程自身典型地不是基于全或无配对比较(all-or-nothing pair comparison)。相反，通常使用尺度相似性评分矩阵(scaled similarity score matrix)，基于化学相似性或进化距离对各个成对比较评分。通常使用的这种矩阵的实例为BLOSUM62矩阵-BLAST系列程序的默认矩阵。GCG威斯康星程序通常使用公开的默认值或自定义符号比较表(更多细节详见用户手册)。对于一些应用，优选使用GCG软件包的公共默认值，或在其他软件情况下的默认矩阵，如BLOSUM62。可替代地，可以基于类似于CLUSTAL(希金斯DG(Higgins DG)和夏普PM(Sharp PM)(1988)，《基因》(Gene)73(1)，237-244)的一种算法，使用在DNASISTM(日立软件公司(HitachiSoftware))中的多重比对特征来计算同源性百分比。一旦软件已经产生最佳比对，就有可能计算同源性％，优选序列一致性％。软件典型地这样进行，作为序列比较的一部分，并且产生数字结果。这些序列也可以具有氨基酸残基的缺失、插入或取代，其产生沉默变化并生成功能上等同的物质。可以基于氨基酸特性(如残基的极性、电荷、可溶性、疏水性、亲水性、和/或两亲性)的相似性做出有意氨基酸取代，并且因此它在将氨基酸集合成官能团中是有用的。可以仅仅基于氨基酸的侧链特性将它们集合在一起。然而，包括突变数据同样是更有用的。出于结构原因，如此衍生的氨基酸的集合很有可能是保守性的。这些集合可以被描述为文氏图形式(Venn diagram)(利文斯敦C.D.(Livingstone C.D.)和巴顿G.J.(BartonG.J.)(1993)“蛋白质序列比对：用于残基保守些的分级分析的策略”(“Protein sequencealignments:a strategy for the hierarchical analysis of residue conservation”)《生物科学计算应用》(Comput.Appl.Biosci.9:745-756)(泰勒(Taylor)W.R.(1986)“氨基酸保守性的分类”(“The classification of amino acid conservation”)《理论生物学杂志》(J.Theor.Biol.)119；205-218)。例如可以根据下表做出保守性取代，该表描述了普遍接受的氨基酸的文氏图分组。

术语“受试者”、“个体”和“患者”在本文中是可互换地使用的，指的是脊椎动物，优选地是哺乳动物，更加优选地是人类。哺乳动物包括但不限于鼠类、猴、人、农畜、体育用动物和宠物。也包括体内获得或体外培养的生物实体的组织、细胞及其子代。

术语“治疗剂(therapeutic agent)”、“可用于治疗的试剂(therapeutic capableagent)”或“处理剂(treatment agent)”是可互换地使用的，并且是指在给予受试者时赋予某种有益影响的一种分子或化合物。该有益影响包括诊断确定的实现；改善疾病、症状、障碍、或病理学病况；减少或预防疾病、症状、障碍或病况的发作；以及总体上对抗疾病、症状、障碍或病理学病况。

如此处使用的，“治疗(treatment)”或“进行治疗(treating)”或“减轻”或“改善”是可互换地使用的。这些术语是指如下途径，该途径用于获得有益或希望的结果，包括但不限于治疗益处和/或预防益处。治疗益处意指治疗中的一种或多种疾病、病况、或症状上的任何治疗上相关的改进或对其的影响。对于预防益处，该组合物可给予至处于发展具体的疾病、病况、或症状的风险的受试者，或给予至报告了疾病的一个或多个生理学症状的受试者，尽管该疾病、病况、或症状可能还没有体现出来。

术语“有效量”或“治疗有效量”是指一种药剂的足以实现有益或希望的结果的量。治疗有效量可依赖于正治疗的受试者和疾病病状、受试者的重量和年龄、疾病病况的严重度、给药方式等中一项或多个而改变，并可以由本领域普通技术人员容易地确定。该术语也适用通过此处描述的显像方法中的任一项提供一种检测用图像的一个剂量。具体剂量可依赖于以下中一个或多个而变化：所选择的具体药剂、所遵循的给药方案、是否与其他化合物组合给予、给予时间、待显像的组织、以及携带它的物理递送系统。

除非另有说明，本发明的实践采用免疫学、生物化学、化学、分子生物学、微生物学、细胞生物学、基因组学和重组DNA的常规技术，这些在本领域的技能之内。参见萨姆布鲁克(Sambrook)、弗里奇(Fritsch)和马尼亚蒂斯(Maniatis)，《分子克隆：实验室手册》(MOLECULAR CLONING:A LABORATORY MANUAL)，第2版(1989)；《当代分子生物学实验手册》(CURRENT PROTOCOLS IN MOLECULAR BIOLOGY)(F.M.奥苏贝尔(F.M.Ausubel)等人编辑，(1987))；《酶学方法》(METHODS IN ENZYMOLOGY)系列(学术出版公司)：《PCR 2：实用方法》(PCR 2:A PRACTICAL APPROACH)(M.J.麦克弗森(M.J.MacPherson,B.D.Hames)和G.R.泰勒(Taylor)编辑(1995))、哈洛(Harlow)和拉内(Lane)编辑(1988)《抗体：实验室手册》(ANTIBODIES,A LABORATORY MANUAL)，以及《动物细胞培养》(ANIMAL CELL CULTURE)(R.I.弗雷谢尼(R.I.Freshney)编辑(1987))。

本发明的若干方面涉及包括一种或多种载体的载体系统，或载体本身。载体可以被设计为用于在原核或真核细胞中表达CRISPR转录物(例如核酸转录物、蛋白质、或酶)。例如，CRISPR转录物可表达于例如大肠杆菌的细菌细胞、昆虫细胞(使用杆状病毒表达载体)、酵母细胞、或哺乳动物细胞中。适合的宿主细胞进一步讨论于Goeddel(戈德尔)，《基因表达技术：酶学方法》(GENE EXPRESSION TECHNOLOGY:METHODS IN ENZYMOLOGY)185，学术出版社(Academic Press)，圣地亚哥(San Diego)，加利福尼亚州(Calif.)(1990年)中。可替代地，重组表达载体可在体外例如使用T7启动子调节序列和T7聚合酶来转录和翻译。

本发明的实施例包括可包含同源取代(本文使用取代和置换两者来表示现有氨基酸残基或核苷酸与替代残基和核苷酸之间的互换)的序列(多核苷酸或多肽两者)，该同源取代，即，在氨基酸的情况下发生同类取代(like-for-like substitution)，如碱性对碱性、酸性对酸性、极性对极性。也可以发生非同源取代，即，从一类残基到另一类残基，或者可替代地涉及包含非天然氨基酸如鸟氨酸(在下文称为Z)、二氨基丁酸鸟氨酸(在下文称为B)、正亮氨酸鸟氨酸(在下文称为O)、吡啶基丙氨酸、噻吩基丙氨酸、萘基丙氨酸和苯基甘氨酸。变体氨基酸序列可以包括适合的可插入在该序列的任何两个氨基酸残基之间的间隔基团，包括除了氨基酸间隔物(如甘氨酸或-β丙氨酸)之外的烷基基团，如甲基、乙基或丙基基团。一个另外的变化形式，其涉及处于类肽形式的一个或多个氨基酸残基的存在，也是本领域技术人员熟知的。为避免疑义，“该类肽形式”用来指代变体氨基酸残基，其中该α-碳取代基在该残基的氮原子上，而不是在该α-碳上。用于制备处于该类肽形式的肽的方法是本领域已知的，例如西蒙RJ(Simon RJ)等人，PNAS(1992)89(20)，9367-9371和豪威尔DC(Horwell DC)，《生物技术趋势》(Trends Biotechnol.)(1995)13(4),132-134。

同源建模：在其他Cas9直向同源物中的相应残基可以通过张(Zhang)等人，2012(《自然》(Nature)；490(7421)：556-60)和陈(Chen)等人，2015(《PLoS计算生物学》(PLoSComput Biol)；11(5)：E1004248)的方法进行鉴定—计算蛋白质-蛋白质相互作用(PPI)方法用以预测由结构域-基序界面介导的相互作用。PrePPI(预测PPI)，一种基于结构的PPI预测方法，使用贝叶斯统计框架(Bayesian statistical framework)将结构证据与非结构证据相结合。该方法涉及取一对查询蛋白并使用结构比对以便鉴别与它们实验确定的结构或同源性模型相对应的结构代表。结构比对进一步用来通过考虑全局和局部几何关系来鉴定接近的和远程的结构相邻物。每当结构代表物的两个相邻物形成报告于蛋白质数据库中的复合物，这限定了用于对两个查询蛋白质之间的相互作用进行建模的模板。复合物的模型是通过在模板中将代表性结构叠加在其对应的结构相邻物上来创建。这种方法进一步描述于戴伊(Dey)等人，2013(《蛋白质科学》(Prot Sci)；22:359-66)。

本发明的多个方面涉及用于嵌合的RNA与Cas9的双顺反子载体。用于嵌合的RNA与Cas9的双顺反子表达载体是优选的。一般而言并且特别地，在这个实施例中，Cas9优选由CBh启动子驱动。嵌合RNA可以优选地由Pol III启动子(如U6启动子)驱动。理想地，将这两者结合。嵌合的指导RNA典型地由20bp指导序列(N)组成并且这可以接合到tracr序列上(从下链的第一个“U”到该转录物的结尾)。该tracr序列可以在如指示的不同位置被截短。指导序列和tracr序列被该tracr配对序列隔开，该tracr配对序列可以是GUUUUAGAGCUA。这之后可以是如所示的环序列GAAA。这两者都是优选的实例。申请人已经通过SURVEYOR测定证明了在人EMX1和PVALB座位处的Cas9介导的indel。ChiRNA由其“+n”标志指示，并且crRNA是指指导序列和tracr序列被表达为分开的转录物的杂交体RNA。贯穿本申请，嵌合RNA也可以被称为单指导、或合成指导RNA(sgRNA)。

在一些实施例中，提供了指导RNA中的环。这可以是茎环或四核苷酸环(tetraloop)。该环优选地是GAAA，但是并并限于这个序列或者实际上在长度上仅仅为4bp。实际上，用于在发夹结构中使用的优选环形成序列在长度上为四个核苷酸，并且最优选地具有序列GAAA。然而，可以使用更长或更短的环序列，正如可替代的序列。这些序列优选地包括三联体(例如，AAA)、和另外的核苷酸(例如C或G)。环形成序列的实例包括CAAA和AAAG。在实践在此披露的任何方法中，可以经由本领域已知的一种或多种方法将适合的载体引入进细胞或胚胎中，这些方法包括但不限于，显微注射、电穿孔、声致穿孔、基因枪、磷酸钙介导的转染、阳离子转染、脂质体转染、树枝状聚合物转染、热休克转染、核转染、磁转染、脂转染、刺穿转染(impalefection)、光学转染、专有剂增强的核酸摄取以及经由脂质体、免疫脂质体、病毒颗粒或人工病毒体进行递送。在一些方法中，通过显微注射将该载体引入进胚胎中。可以将这个或这些载体显微注射进胚胎的细胞核或细胞质中。在一些方法中，通过核转染将这个或这些载体引入进细胞中。

术语“调节组件”旨在包括启动子、增强子、内部核糖体进入位点(IRES)、和其他表达控制组件(例如转录终止信号，如多聚腺苷酸化信号和多聚U序列)。这样的调节序列例如描述于戈德尔(Goeddel)，《基因表达技术：酶学方法》(GENE EXPRESSION TECHNOLOGY:METHODS IN ENZYMOLOGY)185，学术出版社(Academic Press)，圣地亚哥(San Diego)，加利福尼亚州(1990)中。调节组件包括指导一个核苷酸序列在许多类型的宿主细胞中的组成型表达的那些序列以及指导该核苷酸序列只在某些宿主细胞中表达的那些序列(例如，组织特异型调节序列)。组织特异型启动子可主要指导在感兴趣的期望组织中的表达，所述组织例如肌肉、神经元、骨、皮肤、血液、特定的器官(例如肝脏、胰腺)、或特殊的细胞类型(例如淋巴细胞)。调节组件还可以时序依赖性方式(如以细胞周期依赖性或发育阶段依赖性方式)指导表达，该方式可以是或者可以不是组织或细胞类型特异性的。在一些实施例中，一个载体包含一个或多个pol III启动子(例如1、2、3、4、5、或更多个pol III启动子)、一个或多个pol II启动子(例如1、2、3、4、5、或更多个pol II启动子)、一个或多个pol I启动子(例如1、2、3、4、5、或更多个pol I启动子)、或其组合。pol III启动子的实例包括但不限于U6和H1启动子。pol II启动子的实例包括但不限于逆转录劳斯肉瘤病毒(RSV)LTR启动子(任选地具有RSV增强子)、巨细胞病毒(CMV)启动子(任选地具有CMV增强子)[参见，例如，波沙特(Boshart)等人，《细胞》(Cell)41:521-530(1985)]、SV40启动子、二氢叶酸还原酶启动子、β-肌动蛋白启动子、磷酸甘油激酶(PGK)启动子、和EF1α启动子。还被术语“调节组件”涵盖的是增强子组件，如WPRE；CMV增强子；在HTLV-I的LTR中的R-U5’片段(《分子细胞生物学》(Mol.Cell.Biol.)，第8(1)卷，第466-472页，1988)；SV40增强子；以及在兔β-珠蛋白的外显子2与3之间的内含子序列(《美国国家科学院院刊》(Proc.Natl.Acad.Sci.USA.)，第78(3)卷，第1527-31页，1981)。本领域的普通技术人员应当理解的是，表达载体的设计可取决于比如待转化的宿主细胞的选择、所希望的表达水平等因素。载体可以被引入到宿主细胞中而由此产生转录物、蛋白质、或肽，包括由如本文描述的核酸编码的融合蛋白或肽(例如，规律间隔成簇短回文重复(CRISPR)转录物、蛋白质、酶、其突变体形式、其融合蛋白等)。关于调节序列，提及美国专利申请10/491,026，该专利的内容通过引用以其全文并入本文。关于启动子，提及PCT公开WO12/511,940和美国申请12/511,940，这些专利的内容通过引用以其全文并入本文。

载体可以被引入原核生物或原核细胞中并且在其中增殖。在一些实施例中，原核生物用来扩增有待引入真核细胞中的载体的多个拷贝，或者作为有待引入真核细胞中的载体的产生中的中间载体(例如，扩增质粒作为病毒载体包装系统的一部分)。在一些实施例中，原核生物用来扩增一个载体的多个拷贝并且表达一种或多种核酸，如提供用于递送到宿主细胞或宿主生物中的一种或多种蛋白质的来源。蛋白质在原核生物中的表达最经常在大肠杆菌中用含有指导融合或非融合蛋白的表达的组成型或诱导型启动子的载体来进行。融合载体将多个氨基酸添加到在其中编码的蛋白质上，如该重组蛋白的氨基端上。这样的融合载体可以用于一个或多个目的，如：(i)增加重组蛋白的表达；(ii)增加重组蛋白的溶解性；以及(iii)通过在亲和纯化中充当配体来辅助重组蛋白的纯化。通常，在融合表达载体中，将蛋白切割位点引入至融合部分与重组蛋白的接合处以使得能够在纯化融合蛋白之后将重组蛋白与融合部分分离。这类酶以及它们的同源识别序列包括因子Xa、凝血酶以及肠激酶。示例性融合表达载体包括pGEX(发玛西亚生物技术有限公司(Pharmacia BiotechInc)；史密斯和约翰逊，1988.《基因》(Gene)67:31-40)、pMAL(纽英伦生物技术公司(NewEngland Biolabs)，贝弗利(Beverly)，马萨诸塞州(Mass.))以及pRIT5(发玛西亚公司，皮斯卡塔韦(Piscataway)，新泽西州(N.J.))，它们分别将谷胱甘肽S-转移酶(GST)、麦芽糖E结合蛋白或蛋白A融合至靶重组蛋白。适合的诱导型非融合大肠杆菌表达载体的实例包括pTrc(Amrann(阿姆兰)等人，(1988年)《基因》(Gene)69:301-315)以及pET 11d(Studier(斯图迪尔)等人，《基因表达技术：酶学方法》(GENE EXPRESSION TECHNOLOGY:METHODS INENZYMOLOGY)185，学术出版社(Academic Press)，圣地亚哥(San Diego)，加利福尼亚州(Calif.)(1990年)60-89。在一些实施例中，载体是酵母表达载体。用于在酵母酿酒中表达的载体的实例包括pYepSec1(巴尔戴利(Baldari)等人，1987，《欧洲分子生物学学会杂志》(EMBO J)6:229-234)、pMFa(库尔坚(Kurjan)和赫斯库伍特兹(Herskowitz)，1982，《细胞》(Cell)30:933-943)、pJRY88(舒尔茨(Schultz)等人，1987，《基因》(Gene)54:113-123)、pYES2(英杰公司(Invitrogen Corporation)，圣地亚哥(San Diego)，加利福尼亚州(Calif))、以及picZ(英杰公司，圣地亚哥，加利福尼亚州)。在一些实施例中，使用杆状病毒载体，载体驱动昆虫细胞中的蛋白质表达。可用于在培养的昆虫细胞(例如，SF9细胞)中表达蛋白质的杆状病毒载体包括pAc系列(史密斯(Smith)等人，1983，Mol.Cell.Biol.)3:2156-2165)和pVL系列(拉克瑙(Lucklow)和萨莫斯(Summers)，1989，《病毒学》(Virology)170:31-39)。

在一些实施例中，重组哺乳动物表达载体能够指导核酸优先在特定细胞类型中表达(例如，使用组织特异型调节组件来表达核酸)。组织特异型调节组件是本领域中已知的。适合的组织特异型启动子的非限制性实例包括白蛋白启动子(肝脏特异性的；平克特(Pinkert)等人，1987.Genes Dev.1:268-277)，淋巴特异性启动子(卡里曼(Calame)和伊顿(Eaton)，1988.Adv.Immunol.43:235-275)，特别是T细胞受体的启动子(维纳图(Winoto)和巴尔迪莫(Baltimore)，1989.《欧洲分子生物学学会杂志》(EMBO J.)8:729-733)和免疫球蛋白(巴纳吉(Baneiji)等人，1983.《细胞》(Cell)33:729-740；奎恩(Queen)和巴尔迪莫(Baltimore)，1983.《细胞》(Cell)33:741-748)，神经元特异性启动子(例如，神经丝启动子；伯尔尼(Byrne)和鲁德尔(Ruddle)，1989.Proc.Natl.Acad.Sci.USA)86:5473-5477)，胰腺特异性启动子(艾德兰德(Edlund)等人，1985.《科学》(Science)230:912-916)，以及乳腺特异性启动子(例如，乳清启动子；美国专利号4,873,316和欧洲申请公开号264,166)。还涵盖发育型调节启动子，例如，鼠科动物同源框蛋白(hox)启动子凯赛尔((Kessel)和格鲁斯(Gruss)，1990.《科学》(Science)249:374-379)和α-甲胎蛋白启动子(卡姆皮斯(Campes)和蒂尔曼(Tilghman)，1989.Genes Dev.3:537-546)。关于这些原核和真核载体，提及美国专利6,750,059，该专利的内容通过引用以其全文并入本文。本发明的其他实施例可涉及病毒载体的使用，关于它提及美国专利申请13/092,085，该专利的内容通过引用以其全文并入本文。组织特异型调节组件是本领域中已知的，并且在这个方面提及美国专利7,776,321，该专利的内容通过引用以其全文并入本文。在一些实施例中，调节组件有效作地连接至CRISPR系统的一个或多个组件，从而驱动该CRISPR系统的该一个或多个组件的表达。一般而言，CRISPR(规律间隔成簇短回文重复)，也称为SPIDR(SPacer间隔开的同向重复)，构成通常对于特定细菌物种而言特异性的DNA基因座的家族。该CRISPR座位包含在大肠杆菌中被识别的间隔开的短序列重复(SSR)的一个不同类(石野(Ishino)等人，《细菌学杂志》(J.Bacteriol.)，169:5429-5433[1987]；和中田(Nakata)等人，《细菌学杂志》(J.Bacteriol.)，171:3553-3556[1989])、以及相关基因。类似的间隔开的SSR已经鉴定于地中海富盐菌(Haloferax mediterranei)、化脓链球菌、鱼腥藻属、和结核分枝杆菌中(参见，格鲁恩(Groenen)等人，《分子微生物学》(Mol.Microbiol.)，10:1057-1065[1993]；霍(Hoe)等人，《新发感染性疾病》(Emerg.Infect.Dis.)，5:254-263[1999]；马斯波尔(Masepohl)等人，《生物化学与生物物理学学报》(Biochim.Biophys.Acta)1307:26-30[1996]；and Mojica et al.,Mol.Microbiol.)，17:85-93[1995])。这些CRISPR座位典型地不同于其他SSR的重复结构，这些重复已被称为规律间隔的短重复(SRSR)(约翰逊(Janssen)等人，《OMICS：整合生物学杂志》(OMICS J.Integ.Biol.)，6:23-33[2002]；以及莫吉卡(Mojica)等人，《分子微生物学》(Mol.Microbiol.)，36:244-246[2000])。一般而言，这些重复是以簇存在的短组件，其被具有基本上恒定长度的独特间插序列规律地间隔开(莫吉卡(Mojica)等人，[2000]，同上)。虽然重复序列在菌株之间是高度保守的，许多间隔开的重复和这些间隔区的序列一般在菌株与菌株之间不同(冯·埃姆登(van Embden)等人,《细菌学杂志》(J.Bacteriol.)，182:2393-2401[2000])。已经在40种以上的原核生物中鉴定出CRISPR座位(参见，例如，约翰逊(Janssen)等人，《分子微生物学》(Mol.Microbiol.)，43:1565-1575[2002]；以及莫吉卡(Mojica)等人，[2005])，包括但不限于：气火菌属(Aeropyrum)、热棒菌属(Pyrobaculum)、硫化叶菌属(Sulfolobus)、古球菌属(Archaeoglobus)、盐盒菌属(Halocarcula)、甲烷杆菌属(Methanobacterium)、甲烷球菌属(Methanococcus)、甲烷八叠球菌属(Methanosarcina)、甲烷火菌属(Methanopyrus)、焦球菌属(Pyrococcus)、嗜酸菌属(Picrophilus)、热原体属(Thermoplasma)、棒杆菌属(Corynebacterium)、分枝杆菌属(Mycobacterium)、链霉菌属(Streptomyces)、产水菌属(Aquifex)、紫单胞菌属(Porphyromonas)、绿菌属(Chlorobium)、栖热菌属(Thermus)、芽孢杆菌属(Bacillus)、利斯特菌属(Listeria)、葡萄球菌属(Staphylococcus)、梭菌属(Clostridium)、好热厌氧杆菌属(Thermoanaerobacter)、支原体属(Mycoplasma)、梭杆菌属(Fusobacterium)、固氮弓菌属(Azarcus)、色杆菌属(Chromobacterium)、奈瑟球菌属(Neisseria)、亚硝化单胞菌属(Nitrosomonas)、脱硫弧菌属(Desulfovibrio)、地杆菌属(Geobacter)、粘球菌属(Myxococcus)、弯曲杆菌属(Campylobacter)、类杆菌属(Wolinella)、不动杆菌属(Acinetobacter)、欧文菌属(Erwinia)、埃希菌属(Escherichia)、军团菌属(Legionella)、甲基球菌属(Methylococcus)、巴斯德菌属(Pasteurella)、发光细菌属(Photobacterium)、沙门菌属(Salmonella)、黄单胞菌属(Xanthomonas)、耶尔森菌属(Yersinia)、密螺旋体属(Treponema)、和栖热袍菌属(Thermotoga)。

一般而言，如在本申请中使用的“核酸靶向系统”统一指代在表达或引导核酸靶向CRISPR-相关(“Cas”)基因(在本文还称为效应蛋白)的活性中涉及的转录物和其他组件，包括编码核酸靶向Cas(效应物)蛋白和指导RNA(包括crRNA序列和反式激活CRISPR/Cas系统RNA(tracrRNA)序列)的序列、或其他序列以及来自核酸靶向CRISPR座位的转录物。在一些实施例中，核酸靶向系统的一种或多种组件衍生自V型/VI型核酸靶向CRISPR系统。在一些实施例中，核酸靶向系统的一个或多个组件来源于包含内源核酸靶向CRISPR系统的特殊生物，如化脓链球菌。一般而言，核酸靶向系统表征为促进核酸靶向复合物在靶序列的位点处形成的组件。在核酸靶向复合物形成的背景下，“靶序列”是指指导序列被设计为对其具有互补性的序列，其中在靶序列与指导RNA之间的杂交促进DNA或RNA-靶向复合物的形成。完全互补性不是必需的，条件是存在足够互补性以引起杂交并且促进核酸靶向复合物的形成。靶序列可以包括RNA多核苷酸。在一些实施例中，靶序列位于细胞的细胞核或细胞质中。在一些实施例中，该靶序列可位于真核细胞的一个细胞器例如线粒体或叶绿体内。可被用于重组到包括该靶序列的靶基因座中的序列或模板被称为“编辑模板”或“编辑RNA”或“编辑序列”。在本发明的方面，外源的模板RNA可称为编辑模板。在本发明的一个方面，该重组是同源重组。

典型地，在内源核酸靶向系统的背景下，核酸靶向复合物(包含杂交到靶序列上并且与一种或多种核酸靶向效应蛋白复合的指导RNA)的形成导致在该靶序列中或其附近(例如在1、2、3、4、5、6、7、8、9、10、20、50、或更多个碱基对之内)的一条链或两条RNA链的切割。在一些实施例中，将驱动核酸靶向系统的一个或多个组件的表达的一种或多种载体引入到宿主细胞中，使得该核酸靶向系统的这些组件的表达在一个或多个靶位点指导核酸靶向复合物的形成。例如，核酸-靶向效应蛋白和指导RNA可以各自有效作地连接到在分开的载体上的单独的调节组件。可替代地，从相同或不同调节组件表达的二个或更多个组件可以结合在单个载体中，其中提供该核酸靶向系统的任何组分的一种或多种另外的载体不包括在该第一载体中。结合在单个载体中的靶向核酸的系统组件可以按照任何适合的方向排列，如一个组件相对于第二组件位于5'(“上游”)或3'(“下游”)。一个组件的编码序列可以位于第二组件的编码序列的同一条链或相对链上，并且取向为相同或相对的方向。在一些实施例中，单一启动子驱动编码核酸靶向效应蛋白和指导RNA的转录物的表达，该指导RNA嵌入在一个或多个内含子序列中(例如，各自处于不同内含子中，两个或更多个处于至少一个内含子中，或全部处于单一内含子中)。在一些实施例中，核酸靶向效应蛋白和指导RNA有效作地连接至相同的启动子上并且从其表达。

一般而言，指导序列是与靶多核苷酸序列具有足够互补性以便与该靶序列杂交并且引导核酸靶向复合物与该靶序列的序列特异性结合的任何多核苷酸序列。在一些实施例中，当使用适合的比对算法进行最佳比对是，在指导序列与其相应的靶序列之间的互补程度是约或多于约50％、60％、75％、80％、85％、90％、95％、97.5％、99％、或更多。可以使用用于比对序列的任何适合的算法来确定最佳比对，其非限制性实例包括史密斯-沃特曼(Smith-Waterman)算法、尼德曼-翁施(Needleman-Wunsch)算法、基于伯罗斯-惠勒变换(Burrows-Wheeler Transform)的算法(例如伯罗斯-惠勒比对工具(Burrows WheelerAligner))、ClustalW、Clustal X、BLAT、Novoalign(Novocraft技术公司)、ELAND(亿明达公司(Illumina)，圣地亚哥，加利福尼亚州)、SOAP(在soap.genomics.org.cn可获得)、以及Maq(在maq.sourceforge.net可获得)。在一些实施例中，指导序列在长度上为约或多于约5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75个、或更多个核苷酸。在一些实施例中，指导序列在长度上为少于约75、50、45、40、35、30、25、20、15、12个、或更少的核苷酸。可以通过任何适合的测定法来评估指导序列引导核酸靶向复合物与靶序列的序列特异性结合的能力。例如，足以形成核酸靶向复合物的核酸靶向系统的组分，包括有待测试的指导序列在内，可以例如通过用编码该核酸靶CRISPR向序列的组分的载体进行转染而被提供到具有相应靶序列的宿主细胞中，随后通过如本文所述的Surveyor测定来评估在该靶序列之内或附近的优先切割。类似地，通过提供该靶序列、包括有待测试的指导序列在内的核酸靶向复合物的组分、和不同于该测试指导序列的对照指导序列，并且比较在该测试指导序列与该对照指导序列反应之间的靶序列处或附近的结合或切割率，可以在试管中评估靶多核苷酸序列(或在其附近的序列)的切割。其他测定法是可能的，并且将由本领域技术人员想到。

指导序列可以被选择为靶向任何靶序列。在一些实施例中，该靶序列是在基因转录物或mRNA内的序列。

在一些实施例中，该靶序列是在细胞的基因组内的序列。

在一些实施例中，指导序列被选择为降低在该指导序列内的二级结构程度。可以通过任何适合的多核苷酸折叠算法来确定二级结构。一些算法是基于计算最小吉布斯(Gibbs)自由能。一种这样的算法的实例是mFold，正如祖克(Zuker)和施蒂格勒(Stiegler)所描述的(《核酸研究》(Nucleic Acids Res.)9(1981)，133-148)。折叠算法的另一个实例是使用质心结构预测算法的由维也纳大学(University of Vienna)的理论化学研究所(Institute for Theoretical Chemistry)研发的在线网络服务器RNAfold(参见例如，A.R.格鲁伯(Gruber)等人，2008，《细胞》(Cell)106(1):23-24；以及PA卡尔(Carr)和GM丘奇(Church)，2009，《自然生物技术》(Nature Biotechnology)27(12):1151-62)。另外的算法可以发现于美国申请序列号61/836,080)中；通过引用并入本文。

在一些实施例中，还提供了重组模板。重组模板可以是如本文所述的另一个载体的组分，其被包含在一个分开的载体中，或者被提供为一个分开的多核苷酸。在一些实施例中，重组模板被设计为用作在同源重组中的模板，如在被作为核酸靶向复合物的一部分的核酸靶向效应蛋白切开或切割的靶序列之内或在其附近。模板多核苷酸可以具有任何适合的长度，如约或多于约10、15、20、25、50、75、100、150、200、500、1000个、或更多个核苷酸长度。在一些实施例中，该模板多核苷酸与包含该靶序列的多核苷酸的一部分互补。当进行最佳比对时，模板多核苷酸能够与靶序列的一个或多个核苷酸(例如约或多于约1、5、10、15、20、25、30、35、40、45、50、60、70、80、90、100个、或更多个核苷酸)重叠。在一些实施例中，当一个模板序列与包含靶序列的多核苷酸进行最佳比对时，该模板多核苷酸的最近的核苷酸在距离该靶序列的约1、5、10、15、20、25、50、75、100、200、300、400、500、1000、5000、10000个、或更多个核苷酸之内。

在一些实施例中，该核酸靶向效应蛋白是包含一个或多个异源蛋白结构域(例如除了该核酸靶向效应蛋白之外的约或多于约1、2、3、4、5、6、7、8、9、10个、或更多个结构域)的融合蛋白的一部分。在一些实施例中，该CRISPR效应蛋白/酶是包含一个或多个异源蛋白结构域(例如除了该CRISPR酶之外的约或多于约1、2、3、4、5、6、7、8、9、10个、或更多个结构域)的融合蛋白的一部分。CRISPR酶融合蛋白可以包含任何其他蛋白质，以及任选地在任何两个结构域之间的连接序列。可以融合到CRISPR酶上的蛋白质结构域的实例包括但不限于，表位标签、报告基因序列、以及具有下列活性的一者或多者的蛋白质结构域：甲基酶活性、脱甲基酶活性、转录激活活性、转录阻遏活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性和核酸结合活性。表位标签的非限制性实例包括组氨酸(His)标签、V5标签、FLAG标签、流感病毒血凝素(HA)标签、Myc标签、VSV-G标签、和硫氧还蛋白(Trx)标签。报告基因的实例包括，但不限于，谷胱甘肽-S-转移酶(GST)、辣根过氧化物酶(HRP)、氯霉素乙酰转移酶(CAT)、β-半乳糖苷酶、β-葡糖醛酸糖苷酶、萤光素酶、绿色荧光蛋白(GFP)、HcRed、DsRed、青荧光蛋白(CFP)、黄色荧光蛋白(YFP)、以包括蓝色荧光蛋白(BFP)的自发荧光蛋白。CRISPR酶可以融合到编码一种蛋白质或蛋白质片段的基因序列上，所述蛋白质或蛋白质片段结合DNA分子或结合其他细胞分子，其包括，但不限于，麦芽糖结合蛋白(MBP)、S-tag、LexA DNA结合结构域(DBD)融合物、GAL4 DNA结合结构域融合物、以及单纯疱疹病毒(HSV)BP16蛋白融合物。可以形成包含CRISPR酶的融合蛋白的一部分的另外的结构域描述于US20110059502中，通过引用将其并入本文。在一些实施例中，使用标记的CRISPR酶来鉴定靶序列的位置。

在一些实施例中，CRISPR酶可以形成可诱导系统的组分。该系统的诱导性质将允许该系统利用一种能量形式对基因编辑或基因表达进行时空控制。该能量形式可以包括但不限于，电磁辐射、声能、化学能和热能。可诱导系统的实例包括四环素诱导型启动子(Tet-On或Tet-Off)、小分子双杂交体转录激活系统(FKBP、ABA等)或光可诱导系统(光敏素、LOV结构域或隐花色素)。在一个实施例中，该CRISPR酶可以是光可诱导转录效应物(LITE)的一部分，从而以序列特异性方式引导转录活性的变化。光的组分可以包括CRISPR酶、光响应细胞色素异二聚体(例如，来自拟南芥)、以及转录激活/抑制结构域。可诱导的DNA结合蛋白和它们的使用方法的另外实例提供于US 61/736465和US 61/721,283和WO 2014/018423和US8889418、US 8895308、US 20140186919、US 20140242700、US 20140273234、US20140335620、WO 2014093635中，将这些文献通过引用以其全文特此结合。

在一些方面，本发明提供了以下方法，这些方法包括向宿主细胞递送一种或多种多核苷酸，如或如本文描述的一种或多种载体、其一种或多种转录物和/或一种或多种自其转录的蛋白。在一些方面，本发明进一步提供了通过这样的方法产生的细胞以及包括这样的细胞或由这样的细胞产生的生物体(例如动物、植物、或真菌)。在一些实施例中，将与(并且任选地与其复合)指导RNA组合的核酸靶向效应蛋白递送至细胞。可以使用常规的病毒和非病毒基的基因转移方法将核酸引入哺乳动物细胞或靶组织中。可以使用这样的方法向培养物中或宿主生物中的细胞给予编码核酸靶向系统的组分的核酸。非病毒载体递送系统包括DNA质粒、RNA(例如在此描述的载体的转录物)、裸核酸以及与递送赋形剂(如脂质体)复合的核酸。病毒载体递送系统包括DNA和RNA病毒，在被递送至细胞后它们具有游离型或整合型基因组。关于基因疗法程序的综述，参见安德森(Anderson)，《科学》(Science)256:808-813(1992)；纳贝尔(Nabel)&费尔格纳(Felgner)，TIBTECH 11:211-217(1993)；三谷(Mitani)&卡斯基(Caskey)，TIBTECH 11:162-166(1993)；狄龙(Dillon)，TIBTECH 11:167-175(1993)；米勒(Miller)，《自然》(Nature)357:455-460(1992)；范·布朗特(Van Brunt)，《生物技术》(Biotechnology)6(10):1149-1154(1988)；维涅(Vigne)，《恢复神经学和神经科学》(Restorative Neurology and Neuroscience)8:35-36(1995)；克雷默(Kremer)&佩里科德特(Perricaudet)，《英国医学公报》(British Medical Bulletin)51(1):31-44(1995)；哈嗒嗒(Haddada)等人，在《微生物学和免疫学当前主题》(Current Topics inMicrobiology and Immunology)中，多尔夫勒(Doerfler)和博姆(编辑)(1995)；以及余(Yu)等人，《基因疗法》(Gene Therapy)1:13-26(1994)。

核酸的非病毒递送方法包括脂转染、核转染、显微注射、基因枪、病毒颗粒、脂质体、免疫脂质体、聚阳离子或脂质:核酸共轭物、裸DNA、人工病毒体以及DNA的试剂增强性摄取。脂转染描述于例如美国专利号5,049,386、4,946,787；和4,897,355)，并且脂转染试剂是商业销售的(例如Transfectam^TM和Lipofectin^TM)。适于多核苷酸的有效的受体识别脂转染的阳离子和中性脂质包括Felgner(费尔格纳)，WO 91/17424；WO 91/16024的那些。递送可以针对细胞(例如体外或离体给予)或靶组织(例如体内给予)。

脂质:核酸复合物(包括靶向的脂质体，如免疫脂质复合物)的制备是本领域的技术人员熟知的(参见例如，克丽丝特尔(Crystal)，《科学》(Science)270:404-410(1995)；布莱泽(Blaese)等人，《癌症基因疗法》(Cancer Gene Ther.)2:291-297(1995)；贝尔(Behr)等人，《生物共轭化学》(Bioconjugate Chem.)5:382-389(1994)；雷米(Remy)等人，《生物共轭化学》5:647-654(1994)；高(Gao)等人，《基因疗法》(Gene Therapy)2:710-722(1995)；艾哈迈德(Ahmad)等人，《癌症研究》(Cancer Res.)52:4817-4820(1992)；美国专利号4,186,183、4,217,344、4,235,871、4,261,975、4,485,054、4,501,728、4,774,085、4,837,028以及4,946,787)。

使用RNA或DNA病毒基的系统递送核酸利用将病毒靶向体内的特定细胞并将病毒有效负荷(payload)运至细胞核中的高度进化的过程。可以将病毒载体直接给予至患者(体内)或可以使用它们在体外处理细胞，并且任选地，可以将修饰的细胞给予至患者(离体)。常规的病毒基的系统可以包括用于基因转移的逆转录病毒载体、慢病毒载体、腺病毒载体、腺相关病毒载体以及单纯疱疹病毒载体。用逆转录病毒、慢病毒和腺相关病毒基因转移方法整合进宿主基因组中是可能的，这通常导致插入转基因的长期表达。另外，已经在不同细胞类型和靶组织中观察到高转导效率。

可以通过掺入外源包膜蛋白，扩展靶细胞的潜在靶群而改变逆转录病毒的向性。慢病毒载体是能够转导或感染非分裂细胞并典型地产生较高病毒效价的逆转录病毒载体。因此，逆转录病毒基因转移系统的选择将依赖于靶组织。逆转录病毒载体由顺式作用长末端重复组成，这些长末端重复具有包装多达6-10kb的外源序列的能力。最低量的顺式作用LTR对于载体的复制和包装而言是足够的，然后使用这些载体将治疗基因整合进靶细胞中，以提供永久的转基因表达。广泛使用的逆转录病毒载体包括基于鼠白血病病毒(MuLV)、长臂猿白血病病毒(GaLV)、猴免疫缺陷病毒(SIV)、人类免疫缺陷病毒(HIV)及其组合的那些(参见例如，布赫谢尔(Buchscher)等人，《病毒学杂志》(J.Virol.)66:2731-2739(1992)；约翰(Johann)等人，《病毒学杂志》66:1635-1640(1992)；佐姆内尔费尔特(Sommnerfelt)等人，《病毒学》(Virol.)176:58-59(1990)；威尔逊(Wilson)等人，《病毒学杂志》63:2374-2378(1989)；米勒(Miller)等人，《病毒学杂志》65:2220-2224(1991)；PCT/US 94/05700)。在瞬时表达是优选的应用中，可以使用腺病毒基系统。腺病毒基载体在许多细胞类型中能够具有非常高的转导效并且无需细胞分裂。用这样的载体，已经获得了较高的效价和表达水平。可以在相对简单的系统中大量地产生此载体。还可以使用腺相关病毒(“AAV”)载体转导具有靶核酸的细胞，例如，在体外产生核酸和肽，以及用于体内和离体基因疗法程序(参见例如，韦斯特(West)等人，《病毒学》(Virology)160:38-47(1987)；美国专利号4,797,368；WO 93/24641；科丁(Kotin)，《人类基因疗法》(Human Gene Therapy)5:793-801(1994)；缪斯科斯卡(Muzyczka)，《临床研究杂志》(J.Clin.Invest.)94:1351(1994))。重组AAV载体的构建描述于多个出版物中，包括美国专利号5,173,414；特拉特斯金(Tratschin)等人，《分子与细胞生物学》(Mol.Cell.Biol.)5:3251-3260(1985)；特拉特斯金等人，《分子与细胞生物学》(Mol.Cell.Biol.)4:2072-2081(1984)；埃尔莫奈特(Hermonat)&缪斯科斯卡(Muzyczka)，《美国国家科学院院刊》(PNAS)81:6466-6470(1984)；以及萨穆尔斯基(Samulski)等人，《病毒学杂志》(J.Virol.)63:03822-3828(1989)。

一般递送

本发明涉及经由至少一种纳米粒子复合物递送的CRISPR复合物的至少一个种组分(例如，RNA)。在一些方面，本发明提供了以下方法，这些方法包括向宿主细胞递送一种或多种多核苷酸，如或如在此描述的一种或多种载体、其一种或多种转录物和/或一种或多种自其转录的蛋白。在一些方面，本发明进一步提供了通过这样的方法产生的细胞以及包括这样的细胞或由这样的细胞产生的动物。在一些实施例中，将与(并且任选地与其复合)指导序列组合的CRISPR酶递送至细胞。可以使用常规的病毒和非病毒基的基因转移方法将核酸引入哺乳动物细胞或靶组织中。可以使用这样的方法向培养物中或宿主生物中的细胞给予编码CRISPR系统的组分的核酸。非病毒载体递送系统包括DNA质粒、RNA(例如在此描述的载体的转录物)、裸核酸以及与递送赋形剂(如脂质体)复合的核酸。病毒载体递送系统包括DNA和RNA病毒，在被递送至细胞后它们具有游离型或整合型基因组。关于基因疗法程序的综述，参见安德森(Anderson)，《科学》(Science)256:808-813(1992)；纳贝尔(Nabel)&费尔格纳(Felgner)，TIBTECH11:211-217(1993)；三谷(Mitani)&卡斯基(Caskey)，TIBTECH 11:162-166(1993)；狄龙(Dillon)，TIBTECH11:167-175(1993)；米勒(Miller)，《自然》(Nature)357:455-460(1992)；范·布朗特(Van Brunt)，《生物技术》(Biotechnology)6(10):1149-1154(1988)；维涅(Vigne)，《恢复神经学和神经科学》(Restorative Neurologyand Neuroscience)8:35-36(1995)；克雷默(Kremer)&佩里科德特(Perricaudet)，《英国医学公报》(British Medical Bulletin)51(1):31-44(1995)；哈嗒嗒(Haddada)等人，在《微生物学和免疫学当前主题》(Current Topics in Microbiology and Immunology)中多尔夫勒(Doerfler)和博姆(编辑)(1995)；以及余(Yu)等人，《基因疗法》(GeneTherapy)1:13-26(1994)。

核酸的非病毒递送方法包括脂转染、显微注射、基因枪、病毒颗粒、脂质体、免疫脂质体、聚阳离子或脂质：核酸共轭物、裸DNA、人工病毒体以及DNA的试剂增强的摄取。脂转染描述于例如美国专利号5,049,386、4,946,787；和4,897,355)，并且脂转染试剂是商业销售的(例如Transfectam^TM和Lipofectin^TM)。适于多核苷酸的有效的受体识别脂转染的阳离子和中性脂质包括Felgner(费尔格纳)，WO 91/17424；WO 91/16024的那些。递送可以针对细胞(例如体外或离体给予)或靶组织(例如体内给予)。

可以通过掺入外源包膜蛋白，扩展靶细胞的潜在靶群而改变逆转录病毒的向性。慢病毒载体是能够转导或感染非分裂细胞并典型地产生较高病毒效价的逆转录病毒载体。因此，逆转录病毒基因转移系统的选择将依赖于靶组织。逆转录病毒载体由顺式作用长末端重复组成，这些长末端重复具有包装多达6-10kb的外源序列的能力。最低量的顺式作用LTR对于载体的复制和包装而言是足够的，然后使用这些载体将治疗基因整合进靶细胞中，以提供永久的转基因表达。广泛使用的逆转录病毒载体包括基于鼠白血病病毒(MuLV)、长臂猿白血病病毒(GaLV)、猴免疫缺陷病毒(SIV)、人类免疫缺陷病毒(HIV)及其组合的那些(参见例如，布赫谢尔(Buchscher)等人，《病毒学杂志》(J.Virol.)66:2731-2739(1992)；约翰(Johann)等人，《病毒学杂志》66:1635-1640(1992)；佐姆内尔费尔特(Sommnerfelt)等人，《病毒学》(Virol.)176:58-59(1990)；威尔逊(Wilson)等人，《病毒学杂志》63:2374-2378(1989)；米勒(Miller)等人，《病毒学杂志》65:2220-2224(1991)；PCT/US 94/05700)。

在另一个实施例中，考虑了科卡尔(Cocal)水泡性病毒包膜假型逆转录病毒载体颗粒(参见例如，转让给弗雷德·哈钦森癌症研究中心(Fred Hutchinson CancerResearch Center)的美国专利公开号20120164118)。科卡尔病毒属于水泡性病毒属，并且是一种哺乳动物水泡性口炎病原体。科卡尔病毒最初分离自特立尼达拉岛(Trinidad)的螨(琼克斯(Jonkers)等人，《美国兽医研究杂志》(Am.J.Vet.Res.)25:236-242(1964))，并且已经在特立尼达拉岛、巴西和阿根廷从昆虫、牛和马体内鉴定出感染。已经从天然地感染的节肢动物体内分离出感染哺乳动物的水泡性病毒中的许多，表明它们是媒介传播的。水疱性病毒抗体在居住于这些病毒是地方性的且是实验室获得的农村地区的人中间是常见的；人类感染通常导致流感样症状。科卡尔病毒包膜糖蛋白在氨基酸水平上与印第安纳VSV-G(VSV-G Indiana)具有71.5％一致性，并且水疱性病毒的包膜基因的系统发育比较显示科卡尔病毒在血清学上与印第安纳VSV-G株不同，但是在水疱性病毒中间与其最密切相关。琼克斯(Jonkers)等人，《美国兽医研究杂志》(Am.J.Vet.Res.)25:236-242(1964)和特拉瓦索德罗萨(Travassos da Rosa)等人，《美国热带药学与卫生学杂志》(Am.J.Tropical Med.&Hygiene)33:999-1006(1984)。科卡尔水疱性病毒包膜假型逆转录病毒载体颗粒可以包括例如慢病毒、α逆转录病毒、β逆转录病毒、γ逆转录病毒、δ逆转录病毒以及ε逆转录病毒载体颗粒，这些颗粒可以包括逆转录病毒Gag、Pol和/或一种或多种辅助蛋白以及科卡尔水疱性病毒包膜蛋白。在这些实施例的某些方面内，Gag、Pol和辅助蛋白是慢病毒的和/或γ逆转录病毒的。本发明提供了包含或基本上由编码CRISPR系统的外源核酸分子组成的AAV，例如，多个盒，该多个盒包括第一盒或由其组成，该第一盒包括或基本上由启动子、编码CRISPR相关(Cas)蛋白(假定的核酸酶或解旋酶蛋白)(例如，Cas9)的核酸分子和终止子组成，以及两个或更多个，有利地直到载体的包装尺寸极限，例如总共(包括第一盒)五个盒，这些盒包括或基本上由启动子、编码指导RNA(gRNA)的核酸分子和终止子组成(例如，每个盒示意性地由启动子-gRNA1-终止子、启动子-gRNA2-终止子...启动子-gRNA(N)-终止子表示(其中N是可以插入的处于载体的包装尺寸极限的上限的数目))，或两个或更多个单独的rAAV，每个rAAV包含一个或多于一个CRISPR系统盒，例如，第一rAAV包含第一盒，该第一盒包括或基本上由启动子、编码Cas(例如，Cas9)的核酸分子和终止子组成，并且第二rAAV包含多个，四个，盒，这些盒包括或基本上由启动子、编码指导RNA(gRNA)的核酸分子和终止子组成(例如，每个盒示意性地由启动子-gRNA1-终止子、启动子-gRNA2-终止子...启动子-gRNA(N)-终止子表示(其中N是可以插入的处于载体的包装尺寸极限的上限的数目))。由于rAAV是一种DNA病毒，因此涉及AAV或rAAV的在此讨论中的核酸分子有利地是DNA。在一些实施例中，启动子有利地是人类突触蛋白I启动子(hSyn)。用于将核酸递送至细胞的另外的方法是本领域的技术人员已知的。参见例如通过引用结合在此的US 20030087817。

在一些实施例中，用一种或多种在此描述的载体瞬时地或非瞬时地转染宿主细胞。在一些实施例中，当细胞天然地出现在受试者体内时将其转染。在一些实施例中，被转染的细胞取自受试者。在一些实施例中，该细胞来源于取自受试者的细胞，如细胞系。用于组织培养的多种多样的细胞系在本领域是已知的。细胞系的实例包括但不限于，C8161、CCRF-CEM、MOLT、mIMCD-3、NHDF、海拉-S3、Huh1、Huh4、Huh7、HUVEC、HASMC、HEKn、HEKa、MiaPaCell、Panc1、PC-3、TF1、CTLL-2、C1R、Rat6、CV1、RPTE、A10、T24、J82、A375、ARH-77、Calu1、SW480、SW620、SKOV3、SK-UT、CaCo2、P388D1、SEM-K2、WEHI-231、HB56、TIB55、Jurkat、J45.01、LRMB、Bcl-1、BC-3、IC21、DLD2、Raw264.7、NRK、NRK-52E、MRC5、MEF、Hep G2、海拉B、海拉T4、COS、COS-1、COS-6、COS-M6A、BS-C-1猴肾上皮细胞、BALB/3T3小鼠胚胎成纤维细胞、3T3Swiss、3T3-L1、132-d5人类胎儿成纤维细胞；10.1小鼠成纤维细胞、293-T、3T3、721、9L、A2780、A2780ADR、A2780cis、A172、A20、A253、A431、A-549、ALC、B16、B35、BCP-1细胞、BEAS-2B、bEnd.3、BHK-21、BR 293、BxPC3、C3H-10T1/2、C6/36、Cal-27、CHO、CHO-7、CHO-IR、CHO-K1、CHO-K2、CHO-T、CHO Dhfr-/-、COR-L23、COR-L23/CPR、COR-L23/5010、COR-L23/R23、COS-7、COV-434、CML T1、CMT、CT26、D17、DH82、DU145、DuCaP、EL4、EM2、EM3、EMT6/AR1、EMT6/AR10.0、FM3、H1299、H69、HB54、HB55、HCA2、HEK-293、海拉、Hepa1c1c7、HL-60、HMEC、HT-29、Jurkat、JY细胞、K562细胞、Ku812、KCL22、KG1、KYO1、LNCap、Ma-Mel 1-48、MC-38、MCF-7、MCF-10A、MDA-MB-231、MDA-MB-468、MDA-MB-435、MDCK II、MDCK II、MOR/0.2R、MONO-MAC 6、MTD-1A、MyEnd、NCI-H69/CPR、NCI-H69/LX10、NCI-H69/LX20、NCI-H69/LX4、NIH-3T3、NALM-1、NW-145、OPCN/OPCT细胞系、Peer、PNT-1A/PNT 2、RenCa、RIN-5F、RMA/RMAS、Saos-2细胞、Sf-9、SkBr3、T2、T-47D、T84、THP1细胞系、U373、U87、U937、VCaP、维洛(Vero)细胞、WM39、WT-49、X63、YAC-1、YAR及其转基因变种。细胞系可获得自本领域的技术人员已知的多种来源(参见例如，美国典型培养物保藏中心(American Type Culture Collection)(ATCC)(马纳萨斯(Manassus)，弗吉尼亚州))。在一些实施例中，使用用一种或多种在此描述的载体转染的细胞建立新的细胞系，该新的细胞系包括一种或多种载体来源的序列。在一些实施例中，使用用如在此描述的CRISPR系统的组分转染(如通过用一种或多种载体进行瞬时转染或用RNA进行转染)且通过CRISPR复合物的活性修饰的细胞建立新的细胞系，该新的细胞系包括以下细胞，这些细胞包含吸水但是缺少任何其他外源序列。在一些实施例中，在评估一种或多种测试化合物中使用用一种或多种在此描述的载体瞬时或非瞬时转染的细胞或来源于这样的细胞的细胞系。

在一些实施例中，使用一种或多种在此描述的载体产生非人转基因动物或转基因植物。在一些实施例中，该转基因动物是一种哺乳动物，如小鼠、大鼠或兔。用于产生转基因动物和植物的方法在本领域是已知的，并且通常以如在此描述的细胞转染方法开始。在另一个实施例中，可以考虑用具有针阵列的流体递送装置(参见例如，转让给弗雷德·哈钦森癌症研究中心的美国专利公开号20110230839)将CRISPR Cas递送至实体组织。用于将流体递送至实体组织的美国专利公开号20110230839的装置可以包括多个排列为阵列的针；多个储库，每个储库都与该多个针中的对应的针处于流体联通；以及多个致动器，这些致动器有效地耦合至该多个储库中的对应的储库并被配置为控制该储库内的流体压力。在某些实施例中，该多个致动器中的每个都可以包括多个柱塞中的一个，该多个柱塞中的每个的第一端都被接收进该多个储库中的对应的储库中，并且在某些另外的实施例中，该多个柱塞中的柱塞在其对应的第二端被有效地耦合在一起，以便可以同时被按下。某些仍另外的实施例可以包括一个柱塞驱动器，该柱塞驱动器被配置为以选择性地可变速率按下所有该多个柱塞。在其他实施例中，该多个致动器中的每个都可以包括多个流体传输线中的一个，这些流体传输线具有第一和第二端，该多个流体传输线中的每个的第一端被耦合至该多个储库中的对应的储库。在其他实施例中，该装置可以包括一个流体压力源，并且该多个致动器中的每个在该流体压力源与该多个储库中的对应的储库之间都包括一个液压耦合器。在另外的实施例中，该流体压力源可以包括压缩机、真空蓄能器、蠕动泵、主缸、微流体泵以及阀中的至少一个。在另一个实施例中，该多个针中的每个都可以包括多个沿其长度分布的端口。

递送至肾脏

针对肾脏的递送方法总结如下：

递送到脑

用于脑的递送选项包括将处于DNA或RNA形式的CRISPR酶和指导RNA封装到脂质体中并且结合到用于跨血脑屏障(BBB)递送的分子特洛伊木马上。分子特洛伊木马已经显示对于将B-gal表达载体递送到非人类灵长动物的脑中是有效的。可以使用相同的途径来递送含有CRISPR酶和指导RNA的递送载体。例如，夏CF(Xia CF)和博阿多RJ(Boado RJ)、帕德瑞吉WM(Pardridge WM)“使用亲和素-生物素技术经由人胰岛素受体的siRNA的抗体介导的靶向”(“Antibody-mediated targeting of siRNA via the human insulin receptorusing avidin-biotin technology.”《分子药理学》(Mol Pharm.)2009年5月-6月；6(3):747-51.doi:10.1021/mp800194)描述了如何将短干扰RNA(siRNA)递送到培养物中以及体内的细胞，并且可以与受体特异性单克隆抗体(mAb)和亲和素-生物素技术联合使用。作者还报道，就亲和素-生物素技术而言，由于在靶向mAb与siRNA之间的键是稳定的，在静脉给予该靶向的siRNA之后，体内观察到在远处部位(例如脑)的RNAi效应。

张(Zhang)等人(《分子治疗学》(Mol Ther.)2003年1月；7(1):11-8.))描述了编码报道分子如萤光素酶的表达质粒如何被包封在“人工病毒”的内部，该“人工病毒”包含85nm的聚乙二醇化的免疫脂质体，其在体内与针对人胰岛素受体(HIR)的单克隆抗体(MAb)一起靶向到恒河猴脑。该HIRMAb使得携带外源基因的脂质体在静脉注射之后经历跨血脑屏障的转胞吞作用和跨神经元质膜的胞吞作用。与大鼠比较，在恒河猴的脑中的萤光素酶基因表达水平高50倍。通过组织化学和共聚焦显微镜检查都证明了β-半乳糖苷酶基因在灵长动物脑中的广泛神经元表达。作者指明，这种途径使得在24小时内的可逆成年转基因可行。因此，免疫脂质体的使用是优选的。这些可以与抗体结合靶向特定的组织或细胞表面蛋白。

HSC-递送到造血干细胞并编辑造血干细胞；以及具体条件

术语“造血干细胞”或“HSC”是指包括那些广泛地被认为是HSC的细胞，例如产生全部其他血细胞并且衍生自中胚层的位于红骨髓(包含于大多数骨的核心中)中的血细胞。本发明的HSC包括具有造血干细胞的表型的细胞，这些细胞通过以下项来鉴定：小尺寸，缺乏谱系(lin)标记，以及属于分化系列簇的标记例如CD34、CD38、CD90、CD133、CD105、CD45、以及还有c-kit(-干细胞因子的受体)。造血干细胞对于用于检测谱系定型的标记是阴性的，并且因此称为Lin-；并且通过FACS对它们进行纯化过程中，多个高达14种不同的成熟血液-谱系标记，例如人类的CD13&CD33(针对髓系)、CD71(针对红系)、CD19(针对B细胞)、CD61(针对巨核细胞)等；以及B220(鼠类CD45)(针对B细胞)、Mac-1(CD11b/CD18)(针对单核细胞)、Gr-1(针对粒细胞)、Ter119(针对红系细胞)、Il7Ra、CD3、CD4、CD5、CD8(针对T细胞)等。小鼠HSC标记：CD34lo/-、SCA-1+、Thy1.1+/lo、CD38+、C-kit+、lin-，和人类HSC标记：CD34+、CD59+、Thy1/CD90+、CD38lo/-、C-kit/CD117+、和lin-。HSC是通过标记来鉴定。因此，本文处讨论的实施例中，HSC可以是CD34+细胞。HSC还可以是呈CD34-/CD38-的造血干细胞。在本领域中被认为是HSC的可缺乏细胞表面上的c-kit的干细胞是在本发明的范围内，并且CD133+细胞在本领域中也被认为是HSC。

该CRISPR-Cas(例如Cas9)系统可以被工程化为靶向HSC中的一个或多个基因座位。可以制备有利地针对真核细胞并且尤其是哺乳动物细胞(例如人类细胞，如HSC)经密码子优化的Cas(例如，Cas9)蛋白以及靶向HSC中的一个或多个座位(例如基因EMX1)的sgRNA。这些可以经由粒子递送。这些颗粒可以通过混合的Cas(例如Cas9)蛋白和sgRNA形成。sgRNA和Cas(例如Cas9)蛋白混合物可以例如与以下混合物混合，该混合物包含表面活性剂、磷脂、生物可降解聚合物、脂蛋白和醇或基本上由其组成或由其组成，由此可以形成含有sgRNA和Cas(例如Cas9)蛋白的粒子。本发明包括如此制备的粒子和来自这样一种方法的粒子及其用途。

更一般地说，可以使用有效工艺形成粒子。首先，可以将Cas(例如Cas9)蛋白以及靶向基因EMX1或对照基因LacZ的sgRNA以适合的(例如，3:1至1:3或2:1至1:2或1:1)摩尔比，在适合的温度(例如，15-30C，例如，20-25C，例如，室温)下混合在一起持续适合的时间(例如，15-45，如30分钟)，有利的是在无菌、无核酸酶缓冲液中(例如，1X PBS)。分开地，粒子组分如或包含：表面活性剂(例如，阳离子脂质(例如，1,2-二油酰基-3-三甲基铵-丙烷(DOTAP)))；磷脂(例如，二肉豆蔻磷脂酰胆碱(DMPC))；可生物降解的聚合物(例如，乙二醇聚合物或PEG)、以及脂蛋白，如低密度脂蛋白，例如，胆固醇可溶解于醇中，有利的是C1-6烷基醇，如甲醇、乙醇、异丙醇，例如，100％乙醇。将这两种溶液可以混合在一起以形成含有Cas(例如Cas9)-sgRNA复合物的粒子。在某些实施例中，该粒子可以含有HDR模板。其可以是与含有sgRNA+Cas(例如Cas9)蛋白的粒子共给予的粒子，或即，除使HSC与含有sgRNA+Cas(例如Cas9)蛋白的粒子接触之外，使HSC与含有HDR模板的粒子接触；或者使该HSC与含有全部的该sgRNA、Cas(例如Cas9)和该HDR模板的粒子接触。该HDR模板可以通过分开的载体给予，由此在第一实例中，该粒子穿透HSC细胞并且该分开的载体也穿透该细胞，其中该HSC基因组被sgRNA+Cas(例如Cas9)修饰并且该HDR模板也存在，由此基因组座位被该HDR修饰；例如，这可以导致突变的校正。

在这些粒子形成之后，可以将96孔板中的HSC用15ug Cas(例如Cas9)蛋白/孔进行转染。转染后三天，可以收获HSC，并且可以对在EMX1座位处的插入和缺失(indel)的数目进行量化。

这说明了HSC如何可以使用靶向HSC中一个或多个感兴趣基因组座位的CRISPR-Cas(例如Cas9)来修饰。有待修饰的HSC可以是在体内，即在生物中，例如人类或非人类真核细胞，例如动物，如鱼，如斑马斑马鱼；哺乳动物，例如灵长类，如猿、黑猩猩、猕猴；啮齿动物，如小鼠、大鼠；犬或狗；家畜(母牛/牛、绵羊/绵羊、山羊或猪)；飞禽或家禽，例如小鸡。有待修饰的HSC可以是在体外、即这种生物的外部。并且，可以离体使用修饰的HSC，即这种生物的一种或多种HSC可以获得或分离自生物，任选地该一种或多种HSC可以扩增，该一种或多种HSC是由包括靶向HSC中一个或多个基因座位的CRISPR-Cas(例如Cas9)的组合物修饰，例如通过：使该一种或多种HSC与该组合物接触，例如其中该组合物包括含有CRISPR酶以及靶向HSC中的一个或多个基因座位的一种或多种sgRNA的粒子，例如通过将sgRNA和Cas(例如Cas9)蛋白混合物与包含表面活性剂、磷脂、生物可降解聚合物、脂蛋白和醇或基本上由其组成或由其组成的混合物进行混合来获得或可获得的粒子(其中一种或多种sgRNA靶向HSC中的一个或多个基因座位)；任选地扩增所得的经修饰HSC并且向该生物给予所得的经修饰HSC。在一些情况下，分离或获得的HSC可以是来自第一生物(如来自与第二生物是相同物种的生物)，并且该第二生物可以是给予所得的经修饰的HSC的生物，例如该第一生物可以是对第二生物的供体(例如，如在亲本或同族成员中的亲缘物)。修饰的HSC可以具有遗传修饰以解决或减轻或降低个体或受试者或患者的疾病或病况状态的症状。修饰的HSC，例如在对第二生物的第一生物供体的情况下，可以具有遗传修饰，以使HSC具有一种或多种蛋白，例如更像第二生物的表面标记或蛋白。修饰的HSC可以具有遗传修饰以模拟个体或受试者或患者的疾病或病况状态，并且会重给予至非人类生物以制备动物模型。根据本披露和本领域中的知识，HSC的扩增是在本领域技术人员的范围内，参见例如李(Lee)，“通过克服CUL4介导的HOXB4的降解对成于人造血干细胞的改进的离体扩增(Improved ex vivoexpansion of adult hematopoietic stem cells by overcoming CUL4-mediateddegradation of HOXB4.)”《血液》(blood).2013年5月16日；121(20):4082-9.doi:10.1182/blood-2012-09-455204.电子公开于2013年3月21日。

如所指示的为了改善活性，在粒子中配制整个复合物之前，sgRNA可以与Cas(例如Cas9)蛋白预复合。可以制备具有不同摩尔比的不同已知组分的配制品，以促进将核酸递送到细胞(例如1,2-二油酰基-3-三甲基铵-丙烷(DOTAP)、1,2-二十四酰基-sn-甘油-3-磷酸胆碱(DMPC)、聚乙二醇(PEG)和胆固醇)。例如，DOTAP:DMPC:PEG:胆固醇摩尔比可以是DOTAP100，DMPC 0，PEG 0，胆固醇0；或DOTAP 90、DMPC 0、PEG 10、胆固醇0；或DOTAP 90、DMPC 0、PEG 5、胆固醇5。DOTAP 100、DMPC 0、PEG 0、胆固醇0。因此本发明包括混合sgRNA、Cas(例如Cas9)蛋白以及形成粒子的组分；连同来自此类混合的粒子。

在一个优选实施例中，含有Cas(例如Cas9)-sgRNA复合物的粒子可以通过将Cas(例如Cas9)蛋白与一个或多个sgRNA混合在一起来形成，优选按1:1的摩尔比，酶:指导RNA。分开地，优选地将这些已知能促进核酸递送的不同组分(例如，DOTAP、DMPC、PEG、以及胆固醇)溶解于乙醇中。将这两种溶液混合在一起以形成含有Cas(例如Cas9)-sgRNA复合物的粒子。在粒子形成之后，可以将Cas(例如Cas9)-sgRNA复合物转染到细胞中(例如，HSC)。可以应用条形编码。可以使这些粒子、Cas-9和/或sgRNA带条形码。

在一个实施例中，本发明包括制备含有sgRNA-和-Cas(例如Cas9)蛋白的粒子的方法，该方法包括将sgRNA和Cas(例如Cas9)蛋白混合物与包括或基本上由表面活性剂、磷脂、可生物降解的聚合物、脂蛋白及醇组成或由其组成的混合物进行混合。一个实施例包括来自该方法的含有sgRNA-和-Cas(例如Cas9)蛋白的粒子。在一个实施例中，本发明包括该粒子在通过操纵感兴趣基因组座位中的靶序列来修饰感兴趣基因组座位、或生物或非人类生物的方法中的用途，该方法包括将包含该感兴趣基因组座位的细胞与该粒子接触，其中sgRNA靶向该感兴趣基因组座位；或在通过操纵感兴趣基因组座位中的靶序列来修饰感兴趣基因组座位、或生物或非人类生物的方法中的用途，该方法包括使包含该感兴趣基因组座位的细胞与该粒子接触，其中该sgRNA靶向该感兴趣基因组座位。在这些实施例中，感兴趣的基因组座位有利地是HSC中的基因组座位。

对于治疗应用的考虑：基因组编辑疗法中的考虑是序列特异性核酸酶的选择，例如Cas9核酸酶的变体。每个核酸酶变体可以具有自己一套独特的长处和短处，其中的许多必须在治疗的背景下平衡以最大化治疗益处。迄今，两种使用核酸酶的治疗性编辑方法已经显示出显着的前景：基因破坏和基因校正。基因破坏涉及刺激NHEJ以在遗传组件中产生靶向的indel，这通常导致对患者而言有益的功能缺失突变。相比之下，基因校正使用HDR将致病突变直接逆转，从而恢复功能同时保留经校正组件的生理调节。HDR还可以用于将治疗性转基因插入基因组中的限定“安全港”座位中，以恢复丢失的基因功能。为了使得特异性编辑治疗有效，在靶细胞群中必须达到足够高水平的修饰以逆转疾病症状。这种治疗性修饰的‘阈值’通过治疗后经编辑的细胞的健康度、和逆转症状所需的基因产物的量来确定。关于健康度，相对于它们的未编辑对应物，编辑对经处理的细胞产生三种潜的在结果：增加、中性或降低的健康度。在健康度增加的情况下，例如在SCID-X1的治疗中，相对于其未编辑的对应物，修饰的造血祖细胞选择性地扩增。SCID-X1是一种由IL2RG基因的突变引起的疾病，该基因的功能为造血淋巴细胞谱系的适当发育所需[伦纳德(Leonard)，W.J.等人《免疫学综述》(Immunological reviews)138，61-86(1994)；考杉斯基(Kaushansky)，K.&威廉姆斯(Williams)，W.J.威廉姆斯(Williams)《血液学》(hematology)，(麦格劳-希尔医学部(McGraw-Hill Medical)，纽约，2010)]。在通过接受针对SCID-X1的病毒基因疗法的患者和SCID-X1突变的自发校正的罕见实例进行的临床试验中，经校正造血祖细胞可以能够克服这种发育阻断并且相对于其患病对应物扩增以介导治疗[布索(Bousso)，P.等人《美国国家科学院院刊》(Proceedings of the National Academy of Sciences of the UnitedStates of America)97，274-278(2000)；哈赛因-贝-阿比纳(Hacein-Bey-Abina)，S.等人《新英格兰医学杂志》(The New England journal of medicine)346，1185-1193(2002)；加斯帕(Gaspar)，H.B.等人《柳叶刀》(Lancet)364，2181-2187(2004)]。在经编辑细胞具有选择性优势的情况下，甚至低数量的经编辑细胞也可以通过扩增而增多，从而为患者提供治疗益处。相比之下，针对其他造血疾病(像慢性肉芽肿病(CGD))的编辑对于经编辑的造血祖细胞而言没有诱导健康度方面的变化，从而提高治疗性修饰的阈值。CGD是由编码吞噬细胞氧化酶蛋白的基因的突变引起的，这些蛋白通常被嗜中性粒细胞用于产生杀死病原体的活性氧[慕克吉(Mukherjee)，S.&思拉舍(Thrasher)，A.J.《基因》(Gene)525，174-181(2013)]。因为这些基因的功能障碍不影响造血祖细胞健康度或发育，而是仅仅影响成熟造血细胞类型抵抗感染的能力，所以经编辑的细胞在这种疾病中不可能优先扩增。的确，在基因疗法试验中已经观察到在CGD中的基因校正细胞中没有选择性优势，从而造成长期细胞植入困难[梅尔施(Malech)，H.L.等人《美国国家科学院院刊》(Proceedings of theNational Academy of Sciences of the United States of America)94，12133-12138(1997)；康(Kang)，H.J.等人《分子疗法：美国基因治疗学会杂志》(Molecular therapy:thejournal of the American Society of Gene Therapy)19，2092-2101(2011)]。因此，相对于编辑产生增加的靶细胞健康度的疾病，治疗编辑产生中性健康度优势的疾病(像CGD)将需要显着更高水平的编辑。如果编辑赋予健康度劣势，正如恢复癌细胞中的肿瘤抑制基因的功能的情况，经修饰的细胞被其患病对应物胜过，从而使得治疗益处相对于编辑率而言较低。后一类别的疾病特别难以用基因组编辑疗法进行治疗。

除细胞健康度之外，治疗疾病所必需的基因产物的量也影响用于逆转症状所必须达到的治疗性基因组编辑的最低水平。B型血友病是一种基因产物水平的小变化可以导致临床结果的显着变化的疾病。这种疾病是由编码因子IX的基因的突变引起的，所述因子是一种通常由肝脏分泌进入血液的蛋白质，在血液中它作为凝血级联的组分起作用。B型血友病的临床严重性与因子IX活性的量相关。严重疾病与低于1％的正常活性相关，较轻形式的疾病与高于1％的因子IX活性相关[考杉斯基(Kaushansky)，K.&威廉姆斯(Williams)，W.J.威廉姆斯(Williams)《血液学》(hematology)，(麦格劳-希尔医学部(McGraw-HillMedical)，纽约，2010)；洛夫基思特(Lofqvist)，T.等人《内科医学杂志》(Journal ofinternal medicine)241，395-400(1997)]。这表明可以在甚至小百分比的肝细胞中恢复因子IX表达的编辑疗法对临床结果可以具有大的影响。一项使用ZFN校正出生后不久的B型血友病小鼠模型的研究证明3％-7％的校正足以逆转疾病症状，从而为这一假设提供了临床前证据[李(Li)，H.等人《自然》(Nature)475，217-221(2011)]。

基因产物水平的小变化便可以影响临床结果的障碍以及经编辑的细胞存在健康度优势的疾病是基因组编辑疗法的理想靶标，因为治疗性修饰的阈值足够低以允许给出当前技术的成功机会较高。靶向这些疾病现在已经在临床前水平和I期临床试验下取得了编辑治疗的成功。需要改进DSB修复途径操纵和核酸酶递送，以将这些有希望的结果扩展到对于经编辑的细胞而言具有中性健康度优势或需要较大量的基因产物用于治疗的疾病。下表示出了基因组编辑应用于治疗模型的一些实例，并且特此通过引用结下表的参考和那些参考中引用的文献，就如同全部列出一样。

使用CRISPR-Cas(例如Cas9)系统来靶向，通过HDR介导的对突变的校正或HDR介导的插入正确的基因序列，有利地经由如本文的递送系统例如粒子递送系统，解决前述表格的病况中的每一个，这根据本披露和本领域中的知识是在本领域技术人员的范围内。因此，一个实施例包括使携带B型血友病、SCID(例如，SCID-X1、ADA-SCID)或遗传性酪氨酸血症突变的HSC与靶向感兴趣的基因组座位的sgRNA-和-Cas(例如Cas9)蛋白接触，就B型血友病、SCID(例如，SCID-X1、ADA-SCID)或遗传性酪氨酸血症而言(例如，如在李(Li)、吉诺维斯(Genovese)或印(Yin)中的)。该粒子还可以包含适合的HDR模板，以校正突变；或HSC可以与包含或递送HDR模板的第二粒子或载体接触。在此方面，可提及的是B型血友病是一种由编码因子IX的基因的功能缺失突变引起的X连锁隐性障碍，所述因子是凝血级联的关键组分。将受严重影响个体体内的因子IX活性恢复到高于1％的其水平可以将该疾病转化为显着更轻的形式，因为从年幼时预防性地向此类患者体内输注重组因子IX达到此类水平在很大程度上改善临床并发症。根据本领域的知识和本披露的教导，就B型血友病而言，本领域技术人员可以使用靶向并校正突变(由编码因子IX的基因的功能缺失突变引起的X连锁隐性障碍)的CRISPR-Cas(例如Cas9)系统来校正HSC(例如，用递送因子IX的编码序列的适合的HDR模板)；确切地说，sgRNA可以靶向引起B型血友病的突变，并且HDR可以为因子IX的正确表达提供编码。将包含靶向突变-和-Cas(例如Cas9)蛋白的sgRNA的粒子与携带突变的HSC进行接触。该粒子还可以包含适合的HDR模板，以校正因子IX的适当表达的突变；或HSC可以与包含或递送HDR模板的第二粒子或载体接触。可以将这样接触的细胞给予；并且任选地处理/扩增。参见卡地亚(Cartier)，如本文讨论。

在卡地亚(Cartier)，“小型研讨会：X连锁肾上腺脑白质营养不良，造血干细胞移植和X连锁肾上腺脑白质营养不良中的造血干细胞基因疗法(MINI-SYMPOSIUM:X-LinkedAdrenoleukodystrophypa，Hematopoietic Stem Cell Transplantation andHematopoietic Stem Cell Gene Therapy in X-Linked Adrenoleukodystrophy)”，《脑病理学》(Brain Pathology)20(2010)857-862，通过引用并入本文连同它引用的文献，如同完整地陈述一样中，认识到异体造血干细胞移植(HSCT)用于向患有贺勒氏症(Hurler’sdisease)的患者的脑中递送正常的溶酶体酶并且存在关于用于治疗ALD的HSC基因疗法的讨论。在两个患者中，在粒细胞-集落刺激因子(G-CSF)动员后收集外周CD34+细胞，并且用骨髓增殖性肉瘤病毒增强子(缺失阴性对照区的dl587rev引物结合位点取代的(MND)-ALD慢病毒载体)进行转导。在低浓度的细胞因子的存在下，在6h期间用MND-ALD载体转导来自患者的CD34+细胞。转导之后将转导的CD34+细胞冷冻，以在5％的细胞上进行各种安全性测试，这些测试具体地包括三种复制感受态慢病毒(RCL)测定。CD34+细胞的转导效力的范围是从35％至50％，其中慢病毒整合拷贝的平均数目在0.65与0.70之间。将转导的CD34+细胞解冻之后，在用白消安和环磷酰胺完全清髓后，以每kg多于4.106个转导的CD34+细胞再输注到患者体内。将患者的HSC消除，以有利于经基因校正的HSC的植入。对于这两个患者而言，在第13天与15天之间发生血液学恢复。对于第一患者而言，在第12个月发生几乎完全的免疫恢复，并且对于第二患者而言发生在第9个月。与使用慢病毒相对照，根据本领域的知识和本披露的教导，就ALD而言，本领域技术人员可以使用靶向并校正突变的CRISPR-Cas(Cas9)系统来校正HSC(例如，用适合的HDR模板)；确切地说，sgRNA可以靶向ABCD1(位于X染色体上的编码ALD(一种过氧化物酶体膜转运体蛋白)的基因)中的突变，并且HDR可以为该蛋白质的正确表达提供编码。将包含靶向突变-和-Cas(Cas9)蛋白的sgRNA的粒子与携带突变的HSC(例如CD34+细胞)进行接触，如在卡地亚(Cartier)中的。该粒子还可以包含适合的HDR模板，以校正用于过氧化物酶体膜转运蛋白的表达的突变；或HSC可以与包含或递送HDR模板的第二粒子或载体接触。如此接触的细胞任选地可以如在卡地亚(Cartier)中的进行处理。如此接触的细胞可以如在卡地亚(Cartier)中的进行给予。

在患者恶性肿瘤中嵌合抗原受体(CAR)19T-细胞展现抗白血病作用。然而，白血病患者通常不具有足够的T细胞来收集，意味着治疗必须涉及来自供体的修饰的T细胞。因此，存在建立供体T-细胞的库的兴趣。卡西姆(Qasim)等人(“在B-ALL中Talen工程化的通用CAR19T细胞的第一临床应用(First Clinical Application of Talen EngineeredUniversal CAR19T Cells in B-ALL)”ASH第57届年度会议和展览会(ASH 57th AnnualMeeting and Exposition)，2015年12月5日-8日，摘要2046(https://ash.confex.com/ash/2015/webprogram/Paper81653.html在线公开于2015年11月)讨论了修饰CAR19T细胞以通过破坏T细胞受体表达和CD52靶向来消除移植物抗宿主病的风险。此外，靶向CD52细胞，使得它们变得对阿仑单抗不敏感，并且由此允许阿仑单抗预防宿主介导的对人类白细胞抗原(HLA)不匹配的CAR19T细胞的排斥。研究者使用编码与RQR8连接的4g7 CAR19(CD19scFv-4-1BB-CD3ζ)的第三代自我失活型慢病毒载体，然后使用用于多元靶向T细胞受体(TCR)α恒定链座位和CD52基因座位两者的两对TALEN mRNA对细胞进行电穿孔。将在离体表达后仍表达TCR的细胞使用CliniMacsα/βTCR耗减进行耗减，产生T细胞产物(UCART19)，具有<1％的TCR表达，其85％表达CAR19，并且64％变为CD52阴性。给予修饰的CAR19T细胞以治疗患者的复发的急性成淋巴细胞白血病。本文提供的传授内容提供了有效的用于提供经修饰的造血干细胞及其子代的方法，所述造血干细胞及其子代包括但不限于血液的髓系和淋巴系的细胞，包括T细胞、B细胞、单核细胞、巨噬细胞、嗜中性粒细胞、嗜碱性粒细胞、嗜酸性细胞、红细胞、树突状细胞、和巨核细胞或血小板、以及天然杀伤细胞以及它们的前体和祖细胞。此类细胞可以通过敲除、敲进或以其他方式调节靶标来修饰，例如以去除或调节如上所述的CD52以及其他靶标，例如但不限于CXCR4和PD-1。因此本发明的组合物、细胞、和方法，结合改变向患者进行的T细胞或其他细胞的给予，可以用于调节免疫应答和治疗(不限于)恶性肿瘤、病毒感染、和免疫障碍。

X连锁慢性肉芽肿病(CGD)是一种由于不存在吞噬细胞NADPH氧化酶或其活性降低而导致的宿主防御遗传性障碍。使用靶向并校正该突变(不存在吞噬细胞NADPH氧化酶或其活性降低)的CRISPR-Cas(Cas9)系统(例如，用递送吞噬细胞NADPH氧化酶的编码序列的适合的HDR模板)；确切地说，sgRNA可以靶向引起CGD的突变(缺陷吞噬细胞NADPH氧化酶)，并且HDR可以为吞噬细胞NADPH氧化酶的正确表达提供编码。将包含靶向突变-和-Cas(Cas9)蛋白的sgRNA的粒子与携带突变的HSC进行接触。该粒子还可以包含适合的HDR模板，以校正吞噬细胞NADPH氧化酶的适当表达的突变；或HSC可以与包含或递送HDR模板的第二粒子或载体接触。可以将这样接触的细胞给予；并且任选地处理/扩增。参见卡地亚(Cartier)。

范科尼贫血：至少15个基因(FANCA、FANCB、FANCC、FANCD1/BRCA2、FANCD2、FANCE、FANCF、FANCG、FANCI、FANCJ/BACH1/BRIP1、FANCL/PHF9/POG、FANCM、FANCN/PALB2、FANCO/Rad51C和FANCP/SLX4/BTBD12)的突变可以引起范科尼贫血。产生自这些基因的蛋白质涉及在称为FA途径的细胞过程中。当产生新的DNA拷贝的过程(称为DNA复制)由于DNA损伤被阻断时，FA途径被开启(激活)。FA途径将某些蛋白送至损害区域，这触发了DNA修复，所以DNA复制可以继续。FA途径对某一类型的DNA损伤(称为链间交联(ICL))特别具有响应性。当DNA的相对链上的两个DNA结构单元(核苷酸)异常地附接或连接在一起时出现ICL，这使得DNA复制过程停止。ICL可以通过在体内产生的毒性物质的积聚或通过用某些癌症治疗药物进行治疗而引起。将八种与范科尼贫血相关的蛋白质集合在一起以形成称为FA核心复合物的复合物。FA核心复合物激活两种称为FANCD2和FANCI的蛋白质。这两种蛋白质的激活将DNA修复蛋白带至ICL区域，因此可以去除交联并且DNA复制可以继续。FA核心复合物。更具体地，FA核心复合物是由FANCA、FANCB、FANCC、FANCE、FANCF、FANCG、FANCL和FANCM组成的核多蛋白复合物，作为E3泛素连接酶起作用并且介导ID复合物的激活，所述ID复合物是由FANCD2和FANCI构成的异二聚体。一旦被单遍在蛋白化，它便与FA途径下游的经典肿瘤抑制剂(包括FANCD1/BRCA2、FANCN/PALB2、FANCJ/BRIP1和FANCO/Rad51C)相互作用并且由此促进经由同源重组(HR)进行的DNA修复。80％至90％的FA情况归因于以下三个基因之一的突变：FANCA、FANCC和FANCG。这些基因提供用于产生FA核心复合物的组分的指令。与FA核心复合物相关的此类基因的突变将使得该复合物丧失功能并且破坏整个FA途径。其结果是，DNA损伤未被有效修复并且ICL随时间积累。盖泽尔哈特(Geiselhart)，“综述文章，通过范科尼贫血途径破坏信号传导导致异常的造血干细胞生物学：潜在机制和可能的治疗策略(Review Article,Disrupted Signaling through the Fanconi Anemia Pathway Leadsto Dysfunctional Hematopoietic Stem Cell Biology:Underlying Mechanisms andPotential Therapeutic Strategies)”，《贫血》(Anemia)第2012卷(2012)，文章ID265790，http://dx.doi.org/10.1155/2012/265790，讨论了FA和涉及股骨内注射编码FANCC基因的慢病毒从而在体内校正HSC的动物实验。使用靶向与FA相关的突变中的一个或多个的CRISPR-Cas(Cas9)系统，例如具有一种或多种sgRNA和一种或多种HDR模板的CRISPR-Cas(Cas9)系统，这一种或多种sgRNA和这一种或多种HDR模板对应地靶向引起FA的突变FANCA、FANCC或FANCG中的一个或多个并且提供FANCA、FANCC或FANCG中一个或多个的校正表达；例如，sgRNA可以靶向关于FANCC的突变，并且HDR可以为FANCC的适当表达提供编码。将靶向包含一个或多个突变(例如在FA中涉及的一个或多个，例如关于FANCA、FANCC或FANCG中的任何一者或多者的一个或多个突变)-和Cas(Cas9)蛋白的粒子的sgRNA与携带一个或多个突变的HSC接触。该粒子还可以包含一种或多种适合的HDR模板，以校正用于FA中涉及的一种或多种蛋白(例如FANCA、FANCC或FANCG中的任何一者或多者)的适当表达的突变；或HSC可以与包含或递送HDR模板的第二粒子或载体接触。可以将这样接触的细胞给予；并且任选地处理/扩增。参见卡地亚(Cartier)。

本文讨论中的粒子(例如关于包含一种或多种sgRNA和Cas(Cas9)，任选地一种或多种HDR模板或一种或多种HDR模板；例如关于B型血友病、SCID、SCID-X1、ADA-SCID、遗传性酪氨酸血症、β-地中海贫血、X-连锁的CGD、威斯科特-奥尔德里奇综合征、范科尼贫血、肾上腺脑白质营养不良(ALD)、异染性脑白质营养不良(MLD)、HIV/AIDS、免疫缺陷障碍、血液学病况、或遗传性溶酶体贮积疾病)有利地是通过以下来获得或可获得：将一种或多种sgRNA和Cas(Cas9)蛋白混合物(任选地包含一种或多种HDR模板，或这种混合物仅包含一种或多种HDR模板，当关于一种或多种模板分离的粒子是所希望的时候)与包含表面活性剂、磷脂、生物可降解聚合物、脂蛋白和醇或基本上由其组成或由其组成的混合物进行混合(其中一种或多种sgRNA靶向HSC中的一个或多个基因座位)。

的确，本发明尤其适用于用基因组编辑来治疗造血遗传障碍，以及免疫缺陷障碍，例如遗传免疫缺陷障碍，尤其是通过使用本文讨论的粒子技术。遗传免疫缺陷是其中本发明的基因组编辑干预可以成功的疾病。原因包括：造血细胞(免疫细胞是其一个子集)是治疗可及的。它们可以是从身体去除并且自体地或同种异体地移植。此外，某些遗传免疫缺陷，例如，严重的联合免疫缺陷(SCID)，产生了免疫细胞的增殖缺点。通过稀少的自发的‘反’突变来校正引起SCID的遗传损伤指示，校正甚至一个淋巴细胞祖细胞可以足以恢复患者中的免疫功能.../../../Users/t_kowalski/AppData/Local/Microsoft/Windows/Temporary Internet Files/Content.Outlook/GA8VY8LK/Treating SCID forEllen.docx-_ENREF_1参见布索(Bousso)，P.,等人，体内衍生自单一人类T细胞前体的T细胞谱的递送、功能、和稳定性(Diversity,functionality,and stability of the T cellrepertoire derived in vivo from a single human T cell precursor.)《美国国家科学院院刊》(Proceedings of the National Academy of Sciences of the UnitedStates of America)97，274-278(2000)。用于编辑的细胞的选择性优势允许甚至低水平的编辑，以产生治疗作用。本发明的这种作用可以在SCID、威斯科特-奥尔德里奇综合征、和其他本文提及的病况中看到，包括其他遗传性造血障碍，例如α-和β-地中海贫血，其中血红蛋白缺陷不利地影响红系祖细胞的健康。

NHEJ和HDR DSB修复活性随细胞类型和细胞状态而显着变化。NHEJ不是高度地受细胞周期调节并且跨细胞类型是有效的，从而允许在可及靶细胞群中进行高水平的基因破坏。相比之下，HDR主要在S/G2期过程中起作用，并且因此局限于活跃分裂的细胞，从而限制了需要对有丝分裂细胞进行精确基因组修饰的治疗[齐恰(Ciccia)，A.&埃利奇(Elledge)，S.J.《分子细胞》(Molecular cell)40，179-204(2010)；查普曼(Chapman)，J.R.等人《分子细胞》47，497-510(2012)]。

经由HDR的校正效率可以通过靶向座位的表观遗传学状态或序列或者使用的具体修复模板构型(单链对比双链、长同源臂对比短同源臂)进行控制[哈赛因-贝-阿比纳(Hacein-Bey-Abina)，S.等人《新英格兰医学杂志》(The New England journal ofmedicine)346，1185-1193(2002)；加斯帕(Gaspar)，H.B.等人《柳叶刀》(Lancet)364，2181-2187(2004)；博伊默(Beumer)，K.J.等人G3(2013)]。NHEJ和HDR机器在靶细胞中的相对活性也可以影响基因校正效率，因为这些途径可以竞争以解决DSB[博伊默(Beumer)，K.J.等人《美国国家科学院院刊》(Proceedings of the National Academy of Sciences of theUnited States of America)105，19821-19826(2008)]。HDR还赋予了伴随NHEJ策略未见的递送挑战，因为它需要同时递送核酸酶和修复模板。在实践中，这些约束迄今为止已经在治疗相关细胞类型中导致低水平的HDR。临床转化因此在很大程度上已经聚焦于NHEJ策略来治疗疾病，尽管已经针对B型血友病和遗传性酪氨酸血症小鼠模型描述了概念验证临床前HDR治疗[李(Li)，H.等人《自然》(Nature)475，217-221(2011)；印(Yin)，H.等人《自然生物技术》(Nature biotechnology)32，551-553(2014)]。

任何给定的基因组编辑应用都可以包括蛋白质、小RNA分子和/或修复模板的组合，使得递送这多个部分比递送小分子治疗剂显着更具有挑战性。已经开发了两种用于递送基因组编辑工具的主要策略：离体策略和体内策略。在离体治疗中，将患病细胞从体内取出，编辑并且然后移植回患者体内。离体编辑具有以下优点：允许靶细胞群被明确定义并且指定递送到细胞中的治疗性分子的具体剂量。当脱靶修饰是问题时，后一考虑事项可能是特别重要的，因为滴定核酸酶的量可以减少此类突变(徐(Hsu)等人，2013)。离体方法的另一个优点是可以实现典型高的编辑率，这归因于使蛋白质和核酸进入用于研究和基因疗法应用的培养中的细胞中的有效递送系统的发展。

离体方法存在将应用局限于小数目的疾病的缺陷。例如，在体外操纵时靶细胞必须能够存活。对于许多组织(像脑)而言，在体外培养细胞是主要挑战，因为细胞不能存活或失去对其体内功能必需的特性。因此，鉴于本披露和本领域中的知识，通过CRISPR-Cas(Cas9)系统，使得能够进行关于具有经受离体培养和操纵的成体干细胞群体(例如造血系统)的组织的离体治疗。[邦恩(Bunn),H.F.&阿斯特尔(Aster)J.，《血液障碍的病理生理学》(Pathophysiology of blood disorders)(麦格劳希尔(McGraw-Hill)，纽约(New York)，2011)]

体内基因组编辑涉及将编辑系统直接递送到处于其天然组织中的细胞类型。体内编辑允许治疗受影响细胞群不易于离体操纵的疾病。此外，将核酸酶原位递送至细胞允许处理多种组织和细胞类型。相对于离体疗法而言，这些特性可能允许将体内治疗应用于更大范围的疾病。

迄今为止，在很大程度上已经通过使用具有限定的组织特异性向性的病毒载体实现了体内编辑。就携带负荷物的能力和向性而言，此类载体目前是受限的，将这种模式的治疗局限于用临床上有用的载体进行转导是有效的器官系统，如肝、肌肉和眼睛[科特曼(Kotterman)，M.A.&谢弗(Schaffer)，D.V.《自然综述·遗传学》(Naturereviews.Genetics)15，445-451(2014)；纽伦(Nguyen)，T.H.&费里(Ferry)，N.《基因治疗》(Gene therapy)11增刊1，S76-84(2004)；博伊(Boye)，S.E.等人《分子疗法：美国基因治疗学会杂志》(Molecular therapy:the journal of the American Society of GeneTherapy)21，509-519(2013)]。

体内递送的潜在障碍是可能响应于治疗所必需的大量病毒而产生的免疫应答，但是这种现象并不是基因组编辑特有的并且伴随其他基于病毒的基因疗法也有观察到[贝西(Bessis)，N.等人《基因治疗》(Gene therapy)11增刊1，S10-17(2004)]。还有可能的是来自编辑核酸酶本身的肽被呈现在MHC I类分子上以刺激免疫应答，尽管几乎没有支持这发生在临床前水平下的证据。这种模式的治疗的另一个主要困难是控制编辑基因组的核酸酶在体内的分布以及因此的剂量，从而产生可能难以预测的脱靶突变谱。然而，鉴于本披露和本领域中的知识，包括使用用于治疗癌症的基于病毒和粒子的疗法，HSC的体内修饰(例如通过经粒子或病毒递送)是在本领域技术人员的范围之内。

离体编辑疗法：纯化、培养和移植造血细胞的由来已久的临床专业知识已经使得影响血液系统的疾病(如SCID、范科尼贫血、威斯科特-奥尔德里奇综合征和镰状细胞贫血)成为离体编辑治疗的焦点。聚焦于造血细胞的另一个原因是归功于针对血液障碍设计基因治疗的先前努力，已经存在相对较高效率的递送系统。在这些优点存在下，这种模式的治疗可以应用于其中经编辑的细胞具有健康优势的疾病，使得小数目的植入的经编辑细胞可以扩增并治疗疾病。一种这样的疾病是HIV，其中感染导致CD4+ T细胞的健康度劣势。

离体编辑治疗最近已经被扩展成包括基因校正策略。在来自吉诺维斯(Genovese)和同事的一篇最近的论文中克服了离体HDR的障碍，他们在获得自罹患SCID-X1的患者的造血干细胞(HSC)中实现了突变的IL2RG基因的基因校正[吉诺维斯，P.等人《自然》(Nature)510，235-240(2014)]。吉诺维斯(Genovese)等人使用多模式策略完成了HSC中的基因校正。首先，使用含有编码IL2RG的治疗性cDNA的HDR模板的整合缺陷型慢病毒转导HSC。转导后，用对靶向IL2RG中的突变热点的ZFN进行编码的mRNA对细胞进行电穿孔，以基于基因校正刺激HDR。为了提高HDR率，用小分子优化培养条件，以促使HSC分裂。通过优化的培养条件、核酸酶和HDR模板，以治疗上相关的比率在培养中获得来自SCID-X1患者的经基因校正的HSC。来自经历相同的基因校正程序的未受影响的个体的HSC在小鼠体内可以维持长期造血功能，即HSC功能的黄金标准。HSC能够产生所有造血细胞类型并且可以进行自体移植，使得它们成为所有造血遗传障碍的极有价值的细胞群[韦斯曼(Weissman)，I.L.&静流(Shizuru)，J.A.《血液》(Blood)112，3543-3553(2008)]。原则上，经基因校正的HSC可以用于治疗范围广泛的遗传血液障碍，使得这项研究成为治疗性基因组编辑的令人振奋的突破。

体内编辑治疗：体内编辑可以有利地根据本披露和本领域中的知识来使用。对于递送有效的器官系统而言，已经取得了许多令人振奋的临床治疗成功。成功的体内编辑治疗的第一个实例在B型血友病小鼠模型中得到证实[李(Li)，H.等人《自然》(Nature)475，217-221(2011)]。如较早所指出的，B型血友病是一种由编码因子IX的基因的功能缺失突变引起的X连锁隐性障碍，所述因子是凝血级联的关键组分。将受严重影响个体体内的因子IX活性恢复到高于1％的其水平可以将该疾病转化为显着更轻的形式，因为从年幼时预防性地向此类患者体内输注重组因子IX达到此类水平在很大程度上改善临床并发症[洛夫基思特(Lofqvist)，T.等人《内科医学杂志》(Journal of internal medicine)241，395-400(1997)]。因此，仅需低水平的HDR基因校正来改变患者的临床结果。此外，因子IX由肝合成和分泌，肝是可以被编码编辑系统的病毒载体有效转导的器官。

使用编码ZFN的嗜肝腺相关病毒(AAV)血清型和校正HDR模板，在鼠类肝中实现突变的、人源化因子IX基因的高达7％的基因校正[李(Li)，H.等人《自然》(Nature)475，217-221(2011)]。这使得凝块形成动力学(凝血级联功能的量度)得到改进，第一次证明体内编辑治疗不仅可行，而且有效。如本文所讨论的，根据本文的传授内容和本领域中的知识，技术人员被定位，例如李(Li)，以用含HDR模板和CRISPR-Cas(Cas9)系统(该系统靶向X连锁隐性障碍的突变以逆转功能缺失突变)的粒子解决B型血友病。

在此项研究的基础上，其他团体最近已经使用用CRISPR-Cas进行的肝体内基因组编辑成功地治疗遗传性酪氨酸血症小鼠模型并且产生提供针对心血管疾病的保护的突变。这两种不同的应用证明了这种方法用于涉及肝功能异常的障碍的多功能性[印(Yin)，H.等人《自然生物技术》(Nature biotechnology)32，551-553(2014)；丁(Ding)，Q.等人《循环研究》(Circulation research)115，488-492(2014)]。为了证明此策略是广泛适用的，必需将体内编辑应用于其他器官系统。目前，正在努力优化病毒和非病毒载体两者，以扩展可以用这种模式的治疗进行治疗的障碍的范围[科特曼(Kotterman)，M.A.&谢弗(Schaffer)，D.V.《自然综述·遗传学》(Nature reviews.Genetics)15，445-451(2014)；印(Yin)，H.等人《自然综述·遗传学》(Nature reviews.Genetics)15，541-555(2014)]。如本文所讨论的，根据本文的传授内容和本领域中的知识，技术人员被定位，例如印(Yin)，以用含HDR模板和靶向突变的CRISPR-Cas(Cas9)系统的粒子解决遗传性酪氨酸血症。

靶向缺失、治疗应用：基因的靶向缺失可以是优选的。因此，优选的是在以下中涉及的基因，免疫缺陷障碍、血液学病况、或遗传性溶酶体贮积疾病，例如B型血友病、SCID、SCID-X1、ADA-SCID、遗传性酪氨酸血症、β-地中海贫血、X-连锁的CGD、威斯科特-奥尔德里奇综合征、范科尼贫血、肾上腺脑白质营养不良(ALD)、异染性脑白质营养不良(MLD)、HIV/AIDS、其他代谢障碍，编码错误折叠的蛋白(涉及疾病)的基因，导致功能缺失的涉及疾病的基因；总体上使用任何本文讨论的递送系统可以在HSC中靶向突变，其中认为粒子系统是有利的。

在本发明中，可以具体地遵循首先由腾格里(Tangri)等人针对促红细胞生成素提出并且随后开发的方法来降低该CRISPR酶的免疫原性。因此，定向演化或合理设计可以用来降低在宿主物种(人类或其他物种)中的CRISPR酶(例如Cas9)的免疫原性。

基因组编辑：本发明的CRISPR/Cas(Cas9)系统可以用来校正基因突变，先前使用TALEN和ZFN和慢病毒尝试了这些突变(包括如本文讨论的)，但是成功有限；还参见WO2013163628。

过继性细胞疗法

本发明还考虑使用本文描述的CRISPR-Cas系统，例如Cas9效应蛋白系统，从而修饰用于过继性疗法的细胞。本发明的方面涉及特异性针对所选抗原(例如肿瘤相关抗原)的免疫系统细胞如T细胞的过继性转移(参见马尔斯(Maus)等人，2014，用于癌症或病毒的过继性免疫疗法(Adoptive Immunotherapy for Cancer or Viruses)，《免疫学年度评论》(Annual Review of Immunology)，第32卷：189-225；罗森伯格(Rosenberg)和瑞斯提夫(Restifo)，2015，作为用于人类癌症的个性化免疫疗法的过继性细胞转移(Adoptive celltransfer as personalized immunotherapy for human cancer)，《科学》(Science)第348卷，第6230期，第62-68页；瑞斯提夫(Restifo)等人，2015，过继性免疫疗法用于癌症：利用T细胞应答(Adoptive immunotherapy for cancer:harnessing the T cell response).《自然评论免疫学》(Nat.Rev.Immunol.)12(4):269-281；以及约翰逊(Jenson)和里德尔(Riddell)，2014，设计和实施采用嵌合抗原受体修饰的T细胞进行的过继性治疗(Designand implementation of adoptive therapy with chimeric antigen receptor-modified T cells).《免疫学评论》(Immunol Rev.)257(1):127-144)。各种策略可以例如用于通过改变T细胞受体(TCR)的特异性来对T细胞进行基因修饰，例如通过引入具有选择的肽特异性的新TCRα和β链(参见美国专利号8,697,854；PCT专利公开案：WO 2003020763、WO 2004033685、WO 2004044004、WO 2005114215、WO 2006000830、WO 2008038002、WO2008039818、WO 2004074322、WO 2005113595、WO 2006125962、WO 2013166321、WO2013039889、WO 2014018863、WO 2014083173；美国专利号8,088,379)。

作为TCR修饰的替代方案或添加方案，可以使用嵌合抗原受体(CAR)以产生特异性针对所选靶标如恶性细胞的免疫反应性细胞，例如T细胞，其中广泛的受体嵌合构建体已经被描述(参见美国专利号5,843,728；5,851,828；5,912,170；6,004,811；6,284,240；6,392,013；6,410,014；6,753,162；8,211,422；以及PCT公开案WO 9215322)。可替代的CAR构建体可以被表征为属于连续世代。第一代CAR典型地由通过柔性接头例如通过CD8α铰链结构域和CD8α跨膜结构域连接到CD3ζ或FcRγ的跨膜和细胞内信号传导结构域上的特异性针对抗原的抗体的单链可变片段(例如包含与特异性抗体的V_H相连的V_L)组成(scFv-CD3ζ或scFv-FcRγ；参见美国专利号7,741,465；美国专利号5,912,172；美国专利号5,906,936)。第二代CAR结合了在胞内结构域内的一种或多种共刺激分子例如CD28、OX40(CD134)、或4-1BB(CD137)的细胞内结构域(例如scFv-CD28/OX40/4-1BB-CD3ζ；参见美国专利号8,911,993；8,916,381；8,975,071；9,101,584；9,102,760；9,102,761)。第三代CAR包括共刺激性胞内结构域例如CD3ζ-链、CD97、GDI la-CD18、CD2、ICOS、CD27、CD154、CDS、OX40、4-1BB、或CD28信号传导构域的组合(例如scFv-CD28-4-1BB-CD3ζ或scFv-CD28-OX40-CD3ζ；参见美国专利号8,906,682；美国专利号8,399,645；美国专利号5,686,281；PCT公开号WO 2014134165；PCT公开号WO 2012079000)。可替代地，共刺激可以通过在抗原特异性T细胞中表达CAR来安排，所述抗原特异性T细胞被选择为在伴随的共刺激下，在其天然αβTCR例如由专业抗原呈递细胞上的抗原接合后被激活并且扩增。此外，另外的工程化受体可以提供在免疫反应性细胞上，例如以改进T细胞攻击的靶向和/或最小化副作用。

可以使用替代性技术来转化靶免疫反应性细胞，例如原生质体融合、脂转染、转染或电穿孔。可以使用宽范围的载体，例如逆转录病毒载体、慢病毒载体、腺病毒载体、腺相关病毒载体、质粒或转座子，例如睡美人转座子(参见美国专利号6,489,458；7,148,203；7,160,682；7,985,739；8,227,432)，可以用于引入CAR，例如使用通过CD3ζ以及CD28或CD137的第二代抗原特异性CAR信号传导。病毒载体可以例如包括基于HIV、SV40、EBV、HSV或BPV的载体。

靶向的用于转化的细胞可以例如包括T细胞、自然杀伤(NK)细胞、细胞毒性T淋巴细胞(CTL)、调节性T细胞、人类胚胎干细胞、肿瘤浸润淋巴细胞(TIL)或可以分化出淋巴样细胞的多能干细胞。表达希望的CAR的T细胞可以例如通过与γ-照射的激活和繁殖细胞(AaPC)的共培养来选择，它们共表达癌症抗原和共刺激性分子。可以例如通过在可溶性因子例如IL-2和IL-21的存在下，在AaPC上共培养来扩增这些工程化的CAR T细胞。可以例如进行该扩增以提供记忆CAR+ T细胞(其可以例如通过非酶数字阵列和/或多-面板流式细胞术来测定)。以此方式，CAR T细胞可以被提供为具有针对带有抗原的肿瘤的特定细胞毒性活性(任选地连同产生所希望的趋化因子例如干扰素-γ)。这种CAR T细胞可以例如用于动物模型中，例如以治疗肿瘤异种移植物。

多种方法(例如前述的)可以适于提供对患有疾病(例如瘤形成，例如通过给予有效量的含有抗原识别受体的免疫反应性细胞，该抗原识别受体结合所选抗原)的受试者进行治疗和/或增加存活的方法，其中该结合激活免疫反应性细胞，由此治疗或预防该疾病(例如瘤形成、病原体感染、自身免疫性障碍、或异体移植反应)。在CAR T细胞疗法中的给予可以例如涉及给予从106至109个细胞/kg，具有或不具有例如采用环磷酰胺的淋巴耗减历程。

在一个实施例中，该治疗可以给予到经历免疫抑制治疗的患者中。这些细胞或细胞群体，可以被制成由于对这种免疫抑制剂的受体进行编码的基因的失活而耐受至少一种免疫抑制剂。不受理论的束缚，免疫抑制治疗应有助于选择和扩增在患者内的根据本发明的免疫反应性细胞或T细胞。

给予根据本发明的细胞或细胞群体可以按任何便利方式来进行，包括通过雾化吸入、注射、摄取、输注、植入或移植。这些细胞或细胞群体可以皮下、真皮内、瘤内、节内、髓内、肌内、通过静脉内或淋巴管注射、或腹膜内给予至患者。在一个实施例中，本发明的细胞组合物优选是通过静脉注射给予。

给予细胞或细胞群体可以由给予10⁴-10⁹个细胞/kg体重组成，优选10⁵至10⁶个细胞/kg体重，包括在那些范围内的细胞数目的所有整数值。在CAR T细胞疗法中的给予可以例如涉及给予从10⁶至10⁹个细胞/kg，具有或不具有例如采用环磷酰胺的淋巴耗减历程。这些细胞或细胞群体可以按一个或多个剂量给予。在另一个实施例中，有效量的细胞是作为单一剂量给予。在另一个实施例中，有效量的细胞是在一段时间内作为多于一个剂量给予。给予的时间安排是在管理医师的判断内，并且取决于患者的临床病况。这些细胞或细胞群体可以从任何来源如血库或供体获得。虽然个体需要不同，针对具体疾病或病况确定给定细胞类型的有效量的最佳范围是在本领域技术人员的技术内。有效量意指提供治疗或预防益处的量。给予的剂量将取决于接受者的年龄、健康和体重、并行治疗(如果有的话)的种类、治疗频率和所希望的作用的性质。

在另一个实施例中，肠胃外给予有效量的细胞或包含那些细胞的组合物。该给予可以是静脉内给予。该给予可以是直接通过在肿瘤内注射来进行。

为了避免可能的不良反应，工程化的免疫反应性细胞可以配备有转基因安全性开关，该开关处于使得细胞易于暴露于特异性信号的转基因形式。例如，单纯性疱疹病毒胸苷激酶(TK)基因可以按此方式使用，例如通过在干细胞移植后引入到用作供体淋巴细胞输注物的异体T淋巴细胞中(格雷科(Greco)等人，用TK-自杀基因改进细胞疗法的安全性(Improving the safety of cell therapy with the TK-suicide gene).药理学前沿(Front.Pharmacol.)2015；6:95)。在此类细胞中，给予核苷前药例如更昔洛韦或阿昔洛韦引起细胞死亡。可替代的安全性开关构建体包括可诱导的半胱天冬酶9，例如通过给予将两个非功能性icasp9分子置于一起而形成活性酶的小分子二聚物触发。已经描述了各种实施细胞增殖控制的替代途径(参见美国专利公开号20130071414；PCT专利公开案WO2011146862；PCT专利公开案WO 2014011987；PCT专利公开案WO 2013040371；周(Zhou)等人，《血液》(BLOOD),2014,123/25:3895-3905；迪史塔西(Di Stasi)等人，《新英格兰生物医学杂志》(The New England Journal of Medicine)2011；365:1673-1683；萨德拉恩(Sadelain)M等人，《新英格兰生物医学杂志》(The New England Journal of Medicine)2011；365:1735-173；拉莫斯(Ramos)等人，《干细胞》(Stem Cells)28(6):1107-15(2010))。

在过继性疗法的另一个细化方面，基因组编辑可以用于针对例如提供经编辑CART细胞的可替代实施而定制免疫反应性细胞，(参见白罗(Poirot)等人，2015，多元基因组编辑的T细胞生产平台用于“现成的”过继性T细胞免疫疗法(Multiplex genome edited T-cell manufacturing platform for"off-the-shelf"adoptive T-cellimmunotherapies)，《癌症研究》(Cancer Res)75(18):3853)。细胞可以使用如本文描述的任何CRISPR系统和其使用方法来编辑。CRISPR系统可以通过本文描述的任何方法被递送到免疫细胞。在优选实施例中，将细胞进行离体编辑，并且转移到对其有需要的受试者中。可以编辑免疫反应性细胞、CAR T细胞或任何用于过继性细胞转移的细胞。可以进行编辑以消除潜在的同种反应性T-细胞受体(TCR)，破坏化学治疗剂的靶标，阻断免疫检查点，激活T细胞，和/或增加功能上消耗的或功能失调的CD8+ T-细胞的分化和/或增殖(参见PCT专利公开案WO 2013176915、WO 2014059173、WO 2014172606、WO 2014184744、和WO 2014191128)。编辑可以导致基因的失活。

使基因失活意为感兴趣的基因不是以功能蛋白形式表达。在一个具体实施例中，该CRISPR系统特异性地催化一个靶向的基因中的切割，从而使所述靶向的基因失活。引起的核酸链断裂通常是通过同源重组或非同源末端连接(NHEJ)的不同机制修复的。然而，NHEJ是通常导致在切割位点处DNA序列的变化的非完美修复过程。经由非同源末端连接(NHEJ)的修复经常导致小的插入或缺失(indel)，并且可以用于创建特异性基因敲除。其中已经发生切割诱导的诱变事件的细胞可以通过本领域中熟知的方法鉴定和/或选择。

T细胞受体(TCR)是响应于抗原呈递参与T细胞活化的细胞表面受体。TCR总体上由两个链(α和β)构成，它们组装以形成异二聚体，并且与CD3-转导亚基缔合以形成存在于细胞表面上的T细胞受体复合物。TCR的α和β各链由免疫球蛋白样N-末端可变(V)区和恒定(C)区、疏水跨膜结构域、和短胞质区组成。至于免疫球蛋白分子，α和β链的可变区是通过V(D)J重组产生，在T细胞群体内创造了多种多样的抗原特异性。然而，相比于识别完整抗原的免疫球蛋白，由与MHC分子缔合的经处理的肽片段激活T细胞，通过T细胞将额外维度引入抗原识别，称为MHC限制。通过T细胞受体识别在供体和受体之间的MHC差异导致T细胞增殖和移植物抗宿主病(GVHD)的潜在发展。TCRα或TCRβ的失活可以导致TCR从T细胞表面的清除，防止了同种异体抗原的识别并因此防止GVHD。然而，TCR破坏总体上导致清除CD3信号传导组分，并且改变进一步的T细胞扩增的方式。

异体细胞由宿主免疫系统快速地排斥。已经证明，存在于非照射的血液产品中的异体白细胞将持续不超过5至6天(博尼(Boni)，米兰斯基(Muranski)等人2008《血液》(Blood)1；112(12):4746-54)。因此，为了防止异体细胞的排斥，宿主的免疫系统通常必须在一定程度上被抑制。然而，在过继性细胞转移的情况下，免疫抑制性药物的使用还对引入的治疗T细胞具有有害作用。因此，在这些情况下为了有效地使用过继性免疫疗法途径，所引入的细胞将需要对免疫抑制治疗具有抗性。因此，在一个具体实施例中，本发明进一步包括以下步骤：修饰T细胞以使它们对免疫抑制剂具有抗性，优选地通过使对免疫抑制剂的靶标进行编码的至少一个基因失活。免疫抑制剂是通过若干作用机制中的一个抑制免疫功能的试剂。免疫抑制剂可以是但不限于钙调磷酸酶抑制剂、雷帕霉素的靶标、白介素-2受体α-链阻断剂、肌苷一磷酸脱氢酶的抑制剂、二氢叶酸还原酶的抑制剂、皮质类固醇或免疫抑制性抗代谢物。本发明允许通过使T细胞中的免疫抑制剂的靶标失活而对T细胞赋予免疫抑制抗性，以用于免疫疗法。作为非限制性实例，免疫抑制剂的靶标可以是免疫抑制剂的受体，例如：CD52、糖皮质激素受体(GR)、FKBP家族基因成员和亲环蛋白家族基因成员。

免疫检查点是抑制通路，其减慢或终止免疫反应并预防来自免疫细胞的不受控活性的过度组织损害。在某些实施例中，靶向的免疫检查点是编程的死亡-1(PD-1或CD279)基因(PDCD1)。在其他实施例中，靶向的免疫检查点是细胞毒性T-淋巴细胞相关抗原(CTLA-4)。在另外的实施例中，靶向的免疫检查点是CD28和CTLA4Ig超家族的另一个成员，例如BTLA、LAG3、ICOS、PDL1或KIR。在另外的其他实施例中，靶向的免疫检查点是TNFR超家族的一个成员，例如CD40、OX40、CD137、GITR、CD27或TIM-3。

另外的免疫检查点包括含有Src同源性2结构域的蛋白酪氨酸磷酸酶1(SHP-1)(沃森(Watson)HA，等人，SHP-1：用于癌症免疫疗法的下一个检查点靶标(SHP-1:the nextcheckpoint target for cancer immunotherapy)？生物化学学会汇刊(Biochem SocTrans.)2016年4月15日；44(2):356-62)。SHP-1是广泛表达的抑制性蛋白酪氨酸磷酸酶(PTP)。在T-细胞中，它是抗原-依赖性活化和增殖的负调节物。它是胞质蛋白，并且因此不适合于抗体介导的疗法，但其在活化和增殖中的作用使得它成为对于以过继性转移策略(如嵌合抗原受体(CAR)T细胞)进行的基因操纵有吸引力的靶标。免疫检查点还可以包括具有Ig和ITIM结构域的T细胞免疫受体(TIGIT/Vstm3/WUCAM/VSIG9)和VISTA(乐梅西埃(LeMercier)I等人，(2015)超越于CTLA-4和PD-1，负检查点调节物的Z代(Beyond CTLA-4andPD-1,the generation Z of negative checkpoint regulators).《免疫学前沿》(Front.Immunol.)6:418)。

WO 2014172606涉及使用MT1和/或MT1抑制剂以增加消耗的CD8+ T细胞的增殖和/或活性，并且降低CD8+ T细胞消耗(例如，降低功能上消耗的或无响应的CD8+免疫细胞)。在某些实施例中，通过在过继性地转移的T细胞中进行基因编辑来靶向金属硫蛋白。

在某些实施例中，基因编辑的靶标可以是在免疫检查点蛋白的表达中涉及的至少一个靶向的座位。此类靶标可以包括但不限于CTLA4、PPP2CA、PPP2CB、PTPN6、PTPN22、PDCD1、ICOS(CD278)、PDL1、KIR、LAG3、HAVCR2、BTLA、CD160、TIGIT、CD96、CRTAM、LAIR1、SIGLEC7、SIGLEC9、CD244(2B4)、TNFRSF10B、TNFRSF10A、CASP8、CASP10、CASP3、CASP6、CASP7、FADD、FAS、TGFBRII、TGFRBRI、SMAD2、SMAD3、SMAD4、SMAD10、SKI、SKIL、TGIF1、IL10RA、IL10RB、HMOX2、IL6R、IL6ST、EIF2AK4、CSK、PAG1、SIT1、FOXP3、PRDM1、BATF、VISTA、GUCY1A2、GUCY1A3、GUCY1B2、GUCY1B3、MT1、MT2、CD40、OX40、CD137、GITR、CD27、SHP-1或TIM-3。在优选实施例中，在PD-1或CTLA-4基因的表达中涉及的基因座位被靶向。在其他优选实施例中，基因的组合被靶向，例如但不限于PD-1和TIGIT。

在其他实施例中，至少两个基因被编辑。基因对可以包括但不限于PD1和TCRα、PD1和TCRβ、CTLA-4和TCRα、CTLA-4和TCRβ、LAG3和TCRα、LAG3和TCRβ、Tim3和TCRα、Tim3和TCRβ、BTLA和TCRα、BTLA和TCRβ、BY55和TCRα、BY55和TCRβ、TIGIT和TCRα、TIGIT和TCRβ、B7H5和TCRα、B7H5和TCRβ、LAIR1和TCRα、LAIR1和TCRβ、SIGLEC10和TCRα、SIGLEC10和TCRβ、2B4和TCRα、2B4和TCRβ。

无论在T细胞的遗传修饰之前或之后，通常T细胞可以使用例如在以下文献中描述的方法活化和扩增：美国专利6,352,694；6,534,055；6,905,680；5,858,358；6,887,466；6,905,681；7,144,575；7,232,566；7,175,843；5,883,223；6,905,874；6,797,514；6,867,041；和7,572,631。可以体外或体内扩增T细胞。

除非另有说明，本发明的实践采用免疫学、生物化学、化学、分子生物学、微生物学、细胞生物学、基因组学和重组DNA的常规技术，这些在本领域的技能之内。参见《分子克隆：实验室手册》(MOLECULAR CLONING:A LABORATORY MANUAL)，第2版(1989)(萨姆布鲁克(Sambrook)、弗里奇(Fritsch)和马尼亚蒂斯(Maniatis))；《分子克隆：实验室手册》(MOLECULAR CLONING:A LABORATORY MANUAL)，第4版(2012)(格林(Green)和萨姆布鲁克(Sambrook))；分子生物学中的当前工具(CURRENT PROTOCOLS IN MOLECULAR BIOLOGY)(1987)(F.M.奥苏贝尔(Ausubel)等人，编辑)；《酶学方法》(METHODS IN ENZYMOLOGY)系列(学术出版公司)；《PCR 2：实用方法》(PCR2:A PRACTICAL APPROACH)(1995)(M.J.麦克弗森(M.J.MacPherson)、B.D.Hames)和G.R.泰勒(泰勒(Taylor)编辑)；《抗体：实验室手册》(ANTIBODIES,A LABORATORY MANUAL)(1988)(哈洛(Harlow)和拉内(Lane)编辑)；《抗体：实验室手册》(ANTIBODIES,A LABORATORY MANUAL)，第二版(2013)(E.A.格林菲尔德(Greenfield)编辑)；和动物细胞培养(1987)(R.I.弗雷谢尼(Freshney)编辑)。

除非另外指明，本发明的实践使用常规的用于产生遗传修饰的小鼠的技术。参见马滕H.霍夫科(Marten H.Hofker)和简范德乌森(Jan van Deursen)，转基因小鼠方法和方案(TRANSGENIC MOUSE METHODS AND PROTOCOLS)，第二版(2011)。

ALS

美国专利公开号20110023144描述了使用锌指核酸酶基因修饰与肌萎缩性侧索硬化(ALS)疾病相关的细胞、动物以及蛋白质。ALS由涉及随意运动的脑皮层、脑干和脊髓中的某些神经细胞的逐步稳定退化表征。

运动神经元障碍以及与这些障碍相关的蛋白质是一套影响患上运动神经元障碍的易感性、运动神经元障碍的存在、运动神经元障碍的严重性或其任何组合的相异蛋白质。本披露包括编码与一种特定的运动神经元障碍ALS疾病相关的蛋白质的任何染色体序列的编辑。典型地基于ALS相关蛋白与ALS的实验相关性选择与ALS相关的蛋白质。例如，相对于没有ALS的群体，在具有ALS的群体中，与ALS相关的蛋白质的产生率或循环浓度可以升高或降低。可以使用蛋白质组技术评估蛋白质水平差异，包括但不限于蛋白质印迹、免疫组织化学染色、酶联免疫吸附测定(ELISA)以及质谱法。可替代地，可以使用基因组技术通过获得编码这些蛋白质的基因的基因表达谱而鉴定与ALS相关的蛋白质，包括但不限于DNA微阵列分析、基因表达序列分析(SAGE)以及定量实时聚合酶链式反应(Q-PCR)。

通过非限制性实例的方式，与ALS相关的蛋白质包括但不限于以下蛋白质：SOD1超氧化物歧化酶1，ALS3肌萎缩性侧索可溶性硬化3SETX senataxin ALS5肌萎缩性侧索硬化5FUS融合在肉瘤中ALS7肌萎缩性侧索硬化7ALS2肌萎缩性侧索DPP6二肽基肽酶6硬化2NEFH神经微丝，重PTGS1前列腺素-多肽内过氧化物合酶1SLC1A2溶质载体家族1 TNFRSF10B肿瘤坏死因子(胶质高亲和性受体超家族，谷氨酸转运体)，成员10b成员2PRPH外周蛋白HSP90AA1热休克蛋白90kDaα(胞质的)，类别A成员1GRIA2谷氨酸受体，IFNG干扰素，γ离子型的，AMPA 2 S100B S100钙结合FGF2成纤维细胞生长因子2蛋白质B AOX1醛氧化酶1 CS柠檬酸合酶TARDBP TAR DNA结合蛋白TXN硫氧还原蛋白RAPH1 Ras缔合MAP3K5丝裂原激活蛋白质(RaIGDS/AF-6)和激酶5普列克底物蛋白(pleckstrin)同源性结构域1 NBEAL1蛋白激酶锚定蛋白(neurobeachin)样1GPX1谷胱甘肽过氧化物酶1ICA1L胰岛细胞自身抗原RAC1ras-相关C3肉毒菌1.69kDa样毒素底物1MAPT微管相关ITPR2肌醇1,4,5-蛋白tau三磷酸受体，2型ALS2CR4肌萎缩性侧索GLS谷氨酰胺酶硬化2(青少年)染色体区域，候选物4 ALS2CR8肌萎缩性侧索CNTFR睫状神经营养因子硬化2(青少年)受体染色体区域，候选物8ALS2CR11肌萎缩性侧索FOLH1叶酸水解酶1硬化2(青少年)染色体区域，候选物11FAM117B具有序列P4HB的家族脯氨酰基4-羟化酶，相似性117，成员Bβ多肽CNTF睫状神经营养因子SQSTM1死骨片(sequestosome)1STRADB STE20相关激酶NAIP NLR家族，凋亡适配器β抑制蛋白YWHAQ酪氨酸3-SLC33A1溶质载体家族33单加氧酶/色氨酸(乙酰-CoA转运体)，一种5-单加氧酶成员1激活蛋白，θ多肽TRAK2运输蛋白，图4图4同系物，SAC1驱动蛋白结合2脂质磷酸酶结构域包含NIF3L1NIF3NGG1相互作用INA互联蛋白(internexin)神经因子3样1中间丝蛋白，αPARD3Bpar-3分区COX8A细胞色素c氧化酶缺陷3同系物B亚基VIIIA CDK15细胞周期蛋白依赖性激酶HECW1 HECT，C2和WW 15结构域包含E3泛素蛋白连接酶1NOS1一氧化氮合酶1MET met原癌基因SOD2超氧化物歧化酶2，HSPB1热休克27kDa线粒体蛋白1NEFL神经微丝，轻CTSB组织蛋白酶B多肽ANG血管生成素，HSPA8热休克70kDa核糖核酸酶，RNA酶A蛋白8家族，5 VAPB VAMP(囊泡-ESR1雌激素受体1相关膜蛋白)-相关蛋白B和C SNCA突触核蛋白，αHGF肝细胞生长因子CAT过氧化氢酶ACTB肌动蛋白，βNEFM神经微丝，介质TH酪氨酸羟化酶多肽BCL2B-细胞CLL/淋巴瘤2FAS Fas(TNF受体超家族，成员6)CASP3半胱天冬酶3，凋亡-CLU簇集蛋白相关半胱氨酸肽酶SMN1运动神经元的存活G6PD葡萄糖-6-磷酸1，端粒脱氢酶BAX BCL2-相关XHSF1热休克转录蛋白因子1RNF19A环指蛋白19A JUN jun癌基因ALS2CR12肌萎缩性侧索HSPA5热休克70kDa硬化2(青少年)蛋白5染色体区域，候选物12MAPK14丝裂原激活蛋白IL10白介素10激酶14APEX1APEX核酸酶TXNRD1硫氧还原蛋白还原酶1(多功能DNA修复酶)1NOS2一氧化氮合酶2，TIMP1 TIMP金属肽酶可诱导的抑制剂1 CASP9半胱天冬酶9，相关半胱氨酸凋亡肽酶的凋亡-XIAP X-连接的抑制剂GLG1高尔基体糖蛋白1EPO促红细胞生成素VEGFA血管内皮ELN弹性蛋白生长因子A GDNF胶质细胞衍生的NFE2L2核因子(红系(erythroid)-神经营养因子衍生的2)样2SLC6A3溶质载体家族6HSPA4热休克70kDa(神经递质蛋白4转运体，多巴胺)，成员3APOE载脂蛋白E PSMB8蛋白酶体(前体，巨蛋白因子)亚基，β类型，8 DCTN1动力蛋白激活蛋白(dynactin)1TIMP3TIMP金属肽酶抑制剂3KIFAP3驱动蛋白相关SLC1A1溶质载体家族1蛋白3(神经元/上皮高亲和性谷氨酸转运体，系统Xag)，成员1SMN2运动神经元的存活CCNC细胞周期蛋白C 2，着丝粒MPP4膜蛋白，STUB1STIP1同源性和U-棕榈酰化的4盒包含蛋白1 ALS2淀粉样蛋白β(A4)PRDX6过氧化物酶6前体蛋白SYP突触素CABIN1钙调磷酸酶结合蛋白1 CASP1半胱天冬酶1，凋亡-GART磷酸核糖甘氨酰胺相关半胱氨酸甲酰转移酶，肽酶磷酸核糖甘氨酰胺合成酶，磷酸核糖氨基咪唑合成酶CDK5细胞周期蛋白依赖性激酶5ATXN3共济失调蛋白3RTN4浆膜蛋白(reticulon)4 C1QB补体成分1，q亚成分，B链VEGFC神经生长因子HTT亨廷顿蛋白(huntingtin)受体PARK7帕金森病7XDH黄嘌呤脱氢酶GFAP胶质纤维酸性MAP2微管相关蛋白2 CYCS细胞色素c，躯体的FCGR3B IgG的Fc片段，低亲和性IIIb，CCS UBL5(泛素样5超氧化物歧化酶)的铜分子伴侣MMP9基质金属肽酶SLC18A3溶质载体家族18 9((囊状乙酰胆碱)，成员3TRPM7瞬时受体HSPB2热休克27kDa潜在的阳离子通道，蛋白2亚家族M，成员7AKT1 v-akt鼠胸腺瘤DERL1 Der1样结构域家族，病毒癌基因同系物1成员1CCL2趋化因子(C--C基序)NGRN突触生长相关蛋白(neugrin)，轴突配体2赘生物(outgrowth)相关GSR谷胱甘肽还原酶TPPP3促微管蛋白聚合蛋白家族成员3APAF1凋亡肽酶BTBD10BTB(POZ)结构域激活因子1包含10GLUD1谷氨酸CXCR4趋化因子(C--X--C基序)脱氢酶1受体4SLC1A3溶质载体家族1FLT1fms相关酪氨酸(胶质高亲和性谷氨酸转运体)，成员3激酶1PON1对氧磷酶1AR雄激素受体LIF白血病抑制因子ERBB3 v-erb-b2红白血病病毒癌基因同系物3LGALS1凝集素，半乳糖苷-CD44 CD44分子结合，可溶的，1TP53肿瘤蛋白p53TLR3toll样受体3GRIA1谷氨酸受体，GAPDH甘油-3-离子型的，AMPA 1磷酸脱氢酶GRIK1谷氨酸受体，DES结蛋白离子型的，红藻氨酸(kainate)1 CHAT胆碱乙酰转移酶FLT4fms相关酪氨酸激酶4 CHMP2B染色质修饰的BAG1BCL2相关蛋白2B永生基因(athanogene)MT3金属硫蛋白3 CHRNA4胆碱能受体，烟碱的，α4GSS谷胱甘肽合成酶BAK1BCL2-拮抗剂(antagonist/killer)1KDR激酶插入结构域GSTP1谷胱甘肽S-转移酶受体(III型pi 1受体酪氨酸激酶)OGG1 8-氧桥鸟嘌呤(oxoguanine)DNA IL6白介素6(干扰素，糖基化酶β2)。

该动物或细胞可以包括1、2、3、4、5、6、7、8、9、10个或更多个破坏的、编码与ALS相关的蛋白质的染色体序列以及零、1、2、3、4、5、6、7、8、9、10个或更多个编码破坏的与ALS相关的蛋白质的染色体整合序列。与ALS相关的优选蛋白包括SOD1(超氧化物歧化酶1)、ALS2(肌萎缩性侧索硬化2)、FUS(融合在肉瘤中)、TARDBP(TAR DNA结合蛋白)、VAGFA(血管内皮生长因子A)、VAGFB(血管内皮生长因子B)以及VAGFC(血管内皮生长因子C)及其任何组合。

自闭症

美国专利公开号20110023145描述了使用锌指核酸酶基因修饰与自闭症谱系障碍(ASD)相关的细胞、动物以及蛋白质。自闭症谱系障碍(ASD)是一组由社会交往和沟通的质量损伤以及行为、兴趣和活动的限制性重复和刻板性模式表征的障碍。这三种障碍自闭症、阿斯佩格综合征(AS)和未另行规定的广泛性发育障碍(PDD-NOS)是具有不同的严重程度、相关智力功能和医疗条件的同一障碍的连续体。ASD是主要由遗传决定的障碍，具有大约90％遗传力。

美国专利公开号20110023145包括编辑任何编码与ASD相关的蛋白质的染色体序列，这些序列可以被应用于本发明的CRISPR Cas系统。典型地基于与ASD相关的蛋白质与ASD的发生率或适应症的实验相关性选择与ASD相关的蛋白质。例如，相对于缺少ASD的群体，在具有ASD的群体中，与ASD相关的蛋白质的产生率或循环浓度可以升高或降低。可以使用蛋白质组技术评估蛋白质水平差异，包括但不限于蛋白质印迹、免疫组织化学染色、酶联免疫吸附测定(ELISA)以及质谱法。可替代地，可以使用基因组技术通过获得编码这些蛋白质的基因的基因表达谱而鉴定与ASD相关的蛋白质，包括但不限于DNA微阵列分析、基因表达序列分析(SAGE)以及定量实时聚合酶链式反应(Q-PCR)。

可能和与ASD相关的蛋白质相关的疾病状态或障碍的非限制性实例包括自闭症、阿斯佩格综合征(AS)、未另行规定的广泛性发育障碍(PDD-NOS)、雷特综合征、结节性硬化、苯丙酮尿症、史-伦-奥三氏综合征(Smith-Lemli-Opitz syndrome)以及脆性X综合征。通过非限制性实例的方式，与ASD相关的蛋白质包括但不限于以下蛋白质：ATP10C氨基磷脂-METMET受体转运ATP酶酪氨酸激酶(ATP10C)BZRAP1MGLUR5(GRM5)代谢型谷氨酸受体5(MGLUR5)CDH10钙粘素-10MGLUR6(GRM6)代谢型谷氨酸受体6(MGLUR6)CDH9钙粘素-9NLGN1神经连接蛋白-1 CNTN4接触蛋白-4NLGN2神经连接蛋白-2CNTNAP2接触蛋白相关的SEMA5A神经连接蛋白-3蛋白样2(CNTNAP2)DHCR7 7-脱氢胆固醇NLGN4X神经连接蛋白-4X-还原酶(DHCR7)连接的DOC2A双重C2样-结构域-NLGN4Y神经连接蛋白-4Y-包含蛋白α连接的DPP6二肽基NLGN5神经连接蛋白-5氨肽酶样蛋白6EN2锯齿状2(EN2)NRCAM神经细胞粘附分子(NRCAM)MDGA2脆性X智力迟钝NRXN1轴突蛋白-1 1(MDGA2)FMR2(AFF2)AF4/FMR2家族成员2OR4M2嗅觉受体(AFF2)4M2FOXP2叉头框蛋白P2OR4N4嗅觉受体(FOXP2)4N4FXR1脆性X智力OXTR催产素受体阻滞，常染色体(OXTR)同系物1(FXR1)FXR2脆性X智力PAH苯丙氨酸阻滞，常染色体羟化酶(PAH)同系物2(FXR2)GABRA1γ-氨基丁酸PTEN磷酸酶和受体亚基α-1张力蛋白同源物(GABRA1)(PTEN)GABRA5GABAA(.γ.-氨基丁酸PTPRZ1受体类型酸)受体α5酪氨酸蛋白亚基(GABRA5)磷酸酶ζ(PTPRZ1)GABRB1γ-氨基丁酸RELN颤蛋白受体亚基β-1(GABRB1)GABRB3GABAA(.γ.-氨基丁酸RPL10 60S核糖体酸)受体.β.3亚基蛋白L10(GABRB3)GABRG1γ-氨基丁酸SEMA5A脑信号蛋白(Semaphorin)-5A受体亚基γ-1(SEMA5A)(GABRG1)HIRIP3HIRA-相互作用蛋白3SEZ6L2发作相关6同系物(小鼠)样2HOXA1同源盒蛋白Hox-A1SHANK3SH3和多重(HOXA1)锚蛋白重复结构域3(SHANK3)IL6白介素-6SHBZRAP1SH3和多重锚蛋白重复结构域3(SHBZRAP1)LAMB1层粘连蛋白亚基β-1SLC6A4血清素(LAMB1)转运体(SERT)MAPK3丝裂原激活蛋白TAS2R1味觉受体激酶3类型2成员1TAS2R1MAZ Myc相关的锌指TSC1结节性硬化蛋白的蛋白1MDGA2MAM结构域包含TSC2结节性硬化糖基磷脂酰肌醇蛋白2锚定物2(MDGA2)MECP2甲基CpG结合UBE3A泛素蛋白蛋白2(MECP2)连接酶E3A(UBE3A)MECP2甲基CpG结合WNT2无翅型蛋白2(MECP2)MMTV整合位点家族，成员2(WNT2)。

与ASD相关的其染色体序列被编辑的蛋白质的一致性可以并且将会变化。在优选实施例中，与ASD相关的其染色体序列被编辑的蛋白质可以是由BZRAP1基因编码的苯二氮卓受体(外周)相关蛋白1(BZRAP1)、由AFF2基因编码的AF4/FMR2家族成员2蛋白(AFF2)(亦称MFR2)、由FXR1基因编码的脆性X智力迟钝常染色体同系物1蛋白(FXR1)、由FXR2基因编码的脆性X智力迟钝常染色体同系物2蛋白(FXR2)，由MDGA2基因编码的含MAM结构域的糖基磷脂酰肌醇锚定物2蛋白(MDGA2)、由MECP2基因编码的甲基CpG结合蛋白2(MECP2)、由MGLUR5-1基因编码的代谢型谷氨酸受体5(MGLUR5)(亦称GRM5)、由NRXN1基因编码的轴突蛋白1蛋白或由SEMA5A基因编码的脑信号蛋白-5A蛋白(SEMA5A)。在一个示例性实施例中，该基因修饰动物是大鼠，并且编码与ASD相关的蛋白质的编辑的染色体序列如下所列：BZRAP1苯二氮卓受体XM_002727789，(外周)相关XM_213427，蛋白1(BZRAP1)XM_002724533，XM_001081125AFF2(FMR2)AF4/FMR2家族成员2XM_219832，(AFF2)XM_001054673FXR1脆性X智力NM_001012179迟钝，常染色体同系物1(FXR1)FXR2脆性X智力NM_001100647迟钝，常染色体同系物2(FXR2)MDGA2含MAM结构域的NM_199269糖基磷脂酰肌醇锚定物2(MDGA2)MECP2甲基CpG结合NM_022673蛋白2(MECP2)MGLUR5代谢型谷氨酸NM_017012(GRM5)受体5(MGLUR5)NRXN1轴突蛋白-1NM_021767SEMA5A脑信号蛋白-5A(SEMA5A)NM_001107659。

三核苷酸重复扩增障碍(TRE)

美国专利公开号20110016540描述了使用锌指核酸酶基因修饰与三核苷酸重复扩增障碍相关的细胞、动物以及蛋白质。三核苷酸重复扩增障碍是复杂的、进行性的疾病，其涉及发育神经生物学并且常常影响认知以及感觉运动功能。

三核苷酸重复扩增蛋白是一套多样化的蛋白质，这些蛋白质与发生三核苷酸重复扩增障碍的易感性、三核苷酸重复扩增障碍的存在、三核苷酸重复扩增障碍的严重性或其任何组合相关联。三核苷酸重复扩增障碍被分为由重复类型决定的两个类别。最常见的重复是三联体CAG，当出现在一个基因的编码区中时，其编码氨基酸谷氨酰胺(Q)。因此，这些障碍被称为多聚谷氨酰胺(polyQ)障碍并且包括下列疾病：亨廷顿病(HD)；脊延髓肌萎缩症(SBMA)；脊髓小脑性共济失调(SCA型1、2、3、6、7、和17)；以及齿状红核-苍白球吕伊斯体萎缩症(Dentatorubro-Pallidoluysian Atrophy，DRPLA)。其余的三核苷酸重复扩增障碍不涉及CAG三联体，或者该CAG三联体不在该基因的编码区中，并且因此被称为非多聚谷氨酰胺障碍。非多聚谷氨酰胺障碍包括脆性X综合征(FRAXA)；脆性XE精神发育迟滞(FRAXE)；弗里德赖希共济失调(FRDA)；强直性肌营养不良(DM)；和脊髓小脑性共济失调(SCA型8、和12)。

与三核苷酸重复扩增障碍相关联的蛋白质典型地是基于三核苷酸重复扩增障碍相关性蛋白质与三核苷酸重复扩增障碍的实验性关联而选择的。例如，相对于没有三核苷酸重复扩增障碍的群体，在具有三核苷酸重复扩增障碍的群体中，与三核苷酸重复扩增障碍相关的蛋白质的产生率或循环浓度可以升高或降低。可以使用蛋白质组技术评估蛋白质水平差异，包括但不限于蛋白质印迹、免疫组织化学染色、酶联免疫吸附测定(ELISA)以及质谱法。可替代地，可以使用基因组技术通过获得编码这些蛋白质的基因的基因表达谱而鉴定与三核苷酸重复扩增障碍相关的蛋白质，包括但不限于DNA微阵列分析、基因表达系列分析(SAGE)以及定量实时聚合酶链式反应(Q-PCR)。

与三核苷酸重复扩增障碍相关联的蛋白质的非限制性实例包括AR(雄激素受体)、FMR1(脆性x精神发育迟滞1)、HTT(亨廷丁)、DMPK(肌强直性营养不良蛋白激酶)、FXN(线粒体型共济失调蛋白)、ATXN2(脊髓小脑共济失调蛋白2)、ATN1(萎缩蛋白1)、FEN1(片段结构特异内切核酸酶1)、TNRC6A(含有6A的三核苷酸重复)、PABPN1(多聚(A)结合蛋白，核1)、JPH3(亲联蛋白3)、MED15(介体复合物亚基15)、ATXN1(脊髓小脑共济失调蛋白1)、ATXN3(脊髓小脑共济失调蛋白3)、TBP(TATA盒结合蛋白)、CACNA1A(钙通道，电压依赖性，P/Q型、α1A亚基)、ATXN80S(ATXN8相反链(非蛋白质编码))、PPP2R2B(蛋白磷酸酶2，调节亚基B，β)、ATXN7(脊髓小脑共济失调蛋白7)、TNRC6B(含有6B的三核苷酸重复)、TNRC6C(含有6C的三核苷酸重复)、CELF3(CUGBP、Elav样家族成员3)、MAB21L1(mab-21-样1(秀丽隐杆线虫))、MSH2(MutS同源物2，结肠癌，无息肉病型1(大肠杆菌))、TMEM185A(跨膜蛋白185A)、SIX5(SIX同源框5)、CNPY3(冠层3同源物(斑马鱼))、FRAXE(脆性部位，叶酸型，罕见型，fra(X)(q28)E)、GNB2(鸟嘌呤核苷酸结合蛋白(G蛋白)、β多肽2)、RPL14(核糖体蛋白L14)、ATXN8(脊髓小脑共济失调蛋白8)、INSR(胰岛素受体)、TTR(转甲状腺素蛋白)、EP400(E1A结合蛋白p400)、GIGYF2(GRB10相互作用GYF蛋白2)、OGG1(8-氧鸟嘌呤DNA糖基化酶)、STC1(斯钙素1)、CNDP1(肌肽二肽酶1(金属肽酶M20家族))、C10orf2(染色体10开放阅读框2)、MAML3智者基因样3(果蝇)、DKC1(先天性角化不全症1，角化不良蛋白)、PAXIP1(PAX相互作用(具有转录激活域)蛋白1)、CASK(钙/钙调蛋白依赖性丝氨酸蛋白激酶(MAGUK家族)、MAPT(微管相关蛋白tau)、SP1(Sp1转录因子)、POLG(聚合酶(DNA指导的)，γ)、AFF2(AF4/FMR2家族，成员2)、THBS1(凝血酶敏感蛋白1)、TP53(肿瘤蛋白p53)、ESR1(雌激素受体1)、CGGBP1(CGG三联体重复结合蛋白1)、ABT1(基本转录激活因子1)、KLK3(激肽释放酶相关肽酶3)、PRNP(朊病毒蛋白)、JUN(jun癌基因)、KCNN3(钾中间/小电导钙激活通道，亚家族N，成员3)、BAX(BCL2相关X蛋白)、FRAXA(脆性部位，叶酸型，罕见型，fra(X)(q27.3)A(巨睾丸，精神发育迟滞))、KBTBD10(Kelch重复和BTB(POZ)域包含蛋白10)、MBNL1(盲肌样(果蝇))、RAD51(RAD51同源物(RecA同源物，大肠杆菌)(酿酒酵母))、NCOA3(核受体共激活因子3)、ERDA1(扩展重复结构域，CAG/CTG 1)、TSC1(结节性硬化1)、COMP(软骨寡聚基质蛋白)、GCLC(谷氨酰半胱氨酸连接酶，催化亚基)、RRAD(Ras相关关联糖尿病)、MSH3(mutS同源物3(大肠杆菌))、DRD2(多巴胺受体D2)、CD44(CD44分子(印度血型))、CTCF(CCCTC结合因子(锌指蛋白))、CCND1(细胞周期蛋白D1)、CLSPN(扣蛋白同源物(非洲爪蟾))、MEF2A(肌细胞增强因子2A)、PTPRU(蛋白酪氨酸磷酸酶，受体型，U)、GAPDH(3-磷酸甘油醛脱氢酶)、TRIM22(三基序蛋白22)、WT1(维尔姆斯瘤1)、AHR(芳香烃受体)、GPX1(谷胱甘肽过氧化物酶1)、TPMT(硫嘌呤甲基转移酶)、NDP(诺里病(假神经胶质瘤))、ARX(无芒相关同源框)、MUS81(MUS81内切核酸酶同源物(酿酒酵母))、TYR(酪氨酸酶(眼皮肤白化病IA))、EGR1(早期生长反应蛋白1)、UNG(尿嘧啶DNA糖基化酶)、NUMBL(麻木同源物(果蝇)样)、FABP2(脂肪酸结合蛋白2，肠)、EN2(锯齿状同源框2)、CRYGC(晶状体蛋白，γC)、SRP14(信号识别粒子14kDa(同源Alu RNA结合蛋白))、CRYGB(晶状体蛋白，γB)、PDCD1(程序性细胞死亡1)、HOXA1(同源框A1)、ATXN2L(脊髓小脑共济失调蛋白2样)、PMS2(PMS2减数分裂后分离增加2样蛋白(酿酒酵母))、GLA(半乳糖苷酶，α)、CBL(Cas-Br-M(鼠)热带逆转录病毒转化序列)、FTH1(铁蛋白，重多肽1)、IL12RB2(白细胞介素12受体，β2)、OTX2(正小齿同源框2)、HOXA5(同源框A5)、POLG2(聚合酶(DNA指导的)，γ2，辅助亚基)、DLX2(末端减少同源框2)、SIRPA(信号调节蛋白α)、OTX1(正小齿同源框1)、AHRR(芳香烃受体阻遏物)、MANF(中脑星形胶质细胞衍生神经营养因子)、TMEM158(跨膜蛋白158(基因/假基因))、以及ENSG00000078687。

与三核苷酸重复扩增障碍相关联的优选蛋白质包括HTT(亨廷丁)、AR(雄激素受体)、FXN(线粒体型共济失调蛋白)、Atxn3(脊髓小脑共济失调蛋白)、Atxn1(脊髓小脑共济失调蛋白)、Atxn2(脊髓小脑共济失调蛋白)、Atxn7(脊髓小脑共济失调蛋白)、Atxn10(脊髓小脑共济失调蛋白)、DMPK(肌强直性营养不良蛋白激酶)、Atn1(萎缩蛋白1)、CBP(creb结合蛋白)、VLDLR(极低密度脂蛋白受体)、及其任何组合。

阿尔茨海默病

美国专利公开号20110023153描述了使用锌指核酸酶基因修饰与阿尔茨海默病相关的细胞、动物以及蛋白质。曾经修饰的细胞和动物可以进一步使用已知的用于研究靶向突变对AD的发展和/或进展的影响的方法，使用AD研究中常用的措施进行测试-如但不限于，学习和记忆、焦虑、抑郁、成瘾、感觉运动功能以及测量行为、功能、病理、代谢和生化功能的测定。

本披露包括编码与AD相关的蛋白质的任何染色体序列的编辑。典型地基于AD相关蛋白与AD障碍的实验相关性选择AD相关蛋白。例如，相对于缺少AD障碍的群体，在具有AD障碍的群体中，AD相关蛋白的产生率或循环浓度可以升高或降低。可以使用蛋白质组技术评估蛋白质水平差异，包括但不限于蛋白质印迹、免疫组织化学染色、酶联免疫吸附测定(ELISA)以及质谱法。可替代地，可以使用基因组技术通过获得编码这些蛋白质的基因的基因表达谱而鉴定AD相关蛋白，包括但不限于DNA微阵列分析、基因表达序列分析(SAGE)以及定量实时聚合酶链式反应(Q-PCR)。

阿尔茨海默病相关蛋白的实例可以包括例如由VLDLR基因编码的极低密度脂蛋白受体蛋白(VLDLR)、由UBA1基因编码的泛素样改性剂激活酶1(UBA1)或由UBA3基因编码的NEDD8-激活酶E1催化亚基蛋白(UBE1C)。

通过非限制性实例的方式，与AD相关的蛋白质包括但不限于如下所列的蛋白质：染色体序列编码蛋白ALAS2δ-氨基酮戊酸合酶2(ALAS2)ABCA1ATP-结合盒转运体(ABCA1)ACE血管紧张素I-转化酶(ACE)APOE载脂蛋白E前体(APOE)APP淀粉样蛋白前体蛋白(APP)AQP1水通道蛋白1(AQP1)BIN1Myc盒依赖性相互作用蛋白1或桥接整合蛋白1(BIN1)BDNF脑源性神经营养因子(BDNF)BTNL8嗜乳脂蛋白样蛋白8(BTNL8)C1ORF49 1号染色体开放阅读框49 CDH4钙粘素-4 CHRNB2神经元乙酰胆碱受体亚基β-2 CKLFSF2 CKLF样MARVEL跨膜结构域-包含蛋白2(CKLFSF2)CLEC4E C型凝集素结构域家族4，成员e(CLEC4E)CLU簇集蛋白(也称为载脂蛋白J)CR1红细胞补体受体1(CR1，也称为CD35、C3b/C4b受体和免疫粘附受体)CR1L红细胞补体受体1(CR1L)CSF3R粒细胞集落刺激因子3受体(CSF3R)CST3胱抑素C或胱抑素3 CYP2C细胞色素P450 2C DAPK1死亡相关蛋白激酶1(DAPK1)ESR1雌激素受体1FCAR IgA受体的Fc片段(FCAR，也称为CD89)FCGR3B IgG的Fc片段，低亲和性IIIb，受体(FCGR3B或CD16b)FFA2游离脂肪酸受体2(FFA2)FGA纤维蛋白原(因子I)GAB2GRB2-相关结合蛋白2(GAB2)GAB2GRB2-相关结合蛋白2(GAB2)GALP甘丙肽样肽GAPDHS甘油醛-3-磷酸脱氢酶，精子发生的(GAPDHS)GMPB GMBP HP结合珠蛋白(HP)HTR7 5-羟色胺(血清素)受体7(腺苷酸环化酶偶联的)IDE胰岛素降解酶IF127IF127IFI6干扰素，α-可诱导蛋白6(IFI6)IFIT2具有三角形四肽重复的干扰素诱导的蛋白2(IFIT2)IL1RN白介素-1受体拮抗剂(IL-1RA)IL8RA白介素8受体,α(IL8RA或CD181)IL8RB白介素8受体，β(IL8RB)JAG1锯齿状1(JAG1)KCNJ15钾内向整流通道，亚家族J，成员15(KCNJ15)LRP6低密度脂蛋白受体相关蛋白6(LRP6)MAPT微管相关蛋白tau(MAPT)MARK4MAP/微管亲和性调节激酶4(MARK4)MPHOSPH1M期磷蛋白1MTHFR5,10-亚甲基四氢叶酸还原酶MX2干扰素诱导的GTP-结合蛋白Mx2NBN Nibrin，也称为NBNNCSTN呆蛋白NIACR2烟酸受体2(NIACR2，也称为GPR109B)NMNAT3烟酰胺核苷酸腺苷酰转移酶3NTM Neurotrimin(或HNT)ORM1血清类粘蛋白(Orosmucoid)1(ORM1)或α-1-酸性糖蛋白1P2RY13 P2Y嘌呤受体13(P2RY13)PBEF1烟酰胺磷酸核糖转移酶(NAmPRTase或Nampt)也称为前B细胞集落增强因子1(PBEF1)或内脂素PCK1磷酸烯醇丙酮酸羧激酶PICALM磷脂酰肌醇结合网格蛋白装配蛋白(PICALM)PLAU尿激酶型纤维蛋白溶酶原激活剂(PLAU)PLXNC1丛状蛋白(Plexin)C1(PLXNC1)PRNP朊病毒蛋白PSEN1早老素1蛋白(PSEN1)PSEN2早老素2蛋白(PSEN2)PTPRA蛋白质酪氨酸磷酸酶受体A型蛋白(PTPRA)RALGPS2具有PH结构域和SH3结合基序的Ral GEF 2(RALGPS2)RGSL2G-蛋白信号传导样调节剂2(RGSL2)SELENBP1含硒结合蛋白1(SELNBP1)SLC25A37线粒体铁转运蛋白(Mitoferrin)-1SORL1含分拣蛋白相关受体L(DLR类别)A重复的蛋白质(SORL1)TF转铁蛋白TFAM线粒体转录因子A TNF肿瘤坏死因子TNFRSF10C肿瘤坏死因子受体超家族成员10C(TNFRSF10C)TNFSF10肿瘤坏死因子受体超家族，(TRAIL)成员10a(TNFSF10)UBA1泛素样改性剂激活酶1(UBA1)UBA3NEDD8-激活酶E1催化亚基蛋白(UBE1C)UBB泛素B蛋白(UBB)UBQLN1泛醌蛋白(Ubiquilin)-1UCHL1泛素羧基末端酯酶L1蛋白(UCHL1)UCHL3泛素羧基末端水解酶同工酶L3蛋白(UCHL3)VLDLR极低密度脂蛋白受体蛋白(VLDLR)。

在示例性实施例中，与AD相关的其染色体序列被编辑的蛋白质可以是由VLDLR基因编码的极低密度脂蛋白受体蛋白(VLDLR)、由UBA1基因编码的泛素样改性剂激活酶1(UBA1)、由UBA3基因编码的NEDD8-激活酶E1催化亚基蛋白(UBE1C)、由AQP1基因编码的水通道蛋白1(AQP1)、由UCHL1基因编码的泛素羧基末端酯酶L1蛋白(UCHL1)、由UCHL3基因编码的泛素羧基末端水解酶同工酶L3蛋白(UCHL3)、由UBB基因编码的泛素B蛋白(UBB)、由MAPT基因编码的微管相关蛋白tau(MAPT)、由PTPRA基因编码的蛋白质酪氨酸磷酸酶受体A型蛋白(PTPRA)、由PICALM基因编码的磷脂酰肌醇结合网格蛋白装配蛋白(PICALM)、由CLU基因编码的簇集蛋白(也称为载脂蛋白J)、由PSEN1基因编码的早老素1蛋白、由PSEN2基因编码的早老素2蛋白、由SORL1基因编码的含分拣蛋白相关受体L(DLR类别)A重复的蛋白质(SORL1)蛋白质、由APP基因编码的淀粉样蛋白前体蛋白(APP)、由APOE基因编码的载脂蛋白E前体(APOE)或由BDNF基因编码的脑源性神经营养因子(BDNF)。在一个示例性实施例中，该基因修饰动物是大鼠，并且编码与AD相关的蛋白质的编辑的染色体序列如下：APP淀粉样蛋白前体蛋白(APP)NM_019288AQP1水通道蛋白1(AQP1)NM_012778BDNF脑源性神经营养因子NM_012513 CLU簇集蛋白(也称为NM_053021载脂蛋白J)MAPT微管相关蛋白NM_017212tau(MAPT)PICALM磷脂酰肌醇结合NM_053554网格蛋白装配蛋白(PICALM)PSEN1早老素1蛋白(PSEN1)NM_019163PSEN2早老素2蛋白(PSEN2)NM_031087PTPRA酪氨酸磷酸酶NM_012763受体A型蛋白(PTPRA)SORL1含分拣蛋白相关受体L(DLR NM_053519，类别)A重复的XM_001065506，蛋白质(SORL1)XM_217115UBA1泛素样改性剂激活NM_001014080酶1(UBA1)UBA3NEDD8-激活酶E1NM_057205催化亚基蛋白(UBE1C)UBB泛素B蛋白(UBB)NM_138895UCHL1泛素羧基末端NM_017237酯酶L1蛋白(UCHL1)UCHL3泛素羧基末端NM_001110165水解酶同工酶L3蛋白(UCHL3)VLDLR极低密度脂蛋白NM_013155受体蛋白(VLDLR)。

该动物或细胞可以包括1、2、3、4、5、6、7、8、9、10、11、12、13、14、15个或更多个破坏的、编码与AD相关的蛋白质的染色体序列以及零、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15个或更多个编码与AD相关的蛋白质的染色体整合序列。

编辑的或整合的染色体序列可以被修饰为编码一种改变的与AD相关的蛋白质。AD相关染色体序列中的许多突变已经与AD相关。例如，APP中的V7171(即位置717处的缬氨酸变为异亮氨酸)错义突变引起家族性AD。早老素-1蛋白中的多重突变，如H163R(即位置163处的组氨酸变为精氨酸)、A246E(即位置246处的丙氨酸变为谷氨酸)、L286V(即位置286处的亮氨酸变为缬氨酸)以及C410Y(即位置410处的半胱氨酸变为酪氨酸)引起家族性3型阿尔茨海默病。早老素-2蛋白中的突变，如N141I(即位置141处的天冬酰胺变为异亮氨酸)、M239V(即位置239处的甲硫氨酸变为缬氨酸)以及D439A(即位置439处的天冬氨酸变为丙氨酸)引起家族性4型阿尔茨海默病。AD相关基因和疾病的遗传变体的其他相关性在本领域是已知的。参见例如，韦林(Waring)等人(2008)《神经病学年鉴》(Arch.Neurol.)65:329-334，将其披露通过引用以其全文并入本文。

疾病相关基因的实例

疾病相关基因和多核苷酸的实例列于表A和B中。信号传导生化途径相关基因和多核苷酸的实例列于表C中。

示例性靶基因、靶座位、靶多核苷酸的清单

分泌酶障碍

美国专利公开号20110023146描述了使用锌指核酸酶基因修饰与分泌酶相关障碍相关的细胞、动物以及蛋白质。分泌酶对于将前蛋白加工成其生物活性形式是必需的。分泌酶途径的各种组分的缺陷促成许多障碍，特别是具有标志性淀粉样蛋白生成或淀粉样蛋白斑块的那些，如阿尔茨海默病(AD)。

分泌酶障碍以及与这些障碍相关的蛋白质是一套影响众多障碍的易感性、障碍的存在、障碍的严重性或其任何组合的相异蛋白质。本披露包括编码与分泌酶障碍相关的蛋白质的任何染色体序列的编辑。典型地基于分泌酶相关蛋白质与分泌酶障碍的发展的实验相关性选择与分泌酶障碍相关的蛋白质。例如，相对于没有分泌酶障碍的群体，在具有分泌酶障碍的群体中，与分泌酶障碍相关的蛋白质的产生率或循环浓度可以升高或降低。可以使用蛋白质组技术评估蛋白质水平差异，包括但不限于蛋白质印迹、免疫组织化学染色、酶联免疫吸附测定(ELISA)以及质谱法。可替代地，可以使用基因组技术通过获得编码这些蛋白质的基因的基因表达谱而鉴定与分泌酶障碍相关的蛋白质，包括但不限于DNA微阵列分析、基因表达序列分析(SAGE)以及定量实时聚合酶链式反应(Q-PCR)。

通过非限制性实例的方式，与分泌酶障碍相关的蛋白质包括PSENEN(早老素增强子2同系物(秀丽隐杆线虫))、CTSB(组织蛋白酶B)、PSEN1(早老素1)、APP(淀粉样蛋白β(A4)前体蛋白)、APH1B(前咽缺陷1同系物B(秀丽隐杆线虫))、PSEN2(早老素2(阿尔茨海默病4))、BACE1(β-位点APP-切割酶1)、ITM2B(膜内在蛋白2B)、CTSD(组织蛋白酶D)、NOTCH1(Notch同系物1、易位相关(果蝇))、TNF(肿瘤坏死因子(TNF超家族，成员2))、INS(胰岛素)、DYT10(肌张力障碍10)、ADAM17(ADAM金属肽酶结构域17)、APOE(载脂蛋白E)、ACE(血管紧张素I转化酶(肽基二肽酶A)1)、STN(他汀)、TP53(肿瘤蛋白p53)、IL6(白介素6(干扰素，β2))、NGFR(神经生长因子受体(TNFR超家族，成员16))、IL1B(白介素1，β)、ACHE(乙酰胆碱酯酶(Yt血型))、CTNNB1(连环蛋白(钙粘素相关蛋白)，β1，88kDa)、IGF1(胰岛素样生长因子1(生长调节素C))、IFNG(干扰素，γ)、NRG1(神经调节蛋白1)、CASP3(半胱天冬酶3，凋亡相关半胱氨酸肽酶)、MAPK1(丝裂原激活蛋白激酶1)、CDH1(钙粘素1，1型，E-钙粘素(上皮))、APBB1(淀粉样蛋白β(A4)前体蛋白结合，家族B，成员1(Fe65))、HMGCR(3-羟基-3-甲基戊二酰-辅酶A还原酶)、CREB1(cAMP反应组件结合蛋白1)、PTGS2(前列腺素内过氧化物合酶2(前列腺素G/H合酶和环氧合酶))、HES1(长毛和裂口增强蛋白(hairy and enhancer of split)1，(果蝇))、CAT(过氧化氢酶)、TGFB1(转化生长因子，β1)、ENO2(烯醇酶2(γ，神经元的))、ERBB4(v-erb-a红白血病病毒癌基因同系物4(禽的))、TRAPPC10(运输蛋白粒子复合物10)、MAOB(单胺氧化酶B)、NGF(神经生长因子(β多肽))、MMP12(基质金属肽酶12(巨噬细胞弹性蛋白酶))、JAG1(锯齿状1(艾欧吉勒综合征(Alagille syndrome)))、CD40LG(CD40配体)、PPARG(过氧化物酶体增殖剂激活的受体γ)、FGF2(成纤维细胞生长因子2(碱性的))、IL3(白介素3(集落刺激因子，多重的))、LRP1(低密度脂蛋白受体相关蛋白1)、NOTCH4(Notch同系物4(果蝇))、MAPK8(丝裂原激活蛋白激酶8)、PREP(脯氨酰内肽酶)、NOTCH3(Notch同系物3(果蝇))、PRNP(朊病毒蛋白)、CTSG(组织蛋白酶G)、EGF(表皮生长因子(β-尿抑胃素))、REN(肾素)、CD44(CD44分子(印度血型))、SELP(选择素P(颗粒膜蛋白140kDa，抗原CD62))、GHR(生长激素体)、ADCYAP1(腺苷酸环化酶激活多肽1(脑垂体的))、INSR(胰岛素受体)、GFAP(胶质酸性蛋白)、MMP3(基质金属肽酶3(溶基质素1，前明胶酶(progelatinase)))、MAPK10(丝裂原激活蛋白激酶10)、SP1(Sp1转录因子)、MYC(v-myc骨髓细胞瘤病病毒癌基因同系物(禽的))、CTSE(组织蛋白酶E)、PPARA(过氧化物酶体增殖剂激活受体α)、JUN(jun癌基因)、TIMP1(TIMP金属肽酶抑制剂1)、IL5(白介素5(集落刺激因子，嗜酸性粒细胞))、IL1A(白介素1,α)、MMP9(基质金属肽酶9(明胶酶B，92kDa明胶酶，92kDa IV型胶原酶))、HTR4(5-羟色胺(血清素)受体4)、HSPG2(硫酸乙酰肝素蛋白多糖2)、KRAS(v-Ki-ras2柯尔斯顿(Kirsten)大鼠肉瘤病毒癌基因同系物)、CYCS(细胞色素c，躯体的)、SMG1(SMG1同系物，磷脂酰肌醇3-激酶相关激酶(秀丽隐杆线虫))、IL1R1(白介素1受体，I型)、PROK1(前动力蛋白1)、MAPK3(丝裂原激活蛋白激酶3)、NTRK1(神经营养酪氨酸激酶受体，1型)、IL13(白介素13)、MME(膜金属内肽酶)、TKT(转酮醇酶)、CXCR2(趋化因子(C-X-C基序)受体2)、IGF1R(胰岛素样生长因子1受体)、RARA(视黄酸受体，α)、CREBBP(CREB结合蛋白)、PTGS1(前列腺素内过氧化物合酶1(前列腺素G/H合酶和环氧合酶))、GALT(半乳糖-1-磷酸尿甙基转移酶(uridylyltransferase))、CHRM1(胆碱能受体，毒蕈碱1)、ATXN1(共济失调蛋白1)、PAWR(PRKC，凋亡，WT1，调节剂)、NOTCH2(Notch同系物2(果蝇))、M6PR(甘露糖-6-磷酸受体(阳离子依赖性的))、CYP46A1(细胞色素P450，家族46、亚家族A，多肽1)、CSNK1D(酪蛋白激酶1，δ)、MAPK14(丝裂原激活蛋白激酶14)、PRG2(蛋白多糖2，骨髓(自然杀伤细胞激活剂，嗜酸性粒细胞颗粒主要碱性蛋白))、PRKCA(蛋白激酶C，α)、L1 CAM(L1细胞粘附分子)、CD40(CD40分子，TNF受体超家族成员5)、NR1I2(核受体亚家族1，I组，成员2)、JAG2(锯齿状2)、CTNND1(连环蛋白(钙粘素相关蛋白)、δ1)、CDH2(钙粘素2，1型、N-钙粘素(神经元的))、CMA1(糜酶1、肥大细胞)、SORT1(分拣蛋白1)、DLK1(δ样1同系物(果蝇))、THEM4(硫酯酶超家族成员4)、JUP(连接斑珠蛋白(junction plakoglobin))、CD46(CD46分子，补体调节蛋白)、CCL11(趋化因子(C-C基序)配体11)、CAV3(小窝蛋白3)、RNASE3(核糖核酸酶，RNA酶A家族、3(嗜酸性粒细胞阳离子蛋白))、HSPA8(热休克70kDa蛋白8)、CASP9(半胱天冬酶9，凋亡相关半胱氨酸肽酶)、CYP3A4(细胞色素P450，家族3，亚家族A，多肽4)、CCR3(趋化因子(C-C基序)受体3)、TFAP2A(转录因子AP-2α(激活增强子结合蛋白2α))、SCP2(固醇载体蛋白2)、CDK4(细胞周期蛋白依赖性激酶4)、HIF1A(缺氧可诱导的因子1，α亚基(基本螺旋-环-螺旋转录因子))、TCF7L2(转录因子7样2(T细胞特异的，HMG盒))、IL1R2(白介素1受体，II型)、B3GALTL(β1,3-半乳糖转移酶样)、MDM2(Mdm2p53结合蛋白同系物(小鼠))、RELA(v-rel网状内皮组织增殖病毒癌基因同系物A(禽的))、CASP7(半胱天冬酶7，凋亡相关半胱氨酸肽酶)、IDE(胰岛素降解酶)、FABP4(脂肪酸结合蛋白4，脂肪细胞)、CASK(钙/钙调蛋白依赖性丝氨酸蛋白激酶(MAGUK家族))、ADCYAP1R1(腺苷酸环化酶激活多肽1(脑垂体的)受体类型I)、ATF4(激活转录因子4(tax-反应增强子组件B67))、PDGFA(血小板衍生的生长因子α多肽)、C21或f33(21号染色体开放阅读框33)、SCG5(分泌粒蛋白V(7B2蛋白))、RNF123(环指蛋白123)、NFKB1(B细胞中的κ轻多肽基因增强子的核因子1)、ERBB2(v-erb-b2红白血病病毒癌基因同系物2、神经/胶质母细胞瘤衍生的癌基因同系物(禽的))、CAV1(小窝蛋白1，胞膜窖蛋白，22kDa)、MMP7(基质金属肽酶7(基质溶解素，子宫的))、TGFA(转化生长因子，α)、RXRA(类视黄醇X受体，α)、STX1A(突触融合蛋白1A(脑的))、PSMC4(蛋白酶体(前体，巨蛋白因子)26S亚基，ATP酶，4)、P2RY2(嘌呤能受体P2Y，G蛋白偶联的，2)、TNFRSF21(肿瘤坏死因子受体超家族，成员21)、DLG1(discs，大的同系物1(果蝇))、NUMBL(numb同系物(果蝇)样)、SPN(涎福林(sialophorin))、PLSCR1(磷脂混杂酶1)、UBQLN2(泛醌蛋白2)、UBQLN1(泛醌蛋白1)、PCSK7(前蛋白转化酶枯草杆菌/科信(kexin)类型7)、SPON1(脊椎蛋白1，细胞外基质蛋白)、SILV(西尔弗(silver)同系物(小鼠))、QPCT(谷氨酰胺-肽环转移酶)、HESS(长毛和裂口增强蛋白5(果蝇))、GCC1(GRIP和含卷曲螺旋结构域的1)及其任何组合。

该基因修饰动物或细胞可以包括1、2、3、4、5、6、7、8、9、10个或更多个破坏的、编码与分泌酶障碍相关的蛋白质的染色体序列以及零、1、2、3、4、5、6、7、8、9、10个或更多个编码破坏的与分泌酶障碍相关的蛋白质的染色体整合序列。

靶向肝脏或肝脏细胞；血友病

提供了靶向肝脏细胞。这可以是在体外或体内。肝细胞是优选的。递送CRISPR蛋白可以是经由病毒载体，尤其是AAV(并且特别是AAV2/6)载体。这些可以通过静脉注射给予。

针对肝脏的优选靶标，无论在体外还是在体内，是白蛋白基因。在白蛋白以非常高的水平表达时这是一种所谓的‘安全港’，所以在成功的基因编辑之后白蛋白的产生的某些降低被耐受。这也是优选的，因为即使仅一小部分肝细胞被编辑，在从白蛋白启动子/增强子所见的高水平表达允许实现有用水平的正确或转基因生产(从插入的供体模板)。

白蛋白的内含子1已经由韦克斯勒(Wechsler)等人显示(在美国血液学会第57届年度会议上报道-摘要可在线获得于https://ash.confex.com/ash/2015/webprogram/Paper86495.html，并且呈现于2015年12月6日)为是适合的靶位点。他们的工作使用了Zn指，以在此靶位点处切割DNA，并且可以产生适合的指导序列以指导在该相同位点处由CRISPR蛋白的切割。

使用在高度表达的基因(具有高度活性增强子/启动子的基因)内的靶标如白蛋白还可以允许使用无启动子的供体模板，如由韦克斯勒(Wechsler)等人所报道，并且这在肝脏靶向之外也是广泛可应用的。其他高度表达的基因的实例是已知的。

肝脏相关的血液障碍，尤其是血友病并且特别是B型血友病

对肝细胞的成功的基因编辑已经在小鼠(体外和体内两者)中和在非人类灵长类(体内)中实现，显示在肝细胞中通过基因编辑/基因组工程化治疗血液障碍是可行的。具体地，在非人类灵长类中已经示出在肝细胞中人类F9(hF9)基因的表达，指示在人类中B型血友病的治疗。

韦克斯勒(Wechsler)等人在在美国血液学会第57届年度会议上(摘要发表于2015年12月6日，并且可在线获得于https://ash.confex.com/ash/2015/webprogram/Paper86495.html)报道，他们已经成功地通过体内基因编辑在非人类灵长类中从肝细胞表达了人类F9(hF9)。这是使用1)靶向白蛋白座位的内含子1的两个锌指核酸酶(ZFN)，和2)人类F9供体模板构建体来实现的。ZFN和供体模板是在静脉内注射的分开的嗜肝腺相关病毒血清型2/6(AAV2/6)载体上被编码，导致在一定比例的肝脏肝细胞中hF9基因的校正拷贝向白蛋白座位中的靶向插入。

白蛋白座位被选择为“安全港”，因为这种最丰富的血浆蛋白的产生超过10g/天，并且在那些水平上的适度减少是被良好耐受的。基因组编辑的肝细胞产生治疗量的正常hFIX(hF9)，而非白蛋白，由高度活性白蛋白增强子/启动子驱动。在白蛋白座位处hF9转基因的靶向整合以及该基因剪接为白蛋白转录物被示出。

小鼠研究：以1.0x1013载体基因组(vg)/kg，经由尾静脉注射给予C57BL/6小鼠运载体(n＝20)或编码小鼠替代试剂的AAV2/6载体(n＝25)。在治疗的小鼠中血浆hFIX的ELISA分析显示峰值水平为50-1053ng/mL，维持了6个月研究的持续时间。来自小鼠血浆的FIX活性的分析确证了与表达水平相称的生物活性。

非人类灵长类(NHP)研究：在此大动物模型中，以1.2x 1013vg/kg(n＝5/组)单一静脉内共输注编码NHP靶向的白细胞特异性ZFN的AAV2/6载体和人类F9供体，导致>50ng/mL(正常的>1％)。使用更高的AAV2/6剂量(高达1.5x 1014vg/kg)在一些动物中产生高达1000ng/ml(或正常的20％)以及在单一动物中产生高达2000ng/ml(或正常的50％)的血浆hFIX水平，持续研究的持续时间(3个月)。

该治疗在小鼠和NHP中被良好耐受，其中在任何物种中在治疗剂量下，不具有与AAV2/6ZFN+供体治疗相关的显着毒物学发现。圣加蒙(Sangamo)(加利福尼亚州，美国)自从应用至FDA起已经被授予允许执行体内基因组编辑应用的世界上首个人类临床试验。这是在EMEA批准脂蛋白脂肪酶缺陷的阿利泼金(Glybera)基因疗法治疗之后进行的。

因此，在一些实施例中，优选的是使用以下的任一个或全部：

·AAV(尤其是AAV2/6)载体，优选通过静脉注射给予；

·白蛋白，作为用于转基因/模板的基因编辑/插入的靶标-尤其是在白蛋白的内含子1处；

·人类F9供体模板；和/或

·无启动子供体模板。

B型血友病

因此，在一些实施例中，优选的是本发明用于治疗B型血友病。这样优选的是提供模板并且这是人类F9基因。将了解的是，该hF9模板包括wt或‘正确’形式的hF9，这样使得治疗是有效的。

在一个替代实施例中，B型血友病形式的F9可以被递送以便创建模型生物、细胞或细胞系(例如鼠类或非人类灵长类模型生物，细胞或细胞系)，该模型生物、细胞或细胞系具有或携带B型血友病表型，即不能产生wt F9。

A型血友病

在一些实施例中，F9(因子IX)基因可以被上述F8(因子VIII)基因替代，导致A型血友病的治疗(通过提供正确的F8基因)和/或创建A型血友病模型生物、细胞或细胞系(通过提供不正确的A型血友病形式的F8基因)。

C型血友病

在一些实施例中，F9(因子IX)基因可以被上述F11(因子XI)基因替代，导致C型血友病的治疗(通过提供正确的F11基因)和/或创建C型血友病模型生物、细胞或细胞系(通过提供不正确的C型血友病形式的F11基因)。

其他病况

囊性纤维化(CF)

在一些实施例中，提供了治疗、预防或诊断囊性纤维化。该靶标优选地是SCNN1A或CFTR基因。这描述于WO 2015157070，将其披露通过引用特此结合。

癌症和CAR-T

在一些实施例中，提供了治疗、预防或诊断囊性纤维化。该靶标优选是FAS、BID、CTLA4、PDCD1、CBLB、PTPN6、TRAC或TRBC基因中的一个或多个。该癌症可以是以下项中的一种或多种：淋巴瘤、慢性淋巴细胞性白血病(CLL)、B细胞急性淋巴细胞性白血病(B-ALL)、急性成淋巴细胞性白血病、急性髓细胞性白血病、非霍奇金氏淋巴瘤(NHL)、弥漫性大细胞淋巴瘤(DLCL)、多发性骨髓瘤、肾细胞癌(RCC)、成神经细胞瘤、结直肠癌、乳腺癌、卵巢癌、黑色素瘤、肉瘤、前列腺癌、肺癌、食管癌、肝细胞癌、胰腺癌、星形细胞瘤、间皮瘤、头颈癌、以及成神经管细胞瘤。这可以用工程化嵌合抗原受体(CAR)T细胞来实施。这描述于WO2015161276，将其披露通过引用特此结合。

单纯疱疹病毒1和2

在一些实施例中，提供了HSV-1(单纯疱疹病毒1)的治疗、预防或诊断。该靶标优选是在HSV-1中的UL19、UL30、UL48或UL50基因。这描述于WO 2015153789，将其披露通过引用特此结合。

在其他实施例中，提供了HSV-2(单纯疱疹病毒2)的治疗、预防或诊断。该靶标优选是在HSV-2中的UL19、UL30、UL48或UL50基因。这描述于WO 2015153791，将其披露通过引用特此结合。

本发明可以进一步基于CFISPR-Cas9开发的方面、以及如在以下文章(特此通过引用结合于此，并且特别是在涉及在细胞和生物中递送CRISPR蛋白复合物和使用RNA指导的内切核酸酶时)中列出的用途来说明和延伸：

使用CRISPR/Cas系统进行的多元基因组工程化(Multiplex genome engineeringusing CRISPR/Cas systems)。丛(Cong)，L.、兰(Ran)，F.A.、科克斯(Cox)D.、林(Lin)，S.、巴雷德(Barretto)，R.、哈比卜(Habib)，N.、徐(Hsu)，P.D.、武(Wu)，X.、江(Jiang)，W.、马拉菲尼(Marraffini)，L.A.，&张(Zhang)，F.《科学》(Science)2月15日；339(6121):819-23(2013)；

使用CRISPR-Cas系统对细菌基因组进行RNA-指导的编辑(RNA-guided editing ofbacterial genomes using CRISPR-Cas systems)。江(Jiang)W.、比卡德(Bikard)D.、科克斯(Cox)D.、张(Zhang)F、马拉菲尼(Marraffini)LA.《自然生物技术》(Nat BiotechnolMar)；31(3):233-9(2013)；

通过CRISPR/Cas-介导的基因组工程化在多基因中携带突变的小鼠的一步产生(One-Step Generation of Mice Carrying Mutations in Multiple Genes by CRISPR/Cas-Mediated Genome Engineering)。王(Wang)H.、杨(Yang)H.、奇瓦里拉(Shivalila)CS.、多拉蒂(Dawlaty)MM.、程(Cheng)AW.、张(Zhang)F.、耶尼施(Jaenisch)R.《细胞》(Cell)5月9日；153(4):910-8(2013)；

哺乳动物内源转录和外遗传状态的光控制(Optical control of mammalianendogenous transcription and epigenetic states)。科纳曼(Konermann)S、布里格姆(Brigham)MD、特里维诺(Trevino)AE、徐(Hsu)PD、海登里希(Heidenreich)M、丛(Cong)L、普莱特(Platt)RJ、斯科特(Scott)DA、丘奇(Church)GM、张(Zhang)F.《自然》(Nature).8月22日；500(7463):472-6.doi:10.1038/Nature12466.电子公开于2013年8月23日(2013)；

通过RNA指导的CRISPR Cas9进行的双切以用于增强的基因组编辑特异性(DoubleNicking by RNA-Guided CRISPR Cas9for Enhanced Genome Editing Specificity)。兰(Ran)，FA.、徐(Hsu)，PD.、林(Lin)，CY.、古滕伯格(Gootenberg)，JS.、科纳曼(Konermann)，S.、特里维诺(Trevino)，AE.、斯科特(Scott)，DA.、井上(Inoue)，A.、马托巴(Matoba)，S.、张(Zhang)，Y.，&张(Zhang)，F.《细胞》(Cell)8月28日.pii:S0092-8674(13)01015-5.(2013-A)；

RNA指导的Cas9核酸酶的DNA靶向特异性(DNA targeting specificity of RNA-guided Cas9nucleases)。徐(Hsu)，P.、斯科特(Scott)，D.、温斯坦(Weinstein)，J.、兰(Ran)，FA.、科纳曼(Konermann)，S.、阿格瓦拉(Agarwala)，V.、李(Li)，Y.、法恩(Fine)，E.、吴(Wu)，X.、沙勒姆(Shalem)，O.、克拉迪克(Cradick)，TJ.、马拉菲尼(Marraffini)，LA.、包(Bao)，G.，&张(Zhang)，F.《自然生物技术》(Nat Biotechnol)doi:10.1038/nbt.2647(2013)；

使用CRISPR-Cas9系统进行的基因组工程化(Genome engineering using theCRISPR-Cas9 system)。兰(Ran)，FA.、徐(Hsu)，PD.、赖特(Wright)，J.、阿格瓦拉(Agarwala)，V.、斯科特(Scott)，DA.、张(Zhang)，F.《自然工具》(Nature Protocols)十一月；8(11):2281-308(2013-B)；

在人类细胞中基因组规模CRISPR-Cas9敲除筛选(Genome-Scale CRISPR-Cas9Knockout Screening in Human Cells)。Shalem,O.,Sanjana,NE.,Hartenian,E.,Shi,X.,Scott,DA.,Mikkelson,T.,Heckl,D.,Ebert,BL.,Root,DE.,Doench,JG.,Zhang,F.ScienceDec 12.(2013).[电子版先于印刷版]；

在与指导RNA和靶DNA复合物中的cas9的晶体结构(Crystal structure of cas9in complex with guide RNA and target DNA)。尼氏玛素(Nishimasu)，H.、兰(Ran)，FA.、徐(Hsu)，PD.、科纳曼(Konermann)，S.、舍哈塔(Shehata)，SI.、多米耶(Dohmae)，N.、石谷(Ishitani)，R.、张(Zhang)，F.、努尔基(Nureki)，O.《细胞》(Cell)2月27日.156(5):935-49(2014)；

在哺乳动物细胞中CRISPR内切核酸酶Cas9的基因组宽结合(Genome-wide bindingof the CRISPR endonuclease Cas9 in mammalian cells)。吴(Wu)X.、斯科特(Scott)DA.、凯里兹(Kriz)AJ.、邱(Chiu)AC.、徐(Hsu)PD.、达东(Dadon)DB.、程(Cheng)AW.、特里维诺(Trevino)AE.、科纳曼(Konermann)S.、陈(Chen)S.、耶尼施(Jaenisch)R.、张(Zhang)F.、夏普(Sharp)PA.《自然生物技术》(Nat Biotechnol.)4月20日.doi:10.1038/nbt.2889(2014)；

用于基因组编辑和癌模造的CRISPR-Cas9敲入小鼠(CRISPR-Cas9Knockin Micefor Genome Editing and Cancer Modeling.)普莱特(Platt)RJ、陈(Chen)S、周(Zhou)Y、严(Yim)MJ、西奇(Swiech)L、肯普顿(Kempton)HR、达尔曼(Dahlman)JE、帕纳斯(Parnas)O、艾森豪威尔(Eisenhaure)TM、约瓦诺维奇(Jovanovic)M、格拉哈姆(Graham)DB、加加瓦拉(Jhunjhunwala)S、海登赖希(Heidenreich)M、泽维尔(Xavier)RJ、兰格(Langer)R、安德森(Anderson)DG、哈科恩(Hacohen)N、雷格夫(Regev)A、冯(Feng)G、夏普(Sharp)PA、张(Zhang)F.《细胞》(Cell)159(2):440-455DOI:10.1016/j.cell.2014.09.014(2014)；

用于基因组工程化的CRISPR-Cas9的开发与应用(Development and Applicationsof CRISPR-Cas9for Genome Engineering)，徐(Hsu)PD、兰德(Lander)ES、张(Zhang)F.《细胞》(Cell).6月5日；157(6):1262-78(2014)。

使用CRISPR/Cas9系统在人类细胞中进行遗传筛选(Genetic screens in humancells using the CRISPR/Cas9system)，王(Wang)T、魏(Wei)JJ、萨巴蒂尼(Sabatini)DM、兰德(Lander)ES.，《科学》(Science).1月3日；343(6166):80-84.doi:10.1126/science.1246981(2014)；

用于CRISPR-Cas9介导的基因失活的高活性sgRNA的合理设计(Rational designof highly active sgRNAs for CRISPR-Cas9-mediated gene inactivation)，多恩奇(Doench)JG、哈特尼(Hartenian)E、格拉哈姆(Graham)DB、托索瓦(Tothova)Z、赫格德(Hegde)M、斯密斯(Smith)I、苏兰德(Sullender)M、埃伯特(Ebert)BL、泽维尔(Xavier)RJ、罗特(Root)DE.(在线公开于2014年9月3日)《自然生物技术》(Nat Biotechnol).12月；32(12):1262-7(2014)；

使用CRISPR-Cas9在哺乳动物脑中的基因功能的体内探询(In vivointerrogation of gene function in the mammalian brain using CRISPR-Cas9)，斯维希(Swiech)L、海登赖希(Heidenreich)M、班纳吉(Banerjee)A、哈比卜(Habib)N、李(Li)Y、特龙贝塔(Trombetta)J、苏尔(Sur)M、张(Zhang)F.，(在线公开于2014年10月19日)《自然生物技术》(Nat Biotechnol).1月；33(1):102-6(2015)；

用工程化的CRISPR-Cas9复合物进行的基因组范围内的转录激活(Genome-scaletranscriptional activation by an engineered CRISPR-Cas9 complex)，康纳尔曼(Konermann)S、布里格姆(Brigham)MD、特雷维诺(Trevino)AE、俊(Joung)J、阿巴迪(Abudayyeh)OO、巴尔塞纳(Barcena)C、徐(Hsu)PD、哈比卜(Habib)N、古滕伯格(Gootenberg)JS、尼氏玛素(Nishimasu)H、努尔基(Nureki)O、张(Zhang)F.，《自然》(Nature).1月29日；517(7536):583-8(2015)。

用于可诱导的基因组编辑和转录调节的分离-Cas9构造(A split-Cas9architecture for inducible genome editing and transcription modulation)，蔡彻(Zetsche)B、沃尔兹(Volz)SE、张(Zhang)F.，(在线公开于2015年2月02日)《自然生物技术》(Nat Biotechnol).2月；33(2):139-42(2015)；

在肿瘤生长和转移的小鼠模型中基因组范围的CRISPR筛选(Genome-wide CRISPRScreen in a Mouse Model of Tumor Growth and Metastasis)，陈(Chen)S、桑吉那(Sanjana)NE、郑(Zheng)K、沙勒姆(Shalem)O、李(Lee)K、史(Shi)X、斯科特(Scott)DA、宋(Song)J、潘(Pan)JQ、维斯乐德(Weissleder)R、李(Lee)H、张(Zhang)F、夏普(Sharp)PA.《细胞》(Cell)160,1246-1260,2015年3月12日(在小鼠中多元筛选)，以及

使用金黄色葡萄球菌Cas9进行体内基因组编辑(In vivo genome editing usingStaphylococcus aureus Cas9)，兰(Ran)FA、丛(Cong)L、闫(Yan)WX、斯科特(Scott)DA、古滕伯格(Gootenberg)JS、凯里兹(Kriz)AJ、蔡彻(Zetsche)B、沙勒姆(Shalem)O、吴(Wu)X、马卡洛娃(Makarova)KS、库宁(Koonin)EV、夏普(Sharp)PA、张(Zhang)F.，(在线公开于2015年4月01日),《自然》(Nature).4月9日；520(7546):186-91(2015)。

沙勒姆(Shalem)等人，“使用CRISPR-Cas9的高通量功能基因组学(High-throughput functional genomics using CRISPR-Cas9)”，《自然综述遗传学》(NatureReviews Genetics)16,299-311(2015年5月)。徐(Xu)等人，“改进的CRISPR sgRNA设计的序列决定物(Sequence determinants of improved CRISPR sgRNA design)”，《基因组研究》(Genome Research)25,1147-1157(2015年8月)。

帕纳斯(Parnas)等人，“在初级免疫细胞中基因组范围的CRISPR筛选以剖析调节网络(A Genome-wide CRISPR Screen in Primary Immune Cells to Dissect RegulatoryNetworks)”，《细胞》(Cell)162,675-686(2015年7月30日)。

罗马南(Ramanan)等人，“病毒DNA的CRISPR/Cas9切割有效地抑制乙型肝炎病毒(CRISPR/Cas9cleavage of viral DNA efficiently suppresses hepatitis B virus)”，《科学报告》(Scientific Reports)5:10833.doi:10.1038/srep10833(2015年6月2日)

尼氏玛素(Nishimasu)等人，“金黄色葡萄球Cas9的晶体结构(Crystal Structureof Staphylococcus aureus Cas9)”，《细胞》(Cell)162，1113-1126(2015年8月27日)

通过Cas9介导的原位饱和诱变切开BCL11A增强子(BCL11A enhancer dissectionby Cas9-mediated in situ saturating mutagenesis)，詹韦尔(Canver)等人，《自然》(Nature)527(7577):192-7(2015年11月12日)doi:10.1038/nature15521.电子公开于2015年9月16日。

Cpf1是第2类CRISPR-Cas系统的单一RNA指导的内切核酸酶(Cpf1Is a SingleRNA-Guided Endonuclease of a Class 2 CRISPR-Cas System)，蔡彻(Zetsche)等人，《细胞》(Cell)163,759-71(2015年9月25日)。

不同的第2类CRISPR-Cas系统的发现和菜单征(Discovery and FunctionalCharacterization of Diverse Class 2 CRISPR-Cas Systems)，沙姆克(Shmakov)等人，《分子细胞》(Molecular Cell)，60(3),385-397doi:10.1016/j.molcel.2015.10.008，电子公开于2015年10月22日。

具有改进的特异性的合理工程化的Cas9核酸酶(Rationally engineered Cas9nucleases with improved specificity),斯莱马克(Slaymaker)等人，《科学》(Science)2016年1月1日351(6268):84-88doi:10.1126/science.aad5227.电子公开于2015年12月1日。[电子版先于印刷版]

将它们各自通过引用并入本文，可以在本发明的实践中考虑，并且下文简要讨论：

丛(Cong)等人基于嗜热链球菌Cas9以及还有化脓链球菌Cas9两者改造了II型CRISPR-Cas系统以用于在真核细胞中使用，并且证实了Cas9分子可以通过短RNA指导以诱导在人类和小鼠细胞中DNA的精确切割。他们的研究进一步显示Cas9在转化成一种切口酶时可以用来以最低诱变活性促进在真核细胞中的同源定向修复。另外，他们的研究证实多个指导序列可以被编码进单一CRISPR阵列中以使得能够在哺乳动物基因组内的内源性基因组座位位点处同时编辑若干，证实了RNA指导的核酸酶技术的容易可编程性和广泛可应用性。这种使用RNA以编程细胞内序列特异性DNA切割的能力定义了新一类的基因组编辑工具。这些研究进一步显示，其他CRISPR座位可能是可移植入哺乳动物细胞中的，并且还可以介导哺乳动物基因组切割。重要地，可以设想的是CRISPR-Cas系统的若干方面可以进一步改进以增加其效率和多功能性。

江(Jiang)等人使用规律间隔成簇短回文重复(CRISPR)-关联的Cas9内切核酸酶，与双-RNA复合，以在肺炎链球菌和大肠杆菌的基因组中引入精确的突变。该途径依赖于在靶基因组位点处的双-RNA:Cas9-引导的切割，以杀死未突变的细胞，并且回避对选择性标记或反选择系统的需要。该研究报道通过改变短CRISPR RNA(crRNA)的序列以使单一-和多个多核苷酸变化被携带在编辑模板上而重编程双-RNA:Cas9特异性。该研究显示，同时使用两种crRNA使得多元诱变成为可能。另外，当该途径与重组工程组合使用时，在肺炎链球菌中使用描述的途径回收的接近100％的细胞包含希望的突变，并且在大肠杆菌中回收的65％包含突变。

王(Wang)等人(2013)使用CRISPR/Cas系统用于一步生成携带多基因中突变的小鼠，所述小鼠传统上是以多步通过在胚胎干细胞中的连续重组和/或小鼠的与单一突变的耗时性杂交生成的。CRISPR/Cas系统将大大加速功能上丰富的基因和上位基因相互作用的体内研究。

科纳曼(Konermann)等人(2013)解决了在本领域中对通用和稳固技术的需要,其使得能够基于CRISPR Cas9酶以及还有转录激活因子样效应子对DNA-结合结构域进行光调节和化学调节。

兰(Ran)等人(2013-A)描述了将Cas9切口酶突变体与配对的指导RNA相组合以引入靶向的双链断裂的途径。这解决了以下问题：来自微生物CRISPR-Cas系统的Cas9核酸酶通过指导序列而靶向特异性基因组座位，其可以耐受与该DNA靶标的某些错配并由此促进不希望的脱靶诱变。因为基因组中的单独切口以高保真性被修复，所以同时经由适当补偿指导RNA而形成切口对于双链断裂是必需的，并且所述切口形成延伸了特异性识别的碱基的数目以用于靶标切割。作者证实了使用配对的切口形成可以降低在细胞系中的脱靶活性50至1,500倍，并且从而促进在小鼠受精卵中的基因敲除而不牺牲中靶切割效率。这个通用策略使得多种多样的要求高特异性的基因组编辑应用成为可能。

徐(Hsu)等人(2013)表征了在人类细胞中SpCas9靶向特异性以告知靶位点的选择并避免脱靶效应。该研究评价了在293T和293FT细胞中的>100个预测的基因组脱靶座位处>700个指导RNA变体和SpCas9-诱导的indel突变水平。这些作者示出SpCas9以序列依赖性方式耐受指导RNA与靶DNA之间在不同位置处的错配，对错配的数目、位置和分布敏感。这些作者进一步示出SpCas9-介导的切割不受DNA甲基化的影响，并且SpCas9和sgRNA的剂量可被滴定为使得脱靶修饰最小化。另外，为了促进哺乳动物基因组工程应用，这些作者报道提供基于网络的软件工具以指导靶序列的选择和验证连同脱靶分析。

兰(Ran)等人(2013-B)描述了用于在哺乳动物细胞中Cas9介导的经由非同源末端连接(NHEJ)或同源定向修复(HDR)基因组编辑、连同产生修饰的细胞系(以用于下游功能研究)的一组工具。为了最小化脱靶切割，这些作者进一步描述了一种双-切口策略，使用的是Cas9切口酶突变体与配对的指导RNA。由这些作者提供的方案经实验得出用于选择靶位点、评价切割效率和分析脱靶活性的指南。这些研究显示，以靶设计开始，基因修饰可以在少至1-2周内实现，并且修饰的克隆细胞系可以在2-3周内得以衍生。

沙勒姆(Shalem)等人描述了新的在基因组广度范围上探询基因功能的方式。他们的研究显示，递送基因组范围的CRISPR-Cas9敲除(GeCKO)文库利用64,751个独特的指导序列靶向18,080个基因，这些指导序列使得在人类细胞中阴性和阳性选择筛选两者成为可能。首先，这些作者显示，使用该GeCKO文库来鉴定癌症和多能干细胞中对于细胞活力至关重要的基因。接着，在黑色素瘤模型中，这些作者针对基因进行筛选，这些基因的损失涉及对维罗非尼(一种抑制突变体蛋白激酶BRAF的治疗剂)的抗性。他们的研究显示，最高级候选物包括先前验证的基因NF1和MED12连同新颖的命中物NF2、CUL3、TADA2B、和TADA1。这些作者观察到在靶向相同基因的独立指导RNA之间的高水平的一致性以及高比率的命中确认，并且因此证实了采用Cas9进行基因组范围筛选的前景。

尼氏玛素(Nishimasu)等人以2.5A°分辨率报道了与sgRNA复合的化脓链球菌Cas9以及其靶DNA的晶体结构。该结构揭示了一种由靶识别和核酸酶叶片组成的两叶片构造，其将sgRNA:DNA异源双链体容纳在它们的界面处的带正电的凹槽中。然而识别叶片对于结合sgRNA和DNA是至关重要的，核酸酶叶片包含HNH和RuvC核酸酶结构域，这些结构域适合地被定位为分别用于靶DNA的互补和非互补链的切割。核酸酶叶片还包含负责与原型间隔子邻近基序(PAM)相互作用的羧基-末端结构域。这种高分辨率结构和伴随的功能分析已经揭示了RNA-指导的由Cas9进行的DNA靶向的分子机制，由此为合理设计新的通用基因组编辑技术做好准备。

吴(Wu)等人标定了在小鼠胚胎干细胞(mESC)中，来自化脓链球菌的无催化活性Cas9(dCas9)(加载有单一指导RNA(sgRNA))的基因组广度的结合位点。这些作者显示，测试的四种sgRNA中的每一种将dCas9靶向至数十和数千个之间的基因组位点，这些基因组位点频繁地通过sgRNA中的5-核苷酸种子区和NGG原型间隔子邻近基序(PAM)表征。染色质不可接近性降低了dCas9与具有匹配种子序列的其他位点的结合；因此70％的脱靶位点是与基因相关联的。这些作者显示，在用催化活性的Cas9转染的mESC中295dCas9结合位点的靶向测序鉴定出超过背景水平的仅一个突变位点。这些作者提出了一种针对Cas9结合和切割的两态模型，其中种子匹配触发了结合但是需要与靶DNA的广泛配对用于切割。

普莱特(Platt)等人建立了Cre依赖性Cas9敲入式小鼠。这些作者证明了在神经元、免疫细胞、和内皮细胞中，使用腺相关病毒(AAV)-、慢病毒-、或粒子介导的递送指导RNA进行体内以及离体基因组编辑。

徐(Hsu)等人(2014)是综述文章，其总体讨论了CRISPR-Cas9从酸奶到基因组编辑的历史，包括细胞的遗传筛选。

王(Wang)等人(2014)涉及聚池的功能缺失遗传筛选方法，该方法适合用于使用基因组规模的慢病毒单一指导RNA(sgRNA)文库进行的正选择和负选择两者。

多恩奇(Doench)等人创建了sgRNA池，覆盖六个内源性小鼠基因和三个内源性人类基因的一组的全部可能靶位点，并且通过抗体染色和流式细胞术定量地测定了这些sgRNA产生其靶基因的无效等位基因的能力。这些作者显示PAM的优化改进了活性并且还提供了用于设计sgRNA的在线工具。

斯维希(Swiech)等人证明了AAV介导的SpCas9基因组编辑可以使能进行脑中的基因功能的反向遗传学研究。

康纳尔曼(Konermann)等人(2015)讨论了在有和没有接头的情况下，在指导物(例如茎或四核苷酸环)上的适当位置处，附接多种效应物结构域的能力，这些效应物结构域例如转录激活因子、功能和表观基因组调节物。

蔡彻(Zetsche)等人证明了Cas9酶可以分离为两个并且因此针对活化而言Cas9的组装可以被控制。陈(Chen)等人涉及通过证明以下进行多元筛选：在小鼠中基因组范围的体内CRISPR-Cas9筛选揭示了调节肺转移的基因。

兰(Ran)等人(2015)涉及SaCas9以及其编辑基因组的能力，并且证明不能从生物化学测定外推。沙勒姆(Shalem)等人(2015)描述了催化无活性的Cas9(dCas9)融合用于综合地抑制(CRISPRi)或活化(CRISPRa)表达的方式，示出使用Cas9用于基因组规模的筛选(包括测定且聚池的筛选)的进展、使基因组座位失活的敲除途径、以及调节转录活性的策略。

沙勒姆(Shalem)等人(2015)描述了催化无活性的Cas9(dCas9)融合用于综合地抑制(CRISPRi)或活化(CRISPRa)表达的方式，示出使用Cas9用于基因组规模的筛选(包括测定且聚池的筛选)的进展、使基因组座位失活的敲除途径、以及调节转录活性的策略。

许(Xu)等人(2015)评估了在基于CRISPR的筛选中促成单一指导RNA(sgRNA)效率的DNA序列特征。这些作者探索了CRISPR/Cas9敲除的效率以及在切割位点处的核苷酸优选性。这些作者还发现对于CRISPRi/a的序列优选性基本上不同于对于CRISPR/Cas9敲除的序列优选性。

帕纳斯(Parnas)等人(2015)将基因组范围的聚池的CRISPR-Cas9文库引入树突细胞(DC)中，以鉴定控制由细菌脂多糖(LPS)对肿瘤坏死因子(Tnf)的诱导的基因。对Tlr4信号传导的已知调节物和先前未知的候选物进行鉴定，并根据对于对LPS的典型响应的不同效果分成三个功能模块。

罗马南(Ramanan)等人(2015)证明了在受感染细胞中对病毒附加体DNA(cccDNA)的切割。HBV基因组作为3.2kb双链附加体DNA种类存在于受感染的肝细胞的细胞核中，该种类称为共价闭合环状DNA(ccc DNA)，其是HBV生命周期中的关键组分，其复制不受目前疗法的抑制。这些作者显示特异性靶向HBV的高度保守区的sgRNA稳固地抑制病毒复制并耗减cccDNA。

尼氏玛素(Nishimasu)等人(2015)报道了SaCas9的晶体结构，该SaCas9与单一指导RNA(sgRNA)以及其包含5'-TTGAAT-3'PAM和5'-TTGGGT-3'PAM的双链DNA靶标复合。SaCas9与SpCas9的结构比较突出显示出结构保存和差别，解释了它们不同的PAM特异性和直向同源性sgRNA识别。

詹韦尔(Canver)等人(2015)证明了非编码基因组组件的基于CRISPR-Cas9的功能研究。这些作者开发了聚池的CRISPR-Cas9指导RNA文库，以进行人类和小鼠BCL11A增强子的原位饱和诱变，揭示了增强子的关键特征。

蔡彻(Zetsche)等人(2015)报道了Cpf1的表征，Cpf1是来自新凶手弗朗西丝菌U112的第2类CRISPR核酸酶，具有不同于Cas9的特征。Cpf1是单一RNA-指导的内切核酸酶，缺乏tracrRNA，使用富含T的原型间隔子相邻基序，并且经由交错的DNA双链断裂来切割DNA。

沙姆克(Shmakov)等人(2015)报道了三种不同的第2类CRISPR-Cas系统。两种系统CRISPR酶(C2c1和C2c3)包含远远与Cpf1相关的RuvC样内切核酸酶结构域。不像Cpf1，C2c1取决于crRNA和tracrRNA两者以用于DNA切割。该第三酶(C2c2)包含两个预测的HEPN RNA酶结构域，并且是tracrRNA独立的。

斯莱马克(Slaymaker)等人(2016)报道了使用结构指导的蛋白质工程化，以改进化脓链球菌Cas9(SpCas9)的特异性。这些作者开发了“增强的特异性”SpCas9(eSpCas9)变体，这些变体保持稳固的中靶切割，具有降低的脱靶效应。

而且，“二聚CRISPR RNA指导的FokI核酸酶用于高度特异性基因组编辑(DimericCRISPR RNA-guided FokI nucleases for highly specific genome editing)”，胜达(Shengdar)Q.蔡(Tsai)、尼古拉斯威肯(Nicolas Wyvekens)、西迪卡特(Cyd Khayter)、詹尼弗(Jennifer)A.福登(Foden)、维沙尔撒帕尔(Vishal Thapar)、迪帕克雷安(DeepakReyon)、马修(Mathew)J.古德温(Goodwin)、马丁(Martin)J.阿里耶(Aryee)、J.基思俊(Keith Joung)《自然生物技术》(Nature Biotechnology)32(6):569-77(2014)涉及二聚RNA指导的FokI核酸酶，其识别延伸序列并且可以高效率地编辑人类细胞中的内源性基因。

关于CRISPR-Cas系统、其组分、及这类组分的递送(包括方法、材料、递送赋形剂、载体、粒子、AAV、以及其制造和使用(包括关于量和配制品))的一般信息，都可用于本发明的实践中，参考以下：美国专利号8,697,359、8,771,945、8,795,965、8,865,406、8,871,445、8,889,356、8,889,418、8,895,308、8,906,616、8,932,814、8,945,839、8,993,233和8,999,641；美国专利公开案US 2014-0310830(美国申请序列号14/105,031)、US 2014-0287938 A1(美国申请序列号14/213,991)、US 2014-0273234 A1(美国申请序列号14/293,674)、US2014-0273232 A1(美国申请序列号14/290,575)、US 2014-0273231(美国申请序列号14/259,420)、US 2014-0256046 A1(美国申请序列号14/226,274)、US 2014-0248702 A1(美国申请序列号14/258,458)、US 2014-0242700 A1(美国申请序列号14/222,930)、US2014-0242699 A1(美国申请序列号14/183,512)、US 2014-0242664 A1(美国申请序列号14/104,990)、US 2014-0234972 A1(美国申请序列号14/183,471)、US 2014-0227787 A1(美国申请序列号14/256,912)、US 2014-0189896 A1(美国申请序列号14/105,035)、US2014-0186958(美国申请序列号14/105,017)、US 2014-0186919 A1(美国申请序列号14/104,977)、US 2014-0186843 A1(美国申请序列号14/104,900)、US 2014-0179770 A1(美国申请序列号14/104,837)和US 2014-0179006 A1(美国申请序列号14/183,486)，US 2014-0170753(美国申请序列号14/183,429)；US 2015-0184139(美国申请序列号14/324,960)；14/054,414欧洲专利申请EP 2 771 468(EP13818570.7)、EP 2 764 10390(EP13824232.6)、和EP 2 784 162(EP14170383.5)；以及PCT专利公开案WO 2014/093661(PCT/US 2013/074743)、WO 2014/093694(PCT/US 2013/074790)、WO 2014/093595(PCT/US2013/074611)、WO 2014/093718(PCT/US 2013/074825)、WO 2014/093709(PCT/US 2013/074812)、WO 2014/093622(PCT/US 2013/074667)、WO 2014/093635(PCT/US 2013/074691)、WO 2014/093655(PCT/US 2013/074736)、WO 2014/093712(PCT/US 2013/074819)、WO 2014/093701(PCT/US 2013/074800)、WO 2014/018423(PCT/US 2013/051418)、WO 2014/204723(PCT/US 2014/041790)、WO 2014/204724(PCT/US 2014/041800)、WO 2014/204725(PCT/US 2014/041803)、WO 2014/204726(PCT/US 2014/041804)、WO 2014/204727(PCT/US 2014/041806)、WO 2014/204728(PCT/US 2014/041808)、WO 2014/204729(PCT/US 2014/041809)、WO 2015/089351(PCT/US 2014/069897)、WO 2015/089354(PCT/US 2014/069902)、WO 2015/089364(PCT/US 2014/069925)、WO 2015/089427(PCT/US 2014/070068)、WO 2015/089462(PCT/US 2014/070127)、WO 2015/089419(PCT/US 2014/070057)、WO 2015/089465(PCT/US 2014/070135)、WO 2015/089486(PCT/US 2014/070175)、PCT/US 2015/051691、PCT/US 2015/051830。还参考了美国临时专利申请61/758,468；61/802,174；61/806,375；61/814,263；61/819,803和61/828,130，分别提交于2013年1月30日；2013年3月15日；2013年3月28日；2013年4月20日；2013年5月6日和2013年5月28日。还参考提交于2013年6月17日的美国临时专利申请61/836,123。另外参考各自提交于2013年6月17日的美国临时专利申请61/835,931、61/835,936、61/835,973、61/836,080、61/836,101和61/836,127。进一步参考提交于2013年8月5日的美国临时专利申请61/862,468和61/862,355；提交于2013年8月28日的61/871,301；提交于2013年9月25日的61/960,777和提交于2013年10月28日的61/961,980。又进一步参考：提交于2014年10月28日的PCT/US 2014/62558，以及美国临时专利申请系列号：61/915,148、61/915,150、61/915,153、61/915,203、61/915,251、61/915,301、61/915,267、61/915,260、和61/915,397，各自提交于2013年12月12日。提交于2013年1月29日和2013年2月25日的61/757,972和61/768,959；都提交于2014年6月11日的62/010,888和62/010,879；各自提交于2014年6月10日的62/010,329、62/010,439和62/010,441；各自提交于2014年2月12日的61/939,228和61/939,242；提交于2014年4月15日的61/980,012；提交于2014年8月17日的62/038,358；各自提交于2014年9月25日的62/055,484、62/055,460和62/055,487；以及提交于2014年10月27日的62/069,243。参考提交于2014年6月10日的尤其指定美国的PCT申请，申请号PCT/US 14/41806。参考提交于2014年1月22日的美国临时专利申请61/930,214。参考提交于2014年6月10日的尤其指定美国的PCT申请，申请号PCT/US 14/41806。

还提及的是：15年6月17日的美国申请62/180,709，保护的指导RNA(PGRNA)(PROTECTED GUIDE RNAS(PGRNAS))；14年12月12日提交的美国申请62/091,455，保护的指导RNA(PGRNA)(PROTECTED GUIDE RNAS(PGRNAS))；14年12月24日的美国申请62/096,708，保护的指导RNA(PROTECTED GUIDE RNAS(PGRNAS))；14年12月12日的美国申请62/091,462，14年12月23日的62/096,324，2015年6月7日的62/180,681，以及2015年10月5日的62/237,496，用于CRISPR转录因子的失活指导物(DEAD GUIDES FOR CRISPR TRANSCRIPTIONFACTORS)；14年12月12日的美国申请62/091,456，以及2015年6月17日的62/180,692，用于CRISPR-CAS系统的护送的和功能化的指导物(ESCORTED AND FUNCTIONALIZED GUIDES FORCRISPR-CAS SYSTEMS)；14年12月12日的美国申请62/091,461，用于关于造血干细胞(HSC)的基因组编辑的CRISPR-CAS系统和组合物的递送、使用以及治疗应用(DELIVERY,USE ANDTHERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FORGENOME EDITING AS TO HEMATOPOETIC STEM CELLS(HSCs))；14年12月19日的美国申请62/094,903，通过基因组范围的插入捕获测序对双链断裂和基因组重排的无偏鉴定(UNBIASEDIDENTIFICATION OF DOUBLE-STRAND BREAKS AND GENOMIC REARRANGEMENT BY GENOME-WISE INSERT CAPTURE SEQUENCING)；14年12月24日的美国申请62/096,761，用于序列操纵的工程化系统、方法以及优化的酶及指导物支架(ENGINEERING OF SYSTEMS,METHODS ANDOPTIMIZED ENZYME AND GUIDE SCAFFOLDS FOR SEQUENCE MANIPULATION)；14年12月30日的美国申请62/098,059，2015年6月18日的62/181,641，以及2015年6月18日的62/181,667，RNA-靶向系统；14年12月24日的美国申请62/096,656，以及2015年6月17日的62/181,151，具有或缔合于去稳定化结构域的CRISPR(CRISPR HAVING OR ASSOCIATED WITHDESTABILIZATION DOMAINS)；14年12月24日的美国申请62/096,697，具有或缔合于AAV的CRISPR(CRISPR HAVING OR ASSOCIATED WITH AAV)；14年12月30日的美国申请62/098,158，工程化CRISPR复合物插入靶向系统(ENGINEERED CRISPR COMPLEX INSERTIONALTARGETING SYSTEMS)；15年4月22日的美国申请62/151,052，用于胞外核外报告的细胞靶向(CELLULAR TARGETING FOR EXTRACELLULAR EXOSOMAL REPORTING)；14年9月24日的美国申请62/054,490，使用粒子递送组分靶向障碍和疾病的CRISPR-CAS系统和组合物的递送、用途以及治疗应用(DELIVERY,USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CASSYSTEMS AND COMPOSITIONS FOR TARGETING DISORDERS AND DISEASES USING PARTICLEDELIVERY COMPONENTS)；美国申请61/939,154，12-F EB-14，用于用优化的功能性CRISPR-CAS系统进行序列操纵的系统、方法和组合物(SYSTEMS,METHODS AND COMPOSITIONS FORSEQUENCE MANIPULATION WITH OPTIMIZED FUNCTIONAL CRISPR-CAS SYSTEMS)；14年9月25日的美国申请62/055,484，用于用优化的功能性CRISPR-CAS系统进行序列操纵的系统、方法和组合物(SYSTEMS,METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION WITHOPTIMIZED FUNCTIONAL CRISPR-CAS SYSTEMS)；14年12月4日的美国申请62/087,537，用于用优化的功能性CRISPR-CAS系统进行序列操纵的系统、方法和组合物(SYSTEMS,METHODSAND COMPOSITIONS FOR SEQUENCE MANIPULATION WITH OPTIMIZED FUNCTIONAL CRISPR-CAS SYSTEMS)；14年9月24日的美国申请62/054,651，用于对体内多种癌症突变的竞争建模的CRISPR-CAS系统和组合物的递送、用途以及治疗应用(DELIVERY,USE AND THERAPEUTICAPPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR MODELINGCOMPETITION OF MULTIPLE CANCER MUTATIONS IN VIVO)；14年10月23日的美国申请62/067,886，用于对体内多种癌症突变的竞争建模的CRISPR-CAS系统和组合物的递送、用途以及治疗应用(DELIVERY,USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CASSYSTEMS AND COMPOSITIONS FOR MODELING COMPETITION OF MULTIPLE CANCERMUTATIONS IN VIVO)；14年9月24日的美国申请62/054,675，以及2015年6月17日的62/181,002，在神经元细胞/组织中CRISPR-CAS系统和组合物的递送、用途以及治疗应用(DELIVERY,USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS ANDCOMPOSITIONS IN NEURONAL CELLS/TISSUES)；14年9月24日的美国申请62/054,528，在免疫疾病或障碍中的CRISPR-CAS系统和组合物的递送、用途以及治疗应用(DELIVERY,USEAND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS INIMMUNE DISEASES OR DISORDERS)；14年9月25日的美国申请62/055,454，用于使用细胞穿透肽(CPP)靶向障碍和疾病的CRISPR-CAS系统和组合物的递送、用途以及治疗应用(DELIVERY,USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS ANDCOMPOSITIONS FOR TARGETING DISORDERS AND DISEASES USING CELL PENETRATIONPEPTIDES(CPP))；14年9月25日的美国申请62/055,460，多功能CRISPR复合物和/或优化的酶连接的功能性CRISPR复合物(MULTIFUNCTIONAL-CRISPR COMPLEXES AND/OR OPTIMIZEDENZYME LINKED FUNCTIONAL-CRISPR COMPLEXES)；14年12月4日的美国申请62/087,475，以及2015年6月18日的62/181,690，用优化的功能性CRISPR-CAS系统进行功能性筛选(FUNCTIONAL SCREENING WITH OPTIMIZED FUNCTIONAL CRISPR-CAS SYSTEMS)；14年9月25日的美国申请62/055,487，用优化的功能性CRISPR-CAS系统进行功能性筛选(FUNCTIONALSCREENING WITH OPTIMIZED FUNCTIONAL CRISPR-CAS SYSTEMS)；14年12月4日的美国申请62/087,546，以及2015年6月18日的62/181,687，多功能CRISPR复合物和/或优化的酶连接的功能性CRISPR复合物(MULTIFUNCTIONAL CRISPR COMPLEXES AND/OR OPTIMIZED ENZYMELINKED FUNCTIONAL-CRISPR COMPLEXES)；以及14年12月30日的美国申请62/098,285，对于肿瘤生长和转移的CRISPR介导的体内建模以及遗传筛选(CRISPR MEDIATED IN VIVOMODELING AND GENETIC SCREENING OF TUMOR GROWTH AND METASTASIS)。

提及的是2015年6月18日的美国申请62/181,659，以及2015年8月19日的62/207,318，CAS9直向同源物和变体的系统、方法、酶以及指导物支架的工程化和优化以用于序列操纵(ENGINEERING AND OPTIMIZATION OF SYSTEMS,METHODS,ENZYME AND GUIDESCAFFOLDS OF CAS9ORTHOLOGS AND VARIANTS FOR SEQUENCE MANIPULATION)。提及的是2015年6月18日的美国申请62/181,663以及2015年10月22日的62/245,264，新颖的CRISPR酶和系统(NOVEL CRISPR ENZYMES AND SYSTEMS)，2015年6月18日的美国申请62/181,675，2015年10月22日的62/285,349，2016年2月17日的62/296,522，以及2016年4月8日的62/320,231，新颖的CRISPR酶以及系统(NOVEL CRISPR ENZYMES AND SYSTEMS)，2015年9月24日的美国申请62/232,067，2015年12月18日的美国申请14/975,085，欧洲申请号16150428.7，2015年8月16日的美国申请62/205,733，2015年8月5日的美国申请62/201,542，2015年7月16日的美国申请62/193,507，以及2015年6月18日的美国申请62/181,739，各自标题为新颖的CRISPR酶和系统(NOVEL CRISPR ENZYMES AND SYSTEMS)，并且提及2015年10月22日的美国申请62/245,270，新颖的CRISPR酶和系统(NOVEL CRISPR ENZYMES ANDSYSTEMS)。提及的是2014年2月12日的美国申请61/939,256，以及2014年12月12日的WO2015/089473(PCT/US 2014/070152)，各自标题为采用用于序列操纵的新构造的系统、方法以及优化的指导物组合物的工程化(ENGINEERING OF SYSTEMS,METHODS AND OPTIMIZEDGUIDE COMPOSITIONS WITH NEW ARCHITECTURES FOR SEQUENCE MANIPULATION)。还提及的是2015年8月15日的PCT/US 2015/045504，2015年6月17日的美国申请62/180,699，以及2014年8月17日的美国申请62/038,358，各自标题为使用CAS9切口酶的基因组编辑(GENOMEEDITING USING CAS9NICKASES)。

这些专利、专利公开和申请的每一者，以及在其中或在它们的审查程序期间引用的所有文献(“申请引用文献”)以及在这些申请引用文献中引用或参考的所有文献，连同其中提到的或在其中任何文献中提到并通过引用结合在其中的针对任何产品的任何说明书、说明、产品规格、和产品表，特此通过引用并入本文，并且可以在本发明的实践中采用。所有文献(例如，这些专利、专利公开和申请以及申请引用文献)在如同每个单独文献被确切地且单独地指明为通过引用结合的相同程度上通过引用并入本文。

此外，提及的是标题为“用于使用粒子递送组分靶向障碍和疾病的CRISPR-CAS系统和组合物的递送、用途和治疗应用(DELIVERY,USE AND THERAPEUTIC APPLICATIONS OFTHE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR TARGETING DISORDERS AND DISEASESUSING PARTICLE DELIVERY COMPONENTS)”的PCT申请PCT/US 14/70057，案卷参考47627.99.2060和BI-2013/107(要求来自以下一个或多个或所有美国临时专利申请的权益：提交于2014年9月24日的62/054,490；提交于2014年6月10日的62/010,441；以及各自提交于2013年12月12日的61/915,118、61/915,215和61/915,148)(“粒子递送PCT”)，将其通过引用并入本文，关于一种制备含有sgRNA-和-Cas9蛋白的粒子的方法，该方法包括将包含sgRNA和Cas9蛋白(和任选地HDR模板)的混合物与以下混合物混合，该混合物包含表面活性剂、磷脂、生物可降解聚合物、脂蛋白和醇或基本上由其组成或由其组成；以及来自这样的工艺的粒子。例如，其中使Cas9蛋白和sgRNA在适合的温度(例如，15℃-30℃，例如，20℃-25℃，例如，室温)下以适合的摩尔比(例如，3:1至1:3或2:1至1:2或1:1)有利地在无菌、无核酸酶缓冲液(例如，1X PBS)中一起混合适合的时间(例如，15-45，如30分钟)。分开地，粒子组分如或包含：表面活性剂(例如，阳离子脂质(例如，1,2-二油酰基-3-三甲基铵-丙烷(DOTAP)))；磷脂(例如，二肉豆蔻磷脂酰胆碱(DMPC))；可生物降解的聚合物(例如，乙二醇聚合物或PEG)、以及脂蛋白，如低密度脂蛋白，例如，胆固醇溶解于醇中，有利的是C_1-6烷基醇，如甲醇、乙醇、异丙醇，例如，100％乙醇。将这两种溶液混合在一起以形成含有Cas9-sgRNA复合物的粒子。因此，在粒子中配制整个复合物之前，可以使sgRNA与该Cas9蛋白预复合。可以制备具有不同摩尔比的不同已知组分的配制品，以促进将核酸递送到细胞(例如1,2-二油酰基-3-三甲基铵-丙烷(DOTAP)、1,2-二十四酰基-sn-甘油-3-磷酸胆碱(DMPC)、聚乙二醇(PEG)和胆固醇)。例如，DOTAP:DMPC:PEG:胆固醇摩尔比可以是DOTAP 100，DMPC 0，PEG 0，胆固醇0；或DOTAP 90、DMPC 0、PEG 10、胆固醇0；或DOTAP 90、DMPC 0、PEG 5、胆固醇5。DOTAP 100、DMPC 0、PEG 0、胆固醇0。因此，该申请包括将sgRNA、Cas9蛋白和形成粒子的组分混合；连同来自此类混合的粒子。本发明的方面可以涉及粒子；例如，使用类似于粒子递送PCT的工艺的粒子，例如通过将如在本发明中的sgRNA和/或Cas9蛋白的混合物和形成粒子的组分混合，例如如在粒子递送PCT中，以形成粒子；以及来自这样的混合的粒子(或者，当然，涉及如在本发明中的sgRNA和/或Cas9的其他粒子)。

现在将通过以下非限制性实例进一步描述本发明。

实例

以下实例用来说明本文描述的本发明。应理解的是下文所述的激发研究的科学原理不应解读为以任何方式限制主题，或者强加任何机械的或其他要求。

科学原理

不希望受本文描述的任何理论束缚，诸位发明人设想了用于修饰化脓链球菌Cas9(SpCas9)的策略，旨在产生示出改进的靶标特异性的修饰的变体SpCas9酶。相同的原理可以应用于任何Cas9直向同源物。这种改进的特异性可以在示出针对非靶标(脱靶)座位的降低活性的变体中实现，与此同时保持适当的针对预期靶座位的活性。在以下描述的测定中的活性涉及核酸酶活性，通过DNA的切割来表现，如通过INDEL的形成测量的。这种活性被期望为涉及CRISPR复合物(换言之，在Cas9酶和指导RNA之间的复合物)结合至DNA上的相关位点的能力。因此，针对非靶位点的活性降低可以被预期为起因于在该位点处CRISPR复合物的降低的结合。示出针对非靶座位的降低的活性的修饰Cas9酶与未修饰的(例如野生型)酶相比可以因此被预期为不太好地结合至非靶位点。尼氏玛素(Nishimasu)等人(《细胞》(Cell)，2014，156(5)，第935-49页)报道了SpCas9变体酶在解析率下的晶体结构，该SpCas9变体酶与长度为98个核苷酸的单一指导RNA(sgRNA)以及一段包括长23个核苷酸的靶DNA复合。基于这些结构数据，诸位发明人鉴定了位于RuvC-III和HNH结构域之间的正电荷区域。诸位发明人推断，在Cas9酶结合至DNA的相关区域时，在正常的沃森-克里克碱基配对破坏之后，沟槽可以适应非靶链。Cas9的此区域的正电荷残基可以通过与DNA的非靶链的负电荷磷酸二酯骨架相互作用而发挥作用以稳定酶与DNA之间的相互作用。诸位发明人假定，通过Cas9的正电荷残基的取代，与非靶链的相互作用可以被破坏。此相互作用的充足的破坏可以保持针对靶位点的适当活性，但降低酶的针对非靶标位点的活性(其将一般被预期为，与靶序列相比，由于一个或多个错配而与指导序列具有较弱的相互作用)。诸位发明人出人意料地发现Cas9的修饰可以确实降低脱靶活性。还参见图1，以及本文对其的讨论。

另外关于本发明中正电荷残基的取代破坏了与DNA骨架的相互作用，并且导致酶针对非靶位点的活性降低，同时维持了针对靶位点的适当活性，应提及的是克莱恩斯提夫(Kleinstiver)BP等人。这些作者描述了包含REC1结构域中的突变的SpCas9的三取代变体(R661A/Q695A/Q926A)和四取代变体(N497A/R661A/Q695A/Q926A)。这些取代涉及被设计为破坏DNA磷酸酯骨架的氢键的残基，并且突变体被报告为具有高的中靶活性和最低的脱靶活性。(参见，克莱恩斯提夫(Kleinstiver)BP等人，不具有可检测基因组范围的脱靶效应的高保真CRISPR-Cas9核酸酶(High-fidelity CRISPR-Cas9 nucleases with nodetectable genome-wide off-target effects).《自然》(Nature)2016年1月28日；529(7587):490-5.doi:10.1038/nature16526.电子公开于2016年1月6日。

此外，诸位发明人还假定可以进行CRISPR酶的氨基酸残基的修饰，其在Cas9酶结合至DNA的相关区域时在正常的沃森-克里克碱基配对的破坏之后，可以具有增加酶与非靶链之间的相互作用的稳定性的作用。例如，用正电荷氨基酸取代在未修饰的酶中不带正电荷的氨基酸残基可以通过增加该酶的净正电荷而具有稳定酶与非靶链之间的相互作用的作用。因此，在该酶的相关区域中的更多的净正电荷将被预期提供与DNA的非靶链的带负电荷磷酸二酯骨架的更强相互作用。在未修饰酶中不带正电荷的氨基酸可以是例如带中性负荷的、带负电荷的、疏水等的氨基酸。任何此类氨基酸可以用带正电荷氨基酸取代，这样实现所需作用。上述功能作用是基于复杂的和互相关联的静电和热力学考虑。因此，应理解的是，可以组合上述功能作用。因此，CRISPR酶可以按一种增强酶针对靶标的活性但还降低针对一种或多种脱靶的活性的方式被修饰。例如，预期的是，可以使得修饰促进中靶活性的增加，同时可以使得修饰降低脱靶活性。因此，可以实现协同效应。

应当理解的是上述功能效应的任一种可以通过修饰前述沟槽内的氨基酸以及通过修饰该沟槽的邻近处或外部的氨基酸来实现。

实例1-材料和方法。

SpCas9突变体的产生

虽然这从本披露的完整背景中是明显的，缩写“SpCas9”是指化脓链球菌Cas9，并且缩写“SaCas9”是指金黄色葡萄球菌Cas9。修饰的SpCas9和SaCas9变体，例如修饰的丙氨酸变体是使用已知的技术通过基于PCR的诱变来创建的。(其他技术可以包括制备编码Cas9的核酸分子，但针对一个或多个蛋白突变或一个或多个修饰的一个或多个对应密码子发生改变，从而使修饰的或突变的Cas9表达，例如经由载体表达系统，例如细菌表达系统或病毒表达载体系统。然后如此表达的经修饰或突变的Cas9可以易于纯化。本发明的改性的或突变的Cas9可以用于CRISPR-Cas系统中和CRISPR-Cas系统的任何应用中；并且有利地具有降低的或几乎没有或本质上没有或没有脱靶效应和/或增加的中靶效应的优势。因此，本发明的Cas9或具有本发明Cas9的本发明的CRISPR-Cas系统可以经由递送系统被递送，该递送系统可以是一种或多种载体，包括如本文讨论的。)

用于测试修饰的Cas9活性的系统

通过将编码突变体Cas9的质粒和编码sgRNA(仅中靶)的质粒共转染到HEK293T或HEK293FT细胞中来测试修饰的Cas9酶。使用Lipofectamine 2000对汇合率为90％-95％的细胞进行转染，使细胞在37℃和5％CO₂下生长持续大约72h下生长持续大约72h，并且收获。将中靶和脱靶基因组座位进行PCR扩增，并且使用新一代测序(NGS)进行分析。从测序数据计算对于中靶和脱靶座位的Indel％。针对表A中示出的基因组座位测试SpCas9突变体。SaCas9突变体是使用EMX101指导物和OT1至OT3通过NGS来测试，根据兰(Ran)等人2015。没有进行生物化学或SURVEYOR分析(所有数据来自NGS；参见西迪-陈(Sidi-Chen)，“在肿瘤生长和转移的小鼠模型中基因组范围的CRISPR筛选(Genome-wide CRISPR Screen in aMouse Model of Tumor Growth and Metastasis)”，《细胞》(Cell)160(6):1246-1260，DOI:http://dx.doi.org/10.1016/j.cell.2015.02.038，2015年3月12日)。

Indel分析

进行通过靶向深度测序的Indel分析，并且如前所述来分析(徐(Hsu)，P.D.等人(2013)RNA指导的Cas9核酸酶的DNA靶向特异性(DNA targeting specificity of RNA-guided Cas9 nucleases).自然生物技术(Nat.Biotechnol.)31，827-832)。大约转染后3天收获细胞。使用QuickExtract DNA提取试剂盒(Epicentre)，通过将沉淀的细胞重悬浮于QuickExtract(80μL/24-孔，或20μL/96-孔)中、随后在65℃孵育15min、68℃持续15min以及98℃持续10-15min，来提取基因组DNA。用于NGS分析的PCR片段在两步PCR反应中产生。简言之，使用用于第二轮扩增的引物与PCR处理(handle)来扩增感兴趣基因组区域(表2)，随后为融合PCR方法以将亿明达(Illumina)P5适配子以及样品特异性条形码附接至第一轮PCR产物上。

实例2-单一SpCas9突变体的初始分析(EMX1和VEGFA靶序列)。

产生SpCas9的49个初始单一点突变并测试INDEL形成。在此实例中的靶序列是EMX1和VEGFA基因的序列。靶序列和脱靶序列两者示于下表A中，具有PAM序列。在脱靶序列中，如在靶序列之间的错配以粗体和加下划线示出。结果示于图2A和2B中。

与野生型酶相比以下突变体示出针对脱靶位点的降低的活性(参见图2A和2B)。

R63A

H415A

H447A

R778A

R780A

Q807A

K810A

R832A

K848A

K855A

K968A

R976A

H982A

K1000A

K1003A

K1047A

R1060A

K1107A

R1114A

K1118A

K1200A

实例3-单一SpCas9突变体的进一步分析

在具有第三指导序列和另外的脱靶座位的情况下，将在实例2中鉴定的若干单一点突变修饰的SpCas9酶进一步针对INDEL形成进行测试。靶序列和脱靶序列示于下表A中，具有PAM序列。在脱靶序列中，如在靶序列之间的错配以粗体加下划线示出。结果示于图3中。在此实例中测试的经修饰的SpCas9酶是：

R780A

K810A

K848A

K855A

R976A

H982A

K1003A

R1060A

如在图3中所示，与未修饰的(野生型)酶(SpCas9)相比，所有八种修饰的酶示出针对脱靶位点的降低的活性。

实例4-单一SpCas9突变体的进一步分析(VEGFA1靶序列)。

在具有第二不同靶序列的情况下，将若干单一点突变修饰的SpCas9酶(包括实例2中所述的突变体)针对INDEL形成进行测试，在这种情况下VEGFA1是VEGFA基因的序列。在此实例中测试的经修饰的SpCas9酶是：

R780A

K810A

K848A

K855A

R976A

H982A

K1003A

R1060A

H1240A

H1311A

靶序列和脱靶序列示于下表A中，具有PAM序列。在脱靶序列中，如在靶序列之间的错配以粗体加下划线示出。结果示于图3中。

实例5-组合SpCas9突变体的分析

产生二十四个双点突变和14个三点突变修饰的SpCas9酶，并且用两个不同靶序列测试INDEL形成，在这种情况下这两个不同靶序列为EMX1和VEGFA基因的序列(VEGFA3是VEGFA中的序列)。靶序列和脱靶序列示于下表A中，具有PAM序列。在脱靶序列中，如在靶序列之间的错配以粗体和加下划线示出。所测试的突变体和结果示于图4和图5中；在图4和图5的星号指示目前认为有利的实施例。如图4和图5中所示，相比于野生酶，所有突变体示出针对OT 46、OT4、和OT18脱靶的显着降低的活性。若干组合突变体另外示出针对所有四种脱靶的降低的活性，同时保持与WT类似的中靶活性；这些是：

突变体	残基	残基	残基
				1	K810A	K848A
2	K848A	K855A
				3	R780A	K1003A
4	K810A	K1003A
				5	R780A	R1060A
6	K810A	R1060A
				7	K855A	R1060A
8	H982A	K1003A	K1129E
				9	R780A	K1003A	R1060A
10	K810A	K1003A	R1060A
				11	K848A	K1003A	R1060A
12	K855A	K1003A	R1060A
				13	K855A	K1003A	E610G

表A：SpCas9指导物(用于SpCas9的靶标和脱靶座位；红色指示脱靶序列错配；竖直线|指示SpCas9切割位点；脱靶序列经由本发明的突变/修饰而被拒绝)：

表B：SpCas9报告的突变(通过引用结合的引用文献；保留明确地否认这些突变中的单独任一个的权利，并且注意已知突变中没有一种如何被披露或提示为与未修饰的酶相比获得降低的脱靶效应和/或增加的修饰一个或多个靶座位的能力，其在安德斯(Anders)等人中提及：K1107A、KES→GG以及KES→KG可以赋予相对于在sgRNA的位置1和2处的错配的特异性，但是是以适度降低的中靶切割效率为代价，并且他们也未给出对特异性的更详细的表征，这样使得这些已知的突变体未披露或提示本发明的一般主张仍然是有效的；并且，应提及的是本发明可以包括在下表中的任何突变/修饰结合赋予降低的脱靶效应的修饰/突变，只要以下突变/修饰中的一种或多种的添加不会不利地影响本发明中实现的降低的脱靶和/或增加的修饰一个或多个靶座位作用的能力)：

实例6-另外的SpCas9突变体的分析(VEGFA3靶序列)。

产生若干另外的单一点突变修饰的SpCas9酶，并且在靶序列VEGFA3为VEGFA基因的序列的情况下测试INDEL形成。在此实例中测试的经修饰的SpCas9酶如下示出：

突变体	残基
		1	R403A
2	R63A
		3	K782A
4	K890A
		5	K1107A
6	R778A
		7	K1200A
8	K1114A
		9	K1118A
10	K890A
		11	H415A

如图2中所示，相比于野生型酶,若干个突变体示出针对OT1和OT4脱靶两者的显着降低的活性。若干突变体另外示出与野生型酶相比，针对所有三种脱靶的活性的降低，这些是

突变体	残基
		1	R403A
2	R63A
		3	K782A
5	K1107A
		6	R778A
7	K1200A
		11	H415A

实例7-SaCas9突变体的分析(EMX101靶序列)。

产生若干单一点突变修饰的SaCas9酶，并且在靶序列是EMX101基因的序列的情况下测试INDEL形成。靶序列和脱靶序列示于下表C中，具有PAM序列。在脱靶序列中，如在靶序列之间的错配以粗体和加下划线示出。在此实例中测试的经修饰的SaCas9酶是丙氨酸突变体，如下示出：

K518A

K523A

K525A

H557A

R561A

K572A

R686A

K687A

K692A

R694A

H700A

K751A

如图6中所示，相比于野生型酶,若干个突变体示出针对OT2和OT3脱靶两者的显着降低的活性。若干突变体另外示出与野生型酶相比，针对所有三种脱靶的活性的降低，这些是

K523A

K525A

R561A

K572A

R694A

H700A

表C：用于验证SaCas9突变的指导物的序列信息，包括PAM(红色指示脱靶序列错配；脱靶序列经由本发明的突变/修饰而被拒绝)

图7提供关于以下本文披露的SaCas9突变体的另外的数据。

突变体	残基
		1	R245A
2	R480A
		3	R497A
4	R499A
		5	R617A
6	R630A
		7	R634A
8	R644A
		9	R650A
10	R654A
		11	K736A

突变体R245A、R480A、R499A、R650A和R654A在脱靶效应的降低方面表现良好，其中尤其R480A、R499A和R245A表现良好。

实例8-修饰的Cas9酶的列表。

对于SpCas9，目前，在前述实例中包括的本文列出的单一和组合突变体被认为是有利的，因为具有证明的优选特异性增强。SpCas9和SaCas9突变体，包括测试的那些以及以其他方式在本披露之内的那些，列于下表1-7中。

表1-SpCas9四突变体的列表

突变体	残基	残基	残基	残基
					QM1	R63A	K855A	R1060A	E610G
QM2	R63A	H982A	K1003A	K1129E
					QM3	R63A	K810A	K1003A	R1060A

表2-SpCas9单突变体的列表

表3-SpCas9双突变体和三突变体的列表

表4-SaCas9单突变体的列表

突变体	残基
		1	H700
2	R694
		3	K692
4	R686
		5	K687
6	K751
		7	R561
8	H557
		9	K572
10	K523
		11	K518
12	K525

表5-SaCas9单突变体的列表

SpCas9突变体的代表性实例列于下表6中。

表6-SpCas9单突变体的列表

突变体	残基和取代
		1	N14K
2	N776L
		3	E781L
4	E809K
		5	L813R
6	S845K
		7	L847R
8	D849A
		9	I852K
10	D859A
		11	S964K
12	V975K
		13	E977K
14	N978K

下表7提供了在本披露之内的示例性突变体，包括示例的那些。

表7：在本披露之内的代表性突变体

单突变体

双突变体

三突变体

多元突变体

实例9-Cas9的修饰用于增强的中靶活性。

最初，诸位发明人对不带电荷的位于SpCas9的RuvC-III和HNH结构域之间的沟槽中的氨基酸进行修饰。待修饰的氨基酸包括具有不带电荷的侧链的氨基酸，包括丝氨酸、苏氨酸、天冬酰胺和谷氨酰胺。将选择的氨基酸改变为带正电荷的氨基酸，例如精氨酸或赖氨酸。通过如上所述的新一代测序来评估SpCas9的这种单一氨基酸改变对在靶座位处INDEL形成的作用。选择与未修饰的酶相比具有增加的/增强的中靶活性的优选突变。诸位发明人评估如上所述的双突变体和三突变体。选择具有增强的中靶活性的特别优选的突变。

诸位发明人以与针对SpCas9所述的相同方式，评估SaCas9中的此类突变。选择具有增强的中靶活性的特别优选的突变。

诸位发明人扩张了对不带电荷的氨基酸的修饰的范围，这些不带电荷的氨基酸位于SpCas9的RuvC-III和HNH结构域之间的沟槽附近或外部。再次，通过如上所述的SURVEYOR分析评估这些改变对靶座位处的INDEL形成的作用。选择与未修饰的酶相比具有增加的/增强的中靶活性的优选突变。SaCas9中进行类似的分析。

诸位发明人将证明增强的中靶活性的SpCas9突变与证明降低的脱靶活性的突变组合。再次，通过如上所述的SURVEYOR分析评估这些改变对靶座位处的INDEL形成的作用。选择与未修饰的酶相比具有增加/增强的中靶活性和降低的脱靶活性的特别优选的突变。在SpCas9中进行类似的分析。

实例10-SpCas9突变体的分析(多种靶序列)。

将三种突变体K855A(单一突变)、和TM14和TM15(两者为三突变体)，在靶序列为EMX101、EMX1.1、EMX1.2、EMX1.3、EMX1.8、EMX1.10、DNMT1.1、DNMT1.2、DNMT1.4、DNMT1.7、VEGFA4、VEGFA5、和VEGFA3的情况下针对INDEL形成进行测试。如在图10中所示，所有三种突变体示出针对靶标的活性和针对OT4的低脱靶活性。

将一扩大组的单突变体、双突变体、和三突变体，在靶序列为EMX101、EMX1.1、EMX1.2、EMX1.3、EMX1.8、EMX1.10、DNMT1.1、DNMT1.2、DNMT1.4、DNMT1.7、VEGFA4、VEGFA5、和VEGFA3的情况下针对INDEL形成进行测试。这些突变体包括E779L、R780A、K810A、K848A、K855A、R976A、H982A、DM11、DM17、DM19、DM20、DM23、DM24、DM25、DM35、DM40、TM14、TM15、和TM16。图11概述了针对靶标的活性和针对OT4的脱靶活性。总的来说，针对评估的几乎所有的基因组脱靶、以及针对一组广泛的错配指导物存在活性的降低。

实例11-SpCas9突变体的分析(VEGFA3靶标和脱靶序列)。

产生若干突变修饰的SpCas9酶，并且在靶序列是VEGFA3基因的序列的情况下测试INDEL形成。在此实例中测试的经修饰的SpCas9酶包括：

R780A

K848A

K1000A

K848A R1060A

R780A R1114A

H982A K1003A R1060A

R63A K848A R1060A

R63A K855A R1060A E610G

K1107A

T13I R63A K810A

R63A K855A

R63A H982A

G12D R63A R1060A

H415A K848A

R780A R1114A

K848A K1107A

K848A E1108A

S1109A

R63A E610G K855A R1060A

R63A K848A R1060A

如在图12和图13中所示，与野生酶相比，若干突变体针对三种脱靶OT1、OT4、和OT18中的一个或多个示出显着降低的活性。若干突变体另外示出与野生型酶相比，针对所有三种脱靶的活性的降低。这些包括：

R780A R1114A

H982A K1003A K1129E

R63A K855A R1060A E610G

K1107A

R63A K855A

R63A H982A

K848A K1107A

R63A E610G K855A R1060A

R63A K848A R1060A

实例12-SpCas9突变体的分析(EMX1.3靶标和脱靶序列)。

将若干突变修饰的SpCas9酶在靶序列为EMX1.3的序列的情况下针对INDEL形成进行测试。在此实例中测试的经修饰的SpCas9酶包括：

N14K

E779L

E809K

L813R

S845K

L847R

D849A

D861K

E977K

I978K

N979L

N980K

如在图14中所示，某些突变体示出高的中靶活性，以及在这些之中，相对于脱靶序列OT14、OT23、OT35、OT46、和OT53的特异性的区别。突变体中的某些证明了比野生型更高的特异性，其他则证明了针对脱靶序列的高活性。

实例13-SpCas9突变体的分析(EMX1.3靶标)。

将若干突变修饰的SpCas9酶在靶序列为EMX1.3的序列的情况下测试用错配指导物形成INDEL。在此实例中测试的三种经修饰的SpCas9酶包括：

K855A

K810A、K1003A、R1060A

K848A、K1003A、R1060A

结果示于图15中。

实例14-增强的Cas9突变体具有高的活性和特异性

与野生型(WT)SpCas9相比，29个点突变体中的六个将脱靶活性降低至少10倍，同时保持中靶切割效率，并且6个其他突变体将特异性改进2至5倍。当对第二座位VEGFA(1)进行测试时，这些突变体还展现出改进的特异性(图15D)。虽然当靶向EMX1(1)和VEGFA(1)时一些点突变体比WT SpCas9具有更大的特异性，脱靶indel仍然是可检测的(约0.1％)(图15D)。为了进一步改进特异性，申请人使用在初始筛选中鉴定的前几个点突变体进行组合诱变。35个组合突变体中的八个保持野生型中靶活性，并且展现出在EMX1(1)OT1、VEGFA(1)OT1、和VEGFA(2)OT2处的不可检测的脱靶indel水平(图15E)。为了确保所观察到的特异性增加不是由于降低的中靶活性造成的，申请人使用前16个突变体测量了在10个靶座位处的中靶indel形成(图15F)，如通过中靶和脱靶活性的组合确定的。申请人观察到针对三种突变体的高效率和特异性：SpCas9(K855A)、SpCas9(K810A/K1003A/R1060A)(还称为eSpCas9(1.0))、以及SpCas9(K848A/K1003A/R1060A)(还称为eSpCas9(1.1))。这三个变体被选择用于进一步分析。

为了评估SpCas9(K855A)、eSpCas9(1.0)、以及eSpCas9(1.1)是否广泛地保持有效的核酸酶活性，申请人测量了在24个靶位点(跨越10个不同的基因组座位)处的中靶indel产生(图16A)。在多数靶位点中，所有三种突变体产生与WT SpCas9类似的indel水平(图16B)。为了测试特异性的改进是否可以归因于降低的Cas9表达，申请人进行了针对SpCas9的Western印迹，并且发现所有三种突变体等同地表达或以比WT SpCas9更高的水平表达(图16C)。这证明特异性的改进不是由于降低的蛋白质表达水平。

申请人然后比较了三种突变体与WT SpCas9(具有截短指导序列(针对EMX1(1)为18nt并且针对VEGFA(1)为17nt))的特异性，已经显示这些突变体减少脱靶indel形成。所有三种突变体减少了在评估的所有脱靶位点处的切割。并且，eSpCas9(1.0)和eSpCas9(1.1)消除了24个这些位点中的20个。相比之下，具有截短指导物的WT SpCas9消除了24个位点中的14个，但与具有全长指导物的WT SpCas9相比还增加了在5个位点处的脱靶活性。

为了评估SpCas9(K855A)、eCas9(1.0)、和eCas9(1.1)对于错配靶位点的耐受性，申请人系统性地突变VEGFA(1)指导序列以引入不同位置处的单一和双碱基错配(图17A-C)。相比于WT SpCas9，使用错配指导物，所有三种突变体均诱导较低水平的indel。值得注意的是，eSpCas9(1.0)和eSpCas9(1.1)诱导更低的indel水平，甚至在单一碱基错配位于7-12bp种子序列外部的情况下。鉴于申请人未观察到eSpCas9(1.0)和eSpCas9(1.1)之间在特异性方面的任何区别，SpCas9(K855A)和eSpCas9(1.1)被选择用于进一步的基于中靶效率的分析。

使用跨基因组定量DNA双链断裂(DSB)的BLESS(直接原位断裂标记、链霉亲和素富集以及新一代测序)来评估SpCas9(K855A)和eSpCas9(1.1)的基因组范围的编辑特异性(图17A)。在转染后大约24h收获细胞，并且进行BLESS。简言之，将总计1千万个细胞固定用于核分离和透化作用，并且然后用蛋白酶K在37℃处理4min，之后用PMSF失活。将脱蛋白的核DSB用200mM的退火近端接头标记过夜。在蛋白酶K消化标记的核之后，将染色质用26G针进行机械剪切，之后进行声处理(BioRuptor，高档上20分钟，50％占空比)。将总共20μg的剪切染色质捕获于链霉亲和素珠粒上，洗涤、并且连接至200mM的远端接头。然后用I-SceI在37℃消化4h将接头发夹切割下，并且产品经PCR富集18个循环，之后用TruSeq Nano LT试剂盒(亿明达)进行文库制备。对于阴性对照，将细胞用Lipofectamine 2000和pUC19 DNA模拟转染，并且通过测定平行处理。

如前所述的(兰(Ran)等人，《自然》(Nature)2015)计算DSB得分以将背景DSB从真实Cas9-诱导的DSB分离，并且基于DSB得分对座位的分选揭示了前几个脱靶位点，如先前已经针对这些sgRNA靶标鉴定的。为了提供超越这些前几个脱靶的另外的检测能力，我们从先前的Cas9-BLESS数据发现同源性检索算法可以有助于另外鉴定真实的Cas9诱导的DSB。同源性检索算法检索在DSB簇中间任一侧上的基因组50nt的区域内的最佳匹配的指导序列，所述DSB簇是在针对所有NGG和NAG PAM序列的BLESS中鉴定。采用以下权重来计算基于同源性的得分：在sgRNA和基因组序列得分+3之间的匹配，错配是-1，而在sgRNA和基因组序列之间的插入或缺失花费-5。因此，具有全20bp指导物+PAM的中靶序列将得69分。将针对DSB簇的最终同源性得分鉴定为来自所有可能序列的分数的最大值。使用这些权重，我们凭经验发现当>50的阈值用于同源性得分时，真实脱靶(对此，indel是基于靶向的深度测序被鉴定)以及背景DSB被完全分开。针对前200个BLESS DSB座位使用这种同源性指标允许我们进一步从背景DSB鉴定脱靶。

申请人针对两种突变体测定EMX1(1)和VEGFA(1)靶标，并且将这些结果与WTSpCas9进行比较。(图17B)。SpCas9(K855A)和eSpCas9(1.1)两者均展现出在基因组范围上脱靶切割的减少，并且未产生任何新的脱靶位点(图17C-D)。

实例15-Cas9靶向和核酸酶活性的机制

在Cas9结合非靶DNA链的强度超过DNA重杂交的力时脱靶切割发生。与这种模型一致，被设计为弱化Cas9和非互补DNA链之间的相互作用的突变导致特异性方面的实质性改进。该模型还表明，相反地，特异性可以通过加强Cas9与非靶链之间的相互作用而降低。与这种模型一致，产生两种突变体，S845K和L847R，其各自展现出降低的特异性(图24)。

实例16-金黄色葡萄球菌Cas9(SaCas9)的特异性

还可以将类似策略应用于其他Cas9家族蛋白。改进的特异性形式的金黄色葡萄球菌Cas9(SaCas9)类似于eSpCas9而产生。在RuvC和HNH结构域之间的沟槽中的残基的单氨基酸突变体和双氨基酸突变体被针对降低的脱靶切割而筛选。将具有改进的特异性的突变体组合以使得SaCas9的变体保持在EMX位点7处的中靶切割，并且具有显着降低的脱靶切割。(图25)SaCas9的晶体结构显示在HNH和RuvC结构域之间的沟槽被突变为改造核酸酶为具有改进的特异性。

实例17-HBG1的活化

将spCas9或spCas9突变体与不同指导RNA的复合物针对HBG1的活化进行测试。图31示出通过包含具有缺陷核酸酶活性的Cas9分子(例如dCas9，R780A/K810A，和R780A/K855A；还参见图4)的复合物来活化，或者通过核酸酶组分Cas9(例如，未突变的spCas9(px165)，R780A，K810A，或K848A)与缩短的(即“15bp”)指导RNA的复合物来活化。在用所有三种测试的指导物证明活化中突变体R780A是特别值得注意的。

实例18-CRISPR-Cas9组分的粒子介导的向造血干细胞(HSC)中的递送

申请人已经证明Cas9可以经由粒子递送至细胞。许多核治疗剂可需要一种或多种sgRNA和Cas9核酸酶两者的同时递送。因此，申请人证明了将修饰的Cas9酶和sgRNA的复合物以此方式递送的能力。

修饰的Cas9酶是通过经由粒子与一种或多种指导RNA共递送至细胞中来测试。以1:1摩尔比将靶向EMX1基因的sgRNA与eSpCas9(1.1)(K848A，K1003A，R1060A)在室温下在无菌无核酸酶的1X PBS中混合30分钟。对照是将相同的sgRNA与SpCas9混合。分开地，将DOTAP、DMPC、PEG、以及胆固醇溶解于100％乙醇中。将这两种溶液混合在一起以形成含有Cas9-sgRNA复合物的粒子。在这些粒子形成之后，将96孔板中的HSC用15ug Cas9蛋白每孔进行转染。在转染后三天，收获HSC，并且使用BLESS和通过同源性检索算法鉴定的脱靶来评估基因组范围的编辑特异性。对在EMX1座位处的中靶插入和缺失(indel)的数目以及在多个脱靶位点处的indel进行定量。eSpCas9(1.1)展现出在基因组范围上脱靶切割的减少并且没有新脱靶位点。

实例19：CRISPR-Cas9组分的粒子介导的向造血干细胞(HSC)中的递送以及HBB的修复。

靶向在β-球蛋白(HBB)基因中的通常GAG->GTG点突变的任一侧上的序列的两种sgRNA与eSpCas9(1.1)(K848A，K1003A，R1060A)以1:1(sgRNA对酶)摩尔比在室温下在无菌无核酸酶的1X PBS中混合30分钟。对照是将相同的sgRNA与SpCas9混合。分开地，将DOTAP、DMPC、PEG、以及胆固醇溶解于100％乙醇中。将两种溶液和用于校正GAG->GTG点突变的模板核酸混合在一起，以形成包含Cas9-sgRNA复合物和模板的粒子。在这些粒子形成之后，将96孔板中的HSC用15ug Cas9蛋白每孔进行转染。在转染后三天，收获HSC并且针对GAG->GTG点突变的修复对其进行测试。然后使用BLESS和通过同源性检索算法鉴定的脱靶来针对基因组范围的编辑特异性评估校正的细胞。量化在多个脱靶位点处的indel。eSpCas9(1.1)展现出在基因组范围上脱靶切割的减少并且没有新脱靶位点。

指导序列和NGS引物的表格

野生型SpCas9

ATGGCCCCAAAGAAGAAGCGGAAGGTCGGTATCCACGGAGTCCCAGCAGCCGACAAGAAGTACAGCATCGGCCTGGACATCGGCACCAACTCTGTGGGCTGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAATTCAAGGTGCTGGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGAGCCCTGCTGTTCGACAGCGGCGAAACAGCCGAGGCCACCCGGCTGAAGAGAACCGCCAGAAGAAGATACACCAGACGGAAGAACCGGATCTGCTATCTGCAAGAGATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGATAAGAAGCACGAGCGGCACCCCATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCTGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATCTATCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGCGACCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGACCTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCAGCGGCGTGGACGCCAAGGCCATCCTGTCTGCCAGACTGAGCAAGAGCAGACGGCTGGAAAATCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAATGGCCTGTTCGGAAACCTGATTGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTGGCCGAGGATGCCAAACTGCAGCTGAGCAAGGACACCTACGACGACGACCTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTTCTGGCCGCCAAGAACCTGTCCGACGCCATCCTGCTGAGCGACATCCTGAGAGTGAACACCGAGATCACCAAGGCCCCCCTGAGCGCCTCTATGATCAAGAGATACGACGAGCACCACCAGGACCTGACCCTGCTGAAAGCTCTCGTGCGGCAGCAGCTGCCTGAGAAGTACAAAGAGATTTTCTTCGACCAGAGCAAGAACGGCTACGCCGGCTACATTGACGGCGGAGCCAGCCAGGAAGAGTTCTACAAGTTCATCAAGCCCATCCTGGAAAAGATGGACGGCACCGAGGAACTGCTCGTGAAGCTGAACAGAGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCAGCATCCCCCACCAGATCCACCTGGGAGAGCTGCACGCCATTCTGCGGCGGCAGGAAGATTTTTACCCATTCCTGAAGGACAACCGGGAAAAGATCGAGAAGATCCTGACCTTCCGCATCCCCTACTACGTGGGCCCTCTGGCCAGGGGAAACAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACCCCCTGGAACTTCGAGGAAGTGGTGGACAAGGGCGCTTCCGCCCAGAGCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTACGAGTACTTCACCGTGTATAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTCCTGAGCGGCGAGCAGAAAAAGGCCATCGTGGACCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAGAAAATCGAGTGCTTCGACTCCGTGGAAATCTCCGGCGTGGAAGATCGGTTCAACGCCTCCCTGGGCACATACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAATGAGGAAAACGAGGACATTCTGGAAGATATCGTGCTGACCCTGACACTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACCTATGCCCACCTGTTCGACGACAAAGTGATGAAGCAGCTGAAGCGGCGGAGATACACCGGCTGGGGCAGGCTGAGCCGGAAGCTGATCAACGGCATCCGGGACAAGCAGTCCGGCAAGACAATCCTGGATTTCCTGAAGTCCGACGGCTTCGCCAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACCTTTAAAGAGGACATCCAGAAAGCCCAGGTGTCCGGCCAGGGCGATAGCCTGCACGAGCACATTGCCAATCTGGCCGGCAGCCCCGCCATTAAGAAGGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTCGTGAAAGTGATGGGCCGGCACAAGCCCGAGAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACCCAGAAGGGACAGAAGAACAGCCGCGAGAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACACCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGGCGGGATATGTACGTGGACCAGGAACTGGACATCAACCGGCTGTCCGACTACGATGTGGACCATATCGTGCCTCAGAGCTTTCTGAAGGACGACTCCATCGACAACAAGGTGCTGACCAGAAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCTCCGAAGAGGTCGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATTACCCAGAGAAAGTTCGACAATCTGACCAAGGCCGAGAGAGGCGGCCTGAGCGAACTGGATAAGGCCGGCTTCATCAAGAGACAGCTGGTGGAAACCCGGCAGATCACAAAGCACGTGGCACAGATCCTGGACTCCCGGATGAACACTAAGTACGACGAGAATGACAAGCTGATCCGGGAAGTGAAAGTGATCACCCTGAAGTCCAAGCTGGTGTCCGATTTCCGGAAGGATTTCCAGTTTTACAAAGTGCGCGAGATCAACAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTCGTGGGAACCGCCCTGATCAAAAAGTACCCTAAGCTGGAAAGCGAGTTCGTGTACGGCGACTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAAATCGGCAAGGCTACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTTTTCAAGACCGAGATTACCCTGGCCAACGGCGAGATCCGGAAGCGGCCTCTGATCGAGACAAACGGCGAAACCGGGGAGATCGTGTGGGATAAGGGCCGGGATTTTGCCACCGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAAAAGACCGAGGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCCAAGAGGAACAGCGATAAGCTGATCGCCAGAAAGAAGGACTGGGACCCTAAGAAGTACGGCGGCTTCGACAGCCCCACCGTGGCCTATTCTGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGTCCAAGAAACTGAAGAGTGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTCGAGAAGAATCCCATCGACTTTCTGGAAGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTGCCTAAGTACTCCCTGTTCGAGCTGGAAAACGGCCGGAAGAGAATGCTGGCCTCTGCCGGCGAACTGCAGAAGGGAAACGAACTGGCCCTGCCCTCCAAATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCTCCCCCGAGGATAATGAGCAGAAACAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTCTCCAAGAGAGTGATCCTGGCCGACGCTAATCTGGACAAAGTGCTGTCCGCCTACAACAAGCACCGGGATAAGCCCATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAATCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGAGGTACACCAGCACCAAAGAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCCTGTACGAGACACGGATCGACCTGTCTCAGCTGGGAGGCGACAAAAGGCCGGCGGCCACGAAAAAGGCCGGCCAGGCAAAAAAGAAAAAGTAA

>K855A

ATGGACTATAAGGACCACGACGGAGACTACAAGGATCATGATATTGATTACAAAGACGATGACGATAAGATGGCCCCAAAGAAGAAGCGGAAGGTCGGTATCCACGGAGTCCCAGCAGCCGACAAGAAGTACAGCATCGGCCTGGACATCGGCACCAACTCTGTGGGCTGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAATTCAAGGTGCTGGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGAGCCCTGCTGTTCGACAGCGGCGAAACAGCCGAGGCCACCCGGCTGAAGAGAACCGCCAGAAGAAGATACACCAGACGGAAGAACCGGATCTGCTATCTGCAAGAGATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGATAAGAAGCACGAGCGGCACCCCATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCTGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATCTATCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGCGACCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGACCTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCAGCGGCGTGGACGCCAAGGCCATCCTGTCTGCCAGACTGAGCAAGAGCAGACGGCTGGAAAATCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAATGGCCTGTTCGGAAACCTGATTGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTGGCCGAGGATGCCAAACTGCAGCTGAGCAAGGACACCTACGACGACGACCTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTTCTGGCCGCCAAGAACCTGTCCGACGCCATCCTGCTGAGCGACATCCTGAGAGTGAACACCGAGATCACCAAGGCCCCCCTGAGCGCCTCTATGATCAAGAGATACGACGAGCACCACCAGGACCTGACCCTGCTGAAAGCTCTCGTGCGGCAGCAGCTGCCTGAGAAGTACAAAGAGATTTTCTTCGACCAGAGCAAGAACGGCTACGCCGGCTACATTGACGGCGGAGCCAGCCAGGAAGAGTTCTACAAGTTCATCAAGCCCATCCTGGAAAAGATGGACGGCACCGAGGAACTGCTCGTGAAGCTGAACAGAGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCAGCATCCCCCACCAGATCCACCTGGGAGAGCTGCACGCCATTCTGCGGCGGCAGGAAGATTTTTACCCATTCCTGAAGGACAACCGGGAAAAGATCGAGAAGATCCTGACCTTCCGCATCCCCTACTACGTGGGCCCTCTGGCCAGGGGAAACAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACCCCCTGGAACTTCGAGGAAGTGGTGGACAAGGGCGCTTCCGCCCAGAGCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTACGAGTACTTCACCGTGTATAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTCCTGAGCGGCGAGCAGAAAAAGGCCATCGTGGACCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAGAAAATCGAGTGCTTCGACTCCGTGGAAATCTCCGGCGTGGAAGATCGGTTCAACGCCTCCCTGGGCACATACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAATGAGGAAAACGAGGACATTCTGGAAGATATCGTGCTGACCCTGACACTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACCTATGCCCACCTGTTCGACGACAAAGTGATGAAGCAGCTGAAGCGGCGGAGATACACCGGCTGGGGCAGGCTGAGCCGGAAGCTGATCAACGGCATCCGGGACAAGCAGTCCGGCAAGACAATCCTGGATTTCCTGAAGTCCGACGGCTTCGCCAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACCTTTAAAGAGGACATCCAGAAAGCCCAGGTGTCCGGCCAGGGCGATAGCCTGCACGAGCACATTGCCAATCTGGCCGGCAGCCCCGCCATTAAGAAGGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTCGTGAAAGTGATGGGCCGGCACAAGCCCGAGAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACCCAGAAGGGACAGAAGAACAGCCGCGAGAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACACCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGGCGGGATATGTACGTGGACCAGGAACTGGACATCAACCGGCTGTCCGACTACGATGTGGACCATATCGTGCCTCAGAGCTTTCTGAAGGACGACTCCATCGACAACGCGGTGCTGACCAGAAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCTCCGAAGAGGTCGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATTACCCAGAGAAAGTTCGACAATCTGACCAAGGCCGAGAGAGGCGGCCTGAGCGAACTGGATAAGGCCGGCTTCATCAAGAGACAGCTGGTGGAAACCCGGCAGATCACAAAGCACGTGGCACAGATCCTGGACTCCCGGATGAACACTAAGTACGACGAGAATGACAAGCTGATCCGGGAAGTGAAAGTGATCACCCTGAAGTCCAAGCTGGTGTCCGATTTCCGGAAGGATTTCCAGTTTTACAAAGTGCGCGAGATCAACAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTCGTGGGAACCGCCCTGATCAAAAAGTACCCTAAGCTGGAAAGCGAGTTCGTGTACGGCGACTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAAATCGGCAAGGCTACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTTTTCAAGACCGAGATTACCCTGGCCAACGGCGAGATCCGGAAGCGGCCTCTGATCGAGACAAACGGCGAAACCGGGGAGATCGTGTGGGATAAGGGCCGGGATTTTGCCACCGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAAAAGACCGAGGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCCAAGAGGAACAGCGATAAGCTGATCGCCAGAAAGAAGGACTGGGACCCTAAGAAGTACGGCGGCTTCGACAGCCCCACCGTGGCCTATTCTGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGTCCAAGAAACTGAAGAGTGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTCGAGAAGAATCCCATCGACTTTCTGGAAGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTGCCTAAGTACTCCCTGTTCGAGCTGGAAAACGGCCGGAAGAGAATGCTGGCCTCTGCCGGCGAACTGCAGAAGGGAAACGAACTGGCCCTGCCCTCCAAATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCTCCCCCGAGGATAATGAGCAGAAACAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTCTCCAAGAGAGTGATCCTGGCCGACGCTAATCTGGACAAAGTGCTGTCCGCCTACAACAAGCACCGGGATAAGCCCATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAATCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGAGGTACACCAGCACCAAAGAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCCTGTACGAGACACGGATCGACCTGTCTCAGCTGGGAGGCGACAAAAGGCCGGCGGCCACGAAAAAGGCCGGCCAGGCAAAAAAGAAAAAGTAA

eSpCas9(1.0)

ATGGACTATAAGGACCACGACGGAGACTACAAGGATCATGATATTGATTACAAAGACGATGACGATAAGATGGCCCCAAAGAAGAAGCGGAAGGTCGGTATCCACGGAGTCCCAGCAGCCGACAAGAAGTACAGCATCGGCCTGGACATCGGCACCAACTCTGTGGGCTGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAATTCAAGGTGCTGGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGAGCCCTGCTGTTCGACAGCGGCGAAACAGCCGAGGCCACCCGGCTGAAGAGAACCGCCAGAAGAAGATACACCAGACGGAAGAACCGGATCTGCTATCTGCAAGAGATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGATAAGAAGCACGAGCGGCACCCCATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCTGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATCTATCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGCGACCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGACCTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCAGCGGCGTGGACGCCAAGGCCATCCTGTCTGCCAGACTGAGCAAGAGCAGACGGCTGGAAAATCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAATGGCCTGTTCGGAAACCTGATTGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTGGCCGAGGATGCCAAACTGCAGCTGAGCAAGGACACCTACGACGACGACCTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTTCTGGCCGCCAAGAACCTGTCCGACGCCATCCTGCTGAGCGACATCCTGAGAGTGAACACCGAGATCACCAAGGCCCCCCTGAGCGCCTCTATGATCAAGAGATACGACGAGCACCACCAGGACCTGACCCTGCTGAAAGCTCTCGTGCGGCAGCAGCTGCCTGAGAAGTACAAAGAGATTTTCTTCGACCAGAGCAAGAACGGCTACGCCGGCTACATTGACGGCGGAGCCAGCCAGGAAGAGTTCTACAAGTTCATCAAGCCCATCCTGGAAAAGATGGACGGCACCGAGGAACTGCTCGTGAAGCTGAACAGAGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCAGCATCCCCCACCAGATCCACCTGGGAGAGCTGCACGCCATTCTGCGGCGGCAGGAAGATTTTTACCCATTCCTGAAGGACAACCGGGAAAAGATCGAGAAGATCCTGACCTTCCGCATCCCCTACTACGTGGGCCCTCTGGCCAGGGGAAACAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACCCCCTGGAACTTCGAGGAAGTGGTGGACAAGGGCGCTTCCGCCCAGAGCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTACGAGTACTTCACCGTGTATAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTCCTGAGCGGCGAGCAGAAAAAGGCCATCGTGGACCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAGAAAATCGAGTGCTTCGACTCCGTGGAAATCTCCGGCGTGGAAGATCGGTTCAACGCCTCCCTGGGCACATACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAATGAGGAAAACGAGGACATTCTGGAAGATATCGTGCTGACCCTGACACTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACCTATGCCCACCTGTTCGACGACAAAGTGATGAAGCAGCTGAAGCGGCGGAGATACACCGGCTGGGGCAGGCTGAGCCGGAAGCTGATCAACGGCATCCGGGACAAGCAGTCCGGCAAGACAATCCTGGATTTCCTGAAGTCCGACGGCTTCGCCAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACCTTTAAAGAGGACATCCAGAAAGCCCAGGTGTCCGGCCAGGGCGATAGCCTGCACGAGCACATTGCCAATCTGGCCGGCAGCCCCGCCATTAAGAAGGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTCGTGAAAGTGATGGGCCGGCACAAGCCCGAGAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACCCAGAAGGGACAGAAGAACAGCCGCGAGAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACACCCAGCTGCAGAACGAGGCCCTGTACCTGTACTACCTGCAGAATGGGCGGGATATGTACGTGGACCAGGAACTGGACATCAACCGGCTGTCCGACTACGATGTGGACCATATCGTGCCTCAGAGCTTTCTGAAGGACGACTCCATCGACAACAAGGTGCTGACCAGAAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCTCCGAAGAGGTCGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATTACCCAGAGAAAGTTCGACAATCTGACCAAGGCCGAGAGAGGCGGCCTGAGCGAACTGGATAAGGCCGGCTTCATCAAGAGACAGCTGGTGGAAACCCGGCAGATCACAAAGCACGTGGCACAGATCCTGGACTCCCGGATGAACACTAAGTACGACGAGAATGACAAGCTGATCCGGGAAGTGAAAGTGATCACCCTGAAGTCCAAGCTGGTGTCCGATTTCCGGAAGGATTTCCAGTTTTACAAAGTGCGCGAGATCAACAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTCGTGGGAACCGCCCTGATCAAAAAGTACCCTGCGCTGGAAAGCGAGTTCGTGTACGGCGACTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAAATCGGCAAGGCTACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTTTTCAAGACCGAGATTACCCTGGCCAACGGCGAGATCCGGAAGGCGCCTCTGATCGAGACAAACGGCGAAACCGGGGAGATCGTGTGGGATAAGGGCCGGGATTTTGCCACCGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAAAAGACCGAGGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCCAAGAGGAACAGCGATAAGCTGATCGCCAGAAAGAAGGACTGGGACCCTAAGAAGTACGGCGGCTTCGACAGCCCCACCGTGGCCTATTCTGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGTCCAAGAAACTGAAGAGTGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTCGAGAAGAATCCCATCGACTTTCTGGAAGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTGCCTAAGTACTCCCTGTTCGAGCTGGAAAACGGCCGGAAGAGAATGCTGGCCTCTGCCGGCGAACTGCAGAAGGGAAACGAACTGGCCCTGCCCTCCAAATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCTCCCCCGAGGATAATGAGCAGAAACAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTCTCCAAGAGAGTGATCCTGGCCGACGCTAATCTGGACAAAGTGCTGTCCGCCTACAACAAGCACCGGGATAAGCCCATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAATCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGAGGTACACCAGCACCAAAGAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCCTGTACGAGACACGGATCGACCTGTCTCAGCTGGGAGGCGACAAAAGGCCGGCGGCCACGAAAAAGGCCGGCCAGGCAAAAAAGAAAAAG

eSpCas9(1.1)

ATGGACTATAAGGACCACGACGGAGACTACAAGGATCATGATATTGATTACAAAGACGATGACGATAAGATGGCCCCAAAGAAGAAGCGGAAGGTCGGTATCCACGGAGTCCCAGCAGCCGACAAGAAGTACAGCATCGGCCTGGACATCGGCACCAACTCTGTGGGCTGGGCCGTGATCACCGACGAGTACAAGGTGCCCAGCAAGAAATTCAAGGTGCTGGGCAACACCGACCGGCACAGCATCAAGAAGAACCTGATCGGAGCCCTGCTGTTCGACAGCGGCGAAACAGCCGAGGCCACCCGGCTGAAGAGAACCGCCAGAAGAAGATACACCAGACGGAAGAACCGGATCTGCTATCTGCAAGAGATCTTCAGCAACGAGATGGCCAAGGTGGACGACAGCTTCTTCCACAGACTGGAAGAGTCCTTCCTGGTGGAAGAGGATAAGAAGCACGAGCGGCACCCCATCTTCGGCAACATCGTGGACGAGGTGGCCTACCACGAGAAGTACCCCACCATCTACCACCTGAGAAAGAAACTGGTGGACAGCACCGACAAGGCCGACCTGCGGCTGATCTATCTGGCCCTGGCCCACATGATCAAGTTCCGGGGCCACTTCCTGATCGAGGGCGACCTGAACCCCGACAACAGCGACGTGGACAAGCTGTTCATCCAGCTGGTGCAGACCTACAACCAGCTGTTCGAGGAAAACCCCATCAACGCCAGCGGCGTGGACGCCAAGGCCATCCTGTCTGCCAGACTGAGCAAGAGCAGACGGCTGGAAAATCTGATCGCCCAGCTGCCCGGCGAGAAGAAGAATGGCCTGTTCGGAAACCTGATTGCCCTGAGCCTGGGCCTGACCCCCAACTTCAAGAGCAACTTCGACCTGGCCGAGGATGCCAAACTGCAGCTGAGCAAGGACACCTACGACGACGACCTGGACAACCTGCTGGCCCAGATCGGCGACCAGTACGCCGACCTGTTTCTGGCCGCCAAGAACCTGTCCGACGCCATCCTGCTGAGCGACATCCTGAGAGTGAACACCGAGATCACCAAGGCCCCCCTGAGCGCCTCTATGATCAAGAGATACGACGAGCACCACCAGGACCTGACCCTGCTGAAAGCTCTCGTGCGGCAGCAGCTGCCTGAGAAGTACAAAGAGATTTTCTTCGACCAGAGCAAGAACGGCTACGCCGGCTACATTGACGGCGGAGCCAGCCAGGAAGAGTTCTACAAGTTCATCAAGCCCATCCTGGAAAAGATGGACGGCACCGAGGAACTGCTCGTGAAGCTGAACAGAGAGGACCTGCTGCGGAAGCAGCGGACCTTCGACAACGGCAGCATCCCCCACCAGATCCACCTGGGAGAGCTGCACGCCATTCTGCGGCGGCAGGAAGATTTTTACCCATTCCTGAAGGACAACCGGGAAAAGATCGAGAAGATCCTGACCTTCCGCATCCCCTACTACGTGGGCCCTCTGGCCAGGGGAAACAGCAGATTCGCCTGGATGACCAGAAAGAGCGAGGAAACCATCACCCCCTGGAACTTCGAGGAAGTGGTGGACAAGGGCGCTTCCGCCCAGAGCTTCATCGAGCGGATGACCAACTTCGATAAGAACCTGCCCAACGAGAAGGTGCTGCCCAAGCACAGCCTGCTGTACGAGTACTTCACCGTGTATAACGAGCTGACCAAAGTGAAATACGTGACCGAGGGAATGAGAAAGCCCGCCTTCCTGAGCGGCGAGCAGAAAAAGGCCATCGTGGACCTGCTGTTCAAGACCAACCGGAAAGTGACCGTGAAGCAGCTGAAAGAGGACTACTTCAAGAAAATCGAGTGCTTCGACTCCGTGGAAATCTCCGGCGTGGAAGATCGGTTCAACGCCTCCCTGGGCACATACCACGATCTGCTGAAAATTATCAAGGACAAGGACTTCCTGGACAATGAGGAAAACGAGGACATTCTGGAAGATATCGTGCTGACCCTGACACTGTTTGAGGACAGAGAGATGATCGAGGAACGGCTGAAAACCTATGCCCACCTGTTCGACGACAAAGTGATGAAGCAGCTGAAGCGGCGGAGATACACCGGCTGGGGCAGGCTGAGCCGGAAGCTGATCAACGGCATCCGGGACAAGCAGTCCGGCAAGACAATCCTGGATTTCCTGAAGTCCGACGGCTTCGCCAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACCTTTAAAGAGGACATCCAGAAAGCCCAGGTGTCCGGCCAGGGCGATAGCCTGCACGAGCACATTGCCAATCTGGCCGGCAGCCCCGCCATTAAGAAGGGCATCCTGCAGACAGTGAAGGTGGTGGACGAGCTCGTGAAAGTGATGGGCCGGCACAAGCCCGAGAACATCGTGATCGAAATGGCCAGAGAGAACCAGACCACCCAGAAGGGACAGAAGAACAGCCGCGAGAGAATGAAGCGGATCGAAGAGGGCATCAAAGAGCTGGGCAGCCAGATCCTGAAAGAACACCCCGTGGAAAACACCCAGCTGCAGAACGAGAAGCTGTACCTGTACTACCTGCAGAATGGGCGGGATATGTACGTGGACCAGGAACTGGACATCAACCGGCTGTCCGACTACGATGTGGACCATATCGTGCCTCAGAGCTTTCTGGCGGACGACTCCATCGACAACAAGGTGCTGACCAGAAGCGACAAGAACCGGGGCAAGAGCGACAACGTGCCCTCCGAAGAGGTCGTGAAGAAGATGAAGAACTACTGGCGGCAGCTGCTGAACGCCAAGCTGATTACCCAGAGAAAGTTCGACAATCTGACCAAGGCCGAGAGAGGCGGCCTGAGCGAACTGGATAAGGCCGGCTTCATCAAGAGACAGCTGGTGGAAACCCGGCAGATCACAAAGCACGTGGCACAGATCCTGGACTCCCGGATGAACACTAAGTACGACGAGAATGACAAGCTGATCCGGGAAGTGAAAGTGATCACCCTGAAGTCCAAGCTGGTGTCCGATTTCCGGAAGGATTTCCAGTTTTACAAAGTGCGCGAGATCAACAACTACCACCACGCCCACGACGCCTACCTGAACGCCGTCGTGGGAACCGCCCTGATCAAAAAGTACCCTGCGCTGGAAAGCGAGTTCGTGTACGGCGACTACAAGGTGTACGACGTGCGGAAGATGATCGCCAAGAGCGAGCAGGAAATCGGCAAGGCTACCGCCAAGTACTTCTTCTACAGCAACATCATGAACTTTTTCAAGACCGAGATTACCCTGGCCAACGGCGAGATCCGGAAGGCGCCTCTGATCGAGACAAACGGCGAAACCGGGGAGATCGTGTGGGATAAGGGCCGGGATTTTGCCACCGTGCGGAAAGTGCTGAGCATGCCCCAAGTGAATATCGTGAAAAAGACCGAGGTGCAGACAGGCGGCTTCAGCAAAGAGTCTATCCTGCCCAAGAGGAACAGCGATAAGCTGATCGCCAGAAAGAAGGACTGGGACCCTAAGAAGTACGGCGGCTTCGACAGCCCCACCGTGGCCTATTCTGTGCTGGTGGTGGCCAAAGTGGAAAAGGGCAAGTCCAAGAAACTGAAGAGTGTGAAAGAGCTGCTGGGGATCACCATCATGGAAAGAAGCAGCTTCGAGAAGAATCCCATCGACTTTCTGGAAGCCAAGGGCTACAAAGAAGTGAAAAAGGACCTGATCATCAAGCTGCCTAAGTACTCCCTGTTCGAGCTGGAAAACGGCCGGAAGAGAATGCTGGCCTCTGCCGGCGAACTGCAGAAGGGAAACGAACTGGCCCTGCCCTCCAAATATGTGAACTTCCTGTACCTGGCCAGCCACTATGAGAAGCTGAAGGGCTCCCCCGAGGATAATGAGCAGAAACAGCTGTTTGTGGAACAGCACAAGCACTACCTGGACGAGATCATCGAGCAGATCAGCGAGTTCTCCAAGAGAGTGATCCTGGCCGACGCTAATCTGGACAAAGTGCTGTCCGCCTACAACAAGCACCGGGATAAGCCCATCAGAGAGCAGGCCGAGAATATCATCCACCTGTTTACCCTGACCAATCTGGGAGCCCCTGCCGCCTTCAAGTACTTTGACACCACCATCGACCGGAAGAGGTACACCAGCACCAAAGAGGTGCTGGACGCCACCCTGATCCACCAGAGCATCACCGGCCTGTACGAGACACGGATCGACCTGTCTCAGCTGGGAGGCGACAAAAGGCCGGCGGCCACGAAAAAGGCCGGCCAGGCAAAAAAGAAAAAGTAA

***

虽然如上详细描述了本发明的优选实施例，应理解上述段落定义的本发明并不局限于上述说明书中的具体细节，原因是其许多明显变化是可能的而并不背离本发明的精神或范围。

序列表

<110> 布罗德研究所有限公司（THE BROAD INSTITUTE, INC）

麻省理工学院（MASSACHUSETTS INSTITUTE OF TECHNOLOGY）

<120> 降低脱靶效应的CRISPR酶突变

<130> 47627.99.2017

<141> 2016-06-17

<150> 62/269,876

<151> 2015-12-18

<150> 62/255,256

<151> 2015-11-13

<150> 62/237,360

<151> 2015-10-05

<150> 62/207,312

<151> 2015-08-19

<150> 62/181,453

<151> 2015-06-18

<160> 547

<170> SIPOSequenceListing 1.0

<210> 1

<211> 4

<212> PRT

<213> Artificial Sequence

<220>

<221> PEPTIDE

<223> /注释=“人工序列的描述：合成肽”

<400> 1

Gly Gly Gly Ser

1

<210> 2

<211> 15

<212> PRT

<213> Artificial Sequence

<220>

<221> PEPTIDE

<223> /注释=“人工序列的描述：合成肽”

<400> 2

Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser

1 5 10 15

<210> 3

<211> 30

<212> PRT

<213> Artificial Sequence

<220>

<221> PEPTIDE

<223> /注释=“人工序列的描述：合成多肽"

<400> 3

Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly

1 5 10 15

Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser

20 25 30

<210> 4

<211> 45

<212> PRT

<213> Artificial Sequence

<220>

<221> PEPTIDE

<223> /注释=“人工序列的描述：合成多肽"

<400> 4

Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly

1 5 10 15

Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly

20 25 30

Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser

35 40 45

<210> 5

<211> 60

<212> PRT

<213> Artificial Sequence

<220>

<221> PEPTIDE

<223> /注释=“人工序列的描述：合成多肽"

<400> 5

Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly

1 5 10 15

Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly

20 25 30

Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly

35 40 45

Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser

50 55 60

<210> 6

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (1)..(20)

<223> a, c, t或g

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (1)..(1)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (2)..(2)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (3)..(3)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (4)..(4)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (5)..(5)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (6)..(6)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (7)..(7)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (8)..(8)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (9)..(9)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (10)..(10)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (11)..(11)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (12)..(12)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (13)..(13)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (14)..(14)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (15)..(15)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (16)..(16)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (17)..(17)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (18)..(18)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (19)..(19)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (20)..(20)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (21)..(21)

<223> n is a, c, g, t or u

<400> 6

nnnnnnnnnn nnnnnnnnnn ngg 23

<210> 7

<211> 15

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (1)..(12)

<223> a, c, t或g

<220>

<221> modified_base

<222> (13)..(13)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (1)..(1)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (2)..(2)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (3)..(3)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (4)..(4)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (5)..(5)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (6)..(6)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (7)..(7)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (8)..(8)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (9)..(9)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (10)..(10)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (11)..(11)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (12)..(12)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (13)..(13)

<223> n is a, c, g, t or u

<400> 7

nnnnnnnnnn nnngg 15

<210> 8

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (1)..(20)

<223> a, c, t或g

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (1)..(1)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (2)..(2)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (3)..(3)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (4)..(4)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (5)..(5)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (6)..(6)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (7)..(7)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (8)..(8)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (9)..(9)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (10)..(10)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (11)..(11)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (12)..(12)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (13)..(13)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (14)..(14)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (15)..(15)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (16)..(16)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (17)..(17)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (18)..(18)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (19)..(19)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (20)..(20)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (21)..(21)

<223> n is a, c, g, t or u

<400> 8

nnnnnnnnnn nnnnnnnnnn ngg 23

<210> 9

<211> 14

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (1)..(11)

<223> a, c, t或g

<220>

<221> modified_base

<222> (12)..(12)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (1)..(1)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (2)..(2)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (3)..(3)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (4)..(4)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (5)..(5)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (6)..(6)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (7)..(7)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (8)..(8)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (9)..(9)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (10)..(10)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (11)..(11)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (12)..(12)

<223> n is a, c, g, t or u

<400> 9

nnnnnnnnnn nngg 14

<210> 10

<211> 27

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (1)..(20)

<223> a, c, t或g

<220>

<221> modified_base

<222> (21)..(22)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (1)..(1)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (2)..(2)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (3)..(3)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (4)..(4)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (5)..(5)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (6)..(6)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (7)..(7)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (8)..(8)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (9)..(9)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (10)..(10)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (11)..(11)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (12)..(12)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (13)..(13)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (14)..(14)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (15)..(15)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (16)..(16)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (17)..(17)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (18)..(18)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (19)..(19)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (20)..(20)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (21)..(21)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (22)..(22)

<223> n is a, c, g, t or u

<400> 10

nnnnnnnnnn nnnnnnnnnn nnagaaw 27

<210> 11

<211> 19

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (1)..(12)

<223> a, c, t或g

<220>

<221> modified_base

<222> (13)..(14)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (1)..(1)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (2)..(2)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (3)..(3)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (4)..(4)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (5)..(5)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (6)..(6)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (7)..(7)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (8)..(8)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (9)..(9)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (10)..(10)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (11)..(11)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (12)..(12)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (13)..(13)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (14)..(14)

<223> n is a, c, g, t or u

<400> 11

nnnnnnnnnn nnnnagaaw 19

<210> 12

<211> 27

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (1)..(20)

<223> a, c, t或g

<220>

<221> modified_base

<222> (21)..(22)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (1)..(1)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (2)..(2)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (3)..(3)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (4)..(4)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (5)..(5)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (6)..(6)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (7)..(7)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (8)..(8)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (9)..(9)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (10)..(10)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (11)..(11)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (12)..(12)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (13)..(13)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (14)..(14)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (15)..(15)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (16)..(16)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (17)..(17)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (18)..(18)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (19)..(19)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (20)..(20)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (21)..(21)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (22)..(22)

<223> n is a, c, g, t or u

<400> 12

nnnnnnnnnn nnnnnnnnnn nnagaaw 27

<210> 13

<211> 18

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (1)..(11)

<223> a, c, t或g

<220>

<221> modified_base

<222> (12)..(13)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (1)..(1)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (2)..(2)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (3)..(3)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (4)..(4)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (5)..(5)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (6)..(6)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (7)..(7)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (8)..(8)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (9)..(9)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (10)..(10)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (11)..(11)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (12)..(12)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (13)..(13)

<223> n is a, c, g, t or u

<400> 13

nnnnnnnnnn nnnagaaw 18

<210> 14

<211> 25

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (1)..(20)

<223> a, c, t或g

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, 未知或其他

<220>

<221> modified_base

<222> (24)..(24)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (1)..(1)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (2)..(2)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (3)..(3)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (4)..(4)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (5)..(5)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (6)..(6)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (7)..(7)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (8)..(8)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (9)..(9)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (10)..(10)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (11)..(11)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (12)..(12)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (13)..(13)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (14)..(14)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (15)..(15)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (16)..(16)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (17)..(17)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (18)..(18)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (19)..(19)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (20)..(20)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (21)..(21)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (24)..(24)

<223> n is a, c, g, t or u

<400> 14

nnnnnnnnnn nnnnnnnnnn nggng 25

<210> 15

<211> 17

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (1)..(12)

<223> a, c, t或g

<220>

<221> modified_base

<222> (13)..(13)

<223> a, c, t, g, 未知或其他

<220>

<221> modified_base

<222> (16)..(16)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (1)..(1)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (2)..(2)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (3)..(3)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (4)..(4)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (5)..(5)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (6)..(6)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (7)..(7)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (8)..(8)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (9)..(9)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (10)..(10)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (11)..(11)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (12)..(12)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (13)..(13)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (16)..(16)

<223> n is a, c, g, t or u

<400> 15

nnnnnnnnnn nnnggng 17

<210> 16

<211> 25

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (1)..(20)

<223> a, c, t或g

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, 未知或其他

<220>

<221> modified_base

<222> (24)..(24)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (1)..(1)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (2)..(2)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (3)..(3)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (4)..(4)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (5)..(5)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (6)..(6)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (7)..(7)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (8)..(8)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (9)..(9)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (10)..(10)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (11)..(11)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (12)..(12)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (13)..(13)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (14)..(14)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (15)..(15)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (16)..(16)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (17)..(17)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (18)..(18)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (19)..(19)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (20)..(20)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (21)..(21)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (24)..(24)

<223> n is a, c, g, t or u

<400> 16

nnnnnnnnnn nnnnnnnnnn nggng 25

<210> 17

<211> 16

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (1)..(11)

<223> a, c, t或g

<220>

<221> modified_base

<222> (12)..(12)

<223> a, c, t, g, 未知或其他

<220>

<221> modified_base

<222> (15)..(15)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (1)..(1)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (2)..(2)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (3)..(3)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (4)..(4)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (5)..(5)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (6)..(6)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (7)..(7)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (8)..(8)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (9)..(9)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (10)..(10)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (11)..(11)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (12)..(12)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (15)..(15)

<223> n is a, c, g, t or u

<400> 17

nnnnnnnnnn nnggng 16

<210> 18

<211> 137

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成多核苷酸”

<220>

<221> modified_base

<222> (1)..(20)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (1)..(1)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (2)..(2)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (3)..(3)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (4)..(4)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (5)..(5)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (6)..(6)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (7)..(7)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (8)..(8)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (9)..(9)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (10)..(10)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (11)..(11)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (12)..(12)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (13)..(13)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (14)..(14)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (15)..(15)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (16)..(16)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (17)..(17)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (18)..(18)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (19)..(19)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (20)..(20)

<223> n is a, c, g, t or u

<400> 18

nnnnnnnnnn nnnnnnnnnn gtttttgtac tctcaagatt tagaaataaa tcttgcagaa 60

gctacaaaga taaggcttca tgccgaaatc aacaccctgt cattttatgg cagggtgttt 120

tcgttattta atttttt 137

<210> 19

<211> 123

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成多核苷酸”

<220>

<221> modified_base

<222> (1)..(20)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (1)..(1)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (2)..(2)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (3)..(3)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (4)..(4)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (5)..(5)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (6)..(6)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (7)..(7)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (8)..(8)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (9)..(9)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (10)..(10)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (11)..(11)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (12)..(12)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (13)..(13)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (14)..(14)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (15)..(15)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (16)..(16)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (17)..(17)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (18)..(18)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (19)..(19)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (20)..(20)

<223> n is a, c, g, t or u

<400> 19

nnnnnnnnnn nnnnnnnnnn gtttttgtac tctcagaaat gcagaagcta caaagataag 60

gcttcatgcc gaaatcaaca ccctgtcatt ttatggcagg gtgttttcgt tatttaattt 120

ttt 123

<210> 20

<211> 110

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成多核苷酸”

<220>

<221> modified_base

<222> (1)..(20)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (1)..(1)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (2)..(2)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (3)..(3)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (4)..(4)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (5)..(5)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (6)..(6)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (7)..(7)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (8)..(8)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (9)..(9)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (10)..(10)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (11)..(11)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (12)..(12)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (13)..(13)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (14)..(14)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (15)..(15)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (16)..(16)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (17)..(17)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (18)..(18)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (19)..(19)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (20)..(20)

<223> n is a, c, g, t or u

<400> 20

nnnnnnnnnn nnnnnnnnnn gtttttgtac tctcagaaat gcagaagcta caaagataag 60

gcttcatgcc gaaatcaaca ccctgtcatt ttatggcagg gtgttttttt 110

<210> 21

<211> 102

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成多核苷酸”

<220>

<221> modified_base

<222> (1)..(20)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (1)..(1)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (2)..(2)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (3)..(3)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (4)..(4)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (5)..(5)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (6)..(6)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (7)..(7)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (8)..(8)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (9)..(9)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (10)..(10)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (11)..(11)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (12)..(12)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (13)..(13)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (14)..(14)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (15)..(15)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (16)..(16)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (17)..(17)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (18)..(18)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (19)..(19)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (20)..(20)

<223> n is a, c, g, t or u

<400> 21

nnnnnnnnnn nnnnnnnnnn gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt ggcaccgagt cggtgctttt tt 102

<210> 22

<211> 88

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (1)..(20)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (1)..(1)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (2)..(2)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (3)..(3)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (4)..(4)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (5)..(5)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (6)..(6)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (7)..(7)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (8)..(8)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (9)..(9)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (10)..(10)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (11)..(11)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (12)..(12)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (13)..(13)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (14)..(14)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (15)..(15)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (16)..(16)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (17)..(17)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (18)..(18)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (19)..(19)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (20)..(20)

<223> n is a, c, g, t or u

<400> 22

nnnnnnnnnn nnnnnnnnnn gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcaac ttgaaaaagt gttttttt 88

<210> 23

<211> 76

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (1)..(20)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (1)..(1)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (2)..(2)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (3)..(3)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (4)..(4)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (5)..(5)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (6)..(6)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (7)..(7)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (8)..(8)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (9)..(9)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (10)..(10)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (11)..(11)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (12)..(12)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (13)..(13)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (14)..(14)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (15)..(15)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (16)..(16)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (17)..(17)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (18)..(18)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (19)..(19)

<223> n is a, c, g, t or u

<220>

<221> misc_feature

<222> (20)..(20)

<223> n is a, c, g, t or u

<400> 23

nnnnnnnnnn nnnnnnnnnn gttttagagc tagaaatagc aagttaaaat aaggctagtc 60

cgttatcatt tttttt 76

<210> 24

<211> 7

<212> PRT

<213> Simian virus 40

<400> 24

Pro Lys Lys Lys Arg Lys Val

1 5

<210> 25

<211> 16

<212> PRT

<213> Unknown

<220>

<221> PEPTIDE

<223> /注释=“对未知的描述：核质蛋白二分NLS序列”

<400> 25

Lys Arg Pro Ala Ala Thr Lys Lys Ala Gly Gln Ala Lys Lys Lys Lys

1 5 10 15

<210> 26

<211> 9

<212> PRT

<213> Unknown

<220>

<221> PEPTIDE

<223> /注释=“对未知的描述： C-myc NLS序列"

<400> 26

Pro Ala Ala Lys Arg Val Lys Leu Asp

1 5

<210> 27

<211> 11

<212> PRT

<213> Unknown

<220>

<221> PEPTIDE

<223> /注释=“对未知的描述： C-myc NLS序列"

<400> 27

Arg Gln Arg Arg Asn Glu Leu Lys Arg Ser Pro

1 5 10

<210> 28

<211> 38

<212> PRT

<213> Homo sapiens

<400> 28

Asn Gln Ser Ser Asn Phe Gly Pro Met Lys Gly Gly Asn Phe Gly Gly

1 5 10 15

Arg Ser Ser Gly Pro Tyr Gly Gly Gly Gly Gln Tyr Phe Ala Lys Pro

20 25 30

Arg Asn Gln Gly Gly Tyr

35

<210> 29

<211> 42

<212> PRT

<213> Unknown

<220>

<221> PEPTIDE

<223> /注释=“对未知的描述：来自输入蛋白-α序列的IBB结构域"

<400> 29

Arg Met Arg Ile Glx Phe Lys Asn Lys Gly Lys Asp Thr Ala Glu Leu

1 5 10 15

Arg Arg Arg Arg Val Glu Val Ser Val Glu Leu Arg Lys Ala Lys Lys

20 25 30

Asp Glu Gln Ile Leu Lys Arg Arg Asn Val

35 40

<210> 30

<211> 8

<212> PRT

<213> Unknown

<220>

<221> PEPTIDE

<223> /注释=“对未知的描述：肌瘤T蛋白序列"

<400> 30

Val Ser Arg Lys Arg Pro Arg Pro

1 5

<210> 31

<211> 8

<212> PRT

<213> Unknown

<220>

<221> PEPTIDE

<223> /注释=“对未知的描述：肌瘤T蛋白序列"

<400> 31

Pro Pro Lys Lys Ala Arg Glu Asp

1 5

<210> 32

<211> 8

<212> PRT

<213> Homo sapiens

<400> 32

Pro Gln Pro Lys Lys Lys Pro Leu

1 5

<210> 33

<211> 12

<212> PRT

<213> Mus musculus

<400> 33

Ser Ala Leu Ile Lys Lys Lys Lys Lys Met Ala Pro

1 5 10

<210> 34

<211> 5

<212> PRT

<213> Influenza virus

<400> 34

Asp Arg Leu Arg Arg

1 5

<210> 35

<211> 7

<212> PRT

<213> Influenza virus

<400> 35

Pro Lys Gln Lys Lys Arg Lys

1 5

<210> 36

<211> 10

<212> PRT

<213> Hepatitis delta virus

<400> 36

Arg Lys Leu Lys Lys Lys Ile Lys Lys Leu

1 5 10

<210> 37

<211> 10

<212> PRT

<213> Mus musculus

<400> 37

Arg Glu Lys Lys Lys Phe Leu Lys Arg Arg

1 5 10

<210> 38

<211> 20

<212> PRT

<213> Homo sapiens

<400> 38

Lys Arg Lys Gly Asp Glu Val Asp Gly Val Asp Glu Val Ala Lys Lys

1 5 10 15

Lys Ser Lys Lys

20

<210> 39

<211> 17

<212> PRT

<213> Homo sapiens

<400> 39

Arg Lys Cys Leu Gln Ala Gly Met Asn Leu Glu Ala Arg Lys Thr Lys

1 5 10 15

Lys

<210> 40

<211> 12

<212> PRT

<213> Artificial Sequence

<220>

<221> PEPTIDE

<223> /注释=“人工序列的描述：合成肽”

<400> 40

Gly Gly Gly Ser Gly Gly Gly Ser Gly Gly Gly Ser

1 5 10

<210> 41

<211> 7

<212> PRT

<213> Artificial Sequence

<220>

<221> PEPTIDE

<223> /注释=“人工序列的描述：合成肽”

<400> 41

Ala Glu Ala Ala Ala Lys Ala

1 5

<210> 42

<211> 5

<212> PRT

<213> Artificial Sequence

<220>

<221> PEPTIDE

<223> /注释=“人工序列的描述：合成肽”

<400> 42

Gly Gly Gly Gly Ser

1 5

<210> 43

<211> 10

<212> PRT

<213> Artificial Sequence

<220>

<221> PEPTIDE

<223> /注释=“人工序列的描述：合成肽”

<400> 43

Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser

1 5 10

<210> 44

<211> 20

<212> PRT

<213> Artificial Sequence

<220>

<221> PEPTIDE

<223> /注释=“人工序列的描述：合成肽”

<400> 44

Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly

1 5 10 15

Gly Gly Gly Ser

20

<210> 45

<211> 25

<212> PRT

<213> Artificial Sequence

<220>

<221> PEPTIDE

<223> /注释=“人工序列的描述：合成肽”

<400> 45

Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly

1 5 10 15

Gly Gly Gly Ser Gly Gly Gly Gly Ser

20 25

<210> 46

<211> 35

<212> PRT

<213> Artificial Sequence

<220>

<221> PEPTIDE

<223> /注释=“人工序列的描述：合成多肽"

<400> 46

Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly

1 5 10 15

Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly

20 25 30

Gly Gly Ser

35

<210> 47

<211> 40

<212> PRT

<213> Artificial Sequence

<220>

<221> PEPTIDE

<223> /注释=“人工序列的描述：合成多肽"

<400> 47

Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly

1 5 10 15

Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly

20 25 30

Gly Gly Ser Gly Gly Gly Gly Ser

35 40

<210> 48

<211> 50

<212> PRT

<213> Artificial Sequence

<220>

<221> PEPTIDE

<223> /注释=“人工序列的描述：合成多肽"

<400> 48

Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly

1 5 10 15

Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly

20 25 30

Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly

35 40 45

Gly Ser

50

<210> 49

<211> 55

<212> PRT

<213> Artificial Sequence

<220>

<221> PEPTIDE

<223> /注释=“人工序列的描述：合成多肽"

<400> 49

Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly

1 5 10 15

Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly

20 25 30

Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly Gly Ser Gly Gly Gly

35 40 45

Gly Ser Gly Gly Gly Gly Ser

50 55

<210> 50

<211> 12

<212> PRT

<213> Artificial Sequence

<220>

<221> PEPTIDE

<223> /注释=“人工序列的描述：合成肽”

<220>

<221> MOD_RES

<222> (2)..(2)

<223> Ahx

<220>

<221> MOD_RES

<222> (5)..(5)

<223> Ahx

<220>

<221> MOD_RES

<222> (8)..(8)

<223> Ahx

<220>

<221> MOD_RES

<222> (11)..(11)

<223> Ahx

<220>

<221> UNSURE

<222> (2)..(2)

<223> The 'Xaa' at location 2 stands for Gln, Arg, Pro, or Leu.

<220>

<221> UNSURE

<222> (5)..(5)

<223> The 'Xaa' at location 5 stands for Gln, Arg, Pro, or Leu.

<220>

<221> UNSURE

<222> (8)..(8)

<223> The 'Xaa' at location 8 stands for Gln, Arg, Pro, or Leu.

<220>

<221> UNSURE

<222> (11)..(11)

<223> The 'Xaa' at location 11 stands for Gln, Arg, Pro, or Leu.

<400> 50

Arg Xaa Arg Arg Xaa Arg Arg Xaa Arg Arg Xaa Arg

1 5 10

<210> 51

<211> 20

<212> DNA

<213> Homo sapiens

<400> 51

gagtccgagc agaagaagaa 20

<210> 52

<211> 20

<212> DNA

<213> Homo sapiens

<400> 52

gagtcctagc aggagaagaa 20

<210> 53

<211> 20

<212> DNA

<213> Homo sapiens

<400> 53

gagtctaagc agaagaagaa 20

<210> 54

<211> 12

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 54

guuuuagagc ua 12

<210> 55

<211> 9

<212> PRT

<213> Unknown

<220>

<221> PEPTIDE

<223> /注释=“对未知的描述： LAGLIDADG家族基序肽"

<400> 55

Leu Ala Gly Leu Ile Asp Ala Asp Gly

1 5

<210> 56

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 56

gagtccgagc agaagaagaa ggg 23

<210> 57

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 57

gagtctaagc agaagaagaa gag 23

<210> 58

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 58

gagttagagc agaagaagaa agg 23

<210> 59

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 59

gggtgggggg agtttgctcc tgg 23

<210> 60

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 60

gggagggtgg agtttgctcc tgg 23

<210> 61

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 61

cgggggaggg agtttgctcc tgg 23

<210> 62

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 62

ggtgagtgag tgtgtgcgtg tgg 23

<210> 63

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 63

ggtgagtgag tgtgtgtgtg agg 23

<210> 64

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 64

agtgagtgag tgtgtgtgtg ggg 23

<210> 65

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 65

gctgagtgag tgtatgcgtg tgg 23

<210> 66

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 66

gttgagtgaa tgtgtgcgtg agg 23

<210> 67

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 67

tgtgggtgag tgtgtgcgtg agg 23

<210> 68

<211> 27

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 68

ggcctcccca aagcctggcc agggagt 27

<210> 69

<211> 27

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 69

gacctcccca tagcctggcc agggagg 27

<210> 70

<211> 27

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 70

ggcctgccca aggcctgacc aagggaa 27

<210> 71

<211> 26

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 71

ggcctcccaa agccaggcca ggggga 26

<210> 72

<211> 32

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 72

atggtctcac cggtgccacc atggactata ag 32

<210> 73

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 73

atggtctcag gcgaacagcc gcgagagaat gaagcggat 39

<210> 74

<211> 38

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 74

atggtctcag gcgatgaagc ggatcgaaga gggcatca 38

<210> 75

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 75

atggtctcag gcgaacgaga agctgtacct gtactacctg 40

<210> 76

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 76

atggtctcag gcgctgtacc tgtactacct gcagaatgg 39

<210> 77

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 77

atggtctcag ccctgtccga ctacgatgtg gaccatatc 39

<210> 78

<211> 42

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 78

atggtctcag ccgacgactc catcgacaac aaggtgctga cc 42

<210> 79

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 79

atggtctcag cagtgctgac cagaagcgac aagaaccggg 40

<210> 80

<211> 36

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 80

atggtctcac gcaagcgaca agaaccgggg caagag 36

<210> 81

<211> 34

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 81

atggtctcac gcgaaccggg gcaagagcga caac 34

<210> 82

<211> 34

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 82

atggtctcac gcgagcgaca acgtgccctc cgaa 34

<210> 83

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 83

atggtctcag cgctggtgtc cgatttccgg aaggatttc 39

<210> 84

<211> 48

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 84

atggtctcag cggatttcca gttttacaaa gtgcgcgaga tcaacaac 48

<210> 85

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 85

atggtctcac gcagtgcgcg agatcaacaa ctaccacca 39

<210> 86

<211> 38

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 86

atggtctcat ggccgagatc aacaactacc accacgcc 38

<210> 87

<211> 31

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 87

atggtctcac gcccacgccc acgacgccta c 31

<210> 88

<211> 33

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 88

atggtctcac gccgcccacg acgcctacct gaa 33

<210> 89

<211> 37

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 89

atggtctcag cggtgtacga cgtgcggaag atgatcg 37

<210> 90

<211> 35

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 90

atggtctcac gcgaccgaga ttaccctggc caacg 35

<210> 91

<211> 35

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 91

atggtctcag cgcggcctct gatcgagaca aacgg 35

<210> 92

<211> 35

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 92

atggtctcag gcgcctctga tcgagacaaa cggcg 35

<210> 93

<211> 36

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 93

atggtctcag cgctggaaag cgagttcgtg tacggc 36

<210> 94

<211> 36

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 94

atggtctcac gcctatgaga agctgaaggg ctcccc 36

<210> 95

<211> 31

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 95

atggtctcag gcgctgaagg gctcccccga g 31

<210> 96

<211> 37

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 96

atggtctcac gcagtgctgt ccgcctacaa caagcac 37

<210> 97

<211> 35

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 97

atggtctcac gcgcaccggg ataagcccat cagag 35

<210> 98

<211> 36

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 98

atggtctcaa ggcccgggat aagcccatca gagagc 36

<210> 99

<211> 36

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 99

atggtctcag cggataagcc catcagagag caggcc 36

<210> 100

<211> 33

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 100

atggtctcag cgcccatcag agagcaggcc gag 33

<210> 101

<211> 38

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 101

atggtctcac gcagagcagg ccgagaatat catccacc 38

<210> 102

<211> 38

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 102

atggtctcac gccctgttta ccctgaccaa tctgggag 38

<210> 103

<211> 37

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 103

atggtctcac gcgtactttg acaccaccat cgaccgg 37

<210> 104

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 104

atggtctcac gccgagtcta tcctgcccaa gaggaacag 39

<210> 105

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 105

atggtctcaa gcctctatcc tgcccaagag gaacagcga 39

<210> 106

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 106

atggtctcag gccatcctgc ccaagaggaa cagcgataa 39

<210> 107

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 107

atggtctcac gagtctatcc tgcccaagag gaacagcga 39

<210> 108

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 108

atggtctcaa tctatcctgc ccaagaggaa cagcgataa 39

<210> 109

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 109

atggtctcag atcctgccca agaggaacag cgataagct 39

<210> 110

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 110

atggtctcaa ggcatcctgc ccaagaggaa cagcgataa 39

<210> 111

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 111

atggtctcac ggcatcctgc ccaagaggaa cagcgataa 39

<210> 112

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 112

atggtctcac gccgagagaa tgaagcggat cgaagaggg 39

<210> 113

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 113

atggtctcag gcccggatcg aagagggcat caaagagct 39

<210> 114

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 114

atggtctcag gccatcgaag agggcatcaa agagctggg 39

<210> 115

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 115

atggtctcac gccgagctgg gcagccagat cctgaaaga 39

<210> 116

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 116

atggtctcag gccgaacacc ccgtggaaaa cacccagct 39

<210> 117

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 117

atggtctcac gccctgatta cccagagaaa gttcgacaa 39

<210> 118

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 118

atggtctcag gccaacagcg ataagctgat cgccagaaa 39

<210> 119

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 119

atggtctcat gccctgatcg ccagaaagaa ggactggga 39

<210> 120

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 120

atggtctcat gcctactccc tgttcgagct ggaaaacgg 39

<210> 121

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 121

atggtctcac gccctgaaga gaaccgccag aagaagata 39

<210> 122

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 122

atggtctcac gccttccggg gccacttcct gatcgaggg 39

<210> 123

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 123

atggtctcac gccggccact tcctgatcga gggcgacct 39

<210> 124

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 124

atggtctcag gccaccttcg acaacggcag catccccca 39

<210> 125

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 125

atggtctcac gccctgggag agctgcacgc cattctgcg 39

<210> 126

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 126

atggtctcac gccatcccct actacgtggg ccctctggc 39

<210> 127

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 127

atggtctcaa gcctacccta agctggaaag cgagttcgt 39

<210> 128

<211> 38

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 128

atggtctcaa attcttactt tttctttttt gcctggcc 38

<210> 129

<211> 34

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 129

atggtctcac gcctgtccct tctgggtggt ctgg 34

<210> 130

<211> 35

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 130

atggtctcac gcctcgcggc tgttcttctg tccct 35

<210> 131

<211> 34

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 131

atggtctcac gccagctggg tgttttccac gggg 34

<210> 132

<211> 38

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 132

atggtctcac gcctcgttct gcagctgggt gttttcca 38

<210> 133

<211> 37

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 133

atggtctcag ggcgttgatg tccagttcct ggtccac 37

<210> 134

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 134

atggtctcac ggccagaaag ctctgaggca cgatatggtc cac 43

<210> 135

<211> 46

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 135

atggtctcac tgcgttgtcg atggagtcgt ccttcagaaa gctctg 46

<210> 136

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 136

atggtctcat gcggtcagca ccttgttgtc gatggagtc 39

<210> 137

<211> 37

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 137

atggtctcac gcgtcgcttc tggtcagcac cttgttg 37

<210> 138

<211> 34

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 138

atggtctcac gcgccccggt tcttgtcgct tctg 34

<210> 139

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 139

atggtctcag cgcggacttc agggtgatca ctttcacttc 40

<210> 140

<211> 35

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 140

atggtctcac cgcccggaaa tcggacacca gcttg 35

<210> 141

<211> 45

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 141

atggtctcat gcgtaaaact ggaaatcctt ccggaaatcg gacac 45

<210> 142

<211> 46

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 142

atggtctcag ccactttgta aaactggaaa tccttccgga aatcgg 46

<210> 143

<211> 45

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 143

atggtctcag gcgtagttgt tgatctcgcg cactttgtaa aactg 45

<210> 144

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 144

atggtctcag gcgtggtagt tgttgatctc gcgcactttg 40

<210> 145

<211> 35

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 145

atggtctcac cgcgtagtcg ccgtacacga actcg 35

<210> 146

<211> 50

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 146

atggtctcac gcgaaaaagt tcatgatgtt gctgtagaag aagtacttgg 50

<210> 147

<211> 31

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 147

atggtctcag cgcccggatc tcgccgttgg c 31

<210> 148

<211> 33

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 148

atggtctcac gccttccgga tctcgccgtt ggc 33

<210> 149

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 149

atggtctcag cgcagggtac tttttgatca gggcggttc 39

<210> 150

<211> 36

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 150

atggtctcag gcgctggcca ggtacaggaa gttcac 36

<210> 151

<211> 36

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 151

atggtctcac gcctcatagt ggctggccag gtacag 36

<210> 152

<211> 37

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 152

atggtctcat gcgtccagat tagcgtcggc caggatc 37

<210> 153

<211> 37

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 153

atggtctcac gcgttgtagg cggacagcac tttgtcc 37

<210> 154

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 154

atggtctcag ccttgttgta ggcggacagc actttgtcc 39

<210> 155

<211> 35

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 155

atggtctcac cgcgtgcttg ttgtaggcgg acagc 35

<210> 156

<211> 35

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 156

atggtctcag cgcatcccgg tgcttgttgt aggcg 35

<210> 157

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 157

atggtctcat gcgatgggct tatcccggtg cttgttgtag 40

<210> 158

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 158

atggtctcag gcgatgatat tctcggcctg ctctctgatg 40

<210> 159

<211> 30

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 159

atggtctcac gcgaaggcgg caggggctcc 30

<210> 160

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 160

atggtctcag gcgctgaagc cgcctgtctg cacctcggt 39

<210> 161

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 161

atggtctcag gctttgctga agccgcctgt ctgcacctc 39

<210> 162

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 162

atggtctcag gcctctttgc tgaagccgcc tgtctgcac 39

<210> 163

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 163

atggtctcac tcgctgaagc cgcctgtctg cacctcggt 39

<210> 164

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 164

atggtctcaa gatttgctga agccgcctgt ctgcacctc 39

<210> 165

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 165

atggtctcag atctctttgc tgaagccgcc tgtctgcac 39

<210> 166

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 166

atggtctcag cctttgctga agccgcctgt ctgcacctc 39

<210> 167

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 167

atggtctcag ccgccgctga agccgcctgt ctgcacctc 39

<210> 168

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 168

atggtctcag gcgctgttct tctgtccctt ctgggtggt 39

<210> 169

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 169

atggtctcag gccattctct cgcggctgtt cttctgtcc 39

<210> 170

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 170

atggtctcag gccttcattc tctcgcggct gttcttctg 39

<210> 171

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 171

atggtctcag gcgatgccct cttcgatccg cttcattct 39

<210> 172

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 172

atggtctcag gccaggatct ggctgcccag ctctttgat 39

<210> 173

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 173

atggtctcag gcggcgttca gcagctgccg ccagtagtt 39

<210> 174

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 174

atggtctcag gccttgggca ggatagactc tttgctgaa 39

<210> 175

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 175

atggtctcag gcatcgctgt tcctcttggg caggataga 39

<210> 176

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 176

atggtctcag gcaggcagct tgatgatcag gtccttttt 39

<210> 177

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 177

atggtctcag gcggtggcct cggctgtttc gccgctgtc 39

<210> 178

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 178

atggtctcag gcgatcatgt gggccagggc cagatagat 39

<210> 179

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 179

atggtctcag gcgaacttga tcatgtgggc cagggccag 39

<210> 180

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 180

atggtctcag gcctgcttcc gcagcaggtc ctctctgtt 39

<210> 181

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 181

atggtctcag gcgatctggt gggggatgct gccgttgtc 39

<210> 182

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 182

atggtctcag gcgaaggtca ggatcttctc gatcttttc 39

<210> 183

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 183

atggtctcag gctttgatca gggcggttcc cacgacggc 39

<210> 184

<211> 28

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 184

atgaagacta ccggtgccac catggccc 28

<210> 185

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 185

atgaagacta gcgtacctga tcgagaagat caagctgca 39

<210> 186

<211> 36

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 186

atgaagacta gcgatcaagc tgcacgacat gcagga 36

<210> 187

<211> 34

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 187

atgaagacta gcgctgcacg acatgcagga aggc 34

<210> 188

<211> 37

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 188

atgaagacta gccatcatcc ccagaagcgt gtccttc 37

<210> 189

<211> 37

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 189

atgaagacta gcaagcgtgt ccttcgacaa cagcttc 37

<210> 190

<211> 38

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 190

atgaagacta gcggtgctcg tgaagcagga agaaaaca 38

<210> 191

<211> 42

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 191

atgaagacta gcgaagtgga agtttaagaa agagcggaac aa 42

<210> 192

<211> 37

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 192

atgaagacta gcagagcgga acaaggggta caagcac 37

<210> 193

<211> 36

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 193

atgaagacta gcgaacaagg ggtacaagca ccacgc 36

<210> 194

<211> 32

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 194

atgaagacta gcccacgccg aggacgccct ga 32

<210> 195

<211> 37

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 195

atgaagacta gcagagatct tcatcacccc ccaccag 37

<210> 196

<211> 33

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 196

atgaagacta gccaaccggc agaccaacga gcg 33

<210> 197

<211> 35

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 197

atgaagacta gcaaagacca acgagcggat cgagg 35

<210> 198

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 198

atgaagacta gcgttctccg tgcagaaaga cttcatcaac 40

<210> 199

<211> 34

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 199

atgaagacta gcccgcctga tgaacctgct gcgg 34

<210> 200

<211> 42

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 200

atgaagacta aattcttaag cgtaatctgg aacatcgtat gg 42

<210> 201

<211> 34

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 201

atgaagacta acgcggcgtt ctctttgccg gtgg 34

<210> 202

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 202

atgaagacta tcgcctcgat caggtacttg gcgttctctt 40

<210> 203

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 203

atgaagacta gcgcgatctt ctcgatcagg tacttggcgt 40

<210> 204

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 204

atgaagacta tggcgtccac ctcatagttg aaggggttgt 40

<210> 205

<211> 38

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 205

atgaagacta ttgcggggat gatgtggtcc acctcata 38

<210> 206

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 206

atgaagacta ccgcgttgtt gaagctgttg tcgaaggaca 40

<210> 207

<211> 35

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 207

atgaagacta tcgcccgcag aaagctggtg aagcc 35

<210> 208

<211> 37

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 208

atgaagacta ctgccttaaa cttccacttc cgccgca 37

<210> 209

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 209

atgaagacta tcgcctcttt cttaaacttc cacttccgcc 40

<210> 210

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 210

atgaagacta gggccttgta ccccttgttc cgctctttc 39

<210> 211

<211> 39

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 211

atgaagacta ctgcgtactc ctgctcggtt tcgatctcg 39

<210> 212

<211> 41

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 212

atgaagacta tggccttctg catctcgttg atcattttct g 41

<210> 213

<211> 37

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 213

atgaagacta ttgcgttccg cttctgcatc tcgttga 37

<210> 214

<211> 37

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 214

atgaagacta acgcgttgat gtcccgttct tccagca 37

<210> 215

<211> 37

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 215

atgaagacta gggcggtggc gtatctggta tccacca 37

<210> 216

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (21)..(21)

<223> n is a, c, g, t or u

<400> 216

ggtgagtgag tgtgtgcgtg ngg 23

<210> 217

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (21)..(21)

<223> n is a, c, g, t or u

<400> 217

ggtgagtgag tgtgtgtgtg ngg 23

<210> 218

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (21)..(21)

<223> n is a, c, g, t or u

<400> 218

gctgagtgag tgtatgcgtg ngg 23

<210> 219

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (21)..(21)

<223> n is a, c, g, t or u

<400> 219

ggtgagtgag tgcgtgcggg ngg 23

<210> 220

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (21)..(21)

<223> n is a, c, g, t or u

<400> 220

tgtgggtgag tgtgtgcgtg ngg 23

<210> 221

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (21)..(21)

<223> n is a, c, g, t or u

<400> 221

agtgaatgag tgtgtgtgtg ngg 23

<210> 222

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (21)..(21)

<223> n is a, c, g, t or u

<400> 222

tgtgagtaag tgtgtgtgtg ngg 23

<210> 223

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (21)..(21)

<223> n is a, c, g, t or u

<400> 223

actgtgtgag tgtgtgcgtg ngg 23

<210> 224

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (21)..(21)

<223> n is a, c, g, t or u

<400> 224

agcgagtggg tgtgtgcgtg ngg 23

<210> 225

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (21)..(21)

<223> n is a, c, g, t or u

<400> 225

agtgtgtgag tgtgtgcgtg ngg 23

<210> 226

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (21)..(21)

<223> n is a, c, g, t or u

<400> 226

tgtgggtgag tgtgtgcgtg nga 23

<210> 227

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (21)..(21)

<223> n is a, c, g, t or u

<400> 227

agcgagtgag tgtgtgtgtg ngg 23

<210> 228

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (21)..(21)

<223> n is a, c, g, t or u

<400> 228

gtagagtgag tgtgtgtgtg ngg 23

<210> 229

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (21)..(21)

<223> n is a, c, g, t or u

<400> 229

tgagtgtgag tgtgtgcgtg ngg 23

<210> 230

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (21)..(21)

<223> n is a, c, g, t or u

<400> 230

agagagtgag tgtgtgcatg ngg 23

<210> 231

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (21)..(21)

<223> n is a, c, g, t or u

<400> 231

gttgagtgaa tgtgtgcgtg ngg 23

<210> 232

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (21)..(21)

<223> n is a, c, g, t or u

<400> 232

cgtgagtgag tgtgtacctg ngg 23

<210> 233

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (21)..(21)

<223> n is a, c, g, t or u

<400> 233

gggtgggggg agtttgctcc ngg 23

<210> 234

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (21)..(21)

<223> n is a, c, g, t or u

<400> 234

gggagggtgg agtttgctcc ngg 23

<210> 235

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (21)..(21)

<223> n is a, c, g, t or u

<400> 235

cgggggaggg agtttgctcc ngg 23

<210> 236

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (21)..(21)

<223> n is a, c, g, t or u

<400> 236

tagtggaggg agcttgctcc ngg 23

<210> 237

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (21)..(21)

<223> n is a, c, g, t or u

<400> 237

gcgtgggggg tgtttgctcc ngg 23

<210> 238

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (21)..(21)

<223> n is a, c, g, t or u

<400> 238

ttgggggggc agtttgctcc ngg 23

<210> 239

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (21)..(21)

<223> n is a, c, g, t or u

<400> 239

gagtccgagc agaagaagaa ngg 23

<210> 240

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (21)..(21)

<223> n is a, c, g, t or u

<400> 240

gagttagagc agaagaagaa ngg 23

<210> 241

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (21)..(21)

<223> n is a, c, g, t or u

<400> 241

gagtctaagc agaagaagaa nag 23

<210> 242

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (21)..(21)

<223> n is a, c, g, t or u

<400> 242

gaggccgagc agaaaaagga ngg 23

<210> 243

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (21)..(21)

<223> n is a, c, g, t or u

<400> 243

aagtctgagc acaagaagaa ngg 23

<210> 244

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (21)..(21)

<223> n is a, c, g, t or u

<400> 244

gagtcctagc aggagaagaa nag 23

<210> 245

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (21)..(21)

<223> n is a, c, g, t or u

<400> 245

acgtctgagc agaagaagaa ngg 23

<210> 246

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (21)..(21)

<223> n is a, c, g, t or u

<400> 246

gtcacctcca atgactaggg ngg 23

<210> 247

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (21)..(21)

<223> n is a, c, g, t or u

<400> 247

gggcaaccac aaacccacga ngg 23

<210> 248

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (21)..(21)

<223> n is a, c, g, t or u

<400> 248

gcttgtccct ctgtcaatgg ngg 23

<210> 249

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (21)..(21)

<223> n is a, c, g, t or u

<400> 249

gcgccaccgg ttgatgtgat ngg 23

<210> 250

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (21)..(21)

<223> n is a, c, g, t or u

<400> 250

gacatcgatg tcctccccat ngg 23

<210> 251

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (21)..(21)

<223> n is a, c, g, t or u

<400> 251

gcctccccaa agcctggcca ngg 23

<210> 252

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (21)..(21)

<223> n is a, c, g, t or u

<400> 252

gccccgggct tcaagccctg ngg 23

<210> 253

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (21)..(21)

<223> n is a, c, g, t or u

<400> 253

ggcagagtgc tgcttgctgc ngg 23

<210> 254

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (21)..(21)

<223> n is a, c, g, t or u

<400> 254

gctaaagagg gaatgggctt ngg 23

<210> 255

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (21)..(21)

<223> n is a, c, g, t or u

<400> 255

gtttgggagg tcagaaatag ngg 23

<210> 256

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (21)..(21)

<223> n is a, c, g, t or u

<400> 256

gttggagcgg ggagaaggcc ngg 23

<210> 257

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (21)..(21)

<223> n is a, c, g, t or u

<400> 257

gaggctgggg tggaggtgtt ngg 23

<210> 258

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (21)..(21)

<223> n is a, c, g, t or u

<400> 258

gtgggtgagt gagtgcgtgc ngg 23

<210> 259

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (21)..(21)

<223> n is a, c, g, t or u

<400> 259

gattcctggt gccagaaaca ngg 23

<210> 260

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (21)..(21)

<223> n is a, c, g, t or u

<400> 260

gggcagtttg ctcctggcac ngg 23

<210> 261

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (21)..(21)

<223> n is a, c, g, t or u

<400> 261

ggagagaggc tcccatcacg ngg 23

<210> 262

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (21)..(21)

<223> n is a, c, g, t or u

<400> 262

gagaagagaa gtggggtggg ngg 23

<210> 263

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (21)..(21)

<223> n is a, c, g, t or u

<400> 263

gtgtgtgtgt gagggtgtaa ngg 23

<210> 264

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (21)..(21)

<223> n is a, c, g, t or u

<400> 264

ggtgagtgag tgtgtgtgtg ngg 23

<210> 265

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (21)..(21)

<223> a, c, t, g, 未知或其他

<220>

<221> misc_feature

<222> (21)..(21)

<223> n is a, c, g, t or u

<400> 265

gaagaatgga cagaactctg ngg 23

<210> 266

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 266

ccatctcatc cctgcgtgtc tccgcgtcct tcgagagtga ggac 44

<210> 267

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 267

ccatctcatc cctgcgtgtc tccagggacc cctctgacag act 43

<210> 268

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 268

ccatctcatc cctgcgtgtc tccgcccatt tctcctttga ggt 43

<210> 269

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 269

ccatctcatc cctgcgtgtc tcccctccca caggaatttg aag 43

<210> 270

<211> 45

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 270

ccatctcatc cctgcgtgtc tcctgtcacc acacagttac cacct 45

<210> 271

<211> 46

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 271

ccatctcatc cctgcgtgtc tccataaggg gcaagttctg ggctat 46

<210> 272

<211> 46

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 272

ccatctcatc cctgcgtgtc tcctgatgaa gctgcctttc ctaagc 46

<210> 273

<211> 42

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 273

ccatctcatc cctgcgtgtc tcctctgcca gatccttagg cg 42

<210> 274

<211> 41

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 274

ccatctcatc cctgcgtgtc tccgacgtct gggtcccgag c 41

<210> 275

<211> 45

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 275

ccatctcatc cctgcgtgtc tcctcctgtg gaacaaccag acacc 45

<210> 276

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 276

ccatctcatc cctgcgtgtc tccaagctgc tggctttcct aag 43

<210> 277

<211> 41

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 277

ccatctcatc cctgcgtgtc tccaggaccc aggtttgcac t 41

<210> 278

<211> 47

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 278

ccatctcatc cctgcgtgtc tccatgatta gaaacctgca ctcccag 47

<210> 279

<211> 42

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 279

ccatctcatc cctgcgtgtc tccgtgggca ccaggagcgt ag 42

<210> 280

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 280

ccatctcatc cctgcgtgtc tccggcctcg ggaaacttac aat 43

<210> 281

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 281

ccatctcatc cctgcgtgtc tccagtgcct tgcacaaata ggc 43

<210> 282

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 282

ccatctcatc cctgcgtgtc tccctgccat tgtgaacagt gct 43

<210> 283

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 283

ccatctcatc cctgcgtgtc tccaagcaac tccagtccca aat 43

<210> 284

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 284

ccatctcatc cctgcgtgtc tcccctgcag gtgtctcctt ttc 43

<210> 285

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 285

ccatctcatc cctgcgtgtc tccacttctt gggcagtgat gga 43

<210> 286

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 286

ccatctcatc cctgcgtgtc tcctgcaaag ctaagcagag atgc 44

<210> 287

<211> 45

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 287

ccatctcatc cctgcgtgtc tccgcagaga tgcctatgcc tacat 45

<210> 288

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 288

ccatctcatc cctgcgtgtc tccacatgcg attctgcagg gaa 43

<210> 289

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 289

ccatctcatc cctgcgtgtc tcccaaagta caaacggcag aagc 44

<210> 290

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 290

ccatctcatc cctgcgtgtc tccttctgag ggctgctacc tgt 43

<210> 291

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 291

ccatctcatc cctgcgtgtc tcccacggcc tttgcaaata gag 43

<210> 292

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 292

ccatctcatc cctgcgtgtc tcctgggaga gagacccctt ctt 43

<210> 293

<211> 46

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 293

ccatctcatc cctgcgtgtc tccgttctga cattcctcct gaggga 46

<210> 294

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 294

ccatctcatc cctgcgtgtc tccccagact cagtaaagcc tgga 44

<210> 295

<211> 46

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 295

ccatctcatc cctgcgtgtc tccggccctt cctctgtact ctatac 46

<210> 296

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 296

ccatctcatc cctgcgtgtc tccccaatgg ggaggacatc gat 43

<210> 297

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 297

ccatctcatc cctgcgtgtc tccccaatgg ggaggacatc gat 43

<210> 298

<211> 41

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 298

ccatctcatc cctgcgtgtc tccaacccac gagggcagag t 41

<210> 299

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 299

ccatctcatc cctgcgtgtc tcccaaagta caaacggcag aagc 44

<210> 300

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 300

ccatctcatc cctgcgtgtc tcccaaagta caaacggcag aagc 44

<210> 301

<211> 41

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 301

ccatctcatc cctgcgtgtc tccaacccac gagggcagag t 41

<210> 302

<211> 41

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 302

ccatctcatc cctgcgtgtc tccaacccac gagggcagag t 41

<210> 303

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 303

ccatctcatc cctgcgtgtc tccccaatgg ggaggacatc gat 43

<210> 304

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 304

ccatctcatc cctgcgtgtc tccaagcaac tccagtccca aat 43

<210> 305

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 305

ccatctcatc cctgcgtgtc tccaagcaac tccagtccca aat 43

<210> 306

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 306

ccatctcatc cctgcgtgtc tccgcgtctt cgagagtgag gac 43

<210> 307

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 307

ccatctcatc cctgcgtgtc tcccctccca caggaatttg aag 43

<210> 308

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 308

ccatctcatc cctgcgtgtc tcccctccca caggaatttg aag 43

<210> 309

<211> 48

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 309

ccatctcatc cctgcgtgtc tcctgttaaa aacacaacat cagtgcat 48

<210> 310

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 310

ccatctcatc cctgcgtgtc tccacatgcg attctgcagg gaa 43

<210> 311

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 311

ccatctcatc cctgcgtgtc tccacttctt gggcagtgat gga 43

<210> 312

<211> 41

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 312

ccatctcatc cctgcgtgtc tccaggaccc aggtttgcac t 41

<210> 313

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 313

ccatctcatc cctgcgtgtc tccagggacc cctctgacag act 43

<210> 314

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 314

ccatctcatc cctgcgtgtc tccagggacc cctctgacag act 43

<210> 315

<211> 46

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 315

ccatctcatc cctgcgtgtc tccggccctt cctctgtact ctatac 46

<210> 316

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 316

cctctctatg ggcagtcggt gatgggggag agggacacac agat 44

<210> 317

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 317

cctctctatg ggcagtcggt gatgcacacc cacaccctca taca 44

<210> 318

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 318

cctctctatg ggcagtcggt gatgagccac agaggtggag actg 44

<210> 319

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 319

cctctctatg ggcagtcggt gatggcaccc caacacctac atct 44

<210> 320

<211> 46

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 320

cctctctatg ggcagtcggt gatggggaat ctaatgtatg gcatgg 46

<210> 321

<211> 46

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 321

cctctctatg ggcagtcggt gatgtgtgac ccaaaagatt cccacc 46

<210> 322

<211> 49

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 322

cctctctatg ggcagtcggt gatgcacagg cactaacttc ttcagccta 49

<210> 323

<211> 42

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 323

cctctctatg ggcagtcggt gatgccccag caaaacgcac tg 42

<210> 324

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 324

cctctctatg ggcagtcggt gatgccacac acagcgtctt ccg 43

<210> 325

<211> 48

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 325

cctctctatg ggcagtcggt gatgtcaaag ctgtatcccc attgccta 48

<210> 326

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 326

cctctctatg ggcagtcggt gatgagcaac gagacgttaa ccc 43

<210> 327

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 327

cctctctatg ggcagtcggt gatgttctgc cactggctta gctt 44

<210> 328

<211> 49

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 328

cctctctatg ggcagtcggt gatggtaagt gaatctctgt ctgtctcat 49

<210> 329

<211> 47

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 329

cctctctatg ggcagtcggt gatgcaggag gttaaatccc tcctcca 47

<210> 330

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 330

cctctctatg ggcagtcggt gatggtttcc cccatgcttt tctt 44

<210> 331

<211> 42

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 331

cctctctatg ggcagtcggt gatggaaggg ttggtttgga ag 42

<210> 332

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 332

cctctctatg ggcagtcggt gatgaggcat gagccactga gact 44

<210> 333

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 333

cctctctatg ggcagtcggt gatgccctag tgactgccgt ctg 43

<210> 334

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 334

cctctctatg ggcagtcggt gatggccaca gtcgtgtcat cttg 44

<210> 335

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 335

cctctctatg ggcagtcggt gatgtacaag gtgagcctgg gtct 44

<210> 336

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 336

cctctctatg ggcagtcggt gatggaaaga aagccccacc ctcg 44

<210> 337

<211> 45

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 337

cctctctatg ggcagtcggt gatgcaccct cgctctttta gtctc 45

<210> 338

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 338

cctctctatg ggcagtcggt gatgtcagag ggtgctgtct gtct 44

<210> 339

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 339

cctctctatg ggcagtcggt gatggttgcc caccctagtc attg 44

<210> 340

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 340

cctctctatg ggcagtcggt gatggcccaa tcattgatgc tttt 44

<210> 341

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 341

cctctctatg ggcagtcggt gatgggcttt cacaaggatg cagt 44

<210> 342

<211> 48

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 342

cctctctatg ggcagtcggt gatgtcctgc tctcacttag actttctc 48

<210> 343

<211> 58

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 343

cctctctatg ggcagtcggt gatgatggct tacatattta ttagataaaa tgtattcc 58

<210> 344

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 344

cctctctatg ggcagtcggt gatgtggccc cagtctctct tcta 44

<210> 345

<211> 45

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 345

cctctctatg ggcagtcggt gatgtgccag tgcctcaaga atgtc 45

<210> 346

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 346

cctctctatg ggcagtcggt gatgtccagc ttgggcccac 40

<210> 347

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 347

cctctctatg ggcagtcggt gatgtccagc ttgggcccac 40

<210> 348

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 348

cctctctatg ggcagtcggt gatggaggag aaggccaagt ggtc 44

<210> 349

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 349

cctctctatg ggcagtcggt gatggttgcc caccctagtc attg 44

<210> 350

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 350

cctctctatg ggcagtcggt gatggttgcc caccctagtc attg 44

<210> 351

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 351

cctctctatg ggcagtcggt gatggaggag aaggccaagt ggtc 44

<210> 352

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 352

cctctctatg ggcagtcggt gatggaggag aaggccaagt ggtc 44

<210> 353

<211> 40

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 353

cctctctatg ggcagtcggt gatgtccagc ttgggcccac 40

<210> 354

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 354

cctctctatg ggcagtcggt gatgccctag tgactgccgt ctg 43

<210> 355

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 355

cctctctatg ggcagtcggt gatgccctag tgactgccgt ctg 43

<210> 356

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 356

cctctctatg ggcagtcggt gatgggggag agggacacac agat 44

<210> 357

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 357

cctctctatg ggcagtcggt gatggcaccc caacacctac atct 44

<210> 358

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 358

cctctctatg ggcagtcggt gatggcaccc caacacctac atct 44

<210> 359

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 359

cctctctatg ggcagtcggt gatgcgtgtt ccccagagtg actt 44

<210> 360

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 360

cctctctatg ggcagtcggt gatgtcagag ggtgctgtct gtct 44

<210> 361

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 361

cctctctatg ggcagtcggt gatgtacaag gtgagcctgg gtct 44

<210> 362

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 362

cctctctatg ggcagtcggt gatgttctgc cactggctta gctt 44

<210> 363

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 363

cctctctatg ggcagtcggt gatgcacacc cacaccctca taca 44

<210> 364

<211> 44

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 364

cctctctatg ggcagtcggt gatgcacacc cacaccctca taca 44

<210> 365

<211> 45

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成引物"

<400> 365

cctctctatg ggcagtcggt gatgtgccag tgcctcaaga atgtc 45

<210> 366

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 366

ggtgagtgag tgtgtgcgtg tgg 23

<210> 367

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 367

gctgagtgag tgtatgcgtg tgg 23

<210> 368

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 368

tgtgggtgag tgtgtgcgtg agg 23

<210> 369

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 369

agagagtgag tgtgtgcatg agg 23

<210> 370

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 370

agtgagtgag tgtgtgtgtg ggg 23

<210> 371

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 371

ggtgagtgag tgtgtgtgtg agg 23

<210> 372

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 372

ggtgagtgag tgcgtgcggg tgg 23

<210> 373

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 373

agtgtgtgag tgtgtgcgtg tgg 23

<210> 374

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 374

tgtgagtaag tgtgtgtgtg tgg 23

<210> 375

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 375

ggtgagtgtg tgtgtgcatg tgg 23

<210> 376

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 376

gttgagtgaa tgtgtgcgtg agg 23

<210> 377

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 377

gtgagtgagt gtgtgtgtgt gag 23

<210> 378

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 378

agcgagtggg tgtgtgcgtg ggg 23

<210> 379

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 379

ggtgagtgag tgtgtgcgtg tgg 23

<210> 380

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 380

gctgagtgag tgtatgcgtg tgg 23

<210> 381

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 381

tgtgggtgag tgtgtgcgtg agg 23

<210> 382

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 382

agagagtgag tgtgtgcatg agg 23

<210> 383

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 383

agtgagtgag tgtgtgtgtg ggg 23

<210> 384

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 384

ggtgagtgag tgtgtgtgtg agg 23

<210> 385

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 385

ggtgagtgag tgcgtgcggg tgg 23

<210> 386

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 386

agtgtgtgag tgtgtgcgtg tgg 23

<210> 387

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 387

tgtgagtaag tgtgtgtgtg tgg 23

<210> 388

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 388

ggtgagtgtg tgtgtgcatg tgg 23

<210> 389

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 389

gttgagtgaa tgtgtgcgtg agg 23

<210> 390

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 390

gtgagtgagt gtgtgtgtgt gag 23

<210> 391

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 391

agcgagtggg tgtgtgcgtg ggg 23

<210> 392

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 392

ggtgagtgag tgtgtgcgtg tgg 23

<210> 393

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 393

gctgagtgag tgtatgcgtg tgg 23

<210> 394

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 394

tgtgggtgag tgtgtgcgtg agg 23

<210> 395

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 395

agagagtgag tgtgtgcatg agg 23

<210> 396

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 396

agtgagtgag tgtgtgtgtg ggg 23

<210> 397

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 397

ggtgagtgag tgtgtgtgtg agg 23

<210> 398

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 398

ggtgagtgag tgcgtgcggg tgg 23

<210> 399

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 399

agtgtgtgag tgtgtgcgtg tgg 23

<210> 400

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 400

tgtgagtaag tgtgtgtgtg tgg 23

<210> 401

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 401

ggtgagtgtg tgtgtgcatg tgg 23

<210> 402

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 402

gttgagtgaa tgtgtgcgtg agg 23

<210> 403

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 403

gtgagtgagt gtgtgtgtgt gag 23

<210> 404

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 404

agcgagtggg tgtgtgcgtg ggg 23

<210> 405

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 405

gagtccgagc agaagaagaa ggg 23

<210> 406

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 406

gagttagagc agaagaagaa agg 23

<210> 407

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 407

gagtctaagc agaagaagaa gag 23

<210> 408

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 408

aagtctgagc acaagaagaa tgg 23

<210> 409

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 409

gagtcctagc aggagaagaa gag 23

<210> 410

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 410

gagtccgagc agaagaagaa ggg 23

<210> 411

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 411

gagttagagc agaagaagaa agg 23

<210> 412

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 412

gagtctaagc agaagaagaa gag 23

<210> 413

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 413

aagtctgagc acaagaagaa tgg 23

<210> 414

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 414

gagtcctagc aggagaagaa gag 23

<210> 415

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 415

gagtccgagc agaagaagaa ggg 23

<210> 416

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 416

gagttagagc agaagaagaa agg 23

<210> 417

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 417

gagtctaagc agaagaagaa gag 23

<210> 418

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 418

aagtctgagc acaagaagaa tgg 23

<210> 419

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 419

gagtcctagc aggagaagaa gag 23

<210> 420

<211> 4203

<212> DNA

<213> Staphylococcus aureus

<400> 420

atggccccaa agaagaagcg gaaggtcggt atccacggag tcccagcagc cgacaagaag 60

tacagcatcg gcctggacat cggcaccaac tctgtgggct gggccgtgat caccgacgag 120

tacaaggtgc ccagcaagaa attcaaggtg ctgggcaaca ccgaccggca cagcatcaag 180

aagaacctga tcggagccct gctgttcgac agcggcgaaa cagccgaggc cacccggctg 240

aagagaaccg ccagaagaag atacaccaga cggaagaacc ggatctgcta tctgcaagag 300

atcttcagca acgagatggc caaggtggac gacagcttct tccacagact ggaagagtcc 360

ttcctggtgg aagaggataa gaagcacgag cggcacccca tcttcggcaa catcgtggac 420

gaggtggcct accacgagaa gtaccccacc atctaccacc tgagaaagaa actggtggac 480

agcaccgaca aggccgacct gcggctgatc tatctggccc tggcccacat gatcaagttc 540

cggggccact tcctgatcga gggcgacctg aaccccgaca acagcgacgt ggacaagctg 600

ttcatccagc tggtgcagac ctacaaccag ctgttcgagg aaaaccccat caacgccagc 660

ggcgtggacg ccaaggccat cctgtctgcc agactgagca agagcagacg gctggaaaat 720

ctgatcgccc agctgcccgg cgagaagaag aatggcctgt tcggaaacct gattgccctg 780

agcctgggcc tgacccccaa cttcaagagc aacttcgacc tggccgagga tgccaaactg 840

cagctgagca aggacaccta cgacgacgac ctggacaacc tgctggccca gatcggcgac 900

cagtacgccg acctgtttct ggccgccaag aacctgtccg acgccatcct gctgagcgac 960

atcctgagag tgaacaccga gatcaccaag gcccccctga gcgcctctat gatcaagaga 1020

tacgacgagc accaccagga cctgaccctg ctgaaagctc tcgtgcggca gcagctgcct 1080

gagaagtaca aagagatttt cttcgaccag agcaagaacg gctacgccgg ctacattgac 1140

ggcggagcca gccaggaaga gttctacaag ttcatcaagc ccatcctgga aaagatggac 1200

ggcaccgagg aactgctcgt gaagctgaac agagaggacc tgctgcggaa gcagcggacc 1260

ttcgacaacg gcagcatccc ccaccagatc cacctgggag agctgcacgc cattctgcgg 1320

cggcaggaag atttttaccc attcctgaag gacaaccggg aaaagatcga gaagatcctg 1380

accttccgca tcccctacta cgtgggccct ctggccaggg gaaacagcag attcgcctgg 1440

atgaccagaa agagcgagga aaccatcacc ccctggaact tcgaggaagt ggtggacaag 1500

ggcgcttccg cccagagctt catcgagcgg atgaccaact tcgataagaa cctgcccaac 1560

gagaaggtgc tgcccaagca cagcctgctg tacgagtact tcaccgtgta taacgagctg 1620

accaaagtga aatacgtgac cgagggaatg agaaagcccg ccttcctgag cggcgagcag 1680

aaaaaggcca tcgtggacct gctgttcaag accaaccgga aagtgaccgt gaagcagctg 1740

aaagaggact acttcaagaa aatcgagtgc ttcgactccg tggaaatctc cggcgtggaa 1800

gatcggttca acgcctccct gggcacatac cacgatctgc tgaaaattat caaggacaag 1860

gacttcctgg acaatgagga aaacgaggac attctggaag atatcgtgct gaccctgaca 1920

ctgtttgagg acagagagat gatcgaggaa cggctgaaaa cctatgccca cctgttcgac 1980

gacaaagtga tgaagcagct gaagcggcgg agatacaccg gctggggcag gctgagccgg 2040

aagctgatca acggcatccg ggacaagcag tccggcaaga caatcctgga tttcctgaag 2100

tccgacggct tcgccaacag aaacttcatg cagctgatcc acgacgacag cctgaccttt 2160

aaagaggaca tccagaaagc ccaggtgtcc ggccagggcg atagcctgca cgagcacatt 2220

gccaatctgg ccggcagccc cgccattaag aagggcatcc tgcagacagt gaaggtggtg 2280

gacgagctcg tgaaagtgat gggccggcac aagcccgaga acatcgtgat cgaaatggcc 2340

agagagaacc agaccaccca gaagggacag aagaacagcc gcgagagaat gaagcggatc 2400

gaagagggca tcaaagagct gggcagccag atcctgaaag aacaccccgt ggaaaacacc 2460

cagctgcaga acgagaagct gtacctgtac tacctgcaga atgggcggga tatgtacgtg 2520

gaccaggaac tggacatcaa ccggctgtcc gactacgatg tggaccatat cgtgcctcag 2580

agctttctga aggacgactc catcgacaac aaggtgctga ccagaagcga caagaaccgg 2640

ggcaagagcg acaacgtgcc ctccgaagag gtcgtgaaga agatgaagaa ctactggcgg 2700

cagctgctga acgccaagct gattacccag agaaagttcg acaatctgac caaggccgag 2760

agaggcggcc tgagcgaact ggataaggcc ggcttcatca agagacagct ggtggaaacc 2820

cggcagatca caaagcacgt ggcacagatc ctggactccc ggatgaacac taagtacgac 2880

gagaatgaca agctgatccg ggaagtgaaa gtgatcaccc tgaagtccaa gctggtgtcc 2940

gatttccgga aggatttcca gttttacaaa gtgcgcgaga tcaacaacta ccaccacgcc 3000

cacgacgcct acctgaacgc cgtcgtggga accgccctga tcaaaaagta ccctaagctg 3060

gaaagcgagt tcgtgtacgg cgactacaag gtgtacgacg tgcggaagat gatcgccaag 3120

agcgagcagg aaatcggcaa ggctaccgcc aagtacttct tctacagcaa catcatgaac 3180

tttttcaaga ccgagattac cctggccaac ggcgagatcc ggaagcggcc tctgatcgag 3240

acaaacggcg aaaccgggga gatcgtgtgg gataagggcc gggattttgc caccgtgcgg 3300

aaagtgctga gcatgcccca agtgaatatc gtgaaaaaga ccgaggtgca gacaggcggc 3360

ttcagcaaag agtctatcct gcccaagagg aacagcgata agctgatcgc cagaaagaag 3420

gactgggacc ctaagaagta cggcggcttc gacagcccca ccgtggccta ttctgtgctg 3480

gtggtggcca aagtggaaaa gggcaagtcc aagaaactga agagtgtgaa agagctgctg 3540

gggatcacca tcatggaaag aagcagcttc gagaagaatc ccatcgactt tctggaagcc 3600

aagggctaca aagaagtgaa aaaggacctg atcatcaagc tgcctaagta ctccctgttc 3660

gagctggaaa acggccggaa gagaatgctg gcctctgccg gcgaactgca gaagggaaac 3720

gaactggccc tgccctccaa atatgtgaac ttcctgtacc tggccagcca ctatgagaag 3780

ctgaagggct cccccgagga taatgagcag aaacagctgt ttgtggaaca gcacaagcac 3840

tacctggacg agatcatcga gcagatcagc gagttctcca agagagtgat cctggccgac 3900

gctaatctgg acaaagtgct gtccgcctac aacaagcacc gggataagcc catcagagag 3960

caggccgaga atatcatcca cctgtttacc ctgaccaatc tgggagcccc tgccgccttc 4020

aagtactttg acaccaccat cgaccggaag aggtacacca gcaccaaaga ggtgctggac 4080

gccaccctga tccaccagag catcaccggc ctgtacgaga cacggatcga cctgtctcag 4140

ctgggaggcg acaaaaggcc ggcggccacg aaaaaggccg gccaggcaaa aaagaaaaag 4200

taa 4203

<210> 421

<211> 4272

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成多核苷酸”

<400> 421

atggactata aggaccacga cggagactac aaggatcatg atattgatta caaagacgat 60

gacgataaga tggccccaaa gaagaagcgg aaggtcggta tccacggagt cccagcagcc 120

gacaagaagt acagcatcgg cctggacatc ggcaccaact ctgtgggctg ggccgtgatc 180

accgacgagt acaaggtgcc cagcaagaaa ttcaaggtgc tgggcaacac cgaccggcac 240

agcatcaaga agaacctgat cggagccctg ctgttcgaca gcggcgaaac agccgaggcc 300

acccggctga agagaaccgc cagaagaaga tacaccagac ggaagaaccg gatctgctat 360

ctgcaagaga tcttcagcaa cgagatggcc aaggtggacg acagcttctt ccacagactg 420

gaagagtcct tcctggtgga agaggataag aagcacgagc ggcaccccat cttcggcaac 480

atcgtggacg aggtggccta ccacgagaag taccccacca tctaccacct gagaaagaaa 540

ctggtggaca gcaccgacaa ggccgacctg cggctgatct atctggccct ggcccacatg 600

atcaagttcc ggggccactt cctgatcgag ggcgacctga accccgacaa cagcgacgtg 660

gacaagctgt tcatccagct ggtgcagacc tacaaccagc tgttcgagga aaaccccatc 720

aacgccagcg gcgtggacgc caaggccatc ctgtctgcca gactgagcaa gagcagacgg 780

ctggaaaatc tgatcgccca gctgcccggc gagaagaaga atggcctgtt cggaaacctg 840

attgccctga gcctgggcct gacccccaac ttcaagagca acttcgacct ggccgaggat 900

gccaaactgc agctgagcaa ggacacctac gacgacgacc tggacaacct gctggcccag 960

atcggcgacc agtacgccga cctgtttctg gccgccaaga acctgtccga cgccatcctg 1020

ctgagcgaca tcctgagagt gaacaccgag atcaccaagg cccccctgag cgcctctatg 1080

atcaagagat acgacgagca ccaccaggac ctgaccctgc tgaaagctct cgtgcggcag 1140

cagctgcctg agaagtacaa agagattttc ttcgaccaga gcaagaacgg ctacgccggc 1200

tacattgacg gcggagccag ccaggaagag ttctacaagt tcatcaagcc catcctggaa 1260

aagatggacg gcaccgagga actgctcgtg aagctgaaca gagaggacct gctgcggaag 1320

cagcggacct tcgacaacgg cagcatcccc caccagatcc acctgggaga gctgcacgcc 1380

attctgcggc ggcaggaaga tttttaccca ttcctgaagg acaaccggga aaagatcgag 1440

aagatcctga ccttccgcat cccctactac gtgggccctc tggccagggg aaacagcaga 1500

ttcgcctgga tgaccagaaa gagcgaggaa accatcaccc cctggaactt cgaggaagtg 1560

gtggacaagg gcgcttccgc ccagagcttc atcgagcgga tgaccaactt cgataagaac 1620

ctgcccaacg agaaggtgct gcccaagcac agcctgctgt acgagtactt caccgtgtat 1680

aacgagctga ccaaagtgaa atacgtgacc gagggaatga gaaagcccgc cttcctgagc 1740

ggcgagcaga aaaaggccat cgtggacctg ctgttcaaga ccaaccggaa agtgaccgtg 1800

aagcagctga aagaggacta cttcaagaaa atcgagtgct tcgactccgt ggaaatctcc 1860

ggcgtggaag atcggttcaa cgcctccctg ggcacatacc acgatctgct gaaaattatc 1920

aaggacaagg acttcctgga caatgaggaa aacgaggaca ttctggaaga tatcgtgctg 1980

accctgacac tgtttgagga cagagagatg atcgaggaac ggctgaaaac ctatgcccac 2040

ctgttcgacg acaaagtgat gaagcagctg aagcggcgga gatacaccgg ctggggcagg 2100

ctgagccgga agctgatcaa cggcatccgg gacaagcagt ccggcaagac aatcctggat 2160

ttcctgaagt ccgacggctt cgccaacaga aacttcatgc agctgatcca cgacgacagc 2220

ctgaccttta aagaggacat ccagaaagcc caggtgtccg gccagggcga tagcctgcac 2280

gagcacattg ccaatctggc cggcagcccc gccattaaga agggcatcct gcagacagtg 2340

aaggtggtgg acgagctcgt gaaagtgatg ggccggcaca agcccgagaa catcgtgatc 2400

gaaatggcca gagagaacca gaccacccag aagggacaga agaacagccg cgagagaatg 2460

aagcggatcg aagagggcat caaagagctg ggcagccaga tcctgaaaga acaccccgtg 2520

gaaaacaccc agctgcagaa cgagaagctg tacctgtact acctgcagaa tgggcgggat 2580

atgtacgtgg accaggaact ggacatcaac cggctgtccg actacgatgt ggaccatatc 2640

gtgcctcaga gctttctgaa ggacgactcc atcgacaacg cggtgctgac cagaagcgac 2700

aagaaccggg gcaagagcga caacgtgccc tccgaagagg tcgtgaagaa gatgaagaac 2760

tactggcggc agctgctgaa cgccaagctg attacccaga gaaagttcga caatctgacc 2820

aaggccgaga gaggcggcct gagcgaactg gataaggccg gcttcatcaa gagacagctg 2880

gtggaaaccc ggcagatcac aaagcacgtg gcacagatcc tggactcccg gatgaacact 2940

aagtacgacg agaatgacaa gctgatccgg gaagtgaaag tgatcaccct gaagtccaag 3000

ctggtgtccg atttccggaa ggatttccag ttttacaaag tgcgcgagat caacaactac 3060

caccacgccc acgacgccta cctgaacgcc gtcgtgggaa ccgccctgat caaaaagtac 3120

cctaagctgg aaagcgagtt cgtgtacggc gactacaagg tgtacgacgt gcggaagatg 3180

atcgccaaga gcgagcagga aatcggcaag gctaccgcca agtacttctt ctacagcaac 3240

atcatgaact ttttcaagac cgagattacc ctggccaacg gcgagatccg gaagcggcct 3300

ctgatcgaga caaacggcga aaccggggag atcgtgtggg ataagggccg ggattttgcc 3360

accgtgcgga aagtgctgag catgccccaa gtgaatatcg tgaaaaagac cgaggtgcag 3420

acaggcggct tcagcaaaga gtctatcctg cccaagagga acagcgataa gctgatcgcc 3480

agaaagaagg actgggaccc taagaagtac ggcggcttcg acagccccac cgtggcctat 3540

tctgtgctgg tggtggccaa agtggaaaag ggcaagtcca agaaactgaa gagtgtgaaa 3600

gagctgctgg ggatcaccat catggaaaga agcagcttcg agaagaatcc catcgacttt 3660

ctggaagcca agggctacaa agaagtgaaa aaggacctga tcatcaagct gcctaagtac 3720

tccctgttcg agctggaaaa cggccggaag agaatgctgg cctctgccgg cgaactgcag 3780

aagggaaacg aactggccct gccctccaaa tatgtgaact tcctgtacct ggccagccac 3840

tatgagaagc tgaagggctc ccccgaggat aatgagcaga aacagctgtt tgtggaacag 3900

cacaagcact acctggacga gatcatcgag cagatcagcg agttctccaa gagagtgatc 3960

ctggccgacg ctaatctgga caaagtgctg tccgcctaca acaagcaccg ggataagccc 4020

atcagagagc aggccgagaa tatcatccac ctgtttaccc tgaccaatct gggagcccct 4080

gccgccttca agtactttga caccaccatc gaccggaaga ggtacaccag caccaaagag 4140

gtgctggacg ccaccctgat ccaccagagc atcaccggcc tgtacgagac acggatcgac 4200

ctgtctcagc tgggaggcga caaaaggccg gcggccacga aaaaggccgg ccaggcaaaa 4260

aagaaaaagt aa 4272

<210> 422

<211> 4269

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成多核苷酸”

<400> 422

atggactata aggaccacga cggagactac aaggatcatg atattgatta caaagacgat 60

gacgataaga tggccccaaa gaagaagcgg aaggtcggta tccacggagt cccagcagcc 120

gacaagaagt acagcatcgg cctggacatc ggcaccaact ctgtgggctg ggccgtgatc 180

accgacgagt acaaggtgcc cagcaagaaa ttcaaggtgc tgggcaacac cgaccggcac 240

agcatcaaga agaacctgat cggagccctg ctgttcgaca gcggcgaaac agccgaggcc 300

acccggctga agagaaccgc cagaagaaga tacaccagac ggaagaaccg gatctgctat 360

ctgcaagaga tcttcagcaa cgagatggcc aaggtggacg acagcttctt ccacagactg 420

gaagagtcct tcctggtgga agaggataag aagcacgagc ggcaccccat cttcggcaac 480

atcgtggacg aggtggccta ccacgagaag taccccacca tctaccacct gagaaagaaa 540

ctggtggaca gcaccgacaa ggccgacctg cggctgatct atctggccct ggcccacatg 600

atcaagttcc ggggccactt cctgatcgag ggcgacctga accccgacaa cagcgacgtg 660

gacaagctgt tcatccagct ggtgcagacc tacaaccagc tgttcgagga aaaccccatc 720

aacgccagcg gcgtggacgc caaggccatc ctgtctgcca gactgagcaa gagcagacgg 780

ctggaaaatc tgatcgccca gctgcccggc gagaagaaga atggcctgtt cggaaacctg 840

attgccctga gcctgggcct gacccccaac ttcaagagca acttcgacct ggccgaggat 900

gccaaactgc agctgagcaa ggacacctac gacgacgacc tggacaacct gctggcccag 960

atcggcgacc agtacgccga cctgtttctg gccgccaaga acctgtccga cgccatcctg 1020

ctgagcgaca tcctgagagt gaacaccgag atcaccaagg cccccctgag cgcctctatg 1080

atcaagagat acgacgagca ccaccaggac ctgaccctgc tgaaagctct cgtgcggcag 1140

cagctgcctg agaagtacaa agagattttc ttcgaccaga gcaagaacgg ctacgccggc 1200

tacattgacg gcggagccag ccaggaagag ttctacaagt tcatcaagcc catcctggaa 1260

aagatggacg gcaccgagga actgctcgtg aagctgaaca gagaggacct gctgcggaag 1320

cagcggacct tcgacaacgg cagcatcccc caccagatcc acctgggaga gctgcacgcc 1380

attctgcggc ggcaggaaga tttttaccca ttcctgaagg acaaccggga aaagatcgag 1440

aagatcctga ccttccgcat cccctactac gtgggccctc tggccagggg aaacagcaga 1500

ttcgcctgga tgaccagaaa gagcgaggaa accatcaccc cctggaactt cgaggaagtg 1560

gtggacaagg gcgcttccgc ccagagcttc atcgagcgga tgaccaactt cgataagaac 1620

ctgcccaacg agaaggtgct gcccaagcac agcctgctgt acgagtactt caccgtgtat 1680

aacgagctga ccaaagtgaa atacgtgacc gagggaatga gaaagcccgc cttcctgagc 1740

ggcgagcaga aaaaggccat cgtggacctg ctgttcaaga ccaaccggaa agtgaccgtg 1800

aagcagctga aagaggacta cttcaagaaa atcgagtgct tcgactccgt ggaaatctcc 1860

ggcgtggaag atcggttcaa cgcctccctg ggcacatacc acgatctgct gaaaattatc 1920

aaggacaagg acttcctgga caatgaggaa aacgaggaca ttctggaaga tatcgtgctg 1980

accctgacac tgtttgagga cagagagatg atcgaggaac ggctgaaaac ctatgcccac 2040

ctgttcgacg acaaagtgat gaagcagctg aagcggcgga gatacaccgg ctggggcagg 2100

ctgagccgga agctgatcaa cggcatccgg gacaagcagt ccggcaagac aatcctggat 2160

ttcctgaagt ccgacggctt cgccaacaga aacttcatgc agctgatcca cgacgacagc 2220

ctgaccttta aagaggacat ccagaaagcc caggtgtccg gccagggcga tagcctgcac 2280

gagcacattg ccaatctggc cggcagcccc gccattaaga agggcatcct gcagacagtg 2340

aaggtggtgg acgagctcgt gaaagtgatg ggccggcaca agcccgagaa catcgtgatc 2400

gaaatggcca gagagaacca gaccacccag aagggacaga agaacagccg cgagagaatg 2460

aagcggatcg aagagggcat caaagagctg ggcagccaga tcctgaaaga acaccccgtg 2520

gaaaacaccc agctgcagaa cgaggccctg tacctgtact acctgcagaa tgggcgggat 2580

atgtacgtgg accaggaact ggacatcaac cggctgtccg actacgatgt ggaccatatc 2640

gtgcctcaga gctttctgaa ggacgactcc atcgacaaca aggtgctgac cagaagcgac 2700

aagaaccggg gcaagagcga caacgtgccc tccgaagagg tcgtgaagaa gatgaagaac 2760

tactggcggc agctgctgaa cgccaagctg attacccaga gaaagttcga caatctgacc 2820

aaggccgaga gaggcggcct gagcgaactg gataaggccg gcttcatcaa gagacagctg 2880

gtggaaaccc ggcagatcac aaagcacgtg gcacagatcc tggactcccg gatgaacact 2940

aagtacgacg agaatgacaa gctgatccgg gaagtgaaag tgatcaccct gaagtccaag 3000

ctggtgtccg atttccggaa ggatttccag ttttacaaag tgcgcgagat caacaactac 3060

caccacgccc acgacgccta cctgaacgcc gtcgtgggaa ccgccctgat caaaaagtac 3120

cctgcgctgg aaagcgagtt cgtgtacggc gactacaagg tgtacgacgt gcggaagatg 3180

atcgccaaga gcgagcagga aatcggcaag gctaccgcca agtacttctt ctacagcaac 3240

atcatgaact ttttcaagac cgagattacc ctggccaacg gcgagatccg gaaggcgcct 3300

ctgatcgaga caaacggcga aaccggggag atcgtgtggg ataagggccg ggattttgcc 3360

accgtgcgga aagtgctgag catgccccaa gtgaatatcg tgaaaaagac cgaggtgcag 3420

acaggcggct tcagcaaaga gtctatcctg cccaagagga acagcgataa gctgatcgcc 3480

agaaagaagg actgggaccc taagaagtac ggcggcttcg acagccccac cgtggcctat 3540

tctgtgctgg tggtggccaa agtggaaaag ggcaagtcca agaaactgaa gagtgtgaaa 3600

gagctgctgg ggatcaccat catggaaaga agcagcttcg agaagaatcc catcgacttt 3660

ctggaagcca agggctacaa agaagtgaaa aaggacctga tcatcaagct gcctaagtac 3720

tccctgttcg agctggaaaa cggccggaag agaatgctgg cctctgccgg cgaactgcag 3780

aagggaaacg aactggccct gccctccaaa tatgtgaact tcctgtacct ggccagccac 3840

tatgagaagc tgaagggctc ccccgaggat aatgagcaga aacagctgtt tgtggaacag 3900

cacaagcact acctggacga gatcatcgag cagatcagcg agttctccaa gagagtgatc 3960

ctggccgacg ctaatctgga caaagtgctg tccgcctaca acaagcaccg ggataagccc 4020

atcagagagc aggccgagaa tatcatccac ctgtttaccc tgaccaatct gggagcccct 4080

gccgccttca agtactttga caccaccatc gaccggaaga ggtacaccag caccaaagag 4140

gtgctggacg ccaccctgat ccaccagagc atcaccggcc tgtacgagac acggatcgac 4200

ctgtctcagc tgggaggcga caaaaggccg gcggccacga aaaaggccgg ccaggcaaaa 4260

aagaaaaag 4269

<210> 423

<211> 4272

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成多核苷酸”

<400> 423

atggactata aggaccacga cggagactac aaggatcatg atattgatta caaagacgat 60

gacgataaga tggccccaaa gaagaagcgg aaggtcggta tccacggagt cccagcagcc 120

gacaagaagt acagcatcgg cctggacatc ggcaccaact ctgtgggctg ggccgtgatc 180

accgacgagt acaaggtgcc cagcaagaaa ttcaaggtgc tgggcaacac cgaccggcac 240

agcatcaaga agaacctgat cggagccctg ctgttcgaca gcggcgaaac agccgaggcc 300

acccggctga agagaaccgc cagaagaaga tacaccagac ggaagaaccg gatctgctat 360

ctgcaagaga tcttcagcaa cgagatggcc aaggtggacg acagcttctt ccacagactg 420

gaagagtcct tcctggtgga agaggataag aagcacgagc ggcaccccat cttcggcaac 480

atcgtggacg aggtggccta ccacgagaag taccccacca tctaccacct gagaaagaaa 540

ctggtggaca gcaccgacaa ggccgacctg cggctgatct atctggccct ggcccacatg 600

atcaagttcc ggggccactt cctgatcgag ggcgacctga accccgacaa cagcgacgtg 660

gacaagctgt tcatccagct ggtgcagacc tacaaccagc tgttcgagga aaaccccatc 720

aacgccagcg gcgtggacgc caaggccatc ctgtctgcca gactgagcaa gagcagacgg 780

ctggaaaatc tgatcgccca gctgcccggc gagaagaaga atggcctgtt cggaaacctg 840

attgccctga gcctgggcct gacccccaac ttcaagagca acttcgacct ggccgaggat 900

gccaaactgc agctgagcaa ggacacctac gacgacgacc tggacaacct gctggcccag 960

atcggcgacc agtacgccga cctgtttctg gccgccaaga acctgtccga cgccatcctg 1020

ctgagcgaca tcctgagagt gaacaccgag atcaccaagg cccccctgag cgcctctatg 1080

atcaagagat acgacgagca ccaccaggac ctgaccctgc tgaaagctct cgtgcggcag 1140

cagctgcctg agaagtacaa agagattttc ttcgaccaga gcaagaacgg ctacgccggc 1200

tacattgacg gcggagccag ccaggaagag ttctacaagt tcatcaagcc catcctggaa 1260

aagatggacg gcaccgagga actgctcgtg aagctgaaca gagaggacct gctgcggaag 1320

cagcggacct tcgacaacgg cagcatcccc caccagatcc acctgggaga gctgcacgcc 1380

attctgcggc ggcaggaaga tttttaccca ttcctgaagg acaaccggga aaagatcgag 1440

aagatcctga ccttccgcat cccctactac gtgggccctc tggccagggg aaacagcaga 1500

ttcgcctgga tgaccagaaa gagcgaggaa accatcaccc cctggaactt cgaggaagtg 1560

gtggacaagg gcgcttccgc ccagagcttc atcgagcgga tgaccaactt cgataagaac 1620

ctgcccaacg agaaggtgct gcccaagcac agcctgctgt acgagtactt caccgtgtat 1680

aacgagctga ccaaagtgaa atacgtgacc gagggaatga gaaagcccgc cttcctgagc 1740

ggcgagcaga aaaaggccat cgtggacctg ctgttcaaga ccaaccggaa agtgaccgtg 1800

aagcagctga aagaggacta cttcaagaaa atcgagtgct tcgactccgt ggaaatctcc 1860

ggcgtggaag atcggttcaa cgcctccctg ggcacatacc acgatctgct gaaaattatc 1920

aaggacaagg acttcctgga caatgaggaa aacgaggaca ttctggaaga tatcgtgctg 1980

accctgacac tgtttgagga cagagagatg atcgaggaac ggctgaaaac ctatgcccac 2040

ctgttcgacg acaaagtgat gaagcagctg aagcggcgga gatacaccgg ctggggcagg 2100

ctgagccgga agctgatcaa cggcatccgg gacaagcagt ccggcaagac aatcctggat 2160

ttcctgaagt ccgacggctt cgccaacaga aacttcatgc agctgatcca cgacgacagc 2220

ctgaccttta aagaggacat ccagaaagcc caggtgtccg gccagggcga tagcctgcac 2280

gagcacattg ccaatctggc cggcagcccc gccattaaga agggcatcct gcagacagtg 2340

aaggtggtgg acgagctcgt gaaagtgatg ggccggcaca agcccgagaa catcgtgatc 2400

gaaatggcca gagagaacca gaccacccag aagggacaga agaacagccg cgagagaatg 2460

aagcggatcg aagagggcat caaagagctg ggcagccaga tcctgaaaga acaccccgtg 2520

gaaaacaccc agctgcagaa cgagaagctg tacctgtact acctgcagaa tgggcgggat 2580

atgtacgtgg accaggaact ggacatcaac cggctgtccg actacgatgt ggaccatatc 2640

gtgcctcaga gctttctggc ggacgactcc atcgacaaca aggtgctgac cagaagcgac 2700

aagaaccggg gcaagagcga caacgtgccc tccgaagagg tcgtgaagaa gatgaagaac 2760

tactggcggc agctgctgaa cgccaagctg attacccaga gaaagttcga caatctgacc 2820

aaggccgaga gaggcggcct gagcgaactg gataaggccg gcttcatcaa gagacagctg 2880

gtggaaaccc ggcagatcac aaagcacgtg gcacagatcc tggactcccg gatgaacact 2940

aagtacgacg agaatgacaa gctgatccgg gaagtgaaag tgatcaccct gaagtccaag 3000

ctggtgtccg atttccggaa ggatttccag ttttacaaag tgcgcgagat caacaactac 3060

caccacgccc acgacgccta cctgaacgcc gtcgtgggaa ccgccctgat caaaaagtac 3120

cctgcgctgg aaagcgagtt cgtgtacggc gactacaagg tgtacgacgt gcggaagatg 3180

atcgccaaga gcgagcagga aatcggcaag gctaccgcca agtacttctt ctacagcaac 3240

atcatgaact ttttcaagac cgagattacc ctggccaacg gcgagatccg gaaggcgcct 3300

ctgatcgaga caaacggcga aaccggggag atcgtgtggg ataagggccg ggattttgcc 3360

accgtgcgga aagtgctgag catgccccaa gtgaatatcg tgaaaaagac cgaggtgcag 3420

acaggcggct tcagcaaaga gtctatcctg cccaagagga acagcgataa gctgatcgcc 3480

agaaagaagg actgggaccc taagaagtac ggcggcttcg acagccccac cgtggcctat 3540

tctgtgctgg tggtggccaa agtggaaaag ggcaagtcca agaaactgaa gagtgtgaaa 3600

gagctgctgg ggatcaccat catggaaaga agcagcttcg agaagaatcc catcgacttt 3660

ctggaagcca agggctacaa agaagtgaaa aaggacctga tcatcaagct gcctaagtac 3720

tccctgttcg agctggaaaa cggccggaag agaatgctgg cctctgccgg cgaactgcag 3780

aagggaaacg aactggccct gccctccaaa tatgtgaact tcctgtacct ggccagccac 3840

tatgagaagc tgaagggctc ccccgaggat aatgagcaga aacagctgtt tgtggaacag 3900

cacaagcact acctggacga gatcatcgag cagatcagcg agttctccaa gagagtgatc 3960

ctggccgacg ctaatctgga caaagtgctg tccgcctaca acaagcaccg ggataagccc 4020

atcagagagc aggccgagaa tatcatccac ctgtttaccc tgaccaatct gggagcccct 4080

gccgccttca agtactttga caccaccatc gaccggaaga ggtacaccag caccaaagag 4140

gtgctggacg ccaccctgat ccaccagagc atcaccggcc tgtacgagac acggatcgac 4200

ctgtctcagc tgggaggcga caaaaggccg gcggccacga aaaaggccgg ccaggcaaaa 4260

aagaaaaagt aa 4272

<210> 424

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 424

gagtccgagc agaagaagaa ggg 23

<210> 425

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 425

gtcacctcca atgactaggg tgg 23

<210> 426

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 426

gacatcgatg tcctccccat tgg 23

<210> 427

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 427

gcctccccaa agcctggcca ggg 23

<210> 428

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 428

gccccgggct tcaagccctg tgg 23

<210> 429

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 429

ggcagagtgc tgcttgctgc tgg 23

<210> 430

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 430

gattcctggt gccagaaaca ggg 23

<210> 431

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 431

ggtgagtgag tgtgtgcgtg tgg 23

<210> 432

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 432

gctaaagagg gaatgggctt tgg 23

<210> 433

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 433

gtttgggagg tcagaaatag ggg 23

<210> 434

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 434

gagtccgagc agaagaagaa ggg 23

<210> 435

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 435

gtcacctcca atgactaggg tgg 23

<210> 436

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 436

gggcaaccac aaacccacga ggg 23

<210> 437

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 437

gcttgtccct ctgtcaatgg cgg 23

<210> 438

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 438

gcgccaccgg ttgatgtgat ggg 23

<210> 439

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 439

gacatcgatg tcctccccat tgg 23

<210> 440

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 440

gcctccccaa agcctggcca ggg 23

<210> 441

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 441

gccccgggct tcaagccctg tgg 23

<210> 442

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 442

ggcagagtgc tgcttgctgc tgg 23

<210> 443

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 443

ggtgagtgag tgtgtgcgtg tgg 23

<210> 444

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 444

gctaaagagg gaatgggctt tgg 23

<210> 445

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 445

gtttgggagg tcagaaatag ggg 23

<210> 446

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 446

gttggagcgg ggagaaggcc agg 23

<210> 447

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 447

gggtgggggg agtttgctcc tgg 23

<210> 448

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 448

gtagagtgag tgtgtgtgtg tgg 23

<210> 449

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 449

gaagaatgga cagaactctg agg 23

<210> 450

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 450

gattcctggt gccagaaaca ggg 23

<210> 451

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 451

gtgggtgagt gagtgcgtgc ggg 23

<210> 452

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 452

gaggctgggg tggaggtgtt ggg 23

<210> 453

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 453

ggtgagtgag tgtgtgtgtg agg 23

<210> 454

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 454

gtgtgtgtgt gagggtgtaa ggg 23

<210> 455

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 455

gggcagtttg ctcctggcac agg 23

<210> 456

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 456

ggagagaggc tcccatcacg ggg 23

<210> 457

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 457

gagaagagaa gtggggtggg ggg 23

<210> 458

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 458

gtgtgtctgt gtgggtgagt gagtgtgtgc gtgtggggtt gag 43

<210> 459

<211> 43

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 459

ctcaacccca cacgcacaca ctcactcacc cacacagaca cac 43

<210> 460

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 460

ggugagugag ugugugcgug 20

<210> 461

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (20)..(20)

<223> a, c, u, g, 未知或其他

<220>

<221> misc_feature

<222> (20)..(20)

<223> n is a, c, g, t or u

<400> 461

ggugagugag ugugugcgun 20

<210> 462

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (19)..(19)

<223> a, c, u, g, 未知或其他

<220>

<221> misc_feature

<222> (19)..(19)

<223> n is a, c, g, t or u

<400> 462

ggugagugag ugugugcgng 20

<210> 463

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (18)..(18)

<223> a, c, u, g, 未知或其他

<220>

<221> misc_feature

<222> (18)..(18)

<223> n is a, c, g, t or u

<400> 463

ggugagugag ugugugcnug 20

<210> 464

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (17)..(17)

<223> a, c, u, g, 未知或其他

<220>

<221> misc_feature

<222> (17)..(17)

<223> n is a, c, g, t or u

<400> 464

ggugagugag ugugugngug 20

<210> 465

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (16)..(16)

<223> a, c, u, g, 未知或其他

<220>

<221> misc_feature

<222> (16)..(16)

<223> n is a, c, g, t or u

<400> 465

ggugagugag uguguncgug 20

<210> 466

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (15)..(15)

<223> a, c, u, g, 未知或其他

<220>

<221> misc_feature

<222> (15)..(15)

<223> n is a, c, g, t or u

<400> 466

ggugagugag ugugngcgug 20

<210> 467

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (14)..(14)

<223> a, c, u, g, 未知或其他

<220>

<221> misc_feature

<222> (14)..(14)

<223> n is a, c, g, t or u

<400> 467

ggugagugag ugunugcgug 20

<210> 468

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (13)..(13)

<223> a, c, u, g, 未知或其他

<220>

<221> misc_feature

<222> (13)..(13)

<223> n is a, c, g, t or u

<400> 468

ggugagugag ugngugcgug 20

<210> 469

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (12)..(12)

<223> a, c, u, g, 未知或其他

<220>

<221> misc_feature

<222> (12)..(12)

<223> n is a, c, g, t or u

<400> 469

ggugagugag unugugcgug 20

<210> 470

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (11)..(11)

<223> a, c, u, g, 未知或其他

<220>

<221> misc_feature

<222> (11)..(11)

<223> n is a, c, g, t or u

<400> 470

ggugagugag ngugugcgug 20

<210> 471

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (10)..(10)

<223> a, c, u, g, 未知或其他

<220>

<221> misc_feature

<222> (10)..(10)

<223> n is a, c, g, t or u

<400> 471

ggugagugan ugugugcgug 20

<210> 472

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (9)..(9)

<223> a, c, u, g, 未知或其他

<220>

<221> misc_feature

<222> (9)..(9)

<223> n is a, c, g, t or u

<400> 472

ggugagugng ugugugcgug 20

<210> 473

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (8)..(8)

<223> a, c, u, g, 未知或其他

<220>

<221> misc_feature

<222> (8)..(8)

<223> n is a, c, g, t or u

<400> 473

ggugagunag ugugugcgug 20

<210> 474

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (7)..(7)

<223> a, c, u, g, 未知或其他

<220>

<221> misc_feature

<222> (7)..(7)

<223> n is a, c, g, t or u

<400> 474

ggugagngag ugugugcgug 20

<210> 475

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (6)..(6)

<223> a, c, u, g, 未知或其他

<220>

<221> misc_feature

<222> (6)..(6)

<223> n is a, c, g, t or u

<400> 475

gguganugag ugugugcgug 20

<210> 476

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (5)..(5)

<223> a, c, u, g, 未知或其他

<220>

<221> misc_feature

<222> (5)..(5)

<223> n is a, c, g, t or u

<400> 476

ggugngugag ugugugcgug 20

<210> 477

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (4)..(4)

<223> a, c, u, g, 未知或其他

<220>

<221> misc_feature

<222> (4)..(4)

<223> n is a, c, g, t or u

<400> 477

ggunagugag ugugugcgug 20

<210> 478

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (3)..(3)

<223> a, c, u, g, 未知或其他

<220>

<221> misc_feature

<222> (3)..(3)

<223> n is a, c, g, t or u

<400> 478

ggngagugag ugugugcgug 20

<210> 479

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (2)..(2)

<223> a, c, u, g, 未知或其他

<220>

<221> misc_feature

<222> (2)..(2)

<223> n is a, c, g, t or u

<400> 479

gnugagugag ugugugcgug 20

<210> 480

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<220>

<221> modified_base

<222> (1)..(1)

<223> a, c, u, g, 未知或其他

<220>

<221> misc_feature

<222> (1)..(1)

<223> n is a, c, g, t or u

<400> 480

ngugagugag ugugugcgug 20

<210> 481

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 481

ggugagugag ugugugcgug 20

<210> 482

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 482

ggugagugag ugugugcgug 20

<210> 483

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 483

ggugagugag ugugugcgug 20

<210> 484

<211> 20

<212> RNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 484

ggugagugag ugugugcgug 20

<210> 485

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 485

ggtgagtgag tgtgtgcgtg 20

<210> 486

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 486

gacgagtgag tgtgtgcgtg 20

<210> 487

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 487

ggcaagtgag tgtgtgcgtg 20

<210> 488

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 488

ggtaggtgag tgtgtgcgtg 20

<210> 489

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 489

ggtggatgag tgtgtgcgtg 20

<210> 490

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 490

ggtgaacgag tgtgtgcgtg 20

<210> 491

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 491

ggtgagcaag tgtgtgcgtg 20

<210> 492

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 492

ggtgagtagg tgtgtgcgtg 20

<210> 493

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 493

ggtgagtgga tgtgtgcgtg 20

<210> 494

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 494

ggtgagtgaa cgtgtgcgtg 20

<210> 495

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 495

ggtgagtgag catgtgcgtg 20

<210> 496

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 496

ggtgagtgag tacgtgcgtg 20

<210> 497

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 497

ggtgagtgag tgcatgcgtg 20

<210> 498

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 498

ggtgagtgag tgtacgcgtg 20

<210> 499

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 499

ggtgagtgag tgtgcacgtg 20

<210> 500

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 500

ggtgagtgag tgtgtatgtg 20

<210> 501

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 501

ggtgagtgag tgtgtgtatg 20

<210> 502

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 502

ggtgagtgag tgtgtgcacg 20

<210> 503

<211> 20

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 503

ggtgagtgag tgtgtgcgca 20

<210> 504

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 504

gagtccgagc agaagaagaa ggg 23

<210> 505

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 505

gagttagagc agaagaagaa agg 23

<210> 506

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 506

gagtctaagc agaagaagaa gag 23

<210> 507

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 507

aagtctgagc acaagaagaa tgg 23

<210> 508

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 508

gagtcctagc aggagaagaa gag 23

<210> 509

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 509

ggtgagtgag tgtgtgcgtg tgg 23

<210> 510

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 510

gctgagtgag tgtatgcgtg tgg 23

<210> 511

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 511

tgtgggtgag tgtgtgcgtg agg 23

<210> 512

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 512

agagagtgag tgtgtgcatg agg 23

<210> 513

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 513

ggtgagtgag tgtgtgtgtg agg 23

<210> 514

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 514

ggtgagtgag tgcgtgcggg tgg 23

<210> 515

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 515

agtgtgtgag tgtgtgcgtg tgg 23

<210> 516

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 516

tgtgagtaag tgtgtgtgtg tgg 23

<210> 517

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 517

tgtgagtgag tgtgtgtgtg tga 23

<210> 518

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 518

agcgagtggg tgtgtgcgtg ggg 23

<210> 519

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 519

cgtgagtgag tgtgtacctg ggg 23

<210> 520

<211> 1443

<212> PRT

<213> Staphylococcus aureus

<400> 520

Ala Asp Lys Lys Tyr Ser Ile Gly Leu Asp Ile Gly Thr Asn Ser Val

1 5 10 15

Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe

20 25 30

Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile

35 40 45

Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu

50 55 60

Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys

65 70 75 80

Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser

85 90 95

Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys

100 105 110

His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr

115 120 125

His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp

130 135 140

Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His

145 150 155 160

Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro

165 170 175

Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr

180 185 190

Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala

195 200 205

Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn

210 215 220

Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn

225 230 235 240

Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe

245 250 255

Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp

260 265 270

Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp

275 280 285

Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp

290 295 300

Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser

305 310 315 320

Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys

325 330 335

Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe

340 345 350

Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser

355 360 365

Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp

370 375 380

Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg

385 390 395 400

Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu

405 410 415

Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe

420 425 430

Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile

435 440 445

Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp

450 455 460

Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu

465 470 475 480

Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr

485 490 495

Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser

500 505 510

Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys

515 520 525

Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln

530 535 540

Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr

545 550 555 560

Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp

565 570 575

Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly

580 585 590

Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp

595 600 605

Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr

610 615 620

Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala

625 630 635 640

His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr

645 650 655

Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp

660 665 670

Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe

675 680 685

Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe

690 695 700

Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu

705 710 715 720

His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly

725 730 735

Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly

740 745 750

Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln

755 760 765

Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile

770 775 780

Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro

785 790 795 800

Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu

805 810 815

Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg

820 825 830

Leu Ser Asp Tyr Asp Val Asp His Ile Val Pro Gln Ser Phe Leu Lys

835 840 845

Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg

850 855 860

Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys

865 870 875 880

Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys

885 890 895

Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp

900 905 910

Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr

915 920 925

Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp

930 935 940

Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser

945 950 955 960

Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Thr

965 970 975

Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile

980 985 990

Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln

995 1000 1005

Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu

1010 1015 1020

Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp

1025 1030 1035 1040

Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr

1045 1050 1055

His His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu

1060 1065 1070

Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr

1075 1080 1085

Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile

1090 1095 1100

Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe

1105 1110 1115 1120

Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro

1125 1130 1135

Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly

1140 1145 1150

Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn

1155 1160 1165

Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser

1170 1175 1180

Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp

1185 1190 1195 1200

Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr

1205 1210 1215

Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu

1220 1225 1230

Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser

1235 1240 1245

Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu

1250 1255 1260

Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu

1265 1270 1275 1280

Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln

1285 1290 1295

Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr

1300 1305 1310

Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu

1315 1320 1325

Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile

1330 1335 1340

Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala

1345 1350 1355 1360

Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro

1365 1370 1375

Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn

1380 1385 1390

Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg

1395 1400 1405

Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His

1410 1415 1420

Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu

1425 1430 1435 1440

Gly Gly Asp

<210> 521

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 521

gagtccgagc agaagaagaa ggg 23

<210> 522

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 522

gagttagagc agaagaagaa agg 23

<210> 523

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 523

gagtctaagc agaagaagaa gag 23

<210> 524

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 524

gagtcctagc aggagaagaa tag 23

<210> 525

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 525

gaggccgagc agaagaagaa ggg 23

<210> 526

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 526

aagtctgagc acaagaagaa cgg 23

<210> 527

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 527

acgtctgagc agaagaagaa tgg 23

<210> 528

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 528

gggtgggggg agtttgctcc tgg 23

<210> 529

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 529

gggagggtgg agtttgctcc tgg 23

<210> 530

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 530

gcgtgggggg tgtttgctcc cgg 23

<210> 531

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 531

cgggggaggg agtttgctcc tgg 23

<210> 532

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 532

tagtggaggg agcttgctcc tgg 23

<210> 533

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 533

ttgggggggc agtttgctcc tgg 23

<210> 534

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 534

ggtgagtgag tgtgtgcgtg tgg 23

<210> 535

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 535

ggtgagtgag tgtgtgtgtg agg 23

<210> 536

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 536

tgtgggtgag tgtgtgcgtg agg 23

<210> 537

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 537

gctgagtgag tgtatgcgtg tgg 23

<210> 538

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 538

ggtgagtgag tgcgtgcggg tgg 23

<210> 539

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 539

agtgtgtgag tgtgtgcgtg tgg 23

<210> 540

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 540

tgtgggtgag tgtgtgcgtg aga 23

<210> 541

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 541

agtgaatgag tgtgtgtgtg tgg 23

<210> 542

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 542

agcgagtgag tgtgtgtgtg ggg 23

<210> 543

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 543

tgtgagtaag tgtgtgtgtg tgg 23

<210> 544

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 544

agcgagtggg tgtgtgcgtg ggg 23

<210> 545

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 545

gtagagtgag tgtgtgtgtg tgg 23

<210> 546

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 546

actgtgtgag tgtgtgcgtg agg 23

<210> 547

<211> 23

<212> DNA

<213> Artificial Sequence

<220>

<221> source

<223> /注释=“人工序列的描述：合成寡核苷酸”

<400> 547

tgagtgtgag tgtgtgcgtg ggg 23

Claims

1.一种工程化的CRISPR蛋白，其中：

该蛋白与包含RNA的核酸分子复合，以形成CRISPR复合物，

其中当在该CRISPR复合物中时，该核酸分子靶向一个或多个靶多核苷酸座位

该蛋白与未修饰的蛋白相比包括至少一种修饰，

其中与包含未修饰的蛋白的复合物相比，包含经修饰的蛋白的CRISPR复合物具有改变的活性。

2.如权利要求1所述的工程化的CRISPR蛋白，其中该改变的活性包括就该包含RNA的核酸分子或这些靶多核苷酸座位而言的改变的结合特性、就该包含RNA的核酸分子或这些靶多核苷酸座位而言的改变的结合动力学、或就该包含RNA的核酸分子或这些靶多核苷酸座位而言相比于脱靶多核苷酸座位的改变的结合特异性。

3.如权利要求1或2所述的工程化的CRISPR蛋白，其中该改变的活性包括增加的靶向效率或降低的脱靶结合。

4.如权利要求1至3中任一项所述的工程化的CRISPR蛋白，其中该改变的活性包括修饰的切割活性。

5.如权利要求4所述的工程化的CRISPR蛋白，其中该修饰的切割活性包括就这些靶多核苷酸座位而言的增加的切割活性。

6.如权利要求4所述的工程化的CRISPR蛋白，其中该修饰的切割活性包括就这些靶多核苷酸座位而言的降低的切割活性。

7.如权利要求4至6中任一项所述的工程化的CRISPR蛋白，其中该修饰的切割活性包括就脱靶多核苷酸座位而言的降低的切割活性。

8.如权利要求4至6中任一项所述的工程化的CRISPR蛋白，其中该修饰的切割活性包括就脱靶多核苷酸座位而言的增加的切割活性。

9.如前述权利要求中任一项所述的工程化的CRISPR蛋白，其中该改变的活性包括改变的解旋酶动力学。

10.如前述权利要求中任一项所述的工程化的CRISPR蛋白，其中该经修饰的CRISPR蛋白包含修饰，该修饰改变该蛋白与该包含RNA的核酸分子、或这些靶多核苷酸座位的链、或脱靶多核苷酸座位的链的缔合。

11.如前述权利要求中任一项所述的工程化的CRISPR蛋白，其中该经修饰的CRISPR蛋白包含修饰，该修饰改变该CRISPR复合物的形成。

12.如前述权利要求中任一项所述的工程化的CRISPR蛋白，其中该经修饰的CRISPR蛋白包含修饰，该修饰改变该核酸分子至这些多核苷酸座位的靶向。

13.如权利要求10至12中任一项所述的工程化的CRISPR蛋白，其中该修饰包括该蛋白的与该核酸分子缔合的区域中的突变。

14.如权利要求10至12中任一项所述的工程化的CRISPR蛋白，其中该修饰包括该蛋白的与这些靶多核苷酸座位的链缔合的区域中的突变。

15.如权利要求10至12中任一项所述的工程化的CRISPR蛋白，其中该修饰包括该蛋白的与这些脱靶多核苷酸座位的链缔合的区域中的突变。

16.如权利要求10至15中任一项所述的工程化的CRISPR蛋白，其中该修饰或突变包括该蛋白的与该包含RNA的核酸分子、或这些靶多核苷酸座位的链、或脱靶多核苷酸座位的链缔合的区域中的减少的正电荷。

17.如权利要求10至15中任一项所述的工程化的CRISPR蛋白，其中该修饰或突变包括该蛋白的与该包含RNA的核酸分子、或这些靶多核苷酸座位的链、或脱靶多核苷酸座位的链缔合的区域中的减少的负电荷。

18.如权利要求10至15中任一项所述的工程化的CRISPR蛋白，其中该修饰或突变包括该蛋白的与该包含RNA的核酸分子、或这些靶多核苷酸座位的链、或脱靶多核苷酸座位的链缔合的区域中的增加的正电荷。

19.如权利要求10至15中任一项所述的工程化的CRISPR蛋白，其中该修饰或突变包括该蛋白的与该包含RNA的核酸分子、或这些靶多核苷酸座位的链、或脱靶多核苷酸座位的链缔合的区域中的增加的负电荷。

20.如权利要求10至19中任一项所述的工程化的CRISPR蛋白，其中该修饰或突变增加该蛋白与该包含RNA的核酸分子、或这些靶多核苷酸座位的链、或脱靶多核苷酸座位的链之间的位阻。

21.如权利要求10至19中任一项所述的工程化的CRISPR蛋白，其中该修饰或突变包括Lys、His、Arg、Glu、Asp、Ser、Gly、或Thr的取代。

22.如权利要求10至19中任一项所述的工程化的CRISPR蛋白，其中该修饰或突变包括用Gly、Ala、Ile、Glu、或Asp进行取代。

23.如权利要求10至19中任一项所述的工程化的CRISPR蛋白，其中该修饰或突变包括在结合沟槽中的氨基酸取代。

24.如权利要求10至19中任一项所述的工程化的CRISPR蛋白，其中该结合沟槽是在RuvC与HNH结构域之间。

25.如权利要求10至19中任一项所述的工程化的CRISPR蛋白，其中该修饰或突变包括RuvCI、RuvCIII、RuvCIII或HNH结构域中的突变。

26.如权利要求10至19中任一项所述的工程化的CRISPR蛋白，其中该修饰或突变包括在位置12、13、63、415、610、775、779、780、810、832、848、855、861、862、866、961、968、974、976、982、983、1000、1003、1014、1047、1060、1107、1108、1109、1114、1129、1240、1289、1296、1297、1300、1311、和1325中的一个或多个处的氨基酸取代，参考SpCas9的氨基酸位置编号。

27.如权利要求26所述的工程化的CRISPR蛋白，其中在位置63、415、775、779、780、810、832、848、855、861、862、866、961、968、974、976、982、983、1000、1003、1014、1047、1060、1107、1108、1109、1114、1129、1240、1289、1296、1297、1300、1311、或1325处的修饰或突变包括丙氨酸取代。

28.如权利要求26所述的工程化的CRISPR蛋白，其中在位置12处的修饰或突变包括天冬氨酸取代。

29.如权利要求26所述的工程化的CRISPR蛋白，其中在位置13处的修饰或突变包括异亮氨酸取代。

30.如权利要求26所述的工程化的CRISPR蛋白，其中在位置610处的修饰或突变包括甘氨酸取代。

31.如权利要求26所述的工程化的CRISPR蛋白，其中在位置799处的修饰或突变包括亮氨酸取代。

32.如权利要求26所述的工程化的CRISPR蛋白，其中在位置1129处的修饰或突变包括谷氨酸取代。

33.如权利要求26所述的工程化的CRISPR蛋白，其中该修饰或突变包括K775A、E779L、Q807A、R780A、K810A、R832A、K848A、K855A、K862A、K961A、K968A、K974A、R976A、H983A、K1000A、K1014A、K1047A、K1060A、K1003A、S1109A、H1240A、K1289A、K1296A、H1297A、K1300A、H1311A、或K1325A。

34.如权利要求26所述的工程化的CRISPR蛋白，其中该修饰或突变包括R783A和A1322T、或R780A和K810A、或R780A和K855A、或R780A和R976A、或K848A和R976A、或K855A和R976A、或R780A和K848A、或K810A和K848A、或K848A和K855A、或K810A和K855A、或H982A和R1060A、或H982A和R1003A、或K1003A和R1060A、或R780A和H982A、或K810A和H982A、或K848A和H982A、或K855A和H982A、或R780A和K1003A、或K810A和R1003A、或K848A和K1003A、或K848A和K1007A、或R780A和R1060A、或K810A和R1060A、或K848A和R1060A、或R780A和R1114A、或K848A和R1114A、或R63A和K855A、或R63A和H982A、或H415A和R780A、或H415A和K848A、或K848A和E1108A、或K810A和K1003A、或R780A和R1060A、或K810A和R1060A、或K848A和R1060A。

35.如权利要求26所述的工程化的CRISPR蛋白，其中该修饰或突变包括H982A、K1003A和K1129E，或R780A、K1003A和R1060A，或K810A、K1003A和R1060A，或K848A、K1003A和R1060A，或K855A、K1003A和R1060A，或H982A、K1003A和R1060A，或R63A、K848A和R1060A，或T13I、R63A和K810A，或G12D、R63A和R1060A。

36.如权利要求26所述的工程化的CRISPR蛋白，其中该修饰或突变包括R63A、E610G、K855A和R1060A，或R63A、K855A、R1060A和E610G。

37.如前述权利要求中任一项所述的工程化的CRISPR蛋白，其中该蛋白包括II型CRISPR蛋白。

38.如前述权利要求中任一项所述的工程化的CRISPR蛋白，其中该CRISPR蛋白包括来自以下属的生物的CRISPR蛋白，该属包括链球菌属、弯曲杆菌属、Nitratifractor、葡萄球菌属、细小棒菌属、罗氏菌属、奈瑟菌属、葡糖醋杆菌属、固氮螺菌属、Sphaerochaeta、乳杆菌属、真杆菌属或棒状杆菌属。

39.如前述权利要求中任一项所述的工程化的CRISPR蛋白，其中该蛋白包括Cas9蛋白。

40.如前述权利要求中任一项所述的工程化的CRISPR蛋白，其中该CRISPR蛋白包括嵌合Cas9蛋白，该嵌合Cas9蛋白包含来自第一Cas9直向同源物的第一片段和来自第二Cas9直向同源物的第二片段，并且该第一Cas9直向同源物和该第二Cas9直向同源物是不同的。

41.如权利要求40所述的工程化的CRISPR蛋白，其中该第一Cas9直向同源物和该第二Cas9直向同源物中的至少一个包括来自以下生物的Cas9，该生物包括链球菌属、弯曲杆菌属、Nitratifractor、葡萄球菌属、细小棒菌属、罗氏菌属、奈瑟菌属、葡糖醋杆菌属、固氮螺菌属、Sphaerochaeta、乳杆菌属、真杆菌属或棒状杆菌属。

42.如前述权利要求中任一项所述的工程化的CRISPR蛋白，其中该CRISPR蛋白包括一个或多个核定位信号(NLS)结构域。

43.如前述权利要求中任一项所述的工程化的CRISPR蛋白，其中该CRISPR蛋白包括至少两个或更多个NLS。

44.如前述权利要求中任一项所述的工程化的CRISPR蛋白，其中该CRISPR蛋白包括一个或多个异源功能结构域。

45.如权利要求44所述的工程化的CRISPR蛋白，其中该一个或多个异源功能结构域包括一个或多个转录激活结构域。

46.如权利要求45所述的工程化的CRISPR蛋白，其中该转录激活结构域包括VP64。

47.如权利要求44所述的工程化的CRISPR蛋白，其中该一个或多个异源功能结构域包括一个或多个转录阻遏结构域。

48.如权利要求47所述的工程化的CRISPR蛋白，其中该转录阻遏结构域包括KRAB结构域或SID结构域。

49.如权利要求44所述的工程化的CRISPR蛋白，其中该一个或多个异源功能结构域包括一个或多个核酸酶结构域。

50.如权利要求49所述的工程化的CRISPR蛋白，其中核酸酶结构域包括Fok1。

51.如权利要求44所述的工程化的CRISPR蛋白，其中该一个或多个异源功能结构域具有以下活性中的一种或多种：甲基酶活性、脱甲基酶活性、转录激活活性、转录阻遏活性、转录释放因子活性、组蛋白修饰活性、核酸酶活性、单链RNA切割活性、双链RNA切割活性、单链DNA切割活性、双链DNA切割活性以及核酸结合活性。

52.根据前述权利要求中任一项所述的工程化的CRISPR蛋白，其中该CRISPR蛋白由核苷酸序列编码，该核苷酸序列经密码子优化以便在真核生物中表达。

53.一种组合物，该组合物包括如前述权利要求中任一项所述的工程化的CRISPR蛋白。

54.一种系统，该系统包括如前述权利要求中任一项所述的工程化的CRISPR蛋白和包含RNA的核酸分子。

55.一种载体系统，该载体系统包含一种或多种载体，其中该一种或多种载体包含：

a)第一调节组件，该第一调节组件有效作地连接至对如前述权利要求中任一项所述的工程化的CRISPR蛋白进行编码的核苷酸序列；和

b)第二调节组件，该第二调节组件有效作地连接至对一种或多种核酸分子进行编码的一个或多个核苷酸序列，该一种或多种核酸分子包括指导RNA，该指导RNA包含指导序列、tracr序列、和tracr配对序列，其中组分(a)和(b)位于相同或不同载体上。

56.一种分离的真核细胞，包含如权利要求54或55所述的系统。

57.一种调节基因表达的方法，其中该方法包括向细胞中引入如前述权利要求中任一项所述的工程化的CRISPR蛋白或系统。

58.如权利要求59所述的方法，其中该细胞是真核细胞或原核细胞。

59.如权利要求59所述的方法，其中该方法是离体的或体外的。

60.一种治疗对其有需要的个体的疾病、障碍或感染的方法，该方法包括给予有效量的如前述权利要求中任一项所述的工程化的CRISPR蛋白或组合物。

61.一种改变哺乳动物细胞中的感兴趣的基因组座位的表达的方法，该方法包括

使该细胞与如权利要求1-55中任一项所述的组合物接触，并且由此递送载体并且允许形成CRISPR-Cas复合物并使该CRISPR-Cas复合物结合至靶标，并且

确定该基因组座位的表达是否已发生改变。

62.如权利要求61所述的方法，该方法包括导致基因转录降低的基因组DNA切割。

63.如权利要求61所述的方法，其中改变表达包括基因组编辑。

64.如权利要求61所述的方法，其中改变表达包括增加基因产物的表达。

65.如权利要求61所述的方法，其中改变表达包括基因产物的修饰。

66.一种来自如权利要求61-65中任一项所述的方法的具有改变的基因组座位表达的分离的细胞，其中将该改变的表达与尚未经受改变该基因组座位表达的方法的细胞进行比较。

67.一种来自如权利要求66所述的细胞的分离的细胞系。

68.一种修饰感兴趣的靶座位的方法，该方法包括向所述座位递送非天然存在的或工程化的组合物，该组合物包含如权利要求1至52中任一项所述的Cas9蛋白、和一种或多种核酸组分，其中该Cas9蛋白与该一种或多种核酸组分形成复合物，并且在该复合物与感兴趣的靶座位结合时，该Cas9蛋白诱导该感兴趣的靶座位的修饰。

69.如权利要求68所述的方法，其中该感兴趣的靶座位是在细胞内。

70.如权利要求69所述的方法，其中该细胞是真核细胞。

71.如权利要求69所述的方法，其中该细胞是动物细胞或人类细胞。

72.如权利要求69所述的方法，其中该细胞是植物细胞。

73.如权利要求68所述的方法，其中该感兴趣的靶座位被包含在体外的DNA分子中。

74.如权利要求68-73中任一项所述的方法，其中包含Cas9蛋白和一种或多种核酸组分的所述非天然存在的或工程化的组合物作为一种或多种多核苷酸分子被递送到该细胞中。

75.如权利要求68-73中任一项所述的方法，其中Cas9蛋白包括一个或多个核定位信号(NLS)。

76.如权利要求74-75中任一项所述的方法，其中该一种或多种多核苷酸分子被包含在一种或多种载体中。

77.如权利要求74-76中任一项所述的方法，其中该一种或多种多核苷酸分子包括一种或多种调节组件，该一种或多种调节组件被有效地配置成表达该Cas9蛋白和/或该一种或多种核酸组分，任选地其中该一种或多种调节组件包括诱导型启动子。

78.如权利要求74-77中任一项所述的方法，其中该一种或多种多核苷酸分子或该一种或多种载体被包含在递送系统中。

79.如权利要求74-78中任一项所述的方法，其中该系统或该一种或多种多核苷酸分子经由粒子、囊泡、或一种或多种病毒载体进行递送。

80.如权利要求79所述的方法，其中这些粒子包括脂质、糖、金属或蛋白。

81.如权利要求79所述的方法，其中这些囊泡包括外排体或脂质体。

82.如权利要求79所述的方法，其中该一种或多种病毒载体包括一种或多种腺病毒、一种或多种慢病毒或一种或多种腺相关病毒。

83.如权利要求68-79中任一项所述的方法，该方法是通过操纵感兴趣的基因组座位处的一个或多个靶序列来修饰细胞、细胞系或生物的方法。

84.一种来自如权利要求83所述的方法的细胞、或其子代，其中该细胞包括不存在于未经受该方法的细胞中的修饰。

85.如权利要求84所述的细胞、或其子代，其中所述的未经受该方法的细胞包括异常并且来自该方法的细胞的该异常得到解决或校正。

86.一种来自如权利要求84所述的细胞或其子代的细胞产物，其中该产物相对于来自未经受该方法的细胞的细胞产物在性质或数量上被修饰。

87.如权利要求86所述的细胞产物，其中所述的未经受该方法的细胞包括异常并且该细胞产物反映出已经通过该方法解决或校正该异常。

88.一种包含以下系统的体外、离体或体内宿主细胞或细胞系或其子代，该系统包括如权利要求1至52中任一项所述的Cas9蛋白、和一种或多种核酸组分，其中该Cas9蛋白与该一种或多种核酸组分形成复合物，并且在该复合物与感兴趣的靶座位结合时，该Cas9蛋白诱导该感兴趣的靶座位的修饰。

89.根据权利要求88所述的宿主细胞或细胞系或其子代，其中该细胞是真核细胞。

90.根据权利要求89所述的宿主细胞或细胞系或其子代，其中该细胞是动物细胞。

91.根据权利要求89所述的宿主细胞或细胞系或其子代，其中该细胞是人类细胞。

92.根据权利要求89所述的宿主细胞、细胞系或其子代，包括干细胞或干细胞系。

93.根据权利要求89所述的宿主细胞或细胞系或其子代，其中该细胞是植物细胞。

94.一种产生植物的方法，该植物具有由感兴趣的基因编码的经修饰的感兴趣的性状，所述方法包括使植物细胞与根据权利要求54-55中任一项所述的系统接触或使该植物细胞经受根据权利要求68-83所述的方法，由此修饰或引入所述感兴趣的基因，并且从所述植物细胞再生植物。

95.一种鉴定植物中的感兴趣的性状的方法，所述感兴趣的性状由感兴趣的基因编码，所述方法包括使植物细胞与根据权利要求54-55中任一项所述的系统接触或使该植物细胞经受根据权利要求68-83所述的方法，由此鉴定所述感兴趣的基因。

96.如权利要求95所述的方法，进一步包括将该鉴定的感兴趣的基因引入植物细胞或植物细胞系或植物种质中并且从其产生植物，由此该植物含有该感兴趣的基因。

97.如权利要求96所述的方法，其中该植物展现出该感兴趣的性状。

98.一种包含根据权利要求54-55中任一项所述的系统的粒子。

99.如权利要求98所述的粒子，其中该粒子包含与该指导RNA复合的如权利要求1-52中任一项所述的Cas9蛋白。

100.如权利要求98所述的粒子，其中该粒子包含与该指导RNA复合的eSpCas9(1.1)。

101.如权利要求1所述的复合物、包含RNA的核酸分子、或蛋白，其中该复合物、包含RNA的核酸分子或蛋白缀合至至少一个糖部分，该至少一个糖部分任选地是N-乙酰半乳糖胺(GalNAc)，特别是三分支GalNAc。

102.如权利要求68所述的复合物、核酸组分或蛋白，其中该复合物、核酸组分或蛋白缀合至至少一个糖部分，该至少一个糖部分任选地是N-乙酰半乳糖胺(GalNAc)，特别是三分支GalNAc。

103.一种通过提供根据权利要求1-36中任一项所述的具有修饰的工程化的CRISPR蛋白来改进CRISPR系统的特异性的方法。

104.工程化的CRISPR蛋白用于改进CRISPR系统的特异性的用途，其中该CRISPR蛋白是根据权利要求1-36中任一项被修饰。