CN110382692A

CN110382692A - 新型crispr酶以及系统

Info

Publication number: CN110382692A
Application number: CN201780038265.2A
Authority: CN
Inventors: F·张; B·蔡彻; L·高; I·史雷梅克; D·B·T·科克斯
Original assignee: MIT; Broad Institute Inc
Current assignee: MIT; Broad Institute Inc
Priority date: 2016-04-19
Filing date: 2017-04-19
Publication date: 2019-10-25
Also published as: US20210155911A1; AU2017253089A1; KR102670601B1; KR20240091006A; WO2017184768A1; SG11201810179RA; EP3445848A1; KR20210111370A; KR20220104837A; AU2023241391A1; AU2017253089B2; SG10202010311SA; KR102424476B1; CA3026055A1

Abstract

本发明提供了用于靶向核酸的系统、方法和组合物。特别地，本发明提供了非天然存在的或工程化的DNA靶向系统，所述系统包含新型DNA‑靶向CRISPR效应蛋白和至少一种靶向核酸组分如指导RNA。本发明的多个方面特别涉及具有改变的PAM特异性的Cpf1突变体。

Description

新型CRISPR酶以及系统

相关申请并通过引用结合

本申请要求于2016年4月19日提交的美国临时申请序列号62/324,820、2016年6月17日提交的美国临时申请序列号62/351,558、2016年7月11日提交的美国临时申请序列号62/360,765和2016年10月19日提交的美国临时申请序列号62/410,196的权益和优先权，以上文献通过引用并入本文。

参考于2016年4月19日提交的美国临时申请序列号62/324,777和62/324,834、2016年8月17日提交的美国临时申请序列号62/376,379、和2016年10月19日提交的美国临时申请序列号62/410,240，以上文献通过引用并入本文。

将前述申请及本文引用文献中引用或参考的所有文献，以及本文或在通过引用并入本文的任何文献中提到的任何产品的任何厂商说明书、描述、产品规格和产品清单均通过引用并入本文，并且可以应用于本发明的实践中。更具体地，所有参考的文献通过引用并入本文，其程度如同将每个单独的文献具体并单独地指明通过引用并入本文。

关于联邦资助研究的声明

本发明是根据由美国国立卫生研究院(National Institutes of Health)授予的MH100706和MH110049在政府支持下进行。政府享有本发明的一定的权利。

技术领域

本发明总体涉及用于控制涉及序列靶向例如基因转录物的干扰或核酸编辑的基因表达的系统、方法以及组合物，这些系统、方法以及组合物可以使用与成簇规律间隔短回文重复序列(CRISPR)及其组分相关的载体系统。

背景技术

基因组测序技术和分析方法的最新进展明显加速了对与不同范围的生物学功能和疾病相关联的遗传因子进行编目和映射的能力。精确的基因组靶向技术是通过允许个体遗传元件的选择性干扰而使得因果性遗传变异的系统性逆向工程成为可能，以及推进合成生物学、生物技术学和医疗应用所需要的。虽然基因组编辑技术例如设计师的锌指、转录激活因子样效应物(TALE)或归巢大范围核酸酶(homing meganuclease)可以用于产生靶向基因组干扰，但是仍然需要采用新策略和分子机制并且负担的起的、易于建立的、可扩展的且便于靶向真核基因组内的多个位置的新基因组工程技术。这将为基因组工程和生物技术的新应用提供主要资源。

细菌和古细菌的适应性免疫的CRISPR-Cas系统显示出蛋白质组成和基因组座位体系结构的极端多样性。CRISPR-Cas系统座位具有超过50种的基因家族并且不存在严格的通用基因，这表明了座位体系结构的快速进化和极端多样性。到目前为止，采用了多分支方法，针对93种Cas蛋白进行了约395种表达谱的全面cas基因鉴定。分类包括特征基因表达谱加上座位体系结构的特征。提出了一种新的CRISPR-Cas系统分类，其中这些系统广义上分成两类，具有多亚基效应物复合物的第1类和具有单亚基效应物模块的第2类(通过Cas9蛋白来举例说明)。与第2类CRISPR-Cas系统相关联的新型效应蛋白可以被开发为强有力的基因组工程工具并且推定的新型效应蛋白的预测及其工程化和优化是重要的。

本申请中的任何文献的引用或鉴定并不承认该文献作为本发明的现有技术而可以获得。

发明内容

对于具有一系列广泛应用的靶向核酸或多核苷酸(例如，DNA或其任何杂交体或衍生物)的替代性且稳健的系统和技术存在着迫切需要。本发明着手解决这种需要并且提供了相关优点。将本发明的新型DNA靶向系统添加到基因组和表观基因组(epigenomic)靶向技术的全能文库(repertoire)可以通过直接的检测、分析和操纵来转化特定靶位点的研究和干扰或编辑。为了有效而无有害作用地利用本发明的DNA靶向系统用于基因组或表观基因组的靶向，了解这些DNA靶向工具的工程化和优化方面是关键的。

本发明涉及Cpf1，以及指示的用途，和如本文进一步限定的用于鉴定的方法。Cpf1已被表征为第2类CRISPR-Cas系统的单RNA指导核酸内切酶(Zetsche等人(2015)Cell[细胞]；163(3):759-771)。本发明特别涉及突变体Cpf1多肽和多核苷酸。本发明诸位发明人惊奇地发现Cpf1可以被突变以改变PAM识别，即不同的PAM序列可以通过本文描述的Cpf1突变体在功能上被识别，例如，以扩展PAM识别全能文库。如本文所述的根据本发明的突变体能够识别与相应的野生型Cpf1识别的PAM序列的不同和/或短于其的PAM序列(同时还可能仍能识别由相应的野生型Cpf1识别的PAM序列)。如此，本发明因此涉及Cpf1 PAM识别的定向演化。

因此，在一个方面中，本发明涉及具有一个或多个影响PAM识别或特异性的突变的突变型Cpf1多肽。在另外的方面中，本发明涉及具有一个或多个突变的突变型Cpf1多肽，其中所述突变型Cpf1蛋白识别不被相应的野生型Cpf1识别的PAM序列。在另外的方面中，本发明涉及突变型Cpf1多肽，其具有一个或多个突变并识别由除N以外的少于4个核苷酸组成的PAM，条件是所述突变型Cpf1不是突变型FnCpf1。在另外的方面中，本发明涉及识别具有序列YCV的PAM的突变型Cpf1多肽。在另外的方面中，本发明涉及识别具有序列NYCV的PAM的突变型Cpf1多肽。在另外的方面中，本发明涉及识别具有序列TYCV的PAM的突变型Cpf1多肽。在另外的方面中，本发明涉及识别具有序列VYCV的PAM的突变型Cpf1多肽。在另外的方面中，本发明涉及识别具有序列RYN的PAM的突变型Cpf1多肽。在另外的方面中，本发明涉及识别具有序列YCN的PAM的突变型Cpf1多肽。在另外的方面中，本发明涉及识别具有序列RCN的PAM的突变型Cpf1多肽。在另外的方面中，本发明涉及识别具有序列AYV的PAM的突变型Cpf1多肽。在另外的方面中，本发明涉及识别具有序列TYV的PAM的突变型Cpf1多肽。在另外的方面中，本发明涉及识别具有序列TNYS或TNYC的PAM的突变型Cpf1多肽，条件是所述PAM不是TTTV或条件是所述PAM不是TTTN或TTTC。在另外的方面中，本发明涉及识别具有序列TNYS或TNYC的PAM的突变型Cpf1多肽，条件是所述PAM不是TCTG或TCTC。在另外的方面中，本发明涉及识别具有序列TNYS或TNYC的PAM的突变型Cpf1多肽，条件是所述PAM不是TTTV或条件是所述PAM不是TTTN或TCTC。在另外的方面中，本发明涉及识别具有序列TYCC(即TCCC或TTCC)、TRTC(即TATC或TGTC)、TATV(即TATA、TATC、或TATG)、NTTV(即NTTA、NTTC、或NTTG)、TTV(即TTA、TTC、或TTG)、TGYV、TYTV、TYCT、TSTG、TVYS、TVTS、TYYS、TCYS、TBYS、TCYS、TNYS、TYYS、TNTN、TSTG、TTCC、TCCC、TATC、TGTG、TCTG、TACT、AATA、TGTC、TRYV、RYH、TCTC、NTTN、TTN、TRTN、TYCN、TTCN、TCCN、或TATN的PAM的突变型Cpf1多肽，任选地条件是所述PAM不是TTTV或不限于TTTV和/或任选地条件是所述PAM不是TTTN或不限于TTTN和/或任选地条件是所述PAM不是TCTC或不限于TCTC。在这方面，在一个实施例中，所述PAM不是TTTV或TTTC或者不限于TTTV或TTTC。在另外的实施例中，所述PAM不是TCTG或不限于TCTG。在另外的实施例中，所述PAM不是TCTC或不限于TCTC。在某些实施例中，Cpf1是AsCpf1。在另外的实施例中，Cpf1是来自选自以下的生物体的Cpf1：氨基酸球菌属物种BV3L6、硫微螺菌属物种XS5、牛莫拉氏菌AAX08_00205、牛莫拉氏菌AAX11_00205、和毛螺菌科细菌MA2020。

在一个方面中，本发明涉及突变型Cpf1多肽，其具有AsCpf1(优选氨基酸球菌属物种BV3L6)的位置11、12、13、14、15、16、17、34、36、39、40、43、46、47、50、54、57、58、111、126、127、128、129、130、131、132、133、134、135、136、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、532、533、534、535、536、537、538、539、540、541、542、543、544、545、546、547、548、549、550、551、552、553、554、555、556、565、566、567、568、569、570、571、572、573、574、575、592、593、594、595、596、597、598、599、600、601、602、603、604、605、606、607、608、609、610、611、612、613、614、615、616、617、618、619、620、626、627、628、629、630、631、632、633、634、635、636、637、638、642、643、644、645、646、647、648、649、651、652、653、654、655、656、676、679、680、682、683、684、685、686、687、688、689、690、691、692、693、707、711、714、715、716、717、718、719、720、721、722、739、765、768、769、773、777、778、779、780、781、782、783、784、785、786、871、872、873、874、875、876、877、878、879、880、881、882、883、884、或1048处，或AsCpf1直向同源物(来自不同物种的相应效应物，例如LbCpf1)、同源物(具有相同功能的效应物，来自相同或不同的物种)、或变体(例如，如本文其他地方描述的任何另外修饰的Cpf1，包括截短的Cpf1)的相应位置处的一个或多个突变型氨基酸残基，例如AsCpf1(优选地氨基酸球菌属物种BV3L6)的位置Y11、Q12、V13、S14、K15、T16、L17、Q34、F36、E39、D40、R43、H46、Y47、L50、I54、I57、Y58、I111、A126、E127、I128、Y129、K130、G131、L132、F133、K134、A135、E136、A157、L158、L159、R160、S161、F162、D163、K164、F165、T166、T167、Y168、F169、S170、G171、F172、Y173、E174、N175、R176、K177、N178、K532、L533、N534、F535、Q536、M537、P538、T539、L540、A541、S542、G543、W544、D545、V546、N547、K548、E549、K550、N551、N552、G553、A554、I555、L556、L565、G566、I567、M568、P569、K570、Q571、K572、G573、R574、Y575、K592、M593、Y594、Y595、D596、Y597、F598、P599、D600、A601、A602、K603、M604、I605、P606、K607、C608、S609、T610、Q611、L612、K613、A614、V615、T616、A617、H618、F619、Q620、I626、L627、L628、S629、N630、N631、F632、I633、E634、P635、L636、E637、I638、I642、Y643、D644、L645、N646、N647、P648、E649、E651、P652、K653、K654、F655、Q656、W676、F679、T680、D682、F683、L684、S685、K686、Y687、T688、K689、T690、T691、S692、I693、L707、Y711、L714、N715、P716、L717、L718、Y719、H720、I721、S722、K739、W765、L768、F769、N773、T777、S778、I779、K780、L781、N782、G783、Q784、A785、E786、F871、H872、V873、P874、I875、T876、L877、N878、Y879、Q880、A881、A882、N883、S884、或Q1048，或AsCpf1直向同源物(来自不同物种的相应效应物，例如LbCpf1)、同源物(具有相同功能的效应物，来自相同或不同的物种)、或变体(例如，如本文其他地方描述的任何另外修饰的Cpf1，包括截短的Cpf1)的相应位置处的一个或多个突变型氨基酸残基。

在一个方面中，本发明涉及突变型Cpf1多肽，其具有AsCpf1(优选地氨基酸球菌属物种BV3L6)的位置130、131、132、133、134、135、136、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、536、537、538、539、540、541、542、543、544、545、546、547、548、549、550、551、552、570、571、572、573、595、596、597、598、599、600、601、602、603、604、605、606、607、608、609、610、611、612、613、614、615、630、631、632、646、647、648、649、650、651、652、653、683、684、685、686、687、688、689、或690，或AsCpf1直向同源物(来自不同物种的相应效应物，例如LbCpf1)、同源物(具有相同功能的效应物，来自相同或不同的物种)、或变体(例如，如本文其他地方描述的任何另外修饰的Cpf1，包括截短的Cpf1)的相应位置处的一个或多个突变型氨基酸残基，例如AsCpf1(优选地氨基酸球菌属物种BV3L6)的位置K130、G131、L132、F133、K134、A135、E136、F162、D163、K164、F165、T166、T167、Y168、F169、S170、G171、F172、Y173、E174、N175、R176、K177、Q536、M537、P538、T539、L540、A541、S542、G543、W544、D545、V546、N547、K548、E549、K550、N551、N552、K570、Q571、K572、G573、Y595、D596、Y597、F598、P599、D600、A601、A602、K603、M604、I605、P606、K607、C608、S609、T610、Q611、L612、K613、A614、V615、N630、N631、F632、N646、N647、P648、E649、K650、E651、P652、K653、F683、L684、S685、K686、Y687、T688、K689、或T690，或AsCpf1直向同源物(来自不同物种的相应效应物，例如LbCpf1)、同源物(具有相同功能的效应物，来自相同或不同的物种)、或变体(例如，如本文其他地方描述的任何另外修饰的Cpf1，包括截短的Cpf1)的相应位置处的一个或多个突变型氨基酸残基。

在一个方面中，本发明涉及突变型Cpf1多肽，其具有AsCpf1(优选地氨基酸球菌属物种BV3L6)的位置539、542、547、548、550、551、552、或607，或AsCpf1直向同源物(来自不同物种的相应效应物，例如LbCpf1)、同源物(具有相同功能的效应物，来自相同或不同的物种)、或变体(例如，如本文其他地方描述的任何另外修饰的Cpf1，包括截短的Cpf1)的相应位置处的一个或多个突变型氨基酸残基，例如AsCpf1(优选地氨基酸球菌属物种BV3L6)的位置T539、S542、N547、K548、K550、N551、N552、或K607，或AsCpf1直向同源物(来自不同物种的相应效应物，例如LbCpf1)、同源物(具有相同功能的效应物，来自相同或不同的物种)、或变体(例如，如本文其他地方描述的任何另外修饰的Cpf1，包括截短的Cpf1)的相应位置处的一个或多个突变型氨基酸残基，例如选自AsCpf1(优选地氨基酸球菌属物种BV3L6)的S542R、N547K、K548A、K548H、K548N、K548Q、K548R、K550Y、N551R、N552G、N552K、N552R、N552S、N552T、K607A、K607R、T539R、T539K、K548G、K548C、K548F、K548I、K548M、K548S、K548T、K548V、K548W、或K548Y，或AsCpf1直向同源物(来自不同物种的相应效应物，例如LbCpf1)、同源物(具有相同功能的效应物，来自相同或不同的物种)、或变体(例如，如本文其他地方描述的任何另外修饰的Cpf1，包括截短的Cpf1)的相应位置处的一个或多个突变。

在一个方面中，本发明涉及突变型Cpf1多肽，其具有位置542、547、548、550、551、552、167、604、或607处的一个或多个突变型氨基酸残基，或者AsCpf1(优选地氨基酸球菌属物种BV3L6)的位置542、547、548、550、551、552、或607，或AsCpf1直向同源物(来自不同物种的相应效应物，例如LbCpf1)、同源物(具有相同功能的效应物，来自相同或不同的物种)、或变体(例如，如本文其他地方描述的任何另外修饰的Cpf1，包括截短的Cpf1)的相应位置处的一个或多个突变型氨基酸残基。

在一个方面中，本发明涉及突变型Cpf1多肽，其具有AsCpf1(优选地氨基酸球菌属物种BV3L6)的位置542/548、542/607、548/552、542/550/607、542/548/550/607、542/548/552、542/548/551/552、542/607/547、或542/607/547/550，或AsCpf1直向同源物(来自不同物种的相应效应物，例如LbCpf1)、同源物(具有相同功能的效应物，来自相同或不同的物种)、或变体(例如，如本文其他地方描述的任何另外修饰的Cpf1，包括截短的Cpf1)的相应位置处的组合的突变型氨基酸残基，例如具有AsCpf1(优选地氨基酸球菌属物种BV3L6)的位置S542R/K548R、S542R/K607A、K548R/N552R、S542R/K550Y/K607R、S542R/K548R/K550Y/K607R、S542R/K548V/N552R、S542R/K548V/N551R/N552R、S542R/K607R/N547K、或S542R/K607R/N547K/K550Y，或AsCpf1直向同源物(来自不同物种的相应效应物，例如LbCpf1)、同源物(具有相同功能的效应物，来自相同或不同的物种)、或变体(例如，如本文其他地方描述的任何另外修饰的Cpf1，包括截短的Cpf1)的相应位置处的组合的突变型氨基酸残基，例如具有选自AsCpf1(优选地氨基酸球菌属物种BV3L6)的S542R/K548R、S542R/K607A、S542R/K607R、K548R/N552R、S542R/K550Y/K607R、S542R/K548R/K550Y/K607R、S542R/K548V、K548V/N552R、S542R/K548V/N552R、S542R/K548V/N551R/N552R、S542R/K607R/N547K、S542R/K607R/N547K/K550Y、K548V/N552G、或S542R/K548V/N552G，或AsCpf1直向同源物(来自不同物种的相应效应物，例如LbCpf1)、同源物(具有相同功能的效应物，来自相同或不同的物种)、或变体(例如，如本文其他地方描述的任何另外修饰的Cpf1，包括截短的Cpf1)的相应位置处的组合的突变。

在一个优选实施例中，本发明涉及突变型Cpf1多肽，其具有位置542和/或607处的一个或多个突变型氨基酸残基，或AsCpf1的位置542和/或607处或者AsCpf1直向同源物(来自不同物种的相应效应物)、同源物(具有相同功能的效应物，来自相同或不同的物种)、或变体(例如，如本文其他地方描述的任何另外修饰的Cpf1，包括截短的Cpf1)的相应位置处的一个或多个突变型氨基酸残基。

在一个优选实施例中，本发明涉及突变型Cpf1多肽，其具有位置542和/或548(以及任选地552)处的一个或多个突变型氨基酸残基，或AsCpf1的位置542和/或548(以及任选地552)处或者AsCpf1直向同源物(来自不同物种的相应效应物)、同源物(具有相同功能的效应物，来自相同或不同的物种)、或变体(例如，如本文其他地方描述的任何另外修饰的Cpf1，包括截短的Cpf1)的相应位置处的一个或多个突变型氨基酸残基。

在某些实施例中，Cpf1是AsCpf1或LbCpf1。作为进一步指导，AsCpf1(氨基酸球菌属物种BV3L6)的以下氨基酸残基对应于LbCpf1(毛螺菌科细菌ND2006)的各自氨基酸残基，如下表所示。

因此，在参考上述AsCpf1残基的实施例和方面中，同样适用于相应的LbCpf1残基。

在某些实施例中，本发明的突变型Cpf1包含如下选自AsCpf1的突变S542R、N547K、K548A、K548H、K548N、K548Q、K548R、K550Y、N551R、N552G、N552K、N552R、N552S、N552T、K607A、K607R、T539R、T539K、K548G、K548C、K548F、K548I、K548M、K548S、K548T、K548V、K548W、和K548Y，或者Cpf1直向同源物的相应氨基酸残基中的一种或多种。

在某些实施例中，本发明的突变型Cpf1包含如下选自LbCpf1的突变G532R、D537K、K538A、K538H、K538N、K538Q、K538R、T540Y、D541R、Y542G、Y542K、Y542R、Y542S、Y542T、K595A、K595R、G529R、G529K、K538G、K538C、K538F、K538I、K538M、K538S、K538T、K538V、K538W、和K538Y，或者Cpf1直向同源物的相应氨基酸残基中的一种或多种。

根据本发明的一个实施例的优选的突变型Cpf1在下表中指出。

根据本发明的一个实施例的优选的突变型Cpf1和相关识别的PAM序列在下表中指出。

在一个方面中，本发明涉及编码如本文所述的突变型Cpf1的多核酸。在另外的方面中，本发明涉及包含这种多核酸的载体。在另外的方面中，本发明涉及载体系统，载体系统包含这种载体，并且在相同或不同的载体上包含gRNA(指导RNA)。当与同源DNA靶序列结合时，这种载体系统允许重构功能性CRISPR-Cas复合物。因此，在另外的方面中，本发明涉及包含如本文所述的突变型Cpf1和gRNA的复合物。在另外的方面中，本发明涉及包含如本文所述的突变型Cpf1、多核酸、载体或载体系统的递送系统。在另外的方面中，本发明涉及宿主细胞，该宿主细胞包含或表达如本文所述的突变型Cpf1、多核酸、载体、载体系统、复合物或递送系统。在另外的方面中，本发明涉及组合物，该组合物可以是药物组合物，其包含如本文所述的突变型Cpf1、多核酸、载体、载体系统、复合物、递送系统或宿主细胞。在另外的方面中，本发明提供了试剂盒，该试剂盒包含如本文所述的突变型Cpf1、多核酸、载体、载体系统、复合物、递送系统、宿主细胞或组合物。在又另外的方面中，本发明涉及转基因生物，例如非人转基因生物，其包含或表达如本文所述的突变型Cpf1、多核酸、载体、载体系统、复合物、递送系统、宿主细胞或组合物。

在一个方面中，本发明涉及修饰或靶向靶DNA座位的方法，该方法包括向所述座位递送如本文所述的多肽、多核苷酸、载体、载体系统、递送系统、复合物、或组合物。在另外的方面中，本发明涉及修饰或靶向靶DNA座位的方法，该方法包括向所述座位递送如本文所述的根据本发明的突变型Cpf1多肽，或编码所述突变型Cpf1的多核苷酸，和gRNA，或编码所述gRNA的多核苷酸。所述突变型Cpf1多肽优选与所述gRNA形成复合物，并且所述靶DNA座位在所述复合物与所述靶DNA座位结合后优选地被修饰或靶向。

在一个方面中，本发明涉及鉴定具有一个或多个影响PAM识别的突变的突变型Cpf1多肽的方法，该方法包括以下步骤

(a)提供宿主细胞

-包含或表达具有一个或多个影响PAM识别的突变的候选突变型Cpf1多肽，

-包含或表达gRNA，

-包含与DNA靶序列连接的特定PAM序列的多核苷酸，其中所述多核苷酸进一步包含选择标记，其中所述DNA靶序列能够与所述gRNA杂交，

(b)基于所述选择标记的活性鉴定具有一个或多个影响PAM识别的突变的突变型Cpf1多肽。

在另外的方面中，本发明涉及鉴定具有一个或多个影响PAM识别的突变的突变型Cpf1多肽的方法，该方法包括以下步骤

(a1)提供宿主细胞，其包含或表达具有一个或多个影响PAM识别的突变的候选突变型Cpf1多肽和gRNA；

(b1)在所述宿主细胞中引入多核苷酸，该多核苷酸包含与所述gRNA能够与之杂交的DNA靶序列连接的特定PAM序列，其中所述多核苷酸进一步包含选择标记；或者

(a2)提供包含多核苷酸的宿主细胞，该多核苷酸包含与DNA靶序列连接的特定PAM序列，其中所述多核苷酸进一步包含选择标记；

(b2)在所述宿主细胞中引入具有一个或多个影响PAM识别的突变的候选突变型Cpf1多肽，或表达这种多肽的多核苷酸，以及能够与所述DNA靶序列杂交的gRNA，或表达这种gRNA的多核苷酸；

(c)基于所述选择标记的活性鉴定具有一个或多个影响PAM识别的突变的突变型Cpf1多肽。

在另一个方面中，本发明还涉及通过上述方法鉴定的突变型Cpf1，以及编码这种鉴定的突变型Cpf1的多核苷酸，或载体、载体系统、复合物、组合物、递送系统、宿主细胞或转基因生物。

在一个方面中，本发明涉及如本文所述的根据本发明的Cpf1多肽、多核苷酸、载体、载体系统、复合物、递送系统、宿主细胞或组合物用于(优选地，在体外或离体)修饰或靶向DNA靶座位的用途，或用于修饰或靶向非人和/或非动物生物体中的DNA靶座位的用途。在另外的方面中，本发明涉及如本文所述的根据本发明的Cpf1多肽、多核苷酸、载体、载体系统、复合物、递送系统或宿主细胞用于(优选地在体外或离体)基因组编辑，或用于非人和/或非动物生物体的基因组编辑的用途。在另一个方面中，本发明涉及如本文所述的根据本发明的Cpf1多肽、多核苷酸、载体、载体系统、复合物、递送系统、宿主细胞或组合物，用于在修饰或靶向DNA靶座位中使用。在另一个方面中，本发明涉及如本文所述的根据本发明的Cpf1多肽、多核苷酸、载体、载体系统、复合物、递送系统、宿主细胞或组合物，用于在基因组编辑中使用。在另外的方面中，本发明涉及如本文所述的根据本发明的Cpf1多肽、多核苷酸、载体、载体系统、复合物、递送系统、宿主细胞或组合物，用于在疗法中使用或用作药物。在又另一个方面中，本发明涉及如本文所述的根据本发明的Cpf1多肽、多核苷酸、载体、载体系统、复合物、递送系统、宿主细胞或组合物在制备药物中的用途。

通过引用将所附权利要求并入本文。

应当理解，无论何时在整个说明书中参考“Cpf1”，并且除非以其他方式明显或明确指出，否则这样的参考是指如本文所述的根据本发明的突变型Cpf1。

本发明提供了修饰与目的靶座位相缔合的或在该靶座位处的序列的方法，该方法包括将包含根据本发明的(突变型)Cpf1效应蛋白和一种或多种核酸组分的(非天然存在或工程化的)组合物递送至所述座位，其中该效应蛋白与一种或多种核酸组分形成复合物并且在所述复合物与目的座位结合后，该效应蛋白诱导对与目的靶座位缔合的或在该靶座位处的序列的(遗传的、表观遗传的或其他方式的)修饰或序列的功能性(例如转录激活或抑制)。在一个优选实施例中，该修饰是(单或双)链断裂的引入。在一个优选实施例中，与目的靶座位相关联的或在该靶座位处的序列包括DNA并且效应蛋白由亚型V-ACRISPR-Cas座位或亚型V-B CRISPR-Cas座位编码。

应了解，除非另外表明，否则术语Cas酶、CRISPR酶、CRISPR蛋白、Cas蛋白和CRISPRCas通常是可以互换使用的并且在所有本文参考方面处以类推方式指进一步描述在本发明中的新型CRISPR效应蛋白，例如通过具体参考Cas9。本文描述的CRISPR效应蛋白优选为如本文所述的根据本发明的(突变型)Cpf1效应蛋白。

本发明提供了修饰与目的靶座位相缔合的或在该靶座位处的序列的方法，该方法包括将包含如本文所述的根据本发明的Cpf1座位效应蛋白和一种或多种核酸组分的(非天然存在或工程化的)组合物递送至所述与该座位缔合的或在该座位处的序列，其中该Cpf1效应蛋白与一种或多种核酸组分形成复合物并且在所述复合物与目的座位结合后，该效应蛋白诱导对与目的靶座位缔合的或在该靶座位处的序列的(遗传的、表观遗传的或其他方式的)修饰或序列的功能性(例如转录激活或抑制)。在一个优选实施例中，该修饰是(单或双)链断裂的引入。在一个优选实施例中，Cpf1效应蛋白与一种核酸组分；有利地工程化的或非天然存在的核酸组分形成复合物。对与目的靶座位相关联的或在该靶座位处的序列的修饰的诱导可以是Cpf1效应蛋白-核酸指导的。在一个优选实施例中，一种核酸组分是CRISPR RNA(crRNA)。在一个优选实施例中，一种核酸组分是成熟crRNA或指导RNA，其中成熟crRNA或指导RNA包含间隔区序列(或指导序列)和同向重复序列或它们的衍生物。在一个优选实施例中，间隔区序列或其衍生物包含种子序列，其中种子序列对识别和/或杂交于靶座位处的序列是关键的。在一个优选实施例中，如本文所述的根据本发明的Cpf1是AsCpf1(氨基酸球菌属物种，例如氨基酸球菌属物种BV3L6)或LbCpf1(毛螺菌科细菌，例如毛螺菌科细菌MA2020或毛螺菌科细菌ND2006)。在一个优选实施例中，FnCpf1指导RNA的种子序列大约在间隔区序列(或指导序列)的5'端上的前5个核苷酸(nt)之内。在一个优选实施例中，链断裂是交错切割的，产生了5'突出端。在一个优选实施例中，与目的靶座位相关联的或在该靶座位处的序列包括直链DNA或超螺旋DNA。

本发明的方面涉及如本文所述的根据本发明的具有一种或多种(非天然存在或工程化或修饰或优化的)核酸组分的Cpf1效应蛋白复合物。在一个优选实施例中，复合物的核酸组分可以包含连接至同向重复序列的指导序列，其中同向重复序列包括一个或多个茎环或优化的二级结构。在一个优选实施例中，同向重复序列具有16个核苷酸的最小长度并且具有单一茎环。在另外的实施例中，同向重复序列具有长于16个核苷酸，优选地超过17个核苷酸的长度，并且具有超过一个的茎环或优化的二级结构。在一个优选实施例中，同向重复序列可以被修饰成包含一种或多种蛋白质结合的RNA适配体。在一个优选实施例中，一个或多个适配体可以被包含作为优化的二级结构的一部分。此类适配体可以能够结合噬菌体外壳蛋白。噬菌体外壳蛋白可以选自下组，该组包括Qβ、F2、GA、fr、JP501、MS2、M12、R17、BZ13、JP34、JP500、KU1、M11、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、φCb5、φCb8r、φCb12r、φCb23r、7s和PRR1。在一个优选实施例中，噬菌体外壳蛋白是MS2。本发明还提供了复合物的核酸组分，该核酸组分的长度为30或更多个、40或更多个、或50或更多个核苷酸。

本发明提供了基因组编辑的方法，其中该方法包括两轮或更多轮的Cpf1效应蛋白靶向和切割。在某些实施例中，第一轮包括Cpf1效应蛋白切割与远离种子序列的靶座位相关联的序列并且第二轮包括Cpf1效应蛋白切割靶座位处的序列。在本发明的优选实施例中，通过Cpf1效应蛋白进行的第一轮靶向产生了indel并且通过Cpf1效应蛋白进行的第二轮靶向可以经由同源定向修复(HDR)进行修复。在本发明的一个最优选实施例中，通过Cpf1效应蛋白进行的一轮或多轮靶向产生了可以通过修复模板的插入来修复的交错切割。

本发明提供了基因组编辑或修饰与目的靶座位相关联的或在该靶座位处的序列的方法，其中该方法包括将Cpf1效应蛋白复合物引入到任何所希望的细胞类型，原核细胞或真核细胞中，由此Cpf1效应蛋白复合物有效地用于将DNA插入物整合到原核细胞或真核细胞的基因组中。在优选实施例中，细胞是真核细胞并且基因组是哺乳动物基因组。在优选实施例中，DNA插入物的整合通过基于非同源末端连接(NHEJ)的基因插入机制来实现。在优选实施例中，DNA插入物是外源引入的DNA模板或修复模板。在一个优选实施例中，外源引入的DNA模板或修复模板与Cpf1效应蛋白复合物或一种组分或用于表达复合物组分的多核苷酸载体一起递送。在一个更优选实施例中，真核细胞是不分裂的细胞(例如，其中经由HDR进行基因组编辑是特别具有挑战性的不分裂细胞)。在人类细胞中的基因组编辑的优选方法中，Cpf1效应蛋白可以包括但不限于FnCpf1、AsCpf1和LbCpf1效应蛋白。

在此类方法中，目的靶座位可以包含在体外的DNA分子中。在一个优选实施例中，DNA分子是质粒。

在此类方法中，目的靶座位可以包含在细胞内的DNA分子中。细胞可以是原核细胞或真核细胞。细胞可以是哺乳动物细胞。哺乳动物细胞可以是非人类灵长类动物、牛、猪、啮齿动物或小鼠细胞。细胞可以是非哺乳动物真核细胞例如家禽、鱼或虾的细胞。细胞还可以是植物细胞。植物细胞可以是栽培植物例如木薯、玉米、高粱、小麦或稻具有的细胞。植物细胞还可以是藻类、树或蔬菜具有的细胞。通过本发明引入到细胞的修饰可以使得细胞和细胞的子代被改变以改进生物产物例如抗体、淀粉、乙醇或其他所希望的细胞输出物的产生。通过本发明引入到细胞的修饰可以使得细胞和细胞的子代包括使所产生的生物产物发生变化的改变。

在一个优选实施例中，目的靶座位包括DNA。

在此类方法中，目的靶座位可以包含在细胞内的DNA分子中。细胞可以是原核细胞或真核细胞。细胞可以是哺乳动物细胞。哺乳动物细胞可以是非人类哺乳动物，例如灵长类动物、牛、羊、猪类、犬、啮齿动物、兔科例如猴、母牛、绵羊、猪、狗、兔、大鼠或小鼠的细胞。细胞可以是非哺乳动物真核细胞例如家禽鸟类(例如鸡)、脊椎动物鱼(例如鲑鱼)或甲壳类动物(例如牡蛎、蛤、龙虾、虾)的细胞。细胞还可以是植物细胞。植物细胞可以是单子叶植物或双子叶植物具有的细胞或栽培植物或粮食植物例如木薯、玉米、高粱、大豆、小麦、燕麦或稻具有的细胞。植物细胞还可以是藻类、树或生产植物、果实或蔬菜(例如，树类例如柑橘树，例如桔子树、葡萄柚树或柠檬树；桃树或油桃树；苹果树或梨树；坚果树例如杏树或核桃树或阿月浑子树；茄属植物；芸苔属植物；莴苣属植物；菠菜属植物；辣椒属植物；棉花、烟草、芦笋、胡萝卜、甘蓝、西兰花、花椰菜、番茄、茄子、胡椒、莴苣、菠菜、草莓、蓝莓、覆盆子、黑莓、葡萄、咖啡、可可等)具有的细胞。

在任一所述方法中，目的靶座位可以是目的基因组或表观基因组的座位。在任一所述方法中，复合物可以使用用于多重用途的多个指导序列进行递送。在任一所述方法中，可以使用超过一种的蛋白质。

在本发明的优选实施例中，在不存在推定的反式激活crRNA(tracr RNA)序列条件下，发生与目的靶座位相关联的或在该靶座位处的序列的生物化学的或体外或体内的切割，例如通过Cpf1效应蛋白进行切割。在本发明的其他实施例中，在存在推定的反式激活crRNA(tracr RNA)序列条件下，可以发生切割，例如通过其他CRISPR家族效应蛋白进行切割，然而，在评价Cpf1座位之后，申请人推断通过Cpf1效应蛋白复合物进行的靶DNA切割不需要tracrRNA。申请人确定仅包含Cpf1效应蛋白和crRNA(包含同向重复序列和指导序列的指导RNA)的Cpf1效应蛋白复合物足以切割靶DNA。在一个优选实施例中，该Cpf1效应蛋白是AsCpf1或LbCpf1。

在任一上述方法中，效应蛋白(例如Cpf1)和核酸组分可以经由编码该蛋白质和/或一种或多种核酸组分的一个或多个多核苷酸分子来提供，并且其中一个或多个多核苷酸分子被可操作地构造成用于表达蛋白和/或一种或多种核酸组分。一个或多个多核苷酸分子可以包含被可操作地构造成用于表达蛋白质和/或一种或多种核酸组分的一个或多个调节元件。一个或多个多核苷酸分子可以包含在一个或多个载体中。本发明包括此或此类核苷酸分子例如被可操作地构造成用于表达蛋白质的此类多核苷酸分子，和/或一种或多种核酸组分以及此或此类载体。

在任一上述方法中，链断裂可以是单链断裂或双链断裂。

调节元件可以包括诱导型启动子。多核苷酸和/或载体系统可以包括诱导型系统。

在任一上述方法中，一个或多个多核苷酸分子可以包含在递送系统中，或者一种或多种载体可以包含在递送系统中。

在任一上述方法中，该(非天然存在或工程化的)组合物可以经由脂质体、粒子(例如纳米粒子)、外来体、微泡、基因枪或一种或多种载体例如核酸分子或病毒载体递送。

本发明还提供了一种非天然存在或工程化的组合物，该组合物是具有如本文所讨论的或任一本文所述方法中所限定的特性的组合物。

本发明还提供了一种包含一种或多种载体的载体系统，这些一种或多种载体包含编码(非天然存在或工程化的)组合物(为具有如本文所讨论的或任一本文所述方法中所限定的特性的组合物)的组分的一个或多个多核苷酸分子。

本发明还提供了一种包含一种或多种载体或一个或多个多核苷酸分子的递送系统，这些一种或多种载体或一个或多个多核苷酸分子包括编码(非天然存在或工程化的)组合物(为具有如本文所讨论的或任一本文所述方法中所限定的特性的组合物)的组分的一个或多个多核苷酸分子。

本发明还提供了在治疗性治疗方法中使用的一种(非天然存在或工程化的)组合物，或编码所述组合物的组分的一种或多种多核苷酸，或包括编码所述组合物的组分的一种或多种多核苷酸的载体或递送系统。治疗性治疗方法可以包括基因或基因组编辑，或基因治疗。

本发明还提供了其中效应蛋白的一个或多个另外的氨基酸残基可以被修饰，例如工程化或非天然存在的效应蛋白或Cpf1的方法和组合物。在一个实施例中，修饰可以包括效应蛋白的一个或多个氨基酸残基的突变。一个或多个突变可以处于效应蛋白的一个或多个催化活性结构域中。与缺乏所述一个或多个突变的效应蛋白相比，该效应蛋白可以具有降低或废除的核酸酶活性。效应蛋白不可以引导目的靶座位处的一条或另一条DNA链的切割。效应蛋白不可以引导目的靶座位处的DNA链的切割。在一个优选实施例中，一个或多个突变可以包括两个突变。在一个优选实施例中，Cpf1效应蛋白中的一个或多个氨基酸残基被修饰，例如工程化或非天然存在的效应蛋白或Cpf1。在一个优选实施例中，Cpf1效应蛋白是AsCpf1、LbCpf1或FnCpf1效应蛋白。在一个优选实施例中，一个或多个修饰的或突变的氨基酸残基是参照FnCpf1效应蛋白的氨基酸位置编码的D917A、E1006A或D1255A。

本发明还提供了处于包含RuvC结构域的效应蛋白的催化活性结构域中的另外的一个或多个突变或两个或更多个突变。在本发明的一些实施例中，RuvC结构域可以包括RuvCI、RuvCII或RuvCIII结构域，或与RuvCI、RuvCII或RuvCIII结构域等或与如任一本文所述方法中所述的任何相关结构域同源的催化活性结构域。效应蛋白可以包含一个或多个异源功能结构域。一个或多个异源功能结构域可以包括一个或多个核定位信号(NLS)结构域。一个或多个异源功能结构域可以包括至少两个或更多个NLS结构域。一个或多个NLS结构域可以定位成处于或靠近或接近效应蛋白(例如Cpf1)的末端，并且如果是两个或更多个NLS的话，则两个中的每个可以定位成处于或靠近或接近效应蛋白(例如Cpf1)的末端。一个或多个异源功能结构域可以包括一个或多个转录激活结构域。在一个优选实施例中，转录激活结构域可以包括VP64。一个或多个异源功能结构域可以包括一个或多个转录阻遏结构域。在一个优选实施例中，转录阻遏结构域包括KRAB结构域或SID结构域(例如SID4X)。一个或多个异源功能结构域可以包括一个或多个核酸酶结构域。在一个优选实施例中，核酸酶结构域包括Fok1。

本发明还提供一种或多种异源功能结构域以具有以下活性中的一种或多种：甲基化酶活性、脱甲基化酶活性、转录激活活性、转录阻遏活性、转录释放因子活性、组蛋白修饰活性、核酸酶活性、单链RNA切割活性、双链RNA切割活性、单链DNA切割活性、双链DNA切割活性以及核酸结合活性。至少一个或多个异源功能结构域可以处于或靠近效应蛋白的氨基末端并且/或者其中至少一个或多个异源功能结构域处于或靠近效应蛋白的羧基末端。一个或多个异源功能结构域可以融合至效应蛋白。一个或多个异源功能结构域可以系接至效应蛋白。一个或多个异源功能结构域可以通过接头部分连接至效应蛋白。

在一些实施例中，功能结构域是脱氨酶，例如胞苷脱氨酶。胞苷脱氨酶可以被引导至靶核酸，在这儿胞苷脱氨酶引导胞苷至尿苷的转化，产生C至T的取代(在互补链上G变成A)。在这样的实施例中，可以在不存在DNA切割的情况下实施核苷酸取代。

在一些实施例中，本发明涉及靶向碱基编辑子，该编辑子包含与脱氨酶融合的V型CRISPR效应物。基于II型CRISPR效应物的靶向碱基编辑子描述于以下文献中：Komor等人,Nature[自然](2016)533:420-424；Kim等人,Nature Biotechnology[自然生物技术](2017)35:371-376；Shimatani等人,Nature Biotechnology[自然生物技术](2017)doi:10.1038/nbt.3833；和Zong等人,Nature Biotechnology[自然生物技术](2017)doi:10.1038/nbt.3811，将这些文献各自通过引用以其全文并入。

在一些实施例中，该靶向碱基编辑子包含与胞苷脱氨酶融合的Cpf1效应蛋白。在一些实施例中，该胞苷脱氨酶与该Cpf1效应蛋白的羧基末端融合。在一些实施例中，该Cpf1效应蛋白和该胞苷脱氨酶通过接头融合。在不同实施例中，该接头可具有不同的长度和组合物。在一些实施例中，该接头序列的长度在约3至约21个氨基酸残基的范围内。在一些实施例中，该接头序列的长度超过9个氨基酸残基。在一些实施例中，该接头序列的长度为约16个氨基酸残基。在一些实施例中，该Cpf1效应蛋白和该胞苷脱氨酶通过XTEN接头融合。

在一些实施例中，该胞苷脱氨酶是真核起源的，例如人、大鼠或七鳃鳗起源。在一些实施例中，该胞苷脱氨酶是AID、APOBEC3G、APOBEC1或CDA1。在一些实施例中，该靶向碱基编辑子进一步包含抑制碱基切除修复(BER)的结构域。在一些实施例中，该靶向碱基编辑子进一步包含与Cpf1效应蛋白或胞苷脱氨酶融合的尿嘧啶DNA糖基化酶抑制剂(UGI)。

在一些实施例中，该胞苷脱氨酶具有有效的脱氨基窗口，该窗口包围对脱氨基编辑易感的核苷酸。因此，在一些实施例中，“编辑窗口宽度”是指胞苷脱氨酶的编辑效率超过给定靶位点的半数最大值的该靶位点处的核苷酸位置的数目。在一些实施例中，该胞苷脱氨酶的编辑窗口宽度范围为约1至约6个核苷酸。在一些实施例中，该胞苷脱氨酶的编辑窗口宽度为1、2、3、4、5或6个核苷酸。

不受理论的束缚，预期在一些实施例中，接头序列的长度影响编辑窗口宽度。在一些实施例中，随着接头长度从约3扩增至21个氨基酸，编辑窗口宽度从约3增加至6个核苷酸。在一些实施例中，16残基接头提供约5个核苷酸的有效脱氨窗口。在一些实施例中，指导RNA的长度影响编辑窗口宽度。在一些实施例中，缩短指导RNA导致胞苷脱氨酶的有效脱氨窗口变窄。

在一些实施例中，胞苷脱氨酶的突变影响编辑窗口宽度。在一些实施例中，靶向碱基编辑子包含一个或多个降低胞苷脱氨酶催化效率的突变，这样可以防止脱氨酶每次DNA结合事件使多个胞苷脱氨基。在一些实施例中，突变APOBEC1的残基90(W90)处的色氨酸或同源序列中的相应色氨酸残基。在一些实施例中，将Cpf1效应蛋白与包含W90Y或W90F突变的APOBEC1突变体融合。在一些实施例中，突变APOBEC3G的残基285(W285)处的色氨酸或同源序列中的相应色氨酸残基。在一些实施例中，将Cpf1效应蛋白与包含W285Y或W285F突变的APOBEC3G突变体融合。

在一些实施例中，该靶向碱基编辑子包含一种或多种降低对胞苷至脱氨酶活性位点的非最佳呈递的耐受性的突变。在一些实施例中，该苷脱氨酶包含一个或多个改变脱氨酶活性位点的底物结合活性的突变。在一些实施例中，该胞苷脱氨酶包含一个或多个改变待由脱氨酶活性位点识别和结合的DNA构象的突变。在一些实施例中，该胞苷脱氨酶包含一个或多个改变对脱氨酶活性位点的底物可及性的突变。在一些实施例中，突变APOBEC1的残基126(R126)处的精氨酸或同源序列中的相应精氨酸残基。在一些实施例中，将Cpf1效应蛋白与包含R126A或R126E突变的APOBEC1融合。在一些实施例中，突变APOBEC3G的残基320(R320)处的色氨酸或同源序列中的相应精氨酸残基。在一些实施例中，将Cpf1效应蛋白与包含R320A或R320E突变的APOBEC3G突变体融合。在一些实施例中，突变APOBEC1的残基132(R132)处的精氨酸或同源序列中的相应精氨酸残基。在一些实施例中，将Cpf1效应蛋白与包含R132E突变的APOBEC1突变体融合。

在一些实施例中，靶向碱基编辑子的APOBEC1结构域包含选自W90Y、W90F、R126A、R126E、和R132E的一个、两个或三个突变。在一些实施例中，APOBEC1结构域包含W90Y和R126E的双突变。在一些实施例中，APOBEC1结构域包含W90Y和R132E的双突变。在一些实施例中，APOBEC1结构域包含R126E和R132E的双突变。在一些实施例中，APOBEC1结构域包含W90Y、R126E和R132E的三个突变。

在一些实施例中，如本文中公开的胞苷脱氨酶中的一个或多个突变将编辑窗口宽度减少至约2个核苷酸。在一些实施例中，如本文中公开的胞苷脱氨酶中的一个或多个突变将编辑窗口宽度减少至约1个核苷酸。在一些实施例中，如本文所公开的胞苷脱氨酶中的一个或多个突变减少了编辑窗口宽度，同时仅最低限度地或适度地影响酶的编辑效率。在一些实施例中，如本文所公开的胞苷脱氨酶中的一个或多个突变减少了编辑窗口宽度，而不降低酶的编辑效率。在一些实施例中，如本文所公开的胞苷脱氨酶中的一个或多个突变使得能够区分相邻的胞苷核苷酸，否则将通过胞苷脱氨酶以相似的效率对其进行编辑。

在一些实施例中，Cpf1效应蛋白是具有催化失活的RuvC结构域的无效Cpf1(例如AsCpf1 D908A、AsCpf1 E993A、AsCpf1 D1263A、LbCpf1 D832A、LbCpf1 E925A、LbCpf1D947A、和LbCpf1 D1180A)。在一些实施例中，Cpf1效应蛋白是具有催化失活的Nuc结构域的Cpf1切口酶(例如AsCpf1 R1226A)。

在一些实施例中，Cpf1效应蛋白识别靶DNA上的原型间隔区邻近基序(PAM)序列。在一些实施例中，PAM在靶胞苷的上游或下游。在一些实施例中，Cpf1效应蛋白和PAM序列之间的相互作用将靶胞苷置于胞苷脱氨酶的有效脱氨窗口内。在一些实施例中，Cpf1效应蛋白的PAM特异性决定了可由靶向碱基编辑子编辑的位点。在一些实施例中，Cpf1效应蛋白可以识别一种或多种PAM序列，包括但不限于TTTV，其中V是A/C或G(例如，野生型AsCpf1或LbCpf1)，和TTN，其中N是A/C/G或T(例如，野生型FnCpf1)。在一些实施例中，Cpf1效应蛋白包含一个或多个导致PAM序列改变的氨基酸突变。例如，Cpf1效应蛋白可以是包含一个或多个S542(例如S542R)、K548(例如K548V)、N552(例如N552R)或K607(例如K607R)处的氨基酸突变的AsCpf1突变体，或包含一个或多个G532(例如G532R)、K538(例如K538V)、Y542(例如Y542R)或K595(例如K595R)处的氨基酸突变的LbCpf1突变体。

WO 2016022363还描述了用于控制RNA可编程核酸内切酶(例如Cas9)的活性或用于控制包含与功能性效应结构域(例如核酸酶、切口酶、重组酶、脱氨酶、转录激活因子、转录阻遏物或表观遗传修饰结构域)融合的Cas9变体的蛋白质的活性的组合物、方法、系统和试剂盒。因此，本文提供了类似的Cpf1融合蛋白。在特定实施例中，Cpf1融合蛋白包含配体依赖性内含肽，该内含肽的存在抑制蛋白质的一种或多种活性(例如，gRNA结合、酶活性、靶DNA结合)。配体与内含肽的结合导致该内含肽的自我切除，恢复该蛋白质的活性

在一些实施例中，本发明涉及靶向碱基编辑的方法，该方法包括使上述靶向碱基编辑子与原核或真核细胞(优选哺乳动物细胞)同时或顺序地与指导核酸接触，其中该指导核酸与Cpf1效应蛋白形成复合物并引导该复合物结合细胞中靶DNA的模板链，并且其中胞苷脱氨酶将靶DNA的非模板链中的C转化为U。在一些实施例中，Cpf1效应蛋白切割包含与编辑的U相对的G的模板/非编辑的链。

本发明还提供了如本文所述的Cpf1效应蛋白，其包含来自以下属的生物体的Cpf1效应蛋白：链球菌属、弯曲杆菌属、Nitratifractor、葡萄球菌属、细小棒菌属(Parvibaculum)、罗氏菌属、奈瑟氏菌属(Neisseria)、葡糖醋杆菌属、固氮螺菌属、Sphaerochaeta、乳酸杆菌属、真细菌属、棒状杆菌属、肉杆菌属(Carnobacterium)、红细菌属、李斯特菌属(Listeria)、帕鲁迪菌属(Paludibacter)、梭菌属、毛螺菌科(Lachnospiraceae)、Clostridiaridium、纤毛菌属、弗朗西丝氏菌属、军团杆菌属、脂环酸芽孢杆菌属、甲烷嗜甲基菌(Methanomethyophilus)、卟啉单胞菌属(Porphyromonas)、普雷沃菌属、拟杆菌门、创伤球菌属(Helcococcus)、钩端螺旋体属(Letospira)、脱硫弧菌属、脱硫盐碱杆菌属(Desulfonatronum)、丰祐菌科(Opitutaceae)、肿块芽孢杆菌属(Tuberibacillus)、芽孢杆菌属、短芽孢杆菌属、甲基杆菌属或氨基酸球菌属。

本发明还提供了Cpf1效应蛋白，其包含来自以下属的生物体的Cpf1效应蛋白：变异链球菌(S.mutans)、无乳链球菌、似马链球菌(S.equisimilis)、血链球菌(S.sanguinis)、肺炎链球菌；空肠弯曲杆菌(C.jejuni)、大肠弯曲杆菌；N.salsuginis、N.tergarcus；耳葡萄球菌(S.auricularis)、肉葡萄球菌(S.carnosus)；脑膜炎奈瑟氏菌(N.meningitides)、淋病奈瑟氏菌(N.gonorrhoeae)；单核增生李斯特菌、伊氏李斯特菌(L.ivanovii)；肉毒梭菌(C.botulinum)、艰难梭菌、破伤风梭菌(C.tetani)、索氏梭菌(C.sordellii)。

效应蛋白可以包括嵌合效应蛋白，该嵌合效应蛋白包含来自第一效应蛋白直向同源物的第一片段和来自第二Cpf1效应蛋白直向同源物的第二片段，并且其中第一效应蛋白直向同源物和第二效应蛋白直向同源物是不同的。第一效应蛋白直向同源物和第二效应蛋白直向同源物中的至少一者可以包括来自于包括下项的生物体的效应蛋白：链球菌属、弯曲杆菌属、Nitratifractor、葡萄球菌属、细小棒菌属、罗氏菌属、奈瑟氏菌属、葡糖醋杆菌属、固氮螺菌属、Sphaerochaeta、乳酸杆菌属、真细菌属、棒状杆菌属、肉杆菌属、红细菌属、李斯特菌属、帕鲁迪菌属、梭菌属、毛螺菌科、Clostridiaridium、纤毛菌属、弗朗西丝氏菌属、军团杆菌属、脂环酸芽孢杆菌属、甲烷嗜甲基菌、卟啉单胞菌属、普雷沃菌属、拟杆菌门、创伤球菌属、钩端螺旋体属、脱硫弧菌属、脱硫盐碱杆菌属、丰祐菌科、肿块芽孢杆菌属、芽孢杆菌属、短芽孢杆菌属、甲基杆菌属或氨基酸球菌属；例如包含第一片段和第二片段的嵌合效应蛋白，其中第一片段和第二片段中的每个选自包括下项的生物体的Cpf1：链球菌属、弯曲杆菌属、Nitratifractor、葡萄球菌属、细小棒菌属、罗氏菌属、奈瑟氏菌属、葡糖醋杆菌属、固氮螺菌属、Sphaerochaeta、乳酸杆菌属、真细菌属、棒状杆菌属、肉杆菌属、红细菌属、李斯特菌属、帕鲁迪菌属、梭菌属、毛螺菌科、Clostridiaridium、纤毛菌属、弗朗西丝氏菌属、军团杆菌属、脂环酸芽孢杆菌属、甲烷嗜甲基菌、卟啉单胞菌属、普雷沃菌属、拟杆菌门、创伤球菌属、钩端螺旋体属、脱硫弧菌属、脱硫盐碱杆菌属、丰祐菌科、肿块芽孢杆菌属、芽孢杆菌属、短芽孢杆菌属、甲基杆菌属或氨基酸球菌属，其中第一片段和第二片段并非来自相同细菌；例如，包含第一片段和第二片段的嵌合效应蛋白，其中第一片段和第二片段中的每个选自下项的Cpf1：变异链球菌、无乳链球菌、似马链球菌、血链球菌、肺炎链球菌；空肠弯曲杆菌(C.jejuni)、大肠弯曲杆菌；N.salsuginis、N.tergarcus；耳葡萄球菌(S.auricularis)、肉葡萄球菌(S.carnosus)；脑膜炎奈瑟氏菌(N.meningitides)、淋病奈瑟氏菌(N.gonorrhoeae)；单核增生李斯特菌、伊氏李斯特菌(L.ivanovii)；肉毒梭菌、艰难梭菌、破伤风梭菌、索氏梭菌；土拉热弗朗西丝氏菌1、易北普雷沃菌(Prevotellaalbensis)、毛螺菌科细菌MC2017 1、解朊丁酸弧菌(Butyrivibrio proteoclasticus)、佩莱格里尼菌科细菌(Peregrinibacteria bacterium)GW2011_GWA2_33_10、Parcubacteria细菌GW2011_GWC2_44_17、密斯氏菌属(Smithella)物种SCADC、氨基酸球菌属物种BV3L6、毛螺菌科细菌MA2020、暂定的白蚁甲烷枝原体(Candidatus Methanoplasma termitum)、挑剔真细菌(Eubacterium eligens)、牛莫拉氏菌(Moraxella bovoculi)237、牛莫拉氏菌AAX08_00205、牛莫拉氏菌AAX11_00205、丁酸弧菌属物种NC3005、硫微螺菌属物种XS5、稻田钩端螺旋体(Leptospira inadai)、毛螺菌科细菌ND2006、狗口腔卟啉单胞菌(Porphyromonas crevioricanis)3、解糖胨普雷沃菌和猕猴卟啉单胞菌(Porphyromonasmacacae)，其中第一片段和第二片段并非来自相同细菌。在特定实施例中，Cpf1来自选自以下的生物体：氨基酸球菌属物种BV3L6、硫微螺菌属物种XS5、牛莫拉氏菌AAX08_00205、牛莫拉氏菌AAX11_00205、和毛螺菌科细菌MA2020。

在本发明的优选实施例中，效应蛋白来源于Cpf1座位(本文此类效应蛋白也称之为“Cpf1p”)，例如Cpf1蛋白(并且此类效应蛋白或Cpf1蛋白或来源于Cpf1座位的蛋白质也称之为“CRISPR酶”)。Cpf1座位包括但不限于选自以下属的细菌物种的Cpf1座位：土拉热弗朗西丝氏菌1、易北普雷沃菌、毛螺菌科细菌MC2017 1、解朊丁酸弧菌、佩莱格里尼菌科细菌GW2011_GWA2_33_10、Parcubacteria细菌GW2011_GWC2_44_17、密斯氏菌属物种SCADC、氨基酸球菌属物种BV3L6、毛螺菌科细菌MA2020、暂定的白蚁甲烷枝原体、挑剔真细菌、牛莫拉氏菌237、牛莫拉氏菌AAX08_00205、牛莫拉氏菌AAX11_00205、丁酸弧菌属物种NC3005、硫微螺菌属物种XS5、稻田钩端螺旋体、毛螺菌科细菌ND2006、狗口腔卟啉单胞菌3、解糖胨普雷沃菌和猕猴卟啉单胞菌。在某些实施例中，Cpf1p来源于选自以下属的细菌物种：氨基酸球菌属物种BV3L6、毛螺菌科细菌ND2006、毛螺菌科细菌MA2020、牛莫拉氏菌AAX08_00205、牛莫拉氏菌AAX11_00205、丁酸弧菌属物种NC3005、或硫微螺菌属物种XS5。在某些实施例中，Cpf1p来源于选自氨基酸球菌属物种BV3L6或毛螺菌科细菌ND2006的细菌物种。在某些实施例中，效应蛋白来源于土拉热弗朗西丝氏菌1的亚种，包括但不限于土拉热弗朗西丝氏菌新杀手(Novicida)亚种。

在本发明的另外的实施例中，原型间隔区邻近基序(PAM)或PAM-样基序引导效应蛋白复合物与目的靶座位的结合。在本发明的一个优选实施例中，PAM是5'TTN，其中N是A/C/G或T并且效应蛋白是野生型FnCpf1p。在本发明的另一个优选实施例中，PAM是5'TTTV，其中V是A/C或G并且效应蛋白是野生型AsCpf1、野生型LbCpf1或野生型PaCpf1p。在某些实施例中，PAM是5'TTN，其中N是A/C/G或T，效应蛋白是野生型FnCpf1p，并且PAM位于原型间隔区的5'端的上游。在本发明的某些实施例中，PAM是5'CTA，其中效应蛋白是野生型FnCpf1p，并且PAM位于原型间隔区或靶座位的5'端的上游。在优选实施例中，本发明提供了一种用于RNA指导的基因组编辑核酸酶的扩大的靶向范围，其中Cpf1家族的富含T的PAM允许对富含AT基因组的靶向和编辑。

在某些实施例中，CRISPR酶被工程化并且可以包含降低或消除核酸酶活性的一个或多个突变。FnCpf1p RuvC结构域中的氨基酸位置包括但不限于D917A、E1006A、E1028A、D1227A、D1255A、N1257A、D917A、E1006A、E1028A、D1227A、D1255A和N1257A。申请人还鉴定了与PD-(D/E)XK核酸酶超家族和HincII内切核酸酶样最类似的推定的第二核酸酶结构域。在此推定的核酸酶结构域中产生的大幅度降低核酸酶活性的点突变包括但不限于N580A、N584A、T587A、W609A、D610A、K613A、E614A、D616A、K624A、D625A、K627A和Y629A。在一个优选实施例中，FnCpf1p RuvC结构域中的突变是D917A或E1006A，其中D917A或E1006A突变使FnCpf1效应蛋白的DNA切割活性完全失活。在另一个实施例中，FnCpf1p RuvC结构域中的突变是D1255A，其中突变的FnCpf1效应蛋白具有明显降低的核溶解活性。

突变还可以在邻近残基处，例如在靠近以上指出的参与核酸酶活性的那些的氨基酸处形成。在一些实施例中，仅RuvC结构域是失活的，并且在其他实施例中，另一推定的核酸酶结构域是失活的，其中效应蛋白复合物充当切口酶并且仅切割一条DNA链。在一个优选实施例中，其他推定的核酸酶结构域是HincII样内切核酸酶结构域。在一些实施例中，使用两种FnCpf1变体(各自不同的切口酶)来增加特异性，使用两种切口酶变体来切割靶标处的DNA(其中两种切口酶切割DNA链，同时使脱靶修饰最小化或消除，其中仅一条DNA链被切割并且随后进行修复)。在优选实施例中，Cpf1效应蛋白以包含两个Cpf1效应蛋白分子的同源二聚体形式切割与目的靶座位相关联的或在该靶座位处的序列。在一个优选实施例中，同源二聚体可以包含在其对应RuvC结构域中含有不同的突变的两个Cpf1效应蛋白分子。

本发明涵盖使用两种或更多种切口酶的方法，具体地双或双重切口酶方法。在一些方面和实施例中，可以递送单一类型的Cpf1切口酶，例如如本文所述的修饰的Cpf1或修饰的Cpf1切口酶。这使得靶DNA由两种Cpf1切口酶结合。此外，还设想的是可以使用不同的直向同源物，例如DNA的一条链(例如编码链)上的Cpf1切口酶和非编码或相反DNA链上的直向同源物。直向同源物可以是但不限于Cas9切口酶例如SaCas9切口酶或SpCas9切口酶。可能有利的是使用需要不同PAM并且还可以具有不同指导要求的两种不同的直向同源物，由此允许使用者的更大程度的控制。在某些实施例中，DNA切割涉及至少四种类型的切口酶，其中每种类型被指导到不同的靶DNA序列，其中每对在一个DNA链中引入第一切口并且第二对在第二条DNA链中引入切口。在此类方法中，至少两对单链断裂被引入到靶DNA中，其中在引入第一对单链断裂和第二对单链断裂后，第一对单链断裂与第二对单链断裂之间的靶序列被切断。在某些实施例中，直向同源物中的一者或两者是可控的，例如是诱导型。

在本发明的某些实施例中，指导RNA或成熟crRNA包含同向重复序列和指导序列或间隔区序列、基本上由或由同向重复序列和指导序列或间隔区序列组成。在某些实施例中，指导RNA或成熟crRNA包含连接至指导序列或间隔区序列的同向重复序列、基本上由或由该同向重复序列组成。在某些实施例中，指导RNA或成熟crRNA包含19个核苷酸的部分同向重复序列，接着是23-25个核苷酸的指导序列或间隔区序列。在某些实施例中，效应蛋白是FnCpf1效应蛋白并且需要至少16个核苷酸的指导序列以实现可检测的DNA切割并且需要最小17个核苷酸的指导序列以实现有效的体外DNA切割。在某些实施例中，同向重复序列位于指导序列或间隔区序列的上游(即5’)。在一个优选的实施例中，指导RNA的种子序列(即为识别和/或杂交于靶座位处的序列所必不可少的序列)大约在指导序列或间隔区序列的5'端上的前5个核苷酸之内。

在本发明的优选实施例中，成熟crRNA包括茎环或优化的茎环结构或优化的二级结构。在优选实施例中，成熟crRNA在同向重复序列中包括茎环或优化的茎环结构，其中茎环或优化的茎环结构对切割活性是重要的。在某些实施例中，成熟crRNA优选包括单一茎环。在某些实施例中，同向重复序列优选包括单一茎环。在某些实施例中，效应蛋白复合物的切割活性通过引入影响茎环RNA双链体结构的突变来修饰。在优选实施例中，可以引入保持茎环的RNA双链体的突变，由此效应蛋白复合物的切割活性被保持。在其他优选实施例中，可以引入扰乱茎环的RNA双链体结构的突变，由此效应蛋白复合物的切割活性被完全废除。

在本文所述方法或组合物中的任一种中，本发明还提供了编码被密码子优化为在真核细胞或原核细胞中表达的效应蛋白的核苷酸序列。在本发明的一个实施例中，密码子优化的效应蛋白是FnCpf1p、AsCpf1p、或LbCpf1p并且是针对在真核细胞或生物体中的可操作性进行密码子优化，该真核细胞或生物体为例如如本文任何地方提到的此细胞或生物体，例如但不限于酵母细胞或哺乳动物细胞或生物体，包括小鼠细胞、大鼠细胞和人类细胞或非人类真核生物体，例如植物。

在本发明的某些实施例中，至少一个核定位信号(NLS)附接到编码Cpf1效应蛋白的核酸序列。在优选实施例中，至少一个或多个C末端或N末端的NLS被附接(并且因此一种或多种核酸分子编码Cpf1效应蛋白可以包括编码一个或多个NLS，使得表达的产物具有附接或连接的一个或多个NLS)。在一个优选实施例中，C末端的NLS被附接以用于真核细胞优选人类细胞中的最佳表达和核靶向。在某些实施例中，NLS序列与编码Cpf1效应蛋白的核酸序列是异源的。在一个优选实施例中，密码子优化的效应蛋白是FnCpf1p并且指导RNA的间隔区长度为从15至35个核苷酸。在某些实施例中，指导RNA的间隔区长度为至少16个核苷酸，例如至少17个核苷酸。在某些实施例中，间隔区长度为从15至17个核苷酸、从17至20个核苷酸、从20至24个核苷酸，例如20、21、22、23或24个核苷酸、从23至25个核苷酸，例如23、24或25个核苷酸、从24至27个核苷酸、从27-30个核苷酸、从30-35个核苷酸或35个核苷酸或更长。在本发明的某些实施例中，密码子优化的效应蛋白是FnCpf1p并且指导RNA的同向重复序列长度为至少16个核苷酸。在某些实施例中，密码子优化的效应蛋白是FnCpf1p并且指导RNA的同向重复序列长度为从16至20个核苷酸，例如16、17、18、19或20个核苷酸。在某些优选实施例中，指导RNA的同向重复长度为19个核苷酸。

本发明还涵盖用于递送多个核酸组分的方法，其中每个核酸组分对不同的目的靶座位具有特异性，从而修饰多个目的靶座位。复合物的核酸组分可以包含一个或多个蛋白质结合的RNA适配体。一个或多个适配体可以能够结合噬菌体外壳蛋白。噬菌体外壳蛋白可以选自下组，该组包括Qβ、F2、GA、fr、JP501、MS2、M12、R17、BZ13、JP34、JP500、KU1、M11、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、φCb5、φCb8r、φCb12r、φCb23r、7s和PRR1。在一个优选实施例中，噬菌体外壳蛋白是MS2。本发明还提供了复合物的核酸组分，该核酸组分的长度为30或更多个、40或更多个、或50或更多个核苷酸。

因此，本发明的目的在于，在本发明内不涵盖任何先前已知的产品、制备该产品的过程或使用该产品的方法，使得申请人保留和在此披露放弃任何先前已知的产品、过程或方法的权利。进一步指出的是，在本发明的范围之内，本发明并非旨在涵盖任何产品、过程或该产品的制备或使用该产品的方法，其不符合USPTO(35U.S.C.§112，第一段)或EPO(EPC第83条)的书面说明和实施要求，使得申请人保留和在此披露放弃任何先前所述的产品、制备该产品的过程或使用该产品的方法的权利。可能有利的是在本发明实践中遵照EPC第53条(c)和EPC规则28(b)和(c)。本文没有任何东西被解释为约定的。

指出的是，在本披露中并且特别是在本权利要求书和/或段落中，术语例如“包括(comprises)”、“包括(comprised)”、“包括(comprising)”等可以具有在美国专利法中属于它的含义；例如，它们可以意指“包括(includes)”、“包括(included)”、“包括(including)”等；并且这些术语例如“基本上由……组成(consisting essentially of)”和“基本上由……组成(consists essentially of)”具有在美国专利法中归于它们的含义。

这些和其他实施例披露于以下详细说明中或根据其是清楚的并且由其涵盖。

附图说明

本发明的新颖特征在所附权利要求书中具体阐述。通过参考对说明性实施例进行阐述的以下详细说明，将获得对本发明的特征和优点的更好理解，在所述实施例中利用了本发明的原理，并且在所述附图中：

图1.在PI(PAM相互作用)和REC1结构域中具有PAM近端区域(以黄色表示)的氨基酸球菌属物种BV3L6(AsCpf1)的示意性Cpf1结构。

图2A-2C.用于鉴定由Cpf1突变体识别的替代PAM序列的方法。

图3A-3C.A.Cpf1文库制备；B：诱变筛选概述；C：测序文库制备。

图4A-4B.使用wt AsCpf1验证PAM筛选。A.用于含有指示PAM序列的克隆的cam/amp培养基中的菌落生长。B.对于含有指示的PAM序列的克隆的cam/apm培养基中的菌落生长。C.条形图显示野生型AsCpf1对PAM中的取代突变的敏感性。

图5A-5B.表示个体AsCpf1突变体。每个点代表一个特定的点突变。多余突变分开显示。A：对照；pUC19rep1和pUC19rep2是不含PAM序列的pUC19质粒的重复；B：pUC19rep1(无PAM)对比由野生型AsCpf1(TTTC)识别的PAM。

图6.表示个体AsCpf1突变体。每个点代表一个特定的点突变。多余突变分开显示。结果显示指示的PAM序列对比pUC19对照(即没有PAM)。

图7A-7B.AsCpf1突变体S542R识别PAM序列TCCC。

图8A-8B.AsCpf1突变体S542R识别PAM序列TTCC。

图9A-9F.不同的AsCpf1突变体K548识别PAM序列TATC。A/B：AsCpf1突变体K548A；C：AsCpf1突变体K548G；D：AsCpf1突变体K548L；E：AsCpf1突变体K548R；F：环绕的AsCpf1突变体K548突变体均识别PAM序列TATC(K548突变为Ala、Arg、Gly、Leu、Ile、Asn、Cys、Gln、His、Phe、Ser、Thr、Trp、Tyr、Val)。

图10.不同的AsCpf1突变体K548识别PAM序列TGTC；环绕的AsCpf1突变体K548突变体均识别PAM序列TGTC(K548突变为Arg、Gly、Cys、Gln、His、Ser、Thr、Trp、Tyr、Val)。

图11A-11E.显示具有截短指导物的AsCpf1和LbCpf1的Cpf1靶核酸酶活性。图11A提供了关于图B-D中描绘的指导物长度的关键。图11B描绘了具有靶向DNMT1-3的截短指导物的AsCpf1活性。图11C描绘了具有靶向DNMT1-4的截短指导物的AsCpf1活性。图11D描绘了具有靶向DNMT1-3的截短指导物的LbCpf1活性。图11E描绘了具有靶向DNMT1-4的截短指导物的AsCpf1活性。

图12A-12E.显示具有部分结合指导物的AsCpf1和LbCpf1的Cpf1靶核酸酶活性。所有指导物的长度均为24nt，与靶标(范围从24nt至14nt)相匹配。图12A提供了关于图B-D中描绘的部分结合指导物的关键。图12B描绘了具有靶向DNMT1-3的部分匹配指导物的AsCpf1活性。图12C描绘了具有靶向DNMT1-4的部分匹配指导物的AsCpf1活性。图12D描绘了具有靶向DNMT1-3的部分匹配指导物的LbCpf1活性。图12E描绘了具有靶向DNMT1-4的部分匹配指导物的AsCpf1活性。

图13A-13D.体外切割测定。AsCpf1 PAM突变体S542R/K607R在体外具有改变的PAM特异性A.所有耗尽的读数；B.如在体外切割测定中所确定的，滤出TNTN的耗尽的读数；C.人类基因组中Cpf1变体的靶向范围，包括WT(深蓝色)、S542R/K607R(黄色)和S542R/K548V/N552R(浅黄色)。百分比表示由相应的PAM表示的所有非重复指导序列(顶部和底部链)的比例；D.TTTV PAM(深蓝色)和所有可由任何变体(黄色)切割的PAM的人类基因组的非重复区域中最近靶位点之间的距离。

图14A-14D.在HEK293细胞中验证AsCpf1 PAM突变体。针对所示的Cpf1突变体和所示靶基因的所示PAM序列测定的％indel。所示的PAM位点后面的数字表示不同的靶序列(例如TGTG-48)和给定靶序列的不同转染(例如TGTG-48.2)。表达AsCpf1(WT或突变体)的质粒和表达AsCpf1DR+间隔区的质粒的共转染。转染后3天靶向基因组座位的靶向深度测序。

图15A-15D.A.TATV靶位点处的S542R/K548V/N552R变体的活性；B.TYCV位点处的S542R/K607变体的活性；C.TYCV和CCCC靶位点处的S542R/K607R变体的活性和TTTV靶位点处的S542R/K548V变体的活性；D.VYCV位点处的S542R/K607R变体活性。在HEK293细胞中测量所有indel百分比。

图16.在HEK293细胞中验证AsCpf1 PAM突变体S542R/K607R。针对Cpf1突变体和各种靶基因的63个不同靶位点的所示PAM序列测定的％indel。表达AsCpf1(WT或突变体)的质粒和表达AsCpf1DR+间隔区的质粒的共转染。转染后3天靶向基因组座位的靶向深度测序。

图17.AsCpf1(氨基酸球菌属物种BV3L6)和LbCpf1(毛螺菌科细菌ND2006)的蛋白质比对。

图18A-18D.根据本发明的一个实施例的编码突变体Cpf1的示例性表达质粒。(A)编码AsCpf1突变体S542R/K607R的pY036的质粒图谱。(B)pY036的核苷酸序列和特征。(C)编码AsCpf1突变体S542R/K607R的pcDNA的质粒图谱。功能特征在各自的图谱和序列上指示。(D)编码AsCpf1突变体S542R/K607R的pcDNA-hAsCpf1的核苷酸序列和特征。

图19A-19D.基于细菌干扰的阴性选择筛选鉴定AsCpf1(其在非规范PAM处赋予活性)的氨基酸取代。(A)与crRNA和靶DNA复合的AsCpf1(PDB ID：5B43)的晶体结构，突出显示选择用于诱变的PAM核苷酸(品红色)和PAM近端残基(蓝色)。(B)用于鉴定具有改变的PAM特异性的变体的细菌干扰测定的示意图。(C)如通过细菌干扰测量的野生型AsCpf1对PAM中的取代突变的敏感性。(D)屏幕读数的散点图，突出显示耗尽的变体。每个点代表野生型或突变型密码子。虚线指示15倍耗尽。

图20A-20F.具有改变的PAM特异性的AsCpf1变体的构建和表征。(A)组合诱变鉴定了在HEK293T细胞中用TYCV和TATV PAM切割靶位点的AsCpf1变体，其中Y＝C或T，并且V＝A、C或G(参见图22)。(B)用于确定总体PAM特异性的体外切割测定的示意图(还参见图23和24)。(C)野生型(WT)、S542R/K607R(RR)和S542R/K548V/N552R(RVR)变体的最快速切割的PAM的Web标识。(D)WT和变体的所有4-碱基PAM的标准化切割速率。由于可忽略不计的切割，未显示NNRN PAM。最具活性的PAM用红色加框表示。(E)在HEK293T细胞中不同组的靶位点处的WT、RR和RVR在其优选的PAM处的活性的比较(还参见图26)。对于indel数据，每个点代表三次重复的平均值，并且红线表示每个组内的总体平均值。对于倍数改进，每个点代表相应的indel重复的平均值的比率。n.s.p>0.05(Mann-Whitney)；*p<0.05(Mann-Whitney)；****p<0.0001(Wilcoxon符号秩)。(F)人类基因组和编码序列中AsCpf1变体的靶向范围(还参见图28)。图显示到最近的切割位点的距离(以碱基对为单位)的概率质量函数。箱形图表示中位数和四分位数间距。在该分析中忽略了含有N或掩蔽的重复序列的基因组区域。

图21A-21D.AsCpf1 PAM变体的DNA靶向特异性。A.HEK293细胞中的4个靶位点(VEGFA、GRIN2B、EMX1和DNMT1)的DNA双链断裂原位标记和测序(BLISS)。每10⁵次读数的log₁₀双链断裂(DSB)末端用品红色热图表示，并且21D中体外切割测定的相对PAM切割速率用蓝色热图表示。该指导物的最后三个碱基(碱基21-23)中的错配是灰色的，因为它们对切割效率的影响最小。B.用已知的TTTV脱靶位点评估RPL32P3基因中的另外的靶位点，证明PAM偏好对脱靶活性的贡献。C.添加K949A突变改善了WT和变体两者的特异性(还参见图29)。D.有和没有K949A的RR和RVR变体的中靶效率。每个点代表三次重复的平均值。

图22A-22B.评估(A)单个氨基酸突变和(B)组合突变体以构建AsCpf1RVR变体，该变体在具有TATV PAM的靶位点处具有活性(还参见图20A)。

图23A-23C.在(A)WT AsCpf1、(B)S542R/K607R、和(B)S542R/K548V/N552R的每个体外切割时间点处的4⁸个PAM(NNNNNNNN)的丰度的直方图(还参见图20B-D)。每个直方图的颜色表示经过的时间。用于使直方图居中的NNNNVRRT序列以黑色显示。

图24.用于体外切割测定的数据处理渠道用于图20D。

图25A-25B.(A)WT AsCpf1与具有含有胞嘧啶的PAM的靶位点处的RR变体的活性比较。(B)RR变体在TYCV和VYCV位点(V＝A、C或G)处的活性，证明在许多情况下PAM序列中5'T的存在是任选的(即，NYCV PAM可以被识别)。TYCV位点的数据与(A)中所示的相同。在HEK293T细胞中测量所有indel百分比。

图26A-26C.HEK293T细胞中具有高活性PAM的靶位点处的(A)WT AsCpf1、(B)RR变体、和(C)RVR变体的活性。图20E汇总显示了这些数据。对于AsCpf1RR变体，图20E中未包括三个CCCC位点。

图27A-27C.小鼠Neuro2a细胞中TYCV位点处的AsCpf1RR变体的编辑效率。(A)小鼠PCSK9座位的图。灰色框表示编码序列。(B)在具有TYCV PAM的PCSK9靶位点处由RR变体产生的indel百分比。(C)具有最高编辑效率的靶位点(#2)处的代表性indel。红色三角形代表顶部链上的推定的切割位点。

图28A-28C.(A)Cpf1和Cas9的靶向范围的定义(还参见图20F)。比较(B)人类基因组和(C)编码序列中Cpf1(+RR和RVR变体)与Cas9(+VQR和VRER变体)的靶向范围。图显示到最近的切割位点的距离(以碱基对为单位)的概率质量函数。箱形图表示中位数和四分位数间距。在该分析中忽略了含有N或掩蔽的重复序列的基因组区域。

图29.AsCpf1的特异性诱变。(还参见图21C)。残基与DNA链的相互作用或推定的相互作用的丙氨酸扫描。选择K949A作为增强AsCpf1特异性的候选物。Lys949是桥螺旋的一部分。

图30A-30B.Cpf1直向同源物的序列保守性。(A)43个Cpf1或推定的Cpf1直向同源物的序列比对，突出显示REC1、WED-II和PI结构域，其含有选择用于诱变筛选的残基。Cpf1名称缩写遵循我们先前报道的惯例(Zetsche等人，Cell[细胞]2015)。(B)对应于AsCpf1(其赋予改变的PAM特异性)中突变残基的位置(绿色框)的放大图。红线表示在比对中插入一个或多个碱基，为清楚起见，省略了这些碱基。还参见表19。

图31A-31B.工程化LbCpf1的PAM识别。(A)AsCpf1(PBD ID：5B43)和LbCpf1(PDBID：5ID6)的晶体结构，突出显示经突变以改变PAM特异性的相应残基。针对LbCpf1显示的PAM双链体是模型。(B)HEK293T细胞中分别在TYCV和TATV位点处LbCpf1G532R/K595R和G532R/K538V/Y542R的活性。每个点代表三次重复的平均值，并且红线表示每个组内的总体平均值。AsCpf1的数据也出现在图20E中。n.s.p>0.05(Mann-Whitney)；****p<0.0001(Wilcoxon符号秩)。

图32A-32B.HEK293T细胞中具有优选的PAM的靶位点处的(A)LbCpf1RR变体和(B)LbCpf1RVR变体的活性。图31B汇总显示了这些数据。靶位点与图26B-C中所示的相同。对于RR变体，图31B中未包括三个CCCC位点。

具体实施方式

本申请描述了新型RNA指导的核酸内切酶(Cpf1效应蛋白)，其功能上不同于先前描述的CRISPR-Cas9系统。本文所述的Cpf1相关CRISPR阵列被加工为成熟crRNA而不需要附加tracrRNA。本文所述的crRNA包含间隔区序列(或指导序列)和同向重复序列并且Cpf1p-crRNA复合物本身足以有效地切割靶DNA。

总的来说，CRISPR系统特征在于在靶序列的位点处促进CRISPR复合物形成的元件(也称之为内源性CRISPR系统情况下的原型间隔区)。在形成CRISPR复合物的情况下，“靶序列”是指指导序列被设计为所靶向的序列，例如与其具有互补性的序列，其中靶序列与指导序列之间的杂交促进CRISPR复合物的形成。指导序列通过其而与靶序列互补对切割活性是重要的部分本文称之为种子序列。靶序列可包括任何多核苷酸，例如DNA多核苷酸并且包含在目的靶座位之内。在一些实施例中，靶序列位于细胞的细胞核或细胞质中。本文所述的本发明涵盖第2类CRISPR-Cas系统的新型效应蛋白，其中Cas9是示例性效应蛋白并且因此本申请中用于描述新型效应蛋白的术语可以与用于描述CRISPR-Cas9系统的术语相关。

CRISPR-Cas座位具有超过50种的基因家族并且不存在严格的通用基因。因此，单一进化树是不可行的并且需要多分支方法来鉴定新家族。到目前为止，针对93种Cas蛋白存在395种表达谱的全面cas基因鉴定。分类包括特征基因表达谱加上座位体系结构的特征。第1类包括多亚基crRNA-效应物复合物(Cascade)并且第2类包括单亚基crRNA-效应物复合物(Cas9样)。

CRISPR-Cas系统的作用通常分为三个阶段：(1)自适应或间隔区整合，(2)CRISPR座位初级转录物(前crRNA)的加工和包含间隔区和对应于CRISPR重复序列5'和3'片段的可变区的crRNA的成熟，以及(3)DNA(或RNA)干扰。大多数的已知CRISPR-Cas系统中存在的两种蛋白质Cas1和Cas2足以用于将间隔区插入到CRISPR盒中。这两种蛋白质形成为此自适应过程所需要的复合物；Cas1的内切核酸酶活性是为间隔区整合所需要的，而Cas2似乎执行非酶性功能。Cas1-Cas2复合物表示CRISPR-Cas的高度保守的“信息加工”模块，该模块似乎准自主(quasi-autonomous)于系统的其余部分。(参见Annotation and Classificationof CRISPR-Cas Systems[CRISPR-Cas系统的注释和分类].Makarova KS,KooninEV.Methods Mol Biol.[分子生物学方法]2015；1311:47-75)。

先前所述的第2类系统，即II型和推定的V型仅由cas操纵子中的三个或四个基因组成，即包括自适应模块(不参与干扰的cas1-cas2基因对)的cas1和cas2基因，负责干扰但还有助于前crRNA加工和自适应的单一多结构域效应蛋白，以及常常在至少一些II型系统中可有可无的具有不典型功能的第四基因(并且在一些情况下第四基因是cas4(生物化学或计算机模拟证据显示Cas4是具有三个半胱氨酸C末端簇的PD-(DE)xK超家族核酸酶；具有5'-ssDNA外切核酸酶活性)或编码失活的ATP酶的csn2)。在大多数情况下，CRISPR阵列和称为tracrRNA(反式编码小CRISPR RNA)的不同RNA种类的基因与第2类cas操纵子相邻。tracrRNA与对应CRISPR阵列内的重复序列部分同源并且是为前crRNA的加工所必需的，该加工由一种不与CRISPR-Cas座位相关联的普遍存在的细菌酶RNA酶III催化。

Cas1是大多数CRISPR-Cas系统中存在的最保守的蛋白质并且相比于其他Cas蛋白进化较慢。因此，Cas1系统发育已用作CRISPR-Cas系统分类的指南。生物化学或计算机模拟证据显示Cas1是金属依赖性的脱氧核糖核酸酶。大肠杆菌中Cas1的缺失使得对DNA损伤的敏感性增加并且使得染色体分离减弱，如在“A dual function of the CRISPR-Cassystemin bacterial antivirus immunity and DNA repair[CRISPR-Cas系统在细菌抗病毒免疫和DNA修复中的双重功能]”Babu M等人Mol Microbiol[分子微生物学]79:484-502(2011)中所述。生物化学或计算机模拟证据显示Cas 2是对富含U的区具有特异性的RNA酶并且是双链的DNA酶。

本发明的方面涉及与第2类CRISPR-Cas系统相关联的新型效应蛋白的鉴定和工程化。在一个优选实施例中，效应蛋白包含单亚基的效应物模块。在另一个实施例中，效应蛋白在原核细胞或真核细胞中具有功能以便用于体外、体内或离体应用。本发明的一个方面涵盖用于预测新的第2类CRISPR-Cas系统和鉴定其中组分的计算方法和算法。

在一个方面中，本发明涉及具有一个或多个影响PAM识别的突变的突变型Cpf1多肽。优选地，所述突变型Cpf1多肽别不被相应的野生型Cpf1识别的PAM序列。因此，在一个方面中，本发明涉及具有一个或多个突变的突变型Cpf1多肽，其中所述突变型Cpf1蛋白识别不被相应的野生型Cpf1识别的PAM序列。

如本文所用，术语“突变”具有其在本领域中的普通含义。作为进一步指导，突变可以包含点突变。可替代地，突变可包含插入一个或多个连续或非连续氨基酸。优选地，如本文所用的突变是或包含点突变，即一个或多个氨基酸被不同的氨基酸取代。在存在几个点突变的情况下，每个氨基酸可以被相同或不同的氨基酸取代。氨基酸取代可以是保守氨基酸取代或非保守氨基酸取代，如本文其他地方所述(例如保守取代，与非保守取代相反，包括属于同一组或子集的氨基酸的取代，例如疏水、极性氨基酸等。)。如本文所用，“突变型”Cpf1是指已被工程化以包括一个或多个突变的Cpf1。因此，突变型Cpf1是指非天然存在的或工程化的Cpf1，其中故意引入了一个或多个突变。因此，来源自特定起源或物种的突变型Cpf1与来自该起源或物种的天然存在的Cpf1不同。

根据本发明，突变型Cpf1包含一个或多个影响PAM识别的突变。这意味着与野生型(即未突变的)Cpf1相比，突变的Cpf1识别至少一种或多种不同的PAM序列，或突变的Cpf1识别至少一种或多种(基本上)不被相应的野生型Cpf1识别的PAM序列。在该上下文中相应的野生型Cpf1是指未突变的原始Cpf1，并且从中衍生出根据本发明的突变型Cpf1。应理解，根据本发明的突变型Cpf1可以识别或可以不识别由相应的野生型Cpf1识别的PAM序列。如果突变的Cpf1识别出由相应的野生型Cpf1所识别的PAM序列，则识别至少一种另外的PAM序列，其(基本上)不被相应的野生型Cpf1识别。因此，本发明涉及突变型Cpf1，其识别或能够识别(基本上)不被相应的野生型Cpf1识别的PAM序列。

如本文所用，术语“识别(recognized、recognizing或recognition)”在该上下文中是指Cpf1在与gRNA杂交(即与gRNA的指导序列杂交)并且侧翼为PAM序列的DNA靶位点处与gRNA形成功能性复合物的能力，并且其中该Cpf1能够发挥其天然功能，即DNA切割。在该上下文中，应注意这种DNA切割排除了Cpf1是催化失活的Cpf1。在例如灭活的Cpf1(例如无效的Cpf1)的情况下，如果存在所需的PAM序列，则可以在Cpf1、gRNA和同源靶标之间形成复合物，但是这样不会导致DNA切割。在该上下文中，需要注意的是，如果其同源PAM序列存在于靶序列附近，则根据本发明的突变型Cpf1能够形成功能性CRISPR-Cas复合物，而如果突变体Cpf1识别的同源PAM序列存在于靶序列附近，则相应的野生型Cpf1不能形成功能性CRISPR-Cas复合物。优选地，如果在体外切割测定中，基本上所有的DNA都被切割，即基本上100％的DNA被切割，例如至少60％、至少70％、至少80％、至少90％或至少95％的DNA被切割，则认为特定的PAM序列被Cpf1(例如如本文所述的根据本发明的突变型Cpf1)识别。类似地，例如在细菌生长测定中(参见图2)，其中细菌生长和/或存活取决于被特定Cpf1(突变体)识别的同源PAM序列的存在或不存在，如果与不存在PAM序列(或不存在靶序列、或不存在Cpf1、或不存在gRNA)的细菌生长相比基本上没有观察到细菌生长，例如基本上0％的细菌生长，例如至多40％的细菌生长、或至多30％的细菌生长、或至多20％的细菌生长、或至多10％的细菌生长、或至多5％的细菌生长，则认为特定的PAM序列被Cpf1(例如如本文所述的根据本发明的突变型Cpf1)识别。例如，可以在菌落测定中评估细菌生长，如本领域已知的。

在另外的方面中，本发明涉及突变型Cpf1多肽，其具有一个或多个突变并识别由除N以外的少于4个核苷酸组成的PAM，条件是所述突变型Cpf1不是突变型FnCpf1(新凶手弗朗西丝氏菌Cpf1，例如新凶手弗朗西丝氏菌U112Cpf1，例如如以下文献中所描述的FnCpf1：Zetsche等人(2015)Cell[细胞]；163(3):759-771)。N是A、T、G或C。在某些实施例中，根据本发明的突变型Cpf1蛋白识别由除N以外的3个核苷酸组成的PAM序列。在某些实施例中，根据本发明的突变型Cpf1蛋白识别由除N以外的2个核苷酸组成的PAM序列。在某些实施例中，根据本发明的突变型Cpf1蛋白识别由除N以外的1个核苷酸组成的PAM序列。在某些实施例中，根据本发明的突变型Cpf1蛋白不识别PAM序列(即不需要PAM序列来实现功能性)。在某些实施例中，根据本发明的突变型Cpf1蛋白识别由3个核苷酸组成的PAM序列。在某些实施例中，根据本发明的突变型Cpf1蛋白识别由2个核苷酸组成的PAM序列。在某些实施例中，根据本发明的突变型Cpf1蛋白识别由1个核苷酸组成的PAM序列。在某些实施例中，根据本发明的突变型Cpf1蛋白识别由除N以外的3个核苷酸组成的PAM序列。在某些实施例中，根据本发明的突变型Cpf1蛋白识别由4个核苷酸组成的PAM序列。在某些实施例中，根据本发明的突变型Cpf1蛋白识别由4个连续核苷酸组成的PAM序列。在某些实施例中，根据本发明的突变型Cpf1蛋白识别由除N以外的4个连续核苷酸组成的PAM序列。在某些实施例中，根据本发明的突变型Cpf1蛋白识别由除N以外的少于4个连续核苷酸组成的PAM序列。在某些实施例中，根据本发明的突变型Cpf1蛋白识别由除N以外的3个连续核苷酸组成的PAM序列。在某些实施例中，根据本发明的突变型Cpf1蛋白识别由除N以外的2个连续核苷酸组成的PAM序列。在某些实施例中，根据本发明的突变型Cpf1蛋白识别由3个连续核苷酸组成的PAM序列。在某些实施例中，根据本发明的突变型Cpf1蛋白识别由2个连续核苷酸组成的PAM序列。应当理解，识别具有少于4个核苷酸(无论是否包括N和/或是否是连续的核苷酸)的PAM序列的任何突变型Cpf1不是衍生自FnCpf1(即相应的野生型不是FnCpf1)。

在另外的方面中，本发明涉及突变型Cpf1多肽，例如AsCpf1，其识别具有或包含序列YCV的PAM。在另外的方面中，本发明涉及突变型Cpf1多肽，例如AsCpf1，其识别具有或包含序列TYCV的PAM。在另外的方面中，本发明涉及突变型Cpf1多肽，例如AsCpf1，其识别具有或包含序列VYCV的PAM。在另外的方面中，本发明涉及突变型Cpf1多肽，例如AsCpf1，其识别具有或包含序列NYCV的PAM。在另外的方面中，本发明涉及识别具有或包含序列RYN的PAM的突变型Cpf1多肽。在另外的方面中，本发明涉及识别具有或包含序列YCN的PAM的突变型Cpf1多肽。在另外的方面中，本发明涉及识别具有或包含序列RCN的PAM的突变型Cpf1多肽。在另外的方面中，本发明涉及识别具有或包含序列AYV的PAM的突变型Cpf1多肽。在另外的方面中，本发明涉及识别具有或包含序列TYV的PAM的突变型Cpf1多肽。在另外的方面中，本发明涉及识别具有或包含序列TNYC或TNYS的PAM的突变型Cpf1多肽，条件是所述PAM不是TTTV或TTTC或者条件是所述PAM不是TTTN。N是A、C、T、或G。V是A、C、或G。Y是C或T。S是C或G。在某些实施例中，突变型Cpf1多肽识别具有或包含序列YCV、TYCV、VYCV、YCN、RCN、AYV、TYV、RYN、TGYV、TYTV、TYCT、TYCC、TRTC、TATV、NTTV、TTV、TSTG、TVTS、TYYS、TCYS、TBYS、TCYS、TVYS、TNYS、TYYS、TNTN、TSTG、TTCC、TCCC、TATC、TACT、AATA、TGTC、TRYV、RYH、TGTG、TCTG、NTTN、TTN、TRTN、TCN、TCTC、TYCN、TTCN、TCCN、或TATN的PAM。在这方面，在一个实施例中，所述PAM不是TTTV、TTTC、或TCTG。在另外的实施例中，所述PAM不是TCTG。在另外的实施例中，所述PAM不是TCTC。N是A、C、T、或G。V是A、C、或G。Y是C或T。R是A或G、S是C或G、B是C或T或G、W是A或T、R是A或G、K是G或T、M是A或C、D是A或G或T、H是A或C或T。在上述实施例中的某些中，所述Cpf1是AsCpf1。在某些实施例中，突变型Cpf1多肽识别具有或包含序列TYCC或TRTC的PAM。Y是C或T。R是A或G。在某些实施例中，所述突变型Cpf1是突变型AsCpf1，其识别具有或包含序列TNYC或TNYS的PAM，条件是所述PAM不是TTTV和/或TTTC和/或TCTG和/或TCTC。N是A、C、T、或G。V是A、C、或G。Y是C或T。在某些实施例中，突变型Cpf1是突变型AsCpf1，其识别具有或包含序列YCN、RCN、YCV、TYCV、VYCV、RYN、TYCC、TRTC、TATV、NTTV、TTV、TSTG、TVTS、TVYS、TYYS、TCYS、TBYS、TCYS、TNYS、TYYS、TNTN、TSTG、TTCC、TCCC、TATC、TGTG、TCTG、TYTV、TYCT、NTTN、TTN、TRTN、TCN、TCTC、TYCN、TTCN、TCCN、或TATN的PAM。N是A、C、T、或G。V是A、C、或G。Y是C或T。R是A或G。在某些实施例中，突变型Cpf1是AsCpf1，其识别具有或包含序列YCN、RCN、YCV、TYCV、VYCV、RYN、TYTV、TYCT、TYCC、TRTC、TSTG、TVTS、TYYS、TCYS、TBYS、TCYS、TNYS、TYYS、TNTN、TVYS、TSTG、TTCC、TCCC、TATC、TGTG、TCTG、NTTN、TTN、TRTN、TCN、TCTC、TYCN、TTCN、TCCN、或TATN的PAM。Y是C或T。R是A或G。

应当理解，当提及PAM序列长度时，这种情况可包括或不包括随机核苷酸(即“N”)。例如，由4个核苷酸组成的PAM序列可包括一个或多个随机核苷酸，其可以是内部的(例如TNCC、TCNC等)或侧翼核苷酸(NTCC、TCCN等)。然而，如果功能识别需要4个核苷酸的存在，则这种PAM可以被认为是由4个核苷酸组成，尽管一个或多个核苷酸是随机的。或者，侧翼随机核苷酸(特别是5'侧翼随机核苷酸)(即“N”)可以被认为是不相关的(例如PAM序列NYCV可以被认为是YCV)，因此也可以认为落入具有小于4个核苷酸的PAM序列的定义中。

在一个方面中，本发明涉及突变型Cpf1，例如如上所述的突变型Cpf1，其中所述突变型Cpf1包含位置539、542、547、548、550、551、552、167、604、或607处的一个或多个突变型氨基酸残基，或者AsCpf1的位置539、542、547、548、550、551、552、或607，或AsCpf1直向同源物(来自不同物种的相应效应物)、同源物(具有相同功能的效应物，来自相同或不同的物种)、或变体(例如，如本文其他地方描述的任何另外修饰的Cpf1，包括截短的Cpf1)的相应位置处的一个或多个突变型氨基酸残基。在整个说明书中提及AsCpf1的特定氨基酸残基优选涉及氨基酸球菌属物种BV3L6Cpf1。在整个说明书中提及LbCpf1的特定氨基酸残基优选涉及毛螺菌科细菌ND2006Cpf1。同源物和直向同源物可以通过本领域已知的技术鉴定，例如序列比对，也如本文其他地方所述。在某些实施例中，所述突变型Cpf1是AsCpf1，其包含位置539、542、547、548、550、551、552、167、604、或607处的一个或多个突变型氨基酸残基；或者位置539、542、547、548、550、551、552、或607处的一个或多个突变型氨基酸残基。在一个方面中，本发明涉及突变型Cpf1，例如如上所述突变型Cpf1，其中所述突变型Cpf1包含位置542和607处的一个或多个突变型氨基酸残基，或AsCpf1的位置542和607或者AsCpf1直向同源物(来自不同物种的相应效应物)、同源物(具有相同功能的效应物，来自相同或不同的物种)、或变体(例如，如本文其他地方描述的任何另外修饰的Cpf1，包括截短的Cpf1)的相应位置处的一个或多个突变型氨基酸残基。同源物和直向同源物可以通过本领域已知的技术鉴定，例如序列比对，也如本文其他地方所述。在某些实施例中，所述突变型Cpf1是AsCpf1，其包含位置542和607处的一个或多个突变型氨基酸残基；或位置542和607处的一个或多个突变型氨基酸残基。在一个方面中，本发明涉及突变型Cpf1，例如如上所述突变型Cpf1，其中所述突变型Cpf1包含位置542和548(以及任选地552)处的一个或多个突变型氨基酸残基，或AsCpf1的位置542和548(以及任选地552)或者AsCpf1直向同源物(来自不同物种的相应效应物)、同源物(具有相同功能的效应物，来自相同或不同的物种)、或变体(例如，如本文其他地方描述的任何另外修饰的Cpf1，包括截短的Cpf1)的相应位置处的一个或多个突变型氨基酸残基。同源物和直向同源物可以通过本领域已知的技术鉴定，例如序列比对，也如本文其他地方所述。在某些实施例中，所述突变型Cpf1是AsCpf1，其包含位置542和548(以及任选地552)处的一个或多个突变型氨基酸残基；或位置542和548(以及任选地552)处的一个或多个突变型氨基酸残基。在某些实施例中，所述突变型Cpf1包含AsCpf1的位置542或548处(在某些实施例中，位置542和548两者处)，或AsCpf1直向同源物(来自不同物种的相应效应物)、同源物(具有相同功能的效应物，来自相同或不同的物种)、或变体(例如，如本文其他地方描述的任何另外修饰的Cpf1，包括截短的Cpf1)的相应位置处的一个或多个突变型氨基酸残基。在某些实施例中，所述突变型Cpf1是AsCpf1，其包含位置542或548处(在某些实施例中，位置542和548两者处)的一个或多个突变型氨基酸残基。在某些实施例中，所述突变型Cpf1包含AsCpf1的位置S542、N547、K548、K550、N551、N552、T167、M604、或K607处，或AsCpf1直向同源物(来自不同物种的相应效应物)、同源物(具有相同功能的效应物，来自相同或不同的物种)、或变体(例如，如本文其他地方描述的任何另外修饰的Cpf1，包括截短的Cpf1)的相应位置处的一个或多个突变型氨基酸残基。在某些实施例中，所述突变型Cpf1是AsCpf1，其包含位置S542、N547、K548、K550、N551、N552、T167、M604、或K607处的一个或多个突变型氨基酸残基。在某些实施例中，所述突变型Cpf1包含AsCpf1的位置S542或K548处(在某些实施例中，这两个位置处)，或AsCpf1直向同源物(来自不同物种的相应效应物)、同源物(具有相同功能的效应物，来自相同或不同的物种)、或变体(例如，如本文其他地方描述的任何另外修饰的Cpf1，包括截短的Cpf1)的相应位置处的一个或多个突变型氨基酸残基。在某些实施例中，所述突变型Cpf1是AsCpf1，其包含位置S542或K548处(在某些实施例中，这两个位置处)的一个或多个突变型氨基酸残基。在某些实施例中，所述突变型Cpf1包含AsCpf1的位置S542或K607处(在某些实施例中，这两个位置处)，或AsCpf1直向同源物(来自不同物种的相应效应物)、同源物(具有相同功能的效应物，来自相同或不同的物种)、或变体(例如，如本文其他地方描述的任何另外修饰的Cpf1，包括截短的Cpf1)的相应位置处的一个或多个突变型氨基酸残基。在某些实施例中，所述突变型Cpf1是AsCpf1，其包含位置S542或K607处(在某些实施例中，这两个位置处)的一个或多个突变型氨基酸残基。在某些实施例中，所述突变型Cpf1包含AsCpf1的位置S542或K548(以及任选地N552)处(在某些实施例中，这两个位置处)，或AsCpf1直向同源物(来自不同物种的相应效应物)、同源物(具有相同功能的效应物，来自相同或不同的物种)、或变体(例如，如本文其他地方描述的任何另外修饰的Cpf1，包括截短的Cpf1)的相应位置处的一个或多个突变型氨基酸残基。在某些实施例中，所述突变型Cpf1是AsCpf1，其包含位置S542或K548(以及任选地N552)处(在某些实施例中，这两个位置处)的一个或多个突变型氨基酸残基。

在某些实施例中，所述突变型Cpf1包含如下AsCpf1的突变型氨基酸残基542R、547K、548M、548A、548G、548L、548R、548I、548N、548C、K548Q、548H、548F、548S、548T、548W、548Y、548V、550Y、551R、552G、552K、552R、552S、552T、167A、604A、或607A，或者AsCpf1直向同源物(来自不同物种的相应效应物)、同源物(具有相同功能的效应物，来自相同或不同的物种)、或变体(例如，如本文其他地方描述的任何另外修饰的Cpf1，包括截短的Cpf1)的相应残基中的一种或多种。在某些实施例中，所述突变型Cpf1是AsCpf1，其包含如下突变型氨基酸残基542R、547K、548M、548A、548G、548L、548R、548I、548N、548C、K548Q、548H、548F、548S、548T、548W、548Y、548V、550Y、551R、552G、552K、552R、552S、552T、167A、604A、或607A中的一种或多种。在某些实施例中，所述突变型Cpf1包含如下AsCpf1的突变型氨基酸残基542R、548M、548A、548G、548L、548R、548I、548N、548C、K548Q、548H、548F、548S、548T、548W、548Y、或548V，或者AsCpf1直向同源物(来自不同物种的相应效应物)、同源物(具有相同功能的效应物，来自相同或不同的物种)、或变体(例如，如本文其他地方描述的任何另外修饰的Cpf1，包括截短的Cpf1)的相应位置中的一种或多种。在某些实施例中，所述突变型Cpf1是AsCpf1，其包含以下突变型氨基酸残基中的一种或多种：542R、548M、548A、548G、548L、548R、548I、548N、548C、K548Q、548H、548F、548S、548T、548W、548Y、或548V。在某些实施例中，所述突变型Cpf1包含如下AsCpf1的突变型氨基酸残基542R或607R(在某些实施例中，这两个残基)，或者AsCpf1直向同源物(来自不同物种的相应效应物)、同源物(具有相同功能的效应物，来自相同或不同的物种)、或变体(例如，如本文其他地方描述的任何另外修饰的Cpf1，包括截短的Cpf1)的相应位置中的一种或多种。在某些实施例中，所述突变型Cpf1是AsCpf1，其包含如下突变型氨基酸残基542R或607R(在某些实施例中，这两个残基)中的一种或多种。在某些实施例中，所述突变型Cpf1包含如下AsCpf1的突变型氨基酸残基542R或548V(以及任选地552R)(在某些实施例中，这两个残基)，或AsCpf1直向同源物(来自不同物种的相应效应物)、同源物(具有相同功能的效应物，来自相同或不同的物种)、或变体(例如，如本文其他地方描述的任何另外修饰的Cpf1，包括截短的Cpf1)的相应位置中的一种或多种。在某些实施例中，所述突变型Cpf1是AsCpf1，其包含如下突变型氨基酸残基542R或548V(以及任选地552R)(在某些实施例中，这两个残基)中的一种或多种。在某些实施例中，所述突变型Cpf1包含突变型氨基酸残基542(参考AsCpf1)或Cpf1直向同源物中的相应残基。在某些实施例中，所述突变型Cpf1包含突变型氨基酸残基532(参考LbCpf1)或Cpf1直向同源物中的相应残基。

在某些实施例中，所述突变型Cpf1包含如下AsCpf1的突变型氨基酸残基S542R、N547K、K548M、K548A、K548G、K548L、K548R、K548I、K548N、K548C、K548Q、K548H、K548F、K548S、K548T、K548W、K548Y、K548V、K550Y、N551R、N552G、N552K、N552R、N552S、N552T、T167A、M604A、或K607A，或者AsCpf1直向同源物(来自不同物种的相应效应物)、同源物(具有相同功能的效应物，来自相同或不同的物种)、或变体(例如，如本文其他地方描述的任何另外修饰的Cpf1，包括截短的Cpf1)的相应残基中的一种或多种。在某些实施例中，所述突变型Cpf1是AsCpf1，其包含以下突变型氨基酸残基中的一种或多种：S542R、N547K、K548M、K548A、K548G、K548L、K548R、K548I、K548N、K548C、K548Q、K548H、K548F、K548S、K548T、K548W、K548Y、K548V、K550Y、N551R、N552G、N552K、N552R、N552S、N552T、T167A、M604A、或K607A。在某些实施例中，所述突变型Cpf1包含如下AsCpf1的突变型氨基酸残基S542R、K548M、K548A、K548G、K548L、K548R、K548I、K548N、K548C、K548Q、K548H、K548F、K548S、K548T、K548W、K548Y、或K548VA，或者AsCpf1直向同源物(来自不同物种的相应效应物)、同源物(具有相同功能的效应物，来自相同或不同的物种)、或变体(例如，如本文其他地方描述的任何另外修饰的Cpf1，包括截短的Cpf1)的相应位置中的一种或多种。在某些实施例中，所述突变型Cpf1是AsCpf1，其包含以下突变型氨基酸残基中的一种或多种：S542R或K548A、K548G、K548L、K548R、K548I、K548N、K548C、K548Q、K548H、K548F、K548S、K548T、K548W、K548Y、K548V。在某些实施例中，所述突变型Cpf1包含如下AsCpf1的突变型氨基酸残基S542R和K607R，或者AsCpf1直向同源物(来自不同物种的相应效应物)、同源物(具有相同功能的效应物，来自相同或不同的物种)、或变体(例如，如本文其他地方描述的任何另外修饰的Cpf1，包括截短的Cpf1)的相应位置中的一种或多种。在某些实施例中，所述突变型Cpf1是AsCpf1，其包含如下突变型氨基酸残基S542R和K607R中的一种或多种。在某些实施例中，所述突变型Cpf1包含如下AsCpf1的突变型氨基酸残基S542R和K548V(以及任选地N552R)，或者AsCpf1直向同源物(来自不同物种的相应效应物)、同源物(具有相同功能的效应物，来自相同或不同的物种)、或变体(例如，如本文其他地方描述的任何另外修饰的Cpf1，包括截短的Cpf1)的相应位置中的一种或多种。在某些实施例中，所述突变型Cpf1是AsCpf1，其包含如下突变型氨基酸残基S542R和K548V(以及任选地N552R)中的一种或多种。

在上述实施例中的某些中，Cpf1具有或包含如下组合突变中的一种或多种：氨基酸(aa)位置542/548；542/607；548/552；542/548/552、542/550/607；542/548/550/607(参考AsCpf1)，或Cpf1直向同源物中的相应残基。在上述实施例中的某些中，Cpf1具有或包含如下组合突变中的一种或多种：氨基酸(aa)位置532/538；532/595；538/542；532/538/542(参考LbCpf1)，或Cpf1直向同源物中的相应残基。

在某些实施例中，所述突变型Cpf1具有(AsCpf1的或参考AsCpf1的)一个或多个突变并识别(至少)如下表所示的PAM序列，其中所述PAM优选地不被相应的野生型Cpf1识别。当针对给定突变体列出多个PAM序列时，这种突变体可识别一个或多个，例如所有列出的PAM序列。

如其他地方所示，对上面列出的AsCpf1中的氨基酸残基的参考同样适用于其他Cpf1直向同源物(例如LbCpf1)中的相应残基。

在某些实施例中，本发明的Cpf1突变体包含如下表中的一个或多个突变，和/或识别(至少)指示的PAM序列。

另外，在某些实施例中，如上表中所示的所述PAM可以或可以不识别野生型Cpf1识别的PAM序列。在某些实施例中，还可以识别另外的PAM序列。在某些实施例中，上面列出的突变体至少识别指示的PAM序列。通过实例而非限制，已经发现位置542和548处的双突变，例如上面列出的Cpf1(例如AsCpf1)中的双突变S542/K548(例如S542R/K548V)，或Cpf1直向同源物中的相应突变，也能够识别规范PAM序列TTTV。令人惊讶的是，该双突变体具有更高的识别效率，但比野生型Cpf1特异性更低。

在某些实施例中，所述Cpf1具有AsCpf1的如图14中所指示的一个或多个位置，或者AsCpf1直向同源物(来自不同物种的相应效应物)、同源物(具有相同功能的效应物，来自相同或不同的物种)、或变体(例如，如本文其他地方描述的任何另外修饰的Cpf1，包括截短的Cpf1)的相应位置处的一个或多个突变型氨基酸残基。在某些实施例中，如果％indel缺失为至少5％，例如至少10％、例如至少15％、例如至少20％，则认为所述PAM被识别。

在某些实施例中，所述Cpf1具有AsCpf1的如图14中所指示的一个或多个位置，或者AsCpf1直向同源物(来自不同物种的相应效应物)、同源物(具有相同功能的效应物，来自相同或不同的物种)、或变体(例如，如本文其他地方描述的任何另外修饰的Cpf1，包括截短的Cpf1)的相应位置处的一个或多个突变型氨基酸残基，并识别图14中的指示PAM序列。在某些实施例中，如果％indel缺失为至少5％，例如至少10％、例如至少15％、例如至少20％，则认为所述PAM被识别。

在某些实施例中，所述Cpf1具有单突变，例如单点突变。

优选地，AsCpf1的氨基酸位置如UniProtKB/Swiss-Prot登录号U2UMQ6.1(基因库登录号961512548)中所示或如以下文献中所示：Zetsche等人(2015)；Cell[细胞]；163(3):759-771。

在某些实施例中，相应的突变型Cpf1是突变型AsCpf1(氨基酸球菌属物种，例如氨基酸球菌属物种BV3L6)或突变型LbCpf1(毛螺菌科细菌，例如毛螺菌科细菌MA2020或毛螺菌科细菌ND2006)。在一个优选实施例中，相应的突变型Cpf1是突变型AsCpf1(氨基酸球菌属物种，例如氨基酸球菌属物种BV3L6)。

在某些实施例中，如本文所述的根据本发明的突变型Cpf1多肽进一步包含影响Cpf1催化活性和/或Cpf1稳定性的修饰或突变，如本文别处进一步描述的。通过实例而非限制，可以进一步修饰Cpf1，例如去失性或失活的Cpf1(例如“无效”Cpf1)，其中催化活性部分或(基本上)完全丧失，如本文其他地方所述。在该上下文中催化活性的丧失意味着Cpf1蛋白不能切割DNA(例如不能诱导双链断裂，或仅能够诱导单链断裂，例如切口酶)。还可以修饰Cpf1以减少脱靶效应，如本文其他地方所定义的。Cpf1也可以是融合蛋白的一部分，如本文其他地方所定义的。还可以修饰Cpf1以包括去稳定化结构域，如本文其他地方所定义的。Cpf1也可以是拆分的Cpf1，如本文其他地方所定义的。Cpf1也可以是诱导型Cpf1，如本文其他地方所定义的。Cpf1也可以是自失活系统(SIN)的一部分，如本文其他地方所定义的。还可以修饰Cpf1，使其成为如本文其他地方所定义的协同激活因子系统(SAM)的一部分。这些另外修饰的Cpf1蛋白中的一些可用于功能性筛选或用于递送功能性效应物，如本文其他地方所定义的。有利地，此类Cpf1(融合)蛋白可包含(部分)去活的/失活的Cpf1蛋白，如本文其他地方所定义的。

因此，在某些实施例中，如本文所述的根据本发明的经修饰的Cpf1多肽包含在具有功能结构域的融合蛋白中。在某些实施例中，所述功能结构域包含(转录)激活因子结构域、(转录)阻遏物结构域、重组酶、转座酶、组蛋白重塑物、DNA甲基转移酶、隐花色素、光可诱导/可控结构域或化学可诱导/可控结构域。

在某些实施例中，如本文所述的根据本发明的突变型Cpf1多肽不能诱导DNA双链断裂。在某些实施例中，如本文所述的根据本发明的突变型Cpf1多肽是切口酶。在某些实施例中，如本文所述的根据本发明的突变型Cpf1多肽是催化失活的Cpf1多肽。在某些实施例中，如本文所述的根据本发明的突变型Cpf1多肽不能诱导DNA单链断裂。

在一个方面中，本发明涉及编码如本文所述的根据本发明的突变型Cpf1多肽的多核苷酸。在某些实施例中，Cpf1多核苷酸经密码子优化以在目的细胞中表达，如本文其他地方所述。在某些实施例中，编码如本文所述的根据本发明的突变型Cpf1多肽的多核苷酸包含编码一个或多个NLS的一个或多个序列，如本文其他地方所述。

在一个方面中，本发明涉及一种载体，该载体包含编码如本文所述的根据本发明的突变型Cpf1的多核苷酸。在某些实施例中，该载体是表达载体。在某些实施例中，该载体是原核表达载体。在某些实施例中，该载体是真核表达载体。在某些实施例中，该载体是诱导型、条件型或组成型(原核或真核)表达载体，如本文其他地方所述。

在一个方面中，本发明涉及包含一种或多种载体的载体系统，所述一种或多种载体包含编码如本文所述的根据本发明的突变型Cpf1的多核苷酸，并且在相同或不同的载体上包含一种或多种编码指导RNA(gRNA)的多核苷酸。在某些实施例中，所述载体系统包含一种或多种如上定义的表达载体。

在一个方面中，本发明涉及包含如本文所述的根据本发明的突变型Cpf1多肽并且进一步包含gRNA的复合物，如本文其他地方所定义的。作为进一步指导，在某些实施方案中，所述gRNA包含指导序列和同向重复序列，如本文其他地方所定义的。

在某些实施例中，并且作为进一步指导，如本文所定义的gRNA包含指导序列和同向重复序列，如本文其他地方所定义的。在某些实施例中，所述gRNA包含含有5'指导序列和3'同向重复序列的多核苷酸序列。在某些实施例中，所述指导序列能够与靶DNA序列杂交。在某些实施例中，修饰所述指导序列以改变功能性、特异性和/或稳定性，如本文其他地方所定义的。作为另外的实例，并且没有限制的，所述gRNA可以是无效gRNA，如本文其他地方所定义的。作为另外的实例，并且没有限制的，所述gRNA可以是保护的gRNA，如本文其他地方所定义的。作为另外的实例，并且没有限制的，所述gRNA可以是护送的gRNA，如本文其他地方所定义的。作为另外的实例，并且没有限制的，所述gRNA可以通过添加一种或多种适配体来修饰，如本文其他地方所定义的，并且例如可用于如本文其他地方所定义的协同激活因子系统(SAM)。

在某些优选的实施例中，如本文所述的根据本发明的突变型Cpf1能够结合如本文所述的gRNA。在某些实施例中，如本文所述的根据本发明的突变型Cpf1能够与所述gRNA形成(功能性)复合物。在某些实施例中，所述(功能性)复合物中的如本文所述的根据本发明的突变型Cpf1能够在结合所述靶DNA座位后修饰或靶向靶DNA座位。在某些实施例中，所述(功能性)复合物中的如本文所述的根据本发明的突变型Cpf1能够与所述gRNA形成复合物，并影响所述复合物与靶DNA座位的序列特异性结合和/或所述靶座位的修饰。这种复合物可能能够诱导DNA修饰，例如如本文其他地方所述的单链或双链DNA切割，或可能能够改变DNA架构/结构、表观遗传修饰或基因表达，如本文其他地方所述(有利地利用例如无效Cpf1，例如与功能结构域融合的无效Cpf1，如本文其他地方所述)。

在一个方面中，本发明涉及一种递送系统，其包含如本文所述的根据本发明的突变型Cpf1多肽、多核苷酸、载体、载体系统或复合物。递送系统可以配置用于原核递送，或用于真核递送，如本文其他地方所定义的。递送系统可以被配置用于组织特异性递送，或非组织特异性递送，如本文其他地方所定义的。递送系统可以被配置用于诱导型或非诱导型递送，如本文其他地方所定义的。在某些实施例中，递送系统是或包含脂质体、颗粒、外泌体、微泡、基因枪或病毒递送系统，如本文其他地方所述。

在一个方面中，本发明涉及一种宿主细胞，其包含如本文所述的根据本发明的突变型Cpf1多肽、多核苷酸、载体、载体系统、复合物或递送系统。在一个方面中，本发明涉及一种宿主细胞，其表达或能够表达如本文所述的根据本发明的突变型Cpf1多肽(例如包含编码Cpf1的多核酸序列的宿主细胞，例如有利地在载体(如合适的表达载体)上提供)。宿主细胞可以是任何类型的宿主细胞，如本文其他地方所定义的。例如，宿主细胞可以是原核宿主细胞。作为另外的实例，宿主细胞可以是真核宿主细胞。在某些实施例中，宿主细胞是分离的宿主细胞，即不存在于(多细胞)生物体中的细胞，例如分离的人或动物宿主细胞。

在一个方面中，本发明涉及一种组合物，其包含如本文所述的根据本发明的突变型Cpf1多肽、多核苷酸、载体、载体系统、复合物、递送系统或宿主细胞。在某些实施例中，所述组合物是药物或非药物组合物，如本文其他地方所述。

在一个方面中，本发明涉及一种试剂盒，其包含如本文所述的根据本发明的突变型Cpf1多肽、多核苷酸、载体、载体系统、复合物、递送系统、宿主细胞或组合物。在某些实施例中，此类试剂盒可以是或可包含如本文其他地方所述的组分。

在一个方面中，本发明涉及一种转基因生物，其包含如本文所述的根据本发明的突变型Cpf1多肽、多核苷酸、载体、载体系统、复合物、递送系统、宿主细胞或组合物。在另外的方面中，本发明涉及一种转基因生物，其表达或能够表达如本文所述的根据本发明的突变型Cpf1多肽(例如包含如下的转基因生物：编码Cpf1的多核酸序列，例如有利地在载体(如合适的表达载体)上提供，或编码整合在基因组中的Cpf1的多核酸序列，例如有利地在合适的启动子和任选地另外的调节元件的控制下，如本文其他地方所述)。

在一个方面中，本发明涉及修饰或靶向靶DNA座位的方法，该方法包括向所述座位递送如本文所述的根据本发明的多肽、多核苷酸、载体、载体系统、递送系统、复合物、或组合物。在另外的方面中，本发明涉及一种修饰或靶向靶DNA座位的方法，该方法包括向所述座位递送如本文所述的根据本发明的突变型Cpf1多肽、或编码所述如本文所述的突变型Cpf1的多核苷酸、和gRNA、或编码所述gRNA的多核苷酸，优选地其中所述突变型Cpf1多肽与所述gRNA形成复合物，并且优选地其中所述靶DNA座位在所述复合物与所述靶DNA座位结合后被修饰或靶向。用于修饰或靶向靶DNA座位的此类方法在本文其他地方一般性地描述。在某些优选的实施例中，上述方法中的如本文所述的根据本发明的突变型Cpf1能够结合如本文所述的gRNA。在某些实施例中，上述方法中的如本文所述的根据本发明的突变型Cpf1能够与所述gRNA形成(功能性)复合物。在某些实施例中，所述(功能性)复合物中的上述方法中的如本文所述的根据本发明的突变型Cpf1能够在结合所述靶DNA座位后修饰或靶向靶DNA座位。在某些实施例中，所述(功能性)复合物中的上述方法中的如本文所述的根据本发明的突变型Cpf1能够与所述gRNA形成复合物，并影响所述复合物与靶DNA座位的序列特异性结合和/或所述靶座位的修饰。这种复合物可能能够诱导DNA修饰，例如如本文其他地方所述的单链或双链DNA切割，或可能能够改变DNA架构/结构、表观遗传修饰或基因表达，如本文其他地方所述(有利地利用例如无效Cpf1，例如与功能结构域融合的无效Cpf1，如本文其他地方所述)。在某些实施例中，所述修饰或靶向靶座位包括诱导DNA链断裂。在某些实施例中，所述修饰或靶向靶座位包括诱导DNA单链断裂。在某些实施例中，所述修饰或靶向靶座位包括诱导DNA双链断裂。在某些实施例中，所述修饰或靶向靶座位包括改变一种或多种基因的基因表达。在此类方法中，有利地，可以使用如本文其他地方所述的去活的或失活的Cpf1，任选地偶联、缔合或融合其至异源功能结构域，如本文其他地方所述。在某些实施例中，所述修饰或靶向靶座位包括所述靶DNA座位的表观遗传修饰。在某些实施例中，所述修饰或靶向靶座位包括所述靶DNA座位的染色质修饰。在某些实施例中，所述修饰或靶向靶座位包括所述靶DNA座位的架构修饰。

在一个方面中，本发明涉及鉴定突变型Cas、CRISPR酶、CRISPR蛋白或CRISPR效应物(例如如本文所述的根据本发明的突变型Cpf1多肽，其具有一个或多个影响PAM识别的突变)的方法，该方法包括以下步骤

(a)提供宿主细胞，所述宿主细胞：

-包含或表达gRNA，

在另外的方面中，本发明涉及鉴定突变型Cas、CRISPR酶、CRISPR蛋白或CRISPR效应物(例如如本文所述的根据本发明的突变型Cpf1多肽，其具有一个或多个影响PAM识别的突变)的方法(例如上文所述方法)，该方法包括以下步骤

在某些实施例中，鉴定具有一个或多个影响PAM识别的突变的突变型Cpf1多肽的方法包括如图2和/或图3中所示的步骤。

在某些实施例中，这些方法中的所述特定PAM序列未被相应的野生型Cpf1识别。

在某些实施例中，这些方法中的所述宿主细胞是原核宿主细胞。在某些实施例中，这些方法中的所述宿主细胞是真核宿主细胞。

在某些实施例中，这些方法中的所述选择标记是阳性或阴性选择标记(例如，宿主细胞的存活可取决于选择标记的活性)。在某些实施例中，所述选择标记是抗生素抗性基因。

在某些实施例中，这些方法中的所述突变型Cpf1多肽具有催化活性，即能够至少诱导单链DNA断裂，优选双链DNA断裂。

在某些实施例中，这些方法的步骤(a)、(a1)或(a2)中的所述宿主细胞是或包含宿主细胞文库。在某些实施例中，所述宿主细胞文库是或包含候选突变型Cpf1多肽的文库，所述多肽具有一个或多个影响PAM识别的突变。在某些实施例中，所述宿主细胞文库是或包含多核苷酸的PAM文库。在某些实施例中，这些方法的步骤(a)或(b1)中的所述多核苷酸是或包含多核苷酸的PAM文库。在某些实施例中，步骤(a)或(b2)中的具有一个或多个影响PAM识别的突变的所述候选突变型Cpf1多肽是或包含Cpf1突变体文库。

在一个方面中，本发明涉及由如上所述的根据本发明的方法鉴定的突变型Cpf1多肽。在另外的方面中，本发明涉及编码如上所述的根据本发明的方法鉴定的这种突变型多肽的多核苷酸，或载体、载体系统、复合物、组合物、递送系统、宿主细胞、或转基因生物，如本文其他地方所述。

如本文所述的根据本发明的突变体Cpf1可以用于如本文其他地方所述的任何方法或用途，例如但不限于功能性筛选、全基因组敲除筛选、多重化、饱和诱变、或细胞或生物体修饰，以及治疗应用，例如本文其他地方所述的那些。

在一个方面中，本发明涉及如本文所述的根据本发明的Cpf1多肽、多核苷酸、载体、载体系统、复合物、递送系统、宿主细胞或组合物用于(优选地，在体外或离体)修饰或靶向DNA靶座位的用途，或用于修饰或靶向非人和/或非动物生物体中的DNA靶座位的用途，如本文其他地方所述。在另外的方面中，本发明涉及如本文所述的根据本发明的Cpf1多肽、多核苷酸、载体、载体系统、复合物、递送系统或宿主细胞用于(优选地在体外或离体)基因组编辑，或用于非人和/或非动物生物体的基因组编辑的用途，如本文其他地方所述。在另一个方面中，本发明涉及如本文所述的根据本发明的Cpf1多肽、多核苷酸、载体、载体系统、复合物、递送系统、宿主细胞或组合物，(例如在体外、离体或体内)用于在修饰或靶向DNA靶座位中使用，如本文其他地方所述。在另一个方面中，本发明涉及如本文所述的根据本发明的Cpf1多肽、多核苷酸、载体、载体系统、复合物、递送系统、宿主细胞或组合物，(例如在体外、离体或体内)用于在基因组编辑中使用，如本文其他地方所述。在另外的方面中，本发明涉及如本文所述的根据本发明的Cpf1多肽、多核苷酸、载体、载体系统、复合物、递送系统、宿主细胞或组合物，用于在疗法中使用或用作药物，如本文其他地方所述。在又另一个方面中，本发明涉及如本文所述的根据本发明的Cpf1多肽、多核苷酸、载体、载体系统、复合物、递送系统、宿主细胞或组合物在制备药物中的用途，如本文其他地方所述。

在一个方面中，本发明涉及核酸靶向系统，其包含如本文所述的根据本发明的突变型Cpf1(或编码该突变型Cpf1的多核酸)。

术语“核酸靶向系统”(其中核酸是DNA，并且在一些方面中还可以是指DNA-RNA杂交体或其衍生物)总体是指涉及DNA靶向CRISPR相关(“Cas”)基因的表达或引导这些基因的活性的转录物和其他元件，这些转录物和其他元件可包括编码DNA靶向Cas蛋白的序列和包含CRISPR RNA(crRNA)的DNA靶向指导RNA以及(在CRISPR-Cas9系统并非所有系统中)反式激活CRISPR-Cas系统RNA(tracrRNA)序列或来自DNA靶向CRISPR座位的其他序列或转录物。在本文所述的Cpf1DNA靶向的RNA指导型内切核酸酶系统中，tracrRNA序列不是需要的。总的来说，RNA靶向系统的特征在于在靶DNA序列的位点处促进RNA靶向复合物形成的元件。在形成DNA靶向复合物的情况下，“靶序列”是指DNA或RNA靶向指导RNA被设计为与其具有互补性的DNA序列，其中靶序列与RNA靶向指导RNA之间的杂交促进RNA靶向复合物的形成。在一些实施例中，靶序列位于细胞的细胞核或细胞质中。

在一个方面中，本发明涉及包含如本文所述的根据本发明的突变型Cpf1(或编码该突变型Cpf1的多核酸)的CRISPR-Cas复合物、系统、或靶向系统，或CRISPR复合物、系统或靶向系统，或Cas复合物、系统或靶向系统。

在本发明的一个方面中，本申请的新型DNA靶向系统(还称之为DNA靶向CRISPR-Cas或CRISPR-Cas DNA靶向系统)是基于鉴定的型V(例如亚型V-A和亚型V-B)Cas蛋白的，这些蛋白不需要产生定制蛋白来靶向特异性DNA序列，相反，单一效应蛋白或酶可以由RNA分子编程来识别特异性DNA靶，换句话说，可以使用所述RNA分子来将酶募集至特异性DNA靶。本发明的方面具体涉及DNA靶向的RNA指导型Cpf1 CRISPR系统。

本文所述的核酸靶向系统、载体系统、载体和组合物可以用于多种核酸靶向应用，改变或修改基因产物例如蛋白质的合成、核酸切割、核酸编辑、核酸剪接；靶核酸的运输、靶核酸的追踪、靶核酸的分离、靶核酸的可视化等中。

如本文所用的，Cas蛋白或CRISPR酶是指新的CRISPR-Cas系统分类中呈现的任一种蛋白质。在一个有利的实施例中，本发明涵盖V型CRISPR-Cas座位，例如Cpf1编码座位(指代为亚型V-A)中鉴定的效应蛋白。目前，亚型V-A座位涵盖cas1、cas2、不同的基因指代的cpf1以及CRISPR阵列。Cpf1(CRISPR相关蛋白Cpf1，亚型PREFRAN)是一种大蛋白质(约1300个氨基酸)，其含有与Cas9的相应结构域同源的RuvC样核酸酶结构域以及Cas9的特征性富精氨酸簇的对应物。然而，Cpf1缺乏所有Cas9蛋白中存在的HNH核酸酶结构域，并且RuvC样结构域在Cpf1序列中是连续的，这与其中含有包含HNH结构域的长插入物的Cas9相反。因此，在特定实施例中，CRISPR-Cas酶仅包含RuvC样核酸酶结构域。

Cpf1基因可以见于若干种不同的细菌基因组中，典型地与cas1、cas2和cas4基因以及CRISPR盒(例如，新凶手弗朗西丝氏菌Fx1(Francisella cf.novicida Fx1)的FNFX1_1431-FNFX1_1428)在同一座位中。因此，此推定的新型CRISPR-Cas系统的布置似乎类似于II-B型的布置。此外，与Cas9类似，Cpf1蛋白含有与易位子ORF-B同源的便于鉴定的C末端区并且包含活性的RuvC样核酸酶、富含精氨酸的区和Zn指(不存在于Cas9中)。然而，与Cas9不同，Cpf1还存在于没有CRISPR-Cas环境的若干种基因组中并且其与ORF-B的相对较高相似性表明其可能是易位子组分。表明如果此是真正的CRISPR-Cas系统并且Cpf1是Cas9的功能类似物，则其将是新型CRISPR-Cas类型，即V型(参见Annotation and Classification ofCRISPR-Cas Systems[CRISPR-Cas系统的注释和分类].Makarova KS,Koonin EV.MethodsMol Biol.[分子生物学方法]2015；1311:47-75)。然而，如本文所述，将Cpf1指代为亚型V-A以将其与C2c1p区分，该C2c1p不具有相同的结构域结构并且因此被指代为亚型V-B。

本发明的方面还涵盖本文所述的组合物和系统在基因组工程中例如用于在体外、体内或离体中改变或操纵原核细胞或真核细胞中的一种或多种基因的表达或一种或多种基因产物的方法和用途。

在某些方面中，本发明涉及载体。如本文所用，“载体”是一种允许或帮助实体从一个环境转移到另一个环境中的工具。载体是复制子，例如质粒、噬菌体或粘粒，可以向该复制子中插入另一个DNA区段以便使得该插入的区段复制。通常，当与适当控制元件缔合时载体能够复制。总的来说，在整个说明书中，术语“载体”是指能够转运它所连接的另一个核酸的核酸分子。载体包括但不限于，单链、双链或部分双链的核酸分子；包含一个或多个游离端、不包含游离端(例如，环状)的核酸分子；包含DNA、RNA或二者的核酸分子；以及本领域已知的其他种类的多核苷酸。一种类型的载体是“质粒”，该质粒是指一种环状双链DNA环，可以例如通过标准分子克隆技术向该环中插入另外的DNA区段。另一种类型的载体是病毒载体，其中病毒来源的DNA或RNA序列存在于包装到病毒(例如，逆转录病毒、复制缺陷型逆转录病毒、腺病毒、复制缺陷型腺病毒、腺伴随病毒)中的载体中。病毒载体还包括由病毒携带来转染到宿主细胞中的多核苷酸。某些载体能够在它们被引入至其中的宿主细胞中自主复制(例如，具有细菌复制起点的细菌载体以及附加型哺乳动物载体)。其他载体(例如，非附加型哺乳动物载体)在引入到宿主细胞后被整合到宿主细胞的基因组中，并且从而随着宿主基因组一起复制。此外，某些载体能够引导它们可操作地连接的基因的表达。此类载体在本文被称为“表达载体”。用于真核细胞并且在真核细胞中产生表达的载体在本文可以被称为“真核表达载体”。在重组DNA技术中采用的常见表达载体常常是质粒形式。

重组表达载体可以包含处于适用于在宿主细胞中表达核酸的形式的本发明的核酸，这意味着重组表达载体包含一个或多个调节元件，这些调节元件可以基于用于表达的宿主细胞来选择，可操作地连接至有待表达的核酸序列。在重组表达载体内，“可操作地连接”旨在意指目的核苷酸序列以允许核苷酸序列表达(例如，在体外转录/翻译系统中或当该载体被引入到宿主细胞时在宿主细胞中)的方式连接至一个或多个调节元件。关于重组和克隆方法，参考2004年9月2日作为US 2004-0171156A1公开的美国专利申请10/815,730，此专利的内容通过引用以其整体并入本文。

术语“调节元件”旨在包括启动子、增强子、内部核糖体进入位点(IRES)以及其他表达控制元件(例如，转录终止信号，例如多聚腺苷酸化信号和聚U序列)。此类调节元件描述于例如Goeddel,GENE EXPRESSION TECHNOLOGY:METHODS IN ENZYMOLOGY[基因表达技术：酶学方法]185,Academic Press[学术出版社],San Diego[圣地亚哥],Calif.[加利福尼亚州](1990)中。调节元件包括引导核苷酸序列在许多类型的宿主细胞中组成型表达的那些元件和引导核苷酸序列仅在某些宿主细胞中表达的那些元件(例如，组织特异性调控序列)。组织特异性启动子可以引导主要在希望的目的组织例如肌肉、神经元、骨骼、皮肤、血液、特定器官(例如，肝脏、胰脏)、或特定细胞类型(例如，淋巴细胞)中的表达。调节元件还可以时间依赖性方式例如细胞周期依赖性或发育阶段依赖性方式引导表达，这可以是或也可以不是组织特异性或细胞类型特异性的。在一些实施例中，载体包含一个或多个polIII启动子(例如，1、2、3、4、5、或更多个pol III启动子)、一个或多个pol II启动子(例如，1、2、3、4、5、或更多个pol II启动子)、一个或多个pol I启动子(例如，1、2、3、4、5、或更多个pol I启动子)、或其组合。pol III启动子的实例包括但不限于，U6和H1启动子。pol II启动子的实例包括但不限于，逆转录病毒劳斯氏肉瘤病毒(Rous sarcoma virus)(RSV)LTR启动子(任选地具有RSV增强子)、巨细胞病毒(CMV)启动子(任选地具有CMV增强子)[例如，参见Boshart等人，Cell[细胞],41:521-530(1985)]、SV40启动子、二氢叶酸还原酶启动子、β-肌动蛋白启动子、磷酸甘油激酶(PGK)启动子、以及EF1α启动子。术语“调节元件”还涵盖增强子元件，例如WPRE；CMV增强子；HTLV-I的LTR中的R-U5'区段(Mol.Cell.Biol.[分子细胞生物学],第8(1)卷,第466-472页,1988)；SV40增强子；以及兔β-球蛋白的外显子2与3之间的内含子序列(Proc.Natl.Acad.Sci.USA.[美国国家科学院院刊],第78(3)卷,第1527-31页,1981)。本领域技术人员将了解的是，表达载体的设计可以取决于如有待转化的宿主细胞的选择、所希望的表达水平等的此类因素。载体可以引入到宿主细胞中从而产生由本文所述的核酸编码的转录物、蛋白质或肽，包括融合蛋白或肽(例如，成簇规律间隔短回文重复序列(CRISPR)转录物、蛋白质、酶、其突变体形式、其融合蛋白等)。关于调控序列，参考美国专利申请10/491,026，该专利申请的内容通过引用以其整体并入本文。关于启动子，参考PCT公开WO 2011/028929和美国申请12/511,940，这些专利申请的内容通过引用以其整体并入本文。

有利的载体包括慢病毒和腺伴随病毒并且所述载体类型还可以针对靶向的特定细胞类型来选择。

如本文所用，术语型V CRISPR-Cas座位效应蛋白的“crRNA”或“指导RNA”或“单一指导RNA”或“sgRNA”或“一种或多种核酸组分”包括与靶核酸序列具有足够互补性以与靶核酸序列杂交并引导核酸靶向复合物与靶核酸序列的序列特异性结合的任何多核苷酸序列。在本发明的实施例中，术语成熟crRNA和指导RNA以及单一指导RNA如前面引用的文献例如WO 2014/093622(PCT/US 2013/074667)中那样可互换地使用。在一些实施例中，当使用适合比对算法进行最佳比对时，互补程度是约或超过约50％、60％、75％、80％、85％、90％、95％、97.5％、99％、或更大。最佳比对可以通过使用用于比对序列的任何适合的算法来确定，这些算法的非限制性实例包括史密斯-沃特曼(Smith-Waterman)算法、尼德曼-温施(Needleman-Wunsch)算法、基于巴罗斯-惠勒转换(Burrows-Wheeler Transform)的算法(例如，巴罗斯-惠勒比对仪(Burrows Wheeler Aligner))、ClustalW、Clustal X、BLAT、Novoalign(诺沃克拉夫特技术公司(Novocraft Technologies)，可在www.novocraft.com处获得)、ELAND(加利福尼亚州圣迭哥亿明达公司(Illumina,San Diego,CA))、SOAP(可在soap.genomics.org.cn处获得)、以及Maq(可在maq.sourceforge.net处获得)。在一些实施例中，指导序列的长度是约或超过约5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75、或更多个核苷酸。在一些实施例中，指导序列的长度是小于约75、50、45、40、35、30、25、20、15、12、或更少个核苷酸。优选指导序列是10-30个核苷酸长。指导序列(在核酸靶向指导RNA内)引导核酸靶向复合物与靶核酸序列的序列特异性结合的能力可以是通过任何适合的测定来评估。例如，足以形成核酸靶向复合物的核酸靶向CRISPR系统的组分(包括有待测试的指导序列)可以例如通过用编码核酸靶向复合物组分的载体进行转染来提供给具有相应靶核酸序列的宿主细胞，随后例如通过本文所述的Surveyor测定评估靶核酸序列内的优先靶向(例如切割)。类似地，靶核酸序列(或其附近的序列)的切割可以在试管中通过以下方式进行评估：提供靶核酸序列、核酸靶向复合物的组分(包括有待测试的指导序列)和不同于测试指导序列的对照指导序列并且在测试指导序列反应与对照指导序列反应之间比较靶序列处或附近的结合或切割速率。其他测定是可能的，并且是本领域技术人员能够想到的。指导序列和因此核酸靶向指导RNA可以被选择成靶向任何靶核苷酸序列。靶序列可以是DNA。在一些实施例中，靶序列是细胞基因组中的序列。示例性靶序列包括靶基因组中独特的那些。

在一些实施例中，核酸靶向指导RNA被选择以减小该RNA靶向指导RNA内的二级结构程度。在一些实施例中，当进行最佳折叠时，核酸靶向指导RNA的约或小于约75％、50％、40％、30％、25％、20％、15％、10％、5％、1％，或更少的核苷酸参与自互补碱基配对。最佳折叠可以是通过任何适合的多核苷酸折叠算法来确定。一些程序是基于计算最小吉布斯自由能。一种这样的算法的实例是mFold，如通过Zuker和Stiegler(Nucleic Acids Res.[核酸研究]9(1981),133-148)所描述的。另一个示例性折叠算法是维也纳大学的理论化学研究所使用质心结构预测算法开发的在线网站服务器RNAfold(参见例如，A.R.Gruber等人,2008,Cell[细胞]106(1):23-24；以及PA Carr和GM Church,2009,Nature Biotechnology[自然生物技术]27(12):1151-62)。

“tracrRNA”序列或类似术语包括与crRNA序列具有足够互补性以进行杂交的任何多核苷酸序列。如上文所指出的，在本发明的实施例中，tracrRNA不是为Cpf1效应蛋白复合物的切割活性所需要的。

申请人还进行了激发实验以验证V型蛋白例如Cpf1的DNA靶向和切割能力。此实验与大肠杆菌中的StCas9异源表达的类似工作(Sapranauskas,R.等人Nucleic Acids Res[核酸研究]39,9275-9282(2011))极为相似。申请人将含有PAM和抗性基因两者的质粒引入到异源大肠杆菌中，并且然后接种在相应抗生素上。如果存在质粒的DNA切割，则申请人观察不到有活力的群落。

在进一步细节中，如下针对DNA靶进行测定。在此测定中使用两种大肠杆菌菌株。一种携带编码来自细菌菌株的内源性效应蛋白座位的质粒。另一种菌株携带空质粒(例如pACYC184，对照菌株)。将所有可能的7或8bp PAM序列呈递在抗生素抗性质粒(具有氨苄青霉素抗性基因的pUC19)上。将PAM定位成靠近原型间隔区1的序列(内源性效应蛋白座位中的第一间隔区的DNA靶)。克隆了两个PAM文库。一个具有原型间隔区的8个随机bp 5'(例如总的65536个不同PAM序列＝复杂度)。另一个文库具有原型间隔区的7个随机bp 3'(例如总复杂度是16384个不同的PAM)。将两个文库克隆成具有平均500个质粒/可能的PAM。用5'PAM和3'PAM文库在单独的转化中转化测试菌株和对照菌株并且将转化的细胞分别接种在氨苄青霉素板上。使用质粒的识别和随后的切割/干扰使得细胞对氨苄青霉素易感并且阻止了生长。转化后大约12h，收获由测试菌株和对照菌株形成的所有群落并且分离出质粒DNA。使用质粒DNA作为用于PCR扩增和随后的深度测序的模板。未转化的(untransfomed)文库中的所有PAM的表现度显示转化细胞中的PAM的预期表现度。对照菌株中发现的所有PAM的表现度显示真实的表现度。测试菌株中的所有PAM的表现度显示哪个PAM未被酶识别并且与对照菌株的比较允许提取出缺失的PAM的序列。

为了最小化毒性和脱靶效应，重要的是控制所递送的核酸靶向指导RNA的浓度。核酸靶向指导RNA的最佳浓度可以通过以下方式来确定：测试不同浓度的细胞模型或非人类真核动物模型并且使用深度测序分析潜在的脱靶基因组座位处的修饰程度。得到最高的中靶(on-target)修饰水平同时使脱靶修饰水平最小化的浓度应被选择用于体内递送。核酸靶向系统有利地是来源于V型CRISPR系统。在一些实施例中，核酸靶向系统的一个或多个元件是来源于包含内源性RNA靶向系统的特定生物体。在本发明的优选实施例中，RNA靶向系统是V型CRISPR系统。术语“直向同源物(orthologue)”(本文也称之为“直向同源物(ortholog)”)和“同源物(homologue)”(本文也称之为“同源物(homolog)”)是本领域熟知的。作为进一步指导，如本文所用的蛋白质的“同源物”是属于同一种类的蛋白质，该蛋白质执行与作为其同源物的蛋白质相同或类似的功能。同源蛋白可以是但不需要是结构相关的，或仅是部分结构相关的。如本文所用的蛋白质的“直向同源物”是属于不同种类的蛋白质，该蛋白质执行与作为其直向同源物的蛋白质相同或类似的功能。直向同源蛋白可以是但不需要是结构相关的，或仅是部分结构相关的。同源物和直向同源物可以通过同源建模(参见例如Greer,Science[科学]第228卷(1985)1055,和Blundell等人Eur J Biochem[欧洲生物化学杂志]第172卷(1988),513)或“结构BLAST”(Dey F,Cliff Zhang Q,Petrey D,Honig B.Toward a"structural BLAST":using structural relationships to inferfunction.[针对“结构BLAST”：使用结构关系推断功能]Protein Sci.[蛋白质科学]2013年4月；22(4):359-66.doi:10.1002/pro.2225.)来鉴定。还参见CRISPR-Cas座位领域中的Shmakov等人(2015)的申请。同源蛋白可以是但不需要是结构相关的，或仅是部分结构相关的。在特定实施例中，如本文提及的Cpf1的同源物或直向同源物与Cpf1具有至少80％、更优选至少85％、甚至更优选至少90％例如像至少95％的序列同源性或一致性。在另外的实施例中，如本文提及的Cpf1的同源物或直向同源物与野生型Cpf1具有至少80％、更优选至少85％、甚至更优选至少90％例如像至少95％的序列一致性。在Cpf1具有一个或更多个突变的情况下(突变型)，如本文提及的所述Cpf1的同源物或直向同源物与突变型Cpf1具有至少80％、更优选至少85％、甚至更优选至少90％例如像至少95％的序列一致性。

应了解，本文所述的任一功能可以被工程化到来自其他直向同源物的CRISPR酶中，包括包含来自多个直向同源物的片段的嵌合酶。本文其他地方描述了此类直向同源物的实例。因此，嵌合酶可以包含包括但不限于下项的属的生物体的CRISPR酶直向同源物的片段：棒状杆菌属、萨特氏菌属(Sutterella)、军团杆菌属、密螺旋体属、产线菌属(Filifactor)、真细菌属、链球菌属、乳酸杆菌属、支原体属、拟杆菌属、Flaviivola、黄杆菌属、Sphaerochaeta、固氮螺菌属、葡糖醋杆菌属、奈瑟氏菌属、罗氏菌属、细小棒菌属、葡萄球菌属、Nitratifractor、支原体属以及弯曲杆菌属。嵌合酶可以包含第一片段和第二片段并且片段可以是属于本文所提到的属或本文所提到的物种的生物体的CRISPR酶直向同源物的；有利的是，片段来自不同物种的CRISPR酶直向同源物。

在实施例中，本文提及的V型蛋白还包括功能性变体或其同源物或直向同源物。如本文所用的蛋白质的“功能变体”是指此蛋白质的变体，该变体保留该蛋白的至少部分活性。功能变体可以包括突变体(其可以是插入、缺失或置换突变体)，包括同质多形体等。还包括在功能变体内的是此蛋白质与别的，通常是不相关的核酸、蛋白质、多肽或肽的融合产物。功能变体可以是天然存在的或可以是人造的。

在一个实施例中，编码V型效应蛋白，具体地是Cpf1或其直向同源物或同源物的一个或多个核酸分子可以被密码子优化为在真核细胞中表达。真核生物可以是本文所讨论的。一个或多个核酸分子可以是工程化的或非天然存在的。

在一个实施例中，V型效应蛋白，具体地是Cpf1或其直向同源物或同源物可以包含一个或多个突变(并且因此编码所述效应蛋白的一个或多个核酸分子可以具有一个或多个突变)。突变可以是人工引入的突变并且可以包括但不限于催化结构域中的一个或多个突变。参照Cas9酶，催化结构域的实例可以包括但不限于RuvC I、RuvC II、RuvC III以及HNH结构域。

在一个实施例中，V型蛋白，例如Cpf1或其直向同源物或同源物可以用作融合至或可操作地连接至功能结构域的通用的核酸结合蛋白。示例性功能结构域可以包括但不限于，翻译起始区、翻译激活因子、翻译阻遏物、核酸酶(具体地是核糖核酸酶)、剪接体、珠粒、光诱导型/控制型的结构域或化学诱导型/控制型的结构域。

在一些实施例中，未修饰的核酸靶向效应蛋白可以具有切割活性。在一些实施例中，RNA靶向效应蛋白可以引导靶序列或靠近靶序列的位置处的，例如靶序列内和/或靶序列互补序列内或与靶序列相关联的序列处的一条或两条核酸(DNA)链的切割。在一些实施例中，核酸靶向效应蛋白可以引导从靶序列的第一个或最后一个核苷酸开始的约1、2、3、4、5、6、7、8、9、10、15、20、25、50、100、200、500或更多个碱基对内的一条或两条DNA链的切割。在一些实施例中，切割可以是交错的，即产生粘性末端。在一些实施例中，切割是交错切割的，产生了5'突出端。在一些实施例中，切割是交错切割的，产生了具有1至5个核苷酸，优选4或5个核苷酸的5'突出端。在一些实施例中，切割位点远离PAM，例如切割发生在非靶链上的第18核苷酸后面和靶链上的第23核苷酸后面。在一些实施例中，切割位点出现在非靶链上的第18核苷酸(从PAM开始计数)后面和靶链上的第23核苷酸(从PAM开始计数)后面。在一些实施例中，载体编码可以相对于相应野生型酶发生突变的核酸靶向效应蛋白，使得突变型核酸靶向效应蛋白缺乏切割含有靶序列的靶多核苷酸的一条或两条DNA链的能力。作为另一个实例，Cas蛋白的两个或更多个催化结构域(例如Cas9蛋白的RuvC I、RuvC II和RuvCIII或HNH结构域)可以突变成产生实质性缺乏所有DNA切割活性的突变型Cas蛋白。如本文所述，Cpf1效应蛋白的相应催化结构域也可以突变成产生缺乏所有DNA切割活性或具有实质性降低的DNA切割活性的突变型Cpf1效应蛋白。在一些实施例中，当突变型酶的RNA切割活性不超过该酶的非突变形式的核酸切割活性的约25％、10％、5％、1％、0.1％、0.01％或更少时，核酸靶向效应蛋白可以被认为是实质性缺乏所有RNA切割活性的；一个实例可以是当突变形式的核酸切割活性是零或与非突变形式相比是可忽视的时候。效应蛋白可以参照与具有来自V型CRISPR系统的多个核酸酶结构域的最大核酸酶享有同源性的酶的一般类别来鉴定。最优选地，效应蛋白是V型蛋白，例如Cpf1。在另外的实施例中，效应蛋白是V型蛋白。关于衍生，申请人表示，就与野生型酶具有高度的序列同源性的意思而言，衍生的酶在很大程度上是基于野生型酶的，但是该衍生的酶是已经以本领域已知或本文所述的一些方式发生突变的(修饰的)。

同样，应了解，除非另外表明，否则术语Cas和CRISPR酶和CRISPR蛋白和Cas蛋白通常是可以互换使用的并且在所有本文参考方面处以类推方式指进一步描述在本发明中的新型CRISPR效应蛋白，例如通过具体参考Cas9。如以上提到的，本文使用的许多残基编号是指来自V型CRISPR座位的效应蛋白。然而，应了解本发明包括来自其他微生物物种的更多效应蛋白。在某些实施例中，效应蛋白可以是组成型存在的或诱导型存在的或条件型存在的或被给予或递送的。效应蛋白优化可以用于增强功能或用于开发新功能，其可产生嵌合效应蛋白。并且如本文所述的效应蛋白可以被修饰成用作通用的核酸结合蛋白。

典型地，在核酸靶向系统的情况下，核酸靶向复合物(包含杂交至靶序列并与一种或多种核酸靶向效应蛋白复合的指导RNA)的形成产生靶序列中或靶序列附近(例如，从靶序列开始的1、2、3、4、5、6、7、8、9、10、20、50、或更多个碱基对内)的一条或两条DNA链的切割。如本文所用的术语“与目的靶座位相关联的一种或多种序列”是指在靶序列的附近(例如从靶序列开始的1、2、3、4、5、6、7、8、9、10、20、50、或更多个碱基对内，其中靶序列包含在目的靶座位内)的序列。

在本发明中，密码子优化序列的一个实例是被优化为在真核生物，例如人类(即被优化为在人类中表达)，或其他真核生物，如本文所讨论的动物或哺乳动物中表达的序列；例如参见作为密码子优化序列的实例的WO 2014/093622(PCT/US2013/074667)中的SaCas9人类密码子优化序列(根据本领域知识和本披露，特别是关于效应蛋白(例如Cpf1)的密码子优化编码的一个或多个核酸分子是在技术人员的知识范围内的)。虽然这是优选的，但是应了解，其他实例是可能的并且除人类之外的宿主物种的密码子优化，或特定器官的密码子优化是已知的。在一些实施例中，编码DNA/RNA靶向Cas蛋白的酶编码序列被密码子优化为在特定细胞例如真核细胞中表达。真核细胞可以是特定生物体具有的或来源于该特定生物体的那些细胞，该特定生物体是例如植物或哺乳动物，包括但不限于人类或非人类真核生物，或如本文讨论的动物或哺乳动物，例如小鼠、大鼠、兔、狗、家畜或非人类哺乳动物或灵长类动物。在一些实施例中，对于人类或动物而言很可能使得他们(它们)受苦而没有任何实质性医学益处的用于修饰人类的种系遗传一致性的方法和/或用于修饰动物的遗传一致性的方法，以及还有作为这样的方法的结果的动物，可以被排除在外。总的来说，密码子优化是指在维持天然氨基酸序列的情况下通过以下方式修饰核酸序列来增强在目的宿主细胞中的表达的方法：通过用该宿主细胞的基因中更频繁使用或最频繁使用的密码子替换天然序列的至少一个密码子(例如，约或超过约1、2、3、4、5、10、15、20、25、50或更多个密码子)。不同的物种对于具有特定氨基酸的某些密码子表现出特定偏倚性。密码子偏倚性(生物体之间密码子使用的差异)常常与信使RNA(mRNA)的翻译效率相关，而该翻译效率则被认为依赖于(除其他之外)被翻译的密码子的特性和特定转移RNA(tRNA)分子的可获得性。细胞中选择的tRNA的超优势度通常是肽合成中最频繁使用的密码子的反映。因此，基因可以被定制为基于密码子优化在给定生物体中最佳基因表达。密码子使用表是易于获得的，例如在从www.kazusa.orjp/codon/获得的“密码子使用数据库”中并且这些表可以通过多种方式来调整适用。参见Nakamura,Y.等人“Codon usage tabulated from theinternational DNA sequence databases:status for the year 2000[从国际DNA序列数据库中制表的密码子使用：2000年的状态]”Nucl.Acids Res.[核酸研究]28:292(2000)。用于密码子优化特定序列以在特定宿主细胞中表达的计算机算法也是可得的，例如GeneForge(宾夕法尼亚州雅各布斯的Aptagen公司(Aptagen；Jacobus,PA))也是可得的。在一些实施例中，编码DNA/RNA靶向Cas蛋白的序列中的一个或多个密码子(例如1、2、3、4、5、10、15、20、25、50个、或更多个、或所有密码子)对应于特定氨基酸的最频繁使用的密码子。对于酵母的密码子使用，参考从获得的在线Yeast Genome[酵母基因组]数据库或Codonselection in yeast[酵母的密码子选择],Bennetzen和Hall,J Biol Chem.[生物化学杂志]1982年3月25日；257(6):3026-31。对于植物(包括藻类)的密码子使用，参考Codonusage in higher plants,green algae,and cyanobacteria[高等植物、绿藻和蓝藻细菌的密码子使用],Campbell和Gowri,Plant Physiol.[植物生理学]1990年1月；92(1):1-11；以及Codon usage in plant genes[植物基因的密码子使用],Murray等人,Nucleic AcidsRes.[核酸研究]1989年1月25日；17(2):477-98；或Selection on the codon bias ofchloroplast and cyanelle genes in different plant and algal lineages[不同植物和藻类谱系中的叶绿体基因和蓝色小体基因的密码子偏倚性的选择],Morton BR,J MolEvol.[分子进化杂志]1998年4月；46(4):449-59。

在一些实施例中，载体编码包含一个或多个核酸定位序列(NLS)(例如约或超过约1、2、3、4、5、6、7、8、9、10个或更多个NLS)的核酸靶向效应蛋白，例如V型RNA靶向效应蛋白，具体地是Cpf1或其直向同源物或同源物。在一些实施例中，RNA靶向效应蛋白包含处于或靠近氨基末端的约或超过约1、2、3、4、5、6、7、8、9、10个、或更多个NLS，处于或靠近羧基末端的约或超过约1、2、3、4、5、6、7、8、9、10个、或更多个NLS，或这些的组合(例如在氨基末端处的零个或至少一个或多个NLS以及在羧基末端处的零个或至少一个或多个NLS)。当存在超过一个的NLS时，每一个可以被选择为不依赖于其他NLS，使得单一NLS可以存在于超过一个的拷贝中和/或与一个或多个其他NLS相组合存在于一个或多个拷贝中。在一些实施例中，当NLS的最近的氨基酸是在从N末端或C末端沿着该多肽链的约1、2、3、4、5、10、15、20、25、30、40、50个、或更多个氨基酸之内时，NLS可以被认为靠近该N末端或C末端。NLS的非限制性实例包括来源于以下的NLS序列：SV40病毒大T抗原的NLS，其具有氨基酸序列PKKKRKV；来自核质蛋白的NLS(例如，具有序列KRPAATKKAGQAKKKK的核质蛋白二分NLS)；c-myc NLS，其具有氨基酸序列PAAKRVKLD或RQRRNELKRSP；hRNPA1M9NLS，其具有序列NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY；来自输入蛋白-α的IBB结构域的序列RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV；肌瘤T蛋白的序列VSRKRPRP和PPKKARED；人类p53的序列POPKKKPL；小鼠c-abl IV的序列SALIKKKKKMAP；流感病毒NS1的序列DRLRR和PKQKKRK；肝炎病毒δ抗原的序列RKLKKKIKKL；小鼠Mx1蛋白的序列REKKKFLKRR；人类聚(ADP-核糖)聚合酶的序列KRKGDEVDGVDEVAKKKSKK；以及类固醇激素受体(人类)糖皮质激素的序列RKCLQAGMNLEARKTKK。总的来说，一个或多个NLS具有足以驱动DNA/RNA靶向Cas蛋白在真核细胞的细胞核中以可检测的量积累的强度。总的来说，核定位活性的强度可以来源于核酸靶向效应蛋白中的NLS数目、使用的一个或多个特定NLS、或这些因素的组合。可以通过任何合适的技术进行细胞核中积累的检测。例如，可检测标记可以融合至核酸靶向蛋白，使得细胞内的位置可以被可视化，例如与检测细胞核的位置的手段(例如，对细胞核具有特异性的染料，例如DAPI)相组合。还可以将细胞核从细胞中分离出来，然后可以通过任何适合的用于检测蛋白质的方法分析其内容物，例如免疫组织化学、蛋白质印迹或酶活性测定。还可以通过以下方式间接地确定细胞核中的积累：例如通过测定核酸靶向复合物形成的作用(例如，测定在靶序列处的DNA切割或突变、或测定由于DNA靶向复合物形成和/或DNA靶向Cas蛋白活性的影响而改变的基因表达活性)，与没有暴露于核酸靶向Cas蛋白或核酸靶向复合物、或暴露于缺乏一个或多个NLS的核酸靶向Cas蛋白的对照进行比较。在本文所述的Cpf1效应蛋白复合物和系统的优选实施例中，密码子优化的Cpf1效应蛋白包含附接至该蛋白质的C末端的NLS。在某些实施例中，NLS序列与编码Cpf1效应蛋白的核酸序列是异源的。

在一些实施例中，驱动核酸靶向系统的一种或多种元件表达的一种或多种载体被引入到宿主细胞中，以使得该核酸靶向系统的这些元件的表达能引导核酸靶向复合物在一个或多个靶位点处形成。例如，核酸靶向效应酶和核酸靶向指导RNA可以各自可操作地连接至单独载体上的单独调节元件。核酸靶向系统的一种或多种RNA可以被递送至转基因核酸靶向效应蛋白动物或哺乳动物，例如组成型地或诱导型地或条件型地表达核酸靶向效应蛋白的动物或哺乳动物；或以其他方式表达核酸靶向效应蛋白或具有含有核酸靶向效应蛋白的细胞的动物或哺乳动物，例如通过在先向这些动物或哺乳动物给予编码或体内表达核酸靶向效应蛋白的一种或多种载体的方式。可替代地，从相同或不同调节元件表达的这些元件的两种或更多种可以组合在单一载体中，其中一种或多种另外的载体提供核酸靶向系统在第一载体中不包含的任何组分。组合于单一载体中的核酸靶向系统元件可以布置为任何适合的取向，例如一个元件位于相对于第二元件的5'(“上游”)或相对于该第二元件的3'(“下游”)。一个元件的编码序列可以位于第二元件的编码序列的相同链或相反链上，并且取向为相同或相反方向。在一些实施例中，单一启动子驱动编码核酸靶向效应蛋白的转录物和嵌入一种或多种内含子序列之内(例如，各自在不同内含子中、两个或更多个在至少一个内含子中，或所有在单一内含子中)的核酸靶向指导RNA的表达。在一些实施例中，核酸靶向效应蛋白和核酸靶向指导RNA可以可操作地连接至同一个启动子并且从该同一启动子表达。用于表达核酸靶向系统的一个或多个元件的递送媒介物、载体、粒子、纳米粒子、配制品以及其组分如前述文献例如WO 2014/093622(PCT/US2013/074667)中所使用的。在一些实施例中，载体包含一个或多个插入位点，例如限制性内切核酸酶识别序列(也称之为“克隆位点”)。在一些实施例中，一个或多个插入位点(例如，约或超过约1、2、3、4、5、6、7、8、9、10个、或更多个插入位点)位于一种或多种载体的一个或多个序列元件的上游和/或下游。当使用多个不同的指导序列时，可以使用单一表达构建体来使核酸靶向活性靶向细胞内的多个不同的相应靶序列。例如，单一载体可以包含约或超过约1、2、3、4、5、6、7、8、9、10、15、20个、或更多个指导序列。在一些实施例中，可以提供约或超过约1、2、3、4、5、6、7、8、9、10个、或更多个含有此指导序列的载体，并且任选地将其递送至细胞中。在一些实施例中，载体包含可操作地连接至编码核酸靶向效应蛋白的酶编码序列的调节元件。可以单独地递送核酸靶向效应蛋白或一个或多个核酸靶向指导RNA；并且有利的是这些中的至少一者经由粒子复合物递送。核酸靶向效应蛋白mRNA可以在核酸靶向指导RNA在给出时间以待核酸靶向效应蛋白表达之前递送。核酸靶向效应蛋白mRNA可以在给予核酸靶向指导RNA之前1-12小时(优选约2-6小时)给予。可替代地，核酸靶向效应蛋白mRNA和核酸靶向指导RNA可以一起给予。有利地，指导RNA的第二加强剂量可以在初始给予核酸靶向效应蛋白mRNA+指导RNA之后1-12小时(优选约2-6小时)给予。为了实现最有效的基因组修饰水平，核酸靶向效应蛋白mRNA和/或指导RNA的附加给予可能是有用的。

在一个方面中，本发明提供了用于使用核酸靶向系统的一个或多个元件的方法。本发明的核酸靶向复合物提供了一种用于修饰(单链或双链、直链或超螺旋的)靶DNA的有效手段。本发明的核酸靶向复合物具有多种多样的效用，包括修饰(例如，缺失、插入、易位、失活、激活)许多细胞类型中的靶DNA。这样，本发明的核酸靶向复合物在例如基因治疗、药物筛选、疾病诊断以及预后方面具有广泛的应用。示例性核酸靶向复合物包含与杂交至目的靶座位内的靶序列的指导RNA复合的DNA靶向效应蛋白。

在一个方面中，本发明提供了修饰靶多核苷酸的方法。在一些实施例中，该方法包括允许CRISPR复合物结合靶多核苷酸来实施所述靶多核苷酸的切割，从而修饰该靶多核苷酸，其中该CRISPR复合物包含与指导序列(包括如本文所述的任何修饰的指导序列的指导物)复合的CRISPR酶(包括任何修饰的酶，如本文所述的无效Cpf1或Cpf1切口酶等)，该指导序列与所述靶多核苷酸内的靶序列杂交，优选其中所述指导序列与同向重复序列连接。在一个方面中，本发明提供了一种修饰真核细胞中DNA表达的方法，使得所述结合导致所述DNA的表达增加或减少。在一些实施例中，该方法包括允许核酸靶向复合物结合该DNA，以使得所述结合导致所述DNA的表达增加或减少；其中该核酸靶向复合物包含与指导RNA复合的核酸靶向效应蛋白。在一些实施例中，该方法进一步包括将一个或多个载体递送至所述真核细胞，其中一个或多个载体驱动以下中的一个或多个的表达：Cpf1和连接到DR序列的(多个)指导序列。类似的考虑因素和条件适用如上文针对修饰靶DNA的方法。实际上，这些取样、培养和重新引入选择跨本发明的多个方面而适用。在一个方面中，本发明提供了修饰真核细胞中的靶DNA的方法，这些方法可以是在体内、离体或在体外。在一些实施例中，该方法包括从人类或非人类动物取样细胞或细胞群体，并且修饰该细胞或这些细胞。培养可以发生在离体的任何阶段。该细胞或这些细胞甚至可以被重新引入非人类动物或植物中。对于重新引入的细胞，特别优选的是这些细胞是干细胞。细胞可以根据本发明进行修饰以产生例如受控量的基因产物，这些受控量可以是增加的或减少的，这取决于用途，并且/或者发生突变。在某些实施例中，细胞的基因组座位被修复。

实际上，在本发明的任何方面中，核酸靶向复合物可以包含与杂交至靶序列的指导RNA复合的核酸靶向效应蛋白。

本发明涉及用于控制涉及DNA序列靶向的基因表达的系统、方法以及组合物的工程化和优化，这些系统、方法以及组合物与核酸靶向系统及其组分相关。在有利的实施例中，效应酶是V型蛋白，例如Cpf1。本发明方法的一个优点是CRISPR系统最小化了或避免了脱靶结合及其产生的副作用。这是使用安排为对靶DNA具有高度序列特异性的系统来实现的。

关于核酸靶向复合物或系统，优选地，crRNA序列具有一个或多个茎环或发夹并且具有30个或更多个核苷酸的长度，40或更多个核苷酸的长度，或50个或更多个核苷酸的长度；crRNA序列的长度介于10个至30个核苷酸之间，核酸靶向效应蛋白是V型Cas酶。在某些实施例中，crRNA序列的长度介于42个与44个核苷酸之间，并且核酸靶向Cas蛋白是土拉热弗朗西丝氏菌新杀手亚种U112的Cpf1。在某些实施例中，crRNA包含具有19个核苷酸的同向重复序列和具有介于23个与25个之间核苷酸的间隔区序列、基本上由或由该同向重复序列和该间隔区序列组成，并且核酸靶向Cas蛋白是土拉热弗朗西丝氏菌新杀手亚种U112的Cpf1。

使用两种不同的适配体(各自与不同的核酸靶向指导RNA缔合)允许通过不同的核酸靶向指导RNA来使用激活因子-衔接体蛋白质融合物和阻遏物-衔接体蛋白质融合物，以激活一种DNA的表达，同时阻遏另一种。它们可以与它们的不同指导RNA一起、或大体上一起以多重途径给予。大量的这样的修饰核酸靶向指导RNA(例如10或20或30个等)可以同时全部使用，而仅需要递送一个(或至少最小数目的)效应蛋白分子，因为相对较小数目的效应蛋白分子可以与大量的修饰指导序列一起使用。衔接体蛋白质可以与一个或多个激活因子或一个或多个阻遏物缔合(优选连接或融合)。例如，衔接体蛋白质可以与第一激活因子和第二激活因子缔合。第一激活因子和第二激活因子可以是相同的，但是它们优选是不同的激活因子。可以使用三个或更多个或甚至四个或更多个激活因子(或阻遏物)，但是包装尺寸可能限制大于5个不同功能结构域的数目。优选使用接头，通过与衔接体蛋白质的直接融合来使用，其中两个或更多个结构功能域与衔接体蛋白质缔合。适合接头可以包括GlySer接头。

还设想的是作为整体的核酸靶向效应蛋白指导RNA复合物可以与两个或更多个结构功能域缔合。例如，可以存在与核酸靶向效应蛋白缔合的两个或更多个功能结构域，或者可以存在与指导RNA缔合(经由一种或多种衔接体蛋白质)的两个或更多个功能结构域，或者可以存在与核酸靶向效应蛋白缔合的一个或多个功能结构域和与指导RNA缔合(经由一种或多种衔接体蛋白质)的一个或多个功能结构域。

衔接体蛋白质与激活因子或阻遏物之间的融合物可以包含接头。例如，可以使用GlySer接头GGGS。根据需要，它们可以3个((GGGGS)₃)或6个、9个或甚至12个或更多个的重复单元来使用以提供适合的长度。指导RNA与功能结构域(激活因子或阻遏物)之间、核酸靶向Cas蛋白(Cas)与功能结构域(激活因子或阻遏物)之间可以使用接头。接头用于工程化适当的“机械柔性”度。

本发明包括包含核酸靶向效应蛋白和指导RNA的核酸靶向复合物，其中核酸靶向效应蛋白包含至少一个突变，使得核酸靶向效应蛋白具有不超过不具有该至少一个突变的核酸靶向效应蛋白的活性的5％的活性，和任选的至少一个或多个核定位序列；指导RNA包含能够与细胞中的目的RNA中的靶序列杂交的指导序列；并且其中：核酸靶向效应蛋白与两个或更多个功能结构域缔合；或者指导RNA的至少一个环是通过插入结合一种或多种衔接体蛋白质的一种或多种不同的RNA序列来修饰的，并且其中该衔接体蛋白质与两个或更多个功能结构域缔合；或者核酸靶向Cas蛋白与一个或多个功能结构域缔合并且指导RNA的至少一个环是通过插入结合一种或多种衔接体蛋白质的一种或多种不同的RNA序列来修饰的，并且其中该衔接体蛋白质与一个或多个功能结构域缔合。

在一个方面中，本发明提供了一种产生包含突变型疾病相关基因的模型真核细胞的方法。在一些实施例中，疾病相关基因是与患病或发展病的风险的增加相关联的任何基因。在一些实施例中，该方法包括(a)将一个或多个载体引入到真核细胞中，其中一个或多个载体驱动以下中的一个或多个的表达：Cpf1酶和包含与同向重复序列连接的指导序列的受保护的指导RNA；并且(b)使得CRISPR复合物结合靶多核苷酸以实施所述疾病相关基因内的靶多核苷酸的切割，其中CRISPR复合物包含与包含杂交至靶多核苷酸内的靶序列的序列的指导RNA复合的Cpf1酶，从而产生包含突变型疾病相关基因的模型真核细胞。在一些实施例中，所述切割包括通过所述Cpf1酶切割靶序列的位置处的一条或两条链。在一些实施例中，所述切割使得靶基因的转录减少。在一些实施例中，该方法进一步包括使用外源性模板多核苷酸通过基于非同源末端连接(NHEJ)的基因插入机制修复所述切割的靶多核苷酸，其中所述修复产生包括所述靶多核苷酸的一个或多个核苷酸的插入、缺失或取代的突变。在一些实施例中，所述突变使得来自包含靶序列的基因的蛋白质表达发生一个或多个氨基酸的变化。

在一个方面中，本发明提供了如本文所讨论的方法，其中该宿主是真核细胞。在一个方面中，本发明提供了如本文所讨论的方法，其中该宿主是哺乳动物细胞。在一个方面中，本发明提供了如本文所讨论的方法，其中该宿主是非人类真核细胞。在一个方面中，本发明提供了如本文所讨论的方法，其中该非人类真核细胞是非人类哺乳动物细胞。在一个方面中，本发明提供了如本文所讨论的方法，其中非人类哺乳动物细胞可以是包括但不限于，灵长类动物、牛、羊、猪类、犬、啮齿动物、兔科例如猴、母牛、绵羊、猪、狗、兔、大鼠或小鼠的细胞。在一个方面中，本发明提供了如本文所讨论的方法，该细胞可以是非哺乳动物真核细胞例如家禽鸟类(例如鸡)、脊椎动物鱼(例如鲑鱼)或甲壳类动物(例如牡蛎、蛤、龙虾、虾)的细胞。在一个方面中，本发明提供了如本文所讨论的方法，该非人类真核细胞是植物细胞。植物细胞可以是单子叶植物或双子叶植物具有的细胞或栽培植物或粮食植物例如木薯、玉米、高粱、大豆、小麦、燕麦或稻具有的细胞。植物细胞还可以是藻类、树或生产植物、果实或蔬菜(例如，树类例如柑橘树，例如桔子树、葡萄柚树或柠檬树；桃树或油桃树；苹果树或梨树；坚果树例如杏树或核桃树或阿月浑子树；茄属植物；芸苔属植物；莴苣属植物；菠菜属植物；辣椒属植物；棉花、烟草、芦笋、胡萝卜、甘蓝、西兰花、花椰菜、番茄、茄子、胡椒、莴苣、菠菜、草莓、蓝莓、覆盆子、黑莓、葡萄、咖啡、可可等)具有的细胞。

在一个方面中，本发明提供了用于开发调控与疾病相关基因相关联的细胞信号传导事件的生物活性剂的方法。在一些实施例中，疾病相关基因是与患病或发展病的风险的增加相关联的任何基因。在一些实施例中，该方法包括(a)使测试化合物与任一种以上所述实施例的模型细胞接触；并且(b)检测指示与所述疾病相关基因中的所述突变相关联的细胞信号传导事件的减少或增加的读出变化，从而开发调控与所述疾病相关基因相关联的所述细胞信号传导事件的所述生物活性剂。

在一个方面中，本发明提供了通过在一个或多个细胞的基因中引入一个或多个突变来选择一个或多个细胞的方法，该方法包括：将一种或多种载体引入到一个或多个细胞中，其中一种或多种载体驱动以下项中的一个或多个的表达：Cpf1、连接至同向重复序列的指导序列，以及编辑模板；其中编辑模板包含废除Cpf1 切割的一个或多个突变；使得编辑模板与有待选择的一个或多个细胞中的靶多核苷酸同源重组；使得Cpf1 CRISPR-Cas复合物结合靶多核苷酸以实施所述基因内的靶多核苷酸的切割，其中Cpf1 CRISPR-Cas复合物包含与(1)杂交至靶多核苷酸内的靶序列的指导序列，和(2)同向重复序列复合的Cpf1，其中Cpf1 CRISPR-Cas复合物与靶多核苷酸的结合诱导细胞死亡，从而使得其中已引入一个或多个突变的一个或多个细胞被选择；此Cpf1包括本发明的拆分的Cpf1。在本发明的另一个优选实施例中，有待选择的细胞可以是真核细胞。本发明的方面允许在不需要选择标记物或可能包括反选择系统的两步法的情况下选择特异性细胞。

在一个方面中，本发明提供了包含同向重复序列的下游的指导序列的重组多核苷酸，其中在表达时，指导序列引导Cpf1 CRISPR-Cas复合物与真核细胞中存在的相应靶序列的序列特异性结合。在一些实施例中，靶序列是真核细胞中存在的病毒序列。在一些实施例中，靶序列是原癌基因或癌基因。

在一个方面中，本发明提供了包含以下项的载体系统或真核宿主细胞：(a)可操作地连接至同向重复序列的第一调节元件和用于将一种或多种指导序列(包括如本文所述的任一种修饰指导序列)插入DR序列的下游的一个或多个插入位点，其中在表达时，指导序列引导Cpf1 CRISPR-Cas复合物与真核细胞中的靶序列的序列特异性结合，其中Cpf1CRISPR-Cas复合物包含与杂交至靶序列的指导序列(和任选地DR序列)复合的Cpf1(包括如本文所述的任一种修饰酶)；和/或(b)可操作地连接至编码包含核定位序列和/或NES的所述Cpf1酶的酶编码序列的第二调节元件。在一些实施例中，宿主细胞包含组分(a)和(b)。在一些实施例中，组分(a)、组分(b)或组分(a)和(b)被稳定地整合到宿主真核细胞的基因组中。在一些实施例中，组分(a)进一步包含可操作地连接至第一调节元件的两种或更多种指导序列，其中当表达时，两种或更多种指导序列中的每种引导Cpf1 CRISPR-Cas复合物与真核细胞中的不同靶序列的序列特异性结合。.在一些实施例中，CRISPR酶包含具有足以驱动所述CRISPR酶在真核细胞的细胞核中和/或之外以可检测的量积累的强度的一个或多个核定位序列和/或核输出序列或NES。在一些实施例中，Cpf1酶来源于土拉热弗朗西丝氏菌1、土拉热弗朗西丝氏菌新杀手亚种、易北普雷沃菌、毛螺菌科细菌MC2017 1、解朊丁酸弧菌、佩莱格里尼菌科细菌GW2011_GWA2_33_10、Parcubacteria细菌GW2011_GWC2_44_17、密斯氏菌属物种SCADC、氨基酸球菌属物种BV3L6、毛螺菌科细菌MA2020、暂定的白蚁甲烷枝原体、挑剔真细菌、牛莫拉氏菌237、牛莫拉氏菌AAX08_00205、牛莫拉氏菌AAX11_00205、丁酸弧菌属物种NC3005、硫微螺菌属物种XS5、稻田钩端螺旋体、毛螺菌科细菌ND2006、狗口腔卟啉单胞菌3、解糖胨普雷沃菌或猕猴卟啉单胞菌的Cpf1，包括本文所述的任何修饰的酶，并且可以进一步包含Cpf1的改变或突变，并且可以是嵌合Cpf1。.在一些实施例中，CRISPR酶被密码子优化为在真核细胞中表达。在一些实施例中，CRISPR酶引导靶序列位置处的一条或两条链的切割。在一个优选实施例中，链断裂是交错切割的，产生了5'突出端。在一些实施例中，Cpf1缺乏DNA链切割活性(例如，与野生型酶或不具有降低核酸酶活性的突变或改变的酶相比的不超过5％的核酸酶活性)。在一些实施例中，第一调节元件是聚合酶III启动子。在一些实施例中，第二调节元件是聚合酶II启动子。在一些实施例中，同向重复序列具有16个核苷酸的最小长度并且具有单一茎环。在另外的实施例中，同向重复序列具有长于16个核苷酸，优选超过17个核苷酸的长度，并且具有超过一个的茎环或优化的二级结构。在一些实施例中，指导序列的长度是至少16、17、18、19、20、25个核苷酸，或介于16个-30个、或介于16个-25个、或介于16个-20个核苷酸之间。

在一个方面中，本发明提供了包含本文所述的一种或多种组分的试剂盒。在一些实施例中，试剂盒包括如本文所述的载体系统或宿主细胞和用于使用试剂盒的说明书。

修饰的Cpf1酶

Cpf1核酸酶初级结构的计算分析揭示了三个不同的区。第一是C末端RuvC样结构域，其是仅功能表征的结构域。第二是N末端α-螺旋区并且第三是位于RuvC样结构域与α-螺旋区之间的混合的α区和β区。

预测非结构化区的若干小片段在Cpf1初始结构之内。对于小蛋白质序列的拆分和插入而言，不同的Cpf1直向同源物内的暴露于溶剂且不保守的非结构化区是优选的侧面。另外，这些侧面可以用于在Cpf1直向同源物之间产生嵌合蛋白。

基于以上信息，可以产生如本文所述的根据本发明的Cpf1的突变体，这些突变体使得酶部分或完全失活或将双链核酸酶修饰为具有切口酶活性。在可替代实施例中，此信息用于开发具有修饰的活性，例如减小的脱靶效应的酶(本文其他地方所述的)。

去活的/失活的Cpf1蛋白

在如本文所述的根据本发明的Cpf1蛋白具有核酸酶活性的情况下，Cpf1蛋白可以被修饰成具有减弱的核酸酶活性，例如，与野生型酶相比，具有至少70％、至少80％、至少90％、至少95％、至少97％或100％的核酸酶失活；或者换句话说，Cpf1酶有利地具有非突变型或野生型Cpf1酶或CRISPR酶的核酸酶活性的约0％，或不超过非突变型或野生型Cpf1酶的核酸酶活性的约3％或约5％或约10％，这些酶例如属于非突变型或野生型新杀手弗朗西丝氏菌U112(FnCpf1)、氨基酸球菌属物种BV3L6(AsCpf1)、毛螺菌科细菌ND2006(LbCpf1)或牛莫拉氏菌237(MbCpf1 Cpf1酶或CRISPR酶)、或牛莫拉氏菌AAX08_00205Cpf1酶或CRISPR酶、牛莫拉氏菌AAX11_00205Cpf1酶或CRISPR酶、丁酸弧菌属物种NC3005Cpf1酶或CRISPR酶、硫微螺菌属物种XS5Cpf1酶或CRISPR酶、或毛螺菌科细菌MA2020Cpf1酶或CRISPR酶。有可能通过将突变引入到Cpf1和其直向同源物的核酸酶结构域中实现此举。

失活的Cpf1 CRISPR酶可以具有缔合的(例如经由融合蛋白)一个或多个功能结构域，包括例如来自包括下项，或基本上由或由下项组成的组的一个或多个结构域：甲基化酶活性、脱甲基化酶活性、转录激活活性、转录阻遏活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性、DNA切割活性、核酸结合活性以及分子开关(例如光诱导型的)。优选的结构域是Fok1、VP64、P65、HSF1、MyoD1。在提供的是Fok1的情况下，有利的是提供多个Fok1功能结构域以实现功能二聚体并且gRNA被设计为提供适当间隔以用于功能性的使用(Fok1)，如Tsai等人Nature Biotechnology[自然生物技术],第32卷,第6期,2014年6月)中具体描述的。衔接体蛋白质可以利用已知的接头来附接此类功能结构域。在一些情况下，有利的是另外提供至少一个NLS。在一些情况下，将NLS定位在N末端处是有利的。当包含超过一个的功能结构域时，功能结构域可以是相同或不同的。

总的来说，一个或多个功能结构域在失活的Cpf1酶上的定位是允许功能结构域的正确空间取向，从而以属性化的功能效应影响靶的定位。例如，如果功能结构域是转录激活因子(例如，VP64或p65)，则转录激活因子被定位成允许其影响靶的转录的空间取向。同样地，转录阻遏物将有利地定位成影响靶的转录，并且核酸酶(例如Fok1)将有利地定位成切割或部分切割靶。此可以包括除CRISPR酶的N末端/C末端之外的位置。

根据本发明的酶可以应用于对功能筛选重要的优化的功能性CRISPR-Cas系统

在一个方面中，本发明提供了(非天然存在的或工程化的)组合物、复合物、递送系统、试剂盒、(载体)系统、宿主细胞或转基因生物，其包含V型、更特别是Cpf1 CRISPR指导RNA，该指导RNA包含能够与细胞中目的基因组座位中的靶序列杂交的指导序列，其中该指导RNA是通过插入结合一种或多种衔接体蛋白质(例如适配体)的一种或多种不同的RNA序列来修饰的，并且其中每个衔接体蛋白质与一个或多个功能结构域缔合；或者，其中该指导RNA被修饰为具有至少一个非编码功能环。在特定实施例中，通过在同向重复序列内的同向重复序列的5'或指导序列的3'插入一个或多个不同RNA序列来修饰指导RNA。当存在多于一个功能结构域时，功能域可以相同或不同，例如，相同或两个不同的激活因子或阻遏物中的两个。在一个方面中，本发明提供了非天然存在的或工程化的CRISPR-Cas复合物组合物，其包含如本文所讨论的指导RNA和CRISPR酶(其是如本文所述的根据本发明的Cpf1酶)，其中任选地，该Cpf1酶包含至少一个突变，使得Cpf1酶具有不超过不具有该至少一个突变，并且任选地一个或多个突变(其包含至少一个或多个核定位序列)的Cpf1酶的核酸酶活性5％。在一个方面中，本发明提供了本文讨论的Cpf1 CRISPR指导RNA或Cpf1 CRISPR-Cas复合物，其包括含有两个或更多个衔接体蛋白质的非天然存在的或工程化的组合物，其中每种蛋白质与一个或多个功能结构域缔合，并且其中该衔接体蛋白质结合插入该指导RNA中的一个或多个不同RNA序列。在特定的实施例中，另外或可替代地修饰指导RNA，以便仍然确保Cpf1CRISPR复合物的结合，但是防止Cpf1酶的切割(如本文其他地方详述的)。

在一个方面中，本发明提供了(非天然存在的或工程化的)组合物、复合物、递送系统、试剂盒、(载体)系统、宿主细胞或转基因生物，其包含含有指导序列的指导RNA(gRNA)，该指导序列能够与细胞中的目的基因组座位中的靶序列杂交，其中该CPf1酶包含至少一个突变，使得该Cpf1酶具有不超过不具有该至少一个突变的Cpf1酶的核酸酶活性的5％，其中该指导RNA是通过插入结合一种或多种衔接体蛋白质的一种或多种不同的RNA序列来修饰的，并且其中该衔接体蛋白质与一个或多个功能结构域缔合；或者，其中该指导RNA被修饰为具有至少一个非编码功能环，并且其中该组合物包含两个或更多个衔接体蛋白质，其中每个蛋白与一个或多个功能结构域缔合。在一个方面中，本发明提供了本文讨论的组合物，其中该Cpf1酶与不具有至少一个突变的Cpf1酶相比具有至少97％或100％减弱的核酸酶活性。在一个方面中，本发明提供了本文讨论的组合物，其中该Cpf1酶包含两个或更多个突变。在本发明的一个方面中，根据本发明的Cpf1酶与一个或多个功能结构域缔合。在一个方面中，与衔接体蛋白质缔合的两个或更多个功能结构域各自是异源功能结构域。在一个方面中，与Cpf1酶缔合的一个或多个功能结构域各自是异源功能结构域。在一个方面中，该衔接体蛋白质是包含功能结构域的融合蛋白，该融合蛋白任选地包含衔接体蛋白质和功能结构域之间的接头，该接头任选地包含GlySer接头。在一个方面中，gRNA不通过插入与两种或更多种衔接体蛋白质结合的不同RNA序列来修饰。在一个方面中，与衔接体蛋白质缔合的一个或多个功能结构域是转录激活结构域。在一个方面中，与Cpf1酶缔合的一个或多个功能结构域是转录激活结构域。在一个方面中，与衔接体蛋白质缔合的一个或多个功能结构域是转录激活结构域，其包含VP64、p65、MyoD1、HSF1、RTA或SET7/9。在特定实施例中，功能结构域是人E1A缔合蛋白p300(氨基酸(aa)1048-1664)的催化组蛋白乙酰转移酶(HAT)核心结构域。p300组蛋白乙酰转移酶蛋白在其靶位点催化组蛋白H3赖氨酸27的乙酰化，并从其异染色质状态释放DNA，以促进其转录(Hilton等人2015,Nature[自然]NatureBiotechnology[自然生物技术],33:510-517)。在一个方面中，与Cpf1酶缔合的一个或多个功能结构域是转录激活结构域，其包含VP64、p65、MyoD1、HSF1、RTA、SET7/9或核心蛋白p300。在一个方面中，与衔接体蛋白质缔合的一个或多个功能结构域是转录阻遏物结构域。在一个方面中，与Cpf1酶缔合的一个或多个功能结构域是转录阻遏物结构域。在一个方面中，转录阻遏物结构域是KRAB结构域。在一个方面中，转录阻遏物结构域是NuE结构域、NcoR结构域、SID结构域或SID4X结构域。在一个方面中，与衔接体蛋白质缔合的一个或多个功能结构域中的至少一个具有一种或多种活性，包括甲基化酶活性、脱甲基化酶活性、转录激活活性、转录阻遏活性、转录释放因子活性、组蛋白修饰活性、DNA整合活性、RNA切割活性、DNA切割活性、或核酸结合活性。在一个方面中，与Cpf1酶缔合的一个或多个功能结构域具有一种或多种活性，包括甲基化酶活性、脱甲基化酶活性、转录激活活性、转录阻遏活性、转录释放因子活性、组蛋白修饰活性、DNA整合活性、RNA切割活性、DNA切割活性、核酸结合活性或分子开关活性或化学诱导性或光诱导性。在一个方面中，DNA切割活性归因于Fok1核酸酶。在一个方面中，将一个或多个功能结构域附接至Cpf1酶，以使得在结合gRNA和靶标时，该功能结构域呈允许功能结构域以其属性功能起作用的空间取向；或任选地，其中将所述一个或多个功能结构域通过接头，任选地GlySer接头与Cpf1酶附接。在一个方面中，gRNA被修饰，以便在gRNA结合衔接体蛋白质并进一步结合Cpf1酶和靶标后，该功能结构域呈允许功能结构域以其属性功能起作用的空间取向。在一个方面中，将与Cpf1酶缔合的一个或多个功能结构域附接至Cpf1的RuvC结构域。在一个方面中，通过插入一个或多个不同的RNA序列来修饰指导RNA的同向重复序列。在一个方面中，与一种或多种衔接体蛋白质结合的一个或多个不同RNA序列的插入是适配体序列。在一个方面中，适配体序列是对相同衔接体蛋白质具有特异性的两种或更多种适配体序列。在一个方面中，适配体序列是对不同衔接体蛋白质具有特异性的两种或更多种适配体序列。在一个方面中，衔接体蛋白质包含MS2、PP7、Qβ、F2、GA、fr、JP501、M12、R17、BZ13、JP34、JP500、KU1、M11、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、φCb5、φCb8r、φCb12r、φCb23r、7s、PRR1。因此，在特定实施例中，适配体选自特异性结合上文列出的衔接体蛋白质中的任何一种的结合蛋白。在一个方面中，将第一衔接体蛋白质与p65结构域缔合，并将第二衔接体蛋白质与HSF1结构域缔合。在一个方面中，本发明提供了本文讨论的组合物、复合物、递送系统、试剂盒、(载体)系统、宿主细胞或转基因生物，其包含具有至少三个功能结构域的CRISPR-Cas复合物，其中至少一个与Cpf1酶缔合，并且其中至少两个与gRNA缔合。

在一个方面中，存在不止一种gRNA，并且gRNA靶向不同的序列，由此当使用该组合物时，存在多重化。在一个方面中，本发明提供了组合物，其中存在通过插入与一种或多种衔接体蛋白质结合的一种或多种不同RNA序列来修饰的多于一种gRNA。

在一个方面中，存在与一个或多个功能结构域缔合的一种或多种衔接体蛋白质，并与插入指导RNA的一种或多种不同RNA序列结合。

在一个方面中，该一种或多种靶序列是非编码序列或调控序列。调控序列可以是一种或多种启动子、增强子或沉默子序列。

在一个方面中，该指导RNA被修饰为具有至少一个非编码功能环；例如，其中至少一个非编码功能环是抑制性的；例如，其中至少一个非编码功能环包含Alu。

在一个方面中，本发明提供了筛选增功能(GOF)或失功能(LOF)或筛选包含含有或表达Cpf1的如本文讨论的细胞系或本文讨论的模型的细胞的非编码RNA或潜在调节区(例如增强子、阻遏物)，以及将如本文所述的组合物引入细胞系或模型的细胞中的方法，借此gRNA包括激活因子或阻遏物，并且关于引入的gRNA包括激活因子的那些细胞或关于引入的gRNA包括阻遏物的那些细胞分别监测GOF或LOF。本发明的筛选称为SAM筛选。

在一个方面中，本发明提供了包含多个含有指导序列的Cpf1指导RNA(gRNA)的全基因组文库，所述Cpf1指导RNA中的每一个都能够与细胞中目的基因组座位中的靶序列杂交，并且借此该文库能够靶向真核细胞群中的多个基因组座位中的多个靶序列，其中每个gRNA通过插入一种或多种与如本文所述的一种或多种或两种或更多种衔接体蛋白质结合的不同RNA序列进行修饰，并且其中衔接体蛋白质与一个或多个功能结构域缔合；或者，其中该gRNA被修饰为具有至少一个非编码功能环。并且当存在多于一个功能结构域时，功能域可以相同或不同，例如，相同或两个不同的激活因子或阻遏物中的两个。在一个方面中，本发明提供了包含一种或多种本发明的gRNA和Cpf1酶的非天然存在的或工程化的CRISPR-Cas复合物组合物的文库，其中任选地，该Cpf1酶包含至少一个突变，使得Cpf1酶具有不超过不具有该至少一个突变，并且任选地一个或多个突变(其包含至少一个或多个核定位序列)的Cpf1酶的核酸酶活性5％。在一个方面中，本发明提供了一种或多种本发明的gRNA或Cpf1 CRISPR-Cas复合物，其包括含有一种或两种或更多种衔接体蛋白质的非天然存在的或工程化的组合物，其中每种蛋白质与一个或多个功能结构域缔合，并且其中该衔接体蛋白质结合插入该gRNA的至少一个环中的一个或多个不同RNA序列。

在一个方面中，本发明提供了功能性筛选离体或体内细胞库中的基因组中基因的方法，该方法包括给予或表达包含多个Cpf1 CRISPR-Cas系统指导RNA(gRNA)的文库并且其中该筛选进一步包括使用如本文所述的根据本发明的Cpf1酶，其中CRISPR复合物被修饰成包含异源功能结构域。在一个方面中，本发明提供了一种用于筛选基因组的方法，该方法包括向宿主给予文库或者在宿主体内表达文库。在一个方面中，本发明提供了如本文讨论的方法，该方法进一步包括向宿主给予激活因子或在宿主中表达激活因子。在一个方面中，本发明提供了如本文所讨论的方法，其中该激活因子附接至Cpf1酶。在一个方面中，本发明提供了如本文所讨论的方法，其中将该激活因子附接至Cpf1酶的N末端或C末端。在一个方面中，本发明提供了如本文所讨论的方法，其中将该激活因子附接至Cpf1 CRISPR gRNA同向重复序列。在一个方面中，本发明提供了如本文讨论的方法，该方法进一步包括向宿主给予阻遏物或在宿主中表达阻遏物。在一个方面中，本发明提供了如本文所讨论的方法，其中该筛选包括影响并检测基因激活、基因抑制或座位中的切割。在一个方面中，本发明提供了如本文所讨论的方法，该方法包括递送Cpf1 CRISPR-Cas复合物或其一种或多种组分或对其编码的一个或多个核酸分子，其中所述一个或多个核酸分子可操作地连接至一种或多种调控序列并且在体内表达。在一个方面中，本发明提供了如本文所讨论的方法，其中该体内表达是经由慢病毒、腺病毒或AAV。在一个方面中，本发明提供了如本文所讨论的方法，其中该递送是经由粒子、纳米粒子、脂质或细胞穿透肽(CPP)。

在一个方面中，本发明提供了一对Cpf1 CRISPR-Cas复合物，每个复合物包含含有能够与细胞中目的基因组座位中的靶序列杂交的指导序列的Cpf1指导RNA(gRNA)，其中所述gRNA是通过插入结合一种或多种衔接体蛋白质的一种或多种不同RNA序列来修饰的，并且其中该衔接体蛋白质与一个或多个功能结构域缔合，其中每个Cpf1 CRISPR-Cas的每个gRNA包含具有DNA切割活性的功能结构域。在一个方面中，本发明提供了如本文所讨论的成对的Cpf1 CRISPR-Cas复合物，其中DNA切割活性是归因于Fok1核酸酶。

在一些优选的实施例中，功能结构域是转录激活结构域，优选地VP64。在一些实施例中，功能结构域是转录阻遏结构域，优选地KRAB。在一些实施例中，转录阻遏结构域是SID或SID的串联体(例如SID4X)。在一些实施例中，功能结构域是表观遗传修饰结构域，以便提供表观遗传修饰酶。在一些实施例中，功能结构域是激活结构域，它可以是P65激活结构域。

总的来说，以提供包含一个或多个功能结构域(例如，经由融合蛋白)结合的衔接蛋白的特异性结合位点(例如，适配体)的方式来修饰指导RNA。对经修饰的指导RNA进行修饰使得一旦该指导RNA形成CRISPR复合物(即结合指导RNA和靶标的Cpf1酶)，衔接蛋白结合，并且衔接蛋白上的功能结构域以对于属性功能有效是有利的空间取向来定位。例如，如果功能结构域是转录激活因子(例如，VP64或p65)，则转录激活因子被定位成允许其影响靶的转录的空间取向。同样地，转录阻遏物将有利地定位成影响靶的转录，并且核酸酶(例如Fok1)将有利地定位成切割或部分切割靶。

技术人员将理解，对指导RNA的修饰(这些修饰允许衔接蛋白+功能结构域的结合但不适当定位衔接蛋白+功能结构域(例如，由于CRISPR复合物的三维结构内的空间位阻))不是故意的修饰。该一种或多种修饰的指导RNA可以通过在同向重复序列内的同向重复序列的5'或指导序列的3'引入一个或多个不同RNA序列来修饰。

指导RNA可以被设计成包括对相同或不同衔接蛋白具有特异性的多个结合识别位点(例如适配体)。Cpf1酶的指导RNA的特征在于其通常为37-43个核苷酸，并且其仅含有一个茎环。指导RNA可以被设计成结合位于转录起始位点(即TSS)的上游的启动子区-1000-+1核酸，优选-200核酸。此定位改善了影响基因激活(例如，转录激活因子)或基因抑制(例如，转录阻遏物)的功能结构域。修饰指导RNA可以是组合物中包含的靶向一个或多个靶座位的一个或多个修饰指导RNA(例如至少1个指导RNA、至少2个指导RNA、至少5个指导RNA、至少10个指导RNA、至少20个指导RNA、至少30个指导RNA、至少50个指导RNA)。

降低脱靶效应的酶突变

在一个方面中，如本文所述的根据本发明的CRISPR酶(Cpf1)具有一个或多个导致脱靶效应降低的突变，即用于例如当与指导RNA复合时对靶座位实施修饰但降低或消除朝向脱靶的活性的改进CRISPR酶，以及用于例如当与指导RNA复合时增加CRISPR酶活性的改进CRISPR酶。应该理解的是，如下文所述的突变型酶可以用于本文其他地方所述的根据本发明的任一方法中。如本文其他地方所述的方法、产物、组合物和用途中的任一种是同样适用于如下文进一步详述的突变型CRISPR酶。应该理解的是，在如本文所述的方面和实施例中，当提及或解读作为CRISPR酶的Cpf1时，功能CRISPR-Cas系统的重构优选不需要或不依赖于tracr序列并且/或者同向重复序列是指导(靶或间隔区)序列的5'(上游)。

作为进一步指导，提供了以下的特定方面和实施例。

诸位发明人已经出人意料地确定，可以对CRISPR酶进行修饰，这些修饰使得相比于未修饰CRISPR酶脱靶活性降低并且/或者相比于未修饰CRISPR酶靶活性增加。因此，在本发明的某些方面中，本文提供了可以在宽范围的基因修饰应用中具有效用的改进CRISPR酶。本文还提供了CRISPR复合物、组合物和系统以及方法和用途，所有包含了本文披露的修饰CRISPR酶。

在本披露中，术语“Cas”可以意指“Cpf1”或CRISPR酶。在本发明的此方面情况下，Cpf1或CRISPR酶是突变的或修饰的，“由此相比于未修饰酶CRISPR复合物中的酶具有降低的修饰一个或多个脱靶座位的能力”(或类似表达)；并且，当阅读本申请时，术语“Cpf1”或“Cas”或“CRISPR酶”等意指包括根据本发明的突变或修饰的Cpf1或Cas或CRISPR酶，即“由此相比于未修饰酶CRISPR复合物中的酶具有降低的修饰一个或多个脱靶座位的能力”(或类似表达)。

在一个方面中，如本文所述的根据本发明的Cpf1与包含RNA的核酸分子复合以形成CRISPR复合物，其中当在CRISPR复合物中时，其中当处于CRISPR复合物中时，核酸分子靶向一个或多个靶多核苷酸座位，与未修饰Cpf1蛋白相比，该蛋白包含至少一种修饰，并且其中相比于包含未修饰Cpf1蛋白的复合物，包含修饰蛋白的CRISPR复合物具有改变的活性。应该理解的是，当本文提及CRISPR“蛋白”时，Cpf1蛋白优选是修饰的CRISPR酶(例如具有增加或降低(或没有)酶活性)，例如非限制性地包括Cpf1。术语“CRISPR蛋白”可以与“CRISPR酶”可互换地使用，而不考虑相比于野生型CRISPR蛋白，该CRISPR蛋白是否被改变，例如增加或降低(或没有)酶活性。

在一个方面中，工程化的CRISPR蛋白的活性改变包括关于包含RNA的核酸分子或靶多核苷酸座位的结合特性改变，关于包含RNA的核酸分子或靶多核苷酸座位的结合动力学改变，或关于包含RNA的核酸分子或靶多核苷酸座位的相比于脱靶多核苷酸座位的结合特异性改变。

在一些实施例中，未修饰Cas具有DNA切割活性，例如Cpf1。在一些实施例中，Cas引导靶序列位置处的，例如靶序列内和/或靶序列互补序列内的一条或两条链的切割。在一些实施例中，Cas引导从靶序列的第一个或最后一个核苷酸开始的约1、2、3、4、5、6、7、8、9、10、15、20、25、50、100、200、500或更多个碱基对内的一条或两条链的切割。在一些实施例中，载体编码相对于相应野生型酶发生突变的Cas，使得突变型Cas缺乏切割含有靶序列的靶多核苷酸的一条或两条链的能力。在一些实施例中，当突变型酶的DNA切割活性不超过该酶的非突变形式的DNA切割活性的约25％、10％、5％、1％、0.1％、0.01％或更少时，Cas被认为是实质性缺乏所有DNA切割活性的；一个实例可以是当突变形式的DNA切割活性是零或与非突变形式相比是可忽视的时候。因此，Cas可以包含一个或多个突变并且可以在融合或未融合至功能结构域的情况下用作通用DNA结合蛋白。这些突变可以是人工引入的突变或者增功能或失功能突变。在本发明的一个方面中，Cas酶可以融合至蛋白质，例如TAG，和/或诱导型/控制型结构域例如化学诱导型/控制型结构域。本发明中的Cas可以是嵌合的Cas蛋白；例如，通过成为嵌合体而具有增强功能的Cas。嵌合Cas蛋白可以是含有来自超过一种的天然存在的Cas的片段的新Cas。这些可以包括一种Cas9同源物的一个或多个N末端片段与另一种Cas同源物的一个或多个C末端片段的融合物。Cas可以呈mRNA形式被递送至细胞中。本发明的目的明确是避免已知突变上的读取。实际上，短语“由此相比于未修饰酶CRISPR复合物中的酶具有降低的修饰一个或多个脱靶座位的能力并且/或者由此相比于未修饰酶CRISPR复合物中的酶具有增加的修饰一个或多个靶座位的能力”(或类似表达)不意图读取仅产生切口酶或无效Cas的突变或已知的Cas突变。然而，这不是说本发明的一种或多种修饰或一个或多个突变，“由此相比于未修饰酶CRISPR复合物中的酶具有降低的修饰一个或多个脱靶座位的能力并且/或者由此相比于未修饰酶CRISPR复合物中的酶具有增加的修饰一个或多个靶座位的能力”(或类似表达)不可以与产生为切口酶或无效酶的突变组合。此无效酶可以是增强的核酸分子结合剂。并且此切口酶可以是增强的切口酶。例如，将沟中和沟附近的一个或多个中性氨基酸和/或Cas中紧密接近核酸(例如，DNA、cDNA、RNA、gRNA)的其他位置中的其他带电荷的残基改变为一个或多个带正电荷的氨基酸可以“由此使得相比于未修饰酶CRISPR复合物中的酶具有降低的修饰一个或多个脱靶座位的能力并且/或者由此使得相比于未修饰酶CRISPR复合物中的酶具有增加的修饰一个或多个靶座位的能力”，例如产生更多切割。因为此切割可以是增强的中靶切割和脱靶切割两者(超切割的Cpf1)，使用了本领域已知的截短指导序列(tru-guide)或截短sgRNA(tru-sgRNA)(例如参见Fu等人，“Improving CRISPR-Cas nuclease specificity using truncated guide RNAs[使用截短的指导RNA改进CRISPR-Cas核酸酶特异性]”，Nature Biotechnology[自然生物技术]32,279-284(2014)doi:10.1038/nbt.2808，2013年11月17日接收，2014年1月06日接受，2014年1月26日在线公开，2014年1月29日在线修正)以使得靶活性增强而没有较高的脱靶切割或用于产生超切割的切口酶，或用于与使得Cas无效用作超结合剂的突变组合。

为了优化Cpf1效应蛋白对所设想的不同应用的适合性，可以优化和定制Cpf1与靶DNA之间的相互作用。Cpf1与靶DNA之间的相互作用由特异性和非特异性相互作用组分组成。实际上，Cpf1与靶DNA的相互作用将以非特异性方式基于例如酶的一般构象，其可影响DNA结合。可以引入Cpf1酶的突变，其影响这种非特异性相互作用。另一方面，也可以修改Cpf1的特异性相互作用。最近描述了一种用于生成具有增强的特异性的Cas9直向同源物的方法(Slaymaker等人2015)。此策略可以用于增强Cpf1直向同源物的特异性。这基于Cpf1的一个或多个核酸酶结构域内所有正电荷残基(K/R)的突变。理想地，两个方面都将允许技术人员优化针对所期望应用的DNA结合相互作用。在特定的实施例中，这将允许使用Cpf1作为其他效应物的DNA对接平台。

在某些实施例中，工程化的Cpf1蛋白的活性改变包括靶向效率增加或脱靶结合减少。在某些实施例中，工程化的Cpf1蛋白的活性改变包括切割活性的修饰。

在某些实施例中，活性改变包括关于包含RNA的核酸分子或靶多核苷酸座位的结合特性改变，关于包含RNA的核酸分子或靶多核苷酸座位的结合动力学改变，或关于包含RNA的核酸分子或靶多核苷酸座位的相比于脱靶多核苷酸座位的结合特异性改变。

在某些实施例中，活性改变包括靶向效率增加或脱靶结合减少。在某些实施例中，活性改变包括切割活性的修饰。在某些实施例中，活性改变包括关于靶多核苷酸座位的切割活性增加。在某些实施例中，活性改变包括关于靶多核苷酸座位的切割活性减少。在某些实施例中，活性改变包括关于脱靶多核苷酸座位的切割活性减少。在某些实施例中，活性改变包括关于脱靶多核苷酸座位的切割活性增加。

在某些实施例中，活性改变包括关于靶多核苷酸座位的切割活性增加。在某些实施例中，活性改变包括关于靶多核苷酸座位的切割活性减少。在某些实施例中，活性改变包括关于脱靶多核苷酸座位的切割活性减少。在某些实施例中，活性改变包括关于脱靶多核苷酸座位的切割活性增加。因此，在某些实施例中，相比于脱靶多核苷酸座位，存在对靶多核苷酸座位的特异性的增加。在其他实施例中，相比于脱靶多核苷酸座位，存在对靶多核苷酸座位的特异性的降低。

在本发明的一个方面中，工程化的Cpf1蛋白的活性改变包括解旋酶动力学的改变。

在本发明的一个方面中，工程化的Cpf1蛋白包含改变该蛋白质与包含RNA的核酸分子，或靶多核苷酸座位的链，或脱靶多核苷酸座位的链的缔合的修饰。在本发明的一个方面中，工程化的Cpf1蛋白包含改变CRISPR复合物的形成的修饰。

在某些实施例中，改变的Cpf1蛋白包含改变核酸分子对多核苷酸座位的靶向的修饰。在某些实施例中，修饰包括蛋白质中与核酸分子缔合的区中的突变。在某些实施例中，修饰包括蛋白质中与靶多核苷酸座位的链缔合的区中的突变。在某些实施例中，修饰包括蛋白质中与脱靶多核苷酸座位的链缔合的区中的突变。在某些实施例中，修饰或突变包括蛋白质中与包含RNA的核酸分子、或靶多核苷酸座位的链、或脱靶多核苷酸座位的链缔合的区中的正电荷的减少。在某些实施例中，修饰或突变包括蛋白质中与包含RNA的核酸分子、或靶多核苷酸座位的链、或脱靶多核苷酸座位的链缔合的区中的负电荷的减少。在某些实施例中，修饰或突变包括蛋白质中与包含RNA的核酸分子、或靶多核苷酸座位的链、或脱靶多核苷酸座位的链缔合的区中的正电荷的增加。在某些实施例中，修饰或突变包括蛋白质中与包含RNA的核酸分子、或靶多核苷酸座位的链、或脱靶多核苷酸座位的链缔合的区中的负电荷的增加。在某些实施例中，修饰或突变增加了蛋白质与包含RNA的核酸分子、或靶多核苷酸座位的链、或脱靶多核苷酸座位的链之间的空间位阻。在某些实施例中，修饰或突变包括Lys、His、Arg、Glu、Asp、Ser、Gly或Thr的取代。在某些实施例中，修饰或突变包括Gly、Ala、Ile、Glu或Asp的取代。在某些实施例中，修饰或突变包括结合沟中的氨基酸取代。

在某些实施例中，修饰可包括修饰该酶的一个或多个氨基酸残基。在某些实施例中，修饰可以包括位于包含为未修饰酶中的带正电荷的残基的区中的一个或多个氨基酸残基的修饰。在某些实施例中，修饰可以包括未修饰酶中的一个或多个带正电荷的氨基酸残基的修饰。在某些实施例中，修饰可以包括未修饰酶中的一个或多个不带正电荷的氨基酸残基的修饰。修饰可以包括未修饰酶中的一个或多个不带电荷的氨基酸残基的修饰。修饰可以包括未修饰酶中的一个或多个带负电荷的氨基酸残基的修饰。修饰可以包括未修饰酶中的一个或多个疏水性氨基酸残基的修饰。修饰可以包括未修饰酶中的一个或多个极性氨基酸残基的修饰。在某些实施例中，修饰可以包括位于凹槽中的一个或多个残基的修饰。在某些实施例中，修饰可以包括位于凹槽外的一个或多个残基的修饰。在某些实施例中，修饰包括一个或多个残基的修饰，其中一个或多个残基包括精氨酸、组氨酸或赖氨酸。在某些实施例中，可以通过突变所述一个或多个残基来修饰酶。在某些实施例中，该酶是通过所述一个或多个残基的突变来修饰的，并且其中突变包括使用丙氨酸取代未修饰酶中的残基。在某些实施例中，该酶是通过所述一个或多个残基的突变来修饰的，并且其中突变包括使用天冬氨酸或谷氨酸取代未修饰酶中的残基。在某些实施例中，该酶是通过所述一个或多个残基的突变来修饰的，并且其中突变包括使用丝氨酸、苏氨酸、天冬酰胺或谷氨酰胺取代未修饰酶中的残基。在某些实施例中，该酶是通过所述一个或多个残基的突变来修饰的，并且其中突变包括使用丙氨酸、甘氨酸、异亮氨酸、亮氨酸、蛋氨酸、苯丙氨酸、色氨酸、酪氨酸或缬氨酸取代未修饰酶中的残基。在某些实施例中，该酶是通过所述一个或多个残基的突变来修饰的，并且其中突变包括使用极性氨基酸残基取代未修饰酶中的残基。在某些实施例中，该酶是通过所述一个或多个残基的突变来修饰的，并且其中突变包括使用为非极性氨基酸残基的氨基酸残基取代未修饰酶中的残基。在某些实施例中，该酶是通过所述一个或多个残基的突变来修饰的，并且其中突变包括使用带负电的氨基酸残基取代未修饰酶中的残基。在某些实施例中，该酶是通过所述一个或多个残基的突变来修饰的，并且其中突变包括使用为非带负电荷的氨基酸残基的氨基酸残基取代未修饰酶中的残基。在某些实施例中，该酶是通过所述一个或多个残基的突变来修饰的，并且其中突变包括使用不带电氨基酸残基取代未修饰酶中的残基。在某些实施例中，该酶是通过所述一个或多个残基的突变来修饰的，并且其中突变包括使用为不带电氨基酸残基的氨基酸残基取代未修饰酶中的残基。在某些实施例中，该酶是通过所述一个或多个残基的突变来修饰的，并且其中突变包括使用疏水性氨基酸残基取代未修饰酶中的残基。在某些实施例中，该酶是通过所述一个或多个残基的突变来修饰的，并且其中突变包括使用为非疏水性氨基酸残基的氨基酸残基取代未修饰酶中的残基。在某些实施例中，酶是通过本文列出的任一个残基或对应直向同源物中的相应残基的突变来修饰的，或包含修饰，例如包括通过该突变进行的修饰、基本上由或由通过该突变进行的修饰组成；或者该酶包含根据整个本申请中的披露内容的任何一个(单个)、两个(双重)、三个(三重)、四个(四重)或更多个位置的，或CRISPR酶直向同源物中的相应残基或位置的修饰、基本由或由该修饰组成，例如包含本文所列举的任一种Cpf1残基的或CRISPR酶直向同源物中的相应残基或位置的修饰、基本上由或由该修饰组成的酶。在此酶中，每个残基可以通过使用丙氨酸残基的取代来修饰。

申请人最近描述了一种用于产生具有增强的特异性的Cas9直向同源物的方法(Slaymaker等人2015“Rationally engineered Cas9nucleases with improvedspecificity[具有提高的特异性的合理工程化Cas9核酸酶]”)。此策略可以用于增强Cpf1直向同源物的特异性。用于诱变的初级残基优选是RuvC结构域中的所有带正电荷的残基。另外的残基是在不同直向同源物之间为保守的带正电荷的残基。

在某些实施例中，Cpf1的特异性可以通过使稳定化非靶向DNA链的残基发生突变来改进。

在任何(非天然存在的)CRISPR酶(如本文定义的根据本发明的Cpf1)中：

在靶标与一个或多个脱靶座位的相应序列之间可以存在单个错配；和/或

在靶标与一个或多个脱靶座位的相应序列之间可以存在两个、三个或四个或更多个错配，并且/或者

其中在(ii)中所述两个、三个或四个或更多个错配是连续的。

在任一非天然存在的CRISPR酶中，相比于未修饰酶CRISPR复合物中的酶可以具有降低的修饰一个或多个脱靶座位的能力并且其中相比于未修饰酶CRISPR复合物中的酶具有增加的修饰所述靶座位的能力。

在任一非天然存在的CRISPR酶中，相比于未修饰酶的相对差异，当在CRISPR复合物中时酶在靶标与至少一个脱靶座位之间的修饰能力的相对差异可以是增加的。

在一个方面中，本发明提供了如本文所限定的CRISPR核酸酶，例如如本文所述根据本发明的Cpf1，当涉及中靶相互作用时其具有朝向与切割活性相关联的构象的改进平衡并且/或者当涉及脱靶相互作用时其具有远离与切割活性相关联的构象的改进平衡。在一个方面中，本发明提供了具有改进的校对功能的Cas(例如Cpf1)核酸酶，即采用一种在中靶位点处具有核酸酶活性的构象的Cas(例如Cpf1)核酸酶，并且该构象在脱靶位点处具有增加的不利性。Sternberg等人,Nature[自然]527(7576):110-3,doi:10.1038/nature15544，2015年10月28日在线公开.电子版2015年10月28日，使用了荧光共振能量转移(resonance energy transfer(FRET))实验来检测Cas(例如Cpf1)催化结构域在与中靶DNA和脱靶DNA缔合时的相对取向，并且这可以外推到本发明的CRISPR酶(例如Cpf1)。

本发明进一步提供了用于使用修饰的指导RNA调控核酸酶活性和/或特异性的方法和突变。如所讨论的，中靶核酸酶活性可以是增加的或减少的。另外，脱靶核酸酶活性可以是增加的或减少的。此外，对中靶活性的特异性相比于对脱靶活性的特异性可以存在增加或减少。修饰指导RNA包括但不限于，截短的指导RNA、无效指导RNA、化学上修饰的指导RNA、与功能结构域缔合的指导RNA、包含功能结构域的修饰指导RNA、包含适配体的修饰指导RNA、包含衔接蛋白的修饰指导RNA以及包含添加或修饰的环的指导RNA。在一些实施例中，一个或多个功能结构域与无效gRNA(dRNA)缔合。在一些实施例中，与CRISPR酶复合的dRNA引导功能结构域在一个基因座位处的基因调节，同时gRNA引导CRISPR酶在另一个座位处的DNA切割。在一些实施例中，dRNA被选择为与脱靶调节相比使对目的基因座位的调节选择性最大化。在一些实施例中，dRNA被选择为最大化靶基因调节并且最小化靶标切割。

在一个方面中，本发明还提供了用于调控Cas(例如Cpf1)结合活性和/或结合特异性的方法和突变。在某些实施例中，使用了缺乏核酸酶活性的Cas(例如Cpf1)蛋白。在某些实施例中，采用了促进Cas(例如Cpf1)核酸酶的结合但不促进其核酸酶活性的修饰指导RNA。在此类实施例中，中靶结合可以被增加或减少。另外，在此类实施例中，脱靶结合可以被增加或减少。另外，对于中靶结合相比于脱靶结合的特异性可以存在增加或减少。

可以不同组合被采用来增加或减少活性和/或使中靶活性相比于脱靶活性的特异性增加或减少，或增加或减少结合和/或使中靶结合相比于脱靶结合的特异性增加或减少的方法和突变可以用于补偿或增强被形成来促进其他效应的突变或修饰。被形成来促进其他效应的此类突变或修饰包括对Cas(例如Cpf1)的突变或修饰和/或对指导物所进行的设计/突变/修饰。特别地，尽管天然存在的CRISPR/Cas系统涉及由核糖核苷酸(即，指导RNA)组成的指导物，但本发明的工程化系统的指导物可包含脱氧核糖核苷酸、非天然存在的核苷酸和/或核苷酸类似物以及核糖核苷酸。此外，本发明的指导物可包含碱基取代/添加/缺失。

在某些实施例中，将这些方法和Cpf1蛋白与包含非天然存在的核酸和/或非天然存在的核苷酸和/或核苷酸类似物的指导物一起使用，或该指导物是化学修饰的指导RNA。非天然存在的核酸包括例如核苷酸的混合物。可以在核糖、磷酸和/或碱基部分处修饰非天然存在的核苷酸和/或核苷酸类似物。在本发明的一个实施例中，指导核酸包含核糖核苷酸和非核糖核苷酸。在一个这样的实施例中，指导物包含一种或多种核糖核苷酸和一种或多种脱氧核糖核苷酸。在本发明的一个实施例中，该指导物包含一种或多种非天然存在的核苷酸或核苷酸类似物，例如具有硫代磷酸酯键的核苷酸、锁核酸(LNA)核苷酸(其包含核糖环的2'和4'碳之间的亚甲基桥)、或桥接核酸(BNA)。修饰的核苷酸的其他实例包括2'-O-甲基类似物、2'-脱氧类似物或2'-氟代类似物。修饰的碱基的另外的实例包括但不限于2-氨基嘌呤、5-溴-尿苷、假尿苷、肌苷、7-甲基鸟苷。指导RNA化学修饰的实例包括但不限于在一个或多个末端核苷酸处掺入2′-O-甲基(M)、2′-O-甲基3′硫代磷酸酯(MS)或2′-O-甲基3′硫代PACE(MSP)。与未修饰的指导物相比，此类化学修饰的指导物可以具有增加的稳定性和增加的活性，但是中靶相比于脱靶的特异性是不可测的。(参见Hendel,2015,NatBiotechnol.[自然生物技术]33(9):985-9,doi:10.1038/nbt.3290，2015年6月29日在线公开)。在某些实施例中，指导物包含在与靶DNA结合的区域中的核糖核苷酸和在与Cpf1结合的区域中的一个或多个脱氧核糖核苷酸和/或核苷酸类似物。在本发明的一个实施例中，将脱氧核糖核苷酸和/或核苷酸类似物掺入工程化指导结构中，例如但不限于茎-环区。本发明的方法和突变用于使用化学修饰的指导RNA调控Cas(例如Cpf1)核酸酶活性和/或dCpf1靶标结合活性和/或Cpf1结合。

用作RNA指导的结合蛋白的Cas(例如Cpf1)不限于无核酸酶的Cas(例如Cpf1)。具有核酸酶活性的Cas(例如Cpf1)酶当与某些指导RNA一起使用时也可以用作RNA指导的结合蛋白。例如，短指导RNA和包含与靶错配的核苷酸的指导RNA可以促进RNA引导的Cas(例如Cpf1)与靶序列的结合，几乎没有或没有产生靶切割。(参见例如Dahlman,2015,NatBiotechnol.[自然生物技术]33(11):1159-1161,doi:10.1038/nbt.3390，2015年10月05日在线公开)。

本发明提供了用于调控Cas(例如Cpf1)蛋白的结合的方法和突变。在一个实施例中，功能结构域包括VP64，提供了RNA指导的转录因子。在另一个实施例中，功能结构域包括Fok I，提供了RNA指导的核酸酶活性。参考美国专利公开2014/0356959、美国专利公开2014/0342456、美国专利公开2015/0031132，和Mali,P.等人,2013,Science[科学]339(6121):823-6,doi:10.1126/science[科学].1232033，2013年1月3日在线公开，并通过本文的教授内容，本发明包括这些文献结合本文教授内容应用的方法和材料。在某些实施例中，中靶结合被增加。在某些实施例中，脱靶结合被减少。在某些实施例中，中靶结合被减少。在某些实施例中，脱靶结合被增加。因此，本发明还提供了功能化的Cas(例如Cpf1)结合蛋白的中靶结合相比于脱靶结合增加或减少的特异性。

Cas(例如Cpf1)酶当与某些指导RNA一起使用时也可以用作RNA指导的结合蛋白。例如，短指导RNA和包含与靶错配的核苷酸的指导RNA可以促进RNA引导的Cas(例如Cpf1)与靶序列的结合，几乎没有或没有产生靶切割。(参见例如Dahlman,2015,Nat Biotechnol.[自然生物技术]33(11):1159-1161,doi:10.1038/nbt.3390，2015年10月05日在线公开)。在一个方面中，本发明提供了用于调控包含核酸酶活性的Cas(例如Cpf1)蛋白的结合的方法和突变。在某些实施例中，中靶结合被增加。在某些实施例中，脱靶结合被减少。在某些实施例中，中靶结合被减少。在某些实施例中，脱靶结合被增加。在某些实施例中，中靶结合相比于脱靶结合的特异性存在增加或减少。在某些实施例中，指导RNA-Cas(例如Cpf1)酶的核酸酶活性也被调控。

RNA-DNA异源双链体形成对整个靶区(不仅仅是最靠近PAM的种子区序列)的切割活性和特异性是重要的。因此，截短的指导RNA显示出降低的切割活性和特异性。在一个方面中，本发明提供了用于使用改变的指导RNA增加活性和特异性的方法和突变。

在一个方面中，本发明提供了有效中靶活性并且最小化脱靶活性。在一个方面中，本发明提供了由CRISPR蛋白进行的有效中靶切割并且最小化由CRISPR蛋白进行的脱靶切割。在一个方面中，本发明提供了在无DNA切割情况下CRISPR蛋白在基因座位处的特异性结合。在一个方面中，本发明提供了CRISPR蛋白在基因座位处的有效的指导序列引导的中靶结合并且最小化CRISPR蛋白的脱靶结合。因此，在一个方面中，本发明提供了靶特异性基因调节。在一个方面中，本发明提供了在无DNA切割情况下CRISPR酶在基因座位处的特异性结合。因此，在一个方面中，本发明使用单一CRISPR酶提供一个基因座位处的切割和不同基因座位处的基因调节。在一个方面中，本发明使用一种或多种CRISPR蛋白和/或酶提供多个靶标的正交激活和/或抑制和/或切割。

诱导型Cpf1 CRISPR-Cas系统(“拆分的-Cpf1”)

在一个方面中，本发明提供了一种如本文所述的根据本发明的(非天然存在或工程化的)诱导型Cpf1(CRISPR-Cas系统)，该系统包含：

附接至诱导型二聚体的第一半部的第一Cpf1融合构建体以及

附接至诱导型二聚体的第二半部的第二Cpf1融合构建体，

其中第一Cpf1融合构建体被可操作地连接至一个或多个核定位信号，

其中第二Cpf1融合构建体被可操作地连接至一个或多个核输出信号，

其中与诱导物能量源的接触使得诱导型二聚体的第一半部和第二半部合在一起，

其中使诱导型二聚体的第一半部和第二半部合在一起允许第一Cpf1融合构建体和第二Cpf1融合构建体组成功能性Cpf1(任选地其中Cpf1 CRISPR-Cas系统包含含有能够与细胞中目的基因组座位中的靶序列杂交的指导序列的指导RNA(gRNA)，并且

其中功能性Cpf1 CRISPR-Cas系统结合靶序列并且任选地编辑基因组座位以改变基因表达)。

在本发明的一个方面中，在诱导型Cpf1 CRISPR-Cas系统中，诱导型二聚体是或包含诱导型异源二聚体或基本上由或由该诱导型异源二聚体组成。在一个方面中，在诱导型Cpf1 CRISPR-Cas系统中，诱导型异源二聚体的第一半部或第一部分或第一片段是或包含FKBP(任选地FKBP12)或由或基本上由该FKBP组成。在本发明的一个方面中，在诱导型Cpf1CRISPR-Cas系统中，诱导型异源二聚体的第二半部或第二部分或第二片段是或包含FRB或由或基本上由该FRB组成。在本发明的一个方面中，在诱导型Cpf1 CRISPR-Cas系统中，第一Cpf1融合构建体的安排是或包含N'末端Cpf1部分-FRB-NES或由或基本上由该N'末端Cpf1部分-FRB-NES组成。在本发明的一个方面中，在诱导型Cpf1 CRISPR-Cas系统中，第一Cpf1融合构建体的安排是或包含NES-N'末端Cpf1部分-FRB-NES或由或基本上由该NES-N'末端Cpf1部分-FRB-NES组成。在本发明的一个方面中，在诱导型Cpf1 CRISPR-Cas系统中，第二Cpf1融合构建体的安排是或包含C'末端Cpf1部分-FKBP-NLS或基本上由或由该C'末端Cpf1部分-FKBP-NLS组成。在一个方面中，本发明提供了诱导型Cpf1CRISPR-Cas系统，第二Cpf1融合构建体的安排是或包含NLS-C'末端Cpf1部分-FKBP-NLS或由或基本上由该NLS-C'末端Cpf1部分-FKBP-NLS组成。在一个方面中，在诱导型Cpf1 CRISPR-Cas系统中，可以存在将Cpf1部分与诱导型二聚体的半部或部分或片段分开的接头。在一个方面中，在诱导型Cpf1CRISPR-Cas系统中，诱导物能量源是或包含雷帕霉素或基本上由或由雷帕霉素组成。在一个方面中，在诱导型Cpf1 CRISPR-Cas系统中，诱导型二聚体是诱导型同源二聚体。在一个方面中，在诱导型Cpf1 CRISPR-Cas系统中，Cpf1是AsCpf1、LbCpf1或FnCpf1。

在一个方面中，本发明提供了一种(非天然存在或工程化的)诱导型Cpf1CRISPR-Cas系统，该系统包含：

附接至诱导型异源二聚体的第一半部的第一Cpf1融合构建体以及

附接至诱导型异源二聚体的第二半部的第二Cpf1融合构建体，

其中第二CPf1融合构建体被可操作地连接至核输出信号，

其中与诱导物能量源的接触使得诱导型异源二聚体的第一半部和第二半部合在一起，

其中使诱导型异源二聚体的第一半部和第二半部合在一起允许第一Cpf1融合构建体和第二Cpf1融合构建体组成功能性Cpf1(任选地其中Cpf1 CRISPR-Cas系统包含含有能够与细胞中目的基因组座位中的靶序列杂交的指导序列的指导RNA(gRNA)，并且

其中功能性Cpf1 CRISPR-Cas系统编辑基因组座位以改变基因表达)。

因此，本发明尤其包括同源二聚体以及异源二聚体、例如通过突变产生的无效Cpf1或基本上不具有核酸酶活性的Cpf1、其中存在一个或多个NLS和/或一个或多个NES的系统或复合物；连接至拆分Cpf1的一个或多个功能结构域；包括治疗方法的方法，以及用途。

可以认为诱导物能量源是简单的诱导物或二聚化剂。术语“诱导物能量源”贯穿本文的使用是一致的。诱导物能量源(或诱导物)用来重构Cpf1。在一些实施例中，诱导物能量源通过诱导型二聚体的两个半部的作用使得Cpf1的两个部分合在一起。因此在存在诱导物能量源的条件下诱导型二聚体的两个半部变得更强韧。在不存在诱导物能量源的情况下，二聚体的两个半部将不形成为二聚体(进行二聚化)。

因此，诱导型二聚体的两个半部与诱导物能量源合作以二聚化二聚体。这进而通过使得Cpf1的第一部分和第二部分合在一起来重构Cpf1。

CRISPR酶融合构建体各自包含拆分Cpf1的一部分。这些优选经由接头例如本文所述的GlySer接头融合至二聚体的两个半部中的一个。二聚体的两个半部可以是合在一起形成同源二聚体的基本上相同的两个单体，或者它们可以是合在一起形成异源二聚体的不同单体。这样，两个单体可以被认为是全长二聚体的一个半部。

Cpf1是拆分的，在某种意义上，Cpf1酶的两个部分基本上包含有功能的Cpf1。Cpf1可以用作基因组编辑酶(当与靶DNA和指导序列形成复合物时)，例如切口酶或核酸酶(切割DNA的两条链)，或者该Cpf1可以是无效Cpf1，该无效Cpf1实质上是典型地由于其催化结构域中的一个或多个突变而具有非常小或没有催化活性的DNA结合蛋白。

拆分Cpf1的两个部分可以被认为是拆分Cpf1的N'末端部分和C'末端部分。融合典型地是在Cpf1的拆分点处。换句话说，拆分Cpf1的N'末端部分的C'末端融合至一个二聚体半部，而C'末端部分的N'末端融合至另一个二聚体半部。

Cpf1不是必须被拆分，在某种意思上，断裂是新创建的。拆分点典型地是经由计算机模拟设计的并且克隆到构建体中。合起来，拆分Cpf1的两个部分N'末端部分和C'末端部分形成全长Cpf1，该全长Cpf1包含优选至少70％或更多的野生型氨基酸(或编码它们的核苷酸)、优选至少80％或更多、优选至少90％或更多、优选至少95％或更多，并且最优选至少99％或更多的野生型氨基酸(或编码它们的核苷酸)。也许可以进行一些修整，并且设想到突变体。非功能结构域可以全部被去除。重要的是两个部分可以被结合在一起并且所希望的Cpf1功能被恢复或重构。

二聚体可以是同源二聚体或异源二聚体。

一个或多个，优选两个NLS可以用于可操作地连接至第一Cpf1构建体。一个或多个，优选两个NES可以用于可操作地连接至第一Cpf1构建体。NLS和/或NES优选侧接拆分Cpf1二聚体(即半二聚体)融合物，即一个NLS可以被定位在第一Cpf1构建体的N'末端处并且一个NLS可以被定位在第一Cpf1构建体的C'末端处。类似地，一个NES可以被定位在第二Cpf1构建体的N'末端处并且一个NES可以在第二Cpf1构建体的C'末端处。在提及N'末端或C'末端的情况下，应了解的是这些对应于相应核苷酸序列中的5'端和3'端。

优选的安排是，第一Cpf1构建体被安排为5'-NLS-(N'末端Cpf1部分)-接头-(二聚体的第一半部)-NLS-3'。优选的安排是，第二Cpf1构建体被安排为5'-NES-(二聚体的第二半部)-接头-(C'末端Cpf1部分)-NES-3'。合适的启动子优选在这些构建体中的每个的上游。两个构建体可以单独或一起递送。

在一些实施例中，可操作地连接至第二CPf1构建体的一个或多个NES中的一个或全部可以对换成NLS。然而，这典型地可能不是优选的并且在其他实施例中，可操作地连接至第二Cpf1构建体的定位信号是一个或多个NES。

还应了解的是，NES可以被可操作地连接至拆分Cpf1的N'末端片段并且NLS可以被可操作地连接至拆分Cpf1的C'末端片段。然而，可以优选的安排是其中NLS被可操作地连接至拆分Cpf1的N'末端片段并且NES被可操作地连接至拆分Cpf1的C'末端片段。

NES用作将第二Cpf1融合构建体定位在细胞核的外面，至少直到提供了诱导物能量源为止(例如，至少直到能量源被提供给诱导物以执行其功能为止)。诱导物的存在刺激了细胞质内两个Cpf1融合物的二聚化并且使得其热力学上值得用于将第一Cpf1融合物和第二Cpf1融合物二聚化成定位至细胞核。在不受理论束缚的情况下，申请人相信NES将第二Cpf1融合物隔离至细胞质(即细胞核的外面)。第一Cpf1融合物上的NLS将其定位至细胞核。在两种情况下，申请人使用NES或NLS来将平衡(核转运的平衡)移动至所希望的方向。二聚化典型地发生在细胞核的外面(非常少的部分可能发生在细胞核中)并且二聚化复合物上的NLS将核转运的平衡改变为核定位，所以二聚化的并因此重构的Cpf1进入细胞核。

有利地，申请人能够重构拆分Cpf1的功能。使用瞬时转染来证明该构想并且二聚化发生在存在诱导物能量源的背景下。对于Cpf1的单独片段，没有看到活性。然后使用通过慢病毒递送的稳定表达来研究这一点并且显示可以使用拆分Cpf1方法。

本发明的拆分Cpf1方法是有益的，因为其使得Cpf1活性是诱导型，从而允许时间控制。此外，可以使用不同的定位序列(即，NES和NLS为优选的)以降低来自自组装复合物的背景活性。组织特异性启动子，例如针对第一Cpf1融合构建体和第二Cpf1融合构建体中每个的组织特异性启动子也可以用于组织特异性靶向，从而提供空间控制。如果需要，两个不同的组织特异性启动子可以用于产生更精细程度的控制。对于阶段特异性启动子可以使用相同方法，或者可以存在阶段特异性启动子和组织特异性启动子的混合物，其中第一Cpf1融合构建体和第二Cpf1融合构建体中的一个在组织特异性启动子的控制下(即可操作地连接至或包含该组织特异性启动子)，而第一Cpf1融合构建体和第二Cpf1融合构建体中的另一个在阶段特异性启动子的控制下(即可操作地连接至或包含该阶段特异性启动子)。

诱导型Cpf1 CRISPR-Cas系统包含如本文所述的例如像可操作地连接至第一Cpf1融合构建体的一个或多个核定位序列(NLS)。理想的是，这些核定位序列具有足以驱动所述第一Cpf1融合构建体在真核细胞的细胞核中以可检测的量积累的强度。在不希望受到理论约束的情况下，据信核定位序列不是为真核生物中的Cpf1CRISPR-Cas复合物活性所需要的，但是包括此类序列增强系统的活性，特别是对于靶向细胞核中的核酸分子而言，并且有助于本发明的2-部分系统的操作。

同样地，第二Cpf1融合构建体被可操作地连接至核输出序列(NES)。实际上，其可以连接至一个或多个核输出序列。换句话说，与第二Cpf1融合构建体一起使用的输出序列的数目优选为1或2或3。典型地，2是优选的，但是1是足够的并且在一些实施例中1是优选的。NLS和NES的适合实例是本领域已知的。例如，优选的核输出信号(NES)是人类蛋白酪氨酸激酶2。优选的信号将是物种特异性的。

在使用FRB和FKBP系统的情况下，FKBP优选侧接核定位序列(NLS)。在使用FRB和FKBP系统的情况下，优选的安排是N'末端Cpf1-FRB-NES:C'末端Cpf1-FKBP-NLS。因此，第一Cpf1融合构建体将包含C'末端Cpf1部分并且第二Cpf1融合构建体将包含N'末端Cpf1部分。

本发明的另一有益方面是其可以迅速地开启，即其具有快速应答。据信，在不受理论束缚的情况下，通过现有(已经存在的)融合构建体(通过与诱导物能量源接触)可以比通过新融合构建体的表达(尤其是翻译)更迅速地诱导Cpf1活性。这样，第一Cpf1融合构建体和第二Cpf1融合构建体可以提前即在需要Cpf1活性之前表达在靶细胞中。然后Cpf1活性可以进行时间控制并且然后通过添加诱导物能量源迅速地进行重构，理想地，该重构比通过例如载体递送的Cpf1的表达(包括转录的诱导)作用更迅速(以二聚化异源二聚体并且从而提供Cpf1活性)。

申请人证明出CPf1可以被拆分为两组分，该两组分在重新合在一起时重构成功能核酸酶。采用雷帕霉素敏感的二聚化结构域，申请人产生了用于Cpf1介导的基因组编辑和转录调控的时间控制的化学诱导型Cpf1。换言之，申请人证明出可以通过将Cpf1拆分为两片段来使得其为化学诱导型的并且证明出雷帕霉素敏感的二聚化结构域可以用于Cpf1的受控重组装。申请人表明重组装的Cpf1可以用于介导基因组编辑(通过核酸酶/切口酶活性)以及转录调控(作为DNA结合结构域，所谓的“无效Cpf1”)。

这样，雷帕霉素敏感的二聚化结构域的使用是优选的。Cpf1的重组装是优选的。重组装可以通过结合活性的恢复来确定。在Cpf1是切口酶或诱导双链断裂的情况下，本文描述了相比于野生型的适合比较百分比。

雷帕霉素处理可以持续12天。剂量可以是200nM。此时间剂量和/或摩尔剂量是用于人类胚肾293FT(HEK293FT)细胞系的适当剂量的一个实例并且此剂量也可以用于其他细胞系。对于体内治疗性用途，此数字可以外推为例如mg/kg。然而，还设想，在此也使用用于向受试者给予雷帕霉素的标准剂量。关于“标准剂量”，其意指雷帕霉素的正常治疗性用途或初期指示下的剂量(即当给予雷帕霉素以用于防止器官排斥时所用的剂量)。

值得注意的是，Cpf1-FRB/FKBP片段的优选安排是分开的并且是失活的，直到FRB和FKBP的雷帕霉素诱导的二聚化使得功能性全长Cpf1核酸酶的重组装产生为止。因此，优选的是，附接至诱导型异源二聚体的第一半部的第一Cpf1融合构建体与附接至诱导型异源二聚体的第二半部的第二Cpf1融合构建体分开递送和/或分开定位。

为了隔离细胞质中的Cpf1(N)-FRB片段，在该片段不太可能与核定位的Cpf1(C)-FKBP片段二聚化的情况下，优选的是在Cpf1(N)-FRB上使用来自人类蛋白酪氨酸激酶2的单个核输出序列(NES)(Cpf1(N)-FRB-NES)。在雷帕霉素存在下，Cpf1(N)-FRB-NES与Cpf1(C)-FKBP-2xNLS二聚化以重构完全的Cpf1蛋白，这使得核运输(trafficking)的平衡朝核输入移动并且允许DNA靶向。

高剂量的Cpf1可以加剧表现出与指导链具有很少错配的脱靶(OT)序列处的indel频率。如果错配是非连续的和/或在指导序列的种子区的外面，则此类序列是特别易感的。因此，Cpf1活性的时间控制可以用于减少长期表达实验中的剂量并且因此与组成型活性Cpf1相比产生降低的脱靶indel。

申请人证明出拆分Cpf1的稳定、低拷贝表达可以用于在靶向的座位处诱导大量indel，而在脱靶位点处没有明显的突变。申请人克隆了Cpf1片段(基于拆分5的2部分，本文所述的)。

优选的安排是第一Cpf1构建体被安排为5'-第一定位信号-(N'末端CPf1部分)-接头-(二聚体的第一半部)-第一定位信号-3'并且第二Cpf1构建体被安排为5'-第二定位信号-(二聚体的第二半部)-接头-(C'末端Cpf1部分)-第二定位信号-功能结构域-3'。在此，功能结构域置于第二Cpf1构建体的3'端处。可替代地，功能结构域可以置于第一Cpf1构建体的5'端处。一个或多个功能结构域可以使用在3'端或5'端处或两个端处。合适的启动子优选在这些构建体中的每个的上游。两个构建体可以单独或一起递送。定位信号可以是NLS或NES，只要它们在每个构建体上不是相互混合的。

申请人证明出Cpf1可以被拆分为两个不同的片段，这些片段在使用化学品诱导重新合在一起时重构成功能性全长Cpf1核酸酶。拆分Cpf1体系结构将有用于多种应用。例如，拆分CPf1可以允许遗传策略用于通过将每个片段放在不同的组织特异性启动子下来将Cpf1活性限制于交叉的细胞群体。另外，不同的化学诱导型二聚化结构域例如APA和赤霉素也是可以采用的。

诱导物能量源优选是化学品诱导。

拆分部位或位置是Cpf1酶的第一部分与第二部分分开所在的那个点。在一些实施例中，第一部分包含或编码氨基酸1至X，而第二部分包含或编码氨基酸X+1至末端。在此实例中，编码是连续的，但这并非是总是需要的，因为氨基酸(或编码它们的核苷酸)可以从拆分末端中的任一个末端开始修整，前提条件是保留了足够的DNA结合活性和(如果需要)DNA切口酶或切割活性，例如与野生型Cpf1相比保留了至少40％、50％、60％、70％、80％、90％或95％活性。

本文提供的示例性编码可以参考野生型蛋白质，优选野生型FnCpf1、AsCpf1或LbCpf1。然而，设想的是，可以使用野生型Cpf1例如AsCpf1、LbCpf1或FnCpf1蛋白的突变体。在参考特定Cpf1的情况下，编码还可以不完全遵循，因为例如可以使用一些N'或C'末端截短或缺失，但是这可以使用标准序列比对工具来解决。直向同源物作为序列比对工具也是优选的。

因此，拆分部位可以利用本领域普通技术人员例如基于晶体数据和/或计算结构预测来选择。

例如，Cpf1核酸酶初级结构的计算分析揭示了三个不同的区。第一是C末端RuvC样结构域，其是仅功能表征的结构域。第二是N末端α-螺旋区并且第三是位于RuvC样结构域与α-螺旋区之间的混合的α区和β区。预测非结构化区的若干小片段在Cpf1初始结构之内。不同的Cpf1直向同源物内的暴露于溶剂且不保守的非结构化区可以代表用于拆分的优选侧面。

对于Fn、As和Lb Cpf1突变体，应该很容易理解潜在的拆分位点的相应位置是例如基于序列比对的。对于非Fn、非As和非Lb酶，如果直向同源物与预期Cpf1之间存在相对较高的同源度，则可以使用直向同源物的晶体结构，或可以使用计算预测。

理想的是，拆分部位应该位于区或环内。优选地，拆分部位出现在氨基酸序列的中断不引起结构特征(例如，α螺旋或β片层)的部分或全部破坏的地方。结构化的区(未在晶体结构中显现的区，因为这些区是未结构化的从而足以被“冻结”在晶体中)常常是优选的选择。申请人可以例如在Cpf1表面上暴露的未结构化区中进行拆分。

申请人可以遵循作为优选实例及作为指导提供的以下程序。因为未结构化区未在结晶结构中显现，所以申请人将晶体的周围氨基酸序列与Cpf1的初级氨基酸序列进行相互参考。每个未结构化区可以由例如约3至10个氨基酸组成，不显现在晶体中。因此申请人在这些氨基酸之间进行拆分。为了包括更多潜在的拆分侧面，申请人包括了位于Cpf1的外面的环中的拆分，使用了与未结构化区相同的标准。

在一些实施例中，拆分部位是在Cpf1的外面环中。在其他优选实施例中，拆分部位是在Cpf1的未结构化区中。未结构化区典型地是高柔性的外面环，该外面环的结构不能容易地由晶体图案来确定。

一旦拆分部位已被鉴定出，可以设计适合的构建体。

典型地，NES被定位在拆分氨基酸的第一部分的N'末端(或编码该部分的核苷酸的5'端)。在那样的情况下，NLS被定位在拆分氨基酸的第二部分的C'末端(或编码该部分的核苷酸的3'端)。以这种方式，第一Cpf1融合构建体可以被可操作地连接至一个或多个核输出信号并且第二Cpf1融合构建体可以被可操作地连接至核定位信号。

当然，可以提供相反的安排，其中NLS被定位在拆分氨基酸的第一部分的N'末端(或编码该部分的核苷酸的5'端)。在那样的情况下，NES被定位在拆分氨基酸的第二部分的C'末端(或编码该部分的核苷酸的3'端)。因此，第一Cpf1融合构建体可以被可操作地连接至一个或多个核定位信号并且第二Cpf1融合构建体可以被可操作地连接至核输出信号。

使得两个部分(拆分的任一侧面)具有大致相同的长度的拆分对于包装目的可能是有利的。例如，认为当转录物具有大约相同大小时维持两个片段之间的化学计量是容易的。

在某些实例中，人类密码子优化的Cpf1例如Cpf1效应蛋白，如AsCpf1、LbCpf1、或FnCpf1的N末端和C末端片段被分别融合至FRB和FKBP二聚化结构域。此安排可以是优选的。它们可以被转换(即N'末端融合至FKBP并且C'末端融合至FRB)。

本文优选使用接头例如(GGGGS)₃来将Cpf1片段与二聚化结构域分开。(GGGGS)₃是优选的，因为它是相对长的接头(15个氨基酸)。甘胺酸残基是最柔性的并且丝氨酸残基增加接头处于蛋白质之外的机会。(GGGGS)₆(GGGGS)₉或(GGGGS)₁₂可以优选地用作替代物。其他优选替代物是(GGGGS)₁、(GGGGS)₂、(GGGGS)₄、(GGGGS)₅、(GGGGS)₇、(GGGGS)₈、(GGGGS)₁₀、或(GGGGS)₁₁。

例如，(GGGGS)₃可以包含在N'末端Cpf1片段与FRB之间。例如，(GGGGS)₃可以包含在FKB与C'末端Cpf1片段之间。

替代性接头是可用的，当高柔性接头被认为作用最好，以使得Cpf1的2个部分合在一起并因此重构Cpf1活性的机会最大。一个替代方案是核质蛋白的NLS可以用作接头。

接头也可以用在Cpf1与任何功能结构域之间。同样，本文可以使用(GGGGS)₃接头(或因此6、9或12个重复版本)或者可以将核质蛋白的NLS用作CPf1与功能结构域之间的接头。

设想了FRB/FKBP系统的替代物。例如ABA和赤霉素系统。

因此，FKBP家族的优选实例是以下诱导型系统中的任一种。在FK506存在下与钙调磷酸酶A(CNA)二聚化的FKBP；在FKCsA存在下与CyP-Fas二聚化的FKBP；在雷帕霉素存在下与FRB二聚化的FKBP；在库马霉素存在下与GryB二聚化的GyrB；在赤霉素存在下与GID1二聚化的GAI；或在HaXS存在下与HaloTag二聚化的Snap-tag。

FKBP家族本身内的替代物也是优选的。例如，在FK1012存在下进行同源二聚化(即一个FKBP与另一个FKBP二聚化)的FKBP。因此，还提供了一种非天然存在或工程化的诱导型Cpf1 CRISPR-Cas系统，该系统包含：

附接至诱导型同源二聚体(homoodimer)的第一半部的第一Cpf1融合构建体以及

附接至诱导型同源二聚体的第二半部的第二Cpf1融合构建体，

其中第二Cpf1融合构建体被可操作地连接至(任选地一个或多个)核输出信号，

其中与诱导物能量源的接触使得诱导型同源二聚体的第一半部和第二半部合在一起，

其中使诱导型同源二聚体的第一半部和第二半部合在一起允许第一CPf1融合构建体和第二CPf1融合构建体组成功能性Cpf1 CRISPR-Cas系统，

其中Cpf1 CRISPR-Cas系统包含含有能够与细胞中的目的基因组座位中的靶序列杂交的指导序列的指导RNA(gRNA)，并且其中功能性Cpf1 CRISPR-Cas系统结合该靶序列，并且任选地编辑基因组座位以改变基因表达。

在一个实施例中，同源二聚体优选是FKBP并且诱导物能量源优选是FK1012。在另一个实施例中，同源二聚体优选是GryB并且诱导物能量源优选是库马霉素。在另一个实施例中，同源二聚体优选是ABA并且诱导物能量源优选是赤霉素。

在其他实施例中，二聚体是异源二聚物。异源二聚体的优选实例是以下诱导型系统中的任一种：在FK506存在下与钙调磷酸酶A(CNA)二聚化的FKBP；在FKCsA存在下与CyP-Fas二聚化的FKBP；在雷帕霉素存在下，在库马霉素存在下，与FRB二聚化的FKBP；在赤霉素存在下与GID1二聚化的GAI；或在HaXS存在下与HaloTag二聚化的Snap-tag。

申请人使用了FKBP/FRB，因为其是得到充分表征的，并且两个结构域是足以小(<100个氨基酸)至有助于包装的。此外，雷帕霉素已使用较长时间并且副作用是充分了解的。大的二聚化结构域(>300个氨基酸(aa))也应该起作用但是可能需要较长的接头来允许Cpf1重构进行。

Paulmurugan和Gambhir(Cancer Res[癌症研究],2005年8月15日65；7413)讨论了FRB/FKBP/雷帕霉素系统的背景。另一篇有用的论文是Crabtree等人的文章(Chemistry&Biology[化学和生物学]13,99-107,2006年1月)。

在一些实施例中诱导的Cpf1活性的峰值是有益的并且使用单一递送载体可以更容易地发生，但是通过双重载体系统(每个载体递送拆分CPf1的一个半部)也是可能的。峰值可以是高活性并且持续短时间尺度，典型地诱导物的寿命。

对于本文所述的所有方法，应了解的是，将需要适合的gRNA或指导序列。

诱导物的其他实例包括光和激素类。对于光，诱导型二聚体可以是异源二聚体并且包含二聚体的第一光-诱导型半部和二聚体的第二(且互补的)光-诱导型半部。第一光-诱导型二聚体半部和第二光-诱导型二聚体半部的优选实例是CIB1和CRY2系统。CIB1结构域是光敏感隐花色素2(CRY2)的异源二聚体结合配偶体。

在另一个实例中，蓝光-响应的磁体二聚化系统(pMag和nMag)可以融合至拆分Cpf1蛋白的两个部分。响应于光刺激，pMag和nMag进行二聚化并且Cpf1重组装。例如，结合Nihongaki等人(Nat.Biotechnol.[自然生物技术]33,755-790,2015)中的Cas9描述这种系统。

本发明包括的诱导物能量源可以是热、超声、电磁能或化学品。在本发明的一个优选实施例中，诱导物能量源可以是抗生素、小分子、激素、激素衍生物、类固醇或类固醇衍生物。在更优选的实施例中，诱导物能量源可以是脱落酸(ABA)、多西环素(DOX)、cumate、雷帕霉素、4-羟基他莫昔芬(4OHT)、雌激素或蜕皮激素。本发明提供的是，至少一种开关可以选自下组，该组由下项组成：基于抗生素的诱导型系统、基于电磁能的诱导型系统、基于小分子的诱导型系统、基于核受体的诱导型系统以及基于激素的诱导型系统。在一个更优选实施例中，至少一种开关可以选自下组，该组由下项组成：四环素(Tet)/DOX诱导型系统、光诱导型系统、ABA诱导型系统、cumate阻遏物/操纵子系统、4OHT/雌激素诱导型系统、基于蜕皮激素的诱导型系统以及FKBP12/FRAP(FKBP12-雷帕霉素复合物)诱导型系统。此类诱导物也如本文以及在PCT/US 2013/051418中被讨论，该专利通过引用并入本文。

作为另一个实例，可以形成拆分CPf1与荧光蛋白如GFP的融合物。这将允许基因组座位的成像(参见“Dynamic Imaging of Genomic Loci in Living Human Cells by anOptimized CRISPR/Cas System[通过优化的CRISPR/Cas系统使活人类细胞中的基因组座位动态成像]”Chen B等人Cell[细胞]2013)，但是以诱导方式进行。这样，在一些实施例中，一个或多个Cpf1部分可以与荧光蛋白例如GFP缔合(并且具体地是融合)。

在一个方面中，本发明提供了一种(非天然存在或工程化的)Cpf1(CRISPR-Cas系统)，该系统可以包含至少一种开关，其中所述Cpf1 CRISPR-Cas系统的活性是通过与关于该开关的至少一种诱导物能量源接触来控制的。在本发明的一个实施例中，关于至少一种开关的控制或所述Cpf1 CRISPR-Cas系统的活性可以得到激活、增强、终止或阻遏。与至少一种诱导物能量源的接触可以产生第一效应和第二效应。第一效应可以是下项中的一种或多种：核输入、核输出、次级组分(例如效应分子)的募集、(蛋白质、DNA或RNA的)构象变化、切割、货物(cargo)(例如笼装分子或辅助因子)的释放、缔合或解离。第二效应可以是下项中的一种或多种：关于至少一种开关的控制或所述Cpf1 CRISPR-Cas系统的活性的激活、增强、终止或阻遏。在一个实施例中，第一效应和第二效应可以级联发生。

在本发明的另一个方面中，Cpf1可以进一步包含至少一个或多个核定位信号(NLS)、核输出信号(NES)、功能结构域、柔性接头、突变、缺失、改变或截短。NLS、NES或功能结构域中的一个或多个可以是条件型地激活或失活。在另一个实施例中，突变可以是下项中的一种或多种：转录因子同源区中的突变、DNA结合结构域中的突变(例如使碱性螺旋环螺旋的碱性残基突变)、内源性NLS中的突变或内源性NES中的突变。本发明包括的诱导物能量源可以是热、超声、电磁能或化学品。在本发明的一个优选实施例中，诱导物能量源可以是抗生素、小分子、激素、激素衍生物、类固醇或类固醇衍生物。在更优选的实施例中，诱导物能量源可以是脱落酸(ABA)、多西环素(DOX)、cumate、雷帕霉素、4-羟基他莫昔芬(4OHT)、雌激素或蜕皮激素。本发明提供的是，至少一种开关可以选自下组，该组由下项组成：基于抗生素的诱导型系统、基于电磁能的诱导型系统、基于小分子的诱导型系统、基于核受体的诱导型系统以及基于激素的诱导型系统。在一个更优选实施例中，至少一种开关可以选自下组，该组由下项组成：四环素(Tet)/DOX诱导型系统、光诱导型系统、ABA诱导型系统、cumate阻遏物/操纵子系统、4OHT/雌激素诱导型系统、基于蜕皮激素的诱导型系统以及FKBP12/FRAP(FKBP12-雷帕霉素复合物)诱导型系统。

如本申请中详述的控制的方面涉及至少一种或多种开关。如本文所用的术语“开关”是指组分系统或集合，其以协调方式起作用，以影响生物功能的变化，包括生物功能的所有方面，例如该功能的激活、阻遏、增强或终止。在一个方面中，术语开关涵盖基因开关，该基因开关包括基因调节蛋白和这些蛋白质识别的特异性DNA序列的基本组分。在一个方面中，开关涉及在基因调节中使用的诱导和阻遏系统。总的来说，除非存在允许基因表达的一些分子(称为诱导物)，否则诱导型系统可以是关闭的。该分子被称为“诱导表达”。此发生的方式依赖于控制机制以及细胞类型中的差异。阻遏系统是除了在一些分子(称为辅阻遏物)的存在下之外，抑制基因表达的系统。该分子被称为“阻遏表达”。此发生的方式依赖于控制机制以及细胞类型中的差异。如本文所用的术语“诱导型的”可以涵盖开关的所有方面，与涉及的分子机制无关。因此，如由本发明包括的开关可以包括但不限于基于抗生素的诱导型系统、基于电磁能的诱导型系统、基于小分子的诱导型系统、基于核受体的诱导型系统以及基于激素的诱导型系统。在优选实施例中，开关可以是四环素(Tet)/DOX诱导型系统、光诱导型系统、脱落酸(ABA)诱导型系统、cumate阻遏物/操纵子系统、4OHT/雌激素诱导型系统、基于蜕皮激素的诱导型系统或FKBP12/FRAP(FKBP12-雷帕霉素复合物)诱导型系统。

同样产生化学品诱导型系统存在若干种不同的方式：1.由脱落酸(ABA)诱导的基于ABI-PYL的系统(例如参见，stke.sciencemag.org/cgi/content/abstract/sigtrans；4/164/rs2处的网站)，2.由雷帕霉素(或基于雷帕霉素的相关化学品)诱导的基于FKBP-FRB的系统(例如参见，nature.com/nmeth/journal/v2/n6/full/nmeth763.html处的网站)，3.由赤霉素(GA)诱导的基于GID1-GAI的系统(例如参见，nature.com/nchembio/journal/v8/n5/full/nchembio.922.html处的网站)。

由本发明涵盖的另一个系统是基于亚细胞定位中的变化的化学品诱导型系统。申请人还了解了一种被工程化为靶向目的基因组座位的诱导型Cpf1 CRISPR-Cas系统，其中Cpf1酶被拆分为进一步连接至化学品或能量敏感蛋白质的不同部分的两个融合构建体。在化学结合或能量转移至化学品或能量敏感蛋白质之后，此化学品或能量敏感蛋白质使得CPf1酶的任一个半部的亚细胞定位产生变化(即Cpf1酶的任一个半部从细胞质转运到细胞的细胞核中)。融合构建体从一个亚细胞区室或细胞器(在其中它的活性由于缺乏用于重构的Cpf1 CRISPR-Cas系统的底物而被隔离)到另一个亚细胞区室或细胞器(在其中存在底物)的这种转运允许这些组分合在一起并且重构功能活性，并且然后允许这些组分与其所需底物(即哺乳动物细胞核中的基因组DNA)接触，并且产生靶基因表达的激活或阻遏。

考虑了其他诱导型系统，例如但不限于通过下项进行的调节：重金属[Mayo KE等人,Cell[细胞]1982,29:99-108；Searle PF等人,Mol Cell Biol[分子细胞生物学]1985,5:1480-1489和Brinster RL等人,Nature[自然](伦敦)1982,296:39-42]、类固醇激素[Hynes NE等人,Proc Natl Acad Sci USA[美国国家科学院院刊]1981,78:2038-2042；Klock G等人,Nature[自然](伦敦)1987,329:734-736和Lee F等人,Nature[自然](伦敦)1981,294:228-232.]、热休克[Nouer L：Heat Shock Response.[热休克应答]Boca Raton,FL:CRC；1991]并且已经开发了其他试剂[Mullick A,Massie B:Transcription,translation and the control of gene expression[转录、翻译以及基因表达的控制].在由Speir RE编辑的Encyclopedia of Cell Technology[细胞技术的百科全书]中Wiley[威利公司]；2000:1140-1164以及Fussenegger M,.Biotechnol Prog[生物技术进展]2001,17:1-51]。然而，对于这些诱导型哺乳动物启动子存在局限性，例如“关闭”状态的“泄露”和诱导物(热休克、重金属、糖皮质激素等)的多效性。昆虫激素(蜕皮激素)的使用已在降低哺乳动物细胞中的细胞过程干扰的尝试中提出[No D等人,Proc Natl Acad Sci USA[美国国家科学院院刊]1996,93:3346-3351]。另一种优良系统使用雷帕霉素作为诱导物[Rivera VM等人,Nat Med[自然医学]1996,2:1028-1032]但雷帕霉素作为免疫抑制剂的作用是其体内使用的主要限制，并且因此需要发现用于控制基因表达的生物学惰性化合物[Saez E等人,Proc Natl Acad Sci USA[美国国家科学院院刊]2000,97:14512-14517]。

在特定实施例中，本文所述的基因编辑系统处于密码杀伤开关的控制下，该密码杀伤开关(passcode kill switch)是一种当改变细胞条件时有效地杀伤宿主细胞的机制。这是通过引入杂交体LacI-GalR家族转录因子来确保的，这些转录因子需要IPTG的存在以进行转换(Chan等人2015Nature[自然]Nature Chemical Biology[自然化学生物学]doi:10.1038/nchembio.1979)，并且可以用于驱动编码对细胞存活关键的酶的基因。通过将对不同化学品敏感的不同转录因子相结合，可以产生“代码”。此系统可以用于在空间和时间上控制CRISPR诱导的遗传修饰的程度，这在包括治疗性应用的不同领域中可能是有意义的并且避免GMO从其预定的环境中“逃逸”也可能是有意义的。

自失活系统

一旦细胞基因组中的基因的所有拷贝已被编辑,则该细胞中的连续的CRISRP/Cpf1表达不再需要。实际上，持续的表达在非预定基因组位点等处的脱靶效应情况下将是不希望的。因此，时间限制的表达将是有用的。诱导型表达提供了一种途径，但是此外，申请人设想了依赖于CRISPR载体本身内的非编码指导靶序列的用途的自失活Cpf1或CRISPR-Cpf1系统。因此，在表达开始之后，CRISPR系统将使得其自身破坏，但是在完全破坏之前，其将有编辑靶基因的基因组拷贝的时间(在二倍体细胞中的正常点突变的情况下，其需要至多两次编辑)。简单地，自失活Cpf1或CRISPR-Cas系统包括靶向CRISPR酶本身的编码序列或靶向与存在于以下项中的一种或多种中的独特序列互补的一种或多种非编码指导靶序列的附加RNA(即指导RNA)：

(a)在驱动非编码RNA元件的表达的启动子之内，

(b)在驱动Cpf1基因的表达的启动子之内，

(c)在Cpf1编码序列中的ATG翻译起始密码子的100bp之内，

(d)在病毒递送载体，例如在AAV基因组中反向末端重复序列(iTR)之内。

此外，RNA可以经由载体，例如单独的载体或编码CRISPR复合物的同一载体来递送。当通过单独的载体来提供时，靶向Cpf1表达的CRISPR RNA可以依序或同时给予。当依序给予时，在意图用于例如基因编辑或基因工程化的CRISPR RNA之后，将递送靶向Cpf1表达的CRISPR RNA。此时间段可以是数分钟(例如5分钟、10分钟、20分钟、30分钟、45分钟、60分钟)的时间。此时间段可以是数小时(例如2小时、4小时、6小时、8小时、12小时、24小时)的时间。此时间段可以是数天(例如2天、3天、4天、7天)的时间。此时间段可以是数周(例如2周、3周、4周)的时间。此时间段可以是数月(例如2个月、4个月、8个月、12个月)的时间。此时间段可以是数年(2年、3年、4年)的时间。在此方式中，Cas酶与能够与第一靶标(例如一个或多个目的基因组座位)杂交的第一gRNA缔合并且负责所希望的CRISPR-Cas系统的一种或多种功能(例如，基因工程化)；并且随后Cpf1酶可以接着与能够与包含至少一部分的Cpf1或CRISPR盒的序列杂交的第二gRNA缔合。在该gRNA靶向编码Cpf1蛋白的表达的序列的情况下，该酶受到阻碍并且系统发生自失活。以相同方式，经由如本文解释的例如脂质体、脂转染、纳米粒子、微泡施用的靶向Cpf1表达的CRISPR RNA可以依序或同时给予。类似地，自失活可以用于对用来靶向一个或多个靶标的一个或多个指导RNA进行失活。

在一些方面中，提供了单一gRNA，该单一gRNA能够与CRISPR酶起始密码子下游的序列杂交，由此在一段时间后，存在CRISPR酶表达的丧失。在一些方面中，提供了一个或多个gRNA，这些gRNA能够与编码CRISPR-Cas系统的多核苷酸的一个或多个编码或非编码区杂交，由此在一段时间后，存在一种或多种、或在一些情况下全部的CRISPR-Cas系统的失活。在系统的一些方面中，并且不受理论限制，细胞可以包含多种CRISPR-Cas复合物，其中第一亚组的CRISPR复合物包含能够靶向有待编辑的一个基因组座位或多个基因组座位的第一gRNA，并且第二亚组的CRISPR复合物包含能够靶向编码CRISPR-Cas系统的多核苷酸的至少一个第二gRNA，其中第一亚组的CRISPR复合物介导靶向的一个基因组座位或多个基因组座位的编辑并且第二亚组的CRISPR复合物最终使CRISPR-Cas系统失活，从而使细胞中的进一步CRISPR-Cas表达失活。

第一指导RNA可以靶向基因组内的目的任何靶序列，如本文其他地方所述的。第二指导RNA靶向编码CRISPR Cas9酶的载体内的序列，并且从而使来自该载体的酶的表达失活。因此，载体中的靶序列必须能够使表达失活。适合的靶序列可以是例如在Cpf1编码序列的翻译起始密码子附近或之内，在驱动非编码RNA元件的表达的启动子中的非编码序列中，在驱动Cpf1基因的表达的启动子之内，在Cpf1编码序列中的ATG翻译起始密码子的100bp之内，和/或在病毒递送载体，例如AAV基因组中的反向末端重复序列(iTR)之内。靠近此区域的双链断裂可以诱导Cpf1编码序列的移码，使得蛋白质表达丧失。用于使指导RNA“自失活”的替代性靶序列将旨在编辑/失活为CRISPR-Cpf1系统的表达或为载体的稳定性所需要的调节区/调控序列。例如，如果Cpf1编码序列的启动子被破坏，那么转录可以被抑制或阻止。类似地，如果载体包含用于复制、维持性或稳定性的序列，那么有可能靶向这些序列。例如，在AAV载体中，有用的靶序列是在iTR之内。其他有用的供靶向的序列可以是启动子序列、多聚腺苷酸化(polyadenlyation)位点等。

此外，如果指导RNA以阵列格式表达,则同时靶向两个启动子的“自失活”指导RNA将使得间插核苷酸从CRISPR-Cas表达构建体内切除，有效地使得其完全失活。类似地，在指导RNA靶向两个ITR，或同时靶向两种或更多种其他CRISPR-Cas组分的情况下，发生间插核苷酸的切除。总的来说，如本文解释的自失活是适用于CRISPR-Cpf1系统的，以便提供CRISPR-Cpf1的调节。例如，如本文解释的自失活可以适用于如本文解释的突变，例如扩增障碍的CRISPR修复。作为此自失活的结果，CRISPR修复仅仅具有瞬时活性。

向“自失活”指导RNA的5'端添加非靶向核苷酸(例如1-10个核苷酸，优选1-5个核苷酸)可以用于延迟其加工和/或修饰其效力以作为确保CRISPR-Cpf1停止之前的靶向的基因组座位处的编辑的手段。

在自失活Cpf1或CRISPR-Cpf1系统的一个方面中，可以建立共表达一种或多种目的gRNA靶向基因组序列(例如1-2、1-5、1-10、1-15、1-20、1-30)的质粒，其中靶向LbCpf1序列的“自失活”gRNA处于或靠近工程化的ATG起始位点(例如，在5个核苷酸之内、在15个核苷酸之内、在30个核苷酸之内、在50个核苷酸之内、在100个核苷酸之内)。U6启动子区中的调控序列也可以用gRNA靶向。U6驱动的gRNA可以被设计为阵列格式，使得多个gRNA序列可以同时被释放。当首先被递送至靶组织/细胞(离开的细胞)时，gRNA开始积累，同时Cpf1水平在细胞核中上升。Cpf1与介导CRISPR-Cpf1质粒的基因组编辑和自失活的所有gRNA复合。

自失活CRISPR-Cpf1系统的一个方面是由1至4或更多个不同指导序列；例如高达约20或约30个指导序列以单独或串联的阵列格式的表达。每个单个自失活指导序列可以靶向不同的靶标。这样可以从例如一个嵌合pol3转录物开始加工。可以使用Pol3启动子例如U6或H1启动子。Pol2启动子例如本文所提到的那些。反向末端重复(iTR)序列可以侧接Pol3启动子-一个或多个gRNA-Pol2启动子-Cpf1。

嵌合串联的阵列转录物的一个方面在于一种或多种指导序列编辑一个或多个靶标，而一个或多个自失活指导序列使CRISPR/Cpf1系统失活。因此，例如，用于修复扩增障碍的所述CRISPR-Cpf1系统可以直接与本文所述的自失活CRISPR-Cpf1系统相结合。此系统可以例如具有针对供修复的靶区的两个指导序列以及针对CRISPR-Cpf1的自失活的至少一个第三指导序列。参考申请序列号PCT/US2014/069897，题为“Compositions And Methods OfUse Of Crispr-Cas Systems In Nucleotide Repeat Disorders[在核苷酸重复障碍中使用Crispr-Cas系统的组合物和方法]”，2014年12月12日以WO/2015/089351公开。

指导RNA可以是控制指导序列。例如，其可以被工程化为靶向编码CRISPR酶本身的核酸序列，如US 2015232881 A1中所描述，该专利的披露内容通过引用并入本文。在一些实施例中，系统或组合物可以仅提供有被工程化为靶向编码CRISPR酶的核酸序列的指导RNA。此外，该系统或组合物可以提供有被工程化为靶向编码CRISPR酶的核酸序列以及编码CRISPR和任选地第二指导RNA和另外任选地修复模板的核酸序列的指导RNA。第二指导RNA可以是CRISPR系统或组合物(如本文所限定的此治疗性、诊断性、敲除性等)的主要靶标。以这种方式，该系统或组合物是自失活的。这是关于US 2015232881 A1(也如本文其他地方引用的WO 2015070083(A1)所公开的)中的Cas9进行举例说明的，并且可以外推到Cpf1。

使用Cpf1的基因编辑或改变靶座位

双链断裂或一条链的单链断裂应该有利地足以靠近靶位置，由此使得校正发生。在一个实施例中，距离不超过50、100、200、300、350或400个核苷酸。虽然不希望受理论约束，但是据信断裂应该足以靠近靶位置，由此使得断裂处于在端切除过程中遭受外切核酸酶介导的移除的区之内。如果靶位置与断裂之间的距离太大，则突变可能不被包含在端切除中，并且因此可能不被校正，因为模板核苷酸序列仅可以用于校正端切除区内的序列。

在一个实施例中，其中指导RNA和V型分子，具体地是Cpf1或其直向同源物或同源物，优选地Cpf1核酸酶诱导双链断裂，目的是为了诱导HDR-介导的校正，切割位点在离靶位置的0-200bp之间(例如0至175、0至150、0至125、0至100、0至75、0至50、0至25、25至200、25至175、25至150、25至125、25至100、25至75、25至50、50至200、50至175、50至150、50至125、50至100、50至75、75至200、75至175、75至150、75至125、75至100bp)。在一个实施例中，切割位点是在离靶位置的0-100bp之间(例如0至75、0至50、0至25、25至100、25至75、25至50、50至100、50至75或75至100bp)。在另一个实施例中，与Cpf1或其直向同源物或同源物复合的两个或更多个指导RNA可以用于诱导多重断裂，目的是为了诱导HDR介导的校正。

同源臂应该至少延伸至其中可以发生端切除的区，例如为了允许切除的单链突出端查找供体模板内的互补区。总体长度可能受参数例如质粒大小或病毒包装限制所限制。在一个实施例中，同源臂可以不延伸到重复元件中。示例性同源臂长度包括至少50、100、250、500、750或1000个核苷酸。

如本文所用的，靶位置是指靶核酸或靶基因(例如染色体)上的通过V型，具体地是Cpf1或其直向同源物或同源物，优选地Cpf1分子依赖性过程修饰的位点。例如，靶位置可以是进行靶核酸的修饰Cpf1分子切割和模板核酸引导的修饰例如校正的靶位置。在一个实施例中，靶位置可以是处于靶核酸上的两个核苷酸例如相邻核苷酸之间、向其中添加一个或多个核苷酸的位点。靶位置可以包含通过模板核酸改变例如校正的一个或多个核苷酸。在一个实施例中，靶位置处于靶序列(例如指导RNA所结合的序列)之内。在一个实施例中，靶位置处于靶序列(例如指导RNA所结合的序列)的上游或下游。

如本文所用的术语模板核酸是指可以与V型分子，具体地是Cpf1或其直向同源物或同源物，优选地Cpf1分子和指导RNA分子结合使用来改变靶位置的结构的核酸序列。在一个实施例中，靶核酸被修饰为典型地是在或靠近一个或多个切割位点处具有模板核酸的序列的一部分或全部。在一个实施例中，模板核酸是单链的。在一个替代性实施例中，模板核酸是双链的。在一个实施例中，模板核酸是DNA，例如双链DNA。在一个替代性实施例中，模板核酸是单链DNA。

在一个实施例中，模板核酸通过参与同源重组改变了靶位置的结构。在一个实施例中，模板核酸改变了靶位置的序列。在一个实施例中，模板核酸使得修饰的或非天然发生的碱基掺入到靶核酸中。

模板序列可以与靶序列一起经历断裂介导或催化的重组。在一个实施例中，模板核酸可以包含对应于靶序列上的被Cpf1介导的切割事件切割的位点的序列。在一个实施例中，模板核酸可以包含对应于两者，即靶序列上的在第一Cpf1介导的事件中被切割的第一位点和靶序列上的在第二Cpf1介导的事件中被切割的第二位点的序列。

在某些实施例中，模板核酸可以包含使得翻译序列的编码序列中发生改变的序列，例如使得蛋白质产物中的一个氨基酸取代另一个氨基酸，例如使得突变体等位基因转化为野生型等位基因，野生型等位基因转化为突变体等位基因，和/或引入终止密码子、插入氨基酸氨基、缺失氨基酸残基，或使得无意义突变发生的序列。在某些实施例中，模板核酸可以包含使得非编码序列中发生改变，例如外显子中或5'或3'非翻译区或非转录区中发生改变的序列。此类改变包括控制元件，例如启动子、增强子中的改变，以及顺式作用或反式作用控制元件中的改变。

可以使用与靶基因中的靶位置具有同源性的模板核酸以改变靶序列的结构。模板序列可以用于改变不想要的结构，例如不想要的或突变体核苷酸。模板核酸可以包含当整合时产生下项的序列：降低正控制元件的活性；增加正控制元件的活性；降低负控制元件的活性；增加负控制元件的活性；减少基因的表达；增加基因的表达；增加对障碍或疾病的抗性；增加对病毒进入的抗性；校正突变或改变不想要的氨基酸残基，赋予、增加、废除或减少基因产物的生物特性，例如增加酶的酶活性，或增加基因产物与另一个分子相互作用的能力。

模板核酸可以包含使得靶序列的1、2、3、4、5、6、7、8、9、10、11、12或更多个核苷酸的序列中发生变化的序列。在一个实施例中，模板核酸的长度可以是20+/-10、30+/-10、40+/-10、50+/-10、60+/-10、70+/-10、80+/-10、90+/-10、100+/-10、110+/-10、120+/-10、130+/-10、140+/-10、150+/-10、160+/-10、170+/-10、180+/-10、190+/-10、200+/-10、210+/-10或220+/-10个核苷酸。在一个实施例中，模板核酸的长度可以是30+/-20、40+/-20、50+/-20、60+/-20、70+/-20、80+/-20、90+/-20、100+/-20、1 10+/-20、120+/-20、130+/-20、140+/-20、I 50+/-20、160+/-20、170+/-20、180+/-20、190+/-20、200+/-20、210+/-20、或220+/-20个核苷酸。在一个实施例中，模板核酸的长度是10至1,000、20至900、30至800、40至700、50至600、50至500、50至400、50至300、50至200或50至100个核苷酸。

模板核酸包含以下组分：[5'同源臂]-[替换序列]-[3'同源臂]。同源臂提供了染色体中的重组，因此用替换序列替换了不希望的元件，例如突变或特征。在一个实施例中，同源臂侧接最远的切割位点。在一个实施例中，5'同源臂的3'端是靠近替换序列的5'端的位置。在一个实施例中，5'同源臂可以从替换序列的5'端延伸至少10、20、30、40、50、100、200、300、400、500、600、700、800、900、1000、1500或2000个核苷酸5'。在一个实施例中，3'同源臂的5'端是靠近替换序列的3'端的位置。在一个实施例中，3'同源臂可以从替换序列的3'端延伸至少10、20、30、40、50、100、200、300、400、500、600、700、800、900、1000、1500或2000个核苷酸3'。

在某些实施例中，一个或两个同源臂可以被缩短以避免包括某些序列重复元件。例如，5'同源臂可以被缩短以避免序列重复元件。在其他实施例中，3'同源臂可以被缩短以避免序列重复元件。在一些实施例中，5'同源臂和3'同源臂两者都可以被缩短以避免包括某些序列重复元件。

Cpf1效应蛋白复合物系统促进的非同源末端连接

在某些实施例中，核酸酶诱导的非同源末端连接(NHEJ)可以用于靶基因特异性敲除。核酸酶诱导的NHEJ还可以用于去除(例如缺失)目的基因中的序列。总体上，NHEJ通过使两个末端连接在一起来修复DNA的双链断裂；然而，总体上，只要两个相容末端在恰好它们通过双键断裂形成时被完美连接，原始序列就被恢复。在末端重新连接之前，双键断裂的DNA末端常常是酶加工的受试者，在一条或两条链处产生核苷酸的添加或去除。这使得NHEJ修复位点处的DNA序列中存在插入和/或缺失(indel)突变。这些突变中的三分之二典型地改变阅读框并且因此产生非功能蛋白。另外，维持阅读框但插入或缺失大量的序列的突变可以破坏蛋白质的功能性。这是座位依赖性的，因为关键功能结构域中的突变可能比蛋白质的非关键区中的突变耐受性低。由NHEJ产生的indel突变在性质上是不可预测的；然而，在给定的断裂位点处，某些indel序列是有利的并且是以群体来过度表示的，很可能是由于小的微同源区。缺失的长度可以广泛地变化；最常见是在1-50bp范围中，但是它们可以轻易大于50bp，例如它们可以轻易达到大于约100-200bp。插入往往是较短的并且常常包含紧密围绕断裂位点的序列的短的重复。然而，有可能获得大的插入，并且在这些情况下，插入的序列常常被跟踪至基因组的其他区域或跟踪至细胞中存在的质粒DNA。

因为NHEJ是诱变的方法，所以其还可以用于缺失小序列基序，只要特异性最终序列的产生是不需要的。如果双链断裂被靶向靠近短的靶序列，则由NHEJ修复导致的缺失突变常常跨越并且因此去除不想要的核苷酸。对于较大的DNA区段的缺失，引入两个双链断裂(序列的每侧上一个双链断裂)可以在末端之间产生NHEJ，其中去除了整个间插序列。这两个方法可以用于缺失特异性DNA序列；然而，NHEJ的易出错的性质仍可能在修复位点产生indel突变。

双链切割的V型分子，具体地是Cpf1或其直向同源物或同源物，优选地Cpf1分子和单链或切口酶V型分子，具体地是Cpf1或其直向同源物或同源物，优选地Cpf1分子两种均可以用于本文所述的方法和组合物中以产生NHEJ介导的indel。靶向基因，例如编码区，例如目的基因的早期编码区的NHEJ介导的indel可以用于敲除目的基因(即消除该目的基因的表达)。例如，目的基因的早期编码区包含紧跟着转录起始位点的序列，在编码序列的第一外显子内，或在转录起始位点的500bp内(例如，小于500、450、400、350、300、250、200、150、100或50bp)。

在一个实施例中，其中指导RNA和V型分子，具体地是Cpf1或其直向同源物或同源物，优选地Cpf1核酸酶产生了双链断裂，目的是为了诱导NHEJ介导的indel，指导RNA可以被构造成用于将一个双链断裂定位成紧密接近靶位置的核苷酸。在一个实施例中，切割位点可以是在离靶位置的0-500bp之间(例如，离靶位置少于500、400、300、200、100、50、40、30、25、20、15、10、9、8、7、6、5、4、3、2或1bp)。

在一个实施例中，其中与V型分子，具体地是Cpf1或其直向同源物或同源物，优选地Cpf1切口酶复合的两个指导RNA诱导了两个单链断裂，目的是为了诱导NHEJ介导的indel，两个指导RNA可以被构造成用于将两个单链断裂定位成向靶位置的核苷酸提供NHEJ修复。

Cpf1效应蛋白复合物可以递送功能效应物

与通过使DNA水平上的基因突变来永久性消除表达的CRISPR-Cas介导的基因敲除不同，CRISPR-Cas敲低(knockdown)允许通过使用人工转录因素来暂时减少基因表达。使Cpf1蛋白例如FnCpf1蛋白的两个DNA切割结构域中的关键残基突变(例如，D917A和H1006A突变)使得催化失活的Cpf1产生。催化失活的Cpf1与指导RNA复合并且定位至由指导RNA的靶向结构域所指定的DNA序列，然而该Cpf1不切割靶DNA。失活的Cpf1蛋白例如FnCpf1蛋白(例如D917A和H1006A突变)与效应物结构域例如转录阻遏结构域的融合能够将效应物募集至由指导RNA所指定的任何DNA位点。在某些实施例中，Cpf1可以被融合至转录阻遏结构域并且被募集至基因的启动子区。特别是对于基因阻遏，本文预期的是，阻断内源性转录因子的结合位点将有助于下调基因表达。在另一个实施例中，失活的Cpf1可以融合至染色质修饰蛋白。改变染色质状态可以使得靶基因表达减少。

在一个实施例中，指导RNA分子可以被靶向已知的转录应答元件(例如，启动子、增强子等)、已知的上游激活序列，和/或疑似能够控制靶DNA的表达的未知或已知功能的序列。

在一些方法中，可以使靶多核苷酸失活以实施细胞中的表达的修饰。例如，在CRISPR复合物与细胞中的靶序列结合后，靶多核苷酸失活，这样使得该序列不被转录，该编码蛋白不被产生，或者该序列不会像野生型序列一样起作用。例如，可以使蛋白质或微小RNA编码序列失活，这样使得该蛋白质不被产生。

在某些实施例中，CRISPR酶包含选自由D917A、E1006A和D1225A组成的组的一个或多个突变，并且/或者一个或多个突变是在CRISPR酶的RuvC结构域中或者是如本文所讨论的其他方式的突变。在一些实施例中，CRISPR酶在催化结构域中具有一个或多个突变，其中当转录时，同向重复序列形成单一茎环并且指导序列引导CRISPR复合物与靶序列的序列特异性结合，并且其中酶进一步包含功能结构域。在一些实施例中，功能结构域是转录激活结构域，优选地VP64。在一些实施例中，功能结构域是转录阻遏结构域，优选地KRAB。在一些实施例中，转录阻遏结构域是SID或SID的串联体(例如SID4X)。在一些实施例中，功能结构域是表观遗传修饰结构域，以便提供表观遗传修饰酶。在一些实施例中，功能结构域是激活结构域，它可以是P65激活结构域。

递送Cpf1效应蛋白复合物或其组分或者编码其组分的核酸分子

通过本披露和本领域知识，CRISPR-Cas系统，特别是本文所述的新型CRISPR系统或其组分或其核酸分子(包括例如HDR模板)或编码或提供其组分的核酸分子可以通过本文一般和详细描述的递送系统来递送。

因此，如本文所定义的gRNA(包括如本文其他地方所述的任何修饰的gRNA)、CRISPR酶(包括本文其他地方所述的任何修饰的CRISPR酶)可以各自单独地包含在组合物中并且单独或共同地给予至宿主。可替代地，这些组分可以提供于单一组合物中以用于向宿主给予。对宿主的给药可以经由技术人员已知的或本文描述的用于递送至宿主的病毒载体(例如，慢病毒载体、腺病毒载体、AAV载体)进行。如本文解释的，使用不同的选择标记物(例如，对于慢病毒gRNA选择)和gRNA浓度(例如，取决于是否使用多个gRNA)可能对引起改善的效应是有利的。基于此构想，若干种变体适合用于引起基因组座位事件，包括DNA切割、基因激活或基因失活。使用提供的组合物，本领域技术人员可以使用相同或不同功能结构域有利地且特异性地靶向单一或多个座位以引起一个或多个基因组座位事件。组合物可以应用在用于在细胞文库中筛选和在体内建立功能模型的各种方法中(例如，lincRNA的基因激活和功能的鉴定；增功能建模；失功能建模；为了优化和筛选目的，使用本发明的组合物建立细胞系和转基因动物)。

在一些方面中，本发明提供了包括以下各项的方法：向宿主细胞递送一种或多种多核苷酸，例如本文所述的一种或多种载体、其一种或多种转录物和/或由其转录的一种或多种蛋白质。在一些方面中，本发明进一步提供了通过此类方法产生的细胞以及包含此类细胞或由此类细胞产生的生物体(例如动物、植物或真菌)。在一些实施例中，将核酸靶向效应蛋白与指导RNA组合(以及任选地与其复合)递送到细胞中。常规的基于病毒和非病毒的基因转移方法可以用于在哺乳动物细胞或靶组织中引入核酸。此类方法可以用于向培养基或宿主生物体中的细胞给予编码核酸靶向系统的组分的核酸。非病毒载体递送系统包括DNA质粒、RNA(例如本文所述的载体的转录物)、裸核酸、以及与递送媒介物例如脂质体复合的核酸。病毒载体递送系统包括DNA和RNA病毒，这些病毒在递送至细胞后具有附加型基因组或整合型基因组。对于基因治疗程序的综述，参见Anderson,Science[科学]256:808-813(1992)；Nabel和Felgner,TIBTECH 11:211-217(1993)；Mitani和Caskey,TIBTECH 11:162-166(1993)；Dillon,TIBTECH 11:167-175(1993)；Miller,Nature[自然]357:455-460(1992)；Van Brunt,Biotechnology[生物技术]6(10):1149-1154(1988)；Vigne,Restorative Neurology and Neuroscience[恢复神经学和神经科学]8:35-36(1995)；Kremer和Perricaudet,British Medical Bulletin[英国医学公报]51(1):31-44(1995)；Haddada等人,Current Topics in Microbiology and Immunology[微生物学和免疫学的前沿课题]，Doerfler和(编辑)(1995)；以及Yu等人,Gene Therapy[基因治疗]1:13-26(1994)。

非病毒递送核酸的方法包括脂质转染、核转染、显微注射、基因枪、病毒体、脂质体、免疫脂质体、聚阳离子或脂质:核酸轭合物、裸DNA、人工病毒体递送、以及药剂增强DNA摄取。脂质转染描述于例如美国专利号5,049,386、4,946,787；以及4,897,355)并且脂质转染试剂是商业上销售的(例如，Transfectam^TM和Lipofectin^TM)。适用于多核苷酸的有效受体识别脂质转染的阳离子脂质和中性脂质包括以下各项中的那些：Felgner,WO 91/17424；WO 91/16024。递送可以是递送至细胞(例如，体外或离体给予)或靶组织(例如，体内给予)。

脂质:核酸复合物(包括靶向脂质体，例如免疫脂质复合物)的制备是本领域技术人员已熟知的(例如，参见Crystal,Science[科学]270:404-410(1995)；Blaese等人,Cancer Gene Ther.[癌症基因治疗]2:291-297(1995)；Behr等人,Bioconjugate Chem.[生物共轭化学]5:382-389(1994)；Remy等人,Bioconjugate Chem.[生物共轭化学]5:647-654(1994)；Gao等人,Gene Therapy[基因治疗]2:710-722(1995)；Ahmad等人,Cancer Res.[癌症研究]52:4817-4820(1992)；美国专利号4,186,183、4,217,344、4,235,871、4,261,975、4,485,054、4,501,728、4,774,085、4,837,028、和4,946,787)。

使用用于递送核酸的基于RNA或DNA病毒的系统利用了用于将病毒靶向身体内的特定细胞并且将病毒有效负载运输到细胞核内的高度进化的方法。病毒载体可以直接给予至患者(体内)或者它们可以用于体外处理细胞，并且修饰细胞可以任选地给予至患者(离体)。常规基于病毒的系统可以包括用于基因转移的逆转录病毒、慢病毒、腺病毒、腺相关病毒以及单纯疱疹病毒载体。通过逆转录病毒、慢病毒、以及腺相关病毒基因转移方法整合在宿主基因组中是可能的，这常常导致插入的转基因长期表达。另外，高转导效率已在许多不同细胞类型和靶组织中观察到。

逆转录病毒的趋向性可以通过结合外源包膜蛋白来改变，从而扩增靶细胞的潜在靶群体。慢病毒载体是能够转导或感染非分裂细胞并典型地产生高病毒滴度的逆转录病毒载体。逆转录病毒基因转移系统的选择因此将取决于靶组织。逆转录病毒载体包含具有多至6-10kb外源序列的包装容量的顺式作用长末端重复序列。最小量顺式作用LTR是足以复制并包装这些载体的，然后使用这些载体将治疗基因整合到靶细胞中，以提高永久性转基因表达。广泛使用的逆转录病毒载体包括基于以下各项的那些：鼠白血病病毒(MuLV)、长臂猿白血病病毒(GaLV)、猴免疫缺陷病毒(SIV)、人免疫缺陷病毒(HIV)、以及其组合(例如，参见，Buchscher等人,J.Virol.[病毒学杂志]66:2731-2739(1992)；Johann等人,J.Virol.[病毒学杂志]66:1635-1640(1992)；Sommnerfelt等人,Virol.[病毒学]176:58-59(1990)；Wilson等人,J.Virol.[病毒学杂志]63:2374-2378(1989)；Miller等人,J.Virol.[病毒学杂志]65:2220-2224(1991)；PCT/US94/05700)。在其中短暂表达是优选的应用中，可以使用基于腺病毒的系统。基于腺病毒的载体能够在许多细胞类型中具有极高转导效率并且并不要求细胞分裂。使用此类载体，已获得高滴度和表达水平。此载体可以在相对简单的系统中大量产生。腺相关病毒(“AAV”)载体也可以用于使用靶核酸转导细胞，例如用于体外产生核酸和肽并且用于体内和离体基因治疗程序(例如，参见，West等人,Virology[病毒学]160:38-47(1987)；美国专利号4,797,368；WO 93/24641；Kotin,Human Gene Therapy[人类基因治疗]5:793-801(1994)；Muzyczka,J.Clin.Invest.[临床研究杂志]94:1351(1994)。重组AAV载体的结构描述于许多出版物中，包括美国专利号5,173,414；Tratschin等人,Mol.Cell.Biol.[分子与细胞生物学]5:3251-3260(1985)；Tratschin等人,Mol.Cell.Biol.[分子与细胞生物学]4:2072-2081(1984)；Hermonat和Muzyczka,PNAS[美国国家科学院院刊]81:6466-6470(1984)；以及Samulski等人,J.Virol.[病毒学杂志]63:03822-3828(1989)。

载体递送，例如质粒、病毒递送：CRISPR酶，例如Cpf1和/或任一本发明RNA，例如指导RNA可以使用任何适合载体例如质粒或病毒载体例如腺伴随病毒(AAV)、慢病毒、腺病毒或其他病毒载体类型、或它们的组合来递送。Cpf1和一个或多个指导RNA可以包装到一种或多种载体例如质粒或病毒载体中。在一些实施例中，载体例如质粒或病毒载体，例如，通过肌肉注射递送至目的组织中，而有时递送是经由静脉内、经皮、鼻内、经口、粘膜或其他递送方法进行的。此递送可以经由单剂量或多剂量来进行。本领域技术人员应理解的是，本文有待递送的实际剂量可以在很大程度上取决于多种因素而变化，例如载体选择、靶细胞、生物体、或组织、有待治疗的受试者的一般状况、所寻求的转化/修饰的程度、给药途径、给药方式、所寻求的转化/修饰的类型等。

此剂型可以进一步含有，例如，载体(水、盐水、乙醇、甘油、乳糖、蔗糖、磷酸钙、明胶、葡聚糖、琼脂、果胶、花生油、芝麻油等等)、稀释剂、药学上可接受的载体(例如，磷酸盐缓冲盐水)、药学上可接受的赋形剂、和/或本领域已知的其他化合物。该剂型可以进一步含有一种或多种药学上可接受的盐，例如像，无机酸盐例如盐酸盐、氢溴酸盐、磷酸盐、硫酸盐等；以及有机酸盐，例如乙酸盐、丙酸盐、丙二酸盐、苯甲酸盐等。另外，本文也可以存在辅助物质，例如润湿剂或乳化剂、pH缓冲物质、凝胶或胶凝材料、调味剂、着色剂、微球体、聚合物、悬浮剂等。此外，也可以存在一种或多种其他常规药用成分，例如防腐剂、保湿剂、悬浮剂、表面活性剂、抗氧化剂、抗结剂、填充剂、螯合剂、包衣剂、化学稳定剂等，尤其是在该剂型是呈可重构形式时。适合的示例性成分包括微晶纤维素、羧甲基纤维素钠、聚山梨酯80、苯乙醇、三氯叔丁醇、山梨酸钾、抗坏血酸、二氧化硫、没食子酸丙酯、对羟基苯甲酸酯、乙基香兰素、甘油、苯酚、对氯酚、明胶、白蛋白以及它们的组合。药学上可接受的赋形剂的彻底论述可获自REMINGTON’S PHARMACEUTICAL SCIENCES[雷明顿药物科学](Mack Pub.Co.,N.J.[马克出版公司，纽约]1991)，该文献通过引用并入本文。

在本文的一个实施例中，递送是经由腺病毒进行的，其可以是含有至少1x10⁵个腺病毒载体粒子(也称为粒子单位，pu)的单次加强剂量。在本文的一个实施例中，该剂量优选地是腺病毒载体的至少约1x10⁶个粒子(例如，约1x10⁶-1x10¹²个粒子)，更优选地至少约1x10⁷个粒子、更优选地至少约1x10⁸个粒子(例如，约1x10⁸-1x10¹¹个粒子或约1x10⁸-1x10¹²个粒子)，并且最优选至少约1x10⁰个粒子(例如约1x10⁹-1x10¹⁰个粒子或约1x10⁹-1x10¹²个粒子)，或甚至至少约1x10¹⁰个粒子(例如，约1x10¹⁰-1x10¹²个粒子)。可替代地，该剂量包含不超过约1x10¹⁴个粒子，优选不超过约1x10¹³个粒子，甚至更优选不超过约1x10¹²个粒子，甚至更优选不超过约1x10¹¹个粒子，并且最优选不超过约1x10¹⁰个粒子(例如，不超过约1x10⁹个粒子)。因此，该剂量可以含有单剂量的腺病毒载体，其具有例如约1x10⁶粒子单位(pu)、约2x10⁶pu、约4x10⁶pu、约1x10⁷pu、约2x10⁷pu、约4x10⁷pu、约1x10⁸pu、约2x10⁸pu、约4x10⁸pu、约1x10⁹pu、约2x10⁹pu、约4x10⁹pu、约1x10¹⁰pu、约2x10¹⁰pu、约4x10¹⁰pu、约1x10¹¹pu、约2x10¹¹pu、约4x10¹¹pu、约1x10¹²pu、约2x10¹²pu或约4x10¹²pu的腺病毒。参见，例如，在2013年6月4日授权的授予Nabel等人的美国专利号8,454,972B2中的腺病毒载体；该专利通过引用并入本文，以及在其第29栏第36-58行的剂量。在本文的一个实施例中，腺病毒是经由多剂量来递送的。

在本文的一个实施例中，该递送是经由AAV进行的。用于针对人类的AAV的体内递送的治疗有效剂量被认为处于含有从约1x10¹⁰至约1x10¹⁰个功能AAV/ml溶液的从约20至约50ml的盐水溶液的范围内。剂量可以被调整以便相对于任何副作用平衡治疗益处。在本文的一个实施例中，AAV剂量大致处于从约1x10⁵至1x10⁵⁰个基因组AAV、从约1x10⁸至1x10²⁰个基因组AAV、从约1x10¹⁰至约1x10¹⁶个基因组、或约1x10¹¹至约1x10¹⁶个基因组AAV的浓度范围内。人类剂量可以是约1x10¹³个基因组AAV。此类浓度可以从约0.001ml至约100ml、约0.05至约50ml、或约10至约25ml的载体溶液进行递送。通过建立剂量应答曲线的常规试验，本领域普通技术人员可以容易地确立其他有效剂量。参见，例如，2013年3月26日授权的授予Hajjar等人的美国专利号8,404,658B2，在第27栏，第45-60行。

在本文的一个实施例中，该递送是经由质粒进行的。在此类的质粒组合物中，该剂量应该是足以引发应答的质粒的量。例如，在质粒组合物中的质粒DNA的适当量可以是从约0.1至约2mg，或从约1μg至约10μg/70kg个体。本发明的质粒大体上包含(i)启动子；(ii)编码CRISPR酶的序列，该序列可操作地连接至所述启动子；(iii)选择标记物；(iv)复制起点；以及(v)在(ii)的下游并可操作地连接至(ii)的转录终止子。质粒还可以编码CRISPR复合物的RNA组分，但是这些组分中的一个或多个还可以被编码在不同的载体上。

本文的剂量是基于平均70kg个体的。给药频率在医学或兽医学从业者(例如医师、兽医师)或本领域熟练的科学家的范围之内。还应注意的是，实验中使用的小鼠典型地是约20g并且来自小鼠实验的小鼠可以提高至70kg的个体。

在一些实施例中，本发明的RNA分子以脂质体或脂转染配制品等递送并且可以是通过本领域技术人员已熟知的方法来制备。此类方法描述于例如美国专利号5,593,972、5,589,466、和5,580,859中，以上文献通过引用并入本文。已开发了特别旨在增强并改进siRNA到哺乳动物细胞的递送的递送系统(参见，例如Shen等人FEBS Let.[FEBS快报]2003,539:111-114；Xia等人,Nat.Biotech.[自然生物技术]2002,20:1006-1010；Reich等人,Mol.Vision.[分子视觉]2003,9:210-216；Sorensen等人,J.Mol.Biol.[分子生物学杂志]2003,327:761-766；Lewis等人,Nat.Gen.[自然遗传学]2002,32:107-108以及Simeoni等人,NAR[核酸研究]2003,31,11:2717-2724)并且这些递送系统可以适用于本发明。siRNA最近已成功用于抑制灵长类动物中的基因表达(参见，例如Tolentino等人,Retina[视网膜]24(4):660，该文献也可以适用于本发明)。

实际上，RNA递送是可用的体内递送方法。有可能使用脂质体或纳米粒子将Cpf1和gRNA(以及例如HR修复模板)递送至细胞中。因此，本发明的CRISPR酶例如Cpf1的递送和/或RNA的递送可以呈RNA形式并且经由微泡、脂质体或一个粒子或多个粒子来进行。例如，Cpf1mRNA和gRNA可以包装到脂质体粒子中以进行体内递送。脂质体转染试剂例如来自生命技术公司(Life Technologies)的lipofectamine和市场上的其他试剂可以有效地将RNA分子递送至肝脏中。

RNA递送手段还优选包括经由粒子的RNA递送(Cho,S.,Goldberg,M.,Son,S.,Xu,Q.,Yang,F.,Mei,Y.,Bogatyrev,S.,Langer,R.和Anderson,D.,Lipid-likenanoparticles for small interfering RNA delivery to endothelial cells[用于将小干扰RNA递送至内皮细胞的脂质样纳米粒子],Advanced Functional Materials[先进功能材料]，19:3112-3118,2010)或外来体(Schroeder,A.,Levins,C.,Cortez,C.,Langer,R.,和Anderson,D.,Lipid-based nanotherapeutics for siRNA delivery[用于siRNA递送的基于脂质的纳米治疗剂],Journal of Internal Medicine[内科医学杂志],267:9-21,2010,PMID:20059641)。实际上，已经表明外来体在递送siRNA中特别有用，其为与CRISPR系统有一些相似之处的系统。例如，El-Andaloussi S等人(“Exosome-mediateddelivery of siRNA in vitro and in vivo.[外来体介导的体外和体内siRNA递送]”NatProtoc.[自然实验手册]2012年12月；7(12):2112-26.doi:10.1038/nprot.2012.131.电子版2012年11月15日)描述了外来体如何对于跨不同的生物屏障的药物递送是有希望的工具并且可以用于体外和体内递送siRNA。其途径在于通过转染一种包含与肽配体融合的外来体蛋白的表达载体产生靶向的外来体。然后将这些外来体纯化并且由转染的细胞上清液进行表征，然后将RNA加载到外来体中。根据本发明的递送或给药可以使用外来体进行，特别是但不限于脑。维生素E(α-生育酚)可以与CRISPR Cas轭合并且与高密度脂蛋白(HDL)一起递送至脑，例如以与Uno等人完成的用于将短干扰RNA(siRNA)递送至脑的类似方式(HUMANGENE THERAPY[人类基因治疗]22:711-719(2011年6月))。经由用磷酸盐缓冲盐水(PBS)或游离TocsiBACE或Toc-siBACE/HDL充满的并且与脑灌注试剂盒3(Brain Infusion Kit 3)(Alzet)连接的微渗透压泵(型号1007D；Alzet，库比蒂诺(Cupertino)，加利福尼亚州(CA))灌注小鼠。将一根脑灌注插管置于在正中线的前囱的后方约0.5mm，用于灌注到背侧第三脑室中。Uno等人发现，通过相同的ICV灌注方法，少至3nmol的Toc-siRNA与HDL可以诱导相当程度的靶减少。在本发明中对于人类可以考虑类似剂量的轭合至α-生育酚并且与HDL共同给予靶向脑的CRISPR Cas，例如，可以考虑靶向脑的约3nmol至约3μmol的CRISPR Cas。Zou等人(HUMAN GENE THERAPY[人类基因治疗]22:465-475(2011年4月))描述了靶向PKCγ的短发夹RNA的慢病毒介导的递送方法，其用于在大鼠脊髓中的体内基因沉默。Zou等人通过鞘内导管给予约10μl的具有1x10⁹个转导单位(TU)/ml的滴度的重组慢病毒。在本发明中对于人类可以考虑类似剂量的在靶向脑的慢病毒载体中表达的CRISPR Cas，例如，可以考虑靶向脑的在具有1x10⁹个转导单位(TU)/ml的滴度的慢病毒中的约10-50ml的CRISPR Cas。

就脑的局部递送而言，这可以通过不同方式来实现。例如，可以例如通过注射纹状体内(intrastriatally)递送材料。注射可以经由颅骨切开术立体定位地进行。

增强NHEJ或HR效率也有助于递送。优选的是，通过共表达末端加工酶例如Trex2(Dumitrache等人Genetics.[遗传学]2011年8月；188(4):787-797)来增强NHEJ效率。优选的是，通过瞬时地抑制NHEJ机构例如Ku70和Ku86来增加HR效率。HR效率还可以通过共表达原核生物或真核生物同源重组酶例如RecBCD、RecA来增加。

包装和启动子

将本发明的Cpf1编码核酸分子例如DNA包装到载体例如病毒载体中以介导体内修饰的方式包括：

·为了实现NHEJ介导的基因敲除：

·单病毒载体：

·含有两个或更多个表达盒的载体：

·启动子-Cpf1编码核酸分子-终止子

·启动子-gRNA1-终止子

·启动子-gRNA2-终止子

·启动子-gRNA(N)-终止子(一直到载体的大小限制)

·双病毒载体：

·含有用于驱动Cpf1表达的一个表达盒的载体1

·启动子-Cpf1编码核酸分子-终止子

·含有用于驱动一个或多个指导RNA表达的一个或多个表达盒的载体2

·启动子-gRNA1-终止子

·启动子-gRNA(N)-终止子(一直到载体的大小限制)用于介导同源定向修复。

·除了以上所述的单病毒载体和双病毒载体途径之外，另外的载体可以用于递送同源定向修复模板。

用于驱动Cpf1编码核酸分子表达的启动子可以包括：

—AAV ITR可以充当一种启动子：这对于消除另外的启动子元件(可能在载体中占用空间)的需要是有利的。空出来的另外的空间可以用于驱动另外的元件(gRNA等)的表达。另外，ITR活性是相对较弱的，因此可以用于降低由于Cpf1的过表达所致的潜在毒性。

—对于遍存表达，可以使用的启动子包括：CMV、CAG、CBh、PGK、SV40、铁蛋白重链或轻链等。

对于脑或其他CNS表达，可以使用启动子：用于所有神经元的突触蛋白I(SynapsinI)、用于兴奋性神经元的CaMKIIα、用于GABA能神经元的GAD67或GAD65或VGAT等。对于肝脏表达，可以使用白蛋白启动子。对于肺表达，可以使用SP-B。对于内皮细胞，可以使用ICAM。对于造血细胞，可以使用IFNβ或CD45。对于成骨细胞，可以使用OG-2。

用来驱动指导RNA的启动子可以包括：

—Pol III启动子例如U6或H1

—使用Pol II启动子和内含子盒来表达gRNA

腺伴随病毒(AAV)

Cpf1和一个或多个指导RNA可以使用腺伴随病毒(AAV)、慢病毒、腺病毒或其他质粒或病毒载体类型进行递送，具体地说，使用来自以下文献的配方和剂量：例如，美国专利号8,454,972(针对腺病毒的配方、剂量)、8,404,658(针对AAV的配方、剂量)和5,846,946(针对DNA质粒的配方、剂量)以及来自临床试验和关于涉及慢病毒、AAV和腺病毒的临床试验的出版物。例如，对于AAV，给药途径、配方和剂量可以如美国专利号8,454,972并且如涉及AAV的临床试验。对于腺病毒，给药途径、配方和剂量可以如美国专利号8,404,658并且如涉及腺病毒的临床试验。对于质粒递送，给药途径、配方和剂量可以如美国专利号5,846,946并且如涉及质粒的临床研究。剂量可以基于或外推为平均70kg的个体(例如成人男性)，并且可以针对患者、受试者、不同重量和物种的哺乳动物进行调整。给药频率在医学或兽医学从业者(例如医师、兽医师)的范围之内，其取决于常规因素，包括患者或受试者的年龄、性别、一般健康状况、其他状况以及着手解决的特定病状或症状。可以将病毒载体注射到目的组织中。对于细胞类型特异性基因组修饰，Cpf1的表达可以由细胞类型特异性启动子驱动。例如，肝脏特异性表达可以使用白蛋白启动子，并且神经元特异性表达(例如靶向CNS障碍)可以使用突触蛋白I启动子。

就体内递送而言，AAV相比于其他病毒载体是有利的，这是由于几个原因：

低毒性(这可以归因于纯化方法不需要细胞粒子的可以激活免疫应答的超速离心)；

引起插入诱变的低概率，原因在于它未整合到宿主基因组中。

AAV具有4.5或4.75Kb的包装限制。这意味着Cpf1以及启动子和转录终止子必须都配合在同一个病毒载体中。大于4.5或4.75Kb的构建体将导致病毒产生的显著降低。SpCas9是相当大的，该基因自身超过4.1Kb，使其难于包装到AAV中。因此本发明的实施例包括利用更短的Cpf1同源物。

关于AAV，AAV可以是AAV1、AAV2、AAV5或任何其组合。可以相对于有待被靶向的细胞来选择AAV；例如，可以选择用于靶向脑或神经元细胞的AAV血清型1、2、5或杂交体衣壳AAV1、AAV2、AAV5或其任何组合；并且可以选择用于靶向心脏组织的AAV4。AAV8可用于递送至肝脏。本文的启动子和载体是单独优选的。关于这些细胞的某些AAV血清型的列表(参见Grimm,D.等人,J.Virol.[病毒学杂志]82:5887-5911(2008))如下：

慢病毒

慢病毒是复杂的反转录病毒，其具有在有丝分裂细胞和有丝分裂后细胞两者中感染并表达其基因的能力。最为人熟知的慢病毒是人类免疫缺陷病毒(HIV)，其利用其他病毒的包膜糖蛋白来靶向广泛范围的细胞类型。

慢病毒可以如下制备。在克隆pEFF03 Lenti AsDR huLbCpf1(含有慢病毒转移质粒骨架)之后，将处于低传代数(p＝5)的HEK293FT接种在T-75烧瓶中，以在转染之前的一天在具有10％胎牛血清而没有抗生素的DMEM中50％汇合。在20小时之后，将培养基更换为OptiMEM(无血清)培养基，并且在4小时后进行转染。将细胞用10μg的慢病毒转移质粒(pCasES10)和下列包装质粒转染：5μg的pMD2.G(VSV-g假型)和7.5μg的psPAX2(gag/pol/rev/tat)。在具有阳离子脂质递送剂(50μL的Lipofectamine 2000和100μl的Plus试剂)的4mL OptiMEM中进行转染。在6小时之后，将培养基更换为具有10％胎牛血清的无抗生素的DMEM。这些方法在细胞培养过程中使用血清，但是优选无血清的方法。

慢病毒可以如下纯化。在48小时后收获病毒上清液。首先清除上清液的碎片并通过0.45μm的低蛋白结合(PVDF)过滤器进行过滤。然后将它们在超速离心机中以24,000rpm旋转2小时。将病毒沉淀重新悬浮在50μl的DMEM中，在4℃下过夜。然后将它们等分，并且立即在-80℃下冷冻。

在另一个实施例中，还考虑了基于马传染性贫血病毒(EIAV)的最小非灵长类动物慢病毒载体，特别是对于眼部基因治疗而言(例如，参见Balagaan,J Gene Med[基因医学杂志]2006；8:275-285)。在另一个实施例中，还考虑了一种经由视网膜下注射递送用于治疗湿型年龄相关性黄斑变性的、表达血管生成抑制性蛋白(内皮抑素和血管抑素)的基于马传染性贫血病毒的慢病毒基因治疗载体(例如，参见，Binley等人,HUMAN GENETHERAPY[人类基因治疗]23:980-991(2012年9月))并且此载体可以被修改用于本发明的CRISPR-Cas系统。

在另一个实施例中，自灭活慢病毒载体可以用于和/或适于本发明的CRISPR-Cas系统，该自灭活慢病毒载体具有靶向由HIV tat/rev共享的共有外显子的siRNA、核仁定位TAR诱饵、和抗CCR5特异性锤头状核酶(例如，参见，DiGiusto等人(2010)Sci Transl Med[科学转化医学]2:36ra43)。可以收集最少2.5×10⁶个CD34+细胞/每千克患者体重并且以2×10⁶个细胞/ml的密度在X-VIVO 15培养基(龙沙公司(Lonza))中预刺激16至20小时，该培养基含有2μmol/L-谷氨酰胺、干细胞因子(100ng/ml)、Flt-3配体(Flt-3L)(100ng/ml)和促血小板生成素(10ng/ml)(CellGenix公司)。可以用慢病毒以感染复数5在75-cm2的包被有纤连蛋白(25mg/cm2)(重组人纤维连接片断(RetroNectin)，宝生物工程株式会社(TakaraBio Inc.))的组织培养瓶中转导预刺激的细胞16至24小时。

慢病毒载体已披露于帕金森病的治疗中，例如参见美国专利公开号20120295960以及美国专利号7303910和7351585。慢病毒载体还已披露于眼部疾病的治疗中，例如参见美国专利公开号20060281180、20090007284、US 20110117189；US 20090017543；US20070054961、US 20100317109。还已披露了将慢病毒载体递送至脑，例如参见美国专利公开号US 20110293571；US 20110293571、US 20040013648、US 20070025970、US20090111106和美国专利号US 7259015。

RNA递送

RNA递送：该CRISPR酶(例如Cpf1)和/或任一本发明的RNA(例如指导RNA)也可以RNA的形式递送。可以使用体外转录产生Cpf1 mRNA。例如，可以使用含有下列元件的PCR盒来合成Cpf1 mRNA：来自β球蛋白-polyA尾(一串120个或更多个的腺嘌呤)的T7_启动子-kozak序列(GCCACC)-Cpf1-3'UTR。该盒可以用于经由T7聚合酶的转录。也可以使用体外转录从含有T7_启动子-GG-指导RNA序列的盒来转录指导RNA。

为了增强表达并且降低可能的毒性，可以例如使用假-U或5-甲基-C将该CRISPR酶编码序列和/或指导RNA修饰为包含一种或多种修饰核苷酸。

目前，mRNA递送方法是特别有希望用于肝脏递送。

关于RNA递送的许多临床工作已集中于RNAi或反义子上，但是这些系统可以适于递送用于实施本发明的RNA。因此应该相应地理解下文关于RNAi等的参考。

粒子递送系统和/或配制品：

已知若干种类型的粒子递送系统和/或配制品可用于不同范围的生物医学应用中。总的来说，粒子被限定为关于其转运和特性以整体单位表现的小物体。根据直径将粒子进一步分类。粗粒子覆盖介于2,500与10,000纳米之间的范围。细粒子的大小介于100与2,500纳米之间。超细粒子或纳米粒子的大小大体上介于1与100纳米之间。100-nm限制的基准是在于区分粒子与本体材料的新特性典型地出现在100nm以下的临界长度尺度下的事实。

如本文所用，粒子递送系统/配制品被限定为包含根据本发明的粒子的任何生物递送系统/配制品。根据本发明的粒子是具有小于100微米(μm)的最大尺寸(例如，直径)的任一实体。在一些实施例中，本发明粒子具有小于10μm的最大尺寸。在一些实施例中，本发明粒子具有小于2000纳米(nm)的最大尺寸。在一些实施例中，本发明粒子具有小于1000纳米(nm)的最大尺寸。在一些实施例中，本发明粒子具有小于900nm、800nm、700nm、600nm、500nm、400nm、300nm、200nm或100nm的最大尺寸。典型地，本发明粒子具有500nm或更小的最大尺寸(例如，直径)。在一些实施例中，本发明粒子具有250nm或更小的最大尺寸(例如，直径)。在一些实施例中，本发明粒子具有200nm或更小的最大尺寸(例如，直径)。在一些实施例中，本发明粒子具有150nm或更小的最大尺寸(例如，直径)。在一些实施例中，本发明粒子具有100nm或更小的最大尺寸(例如，直径)。例如具有50nm或更小的最大尺寸的较小粒子使用在本发明的一些实施例中。在一些实施例中，本发明粒子具有介于25nm与200nm之间的范围内的最大尺寸。

使用多种不同的技术进行粒子表征(包括例如表征形貌、尺寸等)。常见的技术是电子显微术(TEM、SEM)、原子力显微术(AFM)、动态光散射(DLS)、X-射线光电子光谱法(XPS)、粉末X-射线衍射(XRD)、傅里叶变换红外光谱(FTIR)、基质辅助的激光解吸/电离-飞行时间质谱(MALDI-TOF)、紫外可见光谱、双偏振干涉法和核磁共振(NMR)。可以对于天然粒子(即加载前)或在加载货物(本文货物是指例如CRISPR-Cas系统的一种或多种组分，例如CRISPR酶或mRNA或指导RNA或它们的任何组合，并且可以包括附加载体和/或赋形剂)之后进行表征(尺寸测量)以为本发明的任何体外、离体和/或体内应用的递送提供具有最佳尺寸的粒子。在某些优选实施例中，粒子尺寸(例如直径)表征是基于使用动态光散射(DLS)的测量。关于粒子、其制备和使用方法以及其测量参考美国专利号8,709,843；美国专利号6,007,845；美国专利号5,855,913；美国专利号5,985,309；美国专利号5,543,158；以及JamesE.Dahlman和Carmen Barnes等人Nature Nanotechnology[自然纳米科技](2014)的出版物，2014年5月11日在线公开，doi:10.1038/nnano.2014.84。

本发明范围内的粒子递送系统可以任何形式提供，包括但不限于固体、半固体、乳液或胶体粒子。这样，本文所述的任一递送系统，包括但不限于例如基于脂质的系统、脂质体、胶束、微泡、外来体或基因枪可以被提供作为本发明范围内的粒子递送系统。

粒子

应了解的是，在适当情况下，本文关于粒子或纳米粒子的参考可以是可互换的。可以使用粒子或脂质包膜同时递送CRISPR酶mRNA和指导RNA；例如，本发明的CRISPR酶和RNA(例如作为复合物)可以经由如Dahlman等人、WO 2015089419A2和本文引用的文献中的粒子例如7C1递送(参见，例如James E.Dahlman和Carmen Barnes等人Nature Nanotechnology[自然纳米科技](2014)2014年5月11日在线公开，doi:10.1038/nnano.2014.84)，例如递送粒子包含脂质或类脂质(lipidoid)和亲水性聚合物，例如阳离子脂质和亲水性聚合物，例如其中阳离子脂质包括1,2-二油酰基-3-三甲基铵-丙烷(DOTAP)或1,2-二十四酰基-sn-甘油基-3-磷酸胆碱(DMPC)并且/或者其中亲水性聚合物包括乙二醇或聚乙二醇(PEG)；并且/或者其中粒子进一步包含胆固醇(例如来自配方1＝DOTAP 100、DMPC 0、PEG 0、胆固醇0；配方编号2＝DOTAP 90、DMPC 0、PEG 10、胆固醇0；配方编号3＝DOTAP 90、DMPC 0、PEG 5、胆固醇5的粒子)，其中粒子使用有效、多步方法形成，其中首先将效应蛋白和RNA例如在室温下例如以1:1摩尔比于例如无菌无核酸酶的1X PBS中混合在一起例如持续30分钟；并且单独地，将适用于配方的DOTAP、DMPC、PEG和胆固醇溶解在醇，例如100％乙醇中；并且将两种溶液混合在一起以形成含有复合物的粒子)。

可以使用粒子或脂质包膜同时递送核酸靶向效应蛋白(例如型V蛋白例如Cpf1)mRNA和指导RNA。

例如，Su X,Fricke J,Kavanagh DG,Irvine DJ(“In vitro and in vivo mRNAdelivery using lipid-enveloped pH-responsive polymer nanoparticles[使用脂质包膜的pH响应性聚合物纳米粒子的体外和体内mRNA递送]”Mol Pharm.[分子药剂学]2011年6月6日；8(3):774-87.doi:10.1021/mp100390w.电子版2011年4月1日)描述了生物可降解的核-壳结构化的纳米粒子，其具有由磷脂双层壳包膜的聚(β-氨基酯)(PBAE)核。这些被开发为用于体内mRNA递送。该pH响应性PBAE组分被选择为促进内体破坏，而该脂质表面层被选择为将聚阳离子核的毒性降低到最低限度。因此，这些对于递送本发明的RNA是优选的。

在一个实施例中，考虑了基于自组装生物粘附聚合物的粒子/纳米粒子，其可以适用于肽的经口递送、肽的静脉内递送以及肽的鼻递送，均递送至脑。其他实施例，还考虑了例如疏水性药物的经口吸收和眼部递送。分子包膜技术涉及被保护并递送至疾病位点的工程化聚合物包膜(参见例如Mazza,M.等人ACSNano,2013.7(2):1016-1026；Siew,A.等人MolPharm[分子药剂学],2012.9(1):14-28；Lalatsa,A.等人J Contr Rel[控释杂志],2012.161(2):523-36；Lalatsa,A.,等人,Mol Pharm[分子药剂学],2012.9(6):1665-80；Lalatsa,A.,等人Mol Pharm[分子药剂学],2012.9(6):1764-74；Garrett,N.L.,等人JBiophotonics[生物光电杂志],2012.5(5-6):458-68；Garrett,N.L.,等人J Raman Spect[拉曼光谱杂志],2012.43(5):681-688；Ahmad,S.,等人J Royal Soc Interface[皇家学会界面杂志]2010.7:S423-33；Uchegbu,I.F.Expert Opin Drug Deliv[药物递送专家评论],2006.3(5):629-40；Qu,X.,等人Biomacromolecules[生物大分子],2006.7(12):3452-9和Uchegbu,I.F.等人Int J Pharm[国际药学杂志],2001.224:185-199)。考虑了约5mg/kg的剂量，呈单剂量或多剂量形式，这取决于靶组织。

在一个实施例中，可以使用由Dan Anderson实验室(Dan Anderson’s lab)在MIT开发的可以将RNA递送至癌细胞以便使肿瘤生长停止的粒子/纳米粒子并且/或者使这些粒子/纳米粒子适于本发明的CRISPR Cas系统。具体地说，Anderson实验室(Anderson lab)开发了用于新生物材料和纳米配制品的合成、纯化、表征和配制的全自动化组合系统。例如参见，Alabi等人,Proc Natl Acad Sci U S A.[美国国家科学院院刊]2013年8月6号；110(32):12881-6；Zhang等人,Adv Mater.[先进材料]2013年9月6日；25(33):4641-5；Jiang等人,Nano Lett.[纳米快报]2013年3月13日；13(3):1059-64；Karagiannis等人,ACS Nano.[ACS纳米]2012年10月23日；6(10):8484-7；Whitehead等人,ACS Nano.[ACS纳米]2012年8月28日；6(8):6922-9和Lee等人,Nat Nanotechnol.[自然纳米技术]2012年6月3日；7(6):389-93。

美国专利申请20110293703涉及类脂质化合物，这些化合物在多核苷酸的给药中也是特别有用的，其可以适用于递送本发明的CRISPR Cas系统。在一个方面中，氨基醇类脂质化合物与有待递送至细胞或受试者的药剂结合而形成微粒子、纳米粒子、脂质体、或胶束。有待通过粒子、脂质体、或胶束递送的药剂可以呈气体、液体、或固体的形式，并且该药剂可以是一种多核苷酸、蛋白质、肽、或小分子。氨基醇类脂质化合物可以与其他氨基醇类脂质化合物、聚合物(合成的或天然的)、表面活性剂、胆固醇、碳水化合物、蛋白质、脂质等结合而形成这些粒子。然后这些粒子可以任选地与药物赋形剂结合而形成药物组合物。

美国专利公开号20110293703也提供了制备氨基醇类脂质化合物的方法。使胺的一种或多种等效物与环氧化物封端化合物的一种或多种等效物在适当条件下反应而形成本发明的氨基醇类脂质化合物。在某些实施例中，胺的所有氨基基团与环氧化物封端化合物充分反应而形成叔胺。在其他实施例中，胺的所有氨基基团未与环氧化物封端化合物完全反应形成叔胺，由此生成在氨基醇类脂质化合物中的伯胺或仲胺。这些伯胺或仲胺照原样留下或者可以与另一种亲电体例如一种不同的环氧化物封端化合物反应。正如本领域技术人员应了解的，胺与未过量的环氧化物封端化合物反应将产生多种不同的具有不同数目的尾部的氨基醇类脂质化合物。某些胺类可以被两个环氧化物衍生的化合物尾部完全功能化，而其他分子不会被环氧化物衍生的化合物尾部完全功能化。例如，二胺或多胺可以包括离开该分子的不同氨基部分的一个、二个、三个、或四个环氧化物衍生的化合物尾部，从而产生伯胺、仲胺和叔胺。在某些实施例中，并不是所有氨基基团都被完全功能化。在某些实施例中，使用了相同类型的环氧化物封端化合物中的两种。在其他实施例中，使用了两种或更多种不同的环氧化物封端化合物。氨基醇类脂质化合物的合成是用或不用溶剂进行的，并且该合成可以在从30℃-100℃的范围内，优选在大约50℃-90℃的较高温度下进行。任选地，可以将制备的氨基醇类脂质化合物纯化。例如，可以纯化氨基醇类脂质化合物的混合物以产生具有特定数目的环氧化物衍生的化合物尾部的氨基醇类脂质化合物。或者，该混合物可以被纯化而产生特定的立体异构体或区域异构体。也可以使用卤代烷(例如，碘甲烷)或其他烷化剂将这些氨基醇类脂质化合物烷化，并且/或者它们可以被酰化。

美国专利公开号20110293703还提供了通过发明方法制备的氨基醇类脂质化合物的文库。可以使用涉及液体处理器、机器人、微量滴定板、计算机等的高通量技术制备和/或筛选这些氨基醇类脂质化合物。在某些实施例中，筛选了这些氨基醇类脂质化合物的将多核苷酸或其他药剂(例如，蛋白质、肽、小分子)转染到细胞中的能力。

美国专利公开号20130302401涉及已经使用组合聚合制备的一类聚(β-氨基醇)(PBAA)。这些发明的PBAA可以在生物技术和生物医学应用中用作涂层(例如用于医疗装置或植入物的膜或多层膜的涂层)、添加剂、材料、赋形剂、生物防污剂(non-biofoulingagent)、微图案化剂、以及细胞封装剂。当用作表面涂层时，这些PBAA在体外和体内均引发不同水平的炎症，这取决于它们的化学结构。这类材料的巨大化学多样性允许我们鉴定出在体外抑制巨噬细胞激活的聚合物涂层。此外，在羧化聚苯乙烯微粒的皮下移植之后，这些涂层减少了炎症细胞的募集，并且减轻了纤维化。这些聚合物可以用于形成用于细胞封装的聚合电解质复合物胶囊。本发明还可以具有许多其他的生物应用，例如抗微生物涂层、DNA或siRNA递送、以及干细胞组织工程。美国专利公开号20130302401的教授内容可以适用于本发明的CRISPR Cas系统。在一些实施例中，可以使用基于糖的粒子，例如如本文所述的GalNAc并且参考WO2014118272(通过引用并入本文)以及Nair,JK等人,2014,Journal ofthe American Chemical Society[美国化学学会杂志]136(49),16958-16961)以及本文的传授内容，除非另外表明，否则特别涉及适用于所有粒子的递送。

在另一个实施例中，考虑了脂质纳米粒子(LNP)。抗转甲状腺素蛋白小干扰RNA已被封装在脂质纳米粒子中并且递送至人类(例如参见，Coelho等人,N Engl J Med[新英格兰医学杂志]2013；369:819-29)，并且此系统可以适于并应用于本发明的CRISPR Cas系统。考虑了静脉内给予约0.01至约1mg/kg体重的剂量。考虑了降低输注相关反应的风险的药物，例如考虑到地塞米松、对乙酰氨基酚(acetampinophen)、苯海拉明或西替利嗪、以及雷尼替丁。还考虑了约0.3mg/kg的多剂量，每4周一次，五个剂量。

LNP已经显示在将siRNA递送至肝脏中是高度有效的(例如参见Tabernero等人,Cancer Discovery[癌症发现],2013年4月,第3卷,第4期,第363-470页)，并且因此被考虑用于将编码CRISPR Cas的RNA递送至肝脏。可以考虑6mg/kg的LNP的约四个剂量的用量，每两周一次。Tabernero等人证明，在以0.7mg/kg给予LNP前2个周期之后，观察到肿瘤消退，并且在6个周期结束之后，患者已经实现了部分应答，具有淋巴结转移完全消退以及肝脏肿瘤的显著萎缩。在此患者中给予40个剂量之后获得完全应答，在接受经过26个月的剂量之后其保持缓解和完全治疗。具有RCC和在用VEGF途径抑制剂进行的在先治疗之后进展的包括肾脏、肺以及淋巴结的肝外位点疾病的两位患者在所有位点的疾病都保持稳定大约8至12个月，并且一位具有PNET和肝转移的患者继续在18个月(36个剂量)的延伸研究中保持疾病稳定。

然而，必须将LNP的电荷考虑在内。当阳离子脂质与带负电的脂质结合时，诱导促进细胞内递送的非双层结构。因为带电荷的LNP在静脉内注射之后迅速从循环中清除，所以开发了具有低于7的pKa值的可电离阳离子脂质(例如参见，Rosin等人,Molecular Therapy[分子治疗],第19卷,第12期,第1286-2200页,2011年12月)。带负电荷的聚合物例如RNA可以低pH值(例如，pH 4)加载到LNP中，在此pH时可电离脂质展示出正电荷。然而，在生理学pH值下，LNP表现出与更长的循环时间相容的低表面电荷。已经关注了四种可电离阳离子脂质，即1,2-二亚油酰基-3-二甲基铵-丙烷(DLinDAP)、1,2-二亚油基氧基-3-N,N-二甲基氨基丙烷(DLinDMA)、1,2-二亚油基氧基-酮基-N,N-二甲基-3-氨基丙烷(DLinKDMA)、以及1,2-二亚油基-4-(2-二甲基氨基乙基)-[1,3]-二氧戊环(DLinKC2-DMA)。已经表明，含有这些脂质的LNP siRNA系统在体内肝细胞中表现出显著不同的基因沉默特性，具有根据采用因子VII基因沉默模型的DLinKC2-DMA>DLinKDMA>DLinDMA>>DLinDAP系列而变化的潜能(参见例如Rosin等人,Molecular Therapy[分子治疗],第19卷,第12期,第1286-2200页,2011年12月)。可以考虑1μg/ml LNP或LNP中或与LNP相关联的CRISPR-Cas RNA的剂量，尤其是对于含有DLinKC2-DMA的配制品而言。

LNP的制备和CRISPR Cas封装可以使用和/或改编自Rosin等人,MolecularTherapy[分子治疗],第19卷,第12期,第1286-2200页,2011年12月)。阳离子脂质1,2-二亚油酰基-3-二甲基铵-丙烷(DLinDAP)、1,2-二亚油基氧基-3-N,N-二甲基氨基丙烷(DLinDMA)、1,2-二亚油基氧基酮基-N,N-二甲基-3-氨基丙烷(DLinK-DMA)、1,2-二亚油基-4-(2-二甲基氨基乙基)-[1,3]-二氧戊环(DLinKC2-DMA)、(3-o-[2″-(甲氧基聚乙二醇2000)琥珀酰]-1,2-二肉豆蔻酰基-sn-乙二醇(PEG-S-DMG)、以及R-3-[(ω-甲氧基-聚(乙二醇)2000)氨甲酰]-1,2-二肉豆蔻酰氧基丙基-3-胺(PEG-C-DOMG)可以由泰米拉制药公司(Tekmira Pharmaceuticals)(温哥华(Vancouver)，加拿大(Canada))提供或合成。胆固醇可以购自西格玛公司(Sigma)(圣路易斯(St Louis)，密苏里州(MO))。特异性CRISPR CasRNA可以封装在含有DLinDAP、DLinDMA、DLinK-DMA和DLinKC2-DMA的LNP中(阳离子脂质:DSPC:CHOL:PEGS-DMG或PEG-C-DOMG，摩尔比为40:10:40:10)。在需要时，可以掺入0.2％SP-DiOC18(英杰公司(Invitrogen)，伯灵顿(Burlington)，加拿大)来评估细胞摄取、细胞内递送和生物分布。可以通过以下方式来进行封装：将由阳离子脂质:DSPC:胆固醇:PEG-c-DOMG(40:10:40:10摩尔比)组成的脂质混合物溶解在乙醇中，直至最终脂质浓度为10mmol/l。可以将脂质的此乙醇溶液逐滴添加到pH 4.0的50mmol/l柠檬酸盐中以形成多层囊泡，从而产生30％(体积/体积(vol/vol))乙醇的终浓度。在使用挤出机(北方脂质公司(NorthernLipids)，温哥华，加拿大)通过两个重叠的80nm Nuclepore聚碳酸酯过滤器挤出多层囊泡之后，可以形成大的单层囊泡。可以通过如下步骤实现封装：将溶解在含有30％乙醇(体积/体积(vol/vol))的pH 4.0的50mmol/l柠檬酸盐中的2mg/ml的RNA逐滴添加到挤出的预成形的大单层囊泡中，并且在31℃下孵育30分钟，伴随持续混合直至最终的RNA/脂质重量比为0.06/1(重量/重量(wt/wt))。通过使用Spectra/Por 2再生纤维素透析膜在pH 7.4的磷酸盐缓冲盐水(PBS)中透析16小时进行乙醇的去除以及配制缓冲液的中和。可以使用NICOMP370型粒径分析仪、囊泡/强度模式以及高斯拟合通过动态光散射测定纳米粒子粒径分布(Nicomp粒径分析仪，圣巴巴拉市(Santa Barbara)，加利福尼亚州)。对于所有三个LNP系统的粒径可以是约70nm的直径。可以通过使用VivaPureD MiniH柱(赛多利斯斯泰迪生物技术公司(Sartorius Stedim Biotech))从分析前后收集的样品中去除游离RNA来确定RNA封装效率。可以从洗脱的纳米粒子中提取封装的RNA并且将其在260nm下量化。通过使用来自美国瓦克化学公司(Wako Chemicals USA)(里士满(Richmond)，弗吉尼亚州(VA))的胆固醇E酶测定法测量囊泡中的胆固醇含量来确定RNA与脂质的比率。与本文的LNP和PEG脂质的论述结合，PEG化的脂质体或LNP同样适合于CRISPR-Cas系统或其组分的递送。

大LNP的制备可以使用和/或改编自Rosin等人,Molecular Therapy[分子治疗],第19卷,第12期,第1286-2200页,2011年12月。可以在含有50:10:38.5摩尔比的DLinKC2-DMA、DSPC和胆固醇的乙醇中制备脂质预混物溶液(20.4mg/ml总脂质浓度)。可以0.75:1的摩尔比(乙酸钠:DLinKC2-DMA)将乙酸钠添加到脂质预混物中。随后可以通过将该混合物与1.85倍体积的柠檬酸盐缓冲液(10mmol/l，pH 3.0)在剧烈搅拌下合并来使脂质水合，从而使得自发脂质体在含有35％乙醇的水性缓冲液中形成。可以在37℃下孵育该脂质体溶液以允许粒径的时间依赖性增加。可以通过动态光散射(纳米粒径电位分析仪(Zetasizer NanoZS)，马尔文仪器公司(Malvern Instruments)，乌斯特郡(Worcestershire)，英国(UK))在孵育过程中的不同时间处去除等分试样来研究脂质体尺寸的变化。一旦实现所希望的粒径，可以将水性PEG脂质溶液(储备溶液＝在35％(体积/体积(vol/vol))乙醇中的10mg/mlPEG-DMG)添加到该脂质体混合物中，以产生3.5％总脂质的最终PEG摩尔浓度。在添加PEG-脂质之后，这些脂质体应该其大小，有效抑制进一步生长。然后可以大约1:10(wt:wt)的RNA与总脂质比率将RNA添加到空脂质体中，然后在37℃下孵育30分钟以形成加载的LNP。随后可以将该混合物在PBS中透析过夜，并且用0.45-μm的针筒式滤器(syringe filter)进行过滤。

球形核酸(SNA^TM)构建体和其他纳米粒子(尤其是金纳米粒子)也被考虑作为将CRISPR-Cas系统递送至预期靶标的手段。重要数据表明，基于核酸功能化的金纳米粒子的AuraSense治疗性球形核酸(SNA^TM)构建体是可用的。

可以与本文教授内容结合使用的文献包括：Cutler等人,J.Am.Chem.Soc.[美国化学会志]2011 133:9254-9257,Hao等人,Small.2011 7:3158-3162,Zhang等人,ACS Nano.[ACS纳米]2011 5:6962-6970,Cutler等人,J.Am.Chem.Soc.[美国化学会志]2012 134:1376-1391,Young等人,Nano Lett.[纳米快报]2012 12:3867-71,Zheng等人,Proc.Natl.Acad.Sci.USA.[美国国家科学院院刊]2012 109:11975-80,Mirkin,Nanomedicine[纳米医学]2012 7:635-638Zhang等人,J.Am.Chem.Soc.[美国化学会志]2012 134:16488-1691,Weintraub,Nature[自然]2013 495:S14-S16,Choi等人,Proc.Natl.Acad.Sci.USA.[美国国家科学院院刊]2013 110(19):7625-7630,Jensen等人,Sci.Transl.Med.[科学转化医学]5,209ra152(2013)以及Mirkin等人,Small,10:186-192。

具有RNA的自组装纳米粒子可以用PEG化的聚乙烯亚胺(PEI)构建，其中Arg-Gly-Asp(RGD)肽配体附接在聚乙二醇(PEG)的远端。此系统已作为例如靶向表达整合素的肿瘤新血管系统的手段和作为递送抑制血管内皮生长因子受体2(VEGF R2)表达以及由此实现肿瘤血管新生的siRNA的手段(例如参见，Schiffelers等人,Nucleic Acids Research[核酸研究],2004,第32卷,第19期)。纳米丛(nanoplex)可以通过以下方式制备：将等体积的阳离子聚合物水性溶液和核酸水性溶液混合，以在2至6范围内产生可电离氮(聚合物)相比磷酸盐(核酸)的净摩尔过量。在阳离子聚合物与核酸之间的静电相互作用使得聚复合物(polyplex)形成，该聚复合物具有约100nm的平均粒径分布，因此在此称之为纳米丛。设想了CRISPR Cas的约100至200mg的剂量，用于Schiffelers等人的自组装纳米粒子中的递送。

Bartlett等人的纳米丛(PNAS[美国国家科学院院刊],2007年9月25日,第104卷,第39期)也可以适用于本发明。Bartlett等人的纳米丛通过以下方式制备：将等体积的阳离子聚合物水性溶液和核酸水性溶液混合，以在2至6范围内产生可电离氮(聚合物)相比磷酸盐(核酸)的净摩尔过量。在阳离子聚合物与核酸之间的静电相互作用使得聚复合物(polyplex)形成，该聚复合物具有约100nm的平均粒径分布，因此在此称之为纳米丛。Bartlett等人的DOTA-siRNA合成如下：1,4,7,10-四氮杂环十二烷-1,4,7,10-四乙酸单(N-羟基琥珀酰亚胺酯)(DOTA-NHS酯)订购自Macrocyclics公司(达拉斯(Dallas)，德克萨斯州(TX))。将于碳酸盐缓冲液(pH 9)中的具有100倍摩尔过量的DOTA-NHS-酯的胺修饰的RNA有义链添加到微量离心管中。通过在室温搅拌4h使这些内容物反应。将该DOTA-RNA有义轭合物用乙醇沉淀，重新悬浮在水中，并且退火到未修饰的反义链上以产生DOTA-siRNA。所有液体用Chelex-100(伯乐公司(Bio-rad)，赫库斯(Hercules)，加利福尼亚州(CA))预处理，以便去除痕量金属污染物。可以通过使用含有环糊精的聚阳离子形成Tf靶向和非靶向的siRNA纳米粒子。典型地，以3(+/-)的进料比和0.5克/升的siRNA浓度在水中形成纳米粒子。用Tf(金刚烷-PEG-Tf)修饰在靶向纳米粒子表面上的百分之一的金刚烷-PEG分子。将纳米粒子悬浮在用于注射的5％(重量/体积)葡萄糖载体溶液中。

Davis等人(Nature[自然],第464卷,2010年4月15日)进行了使用靶向的纳米粒子递送系统的RNA临床试验(临床试验登记号NCT00689065)。在21天周期的第1、3、8和10天通过30min的静脉内输注对患有标准护理治疗难治的实体癌的患者给予靶向的纳米粒子剂量。这些纳米粒子由合成递送系统组成，该系统含有：(1)线性的、基于环糊精的聚合物(CDP)，(2)展示在纳米粒子外部上的用于接合癌细胞表面上的TF受体(TFR)的人转铁蛋白(TF)靶向配体，(3)亲水性聚合物(用于促进纳米粒子在生物流体中的稳定性的聚乙二醇(PEG))，以及(4)被设计为降低RRM2(先前在临床中使用的序列指代为siR2B+5)表达的siRNA。长久以来已知TFR在恶性细胞中被下调，并且RRM2是一种确立的抗癌靶标。已经显示这些纳米粒子(临床版本指代为CALAA-01)在非人类灵长类动物中的多剂量研究中耐受性良好。虽然已经通过脂质体递送向患有慢性粒细胞白血病的单一患者给予了siRNA，但是Davis等人的临床试验是初期人类试验，该试验用靶向递送系统全身性地递送siRNA并且治疗患有实体癌的患者。为了确定该靶向递送系统是否能够将功能性siRNA有效递送至人类肿瘤，Davis等人研究了来自三个不同的剂量组群的三位患者的活组织检查；患者A、B和C，他们均患有转移性黑素瘤并且分别接受了18、24和30mg m^-2siRNA的CALAA-01剂量。还可以针对本发明的CRISPR Cas系统考虑类似的剂量。用含有线性的基于环糊精的聚合物(CDP)、展示在纳米粒子外部上的用于接合癌细胞表面上的TF受体(TFR)的人转铁蛋白(TF)靶向配体和/或亲水聚合物(例如，用于促进纳米粒子在生物流体中的稳定性的聚乙二醇(PEG))的纳米粒子，可以实现本发明的递送。

就本发明而言，优选使用纳米粒子或脂质包膜递送CRISPR复合物的一种或多种组分，例如CRISPR酶或mRNA或指导RNA。其他递送系统或载体可以与本发明纳米粒子方面结合使用。

总的来说，“纳米粒子”是指具有小于1000nm直径的任何粒子。在某些优选实施例中，本发明纳米粒子具有500nm或更小的最大尺寸(例如，直径)。在其他优选实施例中，本发明纳米粒子具有介于25nm与200nm之间的范围内的最大尺寸。在其他优选实施例中，本发明纳米粒子具有100nm或更小的最大尺寸(例如，直径)。在其他优选实施例中，本发明纳米粒子具有在35nm与60nm之间的范围内的最大尺寸。

本发明中涵盖的纳米粒子(nanoarticle)可以提供为不同的形式，例如为固体纳米粒子(例如金属(例如银、金、铁、钛)、非金属、基于脂质的固体、聚合物)、纳米粒子的悬浮液、或它们的组合。可以制备金属、绝缘体和半导体纳米粒子，以及杂合结构(例如核-壳纳米粒子)。如果由半导体材料制备的纳米粒子足够小(典型地亚-10nm)以至于出现电子能级的量子化，则这些纳米粒子还可以是标记量子点。此类纳米级粒子作为药物载体或成像剂用于生物医学应用中并且可以适于本发明中的类似目的。

半固体和软纳米粒子以被制造出并且处于本发明的范围之内。半固体性质的原型纳米粒子是脂质体。目前，不同类型的脂质体纳米粒子在临床上用作用于抗癌药物和疫苗的递送系统。具有一半亲水性和另一半疏水性的纳米粒子被称为双面(Janus)粒子并且用于稳定化乳液是特别有效的。它们可以在水/油界面处自组装并且充当固体表面活性剂。

美国专利号8,709,843(通过引用并入本文)提供了用于将含有治疗剂的粒子靶向递送至组织、细胞和细胞内区室的药物递送系统。本发明提供了包含轭合至表面活性剂、亲水性聚合物或脂质的聚合物的靶向粒子。

美国专利号6,007,845(通过引用并入本文)提供了下述粒子：这些粒子具有通过将多官能化合物与一种或多种疏水性聚合物和一种或多种亲水性聚合物共价地连接而形成的多嵌段共聚合物的核，并且含有生物活性材料。

美国专利号5,855,913(通过引用并入本文)提供了下述颗粒组合物：该组合物含有具有小于0.4g/cm3振实密度以及介于5μm与30μm之间的平均直径的空气动力学光粒子，在其表面上掺入了表面活性剂，以用于向肺部系统的药物递送。

美国专利号5,985,309(通过引用并入本文)提供了下述粒子：这些粒子掺入了表面活性剂和/或带正电荷或带负电荷的治疗剂或诊断剂和带相反电荷的分子的亲水性或疏水性复合物，以用于向肺部系统的递送。

美国专利号5,543,158(通过引用并入本文)提供了生物可降解可注射粒子，这些粒子具有生物可降解实心核，该核在其表面上含有生物活性材料和聚(烷撑二醇)部分。

WO 2012135025(也以US 20120251560公开)(通过引用并入本文)描述了轭合的聚乙烯亚胺(PEI)聚合物和轭合的氮杂大环(统称为“一个轭合微质体(lipomer)”或“多个微质体”)。在某些实施例中，可以设想的是，此类轭合微质体可以用于CRISPR-Cas系统的情况中以在体外、离体和在体内实现基因组干扰，从而修饰基因表达，包括蛋白质表达的调控。

在一个实施例中，纳米粒子可以是环氧化物修饰的脂质-聚合物，有利地是7C1(例如参见，James E.Dahlman和Carmen Barnes等人Nature Nanotechnology[自然纳米科技](2014)2014年5月11日在线公开，doi:10.1038/nnano.2014.84)。C71是通过使C15环氧化物封端脂质与PEI600以14:1摩尔比反应合成的，并且与C14PEG2000一起进行配制以产生纳米粒子(直径介于35与60nm之间)，这些纳米粒子在PBS溶液中稳定至少40天。

环氧化物修饰的脂质-聚合物可以用于将本发明的CRISPR-Cas系统递送至肺部、心血管或肾细胞，然而，本领域技术人员可以将该系统适配成递送其他靶器官。设想了在从约0.05至约0.6mg/kg范围内的剂量。还设想了在数天或数周内的剂量，总剂量为约2mg/kg。

Xu等人,WO 2014/186366 A1(US 20160082126)进一步提供了用于递送皂草素的纳米复合物，其中纳米复合物包含皂草素和脂质样化合物，并且其中纳米复合物具有50nm至1000nm的粒径；皂草素通过非共价相互作用或共价键与脂质样化合物结合；并且脂质化合物具有亲水部分、疏水部分和连接亲水部分和疏水部分的接头，其中亲水部分任选带电并且疏水部分具有8-24个碳原子。Xu等人,WO 2014/186348(US 20160129120)提供了包含阳离子递送剂和阴离子药剂的修饰肽或蛋白质的纳米复合物的实例，其中纳米复合物具有50至1000nm的粒径，阳离子递送剂结合阴离子药剂，并且阴离子药剂是由肽和蛋白质以及含有阴离子基团的添加化学部分形成的修饰肽或蛋白质。添加的化学部分通过酰胺基、酯基、醚基，硫醚基、二硫化物基、腙基、硫酸酯基、脒基、脲基、氨基甲酸酯基、亚氨酸酯基或碳酸酯基与肽或蛋白质连接。

Anderson等人(US 20170079916)提供了修饰的树状聚合物纳米颗粒，用于向受试者递送治疗剂、预防剂和/或诊断剂，包括：一个或多个零至七代烷基化树状聚合物；一种或多种两亲聚合物；和一种或多种包封在其中的治疗、预防和/或诊断剂。一种烷基化树状聚合物可选自由以下组成的组：聚(乙烯亚胺)、聚(聚丙烯亚胺)、二氨基丁烷胺聚丙烯亚胺四胺和聚(酰氨基胺)。治疗剂、预防剂和诊断剂可选自由以下组成的组：蛋白质、肽、碳水化合物、核酸、脂质、小分子及其组合。

Anderson等人(US 20160367686)提供了具有式(I)的化合物：

及其盐，其中R.sup.L的每个实例独立地任选地是取代的C.sub.6-C.sub.40烯基，和用于将药剂递送至包含该化合物或其盐的受试者或细胞的组合物；药剂；以及任选地，赋形剂。药剂可以是有机分子、无机分子、核酸、蛋白质、肽、多核苷酸、靶向剂、同位素标记的化合物、疫苗、免疫剂或用于生物加工的药剂。该组合物可进一步包含胆固醇、PEG化脂质、磷脂或载脂蛋白。

Anderson等人(US 20150232883)提供了递送颗粒配制品和/或系统，优选纳米颗粒递送配制品和/或系统，其包含(a)CRISPR-Cas系统RNA多核苷酸序列；或(b)Cas9；或(c)CRISPR-Cas系统RNA多核苷酸序列和Cas9两者；或(d)一种或多种载体，其包含一种或多种编码(a)、(b)或(c)的核酸分子，其中CRISPR-Cas系统RNA多核苷酸序列和Cas9不是天然一起出现的。递送颗粒配制品可进一步包含表面活性剂、脂质或蛋白质，其中表面活性剂可包含阳离子脂质。

Anderson等人(US 20050123596)提供了微粒的实例，所述微粒被设计成当暴露于酸性条件时释放其有效负载，其中所述微粒包含至少一种待递送的药剂、pH引发剂、和聚合物，其中该聚合物选自下组：聚甲基丙烯酸酯和聚丙烯酸酯。

Anderson等人(US 20020150626)提供了用于递送核酸的脂质-蛋白质-糖颗粒，其中通过使多核苷酸与脂质、蛋白质和糖接触将多核苷酸包封在脂质-蛋白质-糖基质中；和多核苷酸、脂质、蛋白质和糖的喷雾干燥混合物以制备微粒。

Liu等人(US 20110212179)提供了包含基础聚合物的双峰多孔聚合物微球，其中该颗粒包含直径范围为从约20至约500微米的大孔和直径范围为从约1至约70微米的微孔，并且其中所述微球具有直径范围为从约50至约1100微米。

Berg等人(US 20160174546)提供了一种纳米脂质递送系统，特别是纳米颗粒浓缩物，其包含：含有脂质、油或溶剂的组合物，该组合物在25℃的粘度小于100cP以及贝壳杉丁醇溶解度大于25Kb；和至少一种选自下组的两亲化合物，该组由以下组成：烷氧基化脂质、烷氧基化脂肪酸、烷氧基化醇、杂原子亲水脂质、杂原子亲水脂肪酸、杂原子亲水醇、稀释剂及其组合，其中该化合物来源于在50℃粘度小于1000cP的起始化合物，其中将浓缩物配置成提供稳定的纳米乳液，其在稀释时具有D50和小于100nm的平均粒径分布。

Zhu等人(US 20140348900)提供了使用多端口歧管制备脂质体、脂质盘和其他脂质纳米颗粒的方法，其中将含有有机溶剂的脂质溶液流与两种或更多种水性溶液(例如，缓冲)流混合。在一些方面中，脂质和水性溶液流中的至少一些不直接彼此相对。因此，该方法不需要稀释有机溶剂作为另外的步骤。在一些实施例中，这些溶液中之一还可含有活性药物成分(API)。本发明提供了一种用不同脂质配制品和不同有效负载制造脂质体的稳健方法。可以通过改变端口尺寸和歧管端口的数量，以及通过选择脂质和水性溶液的流速(flowrate或flow velocity)来控制粒径、形态和制造规模。

Cullis等人(US 20140328759)提供了直径为10-100nm的极限尺寸脂质纳米颗粒，特别是包含围绕水性核的脂质双层。还公开了用于制备这种极限尺寸脂质纳米颗粒的方法和设备。

Manoharan等人(US 20140308304)提供了具有式(I)的阳离子脂质

或其盐，其中X是N或P；R’不存在，或者是氢或烷基；关于R.sup.1和R.sup.2，(i)R.sup.1和R.sup.2各自独立地是任选地取代的烷基、烯基、炔基、环烷基、环烷基烷基、杂环或R.sup.10；(ii)R.sup.1和R.sup.2连同它们所附接的氮原子一起形成任选地取代的杂环状环；或(iii)R.sup.1和R.sup.2中之一是任选地取代的烷基、烯基、炔基、环烷基、环烷基烷基、或杂环，并且另一个与(a)相邻氮原子和(b)与该氮原子相邻的(R).sub.a基团一起形成4-10元杂环状环或杂芳基；R的每次出现独立地是--(CR.sup.3R.sup.4)--；R.sup.3和R.sup.4的每次出现独立地是H、卤素、OH、烷基、烷氧基、--NH.sub.2、烷基氨基、或二烷基氨基；或R.sup.3和R.sup.4连同它们直接附接的碳原子一起形成环烷基基团，其中与原子X*附接的每条链中不超过3个R基团是环烷基；R.sup.10的每次出现独立地选自PEG和基于聚(噁唑啉)、聚(环氧乙烷)、聚(乙烯醇)、聚(甘油)、聚(N-乙烯吡咯烷酮)、聚[N-(2-羟丙基)甲基丙烯酰胺]和聚(氨基酸)的聚合物，其中(i)PEG或聚合物是直链或支链的，(ii)PEG或聚合物通过n个亚单元聚合，(iii)n是10至200单位的数均聚合度，以及(iv)其中具有式的化合物具有至多两个R.sup.10基团；Q不存在或是--O--、--NH--、--S--、--C(O)O--、--OC(O)--、--C(O)N(R.sup.4)--、--N(R.sup.5)C(O)--、--S--S--、--OC(O)O--、--O--N.dbd.C(R.sup.5)--、--C(R.sup.5).dbd.N--O--、--OC(O)N(R.sup.5)--、--N(R.sup.5)C(O)N(R.sup.5)--、--N(R.sup.5)C(O)O--、--C(O)S--、--C(S)O--或--C(R.sup.5).dbd.N--O--C(O)--；Q.sup.1和Q.sup.2各自独立地不存在或者是--O--、--S--、--OC(O)--、--C(O)O--、--SC(O)--、--C(O)S--、--OC(S)--、--C(S)O--、--S--S--、--C(O)(NR.sup.5)--、--N(R.sup.5)C(O)--、--C(S)(NR.sup.5)--、--N(R.sup.5)C(O)--、--N(R.sup.5)C(O)N(R.sup.5)--、或--OC(O)O--；Q.sup.3和Q.sup.4各自独立地是H、--(CR.sup.3R.sup.4)--、芳基、或胆固醇部分；A.sup.1、A.sup.2、A.sup.3和A.sup.4的每次出现独立地是--(CR.sup.5R.sup.5--CR.sup.5.dbd.CR.sup.5)--；R.sup.5的每次出现独立地是H或烷基；M.sup.1和M.sup.2各自独立地是生物可降解基团(例如--OC(O)--、--C(O)O--、--SC(O)--、--C(O)S--、--OC(S)--、--C(S)O--、--S--S--、--C(R.sup.5).dbd.N--、--N.dbd.C(R.sup.5)--、--C(R.sup.5).dbd.N--O--、--O--N.dbd.C(R.sup.5)--、--C(O)(NR.sup.5)--、--N(R.sup.5)C(O)--、--C(S)(NR.sup.5)--、--N(R.sup.5)C(O)--、--N(R.sup.5)C(O)N(R.sup.5)--、--OC(O)O--、--OSi(R.sup.5).sub.2O--、--C(O)(CR.sup.3R.sup.4)C(O)O--、或--OC(O)(CR.sup.3R.sup.4)C(O)--)；Z不存在，或者是亚烃基或--O--P(O)(OH)--O--；每个------(附接至Z)是任选的键，使得当Z不存在时，Q.sup.3和Q.sup.4不直接共价键合在一起；a是1、2、3、4、5或6；b是0、1、2、或3；c、d、e、f、i、j、m、n、q和r各自独立地是0、1、2、3、4、5、6、7、8、9、或10；g和h各自独立地是0、1或2；k和l各自独立地是0或1，其中k和l中至少一个是1；并且o和p各自独立地是0、1或2，其中Q.sup.3和Q.sup.4各自独立地与标有星号(X*)的第三个原子通过具有8个或更多个原子的链分离。阳离子脂质可以与其他脂质组分如胆固醇和PEG-脂质一起使用以与寡核苷酸形成脂质纳米颗粒，以促进细胞摄取和内体逃逸，并在体外和体内敲低靶mRNA。

Liu等人(US 20140301951)提供了一种原始细胞纳米结构，其包含：含有多个孔的多孔粒子核；和至少一个包围该多孔粒子核的脂质双层以形成原始细胞，其中原始细胞能够将一种或多种货物组分加载到多孔粒子核的多个孔中并穿过周围的脂质双层从多孔粒子核释放该一种或多种货物组分。

Chromy等人(US 20150105538)提供了用于组装、溶解和/或纯化纳米脂蛋白颗粒中的膜相关蛋白的方法和系统，其包括在洗涤剂存在下进行的温度转变循环，其中在该温度转变循环期间，使纳米脂蛋白组分达到一个温度，该温度高于和低于形成纳米脂蛋白颗粒的脂质的膜的凝胶至液态结晶转变温度。

Bader等人(US 20150250725)提供了一种制备脂质颗粒的方法，包括以下步骤：i)提供包含变性载脂蛋白的第一溶液，ii)将第一溶液添加到包含至少两种脂质和去污剂但不含载脂蛋白的第二种溶液中，和iii)从ii)中获得的溶液中除去洗涤剂，并且从而产生脂质颗粒。

Mirkin等人(US 20100129793)提供了一种制备复合颗粒的方法，包括以下步骤：(a)混合介电组分和磁性组分以形成第一中间体，(b)混合第一中间体和金种子以形成第二中间体，和(c)通过将第二中间体与金源和还原剂混合以在第二中间体上形成金壳，以形成所述复合颗粒。

外来体

外来体是转运RNA和蛋白质的内源性纳米囊泡，并且可以将RNA递送至脑和其他靶器官。为了降低免疫原性，Alvarez-Erviti等人(2011,Nat Biotechnol[自然生物技术]29:341)使用了用于外来体产生的自我衍生的树突细胞。通过将树突细胞工程化为表达Lamp2b(一种外来体膜蛋白，融合至神经元特异性RVG肽)实现对脑的靶向。通过电穿孔使纯化的外来体加载外源性RNA。静脉内注射的RVG靶向的外来体将GAPDH siRNA特异性地递送至脑中的神经元、小胶质细胞、少突神经胶质细胞，导致特异性的基因敲低。预暴露于RVG外来体未减弱敲低，并且在其他组织中未观察到非特异性摄取。通过BACE1的强的mRNA(60％)和蛋白质(62％)敲低证明了外来体介导的siRNA递送的治疗潜能，BACE1是一种阿尔茨海默病中的治疗靶标。

为了获得免疫惰性的外来体库，Alvarez-Erviti等人收获了来自具有同源主要组织相容性复合体(MHC)单倍型的近交C57BL/6小鼠的骨髓。由于未成熟树突细胞产生大量的缺乏T细胞激活剂例如MHC-II和CD86的外来体，Alvarez-Erviti等人选择了具有粒细胞/巨噬细胞集落刺激因子(GM-CSF)的树突细胞，持续7天。次日，使用良好建立的超速离心方案从培养上清液中纯化外来体。产生的外来体在物理上是均质的，具有直径为80nm的粒径分布峰，如通过纳米粒子跟踪分析(NTA)和电子显微镜检查所测定。Alvarez-Erviti等人获得了6-12μg的外来体(基于蛋白质浓度测量的)/10⁶个细胞。

其次，Alvarez-Erviti等人研究了使用适于纳米级应用的电穿孔方案给修饰的外来体加载外源性货物的可能性。由于电穿孔对于纳米级的膜粒子尚未良好表征，使用非特异性Cy5标记的RNA用于电穿孔方案的经验优化。在外来体超速离心和溶解之后测定了封装的RNA量。在400V和125μF下的电穿孔产生RNA的最大保留并且用于所有的后续实验。

Alvarez-Erviti等人向正常C57BL/6小鼠给予被封装在150μg的RVG外来体中的150μg的每种BACE1siRNA并且将敲低效率与四个对照进行比较：未处理的小鼠、仅用RVG外来体注射的小鼠、用与一种体内阳离子脂质体试剂复合的BACE1siRNA注射的小鼠、以及用与RVG-9R复合的BACE1siRNA注射的小鼠，该RVG肽与静电结合siRNA的9个D-精氨酸轭合。在给药之后3天，分析皮层组织样品，并且在siRNA-RVG-9R处理的和siRNARVG外来体处理的小鼠中均观察到显著的蛋白质敲低(45％，P<0.05，相对于62％，P<0.01)，这是由于BACE1mRNA水平的显著降低(分别为66％[+或-]15％，P<0.001和61％[+或-]13％，P<0.01)。此外，申请人证明了在RVG-外来体处理的动物中总[β]-淀粉样蛋白1-42水平上的显著降低(55％，P<0.05)，该β淀粉样蛋白为一种在阿尔茨海默病理学中的淀粉样白斑的主要成分。所观察到的降低大于在心室内注射BACE1抑制剂之后的正常小鼠中展示的β淀粉样蛋白1-40降低。Alvarez-Erviti等人在BACE1切割产物上进行了5'-cDNA末端快速扩增(RACE)，其提供了经由siRNA的RNAi-介导的敲低的证据。

最后，Alvarez-Erviti等人通过评估IL-6、IP-10、TNFα和IFN-α血清浓度研究了RNA-RVG外来体是否诱导了体内免疫应答。在外来体处理之后，类似于与强有力地刺激IL-6分泌的siRNA-RVG-9R相反的siRNA转染试剂处理，登记了在所有细胞因子上的非显著性变化，证实了该外来体处理的免疫惰性属性(profile)。假定外来体仅封装20％的siRNA，用RVG-外来体的递送比RVG-9R递送显得更有效，因为用少五倍的siRNA实现了相当的mRNA敲低和更好的蛋白质敲低，而没有相应水平的免疫刺激。这个实验证明了RVG-外来体技术的治疗潜力，其潜在地适合于与神经变性疾病相关的基因的长期沉默。Alvarez-Erviti等人的外来体递送系统可以适用于将本发明的CRISPR-Cas系统递送至治疗靶标，尤其是神经变性疾病。对于本发明可以考虑封装在约100至1000mg的RVG外来体中的约100至1000mg的CRISPR Cas的剂量。

El-Andaloussi等人(Nature Protocols[自然实验手册]7,2112-2126(2012))披露了可以如何利用来源于培养的细胞的外来体用于体外和体内递送RNA。这个方案首先描述了通过转染一种包含与肽配体融合的外来体蛋白的表达载体产生靶向的外来体。接着，El-Andaloussi等人解释了如何纯化和表征来自转染的细胞上清液的外来体。接着，El-Andaloussi等人详述了将RNA加载到外来体中的关键步骤。最后，El-Andaloussi等人概述了如何使用外来体有效地在体外递送RNA以及体内递送至小鼠脑中。还提供了预期结果的实例，其中外来体介导的RNA递送通过功能测定和成像来评价。整个方案进行约3周。根据本发明的递送或给药可以使用从自我衍生的树突细胞产生的外来体来进行。根据本文的教授内容，这可以应用在本发明的实践中。

在另一个实施例中，考虑了Wahlgren等人的血浆外来体(Nucleic AcidsResearch[核酸研究],2012,第40卷,第17期e130)。外来体是由包括树突细胞(DC)、B细胞、T细胞、肥大细胞、上皮细胞和肿瘤细胞的许多细胞类型产生的纳米尺寸的囊泡(30-90nm大小)。这些囊泡通过晚期内体的向内出芽而形成，并且然后在与质膜融合后释放到细胞外环境。因为外来体天然地在细胞之间运送RNA，所以这种特性在基因治疗中可能有用，并且根据本披露可以应用在本发明的实践中。来自血浆的外来体可以通过以下方式制备：以900g离心血沉棕黄层20min以便分离血浆，然后收获细胞上清液，以300g离心10min以便消除细胞，并且以16500g离心30min，然后通过0.22mm过滤器进行过滤。通过以120000g超速离心70min使外来体沉淀。根据在RNAi人类/小鼠启动(Starter)试剂盒(凯杰公司(Quiagen)，希尔顿(Hilden)，德国)中的制造商说明进行siRNA到外来体中的化学转染。siRNA以终浓度2mmol/ml添加到100ml PBS中。在添加HiPerFect转染试剂之后，将该混合物在室温下孵育10min。为了去除过量的胶束，使用醛/硫酸盐乳胶珠再分离外来体。可以类似于siRNA进行CRISPR Cas到外来体中的化学转染。外来体可以与从健康供体的外周血中分离的单核细胞和淋巴细胞共培养。因此，可以考虑的是，可以将含有CRISPR Cas的外来体引入到人类的单核细胞和淋巴细胞中并且以自体方式再引入到人类中。因此，可以使用血浆外来体进行根据本发明的递送或给药。

脂质体

可以用脂质体进行根据本发明的递送或给药。脂质体是球形囊泡结构，其由围绕内部水性区室的单层或多层脂质双层以及相对不可渗透的外部亲脂性磷脂双层构成。脂质体作为药物递送载体受到了相当的重视，因为它们是生物相容、无毒的，可以递送亲水性和亲脂性药物分子，保护它们的货物免于被血浆酶降解，并且转运它们的负荷跨过生物膜和血脑屏障(BBB)(对于评述，例如参见，Spuch和Navarro,Journal of Drug Delivery[药物递送杂志],第2011卷,文献标识码469679,12页,2011.doi:10.1155/2011/469679)。

可以由几种不同类型的脂质制造脂质体；然而，磷脂最常用来产生作为药物载体的脂质体。虽然当脂质膜与一种水性溶液混合时脂质体形成是自发的，但是也可以通过使用均质机、超声破碎器、或挤出设备通过以振荡的形式施加力使其加速(对于评述，例如参见，Spuch和Navarro,Journal of Drug Delivery[药物递送杂志],第2011卷,文献标识码469679,12页,2011.doi:10.1155/2011/469679)。

可以将几种其他的添加剂添加到脂质体中，以便修饰其结构和特性。例如，可以将胆固醇或鞘磷脂添加到脂质体混合物中，以便帮助稳定化脂质体结构并且防止脂质体内部货物的泄漏。此外，脂质体由氢化卵磷脂酰胆碱或卵磷脂酰胆碱、胆固醇和磷酸二鲸蜡脂制备，并且脂质体的平均囊泡尺寸被调整到约50nm和100nm。(对于评述，例如参见，Spuch和Navarro,Journal of Drug Delivery[药物递送杂志],第2011卷,文献标识码469679,12页,2011.doi:10.1155/2011/469679)。

脂质体配制品可以是主要由天然磷脂和脂质例如1,2-二硬脂酰-sn-甘油基-3-磷脂酰胆碱(DSPC)、鞘磷脂、卵磷脂酰胆碱和单唾液酰神经节苷酯构成。因为这种配制品仅由磷脂组成，所以脂质体配制品已经遇到了许多挑战，其中之一是在血浆中的不稳定性。已经做出战胜这些挑战的若干尝试，特别是在脂质膜的处理方面。这些尝试之一集中于胆固醇的处理。将胆固醇添加到常规配制品中减缓了封装的生物活性化合物到血浆中的迅速释放，或者添加1,2-二油酰基-sn-甘油基-3-磷酸乙醇胺(DOPE)增加稳定性(对于评述，例如参见，Spuch和Navarro,Journal of Drug Delivery[药物递送杂志],第2011卷,文献标识码469679,12页,2011.doi:10.1155/2011/469679)。

在特别有利的实施例中，特洛伊木马(Trojan Horse)脂质体(也称为分子特洛伊木马)是令人希望的并且方案可见于http://cshprotocols.cshlp.org/content/2010/4/pdb.prot5407.long。这些粒子允许转基因在血管内注射之后递送至整个脑。在不受限制的情况下，据信表面轭合有特异性抗体的中性脂质粒子允许经由胞吞作用跨过血脑屏障。申请人假定利用特洛伊木马脂质体将核酸酶的CRISPR家族经由血管内注射递送至脑，这将允许全脑转基因动物，而不需要胚胎操纵。对于脂质体中的体内给药，可以考虑约1-5g的DNA或RNA。

在另一个实施例中，CRISPR Cas系统或其组分可以脂质体例如稳定的核酸脂质粒子(SNALP)来给予(例如，参见，Morrissey等人,Nature Biotechnology[自然生物技术],第23卷,第8期,2005年8月)。考虑每日静脉内注射约1、3或5mg/kg/天的SNALP中的被靶向的特异性CRISPR Cas。日治疗可以经过约三天，并且然后每周治疗持续约五周。在另一个实施例中，还考虑了通过以约1或2.5mg/kg的剂量静脉内注射给予封装有特异性CRISPR Cas的SNALP(参见例如Zimmerman等人,Nature Letters[自然快报],第441卷,2006年5月4日)。该SNALP配制品可以含有为2:40:10:48的摩尔百分比的脂质3-N-[(w甲氧基聚(乙二醇)2000)氨甲酰]-1,2-二肉豆蔻氧基-丙胺(PEG-C-DMA)、1,2-二亚油基氧基-N,N-二甲基-3-氨基丙烷(DLinDMA)、1,2-二硬脂酰-sn-甘油基-3-磷酸胆碱(DSPC)和胆固醇(参见例如Zimmerman等人,Nature Letters[自然快报],第441卷,2006年5月4日)。

在另一个实施例中，已经证明稳定的核酸-脂质粒子(SNALP)将分子有效地递送至高度血管化的HepG2-衍生的肝脏肿瘤，但是不递送至血管化不良的HCT-116衍生的肝脏肿瘤(参见例如Li,Gene Therapy[基因治疗](2012)19,775-780)。可以通过以下方式制备SNALP脂质体：使用25:1的脂质/siRNA比率和48/40/10/2的胆固醇/D-Lin-DMA/DSPC/PEG-C-DMA的摩尔比，用二硬脂酰磷脂酰胆碱(DSPC)、胆固醇和siRNA配制D-Lin-DMA和PEG-C-DMA。生成的SNALP脂质体的大小为约80-100nm。

在又另一个实施例中，SNALP可以包含合成胆固醇(西格玛-奥德里奇公司(Sigma-Aldrich)，圣路易斯(St Louis)，密苏里州(MO)，美国)、二棕榈酰磷脂酰胆碱(阿凡提极地脂质公司(Avanti Polar Lipids)，阿拉巴斯特(Alabaster)，阿拉巴马州(AL)，美国)、3-N-[(w-甲氧基聚(乙二醇)2000)氨甲酰]-1,2-二肉豆蔻氧基丙基胺，以及阳离子的1,2-二亚油基氧基-3-N,N二甲基氨基丙烷(参见例如Geisbert等人,Lancet[柳叶刀]2010；375:1896-905)。例如可以考虑静脉内推注给予约2mg/kg总CRISPR Cas/剂的剂量。

在又另一个实施例中，SNALP可以包含合成胆固醇(西格玛-奥德里奇公司)、1,2-二硬脂酰基-sn-甘油基-3-磷酸胆碱(DSPC；阿凡提极地脂质公司)、PEG-cDMA，以及1,2-二亚油基氧基-3-(N；N-二甲基)氨基丙烷(DLinDMA)(参见例如Judge,J.Clin.Invest.[临床研究杂志]119:661-673(2009))。用于体内研究的配制品可以包含约9:1的最终脂质/RNA质量比。

已经由阿尔尼拉姆制药公司(Alnylam Pharmaceuticals)的Barros和Gollob评论了RNAi纳米药物的安全性曲线(例如参见，Advanced Drug Delivery Reviews[先进药物递送评论]64(2012)1730-1737)。稳定的核酸脂质粒子(SNALP)由四种不同的脂质构成-在低pH下为阳离子的可电离脂质(DLinDMA)、中性辅助脂质、胆固醇以及可扩散的聚乙二醇(PEG)-脂质。该粒子的直径为大约80nm并且在生理pH下是电中性的。在配制过程中，该可电离脂质用于在粒子形成过程中使脂质与阴离子RNA缩合。当在渐增的酸性内体条件下带正电荷时，该可电离的脂质还介导了SNALP与内体膜的融合，从而能够将RNA释放到细胞质中。该PEG-脂质在配制过程中稳定化粒子并且减少聚集，并且随后提供改进药代动力学特性的中性的亲水性外部。

到目前为止，已经使用具有RNA的SNALP配制品开始两个临床项目。泰米拉制药公司最近在具有升高的LDL胆固醇的成年志愿者中完成了SNALP-ApoB I期单剂量研究。ApoB主要是在肝脏和空肠中表达，并且是为VLDL和LDL的组装和分泌所必需的。十七位受试者接受了SNALP-ApoB的单剂量(跨7个剂量水平的剂量递增)。没有肝脏毒性(预期为基于临床前研究的潜在剂量限制性毒性)的证据。处于最高剂量的(两位中的)一位受试者经历了与免疫系统刺激一致的流感样症状，并且做出结束该试验的决定。

阿尔尼拉姆制药公司已经类似地推出了ALN-TTR01，其采用以上所述的SNALP技术并且靶向突变体和野生型TTR的肝细胞产生，以治疗TTR淀粉样变性(ATTR)。已经描述了三种ATTR综合征：家族性淀粉样变性多神经病(FAP)和家族性淀粉样心肌病(FAC)-两者均由TTR中的常染色体显性突变引起；以及由野生型TTR引起的老年全身性淀粉样变性(SSA)。最近在具有ATTR的患者中完成了ALN-TTR01的安慰剂对照单剂量递增I期试验。向31位患者(23位用研究药物，8位用安慰剂)在0.01至1.0mg/kg(基于siRNA)的剂量范围内以15分钟静脉内(IV)输注给予ALN-TTR01。治疗耐受性良好，其中在肝功能试验中没有显著增加。在≥0.4mg/kg时在23位患者的3位中注意到输注相关反应；所有患者均对减慢输注速率做出了响应并且所有患者继续参与研究。在处于1mg/kg的最高剂量(如根据临床前和NHP研究预期的)的两位患者中注意到血清细胞因子IL-6、IP-10和IL-1ra的最小与瞬时升高。在1mg/kg时观察到ALN-TTR01的预期药效动力学效应，即，血清TTR的降低。

在又另一个实施例中，可以通过将阳离子脂质、DSPC、胆固醇以及PEG-脂质例如以40:10:40:10的摩尔比分别溶解在例如乙醇中来制备SNALP(参见，Semple等人,NatureNiotechnology[自然生物技术],第28卷,第2期,2010年2月,第172-177页)。将该脂质混合物添加到水性缓冲液中(50mM柠檬酸盐，pH 4)，混合至最终的乙醇和脂质浓度分别为30％(体积/体积(vol/vol))和6.1mg/ml，并且使得其在22℃下平衡2min，然后挤出。使用Lipex挤出仪(北方脂质公司)，在22℃下将水合脂质挤出通过两个重叠的80nm孔径大小的过滤器(Nuclepore)，直到获得如通过动态光散射分析测定的70-90nm直径的囊泡为止。这大致需要1-3道次。将该siRNA(溶解在50mM柠檬酸盐中，pH为4的含有30％乙醇的水性溶液)以约5ml/min的速率在混合下添加到预平衡的(35℃)囊泡中。在达到0.06(重量/重量(wt/wt))的最终靶siRNA/脂质比率之后，将该混合物在35℃下另外孵育30min，以允许囊泡重组和siRNA的封装。然后去除乙醇并且通过透析或切向流渗滤用PBS(155mM NaCl，3mM Na₂HPO₄，1mM KH₂PO₄，pH 7.5)替换外部缓冲液。使用受控的逐步稀释法工艺将siRNA封装在SNALP中。KC2-SNALP的脂质组分为以57.1:7.1:34.3:1.4的摩尔比使用的DLin-KC2-DMA(阳离子脂质)、二棕榈酰磷脂酰胆碱(DPPC；阿凡提极地脂质公司)、合成胆固醇(西格玛公司)和PEG-C-DMA。在形成加载的粒子后，将SNALP在PBS中透析并且在使用之前通过0.2μm的过滤器灭菌过滤。平均粒径为75-85nm，并且将90％-95％的siRNA封装在脂质粒子之内。用于体内测试的在配制品中的最终siRNA/脂质比率是约0.15(重量/重量(wt/wt))。在临使用之前将含有因子VII siRNA的LNP-siRNA系统在无菌PBS中稀释到适当浓度，并且通过侧尾静脉以10ml/kg的总体积静脉内给药。这种方法和这些系统可以外推到本发明的CRISPR Cas系统。

其他脂质

其他阳离子脂质，例如氨基脂质2,2-二亚油基-4-二甲基氨基乙基-[1,3]-二氧戊环(DLin-KC2-DMA)可以类似于SiRNA地用来封装CRISPR Cas或其组分或对其编码的一个或多个核酸分子(例如参见，Jayaraman,Angew.Chem.Int.Ed.[德国应用化学国际版]2012,51,8529-8533)，并且因此可以应用于本发明的实践中。可以考虑具有下列脂质组成的预成型囊泡：分别处于摩尔比40/10/40/10的氨基脂质、二硬脂酰磷脂酰胆碱(DSPC)、胆固醇和(R)-2,3-双(十八烷氧基)丙基-1-(甲氧基聚(乙二醇)2000)丙基碳酸酯(PEG-脂质)，以及大约0.05(w/w)的FVII siRNA/总脂质比率。为了确保在70-90nm范围内的窄粒径分布以及0.11±0.04(n＝56)的低多分散性指数，可以在添加指导RNA之前将粒子通过80nm的膜挤出达三次。可以使用含有高度有效的氨基脂质16的粒子，其中四种脂质组分16、DSPC、胆固醇和PEG-脂质的摩尔比(50/10/38.5/1.5)可以被进一步优化，以增强体内活性。

Michael S D Kormann等人(“Expression of therapeutic proteins afterdelivery of chemically modified mRNA in mice:Nature Biotechnology[在小鼠中递送化学修饰的mRNA之后治疗蛋白的表达]”:Nature Biotechnology[自然生物技术],第29卷,第154-157页,(2011))描述了脂质包膜用于递送RNA的用途。脂质包膜的用途在本发明中也是优选的。

在另一个实施例中，脂质可以与本发明的CRISPR Cas系统或其一种或多种组分或对其编码的一个或多个核酸分子一起配制而形成脂质纳米粒子(LNP)。脂质包括但不限于，DLin-KC2-DMA4、C12-200和辅助脂质二硬脂酰磷脂酰胆碱、胆固醇和PEG-DMG，可以使用自发囊泡形成程序将其与CRISPR Cas而不是siRNA一起配制(例如参见，Novobrantseva,Molecular Therapy-Nucleic Acids[分子治疗-核酸](2012)1,e4；doi:10.1038/mtna.2011.3)。组分摩尔比可以是约50/10/38.5/1.5(DLin-KC2-DMA或C12-200/二硬脂酰磷脂酰胆碱/胆固醇/PEG-DMG)。在DLin-KC2-DMA和C12-200脂质纳米粒子(LNP)的情况下，最终脂质:siRNA重量比可以分别是约12:1和9:1。配制品可以具有约80nm的平均粒子直径，具有>90％的包封效率。可以考虑3mg/kg的剂量。

泰米拉公司在美国和国外具有一组针对LNP和LNP配制品的不同方面的大约95个同族专利(参见例如，美国专利号7,982,027；7,799,565；8,058,069；8,283,333；7,901,708；7,745,651；7,803,397；8,101,741；8,188,263；7,915,399；8,236,943和7,838,658，以及欧洲专利号1766035；1519714；1781593和1664316)，所有这些专利均可用于和/或适于本发明。

该CRISPR Cas系统或其组分或对其编码的一个或多个核酸分子可以封装在PLGA微球中进行递送，例如进一步描述于美国公开申请20130252281和20130245107以及20130244279(转让给Moderna Therapeutics公司)中，这些申请涉及包含修饰的核酸分子的组合物的配制品方面，这些核酸分子可以编码蛋白质、蛋白质前体、或该蛋白质或该蛋白质前体的部分或完全加工形式。该配制品可以具有50:10:38.5:1.5-3.0(阳离子脂质:融合脂质:胆固醇:PEG脂质)的摩尔比。PEG脂质可以选自但不限于PEG-c-DOMG、PEG-DMG。该融合脂质可以是DSPC。还参见，Schrum等人,Delivery and Formulation of EngineeredNucleic Acids[工程化核酸的递送和配制]，美国公开申请20120251618。

Nanomerics公司的技术着手解决针对广泛治疗学的生物利用度挑战，包括基于低分子量疏水性药物、肽以及核酸(质粒、siRNA、miRNA)的治疗学。该技术已经证明了明显优势的特异性的给药途径包括口服途径、跨血脑屏障的转运、向实体瘤以及眼部的递送。例如参见，Mazza等人,2013,ACS Nano.[ACS纳米]2013年2月26日；7(2):1016-26；Uchegbu和Siew,2013,J Pharm Sci.[制药科学杂志]102(2):305-10和Lalatsa等人,2012,J ControlRelease[控释杂志]2012年7月20日；161(2):523-36。

美国专利公开号20050019923描述了用于向哺乳动物身体递送生物活性分子例如多核苷酸分子、肽和多肽和/或药剂的阳离子树状聚合物。这些树状聚合物适合于将生物活性分子的递送靶向至例如肝脏、脾、肺、肾或心脏(或甚至脑)。树状聚合物是由简单的支化单体单元以逐步方式制备的合成性3维大分子，其性质和功能性可以容易地进行控制和改变。树状聚合物经由向多功能核(发散式合成法)或朝向多功能核(收敛式合成法)重复加成结构单元来合成，并且结构单元的3维壳的每次加成使得更高级别的树状聚合物形成。聚丙烯亚胺树状聚合物从二氨基丁烷核开始，通过对伯胺的丙烯腈的双迈克尔加成反应向其上添加两倍数目的氨基基团，然后进行腈的氢化。这导致氨基基团的加倍。聚丙烯亚胺树状聚合物含有100％的可质子化氮以及高达64个末端氨基基团(5级，DAB 64)。可质子化基团通常是能够在中性pH下接受质子的胺基。树状聚合物作为基因递送剂的用途在很大程度上集中于聚酰胺-胺和含磷化合物的用途，其中胺/酰胺的混合物或N--P(O₂)S分别作为轭合单元，没有报道关于更低级别的聚丙烯亚胺树状聚合物用于基因递送的用途的工作。还研究了作为pH敏感的控制释放系统的聚丙烯亚胺树状聚合物，其用于药物递送以及当被外周氨基酸基团化学修饰时用于它们的客体分子的封装。还研究了聚丙烯亚胺树状聚合物的细胞毒性和其与DNA的相互作用以及DAB 64的转染效力。

美国专利公开号20050019923是基于与早期报道相反的观察：阳离子树状聚合物例如聚丙烯亚胺树状聚合物展示出适当的特性，例如特异性靶向和低毒性，其用于靶向递送生物活性分子例如遗传物质。此外，阳离子树状聚合物的衍生物也展示出适用于生物活性分子的靶向递送的特性。还参见，生物活性聚合物(Bioactive Polymer)、美国公开申请20080267903，其披露“不同的聚合物，包括阳离子聚胺聚合物和树枝状聚合物显示出具有抗增殖活性，并且因此可用于治疗特征为不希望的细胞增殖的障碍，例如新生物和肿瘤、炎性障碍(包括自身免疫性障碍)、银屑病和动脉粥样硬化。这些聚合物可以作为活性剂单独使用，或者作为其他治疗剂(例如药物分子或用于基因治疗的核酸)的递送载体。在此类情况下，聚合物的自身固有的抗肿瘤活性可以补足有待递送的药剂的活性。这些专利出版物的披露内容可以与本文的教授内容结合使用，以用于递送一种或多种CRISPR Cas系统或其一种或多种组分或对其编码的一个或多个核酸分子。

超电荷蛋白

超电荷蛋白是一类具有非常高的正或负的理论净电荷的工程化或天然存在的蛋白质并且可以用于递送一种或多种CRISPR Cas系统或其一种或多种组分或对其编码的一个或多个核酸分子。超负电荷蛋白和超正电荷蛋白两者都表现出显著的抵抗热诱导或化学诱导的聚集的能力。超正电荷蛋白还能够穿透哺乳动物细胞。使货物例如质粒DNA、RNA或其他蛋白质与这些蛋白质缔合可以使得这些大分子到体外和体内的哺乳动物细胞中的功能递送成为可能。David Liu实验室(David Liu’s lab)在2007年报道了超电荷蛋白的创建和表征(Lawrence等人,2007,Journal of the American Chemical Society[美国化学学会杂志]129,10110-10112)。

RNA和质粒DNA到哺乳动物细胞中的非病毒递送对于研究和治疗应用都是有价值的(Akinc等人,2010,Nat.Biotech.[自然生物技术]26,561-569)。纯化的+36GFP蛋白(或其他超正电荷蛋白)与RNA在适当的无血清培养基中混合并且使得其在添加到细胞中之前复合。在这个阶段血清的包含抑制超电荷蛋白-RNA复合物的形成并且降低治疗效果。已经发现以下方案对于多种细胞系是有效的(McNaughton等人,2009,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]106,6111-6116)(然而，应当进行改变蛋白质和RNA剂量的预试验来优化用于特异性细胞系的程序)：

(1)在治疗前一天，以1x10⁵个细胞/孔接种于48孔板中。

(2)在治疗当天，将纯化的+36GFP蛋白在无血清的培养基中稀释至终浓度200nM。添加RNA到50nM的终浓度。涡旋混合并且在室温下孵育10min。

(3)在孵育过程中，从细胞抽出培养基并且再次用PBS洗涤。

(4)在孵育+36GFP和RNA之后，向细胞添加蛋白质-RNA复合物。

(5)将细胞与复合物在37℃下孵育4h。

(6)在孵育之后，抽出培养基并且用20U/mL的肝素PBS洗涤三次。用含血清的培养基另外孵育细胞48h或更长，这取决于用于活性的测定。

(7)通过免疫印迹、qPCR、表型分析或其他适当的方法分析细胞。

David Liu实验室已经进一步发现+36GFP在一系列细胞中是一种有效的质粒递送试剂。由于质粒DNA是一种比siRNA大的货物，有效复合质粒需要成比例地更大的+36GFP蛋白。为了有效质粒递送，申请人已经开发了一种带有C末端HA2肽标签的+36GFP变体，这种肽是一种已知的来源于流感病毒血凝素蛋白的内体破坏肽。以下方案在多种细胞中是有效的，但是如上所述，建议针对特异性细胞系和递送应用优化质粒DNA和超电荷蛋白的剂量。

(1)在治疗前一天，以1x10⁵/孔接种于48孔板中。(2)在治疗当天，将纯化的GFP蛋白在无血清的培养基中稀释至终浓度2mM。添加1mg质粒DNA。涡旋混合并且在室温下孵育10min。

(3)在孵育过程中，从细胞抽出培养基并且再次用PBS洗涤。

(4)在孵育GFP和质粒DNA之后，向细胞轻轻添加蛋白质-DNA复合物。

(5)将细胞与复合物在37℃下孵育4h。

(6)在孵育之后，抽出培养基并且用PBS洗涤。在含血清培养基中孵育细胞，并且另外孵育24-48h。

(7)在适当时分析质粒递送(例如，通过质粒驱动的基因表达)。

还参见，例如，McNaughton等人,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]106,6111-6116(2009)；Cronican等人,ACS Chemical Biology[ACS化学生物学]5,747-752(2010)；Cronican等人,Chemistry&Biology[化学与生物学]18,833-838(2011)；Thompson等人,Methods in Enzymology[酶学方法]503,293-319(2012)；Thompson,D.B.等人,Chemistry&Biology[化学与生物学]19(7),831-843(2012)。超电荷蛋白的这些方法可以用于和/或适于本发明的CRISPR Cas系统的递送。Lui博士的这些系统和本文的文献并入本文的教授内容可以用于递送一种或多种CRISPR Cas系统或其一种或多种组分或对其编码的一个或多个核酸分子。

细胞穿透肽(CPP)

在又另一个实施例中，考虑了细胞穿透肽(CPP)用于CRISPR Cas系统的递送。CPP是促进不同分子货物(从纳米级粒子至小化学分子和大的DNA片段)的细胞摄取的短肽。如本文所用的术语“货物”包括但不限于下组，该组由下项组成：治疗剂、诊断性探针、肽、核酸、反义寡核苷酸、质粒、蛋白质、粒子(包括纳米粒子)、脂质体、发色团、小分子以及放射性物质。在本发明的方面中，货物还可以包括CRISPR Cas系统的任何组分或整个功能性CRISPR Cas系统。本发明的方面进一步提供了用于将所希望的货物递送至受试者中的方法，这些方法包括：(a)制备包含本发明的细胞穿透肽和所希望的货物的复合物，并且(b)向受试者口服地、关节内地、腹膜内地、鞘内地、动脉内地(intrarterially)、鼻内地、实质内地(intraparenchymally)、皮下地、肌内地、静脉内地、真皮地、直肠内地或局部地给予复合物。货物通过经由共价键的化学连接或通过非共价的相互作用与肽缔合。

CPP的功能是将货物递送至细胞中，这是一种通常通过胞吞作用发生的过程，其中货物被递送至活哺乳动物细胞的内体。细胞穿透肽具有不同的尺寸、氨基酸序列并且带电荷，但是所有CPP具有一种独特的特性，该特性是易位质膜的能力，并且促进不同分子货物到细胞质或细胞器的递送。CPP易位可以被分类成三种主要的进入机制：直接穿透膜中、胞吞作用介导的进入，以及通过瞬时结构的形成的易位。CPP在医学中发现了许多应用，在治疗不同疾病包括癌症中作为药物递送剂，和病毒抑制剂以及用于细胞标记的造影剂。后者的实例包括充当用于GFP、MRI造影剂或量子点的载体。CPP作为用于研究和医学的体外及体内递送载体具有极大潜力。CPP典型地具有下述的氨基酸组成，该氨基酸组成含有高相对丰度的带正电荷的氨基酸例如赖氨酸或精氨酸或具有含有极性/带电荷氨基酸和非极性、疏水性氨基酸的交替图案的序列。这两种结构类型被分别称之为聚阳离子或两亲性分子。CPP的第三种类别是疏水性肽，其仅含有具有低净电荷极性残基或具有对细胞摄取是关键的疏水性氨基酸基团。所发现的原始CPP中之一是来自人类免疫缺陷病毒1(HIV-1)的反激活转录激活因子(Tat)，发现该Tat被培养物中的多种细胞类型从周围培养基中有效摄取。从此以后，多种已知的CPP得到了相当地扩展并且产生了具有更有效的效应蛋白转导特性的小分子合成类似物。CPP包括但不限于穿透素、Tat(48-60)、转运素和(R-AhX-R4)(Ahx＝氨基己酰基)。

美国专利8,372,951提供了来源于嗜酸性粒细胞阳离子蛋白(ECP)的CPP，该CPP表现出非常高的细胞穿透效率和低毒性。还提供了将带有其货物的CPP递送至脊椎动物受试者中的方面。CPP的另外方面和其递送描述于美国专利8,575,305；8；614,194和8,044,019中。CPP可以用于递送CRISPR-Cas系统或其组分。可以用于递送CRISPR-Cas系统或其组分的CPP也被提供于Suresh Ramakrishna,Abu-Bonsrah Kwaku Dad,Jagadish Beloor等人写的手稿“Gene disruption by cell-penetrating peptide-mediated delivery ofCas9protein and guide RNA[通过细胞穿透肽介导的Cas9蛋白和指导RNA的递送进行的基因破坏]”，Genome Res.[基因组研究]2014年4月2日[电子版先于印刷版]中，该文献通过引用以其整体并入本文，其中展示出的是用CPP轭合的重组Cas9蛋白和CPP复合的指导RNA的处理导致人类细胞系中的内源性基因破坏。在论文中，Cas9蛋白经由硫醚键轭合至CPP，而指导RNA与CPP复合，形成了稠合的带正电荷的粒子。已表明，用修饰的Cas9和指导RNA对人类细胞(包括胚胎干细胞、真皮成纤维细胞、HEK293T细胞、HeLa细胞和胚胎癌细胞)的同时处理和依序处理产生有效的基因破坏，其中相对于质粒转染脱靶突变减少。

可植入装置

在另一个实施例中，还考虑了可植入装置用于递送CRISPR Cas系统或其一种或多种组分或对其编码的一个或多个核酸分子。例如，美国专利公开20110195123披露了一种可植入的医疗器械，其局部地且在一长时间段内洗脱药物，包括了若干种类型的此设备、实施的治疗方式和植入方法。该装置包含聚合物基材(例如基质(例如用作装置主体的基质))以及药物，并且在一些情况下包含另外的支架材料，例如金属或另外的聚合物，以及增强能见度和成像的材料。可植入的递送装置在提供局部且一长时间段内的释放方面可能是有利的，其中药物直接释放到患病区域例如肿瘤、炎症、退化的细胞外基质(ECM)，或用于针对症状的目的，或者释放到损伤的平滑肌细胞，或者用于预防。一种药物是如以上披露的RNA，并且这个系统可以用于和/或适于本发明的CRISPR Cas系统。在一些实施例中，植入方式是针对包括近距离放射疗法和针吸活组织检查的其他治疗的当今开发和使用的现有植入程序。在这样的情况下，在本发明中描述的新植入物的尺寸类似于原始植入物。典型地，在同一的治疗程序中，植入了几个装置。

美国专利公开20110195123提供了一种药物递送可植入或可插入系统，包括适用于空腔例如腹腔和/或其中药物递送系统未被锚定或附接的任何其他类型的给药的系统，这些系统包括生物稳定的和/或可降解的和/或生物可吸收的聚合物基材，该基材可以例如任选地是一种基质。应当指出的是术语“插入”也包括植入。该药物递送系统优选地如美国专利公开20110195123中描述的“装填器(Loder)”那样实施。

聚合物或多种聚合物是生物相容的，其结合一种药剂和/或多种药剂，使得药剂以控制的速率释放，其中该聚合物基材例如基质的总体积，例如在一些实施例中是任选地并且优选地不大于容许达到该药剂的治疗水平的最大体积。作为一个非限制性实例，这样的体积优选在0.1m³至1000mm³的范围内，正如该药剂负荷的体积所要求的。该装填器任选地是较大的，例如当结合有其尺寸由功能性决定的装置例如而不限于，膝关节、宫内节育环或子宫颈环等时。

在一些实施例中，该药物递送系统(用于递送该组合物)被设计为优选采用可降解聚合物，其中主要释放机制是本体溶蚀(bulk erosion)；或者在一些实施例中，使用了不可降解的、或缓慢降解的聚合物，其中主要释放机制是扩散而不是本体溶蚀，使得外部部分用作膜，并且其内部部分用作药物贮库，该药物贮库在延长的时间段内(例如从约一周至约几个月)实际上不受环境的影响。还可以任选地使用具有不同释放机制的不同聚合物的组合。在总药物释放期的重要时段期间，在表面处的浓度梯度优选地维持为有效恒定，并且因此扩散速率是有效恒定的(称为“零模式”扩散)。关于术语“恒定”，它意指优选地维持在治疗有效性的低阈值以上的扩散速率，但是可以仍然任选地具有初期突释的特征和/或可以发生波动，例如增加和降低到一定程度。扩散速率优选地被如此维持一长时间段，并且可以考虑使它相对于一定的水平是恒定的，以便优化治疗有效期，例如有效沉默期。

药物递送系统任选地并且优选地被设计为保护基于核苷酸的治疗剂免于降解，而无论是化学性质还是由于受试者体内的酶和其他因素的攻击。

美国专利公开20110195123的药物递送系统任选地与感测和/或激活设备相关联，这些设备通过激活和/或加速/减速的无创和/或微创方法在该装置的植入之时和/或之后被操作，这些方法例如任选地包括但不限于热力加热和冷却、激光束和超声波，包括聚焦超声和/或RF(射频)方法或装置。

根据美国专利公开20110195123的一些实施例，用于局部递送的位点可以任选地包括特征为高度异常的细胞增殖和受抑制的细胞凋亡的靶位点，包括肿瘤、活动性和/或慢性炎症和感染，包括自身免疫性疾病状态、退化组织(包括肌肉和神经组织)、慢性疼痛、退行性位点，以及用于增强组织再生的骨折位置以及其他伤口位置，以及损伤的心肌、平滑肌和横纹肌。

用于植入该组合物的位点、或靶位点，优选地其特征为用于靶向局部递送的足够小的半径、面积和/或体积。例如，该靶位点任选地具有在从约0.1mm至约5cm范围内的直径。

该靶位点的位置优选地针对最大治疗效力而选择。例如，该药物递送系统的组合物(任选地与如上所述的用于植入的装置一起)任选地并且优选地被植入在肿瘤环境或与肿瘤环境相关联的血供之内或附近。

例如该组合物(任选地与该装置一起)任选地植入在胰脏、前列腺、乳房、肝脏之内或附近，经由接管(nipple)进行，植入在血管系统之内，等等。

靶位置任选地选自下组，该组包括下项、基本上由、或由下项组成(仅仅作为非限制性实例，因为任选地身体内的任何位点可以适合于植入装填器)：1.在退行性位点处的脑，像在帕金森病或阿尔茨海默病中在基底神经节、白质和灰质处；2.如在肌萎缩侧索硬化(ALS)的情况下的脊柱；3.预防HPV感染的子宫颈；4.活动性或慢性炎性关节；5.在银屑病情况下的真皮；6.用于止痛作用的交感神经位点和感觉神经位点；7.骨内植入；8.急性和慢性感染位点；9.阴道内；10.耳内--听觉系统、内耳的迷路、前庭系统；11.气管内；12.心内；冠状动脉、心外膜；13.膀胱；14.胆道系统；15.实质组织，包括但不限于肾、肝脏、脾；16.淋巴结；17.唾液腺；18.牙龈；19.关节内(进入关节)；20.眼内；21.脑组织；22.脑室；23.空腔，包括腹腔(例如但不限于，卵巢癌)；24.食管内以及25.直肠内。

任选地，该系统(例如含有该组合物的装置)的插入与向在靶位点处和该位点附近的ECM注射材料相关联，从而影响该靶位点和此位点附近的ECM中的局部pH和/或温度和/或影响该药物扩散和/或药物动力学的其他生物因素。

任选地，根据一些实施例，所述药剂的释放可以与感测和/或激活设备相关联，这些设备通过激活和/或加速/减速的无创和/或微创方法和/或别的方法在插入之前和/或之时和/或之后被操作，所述方法包括激光束、放射、热力加热和冷却、和超声波，包括聚焦超声和/或RF(射频)方法或装置、以及化学激活剂。

根据美国专利公开20110195123的其他实施例，药物优选地包括RNA，例如，对于局限性癌症情况，在乳房、胰脏、脑、肾、膀胱、肺以及前列腺中，如下文所述。尽管使用RNAi进行举例说明，但是许多药物是适用于封装在装填器中的，并且可以与本发明结合使用，只要此类药物可以用装填器基材例如像基质封装，并且此系统可以用于和/或适于递送本发明的CRISPR Cas系统。

作为特殊应用的另一个实例，神经肌肉退行性疾病由于异常基因表达而发生。RNA的局部递送可以具有干扰此异常基因表达的治疗特性。包括小药物和大分子的抗凋亡、抗炎症和抗退行性药物的局部递送也可以任选地是治疗性的。在这样的情况下，该装填器用于以恒定速率和/或通过单独植入的专用装置延长释放。这都可以用于和/或适于本发明的CRISPR Cas系统。

作为特殊应用的又另一个实例，用基因修饰剂治疗精神和认知障碍。基因敲低是一个治疗选择。向中枢神经系统位点局部递送药剂的装填器是对于精神障碍和认知障碍的治疗选择，这些精神障碍和认知障碍包括但不限于，精神病、双极疾病、神经性障碍和行为疾病。这些装填器也可以在特定脑位点进行植入时局部递送包括小药物和大分子的药物。这都可以用于和/或适于本发明的CRISPR Cas系统。

作为特殊应用的另一个实例，在局部位点的先天性和/或适应性免疫介质的沉默能够预防器官移植排斥。用植入到移植器官和/或植入位点中的装填器局部递送RNA和免疫调节试剂使得通过排斥性免疫细胞(例如针对移植器官而被激活的CD8)产生局部免疫抑制。这都可以用于和/或适于本发明的CRISPR Cas系统。

作为特殊应用的另一个实例，包括VEGF和血管生成素及其他的血管生长因子对于新血管形成是必需的。这些因子、肽、肽模拟物的局部递送或抑制它们的阻遏物是一种重要的治疗模式；使阻遏物沉默以及用装填器局部递送刺激血管发生的这些因子、肽、大分子和小药物对于周围血管疾病、全身性血管疾病和心血管疾病是具有治疗性的。

插入的方法，例如植入，可以任选地已用于其他类型的组织植入和/或用于插入和/或用于组织取样，任选地在此类方法中没有修改，或者可替代地任选地仅仅具有非重点修改。此类方法任选地包括但不限于，近距离放射疗法、活组织检查、用和/或不用超声的内窥镜检查例如ERCP、进入脑组织的立体定位法、腹腔镜检查，包括用腹腔镜进入关节、腹器官、膀胱壁和体腔的植入。

本文所讨论的可植入装置技术可以与本文的教授内容一起使用并且因此，通过本披露和本领域知识，CRISPR-Cas系统或其组分或其核酸分子或编码组分或提供组分的核酸分子可以经由可植入装置递送。

患者特异性筛选方法

靶向DNA，例如三核苷酸重复序列的核酸靶向系统可以用于筛选存在此类重复序列的患者或患者样品。重复序列可以是核酸靶向系统的RNA的靶标，并且如果通过核酸靶向系统与其存在结合，则可以检测出该结合，从而表明此类序列存在。因此，核酸靶向系统可以用于筛选存在此类重复序列的患者或患者样品。然后可以向患者给予一种或多种适合的化合物以解决此病状；或可以给予核酸靶向系统以结合此病状并且产生插入、缺失或突变并且缓解此病状。

本发明使用核酸结合靶DNA序列。

CRISPR效应蛋白mRNA和指导RNA

也可以单独递送CRISPR酶mRNA和指导RNA。CRISPR酶mRNA可以在指导RNA在给出时间以待CRISPR酶表达之前递送。CRISPR酶mRNA可以在给予指导RNA之前1-12小时(优选约2-6小时)给予。

可替代地，CRISPR酶mRNA和指导RNA可以一起给予。有利地，指导RNA的第二加强剂量可以在初始给予CRISPR酶mRNA+指导RNA之后1-12小时(优选约2-6小时)给予。

本发明的CRISPR效应蛋白，即Cpf1效应蛋白本文有时称之为CRISPR酶。应了解的是，效应蛋白是基于或来源于酶，所以术语“效应蛋白”当然包括一些实施例中的“酶”。然而，还应了解的是，根据在一些实施例中的需要，效应蛋白可以具有DNA结合，但是不一定具有切割或切口活性，包括无效Cas效应蛋白功能。

为了实现最有效的基因组修饰水平，CRISPR酶mRNA和/或指导RNA的附加给予可能是有用的。在一些实施例中，当特别是在治疗方法中遗传疾病被靶向时，表型改变优选是基因组修饰的结果并且优选其中提供了修复模板以校正或改变表型。

在一些实施例中，可以被靶向的疾病包括与引起疾病的剪接缺陷相关的那些。

在一些实施例中，细胞靶标包括造血干细胞/祖细胞(CD34+)；人类T细胞；以及眼(视网膜细胞)-例如光受体前体细胞。

在一些实施例中，基因靶标包括：人类β球蛋白-HBB(用于治疗镰状细胞贫血，包括通过刺激基因转变(使用紧密相关的HBD基因作为内源性模板)进行)；CD3(T细胞)；以及CEP920-视网膜(眼)。

在一些实施例中，疾病靶标还包括：癌症；镰状细胞贫血(基于点突变)；HIV；β-地中海贫血；以及眼睛或眼部疾病-例如引起莱伯氏先天性黑矇(LCA)的剪接缺陷。

在癌症治疗的上下文中，特定目的靶标是癌基因，例如PIK3CA或KRAS。在具体实施例中，Cpf1效应蛋白用于通过敲除增功能RAS突变体基因来破坏肿瘤。ras基因家族的成员(其是小GTP酶超家族)涉及各种恶性肿瘤，包括肺腺癌、黏液腺瘤、胰腺导管癌和结肠直肠癌。用于靶向RAS癌基因的适合的指导序列的实例是本领域已知的，并且包括但不限于CTGAATTAGCTGTATCGTCA(SEQ ID NO:)和GAATATAAACTTGTGGTAGT(SEQ ID NO:)。

在一些实施例中，递送方法包括：酶-指导复合物(核糖核蛋白)的阳离子脂质介导的“引导”以及质粒DNA的电穿孔。

本发明方法可以进一步包括模板的递送，例如修复模板，这些修复模板可以是dsODN或ssODN，参见下文。模板递送可以是经由与任一或所有CRISPR酶或指导序列的递送同时发生或分开并且经由相同递送机制或不同递送机制。在一些实施例中，优选的是，模板与指导序列一起递送，并且也优选地与CRISPR酶一起递送。一个实例可以是AAV载体。

本发明方法可以进一步包括：(a)将包含互补于由所述双链断裂创建的突出端的突出端的双链寡脱氧核苷酸(dsODN)递送至细胞，其中所述dsODN被整合到目的座位中；或-(b)将单链寡脱氧核苷酸(ssODN)递送至细胞，其中所述ssODN充当用于所述双链断裂的同源定向修复的模板。本发明方法可以用于预防或治疗个体的疾病，任选地其中所述疾病由所述目的座位中的缺陷导致。本发明方法可以在个体中体内进行或者在取自个体的细胞上离体进行，任选地其中所述细胞被返回至个体。

为了最小化毒性和脱靶效应，重要的是控制所递送的CRISPR酶mRNA和指导RNA的浓度。CRISPR酶mRNA和指导RNA的最佳浓度可以通过以下方式来确定：测试不同浓度的细胞模型或动物模型并且使用深度测序分析潜在的脱靶基因组座位处的修饰程度。例如，对于人类基因组的EMX1基因中的指导序列靶向5'-GAGTCCGAGCAGAAGAAGAA-3'，深度测序可以用于评估以下两个脱靶座位处的修饰水平：1：5'-GAGTCCTAGCAGGAGAAGAA-3'和2：5'-GAGTCTAAGCAGAAGAAGAA-3'。得到最高的中靶修饰水平同时使脱靶修饰水平最小化的浓度应被选择用于体内递送。

诱导型系统

在一些实施例中，CRISPR酶可以形成诱导型系统的一种组分。该系统的诱导性质允许使用能量形式时间空间控制基因编辑或基因表达。能量形式可以包括但不限于，电磁辐射、声能、化学能以及热能。诱导型系统的实例包括四环素诱导型启动子(Tet-开或Tet-关)、小分子双杂交转录激活系统(FKBP、ABA等)、或光诱导型系统(光敏色素、LOV结构域或隐花色素)。在一个实施例中，CRISPR酶可以是光诱导型转录效应物(LITE)的一部分，从而以序列特异性方式引导转录活性的变化。光诱导型系统的组分可以包括CRISPR酶、光反应性细胞色素异源二聚体(例如，来自阿拉伯芥)、以及转录激活/阻遏结构域。诱导型DNA结合蛋白及其使用方法的其他实例提供于US 61/736,465和US 61/721,283、以及WO 2014/018423A2和US8889418、US 8895308、US 20140186919、US 20140242700、US 20140273234、US20140335620、WO 2014093635中，其通过引用以其整体特此并入。

本发明包括本发明的组合物用于建立和利用条件型或诱导型CRISPR转基因细胞/动物的用途；例如参见，Platt等人,Cell[细胞](2014),159(2):440-455，或本文引用的PCT专利出版物，例如WO 2014/093622(PCT/US 2013/074667)。例如，细胞或动物如非人类动物，例如脊椎动物或哺乳动物，如啮齿动物，例如小鼠、大鼠或其他实验室或野生动物，例如猫、狗、羊等，可以进行“敲入”，由此类似于Platt等人该动物条件型地或可诱导型地表达Cpf1(包括如本文所述的修饰的Cpf1中的任一个)。因此靶细胞或动物包含条件型或可诱导型(例如呈Cre依赖性构建体的形式)的CRISRP酶(例如Cpf1)和/或条件型或可诱导型的衔接蛋白，在引入到靶细胞中的载体表达时，载体表达Cre，从而诱导或产生了靶细胞中的CRISPR酶(例如Cpf1)表达和/或衔接体表达的条件。通过应用本发明的教授内容和组合物以及创建CRISPR复合物的已知方法，诱导型基因组事件还可以是本发明的一个方面。这个的仅一个实例是CRISPR敲入/条件型转基因动物(例如，包含例如Lox-Stop-polyA-Lox(LSL)盒的小鼠)的产生以及随后递送一种或多种提供一种或多种(修饰的)gRNA(例如，用于基因激活目的的靶基因的-200核苷酸至TSS，例如，具有被外壳蛋白识别的一种或多种适配体的修饰的gRNA，例如MS2)的组合物，如本文所述的一种或多种衔接蛋白(与一个或多个VP64连接的MS2结合蛋白)和用于诱导条件型动物的手段(例如，用于使Cpf1表达诱导的Cre重组酶)。可替代地，可以提供衔接体蛋白质作为具有条件型或诱导型CRISPR酶的条件型或诱导型元件，以提供用于筛选目的的有效模型，该有效模型有利地仅需要对于大量应用的特异性gRNA的最小设计和给予。

具有去稳定结构域或与其缔合的根据本发明的酶

在一个方面中，本发明提供了如本文其他地方所述的Cpf1，其与至少一个去稳定结构域(DD)缔合；并且，出于简化目的，与至少一个去稳定结构域(DD)缔合的这种CRISPR酶在本文中称为“DD-CRISPR酶”。应该理解的是，如本文其他地方所述的根据本发明的CRISPR酶中的任一个可用作具有如下文所述的去稳定化结构域或与其缔合。如本文其他地方所述的方法、产物、组合物和用途中的任一个是同样适用于如下文进一步详述的与去稳定化结构域缔合的CRISPR酶。应该理解的是，在如本文所述的方面和实施例中，当提及或解读作为CRISPR酶的Cpf1时，功能CRISPR-Cas系统的重构优选不需要或不依赖于tracr序列并且/或者同向重复序列是指导(靶或间隔区)序列的5'(上游)。

作为进一步指导，提供了以下的特定方面和实施例。

作为如本部分所述的方面和实施例涉及DD-CRISPR酶、DD-Cas、DD-Cpf1、DD-CRISPR-Cas或DD-CRISPR-Cpf1系统或复合物，没有前缀“DD”的术语“CRISPR”、“Cas”、“Cpf1”、“CRISPR系统”、“CRISPR复合物”、“CRISPR-Cas”、“CRISPR-Cpf1”等可以被认为具有前缀DD，尤其是当上下文允许使得本披露正在解读DD实施例。在一个方面中，本发明提供了工程化的、非天然存在的DD-CRISPR-Cas系统，该系统包含DD-CRISPR酶，例如这样的DD-CRISPR酶：其中CRISPR酶是Cas蛋白(本文称为“DD-Cas蛋白”，即在例如“DD-CRISPR-Cpf1复合物”的术语之前的“DD”意指具有Cpf1蛋白(其具有至少一个与其缔合的去稳定结构域)的CRISPR-Cpf1复合物)、有利地是DD-Cas蛋白，例如，与至少一个去稳定结构域(本文称为“DD-Cpf1蛋白”)和指导RNA缔合的Cpf1蛋白。核酸分子(例如DNA分子)可以编码基因产物。在一些实施例中，DD-Cas蛋白可以切割编码基因产物的DNA分子。在一些实施例中，基因产物的表达被改变。Cas蛋白和指导RNA不并不同时天然存在。本发明包括包含指导序列的指导RNA。在一些实施例中，功能CRISPR-Cas系统可以包含另外的功能结构域。在一些实施例中，本发明提供了用于改变或修饰基因产物的表达的方法。该方法可以包括引入到含有靶核酸(例如DNA分子)或含有和表达靶核酸(例如DNA分子)的细胞中；例如，靶核酸可编码基因产物或提供基因产物(例如调控序列)的表达。

在一些一般实施例中，DD-CRISPR酶与一个或多个功能结构域缔合。在一些更多的特异性实施例中，DD-CRISPR酶是无效Cpf1和/或与一个或多个功能结构域缔合。在一些实施例中，DD-CRISPR酶包含例如α-螺旋或混合的α/β二级结构的截短。在一些实施例中，截短包括用接头去除或替换。在一些实施例中，接头是支链的或以其他方式允许DD和/或功能结构域的拴系。在一些实施例中，CRISPR酶通过融合蛋白与DD缔合。在一些实施例中，CRISPR酶与DD融合。换句话说，DD可以通过与所述CRISPR酶融合而与CRISPR酶缔合。在一些实施例中，酶可以被认为是修饰的CRISPR酶，其中该CRISPR酶与至少一个去稳定结构域(DD)融合。在一些实施例中，DD可以经由连接体蛋白(例如使用例如标记系统(例如链霉抗生物素蛋白-生物素系统)的系统)与CRISPR酶结合。因此，提供了CRISPR酶与对该连接体的高亲和力配体特异的连接体蛋白的融合，而DD与所述高亲和力配体结合。例如，链霉抗生物素蛋白可以是与CRISPR酶融合的连接体，而生物素可以与DD结合。共定位后，链霉抗生物素蛋白将与生物素结合，从而将CRISPR酶连接至DD。为简单起见，在一些实施例中优选CRISPR酶与DD的融合。在一些实施例中，融合包含DD和CRISPR酶之间的接头。在一些实施例中，融合可以是与CRISPR酶的N-末端融合。在一些实施例中，至少一个DD与CRISPR酶的N-末端融合。在一些实施例中，融合可以是与CRISPR酶的C-末端融合。在一些实施例中，至少一个DD与CRISPR酶的C-末端融合。在一些实施例中，一个DD可以与CRISPR酶的N-末端融合，并且另一个DD与CRISPR酶的C-末端融合。在一些实施例中，CRISPR酶与至少两个DD缔合，并且其中第一DD与CRISPR酶的N-末端融合，并且第二DD与CRISPR酶的C-末端融合，该第一和第二DD是相同或不同的。在一些实施例中，融合可以是与DD的N-末端融合。在一些实施例中，融合可以是与DD的C-末端融合。在一些实施例中，融合可以在CRISPR酶的C-末端和DD的N-末端之间。在一些实施例中，融合可以在DD的C-末端和CRISPR酶的N-末端之间。用包含至少一个N-末端融合的DD比用于包含至少一个C末端融合的DD观察到更少的背景。结合N-和C-末端融合具有最小背景但总体活性最低。有利地，通过至少一个N-末端融合或至少一个N末端融合加至少一个C-末端融合来提供DD。并且当然，DD可以通过至少一个C端融合来提供。

在某些实施例中，蛋白质去稳定化结构域(例如诱导型调节)可以与例如Cpf1的N-末端和/或C-末端融合。另外地，可以在溶剂暴露的环中将去稳定化结构域引入例如Cpf1的一级序列中。Cpf1核酸酶初级结构的计算分析揭示了三个不同的区。第一是C末端RuvC样结构域，其是仅功能表征的结构域。第二是N末端α-螺旋区并且第三是位于RuvC样结构域与α-螺旋区之间的混合的α区和β区。预测非结构化区的若干小片段在Cpf1初始结构之内。对于小蛋白质序列的拆分和插入而言，不同的Cpf1直向同源物内的暴露于溶剂且不保守的非结构化区是优选的侧面。另外，这些侧面可以用于在Cpf1直向同源物之间产生嵌合蛋白。

在一些实施例中，DD是ER50。在一些实施例中，此DD的相应的稳定化配体是4HT。这样，在一些实施例中，至少一种DD中的一种是ER50，并且其稳定化配体是4HT或CMP8。在一些实施例中，DD是DHFR50。在一些实施例中，此DD的相应的稳定化配体是TMP。这样，在一些实施例中，至少一个DD中的一个是DHFR50并且因此稳定化配体是TMP。在一些实施例中，DD是ER50。在一些实施例中，此DD的相应的稳定化配体是CMP8。因此，在ER50系统中CMP8可以是4HT的替代性稳定化配体。虽然有可能CMP8和4HT可以/应该使用在竞争事件中，但是一些细胞类型可以对这两种配体中的一个或另一个更易感，并且根据本披露和本领域的知识，技术人员可以使用CMP8和/或4HT。

在一些实施例中，在一个或两个DD与CRISPR酶的C-末端融合的情况下，一个或两个DD可以与CRISPR酶的N-末端融合。在一些实施例中，至少两个DD与CRISPR酶缔合并且这些DD是相同的DD，即这些DD是同源的。因此，两个(或两个或更多个)DD可以是ER50DD。这在一些实施例中是优选的。可替代地，两个(或两个或更多个)DD可以是DHFR50DD。这在一些实施例中也是优选的。在一些实施例中，至少两个DD与CRISPR酶缔合并且这些DD是不同的DD，即这些DD是异源的。因此，一个DD可以是ER50，而一个或多个DD或任何其他DD可以是DHFR50。具有为异源的两个或更多个DD可能是有利的，因为其将提供更大的降解控制水平。在N或C-末端处超过一个的DD的衔接融合可以增强降解；并且这样的衔接融合可以是例如ER50-ER50-Cpf1或DHFR-DHFR-Cpf1。设想的是高的降解水平将在不存在任一稳定化配体的情况下发生，中等的降解水平将在不存在一种稳定化配体并且存在其他(或另一)稳定化配体的情况下发生，而低的降解水平将在存在两种(两种或更多种)稳定化配体的情况下发生。控制还可以通过具有N-末端的ER50DD和C-末端的DHFR50DD来赋予。

在一些实施例中，CRISPR酶与DD的融合包含在DD与CRISPR酶之间的接头。在一些实施例中，接头为GlySer接头。在一些实施例中，DD-CRISPR酶进一步包含至少一个核输出信号(NES)。在一些实施例中，DD-CRISPR酶包含两个或更多个NES。在一些实施例中，DD-CRISPR酶包含至少一个核定位信号(NLS)。这可以与NES相附加。在一些实施例中，CRISPR酶包含以下或基本上由或由以下组成：作为CRISPR酶与DD之间的接头或作为该接头的一部分的定位(核输入或输出)信号。HA或Flag标签作为接头也在本发明的范围之内。申请人使用NLS和/或NES作为接头并且还使用如最高至(GGGGS)₃的GS一样短的甘氨酸丝氨酸接头。

在一个方面中，本发明提供了编码CRISPR酶和缔合的DD的多核苷酸。在一些实施例中，编码的CRISPR酶和缔合的DD与第一调节元件可操作地连接。在一些实施例中，DD也被编码并与第二调节元件可操作地连接。有利地，这里的DD是“清除(mop up)”稳定化配体，并且因此它有利地是与酶缔合的相同的DD(即相同类型的结构域)，例如，如本文所讨论的(其理解为术语“清除”意指如本文所讨论的并且还可以传达执行以便贡献或结束活性)。通过用不与CRISPR酶缔合的过量DD清除稳定化配体，可以看到CRISPR酶的更大降解。在不受理论束缚的情况下，设想的是添加另外的或过量的非缔合的DD，使平衡偏离络合或结合至与CRISPR酶缔合的DD的稳定化配体，而是更多转向络合或结合至游离DD(即不与CRISPR酶缔合)的稳定化DD。因此，当希望通过增加CRISPR酶的降解来降低CRISPR酶活性时，优选提供过量或另外的非缔合(或游离)的DD。过量的游离DD结合残留配体并且还从DD-Cas融合中带走结合的配体。因此，它加速DD-Cas降解并增强Cas活性的时间控制。在一些实施例中，第一调节元件是启动子并且可以任选地包括增强子。在一些实施例中，第二调节元件是启动子并且可任选地包括增强子。在一些实施例中，第一调节元件是早期启动子。在一些实施例中，第二调节元件是晚期启动子。在一些实施例中，第二调节元件是诱导型控制元件(任选地tet系统)或可阻遏的控制元件(任选地tetr系统)或包含其或基本上由其组成。诱导型启动子可能是有利的，例如rTTA，以在强力霉素存在下诱导tet。

附着或缔合可以通过如本文其他地方所述的接头进行。替代性接头是可用的，当高柔性接头被认为作用最好，以使得Cas的2个部分合在一起并因此重构Cas活性的机会最大。一个替代方案是核质蛋白的NLS可以用作接头。例如，接头也可以用在Cas与任何功能结构域之间。同样，本文可以使用(GGGGS)₃接头(或因此6、9或12个重复版本)或者可以将核质蛋白的NLS用作Cas与功能结构域之间的接头。

在功能结构域等与酶的一个或另一个部分“缔合”的情况下，这些典型地是融合。在此术语“与……缔合”是关于一个分子如何相对于另一个“缔合的”，例如CRISPR酶的部分与功能结构域之间的缔合使用的。这两者可以被认为是相互拴系的。在此类蛋白质-蛋白质相互作用的情况下，此缔合可以按照抗体识别表位的方式进行的识别来观察。可替代地，一种蛋白质可以与另一种蛋白质经由两者的融合来缔合，例如一种亚基与另一种亚基融合。典型地通过将一种蛋白质的氨基酸序列添加到另一种蛋白质的氨基酸序列上，例如经由将编码每种蛋白质或亚基的核苷酸序列剪接在一起来发生融合。可替代地，这可以实质上视为两个分子之间的结合或直接连接，例如融合蛋白。

在任何情况下，融合蛋白可以包括两个目的亚基之间的接头(例如酶和功能结构域之间或衔接体蛋白质和功能结构域之间)。因此，在一些实施例中，CRISPR酶的部分通过结合功能结构域来与该功能结构域缔合。在其他实施例中，CRISPR酶与功能结构域缔合，因为两者融合在一起，任选地通过中间接头。接头的实例包括本文所讨论的GlySer接头。虽然非共价结合的DD可能能够引发相关Cas的降解(例如Cpf1)，但蛋白酶体降解涉及蛋白质链的解旋；并且，融合是优选的，因为它可以提供DD在降解时保持与Cas连接。然而，在对DD特异的稳定化配体存在下，将CRISPR酶和DD结合在一起，形成稳定化复合物。该复合物包含与DD结合的稳定化配体。该复合物还包含与CRISPR酶缔合的DD。在不存在所述稳定化配体的情况下，促进了DD及其缔合的CRISPR酶的降解。

去稳定化结构域具有向宽范围的蛋白质赋予不稳定化性的一般效用；例如参见Miyazaki,J Am Chem Soc.[美国化学学会杂志]2012年3月7日；134(9):3942-3945，其通过引用并入本文。CMP8或4-羟基他莫昔芬(4-hydroxytamoxifen)可以是去稳定化结构域。更一般来说，哺乳动物DHFR的温度敏感突变体(DHFRts)，N端法则的去稳定化残基被发现在容许温度下是稳定的，但是在37℃是不稳定的。向表达DHFRts的细胞添加甲氨蝶呤即哺乳动物DHFR的高亲和力配体部分地抑制了蛋白质的降解。这重要地证实了小分子配体可以稳定化细胞中以其他方式被靶向降解的蛋白质。雷帕霉素衍生物用于稳定化mTOR的FRB结构域(FRB^*)的不稳定突变体并且恢复融合激酶GSK-3β.6,7的功能。此系统证实了配体依赖性的稳定性表示用于调节复合物生物环境中的特异性蛋白的功能的有吸引力的策略。用于控制蛋白质活性的系统可以涉及当通过雷帕霉素诱导的FK506结合蛋白和FKBP12的二聚化发生泛素互补时DD变成功能性的。人类FKBP12或ecDHFR蛋白的突变体可以被工程化为分别在不存在其高亲和力配体Shield-1或甲氧苄啶(TMP)的情况下是代谢不稳定的。这些突变体是可用于本发明的实践中的一些可能去稳定化结构域(DD)并且与CRISPR酶形成融合的DD的不稳定化性使得蛋白酶体对整个融合蛋白的CRISPR蛋白进行降解。Shield-1和TMP结合DD并且以剂量依赖性的方式稳定化DD。雌激素受体配体结合结构域(ERLBD，ERS1的残基305-549)也可以被工程化为去稳定化结构域。因为雌激素受体信号传导途径涉及多种疾病例如乳腺癌，该途径已被广泛研究并且已经开发出雌激素受体的许多激动剂和拮抗剂。因此，相容的ERLBD和药物对是已知的。存在结合ERLBD的突变体但不结合其野生型形式的配体。通过使用这些编码三个突变(L384M、M421G、G521R)12的突变体结构域中的一个，有可能使用不扰乱内源性雌激素敏感网络的配体来调节ERLBD源的DD的稳定性。可以引入另外的突变(Y537S)以进一步去稳定化ERLBD并且将其构造为潜在的DD候选物。四突变体是有利的DD改善。突变体ERLBD可以与CRISPR酶融合并且其稳定性可以使用配体来调控或扰乱，由此CRISPR酶具有DD。另一种DD可以是基于突变型FKBP蛋白、由Shield1配体稳定化的12-kDa(107个氨基酸)的标签；例如参见，Nature Methods[自然方法]5,(2008)。例如，DD可以是修饰的FK506结合蛋白12(FKBP12)，其结合合成的、生物惰性的小分子Shield-1并且由该Shield-1可逆地稳定化；例如参见Banaszynski LA,Chen LC,Maynard-Smith LA,Ooi AG,Wandless TJ.A rapid,reversible,and tunable method to regulate proteinfunction in living cells using synthetic small molecules.[一种使用合成的小分子调节活细胞中的蛋白质功能的快速可逆并可调的方法]Cell.[细胞]2006；126:995-1004；Banaszynski LA,Sellmyer MA,Contag CH,Wandless TJ,Thorne SH.Chemicalcontrol of protein stability and function in living mice.[活小鼠中的蛋白质稳定性和功能的化学控制]Nat Med.[自然遗传学]2008；14:1123-1127；Maynard-Smith LA,Chen LC,Banaszynski LA,Ooi AG,Wandless TJ.A directed approach for engineeringconditional protein stability using biologically silent small molecules[一种用于使用生物沉默的小分子工程化条件蛋白稳定性的定向法].The Journal ofbiological chemistry.[生物化学杂志]2007；282:24866-24872；和Rodriguez,ChemBiol.[生物化学杂志]2012年3月23日；19(3):391-398-所有文献通过引用并入本文并且在选择与本发明的实践中的CRISPR酶缔合的DD中可以应用在本发明的实践中。如可以看出的，本领域知识包括许多DD，并且DD可以有利地通过接头与CRISPR酶缔合，例如融合，由此DD在存在配体的情况下可以是稳定化的并且当不存在该配体时，DD可以是去稳定化的，由此CRISPR酶被完全去稳定化，或者DD在不存在配体的情况下可以是稳定化的并且当存在配体时，DD可以变成去稳定化的；DD允许CRISPR酶和因此CRISPR-Cas复合物或系统被调节或控制-可以说开启或关闭，从而提供用于例如在体内或体外环境中调节或控制系统的手段。例如，当目的蛋白质与DD标签作为融合一起表达时，该蛋白质被去稳定化并且在细胞中例如被蛋白酶体快速降解。因此，不存在稳定化配体使得D缔合的Cas被降解。当新的DD与目的蛋白质融合时，该DD的不稳定性被赋予至目的蛋白质，从而使得整个融合蛋白快速降解。Cas的峰值活性有时对降低脱靶效应是有益的。因此，高活性的短突释(burst)是优选的。本发明能够提供此类峰值。在一些意义上，该系统是诱导型的。在一些其他意义上，在不存在稳定化配体情况下系统被阻遏并且在存在稳定化配体的情况下系统被去阻遏。不希望受任何理论束缚且不作任何承诺，本发明的其他益处可以包括：

-可定量的(Dosable)(与打开或关闭的系统相反，例如，可以允许可变CRISPR-Cas系统或复杂的活动)。

-正交(例如，配体)仅影响其同源DD，因此两个或更多个系统可独立地操作，和/或CRISPR酶可来自一种或多种直向同源物。

-可移动的，例如，可以在不同的细胞类型或细胞系中起作用。

-快速。

-时间控制。

-能够通过允许Cas降解来减少背景或脱靶Cas或Cas毒性或Cas的过量积累。

虽然DD可以处于CRISPR酶的一个或多个N和/或C末端处，但在拆分的(如本文其他地方所定义的)一侧或多侧包括DD(例如Cpf1(N)-接头-DD-接头-Cpf1(C))也是引入DD的一种方式。在一些实施例中，如果仅使用DD与CRISPR酶的一个末端缔合，则优选使用ER50作为DD。在一些实施例中，如果使用N-和C-末端两者，则优选使用ER50和/或DHFR50。用N-末端融合观察到特别好的结果，这是出人意料的。同时具有N和C末端融合可以是协同的。去稳定结构域的大小各不相同，但典型地大约-大约为100-300个氨基酸的大小。DD优选是工程化的去稳定化蛋白质结构域。DD和例如从高亲和力配体及其配体结合结构域制备DD的方法。本发明可以被认为是“正交的”，因为只有特异性配体才能稳定其对应(同源)DD，它对非同源DD的稳定性没有影响。可商购的DD系统是CloneTech,ProteoTuner^TM系统；稳定化配体是Shield1。

在一些实施例中，稳定化配体是“小分子”。在一些实施例中，稳定化配体是细胞可渗透的。它对应DD具有高亲和力。适合的DD-稳定化配体对是本领域已知的。总的来说，稳定化配体可通过以下来除去：

-天然加工(例如蛋白酶体降解)，例如体内；

-通过以下来清除，例如离体/细胞培养：

-提供优选的结合配偶体；或者

-提供XS底物(不含Cas的DD)。

在另一个方面中，本发明提供了包含一种或多种载体的工程化的非天然存在的载体系统，这些载体包含与靶向编码基因产物的DNA分子的CRISPR-Cas系统指导RNA可操作地连接的第一调节元件以及与编码DD-Cas蛋白可操作地连接的第二调节元件。组分(a)和(b)可以位于系统的相同或不同的载体上。指导RNA靶向编码细胞中基因产物的DNA分子，并且DD-Cas蛋白可以切割编码基因产物的DNA分子(该DD-Cas蛋白可以切割一条或两条链或基本上不具有核酸酶活性)，由此改变基因产品的表达；并且，其中DD-Cas蛋白和指导RNA不是同时天然存在的。在本发明的一个实施例中，DD-Cas蛋白是DD-Cpf1蛋白。

在一个方面中，本发明提供了DD-CRISPR酶，去包含具有足以驱动所述DD-CRISPR酶在真核细胞的细胞核中和/或之外以可检测的量积累的强度的一个或多个核定位序列和/或NES。在一些实施例中，DD-CRISPR酶是DD-Cpf1酶。在一些实施例中，DD-Cpf1酶来源于土拉热弗朗西丝氏菌1、土拉热弗朗西丝氏菌新杀手亚种、易北普雷沃菌、毛螺菌科细菌MC2017 1、解朊丁酸弧菌、佩莱格里尼菌科细菌GW2011_GWA2_33_10、Parcubacteria细菌GW2011_GWC2_44_17、密斯氏菌属物种SCADC、氨基酸球菌属物种BV3L6、毛螺菌科细菌MA2020、暂定的白蚁甲烷枝原体、挑剔真细菌、牛莫拉氏菌237、牛莫拉氏菌AAX08_00205、牛莫拉氏菌AAX11_00205、丁酸弧菌属物种NC3005、硫微螺菌属物种XS5、稻田钩端螺旋体、毛螺菌科细菌ND2006、狗口腔卟啉单胞菌3、解糖胨普雷沃菌或猕猴卟啉单胞菌Cpf1(例如，被修饰成具有或缔合于至少一个DD)，并且可以进一步包含Cpf1的改变或突变，并且可以是嵌合Cpf1。在一些实施例中，DD-CRISPR酶被密码子优化为在真核细胞中表达。在一些实施例中，DD-CRISPR酶引导靶序列位置处的一条或两条链的切割。在一些实施例中，DD-CRISPR酶缺乏或基本上缺乏DNA链切割活性(例如，与野生型酶或不具有降低核酸酶活性的突变或改变的酶相比的不超过5％的核酸酶活性)。

在另外的方面中，本发明涉及用于鉴定或设计拟合DD-CRISPR-Cpf1系统或其功能部分内或与其结合的潜在的化合物(或反之亦然)的计算机辅助方法(如本文其他地方所述的，例如在“受保护的指导物”下)。

在本发明的具体实施例中，DD-CRISPR-Cpf1系统的晶体结构或DD-CRISPR-Cpf1的组分的晶体结构的构象变化提供关于蛋白质结构区域相对于可能对DD-CRISPR-Cas系统功能重要的核苷酸(RNA或DNA)结构区域的灵活性或运动的重要且关键的信息。在本文引用的材料中为Cpf1提供的结构信息可以用于进一步工程化和优化本文DD-CRISPR-Cas系统，并且这可以外推以询问其他CRISPR酶(例如DD-CRISPR酶系统，例如，其他V型CRISPR酶系统(例如其他V型DD-CRISPR酶系统))也是如此)中的结构-功能关系。本发明包括优化的功能DD-CRISPR-Cas酶系统。具体地说，DD-CRISPR酶包含一个或多个突变，该一个或多个突变将其转化为DNA结合蛋白，该结合蛋白可以募集或附加或插入或附着表现出目的功能的功能结构域。在某些实施例中，CRISPR酶在DD-CRISPR酶的RuvC1中包含一个或多个突变和/或是如本文所讨论的另外突变。在一些实施例中，DD-CRISPR酶在催化结构域中具有一个或多个突变，其中当转录时，指导序列指导DD-CRISPR复合物与靶序列的序列特异性结合，并且其中酶进一步包含功能结构域(例如，用于提供不稳定的结构域或对其做出贡献)。本文引用的材料中提供的结构信息允许询问与靶DNA和CRISPR酶(例如，Cpf1；例如DD-CRISPR酶，例如DD-Cpf1)的指导相互作用，从而允许将sgRNA结构进行工程化或改变以优化整个DD-CRISPR-Cas系统的功能。例如，可以在不与Cpf1蛋白碰撞的情况下通过插入可以与RNA结合的衔接体蛋白质来扩展指导物的环。这些衔接体蛋白质可以进一步募集包含一个或多个功能结构域的效应蛋白或融合。功能结构域可以包含转录激活结构域(例如VP64)、基本上由其组成或由其组成。功能结构域可以包含转录阻遏结构域(例如KRAB)、基本上由其组成。在一些实施例中，转录阻遏结构域是SID或SID的串联体(例如SID4X)、或包含其或基本上由其组成。在一些实施例中，功能结构域是表观遗传修饰结构域、或包含其或基本上由其组成，以便提供表观遗传修饰酶。在一些实施例中，功能结构域包含激活结构域(它可以是P65激活结构域)、基本上由其组成。

本发明的方面涵盖非天然存在的或工程化的组合物，该组合物可以包含：包含能够与细胞中目的基因组座位中的靶序列杂交的指导序列的指导RNA(gRNA)，和可能包含至少一个或多个核定位序列的DD-CRISPR酶，其中该DD-CRISPR酶包含一个或两个或更多个突变，使得与野生型酶相比，该酶具有改变或减少的核酸酶活性，其中gRNA的至少一个环是通过插入与一种或多种衔接体蛋白质结合的一种或多种不同RNA序列来修饰的，并且其中该衔接体蛋白质进一步募集一种或多种异源功能结构域。在本发明的一个实施例中，DD-CRISPR酶包含一个或两个或更多个突变。在另一个实施例中，功能结构域包含转录激活结构域(例如VP64)、基本上由其组成。在另一个实施例中，功能结构域包含转录阻遏结构域(例如KRAB结构域、SID结构域或SID4X结构域)、基本上由其组成。在本发明的实施例中，一种或多种异源功能结构域具有一种或多种活性，该一种或多种活性选自下组，该组包含、基本上由以下组成、或由以下组成：甲基化酶活性、去甲基化酶活性、转录激活活性、转录阻遏活性、转录释放因子活性、组蛋白修饰活性，RNA切割活性和核酸结合活性。在本发明的另外的实施例中，细胞是真核细胞或哺乳动物细胞或人类细胞。在另外的实施例中，衔接体蛋白质选自下组，该组包含、基本上由以下组成、或由以下组成：MS2、PP7、Qβ、F2、GA、fr、JP501、M12、R17、BZ13、JP34、JP500、KU1、M11、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、φCb5、φCb12r、φCb23r、7s、PRR1。在另一个实施例中，gRNA的至少一个环是四环和/或环2。本发明的一个方面涵盖通过将本文所述的任一组合物引入到细胞中来修饰目的基因组座位以改变该细胞中的基因表达的方法。

本发明的一个方面在于以上元件包含在单一组合物中或包含在单独组合物中。这些组合物可以有利地应用于宿主以引起基因组水平上的功能效应。

总的来说，以提供包含一个或多个功能结构域(例如，经由融合蛋白)结合的衔接蛋白的特异性结合位点(例如，适配体)的方式来修饰gRNA。对经修饰的sgRNA进行修饰使得一旦gRNA形成DD-CRISPR复合物(即结合gRNA和靶标的DD-CRISPR酶)，衔接蛋白结合，并且衔接蛋白上的功能结构域以对于属性功能有效是有利的空间取向来定位。例如，如果功能结构域包含转录激活因子(例如，VP64或p65)、基本上由转录激活因子组成，则转录激活因子被定位成允许其影响靶的转录的空间取向。同样地，转录阻遏物将有利地定位成影响靶的转录，并且核酸酶(例如Fok1)将有利地定位成切割或部分切割靶。

技术人员将理解，对gRNA的修饰(这些修饰允许衔接蛋白+功能结构域的结合但不适当定位衔接蛋白+功能结构域(例如，由于CRISPR复合物的三维结构内的空间位阻))不是故意的修饰。如本文所述，一个或多个经修饰的gRNA可以在四环、茎环1、茎环2或茎环3处修饰，优选在四环或茎环2处修饰，最优选在四环和茎环2两者处修饰。

如本文所解释的，功能结构域可以是例如来自下组的一个或多个结构域，该组包含、基本上由以下组成、或由以下组成：甲基化酶活性、脱甲基化酶活性、转录激活活性、转录阻遏活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性、DNA切割活性、核酸结合活性以及分子开关(例如光诱导型的)。在一些情况下，有利的是另外提供至少一个NLS和/或NES。在一些情况下，将NLS和/或NES定位在N末端是有利的。当包含超过一个的功能结构域时，功能结构域可以是相同或不同的。

gRNA可以被设计成包括对相同或不同衔接蛋白具有特异性的多个结合识别位点(例如适配体)。gRNA可以被设计成结合位于转录起始位点(即TSS)的上游的启动子区-1000-+1核酸，优选-200核酸。此定位改善了影响基因激活(例如，转录激活因子)或基因阻遏(例如，转录阻遏物)的功能结构域。修饰gRNA可以是组合物中包含的靶向一个或多个靶座位的一个或多个修饰gRNA(例如至少1个gRNA、至少2个gRNA、至少5个gRNA、至少10个gRNA、至少20个gRNA、至少30个gRNA、至少50个gRNA)。

此外，当核酸酶活性失活(例如，与野生型酶相比，核酸酶失活至少70％、至少80％、至少90％、至少95％、至少97％或100％；或以另一种方式，DD-Cpf1酶或DD-CRISPR酶有利地具有非突变型或野生型Cpf1酶或CRISPR酶的核酸酶活性的约0％，或不超过非突变型或野生型Cpf1酶或CRISPR酶的核酸酶活性的约3％或约5％或约10％)时，具有减少的核酸酶活性的DD-CRISPR酶最有效。有可能通过将突变引入到Cpf1和其直向同源物的RuvC核酸酶结构域中实现此举。失活的CRISPR酶可以具有一个或多个功能结构域(例如，经由融合蛋白)，例如，至少一个去稳定化结构域；或例如，如本文所述的经修饰的gRNA衔接体蛋白质的那些，包括例如来自下组的一个或多个结构域，该组包含、基本上由以下组成、或由以下组成：甲基化酶活性、脱甲基化酶活性、转录激活活性、转录阻遏活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性、DNA切割活性、核酸结合活性以及分子开关(例如光诱导型的)。优选的结构域是Fok1、VP64、P65、HSF1、MyoD1。在提供的是Fok1的情况下，有利的是提供多个Fok1功能结构域以实现功能二聚体并且gRNA被设计为提供适当间隔以用于功能性的使用(Fok1)，如Tsai等人Nature Biotechnology[自然生物技术],第32卷,第6期,2014年6月)中具体描述的。衔接体蛋白质可以利用已知的接头来附接此类功能结构域。在一些情况下，有利的是另外提供至少一个NLS或NES。在某些情况下，将NLS或NES定位在N末端是有利的。当包含超过一个的功能结构域时，功能结构域可以是相同或不同的。总的来说，一个或多个功能结构域在失活的DD-CRISPR酶上的定位是允许功能结构域的正确空间取向，从而以属性化的功能效应影响靶的定位。例如，如果功能结构域是转录激活因子(例如，VP64或p65)，则转录激活因子被定位成允许其影响靶的转录的空间取向。同样地，转录阻遏物将有利地定位成影响靶的转录，并且核酸酶(例如Fok1)将有利地定位成切割或部分切割靶。此可以包括除DD-CRISPR酶的N-末端/C-末端之外的位置。

衔接体蛋白质可以是任何数量的蛋白质，这些蛋白质与引入到经修饰的gRNA中的适配体或识别位点结合并且一旦将gRNA掺入到DD-CRISPR复合物中则允许一个或多个功能结构域的正确定位，以影响具有属性功能的靶标。如本申请中所详细解释的，可以是外壳蛋白，优选噬菌体外壳蛋白。与此类衔接体蛋白质缔合的功能结构域(例如，以融合蛋白的形式)可以包括例如来自下组的一个或多个结构域，该组包含、基本上由以下组成、或由以下组成：甲基化酶活性、脱甲基化酶活性、转录激活活性、转录阻遏活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性、DNA切割活性、核酸结合活性以及分子开关(例如光诱导型的)。优选的结构域是Fok1、VP64、P65、HSF1、MyoD1。在功能结构域是转录激活因子或转录阻遏物的情况下，有利的是另外提供至少一种NLS或NES并且其优选在N末端。当包含超过一个的功能结构域时，功能结构域可以是相同或不同的。衔接体蛋白质可以利用已知的接头来附接此类功能结构域。此类接头可用于将DD与CRISPR酶缔合或使CRISPR酶包含DD。

在一些实施例中，当特别是在治疗方法中遗传疾病被靶向时，表型改变优选是基因组修饰的结果并且优选其中提供了修复模板以校正或改变表型。

在一些实施例中，疾病靶标还包括：癌症；镰状细胞贫血(基于点突变)；HBV、HIV；β-地中海贫血；以及眼睛或眼部疾病-例如引起莱伯氏先天性黑矇(LCA)的剪接缺陷。

本文所述的方法、产物和用途可以用于非治疗性目的。此外，本文所述的方法中的任一个可以应用于体外离体中。

在一个方面中，提供了非天然存在或工程化的组合物，该组合物包含：

I.两种或更多种CRISPR-Cas系统多核苷酸序列，这些多核苷酸序列包含：

(a)能够杂交至多核苷酸座位中的第一靶序列的第一指导序列，

(b)能够杂交至多核苷酸座位中的第二靶序列的第二指导序列，

(c)同向重复序列，以及

II.Cpf1酶或编码它的第二多核苷酸序列，

其中该Cpf1酶是包含一种或多种如本文所述的DD的经修饰的酶，

其中当转录时，第一和第二指导序列分别引导第一和第二CRISPR复合物与第一和第二靶序列的序列特异性结合，

其中第一CRISPR复合物包含与可杂交至第一靶序列的第一指导序列复合的Cpf1酶，

其中第二CRISPR复合物包含与可杂交至第二靶序列的第二指导序列复合的Cpf1酶，并且

其中第一指导序列引导DNA双链体中的靠近第一靶序列的一条链的切割并且第二指导序列引导靠近第二靶序列的另一条链的切割，诱导双链断裂，从而修饰生物体或非人类或非动物生物体。

在另一个实施例中，Cpf1作为蛋白质递送至细胞中。在另一个且特别优选的实施例中，Cpf1作为蛋白质或作为编码它的核苷酸序列递送至细胞中。作为蛋白质向细胞的递送可以包括核糖核蛋白(RNP)复合物的递送，其中蛋白质与指导物复合。

在一个方面中，提供了通过本发明的组合物、系统或修饰酶修饰或包含这些组合物、系统或修饰酶的宿主细胞和细胞系，包括干细胞及其子代。

在一个方面中，提供了细胞治疗的方法，其中例如取样或培养了单个细胞或细胞群体，其中一个或多个细胞是或已经是如本文所述进行离体修饰的，并且然后被重新引入(取样的细胞)或引入(培养的细胞)到生物体中。就这一点而言，干细胞，无论胚胎干细胞或诱导多能干细胞或全能干细胞也是特别优选的。但是，当然，也设想了体内实施例。

本发明方法可以进一步包括模板的递送，例如修复模板，这些修复模板可以是dsODN或ssODN，参见下文。模板递送可以是经由与任一或所有CRISPR酶或指导序列的递送同时发生或分开并且经由相同递送机制或不同递送机制。在一些实施例中，优选的是，模板与指导序列一起递送，并且也优选地与CRISPR酶一起递送。一个实例可以是AAV载体，其中CRISPR酶是AsCpf1或LbCpf1。

本发明还包括根据使用本发明的CRISPR酶或Cas酶或Cpf1酶或CRISPR-CRISPR酶或CRISPR-Cas系统或CRISPR-Cpf1系统获得产物。

在多重(串联)靶向方法中使用的根据本发明的酶

诸位发明人已证实，本文所限定的CRISPR酶可以采用没有丧失活性的超过一个的RNA指导序列。这使得能够使用如本文所限定的CRISPR酶、系统或复合物用于靶向多个DNA靶标、基因或基因座位，其中单一酶、系统或复合物如本文所限定的。指导RNA可以是串联地安排的，任选地通过核苷酸序列例如如本文所限定的同向重复序列分开。不同指导RNA的位置是使得串联不影响活性。

在一个方面中，本发明提供了如本文所述的根据本发明的Cpf1，其用于串联或多重靶向。应该理解的是，如本文其他地方所述的根据本发明的CRISPR(或CRISPR-Cas或Cas)酶、复合物或系统中的任一个可以用于此方法中。如本文其他地方所述的方法、产物、组合物和用途中的任一个是同样适用于如下文进一步详述的多重或串联靶向方法。作为进一步指导，提供了以下的特定方面和实施例。

在一个方面中，本发明提供了如本文所限定的Cpf1酶、复合物或系统用于靶向多个基因座位的用途。在一个实施例中，这可以通过使用多个(串联或多重)指导RNA(gRNA)序列来建立。

在一个方面中，本发明提供了用于使用如在所限定的Cpf1酶、复合物或系统中的一个或多个元件用于串联或多重靶向的方法，其中所述CRISP系统包含多个指导RNA序列。优选地，所述gRNA序列通过核苷酸序列，例如如本文其他地方所限定的同向重复序列分开。

在一个方面中，本发明提供了一种如本文所限定的Cpf1酶、系统或复合物，即具有Cpf1蛋白和多个指导RNA的Cpf1 CRISPR-Cas复合物，这些指导RNA靶向多个核酸分子例如DNA分子，由此每个所述多个指导RNA特异性地靶向其相应的核酸分子，例如DNA分子。每个核酸分子靶向例如可以编码基因产物或涵盖基因座位的DNA分子。因此使用多个指导RNA能够靶向多个基因座位或多基因。在一些实施例中，Cpf1酶可以切割编码基因产物的DNA分子。在一些实施例中，基因产物的表达被改变。Cpf1蛋白和指导RNA并不同时天然存在。本发明包括包含串联地安排的指导序列的指导RNA。Cpf1酶可以形成CRISPR系统或复合物的一部分，该CRISPR系统或复合物进一步包含串联安排的指导RNA(gRNA)，包括2、3、4、5、6、7、8、9、10、15、25、25、30个或超过30个的一组指导序列，每个指导序列能够与细胞中目的基因组座位中的靶序列特异性地杂交。在一些实施例中，功能Cpf1CRISPR系统或复合物结合多个靶序列。在一些实施例中，功能CRISPR系统或复合物可以编辑多种靶序列，例如靶序列可以包含基因组座位，并且在一些实施例中，可以存在基因表达的改变。在一些实施例中，功能CRISPR系统或复合物可以进一步包含功能结构域。在一些实施例中，本发明提供了一种用于改变或修饰多种基因产物的表达的方法。该方法可以包括引入到含有所述靶核酸，例如DNA分子，或含有和表达靶核酸，例如DNA分子的细胞中；例如，靶核酸可以编码基因产物或提供基因产物(例如，调控序列)的表达。

在优选实施例中，用于多重靶向的CRISPR酶是Cpf1，或者CRISPR系统或复合物包含Cpf1。在一些实施例中，用于多重靶向的CRISPR酶是AsCpf1，或者用于多重靶向的CRISPR系统或复合物包含AsCpf1。在一些实施例中，CRISPR酶是LbCpf1，或者CRISPR系统或复合物包含LbCpf1。在一些实施例中，用于多重靶向的Cpf1酶切割DNA的两条链以产生双链断裂(DSB)。在一些实施例中，用于多重靶向的CRISPR酶是切口酶。在一些实施例中，用于多重靶向的Cpf1酶是双重切口酶。在一些实施例中，用于多重靶向的Cpf1酶是Cpf1酶，例如如本文其他地方所限定的DD Cpf1酶。

在一些一般实施例中，用于多重靶向的Cpf1酶与一个或多个功能结构域缔合。在一些更具体实施例中，用于多重靶向的CRISPR酶是如本文其他地方所限定的无效Cpf1。

还提供了组成型地表达如本文使用的Cpf1酶、复合物或系统的模型，该模型用于多重靶向中。生物体可以是转基因的并且可以用本发明的载体转染或者可以是如此转染的生物体的后代。在另外的方面中，本发明提供了包含如本文所限定的CRISPR酶、系统和复合物，或如本文所述的多核苷酸或载体的组合物。还提供了包含优选呈串联安排格式的多个指导RNA的Cpf1 CRISPR系统或复合物。所述不同的指导RNA可以通过核苷酸序列例如同向重复序列分开。

还提供了治疗受试者(例如有需要的受试者)的方法，该方法包括通过用编码Cpf1CRISPR系统或复合物的多核苷酸或本文所述的多核苷酸或载体中的任一种转化受试者来诱导基因编辑，并且向受试者给予它们。还可以提供适合的修复模板，例如通过包含所述修复模板的载体来递送。还提供了治疗受试者(例如有需要的受试者)的方法，该方法包括通过用本文所述的多核苷酸或载体转化受试者来诱导多个靶基因座位的转录激活或阻遏，其中所述多核苷酸或载体编码或包含Cpf1酶、包含优选呈串联安排的多个指导RNA的复合物或系统。在离体发生，例如在细胞培养物中发生任何处理的情况下，那么应了解的是，术语“受试者”可以通过短语“细胞或细胞培养物”来替换。

提供了用于如本文任何地方所限定的治疗方法中的组合物，这些组合物包含Cpf1酶、包含优选呈串联安排的多个指导RNA的复合物或系统，或编码或包含所述Cpf1酶、包含优选呈串联安排的多个指导RNA的复合物或系统的多核苷酸或载体。可以提供包含此类组合物的成套试剂盒。还提供了所述组合物在用于此类治疗方法的药物的制造中的用途。还通过本发明提供了Cpf1 CRISPR系统在筛选，例如增功能筛选中的用途。被人工驱使过表达基因的细胞能够通过负反馈回路来下调随时间变化的基因(重新建立平衡)。在开始筛选的时候，未被调节的基因可能再一次减少。使用诱导型Cpf1激活因子允许就在筛选之前诱导转录并且因此使假阴性命中的可能性最小化。因此，通过本发明在筛选，例如增功能筛选中的使用，假阴性结果的可能性可以被最小化。

在一些实施例中，宿主细胞是用包含编码用于如本文所限定的多靶向中的Cpf1酶、系统或复合物的多核苷酸的一种或多种载体瞬时转染或非瞬时转染的。在一些实施例中，细胞当天然存在在受试者中时被转染。在一些实施例中，转染的细胞是从受试者中获得的。在一些实施例中，细胞是来源于从受试者中获得的细胞，例如细胞系。用于组织培养的多种多样的细胞系是本领域已知的并且本文在其他地方举例说明。细胞系可从本领域技术人员已知的多种来源获得(参见例如，美国典型培养物保藏中心(ATCC)(弗吉尼亚州马纳萨斯(Manassus,Va.)))。在一些实施例中，将用包含编码用于如本文所限定的多靶向中的Cpf1酶、系统或复合物的多核苷酸的一种或多种载体转染的细胞用于建立一种包含一种或多种载体衍生序列的新细胞系。在一些实施例中，将用如本文所述的用于多靶向的Cpf1CRISPR系统或复合物的组分瞬时转染(例如通过瞬时转染一种或多种载体或用RNA转染)并且通过Cpf1 CRISPR系统或复合物的活性修饰的细胞用于建立一种包括含有修饰但缺乏任何其他外源性序列的细胞的细胞系。在一些实施例中，将用包含编码用于如本文所限定的多靶向中的Cpf1酶、系统或复合物的多核苷酸的一种或多种载体瞬时转染或非瞬时转染的细胞，或来源于此类细胞的细胞系用于评估一种或多种测试化合物。

术语“调节元件”如本文其他地方所限定。

在一些实施例中，Cpf1酶是V型或VI型CRISPR系统酶。在一些实施例中，Cpf1酶是Cpf1酶。在一些实施例中，Cpf1酶来源于土拉热弗朗西丝氏菌1、土拉热弗朗西丝氏菌新杀手亚种、易北普雷沃菌、毛螺菌科细菌MC20171、解朊丁酸弧菌、佩莱格里尼菌科细菌GW2011_GWA2_33_10、Parcubacteria细菌GW2011_GWC2_44_17、密斯氏菌属物种SCADC、氨基酸球菌属物种BV3L6、毛螺菌科细菌MA2020、暂定的白蚁甲烷枝原体、挑剔真细菌、牛莫拉氏菌237、牛莫拉氏菌AAX08_00205、牛莫拉氏菌AAX11_00205、丁酸弧菌属物种NC3005、硫微螺菌属物种XS5、稻田钩端螺旋体、毛螺菌科细菌ND2006、狗口腔卟啉单胞菌3、解糖胨普雷沃菌或猕猴卟啉单胞菌Cpf1，并且可以进一步包含如本文其他地方所限定的Cpf1的改变或突变，并且可以是嵌合Cpf1。当使用多个指导RNA时，它们优选通过同向重复序列分开。

在一个方面中，本发明提供了一种修饰宿主细胞例如真核细胞中的多种靶多核苷酸的方法。在一些实施例中，该方法包括使得Cpf1CRISPR复合物结合多种靶多核苷酸，例如来实施所述多种靶多核苷酸的切割，从而修饰多种靶多核苷酸，其中该Cpf1CRISPR复合物包含与多个指导序列复合的Cpf1酶，每个指导序列杂交至所述靶多核苷酸内的特异性靶序列，其中所述多个指导序列连接至同向重复序列。在一些实施例中，所述切割包括通过所述Cpf1酶切割每个靶序列的位置处的一条或两条链。在一些实施例中，所述切割使得多个靶基因的转录减少。在一些实施例中，该方法进一步包括使用外源性模板多核苷酸通过同源重组修复一种或多种所述切割的靶多核苷酸，其中所述修复产生包括一种或多种所述靶多核苷酸的一个或多个核苷酸的插入、缺失或取代的突变。在一些实施例中，所述突变使得由包含一个或多个靶序列的基因表达的蛋白质中发生一个或多个氨基酸的变化。在一些实施例中，该方法进一步包括将一个或多个载体递送至所述真核细胞，其中一个或多个载体驱动以下中的一个或多个的表达：Cpf1酶和与同向重复序列连接的多重指导RNA序列。在一些实施例中，所述载体被递送至受试者中的真核细胞。在一些实施例中，所述修饰发生在细胞培养中的所述真核细胞中。在一些实施例中，该方法进一步包括在所述修饰之前将所述真核细胞从受试者分离。在一些实施例中，该方法进一步包括将所述真核细胞和/或来源于其的细胞返回至所述受试者。

每个gRNA可以被设计成包含对相同或不同衔接蛋白具有特异性的多个结合识别位点(例如适配体)。每个gRNA可以被设计成结合位于转录起始位点(即TSS)的上游的启动子区-1000-+1核酸，优选-200核酸。此定位改善了影响基因激活(例如，转录激活因子)或基因阻遏(例如，转录阻遏物)的功能结构域。修饰gRNA可以是组合物中包含的靶向一个或多个靶座位的一个或多个修饰gRNA(例如至少1个gRNA、至少2个gRNA、至少5个gRNA、至少10个gRNA、至少20个gRNA、至少30个gRNA、至少50个gRNA)。所述多个gRNA序列可以是串联安排的并且优选通过同向重复序列分开。

(c)同向重复序列，

以及

II.Cpf1酶或编码它的第二多核苷酸序列，

其中当转录时，第一和第二指导序列分别引导第一和第二Cpf1 CRISPR复合物与第一和第二靶序列的序列特异性结合，

其中第一CRISPR复合物包含与可杂交至第一靶序列的第一指导序列复合的Cpf1酶，其中第二CRISPR复合物包含与可杂交至第二靶序列的第二指导序列复合的Cpf1酶，并且

其中第一指导序列引导DNA双链体中的靠近第一靶序列的一条链的切割并且第二指导序列引导靠近第二靶序列的另一条链的切割，诱导双链断裂，从而修饰生物体或非人类或非动物生物体。类似地，可以设想包含超过两个的指导RNA的组合物，例如每个RNA对一个靶标具有特异性，并且串联安排在如本文所述的组合物或CRISPR系统或复合物中。

根据本发明的指导RNA包含无效指导序列

在一个方面中，本发明提供了指导序列，这些指导序列以允许形成CRISPR复合物并成功结合靶标、同时不允许成功的核酸酶活性(即没有核酸酶活性/没有indel活性)的方式进行修饰。对于解释的问题，这种经修改的指导序列被称为“无效指导物”或“无效指导序列”。这些无效指导物或无效指导序列可以被认为是关于核酸酶活性的催化失活或构象失活的。核酸酶活性可以使用本领域常用的surveyor分析或深度测序来测量，优选surveyor分析。类似地，无效指导序列可能不足以参与促进催化活性或区分中靶和脱靶结合活性的能力的生产碱基配对。简而言之，surveyor测定涉及纯化和扩增基因的CRISPR靶位点并用扩增CRISPR靶位点的引物形成异源双链体。在重退火后，按照制造商推荐的方案用SURVEYOR核酸酶和SURVEYOR增强子S(Transgenomics)处理产物、在凝胶上分析、并基于相对条带强度进行量化。

因此，在相关方面，本发明提供了非天然存在的或工程化的组合物Cpf1CRISPR-Cas系统，该系统包含如本文所述的功能Cpf1和指导RNA(gRNA)，其中该gRNA包含无效指导序列，由此该gRNA能够与靶序列杂交，使得Cpf1 CRISPR-Cas系统引导细胞(没有可检测的indel活性，该活性由如通过SURVEYOR测定所检测的系统的非突变体Cpf1酶的核酸酶活性导致)中目的基因组座位。出于简化目的，包含gRNA的无效指导序列(由此该gRNA能够与靶序列杂交，使得Cpf1CRISPR-Cas系统引导细胞(没有可检测的indel活性，该活性由如通过SURVEYOR测定所检测的系统的非突变体Cpf1酶的核酸酶活性导致)中的靶基因组座位)在本文中称为“无效gRNA”。应该理解的是，本文其他地方所述的根据本发明的任一gRNA可以用作包含如下文所述的无效指导序列的无效gRNA/gRNA。如本文其他地方所述的方法、产物、组合物和用途中的任一个是同样适用于如下文进一步详述的无效gRNA/包含无效指导序列的gRNA。作为进一步指导，提供了以下的具体方面和实施例。

无效指导序列引导CRISPR复合物与靶序列的序列特异性结合的能力可以通过任何适合的测定来评估。例如，足以形成CRISPR复合物的CRISPR系统的组分(包括有待测试的无效指导序列)可以例如通过用编码CRISPR序列组分的载体进行转染来提供给具有相应靶序列的宿主细胞，随后例如通过本文所述的Surveyor测定评估靶序列内的优先切割。类似地，靶多核苷酸序列的切割可以在试管中通过以下方式进行评价：通过提供靶序列、CRISPR复合物的组分(包括有待测试的无效指导序列)和不同于测试指导序列的对照指导序列并且在测试无效指导序列反应与对照指导序列反应之间比较靶序列处的结合或切割速率。

其他测定是可能的，并且是本领域技术人员能够想到的。无效指导序列可以被选择为靶向任何靶序列。在一些实施例中，靶序列是细胞基因组中的序列。

如本文进一步所解释的，若干结构参数允许适当的框架到达这样的无效指导物。无效指导序列比对应指导序列短，这导致活性Cpf1特异性indel形成。无效指导物比引导相同Cpf1的对应指导物短5％、10％、20％、30％、40％、50％，导致活性Cpf1特异性indel。

如下文所解释的和本领域已知的，gRNA-Cpf1特异性的一个方面是同向重复序列，该序列与此类指导物适当地连接。具体地说，这意味着同向重复序列的设计取决于Cpf1的起点。因此，可用于经验证的无效指导序列的结构数据可用于设计Cpf1特异性等效物。例如，两种或更多种Cpf1效应蛋白的直向同源核酸酶结构域RuvC之间的结构相似性可用于转移设计等效的无效指导物。因此，本文中的无效指导物可以在长度和序列上适当地修饰以反映这种Cpf1特异性等效物，从而允许形成CRISPR复合物并成功结合靶标，同时不允许成功的核酸酶活性。

在本文的上下文中使用无效指导物以及现有技术同时为体外、离体和体内应用中的网络生物学和/或系统生物学提供了出人意料和意想不到的平台，允许多重基因靶向，并且特别是双向多重基因靶向。在使用无效指导物之前，解决多个靶标(例如用于激活、阻遏和/或沉默基因活性)一直是具有挑战性的，并且在某些情况下是不可能的。通过使用无效指导物，可以在例如相同细胞、相同动物或相同患者中解决多个靶标，从而解决多个活性。这种复用可以同时发生或交错一段所希望的时间段。

例如，无效指导物现在允许第一次使用gRNA作为基因靶向的手段，而没有核酸酶活性的后果，同时提供用于激活或阻遏的定向手段。包含无效指导物的指导RNA可以被以允许激活或阻遏基因活性的方式进行修饰，以进一步包括的元件，特别是允许基因效应物的功能放置(例如基因活性的激活因子或阻遏物)的如本文其他地方所述的蛋白质衔接体(例如适配体)。一个实例是掺入适配体，如本文和现有技术中所解释的。通过对包含无效指导物的gRNA进行工程化以掺入蛋白质相互作用适配体(Konermann等人,“Genome-scaletranscription activation by an engineered CRISPR-Cas9complex[通过工程化CRISPR-Cas9复合物进行基因组规模的转录激活],”doi:10.1038/nature14136，通过引用并入本文)，可以组装由多个不同的效应结构域组成的合成转录激活复合物。这可以在天然转录激活过程之后建模。例如，可以将选择性结合效应物的适配体(例如激活因子或阻遏物；作为与激活因子或阻遏物的融合蛋白的二聚化的MS2噬菌体外壳蛋白)或自身结合效应物(例如激活因子或阻遏物)的蛋白质附加到无效gRNA四环和/或茎环2。在MS2的情况下，融合蛋白MS2-VP64与四环和/或茎环2结合，并且进而介导转录上调(例如对于Neurog2)。其他转录激活因子是例如VP64、P65、HSF1和MyoD1。仅仅通过这个概念的实例，用PP7相互作用的茎环替代MS2茎环可用于募集阻遏元件。

因此，一个方面是本发明的gRNA(其包含无效指导物)，其中该gRNA进一步包含提供基因激活或阻遏的修饰，如本文所述。无效gRNA可以包含一种或多种适配体。适配体可以对基因效应物、基因激活因子或基因阻遏物具有特异性。可替代地，适配体可以对蛋白质具有特异性，该蛋白质进而对特异性基因效应物、基因激活因子或基因阻遏物具有特异性并募集/结合特异性基因效应物、基因激活因子或基因阻遏物。如果存在用于激活因子或阻遏物募集的多个位点，则优选这些位点对于激活因子或阻遏物具有特异性。如果存在用于激活因子或阻遏物结合的多个位点，则这些位点可以对相同激活因子或相同阻遏物具有特异性。这些位点也可以对不同激活因子或不同阻遏物具有特异性。基因效应物、基因激活因子、基因阻遏物可以以融合蛋白的形式存在。

在某些实施例中，组合物进一步包含第二gRNA，其中该第二gRNA是能够与第二靶序列杂交的活gRNA，使得第二Cpf1 CRISPR-Cas系统引导细胞(在第二基因组座位处具有可检测的indel活性，该活性由系统的Cpf1酶的核酸酶活性导致)中的目的第二基因组座位。

在某些实施例中，组合物进一步包含多种无效gRNA和/或多种活gRNA。

本发明的一个方面是利用gRNA支架的模块性和可定制性来建立一系列具有不同结合位点(特别是适配体)的gRNA支架，用于以正交方式募集不同类型的效应物。同样，对于更广泛概念的实例和说明，用PP7相互作用的茎环替代MS2茎环可用于结合/募集阻遏元件，实现多重双向转录控制。因此，总的来说，可以采用包含无效指导物的gRNA来提供多重转录控制和优选的双向转录控制。该转录控制是最优选的基因。例如，可以采用一种或多种包含一种或多种无效指导物的gRNA来靶向一种或多种靶基因的激活。同时，可以采用一种或多种包含一种或多种无效指导物的gRNA来靶向一种或多种靶基因的阻遏。这样的序列可以以多种不同的组合应用，例如首先阻遏靶基因，然后在适当的时间激活其他靶标，或者在选择的基因被激活的同时阻遏选择的基因，然后进一步激活和/或阻遏。结果，可以有利地一起解决一个或多个生物系统的多个组分。

在另一个方面中，结构分析也可用于研究无效指导物和活性Cpf1核酸酶(该核酸酶能够结合DNA，但不能切割DNA)之间的相互作用。以这种方式确定对Cpf1的核酸酶活性重要的氨基酸。此类氨基酸的修饰允许改善用于基因编辑的Cpf1酶。

在一个方面中，本发明提供了用于设计、评价或选择用于将Cpf1 CRISPR-Cas系统指导至靶基因座位的无效指导RNA靶序列(无效指导序列)的算法。具体地说，已经确定无效指导RNA特异性涉及不同靶序列长度和组成并且可以通过不同靶序列长度和组成来优化。在一个方面中，本发明提供了用于设计或评价无效指导RNA靶序列(其使无效指导RNA的脱靶结合或相互作用最小化)的算法。在本发明的一个实施例中，用于选择无效指导RNA靶序列(其用于将CRISPR系统引导至生物体中的基因座位)的算法包括：a)在基因座位中定位一个或多个CRISPR基序(PAM)，分析一个或多个CRISPR基序下游的全部序列或序列的一部分，并确定是否存在与靶序列匹配或与其相差一个、两个、三个或更多个错配的脱靶序列。在本发明的实施例中，与天然存在的Cpr1间隔区的长度相比，靶序列可以被截短，并且是从10至15或10至18、或10-23、或15-23个核苷酸，例如10、11、12、13、14、15、16、17、18、19、20、21、22或23个核苷酸。在某些实施例中，如果要求最接近的脱靶序列相差两个核苷酸或三个核苷酸或更多，则选择序列用于gRNA。在优选的实施例中，选择用于gRNA的序列与最接近CRISPR基序的靶序列匹配。

在一个方面中，本发明提供了用于设计或评价无效指导RNA靶序列(其使无效指导RNA的脱靶结合或相互作用最小化)的算法。在本发明的一个实施例中，用于选择无效指导RNA靶序列(其用于将CRISPR系统引导至生物体中的基因座位)的算法包括：a)在基因座位中定位一个或多个CRISPR基序，通过以下来分析每个CRISPR基序的下游的20nt序列：i)确定序列的GC含量；和ii)确定是否存在最接近生物体基因组中CRISPR基序的15个下游核苷酸的脱靶匹配，以及c)如果序列的GC含量为70％或更低，并且没有识别出脱靶匹配，则选择用于无效指导RNA的15个核苷酸序列。在一个实施例中，如果GC含量为60％或更低，则选择用于靶序列的序列。在某些实施例中，如果GC含量为55％或更低、50％或更低、45％或更低、40％或更低、35％或更低或30％或更低，则选择用于靶序列的序列。在一个实施例中，分析基因座位的两个或更多个序列，并选择具有最低GC含量、或下一个最低GC含量或下一个最低GC含量的序列。在一个实施例中，如果在生物体的基因组中未鉴定出脱靶匹配，则选择用于靶序列的序列。在一个实施例中，如果在基因组的调控序列中没有鉴定出脱靶匹配，则选择靶序列。

在一个方面中，本发明提供了选择无效指导RNA靶序列用于将功能化CRISPR系统引导至生物体中的基因座位的方法，该方法包括：a)在基因座位中定位一个或多个CRISPR基序；b)通过以下来分析每个CRISPR基序下游的20nt序列：i)确定序列的GC含量；和ii)确定生物体基因组中序列的前15nt是否存在脱靶匹配；c)如果序列的GC含量为70％或更低并且未鉴定出脱靶匹配，则选择用于指导RNA的序列。在一个实施例中，如果GC含量为50％或更低，则选择序列。在一个实施例中，如果GC含量为40％或更低，则选择序列。在一个实施例中，如果GC含量为30％或更低，则选择序列。在一个实施例中，分析两个或更多个序列并选择具有最低GC含量的序列。在一个实施例中，在生物体的调控序列中确定脱靶匹配。在一个实施例中，基因座位是调节区。一方面提供了包含根据前述方法选择的靶序列的无效指导RNA。

在一个方面中，本发明提供了用于将功能化CRISPR系统靶向生物体中的基因座位的无效指导RNA。在本发明的一个实施例中，无效指导RNA包含靶序列，其中该靶序列的CG含量为70％或更低，并且该靶序列的前15nt与生物体中另一个基因座位的调控序列中的CRISPR基序下游的脱靶序列不匹配。在某些实施例中，靶序列的GC含量为60％或更低、55％或更低、50％或更低、45％或更低、40％或更低、35％或更低或30％或更低。在某些实施例中，靶序列的GC含量为从70％至60％或从60％至50％或从50％至40％或从40％至30％。在一个实施例中，靶序列在座位的潜在的靶序列中具有最低的CG含量。

在本发明的一个实施例中，无效指导物的前15nt与靶序列匹配。在另一个实施例中，无效指导物的前14nt与靶序列匹配。在另一个实施例中，无效指导物的前13nt与靶序列匹配。在另一个实施例中，无效指导物的第一个12nt与靶序列匹配。在另一个实施例中，无效指导物的前11nt与靶序列匹配。在另一个实施例中，无效指导物的前10nt与靶序列匹配。在本发明的一个实施例中，无效指导物的前15nt与另一个基因座位的调节区中的CRISPR基序下游的脱靶序列不匹配。在其他实施例中，无效指导物的前14nt或前13nt、或指导物的前12nt、或无效指导物的前11nt、或无效指导物的前10nt与另一个基因座位的调节区中的CRISPR基序下游的脱靶序列不匹配。在其他实施例中，无效指导物的前15nt、或14nt、或13nt、或12nt、或11nt与基因组中CRISPR基序下游的脱靶序列不匹配。

在某些实施例中，无效指导RNA包括3'末端的另外的核苷酸(其与靶序列不匹配)或(作为整体采用扩展的无效指导物)基因组中的任何其他序列。因此，包括CRISPR基序的下游的前15nt、或14nt、或13nt、或12nt、或11nt的无效指导RNA可在3'末端扩展至12nt、13nt、14nt、15nt、16nt、17nt、18nt、19nt、20nt或更长。

本发明提供了用于将Cpf1 CRISPR-Cas系统(包括但不限于无效Cpf1(dCpf1)或功能化Cpf1系统(其可以包含功能化Cpf1或功能化指导物))引导至基因座位的方法。在一个方面中，本发明提供了选择无效指导RNA靶序列并将功能化CRISPR系统引导至生物体中基因座位的方法。在一个方面中，本发明提供了用于选择无效指导RNA靶序列并通过功能化Cpf1 CRISPR-Cas系统实现靶基因座位的基因调节的方法。在某些实施例中，该方法用于实现靶基因调节，同时使脱靶效应最小化。在一个方面中，本发明提供了用于选择两种或更多种无效指导RNA靶序列并通过功能化Cpf1 CRISPR-Cas系统实现两种或更多种靶基因座位的基因调节的方法。在某些实施例中，该方法用于实现两个或更多个靶基因座位的调节，同时使脱靶效应最小化。

在一个方面中，本发明提供了选择无效指导RNA靶序列的方法，该序列用于将功能化Cpf1引导至生物体中的基因座位，该方法包括：a)在基因座位中定位一个或多个CRISPR基序；b)通过以下来分析每个CRISPR基序下游的序列：i)选择与CRISPR基序相邻的10至15nt，ii)确定序列的GC含量；和c)如果序列的GC含量为40％或更多，则选择10至15nt序列作为用于指导RNA的靶序列。在一个实施例中，如果GC含量为50％或更高，则选择序列。在一个实施例中，如果GC含量为60％或更高，则选择序列。在一个实施例中，如果GC含量为70％或更高，则选择序列。在一个实施例中，分析两个或更多个序列并选择具有最高GC含量的序列。在一个实施例中，该方法进一步包括将核苷酸添加至所选择的序列(其与CRISPR基序下游的序列不匹配)的3'末端。一方面提供了包含根据前述方法选择的靶序列的无效指导RNA。

在一个方面中，本发明提供了用于将功能化CRISPR系统引导至生物体中基因座位的无效指导RNA，其中该无效指导RNA的靶序列由与基因座位的CRISPR基序相邻的10至15个核苷酸组成，其中该靶序列的CG含量为50％或更多。在某些实施例中，无效指导RNA进一步包含添加至靶序列(其与基因座位的CRISPR基序下游的序列不匹配)的3'末端的核苷酸。

在一个方面中，本发明提供了引导一个或多个、或两个或更多个基因座位的单个效应物。在某些实施例中，效应物与Cpf1缔合，并且一种或多种、或两种或更多种所选择的无效指导RNA用于将Cpf1缔合的效应物引导至一个或多个、或两个或更多个所选择的靶基因座位。在某些实施例中，效应物与一种或多种、或两种或更多种所选择的无效指导RNA缔合，每种所选择的无效指导RNA(当与Cpf1酶复合时)使其缔合的效应物定位于无效指导RNA靶。此类CRISPR系统的一个非限制性实例调节通过相同转录因子调节一个或多个、或两个或更多个基因座位的活性。

在一个方面中，本发明提供了两种或更多种引导一种或多种基因座位的效应物。在某些实施例中，采用两种或更多种无效指导RNA，该两种或更多种效应物中的每一种与所选择的无效指导RNA缔合，并且该两种或更多种效应物中的每一种定位于其无效指导RNA的所选择的靶标。此类CRISPR系统的一个非限制性实例调节通过不同转录因子调节一个或多个、或两个或更多个基因座位的活性。因此，在一个非限制性实施例中，将两个或更多个转录因子定位于单个基因的不同调控序列。在另一个非限制性实施例中，将两个或更多个转录因子定位于不同基因的不同调控序列。在某些实施例中，一种转录因子是激活因子。在某些实施例中，一种转录因子是抑制剂。在某些实施例中，一种转录因子是激活因子，并且另一种转录因子是抑制剂。在某些实施例中，对表达相同调节途径的不同组分的基因座位进行调节。在某些实施例中，对表达不同调节途径的组分的基因座位进行调节。

在一个方面中，本发明还提供了用于设计和选择无效指导RNA(其对由活性Cpf1CRISPR-Cas系统介导的靶DNA切割或靶结合和基因调节具有特异性)的方法和算法。在某些实施例中，Cpf1 CRISPR-Cas系统使用活性Cpf1(其在一个基因座位处切割靶DNA，同时结合并促进另一个基因座位的调节)提供正交基因控制。

在一个方面中，本发明提供了选择无效指导RNA靶序列的方法，该序列用于将功能化Cpf1引导至生物体中的基因座位而不进行切割，该方法包括a)在基因座位中定位一个或多个CRISPR基序；b)通过以下来分析每个CRISPR基序的下游的序列：i)选择与CRISPR基序相邻的10至15nt，ii)确定序列的GC含量，以及c)如果序列的GC含量为30％或更多、40％或更多，则选择10至15nt序列作为靶序列用于无效指导RNA中。在某些实施例中，靶序列的GC含量为35％或更高、40％或更高、45％或更高、50％或更高、55％或更高、60％或更高、65％或更高、或70％或更高。在某些实施例中，靶序列的GC含量为从30％至40％或从40％至50％或从50％至60％或从60％至70％。在本发明的一个实施例中，分析基因座位中的两个或更多个序列，并选择具有最高GC含量的序列。

在本发明的一个实施例中，其中评价GC含量的靶序列的部分是最接近PAM的15个靶核苷酸的10至15个连续核苷酸。在本发明的一个实施例中，其中考虑GC含量的指导物的部分是最接近PAM的15个核苷酸的10至11个核苷酸或11至12个核苷酸或12至13个核苷酸或13或14或15个连续核苷酸。

在一个方面中，本发明进一步提供了用于鉴定无效指导RNA(其促进CRISPR系统基因座位切割，同时避免功能激活或抑制)的算法。观察到16至20个核苷酸的无效指导RNA中GC含量的增加与DNA裂解增加和功能激活减少相一致。

本文还证实了，通过向指导RNA(其与CRISPR基序下游的靶序列不匹配)的3'末端添加核苷酸可以增加功能化Cpf1的效率。例如，对于长度为11至15nt的无效指导RNA，较短的指导物可能不太可能促进靶切割，但在促进CRISPR系统结合和功能控制方面也不太有效。在某些实施例中，将与靶序列不匹配的核苷酸添加至无效指导RNA的3'末端提高了激活效率，同时不增加不希望的靶切割。在一个方面中，本发明还提供了用于鉴定改善的无效指导RNA(其有效地促进了DNA结合和基因调节中的CRISPRP系统功能，同时不促进DNA切割)的方法和算法。因此，在某些实施例中，本发明提供了无效指导RNA，其包括CRISPR基序下游的前15nt、或14nt、或13nt、或12nt、或11nt，并且通过与靶标错配12nt、13nt、14nt、15nt、16nt、17nt、18nt、19nt、20nt或更长的核苷酸在3'末端处扩展长度。

在一个方面中，本发明提供了实现选择性正交基因控制的方法。从本文的披露可以理解，考虑到指导物长度和GC含量，根据本发明的无效指导物选择通过功能Cpf1CRISPR-Cas系统提供有效和选择性转录控制，例如以通过激活或抑制并最小化脱靶效应来调节基因座位的转录。因此，通过提供对个体靶座位的有效调节，本发明还提供了两个或更多个靶座位的有效正交调节。

在某些实施例中，正交基因控制是通过两个或更多个靶座位的激活或抑制。在某些实施例中，正交基因控制是通过一个或多个靶座位的激活或抑制和一个或多个靶座位的切割。

根据本发明的Cpf1 CRISPR-Cas系统的护送指导物

在一个方面中，本发明提供了护送的Cpf1 CRISPR-Cas系统或复合物，尤其是涉及护送的Cpf1 CRISPR-Cas系统指导物的这种系统。“护送”意指将Cpf1CRISPR-Cas系统或复合物或指导物递送至细胞内的所选择的时间或地点，使得Cpf1CRISPR-Cas系统或复合物或指导物的活性在空间或时间上受到控制。例如，Cpf1CRISPR-Cas系统或复合物或指导物的活性和目标可以由护送RNA适配体序列(该序列对适配体配体(例如细胞表面蛋白或其他局部细胞组分)具有结合亲和力)控制。可替代地，护送适配体可以例如响应于细胞上或细胞内的适配体效应物，例如瞬时效应物，例如在特定时间应用于细胞的外部能量源。

所护送的Cpf1 CRISPR-Cas系统或复合物具有gRNA，该gRNA具有设计用于改善gRNA结构、体系、稳定性，遗传表达或其任何组合的功能结构。这种结构可以包括适配体。

适配体是可以被设计或选择以与其他配体紧密结合的生物分子，例如使用称为通过指数富集的配体的系统进化的技术(SELEX；Tuerk C,Gold L:“Systematic evolutionof ligands by exponential enrichment:RNA ligands to bacteriophage T4 DNApolymerase.[通过指数富集的系统进化的配体：RNA配体到噬菌体T4DNA聚合酶]”Science[科学]1990,249:505-510)。核酸适配体可以例如选自随机序列寡核苷酸库，并且对多种生物医学相关靶标具有高结合亲和力和特异性，这表明适配体的广泛治疗效用(Keefe,Anthony D.,Supriya Pai,和Andrew Ellington.“Aptamers as therapeutics.[作为治疗剂的适配体]”Nature Reviews Drug Discovery[自然综述药物发现]9.7(2010):537-550)。这些特征也表明适配体作为药物递送媒介物的广泛用途(Levy-Nissenbaum,Etgar等人“Nanotechnology and aptamers:applications in drug delivery.[纳米技术和适配体：药物递送中的应用]”Trends in biotechnology[生物技术趋势]26.8(2008):442-449；以及Hicke BJ,Stephens AW.“Escort aptamers:a delivery service for diagnosisand therapy.[递送适配体：用于诊断和治疗的递送服务]”J Clin Invest[临床研究杂志]2000,106:923-928.)。也可以构建适配体作为分子开关(通过改变特性来响应阙)，例如结合荧光团以模拟绿色荧光蛋白活性的RNA适配体(Paige,Jeremy S.,Karen Y.Wu,和SamieR.Jaffrey.“RNA mimics of green fluorescent protein.[RNA模仿绿色荧光蛋白]”Science[科学]333.6042(2011):642-646)。还有人提出，适配体可用作靶向siRNA治疗递送系统的组分，例如靶向细胞表面蛋白(Zhou,Jiehua,和John J.Rossi.“Aptamer-targetedcell-specific RNA interference.[适配体靶向细胞特异性RNA干扰]”Silence[沉默]1.1(2010):4)。

因此，本文提供了例如通过设计用于改善gRNA递送(包括跨细胞膜递送至细胞内区室或进入细胞核)的一种或多种适配体修饰的gRNA。这种结构(除了一种或多种适配体之外或者不含这样的一种或多种适配体)可以包括使得指导物可递送、可诱导或响应于选择的效应物。因此，本发明包括响应正常或病理生理条件(包括但不限于pH、缺氧、O2浓度、温度、蛋白质浓度、酶浓度、脂质结构、光暴露，机械破坏(例如超声波)、磁场、电场或电磁辐射)的gRNA。

本发明的一个方面提供了包含护送指导RNA(egRNA)的非天然存在的或工程化的组合物，该指导RNA包含：RNA指导序列，其能够与细胞中目的基因组座位中的靶序列杂交；和护送RNA适配体序列，其中该护送适配体对细胞上或细胞中的适配体配体具有结合亲和力，或护送适配体响应于细胞上或细胞中的局部适配体效应物，其中该适配体配体或效应物在细胞上或细胞内的存在在空间或时间上受到限制。

护送适配体可以例如响应于与细胞中适配体配体或效应物的相互作用而改变构象。

护送适配体可以对适配体配体具有特异性结合亲和力。

适配体配体可以位于细胞的位置或区室中，例如位于细胞膜上或膜内。因此，护送适配体与适配体配体的结合可以通过结合作为细胞表面配体的适配体配体，将egRNA引导至细胞中目的位置，例如细胞内部。以这种方式，可以靶向细胞内的各种空间限制位置，例如细胞核或线粒体。

一旦引入预期的改变，例如通过编辑细胞基因组中的基因的预期拷贝，就不再需要在该细胞中继续CRISRP/Cpf1表达。实际上，持续的表达在非预定基因组位点等处的脱靶效应的某些情况下将是不希望的。因此，时间限制的表达将是有用的。诱导型表达提供了一种途径，但是此外，申请人已经工程化出依赖于CRISPR载体本身内的非编码指导靶序列的用途的自失活Cpf1 CRISPR-Cas系统。因此，在表达开始之后，CRISPR系统将使得其自身破坏，但是在完全破坏之前，其将有编辑靶基因的基因组拷贝的时间(在二倍体细胞中的正常点突变的情况下，其需要至多两次编辑)。简单地，自失活Cpf1 CRISPR-Cas系统包括靶向CRISPR酶本身的编码序列或靶向与存在于以下中的一种或多种中的独特序列互补的一种或多种非编码指导靶序列的附加RNA(即指导RNA)：

(a)在驱动非编码RNA元件表达的启动子内，(b)在驱动Cpf1基因表达的启动子内，(c)在Cpf1编码序列中ATG翻译起始密码子的100bp内，(d)在病毒递送载体的反向末端重复序列(iTR)内，例如在AAV基因组中。

egRNA可以包括RNA适配体连接序列，其将护送RNA序列可操作地连接到RNA指导序列。

在实施例中，egRNA可以包括一个或多个光不稳定键或非天然存在的残基。

在一个方面中，护送RNA适配体序列可以与靶miRNA(其可以存在或不存在于细胞内)互补，使得仅当存在靶miRNA时，护送RNA适配体序列与靶miRNA结合，这导致通过RNA诱导的沉默复合物(RISC)在细胞内切割egRNA。

在实施例中，护送RNA适配体序列可以例如长度为从10至200个核苷酸，并且egRNA可以包括多个以上的护送RNA适配体序列。

应该理解的是，本文其他地方所述的任何RNA指导序列均可用于本文所述的egRNA。在本发明的某些实施例中，指导RNA或成熟crRNA包含同向重复序列和指导序列或间隔区序列、基本上由或由同向重复序列和指导序列或间隔区序列组成。在某些实施例中，指导RNA或成熟crRNA包含连接至指导序列或间隔区序列的同向重复序列、基本上由或由该同向重复序列组成。在某些实施例中，指导RNA或成熟crRNA包含19个核苷酸的部分同向重复序列，接着是23-25个核苷酸的指导序列或间隔区序列。在某些实施例中，效应蛋白是FnCpf1效应蛋白并且需要至少16个核苷酸的指导序列以实现可检测的DNA切割并且需要最小17个核苷酸的指导序列以实现有效的体外DNA切割。在某些实施例中，同向重复序列位于指导序列或间隔区序列的上游(即5’)。在一个优选的实施例中，FnCpf1指导RNA的种子序列(即为识别和/或杂交于靶座位处的序列所必不可少的序列)大约在指导序列或间隔区序列的5'端上的前5个核苷酸之内。

egRNA可以与Cpf1(其可以包括至少一个突变，例如使得Cpf1具有如下核酸酶活性的突变：不具有该至少一个突变的Cpf1的不超过5％的核酸酶活性，例如与不具有该至少一个突变的Cpf1相比具有至少97％或100％的减少的核酸酶活性)一起包括在非天然存在的或工程化的Cpf1 CRISPR-Cas复合物组合物中。Cpf1还可以包括一个或多个核定位序列。具有调节例如减少的核酸酶活性的突变型Cpf1酶在本文其他地方描述。

工程化的Cpf1 CRISPR-Cas组合物可以在细胞中提供，例如真核细胞、哺乳动物细胞或人类细胞。

在实施例中，本文所述的组合物包含具有至少三个功能结构域的Cpf1 CRISPR-Cas复合物，其中至少一个与Cpf1缔合，并且其中至少两个与egRNA缔合。

本发明提供了可以通过其调整gRNA介导的基因编辑活性的组合物和方法。本发明提供了gRNA二级结构，其通过增加gRNA和/或增加递送到细胞中的RNA的量来提高切割效率。gRNA可以包括光不稳定或诱导型核苷酸。

为了增加gRNA(例如用病毒或非病毒技术提供的gRNA)的有效性，申请人在gRNA中添加了二级结构，增强了其稳定性并改善了基因编辑。另外，为了克服缺乏有效递送，申请人用细胞穿透RNA适配体修饰了gRNA；适配体与细胞表面受体结合并促进gRNA进入细胞。值得注意的是，可以设计细胞穿透适配体以靶向特异性细胞受体，以介导细胞特异性递送。申请人还创建了诱导型指导物。

可经由隐花色素-2和CIB1的激活和结合来实现诱导型系统的光响应性。蓝光刺激诱导隐花色素-2的激活构象变化，导致其结合配偶体CIB1的募集。这种结合是快速且可逆的，在脉冲刺激后<15秒内达到饱和并且在刺激结束后<15min返回基线。这些快速结合动理学导致系统在时间上仅受转录/翻译速度和转录物/蛋白质降解的限制，而不受诱导剂的摄取和清除的限制。隐花色素-2激活也是高度敏感的，允许使用低光强度刺激并减轻光毒性的风险。此外，在例如完整的哺乳动物大脑的上下文中，可变光强度可用于控制刺激区域的大小，允许比单独的载体递送可提供的更高的精确度。

本发明考虑了例如电磁辐射、声能或热能的能量源以诱导指导物。有利地，电磁辐射是可见光的组分。在优选的实施例中，光是波长为约450至约495nm的蓝光。在尤其优选的实施例中，波长为约488nm。在另一个优选实施例中，光刺激是经由脉冲。光功率可以在约0-9mW/cm2的范围内。在优选的实施例中，每15秒低至0.25秒的刺激范例应导致最大激活。

参与本发明的实践的细胞可以是原核细胞或真核细胞，有利地是动物细胞、植物细胞或酵母细胞，更有利地是哺乳动物细胞。

化学或能量敏感指导物可以在诱导时通过化学源的结合或通过来经历构象变化，从而允许其充当指导物并具有Cpf1 CRISPR-Cas系统或复合功能的能量。本发明可以涉及应用化学源或能量以具有指导功能和Cpf1 CRISPR-Cas系统或复合功能；并且任选地进一步确定基因组座位的表达被改变。

这种化学诱导系统有若干种不同的设计：1.由脱落酸(ABA)诱导的基于ABI-PYL的系统(参见例如http://stke.sciencemag.org/cgi/content/abstract/sigtrans；4/164/rs2)，2.由雷帕霉素(或基于雷帕霉素的相关化学品)诱导的基于FKBP-FRB的系统(参见例如http://www.nature.com/nmeth/journal/v2/n6/full/nmeth763.html)，3.由赤霉素(GA)诱导的基于GID1-GAI的系统(参见例如http://www.nature.com/nchembio/journal/v8/n5/full/nchembio.922.html)。

由本发明涵盖的另一个系统是基于亚细胞定位中的变化的化学品诱导型系统。申请人还开发了一种系统，其中多肽包括DNA结合结构域，该结合结构域包含至少五种或更多种转录激活因子样效应物(TALE)单体和至少一种或多种特异性排列以靶向连接至至少一个或多个效应结构域(其进一步与化学或能量敏感蛋白连接)的目的基因组座位的半单体。在化学结合或能量转移至化学品或能量敏感蛋白质之后，该蛋白质将导致整个多肽的亚细胞定位的变化(即整个多肽从细胞质转运到细胞的细胞核中)。整个多肽从一个亚细胞区室或细胞器(在其中它的活性由于缺乏用于效应结构域的底物而被隔离)到另一个亚细胞区室或细胞器(在其中存在底物)的这种转运允许整个多肽与其所希望的底物(即哺乳动物细胞核中的基因组DNA)接触，并且产生靶基因表达的激活或阻遏。

当效应结构域是核酸酶时，这种类型的系统也可用于诱导细胞中目的基因组座位的切割。

化学诱导型系统可以是基于雌激素受体(ER)的系统，其可被4-羟基他莫昔芬(4OHT)诱导(参见例如，http://www.pnas.org/content/104/3/1027.abstract)。雌激素受体(称为ERT2)的突变型配体结合结构域在结合4-羟基他莫昔芬后易位到细胞的细胞核中。在本发明的另外的实施例中，任何核受体、甲状腺激素受体、视黄酸受体、雌激素受体、雌激素相关受体、糖皮质激素受体、孕酮受体、雄激素受体的任何天然存在的或工程化的衍生物可用于类似于基于ER的诱导型系统的诱导型系统中。

另一种诱导系统基于使用基于瞬态受体电位(TRP)离子通道的系统设计，该系统可通过能量、热量或无线电波诱导(参见例如http://www.sciencemag.org/content/336/6081/604)。这些TRP家族蛋白对不同的刺激(包括光和热)作出响应。当这种蛋白质被光或热激活时，离子通道将打开并允许例如钙的离子进入质膜。这种离子的流入将结合与多肽(包括指导物和Cpf1 CRISPR-Cas复合物或系统的其他组分)连接的细胞内离子相互作用配偶体，并且该结合将诱导多肽的亚细胞定位的变化，导致整个多肽进入细胞的细胞核中。一旦进入细胞核，指导蛋白和Cpf1 CRISPR-Cas复合物的其他组分将被激活并且调节细胞中的靶基因表达。

这种类型的系统也可用于诱导细胞中目的基因组座位的切割；并且在这方面，注意Cpf1酶是核酸酶。光可以用激光或其他形式的能量源产生。热量可以通过能量源产生的温度升高产生，或产生自吸收能量(该能量来自以无线电波形式递送的能量源)后释放热量的纳米粒子产生。

虽然光激活可能是有利的实施例，但有时它可能是不利的，尤其是对于其中光可能不会穿透皮肤或其他器官的体内应用。在这种情况下，可以考虑其他能量激活方法，特别是具有类似效果的电场能量和/或超声。

优选地，在体内条件下使用一个或多个约1伏/cm至约10千伏/cm的电脉冲，基本上如本领域所述的给予电场能量。作为脉冲的替代或除脉冲之外，可以以连续的方式递送电场。电脉冲可以应用持续1μs与500毫秒之间，优选地在1μs至100毫秒之间。可以连续地或以脉冲方式应用电场持续5分钟。

如本文使用的，“电场能量”是细胞暴露于其的电能。优选地，在体内条件下，电场的强度为约1伏/cm至约10千伏/cm或更高(参见WO 97/49450)。

如本文使用的，术语“电场”包括一个或多个脉冲，该一个或多个脉冲处于可变电容和电压并且包括指数和/或方波和/或调制波和/或调制方波形式。应该参考电场和电力，以包括参考细胞的环境中电势差的存在。如本领域中已知的，这种环境可以通过静电、交流电(AC)、直流电(DC)等来建立。电场可以是均匀的、不均匀的或其他方式，并且可以以时间依赖的方式改变强度和/或方向。

电场的单次或多次应用以及超声的单次或多次应用也是可能的，可以任何顺序和任何组合。超声和/或电场可以作为单个或多个连续应用递送，或作为脉冲(脉动递送)递送。

电穿孔已经用于体外和体内程序以将外源物质引入活细胞中。在体外应用中，首先将活细胞的样品与目的药剂混合并置于例如平行板的电极之间。然后，电极向细胞/植入物混合物给予电场。进行体外电穿孔的系统的实例包括Electro Cell ManipulatorECM600产品和Electro Square Porator T820，两者均由Genetronics股份有限公司(Genetronics,Inc)的BTX部门制造(参见美国专利号5,869,326)。

已知的电穿孔技术(体外和体内)通过向位于治疗区域周围的电极给予短暂的高压脉冲而起作用。在电极之间产生的电场使细胞膜暂时变成多孔的，因此目的药剂的分子进入细胞。在已知的电穿孔应用中，该电场包括大约1000V/cm的单个方波脉冲，持续时间约为100.mu.s。例如，可以在Electro Square Porator T820的已知应用中产生这种脉冲。

优选地，在体外条件下，电场的强度为从约1V/cm至约10kV/cm。因此，电场可以具有1V/cm、2V/cm、3V/cm、4V/cm、5V/cm、6V/cm、7V/cm、8V/cm、9V/cm、10V/cm、20V/cm、50V/cm、100V/cm、200V/cm、300V/cm、400V/cm、500V/cm、600V/cm、700V/cm、800V/cm、900V/cm、1kV/cm、2kV/cm、5kV/cm、10kV/cm、20kV/cm、50kV/cm或更高的强度。在体外条件下更优选约0.5kV/cm至约4.0kV/cm。优选地，在体内条件下，电场的强度为从约1V/cm至约10kV/cm。然而，在递送到靶位点的脉冲的数目增加的情况下，可以降低电场强度。因此，设想在较低场强度下电场的脉动递送。

优选地，电场的应用是以多脉冲(例如相同强度和电容的双脉冲或者具有不同强度和/或电容的连续脉冲)的形式。如本文使用的，术语“脉冲”包括可变电容和电压的一个或多个电脉冲，并且包括指数和/或方波和/或调制波/方波形式。

优选地，电脉冲作为选自指数波形、方波形、调制波形和调制方波形的波形来递送。

优选的实施例采用低电压下的直流电。因此，申请人披露了使用电场(该电场以在1V/cm与20V/cm之间的场强度应用于细胞、组织或组织块)持续100毫秒或更长，优选15分钟或更长。

超声有利地以约0.05W/cm2至约100W/cm2的功率水平来给予。可以使用诊断或治疗超声或其组合。

如本文使用的，术语“超声”是指由机械振动组成的能量形式，其频率如此之高，以至于高于人类听觉的范围。超声频谱的下限频率通常可以取为约20kHz。超声的大多数诊断应用采用在1和15MHz’范围内的频率(来自Ultrasonics in Clinical Diagnosis[临床诊断中的超声学],P.N.T.Wells编辑,第2版Publ.Churchill Livingstone[丘吉尔利文斯敦][Edinburgh,London&NY[爱丁堡，伦敦和纽约],1977])。

超声已经用于诊断应用和治疗应用两者中。当用作诊断工具(“诊断超声”)时，超声典型地以高达约100mW/cm2(FDA推荐)的能量密度范围内使用，尽管已经使用过高达750mW/cm2的能量密度。在物理疗法中，超声典型地用作能量源，其范围高达约3至4W/cm2(WHO推荐)。在其他治疗应用中，可以采用更高强度的超声，例如，在100W/cm至高达1kW/cm2(或甚至更高)的HIFU持续短时间段。本说明书中使用的术语“超声”旨在涵盖诊断、治疗和聚焦超声。

聚焦超声(FUS)允许在没有侵入性探针的情况下递送热能(参见Morocz等人1998Journal of Magnetic Resonance Imaging[磁共振成像杂志]第8卷,第1期,第136-142页。聚焦超声的另一种形式是高强度聚焦超声(HIFU)，其由Moussatov等人在Ultrasonics[超声学](1998)第36卷,第8期,第893-900页，以及TranHuuHue等人在Acustica[前庭区](1997)第83卷,第6期,第1103-1106页中综述。

优选地，采用诊断超声和治疗超声的组合。然而，该组合不是限制性的，并且技术人员将理解可以使用任何种类的超声组合。另外地，可以改变能量密度、超声频率和暴露时间段。

优选地，暴露于超声能量源的功率密度为从约0.05至约100Wcm-2。甚至更优选地，暴露于超声能量源的功率密度为从约1至约15Wcm-2。

优选地，暴露于超声能量源的频率为从约0.015至约10.0MHz。更优选地，暴露于超声能量源的频率为从约0.02至约5.0MHz或约6.0MHz。最优选地，以3MHz的频率应用超声。

优选地，暴露持续从约10毫秒至约60分钟的时间段。优选地，暴露持续从约1秒至约5分钟的时间段。更优选地，应用超声持续约2分钟。然而，取决于待破坏的特定靶细胞，暴露可持续更长的持续时间，例如持续15分钟。

有利地，靶组织暴露于超声能量源，其中声功率密度为约0.05Wcm-2至约10Wcm-2，并且频率范围为约0.015至约10MHz(参见WO 98/52609)。然而，替代方案也是可能的，例如，在声功率密度高于100Wcm-2的情况下暴露于超声能量源，但是对于缩短的时间段，例如，在毫秒范围内或更短的时间段内为1000Wcm-2。

优选地，超声的应用是以多脉冲的形式；因此，可以以任何组合采用连续波和脉冲波(超声的脉动递送)。例如，可以应用连续波超声、然后是脉冲波超声，或者反之亦然。这可以以任何顺序和组合重复任何次数。脉冲波超声可以应用于连续波超声的背景，并且可以在任何数量的组中使用任何数量的脉冲。

优选地，超声可以包括脉冲波超声。在一个高度优选的实施例中，超声波以0.7Wcm-2或1.25Wcm-2的功率密度作为连续波应用。如果采用脉冲波超声，则可以采用更高的功率密度。

使用超声波是有利的，因为与光一样，它可以精确地聚焦在靶标上。此外，超声波是有利的，因为与光不同，它可以更深地聚焦到组织中。因此，它更适合于全组织穿透(例如但不限于肝叶)或整个器官(例如但不限于整个肝脏或整个肌肉，例如心脏)治疗。另一个重要的优点是超声是一种非侵入性刺激物，其可用于各种诊断和治疗应用。举例来说，超声在医学成像技术中是熟知的，并且另外在矫形治疗中是熟知的。此外，适用于向受试脊椎动物应用超声波的仪器广泛可获得，并且它们的用途在本领域中是熟知的。

本发明的快速转录响应和内源靶向构成了转录动力学研究的理想系统。例如，本发明可用于研究靶基因诱导表达后变体产生的动力学。在转录循环的另一端，mRNA降解研究通常是响应强细胞外刺激而进行的，从而导致过多基因中的表达水平变化。本发明可以用于可逆地诱导内源靶标的转录，之后可以停止刺激并且可以跟踪独特靶标的降解动理学。

本发明的时间精确度可以提供与实验干预一致的时间遗传调节的能力。例如，怀疑参与长时程增强(LTP)的靶标可以在器官型或解离的神经元培养物中调节，但仅在刺激期间诱导LTP，以避免干扰细胞的正常发育。类似地，在表现出疾病表型的细胞模型中，可能仅在治疗期间调节怀疑参与特定疗法的有效性的靶标。相反地，遗传靶标可能仅在病理刺激期间被调节。任何数量的实验(其中外部实验刺激的遗传线索的时间是相关的)可能潜在地受益于本发明的效用。

体内环境为本发明为控制基因表达提供了同样丰富的机会。光致可变性提供了空间精确度的潜力。利用光极技术的发展，可以将刺激光纤导线放置在精确的大脑区域中。然后可以通过光强度调节刺激区域尺寸。这可以与Cpf1 CRISPR-Cas系统或本发明的复合物的递送一起进行，或者在转基因Cpf1动物的情况下，可以递送本发明的指导RNA，并且光极技术可以允许调节精确大脑区域的基因表达。透明的表达Cpf1的生物体可以具有给予于其的本发明的指导RNA，并且然后可以存在极其精确的激光诱导的局部基因表达变化。

用于培养宿主细胞的培养基包括常用于组织培养的培养基，例如M199-earle基(earle base)、Eagle MEM(E-MEM)、Dulbecco MEM(DMEM)、SC-UCM102、UP-SFM(GIBCO BRL)、EX-CELL302(Nichirei)、EX-CELL293-S(Nichirei)、TFBM-01(Nichirei)、ASF104等。用于特异性细胞类型的适合的培养基可以在美国典型培养物保藏中心(ATCC)或欧洲细胞培养物保藏中心(ECACC)中找到。培养基可以补充有氨基酸(例如L-谷氨酰胺)、盐、抗真菌剂或抗细菌剂(例如)、青霉素-链霉素、动物血清等。细胞培养基可任选地不含血清。

本发明还可以提供有价值的体内时间精确度。本发明可用于改变特定发育阶段期间的基因表达。本发明可用于将遗传线索计时到特定实验窗口。例如，涉及学习的基因可能仅在完整啮齿动物或灵长类大脑的精确区域中的学习刺激期间过表达或阻遏。此外，本发明可用于仅在疾病发展的特定阶段诱导基因表达变化。例如，只有在肿瘤达到特定大小或转移阶段时，癌基因才可能过表达。相反地，怀疑在阿尔茨海默病的发展中的蛋白质可能仅在动物生命中和特定大脑区域内的确定时间点被敲除。尽管这些实例没有详尽地列出本发明的潜在应用，但是它们突出了在其中本发明可以是强大技术的一些领域。

根据本发明的酶可以与受保护的指导RNA组合使用

在一个方面中，本发明的目的是通过热力学调节指导RNA与靶DNA的结合特异性，进一步增强给予单个指导RNA的Cpf1的特异性。这是引入错配、延伸或截短指导序列以增加/减少互补碱基的数目与基因组靶标与其潜在脱靶座位之间共有的错配碱基的数目的一般方法，以便为靶向基因组座位超过基因组脱靶提供热力学优势。

在一个方面中，本发明提供了通过二级结构修饰的指导序列，以增加Cpf1CRISPR-Cas系统的特异性，并且由此该二级结构可以保护免于核酸外切酶活性并允许向指导序列添加3'。

在一个方面中，本发明提供了将“保护子RNA”与指导序列杂交，其中该“保护子RNA”是与指导RNA(gRNA)的5'末端互补的RNA链，以从而产生部分双链gRNA。在本发明的一个实施例中，用完全互补的保护子序列来保护错配碱基降低了靶DNA与3'末端处错配碱基对结合的可能性。在本发明的实施例中，还可以存在包含延长长度的其他序列。

与基因组靶标匹配的指导RNA(gRNA)延伸提供了gRNA保护并增强了特异性。设想具有个体基因组靶标的间隔种子(spacer seed)末端远端的匹配序列的gRNA的延伸以提供增强的特异性。已经在细胞中观察到增强特异性而没有截短的匹配gRNA延伸。伴随这些稳定长度延伸的gRNA结构的预测已显示稳定形式由保护状态产生，其中由于间隔延伸和间隔种子(spacer seed)中的互补序列，延伸与gRNA种子形成封闭环。这些结果证实受保护的指导物概念还包括与20mer间隔区-结合区域远端的基因组靶序列匹配的序列。热力学预测可用于预测导致受保护的gRNA状态的完全匹配或部分匹配的指导物延伸。这将受保护的gRNA的概念扩展到X和Z之间的相互作用，其中X通常具有17-20nt的长度并且Z具有1-30nt的长度。热力学预测可用于确定Z的最佳延伸状态，从而可能在Z中引入少量错配以促进X和Z之间的受保护构象的形成。在整个本申请中，术语“X”和种子长度(SL)可与术语暴露长度(EpL)(其表示可用于靶DNA结合的核苷酸的数目)互换使用；术语“Y”和保护子长度(PL)可互换使用以表示保护子的长度；并且术语“Z”、“E”、“E’”和EL可互换使用以对应于术语扩展长度(ExL)(其表示靶序列扩展的核苷酸的数目)。

对应于扩展长度(ExL)的扩展序列可以任选地直接附接至受保护的指导序列的3'末端处的指导序列。延伸序列的长度可以是2至12个核苷酸。优选地，ExL可以表示为长度为0、2、4、6、8、10或12个核苷酸。在优选的实施例中，ExL的长度表示为0或4个核苷酸。在更优选的实施例中，ExL的长度为4个核苷酸。延伸序列可以与靶序列互补或不互补。

延伸序列可以进一步任选地直接附接至受保护的指导序列的5'末端处的指导序列以及附接至保护序列的3'末端。结果，延伸序列用作受保护的序列和保护序列之间的连接序列。不希望受理论束缚，这种连接可以将保护序列定位在受保护的序列附近，用于改善保护序列与受保护的序列的结合。

向gRNA的远端添加gRNA错配可以证实增强的特异性。在Y中引入未受保护的远端错配或具有远端错配(Z)的gRNA的延伸可以证实增强的特异性。提到的这个概念与受保护的gRNA中使用的X、Y和Z组分有关。未受保护的错配概念可以进一步推广到针对受保护的指导RNA描述的X、Y和Z的概念。

不希望受理论束缚，用完全互补的保护子序列来保护错配碱基可以降低靶DNA与3'末端处错配碱基对结合的可能性。当双链DNA靶标被解开时，Cfp1最终试图询问PAM-远端(靶标的3’末端)用于指导序列互补性。然而，由于受保护的指导RNA(pgRNA)的3'末端是双链的，可能有两种可能的结果：1)指导RNA保护子RNA与指导RNA-靶DNA链将发生交换并且指导物将完全结合靶标，或2)指导RNA将不能完全结合靶标。因为Cpf1靶切割是需要指导RNA的多步动理学反应：靶DNA结合以激活Cas9-催化的DSB，如果指导RNA没有正确结合，则不发生Cpf1切割。

在一个方面中，本发明提供了增强的Cpf1特异性，其中受保护的指导RNA(pgRNA)的双链3'末端允许两种可能的结果：(1)指导RNA-保护子RNA与指导RNA-靶DNA链将发生交换并且指导物将完全结合靶标，或(2)指导RNA将不能完全结合靶标，并且因为Cpf1靶切割是需要指导RNA的多步动理学反应：靶DNA结合以激活Cpf1-催化的DSB，其中如果指导RNA没有正确结合，则不发生Cpf1切割。根据具体实施例，与天然存在的CRISPR-Cas系统相比，受保护的指导RNA提高了靶结合的特异性。根据具体实施例，与天然存在的CRISPR-Cas相比，受保护的经修饰的指导RNA提高了稳定性。根据具体实施例，保护子序列具有3至120个核苷酸之间的长度，并且包含与另一个指导序列或保护子序列互补的3个或更多个连续核苷酸。根据具体实施例，保护子序列形成发夹。根据具体实施例，指导RNA进一步包含受保护的序列和暴露的序列。根据具体实施例，暴露的序列是1至19个核苷酸。更具体地说，暴露的序列与靶序列互补至少75％、至少90％或约100％。根据具体实施例，指导序列与保护子链互补至少90％或约100％。根据具体实施例，指导序列与靶序列互补至少75％、至少90％或约100％。根据具体实施例，指导RNA进一步包含延伸序列。更具体地说，延伸序列与受保护的指导序列的3'末端可操作地连接，并且任选地与受保护的指导序列的3'末端直接连接。根据具体实施例，延伸序列是1-12个核苷酸。根据具体实施例，延伸序列与受保护的指导序列的3'末端和保护子链的5'末端的指导序列可操作地连接，并且任选地与受保护的指导序列的3'末端和保护子链的3'末端直接连接，其中延伸序列是受保护的序列和保护子链之间的连接序列。根据具体实施例，延伸序列100％不与保护子链互补，任选地至少95％、至少90％、至少80％、至少70％、至少60％或至少50％不与保护子链互补。根据具体实施例，指导序列进一步包含附加于指导序列末端的错配，其中错配热力学地优化特异性。

在一个方面中，本发明提供了工程化的非天然存在的CRISPR-Cas系统，其包含Cpf1蛋白和靶向编码细胞中基因产物的DNA分子的受保护的指导RNA，由此该受保护的指导RNA靶向编码基因产物的DNA分子并且该Cpf1蛋白切割编码该基因产物的DNA分子，由此改变该基因产物的表达；并且其中Cpf1蛋白和受保护的指导RNA并不同时天然存在。本发明包括含有融合3’至同向重复序列的指导序列的受保护的指导RNA。在一些实施例中，Cpf1酶是氨基酸球菌属物种BV3L6、毛螺菌科细菌或新杀手弗朗西丝氏菌Cpf1，并且可以包括来源于这些生物体的突变型Cpf1。酶可以是另外的Cpf1同源物或直向同源物。在一些实施例中，编码Cfp1酶的核苷酸序列经密码子优化以在真核细胞中表达。在一些实施例中，Cpf1酶指导靶序列位置处的一条或两条链的切割。在一些实施例中，第一调节元件是聚合酶III启动子。在一些实施例中，第二调节元件是聚合酶II启动子。

关于Cpf1酶的突变，当酶不是FnCpf1时，突变可以是如本文其他地方所述的；还设想了对任何替代氨基酸的保守取代。在一个方面中，本发明提供关于本文讨论的任何或每个或所有实施例，其中CRISPR酶包含至少一个或多个、或至少两个或更多个突变，其中该至少一个或多个突变或该至少两个或更多个突变选自本文其他地方所述的那些。

在另外的方面中，本发明涉及用于鉴定或设计潜在化合物以拟合CRISPR-Cpf1系统或其功能部分内或与其结合(或反之亦然)的计算机辅助方法(用于鉴定或设计潜在CRISPR-Cpf1系统或其功能部分用于结合所希望的化合物的计算机辅助方法)或用于鉴定或设计潜在CRISPR-Cpf1系统(例如，关于预测CRISPR-Cpf1系统的区域能够被操纵-例如，基于晶体结构数据或基于Cpf1直向同源物的数据，或者关于其中官能团(例如激活因子或阻遏物)可以附接到CRISPR-Cpf1系统、或关于Cpf1截短或设计切口酶)的计算机辅助方法，所述方法包括：

使用计算机系统，例如包括处理器、数据存储系统、输入设备和输出设备的编程计算机，步骤如下：

(a)通过所述输入设备数据来输入到编程计算机中，该输入设备数据包括来自CRISPR-Cpf1晶体结构或属于其的原子的子集的三维坐标，例如，在CRISPR-Cpf1系统结合结构域中，或可替代地或另外地在基于Cpf1直向同源物或关于Cpf1s或关于切口酶或关于官能团的方差而变化的结构域中，任选地具有来自一个或多个CRISPR-Cpf1系统复合物的结构信息，从而产生数据集；

(b)使用所述处理器比较所述数据集与存储在所述计算机数据存储系统中的结构(例如，结合或推定结合或希望结合CRISPR-Cpf1系统的化合物的结构、或关于Cpf1直向同源物(例如，作为Cpf1s或关于在Cpf1直向同源物之间变化的结构域或区域)或关于CRISPR-Cpf1晶体结构或关于切口酶或关于官能团)的计算机数据库；

(c)使用计算机方法，从所述数据库，选择一种或多种结构—例如可与所希望的结构结合的CRISPR-Cpf1结构，可与某些CRISPR-Cpf1结构结合的所希望的结构，CRISPR-Cpf1系统(该系统可以例如基于来自CRISPR-Cpf1晶体结构的其他部分和/或来自Cpf1直向同源物的数据进行操纵)、截短的Cpf1、新颖切口酶或特定官能团的部分，或用于附接官能团或官能团-CRISPR-Cpf1系统的位置；

(d)使用计算机方法构建一个或多个所选择的结构的模型；以及

(e)向所述输出设备输出一个或多个所选择的结构；

和任选地将一个或多个所选择的结构中的一个或多个进行合成；

并且进一步任选地作为CRISPR-Cpf1系统或在其中来测试一个或多个合成的所选择的结构；

或，所述方法包括：提供CRISPR-Cpf1晶体结构的至少两个原子(例如，本文中CRISPR-Cpf1晶体结构的晶体结构表的至少两个原子)的坐标或CRISPR-Cpf1晶体结构的至少一个亚结构域的坐标(“选择的坐标”)，提供包含结合分子的候选物的结构或CRISPR-Cpf1系统(该系统可以例如基于来自CRISPR-Cpf1晶体结构的其他部分和/或来自Cpf1直向同源物的数据进行操纵)的部分的结构，或官能团的结构，并使候选物的结构拟合于所选择的坐标，从而获得包含可与所希望的结构结合的CRISPR-Cpf1结构，可与某些CRISPR-Cpf1结构结合的所希望的结构，可被操纵的CRISPR-Cpf1系统、截短的Cpf1s、新颖切口酶或特定官能团的部分，或用于附接官能团或官能团-CRISPR-Cpf1系统的位置的产物数据，并且将其输出；和任选地从所述产物数据合成一个或多个化合物，并且进一步任选地包括作为CRISPR-Cpf1系统或在其中来测试所述合成的化合物。

测试可以包括分析由一个或多个所述合成的所选择的结构产生的CRISPR-Cpf1系统，例如关于结合或执行所希望的功能。

上述方法中的输出可以包括数据传输，例如经由远程通信、电话、视频会议、大众通讯(例如演示(例如计算机演示(例如POWERPOINT))、因特网、电子邮件，文献交流(例如计算机程序(例如WORD)文档))等来传输信息。因此，本发明还包括含有以下的计算机可读介质：根据本文引用的晶体结构的原子坐标数据，所述数据定义CRISPR-Cpf1或其至少一个亚结构域的三维结构，或CRISPR-Cpf1的结构因子数据，所述结构因子数据可来自本文引用的晶体结构的原子坐标数据。计算机可读介质还可以包含前述方法的任何数据。本发明进一步包括用于产生或执行合理设计的计算机系统的方法，如前述方法中包含：根据本文引用的晶体结构的原子坐标数据，所述数据定义CRISPR-Cpf1或其至少一个亚结构域的三维结构，或CRISPR-Cpf1的结构因子数据，所述结构因子数据可来自本文引用的晶体结构的原子坐标数据。本发明进一步包括开展业务(doing business)的方法，该方法包括向用户提供计算机系统或介质或CRISPR-Cpf1或其至少一个亚结构域的三维结构，或CRISPR-Cpf1的结构因子数据，所述结构因子数据可来自本文引用的晶体结构的原子坐标数据，或本文的计算机介质或本文数据传输。

“结合位点”或“活性位点”包含可以与参与结合的化合物(例如核酸分子)结合的结合腔或区域中的位点(例如原子、氨基酸残基的官能团或多个此类原子和/或基团)或基本上由其组成或由其组成。

“拟合”意指通过自动或半自动手段确定候选分子的一个或多个原子与本发明结构的至少一个原子之间的相互作用，并计算这种相互作用稳定的程度。相互作用包括吸引和排斥，由充电、空间考虑等引起。进一步描述了各种用于拟合的基于计算机的方法。

“均方根(或rms)偏差”意指偏离平均值的平方的算术平均值的平方根。

“计算机系统”意指用于分析原子坐标数据的硬件装置、软件装置和数据存储手段。本发明的基于计算机的系统的最小硬件手段典型地包括中央处理单元(CPU)、输入手段、输出手段和数据存储手段。理想地，提供显示器或监视器以可视化结构数据。数据存储手段可以是RAM或用于访问本发明的计算机可读介质的手段。此类系统的实例是运行Unix、Windows或Apple操作系统的计算机和平板设备。

“计算机可读介质”意指可通过计算机直接或间接读取和访问的任何一个或多个介质，例如使得介质适用于上述计算机系统。此类介质包括但不限于：磁存储介质，例如软盘、硬盘存储介质和磁带；光存储介质，例如光盘或CD-ROM；电子存储介质，例如RAM和ROM；拇指驱动设备；云存储设备和这些类别的混合，例如磁/光存储介质。

本发明包括本文所述的受保护的指导物在本文所述的优化的功能CRISPR-Cas酶系统中的用途。

通过指导物工程化的RISC的形成

在一些实施例中，指导物可以是如本文所述的受保护的指导物(例如pgRNA)或护送指导物(例如esgRNA)。在一些实施例中，这两者都使用RISC。RISC是RNAi的关键组分。RISC(RNA诱导的沉默复合物)是多蛋白(特别是核糖核蛋白)复合物，其掺入一条双链RNA(dsRNA)片段，例如小干扰RNA(siRNA)或微小RNA(miRNA)，它们充当RISC模板以识别互补信使RNA(mRNA)转录物。因此，mRNA被RISC的组分中的一种切割。

这样，在一些实施例中，RISC的形成是有利的。根据本发明的各个方面的指导RNA(包括但不限于受保护的和/或护送的指导RNA)可以适于包括促进RISC形成的RNA核苷酸，例如与siRNA或miRNA(该siRNA或miRNA已被提供或例如可能已在细胞中表达)组合。例如，这作为清除或降解指导物的自失活系统可能是有用的。

因此，指导RNA可以包含与靶miRNA或siRNA互补的序列，该序列可以存在或不存在于细胞内。这样，只有当miRNA或siRNA存在(例如通过表达(通过细胞或通过人为干预))时，RNA序列与miRNA或siRNA结合，这然后导致RNA和RNA-诱导的沉默复合物(RISC)在细胞内的切割。因此，在一些实施例中，指导RNA包含与靶miRNA或siRNA互补的RNA序列，并且指导RNA序列与靶miRNA或siRNA的结合导致通过RNA诱导的沉默复合物(RISC)在细胞内切割指导RNA。

这将在下面进一步解释，具体参考受保护的指导物和护送指导物。

通过使用受保护的指导物的RISC的形成

例如，可以在以下方面描述受保护的指导物：一种工程化的非天然存在的组合物，其包含成簇规律间隔短回文重复序列(CRISPR)-CRISPR相关的(Cas)(CRISPR-Cas)系统，该系统具有受保护的指导RNA(pgRNA)多核苷酸序列，该多核苷酸序列包含(a)保护子序列，(b)同向重复和(c)能够与真核细胞中的靶序列杂交的指导序列，其中(a)、(b)和(c)以5'至3'方向排列，其中该保护子序列包含两个或多个与靶序列不互补的核苷酸，其中当转录时，该指导序列引导CRISPR复合物与靶序列的序列特异性结合，其中该CRISPR复合物包含与(1)与靶序列杂交的指导序列复合的Cpf1蛋白，并且其中在多核苷酸序列中和/或一个或多个指导RNA被修饰。

在一个方面中，该受保护的指导系统用于对gRNA的3'延伸的二级结构保护。例如，申请人扩展gRNA使得当miRNA结合位点被RISC复合机器加工和切割时，引入该miRNA结合位点以使gRNA仅激活。如果没有二级结构保护，这是不可能的，因为外切核酸酶处理将从5'末端开始并向gRNA切回。通过向添加的miRNA位点添加小的二级结构环5'，可以保护miRNA免于外切核酸酶咀回(chew back)。

通过使用护送指导物的RISC形成

在另一实例中，可以描述护送指导物。具体地说，设想了miRNA诱导型esgRNA。这里护送RNA适配体序列与靶miRNA互补，因此当靶miRNA存在于掺入RNA诱导的沉默复合物(RISC)的细胞中时，护送RNA适配体序列与靶miRNA结合，这导致通过RNA诱导的沉默复合物(RISC)在细胞内切割esgRNA。

在替代性实施例中，可以在esgRNA的3'末端提供多种一级和二级结构，设计为使得RISC复合物能够进入miRNA结合位点。esgRNA可具有连接至保护子序列3’的第一和第二接头序列。在替代性实施例中，接头1和2可以例如各自独立地为0、1、2、3或4个核苷酸长，并且具有0、1或2个核苷酸长度的保护子序列。

在一个示例性实施例中，可以使用miR-122在HEK.293细胞系统(其中miR-122不是天然表达的)中说明esgRNA靶向的诱导。在没有外源性miR-122的情况下，受保护的esgRNA不介导靶向的EMX1.3核酸酶活性。当添加外源性miR-122(100ng/孔)时，观察到靶向的EMX1.3切割(作为凝胶上的电泳变体可见的不同切割伪影)。这表明高度表达的内源性miRNA可用于提供遗传诱导的sgRNA的系统中。可以使用任何miRNA代替miRNA122，并且容易地确定相应的序列。

例如，sgRNA可以与同内源性靶miRNA互补的“护送”RNA适配体序列连接。靶miRNA可在细胞内形成RNA诱导的沉默复合物(RISC)。当靶miRNA存在于细胞中时，护送RNA适配体序列与靶miRNA结合，这导致通过RNA诱导的沉默复合物(RISC)在细胞内切割esgRNA。护送的切割释放了活性sgRNA。

例如，可以在以下方面描述受保护的指导物：包含护送的单一CRISPR-Cas9指导RNA(esgRNA)的非天然存在的或工程化的组合物，该指导RNA包含：

RNA指导序列，其能够与细胞中目的基因组座位中的靶序列杂交；和

护送RNA适配体序列，

其中该护送RNA适配体序列包含针对细胞上或细胞内适配体配体的结合亲和力，或该护送RNA适配体序列响应于细胞上或细胞内的局部适配体效应物，

其中该适配体配体或效应物在细胞上或细胞中的存在在空间或时间上受到限制。

护送RNA适配体序列可以与靶miRNA(其可以存在或不存在于细胞内)互补，使得仅当存在靶miRNA时，护送RNA适配体序列与靶miRNA结合，这导致通过RNA诱导的沉默复合物(RISC)在细胞内切割esgRNA。因此，在一些实施例中，护送RNA适配体序列与靶miRNA互补，并且护送RNA适配体序列与靶miRNA的结合导致RNA诱导的沉默复合物(RISC)在细胞内切割esgRNA。

试剂盒和组合物

在一个方面中，本发明提供了包含上述方法和组合物中披露的任何一种或多种元件的试剂盒或组合物(统称为“试剂盒”)。在一些实施例中，试剂盒包括如本文教授的载体系统和用于使用试剂盒的说明书。元件可以单独地或组合地提供，并且可以被提供于任何适合的容器中，例如小瓶、瓶子或管。试剂盒可以包括gRNA和如本文所述的非结合保护子链。试剂盒可以包括gRNA以及与指导序列至少部分地结合的保护子链(即pgRNA)。因此，试剂盒可以包括呈如本文所述的部分双链核苷酸序列的pgRNA。在一些实施例中，试剂盒包括一种或多种语言，例如超过一种语言的说明书。说明书可以是针对本文所述的应用和方法的。

在一些实施例中，试剂盒包括在利用本文所述的一个或多个元件的方法中使用的一种或多种试剂。试剂可以提供于任何适合容器中。例如，试剂盒可以提供一种或多种反应或存储缓冲液。可以按在具体测定中可用的形式或按在使用之前需要添加一种或多种其他组分的形式(例如按浓缩或冻干形式)提供试剂。缓冲液可以是任何缓冲液，包括但不限于碳酸钠缓冲液、碳酸氢钠缓冲液、硼酸盐缓冲液、Tris缓冲液、MOPS缓冲液、HEPES缓冲液及其组合。在一些实施例中，缓冲液是碱性的。在一些实施例中，缓冲液具有从约7至约10的pH。在一些实施例中，试剂盒包括一种或多种寡核苷酸，该一种或多种寡核苷酸对应于用于插入到载体中的指导序列，以便可操作地连接该指导序列和调节元件。在一些实施例中，试剂盒包括同源重组模板多核苷酸。在一些实施例中，试剂盒包括本文所述的一种或多种载体和/或一种或多种多核苷酸。试剂盒可以有利地允许提供本发明的系统的所有元件。

在一个方面中，本发明提供了用于使用CRISPR系统的一个或多个元件的方法。本发明的CRISPR复合物提供了一种用于修饰靶多核苷酸的有效手段。本发明的CRISPR复合物具有多种多样的效用，包括修饰(例如，缺失、插入、易位、失活、激活)许多细胞类型中的靶多核苷酸。这样，本发明的CRISPR复合物在例如基因疗法、药物筛选、疾病诊断以及预后方面具有广泛的应用。示例性CRISPR复合物包含与杂交至靶多核苷酸内的靶序列的指导序列复合的CRISPR效应蛋白。在某些实施例中，同向重复序列连接至指导序列。

在一个实施例中，本发明提供了切割靶多核苷酸的方法。该方法包括使用结合靶多核苷酸的CRISPR复合物修饰靶多核苷酸并且实施所述靶多核苷酸的切割。典型地，本发明的CRISPR复合物在被引入到细胞中时产生基因组序列的断裂(例如单链或双链断裂)。例如，该方法可以用于切割细胞中的疾病相关基因。

通过CRISPR复合物产生的断裂可以通过修复过程来修复，例如易出错的非同源末端连接(NHEJ)途径或高保真性同源定向修复(HDR)。在这些修复过程期间，可以将一个外源性多核苷酸模板引入到基因组序列中。在一些方法中，该HDR过程被用于修饰基因组序列。例如，可以将包含有待整合的侧接有一个上游序列和一个下游序列的序列的外源性多核苷酸模板引入到细胞中。上游序列和下游序列与染色体中整合位点的任一侧享有序列相似性。

在希望的情况下，供体多核苷酸可以是DNA，例如DNA质粒、细菌人工染色体(BAC)、酵母人工染色体(YAC)、病毒载体、一段线性DNA、PCR片段、裸核酸或与递送媒介物(例如脂质体或泊洛沙姆)复合的核酸。

外源性多核苷酸模板包含有待整合的序列(例如，突变型基因)。供整合的序列可以是对细胞而言内源或外源的序列。有待整合的序列的实例包括编码蛋白质的多核苷酸或非编码RNA(例如，微小RNA)。因此，供整合的序列可以与一种或多种适当的控制序列可操作地连接。可替代地，有待整合的序列可以提供调节功能。

外源性多核苷酸模板中的上游序列和下游序列被选择为促进目的染色体序列与供体多核苷酸之间的重组。上游序列是与供整合的靶向位点的上游的基因组序列享有序列相似性的核酸序列。类似地，下游序列是与整合的靶向位点的下游的染色体序列享有序列相似性的核酸序列。外源性多核苷酸模板中的上游序列和下游序列与靶向的基因组序列可以具有75％、80％、85％、90％、95％或100％序列一致性。优选地，外源性多核苷酸模板中的上游序列和下游序列与靶向的基因组序列具有约95％、96％、97％、98％、99％或100％序列一致性。在一些方法中，外源性多核苷酸模板中的上游序列和下游序列与靶向的基因组序列具有约99％或100％序列一致性。

上游序列或下游序列可以包含从约20bp至约2500bp，例如约50、100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400或2500bp。在一些方法中，示例性上游序列或下游序列具有约200bp至约2000bp、约600bp至约1000bp，或更具体地约700bp至约1000bp。

在一些方法中，外源性多核苷酸模板可以进一步包含标记。此标记可以使得容易地筛选靶向的整合。适合的标记的实例包括限制性位点、荧光蛋白或选择标记。可以使用重组技术构建本发明的外源性多核苷酸模板(例如参见，Sambrook等人,2001和Ausubel等人,1996)。

在一个用于通过整合外源性多核苷酸模板来修饰靶多核苷酸的示例性方法中，通过CRISPR复合物将双链断裂引入到基因组序列中，经由同源重组外源性多核苷酸模板而修复该断裂，这样使得将该模板整合到基因组中。双链断裂的存在促进模板的整合。

在其他实施例中，本发明提供了一种修饰多核苷酸在真核细胞中的表达的方法。该方法包括通过使用结合多核苷酸的CRISPR复合物增加或减少靶多核苷酸的表达。

在一些方法中，控制序列可以失活，使得其不再作为控制序列起作用。如本文使用的，“控制序列”是指影响核酸序列的转录、翻译或可及性的任何核酸序列。控制序列的实例包括启动子、转录终止子和增强子，它们是控制序列。失活的靶序列可以包括缺失突变(即，缺失一个或多个核苷酸)、插入突变(即，插入一个或多个核苷酸)或无义突变(即，用另一个核苷酸取代一个单核苷酸，这样使得引入终止密码子)。在一些方法中，靶序列的失活导致该靶序列的“敲除”。

CRISPR Cas系统的示例性使用方法

本发明提供了非天然存在的或工程化的组合物、或编码所述组合物的组分的一种或多种多核苷酸、或含有编码所述组合物的组分一种或多种多核苷酸的载体或递送系统，其用于体内、离体或体外修饰靶细胞并且该修饰可以改变细胞使得一旦修饰，CRISPR修饰细胞的子代或细胞系保留改变的表型的方式实施。这些修饰的细胞和子代可以是多细胞生物体的一部分，例如在将CRISPR系统应用于所希望的细胞类型的情况下的植物或动物。CRISPR发明可以是治疗性治疗方法。治疗性治疗方法可以包括基因或基因组编辑，或基因治疗。

失活的CRISPR Cpf1酶用于检测方法例如FISH的用途

在一个方面中，本发明提供了包含本文所述的催化失活Cas蛋白(优选失活Cpf1(dCpf1))的工程化、非天然发生的CRISPR-Cas系统，以及此系统在检测方法(例如荧光原位杂交(FISH))中的用途。缺乏产生DNA双链断裂的能力的dCpf1可以与标记例如荧光蛋白，例如增强型绿色荧光蛋白(eEGFP)融合，并且与小指导RNA共表达以靶向体内的臂间、中心和端粒的(teleomeric)重复序列。dCpf1系统可以用于可视化人类基因组中的重复序列和单个基因两者。标记的dCpf1 CRISPR-cas系统的此类新应用在成像细胞和研究机能核体系结构中，特别是在小细胞核体积或复合物3-D结构的情况下可能是重要的。(Chen B,GilbertLA,Cimini BA,Schnitzbauer J,Zhang W,Li GW,Park J,Blackburn EH,Weissman JS,QiLS,Huang B.2013.Dynamic imaging of genomic loci in living human cells by anoptimized CRISPR/Cas system.[通过优化的CRISPR/Cas系统使活人类细胞中的基因组座位动态成像]Cell[细胞]155(7):1479-91.doi:10.1016/j.cell.2013.12.001。)

使用CRISPR Cpf1来修饰/检测DNA

CRISPR Cpf1系统及其使用方法对于DNA的靶向和任选地遗传修饰是有意义的，而不管其起源。因此，DNA可以是原核、真核或病毒DNA。本文在别处详述了在细胞内或细胞外靶向真核DNA的不同应用。在具体实施例中，Cpf1系统用于靶向微生物，例如原核DNA。在生物体(例如酵母或真菌)中的目的分子的重组生产的上下文中，这可能是有意义的。在本上下文中，本发明设想了用于在宿主细胞中重组产生目的化合物的方法，该方法包括使用Cpf1系统用于遗传修饰宿主细胞(例如酵母、真菌或细菌)，以确保产生所述化合物。该申请进一步设想了通过这些方法获得的化合物。另外地或可替代地，这在检测和/或修饰细菌或病毒DNA的上下文中可能是目的。在具体实施例中，这些方法涉及细菌或病毒DNA的特异性检测和/或修饰。

使用CRISPR Cpf1来降解污染物DNA

在具体实施例中，Cpf1效应蛋白用于靶向和切割污染物DNA。例如，在具体实施例中，真核DNA是样品中的污染物，例如，其中在真核生物的组织或流体样品中检测非真核的(例如病毒或细菌)DNA是目的。通过使用真核生物(例如人类)特异性指导序列确保真核DNA的靶向。这些方法可能涉及或可能不涉及在靶向真核DNA之前裂解样品中存在的细胞。在选择性切割真核DNA后，可以通过本领域已知的方法将其与样品中存在的完整DNA分离。因此，本发明提供了用于从样品中选择性去除真核(例如人类)DNA的方法，该方法包括用本文所述的CRISPR-Cpf1系统来选择性地切割真核DNA。本文还提供了用于实施这些方法的试剂盒，这些试剂盒包含本文所述的CRISPR-Cpf1系统的一种或多种组分，其允许选择性靶向真核DNA。类似地，设想可以确保物种特异性去除污染的DNA。

用CRISPRCas系统或复合物(例如，Cpf1-RNA复合物)修饰靶标

在一个方面中，本发明提供了修饰真核细胞中的靶多核苷酸的方法，这些方法可以是在体内、离体或在体外。在一些实施例中，该方法包括从人类或非人类动物取样细胞或细胞群体，并且修饰该细胞或这些细胞。培养可以发生在离体的任何阶段。该细胞或这些细胞甚至可以被重新引入非人类动物或植物中。对于重新引入的细胞，特别优选的是这些细胞是干细胞。

在一个方面中，本发明提供了修饰真核细胞中的靶多核苷酸的方法。在一些实施例中，该方法包括使CRISPR复合物与靶多核苷酸结合来实施对所述靶多核苷酸的切割，从而修饰靶多核苷酸，其中该CRISPR复合物包含与受保护的指导RNA(其包含与所述靶多核苷酸内的靶序列杂交的指导序列)复合的Cpf1酶。在一些实施例中，所述切割包括通过所述Cpf1酶切割靶序列的位置处的一条或两条链。在一些实施例中，所述切割使得靶基因的转录减少。在一些实施例中，该方法进一步包括通过与外源性模板多核苷酸或基于非同源末端连接(NHEJ)的基因插入机制的同源重组修复所述切割的靶多核苷酸，其中所述修复导致包含所述靶多核苷酸的一个或多个核苷酸的插入、缺失或取代的突变。在一些实施例中，所述突变使得由包含靶序列的基因表达的蛋白质中发生一个或多个氨基酸的变化。在一些实施例中，该方法进一步包括将一个或多个载体递送至所述真核细胞，其中一个或多个载体驱动以下中的一个或多个的表达：Cpf1酶(受保护的指导RNA)，其包含与同向重复序列连接的指导序列。在一些实施例中，所述载体被递送至受试者中的真核细胞。在一些实施例中，所述修饰发生在细胞培养中的所述真核细胞中。在一些实施例中，该方法进一步包括在所述修饰之前将所述真核细胞从受试者分离。在一些实施例中，该方法进一步包括将所述真核细胞和/或来源于其的细胞返回至所述受试者。

实际上，在本发明的任何方面中，CRISPR复合物可以包含与杂交至或可杂交至靶序列的指导序列复合的CRISPR酶。类似的考虑因素和条件适用如上文针对修饰靶多核苷酸的方法。

因此，在本文所述的非天然存在的CRISPR酶中的任一个包含至少一种修饰并且由此该酶具有某些改善的能力。具体地说，这些酶中的任一个能够与指导RNA形成CRISPR复合物。当形成此复合物时，指导RNA能够结合靶多核苷酸序列并且酶能够修饰靶座位。此外，与未修饰酶相比，CRISPR复合物中的酶具有降低的修饰一个或多个脱靶座位的能力。

此外，本文所述的修饰CRISPR酶涵盖下述的酶：由此在CRISPR复合物中该酶与未修饰酶相比具有增加的修饰一个或多个靶座位的能力。此功能可以单独提供或者与以上所述的降低的修饰一个或多个脱靶座位的能力的功能组合提供。任何此类酶可以提供有如本文所述的对CRISPR酶的任一另外修饰，例如与通过一个或多个缔合的异源功能结构域提供的任何活性、任何降低核酸酶活性的另外突变等组合。

在本发明的有利实施例中，修饰CRISPR酶相比于未修饰酶被提供有降低的修饰一个或多个脱靶座位的能力并且相比于未修饰酶被提供有增加的修饰一个或多个靶座位的能力。在与对酶的另外修饰组合的情况下，可以实现显著增强的特异性。例如，提供了此类有利实施例与一个或多个另外的突变的组合，其中一个或多个另外的突变是处于一个或多个催化活性结构域之中。此类另外的催化突变可以赋予如本文其他地方详细所述的切口酶功能性。在此类酶中，可以实现增强的特异性，这归因于关于酶活性的改善特异性。

可以对坐落于位于RuvC-III结构域与HNH结构域之间的带正电荷的区/沟中的氨基酸残基进行如以上所述的降低脱靶效应和/或增强中靶效应的突变。应了解的是，以上所述的功能效应中的任一个可以通过上述沟内的氨基酸的修饰来实现，但是还通过相邻于此沟或在此沟之外的氨基酸的修饰来实现。

可以被工程化到如本文所述的修饰CRISPR酶的另外功能包括以下。1.破坏DNA:蛋白质相互作用而不影响蛋白质三级或二级结构的修饰CRISPR酶。此CRISPR酶包含接触RNA:DNA双链体的任一部分的残基。2.响应于DNA结合(中靶或脱靶)削弱内部蛋白质相互作用使Cpf1保持为核酸酶切割所必需的构象的修饰CRISPR酶。例如：微弱抑制，但是仍允许HNH结构域(定位在易裂的磷酸盐处)的核酸酶构象的修饰。3.响应于DNA结合(中靶或脱靶)增强内部蛋白质相互作用使Cpf1保持为抑制核酸酶活性的构象的修饰CRISPR酶。例如：将HNH结构域稳定为呈远离易裂的磷酸盐的构象的修饰。可以与如本文其他地方详细所述的对CRISPR酶的任何其他修饰组合来提供任何此另外的功能增强。

任一本文所述的改善功能性可以对任何CRISPR酶，例如Cpf1酶进行。然而，应了解，本文所述的功能性中的任一个可以被工程化到来自其他直向同源物的Cpf1酶中，包括包含来自多个直向同源物的片段的嵌合酶。

核酸、氨基酸和蛋白质、调控序列、载体等

本发明使用核酸结合靶DNA序列。这是有利的，因为核酸的制备比蛋白质更容易且更便宜，并且特异性可根据其中寻求同源性的一段序列长度而改变。多靶指的复杂3-D定位例如是不需要的。术语“多核苷酸”、“核苷酸”、“核苷酸序列”、“核酸”以及“寡核苷酸”是可互换使用的。它们是指具有任何长度的核苷酸(脱氧核糖核苷酸或核糖核苷酸)的聚合形式或其类似物。多核苷酸可以具有任何三维结构并且可以执行任何已知或未知的功能。以下是多核苷酸的非限制性实例：基因或基因片段的编码或非编码区、由连锁分析定义的多个座位(一个座位)、外显子、内含子、信使RNA(mRNA)、转移RNA、核糖体RNA、短干扰RNA(siRNA)、短发夹RNA(shRNA)、微小-RNA(miRNA)、核酶、cDNA、重组多核苷酸、支链多核苷酸、质粒、载体、任何序列的分离的DNA、任何序列的分离的RNA、核酸探针和引物。该术语还涵盖具有合成骨架的核酸样结构，参见例如Eckstein,1991；Baserga等人,1992；Milligan,1993；WO 97/03211；WO 96/39154；Mata,1997；Strauss-Soukup,1997；和Samstag,1996。多核苷酸可以包含一个或多个修饰核苷酸，例如甲基化核苷酸和核苷酸类似物。如果存在的话，对核苷酸结构的修饰可以在聚合物组装之前或之后赋予。核苷酸序列可以被非核苷酸组分中断。多核苷酸可以在聚合之后例如通过与标记组分缀合来进一步修饰。如本文使用的，术语“野生型”是本领域技术人员理解的技术术语并且意指在自然界中出现的典型式的生物体、菌株、基因或特征，与突变体或变体形式区分。“野生型”可以是底线。如本文使用的，术语“变体”应理解为意指具有源自自然界中存在的模式的性质展示。术语“非天然存在的”或“工程化的”是可互换使用的并且是指涉及人工处理。这些术语当提及核酸分子或多肽时意指核酸分子或多肽至少基本上与至少一种其他组分分离，该至少一种其他组分在自然界中与该核酸分子或多肽天然缔合并且如自然界中发现的。“互补”是指核酸通过传统的沃森-克里克碱基配对或其他非传统类型来与另一个核酸序列形成氢键的能力。互补百分比表示核酸分子中可与第二核酸序列形成氢键(例如，沃森-克里克碱基配对)的残基百分比(例如，10分之5、6、7、8、9、10是50％、60％、70％、80％、90％以及100％互补)。“完美互补”意指核酸序列的所有连续残基都将与第二核酸序列中同样数目的连续残基形成氢键。如本文使用的“基本上互补”是指在8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40、45、50、或更多个核苷酸上的至少60％、65％、70％、75％、80％、85％、90％、95％、97％、98％、99％、或100％的互补程度，或者是指在严格条件下杂交的两个核酸。如本文使用的，用于杂交的“严格条件”是指与靶序列具有互补的核酸与靶序列显著杂交并且基本上不与非靶序列杂交的条件。严格条件通常是依赖序列的并且根据多种因素而改变。总的来说，该序列越长，该序列与其靶序列特异性杂交的温度越高。严格条件的非限制性实例详细描述于Tijssen(1993)，Laboratory Techniques In Biochemistry And MolecularBiology-Hybridization With Nucleic Acid Probes Part I[生物化学和分子生物学实验室技术—与核酸探针杂交第I部分],第二章“Overview of principles ofhybridization and the strategy of nucleic acid probe assay[杂交理论和核酸探针测定策略的综述]”，Elsevier,N.Y.[纽约爱思维尔公司]。在参考多核苷酸序列时，那么还设想互补或部分互补的序列。这些序列优选地能够在高严格条件下与参考序列杂交。一般地说，为了使杂交率最大化，选择相对低严格性的杂交条件：比热熔点(T_m)低约20℃至25℃。T_m是50％特异性靶序列在限定的离子强度和pH的溶液中与完美互补探针杂交的温度。一般地说，为了要求至少约85％核苷酸互补的杂交序列，选择高严格洗涤条件为低于该T_m约5℃至15℃。为了要求至少约70％核苷酸互补的杂交序列，选择中等严格洗涤条件为低于该T_m约15℃至30℃。高容许(极低严格)洗涤条件可以是低至在该T_m之下50℃，从而允许在杂交序列之间高错配水平。本领域技术人员将认识到，杂交和洗涤阶段的其他物理和化学参数也可被改变为影响来自靶标与探针序列之间特定同源性水平的可检测杂交信号的结果。优选高严格条件包括在50％甲酰胺、5x SSC以及1％SDS中在42℃孵育或者在5x SSC和1％SDS中在65℃孵育，在0.2x SSC和0.1％SDS中在65℃洗涤。“杂交”是指其中一个或多个多核苷酸反应形成经由核苷酸残基的碱基之间氢键键合而稳定的复合物的反应。氢键可以通过沃森-克里克碱基配对、Hoogstein键合或以任何其他序列特异性方式形成。该复合物可以包含形成双链体结构的两条链、形成多链复合物的三条或更多条链、单一自杂交链或这些的任何组合。杂交反应可以构成在更广泛的方法中的步骤，例如PCR起始、或酶切割多核苷酸。能够与给定序列杂交的序列被称为给定序列的“互补序列”。如本文使用的，术语“基因组座位(genomic locus)”或“座位(locus)”(复数是座位(loci))是染色体上的基因或DNA序列的特异性位点。“基因”是指编码在生物体中具有功能作用的多肽或RNA链的DNA或RNA片段并且因此是活生物体中的遗传分子单元。出于本发明的目的，可以认为基因包含调节基因产物产生的区域，无论此类调控序列是否与编码序列和/或转录序列相邻。因此，基因包括但不一定限于，启动子序列、终止子、翻译调控序列例如核糖体结合位点和内部核糖体进入位点、增强子、沉默子、绝缘子、边界元件、复制起点、基质附着位点以及座位控制区。如本文使用的，“基因组座位的表达”或“基因表达”是来自基因的信息用于合成功能基因产物所通过的过程。基因表达产物常常是蛋白质，但在非蛋白编码基因例如rRNA基因或tRNA基因中，该产物是功能RNA。所有已知生命(真核生物(包括多细胞生物体)、原核生物(细菌和古生菌)以及病毒)使用基因表达过程产生功能产物以生存。如本文使用的，基因或核酸的“表达”不仅涵盖细胞基因表达，而且涵盖克隆系统和任何其他背景中的核酸转录和翻译。如本文使用的，“表达”还是指多核苷酸从DNA模板转录(例如转录成mRNA或其他RNA转录物)所通过的过程和/或转录的mRNA随后翻译成肽、多肽或蛋白质所通过的过程。转录物和编码的多肽可以统称为“基因产物”。如果多核苷酸来源于基因组DNA，则在真核细胞中表达可以包括mRNA的剪接。本文可互换使用的术语“多肽”、“肽”和“蛋白质”是指具有任何长度的氨基酸聚合物。该聚合物可以是线性或支化的，它可以包含修饰氨基酸，并且它可以被非氨基酸中断。所述术语还涵盖已修饰的氨基酸聚合物；例如，二硫键形成、糖基化、脂化、乙酰化、磷酸化或任何其他操纵，如与标记组分缀合。如本文使用的，术语“氨基酸”包括天然和/或非天然或合成的氨基酸，包括甘氨酸和D或L光学异构体，以及氨基酸类似物和肽模拟物。如本文使用的，术语“结构域”或“蛋白质结构域”是指可以存在并且独立于其余蛋白质链起作用的一部分蛋白质序列。如本发明的多个方面中所述的，序列一致性与序列同源性相关。同源性比较可以通过眼睛来进行，或者更通常地借助于容易获得的序列比较程序来进行。这些商业上可用的计算机程序可以计算两个或更多更序列之间的同源性百分比(％)并且还可以计算两个或更多更氨基酸或核酸序列所享有的序列一致性。

在本发明的多个方面中，术语“指导RNA”是指包含推定或鉴定的crRNA序列或指导序列的多核苷酸序列。

如本文使用的，术语“野生型”是本领域技术人员理解的技术术语并且意指在自然界中出现的典型式的生物体、菌株、基因或特征，与突变体或变体形式区分。“野生型”可以是底线。

如本文使用的，术语“变体”应理解为意指具有源自自然界中存在的模式的性质展示。

术语“非天然存在的”或“工程化的”是可互换使用的并且是指涉及人工处理。这些术语当提及核酸分子或多肽时意指核酸分子或多肽至少基本上与至少一种其他组分分离，该至少一种其他组分在自然界中与该核酸分子或多肽天然缔合并且如自然界中发现的。在所有方面和实施例中，无论它们是否包括这些术语，都应当理解，优选地，它们可以是任选的并且因此优选地包括或并不优选地不包括。此外，术语“非天然存在的”和“工程化的”可以是可互换使用的并且因此也可以单独或组合使用，并且在两者一起提及时，它们可以彼此替换。具体地说，“工程化的”优选地代替“非天然存在的”或“非天然存在的和/或工程化的”。

序列同源性可以通过任何本领域已知的多种计算机程序(例如BLAST或FASTA等)来生成。用于进行此种比对的适合计算机程序是GCG Wisconsin Bestfit软件包(University of Wisconsin[威斯康星大学],美国；Devereux等人,1984,Nucleic AcidsResearch[核酸研究]12:387)。可以进行序列比较的其他软件的实例包括但不限于，BLAST软件包(参见Ausubel等人,1999同上—第18章)、FASTA(Atschul等人,1990,J.Mol.Biol.[分子生物杂志],403-410)、和GENEWORKS比较工具套件。BLAST和FASTA两种均可用于离线和在线搜索(参见Ausubel等人,1999同上，第7-58页至第7-60页)。然而，优选使用GCGBestfit程序。序列同源性百分比(％)可以对连续序列计算，即将一个序列与另一个序列比对并且将在一个序列中的每个氨基酸或核苷酸与另一个序列中的相应氨基酸或核苷酸直接比较，每次一个残基。这被称为“无空位”比对。典型地，此类无空位比对仅对相对短的多个残基进行。尽管这是一种非常简单且连贯的方法，但是它未能考虑到例如，在序列的另外相同碱基对中，一个插入或缺失可以引起后面的氨基酸残基无法比对，因此可能导致在进行整体比对时同源性％大大减小。因此，大部分序列比较方法被设计为产生最佳比对，从而考虑到可能的插入和缺失而不会过度不利于总体同源性或一致性得分。这通过在序列比对中插入“空位”以试图最大化局部同源性或一致性来实现。然而，这些更复杂的方法将“空位罚分”分配给出现在比对中的每个空位，以使得对于相同数目的相同氨基酸，与尽可能少的空位(影响两个比较的序列之间的较高相关性)的序列比对可以实现比具有许多空位的序列更高的得分。“亲和力空位成本(Affinity gap cost)”典型地用于对空位的存在承担相对高的成本并且对空位中的每个后续残基给予较小的罚分。这是最常使用的空位评分系统。高空位罚分当然可以产生与较少空位的最佳比对。大部分比对程序允许修改空位罚分。然而，优选地当使用此类软件进行序列比较时使用默认值。例如，当使用GCG WisconsinBestfit软件包时，氨基酸的默认空位罚分对于空位是-12并且对于每个延伸是-4。因此最大同源性％的计算首先需要产生最佳比对，考虑到空位罚分。用于进行此种比对的适合的计算机软件是GCG Wisconsin Bestfit软件包(Devereux等人,1984Nuc.Acids Research[核酸研究]12第387页)。可以进行序列比较的其他软件的实例包括但不限于，BLAST软件包(参见Ausubel等人,1999Short Protocols in Molecular Biology[分子生物学短方案],第4版—第18章)、FASTA(Atschul等人,1990,J.Mol.Biol.[分子生物杂志],403-410)、和GENEWORKS比较工具套件。BLAST和FASTA两种均可用于离线和在线搜索(参见Ausubel等人,1999,Short Protocols in Molecular Biology[分子生物学短方案],第7-58页至第7-60页)。然而，对于一些应用，优选使用GCG Bestfit程序。一种称为BLAST 2序列的新工具也可用于比较蛋白质和核苷酸序列(参见FEMS Microbiol Lett.[FEMS微生物学概述]1999 174(2):247-50；FEMS Microbiol Lett.[FEMS微生物学概述]1999177(1):187-8以及美国国立卫生研究院(National Institutes for Health)网站的国家生物技术信息中心网站)。尽管可以根据一致性测量最终同源性％，但是比对方法本身典型地并不是基于不全则无的成对比较。相反，通常使用标准的相似性评分矩阵，它基于化学相似性或进化距离将得分分配给每个成对比较。通常使用的这种矩阵的实例是BLOSUM62矩阵—这是BLAST程序套件的默认矩阵。GCG Wisconsin程序通常使用公用的默认值或自定义符号比较表，如果提供的话(详细内容，参见使用者手册)。对于一些应用，优选地对于GCG软件包使用公用默认值，并且在其他软件的情况下，使用默认矩阵，例如BLOSUM62。可替代地，可以使用DNASIS^TM(日立软件公司(Hitachi Software))中的多重比对特征，基于与CLUSTAL类似的算法计算同源性百分比(Higgins DG和Sharp PM(1988),Gene[基因]73(1),237-244)。一旦软件生成最佳比对，可以计算同源性％，优选地序列一致性％。软件典型地进行作为序列比较的一部分的此计算并且生成多个结果。这些序列还可以具有氨基酸残基的缺失、插入或取代，这产生沉默变化并且形成功能上等效的物质。可以基于氨基酸特征(例如残基的极性、电荷、可溶性、疏水性、亲水性、和/或两亲性)的类似性来进行有目的的氨基酸取代并且因此将氨基酸以官能团分组在一起是有用的。氨基酸可以基于其单独的侧链的特征来分组在一起。然而，包括突变数据也会更有用。出于结构原因，因此衍生的几组氨基酸可能是保守的。这几组可以维恩图(Venn diagram)形式描述(Livingstone C.D.和Barton G.J.(1993)“Proteinsequence alignments:a strategy for the hierarchical analysis of residueconservation[蛋白质序列比对：用于分层分析残基保守性的策略]”Comput.Appl.Biosci.[计算机在生物科学中的应用]9:745-756)(Taylor W.R.(1986)“The classification ofamino acid conservation[氨基酸保守性分类]”J.Theor.Biol.[理论生物学杂志]119；205-218)。可以例如根据下表进行保守性取代，该表描述了普遍接受的氨基酸维恩图分组。

本文可互换使用的术语“受试者”、“个体”和“患者”是指脊椎动物，优选地是哺乳动物，更优选地是人类。哺乳动物包括但不限于，鼠类、猴类、人类、家畜、竞技动物、以及宠物。还涵盖体内获得或体外培养的生物实体的组织、细胞以及其子代。

术语“治疗药”、“能治疗的药剂”或“治疗剂”是可互换使用的并且是指当给予受试者时赋予一些有利作用的分子或化合物。有利作用包括实现诊断确定；缓解疾病、症状、障碍或病理病状；减少或预防疾病、症状、障碍或病状的发作；以及大体上消除疾病、症状、障碍或病理病状。

如本文使用的，“治疗”或“进行治疗”或“减轻”或“缓解”是本文可互换使用的。这些术语是指一种用于获得有利或希望的结果的方法，这些结果包括但不限于治疗益处和/或预防益处。治疗益处意指在治疗中的一种或多种疾病、病状、症状中的任何治疗上的相关改善或对这些疾病的作用。对于预防益处，组合物可以给予至处于发展具体的疾病、病状或症状的风险中的受试者，或给予报告疾病的一种或多种生理学症状的受试者，尽管这种疾病、病状或症状可能还未得到证实。

术语“有效量”或“治疗有效量”是指药剂足以实现有利或希望的结果的量。治疗有效量可以根据以下一个或多个而变化：受试者和正在治疗的疾病病状、受试者的体重和年龄、疾病病状的严重性、给予方式等，这些可以容易通过本领域技术人员确定。该术语还适合于将通过本文所述的任何一种成像方法提供检测图像的剂量。具体剂量可以根据以下一个或多个而变化：所选择的具体药剂、随后的给予方案(无论它是否与其他化合物组合)、给予时间、成像的组织、以及其中携带它的物理递送系统。

本发明的若干方面涉及包含一种或多种载体的载体系统或这样的载体。载体可以被设计为在原核细胞或真核细胞中表达CRISPR转录物(例如，核酸转录物、蛋白质或酶)。例如，CRISPR转录物可以在细菌细胞例如大肠杆菌、昆虫细胞(使用杆状病毒表达载体)、酵母细胞、或哺乳动物细胞中表达。适合的宿主细胞进一步在Goeddel,GENE EXPRESSIONTECHNOLOGY:METHODS IN ENZYMOLOGY[基因表达技术：酶学方法]185,Academic Press[学术出版社],San Diego[圣地亚哥],Calif.[加利福尼亚州](1990)中进行讨论。可替代地，重组表达载体可以例如使用T7启动子调控序列和T7聚合酶来进行体外转录和翻译。

本发明的实施例包括可以含有可发生的同源取代(取代和替换两者本文用于意指存在的氨基酸残基或核苷酸与替代性残基或核苷酸的互换)的序列(多核苷酸或多肽两者)，该同源取代即在氨基酸的情况下的同比取代，例如碱对碱、酸对酸、极性对极性等。也可以发生非同源取代，即从一类残基到另一类残基或者可替代地涉及包含非天然氨基酸例如鸟氨酸(在下文中称为Z)、二氨基丁酸鸟氨酸(在下文中称为B)、正亮氨酸鸟氨酸(在下文中称为O)、吡啶基丙氨酸、噻吩丙氨酸、萘基丙氨酸以及苯基甘氨酸。变体氨基酸序列可以包含适合的间隔基团，这些间隔基团可以插入在该序列的任何两个氨基酸残基之间，包括烷基例如甲基、乙基或丙基以及氨基酸间隔区例如甘氨酸或β-丙氨酸残基。涉及在类肽形式中存在一个或多个氨基酸残基的另一种变型形式可以被本领域技术人员很好地理解。为免生疑，“类肽形式”用于指示变体氨基酸残基，其中α-碳取代基是在残基的氮原子上而不是α-碳上。用于制备类肽形式的肽的方法是本领域已知的，例如Simon RJ等人,PNAS[美国国家科学院院刊](1992)89(20),9367-9371和Horwell DC,Trends Biotechnol.[生物技术趋势](1995)13(4),132-134。

同源建模：在其他Cpf1直向同源物中的相应残基可以通过以下方法来鉴定：Zhang等人,2012(Nature[自然]；490(7421):556-60)和Chen等人,2015(PLoS Comput Biol[科学公共图书馆计算生物学]；11(5):e1004248)—一种预测由结构域基序界面介导的相互作用的计算蛋白质-蛋白质相互作用(PPI)方法。PrePPI(预测的PPI)是一种基于结构的PPI预测方法，该方法使用贝叶斯统计框架将结构证据与非结构证据组合。该方法涉及查询蛋白质的碱基对并且使用结构比对鉴定与其实验上确定的结构或同源模型相对应的结构示意图。结构比对进一步用于通过考虑整体和局部几何关系来鉴定近处和远处的结构邻近物。无论何时结构示意图的两个邻近物形成蛋白质数据库中报道的复合物，这定义了一种用于建模两种查询蛋白质之间的相互作用的模板。复合物模型是通过在模板的相应结构邻近物上叠加代表性结构来创建的。此方法进一步描述于Dey等人,2013(Prot Sci[蛋白质科学]；22:359-66)。

出于本发明的目的，扩增意指采用能够以适当保真度复制靶序列的引物和聚合酶的任何方法。扩增可以是通过天然或重组DNA聚合酶例如TaqGold^TM、T7DNA聚合酶、大肠杆菌DNA聚合酶的克列诺片段、以及逆转录酶。一种优选扩增方法是PCR。

本发明的多个方面涉及指导RNA和(任选修饰或突变的)CRISPR酶(例如，Cpf1)的双顺反子载体。指导RNA和(任选修饰或突变的)CRISPR酶的双顺反子表达载体是优选的。总的来说并且具体的说，本文实施例中(任选修饰或突变的)CRISPR酶是优选通过CBh启动子驱动。该RNA可以是优选地通过Pol III启动子例如U6启动子驱动。理想的是，将两者组合。

在一些实施例中，提供了指导RNA中的环。这可以是发夹环或四元环。该环优选地是GAAA，但不限于此序列或者确实是仅4bp的长度。实际上，用于发夹结构中的优选成环序列的长度是四个核苷酸，并且最优选地具有序列GAAA。然而，也可以使用较长或较短的环序列，如可以是替代性序列。这些序列优选地包含核苷酸三联体(例如，AAA)和另一个核苷酸(例如C或G)。成环序列的实例包括CAAA和AAAG。在实践本文披露的方法中的任一个时，可以经由本领域已知的一种或多种方法来将适合的载体引入到细胞或胚胎中，这些方法包括但不限于，显微注射、电穿孔、声孔效应、基因枪、磷酸钙介导的转染、阳离子转染、脂质体转染、树枝状转染、热激转染、核转染、磁转染、脂转染、刺穿转染、光学转染、专有剂增强的核酸摄取、以及经由脂质体、免疫脂质体、病毒体或人工病毒体递送。在一些方法中，载体通过显微注射引入到胚胎中。这种或这些载体可以显微注射到胚胎的细胞核或细胞质中。在一些方法中，这种或这些载体可以通过核转染引入到细胞中。

载体可以被设计为在原核细胞或真核细胞中表达CRISPR转录物(例如，核酸转录物、蛋白质或酶)。例如，CRISPR转录物可以在细菌细胞例如大肠杆菌、昆虫细胞(使用杆状病毒表达载体)、酵母细胞、或哺乳动物细胞中表达。适合的宿主细胞进一步在Goeddel,GENE EXPRESSION TECHNOLOGY:METHODS IN ENZYMOLOGY[基因表达技术：酶学方法]185,Academic Press[学术出版社],San Diego[圣地亚哥],Calif.[加利福尼亚州](1990)中进行讨论。可替代地，重组表达载体可以例如使用T7启动子调控序列和T7聚合酶来进行体外转录和翻译。

载体可以在原核生物或原核细胞中引入并增殖。在一些实施例中，使用原核生物扩增有待引入到真核细胞的载体拷贝或者作为产生有待引入真核细胞的载体的中间载体(例如，扩增作为病毒载体包装系统的一部分的质粒)。在一些实施例，使用原核生物扩增载体拷贝并表达一种或多种核酸，以便提供用于递送至宿主细胞或宿主生物体的一种或多种蛋白质来源。原核生物中的蛋白质表达最常在具有载体的大肠杆菌中进行，这些载体含有引导融合蛋白或非融合蛋白表达的组成型启动子或诱导型启动子。融合载体将许多氨基酸添加到其中编码的蛋白质，例如添加到重组蛋白的氨基末端。此类融合载体可以用于一个或多个目的，例如：(i)增加重组蛋白的表达；(ii)增加重组蛋白的溶解度；以及(iii)通过充当亲和纯化中的配体来帮助纯化重组蛋白。通常，在融合表达载体中，蛋白水解切割位点被引入在融合部分与重组蛋白的接点处，以使得重组蛋白能够与融合部分分离，从而随后纯化该融合蛋白。此类酶及其同源识别序列包括凝血因子Xa、凝血酶以及肠激酶。示例性融合表达载体包括pGEX(法玛西亚生物技术公司(Pharmacia Biotech Inc)；Smith和Johnson,1988.Gene[基因]67:31-40)、pMAL(New England Biolabs,Beverly,Mass.[普利茅斯贝弗莉的新英格兰生物实验室])以及pRIT5(Pharmacia[法玛西亚公司],Piscataway[皮斯卡塔韦],N.J.[新泽西州])，它们将谷胱甘肽S-转移酶(GST)、麦芽糖E结合蛋白或蛋白A分别融合至靶重组蛋白。适合的诱导型非融合大肠杆菌表达载体的实例包括pTrc(Amrann等人,(1988)Gene[基因]69:301-315)和pET 11d(Studier等人,GENE EXPRESSIONTECHNOLOGY:METHODS IN ENZYMOLOGY[基因表达技术：酶学方法]185,Academic Press[学术出版社],San Diego[圣地亚哥],Calif.[加利福尼亚州](1990)60-89)。在一些实施例中，载体是酵母表达载体。用于在酵母酿酒酵母中表达的载体的实例包括pYepSec1(Baldari等人,1987.EMBO J.[欧洲分子生物学学会杂志]6:229-234)、pMFa(Kuijan和Herskowitz,1982.Cell[细胞]30:933-943)、pJRY88(Schultz等人,1987.Gene[基因]54:113-123)、pYES2(加利福尼亚州圣地亚哥的英杰公司(Invitrogen Corporation,SanDiego,Calif.))以及picZ(加利福尼亚州圣地亚哥的英杰公司(InVitrogen Corp,SanDiego,Calif.))。在一些实施例中，载体在使用杆状病毒表达载体的昆虫细胞中驱动蛋白质表达。可用于在培养的昆虫细胞(例如，SF9细胞)表达蛋白质的杆状病毒载体包括pAc系列(Smith等人,1983.Mol.Cell.Biol.[分子细胞生物学]3:2156-2165)和pVL系列(Lucklow和Summers,1989.Virology[病毒学]170:31-39)。

在一些实施例中，载体能够使用哺乳动物表达载体驱动一种或多种序列在哺乳动物细胞中表达。哺乳动物表达载体的实例包括pCDM8(Seed,1987.Nature[自然]329:840)和pMT2PC(Kaufman等人,1987.EMBO J.[欧洲分子生物学学会杂志]6:187-195)。当用于哺乳动物细胞时，表达载体的控制功能典型地是由一个或多个调节元件提供的。例如，常用的启动子是来源于多瘤、腺病毒2、巨细胞病毒、猿猴病毒40、以及本文披露和本领域已知的其他来源。对于原核细胞和真核细胞两者的其他适合表达系统，参见例如Sambrook等人,MOLECULAR CLONING:A LABORATORY MANUAL.[分子克隆：实验室手册]第2版,Cold SpringHarbor Laboratory[冷泉港实验室],Cold Spring Harbor Laboratory Press[冷泉港实验室出版社],Cold Spring Harbor[冷泉港],N.Y.[纽约],1989中的第16章和第17章。

在一些实施例中，重组哺乳动物表达载体能够引导核酸优先在特定细胞类型中表达(例如，组织特异性调节元件用于表达核酸)。组织特异性调节元件是本领域已知的。适合的组织特异性启动子的非限制性实例包括白蛋白启动子(肝特异性；Pinkert等人,1987.Genes Dev.[基因发育]1:268-277)、淋巴特异性启动子(Calame和Eaton,1988.Adv.Immunol.[免疫学进展]43:235-275)(具体地说T细胞受体(Winoto和Baltimore,1989.EMBO J.[欧洲分子生物学学会杂志]8:729-733)和免疫球蛋白类(Baneiji等人,1983.Cell[细胞]33:729-740；Queen和Baltimore,1983.Cell[细胞]33:741-748的启动子)，神经元特异性启动子(例如神经丝启动子；Byrne和Ruddle,1989.Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]86:5473-5477)、胰脏特异性启动子(Edlund等人,1985.Science[科学]230:912-916)，以及乳腺特异性启动子(例如乳清启动子；美国专利号4,873,316和欧洲申请公开号264,166)。还涵盖发育调节启动子，例如鼠科hox启动子(Kessel和Gruss,1990.Science[科学]249:374-379)和α-胎蛋白启动子(Campes和Tilghman,1989.Genes Dev.[基因发育]3:537-546)。关于原核载体和真核载体，参考美国专利6,750,059，其内容通过引用以其整体并入本文。本发明的其他实施例可以涉及病毒载体的使用，关于此使用参考美国专利申请13/092,085，其内容通过引用以其整体并入本文。组织特异性调节元件是本领域已知的并且就这一点而言，参考美国专利7,776,321，其内容通过引用以其整体并入本文。在一些实施例中，调节元件与CRISPR系统的一个或多个元件可操作地连接，以便驱动该CRISPR系统的一个或多个元件表达。总的来说，CRISPR(成簇规律间隔短回文重复序列)也称为SPIDR(间隔区间隔同向重复序列)，它构成通常对特定细菌种类特异的DNA座位家族。CRISPR座位包括大肠杆菌中识别的不同类别的间隔短序列重复序列(SSR)(Ishino等人,J.Bacteriol.[细菌学杂志],169:5429-5433[1987]；和Nakata等人,J.Bacteriol.[细菌学杂志],171:3553-3556[1989])，以及相关的基因。类似的间隔SSR已在地中海富盐菌、酿脓链球菌、鱼腥藻属、以及结核分枝杆菌中鉴定(参见，Groenen等人,Mol.Microbiol.[分子微生物学],10:1057-1065[1993]；Hoe等人,Emerg.Infect.Dis.[新兴传染病杂志],5:254-263[1999]；Masepohl等人,Biochim.Biophys.Acta[生物物理学报]1307:26-30[1996]；和Mojica等人,Mol.Microbiol.[分子微生物学],17:85-93[1995])。CRISPR座位与其他SSR的典型不同之处在于重复序列结构，该结构称为短规律间隔重复序列(SRSR)(Janssen等人,OMICSJ.Integ.Biol.[组学：整合生物学杂志],6:23-33[2002]；和Mojica等人,Mol.Microbiol.[分子微生物学],36:244-246[2000])。总的来说，这些重复序列是成簇出现的短元件，它们由具有基本上恒定的长度的独特间插序列规律地间隔开(Mojica等人,[2000],同上)。尽管这些重复序列在菌株之间是高度保守的，但是间隔重复序列的数目和间隔区的序列典型地因菌株不同而不同(van Embden等人,J.Bacteriol.[细菌学杂志],182:2393-2401[2000])。CRISPR座位已在超过40种原核生物中鉴定(参见例如Jansen等人,Mol.Microbiol.[分子生物学],43:1565-1575[2002]；以及Mojica等人,[2005])，包括但不限于，气火菌属、火棒菌属、硫化叶菌属、古生球菌属、盐盒菌属、甲烷杆菌属、甲烷球菌属、甲烷八叠球菌属、甲烷八叠球菌属、火球菌属、嗜酸菌属、热原体属、棒状杆菌属、分枝杆菌属、链霉菌属、产水菌属、卟啉单胞菌属、绿硫菌属、栖热菌属、芽孢杆菌属、李斯特菌属、葡萄球菌属、梭菌属、高温厌氧杆菌属、支原体属、梭菌属、固氮弓菌属(Azarcus)、色杆菌属、奈瑟氏菌属、亚硝化单胞菌属、脱硫弧菌属、地杆菌属、黏球菌属、弯曲杆菌属、沃廉菌属、不动杆菌属、欧文氏菌属、埃希菌属、军团杆菌属、甲基球菌属、巴氏杆菌属、发光杆菌属、沙门氏菌属、黄单胞菌属、耶尔森菌属、密螺旋体属、以及热袍菌属。

总的来说，如本申请所用的“核酸靶向系统”总体上是指涉及表达核酸靶向CRISPR相关(“Cas”)基因或引导这些基因活性的转录物和其他元件(本文也称为效应蛋白)，这些基因包括编码核酸靶向Cas(效应)蛋白和指导RNA的序列或来自核酸靶向CRISPR座位的其他序列和转录物。在一些实施例中，核酸靶向系统的一个或多个元件是来源于V型核酸靶向CRISPR系统。在一些实施例中，核酸靶向系统的一个或多个元件是来源于包含内源性核酸靶向CRISPR系统的特定生物体。总的来说，核酸靶向系统的特征是在靶序列的位点处促进核酸靶向复合物形成的元件。在形成核酸靶向复合物的情况下，“靶序列”是指指导序列被设计为与其具有互补性的序列，其中靶序列与指导RNA之间的杂交促进了DNA靶向复合物的形成。并不一定需要完全互补，只要存在引起杂交并且促进核酸靶向复合物形成的足够互补性。靶序列可以包括RNA多核苷酸。在一些实施例中，靶序列位于细胞的细胞核或细胞质中。在一些实施例中，该靶序列可以是在真核细胞的细胞器中，例如线粒体或叶绿体。可以用于重组到包含靶序列的靶向座位中的序列或模板被称为“编辑模板”或“编辑RNA”或“编辑序列”。在本发明的多个方面中，外源性模板RNA可以被称为编辑模板。在本发明的一个方面中，重组是同源重组。

典型地，在内源性核酸靶向系统的情况下，核酸靶向复合物(包含杂交至靶序列并与一种或多种核酸靶向效应蛋白复合的指导RNA)的形成产生靶序列中或靶序列附近(例如，从靶序列开始的1、2、3、4、5、6、7、8、9、10、20、50、或更多个碱基对内)的一条或两条DNA链的切割。在一些实施例中，驱动核酸靶向系统的一种或多种元件表达的一种或多种载体被引入到宿主细胞中，以使得该核酸靶向系统的这些元件的表达能引导核酸靶向复合物在一个或多个靶位点处形成。例如，核酸靶向效应蛋白和指导RNA可以各自与单独载体上的单独调节元件可操作地连接。可替代地，从相同或不同调节元件表达的这些元件的两种或更多种可以组合在单一载体中，其中一种或多种另外的载体提供核酸靶向系统在第一载体中不包含的任何组分。组合于单一载体中的核酸靶向系统元件可以布置为任何适合的取向，例如一个元件位于相对于第二元件的5'(“上游”)或相对于该第二元件的3'(“下游”)。一个元件的编码序列可以位于第二元件的编码序列的相同链或相反链上，并且取向为相同或相反方向。在一些实施例中，单一启动子驱动编码核酸靶向效应蛋白的转录物和嵌入一种或多种内含子序列之内(例如，各自在不同内含子中、两种或更多种在至少一个内含子中，或所有在单一内含子中)的指导RNA的表达。在一些实施例中，核酸靶向效应蛋白和指导RNA可操作地连接至同一启动子并且从该同一启动子表达。

指导序列可以被选择为靶向任何靶序列。在一些实施例中，靶序列是基因转录物或mRNA中的序列。

在一些实施例中，靶序列是细胞基因组中的序列。

在一些实施例中，指导序列被选择为减小该指导序列内的二级结构程度。二级结构可以是通过任何适合的多核苷酸折叠算法来确定。一些程序是基于计算最小吉布斯自由能。一种这样的算法的实例是mFold，如通过Zuker和Stiegler(Nucleic Acids Res.[核酸研究]9(1981),133-148)所描述的。另一个示例性折叠算法是维也纳大学的理论化学研究所使用质心结构预测算法开发的在线网站服务器RNAfold(参见例如，A.R.Gruber等人,2008,Cell[细胞]106(1):23-24；以及PA Carr和GM Church,2009,Nature Biotechnology[自然生物技术]27(12):1151-62)。其他算法可以见于美国申请序列号TBA(代理文件号44790.11.2022；广泛参考BI-2013/004A)；通过引用并入本文。

在一些实施例中，还提供了重组模板。重组模板可以是如本文所述的另一种载体的组分，它包含在单独的载体中或者作为单独的多核苷酸提供。在一些实施例中，重组模板被设计为充当同源重组中的模板，例如在由作为核酸靶向复合物的一部分的核酸靶向效应蛋白切割或分解的靶序列内或附近。模板多核苷酸可以具有任何适合的长度，例如长度是约或超过约10、15、20、25、50、75、100、150、200、500、1000或更多个核苷酸。在一些实施例中，模板多核苷酸是与包含该靶序列的多核苷酸部分互补的。当最佳比对时，模板多核苷酸可以与靶序列的一个或多个核苷酸重叠(例如约或超过约1、5、10、15、20、25、30、35、40、45、50、60、70、80、90、100或更多个核苷酸)。在一些实施例中，当模板序列和包含靶序列的多核苷酸最佳比对时，模板多核苷酸最近的核苷酸是在来自靶序列的约1、5、10、15、20、25、50、75、100、200、300、400、500、1000、5000、10000或更多个核苷酸中。

在一些实施例中，核酸靶向效应蛋白是包含一个或多个异源蛋白质结构域的融合蛋白的一部分(例如，除了核酸靶向效应蛋白之外，还有大约或大于约1、2、3、4、5、6、7、8、9、10个或更多个结构域)。在一些实施例中，CRISPR效应蛋白是包含一个或多个异源蛋白质结构域(例如，约或超过约1、2、3、4、5、6、7、8、9、10或更多个结构域，还有CRISPR酶)的融合蛋白的一部分。CRISPR酶融合蛋白可以包含任何另外的蛋白质序列和任选地在任何两个结构域之间的接头序列。可以与CRISPR酶融合的蛋白质结构域的实例包括但不限于表位标签、报道基因序列和具有一种或多种以下活性的蛋白质结构域：甲基化酶活性、去甲基化酶活性、转录激活活性、转录阻遏活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性和核酸结合活性。表位标签的非限制性实例包括组氨酸(His)标签、V5标签、FLAG标签、流感血球凝集素(HA)标签、Myc标签、VSV-G标签、以及硫氧还蛋白(Trx)标签。报道基因的实例包括但不限于，谷胱甘肽-S-转移酶(GST)、辣根过氧化物酶(HRP)、氯霉素乙酰转移酶(CAT)、β-半乳糖苷酶、β-葡萄糖醛酸酶、荧光素酶、绿色荧光蛋白(GFP)、HcRed、DsRed、青色荧光蛋白(CFP)、黄色荧光蛋白(YFP)、以及自身荧光蛋白(包括蓝色荧光蛋白(BFP))。CRISPR酶可以与编码结合DNA分子或结合其他细胞分子的蛋白质或蛋白质片段的基因序列融合，该蛋白质包括但不限于，麦芽糖结合蛋白(MBP)、S-标签、Lex ADNA结合结构域(DBD)融合、GAL4DNA结合结构域融合、以及单纯疱疹病毒(HSV)BP16蛋白融合。可以形成包含CRISPR酶的融合蛋白的一部分的附加结构域描述于US 20110059502，通过引用并入本文。在一些实施例中，标记的CRISPR酶用于识别靶序列的位置。

对于DNA/RNA或DNA/DNA或RNA/RNA或蛋白质/RNA的选项

在一些实施例中，CRISPR系统的组分可以不同形式递送，例如DNA/RNA或RNA/RNA或蛋白质/RNA的组合。例如，Cpf1可以作为DNA编码多核苷酸或RNA-编码多核苷酸或作为蛋白质递送。指导序列可以作为DNA编码多核苷酸或RNA递送。预想所有可能的组合，包括混合递送形式。

在一些实施例中，所有此类组合(DNA/RNA或DNA/DNA或RNA/RNA或蛋白质/RNA)。在一些实施例中，当Cpf1以蛋白质形式递送时，可以将它与一种或多种指导序列预先组装。

纳米线团

此外，CRISPR可以使用纳米线团(nanoclew)递送，例如如Sun W等人,Cocoon-likeself-degradable DNA nanoclew for anticancer drug delivery.[用抗癌药物递送的茧样可自降解DNA线团],J Am Chem Soc.[美国化学学会杂志]2014年10月22日；136(42):14722-5.doi:10.1021/ja5088024.电子版2014年10月13日；或者在Sun W等人,Self-Assembled DNA Nanoclews for the Efficient Delivery of CRISPR-Cas9for GenomeEditing.[用于有效递送基因组编辑的CRISPR-Cas9的自组装DNA纳米线团],Angew ChemInt Ed Engl.[应用化学国际英语版]2015年10月5日；54(41):12029-33.doi:10.1002/anie.201506030.电子版2015年8月27日。

除非另外指明，本发明的实施采用处于本领域技能范围内的免疫学、生物化学、化学、分子生物学、微生物学、细胞生物学、基因组学以及重组DNA的常规技术。参见Sambrook,Fritsch和Maniatis,MOLECULAR CLONING:A LABORATORY MANUAL[分子克隆：实验室手册],第2版(1989)；CURRENT PROTOCOLS IN MOLECULAR BIOLOGY[分子生物学通用方法](F.M.Ausubel等人编辑,(1987))；系列丛书METHODS IN ENZYMOLOGY[酶学方法](AcademicPress,Inc.[学术出版社公司]):PCR 2:APRACTICAL APPROACH[PCR 2：实践方法](M.J.MacPherson,B.D.Hames和G.R.Taylor编辑(1995)),Harlow和Lane编辑(1988)ANTIBODIES,A LABORATORY MANUAL,and ANIMAL CELL CULTURE[抗体、实验室手册和动物细胞培养](R.I.Freshney编辑(1987))。

遗传和表观遗传条件的模型

本发明的一种方法可以用于创建可用于建模和/或研究目的遗传或表观遗传条件的植物、动物或细胞，例如通过目的突变模型或疾病模型。如本文使用的，“疾病”是指受试者的疾病、障碍或适应症。例如，本发明的一种方法可以用于创建包含与疾病相关联的一种或多种核酸序列中的修饰的动物或细胞、或者其中与疾病相关联的一种或多种核酸序列的表达发生改变的植物、动物或细胞。这种核酸序列可以编码疾病相关蛋白质序列或者可以是疾病相关控制序列。因此，应理解在本发明的多个实施例中，植物、受试者、患者、生物体或细胞可以是非人类受试者、患者、生物体或细胞。因此，本发明提供了通过本发明产生的植物、动物或细胞、或其子代。该子代可以是产生的植物或动物的克隆，或者可以由通过与相同种类的其他个体杂交以使另外希望的性状渗入其后代来进行的有性繁殖产生。在多细胞生物体(特别是动物或植物)的情况下，细胞可以是体内或离体的。在其中细胞处于培养中的情况下，如果满足适当的培养条件并且优选地如果细胞适合地适用于此目的(例如干细胞)，则可以建立细胞系。还设想通过本发明产生的细菌细胞系。因此，还设想细胞系。

在一些方法中，该疾病模型可以用于使用该疾病研究中常用的措施研究突变对动物或细胞和疾病的发展和/或进展的影响。可替代地，这种疾病模型适用于研究药物活性化合物对该疾病的影响。

在一些方法中，该疾病模型可以用于评估可能的基因疗法策略的效力。即，疾病相关基因或多核苷酸可以被修饰为使得疾病发展和/或进展受到抑制或减少。具体地说，该方法包括修饰疾病相关基因或多核苷酸，以使得能产生改变的蛋白质并因此使得动物或细胞具有改变的应答。因此，在一些方法中，基因修饰动物可以与易于发展疾病的动物比较，以使得可以评估基因疗法事件的作用。

在另一个实施例中，本发明提供了开发调控与疾病基因相关联的细胞信号传导事件的生物活性剂的方法。该方法包括使测试化合物与包含驱动一种或多种CRISPR酶表达的一种或多种载体和连接至指导序列的同向重复序列的细胞接触；并且检测指示与例如细胞所含有的疾病相关基因中的突变相关联的细胞信号传导事件的减少或增加的读出变化。

细胞模型或动物模型可以与本发明用于筛查细胞功能变化的方法组合来构造。这种模型可以用于研究通过本发明的CRISPR复合物修饰的基因组序列对目的细胞功能的影响。例如，细胞功能模型可以用研究修饰的基因组序列对细胞内信号传导或细胞外信号传导的影响。可替代地，细胞功能模型可以用研究修饰的基因组序列对感官知觉的影响。在一些此类模型中，修饰模型中与信号传导生物化学途径相关联的一个或多个基因组序列。

已特别研究了几种疾病模型。这些包括从新自闭症危险基因CHD8、KATNAL2和SCN2A；以及综合征自闭症(安格曼综合征)基因UBE3A。这些基因和所得自闭症模型当然是优选的，但足以显示本发明对基因和相应模型的广泛适用性。当与信号传导生物化学途径相关联的一个或多个基因组序列与候选药剂接触时，这些基因组序列的改变的表达可以是通过评定测试模型细胞与对照细胞之间相应基因的mRNA水平差异来确定。可替代地，与信号传导生物活性途径相关联的序列的差异表达是通过检测编码的多肽或基因产物的水平的差异来确定的。

为了评定mRNA转录物或相应多核苷酸水平的试剂诱导的改变，样品中含有的核酸首先根据本领域的标准方法来提取。例如，mRNA可以根据Sambrook等人(1989)所列出的程序使用不同的分解酶或化学品溶液来分离，或者通过核酸结合树脂遵循制造商提供的附带说明来提取。然后通过扩增程序或常规杂交测定(例如，RNA印迹分析)根据本领域广泛已知的方法或者基于本文举例说明的方法来检测提取的核酸样品中含有的mRNA。

出于本发明的目的，扩增意指采用能够以适当保真度复制靶序列的引物和聚合酶的任何方法。扩增可以是通过天然或重组DNA聚合酶例如TaqGold^TM、T7DNA聚合酶、大肠杆菌DNA聚合酶的克列诺片段、以及逆转录酶。一种优选扩增方法是PCR。具体地说，分离的RNA可以经受逆转录测定，该测定与量化聚合酶链反应(RT-PCR)缔合以便量化与信号传导生物化学途径相关联的序列的表达水平。

基因表达水平的检测可以是在扩增测定中实时进行的。在一个方面中，扩增的产物可以用荧光DNA结合剂直接可视化的，这些结合剂包括但不限于DNA嵌入剂和DNA沟结合剂。因为结合到双链DNA分子中的嵌入剂的量典型地与扩增的DNA产物的量成比例，所以可以通过使用本领域的常规光学系统量化嵌入染料的荧光来确定扩增产物的量。适用于此应用的DNA结合染料包括SYBR绿、SYBR蓝、DAPI、碘化丙啶、Hoeste、SYBR金、溴化乙锭、吖啶、原黄素、吖啶橙、吖啶黄、氟香豆素、玫瑰树碱、道诺霉素、氯喹、远端霉素D、色霉素、胡米溴铵(homidium)、光辉霉素、聚吡啶钌、安曲霉素、以及类似物。

在另一个方面中，其他荧光标记例如序列特异性探针可以用于扩增反应中，以帮助检测和量化扩增产物。基于探针的定量扩增依赖于希望的扩增产物的序列特异性检测。它利用荧光的靶特异性探针(例如，探针)，从而获得增加的特异性和灵敏度。本领域中已建立了用于进行基于探针的定量扩增的方法并且在美国专利号5,210,015中教授了这些方法。

在又另一个方面中，可以使用杂交探针进行常规杂交测定，这些杂交探针与和信号传导生物化学途径相关联的序列享有序列同源性。典型地，在杂交反应中允许探针与和来源于测试受试者的生物样品内的信号传导生物化学途径相关联的序列形成稳定的复合物。本领域技术人员将了解的是，在使用反义链作为探针核酸的情况下，样品中提供的靶多核苷酸被选择为与反义核酸的序列互补。相反地，在核苷酸探针是有义核酸的情况下，靶多核苷酸被选择为与有义核酸的序列互补。

杂交可以是在不同严格性的条件下进行。用于实践本发明的适合杂交条件是使得探针与和信号传导生物化学途径相关联的序列之间的识别相互作用是足够特异的且足够稳定的。增加杂交反应严格性的条件是本领域广泛已知和公开的。参见例如，(Sambrook等人,(1989)；Nonradioactive In Situ Hybridization Application Manual[非辐射原位杂交应用手册],Boehringer Mannheim[德国宝灵曼公司],第二版)杂交测定可以使用任何固相支撑体上固定的探针来形成，该固相支撑体包括但不限于硝化纤维、玻璃、硅、以及各种各样的基因阵列。优选的杂交测定市在高密度基因芯片上进行的，如美国专利号5,445,934所述的。

对于在杂交测定过程中形成的探针靶标复合物的常规检测，核苷酸探针被轭合至可检测标记。适用于本发明的可检测标记包括通过光化学手段、生物化学手段、光谱手段、免疫化学手段、电学手段、光学手段或化学手段可检测的任何组合物。多种多样的适当可检测标记是本领域已知的，它们包括荧光标记或化学发光标记、放射性同位素标记、酶标记或其他配体。在优选实施例中，将可能希望采用荧光标记或酶标记，例如地高辛配基、β半乳糖苷酶、脲酶、碱性磷酸酶或过氧化物酶、抗生物素蛋白/生物素复合物。

用于检测或量化杂交强度的检测方法将典型地取决于以上选择的标记。例如，放射性标记可以是使用摄影胶片或感光成像仪检测的。荧光标记可以是使用检测发射光的光探测器检测和量化的。酶标记典型地是通过提供具有底物的酶并测量由酶对该底物的作用产生的反应产物来检测的；并且最后比色标记是通过简单可视化染色标记来检测的。

与信号传导生物化学途径相关联的序列表达的药剂诱导的变化也可以通过检查相应基因产物来确定。测定蛋白质水平典型地涉及a)将生物样品中含有的蛋白质与特异性相关联和信号生传导生物化学途径相关联的蛋白质的药剂接触；并且(b)鉴定所形成的任何药剂:蛋白质复合物。本文实施例的一个方面中，特异性结合与信号传导生物化学途径相关联的蛋白质的药剂是抗体，优选地是单克隆抗体。

该反应是通过以下来进行的：在将允许药剂与和信号传导生物化学途径相关联的蛋白质之间形成复合物的条件下，将该药剂与和来源于测试样品的信号传导生物化学途径相关联的蛋白质样品接触。复合物的形成可以是根据本领域的程序直接或间接检测的。在直接检测方法中，这些药剂供应有可检测标记并且未反应的药剂可以从该复合物中去除；剩余标记的量因此指示所形成的复合物的量。对于这种方法，优选的是选择甚至在严格洗涤条件过程中仍然附接至这些药剂的标记。优选的是，该标记并不干扰结合反应。在替代方案中，间接检测程序可以使用含有以化学方式或酶方式引入的标记的药剂。希望的标记通常并不干扰所得药剂:多肽复合物的结合或稳定性。然而，该标记典型地被设计为易于接近抗体，以有效结合并因此生成可检测信号。

适用于检测蛋白质水平的多种多样的标记是本领域已知的。非限制性实例包括放射性同位素、酶类、胶态金属、荧光化合物、生物发光化合物、以及化学发光化合物。

在结合反应过程中形成的药剂:多肽复合物的量可以是通过标准量化测定来量化的。如上所述，药剂:多肽复合物的形成可以是通过保留在结合位点处的标记的量来直接测量的。在一个替代方案中，测试与信号传导生物化学途径相关联的蛋白质与标记的类似物竞争特异性药剂上的结合位点的能力。在此竞争性测定中，捕获的标记的量与和存在于测试样品中的信号传导生物化学途径相关联的蛋白质序列的量成反比。

用于基于以上列出的一般原则进行蛋白质分析的多种技术是本领域可用的。这些技术包括但不限于，放射免疫测定、ELISA(酶联免疫放射测定法)、“夹层”免疫测定、免疫放射测定法、原位免疫测定(例如使用胶态金、酶或放射性同位素标记)、蛋白印迹分析、免疫沉淀测定、免疫荧光测定、以及SDS-PAGE。

特异性识别或结合与信号传导生物化学途径相关联的蛋白质的抗体是优选用于进行上述蛋白质分析。当希望时，可以使用识别特定类型的翻译后修饰(例如信号传导生物化学途径诱导的修饰)的抗体。翻译后修饰包括但不限于，糖基化、脂化、乙酰化、以及磷酸化。这些抗体可以从商业供应商购买。例如，特异性识别酪氨酸磷酸化蛋白质的抗磷酸酪氨酸抗体可从许多供应商获得，这些供应商包括英杰公司(Invitrogen)和珀金埃尔默公司(Perkin Elmer)。抗磷酸酪氨酸抗体特别适用于检测响应于ER胁迫而在其酪氨酸残基上有差异地磷酰化的蛋白质。此类蛋白质包括但不限于，真核生物翻译起始因子2α(eIF-2α)。可替代地，这些抗体可以是使用多克隆抗体或单克隆抗体技术通过用展示希望的翻译后修饰的靶蛋白免疫宿主动物或抗体产物细胞来生成。

在实践主题方法中，可能希望的是辨别与信号传导生物化学途径相关联的蛋白质在不同身体组织、不同细胞类型和/或不同亚细胞结构中的表达模式。这些研究可以通过使用能够结合蛋白质标记的组织特异性、细胞特异性或亚细胞结构特异性抗体来进行，这些蛋白质标记优先在某些组织、细胞类型或亚细胞结构中表达。

与信号传导生物化学途径相关联的基因的改变的表达也可以是通过检查基因产物活性相对于对照细胞的变化来确定。用于与信号传导生物化学途径相关联的蛋白质的药剂诱导性活性变化的测定将依赖于研究中的生物活性和/或信号转导途径。例如，在该蛋白质是激酶的情况下，该蛋白质使一种或多种下游底物磷酸化的能力的变化可以是通过本领域已知的多种测定来确定的。代表性测定包括但不限于，使用识别磷酸化蛋白的抗体例如抗磷酸酪氨酸抗体的免疫印迹和免疫沉淀反应。此外，激酶活性可以是通过高流通量化学发光测定例如AlphaScreen^TM(可商购自珀金埃尔默公司(Perkin Elmer))和eTag^TM测定(Chan-Hui等人(2003)Clinical Immunology[临床免疫学]111:162-174)来检测的。

在与信号传导生物化学途径相关联的蛋白质是导致细胞内pH条件波动的信号级联放大的一部分的情况下，pH敏感分子例如荧光pH染料可以用作报道分子。在另一个实例中，在与信号传导生物化学途径相关联的蛋白质是离子通道的情况下，可以监测膜电位和/或细胞内离子浓度的波动。许多商用试剂盒和高流通量设备是特别适用于快速且强劲地筛选离子通道的调节剂。代表性仪器包括FLIPRTM(分子机器公司(Molecular Devices,Inc.))和VIPR(极光生物科学公司(Aurora Biosciences))。这些仪器能够同时检测微板的1000个样品孔中的反应并且在一秒或甚至一微秒内提供实时测量值和功能数据。

在实践本文披露的方法中的任一个时，可以经由本领域已知的一种或多种方法来将适合的载体引入到细胞或胚胎中，这些方法包括但不限于，显微注射、电穿孔、声孔效应、基因枪、磷酸钙介导的转染、阳离子转染、脂质体转染、树枝状转染、热激转染、核转染、磁转染、脂转染、刺穿转染、光学转染、专有剂增强的核酸摄取、以及经由脂质体、免疫脂质体、病毒体或人工病毒体递送。在一些方法中，载体通过显微注射引入到胚胎中。这种或这些载体可以显微注射到胚胎的细胞核或细胞质中。在一些方法中，这种或这些载体可以通过核转染引入到细胞中。

CRISPR复合物的靶多核苷酸可以是对于真核细胞而言内源或外源的任何多核苷酸。例如，靶多核苷酸可以是驻留在真核细胞的细胞核内的多核苷酸。靶多核苷酸可以是编码基因产物(例如，蛋白质)的序列或非编码序列(例如，调节多核苷酸或无用DNA)。

靶多核苷酸的实例包括与信号传导生物化学途径相关联的序列，例如信号传导生物化学途径相关联基因或多核苷酸。靶多核苷酸的实例包括疾病相关基因或多核苷酸。“疾病相关”基因或多核苷酸是指与非疾病对照的组织或细胞相比，在来源于疾病影响的组织的细胞中产生异常水平或异常形式的转录产物或翻译产物的任何基因或多核苷酸。它可以是以异常高的水平表达的基因；它可以是以异常低的水平表达的基因，其中改变的表达与疾病的发生和/或进展相关。疾病相关基因还是指具有一个或多个突变或直接负责或与一个或多个负责疾病的病因学的基因连锁不平衡的遗传变异的基因。转录或翻译的产物可以是已知或未知的，并且可以是处于正常或异常水平。

CRISPR复合物的靶多核苷酸可以是对于真核细胞而言内源或外源的任何多核苷酸。例如，靶多核苷酸可以是驻留在真核细胞的细胞核内的多核苷酸。靶多核苷酸可以是编码基因产物(例如，蛋白质)的序列或非编码序列(例如，调节多核苷酸或无用DNA)。在不希望受理论束缚的情况下，认为靶序列应该与PAM(原型间隔区相邻基序)缔合；即，由CRISPR复合物识别的短序列。对于PAM的精确序列和长度要求根据所使用的CRISPR酶而不同，但PAM典型地是与原型间隔区(即，靶序列)相邻的2-5个碱基对序列。PAM序列的实例给出在以下实例部分中，并且技术人员将能够鉴定与给定的CRISPR酶一起使用的其他PAM序列。此外，PAM相互作用(PI)结构域的工程化可以允许编程PAM特异性，提高靶位点识别保真度，并且增加Cas(例如Cas9)基因组工程化平台的多功能性。Cas蛋白例如Cas9蛋白可以被工程化以改变其PAM特异性，例如如Kleinstiver BP等人Engineered CRISPR-Cas9nucleaseswith altered PAM specificities.[具有改变的PAM特异性的工程化CRISPR-Cas9]Nature[自然].2015年7月23日；523(7561):481-5.doi:10.1038/nature14592中所述的。

CRISPR复合物的靶多核苷酸可以包括多个疾病相关基因和多核苷酸以及信号传导生物化学途径相关基因和多核苷酸，如以下中列出的：美国临时专利申请61/736,527和61/748,427，这两份专利申请分别具有广泛的参考文献BI-2011/008/WSGR文件号44063-701.101和BI-2011/008/WSGR文件号44063-701.102，这两份专利申请均题为SYSTEMSMETHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION[用于序列操纵的系统方法和组合物]，它们分别在2012年12月12日和2013年1月2日提交，以及PCT申请PCT/US 2013/074667，该申请题为DELIVERY,ENGINEERING AND OPTIMIZATION OF SYSTEMS,METHODS ANDCOMPOSITIONS FOR SEQUENCE MANIPULATION AND THERAPEUTIC APPLICATIONS[用于序列操纵和治疗应用的系统、方法和组合物的递送、工程化和优化]且在2013年12月12日提交，所有这些专利申请的内容均通过引用以其整体并入本文。

全基因组敲除筛选

本文所述的CRISPR蛋白质和系统可以用于进行有效且性价比高的功能基因组筛选。此类筛选可以利用基于CRISPR效应蛋白的全基因组文库。此类筛选和文库可以提供对基因功能的确定，涉及细胞途径基因，并且基因表达中的任何改变可以如何形成特定生物过程。本发明的一个优点是CRISPR系统避免了脱靶结合及其产生的副作用。这是使用安排为对靶DNA具有高度序列特异性的系统来实现的。在本发明的优选实施例中，CRISPR效应蛋白复合物是Cpf1效应蛋白复合物。

在本发明的实施例中，全基因组文库可以包含多个本文所述的Cpf1指导RNA，这些RNA包含能够靶向真核细胞群体中的多个基因组座位中的多个靶序列的指导序列。细胞群体可以是胚胎干细胞(ES)群体。基因组座位中的靶序列可以是非编码序列。非编码序列可以是内含子、调控序列、剪接位点、3’UTR、5’UTR、或多聚腺苷酸化信号。一种或多种基因产物的基因功能可以是通过所述靶向来改变。该靶向可以导致基因功能敲除。基因产物的靶向可以包含超过一个的指导RNA。基因产物可以被每个基因2、3、4、5、6、7、8、9或10个指导RNA，优选3至4个指导RNA靶向。脱靶修饰可以是通过采用由Cpf1效应蛋白复合物生成的交错双链断裂或者通过利用类似于CRISPR-Cas9系统中使用的方法来最小化(参见例如，DNAtargeting specificity of RNA-guided Cas9nucleases.[RNA-指导Cas9核酸酶的DNA靶向特异性]Hsu,P.,Scott,D.,Weinstein,J.,Ran,FA.,Konermann,S.,Agarwala,V.,Li,Y.,Fine,E.,Wu,X.,Shalem,O.,Cradick,TJ.,Marraffini,LA.,Bao,G.,和Zhang,F.NatBiotechnol[自然生物技术]doi:10.1038/nbt.2647(2013))，通过引用并入本文。该靶向可以是针对约100个或更多个序列。该靶向可以是针对约1000个或更多个序列。该靶向可以是针对约20,000个或更多个序列。该靶向可以是针对整个基因组。该靶向可以是针对集中于相关或希望的途径中的一组靶序列。该途径可以是免疫途径。该途径可以是细胞分裂途径。

本发明的一个方面包括全基因组文库，该全基因组文库可以包含多个Cpf1指导RNA，这些指导RNA可以包含能够靶向多个基因组座位中的多个靶序列的指导序列，其中所述靶向导致基因功能的敲除。此文库可以潜在地包含靶向生物体基因组中的各个和每个基因的指导RNA。

在本发明的一些实施例中，生物体或受试者是真核生物(包括哺乳动物，包括人类)或非人类真核生物或非人类动物或非人类哺乳动物。在一些实施例中，生物体或受试者是非人类动物，并且可以是节肢动物，例如昆虫，或者可以是线虫。在本发明的一些方法中，生物体或受试者是植物。在本发明的一些方法中，生物体或受试者是哺乳动物或非人类哺乳动物。非人类哺乳动物可以是例如啮齿动物(优选地小鼠或大鼠)、有蹄动物或灵长类动物。在本发明的一些方法中，生物体或受试者是藻类，包括微藻类，或者是真菌类。

基因功能的敲除可以包括：在细胞群体的每个细胞中引入包含工程化非天然存在的Cpf1效应蛋白系统的一种或多种载体的一个载体系统，该效应蛋白系统包含I.Cpf1效应蛋白和II.一个或多个指导RNA，其中组分I和组分II可以是处于该系统的相同或不同载体上；将组分I和II整合到每个细胞中，其中该指导序列靶向每个细胞中的独特基因，其中该Cpf1效应蛋白可操作地连接至调节元件，其中在转录时，包含指导序列的该指导RNA引导Cpf1效应蛋白系统与在该独特基因的基因组座位中的靶序列的序列特异性结合；通过Cpf1效应蛋白诱导基因组座位切割；并且确认细胞群体的每个细胞中的多个独特基因中的不同敲除突变，从而生成基因敲除细胞文库。本发明包括细胞群体是真核细胞群体，并且在优选的实施例中，细胞群体是胚胎干(ES)细胞群体。

该一种或多种载体可以是质粒载体。该载体可以是包含Cpf1效应蛋白、gRNA和任选地进入靶细胞中的选择标记的单一载体。在不受理论束缚的情况下，通过单一载体同时递送Cpf1效应蛋白和gRNA的能力使得能够应用于任何目的细胞类型，而不需要首先生成表达Cpf1效应蛋白的细胞系。调节元件可以是诱导型启动子。诱导型启动子可以是多西环素诱导型启动子。在本发明的一些方法中，指导序列的表达是处于T7启动子的控制下并且是由T7聚合酶的表达来驱动。不同敲除突变的确认可以是通过全外显子组测序进行的。敲除突变可以在100个或更多个独特基因中实现。敲除突变可以在1000个或更多个独特基因中实现。敲除突变可以在20,000个或更多个独特基因中实现。敲除突变可以在整个基因组中实现。基因功能的敲除可以在多个独特基因中实现，这些独特基因在特定生理途径或条件下起作用。该途径或条件可以是免疫途径或条件。该途径或条件可以是细胞分裂途径或条件。

本发明还提供了包含本文提及的全基因组文库的试剂盒。该试剂盒可以包含单个容器，该容器包含含有本发明的文库的载体或质粒。该试剂盒还可以包含含有独特Cpf1效应蛋白系统指导RNA的选择的面板，该指导RNA包含来自本发明的文库的指导序列，其中该选择指示特定生理条件。本发明包括的是，靶向是针对约100个或更多个序列、约1000或更多个序列或者约20,000个或更多个序列或整个基因组。另外，一组靶序列可以集中于相关或希望的途径中，例如免疫途径或细胞分裂。

在本发明的另一个方面中，Cpf1效应蛋白可以包含一个或多个突变并且可以在融合或未融合至功能结构域的情况下用作通用DNA结合蛋白。这些突变可以是人工引入的突变或者增功能或失功能突变。这些突变已如本文所述地进行表征。在本发明的一个方面中，功能结构域可以是转录激活结构域，该结构域可以是VP64。在本发明的其他方面中，功能结构域可以是转录阻遏物结构域，该结构域可以是KRAB或SID4X。本发明的其他方面涉及与结构域融合的突变型Cpf1效应蛋白，这些结构域包括但不限于，转录激活因子、阻遏物、重组酶、易位酶、组蛋白重塑物、脱甲基化酶、DNA甲基转移酶、隐花色素、光诱导型/控制型结构域或者化学诱导型/控制型结构域。本发明的一些方法可以包括诱导靶基因的表达。在一个实施例中，通过靶向真核细胞群体中的多个基因组座位中的多个靶序列诱导表达是通过使用功能结构域进行的。

用于CRISPR-Cas9系统中的方法适用于利用Cpf1效应蛋白复合物实践本发明并且参考以下：

Genome-Scale CRISPR-Cas9Knockout Screening in Human Cells[人类细胞中的基因组规模的CRISPR-Cas9敲除筛选]Shalem,O.,Sanjana,NE.,Hartenian,E.,Shi,X.,Scott,DA.,Mikkelson,T.,Heckl,D.,Ebert,BL.,Root,DE.,Doench,JG.,Zhang,F.Science[科学]12月12日(2013)。[电子版先于印刷版]；以最终编辑形式出版为：Science[科学].2014年1月3日；343(6166):84-87。

Shalem等人涉及一种探察全基因组规模的基因功能的新方式。他们的研究显示具有64,751个独特指导序列的基因组规模的CRISPR-Cas9敲除(GeCKO)文库靶向的18,080个基因的递送能够在人类细胞中进行阴性和阳性选择筛选。首先，作者们证实使用GeCKO文库鉴定了癌症和多能干细胞中的细胞活力所必须的基因。接着，在黑色素瘤模型中，作者们筛选其丧失涉及对维罗非尼(一种抑制突变体蛋白激酶BRAF的治疗剂)的抗性的基因。他们的研究显示最高评级的候选物包括先前验证的基因NF1和MED12以及新颖命中NF2、CUL3、TADA2B、以及TADA1。作者们在靶向相同基因的独立的指导RNA与高命中确认率之间观察到高水平的一致性，并且因此证实允许用Cas9进行基因组规模筛选。

还参考美国专利公开号US 20140357530；以及PCT专利公开WO2014093701，通过引用特此并入本文。还参考2015年10月22日题为“Researchers identify potentialalternative to CRISPR-Cas genome editing tools:New Cas enzymes shed light onevolution of CRISPR-Cas systems[研究者鉴定了CRISPR-Cas基因组编辑工具的可潜在替代方案：新Cas酶阐明CRISPR-Cas系统的进化]的NIH通讯稿，该通讯稿通过引用并入本文。

功能变化和筛选

在另一个方面中，本发明提供了一种功能评定和筛选基因的方法。使用本发明的CRISPR系统精确递送功能结构域以通过精确改变特异性目的座位上的甲基化位点来激活或阻遏基因或者改变外遗传状态，这可以与一个或多个指导RNA一起应用于单个细胞或细胞群体或者与文库一起应用于离体或体内细胞库中的基因组，包括给予或表达包含多个指导RNA(gRNA)的文库并且其中该筛选进一步包括使用Cpf1效应蛋白，其中包含该Cpf1效应蛋白的CRISPR复合物被修饰为包含异源功能结构域。在一个方面中，本发明提供了一种用于筛选基因组的方法，该方法包括向宿主给予文库或者在宿主体内表达文库。在一个方面中，本发明提供了如本文讨论的方法，该方法进一步包括向宿主给予激活因子或在宿主中表达激活因子。在一个方面中，本发明提供了一种如本文所讨论的方法，其中该激活因子附接至Cpf1效应蛋白。在一个方面中，本发明提供了一种如本文所讨论的方法，其中该激活因子附接至Cpf1效应蛋白的N末端或C末端。在一个方面中，本发明提供了一种如本文所讨论的方法，其中该激活因子附接至gRNA环。在一个方面中，本发明提供了如本文讨论的方法，该方法进一步包括向宿主给予阻遏物或在宿主中表达阻遏物。在一个方面中，本发明提供了如本文所讨论的方法，其中该筛选包括影响并检测基因激活、基因抑制或座位中的切割。

在一个方面中，本发明提供了有效中靶活性并且最小化脱靶活性。在一个方面中，本发明提供了由Cpf1效应蛋白进行的有效中靶切割并且最小化由Cpf1效应蛋白进行的脱靶切割。在一个方面中，本发明提供了在无DNA切割情况下Cpf1效应蛋白在基因座位处的特异性结合。因此，在一个方面中，本发明提供了靶特异性基因调节。在一个方面中，本发明提供了在无DNA切割情况下Cpf1效应蛋白在基因座位处的特异性结合。因此，在一个方面中，本发明使用单一Cpf1效应蛋白提供在一个基因座位处的切割和在一个不同的基因座位处的基因调节。在一个方面中，本发明使用一种或多种Cpf1效应蛋白和/或酶提供多个靶标的正交激活和/或抑制和/或切割。

在一个方面中，本发明提供了如本文所讨论的方法，该方法包括递送Cpf1效应蛋白复合物或其一种或多种组分或对其编码的一个或多个核酸分子，其中所述一个或多个核酸分子可操作地连接至一个或多个调控序列并且在体内表达。在一个方面中，本发明提供了如本文所讨论的方法，其中该体内表达是经由慢病毒、腺病毒或AAV。在一个方面中，本发明提供了如本文所讨论的方法，其中该递送是经由粒子、纳米粒子、脂质或细胞穿透肽(CPP)。

在一个方面中，本发明提供了一对包含Cpf1效应蛋白的CRISPR复合物，每个复合物包含含有能够与细胞中目的基因组座位中的靶序列杂交的指导序列的指导RNA(gRNA)，其中每个gRNA的至少一个环是通过插入结合一种或多种衔接体蛋白质的一种或多种不同RNA序列来修饰的，并且其中该衔接体蛋白质与一个或多个功能结构域缔合，其中每个Cpf1效应蛋白复合物的每个gRNA包含具有DNA切割活性的功能结构域。在一个方面中，本发明提供了如本文所讨论的成对的Cpf1效应蛋白复合物，其中DNA切割活性是归因于Fok1核酸酶。

在一个方面中，本发明提供了用于切割目的基因组座位中的靶序列的方法，该方法包括向细胞递送Cpf1效应蛋白复合物或其一种或多种组分或对其编码的一个或多个核酸分子，其中所述一个或多个核酸分子可操作地连接至一个或多个调控序列并且在体内表达。在一个方面中，本发明提供了如本文所讨论的方法，其中该递送是经由慢病毒、腺病毒或AAV。在一个方面中，本发明提供了如本文所讨论的方法或如本文所讨论的成对的Cpf1效应蛋白复合物，其中该对中的第一复合物的靶序列是处于双链DNA的第一条链上并且该对中的第二复合物的靶序列是处于双链DNA的第二条链上。在一个方面中，本发明提供了如本文所讨论的方法或如本文所讨论的成对的Cpf1效应蛋白复合物，其中该第一复合物和该第二复合物的靶序列彼此接近，使得DNA以促进同源定向修复的方式切割。在一个方面中，本文的方法可以进一步包括将模板DNA引入到细胞中。在一个方面中，本文的方法或者本文的成对的Cpf1效应蛋白复合物可以涉及其中每个Cpf1效应蛋白复合物具有Cpf1效应酶，该Cpf1效应酶被突变为使得它具有不超过未突变Cpf1效应酶的核酸酶活性的约5％的核酸酶活性。

在一个方面中，本发明提供了如本文所讨论的文库、方法或复合物，其中gRNA被修饰为具有至少一个非编码功能环，例如其中该至少一个非编码功能环是具有阻遏作用的；例如，其中该至少一个非编码功能环包含Alu。

在一个方面中，本发明提供了用于改变或修饰基因产物的表达的方法。所述方法可以包括将工程化的非天然存在的CRISPR系统引入到含有并表达编码基因产物的DNA分子的细胞中，该CRISPR系统包含Cpf1效应蛋白和靶向DNA分子的指导RNA，由此该指导RNA靶向编码基因产物的DNA分子并且该Cpf1效应蛋白切割编码该基因产物的DNA分子，由此改变该基因产物的表达；并且其中Cpf1效应蛋白和指导RNA并不一起天然存在。本发明包括含有连接至同向重复序列的指导序列的指导RNA。

在一些实施例中，一个或多个功能结构域与Cpf1效应蛋白缔合。在一些实施例中，一个或多个功能结构域与衔接体蛋白质，例如如与Konnerman等人(Nature[自然]517,583-588,2015年1月29日)的修饰指导序列一起使用。在一些实施例中，一个或多个功能结构域与无效gRNA(dRNA)缔合。在一些实施例中，与活性Cpf1效应蛋白的dRNA复合物通过基因座位上的功能结构域来引导基因调节，而gRNA通过另一个座位处的活性Cpf1效应蛋白来引导DNA切割，例如由Dahlman等人,2015,Orthogonal gene control with a catalyticallyactive Cas9nuclease[使用催化活性的Cas9核酸酶的正交基因控制],Nat.Biotechnol.[自然生物技术]33(11):1159-61在CRISPR-Cas9系统中类似描述的。在一些实施例中，dRNA被选择为与脱靶调节相比使对目的基因座位的调节选择性最大化。在一些实施例中，dRNA被选择为最大化靶基因调节并且最小化靶切割。

出于以下讨论的目的，提及功能结构域可以是与Cpf1效应蛋白缔合的功能结构域或者与衔接体蛋白质缔合的功能结构域。

在本发明的实践中，可以在不与Cpf1蛋白碰撞的情况下通过插入可以募集衔接体蛋白质的一个或多个不同RNA环或一个或多个不同序列扩展gRNA的环，这些衔接体蛋白质可以结合一个或多个不同RNA环或者一个或多个不同序列。这些衔接体蛋白质可以包括但不限于，存在于各种噬菌体外壳蛋白内的正交RNA结合蛋白/适配体组合。此类外壳蛋白的列表包括但不限于：Qβ、F2、GA、fr、JP501、M12、R17、BZ13、JP34、JP500、KU1、M11、MX1、TW18、VK、SP、FI、ID2、NL95、TW19、AP205、φCb5、φCb8r、φCb12r、φCb23r、7s和PRR1。这些衔接体蛋白质或正交RNA结合蛋白可以进一步募集包含一个或多个功能结构域的效应蛋白或融合。在一些实施例中，功能结构域可以选自下组，该组由以下组成：易位酶结构域、整合酶结构域、重组酶结构域、解离酶领域、转化酶结构域、蛋白酶结构域、DNA甲基转移酶结构域、DNA羟甲基酶结构域、DNA脱甲基酶结构域、组蛋白乙酰化酶结构域、组蛋白脱乙酰化酶结构域、核酸酶域、阻遏物结构域、激活因子结构域、核定位信号结构域、转录调节蛋白质(或转录复合物募集)结构域、细胞摄取活性相关结构域、核酸结合结构域、抗体呈递结构域、组蛋白修饰酶、组蛋白修饰酶的募集物；组蛋白修饰酶、组蛋白甲基转移酶、组蛋白脱甲基化酶、组蛋白激酶、组蛋白磷酸酶、组蛋白核糖基酶、组蛋白脱核糖基酶、组蛋白泛素酶、组蛋白脱泛素酶、组蛋白生物素酶以及组蛋白尾蛋白酶的抑制剂。在一些优选实施例中，功能结构域是转录激活结构域，例如但不限于，VP64、p65、MyoD1、HSF1、RTA、SET7/9或组蛋白乙酰转移酶。在一些实施例中，功能结构域是转录阻遏结构域，优选地KRAB。在一些实施例中，转录阻遏结构域是SID或SID的串联体(例如SID4X)。在一些实施例中，功能结构域是表观遗传修饰结构域，以便提供表观遗传修饰酶。在一些实施例中，功能结构域是激活结构域，它可以是P65激活结构域。

在一些实施例中，一个或多个功能结构域是NLS(核定位序列)或NES(核输出信号)。在一些实施例中，一个或多个功能结构域是转录激活结构域，包括VP64、p65、MyoD1、HSF1、RTA、SET7/9以及组蛋白乙酰转移酶。本文提及的其他激活(或激活因子)结构域(关于与CRISPR酶缔合的那些结构域)包括任何已知的转录激活结构域并且确切的是VP64、p65、MyoD1、HSF1、RTA、SET7/9或组蛋白乙酰转移酶。

在一些实施例中，一个或多个功能结构域是转录阻遏物结构域。在一些实施例中，转录阻遏物结构域是KRAB结构域。在一些实施例中，转录阻遏物结构域是NuE结构域、NcoR结构域、SID结构域或SID4X结构域。

在一些实施例中，一个或多个功能结构域具有一种或多种活性，包括甲基化酶活性、脱甲基化酶活性、转录激活活性、转录阻遏活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性、DNA切割活性、DNA整合活性或核酸结合活性。

在一些实施例中，组蛋白修饰结构域也是优选的。以下讨论了示例性组蛋白修饰结构域。易位酶结构域、HR(同源重组)机构结构域、重组酶结构域、和/或整合酶结构域作为本发明功能结构域也是优选的。在一些实施例中，DNA整合活性包括HR机构结构域、整合酶结构域、重组酶结构域和/或易位酶结构域。在一些实施例中，组蛋白乙酰转移酶是优选的。

在一些实施例中，DNA切割活性是归因于核酸酶。在一些实施例中，核酸酶包括Fok1核酸酶。参见，“Dimeric CRISPR RNA-guided FokI nucleases for highly specificgenome editing[用于高特异性基因组编辑的二聚CRISPR RNA指导FokI核酸酶]”,Shengdar Q.Tsai,Nicolas Wyvekens,Cyd Khayter,Jennifer A.Foden,Vishal Thapar,Deepak Reyon,Mathew J.Goodwin,Martin J.Aryee,J.Keith Joung NatureBiotechnology[自然生物技术]32(6):569-77(2014)，它涉及在人类细胞中识别扩展序列并能以高效率编辑内源性基因的二聚RNA指导FokI核酸酶。

在一些实施例中，一个或多个功能结构域附接至Cpf1效应蛋白，以使得在结合sgRNA和靶标时，功能结构域是呈允许功能结构域以其属性功能起作用的空间取向。

在一些实施例中，一个或多个功能结构域附接至衔接体蛋白质，以使得在Cpf1效应蛋白结合gRNA和靶标时，功能结构域是处于允许功能结构域以其属性功能起作用的空间定向中。

在一个方面中，本发明提供了如本文所讨论的组合物，其中一个或多个功能结构域经由如本文所讨论的接头、任选地GlySer接头附接至Cpf1效应蛋白或衔接体蛋白质。

内源性转录阻遏常常是通过染色质修饰酶例如组蛋白甲基转移酶(HMT)和脱乙酰化酶(HDAC)介导的。阻遏组蛋白效应物结构域是已知的并且下文提供了一个示例性列表。在该示例性表格中，优先使用有助于有效病毒包装(例如经由AAV)的小型蛋白质和功能截短物。然而，总的来说，这些结构域可以包括HDAC、组蛋白甲基转移酶(HMT)和组蛋白乙酰转移酶(HAT)抑制剂、以及HDAC和HMT募集蛋白。在一些实施例中，功能结构域可以是或者包括HDAC效应物结构域、HDAC募集物效应物结构域、组蛋白甲基转移酶(HMT)效应物结构域、组蛋白甲基转移酶(HMT)募集物效应物结构域、或组蛋白乙酰转移酶抑制剂效应物结构域。

因此，本发明的阻遏物结构域可以是选自组蛋白甲基转移酶(HMT)、组蛋白脱乙酰酶(HDAC)、组蛋白乙酰转移酶(HAT)抑制剂、以及HDAC和HMT募集蛋白。

HDAC结构域可以是上表中那些中的任一个，即：HDAC8、RPD3、MesoLo4、HDAC11、HDT1、SIRT3、HST2、CobB、HST2、SIRT5、Sir2A、或SIRT6。

在一些实施例中，功能结构域可以是HDAC募集物效应物结构域。优选实例包括以下表中的那些，即MeCP2、MBD2b、Sin3a、NcoR、SALL1、RCOR1。NcoR是本发明实例中举例说明的，并且尽管它是优选的，但设想的是该类别中的其他结构域也将是有用的。

在一些实施例中，功能结构域可以是甲基转移酶(HMT)效应物结构域。优选实例包括下表中的那些，即NUE、vSET、EHMT2/G9A、SUV39H1、dim-5、KYP、SUVR4、SET4、SET1、SETD8、以及TgSET8。NUE是本发明实例中举例说明的，并且尽管它是优选的，但设想的是该类别中的其他结构域也将是有用的。

在一些实施例中，功能结构域可以是组蛋白甲基转移酶(HMT)募集物效应物结构域。优选实例包括以下表中的那些，即Hp1a、PHF19、以及NIPP1。

在一些实施例中，功能结构域可以是组蛋白乙酰转移酶抑制剂效应物结构域。优选实例包括以下表中列出的SET/TAF-1β。

还优选的是靶向除启动子或启动子近侧元件之外的内源性(调节)控制元件(例如增强子和沉默子)。因此，除靶向启动子之外，本发明还可以用于靶向内源性控制元件(包括增强子和沉默子)。这些控制元件可以位于转录起始位点(TSS)上游和下游，从距离TSS的200bp开始到100kb远。已知控制元件的靶向可以用于激活或阻遏目的基因。在一些情况下，单一控制元件可以影响多个靶基因的转录。单一控制元件的靶向可以因此用于同时控制多基因的转录。

在另一个方面中，推定的控制元件的靶向(例如，通过针对推定的控制元件区域以及该元件周围200bp至100kB)可以用作验证此类元件(通过测量目的基因的转录)或者检测新颖控制元件(例如，通过针对目的基因的TSS的上游和下游的100kb)的手段。此外，推定的控制元件的靶向可以适用于理解疾病遗传原因的情况。与疾病表型相关联的许多突变和常见SNP变体位于编码区之外。使用本文所述的激活或阻遏系统靶向此类区域，可以接着读出a)一组推定的靶标(例如，最紧密接近控制元件来定位的一组基因)的转录或者b)通过RNAseq或微阵列进行整体转录组读出。这允许鉴定疾病表型中涉及的最可能的候选基因。此类候选基因可以适用作新颖药物靶标。

本文提及了组蛋白乙酰转移酶(HAT)抑制剂。然而，在一些实施例中，替代物是针对包含乙酰转移酶、优选组蛋白乙酰转移酶的一个或多个功能结构域。这些适用于表观基因组学领域，例如适用于探察表观基因组的方法。探察表观基因组的方法可以包括例如靶向表观基因组序列。靶向表观基因组序列可以包括将指导序列引导至表观基因组靶序列。在一些实施例中，表观基因组靶序列可以包括启动子、沉默子或增强子序列。

使用连接至本文所述的Cpf1效应蛋白、优选无效Cpf1效应蛋白、更优选无效-FnCpf1效应蛋白的功能结构域靶向表观基因组序列，可以用于激活或阻遏启动子、沉默子或增强子。

乙酰转移酶的实例是已知的，但在一些实施例中可以包括组蛋白乙酰转移酶。在一些实施例中，组蛋白乙酰转移酶可以包含人类乙酰转移酶p300的催化核心(Gerbasch和Reddy,Nature Biotech[自然生物技术]2015年4月6日)。

在一些优选实施例中，功能结构域连接至无效-Cpf1效应蛋白，以靶向并激活表观基因组序列，例如启动子或增强子。还可以提供引导至此类启动子或增强子的一种或多种指导序列，以引导CRISPR酶与此类启动子或增强子结合。

术语“与……缔合”用于本文是指功能结构域与Cpf1效应蛋白或衔接体蛋白质缔合。它是关于一个分子如何与另一个分子“缔合”，例如衔接体蛋白质与功能结构域之间或者Cpf1效应蛋白与功能结构域之间。在此类蛋白质-蛋白质相互作用的情况下，此缔合可以按照抗体识别表位的方式进行的识别来观察。可替代地，一种蛋白质可以与另一种蛋白质经由两者的融合来缔合，例如一种亚基与另一种亚基融合。典型地通过将一种蛋白质的氨基酸序列添加到另一种蛋白质的氨基酸序列上，例如经由将编码每种蛋白质或亚基的核苷酸序列剪接在一起来发生融合。可替代地，这可以实质上视为两个分子之间的结合或直接连接，例如融合蛋白。在任何情况下，融合蛋白可以包含两个目的亚基之间(即酶与功能结构域之间或衔接体蛋白质与功能结构域之间)的接头。因此，在一些实施例中，Cpf1效应蛋白或衔接体蛋白质通过结合功能结构域来与该功能结构域缔合。在其他实施例中，Cpf1效应蛋白或衔接体蛋白质与功能结构域缔合，因为两者任选地经由中间接头融合在一起。

功能结构域或融合蛋白的附接可以是经由接头，例如柔性甘氨酸-丝氨酸(GlyGlyGlySer)或(GGGS)₃或者硬性α-螺旋形接头例如(Ala(GluAlaAlaAlaLys)Ala)。本文优选使用接头例如(GGGGS)3分开蛋白质或肽结构域。(GGGGS)₃是优选的，因为它是相对长的接头(15个氨基酸)。甘胺酸残基是最柔性的并且丝氨酸残基增加接头处于蛋白质之外的机会。(GGGGS)₆(GGGGS)₉或(GGGGS)₁₂可以优选地用作替代物。其他优选替代物是(GGGGS)₁、(GGGGS)₂、(GGGGS)₄、(GGGGS)₅、(GGGGS)₇、(GGGGS)₈、(GGGGS)₁₀、或(GGGGS)₁₁。替代性接头是可用的，当高柔性接头被认为作用最好，以使得Cpf1的2个部分合在一起并因此重构Cpf1活性的机会最大。一个替代方案是核质蛋白的NLS可以用作接头。例如，接头也可以用在Cpf1与任何功能结构域之间。同样，本文可以使用(GGGGS)₃接头(或因此6、9或12个重复版本)或者可以将核质蛋白的NLS用作Cpf1与功能结构域之间的接头。

饱和诱变

本文所述的一种或多种Cpf1效应蛋白系统可以用于进行基因组座位连同细胞表型的饱和诱变或深度扫描诱变—例如以用于测定基因表达、药物抗性和疾病逆转所需要的功能元件的关键性最小特征和不连续易损性。饱和诱变或深度扫描诱导意指在基因组座位中每个或基本上每个DNA碱基被切割。Cpf1效应蛋白指导RNA的文库可以被引入到细胞群体中。该文库可以被引入为使得每个细胞接收单一指导RNA(gRNA)。在其中该文库通过转导如本文所述的病毒载体来引入的情况下，使用低感染复数(MOI)。该文库可以包括靶向在基因组座位中的(原型间隔区相邻基序)(PAM)序列上游的每个序列的gRNA。该文库对于基因组座位中的每1000个碱基对可以包括PAM序列上游的至少100个非重叠基因组序列。该文库可以包括靶向至少一个不同PAM序列上游的序列的gRNA。Cpf1效应蛋白系统可以包含超过一个Cpf1蛋白。可以使用本文所述的任何Cpf1效应蛋白，包括识别不同PAM序列的直向同源物或工程化Cpf1效应蛋白。gRNA的脱靶位点的频率可以是小于500。可以生成脱靶得分以选择具有最低脱靶位点的gRNA。在单个实验中，确定与gRNA靶位点处的切割缔合的任何表型可以是通过使用靶向相同位点的gRNA来证实。靶位点的确认也可以是通过使用如本文所述的修饰的Cpf1效应蛋白和靶向目的基因组位点的两个gRNA来进行的。在不希望受到理论束缚的情况下，如果在确认实验中观察到表型的变化，则靶位点是准确命中的。

基因组座位可以包含至少一个连续的基因组区域。该至少一个连续基因组区域可以包含多至整个基因组。该至少一个连续基因组区域可以包含该基因组的功能元件。该功能元件可以是处于非编码区、编码基因、内含子区域、启动子或增强子。该至少一个连续的基因组区域可以包含至少1kb、优选至少50kb的基因组DNA。该至少一个连续基因组区域可以包含转录因子结合位点。该至少一个连续基因组区域可以包含DNA酶I超敏区域。该至少一个连续基因组区域可以包含转录增强子或阻遏物元件。该至少一个连续基因组区域可以包含富含表观遗传特征的位点。该至少一个连续基因组DNA区域可以包含表观遗传绝缘子。该至少一个连续基因组区域可以包含物理上相互作用的两个或更多个基因组区域。相互作用的基因组区域可以是通过‘4C技术’来确定。4C技术允许对于与选择的DNA片段物理相互作用的DNA区段以无偏性方式筛选整个基因组，如Zhao等人((2006)Nat Genet[自然遗传学]38,1341-7)和美国专利8,642,295中所述的，这两份文献通过引用以其整体并入本文。表观遗传特征可以是组蛋白乙酰化、组蛋白甲基化、组蛋白泛素化、组蛋白磷酸化、DNA甲基化或其缺失。

用于饱和诱变或深度扫描诱变的一种或多种Cpf1效应蛋白系统可以用于细胞群体中。一种或多种Cpf1效应蛋白系统可以用于真核细胞中，这些真核细胞包括但不限于哺乳动物细胞和植物细胞。细胞群体可以是真核细胞。真核细胞群体可以是胚胎干细胞(ES)、神经元细胞、上皮细胞、免疫细胞、内分泌细胞、肌肉细胞、红细胞、淋巴细胞、植物细胞或酵母细胞。

在一个方面中，本发明提供了筛选与表型变化相关联的功能元件的方法。文库可以被引入到适于含有Cpf1效应蛋白的细胞群体。这些细胞基于表型可以被分成至少两组。该表型可以是基因表达、细胞生长或细胞活力。确定存在于每组中的指导RNA的相对表现度，由此通过每组中的指导RNA的表现度来确定与表型变化相关联的基因组位点。表型变化可以是目的基因表达的变化。目的基因可以是上调、下调或敲除的。这些细胞可以被分为高表达组和低表达组。细胞群体可以包括用于确定表型的报道基因构建体。该报道基因构建体可以包含可检测标记。细胞可以通过使用可检测标记来分类。

在另一个方面中，本发明提供了筛选与对化学化合物的抗性相关联的基因组位点的方法。化学化合物可以是药物或杀有害生物剂。文库可以被引入到适于含有Cpf1效应蛋白的细胞群体中，其中该群体中的每个细胞含有不超过一个的指导RNA；用化学化合物处理细胞群体；并且与早时间点相比，在较晚时间点用化学化合物处理后确定指导RNA的表现度，由此通过富集指导RNA来确定与对化学化合物的抗性缔合的基因组位点。gRNA的表现度可以是通过深度测序方法确定的。

用于CRISPR-Cas9系统中的方法适用于利用Cpf1效应蛋白复合物实践本发明并且参考以下文章：题为BCL11Aenhancer dissection by Cas9-mediated in situsaturating mutagenesis[通过Cas9-诱导的原位饱和诱变进行BCL11A增强子分割]Canver,M.C.,Smith,E.C.,Sher,F.,Pinello,L.,Sanjana,N.E.,Shalem,O.,Chen,D.D.,Schupp,P.G.,Vinjamur,D.S.,Garcia,S.P.,Luc,S.,Kurita,R.,Nakamura,Y.,Fujiwara,Y.,Maeda,T.,Yuan,G.,Zhang,F.,Orkin,S.H.,和Bauer,D.E.DOI:10.1038/nature15521，2015年9月16日在线公开，该文章通过引用并入本文并且在下文中简要讨论：

Canver等人涉及进行人和小鼠BCL11A红系增强子的原位饱和诱变的新颖合并的CRISPR-Cas9指导RNA文库，这些红系增强子先前被鉴定为是与胎血红蛋白(HbF)水平相关联的增强子并且该增强子的小鼠直向同源物是红系BCL11A表达所必需的。此方法揭示了这些增强子关键性最小特征和离散缺点。通过编辑原代人祖细胞和小鼠诱变，作者们确认BCL11A红系增强子作为用于HbF再诱导的靶标。作者们制成报告治疗性基因组编辑的详细增强子图。

使用Cpf1系统修饰细胞或生物体的方法

在一些实施例中，本发明包括修饰细胞或生物体的方法。细胞可以是原核细胞或真核细胞。细胞可以是哺乳动物细胞。哺乳动物细胞可以是非人类灵长类动物、牛、猪、啮齿动物或小鼠细胞。细胞可以是非哺乳动物真核细胞例如家禽、鱼或虾的细胞。细胞还可以是植物细胞。植物细胞可以是栽培植物例如木薯、玉米、高粱、小麦或稻具有的细胞。植物细胞还可以是藻类、树或蔬菜具有的细胞。通过本发明引入到细胞的修饰可以使得细胞和细胞的子代被改变以改进生物产物例如抗体、淀粉、乙醇或其他所希望的细胞输出物的产生。通过本发明引入到细胞的修饰可以使得细胞和细胞的子代包括使所产生的生物产物发生变化的改变。

包装细胞典型地用于形成能够感染宿主细胞的病毒粒子。此类细胞包括包装腺病毒的293细胞和包装逆转录病毒的ψ2细胞或PA317细胞。基因疗法中使用的病毒载体通常是通过产生将核酸载体包装到病毒粒子中的细胞系来生成的。这些载体典型地含有包装并随后整合到宿主中所需要的最小病毒序列、被有待表达的一个或多个多核苷酸的表达盒替换的其他病毒序列。失去的病毒功能典型地是由包装的细胞系反向供应的。例如，基因疗法中使用的AAV载体典型地仅具有来自AAV基因组的ITR序列，这些序列是包装并整合到宿主基因组中所需要的。病毒DNA被包装在一个细胞系中，该细胞系含有编码其他AAV基因即rep和cap但缺乏ITR序列的辅助质粒。该细胞系还可以用作为辅助物的腺病毒感染。辅助病毒促进AAV载体复制和来自辅助质粒的AAV基因表达。辅助质粒由于缺乏ITR序列而未大量包装。腺病毒的污染可以是通过例如进行腺病毒比AAV更敏感的热处理来减少的。

在另一个实施例中，预期可卡耳水泡病毒包膜假型化逆转录病毒载体粒子(参见例如，转让给福瑞德哈金森肿瘤研究中心(Fred Hutchinson Cancer Research Center)的美国专利公开号20120164118)。可卡耳病毒是在水泡病毒属中，并且是哺乳动物的水泡性口炎的致病物。可卡耳病毒最初从特立尼达拉岛(Trinidad)的螨虫中分离(Jonkers等人,Am.J.Vet.Res.[美国兽医研究杂志]25:236-242(1964))，并且在特立尼达拉岛、巴西和阿根廷已从昆虫、牛和马中鉴定到感染。感染哺乳动物的许多水泡病毒已从天然感染的节肢动物中分离，这表明它们是载体传播(vector-borne)的。水泡病毒抗体在生活于农村地区的人中是常见，而这些病毒是地方性的并且是实验室采集的；人类的感染通常导致流感样症状。可卡耳病毒包膜糖蛋白与VSV-G Indiana享有71.5％氨基酸水平的一致性，并且水泡病毒包膜基因的系统发育比较显示可卡耳病毒在血清学上不同于水泡病毒内的VSV-GIndiana病毒株，但与其紧密相关。Jonkers等人,Am.J.Vet.Res.[美国兽医研究杂志]25:236-242(1964)和Travassos da Rosa等人,Am.J.Tropical Med.&Hygiene[美国热带医学和卫生杂志]33:999-1006(1984)。可卡耳水泡病毒包膜蛋白假型化逆转录病毒载体粒子可以包括慢病毒、α逆转录病毒、β逆转录病毒、γ逆转录病毒、δ逆转录病毒以及ε逆转录病毒载体粒子，这些载体粒子可以包含逆转录病毒Gag、Pol、和/或一种或多种辅助蛋白以及可卡耳水泡病毒包膜蛋白。在这些实施例的某些方面中，Gag、Pol和辅助蛋白是慢病毒和/或γ逆转录病毒的。本发明提供了含有以下或基本上由以下组成的AAV：编码CRISPR系统的外源性核酸分子，例如包含第一盒或基本上由该第一盒组成的多个盒，该第一盒包含启动子、编码CRISPR-相关(Cas)蛋白(推定的核酸酶或解旋酶蛋白)例如Cpf1的核酸分子和终止子或基本上尤其组成，以及两个或更多个、有利地多至包装尺寸限度的载体，例如总计(包括该第一盒)五个包含启动子、编码指导RNA(gRNA)的核酸分子和终止子或基本上由其组成的盒(例如，每个盒示意性表示为启动子-gRNA1-终止子、启动子-gRNA2-终止子……启动子-gRNA(N)-终止子(其中N是可以插入的数值，该数值是载体包装尺寸限度的上限)，或者两个或更多个单独的rAAV，各自含有CRISPR系统的一个或超过一个盒，例如第一个rAAV含有启动子、编码Cas例如Cas(Cpf1)的核酸分子和终止子或基本上由其组成的第一盒，并且第二rAAV含有多个、四个包含启动子、编码指导RNA(gRNA)的核酸分子和终止子或基本上由其组成的盒(例如，每个盒示意性表示为启动子-gRNA1-终止子、启动子-gRNA2-终止子……启动子-gRNA(N)-终止子(其中N是可以插入的数值，该数值是在该载体的包装尺寸限度的上限内)。由于rAAV是DNA病毒，所以本文关于AAV或rAAV的讨论中的核酸分子有利地是DNA。在一些实施例中，该启动子有利地是人类突触蛋白I启动子(hSyn)。用于将核酸递送至细胞的其他方法是本领域技术人员已知的。参见例如US 20030087817，通过引用并入本文。

在一些实施例中，宿主细胞是用本文所述的一种或多种载体瞬时转染或非瞬时转染的。在一些实施例中，细胞当天然存在在受试者中时被转染。在一些实施例中，转染的细胞是从受试者中获得的。在一些实施例中，细胞是来源于从受试者中获得的细胞，例如细胞系。用于组织培养的多种多样的细胞系是本领域已知的。细胞系包括但不限于，C8161、CCRF-CEM、MOLT、mIMCD-3、NHDF、HeLa-S3、Huh1、Huh4、Huh7、HUVEC、HASMC、HEKn、HEKa、MiaPaCell、Panc1、PC-3、TF1、CTLL-2、C1R、Rat6、CV1、RPTE、A10、T24、J82、A375、ARH-77、Calu1、SW480、SW620、SKOV3、SK-UT、CaCo2、P388D1、SEM-K2、WEHI-231、HB56、TIB55、Jurkat、J45.01、LRMB、Bcl-1、BC-3、IC21、DLD2、Raw264.7、NRK、NRK-52E、MRC5、MEF、Hep G2、HeLa B、HeLa T4、COS、COS-1、COS-6、COS-M6A、BS-C-1猴肾上皮细胞、BALB/3T3小鼠胚成纤维细胞、3T3Swiss、3T3-L1、132-d5人胎儿成纤维细胞；10.1小鼠成纤维细胞、293-T、3T3、721、9L、A2780、A2780ADR、A2780cis、A172、A20、A253、A431、A-549、ALC、B16、B35、BCP-1细胞、BEAS-2B、bEnd.3、BHK-21、BR 293、BxPC3、C3H-10T1/2、C6/36、Cal-27、CHO、CHO-7、CHO-IR、CHO-K1、CHO-K2、CHO-T、CHO Dhfr-/-、COR-L23、COR-L23/CPR、COR-L23/5010、COR-L23/R23、COS-7、COV-434、CML T1、CMT、CT26、D17、DH82、DU145、DuCaP、EL4、EM2、EM3、EMT6/AR1、EMT6/AR10.0、FM3、H1299、H69、HB54、HB55、HCA2、HEK-293、HeLa、Hepa1c1c7、HL-60、HMEC、HT-29、Jurkat、JY细胞、K562细胞、Ku812、KCL22、KG1、KYO1、LNCap、Ma-Mel 1-48、MC-38、MCF-7、MCF-10A、MDA-MB-231、MDA-MB-468、MDA-MB-435、MDCK II、MDCK II、MOR/0.2R、MONO-MAC 6、MTD-1A、MyEnd、NCI-H69/CPR、NCI-H69/LX10、NCI-H69/LX20、NCI-H69/LX4、NIH-3T3、NALM-1、NW-145、OPCN/OPCT细胞系、Peer、PNT-1A/PNT 2、RenCa、RIN-5F、RMA/RMAS、Saos-2细胞、Sf-9、SkBr3、T2、T-47D、T84、THP1细胞系、U373、U87、U937、VCaP、Vero细胞、WM39、WT-49、X63、YAC-1、YAR、以及其转基因品种。细胞系可从本领域技术人员已知的多种来源获得(参见例如，美国典型培养物保藏中心(ATCC)(弗吉尼亚州马纳萨斯(Manassus,Va.)))。在一些实施例中，用本文所述的一种或多种载体转染的细胞用于建立包含一种或多种载体来源的序列的新细胞系。在一些实施例中，将用如本文所述的CRISPR系统的组分瞬时转染(例如通过瞬时转染一种或多种载体或用RNA转染)并且通过CRISPR复合物的活性修饰的细胞用于建立一种包括含有修饰但缺乏任何其他外源性序列的细胞的细胞系。在一些实施例中，将用本文所述的一种或多种载体瞬时转染或非瞬时转染的细胞或来源于此类细胞的细胞系用于评估一种或多种测试化合物。

在一些实施例中，本文所述的一种或多种载体用于产生非人类转基因动物或转基因植物。在一些实施例中，转基因动物是哺乳动物，例如小鼠、大鼠或兔。用于产生转基因动物和植物的方法是本领域已知的并且通常以一种细胞转染方法例如本文所述的方法开始。在另一个实施例中，可以预期具有针阵列的流体递送装置(参见例如，转让给福瑞德哈金森肿瘤研究中心的美国专利公开号20110230839)用于将CRISPR Cas递送至实体组织。美国专利公开号20110230839的一种用于将流体递送至实体组织的装置可以包括按阵列安排的多个针；多个存储器，每个存储器与该多个针中的一个对应针流体连通；以及多个制动器，该多个制动器可操作地连接至该多个存储器中的对应存储器并且被配置为控制该存储器内的流体压力。在某些实施例中，该多个制动器中的每个制动器可以包括多个柱塞之一，该多个柱塞中的每个柱塞的第一端被接收在该多个存储器中的对应存储器中，并且在某些另外的实施例中，该多个柱塞中的这些柱塞在第二端可操作地连接在一起，以便可同时下压。某些另外的实施例可以包括柱塞驱动器，该柱塞驱动器被配置为以选择性可变速率压下所有该多个柱塞。在其他实施例中，该多个制动器中的每个制动器可以包括具有第一端和第二端的多个流体传输线中的一个流体传输线，该多个流体传输线中的每个流体传输线的第一端连接至该多个存储器中的一个对应存储器。在其他实施例中，该装置可以包括一个流体压力来源，并且该多个制动器中的每个制动器包括该流体压力来源与该多个存储器中的一个对应存储器之间的流体连接。在另外的实施例中，流体压力来源可以包括以下中的至少一种：压缩器、真空贮气筒、蠕动泵、主缸、微流体泵、以及阀。在另一个实施例中，该多个针中的每个针可以包括沿着其长度分布的多个端口。

在一个方面中，本发明提供了在原核或真核细胞中修饰靶多核苷酸的方法。在一些实施例中，该方法包括使得核酸靶向复合物结合靶多核苷酸来实施所述靶多核苷酸的切割，从而修饰该靶多核苷酸，其中该核酸靶向复合物包含与杂交至所述靶多核苷酸内的靶序列的指导RNA复合的核酸靶向效应蛋白。

CRISPR复合物组分可以是通过与转运部分轭合或缔合来递送(例如，改编自美国专利号8,106,022；8,313,772)。核酸递送策略可以例如用于改善指导RNA或信使RNA或编码CRISPR复合物组分的编码DNA的递送。例如，RNA可以掺入修饰的RNA核苷酸以改善稳定性、减少免疫刺激和/或改善特异性(参见Deleavey,Glen F.等人,2012,Chemistry&Biology[化学与生物学],第19卷,第8期,937-954；Zalipsky,1995,Advanced Drug DeliveryReviews[高级药物递送评论]16:157-182；Caliceti和Veronese,2003,Advanced DrugDelivery Reviews[高级药物递送评论]55:1261-1277)。已描述可以用于修饰核酸例如gRNA以进行更有效的递送的不同构建体，例如可以适于修饰gRNA以便具有更大疏水性和非离子性从而提高细胞进入的可逆性电荷中和磷酸三酯骨架修饰(Meade BR等人,2014,Nature Biotechnology[自然生物技术]32,1256-1261)。在其他替代实施例中，所选择的RNA基序可以适用于介导细胞转染((M.等人,Molecular Therapy[分子疗法](2012)；203,616-624)。类似地，适配体可以适于例如通过将适配体附加至gRNA来递送CRISPR复合物组分(Tan等人,2011,Trends in Biotechnology[生物技术趋势],2011年12月,第29卷,第12期)。

在一些实施例中，三触角N-乙酰基半乳糖胺(GalNAc)与寡核苷酸组分的轭合可以用于改善递送，例如选择细胞类型例如肝细胞的递送(参见WO 2014118272，通过引用并入本文；Nair,JK等人,2014,Journal of the American Chemical Society[美国化学学会杂志]136(49),16958-16961)。这可以被认为是基于糖的粒子并且本文提供了关于其他粒子递送系统和/或配制品的其他详情。GalNAc因此可以被认为是本文所述的其他粒子的意义上的粒子，以使得一般用途和其他考虑因素(例如所述粒子的递送)也应用于GalNAc粒子。溶液相轭合策略可以例如用于将作为PFP(五氟苯酚)酯激活的三触角GalNAc簇(分子量约2000)附接到5′-己基氨基修饰的寡核苷酸上(5′-HAASO，分子量约8000Da；等人,Bioconjugate Chem.[生物共轭化学],2015,26(8),第1451-1455页)。类似地，已描述用于体内核酸递送的聚(丙烯酸酯)聚合物(参见WO 2013158141，其通过引用并入本文)。在另外的替代实施例中，为了改善递送，可以使用预先混合的CRISPR纳米粒子(或蛋白质复合物)与天然存在的血清蛋白(Akinc A等人,2010,Molecular Therapy[分子疗法]第18卷第7期,1357-1364)。

在一些实施例中，蛋白质CRISPR组分的递送可以是通过将功能肽(例如改变蛋白质疏水性的肽)添加到该蛋白质中，例如以便改善体内功能来实现。CRISPR组分蛋白可以类似地被修饰为促进随后的化学反应。例如，氨基酸可以被添加到具有经受点击化学的基团的蛋白质中(I.等人,2015,Nature Protocols[自然实验手册]10,780-791)。在这种类型的实施例中，点击化学基团那么可以用于添加多种多样的替代性结构，例如用于稳定的聚(乙二醇)、细胞穿透肽、RNA适配体、脂质、或碳水化合物例如GalNAc。在其他替代方案中，CRISPR组分蛋白可以被修饰为适应进入细胞蛋白(参见Svensen等人,2012,Trends inPharmacological Sciences[药理学趋势],第33卷,第4期)，例如通过将细胞穿透肽添加到该蛋白质(参见Kauffman,W.Berkeley等人,2015,Trends in Biochemical Sciences[生物化学趋势],第40卷,第12期,749-764；Koren和Torchilin,2012,Trends in MolecularMedicine[分子医学趋势],第18卷,第7期)。在另一个替代实施例中，患者或受试者可以用有助于CRISPR组分随后递送的化合物或配制品预处理。

筛选技术可用于鉴定递送增强子，例如通过筛选化学文库(Gilleron J.等人,2015,Nucl.Acids Res.[核酸研究]43(16):7984-8001)。还已描述了用于测定递送媒介物例如纳米粒子的效率的方法，这些方法可以用于鉴定对于CRISPR组分的有效递送媒介物(参见Sahay G.等人,2013,Nature Biotechnology[自然生物技术]31,653-658)。

Cpf1效应蛋白复合物可以用于植物中

一种或多种Cpf1效应蛋白系统(例如，单一或多重)可以与农作物基因组的研究进展结合来使用。本文所述的系统可以用于进行有效且性价比高的植物基因或基因组探察或编辑或操纵，例如，快速研究并且/或者选择并且/或者探察并且/或者比较并且/或者操纵并且/或者转化植物基因或基因组；例如，以为一种或多种植物创建、鉴定、发展、优化或赋予一种或多种性状或一种或多种特征或者以转化植物基因组。因此可以存在植物、具有新性状或特征组合的新植物或具有增强的性状的新植物的改善的产生方法。一种或多种Cpf1效应蛋白系统可以用于植物中，以定点整合(SDI)或基因编辑(GE)或任何近反向育种(NearReverse Breeding(NRB))或反向育种(Reverse Breeding(RB))技术。利用本文所述的Cpf1效应蛋白系统的方面可能类似于CRISPR-Cas(例如，CRISPR-Cas9)系统在植物中的使用，并且参考亚利桑那大学(University of Arizona)网站“CRISPR-PLANT”(www.genome.arizona.edu/crispr/)(得到宾州州立大学(Penn State)和AGI的支持)。本发明的实施例可以用于在植物中或在先前已使用RNAi或类似基因组编辑技术的情况中进行基因组编辑；参见例如，Nekrasov,“Plant genome editing made easy:targetedmutagenesis in model and crop plants using the CRISPR-Cas system[植物基因组编辑一点通：在模型和农作物植物中使用CRISPR-Cas系统进行靶向诱变],”Plant Methods[植物方法]2013,9:39(doi:10.1186/1746-4811-9-39)；Brooks,“Efficient geneediting in tomato in the first generation using the CRISPR-Cas9system[在第一代番茄中使用CRISPR-Cas9系统进行有效基因编辑],”Plant Physiology[植物生理学]2014年9月第114.247577页；Shan,“Targeted genome modification of crop plantsusing a CRISPR-Cas system[使用CRISPR-Cas系统进行农作物植物的靶向基因组修饰],”Nature Biotechnology[自然生物技术]31,686-688(2013)；Feng,“Efficient genomeediting in plants using a CRISPR/Cas system[在植物中使用CRISPR/Cas系统进行有效基因组编辑],”Cell Research[细胞研究](2013)23:1229-1232.doi:10.1038/cr.2013.114；2013年8月20日在线公开；Xie,“RNA-guided genome editing in plantsusing a CRISPR-Cas system[在植物中使用CRISPR-Cas系统进行RNA指导的基因组编辑],”Mol Plant.[分子植物]2013年11月；6(6):1975-83.doi:10.1093/mp/sst119.电子版2013年8月17日；Xu,“Gene targeting using the Agrobacterium tumefaciens-mediatedCRISPR-Cas system in rice[在水稻中使用根癌土壤杆菌介导的CRISPR-Cas系统进行基因靶向],”Rice[稻]2014,7:5(2014),Zhou等人“Exploiting SNPs for biallelic CRISPRmutations in the outcrossing woody perennial Populus reveals 4-coumarate:CoAligase specificity and Redundancy[在异型杂交木多年生杨树中利用SNP进行二等位基因CRISPR突变揭示了4-香豆酸：辅酶A连接酶特异性和丰余性],”New Phytologist[新植物学家](2015)(论坛)1-4(仅可在www.newphytologist.com处在线获得)；Caliando等人,“Targeted DNA degradation using a CRISPR device stably carried in the hostgenome[使用在宿主基因组中稳定携带的CRISPR装置进行靶向DNA降解],NATURECOMMUNICATIONS[自然通讯]6:6989,DOI:10.1038/ncomms7989,www.nature.com/naturecommunications DOI:10.1038/ncomms7989；美国专利号6,603,061-Agrobacterium-Mediated Plant Transformation Method[土壤杆菌属介导的植物转化方法]；美国专利号7,868,149-Plant Genome Sequences and Uses Thereof[植物基因组序列及其用途]以及US2009/0100536-Transgenic Plants with Enhanced AgronomicTraits[具有增强的农艺性状的转基因植物]，每份文献的所有内容和披露均通过引用以其整体并入本文。在本发明的实践中，Morrell等人“Crop genomics:advances andapplications[农作物基因组：发展与应用],”Nat Rev Genet.[遗传学自然评论]2011年12月29日；13(2):85-96的内容和披露；每份文献通过引用并入本文，包括关于本文的实施例可以如何用于植物一样。因此，除非另外表明，否则本文提及动物细胞也可以将必要的修正应用于植物细胞；并且，本文具有减小的脱靶效应的酶和采用此类酶的系统可以用于植物应用，包括本文提及的那些。

Cpf1-CRISPR系统对植物和酵母的应用

定义：

总的来说，术语“植物”涉及植物界的任何各种光合，真核，单细胞或多细胞生物，其特征在于通过细胞分裂生长，含有叶绿体，并且具有由纤维素组成的细胞壁。术语植物涵盖单子叶植物和双子叶植物。确切的说，这些植物旨在包括但不限于被子植物和裸子植物，例如刺槐、苜蓿、苋、苹果、杏、洋蓟、灰树、芦笋、鳄梨、香蕉、大麦、豆、甜菜、桦树、山毛榉、黑莓、蓝莓、花椰菜、芽球甘蓝、卷心菜、油菜(canola)、哈密瓜、胡萝卜、木薯、菜花、雪松、谷类、芹菜、栗树、樱桃、大白菜、柑橘、克莱门小柑橘、三叶草、咖啡、谷物、棉花、豇豆、黄瓜、柏树、茄子、榆树、菊苣、桉树、茴香、无花果、枞树、天竺葵、葡萄、葡萄柚、落花生(groundnut)、地樱桃、树胶铁杉、山核桃、羽衣甘蓝、奇异果、甘蓝、落叶松、生菜、韭葱、柠檬、酸橙、洋槐、松树、掌叶铁线蕨、玉米(maize)、芒果、枫树、甜瓜、小米、蘑菇、芥菜、坚果、橡树、燕麦、油棕树、秋葵、洋葱、桔子、观赏植物或花或树、木瓜、棕榈树、欧芹、防风草、豌豆、桃树、花生(peanut)、梨树、泥煤苔(peat)、胡椒、柿子树、木豆、松树、菠萝、车前草、李子、石榴、马铃薯、南瓜、菊苣、萝卜、油菜籽、覆盆子、水稻、黑麦、高梁、红花、黄华柳、大豆、菠菜、云杉、南瓜、草莓、甜菜、甘蔗、向日葵、甘薯、甜玉米、橘子、茶、烟草、番茄、树木、黑小麦、草坪草、芜菁、葡萄树、胡桃、西洋菜、西瓜、小麦、山药、紫杉、以及绿皮西葫芦。术语植物还涵盖藻类，这些藻类主要是统一标准主要为缺乏根、叶和表征高等植物的其他器官的光合自养生物。

用于使用本文所述的Cpf1系统进行基因组编辑的方法可以用于对基本上任何植物赋予所希望的性状。各种各样的植物和植物细胞系统可以使用本披露的核酸构建体和以上提及的各种转化方法来工程化为如本文所述的希望的生理学和农艺学特征。在优选实施例中，用于工程化的靶植物和植物细胞包括但不限于，那些单子叶植物和双子叶植物，例如农作物，包括谷类作物(例如，小麦、玉米、水稻、小米、大麦)、果实农作物(例如，番茄、苹果、梨、草莓、桔子)、草料作物(例如，苜蓿)、根用蔬菜作物(例如，胡萝卜、马铃薯、甜莱、山药)、叶用蔬菜作物(例如，生菜、菠菜)；有花植物(例如，矮牵牛、玫瑰、菊花)、针叶树和松树(例如，冷杉、云杉)；植物治理法中使用的植物(例如，重金属积累的植物)；油料作物(例如，向日葵、油菜籽)和用于实验目的的植物(例如，拟南芥属)。因此，这些方法和CRISPR-Cas系统可以用于广泛范围的植物，例如像属于以下目的双子叶植物：木兰目(Magniolales)、八角目(Illiciales)、樟目(Laurales)、胡椒目(Piperales)、马兜铃目(Aristolochiales)、睡莲目(Nymphaeales)、毛茛目(Ranunculales)、罂粟目(Papaverales)、瓶子草科(Sarraceniaceae)、昆栏树目(Trochodendrales)、金缕梅目(Hamamelidales)、杜仲目(Eucommiales)、塞子木目(Leitneriales)、杨梅目(Myricales)、壳斗目(Fagales)、木麻黄目(Casuarinales)、石竹目(Caryophyllales)、肉穗果目(Batales)、寥目(Polygonales)、蓝雪目(Plumbaginales)、五桠果目(Dilleniales)、山茶目(Theales)、锦葵目(Malvales)、荨麻目(Urticales)、玉蕊目(Lecythidales)、堇菜目(Violales)、杨柳目(Salicales)、白花菜目(Capparales)、杜鹃花目(Ericales)、岩梅目(Diapensiales)、柿树目(Ebenales)、报春花目(Primulales)、蔷薇目(Rosales)、豆目(Fabales)、川草目(Podostemales)、小二仙草目(Haloragales)、桃金娘目(Myrtales)、山茱萸目(Cornales)、山龙眼目(Proteales)、檀香目(San tales)、大花草目(Rafflesiales)、卫矛目(Celastrales)、大戟目(Euphorbiales)、鼠李目(Rhamnales)、无患子目(Sapindales)、胡桃目(Juglandales)、牻牛儿苗目(Geraniales)、远志目(Polygalales)、伞形目(Umbellales)、龙胆目(Gentianales)、花葱目(Polemoniales)、唇形目(Lamiales)、车前草目(Plantaginales)、玄参目(Scrophulariales)、桔梗目(Campanulales)、茜草目(Rubiales)、川续断目(Dipsacales)以及菊目(Asterales)；这些方法和CRISPR-Cas可以用于单子叶植物，例如属于以下目的单子叶植物:泽泻目(Alismatales)、水鳖目(Hydrocharitales)、茨藻目(Najadales)、霉草目(Triuridales)、鸭跖草目(Commelinales)、谷精草目(Eriocaulales)、帚灯草目(Restionales)、禾本目(Poales)、灯芯草目(Juncales)、莎草科(Cyperales)、香蒲目(Typhales)、凤梨目(Bromeliales)、姜目(Zingiberales)、槟榔目(Arecales)、环花目(Cyclanthales)、露兜树目(Pandanales)、天南星目(Arales)、百合目(Lilliales)以及兰目(Orchid ales)，或者用于属于裸子植物的植物，例如属于松杉目(Pinales)、银杏目(Ginkgoales)、苏铁目(Cycadales)、南洋杉目(Araucariales)、柏目(Cupressales)以及麻黄目(Gnetales)。

本文所述的Cpf1 CRISPR系统和使用方法可以用于广泛范围的植物种类，包括在下面的双子叶植物、单子叶植物或裸子植物属的非限制性列表中：颠茄属(Atropa)、油丹属(Alseodaphne)、腰果属(Anacardium)、落花生属(Arachis)、琼楠属(Beilschmiedia)、芸苔属(Brassica)、红花属(Carthamus)、木防己属(Cocculus)、巴豆属(Croton)、甜瓜属(Cucumis)、柑橘属(Citrus)、西瓜属(Citrullus)、辣椒属(Capsicum)、长春花属(Catharanthus)、椰子属(Cocos)、咖啡属(Coffea)、南瓜属(Cucurbita)、胡萝卜属(Daucus)、杜氏木属(Duguetia)、花菱草属(Eschscholzia)、榕属(Ficus)、草莓属(Fragaria)、海罂粟属(Glaucium)、大豆属(Glycine)、棉属(Gossypium)、向日葵属(Helianthus)、橡胶树属(Hevea)、天仙子属(Hyoscyamus)、莴苣属(Lactuca)、卷枝藤属(Landolphia)、亚麻属(Linum)、木姜子属(Litsea)、番茄属(Lycopersicon)、羽扇豆属(Lupinus)、木薯属(Manihot)、马郁兰属(Majorana)、苹果属(Malus)、苜蓿属(Medicago)、烟草属(Nicotiana)、木犀榄属(Olea)、银胶菊属(Parthenium)、罂粟属(Papaver)、鳄梨属(Persea)、菜豆属(Phaseolus)、黄连木属(Pistacia)、豌豆属(Pisum)、梨属(Pyrus)、李属(Prunus)、萝卜属(Raphanus)、蓖麻属(Ricinus)、千里光属(Senecio)、防己属(Sinomenium)、千金藤属(Stephania)、欧白芥属(Sinapis)、茄属(Solanum)、可可属(Theobroma)、三叶草属(Trifolium)、胡芦巴属(Trigonella)、蚕豆属(Vicia)、蔓长春花属(Vinca)、葡萄属(Vilis)以及豇豆属(Vigna)；以及葱属(Allium)、须芒草属(Andropogon)、画眉草属(Aragrostis)、天门冬属(Asparagus)、燕麦属(Avena)、狗牙根属(Cynodon)、油棕属(Elaeis)、羊茅属(Festuca)、羊茅黑麦草属(Festulolium)、萱草属(Heterocallis)、大麦属(Hordeum)、浮萍属(Lemna)、毒麦属(Lolium)、芭蕉属(Musa)、稻属(Oryza)、黍属(Panicum)、狼尾草属(Pannesetum)、梯牧草属(Phleum)、早熟禾属(Poa)、黑麦属(Secale)、高粱属(Sorghum)、小麦属(Triticum)、玉蜀黍属(Zea)、冷杉属(Abies)、杉木属(Cunninghamia)、麻黄属(Ephedra)、云杉属(Picea)、松属(Pinus)、以及黄杉属(Pseudotsuga)。

Cpf1 CRISPR系统和使用方法也可以用于广泛范围的“藻类”或“藻类细胞”；包括例如选自若干真核生物门的藻类，包括红藻门(红藻)、绿藻门(绿藻)、褐藻门(褐藻)、硅藻门(硅藻)、真眼点藻纲以及沟鞭藻类，以及原核生物门蓝藻细菌(蓝绿藻类)。术语“藻类”包括例如选自以下的藻类：双眉藻属(Amphora)、鱼腥藻属(Anabaena)、纤维藻属(Anikstrodesmis)、丛粒藻属(Botryococcus)、角毛藻属(Chaetoceros)、衣藻属(Chlamydomonas)、绿藻属(Chlorella)、绿球藻属(Chlorococcum)、小环藻属(Cyclotella)、筒柱藻属(Cylindrotheca)、杜氏藻属(Dunaliella)、球石藻属(Emiliana)、眼虫属(Euglena)、红球藻属(Hematococcus)、等鞭金藻属(Isochrysis)、单鞭金藻属(Monochrysis)、单针藻属(Monoraphidium)、微绿球藻属(Nannochloris)、拟微绿球藻属(Nannnochloropsis)、舟形藻属(Navicula)、肾鞭藻属(Nephrochloris)、肾爿藻属(Nephroselmis)、菱形藻属(Nitzschia)、节球藻属(Nodularia)、念珠藻属(Nostoc)、髓球藻属(Oochromonas)、卵囊藻(Oocystis)、颤藻(Oscillartoria)、巴夫藻属(Pavlova)、褐指藻属(Phaeodactylum)、扁藻属(Playtmonas)、颗石藻属(Pleurochrysis)、紫菜属(Porhyra)、假鱼腥藻(Pseudoanabaena)、塔胞藻属(Pyramimonas)、裂丝藻属(Stichococcus)、聚球藻属(Synechococcus)、集胞藻属(Synechocystis)、四爿藻属(Tetraselmis)、海链藻属(Thalassiosira)、以及束毛藻属(Trichodesmium)。

植物的一部分即“植物组织”可以根据本发明的方法进行处理以产生改善的植物。植物组织还涵盖植物细胞。如本文所用的术语“植物细胞”是指活体植物的个体单元，在完整全株或在体外组织培养基中、在培养基或琼脂上、在生长培养基或缓冲液的悬浮液中或作为高等组织单元一部分生长的分离形式，例如像植物组织、植物器官或全株。

“原生质体”是指植物细胞使用例如机械或酶促方式完全去除或部分去除保护性细胞壁从而形成的活体植物的完整生物化学感受态单元，该感受态单元在适当生长条件下可以重新形成细胞壁、增殖并再生成全株。

术语“转化”广泛地是指植物宿主通过借助于土壤杆菌或各种化学或物理方法之一来引入DNA从而进行遗传修饰的过程。如本文使用的，术语“植物宿主”是指植物，包括植物的任何细胞、组织、器官或子代。许多适合的植物组织或植物细胞可以被转化，并且包括但不限于，原生质体、体细胞胚胎、花粉、叶、幼苗、茎、愈伤组织、匍伏茎、试管块茎、以及胚芽。植物组织还是指这种植物的任何克隆、种子、子代、繁殖体(无论是有性繁殖产生或无性繁殖产生)、以及任何这些的后代例如切块或种子。

如本文使用的术语“转化的”是指已引入外源DNA分子例如构建体的细胞、组织、器官或生物体。引入的DNA分子可以整合到受体细胞、组织、器官或生物体的基因组DNA中，以使得引入的DNA分子被传输到随后的子代中。在这些实施例中，“转化的”或“转基因的”细胞或植物也可以包括细胞或植物的子代以及通过育种程序采用这种转化的植物作为杂交的母体并表现出因引入的DNA分子的存在而产生的改变的表型的子代。优选地，转基因植物是能育的并且能够将引入的DNA通过有性繁殖传输到子代中。

术语“子代”例如转基因植物的子代是由植物或转基因植物生出的、由其产生的或从其来源的子代。引入的DNA分子还可以瞬时转染到受体细胞中，以使得引入的DNA分子未被随后的子代继承并因此不认为是“转基因的”。因此，如本文使用的，“非转基因”植物或植物细胞是不含有稳定整合到其基因组中的外源DNA的植物。

如本文使用的，术语“植物启动子”是能够开启植物细胞内的转录(无论其起源是否是植物细胞)的启动子。示例性的适合植物启动子包括但不限于，从植物、植物病毒和包含在植物细胞内表达的基因的细菌例如土壤杆菌属或根瘤菌属中获得的启动子。

如本文使用的，“真菌细胞”是指真菌界内的任何类型的真核细胞。真菌界内的种系包括子囊菌门、担子菌门、芽枝霉门(Blastocladiomycota)、壶菌门、球囊菌门(Glomeromycota)、微孢子虫目、以及新美鞭菌门(Neocallimastigomycota)。真菌细胞可以包括酵母、霉菌、以及丝状真菌。在一些实施例中，该真菌细胞是酵母细胞。

如本文使用的，术语“酵母细胞”是指子囊菌门(Ascomycota)和担子菌门(Basidiomycota)内的任何真菌细胞。酵母细胞可以包括芽殖酵母细胞、裂殖酵母细胞、以及霉菌细胞。在不限于这些生物体的情况下，实验室和工业环境中使用的许多类型的酵母是子囊菌门的一部分。在一些实施例中，酵母细胞是酿酒酵母、马克思克鲁维酵母、或东方伊萨酵母细胞。其他酵母细胞可以包括但不限于假丝酵母属某些种(例如，白色念珠菌)、亚罗酵母属某些种(例如，亚罗解脂酵母)、毕赤酵母属某些种(例如，巴斯德毕赤酵母)、克鲁维酵母属某些种(例如，产乳糖酶酵母和马克思克鲁维酵母)、链孢霉属某些种(例如，粗糙脉孢菌)、镰刀菌某些种(例如，尖孢镰刀菌)、以及伊萨酵母属某些种(例如，东方伊萨酵母，又称为库德里阿兹威毕赤酵母(Pichia kudriavzevii)和酸性嗜热假丝酵母(Candidaacidothermophilum))。在一些实施例中，该真菌细胞是丝状真菌细胞。如本文使用的，术语“丝状真菌细胞”是指以细丝(即菌丝或菌丝体)生长的任何类型的真菌细胞。丝状真菌细胞的实例可以包括但不限于，曲霉属某些种(例如，黑曲霉)、木霉属某些种(例如，里氏木霉)、根霉属某些种(例如，稻根霉菌)、以及被孢霉属某些种(例如，深黄被孢霉)。

在一些实施例中，该真菌细胞是工业菌株。如本文使用的，“工业菌株”是指工业过程中使用的或由工业过程分离的任何真菌细胞菌株，该工业过程例如以商业或工业规模生产产品。工业菌株可以是典型地用于工业过程的真菌种类，或者它可以是指也可用于非工业目的(例如，实验室研究)的真菌种类分离株。工业过程的实例可以包括发酵(例如，在食品或饮料产品生产中)、蒸馏、生物燃料生产、化合物生产、以及多肽生产。工业菌株的实例可以包括但不限于，JAY270和ATCC4124。

在一些实施例中，该真菌细胞是多倍体细胞。如本文使用的，“多倍体”细胞可以是指其基因组以超过一个拷贝存在的任何细胞。多倍体细胞可以是指以多倍体状态天然发现的细胞类型，或者它可以是指已诱导为以多倍体状态存在(例如，通过特异性调节、改变、灭活、激活、或者减数分裂、胞质分裂或DNA复制的修饰)的细胞。多倍体细胞可以是指其整个基因组为多倍体的细胞，或者它可以是指在特定目的基因组座位中为多倍体的细胞。在不希望受到理论束缚的情况下，认为与在单倍体细胞中相比指导RNA的丰度在多倍体细胞的基因组工程中可能是更常见的速率限制性组分，并且因此使用本文所述的Cpf1 CRISPRS系统的方法可以利用使用某种真菌细胞类型的优点。

在一些实施例中，该真菌细胞是二倍体细胞。如本文使用的，“二倍体”细胞可以是指其基因组以两个拷贝存在的任何细胞。二倍体细胞可以是指以二倍体状态天然发现的细胞类型，或者它可以是指已诱导为以二倍体状态存在(例如，通过特异性调节、改变、灭活、激活、或者减数分裂、胞质分裂或DNA复制的修饰)的细胞。例如，酿酒酵母菌株S228C可以维持在单倍体状态或二倍体状态中。二倍体细胞可以是指其整个基因组为二倍体的细胞，或者它可以是指在特定目的基因组座位中为二倍体的细胞。在一些实施例中，该真菌细胞是单倍体细胞。如本文使用的，“单倍体”细胞可以是指其基因组以一个拷贝存在的任何细胞。单倍体细胞可以是指以单倍体状态天然发现的细胞类型，或者它可以是指已诱导为以单倍体状态存在(例如，通过特异性调节、改变、灭活、激活、或者减数分裂、胞质分裂或DNA复制的修饰)的细胞。例如，酿酒酵母菌株S228C可以维持在单倍体状态或二倍体状态中。单倍体细胞可以是指其整个基因组为单倍体的细胞，或者它可以是指在特定目的基因组座位中为单倍体的细胞。

如本文使用的，“酵母表达载体”是指含有编码RNA和/或多肽的一个或多个序列的核酸并且可以进一步含有控制一个或多个核酸表达的任何希望的元件、以及使得能够在酵母细胞内复制并维持表达载体的任何元件。许多适合的酵母表达载体及其特征是本领域已知的；例如，不同载体和技术示出于Yeast Protocols[酵母方案],第2版,Xiao,W.编辑(Humana Press[胡马纳出版社],New York[纽约],2007)以及Buckholz,R.G.和Gleeson,M.A.(1991)Biotechnology[生物技术](NY)9(11):1067-72。酵母载体可以包含但不限于，着丝粒(CEN)序列、自主性复制序列(ARS)、可操作地连接至目的序列或基因的启动子例如RNA聚合酶III启动子、终止子例如RNA聚合物III终止子、复制起点、以及标记基因(例如，营养缺陷型、抗生素型或其他选择标记)。用于酵母的表达载体的实例可以包括质粒、酵母人工染色体、2μ质粒、酵母整合型质粒、酵母复制型质粒、穿梭载体、以及附加型质粒。

Cpf1 CRISP系统组分稳定整合在植物和植物细胞的基因组中

在具体实施例中，设想的是引入编码Cpf1 CRISPR系统组分的多核苷酸，以稳定整合到植物细胞基因组中。在这些实施例中，转化载体或表达系统的设计可以根据指导RNA和/或Cpf1基因表达的时间、位置和条件来调整。

在具体实施例中，设想的是将Cpf1 CRISPR系统的组分稳定引入到植物细胞的基因组DNA中。另外地或可替代地，设想的是引入Cpf1 CRISPR系统的组分，以稳定整合到植物细胞器的DNA中，该细胞器例如但不限于质粒、线粒体或叶绿体。

于稳定整合到植物细胞基因组中的表达系统可以包含以下元件中的一个或多个：可用于在植物细胞中表达RNA和/或Cpf1酶的启动子元件；增强表达的5'非翻译区；在某些细胞例如单子叶植物细胞内进一步增强表达的内含子元件；提供了用于插入指导RNA和/或Cpf1基因序列以及其他希望的元件的便利限制性位点的多克隆位点；以及提供对表达转录物的有效终止的3'非翻译区。

表达系统的元件可以是处于一个或多个表达构建体上，该一个或多个表达构建体是环状的，例如质粒或转化载体，或者是非环状的，例如线性双链DNA。

在一个具体实施例中，Cfp1CRISPR表达系统包含至少：

编码与植物中的靶序列杂交的指导RNA(gRNA)的核苷酸序列，并且其中该指导RNA包含指导序列和同向重复序列，以及

编码Cpf1蛋白的核苷酸序列，

其中组分(a)或(b)位于相同或不同构建体上，并且由此不同核苷酸序列可以处于植物细胞内可操作的相同或不同调节元件的控制下。

含有Cpf1 CRISPR系统的组分的一个或多个DNA构建体和(在适用情况下)模板序列可以通过多种常规技术引入到植物、植物部分或植物细胞的基因组中。该过程大体上包括以下步骤：选择一种适合的宿主细胞或宿主组织、将该一个或多个构建体引入到该宿主细胞或宿主组织中、以及由其再生植物细胞或植物。

在具体实施例中，DNA构建体可以使用例如但不限于电穿孔、显微注射、植物细胞原生质体的气溶胶波束注射来引入到植物细胞中，或者DNA构建体可以使用基因枪方法例如DNA粒子轰击来直接引入到植物组织(还参见，Fu等人,Transgenic Res.[转基因研究]2000年2月；9(1):11-9)。粒子轰击的基础是使包覆有目的一种或多种基因的粒子朝向细胞加速，从而导致粒子穿透原生质并且典型地稳定整合到基因组中。(参见例如，Klein等人,Nature[自然](1987),Klein等人,Bio/Technology[生物/技术](1992),Casas等人,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊](1993).)。

在具体实施例中，含有Cpf1 CRISPR系统组分的DNA构建体可以是通过土壤杆菌介导的转化引入到该植物中。该DNA构建体可以与适合T-DNA侧翼区组合并且被引入到常规根瘤土壤杆菌宿主载体中。外源DNA可以是通过感染植物或通过将植物原生质体与含有一个或多个Ti(根瘤诱导)质粒的土壤杆菌一起培育来结合到植物基因组中。(参见例如Fraley等人,(1985),Rogers等人,(1987)和美国专利号5,563,055)。

植物启动子

为了确保植物细胞内的适当表达，本文描述的Cpf1 CRISPR系统的组分典型地是置于植物启动子即植物细胞内可操作的启动子的控制下。设想使用不同类型的启动子。

植物组成型启动子是能够表达它在所有或几乎所有植物组织中在植物的所有或几乎所有发育阶段过程中控制的可读框(ORF)的启动子(称为“组成型表达”)。组成型启动子的一个非限制性实例是花椰菜花叶病毒35S启动子。“调节型启动子”是指不以组成性方式而是以时间和/或空间调节方式引导基因表达的启动子并且包括组织特异型启动子、组织优选型启动子和诱导型启动子。不同启动子可以在不同组织或细胞类型中、或在不同发育阶段、或响应于不同环境条件来引导基因表达。在具体实施例中，一种或多种Cpf1CRISPR组分在组成型启动子例如花椰菜花叶病毒35S启动子的控制下表达，组织优选型启动子可以用于靶向在特定植物组织内的某些细胞类型，例如叶或根的维管细胞或种子的特定细胞内的增强的表达。用于Cpf1 CRISPR系统的特定启动子的实例可见于Kawamata等人,(1997)Plant Cell Physiol[植物细胞生理学]38:792-803；Yamamoto等人,(1997)Plant J[植物杂志]12:255-65；Hire等人,(1992)Plant Mol Biol[植物分子生物学]20:207-18，Kuster等人,(1995)Plant Mol Biol[植物分子生物学]29:759-72，和Capana等人,(1994)Plant Mol Biol[植物分子生物学]25:681-91。

允许时间空间控制基因编辑或基因表达的诱导型启动子的实例可以使用能量形式。能量形式可以包括但不限于，声能、电磁辐射、化学能和/或热能。诱导型系统的实例包括四环素诱导型启动子(Tet-On或Tet-Off)、小分子双杂交转录激活系统(FKBP、ABA等)、或光诱导型系统(光敏色素、LOV结构域或隐花色素)，例如以序列特异性方式引导转录活性改变的光诱导型转录效应物(LITE)。光诱导型系统的组分可以包括Cpf1 CRISPR酶、光反应性细胞色素异源二聚体(例如，来自阿拉伯芥)、以及转录激活/阻遏结构域。诱导型DNA结合蛋白及其使用方法的其他实例提供于US 61/736465和US 61/721,283中，其通过引用以其整体并入本文。

在具体实施例中，瞬时表达或诱导型表达可以是通过使用例如化学品调节启动子来实现的，即由此外源性化学品的应用诱导基因表达。基因表达的调节可以是通过化学物阻抑型启动子来获得，其中化学物的应用阻遏基因表达。化学品诱导型启动子包括但不限于，由苯磺酰胺除草剂安全剂激活的玉米ln2-2启动子(De Veylder等人,(1997)PlantCell Physiol[植物细胞生理学]38:568-77)、由用作苗前除草剂的疏水性亲电子化合物激活的玉米GST启动子(GST-ll-27，WO 93/01294)、以及由水杨酸激活的烟草PR-1启动子(Ono等人,(2004)Biosci Biotechnol Biochem[生物科学、生物技术和生物化学]68:803-7)。本文还可以使用通过抗生素调节的启动子，例如四环素诱导型启动子和四环素阻抑型启动子(Gatz等人,(1991)Mol Gen Genet[分子遗传学和普通遗传学]227:229-37；美国专利号5,814,618和5,789,156)。

特定植物细胞器中的易位和/或表达

表达系统可以包含在特定植物细胞器中易位和/或表达的元件。

叶绿体靶向

在具体实施例中，设想的是Cpf1 CRISPR系统用于特别修饰叶绿体基因或者确保叶绿体中表达。出于此目的，使用叶绿体转化方法或者将Cpf1 CRISPR组分区室化至叶绿体的方法。例如，在质粒基因组中遗传修饰的引入可以减少生物安全性问题，例如通过花粉的基因流。

叶绿体转化方法是本领域已知的并且包括粒子轰击、PEG处理和显微注射。另外地，涉及转化盒从核基因组易位到质粒的方法可以如WO 2010061186所述地使用。

可替代地，设想的是，将一种或多种Cpf1 CRISPR组分靶向植物叶绿体。这是通过在表达构建体中结合编码叶绿体转运肽(CTP)或质体转运肽的序列来实现的，该序列与编码Cpf1蛋白的序列的5’区可操作地连接。在易位到叶绿体中的过程中，在处理步骤中去除CTP。表达蛋白的叶绿体靶向是技术人员已熟知的(参见例如Protein Transport intoChloroplasts[蛋白质转运到叶绿体中],2010,Annual Review of Plant Biology[植物生物学年评],第61卷:157-180)。在此类实施例中，还希望将指导RNA靶向植物叶绿体。例如在US 20040142476中描述了可以用于借助于叶绿体定位序列来将指导RNA易位到叶绿体中的方法和构建体，其通过引用并入本文。构建体的此类变型可以结合到本发明的表达系统中，以有效易位Cpf1-指导RNA。

在藻类细胞中引入编码CRISPR-Cpf1系统的多核苷酸。转基因藻类(或其他植物例如芸苔)可以特别适用于生产植物油或生物燃料例如醇(具体地是甲醇和乙醇)或其他产品。这些藻类可以被工程化以表达或过量表达用于油或生物燃料工业中的高水平油或醇。

US 8945839描述了一种用于使用Cas9工程化微藻(莱茵衣藻细胞)种类)的方法。使用类似工具，本文所述的Cpf1 CRISPR系统的方法可以应用于衣藻属种类和其他藻类上。在具体实施例中，Cpf1和指导RNA引入使用载体表达的藻类中，该载体在组成型启动子的控制下表达Cpf1，例如Hsp70A-Rbc S2或β2-微管蛋白。指导RNA任选地使用含有T7启动子的载体递送。可替代地，Cas9 mRNA和体外转录的指导RNA可以是递送至藻类细胞中。电穿孔方法对于技术人员而言是可用的，例如来自GeneArt Chlamydomonas Engineering试剂盒的标准推荐方法。

在具体实施例中，本文使用的内切核酸酶是拆分的Cpf1酶。拆分的Cpf1酶优先用于藻类中以进行靶向基因组修饰，如在WO 2015086795中对于Cas9已描述的。使用Cpf1拆分系统是特别适用于一种基因组靶向的诱导型方法，并且避免了藻类细胞中Cpf1过量表达的潜在毒性作用。在具体实施例中，所述Cpf1拆分结构域(RuvC和HNH结构域)可以同时或依次引入到细胞中，以使得所述一个或多个拆分的Cpf1结构域具有藻类细胞中的靶核酸序列。拆分的Cpf1与野生型Cpf1相比减小的尺寸允许使用将CRISPR系统递送至细胞的其他方法，例如使用如本文所述的细胞穿透肽。用于生成遗传修饰性藻类的此方法是特别目的。

在酵母细胞中引入编码Cpf1组分的多核苷酸。

在具体实施例中，本发明涉及使用Cpf1 CRISPR系统进行酵母细胞的基因组编辑。用于转化可用于引入编码Cpf1 CRISPR系统组分的多核苷酸的酵母细胞的方法是技术人员已熟知的并通过Kawai等人,2010,Bioeng Bugs.[生物工程缺陷]2010年11月-12月；1(6):395-403)。非限制性实例包括通过乙酸锂处理(可以进一步包括携带者DNA和PEG处理)、轰击或通过电穿孔来转化酵母细胞。

在植物和植物细胞中瞬时表达Cpf1 CRISP系统组分

在具体实施例中，设想的是，在植物细胞中瞬时表达指导RNA和/或Cpf1基因。在这些实施例中，Cpf1 CRISPR系统可以确保仅当指导RNA和Cpf1蛋白两者均存在于细胞中时修饰靶基因，以使得基因组修饰可以得到进一步控制。当Cpf1酶的表达是瞬时的时，由此类植物细胞再生的植物典型地不含有外源DNA。在具体实施例中，Cpf1酶是由植物细胞稳定表达的并且指导序列是瞬时表达的。

在具体实施例中，Cpf1 CRISPR系统组分可以是使用植物病毒载体引入在植物细胞中(Scholthof等人1996,Annu Rev Phytopathol.[植物病理学年度评审]1996；34:299-323)。在另外的具体实施例中，所述病毒载体是来自DNA病毒的载体。例如，双粒病毒组(例如，卷心菜曲叶病毒、豆黄矮病毒、小麦矮化病毒、番茄曲叶病毒、玉米条纹病毒、烟草曲叶病毒或番茄金色花叶病毒)或矮缩病毒组(例如蚕豆坏死黄脉病毒)。在另外的具体实施例中，所述病毒载体是来自RNA病毒的载体。例如，烟草脆裂病毒组(例如，烟草扰乱病毒、烟草花叶病毒)、马铃薯X病毒组(例如，马铃薯X病毒)、或大麦病毒组(例如，大麦条纹花叶病毒)。植物病毒复制基因组是非整合型载体。

在具体实施例中，用于瞬时表达Cpf1 CRISPR构建体的载体例如是pEAQ载体，该载体被专门定制用于在原生质体中进行土壤杆菌介导的瞬时表达(Sainsbury F.等人,PlantBiotechnol J.[植物生物技术杂志]2009年9月；7(7):682-93)。使用修饰的卷心菜曲叶病毒(CaLCuV)载体证实基因组位置的精确靶向，以在表达CRISPR酶的稳定转基因植物中表达gRNA(Scientific Reports[科技报告]5,文章编号：14926(2015),doi:10.1038/srep14926)。

在具体实施例中，编码指导RNA和/或Cpf1基因的双链DNA片段可以被瞬时引入到植物细胞中。在此类实施例中，以足够的量提供引入的双链DNA片段以修饰细胞，但在预期时间段过去之后或者在一次或多次细胞分裂之后不再持续。用于在植物中直接DNA转移的方法是技术人员已知的(参见例如，Davey等人Plant Mol Biol.[植物分子生物学]1989年9月；13(3):273-85)。

在其他实施例中，编码Cpf1蛋白的RNA多核苷酸被引入到植物细胞中，然后通过生成足够量的蛋白质的宿主细胞翻译并加工以修饰该细胞(在至少一个指导RNA存在下)，该引入在预期时间段过去之后或者在一次或多次细胞分裂之后不再持续。用于将mRNA引入到植物原生质体以进行瞬时表达的方法是技术人员已知的(参见例如Gallie,Plant CellReports[植物细胞报告](1993),13；119-122)。

还设想了以上描述的不同方法的组合。

将Cpf1 CRISPR组分递送至植物细胞

在具体实施例中，目的是将Cpf1 CRISPR系统的一种或多种组分直接递送至植物细胞。这尤其对于生成非转基因植物是目的(参见下文)。在具体实施例中，在植物或植物细胞外制备一种或多种Cpf1组分并且将其递送至细胞。例如，在具体实施例中，体外制备Cpf1蛋白，之后引入到植物细胞中。Cpf1蛋白可以是通过本领域技术人员已知的不同方法来制备并且包括重组产生。在表达之后，Cpf1蛋白被分离，在需要时被折叠，被纯化并任选地处理以去除任何纯化标签例如His-标签。一旦获得粗的、部分纯化的、或更完全纯化的Cpf1蛋白，就可以将该蛋白引入到植物细胞中。

在具体实施例中，该Cpf1蛋白与靶向目的基因的指导RNA混合，以形成预组装的核糖核蛋白。

单独组分或预组装核糖核蛋白可以经由电穿孔、通过用Cpf1相关基因产品包覆的粒子轰击、通过化学转染或通过转运穿过细胞膜的一些其他方式来引入到植物细胞中。例如，已证实用预组装CRISPR核糖核蛋白转染植物原生质体确保了植物基因组的靶向修饰(如通过Woo等人Nature Biotechnology[自然生物技术],2015；DOI:10.1038/nbt.3389)。

在具体实施例中，Cpf1 CRISPR系统组分是使用纳米粒子引入到植物细胞中。这些组分，无论是蛋白质或核酸或其组合都可以上载到纳米粒子上或包装在纳米粒子中并且适用于这些植物(例如像WO 2008042156和US 20130185823所述的)。具体地说，本发明的实施例包括上载有以下或包装有以下的纳米粒子：编码Cpf1蛋白的一个或多个DNA分子、编码指导RNA的DNA分子和/或如WO 2015089419所述的分离的指导RNA。

将Cpf1 CRISPR系统的一种或多种组分引入到植物细胞中的其他方式是通过使用细胞穿透肽(CPP)。因此，在具体实施例中，本发明包括含有连接至Cpf1蛋白的细胞穿透肽的组合物。在本发明的具体实施例中，Cpf1蛋白和/或指导RNA连接一个或多个CPP，以在植物原生质体内有效转运它们；还参见Ramakrishna(20140Genome Res.[基因组研究]2014年6月；24(6):1020-7，Cas9in human cells[人类细胞中的Cas9])。在其他实施例中，该Cpf1基因和/或指导RNA是通过连接至一个或多个CPP以进行植物原生质体递送的一个或多个环状或非环状DNA分子来编码。这些植物原生质体然后再生成植物细胞并进一步再生成植物。CPP通常被描述为来源于蛋白质或来源于能够以受体独立性方式转运生物分子穿过细胞膜的嵌合序列的小于35个氨基酸的短肽。CPP可以是阳离子肽、具有疏水性序列的肽、两亲性肽、具有脯氨酸富集序列和抗微生物序列的肽、以及嵌合肽或二分肽(Pooga和Langel2005)。CPP能够穿透生物膜并且同样引发不同生物分子移动穿过细胞膜进入细胞质并改善其细胞内路线，并且因此有助于生物分子与靶标相互作用。CPP的实例包括以下其他：Tat(它是一种1型HIV进行病毒复制所需要的核转录激活蛋白)、穿膜肽、卡波西成纤维细胞增长因子(FGF)信号肽序列、整合素β3信号肽序列；聚精氨酸肽Args序列、富含鸟嘌呤分子转运体、甜箭头肽等……

使用Cpf1 CRISPR系统制备遗传修饰的非转基因植物

在具体实施例中，本文所述的方法用于修饰内源性基因或修饰其表达而不会永久性引入到任何外源性基因的植物的基因组中，包括编码CRISPR组分的外源性基因，以便避免在植物基因组中存在外源DNA。这可能是目的，因为非转基因植物的调节要求较不严格。

在具体实施例中，这是通过Cpf1 CRISPR组分的瞬时表达来保证的。在具体实施例中，一种或多种CRISPR组分是在一种或多种病毒载体上表达的，该一种或多种表达载体产生足够的Cpf1蛋白和指导RNA，以一致地稳定地确保根据本文所述的方法修饰目的基因。

在具体实施例中，在植物原生质体中确保Cpf1 CRISPR构建体的瞬时表达并且因此该构建体并未整合到基因组中。有限表达窗可以足以允许Cpf1 CRISPR系统确保如本文所述的靶基因的修饰。

在具体实施例中，Cpf1 CRISPR系统的不同组分借助于上文所述的粒子递送分子例如纳米粒子或CPP分子单独或混合地引入在植物细胞、原生质体或植物组织中。

Cpf1 CRISPR组分的表达可以通过Cpf1核酸酶的直接活性和任选地引入模板DNA或者通过修饰使用如本文所述的Cpf1 CRISPR系统靶向的基因来诱导基因组的靶向修饰。上文所述的不同策略允许Cpf1介导的靶向基因组编辑而不需要将Cpf1CRISPR组分引入到植物基因组中。瞬时引入到植物细胞中的组分典型地在杂交时去除。

检测植物基因组选择标记的修饰

在具体实施例中，当方法涉及植物基因组内源性靶基因的修饰时，任何适合的方法可以用于在植物、植物部分或植物细胞用Cpf1 CRISPR系统感染或转染之后确定基因靶向或靶向诱变是否发生在靶位点。在该方法涉及靶基因引入的情况下，转化的植物细胞、愈伤组织、组织或植物可以是通过选择或筛选存在转基因或由转基因编码的性状的工程化植物材料来鉴定和分离。物理方法和生物化学方法可以用于鉴定含有插入的基因构建体或内源性DNA修饰的植物或植物细胞转化株。这些方法包括但不限于：1)用于检测并确定重组DNA插入物或修饰的内源性基因的结构的DNA印迹分析或PCR扩增；2)用于检测并检查基因构建体的RNA转录物的rna印迹、S1RNA酶保护、引物延伸或逆转录酶PCR扩增；3)用于检测酶或核糖核酸酶的酶法测定，其中此类基因产物是由基因构建体编码的或者表达受到遗传修饰的影响；4)蛋白质凝胶电泳、蛋白质印迹技术、免疫沉淀反应或酶联免疫分析，其中基因构建体或内源性基因产物是蛋白质。附加技术例如原位杂交、酶染色以及免疫染色也可以用于检测重组构建体的存在或表达或者检测特定植物器官和组织中的内源性基因修饰。用于完成所有这些测定的方法是本领域的技术人员熟知的。

另外地(或可替代地)，编码Cpf1 CRISPR组分的表达系统典型地被设计为包含一种或多种选择标记或可检测标记，这些标记提供一种分离或有效选择含有Cpf1CRISPR系统并且/或者已在早期阶段且以大规模地被该系统修饰的细胞的方式。

在土壤杆菌介导的转化的情况下，标记盒可以与侧接T-DNA边界相邻或处于这些边界之间并且包含在二元载体之内。在另一个实施例中，标记盒可以处于T-DNA之外。选择标记盒也可以处于与表达盒相同的T-DNA边界内或与这些边界相邻或者可以处于二元载体上的第二T-DNA内的其他位置处(例如，2T-DNA系统)。

对于粒子轰击或使用原生质体转化，表达系统可以包含一种或多种分离的线性片段或者可以是含有细菌复制元件、细菌选择标记或其他可检测元件的较大构建体的一部分。包含编码指导序列和/或Cpf1的多核苷酸的这个或这些表达盒可以是物理连接至标记盒或者可以是与编码标记盒的第二核酸分子混合。标记盒包含表达允许有效选择转化细胞的可检测标记或选择标记的必需元件。

基于选择标记的细胞选择程序将取决于标记基因的性质。在具体实施例中，使用选择标记，即允许基于标记的表达直接选择细胞的标记。选择标记可以赋予阳性选择或阴性选择并且对于外部底物的存在是有条件的或没有条件的(Miki等人2004,107(3):193-232)。常见地，将抗生素或除草剂抗性基因用作标记，由此通过在含有抑制量的抗生素或除草剂(标记基因对其赋予抗性)的培养基上生长工程化植物材料来进行选择。此类细菌的实例是对抗生素例如潮霉素(hpt)和潮霉素(nptII)赋予抗性的基因和对除草剂例如草铵膦(bar)和氯磺隆(als)赋予抗性的基因，

转化植物和植物细胞也可以通过筛选可见标记，典型地为能够处理有色底物(例如，β-葡糖醛酸糖苷酶、萤虫素酶、B或C1基因)的活性来鉴定的。此类选择和筛选方法是本领域的技术人员所熟知的。

植物培养和再生

在具体实施例中，具有修饰基因组并且通过本文所述的方法中的任一个产生或获得的植物细胞可以被培养至再生成具有转化或修饰表型并因此具有所希望的表型的全株。常规再生技术是本领域技术人员熟知的。此类再生技术的具体实例依赖于组织培养生长培养基中某些植物激素的操纵，并且典型地依赖于已与所希望的核苷酸序列一起引入的杀生物剂和/或除草剂标记。在另外的具体实施例中，植物再生是从培养的原生质体、植物愈伤组织、外植体、器官、花粉、胚胎或其部分获得的(参见例如，Evans等人(1983),Handbook ofPlant Cell Culture[植物细胞培养手册],Klee等人(1987)Ann.Rev.of Plant Phys.[植物生物学年评])。

在具体实施例中，如本文所述的转化或改善的植物可以自体受精以提供本发明的纯合改善植物(对于DNA修饰是纯合的)种子，或者可以与非转基因植物或不同的改善植物杂交以提供纯合植物的种子。当重组DNA引入到植物细胞中时，这种杂交所得植物是对于重组DNA分子为杂合的植物。通过与改进植物杂交并包含遗传修饰(可以是重组DNA)的此类纯合植物和杂合植物本文被称为“子代”。子代植物是从原始转基因植物传代并且含有通过本文提供的方法引入的基因组修饰或重组DNA分子的植物。可替代地，遗传修饰植物可以是通过以上所述方法之一使用Cfp1酶来获得的，因此无外源DNA结合到该基因组中。通过进一步育种获得的此类植物的子代也可以含有遗传修饰。育种是通过常用于不同农作物的任何育种方法来进行(例如，Allard,Principles of Plant Breeding[植物育种原则],纽约约翰威利父子出版公司(John Wiley和Sons,NY,U.of CA),美国加利福尼亚州戴维斯(Davis,CA)50-98(1960)。

生成具有增强的农艺性状的植物

本文提供的基于Cpf1的CRISPR系统可以用于引入靶向双链或单链断裂并且/或者引入基因激活因子和或阻遏物并且(不限于)可以用于基因靶向、基因置换、靶向诱变、靶向缺失或插入、靶向倒位和/或靶向易位。通过在单个细胞中共表达涉及实现多个修饰的多个靶向RNA，可以确保多重基因组修饰。此技术可以用于高度精确工程化植物以使其具有改善的特征，包括增强的营养品质、增加的对疾病的抗性和对生物和非生物胁迫的抗性、以及增加的有商业价值的植物产品或异源化合物的产生。

在具体实施例中，如本文所述的Cpf1 CRISPR系统可以用于在内源性DNA序列中引入靶向双链断裂(DSB)。该DSB激活细胞DNA修复途径，该修复途径可以用于实现所希望的断裂位点附近的DNA序列修饰。当内源性基因失活可以赋予或促成所希望的性状时，这是目的。在具体实施例中，在DSB位点处促成使用模板序列的同源重组，以便引入目的基因。

在具体实施例中，Cpf1 CRISPR系统可以用作融合至或可操作地连接至功能结构域以激活和/或阻遏内源性植物基因的通用核酸结合蛋白。示例性功能结构域可以包括但不限于，翻译起始区、翻译激活因子、翻译阻遏物、核酸酶(具体地是核糖核酸酶)、剪接体、珠粒、光诱导型/控制型的结构域或化学诱导型/控制型的结构域。典型地，在这些实施例中，该Cpf1蛋白包含至少一个突变，以使得它具有不超过不具有该至少一个突变的Cpf1蛋白的活性的5％的活性；指导RNA包含能够与靶序列杂交的指导序列。

本文所述的方法通常导致生成“改善植物”，在这点上它们与野生型植物相比具有一种或多种希望的性状。在具体实施例中，获得的这些植物、植物细胞或植物部分是包含整合到所有或部分植物细胞的基因组中的内源性DNA序列的转基因植物。在具体实施例中，获得非转基因遗传修饰植物、植物部分或细胞，在这点上没有内源性DNA序列结合到植物的植物细胞中的任一个的基因组中。在此类实施例中，改善植物是非转基因的。当仅确保内源性基因的修饰并且在植物基因组中未引入或维持外源性基因时，所得遗传修饰农作物不含有外源基因并且因此可以基本上认为是非转基因的。在下文中更详细地描述了用于植物基因组编辑的Cpf1 CRISPR系统的不同应用：

a)引入一种或多种外源基因以赋予目的农业性状

本发明提供了基因组编辑或修饰与目的靶座位缔合的或在该靶座位处的序列的方法，其中该方法包括将Cpf1效应蛋白复合物引入到植物细胞中，由此Cpf1效应蛋白复合物有效地用于将DNA插入物(例如编码目的外源基因的插入物)整合到植物细胞的基因组中。在优选实施例中，DNA插入物的整合是通过用外源引入的DNA模板或修复模板进行HR来促成的。典型地，外源引入的DNA模板或修复模板与Cpf1效应蛋白复合物或一种组分或用于表达复合物组分的多核苷酸载体一起来递送。

本文提供的Cpf1 CRISPR系统允许靶向基因递送。已经越来越清楚的是，表达目的基因的效率在很大程度上是由整合到基因组中的位置来确定的。本发明方法允许将外源基因靶向整合到基因组中希望的位置处。该位置可以是基于先前生成事件的信息来选择的或者可以通过本文任何位置披露的方法来选择的。

在具体实施例中，本文提供的方法包括(a)将包含指导RNA(包含同向重复序列和指导序列)的Cpf1 CRISPR复合物引入到细胞中，其中该指导序列与植物细胞内源性靶序列杂交；(b)将在指导序列与靶序列杂交时与指导RNA复合并且诱导处于或靠近指导序列所靶向的序列的双链断裂的Cpf1效应分子引入到该植物细胞中；和(c)将编码HDR修复模板的核苷酸序列引入到细胞中，该修复模板编码目的基因并且作为HDR的结果被引入到DS断裂位置中。在具体实施例中，引入的步骤可以包括将编码Cpf1效应蛋白、指导RNA和修复模板的一个或多个多核苷酸递送到植物细胞中。在具体实施例中，这些多核苷酸是通过DNA病毒(例如，双粒病毒组)或RNA病毒(例如，烟草脆裂病毒组)来递送到细胞中的。在具体实施例中，引入步骤包括将含有编码Cpf1效应蛋白、指导RNA和修复模板的一个或多个多核苷酸序列的T-DNA递送到植物细胞中，其中该递送是经由土壤杆菌。编码Cpf1效应蛋白的核酸序列可以是可操作地连接至启动子，例如组成型启动子(例如，花椰菜花叶病毒35S启动子)或细胞特异型或诱导型启动子。在具体实施例中，多核苷酸是通过微粒轰击来引入的。在具体实施例中，该方法进一步包括在引入步骤后筛选植物细胞，以确定是否引入修复模板，即模板基因。在具体实施例中，这些方法包括由植物细胞再生植物的步骤。在另外的实施例中，这些方法包括杂交育种该植物以获得遗传上希望的植物谱系。编码目的性状的外源基因的实例列出在下文中。

b)编辑内源性基因以赋予目的农艺性状

本发明提供了基因组编辑或修饰与目的靶座位相关联的或在该靶座位处的序列的方法，其中该方法包括将Cpf1效应蛋白复合物引入到植物细胞中，由此Cpf1效应蛋白复合物修饰植物内源性基因的表达。这可以不同方式来实现。在具体实施例中，消除内源性基因的表达是希望的并且使用Cpf1 CRISPR复合物靶向并裂解内源性基因，以便修饰基因表达。在这些实施例中，本文提供的方法包括(a)将包含指导RNA(包含同向重复序列和指导序列)的Cpf1 CRISPR复合物引入到植物细胞中，其中该指导序列与植物细胞基因组的目的基因内的靶序列杂交；和(b)将Cpf1效应蛋白引入到该细胞中，当结合指导RNA时，该效应蛋白包含与靶序列杂交、确保处于或靠近指导序列所靶向的序列的双链断裂的指导序列；在具体实施例中，引入的步骤可以包括将编码Cpf1效应蛋白和指导RNA的一个或多个多核苷酸递送到植物细胞中。

在具体实施例中，这些多核苷酸是通过DNA病毒(例如，双粒病毒组)或RNA病毒(例如，烟草脆裂病毒组)来递送到细胞中的。在具体实施例中，引入步骤包括将含有编码Cpf1效应蛋白和指导RNA的一个或多个多核苷酸序列的T-DNA递送到植物细胞中，其中该递送是经由土壤杆菌。编码Cpf1 CRISPR系统组分的多核苷酸序列可以是可操作地连接至启动子，例如组成型启动子(例如，花椰菜花叶病毒35S启动子)或细胞特异型或诱导型启动子。在具体实施例中，多核苷酸是通过微粒轰击来引入的。在具体实施例中，该方法进一步包括在引入步骤后筛选植物细胞，以确定是否修饰目的基因的表达。在具体实施例中，这些方法包括由植物细胞再生植物的步骤。在另外的实施例中，这些方法包括杂交育种该植物以获得遗传上希望的植物谱系。

在以上所述方法的具体实施例中，抗病性农作物是通过靶向突变疾病易感性基因或编码植物防卫基因的负调节物的基因(例如，Mlo基因)来获得的。在一个具体实施例中，抗除草剂农作物是通过靶向取代植物基因例如编码乙酰乳酸合酶(ALS)和原卟啉原氧化酶(PPO)的基因的特定核苷酸来生成的。在具体实施例中，通过靶向突变编码非生物胁迫耐受性的负调节物的基因而产生的干旱耐盐农作物、通过靶向突变Waxy基因而产生的低直链淀粉谷物、通过靶向突变糊粉层中的主要脂肪酶基因而产生的具有降低的酸败性的水稻或其他谷物等。编码目的性状的内源性基因的更广泛列表列出在下文中。

c)通过Cpf1 CRISPR系统调节内源性基因以赋予目的农艺性状

本文还提供了用于使用本文提供的Cpf1蛋白调节(即，激活或阻遏)内源性基因表达的方法。此类方法利用通过Cpf1复合物靶向植物基因组的一个或多个不同RNA序列。更具体地说，一个或多个不同RNA序列结合两个或更多个衔接体蛋白质(例如，适配体)，由此每个衔接体蛋白质与一个或多个功能结构域缔合并且其中与该衔接体蛋白质缔合的一个或多个结构域中的至少一个功能结构域具有一种或多种活性，包括甲基化酶活性、脱甲基化酶活性、转录激活活性、转录阻遏活性、转录释放因子活性、组蛋白修饰活性、DNA整合活性、RNA切割活性、DNA切割活性或核酸结合活性；这些功能结构域用于调控内源性植物基因的表达以便获得所希望的性状。典型地，在这些实施例中，该Cpf1蛋白具有一个或多个突变，以使得它具有不超过不具有该至少一个突变的Cpf1效应蛋白的核酸酶活性的5％的核酸酶活性。

在具体实施例中，本文提供的方法包括以下步骤：(a)将包含指导RNA(包含同向重复序列和指导序列)的Cpf1 CRISPR复合物引入到细胞中，其中该指导序列与植物细胞内源性靶序列杂交；(b)将在指导序列与靶序列杂交时与指导RNA复合的Cpf1效应分子引入到植物细胞中；并且其中指导RNA被修饰为包含结合功能结构域的不同RNA序列(适配体)和/或Cpf1效应蛋白被修饰为使得它连接至功能结构域。在具体实施例中，引入的步骤可以包括将编码(修饰的)Cpf1效应蛋白和(修饰的)指导RNA的一个或多个多核苷酸递送到植物细胞中。本文任何位置处描述了用于这些方法中的Cpf1 CRISPR系统组分的详情。

在具体实施例中，这些多核苷酸是通过DNA病毒(例如，双粒病毒组)或RNA病毒(例如，烟草脆裂病毒组)来递送到细胞中的。在具体实施例中，引入步骤包括将含有编码Cpf1效应蛋白和指导RNA的一个或多个多核苷酸序列的T-DNA递送到植物细胞中，其中该递送是经由土壤杆菌。编码Cpf1 CRISPR系统的一种或多种组分的核酸序列可以是可操作地连接至启动子，例如组成型启动子(例如，花椰菜花叶病毒35S启动子)或细胞特异型或诱导型启动子。在具体实施例中，多核苷酸是通过微粒轰击来引入的。在具体实施例中，该方法进一步包括在引入步骤后筛选植物细胞，以确定是否修饰目的基因的表达。在具体实施例中，这些方法包括由植物细胞再生植物的步骤。在另外的实施例中，这些方法包括杂交育种该植物以获得遗传上希望的植物谱系。编码目的性状的内源性基因的更广泛列表列出在下文中。

使用Cpf1修饰多倍体植物

许多植物是多倍体，这意味着它们携带其基因组的复制拷贝，有时多至六个，像在小麦中。根据本发明利用Cpf1 CRISPR效应蛋白的方法可以“多重”影响基因的所有拷贝或者一次靶向许多基因。例如，在具体实施例中，本发明的方法用于同时确保不同基因中负责抑制针对疾病的防卫的失功能突变。在具体实施例中，本发明的方法用于同时抑制小麦植物细胞内TaMLO-Al、TaMLO-Bl和TaMLO-Dl核酸序列的表达并且由该细胞再生小麦植物，以便确保该小麦植物抵抗白粉病(还参见WO2015109752)。

赋予农艺性状的示例性基因

如上文所述的，在具体实施例中，本发明涵盖如本文所述的Cpf1 CRISPR用于插入目的DNA(包括一个或多个植物可表达基因)的用途。在另外的具体实施例中，本发明涵盖使用如本文所述的Cpf1系统用于部分或完全缺失一个或多个植物表达基因的方法和工具。在另外的具体实施例中，本发明涵盖使用如本文所述的Cpf1系统确保一种或多种植物表达基因通过突变、驱动、插入一个或多个核苷酸来修饰的方法和工具。在其他具体实施例中，本发明涵盖如本文所述的Cpf1 CRISPR系统确保通过特定修饰引导一个或多个植物表达基因的表达的一种或多种调节元件来修饰所述基因的表达。

在具体实施例中，本发明涵盖涉及引入内源性基因和/或靶向内源性基因以及其调节元件的方法，例如以下列出的基因：

1.赋予对害虫或疾病的抗性的基因：

植物疾病抗性基因。植物可以用克隆的抗性基因转化以工程化对特定病原体菌株具有抗性的植物。参见，例如，Jones等人,Science[科学]266:789(1994)(cloning of thetomato Cf-9gene for resistance to Cladosporium fulvum[对黄枝孢霉的抗性的番茄Cf-9基因的克隆])；Martin等人,Science[科学]262:1432(1993)(tomato Pto gene forresistance to Pseudomonas syringae pv.tomato encodes a protein kinase[对丁香假单胞菌番茄致病变种的抗性的番茄Pto基因编码蛋白激酶])；Mindrinos等人,Cell[细胞]78:1089(1994)(Arabidopsmay be RSP2gene for resistance to Pseudomonassyringae[拟南芥可以是对丁香假单胞菌的抗性的RSP2基因])。

赋予对害虫例如大豆囊胞线虫的抗性的基因。参见例如，PCT申请WO96/30517；PCT申请WO 93/19181。

苏云金芽孢杆菌蛋白，参见例如，Geiser等人,Gene[基因]48:109(1986)。

凝集素，参见例如，Van Damme等人,Plant Molec.Biol.[植物分子]24:25(1994。

维生素结合蛋白，例如抗生物素蛋白，参见PCT申请US 93/06487，该申请教授了抗生物素蛋白和抗生物素蛋白同源物作为针对害虫的杀幼虫剂的用途。

酶抑制剂例如蛋白酶或朊酶抑制剂或淀粉酶抑制剂。参见例如,Abe等人,J.Biol.Chem.[生物化学杂志]262:16793(1987),Huub等人,Plant Molec.Biol.[植物分子生物学]21:985(1993))，Sumitani等人,Biosci.Biotech.Biochem.[生物科学、生物技术和生物化学]57:1243(1993)和美国专利号5,494,813。

昆虫特有的激素或信息素，例如蜕皮甾类或保幼激素、或其变体、基于它的模拟物、或其拮抗剂或激动剂。参见例如，Hammock等人,Nature[自然]344:458(1990)。

昆虫特有的肽或神经肽，这些肽在表达时破坏受影响害虫的生理学。例如Regan,J.Biol.Chem.[生物化学杂志]269:9(1994)和Pratt等人,Biochem.Biophys.Res.Comm.[生物化学与生物物理学研究通讯]163:1243(1989)。还参见美国专利号5,266,317。

在自然界中由蛇、黄蜂或任何其他生物体产生的昆虫特有的毒液。参见例如，Pang等人,Gene[基因]116:165(1992)。

引起单萜、倍半萜、甾体、异羟肟酸、苯丙素衍生物或具有杀昆虫活性的另一种非蛋白质分子超积累的酶。

涉及生物活性分子修饰(包括翻译后修饰)的酶；例如，糖解酶、蛋白水解酶、脂解酶、核酸酶、环化酶、转氨酶、酯酶、水解酶、磷酸酶、激酶、磷酸化酶、聚合酶、弹性蛋白酶、壳多糖酶以及葡聚糖酶，无论是天然还是合成的。参见PCT申请WO 93/02197，Kramer等人,Insect Biochem.Molec.Biol.[昆虫生物化学与分子生物学]23:691(1993)和Kawalleck等人,Plant Molec.Biol.[植物分子生物学]21:673(1993)。

刺激信号转导的分子。参见例如，Botella等人,Plant Molec.Biol.[植物分子生物学]24:757(1994)，和Griess等人,Plant Physiol.[植物生理学]104:1467(1994)。

病毒侵入蛋白或源于此的复合物毒素。参见Beachy等人,Ann.rev.Phytopathol.[植物病理学年度回顾]28:451(1990)。

在自然界中由病原体或寄生虫产生的发育阻滞蛋白(Developmental-arrestiveprotein)。参见Lamb等人,Bio/Technology[生物/技术]10:1436(1992)和Toubart等人,Plant J.[植物杂志]2:367(1992)。

在自然界中由植物产生的发育阻滞蛋白。例如，Logemann等人,Bio/Technology[生物/技术]10:305(1992)。

在植物中，病原体常常是宿主特异性的。例如，一些镰刀菌种类将引起番茄枯萎病但仅攻击番茄，而其他镰刀菌种类仅攻击小麦。植物具有现存和诱导的防卫以抵抗大部分病原体。跨植物各代的突变和重组事件导致引起易感性的遗传变异性，特别是当病原体以比植物更大频率繁殖时。在植物中可以存在非宿主抗性，例如宿主和病原体是不相容的或者可以存在针对所有病原体种族的部分抗性，这些抗性典型地是通过许多基因来控制的，并且/或者也存在对一些病原体种族而不是其他种族的完全抗性。此抗性典型地是通过几种基因控制的。使用多种方法和CRISP-cpf1系统组分，现在存在一种本文预先诱导特异性突变的新工具。因此，可以分析抗性基因来源基因组，并且在具有所希望的特征或形状的植物中，使用诱导抗性基因增加的方法和Cpf1CRISPR系统组分。本发明系统可以比先前的诱变剂更精确地完成此分析并且因此加速并改善植物育种程序。

2.涉及植物疾病的基因，例如WO 2013046247列出的基因：

水稻病害：稻梨孢、宫部旋孢腔菌、立枯丝核菌、藤仓赤霉；小麦病害：白粉病菌、禾谷镰刀菌、燕麦镰刀菌(F.avenaceum)、黄色镰刀菌、雪霉叶枯菌、条形柄锈菌、禾柄锈菌、隐匿柄锈菌、粉红雪腐病菌(Micronectriella nivale)、核瑚菌属物种、小麦黑粉菌、小麦网腥黑穗病菌(Tilletia caries)、小麦基腐病菌、禾生球腔菌、小麦壳多孢、偃麦草核腔菌；大麦病害：白粉病菌、禾谷镰刀菌、燕麦镰刀菌(F.avenaceum)、黄色镰刀菌、雪霉叶枯菌、条形柄锈菌、禾柄锈菌、大麦柄锈菌、裸黑粉菌、大麦云纹斑病菌、圆核腔菌、禾旋孢腔菌、麦类核腔菌、立枯丝核菌：玉米病害：玉米黑粉菌、异旋孢腔菌、高粱胶尾孢、多堆柄锈菌、玉米灰斑病菌、立枯丝核菌；

柑橘病害：柑橘间座壳菌(Diaporthe citri)、柑橘痂囊腔菌(Elsinoefawcetti)、指状青霉菌、桔青霉菌(P.italicum)、寄生疫霉、柑橘褐腐疫霉；苹果病害：苹果链核盘菌(Monilinia mali)、苹果树腐烂病菌(Valsa ceratosperma)、苹果白粉病菌、互隔交链孢菌苹果致病型、苹果黑星病菌、尖孢炭疽(Colletotrichum acutatum)、恶疫霉；

梨病害：梨黑星病菌(Venturia nashicola)、梨黑星菌(V.pirina)、互隔交链孢霉日本梨致病型、梨胶锈菌(Gymnosporangium haraeanum)、恶疫霉；

桃病害：褐腐病菌、嗜果枝孢菌(Cladosporium carpophilum)、拟茎点霉属物种(Phomopsis sp.)；

葡萄病害：痂囊腔菌(Elsinoe ampelina)、檬果炭疽病菌、葡萄白粉菌(Uninulanecator)、葡萄锈病菌(Phakopsora ampelopsidis)、葡萄球座菌、葡萄霜霉菌；

柿子病害：柿盘长孢(Gloesporium kaki)、柿角斑病菌(Cercospora kaki)、柿叶球腔菌(Mycosphaerela nawae)；

瓠果病害：瓜类炭疽菌、黄瓜白粉病菌、甜瓜球腔菌(Mycosphaerella melonis)、尖孢镰刀菌、黄瓜霜霉病菌、疫霉属物种、腐霉属物种；

番茄病害：茄链格孢菌、番茄叶霉病菌(Cladosporium fulvum)、致病疫霉菌；

茄子病害：茄褐纹病菌(Phomopsis vexans)、二孢白粉菌；

十字花科蔬菜病害：萝卜链格孢菌(Alternaria japonica)、白菜白斑病菌(Cercosporella brassicae)、根肿病菌(Plasmodiophora brassicae)、寄生霜霉菌；

大葱病害：葱柄锈菌(Puccinia allii)、大葱霜霉(Peronospora destructor)；

大豆病害：大豆紫斑病菌、大豆痂囊腔菌(Elsinoe glycines)、菜豆间座壳大豆变种、大豆壳针孢、大豆尾孢、豆薯层锈菌、大豆疫霉病菌、立枯丝核菌、棒抱叶斑病菌(Corynespora casiicola)、核盘菌；

菜豆病害：菜豆炭疽病菌；

花生病害：花生黑斑病菌(Cercospora personata)、花生褐斑病菌、齐整小核菌；

豌豆病害豌豆：豌豆白粉菌；

马铃薯病害：茄链格孢菌、致病疫霉菌、马铃薯疫霉绯腐病菌、马铃薯粉状疮痂病菌(Spongospora subterranean,f.sp.Subterranean)；

草莓病害：薄草单丝壳菌(Sphaerotheca humuli)、檬果炭疽病菌；

茶病害；茶网饼病菌(Exobasidium reticulatum)、荼白星病菌(Elsinoeleucospila)、拟盘多毛孢属物种、荼炭疽菌(Colletotrichum theae-sinensis)；

烟草病害：烟草赤星病菌(Alternaria longipes)、二孢白粉菌、烟草炭疽病菌(Colletotrichum tabacum)、烟草霜霉菌、烟草疫霉菌(Phytophthora nicotianae)；

油菜籽病害：核盘菌、立枯丝核菌；

棉花病害：立枯丝核菌；

甜菜病害：甜菜尾孢菌(Cercospora beticola)、水稻纹枯病菌、螺壳状丝囊霉(Aphanomyces cochlioides)；

玫瑰病害：蔷薇双壳菌(Diplocarpon rosae)、蔷薇单丝壳茵(Sphaerothecapannosa)、蔷薇霜霉(Peronospora sparsa)；

菊花和菊科病害：莴苣盘枝霉、野菊壳针抱(Septoria chrysanthemi-indici)、堀氏菊柄锈菌(Puccinia horiana)；

各种植物的病害：瓜果腐霉病菌、德巴利氏腐霉(Pythium debarianum)、禾草腐霉、畸雌腐霉、终极腐霉、灰葡萄孢菌、核盘菌；

萝卜病害：甘蓝链格孢；

结缕草病害：同果核盘菌、立枯丝核菌；

香蕉病害：香蕉黑条叶斑病菌、香蕉黄条叶斑病菌；

向日葵病害：向日葵霜霉病菌；

在不同植物生长早期阶段由以下引起的种子疾病或疾病：曲霉属某些种、青霉属某些种、镰刀菌某些种、赤霉菌某些种、木霉属某些种、根串珠霉属某些种、根霉属某些种、毛霉菌某些种、伏革菌属某些种、茎点霉属某些种、丝核菌某些种、色二孢属某些种等；

各种植物由杆菌属某些种、油壶菌属某些种等介导的病毒病。

3.赋予对除草剂的抗性的基因的实例：

对抑制生长点或分生组织的除草剂的抗性，该除草剂例如咪唑啉酮或硫酰脲，例如分别在Lee等人,EMBO J.[欧洲分子生物学学会杂志]7:1241(1988)，和Miki等人,Theor.Appl.Genet.[理论与应用遗传学]80:449(1990)。

草甘膦耐受性(分别由例如突变体5-烯醇丙酮莽草酸-3-磷酸合酶(EPSP)基因、aroA基因和草甘膦乙酰转移酶(GAT)基因赋予的抗性)、或者对于其他膦羧基化合物例如草铵膦的抗性(由来自链霉菌种类的草丁膦乙酰基转移酶(PAT)基因赋予，该链霉菌种类包括吸水链霉菌和绿色产色链霉菌(Streptomyces viridichromogenes))、以及对吡啶氧基或苯氧基丙酸和环异己酮的抗性(由ACC酶抑制剂编码基因赋予)。参见例如，美国专利号4,940,835和美国专利号6,248,876、美国专利号4,769,061、欧洲号0 333 033和美国专利号4,975,374。还参见欧洲号0242246，DeGreef等人,Bio/Technology[生物/技术]7:61(1989),Marshall等人,Theor.Appl.Genet.[理论与应用遗传学]83:435(1992)，Castle等人的WO 2005012515，以及WO2005107437。

对抑制光合成的除草剂的抗性，该除草剂例如三嗪(psbA和gs+基因)或苯基氰(腈水解酶基因)，以及谷胱甘肽s-转移酶，在Przibila等人,Plant Cell[植物细胞]3:169(1991)，美国专利号4,810,648，以及Hayes等人,Biochem.J.[生物化学杂志]285:173(1992)。

编码使除草剂去毒的酶或对抑制具有抗性的突变体谷氨酰胺合酶的基因，例如在美国专利申请序列号11/760,602中。或者去毒酶是编码草丁膦乙酰转移酶的酶(例如来自链霉菌种类的bar或pat蛋白)。草丁膦乙酰转移酶是例如描述于美国专利号5,561,236；5,648,477；5,646,024；5,273,894；5,637,489；5,276,268；5,739,082；5,908,810和7,112,665。

羟基苯丙酮酸双氧化酶(HPPD)抑制剂，即天然存在的HPPD抗病性酶，或者编码突变或嵌合HPPD酶的基因，如WO 96/38567、WO 99/24585、以及WO99/24586、WO 2009/144079、WO 2002/046387、或美国专利号6,768,044。

4.涉及非生物胁迫耐受性的基因的实例：

能够在植物细胞或植物中减少聚(ADP核糖)聚合酶(PARP)基因的表达和/或活性的转基因，如WO 00/04173或WO/2006/045633所述的。

能够减少这些植物或植物细胞的PARG编码基因的表达和/或活性的转基因，例如在WO 2004/090140中。

编码烟酰胺腺嘌呤二核苷酸补救合成途径的植物功能酶的转基因，这些酶包括烟酰胺酶、烟酰酸磷酸核糖基转移酶、烟酸单核苷酸腺嘌呤转移酶、烟酰胺腺嘌呤二核苷酸合成酶或烟酰胺磷酸核糖基转移酶，例如在EP 04077624.7、WO2006/133827、PCT/EP 07/002,433、EP 1999263、或WO 2007/107326中所述的。

参与碳水化合物生物合成的酶包括例如EP 0571427、WO 95/04826、EP0719338、WO96/15248、WO 96/19581、WO 96/27674、WO 97/11188、WO 97/26362、WO 97/32985、WO 97/42328、WO 97/44472、WO 97/45545、WO 98/27212、WO98/40503、WO99/58688、WO 99/58690、WO 99/58654、WO 00/08184、WO 00/08185、WO 00/08175、WO 00/28052、WO 00/77229、WO01/12782、WO 01/12826、WO02/101059、WO 03/071860、WO 2004/056999、WO 2005/030942、WO 2005/030941、WO 2005/095632、WO 2005/095617、WO 2005/095619、WO 2005/095618、WO2005/123927、WO 2006/018319、WO 2006/103107、WO 2006/108702、WO 2007/009823、WO00/22140、WO 2006/063862、WO 2006/072603、WO 02/034923、EP 06090134.5、EP06090228.5、EP 06090227.7、EP 07090007.1、EP 07090009.7、WO 01/14569、WO02/79410、WO 03/33540、WO 2004/078983、WO 01/19975、WO 95/26407、WO96/34968、WO 98/20145、WO99/12950、WO 99/66050、WO 99/53072、美国专利号6,734,341、WO 00/11192、WO 98/22604、WO 98/32326、WO 01/98509、WO 01/98509、WO 2005/002359、美国专利号5,824,790、美国专利号6,013,861、WO 94/04693、WO94/09144、WO 94/11520、WO 95/35026或WO 97/20936中所述的那些，或参与多聚果糖(尤其是菊粉和果聚糖类型)的产生的酶(如EP 0663956、WO 96/01904、WO96/21023、WO 98/39460、和WO 99/24593中所披露的)，参与α-1,4-葡聚糖的产生的酶(如WO 95/31553、US 2002031826、美国专利号6,284,479、美国专利号5,712,107、WO97/47806、WO 97/47807、WO 97/47808和WO 00/14249中所披露的)，参与α-1,6支链α-1,4-葡聚糖的产生的酶(如WO 00/73422中所披露的)，参与交替糖的产生的酶(如例如WO 00/47727、WO 00/73422、EP 06077301.7、美国专利号5,908,975和EP 0728213中所披露的)，参与透明质酸的产生的酶(如例如在WO 2006/032538、WO 2007/039314、WO 2007/039315、WO2007/039316、JP 2006304779、和WO2005/012529所披露的)。

改善抗旱性的基因。例如，WO 2013122472披露了功能泛素蛋白连接酶蛋白(UPL)、更确切地说是UPL3的缺乏或水平降低导致所述植物对水的需求减少或者对干旱的抗性提高。具有增加的耐旱性的转基因植物的其他实例披露于例如US2009/0144850、US 2007/0266453、以及WO 2002/083911。US2009/0144850描述了一种由于DR02核酸表达的改变而显示耐旱性表型的植物。US 2007/0266453描述了一种由于DR03核酸表达的改变而显示耐旱性表型的植物并且WO 2002/083911描述了一种由于保卫细胞中表达的ABC转运体活性降低而具有增加的对干旱胁迫的耐受性的植物。另一个实例是Kasuga和合著者(1999)的著作，他们描述了在正常生长条件下编码DREB1A的cDNA在转基因植物中的过表达激活了许多胁迫耐受性基因的表达并且导致对干旱、盐负荷以及寒冷的耐受性提高。然而，在正常生长条件下DREB1A的表达也导致严重生长迟缓(Kasuga(1999)Nat Biotechnol[自然生物技术]17(3)287-291)。

在另外的具体实施例中，农作物植物可以是通过影响特定植物性状来改善的。例如，通过开发耐杀有害生物剂植物、提高植物的抗病性、提高昆虫和线虫抗性、提高植物针对寄生杂草的抗性、提高植物耐旱性、提高植物营养价值、提高植物胁迫耐受性、避免自花授粉、植物饲料可消化性生物质、谷物产量等等。在下文中提供了若干特定的非限制性实例。

除单一基因的靶向突变之外，Cpf1CRISPR复合物可以被设计允许在植物中靶向突变多基因、缺失染色体片段、位点特异性整合转基因、体内定点诱变、以及精确基因置换或等位基因交换。因此，本文所述的方法在基因发现和验证、突变和顺基因育种、以及杂交育种中具有广泛的应用。这些应用有助于产生新一代的具有各种改善的农艺形状的遗传修饰农作物，这些农艺形状例如除草剂耐受性、抗病性、非生物胁迫耐受性、高产率、以及优等品质。

使用Cpf1基因创建雄性不育植物

杂交植物与自交植物相比典型地具有有利的农艺形状。然而，对于自花授粉植物，杂种传代可能是有挑战的。在不同植物类型中，基因已被修饰，这对于植物能育性，更具体地说雄性能育性是重要的。例如，在玉米中，至少两种基因已被修饰，这在能育性方面是重要的(Amitabh Mohanty International Conference on New Plant Breeding MolecularTechnologies Technology Development And Regulation[关于新植物育种分子技术、技术发展与管理的阿米塔布莫汉蒂国际会议]，2014年10月9-10日，印度斋蒲尔(Jaipur,India)；Svitashev等人Plant Physiol.[植物生理学]2015年10月；169(2):931-45；Djukanovic等人Plant J.[植物杂志],2013年12月；76(5):888-99)。本文提供的方法可以用于靶向雄性能育性所需要的基因，以便生成雄性不育植物，这些植物可以易于杂交以生成杂种。在具体实施例中，本文提供的Cpf1 CRISPR系统用于靶向诱变细胞色素P450-样基因(MS26)或大范围核酸酶基因(MS45)，从而向玉米植物赋予雄性不育性。像这样遗传改变的玉米植物可以用于杂交育种程序中。

增加植物的能育性阶段

在具体实施例中，本文提供的方法用于延长植物例如水稻植物的能育性阶段。例如，可以靶向水稻能育性阶段基因例如Ehd3，以便生成基因中的突变并且可以选择小植物以延长再生植物能育性阶段(如CN 104004782中所述的)

使用Cpf1生成目的农作物的遗传变异

作物植物中野生种质和遗传变异的可用性是农作物改善程序的关键，但是来自作物植物的种质的可用多样性是有限的。本发明设想了用于生成目的种质的遗传变异的多样性的方法。在Cpf1 CRISPR系统的此应用中，提供了靶向植物基因组中的不同位置的指导RNA文库并且该文库与Cpf1效应蛋白一起引入到植物细胞中。以这种方式，可以生成基因组规模的点突变和基因敲除的集合。在具体实施例中，这些方法包括由如此获得的细胞生成植物部分或植物并且筛选目的性状的细胞。靶基因可以包含编码区和非编码区两者。在具体实施例中，该性状是胁迫耐受性的并且该方法是一种用于生成胁迫耐受性农作物种类。

使用Cpf1影响果实催熟

催熟(ripening)是果实和蔬菜成熟过程中的正常阶段。仅在催熟开始后的几天，催熟致使果实或蔬菜不可食用。此过程对农民和消费者造成大量损失。在具体实施例中，本发明的方法可以用于减少乙烯产生。这是通过确保以下中的一种或多种来保证的：a.抑制ACC合酶基因表达。ACC(1-氨基环丙烷-1-羧酸)合酶是负责将S-腺苷甲硫氨酸(SAM)转化成ACC的酶；这是乙烯生物合成中的第二个步骤至最后一个步骤。当合酶基因的反义(“镜像”)或截短的拷贝插入到植物基因组中时会阻碍酶表达；b.插入ACC脱氨酶基因。从一种常见的非致病性土壤细菌绿针假单胞菌(Pseudomonas chlororaphis)获得编码该酶的基因。它将ACC转化为一种不同的化合物，从而减少可用于产生乙烯的ACC量；c.插入SAM水解酶基因。此方法类似于ACC脱氨酶，其中当乙烯前体代谢物的量减少时乙烯产生受到阻碍；本文情况下，SAM被转化为高丝氨酸。从大肠杆菌T3噬菌体获得编码该酶的基因，以及d.抑制ACC氧化酶基因表达。ACC氧化酶是催化ACC氧化成乙烯的酶，这是乙烯生物合成途径中的最后一个步骤。使用本文所述的方法，下调ACC氧化酶基因，导致乙烯产生受到抑制，从而延迟果实催熟。在具体实施例中，对于以上所述修饰另外地或可替代地，本文所述方法用于修饰乙烯受体，以便干扰由果实获得的乙烯信号。在具体实施例中，修饰，更具体地说抑制编码乙烯结合蛋白的ETR1基因的表达。在具体实施例中，对于本文所述修饰附加地或可替代地，本文所述的方法用于修饰编码多聚半乳糖醛酸酶(PG)的基因的表达，该PG是负责分解果胶(维持植物细胞壁完整性的物质)的酶。果胶分解发生在催熟过程开始时，从而导致水果软化。因此，在具体实施例中，本文所述的方法用于在PG基因中引入突变或者用于抑制PG基因的激活，以便减少所产生的PG酶的量，从而延迟果胶降解。

因此在具体实施例中，这些方法包括使用Cpf1 CRISPR系统确保如上所述的植物细胞基因组的一种或多种修饰并且由该细胞再生植物。在具体实施例中，该植物是番茄植物。

增加植物的保存期限

在具体实施例中，本发明的方法用于修饰涉及产生影响植物或植物部分的保存期限的化合物的基因。更具体地说，该修饰是在防止马铃薯块茎中的还原糖积累的基因中。在高温处理时，这些还原糖与游离氨基酸反应，从而产生棕色苦味产物和高水平的丙烯酰胺，该丙烯酰胺是一种潜在致癌物。在具体实施例中，本文提供的方法用于减少或抑制液泡转化酶基因(VInv)的表达，该液泡转化酶基因编码将蔗糖分解为葡萄糖和果糖的蛋白质(Clasen等人DOI:10.1111/pbi.12370)。

使用Cpf1 CRISPR系统确保增值的性状

在具体实施例中，Cpf1 CRISPR系统用于产生营养提高的农作物。在具体实施例中，本文提供的方法适于生成“功能食品”，即可以提供超过它所含有的传统营养物的健康益处的修饰的食品或食品成分，并且/或者适于生成“营养食品”，即可以被视为食品或食品的一部分并且提供健康益处(包括预防和治疗疾病)的物质。在具体实施例中，营养食品适用于预防和/或治疗癌症、糖尿病、心血管疾病以及高血压中的一种或多种。

营养改善的农作物的实例包括(Newell-McGloughlin,Plant Physiology[植物生理学],2008年7月,第147卷,第939-953页)：

修饰蛋白品质、含量和/或氨基酸组成，例如对于以下所述的：百喜草(Luciani等人2005,Florida Genetics Conference Poster[佛罗里达遗传会议海报])、油菜(Roesler等人,1997Plant Physiol[植物生理学]113 75-81)、玉米(Cromwell等人,1967,1969,JAnim Sci[农林科学]26 1325-1331,O’Quin等人2000J Anim Sci[农林科学]782144-2149，Yang等人2002,Transgenic Res[转基因研究]11 11-20，Young等人2004,Plant J[植物杂志]38 910-922)，马铃薯(Yu J和Ao,1997Acta Bot Sin[植物学报]39329-334；Chakraborty等人2000,Proc Natl Acad Sci USA[美国国家科学院院刊]973724-3729；Li等人2001)Chin Sci Bull[中国科学通报]46 482-484，水稻(Katsube等人1999,PlantPhysiol[植物生理学]120 1063-1074)、大豆(Dinkins等人2001，Rapp2002,In Vitro CellDev Biol Plant[植物体外细胞与发育生物学]37742-747)、甘薯(Egnin和Prakash 1997，In Vitro Cell Dev Biol[体外细胞与发育生物学]33 52A)。

必需氨基酸含量，例如对于以下所述的：油菜(Falco等人1995,Bio/Technology[生物/技术]13 577-582)、羽扇豆(White等人2001,J Sci Food Agric[食品与农业科学杂志]81 147-154)、玉米(Lai和Messing,2002,Agbios 2008GM crop database[2008年农业与生物技术战略公司转基因作物数据库](2008年3月11日))、马铃薯(Zeh等人2001,PlantPhysiol[植物生理学]127 792-802)、高粱(Zhao等人2003,Kluwer Academic Publishers[克拉维尔科学出版社],Dordrecht[多德雷赫特],The Netherlands[荷兰],第413-416页)、大豆(Falco等人1995Bio/Technology[生物/技术]13 577-582；Galili等人2002CritRev Plant Sci[植物科学的关键评论]21167-204)。

油类和脂肪酸，例如对于油菜(Dehesh等人(1996)Plant J[植物杂志]9167-172[PubMed]；Del Vecchio(1996)INFORM International News on Fats,Oils and RelatedMaterials[关于脂肪、油类和相关材料的国际新闻通告]7 230-243；Roesler等人(1997)Plant Physiol[植物生理学]113 75-81[PMC免费文献][PubMed]；Froman和Ursin(2002,2003)Abstracts of Papers of the American Chemical Society[美国化学学会论文摘要]223U35；James等人(2003)Am J Clin Nutr[美国临床营养学杂志]771140-1145[PubMed]；农业与生物技术战略公司(Agbios)(2008,同上)；棉花(Chapman等人(2001).JAm Oil Chem Soc[美国石油化学家协会杂志]78 941-947；Liu等人(2002)J Am Coll Nutr[美国营养学院杂志]21 205S-211S[PubMed]；O'Neill(2007)(澳大利亚生命科学家)http://www.biotechnews.com.au/index.php/id；866694817；fp；4；fpid；2(2008年6月17日)，亚麻籽(Abbadi等人,2004,Plant Cell[植物细胞]16:2734-2748)，玉米(Young等人,2004,Plant J[植物杂志]38 910-922)，油棕(Jalani等人1997,J Am Oil Chem Soc[美国石油化学家协会杂志]74 1451-1455；Parveez,2003,AgBiotechNet[农业生物科技网]1131-8)，水稻(Anai等人,2003,Plant Cell Rep[植物细胞报告]21988-992)，大豆(Reddy和Thomas,1996,Nat Biotechnol[自然生物技术]14 639-642；Kinney和Kwolton,1998,Blackie Academic and Professional[黑人学术和专业],London[伦敦],第193-213页)，向日葵(Arcadia,Biosciences[生物科学]2008)

碳水化合物，例如对于以下所述的果聚糖：菊苣(Smeekens(1997)Trends PlantSci[植物科学趋势]2 286-287,Sprenger等人(1997)FEBS Lett[FEBS快报]400355-358,Sévenier等人(1998)Nat Biotechnol[自然生物技术]16 843-846)、玉米(Caimi等人(1996)Plant Physiol[植物生理学]110 355-363)、马铃薯(Hellwege等人,1997Plant J[植物杂志]12 1057-1065)、甜菜(Smeekens等人1997,同上)；菊粉，例如对于马铃薯(Hellewege等人2000,Proc Natl Acad Sci USA[美国国家科学院院刊]978699-8704)所述的；淀粉，例如对于水稻所述的(Schwall等人(2000)Nat Biotechnol[自然生物技术]18 551-554,Chiang等人(2005)Mol Breed[分子育种]15 125-143)，

维生素类和类葫萝卜素，例如对于以下所述的：油菜(Shintani和DellaPenna(1998)Science[科学]282 2098-2100)、玉米(Rocheford等人,(2002).J Am Coll Nutr[美国营养学院杂志]21 191S-198S，Cahoon等人(2003)Nat Biotechnol[自然生物技术]211082-1087，Chen等人,(2003)Proc Natl Acad Sci USA[美国国家科学院院刊]1003525-3530)、芥菜耔(Shewmaker等人,(1999)Plant J[植物杂志]20 401-412)、马铃薯(Ducreux等人,2005,J Exp Bot[实验植物学杂志]56 81-89)、水稻(Ye等人,(2000)Science科学287303-305)、草莓(Agius等人,(2003)，Nat Biotechnol[自然生物技术]21 177-181)、番茄(Rosati等人,(2000)Plant J[植物杂志]24 413-419，Fraser等人,(2001)J Sci FoodAgric[食品与农业科学杂志]81 822-827，Mehta等人,(2002)Nat Biotechnol[自然生物技术]20 613-618，Díaz de la Garza等人,(2004)Proc Natl Acad Sci USA[美国国家科学院院刊]101 13720-13725，Enfissi等人,(2005)Plant Biotechnol J[植物生物技术杂志]3 17-27，DellaPenna(2007)Proc Natl Acad Sci USA[美国国家科学院院刊]104 3675-3676。

功能性次级代谢产物，例如对于以下所述的：苹果(芪类，Szankowski等人,(2003)Plant Cell Rep[植物细胞报告]22:141-149)、苜蓿(白藜芦醇，Hipskind和Paiva(2000)Mol Plant Microbe Interact[分子植物微生物的相互作用]13 551-562)、猕猴桃(白藜芦醇，Kobayashi等人,(2000)Plant Cell Rep[植物细胞报告]19 904-910)、玉米和大豆(黄酮类，Yu等人(2000)Plant Physiol[植物生理学]124 781-794)、马铃薯(花青素和生物碱糖苷，Lukaszewicz等人(2004)J Agric Food Chem[农业与食品化学杂志]52 1526-1533)、水稻(黄酮类和白藜芦醇，Stark-Lorenzen等人,(1997)Plant Cell Rep[植物细胞报告]16668-673，Shin等人(2006)Plant Biotechnol J[植物生物技术杂志]4 303-315)、番茄(+白藜芦醇、绿原酸、黄酮类、芪；Rosati等人,(2000)同上，Muir等人,(2001)Nature[自然]19470-474，Niggeweg等人,(2004)Nat Biotechnol[自然生物技术]22 746-754，Giovinazzo等人,(2005)Plant Biotechnol J[植物生物技术杂志]3 57-69)、小麦(咖啡酸和咖啡酸、白藜芦醇；United Press International[美国合众国际新闻社](2002))；以及

矿物质可用性，例如对于以下所述的：苜蓿(植酸酶，Austin-Phillips等人,(1999)http://www.molecularfarming.com/nonmedical.html)、生菜(Lettuse)(铁，Goto等人,(2000)Theor Appl Genet[理论与应用遗传学]100 658-664)、水稻(铁，Lucca等人,(2002)J Am Coll Nutr[美国营养学院杂志]21 184S-190S)、玉米、大豆和小麦(植酸酶，Drakakaki等人,(2005)Plant Mol Biol[植物分子生物学]59 869-880，Denbow等人,(1998)Poult Sci[养禽科学]77 878-881，Brinch-Pedersen等人,(2000)Mol Breed[分子育种]6 195-206)。

在具体实施例中，增值的性状与存在于植物中的化合物的设想的健康益处相关。例如，在具体实施例中，通过应用本发明的方法来确保以下化合物中的一种或多种化合物的合成的修改或者诱导/增加它们的合成，以获得增值的农作物：

类葫萝卜素，例如存在于胡萝卜中的α-胡萝卜素，该α-胡萝卜素中和可引起对细胞的损害的自由基；或者存在于各种果实和蔬菜中的β-胡萝卜素，该β-胡萝卜素中和自由基

存在于绿色蔬菜中的叶黄素，该叶黄素有助于维持健康视力

存在于番茄和番茄产品中的番茄红素，该番茄红素认为降低前列腺癌风险

存在于柑橘和玉米中的玉米黄素，该玉米黄素有助于维持健康视力

膳食纤维，例如存在于麦麸中的不溶性纤维，该不溶性纤维可以降低乳腺癌和/或结肠癌风险；以及存在于燕麦中的β葡聚糖；存在于车前子(Psylium)和全谷粒中的可溶性纤维，该可溶性纤维可以降低心血管疾病(CVD)风险

脂肪酸，例如ω-3脂肪酸，这些ω-3脂肪酸可以降低CVD风险并提高心理功能和视功能；共轭亚油酸，该共轭亚油酸可以改善身体组成，可以减小某些癌症风险；以及GLA，该GLA可以降低癌症和CVD的炎症风险，可以改善身体组成

黄酮类，例如存在于小麦中的羟基苯乙烯，这些羟基苯乙烯具有抗氧化剂样活性，可以降低退行性疾病风险；存在于果实和蔬菜中的黄酮醇、儿茶酚类和鞣酸类，这些黄酮醇、儿茶酚类和鞣酸类中和自由基并且可以降低癌症风险

葡萄糖异硫氰酸酯、吲哚、异硫氰酸酯，例如存在于十字花科蔬菜(花椰菜、羽衣甘蓝)、辣根属中的萝卜硫素，该萝卜硫素中和自由基，可以降低癌症风险

酚类，例如存在于葡萄中的芪类，这些芪类可以降低退行性疾病、心脏病和癌症的风险，可以延年益寿功效；以及存在于蔬菜和柑橘中的咖啡酸和阿魏酸，它们具有抗氧化剂样活性，可以降低退行性疾病、心脏病和眼病的风险；以及存在于可可中的表儿茶素，该表儿茶素具有抗氧化剂样活性，可以降低退行性疾病和心脏病的风险

存在于玉米、大豆、小麦以及木制油中的植物甾烷醇/固醇类，它们可以通过降低血胆固醇水平来降低冠心病的风险

存在于洋姜、胡葱、洋葱粉中的果聚糖、菊糖、低聚果糖，它们可以提高胃肠道健康

存在于大豆中的皂苷类，它们可以降低LDL胆固醇

存在于大豆中的大豆蛋白质，它可以降低心脏病风险

植物雌激素，例如存在于大豆中的异黄酮，这些异黄酮可以减少绝经期症状(例如热潮红)，可以减少骨质疏松症和CVD；以及存在于亚麻、黑麦和蔬菜中的木脂素类，这些木脂素类可以防止心脏病和一些癌症，可以降低LDL胆固醇、总胆固醇

硫化物和硫醇类，例如存在于洋葱、大蒜、橄榄、韭葱以及青葱(scallon)中的二烯丙基硫；以及存在于十字花科蔬菜中的烯丙基甲基三硫、二硫醇硫酮，它们可以降低LDL胆固醇，帮助维持健康免疫系统

鞣酸，例如存在于蔓越橘、可可中的原花色素，它可以提高泌尿道健康，可以降低CVD和高血压风险

等等。

此外，本发明的方法还设想了修改蛋白质/淀粉功能性、保质期、味道/美学、纤维品质、以及减少过敏原、抗营养素以及毒素的形状。

因此，本发明涵盖了用于产生具有营养增加价值的植物的方法，所述方法包括使用如本文所述的Cpf1 CRISPR系统将编码涉及产生增加的营养价值的组分的酶的基因引入到植物细胞中并且由所述植物细胞再生植物，所述植物的特征在于增加的营养价值的所述组分的表达增加。在具体实施例中，Cpf1 CRISPR系统用于例如通过修饰控制此化合物代谢的一种或多种转录因子来间接修改这些化合物的内源性合成。上文描述了用于将目的基因引入到植物细胞并且/或者使用Cpf1 CRISPR系统修饰内源性基因的方法。

在已修饰为赋予增值性状的植物中的一些具体修饰实例是：例如通过用硬脂酰-ACP去饱和酶的反义基因转化植物以增加植物硬脂酸含量的具有修饰的脂肪酸代谢的植物。参见Knultzon等人,Proc.Natl.Acad.Sci.U.S.A.[美国国家科学院院刊]89:2624(1992)。另一个实例涉及例如通过克隆并且然后再引入与可以负责特征为低水平植酸的玉米突变体的单一等位基因缔合的DNA来减小植酸酯含量。参见Raboy等人,Maydica 35:383(1990)。

类似地，在强启动子控制下调节玉米糊粉层中黄酮类的产生的玉米(玉蜀黍)TfsC1和R的表达导致拟南芥属(阿拉伯芥)中的花色素苷高积累速率，推测是通过激活整个途径(Bruce等人2000,Plant Cell[植物细胞]12:65-80)。DellaPenna(Welsch等人,2007AnnuRev Plant Biol[植物生物学年评]57:711-738)发现Tf RAP2.2及其相互作用配体SINAT2增加拟南芥叶中的胡萝卜素形成作用。在转基因拟南芥中表达Tf Dof1诱导了编码用于产生碳架、标记性增加氨基酸含量以及减少Glc水平的酶的基因的上调(Yanagisawa,2004Plant Cell Physiol[植物细胞生理学]45:386-391)，并且DOF Tf AtDof1.1(OBP2)上调了拟南芥的葡萄糖异硫氰酸酯生物合成途径中的所有步骤(Skirycz等人,2006Plant J[植物杂志]47:10-24)。

减少植物中的过敏原

在具体实施例中，本文提供的方法可以用于生成具有减少的水平的过敏原的植物，从而使得它们对于消费者而言更安全。在具体实施例中，这些方法包括修饰负责产生植物过敏原的一种或多种基因的表达。例如，在具体实施例中，这些方法包括下调植物细胞例如黑麦草植物细胞中的Lol p5基因的表达并且由该细胞再生植物以便减少所述植物的花粉的过敏原性(Bhalla等人1999,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]第96卷:11676-11680)。

花生过敏和对豆类过敏总体上是真实而严重的健康问题。本发明的Cpf1效应蛋白系统可以用于鉴定并且然后编码或沉默编码此类豆类的过敏原性蛋白的基因。在不限于此类基因和蛋白质的情况下，Nicolaou等人鉴定了花生、大豆、扁豆、羽扇豆、青豆、以及绿豆中的过敏原性蛋白。参见，Nicolaou等人,Current Opinion in Allergy and ClinicalImmunology[过敏症及临床免疫学当代观点]2011；11(3):222)。

用于目的内源性基因的筛选方法

本文提供的方法进一步允许鉴定编码涉及产生增加的营养价值的组分的酶的有价值基因或者通常是影响跨种类、门和植物界的目的农艺性状的基因。通过使用如本文所用的Cpf1 CRISPR系统选择性靶向例如编码植物代谢途径的酶的基因，可以鉴定负责植物某些营养方面的基因。类似地，通过选择性靶向可以影响所希望的农艺性状的基因，可以鉴定相关基因。因此，本发明涵盖了用于编码涉及产生具有特定营养价值和/或农艺性状的化合物的酶的基因的筛选方法。

在植物和酵母中进一步应用Cpf1-CRISPR系统

在生物燃料生产中使用Cpf1 CRISPR系统

如本文使用的“生物燃料”是一种由植物和植物来源的资源制成的代用燃料。可再生生物燃料可以从有机物质中提取，该有机物质的能量已通过碳固定方法来获得或者通过使用或转化生物质来制成。此生物质可以直接用于生物燃料或者可以通过热转化、化学转化和生物化学转化来转化成含有能量的物质。此生物质转化可以形成固体、液体或气体形式的燃料。存在两种类型的生物燃料：生物乙醇和生物柴油。生物乙醇主要是通过纤维素(淀粉)的糖发酵过程来产生的，该纤维素大部分来源于玉米和甘蔗。在另一个方面中，生物柴油主要是由油料作物例如油菜籽、棕榈和大豆产生的。生物燃料主要用于运输。

增强用于生物燃料生产的植物特性

在具体实施例中，使用本文所述的Cpf1 CRISPR系统的方法用于改变细胞壁的特性，以便促进关键性水解剂进入，从而更有效地释放用于发酵的糖。在具体实施例中，修改纤维素和/或木质素的生物合成。纤维素是细胞壁的主要组分。纤维素和木质素的生物合成是共调节的。通过减少植物中的木质素比例，可以增加纤维素的比例。在具体实施例中，本文所述的方法用于下调植物中的木质素生物合成，以便增加可发酵的碳水化合物。更具体地说，本文所述的方法用于下调选自下组的至少一种第一木质素生物合成基因，该组由以下组成：4-香豆酸酯3-羟化酶(C3H)、苯丙氨酸氨裂解酶(PAL)、肉桂酸酯4-羟化酶(C4H)、羟基肉桂酰转移酶(HCT)、咖啡酸O-甲基转移酶(COMT)、咖啡酰氧基辅酶A3-O-甲基转移酶(CCoAOMT)、阿魏酸酯5-羟化酶(F5H)、肉桂醇脱氢酶(CAD)、肉桂酰辅酶A-还原酶(CCR)、4-香豆酸酯-辅酶A连接酶(4CL)、单木质醇-木质素-特异性糖基转移酶、以及醛脱氢酶(ALDH)，如WO 2008064289A2中所披露的。

在具体实施例中，本文所述的方法用于产生在发酵过程中生成低水平乙酸的植物生物质(还参见WO 2010096488)。更具体地说，本文披露的方法用于生成与CaslL同源的突变，以减少多糖乙酰化。

修饰用于生物燃料生产的酵母

在具体实施例中，本文提供的Cpf1酶用于通过重组微生物进行生物乙醇生产。例如，Cpf1可以用于工程化微生物，例如酵母，以由可发酵糖类生成生物燃料或生物聚合物并且任选地能够降解来源于作为可发酵糖来源的农业废弃物的植物来源的木质纤维素。更具体地说，本发明提供了多种方法，凭借这些方法Cpf1 CRISPR复合物用于将生物燃料生产所需要的外源基因引入到微生物中并且/或者修饰可能干扰生物燃料合成的内源性基因。更具体地说，这些方法包括将编码涉及丙酮酸酯转化为乙醇或另一种目的产物的酶的一种或多种核苷酸序列引入到微生物例如酵母中。在具体实施例中，这些方法确保引入允许微生物降解纤维素的一种或多种酶例如纤维素酶。在又另外的实施例中，Cpf1 CRISPR复合物用于修饰与生物燃料产生途径竞争的内源性代谢途径。

因此，在更具体实施例中，本文所述的方法用于如下地修饰微生物：

以引入至少一种异源核酸或增加编码植物细胞壁降解酶的至少一种内源性核酸的表达，以使得所述微生物能够表达所述核酸并且能够产生并分泌所述植物细胞壁降解酶；

以引入至少一种异源核酸或增加编码将丙酮酸酯转化为乙醛的酶的至少一种内源性核酸任选地连同编码将乙醛转化为乙醇的酶的至少一种异源核酸的表达，以使得所述宿主细胞能够表达所述核酸；和/或

以修饰编码所述宿主细胞的代谢途径中的酶的至少一种核酸，其中所述途径产生除来自丙酮酸酯的乙醛或来自乙醛的乙醇之外的代谢物，并且其中所述修饰导致所述代谢物的产生减少，或者以引入编码所述酶的抑制剂的至少一种核酸。

修饰用于生产植物油或生物燃料的藻类和植物

转基因藻类或其他植物例如芸苔可以例如特别适用于生产植物油或生物燃料例如醇(具体地是甲醇和乙醇)。这些藻类可以被工程化以表达或过量表达用于油或生物燃料工业中的高水平油或醇。

根据本发明的具体实施例，Cpf1 CRISPR系统用于生成适用于生物燃料生产的富含脂质的硅藻类。

在具体实施例中，设想的是特异性修饰涉及改变由藻类细胞产生的脂质的量和/或脂质的品质的基因。编码涉及脂肪酸合成途径的酶的基因的实例可以编码具有例如以下活性的蛋白质：乙酰辅酶A羧化酶、脂肪酸合酶、3-酮乙基_酰基-载体蛋白合酶III、甘油-3-磷酸脱氢酶(G3PDH)、烯酰-酰基载体蛋白还原酶(烯酰-ACP-还原酶)、甘油-3-磷酸酰基转移酶、溶血磷脂酰基转移酶或二酰甘油酰基转移酶、磷脂:二酰甘油二酰甘油、磷脂酸磷酸酶、脂肪酸硫酯酶例如软脂酰蛋白硫酯酶、或者苹果酸酶活性。在另外的实施例中，设想的是生成具有增加的脂质积累的硅藻类。这可以是通过靶向减少脂质异化的基因来实现的。对于用于本发明的方法中特别目的是涉及激活三酰甘油和游离脂肪酸的基因，以及直接涉及脂肪酸的β氧化的基因，例如酰基-辅酶A合成酶、3-酮乙基-辅酶A硫解酶、酰基-辅酶A氧化酶活性以及磷葡萄糖变位酶。本文所述的Cpf1 CRISPR系统和方法可以用于特异性激活硅藻类中的此类基因，以便增加其脂质含量。

例如微藻的生物体广泛用于合成生物学。Stovicek等人(Metab.Eng.Comm.[代谢工程通信],2015；2:13描述了工业用酵母例如酿酒酵母的基因组编辑，以有效产生用于工业生产的有力菌株。Stovicek使用了对酵母密码子优化的CRISPR-Cas9系统来同时破坏内源性基因的两个等位基因并且敲除异源基因。Cas9和gRNA由基因组或附加型2μ基载体位置表达。作者们还证实基因破坏效率可以通过优化Cas9和gRNA表达水平来提高。Hlavová等人(Biotechnol.Adv.[生物技术进展]2015)讨论了使用例如CRISPR的技术靶向核基因和叶绿体基因进行插入诱变和筛选来开发微藻种类或菌株。Stovicek和Hlavová的方法可以适用于本发明的Cpf1效应蛋白系统。

US 8945839描述了一种用于使用Cas9工程化微藻(莱茵衣藻细胞)种类)的方法。使用类似工具，本文所述的Cpf1 CRISPR系统的方法可以应用于衣藻属种类和其他藻类上。在具体实施例中，Cpf1和指导RNA引入使用载体表达的藻类中，该载体在组成型启动子的控制下表达Cpf1，例如Hsp70A-Rbc S2或β2-微管蛋白。指导RNA将使用含有T7启动子的载体递送。可替代地，Cpf1 mRNA和体外转录的指导RNA可以是递送至藻类细胞中。电穿孔方法遵循来自GeneArt Chlamydomonas Engineering试剂盒的标准推荐方法。

使用Cpf1生成能够进行脂肪酸生产的微生物

在具体实施例中，本发明的方法用于生成能够产生脂肪酸酯例如脂肪酸甲酯(“FAME”)和脂肪酸乙酯(“FAEE”)的遗传工程化微生物。

典型地，宿主细胞可以被工程化以通过表达或过表达编码硫酯酶的基因、编码酰基-辅酶A合酶的基因以及编码酯合酶的基因来由存在于培养基中的碳源例如醇产生脂肪酸酯。因此，本文提供的方法用于修饰微生物，以便过表达或引入硫酯酶基因、编码酰基-辅酶A合酶的基因、以及编码酯合酶的基因。在具体实施例中，硫酯酶基因选自tesA、'tesA、tesB、fatB、fatB2、fatB3、fatAl、或fatA。在具体实施例中，编码酰基-辅酶A合酶的基因是选自fadDJadK、BH3103、pfl-4354、EAV15023、fadDl、fadD2、RPC_4074、fadDD35、fadDD22、faa39、或编码具有相同特性的酶的鉴定的基因。在具体实施例中，编码酯合酶的基因是编码来自以下的合酶/酰基-辅酶A:二酰基甘油酰基转移酶或其变体的基因：霍霍巴、不动杆菌属物种ADP、泊库岛食烷菌、铜绿假单胞菌、亚德海床杆菌(Fundibacter jadensis)、阿拉伯芥、或真养产碱杆菌。

另外地或可替代地，本文提供的方法用于减少以下中的至少一种基因在所述微生物中的表达：编码酰基-辅酶A

脱氢酶的基因、编码外膜蛋白受体的基因、和编码脂肪酸生物合成转录调节因子的基因。在具体实施例中，例如通过引入突变来失活这些基因中的一种或多种。

在具体实施例中，编码酰基-辅酶A脱氢酶的基因是fadE。在具体实施例中，编码脂肪酸生物合成的转录调节因子的基因编码DNA转录阻抑物，例如fabR。

另外地或可替代地，所述微生物被修饰为减少以下中的至少一种基因的表达：编码丙酮酸甲酸裂解酶的基因、编码乳酸脱氢酶的基因或两者。在具体实施例中，编码丙酮酸甲酸裂解酶的基因是pflB。在具体实施例中，编码乳酸脱氢酶的基因是IdhA。在具体实施例中，例如通过在其中引入突变来失活这些基因中的一种或多种。

在具体实施例中，微生物是选自埃希菌属、芽孢杆菌属、乳酸杆菌属、红球菌属、聚球蓝细菌属、集胞藻属(Synechoystis)、假单胞菌属、曲霉属、木霉属、链孢霉属、镰刀菌属、腐质霉属(Humicola)、根毛霉属、克鲁维酵母属、毕赤酵母属、毛霉菌属、蚀丝霉属、青霉菌属、平革菌属、侧耳属(Pleurotus)、栓菌属(Trametes)、金孢子菌属、酵母菌属、寡养单胞菌(Stenotrophamonas)、裂殖酵母属、亚罗酵母属或链霉菌属。

使用Cpf1生成能够进行有机酸生产的微生物

本文提供的方法进一步用于工程化能够更具体地说由戊糖或己糖生产有机酸的微生物。在具体实施例中，这些方法包括将外源性LDH基因引入到微生物中。在具体实施例中，所述微生物中的有机酸生产另外地或可替代地通过灭活编码涉及内源性代谢途径的蛋白质的内源性基因来增加，该代谢途径产生除目的有机酸之外的代谢物，并且/或者其中该内源性代谢途径耗竭有机酸。在具体实施例中，该修饰确保减少除目的有机酸之外的代谢物的产生。根据具体实施例，这些方法用于引入其中消耗有机酸的内源性途径或编码涉及产生除目的有机酸之外的代谢物的内源性途径的产物的基因的至少一种工程化基因缺失和/或灭活。在具体实施例中，该至少一种工程化基因缺失或灭活是处于编码选自下组的酶的一种或多种基因中：丙酮酸脱羧酶(pdc)、延胡索酸还原酶、醇脱氢酶(adh)、乙醛脱氢酶、磷酸烯醇丙酮酸羧化酶(ppc)、D-乳酸脱氢酶(d-ldh)、L-乳酸脱氢酶(l-ldh)、乳酸2-单加氧酶。

在其他实施例中，该至少一种工程化基因缺失和/或灭活是处于编码丙酮酸脱羧酶(pdc)的内源性基因中。

在另外的实施例中，微生物被工程化以产生乳酸，并且该至少一种工程化基因缺失和/或灭活是处于编码乳酸脱氢酶的内源性基因中。另外地或可替代地，微生物包含至少一种工程化基因缺失或者编码细胞色素依赖性乳酸脱氢酶例如细胞色素B2依赖性L-乳酸脱氢酶的内源性基因的灭活。

使用Cpf1生成改善的利用木糖或纤维二糖的酵母菌株

在具体实施例中，Cpf1 CRISPR系统可以用于选择改进的利用木糖或纤维二糖的酵母菌株。易错PCR可以用于扩增涉及木糖利用或纤维二糖利用途径的一种(或多种)基因。及木糖利用途径和纤维二糖利用途径的基因的实例可以包括但不限于，以下所述的那些：Ha,S.J.等人(2011)Proc.Natl.Acad.Sci.USA[美国国家科学院院刊]108(2):504-9和Galazka,J.M.等人(2010)Science[科学]330(6000):84-6。各自在这种选择的基因中包含随机突变的双链DNA分子的所得文库可以与Cpf1 CRISPR系统的组分共转化到酵母菌株(例如S288C)中并且可以选择具有增加的木糖或纤维二糖利用能力的菌株，如WO 2015138855所述的。

使用Cpf1生成用于类异戊二烯生物合成的改善的酵母菌株

Tadas 等人描述了多种CRISPR/Cas9系统在面包酵母酿酒酵母的一个转化步骤中用于基因组工程化多至5个不同基因组座位的成功应用(MetabolicEngineering[代谢工程]第28卷,2015年3月,第213-222页)，从而得到具有高甲羟戊酸酯(它是工业上重要的异戊二烯生物合成途径的关键性中间体)产量的菌株。在具体实施例中，Cpf1 CRISPR系统可以应用于如本文所述的用于鉴定在异戊二烯合成中使用的另外高产的酵母菌株的多种基因组工程化方法中。

使用Cpf1生成产乳酸酵母菌株

在另一个实施例中，涵盖多种Cpf1 CRISPR系统的成功应用。与VratislavStovicek等人(Metabolic Engineering Communications[代谢工程通讯],第2卷,2015年12月,第13-22页)类似地，改善的产乳酸菌株可以单一转化事件来设计并获得。在一个具体实施例中，Cpf1 CRISPR系统用于同时插入异源乳酸脱氢酶基因并破坏两个内源性基因PDC1和PDC5基因。

在植物中进一步应用Cpf1 CRISPR系统

在具体实施例中，CRISPR系统以及优选地本文所述的Cpf1 CRISPR系统可以用于可视化遗传元件动力学。例如，CRISPR成像可以可视化重复或非重复基因组序列，报道端粒长度变化和端粒移动，并且监控整个细胞周期中的基因座位动力学(Chen等人,Cell[细胞],2013)。这些方法也可以适用于植物。

CRISPR系统以及优选地本文所述的Cpf1 CRISPR系统的其他应用是体外和体内靶向基因破坏阳性选择筛选(Malina等人,Genes and Development[基因与发育],2013)。这些方法也可以适用于植物。

在具体实施例中，失活Cpf1内切核酸酶与组蛋白修饰酶的融合可以在复杂的表观基因组中引入自定义变化(Rusk等人,Nature Methods[自然方法],2014)。这些方法也可以适用于植物。

在具体实施例中，CRISPR系统以及优选地本文所述的Cpf1 CRISPR系统可以用于纯化一个特定部分的染色质并且鉴定相关蛋白，从而阐明它们在转录中的调节作用(Waldrip等人,Epigenetics[表观遗传学],2014)。这些方法也可以适用于植物。

在具体实施例中，本发明可以用在植物系统中的病毒清除疗法，因为它能够切割病毒DNA和RNA。以前的人类系统研究已证实利用CRISPR靶向丙型肝炎的单链RNA病毒(A.Price等人,Proc.Natl.Acad.Sci[国家科学院院报刊],2015)以及乙型肝炎的双链DNA病毒(V.Ramanan等人,Sci.Rep[科学通讯],2015)。这些方法还可以适于在植物中使用Cpf1CRISPR系统。

在具体实施例中，本发明可以用于改变基因组复杂度。在另外的具体实施例中，CRISPR系统以及优选本文所述的Cpf1 CRISPR系统可以用于破坏或改变染色体数目并且生成仅含有来自一个母体的染色体的单倍体植物。此类植物可以被诱导以经受染色体复制并且被转化成仅含有纯合等位基因的二倍体植物(Karimi-Ashtiyani等人,PNAS[美国国家科学院院刊],2015；Anton等人,Nucleus[细胞核],2014)。这些方法也可以适用于植物。

在具体实施例中，本文所述的Cpf1 CRISPR系统可以用于自切割。在这些实施例中，Cpf1酶和gRNA的启动子可以是组成型启动子并且第二gRNA被引入在相同转化盒中，但受到诱导型启动子的控制。此第二gRNA可以被设计以诱导Cpf1基因中的位点特异性切割，以便创建非功能Cpf1。在另外的具体实施例中，第二gRNA在转化盒的两端诱导切割，从而使得该盒从宿主基因组中去除。此系统提供受控的细胞暴露于Cas酶的持续时间并且进一步最小化脱靶编辑。另外，CRISPR/Cas盒两端的切割可以用于生成具有双等位基因突变的无转基因T0植物(如对于Cas9所述的，例如，Moore等人Nucleic Acids Research[核酸研究],2014；Schaeffer等人,Plant Science[植物科学],2015)。Moore等人的方法可以适用于本文所述的Cpf1 CRISPR系统。

Sugano等人(Plant Cell Physiol.[植物生理学]2014年3月；55(3):475-81.doi:10.1093/pcp/pcu014.电子版2014年1月18日)报道了CRISPR-Cas9对于地钱属地钱(Marchantia polymorpha L.)中的靶向诱导的应用，该地钱已做完用于研究陆生植物进化的模型种类。地钱的U6启动子被鉴定并克隆，以表达gRNA。gRNA的靶序列被设计为破坏编码地钱中的生长素响应因子1(ARF1)的基因。使用土壤杆菌介导的转化，Sugano等人分类了配子体世代的地钱的稳定突变体。基于CRISPR-Cas9的体内定点诱变是使用表达Cas9的花椰菜花叶病毒35S或地钱EF1α启动子来实现的。显示生长素耐受表型的分离突变体个体是非嵌合的。此外，稳定的突变体是通过T1植物的无性繁殖来产生的。arf1复等位基因容易使用基于CRIPSR-Cas9的靶向诱变来建立。Sugano等人的方法可以适用于本发明的Cpf1效应蛋白系统。

Kabadi等人(Nucleic Acids Res.[核酸研究]2014年10月29日；42(19):e147.doi:10.1093/nar/gku749.电子版2014年8月13日)开发了一种由通过常规金门(Golden Gate)克隆方法结合到载体中的独立RNA聚合酶III启动子表达Cas9变体、报道基因和多至四个sgRNA的单一慢病毒系统。每个sgRNA被有效地表达并且可以介导无限增殖细胞和原代人类细胞中的多重基因编辑和持续的转录激活。Kabadi等人的方法可以适用于本发明的Cpf1效应蛋白系统。

Ling等人(BMC Plant Biology[BMC植物生物学]2014,14:327)开发了一种基于pGreen或pCAMBIA骨架以及gRNA的CRISPR-Cas9二元载体集合。此工具包不需要除BsaI之外的限制酶来在仅仅一个克隆步骤中以高效率生成具有玉米密码子优化的Cas9和一种或更多种gRNA的最终构建体。此工具包是使用玉米原生质体、转基因玉米品系和转基因拟南芥品系来验证的并且显示表现出高效率和高特异性。更重要地是，使用此工具包，检测T1代转基因幼苗中的三种拟南芥基因的靶向突变。此外，多个基因突变可以由下一代继承。(指导RNA)模块载体集合，作为用于植物多重基因组编辑的工具包。Lin等人的工具包可以适用于本发明的Cpf1效应蛋白系统。

用于经由CRISPR-Cpf1进行靶向植物基因组编辑的方案基于系列文献(Methodsin Molecular Biology[分子生物学方法]第239-255页，2015年2月10日的)第1284卷中对于CRISPR-Cas9系统所披露的那些方法也是可用的。描述了使用阿拉伯芥和本塞姆氏烟草原生质体来设计、构建并评价植物密码子优化的Cas9(pcoCas9)介导的基因组编辑的双gRNA的详细程序。还讨论了在全株植物中应用CRISPR-Cas9系统生成靶向基因组修饰的策略。本文章中描述的方案可以适用于本发明的Cpf1效应蛋白系统。

Ma等人(Mol Plant.[分子植物]2015年8月3日；8(8):1274-84.doi:10.1016/j.molp.2015.04.007)报道了利用植物密码子优化的Cas9基因以在单子叶植物和双子叶植物中方便且高效地进行多重基因组编辑的稳健CRISPR-Cas9载体系统。Ma等人设计了快速生成多个sgRNA表达盒的基于PCR的程序，这些表达盒可以在一轮克隆中通过金门连接或Gibson Assembly(吉布森组装)来组装到二元CRISPR-Cas9载体中。使用此系统，Ma等人编辑了在具有平均85.4％突变率的水稻中的46个靶位点，这些突变大部分是处于双等位基因状态和纯合状态。Ma等人提供了通过同时靶向多个(多至八个)基因家族成员、生物合成途径中的多基因或者单一基因中的多个位点来进行T0水稻和T1拟南芥植物中的失功能基因突变的实例。Ma等人的方法可以适用于本发明的Cpf1效应蛋白系统。

Lowder等人(Plant Physiol.[植物生理学]2015年8月21日.pii:第00636.2015页)还开发了一种能够在植物中对表达的基因、沉默的基因或非编码基因进行多重基因组编辑和转录调节的CRISPR-Cas9工具包。此工具包为研究者提供了使用金门克隆方法和通路(Gateway)克隆方法快速且有效地组装单子叶植物和双子叶植物的功能CRISPR-Cas9T-DNA构建体的方案和试剂。它具有一套完整的能力，包括植物内源性基因的多重基因编辑和转录激活或阻遏。基于T-DNA的转化技术是现代植物生物技术、遗传学、分子生物学和生理学的基础。像这样，申请人开发了一种用于将Cas9(WT、切口酶或dCas9)和一种或多种gRNA组装到目的T-DNA靶标载体中的方法。组装方法是基于金门组装和多位点通路(MultiSiteGateway)重组。对于组装需要三态模块。第一模块是含有无启动子Cas9或其侧接attL1和attR5位点的衍生物基因的Cas9入门载体。第二模块是含有侧接attL5和attL2位点的入门gRNA表达盒的gRNA入门载体。第三模块包括为Cas9表达提供启动子选择的含attR1-attR2靶标T-DNA载体。Lowder等人的工具包可以适用于本发明的Cpf1效应蛋白系统。

在一个有利实施例中，该植物可以是一种树。本发明还利用本文披露的CRISPRCas系统用于草本系统(参见例如，Belhaj等人,Plant Methods[植物方法]9:39和Harrison等人,Genes&Development[基因与发育]28:1859-1872)。在一个特别有利的实施例中，本发明的CRISPR Cas系统可以靶向树的单核苷酸多态性(SNP)(参见例如Zhou等人,NewPhytologist[新植物学家],第208卷,第2期,第298-301页,2015年10月)。在Zhou等人的研究中，作者们在木质多年生杨树中使用4-香豆酸酯:辅酶A连接酶(4CL)基因家族作为个案研究来采用CRISPR Cas系统并且对于所靶向的两个4CL基因实现100％突变效率，其中每个转化株检查携带的双等位基因修饰。在Zhou等人的研究中，CRISPR-Cas9系统对于单核苷酸多态性(SNP)高度敏感，因为对第三4CL基因的切割因靶序列中的SNP而消除。这些方法可以适用于本发明的Cpf1效应蛋白系统。

Zhou等人的方法(New Phytologist[新植物学家],第208卷,第2期,第298-301页,2015年10月)可以如下地适用于本发明。对于CRISPR-Cas9编辑，靶向分别与木质素和黄酮类生物合成缔合的两种4CL基因4CL1和4CL2。通常用于转化的欧洲山杨x银白杨(Populustremula x alba)克隆717-1B4是与基因组测序的毛果杨趋异的。因此，由参考基因组设计的4CL1和4CL2gRNA用内部717RNA-序列数据探察，以确保不存在可能限制Cas效率的SNP。还包括对于4CL1的基因组复制物4CL5设计的第三gRNA。相应717序列在PAM附近/内部的每个等位基因中具有一个SNP，等位基因两者预期消除了由4CL5-gRNA进行的靶向。所有三个gRNA靶向位点都是位于第一外显子内。对于717转化，gRNA由苜蓿属U6.6启动子表达，连同在二元载体内的CaMV 35S启动子控制下表达人类密码子优化的Cas。使用仅Cas的载体的转化可以充当对照。随机选择的4CL1和4CL2品系经受扩增子测序。然后处理数据并且确认所有情况中的双等位基因突变。这些方法可以适用于本发明的Cpf1效应蛋白系统。

在植物中，病原体常常是宿主特异性的。例如，尖孢镰刀菌某种番茄专化型(Fusarium oxysporum f.sp.lycopersici)引起番茄枯萎病但仅攻击番茄，而尖孢镰刀菌物种柄锈菌小麦专化型(F.oxysporum f.dianthii Puccinia graminis f.sp.tritici)仅攻击小麦。植物具有现存和诱导的防卫以抵抗大部分病原体。跨植物各代的突变和重组事件导致引起易感性的遗传变异性，特别是当病原体以比植物更大频率繁殖时。在植物中，可以存在非宿主抗性，例如，宿主和病原体是不相容的。还可以存在典型地受到许多基因控制的水平抗性，例如针对所有病原体种族的部分抗性，以及典型地受到几种基因控制的垂直抗性，例如对一些病原体种族而不是其他种族的竞争性抗性。在基因对基因的水平中，植物和病原体一起进化，并且在一者中的遗传变化与另一者中的变化平衡。因此，使用自然变异，培育者组合大部分对于产量、品质、均匀性、抵抗力、抗性的可用基因。抗性基因的来源包括天然或外源品种、祖传品种、野生植物近缘种、以及诱发突变，例如用诱变剂处理植物材料。使用本发明，为植物育种者提供一种诱导突变的新工具。因此，本领域技术人员可以分析抗性基因来源的基因组，并且在具有所希望的特征或性状的品种中采用本发明诱导产生抗性基因，这具有比先前的诱变剂更大的精确度，并且因此加速并改善植物育种程序。

改善的植物和酵母细胞

本发明还提供了通过本文所述的方法可获得并通过这些方法获得的植物和酵母细胞。通过本文所述的方法获得的改善的植物可以适用于通过表达确保例如对植物害虫、除草剂、干旱、低温或高温、过量水等耐受的基因来进行食品或饲料生产。

通过本文所述的方法获得的改善的植物，具体地是农作物和藻类可以适用于通过表达例如比野生型中通常所见更高的蛋白质、碳水化合物、营养素或维生素水平来进行食品或饲料生产。就这一点而言，改善的植物，具体地是豆类和块茎类是优选的。

改善的藻类或其他植物例如芸苔可以例如特别适用于生产植物油或生物燃料例如醇(具体地是甲醇和乙醇)。这些藻类可以被工程化以表达或过量表达用于油或生物燃料工业中的高水平油或醇。

本发明还提供了改善的植物部分。植物部分包括但不限于，叶、茎、根、块茎、种子、胚乳、胚珠、以及花粉。如本文所设想的植物部分可以是有活力的、无活力的、可再生的、和/或不可再生的。

本文还涵盖的是提供根据本发明的方法生成的植物细胞和植物。在本发明的范围内还包括通过传统育种方法产生的含有遗传修饰的植物的配子、种子、胚胎(合子胚或体细胞胚)、子代或杂种。此类植物可以含有插入在靶序列处或代替靶序列的异源或外源DNA序列。可替代地，此类植物可以仅含有在一个或多个中的变化(突变、缺失、插入、取代)。这样，此类植物与祖代植物的不同之处仅在于特定修饰的存在。

因此，本发明提供了通过本发明产生的植物、动物或细胞、或其子代。该子代可以是产生的植物或动物的克隆，或者可以由通过与相同种类的其他个体杂交以使另外希望的性状渗入其后代来进行的有性繁殖产生。在多细胞生物体(特别是动物或植物)的情况下，细胞可以是体内或离体的。

Cpf1效应蛋白复合物可以用于非人类生物体/动物

在一个方面中，本发明提供了一种非人类真核生物体；优选地是多细胞真核生物体，这些生物体包含根据所述实施例中的任一个的真核宿主细胞。在其他方面中，本发明提供了一种真核生物体；优选地是多细胞真核生物体，这些生物体包含根据所述实施例中的任一个的真核宿主细胞。在这些方面的一些实施例中，该生物体可以是动物；例如，哺乳动物。而且，该生物体可以是节肢动物，例如昆虫。生物体还可以是植物。此外，生物体可以是真菌。

本发明还可以扩展到其他农业应用，例如像农场和生产动物。例如，猪具有许多特征，这些特征使得它们作为生物医学模型是有吸引力的，尤其是在再生医学中。具体地说，具有重症联合免疫缺陷(SCID)的猪可以提供用于再生医学、异种移植(也本文的其他位置讨论)以及肿瘤发展的有用模型并且将有助于开发用人类SCID患者的治疗。Lee等人(ProcNatl Acad Sci U S A.[美国国家科学院院刊]2014年5月20日；111(20):7260-5)利用一种报道基因指导的转录激活因子样效应核酸酶(TALEN)系统，以高效率生成体细胞中的重组激活基因(RAG)2的靶向修饰，包括影响两种等位基因的一些修饰。Cpf1效应蛋白可以适用于一种类似的系统。

Lee等人的方法(Proc Natl Acad Sci U S A.[美国国家科学院院刊]2014年5月20日；111(20):7260-5)可以与如下类似地适用于本发明。突变的猪是通过靶向修饰胎儿成纤维细胞中的RAG2，随后进行SCNT和胚胎转移来产生的。编码CRISPR Cas和报道基因的构建体被电穿孔到胎儿来源的成纤维细胞中。在48h后，表达绿色荧光蛋白的转染细胞以估计每孔一个单一细胞的稀释分到96孔板的单个孔中。RAG2的靶向修饰是通过扩增侧接任何CRISPR Cas切割位点的基因组DNA片段随后对PCR产物进行测序来筛选的。在筛选并确保不存在位点外突变之后，将携带RAG2的靶向修饰的细胞用于SCNT。去除极体连同卵母细胞的一部分相邻细胞质(推测含有中期II板)，并且使供体细胞置于卵黄周隙中。然后电穿孔重构的胚胎，以将供体细胞与卵母细胞融合，并且然后化学激活。将激活的胚胎在具有0.5μMScriptaid(S7817；西格马阿德里奇公司(Sigma-Aldrich))猪受精卵培养基(PorcineZygote Medium)3(PZM3)中孵育14-16h。然后洗涤胚胎以去除Scriptaid并且在PZM3中培养，直到它们转移到代孕猪的输卵管为止。

本发明还可应用于修饰其他动物例如牛的SNP。Tan等人(Proc Natl Acad Sci US A.[美国国家科学院院刊]2013年10月8日；110(41):16526-16531)使用质粒、rAAV和寡核苷酸模板扩增家畜基因编辑工具包，以包括转录激活因子样(TAL)效应核酸酶(TALEN)和成簇规律间隔短回文重复序列(CRISPR)/Cas9-刺激性同源定向修复(HDR)。根据他们的方法将基因特异性gRNA序列克隆到丘奇实验室(Church lab)gRNA载体(Addgene ID:41824)中(Mali P,等人,(2013)RNA-Guided Human Genome Engineering via Cas9[经由Cas9进行RNA指导的人类基因组工程化].Science[科学]339(6121):823-826)。Cas9核酸酶是通过共转染hCas9质粒(Addgene ID:41815)或由RCIScript-hCas9合成的mRNA来提供的。此RCIScript-hCas9是通过将来自hCas9质粒(涵盖hCas9cDNA)的XbaI-AgeI片段亚克隆到RCIScript质粒中来构建。

Heo等人(Stem Cells Dev.[干细胞发展]2015年2月1日；24(3):393-402.doi:10.1089/scd.2014.0278.电子版2014年11月3日)报道了在牛基因组中使用牛多能细胞和成簇规律间隔短回文重复序列(CRISPR)/Cas9核酸酶的高效基因靶向。首先，Heo等人通过异位表达山中因子(yamanaka factor)并且进行GSK3β和MEK抑制剂(2i)处理来由牛体成纤维细胞生成诱导的多能干细胞(iPSC)。Heo等人观察到，这些牛iPSC在畸胎瘤的基因表达和发育潜力方面高度类似于天然多能干细胞。此外，对于牛NANOG座位特异的CRISPR-Cas9核酸酶在牛iPSC和胚胎的牛基因组中显示高度有效的编辑。

提供了一种对例如牛的动物执行并传播经济上重要的经济性状的性状的谱图分析，这些性状例如胴体组成、胴体质量、母体和繁殖性状以及平均日增重。综合性谱图的分析以DNA标记(最常是单核苷酸多态性或SNP)的发现开始。在谱图之后的所有标记是通过科研机构的独立科学家发现的，这些研究机构包括大学、研究团体以及政府机构例如USDA。然后在验证群体中分析的标记。使用代表各种生产环境和生物类型的多种资源种群，通常与来自牛肉产业的种畜、母犊牛、饲育场和/或包装部门的行业伙伴一起工作，以收集不能普遍获得的表型。牛基因组数据库是广泛可用的，参见例如，NAGRP牛基因组协调程序(http://www.animalgenome.org/cattle/maps/db.html)。因此，本发明可以适用于靶向牛SNP。本领域技术人员可以利用用于靶向SNP的以上方案并且将它们应用于牛SNP，例如，如Tan等人或Heo等人所述的。

Qingjian Zou等人(Journal of Molecular Cell Biology Advance Access[分子细胞生物学杂志]，在2015年10月12日在线先行公开)证实通过靶向狗肌生成抑制蛋白(MSTN)基因的第一外显子(骨骼肌质量的负调节物)增加狗的肌肉质量。首先，使用靶向MSTN的sgRNA与Cas9载体共转染到犬胚胎成纤维细胞(CEF)中来验证sgRNA的效率。之后，通过微注射具有正常形态学的胚胎与Cas9 mRNA和MSTN sgRNA的混合物并且将受精卵自身移植到同一母狗的输卵管来生成MSTN KO狗。与其野生型同窝出生母狗相比，敲除小狗在大腿上显示明显的肌肉表型。这也可以使用本文提供的Cpf1 CRISPR系统来进行。

家畜—猪

在一些实施例中，家畜中的病毒靶标可以包括猪CD163，例如在猪巨噬细胞上。CD163与PRRSv(猪繁殖与呼吸综合征病毒，它是一种动脉炎病毒)的感染(认为是通过病毒细胞侵入)缔合。PRRSv的感染，特别是对猪肺泡巨噬细胞(可见于肺中)的感染导致先前不能治愈的猪综合征(“神秘病”或“蓝耳病”)，从而使得家猪遭受(包括)生殖障碍、体重减轻和高死亡率。常常可见机会性感染例如流行性肺炎、脑膜炎和耳肿胀，这是因为通过巨噬细胞活性丧失会引起免疫缺陷。由于抗生素使用的增加和经济损失(估计每年660百万美元)，这也具有重大的经济和环境影响。

如密苏里大学(University of Missouri)的Kristin M Whitworth和Dr RandallPrather博士等人与Genus公司合作(Nature Biotech[自然生物技术]3434，2015年12月07日在线公开)报道的，使用CRISPR-Cas9靶向CD163并且编辑的猪的后代当暴露于PRRSv时是有抗性的。在CD163的外显子7中均具有突变的一个雄性起始者和一种雌性起始者两者繁殖产生后代。雄性起始者在等位基因的外显子7中具有11-bp的缺失，这导致移码突变以及结构域5中的氨基酸45的错义翻译和氨基酸64处的后一个提前终止密码子。另一个等位基因具有外显子7中的2-bp添加和前述内含子中的377-bp缺失，这被预测为引起结构域5的前49个氨基酸的表达，随后是在氨基酸85处的提前终止密码子。母猪在一个等位基因中具有7bp添加，该添加在翻译时预测表达结构域5的前48个氨基酸，随后是在氨基酸70处的提前终止密码子。母猪的另一个等位基因是不可扩增的。预测所选择的后代是无效突变动物(CD163-/-)，即CD163敲除。

因此，在一些实施例中，猪肺泡巨噬细胞可以被CRISPR蛋白靶向。在一些实施例中，猪CD163可以被CRISPR蛋白靶向。在一些实施例中，猪CD163可以通过诱导DSB或通过插入或缺失来敲除，例如靶向外显子7的缺失或修饰，包括以上所述的那些缺失或修饰中的一种或多种，或者在该基因的其他区域中，例如外显子5的缺失或修饰。

还设想了一种编辑的猪及其子代，例如CD163敲除猪。这可以是出于家畜、育种或建模目的(即，猪模型)。还提供了包含基因敲除的精液。

CD163是清道夫受体富含半胱氨酸(SRCR)超家族的成员。基于体外研究，蛋白质的SRCR结构域5是负责启封和释放病毒基因组的结构域。这样，也可以靶向SRCR超家族的其他成员，以便评估对其他病毒的抗性。PRRSV也是哺乳动物动脉炎病毒组的成员，该病毒组还包括鼠科乳酸脱氢酶病毒、猴出血热病毒以及马动脉炎病毒。这些动脉炎病毒享有重要的发病机理特征，包括巨噬细胞向性和引起严重疾病和持续感染两者的能力。因此，动脉炎病毒以及具体地乳酸脱氢酶病毒、猴出血热病毒和马动脉炎病毒可以例如通过猪CD163或其在其他种类中的同源物，并且还提供鼠科、猴和马的模型以及敲除。

实际上，此方法可以扩展到引起其他家畜疾病且可以传播到人类的病毒或细菌，例如猪流感病毒(SIV)菌株，包括丙型流感和称为H1N1、H1N2、H2N1、H3N1、H3N2以及H2N3的甲型流感亚型，以及以上提及的肺炎、脑膜炎和水肿。

使用RNA-指导的Cpf1效应蛋白复合物进行治疗性靶向

如将清楚的，设想的是本发明系统可以用于靶向任何目的多核苷酸序列。本发明提供了一种非天然存在的或工程化的组合物、或编码所述组合物的组分的一种或多种多核苷酸、或含有编码所述组合物的组分一种或多种多核苷酸的载体或递送系统，其用于体内、离体或体外修饰靶细胞并且该修饰可以改变细胞使得一旦修饰，CRISPR修饰细胞的子代或细胞系保留改变的表型的方式实施。这些修饰的细胞和子代可以是多细胞生物体的一部分，例如在将CRISPR系统应用于所希望的细胞类型的情况下的植物或动物。CRISPR发明可以是治疗性治疗方法。治疗性治疗方法可以包括基因或基因组编辑，或基因治疗。

治疗病原体，如细菌、真菌和寄生虫病原体

本发明还可以适用于治疗细菌、真菌和寄生虫病原体。大部分研究工作集中于开发新的抗生素，然而一旦开发，就会经受相同的抗药性问题。本发明提供了克服这些困难的新颖基于CRISPR的替代方案。另外，与现存的抗生素不同，基于CRISPR的治疗可以是制成病原体特异性的，从而诱导靶病原体的细菌细胞死亡同时避免有益细菌死亡。

Jiang等人(“RNA-guided editing of bacterial genomes using CRISPR-Cassystems[使用CRISPR-Cas对细菌基因组进行RNA指导编辑]”Nature Biotechnology[自然生物技术]第31卷,第233-9页,2013年3月)使用一种CRISPR-Cas9系统来突变或杀死肺炎链球菌或大肠杆菌。将精确突变引入到基因组中的工作依赖于靶基因组位点处的双-RNA:Cas9-引导的切割以杀死未突变细胞，并且不再需要选择标记或反选择系统。CRISPR系统已用于逆转抗生素抗性并且消除各菌株之间的抗性转移。Bickard等人证实重编程序以靶向致病基因的Cas9杀死了致命的金黄色葡萄球菌而不是无毒的金黄色葡萄球菌。将核酸酶重编程序以靶向抗生素抗性基因，破坏了具有抗生素抗性基因的葡萄球菌质粒并且针对质粒携带的抗性基因的传播进行免疫。(参见，Bikard等人，“Exploiting CRISPR-Casnucleases to produce sequence-specific antimicrobials[探索产生序列特异性抗微生物剂的CRISPR-Cas核酸酶]”，Nature Biotechnology[自然生物技术]第32卷,1146-1150,doi:10.1038/nbt.3043，2014年10月05日在线公开)。Bikard证实CRISPR-Cas9抗微生物剂在体内起到杀死老鼠皮肤定位模型中的金黄色葡萄球菌的作用。类似地，Yosef等人使用一种CRISPR系统来靶向编码赋予β内酰胺类抗生素抗性的酶的基因(参见Yousef等人,“Temperate and lytic bacteriophages programmed to sensitize and killantibiotic-resistant bacteria[编程以敏化并杀死抗生素抗性细菌的温和和烈性噬菌体]”Proc.Natl.Acad.Sci.USA[美国国家科学院院刊],第112卷,第7267-7272页,doi:10.1073/pnas.1500107112，2015年5月18日在线公开)。

CRISPR系统可以用于编辑对其他遗传方法具有抗性的寄生虫基因组。例如，已显示一种CRISPR-Cas9系统能将双链断裂引入到约氏疟原虫基因组(参见Zhang等人,“Efficient Editing of Malaria Parasite Genome Using the CRISPR/Cas9System[使用CRISPR/Cas9系统有效编辑疟原虫基因组]”，mBio.第5卷,e01414-14,2014年7月-8月)。Ghorbal等人(“Genome editing in the human malaria parasite Plasmodiumfalciparumusing the CRISPR-Cas9system[使用CRISPR-Cas9系统在人类疟原虫镰状疟原虫中进行基因组编辑]”，Nature Biotechnology[自然生物技术],第32卷,第819-821页,doi:10.1038/nbt.2925,2014年6月1日在线公开)修饰了两种基因orc1和kelch13的序列，这两种基因分别在基因沉默和形成对青蒿素的抗性中具有推定的作用。尽管对于该修饰没有直接选择，但是在适当位点改变的寄生虫以极高效率恢复，这表明使用此系统可以生成中性突变或甚至有害突变。CRISPR-Cas9还用于修饰其他致病性寄生虫的基因组，包括刚地弓形虫(参见Shen等人,“Efficient gene disruption in diverse strains ofToxoplasma gondii Using CRISPR/CAS9[使用CRISPR/CAS9在刚地弓形虫的不同菌株中进行有效基因破坏]”，mBio第5卷:e01114-14,2014；以及Sidik等人,“Efficient GenomeEngineering of Toxoplasma gondii Using CRISPR/Cas9[使用CRISPR/Cas9进行刚地弓形虫的有效基因组工程化]”，PLoS One[公共科学图书馆综合],第9卷,e100450,doi:10.1371/journal.pone.0100450,2014年6月27日在线公开)。

Vyas等人(“A Candida albicans CRISPR system permits geneticengineering of essential genes and gene families[白色念珠菌CRISPR系统允许对必需基因和基因家族进行遗传工程化],”Science Advances[科学进展],第1卷,e1500248,DOI:10.1126/sciadv.1500248,2015年4月3日)采用一种CRISPR系统来克服白色念珠菌中长期存在的遗传工程化障碍并且在几种不同基因的两个拷贝的单一实验中进行有效突变。在其他几种机制促成抗药性的有机体中，维亚斯产生不再显示母体临床分离物Can90显示的对氟康唑或放线菌酮的抗性的纯合双突变体。Vyas还通过创建条件型等位基因来获得白色念珠菌的必需基因中的纯合的失功能突变。对于核糖体RNA加工所需要的DCR1无效等位基因在低温下是致命的，但是在高温下是可存活的。Vyas使用一种引入无效突变的修复模板和不能在16℃生长分离的dcr1/dcr1突变体。

本发明的CRISPR系统通过破坏染色体座位来用于镰状疟原虫中。Ghorbal等人(“Genome editing in the human malaria parasite Plasmodium falciparum usingthe CRISPR-Cas9system[使用CRISPR-Cas9系统在人类疟原虫镰状疟原虫中进行基因组编辑]”，Nature Biotechnology[自然生物技术],32,819-821(2014),DOI:10.1038/nbt.2925,2014年6月1日)采用一种CRISPR系统来在疟疾基因组中引入特异性基因敲除和单一核苷酸取代。为了使CRISPR-Cas9系统适于镰状疟原虫，Ghorbal等人生成在也携带药物选择标记ydhodh的pUF1-Cas9附加体中的疟原虫调节元件控制下并且用于转录sgRNA的表达载体，该附加体给予对一种镰状疟原虫二氢乳清酸脱氢酶(PfDHODH)抑制剂DSM1的抗性，使用镰状疟原虫U6小核(sn)RNA调节元件，将用于同源重组修复的指导RNA和供体DNA模板置于相同质粒pL7上。还参见，Zhang C.等人(“Efficient editing of malariaparasite genome using the CRISPR/Cas9system[使用CRISPR/Cas9系统有效编辑疟原虫基因组]”，MBio,2014年7月1日；5(4):E01414-14,doi:10.1128/MbIO.01414-14)和Wagner等人(“Efficient CRISPR-Cas9-mediated genome editing in Plasmodium falciparum[镰状疟原虫中的有效CRISPR-Cas9介导的基因组编辑]”，Nature Methods[自然方法]11,915-918(2014),DOI:10.1038/nmeth.3063)。

治疗病原体，如病毒病原体，例如HIV

Cas-介导的基因组编辑可以用于在躯体组织中引入保护性突变，以对抗非遗传性疾病或复杂疾病。例如，淋巴细胞中NHEJ-介导的CCR5受体灭活(Lombardo等人,NatBiotechnol.[自然生物技术]2007年11月；25(11):1298-306)可以是用于避免HIV感染的可行策略，而PCSK9(Cohen等人,Nat Genet.[自然遗传学]2005年2月；37(2):161-5)或血管生成素(Musunuru等人,N Engl J Med.[新英格兰医学杂志],2010年12月2日；363(23):2220-7)的缺失可以提供针对具有他汀类抗性的血胆固醇过多或高血脂症的治疗作用。尽管这些靶标也可以使用siRNA介导的蛋白质敲低来解决，但是NHEJ介导的基因失活优点是实现永久性治疗益处而不需要持续治疗的能够。正如所有基因治疗一样，确定每个提出的治疗性用途具有有利的益处-危险比率当然是重要的。

将编码Cas9和指导RNA的质粒DNA连同修复模板一起流体动力学递送到酪氨酸血症成年小鼠模型的肝脏中，已显示此递送能够校正突变体Fah基因并且在约250分之1个细胞中挽救野生型Fah蛋白质的表达(Nat Biotechnol.[自然生物技术],2014年6月；32(6):551-3)。另外，临床试验成功地使用ZF核酸酶，通过离体敲除CCR5受体来对抗HIV感染。在所有患者中，HIV DNA水平降低，并且在四分之一的患者中，HIV RNA变得不可检测(Tebas等人,N Engl J Med.[新英格兰医学杂志],2014年3月6日；370(10):901-10)。这两种结果都表明了可编程核酸酶作为一种新治疗平台的希望。

在另一个实施例中，自灭活慢病毒载体可以用于和/或适于本发明的CRISPR-Cas系统，该自灭活慢病毒载体具有靶向由HIV tat/rev共享的共有外显子的siRNA、核仁定位TAR诱饵、和抗CCR5特异性锤头状核酶(例如，参见，DiGiusto等人(2010)Sci Transl Med[科学转化医学]2:36ra43)。可以收集最少2.5×10⁶个CD34+细胞/每千克患者体重并且以2×10⁶个细胞/ml的密度在X-VIVO 15培养基(龙沙公司(Lonza))中预刺激16至20小时，该培养基含有2μmol/L-谷氨酰胺、干细胞因子(100ng/ml)、Flt-3配体(Flt-3L)(100ng/ml)和促血小板生成素(10ng/ml)(CellGenix公司)。可以用慢病毒以感染复数5在75-cm²的包被有纤连蛋白(25mg/cm²)(重组人纤维连接片断(RetroNectin)，宝生物工程株式会社(TakaraBio Inc.))的组织培养瓶中转导预刺激的细胞16至24小时。

通过本领域的知识和本披露中的教授内容，技术人员可以校正HSC至免疫缺陷条件，例如HIV/AIDS，包括使HSC与靶向并敲除CCR5的CRISPR-Cas9系统接触。靶向并敲除含有CCR5-和-Cpf1蛋白的粒子的指导RNA(以及有利地双指导方法，例如一对不同的指导RNA；例如，靶向原代人类CD4+T细胞和CD34+造血干细胞以及祖细胞(HSPC)中的两种临床相关基因B2M和CCR5的指导RNA)与HSC接触。可以给予如此接触的细胞；并且任选地处理/扩增；参考Cartier。还参见，Kiem,“Hematopoietic stem cell-based gene therapy for HIVdisease[用于HIV疾病的基于造血干细胞的基因疗法]”，Cell Stem Cell.[细胞干细胞]2012年2月3日；10(2):137-147；连同其引用的文献一起通过引用并入本文；Mandal等人,“Efficient Ablation of Genes in Human Hematopoietic Stem and Effector Cellsusing CRISPR/Cas9[使用CRISPR/Cas9有效消除人类造血干细胞和效应细胞中的基因]”Cell Stem Cell[细胞干细胞],第15卷,第5期,第643-652页,2014年11月6日；连同其引用的文献一起通过引用并入本文。还参考Ebina,“CRISPR/Cas9system to suppress HIV-1expression by editing HIV-1integrated proviral DNA[通过编辑HIV-1整合的前病毒DNA来抑制HIV-1表达的CRISPR/Cas9系统]”SCIENTIFIC REPORTS[科技报告]|3:2510|DOI:10.1038/srep02510，连同其引用的文献一起通过引用并入本文，作为使用CRISPR-Cpf1系统对抗HIV/AIDS的另一种手段。

用于HIV治疗的基因组编辑的基本原理起源于以下观察：对于CCR5(病毒的细胞共受体)中的失功能突变纯合的个体对感染具有高抗性并且以其他方式获得健康，这表明通过基因组编辑模拟此突变可能是一种安全且有效的治疗策略[Liu,R.等人,Cell[细胞]86,367-377(1996)]。当HIV感染的患者被给予来自对失功能CCR5突变纯合的供体的同种异体骨髓移植，从而导致不可检测的HIV水平和正常CD4T细胞计数的恢复时，这个想法在临床上得到证实[Hutter,G.等人,The New England journal of medicine[新英格兰医学杂志]360,692-698(2009)]。尽管骨髓移植对于大部分HIV患者而言由于成本和潜在移植物对抗宿主疾病而是不现实的治疗策略，但将患者自身T细胞转化为CCR5的HIV治疗则是希望的。

使用ZFN和NHEJ敲除人源化小鼠HIV模型中的CCR5的早期研究显示CCR5编辑的CD4T细胞的移植提高了病毒载量和CD4T-细胞计数[Perez,E.E.等人,Naturebiotechnology[自然生物技术]26,808-816(2008)]。重要的是，这些模型还显示HIV感染导致CCR5裸细胞的选择，这表明编辑赋予了适合的优点并且潜在地允许少量编辑的细胞形成治疗效果。

作为这个研究和其他希望的临床前研究的结果，现在已在人类中测试了敲除人类T细胞中的CCR5的基因组编辑治疗[Holt,N.等人Nature biotechnology[自然生物技术]28,839-847(2010)；Li,L.等人Molecular therapy:the journal of the AmericanSociety of Gene Therapy[分子治疗：美国基因治疗协会杂志]21,1259-1269(2013)]。在最近的I期临床试验中，来自患有HIV的患者的CD4+T细胞被去除，用设计敲除CCR5基因的ZFN编辑，并且自身移植回到患者中[Tebas,P.等人,The New England journal ofmedicine[新英格兰医学杂志]370,901-910(2014)]。

在另一个研究(Mandal等人,Cell Stem Cell,[细胞干细胞],第15卷,第5期,第643-652页,2014年11月6日)中，CRISPR-Cas9已靶向人类CD4+T细胞和CD34+造血干细胞和祖细胞(HSPC)中的两种临床相关基因B2M和CCR5。使用单一RNA指导序列引起HSPC中而不是T细胞中的高效诱变。双重指导方法提高了两种细胞类型中的基因缺失效力。经受使用CRISPR-Cas9的基因组编辑的HSPC保留多谱系潜能。预测的中靶和脱靶突变是经由HSPC中的靶序列测序来检查的并且低水平的脱靶诱变仅在一个位点处观察到。这些结果表明CRISPR-Cas9可以有效消除HSPC中具有最小脱靶诱变的基因，这些HSPC对于具有基于造血细胞的治疗具有广泛的适用性。

Wang等人(PLoS One.[公共科学图书馆综合]2014年12月26日；9(12):e115987.doi:10.1371/journal.pone.0115987)使用表达CRISPR相关蛋白9(Cas9)和CCR5指导RNA的慢病毒载体经由Cas9和单一指导RNA(指导RNA)来沉默CCR5。Wang等人证实表达Cas9和CCR5指导RNA的慢病毒载体到HIV-1易感性人类CD4+细胞中的单轮转导产生高频率的CCR5基因破坏。CCR5基因破坏的细胞不仅抵抗R5-向性HIV-1，包括传输/起始者(T/F)HIV-1分离株，而且在R5-向性HIV-1感染过程中比CCR5基因未破坏细胞具有选择优势。与在甚至转导后84天仍稳定转导的细胞中的这些CCR5指导RNA高度同源的潜在脱靶位点处的基因组突变通过T7内切核酸酶I测定未检测到。

Fine等人(Sci Rep.[科学通讯]2015年7月1日；5:10777.doi:10.1038/srep10777)鉴定了一种表达化脓链球菌Cas9(SpCas9)蛋白片段的双盒系统，这些蛋白片段在细胞中拼接在一起形成能够进行位点特异性DNA切割的功能蛋白。使用特定CRISPR指导链，Fine等人证实此系统作为单一Cas9并且作为一对Cas9切割酶来切割人类HEK-293T细胞内的HBB和CCR5基因的效力。反式拼接的SpCas9(tsSpCas9)与野生型SpCas9(wtSpCas9)相比在标准转染剂量下展示约35％的核酸酶活性，但是在较低给予剂量下具有基本上降低的活性。tsSpCas9相对于wtSpCas9大大减小的可读框长度潜在地允许更复杂且更长的遗传元件包装到AAV载体中，包括组织特异性启动子、多重指导RNA表达、以及与SpCas9的效应物结构域融合。

Li等人(J Gen Virol.[普通病毒学杂志]2015年8月；96(8):2381-93.doi:10.1099/vir.0.000139.电子版2015年4月8日)证实CRISPR-Cas9可以有效介导细胞系中的CCR5座位的编辑，从而导致细胞表面上的CCR5表达的敲除。下一代测序揭示在预测的CCR5切割位点周围引入了不同的突变。对于所分析的三种最有效的指导RNA中的每一种，在15个最高得分的潜在位点处未检测到脱靶效应。通过构建携带CRISPR-Cas9组分的嵌合Ad5F35腺病毒，Li等人有效转导原代CD4+T-淋巴细胞并且破坏CCR5表达，并且正性转导细胞被赋予了HIV-1抗性。

本领域技术人员可以利用以上研究，例如Holt,N.等人,Nature biotechnology[自然生物技术]28,839-847(2010)；Li,L等人,Molecular therapy:the journal of theAmerican Society of Gene Therapy[分子疗法：美国基因疗法协会杂志胞]21,1259-1269(2013),Mandal等人,Cell Stem Cell[细胞干细胞],第15卷,第5期,第643-652页,2014年11月6日,Wang等人(PLoS One.[公共科学图书馆综合]2014年12月26日；9(12):e115987.doi:10.1371/journal.pone.0115987)，Fine等人(Sci Rep.[科学通讯]2015年7月1日；5:10777.doi:10.1038/srep10777)和Li等人(J Gen Virol.[普通病毒学杂志]2015年8月；96(8):2381-93.doi:10.1099/vir.0.000139。电子版2015年4月8日)的以上研究用于使用本发明的CRISPR Cas系统靶向CCR5。

治疗病原体，如病毒病原体，例如HBV

本发明还可以适用于治疗乙型肝炎病毒(HBV)。然而，CRISPR Cas系统必须适于通过例如优化剂量和序列来避免RNAi的缺点，例如过度紧张的(oversatring)内源性小RNA途径的风险(参见例如，Grimm等人,Nature[自然],第441卷,2006年5月26日)。例如，考虑例如每位人类约1-10x10¹⁴个粒子的低剂量。在另一个实施例中，针对HBV的CRISPR Cas系统可以脂质体例如稳定的核酸脂质粒子(SNALP)来给予(参见例如，Morrissey等人,NatureBiotechnology[自然生物技术],第23卷,第8期,2005年8月)。考虑了每日静脉内注射约1、3或5mg/kg/天的靶向SNALP中的HBV RNA的CRISPR Cas。日治疗可以经过约三天，并且然后每周治疗持续约五周。在另一个实施例中，Chen等人(Gene Therapy[基因疗法](2007)14,11-19)的系统可以用于并且/或者适于本发明的CRISPR Cas系统。Chen等人使用双链腺相关病毒8-假病毒载体(dsAAV2/8)递送shRNA。单次给予携带HBV-特异性shRNA的dsAAV2/8载体(每只小鼠1x10¹²个载体基因组)有效抑制HBV转基因小鼠肝脏中的HBV蛋白、mRNA和复制DNA的稳定水平，从而使得循环中的HBV载量降低多至2-3log₁₀。在载体给予后显著HBV抑制持续至少120天。shRNA的治疗效果是靶序列依赖性的并且并不涉及干扰素激活。对于本发明，针对HBV的CRISPR Cas系统可以克隆到AAV载体例如dsAAV2/8载体中并且例如以每位患者约1x10¹⁵个载体染色体至约1x10¹⁶个载体染色体的剂量给予。在另一个实施例中，Wooddell等人(Molecular Therapy[分子疗法],第21卷,第5期,973-985,2013年5月)的方法可以用于并且/或者适于本发明的CRISPR Cas系统。Wooddell等人还证实肝细胞靶向的N-乙酰半乳糖胺轭合的蜂毒肽样肽(NAG-MLP)与肝脏向性胆固醇轭合的siRNA(chol-siRNA)靶向性凝血因子VII(F7)的简单共注射引起小鼠和非人类灵长类动物中的有效F7敲低而不会有临床化学变化或细胞因子的诱导。使用HBV感染的瞬时和转基因小鼠模型，Wooddell等人证实NAG-MLP与靶向保守性HBV序列的强效chol-siRNA的单次共注射引起病毒RNA、蛋白质和病毒DNA的复对数阻遏，该效果持续时间长。对于本发明，可以设想例如约6mg/kg NAG-MLP与6mg/kg HBV特异性CRISPR Cas的静脉内共注射。在替代方案中，可以在第一天递送约3mg/kg NAG-MLP和3mg/kg HBV特异性CRISPR Cas，随后在两周后给予约2-3mg/kg NAG-MLP和2-3mg/kg HBV特异性CRISPR Cas。

Lin等人(Mol Ther Nucleic Acids.[分子疗法-核酸]2014年8月19日；3:e186.doi:10.1038/mtna.2014.38)设计了针对基因型A HBV的八种gRNA。在使用HBV-特异性gRNA时，CRISPR-Cas9系统在用HBV表达载体转染的Huh-7细胞中显著减少HBV核心和表面蛋白。在八种筛选的gRNA中，鉴定了两种有效的gRNA。靶向保守性HBV序列的一种gRNA作用于不同基因型。使用流体动力学-HBV持久性小鼠模型，Lin等人进一步证实此系统可以切割含有肝内HBV基因组的质粒并且促进其在体内清除，从而使得血清表面抗原水平降低。这些数据表明CRISPR-Cas9系统可以破坏体外和体内两者的HBV表达模板，这表明其根除持久性HBV感染的可能性。

Dong等人(Antiviral Res.[抗病毒研究]2015年6月；118:110-7.doi:10.1016/j.antiviral.2015.03.015.电子版2015年4月3日)使用CRISPR-Cas9系统靶向HBV基因组并且有效抑制HBV感染。Dong等人合成了靶向HBV保守区的四种单一指导RNA(指导RNA)。具有Cas9的这些指导RNA的表达减少了在Huh7细胞以及HBV-复制细胞HepG2.2.15中的病毒产生。Dong等人进一步证实CRISPR-Cas9直接切割和切割介导的诱变发生在转染细胞的HBVcccDNA中。在携带HBV cccDNA的小鼠模型中，经由快速尾静脉内注射指导RNA-Cas9质粒引起低水平的cccDNA和HBV蛋白。

Lin等人(J Gen Virol.[普通病毒学杂志]2015年8月；96(8):2252-61.doi:10.1099/vir.0.000159。电子版2015年4月22日)设计了靶向不同HBV基因型的保守区的八种指导RNA(gRNA)，这些指导RNA可以在体外和体内显著抑制HBV复制，以研究使用CRISPR-Cas9系统破坏HBV DNA模板的可能性。HBV特异性gRNA/Cpf1系统可以抑制细胞内不同基因型的HBV的复制，并且病毒DNA通过单一gRNA/Cpf1系统显著减少并且通过不同gRNA/Cpf1系统的组合来清除。

Wang等人(World J Gastroenterol.[世界胃肠病学杂志]2015年8月28日；21(32):9554-65.doi:10.3748/wjg.v21.i32.9554)设计了针对基因型A-D HBV的15种gRNA。选择涵盖HBV调节区的两种gRNA(双-gRNA)的十一种组合。每种gRNA和11种双gRNA对抑制HBV(基因型A-D)复制的效率是通过测量培养基上清液中的HBV表面抗原(HBsAg)或e抗原(HBeAg)来检查的。HBV-表达载体的破坏是在用双-gRNA和HBV-表达载体共转染的HuH7细胞中使用聚合酶链反应(PCR)和测序方法检查的，并且cccDNA的破坏是在HepAD38细胞中使用KCl沉淀法、质粒安全性ATP依赖性DNA酶(PSAD)消化法、滚环扩增法以及定量PCR组合法来检查的。这些gRNA的细胞毒性是通过一种线粒体四唑测定来评估的。所有gRNA可以显著减少培养上清液中的HBsAg或HBeAg产生，该产生依赖于gRNA所针对的区域。所有双gRNA均可以有效抑制基因型A-D HBV的HBsAg和/或HBeAg产生，并且双gRNA抑制HBsAg和/或HBeAg产生的效力与单独使用的单一gRNA相比显著增加。另外，通过PCR直接测序，我们确认这些双gRNA可以通过去除两种使用的gRNA的切割位点之间的片段来特异性破坏HBV表达模板。最重要的是，gRNA-5和gRNA-12组合不仅可以有效抑制HBsAg和/或HBeAg产生，而且破坏HepAD38细胞中的cccDNA储层。

Karimova等人(Sci Rep.[科学通讯]2015年9月3日；5:13734.doi:10.1038/srep13734)鉴定了在HBV基因组的S和X区域内由Cas9切割酶进行的特异性和有效性切割所靶向的交叉基因保守性HBV序列。此方法不仅破坏了报道细胞系中的附加型cccDNA和染色体整合HBV靶位点，而且破坏长期感染和重新感染的肝癌细胞系中的HBV复制。

本领域技术人员可以利用例如Lin等人(Mol Ther Nucleic Acids.[分子治疗-核酸]2014年8月19日；3:e186.doi:10.1038/mtna.2014.38)，Dong等人(Antiviral Res.[抗病毒研究]2015年6月；118:110-7.doi:10.1016/j.antiviral.2015.03.015.电子版2015年4月3日)，Liu等人(J Gen Virol.[普通病毒学杂志]2015年8月；96(8):2252-61.doi:10.1099/vir.0.000159。电子版2015年4月22日)，Wang等人(World J Gastroenterol.[世界胃肠病学杂志]2015年8月28日；21(32):9554-65.doi:10.3748/wjg.v21.i32.9554)和Karimova等人(Sci Rep.[科学通讯]2015年9月3日；5:13734.doi:10.1038/srep13734)的以上研究用于使用本发明的CRISPR Cas系统靶向HBV。

本发明还可以适用于治疗病原体，例如细菌、真菌和寄生虫病原体。大部分研究工作集中于开发新的抗生素，然而一旦开发，就会经受相同的抗药性问题。本发明提供了克服这些困难的新颖基于CRISPR的替代方案。另外，与现存的抗生素不同，基于CRISPR的治疗可以是制成病原体特异性的，从而诱导靶病原体的细菌细胞死亡同时避免有益细菌死亡。

CRISPR系统可以用于编辑对其他遗传方法具有抗性的寄生虫基因组。例如，已显示一种CRISPR-Cas9系统能将双链断裂引入到约氏疟原虫基因组(参见Zhang等人,“Efficient Editing of Malaria Parasite Genome Using the CRISPR/Cas9System[使用CRISPR/Cas9系统有效编辑疟原虫基因组]”，mBio.第5卷,e01414-14,2014年7月-8月)。Ghorbal等人(“Genome editing in the human malaria parasite Plasmodiumfalciparumusing the CRISPR-Cas9system[使用CRISPR-Cas9系统在人类疟原虫镰状疟原虫中进行基因组编辑]”，Nature Biotechnology[自然生物技术],第32卷,第819-821页,doi:10.1038/nbt.2925，2014年6月1日在线公开)修饰了两种基因orc1和kelch13的序列，这两种基因分别在基因沉默和形成对青蒿素的抗性中具有推定的作用。尽管对于该修饰没有直接选择，但是在适当位点改变的寄生虫以极高效率恢复，这表明使用此系统可以生成中性突变或甚至有害突变。CRISPR-Cas9还用于修饰其他致病性寄生虫的基因组，包括刚地弓形虫(参见Shen等人,“Efficient gene disruption in diverse strains ofToxoplasma gondii using CRISPR/CAS9[使用CRISPR/CAS9在刚地弓形虫的不同菌株中进行有效基因破坏]”mBio第5卷:e01114-14,2014；以及Sidik等人，“Efficient GenomeEngineering of Toxoplasma gondii Using CRISPR/Cas9[使用CRISPR/Cas9进行刚地弓形虫的有效基因组工程化]”，PLoS One[公共科学图书馆综合],第9卷,e100450,doi:10.1371/journal.pone.0100450,2014年6月27日在线公开)。

Vyas等人(“A Candida albicans CRISPR system permits geneticengineering of essential genes and gene families[白色念珠菌CRISPR系统允许对必需基因和基因家族进行遗传工程化],”Science Advances[科学进展],第1卷,e1500248,DOI:10.1126/sciadv.1500248，2015年4月3日)采用一种CRISPR系统来克服白色念珠菌中长期存在的遗传工程化障碍并且在几种不同基因的两个拷贝的单一实验中进行有效突变。在其他几种机制促成抗药性的有机体中，维亚斯产生不再显示母体临床分离物Can90显示的对氟康唑或放线菌酮的抗性的纯合双突变体。Vyas还通过创建条件型等位基因来获得白色念珠菌的必需基因中的纯合的失功能突变。对于核糖体RNA加工所需要的DCR1无效等位基因在低温下是致命的，但是在高温下是可存活的。Vyas使用一种引入无效突变的修复模板和不能在16℃生长分离的dcr1/dcr1突变体。

用遗传方面或表观遗传方面治疗疾病

本发明的CRISPR-Cas系统可以用于校正先前使用TALEN和ZFN尝试时有限成功的遗传突变，并且已被鉴定为Cas9系统的潜在靶标，包括如在描述使用Cas9系统靶向座位以使用基因疗法来治疗性解决疾病的方法的爱迪塔斯医药公司(Editas Medicine)的公开申请中，包括Gluckmann等人的WO 2015/048577CRISPR-RELATED METHODS AND COMPOSITIONS[CRISPR相关方法和组合物]；Glucksmann等人的WO 2015/070083CRISPR-RELATED METHODSAND COMPOSITIONS WITH GOVERNING gRNAS[具有控制的gRNA的CRISPR相关方法和组合物]；

研究者考虑基因治疗是否可以用于治疗广泛范围的疾病。预想本发明基于Cpf1效应蛋白的CRISPR系统用于此类治疗用途，包括但不限于进一步列举的靶区域并且使用如下递送方法。可以使用本发明系统有效治疗的病状或疾病的一些实例被包括于基因的实例和本文所包含的参考文献中并且还提供目前与那些病状缔合的基因。所举例说明的基因和病状并不是详尽的。

治疗循环系统疾病

本发明还考虑向血液或造血干细胞递送CRISPR-Cas系统，具体地是本文所述的新颖CRISPR效应蛋白系统。先前已描述了Wahlgren等人(Nucleic Acids Research[核酸研究],2012,第40卷,第17期e130)的血浆外来体并且这些血浆外来体可以用于将CRISPR Cas系统递送至血液。本发明的核酸靶向系统还考虑治疗血红蛋白病，例如地中海贫血和镰状细胞疾病。参见例如，关于可以被本发明的CRISPR Cas系统靶向的潜在靶标的国际专利公开号WO 2013/126794。

Drakopoulou,“Review Article,The Ongoing Challenge of HematopoieticStem Cell-Based Gene Therapy forβ-Thalassemia[评论文章，基于造血干细胞的基因疗法用于β地中海贫血的持续挑战],”Stem Cells International[国际干细胞杂志],第2011卷,文献标识码987980,10页,doi:10.4061/2011/987980，连同其引用的文献如同完全列出一样通过引用并入本文，该文献讨论了使用递送β-球蛋白或γ-球蛋白的基因的慢病毒修饰HSC。与使用慢病毒相比，通过本领域的知识和本披露的教授内容，技术人员可以使用靶向并校正突变的CRISPR-Cas系统(例如，具有递送β-球蛋白或γ-球蛋白，有利地是非镰状β-球蛋白或γ-球蛋白的编码序列的适合HDR模板)校正关于β地中海贫血的HSC；具体地说，指导RNA可以靶向引起β地中海贫血的突变，并且HDR可以提供对于β-球蛋白或γ-球蛋白的适当表达的编码。使靶向含有突变-和-Cas蛋白的粒子的指导RNA与携带突变的HSC接触。该粒子还可以含有校正对于β-球蛋白或γ-球蛋白的适当表达的突变的适合HDR；或者HSC可以与含有或递送HDR模板的第二粒子或载体接触。可以给予如此接触的细胞；并且任选地处理/扩增；参考Cartier。就这一点而言，参考：Cavazzana,“Outcomes of Gene Therapy forβ-Thalassemia Major via Transplantation of Autologous Hematopoietic StemCells Transduced Ex Vivo with a Lentiviralβ^A-T87Q-Globin Vector[主要经由移植用慢病毒β^A-T87Q-球蛋白载体离体转导的自体造血干细胞来进行β地中海贫血的基因疗法的结果]”tif2014.org/abstractFiles/Jean％20Antoine％20Ribeil_Abstract.pdf；Cavazzana-Calvo,“Transfusion independence and HMGA2activation after genetherapy of human β-thalassaemia[在基因疗法人类β-地中海贫血后的输血自主性和HMGA2激活]”Nature[自然]467,318-322(2010年9月16日)doi:10.1038/nature09328；Nienhuis,“Development of Gene Therapy for Thalassemia[地中海贫血的基因疗法的发展],Cold Spring Harbor Perpsectives in Medicine[冷泉港医学观点],doi:10.1101/cshperspect.a011833(2012),LentiGlobin BB305，它是一种含有工程化β-球蛋白基因的慢病毒载体(βA-T87Q)；以及Xie等人,“Seamless gene correction of β-thalassaemia mutations in patient-specific iPSCs using CRISPR/Cas9andpiggyback[在患者特异性iPSC中使用CRISPR/Cas9和分段控制来无缝基因校正β地中海贫血性突变]”,Genome Research[基因组研究]gr.173427.114(2014)http://www.genome.org/cgi/doi/10.1101/gr.173427.114(Cold Spring Harbor LaboratoryPress[冷泉港实验室出版社])；这是Cavazzana涉及人类β-地中海贫血的工作主题和Xie的工作主题，所有这些文献连同其中引用或者与其相关联的所有文献一起通过引用并入本文。在本发明中，HDR模板可以提供表达工程化β球蛋白基因(例如βA-T87Q)或者如谢所述的β-球蛋白的HSC。

Xu等人(Sci Rep.[科学通讯]2015年7月9日；5:12065.doi:10.1038/srep12065)已设计直接靶向球蛋白基因中的内含子2突变位点IVS2-654的TALEN和CRISPR-Cas9。Xu等人使用TALEN和CRISPR-Cas9观察到在IVS2-654座位处的不同双链断裂(DSB)频率，并且当与piggyBac易位子供体组合时TALEN介导与CRISPR-Cas9相比更高的同源基因靶向效率。另外，与TALEN相比，对于CRISPR-Cas9观察到更明显的脱靶事件。最终，使用OP9共培养系统选择用于成红细胞分化的TALEN校正的iPSC克隆并且检测到比未校正细胞相对更高的HBB转录。

Song等人(Stem Cells Dev.[干细胞发展]2015年5月1日1；24(9):1053-65.doi:10.1089/scd.2014.0347。电子版2015年2月5日)使用CRISPR/Cas9校正β-Thal iPSC；基因校正的细胞展现出正常的核型和完整的多能性，因为人类胚胎干细胞(hESC)未显示脱靶效应。然后，Song等人评价了基因校正的β-Thal iPSC的分化效率。Song等人发现在造血分化过程中，基因校正的β-Thal iPSC显示增加的胚状体比率和不同的造血祖细胞百分比。更重要地是，基因校正的β-Thal iPSC品系恢复了HBB表达并且与未校正组相比减少了活性氧产生。Song等人的研究表明β-Thal iPSC的造血分化效率一旦通过CRISPR-Cas9系统校正就会极大地提高。类似的方法可以利用本文所述的CRISPR-Cas系统，例如包含Cpf1效应蛋白的系统来进行。

镰状细胞性贫血是一种常染色体隐性遗传性疾病，其中红血细胞变成镰刀状。它是由位于染色体11的短臂上的β球蛋白基因中的单碱基取代所引起的。因此，产生缬氨酸而不是产生引起镰状血红蛋白(HbS)产生的谷氨酸。这导致形成扭曲性状的红细胞。由于此异常性状，可以阻断小血管，从而引起对骨骼、脾脏和皮肤组织的严重损害。这可以导致疼痛发作、频繁感染、手足综合征或甚至多器官衰竭。扭曲红细胞也更易于发生红细胞溶解，从而导致严重贫血。如在β地中海贫血的情况下，镰状细胞贫血可以是通过用CRISPR-Cas系统修饰HSC来校正的。该系统允许通过切割其DNA并且然后让其自身修复来特异性编辑细胞的基因组。Cas蛋白通过RNA指导序列插入并引导至突变点并且然后它在该点切割DNA。同时，插入健康版本的序列。此序列通过细胞自身修复系统使用来固定诱导的切割。以这种方式，CRISPR-Cas允许校正在先前获得的干细胞中的突变。通过本领域的知识和本披露的教授内容，技术人员可以使用靶向并校正突变的CRISPR-Cas系统(例如，具有递送β-球蛋白，有利地是非镰状β-球蛋白的编码序列的适合HDR模板)校正关于镰状细胞性贫血的HSC；具体地说，指导RNA可以靶向引起镰状细胞性贫血的突变，并且HDR可以提供对于β-球蛋白的适当表达的编码。使靶向含有突变-和-Cas蛋白的粒子的指导RNA与携带突变的HSC接触。该粒子还可以含有校正对于β-球蛋白的适当表达的突变的适合HDR；或者HSC可以与含有或递送HDR模板的第二粒子或载体接触。可以给予如此接触的细胞；并且任选地处理/扩增；参考Cartier。HDR模板可以提供表达工程化β球蛋白基因(例如βA-T87Q)或者如谢所述的β-球蛋白的HSC。

Williams,“Broadening the Indications for Hematopoietic Stem CellGenetic Therapies[扩展用于造血干细胞基因治疗的适应症],”Cell Stem Cell[细胞干细胞]13:263-264(2013)，连同其引用的文献如同完全列出一样通过引用并入本文，该文献报道了到来自患有溶酶体贮积症、异染性脑白质营养不良疾病(MLD)、由芳基硫酸酯酶A缺乏症(ARSA)引起的遗传疾病的患者的HSC/P细胞中的慢病毒介导的基因转移，从而导致神经脱髓鞘；以及到患有威斯科特-奥尔德里奇综合征(Wiskott-Aldrich syndrome(WAS))的患者(患有WAS蛋白缺乏症的患者，该WAS蛋白是一种调节血细胞谱系中的细胞骨架功能的小GTP酶CDC42的效应蛋白，并且因此这些患者罹患免疫缺陷伴随复发性感染、自身免疫性症状、以及血小板减少伴随异常小且功能失调的血小板，从而导致过量出血和白血病与淋巴瘤的风险增加)的HSC中的慢病毒介导的基因转移。与使用慢病毒相比，通过本领域的知识和本披露的教授内容，技术人员可以使用靶向并校正突变(芳基硫酸酯酶A缺乏症(ARSA))的CRISPR-Cas系统(例如，具有递送ARSA的编码序列的适合HDR模板)校正关于MLD(芳基硫酸酯酶A缺乏症(ARSA))的HSC；具体地说，指导RNA可以靶向引起MLD(缺陷性ARSA)的突变，并且HDR可以提供对于ARSA的适当表达的编码。使靶向含有突变-和-Cas蛋白的粒子的指导RNA与携带突变的HSC接触。该粒子还可以含有校正对于ARSA的适当表达的突变的适合HDR；或者HSC可以与含有或递送HDR模板的第二粒子或载体接触。可以给予如此接触的细胞；并且任选地处理/扩增；参考Cartier。与使用慢病毒相比，通过本领域的知识和本披露的教授内容，技术人员可以使用靶向并校正突变(WAS蛋白缺乏症)的CRISPR-Cas系统(例如，具有递送WAS蛋白的编码序列的适合HDR模板)校正关于WAS的HSC；具体地说，指导RNA可以靶向引起WAS(WAS蛋白缺乏症)的突变，并且HDR可以提供对于WAS蛋白的适当表达的编码。使靶向含有突变-和-Cpf1蛋白的粒子的指导RNA与携带突变的HSC接触。该粒子还可以含有校正对于WAS蛋白的适当表达的突变的适合HDR；或者HSC可以与含有或递送HDR模板的第二粒子或载体接触。可以给予如此接触的细胞；并且任选地处理/扩增；参考Cartier。

Watts,“Hematopoietic Stem Cell Expansion and Gene Therapy[造血干细胞扩增和基因疗法]”Cytotherapy[细胞疗法]13(10):1164-1171.doi:10.3109/14653249.2011.620748(2011)，连同其引用的文献如同完全列出一样通过引用并入本文，该文献讨论了作为许多障碍的一种有高度吸引力的治疗选项的造血干细胞(HSC)基因疗法，例如病毒介导的HSC基因疗法，这些病症包括血液学病状、免疫缺陷(包括HIV/AIDS)、以及其他遗传性障碍，如溶酶体储存病，包括SCID-X1、ADA-SCID、β-地中海贫血、X-连锁的CGD、威斯科特-奥尔德里奇综合征、范科尼贫血、肾上腺脑白质营养不良(ALD)、以及异染性脑白质营养不良(MLD)。

转让给策勒克提斯公司(Cellectis)的美国专利公开号20110225664、20110091441、20100229252、20090271881以及20090222937涉及CREI变体，其中两个I-CreI单体中的至少一个具有至少两个取代，一个取代是在分别位于I-CreI的从位置26至40和从位置44至77的LAGLIDADG核心结构域的两个功能子结构域的每一个中，所述变体能够切割来自人类白细胞介素-2受体γ链(IL2RG)基因(也称为常见细胞因子受体γ链基因或γC基因)的DNA靶序列。在美国专利公开号20110225664、20110091441、20100229252、20090271881以及20090222937中鉴定的靶序列可以用于本发明的核酸靶向系统。

几种联合免疫缺陷(SCID)由T淋巴细胞成熟的缺陷引起，通常与B淋巴细胞的功能缺陷缔合(Cavazzana-Calvo等人,Annu.Rev.Med.[医学年鉴],2005,56,585-602；Fischer等人,Immunol.Rev.[免疫学综述],2005,203,98-109)。据估计总发病率是75,000出生儿中有1例。患有未治疗的SCID的患者经受多重机会的微生物感染，并且通常活不过一年。SCID可以是通过进行来自家族供体的造血干细胞移植来治疗。与供体的组织相容性可以广泛地变化。在腺甙脱氨酶(ADA)缺乏症(是SCID的形式之一)的情况下，患者可以通过注射重组腺甙脱氨酶来治疗。

由于ADA基因已在SCID患者中显示是突变的(Giblett等人,Lancet[柳叶刀],1972,2,1067-1069)，所以已鉴定涉及SCID的几种其他基因(Cavazzana-Calvo等人,Annu.Rev.Med.[医学年鉴],2005,56,585-602；Fischer等人,Immunol.Rev.[免疫学综述],2005,203,98-109)。对于SCID存在四种主要原因：(i)最频繁形式的SCID是SCID-X1(X-连锁SCID或X-SCID)，它由IL2RG基因的突变引起，从而导致成熟型T淋巴细胞和NK细胞的缺乏。IL2RG编码γC蛋白(Noguchi等人,Cell[细胞],1993,73,147-157)，该蛋白是至少五种白介素受体复合物的一种常见组分。这些受体通过JAK3激酶(Macchi等人,Nature[自然],1995,377,65-68)激活几种靶标，灭活形成与γC灭活相同的综合征；(ii)ADA基因中的突变导致嘌呤代谢缺陷，这对于淋巴细胞前体是致命的，进而导致B细胞、T细胞和NK细胞的准缺乏；(iii)V(D)J重组是免疫球蛋白和T淋巴细胞受体(TCR)成熟中的必需步骤。涉及此过程的三种基因重组激活基因1和2(RAG1和RAG2)以及Artemis中的突变导致成熟T淋巴细胞和B淋巴细胞的缺乏；并且(iv)还已报道了参与T细胞特异性信号传导的其他基因例如CD45中的突变，尽管它们代表少数情况(Cavazzana-Calvo等人,Annu.Rev.Med.[医学年鉴],2005,56,585-602；Fischer等人,Immunol.Rev.[免疫学综述],2005,203,98-109)。因为当鉴定它们的遗传碱基时，不同SCID形式出于两种主要的原因已成为基因疗法途径的范例(Fischer等人,Immunol.Rev.[免疫学综述],2005,203,98-109)。首先，如在所有血液疾病中，可以设想离体治疗。造血干细胞(HSC)可以从骨髓中恢复，并且保持对于少量细胞分裂的多能性特征。因此，它们可以在体外处理，并且然后重新注射到患者中，在患者中它们重新填充骨髓。其次，由于在SCID患者中淋巴细胞的成熟受到损害，所以校正的细胞具有选择性优点。因此，少量校正的细胞可以恢复一种功能免疫系统。此假设通过以下得到几次证实：(i)免疫功能的部分恢复与SCID患者中的突变逆转相关联(Hirschhorn等人,Nat.Genet.[自然遗传学],1996,13,290-295；Stephan等人,N.Engl.J.Med.[新英格兰医学杂志],1996,335,1563-1567；Bousso等人,Proc.Natl.,Acad.Sci.USA[美国国家科学院院刊],2000,97,274-278；Wada等人,Proc.Natl.Acad.Sci.USA[美国国家科学院院刊],2001,98,8697-8702；Nishikomori等人,Blood[血液],2004,103,4565-4572)，(ii)造血细胞体外SCID-X1缺陷的校正(Candotti等人,Blood[血液],1996,87,3097-3102；Cavazzana-Calvo等人,Blood[血液],1996,Blood[血液],88,3901-3909；Taylor等人,Blood[血液],1996,87,3103-3107；Hacein-Bey等人,Blood[血液],1998,92,4090-4097)，(iii)动物模型体内SCID-X1(Soudais等人,Blood[血液],2000,95,3071-3077；Tsai等人,Blood[血液],2002,100,72-79)，JAK-3(Bunting等人,Nat.Med.[自然·医学],1998,4,58-64；Bunting等人,Hum.GeneTher.[人类基因疗法])2000,11,2353-2364)缺陷的矫正，以及RAG2(Yates等人,Blood[血液],2002,100,3942-3949)缺乏的校正；以及(iv)基因治疗临床试验的结果(Cavazzana-Calvo等人,Science[科学],2000,288,669-672；Aiuti等人,Nat.Med.[自然医学],2002；8,423-425；Gaspar等人,Lancet[柳叶刀],2004,364,2181-2187)。

转让给儿童医学中心社团(Children’s Medical Center Corporation)和哈佛大学(Harvard College)校长和校友会的美国专利公开号20110182867涉及经由BCL11A表达或活性抑制剂例如RNAi和抗体调控造血祖细胞内的胎儿血红蛋白表达(HbF)的方法和用途。美国专利公开号20110182867中所披露的靶标例如BCL11A可以被本发明的CRISPR Cas系统靶向以用于调控胎儿血红蛋白表达。对于另外的BCL11A靶标，还参见Bauer等人(Science[科学],2013年10月11日:第342卷第6155期第253-257页)和Xu等人(Science[科学],2011年11月18日:第334卷第6058期第993-996页)。

通过本领域的知识和本披露的教授内容，技术人员可以校正关于遗传性血液学障碍的HSC，例如β地中海贫血、血友病、或遗传性溶酶体贮积病。

治疗大脑、中枢神经和免疫系统的疾病

本发明还考虑将CRISPR-Cas系统递送到大脑或神经元。例如，RNA干扰(RNAi)通过减少亨廷顿病的致病基因HTT的表达来提供针对这种障碍的治疗潜力(例如，参见，McBride等人,Molecular Therapy[分子疗法]第19卷第12期2011年12月,第2152-2162页)，因此申请者假设它可以用于并且/或者适于CRISPR-Cas系统。该CRISPR-Cas系统可以使用一种减去反义序列脱靶可能性的算法来生成。CRISPR-Cas序列可以靶向小鼠、恒河猴或人类亨廷顿蛋白的外显子52中的序列并且在病毒载体例如AAV中表达。动物(包括人类)可以使用每个脑半球约三次显微注射(总计六次注射)：前连台的头侧前1mm(12μl)并且其余两次注射(分别是12μl和10μl)与前一次注射的尾侧间隔3mm和6mm，其中AAV是1e12vg/ml，速率是约1μl/min，并且将针再放置于原处5分钟以允许注入，以从针尖扩散。

DiFiglia等人(PNAS[美国国家科学院院刊],2007年10月23日,第104期，第43卷,17204-17209)观察到单次给予到成人纹状体的siRNA靶向Htt中可以沉默突变体Htt，减轻神经元病理，并且延迟在快速起效的病毒转基因小鼠HD模型中观察到的异常行为表型。DiFiglia用2μl的10μM Cy3-标记的cc-siRNA-Htt或未轭合siRNA-Htt注射到小鼠纹状体内中。在本发明中对于人类可以考虑类似剂量的靶向Htt的CRISPR Cas，例如可以纹状体内注射约5-10ml 10μM靶向Htt的CRISPR Cas。

在另一个实例中，Boudreau等人(Molecular Therapy[分子疗法],第17卷第6期2009年6月)将5μl表达htt-特异性RNAi病毒(在4x10¹²个病毒基因组/ml下)的重组AAV血清型2/1载体注射到纹状体中。在本发明中对于人类可以考虑类似剂量的靶向Htt的CRISPRCas，例如可以纹状体内注射约10-20ml(4x10¹²个病毒基因组/ml)靶向Htt的CRISPR Cas。

在另一个实例中，可以连续给予靶向HTT的CRISPR Cas(参见例如，Yu等人,Cell[细胞]150,895-908，2012年8月31日)。Yu等人利用递送0.25ml/h的渗透泵(型号2004)递送300mg/天的ss-siRNA或磷酸盐缓冲盐水(PBS)(西格玛奥德里奇公司(Sigma Aldrich))，持续28天，并且使用设计为递送0.5μl/h的泵(型号2002)递送75mg/天的阳性对照MOE ASO，持续14天。用以无菌PBS稀释的ss-siRNA或MOE填充泵(杜雷克特公司(DurectCorporation))，并且然后在37℃孵育24或48小时(型号2004)，之后移植。用2.5％异氟烷麻醉小鼠并且然后在颅底做出中线切口。使用立体定位指导物，将插管移植到右侧脑室并且用乐泰胶固定。将附接至Alzet微型渗透泵的导管附接到该插管，并且将泵置于中肩胛区域皮下。切口用5.0尼龙缝线闭合。在本发明中对于人类可以考虑类似剂量的靶向Htt的CRISPR Cas，例如可以给予约500至1000g/天的靶向Htt的CRISPR Cas。

在连续输注的另一个实例中，Stiles等人(Experimental Neurology[实验神经病学]233(2012)463-471)将具有钛针尖的脑实质内导管移植到右核壳中。将导管连接到皮下植入腹部的II型泵(美敦力公司(Medtronic Neurological)，明尼苏达州明尼阿波利斯市(Minneapolis,MN))。在7天输注6μL/天的磷酸盐缓冲盐水之后，用测试品再次填充泵并且编程以用于连续递送7天。以约0.1至0.5μL/min的不同输注速率输注约2.3至11.52mg/d的siRNA。在本发明中对于人类可以考虑类似剂量的靶向Htt的CRISPR Cas，例如可以给予约20至200mg/天的靶向Htt的CRISPR Cas。在另一个实例中，转让给桑加莫公司(Sangamo)的美国专利公开号20130253040的方法也可以从TALES修改为本发明的核酸靶向系统，以用于治疗亨廷顿病。

本发明的另一个方面涉及利用CRISPR-Cas系统校正已鉴定为与拉福拉病相关联的EMP2A和EMP2B基因中的缺陷。拉福拉病是一种常染色体隐性病状，它的特征在于在青年期可以作为癫痫发作开始的进行性肌阵挛性癫痼。该疾病的几种情况可以是由已鉴定的基因中突变引起的。该疾病引起惊厥、肌肉痉挛、行走困难、痴呆、以及最终死亡。目前没有已证明针对疾病进展有效的治疗。与癫痫相关联的其他遗传性异常也可以是通过CRISPR-Cas系统靶向的并且潜在遗传学在Genetics of Epilepsy and Genetic Epilepsies[癫痫遗传学和遗传性癫痫]中进一步描述，该文献由Giuliano Avanzini、Jeffrey L.Noebels编辑,Mariani Foundation Paediatric Neurology[马里亚尼儿科神经学基础]:20；2009)。

转让给桑加莫生物科技公司(Sangamo BioSciences,Inc.)的美国专利公开号20110158957中涉及灭活T细胞受体(TCR)基因的方法也可以被修改成本发明的CRISPR Cas系统。在另一个实例中，转让给桑加莫生物科技公司(Sangamo BioSciences,Inc.)的美国专利公开号20100311124和转让给策勒克提斯公司(Cellectis)的美国专利公开号20110225664中均涉及灭活谷氨酰胺合成酶基因表达基因的方法也可以被修改成本发明的CRISPR Cas系统。

治疗听力疾病

本发明还考虑将CRISPR-Cas系统递送到一只耳朵或两只耳朵。

研究者调查基因疗法是否可以用于帮助进行目前的耳聋治疗，即，电子耳蜗。耳聋往往是由不能将信号传播到听觉神经元的毛细胞丧失或损伤来引起的。在此类情况下，电子耳蜗可以用于响应于声音并且将电信号传输到神经元。但是这些神经元常常变性并且从耳蜗缩回，因为受损的毛细胞释放较少的生长因子。

美国专利申请20120328580描述了使用注射器例如单剂量注射器将药物组合物注射到耳朵(例如，耳朵给予)，例如注射到耳蜗腔(luminae)(例如，膜蜗管、Sc前庭、以及Sc定音鼓)。例如，可以通过鼓室内注射(例如，注射到中耳)和/或注射到外耳、中耳和/或内耳来给予一种或多种本文所述的化合物。此类方法在本领域中常规用于例如将类固醇和抗生素给予到人耳朵中。注射可以是例如通过耳朵的圆窗或通过耳蜗胶囊。其他内耳给予方法是本领域已知的(参见例如，Salt和Plontke,Drug Discovery Today[今日药物发现],10:1299-1306,2005)。

在另一种给予模式中，药物组合物可以经由导管或泵原位给予。导管或泵可以例如将药物组合物引导到耳蜗腔或耳朵圆窗和/或结肠(colon)腔。适用于将一种或多种本文所述的化合物给予到耳朵例如人类耳朵的示例性药物递送装置和方法是由McKenna等人(美国公开号2006/0030837)和Jacobsen等人(美国专利号7,206,639)。在一些实施例中，导管或泵在手术程序过程中可以定位在例如患者的耳朵(例如，外耳、中耳和/或内耳)。在一些实施例中，导管或泵在不需要进行手术程序的情况下可以定位在例如患者的耳朵(例如，外耳、中耳和/或内耳)。

可替代地，一种或多种本文所述的化合物可以与戴在外耳的机械设备例如电子耳蜗或助听器结合给予。适用于本发明的示例性电子耳蜗是由Edge等人(美国公开号2007/0093878)所述的。

在一些实施例中，以上所述给予模式可以任何顺序组合并且可以是同时的或交替的。

可替代地或另外地，本发明可以根据食品与药品管理局批准的方法中的任一个来给予，例如，如CDER Data Standards Manual[CDER数据标准手册]版本号004(在fda.give/cder/dsm/DRG/drg00301.htm处可获得)所述的。

总的来说，美国专利申请20120328580所述的细胞治疗方法可以用于促进细胞体外完全分化或部分分化成或分化为内耳成熟细胞类型(例如，毛细胞)。由此类方法获得的细胞然后可以移植或植入到需要此治疗的患者中。以下描述了实践这些方法所需要的细胞培养方法，包括用于鉴定和选择适合细胞类型的方法、用于促进所选择细胞完全分化或部分分化的方法、以及用于植入完全或部分分化的细胞的方法。

适用于本发明的细胞包括但不限于，当例如在体外与一种或多种本文所述的化合物接触时能够完全分化或部分分化成内耳成熟细胞例如毛细胞(例如，内和/或外毛细胞)的细胞。能够分化成毛细胞的示例性细胞包括但不限于，干细胞(例如，内耳干细胞、成体干细胞、骨髓源性干细胞、胚胎干细胞、间充质干细胞、皮肤干细胞、iPS细胞、以及脂肪源性干细胞)、祖细胞(例如，内耳祖细胞)、支持细胞(例如，戴特斯细胞(Deiters'cell)、柱细胞、内指细胞、覆盖细胞(tectal cell)以及汉森细胞(Hensen's cell))、和/或生殖细胞。使用干细胞替换内耳感觉细胞描述于Li等人(美国公开号2005/0287127)和Li等人(美国专利序列号11/953,797)。使用骨髓源性干细胞替换内耳感觉细胞描述于Edge等人PCT/US 2007/084654。iPS细胞描述于例如Takahashi等人,Cell[细胞],第131卷,第5期,第861-872页(2007)；Takahashi和Yamanaka,Cell[细胞]126,663-76(2006)；Okita等人,Nature[自然]448,260-262(2007)；Yu,J.等人,Science[科学]318(5858):1917-1920(2007)；Nakagawa等人,Nat.Biotechnol.[自然生物技术]26:101-106(2008)；以及Zaehres和Scholer,Cell[细胞]131(5):834-835(2007)。此类适合的细胞可以是通过分析(例如，定性或定量)一种或多种组织特异性基因的存在来鉴定的。例如，基因表达可以是通过检测一种或多种组织特异性基因的蛋白质产物来检测的。蛋白质检测技术涉及使用针对适当抗原的抗体染色蛋白质(例如，使用细胞提取物或全细胞)。本文情况下，适当抗原是组织特异性基因表达的蛋白质产物。尽管，理论上，第一抗体(即，结合抗原的抗体)可以被标记，但是更常见的是(并且提高可视化)使用针对该第一抗体的第二抗体(例如，抗IgG)。此第二抗体与荧光染料或用于比色反应的适当的酶或金珠(用于电子显微术)或者与生物素-抗生物素蛋白系统轭合，以使得第一抗体的位置以及因此抗原的位置可以被识别。

本发明的CRISPR Cas分子可以通过将药物组合物直接应用于外耳来递送到耳朵，其中组合物通过美国公开的申请20110142917来修改。在一些实施例中，将药物组合物应用于耳道。递送到耳朵还可以被称为耳朵递送或耳部递送。

在一些实施例中，本发明的RNA分子以脂质体或脂转染配制品等递送并且可以是通过本领域技术人员已熟知的方法来制备。此类方法描述于例如美国专利号5,593,972、5,589,466、和5,580,859中，以上文献通过引用并入本文。

已开发了特别旨在增强并改善siRNA到哺乳动物细胞的递送的递送系统(参见例如，Shen等人FEBS Let.[FEBS快报]2003,539:111-114；Xia等人,Nat.Biotech.[自然生物技术]2002,20:1006-1010；Reich等人,Mol.Vision.[分子视觉]2003,9:210-216；Sorensen等人,J.Mol.Biol.[分子生物学杂志]2003,327:761-766；Lewis等人,Nat.Gen.[自然遗传学]2002,32:107-108和Simeoni等人,NAR 2003,31,11:2717-2724)并且这些递送系统可以适用于本发明。siRNA最近已成功用于抑制灵长类动物中的基因表达(参见，例如Tolentino等人,Retina[视网膜]24(4):660，该文献也可以适用于本发明)。

Qi等人披露了用于通过可以适用于本发明的核酸靶向系统的一种新颖蛋白递送技术来经由完整圆窗有效siRNA转染到内耳中(参见例如，Qi等人,Gene Therapy[基因疗法](2013),1-9)。具体地说，可以通过完整圆窗渗透将Cy3-标记的siRNA转染到内耳(包括内外毛细胞)、壶腹嵴、椭圆囊斑以及球囊斑的细胞中的TAT双链RNA结合结构域(TAT-DRBD)成功用于体内递送双链siRNA，以用于治疗各种内耳疾病并且保护听力功能。可以考虑约40μl 10mM RNA作为给予至耳朵的剂量。

根据Rejali等人(Hear Res.[听觉研究]2007年6月；228(1-2):180-7)，电子耳蜗功能可以是通过良好地保留螺旋神经节神经元来提高的，这些神经元是电子耳蜗电刺激的靶标，并且脑源性神经营养因子(BDNF)先前已显示增强实验性耳聋耳朵中存活的螺旋神经节。Rejali等人测试了改善的电子耳蜗电极设计，该设计包括通过具有BDNF基因插入物的病毒载体转导的成纤维细胞涂层。为了完成这种类型的离体基因转移，Rejali等人使用具有BDNF基因盒插入物的腺病毒转导豚鼠成纤维细胞，并且确定这些细胞分泌BDNF并且然后使BDNF分泌细胞经由琼脂糖凝胶附接到电子耳蜗电极并且将电极植入在鼓阶中。Rejali等人确定BDNF表达电极当与对照电极相比时在植入48小时后能够保留显著更多的耳蜗基底转弯处的螺旋神经节神经元，并且证实了将电子耳蜗与离体基因转移组合用于增强螺旋神经节神经元存活的可行性。这种系统可以适用于本发明的核酸靶向系统，以用于递送到耳朵。

Mukherjea等人(Antioxidants&Redox Signaling[抗氧剂与氧化还原信号],第13卷,第5期,2010)用文献证明使用短干扰(si)RNA敲低NOX3消除了顺铂耳毒性，如通过防止OHC损伤并且减小听脑干反应(ABR)中的阈值移位来证实的。向大鼠给予不同剂量的siNOX3(0.3、0.6、以及0.9μg)并且通过实时RT-PCR评价NOX3表达。所使用的最低剂量的NOX3siRNA(0.3μg)当与经鼓膜给予乱序siRNA或未处理的耳蜗相比时并未显示NOX3mRNA的任何抑制。然而，与对照的乱序siRNA相比，给予较高剂量的NOX3siRNA(0.6和0.9μg)减少了NOX3表达。这种系统可以适用于本发明的CRISPR Cas系统，以用于经鼓膜给予约2mg至约4mg剂量的CRISPR Cas，以给予至人类。

Jung等人(Molecular Therapy[分子疗法],第21卷第4期834-841 2013年4月)证实椭圆囊中的Hes5水平在应用siRNA之后有所减小并且这些椭圆囊中的毛细胞数目显著高于随后的对照治疗。数据表明siRNA技术可以适用于诱导内耳的修复和再生并且Notch信号传导途径是一种对于特异性基因表达抑制可能有用的靶标。Jung等人将2μl体积的8μgHes5siRNA(通过将无菌生理盐水添加到冻干siRNA中来制备)注射到耳朵的前庭上皮中。这种系统可以适用于本发明的CRISPR Cas系统，以用于将约1mg至约30mg剂量的CRISPR Cas给予到耳朵的前庭上皮中，以给予至人类。

治疗眼睛疾病

本发明还考虑将CRISPR-Cas系统递送到一只眼睛或两只眼睛。

在本发明的又另一个方面中，CRISPR-Cas系统可以用于校正由几种遗传性突变引起的眼部缺陷，这些遗传性突变进一步描述于Genetic Diseases of the Eye[遗传性突变在遗传性眼睛疾病],第二版,Elias I.Traboulsi编辑,Oxford University Press[哈佛大学出版社],2012。

对于给予至眼睛，慢病毒载体，具体地是马传染性贫血病毒(EIAV)是特别优选的。

在另一个实施例中，还考虑了基于马传染性贫血病毒(EIAV)的最小非灵长类动物慢病毒载体，特别是对于眼部基因治疗而言(参见例如，Balagaan,J Gene Med[基因医学杂志]2006；8:275-285，2005年11月21日在线公开于Wiley InterScience[威利出版公司](www.interscience.wiley.com)DOI:10.1002/jgm.845)。考虑具有驱动靶基因表达的巨细胞病毒(CMV)启动子的载体。考虑所有前房内、视网膜下、眼内以及玻璃体内注射(参见例如，Balagaan,J Gene Med[基因医学杂志]2006；8:275-285，2005年11月21日在线公开于Wiley InterScience[威利出版公司](www.interscience.wiley.com)DOI:10.1002/jgm.845)。可以借助于手术显微镜进行眼内注射。对于视网膜下注射和玻璃体内注射，眼睛可以通过轻微数字压力和使用接触透镜系统查看的眼底来脱垂，该接触透镜系统由在用玻璃显微镜载片盖玻片覆盖的角膜上的一滴偶合介质溶液组成。对于视网膜下注射，安装在5-μl Hamilton注射器上的10-mm 34号针尖端可以在直接可视化下通过上部赤道巩膜朝向后极切向推进，直到针孔在视网膜下间隙中可见为止。然后，可以注射2μl载体悬浮液，以产生上部大泡状视网膜脱离，因此证实视网膜下载体给予。此方法创建自封合巩膜切开术，允许载体悬浮液保留在视网膜下间隙中，直到它被RPE吸收为止，通常在该程序的48h内。此程序可以在下眼半球中重复，以产生下部视网膜脱离。此技术使得约70％视网膜神经感觉层和RPE暴露于载体悬浮液中。对于玻璃体内注射，针尖可以推进通过巩膜到角巩膜缘后部1mm，并且将2μl载体悬浮液注射到玻璃体腔中。对于前房内注射，针尖可以通过角巩膜缘穿刺，朝向角膜中央推进，并且可以注射2μl载体悬浮液。对于前房内注射，针尖可以通过角巩膜缘穿刺，朝向角膜中央推进，并且可以注射2μl载体悬浮液。这些载体可以1.0-1.4x10¹⁰或者1.0-1.4x10⁹转导单位(TU)/ml注射。

在另一个实施例中，还考虑了一种经由视网膜下注射递送用于治疗湿型年龄相关性黄斑变性的、表达血管生成抑制性蛋白(内皮抑素和血管抑素)的基于马传染性贫血病毒的慢病毒基因治疗载体(参见例如，Binley等人,HUMAN GENE THERAPY[人类基因疗法]23:980-991(2012年9月))。这种载体可以被修饰用于本发明的CRISPR-Cas系统。每只眼睛可以用总体积100μl的1.1x10⁵转导单位/眼睛(TU/眼睛)的剂量的治疗。

在另一个实施例中，可以考虑将E1-缺失、部分E3-缺失、E4-缺失腺病毒载体递送至眼睛。向患有晚期新生血管性年龄相关性黄斑变性(AMD)的二十八位患者给予表达人类色素上皮细胞源性因子(AdPEDF.ll)的E1-缺失、部分E3-缺失、E4-缺失腺病毒载体的单次静脉内注射(参见例如，Campochiaro等人,Human Gene Therapy[人类基因疗法]17:167-176(2006年2月))。研究10⁶至10^9.5粒子单位(PU)范围内的剂量，并且不存在与AdPEDF.ll相关的严重不良事件并且不存在剂量限制性毒性(参见例如，Campochiaro等人,Human GeneTherapy[人类基因疗法]17:167-176(2006年2月))。腺病毒载体介导的眼部基因转移似乎是一种用于治疗眼部病症的可行方法并且可以适用于CRISPR Cas系统。

在另一个实施例中，RXi制药公司(RXi Pharmaceuticals)的系统可以用于和/或适于将CRISPR Cas递送至眼睛。本文系统中，单次玻璃体内给予3μg sd-rxRNA，导致PPIB mRNA水平的序列特异性减小，持续14天。系统可以适用于本发明的核酸靶向系统，考虑CRISPR给予人类的约3至20mg的剂量。

Millington-Ward等人(Molecular Therapy[分子疗法],第19卷第4期642-6492011年4月)描述了将基于RNA干扰(RNAi)的视紫红质抑制物和由于变性位置处的核苷酸变化而抵抗抑制的密码子修饰的视紫红质替换基因递送到RNAi靶位点的腺相关病毒(AAV)载体。通过Millington-Ward等人将6.0x10⁸vp或1.8x10¹⁰vp AAV注射液视网膜下注射到眼睛。Millington-Ward等人的AAV载体可以适用于本发明的CRISPR Cas系统，考虑给予至人类的约2x10¹¹至约6x10¹³vp的剂量。

Dalkara等人(Sci Transl Med[科学转化医学]5,189ra76(2013))也涉及改变无害注射到眼睛玻璃体液中之后将野生型版本的缺陷基因递送到整个视网膜的AAV载体的体内定向进化。Dalkara描述了一种7聚体肽展示文库和一种通过DNA改组来自AAV1、2、4、5、6、8、以及9的cap基因来构建的AAV文库。包装在CAG或Rho启动子下表达GFP的rcAAV文库和rAAV载体，并且通过定量PCR获得抗脱氧核糖核酸酶的基因组滴度。合并这些文库，并且进行两轮进化，每次进化由初始文库多样性和随后的三次体内选择步骤组成。在每个此步骤中，向P30rho-GFP小鼠玻璃体内注射2ml碘克沙醇纯化的磷酸盐缓冲盐水(PBS)透析文库，其中基因组滴度是约1x10¹²vg/ml。Dalkara等人的AAV系统可以适用于本发明的核酸靶向系统，考虑给予人类的约1x10¹⁵至约1x10¹⁶vg/ml的剂量。

在另一个实施例中，可以靶向视紫红质基因以用于治疗色素性视网膜炎(RP)，其中转让给桑加莫生物科技公司(Sangamo BioSciences,Inc.)的美国专利号20120204282的系统可以根据本发明的CRISPR Cas系统进行修改。

在另一个实施例中，转让给策勒克提斯公司(Cellectis)的美国专利公开号20130183282的方法是涉及切割来自人类视紫红质基因的靶序列的方法，该方法也可以被修改成本发明的核酸靶向系统。

转让给中央研究院(Academia Sinica)的美国专利公开号20130202678涉及用于治疗视网膜病变和威胁视力的眼科病症的方法，这些方法涉及将Puf-A基因(该基因在视网膜神经节和眼组织的色素细胞中表达并且展示一种独特的抗细胞凋亡活性)递送到眼睛的视网膜下间隙或玻璃体内间隙。具体地说，希望的靶标是zgc:193933、prdm1a、spata2、tex10、rbb4、ddx3、zp2.2、Blimp-1以及HtrA2，所有这些靶标均可以被本发明的核酸靶向系统靶向。

Wu(细胞干细胞，13:659-62,2013)设计了一种将Cas9引导到在小鼠中引起白内障的单一碱基对突变的指导RNA，其中它诱导DNA切割。然后使用另一个野生型等位基因或者给予受精卵的寡核苷酸，修复机制校正破坏的等位基因的序列并且校正突变体小鼠中引起白内障的遗传性缺陷。

美国专利公开号20120159653描述了使用锌指核酸酶遗传性修饰与黄斑变性(MD)相关的细胞、动物和蛋白质。黄斑变性(MD)是老年人视力缺损的主要原因，但是也是儿童疾病例如眼底黄色斑点症、索斯比氏眼底病(Sorsby fundus)以及致命性儿童神经变性疾病的标志性症状，其中发作年龄最早到婴儿期。黄斑变性由于视网膜损害而导致视野(黄斑)中心的视力丧失。目前存在的动物模型并未概括疾病在人类中所观察到的主要标志。包含编码与MD相关联的蛋白质的突变体基因的可用动物模型也产生高度可变表型，这使得对人类疾病的翻译和治疗发展成为问题。

美国专利公开号20120159653的一个方面涉及编辑编码与MD相关联的蛋白质的任何染色体序列，它们可以适用于本发明的核酸靶向系统。与MD相关联的蛋白质典型地是基于和MD相关联的蛋白质与MD病症的实验缔合性来选择。例如，与MD相关联的蛋白质的产生率或循环浓度在患有MD病症的群体中相对于不存在MD病症的群体有所升高或降低。蛋白质水平的差异可以适于蛋白质组学技术来评估，这些技术包括但不限于，蛋白印迹法、免疫组织化学染色、酶联免疫吸附测定(ELISA)、以及质谱法。可替代地，与MD相关联的蛋白质可以是通过使用基因组技术获得编码这些蛋白质的基因的基因表达谱来鉴定，这些基因组技术包括但不限于DNA微阵列分析、基因表达序列分析(SAGE)、以及定量实时聚合酶链反应(Q-PCR)。

作为非限制性实例，与MD相关联的蛋白质包括但不限于以下蛋白质：(ABCA4)ATP-结合盒，子家族A(ABC1)，成员4；ACHM1全色盲(杆状细胞单色型色觉(rod monochromacy))1；ApoE载脂蛋白E(ApoE)；C1QTNF5(CTRP5)C1q和肿瘤坏死因子相关蛋白5(C1QTNF5)；C2补体组分2(C2)；C3补体组分(C3)；CCL2趋化因子(C-C基序)配体2(CCL2)；CCR2趋化因子(C-C基序)受体2(CCR2)；CD36分化抗原簇36；CFB补体因子B；CFH补体因子；CFH H；CFHR1补体因子H相关1；CFHR3补体因子H相关3；CNGB3环状核苷酸门控通道β3；CP血浆铜蓝蛋白(CP)；CRPC反应蛋白(CRP)；CST3抑半胱氨酸蛋白酶蛋白C或抑半胱氨酸蛋白酶蛋白3(CST3)；CTSD组织蛋白酶D(CTSD)；CX3CR1趋化因子(C-X3-C基序)受体1；ELOVL4伸长的极长链脂肪酸4；ERCC6切补修复交叉互补啮齿动物修复缺陷，互补群6；FBLN5腓骨蛋白-5；FBLN5腓骨蛋白5；FBLN6腓骨蛋白6；FSCN2成束蛋白(FSCN2)；HMCN1半椎蛋白(Hemicentrin)1；HMCN1半椎蛋白1；HTRA1HtrA丝氨酸肽酶1(HTRA1)；HTRA1HtrA丝氨酸肽酶1；IL-6白介素6；IL-8白介素8；LOC387715假定蛋白；PLEKHA1含普列克底物蛋白同源结构域家族A成员1(PLEKHA1)；PROM1Prominin 1(PROM1或CD133)；PRPH2外周蛋白-2；RPGR色素性视网膜炎GTP酶调节剂；SERPING1丝氨酸蛋白酶抑制剂肽酶抑制剂，进化支(clade)G，成员1(C1抑制剂)；TCOF1糖蜜TIMP3金属蛋白酶抑制剂3(TIMP3)；TLR3Toll样受体3。

与MD相关联且其染色体序列被编辑的蛋白质的性质可以并且将发生改变。在优选实施例中，与MD相关联且其染色体序列被编辑的蛋白质可以是由ABCR基因编码的ATP结合盒子家族A(ABC1)成员4蛋白(ABCA4)、由APOE基因编码的载脂蛋白E蛋白(APOE)、由CCL2基因编码的趋化因子(C-C基序)配体2蛋白(CCL2)、由CCR2基因编码的趋化因子(C-C基序)受体2蛋白(CCR2)、由CP基因编码的血浆铜蓝蛋白(CP)、由CTSD基因编码的组织蛋白酶D蛋白(CTSD)、或者由TIMP3基因编码的金属蛋白酶抑制剂3蛋白质(TIMP3)。在一个示例性实施例中，遗传修饰的动物是大鼠，并且编码与MD相关联的蛋白质的编辑的染色体序列可以是：(ABCA4)ATP结合盒子亚家族A(ABC1)成员4NM_000350；APOE载脂蛋白E(APOE)NM_138828；CCL2趋化因子(C-C基序)配体2(CCL2)NM_031530；CCR2趋化因子(C-C基序)受体2(CCR2)NM_021866；CP血浆铜蓝蛋白(CP)NM_012532；CTSD组织蛋白酶D(CTSD)NM_134334；TIMP3金属蛋白酶抑制剂3(TIMP3)NM_012886。动物或细胞可以包含编码与MD相关联的蛋白质的1、2、3、4、5、6、7或更多个破坏的染色体序列和编码与MD相关联的破坏蛋白质的1、2、3、4、5、6、7或更多个染色体整合序列。

编辑或整合的染色体序列可以被修饰为编码与MD相关联的改变的蛋白质。在MD相关联的染色体序列中的许多突变已与MD相关联。与MD相关联的染色体序列中的突变的非限制性实例包括可以引起MD的那些突变，包括在ABCR蛋白质，E471K(即在位置471处的谷氨酸被改变成赖氨酸)、R1129L(即在位置1129处的精氨酸被改变成亮氨酸)、T1428M(即在位置1428处的苏氨酸被改变成甲硫氨酸)、R1517S(即在位置1517处的精氨酸被改变成丝氨酸)、I1562T(即在位置1562处的异亮氨酸被改变成苏氨酸)、以及G1578R(即在位置1578处的甘氨酸被改变成精氨酸)；在CCR2蛋白质中，V64I(即在位置192处的缬氨酸被改变成异亮氨酸)；在CP蛋白质中，G969B(即在位置969处的甘氨酸被改变成天冬酰胺或天冬氨酸)；在TIMP3蛋白质，S156C(即在位置156处的丝氨酸被改变成半胱氨酸)、G166C(即在位置166处的甘氨酸被改变成半胱氨酸)、G167C(即在位置167处的甘氨酸被改变成半胱氨酸)、Y168C(即在位置168处的酪氨酸被改变成半胱氨酸)、S170C(即在位置170处的丝氨酸被改变成半胱氨酸)、Y172C(即在位置172处的酪氨酸被改变成半胱氨酸)、以及S181C(即在位置181处的丝氨酸被改变成半胱氨酸)。MD相关基因的遗传性变型与疾病的其他相关性是本领域已知的。

治疗循环系统疾病和肌肉疾病

本发明还考虑将本文所述的CRISPR-Cas系统例如Cpf1效应蛋白系统递送到心脏。对于心脏，心肌向性腺相关病毒(AAVM)是优选的，具体地是在心脏中显示优先基因转移的AAVM41(参见，例如，Lin-Yanga等人,PNAS[美国国家科学院院刊],2009年3月10日,第106卷,第10期)。给予可以是全身性的或局部的。对于全身性给予，考虑约1-10x10¹⁴个载体基因组的剂量。还参见，例如，Eulalio等人,(2012)Nature[自然]492:376和Somasuntharam等人(2013)Biomaterials[生物材料]34:7790。

例如美国专利公开号20110023139描述了使用锌指核酸酶遗传性修饰与心血管疾病相关的细胞、动物和蛋白质。心血管疾病通常包括高血压、心脏病发作、心力衰竭、以及卒中和TIA。涉及心血管疾病的任何染色体序列或者由涉及心血管疾病的任何染色体序列编码的蛋白质可以用于本披露描述的方法中。心血管相关蛋白典型地是基于心血管相关蛋白与心血管疾病发展的实验相关性来选择。例如，心血管相关蛋白的产生率或循环浓度在患有心血管障碍的群体中相对于不存在心血管障碍的群体有所升高或降低。蛋白质水平的差异可以适于蛋白质组学技术来评估，这些技术包括但不限于，蛋白印迹法、免疫组织化学染色、酶联免疫吸附测定(ELISA)、以及质谱法。可替代地，心血管相关蛋白可以是通过使用基因组技术获得编码这些蛋白质的基因的基因表达谱来鉴定，这些基因组技术包括但不限于DNA微阵列分析、基因表达序列分析(SAGE)、以及定量实时聚合酶链反应(Q-PCR)。

治疗肝脏和肾脏的疾病

本发明还考虑将本文所述的CRISPR-Cas系统例如Cpf1效应蛋白系统递送到肝脏和/或肾脏。诱导治疗性核酸的细胞摄取的递送策略包括物理力或载体系统，例如基于病毒、脂质或复合物的递送系统或纳米载体。从最初具有不太可能的临床相关性的应用开始，当核酸使用全身性流体动力学高压注射来发送到肾细胞时，广泛范围的基因治疗病毒和非病毒载体已经用于靶向不同动物肾脏疾病模型的体内转录后事件(Csaba Révész和PéterHamar(2011).Delivery Methods to Target RNAs in the Kidney[在肾脏中靶向RNA的递送方法],Gene Therapy Applications[基因疗法应用]Chunsheng Kang教授(编辑)，ISBN:978-953-307-541-9,InTech,可获得自：http://www.intechopen.com/books/gene-therapy-applications/delivery-methods-to-target-rn as-inthe-kidney)。到肾脏中的递送方法可以包括Yuan等人(Am J Physiol Renal Physiol[美国肾脏生理学杂志])295:F605-F617,2008)中所述的那些方法，他们研究了靶向花生四烯酸代谢的12/15-脂加氧酶(12/15-LO)途径的小干扰RNA(siRNA)的体内递送是否可以改善链脲霉素注射的1型糖尿病小鼠模型中的肾损伤和糖尿病肾病(DN)。为了实现更大的体内进入和肾脏中的siRNA表达，Yuan等人使用与胆固醇轭合的双链12/15-LO siRNA寡核苷酸。将约400μg siRNA皮下注射到小鼠中。Yuang等人的方法可以适用于本发明的CRISPR Cas系统，考虑向人皮下注射1-2g与胆固醇轭合的CRISPR Cas，以用于递送到肾脏。

Molitoris等人(J Am Soc Nephrol[美国肾脏病学会杂志]20:1754-1764,2009)利用近端小管细胞(PTC)作为肾脏内的寡核苷酸重吸收位点，以测试siRNA靶向细胞凋亡途径中的关键蛋白p53的效率，从而防止肾脏损伤。在缺血性损伤后4h静脉内注射对于p53的合成的裸siRNA最大限度地保护了PTC和肾功能。Molitoris等人的数据表明将siRNA快速递送到近端小管细胞采用静脉内注射。对于剂量反应性分析，用0.33；1、3或5mg/kg剂量的siP53注射大鼠，在相同的四个时间点给予，分别产生累积剂量1.32；4、12以及20mg/kg。与PBS处理的缺血对照大鼠相比较，所有测试的siRNA剂量在第一天产生了SCr降低作用，其中更高的剂量在经过大约五天中更有效。12mg/kg和20mg/kg的累积剂量提供了最好的保护作用。Molitoris等人的方法可以适用于本发明的核酸靶向系统，对于人类考虑用于递送到肾脏的12和20mg/kg累积。

Thompson等人(Nucleic Acid Therapeutics[核酸治疗],第22卷,第4期,2012)报道了在啮齿动物和非人类灵长类动物中静脉内注射之后合成的小干扰RNA I5NP的毒物学特征和药代动力学特征。I5NP被设计经由RNA干扰(RNAi)途径作用，以暂时抑制促细胞凋亡蛋白p53的表达，并且被开发来防止细胞经受在主要心脏手术过程中可能出现的急性缺血/再灌注损伤例如急性肾损伤以及在肾脏移植之后可能出现的移植物功能延迟。在啮齿类中的800mg/kg I5NP以及在非人类灵长动物中的1,000mg/kg I5NP的剂量对于引起不良作用是需要的，在猴中被分离为引导对血液的作用，包括补体的亚临床激活和凝血时间的轻度增加。在大鼠中，使用I5NP的大鼠类似物未观察到另外的不良作用，这表明这些作用可能表示合成型RNA双链体的分类作用，而不是与I5NP的预期药理活性相关的毒性。总之，这些数据支持用于在急性缺血/再灌注损伤之后保留肾功能的I5NP的静脉内给予的临床测试。在猴子中无观察到的不良反应的水平(NOAEL)是500mg/kg。在猴子中在以多至25mg/kg的剂量水平静脉内给予之后未观察到对心血管、呼吸和神经系统参数的作用。因此，对于向人类的肾脏静脉内给予CRISPR Cas可以考虑类似剂量。

Shimizu等人(J Am Soc Nephrol[美国肾脏病学会杂志]21:622-633,2010)开发了一种经由基于聚(乙二醇)-聚(L-赖氨酸)的媒介物将siRNA靶向递送到肾小球的系统。该siRNA/纳米载体复合物的直径是约10至20nm，该直径是将允许它移动跨过穿孔内皮细胞而接近肾小球膜的大小。在腹膜内注射荧光标记的siRNA/纳米载体复合物之后，Shimizu等人在血液循环中检测到siRNA，持续一段延长的时间。在肾小球肾炎的小鼠模型中，丝裂原激活蛋白激酶1(MAPK1)siRNA/纳米载体复合物的重复腹膜内给予抑制了肾小球MAPK1mRNA和蛋白质表达。为了研究siRNA累积，向BALBc小鼠给予与PIC纳米载体复合的Cy5标记的siRNA(0.5ml，5nmol的siRNA含量)、裸露的Cy5标记的siRNA(0.5ml，5nmol)、或封装在HVJ-E中的Cy5标记的siRNA(0.5ml，5nmol的siRNA含量)。Shimizu等人的方法可以适用于本发明的CRISPR Cas系统，对于人类考虑在约1-2升内约10-20μmol与纳米载体复合的CRISPR Cas，以腹膜内给予并且递送到肾脏。

治疗上皮细胞和肺部疾病

本发明还考虑将本文所述的CRISPR-Cas系统例如Cpf1效应蛋白系统递送到一侧或两侧肺部。

尽管基于AAV-2的载体最初提出用于CFTR递送到CF气道，但是其他血清型诸如AAV-1、AAV-5、AAV-6、以及AAV-9在各种各样的肺上皮细胞模型中展现出提高的基因转移效率(参见例如，Li等人,Molecular Therapy[分子疗法],第17卷第12期,2067-2077 2009年12月)。证实在体外转导的人类气道上皮细胞中AAV-1比AAV-2和AAV-5更有效约100倍，5尽管体内AAV-1转导的鼠气管内气道上皮细胞具有等于AAV-5的效率。其他研究已显示，在针对体外人类气道上皮(HAE)的基因递送上，AAV-5比AAV-2更有效50倍，并且在体内小鼠肺气道上皮中显著更有效。还已显示在体外人类气道上皮细胞中和在体内鼠类气道中，AAV-6比AAV-2更有效。8更为近期的分离物AAV-9显示在体内鼠类鼻和肺泡上皮中展示了比AAV-5更大的基因转移效率，其中持续超过9个月检测出基因表达，这表明AAV可以使得能够在体内进行长期基因表达，这对于CFTR基因递送载体而言是一种理想特性。此外，证实了AAV-9可以被再次给予至鼠类的肺部，而不丧失CFTR表达并且具有最低限度的免疫结果。可以在CF和非CF HAE培养物的顶面上用100μl的AAV载体接种，持续数小时(参见例如，Li等人,Molecular Therapy[分子疗法],第17卷第12期2067-2077 2009年12月)。MOI可以从1x10³到4x10⁵个载体基因组/细胞而变化，这取决于病毒浓度和这些实验的目的。以上引用的载体被考虑用于本发明的递送和/或给予。

Zamora等人(Am J Respir Crit Care Med[美国呼吸道与危重护理学杂志])第183卷第531-538页,2011)报道了针对人类感染性疾病治疗的RNA干扰治疗法的应用实例以及抗病毒药物在呼吸道合胞病毒(RSV)感染的肺移植受体中的随机试验。Zamora等人进行了一项在具有RSV呼吸道感染的LTX受体中的随机化、双盲、安慰剂对照的试验。允许患者接受针对RSV的护理标准。每天给予雾化的ALN-RSV01(0.6mg/kg)或安慰剂，持续3天。此研究表明可以向患有RSV感染的LTX受体安全地给予靶向RSV的RNAi治疗剂。ALN-RSV01的三个每日剂量并不导致任何呼吸道症状的加重或肺功能的损害，并且未展示任何出全身性致炎作用，例如细胞因子或CRP的诱导。在吸入之后，药代动力学仅显示低的、短暂的全身性暴露，与临床前动物数据一致，表明静脉内或通过吸入给予的ALN-RSV01通过外切核酸酶介导的消化和肾脏排泄而从循环中快速清除。Zamora等人的方法可以适用于本发明的CRISPR Cas系统，并且对于本发明可以考虑雾化的CRISPR Cas，例如使用0.6mg/kg的剂量。

Schwank等人(Cell Stem Cell[细胞干细胞],13:653-58,2013)使用CRISPR-Cas9校正与人类干细胞的囊性纤维化缔合的缺陷。该组的靶标是一种离子通道囊性纤维化跨膜导体受体(CFTR)的基因。CFTR中的缺失引起囊性纤维化患者中的蛋白质错误折叠。使用由来自患有囊性纤维化的两位儿童的细胞样品开发的培养的肠道干细胞，施万克等人能够使用CRISPR连同含有有待插入的修复性序列的供体质粒校正该缺陷。然后研究者将这些细胞生长成肠道“细胞器”或微型肠，并且证实它们能够正常起作用。本文情况下，约一半克隆的细胞器经受适当的遗传校正。

治疗肌肉系统疾病

本发明还考虑将本文所述的CRISPR-Cas系统例如Cpf1效应蛋白系统递送到一个或多个肌肉。

Bortolanza等人(Molecular Therap[分子疗法],第19卷第11期,2055-20642011年11月)证实，在FRG1小鼠中在面肩肱型肌营养不良(FSHD)发作之后，RNA干扰表达盒的全身性递送导致剂量依赖性长期FRG1敲低，而没有毒性迹象。Bortolanza等人发现，单次静脉内注射5x10¹²vg的rAAV6-sh1FRG1挽救了FRG1小鼠的肌肉组织病理学和肌肉功能。详细地说，使用25号Terumo注射器将200μl含有2x10¹²或5x10¹²vg载体的生理溶液注射到尾静脉中。Bortolanza等人的方法可以适用于表达CRISPR Cas的AAV并且可以约2x10¹⁵或2x10¹⁶vg载体的剂量注射到人类中。

Dumonceaux等人(Molecular Therapy[分子疗法]第18卷第5期,881-8872010年5月)使用针对肌肉生长抑制素受体AcvRIIb mRNA(sh-AcvRIIb)的RNA干扰技术抑制肌肉生长抑制素途径。由载体化U7外显子跳跃技术(U7-DYS)介导准肌营养不良蛋白(quasi-dystrophin)的恢复。将携带单独的sh-AcvrIIb构建体、单独的U7-DYS构建体、或这两种构建体的组合的腺相关载体注射到营养不良mdx小鼠的胫骨前肌(TA)肌肉中。以10¹¹个AAV病毒基因组进行注射。Dumonceaux等人的方法可以适用于表达CRISPR Cas的AAV并且以约10¹⁴或10¹⁵vg载体的剂量注射到人类中。

Kinouchi等人(Gene Therapy[基因疗法](2008)15,1126-1130)报道了通过未经化学修饰的siRNA与缺端胶原(ATCOL)形成纳米粒子来体内siRNA递送到正常或患病小鼠骨骼肌的有效性。ATCOL介导的靶向肌肉生长抑制素(一种骨骼肌生长的负调节剂)的siRNA在小鼠骨骼肌中的局部应用或者静脉内应用在应用之后几周内引起肌肉质量的显著增加。这些结果显示siRNA的ATCOL介导的应用是一种用于包括肌肉萎缩在内的疾病的未来治疗用途的强大工具。根据制造商的说明，将MstsiRNA(终浓度，10mM)与ATCOL(对于局部给予的终浓度，0.5％)(AteloGene，高研株式会社(Kohken)，日本东京(Tokyo,Japan))混合。在通过Nembutal(25mg/kg，腹膜内注射)麻醉小鼠(20周大的雄性C57BL/6)之后，将Mst-siRNA/ATCOL复合物注射到咬肌和股二头肌中。Kinouchi等人的方法可以适用于CRISPR Cas并且可以注射到人类中，例如以40μM溶液的约500至1000ml的剂量注射到肌肉中。Hagstrom等人(Molecular Therapy[分子疗法]第10卷,第2期,2004年8月)描述了一种使得能够将核酸有效且可重复地递送到遍及哺乳动物四肢肌肉的肌细胞(肌纤维)的血管内、非病毒方法。该程序涉及将裸质粒DNA或siRNA注射到暂时由止血带或血压袖带分离的肢体的远端静脉中。通过以足够的体积将其迅速注射来促进向肌纤维的核酸递送，使得该核酸溶液能够溢出到肌肉组织中。在小动物和大动物中都以最低毒性实现在骨骼肌中的高水平转基因表达。还获得了向四肢肌肉递送siRNA的证据。为了将质粒DNA静脉内注射到恒河猴中，将一个三通旋塞连接到各自加载有单个注射器的两个注射泵中(型号PHD 2000；哈佛仪器公司(Harvard Instruments))。在罂粟碱注射五分钟之后，以1.7或2.0ml/s的速率注射pDNA(15.5到25.7mg，在40-100ml盐水中)。对于表达本发明的CRISPR Cas的质粒DNA，这可以按比例增加，其中对于人类注射在800到2000ml盐水中的约300到500mg。对于将腺病毒载体注射到大鼠中，注射在3ml正常生理盐水溶液(NSS)中的2x10⁹个感染粒子。对于表达本发明的CRISPR Cas的腺病毒载体，这可以按比例增加，其中对于人类注射在10升NSS中的约1x10¹³个感染粒子。对于siRNA，以12.5μg的siRNA注射到大鼠的大隐静脉中，并且以750μg的siRNA注射到灵长类动物的大隐静脉中。对于本发明的CRISPR Cas，这可以按比例增加，例如，其中将约15至约50mg注射到大隐静脉中。

例如，还参见WO 2013163628A2,Genetic Correction of Mutated Genes[突变基因的遗传校正],Duke University[杜克大学]的公开申请，描述了例如校正框移突变的努力，该框移突变引起提前终止密码子和可以经由核酸酶介导的非同源末端接合进行校正的截短基因产物，该基因产物诸如引起杜氏肌营养不良(“DMD”)的那些基因产物，该杜氏肌营养不良是一种隐性遗传的、致命的、X连锁障碍，其导致由肌营养不良蛋白基因突变所致的肌肉变性。引起DMD的大多数肌营养不良蛋白突变是破坏阅读框并且引起肌营养不良蛋白基因的提前翻译终止的外显子缺失。肌营养不良蛋白是一种细胞质蛋白，它提供负责调节肌细胞完整性和功能的细胞膜肌营养不良蛋白聚糖复合物的结构稳定性。如本文可互换使用的肌营养不良蛋白基因或“DMD基因”是在座位Xp21处的2.2兆碱基。初级转录测量了约2,400kb，其中成熟mRNA是约14kb。79个外显子编码超过3500个氨基酸的蛋白质。在DMD患者中，外显子51常常接近破坏框的缺失并且已在临床试验中被靶向用于基于寡核苷酸的外显子跳跃。对于外显子51跳跃化合物依替利森(eteplirsen)的临床试验，最近报道了跨48周的显著功能益处，与基线相比具平均47％的肌营养不良蛋白阳性纤维。外显子51中的突变理想地适合于通过基于NHEJ的基因组编辑进行永久性校正。

转让给策勒克提斯公司(Cellectis)的美国专利公开号20130145487的方法涉及切割来自人类肌营养不良蛋白基因(DMD)的靶序列的大范围核酸酶变体，该方法也可以被修改成本发明的核酸靶向系统。

治疗皮肤疾病

本发明还考虑将本文所述的CRISPR-Cas系统例如Cpf1效应蛋白系统递送到皮肤。

Hickerson等人(Molecular Therapy-Nucleic Acids[分子疗法-核酸](2013)2,e129)涉及一种用于向人类和鼠类皮肤递送自我递送(sd)-siRNA的机动化的微针阵列皮肤递送设备。将基于siRNA的皮肤治疗剂转化到临床的主要挑战是有效递送系统的开发。在多种皮肤递送技术中已经投入了大量的努力，但是成功有限。在其中用siRNA治疗皮肤的临床研究中，与皮下针注射缔合的剧烈疼痛排除了试验中另外患者的纳入，这凸显了对于改善的、更为“患者友好的”(即，很少或没有疼痛)递送方法的需要。微针代表一种将包括siRNA在内的大带电货物递送穿过一级屏障角质层的有效途径，并且通常被认为比常规皮下针疼痛更少。机动化的“冲压型”微针设备，包括由Hickerson等人使用的机动化微针阵列(MMNA)设备，已经显示在无毛小鼠研究中是安全的并且引起很少的疼痛或不引起疼痛，其证据为：(i)在美容业中广泛使用以及(ii)其中几乎所有志愿者都发现使用该设备比流感疫苗针剂(flushot)疼痛少得多的有限测试，这表明使用此设备的siRNA递送将产生比使用皮下针注射的先前临床试验中所体验的少得多的疼痛。该MMNA设备(作为Triple-M或Tri-M由韩国首尔(Seoul,South Korea)的Bomtech电子有限公司(Bomtech Electronic Co)销售)适于将siRNA递送到小鼠和人类皮肤。将sd-siRNA溶液(高达300μl的0.1mg/ml RNA)引入到设定为0.1mm深度的一次性Tri-M针盒(Bomtech公司)的腔室中。为了处理人类皮肤，在处理之前将未鉴定的皮肤(在外科手术之后立即获得)手动拉伸并且钉在软木平台上。使用具有28号0.5英寸针头的胰岛素注射器进行所有皮内注射。该MMNA设备和Hickerson等人的方法可以用于并且/或者适于例如以高达300μl的0.1mg/ml CRISPR Cas的剂量将本发明的CRISPRCas递送到皮肤。

Leachman等人(Molecular Therapy[分子疗法],第18卷第2期,442-4462010年2月)涉及一种利用基于第一短干扰RNA(siRNA)的皮肤治疗剂用于治疗罕见皮肤病症先天性甲肥厚(PC)的Ib期临床试验，先天性甲肥厚是一种常染色体显性综合征，包括致残性的掌跖角化病。此siRNA(称为TD101)特异性地并强有力地靶向角蛋白6a(K6a)N171K突变体mRNA，而不影响野生型K6a mRNA。

Zheng等人(PNAS[美国国家科学院院刊],2012年7月24日,第109卷,第30期,11975-11980)证实，球形核酸纳米粒子轭合物(SNA-NC)是由高度定向的、共价固定的siRNA的致密壳围绕的金核，它在应用之后数小时内自由地穿透几乎100％体外角化细胞、小鼠皮肤、以及人类表皮。Zheng等人证实，在人类皮肤中单次应用25nM的表皮生长因子受体(EGFR)SNA-NC持续60小时显示出有效的基因敲低。对于向皮肤给予的在SNA-NC中固定的CRISPR Cas，可以考虑类似剂量。

一般基因疗法考虑因素

疾病相关基因和多核苷酸的实例和疾病特定信息是从麦考斯克-内森遗传医学研究所(McKusick-Nathans Institute of Genetic Medicine)、约翰霍普金斯大学(马里兰州巴尔的摩)(Johns Hopkins University(Baltimore,Md.))和国家生物技术信息中心(National Center for Biotechnology Information)、国家医学图书馆(马里兰州贝塞斯达)(National Library of Medicine(Bethesda,Md.))可获得的，在世界互联网上可获得的。

这些基因和途径中的突变可能导致产生影响功能的不适当蛋白质或不适当量的蛋白质。来自2012年12月12日提交的美国临时申请61/736,527的基因、疾病和蛋白质的另外实例通过引用并入本文。此类基因、蛋白质和途径可以是本发明的CRISPR复合物的靶多核苷酸。本发明的实施例还涉及牵涉敲除基因、扩增基因并修复与DNA重复序列不稳定性和神经障碍相关联的特定突变的方法和组合物(Robert D.Wells,Tetsuo Ashizawa,GeneticInstabilities and Neurological Diseases[基因不稳定性和神经疾病],第二版,Academic Press[学术出版社],2011年10月13日-Medical[医学])。已发现串联重复序列的具体方面是超过二十种人类疾病的原因(New insights into repeat instability:roleof RNA·DNAhybrids.[重复序列不稳定性的新观点：RNA·DNA杂交体的作用]McIvor EI,Polak U,Napierala M.RNA Biol.[RNA生物学]2010年9月-10月；7(5):551-8)。本发明效应蛋白系统可以用于校正基因组不稳定性的这些缺陷。

本发明的几个其他方面涉及校正与广泛范围的遗传疾病相关联的缺陷，这些疾病在国立卫生研究院(National Institutes of Health)网站上的主题小节遗传性障碍下进一步描述(网址是在health.nih.gov/topic/GeneticDisorders)。遗传性脑病可以包括但不限于，肾上腺脑白质营养不良、胼胝体发育不全、艾卡尔迪综合征、阿尔珀斯病、阿尔茨海默病、巴斯综合症、贝敦氏病、CADASIL、小脑变性、法布里病、格-施-沙病(Gerstmann-Straussler-Scheinker Disease)、亨廷顿病、以及其他三联体重复序列障碍、利氏病、莱施-奈恩综合征、门克斯病、线粒体肌病以及NINDS空洞脑。这些疾病在国立卫生研究院网站上的小节遗传性脑部障碍下进一步描述。

Cas9发展和使用

本发明可以基于以下文献中列出的CRISPR-Cas9发展和使用的方面来说明和扩展，并且特别是涉及细胞和生物体中的CRISPR蛋白复合物的递送和RNA指导内切核酸酶的使用：

Multiplex genome engineering using CRISPR/Cas systems[使用CRISPR/Cas系统的多重基因组工程化]Cong,L.,Ran,F.A.,Cox,D.,Lin,S.,Barretto,R.,Habib,N.,Hsu,P.D.,Wu,X.,Jiang,W.,Marraffini,L.A.,和Zhang,F.Science[科学]2月15日；339(6121):819-23(2013)；

RNA-guided editing of bacterial genomes using CRISPR-Cas systems[使用CRISPR-Cas对细菌基因组进行RNA指导编辑]Jiang W.,Bikard D.,Cox D.,Zhang F,Marraffini LA.Nat Biotechnol[自然生物技术],3月；31(3):233-9(2013)；

One-Step Generation of Mice Carrying Mutations in Multiple Genes byCRISPR/Cas-Mediated Genome Engineering[通过CRISPR/Cas介导的基因组工程化来一步生成携带多基因中的突变的小鼠]Wang H.,Yang H.,Shivalila CS.,Dawlaty MM.,ChengAW.,Zhang F.,Jaenisch R.Cell[细胞]5月9日；153(4):910-8(2013)；

Optical control of mammalian endogenous transcription and epigeneticstates[哺乳动物内源性转录和外遗传状态的光控制]Konermann S,Brigham MD,TrevinoAE,Hsu PD,Heidenreich M,Cong L,Platt RJ,Scott DA,Church GM,Zhang F.Nature[自然]8月22日；500(7463):472-6.doi:10.1038/Nature12466.电子版2013年8月23日(2013)；

Double Nicking by RNA-Guided CRISPR Cas9for Enhanced Genome EditingSpecificity[用于增强基因组编辑特异性的RNA指导的CRISPR Cas9的双重切口]Ran,FA.,Hsu,PD.,Lin,CY.,Gootenberg,JS.,Konermann,S.,Trevino,AE.,Scott,DA.,Inoue,A.,Matoba,S.,Zhang,Y.,和Zhang,F.Cell[细胞]8月28日.pii:S0092-8674(13)01015-5(2013-A)；

DNA targeting specificity of RNA-guided Cas9nucleases[靶向RNA指导的Cas9核酸酶的特异性的DNA]Hsu,P.,Scott,D.,Weinstein,J.,Ran,FA.,Konermann,S.,Agarwala,V.,Li,Y.,Fine,E.,Wu,X.,Shalem,O.,Cradick,TJ.,Marraffini,LA.,Bao,G.,和Zhang,F.Nat Biotechnol[自然生物技术]doi:10.1038/nbt.2647(2013)；

Genome engineering using the CRISPR-Cas9system[使用CRISPR-Cas9系统的基因组工程化]Ran,FA.,Hsu,PD.,Wright,J.,Agarwala,V.,Scott,DA.,Zhang,F.NatureProtocols[自然实验手册],11月；8(11):2281-308(2013-B)；

Genome-Scale CRISPR-Cas9Knockout Screening in Human Cells[人类细胞中的基因组规模的CRISPR-Cas9敲除筛选]Shalem,O.,Sanjana,NE.,Hartenian,E.,Shi,X.,Scott,DA.,Mikkelson,T.,Heckl,D.,Ebert,BL.,Root,DE.,Doench,JG.,Zhang,F.Science[科学]12月12日(2013)。[电子版先于印刷版]；

Crystal structure of cas9in complex with guide RNA and target DNA[与指导RNA和靶向RNA复合的cas9的晶体结构]Nishimasu,H.,Ran,FA.,Hsu,PD.,Konermann,S.,Shehata,SI.,Dohmae,N.,Ishitani,R.,Zhang,F.,Nureki,O.Cell[细胞]2月27日,156(5):935-49(2014)；

Genome-wide binding of the CRISPR endonuclease Cas9in mammalian cells[哺乳动物细胞中CRISPR内切核酸酶Cas9的全基因组结合]Wu X.,Scott DA.,Kriz AJ.,Chiu AC.,Hsu PD.,Dadon DB.,Cheng AW.,Trevino AE.,Konermann S.,Chen S.,Jaenisch R.,Zhang F.,Sharp PA.Nat Biotechnol.[自然生物技术]4月20日.doi:10.1038/nbt.2889(2014)；

CRISPR-Cas9Knockin Mice for Genome Editing and Cancer Modeling[用于基因组编辑和癌症建模的CRISPR-Cas9敲入小鼠]Platt RJ,Chen S,Zhou Y,Yim MJ,SwiechL,Kempton HR,Dahlman JE,Parnas O,Eisenhaure TM,Jovanovic M,Graham DB,Jhunjhunwala S,Heidenreich M,Xavier RJ,Langer R,Anderson DG,Hacohen N,RegevA,Feng G,Sharp PA,Zhang F.Cell[细胞]159(2):440-455 DOI:10.1016/j.cell.2014.09.014(2014)；

Development and Applications of CRISPR-Cas9for Genome Engineering[用基因组工程化的CRISPR-Cas9的发展和应用],Hsu PD,Lander ES,Zhang F.,Cell[细胞]6月5日；157(6):1262-78(2014)。

Genetic screens in human cells using the CRISPR/Cas9 system[使用CRISPR/Cas9系统的人类细胞的遗传筛选],Wang T,Wei JJ,Sabatini DM,Lander ES.,Science[科学]1月3日；343(6166):80-84.doi:10.1126/science[科学]1246981(2014)；

Rational design of highly active sgRNAs for CRISPR-Cas9-mediated geneinactivation[用于CRISPR-Cas9-介导的基因灭活的高活性sgRNA的合理设计],DoenchJG,Hartenian E,Graham DB,Tothova Z,Hegde M,Smith I,Sullender M,Ebert BL,Xavier RJ,Root DE.,(2014年9月3日在线公开)Nat Biotechnol.[自然生物技术]12月；32(12):1262-7(2014)；

In vivo interrogation of gene function in the mammalian brain usingCRISPR-Cas9[使用CRISPR-Cas9体内探察哺乳动物大脑的基因功能],Swiech L,Heidenreich M,Banerjee A,Habib N,Li Y,Trombetta J,Sur M,Zhang F.,(2014年10月19日在线公开)Nat Biotechnol.[自然生物技术]1月；33(1):102-6(2015)；

Genome-scale transcriptional activation by an engineered CRISPR-Cas9complex[通过工程化CRISPR-Cas9复合物进行基因组规模的转录激活],Konermann S,Brigham MD,Trevino AE,Joung J,Abudayyeh OO,Barcena C,Hsu PD,Habib N,Gootenberg JS,Nishimasu H,Nureki O,Zhang F.,Nature[自然]1月29日；517(7536):583-8(2015)。

A split-Cas9architecture for inducible genome editing andtranscription modulation[用于诱导型基因组编辑和转录调节的拆分Cas9架构],Zetsche B,Volz SE,Zhang F.,(2015年2月02日在线公开)Nat Biotechnol.[自然生物技术]2月；33(2):139-42(2015)；

Genome-wide CRISPR Screen in a Mouse Model of Tumor Growth andMetastasis[肿瘤生长和转移的小鼠模型中的全基因组CRISPR筛选],Chen S,Sanjana NE,Zheng K,Shalem O,Lee K,Shi X,Scott DA,Song J,Pan JQ,Weissleder R,Lee H,ZhangF,Sharp PA.Cell[细胞]160,1246-1260,2015年3月12日(小鼠中的多重筛选)，以及

In vivo genome editing using Staphylococcus aureus Cas9[使用金黄色葡萄球菌Cas9的体内基因组编辑],Ran FA,Cong L,Yan WX,Scott DA,Gootenberg JS,KrizAJ,Zetsche B,Shalem O,Wu X,Makarova KS,Koonin EV,Sharp PA,Zhang F.,(2015年4月01日在线公开),Nature.[自然]4月9日；520(7546):186-91(2015)；

Shalem等人,“High-throughput functional genomics using CRISPR-Cas9[使用CRISPR-Cas9的高通量功能基因组学]”Nature Reviews Genetics[遗传学自然评论]16,299-311(2015年5月)。

Xu等人,“Sequence determinants of improved CRISPR sgRNA design[改善的CRISPR sgRNA设计的序列决定簇]”Genome Research[基因组研究]25,1147-1157(2015年8月)。

Parnas等人,“A Genome-wide CRISPR Screen in Primary Immune Cells toDissect Regulatory Networks[一种在原代免疫细胞解剖调节网络的全基因组CRISPR筛选]”Cell[细胞]162,675-686(2015年7月30日)。

Ramanan等人,“CRISPR/Cas9cleavage of viral DNA efficiently suppresseshepatitis B virus[病毒DNA的CRISPR/Cas9分割有效抑制了乙型肝炎病毒]”ScientificReports[科学通讯]5:10833.doi:10.1038/srep10833(2015年6月2日)

Nishimasu等人,“Crystal Structure of Staphylococcus aureus Cas9[金黄色葡萄球菌Cas9的晶体结构]”Cell[细胞]162,1113-1126(2015年8月27日)

Zetsche等人(2015),“Cpf1is a single RNA-guided endonuclease of a class2CRISPR-Cas system[Cpf1是第2类CRISPR-Cas系统的单一RNA指导的内切核酸酶]”Cell[细胞]163,759-771(2015年10月22日)doi:10.1016/j.cell.2015.09.038.电子版2015年9月25日

Shmakov等人(2015),“Discovery and Functional Characterization ofDiverse Class 2CRISPR-Cas Systems[不同的第2类CRISPR-Cas系统的发现和功能表征]”Molecular Cell[分子细胞]60,385-397(2015年11月5日)doi:10.1016/j.molcel.2015.10.008.电子版2015年10月22日

Gao等人,“Engineered Cpf1Enzymes with Altered PAM Specificities[具有改变的PAM特异性的工程化Cpf1酶]”bioRxiv 091611；doi:http://dx.doi.org/10.1101/091611(2016年12月4日)。

每份文献通过引用并入本文，它们可以被考虑用于实践本发明，并且如以下简要讨论的：

Cong等人基于嗜热链球菌Cas9并且还基于酿脓链球菌Cas9来工程化用于真核细胞的II型CRISPR-Cas系统，并且证实Cas9核酸酶可以通过短RNA来指导以诱导人类和小鼠细胞中的精确DNA切割。他们的研究显示Cas9在转化成切口酶后可以用于促进具有最小诱变活性的真核细胞中的同源定向修复。另外地，他们的研究证实多个指导序列可以被编码成单一CRISPR阵列，以使得能够在哺乳动物基因组内的多个内源性基因组座位位点处同时进行编辑，这证实RNA指导的核酸酶技术的容易可编程性和广泛适用性。使用RNA编程细胞内的序列特异性DNA切割的这种能力限定了一类新的基因组工程化工具。这些研究进一步显示其他CRISPR座位作为可能可移植到哺乳动物细胞中并且也可以介导哺乳动物基因组切割。重要的是，可以设想CRISPR-Cas系统的几个方面可以被进一步改善以增加其效率和多功能性。

Jiang等人使用与双RNA复合的成簇的、规律间隔的、短回文重复序列(CRISPR)相关Cas9内切核酸酶，在肺炎链球菌和大肠杆菌的基因组中引入精确突变。该方法依赖于靶基因组位点处的双-RNA :Cas9-引导的切割以杀死未突变细胞，并且不再需要选择标记或反选择系统。该研究报道了通过改变短CRISPR RNA(crRNA)的序列以形成编辑模板上携带的单个核苷酸或多个核苷酸来重新编程双RNA :Cas9特异性。该研究显示同时使用两个crRNA能够进行多重诱变。另外，当该方法与重组组合使用时，在肺炎链球菌中几乎100％使用所述方法恢复的细胞含有希望的突变，并且在大肠杆菌中65％恢复的细胞含有该突变。

Wang等人(2013)使用用于一步生成携带多基因中的突变的小鼠的CRISPR-Cas系统，这些突变通常是在多个步骤中通过在胚胎干细胞中连续重组和/或具有单个突变的小鼠的耗时互交来生成的。CRISPR-Cas系统将极大地加速功能冗余基因和上位基因相互作用的体内研究。

Konermann等人(2013)解决了本领域中对于通用和稳健技术的需要，这些技术使得能够光学和化学调节基于DNA结合结构域的CRISPR Cas9酶并且还调节转录激活因子样效应物

Ran等人(2013-A)描述了一种将Cas9切口酶突变体与成对的指导RNA组合以引入靶向双链断裂的方法。这解决了来自微生物CRISPR-Cas系统的Cas9核酸酶通过指导序列被靶向特异性基因组座位的问题，这些指导序列可以耐受与DNA靶标的某些错配并且因此促成不希望的脱靶诱变。因为基因组中的个别切口以高保真度修复，因此经由适当偏移的指导RNA进行同时切口对于双链断裂是需要的并且扩大了用于靶向切割的特异性识别的碱基的数目。作者们证实使用成对切口可以在细胞系中减少50倍至1,500倍的脱靶活性并且促进小鼠受精卵中的基因敲除，而不用牺牲中靶切割效率。此通用策略使得能够进行需要高特异性的各种各样的基因组编辑应用。

Hsu等人(2013)表征了人类细胞中的SpCas9靶向特异性，以告知靶位点的选择并避免脱靶效应。该研究评价了>700种指导RNA变体和293T和293FT细胞中>100个预测的基因组脱靶座位处的SpCas9诱导型indel突变水平。作者们指示SpCas9以序列依赖性方式容忍指导RNA与靶DNA之间的不同位置处的错配，对错配的数目、位置和分布敏感。作者们进一步证实SpCas9-介导的切割未受到DNA甲基化的影响并且SpCas9和gRNA的剂量可以被滴定来最小化脱靶修饰。另外地，为了促进哺乳动物基因组工程化应用，作者们的报道提供了一种指导靶序列的选择和验证以及脱靶分析的基于网络的软件工具。

Ran等人(2013-B)描述了一组用于在哺乳动物细胞中经由非同源末端接合(NHEJ)或同源定向修复(HDR)进行Cas9介导的基因组编辑以及生成用于下游功能研究的修饰的细胞系的工具。为了最小化脱靶切割，作者们进一步描述一种使用具有成对指导RNA的Cas9切口酶突变体的双切口策略。这些作者们提供的方案在实验上推导了用于选择靶位点、评价切割效率并分析脱靶活性的准则。这些研究显示以靶向设计开始，基因修饰可以在仅仅1-2周内实现，并且修饰的克隆细胞系可以在2-3周内得到。

Shalem等人描述了一种探察全基因组规模的基因功能的新方式。他们的研究显示具有64,751个独特指导序列的基因组规模的CRISPR-Cas9敲除(GeCKO)文库靶向的18,080个基因的递送能够在人类细胞中进行阴性和阳性选择筛选。首先，作者们证实使用GeCKO文库鉴定了癌症和多能干细胞中的细胞活力所必须的基因。接着，在黑色素瘤模型中，作者们筛选其丧失涉及对维罗非尼(一种抑制突变体蛋白激酶BRAF的治疗剂)的抗性的基因。他们的研究显示最高评级的候选物包括先前验证的基因NF1和MED12以及新颖命中NF2、CUL3、TADA2B、以及TADA1。作者们在靶向相同基因的独立的指导RNA与高命中确认率之间观察到高水平的一致性，并且因此证实允许用Cas9进行基因组规模筛选。

Nishimasu等人报道了与sgRNA复合的酿脓链球菌Cas9的晶体结构以及其在2.5A°分辨率下的靶DNA。该结构揭示了一种由靶向识别和核酸酶裂片(lobe)组成的二裂片体系结构，在其界面处带正电荷的沟中提供sgRNA :DNA异源双链核酸分子。识别裂片对于结合sgRNA和DNA是必需的，而核酸酶裂片含有HNH和RuvC核酸酶结构域，这些结构域被适当地定位来分别切割靶DNA的互补链和非互补链。核酸酶裂片还含有负责与原型间隔区相邻基序(PAM)相互作用的羧基末端结构域。此高分辨结构和伴随的功能分析已揭示了通过Cas9进行的RNA指导的DNA靶向的分子机制，从而为新的通用型基因组编辑技术的合理设计做准备。

Wu等人由装载有小鼠胚胎干细胞(mESC)中的单一指导RNA(sgRNA)的酿脓链球菌绘制无催化活性Cas9(dCas9)的全基因组结合位点。作者们证实四种测试的sgRNA各自使得dCas9靶向几十个与几千个之间的基因组位点，频繁地表征为sgRNA和NGG原型间隔区相邻基序(PAM)中的5-核苷酸种子区。染色质难接近性减少了dCas9与具有匹配的种子序列的其他位点的结合；因此70％脱靶位点与基因相关联。作者们证实在用催化活性的Cas9转染的mESC中295dCas9结合位点的靶向测序鉴定了在背景水平上突变的仅一个位点。作者们提出一种用于Cas9结合和切割的两阶段模型，其中种子匹配触发结合但扩大的与靶DNA的配对对于切割是需要的。

Platt等人建立了一种Cre-依赖性Cas9敲入小鼠。作者们证实了使用神经元、免疫细胞和内皮细胞中的指导RNA的腺相关病毒(AAV)、慢病毒或粒子介导的递送进行的体内以及离体基因组编辑。

Hsu等人(2014)是大体上讨论了CRISPR-Cas9从酸乳到基因组编辑的历史(包括细胞遗传筛选)的评论性文章。

Wang等人(2014)涉及一种适用于使用基因组规模的慢病毒单一指导RNA(sgRNA)文库的阳性选择和阴性选择的合并的失功能遗传筛选方法。

Doench等人创建了一个sgRNA库，铺在一组六种内源性小鼠基因和三种内源性人类基因的所有可能的靶位点上，并且通过抗体染色和流式细胞术定量评估它们产生靶基因的无效等位基因的能力。作者们证实PAM的优化提高活性并且也提高一组用于设计sgRNA的在线工具。

Swiech等人证实AAV介导的SpCas9基因组编辑可以能够进行大脑中的基因功能的反向遗传学研究。

Konermann等人(2015)讨论了在使用或不使用接头的情况下将多个效应物结构域例如转录激活因子、功能和表观基因组调节物附接在指导序列诸如茎环或四核苷酸环上的适当位置处的能力。

Zetsche等人证实Cas9酶可以拆分成两个并且因此可以控制用于激活的Cas9的组装。

Chen等人涉及通过证实小鼠全基因组体内CRISPR-Cas9筛选揭示了基因调节肺部转移来进行多重筛选。

Ran等人(2015)涉及SaCas9以及其编辑基因组的能力并且证实不能从生物化学测定外推。

Shalem等人(2015)描述其中无催化活性Cas9(dCas9)融合物用于在合成上阻遏(CRISPRi)或激活(CRISPRa)表达，从而显示使用基因组规模的筛选的Cas9的进展的方式，这些筛选包括排列和合并的筛选、灭活基因组座位的敲除方法以及调节转录活性的策略。

Xu等人(2015)评估了有助于基于CRISPR的筛选的单一指导RNA(sgRNA)效率的DNA序列特征。作者们探寻了CRISPR/Cas9敲除的效率和切割位点处的核苷酸偏好。作者们还发现CRISPRi/a的序列偏好基本上不同于CRISPR/Cas9敲除的序列偏好。

Parnas等人(2015)将全基因组合并的CRISPR-Cas9文库引入到树突细胞(DC)中，以鉴定控制细菌性脂多糖(LPS)对肿瘤坏死因子(Tnf)的诱导。鉴定Tlr4信号传导的已知调节剂和先前未知的候选物并且将其分成对于对LPS的典型响应具有不同作用的三种功能模块。

Ramanan等人(2015)证实了感染细胞中的病毒附加体DNA(cccDNA)的切割。HBV基因组在感染的肝细胞的核中作为称为共价闭环DNA(cccDNA)的3.2kb双链附加型DNA种类存在，该共价闭环DNA是在HBV生命周期中其复制不受当前治疗的抑制的关键性组分。作者们证实特异性靶向HBV的高度保守区的sgRNA强烈抑制了病毒复制和缺失的cccDNA。

Nishimasu等人(2015)报道了与单一指导RNA(sgRNA)及其双链DNA靶标复合的SaCas9的晶体结构，该单一指导RNA含有5'-TTGAAT-3'PAM和5'-TTGGGT-3'PAM。SaCas9与SpCas9的结构比较突出显示了结构保守性和趋异性，这解释了它们不同的PAM特异性和直源sgRNA识别。

Canver等人(2015)证实基于CRISPR-Cas9的非编码基因组元件的功能研究。作者们开发了进行人类和小鼠BCL11A增强子的原位饱和诱变的合并的CRISPR-Cas9指导RNA文库，这揭示了这些增强子的关键性特征。

Zetsche等人(2015)报道了来自新杀手弗朗西丝氏菌U112的、具有不同于Cas9的特征的第2类CRISPR核酸酶Cpf1的表征。Cpf1是一种缺乏tracrRNA的单一RNA指导的内切核酸酶，它利用T富集的原型间隔区相邻基序，并且经由交错双链断裂来切割DNA。

Shmakov等人(2015)报道了三种不同的第2类CRISPR-Cas系统。两种系统性CRISPR酶(C2c1和C2c3)含有与Cpf1相关性较远的RuvC样内切核酸酶结构域。不同于Cpf1，C2c1取决于用于DNA切割的crRNA和tracrRNA。第三种酶(C2c2)含有两个预测的HEPN RNA酶结构域并且是tracrRNA独立的。

Slaymaker等人(2016)报道了使用结构指导的蛋白质工程化来提高酿脓链球菌Cas9(SpCas9)的特异性。作者们开发了维持强劲的中靶切割同时具有减小的脱靶效应的“特异性增强”的SpCas9(eSpCas9)变体。

同样地，“Dimeric CRISPR RNA-guided FokI nucleases for highly specificgenome editing[用于高特异性基因组编辑的二聚CRISPR RNA指导FokI核酸酶]”，Shengdar Q.Tsai,Nicolas Wyvekens,Cyd Khayter,Jennifer A.Foden,Vishal Thapar,Deepak Reyon,Mathew J.Goodwin,Martin J.Aryee,J.Keith Joung NatureBiotechnology[自然生物技术]32(6):569-77(2014)涉及在人类细胞中识别扩展序列并能以高效率编辑内源性基因的二聚RNA指导FokI核酸酶。

美国专利号8,697,359、8,771,945、8,795,965、8,865,406、8,871,445、8,889,356、8,889,418、8,895,308、8,906,616、8,932,814、8,945,839、8,993,233以及8,999,641；美国专利公开US 2014-0310830(美国申请序列号14/105,031)，US 2014-0287938A1(美国申请序列号14/213,991)，US 2014-0273234A1(美国申请序列号14/293,674)，US2014-0273232A1(美国申请序列号14/290,575)，US 2014-0273231(美国申请序列号14/259,420)，US 2014-0256046A1(美国申请序列号14/226,274)，US2014-0248702A1(美国申请序列号14/258,458)，US 2014-0242700A1(美国申请序列号14/222,930)，US 2014-0242699A1(美国申请序列号14/183,512)，US2014-0242664A1(美国申请序列号14/104,990)，US2014-0234972A1(美国申请序列号14/183,471)，US 2014-0227787A1(美国申请序列号14/256,912)，US2014-0189896A1(美国申请序列号14/105,035)，US 2014-0186958(美国申请序列号14/105,017)，US 2014-0186919A1(美国申请序列号14/104,977)，US 2014-0186843A1(美国申请序列号14/104,900)，US 2014-0179770A1(美国申请序列号14/104,837)和US 2014-0179006A1(美国申请序列号14/183,486)，US 2014-0170753(美国申请序列号14/183,429)；US 2015-0184139(美国申请序列号14/324,960)；14/054,414，欧洲专利申请EP 2 771 468(EP 13818570.7)，EP 2 764 103(EP 13824232.6)，以及EP 2784 162(EP 14170383.5)；以及PCT专利公开WO 2014/093661(PCT/US2013/074743)、WO 2014/093694(PCT/US 2013/074790)、WO 2014/093595(PCT/US2013/074611)、WO 2014/093718(PCT/US 2013/074825)、WO 2014/093709(PCT/US2013/074812)、WO 2014/093622(PCT/US2013/074667)、WO 2014/093635(PCT/US2013/074691)、WO 2014/093655(PCT/US 2013/074736)、WO 2014/093712(PCT/US2013/074819)、WO 2014/093701(PCT/US 2013/074800)、WO 2014/018423(PCT/US2013/051418)、WO 2014/204723(PCT/US 2014/041790)、WO 2014/204724(PCT/US2014/041800)、WO 2014/204725(PCT/US 2014/041803)、WO 2014/204726(PCT/US2014/041804)、WO 2014/204727(PCT/US 2014/041806)、WO 2014/204728(PCT/US2014/041808)、WO 2014/204729(PCT/US 2014/041809)、WO 2015/089351(PCT/US2014/069897)、WO 2015/089354(PCT/US 2014/069902)、WO 2015/089364(PCT/US2014/069925)、WO 2015/089427(PCT/US 2014/070068)、WO 2015/089462(PCT/US2014/070127)、WO 2015/089419(PCT/US 2014/070057)、WO 2015/089465(PCT/US2014/070135)、WO 2015/089486(PCT/US 2014/070175)、PCT/US 2015/051691、PCT/US2015/051830。还参考美国临时专利申请61/758,468；61/802,174；61/806,375；61/814,263；61/819,803和61/828,130，它们分别在2013年1月30日；2013年3月15日；2013年3月28日；2013年4月20日；2013年5月6日以及2013年5月28日提交。还参考在2013年6月17日提交的美国临时专利申请61/836,123。还另外地参考美国临时专利申请61/835,931、61/835,936、61/835,973、61/836,080、61/836,101、以及61/836,127，这些专利各自在2013年6月17日提交。还参考2013年8月5日提交的美国临时专利申请61/862,468和61/862,355；在2013年8月28日提交的61/871,301；在2013年9月25日提交的61/960,777以及2013年10月28日提交的61/961,980。又进一步参考：2014年10月28日提交的PCT/US 2014/62558和美国临时专利申请序列号：61/915,148、61/915,150、61/915,153、61/915,203、61/915,251、61/915,301、61/915,267、61/915,260、和61/915,397，各自于2013年12月12日提交；在2013年1月29日和2013年2月25日提交的61/757,972和61/768,959；两者均在2014年6月11日提交的62/010,888和62/010,879；各自在2014年6月10日提交的62/010,329、62/010,439和62/010,441；各自在2014年2月12日提交的61/939,228和61/939,242；在2014年4月15日提交的61/980,012；在2014年8月17日提交的62/038,358；各自在2014年9月25日提交的62/055,484、62/055,460和62/055,487；以及在2014年10月27日提交的62/069,243。参考指定尤其是美国的2014年6月10日提交的申请号PCT/US 14/41806的PCT申请。参考2014年1月22日提交的美国临时专利申请61/930,214。参考指定尤其是美国的2014年6月10日提交的申请号PCT/US14/41806的PCT申请。

还参考15年6月17日的美国申请62/180,709，PROTECTED GUIDE RNAS(PGRNAS)[保护性指导RNA(PGRNA)]；14年12月12日提交的美国申请62/091,455，PROTECTED GUIDE RNAS(PGRNAS)[保护性指导RNA(PGRNA)]；14年12月24日提交的美国申请62/096,708，PROTECTEDGUIDE RNAS(PGRNAS)[保护性指导RNA(PGRNA)]；14年12月12日的美国申请62/091,462、14年12月23日的62/096,324、2015年6月17日的62/180,681、以及2015年10月5日的62/237,496，DEAD GUIDES FOR CRISPR TRANSCRIPTION FACTORS[用于CRISPR转录因子的无效指导序列]；14年12月12日的美国申请62/091,456和2015年6月17日的62/180,692，ESCORTEDAND FUNCTIONALIZED GUIDES FOR CRISPR-CAS SYSTEMS[用于CRISPR-CAS系统的护送指导序列和功能化指导序列]；14年12月12日的美国申请62/091,461，DELIVERY,USE ANDTHERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FORGENOME EDITING AS TO HEMATOPOETIC STEM CELLS(HSCs)[用于关于造血干细胞(HSC)的基因组编辑的CRISPR-CAS系统和组合物的递送、使用和治疗性应用]；14年12月19日的美国申请62/094,903，UNBIASED IDENTIFICATION OF DOUBLE-STRAND BREAKS AND GENOMICREARRANGEMENT BY GENOME-WISE INSERT CAPTURE SEQUENCING[通过基因组规格的插入物捕获测序来无偏性地鉴定双链断裂和基因组重新排列]；14年12月24日的美国申请62/096,761，ENGINEERING OF SYSTEMS,METHODS AND OPTIMIZED ENZYME AND GUIDE SCAFFOLDSFOR SEQUENCE MANIPULATION[用于序列操纵的系统、方法和最佳酶和指导支架的工程化]；14年12月30日的美国申请62/098,059、2015年6月18日的62/181,641、以及2015年6月18日的62/181,667，RNA-TARGETING SYSTEM[RNA靶向系统]；14年12月24日的美国申请62/096,656和2015年6月17日的62/181,151，CRISPR HAVING OR ASSOCIATED WITHDESTABILIZATION DOMAINS[具有去稳定结构域或与其缔合的CRISPR]；14年12月24日的美国申请62/096,697，CRISPR HAVING OR ASSOCIATED WITH AAV[具有AAV或与该AAV缔合的CRISPR]；14年12月30日的美国申请62/098,158，ENGINEERED CRISPR COMPLEXINSERTIONAL TARGETING SYSTEMS[工程化CRISPR复合物插入的靶向系统]；15年4月22日的美国申请62/151,052，CELLULAR TARGETING FOR EXTRACELLULAR EXOSOMAL REPORTING[用于细胞外外来体报道的细胞靶向]；14年9月24日的美国申请62/054,490，DELIVERY,USEAND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FORTARGETING DISORDERS AND DISEASES USING PARTICLE DELIVERY COMPONENTS[用于使用粒子递送组合物靶向障碍和疾病的CRISPR-CAS系统和组合物的递送、使用和治疗性应用]；14年2月12日的美国申请61/939,154，SYSTEMS,METHODS AND COMPOSITIONS FOR SEQUENCEMANIPULATION WITH OPTIMIZED FUNCTIONAL CRISPR-CAS SYSTEMS[用于使用最佳功能的CRISPR-CAS系统进行序列操纵的系统、方法和组合物]；14年9月25日的美国申请62/055,484，SYSTEMS,METHODS AND COMPOSITIONS FOR SEQUENCE MANIPULATION WITH OPTIMIZEDFUNCTIONAL CRISPR-CAS SYSTEMS[用于使用最佳功能的CRISPR-CAS系统进行序列操纵的系统、方法和组合物]；14年12月4日的美国申请62/087,537，SYSTEMS,METHODS ANDCOMPOSITIONS FOR SEQUENCE MANIPULATION WITH OPTIMIZED FUNCTIONAL CRISPR-CASSYSTEMS[用于使用最佳功能的CRISPR-CAS系统进行序列操纵的系统、方法和组合物]；14年9月24日的美国申请62/054,651，DELIVERY,USE AND THERAPEUTIC APPLICATIONS OF THECRISPR-CAS SYSTEMS AND COMPOSITIONS FOR MODELING COMPETITION OF MULTIPLECANCER MUTATIONS IN VIVO[用于体内调节多种癌症突变的竞争的CRISPR-CAS系统和组合物的递送、使用和治疗性应用]；14年10月23日的美国申请62/067,886，DELIVERY,USE ANDTHERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FORMODELING COMPETITION OF MULTIPLE CANCER MUTATIONS IN VIVO[用于体内调节多种癌症突变的竞争的CRISPR-CAS系统和组合物的递送、使用和治疗性应用]；14年9月24日的美国申请62/054,675和2015年6月17日的62/181,002，DELIVERY,USE AND THERAPEUTICAPPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS IN NEURONAL CELLS/TISSUES[CRISPR-CAS系统和组合物在神经元细胞/组织中的递送、使用和治疗性应用]；14年9月24日的美国申请62/054,528，DELIVERY,USE AND THERAPEUTIC APPLICATIONS OFTHE CRISPR-CAS SYSTEMS AND COMPOSITIONS IN IMMUNE DISEASES OR DISORDERS[CRISPR-CAS系统和组合物在免疫疾病或障碍中的递送、使用和治疗性应用]；14年9月25日的美国申请62/055,454，DELIVERY,USE AND THERAPEUTIC APPLICATIONS OF THE CRISPR-CAS SYSTEMS AND COMPOSITIONS FOR TARGETING DISORDERS AND DISEASES USING CELLPENETRATION PEPTIDES(CPP)[用于使用细胞穿透肽(CPP)靶向障碍和疾病的CRISPR-CAS系统和组合物的递送、使用和治疗性应用]；14年9月25日的美国申请62/055,460，MULTIFUNCTIONAL-CRISPR COMPLEXES AND/OR OPTIMIZED ENZYME LINKED FUNCTIONAL-CRISPR COMPLEXES[多功能-CRISPR复合物和/或最佳酶连接的功能性-CRISPR复合物]；14年12月4日的美国申请62/087,475和2015年6月18日的62/181,690，FUNCTIONAL SCREENINGWITH OPTIMIZED FUNCTIONAL CRISPR-CAS SYSTEMS[使用最佳CRISPR-CAS系统的功能筛选]；14年9月25日的美国申请62/055,487，FUNCTIONAL SCREENING WITH OPTIMIZEDFUNCTIONAL CRISPR-CAS SYSTEMS[使用最佳CRISPR-CAS系统的功能筛选]；14年12月4日的美国申请62/087,546和2015年6月18日的62/181,687，MULTIFUNCTIONAL CRISPRCOMPLEXES AND/OR OPTIMIZED ENZYME LINKED FUNCTIONAL-CRISPR COMPLEXES[多功能-CRISPR复合物和/或最佳酶连接的功能-CRISPR复合物]；以及14年12月30日的美国申请62/098,285，CRISPR MEDIATED IN VIVO MODELING AND GENETIC SCREENING OF TUMORGROWTH AND METASTASIS[肿瘤生长和转移的CRISPR介导的体内调节和遗传筛选]。

还参考2015年6月18日的美国申请62/181,659和2015年8月19日的62/207,318，ENGINEERING AND OPTIMIZATION OF SYSTEMS,METHODS,ENZYME AND GUIDE SCAFFOLDS OFCAS9ORTHOLOGS AND VARIANTS FOR SEQUENCE MANIPULATION[用于序列操纵的CAS9直向同源物和变体的系统、方法、酶以及指导支架的工程化和优化]。参考2015年6月18日的美国申请62/181,663和2015年10月22日的62/245,264，NOVEL CRISPR ENZYMES AND SYSTEMS[新颖CRISPR酶以及系统]；2015年6月18日的美国申请62/181,675、2015年10月22日的62/285,349、2016年2月17日的62/296,522、以及2016年4月8日的62/320,231，NOVEL CRISPRENZYMES AND SYSTEMS[新颖CRISPR酶以及系统]；2015年9月24日的美国申请62/232,067、2015年12月18日的美国申请14/975,085、欧洲申请号16150428.7、2015年8月16日的美国申请62/205,733、2015年8月5日的美国申请62/201,542、2015年7月16日的美国申请62/193,507、以及2015年6月18日的美国申请62/181,739，这些专利各自题为NOVEL CRISPRENZYMES AND SYSTEMS[新颖CRISPR酶以及系统]；以及2015年10月22日的美国申请62/245,270，NOVEL CRISPR ENZYMES AND SYSTEMS[新颖CRISPR酶以及系统]。还参考2014年2月12日的美国申请61/939,256和2014年12月12日的WO 2015/089473(PCT/US2014/070152)，这些专利各自题为ENGINEERING OF SYSTEMS,METHODS AND OPTIMIZED GUIDE COMPOSITIONSWITH NEW ARCHITECTURES FOR SEQUENCE MANIPULATION[具有用于序列操纵的新体系结构的系统、方法和最佳指导组合物的工程化]。还参考2015年8月15日的PCT/US2015/045504、2015年6月17日的美国申请62/180,699以及2014年8月17日的美国申请62/038,358，这些专利各自题为GENOME EDITING USING CAS9NICKASES[使用CAS9切口酶的基因组编辑]。

每一份这些专利、专利公开和申请、以及其中或它们的诉讼期间(“应用引用文献”)所引用的所有文献或本文应用引用文献中引用或参考的所有文献，连同本文或在通过引用并入本文的任何文献中提到的任何产品的任何说明书、描述、产品规格和产品清单均通过引用并入本文，并且可以应用于本发明的实践中。所有文献(例如，这些专利、专利公开和申请以及应用引用文献)通过引用并入本文，其程度如同将每个单独的文献具体并单独地指明通过引用并入本文。

本发明将在以下实例中进一步说明，这些实例仅出于说明目的给出并且不旨在以任何方式限制本发明。

实例

实例1：AsCpf1 PAM识别的定向进化

Cpf1是第2类V型CRISPR效应物。它是一种单一RNA指导的核酸内切酶并且经由交错双链断裂切割DNA。多重基因组编辑是有效的。Cpf1切割PAM的远端：18和23bp下游(Zetsche等人(2015)Cell[细胞]；163:759-771)。

野生型AsCpf1(例如AsCpf1和LbCpf1)识别PAM序列TTTV(其中V是A、C或G)。

替代PAM序列将扩展PAM谱系，并因此扩展可能的靶序列的量。此外，较短的PAM序列同样允许增加可能的靶序列的量。人类基因组含有41％GC、59％AT(29.5％T)。一行中3Ts的可能性＝0.0257(2.57％)。大约每40个碱基将获得TTT。一行中4T的概率为0.00758。因此，在任何给定的基因组起始位置，TTTV的可能性为1.81％。大约每55个碱基将获得TTTV。

经由AsCpf1(氨基酸球菌属物种BV3L6，UniProtKB/Swiss-Prot登录号U2UMQ6.1；genbank登录号961512548)的诱变，扩大了PAM识别。当与DNA结合时，PI(PAM相互作用)和Cpf1的REC1结构域与PAM序列非常接近(图1)。根据如图2和图3所述的方法，创建整个PAM近端区域的点突成并针对替代PAM识别进行评价。创建突变体Cpf1文库，其中不同的Cpf1突变体在能够在大肠杆菌中表达的CamR质粒(pACYS Cpf1质粒)上编码。质粒还含有侧接同向重复的间隔序列，用于重构能够与DNA靶座位结合的功能CPRISPR/Cpf1复合物。将文库在大肠杆菌中转化以产生含有Cpf1突变体文库的大肠杆菌。

在突变体Cpf1大肠杆菌文库中转化包含侧接PAM序列并且进一步包含AmpR标记的靶序列的第二质粒。对于多个替代PAM序列，这是并行执行的。

文库复杂性为32,256(84个位置*32个密码子*12个PAM)

在Cam/Amp培养基上的选择允许鉴定被特定Cpf1突变体识别的替代PAM序列。如果PAM序列被特定Cpf1突变体识别，则切割含有AmpR的质粒并丧失Amp抗性。因此，存在识别出特定PAM序列的文库成员的特异性耗竭。对包含Cpf1突变体并且在筛选中耗竭的质粒的测序鉴定了识别替代PAM序列的特定Cpf1突变体。

用野生型AsCpf1验证上述方法(图4)。证实了通过野生型AsCpf1(TTTC)识别的PAM序列确实不能维持Cam/Amp培养基上的细菌生长。

然后将上述方法应用于突变体AsCpf1文库。作为对照，在没有PAM序列的筛选中不同Cpf1突变体的表示(图5A)证实特定突变体没有显著的过量或代表性不足(underrepresentation)，而在具有由野生型Cpf1识别的PAM序列的筛选中不同的Cpf1突变体的表示(图5B)证实显著的代表性不足(或野生型Cpf1的耗竭)。各种替代PAM序列的不同Cpf1突变体的表示示于图6中。从图6中(并且在图7-10中进一步详述)，显然各种Cpf1突变体识别非典型PAM序列。

图7证实具有S542R突变的AsCpf1突变体能够至少识别PAM序列TCCC。图8证实具有S542R的AsCpf1突变体能够识别至少PAM序列TTCC突变。S542R允许识别TCCC和TTCC(允许在PAM的第3位置处的C)。

图9证实具有各种K548突变的AsCpf1突变体能够至少识别PAM序列TATC。至少突变体K548A、K548G、K548L、K548R、K548I、K548N、K548C、K548Q、K548H、K548F、K548S、K548T、K548W、K548Y、K548V能够识别PAM序列TATC。图10证实具有各种K548突变的AsCpf1突变体能够至少识别PAM序列TGTC。至少突变体K548G、K548R、K548C、K548Q、K548H、K548S、K548T、K548W、K548Y、K548V能够识别PAM序列TGTC。K548为PAM的第二碱基提供了胸腺嘧啶严格性。许多替代aa允许识别TATC或TGTC PAM。

进一步鉴定了AsCpf1突变体(数据未显示)，其识别了另外的替代PAM序列：167A(识别NTTV或TTV)、604A(识别TTTV)、607A(识别TCCC)。

进行体外切割实验(基本上如Zetsche等人(2015),Cell[细胞]163:1-13中所述)，其中来自表达AsCpf1的哺乳动物细胞的裂解物在试管中与含有在靶标位点之前随机化PAM的8-bp的质粒文库一起孵育。包含可靶向PAM的PAM文库的成员被切割，而所有其他PAM保持完整。对未切割的PAM进行测序并与阴性对照进行比较。相对于对照的PAM耗竭表示Cpf1可以切割的那些-图13中示出了耗竭的PAM序列的集合序列标志。

基于Cpf1蛋白的结构及其与gRNA和靶序列的相互作用的考虑，在PAM序列的物理邻近区域(即在PAM的1.4nm内)发现以下氨基酸残基AsCpf1(氨基酸球菌属物种BV3L6)：Y11、Q12、V13、S14、K15、T16、L17、Q34、F36、E39、D40、R43、H46、Y47、L50、I54、I57、Y58、I111、A126、E127、I128、Y129、K130、G131、L132、F133、K134、A135、E136、A157、L158、L159、R160、S161、F162、D163、K164、F165、T166、T167、Y168、F169、S170、G171、F172、Y173、E174、N175、R176、K177、N178、K532、L533、N534、F535、Q536、M537、P538、T539、L540、A541、S542、G543、W544、D545、V546、N547、K548、E549、K550、N551、N552、G553、A554、I555、L556、L565、G566、I567、M568、P569、K570、Q571、K572、G573、R574、Y575、K592、M593、Y594、Y595、D596、Y597、F598、P599、D600、A601、A602、K603、M604、I605、P606、K607、C608、S609、T610、Q611、L612、K613、A614、V615、T616、A617、H618、F619、Q620、I626、L627、L628、S629、N630、N631、F632、I633、E634、P635、L636、E637、I638、I642、Y643、D644、L645、N646、N647、P648、E649、E651、P652、K653、K654、F655、Q656、W676、F679、T680、D682、F683、L684、S685、K686、Y687、T688、K689、T690、T691、S692、I693、L707、Y711、L714、N715、P716、L717、L718、Y719、H720、I721、S722、K739、W765、L768、F769、N773、T777、S778、I779、K780、L781、N782、G783、Q784、A785、E786、F871、H872、V873、P874、I875、T876、L877、N878、Y879、Q880、A881、A882、N883、S884、和Q1048。

预期这些残基中的一个或多个的突变会影响PAM识别。

选择以下氨基酸残基进行诱变，因此产生具有突变的指示的氨基酸残基的突变型Cpf1蛋白：K130、G131、L132、F133、K134、A135、E136、F162、D163、K164、F165、T166、T167、Y168、F169、S170、G171、F172、Y173、E174、N175、R176、K177、Q536、M537、P538、T539、L540、A541、S542、G543、W544、D545、V546、N547、K548、E549、K550、N551、N552、K570、Q571、K572、G573、Y595、D596、Y597、F598、P599、D600、A601、A602、K603、M604、I605、P606、K607、C608、S609、T610、Q611、L612、K613、A614、V615、N630、N631、F632、N646、N647、P648、E649、K650、E651、P652、K653、F683、L684、S685、K686、Y687、T688、K689、或T690。

在具有AsCpf1突变体文库的细菌PAM筛选中筛选以下PAM序列：TATC、TGTC、TATT、TTCC、TCCC、TTAC、TCTT、和TTGC。

下表指示发现与指示的突变体(AsCpf1)缔合的PAM序列，如在细菌PAM筛选(中间列)中鉴定的，从其假定推定的PAM(右列)。至少指示的PAM序列被指示的突变体识别。以粗体指示的是已生成和测试的突变体。基于结构考虑以及所产生的突变体的PAM序列的知识来假定其他突变体的PAM序列。

为了评估整体PAM偏好，通过体外PAM鉴定试验将变体(包括S542R/K607R(在下文中称为“RR”)、S542R/K548V(在下文中称为“RV”)和S542R/K548V/N552R(在下文中称为“RVR”))与野生型进行比较。将来自表达AsCpf1(或变体)的HEK293细胞的细胞裂解物与体外转录的crRNA和含有恒定靶的质粒DNA文库一起孵育，所述恒定靶前面是简并序列(5'-NNNNNNNN-靶标)。对于每个Cpf1变体，进行10次重复的切割反应，每次孵育不同的时间量，以确定切割动理学。

WT AsCpf1在TTTV PAM上最活跃(图13C)，并且对于NTTV、TCTV、TTCV和TTTT观察到低切割速率，与HEK293细胞中的观察一致。

图13显示了如在体外切割测定中确定的S542R/K607R AsCpf1突变体的(N)YCV(例如TYCV、VYCV、或YCV PAM)序列的验证。类似地，体外切割测定验证了AsCpf1突变体S542R/K548V的PAM序列为AYV、TYV和TGYV。还发现该突变体识别具有比野生型AsCpf1更高效率、但具有降低的特异性的典型PAM TTTV。图13C显示野生型和RR和RVR变体的所有4-碱基PAM基序的归一化切割速率。RVR变体在TATV PAM具有最高活性，相比之下WT的该PAM的活性很小或没有。这些PAM增加了人类基因组的非重复区域中Cpf1的靶向范围(图13D)并且减小了不能靶向的基因组DNA区段的大小(图13E)。

实例2-截断的指导物。

将HEK293FT细胞在24孔板中转染，每孔含有400ng AS或LbCpf1编码质粒和100ngU6::crRNA PCR片段。使用靶向DNMT1-3或DNMT1-4的指导物，所述指导物长度在24nt(全长)和14nt(从3'末端截短)之间。长度为24nt至19nt的指导物证实与两种酶具有相似的活性。使用18nt指导物略微降低活性，并使用17nt至15nt的指导物进一步降低活性。使用少于15nt的指导物观察到活性很低或没有活性。(图11B-11E)。

实例3-部分结合指导物。

将HEK293FT细胞在24孔板中转染，每孔含有400ng AS或LbCpf1编码质粒和100ngU6::crRNA PCR片段。使用靶向DNMT1-3或DNMT1-4的指导物(全长24nt)。匹配核苷酸的数目从24nt(全长)至14nt不等，并且匹配核苷酸最接近PAM，而非匹配核苷酸在3’末端。

匹配24nt至19nt的指导物显示出与两种酶具有相似的活性。使用匹配18nt的指导物，活性有所降低。匹配17nt至15nt的指导物显示活性很低或没有可检测的活性。对于匹配少于15nt的指导物，无法检测到活性。(图12B-12E)。

实例4-在哺乳动物细胞中验证Cpf1突变体。

将不同的Cpf1突变体(氨基酸球菌属物种BV3L6，基本上如Zetsche等人(2015),Cell[细胞],163:759-771中所述的)克隆到真核表达载体中(作为实例，用于评价具有S542/K607R突变的AsCpf1的表达载体在图17中提供；类似的表达载体设计用于其他Cpf1突变体)并在HEK293T细胞中转染，并且基于indel百分比来评价基因组编辑。以下Cpf1突变体产生并包含单个或多个点突变(即单个或多个氨基酸突变)。表中还指示了测试的PAM序列和围绕并包括所述氨基酸突变(来自位置539至552)的Cpf1核酸序列。

对应于图14中指示的靶序列号的靶序列在下表中指示(不是对于每个靶序列，结果示于图14中)。

针对与多种PAM序列缔合的靶序列(在DNMT1基因内选择的指导RNA靶位点)(如图14所指示的)或针对不同靶基因的多种靶序列(其与AsCpf1S542R/K607R突变体的指示的YCN PAM序列缔合)(如图15所指示的)来评价HEK细胞中％indel活性。将指示的Cpf1突变体的indel％与野生型Cpf1或阴性对照(未转染Cpf1)的indel％进行比较。

图14中的不同靶序列和靶基因在下表中指示，并且侧接PAM序列，导致S542R/K607R突变体的共有PAM序列YCN。

使用BLISS(双链断裂原位标记和测序)评价RR和RVR变体的全基因组编辑特异性，其量化跨基因组的DNA双链断裂(DSB)。为了将变体与WT进行比较，分析仅限于携带可被所有三种酶可靠地切割的PAM的靶位点；TTTV是唯一符合此标准的PAM，尽管它对RR变体的活性较低。针对评价的四个靶位点中的三个(VEGFA、GRIN2B和DNMT1)，对于WT或变体，从BLISS鉴定的座位中的任一个的深度测序未检测到脱靶活性(图19a)。对于第四个靶位点(EMX1)，BLISS鉴定了6个具有可检测indel的脱靶位点；所有6个位点都有一个TTCA PAM，并且在指导物的前19bp中不超过一个错配。与WT相比，这两种变体在这些脱靶位点具有增加的活性，这与它们识别TTCA PAM的增加的能力一致。在另一个方面中，当用已知的TTTV脱靶位点靶向不同位点时，变体表现出降低的脱靶活性(图19b)，这也与PAM偏好一致。总之，这些结果指示变体保留了与WT AsCpf1相当的高水平编辑特异性。

是否可通过去除非特异性接触(例如在带正电荷或极性残基与靶DNA之间的)来改善特异性，进行了测试。位于假设与非靶DNA链相互作用的蛋白质裂缝中的K949A与RR和RVR变体组合进行测试，K949A减少了所有脱靶位点的切割，同时保持高水平的中靶活性(图19C)。

由于Cpf1-家族酶具有强烈的序列和结构同源性，在其他Cpf1直向同源物中，AsCpf1中的S542、K548、N552和K607位置具有明确的对应性。在晶体结构的基础上，LbCpf1可以类似地被工程化以识别TYCV/CCCC和TATV PAM，例如分别通过突变G532R/K595R和G532R/K538V/Y542R。

Cpf1切割在293FT细胞中的活性

用N-末端核定位标签合成用于人类表达密码子优化的Cpf1蛋白，并通过Genscript克隆到pcDNA3.1CMV表达质粒中。使用Herculase II(安捷伦技术公司(AgilentTechnologies))生成包含驱动crRNA序列表达的U6启动子的PCR扩增子。使用Lipofectamine 2000试剂(生命技术公司(Life Technologies))将400ng Cpf1表达质粒和100ng crRNA PCR产物以75％-90％融合度转染到24孔板的HEK293FT细胞中。使用QuickExtract^TM DNA提取溶液(Epicentre公司)收获基因组DNA。

表征293FT细胞中的Cpf1 indel模式的深度测序

如所述地转染并收获HEK293FT细胞，以用于评估Cpf1切割的活性。使用两轮PCR区域来扩增侧接DNMT1靶标的基因组区域，以将Illumina P5衔接蛋白以及独特样品特异性识别码添加到靶扩增子中。在2％E-gel(英杰公司(Invitrogen))运行PCR产物并且按照制造商推荐的方案使用QiaQuick自旋柱(凯杰公司(Qiagen))进行凝胶提取。将样品合并并且通过Qubit 2.0荧光计(生命技术公司(Life Technologies))进行量化。在MiSeq(亿明达公司(Illumina))上对制备的cDNA文库进行测序。使用Geneious 6.0.3读数测绘仪的Python实现方式绘制Indel。

实例5-示例性方法

文库构建。将由T7启动子驱动的人类密码子优化的AsCpf1克隆到修饰的pACYC骨架中，并经由适合的沉默突变引入侧接选择的PAM近端AsCpf1残基的独特限制性位点。对于每个残基，诱变插入物合成为短互补寡核苷酸(整合DNA技术)，并且突变密码子被简并NNK碱基混合物(其中K＝G或T)代替。通过在非突变的相邻密码子中产生沉默突变的独特组合来对每个简并密码子位置进行识别码化，以便校正筛选读出期间的测序错误。通过盒式诱变对变体文库进行组装、微量制备、合并、并用异丙醇沉淀。

大肠杆菌阴性选择筛选。用变体文库转化NovaBlue(DE3)大肠杆菌(Novagen)，并将其铺板在含有25μg/mL氯霉素的LB琼脂上。将存活的菌落刮下并在含有25μg/mL氯霉素的ZymoBroth中培养至O.D.为0.4-0.6，并使用Mix&Go试剂盒(Zymo公司)使其成为感受态。对于筛选的每个突变体PAM，用含有突变体PAM的100ng靶质粒转化感受态大肠杆菌库，在冰上孵育15-30分钟，在42℃热激30秒，并在不存在IPTG的情况下铺板在含有100μg/mL氨苄青霉素和25μg/mL氯霉素的LB琼脂(Affymetrix)上。通过用缺乏靶位点的pUC19转化大肠杆菌获得阴性对照。通过midi-prep(凯杰公司(Qiagen))分离来自存活菌落的质粒DNA。将含有突变的区域用含有Illumina衔接体的定制引物扩增，并用600-循环MiSeq试剂盒(亿明达公司(Illumina))进行配对末端测序。通过要求以下来过滤读数：与沉默密码子识别码完美匹配；三个NNK碱基的每一个的Phred质量(Q分数)至少为30；正向和反向读数之间的一致性(如果适用)。假设TAG(终止)密码子的平均丰度等效于阴性对照，将每个变体的读数计数归一化。

体外PAM鉴定测定。如下所述，将编码AsCpf1变体的质粒转染到HEK293T细胞中。细胞裂解物用裂解缓冲液(20mM HEPES，100mM KCl，5mM MgCl₂，1mM DTT，5％甘油，0.1％Triton X-100)(补充有ETDA-游离完全蛋白酶抑制剂混合物(罗氏公司(Roche))制备。使用定制寡核苷酸和HiScribe T7体外转录试剂盒(NEB)并遵循制造商的推荐方案来体外转录crRNA。对于PAM文库，将33bp靶位点之前的简并8bp序列克隆到pUC19中的MCS中，并用AatII和LguI消化文库，并在使用前进行凝胶提取。每个体外切割反应由1μL 10x CutSmart缓冲液(NEB)、25ng PAM文库、250ng体外转录的crRNA、0.5μL的细胞裂解物和水组成，总体积为10μL。将反应在37℃孵育并通过加入50μL缓冲液PB(凯杰公司(Qiagen))淬灭，然后进行柱纯化。将纯化的DNA使用含有Illumina衔接体的定制引物，在29个总循环中用两轮PCR来扩增，并用75-循环NextSeq试剂盒(亿明达公司(Illumina))测序。对于每种Cpf1变体，分别进行体外切割反应持续1.15min、4min、10min、15min、20min、30min、40min、90min、和175min。将未修饰的简并序列文库用作0min时间点。将阴性对照(使用来自未修饰的HEK293T细胞的裂解物)在10min时取出。

PAM裂解动理学的计算分析。还参见图23-24。通过Phred质量(对于所有8个简并PAM碱基，≥30)过滤测序读数。对于每个切割反应，将4⁸个PAM序列中的每一个的耗竭率计算为(切割反应中的归一化读数计数)/(阴性对照中的归一化读数计数)。然后将每个耗竭率除以所有NNNNVRRT序列的中值耗竭率，其未被WT AsCpf1或任一变体切割。使用非线性最小二乘法将每个Cpf1变体的每个PAM序列(总共4⁸个)的耗竭率拟合到指数衰减模型x(t)＝c₀+ce^-kt，其中x(t)是在时间t处的耗竭率，并且术语c₀≤0.2和K(以min^-1计的速率常数)是参数。对于每个变体，将每个4-碱基PAM的切割速率k计算为对应于该PAM的2568-碱基序列的中值切割速率；例如，将TTTA的切割速率计算为NNNNTTTA形式的256个序列的中值切割速率。最后，调整所有切割速率，使得每种变体的任何4-碱基PAM的最高速率等于1。

细胞培养和转染。将人类胚肾293和Neuro2a细胞系在37℃维持在补充有10％FBS(Gibco公司)的Dulbecco改良的Eagle培养基中，并且用5％CO₂孵育。根据制造商推荐的方案，将细胞在转染前一天接种于24-或96孔板(科宁公司(Corning))中，密度为大约每24孔1.2x10⁵个细胞或每96孔2.4x10⁴个细胞，并以50％-80％转染使用Lipofectamine 2000(生命技术公司(Life Technologies))进行汇合。对于细胞裂解物，每24孔递送500ng的Cpf1质粒。对于HEK293T细胞中的indel分析，每24孔递送总共400ng的Cpf1质粒加100ng crRNA质粒，或每96孔递送100ng Cas9加50ng crRNA质粒。对于BLISS和Neuro2a细胞中的indel分析，每24孔递送500ng具有Cpf1和crRNA两者的质粒。所有indel和BLISS实验使用23个核苷酸的指导物长度。

indel量化。通过靶向深度测序(亿明达公司(Illumina))量化所有indel率。对于indel文库制备，在转染后大约3天收获细胞，并使用QuickExtract DNA提取试剂盒(恩皮森特公司(Epicentre))通过将沉淀的细胞重新悬浮于QuickExtract(每24孔80μL，或每96孔20μL)中提取基因组DNA，然后在65℃孵育15min，在68℃孵育15min，在98℃孵育10min。使用两轮PCR附接Illumina手柄，产生用于深度测序的扩增子。通过搜索每个扩增子与用于描绘切割位点周围50-70bp窗口的末端的链的精确匹配来从计算方面计数indel。然后将这些链之间的以bp计的距离与参考基因组中的相应距离进行比较，如果两个距离不同，则将扩增子计为indel。对于每个样品，将indel率确定为(具有indel的读数的数量)/(总读数的数量)。排除总读数少于1000的样品。在未显示阴性对照数据的情况下，indel百分比表示减去背景的最大可能性估计。具体地说，对于具有R总读数的样品，其中n≤R是indel，并且假阳性率0≤α≤1(如通过阴性对照所确定的)，真实的插入率估计为最大{0,[(n/R)-α]/(1-α)}。

Cpf1靶向范围的计算分析。将完整的GRCh38人类基因组装配和编码序列(具有被掩盖的重复和低复杂性区域)从Ensembl下载并如图28所述进行分析。

BLISS。如前所述进行所有BLISS实验和分析。对Cpf1的交错切割位点的数据分析从先前的分析略微修改以增加灵敏度。先前，为了区分真实核酸酶诱导事件与DSB热点、着丝粒和端粒中的背景DSB，基于重叠小于-6bp的成对读数的部分使用截止值。根据Cas9脱靶分析的经验数据，将该截止值设定为0.95。为了适应由Cpf1的交错切割位点产生的变异，发现通过将该截止值放宽至0.85，可以发现对真实Cpf1脱靶的更高灵敏度。所有其他分析，例如指导物同源性评分计算，如所述。

样品量和统计数据。每次测量的样品大小为：对于细菌菌落计数，n＝3(图19C)；对于组合诱变(图20A)和对于BLISS座位的indel(图21A)，n＝4；对于所有其他indel数据，n＝2或n＝3。所有图中的误差条显示平均值的标准误差。

质粒和指导序列。本研究中使用的质粒和指导序列的列表可以在表20-21中找到。

实例6-具有改变的PAM特异性的工程化Cpf1变体

基于与crRNA和靶DNA复合的AsCpf1的晶体结构，选择在PAM双链体附近的AsCpf1中的60个残基进行靶向诱变(图19A和表17)。通过使用盒式诱变在每个位置随机化密码子来构建在这些残基处编码大多数单个氨基酸取代的AsCpf1变体的质粒文库。密码子随机化的使用允许比易错PCR获得更大的突变覆盖，并且进一步防止由模板序列引起的代表性偏倚。

使用大肠杆菌中基于质粒干扰的耗竭筛选以鉴定该文库内具有非典型PAM的切割活性的变体(图19A)。在该测定中，用携带氨苄青霉素抗性基因的第二质粒和携带突变型PAM的靶位点转化大肠杆菌的库，每个大肠杆菌表达crRNA和来自用氯霉素维持的质粒的Cpf1变体。当在氨苄青霉素选择性培养基上生长时，成功的靶切割导致氨苄青霉素抗性丧失和随后的细胞死亡。通过将原始文库与存活细菌中携带Cpf1的质粒DNA的序列进行比较，确定了由于突变型PAM的新颖切割活性而耗竭的变体。

为了有效地使用该方法来区分具有来自野生型(WT)AsCpf1的非典型PAM活性的变体，使用WT AsCpf1具有最小活性的PAM序列通过新颖变体确定活性的动态范围。评价WTAsCpf1对PAM中取代突变的灵敏度，如由于成功的质粒干扰导致的大肠杆菌死亡所确定的，侧重于具有单核苷酸取代的PAM(即，NTTV、TNTV和TTNV，其中V被任意选择为C)。

当用NTTC和TCTC PAM转化时，表达WT AsCpf1的大肠杆菌在氨苄青霉素培养基上的存活率可忽略不计(图19C)，表明这些PAM序列支持AsCpf1介导的DNA质粒切割并且不能用于筛选变体文库。相反，其他五个具有单个突变(TATC、TGTC、TTAC、TTCC和TTGC)的PAM具有显著的存活率。针对在这五种PAM以及具有双突变(TCCC)的另外的PAM中的活性，筛选AsCpf1变体文库(图19D)。

在深度测序读出后，在靶向残基位置处约86％的可能变体用pUC19-转化的阴性对照中的至少15个读数表示，以允许评估它们在用新颖PAM和靶标转化的相应样品中的耗竭。对于TATC、TGTC、TTCC和TCCC PAM，文库中至少一个AsCpf1变体高度耗竭(≥15倍)(图19D和表18)。对于TATC和TGTC，许多耗竭的变体位于Lys548(一种与PAM双链体形成氢键的保守残基)。对于TTCC和TCCC也观察到许多命中，最显著的是Ser542(一种非保守残基)处的精氨酸取代。

将在HEK293T细胞中筛选的鉴定的变体的活性通过将它们靶向两个基因(DNMT1和VEGFA)中的内源位点来评价细胞(图20A和图22A)。测试的大多数变体在靶位点产生indel及其相应的PAM；具体地说，K548V在TATC靶位点处最活跃，而S542R显著增加两个TTCC靶位点以及TCCC位点的活性。将顶部单个氨基酸突变组合成双突变体和三突变体进一步改善了活性(图20A和图22B)。选择具有最高活性的变体S542R/K607R(下文称为RR)和S542R/K548V/N552R(下文称为RVR)进行进一步研究。

通过调整先前描述的体外PAM鉴定测定来评价RR和RVR变体的整体PAM偏好以及与WT AsCpf1的比较(图20B)。将来自表达AsCpf1的HEK293T细胞(或工程化的变体)的细胞裂解物与体外转录的crRNA和含有恒定靶的质粒DNA文库一起孵育，所述恒定靶前面是简并序列(5'-NNNNNNNN-靶标)。通过对完整底物进行扩增和深度测序并与阴性对照比较来确定成功切割的序列。对于每个Cpf1变体，并行进行9次反应，每次孵育不同的时间量，以确定切割动理学(参见方法和图23-24)。

如预期的，WT AsCpf1在TTTV PAM中最活跃(图20C-20D)并且在TTTT具有较低的活性，这支持了先前报道的WT PAM作为TTTV的定义。WT还以低速率切割包括NTTV、TCTV和TTCV在内的其他序列，这与我们在HEK293T细胞(图25)和大肠杆菌中的观察结果一致。相反，RR和RVR变体在TYCV(其中Y可以是C或T)和TATV PAM处分别具有最高活性，而在那些PAM中WT的活性很小或没有(图20C-20D)。变体PAM没有严格定义为WT的变体：RR变体还切割ACCC和CCCC PAM(并且在较小程度上，切割VYCV)，并且RVR变体也切割RATR PAM(其中R可以是A或G)。

为了评估新颖PAM活性的稳健性，在HEK293T细胞中不同组的内源靶位点上研究了RR和RVR变体在其优选的PAM上的活性(即分别为TYCV和TATV)(图20E和图26)。RR和RVR变体分别在20个TYCV位点中的14个(70％)和23个TATV位点中的18个(78％)获得>50％indel，而在大多数这些位点上WT AsCpf1的活性很少或没有(对于这两种变体，p<0.0001)。相比之下，WT AsCpf1在23个TTTV位点中的8个(35％)实现了>50％indel。这些数据表明，在它们各自优选的PAM中，变体具有与WT核酸酶相当或略高的活性(图20E)。RR变体还在小鼠Neuro2a细胞中显示出显著的编辑速率(对于9个TYCV位点中的6个，>20％indel)(图27)。

由于观察到RR变体在体外切割VYCV PAM，尽管速率低于TYCV，但是在HEK293T细胞中的单独的VYCV位点处测试了RR变体的活性(图25)。在评估的四个基因(CFTR、DNMT1、EMX1和VEGFA)中，RR变体在36个VYCV位点中有24个(67％)获得>20％indel，表明必要时，具有VYCV PAM的靶位点也可以考虑用RR变体进行编辑。

进行人类基因组中PAM序列分布的计算分析，以量化Cpf1 PAM变体对CRISPR-Cpf1系统靶向范围的影响(图20F和图28)。当仅考虑最活跃的PAM时，变体和WT共同将Cpf1的靶向范围扩展至人类编码序列中每约11bp的一个靶位点(对应于相对于单独WT的3倍增加)并且将中值距离减少到3bp的最近的切割位点。此外，当考虑更广泛定义的一组有效可切割的PAM(特别是优选的PAM加MCCC和RATR，其中M可以是A或C)时，靶向范围在人类编码序列中进一步扩展到每约7bp一个位点，与最近的切割位点的中值距离为2bp。

使用BLISS(双链断裂原位标记和测序)来评价RR和RVR变体的全基因组编辑特异性，其量化了跨基因组的DNA双链断裂(DSB)。为了将变体与WT进行公平比较，选择携带可被所有三种酶可靠地切割的PAM的靶位点；TTTV是唯一符合此标准的PAM，尽管它对RR变体的活性较低。针对评价的四个靶位点中的三个(VEGFA、GRIN2B和DNMT1)，对于核酸酶中的任一个，从BLISS鉴定的座位的深度测序未检测到脱靶活性(图21A)。对于第四个靶位点(EMX1)，BLISS鉴定了六个具有可检测indel的脱靶位点；所有六个位点都有一个TTCA PAM，并且在指导物的前19个核苷酸中不超过一个错配。如预期的，与WT相比，这两种变体在这些脱靶位点具有增加的活性，这与它们识别TTCA PAM的增加的能力一致。在另一个方面中，当用已知的TTTV脱靶位点靶向RPL32P3基因中的位点时，这些变体表现出降低的脱靶活性(图21B)，这也与PAM偏好一致。总之，这些结果指示变体保留了与WT AsCpf1相当的高水平编辑特异性。

是否可通过去除非特异性接触(例如在带正电荷或极性残基与靶DNA之间的)来改善AsCpf1的特异性，进行了研究。K949A被靶向为候选物，因为它位于假设其与非靶DNA链相互作用的蛋白质的裂缝中(图29)。当与RR和RVR变体组合时，K949A减少了评估的所有脱靶位点处的切割(图21C)，同时保持高水平的中靶活性(图21D)。

由于Cpf1-家族核酸内切酶具有强烈的序列和结构同源性，在其他Cpf1直向同源物中，AsCpf1中的S542、K548、N552和K607位置具有清除的对应性(图30和表19)。基于序列比对和晶体结构，假设LbCpf1也可以通过分别引入突变G532R/K595R和G532R/K538V/Y542R而被工程化以识别TYCV和TATV PAM(图31A)。这些突变以预测的方式改变了LbCpf1的PAM特异性(图31B和图32)，表明它们可能通常适用于Cpf1直向同源物。

***

本发明进一步通过如下编号段落进行描述：

1.一种突变型Cpf1多肽，该多肽包含一个或多个影响PAM识别的突变。

2.根据段落1所述的突变型Cpf1多肽，其中所述突变型Cpf1多肽识别不被相应的野生型Cpf1识别的PAM序列。

3.一种突变型Cpf1多肽，该多肽具有一个或多个突变，其中所述突变型Cpf1蛋白识别不被相应的野生型Cpf1识别的PAM序列。

4.一种突变型Cpf1多肽，该多肽具有一个或多个突变并识别由除N以外的少于4个核苷酸组成的PAM，条件是所述突变型Cpf1不是突变型FnCpf1。

5.一种突变型Cpf1多肽，该多肽识别具有序列YCN、(T)YCV、AYV、TYV、RYN、或RCN，或者具有序列TNYC或TNYS的PAM，条件是所述PAM不是TTTV，和/或所述PAM不是TTTC，和/或所述PAM不是TCTS，优选地其中所述PAM具有或包含以下序列：(T)YCV或RYN；AYV或TYV；YCN或RCN。

6.一种突变型Cpf1多肽，该多肽识别具有或包含以下序列的PAM：YCN、YCV、AYV、TYV、RYN、RCN、TGYV、NTTN、TTN、TRTN、TYTV、TYCT、TYCN、TRTN、NTTN、TACT、TYCC、TRTC、TATV、NTTV、TTV、TSTG、TVTS、TYYS、TCYS、TBYS、TCYS、TNYS、TYYS、TNTN、TSTG、TTCC、TCCC、TATC、TGTG、TCTG、TYCV、或TCTC。

7.根据段落1至6中任一项所述的突变型Cpf1，其中所述突变型Cpf1是突变型AsCpf1或突变型LbCpf1。

8.一种突变型Cpf1，优选地根据段落1至7中任一项所述的突变型Cpf1，其中所述突变型Cpf1包含以下位置处的一个或多个突变型氨基酸残基：位置11、12、13、14、15、16、17、34、36、39、40、43、46、47、50、54、57、58、111、126、127、128、129、130、131、132、133、134、135、136、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、532、533、534、535、536、537、538、539、540、541、542、543、544、545、546、547、548、549、550、551、552、553、554、555、556、565、566、567、568、569、570、571、572、573、574、575、592、593、594、595、596、597、598、599、600、601、602、603、604、605、606、607、608、609、610、611、612、613、614、615、616、617、618、619、620、626、627、628、629、630、631、632、633、634、635、636、637、638、642、643、644、645、646、647、648、649、651、652、653、654、655、656、676、679、680、682、683、684、685、686、687、688、689、690、691、692、693、707、711、714、715、716、717、718、719、720、721、722、739、765、768、769、773、777、778、779、780、781、782、783、784、785、786、871、872、873、874、875、876、877、878、879、880、881、882、883、884、或1048；优选地，包含以下位置处的一个或多个突变型氨基酸残基：位置130、131、132、133、134、135、136、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、536、537、538、539、540、541、542、543、544、545、546、547、548、549、550、551、552、570、571、572、573、595、596、597、598、599、600、601、602、603、604、605、606、607、608、609、610、611、612、613、614、615、630、631、632、646、647、648、649、650、651、652、653、683、684、685、686、687、688、689、或690；更优选地，包含AsCpf1的位置539、542、547、548、550、551、552、167、604、和/或607处或者AsCpf1直向同源物、同源物、或变体的相应位置处的一个或多个突变型氨基酸残基，优选位置542或542和607处的突变型氨基酸残基，其中所述突变优选地是542R和607R，例如S542R和K607R；或优选地包含位置542和548(以及任选地552)处的突变型氨基酸残基，其中所述突变优选地是542R和548V(以及任选地552R)，例如S542R和K548V(以及任选地N552R)；或LbCpf1的位置532、538、542、和/或595处或者AsCpf1直向同源物、同源物、或变体的相应位置处，优选地位置532或532和595处的突变型氨基酸残基，其中所述突变优选地是532R和595R，例如G532R和K595R；或优选地包含位置532和538(以及任选地542)处的突变型氨基酸残基，其中所述突变优选地是532R和538V(以及任选地542R)，例如G532R和K538V(以及任选地Y542R)，最优选地其中所述突变是AsCpf1的S542R和K607R、S542R和K548V、或S542R、K548V和N552R。

9.根据段落1至8中任一项所述的突变型Cpf1多肽，该多肽进一步包含影响Cpf1催化活性和/或Cpf1稳定性的修饰或突变。

10.根据段落1至9中任一项所述的突变型Cpf1多肽，该多肽包含在具有功能结构域的融合蛋白中。

11.根据段落10所述的突变型Cpf1多肽，其中所述功能结构域包含激活因子结构域、阻遏物结构域、重组酶、转座酶、组蛋白重塑物、DNA甲基转移酶、隐花色素、光可诱导/可控结构域、或化学可诱导/可控结构域。

12.根据段落1至11中任一项所述的突变型Cpf1多肽，该多肽不能诱导DNA双链断裂。

13.根据段落1至12中任一项所述的突变型Cpf1多肽，该多肽是切口酶。

14.根据段落1至13中任一项所述的突变型Cpf1多肽，该多肽是无催化活性的Cpf1多肽。

15.根据段落1至14中任一项所述的突变型Cpf1多肽，该多肽不能诱导DNA单链断裂。

16.一种多核苷酸，该多核苷酸编码根据段落1至15中任一项所述的突变型Cpf1多肽。

17.根据段落16所述的多核苷酸，该多核苷酸经密码子优化用于在目的细胞中表达。

18.根据段落16或17所述的多核苷酸，其中所述多核苷酸进一步包含编码一个或多个NLS的一个或多个序列。

19.一种载体，该载体包含根据段落16至18中任一项所述的多核苷酸。

20.根据段落19所述的载体，该载体是表达载体。

21.根据段落19或20所述的载体，该载体是诱导型、条件型或组成型表达载体。

22.一种载体系统，该载体系统包含一种或多种载体，所述一种或多种载体包含根据段落16至18中任一项所述的多核苷酸，并且在相同或不同的载体上包含编码指导物的一种或多种多核苷酸。

23.根据段落22所述的载体系统，其中所述一种或多种载体是表达载体。

24.一种复合物，该复合物包含指导物和根据段落1至15中任一项所述的突变型Cpf1多肽。

25.根据段落22至24中任一项所述的载体系统或复合物，其中所述指导物包含指导序列和同向重复序列。

26.根据段落22至25中任一项所述的载体系统或复合物，其中所述指导物包含含有3'指导序列和5'同向重复序列的多核苷酸序列。

27.根据段落22至26中任一项所述的载体系统或复合物，其中所述指导序列能够与靶DNA序列杂交。

28.根据段落22至27中任一项所述的载体系统或复合物，其中修饰所述指导序列以改变功能性、特异性和/或稳定性。

29.根据段落22至28中任一项所述的载体系统或复合物，其中所述突变型Cpf1能够结合所述指导物。

30.根据段落22至29中任一项所述的载体系统或复合物，其中所述突变型Cpf1能够与所述指导物形成复合物，并且其中所述复合物能够在与靶DNA座位结合后修饰或靶向所述靶DNA座位。

31.根据段落22至30中任一项所述的载体系统或复合物，其中所述突变型Cpf1能够与所述指导物形成复合物并且影响所述复合物与靶DNA座位的序列特异性结合。

32.一种递送系统，该递送系统包含根据段落1至31中任一项所述的多肽、多核苷酸、载体、载体系统、或复合物。

33.根据段落32所述的递送系统，其中所述递送系统是脂质体、颗粒、外泌体、微泡、基因枪、或病毒递送系统。

34.一种宿主细胞，该宿主细胞包含根据段落1至33中任一项所述的突变型Cpf1多肽、多核苷酸、载体、载体系统、复合物、或递送系统。

35.一种宿主细胞，该宿主细胞表达或能够表达根据段落1至15中任一项所述的突变型Cpf1多肽。

36.根据段落34和35中任一项所述的宿主细胞，该宿主细胞是原核或真核宿主细胞。

37.根据段落34至36中任一项所述的宿主细胞，该宿主细胞是分离的宿主细胞。

38.一种组合物，该组合物包含根据段落1至37中任一项所述的突变型Cpf1多肽、多核苷酸、载体、载体系统、复合物、递送系统、或宿主细胞。

39.一种试剂盒，该试剂盒包含根据段落1至38中任一项所述的突变型Cpf1多肽、多核苷酸、载体、载体系统、复合物、递送系统、宿主细胞、或组合物。

40.一种转基因生物，该转基因生物包含根据段落1至38中任一项所述的突变型Cpf1多肽、多核苷酸、载体、载体系统、复合物、递送系统、宿主细胞、或组合物。

41.一种转基因生物，该转基因生物表达或能够表达根据段落1至15中任一项所述的突变型Cpf1多肽。

42.一种修饰或靶向靶DNA座位的方法，该方法包括向所述座位递送根据段落1至33中任一项所述的多肽、多核苷酸、载体、载体系统、递送系统、或复合物。

43.一种修饰或靶向靶DNA座位的方法，该方法包括向所述座位递送根据段落38所述的组合物。

44.一种修饰或靶向靶DNA座位的方法，该方法包括向所述座位递送根据段落1至15中任一项所述的突变型Cpf1多肽、或编码所述突变型Cpf1的多核苷酸、和指导物、或编码指导RNA的多核苷酸，其中所述突变型Cpf1多肽与所述指导物形成复合物，并且其中所述靶DNA座位在所述复合物与所述靶DNA座位结合后被修饰或靶向。

45.根据段落42至44中任一项所述的方法，其中所述修饰或靶向靶座位包括诱导DNA链断裂。

46.根据段落42至45中任一项所述的方法，其中所述修饰或靶向靶座位包括诱导DNA双链断裂。

47.根据段落42至46中任一项所述的方法，其中所述修饰或靶向靶座位包括改变一种或多种基因的基因表达。

48.根据段落42至47中任一项所述的方法，其中所述修饰或靶向靶座位包括所述靶DNA座位的表观遗传修饰。

49.根据段落42至48中任一项所述的方法，该方法是通过操纵目的基因组座位处的一个或多个靶序列来修饰细胞、细胞系或生物体的方法。

50.一种来自根据段落49所述的方法的细胞或其子代，其中该细胞包含在未经受该方法的细胞中不存在的修饰。

51.根据段落50所述的细胞或其子代，其中未经受该方法的该细胞包含异常并且来自该方法的该细胞的该异常已得到解决或校正。

52.一种来自根据段落50所述的细胞或其子代的细胞产物，其中相对于来自未经受该方法的细胞的细胞产物，该产物在性质或量方面得到修饰。

53.根据段落52所述的细胞产物，其中未经受该方法的该细胞包含异常并且该细胞产物反映了该异常已通过该方法解决或校正。

54.一种鉴定突变型Cpf1多肽的方法，该突变型Cpf1多肽具有一个或多个影响PAM识别的突变，该方法包括以下步骤

(a)提供宿主细胞

-包含或表达gRNA，

55.根据段落54所述的方法，该方法包括以下步骤

56.根据段落54或55所述的方法，其中所述特定PAM序列不被相应的野生型Cpf1识别。

57.根据段落54或56中任一项所述的方法，其中所述宿主细胞是原核或真核宿主细胞。

58.根据段落54至57中任一项所述的方法，其中所述选择标记是阳性或阴性选择标记。

59.根据段落54至58中任一项所述的方法，其中所述选择标记是抗生素抗性基因。

60.根据段落54至59中任一项所述的方法，其中所述突变型Cpf1多肽具有催化活性。

61.根据段落54至58中任一项所述的方法，其中步骤(a)、(a1)、或(a2)中的所述宿主细胞是宿主细胞文库。

62.根据段落61所述的方法，其中所述宿主细胞文库包含候选突变型Cpf1多肽的文库，所述多肽具有一个或多个影响PAM识别的突变。

63.根据段落61所述的方法，其中所述宿主细胞文库包含多核苷酸的PAM文库。

64.根据段落54至63中任一项所述的方法，其中步骤(a)或(b1)中的所述多核苷酸是多核苷酸的PAM文库。

65.根据段落54至63中任一项所述的方法，其中步骤(a)或(b2)中的具有一个或多个影响PAM识别的突变的所述候选突变型Cpf1多肽是Cpf1突变体文库。

66.一种突变型Cpf1多肽，该多肽通过根据段落54至65中任一项所述的方法鉴定。

67.一种多核苷酸，该多核苷酸编码根据段落66所述的突变型多肽。

68.根据段落1至38、66或67中任一项所述的多肽、多核苷酸、载体、载体系统、复合物、递送系统、宿主细胞、或组合物用于优选地在体外或离体修饰或靶向DNA靶座位的用途。

69.根据段落1至38、66或67中任一项所述的多肽、多核苷酸、载体、载体系统、复合物、递送系统、或宿主细胞用于优选地在体外或离体基因组编辑的用途。

70.根据段落1至38、66或67中任一项所述的多肽、多核苷酸、载体、载体系统、复合物、递送系统、宿主细胞、或组合物，用于在修饰或靶向DNA靶座位中使用。

71.根据段落1至38、66或67中任一项所述的多肽、多核苷酸、载体、载体系统、复合物、递送系统、宿主细胞、或组合物，用于在基因组编辑中使用。

72.根据段落1至38、66或67中任一项所述的多肽、多核苷酸、载体、载体系统、复合物、递送系统、宿主细胞、或组合物，用于在疗法中使用。

73.根据段落1至38、66或67中任一项所述的多肽、多核苷酸、载体、载体系统、复合物、递送系统、宿主细胞、或组合物，用于制造药物。

74.一种工程化的、非天然存在的成簇规律间隔短回文重复序列(CRISPR)-CRISPR相关(Cas)(CRISPR-Cas)系统，该系统包含

a)一种或多种包含指导物的V型CRISPR-Cas多核苷酸序列，该指导物包含连接至同向重复序列的指导序列，其中该指导序列能够与靶序列杂交，或者一种或多种编码该一种或多种V型CRISPR-Cas多核苷酸序列的核苷酸序列，以及

b)Cpf1效应蛋白或者编码该Cpf1效应蛋白的一种或多种核苷酸序列；

其中该一种或多种指导序列与所述靶序列杂交，所述靶序列是原型间隔区相邻基序(PAM)的3’，并且所述指导物与该Cpf1效应蛋白形成复合物；其中Cpf1效应物包含根据段落1至15中任一项所述的突变型Cpf1多肽。

75.一种工程化的、非天然存在的成簇规律间隔短回文重复序列(CRISPR)-CRISPR相关(Cas)(CRISPR-Cas)载体系统，该载体系统包含一种或多种编码根据段落1所述的非天然存在的成簇规律间隔短回文重复序列(CRISPR)-CRISPR相关(Cas)(CRISPR-Cas)系统的载体，该载体系统包含

a)可操作地连接至一种或多种核苷酸序列的第一调节元件，该一种或多种核苷酸序列编码包含指导RNA的一种或多种V型CRISPR-Cas多核苷酸序列，该指导RNA包含连接至同向重复序列的指导序列，其中该指导序列能够与靶序列杂交，

b)可操作地连接至编码Cpf1效应蛋白的核苷酸序列的第二调节元件；

其中组分(a)和(b)位于该系统的相同或不同的载体上，其中当转录时，该一种或多种指导序列与所述靶序列杂交，所述靶序列是原型间隔区相邻基序(PAM)的3’，并且所述指导物与该Cpf1效应蛋白形成复合物；其中Cpf1效应物包含根据段落1至15中任一项所述的突变型Cpf1多肽。

76.一种产生具有由目的基因编码的修饰的目的性状的植物的方法，所述方法包括将植物细胞与根据段落74或75所述的系统接触或者使该植物细胞经受根据段落44所述的方法，由此修饰或引入所述目的基因并且由所述植物细胞再生植物。

77.一种鉴定植物中目的性状的方法，所述目的性状由目的基因编码，所述方法包括将植物细胞与根据段落74或75所述的系统接触或者使该植物细胞经受根据段落44所述的方法，由此鉴定所述目的基因。

78.根据段落77所述的方法，该方法进一步包括将该鉴定的目的基因引入到植物细胞或植物细胞系或植物种质中以及由其生成植物，由此该植物含有该目的基因。

79.根据段落78所述的方法，其中该植物展现出该目的性状。

80.一种粒子，该粒子包含根据段落74或75所述的系统。

81.根据段落80所述的粒子，其中该粒子含有与该指导物复合的Cpf1效应蛋白。

82.根据段落74、75或44所述的系统或方法，其中该复合物、指导物或蛋白质被轭合至至少一种糖部分，任选地是N-乙酰半乳糖胺(GalNAc)，具体地是三触角GalNAc。

83.根据段落74、75或44所述的系统或方法，其中Mg²⁺的浓度是约1mM至约15mM。

84.根据段落74、75或44所述的系统或方法，其中该Cpf1效应蛋白与胞苷脱氨酶融合。

85.根据段落84所述的系统或方法，其中该胞苷脱氨酶与该Cpf1效应蛋白的羧基末端融合。

86.根据段落84或85所述的系统或方法，其中该Cpf1效应蛋白或该胞苷脱氨酶进一步与尿嘧啶DNA糖基化酶抑制剂融合。

87.根据段落84-86中任一项所述的系统或方法，其中该Cpf1效应蛋白包含无催化活性的Nuc结构域。

88.根据段落84-87中任一项所述的系统或方法，其中该Cpf1效应蛋白包含无催化活性的RuvC结构域。

89.根据段落84-88中任一项所述的系统或方法，其中该指导物与该Cpf1效应蛋白形成复合物并指导该复合物结合靶DNA，并且其中该胞苷脱氨酶将该靶DNA的非靶向链中的C转化为U。

90.根据段落74所述的系统，该系统包含多种指导RNA，每种指导RNA包含不同的指导序列，其中该多种指导序列能够与多种不同的靶序列杂交。

91.根据段落75所述的系统，其中该一种或多种载体编码多种指导RNA，每种指导RNA包含不同的指导序列，其中该多种指导序列能够与多种不同的靶序列杂交。

92.根据段落44所述的方法，该方法包括向多种不同的目的靶座位中的每一个递送不同的核酸组分。

93.根据段落74、75或44所述的系统或方法，其中该Cpf1效应蛋白是包含无催化活性的RuvC结构域的无效Cpf1。

94.根据段落93所述的系统或方法，其中该Cpf1效应蛋白与异源功能结构域融合，该异源功能结构域具有甲基化酶活性、去甲基化酶活性、转录激活活性、转录抑制活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性、DNA切割活性、或核酸结合活性。

95.根据段落93所述的系统或方法，其中该Cpf1效应蛋白与转录激活结构域或转录抑制结构域融合。

虽然已经在本文示出并描述了本发明的优选实施例，但是对本领域的普通技术人员而言应该显而易见是这样的实施例仅以举例方式提供。在不背离本发明的情况下众多变化、改变和替代现在将被本领域的普通技术人员想到。应该理解的是，本文所述的本发明的实施例的不同替代方案可以用于实践本发明。预期的是以下权利要求书限定了本发明的范围以及由此覆盖在这些权利要求和它们的等效物的范围内的方法和结构。

Claims

2.根据权利要求1所述的突变型Cpf1多肽，其中所述突变型Cpf1多肽识别不被相应的野生型Cpf1识别的PAM序列。

7.根据权利要求1至6中任一项所述的突变型Cpf1，其中所述突变型Cpf1是突变型AsCpf1或突变型LbCpf1。

8.一种突变型Cpf1，优选地根据权利要求1至7中任一项所述的突变型Cpf1，其中所述突变型Cpf1包含以下位置处的一个或多个突变型氨基酸残基：位置11、12、13、14、15、16、17、34、36、39、40、43、46、47、50、54、57、58、111、126、127、128、129、130、131、132、133、134、135、136、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、532、533、534、535、536、537、538、539、540、541、542、543、544、545、546、547、548、549、550、551、552、553、554、555、556、565、566、567、568、569、570、571、572、573、574、575、592、593、594、595、596、597、598、599、600、601、602、603、604、605、606、607、608、609、610、611、612、613、614、615、616、617、618、619、620、626、627、628、629、630、631、632、633、634、635、636、637、638、642、643、644、645、646、647、648、649、651、652、653、654、655、656、676、679、680、682、683、684、685、686、687、688、689、690、691、692、693、707、711、714、715、716、717、718、719、720、721、722、739、765、768、769、773、777、778、779、780、781、782、783、784、785、786、871、872、873、874、875、876、877、878、879、880、881、882、883、884、或1048；优选地，包含以下位置处的一个或多个突变型氨基酸残基：位置130、131、132、133、134、135、136、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、536、537、538、539、540、541、542、543、544、545、546、547、548、549、550、551、552、570、571、572、573、595、596、597、598、599、600、601、602、603、604、605、606、607、608、609、610、611、612、613、614、615、630、631、632、646、647、648、649、650、651、652、653、683、684、685、686、687、688、689、或690；更优选地，包含AsCpf1的位置539、542、547、548、550、551、552、167、604、和/或607处或者AsCpf1直向同源物、同源物、或变体的相应位置处的一个或多个突变型氨基酸残基，优选位置542或542和607处的突变型氨基酸残基，其中所述突变优选地是542R和607R，例如S542R和K607R；或优选地包含位置542和548(以及任选地552)处的突变型氨基酸残基，其中所述突变优选地是542R和548V(以及任选地552R)，例如S542R和K548V(以及任选地N552R)；或LbCpf1的位置532、538、542、和/或595处或者AsCpf1直向同源物、同源物、或变体的相应位置处，优选地位置532或532和595处的突变型氨基酸残基，其中所述突变优选地是532R和595R，例如G532R和K595R；或优选地包含位置532和538(以及任选地542)处的突变型氨基酸残基，其中所述突变优选地是532R和538V(以及任选地542R)，例如G532R和K538V(以及任选地Y542R)，最优选地其中所述突变是AsCpf1的S542R和K607R、S542R和K548V、或S542R、K548V和N552R。

9.根据权利要求1至8中任一项所述的突变型Cpf1多肽，该多肽进一步包含影响Cpf1催化活性和/或Cpf1稳定性的修饰或突变。

10.根据权利要求1至9中任一项所述的突变型Cpf1多肽，该多肽包含在具有功能结构域的融合蛋白中。

11.根据权利要求10所述的突变型Cpf1多肽，其中所述功能结构域包含激活因子结构域、阻遏物结构域、重组酶、转座酶、组蛋白重塑物、DNA甲基转移酶、隐花色素、光可诱导/可控结构域、或化学可诱导/可控结构域。

12.根据权利要求1至11中任一项所述的突变型Cpf1多肽，该多肽不能诱导DNA双链断裂。

13.根据权利要求1至12中任一项所述的突变型Cpf1多肽，该多肽是切口酶。

14.根据权利要求1至13中任一项所述的突变型Cpf1多肽，该多肽是无催化活性的Cpf1多肽。

15.根据权利要求1至14中任一项所述的突变型Cpf1多肽，该多肽不能诱导DNA单链断裂。

16.一种多核苷酸，该多核苷酸编码根据权利要求1至15中任一项所述的突变型Cpf1多肽。

17.根据权利要求16所述的多核苷酸，该多核苷酸经密码子优化用于在目的细胞中表达。

18.根据权利要求16或17所述的多核苷酸，其中所述多核苷酸进一步包含编码一个或多个NLS的一个或多个序列。

19.一种载体，该载体包含根据权利要求16至18中任一项所述的多核苷酸。

20.根据权利要求19所述的载体，该载体是表达载体。

21.根据权利要求19或20所述的载体，该载体是诱导型、条件型或组成型表达载体。

22.一种载体系统，该载体系统包含一种或多种载体，所述一种或多种载体包含根据权利要求16至18中任一项所述的多核苷酸，并且在相同或不同的载体上包含编码gRNA的一种或多种多核苷酸。

23.根据权利要求22所述的载体系统，其中所述一种或多种载体是表达载体。

24.一种复合物，该复合物包含根据权利要求1至15中任一项所述的突变型Cpf1多肽和gRNA。

25.根据权利要求22至24中任一项所述的载体系统或复合物，其中所述指导物包含指导序列和同向重复序列。

26.根据权利要求22至25中任一项所述的载体系统或复合物，其中所述gRNA包含含有3'指导序列和5'同向重复序列的多核苷酸序列。

27.根据权利要求22至26中任一项所述的载体系统或复合物，其中所述指导序列能够与靶DNA序列杂交。

28.根据权利要求22至27中任一项所述的载体系统或复合物，其中修饰所述指导序列以改变功能性、特异性和/或稳定性。

29.根据权利要求22至28中任一项所述的载体系统或复合物，其中所述突变型Cpf1能够结合所述gRNA。

30.根据权利要求22至29中任一项所述的载体系统或复合物，其中所述突变型Cpf1能够与所述gRNA形成复合物，并且其中所述复合物能够在与靶DNA座位结合后修饰或靶向所述靶DNA座位。

31.根据权利要求22至30中任一项所述的载体系统或复合物，其中所述突变型Cpf1能够与所述gRNA形成复合物并且影响所述复合物与靶DNA座位的序列特异性结合。

32.一种递送系统，该递送系统包含根据权利要求1至31中任一项所述的多肽、多核苷酸、载体、载体系统、或复合物。

33.根据权利要求32所述的递送系统，其中所述递送系统是脂质体、颗粒、外泌体、微泡、基因枪、或病毒递送系统。

34.一种宿主细胞，该宿主细胞包含根据权利要求1至33中任一项所述的突变型Cpf1多肽、多核苷酸、载体、载体系统、复合物、或递送系统。

35.一种宿主细胞，该宿主细胞表达或能够表达根据权利要求1至15中任一项所述的突变型Cpf1多肽。

36.根据权利要求34和35中任一项所述的宿主细胞，该宿主细胞是原核或真核宿主细胞。

37.根据权利要求34至36中任一项所述的宿主细胞，该宿主细胞是分离的宿主细胞。

38.一种组合物，该组合物包含根据权利要求1至37中任一项所述的突变型Cpf1多肽、多核苷酸、载体、载体系统、复合物、递送系统、或宿主细胞。

39.一种试剂盒，该试剂盒包含根据权利要求1至38中任一项所述的突变型Cpf1多肽、多核苷酸、载体、载体系统、复合物、递送系统、宿主细胞、或组合物。

40.一种转基因生物，该转基因生物包含根据权利要求1至38中任一项所述的突变型Cpf1多肽、多核苷酸、载体、载体系统、复合物、递送系统、宿主细胞、或组合物。

41.一种转基因生物，该转基因生物表达或能够表达根据权利要求1至15中任一项所述的突变型Cpf1多肽。

42.一种修饰或靶向靶DNA座位的方法，该方法包括向所述座位递送根据权利要求1至33中任一项所述的多肽、多核苷酸、载体、载体系统、递送系统、或复合物。

43.一种修饰或靶向靶DNA座位的方法，该方法包括向所述座位递送根据权利要求38所述的组合物。

44.一种修饰或靶向靶DNA座位的方法，该方法包括向所述座位递送根据权利要求1至15中任一项所述的突变型Cpf1多肽、或编码所述突变型Cpf1的多核苷酸、和gRNA、或编码所述gRNA的多核苷酸，其中所述突变型Cpf1多肽与所述gRNA形成复合物，并且其中所述靶DNA座位在所述复合物与所述靶DNA座位结合后被修饰或靶向。

45.根据权利要求42至44中任一项所述的方法，其中所述修饰或靶向靶座位包括诱导DNA链断裂。

46.根据权利要求42至45中任一项所述的方法，其中所述修饰或靶向靶座位包括诱导DNA双链断裂。

47.根据权利要求42至46中任一项所述的方法，其中所述修饰或靶向靶座位包括改变一种或多种基因的基因表达。

48.根据权利要求42至47中任一项所述的方法，其中所述修饰或靶向靶座位包括所述靶DNA座位的表观遗传修饰。

49.根据权利要求42至48中任一项所述的方法，该方法是通过操纵目的基因组座位处的一个或多个靶序列来修饰细胞、细胞系或生物体的方法。

50.一种来自根据权利要求49所述的方法的细胞或其子代，其中该细胞包含在未经受该方法的细胞中不存在的修饰。

51.根据权利要求50所述的细胞或其子代，其中未经受该方法的该细胞包含异常并且来自该方法的该细胞的该异常已得到解决或校正。

52.一种来自根据权利要求50所述的细胞或其子代的细胞产物，其中相对于来自未经受该方法的细胞的细胞产物，该产物在性质或量方面得到修饰。

53.根据权利要求52所述的细胞产物，其中未经受该方法的该细胞包含异常并且该细胞产物反映了该异常已通过该方法解决或校正。

(a)提供宿主细胞

-包含或表达gRNA，

55.根据权利要求54所述的方法，该方法包括以下步骤

56.根据权利要求54或55所述的方法，其中所述特定PAM序列不被相应的野生型Cpf1识别。

57.根据权利要求54或56中任一项所述的方法，其中所述宿主细胞是原核或真核宿主细胞。

58.根据权利要求54至57中任一项所述的方法，其中所述选择标记是阳性或阴性选择标记。

59.根据权利要求54至58中任一项所述的方法，其中所述选择标记是抗生素抗性基因。

60.根据权利要求54至59中任一项所述的方法，其中所述突变型Cpf1多肽具有催化活性。

61.根据权利要求54至58中任一项所述的方法，其中步骤(a)、(a1)、或(a2)中的所述宿主细胞是宿主细胞文库。

62.根据权利要求61所述的方法，其中所述宿主细胞文库包含候选突变型Cpf1多肽的文库，所述多肽具有一个或多个影响PAM识别的突变。

63.根据权利要求61所述的方法，其中所述宿主细胞文库包含多核苷酸的PAM文库。

64.根据权利要求54至63中任一项所述的方法，其中步骤(a)或(b1)中的所述多核苷酸是多核苷酸的PAM文库。

65.根据权利要求54至63中任一项所述的方法，其中步骤(a)或(b2)中的具有一个或多个影响PAM识别的突变的所述候选突变型Cpf1多肽是Cpf1突变体文库。

66.一种突变型Cpf1多肽，该多肽通过根据权利要求54至65中任一项所述的方法鉴定。

67.一种多核苷酸，该多核苷酸编码根据权利要求66所述的突变型多肽。

68.根据权利要求1至38、66或67中任一项所述的多肽、多核苷酸、载体、载体系统、复合物、递送系统、宿主细胞、或组合物用于优选地在体外或离体修饰或靶向DNA靶座位的用途。

69.根据权利要求1至38、66或67中任一项所述的多肽、多核苷酸、载体、载体系统、复合物、递送系统、或宿主细胞用于优选地在体外或离体基因组编辑的用途。

70.根据权利要求1至38、66或67中任一项所述的多肽、多核苷酸、载体、载体系统、复合物、递送系统、宿主细胞、或组合物，用于在修饰或靶向DNA靶座位中使用。

71.根据权利要求1至38、66或67中任一项所述的多肽、多核苷酸、载体、载体系统、复合物、递送系统、宿主细胞、或组合物，用于在基因组编辑中使用。

72.根据权利要求1至38、66或67中任一项所述的多肽、多核苷酸、载体、载体系统、复合物、递送系统、宿主细胞、或组合物，用于在疗法中使用。

73.根据权利要求1至38、66或67中任一项所述的多肽、多核苷酸、载体、载体系统、复合物、递送系统、宿主细胞、或组合物，用于制造药物。

c)一种或多种包含指导RNA的V型CRISPR-Cas多核苷酸序列，该指导RNA包含连接至同向重复序列的指导序列，其中该指导序列能够与靶序列杂交，或者一种或多种编码该一种或多种V型CRISPR-Cas多核苷酸序列的核苷酸序列，以及

d)Cpf1效应蛋白或者编码该Cpf1效应蛋白的一种或多种核苷酸序列；

其中该一种或多种指导序列与所述靶序列杂交，所述靶序列是原型间隔区相邻基序(PAM)的3’，并且所述指导物与该Cpf1效应蛋白形成复合物；其中Cpf1效应物包含根据权利要求1至15中任一项所述的突变型Cpf1多肽。

75.一种工程化的、非天然存在的成簇规律间隔短回文重复序列(CRISPR)-CRISPR相关(Cas)(CRISPR-Cas)载体系统，该载体系统包含一种或多种编码根据权利要求1所述的非天然存在的成簇规律间隔短回文重复序列(CRISPR)-CRISPR相关(Cas)(CRISPR-Cas)系统的载体，该载体系统包含

c)可操作地连接至一种或多种核苷酸序列的第一调节元件，该一种或多种核苷酸序列编码包含指导物的一种或多种V型CRISPR-Cas多核苷酸序列，该指导物包含连接至同向重复序列的指导序列，其中该指导序列能够与靶序列杂交，

d)可操作地连接至编码Cpf1效应蛋白的核苷酸序列的第二调节元件；

其中组分(a)和(b)位于该系统的相同或不同的载体上，

其中当转录时，该一种或多种指导序列与所述靶序列杂交，所述靶序列是原型间隔区相邻基序(PAM)的3’，并且所述指导物与该Cpf1效应蛋白形成复合物；其中Cpf1效应物包含根据权利要求1至15中任一项所述的突变型Cpf1多肽。

76.一种产生具有由目的基因编码的修饰的目的性状的植物的方法，所述方法包括将植物细胞与根据权利要求74或75所述的系统接触或者使该植物细胞经受根据权利要求44所述的方法，由此修饰或引入所述目的基因并且由所述植物细胞再生植物。

77.一种鉴定植物中目的性状的方法，所述目的性状由目的基因编码，所述方法包括将植物细胞与根据权利要求74或75所述的系统接触或者使该植物细胞经受根据权利要求44所述的方法，由此鉴定所述目的基因。

78.根据权利要求77所述的方法，该方法进一步包括将该鉴定的目的基因引入到植物细胞或植物细胞系或植物种质中以及由其生成植物，由此该植物含有该目的基因。

79.根据权利要求78所述的方法，其中该植物展现出目的性状。

80.一种粒子，该粒子包含根据权利要求74或75所述的系统。

81.根据权利要求80所述的粒子，其中该粒子含有与该指导物复合的Cpf1效应蛋白。

82.根据权利要求74、75或44所述的系统或方法，其中该复合物、指导物或蛋白质被轭合至至少一种糖部分，任选地是N-乙酰半乳糖胺(GalNAc)，具体地是三触角GalNAc。

83.根据权利要求74、75或44所述的系统或方法，其中Mg²⁺的浓度是约1mM至约15mM。

84.根据权利要求74、75或44所述的系统或方法，其中该Cpf1效应蛋白与胞苷脱氨酶融合。

85.根据权利要求84所述的系统或方法，其中该胞苷脱氨酶与该Cpf1效应蛋白的羧基末端融合。

86.根据权利要求84或85所述的系统或方法，其中该Cpf1效应蛋白或该胞苷脱氨酶进一步与尿嘧啶DNA糖基化酶抑制剂融合。

87.根据权利要求84-86中任一项所述的系统或方法，其中该Cpf1效应蛋白包含无催化活性的Nuc结构域。

88.根据权利要求84-87中任一项所述的系统或方法，其中该Cpf1效应蛋白包含无催化活性的RuvC结构域。

89.根据权利要求84-88中任一项所述的系统或方法，其中该指导物与Cpf1效应蛋白形成复合物并指导该复合物结合靶DNA，并且其中该胞苷脱氨酶将该靶DNA的非靶向链中的C转化为U。

90.根据权利要求74所述的系统，该系统包含多种指导物，每种指导物包含不同的指导序列，其中该多种指导序列能够与多种不同的靶序列杂交。

91.根据权利要求75所述的系统，其中该一种或多种载体编码多种指导RNA，每种指导RNA包含不同的指导序列，其中该多种指导序列能够与多种不同的靶序列杂交。

92.根据权利要求44所述的方法，该方法包括向多种不同的目的靶座位中的每一个递送不同的核酸组分。

93.根据权利要求74、75或44所述的系统或方法，其中该Cpf1效应蛋白是包含无催化活性的RuvC结构域的无效Cpf1。

94.根据权利要求93所述的系统或方法，其中该Cpf1效应蛋白与异源功能结构域融合，该异源功能结构域具有甲基化酶活性、去甲基化酶活性、转录激活活性、转录抑制活性、转录释放因子活性、组蛋白修饰活性、RNA切割活性、DNA切割活性、或核酸结合活性。

95.根据权利要求93所述的系统或方法，其中该Cpf1效应蛋白与转录激活结构域或转录抑制结构域融合。