CN108779462A

CN108779462A - 用于治疗血红蛋白病的组合物和方法

Info

Publication number: CN108779462A
Application number: CN201680082815.6A
Authority: CN
Inventors: A·E·博伊塔诺; M·库克; L·B·科立克斯泰恩; R·莱斯卡博; C·S·米克宁; K·穆鲁巴; S·R·普利斯; J·斯尼德; S·C·史蒂文森; M·斯图尔特; Y·杨
Original assignee: Internal Treatment Co; Novartis AG
Current assignee: Internal Treatment Co; Novartis AG
Priority date: 2015-12-28
Filing date: 2016-12-26
Publication date: 2018-11-09
Also published as: IL260257B2; IL308706A; US20240002843A1; EA201891532A1; BR112018013065A2; RU2018127636A3; JP2023159185A; MX2018007987A; AU2016381313A1; AU2020223733A1; CA3009727A1; MY192848A; JP2021166514A; RU2018127636A; EP3397767A1; HK1258205A1; AU2016381313B2; IL260257B1; US20190010495A1; AU2020223733B2

Abstract

本发明涉及用于治疗血红蛋白病的基因组编辑系统、试剂和方法。

Description

用于治疗血红蛋白病的组合物和方法

相关申请的交叉引用

本申请要求2015年12月28日提交的美国临时专利申请号62/271,968以及2016年6月8日提交的美国临时专利申请号62/347,484的优先权。这些申请的全部内容通过引用并入本文。

背景技术

CRISPR(成簇规律间隔短回文重复序列)在细菌中作为适应性免疫系统进化以抵御病毒攻击。在暴露于病毒时，病毒DNA的短区段被整合到细菌基因组的CRISPR基因座中。RNA从包含病毒序列的CRISPR基因座的部分转录。该RNA(其含有与病毒基因组互补的序列)介导Cas9蛋白靶向病毒基因组中的序列。Cas9蛋白切割病毒靶标并由此使其沉默。

最近，CRISPR/Cas系统已经适用于真核细胞中的基因组编辑。位点特异性单链断裂(SSB)或双链断裂(DSB)的引入允许通过例如非同源末端连接(NHEJ)或同源定向修复(HDR)来改变靶序列。

发明内容

不受理论束缚，本发明部分地基于以下发现：CRISPR系统(例如Cas9 CRISPR系统，例如如本文所述)可用于修饰细胞(例如造血干细胞和祖细胞(HSPC))以增加胎儿血红蛋白(HbF)表达和/或降低β珠蛋白(例如具有致病性突变的β珠蛋白基因)的表达，并且此类细胞可用于治疗血红蛋白病，例如镰状细胞疾病和β地中海贫血。

因此，在一方面，本发明提供了包含一种或多种(例如一种)如本文所述的gRNA分子的CRISPR系统(例如Cas CRISPR系统，例如Cas9 CRISPR系统，例如酿脓链球菌Cas9CRISPR系统)。本文所述的任何gRNA分子均可用于此类系统以及本文所述的方法和细胞中。

在一方面，本发明提供了包含tracr和crRNA的gRNA分子，其中该crRNA包含与BCL11A基因、BCL11a增强子或HFPH区域的靶序列互补的靶向结构域。

在另一方面，本发明提供了包含靶向结构域的gRNA分子，该靶向结构域与BCL11A基因的靶序列互补，例如与BCL11a编码区内(例如在BCL11a外显子内，例如在BCL11a外显子2内)的靶序列互补。在实施例中，该gRNA包含靶向结构域，该靶向结构域包含SEQ ID NO:1至SEQ ID NO:85或SEQ ID NO:400至SEQ ID NO:1231中的任何一个，例如由其组成。

在另一方面，本发明提供了包含靶向结构域的gRNA分子，该靶向结构域与BCL11A增强子的靶序列互补。

在实施例中，该gRNA包含靶向结构域，该靶向结构域包含SEQ ID NO:1232至SEQID NO:1499中的任何一个，例如由其组成。

在实施例中，对于BCL11a增强子的靶序列而言的gRNA是对于BCL11a增强子的+58区域内的靶序列而言的，并且该靶向结构域包含SEQ ID NO:182至SEQ ID NO:277或SEQ IDNO:334至SEQ ID NO:341中的任何一个，例如由其组成。在实施例中，该靶向结构域包含SEQID NO:341、SEQ ID NO:246、SEQ ID NO:248、SEQ ID NO:247、SEQ ID NO:245、SEQ ID NO:249、SEQ ID NO:244、SEQ ID NO:199、SEQ ID NO:251、SEQ ID NO:250、SEQ ID NO:334、SEQID NO:185、SEQ ID NO:186、SEQ ID NO:336、或SEQ ID NO:337中的任何一个，例如由其组成。在实施例中，该靶向结构域包含SEQ ID NO:248，例如由其组成。在实施例中，该靶向结构域包含SEQ ID NO:247，例如由其组成。在实施例中，该靶向结构域包含SEQ ID NO:245，例如由其组成。在实施例中，该靶向结构域包含SEQ ID NO:336，例如由其组成。在实施例中，该靶向结构域包含SEQ ID NO:337，例如由其组成。在实施例中，该靶向结构域包含SEQID NO:338，例如由其组成。在实施例中，该靶向结构域包含SEQ ID NO:335，例如由其组成。在实施例中，该靶向结构域包含SEQ ID NO:252，例如由其组成。在一个实施例中，该gRNA是包含crRNA和tracr的dgRNA，该crRNA例如从5'至3'包含SEQ ID NO:248-SEQ ID NO:6607，例如由其组成，并且该tracr例如从5'至3'包含SEQ ID NO:6660，例如由其组成。在一个实施例中，该gRNA是包含crRNA和tracr的dgRNA，该crRNA例如从5'至3'包含SEQ ID NO:247-SEQ ID NO:6607，例如由其组成，并且该tracr例如从5'至3'包含SEQ ID NO:6660，例如由其组成。在一个实施例中，该gRNA分子是sgRNA分子并且例如从5'至3'包含SEQ ID NO:338-SEQ ID NO:6604-UUUU，例如由其组成。在一个实施例中，该gRNA分子是sgRNA分子并且例如从5'至3'包含SEQ ID NO:335-SEQ ID NO:6604-UUUU，例如由其组成。在一个实施例中，该gRNA分子是sgRNA分子并且例如从5'至3'包含SEQ ID NO:336-SEQ ID NO:6604-UUUU，例如由其组成。在一个实施例中，该gRNA分子是sgRNA分子并且例如从5'至3'包含SEQ ID NO:245-SEQ ID NO:6604-UUUU，例如由其组成。在一个实施例中，该gRNA分子是sgRNA分子并且例如从5'至3'包含SEQ ID NO:337-SEQ ID NO:6604-UUUU，例如由其组成。在一个实施例中，该gRNA分子是sgRNA分子并且例如从5'至3'包含SEQ ID NO:252-SEQ ID NO:6604-UUUU，例如由其组成。

在实施例中，对于BCL11a增强子的靶序列而言的gRNA是对于BCL11a增强子的+62区域内的靶序列而言的，并且该靶向结构域包含SEQ ID NO:278至SEQ ID NO:333中的任何一个，例如由其组成。在实施例中，该靶向结构域包含SEQ ID NO:318、SEQ ID NO:312、SEQID NO:313、SEQ ID NO:294、SEQ ID NO:310、SEQ ID NO:319、SEQ ID NO:298、SEQ ID NO:322、SEQ ID NO:311、SEQ ID NO:315、SEQ ID NO:290、SEQ ID NO:317、SEQ ID NO:309、SEQID NO:289、或SEQ ID NO:281中的任何一个，例如由其组成。在实施例中，该靶向结构域包含SEQ ID NO:318，例如由其组成。

在实施例中，对于BCL11a增强子的靶序列而言的gRNA是对于BCL11a增强子的+55区域内的靶序列而言的，并且该靶向结构域包括SEQ ID NO:1596至SEQ ID NO:1691中的任何一个，例如由其组成。在实施例中，该靶向结构域包含SEQ ID NO:1683、SEQ ID NO:1638、SEQ ID NO:1647、SEQ ID NO:1609、SEQ ID NO:1621、SEQ ID NO:1617、SEQ ID NO:1654、SEQ ID NO:1631、SEQ ID NO:1620、SEQ ID NO:1637、SEQ ID NO:1612、SEQ ID NO:1656、SEQ ID NO:1619、SEQ ID NO:1675、SEQ ID NO:1645、SEQ ID NO:1598、SEQ ID NO:1599、SEQ ID NO:1663、SEQ ID NO:1677、或SEQ ID NO:1626中的任何一个，例如由其组成。

在另一方面，本发明提供了包含靶向结构域的gRNA分子，该靶向结构域与遗传性胎儿血红蛋白持续存在综合征(HPFH)区域的靶序列互补。在一个实施例中，该HPFH区域是法国HPFH区域。在实施例中，该靶向结构域包含SEQ ID NO:86至SEQ ID NO:181或SEQ IDNO:1500至SEQ ID NO:1595中的任何一个，例如由其组成。在实施例中，该靶向结构域包含SEQ ID NO:100、SEQ ID NO:165、SEQ ID NO:113、SEQ ID NO:99、SEQ ID NO:112、SEQ IDNO:98、SEQ ID NO:1580、SEQ ID NO:106、SEQ ID NO:1503、SEQ ID NO:1589、SEQ ID NO:160、SEQ ID NO:1537、SEQ ID NO:159、SEQ ID NO:101、SEQ ID NO:162、SEQ ID NO:104、SEQ ID NO:138、SEQ ID NO:1536、SEQ ID NO:1539、SEQ ID NO:1585中的任何一个，例如由其组成。在实施例中，该靶向结构域包含SEQ ID NO:100，例如由其组成。在实施例中，该靶向结构域包含SEQ ID NO:165，例如由其组成。在实施例中，该靶向结构域包含SEQ ID NO:113，例如由其组成。

在任何上述实施例中，该gRNA分子可以进一步具有本文所述的区域和/或特性。在一方面，该gRNA分子(例如任何上述方面或实施例的)包含靶向结构域，该靶向结构域包含任何一个所列举的靶向结构域序列的17、18、19、20、21、22、23或24个连续核酸，例如由其组成。在实施例中，任何一个所列举的靶向结构域序列的17、18、19、20、21、22、23或24个连续核酸是布置于所列举的靶向结构域序列的3'端的17、18、19、20、21、22、23或24个连续核酸。在实施例中，任何一个所列举的靶向结构域序列的17、18、19、20、21、22、23或24个连续核酸是布置于所列举的靶向结构域序列的5'端的17、18、19、20、21、22、23或24个连续核酸。在实施例中，任何一个所列举的靶向结构域序列的17、18、19、20、21、22、23或24个连续核酸不包含所列举的靶向结构域序列的5'或3'核酸。在任何上述方面或实施例中，该靶向结构域可以由所列举的靶向结构域序列组成。

在gRNA分子的实施例中，包括在任何上述方面和实施例中，该靶向结构域包含任何一个所列举的靶向结构域序列的17、18、19、20、21(如果存在于参考序列中)、22(如果存在于参考序列中)、23(如果存在于参考序列中)、24(如果存在于参考序列中)或25(如果存在于参考序列中)个连续核酸。在gRNA分子的其他实施例中，包括在任何上述方面和实施例中，该靶向结构域由任何一个所列举的靶向结构域序列的17、18、19、20、21(如果存在于参考序列中)、22(如果存在于参考序列中)、23(如果存在于参考序列中)、或24(如果存在于参考序列中)或25(如果存在于参考序列中)个连续核酸组成。在gRNA分子的实施例中，包括在任何上述方面和实施例中，任何一个所列举的靶向结构域序列的17、18、19、20、21(如果存在于参考序列中)、22(如果存在于参考序列中)、23(如果存在于参考序列中)、或24(如果存在于参考序列中)或25(如果存在于参考序列中)个连续核酸是布置于所列举的靶向结构域序列的3'端的17、18、19、20、21(如果存在于参考序列中)、22(如果存在于参考序列中)、23(如果存在于参考序列中)、或24(如果存在于参考序列中)或25(如果存在于参考序列中)个连续核酸。在gRNA分子的其他实施例中，包括在任何上述方面和实施例中，任何一个所列举的靶向结构域序列的17、18、19、20、21(如果存在于参考序列中)、22(如果存在于参考序列中)、23(如果存在于参考序列中)、或24(如果存在于参考序列中)或25(如果存在于参考序列中)个连续核酸是布置于所列举的靶向结构域序列的5'端的17、18、19、20、21(如果存在于参考序列中)、22(如果存在于参考序列中)、23(如果存在于参考序列中)、或24(如果存在于参考序列中)或25(如果存在于参考序列中)个连续核酸。在gRNA分子的其他实施例中，包括在任何上述方面和实施例中，任何一个所列举的靶向结构域序列的17、18、19、20、21(如果存在于参考序列中)、22(如果存在于参考序列中)、23(如果存在于参考序列中)、或24(如果存在于参考序列中)或25(如果存在于参考序列中)个连续核酸不包含所列举的靶向结构域序列的5'或3'核酸。

在一方面，包括在任何上述方面或实施例中，该gRNA分子包含crRNA的部分和tracr的部分，所述部分杂交以形成标志杆，该标志杆包含SEQ ID NO:6584或6585。在实施例中，该标志杆进一步包含位于标志杆的crRNA部分的3'的第一标志杆延伸部，其中所述第一标志杆延伸部包含SEQ ID NO:6586。在实施例中，该标志杆进一步包含位于标志杆的crRNA部分的3'的第二标志杆延伸部和(如果存在)第一标志杆延伸部，其中所述第二标志杆延伸部包含SEQ ID NO:6587。

在一方面，包括在任何上述方面或实施例中，本发明提供了包含tracr的gRNA分子，该tracr包含SEQ ID NO:6660或SEQ ID NO:6661，例如由其组成。在实施例中，该标志杆的crRNA部分包含SEQ ID NO:6607或SEQ ID NO:6608。

在一方面，包括在任何上述方面或实施例中，本发明提供了包含tracr的gRNA分子，该tracr包含SEQ ID NO:6589或6590和任选的布置于SEQ ID NO:6589或6590的5’的第一tracr延伸部，如果存在第一标志杆延伸部的话，所述第一tracr延伸部包含SEQ ID NO:6591。

在一方面，包括在任何上述方面或实施例中，本发明提供了一种gRNA分子，其中靶向结构域和tracr被布置于分开的核酸分子(例如dgRNA分子)上。

在一方面，包括在任何上述方面或实施例中，本发明提供了一种gRNA分子，其中靶向结构域和tracr被布置于单个核酸分子(例如sgRNA分子)上，并且其中tracr被布置于靶向结构域的3'。在实施例中，该sgRNA分子包含布置于靶向结构域的3'且布置于tracr的5’的环，例如包含SEQ ID NO:6588(例如由其组成)的环。

在一方面，包括在任何上述方面或实施例中，本发明提供了一种gRNA分子，该gRNA分子从5'至3'包含[靶向结构域]-：

(a)SEQ ID NO:6601；

(b)SEQ ID NO:6602；

(c)SEQ ID NO:6603；

(d)SEQ ID NO:6604；或者

(e)以上(a)至(d)中的任一个，在3'端进一步包含1、2、3、4、5、6或7个尿嘧啶(U)核苷酸，例如4个尿嘧啶核苷酸。在实施例中，在靶向结构域和(a)-(e)中任一个的序列之间没有间插核苷酸。

在另一方面，本发明提供了包含任何上述方面和实施例的一种或多种(例如一种)gRNA分子的CRISPR系统，例如Cas CRISPR系统，例如Cas9 CRISPR系统，例如酿脓链球菌Cas9 CRISPR系统。在一方面，本发明提供了一种组合物，该组合物包含任何上述方面和实施例的第一gRNA分子，进一步包含Cas9分子。在实施例中，该Cas9分子是有活性或无活性的酿脓链球菌Cas9。在实施例中，该第一gRNA分子和Cas9分子存在于核糖核蛋白复合物(RNP)中。

在另一方面，本发明提供了组合物，其包含多于一种gRNA，例如多于一种如本文所述的gRNA分子，例如多于一种任何上述gRNA分子方面或实施例的gRNA分子。因此，在另外的方面，本发明提供了任何上述组合物方面和实施例的组合物，其进一步包含第二gRNA分子；第二gRNA分子和第三gRNA分子；或第二gRNA分子、第三gRNA分子和第四gRNA分子，其中第二gRNA分子、第三gRNA分子(如果存在)和第四gRNA分子(如果存在)是如本文所述的gRNA分子，例如任何上述gRNA分子方面或实施例的gRNA分子。在一个实施例中，该组合物的每种gRNA分子与不同的靶序列互补。在一个实施例中，每种gRNA分子与同一基因或区域内的靶序列互补。在一方面，第一gRNA分子、第二gRNA分子、第三gRNA分子(如果存在)和第四gRNA分子(如果存在)与相隔不多于20000个核苷酸、不多于10000个核苷酸、不多于6000个核苷酸、不多于5000个核苷酸、不多于4000个核苷酸、不多于1000个核苷酸、不多于500个核苷酸、不多于400个核苷酸、不多于300个核苷酸、不多于200个核苷酸、不多于100个核苷酸、不多于90个核苷酸、不多于80个核苷酸、不多于70个核苷酸、不多于60个核苷酸、不多于50个核苷酸、不多于40个核苷酸、不多于30个核苷酸、不多于20个核苷酸、或不多于10个核苷酸的靶序列互补。在另一方面，该组合物的每种gRNA分子与不同基因或区域内的靶序列互补。

本文描述了本发明的多于一种gRNA分子的特定和优选组合。在一方面，该组合物包含第一gRNA分子和第二gRNA分子，其中第一gRNA分子和第二gRNA分子与不同靶序列互补，并且：

(a)独立地选自对于BCL11a基因而言的本文(例如以上)所述的gRNA分子；

(b)独立地选自对于+58 BCL11a增强子而言的本文(例如以上)所述的gRNA分子；

(c)独立地选自对于+62 BCL11a增强子而言的本文(例如以上)所述的gRNA分子；

(d)独立地选自对于+55 BCL11a增强子而言的本文(例如以上)所述的gRNA分子；或者

(e)独立地选自对于HPFH区域而言的本文(例如以上)所述的gRNA分子。

在一方面，该组合物包含第一gRNA分子和第二gRNA分子，其中第一gRNA分子和第二gRNA分子与不同靶序列互补，并且：

(a)第一gRNA分子选自对于BCL11a基因而言的本文(例如以上)所述的gRNA分子，并且第二gRNA分子选自对于+58 BCL11a增强子而言的本文(例如以上)所述的gRNA分子；

(b)第一gRNA分子选自对于BCL11a基因而言的本文(例如以上)所述的gRNA分子，并且第二gRNA分子选自对于+62 BCL11a增强子而言的本文(例如以上)所述的gRNA分子；

(c)第一gRNA分子选自对于BCL11a基因而言的本文(例如以上)所述的gRNA分子，并且第二gRNA分子选自对于+55 BCL11a增强子而言的本文(例如以上)所述的gRNA分子；

(d)第一gRNA分子选自对于BCL11a基因而言的本文(例如以上)所述的gRNA分子，并且第二gRNA分子选自对于HPFH区域而言的本文(例如以上)所述的gRNA分子；

(e)第一gRNA分子选自对于+58 BCL11a增强子而言的本文(例如以上)所述的gRNA分子，并且第二gRNA分子选自对于+62 BCL11a增强子而言的本文(例如以上)所述的gRNA分子；

(f)第一gRNA分子选自对于+58 BCL11a增强子而言的本文(例如以上)所述的gRNA分子，并且第二gRNA分子选自对于+55 BCL11a增强子而言的本文(例如以上)所述的gRNA分子；

(g)第一gRNA分子选自对于+58 BCL11a增强子而言的本文(例如以上)所述的gRNA分子，并且第二gRNA分子选自对于HPFH区域而言的本文(例如以上)所述的gRNA分子；

(h)第一gRNA分子选自对于+62 BCL11a增强子而言的本文(例如以上)所述的gRNA分子，并且第二gRNA分子选自对于+55 BCL11a增强子而言的本文(例如以上)所述的gRNA分子；

(i)第一gRNA分子选自对于+62 BCL11a增强子而言的本文(例如以上)所述的gRNA分子，并且第二gRNA分子选自对于HPFH区域而言的本文(例如以上)所述的gRNA分子；

(j)第一gRNA分子选自对于+55 BCL11a增强子而言的本文(例如以上)所述的gRNA分子，并且第二gRNA分子选自对于HPFH区域而言的本文(例如以上)所述的gRNA分子。

在另一方面，包含第一gRNA分子和第二gRNA分子的组合物包含：

(a)选自对于HPFH区域而言的本文(例如以上)所述的gRNA分子的第一gRNA分子、和包含与β珠蛋白基因的靶序列互补的靶向结构域的第二gRNA分子；或者

(b)选自对于BCL11a增强子(例如+58 BCL11a增强子、+55 BCL11a增强子或+62BCL11a增强子)而言的本文(例如以上)所述的gRNA分子的第一gRNA分子、和包含与β珠蛋白基因的靶序列互补的靶向结构域的第二gRNA分子。

在任何上述组合物方面和实施例中，就组合物的gRNA组成部分而言，该组合物可以由第一gRNA分子和第二gRNA分子组成。

在任何上述组合物方面和实施例中，这些组合物可以被配制在适于电穿孔的介质中。

在另一方面，本发明提供了编码CRISPR系统的一种或多种gRNA分子和/或Cas分子的核酸。不受理论束缚，认为将此类核酸递送至细胞将导致细胞内CRISPR系统的表达。在一方面，本发明提供了编码任何先前gRNA方面和实施例的一种或多种gRNA分子的核酸序列。在实施例中，该核酸包含与编码一种或多种gRNA分子的序列有效地连接的启动子。在实施例中，该启动子是由RNA聚合酶II或RNA聚合酶III识别的启动子。在实施例中，该启动子是U6启动子或HI启动子。

在另外的方面，该核酸进一步包含编码Cas9分子的序列。在实施例中，该核酸包含与编码Cas9分子的序列有效地连接的启动子。在实施例中，该启动子是EF-1启动子、CMV IE基因启动子、EF-1α启动子、泛蛋白C启动子或磷酸甘油酸激酶(PGK)启动子。

在一方面，本发明提供了包含任何先前核酸方面和实施例的核酸的载体。在实施例中，该载体选自由以下组成的组：慢病毒载体、腺病毒载体、腺相关病毒(AAV)载体、单纯疱疹病毒(HSV)载体、质粒、微环、纳米质粒和RNA载体。

在另一方面，本发明提供了一种组合物，该组合物包含一种或多种例如如本文所述、例如在任何先前gRNA分子方面和实施例中的gRNA分子，和编码Cas9分子的核酸。

在另一方面，本发明提供了一种组合物，该组合物包含编码一种或多种gRNA分子(例如如本文所述，例如任何先前gRNA分子方面和实施例的)的核酸和Cas9分子。

在另一方面，本发明提供了一种组合物(例如任何上述组合物方面和实施例的组合物)，该组合物进一步包含模板核酸。在另一方面，本发明提供了一种组合物(例如任何上述组合物方面和实施例的组合物)，该组合物进一步包含编码模板核酸的核酸序列。在实施例中，该模板核酸包含与gRNA分子的靶序列的核苷酸对应的核苷酸。在实施例中，该模板核酸包含编码人β珠蛋白(例如包含突变G16D、E22A和T87Q中的一个或多个的人β珠蛋白)的核酸。在实施例中，该模板核酸包含编码人γ珠蛋白的核酸。

在另一方面，本发明提供了细胞，其包含(或在任何时间包含)gRNA分子、CRISPR系统、组合物或核酸(例如如本文所述，例如如任何上述方面和实施例中的)。在这些方面，本发明提供了通过这种包含而被经修饰的细胞。

因此，在一方面，本发明提供了一种改变细胞核酸内的靶序列(例如改变其结构，例如序列)的方法，该方法包括使所述细胞与以下接触：

1)任何上述gRNA分子方面和实施例的一种或多种gRNA分子、和Cas9分子(例如如本文所述)；

2)任何上述gRNA分子方面和实施例的一种或多种gRNA分子、和编码Cas9分子的核酸(例如如本文所述)；

3)编码任何上述gRNA分子方面和实施例的一种或多种gRNA分子的核酸、和Cas9分子(例如如本文所述)；

4)编码上述gRNA分子方面和实施例的一种或多种gRNA分子的核酸、和编码Cas9分子的核酸(例如如本文所述)；或者

5)以上1)至4)中的任一个、和模板核酸(例如如本文所述)；

6)以上1)至4)中的任一个、和包含编码模板核酸的序列的核酸(例如如本文所述)；

7)如本文所述的组合物(例如，任何上述组合物方面和实施例的)；或者

8)任何上述载体方面和实施例的载体。

在实施例中，该gRNA分子或编码gRNA分子的核酸以及该Cas9分子或编码Cas9分子的核酸被配制在单一组合物中。在其他实施例中，该gRNA分子或编码gRNA分子的核酸以及该Cas9分子或编码Cas9分子的核酸被配制在多于一种组合物中。在实施例中，同时或顺序地递送多于一种组合物。

在实施例中，该细胞是动物细胞。在实施例中，该细胞是哺乳动物细胞、灵长类动物细胞或人细胞。在实施例中，该细胞是造血干细胞或祖细胞(HSPC)(例如HSPC群)。在实施例中，该细胞是CD34+细胞。在实施例中，该细胞是CD34+/CD38-/CD90+/CD45RA-细胞。在实施例中，该细胞是CD34+/CD90+/CD49f+细胞。在实施例中，该细胞是CD34+/CD38-/CD90+/CD45RA-/CD49f+细胞。在实施例中，该方法包括已富集HSPC(例如CD34+细胞)的细胞群。

在实施例中，该细胞(例如细胞群)已经自骨髓分离。在实施例中，该细胞(例如细胞群)已经自动员的外周血分离。在实施例中，该细胞(例如细胞群)已经自脐带血分离。

在实施例中，该细胞(例如细胞群)相对于待施用所述细胞(例如细胞群)的患者是自体的。在实施例中，该细胞(例如细胞群)相对于待施用所述细胞(例如细胞群)的患者是同种异体的。

在本文所述方法的实施例中，改变导致细胞中胎儿血红蛋白表达的增加。在本文所述方法的实施例中，改变导致细胞中胎儿血红蛋白表达的降低。

在另一方面，本发明提供了一种通过任何上述方法方面和实施例的方法改变的细胞。在另一方面，本发明提供了一种细胞，该细胞包含任何先前方面和实施例的第一gRNA分子(例如如本文所述)或组合物(例如如本文所述)或编码第一gRNA分子的核酸(例如如本文所述)。在实施例中，该细胞是动物细胞。在实施例中，该细胞是哺乳动物细胞、灵长类动物细胞或人细胞。在实施例中，该细胞是造血干细胞或祖细胞(HSPC)(例如HSPC群)。在实施例中，该细胞是CD34+细胞。在实施例中，该细胞是CD34+/CD38-/CD90+/CD45RA-细胞。在实施例中，该细胞是CD34+/CD90+/CD49f+细胞。在实施例中，该方法包括已富集HSPC(例如CD34+细胞)的细胞群。

在实施例中，该细胞包含、已包含或将包含例如如本文所述、例如任何先前gRNA分子方面和实施例的第二gRNA分子，或编码第二gRNA分子的核酸，其中第一gRNA分子和第二gRNA分子包含不相同的靶向结构域。

在实施例中，该细胞中胎儿血红蛋白的表达增加，例如相对于未经修饰以包含gRNA分子(例如如本文所述)的相同细胞类型的细胞。在实施例中，该细胞中β珠蛋白的表达降低，例如相对于未经修饰以包含gRNA分子(例如如本文所述)的相同细胞类型的细胞。在实施例中，该细胞中胎儿血红蛋白的表达增加并且β珠蛋白的表达降低，例如相对于未经修饰以包含gRNA分子(例如如本文所述)的相同细胞类型的细胞。

在一方面，本发明的细胞(或包含细胞的方法)已经与例如如本文所述的干细胞扩增剂例如化合物1、化合物2、化合物3或化合物4进行了接触。在一方面，本发明的细胞(或包含细胞的方法)已经与例如如本文所述的干细胞扩增剂例如化合物1、化合物2、化合物3、化合物4或其组合(例如化合物1和化合物4)进行了接触。在一个实施例中，该干细胞扩增剂是化合物4。在一个实施例中，该干细胞扩增剂是化合物1和化合物4的组合。在实施例中，接触是离体的。

在另一方面，本发明提供了治疗方法，例如治疗血红蛋白病的方法。在一方面，本发明提供了一种治疗血红蛋白病的方法，该方法包括向患者施用任何先前细胞或方法方面和实施例的细胞(例如细胞群)。

在另一方面，本发明提供了一种增加哺乳动物中胎儿血红蛋白表达的方法，该方法包括向患者施用任何先前细胞或方法方面和实施例的细胞。在一个实施例中，该血红蛋白病是β-地中海贫血或镰状细胞疾病。

在另一方面，本发明提供了例如如本文所述的指导RNA分子，用于作为例如用于治疗疾病的药物使用。在实施例中，该疾病是血红蛋白病，例如β-地中海贫血或镰状细胞疾病。

在另一方面，本发明提供了例如如本文所述、例如如任何上述gRNA分子方面和实施例中所述的gRNA分子，其中当将包含gRNA的CRISPR系统引入细胞(例如CD34+细胞，例如HSC)中时，产生的插入/缺失的至少约15％包含(a)移码突变；或(b)相对于未经修饰的靶DNA的大的缺失，如通过NGS所测量的。在实施例中，产生的插入/缺失的至少约25％包含(a)移码突变；或(b)相对于未经修饰的靶DNA的大的缺失，如通过NGS所测量的。在实施例中，产生的插入/缺失的至少约40％、至少约50％、至少约60％、至少约70％、至少约80％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％、或至少约99％包含(a)移码突变；或(b)相对于未经修饰的靶DNA的大的缺失，如通过NGS所测量的。

在另一方面，本发明提供了用于离体扩增和修饰HSPC(例如CD34+细胞)的方法。在一方面，本发明提供了一种修饰细胞(例如细胞群)的方法，该方法包括：

(a)提供细胞群；

(b)在干细胞扩增剂存在下，离体扩增所述细胞；和

(c)向所述细胞中引入第一gRNA分子(例如如本文所述，例如任何上述gRNA分子方面和实施例的)、编码第一gRNA分子的核酸分子、或组合物(例如如本文所述，例如任何上述组合物方面和实施例的)；

使得所述细胞中血红蛋白(例如胎儿血红蛋白)表达相对于未经受步骤(c)的相同细胞类型增加。

在实施例中，将这些细胞引入有需要的受试者，例如患有血红蛋白病例如镰状细胞疾病或β地中海贫血的受试者中。

在实施例中，这些细胞是或包含CD34+细胞。在实施例中，这些细胞是或包含HSPC。在实施例中，这些细胞自骨髓、动员的外周血或脐带血分离。在一个优选的实施例中，这些细胞自骨髓分离。在其他实施例中，这些细胞自动员的外周血分离。在一些方面，动员的外周血自已施用G-CSF的受试者分离。在一些方面，动员的外周血自已施用除G-CSF以外的动员剂例如(AMD3100)的受试者分离。在实施例中，这些细胞是富集细胞群。

在实施例中，该干细胞扩增剂是化合物1、化合物2、化合物3或化合物4，例如化合物4。在实施例中，该干细胞扩增剂是化合物1、化合物2、化合物3、化合物4或其组合(例如，化合物1和化合物4的组合)。在实施例中，这些细胞以从约1微摩尔至约200微摩尔(uM)的浓度与化合物4进行接触。在一个实施例中，化合物4的浓度为约75微摩尔(uM)。在实施例中，在干细胞扩增剂存在下离体扩增所述细胞发生约1-10天，例如约1-5天、例如约2-5天、例如约4天的时间段。

在实施例中，这些细胞对于意欲施用所述细胞的患者是自体的。在实施例中，这些细胞对于意欲施用所述细胞的患者是同种异体的。

在实施例中，扩增步骤(b)进一步处于促血小板生成素(Tpo)、Flt3配体(Flt-3L)、人干细胞因子(SCF)和人白细胞介素-6(IL-6)的存在下。在实施例中，促血小板生成素(Tpo)、Flt3配体(Flt-3L)、人干细胞因子(SCF)和人白细胞介素-6(IL-6)浓度均为约50ng/mL。在实施例中，促血小板生成素(Tpo)、Flt3配体(Flt-3L)、人干细胞因子(SCF)和人白细胞介素-6(IL-6)浓度均为50ng/mL。

下面描述了另外的方面和实施例。

在一方面，本发明提供了一种gRNA分子，该gRNA分子包含tracr和crRNA，其中该crRNA包含与BCL11A基因(例如人BCL11a基因)、BCL11a增强子(例如人BCL11a增强子)、或HFPH区域(例如人HPFH区域)的靶序列互补的靶向结构域。

在实施例中，该靶序列是BCL11A基因的靶序列，并且该靶向结构域包含SEQ IDNO:1至SEQ ID NO:85或SEQ ID NO:400至SEQ ID NO:1231中的任何一个，例如由其组成。这些实施例在本文中称为gRNA分子实施例2。

在其他实施例中，该靶序列是BCL11a增强子的靶序列，并且该靶向结构域包含SEQID NO:1232至SEQ ID NO:1499中的任何一个，例如由其组成。这些实施例在本文中称为gRNA分子实施例3。在优选的实施例中，该靶序列是BCL11a增强子的靶序列，并且该靶向结构域包含SEQ ID NO:182至SEQ ID NO:277或SEQ ID NO:334至SEQ ID NO:341中的任何一个，例如由其组成。这些实施例在本文中称为gRNA分子实施例4。在更优选的实施例中，该靶向结构域包含SEQ ID NO:341、SEQ ID NO:246、SEQ ID NO:248、SEQ ID NO:247、SEQ IDNO:245、SEQ ID NO:249、SEQ ID NO:244、SEQ ID NO:199、SEQ ID NO:251、SEQ ID NO:250、SEQ ID NO:334、SEQ ID NO:185、SEQ ID NO:186、SEQ ID NO:336、或SEQ ID NO:337中的任何一个，例如由其组成。这些实施例在本文中称为gRNA分子实施例5。在仍更优选的实施例中，该靶向结构域包含SEQ ID NO:247、SEQ ID NO:248、SEQ ID NO:335、SEQ ID NO:336、SEQ ID NO:337或SEQ ID NO:338中的任何一个，例如由其组成(在本文中称为gRNA分子实施例6)，例如包含SEQ ID NO:248或SEQ ID NO:338中的任何一个，例如由其组成(在本文中称为gRNA分子实施例7)。在实施例中，该靶向结构域包含SEQ ID NO:248，例如由其组成(在本文中称为gRNA分子实施例8)。在实施例中，该靶向结构域包含SEQ ID NO:338，例如由其组成(在本文中称为gRNA分子实施例9)。

在其他实施例中，该靶序列是BCL11a增强子的靶序列，并且该靶向结构域包含SEQID NO:278至SEQ ID NO:333中的任何一个，例如由其组成(在本文中称为gRNA分子实施例10)。在优选的实施例中，该靶向结构域包含SEQ ID NO:318、SEQ ID NO:312、SEQ ID NO:313、SEQ ID NO:294、SEQ ID NO:310、SEQ ID NO:319、SEQ ID NO:298、SEQ ID NO:322、SEQID NO:311、SEQ ID NO:315、SEQ ID NO:290、SEQ ID NO:317、SEQ ID NO:309、SEQ ID NO:289、或SEQ ID NO:281中的任何一个，例如由其组成(在本文中称为gRNA分子实施例11)。在一个优选的实施例中，该靶向结构域包含SEQ ID NO:318，例如由其组成(在本文中称为gRNA分子实施例12)。

在其他实施例中，该靶序列是BCL11a增强子的靶序列，并且该靶向结构域包含SEQID NO:1596至SEQ ID NO:1691中的任何一个，例如由其组成(在本文中称为gRNA分子实施例13)。在优选的实施例中，该靶向结构域包含SEQ ID NO:1683、SEQ ID NO:1638、SEQ IDNO:1647、SEQ ID NO:1609、SEQ ID NO:1621、SEQ ID NO:1617、SEQ ID NO:1654、SEQ IDNO:1631、SEQ ID NO:1620、SEQ ID NO:1637、SEQ ID NO:1612、SEQ ID NO:1656、SEQ IDNO:1619、SEQ ID NO:1675、SEQ ID NO:1645、SEQ ID NO:1598、SEQ ID NO:1599、SEQ IDNO:1663、SEQ ID NO:1677、或SEQ ID NO:1626中的任何一个，例如由其组成(在本文中称为gRNA分子实施例14)。

在其他实施例中，该靶序列是HFPH区域(例如法国HPFH区域)的靶序列，并且该靶向结构域包含SEQ ID NO:86至SEQ ID NO:181、SEQ ID NO:1500至SEQ ID NO:1595或SEQID NO:1692至SEQ ID NO:1761中的任何一个，例如由其组成(在本文中称为gRNA分子实施例15)。在优选的实施例中，该靶向结构域包含SEQ ID NO:100、SEQ ID NO:165、SEQ ID NO:113、SEQ ID NO:99、SEQ ID NO:112、SEQ ID NO:98、SEQ ID NO:1580、SEQ ID NO:106、SEQID NO:1503、SEQ ID NO:1589、SEQ ID NO:160、SEQ ID NO:1537、SEQ ID NO:159、SEQ IDNO:101、SEQ ID NO:162、SEQ ID NO:104、SEQ ID NO:138、SEQ ID NO:1536、SEQ ID NO:1539、SEQ ID NO:1585中的任何一个，例如由其组成(在本文中称为gRNA分子实施例16)。在仍更优选的实施例中，该靶向结构域包含SEQ ID NO:98、SEQ ID NO:100、SEQ ID NO:1505、SEQ ID NO:1589、SEQ ID NO:1700或SEQ ID NO:1750中的任何一个，例如由其组成(在本文中称为gRNA分子实施例17)。在其他优选的实施例中，该靶向结构域包含SEQ ID NO:100、SEQ ID NO:165或SEQ ID NO:113中的任何一个，例如由其组成(在本文中称为gRNA分子实施例18)。

在实施例中，该gRNA分子包含靶向结构域，该靶向结构域包含本文所述的任何靶向结构域序列(例如表1或表2的靶向结构域序列)的17、18、19、20、21、22、23或24个，优选20个连续核酸，例如由其组成。在实施例中，本文所述的任何一个靶向结构域序列(例如表1或表2的靶向结构域序列)的17、18、19、20、21、22、23或24个，优选20个连续核酸是布置于所列举的靶向结构域序列的3'端的17、18、19、20、21、22、23或24个，优选20个连续核酸。在其他实施例中，本文所述的任何一个靶向结构域序列(例如表1或表2的靶向结构域序列)的17、18、19、20、21、22、23或24个，优选20个连续核酸是布置于所列举的靶向结构域序列的5'端的17、18、19、20、21、22、23或24个，优选20个连续核酸。在其他实施例中，本文所述的任何一个靶向结构域序列(例如表1或表2的靶向结构域序列)的17、18、19、20、21、22、23或24个，优选20个连续核酸不包含所列举的靶向结构域序列的5'或3'核酸。

在实施例中，该gRNA分子包含靶向结构域，该靶向结构域包含本文所述的任何靶向结构域序列(例如表5、表6、表7、表8或表9的靶向结构域序列)的17、18、19或20个，优选20个连续核酸，例如由其组成。在实施例中，本文所述的任何一个靶向结构域序列(例如表5、表6、表7、表8或表9的靶向结构域序列)的17、18、19或20个，优选20个连续核酸是布置于所列举的靶向结构域序列的3'端的17、18、19或20个，优选20个连续核酸。在其他实施例中，本文所述的任何一个靶向结构域序列(例如表5、表6、表7、表8或表9的靶向结构域序列)的17、18、19或20个，优选20个连续核酸是布置于所列举的靶向结构域序列的5'端的17、18、19或20个，优选20个连续核酸。在其他实施例中，本文所述的任何一个靶向结构域序列(例如表5、表6、表7、表8或表9的靶向结构域序列)的17、18、19或20个，优选20个连续核酸不包含所列举的靶向结构域序列的5'或3'核酸。

以下方面描述了可以与任何上述方面和实施例组合的gRNA分子的特征。在实施例中，该gRNA分子(包括任何上述方面和实施例的gRNA分子)包含crRNA的部分和tracr的部分，所述部分杂交以形成标志杆，该标志杆包含SEQ ID NO:6584或6585。在实施例中，该标志杆进一步包含位于标志杆的crRNA部分的3'的第一标志杆延伸部，其中所述第一标志杆延伸部包含SEQ ID NO:6586。在实施例中，该标志杆进一步包含(除了第一标志杆延伸部或替代第一标志杆延伸部)位于标志杆的crRNA部分的3'的第二标志杆延伸部和(如果存在)第一标志杆延伸部，其中所述第二标志杆延伸部包含SEQ ID NO:6587。

在实施例中，包括在任何上述方面和实施例中，该tracr包含SEQ ID NO:6660或SEQ ID NO:6661。在实施例中，该tracr包含SEQ ID NO:7812，任选地在3'端进一步包含另外的1、2、3、4、5、6或7个尿嘧啶(U)核苷酸。在实施例中，该crRNA从5'至3'包含[靶向结构域]-：a)SEQ ID NO:6584；b)SEQ ID NO:6585；c)SEQ ID NO:6605；d)SEQ ID NO:6606；e)SEQ ID NO:6607；f)SEQ ID NO:6608；或g)SEQ ID NO:7806。

在实施例中，包括在任何上述方面和实施例中，该tracr从5'至3'包含：a)SEQ IDNO:6589；b)SEQ ID NO:6590；c)SEQ ID NO:6609；d)SEQ ID NO:6610；e)SEQ ID NO:6660；f)SEQ ID NO:6661；g)SEQ ID NO:7812；h)SEQ ID NO:7807；i)SEQ ID NO:7808；j)SEQ IDNO:7809；k)以上a)至j)中的任一个，在3'端进一步包含至少1、2、3、4、5、6或7个尿嘧啶(U)核苷酸，例如1、2、3、4、5、6或7个尿嘧啶(U)核苷酸；l)以上a)至k)中的任一个，在3'端进一步包含至少1、2、3、4、5、6或7个腺嘌呤(A)核苷酸，例如1、2、3、4、5、6或7个腺嘌呤(A)核苷酸；或m)以上a)至l)中的任一个，在5'端(例如在5'末端)进一步包含至少1、2、3、4、5、6或7个腺嘌呤(A)核苷酸，例如1、2、3、4、5、6或7个腺嘌呤(A)核苷酸。

在实施例中，靶向结构域和tracr被布置于分开的核酸分子上。在此类gRNA分子的实施例中，包含靶向结构域的核酸分子包含任选地布置成紧邻靶向结构域的3'的SEQ IDNO:6607，并且包含tracr的核酸分子包含SEQ ID NO:6660，例如由其组成。

在实施例中，该标志杆的crRNA部分包含SEQ ID NO:6607或SEQ ID NO:6608。

在实施例中，该tracr包含SEQ ID NO:6589或6590和任选的布置于SEQ ID NO:6589或6590的5'的第一tracr延伸部，如果存在第一标志杆延伸部的话，所述第一tracr延伸部包含SEQ ID NO:6591。

在实施例中，包括在任何上述方面和实施例的实施例中，靶向结构域和tracr被布置于分开的核酸分子上。在其他实施例中，包括在任何上述方面和实施例的实施例中，靶向结构域和tracr被布置于单个核酸分子上，例如tracr被布置于靶向结构域的3'。

在实施例中，当靶向结构域和tracr被布置于单个核酸分子上时，该gRNA分子进一步包含布置于靶向结构域的3'且布置于tracr的5’的环。在实施例中，该环包含SEQ ID NO:6588，例如由其组成。

在实施例中，当靶向结构域和tracr被布置于单个核酸分子上时，该gRNA分子从5'至3'包含[靶向结构域]-：(a)SEQ ID NO:6601；(b)SEQ ID NO:6602；(c)SEQ ID NO:6603；(d)SEQ ID NO:6604；(e)SEQ ID NO:7811；或(f)以上(a)至(e)中的任一个，在3'端进一步包含1、2、3、4、5、6或7个尿嘧啶(U)核苷酸。在实施例中，该gRNA分子包含所述靶向结构域和任选地布置成紧邻所述靶向结构域的3'的SEQ ID NO:7811，例如由其组成。

在实施例中，包括在任何上述方面和实施例中，该gRNA分子的每个核酸残基是未经修饰的A、U、G或C核酸残基和一种或多种核酸分子的每个残基之间的未经修饰的磷酸酯键。在其他实施例中，包括在任何上述方面和实施例中，构成gRNA分子的一种或任选地多于一种的核酸分子包含：a)在所述一种或多种核酸分子的3'端的一个或多个，例如三个硫代磷酸酯修饰；b)在所述一种或多种核酸分子的5'端的一个或多个，例如三个硫代磷酸酯修饰；c)在所述一种或多种核酸分子的3'端的一个或多个，例如三个2'-O-甲基修饰；d)在所述一种或多种核酸分子的5'端的一个或多个，例如三个2'-O-甲基修饰；e)在所述一种或多种核酸分子的相对于末端的第4个、相对于末端的第3个和相对于末端的第2个3'残基的每个处的2'O-甲基修饰；f)在所述一种或多种核酸分子的相对于末端的第4个、相对于末端的第3个和相对于末端的第2个5'残基的每个处的2'O-甲基修饰；或f)其任何组合。

在优选的实施例中，本发明提供了一种gRNA分子(例如，其为sgRNA分子)，该gRNA分子包含以下序列，例如由其组成：(a)SEQ ID NO:342；(b)SEQ ID NO:343；或(c)SEQ IDNO:1762(在本发明内容中称为gRNA分子实施例41)。

在其他优选的实施例中，本发明提供了一种gRNA分子(例如，其为双gRNA分子)，该gRNA分子包含以下，例如由其组成：(a)crRNA和tracr，该crRNA包含SEQ ID NO:344，例如由其组成，并且该tracr包含SEQ ID NO:6660，例如由其组成；(b)crRNA和tracr，该crRNA包含SEQ ID NO:344，例如由其组成，并且该tracr包含SEQ ID NO:346，例如由其组成；(c)crRNA和tracr，该crRNA包含SEQ ID NO:345，例如由其组成，并且该tracr包含SEQ ID NO:6660，例如由其组成；或(d)crRNA和tracr，该crRNA包含SEQ ID NO:345，例如由其组成，并且该tracr包含SEQ ID NO:346，例如由其组成(在本发明内容中称为gRNA分子实施例42)。

在其他优选的实施例中，本发明提供了一种gRNA分子(例如，其为sgRNA分子)，该gRNA分子包含以下序列，例如由其组成：(a)SEQ ID NO:347；(b)SEQ ID NO:348；或(c)SEQID NO:1763(在本发明内容中称为gRNA分子实施例43)。

在其他优选的实施例中，本发明提供了一种gRNA分子(例如，其为双gRNA分子)，该gRNA分子包含以下，例如由其组成：(a)crRNA和tracr，该crRNA包含SEQ ID NO:349，例如由其组成，并且该tracr包含SEQ ID NO:6660，例如由其组成；(b)crRNA和tracr，该crRNA包含SEQ ID NO:349，例如由其组成，并且该tracr包含SEQ ID NO:346，例如由其组成；(c)crRNA和tracr，该crRNA包含SEQ ID NO:350，例如由其组成，并且该tracr包含SEQ ID NO:6660，例如由其组成；或(d)crRNA和tracr，该crRNA包含SEQ ID NO:350，例如由其组成，并且该tracr包含SEQ ID NO:346，例如由其组成(在本发明内容中称为gRNA分子实施例44)。

在其他优选的实施例中，本发明提供了一种gRNA分子(例如，其为sgRNA分子)，该gRNA分子包含以下序列，例如由其组成：(a)SEQ ID NO:351；(b)SEQ ID NO:352；或(c)SEQID NO:1764(在本发明内容中称为gRNA分子实施例45)。

在其他优选的实施例中，本发明提供了一种gRNA分子(例如，其为双gRNA分子)，该gRNA分子包含以下，例如由其组成：(a)crRNA和tracr，该crRNA包含SEQ ID NO:353，例如由其组成，并且该tracr包含SEQ ID NO:6660，例如由其组成；(b)crRNA和tracr，该crRNA包含SEQ ID NO:353，例如由其组成，并且该tracr包含SEQ ID NO:346，例如由其组成；(c)crRNA和tracr，该crRNA包含SEQ ID NO:354，例如由其组成，并且该tracr包含SEQ ID NO:6660，例如由其组成；或(d)crRNA和tracr，该crRNA包含SEQ ID NO:354，例如由其组成，并且该tracr包含SEQ ID NO:346，例如由其组成(在本发明内容中称为gRNA分子实施例46)。

在其他优选的实施例中，本发明提供了一种gRNA分子(例如，其为sgRNA分子)，该gRNA分子包含以下序列，例如由其组成：(a)SEQ ID NO:355；(b)SEQ ID NO:356；或(c)SEQID NO:1765(在本发明内容中称为gRNA分子实施例47)。

在其他优选的实施例中，本发明提供了一种gRNA分子(例如，其为双gRNA分子)，该gRNA分子包含以下，例如由其组成：(a)crRNA和tracr，该crRNA包含SEQ ID NO:357，例如由其组成，并且该tracr包含SEQ ID NO:6660，例如由其组成；(b)crRNA和tracr，该crRNA包含SEQ ID NO:357，例如由其组成，并且该tracr包含SEQ ID NO:346，例如由其组成；(c)crRNA和tracr，该crRNA包含SEQ ID NO:358，例如由其组成，并且该tracr包含SEQ ID NO:6660，例如由其组成；或(d)crRNA和tracr，该crRNA包含SEQ ID NO:358，例如由其组成，并且该tracr包含SEQ ID NO:346，例如由其组成(在本发明内容中称为gRNA分子实施例48)。

在其他优选的实施例中，本发明提供了一种gRNA分子(例如，其为sgRNA分子)，该gRNA分子包含以下序列，例如由其组成：(a)SEQ ID NO:359；(b)SEQ ID NO:360；或(c)SEQID NO:1766(在本发明内容中称为gRNA分子实施例49)。

在其他优选的实施例中，本发明提供了一种gRNA分子(例如，其为双gRNA分子)，该gRNA分子包含以下，例如由其组成：(a)crRNA和tracr，该crRNA包含SEQ ID NO:361，例如由其组成，并且该tracr包含SEQ ID NO:6660，例如由其组成；(b)crRNA和tracr，该crRNA包含SEQ ID NO:361，例如由其组成，并且该tracr包含SEQ ID NO:346，例如由其组成；(c)crRNA和tracr，该crRNA包含SEQ ID NO:362，例如由其组成，并且该tracr包含SEQ ID NO:6660，例如由其组成；或(d)crRNA和tracr，该crRNA包含SEQ ID NO:362，例如由其组成，并且该tracr包含SEQ ID NO:346，例如由其组成(在本发明内容中称为gRNA分子实施例50)。

在其他优选的实施例中，本发明提供了一种gRNA分子(例如，其为sgRNA分子)，该gRNA分子包含以下序列，例如由其组成：(a)SEQ ID NO:363；(b)SEQ ID NO:364；或(c)SEQID NO:1767(在本发明内容中称为gRNA分子实施例51)。

在其他优选的实施例中，本发明提供了一种gRNA分子(例如，其为双gRNA分子)，该gRNA分子包含以下，例如由其组成：(a)crRNA和tracr，该crRNA包含SEQ ID NO:365，例如由其组成，并且该tracr包含SEQ ID NO:6660，例如由其组成；(b)crRNA和tracr，该crRNA包含SEQ ID NO:365，例如由其组成，并且该tracr包含SEQ ID NO:346，例如由其组成；(c)crRNA和tracr，该crRNA包含SEQ ID NO:366，例如由其组成，并且该tracr包含SEQ ID NO:6660，例如由其组成；或(d)crRNA和tracr，该crRNA包含SEQ ID NO:366，例如由其组成，并且该tracr包含SEQ ID NO:346，例如由其组成(在本发明内容中称为gRNA分子实施例52)。

在其他优选的实施例中，本发明提供了一种gRNA分子(例如，其为sgRNA分子)，该gRNA分子包含以下序列，例如由其组成：(a)SEQ ID NO:367；(b)SEQ ID NO:368；或(c)SEQID NO:1768(在本发明内容中称为gRNA分子实施例53)。

在其他优选的实施例中，本发明提供了一种gRNA分子(例如，其为双gRNA分子)，该gRNA分子包含以下，例如由其组成：(a)crRNA和tracr，该crRNA包含SEQ ID NO:369，例如由其组成，并且该tracr包含SEQ ID NO:6660，例如由其组成；(b)crRNA和tracr，该crRNA包含SEQ ID NO:369，例如由其组成，并且该tracr包含SEQ ID NO:346，例如由其组成；(c)crRNA和tracr，该crRNA包含SEQ ID NO:370，例如由其组成，并且该tracr包含SEQ ID NO:6660，例如由其组成；或(d)crRNA和tracr，该crRNA包含SEQ ID NO:370，例如由其组成，并且该tracr包含SEQ ID NO:346，例如由其组成(在本发明内容中称为gRNA分子实施例54)。

在其他优选的实施例中，本发明提供了一种gRNA分子(例如，其为sgRNA分子)，该gRNA分子包含以下序列，例如由其组成：(a)SEQ ID NO:371；(b)SEQ ID NO:372；或(c)SEQID NO:1769(在本发明内容中称为gRNA分子实施例55)。

在其他优选的实施例中，本发明提供了一种gRNA分子(例如，其为双gRNA分子)，该gRNA分子包含以下，例如由其组成：(a)crRNA和tracr，该crRNA包含SEQ ID NO:373，例如由其组成，并且该tracr包含SEQ ID NO:6660，例如由其组成；(b)crRNA和tracr，该crRNA包含SEQ ID NO:373，例如由其组成，并且该tracr包含SEQ ID NO:346，例如由其组成；(c)crRNA和tracr，该crRNA包含SEQ ID NO:374，例如由其组成，并且该tracr包含SEQ ID NO:6660，例如由其组成；或(d)crRNA和tracr，该crRNA包含SEQ ID NO:374，例如由其组成，并且该tracr包含SEQ ID NO:346，例如由其组成(在本发明内容中称为gRNA分子实施例56)。

在其他优选的实施例中，本发明提供了一种gRNA分子(例如，其为sgRNA分子)，该gRNA分子包含以下序列，例如由其组成：(a)SEQ ID NO:375；(b)SEQ ID NO:376；或(c)SEQID NO:1770(在本发明内容中称为gRNA分子实施例57)。

在其他优选的实施例中，本发明提供了一种gRNA分子(例如，其为双gRNA分子)，该gRNA分子包含以下，例如由其组成：(a)crRNA和tracr，该crRNA包含SEQ ID NO:377，例如由其组成，并且该tracr包含SEQ ID NO:6660，例如由其组成；(b)crRNA和tracr，该crRNA包含SEQ ID NO:377，例如由其组成，并且该tracr包含SEQ ID NO:346，例如由其组成；(c)crRNA和tracr，该crRNA包含SEQ ID NO:378，例如由其组成，并且该tracr包含SEQ ID NO:6660，例如由其组成；或(d)crRNA和tracr，该crRNA包含SEQ ID NO:378，例如由其组成，并且该tracr包含SEQ ID NO:346，例如由其组成(在本发明内容中称为gRNA分子实施例58)。

在其他优选的实施例中，本发明提供了一种gRNA分子(例如，其为sgRNA分子)，该gRNA分子包含以下序列，例如由其组成：(a)SEQ ID NO:379；(b)SEQ ID NO:380；或(c)SEQID NO:1771(在本发明内容中称为gRNA分子实施例59)。

在其他优选的实施例中，本发明提供了一种gRNA分子(例如，其为双gRNA分子)，该gRNA分子包含以下，例如由其组成：(a)crRNA和tracr，该crRNA包含SEQ ID NO:381，例如由其组成，并且该tracr包含SEQ ID NO:6660，例如由其组成；(b)crRNA和tracr，该crRNA包含SEQ ID NO:381，例如由其组成，并且该tracr包含SEQ ID NO:346，例如由其组成；(c)crRNA和tracr，该crRNA包含SEQ ID NO:382，例如由其组成，并且该tracr包含SEQ ID NO:6660，例如由其组成；或(d)crRNA和tracr，该crRNA包含SEQ ID NO:382，例如由其组成，并且该tracr包含SEQ ID NO:346，例如由其组成(在本发明内容中称为gRNA分子实施例60)。

在其他优选的实施例中，本发明提供了一种gRNA分子(例如，其为sgRNA分子)，该gRNA分子包含以下序列，例如由其组成：(a)SEQ ID NO:383；(b)SEQ ID NO:384；或(c)SEQID NO:1772(在本发明内容中称为gRNA分子实施例61)。

在其他优选的实施例中，本发明提供了一种gRNA分子(例如，其为双gRNA分子)，该gRNA分子包含以下，例如由其组成：(a)crRNA和tracr，该crRNA包含SEQ ID NO:385，例如由其组成，并且该tracr包含SEQ ID NO:6660，例如由其组成；(b)crRNA和tracr，该crRNA包含SEQ ID NO:385，例如由其组成，并且该tracr包含SEQ ID NO:346，例如由其组成；(c)crRNA和tracr，该crRNA包含SEQ ID NO:386，例如由其组成，并且该tracr包含SEQ ID NO:6660，例如由其组成；或(d)crRNA和tracr，该crRNA包含SEQ ID NO:386，例如由其组成，并且该tracr包含SEQ ID NO:346，例如由其组成(在本发明内容中称为gRNA分子实施例62)。

在其他优选的实施例中，本发明提供了一种gRNA分子(例如，其为sgRNA分子)，该gRNA分子包含以下序列，例如由其组成：(a)SEQ ID NO:387；(b)SEQ ID NO:388；或(c)SEQID NO:1773(在本发明内容中称为gRNA分子实施例63)。

在其他优选的实施例中，本发明提供了一种gRNA分子(例如，其为双gRNA分子)，该gRNA分子包含以下，例如由其组成：(a)crRNA和tracr，该crRNA包含SEQ ID NO:389，例如由其组成，并且该tracr包含SEQ ID NO:6660，例如由其组成；(b)crRNA和tracr，该crRNA包含SEQ ID NO:389，例如由其组成，并且该tracr包含SEQ ID NO:346，例如由其组成；(c)crRNA和tracr，该crRNA包含SEQ ID NO:390，例如由其组成，并且该tracr包含SEQ ID NO:6660，例如由其组成；或(d)crRNA和tracr，该crRNA包含SEQ ID NO:390，例如由其组成，并且该tracr包含SEQ ID NO:346，例如由其组成(在本发明内容中称为gRNA分子实施例64)。

在其他优选的实施例中，本发明提供了一种gRNA分子(例如，其为sgRNA分子)，该gRNA分子包含以下序列，例如由其组成：(a)SEQ ID NO:391；(b)SEQ ID NO:392；或(c)SEQID NO:1774(在本发明内容中称为gRNA分子实施例65)。

在其他优选的实施例中，本发明提供了一种gRNA分子(例如，其为双gRNA分子)，该gRNA分子包含以下，例如由其组成：(a)crRNA和tracr，该crRNA包含SEQ ID NO:393，例如由其组成，并且该tracr包含SEQ ID NO:6660，例如由其组成；(b)crRNA和tracr，该crRNA包含SEQ ID NO:393，例如由其组成，并且该tracr包含SEQ ID NO:346，例如由其组成；(c)crRNA和tracr，该crRNA包含SEQ ID NO:394，例如由其组成，并且该tracr包含SEQ ID NO:6660，例如由其组成；或(d)crRNA和tracr，该crRNA包含SEQ ID NO:394，例如由其组成，并且该tracr包含SEQ ID NO:346，例如由其组成(在本发明内容中称为gRNA分子实施例66)。

在其他优选的实施例中，本发明提供了一种gRNA分子(例如，其为sgRNA分子)，该gRNA分子包含以下序列，例如由其组成：(a)SEQ ID NO:395；(b)SEQ ID NO:396；或(c)SEQID NO:1775(在本发明内容中称为gRNA分子实施例67)。

在其他优选的实施例中，本发明提供了一种gRNA分子(例如，其为双gRNA分子)，该gRNA分子包含以下，例如由其组成：(a)crRNA和tracr，该crRNA包含SEQ ID NO:397，例如由其组成，并且该tracr包含SEQ ID NO:6660，例如由其组成；(b)crRNA和tracr，该crRNA包含SEQ ID NO:397，例如由其组成，并且该tracr包含SEQ ID NO:346，例如由其组成；(c)crRNA和tracr，该crRNA包含SEQ ID NO:398，例如由其组成，并且该tracr包含SEQ ID NO:6660，例如由其组成；或(d)crRNA和tracr，该crRNA包含SEQ ID NO:398，例如由其组成，并且该tracr包含SEQ ID NO:346，例如由其组成(在本发明内容中称为gRNA分子实施例68)。

在实施例中，包括在任何上述方面和实施例中，本发明提供了一种gRNA分子，其中当将包含该gRNA分子的CRISPR系统(例如如本文所述的RNP)引入细胞中时，在与gRNA分子的靶向结构域互补的靶序列处或其附近形成插入/缺失。在实施例中，包括在包含与+58增强子区域的靶序列互补的靶向结构域的实施例中，该插入/缺失不包含GATA-1和/或TAL-1结合位点的核苷酸。在实施例中，该插入/缺失不干扰GATA-1和/或TAL-1与其结合位点的结合。在实施例中，包括在任何上述方面和实施例中，本发明提供了一种gRNA分子，其中当将包含该gRNA分子的CRISPR系统(例如如本文所述的RNP)引入细胞群中时，在该群的至少约40％，例如至少约50％、例如至少约60％、例如至少约70％、例如至少约80％、例如至少约90％、例如至少约95％、例如至少约96％、例如至少约97％、例如至少约98％、例如至少约99％的细胞中，在与gRNA分子的靶向结构域互补的靶序列处或其附近形成插入/缺失。在实施例中，包括在任何上述方面和实施例中，本发明提供了一种gRNA分子，其中当将包含该gRNA分子的CRISPR系统(例如如本文所述的RNP)引入细胞群中时，在该群的至少约20％，例如至少约30％、例如至少约35％、例如至少约40％、例如至少约45％、例如至少约50％、例如至少约55％、例如至少约60％、例如至少约65％、例如至少约70％、例如至少约75％、例如至少约80％、例如至少约85％、例如至少约90％、例如至少约95％、例如至少约99％的细胞中，在与gRNA分子的靶向结构域互补的靶序列处或其附近形成插入/缺失，该插入/缺失不包含GATA-1和/或TAL-1结合位点的核苷酸。在实施例中，包括在任何上述方面和实施例中，该插入/缺失是图25、表15、表26、表27或表37中任一个中列出的插入/缺失。在实施例中，在该群的至少约30％，例如至少约40％、例如至少约50％、例如至少约60％、例如至少约70％、例如至少约80％、例如至少约90％、例如至少约95％、例如至少约96％、例如至少约97％、例如至少约98％、例如至少约99％的细胞中，该插入/缺失是图25、表15、表26、表27或表37中任一个中列出的插入/缺失。在实施例中，所述细胞群中三个最常检测到的插入/缺失包括图25、表15、表26、表27或表37中任一个中列出的与任何gRNA分子相关的插入/缺失。在实施例中，该插入/缺失(或靠前的插入/缺失的模式)是如通过例如如本领域所述的下一代测序(NGS)所测量的。在实施例中，包括在任何上述方面和实施例中，本发明提供了一种gRNA分子，其中当将包含该gRNA分子的CRISPR系统(例如如本文所述的RNP)引入细胞中时，在所述细胞中不形成脱靶插入/缺失，例如如通过下一代测序和/或核苷酸插入测定可检测到的，例如在HPCS细胞(例如CD34+细胞)中测定。在实施例中，包括在任何上述方面和实施例中，本发明提供了一种gRNA分子，其中当将包含该gRNA分子的CRISPR系统(例如如本文所述的RNP)引入细胞群中时，在该细胞群的不多于约5％，例如不多于约1％、例如不多于约0.1％、例如不多于约0.01％的细胞中检测到脱靶插入/缺失，例如如通过下一代测序和/或核苷酸插入测定可检测到的，例如在HPSC细胞群(例如CD34+细胞群)中测定。

在实施例中，包括在任何上述方面和实施例中，本发明提供了一种gRNA分子，其中当将包含该gRNA分子的CRISPR系统(例如如本文所述的RNP)引入细胞中时，胎儿血红蛋白在所述细胞或其子代，例如其类红细胞子代，例如其红细胞子代中的表达增加。在实施例中，胎儿血红蛋白在所述细胞或其子代，例如其类红细胞子代，例如其红细胞子代中的表达增加至少约20％，例如至少约30％、例如至少约40％、例如至少约50％、例如至少约60％、例如至少约70％、例如至少约80％、例如至少约90％、例如至少约95％、例如至少约96％、例如至少约97％、例如至少约98％、例如至少约99％。在实施例中，所述细胞或其子代，例如其类红细胞子代，例如其红细胞子代产生每个细胞至少约6皮克(例如，至少约7皮克、至少约8皮克、至少约9皮克、至少约10皮克、或从约8皮克至约9皮克、或从约9皮克至约10皮克)胎儿血红蛋白。在实施例中，包括在任何上述方面和实施例中，本发明提供了一种gRNA分子，其中当将包含该gRNA分子的CRISPR系统(例如如本文所述的RNP)引入细胞中时，胎儿血红蛋白(例如γ珠蛋白)mRNA在所述细胞或其子代，例如其类红细胞子代，例如其红细胞子代中的水平增加。在实施例中，包括在任何上述方面和实施例中，本发明提供了一种gRNA分子，其中当将包含该gRNA分子的CRISPR系统(例如如本文所述的RNP)引入细胞中时，BCL11a mRNA在所述细胞或其子代，例如其类红细胞子代，例如其红细胞子代中的表达降低。在实施例中，包括在任何上述方面和实施例中，本发明提供了一种gRNA分子，其中当将包含该gRNA分子的CRISPR系统(例如如本文所述的RNP)引入细胞中时，BCL11a mRNA在所述细胞或其子代，例如其类红细胞子代，例如其红细胞子代中的水平降低。

在提及细胞的任何上述方面和实施例中，该细胞是(或细胞群包含)哺乳动物细胞、灵长类动物细胞或人细胞，例如是人细胞或人细胞群。在实施例中，该细胞是(或细胞群包含)HSPC，例如是CD34+，例如是CD34+CD90+。在实施例中，该细胞(或细胞群)相对于待施用所述细胞的患者是自体的。在其他实施例中，该细胞(或细胞群)相对于待施用所述细胞的患者是同种异体的。

在另一方面，本发明提供了一种组合物，该组合物包含：1)本文所述的一种或多种gRNA分子(包括第一gRNA分子)，例如任何先前方面和实施例的一种或多种gRNA分子，以及例如如本文所述的Cas9分子；2)本文所述的一种或多种gRNA分子(包括第一gRNA分子)，例如任何先前方面和实施例的一种或多种gRNA分子，以及编码Cas9分子的核酸(本文所述)；3)编码本文所述的一种或多种gRNA分子(包括第一gRNA分子)，例如任何先前方面和实施例的一种或多种gRNA分子的核酸，以及Cas9分子(本文所述)；4)编码本文所述的一种或多种gRNA分子(包括第一gRNA分子)，例如任何先前方面和实施例的一种或多种gRNA分子的核酸，以及编码Cas9分子的核酸(本文所述)；或5)以上1)至4)中的任一个，以及模板核酸；或6)以上1)至4)中的任一个，以及包含编码模板核酸的序列的核酸。

在优选的实施例中，本发明提供了一种组合物，该组合物包含第一gRNA分子(例如本文所述，例如任何先前gRNA分子方面和实施例的第一gRNA分子)，进一步包含Cas9分子(本文所述)。

在实施例中，该Cas9分子是有活性或无活性的酿脓链球菌Cas9。在实施例中，该Cas9分子包含SEQ ID NO:6611。在实施例中，该Cas9分子包含以下，例如由其组成：(a)SEQID NO:7821；(b)SEQ ID NO:7822；(c)SEQ ID NO:7823；(d)SEQ ID NO:7824；(e)SEQ IDNO:7825；(f)SEQ ID NO:7826；(g)SEQ ID NO:7827；(h)SEQ ID NO:7828；(i)SEQ ID NO:7829；(j)SEQ ID NO:7830；或(k)SEQ ID NO:7831。

在优选的实施例中，该第一gRNA分子和Cas9分子存在于核糖核蛋白复合物(RNP)中。

在实施例中，本发明提供了一种组合物，例如任何先前方面和实施例的组合物，该组合物进一步包含第二gRNA分子；第二gRNA分子和第三gRNA分子；或第二gRNA分子、任选地第三gRNA分子、以及任选地第四gRNA分子，其中第二gRNA分子、任选的第三gRNA分子和任选的第四gRNA分子是本文所述的gRNA分子的gRNA分子，例如任何先前gRNA分子方面和实施例的gRNA分子，并且其中该组合物的每种gRNA分子与不同的靶序列互补。

在实施例中，第一gRNA分子、第二gRNA分子、任选的第三gRNA分子和任选的第四gRNA分子中的两种或更多种与同一基因或区域内的靶序列互补。在实施例中，第一gRNA分子、第二gRNA分子、任选的第三gRNA分子和任选的第四gRNA分子与相隔不多于20000个核苷酸、不多于10000个核苷酸、不多于6000个核苷酸、不多于5000个核苷酸、不多于4000个核苷酸、不多于1000个核苷酸、不多于500个核苷酸、不多于400个核苷酸、不多于300个核苷酸、不多于200个核苷酸、不多于100个核苷酸、不多于90个核苷酸、不多于80个核苷酸、不多于70个核苷酸、不多于60个核苷酸、不多于50个核苷酸、不多于40个核苷酸、不多于30个核苷酸、不多于20个核苷酸、或不多于10个核苷酸的靶序列互补。

在其他实施例中，第一gRNA分子、第二gRNA分子、任选的第三gRNA分子和任选的第四gRNA分子中的两种或更多种与不同基因或区域内的靶序列互补。

在实施例中，包括在任何上述组合物方面和实施例中，本发明提供了包含第一gRNA分子和第二gRNA分子的组合物，其中第一gRNA分子和第二gRNA分子：

(a)独立地选自gRNA分子实施例4的gRNA分子，并且与不同的靶序列互补；

(b)独立地选自gRNA分子实施例5的gRNA分子，并且与不同的靶序列互补；

(c)独立地选自gRNA分子实施例6的gRNA分子，并且与不同的靶序列互补；或者

(d)独立地选自gRNA分子实施例7的gRNA分子，并且与不同的靶序列互补；或者

(e)独立地选自gRNA分子实施例41-56中任一个的gRNA分子，并且与不同的靶序列互补。

(a)独立地选自gRNA分子实施例10的gRNA分子，并且与不同的靶序列互补；或者

(b)独立地选自gRNA分子实施例11的gRNA分子，并且与不同的靶序列互补。

(a)独立地选自gRNA分子实施例13的gRNA分子，并且与不同的靶序列互补；或者

(b)独立地选自gRNA分子实施例14的gRNA分子，并且与不同的靶序列互补。

(a)独立地选自gRNA分子实施例16的gRNA分子，并且与不同的靶序列互补；

(b)独立地选自gRNA分子实施例17的gRNA分子，并且与不同的靶序列互补；

(c)独立地选自gRNA分子实施例18的gRNA分子，并且与不同的靶序列互补；或者

(d)独立地选自gRNA分子实施例57-68中任一个的gRNA分子，并且与不同的靶序列互补。

在实施例中，包括在任何上述组合物方面和实施例中，本发明提供了包含第一gRNA分子和第二gRNA分子的组合物，其中：

(1)第一gRNA分子：(a)选自gRNA分子实施例4的gRNA分子，(b)选自gRNA分子实施例5的gRNA分子，(c)选自gRNA分子实施例6的gRNA分子，(d)选自gRNA分子实施例7的gRNA分子，或(e)选自gRNA分子实施例41-56中任一个的gRNA分子；并且

(2)第二gRNA分子：(a)选自gRNA分子实施例10的gRNA分子，或(b)选自gRNA分子实施例11的gRNA分子。

(2)第二gRNA分子：(a)选自gRNA分子实施例13的gRNA分子，(b)选自gRNA分子实施例14的gRNA分子。

(2)第二gRNA分子：(a)选自gRNA分子实施例16的gRNA分子，(b)选自gRNA分子实施例17的gRNA分子，(c)选自gRNA分子实施例18的gRNA分子，或(d)选自gRNA分子实施例57-68中任一个的gRNA分子。

(1)第一gRNA分子：(a)选自gRNA分子实施例10的gRNA分子，或(b)选自gRNA分子实施例11的gRNA分子；并且

(1)第一gRNA分子：(a)选自gRNA分子实施例13的gRNA分子，(b)选自gRNA分子实施例14的gRNA分子；并且

(1)第一gRNA分子：(a)选自gRNA分子实施例16的gRNA分子，(b)选自gRNA分子实施例17的gRNA分子，(c)选自gRNA分子实施例18的gRNA分子，或(d)选自gRNA分子实施例57-68中任一个的gRNA分子；并且(2)第二gRNA分子包含与β珠蛋白基因的靶序列互补的靶向结构域；或者

(1)第一gRNA分子：(a)选自gRNA分子实施例4的gRNA分子，(b)选自gRNA分子实施例5的gRNA分子，(c)选自gRNA分子实施例6的gRNA分子，(d)选自gRNA分子实施例7的gRNA分子，(e)选自gRNA分子实施例41-56中任一个的gRNA分子，(f)选自gRNA分子实施例10的gRNA分子，(g)选自gRNA分子实施例11的gRNA分子，(h)选自gRNA分子实施例13的gRNA分子，或(i)选自gRNA分子实施例14的gRNA分子；并且(2)第二gRNA分子包含与β珠蛋白基因的靶序列互补的靶向结构域。

在实施例中，包括在任何上述组合物方面和实施例中，本发明提供了一种组合物，其中第一gRNA分子和第二gRNA分子独立地选自gRNA分子实施例41-68中任一个的gRNA分子。

在组合物的实施例中，就组合物的gRNA分子组成部分而言，该组合物由第一gRNA分子和第二gRNA分子组成。

在组合物的实施例中，每种所述gRNA分子处于具有本文所述的Cas9分子的核糖核蛋白复合物(RNP)中。

在实施例中，包括在任何上述组合物方面和实施例中，本发明提供了进一步包含模板核酸的组合物，其中该模板核酸包含与第一gRNA的靶序列处或其附近的核苷酸对应的核苷酸。在实施例中，该模板核酸包含编码以下的核酸：(a)人β珠蛋白(例如包含突变G16D、E22A和T87Q中的一个或多个的人β珠蛋白)或其片段；或(b)人γ珠蛋白或其片段。

在实施例中，包括在任何上述组合物方面和实施例中，该组合物被配制在适于电穿孔(例如适于电穿孔到HSPC细胞中)的介质中。在包含一种或多种gRNA分子的组合物的实施例中，每种所述gRNA分子处于具有本文所述的Cas9分子的RNP中，并且其中每种所述RNP的浓度小于约10uM，例如小于约3uM、例如小于约1uM、例如小于约0.5uM、例如小于约0.3uM、例如小于约0.1uM。

在另一方面，本发明提供了编码本文所述的一种或多种gRNA分子，例如任何先前方面和实施例的gRNA分子的核酸序列。在实施例中，该核酸包含与编码一种或多种gRNA分子的序列有效地连接的启动子，例如由RNA聚合酶II或RNA聚合酶III识别的启动子，例如U6启动子或HI启动子。在实施例中，该核酸进一步编码例如本文所述的Cas9分子，例如包含SEQ ID NO:6611、SEQ ID NO:7821、SEQ ID NO:7822、SEQ ID NO:7823、SEQ ID NO:7824、SEQ ID NO:7825、SEQ ID NO:7826、SEQ ID NO:7827、SEQ ID NO:7828、SEQ ID NO:7829、SEQ ID NO:7830、或SEQ ID NO:7831中任一个(例如由其组成)的Cas9分子。在实施例中，该核酸包含与编码Cas9分子的序列有效地连接的启动子，例如EF-1启动子、CMV IE基因启动子、EF-1α启动子、泛蛋白C启动子或磷酸甘油酸激酶(PGK)启动子。

在另一方面，本发明提供了一种载体，该载体包含任何先前核酸方面和实施例的核酸。在实施例中，该载体选自由以下组成的组：慢病毒载体、腺病毒载体、腺相关病毒(AAV)载体、单纯疱疹病毒(HSV)载体、质粒、微环、纳米质粒和RNA载体。

在另一方面，本发明提供了一种在细胞内的靶序列处或其附近改变所述细胞(例如细胞群)(例如改变核酸的结构(例如序列))的方法，该方法包括使所述细胞(例如细胞群)与以下进行接触(例如向所述细胞(例如细胞群)中引入)：1)任何先前gRNA分子方面和实施例的一种或多种gRNA分子、和Cas9分子(例如本文所述)；2)任何先前gRNA分子方面和实施例的一种或多种gRNA分子、和编码Cas9分子的核酸(例如本文所述)；3)编码任何先前gRNA分子方面和实施例的一种或多种gRNA分子的核酸、和Cas9分子(例如本文所述)；4)编码任何先前gRNA分子方面和实施例的一种或多种gRNA分子的核酸、和编码Cas9分子的核酸(例如本文所述)；5)以上1)至4)中的任一个、和模板核酸；6)以上1)至4)中的任一个、和包含编码模板核酸的序列的核酸；7)任何先前组合物方面和实施例的组合物；或8)任何先前载体方面和实施例的载体。在实施例中，该gRNA分子或编码gRNA分子的核酸以及该Cas9分子或编码Cas9分子的核酸被配制在单一组合物中。在其他实施例中，该gRNA分子或编码gRNA分子的核酸以及该Cas9分子或编码Cas9分子的核酸被配制在多于一种组合物中。在包含多于一种组合物的实施例中，同时或顺序地递送多于一种组合物。在实施例中，该细胞是动物细胞，例如哺乳动物细胞、灵长类动物细胞或人细胞。在实施例中，该细胞是造血干细胞或祖细胞(HSPC)(例如HSPC群)，例如该细胞是CD34+细胞，例如该细胞是CD34+CD90+细胞。在实施例中，将该细胞布置于包含已富集CD34+细胞的细胞群的组合物中。在实施例中，该细胞(例如细胞群)已自骨髓、动员的外周血或脐带血分离。在实施例中，该细胞相对于待施用所述细胞的患者是自体的。在其他实施例中，该细胞相对于待施用所述细胞的患者是同种异体的。在实施例中，该方法导致在与一种或多种gRNA分子的靶向结构域互补的基因组DNA序列处或其附近的插入/缺失，例如图25、表15、表26、表27或表37中所示的插入/缺失，例如如图25、表15、表26、表27或表37中所示的与gRNA分子的靶向结构域相关的插入/缺失。在实施例中，该插入/缺失是小于约40个核苷酸，例如小于30个核苷酸、例如小于20个核苷酸、例如小于10个核苷酸的插入或缺失，例如是单核苷酸缺失。在实施例中，该方法产生一种细胞群，其中该群的至少约50％，例如至少约60％、例如至少约70％、例如至少约80％、例如至少约90％(例如至少约95％、至少约96％、至少约97％、至少约98％、或至少约99％)的细胞已被改变，例如包含插入/缺失。在实施例中，该方法(例如对细胞群进行的方法，例如本文所述)产生一种细胞(例如细胞群)，该细胞(例如细胞群)能够分化成类红细胞谱系的分化的细胞(例如红细胞)，并且其中所述分化的细胞例如相对于未经改变的细胞(例如细胞群)表现出增加的胎儿血红蛋白水平。在实施例中，该方法产生一种细胞群，该细胞群能够分化成分化的细胞群，例如类红细胞谱系细胞群(例如红细胞群)，并且其中所述分化的细胞群例如相对于未经改变的细胞群具有增加的F细胞分数(例如，高至少约15％、高至少约20％、高至少约25％、高至少约30％、或高至少约40％)。在实施例中，该方法产生一种细胞，该细胞能够分化成分化的细胞，例如类红细胞谱系细胞(例如红细胞)，并且其中所述分化的细胞产生每个细胞至少约6皮克(例如，至少约7皮克、至少约8皮克、至少约9皮克、至少约10皮克、或从约8皮克至约9皮克、或从约9皮克至约10皮克)胎儿血红蛋白。在实施例中，该方法是离体进行的。在其他实施例中，该方法是在体内进行的。

在另一方面，本发明提供了一种通过任何先前方法方面和实施例的改变细胞的方法改变的细胞。

在另一方面，本发明提供了一种细胞，该细胞可通过任何先前方法方面和实施例的改变细胞的方法获得。

在另一方面，本发明提供了一种细胞，该细胞包含例如本文所述、例如任何先前gRNA分子方面和实施例的第一gRNA分子，或例如本文所述、例如任何先前组合物方面和实施例的组合物，例如本文所述、例如任何先前核酸方面和实施例的核酸，或例如本文所述、例如任何先前载体方面和实施例的载体。在实施例中，该细胞进一步包含例如本文所述的Cas9分子，例如包含SEQ ID NO:6611、SEQ ID NO:7821、SEQ ID NO:7822、SEQ ID NO:7823、SEQ ID NO:7824、SEQ ID NO:7825、SEQ ID NO:7826、SEQ ID NO:7827、SEQ ID NO:7828、SEQ ID NO:7829、SEQ ID NO:7830、或SEQ ID NO:7831中任一个(例如由其组成)的Cas9分子。在实施例中，该细胞包含、已包含或将包含例如本文所述、例如任何先前gRNA分子方面和实施例的第二gRNA分子，或编码例如本文所述、例如任何先前gRNA分子方面和实施例的第二gRNA分子的核酸，其中第一gRNA分子和第二gRNA分子包含不相同的靶向结构域。在实施例中，相对于未经修饰以包含gRNA分子的相同细胞类型的细胞或其子代，胎儿血红蛋白在所述细胞或其子代(例如其类红细胞子代，例如其红细胞子代)中的表达增加。在实施例中，该细胞能够分化成分化的细胞，例如类红细胞谱系细胞(例如红细胞)，并且其中所述分化的细胞例如相对于未经修饰以包含gRNA分子的相同类型的细胞表现出增加的胎儿血红蛋白水平。在实施例中，例如相对于未经修饰以包含gRNA分子的相同类型的细胞，该分化的细胞(例如类红细胞谱系细胞，例如红细胞)产生至少约6皮克(例如，至少约7皮克、至少约8皮克、至少约9皮克、至少约10皮克、或从约8皮克至约9皮克、或从约9皮克至约10皮克)胎儿血红蛋白。在实施例中，该细胞已经与例如本文所述的干细胞扩增剂(例如为化合物1、化合物2、化合物3、化合物4或其组合(例如化合物1和化合物4)的干细胞扩增剂，例如为化合物4的干细胞扩增剂)进行接触(例如离体接触)。在实施例中，包括在任何上述方面和实施例中，该细胞包含在与引入其中的gRNA分子(如本文所述，例如任何上述方面和实施例的gRNA分子)的靶向结构域互补的基因组DNA序列处或其附近的插入/缺失，例如图25、表15、表26、表27或表37中所示的插入/缺失，例如图25、表15、表26、表27或表37中所示的与引入其中的gRNA分子(如本文所述，例如任何上述方面和实施例的gRNA分子)相关的插入/缺失。在实施例中，该插入/缺失是小于约40个核苷酸，例如小于30个核苷酸、例如小于20个核苷酸、例如小于10个核苷酸的插入或缺失，例如该插入/缺失是单核苷酸缺失。在实施例中，包括在任何上述细胞方面和实施例中，该细胞是动物细胞，例如该细胞是哺乳动物细胞、灵长类动物细胞或人细胞。在实施例中，包括在任何上述细胞方面和实施例中，该细胞是造血干细胞或祖细胞(HSPC)(例如HSPC群)，例如该细胞是CD34+细胞，例如该细胞是CD34+CD90+细胞。在实施例中，包括在任何上述细胞方面和实施例中，该细胞(例如细胞群)已自骨髓、动员的外周血或脐带血分离。在实施例中，包括在任何上述细胞方面和实施例中，该细胞相对于待施用所述细胞的患者是自体的。在实施例中，该细胞相对于待施用所述细胞的患者是同种异体的。

在另一方面，本发明提供了一种包含任何先前细胞方面和实施例的细胞的细胞群。在实施例中，该群的至少约50％，例如至少约60％、例如至少约70％、例如至少约80％、例如至少约90％(例如至少约95％、至少约96％、至少约97％、至少约98％、或至少约99％)的细胞是根据任何先前细胞方面和实施例的细胞。在实施例中，该细胞群能够分化成分化的细胞群，例如类红细胞谱系细胞群(例如红细胞群)，并且其中所述分化的细胞群例如相对于相同类型的未经修饰的细胞群具有增加的F细胞分数(例如，高至少约15％、高至少约20％、高至少约25％、高至少约30％、或高至少约40％)。在实施例中，该分化的细胞群的F细胞产生每个细胞平均至少约6皮克(例如，至少约7皮克、至少约8皮克、至少约9皮克、至少约10皮克、或从约8皮克至约9皮克、或从约9皮克至约10皮克)胎儿血红蛋白。在实施例中，该群包含：1)至少1e6个CD34+细胞/kg待施用细胞的患者体重；2)至少2e6个CD34+细胞/kg待施用细胞的患者体重；3)至少3e6个CD34+细胞/kg待施用细胞的患者体重；4)至少4e6个CD34+细胞/kg待施用细胞的患者体重；或5)从2e6至10e6个CD34+细胞/kg待施用细胞的患者体重。在实施例中，该群的至少约40％，例如至少约50％(例如，至少约60％、至少约70％、至少约80％、或至少约90％)的细胞是CD34+细胞。在实施例中，该群的至少约10％，例如至少约15％、例如至少约20％、例如至少约30％的细胞是CD34+CD90+细胞。在实施例中，该细胞群源自骨髓、外周血(例如动员的外周血)、脐带血或诱导性多能干细胞(iPSC)。在一个优选的实施例中，该细胞群源自骨髓。在实施例中，该细胞群包含乳动物细胞，例如人细胞，例如由其组成。在实施例中，该细胞群相对于待将其施用至的患者是自体的。在其他实施例中，该细胞群相对于待将其施用至的患者是同种异体的。

在另一方面，本发明提供了一种组合物，该组合物包含任何先前细胞方面和实施例的细胞、或任何先前细胞群方面和实施例的细胞群。在实施例中，该组合物包含可药用介质，例如适于冷冻保存的可药用介质。

在另一方面，本发明提供了一种治疗血红蛋白病的方法，该方法包括向患者施用任何先前细胞方面和实施例的细胞、任何先前细胞群方面和实施例的细胞群、或者任何先前组合物方面和实施例的组合物。在实施例中，该血红蛋白病是地中海贫血(例如β-地中海贫血)或镰状细胞疾病。

在另一方面，本发明提供了一种增加哺乳动物中的胎儿血红蛋白表达的方法，该方法包括向患者施用任何先前细胞方面和实施例的细胞、任何先前细胞群方面和实施例的细胞群、或者任何先前组合物方面和实施例的组合物。

在另一方面，本发明提供了一种制备细胞(例如细胞群)的方法，该方法包括：(a)提供细胞(例如细胞群)(例如HSPC(例如HSPC群))；(b)在包含干细胞扩增剂的细胞培养基中离体培养所述细胞(例如，所述细胞群)；和(c)向所述细胞中引入第一gRNA分子(例如本文所述，例如任何先前gRNA分子方面和实施例的gRNA分子)、编码第一gRNA分子(例如本文所述，例如任何先前gRNA分子方面和实施例的gRNA分子)的核酸分子、组合物(例如本文所述，例如任何先前组合物方面和实施例的组合物)、核酸(例如本文所述，例如任何先前核酸方面和实施例的核酸)、或载体(例如本文所述，例如任何先前载体方面和实施例的载体)。在所述方法的实施例中，在所述引入步骤(c)之后，所述细胞(例如细胞群)能够分化成分化的细胞(例如分化的细胞群)，例如类红细胞谱系细胞(例如类红细胞谱系细胞群)，例如红细胞(例如红细胞群)，并且其中所述分化的细胞(例如分化的细胞群)例如相对于未经受步骤(c)的相同细胞产生增加的胎儿血红蛋白。在实施例中，包括在任何上述方法方面和实施例中，该干细胞扩增剂是化合物1、化合物2、化合物3、化合物4或其组合(例如，化合物1和化合物4)，例如是化合物4。在实施例中，包括在任何上述方法方面和实施例中，该细胞培养基包含促血小板生成素(Tpo)、Flt3配体(Flt-3L)和人干细胞因子(SCF)。在实施例中，包括在任何上述方法方面和实施例中，该细胞培养基进一步包含人白细胞介素-6(IL-6)。在实施例中，包括在任何上述方法方面和实施例中，该细胞培养基包含各自浓度范围从约10ng/mL至约1000ng/mL，例如浓度均为约50ng/mL，例如浓度为50ng/mL的促血小板生成素(Tpo)、Flt3配体(Flt-3L)和人干细胞因子(SCF)。在实施例中，包括在任何上述方法方面和实施例中，该细胞培养基包含浓度范围从约10ng/mL至约1000ng/mL，例如浓度为约50ng/mL，例如浓度为50ng/mL的人白细胞介素-6(IL-6)。在实施例中，包括在任何上述方法方面和实施例中，该细胞培养基包含浓度范围从约1nM至约1mM，例如浓度范围从约1uM至约100uM，例如浓度范围从约50uM至约75uM，例如浓度为约50uM，例如浓度为50uM，或浓度为约75uM，例如浓度为75uM的干细胞扩增剂。在实施例中，包括在任何上述方法方面和实施例中，培养步骤(b)包括在引入步骤(c)之前的培养期，例如，在引入步骤(c)之前的培养期为至少12小时，例如为约1天至约3天的时间段，例如为约1天至约2天的时间段，例如为约2天的时间段。在实施例中，包括在任何上述方法方面和实施例中，培养步骤(b)包括在引入步骤(c)之后的培养期，例如，在引入步骤(c)之后的培养期为至少12小时，例如为约1天至约10天的时间段，例如为约1天至约5天的时间段，例如为约2天至约4天的时间段，例如为约2天的时间段或为约3天的时间段或为约4天的时间段。在实施例中，包括在任何上述方法方面和实施例中，该细胞群例如相对于未根据步骤(b)培养的细胞扩增至少4倍，例如至少5倍、例如至少10倍。在实施例中，包括在任何上述方法方面和实施例中，引入步骤(c)包括电穿孔，例如包含1至5个脉冲，例如1个脉冲的电穿孔，并且其中每个脉冲处于范围从700伏至2000伏的脉冲电压下，并且具有范围从10ms至100ms的脉冲持续时间。在实施例中，包括在任何上述方法方面和实施例中，电穿孔包含1个脉冲，例如由其组成。在实施例中，包括在任何上述方法方面和实施例中，脉冲电压范围从1500伏至1900伏，例如为1700伏。在实施例中，包括在任何上述方法方面和实施例中，脉冲持续时间范围从10ms至40ms，例如为20ms。在实施例中，包括在任何上述方法方面和实施例中，步骤(a)中提供的细胞(例如细胞群)是人细胞(例如人细胞群)。在实施例中，包括在任何上述方法方面和实施例中，步骤(a)中提供的细胞(例如细胞群)自骨髓、外周血(例如动员的外周血)、脐带血或诱导性多能干细胞(iPSC)，优选骨髓分离。在实施例中，包括在任何上述方法方面和实施例中，步骤(a)中提供的细胞(例如细胞群)自骨髓分离，例如自患有血红蛋白病的患者的骨髓分离。在实施例中，包括在任何上述方法方面和实施例中，步骤(a)中提供的细胞群富含HSPC，例如CD34+细胞。在实施例中，包括在任何上述方法方面和实施例中，继引入步骤(c)之后，将该细胞(例如细胞群)冷冻保存。在实施例中，包括在任何上述方法方面和实施例中，继引入步骤(c)之后，该细胞(例如细胞群)包含在与第一gRNA分子的靶向结构域互补的基因组DNA序列处或其附近的插入/缺失，例如图25、表15、表26、表27或表37中所示的插入/缺失，例如图25、表15、表26、表27或表37中所示的与第一gRNA分子相关的插入/缺失。在实施例中，包括在任何上述方法方面和实施例中，在引入步骤(c)之后，该细胞群的至少约50％、至少约60％、至少约70％、至少约80％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％的细胞包含在与第一gRNA分子的靶向结构域互补的基因组DNA序列处或其附近的插入/缺失，例如图25、表15、表26、表27或表37中所示的插入/缺失，例如图25、表15、表26、表27或表37中所示的与第一gRNA分子相关的插入/缺失。

在另一方面，本发明提供了一种细胞(例如细胞群)，该细胞(例如细胞群)可通过任何先前方面和实施例的制备细胞的方法获得。在另一方面，本发明提供了一种治疗血红蛋白病(例如地中海贫血(例如β-地中海贫血)或镰状细胞疾病)的方法，该方法包括向人类患者施用包含所述细胞(例如细胞群)的组合物。在另一方面，本发明提供了一种增加人类患者中的胎儿血红蛋白表达的方法，该方法包括向所述人类患者施用包含所述细胞(例如细胞群)的组合物。在实施例中，向人类患者施用一种组合物，该组合物包含至少约1e6个细胞(例如CD34+细胞，例如可通过任何先前方面和实施例的制备细胞的方法获得的细胞)/kg人类患者体重，例如至少约1e6个可通过任何先前方面和实施例的制备细胞的方法获得的CD34+细胞/kg人类患者体重。在实施例中，向人类患者施用一种组合物，该组合物包含至少约2e6个细胞(例如CD34+细胞，例如可通过任何先前方面和实施例的制备细胞的方法获得的细胞)/kg人类患者体重，例如至少约2e6个可通过任何先前方面和实施例的制备细胞的方法获得的CD34+细胞/kg人类患者体重。在实施例中，向人类患者施用一种组合物，该组合物包含从约2e6至约10e6个细胞(例如CD34+细胞，例如可通过任何先前方面和实施例的制备细胞的方法获得的细胞)/kg人类患者体重，例如至少约2e6至约10e6个可通过任何先前方面和实施例的制备细胞的方法获得的CD34+细胞/kg人类患者体重。

在另一方面，本发明提供了本文所述的gRNA分子，例如任何先前gRNA分子方面和实施例的gRNA分子；本文所述的组合物，例如任何先前组合物方面和实施例的组合物；本文所述的核酸，例如任何先前核酸方面和实施例的核酸；本文所述的载体，例如任何先前载体方面和实施例的载体；本文所述的细胞，例如任何先前细胞方面和实施例的细胞；或本文所述的细胞群，例如任何先前细胞群方面和实施例的细胞群；用于作为药剂使用。

在另一方面，本发明提供了本文所述的gRNA分子，例如任何先前gRNA分子方面和实施例的gRNA分子；本文所述的组合物，例如任何先前组合物方面和实施例的组合物；本文所述的核酸，例如任何先前核酸方面和实施例的核酸；本文所述的载体，例如任何先前载体方面和实施例的载体；本文所述的细胞，例如任何先前细胞方面和实施例的细胞；或本文所述的细胞群，例如任何先前细胞群方面和实施例的细胞群；用于制备药剂。

在另一方面，本发明提供了本文所述的gRNA分子，例如任何先前gRNA分子方面和实施例的gRNA分子；本文所述的组合物，例如任何先前组合物方面和实施例的组合物；本文所述的核酸，例如任何先前核酸方面和实施例的核酸；本文所述的载体，例如任何先前载体方面和实施例的载体；本文所述的细胞，例如任何先前细胞方面和实施例的细胞；或本文所述的细胞群，例如任何先前细胞群方面和实施例的细胞群；用于治疗疾病。

在另一方面，本发明提供了本文所述的gRNA分子，例如任何先前gRNA分子方面和实施例的gRNA分子；本文所述的组合物，例如任何先前组合物方面和实施例的组合物；本文所述的核酸，例如任何先前核酸方面和实施例的核酸；本文所述的载体，例如任何先前载体方面和实施例的载体；本文所述的细胞，例如任何先前细胞方面和实施例的细胞；或本文所述的细胞群，例如任何先前细胞群方面和实施例的细胞群；用于治疗疾病，其中该疾病是血红蛋白病，例如地中海贫血(例如β-地中海贫血)或镰状细胞疾病。

附图说明

图1：Bcl11a +58类红细胞增强子区域的Cas9编辑。在通过脂质转染进行的靶向+58增强子区域的crRNA和trRNA的递送后24小时，在HEK-293 Cas9GFP中通过NGS检测到的编辑的分数。每个点表示不同的crRNA，trRNA保持恒定。基因组坐标表示例如参考hg38的染色体2上的位置。(n＝1)

图2：Bcl11a +62类红细胞增强子区域的Cas9编辑。在通过脂质转染进行的靶向+62增强子区域的crRNA和trRNA的递送后24小时，在HEK-293 Cas9GFP中通过NGS检测到的编辑的分数。每个点表示不同的crRNA，trRNA保持恒定。基因组坐标表示例如参考hg38的染色体2上的位置。(n＝1)

图3.在引入Cas9编辑系统后，用于选择细胞的门控策略。

图4.来自Cas9编辑系统处理的CD34+细胞的基因片段的琼脂糖凝胶电泳(显示了CD34+CD90+和CD34+CD90-细胞群两者、以及未分选的参考细胞)。上部条带表示未切割的同源双链DNA，并且下部条带表示由异源双链DNA产生的切割产物。最左边的泳道是DNA梯。通过ImageJ软件通过未处理图像的峰积分来计算条带强度。如下计算％基因修饰(插入/缺失)：％基因修饰＝100x(1-(1-切割分数(fraction cleaved))^1/2)，并且在凝胶的每个相应泳道的下方示出。

图5.显示由sgRNA分子靶向的基因组DNA的位点的类红细胞增强子区域，这些sgRNA分子包含与加下划线的核苷酸互补的靶向结构域。

图6A/6B.在CD34+ HSC细胞中由sgEH1(CR00276)(A)或sgEH2(CR00275)(B)引起的插入/缺失形成的NGS结果。插入用大写字母。缺失通过短划线表示。切割位点附近的微同源性区域以粗体下划线突出显示。

图6C/6D.在CD34+ HSC细胞中由sgEH8(CR00273)(C)或sgEH9(CR00277)(D)引起的插入/缺失形成的NGS结果。插入用大写字母。缺失通过短划线表示。切割位点附近的微同源性区域以粗体下划线突出显示。

图7.g7、g8和g2的NGS结果及其跨多个供体的插入/缺失模式形成。来自使用g7和g8的两个生物学重复实验的前3个插入/缺失的序列是相同的，并且使用g2的前3个插入/缺失的序列与来自先前实验的序列相同。

图8.使用经修饰的gRNA支架(BC)的NGS结果和插入/缺失模式形成。来自这些实验的前3个插入/缺失的序列与使用标准gRNA支架时形成的序列相同。

图9.跨不同递送方法的插入/缺失模式的比较。AVG％是指表现所示插入/缺失的NGS读数的％(2次实验的平均值)。

图10.由将g7 gRNA和g8 gRNA与非延伸标志杆区域(“reg”)或与第一标志杆延伸部和第一tracr延伸部(“BC”)共同引入引起的插入/缺失形成。将两种gRNA的PAM序列加框。

图11：针对CD34+细胞中BCL11a基因的+58增强子区域的靠前的gRNA序列，如通过NGS所测量的(n＝3)。

图12：针对CD34+细胞中BCL11a基因的+62增强子区域的靠前的gRNA序列，如通过NGS所测量的(n＝3)。

图13：当将靶向BCL11a+62增强子基因座的2种gRNA分子引入HEK293_Cas9细胞中时，当将CR00187(浅灰色条)或CR00202(深灰色条)保持恒定并与包含所示gRNA的靶向结构域的第二gRNA分子共同插入细胞中时的预测的切割大小。

图14：通过添加包含CR00187的靶向结构域的gRNA分子和图中所示的第二gRNA分子，在BCL11a的+62增强子内的基因组DNA的切除。星号(*)表示观察到的频率大于30％的切除；开角(^)表示观察到的频率较低(<30％)的切除。导致片段小于50nt的那些预测的切除产物不能被区分。

图15：通过添加包含CR00202的靶向结构域的gRNA分子和图中所示的第二gRNA分子，在BCL11a的+62增强子内的基因组DNA的切除。星号(*)表示观察到的频率大于30％的切除；开角(^)表示观察到的频率较低(<30％)的切除。

图16：由靶向法国HPFH区域的192种gRNA分子引起的％插入/缺失形成(SankaranVG等人A functional element necessary for fetal hemoglobin silencing.[胎儿血红蛋白沉默所必需的功能元件]NEJM[新英格兰医学杂志](2011)365:807-814)。

图17.将Cas9:gRNA核糖核蛋白(Cas9-RNP)递送至原代人CD34+HSPC中用于进行基因组编辑，随后进行遗传和表型表征的实验方案。

图18.将Cas9-RNP复合物模拟电穿孔或电穿孔到CD34+ HSPC中之后的细胞活力。在RNP复合物的电穿孔后，将HSPC体外扩增48小时并监测细胞活力并确定百分比存活力。在x轴上显示用于制造RNP复合物的gRNA的名称，并在y轴上显示相应的细胞活力。CRxxxx标识符表示gRNA分子的靶向结构域。

图19.使用T7内切核酸酶测定进行的错配检测。对人HSC进行电穿孔以递送RNP复合物以通过NHEJ将插入/缺失引入BCL11A类红细胞增强子的+58DHS区域中。使跨越靶区域的PCR扩增子经受T7E1测定并且通过2％琼脂糖凝胶电泳分析所得片段。+58类红细胞增强子BCL11A的区域被两种指导RNA形式(双指导RNA-黑色；单指导RNA-灰色(底图以及来自顶图的g7BCL11a-BC(1)和g7BCL11A-BC(2)))破坏。通过ImageJ软件(http:// rsb.info.nih.gov/ij/)估计DNA条带的强度以确定经编辑的等位基因的百分比。所使用的gRNA的名称和由错配检测测定确定的相应基因编辑效率也显示在凝胶图像下面的表格中。

图20：通过下一代测序测得的百分比等位基因编辑。标记如针对图18和图19所述。

图21.显示针对五种选择的gRNA观察到的菌落数和菌落类型的集落形成细胞(CFC)单位测定。将在+58类红细胞增强子处编辑的HSPC基因组铺板在甲基纤维素中，并使用STEMvision，使用形态学和表型标准，根据成熟细胞的数目和类型对克隆菌落进行分类和计数。菌落被分类为集落形成单位-类红细胞(CFU-E)、爆发集落形成单位-类红细胞(BFU-E)、集落形成单位-粒细胞/巨噬细胞(CFU-GM)和集落形成单位-粒细胞/类红细胞/巨噬细胞/巨核细胞(CFU-GEMM)。

图22.类红细胞分化期间细胞分裂的动力学。在类红细胞分化期间第0、7、14和21天确定的细胞总数和计算的细胞扩增倍数。

图23.在经基因组编辑和类红细胞分化的HSC中，BCL11A、γ-珠蛋白和β-珠蛋白的mRNA水平。通过实时PCR定量单系类红细胞培养物中BCL11A、γ-珠蛋白和β-珠蛋白链的相对mRNA表达。将转录物水平针对人GAPDH转录物水平进行标准化。

图24A.用破坏BCL11a增强子(+58)的双gRNA/cas9系统获得的HSC的高效编辑导致高水平的对HbF的诱导。使电穿孔后48小时的HSC经受体外类红细胞分化并测量HbF表达。在第7、14和21天通过FACS分析来监测HbF阳性细胞(F-细胞)的百分比。用dgRNA系统产生了该图中显示的数据，其中dgRNA包含所示靶向结构域。

图24B.用破坏BCL11a增强子(+58)的sgRNA/cas9系统获得的HSC的高效编辑导致高水平的对HbF的诱导。使电穿孔后48小时的HSC经受体外类红细胞分化并测量HbF表达。在第7、14和21天通过FACS分析来监测HbF阳性细胞(F-细胞)的百分比。用sgRNA系统产生了该图中显示的数据，其中sgRNA包含所示靶向结构域。

图25：通过包含所示靶向结构域的gRNA在HSPC中产生的插入/缺失模式。

图26A：在CD34+细胞扩增培养基中，通过细胞表面标志物染色对经编辑和未经编辑的培养物进行的表型分析。所有的gRNA分子都以dgRNA形式进行测试。所使用的Tracr为SEQ ID NO:7808，并且crRNA具有以下形式和序列，其中示出了2'O-甲基(m)和硫代磷酸酯键(*)修饰：mN*mN*mN*rNrNrNrNrNrNrNrNrNrNrNrNrNrNrNrNrNrGrUrUrUrUrArGrArGrCrUrArU*mG*mC*mU，其中N是所示靶向结构域的残基。所示为代表性点图，显示了如材料和方法中所述的用每种抗体组或相应的同种型对照染色的细胞的荧光。将所示的细胞通过正向和侧向散射特性和DAPI(4',6-二脒基-2-苯基吲哚)区别在活细胞群上进行预门控。图中顶部命名的每个细胞群的百分比由粗线框表示的门确定。

图26B：在CD34+细胞扩增培养基中，通过细胞表面标志物染色对经编辑和未经编辑的培养物进行的表型分析。所有的gRNA分子都以dgRNA形式进行测试。所使用的Tracr为SEQ ID NO:7808，并且crRNA具有以下形式和序列，其中示出了2'O-甲基(m)和硫代磷酸酯键(*)修饰：mN*mN*mN*rNrNrNrNrNrNrNrNrNrNrNrNrNrNrNrNrNrGrUrUrUrUrArGrArGrCrUrArU*mG*mC*mU，其中N是所示靶向结构域的残基。所示为在经编辑和未经编辑的培养物中每个命名的细胞群的百分比。经编辑的培养物的靶向结构域如所示。

图27.从用RNP编辑的CD34+细胞群分化的类红细胞中的％F细胞，这些RNP包含靶向HPFH区域内的两个位点的dgRNA。“g2”是阳性对照(对于BCL11a基因的编码区而言的靶向结构域)；“cntrl”是阴性对照(仅引入Cas9)。

图28A.在包含指定dgRNA(如所示的未经修饰的(unmod)或经修饰的)的RNP的电穿孔后第2天，如通过NGS确定的CD34+ HSPC中的％编辑。对照包含dgRNA，该dgRNA包含未经修饰的CR00317的靶向结构域(CR00317-m)，或包括仅在缓冲液中的电穿孔(无Cas9或gRNA；“模拟物”)。

图28B.在包含指定dgRNA(如所示的未经修饰的或经修饰的)的RNP的电穿孔后第2天，如通过NGS确定的CD34+ HSPC中的％编辑。对照包括仅在缓冲液中的电穿孔(无Cas9或gRNA；“模拟物”)。

图29.在包含指定sgRNA(如所示的未经修饰的或经修饰的)的RNP的电穿孔后第2天，如通过NGS确定的CD34+ HSPC中的％编辑。在每种情况下，数字对应于靶向结构域的CRxxxxxx标识符，例如未经修饰的sg312是指包含CR00312的靶向结构域的未经修饰的sgRNA。对照包括仅Cas9蛋白的电穿孔(“Cas9”)、仅有缓冲液情况下的电穿孔(“模拟物”)、或不包括电穿孔(“WT”)。

图30A.在用包含指定dgRNA(如所示的未经修饰的或经修饰的)的RNP电穿孔CD34+HSPC之后为HbF+，然后通过在类红细胞分化培养基中培养而诱导分化的标准化％红细胞(减去“模拟物”中的％F细胞)。对照包括仅缓冲液的电穿孔(“模拟物”)。

图30B.在用包含指定dgRNA(如所示的未经修饰的或经修饰的)的RNP电穿孔CD34+HSPC之后为HbF+，然后通过在类红细胞分化培养基中培养而诱导分化的标准化％红细胞(减去“模拟物”中的％F细胞)。对照包括仅缓冲液的电穿孔(“模拟物”)。

图31.在用包含指定sgRNA(如所示的未经修饰的或经修饰的)的RNP电穿孔CD34+HSPC之后为HbF+的标准化％红细胞(减去“模拟物”中的％F细胞)。在每种情况下，数字对应于靶向结构域的CRxxxxxx标识符，例如未经修饰的sg312是指包含CR00312的靶向结构域的未经修饰的sgRNA，然后通过在类红细胞分化培养基中培养而诱导分化。对照包括仅Cas9蛋白和tracr的电穿孔(“仅Cas9+TracRNA”)、仅有缓冲液情况下的电穿孔(“仅细胞+脉冲”)、或不包括电穿孔(“仅细胞，无脉冲”)。

图32.在将包含指定sgRNA(在每种情况下，数字对应于靶向结构域的CRxxxxxx标识符，例如未经修饰的sg312是指包含CR00312的靶向结构域的未经修饰的sgRNA)的RNP电穿孔到CD34+细胞中之后，在类红细胞分化后第14天在培养中的细胞扩增总倍数。对照包括仅Cas9蛋白和tracr的电穿孔(“仅Cas9+TracRNA”)、仅有缓冲液情况下的电穿孔(“仅细胞+脉冲”)、或不包括电穿孔(“仅细胞，无脉冲”)。

图33.由靶向BCL11a增强子区域的dgRNA分子指导的Cas9切割的潜在脱靶位点的评估。对于每种测试的指导RNA，三角形表示中靶位点，而空心圆圈表示潜在脱靶位点。

图34.由不同的Cas9变体引起的CD34+造血干细胞中靶B2M基因座处的编辑效率，如通过NGS和流式细胞术所评估的。NLS＝SV40NLS；His6或His8分别是指6个或8个组氨酸残基；TEV＝烟草蚀纹病毒切割位点；Cas9＝野生型酿脓链球菌Cas9-突变或变体如所示)。

图35.数据显示在扩增培养基中培养总共10天后(电穿孔前培养3天且电穿孔后培养7天)细胞数的增加倍数。在测试的所有指导RNA(包括单指导和双指导RNA形式)中，细胞扩增范围从2-7倍。箭头所示的CR00312和CR001128在细胞扩增10天后显示出3-6倍的增加。标记“Crxxxx”是指具有所示靶向结构域的dgRNA；“sgxxxx”是指具有相同数字的CRxxxxx标识符的靶向结构域的sgRNA(例如，sg312具有CR00312的靶向结构域)；“Unmod(未经修饰的)”表示对一种或多种RNA没有修饰；当与dgRNA相关而使用时，“O’MePS”是指具有三个3'和三个5'2'-OMe修饰和硫代磷酸酯键的crRNA，与未经修饰的tracr配对；当与sgRNA相关而使用时，“O’MePS”是指如下gRNA，该gRNA具有三个5'末端2'-OMe修饰和硫代磷酸酯键，三个3'末端硫代磷酸酯键，以及相对于末尾的第4个、相对于末尾的第3个和相对于末尾的第2个3'核苷酸的三个2'OMe修饰。

图36.用于区分不同HSPC亚群的门控策略。

图37.在指定培养基(用IL6、化合物4或IL6和化合物4两者改良的STF)中离体培养48小时后，但在CRISPR系统的电穿孔之前，每个造血子集的频率。STF＝StemSpan SFEM。

图38.在电穿孔引入靶向BCL11a的+58增强子的CRISPR系统后7天，在指定培养基(用IL6、化合物4或IL6和化合物4两者改良的STF)中培养的每个造血子集的频率。STF＝StemSpan SFEM。

图39A.使用不同RNP浓度进行基因编辑时的细胞活力，其中RNP含有靶向+58区域的dgRNA。

图39B.使用不同RNP浓度进行基因编辑时的细胞活力，其中RNP含有靶向+58区域的sgRNA。

图40A.使用不同RNP浓度进行基因编辑时通过NGS测量的基因编辑效率，其中RNP含有靶向+58区域的dgRNA。

图40B使用不同RNP浓度进行基因编辑时通过NGS测量的基因编辑效率，其中RNP含有靶向+58区域的sgRNA。

图41A.使用不同RNP浓度进行基因编辑时通过流式细胞术测量的HbF诱导的百分比，其中RNP含有靶向+58区域的dgRNA。

图41B使用不同RNP浓度进行基因编辑时通过流式细胞术测量的HbF诱导的百分比，其中RNP含有靶向+58区域的sgRNA。

图42A.具有不同Cas9蛋白的RNP的基因编辑效率。使用与未修饰形式的sgRNACR00312和sgRNA CR001128、或修饰形式的sgRNA CR00312和sgRNA CR001128相结合的不同Cas9变体(在X轴上列出)进行基因编辑。使经编辑的细胞经受NGS以确定％编辑(Y轴)。

图42B.使用不同的Cas9蛋白进行基因编辑时的HbF+细胞的诱导。使用与未修饰形式的sgRNA CR00312和sgRNA CR001128、或修饰形式的sgRNA CR00312和sgRNA CR001128相结合的不同Cas9变体(在X轴上列出)进行基因编辑。经编辑的细胞分化成类红细胞谱系，并使用与荧光团缀合的抗HbF抗体通过流式细胞术评估HbF产生。

图43.如通过NGS所确定的，在CD34+ HSPC中通过包含指定dgRNA或sgRNA(如所示的未经修饰的或经修饰的)的RNP的电穿孔的％编辑(标记是指如表36中所示的gRNA序列)。在电穿孔后2天(黑色条)或6天(灰色条)确定编辑。在仅Cas9蛋白和Tracr的对照电穿孔(“无”，数据未显示)之后，在每个位点检测到小于1.5％的编辑。显示了2次电穿孔重复的平均值+标准差。

图44.在将包含指定dgRNA或sgRNA(如所示的未经修饰的或经修饰的)的RNP电穿孔到CD34+ HSPC中之后为CD71+并在类红细胞分化条件下培养7天的活细胞的百分比(标记是指如表36中所示的gRNA序列)。电穿孔后，如实例4.7所述，通过方案1(黑色条)或方案2(灰色条)维持细胞。对照包括仅Cas9蛋白和Tracr的电穿孔(“无”)。显示了2次电穿孔重复的平均值+标准差。

图45.在将包含指定dgRNA或sgRNA(如所示的未经修饰的或经修饰的)的RNP电穿孔到CD34+ HSPC中之后为HbF+并在类红细胞分化条件下培养7天的类红细胞的百分比(标记是指如表36中所示的gRNA序列)。电穿孔后，如实例4.7所述，通过方案1(黑色条)或方案2(灰色条)维持细胞。对照包括仅Cas9蛋白和Tracr的电穿孔(“无”)。显示了2次电穿孔重复的平均值+标准差。

图46.在将包含指定dgRNA或sgRNA(如所示的未经修饰的或经修饰的)的RNP电穿孔到CD34+ HSPC中之后为HbF+并在类红细胞分化条件下培养14天的细胞的百分比(标记是指如表36中所示的gRNA序列)。电穿孔后，如实例4.7所述，通过方案1(黑色条)或方案2(灰色条)维持细胞。对照包括仅Cas9蛋白和Tracr的电穿孔(“无”)。显示了2次电穿孔重复的平均值+标准差。

图47.在将包含指定dgRNA或sgRNA(如所示的未经修饰的或经修饰的)的RNP电穿孔到CD34+ HSPC中之后为HbF+并在类红细胞分化条件下培养21天的细胞的百分比(标记是指如表36中所示的gRNA序列)。电穿孔后，如实例4.7所述，通过方案1(黑色条)或方案2(灰色条)维持细胞。对照包括仅Cas9蛋白和Tracr的电穿孔(“无”)。显示了2次电穿孔重复的平均值+标准差。

图48.在将包含指定dgRNA或sgRNA(如所示的未经修饰的或经修饰的)的RNP电穿孔到CD34+ HSPC中之后，类红细胞分化培养7天(黑色条)或21天(灰色条)中的细胞扩增总倍数(标记是指如表36中所示的gRNA序列)。电穿孔后，如实例4.7所述，通过方案2维持细胞。对照包括仅Cas9蛋白和Tracr的电穿孔(“无”)。显示了2次电穿孔重复的平均值+标准差。

图49.由靶向HPFH区域的dgRNA分子指导的Cas9切割的潜在脱靶位点的评估。对于每种测试的指导RNA，三角形表示中靶位点，而空心圆圈表示潜在脱靶位点。

定义

术语“CRISPR系统”、“Cas系统”或“CRISPR/Cas系统”是指包含RNA指导的核酸酶或其他效应分子和gRNA分子的一组分子，它们一起对于指导和实现由RNA指导的核酸酶或其他效应分子在靶序列处对核酸的修饰是必需且足够的。在一个实施例中，CRISPR系统包含gRNA和Cas蛋白(例如Cas9蛋白)。包含Cas9或经修饰的Cas9分子的此类系统在本文中称为“Cas9系统”或“CRISPR/Cas9系统”。在一个实例中，gRNA分子和Cas分子可以复合，以形成核糖核蛋白(RNP)复合物。

术语“指导RNA”、“指导RNA分子”、“gRNA分子”或“gRNA”可互换使用，并且是指促进将RNA指导的核酸酶或其他效应分子(通常与gRNA分子复合)特异性指导到靶序列上的一组核酸分子。在一些实施例中，通过将gRNA的部分与DNA杂交(例如通过gRNA靶向结构域)以及通过将gRNA分子的部分与RNA指导的核酸酶或其他效应分子结合(例如，至少通过gRNAtracr)来实现所述指导。在实施例中，gRNA分子由单个连续的多核苷酸分子组成，在本文中称为“单指导RNA”或“sgRNA”等。在其他实施例中，gRNA分子由多个，通常是两个多核苷酸分子组成，这些多核苷酸分子本身能够缔合，通常通过杂交，在本文中称为“双指导RNA”或“dgRNA”等。gRNA分子在下面更详细地描述，但通常包含靶向结构域和tracr。在实施例中，靶向结构域和tracr被布置于单个多核苷酸上。在其他实施例中，靶向结构域和tracr被布置于分开的多核苷酸上。

术语“靶向结构域”(当该术语与gRNA结合使用时)是gRNA分子的部分，其识别靶序列(例如细胞核酸内的靶序列，例如在基因内)，例如与其互补。

术语“crRNA”(当该术语与gRNA分子结合使用时)是gRNA分子的部分，其包含靶向结构域和与tracr相互作用以形成标志杆区域的区域。

术语“靶序列”是指与gRNA靶向结构域互补，例如完全互补的核酸序列。在实施例中，靶序列被布置于基因组DNA上。在一个实施例中，靶序列与由具有核酸酶或其他效应子活性的蛋白质识别的前间区邻近基序(PAM)序列(例如由Cas9识别的PAM序列)相邻(在DNA的相同链上或在DNA的互补链上)。在实施例中，靶序列是影响珠蛋白基因表达，例如影响β珠蛋白或胎儿血红蛋白(HbF)表达的基因或基因座内的靶序列。在实施例中，靶序列是珠蛋白基因座内的靶序列。在实施例中，靶序列是BCL11a基因内的靶序列。在实施例中，靶序列是BCL11a增强子区域内的靶序列。在实施例中，靶序列是HPFH区域内的靶序列。

如在本文中与gRNA分子结合使用的术语“标志杆(flagpole)”是指gRNA的部分，其中crRNA和tracr彼此结合或杂交。

如在本文中与gRNA分子结合使用的术语“tracr”是指gRNA的与核酸酶或其他效应分子结合的部分。在实施例中，tracr包含与Cas9特异性结合的核酸序列。在实施例中，tracr包含形成标志杆的部分的核酸序列。

术语“Cas9”或“Cas9分子”是指来自细菌II型CRISPR/Cas系统的负责DNA切割的酶。Cas9还包括野生型蛋白质及其功能性和非功能性突变体。在实施例中，Cas9为酿脓链球菌的Cas9。

如与核酸结合使用的术语“互补”是指碱基A与T或U和G与C的配对。术语互补是指完全互补的核酸分子，即整个参考序列中的形式A与T或U对和G与C对，以及至少80％、85％、90％、95％、99％互补的分子。

如与同源定向修复或同源重组结合使用的“模板核酸”是指通过CRISPR系统供体序列插入修饰位点以在切割位点处进行基因修复(插入)的核酸。

“插入/缺失(indel)”(当该术语在本文中使用时)是指相对于参考核酸包含一个或多个核苷酸插入、一个或多个核苷酸缺失、或核苷酸插入和缺失的组合的核酸，其在暴露于包含gRNA分子的组合物(例如CRISPR系统)之后产生。插入/缺失可以通过在暴露于包含gRNA分子的组合物之后对核酸进行测序来确定，例如通过NGS。关于插入/缺失的位点，如果插入/缺失包含参考位点的约10、9、8、7、6、5、4、3、2或1个核苷酸内的至少一个插入或缺失，或者插入/缺失与所述参考位点的部分或全部重叠(例如，包含至少一个与gRNA分子例如本文所述的gRNA分子的靶向结构域互补的位点的10、9、8、7、6、5、4、3、2或1个核苷酸重叠的插入或缺失，或至少一个在gRNA分子例如本文所述的gRNA分子的靶向结构域互补的位点的10、9、8、7、6、5、4、3、2或1个核苷酸内的插入或缺失)，则称插入/缺失位于参考位点(例如，与gRNA分子的靶向结构域互补的位点)“处或附近”。

“插入/缺失模式(indel pattern)”(当该术语在本文中使用时)是指在暴露于包含gRNA分子的组合物之后产生的一组插入/缺失。在一个实施例中，依据出现频率，插入/缺失模式由前三个插入/缺失组成。在一个实施例中，依据出现频率，插入/缺失模式由前五个插入/缺失组成。在一个实施例中，插入/缺失模式由相对于所有测序读数以大于约5％的频率存在的插入/缺失组成。在一个实施例中，插入/缺失模式由相对于插入/缺失测序读数(即，不是由未经修饰的参考核酸序列组成的那些读数)的总数以大于约10％的频率存在的插入/缺失组成。在一个实施例中，插入/缺失模式包含前五个最常观察到的插入/缺失中的任何3个。插入/缺失模式可以例如通过对暴露于gRNA分子的细胞群中的细胞进行测序来确定。

“脱靶插入/缺失”(当该术语在本文中使用时)是指在除了gRNA分子的靶向结构域的靶序列以外的位点处或其附近的插入/缺失。相对于gRNA的靶向结构域的序列，此类位点可以包含例如1、2、3、4、5个或更多个错配核苷酸。在示例性实施例中，使用经由电脑模拟预测的脱靶位点的靶向测序或通过本领域已知的插入方法来检测此类位点。

术语“一个/种(a和an)”是指一个/种或多于一个/种(即，至少一个/种)该冠词的语法宾语。通过举例，“一个元件”意指一个元件或多于一个元件。

当指可测量的值如量、时距等时，术语“约”意在涵盖与规定值±20％、或在一些情况下±10％、或在一些情况下±5％、或在一些情况下±1％、或在一些情况下±0.1％的变化，因为此类变化适于执行所披露的方法。

术语“抗原”或“Ag”是指引起免疫应答的分子。免疫应答可以涉及抗体产生或特定免疫活性细胞的活化或两者。技术人员将理解实际上包括所有蛋白质或肽的任何大分子都可以充当抗原。此外，抗原可以衍生自重组或基因组DNA。技术人员将理解包含编码引发免疫应答的蛋白质的核苷酸序列或部分核苷酸序列的任何DNA都因此编码“抗原”(当该术语在本文中使用时)。此外，本领域技术人员将理解抗原不需要仅由基因的全长核苷酸序列编码。显而易见的是，本发明包括但不限于使用多于一种基因的部分核苷酸序列，并且这些核苷酸序列以各种组合排列以编码引发所需免疫应答的多肽。另外，技术人员将理解抗原根本不需要由“基因”编码。显而易见的是，抗原可以合成或可以源自生物样品，或者可以是除多肽外的大分子。这种生物样品可以包括但不限于组织样品、细胞或具有其他生物组分的流体。

术语“自体的”是指源自与后来再将其引入到其中的同一个体的任何材料。

术语“同种异体的”是指源自与引入材料的个体相同的物种的不同动物的任何材料。当一个或多个基因座处的基因不相同时，称两个或更多个个体彼此是同种异体的。在一些方面，来自相同物种的个体的同种异体材料可以在遗传上充分不同以抗原性地相互作用。

术语“异种的”是指源自不同物种的动物的移植物。

“衍生自”(当该术语在本文中使用时)表示第一和第二分子之间的关系。它通常是指第一分子和第二分子之间的结构相似性，并不暗示或包括对衍生自第二分子的第一分子的过程或来源的限制。

术语“编码”是指多核苷酸(如基因、cDNA或mRNA)中特定核苷酸序列用作在生物过程中用于合成具有确定核苷酸序列(例如，rRNA、tRNA和mRNA)或确定氨基酸序列的其他聚合物和大分子的模板的固有特性，以及由此产生的生物学特性。因此，如果与基因对应的mRNA的转录和翻译在细胞或其他生物系统中产生蛋白质，则该基因、cDNA或RNA编码该蛋白质。编码链(其核苷酸序列与mRNA序列相同并且通常在序列表中提供)和非编码链(用作基因或cDNA转录的模板)都可以称为编码蛋白质或者该基因或cDNA的其他产物。

除非另外说明，否则“编码氨基酸序列的核苷酸序列”包括彼此呈简并形式且编码相同氨基酸序列的所有核苷酸序列。短语编码蛋白质或RNA的核苷酸序列还可以包含内含子，其程度为编码该蛋白质的核苷酸序列可以在某些形式中含有一个或多个内含子。

术语“有效量”或“治疗有效量”在本文中可互换使用，并且是指如本文所述的化合物、制剂、材料或组合物的有效于实现特定的生物学结果的量。

术语“内源的”是指来自生物体、细胞、组织或系统或在其内部产生的任何材料。

术语“外源的”是指从生物体、细胞、组织或系统引入或在其外部产生的任何材料。

术语“表达”是指由启动子驱动的特定核苷酸序列的转录和/或翻译。

术语“转移载体”是指包含分离的核酸并且可用于向细胞内部递送该分离的核酸的物质组合物。许多载体在本领域中是已知的，包括但不限于线性多核苷酸、与离子化合物或两亲化合物相关的多核苷酸、质粒、以及病毒。因此，术语“转移载体”包括自主复制的质粒或病毒。该术语还应当解释为进一步包括促进将核酸转移到细胞中的非质粒和非病毒化合物，例如像聚赖氨酸化合物、脂质体等。病毒转移载体的实例包括但不限于腺病毒载体、腺相关病毒载体、逆转录病毒载体、慢病毒载体等。

术语“表达载体”是指包含重组多核苷酸的载体，该重组多核苷酸包含与待表达的核苷酸序列有效地连接的表达控制序列。表达载体包含足够的用于表达的顺式作用元件；用于表达的其他元件可以由宿主细胞提供或在体外表达系统中提供。表达载体包括本领域已知的所有表达载体，包括掺入重组多核苷酸的粘粒、质粒(例如，裸露的或包含在脂质体中)和病毒(例如，慢病毒、逆转录病毒、腺病毒和腺相关病毒)。

术语“同源的”或“同一性”是指两个聚合分子之间，例如两个核酸分子(如两个DNA分子或两个RNA分子)之间或两个多肽分子之间的亚基序列同一性。当这两个分子中的亚基位置被相同的单体亚基占据时；例如，如果两个DNA分子中的每一个中的位置被腺嘌呤占据，则它们在该位置是同源的或相同的。两个序列之间的同源性是匹配位置或同源位置的数目的直接函数；例如，如果两个序列中一半的位置(例如，长度为十个亚基的聚合物中的五个位置)是同源的，则这两个序列是50％同源的；如果90％的位置(例如，10个中的9个)是匹配的或同源的，则这两个序列是90％同源的。

术语“分离的”意指从天然状态改变的或去除的。例如，天然存在于活体动物中的核酸或肽不是“分离的”，但是与其天然状态的共存材料部分或完全分开的相同核酸或肽是“分离的”。分离的核酸或蛋白质能以基本上纯化的形式存在，或者可以存在于非天然环境(例如像，宿主细胞)中。

术语“有效地连接”或“转录控制”是指调节序列和异源核酸序列之间的导致后者的表达的功能性连接。例如，当第一核酸序列被放置成与第二核酸序列有功能关系时，该第一核酸序列与该第二核酸序列有效地连接。例如，如果启动子影响编码序列的转录或表达，则该启动子与该编码序列有效地连接。有效地连接的DNA序列可以彼此邻接，并且例如在需要连接两个蛋白质编码区的情况下，它们处于同一阅读框中。

术语“肠胃外”施用免疫原性组合物包括例如皮下(s.c.)、静脉内(i.v.)、肌肉内(i.m.)、或胸骨内注射、瘤内或输注技术。

术语“核酸”或“多核苷酸”是指单链或双链形式的脱氧核糖核酸(DNA)或核糖核酸(RNA)及其聚合物。除非特别限定，否则该术语涵盖含有已知的天然核苷酸类似物的核酸，这些核酸具有与参考核酸类似的结合特性并且以与天然存在的核苷酸类似的方式进行代谢。除非另外指出，否则特定的核酸序列还隐含地涵盖其保守经修饰的变体(例如，简并密码子取代)、等位基因、直向同源物、SNP和互补序列以及明确指明的序列。具体地，简并密码子取代可以通过产生如下序列而获得，在这些序列中，一个或多个所选的(或全部)密码子的第三位被混合碱基和/或脱氧肌苷残基取代(Batzer等人,Nucleic Acid Res.[核酸研究]19:5081(1991)；Ohtsuka等人,J.Biol.Chem.[生物化学杂志]260:2605-2608(1985)；以及Rossolini等人,Mol.Cell.Probes[分子与细胞探针]8:91-98(1994))。

术语“肽”、“多肽”和“蛋白质”可互换使用，并且是指包含由肽键共价连接地氨基酸残基的化合物。蛋白质或肽必须含有至少两个氨基酸，并且对可构成蛋白质或肽序列的氨基酸的最大数目没有限制。多肽包括包含由肽键彼此相连的两个或更多个氨基酸的任何肽或蛋白质。如本文所用，该术语是指短链，例如其在本领域中通常也称为肽、寡肽和寡聚体，并且还是指较长的链，其在本领域中通常称为蛋白质，存在有很多类型的蛋白质。“多肽”包括例如生物活性片段、基本上同源的多肽、寡肽、同源二聚体、异源二聚体、多肽的变体、经修饰的多肽、衍生物、类似物、融合蛋白等。多肽包括天然肽、重组肽或其组合。

术语“启动子”是指启动多核苷酸序列的特异性转录所需的由细胞合成机器或引入的合成机器所识别的DNA序列。

术语“启动子/调节序列”是指表达与启动子/调节序列有效地连接的基因产物所需的核酸序列。在一些情况下，该序列可以是核心启动子序列，并且在其他情况下，该序列还可以包含增强子序列和表达基因产物所需的其他调节元件。启动子/调节序列可以是例如以组织特异性方式表达基因产物的启动子/调节序列。

术语“组成型”启动子是指当与编码或指定基因产物的多核苷酸有效地连接时，在细胞的大多数或全部生理条件下致使基因产物在细胞中产生的核苷酸序列。

术语“诱导型”启动子是指当与编码或指定基因产物的多核苷酸有效地连接时，基本上仅在对应于启动子的诱导物存在于细胞中时才致使基因产物在细胞中产生的核苷酸序列。

术语“组织特异性”启动子是指当与编码或由基因指定的多核苷酸有效地连接时，基本上仅在细胞是对应于启动子的组织类型的细胞时才致使基因产物在细胞中产生的核苷酸序列。

如在本文中与信使RNA(mRNA)结合使用，5'帽(也称为RNA帽、RNA 7-甲基鸟苷帽或RNA m7G帽)是已经在转录开始后不久添加到真核信使RNA的“前”端或5'端的经修饰的鸟嘌呤核苷酸。5'帽由与第一转录核苷酸连接的末端基团组成。它的存在对于被核糖体识别和被保护免于RNA酶至关重要。帽添加与转录偶联，并且共转录地发生，使得每个都影响另一个。在转录开始后不久，合成的mRNA的5'端被与RNA聚合酶相关的帽合成复合物结合。该酶促复合物催化mRNA加帽所需的化学反应。合成作为多步生物化学反应进行。可以修饰加帽部分以调节mRNA的功能，例如其稳定性或翻译效率。

如本文所用，“体外转录的RNA”是指已在体外合成的RNA，优选mRNA。通常，体外转录的RNA由体外转录载体产生。体外转录载体包含用于产生体外转录的RNA的模板。

如本文所用，“聚(A)”是通过聚腺苷酸化与mRNA连接的一系列腺苷。在用于瞬时表达的构建体的优选实施例中，聚A为50个至5000个之间(SEQ ID NO:6596)，优选大于64个，更优选大于100个，最优选大于300个或400个。聚(A)序列可以被化学修饰或酶促修饰以调节mRNA功能，如定位、稳定性或翻译效率。

如本文所用，“聚腺苷酸化”是指聚腺苷酰基部分或其经修饰的变体与信使RNA分子的共价连接。在真核生物中，大多数信使RNA(mRNA)分子在3'端被聚腺苷酸化。3'聚(A)尾是通过酶(聚腺苷酸聚合酶)的作用添加到前mRNA上的腺嘌呤核苷酸(通常数百个)的长序列。在高等真核生物中，将聚(A)尾添加到含有特定序列(聚腺苷酸化信号)的转录物上。聚(A)尾和与其结合的蛋白质有助于保护mRNA免于被外切核酸酶降解。聚腺苷酸化对于转录终止、从细胞核输出mRNA以及翻译也是重要的。聚腺苷酸化在DNA转录成RNA后立即在细胞核中发生，但另外也可稍后在细胞质中发生。转录终止后，通过与RNA聚合酶相关的内切核酸酶复合物的作用切割mRNA链。切割位点通常被表征为切割位点附近存在碱基序列AAUAAA。在mRNA被切割后，腺苷残基被添加到切割位点处的游离3'端上。

如本文所用，“瞬时”是指非整合转基因的持续数小时、数天或数周的表达，其中表达的时间段小于如果整合到基因组中或包含在宿主细胞中的稳定质粒复制子内的基因的表达的时间段。

如本文所用，术语“治疗(treat、treatment和treating)”是指减少或缓解病症例如血红蛋白病的进展、严重性和/或持续时间，或者缓解病症例如血红蛋白病的一种或多种症状(优选地，一种或多种可辨别的症状)，这由施用一种或多种疗法(例如一种或多种治疗剂，如本发明的gRNA分子、CRISPR系统或经修饰的细胞)引起。在具体的实施例中，术语“治疗(treat、treatment和treating)”是指改善血红蛋白病病症的至少一种可测量的物理参数，这是患者无法辨别的。在其他实施例中，术语“治疗(treat、treatment和treating)”是指通过例如稳定可辨别的症状来物理地，通过例如稳定物理参数来生理地，或通过两者，抑制病症的进展。在其他实施例中，术语“治疗(treat、treatment和treating)”是指减少或稳定血红蛋白病例如镰状细胞疾病病或β-地中海贫血的症状。

术语“信号转导途径”是指在多种信号转导分子之间的生物化学关系，这些信号转导分子在信号从细胞的部分传递至细胞的另一部分中发挥作用。短语“细胞表面受体”包括能够接收信号并且传递信号跨过细胞膜的分子以及分子复合物。

术语“受试者”旨在包括可以在其中引发免疫应答的活生物体(例如，哺乳动物、人)。

术语“基本上纯化的”细胞是指基本上不含其他细胞类型的细胞。基本上纯化的细胞还指已经与其天然存在状态下正常相关的其他细胞类型分离的细胞。在一些情况下，基本上纯化的细胞群是指同源的细胞群。在其他情况下，该术语仅指已经与其天然状态下天然相关的细胞分离的细胞。在一些方面，在体外培养细胞。在其他方面，不在体外培养细胞。

如本文所用的术语“治疗剂”意指治疗。通过减少、抑制、缓解或根除疾病状态来获得治疗效果。

如本文所用的术语“预防”意指对疾病或疾病状态的预防或保护性治疗。

术语“转染的”或“转化的”或“转导的”是指将外源核酸和/或蛋白质转移或引入宿主细胞中的过程。“转染的”或“转化的”或“转导的”细胞是已经使用外源核酸和/或蛋白质转染、转化或转导的细胞。细胞包括原代主题细胞及其子代。

术语“特异性结合”是指识别并结合样品中存在的结合配偶体(例如蛋白质或核酸)的分子，但该分子基本上不识别或结合样品中的其他分子。

术语“生物当量”是指产生与参考剂量或参考量的参考化合物产生的效果相当的效果所需的除参考化合物之外的试剂的量。

如本文所用的“难治性”是指对治疗无响应的疾病，例如血红蛋白病。在实施例中，难治性血红蛋白病可以在治疗开始之前或治疗开始时对治疗具有抗性。在其他实施例中，难治性血红蛋白病可能在治疗期间变得有抗性。难治性血红蛋白病也称为抗性血红蛋白病。

如本文所用的“复发”是指疾病(例如血红蛋白病)或疾病的体征和症状(如改善期之后，例如在疗法(例如血红蛋白病疗法)的先前治疗后的血红蛋白病)的回返。

范围：贯穿本披露，能以范围形式呈现本发明的各个方面。应该理解的是，范围形式的描述仅仅是为了方便以及简洁，不应该被理解为对本发明范围的不灵活的限制。因此，范围的描述应当被认为是具有确切披露的所有可能的子范围以及该范围内的单独数值。例如，范围如从1至6的描述应当被认为是具有确切披露的子范围，如从1至3、从1至4、从1至5、从2至4、从2至6、从3至6等，以及该范围内的单独数字，例如1、2、2.7、3、4、5、5.3和6。作为另一个实例，范围如95％-99％同一性包括具有95％、96％、97％、98％或99％同一性，并且包括如96％-99％、96％-98％、96％-97％、97％-99％、97％-98％和98％-99％同一性的子范围。无论范围的宽度如何，这都适用。

术语“BCL11a”是指B细胞淋巴瘤/白血病11A(一种RNA聚合酶II核心启动子近端区序列特异性DNA结合蛋白)以及编码所述蛋白质的基因、以及所有内含子和外显子。该基因编码C2H2型锌指蛋白。已发现BCL11A在抑制胎儿血红蛋白产生中起作用。BCL11a也称为B细胞CLL/淋巴瘤11A(锌指蛋白)、CTIP1、EVI9、嗜亲性病毒整合位点9蛋白同系物、COUP-TF-相互作用蛋白1、锌指蛋白856、KIAA1809、BCL-11A、ZNF856、EVI-9、以及B细胞CLL/淋巴瘤11A。该术语涵盖BLC11a的所有同种型和剪接变体。编码BCL11a的人基因被定位于染色体位置2p16.1(通过Ensembl)。人和鼠氨基酸和核酸序列可以在公共数据库如GenBank、UniProt和Swiss-Prot中找到，并且人BCL11a的基因组序列可以在GenBank中的NC_000002.12找到。BCL11a基因是指这个基因组位置，包括所有内含子和外显子。BCL11a有多种已知的同种型。

编码人BCL11a的同种型1的mRNA序列可在NM_022893找到。人BCL11a的同种型1的肽序列是：

SEQ ID NO:21-1(标识符Q9H165-1；和NM_022893.3；以及登录号ADL14508.1)。

其他BCL11a蛋白同种型的序列提供于：

同种型2：Q9H165-2

同种型3：Q9H165-3

同种型4：Q9H165-4

同种型5：Q9H165-5

同种型6：Q9H165-6

如本文所用，人BCL11a蛋白还涵盖在其全长上与BCL11a同种型1-6具有至少约70％、71％、72％、73％、74％、75％、76％、77％、78％、79％、80％、81％、82％、83％、84％、85％、86％、87％、88％、89％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％序列同一性的蛋白质，其中此类蛋白质仍然具有BCL11a的至少一种功能。

如本文所用的术语“珠蛋白基因座”是指人染色体11的区域，其包含胚胎(ε)、胎儿(G(γ)和A(γ))基因，成人珠蛋白基因(γ和β)，基因座控制区域和DNA酶I超敏感性位点。

术语“HPFH”是指遗传性胎儿血红蛋白持续存在综合征，其特征在于成人红细胞中胎儿血红蛋白增加。术语“HPFH区域”是指如下基因组位点，其在被修饰(例如，突变或缺失)时引起成人红细胞中HbF产生增加，并且包括文献中鉴定的HPFH位点(参见例如，theOnline Mendelian Inheritance in Man[在线人孟德尔遗传]：http://www.omim.org/entry/141749)。在一个示例性实施例中，HPFH区域是位于染色体11p15上的β珠蛋白基因簇内的区域或包含染色体11p15上的β珠蛋白基因簇的区域。在一个示例性实施例中，HPFH区域位于至少部分δ珠蛋白基因内或包含至少部分δ珠蛋白基因。在一个示例性实施例中，HPFH区域是HBG1的启动子的区域。在一个示例性实施例中，HPFH区域是HBG1的启动子的区域。在一个示例性实施例中，HPFH区域是在Sankaran VG等人NEJM[新英格兰医学杂志](2011)365:807-814中描述的区域。在一个示例性实施例中，HPFH区域是法国断点缺失性HPFH，如在Sankaran VG等人NEJM[新英格兰医学杂志](2011)365:807-814中所述。在一个示例性实施例中，HPFH区域是阿尔及利亚HPFH，如在Sankaran VG等人NEJM[新英格兰医学杂志](2011)365:807-814中所述。在一个示例性实施例中，HPFH区域是斯里兰卡HPFH，如在Sankaran VG等人NEJM[新英格兰医学杂志](2011)365:807-814中所述。在一个示例性实施例中，HPFH区域是HPFH-3，如在Sankaran VG等人NEJM[新英格兰医学杂志](2011)365:807-814中所述。在一个示例性实施例中，HPFH区域是HPFH-2，如在Sankaran VG等人NEJM[新英格兰医学杂志](2011)365:807-814中所述。在一个实施例中，HPFH-1区域是HPFH-3，如在Sankaran VG等人NEJM[新英格兰医学杂志](2011)365:807-814中所述。在一个示例性实施例中，HPFH区域是斯里兰卡(δβ)⁰-地中海贫血HPFH，如在Sankaran VG等人NEJM[新英格兰医学杂志](2011)365:807-814中所述。在一个示例性实施例中，HPFH区域是西西里(δβ)⁰-地中海贫血HPFH，如在Sankaran VG等人NEJM[新英格兰医学杂志](2011)365:807-814中所述。在一个示例性实施例中，HPFH区域是马其顿(δβ)⁰-地中海贫血HPFH，如在Sankaran VG等人NEJM[新英格兰医学杂志](2011)365:807-814中所述。在一个示例性实施例中，HPFH区域是库尔德β⁰-地中海贫血HPFH，如在Sankaran VG等人NEJM[新英格兰医学杂志](2011)365:807-814中所述。在一个示例性实施例中，HPFH区域是位于Chr11:5213874-5214400(hg18)处的区域。在一个示例性实施例中，HPFH区域是位于Chr11:5215943-5215046(hg18)处的区域。在一个示例性实施例中，HPFH区域是位于Chr11:5234390-5238486(hg38)处的区域。

“BCL11a增强子”(当该术语在本文中使用时)是指影响例如增强BCL11a的表达或功能的核酸序列。参见例如，Bauer等人,Science[科学],第342卷,2013,第253-257页。BCL11a增强子可以例如仅在某些细胞类型(例如类红细胞谱系细胞)中有效。BCL11a增强子的一个实例是BCL11a基因的外显子2和外显子3之间的核酸序列(例如，位于或对应于如hg38中所记录的位置+55:Chr2:60497676-60498941；+58:Chr2:60494251-60495546；+62:Chr2:60490409-60491734处的核酸)。在一个实施例中，BCL11a增强子是BCL11a基因的外显子2和外显子3之间的核酸序列的+62区域。在一个实施例中，BCL11a增强子是BCL11a基因的外显子2和外显子3之间的核酸序列的+58区域。在一个实施例中，BCL11a增强子是BCL11a基因的外显子2和外显子3之间的核酸序列的+55区域。

术语“造血干细胞和祖细胞”或“HSPC”可互换使用，并且是指包含造血干细胞(“HSC”)和造血祖细胞(“HPC”)两者的细胞群。此类细胞被表征为例如CD34+。在示例性实施例中，HSPC自骨髓分离。在其他示例性实施例中，HSPC自外周血分离。在其他示例性实施例中，HSPC自脐带血分离。

如本文所用的“干细胞扩增剂”是指相对于不存在所述试剂的相同细胞类型，使细胞(例如HSPC、HSC和/或HPC)以更快的速率增殖(例如数量增加)的化合物。在一个示例性方面，干细胞扩增剂是芳烃受体途径的抑制剂。下面提供了干细胞扩增剂的其他实例。在实施例中，离体完成增殖，例如数量增加。

“植入(engraftment或engraft)”是指将细胞或组织(例如HSPC群)掺入受者(例如哺乳动物或人受试者)的体内。在一个实例中，植入包括植入的细胞在受者中的生长、扩增和/或分化。在一个实例中，HSPC的植入包括所述HSPC在受者体内分化并生长成类红细胞。

如本文所用的术语“造血祖细胞”(HPC)是指原始造血细胞，其具有有限的自我更新能力和取决于造血等级内的放置的多谱系分化(例如，髓样、淋巴样)、单谱系分化(例如，髓样或淋巴样)或细胞类型限制性分化(例如，类红细胞祖细胞)的潜能(Doulatov等人,Cell Stem Cell[细胞干细胞]2012)。

如本文所用的“造血干细胞”(HSC)是指未成熟的血细胞，其具有自我更新和分化成更成熟的血细胞的能力，这些更成熟的血细胞包括粒细胞(例如，早幼粒细胞、嗜中性粒细胞、嗜酸性粒细胞、嗜碱性粒细胞)、红细胞(例如，网织红细胞、红细胞)、凝血细胞(例如，原巨核细胞、血小板生成型巨核细胞、血小板)和单核细胞(例如，单核细胞、巨噬细胞)。在整个说明书中，HSC可互换地描述为干细胞。本领域已知此类细胞可以包括或可以不包括CD34+细胞。CD34+细胞是表达CD34细胞表面标志物的未成熟细胞。据信CD34+细胞包括具有以上定义的干细胞特性的细胞亚群。本领域众所周知，HSC是多能细胞，其可以产生原始祖细胞(例如，多能祖细胞)和/或定向于特定造血谱系的祖细胞(例如，淋巴祖细胞)。定向于特定造血谱系的干细胞可以属于T细胞谱系、B细胞谱系、树突细胞谱系、朗格汉斯细胞谱系和/或淋巴组织特异性巨噬细胞谱系。此外，HSC还指长期HSC(LT-HSC)和短期HSC(ST-HSC)。ST-HSC比LT-HSC更活跃且更具增殖性。然而，LT-HSC具有无限的自我更新(即，它们在整个成年期存活)，而ST-HSC具有有限的自我更新(即，它们仅存活有限的时间段)。任何这些HSC都可以用于本文所述的任何方法中。任选地，ST-HSC是有用的，因为它们具高度增殖性，因此快速增加HSC及其子代的数量。造血干细胞任选地获得自血液制品。血液制品包括从体内或含有造血来源的细胞的身体器官获得的产品。此类来源包括未分级的骨髓、脐带、外周血(例如动员的外周血，例如用动员剂如G-CSF或(AMD3100)动员的外周血)、肝脏、胸腺、淋巴和脾。所有上述粗制或未分级的血液制品都能以本领域技术人员已知的方法富集具有造血干细胞特征的细胞。在一个实施例中，HSC被表征为CD34+/CD38-/CD90+/CD45RA-。在实施例中，HSC被表征为CD34+/CD90+/CD49f+细胞。

细胞背景下的“扩增(expansion或expand)”是指来自细胞(其可以相同或不同)的初始细胞群的特有的一种或多种细胞类型的数量增加。用于扩增的初始细胞可能与产自扩增的细胞不同。

“细胞群”是指从生物来源(例如血液制品或组织)分离并且源自多于一种细胞的真核哺乳动物(优选人)细胞。

当在细胞群背景下使用时，“富集”是指基于一种或多种标志物(例如CD34+)的存在而选择的细胞群。

术语“CD34+细胞”是指在其表面表达CD34标志物的细胞。可以使用例如流式细胞术和荧光标记的抗CD34抗体来检测和计数CD34+细胞。

“富含CD34+细胞”意指已经基于CD34标志物的存在选择细胞群。因此，选择方法之后细胞群中CD34+细胞的百分比高于基于CD34标志物的选择步骤之前初始细胞群中CD34+细胞的百分比。例如，CD34+细胞可代表富含CD34+细胞的细胞群中至少50％、60％、70％、80％或至少90％的细胞。

术语“F细胞”和“F-细胞”是指含有和/或产生(例如表达)胎儿血红蛋白的细胞，通常是红细胞(例如红细胞)。例如，F-细胞是含有或产生可检测水平的胎儿血红蛋白的细胞。例如，F-细胞是含有或产生至少5皮克胎儿血红蛋白的细胞。在另一个实例中，F-细胞是含有或产生至少6皮克胎儿血红蛋白的细胞。在另一个实例中，F-细胞是含有或产生至少7皮克胎儿血红蛋白的细胞。在另一个实例中，F-细胞是含有或产生至少8皮克胎儿血红蛋白的细胞。在另一个实例中，F-细胞是含有或产生至少9皮克胎儿血红蛋白的细胞。在另一个实例中，F-细胞是含有或产生至少10皮克胎儿血红蛋白的细胞。可以使用本文所述的测定法或通过本领域已知的其他方法，例如使用抗胎儿血红蛋白检测试剂的流式细胞术、高效液相色谱法、质谱法或酶联免疫吸附测定法来测量胎儿血红蛋白的水平。

除非另有说明，否则所有基因组或染色体坐标均根据hg38。

具体实施方式

本文所述的gRNA分子、组合物和方法涉及使用CRISPR/Cas9系统在真核细胞中进行基因组编辑。具体地，本文所述的gRNA分子、组合物和方法涉及珠蛋白水平的调节，并且可用于例如调节珠蛋白基因和蛋白质的表达和生产。这些gRNA分子、组合物和方法可用于治疗血红蛋白病。

I.gRNA分子

gRNA分子可具有许多结构域，如下文更全面描述的，然而，gRNA分子通常包含至少一个crRNA结构域(包含靶向结构域)和tracr。用作CRISPR系统的组分的本发明的gRNA分子可用于在靶位点处或附近修饰(例如，修饰序列)DNA。此类修饰包括缺失和或插入，这些缺失和或插入导致例如包含靶位点的基因的功能产物的表达降低或消除。下面更全面地描述了这些用途和另外的用途。

在一个实施例中，单分子或sgRNA优选从5'至3'包含：crRNA(其含有与靶序列互补的靶向结构域和形成标志杆的部分的区域(即crRNA标志杆区域))；环；和tracr(其含有与crRNA标志杆区域互补的结构域、和另外结合核酸酶或其他效应分子(例如Cas分子，例如Cas9分子)的结构域)；并且可以采用以下形式(从5'至3')：

[靶向结构域]-[crRNA标志杆区域]-[任选的第一标志杆延伸部]-[环]-[任选的第一tracr延伸部]-[tracr标志杆区域]-[tracr核酸酶结合结构域]。

在实施例中，tracr核酸酶结合结构域结合Cas蛋白，例如Cas9蛋白。

在一个实施例中，双分子或dgRNA包含两种多核苷酸；第一种，优选从5'至3'：crRNA(其含有与靶序列互补的靶向结构域和形成标志杆的部分的区域)；和第二种，优选从5'至3'：tracr(其含有与crRNA标志杆区域互补的结构域、和另外结合核酸酶或其他效应分子(例如Cas分子，例如Cas9分子)的结构域)；并且可以采用以下形式(从5'至3')：

多核苷酸1(crRNA)：[靶向结构域]-[crRNA标志杆区域]-[任选的第一标志杆延伸部]-[任选的第二标志杆延伸部]

多核苷酸2(tracr)：[任选的第一tracr延伸部]-[tracr标志杆区域]-[tracr核酸酶结合结构域]

在一些方面，靶向结构域包含本文所述的靶向结构域序列或由其组成，例如，表1、2、3、4、5或6中所述的靶向结构域，或包含表1、2、3、4、5或6中所述的靶向结构域序列的17、18、19、20、21、22、23、24或25个(优选20个)连续核苷酸或由其组成的靶向结构域。

在一些方面，标志杆(例如crRNA标志杆区域)从5'至3'包含：GUUUUAGAGCUA(SEQID NO:6584)。

在一些方面，标志杆(例如crRNA标志杆区域)从5'至3'包含：GUUUAAGAGCUA(SEQID NO:6585)。

在一些方面，环从5'至3'包含：GAAA(SEQ ID NO:6588)。

在一些方面，tracr从5'至3'包含：UAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(SEQ ID NO:6589)，并且优选地在包含SEQ ID NO 6584的gRNA分子中使用。

在一些方面，tracr从5'至3'包含：UAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(SEQ ID NO:6590)，并且优选地在包含SEQ ID NO 6585的gRNA分子中使用。

在一些方面，gRNA还可以在3'端包含另外的U核酸。例如，gRNA可以在3'端包含另外的1、2、3、4、5、6、7、8、9或10个U核酸。在一个实施例中，gRNA在3'端包含另外的4个U核酸。在dgRNA的情况下，dgRNA的一种或多种多核苷酸(例如，包含靶向结构域的多核苷酸和包含tracr的多核苷酸)可以在3'端包含另外的U核酸。例如，dgRNA的情况，dgRNA的一种或多种多核苷酸(例如，包含靶向结构域的多核苷酸和包含tracr的多核苷酸)可以在3'端包含另外的1、2、3、4、5、6、7、8、9或10个U核酸。在一个实施例中，在dgRNA的情况下，dgRNA的一种或多种多核苷酸(例如，包含靶向结构域的多核苷酸和包含tracr的多核苷酸)在3'端包含另外的4个U核酸。在dgRNA的一个实施例中，只有包含tracr的多核苷酸包含另外的一个或多个U核酸，例如4个U核酸。在dgRNA的一个实施例中，只有包含靶向结构域的多核苷酸包含另外的一个或多个U核酸。在dgRNA的一个实施例中，包含靶向结构域的多核苷酸和包含tracr的多核苷酸两者都包含另外的U核酸，例如4个U核酸。

在一些方面，gRNA还可以在3'端包含另外的A核酸。例如，gRNA可以在3'端包含另外的1、2、3、4、5、6、7、8、9或10个A核酸。在一个实施例中，gRNA在3'端包含另外的4个A核酸。在dgRNA的情况下，dgRNA的一种或多种多核苷酸(例如，包含靶向结构域的多核苷酸和包含tracr的多核苷酸)可以在3'端包含另外的A核酸。例如，dgRNA的情况，dgRNA的一种或多种多核苷酸(例如，包含靶向结构域的多核苷酸和包含tracr的多核苷酸)可以在3'端包含另外的1、2、3、4、5、6、7、8、9或10个A核酸。在一个实施例中，在dgRNA的情况下，dgRNA的一种或多种多核苷酸(例如，包含靶向结构域的多核苷酸和包含tracr的多核苷酸)在3'端包含另外的4个A核酸。在dgRNA的一个实施例中，只有包含tracr的多核苷酸包含另外的一个或多个A核酸，例如4个A核酸。在dgRNA的一个实施例中，只有包含靶向结构域的多核苷酸包含另外的一个或多个A核酸。在dgRNA的一个实施例中，包含靶向结构域的多核苷酸和包含tracr的多核苷酸两者都包含另外的U核酸，例如4个A核酸。

在实施例中，gRNA分子的一种或多种多核苷酸可以在5'端包含帽。

在一个实施例中，单分子或sgRNA优选从5'至3'包含：crRNA(其含有与靶序列互补的靶向结构域)；crRNA标志杆区域；第一标志杆延伸部；环；第一tracr延伸部(其含有与第一标志杆延伸部的至少一部分互补的结构域)；和tracr(其含有与crRNA标志杆区域互补的结构域、和另外结合Cas9分子的结构域)。在一些方面，靶向结构域包含本文所述的靶向结构域序列，例如，表1、2、3、4、5或6中所述的靶向结构域，或包含表1、2、3、4、5或6中所述的靶向结构域序列的17、18、19、20、21、22、23、24或25个(优选20个)连续核苷酸(例如表1、2、3、4、5或6中所述的靶向结构域序列的3'17、18、19、20、21、22、23、24或25个(优选20个)连续核苷酸)或由其组成的靶向结构域。

在包含第一标志杆延伸部和/或第一tracr延伸部的方面，标志杆、环和tracr序列可以如上所述。通常，可以采用任何第一标志杆延伸部和第一tracr延伸部，其条件是它们是互补的。在实施例中，第一标志杆延伸部和第一tracr延伸部由3、4、5、6、7、8、9、10个或更多个互补核苷酸组成。

在一些方面，第一标志杆延伸部从5'至3'包含：UGCUG(SEQ ID NO:6586)。在一些方面，第一标志杆延伸部由SEQ ID NO:6586组成。

在一些方面，第一tracr延伸部从5'至3'包含：CAGCA(SEQ ID NO:6591)。在一些方面，第一tracr延伸部由SEQ ID NO:6591组成。

在一个实施例中，dgRNA包含两种核酸分子。在一些方面，dgRNA包含第一核酸，该第一核酸优选从5'至3'含有：与靶序列互补的靶向结构域；crRNA标志杆区域；任选地第一标志杆延伸部；和任选地第二标志杆延伸部；以及第二核酸(在本文中其可称为tracr，并且包含至少一个结合Cas分子(例如Cas9分子)的结构域)，该第二核酸优选从5'至3'包含：任选地第一tracr延伸部；和tracr(其含有与crRNA标志杆区域互补的结构域、和另外结合Cas(例如Cas9)分子的结构域)。第二核酸可以另外在3'端(例如，tracr的3')包含另外的U核酸。例如，tracr可以在3'端(例如，tracr的3')包含另外的1、2、3、4、5、6、7、8、9或10个U核酸。第二核酸可以另外地或替代地在3'端(例如，tracr的3')包含另外的A核酸。例如，tracr可以在3'端(例如，tracr的3')包含另外的1、2、3、4、5、6、7、8、9或10个A核酸。在一些方面，靶向结构域包含本文所述的靶向结构域序列，例如，表1、2、3、4、5或6中所述的靶向结构域，或包含表1、2、3、4、5或6中所述的靶向结构域序列的17、18、19、20、21、22、23、24或25个(优选20个)连续核苷酸或由其组成的靶向结构域。

在涉及dgRNA的方面，crRNA标志杆区域、任选的第一标志杆延伸部、任选的第一tracr延伸部和tracr序列可以如上所述。

在一些方面，任选的第二标志杆延伸部从5'至3'包含：UUUUG(SEQ ID NO:6587)。

在实施例中，gRNA分子的3'1、2、3、4或5个核苷酸，5'1、2、3、4或5个核苷酸，或3'和5'1、2、3、4或5个核苷酸(并且在dgRNA分子的情况下，为包含靶向结构域的多核苷酸和/或包含tracr的多核苷酸)是经修饰的核酸，如在下面部分XIII中更全面描述的。

这些结构域将在下面简要讨论：

1)靶向结构域：

关于靶向结构域的选择的指导可以例如在以下中找到：Fu Y等人NAT BIOTECHNOL[自然生物技术]2014(doi:10.1038/nbt.2808)和Sternberg SH等人NATURE[自然]2014(doi:10.1038/naturel3011)。

靶向结构域包含与靶核酸上的靶序列互补，例如至少80％、85％、90％、95％或99％互补，例如完全互补的核苷酸序列。靶向结构域是RNA分子的部分，因此将包含碱基尿嘧啶(U)，而编码gRNA分子的任何DNA将包含碱基胸腺嘧啶(T)。尽管不希望受理论束缚，但据信靶向结构域与靶序列的互补性有助于gRNA分子/Cas9分子复合物与靶核酸相互作用的特异性。应理解，在靶向结构域和靶序列对中，靶向结构域中的尿嘧啶碱基将与靶序列中的腺嘌呤碱基配对。

在一个实施例中，靶向结构域的长度是5至50，例如10至40、例如10至30、例如15至30、例如15至25个核苷酸。在一个实施例中，靶向结构域的长度是15、16、17、18、19、20、21、22、23、24或25个核苷酸。在一个实施例中，靶向结构域的长度是16个核苷酸。在一个实施例中，靶向结构域的长度是17个核苷酸。在一个实施例中，靶向结构域的长度是18个核苷酸。在一个实施例中，靶向结构域的长度是19个核苷酸。在一个实施例中，靶向结构域的长度是20个核苷酸。在一个实施例中，靶向结构域的长度是21个核苷酸。在一个实施例中，靶向结构域的长度是22个核苷酸。在一个实施例中，靶向结构域的长度是23个核苷酸。在一个实施例中，靶向结构域的长度是24个核苷酸。在一个实施例中，靶向结构域的长度是25个核苷酸。在实施例中，上述的16、17、18、19、20、21、22、23、24或25个核苷酸包含来自表1、2、3、4、5或6中所述的靶向结构域的5'-16、17、18、19、20、21、22、23、24或25个核苷酸。在实施例中，上述的16、17、18、19、20、21、22、23、24或25个核苷酸包含来自表1、2、3、4、5或6中所述的靶向结构域的3'-16、17、18、19、20、21、22、23、24或25个核苷酸。

不受理论束缚，据信布置于靶向结构域的3'端的靶向结构域的8、9、10、11或12个核酸对于靶向靶序列是重要的，因此可以称为靶向结构域的“核心”区域。在一个实施例中，核心结构域与靶序列完全互补。

与靶向结构域互补的靶核酸链在本文中称为靶序列。在一些方面，靶序列被布置于染色体上，例如，是基因内的靶标。在一些方面，靶序列被布置于基因的外显子内。在一些方面，靶序列被布置于基因的内含子内。在一些方面，靶序列包含或接近(例如，在10、20、30、40、50、100、200、300、400、500、或1000个核酸内)目的基因的调节元件的结合位点，例如，启动子或转录因子结合位点。结构域的一些或全部核苷酸可以具有修饰，例如本文部分XIII中找到的修饰。

2)crRNA标志杆区域：

标志杆含有来自crRNA和tracr两者的部分。crRNA标志杆区域与tracr的部分互补，并且在一个实施例中，与tracr的部分具有足够的互补性，以在至少一些生理条件(例如，正常生理条件)下形成双链区域。在一个实施例中，crRNA标志杆区域的长度是5至30个核苷酸。在一个实施例中，crRNA标志杆区域的长度是5至25个核苷酸。crRNA标志杆区域可以与来自细菌CRISPR阵列的重复序列的天然存在的部分具有同源性，或者衍生自来自细菌CRISPR阵列的重复序列的天然存在的部分。在一个实施例中，其与本文披露的crRNA标志杆区域(例如酿脓链球菌或嗜热链球菌crRNA标志杆区域)具有至少50％的同源性。

在一个实施例中，标志杆(例如crRNA标志杆区域)包含SEQ ID NO:6584。在一个实施例中，标志杆(例如crRNA标志杆区域)包含与SEQ ID NO:6584具有至少50％、60％、70％、80％、85％、90％、95％或99％同源性的序列。在一个实施例中，标志杆(例如crRNA标志杆区域)包含SEQ ID NO:6584的至少5、6、7、8、9、10或11个核苷酸。在一个实施例中，标志杆(例如crRNA标志杆区域)包含SEQ ID NO:6585。在一个实施例中，标志杆包含与SEQ ID NO:6585具有至少50％、60％、70％、80％、85％、90％、95％或99％同源性的序列。在一个实施例中，标志杆(例如crRNA标志杆区域)包含SEQ ID NO:6585的至少5、6、7、8、9、10或11个核苷酸。

结构域的一些或全部核苷酸可以具有修饰，例如本文部分XIII中描述的修饰。

3)第一标志杆延伸部

当使用包含第一tracr延伸部的tracr时，crRNA可以包含第一标志杆延伸部。通常，可以采用任何第一标志杆延伸部和第一tracr延伸部，其条件是它们是互补的。在实施例中，第一标志杆延伸部和第一tracr延伸部由3、4、5、6、7、8、9、10个或更多个互补核苷酸组成。

第一标志杆延伸部可以包含与第一tracr延伸部的核苷酸互补，例如80％、85％、90％、95％或99％互补，例如完全互补的核苷酸。在一些方面，与第一tracr延伸部的互补核苷酸杂交的第一标志杆延伸部核苷酸是连续的。在一些方面，与第一tracr延伸部的互补核苷酸杂交的第一标志杆延伸部核苷酸是不连续的，例如，包含由不与第一tracr延伸部的核苷酸碱基配对的核苷酸分开的两个或更多个杂交区域。在一些方面，第一标志杆延伸部包含至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或更多个核苷酸。在一些方面，第一标志杆延伸部从5'至3'包含：UGCUG(SEQ ID NO:6586)。在一些方面，第一标志杆延伸部由SEQ ID NO:6586组成。在一些方面，第一标志杆延伸部包含与SEQ ID NO:6586具有至少80％、85％、90％、95％或99％同源性的核酸。

第一tracr延伸部的一些或全部核苷酸可以具有修饰，例如本文部分XIII中找到的修饰。

3)环

环用于将crRNA标志杆区域(或任选地第一标志杆延伸部，当存在时)与sgRNA的tracr(或任选地第一tracr延伸部，当存在时)连接。环可以共价地或非共价地连接crRNA标志杆区域和tracr。在一个实施例中，连接是共价的。在一个实施例中，环共价偶联crRNA标志杆区域和tracr。在一个实施例中，环共价偶联第一标志杆延伸部和第一tracr延伸部。在一个实施例中，环是或包含插入在crRNA标志杆区域与tracr的与crRNA标志杆区域杂交的结构域之间的共价键。通常，环包含一个或多个，例如2、3、4、5、6、7、8、9或10个核苷酸。

在dgRNA分子中，这两种分子可以借助于crRNA的至少一部分(例如crRNA标志杆区域)和tracr的至少一部分(例如tracr的与crRNA标志杆区域互补的结构域)之间的杂交而关联。

多种环适合用于在sgRNA中使用。环可以由共价键组成，或者短至一个或几个核苷酸，例如长度为1、2、3、4或5个核苷酸。在一个实施例中，环的长度是2、3、4、5、6、7、8、9、10、15、20、或25个或更多个核苷酸。在一个实施例中，环的长度是2至50、2至40、2至30、2至20、2至10、或2至5个核苷酸。在一个实施例中，环与天然存在的序列具有同源性，或者衍生自天然存在的序列。在一个实施例中，环与本文披露的环具有至少50％的同源性。在一个实施例中，环包含SEQ ID NO:6588。

4)第二标志杆延伸部

在一个实施例中，dgRNA可以包含另外的序列(在crRNA标志杆区域的3')、或(当存在时)第一标志杆延伸部，在本文中称为第二标志杆延伸部。在一个实施例中，第二标志杆延伸部的长度是2-10、2-9、2-8、2-7、2-6、2-5、或2-4个核苷酸。在一个实施例中，第二标志杆延伸部的长度是2、3、4、5、6、7、8、9或10个或更多个核苷酸。在一个实施例中，第二标志杆延伸部包含SEQ ID NO:6587。

5)Tracr：

tracr是核酸酶(例如Cas9)结合所需的核酸序列。不受理论束缚，据信每种Cas9种类与特定的tracr序列相关。tracr序列用于sgRNA和dgRNA系统两者中。在一个实施例中，tracr包含来自或衍生自酿脓链球菌tracr的序列。在一些方面，tracr具有与crRNA的标志杆部分杂交的部分，例如，与crRNA标志杆区域具有足够的互补性，以在至少一些生理条件下形成双链区域(在本文中有时称为tracr标志杆区域或与crRNA标志杆区域互补的tracr结构域)。在实施例中，tracr的与crRNA标志杆区域杂交的结构域包含与crRNA标志杆区域的互补核苷酸杂交的至少5、6、7、8、9、10、11、12、13、14、15、16、17、18、19或20个核苷酸。在一些方面，与crRNA标志杆区域的互补核苷酸杂交的tracr核苷酸是连续的。在一些方面，与crRNA标志杆区域的互补核苷酸杂交的tracr核苷酸是不连续的，例如，包含由不与crRNA标志杆区域的核苷酸碱基配对的核苷酸分开的两个或更多个杂交区域。在一些方面，tracr的与crRNA标志杆区域杂交的部分从5'至3'包含：UAGCAAGUUAAAA(SEQ ID NO:6597)。在一些方面，tracr的与crRNA标志杆区域杂交的部分从5'至3'包含：UAGCAAGUUUAAA(SEQ ID NO:6598)。在实施例中，与crRNA标志杆区域杂交的序列被布置于tracr上，在tracr的另外结合核酸酶(例如Cas分子，例如Cas9分子)的序列的5'-。

tracr进一步包含另外结合核酸酶(例如Cas分子，例如Cas9分子)的结构域。不受理论束缚，据信来自不同物种的Cas9结合不同的tracr序列。在一些方面，tracr包含与酿脓链球菌Cas9分子结合的序列。在一些方面，tracr包含与本文披露的Cas9分子结合的序列。在一些方面，另外结合Cas9分子的结构域从5'至3'包含：UAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(SEQ ID NO:6599)。在一些方面，另外结合Cas9分子的结构域从5'至3'包含：UAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU(SEQ ID NO:6600)。

在一些实施例中，tracr包含SEQ ID NO:6589。在一些实施例中，tracr包含SEQ IDNO:6590。

tracr的一些或全部核苷酸可以具有修饰，例如本文部分XIII中找到的修饰。在实施例中，gRNA(例如，sgRNA、或dgRNA的tracr和/或crRNA)，例如任何上述gRNA或gRNA组分，在gRNA的5'端、3'端或5'和3'两端包含反向脱碱基残基。在实施例中，gRNA(例如，sgRNA、或dgRNA的tracr和/或crRNA)，例如任何上述gRNA或gRNA组分，包含在多核苷酸的5'端残基之间的一个或多个硫代磷酸酯键，例如前两个5'残基之间、前三个5'残基中的每一个之间、前四个5'残基中的每一个之间或前五个5'残基中的每一个之间的硫代磷酸酯键。在实施例中，gRNA或gRNA组分可以替代地或另外地包含在多核苷酸的3'端残基之间的一个或多个硫代磷酸酯键，例如前两个3'残基之间、前三个3'残基中的每一个之间、前四个3'残基中的每一个之间或前五个3'残基中的每一个之间的硫代磷酸酯键。在一个实施例中，gRNA(例如，sgRNA、或dgRNA的tracr和/或crRNA)，例如任何上述gRNA或gRNA组分，包含在前四个5'残基中的每一个之间的硫代磷酸酯键(例如包含在5'端的三个硫代磷酸酯键，例如由其组成)和在前四个3'残基中的每一个之间的硫代磷酸酯键(例如包含在3'端的三个硫代磷酸酯键，例如由其组成)。在一个实施例中，任何上述硫代磷酸酯修饰与多核苷酸的5'端、3'端或5'和3'两端的反向脱碱基残基组合。在此类实施例中，反向脱碱基核苷酸可通过磷酸酯键或硫代磷酸酯键与5'和/或3'核苷酸连接。在实施例中，gRNA(例如，sgRNA、或dgRNA的tracr和/或crRNA)，例如任何上述gRNA或gRNA组分，包含一个或多个含有2'O-甲基经修饰的核苷酸。在实施例中，5'残基中的前1、2、3个或更多个中的每一个包含2'O-甲基修饰。在实施例中，3'残基中的前1、2、3个或更多个中的每一个包含2'O-甲基修饰。在实施例中，相对于末端的第4个、相对于末端的第3个、和相对于末端的第2个3'残基包含2'O-甲基修饰。在实施例中，5'残基中的前1、2、3个或更多个中的每一个包含2'O-甲基修饰，并且3'残基中的前1、2、3个或更多个中的每一个包含2'O-甲基修饰。在一个实施例中，5'残基中的前3个中的每一个包含2'O-甲基修饰，并且3'残基中的前3个中的每一个包含2'O-甲基修饰。在实施例中，5'残基中的前3个中的每一个包含2'O-甲基修饰，并且相对于末端的第4个、相对于末端的第3个、和相对于末端的第2个3'残基包含2'O-甲基修饰。在实施例中，任何例如如上所述的2'O-甲基修饰可以与例如如上所述的一种或多种硫代磷酸酯修饰、和/或例如如上所述的一种或多种倒置脱碱基修饰组合。在一个实施例中，gRNA(例如，sgRNA、或dgRNA的tracr和/或crRNA)，例如任何上述gRNA或gRNA组分，包含在前四个5'残基中的每一个之间的硫代磷酸酯键(例如包含在一个或多个多核苷酸的5'端的三个硫代磷酸酯键，例如由其组成)、在前四个3'残基中的每一个之间的硫代磷酸酯键(例如包含在一个或多个多核苷酸的3'端的三个硫代磷酸酯键，例如由其组成)、在前三个5'残基中的每一个处的2'O-甲基修饰、以及在前三个3'残基中的每一个处的2'O-甲基修饰，例如由其组成。在一个实施例中，gRNA(例如，sgRNA、或dgRNA的tracr和/或crRNA)，例如任何上述gRNA或gRNA组分，包含在前四个5'残基中的每一个之间的硫代磷酸酯键(例如包含在一个或多个多核苷酸的5'端的三个硫代磷酸酯键，例如由其组成)，在前四个3'残基中的每一个之间的硫代磷酸酯键(例如包含在一个或多个多核苷酸的3'端的三个硫代磷酸酯键，例如由其组成)，在前三个5'残基中的每一个处的2'O-甲基修饰，以及在相对于末端的第4个、相对于末端的第3个和相对于末端的第2个3'残基中的每一个处的2'O-甲基修饰，例如由其组成。

在一个实施例中，gRNA(例如，sgRNA、或dgRNA的tracr和/或crRNA)，例如任何上述gRNA或gRNA组分，包含在前四个5'残基中的每一个之间的硫代磷酸酯键(例如包含在一个或多个多核苷酸的5'端的三个硫代磷酸酯键，例如由其组成)、在前四个3'残基中的每一个之间的硫代磷酸酯键(例如包含在一个或多个多核苷酸的3'端的三个硫代磷酸酯键，例如由其组成)、在前三个5'残基中的每一个处的2'O-甲基修饰、在前三个3'残基中的每一个处的2'O-甲基修饰、以及在5'和3'端中每一个处的另外的反向脱碱基残基，例如由其组成。

在一个实施例中，gRNA(例如，sgRNA、或dgRNA的tracr和/或crRNA)，例如任何上述gRNA或gRNA组分，包含在前四个5'残基中的每一个之间的硫代磷酸酯键(例如包含在一个或多个多核苷酸的5'端的三个硫代磷酸酯键，例如由其组成)，在前四个3'残基中的每一个之间的硫代磷酸酯键(例如包含在一个或多个多核苷酸的3'端的三个硫代磷酸酯键，例如由其组成)，在前三个5'残基中的每一个处的2'O-甲基修饰，以及在相对于末端的第4个、相对于末端的第3个和相对于末端的第2个3'残基中的每一个处的2'O-甲基修饰，以及在5'和3'端中每一个处的另外的反向脱碱基残基，例如由其组成。

在一个实施例中，gRNA是dgRNA并且包含以下，例如由以下组成：crRNA：

mN*mN*mN*NNNNNNNNNNNNNNNNNGUUUUAGAGCUAU*mG*mC*mU，其中m表示具有2'O-甲基经修饰的碱基，*表示硫代磷酸酯键，N表示靶向结构域的残基，例如如本文所述(任选地在5'和/或3'末端具有反向脱碱基残基)；和

tracr：

AACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(SEQ ID NO:6660)(任选地在5'和/或3'末端具有反向脱碱基残基)。

tracr：

mA*mA*mC*AGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU*mU*mU*mU(SEQ ID NO:346)，其中m表示具有2'O-甲基经修饰的碱基，*表示硫代磷酸酯键，N表示靶向结构域的残基，例如如本文所述(任选地在5'和/或3'末端具有反向脱碱基残基)。

mN*mN*mN*NNNNNNNNNNNNNNNNNGUUUUAGAGCUAUGCUGUU*mU*mU*mG，其中m表示具有2'O-甲基经修饰的碱基，*表示硫代磷酸酯键，N表示靶向结构域的残基，例如如本文所述(任选地在5'和/或3'末端具有反向脱碱基残基)；和

tracr：

mA*mA*mC*AGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU*mU*mU*mU(SEQ ID NO:346)，其中m表示具有2'O-甲基经修饰的碱基，*表示硫代磷酸酯键(任选地在5'和/或3'末端具有反向脱碱基残基)。

在一个实施例中，gRNA是dgRNA并且包含以下，例如由以下组成：

crRNA：

NNNNNNNNNNNNNNNNNNNNGUUUUAGAGCUAUGCUGUUUUG，其中N表示靶向结构域的残基，例如如本文所述(任选地在5'和/或3'末端具有反向脱碱基残基)；和

tracr：

在一个实施例中，gRNA是sgRNA并且包含以下，例如由以下组成：NNNNNNNNNNNNNNNNNNNNGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU，其中m表示具有2'O-甲基经修饰的碱基，*表示硫代磷酸酯键，N表示靶向结构域的残基，例如如本文所述(任选地在5'和/或3'末端具有反向脱碱基残基)。

在一个实施例中，gRNA是sgRNA并且包含以下，例如由以下组成：mN*mN*mN*NNNNNNNNNNNNNNNNNGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCU*mU*mU*mU，其中m表示具有2'O-甲基经修饰的碱基，*表示硫代磷酸酯键，N表示靶向结构域的残基，例如如本文所述(任选地在5'和/或3'末端具有反向脱碱基残基)。

在一个实施例中，gRNA是sgRNA并且包含以下，例如由以下组成：mN*mN*mN*NNNNNNNNNNNNNNNNNGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCmU*mU*mU*U，其中m表示具有2'O-甲基经修饰的碱基，*表示硫代磷酸酯键，N表示靶向结构域的残基，例如如本文所述(任选地在5'和/或3'末端具有反向脱碱基残基)。

6)第一Tracr延伸部

在gRNA包含第一标志杆延伸部的情况下，tracr可以包含第一tracr延伸部。第一tracr延伸部可以包含与第一标志杆延伸部的核苷酸互补，例如80％、85％、90％、95％或99％互补，例如完全互补的核苷酸。在一些方面，与第一标志杆延伸部的互补核苷酸杂交的第一tracr延伸部核苷酸是连续的。在一些方面，与第一标志杆延伸部的互补核苷酸杂交的第一tracr延伸部核苷酸是不连续的，例如，包含由不与第一标志杆延伸部的核苷酸碱基配对的核苷酸分开的两个或更多个杂交区域。在一些方面，第一tracr延伸部包含至少2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20个或更多个核苷酸。在一些方面，第一tracr延伸部包含SEQ ID NO:6591。在一些方面，第一tracr延伸部包含与SEQ ID NO:6591具有至少80％、85％、90％、95％或99％同源性的核酸。

在一些实施例中，sgRNA从5'至3'可以包含布置于靶向结构域的3'的：

a)

GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(SEQ ID NO:6601)；

b)

GUUUAAGAGCUAGAAAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(SEQ ID NO:6602)；

c)

GUUUUAGAGCUAUGCUGGAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(SEQ ID NO:6603)；

d)

GUUUAAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(SEQ ID NO:6604)；

e)以上a)至d)中的任一个，在3'端进一步包含至少1、2、3、4、5、6或7个尿嘧啶(U)核苷酸，例如1、2、3、4、5、6或7个尿嘧啶(U)核苷酸；

f)以上a)至d)中的任一个，在3'端进一步包含至少1、2、3、4、5、6或7个腺嘌呤(A)核苷酸，例如1、2、3、4、5、6或7个腺嘌呤(A)核苷酸；或者

或g)以上a)至f)中的任一个，在5'端(例如在5'末端，例如靶向结构域的5')进一步包含至少1、2、3、4、5、6或7个腺嘌呤(A)核苷酸，例如1、2、3、4、5、6或7个腺嘌呤(A)核苷酸。在实施例中，以上a)至g)中的任一个直接布置在靶向结构域的3'。

在一个实施例中，本发明的sgRNA从5'至3'包含以下，例如由以下组成：[靶向结构域]-GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU(SEQID NO:7811)。

在一个实施例中，本发明的sgRNA从5'至3'包含以下，例如由以下组成：[靶向结构域]-

GUUUAAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU(SEQ ID NO:7807)。

在一些实施例中，dgRNA可以包含：

crRNA，其从5'至3'包含优选地直接布置于靶向结构域的3'的：

a)GUUUUAGAGCUA(SEQ ID NO:6584)；

b)GUUUAAGAGCUA(SEQ ID NO:6585)；

c)GUUUUAGAGCUAUGCUG(SEQ ID NO:6605)；

d)GUUUAAGAGCUAUGCUG(SEQ ID NO:6606)；

e)GUUUUAGAGCUAUGCUGUUUUG(SEQ ID NO:6607)；

f)GUUUAAGAGCUAUGCUGUUUUG(SEQ ID NO:6608)；或者

g)GUUUUAGAGCUAUGCU(SEQ ID NO:7806)：

和tracr，其从5'至3'包含：

a)

UAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(SEQ IDNO:6589)；

b)

UAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(SEQ IDNO:6590)；

c)

CAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(SEQID NO:6609)；

d)

CAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(SEQID NO:6610)；

e)

AACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(SEQ ID NO:6660)；

f)

AACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(SEQ ID NO:6661)；

g)

AACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(SEQ ID NO:7812)

h)

GUUUAAGAGCUAUGCUGGAAACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU(SEQ ID NO:7807)；

i)

AGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUU(SEQ ID NO:7808)；

j)

GUUGGAACCAUUCAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUU(SEQ ID NO:7809)；

k)以上a)至j)中的任一个，在3'端进一步包含至少1、2、3、4、5、6或7个尿嘧啶(U)核苷酸，例如1、2、3、4、5、6或7个尿嘧啶(U)核苷酸；

l)以上a)至j)中的任一个，在3'端进一步包含至少1、2、3、4、5、6或7个腺嘌呤(A)核苷酸，例如1、2、3、4、5、6或7个腺嘌呤(A)核苷酸；或者

m)以上a)至l)中的任一个，在5'端(例如在5'末端)进一步包含至少1、2、3、4、5、6或7个腺嘌呤(A)核苷酸，例如1、2、3、4、5、6或7个腺嘌呤(A)核苷酸。

在一个实施例中，以上k)的序列包含3'序列UUUUUU，例如，如果U6启动子用于转录的话。在一个实施例中，以上k)的序列包含3'序列UUUU，例如，如果HI启动子用于转录的话。在一个实施例中，以上k)的序列包含可变数目的3'U，例如取决于所使用的pol-III启动子的终止信号。在一个实施例中，以上k)的序列包含衍生自DNA模板的可变3'序列，如果使用T7启动子的话。在一个实施例中，以上k)的序列包含衍生自DNA模板的可变3'序列，例如，如果体外转录用于产生RNA分子的话。在一个实施例中，以上k)的序列包含衍生自DNA模板的可变3'序列，例如，如果pol-II启动子用于驱动转录的话。

在一个实施例中，crRNA包含靶向结构域和布置于靶向结构域的3'(例如，直接布置于靶向结构域的3')的序列，例如由其组成，该序列包含SEQ ID NO:6607，例如由其组成；并且tracr包含以下，例如由以下组成：

AACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(SEQ ID NO:6660)。

在一个实施例中，crRNA包含靶向结构域和布置于靶向结构域的3'(例如，直接布置于靶向结构域的3')的序列，例如由其组成，该序列包含SEQ ID NO:6608，例如由其组成；并且tracr包含以下，例如由以下组成：

AACAGCAUAGCAAGUUUAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(SEQ ID NO:6661)。

在一个实施例中，crRNA包含靶向结构域和布置于靶向结构域的3'(例如，直接布置于靶向结构域的3')的序列，例如由其组成，该序列包含GUUUUAGAGCUAUGCU(SEQ ID NO:7806)，例如由其组成；并且tracr包含以下，例如由以下组成：

AGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUU(SEQ ID NO:7808)。

在一个实施例中，crRNA包含靶向结构域和布置于靶向结构域的3'(例如，直接布置于靶向结构域的3')的序列，例如由其组成，该序列包含GUUUUAGAGCUAUGCUGUUUUG(SEQID NO:6607)，例如由其组成；并且tracr包含以下，例如由以下组成：

GUUGGAACCAUUCAAAACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUU(SEQ ID NO:7809)。

II.用于改变珠蛋白基因的表达的靶向结构域

下表中提供了用于本发明的各个方面(例如，用于改变珠蛋白基因(例如胎儿血红蛋白基因或血红蛋白β基因)的表达)的gRNA分子的靶向结构域。

表1：针对BLC11a外显子区域的gRNA靶向结构域

表2：靶向BCL11a内含子2的gRNA靶向结构域(例如对于BCL11a增强子而言的)

在实施例中，gRNA靶向结构域由上表中任何一个序列的20个3'nt组成。

下表中描述了可用于本发明的组合物和方法中的示例性优选gRNA靶向结构域。

表5.针对BCL11a基因编码区的优选指导RNA靶向结构域

表6：针对法国HPFH(法国HPFH；Sankaran VG等人A functional elementnecessary for fetal hemoglobin silencing[胎儿血红蛋白沉默所必需的功能元件].NEJM[新英格兰医学杂志](2011)365:807-814)的优选指导RNA靶向结构域

在本发明的一些方面，优选的是，对于HPFH区域而言的gRNA分子包含gRNA的靶向结构域，例如由其组成，该gRNA相对于对照能够使得F细胞增加至少约20％，例如在实例4中所述的测定中。在一方面，gRNA分子包含含有SEQ ID NO:113(例如由其组成)的靶向结构域。在一方面，gRNA分子包含含有SEQ ID NO:99(例如由其组成)的靶向结构域。在一方面，gRNA分子包含含有SEQ ID NO:112(例如由其组成)的靶向结构域。在一方面，gRNA分子包含含有SEQ ID NO:98(例如由其组成)的靶向结构域。在一方面，gRNA分子包含含有SEQ IDNO:1580(例如由其组成)的靶向结构域。在一方面，gRNA分子包含含有SEQ ID NO:106(例如由其组成)的靶向结构域。在一方面，gRNA分子包含含有SEQ ID NO:1589(例如由其组成)的靶向结构域。在一方面，gRNA分子包含含有SEQ ID NO:1503(例如由其组成)的靶向结构域。在一方面，gRNA分子包含含有SEQ ID NO:160(例如由其组成)的靶向结构域。在一方面，gRNA分子包含含有SEQ ID NO:1537(例如由其组成)的靶向结构域。在一方面，gRNA分子包含含有SEQ ID NO:159(例如由其组成)的靶向结构域。在一方面，gRNA分子包含含有SEQ IDNO:101(例如由其组成)的靶向结构域。在一方面，gRNA分子包含含有SEQ ID NO:162(例如由其组成)的靶向结构域。在一方面，gRNA分子包含含有SEQ ID NO:104(例如由其组成)的靶向结构域。在一方面，gRNA分子包含含有SEQ ID NO:138(例如由其组成)的靶向结构域。在一方面，gRNA分子包含含有SEQ ID NO:1536(例如由其组成)的靶向结构域。在一方面，gRNA分子包含含有SEQ ID NO:1539(例如由其组成)的靶向结构域。在一方面，gRNA分子包含含有SEQ ID NO:1585(例如由其组成)的靶向结构域。

在本发明的一些方面，例如如本文所示，包括靶向多于一个(例如两个)靶位点的gRNA分子(例如，第一gRNA分子和第二gRNA分子)可能是有益的。在一些实施例中，这两个靶位点均位于HPFH区域中。在这些方面，可以使用包含表6中列出的靶向结构域的多于一种(例如两种)gRNA分子(例如，第一种gRNA分子和第二种gRNA分子)的任何组合。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:100和SEQ ID NO:165(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:100和SEQ ID NO:113(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:100和SEQ ID NO:99(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:100和SEQ ID NO:112(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:100和SEQ ID NO:98(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:100和SEQ ID NO:1580(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:100和SEQ ID NO:106(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:100和SEQ ID NO:1503(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:100和SEQ ID NO:1589(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:100和SEQ ID NO:160(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:100和SEQ ID NO:1537(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:100和SEQ ID NO:159(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:100和SEQ ID NO:101(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:100和SEQ ID NO:162(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:100和SEQ ID NO:104(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:100和SEQ ID NO:138(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:100和SEQ ID NO:1536(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:100和SEQ ID NO:1539(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:100和SEQ ID NO:1585(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ IDNO:165和SEQ ID NO:113(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:165和SEQ ID NO:99(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:165和SEQ ID NO:112(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ IDNO:165和SEQ ID NO:98(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:165和SEQ ID NO:1580(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:165和SEQ ID NO:106(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:165和SEQ ID NO:1503(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:165和SEQ ID NO:1589(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:165和SEQ ID NO:160(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:165和SEQ ID NO:1537(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:165和SEQ ID NO:159(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:165和SEQ ID NO:101(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:165和SEQ ID NO:162(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:165和SEQ ID NO:104(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:165和SEQ ID NO:138(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:165和SEQ ID NO:1536(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:165和SEQ ID NO:1539(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:165和SEQ ID NO:1585(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:113和SEQ ID NO:165(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:113和SEQ ID NO:99(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:113和SEQ ID NO:112(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:113和SEQ ID NO:98(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:113和SEQ ID NO:1580(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:113和SEQ ID NO:106(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:113和SEQ ID NO:1503(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:113和SEQ ID NO:1589(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:113和SEQ ID NO:160(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:113和SEQ ID NO:1537(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:113和SEQ ID NO:159(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:113和SEQ ID NO:101(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:113和SEQ ID NO:162(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:113和SEQ ID NO:104(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:113和SEQ ID NO:138(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:113和SEQ ID NO:1536(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:113和SEQ ID NO:1539(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:113和SEQ ID NO:1585(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:99和SEQ ID NO:165(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:99和SEQ ID NO:113(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:99和SEQ ID NO:112(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:99和SEQ ID NO:98(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:99和SEQ ID NO:1580(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:99和SEQ ID NO:106(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ IDNO:99和SEQ ID NO:1503(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:99和SEQ ID NO:1589(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:99和SEQ ID NO:160(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ IDNO:99和SEQ ID NO:1537(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:99和SEQ ID NO:159(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:99和SEQ ID NO:101(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ IDNO:99和SEQ ID NO:162(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:99和SEQ ID NO:104(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:99和SEQ ID NO:138(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ IDNO:99和SEQ ID NO:1536(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:99和SEQ ID NO:1539(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:99和SEQ ID NO:1585(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ IDNO:112和SEQ ID NO:165(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:112和SEQ ID NO:113(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:112和SEQ ID NO:99(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ IDNO:112和SEQ ID NO:98(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:112和SEQ ID NO:1580(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:112和SEQ ID NO:106(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:112和SEQ ID NO:1503(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:112和SEQ ID NO:1589(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:112和SEQ ID NO:160(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:112和SEQ ID NO:1537(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:112和SEQ ID NO:159(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:112和SEQ ID NO:101(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:112和SEQ ID NO:162(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:112和SEQ ID NO:104(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:112和SEQ ID NO:138(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:112和SEQ ID NO:1536(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:112和SEQ ID NO:1539(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:112和SEQ ID NO:1585(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:98和SEQ ID NO:165(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:98和SEQ ID NO:113(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:98和SEQ ID NO:99(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:98和SEQ ID NO:112(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:98和SEQ ID NO:1580(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:98和SEQ ID NO:106(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ IDNO:98和SEQ ID NO:1503(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:98和SEQ ID NO:1589(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:98和SEQ ID NO:160(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ IDNO:98和SEQ ID NO:1537(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:98和SEQ ID NO:159(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:98和SEQ ID NO:101(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ IDNO:98和SEQ ID NO:162(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:98和SEQ ID NO:104(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:98和SEQ ID NO:138(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ IDNO:98和SEQ ID NO:1536(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:98和SEQ ID NO:1539(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:98和SEQ ID NO:1585(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ IDNO:1580和SEQ ID NO:165(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1580和SEQ ID NO:113(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1580和SEQ ID NO:99(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:1580和SEQ ID NO:112(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1580和SEQ ID NO:98(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1580和SEQ ID NO:106(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:1580和SEQ ID NO:1503(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1580和SEQ ID NO:1589(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1580和SEQ IDNO:160(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1580和SEQ ID NO:1537(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1580和SEQ ID NO:159(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1580和SEQ ID NO:101(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1580和SEQ ID NO:162(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1580和SEQ ID NO:104(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1580和SEQ ID NO:138(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1580和SEQ ID NO:1536(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1580和SEQ ID NO:1539(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ IDNO:1580和SEQ ID NO:1585(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:106和SEQ ID NO:165(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:106和SEQ ID NO:113(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ IDNO:106和SEQ ID NO:99(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:106和SEQ ID NO:112(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:106和SEQ ID NO:98(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ IDNO:106和SEQ ID NO:1580(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:106和SEQ ID NO:1503(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:106和SEQ ID NO:1589(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:106和SEQ ID NO:160(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:106和SEQ ID NO:1537(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:106和SEQ ID NO:159(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:106和SEQ ID NO:101(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:106和SEQ ID NO:162(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:106和SEQ ID NO:104(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:106和SEQ ID NO:138(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:106和SEQ ID NO:1536(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:106和SEQ ID NO:1539(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:106和SEQ ID NO:1585(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1503和SEQ ID NO:165(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1503和SEQ IDNO:113(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1503和SEQ ID NO:99(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1503和SEQ ID NO:112(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1503和SEQID NO:98(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1503和SEQ ID NO:1580(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1503和SEQ ID NO:106(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1503和SEQ ID NO:1589(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1503和SEQ ID NO:160(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1503和SEQ ID NO:1537(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1503和SEQ ID NO:159(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1503和SEQ ID NO:101(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1503和SEQ ID NO:162(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ IDNO:1503和SEQ ID NO:104(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1503和SEQ ID NO:138(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1503和SEQ ID NO:1536(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:1503和SEQ ID NO:1539(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1503和SEQ ID NO:1585(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1589和SEQ IDNO:165(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1589和SEQ ID NO:113(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1589和SEQ ID NO:99(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1589和SEQID NO:112(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1589和SEQ ID NO:98(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1589和SEQ ID NO:1580(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1589和SEQ ID NO:106(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1589和SEQ ID NO:1503(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1589和SEQ ID NO:160(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1589和SEQ ID NO:1537(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1589和SEQ ID NO:159(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1589和SEQ ID NO:101(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:1589和SEQ ID NO:162(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1589和SEQ ID NO:104(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1589和SEQ ID NO:138(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1589和SEQ ID NO:1536(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1589和SEQ ID NO:1539(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1589和SEQID NO:1585(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:160和SEQ ID NO:165(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:160和SEQ ID NO:113(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:160和SEQ ID NO:99(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:160和SEQ ID NO:112(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:160和SEQ ID NO:98(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:160和SEQ ID NO:1580(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:160和SEQ ID NO:106(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:160和SEQ ID NO:1503(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:160和SEQ ID NO:1589(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:160和SEQ ID NO:1537(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:160和SEQ ID NO:159(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ IDNO:160和SEQ ID NO:101(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:160和SEQ ID NO:162(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:160和SEQ ID NO:104(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ IDNO:160和SEQ ID NO:138(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:160和SEQ ID NO:1536(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:160和SEQ ID NO:1539(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:160和SEQ ID NO:1585(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1537和SEQ ID NO:165(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1537和SEQ ID NO:113(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1537和SEQ ID NO:99(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1537和SEQ ID NO:112(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1537和SEQ IDNO:98(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1537和SEQ ID NO:1580(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1537和SEQ ID NO:106(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1537和SEQID NO:1503(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1537和SEQ ID NO:1589(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1537和SEQ ID NO:160(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1537和SEQ ID NO:159(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1537和SEQ ID NO:101(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1537和SEQ ID NO:162(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1537和SEQ ID NO:104(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1537和SEQ ID NO:138(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1537和SEQ ID NO:1536(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ IDNO:1537和SEQ ID NO:1539(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1537和SEQ ID NO:1585(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:159和SEQ ID NO:165(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:159和SEQ ID NO:113(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:159和SEQ ID NO:99(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:159和SEQ ID NO:112(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:159和SEQ ID NO:98(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:159和SEQ ID NO:1580(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:159和SEQ ID NO:106(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:159和SEQ ID NO:1503(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:159和SEQ ID NO:1589(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:159和SEQ ID NO:160(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:159和SEQ ID NO:1537(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:159和SEQ ID NO:101(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:159和SEQ ID NO:162(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:159和SEQ ID NO:104(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:159和SEQ ID NO:138(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:159和SEQ ID NO:1536(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:159和SEQ ID NO:1539(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:159和SEQ ID NO:1585(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:101和SEQ IDNO:165(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:101和SEQ ID NO:113(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:101和SEQ ID NO:99(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:101和SEQ IDNO:112(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:101和SEQ ID NO:98(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:101和SEQ ID NO:1580(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:101和SEQ IDNO:106(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:101和SEQ ID NO:1503(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:101和SEQ ID NO:1589(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:101和SEQ IDNO:160(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:101和SEQ ID NO:1537(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:101和SEQ ID NO:159(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:101和SEQ IDNO:162(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:101和SEQ ID NO:104(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:101和SEQ ID NO:138(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:101和SEQ IDNO:1536(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:101和SEQ ID NO:1539(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:101和SEQ ID NO:1585(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:162和SEQ IDNO:165(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:162和SEQ ID NO:113(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:162和SEQ ID NO:99(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:162和SEQ IDNO:112(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:162和SEQ ID NO:98(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:162和SEQ ID NO:1580(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:162和SEQ IDNO:106(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:162和SEQ ID NO:1503(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:162和SEQ ID NO:1589(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:162和SEQ IDNO:160(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:162和SEQ ID NO:1537(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:162和SEQ ID NO:159(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:162和SEQ IDNO:101(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:104和SEQ ID NO:165(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:104和SEQ ID NO:113(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:104和SEQ IDNO:99(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:104和SEQ ID NO:112(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:104和SEQ ID NO:98(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:104和SEQ ID NO:1580(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:104和SEQ ID NO:106(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:104和SEQ ID NO:1503(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:104和SEQ IDNO:1589(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:104和SEQ ID NO:160(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:104和SEQ ID NO:1537(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:104和SEQ IDNO:159(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:104和SEQ ID NO:101(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:104和SEQ ID NO:162(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:104和SEQ IDNO:138(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:104和SEQ ID NO:1536(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:104和SEQ ID NO:1539(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:104和SEQ IDNO:1585(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:138和SEQ ID NO:165(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:138和SEQ ID NO:113(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:138和SEQ IDNO:99(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:138和SEQ ID NO:112(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:138和SEQ ID NO:98(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:138和SEQ ID NO:1580(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:138和SEQ ID NO:106(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:138和SEQ ID NO:1503(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:138和SEQ IDNO:1589(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:138和SEQ ID NO:160(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:138和SEQ ID NO:1537(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:138和SEQ IDNO:159(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:138和SEQ ID NO:101(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:138和SEQ ID NO:162(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:138和SEQ IDNO:104(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:138和SEQ ID NO:1536(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:138和SEQ ID NO:1539(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:138和SEQ IDNO:1585(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1536和SEQ ID NO:165(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1536和SEQ ID NO:113(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1536和SEQID NO:99(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1536和SEQ ID NO:112(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1536和SEQ ID NO:98(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1536和SEQ ID NO:1580(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1536和SEQ ID NO:106(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1536和SEQ ID NO:1503(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1536和SEQ ID NO:1589(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1536和SEQ ID NO:160(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1536和SEQ ID NO:1537(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:1536和SEQ ID NO:159(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1536和SEQ ID NO:101(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1536和SEQ ID NO:162(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1536和SEQ ID NO:104(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1536和SEQ ID NO:138(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1536和SEQ IDNO:1539(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1536和SEQ ID NO:1585(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1539和SEQ ID NO:165(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1539和SEQ ID NO:113(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1539和SEQ ID NO:99(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1539和SEQ ID NO:112(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1539和SEQ ID NO:98(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1539和SEQ ID NO:1580(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1539和SEQ ID NO:106(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1539和SEQ ID NO:1503(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1539和SEQ ID NO:1589(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1539和SEQ ID NO:160(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:1539和SEQ ID NO:1537(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1539和SEQ ID NO:159(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1539和SEQ ID NO:101(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1539和SEQ ID NO:162(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1539和SEQ ID NO:104(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1539和SEQ IDNO:138(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1539和SEQ ID NO:1536(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1539和SEQ ID NO:1585(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1585和SEQ ID NO:165(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1585和SEQ ID NO:113(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1585和SEQ ID NO:99(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1585和SEQ ID NO:112(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1585和SEQ ID NO:98(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1585和SEQ ID NO:1580(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1585和SEQ ID NO:106(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1585和SEQ ID NO:1503(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1585和SEQ ID NO:1589(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ IDNO:1585和SEQ ID NO:160(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1585和SEQ ID NO:1537(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1585和SEQ ID NO:159(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:1585和SEQ ID NO:101(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1585和SEQ ID NO:162(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1585和SEQ ID NO:104(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1585和SEQ ID NO:138(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1585和SEQ ID NO:1536(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1585和SEQ IDNO:1539(例如由其组成)的靶向结构域。

表7：针对BCL11a基因的+58增强子区域(即BCL11a增强子)的优选指导RNA靶向结构域

在本发明的一些方面，优选的是，对于BCL11a的+58增强子区域而言的gRNA分子包含图11中列出的gRNA的靶向结构域。在一方面，gRNA分子包含含有SEQ ID NO:341(例如由其组成)的靶向结构域。在一方面，gRNA分子包含含有SEQ ID NO:246(例如由其组成)的靶向结构域。在一方面，gRNA分子包含含有SEQ ID NO:248(例如由其组成)的靶向结构域。在一方面，gRNA分子包含含有SEQ ID NO:247(例如由其组成)的靶向结构域。在一方面，gRNA分子包含含有SEQ ID NO:245(例如由其组成)的靶向结构域。在一方面，gRNA分子包含含有SEQ ID NO:249(例如由其组成)的靶向结构域。在一方面，gRNA分子包含含有SEQ ID NO:244(例如由其组成)的靶向结构域。在一方面，gRNA分子包含含有SEQ ID NO:199(例如由其组成)的靶向结构域。在一方面，gRNA分子包含含有SEQ ID NO:251(例如由其组成)的靶向结构域。在一方面，gRNA分子包含含有SEQ ID NO:250(例如由其组成)的靶向结构域。在一方面，gRNA分子包含含有SEQ ID NO:334(例如由其组成)的靶向结构域。在一方面，gRNA分子包含含有SEQ ID NO:185(例如由其组成)的靶向结构域。在一方面，gRNA分子包含含有SEQ ID NO:186(例如由其组成)的靶向结构域。在一方面，gRNA分子包含含有SEQ ID NO:336(例如由其组成)的靶向结构域。在一方面，gRNA分子包含含有SEQ ID NO:337(例如由其组成)的靶向结构域。

在本发明的一些方面，例如如本文所示，包括靶向多于一个(例如两个)靶位点的gRNA分子(例如，第一gRNA分子和第二gRNA分子)可能是有益的。在一些实施例中，这两个靶位点均位于+58 BCL11a增强子区域中。在这些方面，可以使用包含表7中列出的靶向结构域的多于一种(例如两种)gRNA分子(例如，第一种gRNA分子和第二种gRNA分子)的任何组合。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:341和SEQ ID NO:244(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:341和SEQ ID NO:199(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:341和SEQ ID NO:251(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:341和SEQ ID NO:250(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:341和SEQ ID NO:334(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:341和SEQ ID NO:185(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:341和SEQ ID NO:186(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:341和SEQ ID NO:336(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:341和SEQ ID NO:337(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:341和SEQ ID NO:246(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:341和SEQ ID NO:248(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:341和SEQ ID NO:247(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:341和SEQ ID NO:245(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:341和SEQ ID NO:249(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:341和SEQ ID NO:244(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:341和SEQ ID NO:199(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:341和SEQ ID NO:251(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:341和SEQ ID NO:250(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:341和SEQ ID NO:334(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:341和SEQ ID NO:185(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:341和SEQ ID NO:186(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:341和SEQ ID NO:336(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:341和SEQ ID NO:337(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:246和SEQ ID NO:244(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:246和SEQ ID NO:199(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:246和SEQ ID NO:251(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:246和SEQ ID NO:250(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:246和SEQ ID NO:334(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:246和SEQ ID NO:185(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:246和SEQ ID NO:186(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:246和SEQ ID NO:336(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:246和SEQ ID NO:337(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:246和SEQ ID NO:248(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:246和SEQ ID NO:247(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:246和SEQ ID NO:245(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:246和SEQ ID NO:249(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:246和SEQ ID NO:244(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:246和SEQ ID NO:199(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:246和SEQ ID NO:251(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:246和SEQ ID NO:250(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:246和SEQ ID NO:334(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:246和SEQ ID NO:185(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:246和SEQ ID NO:186(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:246和SEQ ID NO:336(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:246和SEQ ID NO:337(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:248和SEQ ID NO:244(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:248和SEQ ID NO:199(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:248和SEQ ID NO:251(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:248和SEQ ID NO:250(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:248和SEQ ID NO:334(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:248和SEQ ID NO:185(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:248和SEQ ID NO:186(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:248和SEQ ID NO:336(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:248和SEQ ID NO:337(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:248和SEQ ID NO:246(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:248和SEQ ID NO:247(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:248和SEQ ID NO:245(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:248和SEQ ID NO:249(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:248和SEQ ID NO:244(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:248和SEQ ID NO:199(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:248和SEQ ID NO:251(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:248和SEQ ID NO:250(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:248和SEQ ID NO:334(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:248和SEQ ID NO:185(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:248和SEQ ID NO:186(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:248和SEQ ID NO:336(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:248和SEQ ID NO:337(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:247和SEQ ID NO:244(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:247和SEQ ID NO:199(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:247和SEQ ID NO:251(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:247和SEQ ID NO:250(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:247和SEQ ID NO:334(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:247和SEQ ID NO:185(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:247和SEQ ID NO:186(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:247和SEQ ID NO:336(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:247和SEQ ID NO:337(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:247和SEQ ID NO:246(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:247和SEQ ID NO:248(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:247和SEQ ID NO:245(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:247和SEQ ID NO:249(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:247和SEQ ID NO:244(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:247和SEQ ID NO:199(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:247和SEQ ID NO:251(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:247和SEQ ID NO:250(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:247和SEQ ID NO:334(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:247和SEQ ID NO:185(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:247和SEQ ID NO:186(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:247和SEQ ID NO:336(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:247和SEQ ID NO:337(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:245和SEQ ID NO:244(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:245和SEQ ID NO:199(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:245和SEQ ID NO:251(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:245和SEQ ID NO:250(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:245和SEQ ID NO:334(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:245和SEQ ID NO:185(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:245和SEQ ID NO:186(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:245和SEQ ID NO:336(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:245和SEQ ID NO:337(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:245和SEQ ID NO:246(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:245和SEQ ID NO:248(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:245和SEQ ID NO:247(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:245和SEQ ID NO:249(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:245和SEQ ID NO:244(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:245和SEQ ID NO:199(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:245和SEQ ID NO:251(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:245和SEQ ID NO:250(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:245和SEQ ID NO:334(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:245和SEQ ID NO:185(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:245和SEQ ID NO:186(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:245和SEQ ID NO:336(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:245和SEQ ID NO:337(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:249和SEQ ID NO:244(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:249和SEQ ID NO:199(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:249和SEQ ID NO:251(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:249和SEQ ID NO:250(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:249和SEQ ID NO:334(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:249和SEQ ID NO:185(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:249和SEQ ID NO:186(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:249和SEQ ID NO:336(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:249和SEQ ID NO:337(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:249和SEQ ID NO:246(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:249和SEQ ID NO:248(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:249和SEQ ID NO:247(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:249和SEQ ID NO:245(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:249和SEQ ID NO:244(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:249和SEQ ID NO:199(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:249和SEQ ID NO:251(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:249和SEQ ID NO:250(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:249和SEQ ID NO:334(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:249和SEQ ID NO:185(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:249和SEQ ID NO:186(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:249和SEQ ID NO:336(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:249和SEQ ID NO:337(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:244和SEQ ID NO:199(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:244和SEQ ID NO:251(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:244和SEQ ID NO:250(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:244和SEQ ID NO:334(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:244和SEQ ID NO:185(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:244和SEQ ID NO:186(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:244和SEQ ID NO:336(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:244和SEQ ID NO:337(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:244和SEQ ID NO:246(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:244和SEQ ID NO:248(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:244和SEQ ID NO:247(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:244和SEQ ID NO:245(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:244和SEQ ID NO:249(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:244和SEQ ID NO:199(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:244和SEQ ID NO:251(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:244和SEQ ID NO:250(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:244和SEQ ID NO:334(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:244和SEQ ID NO:185(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:244和SEQ ID NO:186(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:244和SEQ ID NO:336(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:244和SEQ ID NO:337(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:199和SEQ ID NO:244(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:199和SEQ ID NO:251(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:199和SEQ ID NO:250(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:199和SEQ ID NO:334(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:199和SEQ ID NO:185(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:199和SEQ ID NO:186(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:199和SEQ ID NO:336(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:199和SEQ ID NO:337(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:199和SEQ ID NO:246(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:199和SEQ ID NO:248(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:199和SEQ ID NO:247(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:199和SEQ ID NO:245(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:199和SEQ ID NO:249(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:199和SEQ ID NO:244(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:199和SEQ ID NO:251(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:199和SEQ ID NO:250(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:199和SEQ ID NO:334(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:199和SEQ ID NO:185(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:199和SEQ ID NO:186(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:199和SEQ ID NO:336(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:199和SEQ ID NO:337(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:251和SEQ ID NO:244(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:251和SEQ ID NO:199(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:251和SEQ ID NO:250(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:251和SEQ ID NO:334(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:251和SEQ ID NO:185(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:251和SEQ ID NO:186(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:251和SEQ ID NO:336(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:251和SEQ ID NO:337(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:251和SEQ ID NO:246(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:251和SEQ ID NO:248(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:251和SEQ ID NO:247(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:251和SEQ ID NO:245(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:251和SEQ ID NO:249(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:251和SEQ ID NO:244(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:251和SEQ ID NO:199(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:251和SEQ ID NO:250(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:251和SEQ ID NO:334(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:251和SEQ ID NO:185(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:251和SEQ ID NO:186(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:251和SEQ ID NO:336(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:251和SEQ ID NO:337(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:250和SEQ ID NO:244(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:250和SEQ ID NO:199(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:250和SEQ ID NO:251(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:250和SEQ ID NO:334(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:250和SEQ ID NO:185(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:250和SEQ ID NO:186(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:250和SEQ ID NO:336(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:250和SEQ ID NO:337(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:250和SEQ ID NO:246(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:250和SEQ ID NO:248(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:250和SEQ ID NO:247(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:250和SEQ ID NO:245(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:250和SEQ ID NO:249(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:250和SEQ ID NO:244(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:250和SEQ ID NO:199(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:250和SEQ ID NO:251(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:250和SEQ ID NO:334(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:250和SEQ ID NO:185(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:250和SEQ ID NO:186(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:250和SEQ ID NO:336(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:250和SEQ ID NO:337(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:334和SEQ ID NO:244(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:334和SEQ ID NO:199(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:334和SEQ ID NO:251(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:334和SEQ ID NO:250(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:334和SEQ ID NO:185(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:334和SEQ ID NO:186(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:334和SEQ ID NO:336(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:334和SEQ ID NO:337(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:334和SEQ ID NO:246(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:334和SEQ ID NO:248(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:334和SEQ ID NO:247(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:334和SEQ ID NO:245(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:334和SEQ ID NO:249(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:334和SEQ ID NO:244(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:334和SEQ ID NO:199(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:334和SEQ ID NO:251(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:334和SEQ ID NO:250(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:334和SEQ ID NO:185(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:334和SEQ ID NO:186(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:334和SEQ ID NO:336(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:334和SEQ ID NO:337(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:185和SEQ ID NO:244(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:185和SEQ ID NO:199(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:185和SEQ ID NO:251(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:185和SEQ ID NO:250(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:185和SEQ ID NO:334(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:185和SEQ ID NO:186(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:185和SEQ ID NO:336(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:185和SEQ ID NO:337(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:185和SEQ ID NO:246(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:185和SEQ ID NO:248(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:185和SEQ ID NO:247(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:185和SEQ ID NO:245(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:185和SEQ ID NO:249(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:185和SEQ ID NO:244(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:185和SEQ ID NO:199(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:185和SEQ ID NO:251(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:185和SEQ ID NO:250(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:185和SEQ ID NO:334(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:185和SEQ ID NO:186(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:185和SEQ ID NO:336(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:185和SEQ ID NO:337(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:186和SEQ ID NO:244(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:186和SEQ ID NO:199(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:186和SEQ ID NO:251(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:186和SEQ ID NO:250(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:186和SEQ ID NO:334(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:186和SEQ ID NO:185(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:186和SEQ ID NO:336(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:186和SEQ ID NO:337(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:186和SEQ ID NO:246(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:186和SEQ ID NO:248(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:186和SEQ ID NO:247(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:186和SEQ ID NO:245(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:186和SEQ ID NO:249(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:186和SEQ ID NO:244(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:186和SEQ ID NO:199(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:186和SEQ ID NO:251(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:186和SEQ ID NO:250(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:186和SEQ ID NO:334(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:186和SEQ ID NO:185(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:186和SEQ ID NO:336(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:186和SEQ ID NO:337(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:336和SEQ ID NO:244(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:336和SEQ ID NO:199(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:336和SEQ ID NO:251(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:336和SEQ ID NO:250(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:336和SEQ ID NO:334(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:336和SEQ ID NO:185(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:336和SEQ ID NO:186(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:336和SEQ ID NO:337(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:336和SEQ ID NO:246(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:336和SEQ ID NO:248(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:336和SEQ ID NO:247(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:336和SEQ ID NO:245(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:336和SEQ ID NO:249(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:336和SEQ ID NO:244(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:336和SEQ ID NO:199(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:336和SEQ ID NO:251(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:336和SEQ ID NO:250(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:336和SEQ ID NO:334(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:336和SEQ ID NO:185(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:336和SEQ ID NO:186(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:336和SEQ ID NO:337(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:337和SEQ ID NO:244(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:337和SEQ ID NO:199(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:337和SEQ ID NO:251(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:337和SEQ ID NO:250(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:337和SEQ ID NO:334(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:337和SEQ ID NO:185(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:337和SEQ ID NO:186(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:337和SEQ ID NO:336(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:337和SEQ ID NO:246(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:337和SEQ ID NO:248(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:337和SEQ ID NO:247(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:337和SEQ ID NO:245(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:337和SEQ ID NO:249(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:337和SEQ ID NO:244(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:337和SEQ ID NO:199(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:337和SEQ ID NO:251(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:337和SEQ ID NO:250(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:337和SEQ ID NO:334(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:337和SEQ ID NO:185(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:337和SEQ ID NO:186(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:337和SEQ ID NO:336(例如由其组成)的靶向结构域。

在实施例中，本发明的方面涉及或包含与BCL11a基因的+58增强子区域内的靶序列互补的gRNA分子，其被布置于GATA-1结合位点的3'，例如GATA1结合位点和TAL-1结合位点的3'。在实施例中，包含本文所述的gRNA分子的CRISPR系统在靶位点处或其附近诱导一个或多个插入/缺失。在实施例中，插入/缺失不包含GATA-1结合位点的核苷酸并且/或不包含TAL-1结合位点的核苷酸。在实施例中，CRISPR系统在靶位点处或或其附近例如以至少约10％、至少约20％、至少约30％、至少约40％或至少约50％的总体移码插入/缺失率(例如如通过NGS所测量的)诱导一个或多个移码插入/缺失。在实施例中，总体插入/缺失率为至少约70％、至少约80％、至少约90％或至少约95％，例如如通过NGS所测量的。

表8：针对BCL11a基因的+62增强子区域(即BCL11a增强子)的优选指导RNA靶向结构域

在本发明的一些方面，优选的是，对于BCL11a的+62增强子区域而言的gRNA分子包含图12中列出的gRNA的靶向结构域。在一方面，gRNA分子包含含有SEQ ID NO:318(例如由其组成)的靶向结构域。在一方面，gRNA分子包含含有SEQ ID NO:312(例如由其组成)的靶向结构域。在一方面，gRNA分子包含含有SEQ ID NO:313(例如由其组成)的靶向结构域。在一方面，gRNA分子包含含有SEQ ID NO:294(例如由其组成)的靶向结构域。在一方面，gRNA分子包含含有SEQ ID NO:310(例如由其组成)的靶向结构域。在一方面，gRNA分子包含含有SEQ ID NO:319(例如由其组成)的靶向结构域。在一方面，gRNA分子包含含有SEQ ID NO:298(例如由其组成)的靶向结构域。在一方面，gRNA分子包含含有SEQ ID NO:322(例如由其组成)的靶向结构域。在一方面，gRNA分子包含含有SEQ ID NO:311(例如由其组成)的靶向结构域。在一方面，gRNA分子包含含有SEQ ID NO:315(例如由其组成)的靶向结构域。在一方面，gRNA分子包含含有SEQ ID NO:290(例如由其组成)的靶向结构域。在一方面，gRNA分子包含含有SEQ ID NO:317(例如由其组成)的靶向结构域。在一方面，gRNA分子包含含有SEQ ID NO:309(例如由其组成)的靶向结构域。在一方面，gRNA分子包含含有SEQ ID NO:289(例如由其组成)的靶向结构域。在一方面，gRNA分子包含含有SEQ ID NO:281(例如由其组成)的靶向结构域。

在本发明的一些方面，例如如本文所示，包括靶向多于一个(例如两个)靶位点的gRNA分子(例如，第一gRNA分子和第二gRNA分子)可能是有益的。在一些实施例中，这两个靶位点均位于+62 BCL11a增强子区域中。在这些方面，可以使用包含表8中列出的靶向结构域的多于一种(例如两种)gRNA分子(例如，第一种gRNA分子和第二种gRNA分子)的任何组合。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:318和SEQ ID NO:312(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:318和SEQ ID NO:313(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:318和SEQ ID NO:294(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:318和SEQ ID NO:310(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:318和SEQ ID NO:319(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:318和SEQ ID NO:298(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:318和SEQ ID NO:322(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:318和SEQ ID NO:311(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:318和SEQ ID NO:315(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:318和SEQ ID NO:290(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:318和SEQ ID NO:317(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:318和SEQ ID NO:309(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:318和SEQ ID NO:289(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:318和SEQ ID NO:281(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:312和SEQ ID NO:313(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:312和SEQ ID NO:294(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:312和SEQ ID NO:310(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:312和SEQ ID NO:319(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:312和SEQ ID NO:298(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:312和SEQ ID NO:322(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:312和SEQ ID NO:311(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:312和SEQ ID NO:315(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:312和SEQ ID NO:290(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:312和SEQ ID NO:317(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:312和SEQ ID NO:309(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:312和SEQ ID NO:289(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:312和SEQ ID NO:281(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:313和SEQ ID NO:312(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:313和SEQ ID NO:294(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:313和SEQ ID NO:310(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:313和SEQ ID NO:319(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:313和SEQ ID NO:298(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:313和SEQ ID NO:322(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:313和SEQ ID NO:311(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:313和SEQ ID NO:315(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:313和SEQ ID NO:290(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:313和SEQ ID NO:317(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:313和SEQ ID NO:309(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:313和SEQ ID NO:289(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:313和SEQ ID NO:281(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:294和SEQ ID NO:312(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:294和SEQ ID NO:313(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:294和SEQ ID NO:310(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:294和SEQ ID NO:319(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:294和SEQ ID NO:298(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:294和SEQ ID NO:322(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:294和SEQ ID NO:311(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:294和SEQ ID NO:315(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:294和SEQ ID NO:290(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:294和SEQ ID NO:317(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:294和SEQ ID NO:309(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:294和SEQ ID NO:289(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:294和SEQ ID NO:281(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:310和SEQ ID NO:312(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:310和SEQ ID NO:313(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:310和SEQ ID NO:294(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:310和SEQ ID NO:319(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:310和SEQ ID NO:298(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:310和SEQ ID NO:322(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:310和SEQ ID NO:311(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:310和SEQ ID NO:315(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:310和SEQ ID NO:290(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:310和SEQ ID NO:317(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:310和SEQ ID NO:309(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:310和SEQ ID NO:289(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:310和SEQ ID NO:281(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:319和SEQ ID NO:312(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:319和SEQ ID NO:313(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:319和SEQ ID NO:294(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:319和SEQ ID NO:310(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:319和SEQ ID NO:298(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:319和SEQ ID NO:322(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:319和SEQ ID NO:311(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:319和SEQ ID NO:315(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:319和SEQ ID NO:290(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:319和SEQ ID NO:317(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:319和SEQ ID NO:309(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:319和SEQ ID NO:289(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:319和SEQ ID NO:281(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:298和SEQ ID NO:312(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:298和SEQ ID NO:313(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:298和SEQ ID NO:294(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:298和SEQ ID NO:310(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:298和SEQ ID NO:319(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:298和SEQ ID NO:322(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:298和SEQ ID NO:311(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:298和SEQ ID NO:315(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:298和SEQ ID NO:290(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:298和SEQ ID NO:317(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:298和SEQ ID NO:309(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:298和SEQ ID NO:289(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:298和SEQ ID NO:281(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:322和SEQ ID NO:312(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:322和SEQ ID NO:313(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:322和SEQ ID NO:294(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:322和SEQ ID NO:310(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:322和SEQ ID NO:319(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:322和SEQ ID NO:298(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:322和SEQ ID NO:311(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:322和SEQ ID NO:315(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:322和SEQ ID NO:290(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:322和SEQ ID NO:317(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:322和SEQ ID NO:309(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:322和SEQ ID NO:289(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:322和SEQ ID NO:281(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:311和SEQ ID NO:312(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:311和SEQ ID NO:313(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:311和SEQ ID NO:294(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:311和SEQ ID NO:310(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:311和SEQ ID NO:319(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:311和SEQ ID NO:298(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:311和SEQ ID NO:322(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:311和SEQ ID NO:315(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:311和SEQ ID NO:290(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:311和SEQ ID NO:317(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:311和SEQ ID NO:309(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:311和SEQ ID NO:289(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:311和SEQ ID NO:281(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:315和SEQ ID NO:312(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:315和SEQ ID NO:313(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:315和SEQ ID NO:294(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:315和SEQ ID NO:310(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:315和SEQ ID NO:319(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:315和SEQ ID NO:298(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:315和SEQ ID NO:322(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:315和SEQ ID NO:311(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:315和SEQ ID NO:290(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:315和SEQ ID NO:317(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:315和SEQ ID NO:309(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:315和SEQ ID NO:289(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:315和SEQ ID NO:281(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:290和SEQ ID NO:312(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:290和SEQ ID NO:313(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:290和SEQ ID NO:294(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:290和SEQ ID NO:310(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:290和SEQ ID NO:319(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:290和SEQ ID NO:298(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:290和SEQ ID NO:322(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:290和SEQ ID NO:311(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:290和SEQ ID NO:315(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:290和SEQ ID NO:317(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:290和SEQ ID NO:309(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:290和SEQ ID NO:289(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:290和SEQ ID NO:281(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:317和SEQ ID NO:312(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:317和SEQ ID NO:313(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:317和SEQ ID NO:294(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:317和SEQ ID NO:310(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:317和SEQ ID NO:319(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:317和SEQ ID NO:298(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:317和SEQ ID NO:322(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:317和SEQ ID NO:311(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:317和SEQ ID NO:315(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:317和SEQ ID NO:290(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:317和SEQ ID NO:309(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:317和SEQ ID NO:289(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:317和SEQ ID NO:281(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:309和SEQ ID NO:312(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:309和SEQ ID NO:313(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:309和SEQ ID NO:294(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:309和SEQ ID NO:310(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:309和SEQ ID NO:319(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:309和SEQ ID NO:298(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:309和SEQ ID NO:322(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:309和SEQ ID NO:311(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:309和SEQ ID NO:315(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:309和SEQ ID NO:290(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:309和SEQ ID NO:317(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:309和SEQ ID NO:289(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:309和SEQ ID NO:281(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:289和SEQ ID NO:312(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:289和SEQ ID NO:313(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:289和SEQ ID NO:294(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:289和SEQ ID NO:310(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:289和SEQ ID NO:319(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:289和SEQ ID NO:298(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:289和SEQ ID NO:322(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:289和SEQ ID NO:311(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:289和SEQ ID NO:315(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:289和SEQ ID NO:290(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:289和SEQ ID NO:317(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:289和SEQ ID NO:309(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:289和SEQ ID NO:281(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:281和SEQ ID NO:312(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:281和SEQ ID NO:313(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:281和SEQ ID NO:294(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:281和SEQ ID NO:310(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:281和SEQ ID NO:319(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:281和SEQ ID NO:298(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:281和SEQ ID NO:322(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:281和SEQ ID NO:311(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:281和SEQ ID NO:315(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:281和SEQ ID NO:290(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:281和SEQ ID NO:317(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:281和SEQ ID NO:309(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:281和SEQ ID NO:289(例如由其组成)的靶向结构域。

表9.针对BCL11a基因的+55增强子区域(即BCL11a增强子)的优选指导RNA靶向结构域

在本发明的一些方面，优选的是，对于BCL11a的+55增强子区域而言的gRNA分子包含含有靶向结构域序列(例如由其组成)的靶向结构域，该靶向结构域序列选自SEQ ID NO:1683、SEQ ID NO:1638、SEQ ID NO:1647、SEQ ID NO:1609、SEQ ID NO:1621、SEQ ID NO:1617、SEQ ID NO:1654、SEQ ID NO:1631、SEQ ID NO:1620、SEQ ID NO:1637、SEQ ID NO:1612、SEQ ID NO:1656、SEQ ID NO:1619、SEQ ID NO:1675、SEQ ID NO:1645、SEQ ID NO:1598、SEQ ID NO:1599、SEQ ID NO:1663、SEQ ID NO:1677和SEQ ID NO:1626。

在本发明的一些方面，例如如本文所示，包括靶向多于一个(例如两个)靶位点的gRNA分子(例如，第一gRNA分子和第二gRNA分子)可能是有益的。在一些实施例中，这两个靶位点均位于+55 BCL11a增强子区域中。在这些方面，可以使用包含表9中列出的靶向结构域(例如由其组成)的多于一种(例如两种)gRNA分子(例如，第一种gRNA分子和第二种gRNA分子)的任何组合，这些靶向结构域靶向+55BCL11a增强子区域的不同靶位点。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1683和SEQ ID NO:1638(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1683和SEQ ID NO:1647(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1683和SEQ ID NO:1609(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1683和SEQ ID NO:1621(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ IDNO:1683和SEQ ID NO:1617(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1683和SEQ ID NO:1654(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1683和SEQ ID NO:1631(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:1683和SEQ ID NO:1620(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1683和SEQ ID NO:1637(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1683和SEQ IDNO:1612(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1683和SEQ ID NO:1656(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1683和SEQ ID NO:1619(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1683和SEQ ID NO:1675(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1683和SEQ ID NO:1645(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1683和SEQ ID NO:1598(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ IDNO:1683和SEQ ID NO:1599(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1683和SEQ ID NO:1663(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1683和SEQ ID NO:1677(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:1683和SEQ ID NO:1626(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1638和SEQ ID NO:1647(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1638和SEQ IDNO:1609(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1638和SEQ ID NO:1621(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1638和SEQ ID NO:1617(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1638和SEQ ID NO:1654(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1638和SEQ ID NO:1631(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1638和SEQ ID NO:1620(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ IDNO:1638和SEQ ID NO:1637(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1638和SEQ ID NO:1612(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1638和SEQ ID NO:1656(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:1638和SEQ ID NO:1619(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1638和SEQ ID NO:1675(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1638和SEQ IDNO:1645(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1638和SEQ ID NO:1598(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1638和SEQ ID NO:1599(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1638和SEQ ID NO:1663(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1638和SEQ ID NO:1677(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1638和SEQ ID NO:1626(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ IDNO:1647和SEQ ID NO:1638(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1647和SEQ ID NO:1609(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1647和SEQ ID NO:1621(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:1647和SEQ ID NO:1617(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1647和SEQ ID NO:1654(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1647和SEQ IDNO:1631(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1647和SEQ ID NO:1620(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1647和SEQ ID NO:1637(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1647和SEQ ID NO:1612(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1647和SEQ ID NO:1656(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1647和SEQ ID NO:1619(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ IDNO:1647和SEQ ID NO:1675(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1647和SEQ ID NO:1645(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1647和SEQ ID NO:1598(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:1647和SEQ ID NO:1599(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1647和SEQ ID NO:1663(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1647和SEQ IDNO:1677(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1647和SEQ ID NO:1626(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1609和SEQ ID NO:1638(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1609和SEQ ID NO:1647(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1609和SEQ ID NO:1621(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1609和SEQ ID NO:1617(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ IDNO:1609和SEQ ID NO:1654(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1609和SEQ ID NO:1631(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1609和SEQ ID NO:1620(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:1609和SEQ ID NO:1637(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1609和SEQ ID NO:1612(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1609和SEQ IDNO:1656(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1609和SEQ ID NO:1619(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1609和SEQ ID NO:1675(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1609和SEQ ID NO:1645(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1609和SEQ ID NO:1598(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1609和SEQ ID NO:1599(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ IDNO:1609和SEQ ID NO:1663(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1609和SEQ ID NO:1677(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1609和SEQ ID NO:1626(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:1621和SEQ ID NO:1638(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1621和SEQ ID NO:1647(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1621和SEQ IDNO:1609(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1621和SEQ ID NO:1617(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1621和SEQ ID NO:1654(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1621和SEQ ID NO:1631(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1621和SEQ ID NO:1620(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1621和SEQ ID NO:1637(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ IDNO:1621和SEQ ID NO:1612(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1621和SEQ ID NO:1656(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1621和SEQ ID NO:1619(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:1621和SEQ ID NO:1675(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1621和SEQ ID NO:1645(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1621和SEQ IDNO:1598(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1621和SEQ ID NO:1599(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1621和SEQ ID NO:1663(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1621和SEQ ID NO:1677(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1621和SEQ ID NO:1626(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1617和SEQ ID NO:1638(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ IDNO:1617和SEQ ID NO:1647(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1617和SEQ ID NO:1609(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1617和SEQ ID NO:1621(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:1617和SEQ ID NO:1654(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1617和SEQ ID NO:1631(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1617和SEQ IDNO:1620(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1617和SEQ ID NO:1637(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1617和SEQ ID NO:1612(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1617和SEQ ID NO:1656(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1617和SEQ ID NO:1619(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1617和SEQ ID NO:1675(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ IDNO:1617和SEQ ID NO:1645(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1617和SEQ ID NO:1598(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1617和SEQ ID NO:1599(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:1617和SEQ ID NO:1663(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1617和SEQ ID NO:1677(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1617和SEQ IDNO:1626(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1654和SEQ ID NO:1638(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1654和SEQ ID NO:1647(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1654和SEQ ID NO:1609(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1654和SEQ ID NO:1621(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1654和SEQ ID NO:1617(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ IDNO:1654和SEQ ID NO:1631(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1654和SEQ ID NO:1620(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1654和SEQ ID NO:1637(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:1654和SEQ ID NO:1612(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1654和SEQ ID NO:1656(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1654和SEQ IDNO:1619(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1654和SEQ ID NO:1675(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1654和SEQ ID NO:1645(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1654和SEQ ID NO:1598(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1654和SEQ ID NO:1599(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1654和SEQ ID NO:1663(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ IDNO:1654和SEQ ID NO:1677(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1654和SEQ ID NO:1626(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1631和SEQ ID NO:1638(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:1631和SEQ ID NO:1647(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1631和SEQ ID NO:1609(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1631和SEQ IDNO:1621(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1631和SEQ ID NO:1617(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1631和SEQ ID NO:1654(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1631和SEQ ID NO:1620(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1631和SEQ ID NO:1637(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1631和SEQ ID NO:1612(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ IDNO:1631和SEQ ID NO:1656(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1631和SEQ ID NO:1619(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1631和SEQ ID NO:1675(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:1631和SEQ ID NO:1645(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1631和SEQ ID NO:1598(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1631和SEQ IDNO:1599(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1631和SEQ ID NO:1663(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1631和SEQ ID NO:1677(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1631和SEQ ID NO:1626(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1620和SEQ ID NO:1638(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1620和SEQ ID NO:1647(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ IDNO:1620和SEQ ID NO:1609(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1620和SEQ ID NO:1621(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1620和SEQ ID NO:1617(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:1620和SEQ ID NO:1654(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1620和SEQ ID NO:1631(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1620和SEQ IDNO:1637(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1620和SEQ ID NO:1612(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1620和SEQ ID NO:1656(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1620和SEQ ID NO:1619(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1620和SEQ ID NO:1675(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1620和SEQ ID NO:1645(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ IDNO:1620和SEQ ID NO:1598(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1620和SEQ ID NO:1599(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1620和SEQ ID NO:1663(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:1620和SEQ ID NO:1677(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1620和SEQ ID NO:1626(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1637和SEQ IDNO:1638(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1637和SEQ ID NO:1647(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1637和SEQ ID NO:1609(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1637和SEQ ID NO:1621(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1637和SEQ ID NO:1617(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1637和SEQ ID NO:1654(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ IDNO:1637和SEQ ID NO:1631(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1637和SEQ ID NO:1620(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1637和SEQ ID NO:1612(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:1637和SEQ ID NO:1656(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1637和SEQ ID NO:1619(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1637和SEQ IDNO:1675(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1637和SEQ ID NO:1645(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1637和SEQ ID NO:1598(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1637和SEQ ID NO:1599(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1637和SEQ ID NO:1663(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1637和SEQ ID NO:1677(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ IDNO:1637和SEQ ID NO:1626(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1612和SEQ ID NO:1638(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1612和SEQ ID NO:1647(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:1612和SEQ ID NO:1609(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1612和SEQ ID NO:1621(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1612和SEQ IDNO:1617(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1612和SEQ ID NO:1654(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1612和SEQ ID NO:1631(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1612和SEQ ID NO:1620(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1612和SEQ ID NO:1637(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1612和SEQ ID NO:1656(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ IDNO:1612和SEQ ID NO:1619(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1612和SEQ ID NO:1675(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1612和SEQ ID NO:1645(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:1612和SEQ ID NO:1598(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1612和SEQ ID NO:1599(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1612和SEQ IDNO:1663(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1612和SEQ ID NO:1677(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1612和SEQ ID NO:1626(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1656和SEQ ID NO:1638(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1656和SEQ ID NO:1647(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1656和SEQ ID NO:1609(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ IDNO:1656和SEQ ID NO:1621(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1656和SEQ ID NO:1617(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1656和SEQ ID NO:1654(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:1656和SEQ ID NO:1631(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1656和SEQ ID NO:1620(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1656和SEQ IDNO:1637(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1656和SEQ ID NO:1612(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1656和SEQ ID NO:1619(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1656和SEQ ID NO:1675(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1656和SEQ ID NO:1645(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1656和SEQ ID NO:1598(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ IDNO:1656和SEQ ID NO:1599(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1656和SEQ ID NO:1663(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1656和SEQ ID NO:1677(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:1656和SEQ ID NO:1626(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1619和SEQ ID NO:1638(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1619和SEQ IDNO:1647(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1619和SEQ ID NO:1609(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1619和SEQ ID NO:1621(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1619和SEQ ID NO:1617(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1619和SEQ ID NO:1654(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1619和SEQ ID NO:1631(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ IDNO:1619和SEQ ID NO:1620(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1619和SEQ ID NO:1637(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1619和SEQ ID NO:1612(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:1619和SEQ ID NO:1656(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1619和SEQ ID NO:1675(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1619和SEQ IDNO:1645(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1619和SEQ ID NO:1598(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1619和SEQ ID NO:1599(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1619和SEQ ID NO:1663(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1619和SEQ ID NO:1677(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1619和SEQ ID NO:1626(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ IDNO:1675和SEQ ID NO:1638(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1675和SEQ ID NO:1647(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1675和SEQ ID NO:1609(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:1675和SEQ ID NO:1621(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1675和SEQ ID NO:1617(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1675和SEQ IDNO:1654(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1675和SEQ ID NO:1631(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1675和SEQ ID NO:1620(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1675和SEQ ID NO:1637(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1675和SEQ ID NO:1612(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1675和SEQ ID NO:1656(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ IDNO:1675和SEQ ID NO:1619(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1675和SEQ ID NO:1645(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1675和SEQ ID NO:1598(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:1675和SEQ ID NO:1599(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1675和SEQ ID NO:1663(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1675和SEQ IDNO:1677(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1675和SEQ ID NO:1626(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1645和SEQ ID NO:1638(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1645和SEQ ID NO:1647(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1645和SEQ ID NO:1609(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1645和SEQ ID NO:1621(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ IDNO:1645和SEQ ID NO:1617(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1645和SEQ ID NO:1654(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1645和SEQ ID NO:1631(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:1645和SEQ ID NO:1620(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1645和SEQ ID NO:1637(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1645和SEQ IDNO:1612(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1645和SEQ ID NO:1656(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1645和SEQ ID NO:1619(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1645和SEQ ID NO:1675(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1598和SEQ ID NO:1638(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1598和SEQ ID NO:1647(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ IDNO:1598和SEQ ID NO:1609(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1598和SEQ ID NO:1621(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1598和SEQ ID NO:1617(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:1598和SEQ ID NO:1654(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1598和SEQ ID NO:1631(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1598和SEQ IDNO:1620(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1598和SEQ ID NO:1637(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1598和SEQ ID NO:1612(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1598和SEQ ID NO:1656(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1598和SEQ ID NO:1619(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1598和SEQ ID NO:1675(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ IDNO:1598和SEQ ID NO:1645(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1598和SEQ ID NO:1599(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1598和SEQ ID NO:1663(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:1598和SEQ ID NO:1677(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1598和SEQ ID NO:1626(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1599和SEQ IDNO:1638(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1599和SEQ ID NO:1647(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1599和SEQ ID NO:1609(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1599和SEQ ID NO:1621(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1599和SEQ ID NO:1617(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1599和SEQ ID NO:1654(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ IDNO:1599和SEQ ID NO:1631(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1599和SEQ ID NO:1620(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1599和SEQ ID NO:1637(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:1599和SEQ ID NO:1612(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1599和SEQ ID NO:1656(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1599和SEQ IDNO:1619(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1599和SEQ ID NO:1675(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1599和SEQ ID NO:1645(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1599和SEQ ID NO:1598(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1599和SEQ ID NO:1663(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1599和SEQ ID NO:1677(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ IDNO:1599和SEQ ID NO:1626(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1663和SEQ ID NO:1638(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1663和SEQ ID NO:1647(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:1663和SEQ ID NO:1609(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1663和SEQ ID NO:1621(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1663和SEQ IDNO:1617(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1663和SEQ ID NO:1654(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1663和SEQ ID NO:1631(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1663和SEQ ID NO:1620(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1663和SEQ ID NO:1637(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1663和SEQ ID NO:1612(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ IDNO:1663和SEQ ID NO:1656(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1663和SEQ ID NO:1619(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1663和SEQ ID NO:1675(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:1663和SEQ ID NO:1645(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1663和SEQ ID NO:1598(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1663和SEQ IDNO:1599(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1663和SEQ ID NO:1677(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1663和SEQ ID NO:1626(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1677和SEQ ID NO:1638(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1677和SEQ ID NO:1647(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1677和SEQ ID NO:1609(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ IDNO:1677和SEQ ID NO:1621(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1677和SEQ ID NO:1617(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1677和SEQ ID NO:1654(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:1677和SEQ ID NO:1631(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1677和SEQ ID NO:1620(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1677和SEQ IDNO:1637(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1677和SEQ ID NO:1612(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1677和SEQ ID NO:1656(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1677和SEQ ID NO:1619(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1677和SEQ ID NO:1675(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1677和SEQ ID NO:1645(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ IDNO:1677和SEQ ID NO:1598(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1677和SEQ ID NO:1599(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1677和SEQ ID NO:1663(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:1677和SEQ ID NO:1626(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1626和SEQ ID NO:1638(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1626和SEQ IDNO:1647(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1626和SEQ ID NO:1609(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1626和SEQ ID NO:1621(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1626和SEQ ID NO:1617(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1626和SEQ ID NO:1654(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1626和SEQ ID NO:1631(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ IDNO:1626和SEQ ID NO:1620(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1626和SEQ ID NO:1637(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1626和SEQ ID NO:1612(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQID NO:1626和SEQ ID NO:1656(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1626和SEQ ID NO:1619(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1626和SEQ IDNO:1675(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1626和SEQ ID NO:1645(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1626和SEQ ID NO:1598(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1626和SEQ ID NO:1599(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1626和SEQ ID NO:1663(例如由其组成)的靶向结构域。在一方面，第一gRNA分子和第二gRNA分子分别包含含有SEQ ID NO:1626和SEQ ID NO:1677(例如由其组成)的靶向结构域。

III.用于设计gRNA的方法

本文描述了用于设计gRNA的方法，包括用于选择、设计和验证靶序列的方法。本文还提供了示例性靶向结构域。本文讨论的靶向结构域可以掺入本文所述的gRNA中。

用于选择和验证靶序列以及脱靶分析的方法描述于例如Mali等人,2013 SCIENCE[科学]339(6121):823-826；Hsu等人,2013 NAT BIOTECHNOL[自然生物技术],31(9):827-32；Fu等人,2014 NAT BIOTECHNOL[自然生物技术],doi:10.1038/nbt.2808.PubMed PMID:24463574；Heigwer等人,2014 NAT METHODS[自然方法]ll(2):122-3.doi:10.1038/nmeth.2812.PubMed PMID:24481216；Bae等人,2014BIOINFORMATICS[生物信息学]PubMedPMID:24463181；Xiao A等人,2014 BIOINFORMATICS[生物信息学]PubMed PMID:24389662中。

例如，软件工具可用于优化对用户靶序列内gRNA的选择，例如以最小化整个基因组中的总脱靶活性。脱靶活性可能不是切割。对于每种可能的gRNA选择，例如使用酿脓链球菌Cas9，该工具可以鉴别整个基因组中含有多达一定数量(例如，1、2、3、4、5、6、7、8、9或10个)的错配碱基对的所有脱靶序列(例如前述的NAG或NGG PAM)。可以例如使用实验衍生的加权方案来预测每个脱靶序列处的切割效率。然后根据其预测的总脱靶切割对每种可能的gRNA进行排列；排名靠前的gRNA代表可能具有最大中靶切割和最少脱靶切割的gRNA。其他功能(例如，用于CRISPR构建的自动化试剂设计、用于中靶Surveyor测定的引物设计、以及用于经由下一代测序对脱靶切割进行高通量检测和定量的引物设计)也可以被包括在该工具中。候选gRNA分子可以通过本领域已知的方法或如本文所述的进行评估。

虽然软件算法可用于生成潜在gRNA分子的初始列表，但切割效率和特异性不一定反映预测值，并且gRNA分子通常需要在特定细胞系(例如原代人细胞系，例如人HSPC，例如人CD34+细胞)中筛选，以确定例如切割效率、插入/缺失形成、切割特异性和所需表型的变化。可以通过本文所述的方法测定这些特性。

在本发明的方面，包含CR00312的靶向结构域(SEQ ID NO:248，下面加下划线的)的gRNA，例如以下描述的gRNA分子之一，可用于本发明的CRISPR系统、方法、细胞以及其他方面和实施例中，包括在涉及多于一种例如本文所述的gRNA分子的方面：

sgRNA CR00312#1：

GUUUGGCCUCUGAUUAGGGUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU(SEQ ID NO:342)

sgRNA CR00312#2：

mG*mU*mU*UGGCCUCUGAUUAGGGUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCU*mU*mU*mU(SEQ ID NO:343)

sgRNA CR00312#3：

mG*mU*mU*UGGCCUCUGAUUAGGGUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCmU*mU*mU*U(SEQ ID NO:1762)

dgRNA CR00312#1：

crRNA：

GUUUGGCCUCUGAUUAGGGUGUUUUAGAGCUAUGCUGUUUUG(SEQ ID NO:344)

tracr：

AACAGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUUUUU(SEQ ID NO:6660)

dgRNA CR00312#2：

crRNA：

mG*mU*mU*UGGCCUCUGAUUAGGGUGUUUUAGAGCUAUGCUGUU*mU*mU*mG(SEQ ID NO:345)

tracr：

mA*mA*mC*AGCAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU*mU*mU*mU(SEQ ID NO:346)

dgRNA CR00312#3：

crRNA：

mG*mU*mU*UGGCCUCUGAUUAGGGUGUUUUAGAGCUAUGCUGUU*mU*mU*mG(SEQ ID NO:345)

tracr：

在本发明的方面，包含CR001128的靶向结构域(SEQ ID NO:338，下面加下划线的)的gRNA，例如以下描述的gRNA分子之一，可用于本发明的CRISPR系统、方法、细胞以及其他方面和实施例中，包括在涉及多于一种例如本文所述的gRNA分子的方面：

sgRNA CR001128#1：

AUCAGAGGCCAAACCCUUCCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU(SEQ ID NO:347)

sgRNA CR001128#2：

mA*mU*mC*AGAGGCCAAACCCUUCCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCU*mU*mU*mU(SEQ ID NO:348)

sgRNA CR001128#3：

mA*mU*mC*AGAGGCCAAACCCUUCCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCmU*mU*mU*U(SEQ ID NO:1763)

dgRNA CR001128#1：

crRNA：

AUCAGAGGCCAAACCCUUCCGUUUUAGAGCUAUGCUGUUUUG(SEQ ID NO:349)

tracr：

dgRNA CR001128#2：

crRNA：

mA*mU*mC*AGAGGCCAAACCCUUCCGUUUUAGAGCUAUGCUGUU*mU*mU*mG(SEQ ID NO:350)

tracr：

dgRNA CR001128#3：

crRNA：

mA*mU*mC*AGAGGCCAAACCCUUCCGUUUUAGAGCUAUGCUGUU*mU*mU*mG(SEQ ID NO:350)

tracr：

在本发明的方面，包含CR001126的靶向结构域(SEQ ID NO:336，下面加下划线的)的gRNA，例如以下描述的gRNA分子之一，可用于本发明的CRISPR系统、方法、细胞以及其他方面和实施例中，包括在涉及多于一种例如本文所述的gRNA分子的方面：

sgRNA CR001126#1：

UUUAUCACAGGCUCCAGGAAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU(SEQ ID NO:351)

sgRNA CR001126#2：

mU*mU*mU*AUCACAGGCUCCAGGAAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCU*mU*mU*mU(SEQ ID NO:352)

sgRNA CR001126#3：

mU*mU*mU*AUCACAGGCUCCAGGAAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCmU*mU*mU*U(SEQ ID NO:1764)

dgRNA CR001126#1：

crRNA：

UUUAUCACAGGCUCCAGGAAGUUUUAGAGCUAUGCUGUUUUG(SEQ ID NO:353)

tracr：

dgRNA CR001126#2：

crRNA：

mU*mU*mU*AUCACAGGCUCCAGGAAGUUUUAGAGCUAUGCUGUU*mU*mU*mG(SEQ ID NO:354)

tracr：

dgRNA CR001126#3：

crRNA：

mU*mU*mU*AUCACAGGCUCCAGGAAGUUUUAGAGCUAUGCUGUU*mU*mU*mG(SEQ ID NO:354)

tracr：

在本发明的方面，包含CR00311的靶向结构域(SEQ ID NO:247，下面加下划线的)的gRNA，例如以下描述的gRNA分子之一，可用于本发明的CRISPR系统、方法、细胞以及其他方面和实施例中，包括在涉及多于一种例如本文所述的gRNA分子的方面：

sgRNA CR00311#1：

UUUGGCCUCUGAUUAGGGUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU(SEQ ID NO:355)

sgRNA CR00311#2：

mU*mU*mU*GGCCUCUGAUUAGGGUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCU*mU*mU*mU(SEQ ID NO:356)

sgRNA CR00311#3：

mU*mU*mU*GGCCUCUGAUUAGGGUGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCmU*mU*mU*U(SEQ ID NO:1765)

dgRNA CR00311#1：

crRNA：

UUUGGCCUCUGAUUAGGGUGGUUUUAGAGCUAUGCUGUUUUG(SEQ ID NO:357)

tracr：

dgRNA CR00311#2：

crRNA：

mU*mU*mU*GGCCUCUGAUUAGGGUGGUUUUAGAGCUAUGCUGUU*mU*mU*mG(SEQ ID NO:358)

tracr：

dgRNA CR00311#3：

crRNA：

mU*mU*mU*GGCCUCUGAUUAGGGUGGUUUUAGAGCUAUGCUGUU*mU*mU*mG(SEQ ID NO:358)

tracr：

在本发明的方面，包含CR00309的靶向结构域(SEQ ID NO:245，下面加下划线的)的gRNA，例如以下描述的gRNA分子之一，可用于本发明的CRISPR系统、方法、细胞以及其他方面和实施例中，包括在涉及多于一种例如本文所述的gRNA分子的方面：

sgRNACR00309#1：

CACGCCCCCACCCUAAUCAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU(SEQ ID NO:359)

sgRNACR00309#2：

mC*mA*mC*GCCCCCACCCUAAUCAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCU*mU*mU*mU(SEQ ID NO:360)

sgRNA CR00309#3：

mC*mA*mC*GCCCCCACCCUAAUCAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCmU*mU*mU*U(SEQ ID NO:1766)

dgRNA CR00309#1：

crRNA：

CACGCCCCCACCCUAAUCAGGUUUUAGAGCUAUGCUGUUUUG(SEQ ID NO:361)

tracr：

dgRNA CR00309#2：

crRNA：

mC*mA*mC*GCCCCCACCCUAAUCAGGUUUUAGAGCUAUGCUGUU*mU*mU*mG(SEQ ID NO:362)

tracr：

dgRNA CR00309#3：

crRNA：

mC*mA*mC*GCCCCCACCCUAAUCAGGUUUUAGAGCUAUGCUGUU*mU*mU*mG(SEQ ID NO:362)

tracr：

在本发明的方面，包含CR001127的靶向结构域(SEQ ID NO:337，下面加下划线的)的gRNA，例如以下描述的gRNA分子之一，可用于本发明的CRISPR系统、方法、细胞以及其他方面和实施例中，包括在涉及多于一种例如本文所述的gRNA分子的方面：

sgRNA CR001127#1：

CACAGGCUCCAGGAAGGGUUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU(SEQ ID NO:363)

sgRNA CR001127#2：

mC*mA*mC*AGGCUCCAGGAAGGGUUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCU*mU*mU*mU(SEQ ID NO:364)

sgRNA CR001127#3：

mC*mA*mC*AGGCUCCAGGAAGGGUUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCmU*mU*mU*U(SEQ ID NO:1767)

dgRNA CR001127#1：

crRNA：

CACAGGCUCCAGGAAGGGUUGUUUUAGAGCUAUGCUGUUUUG(SEQ ID NO:365)

tracr：

dgRNA CR001127#2：

crRNA：

mC*mA*mC*AGGCUCCAGGAAGGGUUGUUUUAGAGCUAUGCUGUU*mU*mU*mG(SEQ ID NO:366)

tracr：

dgRNA CR001127#3：

crRNA：

mC*mA*mC*AGGCUCCAGGAAGGGUUGUUUUAGAGCUAUGCUGUU*mU*mU*mG(SEQ ID NO:366)

tracr：

在本发明的方面，包含CR00316的靶向结构域(SEQ ID NO:252，下面加下划线的)的gRNA，例如以下描述的gRNA分子之一，可用于本发明的CRISPR系统、方法、细胞以及其他方面和实施例中，包括在涉及多于一种例如本文所述的gRNA分子的方面：

sgRNA CR00316#1：

UUGCUUUUAUCACAGGCUCCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU(SEQ ID NO:367)

sgRNA CR00316#2：

mU*mU*mG*CUUUUAUCACAGGCUCCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCU*mU*mU*mU(SEQ ID NO:368)

sgRNA CR00316#3：

mU*mU*mG*CUUUUAUCACAGGCUCCGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCmU*mU*mU*U(SEQ ID NO:1768)

dgRNA CR00316#1：

crRNA：

UUGCUUUUAUCACAGGCUCCGUUUUAGAGCUAUGCUGUUUUG(SEQ ID NO:369)

tracr：

dgRNA CR00316#2：

crRNA：

mU*mU*mG*CUUUUAUCACAGGCUCCGUUUUAGAGCUAUGCUGUU*mU*mU*mG(SEQ ID NO:370)

tracr：

dgRNA CR00316#3：

crRNA：

mU*mU*mG*CUUUUAUCACAGGCUCCGUUUUAGAGCUAUGCUGUU*mU*mU*mG(SEQ ID NO:370)

tracr：

在本发明的方面，包含CR001125的靶向结构域(SEQ ID NO:335，下面加下划线的)的gRNA，例如以下描述的gRNA分子之一，可用于本发明的CRISPR系统、方法、细胞以及其他方面和实施例中，包括在涉及多于一种例如本文所述的gRNA分子的方面：

sgRNA CR001125#1：

UUUUAUCACAGGCUCCAGGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU(SEQ ID NO:371)

sgRNA CR001125#2：

mU*mU*mU*UAUCACAGGCUCCAGGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCU*mU*mU*mU(SEQ ID NO:372)

sgRNA CR001125#3：

mU*mU*mU*UAUCACAGGCUCCAGGAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCmU*mU*mU*U(SEQ ID NO:1769)

dgRNA CR001125#1：

crRNA：

UUUUAUCACAGGCUCCAGGAGUUUUAGAGCUAUGCUGUUUUG(SEQ ID NO:373)

tracr：

dgRNA CR001125#2：

crRNA：

mU*mU*mU*UAUCACAGGCUCCAGGAGUUUUAGAGCUAUGCUGUU*mU*mU*mG(SEQ ID NO:374)

tracr：

dgRNA CR001125#3：

crRNA：

mU*mU*mU*UAUCACAGGCUCCAGGAGUUUUAGAGCUAUGCUGUU*mU*mU*mG(SEQ ID NO:374)

tracr：

在本发明的方面，包含CR001030的靶向结构域(SEQ ID NO:100，下面加下划线的)的gRNA，例如以下描述的gRNA分子之一，可用于本发明的CRISPR系统、方法、细胞以及其他方面和实施例中，包括在涉及多于一种例如本文所述的gRNA分子的方面：

sgRNA CR001030#1：

ACUGCUGAAAGAGAUGCGGUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU(SEQ ID NO:375)

sgRNA CR001030#2：

mA*mC*mU*GCUGAAAGAGAUGCGGUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCU*mU*mU*mU(SEQ ID NO:376)

sgRNA CR001030#3：

mA*mC*mU*GCUGAAAGAGAUGCGGUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCmU*mU*mU*U(SEQ ID NO:1770)

dgRNA CR001030#1：

crRNA：

ACUGCUGAAAGAGAUGCGGUGUUUUAGAGCUAUGCUGUUUUG(SEQ ID NO:377)

tracr：

dgRNA CR001030#2：

crRNA：

mA*mC*mU*GCUGAAAGAGAUGCGGUGUUUUAGAGCUAUGCUGUU*mU*mU*mG(SEQ ID NO:378)

tracr：

dgRNA CR001030#3：

crRNA：

mA*mC*mU*GCUGAAAGAGAUGCGGUGUUUUAGAGCUAUGCUGUU*mU*mU*mG(SEQ ID NO:378)

tracr：

在本发明的方面，包含CR001028的靶向结构域(SEQ ID NO:98，下面加下划线的)的gRNA，例如以下描述的gRNA分子之一，可用于本发明的CRISPR系统、方法、细胞以及其他方面和实施例中，包括在涉及多于一种例如本文所述的gRNA分子的方面：

sgRNA CR001028#1：

UGCGGUGGGGAGAUAUGUAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU(SEQ ID NO:379)

sgRNA CR001028#2：

mU*mG*mC*GGUGGGGAGAUAUGUAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCU*mU*mU*mU(SEQ ID NO:380)

sgRNA CR001028#3：

mU*mG*mC*GGUGGGGAGAUAUGUAGGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCmU*mU*mU*U(SEQ ID NO:1771)

dgRNA CR001028#1：

crRNA：

UGCGGUGGGGAGAUAUGUAGGUUUUAGAGCUAUGCUGUUUUG(SEQ ID NO:381)

tracr：

dgRNACR001028#2：

crRNA：

mU*mG*mC*GGUGGGGAGAUAUGUAGGUUUUAGAGCUAUGCUGUU*mU*mU*mG(SEQ ID NO:382)

tracr：

dgRNACR001028#3：

crRNA：

mU*mG*mC*GGUGGGGAGAUAUGUAGGUUUUAGAGCUAUGCUGUU*mU*mU*mG(SEQ ID NO:382)

tracr：

在本发明的方面，包含CR001221的靶向结构域(SEQ ID NO:1589，下面加下划线的)的gRNA，例如以下描述的gRNA分子之一，可用于本发明的CRISPR系统、方法、细胞以及其他方面和实施例中，包括在涉及多于一种例如本文所述的gRNA分子的方面：

sgRNA CR001221#1：

GAAACAAUGAGGACCUGACUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU(SEQ ID NO:383)

sgRNA CR001221#2：

mG*mA*mA*ACAAUGAGGACCUGACUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCU*mU*mU*mU(SEQ ID NO:384)

sgRNA CR001221#3：

mG*mA*mA*ACAAUGAGGACCUGACUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCmU*mU*mU*U(SEQ ID NO:1772)

dgRNA CR001221#1：

crRNA：

GAAACAAUGAGGACCUGACUGUUUUAGAGCUAUGCUGUUUUG(SEQ ID NO:385)

tracr：

dgRNA CR001221#2：

crRNA：

mG*mA*mA*ACAAUGAGGACCUGACUGUUUUAGAGCUAUGCUGUU*mU*mU*mG(SEQ ID NO:386)

tracr：

dgRNA CR001221#3：

crRNA：

mG*mA*mA*ACAAUGAGGACCUGACUGUUUUAGAGCUAUGCUGUU*mU*mU*mG(SEQ ID NO:386)

tracr：

在本发明的方面，包含CR001137的靶向结构域(SEQ ID NO:1505，下面加下划线的)的gRNA，例如以下描述的gRNA分子之一，可用于本发明的CRISPR系统、方法、细胞以及其他方面和实施例中，包括在涉及多于一种例如本文所述的gRNA分子的方面：

sgRNA CR001137#1：

GUAAGCAUUUAAGUGGCUACGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU(SEQ ID NO:387)

sgRNA CR001137#2：

mG*mU*mA*AGCAUUUAAGUGGCUACGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCU*mU*mU*mU(SEQ ID NO:388)

sgRNA CR001137#3：

mG*mU*mA*AGCAUUUAAGUGGCUACGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCmU*mU*mU*U(SEQ ID NO:1773)

dgRNA CR001137#1：

crRNA：

GUAAGCAUUUAAGUGGCUACGUUUUAGAGCUAUGCUGUUUUG(SEQ ID NO:389)

tracr：

dgRNA CR001137#2：

crRNA：

mG*mU*mA*AGCAUUUAAGUGGCUACGUUUUAGAGCUAUGCUGUU*mU*mU*mG(SEQ ID NO:390)

tracr：

dgRNA CR001137#3：

crRNA：

mG*mU*mA*AGCAUUUAAGUGGCUACGUUUUAGAGCUAUGCUGUU*mU*mU*mG(SEQ ID NO:390)

tracr：

在本发明的方面，包含CR003035的靶向结构域(SEQ ID NO:1505，下面加下划线的)的gRNA，例如以下描述的gRNA分子之一，可用于本发明的CRISPR系统、方法、细胞以及其他方面和实施例中，包括在涉及多于一种例如本文所述的gRNA分子的方面：

sgRNA CR003035#1：

AGGCACCUCAGACUCAGCAUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU(SEQ ID NO:391)

sgRNA CR003035#2：

mA*mG*mG*CACCUCAGACUCAGCAUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCU*mU*mU*mU(SEQ ID NO:392)

sgRNA CR003035#3：

mA*mG*mG*CACCUCAGACUCAGCAUGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCmU*mU*mU*U(SEQ ID NO:1774)

dgRNA CR003035#1：

crRNA：

AGGCACCUCAGACUCAGCAUGUUUUAGAGCUAUGCUGUUUUG(SEQ ID NO:393)

tracr：

dgRNA CR003035#2：

crRNA：

mA*mG*mG*CACCUCAGACUCAGCAUGUUUUAGAGCUAUGCUGUU*mU*mU*mG(SEQ ID NO:394)

tracr：

dgRNA CR003035#3：

crRNA：

mA*mG*mG*CACCUCAGACUCAGCAUGUUUUAGAGCUAUGCUGUU*mU*mU*mG(SEQ ID NO:394)

tracr：

在本发明的方面，包含CR003085的靶向结构域(SEQ ID NO:1750，下面加下划线的)的gRNA，例如以下描述的gRNA分子之一，可用于本发明的CRISPR系统、方法、细胞以及其他方面和实施例中，包括在涉及多于一种例如本文所述的gRNA分子的方面：

sgRNA CR003085#1：

AUGGUAUGGGAGGUAUACUAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU(SEQ ID NO:395)

sgRNA CR003085#2：

mA*mU*mG*GUAUGGGAGGUAUACUAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCU*mU*mU*mU(SEQ ID NO:396)

sgRNA CR003085#3：

mA*mU*mG*GUAUGGGAGGUAUACUAGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCmU*mU*mU*U(SEQ ID NO:1775)

dgRNA CR003085#1：

crRNA：

AUGGUAUGGGAGGUAUACUAGUUUUAGAGCUAUGCUGUUUUG(SEQ ID NO:397)

tracr：

dgRNA CR003085#2：

crRNA：

mA*mU*mG*GUAUGGGAGGUAUACUAGUUUUAGAGCUAUGCUGUU*mU*mU*mG(SEQ ID NO:398)

tracr：

dgRNA CR003085#3：

crRNA：

mA*mU*mG*GUAUGGGAGGUAUACUAGUUUUAGAGCUAUGCUGUU*mU*mU*mG(SEQ ID NO:398)

tracr：

在上述每种gRNA分子中，“*”表示相邻核苷酸之间的硫代磷酸酯键，“mN”(其中N＝A、G、C或U)表示2'-OMe经修饰的核苷酸。在实施例中，本文所述(例如以上所述)的任何gRNA分子与Cas9分子(例如如本文所述)复合，以形成核糖核蛋白复合物(RNP)。此类RNP在本发明的方法、细胞、以及其他方面和实施例(例如本文所述)中特别有用。

IV.Cas分子

Cas9分子

在优选的实施例中，Cas分子是Cas9分子。多种物种的Cas9分子可用于本文所述的方法和组合物中。尽管酿脓链球菌Cas9分子是本文大部分公开内容的主题，但也可以使用衍生自或基于本文列出的其他物种的Cas9蛋白的Cas9分子。换句话说，其他Cas9分子(例如嗜热链球菌、金黄色葡萄球菌和/或脑膜炎奈瑟氏菌Cas9分子)可用于本文所述的系统、方法和组合物中。另外的Cas9物种包括：燕麦食酸菌(Acidovorax avenae)、胸膜肺炎放线杆菌(Actinobacillus pleuropneumoniae)、产琥珀酸放线杆菌(Actinobacillussuccinogenes)、猪放线杆菌(Actinobacillus suis)、放线菌属物种、cycliphilusdenitrificans、少食氨基酸单胞菌(Aminomonas paucivorans)、蜡样芽饱杆菌(Bacilluscereus)、史密斯氏芽孢杆菌(Bacillus smithii)、苏云金芽孢杆菌、拟杆菌属物种、Blastopirellula marina、慢生根瘤菌属物种、侧孢短芽孢杆菌(Brevibacilluslatemsporus)、结肠弯曲菌(Campylobacter coli)、空肠弯曲菌(Campylobacter jejuni)、拉德弯曲菌(Campylobacter lad)、Candidatus Puniceispirillum、解纤维梭菌(Clostridiu cellulolyticum)、产气荚膜梭菌(Clostridium perfringens)、拥挤棒杆菌(Corynebacterium accolens)、白喉棒杆菌(Corynebacterium diphtheria)、马氏棒杆菌(Corynebacterium matruchotii)、Dinoroseobacter sliibae、细长真杆菌(Eubacteriumdolichum)、γ变形杆菌、固氮葡糖醋杆菌(Gluconacetobacler diazotrophicus)、副流感嗜血杆菌(Haemophilus parainfluenzae)、生痰嗜血杆菌(Haemophilus sputorum)、加拿大螺杆菌(Helicobacter canadensis)、同性恋螺杆菌(Helicobacter cinaedi)、鼬鼠螺杆菌(Helicobacter mustelae)、多营养泥杆菌(Ilyobacter polytropus)、金氏金氏菌(Kingella kingae)、卷曲乳杆菌(Lactobacillus crispatus)、伊氏李斯特菌(Listeriaivanovii)、单核细胞增生李斯特菌(Listeria monocytogenes)、李斯特氏菌科细菌、甲基孢囊菌属物种、甲基弯菌(Methylosinus trichosporium)、羞怯动弯杆菌(Mobiluncusmulieris)、杆菌状奈瑟氏菌(Neisseria bacilliformis)、灰色奈瑟氏菌(Neisseriacinerea)、浅黄奈瑟氏菌(Neisseria flavescens)、乳糖奈瑟氏菌(Neisserialactamica)、奈瑟氏菌属物种、瓦茨瓦尔西奈瑟氏菌(Neisseria wadsworthii)、亚硝化单胞菌属物种、Parvibaculum lavamentivorans、多杀巴斯德菌(Pasteurella multocida)、琥珀酸考拉杆菌(Phascolarctobacterium succinatutens)、丁香罗尔斯通菌(Ralstoniasyzygii)、沼泽红假单胞菌(Rhodopseudomonas palustris)、小红卵菌属物种、穆氏西蒙斯氏菌(Simonsiella muelleri)、鞘氨醇单胞菌属物种、维尼芽孢乳杆菌(Sporolactobacillus vineae)、路邓葡萄球菌(Staphylococcus lugdunensis)、链球菌属物种、罕见小球菌属物种(Subdoligranulum sp.)、Tislrella mobilis、密螺旋体属物种、或Verminephrobacter eiseniae。

Cas9分子(当该术语在本文中使用时)是指可与gRNA分子(例如，tracr的结构域的序列)相互作用，并且与gRNA分子一起定位(例如，靶向或归巢)于包含靶序列和PAM序列的位点的分子。

在一个实施例中，Cas9分子能够切割靶核酸分子，其在本文中可称为活性Cas9分子。在一个实施例中，活性Cas9分子包含一种或多种以下活性：切口酶活性，即切割核酸分子的单链(例如非互补链或互补链)的能力；双链核酸酶活性，即切割双链核酸的两条链并产生双链断裂的能力，其在一个实施例中是在两种切口酶活性的存在下；内切核酸酶活性；外切核酸酶活性；以及解旋酶活性，即解开双链核酸的螺旋结构的能力。

在一个实施例中，酶促活性Cas9分子切割两条DNA链并导致双链断裂。在一个实施例中，Cas9分子仅切割一条链，例如与gRNA杂交的链、或和与gRNA杂交的链互补的链。在一个实施例中，活性Cas9分子包含与HNH样结构域相关的切割活性。在一个实施例中，活性Cas9分子包含与N末端RuvC样结构域相关的切割活性。在一个实施例中，活性Cas9分子包含与HNH样结构域相关的切割活性和与N末端RuvC样结构域相关的切割活性。在一个实施例中，活性Cas9分子包含有活性或有切割能力的HNH样结构域和无活性或无切割能力的N末端RuvC样结构域。在一个实施例中，活性Cas9分子包含无活性或无切割能力的HNH样结构域和有活性或有切割能力的N末端RuvC样结构域。

在一个实施例中，活性Cas9分子与靶核酸相互作用并切割靶核酸的能力是PAM序列依赖性的。PAM序列是靶核酸中的序列。在一个实施例中，靶核酸的切割发生在PAM序列的上游。来自不同细菌物种的活性Cas9分子可以识别不同的序列基序(例如PAM序列)。在一个实施例中，酿脓链球菌的活性Cas9分子识别序列基序NGG并指导靶核酸序列的在该序列上游1至10个(例如3至5个)碱基对的切割。参见例如，Mali等人,SCIENCE[科学]2013；339(6121):823-826。在一个实施例中，嗜热链球菌的活性Cas9分子识别序列基序NGGNG和NNAGAAW(W＝A或T)并指导核心靶核酸序列的在这些序列上游1至10个(例如3至5个)碱基对的切割。参见例如，Horvath等人,SCIENCE[科学]2010；327(5962):167-170；以及Deveau等人,JBACTERIOL[细菌学杂志]2008；190(4):1390-1400。在一个实施例中，来自变形链球菌(S.mutans)的活性Cas9分子识别序列基序NGG或NAAR(R-A或G)并指导核心靶核酸序列的在该序列上游1至10个(例如3至5个)碱基对的切割。参见例如，Deveau等人,J BACTERIOL[细菌学杂志]2008；190(4):1 390-1400。

在一个实施例中，金黄色葡萄球菌的活性Cas9分子识别序列基序NNGRR(R＝A或G)并指导靶核酸序列的在该序列上游1至10个(例如3至5个)碱基对的切割。参见例如，Ran F.等人,NATURE[自然],第520卷,2015,第186-191页。在一个实施例中，脑膜炎奈瑟氏菌的活性Cas9分子识别序列基序NNNNGATT并指导靶核酸序列的在该序列上游1至10个(例如3至5个)碱基对的切割。参见例如，Hou等人,PNAS EARLY EDITION[美国国家科学院院刊早期版本]2013,1-6。可以例如使用Jinek等人,SCIENCE[科学]2012,337:816中描述的转化测定来确定Cas9分子识别PAM序列的能力。

一些Cas9分子具有与gRNA分子相互作用并且与gRNA分子协力归巢(例如，靶向或定位)至核心靶结构域的能力，但不能切割靶核酸，或者不能以有效速率切割。没有或基本上没有切割活性的Cas9分子在本文中可称为无活性Cas9(酶促失活的Cas9)、死Cas9或dCas9分子。例如，如通过本文所述的测定所测量的，无活性Cas9分子可以缺乏切割活性或具有基本上更小的切割活性，例如小于参考Cas9分子的切割活性的20％、10％、5％、1％或0.1％。

示例性天然存在的Cas9分子描述于Chylinski等人,RNA Biology[RNA生物学]2013；10:5,727-737中。此类Cas9分子包括簇1细菌家族、簇2细菌家族、簇3细菌家族、簇4细菌家族、簇5细菌家族、簇6细菌家族、簇7细菌家族、簇8细菌家族、簇9细菌家族、簇10细菌家族、簇11细菌家族、簇12细菌家族、簇13细菌家族、簇14细菌家族、簇15细菌家族、簇16细菌家族、簇17细菌家族、簇18细菌家族、簇19细菌家族、簇20细菌家族、簇21细菌家族、簇22细菌家族、簇23细菌家族、簇24细菌家族、簇25细菌家族、簇26细菌家族、簇27细菌家族、簇28细菌家族、簇29细菌家族、簇30细菌家族、簇31细菌家族、簇32细菌家族、簇33细菌家族、簇34细菌家族、簇35细菌家族、簇36细菌家族、簇37细菌家族、簇38细菌家族、簇39细菌家族、簇40细菌家族、簇41细菌家族、簇42细菌家族、簇43细菌家族、簇44细菌家族、簇45细菌家族、簇46细菌家族、簇47细菌家族、簇48细菌家族、簇49细菌家族、簇50细菌家族、簇51细菌家族、簇52细菌家族、簇53细菌家族、簇54细菌家族、簇55细菌家族、簇56细菌家族、簇57细菌家族、簇58细菌家族、簇59细菌家族、簇60细菌家族、簇61细菌家族、簇62细菌家族、簇63细菌家族、簇64细菌家族、簇65细菌家族、簇66细菌家族、簇67细菌家族、簇68细菌家族、簇69细菌家族、簇70细菌家族、簇71细菌家族、簇72细菌家族、簇73细菌家族、簇74细菌家族、簇75细菌家族、簇76细菌家族、簇77细菌家族、或簇78细菌家族的Cas9分子。

示例性天然存在的Cas9分子包括簇1细菌家族的Cas9分子。实例包括以下的Cas9分子：酿脓链球菌(例如菌株SF370、MGAS 10270、MGAS 10750、MGAS2096、MGAS315、MGAS5005、MGAS6180、MGAS9429、NZ131和SSI-1)、嗜热链球菌(例如菌株LMD-9)、假豕链球菌(S.pseudoporcinus)(例如菌株SPIN 20026)、变形链球菌(例如菌株UA 159、NN2025)、猴链球菌(S.macacae)(例如菌株NCTC1 1558)、解没食子酸链球菌(S.gallolylicus)(例如菌株UCN34、ATCC BAA-2069)、马链球菌(S.equines)(例如菌株ATCC 9812、MGCS 124)、停乳链球菌(S.dysgalactiae)(例如菌株GGS 124)、牛链球菌(S.bovis)(例如菌株ATCC 700338)、S.cmginosus(例如菌株F021 1)、无乳链球菌(S.agalactia*)(例如菌株NEM316、A909)、单核细胞增生李斯特菌(例如菌株F6854)、无害李斯特菌(L.innocua，例如菌株Clip1 1262)、意大利肠球菌(Enterococcus italicus)(例如菌株DSM 15952)、或屎肠球菌(Enterococcus faecium)(例如菌株1,231,408)。另外的示例性Cas9分子是脑膜炎奈瑟氏菌的Cas9分子(Hou等人PNAS Early Edition[美国国家科学院院刊早期版本]2013,1-6)和金黄色葡萄球菌Cas9分子。

在一个实施例中，Cas9分子(例如活性Cas9分子或无活性Cas9分子)包含与本文所述的任何Cas9分子序列或天然存在的Cas9分子序列具有60％、65％、70％、75％、80％、85％、90％、95％、96％、97％、98％或99％同源性的氨基酸序列；当与本文所述的任何Cas9分子序列或天然存在的Cas9分子序列相比时，相差不超过1％、2％、5％、10％、15％、20％、30％或40％的氨基酸残基的氨基酸序列；与本文所述的任何Cas9分子序列或天然存在的Cas9分子序列相差至少1、2、5、10或20个氨基酸但相差不超过100、80、70、60、50、40或30个氨基酸的氨基酸序列；或与本文所述的任何Cas9分子序列或天然存在的Cas9分子序列相同的氨基酸序列；所述Cas9分子序列是例如来自本文所列物种的或描述于Chylinski等人,RNA Biology[RNA生物学]2013,10:5,′|2′|-Τ,1；Hou等人PNAS Early Edition[美国国家科学院院刊早期版本]2013,1-6中的Cas9分子。

在一个实施例中，Cas9分子包含与酿脓链球菌Cas9具有60％、65％、70％、75％、80％、85％、90％、95％、96％、97％、98％或99％同源性的氨基酸序列；当与酿脓链球菌Cas9相比时，相差不超过1％、2％、5％、10％、15％、20％、30％或40％的氨基酸残基的氨基酸序列；与酿脓链球菌Cas9相差至少1、2、5、10或20个氨基酸但相差不超过100、80、70、60、50、40或30个氨基酸的氨基酸序列；或与酿脓链球菌Cas9相同的氨基酸序列；所述酿脓链球菌Cas9如下：

(SEQ ID NO:6611)

在实施例中，Cas9分子是SEQ ID NO:6611的酿脓链球菌Cas9变体，其包含对带正电荷的氨基酸(例如赖氨酸、精氨酸或组氨酸)的一个或多个突变，这些突变在所述位置引入不带电荷或非极性氨基酸(例如丙氨酸)。在实施例中，突变是对于Cas9的nt沟中的一个或多个带正电荷的氨基酸而言的。在实施例中，Cas9分子是SEQ ID NO:6611的酿脓链球菌Cas9变体，其包含在SEQ ID NO:6611的位置855处的突变，例如在SEQ ID NO:6611的位置855处突变为不带电荷的氨基酸，例如丙氨酸。在实施例中，Cas9分子仅在SEQ ID NO:6611的位置855处相对于SEQ ID NO:6611具有突变，例如突变为不带电荷的氨基酸，例如丙氨酸。在实施例中，Cas9分子是SEQ ID NO:6611的酿脓链球菌Cas9变体，其包含在SEQ ID NO:6611的位置810处的突变、位置1003处的突变、和/或位置1060处的突变，例如在SEQ ID NO:6611的位置810、位置1003、和/或位置1060处突变为丙氨酸。在实施例中，Cas9分子仅在SEQID NO:6611的位置810、位置1003、和位置1060处相对于SEQ ID NO:6611具有突变，例如，其中每个突变是突变为不带电荷的氨基酸，例如丙氨酸。在实施例中，Cas9分子是SEQ ID NO:6611的酿脓链球菌Cas9变体，其包含在SEQ ID NO:6611的位置848处的突变、位置1003处的突变、和/或位置1060处的突变，例如在SEQ ID NO:6611的位置848、位置1003、和/或位置1060处突变为丙氨酸。在实施例中，Cas9分子仅在SEQ ID NO:6611的位置848、位置1003、和位置1060处相对于SEQ ID NO:6611具有突变，例如，其中每个突变是突变为不带电荷的氨基酸，例如丙氨酸。在实施例中，Cas9分子是如在Slaymaker等人,Science Express[科学快讯]中描述的Cas9分子，该文献可于2015年12月1日在Science DOI:10.1126/Science.aad5227在线获得。

在实施例中，Cas9分子是SEQ ID NO:6611的酿脓链球菌Cas9变体，其包含一个或多个突变。在实施例中，Cas9变体包含在SEQ ID NO:6611的位置80处的突变，例如，包含SEQID NO:6611的位置80处的亮氨酸(即，包含具有C80L突变的SEQ ID NO:6611，例如由其组成)。在实施例中，Cas9变体包含在SEQ ID NO:6611的位置574处的突变，例如，包含SEQ IDNO:6611的位置574处的谷氨酸(即，包含具有C574E突变的SEQ ID NO:6611，例如由其组成)。在实施例中，Cas9变体包含在SEQ ID NO:6611的位置80处的突变和位置574处的突变，例如，包含SEQ ID NO:6611的位置80处的亮氨酸和SEQ ID NO:6611的位置574处的谷氨酸(即，包含具有C80L突变和C574E突变的SEQ ID NO:6611，例如由其组成)。不受理论束缚，据信此类突变改善了Cas9分子的溶解特性。

在实施例中，Cas9分子是SEQ ID NO:6611的酿脓链球菌Cas9变体，其包含一个或多个突变。在实施例中，Cas9变体包含在SEQ ID NO:6611的位置147处的突变，例如，包含SEQ ID NO:6611的位置147处的酪氨酸(即，包含具有D147Y突变的SEQ ID NO:6611，例如由其组成)。在实施例中，Cas9变体包含在SEQ ID NO:6611的位置411处的突变，例如，包含SEQID NO:6611的位置411处的苏氨酸(即，包含具有P411T突变的SEQ ID NO:6611，例如由其组成)。在实施例中，Cas9变体包含在SEQ ID NO:6611的位置147处的突变和位置411处的突变，例如，包含SEQ ID NO:6611的位置147处的酪氨酸和SEQ ID NO:6611的位置411处的苏氨酸(即，包含具有D147Y突变和P411T突变的SEQ ID NO:6611，例如由其组成)。不受理论束缚，据信此类突变改善了Cas9分子例如在酵母中的靶向效率。

在实施例中，Cas9分子是SEQ ID NO:6611的酿脓链球菌Cas9变体，其包含一个或多个突变。在实施例中，Cas9变体包含在SEQ ID NO:6611的位置1135处的突变，例如，包含SEQ ID NO:6611的位置1135处的谷氨酸(即，包含具有D1135E突变的SEQ ID NO:6611，例如由其组成)。不受理论束缚，据信此类突变改善了Cas9分子对NGG PAM序列相对于NAG PAM序列的选择性。

在实施例中，Cas9分子是SEQ ID NO:6611的酿脓链球菌Cas9变体，其包含一个或多个突变，这些突变在某些位置引入不带电荷或非极性氨基酸(例如丙氨酸)。在实施例中，Cas9分子是SEQ ID NO:6611的酿脓链球菌Cas9变体，其包含在SEQ ID NO:6611的位置497处的突变、位置661处的突变、位置695处的突变和/或位置926处的突变，例如在SEQ ID NO:6611的位置497、位置661、位置695和/或位置926处突变为丙氨酸。在实施例中，Cas9分子仅在SEQ ID NO:6611的位置497、位置661、位置695和位置926处相对于SEQ ID NO:6611具有突变，例如，其中每个突变是突变为不带电荷的氨基酸，例如丙氨酸。不受理论束缚，据信此类突变减少了Cas9分子在脱靶位点的切割。

应当理解，本文所述的对于Cas9分子而言的突变可以组合，并且可以与本文所述的任何融合或其他修饰组合，并且在本文所述的测定中测试了Cas9分子。

各种类型的Cas分子可用于实践本文披露的发明。在一些实施例中，使用II型Cas系统的Cas分子。在其他实施例中，使用其他Cas系统的Cas分子。例如，可以使用I型或III型Cas分子。示例性Cas分子(和Cas系统)例如描述于Haft等人,PLoS COMPUTATIONAL BIOLOGY[科学公共图书馆计算生物学]2005,1(6):e60以及Makarova等人,NATURE REVIEWMICROBIOLOGY[自然微生物学评论]201 1,9:467-477中，将这两篇参考文献的内容通过引用以其全文并入本文。

在一个实施例中，Cas9分子包含一种或多种以下活性：切口酶活性；双链切割活性(例如，内切核酸酶和/或外切核酸酶活性)；解旋酶活性；或与gRNA分子一起定位至靶核酸的能力。

经改变的Cas9分子

天然存在的Cas9分子具有许多特性，包括：切口酶活性；核酸酶活性(例如，内切核酸酶和/或外切核酸酶活性)；解旋酶活性；与gRNA分子功能上相关的能力；以及靶向(或定位于)核酸上的位点的能力(例如，PAM识别和特异性)。在一个实施例中，Cas9分子可以包括这些特性的全部或子集。在典型的实施例中，Cas9分子具有与gRNA分子相互作用，并且与gRNA分子一起定位于核酸中的位点的能力。其他活性(例如PAM特异性、切割活性或解旋酶活性)可在Cas9分子中更广泛地变化。

具有所需特性的Cas9分子能以多种方式制造，例如通过改变亲本(例如天然存在的Cas9分子)以提供具有所需特性的经改变的Cas9分子。例如，可以引入相对于亲本Cas9分子的一个或多个突变或差异。此类突变和差异包括：取代(例如，保守取代或非必需氨基酸的取代)；插入；或缺失。在一个实施例中，Cas9分子相对于参考Cas9分子可以包含一个或多个突变或差异，例如至少1、2、3、4、5、10、15、20、30、40或50个突变但少于200、100或80个突变。

在一个实施例中，一个或多个突变对Cas9活性(例如本文所述的Cas9活性)没有实质性影响。在一个实施例中，一个或多个突变对Cas9活性(例如本文所述的Cas9活性)具有实质性影响。在一个实施例中，示例性活性包括PAM特异性、切割活性和解旋酶活性中的一种或多种。一个或多个突变可以例如存在于以下中：一个或多个RuvC样结构域，例如N末端RuvC样结构域；HNH样结构域；RuvC样结构域和HNH样结构域外的区域。在一些实施例中，一个或多个突变存在于N末端RuvC样结构域中。在一些实施例中，一个或多个突变存在于HNH样结构域中。在一些实施例中，突变存在于N末端RuvC样结构域和HNH样结构域两者中。

例如可以通过评估突变是否是保守的或通过部分III中所述的方法，来评估或预测特定序列(例如取代)是否可以影响一种或多种活性，如靶向活性、切割活性等。在一个实施例中，如在Cas9分子的背景下使用的“非必需”氨基酸残基是可以从Cas9分子(例如天然存在的Cas9分子，例如活性Cas9分子)的野生型序列改变而不消除或更优选地基本上不改变Cas9活性(例如切割活性)的残基，而改变“必需”氨基酸残基则导致活性(例如切割活性)的显著丧失。

具有经改变的PAM识别或不识别PAM的Cas9分子

天然存在的Cas9分子可以识别特定的PAM序列，例如以上针对酿脓链球菌、嗜热链球菌、变形链球菌、金黄色葡萄球菌和脑膜炎奈瑟氏菌所述的PAM识别序列。

在一个实施例中，Cas9分子具有与天然存在的Cas9分子相同的PAM特异性。在其他实施例中，Cas9分子具有与天然存在的Cas9分子无关的PAM特异性，或与和其具有最接近的序列同源性的天然存在的Cas9分子无关的PAM特异性。例如，可以改变天然存在的Cas9分子，例如以改变PAM识别，例如以改变Cas9分子识别的PAM序列以减少脱靶位点和/或改善特异性；或消除PAM识别要求。在一个实施例中，可以改变Cas9分子，例如以增加PAM识别序列的长度和/或将Cas9特异性提高至高水平的同一性以减少脱靶位点和增加特异性。在一个实施例中，PAM识别序列的长度在长度上是至少4、5、6、7、8、9、10或15个氨基酸。可以使用定向进化来产生识别不同PAM序列和/或具有降低的脱靶活性的Cas9分子。可用于Cas9分子的定向进化的示例性方法和系统描述于例如Esvelt等人,Nature[自然]2011,472(7344):499-503中。可以例如通过本文所述的方法来评估候选Cas9分子。

非切割和经修饰的切割Cas9分子

在一个实施例中，Cas9分子包含不同于天然存在的Cas9分子(例如不同于具有最接近同源性的天然存在的Cas9分子)的切割特性。例如，Cas9分子可以不同于天然存在的Cas9分子(例如酿脓链球菌的Cas9分子)，如下能力可以被消除：例如，与天然存在的Cas9分子(例如酿脓链球菌的Cas9分子)相比，其调节(例如降低或增加)双链断裂的切割的能力(内切核酸酶和/或外切核酸酶活性)；例如，与天然存在的Cas9分子(例如酿脓链球菌的Cas9分子)相比，其调节(例如降低或增加)核酸单链(例如核酸分子的非互补链或核酸分子的互补链)的切割的能力(切口酶活性)；或者切割核酸分子(例如双链或单链核酸分子)的能力。

经修饰的切割活性Cas9分子

在一个实施例中，活性Cas9分子包含一种或多种以下活性：与N末端RuvC样结构域相关的切割活性；与HNH样结构域相关的切割活性；与HNH结构域相关的切割活性和与N末端RuvC样结构域相关的切割活性。

在一个实施例中，Cas9分子是Cas9切口酶，例如仅切割DNA单链。在一个实施例中，Cas9切口酶包含在SEQ ID NO:6611的位置10处的突变和/或位置840处的突变，例如包含对SEQ ID NO:6611的D10A和/或H840A突变。

非切割无活性Cas9分子

在一个实施例中，经改变的Cas9分子是无活性Cas9分子，其不切割核酸分子(双链或单链核酸分子)或以显著较小的效率(例如小于20％、10％、5％、1％或0.1％的参考Cas9分子的切割活性，例如如通过本文所述的测定所测量的)切割核酸分子。参考Cas9分子可以是天然存在的未经修饰的Cas9分子，例如天然存在的Cas9分子，如酿脓链球菌、嗜热链球菌、金黄色葡萄球菌或脑膜炎奈瑟氏菌的Cas9分子。在一个实施例中，参考Cas9分子是具有最接近的序列同一性或同源性的天然存在的Cas9分子。在一个实施例中，无活性Cas9分子缺乏显著的与N末端RuvC样结构域相关的切割活性和与HNH样结构域相关的切割活性。

在一个实施例中，Cas9分子是dCas9。Tsai等人.(2014),Nat.Biotech.[自然生物技术]32:569-577。

催化失活的Cas9分子可以与转录阻遏物融合。无活性Cas9融合蛋白与gRNA复合并定位于由gRNA靶向结构域指定的DNA序列，但与有活性Cas9不同，它不会切割靶DNA。效应结构域(如转录阻遏结构域)与无活性Cas9的融合使得能够将效应子募集至由gRNA指定的任何DNA位点。将Cas9融合蛋白位点特异性靶向于基因的启动子区可以阻断或影响聚合酶与启动子区的结合，例如，Cas9与转录因子(例如转录激活因子)融合和/或转录增强子与核酸结合以增加或抑制转录激活。可替代地，将Cas9与转录阻遏物的融合物位点特异性靶向于基因的启动子区可用于降低转录激活。

可与无活性Cas9分子融合的转录阻遏物或转录阻遏物结构域可以包括ruppel相关盒(KRAB或SKD)、Mad mSIN3相互作用结构域(SID)或ERF阻遏物结构域(ERD)。

在另一个实施例中，无活性Cas9分子可以与修饰染色质的蛋白质融合。例如，无活性Cas9分子可以与以下融合：异染色质蛋白1(HPl)、组蛋白赖氨酸甲基转移酶(例如SUV39H1、SUV39H2、G9A、ESET/SETDB 1、Pr-SET7/8、SUV4-20H 1、RIZ1)、组蛋白赖氨酸脱甲基酶(例如LSD1/BHC1 10、SpLsdl/Sw、l/Safl 10、Su(var)3-3、JMJD2A/JHDM3A、JMJD2B、JMJD2C/GASC1、JMJD2D、Rph 1、JARID 1A/RBP2、JARI DIB/PLU-I、JAR1D 1C/SMCX、JARID1D/SMCY、Lid、Jhn2、Jmj2)、组蛋白赖氨酸脱乙酰酶(例如HDAC1、HDAC2、HDAC3、HDAC8、Rpd3、Hos 1、Cir6、HDAC4、HDAC5、HDAC7、HDAC9、Hdal、Cir3、SIRT 1、SIRT2、Sir2、Hst1、Hst2、Hst3、Hst4、HDAC 1 1)以及DNA甲基化酶(DNMT1、DNMT2a/DMNT3b、MET1)。无活性Cas9-染色质修饰分子融合蛋白可用于改变染色质状态以减少靶基因的表达。

异源序列(例如转录阻遏物结构域)可以与无活性Cas9蛋白的N末端或C末端融合。在一个替代性实施例中，异源序列(例如转录阻遏物结构域)可以与无活性Cas9蛋白的内部部分(即，N末端或C末端以外的部分)融合。

可以例如通过本文部分III中所述的方法来评估Cas9分子/gRNA分子复合物结合并切割靶核酸的能力。Cas9分子(例如，有活性Cas9或无活性Cas9，单独或处于与gRNA分子的复合物中)的活性还可以通过本领域熟知的方法来评估，包括基因表达测定和基于染色质的测定，例如染色质免疫沉淀法(ChiP)和染色质体内测定(CiA)。

其他Cas9分子融合物

在实施例中，Cas9分子(例如酿脓链球菌的Cas9)可以另外包含一个或多个赋予额外活性的氨基酸序列。

在一些方面，Cas9分子可以包含一个或多个核定位序列(NLS)，如至少1、2、3、4、5、6、7、8、9、10个或更多个NLS。在一些实施例中，Cas9分子包含在氨基末端或其附近的至少1、2、3、4、5、6、7、8、9、10个或更多个NLS，在羧基末端或其附近的至少1、2、3、4、5、6、7、8、9、10个或更多个NLS，或这些的组合(例如在氨基末端的一个或多个NLS以及在羧基末端的一个或多个NLS)。当存在多于一个NLS时，每一个可以被选择为不依赖于其他NLS，使得单一NLS可以存在于多于一个拷贝中和/或与存在于一个或多个拷贝中的一个或多个其他NLS组合。在一些实施例中，当NLS的最近的氨基酸是在从N末端或C末端沿着多肽链的约1、2、3、4、5、10、15、20、25、30、40、50个或更多个氨基酸内时，NLS可以被认为靠近N末端或C末端。通常，NLS由暴露于蛋白质表面上的带正电荷的赖氨酸或精氨酸的一个或多个短序列组成，但其他类型的NLS是已知的。NLS的非限制性实例包括NLS序列，其包含或衍生自：SV40病毒大T抗原的NLS，其具有氨基酸序列PKKKRKV(SEQ ID NO:6612)；来自核质蛋白的NLS(例如具有序列KRPAATKKAGQAKKKK(SEQ ID NO:6613)的核质蛋白二分NLS)；c-myc NLS，其具有氨基酸序列PAAKRVKLD(SEQ ID NO:6614)或RQRRNELKRSP(SEQ ID NO:6615)；hRNPA1M9NLS，其具有序列NQSSNFGPMKGGNFGGRSSGPYGGGGQYFAKPRNQGGY(SEQ ID NO:6616)；来自输入蛋白-α的IBB结构域的序列RMRIZFKNKGKDTAELRRRRVEVSVELRKAKKDEQILKRRNV(SEQ ID NO:6617)；肌瘤T蛋白的序列VSRKRPRP(SEQ ID NO:6618)和PPKKARED(SEQ ID NO:6619)；人p53的序列PQPKKKPL(SEQ ID NO:6620)；小鼠c-ab1IV的序列SALIKKKKKMAP(SEQ ID NO:6621)；流感病毒NS1的序列DRLRR(SEQ ID NO:6622)和PKQKKRK(SEQ ID NO:6623)；肝炎病毒δ抗原的序列RKLKKKIKKL(SEQ ID NO:6624)；小鼠Mx1蛋白的序列REKKKFLKRR(SEQ ID NO:6625)；人聚(ADP-核糖)聚合酶的序列KRKGDEVDGVDEVAKKKSKK(SEQ ID NO:6626)；以及类固醇激素受体(人)糖皮质激素的序列RKCLQAGMNLEARKTKK(SEQ ID NO:6627)。其他合适的NLS序列在本领域中是已知的(例如，Sorokin,Biochemistry[生物化学](莫斯科)(2007)72:13,1439-1457；Lange J Biol Chem.[生物化学杂志](2007)282:8,5101-5)。

在一个实施例中，Cas9分子(例如酿脓链球菌Cas9分子)包含SV40的NLS序列，例如布置于Cas9分子的N末端。在一个实施例中，Cas9分子(例如酿脓链球菌Cas9分子)包含布置于Cas9分子的N末端的SV40的NLS序列和布置于Cas9分子的C末端的SV40的NLS序列。在一个实施例中，Cas9分子(例如酿脓链球菌Cas9分子)包含布置于Cas9分子的N末端的SV40的NLS序列和布置于Cas9分子的C末端的核质蛋白的NLS序列。在任何上述实施例中，该分子可以另外包含标签，例如His标签，例如His(6)标签或His(8)标签，例如在N末端或C末端。

在一些方面，Cas9分子可以包含一个或多个允许特异性识别Cas9分子的氨基酸序列，例如标签。在一个实施例中，标签是组氨酸标签，例如包含至少3、4、5、6、7、8、9、10个或更多个组氨酸氨基酸的组氨酸标签。在实施例中，组氨酸标签是His6标签(六个组氨酸)。在其他实施例中，组氨酸标签是His8标签(八个组氨酸)。在实施例中，组氨酸标签可以通过接头与Cas9分子的一个或多个其他部分分开。在实施例中，接头是GGS。这种融合物的一个实例是Cas9分子iProt106520。

在一些方面，Cas9分子可以包含被蛋白酶识别的一个或多个氨基酸序列(例如，包含蛋白酶切割位点)。在实施例中，切割位点是烟草蚀纹病毒(TEV)切割位点，例如包含序列ENLYFQG(SEQ ID NO:7810)。在一些方面，蛋白酶切割位点(例如TEV切割位点)被布置于标签(例如His标签，例如His6或His8标签)与Cas9分子的其余部分之间。不受理论束缚，据信这种引入将允许使用标签用于例如Cas9分子的纯化，然后继而进行切割，因此标签不会干扰Cas9分子功能。

在实施例中，Cas9分子(例如如本文所述的Cas9分子)包含N末端NLS和C末端NLS(例如，从N末端至C末端包含NLS-Cas9-NLS)，例如其中每个NLS是SV40 NLS(PKKKRKV(SEQID NO:6612))。在实施例中，Cas9分子(例如如本文所述的Cas9分子)包含N末端NLS、C末端NLS、以及C末端His6标签(例如，从N末端至C末端包含NLS-Cas9-NLS-His标签)，例如其中每个NLS是SV40 NLS(PKKKRKV(SEQ ID NO:6612))。在实施例中，Cas9分子(例如如本文所述的Cas9分子)包含N末端His标签(例如His6标签)、N末端NLS、以及C末端NLS(例如，从N末端至C末端包含His标签-NLS-Cas9-NLS)，例如其中每个NLS是SV40 NLS(PKKKRKV(SEQ ID NO:6612))。在实施例中，Cas9分子(例如如本文所述的Cas9分子)包含C末端NLS和N末端His标签(例如His6标签)(例如，从N末端至C末端包含His标签-Cas9-NLS)，例如其中每个NLS是SV40 NLS(PKKKRKV(SEQ ID NO:6612))。在实施例中，Cas9分子(例如如本文所述的Cas9分子)包含N末端NLS和C末端His标签(例如His6标签)(例如，从N末端至C末端包含NLS-Cas9-His标签)，例如其中每个NLS是SV40NLS(PKKKRKV(SEQ ID NO:6612))。在实施例中，Cas9分子(例如如本文所述的Cas9分子)包含N末端His标签(例如，His8标签)、N末端切割结构域(例如，烟草蚀纹病毒(TEV)切割结构域(例如，包含序列ENLYFQG(SEQ ID NO:7810)))、N末端NLS(例如，SV40 NLS；SEQ ID NO:6612)、以及C末端NLS(例如，SV40 NLS；SEQ ID NO:6612)(例如，从N末端至C末端包含His tag-TEV-NLS-Cas9-NLS)。在任何上述实施例中，Cas9具有SEQ ID NO:6611的序列。可替代地，在任何上述实施例中，Cas9具有SEQ ID NO:6611的Cas9变体的序列，例如如本文所述。在任何上述实施例中，Cas9分子包含His标签与该分子的另一部分之间的接头，例如GGS接头。下面提供了上述示例性Cas9分子的氨基酸序列。“iProt”标识符与图60中的标识符匹配。

iProt105026(也称为iProt106154、iProt106331、iProt106545和PID426303，这取决于蛋白质的制备)(SEQ ID NO:7821)：

iProt106518(SEQ ID NO:7822)：

iProt106519(SEQ ID NO:7823)：

iProt106520(SEQ ID NO:7824)：

iProt106521(SEQ ID NO:7825)：

iProt106522(SEQ ID NO:7826)：

iProt106658(SEQ ID NO:7827)：

iProt106745(SEQ ID NO:7828)：

iProt106746(SEQ ID NO:7829)：

iProt106747(SEQ ID NO:7830)：

iProt106884(SEQ ID NO:7831)：

编码Cas9分子的核酸

本文提供了编码Cas9分子(例如有活性Cas9分子或无活性Cas9分子)的核酸。

编码Cas9分子的示例性核酸描述于Cong等人,SCIENCE[科学]2013,399(6121):819-823；Wang等人,CELL[细胞]2013,153(4):910-918；Mali等人,SCIENCE[科学]2013,399(6121):823-826；Jinek等人,SCIENCE[科学]2012,337(6096):816-821中。

在一个实施例中，编码Cas9分子的核酸可以是合成的核酸序列。例如，合成的核酸分子可以是化学经修饰的，例如如部分XIII中所述。在一个实施例中，Cas9 mRNA具有一种或多种(例如全部)以下特性：其被加帽、聚腺苷酸化、被5-甲基胞苷和/或假尿苷取代。

另外地或可替代地，合成的核酸序列可以是密码子优化的，例如，至少一个非常见密码子或较不常见密码子已被常见密码子替代。例如，合成核酸可以指导经优化的信使mRNA(例如被优化用于在哺乳动物表达系统(例如本文所述)中表达)的合成。

下面提供了编码酿脓链球菌的Cas9分子的示例性密码子优化的核酸序列。

(SEQ ID NO:6628)

如果以上Cas9序列在C末端与肽或多肽融合(例如，无活性Cas9在C末端与转录阻遏物融合)，则应理解终止密码子将被除去。

VI.候选分子的功能分析

候选Cas9分子、候选gRNA分子、候选Cas9分子/gRNA分子复合物可以通过本领域已知的方法或如本文所述的进行评估。例如，用于评估Cas9分子的内切核酸酶活性的示例性方法描述于例如Jinek等人,SCIENCE[科学]2012；337(6096):8 16-821中。

VII.模板核酸(用于引入核酸)

如本文所用的术语“模板核酸”或“供体模板”是指有待在已经被本发明的CRISPR系统修饰(例如切割)的靶序列处或其附近插入的核酸。在一个实施例中，在靶序列处或其附近的核酸序列被修饰为通常在一个或多个切割位点处或其附近具有模板核酸的一些或全部序列。在一个实施例中，模板核酸是单链的。在一个替代性实施例中，模板核酸是双链的。在一个实施例中，模板核酸是DNA，例如双链DNA。在一个替代性实施例中，模板核酸是单链DNA。

在实施例中，模板核酸包含编码珠蛋白(例如β珠蛋白)的序列，例如包含β珠蛋白基因。在一个实施例中，由该核酸编码的β珠蛋白包含一个或多个突变，例如抗镰状化突变。在一个实施例中，由该核酸编码的β珠蛋白包含突变T87Q。在一个实施例中，由该核酸编码的β珠蛋白包含突变G16D。在一个实施例中，由该核酸编码的β珠蛋白包含突变E22A。在一个实施例中，β珠蛋白基因包含突变G16D、E22A和T87Q。在实施例中，模板核酸进一步包含一种或多种调节元件，例如启动子(例如人β珠蛋白启动子)、3'增强子、和/或珠蛋白基因座控制区域的至少一部分(例如，一个或多个DNA酶I超敏感性位点(例如，人球蛋白基因座的HS2、HS3和/或HS4))。

在其他实施例中，模板核酸包含编码γ珠蛋白的序列，例如包含γ珠蛋白基因。在实施例中，模板核酸包含编码多于一个拷贝的γ珠蛋白的序列，例如包含两个或更多个(例如两个)γ珠蛋白基因序列。在实施例中，模板核酸进一步包含一种或多种调节元件，例如启动子和/或增强子。

在一个实施例中，模板核酸通过参与同源定向修复事件来改变靶位置的结构。在一个实施例中，模板核酸改变靶位置的序列。在一个实施例中，模板核酸使得经修饰的或非天然发生的碱基掺入靶核酸中。

可以使用本文讨论的方法之一校正本文所述的基因或途径中的突变。在一个实施例中，使用模板核酸通过同源定向修复(HDR)来校正本文所述的基因或途径中的突变。在一个实施例中，使用模板核酸通过同源重组(HR)来校正本文所述的基因或途径中的突变。在一个实施例中，使用模板核酸通过非同源末端连接(NHEJ)修复来校正本文所述的基因或途径中的突变。在其他实施例中，编码目的分子的核酸可以插入在由本发明的CRISPR系统经修饰的位点处或其附近。在实施例中，模板核酸包含调节元件，例如一种或多种启动子和/或增强子，其有效地连接至编码目的分子的核酸序列，例如如本文所述。

HDR或HR修复和模板核酸

如本文所述，核酸酶诱导的同源定向修复(HDR)或同源重组(HR)可用于改变靶序列并校正(例如，修复或编辑)基因组中的突变。尽管不希望受理论束缚，但据信通过基于供体模板或模板核酸的修复发生靶序列的改变。例如，供体模板或模板核酸提供靶序列的改变。预期质粒供体或线性双链模板可用作同源重组的模板。进一步预期单链供体模板可用作通过靶序列和供体模板之间的同源定向修复的替代方法(例如，单链退火)来改变靶序列的模板。供体模板实现的对靶序列的改变可取决于经由Cas9分子的切割。经由Cas9的切割可以包括双链断裂、一个单链断裂或两个单链断裂。

在一个实施例中，可以通过单个双链断裂或两个单链断裂来校正突变。在一个实施例中，可以通过提供模板和CRISPR/Cas9系统来校正突变，该CRISPR/Cas9系统产生(1)一个双链断裂，(2)两个单链断裂，(3)两个双链断裂，其中断裂发生在靶序列的每一侧，(4)一个双链断裂和两个单链断裂，其中双链断裂和两个单链断裂发生在靶序列的每一侧，(5)四个单链断裂，其中一对单链断裂发生在靶序列的每一侧，或(6)一个单链断裂。

双链断裂介导的校正

在一个实施例中，双链切割受Cas9分子影响，该Cas9分子具有与HNH样结构域相关的切割活性和与RuvC样结构域(例如N末端RuvC样结构域)相关的切割活性，例如野生型Cas9。此类实施例仅需要单个gRNA。

单链断裂介导的校正

在其他实施例中，两个单链断裂或缺口受Cas9分子影响，该Cas9分子具有切口酶活性，例如与HNH样结构域相关的切割活性或与N末端RuvC样结构域相关的切割活性。此类实施例需要两种gRNA，一种用于放置每个单链断裂。在一个实施例中，具有切口酶活性的Cas9分子切割与gRNA杂交的链，但不切割和与gRNA杂交的链互补的链。在一个实施例中，具有切口酶活性的Cas9分子不切割与gRNA杂交的链，而是切割和与gRNA杂交的链互补的链。

在一个实施例中，切口酶具有HNH活性，例如，使具有RuvC活性的Cas9分子(例如在D10处具有突变(例如D10A突变)的Cas9分子)失活。D10A使RuvC失活；因此，Cas9切口酶(仅)具有HNH活性并且将切割与gRNA杂交的链(例如，互补链，其上没有NGG PAM)。在其他实施例中，具有H840(例如H840A)突变的Cas9分子可用作切口酶。H840A使HNH失活；因此，Cas9切口酶(仅)具有RuvC活性并切割非互补链(例如，具有NGG PAM并且其序列与gRNA相同的链)。

在切口酶和两种gRNA用于定位两个单链切口的一个实施例中，一个切口位于靶核酸的+链上，并且一个切口位于-链上。PAM面向外。可以选择gRNA使得gRNA被约0-50、0-100或0-200个核苷酸分开。在一个实施例中，在与两种gRNA的靶向结构域互补的靶序列之间没有重叠。在一个实施例中，gRNA不重叠并且被多达50、100或200个核苷酸分开。在一个实施例中，使用两种gRNA可以增加特异性，例如通过降低脱靶结合(Ran等人,CELL[细胞]2013)。

在一个实施例中，单个切口可用于诱导HDR。本文预期单个切口可用于增加在给定切割位点处的HDR、HR或NHEJ的比率。

双链断裂或单链断裂相对于靶位置的放置

双链断裂或一条链中的单链断裂应该足够靠近靶位置，使得校正发生。在一个实施例中，距离不超过50、100、200、300、350或400个核苷酸。虽然不希望受理论束缚，但据信断裂应该足够靠近靶位置，使得断裂在末端切除过程中经受外切核酸酶介导的移除的区域内。如果靶位置与断裂之间的距离太大，则突变可能不被包含在末端切除中，并且因此可能不被校正，因为供体序列仅可以用于校正末端切除区域内的序列。

在gRNA(单分子(或嵌合)或模块化gRNA)和Cas9核酸酶诱导双链断裂以诱导HDR-或HR-介导的校正的一个实施例中，切割位点是在离靶位置的0-200bp之间(例如，0至175、0至150、0至125、0至100、0至75、0至50、0至25、25至200、25至175、25至150、25至125、25至100、25至75、25至50、50至200、50至175、50至150、50至125、50至100、50至75、75至200、75至175、75至150、75至125、75至100bp)。在一个实施例中，切割位点是在离靶位置的0-100bp之间(例如0至75、0至50、0至25、25至100、25至75、25至50、50至100、50至75或75至100bp)。

在与Cas9切口酶复合的两种gRNA(独立地，单分子(或嵌合)或模块化gRNA)诱导两个单链断裂以诱导HDR介导的校正的一个实施例中，更接近的切口是在离靶位置的0-200bp之间(例如，0至175、0至150、0至125、0至100、0至75、0至50、0至25、25至200、25至175、25至150、25至125、25至100、25至75、25至50、50至200、50至175、50至150、50至125、50至100、50至75、75至200、75至175、75至150、75至125、75至100bp)，并且这两个切口将彼此理想地在25-55bp内(例如，25至50、25至45、25至40、25至35、25至30、30至55、30至50、30至45、30至40、30至35、35至55、35至50、35至45、35至40、40至55、40至50、40至45bp)并且离彼此不超过100bp(例如，离彼此不超过90、80、70、60、50、40、30、20、10或5bp)。在一个实施例中，切割位点是在离靶位置的0-100bp之间(例如0至75、0至50、0至25、25至100、25至75、25至50、50至100、50至75或75至100bp)。

在一个实施例中，两种gRNA(例如独立地，单分子(或嵌合)或模块化gRNA)被配置成将双链断裂定位在靶位置的两侧。在一个替代性实施例中，三种gRNA(例如独立地，单分子(或嵌合)或模块化gRNA)被配置成将双链断裂(即，一种gRNA与Cas9核酸酶复合)和两个单链断裂或成对的单链断裂(即，两种gRNA与Cas9切口酶复合)定位在靶位置的任一侧(例如，第一gRNA用于靶向靶位置的上游(即5')，并且第二gRNA用于靶向靶位置的下游(即3'))。在另一个实施例中，四种gRNA(例如独立地，单分子(或嵌合)或模块化gRNA)被配置成在靶位置的任一侧产生两对单链断裂(即，两对两种gRNA与Cas9切口酶复合)(例如，第一gRNA用于靶向靶位置的上游(即5')，并且第二gRNA用于靶向靶位置的下游(即3'))。一个或多个双链断裂或成对的两个单链切口的较近者将理想地在靶位置的0-500bp内(例如，离靶位置不超过450、400、350、300、250、200、150、100、50或25bp)。当使用切口酶时，成对的两个切口彼此在25-55bp内(例如，在25至50、25至45、25至40、25至35、25至30、50至55、45至55、40至55、35至55、30至55、30至50、35至50、40至50、45至50、35至45、或40至45bp之间)并且离彼此不超过100bp(例如，不超过90、80、70、60、50、40、30、20或10bp)。

在一个实施例中，两种gRNA(例如独立地，单分子(或嵌合)或模块化gRNA)被配置成将双链断裂定位在靶位置的两侧。在一个替代性实施例中，三种gRNA(例如独立地，单分子(或嵌合)或模块化gRNA)被配置成将双链断裂(即，一种gRNA与Cas9核酸酶复合)和两个单链断裂或成对的单链断裂(即，两种gRNA与Cas9切口酶复合)定位在两个靶序列上(例如，第一gRNA用于靶向插入位点的上游(即5')靶序列，并且第二gRNA用于靶向插入位点的下游(即3')靶序列)。在另一个实施例中，四种gRNA(例如独立地，单分子(或嵌合)或模块化gRNA)被配置成在插入位点的任一侧产生两对单链断裂(即，两对两种gRNA与Cas9切口酶复合)(例如，第一gRNA用于靶向本文所述的上游(即5')靶序列，并且第二gRNA用于靶向本文所述的下游(即3')靶序列)。一个或多个双链断裂或成对的两个单链切口的较近者将理想地在靶位置的0-500bp内(例如，离靶位置不超过450、400、350、300、250、200、150、100、50或25bp)。当使用切口酶时，成对的两个切口彼此在25-55bp内(例如，在25至50、25至45、25至40、25至35、25至30、50至55、45至55、40至55、35至55、30至55、30至50、35至50、40至50、45至50、35至45、或40至45bp之间)并且离彼此不超过100bp(例如，不超过90、80、70、60、50、40、30、20或10bp)。

同源臂的长度

同源臂应该至少延伸至其中可以发生末端切除的区域，例如为了允许切除的单链突出端查找供体模板内的互补区域。总长度可能受参数诸如质粒大小或病毒包装限制的限制。在一个实施例中，同源臂不延伸到重复元件(例如，ALU重复、LINE重复)中。模板可以具有两个相同或不同长度的同源臂。

示例性同源臂长度包括至少25、50、100、250、500、750或1000个核苷酸。

如本文所用，靶位置是指通过Cas9分子依赖性过程经修饰的靶核酸(例如，染色体)上的位点。例如，靶位置可以是进行靶核酸的经修饰的Cas9分子切割和模板核酸指导的修饰(例如校正)的靶位置。在一个实施例中，靶位置可以是靶核酸上的两个核苷酸(例如相邻核苷酸)之间的、向其中添加一个或多个核苷酸的位点。靶位置可以包含通过模板核酸改变(例如校正)的一个或多个核苷酸。在一个实施例中，靶位置处于靶序列(例如与gRNA结合的序列)内。在一个实施例中，靶位置处于靶序列(例如与gRNA结合的序列)的上游或下游。

通常，模板序列与靶序列一起经历断裂介导或催化的重组。在一个实施例中，模板核酸包含对应于靶序列上的位点的序列，该位点被Cas9介导的切割事件切割。在一个实施例中，模板核酸包含对应于两者(靶序列上的在第一Cas9介导的事件中被切割的第一位点和靶序列上的在第二Cas9介导的事件中被切割的第二位点)的序列。

在一个实施例中，模板核酸可以包含使得翻译序列的编码序列中发生改变的序列，例如使得蛋白质产物中的一个氨基酸取代为另一个氨基酸，例如使得突变型等位基因转化为野生型等位基因，野生型等位基因转化为突变型等位基因，和/或引入终止密码子、插入氨基酸氨基、缺失氨基酸残基、或无义突变的序列。

在其他实施例中，模板核酸可以包含使得非编码序列中发生改变，例如外显子中或5'或3'非翻译区或非转录区中发生改变的序列。此类改变包括控制元件(例如启动子、增强子)中的改变，以及顺式作用或反式作用控制元件中的改变。

模板核酸可以包含当整合时导致以下的序列：

降低正控制元件的活性；

增加正控制元件的活性；

降低负控制元件的活性；

增加负控制元件的活性；

减少基因的表达；

增加基因的表达；

增加对病症或疾病的抗性；

增加对病毒进入的抗性；

校正突变或改变不需要的氨基酸残基；

赋予、增加、消除或减少基因产物的生物学特性，例如增加酶的酶活性，或增加基因产物与另一个分子相互作用的能力。

模板核酸可以包含导致以下的序列：

靶序列的1、2、3、4、5、6、7、8、9、10、11、12个或更多个核苷酸的序列中发生变化。

在一个实施例中，模板核酸的长度是20+/-10、30+/-10、40+/-10、50+/-10、60+/-10、70+/-10、80+/-10、90+/-10、100+/-10、110+/-10、120+/-10、130+/-10、140+/-10、150+/-10、160+/-10、170+/-10、180+/-10、190+/-10、200+/-10、210+/-10、220+/-10、200-300、300-400、400-500、500-600、600-700、700-800、800-900、900-1000、1000-2000、2000-3000个或多于3000个核苷酸。

模板核酸包含以下组分：

[5'同源臂]-[插入序列]-[3'同源臂]。

同源臂提供了重组到染色体中，这可以用替换序列替代不希望的元件，例如突变或特征。在一个实施例中，同源臂侧接最远的切割位点。

在一个实施例中，5'同源臂的3'端是靠近替换序列的5'端的位置。在一个实施例中，5'同源臂可以从替换序列的5'端延伸至少10、20、30、40、50、60、70、80、90、100、120、150、180、200、300、400、500、600、700、800、900、1000、1500或2000个核苷酸5'。

在一个实施例中，3'同源臂的5'端是靠近替换序列的3'端的位置。在一个实施例中，3'同源臂可以从替换序列的3'端延伸至少10、20、30、40、50、60、70、80、90、100、120、150、180、200、300、400、500、600、700、800、900、1000、1500或2000个核苷酸3'。

本文预期可以缩短一个或两个同源臂以避免包含某些序列重复元件，例如Alu重复、LINE元件。例如，可以缩短5'同源臂以避免序列重复元件。在其他实施例中，可以缩短3'同源臂以避免序列重复元件。在一些实施例中，可以缩短5'同源臂和3'同源臂两者以避免包含某些序列重复元件。

本文预期用于校正突变的模板核酸可以被设计为用作单链寡核苷酸(ssODN)。当使用ssODN时，5'同源臂和3'同源臂的长度可以在高达约200个碱基对(bp)的范围内，例如长度为至少25、50、75、100、125、150、175或200bp。对于ssODN也考虑了更长的同源臂，因为寡核苷酸合成的改进仍继续进行。

用于基因靶向的NHEJ方法

如本文所述，核酸酶诱导的非同源末端连接(NHEJ)可以用于靶基因特异性敲除。核酸酶诱导的NHEJ还可以用于去除(例如缺失)目的基因中的序列。

尽管不希望受理论束缚，但据信，在一个实施例中，与本文所述的方法相关的基因组改变依赖于核酸酶诱导的NHEJ和NHEJ修复途径的易错性质。NHEJ通过使两个末端连接在一起来修复DNA中的双链断裂；然而，通常，只要两个相容末端在恰好它们通过双键断裂形成时被完美连接，原始序列就被恢复。在末端重新连接之前，双键断裂的DNA末端常常是酶加工的受试者，酶加工在一条或两条链处产生核苷酸的添加或去除。这使得NHEJ修复位点处的DNA序列中存在插入和/或缺失(indel)突变。这些突变中的三分之二可以改变阅读框并且因此产生非功能蛋白。另外，维持阅读框但插入或缺失大量的序列的突变可以破坏蛋白质的功能。这是基因座依赖性的，因为关键功能结构域中的突变可能比蛋白质的非关键区域中的突变耐受性低。

由NHEJ产生的插入/缺失突变在性质上是不可预测的；然而，在给定的断裂位点处，某些插入/缺失序列是有利的并且是以群来过度表示的。缺失的长度可以广泛地变化；最常见是在1-50bp范围内，但是它们可以轻易达到大于100-200bp。插入往往是较短的并且常常包含紧密围绕断裂位点的序列的短的重复。然而，有可能获得大的插入，并且在这些情况下，插入的序列常常被跟踪至基因组的其他区域或跟踪至细胞中存在的质粒DNA。

因为NHEJ是诱变的方法，所以其还可以用于缺失小序列基序，只要不需要产生特定的最终序列。如果双链断裂被靶向靠近短的靶序列，则由NHEJ修复导致的缺失突变常常跨越并且因此去除不想要的核苷酸。对于较大的DNA区段的缺失，引入两个双链断裂(序列的每侧上一个双链断裂)可以在末端之间产生NHEJ，其中去除了整个间插序列。这两种方法都可以用于缺失特定DNA序列；然而，NHEJ的易错性质仍可能在修复位点产生插入/缺失突变。

双链切割Cas9分子和单链或切口酶Cas9分子均可用于本文所述的方法和组合物中以产生NHEJ介导的插入/缺失。靶向基因(例如编码区，例如目的基因的早期编码区)的NHEJ介导的插入/缺失可以用于敲除目的基因(即消除其表达)。例如，目的基因的早期编码区包含紧跟着转录起始位点的序列，在编码序列的第一外显子内，或在转录起始位点的500bp内(例如，小于500、450、400、350、300、250、200、150、100或50bp)。

双链或单链断裂相对于靶位置的放置

在gRNA和Cas9核酸酶产生双链断裂以诱导NHEJ介导的插入/缺失的一个实施例中，gRNA(例如单分子(或嵌合)或模块化gRNA分子)被配置成将一个双链断裂定位成与靶位置的核苷酸紧邻。在一个实施例中，切割位点是在离靶位置的0-500bp之间(例如，离靶位置小于500、400、300、200、100、50、40、30、25、20、15、10、9、8、7、6、5、4、3、2或1bp)。

在与Cas9切口酶复合的两种gRNA诱导两个单链断裂以诱导NHEJ介导的插入/缺失的一个实施例中，两种gRNA(例如独立地，单分子(或嵌合)或模块化gRNA)被配置成定位两个单链断裂以提供NHEJ修复靶位置的核苷酸。在一个实施例中，gRNA被配置成将切口定位在不同链上的相同位置或彼此的几个核苷酸内，基本上模拟双链断裂。在一个实施例中，较近的切口在离靶位置的0-30bp之间(例如，离靶位置小于30、25、20、1、10、9、8、7、6、5、4、3、2或1bp)，并且这两个切口彼此在25-55bp内(例如，在25至50、25至45、25至40、25至35、25至30、50至55、45至55、40至55、35至55、30至55、30至50、35至50、40至50、45至50、35至45、或40至45bp之间)并且离彼此不超过100bp(例如，不超过90、80、70、60、50、40、30、20或10bp)。在一个实施例中，gRNA被配置成将单链断裂放置在靶位置的核苷酸的任一侧。

双链切割Cas9分子和单链或切口酶Cas9分子均可用于本文所述的方法和组合物中以产生靶位置的两侧的断裂。可以在靶位置的两侧产生双链断裂或成对的单链断裂以去除两个切口之间的核酸序列(例如，使两个断裂之间的区域缺失)。在一个实施例中，两种gRNA(例如独立地，单分子(或嵌合)或模块化gRNA)被配置成将双链断裂定位在靶位置的两侧(例如，第一gRNA用于靶向本文所述的基因或途径中的突变的上游(即5')，并且第二gRNA用于靶向本文所述的基因或途径中的突变的下游(即3'))。在一个替代性实施例中，三种gRNA(例如独立地，单分子(或嵌合)或模块化gRNA)被配置成将双链断裂(即，一种gRNA与Cas9核酸酶复合)和两个单链断裂或成对的单链断裂(即，两种gRNA与Cas9切口酶复合)定位在靶位置的任一侧(例如，第一gRNA用于靶向本文所述的基因或途径中的突变的上游(即5')，并且第二gRNA用于靶向本文所述的基因或途径中的突变的下游(即3'))。在另一个实施例中，四种gRNA(例如独立地，单分子(或嵌合)或模块化gRNA)被配置成在靶位置的任一侧产生两对单链断裂(即，两对两种gRNA与Cas9切口酶复合)(例如，第一gRNA用于靶向本文所述的基因或途径中的突变的上游(即5')，并且第二gRNA用于靶向本文所述的基因或途径中的突变的下游(即3'))。一个或多个双链断裂或成对的两个单链切口的较近者将理想地在靶位置的0-500bp内(例如，离靶位置不超过450、400、350、300、250、200、150、100、50或25bp)。当使用切口酶时，成对的两个切口彼此在25-55bp内(例如，在25至50、25至45、25至40、25至35、25至30、50至55、45至55、40至55、35至55、30至55、30至50、35至50、40至50、45至50、35至45、或40至45bp之间)并且离彼此不超过100bp(例如，不超过90、80、70、60、50、40、30、20或10bp)。

在其他实施例中，可以通过微同源末端连接(MMEJ)来介导模板核酸的插入。参见例如，Saksuma等人,“MMEJ-assisted gene knock-in using TALENs and CRISPR-Cas9with the PITCh systems.[使用TALEN以及CRISPR-Cas9与PITCh系统进行的MMEJ辅助基因敲入]”Nature Protocols[自然试验方案]11,118-133(2016)doi:10.1038/nprot.2015.140，2015年12月17日在线发表，将其内容通过引用以其全文并入。

VIII.包含多于一种gRNA分子的系统

尽管不意在受理论束缚，但本文已令人惊讶地显示，靶向紧邻连续核酸的两个靶序列(例如，通过两种gRNA分子/Cas9分子复合物，其各自在其对应的靶序列处或其附近诱导单链或双链断裂)诱导位于这两个靶序列之间的核酸序列(或至少80％、85％、90％、95％、96％、97％、98％、99％的核酸序列)的切除(例如，缺失)。在一些方面，本披露提供了两种或更多种gRNA分子的用途，这些gRNA分子包含靶向靶序列的靶向结构域，这些靶序列紧邻连续核酸，这些连续核酸是例如染色体，例如基因或基因座，包括其内含子、外显子和调节元件。该用途可以例如通过将两种或更多种gRNA分子与一种或多种Cas9分子(或编码两种或更多种gRNA分子和/或一种或多种Cas9分子的核酸)一起引入细胞中而实现。

在一些方面，两种或更多种gRNA分子的靶序列被定位成在连续核酸上相隔至少5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、200、300、400、500、600、700、800、900、1000、2000、3000、4000、5000、6000、7000、8000、9000、10,000、11,000、12,000、13,000、14,000、或15,000个核苷酸，但在连续核酸上相隔不超过25,000个核苷酸。在一个实施例中，靶序列被定位成相隔约4000个核苷酸。在一个实施例中，靶序列被定位成相隔约6000个核苷酸。

在一些方面，所述多种gRNA分子各自靶向相同基因或基因座内的序列。在另一方面，所述多种gRNA分子各自靶向2种或更多种不同基因内的序列。

在一些方面，本发明提供了包含多种(例如2种或更多种，例如2种)本发明的gRNA分子的组合物和细胞，其中所述多种gRNA分子靶向相隔小于15,000、小于14,000、小于13,000、小于12,000、小于11,000、小于10,000、小于9,000、小于8,000、小于7,000、小于6,000、小于5,000、小于4,000、小于3,000、小于2,000、小于1,000、小于900、小于800、小于700、小于600、小于500、小于400、小于300、小于200、小于100、小于90、小于80、小于70、小于60、小于50、小于40、或小于30个核苷酸的序列。在一个实施例中，靶序列在双链体核酸的同一条链上。在一个实施例中，靶序列在双链体核酸的不同链上。

在一个实施例中，本发明提供了一种用于切除(例如，缺失)布置于两个gRNA结合位点之间的核酸的方法，这两个gRNA结合位点被布置成在双链体核酸的相同或不同链上相隔小于25,000、小于20,000、小于15,000、小于14,000、小于13,000、小于12,000、小于11,000、小于10,000、小于9,000、小于8,000、小于7,000、小于6,000、小于5,000、小于4,000、小于3,000、小于2,000、小于1,000、小于900、小于800、小于700、小于600、小于500、小于400、小于300、小于200、小于100、小于90、小于80、小于70、小于60、小于50、小于40或小于30个核苷酸。在一个实施例中，该方法提供了布置于与每个gRNA结合位点相关的PAM位点之间的超过50％、超过60％、超过70％、超过80％、超过85％、超过86％、超过87％、超过88％、超过89％、超过90％、超过91％、超过92％、超过93％、超过94％、超过95％、超过96％、超过97％、超过98％、超过99％或100％的核苷酸的缺失。在实施例中，缺失进一步包含在与每个gRNA结合位点相关的一个或多个PAM位点内的一个或多个核苷酸。在实施例中，缺失进一步包含在与每个gRNA结合位点相关的PAM位点之间的区域外的一个或多个核苷酸。

在一方面，两种或更多种gRNA分子包含靶向靶序列的靶向结构域，这些靶序列侧接基因调节元件(例如启动子结合位点、增强子区域或阻遏物区域)，使得间插序列(或间插序列的部分)的切除引起目的基因的上调或下调。

在一个实施例中，两种或更多种gRNA分子包含靶向结构域，这些靶向结构域包含表1或表5的靶向结构域序列，例如由其组成。在一些方面，两种或更多种gRNA分子包含与同一基因中的序列互补的靶向结构域。在一些方面，两种或更多种gRNA分子包含与不同基因的序列互补的靶向结构域。在一个实施例中，两种或更多种gRNA分子包含靶向结构域，这些靶向结构域包含表6的靶向结构域序列，例如由其组成。在一个实施例中，两种或更多种gRNA分子包含靶向结构域，这些靶向结构域包含表2、表7、表8和/或表9的靶向结构域序列，例如由其组成。在一些方面，两种或更多种gRNA分子包含与同一基因中的序列互补的靶向结构域。在一些方面，两种或更多种gRNA分子包含与不同基因的序列互补的靶向结构域。在一个实施例中，两种或更多种gRNA分子选自表7、表8和/或表9的gRNA分子。在一个实施例中，第一和第二gRNA分子包含靶向结构域(这些靶向结构域包含选自表1-9的靶向结构域序列，例如由其组成)，并且例如选自不同的表，并且包含与不同基因的序列互补的靶向结构域。

在一方面，两种或更多种gRNA分子包含靶向靶序列的靶向结构域，这些靶序列侧接基因调节元件(例如启动子结合位点、增强子区域或阻遏物区域)，使得间插序列(或间插序列的部分)的切除引起目的基因的上调或下调。通过举例，两种或更多种gRNA分子包含靶向靶序列的靶向结构域，这些靶序列侧接BCL11a基因的类红细胞增强子区域(例如，在+55、+58或+62区域内)的GATA1结合位点(或其部分)或TAL1结合位点(或其部分)。在其他实施例中，一种或多种gRNA分子不会导致BCL11a增强子内的GATA1结合位点或TAL1结合位点的破坏。

在一个实施例中，两种或更多种gRNA分子包含靶向结构域，这些靶向结构域包含选自表1的靶向结构域，例如由其组成。在一个实施例中，两种或更多种gRNA分子包含靶向结构域，这些靶向结构域包含选自表2的靶向结构域，例如由其组成。在一个实施例中，两种或更多种gRNA分子包含靶向结构域，这些靶向结构域包含选自表3的靶向结构域，例如由其组成。在一个实施例中，两种或更多种gRNA分子包含靶向结构域，这些靶向结构域包含选自表4的靶向结构域，例如由其组成。在一个实施例中，两种或更多种gRNA分子包含靶向结构域，这些靶向结构域包含选自表5的靶向结构域，例如由其组成。在一个实施例中，两种或更多种gRNA分子包含靶向结构域，这些靶向结构域包含选自表6的靶向结构域，例如由其组成。在一个实施例中，两种或更多种gRNA分子包含靶向结构域，这些靶向结构域包含选自表7的靶向结构域，例如由其组成。在一个实施例中，两种或更多种gRNA分子包含靶向结构域，这些靶向结构域包含选自表8的靶向结构域，例如由其组成。在一个实施例中，两种或更多种gRNA分子包含靶向结构域，这些靶向结构域包含选自表9的靶向结构域，例如由其组成。

在一些方面，两种或更多种gRNA分子包含靶向结构域，这些靶向结构域包含以上部分II中列出的靶向结构域序列对，例如由其组成。

不受理论束缚，据信增加胎儿血红蛋白(例如，γ珠蛋白)的表达同时减少或消除β珠蛋白(例如，包含镰状化突变的β珠蛋白)的表达将导致治疗血红蛋白病(例如镰状细胞疾病)的功效增加。因此，在一方面，两种或更多种gRNA分子包含引起γ珠蛋白表达增加的第一gRNA分子以及减少或消除β珠蛋白(例如携带镰状细胞突变的β珠蛋白)表达的第二gRNA分子。在实施例中，两种或更多种gRNA分子包含第一gRNA分子和第二gRNA分子，该第一gRNA分子靶向例如如本文所述的BCL11a增强子区域内的序列，例如包含靶向结构域的gRNA分子，该靶向结构域包含表7、表8或表9的靶向结构域，例如由其组成，并且还第二gRNA分子靶向镰状球蛋白基因(例如，包含镰状化突变的β珠蛋白基因)的序列。

IX.gRNA的特性

本文还令人惊讶地显示，使用相同的细胞类型、递送方法和crRNA/tracr组分，gRNA分子和包含所述gRNA分子的CRISPR系统在多个实验中产生相似或相同的插入/缺失模式。不受理论束缚，据信一些插入/缺失模式可能比其他插入/缺失模式更有利。例如，主要包括导致“移码突变”的插入和/或缺失(例如，1-或2-碱基对插入或缺失，或任何插入或缺失，其中n/3不是整数(其中n＝插入或缺失中核苷酸的数量))的插入/缺失可能有益于减少或消除功能蛋白的表达。同样地，主要包括“大缺失”(多于10、11、12、13、14、15、20、25或30个核苷酸的缺失)的插入/缺失也可能有益于例如去除关键调节序列(如启动子结合位点)，这可以类似地对功能蛋白的表达具有改进的影响。虽然令人惊讶地发现由给定的gRNA/CRISPR系统诱导的插入/缺失模式在各细胞类型中一致地重现，如本文所述，但是在引入gRNA/CRISPR系统后，在给定的细胞中并不是任何单个插入/缺失结构会必然地产生。

因此，本发明提供了gRNA分子，这些gRNA分子产生有益的插入/缺失模式或结构，例如具有主要由一个或多个移码突变和/或大缺失构成的插入/缺失模式或结构。如本文所述，可以通过NGS评估在测试细胞(例如，HEK293细胞)中或在目的细胞(例如，HSPC细胞)中由候选gRNA分子产生的插入/缺失模式或结构来选择此类gRNA分子。如实例中所示，已发现当将gRNA分子引入所需细胞群中时，产生包含显著分数的在靶基因中具有移码突变的细胞的细胞群。在一些情况下，移码突变率高达75％、80％、85％、90％或更高。因此，本发明提供了包含至少约40％(例如，至少约45％、至少约50％、至少约55％、至少约60％、至少约65％、至少约70％、至少约75％、至少约80％、至少约85％、至少约90％、至少约95％、或至少约99％)的在本文所述的gRNA分子的靶位点处或其附近具有移码突变(例如如本文所述)的细胞的细胞群。本发明还提供了包含至少约50％(例如，至少约55％、至少约60％、至少约65％、至少约70％、至少约75％、至少约80％、至少约85％、至少约90％、至少约95％、或至少约99％)的在本文所述的gRNA分子的靶位点处或其附近具有移码突变(例如如本文所述)的细胞的细胞群。

因此，本发明提供了选择用于本发明的治疗方法的gRNA分子的方法，这些方法包括：1)向目的靶标提供多种gRNA分子，2)评估通过使用所述gRNA分子产生的插入/缺失模式或结构，3)选择形成插入/缺失模式或结构的gRNA分子，这些插入/缺失模式或结构主要由移码突变、大缺失或其组合构成，和4)在本发明的方法中使用所述选择的gRNA。

本发明进一步提供了改变细胞的方法和经改变的细胞，其中在该细胞类型中用给定gRNA/CRISPR系统不断地产生特定的插入/缺失模式。例如，在实例中披露了插入/缺失模式，包括用本文所述的gRNA/CRISPR系统观察到的前5个最常发生的插入/缺失。如实例中所示，产生了其中显著分数的细胞包含前5个插入/缺失中的一个的细胞群(例如，其中前5个插入/缺失中的一个存在于该群的超过30％、超过40％、超过50％、超过60％、或更多的细胞中的细胞群)。因此，本发明提供了包含用给定gRNA/CRISPR系统观察到的前5个插入/缺失中的任何一个的插入/缺失的细胞，例如HSPC(如本文所述)。此外，本发明提供了当通过例如NGS评估时包含高百分比的包含本文针对给定gRNA/CRISPR系统所述的前5个插入/缺失中的一个的细胞的细胞群，例如HSPC(如本文所述)。当与插入/缺失模式分析结合使用时，“高百分比”是指至少约50％(例如，至少约55％、至少约60％、至少约65％、至少约70％、至少约75％、至少约80％、至少约85％、至少约90％、至少约95％、或至少约99％)的该群的包含本文针对给定gRNA/CRISPR系统所述的前5个插入/缺失中的一个的细胞。在其他实施例中，该细胞群包含至少约25％(例如从约25％至约60％、例如从约25％至约50％、例如从约25％至约40％、例如从约25％至约35％)的具有本文针对给定gRNA/CRISPR系统所述的前5个插入/缺失中的一个的细胞。在实施例中，表15、图25和表37中提供了针对靶向BCL11a增强子的+58区域的给定gRNA/CRISPR系统的靠前的插入/缺失，例如前5个插入/缺失。在实施例中，表26、表27和表37中提供了针对靶向HPFH区域的给定gRNA/CRISPR系统的靠前的插入/缺失，例如前5个插入/缺失。

还发现某些gRNA分子不会在靶细胞类型的基因组内的脱靶序列处产生插入/缺失，或者相对于靶位点处的插入/缺失产生频率以非常低的频率(例如，群内<5％的细胞)在脱靶位点处产生插入/缺失。因此，本发明提供了gRNA分子和CRISPR系统，它们在靶细胞类型中不表现出脱靶插入/缺失形成，或产生<5％的脱靶插入/缺失形成频率。在实施例中，本发明提供了gRNA分子和CRISPR系统，它们在靶细胞类型中不表现出任何脱靶插入/缺失形成。因此，本发明进一步提供了如下细胞(例如细胞群，例如HSPC，例如如本文所述)，该细胞在本文所述的gRNA分子的靶位点处或其附近包含插入/缺失(例如，移码插入/缺失，或由给定gRNA/CRISPR系统产生的前5个插入/缺失中的任何一个，例如如本文所述)，但在gRNA分子的任何脱靶位点处不包含插入/缺失。在其他实施例中，本发明进一步提供了如下细胞群(例如HSPC，例如如本文所述)，该细胞群包含>50％的在本文所述的gRNA分子的靶位点处或其附近具有插入/缺失(例如移码插入/缺失，或由给定gRNA/CRISPR系统产生的前5个插入/缺失中的任何一个，例如如本文所述)的细胞，但包含小于5％，例如小于4％、小于3％、小于2％或小于1％的在gRNA分子的任何脱靶位点处包含插入/缺失的细胞。

在实施例中，由本文所述的CRISPR系统(例如，包含本文所述的gRNA分子的CRISPR系统)产生的插入/缺失不包含GATA-1结合位点的核苷酸并且/或不包含TAL-1结合位点的核苷酸(例如，不包含图25中所述的GATA-1结合位点和/或TAL-1结合位点的核苷酸)。

X.递送/构建体

能以各种形式递送、配制或施用这些组分，例如Cas9分子或gRNA分子、或两者。作为非限制性实例，可以配制(在一种或多种组合物中)、直接递送或施用gRNA分子和Cas9分子到需要基因组编辑事件的细胞中。可替代地，可以配制(在一种或多种组合物中)、递送或施用编码一种或多种组分(例如Cas9分子或gRNA分子、或两者)的核酸。在一方面，gRNA分子作为编码gRNA分子的DNA提供，并且Cas9分子作为编码Cas9分子的DNA提供。在一个实施例中，gRNA分子和Cas9分子在分开的核酸分子上编码。在一个实施例中，gRNA分子和Cas9分子在同一核酸分子上编码。在一方面，gRNA分子作为RNA提供，并且Cas9分子作为编码Cas9分子的DNA提供。在一个实施例中，提供具有例如如本文所述的一种或多种经修饰的gRNA分子。在一方面，gRNA分子作为RNA提供，并且Cas9分子作为编码Cas9分子的mRNA提供。在一方面，gRNA分子作为RNA提供，并且Cas9分子作为蛋白质提供。在一个实施例中，gRNA和Cas9分子作为核糖核蛋白复合物(RNP)提供。在一方面，gRNA分子作为编码gRNA分子的DNA提供，并且Cas9分子作为蛋白质提供。

递送(例如RNP的递送(例如，递送至如本文所述的HSPC细胞中))可以通过例如电穿孔(例如如本领域已知的)或使得细胞膜可渗透核酸和/或多肽分子的其他方法来实现。在实施例中，使用4D-核转染仪(龙沙公司(Lonza))，例如使用4D-核转染仪(龙沙公司)上的程序CM-137，通过电穿孔来递送如本文所述的CRISPR系统，例如RNP。在实施例中，使用从约800伏至约2000伏，例如从约1000伏至约1800伏、例如从约1200伏至约1800伏、例如从约1400伏至约1800伏、例如从约1600伏至约1800伏、例如约1700伏的电压，例如在1700伏的电压下，通过电穿孔来递送如本文所述的CRISPR系统，例如RNP。在实施例中，脉冲宽度/长度为从约10ms至约50ms，例如从约10ms至约40ms、例如从约10ms至约30ms、例如从约15ms至约25ms、例如约20ms、例如20ms。在实施例中，使用1、2、3、4、5个或更多个(例如2个、例如1个)脉冲。在一个实施例中，使用约1700伏(例如1700伏)的电压、约20ms(例如20ms)的脉冲宽度，使用单个(1个)脉冲，通过电穿孔来递送如本文所述的CRISPR系统，例如RNP。在实施例中，使用氖电穿孔仪来完成电穿孔。用于使膜可渗透的另外的技术在本领域中是已知的，并且包括例如细胞挤压(例如，如WO 2015/023982和WO 2013/059343中所述，将其内容通过引用以其全文特此并入)、纳米针(例如，如Chiappini等人,Nat.Mat.[天然材料],14；532-39或US2014/0295558中所述，将其内容通过引用以其全文特此并入)和纳米管(例如，如Xie,ACS Nano[ACS纳米],7(5)；4351-58中所述，将其内容通过引用以其全文特此并入)。

当递送以DNA编码的组分时，DNA将通常包含控制区(例如包含启动子)以实现表达。Cas9分子序列的有用启动子包括CMV、EF-1α、MSCV、PGK、CAG控制启动子。gRNA的有用启动子包括H1、EF-1a和U6启动子。可以选择具有相似或不同强度的启动子来调整组分的表达。编码Cas9分子的序列可以包含核定位信号(NLS)，例如SV40 NLS。在一个实施例中，Cas9分子或gRNA分子的启动子可以独立地是可诱导的、组织特异性的或细胞特异性的。

Cas9分子和或gRNA分子的基于DNA的递送

编码Cas9分子和/或gRNA分子的DNA可以通过本领域已知的方法或如本文所述的给予受试者或递送到细胞中。例如，编码Cas9和/或编码gRNA的DNA可以例如通过载体(例如病毒或非病毒载体)、基于非载体的方法(例如使用裸DNA或DNA复合物)、或其组合来递送。

在一些实施例中，编码Cas9和/或编码gRNA的DNA通过载体(例如，病毒载体/病毒、质粒、微环或纳米质粒)来递送。

载体可以包含编码Cas9分子和/或gRNA分子的序列。载体还可以包含例如与Cas9分子序列融合的编码信号肽(例如，用于核定位、核仁定位、线粒体定位)的序列。例如，载体可以包含与编码Cas9分子的序列融合的一个或多个核定位序列(例如，来自SV40)。

一个或多个调节/控制元件(例如启动子、增强子、内含子、聚腺苷酸化信号、Kozak共有序列、内部核糖体进入位点(IRES)、2A序列以及剪接受体或供体)可以被包含在载体中。在一些实施例中，启动子被RNA聚合酶II识别(例如，CMV启动子)。在其他实施例中，启动子被RNA聚合酶III识别(例如，U6启动子)。在一些实施例中，启动子是调节型启动子(例如，诱导型启动子)。在其他实施例中，启动子是组成型启动子。在一些实施例中，启动子是组织特异性启动子。在一些实施例中，启动子是病毒启动子。在其他实施例中，启动子是非病毒启动子。

在一些实施例中，载体或递送媒介物是微环。在一些实施例中，载体或递送媒介物是纳米质粒。

在一些实施例中，载体或递送媒介物是病毒载体(例如，用于产生重组病毒)。在一些实施例中，病毒是DNA病毒(例如，dsDNA或ssDNA病毒)。在其他实施例中，病毒是RNA病毒(例如，ssRNA病毒)。

示例性病毒载体/病毒包括例如逆转录病毒、慢病毒、腺病毒、腺相关病毒(AAV)、痘苗病毒、痘病毒和单纯疱疹病毒。病毒载体技术在本领域中是熟知的，并且例如描述于Sambrook等人,2012,MOLECULAR CLONING:A LABORATORY MANUAL[分子克隆：实验室手册],第1-4卷,Cold Spring Harbor Press[冷泉港出版社],纽约中，以及其他病毒学和分子生物学手册中。

在一些实施例中，病毒感染正在分裂的细胞。在其他实施例中，病毒感染不分裂的细胞。在一些实施例中，病毒感染正在分裂和不分裂的细胞两者。在一些实施例中，病毒可以整合到宿主基因组中。在一些实施例中，病毒被工程化成例如在人体内具有降低的免疫力。在一些实施例中，病毒是有复制能力的。在其他实施例中，病毒是复制缺陷型的，例如，另外轮次的病毒粒子复制和/或包装所必需的基因的一个或多个编码区被其他基因替代或缺失。在一些实施例中，病毒引起Cas9分子和/或gRNA分子的瞬时表达。在其他实施例中，病毒导致Cas9分子和/或gRNA分子的持久(例如，至少1周、2周、1个月、2个月、3个月、6个月、9个月、1年、2年)或永久表达。病毒的包装容量可以变化，例如，从至少约4kb到至少约30kb，例如至少约5kb、10kb、15kb、20kb、25kb、30kb、35kb、40kb、45kb、或50kb。

在一些实施例中，编码Cas9和/或gRNA的DNA通过重组逆转录病毒来递送。在一些实施例中，逆转录病毒(例如，莫洛尼鼠白血病病毒)包含逆转录酶，例如，其允许整合到宿主基因组中。在一些实施例中，逆转录病毒是有复制能力的。在其他实施例中，逆转录病毒是复制缺陷型的，例如，另外轮次的病毒粒子复制和包装所必需的基因的一个或多个编码区被其他基因替代或缺失。

在一些实施例中，编码Cas9和/或gRNA的DNA通过重组慢病毒来递送。例如，慢病毒是复制缺陷型的，例如，不包含病毒复制所需的一种或多种基因。

在一些实施例中，编码Cas9和/或gRNA的DNA通过重组腺病毒来递送。在一些实施例中，腺病毒被工程化成在人体内具有降低的免疫力。

在一些实施例中，编码Cas9和/或gRNA的DNA通过重组AAV来递送。在一些实施例中，AAV可以将其基因组整合到宿主细胞(例如如本文所述的靶细胞)的基因组中。在一些实施例中，AAV是自身互补的腺相关病毒(scAAV)，例如包装两条链的scAAV，这两条链一起退火以形成双链DNA。可以在所披露的方法中使用的AAV血清型包括例如AAVl、AAV2、经修饰的AAV2(例如在Y444F、Y500F、Y730F和/或S662V处的修饰)、AAV3、经修饰的AAV3(例如在Y705F、Y731F和/或T492V处的修饰)、AAV4、AAV5、AAV6、经修饰的AAV6(例如在S663V和/或T492V处的修饰)、AAV8。AAV 8.2、AAV9、AAV rh10以及假型AAV(如AAV2/8、AAV2/5和AAV2/6)也可用于所披露的方法中。

在一些实施例中，编码Cas9和/或gRNA的DNA通过杂合病毒(例如本文所述的一种或多种病毒的杂合体)来递送。

包装细胞用于形成能够感染宿主细胞或靶细胞的病毒颗粒。这种细胞包括可以包装腺病毒的293细胞，以及可以包装逆转录病毒的ψ2细胞或PA317细胞。通常通过将核酸载体包装到病毒颗粒中的生产者细胞系来产生基因疗法中使用的病毒载体。载体通常含有包装并且随后整合到宿主细胞或靶细胞(如果合适的话)中所需的最小病毒序列，其中其他病毒序列被编码有待表达的蛋白质的表达盒替代。例如，基因疗法中使用的AAV载体通常仅具有来自AAV基因组的反向末端重复(ITR)序列，这些序列是在宿主细胞或靶细胞中包装和基因表达所需的。失去的病毒功能是由包装细胞系反向供应的。自此以后，病毒DNA被包装在细胞系中，该细胞系含有编码其他AAV基因即rep和cap但缺乏ITR序列的辅助质粒。该细胞系还被作为辅助者的腺病毒感染。辅助病毒促进AAV载体复制和来自辅助质粒的AAV基因表达。辅助质粒由于缺乏ITR序列而未大量包装。腺病毒的污染可以通过例如进行腺病毒比AAV更敏感的热处理来减少。

在一个实施例中，病毒载体具有细胞类型和/或组织类型识别的能力。例如，病毒载体可以被不同的/替代的病毒包膜糖蛋白假型化；被细胞类型特异性受体工程化(例如，进行病毒包膜糖蛋白的遗传修饰以掺入靶向配体(如肽配体)、单链抗体、生长因子)；和/或被工程化成拥有具有双重特异性的分子桥，其一端识别病毒糖蛋白并且另一端识别靶细胞表面的部分(例如，配体-受体、单克隆抗体、抗生物素蛋白-生物素以及化学缀合)。

在一个实施例中，病毒载体实现细胞类型特异性表达。例如，可以构建组织特异性启动子以限制转基因(Cas9和gRNA)仅在靶细胞中表达。载体的特异性还可以通过转基因表达的微小RNA依赖性控制来介导。在一个实施例中，病毒载体具有增加的病毒载体和靶细胞膜的融合效率。例如，可以掺入融合蛋白(如有融合能力的血凝素(HA))以增加病毒摄取到细胞中。在一个实施例中，病毒载体具有核定位的能力。例如，需要细胞壁分解(在细胞分裂期间)并因此不会感染非分裂细胞的病毒可以被改变以在病毒的基质蛋白中掺入核定位肽，从而能够转导非增殖细胞。

在一些实施例中，编码Cas9和/或gRNA的DNA通过基于非载体的方法(例如，使用裸DNA或DNA复合物)来递送。例如，DNA可以例如通过有机改性的二氧化硅或硅酸盐(Ormosil)、电穿孔、基因枪、声致穿孔、磁转染、脂质介导的转染、树枝状聚合物、无机纳米颗粒、磷酸钙或、或其组合来递送。

在一些实施例中，编码Cas9和/或gRNA的DNA通过载体和基于非载体的方法的组合来递送。例如，病毒体包含与灭活病毒(例如，HIV或流感病毒)组合的脂质体，其可导致例如在呼吸道上皮细胞中的比单独的病毒或脂质体方法更有效的基因转移。

在一个实施例中，递送媒介物是非病毒载体。在一个实施例中，非病毒载体是无机纳米颗粒(例如，附着于纳米颗粒表面的有效负载上)。示例性无机纳米颗粒包括例如磁性纳米颗粒(例如，Fe lvln0₂)或二氧化硅。纳米颗粒的外表面可以与允许有效负载的附着(例如，缀合或截留)的带正电荷的聚合物(例如，聚乙烯亚胺、聚赖氨酸、聚丝氨酸)缀合。在一个实施例中，非病毒载体是有机纳米颗粒(例如，将有效负载截留在纳米颗粒内)。示例性有机纳米颗粒包括例如SNALP脂质体，这些SNALP脂质体含有阳离子脂质和中性辅助脂质以及涂有脂质涂层的核酸复合物，这些中性辅助脂质涂有聚乙二醇(PEG)和鱼精蛋白。

用于转移CRISPR系统或编码CRISPR系统或其组分的核酸(例如载体)的示例性脂质和/或聚合物包括例如WO 2011/076807、WO 2014/136086、WO 2005/060697、WO 2014/140211、WO 2012/031046、WO 2013/103467、WO 2013/006825、WO 2012/006378、WO 2015/095340、以及WO 2015/095346中描述的那些，将前述各项的内容通过引用以其全文特此并入。在一个实施例中，媒介物具有靶向修饰以增加纳米颗粒和脂质体(例如细胞特异性抗原、单克隆抗体、单链抗体、适体、聚合物、糖和细胞穿透肽)的靶细胞摄取。在一个实施例中，媒介物使用促融合肽/聚合物和内体去稳定化肽/聚合物。在一个实施例中，媒介物经历酸触发的构象变化(例如，以加速运载物(cargo)的内体逃逸)。在一个实施例中，使用刺激可切割的聚合物，例如用于在细胞区室中释放。例如，可以使用在还原性细胞环境中裂解的基于二硫化物的阳离子聚合物。

在一个实施例中，递送媒介物是生物学非病毒递送媒介物。在一个实施例中，媒介物是减毒细菌(例如，天然或人工工程化为侵入性但减毒以预防发病机理和表达转基因(例如，单核细胞增生李斯特菌、某些沙门氏菌属菌株、长双歧杆菌和经修饰的大肠杆菌)、具有营养性和组织特异性向性以靶向特定组织的细菌、具有经修饰的表面蛋白以改变靶组织特异性的细菌。在一个实施例中，媒介物是经遗传经修饰的噬菌体(例如，具有大包装容量、较低疫原性，含有哺乳动物质粒维持序列并掺入有靶向配体的工程化噬菌体)。在一个实施例中，媒介物是哺乳动物病毒样颗粒。例如，可以产生经修饰的病毒颗粒(例如，通过纯化“空”颗粒，然后用所需运载物离体组装病毒)。媒介物还可以被工程化成掺入靶向配体以改变靶组织特异性。在一个实施例中，媒介物是生物脂质体。例如，生物脂质体是源自人细胞的基于磷脂的颗粒(例如，红细胞血影，其是源自受试者的分解成球状结构的红细胞(例如，组织靶向可以通过附着各种组织特异性配体或细胞特异性配体来实现))，或分泌性外来体-受试者(即患者)衍生的内吞起源的膜结合纳米囊泡(30-100nm)(例如，可以从各种细胞类型产生，因此可以被细胞吸收而不需要靶向配体)。

在一个实施例中，递送除Cas系统的组分(例如本文所述的Cas9分子组分和/或gRNA分子组分)之外的一种或多种核酸分子(例如DNA分子)。在一个实施例中，在与递送Cas系统的一种或多种组分的同时递送核酸分子。在一个实施例中，在递送Cas9系统的一种或多种组分之前或之后(例如，少于约30分钟、1小时、2小时、3小时、6小时、9小时、12小时、1天、2天、3天、1周、2周或4周)递送核酸分子。在一个实施例中，通过与递送Cas9系统的一种或多种组分(例如Cas9分子组分和/或gRNA分子组分)不同的方式递送核酸分子。核酸分子可以通过本文所述的任何递送方法来递送。例如，核酸分子可以通过病毒载体(例如整合缺陷型慢病毒)来递送，并且Cas9分子组分和/或gRNA分子组分可以通过电穿孔来递送，例如，使得可以减少由核酸(例如DNA)引起的毒性。在一个实施例中，核酸分子编码治疗性蛋白，例如本文所述的蛋白质。在一个实施例中，核酸分子编码RNA分子，例如本文所述的RNA分子。编码Cas9分子的RNA的递送

编码Cas9分子(例如，有活性Cas9分子、无活性Cas9分子或无活性Cas9融合蛋白)和/或gRNA分子的RNA可以通过本领域已知的方法或如本文所述的递送至细胞(例如本文所述的靶细胞)中。例如，编码Cas9和/或编码gRNA的RNA可以例如通过显微注射、电穿孔、脂质介导的转染、肽介导的递送或其组合来递送。

作为蛋白质的Cas9分子的递送

Cas9分子(例如，有活性Cas9分子、无活性Cas9分子或无活性Cas9融合蛋白)可以通过本领域已知的方法或如本文所述的递送到细胞中。例如，Cas9蛋白分子可以例如通过显微注射、电穿孔、脂质介导的转染、肽介导的递送、细胞挤压或磨蚀(例如，通过纳米针)或其组合来递送。递送可以伴随有编码gRNA的DNA或伴随有gRNA，例如通过在核糖核蛋白复合物(RNP)中预复合gRNA和Cas9蛋白。

在一方面，例如如本文所述的Cas9分子作为蛋白质来递送，并且gRNA分子作为一种或多种RNA(例如，如本文所述的dgRNA或sgRNA)来递送。在实施例中，Cas9蛋白在递送至细胞之前与gRNA分子复合，例如如本文所述，作为核糖核蛋白复合物(“RNP”)。在实施例中，可以通过任何本领域已知的方法(例如电穿孔)将RNP递送到细胞(例如本文所述)中。如本文所述，并且不受理论束缚，可以优选的是使用例如如本文所述的gRNA分子和Cas9分子，它们导致靶细胞中的靶序列处的高％编辑(例如，>85％、>90％、>95％、>98％或>99％)，即使当递送至细胞的RNP浓度降低时。同样，不受理论束缚，递送包含gRNA分子的降低浓度或低浓度的RNP(其在靶细胞中的靶序列处产生高％编辑(包括在低RNP浓度下))可以是有益的，因为它可以降低脱靶编辑事件的频率和数量。在一方面，在使用低浓度或降低浓度的RNP的情况下，可以使用以下示例性程序来产生具有dgRNA分子的RNP：

1.提供高浓度(例如，比待递送至细胞的最终RNP浓度高的浓度)的在溶液中的Cas9分子和tracr，并允许这两种组分平衡；

2.提供crRNA分子，并且允许这些组分平衡(从而形成RNP的高浓度溶液)；

3.将RNP溶液稀释至所需浓度；

4.将所述所需浓度的所述RNP递送至靶细胞，例如通过电穿孔。

可以修改以上程序以与sgRNA分子一起使用，通过省略以上步骤2，并且在步骤1中，提供高浓度的在溶液中的Cas9分子和sgRNA分子，并允许这些组分平衡。在实施例中，Cas9分子和每种gRNA组分在溶液中以1:2的比率(Cas9:gRNA)，例如1:2摩尔比的Cas9:gRNA分子提供。在使用dgRNA分子的情况下，比率(例如摩尔比)是1:2:2(Cas9:tracr:crRNA)。在实施例中，RNP以20uM或更高的浓度，例如从约20uM至约50uM的浓度形成。在实施例中，RNP以10uM或更高的浓度，例如从约10uM至约30uM的浓度形成。在实施例中，在包含靶细胞(例如本文所述)的溶液中将RNP稀释至10uM或更低的终浓度(例如，从约0.01uM至约10uM的浓度)以递送至所述靶细胞。在实施例中，在包含靶细胞(例如本文所述)的溶液中将RNP稀释至3uM或更低的终浓度(例如，从约0.01uM至约3uM的浓度)以递送至所述靶细胞。在实施例中，在包含靶细胞(例如本文所述)的溶液中将RNP稀释至1uM或更低的终浓度(例如，从约0.01uM至约1uM的浓度)以递送至所述靶细胞。在实施例中，在包含靶细胞(例如本文所述)的溶液中将RNP稀释至0.3uM或更低的终浓度(例如，从约0.01uM至约0.3uM的浓度)以递送至所述靶细胞。在实施例中，在包含靶细胞(例如本文所述)的溶液中以约3uM的终浓度提供RNP以递送至所述靶细胞。在实施例中，在包含靶细胞(例如本文所述)的溶液中以约1uM的终浓度提供RNP以递送至所述靶细胞。在实施例中，在包含靶细胞(例如本文所述)的溶液中以约0.3uM的终浓度提供RNP以递送至所述靶细胞。在实施例中，在包含靶细胞(例如本文所述)的溶液中以约0.1uM的终浓度提供RNP以递送至所述靶细胞。在实施例中，在包含靶细胞(例如本文所述)的溶液中以约0.05uM的终浓度提供RNP以递送至所述靶细胞。在实施例中，在包含靶细胞(例如本文所述)的溶液中以约0.03uM的终浓度提供RNP以递送至所述靶细胞。在实施例中，在包含靶细胞(例如本文所述)的溶液中以约0.01uM的终浓度提供RNP以递送至所述靶细胞。在实施例中，RNP被配制在适于电穿孔的介质中。在实施例中，例如如本文所述，通过电穿孔，例如使用本文所述的电穿孔条件，将RNP递送至细胞，例如HSPC细胞。

组分的双模式递送或差别递送

Cas系统的组分(例如Cas9分子组分和gRNA分子组分)的单独递送，并且更具体地通过不同模式的组分递送，可以例如通过改善组织特异性和安全性来增强性能。

在一个实施例中，Cas9分子和gRNA分子通过不同的模式递送，或者有时在本文中称为差别模式。如本文所用，不同模式或差别模式是指赋予主题组分分子(例如Cas9分子、gRNA分子或模板核酸)不同的药效学或药代动力学特性的递送模式。例如，递送模式可导致不同的组织分布、不同的半衰期或不同的时间分布，例如在所选择的区室、组织或器官中。

一些递送模式(例如，通过例如通过自主复制或插入到细胞核酸中而在细胞中或在细胞子代中持续存在的核酸载体的递送)导致组分的更持久的表达和存在。

XI.治疗方法

本文所述的Cas9系统(例如，一种或多种gRNA分子和一种或多种Cas9分子)可用于治疗哺乳动物(例如人)的疾病。术语“治疗(treat、treated、treating和treatment)”包括向细胞施用cas9系统(例如一种或多种gRNA分子和一种或多种cas9分子)，以预防或延迟疾病的症状、并发症或生物化学指标的发作，缓解症状，或阻止或抑制疾病、病状或病症的进一步发展。治疗还可以包括施用一种或多种(例如，一群)细胞，例如HSPC，这些细胞已经通过引入本发明的gRNA分子(或多于一种gRNA分子)、或者通过引入如本文所述的CRISPR系统、或通过制备本文所述细胞的任何方法修饰，以预防或延迟疾病的症状、并发症或生物化学指标的发作，缓解症状，或阻止或抑制疾病、病状或病症的进一步发展。治疗可以是预防性的(以预防或延迟疾病的发作，或以防止其临床或亚临床症状的显现)或在疾病显现后对症状的治疗性抑制或缓解。可以通过本文所述的治疗措施来测量治疗。因此，本发明的“治疗”方法还包括向受试者施用通过将cas9系统(例如，一种或多种gRNA分子和一种或多种Cas9分子)引入细胞而改变的所述细胞，以治愈疾病或病状、降低其严重性、或改善其一种或多种症状，以延长受试者的健康或存活超过在不存在这种治疗的情况下预期的健康或存活。例如，“治疗”包括将受试者的疾病症状缓解至少5％、6％、7％、8％、9％、10％、11％、12％、13％、14％、15％、16％、17％、18％、19％、20％、25％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％或更多。

包含含有本文(例如表1、2、3、4、5、6、7、8和/或9中)所述的靶向结构域的gRNA分子的Cas9系统可用于治疗血红蛋白病。

血红蛋白病

血红蛋白病涵盖许多遗传起源的贫血，其中红细胞(RBC)的产生减少和/或破坏增加(溶血)。这些还包括遗传缺陷，其导致异常血红蛋白的产生，还伴随维持氧浓度的能力受损。一些此类病症涉及不能产生足够量的正常β-珠蛋白，而其他病症涉及完全不能产生正常β-珠蛋白。这些与β-珠蛋白相关的病症通常称为β-血红蛋白病。例如，β-地中海贫血是由β-珠蛋白基因表达的部分或完全缺陷(其导致有缺陷的HbA或缺乏HbA)引起的。镰状细胞性贫血是由β-珠蛋白结构基因的点突变(其导致异常(镰状)血红蛋白(HbS)的产生)引起的。HbS易于聚合，特别是在脱氧条件下。HbS RBC比正常RBC更脆弱，并更容易经历溶血，最终导致贫血。

在一个实施例中，使用本文所述的Cas9分子和gRNA分子(例如CRISPR系统)，例如通过同源重组来校正α珠蛋白或β珠蛋白中的遗传缺陷。

在一个实施例中，使用本文所述的CRISPR系统和方法，通过同源重组，将编码野生型(例如，非突变的)α珠蛋白或β珠蛋白拷贝的基因插入细胞的基因组中，例如在安全港位点处，例如在AAVS1安全港位点处。

在一个实施例中，使用本文所述的Cas9分子和gRNA分子来靶向血红蛋白病相关基因。示例性靶标包括例如与γ-珠蛋白基因的控制相关的基因。在一个实施例中，靶标是BCL11A。在一个实施例中，靶标是BCL11a增强子。在一个实施例中，靶标是HPFH区域。

胎儿血红蛋白(也为血红蛋白F或HbF或α2γ2)是两个成人α-珠蛋白多肽和两个胎儿β样γ-珠蛋白多肽的四聚体。HbF是人胎儿在子宫中发育的后七个月期间和在新生儿直至大约6个月大期间的主要氧转运蛋白。在功能上，胎儿血红蛋白与成人血红蛋白的最大差异在于它能够以比成人形式更大的亲和力结合氧，从而使发育中的胎儿更好地从母亲的血流中获取氧。

在新生儿中，到出生后约6个月时胎儿血红蛋白几乎完全被成人血红蛋白替代。在成人中，胎儿血红蛋白的产生可以在药理学上重新激活，这可用于治疗诸如血红蛋白病等疾病。例如，在某些患有血红蛋白病的患者中，更高水平的γ-球蛋白表达可以部分地补偿有缺陷或受损的β-珠蛋白基因产生，这可以改善这些疾病的临床严重性。增加的HbF水平或F-细胞(含有HbF的红细胞)数量可以改善血红蛋白病(例如重型β-地中海贫血和镰状细胞性贫血)的疾病严重性。

增加的HbF水平或F-细胞可以相关地降低细胞中BCL11A的表达。BCL11A基因编码多锌指转录因子。在一个实施例中，BCL11A的表达被调节，例如下调。在一个实施例中，BCL11A基因被编辑。在一个实施例中，例如在类红细胞谱系细胞中BCL11a的功能受损或下调。在一个实施例中，细胞是造血干细胞或祖细胞。

镰状细胞疾病

镰状细胞疾病是一组影响血红蛋白的病症。患有这种病症的人具有非典型血红蛋白分子(血红蛋白S)，其可以使红细胞变形成镰状或新月形。这种病症的典型特征包括少量的红细胞(贫血)、反复感染和疼痛的周期性发作。

HBB基因中的突变导致镰状细胞疾病。HBB基因提供了制备β-珠蛋白的指令。各种形式的β-珠蛋白由HBB基因中的不同突变产生。一种特定的HBB基因突变产生一种称为血红蛋白S(HbS)的β-珠蛋白的异常形式。HBB基因中的其他突变导致β-珠蛋白的另外的异常形式，如血红蛋白C(HbC)和血红蛋白E(HbE)。HBB基因突变还可以导致异常低水平的β-珠蛋白，即β地中海贫血。

在患有镰状细胞疾病的人中，血红蛋白中的至少一个β-珠蛋白亚基被血红蛋白S替代。在镰状细胞性贫血(其是镰状细胞疾病的常见形式)中，血红蛋白S替代血红蛋白中的两个β-珠蛋白亚基。在其他类型的镰状细胞疾病中，血红蛋白中仅有一个β-珠蛋白亚基被血红蛋白S替代。另一个β-珠蛋白亚基被不同的异常变体(如血红蛋白C)替代。例如，患有镰状血红蛋白C(HbSC)疾病的人具有含有血红蛋白S和血红蛋白C而不是β-珠蛋白的血红蛋白分子。如果产生血红蛋白S和β地中海贫血的突变同时发生，则个体患有血红蛋白S-β地中海贫血(HbSBetaThal)疾病。

β地中海贫血

β地中海贫血是一种减少血红蛋白产生的血液病症。在患有β地中海贫血的人中，低水平的血红蛋白导致身体的许多部位缺氧。受影响的个体也缺乏红细胞(贫血)，这可能导致皮肤苍白、虚弱、疲劳和更严重的并发症。患有β地中海贫血的人发生异常血凝块的风险增加。

根据症状的严重性将β地中海贫血分类为两种类型：重型地中海贫血(也称为库利氏贫血)和中间型地中海贫血。在这两种类型中，重型地中海贫血更为严重。

HBB基因中的突变导致β地中海贫血。HBB基因提供了制备β-珠蛋白的指令。HBB基因中的一些突变阻止了任何β-珠蛋白的产生。β-珠蛋白的缺乏被称为β-0(B°)地中海贫血。其他HBB基因突变允许产生一些但量减少的β-珠蛋白，即β-加(B+)地中海贫血。患有这两种类型的人被诊断为重型地中海贫血和中间型地中海贫血。

在一个实施例中，靶向第一基因的Cas9分子/gRNA分子复合物用于治疗以第二基因(例如第二基因中的突变)为特征的病症。通过举例，例如通过编辑或有效负载递送，靶向第一基因可以补偿或抑制来自第二基因(例如突变的第二基因)的影响的进一步损害。在一个实施例中，受试者携带的第一基因的一个或多个等位基因不是该病症的成因。

在一方面，本发明涉及治疗需要增加的胎儿血红蛋白(HbF)的哺乳动物(例如人)。

在一方面，本发明涉及治疗已被诊断患有血红蛋白病或有发生血红蛋白病风险的哺乳动物(例如人)。

在一方面，血红蛋白病是β-血红蛋白病。在一方面，血红蛋白病是镰状细胞疾病。在一方面，血红蛋白病是β地中海贫血。

治疗血红蛋白病的方法

在另一方面，本发明提供了治疗方法。在一些方面，本发明的gRNA分子、CRISPR系统和/或细胞用于治疗有需要的患者。在一些方面，患者是哺乳动物，例如人。在一些方面，患者患有血红蛋白病。在实施例中，患者患有镰状细胞疾病。在实施例中，患者患有β地中海贫血。

在一方面，该治疗方法包括向哺乳动物(例如人)施用本文所述的一种或多种gRNA分子(例如，包含表1、2、3、4、5、6、7、8或9中所述的靶向结构域的一种或多种gRNA分子)和本文所述的一种或多种cas9分子。

在一方面，该治疗方法包括向哺乳动物施用细胞群，其中该细胞群是来自哺乳动物(例如人)的细胞群，该哺乳动物(例如人)已施用本文所述的一种或多种gRNA分子(例如，包含表1、2、3、4、5、6、7、8或9中所述的靶向结构域的一种或多种gRNA分子)和本文所述的一种或多种cas9分子(例如本文所述的CRISPR系统)。在一个实施例中，将一种或多种gRNA分子或CRISPR系统施用至细胞是在体内完成的。在一个实施例中，将一种或多种gRNA分子或CRISPR系统施用至细胞是离体完成的。

在一方面，该治疗方法包括向哺乳动物(例如人)施用有效量的包含如下细胞或所述细胞子代的细胞群，这些细胞包含或曾经包含本文所述的一种或多种gRNA分子(例如，包含表1、2、3、4、5、6、7、8或9中所述的靶向结构域的一种或多种gRNA分子)和本文所述的一种或多种cas9分子。在一个实施例中，细胞对于哺乳动物是同种异体的。在一个实施例中，细胞对于哺乳动物是自体的。在一个实施例中，从哺乳动物收获细胞，离体操作，并返回到哺乳动物中。

在一些方面，包含或曾经包含本文所述的一种或多种gRNA分子(例如包含表1、2、3、4、5、6、7、8或9中所述的靶向结构域的一种或多种gRNA分子)和本文所述的一种或多种cas9分子的细胞或所述细胞的子代包含干细胞或祖细胞。在一方面，干细胞是造血干细胞。在一方面，祖细胞是造血祖细胞。在一方面，细胞包含造血干细胞和造血祖细胞两者，例如是HSPC。在一方面，细胞包含CD34+细胞，例如由其组成。在一方面，细胞基本上不含CD34-细胞。在一方面，细胞包含CD34+/CD90+干细胞，例如由其组成。在一方面，细胞包含CD34+/CD90-细胞，例如由其组成。在一方面，细胞是包含一种或多种以上所述或本文所述的细胞类型的群。

在一个实施例中，本披露提供了一种用于治疗有需要的哺乳动物(例如人)的血红蛋白病(例如镰状细胞疾病或β-地中海贫血)的方法，或一种用于增加有需要的哺乳动物(例如人)中的胎儿血红蛋白表达的方法，该方法包括：

a)提供(例如收获或分离)来自哺乳动物的HSPC(例如CD34+细胞)群；

b)离体提供所述细胞(例如在细胞培养基中)，任选地在有效量的组合物存在下，该组合物包含至少一种干细胞扩增剂，借此所述HSPC(例如CD34+细胞)群扩增至比未处理的群更大的程度；

c)使HSPC(例如CD34+细胞)群接触有效量的：组合物，该组合物包含含有本文所述的靶向结构域(例如表1、2、3、4、5、6、7、8或9中所述的靶向结构域)的至少一种gRNA分子或编码所述gRNA分子的核酸以及至少一种cas9分子(例如本文所述)或编码所述cas9分子的核酸，例如如本文所述的一种或多种RNP，例如具有本文所述的CRISPR系统；

d)在该群的至少一部分细胞(例如该群的至少一部分HSPC，例如CD34+细胞)中引起至少一种修饰，借此例如，当所述HSPC分化成类红细胞谱系细胞(例如红细胞)时，胎儿血红蛋白表达增加，例如相对于未根据步骤c)接触的细胞；和

f)将包含所述经修饰的HSPC(例如CD34+细胞)的细胞群返回到哺乳动物中。

在一方面，HSPC对于它们返回的哺乳动物是同种异体的。在一方面，HSPC对于它们返回的哺乳动物是自体的。在一些方面，HSPC自骨髓分离。在一些方面，HSPC自外周血，例如动员的外周血分离。在一些方面，动员的外周血自已施用G-CSF的受试者分离。在一些方面，动员的外周血自已施用除G-CSF以外的动员剂例如(AMD3100)的受试者分离。在一些方面，HSPC自脐带血分离。

在该方法的另外的实施例中，该方法进一步包括在提供HSPC(例如CD34+细胞)群(例如来自上述来源)后，富集HSPC(例如CD34+细胞)的细胞群的步骤。在该方法的实施例中，在所述富集后，该细胞群(例如HSPC)基本上不含CD34-细胞。

在实施例中，返回到哺乳动物中的细胞群包含至少70％的活细胞。在实施例中，返回到哺乳动物中的细胞群包含至少75％的活细胞。在实施例中，返回到哺乳动物中的细胞群包含至少80％的活细胞。在实施例中，返回到哺乳动物中的细胞群包含至少85％的活细胞。在实施例中，返回到哺乳动物中的细胞群包含至少90％的活细胞。在实施例中，返回到哺乳动物中的细胞群包含至少95％的活细胞。在实施例中，返回到哺乳动物中的细胞群包含至少99％的活细胞。可以通过针对细胞活力标志物(例如如本领域已知的)将细胞群的代表性部分进行染色来确定活力。

在另一个实施例中，本披露提供了一种用于治疗有需要的哺乳动物(例如人)的血红蛋白病(例如镰状细胞疾病或β-地中海贫血)的方法，或一种用于增加有需要的哺乳动物(例如人)中的胎儿血红蛋白表达的方法，该方法包括以下步骤：

a)提供(例如收获或分离)哺乳动物的HSPC(例如CD34+细胞)群，例如来自哺乳动物的骨髓；

b)从步骤a)的细胞群分离CD34+细胞；

c)离体提供所述CD34+细胞，并且例如在细胞培养基中、在有效量的组合物存在下培养所述细胞，该组合物包含至少一种干细胞扩增剂，例如化合物4，例如浓度为约0.5至约0.75微摩尔的化合物4，借此所述CD34+细胞群扩增至比未处理的群更大的程度；

d)向CD34+细胞群的细胞中引入有效量的：组合物，该组合物包含例如如本文所述的Cas9分子和例如如本文所述的gRNA分子，例如任选地其中Cas9分子和gRNA分子处于例如如本文所述的RNP的形式，并且任选地其中所述RNP引入所述细胞中是通过例如如本文所述的电穿孔进行的；

e)在该群的至少一部分细胞(例如该群的至少一部分HSPC，例如CD34+细胞)中引起至少一种遗传修饰，借此在与步骤d)中引入的gRNA的靶向结构域互补的基因组位点处或其附近产生例如如本文所述的插入/缺失；

f)任选地，另外在所述引入之后，例如在细胞培养基中、在有效量的组合物存在下培养所述细胞，该组合物包含至少一种干细胞扩增剂，例如化合物4，例如浓度为约0.5至约0.75微摩尔的化合物4，使得细胞扩增至少2倍，例如至少4倍、例如至少5倍；

g)冷冻保存所述细胞；和

h)将细胞返回到哺乳动物中，其中，

返回到哺乳动物中的细胞包含如下细胞：1)保持分化成类红细胞谱系细胞(例如红细胞)的能力；2)当分化成红细胞时，例如相对于未被步骤e)的gRNA经修饰的细胞产生增加水平的胎儿血红蛋白，例如产生每个细胞至少6皮克的胎儿血红蛋白。

在以上方法的实施例中，所述步骤b)产生基本上不含CD34-细胞的细胞群。

在该方法的另外的实施例中，该方法进一步包括在提供HSPC(例如CD34+细胞)群(例如来自上述来源)后，该细胞群富含HSPC(例如CD34+细胞)。

在这些方法的一个另外的实施例中，具有分化增加的胎儿血红蛋白表达能力的经修饰的HSPC(例如CD34+干细胞)群在重新引入哺乳动物中之前被冷冻保存并储存。在实施例中，将具有分化成类红细胞谱系细胞(例如红细胞)的能力和/或当分化成类红细胞谱系细胞(例如红细胞)时产生增加的胎儿血红蛋白水平的冷冻保存的HSPC群解冻，然后重新引入哺乳动物中。在这些方法的一个另外的实施例中，该方法包括化学疗法和/或放射疗法以去除或减少哺乳动物中的内源性造血祖细胞或干细胞。在这些方法的一个另外的实施例中，该方法不包括用以去除或减少哺乳动物中的内源性造血祖细胞或干细胞的化学疗法和/或放射疗法的步骤。在这些方法的一个另外的实施例中，该方法包括化学疗法和/或放射疗法以部分地减少哺乳动物中内源性造血祖细胞或干细胞(例如，部分淋巴细胞耗竭)。在实施例中，在将经修饰的HSPC重新引入哺乳动物中之前，用完全淋巴耗竭剂量的白消安治疗患者。在实施例中，在将经修饰的HSPC重新引入哺乳动物中之前，用部分淋巴耗竭剂量的白消安治疗患者。

在实施例中，使细胞与RNP接触，该RNP包含例如如本文所述的、与对于+58 BCL11a增强子区域而言的gRNA复合的Cas9分子。在实施例中，gRNA包含CR000312的靶向结构域。在实施例中，gRNA包含CR000311的靶向结构域。在实施例中，gRNA包含CR001128的靶向结构域。在实施例中，gRNA包含CR001125的靶向结构域。在实施例中，gRNA包含CR001126的靶向结构域。在实施例中，gRNA包含CR001127的靶向结构域。在实施例中，gRNA是包含crRNA和tracr的双指导RNA，该crRNA包含[SEQ ID NO:248]-[SEQ ID NO:6607]，例如由其组成，并且该tracr包含[SEQ ID NO:7812]，例如由其组成，任选地具有1、2、3、4、5、6或7个另外的3'尿嘧啶核苷酸，例如SEQ ID NO:6660。在实施例中，gRNA是sgRNA，该sgRNA包含[SEQ ID NO:248]-[SEQ ID NO:6601]，例如由其组成，任选地具有1、2、3、4、5、6或7个另外的3'尿嘧啶核苷酸，例如[SEQ ID NO:248]-[SEQ ID NO:7811]。在实施例中，gRNA是包含crRNA和tracr的双指导RNA，该crRNA包含[SEQ ID NO:247]-[SEQ ID NO:6607]，例如由其组成，并且该tracr包含SEQ ID NO:7812，例如由其组成，任选地具有1、2、3、4、5、6或7个另外的3'尿嘧啶核苷酸，例如SEQ ID NO:6660。在实施例中，gRNA是sgRNA，该sgRNA包含[SEQ ID NO:247]-[SEQ ID NO:6601]，例如由其组成，任选地具有1、2、3、4、5、6或7个另外的3'尿嘧啶核苷酸，例如[SEQ ID NO:247]-[SEQ ID NO:7811]。在实施例中，gRNA是包含crRNA和tracr的双指导RNA，该crRNA包含[SEQ ID NO:338]-[SEQ ID NO:6607]，例如由其组成，并且该tracr包含SEQ ID NO:7812，例如由其组成，任选地具有1、2、3、4、5、6或7个另外的3'尿嘧啶核苷酸，例如SEQ ID NO:6660。在实施例中，gRNA是sgRNA，该sgRNA包含[SEQ ID NO:338]-[SEQ IDNO:6601]，例如由其组成，任选地具有1、2、3、4、5、6或7个另外的3'尿嘧啶核苷酸，例如[SEQID NO:338]-[SEQ ID NO:7811]。在实施例中，gRNA是包含crRNA和tracr的双指导RNA，该crRNA包含[SEQ ID NO:335]-[SEQ ID NO:6607]，例如由其组成，并且该tracr包含SEQ IDNO:7812，例如由其组成，任选地具有1、2、3、4、5、6或7个另外的3'尿嘧啶核苷酸，例如SEQID NO:6660。在实施例中，gRNA是sgRNA，该sgRNA包含[SEQ ID NO:335]-[SEQ ID NO:6601]，例如由其组成，任选地具有1、2、3、4、5、6或7个另外的3'尿嘧啶核苷酸，例如[SEQ IDNO:335]-[SEQ ID NO:7811]。在实施例中，gRNA是包含crRNA和tracr的双指导RNA，该crRNA包含[SEQ ID NO:336]-[SEQ ID NO:6607]，例如由其组成，并且该tracr包含SEQ ID NO:7812，例如由其组成，任选地具有1、2、3、4、5、6或7个另外的3'尿嘧啶核苷酸，例如SEQ IDNO:6660。在实施例中，gRNA是sgRNA，该sgRNA包含[SEQ ID NO:336]-[SEQ ID NO:6601]，例如由其组成，任选地具有1、2、3、4、5、6或7个另外的3'尿嘧啶核苷酸，例如[SEQ ID NO:336]-[SEQ ID NO:7811]。在实施例中，gRNA是包含crRNA和tracr的双指导RNA，该crRNA包含[SEQ ID NO:337]-[SEQ ID NO:6607]，例如由其组成，并且该tracr包含SEQ ID NO:7812，例如由其组成，任选地具有1、2、3、4、5、6或7个另外的3'尿嘧啶核苷酸，例如SEQ IDNO:6660。在实施例中，gRNA是sgRNA，该sgRNA包含[SEQ ID NO:337]-[SEQ ID NO:6601]，例如由其组成，任选地具有1、2、3、4、5、6或7个另外的3'尿嘧啶核苷酸，例如[SEQ ID NO:337]-[SEQ ID NO:7811]。在任何上述实施例中，gRNA的任何或所有RNA组分可以在一个或多个核苷酸处被修饰，例如如本文所述。在实施例中，gRNA分子是SEQ ID NO:342。在实施例中，gRNA分子是SEQ ID NO:343。在实施例中，gRNA分子是SEQ ID NO:1762。在实施例中，gRNA分子是由SEQ ID NO:344和SEQ ID NO:6660组成的dgRNA分子。在实施例中，gRNA分子是由SEQ ID NO:344和SEQ ID NO:346组成的dgRNA分子。在实施例中，gRNA分子是由SEQ IDNO:345和SEQ ID NO:6660组成的dgRNA分子。在实施例中，gRNA分子是由SEQ ID NO:345和SEQ ID NO:346组成的dgRNA分子。在实施例中，gRNA分子是SEQ ID NO:347。在实施例中，gRNA分子是SEQ ID NO:348。在实施例中，gRNA分子是SEQ ID NO:1763。在实施例中，gRNA分子是由SEQ ID NO:349和SEQ ID NO:6660组成的dgRNA分子。在实施例中，gRNA分子是由SEQID NO:349和SEQ ID NO:346组成的dgRNA分子。在实施例中，gRNA分子是由SEQ ID NO:350和SEQ ID NO:6660组成的dgRNA分子。在实施例中，gRNA分子是由SEQ ID NO:350和SEQ IDNO:346组成的dgRNA分子。在实施例中，gRNA分子是SEQ ID NO:351。在实施例中，gRNA分子是SEQ ID NO:352。在实施例中，gRNA分子是SEQ ID NO:1764。在实施例中，gRNA分子是由SEQ ID NO:353和SEQ ID NO:6660组成的dgRNA分子。在实施例中，gRNA分子是由SEQ IDNO:353和SEQ ID NO:346组成的dgRNA分子。在实施例中，gRNA分子是由SEQ ID NO:354和SEQ ID NO:6660组成的dgRNA分子。在实施例中，gRNA分子是由SEQ ID NO:354和SEQ IDNO:346组成的dgRNA分子。在实施例中，gRNA分子是SEQ ID NO:355。在实施例中，gRNA分子是SEQ ID NO:356。在实施例中，gRNA分子是SEQ ID NO:1765。在实施例中，gRNA分子是由SEQ ID NO:357和SEQ ID NO:6660组成的dgRNA分子。在实施例中，gRNA分子是由SEQ IDNO:357和SEQ ID NO:346组成的dgRNA分子。在实施例中，gRNA分子是由SEQ ID NO:358和SEQ ID NO:6660组成的dgRNA分子。在实施例中，gRNA分子是由SEQ ID NO:358和SEQ IDNO:346组成的dgRNA分子。在实施例中，gRNA分子是SEQ ID NO:359。在实施例中，gRNA分子是SEQ ID NO:360。在实施例中，gRNA分子是SEQ ID NO:1766。在实施例中，gRNA分子是由SEQ ID NO:361和SEQ ID NO:6660组成的dgRNA分子。在实施例中，gRNA分子是由SEQ IDNO:361和SEQ ID NO:346组成的dgRNA分子。在实施例中，gRNA分子是由SEQ ID NO:362和SEQ ID NO:6660组成的dgRNA分子。在实施例中，gRNA分子是由SEQ ID NO:362和SEQ IDNO:346组成的dgRNA分子。在实施例中，gRNA分子是SEQ ID NO:363。在实施例中，gRNA分子是SEQ ID NO:364。在实施例中，gRNA分子是SEQ ID NO:1767。在实施例中，gRNA分子是由SEQ ID NO:365和SEQ ID NO:6660组成的dgRNA分子。在实施例中，gRNA分子是由SEQ IDNO:365和SEQ ID NO:346组成的dgRNA分子。在实施例中，gRNA分子是由SEQ ID NO:366和SEQ ID NO:6660组成的dgRNA分子。在实施例中，gRNA分子是由SEQ ID NO:366和SEQ IDNO:346组成的dgRNA分子。在实施例中，gRNA分子是SEQ ID NO:367。在实施例中，gRNA分子是SEQ ID NO:368。在实施例中，gRNA分子是SEQ ID NO:1768。在实施例中，gRNA分子是由SEQ ID NO:369和SEQ ID NO:6660组成的dgRNA分子。在实施例中，gRNA分子是由SEQ IDNO:369和SEQ ID NO:346组成的dgRNA分子。在实施例中，gRNA分子是由SEQ ID NO:370和SEQ ID NO:6660组成的dgRNA分子。在实施例中，gRNA分子是由SEQ ID NO:370和SEQ IDNO:346组成的dgRNA分子。在实施例中，gRNA分子是SEQ ID NO:371。在实施例中，gRNA分子是SEQ ID NO:372。在实施例中，gRNA分子是SEQ ID NO:1769。在实施例中，gRNA分子是由SEQ ID NO:373和SEQ ID NO:6660组成的dgRNA分子。在实施例中，gRNA分子是由SEQ IDNO:373和SEQ ID NO:346组成的dgRNA分子。在实施例中，gRNA分子是由SEQ ID NO:374和SEQ ID NO:6660组成的dgRNA分子。在实施例中，gRNA分子是由SEQ ID NO:374和SEQ IDNO:346组成的dgRNA分子。

在实施例中，使细胞与RNP接触，该RNP包含例如如本文所述的、与对于HPFH区域而言的gRNA复合的Cas9分子。在实施例中，gRNA包含CR001030的靶向结构域。在实施例中，gRNA包含CR001028的靶向结构域。在实施例中，gRNA包含CR001221的靶向结构域。在实施例中，gRNA包含CR001137的靶向结构域。在实施例中，gRNA包含CR003035的靶向结构域。在实施例中，gRNA包含CR003085的靶向结构域。在实施例中，gRNA是包含crRNA和tracr的双指导RNA，该crRNA包含[SEQ ID NO:98]-[SEQ ID NO:6607]，例如由其组成，并且该tracr包含SEQ ID NO:7812，例如由其组成，任选地具有1、2、3、4、5、6或7个另外的3'尿嘧啶核苷酸，例如SEQ ID NO:6660。在实施例中，gRNA是sgRNA，该sgRNA包含[SEQ ID NO:98]-[SEQ ID NO:6601]，例如由其组成，任选地具有1、2、3、4、5、6或7个另外的3'尿嘧啶核苷酸，例如[SEQ IDNO:98]-[SEQ ID NO:7811]。在实施例中，gRNA是包含crRNA和tracr的双指导RNA，该crRNA包含[SEQ ID NO:100]-[SEQ ID NO:6607]，例如由其组成，并且该tracr包含SEQ ID NO:7812，例如由其组成，任选地具有1、2、3、4、5、6或7个另外的3'尿嘧啶核苷酸，例如SEQ IDNO:6660。在实施例中，gRNA是sgRNA，该sgRNA包含[SEQ ID NO:100]-[SEQ ID NO:6601]，例如由其组成，任选地具有1、2、3、4、5、6或7个另外的3'尿嘧啶核苷酸，例如[SEQ ID NO:100]-[SEQ ID NO:7811]。在实施例中，gRNA是包含crRNA和tracr的双指导RNA，该crRNA包含[SEQ ID NO:1589]-[SEQ ID NO:6607]，例如由其组成，并且该tracr包含SEQ ID NO:7812，例如由其组成，任选地具有1、2、3、4、5、6或7个另外的3'尿嘧啶核苷酸，例如SEQ IDNO:6660。在实施例中，gRNA是sgRNA，该sgRNA包含[SEQ ID NO:1589]-[SEQ ID NO:6601]，例如由其组成，任选地具有1、2、3、4、5、6或7个另外的3'尿嘧啶核苷酸，例如[SEQ ID NO:1589]-[SEQ ID NO:7811]。在实施例中，gRNA是包含crRNA和tracr的双指导RNA，该crRNA包含[SEQ ID NO:1505]-[SEQ ID NO:6607]，例如由其组成，并且该tracr包含SEQ ID NO:7812，例如由其组成，任选地具有1、2、3、4、5、6或7个另外的3'尿嘧啶核苷酸，例如SEQ IDNO:6660。在实施例中，gRNA是sgRNA，该sgRNA包含[SEQ ID NO:1505]-[SEQ ID NO:6601]，例如由其组成，任选地具有1、2、3、4、5、6或7个另外的3'尿嘧啶核苷酸，例如[SEQ ID NO:1505]-[SEQ ID NO:7811]。在实施例中，gRNA是包含crRNA和tracr的双指导RNA，该crRNA包含[SEQ ID NO:1700]-[SEQ ID NO:6607]，例如由其组成，并且该tracr包含SEQ ID NO:7812，例如由其组成，任选地具有1、2、3、4、5、6或7个另外的3'尿嘧啶核苷酸，例如SEQ IDNO:6660。在实施例中，gRNA是sgRNA，该sgRNA包含[SEQ ID NO:1700]-[SEQ ID NO:6601]，例如由其组成，任选地具有1、2、3、4、5、6或7个另外的3'尿嘧啶核苷酸，例如[SEQ ID NO:1700]-[SEQ ID NO:7811]。在实施例中，gRNA是包含crRNA和tracr的双指导RNA，该crRNA包含[SEQ ID NO:1750]-[SEQ ID NO:6607]，例如由其组成，并且该tracr包含SEQ ID NO:7812，例如由其组成，任选地具有1、2、3、4、5、6或7个另外的3'尿嘧啶核苷酸，例如SEQ IDNO:6660。在实施例中，gRNA是sgRNA，该sgRNA包含[SEQ ID NO:1750]-[SEQ ID NO:6601]，例如由其组成，任选地具有1、2、3、4、5、6或7个另外的3'尿嘧啶核苷酸，例如[SEQ ID NO:1750]-[SEQ ID NO:7811]。在实施例中，gRNA分子是SEQ ID NO:375。在实施例中，gRNA分子是SEQ ID NO:376。在实施例中，gRNA分子是SEQ ID NO:1770。在实施例中，gRNA分子是由SEQ ID NO:377和SEQ ID NO:6660组成的dgRNA分子。在实施例中，gRNA分子是由SEQ IDNO:377和SEQ ID NO:346组成的dgRNA分子。在实施例中，gRNA分子是由SEQ ID NO:378和SEQ ID NO:6660组成的dgRNA分子。在实施例中，gRNA分子是由SEQ ID NO:378和SEQ IDNO:346组成的dgRNA分子。在实施例中，gRNA分子是SEQ ID NO:379。在实施例中，gRNA分子是SEQ ID NO:380。在实施例中，gRNA分子是SEQ ID NO:1771。在实施例中，gRNA分子是由SEQ ID NO:381和SEQ ID NO:6660组成的dgRNA分子。在实施例中，gRNA分子是由SEQ IDNO:381和SEQ ID NO:346组成的dgRNA分子。在实施例中，gRNA分子是由SEQ ID NO:382和SEQ ID NO:6660组成的dgRNA分子。在实施例中，gRNA分子是由SEQ ID NO:382和SEQ IDNO:346组成的dgRNA分子。在实施例中，gRNA分子是SEQ ID NO:383。在实施例中，gRNA分子是SEQ ID NO:384。在实施例中，gRNA分子是SEQ ID NO:1772。在实施例中，gRNA分子是由SEQ ID NO:385和SEQ ID NO:6660组成的dgRNA分子。在实施例中，gRNA分子是由SEQ IDNO:385和SEQ ID NO:346组成的dgRNA分子。在实施例中，gRNA分子是由SEQ ID NO:386和SEQ ID NO:6660组成的dgRNA分子。在实施例中，gRNA分子是由SEQ ID NO:386和SEQ IDNO:346组成的dgRNA分子。在实施例中，gRNA分子是SEQ ID NO:387。在实施例中，gRNA分子是SEQ ID NO:388。在实施例中，gRNA分子是SEQ ID NO:1773。在实施例中，gRNA分子是由SEQ ID NO:389和SEQ ID NO:6660组成的dgRNA分子。在实施例中，gRNA分子是由SEQ IDNO:389和SEQ ID NO:346组成的dgRNA分子。在实施例中，gRNA分子是由SEQ ID NO:390和SEQ ID NO:6660组成的dgRNA分子。在实施例中，gRNA分子是由SEQ ID NO:390和SEQ IDNO:346组成的dgRNA分子。在实施例中，gRNA分子是SEQ ID NO:391。在实施例中，gRNA分子是SEQ ID NO:392。在实施例中，gRNA分子是SEQ ID NO:1774。在实施例中，gRNA分子是由SEQ ID NO:393和SEQ ID NO:6660组成的dgRNA分子。在实施例中，gRNA分子是由SEQ IDNO:393和SEQ ID NO:346组成的dgRNA分子。在实施例中，gRNA分子是由SEQ ID NO:394和SEQ ID NO:6660组成的dgRNA分子。在实施例中，gRNA分子是由SEQ ID NO:394和SEQ IDNO:346组成的dgRNA分子。在实施例中，gRNA分子是SEQ ID NO:395。在实施例中，gRNA分子是SEQ ID NO:396。在实施例中，gRNA分子是SEQ ID NO:1775。在实施例中，gRNA分子是由SEQ ID NO:397和SEQ ID NO:6660组成的dgRNA分子。在实施例中，gRNA分子是由SEQ IDNO:397和SEQ ID NO:346组成的dgRNA分子。在实施例中，gRNA分子是由SEQ ID NO:398和SEQ ID NO:6660组成的dgRNA分子。在实施例中，gRNA分子是由SEQ ID NO:398和SEQ IDNO:346组成的dgRNA分子。

在实施例中，干细胞扩增剂是化合物1。在实施例中，干细胞扩增剂是化合物2。在实施例中，干细胞扩增剂是化合物3。在实施例中，干细胞扩增剂是化合物4。在实施例中，干细胞扩增剂是化合物4并且以2-0.1微摩尔，例如1-0.25微摩尔、例如0.75-0.5微摩尔的浓度存在。在实施例中，干细胞扩增剂是WO 2010/059401中所述的分子(例如，WO 2010/059401的实例1中所述的分子)。

在实施例中，在使细胞与例如本文所述的CRISPR系统接触的步骤之前，将细胞(例如HSPC，例如如本文所述)离体培养约1小时至约15天的时间段，例如约12小时至约12天的时间段、例如约12小时至4天的时间段、例如约1天至约4天的时间段、例如约1天至约2天的时间段、例如约1天的时间段或约2天的时间段。在实施例中，所述接触步骤之前的所述培养是在组合物(例如，细胞培养基)中，该组合物包含例如本文所述的干细胞扩增剂，例如化合物4，例如浓度为约0.25uM至约1uM的化合物4、例如浓度为约0.75-0.5微摩尔的化合物4。在实施例中，在使细胞与例如本文所述的CRISPR系统接触的步骤之后，将细胞例如在细胞培养基中离体培养不超过约1天的时间段，例如不超过约18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、或1小时，该细胞培养基包含例如本文所述的干细胞扩增剂，例如化合物4，例如浓度为约0.25uM至约1uM的化合物4、例如浓度为约0.75-0.5微摩尔的化合物4。在其他实施例中，在使细胞与例如本文所述的CRISPR系统接触的步骤之后，将细胞在细胞培养基中离体培养约1小时至约15天的时间段，例如约12小时至约10天的时间段、例如约1天至约10天的时间段、例如约1天至约5天的时间段、例如约1天至约4天的时间段、例如约2天至约4天的时间段、例如约2天、约3天或约4天的时间段，例如，该细胞培养基包含例如本文所述的干细胞扩增剂，例如化合物4，例如浓度为约0.25uM至约1uM的化合物4、例如浓度为约0.75-0.5微摩尔的化合物4。在实施例中，将细胞离体培养(例如，在所述接触步骤之前培养和/或在所述接触步骤之后培养)约1小时至约20天的时间段，例如约6-12天的时间段，例如约6天、约7天、约8天、约9天、约10天、约11天或约12天的时间段。

在实施例中，包含返回到哺乳动物中的经修饰的HSPC的细胞群包含每kg至少约1百万个细胞(例如，至少约1百万个CD34+细胞)。在实施例中，包含返回到哺乳动物中的经修饰的HSPC的细胞群包含每kg至少约2百万个细胞(例如，至少约2百万个CD34+细胞)。在实施例中，包含返回到哺乳动物中的经修饰的HSPC的细胞群包含每kg至少约3百万个细胞(例如，至少约3百万个CD34+细胞)。在实施例中，包含返回到哺乳动物中的经修饰的HSPC的细胞群包含每kg至少约4百万个细胞(例如，至少约4百万个CD34+细胞)。在实施例中，包含返回到哺乳动物中的经修饰的HSPC的细胞群包含每kg至少约5百万个细胞(例如，至少约5百万个CD34+细胞)。在实施例中，包含返回到哺乳动物中的经修饰的HSPC的细胞群包含每kg至少约6百万个细胞(例如，至少约6百万个CD34+细胞)。在实施例中，包含返回到哺乳动物中的经修饰的HSPC的细胞群包含每kg至少1百万个细胞(例如，至少1百万个CD34+细胞)。在实施例中，包含返回到哺乳动物中的经修饰的HSPC的细胞群包含每kg至少2百万个细胞(例如，至少2百万个CD34+细胞)。在实施例中，包含返回到哺乳动物中的经修饰的HSPC的细胞群包含每kg至少3百万个细胞(例如，至少3百万个CD34+细胞)。在实施例中，包含返回到哺乳动物中的经修饰的HSPC的细胞群包含每kg至少4百万个细胞(例如，至少4百万个CD34+细胞)。在实施例中，包含返回到哺乳动物中的经修饰的HSPC的细胞群包含每kg至少5百万个细胞(例如，至少5百万个CD34+细胞)。在实施例中，包含返回到哺乳动物中的经修饰的HSPC的细胞群包含每kg至少6百万个细胞(例如，至少6百万个CD34+细胞)。在实施例中，包含返回到哺乳动物中的经修饰的HSPC的细胞群包含每kg约1百万个细胞(例如，约1百万个CD34+细胞)。在实施例中，包含返回到哺乳动物中的经修饰的HSPC的细胞群包含每kg约2百万个细胞(例如，约2百万个CD34+细胞)。在实施例中，包含返回到哺乳动物中的经修饰的HSPC的细胞群包含每kg约3百万个细胞(例如，约3百万个CD34+细胞)。在实施例中，包含返回到哺乳动物中的经修饰的HSPC的细胞群包含每kg约4百万个细胞(例如，约4百万个CD34+细胞)。在实施例中，包含返回到哺乳动物中的经修饰的HSPC的细胞群包含每kg约5百万个细胞(例如，约5百万个CD34+细胞)。在实施例中，包含返回到哺乳动物中的经修饰的HSPC的细胞群包含每kg约6百万个细胞(例如，约6百万个CD34+细胞)。在实施例中，包含返回到哺乳动物中的经修饰的HSPC的细胞群包含约2x 10⁶个细胞/每kg患者体重。在实施例中，包含返回到哺乳动物中的经修饰的HSPC的细胞群包含至少2x 10⁶个细胞/每kg患者体重。

在实施例中，任何上述方法导致患者具有至少80％的其循环的CD34+细胞，例如在将细胞重新引入哺乳动物中后如至少15天，例如至少20天、至少30天、至少40天、至少50天或至少60天所测量的，这些循环的CD34+细胞包含在与该方法中使用的gRNA分子的靶向结构域互补的基因组位点处或其附近的插入/缺失。

在实施例中，任何上述方法导致患者具有至少20％的其骨髓CD34+细胞，例如在将细胞重新引入哺乳动物中后如至少15天，例如至少20天、至少30天、至少40天、至少50天或至少60天所测量的，这些骨髓CD34+细胞包含在与该方法中使用的gRNA分子的靶向结构域互补的基因组位点处或其附近的插入/缺失。

在实施例中，重新引入哺乳动物中的HSPC能够在体内分化成类红细胞谱系细胞，例如红细胞，并且所述分化的细胞表现出增加的胎儿血红蛋白水平，例如，产生每个细胞至少6皮克的胎儿血红蛋白，例如，每个细胞至少7皮克的胎儿血红蛋白，每个细胞至少8皮克的胎儿血红蛋白，每个细胞至少9皮克的胎儿血红蛋白，每个细胞至少10皮克的胎儿血红蛋白，例如每个细胞约9至约10皮克之间的胎儿血红蛋白，例如使得哺乳动物的血红蛋白病被治疗。

应当理解，当细胞被表征为具有增加的胎儿血红蛋白时，其包括其中该细胞的子代(例如分化的子代)表现出增加的胎儿血红蛋白的实施例。例如，在本文所述的方法中，经改变或经修饰的CD34+细胞(或细胞群)可能不表达增加的胎儿血红蛋白，但当分化成类红细胞谱系细胞(例如红细胞)时，细胞表达增加的胎儿血红蛋白，例如在类似条件下相对于未经修饰或未经改变的细胞增加的胎儿血红蛋白。

XII.培养方法和制备细胞的方法

本披露提供了培养细胞(例如HSPC，例如造血干细胞，例如用本文所述的gRNA分子修饰或待经修饰的CD34+细胞)的方法。

DNA修复途径抑制剂

不受理论束缚，据信由给定gRNA分子在特定靶序列处产生的插入/缺失模式是细胞内每种活性DNA修复机制(例如，非同源末端连接、微同源介导的末端连接等)的产物。不受理论束缚，据信通过使待编辑的细胞与不产生所需插入/缺失的DNA修复途径的抑制剂接触，可以选择或富集特别有利的插入/缺失。因此，本发明的gRNA分子、CRISPR系统、方法和其他方面可以与此类抑制剂组合进行。此类抑制剂的实例包括例如在WO 2014/130955中所述的抑制剂，将其内容通过引用以其全文特此并入。在实施例中，抑制剂是DNAPKc抑制剂，例如NU7441。

干细胞扩增剂

在一方面，本发明涉及用一种或多种试剂培养细胞，例如HSPC，例如用本文所述的gRNA分子修饰或待经修饰的CD34+细胞，该一种或多种试剂导致相对于未用该试剂处理的细胞扩增速率增加、扩增水平增加、或移植增加。此类试剂在本文中称为干细胞扩增剂。

在一方面，导致相对于未用试剂(例如干细胞扩增剂)处理的细胞扩增速率增加或扩增水平增加的一种或多种试剂包含作为芳烃受体(AHR)途径的抑制剂的试剂。在一些方面，干细胞扩增剂是WO 2013/110198中披露的化合物或WO 2010/059401中披露的化合物，将其内容通过引用以其全文而并入。

在一方面，导致相对于未用试剂处理的细胞扩增速率增加或扩增水平增加的一种或多种试剂是嘧啶并[4,5-b]吲哚衍生物，例如，如WO 2013/110198中所披露的，将其内容通过引用以其全文特此并入。在一个实施例中，试剂是化合物1((1r,4r)-N¹-(2-苄基-7-(2-甲基-2H-四唑-5-基)-9H-嘧啶并[4,5-b]吲哚-4-基)环己烷-1,4-二胺)：

化合物1

在另一方面，试剂是化合物2(4-(3-哌啶-1-基丙基氨基)-9H-嘧啶并[4,5-b]吲哚-7-甲酸甲酯)：

化合物2：

在另一方面，导致相对于未用试剂处理的细胞扩增速率增加或扩增水平增加的一种或多种试剂是WO 2010/059401中披露的试剂，将其内容通过引用以其全文特此并入。

在一个实施例中，干细胞扩增剂是4-(2-(2-(苯并[b]噻吩-3-基)-9-异丙基-9H-嘌呤-6-基氨基)乙基)苯酚，即是来自WO 2010/059401中的实例1的化合物，其具有以下结构：

化合物3：

在另一方面，干细胞扩增剂是化合物4((S)-2-(6-(2-(1H-吲哚-3-基)乙基氨基)-2-(5-氟吡啶-3-基)-9H-嘌呤-9-基)丙-l-醇，即是根据WO 2010/059401的化合物157S，其具有以下结构：

化合物4：

在实施例中，在将CRISPR系统(例如，本发明的gRNA分子和/或Cas9分子)引入所述HSPC中之前，使HSPC群与干细胞扩增剂(例如化合物1、化合物2、化合物3、化合物4或其组合(例如化合物1和化合物4的组合)接触。在实施例中，在将CRISPR系统(例如，本发明的gRNA分子和/或Cas9分子)引入所述HSPC中之后，使HSPC群与干细胞扩增剂(例如化合物1、化合物2、化合物3、化合物4或其组合(例如化合物1和化合物4的组合)接触。在实施例中，在将CRISPR系统(例如，本发明的gRNA分子和/或Cas9分子)引入所述HSPC中之前和之后，均使HSPC群与干细胞扩增剂(例如化合物1、化合物2、化合物3、化合物4或其组合(例如化合物1和化合物4的组合)接触。

在实施例中，干细胞扩增剂以有效量存在以增加HSPC的扩增水平，相对于在相同培养基中但不存在干细胞扩增剂情况下的HSPC。在实施例中，干细胞扩增剂以范围从约0.01至约10uM，例如从约0.1uM至约1uM的浓度存在。在实施例中，干细胞扩增剂以约1uM、约950nM、约900nM、约850nM、约800nM、约750nM、约700nM、约650nM、约600nM、约550nM、约500nM、约450nM、约400nM、约350nM、约300nM、约250nM、约200nM、约150nM、约100nM、约50nM、约25nM、或约10nM的浓度存在于细胞培养基中。在实施例中，干细胞扩增剂以范围从约500nM至约750nM的浓度存在。

在实施例中，干细胞扩增剂是化合物4，其以范围从约0.01至约10微摩尔(uM)的浓度存在于细胞培养基中。在实施例中，干细胞扩增剂是化合物4，其以范围从约0.1至约1微摩尔(uM)的浓度存在于细胞培养基中。在实施例中，干细胞扩增剂是化合物4，其以约0.75微摩尔(uM)的浓度存在于细胞培养基中。在实施例中，干细胞扩增剂是化合物4，其以约0.5微摩尔(uM)的浓度存在于细胞培养基中。在任何前述的实施例中，细胞培养基另外包含化合物1。

在实施例中，干细胞扩增剂是化合物1和化合物4的混合物。

在实施例中，使本发明的细胞与一种或多种干细胞扩增剂分子接触足够的时间并且以足够的量接触，以引起CD34+细胞扩增2至10,000倍，例如CD34+细胞扩增2-1000倍、例如CD34+细胞扩增2-100倍、例如CD34+细胞扩增20-200倍。如本文所述，与一种或多种干细胞扩增剂的接触可以在细胞与例如如本文所述的CRISPR系统接触之前，在细胞与例如如本文所述的CRISPR系统接触之后，或其组合。在一个实施例中，使细胞与一种或多种干细胞扩增剂分子(例如化合物4)接触足够的时间并且以足够的量接触，以引起CD34+细胞扩增至少2倍，例如在靶位点处或其附近包含插入/缺失的CD34+细胞，该靶位点与引入所述细胞中的CRISPR/Cas9系统的gRNA的靶向结构域具有互补性。在一个实施例中，使细胞与一种或多种干细胞扩增剂分子(例如化合物4)接触足够的时间并且以足够的量接触，以引起CD34+细胞扩增至少4倍，例如在靶位点处或其附近包含插入/缺失的CD34+细胞，该靶位点与引入所述细胞中的CRISPR/Cas9系统的gRNA的靶向结构域具有互补性。在一个实施例中，使细胞与一种或多种干细胞扩增剂分子(例如化合物4)接触足够的时间并且以足够的量接触，以引起CD34+细胞扩增至少5倍，例如在靶位点处或其附近包含插入/缺失的CD34+细胞，该靶位点与引入所述细胞中的CRISPR/Cas9系统的gRNA的靶向结构域具有互补性。在一个实施例中，使细胞与一种或多种干细胞扩增剂分子接触足够的时间并且以足够的量接触，以引起CD34+细胞扩增至少10倍。在一个实施例中，使细胞与一种或多种干细胞扩增剂分子接触足够的时间并且以足够的量接触，以引起CD34+细胞扩增至少20倍。在一个实施例中，使细胞与一种或多种干细胞扩增剂分子接触足够的时间并且以足够的量接触，以引起CD34+细胞扩增至少30倍。在一个实施例中，使细胞与一种或多种干细胞扩增剂分子接触足够的时间并且以足够的量接触，以引起CD34+细胞扩增至少40倍。在一个实施例中，使细胞与一种或多种干细胞扩增剂分子接触足够的时间并且以足够的量接触，以引起CD34+细胞扩增至少50倍。在一个实施例中，使细胞与一种或多种干细胞扩增剂分子接触足够的时间并且以足够的量接触，以引起CD34+细胞扩增至少60倍。在实施例中，使细胞与一种或多种干细胞扩增剂接触约1-60天的时间段，例如约1-50天、例如约1-40天、例如约1-30天、例如约1-20天、例如约1-10天、例如约7天、例如约1-5天、例如约2-5天、例如约2-4天、例如约2天、或例如约4天。

在实施例中，在使细胞与例如本文所述的CRISPR系统接触的步骤之前，将细胞(例如HSPC，例如如本文所述)离体培养约1小时至约10天的时间段，例如约12小时至约5天的时间段、例如约12小时至4天的时间段、例如约1天至约4天的时间段、例如约1天至约2天的时间段、例如约1天的时间段或约2天的时间段。在实施例中，所述接触步骤之前的所述培养是在组合物(例如，细胞培养基)中，该组合物包含例如本文所述的干细胞扩增剂，例如化合物4，例如浓度为约0.25uM至约1uM的化合物4、例如浓度为约0.75-0.5微摩尔的化合物4。在实施例中，在使细胞与例如本文所述的CRISPR系统接触的步骤之后，将细胞例如在细胞培养基中离体培养不超过约1天的时间段，例如不超过约18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2、或1小时，该细胞培养基包含例如本文所述的干细胞扩增剂，例如化合物4，例如浓度为约0.25uM至约1uM的化合物4、例如浓度为约0.75-0.5微摩尔的化合物4。在其他实施例中，在使细胞与例如本文所述的CRISPR系统接触的步骤之后，将细胞在细胞培养基中离体培养约1小时至约14天的时间段，例如约12小时至约10天的时间段、例如约1天至约10天的时间段、例如约1天至约5天的时间段、例如约1天至约4天的时间段、例如约2天至约4天的时间段、例如约2天、约3天或约4天的时间段，例如，该细胞培养基包含例如本文所述的干细胞扩增剂，例如化合物4，例如浓度为约0.25uM至约1uM的化合物4、例如浓度为约0.75-0.5微摩尔的化合物4。

在实施例中，细胞培养基是化学成分确定的培养基。在实施例中，细胞培养基可以另外含有例如StemSpan SFEM(干细胞技术公司(StemCell Technologies)；目录号09650)。在实施例中，细胞培养基可以替代地或另外地含有例如HSC Brew GMP(美天旎公司(Miltenyi))。在实施例中，培养基可以补充有促血小板生成素(TPO)、人Flt3配体(Flt-3L)、人干细胞因子(SCF)、人白细胞介素-6、L-谷氨酰胺、和/或青霉素/链霉素。在实施例中，培养基补充有促血小板生成素(TPO)、人Flt3配体(Flt-3L)、人干细胞因子(SCF)、人白细胞介素-6和L-谷氨酰胺。在其他实施例中，培养基补充有促血小板生成素(TPO)、人Flt3配体(Flt-3L)、人干细胞因子(SCF)和人白细胞介素-6。在其他实施例中，培养基补充有促血小板生成素(TPO)、人Flt3配体(Flt-3L)和人干细胞因子(SCF)，但不补充人白细胞介素-6。当存在于培养基中时，促血小板生成素(TPO)、人Flt3配体(Flt-3L)、人干细胞因子(SCF)、人白细胞介素-6和/或L-谷氨酰胺各自以范围从约1ng/mL至约1000ng/mL的浓度，例如范围从约10ng/mL至约500ng/mL的浓度、例如范围从约10ng/mL至约100ng/mL的浓度、例如范围从约25ng/mL至约75ng/mL的浓度、例如约50ng/mL的浓度存在。在实施例中，每种补充的组分的浓度相同。在其他实施例中，每种补充的组分的浓度不同。在一个实施例中，培养基包含StemSpan SFEM(干细胞技术公司；目录号09650)、50ng/mL的促血小板生成素(Tpo)、50ng/mL的人Flt3配体(Flt-3L)、50ng/mL的人干细胞因子(SCF)、以及50ng/mL的人白细胞介素-6(IL-6)。在一个实施例中，培养基包含StemSpan SFEM(干细胞技术公司；目录号09650)、50ng/mL的促血小板生成素(Tpo)、50ng/mL的人Flt3配体(Flt-3L)、以及50ng/mL的人干细胞因子(SCF)，并且不包含IL-6。在实施例中，培养基进一步包含干细胞扩增剂，例如化合物4，例如浓度为0.75μM的化合物4。在实施例中，培养基进一步包含干细胞扩增剂，例如化合物4，例如浓度为0.5μM的化合物4。在实施例中，培养基进一步包含1％L-谷氨酰胺和2％青霉素/链霉素。在实施例中，细胞培养基不含血清。

XII.组合疗法

本披露预期了本文所述的gRNA分子、或用本文所述的gRNA分子经修饰的细胞(例如造血干细胞，例如CD34+细胞)与一种或多种其他治疗方式和/或药剂的组合的用途。因此，除了使用gRNA分子或用本文所述的gRNA分子经修饰的细胞之外，还可以向受试者施用一种或多种用于治疗血红蛋白病的“标准”疗法。

用于治疗血红蛋白病的一种或多种另外的疗法可以包括例如另外的干细胞移植，例如造血干细胞移植。干细胞移植可以是同种异体的或自体的。

用于治疗血红蛋白病的一种或多种另外的疗法可以包括例如输血和/或铁螯合(例如去除)疗法。已知的铁螯合剂包括例如去铁胺和地拉罗司。

用于治疗血红蛋白病的一种或多种另外的疗法可以包括例如叶酸补充剂或羟基脲(例如5-羟基脲)。用于治疗血红蛋白病的一种或多种另外的疗法可以是羟基脲。在实施例中，羟基脲能以例如每天10mg/kg-35mg/kg，例如每天10mg/kg-20mg/kg的剂量施用。在实施例中，羟基脲能以每天10mg/kg的剂量施用。在实施例中，羟基脲能以每天10mg/kg的剂量施用。在实施例中，羟基脲能以每天20mg/kg的剂量施用。在实施例中，羟基脲在本发明的细胞(或细胞群)(例如CD34+细胞(或细胞群))之前和/或之后施用，例如如本文所述。

一种或多种另外的治疗剂可以包括例如抗p-选择素抗体，例如SelG1(Selexys公司)。p-选择素抗体描述于例如PCT公开WO 1993/021956、PCT公开WO 1995/034324、PCT公开WO 2005/100402、PCT公开WO 2008/069999、美国专利申请公开US 2011/0293617、美国专利号5800815、美国专利号6667036、美国专利号8945565、美国专利号8377440以及美国专利号9068001中，将其各自内容以其全文并入本文。

一种或多种另外的药剂可以包括例如上调胎儿血红蛋白的小分子。此类分子的实例包括TN1(例如，如Nam,T.等人,ChemMedChem[药物化学]2011,6,777-780,DOI:10.1002/cmdc.201000505所述，通过引用并入本文)。

一种或多种另外的疗法还可以包括辐射或本领域已知的其他骨髓消融疗法。这种疗法的一个实例是白消安。可以在将本发明的细胞引入受试者中之前进行这种另外的治疗。在一个实施例中，本文所述的治疗方法(例如，包括施用通过本文所述的方法修饰(例如用本文所述的CRISPR系统修饰，例如以增加HbF产生)的细胞(例如HSPC)的治疗方法)，该方法不包括骨髓消融步骤。在实施例中，这些方法包括部分骨髓消融步骤。

本文所述的疗法(例如，包括施用HSPC(例如使用本文所述的CRISPR系统经修饰的HSPC)群)也可以与另外的治疗剂组合。在一个实施例中，另外的治疗剂是HDAC抑制剂，例如帕比司他。在一个实施例中，另外的治疗剂是PCT公开号WO 2014/150256中所述的化合物，例如WO 2014/150256的表1中所述的化合物，例如GBT440。HDAC抑制剂的其他实例包括例如辛二酰苯胺异羟肟酸(SAHA)。一种或多种另外的药剂可以包括例如DNA甲基化抑制剂。已经显示此类药剂增加具有降低的BCL11a活性的细胞中的HbF诱导(例如，Jian Xu等人,Science[科学]334,993(2011)；DOI:0.1126/science.1211053，通过引用并入本文)。其他HDAC抑制剂包括本领域已知的任何HDAC抑制剂，例如曲古抑菌素A、HC毒素、DACI-2、FK228、DACI-14、depudicin、DACI-16、tubacin、NK57、MAZ1536、NK125、Scriptaid、Pyroxamide、MS-275、ITF-2357、MCG-D0103、CRA-024781、CI-994和LBH589(参见例如，Bradner JE等人,PNAS[美国国家科学院院刊],2010(第107卷:28),12617-12622，通过引用以其全文并入本文)。

本文所述的gRNA分子、或用本文所述的gRNA分子经修饰的细胞(例如造血干细胞，例如CD34+细胞)以及共治疗剂或共同疗法可以在相同的制剂中或分开地施用。在分开施用的情况下，本文所述的gRNA分子或用本文所述的gRNA分子经修饰的细胞可以在共治疗剂或共同疗法之前、之后或同时施用。一种药剂可以在另一药剂之前或之后以数分钟至数周范围的间隔施用。在将两种或更多种不同种类的治疗剂分开施用于受试者的实施例中，通常将确保在每次递送的时间之间没有超过显著的时间段，使得这些不同种类的药剂将仍能够对靶组织或细胞发挥有利的组合作用。

XIII.经修饰的核苷、核苷酸和核酸

经修饰的核苷和经修饰的核苷酸可以存在于核酸中，例如特别是gRNA，但也可以存在于其他形式的RNA中，例如mRNA、RNAi或siRNA。如本文所述，“核苷”定义为含有五碳糖分子(戊糖或核糖)或其衍生物和有机碱(嘌呤或嘧啶)或其衍生物的化合物。如本文所述，“核苷酸”定义为进一步包含磷酸基团的核苷。

经修饰的核苷和核苷酸可以包含以下一种或多种：

(i)改变(例如替代)磷酸二酯主链连接中的一个或两个非连接磷酸氧和/或一个或多个连接磷酸氧；

(ii)改变(例如替代)核糖的成分，例如核糖上的2'羟基；

(iii)用“去磷酸”接头大规模替代磷酸部分；

(iv)修饰或替代天然存在的核碱基，包括用非标准核碱基；

(v)替代或修饰核糖-磷酸主链；

(vi)修饰寡核苷酸的3'端或5'端，例如去除、修饰或替代末端磷酸基团或部分、帽或接头的缀合；和

(vii)修饰或替代糖。

可以组合以上列出的修饰以提供可以具有两种、三种、四种或更多种经修饰的经修饰的核苷和核苷酸。例如，经修饰的核苷或核苷酸可以具有经修饰的糖和经修饰的核碱基。在一个实施例中，gRNA的每个碱基被修饰，例如所有碱基都具有经修饰的磷酸基团，例如所有碱基都是硫代磷酸酯基团。在一个实施例中，单分子或模块化gRNA分子的全部或基本上全部的磷酸基团被硫代磷酸酯基团替代。在实施例中，gRNA的五个3'末端碱基中的一个或多个和/或五个5'末端碱基中的一个或多个被硫代磷酸酯基团修饰。

在一个实施例中，经修饰的核苷酸(例如具有如本文所述的经修饰的核苷酸)可以掺入核酸(例如“经修饰的核酸”)中。在一些实施例中，经修饰的核酸包含一个、两个、三个或更多个经修饰的核苷酸。在一些实施例中，经修饰的核酸中的至少5％(例如，至少约5％、至少约10％、至少约15％、至少约20％、至少约25％、至少约30％、至少约35％、至少约40％、至少约45％、至少约50％、至少约55％、至少约60％、至少约65％、至少约70％、至少约75％、至少约80％、至少约85％、至少约90％、至少约95％、或约100％)的位置是经修饰的核苷酸。

未经修饰的核酸可能易于被例如细胞核酸酶降解。例如，核酸酶可以水解核酸磷酸二酯键。因此，在一方面，本文所述的经修饰的核酸可以含有一个或多个经修饰的核苷或核苷酸，例如以引入对核酸酶的稳定性。

在一些实施例中，当在体内和离体地引入细胞群中时，本文所述的经修饰的核苷、经修饰的核苷酸和经修饰的核酸可以表现出降低的先天性免疫应答。术语“先天性免疫应答”包括对外源核酸(包括通常为病毒或细菌来源的单链核酸)的细胞应答，其涉及诱导细胞因子(特别是干扰素)表达和释放、以及细胞死亡。在一些实施例中，本文所述的经修饰的核苷、经修饰的核苷酸和经修饰的核酸可以破坏大沟相互作用配偶体与核酸的结合。在一些实施例中，当在体内和离体地引入细胞群中时，本文所述的经修饰的核苷、经修饰的核苷酸和经修饰的核酸可以表现出降低的先天性免疫应答，并且还破坏大沟相互作用配偶体与核酸的结合。

化学基团的定义

如本文所用，“烷基”意在指直链或支链的饱和烃基。示例性烷基基团包括甲基(Me)、乙基(Et)、丙基(例如正丙基和异丙基)、丁基(例如正丁基、异丁基、叔丁基)、戊基(例如正戊基、异戊基、新戊基)等。烷基基团可以含有从1至约20、从2至约20、从1至约12、从1至约8、从1至约6、从1至约4、或从1至约3个碳原子。

如本文所用，“芳基”是指单环或多环(例如，具有2、3或4个稠环)芳族烃，例如像苯基、萘基、蒽基、

菲基、茚满基、茚基等。在一些实施例中，芳基基团具有从6至约20个碳原子。

如本文所用，“烯基”是指含有至少一个双键的脂肪族基团。如本文所用，“炔基”是指含有2-12个碳原子并且其特征在于具有一个或多个三键的直链或支链烃链。炔基基团的实例包括但不限于乙炔基、炔丙基和3-己炔基。

如本文所用，“芳基烷基”或“芳烷基”是指烷基氢原子被芳基基团替代的烷基部分。芳烷基包括多于一个氢原子已经被芳基基团替代的基团。“芳基烷基”或“芳烷基”的实例包括苄基、2-苯基乙基、3-苯基丙基、9-芴基、二苯甲基和三苯甲基基团。

如本文所用，“环烷基”是指具有3至12个碳的环状、二环、三环或多环非芳族烃基团。环烷基部分的实例包括但不限于环丙基、环戊基和环己基。

如本文所用，“杂环基”是指杂环系统的一价基团。代表性的杂环基包括但不限于四氢呋喃基、四氢噻吩基、吡咯烷基、吡咯烷酮基、哌啶基、吡咯啉基、哌嗪基、二噁烷基、二氧戊环基、二氮杂卓基、氧氮杂卓基、硫杂卓基和吗啉基。

如本文所用，“杂芳基”是指杂芳族环系统的一价基团。杂芳基部分的实例包括但不限于咪唑基、噁唑基、噻唑基、三唑基、吡咯基、呋喃基、吲哚基、苯硫基、吡唑基、吡啶基、吡嗪基、哒嗪基、嘧啶基、吲嗪基、嘌呤基、萘啶基、喹啉基和蝶啶基。

磷酸主链修饰

磷酸基团

在一些实施例中，经修饰的核苷酸的磷酸基团可以通过用不同的取代基替代一个或多个氧来修饰。此外，经修饰的核苷酸(例如经修饰的核酸中存在的经修饰的核苷酸)可以包含用如本文所述的经修饰的磷酸大规模替代未经修饰的磷酸部分。在一些实施例中，磷酸主链的修饰可以包括产生不带电荷的接头或具有不对称电荷分布的带电荷的接头的改变。

经修饰的磷酸基团的实例包括硫代磷酸酯、硒代磷酸酯(phosphoroselenate)、硼酸磷酸酯(borano phosphate)、硼酸磷酸酯(borano phosphate ester)、氢膦酸酯、氨基磷酸酯、烷基或芳基膦酸酯以及磷酸三酯。在一些实施例中，磷酸主链部分中的非桥接磷酸氧原子之一可以被以下任何基团替代：硫(S)、硒(Se)、BR₃(其中R可以是例如氢、烷基或芳基)、C(例如烷基基团、芳基基团等)、H、NR₂(其中R可以是例如氢、烷基或芳基)、或OR(其中R可以是例如烷基或芳基)。未经修饰的磷酸基团中的磷原子是非手性的。然而，用以上原子或原子团中的一个替代一个非桥接氧可以使磷原子变得具手性；也就是说，以这种方式经修饰的磷酸基团中的磷原子是立构中心。立构磷原子可以具有“R”构型(本文中为Rp)或“S”构型(本文中为Sp)。

二硫代磷酸酯的两个非桥接氧被硫替代。二硫代磷酸酯中的磷中心是非手性的，其阻止了寡核糖核苷酸非对映异构体的形成。在一些实施例中，对一个或两个非桥接氧的修饰还可以包括用独立地选自S、Se、B、C、H、N和OR(R可以是例如烷基或芳基)的基团替代非桥接氧。

磷酸接头也可以通过用氮(桥接氨基磷酸酯)、硫(桥接硫代磷酸酯)和碳(桥接亚甲基膦酸酯)替代桥接氧(即，连接磷酸与核苷的氧)来修饰。替代可以在任一连接氧或两个连接氧处发生。

磷酸基团的替代

磷酸基团可以被不含磷的连接体替代。在一些实施例中，带电荷的磷酸基团可以被中性部分替代。

可以替代磷酸基团的部分的实例可以包括但不限于例如甲基膦酸酯、羟基氨基、硅氧烷、碳酸酯、羧甲基、氨基甲酸酯、酰胺、硫醚、环氧乙烷接头、磺酸酯、磺酰胺、硫代甲缩醛、甲缩醛、肟、亚甲基亚氨基、亚甲基甲基亚氨基、亚甲基亚肼基、亚甲基二甲基亚肼基和亚甲基氧基甲基亚氨基。

核糖磷酸主链的替代

还可以构建能模拟核酸的支架，其中磷酸接头和核糖被核酸酶抗性核苷或核苷酸替代物替代。在一些实施例中，核碱基可以被替代物主链拴系。实例可以包括但不限于吗啉代、环丁基、吡咯烷和肽核酸(PNA)核苷替代物。

糖修饰

经修饰的核苷和经修饰的核苷酸可以包含对糖基的一种或多种修饰。例如，2'羟基基团(OH)可以被许多不同的“氧基”或“脱氧”取代基修饰或替代。在一些实施例中，对2'羟基基团的修饰可以增强核酸的稳定性，因为羟基不再能被去质子化以形成2'-醇盐离子。2'-醇盐可以通过对接头磷原子的分子内亲核攻击来催化降解。

“氧基”-2'羟基基团经修饰的实例可以包括烷氧基或芳氧基(OR，其中“R”可以是例如烷基、环烷基、芳基、芳烷基、杂芳基或糖)；聚乙二醇(PEG)、0(CH₂CH₂0)_nCH2CH₂OR(其中R可以是例如H或任选地取代的烷基，并且n可以是从0至20(例如，从0至4、从0至8、从0至10、从0至16、从1至4、从1至8、从1至10、从1至16、从1至20、从2至4、从2至8、从2至10、从2至16、从2至20、从4至8、从4至10、从4至16、以及从4至20)的整数)。在一些实施例中，“氧基”-2'羟基基团修饰可以包括“锁”核酸(LNA)，其中2'羟基可以例如通过Ci-₆亚烷基或Cj-6亚杂烷基桥连接至相同核糖的4'碳，其中示例性桥可以包括亚甲基、亚丙基、醚或氨基桥；O-氨基(其中氨基可以是例如NH₂；烷基氨基、二烷基氨基、杂环基、芳基氨基、二芳基氨基、杂芳基氨基或二杂芳基氨基、乙二胺或多氨基)和氨基烷氧基、0(CH₂)_n-氨基(其中氨基可以是例如NH₂；烷基氨基、二烷基氨基、杂环基、芳基氨基、二芳基氨基、杂芳基氨基或二杂芳基氨基、乙二胺或多氨基)。在一些实施例中，“氧基”-2'羟基基团修饰可以包括甲氧基乙基基团(MOE)(OCH₂CH₂OCH₃，例如PEG衍生物)。

“脱氧”修饰可以包括氢(即脱氧核糖，例如在部分ds RNA的突出部分)；卤素(例如，溴、氯、氟或碘)；氨基(其中氨基可以是例如NH₂；烷基氨基、二烷基氨基、杂环基、芳基氨基、二芳基氨基、杂芳基氨基、二杂芳基氨基或氨基酸)；NH(CH₂CH₂NH)_nCH2CH₂-氨基(其中氨基可以是例如如本文所述的)、-NHC(0)R(其中R可以是例如烷基、环烷基、芳基、芳烷基、杂芳基或糖)、氰基；巯基；烷基-硫代-烷基；硫代烷氧基；以及烷基、环烷基、芳基、烯基和炔基，其可以任选地被例如如本文所述的氨基取代。

糖基还可以含有一个或多个如下碳，这些碳具有与核糖中相应碳相反的立体化学构型。因此，经修饰的核酸可以包含含有例如阿拉伯糖(作为糖)的核苷酸。核苷酸“单体”可以在糖上的Γ位具有α键，例如α-核苷。经修饰的核酸还可以包含“脱碱基”糖，其在C-处缺乏核碱基。这些脱碱基糖还可以在一个或多个组成性糖原子上被进一步修饰。经修饰的核酸还可以包含一种或多种L形式的糖，例如L-核苷。

通常，RNA包含糖基核糖，其是具有氧的5元环。示例性的经修饰的核苷和经修饰的核苷酸可以包括但不限于核糖中的氧的替代(例如，用硫(S)、硒(Se)或亚烷基，例如像亚甲基或亚乙基)；双键的添加(例如，以用环戊烯基或环己烯基替代核糖)；核糖的环收缩(例如，以形成环丁烷或氧杂环丁烷的4元环)；核糖的环扩展(例如，以形成具有另外的碳或杂原子的6元或7元环，例如像还具有氨基磷酸酯主链的脱水己糖醇、阿卓糖醇、甘露醇、环己基、环己烯基以及吗啉代)。在一些实施例中，经修饰的核苷酸可以包括多环形式(例如，三环)；和“解锁”形式，如二醇核酸(GNA)(例如，R-GNA或S-GNA，其中核糖被连接到磷酸二酯键的二醇单元替代)、苏阿糖核酸(TNA，其中核糖被a-L-苏阿呋喃糖基-(3'-→2')替代)。

对核碱基的修饰

可以掺入经修饰的核酸中的本文所述的经修饰的核苷和经修饰的核苷酸可以包含经修饰的核碱基。核碱基的实例包括但不限于腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)和尿嘧啶(U)。这些核碱基可以被修饰或完全替代以提供可以掺入经修饰的核酸中的经修饰的核苷和经修饰的核苷酸。核苷酸的核碱基可以独立地选自嘌呤、嘧啶、嘌呤或嘧啶类似物。在一些实施例中，核碱基可以包括例如碱基的天然存在的和合成的衍生物。

尿嘧啶

在一些实施例中，经修饰的核碱基是经修饰的尿嘧啶。具有经修饰的尿嘧啶的示例性核碱基和核苷包括但不限于假尿苷(ψ)、吡啶-4-酮核糖核苷、5-氮杂-尿苷、6-氮杂-尿苷、2-硫代-5-氮杂-尿苷、2-硫代-尿苷(s2U)、4-硫代-尿苷(s4U)、4-硫代-假尿苷、2-硫代-假尿苷、5-羟基-尿苷(ho⁵U)、5-氨基烯丙基-尿苷、5-卤代-尿苷(例如5-碘-尿苷或5-溴-尿苷)、3-甲基-尿苷(m³U)、5-甲氧基-尿苷(mo⁵U)、尿苷5-氧基乙酸(cmo⁵U)、尿苷5-氧基乙酸甲酯(mcmo^U)、5-羧甲基-尿苷(cm^sU)、1-羧甲基-假尿苷、5-羧基羟基甲基-尿苷(chm⁵U)、5-羧基羟基甲基-尿苷甲酯(mchm⁵U)、5-甲氧基羰基甲基-尿苷(mcm⁵U)、5-甲氧基羰基甲基-2-硫代-尿苷(mcm⁵s2U)、5-氨基甲基-2-硫代-尿苷(nm⁵s2U)、5-甲基氨基甲基-尿苷(mnm⁵U)、5-甲基氨基甲基-2-硫代-尿苷(mnm⁵s2U)、5-甲基氨基甲基-2-硒代-尿苷(mnm⁵se2U)、5-氨甲酰基甲基-尿苷(ncm⁵U)、5-羧甲基氨基甲基-尿苷(cmnm⁵U)、5-羧甲基氨基甲基-2-硫代-尿苷(cmnm\s2U)、5-丙炔基-尿苷、1-丙炔基-假尿苷、5-牛磺酸甲基-尿苷(xcm⁵U)、1-牛磺酸甲基-假尿苷、5-牛磺酸甲基-2-硫代-尿苷(Trn⁵s2U)、1-牛磺酸甲基-4-硫代-假尿苷、5-甲基-尿苷(m⁵U，即，具有核碱基脱氧胸腺嘧啶)、1-甲基-假尿苷(ιτι'ψ)、5-甲基-2-硫代-尿苷(m⁵s2U)、l-甲基-4-硫代-假尿苷(m's\|/)、4-硫代-1-甲基-假尿苷、3-甲基-假尿苷(m'V)、2-硫代-1-甲基-假尿苷、1-甲基-1-脱氮杂-假尿苷、2-硫代-1-甲基-1-脱氮杂-假尿苷、二氢尿苷(D)、二氢假尿苷、5,6-二氢尿苷、5-甲基-二氢尿苷(m⁵D)、2-硫代-二氢尿苷、2-硫代-二氢假尿苷、2-甲氧基-尿苷、2-甲氧基-4-硫代-尿苷、4-甲氧基-假尿苷、4-甲氧基-2-硫代-假尿苷、N1-甲基-假尿苷、3-(3-氨基-3-羧基丙基)尿苷(acp³U)、1-甲基-3-(3-氨基-3-羧基丙基假尿苷、5-(异戊烯基氨基甲基)尿苷(inm⁵U)、5-(异戊烯基氨基甲基])-2-硫代-尿苷(inm⁵s2U)、a-硫代-尿苷、2'-0-甲基-尿苷(Urn)、5,2'-0-二甲基-尿苷(m⁵Um)、2'-0-甲基-假尿苷(ψπι)、2-硫代-2'-0-甲基-尿苷(s2Um)、5-甲氧基羰基甲基-2'-0-甲基-尿苷(mcm ⁵Um)、5-氨甲酰基甲基-2'-0-甲基-尿苷(ncm ⁵Um)、5-羧甲基氨基甲基-2'-0-甲基-尿苷(cmnm ⁵Um)、3,2'-0-二甲基-尿苷(m³Um)、5-(异戊烯基氨基甲基)-2'-0-甲基-尿苷(inm⁵Um)、1-硫代-尿苷、脱氧胸苷、2'-F-阿糖-尿苷、2'-F-尿苷、2'-OH-阿糖-尿苷、5-(2-甲氧羰基乙烯基)尿苷、5-[3-(1-E-丙烯基氨基)尿苷、吡唑并[3,4-d]嘧啶、黄嘌呤、以及次黄嘌呤。

胞嘧啶

在一些实施例中，经修饰的核碱基是经修饰的胞嘧啶。具有经修饰的胞嘧啶的示例性核碱基和核苷包括但不限于5-氮杂-胞苷、6-氮杂-胞苷、假异胞苷、3-甲基-胞苷(m³C)、N4-乙酰基-胞苷(act)、5-甲酰基-胞苷(f⁵C)、N4-甲基-胞苷(m⁴C)、5-甲基-胞苷(m⁵C)、5-卤代-胞苷(例如5-碘-胞苷)、5-羟基甲基-胞苷(hm⁵C)、1-甲基-假异胞苷、吡咯并-胞苷、吡咯并-假异胞苷、2-硫代-胞苷(s2C)、2-硫代-5-甲基-胞苷、4-硫代-假异胞苷、4-硫代-1-甲基-假异胞苷、4-硫代-1-甲基-1-脱氮杂-假异胞苷、1-甲基-1-脱氮杂-假异胞苷、泽布拉恩(zebularine)、5-氮杂-泽布拉恩、5-甲基-泽布拉恩、5-氮杂-2-硫代-泽布拉恩、2-硫代-泽布拉恩、2-甲氧基-胞苷、2-甲氧基-5-甲基-胞苷、4-甲氧基-假异胞苷、4-甲氧基-1-甲基-假异胞苷、赖胞苷(k²C)、a-硫代-胞苷、2'-0-甲基-胞苷(Cm)、5,2'-0-二甲基-胞苷(m⁵Cm)、N4-乙酰基-2'-0-甲基-胞苷(ac⁴Cm)、N4,2'-0-二甲基-胞苷(m⁴Cm)、5-甲酰基-2'-0-甲基-胞苷(f⁵Cm)、N4,N4,2'-0-三甲基-胞苷(m⁴ ₂Cm)、1-硫代-胞苷、2'-F-阿糖-胞苷、2'-F-胞苷、以及2'-OH-阿糖-胞苷。

腺嘌呤

在一些实施例中，经修饰的核碱基是经修饰的腺嘌呤。具有经修饰的腺嘌呤的示例性核碱基和核苷包括但不限于2-氨基-嘌呤、2,6-二氨基嘌呤、2-氨基-6-卤代-嘌呤(例如2-氨基-6-氯-嘌呤)、6-卤代-嘌呤(例如6-氯-嘌呤)、2-氨基-6-甲基-嘌呤、8-叠氮基-腺苷、7-脱氮杂-腺嘌呤、7-脱氮杂-8-氮杂-腺嘌呤、7-脱氮杂-2-氨基-嘌呤、7-脱氮杂-8-氮杂-2-氨基-嘌呤、7-脱氮杂-2,6-二氨基嘌呤、7-脱氮杂-8-氮杂-2,6-二氨基嘌呤、1-甲基-腺苷(m'A)、2-甲基-腺嘌呤(m A)、N6-甲基-腺苷(m⁶A)、2-甲硫基-N6-甲基-腺苷(ms2m⁶A)、N6-异戊烯基-腺苷(i⁶A)、2-甲硫基-N6-异戊烯基-腺苷(ms²i⁶A)、N6-(顺-羟基异戊烯基)腺苷(io⁶A)、2-甲硫基-N6-(顺-羟基异戊烯基)腺苷(ms2io⁶A)、N6-甘氨酰基氨甲酰基-腺苷(g⁶A)、N6-苏氨酰基氨甲酰基-腺苷(t⁶A)、N6-甲基-N6-苏氨酰基氨甲酰基-腺苷(m⁶t⁶A)、2-甲硫基-N6-苏氨酰基氨甲酰基-腺苷(ms²g⁶A)、N6,N6-二甲基-腺苷(m⁶ ₂A)、N6-羟基正缬氨酰基氨甲酰基-腺苷(hn⁶A)、2-甲硫基-N6-羟基正缬氨酰基氨甲酰基-腺苷(ms2hn⁶A)、N6-乙酰基-腺苷(ac⁶A)、7-甲基-腺嘌呤、2-甲硫基-腺嘌呤、2-甲氧基-腺嘌呤、a-硫代-腺苷、2'-0-甲基-腺苷(Am)、N⁶,2'-0-二甲基-腺苷(m⁵Am)、N⁶-甲基-2'-脱氧腺苷、N6,N6,2'-0-三甲基-腺苷(m⁶ ₂Am)、1,2'-0-二甲基-腺苷(m'Am)、2'-0-核糖基腺苷(磷酸)(Ar(p))、2-氨基-N6-甲基-嘌呤、1-硫代-腺苷、8-叠氮基-腺苷、2'-F-阿糖-腺苷、2'-F-腺苷、2'-OH-阿糖-腺苷、以及N6-(19-氨基-五氧杂十九烷基)-腺苷。

鸟嘌呤

在一些实施例中，经修饰的核碱基是经修饰的鸟嘌呤。具有经修饰的鸟嘌呤的示例性核碱基和核苷包括但不限于肌苷(I)、1-甲基-肌苷(m'l)、怀俄苷(imG)、甲基怀俄苷(mimG)、4-脱甲基-怀俄苷(imG-14)、异怀俄苷(imG2)、怀丁苷(yW)、过氧怀丁苷(o₂yW)、羟基怀丁苷(OHyW)、修饰不足的羟基怀丁苷(OHyW*)、7-脱氮杂-鸟苷、辫苷(Q)、环氧辫苷(oQ)、半乳糖基-辫苷(galQ)、甘露糖基-辫苷(manQ)、7-氰基-7-脱氮杂-鸟苷(preQ₀)、7-氨基甲基-7-脱氮杂-鸟苷(preQi)、古嘌苷(G⁺)、7-脱氮杂-8-氮杂-鸟苷、6-硫代-鸟苷、6-硫代-7-脱氮杂-鸟苷、6-硫代-7-脱氮杂-8-氮杂-鸟苷、7-甲基-鸟苷(m⁷G)、6-硫代-7-甲基-鸟苷、7-甲基-肌苷、6-甲氧基-鸟苷、1-甲基-鸟苷(m'G)、N2-甲基-鸟苷(m²G)、N2,N2-二甲基-鸟苷(m² ₂G)、N2,7-二甲基-鸟苷(m²,7G)、N2,N2,7-二甲基-鸟苷(m²,2,7G)、8-氧代-鸟苷、7-甲基-8-氧代-鸟苷、1-甲硫基-鸟苷、N2-甲基-6-硫代-鸟苷、N2,N2-二甲基-6-硫代-鸟苷、a-硫代-鸟苷、2'-0-甲基-鸟苷(Gm)、N2-甲基-2'-0-甲基-鸟苷(m3/4m)、N2,N2-二甲基-2'-0-甲基-鸟苷(m² ₂Gm)、1-甲基-2'-0-甲基-鸟苷(m'Gm)、N2,7-二甲基-2'-0-甲基-鸟苷(m²,7Gm)、2'-0-甲基-肌苷(Im)、l,2'-0-二甲基-肌苷(m'lm)、0⁶-苯基-2'-脱氧肌苷、2'-0-核糖基鸟苷(磷酸)(Gr(p))、1-硫代-鸟苷、0⁶-甲基-鸟苷、0⁶-甲基-2'-脱氧鸟苷、2'-F-阿糖-鸟苷、以及2'-F-鸟苷。

经修饰的gRNA

在一些实施例中，经修饰的核酸可以是经修饰的gRNA。在一些实施例中，gRNA可以在3'端被修饰。在该实施例中，gRNA可以在3'末端U核糖处被修饰。例如，U核糖的两个末端羟基基团可以被氧化成醛基并伴随核糖环的打开以提供经修饰的核苷，其中U可以是未经修饰的或经修饰的尿苷。

在另一个实施例中，3'末端U可以用2'3'环磷酸酯修饰，其中U可以是未经修饰的或经修饰的尿苷。在一些实施例中，gRNA分子可以含有3'核苷酸，其可以被稳定化以对抗降解，例如通过掺入一个或多个本文所述的经修饰的核苷酸。在该实施例中，例如，尿苷可以被经修饰的尿苷(例如5-(2-氨基)丙基尿苷和5-溴尿苷)或被本文所述的任何经修饰的尿苷替代；腺苷和鸟嘌呤可以被经修饰的腺苷和鸟苷(例如在8位处有经修饰的，例如8-溴鸟苷)或被本文所述的任何经修饰的腺苷或鸟苷替代。在一些实施例中，脱氮核苷酸(例如7-脱氮腺苷)可以掺入gRNA中。在一些实施例中，O-和N-烷基化的核苷酸(例如N6-甲基腺苷)可以掺入gRNA中。在一些实施例中，可以掺入糖经修饰的核糖核苷酸，例如，其中2'OH-基团被选自以下的基团替代：H、-OR、-R(其中R可以是例如甲基、烷基、环烷基、芳基、芳烷基、杂芳基或糖)、卤素、-SH、-SR(其中R可以是例如烷基、环烷基、芳基、芳烷基、杂芳基或糖)、氨基(其中氨基可以是例如NH₂；烷基氨基、二烷基氨基、杂环基、芳基氨基、二芳基氨基、杂芳基氨基、二杂芳基氨基或氨基酸)；或氰基(-CN)。在一些实施例中，磷酸主链可以如本文所述的修饰，例如用硫代磷酸酯基团。在一些实施例中，gRNA的突出端区域中的核苷酸可以各自独立地是经修饰或未经修饰的核苷酸，包括但不限于2'-糖经修饰的(如2-F 2'-O-甲基)胸苷(T)、2'-O-甲氧基乙基-5-甲基尿苷(Teo)、2'-O-甲氧基乙基腺苷(Aeo)、2'-O-甲氧基乙基-5-甲基胞苷(m5Ceo)及其任何组合。

在一个实施例中，RNA分子(例如gRNA分子)的单链突出端中的一个或多个或所有核苷酸是脱氧核苷酸。

药物组合物

本发明的药物组合物可以包含本文所述的gRNA分子(例如如本文所述的多种gRNA分子)或包含用本文所述的一种或多种gRNA分子经修饰的一种或多种细胞的细胞(例如细胞群，例如造血干细胞(例如CD34+细胞)群)，与一种或多种药学上或生理学上可接受的载体、稀释剂或赋形剂的组合。此类组合物可以包含缓冲液，如中性缓冲盐水、磷酸盐缓冲盐水等；碳水化合物，如葡萄糖、甘露糖、蔗糖或葡聚糖、甘露醇；蛋白质；多肽或氨基酸如甘氨酸；抗氧化剂；螯合剂，如EDTA或谷胱甘肽；佐剂(例如氢氧化铝)；以及防腐剂。在一方面，本发明的组合物被配制用于静脉内施用。

本发明的药物组合物能以适合于待治疗(或预防)的疾病的方式施用。施用的数量和频率将由诸如患者的状况以及患者的疾病的类型和严重性等因素来确定，然而适当的剂量可以通过临床试验来确定。

在一个实施例中，药物组合物基本上不含(例如没有可检测水平的)污染物，例如选自由以下组成的组：内毒素、支原体、小鼠抗体、合并的人血清、牛血清白蛋白、牛血清、培养基成分、不需要的CRISPR系统成分、细菌和真菌。在一个实施例中，细菌是选自由以下组成的组的至少一种：粪产碱菌、白色念珠菌、大肠杆菌、流感嗜血杆菌、脑膜炎奈瑟氏菌、铜绿假单胞菌、金黄色葡萄球菌、肺炎链球菌、以及酿脓链球菌A组。

能以任何常规方式施用主题组合物，包括通过雾化吸入、注射、摄取、输血、植入或移植。可以向患者经动脉、皮下、真皮内、瘤内、结内、髓内、肌内、通过静脉内(i.v.)注射、或者腹膜内施用本文所述的组合物。在一方面，通过真皮内或皮下注射向患者施用本发明的组合物。在一方面，通过静脉内注射来施用本发明的细胞组合物。

有待向患者施用的以上治疗的剂量将随着所治疗病状的确切性质和该治疗的受者而变化。可以根据本领域接受的做法来缩放人施用剂量。

细胞

本发明还涉及包含本发明的gRNA分子或编码所述gRNA分子的核酸的细胞。

在一方面，细胞是通过本文所述的方法制备的细胞。

在实施例中，细胞是造血干细胞(例如造血干细胞和祖细胞；HSPC)，例如CD34+干细胞。在实施例中，细胞是CD34+/CD90+干细胞。在实施例中，细胞是CD34+/CD90-干细胞。在实施例中，细胞是人造血干细胞。在实施例中，细胞是自体的。在实施例中，细胞是同种异体的。

在实施例中，细胞源自骨髓，例如自体骨髓。在实施例中，细胞源自外周血，例如动员的外周血，例如自体动员的外周血。在使用动员的外周血的实施例中，细胞自已施用动员剂的患者分离。在实施例中，动员剂是G-CSF。在实施例中，动员剂是(AMD3100)。在实施例中，细胞源自脐带血，例如同种异体脐带血。

在实施例中，细胞是哺乳动物细胞。在实施例中，细胞是人细胞。

在一方面，本发明提供了如下细胞，该细胞在与例如如本文所述的一种或多种gRNA分子(例如作为如本文所述的CRISPR系统的部分引入所述细胞中)具有互补性的核酸序列处或其附近(例如，在其20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个核苷酸内)包含修饰或改变，例如插入/缺失。在实施例中，细胞是CD34+细胞。在实施例中，经改变或经修饰的细胞(例如CD34+细胞)保持分化成多个谱系的细胞的能力，例如保持分化成类红细胞谱系细胞的能力。在实施例中，经改变或经修饰的细胞(例如CD34+细胞)在培养中(例如，在包含干细胞扩增剂(例如化合物4)的培养中)已经历或能够经历至少2次、至少3次、至少4次、至少5次、至少6次、至少7次、至少8次、至少9次或至少10次或更多次倍增。在实施例中，经改变或经修饰的细胞(例如CD34+细胞)在培养中(例如，在包含例如如本文所述的干细胞扩增剂分子(例如化合物4)的培养中)已经历或能够经历至少5次(例如约5次)倍增。在实施例中，经改变或经修饰的细胞(例如CD34+细胞)表现出和/或能够分化成如下细胞，例如分化成类红细胞谱系细胞，例如分化成红细胞，该细胞相对于类似的未经修饰或未经改变的细胞表现出增加的胎儿血红蛋白水平(例如表达水平和/或蛋白质水平)，例如胎儿血红蛋白蛋白质水平增加至少20％。在实施例中，经改变或经修饰的细胞(例如CD34+细胞)表现出和/或能够分化成如下细胞，例如分化成类红细胞谱系细胞，例如分化成红细胞，该细胞相对于类似的未经修饰或未经改变的细胞表现出增加的胎儿血红蛋白水平(例如表达水平和/或蛋白质水平)，例如产生至少6皮克，例如至少7皮克、至少8皮克、至少9皮克、或至少10皮克的胎儿血红蛋白。在实施例中，经改变或经修饰的细胞(例如CD34+细胞)表现出和/或能够分化成如下细胞，例如分化成类红细胞谱系细胞，例如分化成红细胞，该细胞相对于类似的未经修饰或未经改变的细胞表现出增加的胎儿血红蛋白水平(例如表达水平和/或蛋白质水平)，例如产生约6皮克至约12皮克、约6皮克至约7皮克、约7皮克至约8皮克、约8皮克至约9皮克、约9皮克至约10皮克、约10皮克至约11皮克或约11皮克至约12皮克的胎儿血红蛋白。

在一方面，本发明提供了包含如下细胞的细胞群，这些细胞在与例如如本文所述的一种或多种gRNA分子(例如作为如本文所述的CRISPR系统的部分引入所述细胞中)具有互补性的核酸序列处或其附近(例如，在其20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个核苷酸内)具有修饰或改变，例如插入/缺失。在实施例中，该群的至少50％(例如至少60％、至少70％、至少80％或至少90％)的细胞具有修饰或改变(例如具有至少一种修饰或改变)，例如在引入本发明的gRNA和/或CRISPR系统后第2天，例如如通过NGS(例如如本文所述)所测量的。在实施例中，该群的至少90％(例如至少91％、至少92％、至少93％、至少94％、至少95％、至少96％、至少97％、至少98％或至少99％)的细胞具有修饰或改变(例如具有至少一种修饰或改变)，例如在引入本发明的gRNA和/或CRISPR系统后第2天，例如如通过NGS(例如如本文所述)所测量的。在实施例中，该细胞群包含CD34+细胞，例如包含至少约50％、至少约60％、至少约70％、至少约80％、至少约90％、至少约95％或至少约98％的CD34+细胞。在实施例中，包含经改变或经修饰的细胞(例如CD34+细胞)的细胞群保持产生(例如分化成)多个谱系的细胞的能力，例如保持产生(例如分化成)类红细胞谱系细胞的能力。在实施例中，该细胞群(例如CD34+细胞群)在培养中(例如，在包含干细胞扩增剂(例如化合物4)的培养中)已经历或能够经历至少2次、至少3次、至少4次、至少5次、至少6次、至少7次、至少8次、至少9次或至少10次或更多次群倍增。在实施例中，经改变或经修饰的细胞群(例如CD34+细胞群)在培养中(例如，在包含例如如本文所述的干细胞扩增剂分子(例如化合物4)的培养中)已经历或能够经历至少5次(例如约5次)群倍增。在实施例中，包含经改变或经修饰的细胞(例如CD34+细胞)的细胞群表现出和/或能够分化成如下细胞群，例如分化成类红细胞谱系的细胞群，例如分化成红细胞群，该细胞群相对于类似的未经修饰或未经改变的细胞表现出增加的胎儿血红蛋白水平(例如表达水平和/或蛋白质水平)，例如胎儿血红蛋白蛋白质水平增加至少20％。在实施例中，包含经改变或经修饰的细胞(例如CD34+细胞)的细胞群表现出和/或能够分化成如下细胞群，例如分化成类红细胞谱系的细胞群，例如分化成红细胞群，该细胞群相对于类似的未经修饰或未经改变的细胞表现出增加的胎儿血红蛋白水平(例如表达水平和/或蛋白质水平)，例如包含产生每个细胞至少6皮克，例如至少7皮克、至少8皮克、至少9皮克、或至少10皮克胎儿血红蛋白的细胞。在实施例中，经改变或经修饰的细胞(例如CD34+细胞)群表现出和/或能够分化成如下细胞群，例如分化成类红细胞谱系的细胞群，例如分化成红细胞群，该细胞群相对于类似的未经修饰或未经改变的细胞表现出增加的胎儿血红蛋白水平(例如表达水平和/或蛋白质水平)，例如包含产生每个细胞约6皮克至约12皮克、约6皮克至约7皮克、约7皮克至约8皮克、约8皮克至约9皮克、约9皮克至约10皮克、约10皮克至约11皮克或约11皮克至约12皮克胎儿血红蛋白的细胞。

在实施例中，例如如本文所述的细胞群包含至少约1e3个细胞。在实施例中，例如如本文所述的细胞群包含至少约1e4个细胞。在实施例中，例如如本文所述的细胞群包含至少约1e5个细胞。在实施例中，例如如本文所述的细胞群包含至少约1e6个细胞。在实施例中，例如如本文所述的细胞群包含至少约1e7个细胞。在实施例中，例如如本文所述的细胞群包含至少约1e8个细胞。在实施例中，例如如本文所述的细胞群包含至少约1e9个细胞。在实施例中，例如如本文所述的细胞群包含至少约1e10个细胞。在实施例中，例如如本文所述的细胞群包含至少约1e11个细胞。在实施例中，例如如本文所述的细胞群包含至少约1e12个细胞。在实施例中，例如如本文所述的细胞群包含至少约1e13个细胞/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含至少约1e6个细胞/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含至少约2e6个细胞/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含至少约3e6个细胞/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含至少约4e6个细胞/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含至少约5e6个细胞/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含至少约6e6个细胞/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含至少约7e6个细胞/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含至少约8e6个细胞/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含至少约9e6个细胞/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含至少约1e7个细胞/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含至少约2e7个细胞/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含至少约3e7个细胞/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含至少约4e7个细胞/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含至少约5e7个细胞/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含至少约6e7个细胞/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含至少约7e7个细胞/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含至少约8e7个细胞/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含至少约9e7个细胞/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含至少约1e8个细胞/千克待施用这些细胞的患者的体重。在任何上述实施例中，该细胞群可以包含至少约50％(例如至少约60％、至少约70％、至少约80％、至少约90％、至少约95％或至少约99％)的HSPC，例如CD34+细胞。在任何上述实施例中，该细胞群可以包含约60％的HSPC，例如CD34+细胞。在一个实施例中，例如如本文所述的细胞群包含约3e7个细胞并且包含约2e7个HSPC，例如CD34+细胞。

在实施例中，例如如本文所述的细胞群包含至少约1e6个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含至少约1.5e6个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含至少约2e6个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含至少约3e6个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含至少约4e6个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含至少约5e6个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含至少约6e6个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含至少约7e6个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含至少约8e6个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含至少约9e6个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含至少约1e7个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含至少约2e7个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含至少约3e7个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含至少约4e7个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含至少约5e7个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含至少约6e7个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含至少约7e7个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含至少约8e7个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含至少约9e7个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含至少约1e8个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含至少约2e8个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含至少约3e8个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含至少约4e8个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含至少约5e8个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。

在实施例中，例如如本文所述的细胞群包含约1e6个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含约1.5e6个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含约2e6个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含约3e6个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含约4e6个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含约5e6个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含约6e6个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含约7e6个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含约8e6个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含约9e6个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含约1e7个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含约2e7个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含约3e7个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含约4e7个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含约5e7个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含约6e7个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含约7e7个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含约8e7个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含约9e7个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含约1e8个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含约2e8个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含约3e8个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含约4e8个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含约5e8个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。

在实施例中，例如如本文所述的细胞群包含从约2e6个至约10e6个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。在实施例中，例如如本文所述的细胞群包含从2e6个至10e6个HSPC(例如CD34+细胞)/千克待施用这些细胞的患者的体重。

本发明的细胞可以包含本发明的gRNA分子或编码所述gRNA分子的核酸、以及本发明的Cas9分子或编码所述Cas9分子的核酸。在一个实施例中，本发明的细胞可以包含核糖核蛋白(RNP)复合物，该复合物包含本发明的gRNA分子和本发明的Cas9分子。

本发明的细胞优选地被修饰成离体包含本发明的gRNA分子，例如通过本文所述的方法，例如通过电穿孔。

本发明的细胞包括如下细胞，在这些细胞中通过引入包含本发明的gRNA的CRISPR系统而改变(例如减少或抑制)一种或多种基因的表达。例如，相对于未经修饰的细胞，本发明的细胞可以具有降低的BCL11a表达水平。作为另一个实例，相对于未经修饰的细胞，本发明的细胞可以具有增加的胎儿血红蛋白表达水平。作为另一个实例，相对于未经修饰的细胞，本发明的细胞可以具有降低的β珠蛋白表达水平。可替代地，或另外，本发明的细胞可以产生(例如分化成)另一类型的细胞(例如红细胞)，其相对于从未经修饰的细胞分化的细胞具有降低的BCL11a表达水平。可替代地，或另外，本发明的细胞可以产生(例如分化成)另一类型的细胞(例如红细胞)，其相对于从未经修饰的细胞分化的细胞具有增加的胎儿血红蛋白表达水平。可替代地，或另外，本发明的细胞可以产生(例如分化成)另一类型的细胞(例如红细胞)，其相对于从未经修饰的细胞分化的细胞具有降低的β珠蛋白表达水平。

本发明的细胞包括如下细胞，在这些细胞中通过引入包含本发明的gRNA的CRISPR系统而改变(例如减少或抑制)一种或多种基因的表达。例如，相对于未经修饰的细胞，本发明的细胞可以具有降低的血红蛋白β(例如突变型或野生型血红蛋白β)表达水平。在另一方面，本发明提供了由引入了包含本发明的gRNA的CRISPR系统的细胞衍生(例如由其分化)的细胞。在这些方面，其中引入了包含本发明的gRNA的CRISPR系统的细胞可能不会表现出降低的血红蛋白β(例如突变型或野生型血红蛋白β)水平，但是由其衍生(例如由其分化)的细胞表现出降低的血红蛋白β(例如突变型或野生型血红蛋白β)水平。在实施例中，衍生(例如分化)在体内(例如在患者中)完成。在实施例中，其中引入了包含本发明的gRNA的CRISPR系统的细胞是CD34+细胞，并且由其衍生(例如分化)的细胞属于类红细胞谱系，例如红细胞。

本发明的细胞包括如下细胞，在这些细胞中通过引入包含本发明的gRNA的CRISPR系统而改变(例如增加或促进)一种或多种基因的表达。例如，相对于未经修饰的细胞，本发明的细胞可以具有增加的胎儿血红蛋白表达水平。在另一方面，本发明提供了由引入了包含本发明的gRNA的CRISPR系统的细胞衍生(例如由其分化)的细胞。在这些方面，其中引入了包含本发明的gRNA的CRISPR系统的细胞可能不会表现出增加的胎儿血红蛋白水平，但是由其衍生(例如由其分化)的细胞表现出增加的胎儿血红蛋白水平。在实施例中，衍生(例如分化)在体内(例如在患者中)完成。在实施例中，其中引入了包含本发明的gRNA的CRISPR系统的细胞是CD34+细胞，并且由其衍生(例如分化)的细胞属于类红细胞谱系，例如红细胞。

在另一方面，本发明提供了如下细胞，这些细胞在与引入所述细胞中的一种或多种gRNA分子具有互补性的核酸序列处(例如内)或其附近(例如，在其20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个核苷酸内)包含插入/缺失。在实施例中，插入/缺失是移码插入/缺失。在实施例中，插入/缺失是表15中列出的插入/缺失。在实施例中，插入/缺失是表26、表27或表37中列出的插入/缺失。在实施例中，本发明涉及例如如本文所述的细胞群，其中该细胞群包含具有表15中列出的插入/缺失的细胞。在实施例中，本发明涉及例如如本文所述的细胞群，其中该细胞群包含具有表26、表27或表37中列出的插入/缺失的细胞。

在一方面，本发明涉及包含如下细胞的细胞群(例如HSPC群)，这些细胞在与引入所述细胞(例如如本文所述)中的例如如本文所述的一种或多种gRNA分子具有互补性的核酸序列处或其附近(例如，在其20、19、18、17、16、15、14、13、12、11、10、9、8、7、6、5、4、3、2或1个核苷酸内)包含例如如本文所述的插入/缺失，例如在图25、表15、表26、表27或表37中所述的插入/缺失或插入/缺失模式。在实施例中，插入/缺失是移码插入/缺失。在实施例中，该群的20％-100％的细胞包含所述一种或多种插入/缺失。在实施例中，该群的30％-100％的细胞包含所述一种或多种插入/缺失。在实施例中，该群的40％-100％的细胞包含所述一种或多种插入/缺失。在实施例中，该群的50％-100％的细胞包含所述一种或多种插入/缺失。在实施例中，该群的60％-100％的细胞包含所述一种或多种插入/缺失。在实施例中，该群的70％-100％的细胞包含所述一种或多种插入/缺失。在实施例中，该群的80％-100％的细胞包含所述一种或多种插入/缺失。在实施例中，该群的90％-100％的细胞包含所述一种或多种插入/缺失。在实施例中，该细胞群保留分化成多种细胞类型的能力，例如保持分化成类红细胞谱系细胞(例如红细胞)的能力。在实施例中，经编辑且分化的细胞(例如红细胞)保持增殖的能力，例如，在例如如实例中所述的类红细胞分化培养基(EDM)中7天后增殖至少5倍、至少10倍、至少15倍、至少20倍、至少25倍、至少30倍、至少35倍、至少40倍、至少45倍、至少50倍或更多倍，和/或在例如如实例中所述的类红细胞分化培养基(EDM)中21天后增殖至少30倍、至少35倍、至少40倍、至少45倍、至少50倍、至少55倍、至少60倍、至少65倍、至少70倍、至少75倍、至少80倍、至少85倍、至少90倍、至少95倍、至少100倍、至少110倍、至少120倍、至少130倍、至少140倍、至少150倍、至少200倍、至少300倍、至少400倍、至少500倍、至少600倍、至少700倍、至少800倍、至少900倍、至少1000倍、至少1100倍、至少1200倍、至少1300倍、至少1400倍、至少1500倍或更多倍。

在一个实施例中，本发明提供了一种细胞(例如CD34+细胞)群，其中该群的至少90％(例如至少95％、例如至少98％)的细胞在与本文所述的gRNA分子的靶向结构域互补的位点处或其附近包含例如如本文所述的插入/缺失(不受理论束缚，据信将如本文所述的gRNA分子或CRISPR系统引入细胞群中在所述群中产生插入/缺失模式，因此，该群中包含插入/缺失的每个细胞可能不表现出相同的插入/缺失)；其中所述细胞保持分化成类红细胞谱系细胞(例如红细胞)的能力；和/或其中相对于由类似的未经修饰的细胞群分化的细胞，从该细胞群分化的所述细胞具有增加的胎儿血红蛋白水平(例如，该群具有更高的％F细胞)。在实施例中，该细胞群离体经历至少5倍的扩增，例如在包含化合物4的培养基中。

在实施例中，插入/缺失小于约50个核苷酸，例如，小于约45个、小于约40个、小于约35个、小于约30个或小于约25个核苷酸。在实施例中，插入/缺失小于约25个核苷酸。在实施例中，插入/缺失小于约20个核苷酸。在实施例中，插入/缺失小于约15个核苷酸。在实施例中，插入/缺失小于约10个核苷酸。在实施例中，插入/缺失小于约9个核苷酸。在实施例中，插入/缺失小于约9个核苷酸。在实施例中，插入/缺失小于约7个核苷酸。在实施例中，插入/缺失小于约6个核苷酸。在实施例中，插入/缺失小于约5个核苷酸。在实施例中，插入/缺失小于约4个核苷酸。在实施例中，插入/缺失小于约3个核苷酸。在实施例中，插入/缺失小于约2个核苷酸。在任何上述实施例中，插入/缺失是至少1个核苷酸。在实施例中，插入/缺失是1个核苷酸。

在一方面，本发明提供了例如如本文所述的经修饰的HSPC群或由所述HSPC分化的类红细胞(例如，离体或在患者中分化)群，其中至少15％、至少20％、至少25％、至少30％、至少35％、至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、或至少95％的细胞是F细胞。在实施例中，该细胞群比不具有引入所述细胞中的例如如本文所述的一种或多种gRNA分子的相似的细胞群含有更高百分比的F细胞(或能够分化成(例如在体内)含有更高百分比的F细胞的红细胞群)。在实施例中，该细胞群相对于不具有引入所述细胞中的例如如本文所述的一种或多种gRNA分子的相似的细胞群具有增加至少20％，例如增加至少21％、增加至少22％、增加至少23％、增加至少24％、增加至少25％、增加至少26％、增加至少27％、增加至少28％、或增加至少29％的F细胞(或能够分化成(例如在体内)具有增加至少20％，例如增加至少21％、增加至少22％、增加至少23％、增加至少24％、增加至少25％、增加至少26％、增加至少27％、增加至少28％、或增加至少29％的F细胞的红细胞群)。在实施例中，该细胞群相对于不具有引入所述细胞中的例如如本文所述的一种或多种gRNA分子的相似的细胞群具有增加至少30％，例如增加至少35％、增加至少40％、增加至少45％、增加至少50％、增加至少55％、增加至少60％、增加至少65％、增加至少70％、增加至少75％、增加至少80％、增加至少85％、增加至少90％、或增加至少95％的F细胞(或能够分化成(例如在体内)具有增加至少30％，例如增加至少35％、增加至少40％、增加至少45％、增加至少50％、增加至少55％、增加至少60％、增加至少65％、增加至少70％、增加至少75％、增加至少80％、增加至少85％、增加至少90％、或增加至少95％的F细胞的红细胞群)。在实施例中，该细胞群相对于不具有引入所述细胞中的例如如本文所述的一种或多种gRNA分子的相似的细胞群具有增加至少10％-90％、20％-80％、20％-70％、20％-60％、20％-50％、20％-40％、20％-30％、25％-80％、25％-70％、25％-60％、25％-50％、25％-40％、25％-35％、25％-30％、30％-80％、30％-70％、30％-60％、30％-50％、30％-40％、或30％-35％的F细胞(或能够分化成(例如在体内)具有增加至少10％-90％、20％-80％、20％-70％、20％-60％、20％-50％、20％-40％、20％-30％、25％-80％、25％-70％、25％-60％、25％-50％、25％-40％、25％-35％、25％-30％、30％-80％、30％-70％、30％-60％、30％-50％、30％-40％、或30％-35％的F细胞的红细胞群)。在实施例中，例如如通过本文所述方法产生的细胞群包含足够数量的细胞和/或增加足够的％F细胞以治疗有需要的患者的(当例如以治疗有效量引入所述患者中时)例如如本文所述的血红蛋白病，例如镰状细胞疾病和/或β地中海贫血。在实施例中，F细胞的增加是在例如如本文所述的类红细胞分化测定中所测量的。

在实施例中，包括在本文所述的任何实施例和方面中，本发明涉及例如如通过本文所述的任何gRNA、方法和/或CRISPR系统经修饰的细胞(例如细胞群)，该细胞包含每个细胞产生至少6皮克胎儿血红蛋白的F细胞。在实施例中，F细胞产生每个细胞至少7皮克的胎儿血红蛋白。在实施例中，F细胞产生每个细胞至少8皮克的胎儿血红蛋白。在实施例中，F细胞产生每个细胞至少9皮克的胎儿血红蛋白。在实施例中，F细胞产生每个细胞至少10皮克的胎儿血红蛋白。在实施例中，F细胞平均产生每个细胞6.0皮克与7.0皮克之间、7.0皮克与8.0皮克之间、8.0皮克与9.0皮克之间、9.0皮克与10.0皮克之间、10.0皮克与11.0皮克之间、或11.0皮克与12.0皮克之间的胎儿血红蛋白。

在实施例中，包括在任何上述实施例中，本发明的细胞和/或细胞群包含不含有编码Cas9分子的核酸的细胞，例如由其组成。

治疗方法

递送时机

在一个实施例中，递送除Cas系统的组分(例如本文所述的Cas9分子组分和/或gRNA分子组分)之外的一种或多种核酸分子(例如DNA分子)。在一个实施例中，在与递送Cas系统的一种或多种组分的同时递送核酸分子。在一个实施例中，在递送Cas系统的一种或多种组分之前或之后(例如，少于约30分钟、1小时、2小时、3小时、6小时、9小时、12小时、1天、2天、3天、1周、2周或4周)递送核酸分子。在一个实施例中，通过与递送Cas系统的一种或多种组分(例如Cas9分子组分和/或gRNA分子组分)不同的方式递送核酸分子。核酸分子可以通过本文所述的任何递送方法来递送。例如，核酸分子可以通过病毒载体(例如整合缺陷型慢病毒)来递送，并且Cas9分子组分和/或gRNA分子组分可以通过电穿孔来递送，例如，使得可以减少由核酸(例如DNA)引起的毒性。在一个实施例中，核酸分子编码治疗性蛋白，例如本文所述的蛋白质。在一个实施例中，核酸分子编码RNA分子，例如本文所述的RNA分子。

组分的双模式递送或差别递送

Cas系统的组分(例如Cas9分子组分和gRNA分子组分)的单独递送，并且更具体地通过不同模式的组分递送，可以例如通过改善组织特异性和安全性来增强性能。在一个实施例中，Cas9分子和gRNA分子通过不同的模式递送，或者有时在本文中称为差别模式。如本文所用，不同模式或差别模式是指赋予主题组分分子(例如例如Cas9分子、gRNA分子、模板核酸或有效负载)不同的药效学或药代动力学特性的递送模式。例如，递送模式可导致不同的组织分布、不同的半衰期或不同的时间分布，例如在所选择的区室、组织或器官中。

一些递送模式(例如，通过例如通过自主复制或插入到细胞核酸中而在细胞中或在细胞子代中持续存在的核酸载体的递送)导致组分的更持久的表达和存在。实例包括病毒(例如腺相关病毒或慢病毒)递送。

通过举例，这些组分(例如Cas9分子和gRNA分子)可以通过如下模式递送，这些模式在所递送的组分在身体中或在特定的区室、组织或器官中的所得半衰期或持久性方面有所不同。在一个实施例中，可以通过此类模式递送gRNA分子。Cas9分子组分可以通过如下模式递送，该模式导致其持久性较差或较少暴露于身体或者特定区室或组织或器官。

更一般地，在一个实施例中，第一递送模式用于递送第一组分，并且第二递送模式用于递送第二组分。第一递送模式赋予第一药效学或药代动力学特性。第一药效学特性可以是例如组分或编码该组分的核酸在体内、区室、组织或器官中的分布、持久性或暴露。第二递送模式赋予第二药效学或药代动力学特性。第二药效学特性可以是例如组分或编码该组分的核酸在体内、区室、组织或器官中的分布、持久性或暴露。

在一个实施例中，第一药效学或药代动力学特性(例如分布、持久性或暴露)比第二药效学或药代动力学特性更受限制。

在一个实施例中，选择第一递送模式以优化(例如最小化)药效学或药代动力学特性，例如分布、持久性或暴露。

在一个实施例中，选择第二递送模式以优化(例如最大化)药效学或药代动力学特性，例如分布、持久性或暴露。

在一个实施例中，第一递送模式包含使用相对持久的元件，例如核酸，例如质粒或病毒载体，例如AAV或慢病毒。因为此类载体是相对持久的，所以从它们转录的产物将是相对持久的。

在一个实施例中，第二递送模式包含相对瞬时的元件，例如RNA或蛋白质。

在一个实施例中，第一组分包含gRNA，并且递送模式是相对持久的，例如，gRNA从质粒或病毒载体(例如AAV或慢病毒)转录。这些基因的转录几乎没有生理后果，因为这些基因不编码蛋白质产物，并且gRNA不能孤立地起作用。第二组分Cas9分子以瞬时方式递送，例如作为mRNA或作为蛋白质，确保完整的Cas9分子/gRNA分子复合物仅在短时间内存在并具有活性。

此外，这些组分能以不同的分子形式或用不同递送载体来递送，这些递送载体彼此互补以增强安全性和组织特异性。

使用差别递送模式可以提高性能，即安全性和疗效。例如，可以降低最终脱靶经修饰的可能性。通过较不持久的模式递送免疫原性组分(例如Cas9分子)可以降低免疫原性，因为来自细菌衍生的Cas酶的肽通过MHC分子展示在细胞表面上。两部分的递送系统可以缓解这些缺点。

差别递送模式可以用于将组分递送到不相同但重叠的靶区域。在靶区域的重叠区之外，使形成活性复合物最小化。因此，在一个实施例中，通过产生第一空间(例如组织)分布的第一递送模式来递送第一组分，例如gRNA分子。通过产生第二空间(例如组织)分布的第二递送模式来递送第二组分，例如Cas9分子。在一个实施例中，第一模式包含选自脂质体、纳米颗粒(例如聚合纳米颗粒)和核酸(例如病毒载体)的第一元件。第二模式包含选自该组的第二元件。在一个实施例中，第一递送模式包含第一靶向元件，例如细胞特异性受体或抗体，并且第二递送模式不包含该元件。在一个实施例中，第二递送模式包含第二靶向元件，例如第二细胞特异性受体或第二抗体。

当Cas9分子在病毒递送载体、脂质体或聚合纳米颗粒中递送时，当可能期望仅靶向单个组织时，存在递送至多个组织和在多个组织中有治疗活性的可能性。两部分的递送系统可以解决这一挑战并提高组织特异性。如果gRNA分子和Cas9分子被包装在具有不相同但重叠的组织向性的分开的递送载体中，则全功能复合物仅在这两种载体均靶向的组织中形成。

候选Cas分子(例如Cas9分子)、候选gRNA分子、候选Cas9分子/gRNA分子复合物、以及候选CRISPR系统可以通过本领域已知的方法或如本文所述的进行评估。例如，用于评估Cas9分子的内切核酸酶活性的示例性方法描述于例如Jinek等人,Science[科学]2012；337(6096):816-821中。

实例

实例1

指导物选择和设计

使用人参考基因组和用户定义的目的基因组区域(例如，基因、基因的外显子、非编码调节区等)经由电脑模拟进行初始指导物选择，用于鉴定目的区域中的PAM。对于每个鉴定的PAM，进行分析并报告统计数值。基于例如如本文所述的用于确定效率和疗效的许多方法进一步选择和排序gRNA分子。

贯穿这些实例，在下面的实验中，使用sgRNA分子或dgRNA分子。除非另有说明，否则在使用dgRNA分子的情况下，gRNA包含以下：

crRNA：[靶向结构域]-[SEQ ID NO:6607]

tracr(trRNA)：SEQ ID NO:6660

除非另有说明，否则在使用sgRNA分子的实验中，使用以下序列：

[靶向结构域]-[SEQ ID NO:6601]-UUUU

除非另有说明，否则在使用标记为“BC”的sgRNA分子的实验中，使用以下序列：

[靶向结构域]-[SEQ ID NO:6604]-UUUU

转染HEK-293_Cas9GFP细胞用于初步指导物筛选

转染表达Cas9GFP的HEK293细胞(HEK-293_Cas9GFP)用于靶特异性crRNA的初步筛选。在该实例中，使用定义的标准(包括经由电脑模拟的脱靶检测，例如如本文所述)来设计并选择靶特异性crRNA用于初步筛选。选择的crRNA以化学方法合成并以96孔格式递送。将HEK-293-Cas9GFP细胞用1:1比率的靶crRNA与储备trRNA进行转染。根据制造商的方案(Lipofectamine 2000，生命科技公司(Life Technologies))使用脂质转染技术来介导转染。在脂质转染后24小时裂解转染的细胞，并用T7E1测定和/或下一代测序(NGS；下文)检测裂解物内的编辑(例如切割)。

T7E1测定

T7E1测定用于检测基因组DNA中的突变事件，如在由Cas9进行DNA切割后通过非同源末端连接(NHEJ)产生的插入、缺失和取代(参见Cho等人,Targeted genome engineeringin human cells with the Cas9 RNA-guided endonuclease[使用Cas9 RNA引导的内切核酸酶在人细胞中进行靶向基因组工程].Nature Biotechnology[自然生物技术].2013；31,230-232)。

通过PCR来扩增已经被靶向用于被CRISPR/Cas9切割的基因组DNA区域，在95℃变性10分钟，然后通过以每秒0.5℃的速度从95℃缓降至25℃进行再次退火。如果在扩增区域内存在突变，则DNA组合形成异源双链体。然后将再退火的异源双链体用T7E1(新英格兰生物实验室(New England Biolabs))在37℃消化25分钟或更长时间。T7E1内切核酸酶识别DNA错配、异源双链体和带切口的双链DNA，并在这些位点产生双链断裂。使用片段分析仪分析所得DNA片段并进行定量以确定切割效率。

下一代测序(NGS)以及中靶切割效率和插入/缺失形成的分析

为了确定对基因组中的靶位置编辑(例如，切割)的效率，利用深度测序来鉴定由非同源末端连接引入的插入和缺失的存在。

首先在靶位点周围设计PCR引物，并PCR扩增目的基因组区域。根据制造商的方案(依诺米那公司(Illumina))进行另外的PCR以添加用于测序的必要化学过程。然后在依诺米那MiSeq仪上对扩增子进行测序。然后在消除具有低质量分数的那些读数之后，将读数与人参考基因组(例如，hg38)进行比对。从包含映射到参考基因组的读数的所得文件(BAM文件)中，选择与目的靶区域重叠的读数，并计算野生型读数的数量与包含插入或缺失的读数的数量。然后将编辑百分比定义为具有插入或删除的读数总数相比于读数总数(包括野生型)。为了确定由编辑产生的插入和/或缺失的样式，选择具有插入/缺失的比对读数，并且对具有给定插入/缺失的读数的数量进行求和。然后将该信息显示为列表以及在直方图上以表示每个插入点的频率的形式可视化。

RNP生成

向Cas9蛋白中添加crRNA和trRNA导致活性Cas9核糖核蛋白复合物(RNP)的形成，其介导与crRNA指定的靶区域的结合和靶基因组DNA的特异性切割。通过将trRNA和crRNA加载到Cas9中形成该复合物，其被认为引起Cas9的构象变化，从而允许其结合并切割dsDNA。

将crRNA和trRNA分别在95℃变性2分钟，并使其达到室温。将Cas9蛋白(10mg/ml)添加到5X CCE缓冲液(20mM HEPES、100mM KCl、5mM MgCl₂、1mM DTT、5％甘油)中，然后向其中添加trRNA和各种crRNA(在分开的反应中)，并在37℃孵育10分钟，从而形成活性RNP复合物。通过电穿孔和其他方法将复合物递送到广泛多种细胞中，包括HEK-293和CD34+造血细胞。

将RNP递送到CD34+ HSC中

将Cas9 RNP递送到CD34+ HSC中。

将CD34+ HSC解冻并在添加有IL12、SCF、TPO、Flt3L和Pen/Strep的StemSpan SFEM(干细胞技术公司)培养基中培养(约500,000个细胞/ml)过夜。根据各个RNP递送反应，将大约90,000个细胞等分并沉淀。然后将细胞重悬于60ul P3核转染缓冲液(龙沙集团(Lonza))中，随后向其中添加活性RNP。然后将HSC以一式三份(20uL/电穿孔)进行电穿孔(例如，使用龙沙核转染仪上的程序CA-137进行核转染)。电穿孔后立即将StemSpan SFEM培养基(含有IL12、SCF、TPO、Flt3L和Pen/Strep)添加到HSC中，将其培养至少24小时。然后收获HSC并进行T7E1、NGS和/或表面标志物表达分析。

HSC功能测定

可以使用已知技术例如流式细胞术或体外集落形成测定法来测定CD34+ HSC的干细胞表型。举例来说，使用Methocult H4034最优试剂盒(干细胞技术公司)，使用制造商的方案，通过体外集落形成测定法(CFC)来测定细胞。简言之，将<＝100ul体积的500-2000个CD34+细胞添加到1ml-1.25ml methocult中。将混合物剧烈涡旋4-5秒以充分混合，然后使其在室温下静置至少5分钟。使用注射器，将1ml-1.25ml的MethoCult+细胞转移到6孔板的35mm皿或孔中。根据制造商的方案，在12-14天后评估集落数和形态。

体内异种移植

HSC在功能上由其自我更新和多谱系分化的能力来定义。此功能性只能在体内进行评估。用于确定人HSC功能的金标准是通过异种移植到NOD-SCIDγ小鼠(NSG)中，该小鼠通过一系列突变是严重免疫受损的，因此可以充当人细胞的受体。编辑后的HSC将被移植到NSG小鼠中以验证诱导的编辑不影响HSC功能。每月外周血分析将用于评估人嵌合状态和谱系发展，并且20周后的再次移植将用于确定功能性HSC的存在。

结果

将使用本文所述的gRNA分子(例如，如上所述的dgRNA分子)在HEK293_Cas9GFP细胞中进行的编辑的结果(如通过T7E1(“T7”)和/或NGS所测定的)总结于图1(针对+58BCL11a增强子区域的gRNA分子)和图2(针对+62 BCL11a增强子区域的gRNA分子)中以及如以下所示的表中。CD34+ HSPC中的平均编辑报告在例如以下表10(针对+58 BCL11a增强子区域的gRNA分子)、表11(针对+62 BCL11a增强子区域的gRNA分子)、表12B(针对+55 BCL11a增强子区域的gRNA分子)和表13(针对法国HPFH区域的gRNA分子)中。在报告T7E1测定结果的情况下，“2”表示高效切割；“1”表示低效切割，并且“0”表示无切割。通常，T7E1结果与由NGS测定的定量切割相关。靠前的15个gRNA(如通过CD34+细胞中最高％编辑进行排列)显示在图11(+58 BCL11a增强子区域)和图12(+62 BCL11a增强子区域)中。

表10：在CD34+ HSPC中的Bcl11a +58增强子区域crRNA 1°筛选结果(通过NGS，n＝3)。

表11：在CD34+ HSPC中的Bcl11a +62增强子区域crRNA 1°筛选结果(通过NGS，n＝3)。

表12A：在HEK-293-Cas9细胞中的Bcl11a +55增强子区域crRNA 1°筛选结果

n/a＝未评估

在以上实验之后，使用新设计的用于NGS分析的一组引物，在HEK-293-Cas9细胞和CD34+细胞两者中再次一式三份地测试相同的指导物RNA分子。下面将结果报告于表12B中。

表12B：在HEK-293-Cas9细胞和在CD34+ HSPC中的Bcl11a +55增强子区域crRNA筛选结果(通过NGS，n＝3)。

n.d.＝未确定

表13：在HEK-293-Cas9细胞和在CD34+ HSPC中的法国HPFH区域crRNA 1°筛选结果(通过NGS，n＝3)。

n/a＝未测定；nd＝未确定

在BCL11a增强子位点处的基因组编辑

对合成的sgRNA分子进行了排序，所述合成的sgRNA分子含有对BCL11a的+58或+62类红细胞增强子区域内的基因组DNA具有特异性的靶向结构域。图5显示了由sgRNA靶向的基因组DNA，其被命名为sgEH1至sgEH9。

sgEH1靶向结构域(CR00276)：AUCACAUAUAGGCACCUAUC(SEQ ID NO:212)

sgEH2靶向结构域(CR00275)：CACAGUAGCUGGUACCUGAU(SEQ ID NO:211)

sgEH8靶向结构域(CR00273)：CAGGUACCAGCUACUGUGUU(SEQ ID NO:209)

sgEH9(CR00277)靶向结构域：UGAUAGGUGCCUAUAUGUGA(SEQ ID NO:213)

使用电穿孔(NEON电穿孔仪)，将含有与Cas9预复合的sgEH[X]的RNP引入CD34+骨髓细胞(从龙沙集团订购的骨髓CD34+细胞，目录号2M-101C，批号466977，30y，F，B(96.8％))。使用T7E1和NGS来确定在CD34+干细胞中的切割。结果总结在图6A-6D中，其显示了四个实验(两个实验来自两个不同供体)的总体插入/缺失形成，以及靠前的插入/缺失样式。sgEH1、2和9能够高效率地指导切割。

出人意料地发现，在多个实验中，包括使用来自不同供体的细胞的实验，插入/缺失样式保持恒定(参见图6A-6D)。也就是说，每种gRNA给出一致的插入/缺失形成模式。同样，缺失似乎与切割位点附近的微同源性区域相关。

为了进一步研究这种现象，在试验下使用不同的生物样品以及不同的递送方法和gRNA支架设计了针对BCL11a基因座的gRNA。对于该实验，使用具有以下靶向结构域的gRNA：

G7(也称为g7)靶向结构域：GUGCCAGAUGAACUUCCCAU(例如，SEQ ID NO:1191的3'20个碱基)

G8(也称为g8)靶向结构域：CACAAACGGAAACAAUGCAA(例如，SEQ ID NO:1186的3'20个碱基)

在第一个实验中，在两个不同的生物样品上测试g7和g8。如图7所示，每种gRNA的靠前的3个最普遍的插入/缺失的样式是相同的。接下来，用不同的tracrRNA组分测试包含G7和G8靶向结构域的gRNA分子。在先前的实验中，将其后跟随着-UUUU的SEQ ID NO:6601直接附加到gRNA靶向结构域以形成sgRNA。在下一组实验中，将气候跟随着-UUUU的SEQ IDNO:6604直接附加到g7和g8的gRNA靶向结构域，以产生具有不同支架的sgRNA分子(称为g7BC或g8BC的gRNA)。如图8所示，即使当使用不同的sgRNA支架时，插入/缺失样式也保持不变。最后，使用不同的递送方法比较插入/缺失样式。研究了经由RNP电穿孔或通过经由lipofectamine 2000递送编码g7的质粒来将g7递送至293细胞，并且结果报告于图9中。如所示，插入/缺失样式保持不变。同时，这些结果强烈表明插入/缺失样式形成是序列依赖性的。靶向在切割导致大的缺失和/或移码缺失的情况下的序列的gRNA分子可能有益于功能丧失。

使用多个指导物进行切除

以上G7和g8在近端位点靶向基因组DNA(PAM序列在BCL11a基因内的彼此50个核苷酸内)。为了研究同时靶向两个近端位点的效果，用包含具有G7靶向结构域的gRNA的RNP以及包含具有G8靶向结构域的gRNA的RNP转染CD34+细胞。通过NGS评估切割效率和插入/缺失样式。如图10所示，主要插入/缺失是两个gRNA结合位点之间的核苷酸的缺失。这些结果证明，可以使用多个(例如2个)邻近结合的指导物来实现位于两个结合位点之间的DNA的切除。

CD34+干细胞中的基因组编辑

在CD34+原代造血干细胞中证实了BCL11a基因座处的基因组编辑。简言之，根据制造商的说明，使用免疫选择(美天旎公司(Miltenyi))，从来自成年供体的G-CSF动员的外周血(澳赛尔斯公司(AllCells))中分离CD34+细胞。细胞门控示于图3中。将细胞等分并冷冻保存。将解冻的细胞以2x10⁵/ml接种于SFEM(干细胞技术公司)+1X抗生素/抗真菌剂+各自50ng/ml细胞因子(TPO、FLT3L、IL6和SCF)+500nM化合物4中，并在37℃、5％CO₂下在加湿培养箱中培养5天。5天后的细胞浓度为1x10⁶/ml。

将由各自150ng的Cas9(金斯瑞公司(Genscript)#265425-7)和sgRNA(TriLink，包含sgBCL11A_7靶向结构域(即，g7的靶向结构域)：GTGCCAGATGAACTTCCCATGTTTAAGAGCTATGCTGGAAACAGCATAGCAAGTTTAAATAAGGCTAGTCCGTTATCAACTTGAAAAAGTGGCACCGAGTCGGTGCTTTT)(SEQ ID NO:2000)组成的预孵育的RNP复合物添加到2x10⁵个细胞中，并根据制造商的方案在具有以下脉冲参数的Neon系统(生命技术公司)上进行电穿孔：1600V，20ms，1个脉冲。进行重复的电穿孔。在不存在RNP复合物的情况下也进行模拟电穿孔。电穿孔后，将细胞接种到1ml培养基中以恢复过夜。

电穿孔后第二天，将1/20的未分选培养物接种于SFEM(干细胞技术公司)+1X抗生素/抗真菌剂+各50ng/ml的TPO、FLT3L、IL6、SCF、IL3和GCSF中持续6天。将剩余的细胞用针对人CD34和人CD90的抗体进行染色，并通过流式细胞术分选CD34+CD90+和CD34+CD90-群。已知CD34+CD90+细胞含有造血干细胞，如通过在免疫缺陷小鼠中的长期多谱系植入所定义的(参见Majeti等人2007Cell Stem Cell[细胞干细胞]1,635-645)。经选择用于分选的细胞群由图3的代表性点图中的门控表示。将分选的细胞在SFEM(干细胞技术公司)+1X抗生素/抗真菌剂+各50ng/ml的TPO、FLT3L、IL6、SCF、IL3和GCSF中培养6天，这时收获所有培养物用于基因组编辑的分析。

从收获的细胞纯化基因组DNA，并用以下引物扩增靶区域：BCL11A-7F，gcttggctacagcacctctga；BCL11A-7R，ggcatggggttgagatgtgct。将PCR产物进行变性并再退火，然后根据制造商的推荐与T7E1(新英格兰生物实验室)一起孵育。然后通过琼脂糖凝胶电泳分析该反应(图4)。上部条带表示未切割的同源双链DNA，并且下部条带表示由异源双链DNA产生的切割产物。远左泳道是DNA梯。通过ImageJ软件通过未处理图像的峰积分来计算条带强度。如下计算％基因修饰(插入/缺失)：％基因修饰＝100x(1-(1-切割分数)^1/2)，并且在凝胶的每个相应泳道的下方示出。

结果示于图4中。含有造血干细胞的CD34+CD90+群中的基因编辑效率等同于CD34+CD90-细胞或未分选的细胞。这些实验证明，基因编辑可以在CD34+HSPC和进一步富集HSC的CD34+CD90+细胞中完成。

实例3.在造血干细胞和祖细胞(HSPC)中使用CRISPR-Cas9进行BCL11A类红细胞增强子编辑，用于在成年类红细胞中胎儿珠蛋白表达的去阻抑

方法：

人CD34⁺细胞培养。人骨髓CD34⁺细胞购自澳赛尔斯公司(目录号：ABM017F)或龙沙集团(目录号：2M-101C)，并且使用StemSpan SFEM(干细胞技术公司；目录号09650)扩增2至3天，所述StemSpan SFEM补充有50ng/mL的促血小板生成素(Tpo，派普泰克公司(Peprotech)；目录号300-18)、50ng/mL的人Flt3配体(Flt-3L，派普泰克公司；目录号300-19)、50ng/mL的人干细胞因子(SCF，派普泰克公司；目录号300-07)、人白细胞介素-6(IL-6，派普泰克公司；目录号200-06)、1％L-谷氨酰胺、2％青霉素/链霉素、以及化合物4(0.75μM)。在扩增2至3天后，培养物相对于购自澳赛尔斯公司的起始细胞数扩增了2至3倍，并且相对于购自龙沙集团的起始细胞数扩增了1至1.5倍。这些培养条件用于所有CD34+扩增步骤，包括在引入如本文所述的CRISPR/Cas系统之前和之后。

装配Cas9和指导RNA核糖核蛋白(RNP)复合物，制备HSC，并将RNP电穿孔到HSC中。在电穿孔之前立即制备Cas9-指导RNA核糖核蛋白复合物(RNP)。对于使用双指导RNA(dgRNA)形成RNP，首先将各自3μg的crRNA(以2.24μL)和tracr(以1.25μL)在95在分开的管中变性2分钟，然后冷却至室温。为了制备Cas9蛋白，将7.3μg的CAS9蛋白(以1.21μL)与0.52μL的5x CCE缓冲液(20mM HEPES、100mM KCL、5mM MgCL2、5％甘油和新鲜添加的1mMDTT)混合。首先将Tracr与Cas9制剂混合并在37℃孵育5分钟。然后将crRNA添加到Tracr/CAS9复合物中并在37℃孵育5分钟。通过以200x g离心15分钟来收集HSC，并以2x 10⁷/mL的细胞密度重悬于Neon电穿孔试剂盒(英杰公司；目录号：MPK1096)附带的T缓冲液中。通过轻轻上下吸移3次将RNP与12μL的细胞混合。为了制备单指导RNA(sgRNA)和Cas9复合物，将2.25μg sgRNA(以1.5μL)与2.25μg Cas9蛋白(以3μL)混合，并在室温下孵育5分钟。然后通过轻轻上下吸移数次将sgRNA/Cas9复合物与10.5μL的2x 10⁷/mL细胞混合，并在室温下孵育2分钟。将该RNP/细胞混合物(10μL)转移到Neon电穿孔探针中。用Neon转染系统(英杰公司；MPK5000S)，使用1700伏/20毫秒和1个脉冲进行电穿孔。电穿孔后，将细胞转移到补充有如上所述的生长因子和细胞因子的0.5mL预热的StemSpan SFEM培养基中，并在37℃培养2天。

基因组DNA制备。在电穿孔后48小时，由经编辑和未经编辑的HSC制备基因组DNA。将细胞在10mM Tris-HCL(pH 8.0)、0.05％SDS和新添加的25μg/mL的蛋白酶K中中裂解，并在37℃孵育1小时，然后在85℃再孵育15分钟以灭活蛋白酶K。

T7E1测定。为了确定HSC的编辑效率，进行T7E1测定。使用Phusion热启动II高保真试剂盒(赛默科技公司；目录号：F-549L)以下列循环条件进行PCR：98℃持续30”；35个循环的98℃持续5”，68℃持续20’，72℃持续30”；72℃持续5分钟。使用以下引物：正向引物：5'-AGCTCCAAACTCTCAAACCACAGGG-3'(SEQ ID NO:2001)和反向引物：5'-TACAATTTTGGGAGTCCACACGGCA-3'(SEQ ID NO:2002)。使用以下条件使PCR产物变性并重新退火：95℃持续5分钟，以-2℃/s 95℃-85℃，以-0.1℃/s 85℃-25℃，维持4℃。退火后，将1μL的错配敏感性T7 E1核酸酶(NEB公司，目录号M0302L)添加到10μL的以上PCR产物中，并在37℃进一步孵育15分钟以消化异源双链体，并且将所得DNA片段通过琼脂糖凝胶(2％)电泳进行分析。使用ImageJ软件(http://rsb.info.nih.gov/ij/)量化编辑效率。

下一代测序(NGS)。为了更精确地确定编辑效率以及插入和缺失(插入/缺失)样式，对PCR产物进行下一代测序(NGS)。使用Titanium Taq PCR试剂盒(克隆技术实验室公司(Clontech Laboratories)；目录号：639210)以下列循环条件以一式两份进行PCR：98℃持续5分钟；30个循环的95℃持续15秒，68℃持续15秒，72℃1分钟；72℃持续7分钟。使用以下引物：正向引物：5'-AGCTCCAAACTCTCAAACCACAGGG-3'(SEQ ID NO:2001)和反向引物：5'-TACAATTTTGGGAGTCCACACGGCA-3'(SEQ ID NO:2002)。通过2％琼脂糖凝胶电泳来分析PCR产物并提交进行深度测序。

对HSPC培养物的流式细胞术分析。对HSPC进行流式细胞术以表征干细胞群和祖细胞群。对细胞培养物的等分试样确定基因组编辑之前和之后的CD34⁺、CD34⁺CD90⁺细胞亚群的百分比。将细胞与抗CD34(BD生物科学公司(BD Biosciences)，目录号555824)、抗CD90(Biolegend公司，目录号328109)在含有补充有0.5％BSA的PBS的染色缓冲液中于4℃在黑暗中一起孵育30分钟。通过7AAD确定细胞活力。用染色缓冲液洗涤细胞，并在FACSCanto(BD公司(Becton Dickinson))上进行多色FACS分析。使用Flowjo分析流式细胞术结果，并且数据表示为总细胞群的CD34⁺、CD34⁺CD90⁺百分比。由细胞总数乘以每个群的百分比计算培养物中每种细胞类型群的绝对数量。

进行含HbF的类红细胞的体外红细胞生成和FACS分析。在电穿孔后48小时，使经基因组编辑的HSC进行体外类红细胞分化。简言之，将经编辑的HSC在类红细胞分化培养基(EDM)中培养，该培养基由补充有330μg/mL人全转铁蛋白(西格玛公司，目录号T0665)、10μg/mL重组人胰岛素(西格玛公司，目录号I3536)、2IU/mL肝素(西格玛公司，目录号H3149)、5％人血浆(西格玛公司，目录号P9523)、3IU/mL人促红细胞生成素(R&D公司，目录号287-TC)、1％L-谷氨酰胺以及2％青霉素/链霉素的IMDM(英杰公司，目录号31980-097)组成。在第0天-第7天的培养期间，EDM进一步补充有10^-6M氢化可的松(西格玛公司，目录号H0888)、100ng/mL人SCF(派普泰克公司，目录号300-07)和5ng/mL人IL-3(派普泰克公司，目录号200-03)，持续7天。在第7天-第11天的培养期间，EDM仅补充有100ng/mL的人SCF。在第11天-第21天的培养期间，EDM没有额外的补充剂。在培养的第7天、第14天和第21天，通过细胞内染色来分析细胞(2-10x 10⁵个)的HbF表达。简言之，通过以350x g离心5分钟来收集细胞，并用染色缓冲液(Biolegend公司，目录号420201)洗涤一次。然后将细胞用0.5mL固定缓冲液(Biolegend公司，目录号420801)固定，并用2mL的1x细胞内染色透化洗涤缓冲液(Biolegend公司，目录号421002)通过以350x g离心5分钟来洗涤三次。然后将细胞与5μL的抗HbF抗体(生命科技公司，目录号MHFH01)在100μL的1x细胞内染色透化洗涤缓冲液中在室温下一起孵育20分钟。将细胞用2mL的1x细胞内染色透化洗涤缓冲液洗涤两次，并重悬于200μL染色缓冲液中并在FACS Canto(BD公司(Becton Dickinson))上分析HbF表达。使用Flowjo分析结果，并且将数据表示为总细胞群中HbF阳性细胞(F细胞)的％。

基因表达测定。使用RNeasy迷你试剂盒(凯杰公司，目录号74104)，将约1x 10⁶个细胞用来纯化RNA。使用qScript cDNA合成试剂盒(Quanta公司，目录号95047-500)，将200ng至400ng RNA用于第一链合成。根据供应商方案，使用Taq-Man快速前进PR混合物(Taq-Man Fast Advance PR Mix，生命科技公司，目录号4444963)和GAPDH(生命科技公司，ID#Hs02758991_g1)、HbB(生命科技公司，ID#：Hs00747223_g1)、HbG2/HbG1(生命科技公司，ID#Hs00361131_g1)和BCL11A(生命科技公司，ID#：Hs01093197_m1)进行Taq-man PCR。将每个基因的相对表达标准化为GAPDH表达。

集落形成单位细胞分析。对于集落形成单位(CFU)测定，将300个细胞/1.1mLMethocult/35mm培养皿一式两份置于含有SCF、GM-CSF、IL-3和促红细胞生成素的Methocult H4434甲基纤维素培养基(干细胞技术公司)中。将Pen/Strep添加到Methocult中。将培养皿在37℃的加湿培养箱中进行孵育。在铺板后第14天，使用StemVision(干细胞技术公司)计数含有至少30个细胞的集落，以获得整个平板的图像。然后StemVision图像分析仪软件计数集落总数，CFU-GEMM(粒细胞、红细胞、巨噬细胞、巨核细胞)、CFU-GM(粒细胞、巨噬细胞)、CFU-M(巨噬细胞)、CFU-E(类红细胞)和BFU-E(爆式集落形成单位-类红细胞)的数量，并通过手动地使用StemVision克隆标志物软件来确认。

体内植入研究。在IACUC批准的方案下进行体内植入研究。将相当于30,000个起始细胞的、基因组编辑的HSC的最终培养物的部分经由尾静脉静脉内注射到亚致死照射的(200cGY)6至8周龄的NSG小鼠中。在照射后24小时内进行植入。通过使用抗人CD45和抗小鼠CD45抗体，在输注后4周、8周和12周对收集的血液进行流式细胞术分析来监测植入。移植后13周处死小鼠，收集骨髓、脾脏和胸腺用于通过流式细胞术和集落形成细胞单位测定进行分析。对于二次植入，将来自每只受者小鼠的50％骨髓移植到一只次级亚致死照射的NSG小鼠中。通过使用抗人CD45和抗小鼠CD45抗体，使用泛白细胞标志物CD45，在输注后4周、8周和12周对收集的血液进行流式细胞术分析来监测植入。移植后十五周，从次级小鼠收获骨髓和脾脏，并通过流式细胞术和集落形成细胞单位测定进行分析。

结果：

不受理论束缚，认为HSC中BCL11A类红细胞增强子的靶向基因破坏将在类红细胞谱系中选择性地下调BCL11A的表达并减轻对γ-珠蛋白表达的抑制，这允许产生含有升高的HbF蛋白的红细胞，即F细胞。升高的HbF防止了脱氧条件下红细胞的镰状化，并且对于β-地中海贫血和SCD的患者都将具有治疗性/治愈性。采用来自SCD患者的离体基因组编辑的HSC的自体造血干细胞移植(HSCT)还与干细胞扩增增强技术(例如芳烃受体(AHR)抑制剂，例如如WO 2010/059401(将其内容通过引用以其全文并入)中所述，例如化合物4)组合，以改善体外扩增并增加递送的基因经修饰的HSC的剂量。

对于通过可编程核酸酶Cas9进行的高效基因组编辑，成功将指导RNA(gRNA)和Cas9蛋白递送到靶细胞和组织中是必不可少的。最近的报道证明，当通过电穿孔将Cas9核糖核蛋白(RNP)复合物递送到靶细胞中时，所述复合物可以在几种不同的细胞类型中完成高效和特异性的基因组编辑。Cas9-RNP复合物几乎在递送后立即切割染色体DNA并在细胞中迅速降解，从而减少脱靶效应。相反，使用用于递送Cas9的质粒和病毒载体系统导致酶的延长表达，从而加重与该系统相关的脱靶效应。另外，将RNP递送到靶细胞中不需要额外的工具，这将极大地促进基因组编辑在临床中用于治疗目的的翻译。将纯化的重组Cas9蛋白和gRNA复合物(RNP)递送到培养的HSPC中，并且使用的概述实验显示在图17中。

从大肠杆菌纯化重组的Cas9蛋白，并与由crRNA和tracr组成的合成双gRNA(dgRNA)或全长单指导RNA(sgRNA)复合以产生核糖核蛋白(RNP)复合物。表14中显示了该研究中使用的gRNA的列表和序列。如材料和方法所述，经由电穿孔将RNP复合物电穿孔到健康或SCD患者衍生的骨髓CD34+ HSPC中。在递送RNP复合物之前，将细胞在含有化合物4的HSC扩增培养基中扩增2天。活跃地分裂的细胞可以促进通过电穿孔递送的RNP复合物的摄取。为了促进从转染过程的恢复，将细胞在含有化合物4的改良的扩增培养基中再培养两天。通过使用7AAD的流式细胞术确定电穿孔后48小时的细胞活力。存活率相对较高，>80％的细胞存活(图18)，这表明与文献中报道的Cas9和gRNA递送系统的其他方法相比，RNP复合物的HSPC耐受性电穿孔相对较好。

表14.gRNA列表，所述gRNA靶向本研究中使用的BCL11A类红细胞特异性增强子。

T7E1测定是评估基因组中特定位点处的编辑的便捷方法。在电穿孔后2天，从HSPC中提取基因组DNA。通过聚合酶链式反应(PCR)扩增靶向的BCL11A类红细胞增强子区域。对PCR产物进行T7E1测定。将T7E1测定的终产物进行2％琼脂糖凝胶电泳，并通过imageJ(http://rsb.info.nih.gov/ij/)来定量经编辑的等位基因百分比。预期的PCR产物大小和T7E1消化的片段的近似预期大小显示于图19中。总编辑频率标示为琼脂糖凝胶图像下方总编辑的百分比。在用BCL11A Cas9 RNP处理的细胞中观察到BCL11A基因座处的基因组编辑，但在模拟电穿孔的对照细胞中没有观察到(图19)。

使BCL11A的+58类红细胞增强子区域的基因组PCR产物也进行下一代测序(NGS)。NGS有助于同时监测大量样品，从而全面了解等位基因。此外，它提供了有关插入和缺失(插入/缺失)的异质性的信息。将所述序列与来自对照(模拟)处理细胞的序列进行比较。序列分析的结果显示，通过NHEJ修复了CRISPR-Cas9诱导的双链断裂，这导致位于+58BCL11A类红细胞增强子区域中的Cas9切割位点附近的小缺失和插入(插入/缺失)的可变频率(图20和表15)。总体而言，与靶向相同序列的dgRNA相比，对于sgRNA所观察到的编辑效率更高，14个sgRNA中的12个在超过50％的等位基因处产生编辑(图20和表15)，尽管(不受理论束缚)在sgRNA和dgRNA之间的效率的不同可能受材料来源的影响。

表15.在用Cas9-RNP编辑的HSPC中，通过NGS鉴定的基因型。给出了每个群的核苷酸序列。由每种gRNA靶向的靶序列在每个插入/缺失群上方表示，PAM序列以小写字母表示。虚线表示缺失的碱基，并且小写字母表示插入。在对gRNA的描述中，dgRNA是指包含指定的靶向结构域的双gRNA分子。sgRNA表示包含指定的靶向结构域的单个gRNA分子。在使用相同dgRNA或sgRNA进行多个实验的情况下，连续实验被标记为“dgRNA”、“d1gRNA”、“d2gRNA”等。

为了确定CD34+ HSPC是否在离体操作(包括基因组编辑)后保留其分化为效应细胞的多谱系潜力，对选择的gRNA进行体外集落形成细胞(CFC)单位测定。将基因组编辑的细胞悬浮于补充细胞因子的甲基纤维素中，并在37℃，在5％CO₂的潮湿气氛中维持14天。形成了离散集落，根据成熟细胞的数量和类型使用形态学和表型标准(STEMvision)对这些离散菌落进行分类和计数，所述标准包含对集落形成单位-类红细胞(CFU-E)、爆发集落形成单位-类红细胞(BFU-E)、集落形成单位-粒细胞/巨噬细胞(CFU-GM)以及集落形成单位-粒细胞/红细胞/巨噬细胞/巨核细胞(CFU-GEMM；图21)的贡献并对其进行评分。模拟转染细胞的集落形成潜力最高，其次是靶向BCL11A的+58类红细胞增强子的gRNA。对于靶向BCL11A类红细胞增强子的gRNA，观察到相似数量和类型的集落。靶向BCL11A的外显子2的指导RNA产生了最少数量的集落(图22)。

通过实时PCR定量单系类红细胞培养物中BCL11A、γ-和β-珠蛋白链的相对mRNA表达水平。将转录物水平针对人GAPDH转录物水平进行标准化。在基因组编辑的HSPC中，BCL11A mRNA水平降低。相反，在类红细胞分化的第7天和第14天，在未经编辑或经编辑的HSPC中在BCL11A的外显子2处的BCL11A mRNA水平保持相同(图23)。在类红细胞分化期间，在经编辑的HSPC中，γ-珠蛋白mRNA水平增加并且相应地β-珠蛋白mRNA水平逐渐降低(图23)。在源自基因组编辑细胞的红细胞中HbF的增加和β-珠蛋白(镰状珠蛋白)水平的降低可能通过减少镰状化来具有治疗意义。

使用与荧光染料缀合的抗体，通过流式细胞术分析在类红细胞分化的不同阶段(第7天、第14天和第21天)的基因组编辑和未编辑的HSPC中胎儿珠蛋白和两种类红细胞表面标志物(转铁蛋白受体(CD71)和血型糖蛋白A(CD235a))的表达水平。通过排除7AAD来识别并门控活细胞。基因组编辑不会不利地影响类红细胞分化，因为培养的细胞显示出与晚期成红细胞一致的类似的CD71和CD235A阳性水平。+58类红细胞增强子区域的基因组编辑导致含HbF的细胞(高达67％)比其他gRNA和模拟电穿孔细胞更大的增加(图24)。通过g7gRNA靶向BCL11A的外显子2观察到非常高的对HbF阳性细胞的诱导。然而，外显子2靶向的细胞的细胞增殖和集落形成潜力显著降低(图21和22)。

在对靶向的区域进行深度测序后，我们注意到GATA1和TAL1结合基序在基因组编辑的靶区域中是完整的(图25)。最近的文献证明了GATA1结合位点在调节BCL11A表达和抑制胎儿珠蛋白中的重要性。Viestra等人,Nature Methods.[自然方法]2015,12:927。与文献报道相比，这些文献报道显示了这两个基序用于在成人红细胞中维持BCL11A水平的重要性，我们的调查结果表明这两个转录因子结合位点上游的序列在调节BCL11a基因表达方面也很重要，并且即使当GATA1和TAL1结合位点保持完整时，也仅在这些上游位点处的基因组编辑才导致HbF的上调。

实例3.1

方法：

人CD34⁺细胞培养。根据制造商的说明书使用免疫选择(美天旎公司(Miltenyi))从来自成年供体的G-CSF动员的外周血(澳赛尔斯公司)分离人CD34+细胞，并使用StemSpanSFEM(干细胞技术公司；目录号09650)扩增3天，该StemSpan SFEM补充有各自50ng/mL的促血小板生成素(Tpo)、Flt3配体(Flt-3L，生命科技公司，目录#PHC9413)、人干细胞因子(SCF，生命科技公司，目录#PHC2113)和人白细胞介素-6(IL-6，生命科技公司，目录#PHC0063)、以及1x抗生素/抗真菌剂(Gibco公司，目录#10378-016)和500nM化合物4。

装配Cas9和指导RNA核糖核蛋白(RNP)复合物，制备HSPC，并将RNP电穿孔到HSPC中。在电穿孔之前立即制备Cas9-指导RNA核糖核蛋白复合物(RNP)。对于使用双指导RNA(dgRNA)形成RNP，首先将各自3μg的crRNA(以2.24μL)和tracr(以1.25μL)在95℃在分开的管中变性2分钟，然后冷却至室温。为了制备Cas9蛋白，将6μg的CAS9蛋白(以1μL)与0.5μL的5x CCE缓冲液(20mM HEPES、100mM KCL、5mM MgCL2、5％甘油和新鲜添加的1mM DTT)混合。首先将Tracr与Cas9制剂混合并在37℃孵育5分钟。然后将crRNA添加到Tracr/CAS9复合物中并在37℃孵育5分钟。对于无/对照条件，将媒介物而不是crRNA添加到Tracr/CAS9复合物中。通过离心来收集HSPC并以2.5x 10⁶/mL的细胞密度重悬于P3原代细胞溶液(龙沙集团，目录号PBP3-00675)中。通过上下吸移将RNP与20μL细胞混合，并在室温下孵育2分钟。使用4D-核转染仪(龙沙集团)上的代码CM-137，对该RNP/细胞混合物(20μL)进行电穿孔。进行重复的20μL的电穿孔。对于本实例3.1中的实验，所使用的tracr为SEQ ID NO:7808，并且crRNA具有以下形式和序列，其中示出了2'O-甲基(m)和硫代磷酸酯键(*)修饰：mN*mN*mN*rNrNrNrNrNrNrNrNrNrNrNrNrNrNrNrNrNrGrUrUrUrUrArGrArGrCrUrArU*mG*mC*mU，其中N是所示靶向结构域的核苷酸(例如，如通过CRxxxxx标识符所示)。

进行含HbF的类红细胞的体外红细胞生成和FACS分析。电穿孔后，立即将细胞转移到250μL预温热的类红细胞分化培养基(EDM)中，该培养基由IMDM(Hyclone公司，目录#SH30228.01)、330μg/mL人全转铁蛋白(Invitria公司，目录#777TRF029)、10μg/mL重组人胰岛素(Gibco公司，目录#A1138211)、2IU/mL肝素(西格玛公司(Sigma)，部分#H3393)、5％人AB血清(西格玛公司，目录#H4522)、125ng/mL人促红细胞生成素(派普泰克公司(Peprotech)#10779-058)和1x抗生素/抗真菌剂(Gibco公司，目录号#10378-016)组成。EDM进一步补充有1μM氢化可的松(西格玛公司，H8672)、100ng/mL人SCF(生命科技公司，目录#PHC2113)和5ng/mL人IL-3(派普泰克公司，#10779-598)。2天后，将细胞培养物稀释于新鲜培养基中。将培养物保持总共7天，此时通过细胞内染色来分析细胞的HbF表达。简而言之，将细胞用PBS洗涤一次，重悬于可固定紫死细胞染色剂(Fixable VioletDead Cell Stain)(赛默飞世尔公司(ThermoFisher)L34963；在PBS中的1:1000)中并孵育30分钟。然后洗涤细胞并用抗CD71-BV711抗体(飞世尔科学有限责任公司(FisherScientific Company Llc.)BDB563767)和抗CD235a-APC(BD 551336)抗体染色30分钟。然后洗涤细胞，随后用固定缓冲液(Biolegend公司，目录#420801)进行固定，并根据制造商的说明用1x细胞内染色透化洗涤缓冲液(Biolegend公司，目录号#421002)进行透化。然后在室温将细胞与在50μL的1x细胞内染色透化洗涤缓冲液中的0.5μL抗HbF-PE抗体(生命科技公司，部分#MHFH04)一起孵育20分钟。将细胞用2mL的1x细胞内染色透化洗涤缓冲液洗涤两次，并重悬于染色缓冲液中，并在LSRFortessa流式细胞仪(BD生物科学公司(BDBiosciences))上分析HbF表达。使用Flowjo分析结果，并且将数据表示为活CD71阳性类红细胞群中HbF阳性细胞(F细胞)的％。

进行基因组DNA制备和下一代测序(NGS)。使用快速提取DNA提取溶液(Epicentre公司，目录#QE09050)在电穿孔后48小时从编辑和未编辑的HSPC制备基因组DNA。为了确定编辑效率以及插入和缺失(插入/缺失)的模式，使用位于靶位点侧翼的引物产生PCR产物，然后对其进行下一代测序(NGS)。未编辑样品中相应序列的编辑百分比通常小于1％并从未超过3％。

结果：

不受理论束缚，认为BCL11A类红细胞增强子区域的靶向遗传破坏将减轻对γ-珠蛋白表达的抑制，这允许产生含有升高的HbF蛋白的红细胞(表达胎儿血红蛋白(例如表达升高的胎儿血红蛋白水平)的细胞有时在本文中称为“F-细胞”。在实施例中，如果一种细胞产生至少6皮克胎儿血红蛋白/细胞，则认为这种细胞是F-细胞)。升高的HbF防止了脱氧条件下红细胞的镰状化，并且对于β-地中海贫血和SCD的患者都将具有治疗性/治愈性。采用来自SCD患者的离体基因组编辑的HSC的自体造血干细胞移植(HSCT)还与干细胞扩增增强技术(例如芳烃受体(AHR)抑制剂，例如如WO 2010/059401(将其内容通过引用以其全文并入)中所述，例如化合物4)组合，以改善体外扩增并增加递送的基因经修饰的HSC的剂量。

从大肠杆菌纯化重组的Cas9蛋白，并与由crRNA和tracr组成的合成双gRNA(dgRNA)复合以产生核糖核蛋白(RNP)复合物。该研究中使用的gRNA列表(例如，包含所示CRxxxxxx标识符的靶向结构域的gRNA)示于表17中。如材料和方法下所述，通过电穿孔将RNP复合物电穿孔到CD34+ HSPC中。在递送RNP复合物之前对细胞进行扩增。活跃地分裂的细胞可以促进通过电穿孔递送的RNP复合物的摄取。

表17.gRNA列表，所述gRNA靶向本研究中使用的BCL11A类红细胞特异性增强子区域。如材料和方法中所述，对所有的gRNA分子以dgRNA形式一式两份进行测试。

使用与荧光染料缀合的抗体，通过流式细胞术分析基因组编辑和未编辑的HSPC中胎儿珠蛋白和两种类红细胞表面标志物(转铁蛋白受体(CD71)和血型糖蛋白A(CD235a))的表达水平。通过排除Live Dead Violet来识别并门控活细胞。与模拟电穿孔的细胞(22.4％)相比，BCL11A类红细胞特异性增强子区域靶向导致了含有HbF的类红细胞百分比增加(高达50.7％)(表17)。还平行观察到dgRNA对HbF阳性细胞的诱导，所述dgRNA包括靶向BCL11A的外显子2的g8的靶向结构域。对BCL11A类红细胞增强子区域的基因组PCR产物也进行下一代测序(NGS)以确定编辑的等位基因在细胞群中的百分比。导致超过40％的HbF+细胞的dgRNA处理具有74.8％至94.0％的编辑范围(表17)。对于相同的靶向结构域，本实例中的dgRNA在tracr和crRNA序列方面与实例3中的不同；然而，对于大多数靶向结构域，编辑和HbF诱导在dgRNA形式上是相似的。值得注意的是，本研究中dgRNA形式的CR000317_EH4导致对50.7％HbF+细胞的高HbF诱导。由基因组编辑的细胞衍生的含HbF的类红细胞的增加可能通过减少镰刀化而具有积极的治疗意义。

实例3.2.使用靶向HSPC中BCL11a增强子的+58区域的gRNA优化gRNA编辑和胎儿血红蛋白上调。

基于来自对靶向BCL11a增强子的+58区域的gRNA的综合筛选的％编辑结果，选择8个gRNA靶向结构域用于进一步研究和优化。为了测试针对gRNA分子的修饰对％编辑、类红细胞分化和胎儿血红蛋白表达的影响，设计了靶向BCL11a增强子区域的+58区域内的位点的八种不同形式的gRNA分子。制造了包含靶向结构域CR00309、CR00311、CR00312、CR00316、CR01125、CR01126、CR01127和CR01128的以下形式的gRNA：

dgRNA(除了如实例1中所述的靶向结构域的那些序列之外的所有序列)：

1.未经修饰的crRNA和未经修饰的tracr(“未经修饰的(Unmodified/Unmod)”)

2.未经修饰的crRNA和未经修饰的tracr，但仅具有指定的靶向结构域的5'-18个核苷酸(不是完整的20个核苷酸)(“18个核苷酸”)

3.用硫代磷酸酯键经修饰的crRNA的三个3'核苷酸和三个5'核苷酸，以及未经修饰的tracr(“PS”)

4.在crRNA的5'和3'末端的额外的反向无碱基残基，以及未经修饰的tracr(“Invd”)

5.用硫代磷酸酯键和用2'-O甲基基团经修饰的crRNA的三个3'核苷酸和三个5'核苷酸，以及未经修饰的tracr(“OMePS”)

6.用2'-氟基团经修饰的crRNA的三个3'核苷酸和三个5'核苷酸，以及未经修饰的tracr(“F”)

7.用硫代磷酸酯键和用2'-氟基团经修饰的crRNA的三个3'核苷酸和三个5'核苷酸，以及未经修饰的tracr(“F-PS”)

sgRNA(除了靶向结构域之外的所有序列如实例1中所述)：

1.未经修饰的sgRNA(“未经修饰的(Unmodified/Unmod)”)

2.仅由指定的靶向结构域的5'-18个核苷酸(不是完整的20个核苷酸)组成的靶向结构域(“18个核苷酸”)

3.用硫代磷酸酯键经修饰的sgRNA的三个3'核苷酸和三个5'核苷酸(“PS”)

4.在sgRNA的5'和3'末端的额外的反向无碱基残基(“Invd”)

5.用硫代磷酸酯键和用2'-O甲基基团经修饰的sgRNA的三个3'核苷酸和三个5'核苷酸(“OMePS”)

6.用2'-氟基团经修饰的sgRNA的三个3'核苷酸和三个5'核苷酸(“F”)

7.用硫代磷酸酯键和用2'-氟基团经修饰的sgRNA的三个3'核苷酸和三个5'核苷酸(“F-PS”)

所有其他试剂和方法如实例3中所描述。所有结果以一式两份进行，并且将结果报告在图28-32中。图28A和图28B显示在包含所示双指导RNA(dgRNA)的RNP进行的电穿孔后2天，在CD34+细胞中的如通过NGS所测量的％编辑。图29显示在包含所示单指导RNA(sgRNA)的RNP进行的电穿孔后2天，在CD34+细胞中的如通过NGS所测量的％编辑。图30显示在包含所示双指导RNA(dgRNA)的RNP进行的电穿孔后，在将经编辑的CD34+细胞转移至类红细胞分化培养基后第14天，如通过流式细胞术所测量的％HbF阳性细胞。图31显示在包含所示单指导RNA(sgRNA)的RNP进行的电穿孔后，在将经编辑的CD34+细胞转移至类红细胞分化培养基后第14天，如通过流式细胞术所测量的％HbF阳性细胞。图32显示在类红细胞分化培养基中14天后，经编辑的细胞的成倍扩增。这些结果表明，dgRNA和sgRNA两种形式的所选gRNA分子中的许多种能够在靶位点处实现基因组编辑，其中效率超过90％，并且在某些情况下，当作为RNP经由电穿孔递送至CD34+细胞时，效率超过98％。同样，相对于未经修饰的细胞(“模拟”)，许多所选gRNA能够实现％F细胞超过20％的增加。最后，虽然HSPC中BCL11A类红细胞增强子的基因组编辑降低了类红细胞的扩增能力，但一些gRNA(例如CR00309)的效果比其他gRNA(例如CR00312)更明显，但是大多数分化为红细胞的经编辑的细胞群能够在离体类红细胞分化培养基中的14天内实现500-1500次之间的群倍增，这表明经编辑的细胞可以在治疗上用于治疗患者的血红蛋白病，如镰状细胞疾病或β地中海贫血。

实例4.在造血干细胞和祖细胞(HSPC)中使用CRISPR-Cas9进行HPFH区域编辑，用于在成年类红细胞中胎儿珠蛋白表达的去阻抑

方法：

人CD34⁺细胞培养。根据制造商的说明书使用免疫选择(美天旎公司(Miltenyi))从来自成年供体的G-CSF动员的外周血(澳赛尔斯公司)分离人CD34+细胞，并使用StemSpanSFEM(干细胞技术公司；目录号09650)扩增4至6天，该StemSpan SFEM补充有各自50ng/mL的促血小板生成素(Tpo)、Flt3配体(Flt-3L，生命科技公司，目录#PHC9413)、人干细胞因子(SCF，生命科技公司，目录#PHC2113)和人白细胞介素-6(IL-6，生命科技公司，目录#PHC0063)、以及1x抗生素/抗真菌剂(Gibco公司，目录#10378-016)和500nM化合物4。贯穿该实例(包括其子实例)，在方案指示细胞被“扩增”的情况下，使用该培养基。贯穿该实例(包括其子实例)，该培养基也称为“干细胞扩增培养基”或“扩增培养基”。

装配Cas9和指导RNA核糖核蛋白(RNP)复合物，制备HSPC，并将RNP电穿孔到HSPC中。在电穿孔之前立即制备Cas9-指导RNA核糖核蛋白复合物(RNP)。对于使用双指导RNA(dgRNA)形成RNP，首先将各自3μg的crRNA(以2.24μL)和tracr(以1.25μL)在95℃在分开的管中变性2分钟，然后冷却至室温。为了制备Cas9蛋白，将6μg的CAS9蛋白(以0.8μL至1μL)与0.5μL的5x CCE缓冲液(20mM HEPES、100mM KCL、5mM MgCL2、5％甘油和新鲜添加的1mMDTT)混合。首先将Tracr与Cas9制剂混合并在37℃孵育5分钟。然后将crRNA添加到Tracr/CAS9复合物中并在37℃孵育5分钟。对于无/对照条件，将媒介物而不是crRNA添加到Tracr/CAS9复合物中。通过离心来收集HSPC，并以5x 10⁶/mL的细胞密度重悬于Neon电穿孔试剂盒附带(英杰公司；目录号：MPK1096)的T缓冲液中。通过上下吸移将RNP与20μL细胞混合，并在室温下孵育2分钟。将该RNP/细胞混合物(10μL)转移到Neon电穿孔探针中。用Neon转染系统(英杰公司；MPK5000S)，使用1700伏/20毫秒和1个脉冲进行电穿孔。进行重复的10μL的电穿孔。

基因表达分析。在如上所述的7天的体外红细胞生成后，使用Zymo研究ZR-96快速RNA试剂盒(Zymo公司，目录#R1053)将约1x 10⁵个细胞用于纯化RNA。使用Quantiscript反转录试剂盒(凯杰公司，目录#205313)，将高达1μg的RNA用于第一链合成。根据供应商方案，使用2x Taq-Man快速前进PR混合物(Taq-Man Fast Advance PR Mix，生命科技公司，目录#4444963)以及针对GAPDH(生命科技公司，ID#Hs02758991_g1，VIC)、HBB(生命科技公司，Hs00747223_g1，VIC)和HBG2/HBG1(生命科技公司，ID#Hs00361131_g1，FAM)的Taq-Man基因表达测定来进行Taq-man实时定量PCR。将每个基因的相对表达标准化为GAPDH表达，并通过ΔΔCt方法报告为无/对照RNP递送的样品的倍数。可替代地，在转化为GAPDH标准化的转录物的相对量(2^-ΔCt)之后，将HBG2/HBG1表达水平计算为HBB和HBG2/HBG1表达的总和的百分比。

进行基因组DNA制备和下一代测序(NGS)。使用快速提取DNA提取溶液(Epicentre公司，目录#QE09050)在电穿孔后48小时从编辑和未编辑的HSPC制备基因组DNA。为了确定编辑效率以及插入和缺失(插入/缺失)的样式，使用位于靶位点侧翼的引物产生PCR产物，然后对其进行如该文献中所述的下一代测序(NGS)。未编辑的样品(仅用由Cas9和Tracr组成的RNP进行电穿孔)中相应序列的编辑百分比通常小于1％且从未超过3％。

结果：

不受理论束缚，认为HPFH区域的靶向遗传破坏将减轻对γ-珠蛋白表达的抑制，这允许产生含有升高的HbF蛋白的红细胞(表达胎儿血红蛋白的细胞有时在本文中称为“F-细胞”)。升高的HbF防止了脱氧条件下红细胞的镰状化，并且对于β-地中海贫血和SCD的患者都将具有治疗性/治愈性。采用来自SCD患者的离体基因组编辑的HSC的自体造血干细胞移植(HSCT)还与干细胞扩增增强技术(例如芳烃受体(AHR)抑制剂，例如如WO 2010/059401(将其内容通过引用以其全文并入)中所述，例如化合物4)组合，以改善体外扩增并增加递送的基因经修饰的HSC的剂量。

从大肠杆菌纯化重组的Cas9蛋白，并与由crRNA和tracr组成的合成双gRNA(dgRNA)复合以产生核糖核蛋白(RNP)复合物。表16中显示了该研究中使用的gRNA的列表和序列。如材料和方法下所述，通过电穿孔将RNP复合物电穿孔到CD34+ HSPC中。在递送RNP复合物之前对细胞进行扩增。活跃地分裂的细胞可以促进通过电穿孔递送的RNP复合物的摄取。

表16.gRNA列表，所述gRNA靶向本研究中使用的HPFH区域。所有gRNA分子以上述dgRNA形式以一式两份进行测试，除了g8(由mN*mN*mN*rNrNrNrNrNrNrNrNrNrNrNrNrNrNrNrNrNrGrUrUrUrUrArGrArGrCrUrArU*mG*mC*mU组成的crRNA，其中N是靶向结构域的残基，并且如下表示修饰：2'O-甲基(m)和硫代磷酸酯键(*)；tracr序列SEQ ID NO:7808)以及无/对照。在16个重复中各自测试g8以及无/对照。

使用与荧光染料缀合的抗体，通过流式细胞术分析基因组编辑和未编辑的HSPC中胎儿珠蛋白和两种类红细胞表面标志物(转铁蛋白受体(CD71)和血型糖蛋白A(CD235a))的表达水平。通过排除Live Dead Violet来识别并门控活细胞。基因组编辑不会不利地影响类红细胞分化，因为培养的细胞显示出与成红细胞一致的与未编辑细胞相似的CD71+细胞百分比。与模拟电穿孔的细胞(21.0％)相比，HPFH区域靶向导致了含有HbF的类红细胞百分比增加(高达51.4％)(表16)。还平行观察到dgRNA对HbF阳性细胞的诱导，所述dgRNA包括靶向BCL11A的外显子2的g8的靶向结构域。对HPFH区域的基因组PCR产物也进行下一代测序(NGS)以确定经编辑的等位基因在细胞群中的百分比。在用包含Cas9、具有给定靶向结构域的crRNA、和Tracr的RNP进行电穿孔的许多细胞培养物中观察到HFPH基因座处的基因组编辑高百分比(表16)，但是在无靶向结构域递送(仅含有Cas9和Tracr的RNP)的对照细胞中没有观察到。具体而言，导致超过40％的HbF+细胞的dgRNA处理具有43.0％至91.7％的经编辑的等位基因的范围(表16)。

表18.在当前研究中，对用靶向HPFH区域的gRNA编辑的选择培养物的基因表达分析。所有的gRNA分子都以dgRNA形式以一式两份进行测试。如材料和方法中所述确定并报告胎儿γ-珠蛋白(γ-珠蛋白，HBG2/HBG1基因)、成人β-珠蛋白(β-珠蛋白，HBB基因)和甘油醛-3-磷酸脱氢酶(GAPDH基因)的表达。

还分析了该研究中一些培养物的血红蛋白基因表达。在这些靶向结构域中，胎儿γ-珠蛋白基因表达被诱导超过无/对照1.6至3.8倍，伴随着成人β-珠蛋白表达的适度降低(无/对照的0.58至0.91倍)(表18)。这些效应共同导致γ-珠蛋白表达水平在细胞群中总β型珠蛋白(γ/[γ+β])的13.8％至26.6％的范围内(表17)，其中跨靶向结构域的相对胎儿珠蛋白诱导与对于HbF蛋白诱导所观察到的相似(表16)。在源自经基因组编辑的细胞的红细胞中HbF/γ-珠蛋白的增加或者HbF/γ-珠蛋白的增加连同β-珠蛋白(镰状珠蛋白)水平的降低可能通过减少镰状化来具有治疗意义。

实例4.2

方法：方法如实例4，但有以下例外。

装配Cas9和指导RNA核糖核蛋白(RNP)复合物，制备HSPC，并将RNP电穿孔到HSPC中。将通过离心收集的HSPC以2.5x 10⁶/mL的细胞密度重悬于P3原代细胞溶液(龙沙集团，目录号PBP3-00675)中。通过上下吸移将RNP与20μL细胞混合，并在室温下孵育2分钟。使用4D-核转染仪(龙沙集团)上的代码CM-137，对该RNP/细胞混合物(20μL)进行电穿孔。

结果：

从大肠杆菌纯化重组的Cas9蛋白，并与由crRNA和tracr组成的合成双gRNA(dgRNA)复合以产生核糖核蛋白(RNP)复合物。表19中显示了该研究中使用的gRNA的列表。如材料和方法下所述，通过电穿孔将RNP复合物电穿孔到CD34+ HSPC中。在递送RNP复合物之前对细胞进行扩增。活跃地分裂的细胞可以促进通过电穿孔递送的RNP复合物的摄取。

表19.gRNA列表，所述gRNA靶向本研究中使用的HPFH区域。所有gRNA分子均以dgRNA形式进行测试(g8除外，g8使用以下以dgRNA形式进行测试：由mN*mN*mN*rNrNrNrNrNrNrNrNrNrNrNrNrNrNrNrNrNrGrUrUrUrUrArGrArGrCrUrArU*mG*mC*mU组成的crRNA，其中N是靶向结构域的残基，并且如下表示修饰：2'O-甲基(m)和硫代磷酸酯键(*)；tracr序列SEQ ID NO:7808)。

使用与荧光染料缀合的抗体，通过流式细胞术分析基因组编辑和未编辑的HSPC中胎儿珠蛋白和两种类红细胞表面标志物(转铁蛋白受体(CD71)和血型糖蛋白A(CD235a))的表达水平。通过排除Live Dead Violet来识别并门控活细胞。基因组编辑不会不利地影响类红细胞分化，因为培养的细胞显示出与成红细胞一致的与未编辑细胞相似的CD71+细胞百分比。与模拟电穿孔的细胞(18.9％和21.1％)相比，HPFH区域靶向导致了含有HbF的类红细胞百分比增加(高达46.6％)(表19)。还平行观察到dgRNA对HbF阳性细胞的诱导，所述dgRNA包括靶向BCL11A的外显子2的g8的靶向结构域。

最后，通过NGS评估在包含靶向结构域CR003031、CR003033、CR003035、CR003037、CR003038、CR003052、CR003085的dgRNA的靶位点处或附近产生的插入/缺失样式。表27中显示了在每个位置处的靠前的5个最频繁的插入/缺失。

表27.在暴露于包含所示gRNA分子的RNP之后，每个靶序列中最频繁的5个插入/缺失。每种gRNA均以dgRNA进行测试。大写字母是在靶序列处及附近的天然存在的核苷酸。相对于未经修饰的靶序列的缺失显示为“-”；插入显示为小写字母。

这些结果支持来自本文所述的早期实验的结论，即，在由所示gRNA分子靶向的HPFH区域中的小插入/缺失(例如，在这种情况下，来自1-20个核苷酸的插入/缺失)可以对HbF的表达和产生具有显著影响。由基因组编辑的细胞衍生的含HbF的类红细胞的增加可能通过减少镰刀化而具有治疗意义。

实例4.3

方法：方法如实例4，但有以下例外。

人CD34⁺细胞培养。在递送RNP之前，将人CD34+细胞在扩增培养基中扩增3天。

装配Cas9和指导RNA核糖核蛋白(RNP)复合物，制备HSPC，并将RNP电穿孔到HSPC中。将通过离心收集的HSPC以6.4x 10⁶/mL的细胞密度重悬于P3原代细胞溶液(龙沙集团，目录号PBP3-00675)中。通过上下吸移将RNP与20μL细胞混合，并在室温下孵育2分钟。使用4D-核转染仪(龙沙集团)上的代码CM-137，对该RNP/细胞混合物(20μL)进行电穿孔。以一式两份进行电穿孔。Tracr为SEQ ID NO:7808，并且crRNA具有以下形式，其中示出了2'O-甲基(m)和硫代磷酸酯键(*)修饰：mN*mN*mN*rNrNrNrNrNrNrNrNrNrNrNrNrNrNrNrNrNrGrUrUrUrUrArGrArGrCrUrArU*mG*mC*mU，其中N是靶向结构域的核苷酸。

进行含HbF的类红细胞的体外红细胞生成和FACS分析。电穿孔后，立即将细胞转移到由EDM和补充剂组成的预热的培养基中。在第0天-第7天的培养期间，EDM进一步补充有1μM氢化可的松(西格玛公司，H8672)、100ng/mL人SCF(生命科技公司，目录#PHC2113)和5ng/mL人IL-3(派普泰克公司，#10779-598)。在第7天-第11天的培养期间，EDM仅补充有100ng/mL的人SCF。在第11天-第21天的培养期间，EDM没有额外的补充剂。在第0天以2.6x 10⁴个细胞/ml开始细胞培养，在第7天调节至4.0x 10⁴个细胞/ml，并在第11天调节至1.0x 10⁶个细胞/ml。在第14天和第19天，再加满培养基。在RNP递送后1天、4天、7天、11天、14天和21天对活细胞进行计数。使用AccuCheck计数珠(赛默飞世尔公司，目录号PCB100)，通过流式细胞术确定所有活细胞计数，其中通过DAPI(4',6-二脒基-2-苯基吲哚)染色来辨别不能生存的细胞。在培养的第7天、第16天和第21天，通过细胞内染色来分析细胞(1x 10⁵个)的HbF表达。在第16天和第21天，用于HbF表达的细胞内染色不包括抗CD71和抗CD235a抗体，并且报道了在整个活细胞群中HbF阳性细胞(F-细胞)的％。在第21天，使用可固定近红外死细胞染色剂(赛默飞世尔L34975)作为活力染料。

进行基因组DNA制备和下一代测序(NGS)。使用快速提取DNA提取溶液(Epicentre公司，目录#QE09050)在电穿孔后7天从编辑和未编辑的HSPC制备基因组DNA。

结果：

从大肠杆菌纯化重组的Cas9蛋白，并与由crRNA和tracr组成的合成双gRNA(dgRNA)复合以产生核糖核蛋白(RNP)复合物。表20中显示了该研究中使用的gRNA的列表。如材料和方法下所述，通过电穿孔将RNP复合物电穿孔到CD34+ HSPC中。在递送RNP复合物之前对细胞进行扩增。活跃地分裂的细胞可以促进通过电穿孔递送的RNP复合物的摄取。

表20.本研究中相对的活细胞增殖。显示了单独的电穿孔重复。所有gRNA均以dgRNA形式使用tracr SEQ ID NO:7808进行测试，并且crRNA具有以下形式，其中示出了2'O-甲基(m)和硫代磷酸酯键(*)修饰：mN*mN*mN*rNrNrNrNrNrNrNrNrNrNrNrNrNrNrNrNrNrGrUrUrUrUrArGrArGrCrUrArU*mG*mC*mU，其中N是靶向结构域的核苷酸。(n.d.未确定)

在三阶段的类红细胞分化细胞培养方案中分析基因组编辑和未编辑的HSPC的增殖。电穿孔后1天的细胞恢复百分比范围为58％至96％，并且其在各种条件(包括未编辑但电穿孔的对照)下是类似的(表20)。在由dgRNA(包含靶向BCL11A的外显子2的g8的靶向结构域)编辑的细胞中增殖受到抑制(在第21天，为未编辑对照的10％-12％，表20)，但是用所包含的HPFH区域靶向性dgRNA编辑的细胞的增殖与对照相似(在第21天，为未编辑对照的47％-99％，表20)。

表21.本研究中的HbF诱导显示了单独的电穿孔重复。所有的gRNA分子都以dgRNA形式进行测试。所有gRNA均以dgRNA形式使用tracr SEQ ID NO:7808进行测试，并且crRNA具有以下形式，其中示出了2'O-甲基(m)和硫代磷酸酯键(*)修饰：mN*mN*mN*rNrNrNrNrNrNrNrNrNrNrNrNrNrNrNrNrNrGrUrUrUrUrArGrArGrCrUrArU*mG*mC*mU，其中N是靶向结构域的核苷酸。(n.d.未确定)

使用与荧光染料缀合的抗体，通过流式细胞术分析基因组编辑和未编辑的HSPC中胎儿珠蛋白和两种类红细胞表面标志物(转铁蛋白受体(CD71)和血型糖蛋白A(CD235a))的表达水平。通过排除Live/Dead可固定死细胞染色剂来识别并门控活细胞。基因组编辑不会不利地影响类红细胞分化，因为培养的细胞显示出与成红细胞一致的与分化第7天的未编辑细胞相似的CD71+细胞百分比。在整个21天的培养期中，与模拟电穿孔细胞相比，用所包含的HPFH区域靶向性dgRNA处理的培养物产生增加的包含HbF的类红细胞百分比(表21)。还平行观察到dgRNA对HbF阳性细胞的诱导，所述dgRNA包括靶向BCL11A的外显子2的g8的靶向结构域。对HPFH区域的基因组PCR产物也进行下一代测序(NGS)以确定编辑的等位基因在细胞群中的百分比。在用包含Cas9、具有给定靶向结构域的crRNA、和Tracr的RNP进行电穿孔的细胞培养物中观察到HFPH基因座处的基因组编辑(表21)，但是在无靶向结构域递送(仅含有Cas9和Tracr的RNP)的对照细胞中没有观察到。由基因组编辑的细胞衍生的含HbF的类红细胞的增加可能通过减少镰刀化而具有治疗意义。

实例4.4

方法：方法如实例4，但有以下例外。

人CD34⁺细胞培养。取决于研究，在递送RNP之前，将人CD34+细胞在扩增培养基中扩增3至6天。

装配Cas9和指导RNA核糖核蛋白(RNP)复合物，制备HSPC，并将RNP电穿孔到HSPC中。对于一些研究，使用4D-核转染仪(龙沙集团)递送RNP复合物。在那些研究中，将通过离心收集的HSPC以2.2x 10⁶/mL至6.4x 10⁶/mL的细胞密度(取决于研究)重悬于P3原代细胞溶液(龙沙集团，目录号PBP3-00675)中。通过上下吸移将RNP与20μL细胞混合，并在室温下孵育2分钟。使用4D-核转染仪(龙沙集团)上的代码CM-137，对该RNP/细胞混合物(20μL)进行电穿孔。以一式两份进行电穿孔。dgRNA形式在研究之间变化，并且在表22中通过以下符号表示。形式A是以上实例1中所述的dgRNA形式，其中示出了靶向结构域序列。形式B是如下dgRNA形式，其使用具有rNrNrNrNrNrNrNrNrNrNrNrNrNrNrNrNrNrNrNrNrGrUrUrUrUrArGrArGrCrUrArUrGrCrU的crRNA(其中r表示RNA碱基，N对应于所示的靶向结构域序列)以及tracr由SEQ ID NO:7808组成。形式C是如下dgRNA形式，其使用具有序列mN*mN*mN*rNrNrNrNrNrNrNrNrNrNrNrNrNrNrNrNrNrGrUrUrUrUrArGrArGrCrUrArU*mG*mC*mU的crRNA，其中r表示RNA碱基，N对应于所示的靶向结构域序列，m表示具有2'O-甲基经修饰的碱基，并且*表示硫代磷酸酯键，并且tracr由SEQ ID NO:7808组成。

进行含HbF的类红细胞的体外红细胞生成和FACS分析。在一项研究中，细胞培养在第0天以2.6x 10⁴个细胞/ml开始。对于通过直接接种到250μl中而开始的那些细胞培养(如实例4中所述)，将该细胞培养物在1至3天后(取决于研究)稀释于新鲜培养基中。

进行基因组DNA制备和下一代测序(NGS)。使用快速提取DNA提取溶液(Epicentre公司，目录#QE09050)，在电穿孔后24小时至7天(取决于研究)从编辑和未编辑的HSPC制备基因组DNA。

结果：

从大肠杆菌纯化重组的Cas9蛋白，并与由crRNA和tracr组成的合成双gRNA(dgRNA)复合以产生核糖核蛋白(RNP)复合物。表22中显示了研究中使用的gRNA的列表。如材料和方法下所述，通过电穿孔将RNP复合物电穿孔到CD34+ HSPC中。在递送RNP复合物之前对细胞进行扩增。活跃地分裂的细胞可以促进通过电穿孔递送的RNP复合物的摄取。

表22.多项研究的汇总数据，所述多项研究评估靶向HPFH区域的所示gRNA和对照。所有的gRNA分子都以dgRNA形式进行测试。如上所述指定了所示研究中dgRNA形式的细节。注意，评估4和5是平行进行的，因此共用对照条件。

使用与荧光染料缀合的抗体，通过流式细胞术分析基因组编辑和未编辑的HSPC中胎儿珠蛋白和两种类红细胞表面标志物(转铁蛋白受体(CD71)和血型糖蛋白A(CD235a))的表达水平。通过排除Live Dead Violet来识别并门控活细胞。与模拟电穿孔细胞相比，HPFH区域靶向导致含有HbF的类红细胞的百分比增加，在多个评估和dgRNA形式中结果一致(表22)。在一些情况下，％HbF+细胞的增加与特定的dgRNA形式(例如CR001028的形式C)相关(表22)。还平行观察到dgRNA对HbF阳性细胞的诱导，所述dgRNA包括靶向BCL11A的外显子2的g8的靶向结构域。对HPFH区域的基因组PCR产物也进行下一代测序(NGS)以确定编辑的等位基因在细胞群中的百分比。在用包含Cas9、具有给定靶向结构域的crRNA、和Tracr的RNP进行电穿孔的细胞培养物中观察到HFPH基因座处的基因组编辑(表22)，但是在无靶向结构域递送(仅含有Cas9和Tracr的RNP)的对照细胞中没有观察到。

最后，针对每种gRNA，通过NGS评估插入/缺失样式以及每个插入/缺失的频率。表26中显示了每个靶位点处最频繁出现的插入/缺失。表26.在暴露于包含所示gRNA分子的RNP之后，每个靶序列中最频繁的5个插入/缺失。在两个单独的实验中以dgRNA形式测试每种gRNA，并且每个实验的结果单独显示。大写字母是在靶序列处及附近的天然存在的核苷酸。相对于未经修饰的靶序列的缺失显示为“-”；插入显示为小写字母。

尽管在某些情况下，最频繁的插入/缺失的相对丰度因实验而异，但对于任何给定的gRNA，这两个实验中的靠前的插入/缺失大致相同。这表明对于这些dgRNA，在HSC细胞中产生的插入/缺失样式是一致的。同样，这些结果支持了早期实验中出人意料的发现，即由这些gRNA靶向的HPFH区域中的小插入/缺失(例如，在这种情况下，来自1-20个核苷酸的插入/缺失)可能导致胎儿血红蛋白的显著上调。由基因组编辑的细胞衍生的含HbF的类红细胞的增加可能通过减少镰刀化而具有治疗意义。

实例4.5

方法：方法如子实例4.1，但有以下例外。

人CD34⁺细胞培养。人CD34+细胞来源于骨髓(Hemacare公司，目录号BM34C-3)。将CD34+细胞解冻并在RNP递送之前在扩增培养基中扩增1天。在RNP递送后，将细胞立即转移回到200μl扩增培养基中并使其恢复过夜。第二天，对培养物进行计数并调节至2.0x 10⁵个活细胞/ml。根据RNP递送后1天的活细胞计数来计算恢复百分数，作为电穿孔的活细胞的百分比。再在扩增培养基中7天(RNP递送后8天)之后，再次确定活细胞计数。将增殖倍数计算为在扩增培养基中7天后的活细胞计数除以2.0x 10⁵个细胞/ml。使用AccuCheck计数珠(赛默飞世尔公司，目录号PCB100)，通过流式细胞术测量所有活细胞计数，其中通过DAPI(4',6-二脒基-2-苯基吲哚)染色来辨别不能生存的细胞。再在扩增培养基中1天(RNP递送后9天)之后，如细胞表型分析下所述，通过流式细胞术对细胞培养物进行表型分析。

装配Cas9和指导RNA核糖核蛋白(RNP)复合物，制备HSPC，并将RNP电穿孔到HSPC中。将通过离心收集的HSPC以5.4x 10⁶/mL的细胞密度重悬于P3原代细胞溶液(龙沙集团，目录号PBP3-00675)中。通过上下吸移将RNP与20μL细胞混合，并在室温下孵育2分钟。使用4D-核转染仪(龙沙集团)上的代码CM-137，对该RNP/细胞混合物(20μL)进行电穿孔。以一式两份进行电穿孔。使用的crRNA具有序列mN*mN*mN*rNrNrNrNrNrNrNrNrNrNrNrNrNrNrNrNrNrGrUrUrUrUrArGrArGrCrUrArU*mG*mC*mU，其中r表示RNA碱基，m表示具有2'O-甲基经修饰的碱基，并且*表示硫代磷酸酯键，N表示所示靶向结构域的残基。使用的tracr序列是SEQ ID NO:7808。

集落形成单位细胞分析。RNP递送后第二天，如所述对人CD34+细胞培养物中的活细胞进行计数。对于粒细胞/巨噬细胞祖细胞集落形成单位(CFU)测定，将227个细胞/1mLMethocult H4035甲基纤维素培养基(干细胞技术公司)以一式两份进行铺板。将1x抗生素/抗真菌剂(Gibco公司，目录#10378-016)添加到Methocult中。将培养皿在37℃的加湿培养箱中进行孵育。在铺板后第15天，对含有至少50个细胞的集落进行计数。将集落数/mlMethocult除以227并乘以1000以获得每1000个细胞的CFU频率。

细胞表型分析。在用以下抗体组染色后，分析细胞的表面标志物表达。第1组：对以下具有特异性的抗体：CD38(FITC-缀合物，BD生物科学公司#340926，克隆HB7)、CD133表位1(PE-缀合物，美天旎公司#130-080-801，克隆AC133)、CD34(PerCP-缀合物，BD生物科学公司#340666，克隆8G12)、CD90(APC-缀合物，BD生物科学公司#598695，克隆E10)、CD45RA(Pe-Cy7-缀合物，eBioscience公司#25-0458-42，克隆HI100)。第2组：：CD34(PerCP-缀合物，BD生物科学公司#340666，克隆8G12)、CD33(PE-Cy7-缀合物，BD生物科学公司#333946，克隆P67.6)、CD14(APC-H7-缀合物，BD生物科学公司#560270，克隆)、CD15(PE-缀合物，Biolegend公司#301905，克隆HI98)。第3组：CD34(PerCP-缀合物，BD生物科学公司#340666，克隆8G12)、CD41a(APC-H7-缀合物，BD生物科学公司#561422，克隆HIP8)、CD71(FITC-缀合物，BD生物科学公司#555536，克隆M-A712)、CD19(PE-缀合物，BD生物科学公司#340720，克隆SJ25C1)、CD56(APC-缀合物，Biolegend公司#318310，克隆HCD56)。除了包括抗CD45RA而不是其同种型对照之外，使用相应的同种型对照抗体组来平行地染色培养物。通过DAPI(4',6-二脒基-2-苯基吲哚)染色来辨别不能生存的细胞。在LSRFortessa流式细胞仪(BD生物科学公司)上分析染色样品的细胞表面蛋白表达。使用Flowjo分析结果，并且将数据表示为DAPI阴性活细胞群的％。

进行基因组DNA制备和下一代测序(NGS)。使用快速提取DNA提取溶液(Epicentre公司，目录#QE09050)，在电穿孔后1天和8天从编辑和未编辑的HSPC制备基因组DNA。

结果：

不受理论束缚，认为HPFH区域或BCL11A类红细胞增强子区域的靶向遗传破坏将减轻对γ-珠蛋白表达的抑制，这允许产生含有升高的HbF蛋白的红细胞(表达胎儿血红蛋白的细胞有时在本文中称为“F-细胞”)。升高的HbF防止了脱氧条件下红细胞的镰状化，并且对于β-地中海贫血和SCD的患者都将具有治疗性/治愈性。采用来自SCD患者的离体基因组编辑的HSC的自体造血干细胞移植(HSCT)还与干细胞扩增增强技术(例如芳烃受体(AHR)抑制剂，例如如WO 2010/059401(将其内容通过引用以其全文并入)中所述，例如化合物4)组合，以改善体外扩增并增加递送的基因经修饰的HSC的剂量。

从大肠杆菌纯化重组的Cas9蛋白，并与由crRNA和tracr组成的合成双gRNA(dgRNA)复合以产生核糖核蛋白(RNP)复合物。表23中显示了该研究中使用的gRNA的列表。如材料和方法下所述，通过电穿孔将RNP复合物电穿孔到CD34+ HSPC中。在递送RNP复合物之前对细胞进行扩增。活跃地分裂的细胞可以促进通过电穿孔递送的RNP复合物的摄取。

表23.在本研究中，对于编辑和未编辑的细胞培养物的相对活细胞恢复、CD34+培养基中的增殖、以及粒细胞/巨噬细胞祖细胞集落形成单位(CFU)频率。如材料和方法中所述计算恢复百分比、增殖倍数和CFU频率。显示了单独的电穿孔重复。所有的gRNA分子都以dgRNA形式进行测试。Tracr序列为SEQ ID NO:7808，并且crRNA具有以下形式，其中示出了2'O-甲基(m)和硫代磷酸酯键(*)修饰：mN*mN*mN*rNrNrNrNrNrNrNrNrNrNrNrNrNrNrNrNrNrGrUrUrUrUrArGrArGrCrUrArU*mG*mC*mU，其中N是所示靶向结构域的残基。

电穿孔后1天的细胞恢复百分比范围为72.5％至89.8％，并且其在各种条件(包括未编辑但电穿孔的对照)下是类似的(表23)。分析基因组编辑和未编辑的HSPC在CD34+细胞扩增培养基中的增殖。对于编辑的细胞培养物在7天内的增殖范围为4.8倍至17.3倍，而对于未编辑的细胞的增殖范围为19.3倍至20.5倍(表22)。与未编辑的对照相比，由本研究中靶向HPFH区域或BCL11A类红细胞增强子区域的dgRNA进行的编辑未改变培养物中如通过表面标志物表达所确定的细胞类型的组成，这表明在这些条件下靶向这些位点不会改变HSPC命运(图26A-26B)。相比之下，用靶向BCL11A外显子中的g8的dgRNA进行的编辑导致增殖适度降低但细胞组成明显改变，特别是所有CD34+HSPC亚型以及CD71+类红细胞群的百分比降低、以及CD14+单核细胞和CD15+粒细胞群的百分比增加(表23和图26A-26B)。在编辑的培养物中，粒细胞/巨噬细胞祖细胞集落形成单位(CFU)的频率是相似的，与未编辑的培养物(154到185个CFU/1000个细胞)相比，在编辑的培养物中仅有适度的CFU降低(范围从95到145个CFU/1000个细胞)，这表明通过靶向这些位点，粒细胞/巨噬细胞祖细胞功能没有大幅改变(表23)。

实例4.6

方法：方法如实例4，但有以下例外。

装配Cas9和指导RNA核糖核蛋白(RNP)复合物，制备HSPC，并将RNP电穿孔到HSPC中。在一些情况下，将含有两个不同靶向结构域的crRNA递送到相同的细胞培养物中。在这些情况下，递送至细胞的总RNP含有6μg的Cas9、3μg的crRNA和3μg的Tracr，如子实例4.1中所述；然而，含有各自1.5μg的两种crRNA是独立复合的含有1.5μg Tracr和3μg Cas9的Tracr/CAS9混合物，并且仅在添加到细胞中时才组合。将通过离心收集的HSPC以2.5x 10⁶/mL的细胞密度重悬于P3原代细胞溶液(龙沙集团，目录号PBP3-00675)中。通过上下吸移将RNP与20μL细胞混合，并在室温下孵育2分钟。使用4D-核转染仪(龙沙集团)上的代码CM-137，对该RNP/细胞混合物(20μL)进行电穿孔。以一式两份进行电穿孔。该dgRNA形式使用具有SEQ ID NO:7808的tracr、以及具有序列mN*mN*mN*rNrNrNrNrNrNrNrNrNrNrNrNrNrNrNrNrNrGrUrUrUrUrArGrArGrCrUrArU*mG*mC*mU的crRNA，其中r表示RNA碱基，m表示具有2'O-甲基经修饰的碱基，并且*表示硫代磷酸酯键，并且N表示所示靶向结构域的残基。

进行含HbF的类红细胞的体外红细胞生成和FACS分析。3天后将细胞培养物稀释于新鲜培养基中。

进行基因组DNA制备和下一代测序(NGS)。使用快速提取DNA提取溶液(Epicentre公司，目录#QE09050)在电穿孔后3天从编辑和未编辑的HSPC制备基因组DNA。

结果：

从大肠杆菌纯化重组的Cas9蛋白，并与由crRNA和tracr组成的合成双gRNA(dgRNA)复合以产生核糖核蛋白(RNP)复合物。表24中显示了该研究中使用的gRNA的列表。如材料和方法下所述，通过电穿孔将RNP复合物电穿孔到CD34+ HSPC中。在递送RNP复合物之前对细胞进行扩增。活跃地分裂的细胞可以促进通过电穿孔递送的RNP复合物的摄取。

表24.通过同时靶向BCL11A类红细胞增强子区域和HPFH区域而进行的HbF诱导。所有的gRNA分子都以dgRNA形式以一式两份进行测试。所使用的tracr具有SEQ ID NO:7808的序列，并且crRNA具有以下形式，其中示出了2'O-甲基(m)和硫代磷酸酯键(*)修饰：mN*mN*mN*rNrNrNrNrNrNrNrNrNrNrNrNrNrNrNrNrNrGrUrUrUrUrArGrArGrCrUrArU*mG*mC*mU，其中N是所示靶向结构域的残基。

使用与荧光染料缀合的抗体，通过流式细胞术分析基因组编辑和未编辑的HSPC中胎儿珠蛋白和两种类红细胞表面标志物(转铁蛋白受体(CD71)和血型糖蛋白A(CD235a))的表达水平。通过排除Live Dead Violet来识别并门控活细胞。与模拟电穿孔的细胞相比，HPFH区域或BCL11A类红细胞增强子靶向导致了含有HbF的类红细胞百分比增加(表24)。还平行观察到dgRNA对HbF阳性细胞的诱导，所述dgRNA包括靶向BCL11A的外显子2的g8的靶向结构域。当HPFH区域和BCL11A类红细胞增强子同时靶向相同细胞群时，含HbF的细胞的百分比增加超过独立靶向任一区域的含HbF的细胞的百分比(表24)。因此，通过靶向HPFH区域或BCL11A类红细胞增强子，可以实现源自编辑的细胞的含HbF的红细胞的增加，以及通过同时靶向这两个区域，可以更大程度地实现这一增加。

对这两个区域的基因组PCR产物独立地进行下一代测序(NGS)以确定细胞群中经编辑的等位基因的百分比。在用包含Cas9、具有给定靶向结构域的crRNA、和Tracr的RNP进行电穿孔的细胞培养物中观察到基因组编辑(表24)，但是在无靶向结构域递送(仅含有Cas9和Tracr的RNP)的对照细胞中没有观察到。当靶向两个位点的RNP被递送到相同的细胞群中时，观察到在这两个位点处的编辑(表24)。在一些情况下，当递送两种RNP与仅递送一种RNP时相比，在给定位点处的编辑的细胞的百分比适度降低(表24)，这可能是由于在前一种情况下靶向给定位点的RNP浓度较低所致。当两种RNP同时递送时，通过增加各自单独的RNP浓度，可以实现更高的编辑百分比和可能更高的含HbF的细胞的百分比。由基因组编辑的细胞衍生的含HbF的类红细胞的增加可能通过减少镰刀化而具有治疗意义。

实例4.7

方法：方法如实例4，但有以下例外。

人CD34+细胞培养。人CD34+细胞来源于骨髓(龙沙集团，目录号2M-101D)。将CD34+细胞解冻并在RNP递送之前在扩增培养基中扩增2天。

装配Cas9和指导RNA核糖核蛋白(RNP)复合物，制备HSPC，并将RNP电穿孔到HSPC中。为了使用单指导RNA(sgRNA)形成RNP，将6μg的sgRNA添加到6μg的CAS9蛋白(以0.8μL到1μL)和0.5μL的5x CCE缓冲液(20mM HEPES、100mM KCL、5mM MgCL2、5％甘油和新鲜添加的1mM DTT)中，总体积为5μL，并在37℃孵育5分钟。将通过离心收集的HSPC以6.4x 10⁶/mL的细胞密度重悬于P3原代细胞溶液(龙沙集团，目录号PBP3-00675)中。通过上下吸移将RNP与20μL细胞混合，并在室温下孵育2分钟。使用4D-核转染仪(龙沙集团)上的代码CM-137，对该RNP/细胞混合物(20μL)进行电穿孔。以一式两份进行电穿孔。对于dgRNA、dgRNA-PS和dgRNA-OMePS，Tracr是SEQ ID NO:6660，除了g8，其与Tracr SEQ ID NO:7808一起使用。该实验中使用的所有gRNA的形式显示在表36中，除了dgRNA g8OMePS，其包含具有序列mC*mA*mC*AAACGGAAACAAUGCAAGUUUUAGAGCUAU*mG*mC*mU的crRNA和具有SEQ ID NO:7808的序列的tracr。

进行含HbF的类红细胞的体外红细胞生成和FACS分析。在RNP递送后，按照方案1或方案2维持细胞。对于方案1，立即将细胞转移到由EDM和补充剂组成的预热的培养基中。在第0天-第7天的培养期间，EDM进一步补充有1μM氢化可的松(西格玛公司，H8672)、100ng/mL人SCF(生命科技公司，目录#PHC2113)和5ng/mL人IL-3(派普泰克公司，#10779-598)。在第7天-第11天的培养期间，EDM仅补充有100ng/mL的人SCF。在第11天-第21天的培养期间，EDM没有额外的补充剂。在第7天，将细胞培养物调节至4.0x 10⁴个细胞/ml。在第11天、第14天和第19天，再加满培养基。对于方案2，将细胞立即转移回到200μl扩增培养基中并使其再扩增2天。在RNP递送后2天对培养物进行计数。然后将细胞沉淀并重悬于由EDM和补充剂组成的预热的培养基中。在第0天-第7天的EDM培养期间，EDM进一步补充有1μM氢化可的松(西格玛公司，H8672)、100ng/mL人SCF(生命科技公司，目录#PHC2113)和5ng/mL人IL-3(派普泰克公司，#10779-598)。在第7天-第11天的培养期间，EDM仅补充有100ng/mL的人SCF。在第11天-第21天的培养期间，EDM没有额外的补充剂。在第0天以4.0x 10⁴个细胞/ml开始细胞培养，在第4天用新鲜培养基稀释4倍，并在第7天调节至2.0x 10⁵个细胞/ml。在第11天、第14天和第19天，再加满培养基。在第7天、第18天和第21天在EDM培养中对活细胞进行计数。使用AccuCheck计数珠(赛默飞世尔公司，目录号PCB100)，通过流式细胞术测量所有活细胞计数，其中通过DAPI(4',6-二脒基-2-苯基吲哚)染色来辨别不能生存的细胞。对于这两个方案，在类红细胞分化培养的第7天、第14天和第21天，通过细胞内染色来分析细胞的HbF表达。在第14天和第21天，用于HbF表达的细胞内染色不包括抗CD71和抗CD235a抗体，并且报道了在整个活细胞群中HbF阳性细胞(F-细胞)的％。使用可固定近红外死细胞染色剂(赛默飞世尔L34975)作为活力染料。

进行基因组DNA制备和下一代测序(NGS)。使用快速提取DNA提取溶液(Epicentre公司，目录#QE09050)，在电穿孔后2天和6天从通过方案2培养的编辑和未编辑的HSPC制备基因组DNA。

结果：

从大肠杆菌纯化重组的Cas9蛋白，并与合成的单gRNA(sgRNA)或由crRNA和tracr组成的双gRNA(dgRNA)复合以产生核糖核蛋白(RNP)复合物。表36中显示了该研究中使用的gRNA的形式。如材料和方法下所述，通过电穿孔将RNP复合物电穿孔到CD34+ HSPC中。在递送RNP复合物之前扩增细胞，并且在一些情况(方案2)下也在电穿孔后扩增细胞。活跃地分裂的细胞可以促进通过电穿孔递送的RNP复合物的摄取。

对HPFH区域的基因组PCR产物进行下一代测序(NGS)以确定细胞群中经编辑的等位基因的百分比。在用包含Cas9、具有给定靶向结构域的crRNA、和Tracr的RNP进行电穿孔的细胞培养物中观察到HFPH基因座处的基因组编辑(图43)，但是在无靶向结构域递送(仅含有Cas9和Tracr的RNP)的对照细胞中没有观察到。在某些情况下，相对于其他gRNA形式，在给定靶位点处使用经修饰的sgRNA进行的编辑更大(图43)。最后，针对每种gRNA，通过NGS评估插入/缺失样式以及每个插入/缺失的频率。在多个重复中使用同一gRNA/Cas9而产生的插入/缺失样式是相似的。表37中显示了每个靶位点处最频繁出现的代表性插入/缺失。

表36.在该子实例中描述的实验中使用的gRNA序列。N表示所示靶向结构域的残基；mN表示2'-OMe经修饰的核酸；*表示硫代磷酸酯修饰。

表37.在RNP引入后第6天，从NGS测序中观察到每种gRNA(靶向结构域和形式)的靠前的插入/缺失。gRNA序列如表36中所示。大写字母是在靶序列处及附近的天然存在的核苷酸。相对于未经修饰的靶序列的缺失显示为“-”；插入显示为小写字母。

在三阶段的类红细胞分化细胞培养方案中分析基因组编辑和未编辑的HSPC的增殖和HbF上调。使用与荧光染料缀合的抗体，通过流式细胞术分析基因组编辑和未编辑的HSPC中胎儿珠蛋白和第7天的两种类红细胞表面标志物(转铁蛋白受体(CD71)和血型糖蛋白A(CD235a))的表达水平。通过排除Live/Dead可固定死细胞染色剂来鉴定并门控活细胞。用所包含的HPFH区域靶向性gRNA和BCL11A类红细胞增强子靶向性gRNA进行的基因组编辑不会不利地影响类红细胞分化，因为培养的细胞显示与成红细胞一致的与分化第7天的未编辑细胞类似的CD71+细胞百分比，尽管方案1和方案2的多种条件下的不同之处在于CD71+百分比(图44)。用所包含的HPFH区域靶向性gRNA和BCL11A类红细胞增强子靶向性gRNA处理的培养物导致在整个21天的培养期中和这两种方案之间，与模拟电穿孔细胞相比，含有HbF的类红细胞百分比的相对变化的相似模式(图45、图46和图47)。HbF在暴露于RNP的细胞中被诱导并且在方案1或方案2中被维持，然而，在方案2的条件和时间点下，HbF阳性细胞的百分比倾向于更低(图45、图46和图47)。由靶结构域CR001030、CR00312和CR001128组成的gRNA对HbF的诱导最明显，特别是在较晚的时间点(图45、图46和图47)。在靶向结构域中，sgRNA倾向于比dgRNA更高的HbF诱导，特别是OMePS经修饰的sgRNA(图45、图46和图47)。靶向结构域CR001137对HbF的相对较低的诱导可以通过该靶位点处的较低编辑水平来解释(图43、图45-图47)。还平行观察到dgRNA对HbF阳性细胞的诱导，所述dgRNA包括靶向BCL11A的外显子2的g8的靶向结构域(图45-图47)。由基因组编辑的细胞衍生的含HbF的类红细胞的增加可能通过减少镰刀化而具有治疗意义。编辑的细胞能够在类红细胞分化条件下增殖(第7天为9倍至53倍以及第21天为36倍至143倍，图48)，然而，在一些情况下，相对于未编辑的对照细胞，增殖受到抑制(第7天为未编辑的对照的14％-83％以及第21天为未编辑的对照的18％-95％)(图48)。对如下细胞观察到最低的增殖，所述细胞由包含靶向BCL11A的外显子2的g8的靶向结构域的dgRNA(第7天为未编辑的对照的30％以及第21天为未编辑的对照的18％)和许多OMePS经修饰的sgRNA进行编辑(图48)。

实例5使用针对HPFH区域的两种gRNA进行的切除

将原代人CD34+ HSPC用RNP进行电穿孔，RNP含有针对HPFH区域内的不同位点的两种不同的gRNA分子。对于每种RNP，使用如上所述的dgRNA分子。简言之，将包含靶向法国HPFH区域内的第一位点的dgRNA的RNP和包含靶向法国HPFH区域内的第二位点的dgRNA的RNP进行组合，并以下列比例电穿孔到CD34+ HSPC中：0.5X第一dgRNA RNP+0.5X第二dgRNARNP；1.0X g2dgRNA(“g2”＝阳性对照，其包含CR000088靶向结构域，该靶向结构域靶向BCL11a基因的编码序列)；无RNP(“对照”)。将细胞如上所述进行培养，并使用上述方案将细胞分化成红细胞(参见图17)。评估胎儿血红蛋白表达。结果示于图27和表25中。不受理论束缚，认为包含针对两种靶序列的gRNA分子的RNP的同时引入将导致两个切割位点之间(包括该区域内包含的任何调节或编码序列)的DNA(例如，两个切割位点之间的全部或大部分DNA)的缺失(即，切除)。这些结果显示，靶向HPFH区域内的两个单独区域的RNP可以通过电穿孔同时递送到CD34+ HSPC中，并且在分化为红细胞的经编辑的细胞中诱导胎儿血红蛋白表达。

表25.

实例6.对靶向BCL11a增强子的gRNA的潜在脱靶编辑评估

使用基于寡插入的测定(参见，例如，Tsai等人,Nature Biotechnology.[自然生物技术]33,187-197；2015)来确定由靶向BCL11a增强子的Cas9切割的潜在脱靶基因组位点。在上述表达Cas9的HEK293细胞中筛选靶向BCL11a增强子的总共28个指导物(包含所示靶向结构域的双指导RNA)和靶向HPFH区域的10个gRNA，并将结果绘制在图33(BCL11a增强子)和图49(HPFH)中。关于靶向BCL11a增强子的gRNA，该测定鉴定了一些指导物的潜在脱靶位点，然而使用靶向深度测序来确定潜在位点是否是由Cas9切割的真正脱靶位点。使用位于潜在脱靶位点的侧翼的引物，扩增分离的基因组DNA并对扩增子进行测序。如果潜在脱靶位点被Cas9切割，则应在该位点检测到插入/缺失。从这些潜在脱靶位点的后续查询中得出，针对以下至少三种指导RNA在潜在脱靶位点处未检测到插入/缺失：CR000311、CR000312、CR001128。关于靶向BCL11a增强子的gRNA，该测定未鉴定出针对至少gRNACR001137、CR001212和CR001221的任何潜在脱靶位点。将进行靶向深度测序以确定针对其他gRNA分子而鉴定的潜在脱靶位点是否是由Cas9切割的真正脱靶位点。

实例7：对Cas9变体的评估

在CD34+造血干细胞中进行评估

我们通过测量它们在原代人造血干细胞(HSC)中敲除β-2-微球蛋白(B2M)基因的效率来评估14种纯化的酿脓链球菌Cas9(SPyCas9)蛋白。这些蛋白质被分成3组：第一组由具有改善的选择性的SPyCas9变体组成(Slaymaker等人2015,Science[科学]351:84(e1.0、e1.1和K855A)；Kleinstiver等人2016,Nature[自然]529:490(HF))。第二组由野生型SPyCas9和具有两个半胱氨酸取代(C80L，C574E)的SPyCas9蛋白组成，野生型SPyCas9具有不同数量和/或位置的SV40核定位信号(NLS)以及有或没有可切割的TEV位点的6x组氨酸(His6)或8x组氨酸(His8)标签，所述两个半胱氨酸取代被报道用于稳定Cas9用于结构研究(Nishimasu等人2014,Cell[细胞]156:935)。第三组由通过不同方法产生的相同重组SPyCas9组成(图60)。通过FACS和下一代测序(NGS)确定B2M敲除。

方法

材料

1.Neon电穿孔仪(英杰公司，MPK5000)

2.Neon电穿孔试剂盒(英杰公司，MPK1025)

3.crRNA(靶向结构域序列为GGCCACGGAGCGAGACAUCU，与B2M基因中的序列互补，与SEQ ID NO:6607融合)

4.tracrRNA(SEQ ID NO:6660)

5.Cas9存储缓冲液：20mM Tris-Cl(pH 8.0)，200mM KCl，10mM MgCl₂

6.骨髓来源的CD34+ HSC(龙沙集团，2M-101C)

7.细胞培养基(干细胞技术公司，具有StemSpam CC-100的StemSpam SFEM II)

8.FACS洗涤缓冲液：在PBS中的2％FCS

9.FACS阻断缓冲液：每mL PBS，添加0.5ug小鼠IgG、150ug Fc阻断剂、20uL FCS

10.Chelex悬浮液：在H₂O中的10％Chelex 100(伯乐公司(bioRad)，目录#142-1253)

11.抗B2M抗体：Biolegend公司，目录#316304

过程

按照龙沙集团的建议解冻并生长细胞，每2-3天添加一次培养基。在第5天，将细胞以200x g沉淀15分钟，用PBS洗涤一次，用来自NEON试剂盒的T缓冲液以2x10⁴/uL重悬细胞，置于冰上。用Cas9存储缓冲液稀释Cas9蛋白至5mg/ml。用H₂O将crRNA和tracrRNA重构为100uM。通过将各自0.8uL的CAS9蛋白、crRNA和tracrRNA与0.6uL的Cas9存储缓冲液混合来制备核糖核蛋白(RNP)复合物，在室温下孵育10分钟。将7uL的HSC与RNP复合物混合两分钟，并将整体10uL转移到Neon移液管尖端，在1700v、20ms和1个脉冲下进行电穿孔。电穿孔后，立即将细胞转移到24孔板的含有1ml培养基的孔中，所述培养基在37℃、5％CO₂下预校准。在电穿孔后72小时收获细胞用于FACS和NGS分析。

FACS：从24孔板的每个孔中取出250uL细胞到96孔U形底板的各孔中，并沉淀细胞。用2％FCS(胎牛血清)-PBS洗涤一次。向细胞中添加50uL FACS阻断缓冲液并在冰上孵育10分钟，添加1uL FITC标记的B2M抗体并孵育30分钟。用150uL FACS洗涤缓冲液洗涤一次，然后用200uL FACS洗涤缓冲液再洗涤一次。将细胞重悬于200uL FACS缓冲液中用于FACS分析。

NGS样品制备：将250uL的细胞悬浮液从24孔板的每个孔转移至1.5ml微量离心管中，添加1mL PBS并沉淀细胞。添加100uL的Chelex悬浮液，在99℃孵育8分钟并涡旋10秒，然后在99℃孵育8分钟，涡旋10秒。通过以10,000x g离心3分钟来沉淀树脂，并将上清液裂解物用于PCR。取4uL裂解物并使用Titanium试剂盒(克隆技术公司，目录#639208)，并按照制造商的说明，用b2m引物(b2mg67F：CAGACAGCAAACTCACCCAGT，b2mg67R：CTGACGCTTATCGACGCCCT)进行PCR反应。使用以下PCR条件：在98℃下5分钟，持续1个循环；在95℃下15秒，在62℃下15秒，以及在72℃下1分钟，持续30个循环；并最后在72℃下3分钟，持续1个循环。将PCR产物用于NGS。

统计学：将通过FACS测定的B2M KO细胞的百分比和通过NGS测定的插入/缺失的百分比用于评估CAS 9切割效率。该实验以Cas9为固定效应而设计。每个实验都嵌入供体内，作为嵌入随机效应。因此，该混合线性模型应用于FACS和NGS数据的分析。

结果

为了标准化实验和供体变化，我们绘制了每种蛋白质对于iProt105026的相对活性，iProt105026是原始设计，其具有位于野生型SPyCas9的侧翼的两个SV40 NLS和蛋白质C末端的His6标签(图34)。统计分析显示，与参考Cas9蛋白iProt105026相比，iProt106331、iProt106518、iProt106520和iProt106521在敲除HSC中的B2M方面没有显著差异，而其他测试的变体(PID426303、iProt106519、iProt106522、iProt106545、iProt106658、iProt106745、iProt106746、iProt106747、iProt106884)与参考iProt105026在敲除HSC中的B2M方面有极显著差异。我们发现将His6标签从C末端移至N末端(iProt106520)不会影响蛋白质的活性(图34)。只有当一个NLS被置于蛋白质的C末端时，该NLS才足以维持活性(iProt106521对比iProt106522，图34)。从方法1纯化的蛋白质具有比来自方法2和3的蛋白质一贯更高的敲除效率(iProt106331对比iProt106545和PID426303，图34)。通常，具有报道的改善的选择性的SPyCas9变体不如野生型SPyCas9(iProt106745、iProt106746和iProt106747，图34)那样有活性。有趣的是，iProt106884没有切割靶位点。这与Kleinstiver等人的报道一致，即该变体未能在哺乳动物细胞中切割多达20％的合理靶位点(Kleinstiver等人2016,Nature[自然]529:490)。最后，具有两个半胱氨酸取代的Cas9变体(iProt106518)保持高水平的酶活性(图34)。

接下来，用靶向+58增强子区域的经修饰或未经修饰的gRNA测试包含不同Cas9变体的RNP的编辑效率。对包含靶向结构域cr00312和cr1128的、未经修饰的(CR00312＝SEQID NO:342；CR001128＝SEQ ID NO:347)或经修饰的(OMePS CR00312＝SEQ ID NO:1762；OMePS CR001128＝SEQ ID NO:1763)sgRNA分子进行测试，并与表35中所示的Cas9变体预复合。

表35.用+58增强子区域靶向性gRNA分子测试Cas9变体的生物学功能。

iProt代码	构建体
		iProt106518	NLS-Cas9(C80L/C574E)-NLS-His6
iProt106331	NLS-Cas9-NLS-His6
		iProt106745	NLS-Cas9(K855A)-NLS-His6
iProt106884	NLS-Cas9(HF)-NLS-His6

将如上所述形成的RNP递送至如上所述的HSPC细胞中，并且如在这些实例中所述，评估细胞的％编辑(通过NGS)和类红细胞分化后的％HbF诱导。结果示于图42A(％编辑)和图42B(HbF诱导)中。结果表明，改变测试的那些变体之间的Cas9组分不会改变sgRNACR00312和CR001128的未修饰和修饰形式的基因编辑效率，并且Cas9变体也不影响类红细胞分化的经基因编辑是细胞产生HbF的能力。

实例8：基因编辑的HSPC的离体扩增，以及HSPC亚群中的编辑分析

在基因编辑之前扩增细胞

人骨髓CD34⁺细胞购自澳赛尔斯公司(目录号：ABM017F)或龙沙集团(目录号：2M-101C)，并且使用StemSpan SFEM(干细胞技术公司；目录号09650)进行扩增2至3天，所述StemSpan SFEM补充有50ng/mL的促血小板生成素(Tpo，派普泰克公司(Peprotech)；目录号300-18)、50ng/mL的人Flt3配体(Flt-3L，派普泰克公司；目录号300-19)、50ng/mL的人干细胞因子(SCF，派普泰克公司；目录号300-07)、人白细胞介素-6(IL-6，派普泰克公司；目录号200-06)、1％L-谷氨酰胺、2％青霉素/链霉素、以及化合物4(0.75μM)。

将Cas9和指导RNA核糖核蛋白(RNP)复合物电穿孔到细胞中

在电穿孔之前立即制备Cas9-指导RNA核糖核蛋白复合物(RNP)。对于使用双指导RNA形成RNP，首先将各自3μg的crRNA(以2.24μL)和tracrRNA(以1.25μL)在95℃在分开的管中变性2分钟，然后冷却至室温。为了制备Cas9蛋白，将7.3μg的CAS9蛋白(以1.21μL)与0.52μL的5x CCE缓冲液(20mM HEPES、100mM KCL、5mM MgCL2、5％甘油和新鲜添加的1mM DTT)混合。首先将TracrRNA与Cas9制剂混合并在37℃孵育5分钟。然后将CrRNA添加到TracrRNA/CAS9复合物中并在37℃孵育5分钟。通过以200x g离心15分钟来收集HSPC，并以2x 10⁷/mL的细胞密度重悬于Neon电穿孔试剂盒(英杰公司；目录号：MPK1096)附带的T缓冲液中。通过轻轻上下吸移3次将RNP与12μL的细胞混合。为了制备单指导RNA(sgRNA)和Cas9复合物，将2.25μg sgRNA(以1.5μL)与2.25μg Cas9蛋白(以3μL)混合，并在室温下孵育5分钟。然后通过轻轻上下吸移数次将sgRNA/Cas9复合物与10.5μL的2x 10⁷/mL细胞混合，并在室温下孵育2分钟。将该RNP/细胞混合物(10μL)转移到Neon电穿孔探针中。用Neon转染系统(英杰公司；MPK5000S)，使用1700伏/20毫秒和1个脉冲进行电穿孔。

在基因编辑之后的细胞扩增

电穿孔后，将细胞转移到补充有如上所述的生长因子、细胞因子和化合物4的0.5mL预热的StemSpan SFEM培养基中，并在37℃培养3天。在总共10天的细胞扩增(电穿孔之前的3天和电穿孔之后的7天)之后，总细胞数相对于起始细胞数增加2-7倍(图35)。

基因组DNA制备

在电穿孔后48小时，由经编辑和未经编辑的HSPC制备基因组DNA。将细胞在10mMTris-HCL(pH 8.0)、0.05％SDS和新添加的25μg/mL的蛋白酶K中中裂解，并在37℃孵育1小时，然后在85℃再孵育15分钟以灭活蛋白酶K。

T7E1测定

为了确定HSPC的编辑效率，进行T7E1测定。使用Phusion热启动II高保真试剂盒(赛默科技公司；目录号：F-549L)以下列循环条件进行PCR：98℃持续30”；35个循环的98℃持续5”，68℃持续20’，72℃持续30”；72℃持续5分钟。使用以下引物：正向引物：5'-AGCTCCAAACTCTCAAACCACAGGG-3'和反向引物：5'-TACAATTTTGGGAGTCCACACGGCA-3'。使用以下条件使PCR产物变性并重新退火：95℃持续5分钟，以-2℃/s 95℃-85℃，以-0.1℃/s85℃-25℃，维持4℃。退火后，将1μL的错配敏感性T7E1核酸酶(NEB公司，目录号M0302L)添加到10μL的以上PCR产物中，并在37℃进一步孵育15分钟以消化异源双链体，并且将所得DNA片段通过琼脂糖凝胶(2％)电泳进行分析。使用ImageJ软件(http://rsb.info.nih.gov/ij/)量化编辑效率。

PCR制备用于下一代测序(NGS)

为了更精确地确定编辑效率以及插入和缺失(插入/缺失)样式，对PCR产物进行下一代测序(NGS)。使用Titanium Taq PCR试剂盒(克隆技术实验室公司(ClontechLaboratories)；目录号：639210)以下列循环条件以一式两份进行PCR：98℃持续5分钟；30个循环的95℃持续15秒，68℃持续15秒，72℃1分钟；72℃持续7分钟。使用以下引物：正向引物：5'-AGCTCCAAACTCTCAAACCACAGGG-3'和反向引物：5'-TACAATTTTGGGAGTCCACACGGCA-3'。通过2％琼脂糖凝胶电泳来分析PCR产物并提交进行深度测序。

对造血干细胞和祖细胞亚群中编辑效率的流式细胞术分析。

对细胞进行流式细胞术以表征干细胞和祖细胞(HSPC)亚群中的编辑效率。在基因组编辑之前(培养48小时)和之后(培养10天；基因组编辑之后3天)，通过取样细胞培养物的等分试样确定HSPC亚群(包括CD34+细胞、CD34+CD90+细胞、CD34+CD90+CD45RA-细胞和CD34+CD90+CD45RA-CD49f+细胞)的频率(图36、图37、图38)。在4℃下，在黑暗中，将细胞与抗CD34(BD生物科学公司，目录#555824)、抗CD38(BD生物科学公司，目录#560677)、抗CD90(BD生物科学公司，目录#555596)、抗CD45RA(BD生物科学公司，目录#563963)、抗CD49f(BD生物科学公司，目录#562582)在改良的FACS缓冲液中一起孵育30分钟，该改良的FACS缓冲液含有补充有0.5％BSA、2mM EDTA(pH 7.4)的PBS。通过7AAD确定细胞活力。用改良的FACS缓冲液洗涤细胞，并在Fortessa(BD生物科学公司)上进行多色FACS分析。使用Flowjo软件分析流式细胞术结果。在化合物4(单独)存在下生长的经基因组编辑的细胞表现出评估的所有HSPC亚群(包括CD34+、CD34+CD90+、CD34+CD90+CD45RA-和CD34+CD90+CD45RA-CD49f+亚组)的可检测水平，这表明在基因组编辑之后，在化合物4(单独)存在下，长期HSC群在细胞培养物中持续存在(图38)。

在基因编辑后四小时，对细胞培养物的等分试样进行取样，并将细胞分选为HSPC亚群(CD34+、CD34+CD38+、CD34+CD38-、CD34+CD38-CD45RA-、CD34+CD38-CD45RA-CD90+CD49f-、CD34+CD38-CD45RA-CD90-CD49f-、以及CD34+CD38-CD45RA-CD90-CD49f+细胞)，并进行NGS以测量编辑效率(表28)。值得注意的是，所有造血细胞亚群，包括富含长期HSC的亚群，都展示出类似的高基因编辑效率(>95％)。长期HSC中的这种高基因编辑效率具有显著的治疗影响，因为这些细胞能够长期植入患者并维持终生的造血多谱系再生。

表28.通过NGS测量的每个HSPC亚群中的编辑效率。

实例9：对潜在脱靶编辑的评价

HSPC培养和CRISPR/Cas9基因组编辑

用于产生RNP和细胞操作的方法如实例4，但有以下例外。人CD34⁺细胞培养。根据制造商的说明，使用免疫选择(美天旎公司)，从来自成年供体的G-CSF动员的外周血(澳赛尔斯公司，目录号mPB025-Reg.E)分离人CD34+细胞或人CD34+细胞源自骨髓(Hemacare公司，目录号BM34C-3)。将CD34+细胞解冻并在RNP递送之前扩增2天至5天。在RNP递送后，将细胞在扩增培养基中再培养13天或如下在类红细胞分化培养基中培养7天或11天。在第0天-第7天的培养期间，EDM进一步补充有1μM氢化可的松(西格玛公司，H8672)、100ng/mL人SCF(生命科技公司，目录#PHC2113)和5ng/mL人IL-3(派普泰克公司，#10779-598)。在第7天-第11天的培养期间，EDM仅补充有100ng/mL的人SCF。在培养期结束时，收获细胞用于基因组DNA制备和分析。

装配Cas9和指导RNA核糖核蛋白(RNP)复合物，制备HSPC，并将RNP电穿孔到HSPC中。将通过离心收集的HSPC重悬于P3原代细胞溶液(龙沙集团，目录号PBP3-00675)中。通过上下吸移将RNP与20μL的细胞混合，并在室温下孵育2分钟。使用4D-核转染仪(龙沙集团)上的代码CM-137对RNP/细胞混合物(20μL)进行电穿孔。使用包含具有序列NNNNNNNNNNNNNNNNNNNNGUUUUAGAGCUAUGCUGUUUUG(其中N表示所示靶向结构域的残基)的crRNA和具有序列SEQ ID NO:6660的tracr的dgRNA。

基因组DNA提取

使用DNeasy血液&组织试剂盒(凯杰公司，目录#69506)，按照制造商的建议从RNP处理和未处理的HSPC中分离基因组DNA。

经由计算机模拟鉴定潜在的gRNA脱靶基因座

如下鉴定针对BCL11A +58区域gRNA CR00309、CR00311、CR00312、CR00316、CR001125、CR001126、CR001127和CR001128以及HPFH区域gRNA CR001028、CR001030、CR001137、CR001221、CR003035和CR003085的潜在脱靶基因座。对于每种gRNA，使用BFAST序列比对仪(版本0.6.4f，Homer等人,PLoS One[公共科学图书馆综合],2009,4(11),e7767,PMID:19907642)，使用允许多达5个核苷酸错配的标准参数，将20个核苷酸的gRNA原型间隔子序列与人基因组参考序列(构造体GRCh38)进行比对。鉴定的基因座被过滤以仅包含与Cas9经典5'-NGG-3'PAM序列5'相邻的位点(即5'-脱靶基因座-PAM-3')。使用BEDTools脚本(版本2.11.2，Quinlan和Hall,Bioinformatics[生物信息学],2010 26(6):841-2,PMID:20110278)，将具有5个核苷酸错配的位点进一步针对RefSeq基因注解(Pruitt等人,Nucleic Acids Res.[核酸研究],2014 42(数据库专刊):D756-63,PMID:24259432)进行过滤以仅包含注解为外显子的基因座。针对BCL11A +58区域和HPFH区域gRNA而鉴定的潜在脱靶基因座的计数分别示于表1和表2中。

表29.示出了针对在RefSeq外显子内具有0、1、2、3和4个核苷酸错配以及5个核苷酸错配的BCL11A +58区域gRNA CR00309、CR00311、CR00312、CR00316、CR001125、CR001126、CR001127和CR001128而鉴定的计算机模拟的脱靶基因座的计数。

表30.示出针对在RefSeq外显子内具有0、1、2、3和4个核苷酸错配以及的5个核苷酸错配的HPFH区域gRNA CR001028、CR001030、CR001137、CR001221、CR003035和CR003085而鉴定的计算机模拟的脱靶基因座的计数。

用于靶向扩增潜在脱靶位点的PCR引物设计

使用Primer3(版本2.3.6，Untergasser等人,Nucleic Acids Res.[核酸研究],2012 40(15):e115,PMID:22730293)，使用默认参数，设计靶向针对BCL11A +58区域gRNA(CR00309、CR00311、CR00312、CR00316、CR001125、CR001126、CR001127和CR001128)和HPFH区域gRNA(CR001028、CR001030、CR001137、CR001221、CR003035和CR003085)而鉴定的潜在脱靶基因座(和中靶基因座)的PCR扩增子，目标是扩增子大小范围为约160-300个碱基对长度，其中gRNA原型间隔子序列位于该扩增子的中心。对于gRNA CR001127，仅针对具有0-4个核苷酸错配的位点设计PCR引物，没有针对在RefSeq外显子内具有5个核苷酸错配的位点设计引物。通过针对人基因组参考序列(构造体GRCh38)的BLAST序列搜索(版本2.2.19，Altschul等人,J Mol Biol.[分子生物学杂志],1990,215(3):403-10,PMID:2231712)来检查所得PCR引物对和扩增子序列的独特性。丢弃并重新设计产生多于一个扩增子序列的引物对。表3和表5分别显示了针对BCL11A +58区和HPFH区域gRNA而设计的成功PCR引物对的计数。

依诺米那测序文库制备、定量和测序

使用Quant-iT PicoGreen dsDNA试剂盒(赛默飞世尔公司，目录#P7581)，使用制造商的推荐，对来自RNP处理的(每种gRNA 2个重复)和未处理的(每种gRNA 1个重复)HSPC样品的基因组DNA进行定量。使用两个连续PCR反应，针对每个样品产生靶向个体脱靶基因座(和中靶基因座)的依诺米那测序文库。第一次PCR使用靶特异性PCR引物(上文设计)扩增靶基因座，所述引物用通用型依诺米那测序相容序列进行加尾。第二次PCR将另外的依诺米那测序相容序列添加到第一PCR扩增子，包括样品条码以在测序期间实现多重化。PCR 1以10μL的终体积进行，每个反应含有3-6ng的gDNA(相当于约500-1000个细胞)、终浓度为0.25μM的PCR 1引物对(集成DNA技术公司(Integrated DNA Technologies))、以及1x终浓度的Q5热启动预混合液(新英格兰生物实验室公司，目录#102500-140)。PCR 1左引物是用序列5'-TCGTCGGCAGCGTCAGATGTGTATAAGAGACAG-3'进行5'加尾的(即，5'-尾-靶特异性左引物-3')，并且右引物是用序列5'-GTCTCGTGGGCTCGGAGATGTGTATAAGAGACAG-3'进行5'加尾的(即，5'-尾-靶特异性右引物-3')。使用以下循环条件在热循环仪上进行PCR 1：1个循环，98℃持续1min；25个循环，98℃持续10秒，63℃持续20秒，以及72℃持续30秒；1个循环，在72℃持续2分钟。然后使用无核酸酶的水(Ambion公司，目录#AM9932)将PCR 1稀释1/100，并用作PCR 2的输入。PCR 2以10μL的终体积进行，每个反应含有2μL稀释的PCR 1产物、终浓度为0.5μM的PCR 2引物对(集成DNA技术公司)、以及1x终浓度的Q5热启动预混合液(新英格兰生物实验室公司，目录#102500-140)。使用的PCR 2左引物序列是5'-AATGATACGGCGACCACCGAGATCTACACNNNNNNNNTCGTCGGCAGCGTC-3'，并且使用的PCR 2右引物序列是5'-CAAGCAGAAGACGGCATACGAGATNNNNNNNNGTCTCGTGGGCTCGG-3'，其中NNNNNNNN表示用于样品多重化(作为标准依诺米那测序方法的部分)的8个核苷酸的条码序列。使用以下循环条件在热循环仪上进行PCR 2：1个循环，72℃持续3min；1个循环，98℃持续2min；15个循环，98℃持续10秒，63℃持续30秒，72℃持续2分钟。按照制造商的建议，使用AgencourtAMPure XP珠(贝克曼库尔特公司(Beckman Coulter)，目录#A63882)清洁PCR 2扩增子(现在是可行的依诺米那测序文库)。然后使用标准qPCR定量方法，使用Power SYBR Green PCR预混合液(生命科技公司，目录#4367660)以及对依诺米那测序文库末端具有特异性的引物(正向引物序列5'-CAAGCAGAAGACGGCATACGA-3'和反向引物序列5'-AATGATACGGCGACCACCGAGA-3')对清洁的依诺米那测序文库进行定量。然后将依诺米那测序文库进行等摩尔汇集并按照制造商的推荐，使用MiSeq试剂盒v3(依诺米那公司，目录#MS-102-3003)，在具有300个碱基配对末端读数的MiSeq仪(依诺米那公司，目录#SY-410-1003)上进行依诺米那测序。对于至少一个经处理的重复，每个基因座产生最小1000倍的序列覆盖率。分别进行经处理和未处理样品的PCR、清洁、汇集和测序，以避免经处理与未处理样品或由其产生的PCR扩增子之间发生任何交叉污染的可能性。

依诺米那测序数据QC和变体分析

使用默认参数，使用依诺米那MiSeq分析软件(MiSeq报告基因，版本2.6.2，依诺米那公司)来产生扩增子特异性FASTQ测序数据文件(Cock等人,Nucleic Acids Res.[核酸研究]2010,38(6):1767-71,PMID:20015970)。然后通过内部开发的变体分析过程来处理FASTQ文件，该过程由一系列使用标准Perl脚本包装器连接在一起的公共域软件包组成。使用的工作流被分为五个阶段。

第1阶段，PCR引物以及中靶和脱靶序列QC：对于中靶位点和脱靶位点，使用BLAST搜索(版本2.2.29+，Altschul等人,J Mol Biol.[分子生物学杂志],1990,215(3):403-10,PMID:2231712)，将20个核苷酸的gRNA原型间隔子序列加上PAM序列和靶特异性PCR引物序列(左引物和右引物都没有额外的依诺米那序列)与人基因组参考序列(构造体GRCh38)进行比对。标记了具有多个基因组位置的中靶位点和脱靶位点。

第2阶段，测序仪文件解压缩：使用gzip脚本(版本1.3.12)将依诺米那测序仪生成的FASTQ.GZ文件解压缩为FASTQ文件，并计算每个文件的读数。没有读数的文件被排除在进一步分析之外。

第3阶段，序列读数比对和质量修剪：使用BWA-MEM比对仪(版本0.7.4-r385，Li和Durbin,Bioinformatics[生物信息学],2009,25(14):1754-60,PMID:19451168)使用‘硬裁剪’，将FASTQ文件中的测序读数与人基因组参考序列(构造体GRCh38)进行比对，以修剪依诺米那序列的3'端读数和低质量碱基。使用SAMtools脚本(版本0.1.19-44428cd，Li等人,Bioinformatics[生物信息学],2009 25(16):2078-9,PMID:19505943)，将BAM文件格式(Li等人,Bioinformatics[生物信息学],2009 25(16):2078-9,PMID:19505943)的所得的对齐读数转换为FASTQ文件。然后使用BWA-MEM比对仪，将FASTQ文件与人基因组参考序列(构造体GRCh38)再次进行比对，这次没有‘硬裁剪’。

第4阶段，变体(SNP和插入/缺失)分析：使用VarDict变体调用者(版本1.0，由开发者ZhangWu Lia改进的‘有意识的Cas9’，Lai等人,Nucleic Acids Res.[核酸研究],2016,44(11):e108,PMID:27060149)来处理比对的读数的BAM文件，其中，将等位基因频率检测限度设定为>＝0.0001以鉴定变体(SNP和插入/缺失)。所述觉察Cas9的VarDict调用器基于公共域包，但其针对在位于PAM序列的5'的3个碱基处的gRNA原型间隔子序列中的潜在Cas9核酸酶切割位点，能够移除由于变体事件的比对区域中的重复序列而产生的模糊变体调用。使用SAMtools脚本来计算每个样品扩增子的读数覆盖率，以确定中靶位点和脱靶位点是否以>1000倍的序列覆盖率被覆盖。标记了序列覆盖率<1000倍的位点。

第5阶段，dbSNP过滤以及经处理/未处理的差异分析：针对在dbSNP(构造体142，Shery等人,Nucleic Acids Res.[核酸研究]2001,29(1):308-11,PMID:11125122)中发现的已知变体(SNP和插入/缺失)对所鉴定的变体进行过滤。进一步过滤经处理的样品中的变体以排除：1)在未处理的对照样品中鉴定的变体；2)VarDict链偏好性为2:1的变体(其中，支持参考序列的正向和反向读数计数是平衡的，但对于非参考变体调用是不平衡的)；3)位于潜在Cas9切割位点周围的100bp窗口外的变体；4)在潜在Cas9切割位点周围的100bp窗口内的单核苷酸变体。最后，仅考虑在潜在Cas9切割位点的100bp窗口中具有>2％(在超过大约10-20个细胞中编辑)的组合插入/缺失频率的位点。使用综合基因组查看器(IGV版本2.3，Robinson等人,Nat Biotechnol.[自然生物技术]2011,9(1):24-6,PMID:21221095)，在读数比对水平上进一步检查潜在的活性编辑位点，所述综合基因组查看器允许目视检查与基因组参考序列的读数比对。

中靶和脱靶分析结果

BCL11A +58区域和HPFH区域gRNA的中靶位点在经处理的样品中的预期Cas9切割位点处显示出强大的编辑，其中对于所有gRNA，插入/缺失频率均大于88％。表3和表5显示了在至少一个生物学重复中表征的脱靶位点的数量。未表征的位点不能进行PCR引物设计或PCR扩增，并且仍在研究中。

BCL11A +58区域的经由计算机模拟的靶向分析结果

gRNA CR00309：gRNA CR00309的中靶位点在预期的Cas9切割位点处显示出强大的编辑，其中平均插入/缺失频率为约92％。表31显示了表征的脱靶位点的数量。未表征的位点在PCR引物设计或PCR扩增中失败，并且仍在研究中。潜在脱靶位点的表征鉴定了在两个经处理的重复中所提出的Cas9切割位点周围的100bp窗口中的四个脱靶位点。位点1具有约18％的平均插入/缺失频率，具有相对于中靶gRNA原型间隔子序列(5'-CtCaCCtCCACCCTAATCAG-PAM-3'，PAM＝AGG)的3个错配，并且位于染色体11上的碱基对位置22,195,800-22,195,819处的Anoctamin 5基因(ANO5)的内含子1中，相距外显子1约2.3kb。位点2具有约18％的平均插入/缺失频率，具有相对于中靶gRNA原型间隔子序列(5'-CACGCCCaCACCtTAATCAG-PAM-3'，PAM＝GGG)的2个错配，并且位于染色体12的碱基对位置3,311,901-3,311,926处的基因间区中。位点3具有约80％的平均插入/缺失频率，具有相对于中靶gRNA原型间隔子序列(5'-CACGaCCCaACCCTAATCAG-PAM-3'，PAM＝AGG)的2个错配，并且位于染色体1上的碱基对位置236,065,415-236,065,434处的GenBank(Clark等人,NucleicAcids Res.[核酸研究]2016年1月4日；44(数据库专刊):D67-D72,PMID:26590407)转录物(BC012501，未在RefSeq中注释)中。位点4具有约2％的平均插入/缺失频率，具有相对于中靶gRNA原型间隔子序列(5'-CtaGCCCCtACCCTAATaAG-3',PAM＝TGG)的4个错配，并且位于染色体1上的碱基对位置33,412,659-33,412,678处的GenBank注释的转录物(称为多同源异型2蛋白，未在RefSeq中注释)的内含子1中。

gRNA CR00311：gRNA CR00311的中靶位点在预期的Cas9切割位点处显示出强大的编辑，其中平均插入/缺失频率为约95％。表31显示了成功表征的脱靶位点的数量。未表征的位点在PCR引物设计或PCR扩增中失败，并且仍在研究中。迄今为止，在检查的位点处没有观察到显著的脱靶活性。

gRNA CR000312：gRNA CR000312的中靶位点在预期的Cas9切割位点处显示出强大的编辑，其中平均插入/缺失频率为约98％。表31显示了成功表征的脱靶位点的数量。未表征的位点在PCR引物设计或PCR扩增中失败，并且仍在研究中。迄今为止，在检查的位点处没有观察到显著的脱靶活性。

gRNA CR000316：gRNA CR000316的中靶位点在预期的Cas9切割位点处显示出强大的编辑，其中平均插入/缺失频率为约91％，但大多数脱靶位点仍有待表征。

gRNA CR001125：gRNA CR0001125的中靶位点在预期的Cas9切割位点处显示出强大的编辑，其中平均插入/缺失频率为约91％。表31显示了成功表征的脱靶位点的数量。未表征的位点在PCR引物设计或PCR扩增中失败，并且仍在研究中。迄今为止，在检查的位点处没有观察到显著的脱靶活性。

gRNA CR001126：gRNA CR0001126的中靶位点在预期的Cas9切割位点处显示出强大的编辑，其中平均插入/缺失频率为约92％。表31显示了成功表征的脱靶位点的数量。未表征的位点在PCR引物设计或PCR扩增中失败，并且仍在研究中。潜在脱靶位点的表征迄今为止鉴定了在两个经处理的重复中所提出的Cas9切割位点周围的100bp窗口中的两个脱靶位点。第一位点具有约2％的平均插入/缺失频率，具有相对于中靶gRNA原型间隔子序列(5'-TTTATaACAGGCTCCAGaAA-PAM-3'，PAM＝TGG)的2个错配，并且位于染色体4上的碱基对位置35,881,815-35,881,834处的基因间区中，相距最近的GenBank转录物(未在RefSeq中注释)约9.5kb。第二位点具有约1.7％的平均插入/缺失频率，具有相对于中靶gRNA原型间隔子序列(5'caTATCACAGGCcCCAGGAg-PAM-3'，PAM＝GGG)的4个错配，并且位于染色体6上的碱基对位置16,519,907-16,519,926处的Ataxin 1基因(ATXN1)的内含子6中，相距外显子6约2.7kb。

gRNA CR001127：gRNA CR0001127的中靶位点在预期的Cas9切割位点处显示出强大的编辑，其中平均插入/缺失频率为约97％。表31显示了成功表征的脱靶位点的数量。未表征的位点在PCR引物设计或PCR扩增中失败，并且仍在研究中。迄今为止，在检查的位点处没有观察到显著的脱靶活性。

gRNA CR001128：gRNA CR0001128的中靶位点在预期的Cas9切割位点处显示出强大的编辑，其中平均插入/缺失频率为约94％。表31显示了成功表征的脱靶位点的数量。未表征的位点在PCR引物设计或PCR扩增中失败，并且仍在研究中。迄今为止，在检查的位点处没有观察到显著的脱靶活性。

对经鉴定的所有活跃编辑的BCL11+58区域脱靶位点的人工检查显示了作为Cas9介导的双链断裂非同源末端连接DNA修复的特征的围绕所提出的Cas9切割位点的典型插入/缺失样式。尚不清楚在所鉴定的位点处的编辑是否对基因表达或细胞活力有任何不利影响，这需要进一步分析。

表31.显示了所鉴定的经由计算机模拟的脱靶位点、在至少一个经处理的重复中成功表征的位点和显示针对BCL11A +58区域gRNA CR00309、CR00311、CR00312、CR00316、CR001125、CR001126、CR001127和CR001128进行编辑的位点的计数。*仅检查具有0-4个核苷酸错配的位点。

BCL11A +58区域GUIDE-Seq命中验证结果

使用上述针对经由计算机模拟而定义的位点的靶向测序方法，在RNP处理和未处理的HSPC中对由GUIDE-seq(Tsai等人,Nat Biotechnol.[自然生物技术]2015,33(2):187-97,PMID:25513782)鉴定的潜在脱靶命中进行表征。鉴定了针对gRNA CR00312、CR00316、CR001125、CR001126、CR001127和CR001128的GUIDE-seq潜在命中。对于gRNA CR00311和CR001128没有鉴定出潜在命中。当使用靶向测序在HSPC中查询潜在命中时，在经处理的HSPC中针对gRNA CR00312、CR001125和CR001127未验证出潜在命中。一个潜在命中验证了gRNA CR001126，这是通过经由计算机模拟的定向方法在ATXN1的内含子6(染色体6：16,519,907-16,519,926碱基对)中鉴定的相同位点。对gRNA CR00309和CR00316的潜在命中的验证仍在进行中。

HPFH区域的经由计算机模拟的靶向分析结果

gRNA CR001028：gRNA CR0001028的中靶位点在预期的Cas9切割位点处显示出强大的编辑，其中平均插入/缺失频率为约91％。表32显示了成功表征的脱靶位点的数量。未表征的位点在PCR引物设计或PCR扩增中失败，并且仍在研究中。潜在脱靶位点的表征迄今为止鉴定了在两个经处理的重复中所提出的Cas9切割位点周围的100bp窗口中的两个脱靶位点。位点1具有约2.8％的平均插入/缺失频率，具有相对于中靶gRNA原型间隔子序列(5'-TGgGGTGGGGAGATATGaAG-PAM-3'，PAM＝AGG)的2个错配，并且位于染色体4上的碱基对位置58,169,308-58,169,327处的、非编码RNA(LF330410，未在RefSeq中注释)的内含子2中。位点2具有约3.5％的平均插入/缺失频率，具有相对于中靶gRNA原型间隔子序列(5'-gGaGGTGGGGAGAgATGTAG-PAM-3'，PAM＝AGG)的3个错配，并且位于染色体6上的碱基对位置26,366,733-26,366,752处的、嗜乳脂蛋白亚族3成员A2基因(BTN3A2)的内含子1中，相距外显子2约1.3kb。

gRNA CR001030：gRNA CR0001030的中靶位点在预期的Cas9切割位点处显示出强大的编辑，其中平均插入/缺失频率为约89％。表32显示了成功表征的脱靶位点的数量。未表征的位点在PCR引物设计或PCR扩增中失败，并且仍在研究中。潜在脱靶位点的表征迄今为止在两个经处理的重复中所提出的Cas9切割位点周围的100bp窗口中鉴定了一个脱靶位点，其中平均插入/缺失频率为57％。该位点具有相对于中靶gRNA原型间隔子序列(5'-caTGCgGAAAGAGATGCGGT-PAM-3'，PAM＝TGG)的3个错配，并且位于X染色体上的碱基对位置24,503,476-24,503,495处的、丙酮酸脱氢酶激酶3基因(PDK3)的外显子4中。

gRNA CR001137：gRNA CR0001037的中靶位点在预期的Cas9切割位点处显示出强大的编辑，其中平均插入/缺失频率为约84％。表32显示了成功表征的脱靶位点的数量。未表征的位点在PCR引物设计或PCR扩增中失败，并且仍在研究中。迄今为止，在检查的位点处没有观察到显著的脱靶活性。

gRNA CR001221：gRNA CR0001221的中靶位点在预期的Cas9切割位点处显示出强大的编辑，其中平均插入/缺失频率为约95％。表32显示了成功表征的脱靶位点的数量。未表征的位点在PCR引物设计或PCR扩增中失败，并且仍在研究中。迄今为止，在检查的位点处没有观察到显著的脱靶活性。

gRNA CR003035：gRNA CR0003035的中靶位点在预期的Cas9切割位点处显示出强大的编辑，其中平均插入/缺失频率为约89％。表32显示了成功表征的脱靶位点的数量。未表征的位点在PCR引物设计或PCR扩增中失败，并且仍在研究中。潜在脱靶位点的表征迄今为止鉴定了在两个经处理的重复中所提出的Cas9切割位点周围的100bp窗口中的两个脱靶位点。位点1具有约20％的平均插入/缺失频率，具有相对于中靶gRNA原型间隔子序列(5'-AGGtACCTCAaACTCAGCAT-PAM-3'，PAM＝AGG)的2个错配，并且位于染色体2上的碱基对位置66,281,781-66,281,800处的基因间区中，并且相距最近的转录物(JD432564，未在RefSeq中注释)约7.1kb。位点2具有约2.5％的平均插入/缺失频率，具有相对于中靶gRNA原型间隔子序列(5'-AGagACCcCAGACTCAGCAT-PAM-3'，PAM＝AGG)的3个错配，并且位于染色体10上的碱基对位置42,997,289-42,997,308处的基因间区中，并且相距微小RNA 5100(MIR5100)约0.3kb。

gRNA CR003085：gRNA CR0003038的中靶位点在预期的Cas9切割位点处显示出强大的编辑，其中平均插入/缺失频率为约94％。表32显示了成功表征的脱靶位点的数量。未表征的位点在PCR引物设计或PCR扩增中失败，并且仍在研究中。潜在脱靶位点的表征迄今为止在两个经处理的重复中所提出的Cas9切割位点周围的100bp窗口中鉴定了一个脱靶位点，其中平均插入/缺失频率为约2％。该位点具有相对于中靶gRNA原型间隔子序列(5'-ATGGTATGaGAaaTATACTA-PAM-3'，PAM＝TGG)的3个错配，并且位于染色体2上的碱基对位置171,872,630-171,872,649处的、溶质载体家族25成员12基因(SLC25A12)的内含子2中，并且相距外显子3约3.8kb。

对经鉴定的所有活跃编辑的HPFH区域脱靶位点的人工检查显示了作为Cas9介导的双链断裂非同源末端连接DNA修复的特征的围绕所提出的Cas9切割位点的典型插入/缺失样式。尚不清楚在所鉴定的位点处的编辑是否对基因表达或细胞活力有任何不利影响，这需要进一步分析。

表32.显示了所鉴定的经由计算机模拟的潜在脱靶位点、在至少一个经处理的重复中成功表征的位点和显示针对HPFH区域gRNA CR001028、CR001030、CR001137、CR001221、CR003035、和CR003085进行编辑的位点的计数。

HPFH区域GUIDE-Seq命中验证结果

使用与对于经由计算机模拟的位点所描述的相同方法，在RNP处理和未处理的HSPC中，对使用GUIDE-seq(Tsai等人,Nat Biotechnol.[自然生物技术]2015,33(2):187-97,PMID:25513782)鉴定的潜在脱靶命中进行查询。针对gRNA CR001028、CR001030、CR003035和CR003085(迄今为止)鉴定了GUIDE-seq潜在脱靶命中。迄今为止未鉴定出针对gRNA CR001137和CR001221的命中。在HSPC中验证了针对gRNA CR001028的一个命中，这是在染色体4上的碱基对位置58,169,308-58,169,327处通过经由计算机模拟的定向方法鉴定的相同位点。在HSPC中验证了针对gRNA CR001030的一个命中，这是在PDK3基因的外显子4中通过经由计算机模拟的定向方法鉴定的相同位点。在HSPC中验证了针对gRNA CR003035的一个命中，这是在染色体2的碱基对位置66,281,781-66,281,800处的基因间区中通过经由计算机模拟的定向方法鉴定的相同位点。在HSPC中验证了针对gRNA CR003085的一个命中，这是在染色体2上的碱基对位置171,872,630-171,872,649处通过经由计算机模拟的定向方法鉴定的相同位点。

对于gRNA编辑效率筛选的中靶分析

按照制造商的推荐，使用Agencourt AMPure XP珠(贝克曼库尔特公司，目录#A63882)清洁靶向gRNA中靶位点的PCR扩增子。使用制造商的推荐，使用Quant-iTPicoGreen dsDNA试剂盒(赛默飞世尔公司，目录#P7581)对样品进行定量。按照制造商的推荐，使用Nextera DNA文库制备试剂盒(依诺米那公司，目录#FC-121-1031)将扩增子转化到依诺米那测序文库中。将所得的测序文库进行AMPure珠清洁，qPCR定量，汇集并用使用150个碱基(依诺米那公司，目录#MS-102-2002)或250个碱基(依诺米那公司，目录#MS-102-2003)配对末端读数的依诺米那MiSeq仪进行测序，如脱靶分析部分中所述。针对每个文库，生成了最小1000倍的测序覆盖率，并使用一系列内部脚本来调用变体。简而言之，与扩增子序列相比，使用基于串的序列搜索来鉴定跨越集中于gRNA序列上的80-100个碱基对的窗口的测序读数，通过序列差异进行分类并计算变体频率。另外，使用依诺米那MiSeq报告软件(依诺米那公司，版本2.6.1)将测序读数与扩增子序列进行比对，并使用综合基因组查看器(IGV版本2.3，Robinson等人,Nat Biotechnol.[自然生物技术]2011,9(1):24-6,PMID:21221095)对所得读数比对进行检查。

实例10：评估RNP浓度对基因编辑和HbF诱导的影响

进行RNP稀释测定以确定用于基因编辑的最佳RNP浓度

使用Cas9(iProt:106331)和指导核糖核苷酸复合物(RNP)浓度的连续稀释进行基因编辑(表33)。表34中列出了在该测定中使用的各种gRNA、它们的形式以及修饰。

表33：RNP稀释用于研究RNP浓度对基因编辑和HbF诱导的影响。

表34:在RNP稀释测定中使用的、具有或不具有化学经修饰的、单或双指导物形式的gRNA的列表。“OMePS”修饰，关于dgRNA形式是指具有以下结构的经修饰的crRNA：与具有SEQ ID NO:6660的未经修饰的tracr(即，tracrRNA)配对的mN*mN*mN*NNNNNNNNNNNNNNNNNGUUUUAGAGCUAUGCUGUU*mU*mU*mG；并且关于sgRNA是指具有以下结构的gRNA：mN*mN*mN*NNNNNNNNNNNNNNNNNGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCmU*mU*mU*U，其中N＝靶向结构域的核苷酸，mN是指2'-Ome-经修饰的核苷酸，并且*是指硫代磷酸酯键。“未经修饰的”是指没有RNA经修饰的gRNA：dgRNA由与SEQ ID NO:6660配对的NNNNNNNNNNNNNNNNNNNNGUUUUAGAGCUAUGCUGUUUUG组成；sgRNA是指NNNNNNNNNNNNNNNNNNNNGUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU，其中N＝所示靶向结构域的核苷酸。

如前所述对CD34+细胞进行电穿孔，并进行细胞活力、基因编辑效率和产生HbF的能力的测量。当评估细胞活力时，结果显示，当使用单指导或双指导形式时，不同的RNP浓度对电穿孔后的细胞活力没有影响(图39A和图39B)。在对CD34+细胞进行基因编辑后，NGS数据显示对未经修饰的CR00312和CR001128以及经修饰的CR00312而言RNP浓度降至1.47uM实现了最大％基因编辑效率，而对经修饰的CR001228而言在低至2.94uM的RNP浓度下实现了最大％基因编辑效率(图40A)。对于sgRNA形式，所有测试的gRNA在降至0.48uM的RNP浓度下均达到最大％编辑(图40B)。在测量经基因编辑的细胞分化为类红细胞谱系并产生HbF的能力时，我们的数据显示对于含有dgRNA的RNP而言降至2.94uM的RNP浓度(图41A)和对于含有sgRNA的RNP而言降至0.97uM的RNP浓度(图41B)导致最高水平的HbF诱导。

该申请正在提交序列表。在一定程度上，序列表与说明书中列举的任何序列之间存在任何差异，但说明书中列举的序列应被认为是正确的序列。除非另有说明，否则所有基因组位置均依据hg38。

通过引用并入

本文提及的所有出版物、专利和专利申请以其全文通过引用特此并入，如同每个单独的出版物、专利或专利申请被明确且单独地表明通过引用并入。在冲突存在的情况下，将以本申请(包括本文的任何定义)为准。

等效形式

本领域的技术人员仅使用常规实验就将认识到或能够确定本文所述的本发明这些具体实施例的许多等效形式。虽然已经参照具体方面披露了本发明，但是本领域其他技术人员可以在不偏离本发明的真实精神以及范围的情况下设想本发明的其他方面以及变化。所附权利要求旨在理解为包括所有此类方面以及等效变化。

Claims

1.一种gRNA分子，该gRNA分子包含tracr和crRNA，其中该crRNA包含与BCL11A基因(例如人BCL11a基因)、BCL11a增强子(例如人BCL11a增强子)、或HFPH区域(例如人HPFH区域)的靶序列互补的靶向结构域。

2.如权利要求1所述的gRNA分子，其中该靶序列是BCL11A基因的靶序列，并且该靶向结构域包含SEQ ID NO:1至SEQ ID NO:85或SEQ ID NO:400至SEQ ID NO:1231中的任何一个，例如由其组成。

3.如权利要求1所述的gRNA分子，其中该靶序列是BCL11a增强子的靶序列，并且该靶向结构域包含SEQ ID NO:1232至SEQ ID NO:1499中的任何一个，例如由其组成。

4.如权利要求1所述的gRNA分子，其中该靶序列是BCL11a增强子的靶序列，并且该靶向结构域包含SEQ ID NO:182至SEQ ID NO:277或SEQ ID NO:334至SEQ ID NO:341中的任何一个，例如由其组成。

5.如权利要求4所述的gRNA分子，其中该靶向结构域包含SEQ ID NO:341、SEQ ID NO:246、SEQ ID NO:248、SEQ ID NO:247、SEQ ID NO:245、SEQ ID NO:249、SEQ ID NO:244、SEQID NO:199、SEQ ID NO:251、SEQ ID NO:250、SEQ ID NO:334、SEQ ID NO:185、SEQ ID NO:186、SEQ ID NO:336、或SEQ ID NO:337中的任何一个，例如由其组成。

6.如权利要求4所述的gRNA分子，其中该靶向结构域包含SEQ ID NO:247、SEQ ID NO:248、SEQ ID NO:335、SEQ ID NO:336、SEQ ID NO:337、或SEQ ID NO:338中的任何一个，例如由其组成。

7.如权利要求4所述的gRNA分子，其中该靶向结构域包含SEQ ID NO:248或SEQ ID NO:338中的任何一个，例如由其组成。

8.如权利要求4所述的gRNA分子，其中该靶向结构域包含SEQ ID NO:248，例如由其组成。

9.如权利要求4所述的gRNA分子，其中该靶向结构域包含SEQ ID NO:338，例如由其组成。

10.如权利要求1所述的gRNA分子，其中该靶序列是BCL11a增强子的靶序列，并且该靶向结构域包含SEQ ID NO:278至SEQ ID NO:333中的任何一个，例如由其组成。

11.如权利要求10所述的gRNA分子，其中该靶向结构域包含SEQ ID NO:318、SEQ IDNO:312、SEQ ID NO:313、SEQ ID NO:294、SEQ ID NO:310、SEQ ID NO:319、SEQ ID NO:298、SEQ ID NO:322、SEQ ID NO:311、SEQ ID NO:315、SEQ ID NO:290、SEQ ID NO:317、SEQ IDNO:309、SEQ ID NO:289、或SEQ ID NO:281中的任何一个，例如由其组成。

12.如权利要求10所述的gRNA分子，其中该靶向结构域包含SEQ ID NO:318，例如由其组成。

13.如权利要求1所述的gRNA分子，其中该靶序列是BCL11a增强子的靶序列，并且该靶向结构域包含SEQ ID NO:1596至SEQ ID NO:1691中的任何一个，例如由其组成。

14.如权利要求13所述的gRNA分子，其中该靶向结构域包含SEQ ID NO:1683、SEQ IDNO:1638、SEQ ID NO:1647、SEQ ID NO:1609、SEQ ID NO:1621、SEQ ID NO:1617、SEQ IDNO:1654、SEQ ID NO:1631、SEQ ID NO:1620、SEQ ID NO:1637、SEQ ID NO:1612、SEQ IDNO:1656、SEQ ID NO:1619、SEQ ID NO:1675、SEQ ID NO:1645、SEQ ID NO:1598、SEQ IDNO:1599、SEQ ID NO:1663、SEQ ID NO:1677、或SEQ ID NO:1626中的任何一个，例如由其组成。

15.如权利要求1所述的gRNA分子，其中该靶序列是HFPH区域(例如法国HPFH区域(French HPFH region))的靶序列，并且该靶向结构域包含SEQ ID NO:86至SEQ ID NO:181、SEQ ID NO:1500至SEQ ID NO:1595、或SEQ ID NO:1692至SEQ ID NO:1761中的任何一个，例如由其组成。

16.如权利要求15所述的gRNA分子，其中该靶向结构域包含SEQ ID NO:100、SEQ IDNO:165、SEQ ID NO:113、SEQ ID NO:99、SEQ ID NO:112、SEQ ID NO:98、SEQ ID NO:1580、SEQ ID NO:106、SEQ ID NO:1503、SEQ ID NO:1589、SEQ ID NO:160、SEQ ID NO:1537、SEQID NO:159、SEQ ID NO:101、SEQ ID NO:162、SEQ ID NO:104、SEQ ID NO:138、SEQ ID NO:1536、SEQ ID NO:1539、SEQ ID NO:1585中的任何一个，例如由其组成。

17.如权利要求15所述的gRNA分子，其中该靶向结构域包含SEQ ID NO:98、SEQ ID NO:100、SEQ ID NO:1505、SEQ ID NO:1589、SEQ ID NO:1700、或SEQ ID NO:1750中的任何一个，例如由其组成。

18.如权利要求15所述的gRNA分子，其中该靶向结构域包含SEQ ID NO:100、SEQ IDNO:165、或SEQ ID NO:113中的任何一个，例如由其组成。

19.如权利要求2-18中任一项所述的gRNA分子，其中该靶向结构域包含任何一个所列举的靶向结构域序列的17、18、19、20、21、22、23、或24个连续核酸，例如由其组成。

20.如权利要求16所述的gRNA分子，其中任何一个所列举的靶向结构域序列的该17、18、19、20、21、22、23、或24个连续核酸是布置于所列举的靶向结构域序列的3'端的17、18、19、20、21、22、23、或24个连续核酸。

21.如权利要求16所述的gRNA分子，其中任何一个所列举的靶向结构域序列的该17、18、19、20、21、22、23、或24个连续核酸是布置于所列举的靶向结构域序列的5'端的17、18、19、20、21、22、23、或24个连续核酸。

22.如权利要求16所述的gRNA分子，其中任何一个所列举的靶向结构域序列的该17、18、19、20、21、22、23、或24个连续核酸不包含所列举的靶向结构域序列的5'或3'核酸。

23.如权利要求2-22中任一项所述的gRNA分子，其中该靶向结构域由所列举的靶向结构域序列组成。

24.如先前权利要求中任一项所述的gRNA分子，其中该crRNA的部分和该tracr的部分杂交形成标志杆(flagpole)，该标志杆包含SEQ ID NO:6584或6585。

25.如权利要求24所述的gRNA分子，其中该标志杆进一步包含位于该标志杆的crRNA部分的3'的第一标志杆延伸部，其中所述第一标志杆延伸部包含SEQ ID NO:6586。

26.如权利要求24或25所述的gRNA分子，其中该标志杆进一步包含位于该标志杆的crRNA部分的3'的第二标志杆延伸部和如果存在，该第一标志杆延伸部，其中所述第二标志杆延伸部包含SEQ ID NO:6587。

27.如权利要求1-26中任一项所述的gRNA分子，其中该tracr包含SEQ ID NO:6660或SEQ ID NO:6661。

28.如权利要求1-26中任一项所述的gRNA分子，其中该tracr包含SEQ ID NO:7812，任选地在3'端进一步包含另外的1、2、3、4、5、6、或7个尿嘧啶(U)核苷酸。

29.如权利要求1-28中任一项所述的gRNA分子，其中该crRNA从5'至3'包含[靶向结构域]-：

a)SEQ ID NO:6584；

b)SEQ ID NO:6585；

c)SEQ ID NO:6605；

d)SEQ ID NO:6606；

e)SEQ ID NO:6607；

f)SEQ ID NO:6608；或者

g)SEQ ID NO:7806。

30.如权利要求1-23或29中任一项所述的gRNA分子，其中该tracr从5’至3’包含：

a)SEQ ID NO:6589；

b)SEQ ID NO:6590；

c)SEQ ID NO:6609；

d)SEQ ID NO:6610；

e)SEQ ID NO:6660；

f)SEQ ID NO:6661；

g)SEQ ID NO:7812；

h)SEQ ID NO:7807；

i)SEQ ID NO:7808；

j)SEQ ID NO:7809；

k)以上a)至j)中的任一个，在3'端进一步包含至少1、2、3、4、5、6或7个尿嘧啶(U)核苷酸，例如1、2、3、4、5、6、或7个尿嘧啶(U)核苷酸；

l)以上a)至k)中的任一个，在3'端进一步包含至少1、2、3、4、5、6或7个腺嘌呤(A)核苷酸，例如1、2、3、4、5、6、或7个腺嘌呤(A)核苷酸；或者

m)以上a)至l)中的任一个，在5'端(例如在5'末端)进一步包含至少1、2、3、4、5、6或7个腺嘌呤(A)核苷酸，例如1、2、3、4、5、6、或7个腺嘌呤(A)核苷酸。

31.如权利要求1-23中任一项所述的gRNA分子，其中该靶向结构域和该tracr被布置于分开的核酸分子上，并且其中包含该靶向结构域的核酸分子包含任选地紧邻该靶向结构域的3'布置的SEQ ID NO:6607，并且包含该tracr的核酸分子包含SEQ ID NO:6660，例如由其组成。

32.如权利要求27-28中任一项所述的gRNA分子，其中该标志杆的crRNA部分包含SEQID NO:6607或SEQ ID NO:6608。

33.如权利要求1-26中任一项所述的gRNA分子，其中该tracr包含SEQ ID NO:6589或6590和任选的布置于SEQ ID NO:6589或6590的5'的第一tracr延伸部，如果存在第一标志杆延伸部的话，所述第一tracr延伸部包含SEQ ID NO:6591。

34.如权利要求1-33中任一项所述的gRNA分子，其中该靶向结构域和该tracr被布置于分开的核酸分子上。

35.如权利要求1-33中任一项所述的gRNA分子，其中该靶向结构域和该tracr被布置于单个核酸分子上，并且其中该tracr被布置于该靶向结构域的3'。

36.如权利要求35所述的gRNA分子，该gRNA分子进一步包含布置于该靶向结构域的3'且布置于该tracr的5'的环。

37.如权利要求36所述的gRNA分子，其中该环包含SEQ ID NO:6588。

38.如权利要求1-23中任一项所述的gRNA分子，该gRNA分子从5'至3'包含[靶向结构域]-：

(a)SEQ ID NO:6601；

(b)SEQ ID NO:6602；

(c)SEQ ID NO:6603；

(d)SEQ ID NO:6604；

(e)SEQ ID NO:7811；或者

(f)以上(a)至(e)中的任一个，在3'端进一步包含1、2、3、4、5、6或7个尿嘧啶(U)核苷酸。

39.如权利要求1-40中任一项所述的gRNA分子，其中该靶向结构域和该tracr被布置于单个核酸分子上，并且其中所述核酸分子包含所述靶向结构域和任选地紧邻所述靶向结构域的3'布置的SEQ ID NO:7811，例如由其组成。

40.如权利要求1-39中任一项所述的gRNA分子，其中一种或任选地多于一种包含该gRNA分子的核酸分子包含：

a)在所述一种或多种核酸分子的3'端的一个或多个，例如三个硫代磷酸酯修饰；

b)在所述一种或多种核酸分子的5'端的一个或多个，例如三个硫代磷酸酯修饰；

c)在所述一种或多种核酸分子的3'端的一个或多个，例如三个2'-O-甲基修饰；

d)在所述一种或多种核酸分子的5'端的一个或多个，例如三个2'-O-甲基修饰；

e)在所述一种或多种核酸分子的相对于末端的第4个、相对于末端的第3个和相对于末端的第2个3'残基的每个处的2’O-甲基修饰；

f)在所述一种或多种核酸分子的相对于末端的第4个、相对于末端的第3个和相对于末端的第2个5'残基的每个处的2’O-甲基修饰；或者

f)其任何组合。

41.如权利要求1所述的gRNA分子，该gRNA分子包含以下序列，例如由其组成：

(a)SEQ ID NO:342；

(b)SEQ ID NO:343；或者

(c)SEQ ID NO:1762。

42.如权利要求1所述的gRNA分子，该gRNA分子包含以下，例如由其组成：

(a)crRNA和tracr，该crRNA包含SEQ ID NO:344，例如由其组成，并且该tracr包含SEQID NO:6660，例如由其组成；

(b)crRNA和tracr，该crRNA包含SEQ ID NO:344，例如由其组成，并且该tracr包含SEQID NO:346，例如由其组成；

(c)crRNA和tracr，该crRNA包含SEQ ID NO:345，例如由其组成，并且该tracr包含SEQID NO:6660，例如由其组成；或者

(d)crRNA和tracr，该crRNA包含SEQ ID NO:345，例如由其组成，并且该tracr包含SEQID NO:346，例如由其组成。

43.如权利要求1所述的gRNA分子，该gRNA分子包含以下序列，例如由其组成：

(a)SEQ ID NO:347；

(b)SEQ ID NO:348；或者

(c)SEQ ID NO:1763。

44.如权利要求1所述的gRNA分子，该gRNA分子包含以下，例如由其组成：

(a)crRNA和tracr，该crRNA包含SEQ ID NO:349，例如由其组成，并且该tracr包含SEQID NO:6660，例如由其组成；

(b)crRNA和tracr，该crRNA包含SEQ ID NO:349，例如由其组成，并且该tracr包含SEQID NO:346，例如由其组成；

(c)crRNA和tracr，该crRNA包含SEQ ID NO:350，例如由其组成，并且该tracr包含SEQID NO:6660，例如由其组成；或者

(d)crRNA和tracr，该crRNA包含SEQ ID NO:350，例如由其组成，并且该tracr包含SEQID NO:346，例如由其组成。

45.如权利要求1所述的gRNA分子，该gRNA分子包含以下序列，例如由其组成：

(a)SEQ ID NO:351；

(b)SEQ ID NO:352；或者

(c)SEQ ID NO:1764。

46.如权利要求1所述的gRNA分子，该gRNA分子包含以下，例如由其组成：

(a)crRNA和tracr，该crRNA包含SEQ ID NO:353，例如由其组成，并且该tracr包含SEQID NO:6660，例如由其组成；

(b)crRNA和tracr，该crRNA包含SEQ ID NO:353，例如由其组成，并且该tracr包含SEQID NO:346，例如由其组成；

(c)crRNA和tracr，该crRNA包含SEQ ID NO:354，例如由其组成，并且该tracr包含SEQID NO:6660，例如由其组成；或者

(d)crRNA和tracr，该crRNA包含SEQ ID NO:354，例如由其组成，并且该tracr包含SEQID NO:346，例如由其组成。

47.如权利要求1所述的gRNA分子，该gRNA分子包含以下序列，例如由其组成：

(a)SEQ ID NO:355；

(b)SEQ ID NO:356；或者

(c)SEQ ID NO:1765。

48.如权利要求1所述的gRNA分子，该gRNA分子包含以下，例如由其组成：

(a)crRNA和tracr，该crRNA包含SEQ ID NO:357，例如由其组成，并且该tracr包含SEQID NO:6660，例如由其组成；

(b)crRNA和tracr，该crRNA包含SEQ ID NO:357，例如由其组成，并且该tracr包含SEQID NO:346，例如由其组成；

(c)crRNA和tracr，该crRNA包含SEQ ID NO:358，例如由其组成，并且该tracr包含SEQID NO:6660，例如由其组成；或者

(d)crRNA和tracr，该crRNA包含SEQ ID NO:358，例如由其组成，并且该tracr包含SEQID NO:346，例如由其组成。

49.如权利要求1所述的gRNA分子，该gRNA分子包含以下序列，例如由其组成：

(a)SEQ ID NO:359；

(b)SEQ ID NO:360；或者

(c)SEQ ID NO:1766。

50.如权利要求1所述的gRNA分子，该gRNA分子包含以下，例如由其组成：

(a)crRNA和tracr，该crRNA包含SEQ ID NO:361，例如由其组成，并且该tracr包含SEQID NO:6660，例如由其组成；

(b)crRNA和tracr，该crRNA包含SEQ ID NO:361，例如由其组成，并且该tracr包含SEQID NO:346，例如由其组成；

(c)crRNA和tracr，该crRNA包含SEQ ID NO:362，例如由其组成，并且该tracr包含SEQID NO:6660，例如由其组成；或者

(d)crRNA和tracr，该crRNA包含SEQ ID NO:362，例如由其组成，并且该tracr包含SEQID NO:346，例如由其组成。

51.如权利要求1所述的gRNA分子，该gRNA分子包含以下序列，例如由其组成：

(a)SEQ ID NO:363；

(b)SEQ ID NO:364；或者

(c)SEQ ID NO:1767。

52.如权利要求1所述的gRNA分子，该gRNA分子包含以下，例如由其组成：

(a)crRNA和tracr，该crRNA包含SEQ ID NO:365，例如由其组成，并且该tracr包含SEQID NO:6660，例如由其组成；

(b)crRNA和tracr，该crRNA包含SEQ ID NO:365，例如由其组成，并且该tracr包含SEQID NO:346，例如由其组成；

(c)crRNA和tracr，该crRNA包含SEQ ID NO:366，例如由其组成，并且该tracr包含SEQID NO:6660，例如由其组成；或者

(d)crRNA和tracr，该crRNA包含SEQ ID NO:366，例如由其组成，并且该tracr包含SEQID NO:346，例如由其组成。

53.如权利要求1所述的gRNA分子，该gRNA分子包含以下序列，例如由其组成：

(a)SEQ ID NO:367；

(b)SEQ ID NO:368；或者

(c)SEQ ID NO:1768。

54.如权利要求1所述的gRNA分子，该gRNA分子包含以下，例如由其组成：

(a)crRNA和tracr，该crRNA包含SEQ ID NO:369，例如由其组成，并且该tracr包含SEQID NO:6660，例如由其组成；

(b)crRNA和tracr，该crRNA包含SEQ ID NO:369，例如由其组成，并且该tracr包含SEQID NO:346，例如由其组成；

(c)crRNA和tracr，该crRNA包含SEQ ID NO:370，例如由其组成，并且该tracr包含SEQID NO:6660，例如由其组成；或者

(d)crRNA和tracr，该crRNA包含SEQ ID NO:370，例如由其组成，并且该tracr包含SEQID NO:346，例如由其组成。

55.如权利要求1所述的gRNA分子，该gRNA分子包含以下序列，例如由其组成：

(a)SEQ ID NO:371；

(b)SEQ ID NO:372；或者

(c)SEQ ID NO:1769。

56.如权利要求1所述的gRNA分子，该gRNA分子包含以下，例如由其组成：

(a)crRNA和tracr，该crRNA包含SEQ ID NO:373，例如由其组成，并且该tracr包含SEQID NO:6660，例如由其组成；

(b)crRNA和tracr，该crRNA包含SEQ ID NO:373，例如由其组成，并且该tracr包含SEQID NO:346，例如由其组成；

(c)crRNA和tracr，该crRNA包含SEQ ID NO:374，例如由其组成，并且该tracr包含SEQID NO:6660，例如由其组成；或者

(d)crRNA和tracr，该crRNA包含SEQ ID NO:374，例如由其组成，并且该tracr包含SEQID NO:346，例如由其组成。

57.如权利要求1所述的gRNA分子，该gRNA分子包含以下序列，例如由其组成：

(a)SEQ ID NO:375；

(b)SEQ ID NO:376；或者

(c)SEQ ID NO:1770。

58.如权利要求1所述的gRNA分子，该gRNA分子包含以下，例如由其组成：

(a)crRNA和tracr，该crRNA包含SEQ ID NO:377，例如由其组成，并且该tracr包含SEQID NO:6660，例如由其组成；

(b)crRNA和tracr，该crRNA包含SEQ ID NO:377，例如由其组成，并且该tracr包含SEQID NO:346，例如由其组成；

(c)crRNA和tracr，该crRNA包含SEQ ID NO:378，例如由其组成，并且该tracr包含SEQID NO:6660，例如由其组成；或者

(d)crRNA和tracr，该crRNA包含SEQ ID NO:378，例如由其组成，并且该tracr包含SEQID NO:346，例如由其组成。

59.如权利要求1所述的gRNA分子，该gRNA分子包含以下序列，例如由其组成：

(a)SEQ ID NO:379；

(b)SEQ ID NO:380；或者

(c)SEQ ID NO:1771。

60.如权利要求1所述的gRNA分子，该gRNA分子包含以下，例如由其组成：

(a)crRNA和tracr，该crRNA包含SEQ ID NO:381，例如由其组成，并且该tracr包含SEQID NO:6660，例如由其组成；

(b)crRNA和tracr，该crRNA包含SEQ ID NO:381，例如由其组成，并且该tracr包含SEQID NO:346，例如由其组成；

(c)crRNA和tracr，该crRNA包含SEQ ID NO:382，例如由其组成，并且该tracr包含SEQID NO:6660，例如由其组成；或者

(d)crRNA和tracr，该crRNA包含SEQ ID NO:382，例如由其组成，并且该tracr包含SEQID NO:346，例如由其组成。

61.如权利要求1所述的gRNA分子，该gRNA分子包含以下序列，例如由其组成：

(a)SEQ ID NO:383；

(b)SEQ ID NO:384；或者

(c)SEQ ID NO:1772。

62.如权利要求1所述的gRNA分子，该gRNA分子包含以下，例如由其组成：

(a)crRNA和tracr，该crRNA包含SEQ ID NO:385，例如由其组成，并且该tracr包含SEQID NO:6660，例如由其组成；

(b)crRNA和tracr，该crRNA包含SEQ ID NO:385，例如由其组成，并且该tracr包含SEQID NO:346，例如由其组成；

(c)crRNA和tracr，该crRNA包含SEQ ID NO:386，例如由其组成，并且该tracr包含SEQID NO:6660，例如由其组成；或者

(d)crRNA和tracr，该crRNA包含SEQ ID NO:386，例如由其组成，并且该tracr包含SEQID NO:346，例如由其组成。

63.如权利要求1所述的gRNA分子，该gRNA分子包含以下序列，例如由其组成：

(a)SEQ ID NO:387；

(b)SEQ ID NO:388；或者

(c)SEQ ID NO:1773。

64.如权利要求1所述的gRNA分子，该gRNA分子包含以下，例如由其组成：

(a)crRNA和tracr，该crRNA包含SEQ ID NO:389，例如由其组成，并且该tracr包含SEQID NO:6660，例如由其组成；

(b)crRNA和tracr，该crRNA包含SEQ ID NO:389，例如由其组成，并且该tracr包含SEQID NO:346，例如由其组成；

(c)crRNA和tracr，该crRNA包含SEQ ID NO:390，例如由其组成，并且该tracr包含SEQID NO:6660，例如由其组成；或者

(d)crRNA和tracr，该crRNA包含SEQ ID NO:390，例如由其组成，并且该tracr包含SEQID NO:346，例如由其组成。

65.如权利要求1所述的gRNA分子，该gRNA分子包含以下序列，例如由其组成：

(a)SEQ ID NO:391；

(b)SEQ ID NO:392；或者

(c)SEQ ID NO:1774。

66.如权利要求1所述的gRNA分子，该gRNA分子包含以下，例如由其组成：

(a)crRNA和tracr，该crRNA包含SEQ ID NO:393，例如由其组成，并且该tracr包含SEQID NO:6660，例如由其组成；

(b)crRNA和tracr，该crRNA包含SEQ ID NO:393，例如由其组成，并且该tracr包含SEQID NO:346，例如由其组成；

(c)crRNA和tracr，该crRNA包含SEQ ID NO:394，例如由其组成，并且该tracr包含SEQID NO:6660，例如由其组成；或者

(d)crRNA和tracr，该crRNA包含SEQ ID NO:394，例如由其组成，并且该tracr包含SEQID NO:346，例如由其组成。

67.如权利要求1所述的gRNA分子，该gRNA分子包含以下序列，例如由其组成：

(a)SEQ ID NO:395；

(b)SEQ ID NO:396；或者

(c)SEQ ID NO:1775。

68.如权利要求1所述的gRNA分子，该gRNA分子包含以下，例如由其组成：

(a)crRNA和tracr，该crRNA包含SEQ ID NO:397，例如由其组成，并且该tracr包含SEQID NO:6660，例如由其组成；

(b)crRNA和tracr，该crRNA包含SEQ ID NO:397，例如由其组成，并且该tracr包含SEQID NO:346，例如由其组成；

(c)crRNA和tracr，该crRNA包含SEQ ID NO:398，例如由其组成，并且该tracr包含SEQID NO:6660，例如由其组成；或者

(d)crRNA和tracr，该crRNA包含SEQ ID NO:398，例如由其组成，并且该tracr包含SEQID NO:346，例如由其组成。

69.如权利要求1-68中任一项所述的gRNA分子，其中当将包含该gRNA分子的CRISPR系统(例如如本文所述的RNP)引入细胞中时，在与该gRNA分子的靶向结构域互补的靶序列处或其附近形成插入/缺失。

70.如权利要求69所述的gRNA分子，其中该插入/缺失不包含GATA-1或TAL-1结合位点的核苷酸。

71.如权利要求1-70中任一项所述的gRNA分子，其中当将包含该gRNA分子的CRISPR系统(例如如本文所述的RNP)引入细胞群中时，在该群的至少约40％，例如至少约50％、例如至少约60％、例如至少约70％、例如至少约80％、例如至少约90％、例如至少约95％、例如至少约96％、例如至少约97％、例如至少约98％、例如至少约99％的细胞中，在与该gRNA分子的靶向结构域互补的靶序列处或其附近形成插入/缺失。

72.如权利要求1-68中任一项所述的gRNA分子，其中当将包含该gRNA分子的CRISPR系统(例如如本文所述的RNP)引入细胞群中时，在该群的至少约20％，例如至少约30％、例如至少约35％、例如至少约40％、例如至少约45％、例如至少约50％、例如至少约55％、例如至少约60％、例如至少约65％、例如至少约70％、例如至少约75％、例如至少约80％、例如至少约85％、例如至少约90％、例如至少约95％、例如至少约99％的细胞中，在与该gRNA分子的靶向结构域互补的靶序列处或其附近形成插入/缺失，该插入/缺失不包含GATA-1或TAL-1结合位点的核苷酸。

73.如权利要求71-72中任一项所述的gRNA分子，其中在该群的至少约30％，例如至少约40％、例如至少约50％、例如至少约60％、例如至少约70％、例如至少约80％、例如至少约90％、例如至少约95％、例如至少约96％、例如至少约97％、例如至少约98％、例如至少约99％的细胞中，该插入/缺失是图25、表15、表26、表27或表37中任一个中列出的插入/缺失。

74.如权利要求71-73中任一项所述的gRNA分子，其中所述细胞群中三个最常检测到的插入/缺失包括图25、表15、表26、表27或表37中任一个中列出的与任何gRNA分子相关的插入/缺失。

75.如权利要求69-74中任一项所述的gRNA分子，其中该插入/缺失是如通过下一代测序(NGS)所测量的。

76.如权利要求1-75中任一项所述的gRNA分子，其中当将包含该gRNA分子的CRISPR系统(例如如本文所述的RNP)引入细胞中时，胎儿血红蛋白在所述细胞或其子代，例如其类红细胞子代，例如其红细胞子代中的表达增加。

77.如权利要求76所述的gRNA分子，其中胎儿血红蛋白在所述细胞或其子代，例如其类红细胞子代，例如其红细胞子代中的表达增加至少约20％，例如至少约30％、例如至少约40％、例如至少约50％、例如至少约60％、例如至少约70％、例如至少约80％、例如至少约90％、例如至少约95％、例如至少约96％、例如至少约97％、例如至少约98％、例如至少约99％。

78.如权利要求76-77中任一项所述的gRNA分子，其中所述细胞或其子代，例如其类红细胞子代，例如其红细胞子代产生每个细胞至少约6皮克(例如，至少约7皮克、至少约8皮克、至少约9皮克、至少约10皮克、或从约8皮克至约9皮克、或从约9皮克至约10皮克)胎儿血红蛋白。

79.如权利要求1-78中任一项所述的gRNA分子，其中当将包含该gRNA分子的CRISPR系统(例如如本文所述的RNP)引入细胞中时，在所述细胞中未形成脱靶插入/缺失，例如如通过下一代测序和/或核苷酸插入测定可检测到的。

80.如权利要求1-78中任一项所述的gRNA分子，其中当将包含该gRNA分子的CRISPR系统(例如如本文所述的RNP)引入细胞群中时，在该细胞群的不多于约5％，例如不多于约1％、例如不多于约0.1％、例如不多于约0.01％的细胞中检测到脱靶插入/缺失，例如如通过下一代测序和/或核苷酸插入测定可检测到的。

81.如权利要求69-80中任一项所述的gRNA分子，其中该细胞是(或细胞群包含)哺乳动物细胞、灵长类动物细胞、或人细胞，例如是人细胞。

82.如权利要求81所述的gRNA分子，其中该细胞是(或细胞群包含)HSPC。

83.如权利要求82所述的gRNA分子，其中该HSPC是CD34+。

84.如权利要求83所述的gRNA分子，其中该HSPC是CD34+CD90+。

85.如权利要求69-84中任一项所述的gRNA分子，其中该细胞相对于待施用所述细胞的患者是自体的。

86.如权利要求69-84中任一项所述的gRNA分子，其中该细胞相对于待施用所述细胞的患者是同种异体的。

87.一种组合物，该组合物包含：

1)如权利要求1-86中任一项所述的一种或多种gRNA分子(包括第一gRNA分子)、和Cas9分子；

2)如权利要求1-86中任一项所述的一种或多种gRNA分子(包括第一gRNA分子)、和编码Cas9分子的核酸；

3)编码如权利要求1-86中任一项所述的一种或多种gRNA分子(包括第一gRNA分子)的核酸、和Cas9分子；

4)编码如权利要求1-86中任一项所述的一种或多种gRNA分子(包括第一gRNA分子)的核酸、和编码Cas9分子的核酸；或者

5)以上1)至4)中的任一个、和模板核酸；或者

6)以上1)至4)中的任一个、和包含编码模板核酸的序列的核酸。

88.一种包含如权利要求1-86中任一项所述的第一gRNA分子的组合物，该组合物进一步包含Cas9分子。

89.如权利要求87或88所述的组合物，其中该Cas9分子是有活性或无活性的酿脓链球菌Cas9。

90.如权利要求87-89所述的组合物，其中该Cas9分子包含SEQ ID NO:6611。

91.如权利要求87-89所述的组合物，其中该Cas9分子包含以下，例如由其组成：

(a)SEQ ID NO:7821；

(b)SEQ ID NO:7822；

(c)SEQ ID NO:7823；

(d)SEQ ID NO:7824；

(e)SEQ ID NO:7825；

(f)SEQ ID NO:7826；

(g)SEQ ID NO:7827；

(h)SEQ ID NO:7828；

(i)SEQ ID NO:7829；

(j)SEQ ID NO:7830；或者

(k)SEQ ID NO:7831。

92.如权利要求88-91中任一项所述的组合物，其中该第一gRNA分子和Cas9分子存在于核糖核蛋白复合物(RNP)中。

93.如权利要求87-92中任一项所述的组合物，该组合物进一步包含第二gRNA分子；第二gRNA分子和第三gRNA分子；或第二gRNA分子、任选地第三gRNA分子、以及任选地第四gRNA分子，其中该第二gRNA分子、该任选的第三gRNA分子、和该任选的第四gRNA分子是如权利要求1-68中任一项所述的gRNA分子，并且其中该组合物的每种gRNA分子与不同的靶序列互补。

94.如权利要求93所述的组合物，其中该第一gRNA分子、该第二gRNA分子、该任选的第三gRNA分子、和该任选的第四gRNA分子中的两种或更多种与同一基因或区域内的靶序列互补。

95.如权利要求93或94所述的组合物，其中该第一gRNA分子、该第二gRNA分子、该任选的第三gRNA分子、和该任选的第四gRNA分子与相隔不多于20000个核苷酸、不多于10000个核苷酸、不多于6000个核苷酸、不多于5000个核苷酸、不多于4000个核苷酸、不多于1000个核苷酸、不多于500个核苷酸、不多于400个核苷酸、不多于300个核苷酸、不多于200个核苷酸、不多于100个核苷酸、不多于90个核苷酸、不多于80个核苷酸、不多于70个核苷酸、不多于60个核苷酸、不多于50个核苷酸、不多于40个核苷酸、不多于30个核苷酸、不多于20个核苷酸或不多于10个核苷酸的靶序列互补。

96.如权利要求93所述的组合物，其中该第一gRNA分子、该第二gRNA分子、该任选的第三gRNA分子、和该任选的第四gRNA分子中的两种或更多种与不同基因或区域内的靶序列互补。

97.如权利要求94-95中任一项所述的组合物，该组合物包含第一gRNA分子和第二gRNA分子，其中该第一gRNA分子和第二gRNA分子：

(a)独立地选自如权利要求4所述的gRNA分子，并且与不同的靶序列互补；

(b)独立地选自如权利要求5所述的gRNA分子，并且与不同的靶序列互补；

(c)独立地选自如权利要求6所述的gRNA分子，并且与不同的靶序列互补；或者

(d)独立地选自如权利要求7所述的gRNA分子，并且与不同的靶序列互补；或者

(e)独立地选自如权利要求41-56中任一项所述的gRNA分子，并且与不同的靶序列互补。

98.如权利要求94-95中任一项所述的组合物，该组合物包含第一gRNA分子和第二gRNA分子，其中该第一gRNA分子和第二gRNA分子：

(a)独立地选自如权利要求10所述的gRNA分子，并且与不同的靶序列互补；或者

(b)独立地选自如权利要求11所述的gRNA分子，并且与不同的靶序列互补。

99.如权利要求94-95中任一项所述的组合物，该组合物包含第一gRNA分子和第二gRNA分子，其中该第一gRNA分子和第二gRNA分子：

(a)独立地选自如权利要求13所述的gRNA分子，并且与不同的靶序列互补；或者

(b)独立地选自如权利要求14所述的gRNA分子，并且与不同的靶序列互补。

100.如权利要求94-96中任一项所述的组合物，该组合物包含第一gRNA分子和第二gRNA分子，其中该第一gRNA分子和第二gRNA分子：

(a)独立地选自如权利要求16所述的gRNA分子，并且与不同的靶序列互补；

(b)独立地选自如权利要求17所述的gRNA分子，并且与不同的靶序列互补；

(c)独立地选自如权利要求18所述的gRNA分子，并且与不同的靶序列互补；或者

(d)独立地选自如权利要求57-68中任一项所述的gRNA分子，并且与不同的靶序列互补。

101.如权利要求94-96中任一项所述的组合物，该组合物包含第一gRNA分子和第二gRNA分子，其中：

(1)该第一gRNA分子：(a)选自如权利要求4所述的gRNA分子，(b)选自如权利要求5所述的gRNA分子，(c)选自如权利要求6所述的gRNA分子，(d)选自如权利要求7所述的gRNA分子，或(e)选自如权利要求41-56中任一项所述的gRNA分子；并且

(2)该第二gRNA分子：(a)选自如权利要求10所述的gRNA分子，或(b)选自如权利要求11所述的gRNA分子。

102.如权利要求94-96中任一项所述的组合物，该组合物包含第一gRNA分子和第二gRNA分子，其中：

(2)该第二gRNA分子：(a)选自如权利要求13所述的gRNA分子，(b)选自如权利要求14所述的gRNA分子。

103.如权利要求94-96中任一项所述的组合物，该组合物包含第一gRNA分子和第二gRNA分子，其中：

(2)该第二gRNA分子：(a)选自如权利要求16所述的gRNA分子，(b)选自如权利要求17所述的gRNA分子，(c)选自如权利要求18所述的gRNA分子，或(d)选自如权利要求57-68中任一项所述的gRNA分子。

104.如权利要求94-96中任一项所述的组合物，该组合物包含第一gRNA分子和第二gRNA分子，其中：

(1)该第一gRNA分子：(a)选自如权利要求10所述的gRNA分子，或(b)选自如权利要求11所述的gRNA分子；并且

105.如权利要求94-96中任一项所述的组合物，该组合物包含第一gRNA分子和第二gRNA分子，其中：

106.如权利要求94-96中任一项所述的组合物，该组合物包含第一gRNA分子和第二gRNA分子，其中：

(1)该第一gRNA分子：(a)选自如权利要求13所述的gRNA分子，(b)选自如权利要求14所述的gRNA分子；并且

107.如权利要求96所述的组合物，该组合物包含第一gRNA分子和第二gRNA分子，其中：

(1)该第一gRNA分子：(a)选自如权利要求16所述的gRNA分子，(b)选自如权利要求17所述的gRNA分子，(c)选自如权利要求18所述的gRNA分子，或(d)选自如权利要求57-68中任一项所述的gRNA分子；并且(2)该第二gRNA分子包含与β珠蛋白基因的靶序列互补的靶向结构域；或者

(1)该第一gRNA分子：(a)选自如权利要求4所述的gRNA分子，(b)选自如权利要求5所述的gRNA分子，(c)选自如权利要求6所述的gRNA分子，(d)选自如权利要求7所述的gRNA分子，(e)选自如权利要求41-56中任一项所述的gRNA分子，(f)选自如权利要求10所述的gRNA分子，(g)选自如权利要求11所述的gRNA分子，(h)选自如权利要求13所述的gRNA分子，或(i)选自如权利要求14所述的gRNA分子；并且(2)该第二gRNA分子包含与β珠蛋白基因的靶序列互补的靶向结构域。

108.如权利要求94-96所述的组合物，其中该第一gRNA分子和该第二gRNA分子独立地选自如权利要求41-68中任一项所述的gRNA分子。

109.如权利要求87-108中任一项所述的组合物，其中就该组合物的gRNA分子组成部分而言，该组合物由第一gRNA分子和第二gRNA分子组成。

110.如权利要求87-109中任一项所述的组合物，其中每种所述gRNA分子处于具有本文所述的Cas9分子，例如如权利要求90或91中任一项所述的Cas9分子的核糖核蛋白复合物(RNP)中。

111.如权利要求87-110中任一项所述的组合物，该组合物包含模板核酸，其中该模板核酸包含与在该第一gRNA分子的靶序列处或其附近的核苷酸对应的核苷酸。

112.如权利要求111中任一项所述的组合物，其中该模板核酸包含编码以下的核酸：

(a)人β珠蛋白(例如包含突变G16D、E22A和T87Q中的一个或多个的人β珠蛋白)或其片段；或者

(b)人γ珠蛋白或其片段。

113.如权利要求87-112中任一项所述的组合物，该组合物被配制在适于电穿孔的介质中。

114.如权利要求87-113中任一项所述的组合物，其中每种所述gRNA分子处于具有本文所述的Cas9分子的RNP中，并且其中每种所述RNP的浓度小于约10uM，例如小于约3uM、例如小于约1uM、例如小于约0.5uM、例如小于约0.3uM、例如小于约0.1uM。

115.一种核酸序列，该核酸序列编码如权利要求1-68中任一项所述的一种或多种gRNA分子。

116.如权利要求115所述的核酸序列，其中该核酸包含与编码该一种或多种gRNA分子的序列有效地连接的启动子。

117.如权利要求116所述的核酸序列，其中该启动子是由RNA聚合酶II或RNA聚合酶III识别的启动子。

118.如权利要求117所述的核酸序列，其中该启动子是U6启动子或HI启动子。

119.如权利要求115-118中任一项所述的核酸序列，其中该核酸还编码Cas9分子。

120.如权利要求119所述的核酸序列，其中该Cas9分子包含SEQ ID NO:6611、SEQ IDNO:7821、SEQ ID NO:7822、SEQ ID NO:7823、SEQ ID NO:7824、SEQ ID NO:7825、SEQ IDNO:7826、SEQ ID NO:7827、SEQ ID NO:7828、SEQ ID NO:7829、SEQ ID NO:7830、或SEQ IDNO:7831中的任一个。

121.如权利要求119-120中任一项所述的核酸序列，其中所述核酸包含与编码Cas9分子的序列有效地连接的启动子。

122.如权利要求121所述的核酸序列，其中该启动子是EF-1启动子、CMV IE基因启动子、EF-1α启动子、泛蛋白C启动子、或磷酸甘油酸激酶(PGK)启动子。

123.一种载体，该载体包含如权利要求115-122中任一项所述的核酸。

124.如权利要求123所述的载体，其中该载体选自由以下组成的组：慢病毒载体、腺病毒载体、腺相关病毒(AAV)载体、单纯疱疹病毒(HSV)载体、质粒、微环、纳米质粒、和RNA载体。

125.一种在细胞内的靶序列处或其附近改变所述细胞(例如细胞群)(例如改变核酸的结构(例如序列))的方法，该方法包括使所述细胞(例如细胞群)与以下进行接触(例如向所述细胞(例如细胞群)中引入)：

1)如权利要求1-68中任一项所述的一种或多种gRNA分子、和Cas9分子；

2)如权利要求1-68中任一项所述的一种或多种gRNA分子、和编码Cas9分子的核酸；

3)编码如权利要求1-68中任一项所述的一种或多种gRNA分子的核酸、和Cas9分子；

4)编码如权利要求1-68中任一项所述的一种或多种gRNA分子的核酸、和编码Cas9分子的核酸；

5)以上1)至4)中的任一个、和模板核酸；

6)以上1)至4)中的任一个、和包含编码模板核酸的序列的核酸；

7)如权利要求87-114中任一项所述的组合物；或者

8)如权利要求123-124中任一项所述的载体。

126.如权利要求125所述的方法，其中该gRNA分子或编码该gRNA分子的核酸、以及该Cas9分子或编码该Cas9分子的核酸被配制在单一组合物中。

127.如权利要求125所述的方法，其中该gRNA分子或编码该gRNA分子的核酸、以及该Cas9分子或编码该Cas9分子的核酸被配制在多于一种组合物中。

128.如权利要求127所述的方法，其中同时或顺序地递送该多于一种组合物。

129.如权利要求125-128中任一项所述的方法，其中该细胞是动物细胞。

130.如权利要求125-128中任一项所述的方法，其中该细胞是哺乳动物细胞、灵长类动物细胞、或人细胞。

131.如权利要求130所述的方法，其中该细胞是造血干细胞或祖细胞(HSPC)(例如HSPC群)。

132.如权利要求125-131中任一项所述的方法，其中该细胞是CD34+细胞。

133.如权利要求125-132中任一项所述的方法，其中该细胞是CD34+CD90+细胞。

134.如权利要求125-133中任一项所述的方法，其中将该细胞布置于包含已富集CD34+细胞的细胞群的组合物中。

135.如权利要求125-134中任一项所述的方法，其中该细胞(例如细胞群)已自骨髓、动员的外周血、或脐带血分离。

136.如权利要求125-135中任一项所述的方法，其中该细胞相对于待施用所述细胞的患者是自体的或同种异体的。

137.如权利要求125-136中任一项所述的方法，其中该改变导致在与该一种或多种gRNA分子的靶向结构域互补的基因组DNA序列处或其附近的插入/缺失。

138.如权利要求137所述的方法，其中该插入/缺失是图25、表15、表26、表27或表37所示的插入/缺失。

139.如权利要求137-138所述的方法，其中该插入/缺失是小于约40个核苷酸，例如小于30个核苷酸、例如小于20个核苷酸、例如小于10个核苷酸的插入或缺失。

140.如权利要求139所述的方法，其中该插入/缺失是单个核苷酸缺失。

141.如权利要求137-140中任一项所述的方法，其中该方法产生细胞群，其中该群的至少约50％，例如至少约60％、例如至少约70％、例如至少约80％、例如至少约90％(例如至少约95％、至少约96％、至少约97％、至少约98％、或至少约99％)的细胞已被改变，例如包含插入/缺失。

142.如权利要求125-141中任一项所述的方法，其中该改变产生如下细胞(例如细胞群)，该细胞(例如细胞群)能够分化成类红细胞谱系的分化的细胞(例如红细胞)，并且其中所述分化的细胞例如相对于未经改变的细胞(例如细胞群)表现出增加的胎儿血红蛋白水平。

143.如权利要求125-142中任一项所述的方法，其中该改变产生如下细胞群，该细胞群能够分化成分化的细胞群，例如类红细胞谱系细胞群(例如红细胞群)，并且其中所述分化的细胞群例如相对于未经改变的细胞群具有增加的F细胞分数(例如，高至少约15％、高至少约20％、高至少约25％、高至少约30％、或高至少约40％)。

144.如权利要求125-142中任一项所述的方法，其中该改变产生如下细胞，该细胞能够分化成分化的细胞，例如类红细胞谱系细胞(例如红细胞)，并且其中所述分化的细胞产生每个细胞至少约6皮克(例如，至少约7皮克、至少约8皮克、至少约9皮克、至少约10皮克、或从约8皮克至约9皮克、或从约9皮克至约10皮克)胎儿血红蛋白。

145.一种细胞，通过如权利要求125-144中任一项所述的方法改变。

146.一种细胞，可通过如权利要求125-144中任一项所述的方法获得。

147.一种细胞，该细胞包含如权利要求1-68中任一项所述的第一gRNA分子、或如权利要求87-114中任一项所述的组合物、如权利要求115-122中任一项所述的核酸、或如权利要求123-124中任一项所述的载体。

148.如权利要求147所述的细胞，该细胞包含Cas9分子。

149.如权利要求148所述的细胞，其中该Cas9分子包含SEQ ID NO:6611、SEQ ID NO:7821、SEQ ID NO:7822、SEQ ID NO:7823、SEQ ID NO:7824、SEQ ID NO:7825、SEQ ID NO:7826、SEQ ID NO:7827、SEQ ID NO:7828、SEQ ID NO:7829、SEQ ID NO:7830、或SEQ ID NO:7831中的任一个。

150.如权利要求145-149中任一项所述的细胞，其中该细胞包含、已包含、或将包含如权利要求1-68中任一项所述的第二gRNA分子、或编码如权利要求1-68中任一项所述的第二gRNA分子的核酸，其中该第一gRNA分子和第二gRNA分子包含不相同的靶向结构域。

151.如权利要求145-150中任一项所述的细胞，其中相对于未经修饰以包含gRNA分子的相同细胞类型的细胞或其子代，所述细胞或其子代(例如其类红细胞子代，例如其红细胞子代)中的胎儿血红蛋白的表达增加。

152.如权利要求145-150中任一项所述的细胞，其中该细胞能够分化成分化的细胞，例如类红细胞谱系细胞(例如红细胞)，并且其中所述分化的细胞例如相对于未经修饰以包含gRNA分子的相同类型的细胞表现出增加的胎儿血红蛋白水平。

153.如权利要求152所述的细胞，其中例如相对于未经修饰以包含gRNA分子的相同类型的细胞，该分化的细胞(例如类红细胞谱系细胞，例如红细胞)产生至少约6皮克(例如，至少约7皮克、至少约8皮克、至少约9皮克、至少约10皮克、或从约8皮克至约9皮克、或从约9皮克至约10皮克)胎儿血红蛋白。

154.如权利要求145-153中任一项所述的细胞，该细胞已与干细胞扩增剂进行了接触。

155.如权利要求154所述的细胞，其中该干细胞扩增剂是化合物1、化合物2、化合物3、化合物4、或其组合(例如，化合物1和化合物4)。

156.如权利要求155所述的细胞，其中该干细胞扩增剂是化合物4。

157.一种细胞，例如如权利要求145-156中任一项所述的细胞，该细胞包含在与如权利要求1-68中任一项所述的gRNA分子的靶向结构域互补的基因组DNA序列处或其附近的插入/缺失。

158.如权利要求157所述的细胞，其中该插入/缺失是图25、表15、表26、表27或表37所示的插入/缺失。

159.如权利要求157-158中任一项所述的细胞，其中该插入/缺失是小于约40个核苷酸，例如小于30个核苷酸、例如小于20个核苷酸、例如小于10个核苷酸的插入或缺失。

160.如权利要求157-159中任一项所述的细胞，其中该插入/缺失是单个核苷酸缺失。

161.如权利要求145-160中任一项所述的细胞，其中该细胞是动物细胞。

162.如权利要求161所述的细胞，其中该细胞是哺乳动物细胞、灵长类动物细胞、或人细胞。

163.如权利要求145-162中任一项所述的细胞，其中该细胞是造血干细胞或祖细胞(HSPC)(例如HSPC群)。

164.如权利要求145-163中任一项所述的细胞，其中该细胞是CD34+细胞。

165.如权利要求164所述的细胞，其中该细胞是CD34+CD90+细胞。

166.如权利要求145-165中任一项所述的细胞，其中该细胞(例如细胞群)已自骨髓、动员的外周血、或脐带血分离。

167.如权利要求145-166中任一项所述的细胞，其中该细胞相对于待施用所述细胞的患者是自体的。

168.如权利要求145-166中任一项所述的细胞，其中该细胞相对于待施用所述细胞的患者是同种异体的。

169.一种细胞群，该细胞群包含如权利要求145-168中任一项所述的细胞。

170.如权利要求169所述的细胞群，其中该群的至少约50％，例如至少约60％、例如至少约70％、例如至少约80％、例如至少约90％(例如至少约95％、至少约96％、至少约97％、至少约98％、或至少约99％)的细胞是如权利要求145-168中任一项所述的细胞。

171.如权利要求169-170中任一项所述的细胞群，其中该细胞群能够分化成分化的细胞群，例如类红细胞谱系细胞群(例如红细胞群)，并且其中所述分化的细胞群例如相对于相同类型的未经修饰的细胞群具有增加的F细胞分数(例如，高至少约15％、高至少约20％、高至少约25％、高至少约30％、或高至少约40％)。

172.如权利要求171所述的细胞群，其中该分化的细胞群的F细胞产生每个细胞平均至少约6皮克(例如，至少约7皮克、至少约8皮克、至少约9皮克、至少约10皮克、或从约8皮克至约9皮克、或从约9皮克至约10皮克)胎儿血红蛋白。

173.如权利要求169-172中任一项所述的细胞群，该细胞群包含：

1)至少1e6个CD34+细胞/kg待施用所述细胞的患者的体重；

2)至少2e6个CD34+细胞/kg待施用所述细胞的患者的体重；

3)至少3e6个CD34+细胞/kg待施用所述细胞的患者的体重；

4)至少4e6个CD34+细胞/kg待施用所述细胞的患者的体重；或者

5)从2e6个至10e6个CD34+细胞/kg待施用所述细胞的患者的体重。

174.如权利要求169-173中任一项所述的细胞群，其中该群的至少约40％，例如至少约50％(例如，至少约60％、至少约70％、至少约80％、或至少约90％)的细胞是CD34+细胞。

175.如权利要求174所述的细胞群，其中该群的至少约10％，例如至少约15％、例如至少约20％、例如至少约30％的细胞是CD34+CD90+细胞。

176.如权利要求169-175中任一项所述的细胞群，其中该细胞群源自骨髓。

177.如权利要求169-176中任一项所述的细胞群，其中该细胞群包含哺乳动物细胞例如人细胞，例如由其组成。

178.如权利要求169-177中任一项所述的细胞群，其中该细胞群相对于待将其施用至的患者是自体的。

179.如权利要求169-177中任一项所述的细胞群，其中该细胞群相对于待将其施用至的患者是同种异体的。

180.一种组合物，该组合物包含如权利要求145-168中任一项所述的细胞、或如权利要求169-179中任一项所述的细胞群。

181.如权利要求180所述的组合物，该组合物包含可药用介质，例如适于冷冻保存的可药用介质。

182.一种治疗血红蛋白病的方法，该方法包括向患者施用如权利要求145-168中任一项所述的细胞、如权利要求169-179中任一项所述的细胞群、或如权利要求180-181中任一项所述的组合物。

183.一种增加哺乳动物中胎儿血红蛋白表达的方法，该方法包括向患者施用如权利要求145-168中任一项所述的细胞、如权利要求169-179中任一项所述的细胞群、或如权利要求180-181中任一项所述的组合物。

184.如权利要求182所述的方法，其中该血红蛋白病是β-地中海贫血或镰状细胞疾病。

185.一种制备细胞(例如细胞群)的方法，该方法包括：

(a)提供细胞(例如细胞群)(例如HSPC(例如HSPC群))；

(b)在包含干细胞扩增剂的细胞培养基中离体培养所述细胞(例如所述细胞群)；和

(c)向所述细胞中引入如权利要求1-68中任一项所述的第一gRNA分子、编码如权利要求1-68中任一项所述的第一gRNA分子的核酸分子、如权利要求87-114中任一项所述的组合物、如权利要求115-122中任一项所述的核酸、或如权利要求123-124中任一项所述的载体。

186.如权利要求185所述的方法，其中在所述引入步骤(c)之后，所述细胞(例如细胞群)能够分化成分化的细胞(例如分化的细胞群)，例如类红细胞谱系细胞(例如类红细胞谱系细胞群)，例如红细胞(例如红细胞群)，并且其中所述分化的细胞(例如分化的细胞群)例如相对于未经受步骤(c)的相同细胞产生增加的胎儿血红蛋白。

187.如权利要求185-186中任一项所述的方法，其中该干细胞扩增剂是化合物1、化合物2、化合物3、化合物4或其组合(例如，化合物1和化合物4)。

188.如权利要求187所述的方法，其中该干细胞扩增剂是化合物4。

189.如权利要求185-188中任一项所述的方法，其中该细胞培养基包含促血小板生成素(Tpo)、Flt3配体(Flt-3L)、和人干细胞因子(SCF)。

190.如权利要求189所述的方法，其中该细胞培养基进一步包含人白细胞介素-6(IL-6)。

191.如权利要求189-190所述的方法，其中该细胞培养基包含各自浓度范围从约10ng/mL至约1000ng/mL的促血小板生成素(Tpo)、Flt3配体(Flt-3L)、和人干细胞因子(SCF)。

192.如权利要求191所述的方法，其中该细胞培养基包含浓度均为约50ng/mL，例如浓度为50ng/mL的促血小板生成素(Tpo)、Flt3配体(Flt-3L)、和人干细胞因子(SCF)。

193.如权利要求190-192中任一项所述的方法，其中该细胞培养基包含浓度范围从约10ng/mL至约1000ng/mL的人白细胞介素-6(IL-6)。

194.如权利要求193所述的方法，其中该细胞培养基包含浓度为约50ng/mL，例如浓度为50ng/mL的人白细胞介素-6(IL-6)。

195.如权利要求185-194中任一项所述的方法，其中该细胞培养基包含浓度范围从约1nM至约1mM的干细胞扩增剂。

196.如权利要求195所述的方法，其中该细胞培养基包含浓度范围从约1uM至约100uM的干细胞扩增剂。

197.如权利要求196所述的方法，其中该细胞培养基包含浓度范围从约50uM至约75uM的干细胞扩增剂。

198.如权利要求197所述的方法，其中该细胞培养基包含浓度为约50uM，例如浓度为50uM的干细胞扩增剂。

199.如权利要求197所述的方法，其中该细胞培养基包含浓度为约75uM，例如浓度为75uM的干细胞扩增剂。

200.如权利要求185-199中任一项所述的方法，其中该培养步骤(b)包括在该引入步骤(c)之前的培养期。

201.如权利要求200所述的方法，其中在该引入步骤(c)之前的培养期为至少12小时，例如为约1天至约3天的时间段，例如为约1天至约2天的时间段，例如为约2天的时间段。

202.如权利要求185-201中任一项所述的方法，其中该培养步骤(b)包括在该引入步骤(c)之后的培养期。

203.如权利要求202所述的方法，其中在该引入步骤(c)之后的培养期为至少12小时，例如为约1天至约10天的时间段，例如为约1天至约5天的时间段，例如为约2天至约4天的时间段，例如为约2天的时间段或为约3天的时间段或为约4天的时间段。

204.如权利要求185-203中任一项所述的方法，其中该细胞群例如相对于未根据步骤(b)培养的细胞扩增至少4倍，例如至少5倍、例如至少10倍。

205.如权利要求185-204中任一项所述的方法，其中该引入步骤(c)包括电穿孔。

206.如权利要求205所述的方法，其中该电穿孔包含1至5个脉冲，例如1个脉冲，并且其中每个脉冲处于范围从700伏至2000伏的脉冲电压下，并且具有范围从10ms至100ms的脉冲持续时间。

207.如权利要求206所述的方法，其中该电穿孔包含1个脉冲。

208.如权利要求206-207中任一项所述的方法，其中该脉冲电压范围从1500伏至1900伏，例如为1700伏。

209.如权利要求206-208中任一项所述的方法，其中该脉冲持续时间范围从10ms至40ms，例如为20ms。

210.如权利要求185-209中任一项所述的方法，其中步骤(a)中提供的细胞(例如细胞群)是人细胞(例如人细胞群)。

211.如权利要求210所述的方法，其中步骤(a)中提供的细胞(例如细胞群)自骨髓、外周血(例如动员的外周血)或脐带血分离。

212.如权利要求211所述的方法，其中步骤(a)中提供的细胞(例如细胞群)自骨髓分离，例如自患有血红蛋白病的患者的骨髓分离。

213.如权利要求185-212中任一项所述的方法，其中步骤(a)中提供的细胞群富含CD34+细胞。

214.如权利要求185-213中任一项所述的方法，其中继该引入步骤(c)之后，将该细胞(例如细胞群)冷冻保存。

215.如权利要求185-214中任一项所述的方法，其中继该引入步骤(c)之后，该细胞(例如细胞群)包含在与该第一gRNA分子的靶向结构域互补的基因组DNA序列处或其附近的插入/缺失。

216.如权利要求132中任一项所述的方法，其中该插入/缺失是图25、表15、表26、表27或表37所示的插入/缺失。

217.如权利要求185-216中任一项所述的方法，其中在该引入步骤(c)之后，该细胞群的至少约50％、至少约60％、至少约70％、至少约80％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％或至少约99％的细胞包含在与该第一gRNA分子的靶向结构域互补的基因组DNA序列处或其附近的插入/缺失。

218.如权利要求217所述的方法，其中该细胞群的每个所述细胞中的插入/缺失是图25、表15、表26、表27或表37所示的插入/缺失。

219.一种细胞(例如细胞群)，可通过如权利要求185-218中任一项所述的方法获得。

220.一种治疗血红蛋白病的方法，该方法包括向人类患者施用包含如权利要求219所述的细胞(例如细胞群)的组合物。

221.一种增加人类患者中的胎儿血红蛋白表达的方法，该方法包括向所述人类患者施用包含如权利要求219所述的细胞(例如细胞群)的组合物。

222.如权利要求220所述的方法，其中该血红蛋白病是β-地中海贫血或镰状细胞疾病。

223.如权利要求220-222中任一项所述的方法，其中向该人类患者施用组合物，该组合物包含至少约1e6个如权利要求219所述的细胞/kg人类患者体重，例如至少约1e6个如权利要求219所述的CD34+细胞/kg人类患者体重。

224.如权利要求223所述的方法，其中向该人类患者施用组合物，该组合物包含至少约2e6个如权利要求219所述的细胞/kg人类患者体重，例如至少约2e6个如权利要求219所述的CD34+细胞/kg人类患者体重。

225.如权利要求223所述的方法，其中向该人类患者施用组合物，该组合物包含从约2e6个至约10e6个如权利要求219所述的细胞/kg人类患者体重，例如至少约2e6个至约10e6个如权利要求219所述的CD34+细胞/kg人类患者体重。

226.如权利要求1-86中任一项所述的gRNA分子、如权利要求87-114或180-181中任一项所述的组合物、如权利要求115-122中任一项所述的核酸、如权利要求123-124中任一项所述的载体、如权利要求145-168或219中任一项所述的细胞、或如权利要求169-179中任一项所述的细胞群，用于作为药剂使用。

227.如权利要求1-86中任一项所述的gRNA分子、如权利要求87-114或180-181中任一项所述的组合物、如权利要求115-122中任一项所述的核酸、如权利要求123-124中任一项所述的载体、如权利要求145-168或219中任一项所述的细胞、或如权利要求169-179中任一项所述的细胞群，用于制备药剂。

228.如权利要求1-86中任一项所述的gRNA分子、如权利要求87-114或180-181中任一项所述的组合物、如权利要求115-122中任一项所述的核酸、如权利要求123-124中任一项所述的载体、如权利要求145-168或219中任一项所述的细胞、或如权利要求169-179中任一项所述的细胞群，用于治疗疾病。

229.如权利要求1-86中任一项所述的gRNA分子、如权利要求87-114或180-181中任一项所述的组合物、如权利要求115-122中任一项所述的核酸、如权利要求123-124中任一项所述的载体、如权利要求145-168或219中任一项所述的细胞、或如权利要求169-179中任一项所述的细胞群，用于治疗疾病，其中该疾病是血红蛋白病。

230.如权利要求1-86中任一项所述的gRNA分子、如权利要求87-114或180-181中任一项所述的组合物、如权利要求115-122中任一项所述的核酸、如权利要求123-124中任一项所述的载体、如权利要求145-168或219中任一项所述的细胞、或如权利要求169-179中任一项所述的细胞群，用于治疗疾病，其中该血红蛋白病是β-地中海贫血或镰状细胞疾病。