CN113710284A

CN113710284A - 具有改善的因子viii表达的血友病a基因编辑

Info

Publication number: CN113710284A
Application number: CN202080027768.1A
Authority: CN
Inventors: A.R.布鲁克斯
Original assignee: CRISPR Therapeutics AG; Bayer Healthcare LLC
Current assignee: CRISPR Therapeutics AG; Bayer Healthcare LLC
Priority date: 2019-06-05
Filing date: 2020-04-15
Publication date: 2021-11-26
Also published as: MX2021009814A; KR20220022110A; JP2023520262A; BR112021015776A2

Abstract

本文在一些实施例中提供了用于离体或体内治疗受试者的血友病A的材料和方法。本文在一些实施例中还提供了用于将编码具有B结构域替代物的合成FVIII的编码序列敲入基因组中的材料和方法。

Description

具有改善的因子VIII表达的血友病A基因编辑

技术领域

本文提供的披露内容涉及用于离体和体内治疗血友病A的材料和方法。另外，提供用于基因编辑以调节凝血蛋白诸如因子VIII(FVIII)的表达、功能或活性的材料和方法。

背景技术

血友病A(HemA)是由FVIII基因(F8)中的遗传缺陷引起的，该遗传缺陷导致血液中FVIII蛋白水平低或检测不到。这导致在组织损伤部位处不能有效地形成凝块，从而导致出血失控，如果不治疗，则可能致命。替代缺失的或非功能性的FVIII蛋白对于HemA受试者而言是一种有效的治疗方法并且是现行护理标准。然而，蛋白替代疗法需要频繁地静脉施用FVIII蛋白，这在成人中是不方便的，在儿童中成问题，费用高昂(>$200,000/年)，并且如果不严格遵循治疗方案，则可能导致破裂出血事件。

非常需要彻底治愈血友病A。虽然使用腺相关病毒(AAV)的基于病毒的基因疗法已在临床前动物模型和人类受试者中显示出一些前景，但它具有许多缺点。例如，报道的基于AAV的基因疗法使用由肝脏特异性启动子驱动的FVIII编码序列，该启动子包封在AAV病毒衣壳内(通常使用血清型AAV5、AAV8或AAV9或AAVrh10等)。一般而言，用于基因疗法的AAV病毒将包装的编码序列盒递送至转导细胞的细胞核中，在这些细胞中该盒几乎只保持为游离型并且正是治疗性编码序列的游离型拷贝产生治疗性蛋白。AAV不具有将包封的DNA整合到宿主细胞基因组中的机制。因为治疗性编码序列保持为游离体，当宿主细胞分裂时它不协同复制，因此可能从子细胞中丢失。已证明，当含有AAV游离体的肝脏细胞被诱导分裂时，AAV基因组不复制而是被稀释。因此，预计基于AAV的基因疗法在肝脏尚未达到成人大小的儿童中不会有效。因为目前的疗法是不充分的，所以对于成人和儿童的HemA迫切需要新的有效且持久的或长期的治疗。

FVIII最初表达为具有结构域结构A1-A2-B-A3-C1-C2的蛋白。该蛋白通过大体积、高度糖基化的B结构域的蛋白水解裂解而活化，留下重链(A1-A2)和轻链(A3-C1-C2)异二聚体。FVIII蛋白的B结构域不是生物活性所需的。从FVIII编码序列中去除大B结构域对于实现可靠包装到用于体内递送的AAV载体中是必需的。然而，去除含有多达18个N-连接的糖基化位点的B结构域导致FVIII蛋白的分泌受损。因此，迫切需要可以有效和高效表达的改良形式的FVIII。

发明内容

申请人已经发现了可用于补充缺陷型F8基因，从而引起功能性FVIII蛋白表达的基因编辑组合物和方法。因此，本文提供的发明包括用于改变宿主细胞DNA序列的系统和组合物，用于改变宿主细胞基因组的方法，用于插入提供改善的表达的合成因子VIII编码序列的方法和系统，可以施用于受试者的具有提供改善的表达的合成因子VIII编码序列的细胞，用于治疗血友病A的方法，以及实现任何前述方面的试剂盒。

在一个方面，本文提供了用于改变宿主细胞DNA序列的系统，该系统具有：DNA内切核酸酶或编码该DNA内切核酸酶的核酸；具有与宿主细胞基因座互补的间隔区序列的向导RNA(gRNA)或编码该gRNA的核酸；以及具有编码合成FVIII蛋白的核酸序列的供体模板，其中该合成FVIII蛋白包含B结构域替代物，其中该B结构域替代物具有0至9个N-连接的糖基化位点且长度为3至约40个氨基酸。

在另一方面，提供了编辑宿主细胞中的基因组的方法，该方法包括向该细胞提供以下物质：具有与宿主细胞基因座互补的间隔区序列的gRNA或编码该gRNA的核酸；DNA内切核酸酶或编码该DNA内切核酸酶的核酸；以及具有编码合成FVIII蛋白的核酸序列的供体模板，其中该合成FVIII蛋白具有B结构域替代物，该B结构域替代物具有0至9个N-连接的糖基化位点且长度为3至约40个氨基酸。

在另一方面，提供了一种细胞，其中该细胞的基因组包括编码合成FVIII蛋白的DNA，该合成FVIII蛋白具有B结构域替代物，其中该B结构域替代物具有0至9个N-连接的糖基化位点且长度为3至约40个氨基酸。

在另一方面，提供了通过将如上所述的具有编码合成FVIII蛋白的DNA的细胞施用于受试者来治疗该受试者的血友病A的方法。

在另一方面，提供了通过向受试者中的细胞提供以下物质来治疗该受试者的血友病A的方法：具有与宿主细胞基因座互补的间隔区序列的gRNA或编码该gRNA的核酸；DNA内切核酸酶或编码该DNA内切核酸酶的核酸；以及具有编码合成FVIII蛋白的核酸序列的供体模板，其中该合成FVIII蛋白具有B结构域替代物，该B结构域替代物具有0至9个N-连接的糖基化位点且长度为3至约40个氨基酸。

另一方面，本文提供了一种试剂盒，该试剂盒包含上述系统的一种或多种要素，并且进一步包含使用说明书。

在另一方面，本文提供了具有编码合成FVIII蛋白的多核苷酸序列的核酸，其中该合成FVIII蛋白具有B结构域替代物，该B结构域替代物具有0至9个N-连接的糖基化位点且长度为3至约40个氨基酸。

在另一方面，本文提供了通过向受试者中的细胞提供以下物质来增加受试者中的FVIII量的方法，其中该受试者具有第一FVIII血清水平：具有与宿主细胞基因座互补的间隔区序列的gRNA或编码该gRNA的核酸；DNA内切核酸酶或编码该DNA内切核酸酶的核酸；以及具有编码合成FVIII蛋白的核酸序列的供体模板，其中该合成FVIII蛋白具有B结构域替代物，该B结构域替代物具有0至9个N-连接的糖基化位点且长度为3至约40个氨基酸。

附图说明

通过参考下面的详细描述和附图，将获得对本披露某些特征和优点的理解，下面的详细描述阐述了说明性实施例，其中利用了本披露的原理，并且附图中：

图1描绘了流体动力学注射编码FVIII供体模板的5种质粒，接着LNP递送Cas9mRNA和sgRNA后小鼠血液中的FVIII水平。

图2描绘了注射包封FVIII供体模板pCB099和pCB102的AAV8病毒，接着在4周后施用包封spCas9 mRNA和gRNA mALbT1的LNP的小鼠血液中的FVIII水平。在注射LNP后10天测量FVIII水平。

图3描绘了用四种不同的FVIII供体质粒通过HDI给药，接着用包封spCas9和mALbT1 gRNA的LNP给药的血友病A小鼠血液中的FVIII活性。

图4描绘了在LNP给药后11天和28天血友病A小鼠血液中的FVIII活性。小鼠在LNP给药前4周接受了2×10¹² vg/kg的AAV8病毒。

图5描绘了流体动力学注射质粒pCB1007(n＝7只小鼠)、pCB1019(n＝7)和pCB1020(n＝6)并且眶后注射包封mALbT1 gRNA和Cas9 mRNA的LNP的小鼠血液中的FVIII活性。在LNP给药后第6天和第9天测量FVIII。

图6描绘了流体动力学注射质粒pCB1007(n＝7只小鼠)、pCB1025(n＝7)和pCB1026(n＝6)并且眶后注射包封mALbT1 gRNA和Cas9 mRNA的LNP的小鼠血液中的FVIII活性。在LNP给药后第6天和第9天测量FVIII。

图7描绘了来自四个供体的人原代肝细胞中向导RNA T4、T5、T11和T13(靶向人白蛋白内含子1)的切割效率的结果，比较了19个碱基的靶序列与20个碱基的靶序列。

图8描绘了具有0至7个N-连接的聚糖基序和不同密码子优化的FVIII供体盒的固有表达效率(FVIII活性除以靶向整合频率)。

图9描绘了其中B结构域替代物含有0、1、3、5或6个聚糖的FVIII构建体。

图10描绘了在LNP给药后11天血友病A小鼠血液中的FVIII活性。

图11描绘了在LNP给药后28天血友病A小鼠血液中的FVIII活性。

图12描绘了具有0、1、3、5或6个N-连接的聚糖基序的FVIII供体盒的固有表达效率(FVIII活性除以靶向整合频率)。

具体实施方式

RNA向导内切核酸酶编辑提供优于例如慢病毒基因治疗方法的优点。然而，在编辑方案中插入大序列可能是有问题的，例如，原因是大序列可能难以包装以进行递送，或者与短序列相比，可能难以制造。一些蛋白需要N-连接的糖基化位点的存在才能从表达它们的细胞中正确分泌。N-糖基化位点的共有氨基酸序列是N-X-T/S，其中X是除脯氨酸以外的任何残基。将聚糖添加到N(天冬酰胺)残基(K.F.Medzihradszky,Meth Mol Biol[分子生物学方法](2008)446:293-316)。申请人已经发现，此类蛋白中N-连接的糖基化位点的数目可以大幅减小或甚至消除，从而减小蛋白编码序列的大小，而对转录、翻译或分泌没有不利影响。例如，申请人已经发现，工程化FVIII编码序列的B结构域以减小或消除糖基化位点的数量可以减小用于基因编辑的FVIII序列的大小，而不明显影响所得到的经工程化的(合成的)FVIII的转录、翻译或分泌，同时产生具有FVIII功能的经工程化的FVIII蛋白。此外，最小化添加到B结构域缺失的FVIII中的N-聚糖位点的数目将最小化产生抗体或T细胞的新型表位的风险，从而降低新型FVIII蛋白可能在受试者中诱导免疫应答的风险。本披露尤其提供了用于基因编辑以通过基因组编辑来调节细胞中凝血蛋白诸如FVIII的表达、功能或活性的组合物和方法。本披露尤其还提供了用于离体和体内治疗患有血友病A的受试者的组合物和方法。具体而言，本发明提供了提供改善的整合和改善的表达的基因组编辑方法和系统，以及能够改善血友病A的合成FVIII编码序列和蛋白。

定义

除非另有定义，否则本文使用的所有技术和科学术语具有与要求保护的主题所属领域中的技术人员通常所理解的相同含义。应当理解，详细描述仅是示例性和说明性的，并且不限制所要求保护的任何主题。在本申请中，除非另有明确说明，否则单数的使用包括复数。如说明书中所用，除非上下文另外明确指出，否则单数形式“一”、“一种(个)”和“该”包括复数指示物。在本申请中，除非另有说明，否则“或”的使用意指“和/或”。此外，术语“包括(including)”以及其他形式(诸如“包括(include)”、“包括(includes)”和“包括(included)”)的使用不是限制性的。

尽管可以在单个实施例的背景下描述本披露的特征，但是这些特征也可以单独地或以任何合适的组合来提供。相反，尽管为了清楚起见，本文中可以在单独实施例的背景下描述本披露，但是本披露也可以在单个实施例中实现。本文引用的任何公开的专利申请和任何其他公开的参考文献、文件、手稿和科学文献出于任何目的通过援引并入本文。在有冲突的情况下，将以本说明书(包括定义)为准。另外，材料、方法和实例仅为说明性的，并非旨在为限制性的。

如本文所用，范围和量可以表示为“约”特定值或范围。“约”还包括确切的量。因此，“约5μL”意指“约5μL”，还意指“5μL”。通常，术语“约”包括预期在实验误差范围诸如±1％、±2％、±3％、±5％或±10％以内的量。

当本文中呈现数值范围时，可以考虑到，在该范围的下限和上限之间的每个中间值、该范围的上限和下限值以及该范围内的所有规定值都涵盖在本披露的范围内。本披露还涵盖了该范围的下限和上限内的所有可能的子范围。

术语“多肽”、“肽”和“蛋白”在本文中可互换使用，以表示通过肽键相互连接的氨基酸残基的线性系列，该系列可以包括蛋白、多肽、寡肽、肽及其片段。蛋白可以由天然存在的氨基酸和/或合成的(例如，经修饰的或非天然存在的)氨基酸组成。如本文所用，术语“氨基酸”或“肽残基”可以指天然存在的氨基酸和合成氨基酸两者。术语“多肽”、“肽”和“蛋白”包括融合蛋白，包括但不限于有或无N端甲硫氨酸残基，具有异源氨基酸序列的融合蛋白，具有异源和同源前导序列的融合蛋白；免疫标记蛋白；具有可检测的融合伴侣的融合蛋白，例如，包括荧光蛋白、β-半乳糖苷酶、荧光素酶等作为融合伴侣的融合蛋白。此外，应该注意，在氨基酸序列的开始或末端的破折号表示连接一个或多个氨基酸残基的另一序列的肽键或连接端羧基或端羟基的共价键。然而，不应该将不存在破折号视为意指不存在连接端羧基或端羟基的这种肽键或共价键，因为在表示氨基酸序列时常规地将此省略。

术语“多核苷酸”、“寡核苷酸”、“寡聚物”(oligomer)、“寡聚物”(oligo)、“编码序列”和“核酸”是指不同长度的聚合形式的核苷酸(核糖核苷酸或脱氧核糖核苷酸)。因此，这些术语包括但不限于单链、双链或多链DNA或RNA、基因组DNA、cDNA、DNA-RNA杂合体，或具有嘌呤和嘧啶碱基或其他天然、化学或生物化学修饰的、非天然或衍生化的核苷酸碱基的聚合物。

术语“功能等效”或作为“功能等效物”是指但不限于具有源自本文披露的化合物的结构或序列并且其结构或序列与本文披露的那些足够相似，使其具有相同或相似的活性和效用或者，基于这种相似性，本领域的技术人员预计会表现出与参考化合物相同或相似的活性和效用的任何分子诸如核酸或蛋白。获得功能等效物、“衍生物”或“变体”的修饰可以包括，例如，一个或多个核酸或氨基酸残基的添加、缺失和/或取代。

蛋白的功能等效物或功能等效物片段可以具有一个或多个保守性氨基酸取代。术语“保守性氨基酸取代”是指将一个氨基酸取代为另一个具有与原氨基酸相似的特性的氨基酸，即一个氨基酸被来自同一分组的另一氨基酸取代。保守性氨基酸分组如下：

分组	氨基酸名称
		脂肪族	Gly、Ala、Val、Leu、Ile
含羟基或巯基/硒	Ser、Cys、Thr、Met
		环状	Pro
芳香族	Phe、Tyr、Trp
		碱性	His、Lys、Arg
酸性及其酰胺	Asp、Glu、Asn、Gln

可以在预定的肽或其片段的任何位置引入保守性取代。然而，也可能需要引入非保守性取代，特别是但不限于在任何一个或多个位置引入非保守性取代。导致形成肽的功能等效片段的非保守性取代将例如在极性、电荷、空间体积和/或与其他蛋白或核酸的结合方面不同，而保持功能等效物或变体片段的抗凝功能性。

通过在比较窗口中比较两个最佳比对的序列来测定序列同一性的百分比，其中多核苷酸或多肽序列在比较窗口中的一部分与参考序列(没有添加或缺失)相比，可能具有添加或缺失(即空位)以便进行两个序列的最佳比对。在一些情况下，通过以下方式来计算百分比：确定两个序列中出现相同的核酸碱基或氨基酸残基的位置数目以得到匹配位置数目，将匹配位置数目除以比较窗口中的位置总数并将结果乘以100，得到序列同一性的百分比。可以使用，例如，AlignX(包括在Vectro NTI中，基于ClustalW(http://www.clustal.org/clutal2/)，使用标准参数(例如：空位开放罚分＝15；空位延伸罚分＝6.6；空位分离罚分范围＝8)确定序列同一性。

在两个或更多个核酸或多肽序列的背景下，术语“相同”或百分比“同一性”是指正如使用以下序列比较算法之一或通过手动比对和目视检查所测量的，出于最大一致性在比较窗口或指定区域上进行比较和比对时，相同的或具有规定百分比的相同氨基酸残基或核苷酸(例如，在规定区域，例如整个多肽序列或多肽单个结构域中具有60％、65％、70％、75％、80％、85％、90％、95％、98％或99％同一性)的两个或更多个序列或子序列。于是称此类序列是“基本上相同的”。该定义也指测试序列的互补序列。

本文可互换使用的术语“互补”或“基本上互补”意指核酸(例如DNA或RNA)具有使其能够与另一个核酸以序列特异性的反向平行方式非共价结合，即形成沃森-克里克(Watson-Crick)碱基对和/或G/U碱基对的核苷酸序列(即核酸与互补核酸特异性结合)。如本领域已知的，标准的沃森-克里克碱基配对包括：腺嘌呤(A)与胸腺嘧啶(T)配对，腺嘌呤(A)与尿嘧啶(U)配对，以及鸟嘌呤(G)与胞嘧啶(C)配对。

“编码”特定RNA的DNA序列是转录为RNA的DNA核酸序列。DNA多核苷酸可以编码翻译成蛋白的RNA(mRNA)，或者DNA多核苷酸可以编码不翻译成蛋白的RNA(例如tRNA、rRNA或向导RNA；也称为“非编码”RNA或“ncRNA”)。“蛋白编码序列或编码特定蛋白或多肽的序列”是在体外或体内当置于适当调控序列的控制下时转录成mRNA(在DNA的情况下)并翻译(在mRNA的情况下)成多肽的核酸序列。

如本文所用，“密码子”是指一起形成DNA或RNA分子中的遗传密码单元的三个核苷酸的序列。如本文所用，术语“密码子简并性”是指遗传密码中容许核苷酸序列变化而不影响所编码的多肽的氨基酸序列的性质。

术语“密码子优化的”或“密码子优化”是指用于转化合适宿主的核酸分子的基因或编码区，是指核酸分子的基因或编码区中反映宿主生物体的密码子使用而不改变DNA编码的多肽的密码子改变。这种优化包括用该生物体的基因中使用频率更高的一个或多个密码子来替代至少一个或多于一个或大量密码子。密码子使用表可轻易获得，例如，在www.kazusa.or.jp/codon/上可用的“密码子使用数据库”(2019年1月30日访问)。通过利用关于每种生物体中的密码子使用或密码子偏好的知识，本领域的普通技术人员可以将这些频率应用于任何给定的多肽序列，并产生编码该多肽，但是使用给定物种的最佳密码子的密码子优化编码区的核酸片段。密码子优化编码区通过本领域技术人员已知的方法来设计。

当提到例如细胞、核酸、蛋白或载体使用时，术语“重组”或“工程化”表明该细胞、核酸、蛋白或载体已经通过实验室方法进行修饰或者是实验室方法的结果。因此，例如，重组或工程化蛋白包括通过实验室方法产生的蛋白。重组或工程化蛋白可以包括在天然(非重组或野生型)形式的蛋白中未发现的氨基酸残基，并且可以包括已经过修饰(例如标记)的氨基酸残基。该术语可以包括对肽、蛋白或核酸序列的任何修饰。此类修饰包括：肽、蛋白或核酸序列的任何化学修饰；肽或蛋白中一个或多个氨基酸的添加、缺失和/或取代；以及核酸序列中一个或多个核酸的添加、缺失和/或取代。

术语“基因组DNA”或“基因组序列”是指生物体基因组的DNA，包括但不限于细菌、真菌、古菌、植物或动物基因组的DNA。

如本文所用，“转基因”、“外源基因”和“外源序列”是指不存在于细胞基因组中但是人工引入基因组中(例如通过基因组编辑)的核酸序列或基因。

如本文所用，“内源基因”或“内源序列”是指天然存在于细胞基因组中，无需经由任何人工手段引入的核酸序列或基因。

术语“载体”或“表达载体”是指复制子，诸如质粒、噬菌体、病毒或粘粒，其上可以附着另一个DNA区段，例如“插入物”，以使该附着区段在细胞中复制。

术语“表达盒”是指具有与启动子可操作地连接的DNA编码序列的载体。“可操作地连接”是指其中所述组分处于容许它们以其预期方式起作用的关系的并置。例如，如果启动子影响编码序列的转录或表达，则该启动子是与该编码序列可操作地连接的。术语“重组表达载体”和“DNA构建体”在本文可互换使用，是指具有载体和至少一个插入物的DNA分子。重组表达载体通常是出于使插入物表达和/或繁殖的目的或为了构建其他重组核苷酸序列而产生的。核酸可以或可以不与启动子序列可操作地连接，并且可以或可以不与DNA调控序列可操作地连接。

术语“调控序列”包括启动子、增强子和其他表达控制元件(例如，聚腺苷酸化信号)。此类调控序列是本领域已知的并且例如在Goeddel；Gene Expression Technology:Methods in Enzymology[基因表达技术：酶学方法]185，加州圣地亚哥学术出版社(Academic Press,San Diego,CA)(1990)中有描述。调控序列包括那些在许多类型的宿主细胞中指导核苷酸序列组成型表达的调控序列以及那些仅在某些宿主细胞中指导核苷酸序列表达的调控序列(例如，组织特异性调控序列)。

当外源DNA例如重组表达载体已引入细胞内部时，该细胞已经被这种DNA“遗传修饰”或“转化”或“转染”。外源DNA的存在导致永久或暂时的遗传变化。转化DNA可以或可以不整合(共价连接)到细胞基因组中。具有治疗活性(例如治疗血友病A)的经遗传修饰(或转化或转染)的细胞可以使用并称为“治疗细胞”。

在分子诸如肽片段的背景下使用的术语“浓度”是指在给定体积的溶液中存在的分子的量，例如分子的摩尔数。

术语“急性期蛋白”是指响应于炎症在表达或血清浓度方面变化的蛋白。急性期蛋白的实例包括白蛋白、转铁蛋白、转甲状腺素蛋白、纤维蛋白原、抗凝血酶等。

术语“个体”、“受试者”和“宿主”是指需要诊断、治疗或疗法的任何受试者。在一些方面，受试者是哺乳动物。在一些方面，受试者是人。在一些方面，受试者是人类患者。在一些方面，受试者患有或怀疑患有血友病A和/或具有血友病A的一种或多种症状。在一些方面，受试者是被诊断为在诊断时或之后具有血友病A风险的人。在一些情况下，可以根据基因组中内源性FVIII基因或靠近FVIII基因的基因组序列中存在一个或多个可以影响FVIII基因表达的突变来确定血友病A风险的诊断。

提到疾病或病状时使用的术语“治疗”意指实现与折磨个体的病状相关的症状的缓解，其中缓解在广义上用于指与所治病状(例如，血友病A)相关的参数例如症状幅度的降低。治疗还包括这样的情形，其中病理病状或至少与之相关的症状受到完全抑制，例如防止其发生或完全消除，使得宿主不再遭受该病状或至少不再遭受该病状特有的症状。因此，治疗包括：(i)预防(即，降低临床症状发展的风险，包括使临床症状不发展，例如，预防疾病进展)，和(ii)抑制(即，阻止临床症状的发展或进一步发展，例如，减轻或完全抑制活动性疾病)。

术语“有效量”、“药物有效量”和“治疗有效量”意指当施用给患有特定病状的受试者时足以提供所需效用的组合物的量。在离体治疗血友病A的背景下，术语“有效量”是指预防或缓和血友病A的至少一种或多种体征或症状所需的治疗细胞群或其后代的量，并且涉及足以提供所需作用，例如治疗受试者的血友病A症状的具有治疗细胞或其后代的组合物的量。因此，术语“治疗有效量”是指治疗细胞或具有治疗细胞的组合物，当施用于需要治疗的受试者(诸如患有血友病A或处于血友病A风险中的受试者)时，足以促进特定作用的量或数目。有效量还包括足以预防或延迟疾病症状发展，改变疾病症状过程(例如但不限于，减缓疾病症状的进展)，或逆转疾病症状的量或数目。在体内治疗受试者(例如患者)的血友病A或在体外培养的细胞中进行基因组编辑的背景下，有效量是指编辑受试者体内细胞或体外培养的细胞的基因组所需的用于基因组编辑的组分，诸如gRNA、供体模板和/或定点多肽(诸如DNA内切核酸酶)的量。应当理解，对于任何给定的情况，本领域的普通技术人员可以确定适当的“有效量”。

如本文所用，术语“药物组合物”和“药物”是指与本发明的细胞(表达合成FVIII蛋白)和/或本发明的系统的一种或多种组分(即，gRNA或编码gRNA的核酸，DNA内切核酸酶或编码DNA内切核酸酶的核酸，和/或编码合成因子VIII蛋白的供体模板)组合的药学上可接受的赋形剂。

如本文所用，术语“药学上可接受的赋形剂”是指提供药学上可接受的载剂、添加剂或稀释剂以将一种或多种目标化合物施用于受试者的任何合适的物质。“药学上可接受的赋形剂”可以涵盖称为药学上可接受的稀释剂、药学上可接受的添加剂和药学上可接受的载剂的物质。

术语“合成FVIII”是指与野生型人因子VIII的A和C结构域具有大幅序列同一性(GenBank:CAD97566.1；G.A.Vehar等人，Nature[自然](1984)312:337-42)，但具有B结构域替代物而不是野生型B结构域的蛋白。在本发明的一个实施例中，合成FVIII蛋白的A和C结构域的序列与A和C结构域的野生型序列具有80％、90％、95％、98％或99％的同一性。在一些实施例中，B结构域替代物是具有约10至约200个氨基酸的任何序列的多肽。在一些实施例中，B结构域替代物具有约20至约100个氨基酸。在一些实施例中，B结构域替代物可具有少于40个氨基酸(例如，具有3至40个氨基酸的任何数目的氨基酸)和1-9个当表达时提供B结构域替代物糖基化的N-连接的糖基化位点。B结构域替代物可进一步包括蛋白酶裂解位点，使得合成的FVIII蛋白可以与野生型蛋白相同的方式裂解成重链和轻链。在一个实施例中，除了1-9个N-连接的糖基化(“聚糖”)位点之外，B结构域替代蛋白序列还包括来自野生型B结构域的N端和C端的1-10个氨基酸。在一个实施例中，B结构域替代蛋白序列具有1-6个聚糖位点。在一个实施例中，B结构域替代蛋白序列具有1-5个聚糖位点。在一个实施例中，B结构域替代蛋白序列具有1-4个聚糖位点。在一个实施例中，B结构域替代蛋白序列具有2-4个聚糖位点。在一个实施例中，B结构域替代蛋白序列具有SEQ ID NO:362-369、371和373中任一个的序列，或与SEQ ID NO:362-369、371和373中任一个的序列具有至少80％、90％、95％、98％或99％同一性的序列。在一个实施例中，B结构域替代蛋白序列具有SEQ ID NO:362-366、371和373中任一个的序列，或与SEQ ID NO:362-366、371和373中任一个的序列具有至少80％、90％、95％、98％或99％同一性的序列。在一个实施例中，B结构域替代蛋白序列具有SEQ ID NO:362-364、371和373中任一个的序列，或与SEQ ID NO:362-364、371和373中任一个的序列具有至少80％、90％、95％、98％或99％同一性的序列。在一个实施例中，B结构域替代蛋白序列具有SEQ ID NO:362-363中任一个的序列，或与SEQ ID NO:362-363中任一个的序列具有至少80％、90％、95％、98％或99％同一性的序列。在一个实施例中，B结构域替代蛋白序列具有SEQ ID NO:362-369中任一个的序列。在一个实施例中，B结构域替代蛋白序列具有SEQ ID NO:362-366中任一个的序列。在一个实施例中，B结构域替代蛋白序列具有SEQ ID NO:362-364中任一个的序列。在一个实施例中，B结构域替代蛋白序列具有SEQ ID NO:362-363、371和373中任一个的序列。在一个实施例中，B结构域替代蛋白序列具有SEQ ID NO:371或373中任一个的序列。

术语“安全港基因座”是指宿主细胞基因组内可以被修饰(例如，通过裂解，或通过插入供体序列)而不破坏细胞的代谢或调控(例如，通过引起细胞凋亡、增殖等)，和/或不会对其他细胞(非编辑细胞)或作为整体的宿主生物体产生风险或不利影响(例如，通过无意中引起生长因子的过表达等)的基因座。在一些实施例中，安全港基因座是在宿主细胞中表达的基因座。在一些实施例中，安全港基因座是白蛋白基因座、纤维蛋白原基因座、AAVS1基因座或转铁蛋白基因座。

核酸

靶向基因组的核酸或向导RNA

本披露提供了靶向基因组的核酸，该核酸可以将相关多肽(例如，定点多肽，诸如DNA内切核酸酶)的活性指向靶核酸内的特定靶序列。在一些实施例中，靶向基因组的核酸是RNA。靶向基因组的RNA在本文中称为“指导RNA”或“gRNA”。向导RNA至少具有可以与目标靶核酸序列和CRISPR重复序列杂交的间隔区序列。在II型系统中，gRNA还具有称为tracrRNA序列的第二RNA。在II型gRNA中，CRISPR重复序列和tracrRNA序列彼此杂交形成双链体。在V型gRNA中，crRNA形成双链体。在两种系统中，双链体都结合定点多肽，使得gRNA和定点多肽形成复合物。靶向基因组的核酸由于其与定点多肽缔合而为复合物提供了靶标特异性。因此，靶向基因组的核酸指导定点多肽的活性。

在一些实施例中，靶向基因组的核酸是双分子gRNA。双分子gRNA具有两条RNA链。第一链在5’至3’方向上具有任选的间隔区延伸序列、间隔区序列和最小CRISPR重复序列。第二条链具有最小tracrRNA序列(与最小CRISPR重复序列互补)、3’tracrRNA序列以及任选的tracrRNA延伸序列。在一些实施例中，靶向基因组的核酸是单分子gRNA。II型系统中的单分子gRNA(sgRNA)在5’至3’方向上具有任选的间隔区延伸序列、间隔区序列、最小CRISPR重复序列、单分子向导接头、最小tracrRNA序列、3’tracrRNA序列和任选的tracrRNA延伸序列。任选的tracrRNA延伸序列可以具有为gRNA贡献附加功能(例如，稳定性)的元件。单分子指导接头将最小CRISPR重复序列和最小tracrRNA序列连接起来以形成发夹结构。任选的tracrRNA延伸序列具有一个或多个发夹。V型系统中的sgRNA在5’至3’方向上具有最小CRISPR重复序列和间隔区序列。

举例说明，CRISPR/Cas/Cpf1系统中使用的gRNA或其他较小的RNA可以通过如下所述和本领域描述的化学手段容易地合成。随着化学合成程序的不断发展，通过诸如高效液相色谱法(HPLC，其避免使用诸如PAGE等凝胶)等程序纯化此类RNA随着多核苷酸长度显著增加超过约一百个核苷酸而趋于更具挑战性。用于产生更大长度的RNA的一种方法是产生两个或更多个连接在一起的分子。更长的RNA(诸如编码Cas9或Cpf1内切核酸酶的那些)更容易酶促产生。如本领域所述，可以在RNA的化学合成和/或酶促生成期间或之后引入RNA修饰，例如，增强稳定性、降低先天免疫应答的可能性或程度、和/或增强其他属性的修饰。

间隔区延伸序列

在靶向基因组的核酸的一些实施例中，间隔区延伸序列可以改变活性，提供稳定性和/或提供用于修饰靶向基因组的核酸的位置。间隔区延伸序列可以改变中靶或脱靶活性或特异性。在一些实施例中，提供了间隔区延伸序列。间隔区延伸序列的长度可以大于1、5、10、15、20、25、30、35、40、45、50、60、70、80、90、100、120、140、160、180、200、220、240、260、280、300、320、340、360、380、400、1000、2000、3000、4000、5000、6000、或7000个或更多个核苷酸。间隔区延伸序列的长度可以为约1、5、10、15、20、25、30、35、40、45、50、60、70、80、90、100、120、140、160、180、200、220、240、260、280、300、320、340、360、380、400、1000、2000、3000、4000、5000、6000、或7000个或更多个核苷酸。间隔区延伸序列的长度可以小于1、5、10、15、20、25、30、35、40、45、50、60、70、80、90、100、120、140、160、180、200、220、240、260、280、300、320、340、360、380、400、1000、2000、3000、4000、5000、6000、7000个或更多个核苷酸。在一些实施例中，间隔区延伸序列的长度小于10个核苷酸。在一些实施例中，间隔区延伸序列的长度在10-30个核苷酸之间。在一些实施例中，间隔区延伸序列的长度在30-70个核苷酸之间。

在一些实施例中，间隔区延伸序列具有另一个部分(例如，稳定性控制序列、内切核糖核酸酶结合序列、核酶)。在一些实施例中，该部分降低或增加靶向核酸的核酸的稳定性。在一些实施例中，该部分是转录终止子区段(即，转录终止序列)。在一些实施例中，该部分在真核细胞中起作用。在一些实施例中，该部分在原核细胞中起作用。在一些实施例中，该部分在真核细胞和原核细胞两者中起作用。合适的部分的非限制性实例包括：5’帽(例如，7-甲基鸟苷酸帽(m7G))，核糖开关序列(例如，允许蛋白和蛋白复合物调控稳定性和/或调控可及性)，形成dsRNA双链体的序列(即，发夹)，将RNA靶向亚细胞位置(例如，细胞核、线粒体、叶绿体等)的序列，提供跟踪的修饰或序列(例如，直接与荧光分子缀合，与促进荧光检测的部分缀合，允许进行荧光检测的序列等)，和/或为蛋白(例如，作用于DNA的蛋白，包括转录激活因子，转录阻遏因子、DNA甲基转移酶、DNA脱甲基化酶、组蛋白乙酰转移酶、组蛋白脱乙酰化酶等)提供结合位点的修饰或序列。

间隔区序列

间隔区序列可与目标靶核酸中的序列杂交。靶向基因组的核酸的间隔区经由杂交(即，碱基配对)以序列特异性方式与靶核酸相互作用。因此，间隔区的核苷酸序列根据目标靶核酸的序列而变化。

在本文的CRISPR/Cas系统中，间隔区序列设计成与位于系统中使用的Cas9酶的PAM的5’的靶核酸杂交。间隔区可以与靶序列完美匹配或者可以具有错配。每个Cas9酶都有特定的PAM序列，使得该酶识别靶DNA。例如，酿脓链球菌(S.pyogenes)识别靶核酸中具有序列5’-NRG-3’的PAM，其中R具有A或G，其中N是任何核苷酸并且N紧邻间隔区序列所靶向的靶核酸序列的3’。

在一些实施例中，靶核酸序列具有20个核苷酸。在一些实施例中，靶核酸具有少于20个核苷酸。在一些实施例中，靶核酸具有超过20个核苷酸。在一些实施例中，靶核酸具有至少：5、10、15、16、17、18、19、20、21、22、23、24、25、30个或更多个核苷酸。在一些实施例中，靶核酸至多具有：5、10、15、16、17、18、19、20、21、22、23、24、25、30个或更多个核苷酸。在一些实施例中，靶核酸序列具有20个紧邻PAM第一个核苷酸的5’的碱基。例如，在具有5’-NNNNNNNNNNNNNNNNNNNNNRG-3’的序列(SEQ ID NO:191)中，靶核酸具有对应于N的序列，其中N是任何核苷酸，并且加下划线的NRG序列(R是G或A)是酿脓链球菌Cas9 PAM。在一些实施例中，在本披露的组合物和方法中用作酿脓链球菌Cas9所识别的PAM序列是NGG。

在一些实施例中，与靶核酸杂交的间隔区序列的长度为至少约6个核苷酸(nt)。间隔区序列可以为至少约6个nt、约10个nt、约15个nt、约18个nt、约19个nt、约20个nt、约25个nt、约30个nt、约35个nt或约40个nt、约6个nt至约80个nt、约6个nt至约50个nt、约6个nt至约45个nt、约6个nt至约40个nt、约6个nt至约35个nt、约6个nt至约30个nt、约6个nt至约25个nt、约6个nt至约20个nt、约6个nt至约19个nt、约10个nt至约50个nt、约10个nt至约45个nt、约10个nt至约40个nt、约10个nt至约35个nt、约10个nt至约30个nt、约10个nt至约25个nt、约10个nt至约20个nt、约10个nt至约19个nt、约19个nt至约25个nt、约19个nt至约30个nt、约19个nt至约35个nt、约19个nt至约40个nt、约19个nt至约45个nt、约19个nt至约50个nt、约19个nt至约60个nt、约20个nt至约25个nt、约20个nt至约30个nt、约20个nt至约35个nt、约20个nt至约40个nt、约20个nt至约45个nt、约20个nt至约50个nt、或约20个nt至约60个nt。在一些实施例中，间隔区序列具有20个核苷酸。在一些实施例中，间隔区具有19个核苷酸。在一些实施例中，间隔区具有18个核苷酸。在一些实施例中，间隔区具有17个核苷酸。在一些实施例中，间隔区具有16个核苷酸。在一些实施例中，间隔区具有15个核苷酸。

在一些实施例中，间隔区序列与靶核酸之间的百分比互补性是至少约30％、至少约40％、至少约50％、至少约60％、至少约65％、至少约70％、至少约75％、至少约80％、至少约85％、至少约90％、至少约95％、至少约97％、至少约98％、至少约99％、或100％。在一些实施例中，间隔区序列与靶核酸之间的百分比互补性是至多约30％、至多约40％、至多约50％、至多约60％、至多约65％、至多约70％、至多约75％、至多约80％、至多约85％、至多约90％、至多约95％、至多约97％、至多约98％、至多约99％、或100％。在一些实施例中，间隔区序列与靶核酸之间的百分比互补性相比于靶核酸互补链的靶序列的六个连续最5’核苷酸为100％。在一些实施例中，间隔区序列与靶核酸之间的百分比互补性相比于约20个连续核苷酸为至少60％。在一些实施例中，间隔区序列和靶核酸的长度可以相差1至6个核苷酸，这可以被认为是一个或多个突起。

在一些实施例中，使用计算机程序来设计或选择间隔区序列。计算机程序可以使用变量，诸如预测的解链温度、二级结构形成、预测的退火温度、序列同一性、基因组背景、染色质可及性、％GC、基因组发生(例如，相同或相似但由于错配、插入或缺失而在一个或多个点有所不同的序列)的频率、甲基化状态、SNP的存在等。

最小CRISPR重复序列

在一些实施例中，最小CRISPR重复序列是与参考CRISPR重复序列(例如，来自酿脓链球菌的crRNA；参见例如，J.J.Ferretti等人，Proc Natl Acad Sci USA[美国国家科学院院刊](2001)98(8):4658-63)具有至少约30％、约40％、约50％、约60％、约65％、约70％、约75％、约80％、约85％、约90％、约95％、或100％序列同一性的序列。

在一些实施例中，最小CRISPR重复序列具有可与细胞中的最小tracrRNA序列杂交的核苷酸。最小CRISPR重复序列和最小tracrRNA序列形成双链体。最小CRISPR重复序列和最小tracrRNA序列一起结合至定点多肽。最小CRISPR重复序列的至少一部分与最小tracrRNA序列杂交。在一些实施例中，最小CRISPR重复序列的至少一部分与最小tracrRNA序列具有至少约30％、约40％、约50％、约60％、约65％、约70％、约75％、约80％、约85％、约90％、约95％或100％的互补性。在一些实施例中，最小CRISPR重复序列的至少一部分与最小tracrRNA序列具有至多约30％、约40％、约50％、约60％、约65％、约70％、约75％、约80％、约85％、约90％、约95％或100％的互补性。

最小CRISPR重复序列可以具有约7个核苷酸至约100个核苷酸的长度。例如，最小CRISPR重复序列的长度是约7个nt至约50个nt、约7个nt至约40个nt、约7个nt至约30个nt、约7个nt至约25个nt、约7个nt至约20个nt、约7个nt至约15个nt、约8个nt至约40个nt、约8个nt至约30个nt、约8个nt至约25个nt、约8个nt至约20个nt、约8个nt至约15个nt、约15个nt至约100个nt、约15个nt至约80个nt、约15个nt至约50个nt、约15个nt至约40个nt、约15个nt至约30个nt、或约15个nt至约25个nt。在一些实施例中，最小CRISPR重复序列的长度是大约9个核苷酸。在一些实施例中，最小CRISPR重复序列的长度是大约12个核苷酸。

在一些实施例中，最小CRISPR重复序列与参考最小CRISPR重复序列(例如，来自酿脓链球菌的野生型crRNA；参见例如，J.J.Ferretti等人，同上)在一段至少6、7、或8个连续核苷酸上具有至少约60％同一性。例如，最小CRISPR重复序列与参考最小CRISPR重复序列在一段至少6、7、或8个连续核苷酸上具有至少约65％同一性、至少约70％同一性、至少约75％同一性、至少约80％同一性、至少约85％同一性、至少约90％同一性、至少约95％同一性、至少约98％同一性、至少约99％同一性或100％同一性。

最小tracrRNA序列

在一些实施例中，最小tracrRNA序列是与参考tracrRNA序列(例如，来自酿脓链球菌的野生型tracrRNA；参见例如，J.J.Ferretti等人，同上)具有至少约30％、约40％、约50％、约60％、约65％、约70％、约75％、约80％、约85％、约90％、约95％、或100％序列同一性的序列。

在一些实施例中，最小tracrRNA序列具有与细胞中的最小CRISPR重复序列杂交的核苷酸。最小tracrRNA序列和最小CRISPR重复序列形成双链体。最小tracrRNA序列和最小CRISPR重复序列一起结合至定点多肽。最小tracrRNA序列的至少一部分可以与最小CRISPR重复序列杂交。在一些实施例中，最小tracrRNA序列与最小CRISPR重复序列具有至少约30％、约40％、约50％、约60％、约65％、约70％、约75％、约80％、约85％、约90％、约95％、或100％的互补性。

最小tracrRNA序列可以具有约7个核苷酸至约100个核苷酸的长度。例如，最小tracrRNA序列的长度可以是约7个nt至约50个nt、约7个nt至约40个nt、约7个nt至约30个nt、约7个nt至约25个nt、约7个nt至约20个nt、约7个nt至约15个nt、约8个nt至约40个nt、约8个nt至约30个nt、约8个nt至约25个nt、约8个nt至约20个nt、约8个nt至约15个nt、约15个nt至约100个nt、约15个nt至约80个nt、约15个nt至约50个nt、约15个nt至约40个nt、约15个nt至约30个nt或约15个nt至约25个nt。在一些实施例中，最小tracrRNA序列的长度是大约9个核苷酸。在一些实施例中，最小tracrRNA序列是大约12个核苷酸。在一些实施例中，最小tracrRNA由M.Jinek等人Science[科学](2012)337(6096):816-21中描述的tracrRNA nt23-48组成。

在一些实施例中，最小tracrRNA序列与参考最小tracrRNA序列(例如，来自酿脓链球菌的野生型tracrRNA；参见例如，J.J.Ferretti等人，同上)在一段至少6、7、或8个连续核苷酸上具有至少约60％同一性。例如，最小tracrRNA序列与参考最小tracrRNA序列在一段至少6、7、或8个连续核苷酸上具有至少约65％同一性、约70％同一性、约75％同一性、约80％同一性、约85％同一性、约90％同一性、约95％同一性、约98％同一性、约99％同一性或100％同一性。

在一些实施例中，最小CRISPR RNA和最小tracrRNA之间的双链体具有双螺旋。在一些实施例中，最小CRISPR RNA和最小tracrRNA之间的双链体具有至少约1、2、3、4、5、6、7、8、9或10个或更多个核苷酸。在一些实施例中，最小CRISPR RNA和最小tracrRNA之间的双链体具有至多约1、2、3、4、5、6、7、8、9或10个或更多个核苷酸。

在一些实施例中，双链体具有错配(即，双链体的两条链不是100％互补的)。在一些实施例中，双链体具有至少约1、2、3、4或5个错配。在一些实施例中，双链体具有至多约1、2、3、4或5个错配。在一些实施例中，双链体具有不超过2个错配。

突起

在一些实施例中，在最小CRISPR RNA与最小tracrRNA之间的双链体中存在“突起”。突起是双链体中核苷酸的未配对区域。在一些实施例中，突起有助于双链体与定点多肽的结合。突起在双链体的一侧具有未配对的5’-XXXY-3’，其中X是任何嘌呤，而Y具有可以与相对链上的核苷酸形成摆动配对的核苷酸，并且突起在双链体的另一侧具有未配对的核苷酸区域。双链体两侧的未配对核苷酸数目可以不同。

在一个实例中，突起在该突起的最小CRISPR重复链上具有未配对的嘌呤(例如，腺嘌呤)。在一些实施例中，突起具有该突起的最小tracrRNA序列链的未配对的5’-AAGY-3’，其中Y具有可以与最小CRISPR重复序列链上的核苷酸形成摆动配对的核苷酸。

在一些实施例中，双链体的最小CRISPR重复侧上的突起具有至少1、2、3、4或5个或更多个未配对的核苷酸。在一些实施例中，双链体的最小CRISPR重复侧上的突起具有至多1、2、3、4或5个或更多个未配对的核苷酸。在一些实施例中，双链体的最小CRISPR重复序列侧上的突起具有1个未配对的核苷酸。

在一些实施例中，双链体的最小tracrRNA序列侧的突起具有至少1、2、3、4、5、6、7、8、9或10个或更多个未配对的核苷酸。在一些实施例中，双链体的最小tracrRNA序列侧的突起具有至多1、2、3、4、5、6、7、8、9或10个或更多个未配对的核苷酸。在一些实施例中，双链体的第二侧(例如，双链体的最小tracrRNA序列侧)上的突起具有4个未配对的核苷酸。

在一些实施例中，突起具有至少一个摆动配对。在一些实施例中，突起具有至多一个摆动配对。在一些实施例中，突起具有至少一个嘌呤核苷酸。在一些实施例中，突起具有至少3个嘌呤核苷酸。在一些实施例中，突起序列具有至少5个嘌呤核苷酸。在一些实施例中，突起序列具有至少一个鸟嘌呤核苷酸。在一些实施例中，突起序列具有至少一个腺嘌呤核苷酸。

发夹

在一些实施例中，一个或多个发夹位于3’tracrRNA序列中的最小tracrRNA的3’。

在一些实施例中，发夹起始于距最小CRISPR重复序列和最小tracrRNA序列双链体中最后一个配对核苷酸的3’至少约1、2、3、4、5、6、7、8、9、10、15、或20个或更多个核苷酸处。在一些实施例中，发夹可以起始于距最小CRISPR重复序列和最小tracrRNA序列双链体中最后一个配对核苷酸的3’至多约1、2、3、4、5、6、7、8、9或10个或更多个核苷酸处。

在一些实施例中，发夹具有至少约1、2、3、4、5、6、7、8、9、10、15或20个或更多个连续的核苷酸。在一些实施例中，发夹具有至多约1、2、3、4、5、6、7、8、9、10、15个或更多个连续的核苷酸。

在一些实施例中，发夹具有CC二核苷酸(即，两个连续的胞嘧啶核苷酸)。

在一些实施例中，发夹具有双链体核苷酸(即，发夹中杂交在一起的核苷酸)。例如，发夹具有在3’tracrRNA序列的发夹双链体中与GG二核苷酸杂交的CC二核苷酸。

一个或多个发夹可以与定点多肽的向导RNA相互作用区域相互作用。在一些实施例中，存在两个或更多个发夹，并且在一些实施例中，存在三个或更多个发夹。

3’tracrRNA序列

在一些实施例中，3’tracrRNA序列具有与参考tracrRNA序列(例如，来自酿脓链球菌的tracrRNA)具有至少约30％、约40％、约50％、约60％、约65％、约70％、约75％、约80％、约85％、约90％、约95％、或100％序列同一性的序列。

在一些实施例中，3’tracrRNA序列的长度为约6个核苷酸至约100个核苷酸。例如，3’tracrRNA序列的长度可以是约6个nt至约50个nt、约6个nt至约40个nt、约6个nt至约30个nt、约6个nt至约25个nt、约6个nt至约20个nt、约6个nt至约15个nt、约8个nt至约40个nt、约8个nt至约30个nt、约8个nt至约25个nt、约8个nt至约20个nt、约8个nt至约15个nt、约15个nt至约100个nt、约15个nt至约80个nt、约15个nt至约50个nt、约15个nt至约40个nt、约15个nt至约30个nt或约15个nt至约25个nt。在一些实施例中，3’tracrRNA序列的长度为大约14个核苷酸。

在一些实施例中，3’tracrRNA序列与参考3’tracrRNA序列在一段至少6、7、或8个连续核苷酸上具有至少约60％同一性。例如，3’tracrRNA序列与参考3’tracrRNA序列在一段至少6、7、或8个连续核苷酸上具有至少约60％同一性、至少约65％同一性、约70％同一性、约75％同一性、约80％同一性、约85％同一性、约90％同一性、约95％同一性、约98％同一性、约99％同一性或100％同一性。

在一些实施例中，3’tracrRNA序列具有多于一个双链体区域。在一些实施例中，3’tracrRNA序列具有两个双链体区域。

在一些实施例中，3’tracrRNA序列具有茎环结构。在一些实施例中，3’tracrRNA中的茎环结构具有至少1、2、3、4、5、6、7、8、9、10、15或20个或更多个核苷酸。在一些实施例中，3’tracrRNA中的茎环结构具有至多1、2、3、4、5、6、7、8、9或10个或更多个核苷酸。在一些实施例中，茎环结构具有功能部分。例如，茎环结构可以具有适体、核酶、蛋白相互作用发夹、CRISPR阵列、内含子或外显子。在一些实施例中，茎环结构具有至少约1、2、3、4或5个或更多个功能部分。在一些实施例中，茎环结构具有至多约1、2、3、4或5个或更多个功能部分。

在一些实施例中，3’tracrRNA序列中的发夹具有P结构域。在一些实施例中，在发夹中P结构域具有双链区。

tracrRNA延伸序列

在一些实施例中，无论tracrRNA是在单分子向导还是双分子向导的背景下，都可以提供tracrRNA延伸序列。在一些实施例中，tracrRNA延伸序列的长度为约1个核苷酸至约400个核苷酸。在一些实施例中，tracrRNA延伸序列的长度大于1、5、10、15、20、25、30、35、40、45、50、60、70、80、90、100、120、140、160、180、200、220、240、260、280、300、320、340、360、380、或400个核苷酸。在一些实施例中，tracrRNA延伸序列的长度为约20至约5000个或更多个核苷酸。在一些实施例中，tracrRNA延伸序列的长度大于1000个核苷酸。在一些实施例中，tracrRNA延伸序列的长度小于1、5、10、15、20、25、30、35、40、45、50、60、70、80、90、100、120、140、160、180、200、220、240、260、280、300、320、340、360、380、400个或更多个核苷酸。在一些实施例中，tracrRNA延伸序列的长度可以小于1000个核苷酸。在一些实施例中，tracrRNA延伸序列的长度小于10个核苷酸。在一些实施例中，tracrRNA延伸序列的长度为10-30个核苷酸。在一些实施例中，tracrRNA延伸序列的长度为30-70个核苷酸。

在一些实施例中，tracrRNA延伸序列具有功能部分(例如，稳定性控制序列、核酶、内切核糖核酸酶结合序列)。在一些实施例中，功能部分具有转录终止子片段。在一些实施例中，功能部分的总长度为约10个nt至约100个核苷酸、约10个nt至约20个nt、约20个nt至约30个nt、约30个nt至约40个nt、约40个nt至约50个nt、约50个nt至约60个nt、约60个nt至约70个nt、约70个nt至约80个nt、约80个nt至约90个nt、或约90个nt至约100个nt、约15个nt至约80个nt、约15个nt至约50个nt、约15个nt至约40个nt、约15个nt至约30个nt、或约15个nt至约25个nt。在一些实施例中，功能部分在真核细胞中起作用。在一些实施例中，功能部分在原核细胞中起作用。在一些实施例中，功能部分在真核细胞和原核细胞两者中起作用。

合适的tracrRNA延伸功能部分的非限制性实例包括：3’聚腺苷酸化尾，核糖开关序列(例如，允许蛋白和蛋白复合物调控稳定性和/或调控可及性)，形成dsRNA双链体的序列，将RNA靶向亚细胞位置(例如，细胞核、线粒体、叶绿体等)的序列，提供跟踪的修饰或序列(例如，直接与荧光分子缀合，与促进荧光检测的部分缀合，允许进行荧光检测的序列等)，和/或为蛋白(例如，作用于DNA的蛋白，包括转录激活因子，转录阻遏因子、DNA甲基转移酶、DNA脱甲基化酶、组蛋白乙酰转移酶、组蛋白脱乙酰化酶等)提供结合位点的修饰或序列。在一些实施例中，tracrRNA延伸序列具有引物结合位点或分子索引(例如，条形码序列)。在一些实施例中，tracrRNA延伸序列具有一个或多个亲和标签。

单分子向导接头序列

在一些实施例中，单分子向导核酸的接头序列的长度为约3个核苷酸至约100个核苷酸。说明性接头的长度为约3个nt至约90个nt、约3个nt至约80个nt、约3个nt至约70个nt、约3个nt至约60个nt、约3个nt至约50个nt、约3个nt至约40个nt、约3个nt至约30个nt、约3个nt至约20个nt、约3个nt至约10个nt。例如，接头可以具有约3个nt至约5个nt、约5个nt至约10个nt、约10个nt至约15个nt、约15个nt至约20个nt、约20个nt至约25个nt、约25个nt至约30个nt、约30个nt至约35个nt、约35个nt至约40个nt、约40个nt至约50个nt、约50个nt至约60个nt、约60个nt至约70个nt、约70个nt至约80个nt、约80个nt至约90个nt或约90个nt至约100个nt的长度。在一些实施例中，单分子向导核酸的接头在4至40个核苷酸之间。在一些实施例中，接头是至少约100、500、1000、1500、2000、2500、3000、3500、4000、4500、5000、5500、6000、6500或7000个或更多个核苷酸。在一些实施例中，接头是至多约100、500、1000、1500、2000、2500、3000、3500、4000、4500、5000、5500、6000、6500或7000个或更多个核苷酸。

接头可以具有多种序列中的任何序列，但是在一些实施例中，接头将不具有与gRNA的其他部分具有广泛同源区的序列，同源区可能引起分子内结合，分子内结合可能干扰gRNA的其他功能区。在M.Jinek等人(同上)中，使用简单的4个核苷酸的序列-GAAA-，但是同样可以使用许多其他序列(包括更长的序列)。

在一些实施例中，接头序列具有功能部分。例如，接头序列可以具有一个或多个特征，包括适体、核酶、蛋白相互作用发夹、蛋白结合位点、CRISPR阵列、内含子或外显子。在一些实施例中，接头序列具有至少约1、2、3、4或5个或更多个功能部分。在一些实施例中，接头序列具有至多约1、2、3、4或5个或更多个功能部分。

在一些实施例中，根据本披露由gRNA靶向的基因组位置可以处于基因组例如人类基因组中的合适内源基因座处、内部或附近。内源基因座可以基于包括高表达的基因，或替代性地极具选择性表达的基因(例如，仅在某些组织中或在某些条件下表达的基因)来选择。用于在肝脏中表达的示例性基因座包括例如白蛋白基因座、转铁蛋白基因座和纤维蛋白原基因座。

在一些实施例中，本文提供了包含与细胞中内源转铁蛋白基因座内或附近的基因组序列互补的间隔区序列的gRNA。在一些实施例中，gRNA包含与细胞中内源转铁蛋白基因的内含子1内的序列互补的间隔区序列。在一些实施例中，该gRNA包含来自SEQ ID NO:1-190中任一个的间隔区序列或与SEQ ID NO:1-190中任一个相比具有不超过三个错配的其变体。在一些实施例中，gRNA包含来自SEQ ID NO:96、5、6、9、8、11、15、16、12、7、10、17、18、29、76、50、54、81、64、51、1-4、13、14、19-28、30-49、52、53、55-63、65-75、77-80、82-95和97-190中任一个的间隔区序列，或与SEQ ID NO:96、5、6、9、8、11、15、16、12、7、10、17、18、29、76、50、54、81、64、51、1-4、13、14、19-28、30-49、52、53、55-63、65-75、77-80、82-95和97-190中任一个相比具有不超过三个错配的其变体。在一些实施例中，该gRNA包含来自SEQ IDNO:5、6、9、8、11、15、16、12、7和10中任一个的间隔区序列或与SEQ ID NO:5、6、9、8、11、15、16、12、7和10中任一个相比具有不超过三个错配的其变体。在一些实施例中，该gRNA包含来自SEQ ID NO:17、18、29、76、50、54、81、96、64和51中任一个的间隔区序列或与SEQ ID NO:17、18、29、76、50、54、81、96、64和51中任一个相比具有不超过三个错配的其变体。在一些实施例中，间隔区序列长度为19个核苷酸并且不包括从中选择它的序列的位置1处的核苷酸。

在一些实施例中，根据本披露由gRNA靶向的基因组位置可以处于基因组例如人类基因组中的内源纤维蛋白原α链(纤维蛋白原-α)基因座处、内部或附近。靶向此类位置的示例性向导RNA包括SEQ ID NO:192-270中任一个列出的间隔区序列和相关的Cas9或Cpf1切割位点。如本领域普通技术人员所理解的，每个向导RNA设计为包括与其基因组靶序列互补的间隔区序列。例如，可以将SEQ ID NO:192-270中任一个列出的每个间隔区序列放入单个RNA嵌合体或crRNA(以及相应的tracrRNA)中。参见M.Jinek等人，同上，以及E.Deltcheva等人，Nature[自然](2011)471:602-07。

靶向白蛋白位置的示例性向导RNA包括来自SEQ ID NO:271-298中任一个的间隔区序列和相关的Cas9或Cpf1切割位点。例如，包括来自SEQ ID NO:271的间隔区序列的gRNA可以包括间隔区序列UAAUUUUCUUUUGCGCACUA(SEQ ID NO:299)。如本领域普通技术人员所理解的，每个向导RNA设计为包括与其基因组靶序列互补的间隔区序列。例如，可以将来自SEQ ID NO:271-298中任一个的每个间隔区序列放入单个RNA嵌合体或crRNA(以及相应的tracrRNA)中。

供体模板

定点多肽(如，DNA内切核酸酶)可以在核酸(例如，基因组DNA)中引入双链断裂或单链断裂。双链断裂可以刺激细胞内源DNA修复途径(例如，同源依赖性修复(HDR)、非同源末端连接或替代性非同源末端连接(A-NHEJ)或微同源介导的末端连接(MMEJ))。NHEJ可以修复裂解的靶核酸，而无需同源模板。有时这可以在靶核酸的裂解位点处产生小缺失或插入(插入缺失)，并且可以导致基因表达的破坏或改变。当同源修复模板或供体可用时，可发生HDR，也称为同源重组(HR)。

同源供体模板具有与靶核酸裂解位点侧翼的序列同源的序列。姐妹染色单体通常被细胞用作修复模板。然而，出于基因组编辑的目的，修复模板通常作为外源核酸提供，诸如质粒、双链体寡核苷酸、单链寡核苷酸、双链寡核苷酸、或病毒核酸。对于外源供体模板，通常在具有同源性的侧翼区域之间引入另外的核酸序列(诸如转基因)或修饰(诸如单碱基或多碱基改变或缺失)，使得另外的或改变的核酸序列也并入靶基因座中。MMEJ导致与NHEJ相似的遗传结果，因为在裂解位点可以发生小的缺失和插入。MMEJ利用位于裂解位点侧翼的几个碱基对的同源序列来驱动有利的末端连接DNA修复结果。在一些情况下，可以基于核酸酶靶区域中潜在的微同源性分析来预测可能的修复结果。

因此，在一些情况下，使用同源重组将外源多核苷酸序列插入靶核酸裂解位点。外源多核苷酸序列在本文中被称为供体模板(或供体或供体序列或供体DNA模板)。在一些实施例中，将供体模板、供体模板的一部分、供体模板的拷贝、或供体模板的拷贝的一部分插入靶核酸裂解位点。在一些实施例中，供体模板是不天然存在于靶核酸裂解位点的序列。

当在发生双链断裂的细胞核内以足够浓度提供外源DNA分子时，可以在NHEJ修复过程中在双链断裂处插入外源DNA，从而成为基因组的永久添加。如果供体模板含有目标基因(诸如FVIII基因)的编码序列，任选地还含有相关的调控序列(诸如启动子、增强子、聚A序列和/或剪接受体序列)(在本文中也称为“供体盒”)，则编码序列可以从基因组中的整合拷贝表达，从而在细胞生命中永久表达。而且，当细胞分裂时，供体模板的整合拷贝可以传递到子细胞。

在存在足够浓度的供体DNA模板的情况下，该供体模板含有与双链断裂任一侧的DNA序列具有同源性的侧翼DNA序列(称为同源臂)，可以经由HDR途径整合供体模板。同源臂充当供体模板与双链断裂任一侧的序列之间同源重组的底物。这可以导致供体模板的无错误插入，其中双链断裂任一侧的序列与未修饰的基因组中的序列相比没有改变。

用于通过HDR进行编辑而提供的供体差异很大，但通常含有带有小或大侧翼同源臂的预期序列，以允许对基因组DNA进行退火。引入的遗传变化侧翼的同源区可以是30bp或更小，或者与可以含有启动子、cDNA等的几千碱基的盒一样大。可以使用单链和双链寡核苷酸供体。这些寡核苷酸的大小范围从小于100个nt到超过许多kb，但是也可以生成和使用更长的ssDNA。通常使用双链供体，包括PCR扩增子、质粒和微环。一般而言，已经发现AAV载体是递送供体模板非常有效的手段，但是单个供体的包装极限<5kb。供体的活跃转录使HDR增加三倍，表明包含启动子可以提高转化率。相反，供体的CpG甲基化可降低基因表达和HDR。

在一些实施例中，可以用核酸酶或独立地通过多种不同的方法，例如通过转染、纳米颗粒、显微注射或病毒转导来提供供体DNA。在一些实施例中，可以使用一系列的拴系选项来增加供体对于HDR的可用性。实例包括将供体附接至核酸酶、附接至附近结合的DNA结合蛋白、或附接至参与DNA末端结合或修复的蛋白。

除了通过NHEJ或HDR进行基因组编辑外，还可以使用NHEJ途径和HR进行位点特异性基因插入。组合方法可适用于某些情形，可能包括内含子/外显子边界。NHEJ可以对内含子中的连接有效，而无错误HDR则更适合编码区。

在实施例中，待插入基因组的外源序列是合成FVIII编码序列，其编码在野生型B结构域将会是另外的形式的位置具有B结构域替代物的合成FVIII蛋白。合成FVIII编码序列可以包括编码合成FVIII蛋白的核酸序列，该合成FVIII蛋白具有野生型FVIII蛋白的实质性活性，例如促凝血活性。合成FVIII蛋白的活性程度可以是野生型FVIII蛋白所表现出的活性的至少约30％、约40％、约50％、约60％、约70％、约80％、约85％、约90％、约95％或约100％。在一些实施例中，合成FVIII蛋白可与FVIII蛋白，例如野生型FVIII蛋白具有至少约30％、约40％、约50％、约60％、约70％、约80％、约85％、约90％、约95％、约96％、约97％、约98％或约99％的氨基酸序列同一性。在一些实施例中，合成FVIII蛋白可与不包括B结构域的FVIII蛋白，例如B结构域裂解后的野生型FVIII蛋白具有至少约30％、约40％、约50％、约60％、约70％、约80％、约85％、约90％、约95％、约96％、约97％、约98％或约99％的氨基酸序列同一性。在一些实施例中，本领域的普通技术人员可以使用本领域中已知的许多方法来测试化合物例如肽或蛋白的功能或活性。合成FVIII蛋白还可以包括野生型FVIII蛋白的任何片段或在全长野生型FVIII蛋白的一个或多个氨基酸残基上具有保守性修饰的经修饰FVIII蛋白的片段。因此，在一些实施例中，合成FVIII编码序列可与FVIII编码序列，例如野生型FVIII编码序列具有至少约30％、约40％、约50％、约60％、约70％、约80％、约85％、约90％、约95％、约96％、约97％、约98％或约99％的核酸序列同一性。

在本发明的实施例中，合成FVIII含有一个或多个保守性或非保守性氨基酸取代，这些取代改善蛋白的各方面而不会对蛋白的抗凝血性产生不利影响。在一个实施例中，位置309处的苯丙氨酸被丝氨酸或丙氨酸(非保守性地)替代以分别提供F309S和F309A突变蛋白。这些取代被认为会破坏A1结构域中伴侣免疫球蛋白结合蛋白(BiP)的潜在结合位点，从而提高蛋白的表达和分泌(M.Swaroop等人，J Biol Chem[生物化学杂志](1997)272:24121-24)。

本发明的B结构域替代物用小得多的肽链替代野生型FVIII的B结构域，同时仍然提供蛋白酶裂解位点和一个或多个用于N-连接糖基化的位点。B结构域替代物可具有约10至约200个氨基酸。在一些实施例中，B结构域替代物具有约20至约100个氨基酸。在一些实施例中，B结构域替代物具有约1至约40个氨基酸、约1至约35个氨基酸、约1至约30个氨基酸、约1至约25个氨基酸、约1至约20个氨基酸、约1至约15个氨基酸、约1至约10个氨基酸或约1至约5个氨基酸。在一些实施例中，B结构域替代物具有约5至约40个氨基酸、约10至约40个氨基酸、约15至约40个氨基酸、约20至约40个氨基酸、约25至约40个氨基酸、约30至约40个氨基酸或约35至约40个氨基酸。在一些实施例中，B结构域替代物具有1个氨基酸、2个氨基酸、3个氨基酸、4个氨基酸、5个氨基酸、6个氨基酸、7个氨基酸、8个氨基酸、9个氨基酸、10个氨基酸、11个氨基酸、12个氨基酸、13个氨基酸、14个氨基酸、15个氨基酸、16个氨基酸、17个氨基酸、18个氨基酸、19个氨基酸、20个氨基酸、21个氨基酸、22个氨基酸、23个氨基酸、24个氨基酸、25个氨基酸、26个氨基酸、27个氨基酸、28个氨基酸、29个氨基酸、30个氨基酸、31个氨基酸、32个氨基酸、33个氨基酸、34个氨基酸、35个氨基酸、36个氨基酸、37个氨基酸、38个氨基酸、39个氨基酸或40个氨基酸。在一些实施例中，编码B结构域替代物的核酸经密码子优化。在一些实施例中，B结构域替代物包含蛋白酶裂解位点，例如RHQR。

在涉及插入其合成FVIII编码序列的一些实施例中，可以将合成FVIII编码序列的cDNA插入具有缺陷FVIII基因或其调控序列的受试者基因组中。在这种情况下，供体DNA或供体模板可以是具有编码合成FVIII的序列的表达盒或载体构建体。在一些实施例中，可以使用在说明书的其他地方描述的含有编码合成FVIII的序列的表达载体。

在一些实施例中，根据本文所述的包含供体盒的任何供体模板，供体盒在一侧或两侧上侧接有gRNA靶位点。例如，这种供体模板可以包含供体盒，在供体盒的5’具有gRNA靶位点和/或在供体盒的3’具有gRNA靶位点。在一些实施例中，供体模板包含在供体盒的5’具有gRNA靶位点的供体盒。在一些实施例中，供体模板包含在供体盒的3’具有gRNA靶位点的供体盒。在一些实施例中，供体模板包含供体盒，在供体盒的5’具有gRNA靶位点且在供体盒的3’具有gRNA靶位点。在一些实施例中，供体模板包含供体盒，在供体盒的5’具有gRNA靶位点且在供体盒的3’具有gRNA靶位点，并且两个gRNA靶位点包含相同的序列。在一些实施例中，供体模板包含至少一个gRNA靶位点，并且供体模板中的该至少一个gRNA靶位点包含与供体模板的供体盒要整合到的靶基因座中的gRNA靶位点相同的序列。在一些实施例中，供体模板包含至少一个gRNA靶位点，并且供体模板中的该至少一个gRNA靶位点包含供体模板的供体盒要整合到的靶基因座中的gRNA靶位点的反向互补序列。在一些实施例中，供体模板包含供体盒，在供体盒的5’具有gRNA靶位点且在供体盒的3’具有gRNA靶位点，并且供体模板中的两个gRNA靶位点包含与供体模板的供体盒要整合到的靶基因座中的gRNA靶位点相同的序列。在一些实施例中，供体模板包含供体盒，在供体盒的5’具有gRNA靶位点且在供体盒的3’具有gRNA靶位点，并且供体模板中的两个gRNA靶位点包含供体模板的供体盒要整合到的靶基因座中的gRNA靶位点的反向互补序列。

编码定点多肽或DNA内切核酸酶的核酸

因此，在一些实施例中，基因组编辑的方法和组合物可以使用编码定点多肽诸如DNA内切核酸酶的核酸(或寡核苷酸)。编码定点多肽的核酸序列可以是DNA或RNA。如果编码定点多肽的核酸序列是RNA，则它可以与gRNA序列共价连接或作为单独的序列存在。在一些实施例中，直接使用定点多肽(诸如DNA内切核酸酶)，而不是编码它的核酸序列。

载体

另一方面，本披露提供了一种核酸，该核酸具有编码本披露的靶向基因组的核酸，本披露的定点多肽和/或执行本披露方法的实施例所必需的任何核酸或蛋白分子的核苷酸序列。在一些实施例中，这种核酸是载体(例如，重组表达载体)。

所考虑的表达载体包括但不限于基于痘苗病毒、脊髓灰质炎病毒、腺病毒、腺相关病毒、SV40、单纯疱疹病毒、人类免疫缺陷病毒、逆转录病毒(例如，鼠白血病病毒、脾坏死病毒，以及衍生自逆转录病毒(如劳氏肉瘤病毒(Rous Sarcoma Virus)、哈维肉瘤病毒(Harvey Sarcoma Virus)、禽类白血病病毒、慢病毒、人类免疫缺陷病毒、骨髓增生肉瘤病毒和乳腺肿瘤病毒)的载体)的病毒载体和其他重组载体。所考虑的用于真核靶细胞的其他载体包括但不限于载体pXT1、pSG5、pSVK3、pBPV、pMSG和pSVLSV40(法玛西亚公司(Pharmacia))。所考虑的用于真核靶细胞的另外的载体包括但不限于载体pCTx-1、pCTx-2和pCTx-3。可以使用其他载体，只要它们与宿主细胞相容即可。

在一些实施例中，载体具有一个或多个转录和/或翻译控制元件。取决于所利用的宿主/载体系统，可以在表达载体中使用许多合适的转录和翻译控制元件中的任一种，包括组成型和诱导型启动子、转录增强子元件、转录终止子等。在一些实施例中，载体是自失活载体，其使病毒序列或CRISPR机制的组分或其他元件失活。

合适的真核启动子(即，在真核细胞中有功能的启动子)的非限制性实例包括来自以下的那些：巨细胞病毒(CMV)立即早期启动子、单纯疱疹病毒(HSV)胸苷激酶、早期和晚期SV40启动子、来自逆转录病毒的长末端重复序列(LTR)、人延伸因子-1(EF1)启动子、具有与鸡β-肌动蛋白启动子(CAG)融合的巨细胞病毒(CMV)增强子的杂交构建体、鼠干细胞病毒启动子(MSCV)、磷酸甘油酸激酶1基因座启动子(PGK)和小鼠金属硫蛋白-I。

为了表达小RNA(包括gRNA)，启动子诸如RNA聚合酶III启动子(包括例如U6和H1)可以是有利的。增强此类启动子的用途的描述和参数是本领域已知的，并且定期描述另外的信息和方法；参见例如，H.Ma等人，Mol Ther Nuc Acids[分子疗法-核酸]3,e161(2014)doi:10.1038/mtna.2014.12。

表达载体还可以含有用于翻译起始的核糖体结合位点和转录终止子。表达载体还可以包括用于扩增表达的适当序列。表达载体还可以包括编码与定点多肽融合的非天然标签(例如，组氨酸标签、血凝素标签、绿色荧光蛋白等)的核苷酸序列，从而产生融合蛋白。

在一些实施例中，启动子是诱导型启动子(例如，热激启动子、四环素调节的启动子、类固醇调节的启动子、金属调节的启动子、雌激素受体调节的启动子等)。在一些实施例中，启动子是组成型启动子(例如，CMV启动子、UBC启动子)。在一些实施例中，启动子是空间受限和/或时间受限的启动子(例如，组织特异性启动子、细胞类型特异性启动子等)。在一些实施例中，如果要在载体插入基因组中之后在基因组中存在的内源性启动子下表达基因，则载体不具有要在宿主细胞中表达的至少一个基因的启动子。

定点多肽或DNA内切核酸酶

由于NHEJ和/或HDR引起的对靶DNA的修饰可以导致例如突变、缺失、改变、整合、基因矫正、基因替换、基因标记、转基因插入、核苷酸缺失、基因破坏、易位和/或基因突变。将非天然核酸整合到基因组DNA中的过程是基因组编辑的实例。

定点多肽是在基因组编辑中用于裂解DNA的核酸酶。能以一种或多种多肽、或一种或多种编码该多肽的mRNA的方式将定点多肽施用于细胞或受试者。

在CRISPR/Cas或CRISPR/Cpf1系统的背景下，定点多肽可与gRNA结合，该gRNA又指定靶DNA中多肽所指向的位点。在本文的CRISPR/Cas或CRISPR/Cpf1系统的实施例中，定点多肽是内切核酸酶，诸如DNA内切核酸酶。

在一些实施例中，定点多肽具有多个核酸裂解(即，核酸酶)结构域。两个或更多个核酸裂解结构域可以经由接头连接在一起。在一些实施例中，该接头是柔性接头。接头的长度可为1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、35、40个或更多个氨基酸。

天然存在的野生型Cas9酶具有两个核酸酶结构域，即HNH核酸酶结构域和RuvC结构域。本文中，“Cas9”是指天然存在的和重组的Cas9两者。本文所考虑的Cas9酶具有HNH核酸酶结构域或HNH样核酸酶结构域，和/或RuvC核酸酶结构域或RuvC样核酸酶结构域。

HNH结构域和HNH样结构域具有McrA样折叠。HNH和HNH样结构域具有两条反平行的β-链和α-螺旋，并且具有金属结合位点(例如，二价阳离子结合位点)。HNH结构域和HNH样结构域可以裂解靶核酸的一条链(例如，crRNA靶向的链的互补链)。

RuvC和RuvC样结构域具有RNA酶H或RNA酶H样折叠。RuvC/RNA酶H结构域涉及一系列不同的基于核酸的功能，并且作用于RNA和DNA两者。RNA酶H结构域具有5条被多个α螺旋包围的β链。RuvC/RNA酶H结构域和RuvC/RNA酶H样结构域具有金属结合位点(例如，二价阳离子结合位点)，并且可以裂解靶核酸的一条链(例如，双链靶DNA的非互补链)。

在一些实施例中，定点多肽具有的氨基酸序列与野生型示例性定点多肽(例如，来自酿脓链球菌的Cas9，US 2014/0068797序列ID No.8或R.Sapranauskas等人,Nuc AcidsRes[核酸研究](2011)39(21):9275-82)和其他定点多肽)具有至少10％、至少15％、至少20％、至少30％、至少40％、至少50％、至少60％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少99％或100％的氨基酸序列同一性。

在一些实施例中，定点多肽具有的氨基酸序列与野生型示例性定点多肽(例如，来自酿脓链球菌的Cas9)的核酸酶结构域具有至少10％、至少15％、至少20％、至少30％、至少40％、至少50％、至少60％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％、至少99％或100％的氨基酸序列同一性。

在一些实施例中，定点多肽是与野生型定点多肽(例如，来自酿脓链球菌的Cas9)在10个连续氨基酸上具有至少70％、75％、80％、85％、90％、95％、97％、99％或100％的同一性的DNA内切核酸酶。在一些实施例中，定点多肽与野生型定点多肽在10个连续氨基酸上具有至多70％、75％、80％、85％、90％、95％、97％、99％或100％的同一性。在一些实施例中，定点多肽与野生型定点多肽在定点多肽HNH核酸酶结构域的10个连续氨基酸上具有至少70％、75％、80％、85％、90％、95％、97％、99％或100％的同一性。在一些实施例中，定点多肽与野生型定点多肽在定点多肽HNH核酸酶结构域的10个连续氨基酸上具有至多70％、75％、80％、85％、90％、95％、97％、99％或100％的同一性。在一些实施例中，定点多肽与野生型定点多肽在定点多肽RuvC核酸酶结构域的10个连续氨基酸上具有至少70％、75％、80％、85％、90％、95％、97％、99％或100％的同一性。在一些实施例中，定点多肽与野生型定点多肽在定点多肽RuvC核酸酶结构域的10个连续氨基酸上具有至多70％、75％、80％、85％、90％、95％、97％、99％或100％的同一性。

在一些实施例中，定点多肽具有野生型示例性定点多肽的修饰形式。野生型示例性定点多肽的修饰形式具有降低定点多肽的核酸裂解活性的突变。在一些实施例中，野生型示例性定点多肽的修饰形式具有小于90％、小于80％、小于70％、小于60％、小于50％、小于40％、小于30％、小于20％、小于10％、小于5％、或小于1％的野生型示例性定点多肽的核酸裂解活性。定点多肽的修饰形式可以不具有实质性核酸裂解活性。当定点多肽是不具有实质性核酸裂解活性的修饰形式时，在本文中将其称为“酶促失活的”。

在一些实施例中，定点多肽的修饰形式具有突变，使其可以在靶核酸上诱导单链断裂(SSB)(例如，通过切割双链靶核酸的仅一条糖-磷酸骨架)。在一些实施例中，突变在野生型定点多肽(例如，来自酿脓链球菌的Cas9)的多个核酸裂解结构域的一个或多个中产生小于90％、小于80％、小于70％、小于60％、小于50％、小于40％、小于30％、小于20％、小于10％、小于5％、或小于1％的核酸裂解活性。在一些实施例中，突变导致多个核酸裂解结构域中的一个或多个保留裂解靶核酸的互补链的能力，但是降低了裂解靶核酸的非互补链的能力。在一些实施例中，突变导致多个核酸裂解结构域中的一个或多个保留裂解靶核酸的非互补链的能力，但是降低了裂解靶核酸的互补链的能力。例如，使野生型示例性酿脓链球菌Cas9多肽中的残基(诸如Asp10、His840、Asn854和Asn856)突变，以使多个核酸裂解结构域(例如，核酸酶结构域)中的一个或多个失活。在一些实施例中，待突变的残基对应于野生型示例性酿脓链球菌Cas9多肽中的残基Asp10、His840、Asn854和Asn856(例如，通过序列和/或结构比对确定的)。突变的非限制性实例包括D10A、H840A、N854A和N856A。本领域技术人员将认识到，除丙氨酸取代以外的突变是合适的。

在一些实施例中，将D10A突变与H840A、N854A或N856A突变中的一种或多种组合以产生基本上缺乏DNA裂解活性的定点多肽。在一些实施例中，将H840A突变与D10A、N854A或N856A突变中的一种或多种组合以产生基本上缺乏DNA裂解活性的定点多肽。在一些实施例中，将N854A突变与H840A、D10A或N856A突变中的一种或多种组合以产生基本上缺乏DNA裂解活性的定点多肽。在一些实施例中，将N856A突变与H840A、N854A或D10A突变中的一种或多种组合以产生基本上缺乏DNA裂解活性的定点多肽。具有一个基本上失活的核酸酶结构域的定点多肽称为“切口酶”。

在一些实施例中，RNA引导的内切核酸酶(例如Cas9)的变体，可以用于增加CRISPR介导的基因组编辑的特异性。野生型Cas9通常由设计为与靶序列(诸如内源基因组基因座)中～20个核苷酸的指定序列杂交的单个向导RNA进行引导。然而，在向导RNA和靶基因座之间可以容忍若干错配，从而有效地将靶位点所需的同源性长度减少到例如低至13个同源性nt，从而导致在靶基因组中其他位置处CRISPR/Cas9复合物进行结合和双链核酸裂解(也称为脱靶裂解)的可能性增加。因为Cas9的切口酶变体各自仅切割一条链，所以为了产生双链断裂，一对切口酶必须紧密结合在靶核酸的相反链上，从而产生一对切口，这相当于双链断裂。这就要求两个单独的gRNA(针对每个切口酶各一个)必须紧密结合在靶核酸的相反链上。这一要求实质上使双链断裂发生所需的最小同源长度加倍，从而降低了在基因组中其他位置发生双链裂解事件的可能性，而这两个gRNA位点(如果存在)不太可能彼此足够靠近形成双链断裂。如本领域所述，切口酶还可以用于相对于NHEJ促进HDR。通过使用有效介导所希望的变化的特定供体序列，HDR可用于将所选变化引入基因组中的靶位点。对用于基因编辑的CRISPR/Cas系统的描述可以在例如国际专利申请公开号WO 2013/176772和J.D.Sander等人，Nature Biotechnology[自然生物技术](2014)32:347-55，以及其中引用的参考文献中找到。

在一些实施例中，定点多肽(例如，变体、突变的、酶促失活的和/或条件性酶促失活的定点多肽)靶向核酸。在一些实施例中，定点多肽靶向DNA。在一些实施例中，定点多肽靶向RNA。

在一些实施例中，定点多肽具有一个或多个非天然序列(例如，定点多肽是融合蛋白)。

在一些实施例中，定点多肽具有与来自细菌(例如，酿脓链球菌)的Cas9具有至少15％氨基酸同一性的氨基酸序列，核酸结合结构域和两个核酸裂解结构域(例如，HNH结构域和RuvC结构域)。

在一些实施例中，定点多肽具有与来自细菌的Cas9具有至少15％氨基酸同一性的氨基酸序列，和两个核酸裂解结构域(即，HNH结构域和RuvC结构域)。

在一些实施例中，定点多肽具有与来自细菌的Cas9具有至少15％氨基酸同一性的氨基酸序列，和两个核酸裂解结构域，其中一个或两个核酸裂解结构域与来自细菌的Cas9具有至少50％的氨基酸同一性。

在一些实施例中，定点多肽具有与来自细菌的Cas9具有至少15％氨基酸同一性的氨基酸序列，两个核酸裂解结构域(例如，HNH结构域和RuvC结构域)和非天然序列(例如，核定位信号)或连接定点多肽与非天然序列的接头。

在一些实施例中，定点多肽具有与来自细菌的Cas9具有至少15％氨基酸同一性的氨基酸序列，和两个核酸裂解结构域(例如，HNH结构域和RuvC结构域)，其中定点多肽在一个或两个核酸裂解结构域中具有突变，该突变使核酸酶结构域的裂解活性降低至少50％。

在一些实施例中，定点多肽具有与来自细菌的Cas9具有至少15％氨基酸同一性的氨基酸序列，和两个核酸裂解结构域(例如，HNH结构域和RuvC结构域)，其中一个核酸酶结构域具有天冬氨酸10突变，和/或其中一个核酸酶结构域具有组氨酸840突变，并且其中该突变使核酸酶结构域的裂解活性降低至少50％。

在一些实施例中，该一种或多种定点多肽，诸如DNA内切核酸酶，包括两个在基因组中的特定基因座处共同实现一个双链断裂的切口酶，或四个在基因组中的特定基因座处共同实现两个双链断裂的切口酶。替代性地，一种定点多肽影响基因组中特定基因座处的一个双链断裂。

在一些实施例中，编码定点多肽的多核苷酸可用于编辑基因组。在一些此类实施例中，根据本领域已知的方法对编码定点多肽的多核苷酸进行密码子优化，以在含有目标靶DNA的细胞中表达。例如，如果预期的靶核酸在人类细胞中，则可以使用编码Cas9的人类密码子优化的多核苷酸产生Cas9多肽。

以下提供了可以在本披露的实施例中使用的定点多肽的一些实例。

CRISPR内切核酸酶系统

在许多原核生物(例如，细菌和古细菌)的基因组中都可以找到CRISPR(成簇规律间隔短回文重复序列)基因组基因座。在原核生物中，CRISPR基因座编码以下产物，这些产物起到一种类型的免疫系统的作用，以帮助原核生物防御外来入侵者(诸如病毒和噬菌体)。CRISPR基因座功能有三个阶段：将新序列整合到CRISPR基因座中，表达CRISPR RNA(crRNA)，以及使外来入侵者核酸沉默。已经鉴定出五种类型的CRISPR系统(例如，I型、II型、III型、U型和V型)。

CRISPR基因座包括许多短重复序列，称为“重复序列”。当表达时，重复序列可以形成二级发夹结构(例如，发夹)和/或具有非结构化的单链序列。重复序列通常成簇出现，并且经常在物种之间相异。重复序列与称为“间隔区”的独特插入序列有规律地间隔，从而形成重复序列-间隔区-重复序列基因座结构。间隔区与已知的外来入侵者序列相同或与其具有高度同源性。间隔区-重复序列单元编码crRNA，其被加工成间隔区-重复序列单元的成熟形式。crRNA具有参与靶向靶核酸的“种子”或间隔区序列(在原核生物中天然存在的形式，间隔区序列靶向外来入侵者核酸)。间隔区序列位于crRNA的5’或3’末端。

CRISPR基因座也具有编码CRISPR相关(Cas)基因的多核苷酸序列。Cas基因编码参与原核生物中crRNA功能的生物发生和干扰阶段的内切核酸酶。一些Cas基因具有同源二级和/或三级结构。

II型CRISPR系统

实际上，II型CRISPR系统中的crRNA生物发生需要反式激活CRISPR RNA(tracrRNA)。tracrRNA被内源性RNA酶III修饰，然后与前crRNA阵列中的crRNA重复序列杂交。募集内源性RNA酶III以裂解前crRNA。裂解的crRNA进行外切核糖核酸酶修剪以产生成熟的crRNA形式(例如，进行5’修剪)。tracrRNA保持与crRNA杂交，并且tracrRNA和crRNA与定点多肽(例如，Cas9)缔合。crRNA-tracrRNA-Cas9复合物的crRNA将该复合物引导至可以与crRNA杂交的靶核酸。crRNA与靶核酸的杂交可激活Cas9进行靶向的核酸裂解。II型CRISPR系统中的靶核酸称为原间隔区邻近基序(PAM)。实际上，PAM对促进定点多肽(例如，Cas9)与靶核酸的结合至关重要。II型系统(也称为Nmeni或CASS4)进一步细分为II-A型(CASS4)和II-B型(CASS4a)。M.Jinek等人(同上)报道称CRISPR/Cas9系统可用于RNA可编程基因组编辑，并且国际专利申请公开号WO 2013/176772提供了用于位点特异性基因编辑的CRISPR/Cas内切核酸酶系统的实例和应用。

V型CRISPR系统

V型CRISPR系统与II型系统具有若干重要差异。例如，Cpf1是单个RNA引导的内切核酸酶，与II型系统不同，缺少tracrRNA。事实上，Cpf1相关的CRISPR阵列无需另外的反式激活tracrRNA就可以加工成成熟的crRNA。将V型CRISPR阵列加工成长度为42-44个核苷酸的短成熟crRNA，其中每个成熟crRNA均以19个核苷酸的正向重复序列开始，然后是23-25个核苷酸的间隔区序列。相反，II型系统中的成熟crRNA以20-24个核苷酸的间隔区序列开始，然后是约22个核苷酸的正向重复序列。同样，Cpf1利用富含T的原间隔区邻近基序，使得Cpf1-crRNA复合物有效地裂解前面是短的富含T的PAM的靶DNA，这与II型系统中富含G的PAM在靶DNA之后相反。因此，V型系统在远离PAM的点处裂解，而II型系统在与PAM邻近的点处裂解。另外，与II型系统不同，Cpf1经由交错的DNA双链断裂(具有4或5个核苷酸的5’突出端)裂解DNA。II型系统经由平的双链断裂裂解。与II型系统相似，Cpf1含有预测的RuvC样内切核酸酶结构域，但缺乏第二HNH内切核酸酶结构域，这与II型系统相反。

Cas基因/多肽和原间隔区邻近基序

示例性CRISPR/Cas多肽包括I.Fonfara等人,Nucleic Acids Res.[核酸研究](2014)42:2577-90的图1中的Cas9多肽。自从发现Cas基因以来，CRISPR/Cas基因命名系统已经进行了广泛的重写。上文Fonfara的图5提供了来自不同物种的Cas9多肽的PAM序列。

靶向基因组的核酸和定点多肽的复合物

靶向基因组的核酸与定点多肽(例如，核酸引导的核酸酶，诸如Cas9)相互作用，从而形成复合物。靶向基因组的核酸(例如gRNA)将定点多肽引导至靶核酸。

如前所述，在一些实施例中，定点多肽和靶向基因组的核酸可各自单独施用于细胞或受试者。在一些实施例中，定点多肽可以与一种或多种向导RNA、或者一种或多种crRNA以及tracrRNA预复合。然后可以将预复合材料施用至细胞或受试者。这种预复合材料称为核糖核蛋白颗粒(RNP)。

用于基因组编辑的系统

本文提供了用于基因组编辑，尤其是用于将合成FVIII编码序列插入细胞基因组中的系统。这些系统可以用于本文所述的方法中，诸如用于编辑细胞的基因组和用于治疗受试者，例如患有血友病A的受试者。

在一些实施例中，本文提供了一种系统，该系统包含(a)DNA内切核酸酶或编码该DNA内切核酸酶的核酸；(b)靶向细胞基因组中的白蛋白基因座的gRNA；以及(c)包含编码合成FVIII蛋白的核酸序列的供体模板。在一些实施例中，gRNA靶向白蛋白基因的内含子1。在一些实施例中，gRNA包含来自SEQ ID NO:271-298中任一个的间隔区序列。

在一些实施例中，本文提供了一种系统，该系统包含(a)脱氧核糖核苷酸(DNA)内切核酸酶或编码该DNA内切核酸酶的核酸；(b)包含来自SEQ ID NO:271-298中任一个的间隔区序列的向导RNA(gRNA)；以及(c)包含编码合成FVIII蛋白的核酸序列的供体模板。在一些实施例中，gRNA包含来自SEQ ID NO:274、275、281和283中任一个的间隔区序列。在一些实施例中，gRNA包含来自SEQ ID NO:274的间隔区序列。在一些实施例中，gRNA包含来自SEQID NO:275的间隔区序列。在一些实施例中，gRNA包含来自SEQ ID NO:281的间隔区序列。在一些实施例中，gRNA包含来自SEQ ID NO:283的间隔区序列。

在一些实施例中，根据本文所述的任何系统，该DNA内切核酸酶选自由以下项组成的组：Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也称为Csn1和Csx12)、Cas100、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4或Cpf1内切核酸酶或其功能等效物。在一些实施例中，DNA内切核酸酶是Cas9。在一些实施例中，Cas9来自酿脓链球菌(spCas9)。在一些实施例中，Cas9来自路邓葡萄球菌(SluCas9)。

在一些实施例中，根据本文所述的任何系统，对编码合成FVIII蛋白的核酸序列进行密码子优化以在宿主细胞中表达。在一些实施例中，对编码合成FVIII蛋白的核酸序列进行密码子优化以在人类细胞中表达。

在一些实施例中，根据本文所述的任何系统，该系统包含编码DNA内切核酸酶的核酸。在一些实施例中，对编码DNA内切核酸酶的核酸进行密码子优化以在宿主细胞中表达。在一些实施例中，对编码DNA内切核酸酶的核酸进行密码子优化以在人类细胞中表达。在一些实施例中，编码DNA内切核酸酶的核酸是DNA，诸如DNA质粒。在一些实施例中，编码DNA内切核酸酶的核酸是RNA，诸如mRNA。

在一些实施例中，根据本文所述的任何系统，供体模板在AAV载体中编码。在一些实施例中，供体模板包含供体盒，该供体盒包含合成FVIII编码序列，并且该供体盒在一侧或两侧上侧接有gRNA靶位点。在一些实施例中，供体盒在两侧上侧接有gRNA靶位点。在一些实施例中，gRNA靶位点是系统中gRNA的靶位点。在一些实施例中，供体模板的gRNA靶位点是该系统中gRNA的细胞基因组gRNA靶位点的反向互补序列。

在一些实施例中，根据本文所述的任何系统，DNA内切核酸酶或编码该DNA内切核酸酶的核酸配制在脂质体或脂质纳米颗粒中。在一些实施例中，脂质体或脂质纳米颗粒还包含gRNA。在一些实施例中，脂质体或脂质纳米颗粒是脂质纳米颗粒。在一些实施例中，该系统包含脂质纳米颗粒，该脂质纳米颗粒包含编码DNA内切核酸酶的核酸和gRNA。在一些实施例中，编码DNA内切核酸酶的核酸是编码DNA内切核酸酶的mRNA。

在一些实施例中，根据本文所述的任何系统，DNA内切核酸酶与gRNA复合，形成RNP复合物。

基因组编辑的方法

本文提供了基因组编辑，尤其是将其合成FVIII蛋白插入细胞基因组中的方法。该方法可用于治疗受试者，例如患有血友病A的患者，并且在这种情况下，可以从受试者或单独的供体中分离细胞。然后，使用本文所述的材料和方法编辑该细胞的染色体DNA。

本文提供了将合成FVIII编码序列敲入基因组的方法。一方面，本披露提供了将合成FVIII编码序列，即编码合成FVIII蛋白的核酸序列插入细胞基因组中。合成FVIII蛋白可以包括具有野生型FVIII蛋白的大量活性，例如野生型FVIII蛋白所表现出的活性的至少约30％、约40％、约50％、约60％、约70％、约80％、约90％、约95％或约100％的肽。在一些实施例中，本领域的普通技术人员可以使用本领域中已知的许多方法来测试化合物例如肽或蛋白的功能或活性。在一些实施例中，合成FVIII蛋白还可以包括野生型FVIII蛋白的任何片段或在全长野生型FVIII蛋白的一个或多个氨基酸残基上具有保守性修饰的经修饰FVIII蛋白的片段。在一些实施例中，合成FVIII蛋白还可以包括基本上不会对野生型FVIII蛋白的功能产生负面影响的任何修饰，例如一个或多个氨基酸的缺失、插入和/或突变。因此，在一些实施例中，合成FVIII编码序列的核酸序列可与FVIII编码序列具有至少约30％、约40％、约50％、约60％、约70％、约80％、约85％、约90％、约95％、约96％、约97％、约98％或约99％的核酸序列同一性。

在一些实施例中，将合成FVIII编码序列插入细胞的基因组序列中。在一些实施例中，插入位点处于细胞基因组中的白蛋白基因座、转铁蛋白基因座或纤维蛋白原α基因座处或内部。在一些实施例中，插入位点是白蛋白基因座。插入方法使用一种或多种靶向白蛋白基因第一个内含子(或内含子1)的gRNA。在一些实施例中，供体DNA是具有合成FVIII编码序列的单链或双链DNA。

在一些实施例中，基因组编辑方法利用DNA内切核酸酶诸如CRISPR/Cas系统遗传引入(敲入)合成FVIII编码序列。在一些实施例中，DNA内切核酸酶是Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也称为Csn1和Csx12)、Cas100、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4或Cpf1内切核酸酶、其同源物、天然存在的分子的重组物、其密码子优化或修饰形式以及任何前述物质的组合。在一些实施例中，DNA内切核酸酶是Cas9。在一些实施例中，Cas9来自酿脓链球菌(spCas9)。在一些实施例中，Cas9来自路邓葡萄球菌(SluCas9)。

在一些实施例中，经受基因组编辑的细胞在基因组中具有一个或多个突变，突变导致内源性FVIII基因的表达与没有此类突变的正常细胞中的表达相比降低。正常细胞可以是来源于(或分离自)没有FVIII基因缺陷的不同受试者的健康细胞或对照细胞。在一些实施例中，经受基因组编辑的细胞可以来源于(或分离自)需要治疗FVIII基因相关病状或病症，例如血友病A的受试者。因此，在一些实施例中，这种细胞中内源性FVIII基因的表达与正常细胞中内源性FVIII基因的表达相比降低约10％、约20％、约30％、约40％、约50％、约60％、约70％、约80％、约90％或约100％。

在一些实施例中，基因组编辑方法进行功能性FVIII编码序列(例如与提供的启动子可操作地连接的FVIII编码序列)(在基因组的非编码区)的靶向插入，以便在体内稳定地生成FVIII蛋白。在一些实施例中，FVIII编码序列的靶向整合发生于在目标细胞类型例如肝细胞或窦内皮细胞中高度表达的白蛋白基因的内含子中。

一方面，将合成FVIII编码序列的核酸序列插入细胞的基因组中。在实施例中，要插入的合成FVIII编码序列是经修饰的FVIII编码序列。在一些实施例中，在经修饰的FVIII编码序列中，野生型FVIII编码序列的B结构域缺失并且被B结构域替代物替代。在一些实施例中，合成FVIII由于其尺寸较小而优于全长野生型FVIII(4371bp对比7053bp)。因此，在一些实施例中，缺乏FVIII信号肽并且在其5’末端(FVIII编码序列的N端)含有剪接受体序列的合成FVIII编码序列特异性整合到哺乳动物(包括人)的肝细胞中的基因座的内含子1中。在一个实施例中，基因座是白蛋白基因座。在另一个实施例中，基因座是转铁蛋白基因座。在另一个实施例中，基因座是纤维蛋白原α基因座。

合成FVIII编码序列从转铁蛋白启动子转录可产生含有转铁蛋白外显子1、内含子1的一部分和整合的合成FVIII编码序列的前mRNA。当这种前mRNA经过自然剪接过程以去除内含子时，剪接机制可以将转铁蛋白外显子1的3’侧的剪接供体连接到下一个可用的剪接受体，该剪接受体将成为插入的DNA供体的合成FVIII编码序列的5’末端的剪接受体。这可以产生含有与合成FVIII的成熟编码序列融合的转铁蛋白外显子1的成熟mRNA。

这种合成FVIII编码序列从白蛋白启动子转录可产生含有白蛋白外显子1、内含子1的一部分和整合的合成FVIII编码序列的前mRNA。当这种前mRNA经过自然剪接过程以去除内含子时，剪接机制可以将白蛋白外显子1的3’侧的剪接供体连接到下一个可用的剪接受体，该剪接受体将成为插入的DNA供体的合成FVIII编码序列的5’末端的剪接受体。这可以产生含有与合成FVIII的成熟编码序列融合的白蛋白外显子1的成熟mRNA。白蛋白的外显子1编码信号肽加上两个附加氨基酸和在人类中通常编码白蛋白N端的蛋白序列DAH的密码子的1/3。因此，在一些实施例中，在从细胞分泌期间白蛋白信号肽预期裂解之后，可以产生合成FVIII蛋白，该蛋白具有三个附加氨基酸残基添加至N端，从而在FVIII-FVIII蛋白的N端产生氨基酸序列-DAHATRRYY(SEQ ID NO:300)。由于这三个氨基酸中的第3个(带下划线)部分由外显子1的末端编码，而部分由合成FVIII DNA供体模板编码，因此可以将第3个附加氨基酸残基的同一性选择为Leu、Pro、His、Gln或Arg。在这些选择中，在一些实施例中使用Leu，因为Leu是分子最不复杂的，因此最不可能形成新的T细胞表位，从而在合成FVIII蛋白的N端产生氨基酸序列-DALATRRYY。替代性地，可以将DNA供体模板设计为缺失第3个残基，从而在合成FVIII蛋白的N端产生氨基酸序列DALTRRYY。在一些情况下，在天然蛋白的序列中添加附加氨基酸可增加免疫原性风险。因此，在预测合成FVIII N端的两个潜在选择的潜在免疫原性的计算机模拟分析证明一个残基缺失(DALTRRYY)具有较低的免疫原性评分的一些实施例中，这可以是至少一些实施例中的设计。

在一些实施例中，可以使用其中密码子使用已经优化的编码合成FVIII的DNA序列，以改善在哺乳动物细胞中的表达(所谓的“密码子优化”)。在该领域中不同的计算机算法也可用于进行密码子优化，并且这些算法生成不同的DNA序列(V.P.Mauro等人，TrendsMol Med[分子医学趋势](2014)20:604-13)。可商购的密码子优化算法的实例是ATUM和基因技术股份公司(GeneArt)(赛默飞世尔科技的一部分)采用的算法。经证明密码子优化FVIII编码序列在向小鼠进行基于基因的递送后显著改善FVIII的表达(A.C.Nathwani等人，Blood[血液](2006)107(7):2653-61.；N.J.Ward等人，Blood[血液](2011)117(3):798-807；P.A.Radcliffe等人，Gene Ther.[基因疗法](2008)15(4):289-97)。密码子优化是用于改善目标编码序列的表达的既定方法，并且主要基于用较不频繁使用的密码子取代较频繁使用的密码子，而不改变所编码的氨基酸序列。由于密码子偏倚可影响蛋白表达的初始认识，已经发展了密码子优化的方法，并且算法是可商购获得的，包括DNA合成公司(诸如基因技术股份公司和ATUM)提供的那些。这些可商购获得的算法作为DNA合成服务的一部分对用户是免费可获得的，并且也设计成去除隐蔽剪接信号并且甚至去除编码序列上的G/C内容物。递送外源核酸至体内细胞可诱导至少部分由Toll受体系统识别CG二核苷酸(也称为CpG序列)所驱动的先天免疫应答，且CG二核苷酸含量的降低被提出作为降低对这些核酸的先天免疫应答的方式，尤其是当质粒DNA为递送载体时。另见P.Colella等人,Mol TherMethods Clin Dev[分子疗法-方法与临床发展](2018)8:87-104。当为了在哺乳动物物种中表达而优化基因的天然存在(天然)的编码序列时，通常增加CG二核苷酸的数目，因为更频繁使用的密码子在该密码子的第3(摆动)位置含有更高频率的G和C核苷酸。因此，编码序列中G和C核苷酸的总含量的增加将产生更高的GC二核苷酸含量。

在一些实施例中，通过不同算法进行密码子优化的合成FVIII编码序列与天然FVIII序列(存在于人类基因组中)之间的序列同源性或同一性的范围可以为约30％、约40％、约50％、约60％、约65％、约70％、约75％、约80％、约85％、约90％、约95％或100％。在一些实施例中，密码子优化的合成FVIII编码序列与天然FVIII序列具有约75％至约79％的序列同源性或同一性。在一些实施例中，密码子优化的合成FVIII编码序列与天然FVIII序列具有约70％、约71％、约72％、约73％、约74％、约75％、约76％、约77％、约78％、约79％或约80％的序列同源性或同一性。

在一些实施例中，将供体模板或供体构建体制备成含有编码合成FVIII的DNA序列。在一些实施例中，将DNA供体模板设计成含有密码子优化的人合成FVIII编码序列。在一些实施例中，密码子优化以这样的方式进行，使得5’末端编码FVIII信号肽的序列已缺失并且被剪接受体序列替代，另外，将聚腺苷酸化信号添加到3’末端的FVIII终止密码子之后(MAB8A-SEQ ID NO:301)。剪接受体序列可以选自来自已知基因的已知剪接受体序列，或者可以使用源自本领域已知的许多剪接受体序列的比对的共有剪接受体序列。在一些实施例中，使用来自高度表达的基因的剪接受体序列，因为认为此类序列会提供最佳剪接效率。在一些实施例中，共有剪接受体序列由具有共有序列T/CNC/TT/CA/GAC/T(SEQ ID NO:302)的分支位点(Branch site)组成，其后20bp以内是10至12个碱基的多嘧啶串(C或T)，接着是AG>G/A，其中>是内含子/外显子边界的位置。在一个实施例中，使用合成剪接受体序列(ctgacctcttctcttcctcccacag-SEQ ID NO:303)。在另一个实施例中，使用来自人(TTAACAATCCTTTTTTTTCTTCCCTTGCCCAG-SEQ ID NO:304)或小鼠(taaatatgttgtgtggtttttctctccc tgtttccacag-SEQ ID NO:305)的白蛋白基因内含子1/外显子2边界的天然剪接受体序列。

聚腺苷酸化序列为细胞提供信号以添加聚A尾，这对于细胞内mRNA的稳定性至关重要。在DNA供体模板将要包装到AAV颗粒中的一些实施例下，本发明的实施例将包装的DNA的大小保持在AAV的包装极限以内，该极限可以小于约5Kb，或者不超过约4.7Kb。因此，在一些实施例中，使用尽可能短的聚A序列，例如约10-mer、约20-mer、约30-mer、约40-mer、约50-mer或约60-mer或前述任何中间数目的核苷酸。共有合成的聚A信号序列已在文献中有所描述(N.Levitt等人，Genes Dev[基因和发育](1989)3(7):1019-25)，其具有序列AATAAAAGATCTTTATTTTCATTAGATCTGTGTGTTGGTTTTTTGTGTG(SEQ ID NO:306)，并且通常用于许多表达载体中。

在一些实施例中，可以将附加序列元件添加至DNA供体模板以提高整合频率。一种这样的元件是同源臂。双链断裂左侧的序列(LHA)附加到DNA供体模板的5’末端(FVIII编码序列的N端)，而双链断裂右侧的序列(RHA)附加到DNA供体模板例如MAB8B(SEQ ID NO:308)的3’末端(FVIII编码序列的C端)。

在一些实施例中提供的替代性DNA供体模板设计具有与将用于裂解基因组位点的sgRNA的识别序列互补的序列。MAB8C(SEQ ID NO:309)代表这种类型的DNA供体模板的实例。通过包括sgRNA识别位点，DNA供体模板将被已向其中递送了DNA供体模板和sgRNA/Cas9的细胞核内的sgRNA/Cas9复合物裂解。将供体模板裂解成线性片段可以提高通过非同源末端连接机制或通过HDR机制在双链断裂处整合的频率。在递送包装在AAV中的供体模板的情况下，这可能特别有益，因为已知递送到细胞核中之后，AAV基因组会连环化形成更大的环状双链DNA分子(H.Nakai等人，J Virol[病毒学杂志](2001)75:6969-76)。因此，在一些情况下，尤其是通过NHEJ机制，环状连环体可能是双链断裂处整合效率较低的供体。以前有报道称，通过在质粒中包含锌指核酸酶切割位点，可以提高使用环状质粒DNA供体模板进行靶向整合的效率(S.Cristea等人，Biotechnol.Bioeng.[生物技术与生物工程](2013)110:871-80)。最近，还使用CRISPR/Cas9核酸酶应用了这种方法(K.Suzuki等人，Nature[自然](2017)540:144-49)。虽然sgRNA识别序列在存在于双链DNA供体模板的任一条链上时有活性，但预计使用基因组中存在的sgRNA识别序列的反向互补序列有利于稳定整合，因为以相反方向整合会重新产生可以重新切割的sgRNA识别序列，从而释放出插入的供体模板。预测通过NHEJ以正向方向将这种供体模板整合在基因组中不会重新产生sgRNA识别序列，使得整合的供体模板不可以从基因组中切除。可以测试和确定在有或无同源臂的供体中包括sgRNA识别序列在FVIII供体模板的整合效率上的益处，例如在小鼠中使用AAV递送供体以及使用LNP(脂质纳米颗粒)递送CRISPR/CAS9组件。

在一些实施例中，供体模板在根据本文所述的任何实施例的供体盒中包含合成FVIII编码序列，该供体盒在一侧或两侧上侧接有gRNA靶位点。在一些实施例中，供体模板包含在供体盒的5’的gRNA靶位点和/或在供体盒的3’的gRNA靶位点。在一些实施例中，供体模板包含两个侧翼gRNA靶位点，并且这两个gRNA靶位点包含相同序列。在一些实施例中，供体模板包含至少一个gRNA靶位点，并且供体模板中的该至少一个gRNA靶位点是靶向白蛋白基因的第一内含子的一个或多个gRNA中的至少一个的靶位点。在一些实施例中，供体模板包含至少一个gRNA靶位点，并且供体模板中的该至少一个gRNA靶位点是白蛋白基因的第一内含子中一个或多个gRNA中的至少一个的靶位点的反向互补序列。在一些实施例中，供体模板包含在供体盒的5’的gRNA靶位点和在供体盒的3’的gRNA靶位点，并且供体模板中的这两个gRNA靶位点被靶向白蛋白基因的第一内含子的一个或多个gRNA靶向。在一些实施例中，供体模板包含在供体盒的5’的gRNA靶位点和在供体盒的3’的gRNA靶位点，并且供体模板中的这两个gRNA靶位点是白蛋白基因的第一内含子中一个或多个gRNA中的至少一个的靶位点的反向互补序列。

将FVIII编码序列插入靶位点，即插入FVIII编码序列的基因组位置，可以是在内源白蛋白基因座或其邻近序列中。在一些实施例中，以这样的方式插入FVIII编码序列，使得插入的编码序列的表达受白蛋白基因的内源启动子控制。在一些实施例中，将FVIII编码序列插入白蛋白基因的一个内含子中。在一些实施例中，将FVIII编码序列插入白蛋白基因的一个外显子中。在一些实施例中，将FVIII编码序列插入内含子:外显子(或反之亦然)的连接处。在一些实施例中，FVIII编码序列的插入是在白蛋白基因座的第一内含子(或内含子1)中。在一些实施例中，FVIII编码序列的插入不会明显影响(例如上调或下调)白蛋白基因的表达。

在实施例中，用于插入FVIII编码序列的靶位点是在内源白蛋白基因处、内部或附近。在一些实施例中，靶位点在基因间区中，该基因间区在基因组中白蛋白基因座的启动子上游。在一些实施例中，靶位点在白蛋白基因座内。在一些实施例中，靶位点在白蛋白基因座的一个内含子中。在一些实施例中，靶位点在白蛋白基因座的一个外显子中。在一些实施例中，靶位点在白蛋白基因座的内含子和外显子之间(或反之亦然)的一个连接处。在一些实施例中，靶位点在白蛋白基因座的第一内含子(或内含子1)中。在某些实施例中，靶位点在白蛋白基因的第一外显子下游至少、约或至多0、1、5、10、20、30、40、50、100、150、200、250、300、350、400、450或500或550或600或650bp处。在一些实施例中，靶位点在白蛋白基因的第一内含子上游至少、约或至多0.1kb、约0.2kb、约0.3kb、约0.4kb、约0.5kb、约1kb、约1.5kb、约2kb、约2.5kb、约3kb、约3.5kb、约4kb、约4.5kb或约5kb处。在一些实施例中，靶位点在白蛋白基因的第二外显子上游约0bp至约100bp，上游约101bp至约200bp，上游约201bp至约300bp，上游约301bp至约400bp，约401bp至约500bp，上游约501bp至约600bp，上游约601bp至约700bp，上游约701bp至约800bp，上游约801bp至约900bp，上游约901bp至约1000bp，上游约1001bp至约1500bp，上游约1501bp至约2000bp，上游约2001bp至约2500bp，上游约2501bp至约3000bp，上游约3001bp至约3500bp，上游约3501bp至约4000bp，上游约4001bp至约4500bp或上游约4501bp至约5000bp以内的任何位置。在一些实施例中，靶位点在基因组中人白蛋白基因的第一外显子末端(即3’末端)下游至少37bp。在一些实施例中，靶位点在基因组中人白蛋白基因的第二外显子起点(即5’起点)上游至少330bp。

在一些实施例中，本文提供了一种编辑细胞中的基因组的方法，该方法包括向细胞提供以下物质：(a)靶向细胞基因组中的白蛋白基因座的向导RNA(gRNA)；(b)DNA内切核酸酶或编码该DNA内切核酸酶的核酸；以及(c)包含编码合成FVIII蛋白的核酸序列的供体模板。在一些实施例中，gRNA靶向白蛋白基因的内含子1。在一些实施例中，gRNA包含来自SEQ ID NO:271-298中任一个的间隔区序列。

在一些实施例中，本文提供了一种编辑细胞中的基因组的方法，该方法包括向细胞提供以下物质：(a)包含来自SEQ ID NO:271-298中任一个的间隔区序列的gRNA；(b)DNA内切核酸酶或编码该DNA内切核酸酶的核酸；以及(c)包含编码合成FVIII蛋白的核酸序列的供体模板。在一些实施例中，gRNA包含来自SEQ ID NO:274、275、281和283中任一个的间隔区序列。在一些实施例中，gRNA包含来自SEQ ID NO:274的间隔区序列。在一些实施例中，gRNA包含来自SEQ ID NO:275的间隔区序列。在一些实施例中，gRNA包含来自SEQ ID NO:281的间隔区序列。在一些实施例中，gRNA包含来自SEQ ID NO:283的间隔区序列。在一些实施例中，细胞是人细胞，例如人肝脏细胞。

在一些实施例中，根据本文所述的编辑细胞中的基因组的任何方法，该DNA内切核酸酶选自由以下项组成的组：Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也称为Csn1和Csx12)、Cas100、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4或Cpf1内切核酸酶或其功能等效物。在一些实施例中，DNA内切核酸酶是Cas9。在一些实施例中，Cas9是spCas9。在一些实施例中，Cas9是SluCas9。

在一些实施例中，根据本文所述的编辑细胞中的基因组的任何方法，对编码合成FVIII蛋白的核酸序列进行密码子优化以在细胞中表达。在一些实施例中，细胞是人细胞。

在一些实施例中，根据本文所述的编辑细胞中的基因组的任何方法，该方法采用编码DNA内切核酸酶的核酸。在一些实施例中，对编码DNA内切核酸酶的核酸进行密码子优化以在细胞中表达。在一些实施例中，细胞是人细胞，例如人肝脏细胞。在一些实施例中，编码DNA内切核酸酶的核酸是DNA，诸如DNA质粒。在一些实施例中，编码DNA内切核酸酶的核酸是RNA，诸如mRNA。

在一些实施例中，根据本文所述的编辑细胞中的基因组的任何方法，供体模板在AAV载体中编码。在一些实施例中，供体模板包含供体盒，该供体盒包含编码合成FVIII蛋白的核酸序列，并且该供体盒在一侧或两侧上侧接有gRNA靶位点。在一些实施例中，供体盒在两侧上侧接有gRNA靶位点。在一些实施例中，该gRNA靶位点是所施用的gRNA的靶位点。在一些实施例中，供体模板的gRNA靶位点是gRNA的细胞基因组gRNA靶位点的反向互补序列。

在一些实施例中，根据本文所述的编辑细胞中的基因组的任何方法，DNA内切核酸酶或编码该DNA内切核酸酶的核酸配制在脂质体或脂质纳米颗粒中。在一些实施例中，脂质体或脂质纳米颗粒还包含gRNA。在一些实施例中，脂质体或脂质纳米颗粒是脂质纳米颗粒。在一些实施例中，该方法采用脂质纳米颗粒，该脂质纳米颗粒包含编码DNA内切核酸酶的核酸和gRNA。在一些实施例中，编码DNA内切核酸酶的核酸是编码DNA内切核酸酶的mRNA。

在一些实施例中，根据本文所述的编辑细胞中的基因组的任何方法，DNA内切核酸酶与gRNA预复合，形成RNP复合物。

在一些实施例中，根据本文所述的编辑细胞中的基因组的任何方法，在将供体模板提供给细胞之后，将gRNA和DNA内切核酸酶或编码该DNA内切核酸酶的核酸提供给该细胞。在一些实施例中，在将该供体模板提供给该细胞后超过4天，将gRNA和DNA内切核酸酶或编码该DNA内切核酸酶的核酸提供给该细胞。在一些实施例中，在将该供体模板提供给该细胞后至少14天，将gRNA和DNA内切核酸酶或编码该DNA内切核酸酶的核酸提供给该细胞。在一些实施例中，在将该供体模板提供给该细胞后至少17天，将gRNA和DNA内切核酸酶或编码该DNA内切核酸酶的核酸提供给该细胞。在一些实施例中，将(a)和(b)作为包含编码DNA内切核酸酶的核酸和gRNA的脂质纳米颗粒提供给细胞。在一些实施例中，编码DNA内切核酸酶的核酸是编码DNA内切核酸酶的mRNA。在一些实施例中，将(c)作为编码供体模板的AAV载体提供给细胞。

在一些实施例中，根据本文所述的编辑细胞中的基因组的任何方法，在第一剂量的gRNA和DNA内切核酸酶或编码该DNA内切核酸酶的核酸后，向该细胞提供一个或多个附加剂量的gRNA和DNA内切核酸酶或编码该DNA内切核酸酶的核酸。在一些实施例中，在第一剂量的gRNA和DNA内切核酸酶或编码该DNA内切核酸酶的核酸后，向该细胞提供一个或多个附加剂量的gRNA和DNA内切核酸酶或编码该DNA内切核酸酶的核酸，直至达到该编码合成FVIII蛋白的核酸序列的目标靶向整合水平和/或该编码合成FVIII蛋白的核酸序列的目标表达水平。

在一些实施例中，根据本文所述的编辑细胞中的基因组的任何方法，编码合成FVIII蛋白的核酸序列在内源白蛋白启动子的控制下表达。

在一些实施例中，本文提供了将合成FVIII编码序列插入细胞基因组的白蛋白基因座中的方法，该方法包括将以下物质引入细胞中：(a)Cas DNA内切核酸酶(例如，Cas9)或编码Cas DNA内切核酸酶的核酸，(b)gRNA或编码gRNA的核酸，其中gRNA能够引导Cas DNA内切核酸酶裂解白蛋白基因座中的靶多核苷酸序列，以及(c)根据本文所述的任何实施例的包含合成FVIII编码序列的供体模板。在一些实施例中，该方法包括将编码Cas DNA内切核酸酶的mRNA引入细胞中。在一些实施例中，该方法包括将根据本文所述的任何实施例的LNP引入细胞中，该LNP包含i)编码Cas DNA内切核酸酶的mRNA和ii)gRNA。在一些实施例中，供体模板是AAV供体模板。在一些实施例中，供体模板包含含有合成FVIII编码序列的供体盒，其中供体盒在一侧或两侧上侧接有gRNA靶位点。在一些实施例中，供体盒侧翼的gRNA靶位点是白蛋白基因座中gRNA靶位点的反向互补序列。在一些实施例中，在将供体模板引入细胞后，将Cas DNA内切核酸酶或编码Cas DNA内切核酸酶的核酸以及gRNA或编码gRNA的核酸引入细胞。在一些实施例中，在将供体模板引入细胞中允许供体模板进入细胞核的足够时间后，将Cas DNA内切核酸酶或编码Cas DNA内切核酸酶的核酸以及gRNA或编码gRNA的核酸引入细胞中。在一些实施例中，在将供体模板引入细胞中允许供体模板在细胞核中由单链AAV基因组转化为双链DNA分子的足够时间后，将Cas DNA内切核酸酶或编码Cas DNA内切核酸酶的核酸以及gRNA或编码gRNA的核酸引入细胞中。在一些实施例中，Cas DNA内切核酸酶是Cas9。

在一些实施例中，根据本文所述的将合成FVIII编码序列插入细胞基因组的白蛋白基因座中的任何方法，靶多核苷酸序列在白蛋白基因的内含子1中。在一些实施例中，gRNA包含来自SEQ ID NO:271-298中任一个的间隔区序列。在一些实施例中，gRNA包含来自SEQ ID NO:274、275、281和283中任一个的间隔区序列。在一些实施例中，gRNA包含来自SEQID NO:274的间隔区序列。在一些实施例中，gRNA包含来自SEQ ID NO:275的间隔区序列。在一些实施例中，gRNA包含来自SEQ ID NO:281的间隔区序列。在一些实施例中，gRNA包含来自SEQ ID NO:283的间隔区序列。

在一些实施例中，本文提供了将合成FVIII编码序列插入细胞基因组的白蛋白基因座中的方法，该方法包括将以下物质引入细胞中：(a)根据本文所述的任何实施例的LNP，其包含i)编码Cas9 DNA内切核酸酶的mRNA和ii)gRNA，其中gRNA能够引导Cas9 DNA内切核酸酶裂解白蛋白基因座中的靶多核苷酸序列，以及(b)根据本文所述的任何实施例的包含合成FVIII编码序列的AAV供体模板。在一些实施例中，供体模板包含含有合成FVIII编码序列的供体盒，其中供体盒在一侧或两侧上侧接有gRNA靶位点。在一些实施例中，供体盒侧翼的gRNA靶位点是白蛋白基因座中gRNA靶位点的反向互补序列。在一些实施例中，在将AAV供体模板引入细胞后，将LNP引入细胞。在一些实施例中，在将AAV供体模板引入细胞中允许供体模板进入细胞核的足够时间后将LNP引入细胞中。在一些实施例中，在将AAV供体模板引入细胞中允许供体模板在细胞核中由单链AAV基因组转化为双链DNA分子的足够时间后将LNP引入细胞中。在一些实施例中，在第一次将LNP引入细胞后，进行向细胞中一次或多次(诸如2、3、4、5次或更多次)附加引入LNP。在一些实施例中，gRNA包含来自SEQ ID NO:271-298中任一个的间隔区序列。在一些实施例中，gRNA包含来自SEQ ID NO:274、275、281和283中任一个的间隔区序列。在一些实施例中，gRNA包含来自SEQ ID NO:274的间隔区序列。在一些实施例中，gRNA包含来自SEQ ID NO:275的间隔区序列。在一些实施例中，gRNA包含来自SEQ ID NO:281的间隔区序列。在一些实施例中，gRNA包含来自SEQ ID NO:283的间隔区序列。

FVIII编码序列插入靶位点可以在内源纤维蛋白原-α基因座或其相邻序列中。在一些实施例中，以这样的方式插入FVIII编码序列，使得插入的编码序列的表达受纤维蛋白原-α基因的内源启动子控制。在一些实施例中，将FVIII编码序列插入纤维蛋白原-α基因的一个内含子中。在一些实施例中，将FVIII编码序列插入纤维蛋白原-α基因的一个外显子中。在一些实施例中，将FVIII编码序列插入内含子:外显子(或反之亦然)的连接处。在一些实施例中，FVIII编码序列的插入在纤维蛋白原-α基因座的第一内含子(或内含子1)中。在一些实施例中，FVIII编码序列的插入不会明显影响(例如上调或下调)纤维蛋白原-α基因的表达。

在某些实施例中，靶位点处于纤维蛋白原-α基因的第一外显子下游(即，从第一外显子的最后一个碱基对或3’末端开始)至少、约或至多0、1、5、10、20、30、40、50、100、150、200、250、300、350、400、450、500、550、600、650、700、750、800、850、900、950、1000、1050、1071bp或任何介于中间的核酸长度。在一些实施例中，靶位点处于纤维蛋白原-α基因的第二外显子上游(即，从第二外显子的第一个核酸或5’末端开始)至少、约或至多0.1kb、约0.2kb、约0.3kb、约0.4kb、约0.5kb、约1kb或任何介于中间的核酸长度。在一些实施例中，靶位点处于纤维蛋白原-α基因的第二外显子上游(即，从第二外显子的第一个核酸或5’末端开始)约0bp至约100bp、约101bp至约200bp、约201bp至约300bp、约301bp至约400bp、约401bp至约500bp、约501bp至约600bp、约601bp至约700bp、约701bp至约800bp、约801bp至约900bp、约901bp至约1000bp、约1001bp至约1071bp以内的任何地方。

在一些实施例中，插入FVIII编码序列的靶位点在基因组中人纤维蛋白原-α基因的第一外显子的末端下游至少40bp，并且在基因组中人纤维蛋白原-α基因的第二外显子的起点上游至少60bp。

在一些实施例中，插入FVIII编码序列的靶位点在基因组中人纤维蛋白原-α基因的第一外显子的末端下游至少42bp，并且在基因组中人纤维蛋白原-α基因的第二外显子的起点上游至少65bp。

在一些实施例中，该插入在基因组中人纤维蛋白原-α基因的第一外显子的末端下游至少12bp，并且在基因组中人纤维蛋白原-α基因的第二外显子的起点上游至少52bp。

在一些实施例中，该插入在基因组中人纤维蛋白原-α基因的第一外显子的末端下游至少94bp，并且在基因组中人纤维蛋白原-α基因的第二外显子的起点上游至少86bp。

在一些实施例中，根据本文所述的任何系统，供体模板包含用于靶向整合到转铁蛋白基因的内含子1中的编码合成FVIII的核酸序列，其中供体模板从5’至3’包含i)第一gRNA靶位点；ii)剪接受体；iii)编码合成FVIII的核苷酸序列；和iv)聚腺苷酸化信号。在一些实施例中，供体模板进一步包含iv)聚腺苷酸化信号下游的第二gRNA靶位点。在一些实施例中，第一gRNA靶位点和第二gRNA靶位点是相同的。在一些实施例中，供体模板进一步包含在ii)剪接受体和iii)编码合成FVIII蛋白的核苷酸序列之间的编码转铁蛋白基因的外显子2上编码的转铁蛋白信号肽的末端部分的序列或其变体，该变体保留内源序列的至少一些活性。在一些实施例中，供体模板进一步包含在i)第一gRNA靶位点与ii)剪接受体之间的多核苷酸间隔区。在一些实施例中，多核苷酸间隔区的长度为18个核苷酸。在一些实施例中，供体模板在一侧上侧接有第一AAV ITR(反向末端重复序列)和/或在另一侧上侧接有第二AAV ITR。在一些实施例中，第一AAV ITR是AAV2 ITR和/或第二AAV ITR是AAV2 ITR。在一些实施例中，iii)的核苷酸序列编码具有包含3、4、5或6个N-连接的糖基化位点的B结构域替代物的合成FVIII。供体模板组件的示例性序列可以在SEQ ID NO:310和/或311的供体模板序列中找到。

靶序列选择

在一些实施例中，5’边界和/或3’边界的位置相对于特定参考基因座的移动用于促进或增强基因编辑的特定应用，这部分取决于选择用于编辑的内切核酸酶系统，如本文进一步描述和说明的那样。

在这种靶序列选择的第一个非限制性方面，许多内切核酸酶系统具有引导对潜在裂解靶位点的初始选择的规则或标准，诸如在CRISPR II型或V型内切核酸酶的情况下在邻近DNA裂解位点的特定位置需要有PAM序列基序。

在靶序列选择或优化的另一个非限制性方面，靶序列与DNA内切核酸酶的特定组合的“脱靶”活性频率(即在所选靶序列以外的位点发生双链断裂的频率)相对于中靶活性的频率进行评估。在一些情况下，已在所需基因座进行正确编辑的细胞相对于其他细胞具有选择优势。选择优势的说明性但非限制性的实例包括获得诸如提高的复制率、持久性、对某些条件的抗性、引入受试者后体内成功植入率或持久性增强的属性，以及其他与此类细胞的维持或数目或活力增加相关的属性。在其他情况下，可以通过一种或多种用于鉴定、分类或以其他方式选择已正确编辑的细胞的筛选方法来正向选择已在所需基因座处正确编辑的细胞。选择优势和定向选择方法都可以利用与矫正相关的表型。在一些实施例中，可以对细胞进行两次或更多次编辑以产生第二修饰，该第二修饰产生用于选择或纯化预期细胞群的新表型。可以通过添加选择或筛选标记的第二gRNA来产生这种第二修饰。在一些情况下，可以使用含有cDNA还有选择标记的DNA片段在所需基因座处对细胞进行正确编辑。

在实施例中，无论在特定情况下是任何选择优势适用还是应用任何定向选择，还应通过考虑脱靶频率来引导靶序列选择，以增强应用的有效性和/或降低在除所需靶标以外的位点产生不需要的改变的可能性。如本文和本领域中进一步描述和说明的，脱靶活性的发生受多种因素的影响，这些因素包括靶位点与脱靶位点之间的相似性和相异性，以及所使用的特定内切核酸酶。可以使用协助预测脱靶活性的生物信息学工具，并且通常也可以使用此类工具来鉴定脱靶活性的最可能位点，然后可以在实验设置中对其进行评估以评价脱靶与中靶活性的相对频率，从而允许选择具有相对较高中靶活性的序列。本文提供了此类技术的实例，并且其他技术是本领域已知的。

靶序列选择的另一方面涉及同源重组事件。共有同源区的序列可以用作导致间插序列缺失的同源重组事件的焦点。此类重组事件发生在染色体和其他DNA序列的正常复制过程中，也发生在合成DNA序列时，诸如在双链断裂(DSB)修复的情况下。DSB在正常细胞复制周期期间定期发生，但也可通过诸如紫外线和DNA断裂的其他诱导物等因素，或诸如化学诱导物等试剂的存在而增强。许多此类诱导物导致DSB在基因组中不加选择地发生，并且DSB在正常细胞中被定期诱导和修复。在修复过程中，可以完全保真地重构原始序列，然而，在一些情况下，会在DSB位点引入小的插入缺失。

如同在本文所述的内切核酸酶系统的情况下，还可以在特定位置特异性诱导DSB，本文所述的内切核酸酶系统可以用于在选定的染色体位置引起定向或优先的基因修饰事件。在DNA修复(以及复制)的背景下同源序列易于重组的趋势可以在许多情况下加以利用，并且是基因编辑系统(诸如CRISPR)的一种应用的基础，其中使用同源定向修复将通过使用供体模板提供的目标序列插入所需的染色体位置。

特定序列之间的同源区，可以是可以具有少至十个碱基对或更少的小的“微同源”区，也可以用于实现所需缺失。例如，将单个DSB引入与附近序列表现出微同源性的位点。在这种DSB的正常修复过程中，高频发生的结果是间插序列的缺失，这是由于DSB和伴随的细胞修复过程促进重组的结果。

然而，在一些情形下，在同源区内选择靶序列也会引起更大的缺失，包括基因融合(当缺失处于编码区时)，鉴于特定情形，这些缺失可能是或可能不是所需的。

本文提供的实例进一步说明了用于产生设计用于插入FVIII编码序列的DSB的靶区域的选择，以及此类区域内设计用于相对于中靶事件将脱靶事件减到最少的特定靶序列的选择。

靶向整合

在一些实施例中，本文提供的方法是在肝细胞基因组中的特定位置整合合成FVIII编码序列，这称为“靶向整合”。在一些实施例中，通过使用序列特异性核酸酶在基因组DNA中产生双链断裂来实现靶向整合。

在一些实施例中使用的CRISPR/CAS系统具有可以快速筛选大量基因组靶标以鉴定最佳CRISPR/CAS设计的优点。靶向基因组任何区域的sgRNA分子可通过定位与所有PAM基序相邻的20bp序列来在计算机上设计。PAM基序在真核生物基因组中平均每15bp出现。然而，通过计算机模拟方法设计的sgRNA将以不同效率在细胞中产生双链断裂，并且目前无法使用计算机模拟方法预测一系列sgRNA分子的切割效率。由于sgRNA可以在体外快速合成，因此这使得可以快速筛选给定基因组区域中所有可能的sgRNA序列，以鉴定引起最有效切割的sgRNA。通常，当在细胞中测试给定基因组区域内的一系列sgRNA时，观察到裂解效率范围在0％至90％之间。也可以使用计算机模拟算法以及实验室实验来确定任何给定sgRNA的脱靶可能性。虽然与sgRNA的20bp识别序列的完美匹配主要在大多数真核基因组中仅出现一次，但在基因组中还存在许多与sgRNA具有一个或多个碱基对错配的其他位点。这些位点可以按可变频率裂解，可变频率基于错配数目或位置往往是无法预测的。未通过计算机模拟分析鉴定的其他脱靶位点处的裂解也可发生。因此，筛选相关细胞类型中的许多sgRNA以鉴定具有最有利的脱靶特性的sgRNA是选择最佳sgRNA用于治疗用途的关键组成部分。有利的脱靶特性不仅要考虑实际脱靶位点的数目和这些位点的切割频率，还要考虑这些位点在基因组中的位置。例如，与功能上重要的基因(尤其是致癌基因或抑癌基因)接近或在其内部的脱靶位点，被认为不如没有已知功能的基因间区中的位点有利。因此，无法简单地通过对生物体基因组序列的计算机模拟分析来预测对最佳sgRNA的鉴定，而是需要实验测试。虽然计算机模拟分析可有助于缩小待测试的向导的数目，但无法预测具有高中靶切割的向导或预测具有低的所需脱靶切割的向导。实验数据表明，各自与基因组在目标区域(诸如白蛋白内含子1)中具有完美匹配的sgRNA的切割效率从无切割到切割>90％变化，并且无法通过任何已知算法预测。给定sgRNA促进Cas酶裂解的能力可与基因组DNA中该特定位点的可及性有关，可及性可由该区域中的染色质结构决定。静止分化细胞(诸如肝细胞)中的大多数基因组DNA以高度浓缩的异染色质形式存在，而活跃转录的区域则以更开放的染色质状态存在，已知更开放的染色质是大分子更易接近的，诸如蛋白如Cas蛋白。由于存在或不存在结合的转录因子或其他调节蛋白，即使在活跃转录的基因内，DNA的某些特定区域也比其他区域更易接近。无法预测基因组中或特定基因组基因座或基因组基因座的区域(诸如内含子和诸如白蛋白内含子1)内的位点，因此需要在相关细胞类型中通过实验确定。一旦选择一些位点作为潜在插入位点，就可以向这种位点添加一些变异，例如在有或没有实验测试的情况下，通过将几个核苷酸移到选定位点的上游或下游来添加变异。

在一些实施例中，可用于本文披露的方法中的gRNA是SEQ ID NO:271-298中的一个或多个或其与SEQ ID NO:271-298中的那些具有至少约85％的核苷酸序列同一性的任何功能等效物。

核酸修饰

在一些实施例中，引入细胞中的多核苷酸具有一种或多种修饰，这些修饰可单独或组合使用，例如以增强活性、稳定性或特异性，改变递送，减少宿主细胞中的先天免疫应答，或用于其他增强，如本文进一步描述和本领域已知的。

在某些实施例中，在CRISPR/Cas9/Cpf1系统中使用经修饰的多核苷酸，在这种情况下，引入细胞中的向导RNA(单分子向导或双分子向导)和/或编码Cas或Cpf1内切核酸酶的DNA或RNA可以是经修饰的，如下面所描述和说明的。此类经修饰的多核苷酸可以用于CRISPR/Cas9/Cpf1系统中以编辑任何一个或多个基因组基因座。

使用CRISPR/Cas9/Cpf1系统进行此类用途的非限制性说明，可以使用对向导RNA的修饰来增强具有gRNA和Cas或Cpf1内切核酸酶的CRISPR/Cas9/Cpf1基因组编辑复合物的形成或稳定性，该gRNA可以是单分子向导或双分子。对gRNA的修饰也可以或替代性地用于增强基因组编辑复合物与基因组中靶序列之间相互作用的起始、稳定性或动力学，这可以用于例如增强中靶活性。对向导RNA的修饰也可以或替代性地用于增强特异性，例如，与其他(脱靶)位点处的作用相比，中靶位点处的基因组编辑的相对速率。

修饰也可以或替代性地用于增加指导RNA的稳定性，例如通过增加其对细胞中存在的核糖核酸酶(RNA酶)降解的抗性，从而导致其在细胞中的半衰期增加。增强向导RNA半衰期的修饰可在其中将Cas或Cpf1内切核酸酶经由需要翻译以便产生内切核酸酶的RNA引入待编辑的细胞的实施例中特别有用，因为增加与编码内切核酸酶的RNA同时引入的向导RNA的半衰期可用于增加向导RNA和编码的Cas或Cpf1内切核酸酶在细胞中共存的时间。

修饰也可以或替代性地用于降低引入细胞中的RNA引发先天免疫应答的可能性或程度。如以下和本领域中所述，已经在RNA干扰(RNAi)(包括小干扰RNA(siRNA))的背景下充分表征的此类应答倾向于与RNA的半衰期降低和/或细胞因子或与免疫应答有关的其他因子的引发相关。

还可以对引入细胞中的编码内切核酸酶的RNA进行一种或多种类型的修饰，这些修饰包括但不限于增强RNA稳定性的修饰(诸如通过增加细胞中存在的RNA酶的降解)、增强所得产物(即，内切核酸酶)的翻译的修饰、和/或降低引入细胞中的RNA引发先天免疫应答的可能性或程度的修饰。

类似地，可以使用诸如前述和其他的修饰的组合。在CRISPR/Cas9/Cpf1的情况下，例如，可以对向导RNA进行一种或多种类型的修饰(包括上述示例的那些)，和/或可以对编码Cas内切核酸酶的RNA进行一种或多种类型的修饰(包括以上示例的那些)。

举例说明，CRISPR/Cas9/Cpf1系统中使用的向导RNA或其他较小的RNA可以通过化学手段容易地合成，这使许多修饰可以容易地并入，如下文所示和本领域所述。随着化学合成程序的不断发展，通过诸如高效液相色谱法(HPLC，其避免使用诸如PAGE等凝胶)等程序纯化此类RNA随着多核苷酸长度显著增加超过约一百个核苷酸而趋于更具挑战性。用于产生更大长度的化学修饰的RNA的一种方法是产生两个或更多个连接在一起的分子。更长的RNA(诸如编码Cas9内切核酸酶的那些)更容易酶促产生。虽然通常可用于酶促产生的RNA中的修饰类型较少，但仍存在以下修饰，这些修饰可用于例如增强稳定性、降低先天免疫应答的可能性或程度、和/或增强其他属性，如以下和本领域进一步所描述的；并且定期开发新的修饰类型。

通过举例说明修饰类型，尤其是那些经常与较小的化学合成的RNA一起使用的修饰，修饰可以具有在糖的2’位置经修饰的一个或多个核苷酸，在一些实施例中为2’-O-烷基、2’-O-烷基-O-烷基或2’-氟修饰的核苷酸。在一些实施例中，RNA修饰包括在RNA的3’末端的嘧啶、无碱基残基或反向碱基的核糖上的2’-氟、2’-氨基或2’-O-甲基修饰。已将此类修饰并入寡核苷酸中，并且已经报道这些寡核苷酸对给定靶标具有比2’-脱氧寡核苷酸更高的T_m(即，更高的靶结合亲和力)。

已经报道许多核苷酸和核苷修饰使并入它们中的寡核苷酸比天然寡核苷酸对核酸酶消化更具抗性；这些经修饰的寡核苷酸比未经修饰的寡核苷酸完整地存活更长的时间。经修饰的寡核苷酸的具体实例包括具有经修饰的骨架的那些，例如硫代磷酸酯、磷酸三酯、甲基膦酸酯、短链烷基或环烷基糖间连键或短链杂原子或杂环糖间连键。一些寡核苷酸是具有硫代磷酸酯骨架的寡核苷酸和具有杂原子骨架的寡核苷酸，尤其是CH₂-NH-O-CH₂、CH₂-N(CH₃)-O-CH₂(称为亚甲基(甲基亚氨基)或MMI骨架)、CH₂-O-N(CH₃)-CH₂、CH₂-N(CH₃)-N(CH₃)-CH₂和O-N(CH₃)-CH₂-CH2骨架，其中天然磷酸二酯骨架表示为O-P-O-CH,)；是具有酰胺骨架的寡核苷酸(参见A.De Mesmaeker等人,Ace Chem Res[化学研究报告](1995)28:366-374)；是具有吗啉代骨架结构的寡核苷酸(参见Summerton和Weller,美国专利号5,034,506)；以及具有肽核酸(PNA)骨架的寡核苷酸(下文描述)。含磷连键包括但不限于硫代磷酸酯、手性硫代磷酸酯、二硫代磷酸酯、磷酸三酯、氨基烷基磷酸三酯、具有3’亚烷基膦酸酯和手性膦酸酯的甲基和其他烷基膦酸酯、亚膦酸酯、具有3’-氨基氨基磷酸酯和氨基烷基氨基磷酸酯的氨基磷酸酯、硫羰基氨基磷酸酯、硫羰基烷基膦酸酯、硫羰基烷基磷酸三酯和具有正常3’-5’连键的硼烷磷酸酯，这些的2’-5’连接类似物以及极性反转的那些类似物，其中核苷单元的相邻对3’-5’连接至5’-3’或2’-5’连接至5’-2’；参见美国专利号3,687,808、4,469,863、4,476,301、5,023,243、5,177,196、5,188,897、5,264,423、5,276,019、5,278,302、5,286,717、5,321,131、5,399,676、5,405,939、5,453,496、5,455,233、5,466,677、5,476,925、5,519,126、5,536,821、5,541,306、5,550,111、5,563,253、5,571,799、5,587,361和5,625,050。

基于吗啉基的寡聚化合物描述于D.A.Braasch等人，Biochem[生物化学](2002)41(14):4503-10；S.C.Ekker等人，Genesis[起源](2001)30(3):89-93(和该期刊中的其他论文)；J.Heasman,Dev Biol[发育生物学](2002)243:209-14；A.Nasevicius等人，Nat Genet[自然遗传](2000)26:216-20；G.Lacerra等人，Proc Natl Acad Sci USA[美国国家科学院院刊](2000)97:9591-96；以及美国专利号5,034,506。

环己烯基核酸寡核苷酸模拟物在J.Wang等人,J Am Chem.Soc[美国化学学会杂志](2000)122:8595-602中有描述。

其中不包括磷原子的经修饰的寡核苷酸骨架具有由短链烷基或环烷基核苷间连键、混合杂原子和烷基或环烷基核苷间连键或者一个或多个短链杂原子核苷间连键或杂环核苷间连键形成的骨架。这些具有那些具有吗啉基连键(部分由核苷的糖部分形成)的骨架；硅氧烷骨架；硫化物、亚砜和砜骨架；甲酰基和硫代甲酰基骨架；亚甲基甲酰基和硫代甲酰基骨架；含烯烃的骨架；氨基磺酸酯骨架；亚甲基亚氨基和亚甲基肼基骨架；磺酸酯和磺胺骨架；酰胺骨架；以及具有混合的N、O、S和CH₂组分的其他骨架；参见美国专利号5,034,506、5,166,315、5,185,444、5,214,134、5,216,141、5,235,033、5,264,562、5,264,564、5,405,938、5,434,257、5,466,677、5,470,967、5,489,677、5,541,307、5,561,225、5,596,086、5,602,240、5,610,289、5,602,240、5,608,046、5,610,289、5,618,704、5,623,070、5,663,312、5,633,360、5,677,437和5,677,439，每个专利通过援引并入本文。

还可以包括一种或多种经取代的糖部分，例如，在2’位置的以下之一：OH、SH、SCH₃、F、OCN、OCH₃OCH₃、OCH₃O(CH₂)_nCH₃、O(CH₂)_nNH₂或O(CH₂)_nCH₃，其中n为1至约10；C₁至C₁₀低级烷基、烷氧基烷氧基、经取代的低级烷基、烷芳基或芳烷基；Cl；Br；CN；CF₃；OCF₃；O-、S-或N-烷基；O-、S-或N-烯基；SOCH₃；SO₂CH₃；ONO₂；NO₂；N₃；NH₂；杂环烷基；杂环烷芳基；氨基烷基氨基；聚烷基氨基；经取代的甲硅烷基；RNA裂解基团；报告基团；嵌入剂；用于改善寡核苷酸的药代动力学特性的基团；或者用于改善寡核苷酸的药效学特性的基团和具有类似性质的其他取代基。在一些实施例中，修饰包括2’-甲氧基乙氧基(2’-O-CH₂CH₂OCH₃，也称为2’-O-(2-甲氧基乙基))(P.Martin等人,Helv Chim Acta[瑞士化学学报],(1995)78:486)。其他修饰包括2’-甲氧基(2’-O-CH₃)、2’-丙氧基(2’-OCH₂CH₂CH₃)和2’-氟(2’-F)。还可以在寡核苷酸上的其他位置，特别是在3’端核苷酸上的糖的3’位置和5’端核苷酸的5’位置进行类似的修饰。寡核苷酸也可以具有糖模拟物，诸如代替环戊呋喃糖基的环丁基。

在一些实施例中，核苷酸单元的糖和核苷间连键(即骨架)均被新型基团替代。维持碱基单元以与适当的核酸靶化合物杂交。一种这样的寡聚化合物，即已经报道具有优异杂交特性的寡核苷酸模拟物，被称作肽核酸(PNA)。在PNA化合物中，寡核苷酸的糖骨架被替换为含有酰胺的骨架，例如氨基乙基甘氨酸骨架。这些核碱基得以保持并且直接或间接地结合至该骨架的酰胺部分的氮杂氮原子。传授制备PNA化合物的代表性美国专利有但不限于美国专利号5,539,082、5,714,331和5,719,262。PNA化合物的其他传授内容可以在P.E.Nielsen等人,Science[科学],(1991)254:1497-500中找到。

在一些实施例中，向导RNA还可以另外或替代性地包括核碱基(在本领域中常常简称为“碱基”)修饰或取代。如本文所用，“未修饰的”或“天然的”核碱基包括腺嘌呤(A)、鸟嘌呤(G)、胸腺嘧啶(T)、胞嘧啶(C)和尿嘧啶(U)。经修饰的核碱基包括仅很少或瞬时发现于天然核酸中的核碱基，例如次黄嘌呤、6-甲基腺嘌呤、5-甲基嘧啶，特别是5-甲基胞嘧啶(也称为5-甲基-2’脱氧胞嘧啶并且常常在本领域中称为5-Me-C)、5-羟甲基胞嘧啶(HMC)、糖基HMC和龙胆二糖基HMC，以及合成的核碱基，例如2-氨基腺嘌呤、2-(甲基氨基)腺嘌呤、2-(咪唑基烷基)腺嘌呤、2-(氨基烷基氨基)腺嘌呤或其他杂取代的烷基腺嘌呤、2-硫尿嘧啶、2-硫胸腺嘧啶、5-溴尿嘧啶、5-羟甲基尿嘧啶、8-氮杂鸟嘌呤、7-脱氮鸟嘌呤、N6(6-氨基己基)腺嘌呤和2,6-二氨基嘌呤；G.Gebeyehu等人,Nucl Acids Res[核酸研究](1997)15:4513。也可以包括本领域已知的“通用”碱基，例如肌苷。已报道5-Me-C取代使核酸双链体稳定性提高0.6℃-1.2℃。(Y.S.Sanghvi等人,“Antisense Research and Applications”[反义研究与应用],CRC Press[CRC出版社],Boca Raton[波卡拉顿],1993,第276-278页)是碱基取代的实施例。

在一些实施例中，经修饰的核碱基包括其他合成的和天然的核碱基，诸如5-甲基胞嘧啶(5-me-C)，5-羟甲基胞嘧啶，黄嘌呤，次黄嘌呤，2-氨基腺嘌呤，腺嘌呤和鸟嘌呤的6-甲基和其他烷基衍生物，腺嘌呤和鸟嘌呤的2-丙基和其他烷基衍生物，2-硫尿嘧啶，2-硫胸腺嘧啶和2-硫胞嘧啶，5-卤尿嘧啶和胞嘧啶，5-丙炔尿嘧啶和胞嘧啶，6-偶氮尿嘧啶、胞嘧啶和胸腺嘧啶，5-尿嘧啶(假尿嘧啶)，4-硫尿嘧啶，8-卤代、8-氨基、8-硫醇、8-硫代烷基、8-羟基和其他8-取代的腺嘌呤和鸟嘌呤，5-卤代尤其是5-溴、5-三氟甲基和其他的5-取代的尿嘧啶和胞嘧啶，7-甲基鸟嘌呤和7-甲基腺嘌呤，8-氮杂鸟嘌呤和8-氮杂腺嘌呤，7-脱氮鸟嘌呤和7-脱氮杂腺嘌呤，以及3-脱氮鸟嘌呤和3-脱氮杂腺嘌呤。

此外，核碱基包括美国专利号3,687,808中披露的那些，在“The ConciseEncyclopedia of Polymer Science and Engineering[高分子科学和工程简明百科全书],第858-859页,Kroschwitz,J.I.编辑,约翰威立国际出版公司(John Wiley&Sons),1990中披露的那些，Englisch等人,Ange.Chemie[应用化学],国际版本(Int’l Ed),(1991)30:613中披露的那些，以及Y.S.Sanghvi,第15章,“Antisense Research andApplications[反义研究和应用]”,第289-302页,Crooke,S.T.和Lebleu,B.编辑,CRC出版社,1993披露的那些。这些核碱基中的某些对提高本披露的寡聚化合物的结合亲和力是特别有用的。这些包括具有2-氨基丙基腺嘌呤、5-丙炔基尿嘧啶和5-丙炔基胞嘧啶的5-取代的嘧啶、6-氮杂嘧啶和N-2、N-6和0-6取代的嘌呤。已报道5-甲基胞嘧啶取代使核酸双链体稳定性提高0.6℃-1.2℃(Y.S.Sanghvi，同上，第276-78页)是碱基取代的实施例，甚至更特别地当与2’-O-甲氧基乙基糖修饰组合时。经修饰的核碱基在以下参考文献中有描述：美国专利号3,687,808、4,845,205、5,130,302、5,134,066、5,175,273、5,367,066、5,432,272、5,457,187、5,459,255、5,484,908、5,502,177、5,525,711、5,552,540、5,587,469、5,596,091、5,614,617、5,681,941、5,750,692、5,763,588、5,830,653、6,005,096和美国专利申请公开2003/0158403。

在一些实施例中，将编码内切核酸酶的向导RNA和/或mRNA(或DNA)化学连接至增强寡核苷酸的活性、细胞分布或细胞摄取的一个或多个部分或缀合物。此类部分包括但不限于脂质部分，诸如胆固醇部分(Letsinger等人,Proc Natl Acad Sci USA[美国国家科学院院刊],(1989)86:6553-56)；胆酸(Manoharan等人,Bioorg Med Chem Let[生物有机化学与医药化学通讯],(1994)4:1053-60)；硫醚，例如己基-S-三苯甲基硫醇(Manoharan等人，Ann N Y Acad Sci[纽约科学会年鉴](1992)660:306-09)和Manoharan等人，Bioorg MedChem Let[生物有机与药物化学快报],(1993)3:2765-70)；巯基胆固醇(Oberhauser等人,Nucl Acids Res[核酸研究](1992)20:533-538)；脂肪链，例如十二烷二醇或十一烷基残基(Kabanov等人,FEBS Lett.[欧洲生化学会联合会快报],(1990)259:327-330和Svinarchuk等人,Biochimie[生物化学](1993)75:49-54)；磷脂，例如二-十六烷基-外消旋-甘油或三乙铵1,2-二-O-十六烷基-外消旋-甘油基-3-H-膦酸酯(Manoharan等人,Tetrahedron Lett[四面体通讯](1995)36:3651-54和Shea等人,Nucl Acids Res[核酸研究](1990)18:3777-83)；聚胺或聚乙二醇链(Mancharan等人,Nucleosides&Nucleotides[核苷与核苷酸],(1995)14:969-73)；金刚烷乙酸(Manoharan等人,Tetrahedron Lett[四面体通讯],(1995)36:3651-54)；棕榈基部分(Mishra等人,Biochim Biophys Acta[生物化学与生物物理学学报],(1995)1264:229-37)；或十八烷基胺或己氨基-羰基-t-羟胆固醇部分(Crooke等人,JPharmacol Exp Ther[药理学与实验疗法杂志](1996)277:923-37)。另见美国专利号4,828,979、4,948,882、5,218,105、5,525,465、5,541,313、5,545,730、5,552,538、5,578,717；5,580,731、5,580,731、5,591,584、5,109,124、5,118,802、5,138,045、5,414,077、5,486,603、5,512,439、5,578,718、5,608,046、4,587,044、4,605,735、4,667,025、4,762,779、4,789,737、4,824,941、4,835,263、4,876,335、4,904,582、4,958,013、5,082,830、5,112,963、5,214,136、5,082,830、5,112,963、5,214,136、5,245,022、5,254,469、5,258,506、5,262,536、5,272,250、5,292,873、5,317,098、5,371,241、5,391,723、5,416,203、5,451,463、5,510,475、5,512,667、5,514,785、5,565,552、5,567,810、5,574,142、5,585,481、5,587,371、5,595,726、5,597,696、5,599,923、5,599,928和5,688,941。

在一些实施例中，糖和其他部分可用于将具有核苷酸的蛋白和复合物(诸如阳离子多核糖体和脂质体)靶向至特定位点。例如，肝细胞定向转移可以经由脱唾液酸糖蛋白受体(ASGPR)介导；参见例如，Hu等人,Protein Pept Lett[蛋白和肽快报](2014)21(10):1025-30。可以使用本领域已知的其他系统来将本情况中使用的生物分子和/或其复合物靶向至特定的目标靶细胞。

在一些实施例中，这些靶向部分或缀合物可以包括共价结合至官能团诸如伯羟基或仲羟基的缀合物基团。本披露的缀合物基团包括嵌入剂、报告分子、聚胺、聚酰胺、聚乙二醇、聚醚、增强寡聚物的药效学特性的基团，和增强寡聚物的药代动力学特性的基团。示例性缀合物基团包括胆固醇、脂质、磷脂、生物素、吩嗪、叶酸、菲啶、蒽醌、吖啶、荧光素、罗丹明、香豆素和染料。在本披露的背景下，增强药效学特性的基团包括改善摄取、增强对降解的抗性、和/或加强与靶核酸的序列特异性杂交的基团。在本披露的背景下，增强药代动力学特性的基团包括改善本披露的化合物的摄取、分布、代谢或排泄的基团。代表性缀合物基团披露于1992年10月23日提交的国际专利申请号PCT/US 92/09196和美国专利号6,287,860中，将其通过援引并入本文。缀合物部分包括但不限于脂质部分(如胆固醇部分)、胆酸、硫醚(例如己基-5-三苯甲基硫醚)、巯基胆固醇、脂肪链(例如十二烷二醇或十一基残基)、磷脂(例如二-十六基-外消旋-甘油或三乙铵l,2-二-O-十六基-外消旋-甘油-3-H-膦酸酯)、多胺或聚乙二醇链、或金刚烷乙酸、棕榈基部分、或十八烷基胺、或己基氨基-羰基-氧基胆固醇部分。参见例如，美国专利号4,828,979、4,948,882、5,218,105、5,525,465、5,541,313、5,545,730、5,552,538、5,578,717；5,580,731、5,580,731、5,591,584、5,109,124、5,118,802、5,138,045、5,414,077、5,486,603、5,512,439、5,578,718、5,608,046、4,587,044、4,605,735、4,667,025、4,762,779、4,789,737、4,824,941、4,835,263、4,876,335、4,904,582、4,958,013、5,082,830、5,112,963、5,214,136、5,082,830、5,112,963、5,214,136、5,245,022、5,254,469、5,258,506、5,262,536、5,272,250、5,292,873、5,317,098、5,371,241、5,391,723、5,416,203、5,451,463、5,510,475、5,512,667、5,514,785、5,565,552、5,567,810、5,574,142、5,585,481、5,587,371、5,595,726、5,597,696、5,599,923、5,599,928和5,688,941。

不太适合化学合成并且通常通过酶促合成产生的更长多核苷酸也可以通进行修饰。此类修饰可以包括例如某些核苷酸类似物的引入，在分子的5’或3’端并入特定的序列或其他部分，以及其他修饰。举例说明，编码Cas9的mRNA的长度大约为4kb，并且可以通过体外转录来合成。对mRNA的修饰可用于例如增加其翻译或稳定性(如通过增加其对被细胞降解的抗性)、或降低RNA引发通常在细胞中引入外源RNA(特别是较长的RNA，如编码Cas9的RNA)后观察到的先天免疫应答的趋势。

在本领域中已经描述了许多这样的修饰，如polyA尾、5’帽类似物(例如，抗反向帽类似物(ARCA)或m7G(5’)ppp(5’)G(mCAP))、经修饰的5’或3’非翻译区(UTR)、使用经修饰的碱基(如假UTP、2-硫-UTP、5-甲基胞嘧啶-5’-三磷酸酯(5-甲基-CTP)或N6-甲基-ATP)、或用磷酸酶处理以去除5’末端磷酸酯。这些修饰和其他修饰是本领域已知的，并且定期开发RNA的新修饰。

已经报道，体内递送的经化学修饰的mRNA可用于实现改善的治疗效果；参见例如，Kormann等人,Nature Biotechnol[自然生物技术](2011)29:154-57。此类修饰可用于例如增加RNA分子的稳定性和/或降低其免疫原性。使用化学修饰(如假U、N6-甲基-A、2-硫-U和5-甲基-C)发现分别用2-硫-U和5-甲基-C取代尿苷和胞苷残基的四分之一导致小鼠中toll样受体(TLR)介导的mRNA识别显著降低。通过减少先天免疫系统的激活，这些修饰可用于有效提高体内mRNA的稳定性和寿命；参见例如，Kormann等人，同上。

还已报道重复施用合成的信使RNA(并入了旨在绕过先天抗病毒应答的修饰)可以将分化的人类细胞重新编程为具有多能性。参见例如，Warren等人,Cell Stem Cell[细胞-干细胞](2010)7(5):618-30。充当初级重编程蛋白的此类经修饰的mRNA可成为重编程多种人类细胞类型的有效手段。此类细胞称为诱导多能干细胞(iPSC)，并且发现并入5-甲基-CTP、假UTP和抗反向帽类似物(ARCA)的酶促合成的RNA可用于有效逃避细胞的抗病毒应答；参见例如，Warren等人，同上。

本领域描述的多核苷酸的其他修饰包括例如使用聚A尾、添加5’帽类似物(诸如m7G(5’)ppp(5’)G(mCAP))、对5’或3’非翻译区(UTR)的修饰，以及用磷酸酶处理以去除5’端磷酸酯。

已经结合对RNAi(包括siRNA)的修饰开发了适用于产生用于本文的经修饰的RNA的许多组合物和技术。siRNA在体内面临特别的挑战，因为它们经由mRNA干扰对基因沉默的影响通常是暂时的，可能需要重复施用。另外，siRNA是双链RNA(dsRNA)，并且哺乳动物免疫应答已经进化为检测和中和dsRNA，该dsRNA通常是病毒感染的副产物。因此，存在可以介导对dsRNA的细胞应答的哺乳动物酶如PKR(dsRNA响应激酶)和潜在视黄酸诱导型基因I(RIG-I)，以及可响应于此类分子而触发对细胞因子的诱导的Toll样受体(如TLR3、TLR7和TLR8)；参见例如以下综述：Angart等人,Pharmaceuticals[药物](Basel)(2013)6(4):440-68；Kanasty等人,Mol Ther[分子疗法](2012)20(3):513-24；Burnett等人,Biotechnol J[生物技术杂志](2011)6(9):1130-46；Judge和MacLachlan,Hum Gene Ther[人类基因疗法](2008)19(2):111-24；以及其中引用的参考文献。

如本文所述，已经开发出多种修饰并将其应用于提高RNA稳定性、减少先天免疫应答、和/或获得可用于结合将多核苷酸引入人类细胞中的其他益处；参见例如以下综述：K.A.Whitehead等人，Ann Rev Chem Biomol Eng[化学与生物分子工程年度报告](2011)2:77-96；Gaglione和Messere,Mini Rev Med Chem[药物化学简评](2010)10(7):578-95；Chernolovskaya等人,Curr Opin Mol Ther[分子治疗学最新观点](2010)12(2):158-67；Deleavey等人,Curr Protoc Nuc Acid Chem[核酸化学实验操作手册]，第16章：第16.3单元(2009)；Behlke,Oligonucleotides[寡核苷酸](2008)18(4):305-19；Fucini等人,Nucleic Acid Ther[核酸疗法](2012)22(3):205-210；Bremsen等人,Front Genet[基因学前沿](2012)3:154。

存在许多经修饰的RNA的商业供应商，其中许多专门从事于旨在改善siRNA有效性的修饰。基于文献中报道的发现，提供了多种方法。例如，Dharmacon指出，用硫(硫代磷酸酯，PS)替换非桥连氧已被广泛用于改善siRNA的核酸酶抗性，如Kole在Nature Rev DrugDisc[自然评论：药物发现](2012)11:125-40所报道的。已经报道核糖2’-位置的修饰可改善核苷酸间磷酸键的核酸酶抗性，同时增加双链体稳定性(T_m)，还已经报道这可提供保护免受免疫激活。适度的PS骨架修饰与小的、良好耐受的2’-取代(2’-O-甲基、2’-氟、2’-氢)的组合与用于体内应用的高度稳定的siRNA相关，如Soutschek等人Nature[自然](2004)432:173-78所报道的；并且已经报道2’-O-甲基修饰有效改善稳定性，如通过Volkov,Oligonucleotides[寡核苷酸](2009)19:191-202所报道的。关于减少对先天免疫应答的诱导，据报道用2’-O-甲基、2’-氟、2’-氢修饰特定序列可减少TLR7/TLR8相互作用，同时通常保持沉默活性；参见例如Judge等人，Mol Ther[分子疗法](2006)13:494-505；以及Cekaite等人，J Mol Biol[分子生物学杂志](2007)365:90-108。还已报道其他修饰(诸如2-硫尿嘧啶、假尿嘧啶、5-甲基胞嘧啶、5-甲基尿嘧啶和N⁶-甲基腺苷)可最小化由TLR3、TLR7和TLR8介导的免疫作用；参见例如K.Kariko等人，Immunity[免疫力](2005)23:165-75。

还如本领域中已知的并且可商购的，可以将许多缀合物应用于本文使用的多核苷酸(如RNA)，以增强这些缀合物的递送和/或细胞摄取，这些缀合物包括例如胆固醇、生育酚和叶酸、脂质、肽、聚合物、接头和适体；参见例如，Winkler,Ther.Deliv.[治疗递送](2013)4:791-809，及其中引用的参考文献。

递送

在一些实施例中，将本文提供的方法中使用的任何核酸分子，例如编码本披露的靶向基因组的核酸和/或定点多肽的核酸包装到递送载体中或表面上，以递送至细胞。递送媒介物包括但不限于纳米球、脂质体、量子点、纳米颗粒、聚乙二醇颗粒、水凝胶和胶束。如本领域中所述，多种靶向部分可用于增强此类媒介物与所需细胞类型或位置的优先相互作用。

本披露的复合物、多肽和核酸可以通过以下方式引入细胞中：病毒或噬菌体感染、转染、缀合、原生质体融合、脂质转染、电穿孔、核转染、磷酸钙沉淀、聚乙烯亚胺(PEI)介导的转染、DEAE-葡聚糖介导的转染、脂质体介导的转染、基因枪技术、磷酸钙沉淀、直接微量注射、纳米颗粒介导的核酸递送等。

在实施例中，向导RNA多核苷酸(RNA或DNA)和/或内切核酸酶多核苷酸(RNA或DNA)通过本领域已知的病毒或非病毒递送媒介物递送。替代性地，可以通过本领域已知的病毒或非病毒递送媒介物，诸如电穿孔或脂质纳米颗粒来递送定点多肽。在一些实施例中，DNA内切核酸酶作为一种或多种多肽单独地或与一种或多种gRNA，或一种或多种crRNA与tracrRNA一起预复合地递送。

在实施例中，多核苷酸通过非病毒递送媒介物递送，非病毒递送媒介物包括但不限于纳米颗粒、脂质体、核糖核蛋白、带正电的肽、小分子RNA-缀合物、适体-RNA嵌合体和RNA-融合蛋白复合物。一些示例性非病毒递送媒介物在Peer和Lieberman,Gene Ther[基因疗法](2011)18:1127-33(其重点是用于siRNA的非病毒递送媒介物也可用于递送其他多核苷酸)中有描述。

在实施例中，多核苷酸(诸如向导RNA、sgRNA和编码内切核酸酶的mRNA)通过脂质纳米颗粒(LNP)递送至细胞或受试者。

虽然已经在动物模型和人类中都测试了几种用于核酸的非病毒递送方法，但是最完善的系统是脂质纳米颗粒。LNP通常由可电离的阳离子脂质和三种或更多种附加组分组成，这些附加组分通常为胆固醇、DOPE和含聚乙二醇(PEG)的脂质(参见例如实例1)。阳离子脂质可以与带正电的核酸结合，从而形成避免核酸被降解的致密复合物。在通过微流体系统期间，这些组分自组装以形成大小范围为50至150nM的颗粒，其中核酸包封在与阳离子脂质复合的核中并被脂质双层样结构包围。注射入受试者的循环后，这些颗粒可以与载脂蛋白E(apoE)结合。ApoE是LDL受体的配体，并经由受体介导的内吞作用介导摄取到肝脏的肝细胞中。已经报道这种类型的LNP可有效地将mRNA和siRNA递送至啮齿动物、灵长类动物和人的肝脏的肝细胞。在内吞作用后，LNP存在于内体中。包封的核酸经历了由阳离子脂质的可电离性质介导的内体逃逸过程。这样将核酸递送到细胞质中，在细胞质中mRNA可以翻译成所编码的蛋白。因此，在一些实施例中，将gRNA和编码Cas9的mRNA包封到LNP中用于在静脉注射后将两种组分有效地递送至肝细胞。内体逃逸后，Cas9 mRNA翻译成Cas9蛋白，并且与gRNA形成复合物。在一些实施例中，将核定位信号包含在Cas9蛋白序列中促进Cas9蛋白/gRNA复合物向核的易位。替代性地，小gRNA穿过核孔复合物，并与核中的Cas9蛋白形成复合物。一旦处于核中，gRNA/Cas9复合物就会扫描基因组中的同源靶位点，并优先在基因组中的所需靶位点处产生双链断裂。RNA分子在体内的半衰期很短，大约数小时至数天。类似地，蛋白的半衰期往往很短，大约数小时至数天。因此，在一些实施例中，使用LNP递送gRNA和Cas9 mRNA可以仅引起gRNA/Cas9复合物的瞬时表达和活性。在一些实施例中，这可以提供降低脱靶裂解频率的优点，从而使遗传毒性的风险降至最低。LNP通常免疫原性低于病毒颗粒。虽然许多人对AAV有预先存在的免疫力，但对LNP却没有预先存在的免疫力。不太可能发生针对LNP的额外适应性免疫应答，这使得能够重复进行LNP给药。

当向受试者施用基于基因编辑的基因疗法(其中将治疗性编码序列整合到宿主基因组基因座，诸如安全港基因座中)时，达到为受试者提供最佳治疗益处的基因表达水平将是有利的。例如，在血友病A中，血液中最理想的FVIII蛋白水平将在正常水平的20％至100％、30％至100％、40％至100％或50％至100％的范围内。使用强启动子驱动来自AAV基因组的游离型拷贝的治疗性编码序列的表达的基于AAV的标准基因疗法，无法实现对所达到的表达水平的控制，因为AAV病毒只可以给药一次，并且所达到的表达水平在受试者之间显著不同(S.Rangarajan等人,N Engl J Med[新英格兰医学杂志](2017)377:2519-30)。对受试者进行AAV病毒给药后，他或她会产生针对病毒衣壳蛋白的高滴度抗体，基于临床前模型，这些抗体预计会阻止病毒的有效重新施用(H.Petry等人,Gene Ther[基因疗法](2008)15:54-60)。通过AAV病毒而递送的治疗基因整合到基因组中的安全港基因座诸如白蛋白内含子1并且这种靶向整合经由在基因组中产生双链断裂而发生的一种方法提供了控制靶向整合水平，从而控制治疗性编码序列产物水平的机会。在通过包封含有编码合成FVIII的供体DNA盒的AAV基因组的AAV转导肝脏之后，AAV基因组在转导细胞的细胞核内维持游离状态。这些游离型AAV基因组随时间推移相对稳定，因此为在由CRISPR/Cas9产生的双链断裂处进行靶向整合提供了供体模板库。

已经开发出几种不同的可电离的阳离子脂质用于LNP。这些包括C12-200(K.T.Love等人，Proc Natl Acad Sci USA[美国国家科学院院刊](2010)107:1864-69)、MC3(M.Jayaraman等人，Angew Chem Int Ed Engl[德国应用化学](2012)51:8529-33)、LN16和MD1(Fougerolles等人，美国专利号8754062)等。C12-200是1,1’-((2-(4-(2-((2-(双(2-羟基十二烷基)氨基)乙基)(2-羟基十二烷基)氨基)乙基)哌嗪-1-基)乙基)氮烷二基)双(十二烷-2-醇)。在一种类型的LNP中，GalNac部分附接到LNP的外部，并充当经由脱唾液酸糖蛋白受体摄取到肝脏中的配体。这些阳离子脂质中的任一种均可用于配制LNP，以将gRNA和Cas9 mRNA递送至肝脏。

在一些实施例中，LNP的直径小于约1000nm、500nm、250nm、200nm、150nm、100nm、75nm、50nm或25nm。替代性地，纳米颗粒的大小范围可以是约1-1000nm、1-500nm、1-250nm、25-200nm、25-100nm、35-75nm或25-60nm。

LNP可以由阳离子、阴离子或中性脂质制成。中性脂质(诸如融合磷脂DOPE或膜组分胆固醇)可以作为“辅助脂质”包含在LNP中，以增强转染活性和纳米颗粒稳定性。阳离子脂质的局限性可以包括由于稳定性差和快速清除以及产生炎性反应或抗炎反应而导致的功效低下。LNP还可以具有疏水性脂质、亲水性脂质，或者具有疏水性和亲水性脂质两者。

本领域已知的任何脂质或脂质组合均可用于产生LNP。用于产生LNP的脂质的实例包括：DOTMA、DOSPA、DOTAP、DMRIE、DC-胆固醇、DOTAP-胆固醇、GAP-DMORIE-DPyPE和GL67A-DOPE-DMPE-聚乙二醇(PEG)。阳离子脂质的实例包括98N12-5、C12-200、DLin-KC2-DMA(KC2)、DLin-MC3-DMA(MC3)、XTC、MD1和7C1。中性脂质的实例包括DPSC、DPPC、POPC、DOPE和SM。PEG修饰的脂质的实例包括PEG-DMG、PEG-CerC14和PEG-CerC20。

在实施例中，脂质可以以任何数目的摩尔比组合以产生LNP。另外，一种或多种多核苷酸可以以宽范围的摩尔比与一种或多种脂质组合以产生LNP。

在实施例中，定点多肽和靶向基因组的核酸可各自单独施用于细胞或受试者。定点多肽可以与一种或多种向导RNA、或者一种或多种crRNA以及tracrRNA预复合。然后可以将预复合材料施用至细胞或受试者。这种预复合材料称为核糖核蛋白颗粒(RNP)。

RNA能够与RNA或DNA形成特异性相互作用。虽然在许多生物学过程中都利用了这种特性，但它也伴随着在富含核酸的细胞环境中发生混杂相互作用的风险。该问题的一种解决方案是形成核糖核蛋白颗粒(RNP)，其中RNA与内切核酸酶预复合。RNP的另一个益处是避免RNA被降解。

在一些实施例中，RNP中的内切核酸酶是经修饰的或未修饰的。同样，gRNA、crRNA、tracrRNA或sgRNA可以是经修饰的或未修饰的。许多修饰是本领域已知的并且可以使用。

内切核酸酶和sgRNA通常以约1:1的摩尔比组合。替代性地，内切核酸酶、crRNA和tracrRNA可以以约1:1:1的摩尔比组合。然而，可以使用宽范围的摩尔比来生产RNP。

在一些实施例中，将重组AAV载体用于递送。用于产生rAAV颗粒的技术(其中向细胞提供待包装的AAV基因组(其包括待递送的多核苷酸、rep和cap基因以及辅助病毒功能))在本领域是标准的。产生rAAV需要单个细胞(本文称为包装细胞)内存在以下组分：rAAV基因组，与rAAV基因组分开(即不在其中)的AAV rep和cap基因，以及辅助病毒功能。AAV rep和cap基因可以来自可衍生重组病毒的任何AAV血清型，并且可以来自与rAAV基因组ITR不同的AAV血清型，包括但不限于AAV血清型AAV-1、AAV-2、AAV-3、AAV-4、AAV-5、AAV-6、AAV-7、AAV-8、AAV-9、AAV-10、AAV-11、AAV-12、AAV-13和AAV rh.74。假型rAAV的产生在例如国际专利申请WO 01/83692中披露。参见表1。

表1.选定的AAV的AAV血清型和基因库登录号。

AAV血清型	基因库登录号
		AAV-1	NC_002077.1
AAV-2	NC_001401.2
		AAV-3	NC_001729.1
AAV-3B	AF028705.1
		AAV-4	NC_001829.1
AAV-5	NC_006152.1
		AAV-6	AF028704.1
AAV-7	NC_006260.1
		AAV-8	NC_006261.1
AAV-9	AX753250.1
		AAV-10	AY631965.1
AAV-11	AY631966.1
		AAV-12	DQ813647.1
AAV-13	EU285562.1

在一些实施例中，产生包装细胞的方法，对于AAV颗粒产生而言，涉及产生稳定表达必需组分的细胞系。例如，将具有以下项的质粒(或多个质粒)整合到细胞的基因组中：缺少AAV rep和cap基因的rAAV基因组，与rAAV基因组分开的AAV rep和cap基因，以及选择性标记(诸如新霉素耐药性基因)。已经通过诸如GC加尾(R.J.Samulski等人，Proc Natl AcadSci USA[美国国家科学院院刊](1982)79:2077-81)，添加含有限制性内切核酸酶裂解位点的合成接头(C.A.Laughlin等人，Gene[基因](1983)23:65-73)，以及通过直接平端连接(P.Senapathy等人，J Biol Chem[生物化学杂志](1984)259:4661-66)等程序将AAV基因组引入到细菌质粒中。然后用辅助病毒(诸如腺病毒)感染包装细胞系。该方法的优点是，细胞是可选择的，并且适合rAAV的大规模生产。其他合适的方法采用腺病毒或杆状病毒而不是质粒来将rAAV基因组和/或rep和cap基因引入包装细胞中。

产生rAAV的一般原理在例如B.J.Carter,Cur Op Biotechnol[生物技术当前述评](1992)3(5):533-39；以及N.Muzyczka,Curr Topics Microbiol Immunol[微生物学和免疫学的当前主题](1992)158:97-129)中有综述。在以下参考文献中描述了一些方法：J.D.Tratschin等人,Mol Cell Biol[分子细胞生物学](1984)4:2072-81；P.L.Hermonat等人,Proc Natl Acad Sci USA[美国国家科学院院刊](1984)81:6466-70；J.D.Tratschin等人,Mol Cell Biol[分子细胞生物学](1985)5:3251-60；S.K.McLaughlin等人,J Virol[病毒学杂志](1988)62:1963-73；J.S.Lebkowski等人,Mol Cell Biol[分子细胞生物学](1988)8:3988-96；R.J.Samulski等人,J Virol[病毒学杂志](1989)63:3822-28)；美国专利号5,173,414；WO 95/13365和对应的美国专利号5,658.776；WO 95/13392；WO 96/17947；PCT/US 98/18600；WO 97/09441(PCT/US 96/14423)；WO 97/08298(PCT/US 96/13872)；WO97/21825(PCT/US 96/20777)；WO 97/06243(PCT/FR 96/01064)；WO 99/11764；P.Perrin等人,Vaccine[疫苗](1995)13:1244-50；R.W.Paul等人,Human Gene Ther[人类基因疗法](1993)4:609-15；Clark等人,Gene Ther[基因疗法](1996)3:1124-32；美国专利号5,786,211；美国专利号5,871,982；和美国专利号6,258,595。

AAV载体血清型可以与靶细胞类型匹配。例如，以下示例性细胞类型可以用其中的指定AAV血清型进行转导。例如，适于肝脏组织/细胞类型的AAV载体的血清型包括但不限于AAV3、AAV5、AAV8和AAV9。

除了腺相关病毒载体，还可以使用其他病毒载体。此类病毒载体包括但不限于慢病毒、α病毒、肠病毒、瘟病毒、杆状病毒、疱疹病毒、EB病毒、乳多空病毒(papovavirus)、痘病毒、疫苗病毒和单纯疱疹病毒。

在一些实施例中，将Cas9 mRNA、靶向白蛋白基因中一个或两个基因座的sgRNA和供体DNA各自单独地配制为脂质纳米颗粒，或全部共同配制为一个脂质纳米颗粒，或共同配制为两个或更多个脂质纳米颗粒。

在一些实施例中，将Cas9 mRNA配制为脂质纳米颗粒，而sgRNA和供体DNA以AAV载体递送。在一些实施例中，将Cas9 mRNA和sgRNA共同配制为脂质纳米颗粒，而将供体DNA以AAV载体递送。

可以选择以DNA质粒、mRNA或蛋白的形式递送Cas9核酸酶。向导RNA可以从相同的DNA表达，或者也可以作为RNA递送。可以对RNA进行化学修饰以改变或改善其半衰期、或降低免疫应答的可能性或程度。内切核酸酶蛋白可以在递送前与gRNA复合。病毒载体允许有效递送：分离的Cas9型式和较小的Cas9直系同源物可以包装在AAV中，用于HDR的供体也可以包装在AAV中。还存在可以递送这些组分中的每一个的一系列非病毒递送方法，或者可以串联使用非病毒和病毒方法。例如，纳米颗粒可用于递送蛋白和向导RNA，而AAV可用于递送供体DNA。

在与递送用于治疗性治疗的基因组编辑组分有关的一些实施例中，将至少以下两种组分递送到待转化的细胞(例如肝细胞)的核中：序列特异性核酸酶和DNA供体模板。在一些实施例中，将供体DNA模板包装到对肝脏具有嗜性的AAV中。在一些实施例中，AAV选自血清型AAV8、AAV9、AAVrh10、AAV5、AAV6或AAV-DJ。在一些实施例中，将AAV包装的DNA供体模板施用给受试者，例如，首先通过外周静脉内注射施用给受试者，然后施用序列特异性核酸酶。先递送AAV包装的供体模板的优点在于，所递送的供体模板将被稳定地保持在转导的肝细胞的核中，这允许随后施用序列特异性核酸酶。这将在基因组中产生双链断裂，随后通过HDR或NHEJ整合供体模板。在一些实施例中，期望序列特异性核酸酶仅在促进转基因以达到所需治疗效果的足够水平靶向整合所需的时间内在靶细胞中保持活性。如果序列特异性核酸酶在细胞中保持活性较长时间，这将导致脱靶位点处双链断裂的频率增加。具体地说，脱靶裂解的频率是脱靶切割效率乘以核酸酶具有活性的时间的函数。由于mRNA和翻译的蛋白在细胞中的寿命很短，因此以mRNA形式递送序列特异性核酸酶导致核酸酶活性持续时间很短，在几小时至几天的范围内。因此，预计将序列特异性核酸酶递送至已经含有供体模板的细胞中会导致靶向整合相对于脱靶整合的更佳比率。另外，在外周静脉注射后，AAV介导供体模板递送至肝细胞核需要时间，通常大约为1至14天，这是因为病毒感染细胞，使内体逃逸并转运至细胞核并通过宿主组分将单链AAV基因组转化为双链DNA分子需要时间。因此，在一些实施例中，在提供CRISPR/Cas9组分之前完成供体模板向细胞核的递送，因为这些核酸酶组分将仅在约1至3天内有活性。

在一些实施例中，DNA内切核酸酶是CRISPR/Cas9，其由针对白蛋白基因内含子1内的DNA序列的sgRNA与Cas9核酸酶一起组成。在一些实施例中，Cas9内切核酸酶作为编码可操作地融合至一个或多个核定位信号(NLS)的Cas9蛋白的mRNA递送。在一些实施例中，sgRNA和Cas9 mRNA包装在脂质纳米颗粒中递送至肝细胞。在一些实施例中，脂质纳米颗粒含有脂质C12-200(K.T.Love等人，Proc Natl Acad Sci USA[美国国家科学院院刊](2010)107:1864-69)。在一些实施例中，包装在LNP中的sgRNA与Cas9mRNA的比率为1:1(质量比)，在小鼠体内引起最大限度的DNA裂解。在替代性实施例中，可以使用包装在LNP中的sgRNA与Cas9 mRNA的不同质量比，例如10:1、9:1、8:1、7:1、6:1、5:1、4:1、3:1或2:1或反向比率。在一些实施例中，将Cas9 mRNA和sgRNA包装到单独的LNP配制品中，并且在含有sgRNA的LNP之前约1至约8小时将含有Cas9 mRNA的LNP递送至受试者，以在递送sgRNA之前留出翻译Cas9mRNA的最佳时间。

在一些实施例中，将包封gRNA和Cas9 mRNA的LNP配制品(“LNP-核酸酶配制品”)施用于受试者，例如先前施用了包装到AAV中的DNA供体模板的受试者。在一些实施例中，在施用AAV供体模板后的1天至28天内，或7天至28天内，或7天至14天内将LNP-核酸酶配制品施用于受试者。相对于AAV供体模板，LNP-核酸酶配制品的最佳递送时间可以使用本领域已知的技术来确定，例如在包括小鼠和猴子在内的动物模型中进行的研究。

在一些实施例中，使用非病毒递送方法将DNA-供体模板递送至受试者(例如受试者)的肝细胞。虽然一些受试者(通常为30％)具有针对最常用的AAV血清型的预先存在的中和抗体，从而阻止了AAV的有效基因递送，但是所有受试者均可通过非病毒递送方法治疗。在本领域中已知几种非病毒递送方法。具体而言，已知LNP在动物和人类中静脉注射后，有效地将其包封的货物递送至肝细胞的细胞质。这些LNP通过受体介导的内吞作用过程被肝脏主动吸收，导致优先摄取到肝脏中。

在一些实施例中，为了促进供体模板的核定位，可以促进质粒的核定位的DNA序列，例如猿猴病毒40(SV40)复制起点和早期启动子的366bp区域可以添加到供体模板上。与细胞蛋白结合的其他DNA序列也可用于改善DNA的核进入。

在一些实施例中，在AAV供体模板之后首次施用例如含有gRNA和Cas9核酸酶或编码Cas9核酸酶的mRNA的LNP-核酸酶配制品之后，测量受试者(例如受试者)血液中引入的FVIII的表达或活性水平。如果FVIII水平不足以治疗疾病，例如水平为正常水平的5％，则可以第二次或第三次施用LNP-核酸酶配制品以促进向基因组安全港基因座的附加靶向整合。可以使用本领域已知的技术，例如使用包括小鼠和猴子在内的动物模型进行的试验来测试和优化使用多个剂量的LNP-核酸酶配制品以获得FVIII的所需治疗水平的可行性。

在一些实施例中，根据本文所述的包括向受试者施用i)包含供体盒的AAV供体模板和ii)LNP-核酸酶配制品的任何方法，在向受试者施用AAV供体模板后的约1天至约28天内向受试者施用初始剂量的LNP-核酸酶配制品。在一些实施例中，在足以允许将供体模板递送至靶细胞核的时间后，向受试者施用初始剂量的LNP-核酸酶配制品。在一些实施例中，在足以允许单链AAV基因组在靶细胞核中转化为双链DNA分子的时间后，向受试者施用初始剂量的LNP-核酸酶配制品。在一些实施例中，在施用初始剂量之后，向受试者施用一个或多个(诸如两个、三个、四个、五个或更多个)附加剂量的LNP-核酸酶配制品。在一些实施例中，向受试者施用一个或多个剂量的LNP-核酸酶配制品，直至达到供体盒的目标靶向整合水平和/或供体盒的目标表达水平。在一些实施例中，该方法进一步包括在每次施用LNP-核酸酶配制品之后测量供体盒的靶向整合水平和/或供体盒的表达水平，并且如果未达到供体盒的目标靶向整合水平和/或供体盒的目标表达水平，则施用附加剂量的LNP-核酸酶配制品。在一些实施例中，这些附加剂量的LNP-核酸酶配制品中的至少一个的量与初始剂量相同。在一些实施例中，这些附加剂量的LNP-核酸酶配制品中的至少一个的量小于初始剂量。在一些实施例中，这些附加剂量的LNP-核酸酶配制品中的至少一个的量大于初始剂量。

经遗传修饰的细胞和细胞群

一方面，本文的披露提供了一种编辑细胞中的基因组，从而产生经遗传修饰的细胞的方法。在一些方面，提供了经遗传修饰的细胞群。因此“经遗传修饰的细胞”是指具有至少一个通过基因组编辑(例如，使用CRISPR/Cas9/Cpf1系统)而引入的遗传修饰的细胞。在一些实施例中，经遗传修饰的细胞是经遗传修饰的肝细胞。本文考虑了具有靶向基因组的外源核酸和/或编码靶向基因组的核酸的外源核酸的经遗传修饰的细胞。

在一些实施例中，可以通过将合成FVIII编码序列的核酸序列插入细胞的基因组序列中来编辑细胞的基因组。在一些实施例中，经受基因组编辑的细胞在基因组中具有一个或多个突变，突变导致内源性FVIII基因的表达与没有此类突变的正常细胞中的表达相比降低。正常细胞可以是来源于(或分离自)没有FVIII基因缺陷的不同受试者的健康细胞或对照细胞。在一些实施例中，经受基因组编辑的细胞可以来源于(或分离自)需要治疗FVIII基因相关病状或病症的受试者。因此，在一些实施例中，这种细胞中内源性FVIII基因的表达与正常细胞中内源性FVIII基因的表达相比降低约10％、约20％、约30％、约40％、约50％、约60％、约70％、约80％、约90％或约100％。

成功插入转基因，例如编码合成FVIII编码序列的核酸后，所引入的合成FVIII编码序列在细胞中的表达与细胞内源FVIII基因的表达相比，可以是至少约10％、约20％、约30％、约40％、约50％、约60％、约70％、约80％、约90％、约100％、约200％、约300％、约400％、约500％、约600％、约700％、约800％、约900％、约1,000％、约2,000％、约3,000％、约5,000％、约10,000％或更多。在一些实施例中，在经基因组编辑的细胞中引入的FVIII编码序列产物(包括合成FVIII编码序列)的活性与细胞内源FVIII基因的表达相比，可以是至少约10％、约20％、约30％、约40％、约50％、约60％、约70％、约80％、约90％、约100％、约200％、约300％、约400％、约500％、约600％、约700％、约800％、约900％、约1,000％、约2,000％、约3,000％、约5,000％、约10,000％或更多。在一些实施例中，所引入的合成FVIII编码序列在细胞中的表达是细胞内源FVIII基因的表达的至少约2倍、约3倍、约4倍、约5倍、约6倍、约7倍、约8倍、约9倍、约10倍、约15倍、约20倍、约30倍、约50倍、约100倍、约1000倍或更多。而且，在一些实施例中，在经基因组编辑的细胞中引入的合成FVIII编码序列产物的活性可以与正常健康细胞中FVIII基因产物的活性相当或更高。

在用于治疗或缓解血友病A的实施例中，用于基因编辑的主要靶标是人细胞。在一些实施例中，在离体方法和体内方法中，人细胞是肝细胞。在一些实施例中，通过在源自有需要的受试者(并因此已经完全与受试者匹配)的自体细胞中进行基因编辑，可以产生细胞，这些细胞可以安全地重新引入受试者体内，并有效地产生在缓解与受试者疾病相关的一种或多种临床状况的方面有效的细胞群。在此类治疗的一些实施例中，根据本领域已知的任何方法分离肝细胞，并用于产生经遗传修饰的、治疗上有效的细胞。在一个实施例中，将肝脏干细胞离体进行遗传修饰，然后重新引入受试者体内，在受试者体内它们将会产生表达插入的FVIII编码序列的经遗传修饰的肝细胞或窦内皮细胞。

治疗方法

血友病分为“轻度”(FVIII蛋白血清浓度为0.40至0.05IU/mL)、“中度”(0.05至0.01IU/mL)或“重度”(<0.01IU/mL，小于正常值的1％)(G.C.White等人,Thromb Haemost[血栓与止血学](2001)85(3):560-75)。对接受FVIII替代蛋白疗法的血友病A患者的分析报告，在预测的FVIII谷水平为正常水平的3％、5％、10％、15％和20％时，没有出血发生的频率分别为71％、79％、91％、97％和100％(G.Spotts等人,Blood[血液](2014)124:689)。这表明当FVIII水平维持在15％至20％的最低水平之上时，出血事件的比率降低到接近于零。虽然治愈血友病A所需的精确FVIII水平尚未定义，并且可能因受试者而异，但预计约5％至约30％的水平会引起出血事件的显著减少。

一方面，本文提供了一种通过编辑受试者的基因组来治疗受试者的血友病A的基因治疗方法。在一些实施例中，该基因治疗方法将功能性合成FVIII编码序列整合到受试者相关细胞类型的基因组中，并且永久治愈血友病A。在一些实施例中，将合成FVIII编码序列整合到肝细胞中，因为这些细胞会有效地表达许多蛋白并分泌到血液中。另外，对于肝脏未生长完全的小儿受试者，可以考虑这种使用肝细胞的整合方法，因为整合的编码序列会随着肝细胞分裂而传递给子细胞。

另一方面，本文提供了使用基因组工程工具通过将合成FVIII编码序列敲入基因座中并恢复FVIII蛋白活性而对基因组产生永久性变化的细胞离体和体内方法。此类方法使用内切核酸酶，诸如CRISPR相关的(CRISPR/Cas9、Cpf1等)核酸酶，使任何序列从基因组中永久性缺失、插入、编辑、矫正或替代，或在基因组基因座中插入外源序列，例如合成FVIII编码序列。以这种方式，本披露中阐述的实例通过单一治疗恢复了FVIII基因的活性(而不是在受试者的一生中都要递送潜在治疗)。

在一些实施例中，基于离体细胞的治疗使用从受试者分离的肝细胞。使用本文所述的材料和方法编辑这些细胞的染色体DNA。最后，将经过编辑的细胞和/或其后代施用或植入受试者中。

离体细胞治疗方法的一个优点是能够在施用前对治疗剂进行全面分析。基于核酸酶的治疗剂具有一定程度的脱靶作用。离体进行基因矫正允许人们能够在施用前表征经矫正的细胞群。本披露的方面包括对矫正细胞的基因组进行测序，以确保任何脱靶切割位于与对受试者的最小风险相关的基因组位置。此外，可以在施用或移植之前筛选或分离出特定细胞群，包括克隆群体。

另一个实施例是基于体内的疗法。在这种方法中，使用本文所述的材料和方法矫正受试者体内细胞的染色体DNA。在一些实施例中，细胞是肝细胞。

体内基因疗法的一个优势是易于产生和施用治疗剂。可以使用相同的治疗方法和疗法来治疗多于一名受试者，例如，共有相同或相似基因型或等位基因的多名受试者。相反，离体细胞疗法通常使用受试者自身的细胞，将这些细胞分离、操纵并返回至同一受试者。

在一些实施例中，该受试者具有血友病A的症状。在一些实施例中，该受试者是怀疑患有血友病A的人。替代性地，该受试者是被诊断为具有血友病A风险的人。在一些实施例中，需要治疗的受试者可以在内源FVIII基因或其调控序列中具有一个或多个遗传缺陷(例如缺失、插入和/或突变)，使得FVIII蛋白的活性(包括表达水平或功能性)，与正常健康受试者相比大大降低。

在一些实施例中，本文提供了一种治疗受试者的血友病A的方法，该方法包括向受试者的细胞提供以下物质：(a)靶向细胞基因组中的白蛋白基因座的gRNA；(b)DNA内切核酸酶或编码该DNA内切核酸酶的核酸；以及(c)包含编码合成FVIII蛋白的核酸序列的供体模板。在一些实施例中，gRNA靶向白蛋白基因的内含子1。在一些实施例中，gRNA包含来自SEQID NO:271-298中任一个的间隔区序列。

在一些实施例中，本文提供了一种治疗受试者的血友病A的方法，该方法包括向受试者的细胞提供以下物质：(a)包含来自SEQ ID NO:271-298中任一个的间隔区序列的gRNA；(b)DNA内切核酸酶或编码该DNA内切核酸酶的核酸；以及(c)包含编码合成FVIII蛋白的核酸序列的供体模板。在一些实施例中，gRNA包含来自SEQ ID NO:274、275、281和283中任一个的间隔区序列。在一些实施例中，gRNA包含来自SEQ ID NO:274的间隔区序列。在一些实施例中，gRNA包含来自SEQ ID NO:275的间隔区序列。在一些实施例中，gRNA包含来自SEQ ID NO:281的间隔区序列。在一些实施例中，gRNA包含来自SEQ ID NO:283的间隔区序列。在一些实施例中，细胞是人细胞，例如人肝脏细胞。在一些实施例中，受试者是患有或怀疑患有血友病A的受试者。在一些实施例中，受试者被诊断为具有血友病A的风险。

在一些实施例中，根据本文所述的治疗血友病A的任何方法，该DNA内切核酸酶选自由以下项组成的组：Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也称为Csn1和Csx12)、Cas100、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4和Cpf1内切核酸酶及其功能等效物。在一些实施例中，DNA内切核酸酶是Cas9。在一些实施例中，Cas9是spCas9。在一些实施例中，Cas9是SluCas9。

在一些实施例中，根据本文所述的治疗血友病A的任何方法，对编码合成FVIII编码序列的核酸序列进行密码子优化以在细胞中表达。在一些实施例中，细胞是人细胞。

在一些实施例中，根据本文所述的治疗血友病A的任何方法，该方法采用编码DNA内切核酸酶的核酸。在一些实施例中，对编码DNA内切核酸酶的核酸进行密码子优化以在细胞中表达。在一些实施例中，细胞是人细胞，例如人肝脏细胞。在一些实施例中，编码DNA内切核酸酶的核酸是DNA，诸如DNA质粒。在一些实施例中，编码DNA内切核酸酶的核酸是RNA，诸如mRNA。

在一些实施例中，根据本文所述的治疗血友病A的任何方法，供体模板在AAV载体中编码。在一些实施例中，供体模板包含供体盒，该供体盒包含编码合成FVIII蛋白的核酸序列，并且该供体盒在一侧或两侧上侧接有gRNA靶位点。在一些实施例中，供体盒在两侧上侧接有gRNA靶位点。在一些实施例中，该gRNA靶位点是所施用的gRNA的靶位点。在一些实施例中，供体模板的gRNA靶位点是施用的gRNA的细胞基因组gRNA靶位点的反向互补序列。在一些实施例中，向该细胞提供该供体模板包括向该受试者施用该供体模板。在一些实施例中，该施用是静脉内。

在一些实施例中，根据本文所述的治疗血友病A的任何方法，DNA内切核酸酶或编码该DNA内切核酸酶的核酸配制在脂质体或LNP中。在一些实施例中，脂质体或LNP还包含gRNA。在一些实施例中，向该细胞提供该gRNA和该DNA内切核酸酶或编码该DNA内切核酸酶的核酸包括向该受试者施用该脂质体或LNP。在一些实施例中，该施用是静脉内。在一些实施例中，该脂质体或LNP是LNP。在一些实施例中，该方法采用LNP，该LNP包含编码DNA内切核酸酶的核酸和gRNA。在一些实施例中，编码DNA内切核酸酶的核酸是编码DNA内切核酸酶的mRNA。

在一些实施例中，根据本文所述的治疗血友病A的任何方法，DNA内切核酸酶与gRNA预复合，形成RNP复合物。

AAV感染细胞(包括肝脏细胞)的过程涉及从内体逃逸，病毒脱壳以及AAV基因组转运至细胞核。在这些研究中使用的AAV的情况下，其中单链基因组包装在病毒中，单链基因组经历第二链DNA合成形成双链DNA基因组的过程。将单链基因组完全转化为双链基因组所需的时间尚未完全确定，但认为是限速步骤(Ferrari等人，J Virol[病毒学杂志](1996)70:3227-34)。然后，双链线性基因组串接成多聚体环状形式，该聚体环状形式由头-尾和尾-头相连的单体组成(Sun等人，Human Gene Ther.[人类基因疗法](2010)21:750-62)。

在一些实施例中，根据本文所述的治疗血友病A的任何方法，在将供体模板提供给细胞之后，将施用的gRNA和施用的DNA内切核酸酶或编码该DNA内切核酸酶的核酸提供给该细胞。在一些实施例中，在将该供体模板提供给该细胞后超过4天，将施用的gRNA和施用的DNA内切核酸酶或编码该DNA内切核酸酶的核酸提供给该细胞。在一些实施例中，在将该供体模板提供给该细胞后至少14天，将gRNA和DNA内切核酸酶或编码该DNA内切核酸酶的核酸提供给该细胞。在一些实施例中，在将该供体模板提供给该细胞后至少17天，将gRNA和DNA内切核酸酶或编码该DNA内切核酸酶的核酸提供给该细胞。在一些实施例中，向细胞提供gRNA和DNA内切核酸酶包括向受试者施用(诸如通过静脉内途径施用)包含编码DNA内切核酸酶的核酸和gRNA的LNP。在一些实施例中，编码DNA内切核酸酶的核酸是编码DNA内切核酸酶的mRNA。在一些实施例中，向细胞提供供体模板包括向受试者施用(诸如通过静脉内途径施用)在AAV载体中编码的供体模板。

在一些实施例中，根据本文所述的治疗血友病A的任何方法，在第一剂量的gRNA和DNA内切核酸酶或编码该DNA内切核酸酶的核酸后，向该细胞提供一个或多个附加剂量的gRNA和DNA内切核酸酶或编码该DNA内切核酸酶的核酸。在一些实施例中，在第一剂量的gRNA和DNA内切核酸酶或编码该DNA内切核酸酶的核酸后，向该细胞提供一个或多个附加剂量的gRNA和DNA内切核酸酶或编码该DNA内切核酸酶的核酸，直至达到该编码合成FVIII蛋白的核酸序列的目标靶向整合水平和/或该编码合成FVIII蛋白的核酸序列的目标表达水平。在一些实施例中，向细胞提供gRNA和DNA内切核酸酶包括向受试者施用(诸如通过静脉内途径施用)包含编码DNA内切核酸酶的核酸和gRNA的脂质纳米颗粒。在一些实施例中，编码DNA内切核酸酶的核酸是编码DNA内切核酸酶的mRNA。

在一些实施例中，根据本文所述的治疗血友病A的任何方法，编码合成FVIII蛋白的核酸序列在内源白蛋白启动子的控制下表达。在一些实施例中，编码合成FVIII蛋白的核酸序列在内源转铁蛋白启动子的控制下表达。在一些实施例中，编码合成FVIII蛋白的核酸序列在内源纤维蛋白原-α链启动子的控制下表达。

在一些实施例中，根据本文所述的治疗血友病A的任何方法，编码合成FVIII蛋白的核酸序列在受试者的肝脏中表达。

将细胞递送至受试者

在一些实施例中，本披露的离体方法涉及将经过基因组编辑的细胞施用到有此需要的受试者中。这可以使用本领域已知的任何肠胃外施用方法来完成。例如，可以将遗传修饰的细胞直接注射到受试者的血液中，直接注射到肝脏中或肝脏附近(植入)，或以其他方式施用于受试者。

在一些实施例中，本文披露的方法包括通过导致引入的细胞至少部分定位在所需部位，以便产生所需效果的方法或途径，将经遗传修饰的治疗细胞植入或“移植”到受试者体内。可以通过任何适当的途径引入治疗细胞或其分化后代，该途径导致递送至受试者中的所需位置，在该位置中至少一部分植入的细胞或细胞组分保持活力。在施用于受试者后，细胞的活力期可以短至数小时(例如二十四小时)、几天，长达数年，或甚至受试者的寿命(即长期植入)。

当以预防方式提供时，本文所述的治疗细胞在血友病A的任何症状之前施用给受试者。因此，在一些实施例中，经遗传修饰的肝细胞群的预防性施用用于预防血友病A症状的发生。

当在一些实施例中以治疗方式提供时，在血友病A症状或指征发作时(或之后)，例如在疾病发作时，提供经遗传修饰的肝细胞。

在一些实施例中，根据本文所述的方法施用的治疗性肝细胞群具有获自一个或多个供体的同种异体肝细胞。“同种异体”是指肝细胞或具有从相同物种的一个或多个不同供体获得的肝细胞的生物样品，其中一个或多个基因座处的基因是不相同的。例如，施用于受试者的肝细胞群可以源自一个或多个不相关的供体受试者，或源自一个或多个不相同的同胞。在一些实施例中，可以使用同基因肝细胞群，诸如从遗传上相同的动物或从同卵双胞胎获得的那些。在其他实施例中，肝细胞是自体细胞；即，这些肝细胞是从受试者获得或分离并施用给相同受试者的，即，供体和受体是相同的。

在一个实施例中，有效量是指预防或减轻血友病A的至少一种或多种体征或症状所需的治疗细胞群的量，并且涉及足以提供所需效果，例如治疗患有血友病A的受试者的组合物的量。因此，在实施例中，治疗有效量是指治疗细胞或具有治疗细胞的组合物，当施用于受试者(诸如患有血友病A或处于血友病A风险中的受试者)时，足以促进特定作用的量。有效量还包括足以预防或延迟疾病症状发展，改变疾病症状过程(例如但不限于，减缓疾病症状的进展)，或逆转疾病症状的量。应当理解，对于任何给定的情况，本领域的普通技术人员可以确定适当的有效量。

为了用于本文所述的实施例中，治疗细胞(例如经基因组编辑的肝细胞)的有效量可以是至少约10²个细胞，至少约5×10²个细胞，至少约10³个细胞，至少约5×10³个细胞，至少约10⁴个细胞，至少约5×10⁴个细胞，至少约10⁵个细胞，至少约2×10⁵个细胞，至少约3×10⁵个细胞，至少约4×10⁵个细胞，至少约5×10⁵个细胞，至少约6×10⁵个细胞，至少约7×10⁵个细胞，至少约8×10⁵个细胞，至少约9×10⁵个细胞，至少约1×10⁶个细胞，至少约2×10⁶个细胞，至少约3×10⁶个细胞，至少约4×10⁶个细胞，至少约5×10⁶个细胞，至少约6×10⁶个细胞，至少约7×10⁶个细胞，至少约8×10⁶个细胞，至少约9×10⁶个细胞，或其倍数。治疗细胞衍生自一个或多个供体、或获得自自体来源。在本文所述的一些实施例中，治疗细胞在施用于有需要的受试者之前在培养中扩增。

在一些实施例中，在患有血友病A的受试者的细胞中表达的功能性FVIII水平的适度和增量增加有益于缓解疾病的一种或多种症状，提高长期存活率和/或减少与其他治疗相关的副作用。在将此类细胞施用于人类受试者后，存在产生更高水平的功能性FVIII的治疗细胞是有益的。在一些实施例中，对受试者的有效治疗产生相对于所治受试者中的总FVIII至少约1％、3％、5％或7％的功能性FVIII。在一些实施例中，功能性FVIII为总FVIII的至少约10％。在一些实施例中，功能性FVIII为总FVIII的至少、约或至多20％、30％、40％、50％、60％、70％、80％、90％或100％。类似地，引入甚至相对有限的功能性FVIII水平显著升高的细胞亚群在受试者中是有益的，因为在一些情况下，标准化细胞相对于患病细胞具有选择优势。然而，即使是适度水平的功能性FVIII水平升高的治疗细胞，也有益于缓解受试者的血友病A的一个或多个方面。在一些实施例中，施用此类细胞的受试者中有约10％、约20％、约30％、约40％、约50％、约60％、约70％、约80％、约90％或更多的治疗剂产生水平增加的功能性FVIII。

在实施例中，通过一种方法或途径将治疗细胞组合物递送至受试者中导致该细胞组合物至少部分定位在所需部位。可以通过在受试者中导致有效治疗的任何适当途径来施用细胞组合物，即，施用导致递送至受试者中的所需位置，在该位置中递送了至少一部分组合物，即，至少约1×10⁴个细胞被递送到所需部位持续一段时间。施用模式包括注射、输注、滴注或摄取。“注射”包括但不限于静脉内、肌内、动脉内、鞘内、心室内、囊内、眶内、心内、真皮内、腹膜内、经气管、皮下、表皮下、关节内、被膜下、蛛网膜下、脊柱内、脑脊髓内和胸骨内注射和输注。在一些实施例中，该途径是静脉内。为了递送细胞，可以通过注射或输注进行施用。

在一个实施例中，全身性施用细胞，换句话说，将治疗细胞群以除直接施用至靶部位、组织或器官以外的方式施用，使其进入受试者的循环系统，从而经受代谢和其他类似过程。

用于治疗血友病A的组合物的治疗功效可以由熟练的临床医师确定。然而，如果任何一种或多种体征或症状，例如功能性FVIII水平以有益的方式发生改变(例如，增加至少10％)，或其他临床上接受的症状或疾病标志物得到改善或缓解，则认为治疗是有效的治疗。功效还可以通过如通过住院治疗或需要医疗干预所评估的个体恶化的失败(例如，疾病进展停止或至少减慢)来测量。测量这些指标的方法是本领域技术人员已知的和/或本文所述的。治疗包括对个体或动物(一些非限制性实例包括人或哺乳动物)中疾病的任何治疗，并包括：(1)抑制疾病，例如阻止或减缓症状的进展；或(2)减轻疾病，例如引起症状消退；以及(3)预防或降低症状发展的可能性。

组合物

一方面，本披露提供了用于实施本文披露的方法的组合物。组合物可以包含以下物质中的一种或多种：靶向基因组的核酸(例如，gRNA)；定点多肽(例如，DNA内切核酸酶)或编码定点多肽的核苷酸序列；以及待插入以实现本文披露的方法的期望遗传修饰的多核苷酸(例如，供体模板)。

在一些实施例中，组合物具有编码靶向基因组的核酸(例如gRNA)的核苷酸序列。

在一些实施例中，组合物具有定点多肽(例如DNA内切核酸酶)。在一些实施例中，组合物具有编码定点多肽的核苷酸序列。

在一些实施例中，组合物具有待插入基因组中的多核苷酸(例如供体模板)。

在一些实施例中，组合物具有(i)编码靶向基因组的核酸(例如gRNA)的核苷酸序列和(ii)定点多肽(例如DNA内切核酸酶)或编码该定点多肽的核苷酸序列。

在一些实施例中，组合物具有(i)编码靶向基因组的核酸(例如gRNA)的核苷酸序列和(ii)待插入基因组中的多核苷酸(例如供体模板)。

在一些实施例中，组合物具有(i)定点多肽(例如DNA内切核酸酶)或编码该定点多肽的核苷酸序列，和(ii)待插入基因组中的多核苷酸(例如供体模板)。

在一些实施例中，组合物具有(i)编码靶向基因组的核酸的核苷酸序列，(ii)定点多肽或编码该定点多肽的核苷酸序列，和(iii)待插入基因组中的多核苷酸(例如供体模板)。

在任何上述组合物的一些实施例中，该组合物具有靶向基因组的单分子向导核酸。在任何上述组合物的一些实施例中，该组合物具有靶向基因组的双分子核酸。在任何上述组合物的一些实施例中，该组合物具有两个或更多个双分子向导或单分子向导。在一些实施例中，组合物具有编码靶向核酸的核酸的载体。在一些实施例中，靶向基因组的核酸是DNA内切核酸酶，尤其是Cas9。

在一些实施例中，组合物含有一种或多种适于基因组编辑，尤其是适于将合成FVIII编码序列插入细胞基因组中的gRNA。该组合物的gRNA可以靶向内源白蛋白基因处、内部或附近的基因组位点。在一些实施例中，gRNA在白蛋白基因处、内部或附近具有与基因组序列互补的间隔区序列。

在一些实施例中，组合物的gRNA是选自SEQ ID NO:271-298中任一个的序列及其变体，这些变体与SEQ ID NO:271-298中任一个具有至少约50％、约55％、约60％、约65％、约70％、约75％、约80％、约85％、约90％或约95％的同一性或同源性。在一些实施例中，gRNA的变体与SEQ ID NO:271-298中的任一个具有至少约85％的同源性。

在一些实施例中，组合物的gRNA具有与基因组中的靶位点互补的间隔区序列。在一些实施例中，间隔区序列的长度为15个碱基至20个碱基。在一些实施例中，间隔区序列与基因组序列之间的互补性为至少约80％、至少约85％、至少约90％、至少约95％、至少约96％、至少约97％、至少约98％、至少约99％或约100％。

在一些实施例中，组合物具有DNA内切核酸酶或编码该DNA内切核酸酶的核酸和/或具有合成FVIII编码序列的核酸序列的供体模板。在一些实施例中，DNA内切核酸酶是Cas9。在一些实施例中，编码该DNA内切核酸酶的核酸是DNA或RNA。

在一些实施例中，任何寡核苷酸或核酸序列中的一个或多个在AAV载体中编码。因此，在一些实施例中，gRNA在AAV载体中编码。在一些实施例中，编码DNA内切核酸酶的核酸在AAV载体中编码。在一些实施例中，供体模板在AAV载体中编码。在一些实施例中，两个或更多个寡核苷酸或核酸序列在单个AAV载体中编码。因此，在一些实施例中，gRNA序列和编码DNA内切核酸酶的核酸在单个AAV载体中编码。

在一些实施例中，组合物具有脂质体或脂质纳米颗粒。因此，在一些实施例中，可以将组合物的任何化合物(例如DNA内切核酸酶或编码DNA内切核酸酶的核酸、gRNA和供体模板)配制在脂质体或LNP中。在一些实施例中，一种或多种这样的化合物经由共价键或非共价键与脂质体或LNP缔合。在一些实施例中，任何化合物单独地或一起包含在脂质体或LNP中。因此，在一些实施例中，将DNA内切核酸酶或编码DNA内切核酸酶的核酸、gRNA和供体模板中的每一种单独地配制在脂质体或LNP中。在一些实施例中，将DNA内切核酸酶与gRNA一起配制在脂质体或LNP中。在一些实施例中，将DNA内切核酸酶或编码DNA内切核酸酶的核酸、gRNA和供体模板一起配制在脂质体或LNP中。

在一些实施例中，上述组合物还具有一种或多种附加试剂，其中此类附加试剂选自缓冲液、用于将多肽或多核苷酸引入细胞中的缓冲液、洗涤缓冲液、对照试剂、对照载体、对照RNA多核苷酸、用于由DNA体外产生多肽的试剂、用于测序的衔接子等。缓冲液可以是稳定化缓冲液、重构缓冲液、稀释缓冲液等。在一些实施例中，组合物还包含一种或多种组分，这些组分可用于促进或增强内切核酸酶对DNA的中靶结合或裂解，或提高靶向的特异性。

在一些实施例中，根据特定的施用模式和剂型，用药学上可接受的赋形剂诸如载剂、溶剂、稳定剂、佐剂、稀释剂等配制组合物的任何组分。在实施例中，通常将向导RNA组合物配制成达到生理相容的pH，并且根据配制和施用途径，其范围是pH为约3至pH为约11，约pH 3至约pH 7。在一些实施例中，将pH调节到约pH 5.0至约pH 8.0的范围。在一些实施例中，组合物具有治疗有效量的至少一种本文所述的化合物，以及一种或多种药学上可接受的赋形剂。任选地，该组合物可以具有本文所述的化合物的组合，可以包含可用于治疗或预防细菌生长的第二活性成分(例如但不限于，抗菌剂或抗微生物剂)，并且可以包含本披露的试剂的组合。在一些实施例中，将gRNA与一种或多种其他寡核苷酸，例如编码DNA内切核酸酶的核酸和/或供体模板一起配制。替代性地，用上述用于gRNA配制的方法单独地或与其他寡核苷酸组合配制编码DNA内切核酸酶的核酸和供体模板。

合适的赋形剂包括例如载剂分子，这些载剂分子包括大的、缓慢代谢的大分子(如蛋白、多糖、聚乳酸、聚乙醇酸、聚氨基酸、氨基酸共聚物和失活病毒颗粒)。其他示例性赋形剂包括抗氧化剂(例如但不限于抗坏血酸)、螯合剂(例如但不限于EDTA)、碳水化合物(例如但不限于糊精、羟烷基纤维素和羟烷基甲基纤维素)、硬脂酸、液体(例如但不限于油、水、盐水、甘油和乙醇)、润湿剂或乳化剂、pH缓冲物质等。

在一些实施例中，组合物的任何化合物(例如DNA内切核酸酶或编码DNA内切核酸酶的核酸、gRNA和供体模板)经由转染诸如电穿孔来递送。在一些示例性实施例中，在提供给细胞之前，将DNA内切核酸酶与gRNA预复合，形成RNP复合物，并且将RNP复合物进行电穿孔。在此类实施例中，供体模板可以经由电穿孔递送。

在一些实施例中，“组合物”是指具有用于离体治疗方法中的治疗细胞的治疗性组合物。

在实施例中，治疗性组合物含有生理上可耐受的载剂以及作为活性成分溶解或分散在其中的细胞组合物，和任选地至少一种如本文所述的附加生物活性剂。在一些实施例中，当为了治疗目的向哺乳动物或人类受试者施用治疗性组合物时，治疗性组合物基本上没有免疫原性。

一般而言，本文所述的经遗传修饰的治疗细胞与药学上可接受的载剂一起作为悬浮液施用。本领域技术人员将认识到，将用于细胞组合物中的药学上可接受的载剂将不包括大大干扰待递送至受试者的细胞的活力的缓冲液、化合物、冷冻保存剂、防腐剂或其他试剂。具有细胞的配制品可以包括例如容许维持细胞膜完整性的渗透缓冲液，以及任选地包括营养素以在施用后维持细胞活力或增强移植。此类配制品和悬浮液是本领域技术人员已知的，和/或可以使其适于与如本文所述的细胞一起使用。

在一些实施例中，细胞组合物也可以乳化或作为脂质体组合物存在，条件是乳化过程不会对细胞活力产生不利影响。可以将细胞和任何其他活性成分与药学上可接受的并且与活性成分相容的赋形剂混合，并以适用于本文所述的治疗方法的量混合。

细胞组合物中所含的另外的试剂可以包括其中的组分的药学上可接受的盐。药学上可接受的盐包括与无机酸(诸如盐酸或磷酸)或有机酸(诸如乙酸、酒石酸、扁桃酸等)形成的酸加成盐(与多肽的游离氨基基团形成)。与游离羧基基团形成的盐也可以衍生自无机碱(诸如氢氧化钠、氢氧化钾、氢氧化铵、氢氧化钙或氢氧化铁)和有机碱(诸如异丙胺、三甲胺、2-乙基氨基乙醇、组氨酸、普鲁卡因等)。

生理上可耐受的载剂是本领域众所周知的。示例性液体载剂是无菌水溶液，这些无菌水溶液除了活性成分和水外不含任何材料，或者含有缓冲液(如生理pH值的磷酸钠、生理盐水或两者，如磷酸盐缓冲盐水)。更进一步，水性载剂可以含有多于一种缓冲盐，以及诸如氯化钠和氯化钾的盐、右旋糖、聚乙二醇和其他溶质。除了并排除水之外，液体组合物还可以含有液相。此类另外的液相的实例是甘油、植物油(如棉籽油)和水油乳剂。在细胞组合物中有效治疗特定病症或病状的活性化合物的量将取决于病症或病状的性质，并且可以通过标准临床技术来确定。

试剂盒

一些实施例提供了一种试剂盒，该试剂盒包含任何上述组合物，例如用于基因组编辑的组合物或治疗性细胞组合物以及一种或多种附加组分。

在一些实施例中，试剂盒可具有一种或多种附加治疗剂，这些附加治疗剂可与组合物同时或按顺序施用以达到所需目的，例如基因组编辑或细胞疗法。

在一些实施例中，试剂盒可进一步包括用于使用试剂盒的组分来实践这些方法的说明书。通常将用于实践这些方法的说明书记录在合适的记录介质上。例如，说明书可以印刷在诸如纸或塑料等的基质上。说明书可以作为包装插页存在于试剂盒中，存在于试剂盒或其组件的容器的标签中(即，伴同包装或分包装一起)等。说明书可以作为合适的计算机可读存储介质(例如，CD-ROM、磁盘、闪存盘等)上存在的电子存储数据文件存在。在一些情况下，试剂盒中不存在真实的说明书，但提供了用于从远程来源(例如，经由互联网)获得说明书的方式。该实施例的实例是包括网址的试剂盒，在该网址中，可以观看该说明书和/或可以下载说明书。与说明书一样，用于获得说明书的方法可以记录在合适的基质上。

另外的治疗方法

可以使用工程化以靶向特定序列的定点多肽进行基因编辑。迄今为止，此类核酸酶有四种主要类型：大范围核酸酶及其功能等效物、锌指核酸酶(ZFN)、转录激活因子样效应子核酸酶(TALEN)和CRISPR/CAS核酸酶系统。核酸酶平台在设计难度、靶向密度和作用方式上不相同，尤其是ZFN和TALEN的特异性是通过蛋白-DNA的相互作用，而RNA-DNA的相互作用主要指导Cas蛋白。Cas9裂解还需要临近基序PAM，该基序在不同的CRISPR系统之间有所不同。使用NRG PAM裂解来自酿脓链球菌的Cas9，而来自脑膜炎奈瑟球菌(Neisseriameningitidis)的CRISPR可以在具有PAM的位点裂解，这些位点包括NNNNGATT(SEQ ID NO:312)、NNNNNGTTT(SEQ ID NO:313)和NNNNGCTT(SEQ ID NO:314)。许多其他Cas9直系同源物靶向与替代性PAM相邻的原间隔区。

CRISPR内切核酸酶(诸如Cas9)可用于本披露的方法的实施例中。此外，本文所述的传授内容(诸如治疗性靶位点)可以应用于其他形式的内切核酸酶，诸如ZFN、TALEN、HE、或MegaTAL，或使用核酸酶的组合。然而，为了将本披露的传授内容应用于此类内切核酸酶，尤其需要工程化针对特定靶位点的蛋白。

可以使附加结合结构域与Cas9蛋白融合以增加特异性。这些构建体的靶位点映射到已鉴定的gRNA指定位点，但需要附加结合基序，诸如锌指结构域。在Mega-TAL的情况下，大范围核酸酶可以与TALE DNA结合结构域融合。大范围核酸酶结构域可以增加特异性并提供裂解。类似地，失活或“死亡”的Cas9(dCas9)可以与裂解结构域融合，并需要sgRNA/Cas9靶位点和融合DNA结合结构域的相邻结合位点。除了催化失活之外，这可能还需要对dCas9进行一些蛋白工程化，以减少在没有附加结合位点情况下的结合。

在一些实施例中，根据本披露的编辑基因组的组合物和方法(例如，将FVIII编码序列插入白蛋白基因座中)使用以下以下任何方法。

锌指核酸酶

锌指核酸酶(ZFN)是具有连接至II型内切核酸酶FokI的催化结构域的工程化锌指DNA结合结构域的模块化蛋白。由于FokI仅作为二聚体起作用，因此必须对一对ZFN进行工程化以使其与相反DNA链上的同源靶“半位点”序列结合，并且它们之间的精确间隔使得能够形成具有催化活性的FokI二聚体。在本身没有序列特异性的FokI结构域的二聚化之后，ZFN半位点之间会产生DNA双链断裂，作为基因组编辑的起始步骤。

每个ZFN的DNA结合结构域通常具有3-6个富Cys2-His2结构的锌指，每个指主要识别靶DNA序列一条链上的核苷酸三联体，但是与第四核苷酸的跨链相互作用也可能很重要。与DNA进行关键接触的位置中的指的氨基酸的改变会改变给定指的序列特异性。因此，四指锌指蛋白将选择性识别12bp的靶序列，其中该靶序列是每个指贡献的三联体偏好的合成物，但是三联体偏好可能会不同程度受到相邻指的影响。ZFN的一个重要方面是，只需修饰单个指即可轻松将ZFN重新靶向至几乎任何基因组地址，但是要做好这一点还需要相当多的专业知识。在ZFN的大多数应用中，使用4-6指的蛋白，分别识别12-18bp。因此，一对ZFN通常将识别24-36bp的组合靶序列(不包括半位点之间5-7bp的间隔区)。结合位点可以用更大的间隔区(包括15-17bp)进一步隔开。假设在设计过程中排除了重复序列或基因同源物，则该长度的靶序列在人类基因组中可能是唯一的。然而，ZFN蛋白-DNA相互作用的特异性并不是绝对的，因此脱靶结合和裂解事件的确会发生，要么是两个ZFN之间的异二聚体，要么是ZFN中的一个或另一个的同型二聚体。通过对FokI结构域的二聚化界面进行工程化以产生“正”和“负”变体(也称为专性异二聚体变体，它们只可以与彼此二聚化，而不可以与自身二聚化)，有效地消除了后者的可能性。促成专性异二聚体阻止了同二聚体的形成。这大大提高了ZFN以及采用这些FokI变体的任何其他核酸酶的特异性。

在本领域中已经描述了多种基于ZFN的系统，定期报告其修改，并且大量参考文献描述了用于指导ZFN设计的规则和参数；参见例如Segal等人,Proc Natl Acad Sci USA[美国国家科学院院刊](1999)96(6):2758-63；B.Dreier等人,J Mol Biol.[分子生物学杂志],(2000)303(4):489-502；Q.Liu等人,J Biol Chem.[生物化学杂志](2002)277(6):3850-6；Dreier等人,J Biol Chem[生物化学杂志](2005)280(42):35588-97；以及Dreier等人,J Biol Chem.[生物化学杂志](2001)276(31):29466-78。

转录激活因子样效应子核酸酶(TALEN)

TALEN代表模块化核酸酶的另一种形式，其中与ZFN一样，经工程化的DNA结合结构域与FokI核酸酶结构域连接，并且一对TALEN串联作用以实现靶向DNA裂解。与ZFN的主要区别在于DNA结合结构域的性质以及相关的靶DNA序列识别特性。TALEN DNA结合结构域源自TALE蛋白，这些蛋白最初在植物细菌病原体黄单胞菌属(Xanthomonas sp.)中有描述。TALE具有33-35个氨基酸重复序列的串联阵列，每个重复序列识别靶DNA序列中的单个碱基对，该序列通常长达20bp，从而使总靶序列长度达到40bp。通过重复可变双残基(RVD)确定每个重复序列的核苷酸特异性，该重复可变双残基仅在位置12和13处包括两个氨基酸。鸟嘌呤、腺嘌呤、胞嘧啶和胸腺嘧啶碱基主要分别被以下四个RVD识别：Asn-Asn、Asn-Ile、His-Asp和Asn-Gly。这构成了比锌指要简单得多的识别码，因此在核酸酶设计方面比锌指具有优势。然而，与ZFN一样，TALEN的蛋白-DNA相互作用在其特异性上也不是绝对的，并且TALEN还受益于使用FokI结构域的专性异二聚体变体来降低脱靶活性。

已经产生了在其催化功能方面失活的FokI结构域的另外的变体。如果TALEN或ZFN对中的一半含有失活的FokI结构域，则在靶位点处只会发生单链DNA裂解(产生切口)，而不会发生DSB。其结果与使用CRISPR/Cas9/Cpf1“切口酶”突变体(其中Cas9裂解结构域之一已失活)相当。DNA切口可以用于驱动通过HDR进行基因组编辑，但是效率要比DSB低。与DSB不同，主要益处在于脱靶切口被快速而准确地修复，而DSB容易受到NHEJ介导的错误修复。

在本领域中已经描述了多种基于TALEN的系统，并且定期报告其修改：参见例如Boch,Science[科学](2009)326(5959):1509-12；Mak等人,Science[科学](2012)335(6069):716-9；以及Moscou等人,Science[科学](2009)326(5959):1501。已经有多个小组描述了基于“金门(Golden Gate)”平台或克隆方案的TALEN的用途：参见例如，T.Cermak等人,Nucleic Acids Res.[核酸研究](2011)39(12):e82；Li等人,Nucleic Acids Res.[核酸研究](2011)39(14):6315-25；Weber等人,PLoS One[公共科学图书馆·综合](2011)6(2):e16765；Wang等人,J Genet Genomics[遗传学与基因组学杂志](2014)41(6):339-47,Epub 2014Can 17；以及T.Cermak等人,Methods Mol Biol.[分子生物学方法](2015)1239:133-59。

归巢内切核酸酶

归巢内切核酸酶(HE)是具有长的识别序列(14-44个碱基对)的位点特异性内切核酸酶，并通常在基因组中唯一的位点处以高特异性裂解DNA。至少有六个按其结构分类的已知HE家族，包括LAGLIDADG(SEQ ID NO:6)、GIY-YIG、His-Cis框、H-N-H、PD-(D/E)xK和类Vsr，它们源自多种宿主，包括真核生物、原生生物、细菌、古细菌、蓝细菌和噬菌体。与ZFN和TALEN一样，HE可以用于在靶基因座处产生DSB，作为基因组编辑的起始步骤。另外，一些天然的和经工程化的HE仅切割DNA的单链，从而作为位点特异性切口酶起作用。HE的较大的靶序列以及HE提供的特异性使它们成为产生位点特异性DSB的有吸引力的候选物。

在本领域中已经描述了多种基于HE的系统，并且定期报告其修改：参见例如以下文献的综述：Steentoft等人,Glycobiology[糖生物学](2014)24(8):663-80；Belfort和Bonocora,Methods Mol Biol.[分子生物学方法](2014)1123:1-26；Hafez和Hausner,Genome[基因组](2012)55(8):553-69；以及其中引用的参考文献。

MegaTAL/Tev-mTALEN/MegaTev

作为杂合核酸酶的另外的实例，MegaTAL平台和Tev-mTALEN平台使用TALE DNA结合结构域和有催化活性的HE的融合，该融合利用TALE的可调DNA结合和特异性，以及HE的裂解序列特异性：参见例如Boissel等人，Nuc.Acids Res.[核酸研究](2014)42:2591-601；Kleinstiver等人,G3(2014)4:1155-65；以及Boissel和Scharenberg,Methods Mol.Biol.[分子生物学方法](2015)1239:171-96。

在另一种变型中，MegaTev架构是大范围核酸酶(Mega)与衍生自GIY-YIG归巢内切核酸酶I-TevI(Tev)的核酸酶结构域的融合。这两个活性位点在DNA底物上相距～30bp，并产生两个具有不相容粘性末端的DSB；参见例如Wolfs等人，Nuc.Acids Res.[核酸研究](2014)42:8816-29。可以预见，现有基于核酸酶的方法的其他组合将会发展，并可用于实现本文所述的靶向基因组修饰。

dCas9-FokI或dCpf1-Fok1和其他核酸酶

结合上述核酸酶平台的结构和功能特性提供了一种另外的基因组编辑的方法，该方法可能克服一些固有缺陷。例如，CRISPR基因组编辑系统通常使用单个Cas9内切核酸酶产生DSB。靶向的特异性由向导RNA中的20或22个核苷酸的序列驱动，该序列与靶DNA进行沃森-克里克碱基配对(在来自酿脓链球菌的Cas9的情况下，加上相邻的NAG或NGG PAM序列中的另外两个碱基)。这种序列足够长以至于在人类基因组中是唯一的，然而，RNA/DNA相互作用的特异性不是绝对的，有时可以耐受明显的混杂，尤其是在靶序列的5’一半处，这有效地减少了驱动特异性的碱基的数目。对此的一种解决方案是使Cas9或Cpf1催化功能完全失活(仅保留RNA指导的DNA结合功能)，而将FokI结构域与失活的Cas9融合；参见例如Tsai等人,Nature Biotech[自然·生物技术](2014)32:569-76；以及Guilinger等人,NatureBiotech.[自然·生物技术](2014)32:577-82。由于FokI必须二聚化才能变得有催化活性，因此需要两种指导RNA来将两种FokI融合物拴系在紧密接近的位置，以形成二聚体并裂解DNA。这本质上使组合靶位点中的碱基数目加倍，从而提高被基于CRISPR的系统靶向的严格性。

作为另一实例，TALE DNA结合结构域与具有催化活性的HE(如I-TevI)的融合利用TALE的可调DNA结合和特异性，以及I-TevI的裂解序列特异性，预期可以进一步减少脱靶裂解。

在下面的所附描述中阐述了本披露的一个或多个实施例的详情。从说明书看，本披露的其他特征、目的和优点将显而易见。在说明书中，除非上下文另外明确指出，否则单数形式也包括复数指示物。除非另外定义，否则本文使用的技术和科学术语均具有与本披露所属领域中的普通技术人员通常所理解的相同含义。在有冲突的情况下，以本说明书为准。

应了解本文所述的实例和实施例仅出于说明的目的，并且将对本领域技术人员建议鉴于此的修改或变化且包括在本申请案的精神和范围内及所附权利要求的范围内。本文引用的所有出版物、专利和专利申请均据此通过援引整体并入以用于所有目的。

通过以下非限制性实例进一步说明本文提供的披露的一些实施例。

示例性实施例

实施例1.一种系统，该系统包含：脱氧核糖核酸(DNA)内切核酸酶或编码该DNA内切核酸酶的核酸；包含与宿主细胞基因座互补的间隔区序列的向导RNA(gRNA)或编码该gRNA的核酸；和包含编码合成FVIII蛋白的核酸序列的供体模板，其中该合成FVIII蛋白包含B结构域替代物，其中该B结构域替代物包含0至9个N-连接的糖基化位点且长度为3至约40个氨基酸。

实施例2.如实施例1所述的系统，其中该B结构域替代物包含0至6个N-连接的糖基化位点。

实施例3.如实施例2所述的系统，其中该B结构域替代物包含0至3个N-连接的糖基化位点。

实施例4.如实施例1所述的系统，其中该B结构域替代物包含SEQ ID NO:362-369、371和373中任一个的氨基酸序列。

实施例5.如实施例4所述的系统，其中该B结构域替代物包含SEQ ID NO:362-366、371和373中任一个的氨基酸序列或其与SEQ ID NO:362-366、371和373中任一个具有至少80％同一性的变体。

实施例6.如实施例5所述的系统，其中该B结构域替代物包含SEQ ID NO:362-364、371和373中任一个的氨基酸序列。

实施例7.如实施例1-6中任一项所述的系统，其中该宿主细胞基因座是在肝脏中表达的基因的基因座。

实施例8.如实施例1-7中任一项所述的系统，其中该宿主细胞基因座是编码急性期蛋白的基因的基因座。

实施例9.如实施例8所述的系统，其中该急性期蛋白是白蛋白、转铁蛋白或纤维蛋白原。

实施例10.如实施例1-7中任一项所述的系统，其中该宿主细胞基因座是安全港基因座。

实施例11.如实施例1-10中任一项所述的系统，其中该DNA内切核酸酶选自由以下项组成的组：Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也称为Csn1和Csx12)、Cas100、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4或Cpf1内切核酸酶及其功能衍生物。

实施例12.如实施例11所述的系统，其中该DNA内切核酸酶是Cas9。

实施例13.如实施例1-11中任一项所述的系统，其中对编码该DNA内切核酸酶的核酸进行密码子优化以在宿主细胞中表达。

实施例14.如实施例1-13中任一项所述的系统，其中编码该DNA内切核酸酶的核酸是脱氧核糖核酸(DNA)。

实施例15.如实施例1-13中任一项所述的系统，其中编码该DNA内切核酸酶的核酸是核糖核酸(RNA)。

实施例16.如实施例15所述的系统，其中编码该DNA内切核酸酶的RNA是mRNA。

实施例17.如实施例1-16中任一项所述的系统，其中该供体模板核酸序列经过密码子优化以在该宿主细胞中表达。

实施例18.如实施例1-17中任一项所述的系统，其中与编码FVIII蛋白的野生型核酸序列相比，该供体模板核酸序列包含降低含量的CpG二核苷酸。

实施例19.如实施例18所述的系统，其中该供体模板核酸序列不含CpG二核苷酸。

实施例20.如实施例1-19中任一项所述的系统，其中该供体模板在AAV载体中编码。

实施例21.如实施例1-20中任一项所述的系统，其中该供体模板包含供体盒，该供体盒包含编码合成FVIII蛋白的核酸序列，并且其中该供体盒在一侧或两侧上侧接有gRNA靶位点。

实施例22.如实施例21所述的系统，其中该供体盒在两侧上侧接有gRNA靶位点。

实施例23.如实施例21所述的系统，其中该供体盒在其5’侧上侧接有gRNA靶位点。

实施例24.如实施例21-23中任一项所述的系统，其中该gRNA靶位点是该系统中gRNA的靶位点。

实施例25.如实施例24所述的系统，其中该供体模板的gRNA靶位点是该系统中gRNA的基因组gRNA靶位点的反向互补序列。

实施例26.如实施例1-25中任一项所述的系统，其中该DNA内切核酸酶或编码该DNA内切核酸酶的核酸包含在脂质体或脂质纳米颗粒中。

实施例27.如实施例26所述的系统，其中该脂质体或脂质纳米颗粒还包含该gRNA。

实施例28.如实施例1-27中任一项所述的系统，其中该DNA内切核酸酶与该gRNA复合，从而提供核糖核蛋白(RNP)复合物。

实施例29.一种编辑宿主细胞中的基因组的方法，该方法包括向该细胞提供以下物质：(a)包含与宿主细胞基因座互补的间隔区序列的gRNA或编码该gRNA的核酸；(b)DNA内切核酸酶或编码该DNA内切核酸酶的核酸；以及(c)包含编码合成FVIII蛋白的核酸序列的供体模板，其中该合成FVIII蛋白包含B结构域替代物，其中该B结构域替代物包含0至9个N-连接的糖基化位点且长度为3至约40个氨基酸。

实施例30.如实施例29所述的方法，其中该B结构域替代物包含0至6个N-连接的糖基化位点。

实施例31.如实施例30所述的方法，其中该B结构域替代物包含0至3个N-连接的糖基化位点。

实施例32.如实施例29所述的方法，其中该B结构域替代物包含SEQ ID NO:362-369、371和373中任一个的氨基酸序列。

实施例33.如实施例32所述的方法，其中该B结构域替代物包含SEQ ID NO:362-366、371和373中任一个的氨基酸序列或其与SEQ ID NO:362-366、371和373中任一个具有至少80％同一性的变体。

实施例34.如实施例33所述的方法，其中该B结构域替代物包含SEQ ID NO:362-364、371和373中任一个的氨基酸序列。

实施例35.如实施例29-34中任一项所述的方法，其中该宿主细胞内源基因座是在肝脏中表达的基因的基因座。

实施例36.如实施例29-35中任一项所述的方法，其中该宿主细胞内源基因座是编码急性期蛋白的基因的基因座。

实施例37.如实施例36所述的方法，其中该急性期蛋白是白蛋白、转铁蛋白或纤维蛋白原。

实施例38.如实施例29-34中任一项所述的方法，其中该宿主细胞内源基因座是安全港基因座。

实施例39.如实施例29-38中任一项所述的方法，其中该DNA内切核酸酶选自由以下项组成的组：Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也称为Csn1和Csx12)、Cas100、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4或Cpf1内切核酸酶；或其功能衍生物。

实施例40.如实施例39所述的方法，其中该DNA内切核酸酶是Cas9。

实施例41.如实施例29-40中任一项所述的方法，其中对编码该DNA内切核酸酶的核酸进行密码子优化以在宿主细胞中表达。

实施例42.如实施例29-41中任一项所述的方法，其中编码该DNA内切核酸酶的核酸是脱氧核糖核酸(DNA)。

实施例43.如实施例29-41中任一项所述的方法，其中编码该DNA内切核酸酶的核酸是核糖核酸(RNA)。

实施例44.如实施例43所述的方法，其中编码该DNA内切核酸酶的RNA是mRNA。

实施例45.如实施例29所述的方法，其中该供体模板在AAV载体中编码。

实施例46.如实施例29-45中任一项所述的方法，其中该供体模板核酸序列经过密码子优化以在该宿主细胞中表达。

实施例47.如实施例29-46中任一项所述的方法，其中与编码FVIII的野生型核酸序列相比，该供体模板核酸序列包含降低含量的CpG二核苷酸。

实施例48.如实施例47所述的方法，其中该供体模板核酸序列不含CpG二核苷酸。

实施例49.如实施例29-48中任一项所述的方法，其中该供体模板包含供体盒，该供体盒包含编码合成FVIII蛋白的核酸序列，并且其中该供体盒在一侧或两侧上侧接有gRNA靶位点。

实施例50.如实施例49所述的方法，其中该供体盒在两侧上侧接有gRNA靶位点。

实施例51.如实施例49所述的方法，其中该供体盒在其5’侧上侧接有gRNA靶位点。

实施例52.如实施例49-51中任一项所述的方法，其中该gRNA靶位点是所施用的gRNA的靶位点。

实施例53.如实施例52所述的方法，其中该供体模板的gRNA靶位点是该细胞基因组中针对所施用的gRNA的gRNA靶位点的反向互补序列。

实施例54.如实施例29-53中任一项所述的方法，其中该DNA内切核酸酶或编码该DNA内切核酸酶的核酸配制在脂质体或脂质纳米颗粒中。

实施例55.如实施例54所述的方法，其中该脂质体或脂质纳米颗粒还包含该gRNA。

实施例56.如实施例29-55中任一项所述的方法，其中该DNA内切核酸酶和该gRNA作为核糖核蛋白(RNP)复合物提供给宿主细胞，该复合物包含与该gRNA预复合的DNA内切核酸酶。

实施例57.如实施例29-56中任一项所述的方法，其中在将该供体模板提供给该细胞后超过4天，将该gRNA或编码该gRNA的核酸和该DNA内切核酸酶或编码该DNA内切核酸酶的核酸提供给该细胞。

实施例58.如实施例29-57中任一项所述的方法，其中在将该供体模板提供给该细胞后至少14天，将该gRNA或编码该gRNA的核酸和该DNA内切核酸酶或编码该DNA内切核酸酶的核酸提供给该细胞。

实施例59.如实施例57或58所述的方法，其中在第一剂量的该gRNA或编码该gRNA的核酸和该DNA内切核酸酶或编码该DNA内切核酸酶的核酸后，向该细胞提供一个或多个附加剂量的该gRNA或编码该gRNA的核酸和该DNA内切核酸酶或编码该DNA内切核酸酶的核酸。

实施例60.如实施例59所述的方法，其中在第一剂量的该gRNA或编码该gRNA的核酸和该DNA内切核酸酶或编码该DNA内切核酸酶的核酸后，向该细胞提供一个或多个附加剂量的该gRNA或编码该gRNA的核酸和该DNA内切核酸酶或编码该DNA内切核酸酶的核酸，直至达到该编码合成FVIII蛋白的核酸序列的目标靶向整合水平，或达到该编码合成FVIII蛋白的核酸序列的目标表达水平。

实施例61.如实施例29-60中任一项所述的方法，其中该细胞是肝脏细胞。

实施例62.如实施例61所述的方法，其中该细胞是人肝脏细胞或人肝窦上皮细胞。

实施例63.一种细胞，其中该细胞的基因组包含编码合成FVIII蛋白的DNA，其中该合成FVIII蛋白包含B结构域替代物，其中该B结构域替代物包含0至9个N-连接的糖基化位点且长度为3至约40个氨基酸。

实施例64.如实施例63所述的细胞，其中该合成FVIII蛋白与内源性白蛋白启动子、内源性转铁蛋白启动子或内源性纤维蛋白原α启动子可操作地连接。

实施例65.如实施例63所述的细胞，其中编码该合成FVIII蛋白的核酸序列经过密码子优化以在该细胞中表达。

实施例66.如实施例63所述的细胞，其中该细胞是人肝脏细胞。

实施例67.如实施例66所述的细胞，其中该细胞是人肝脏细胞或人肝窦上皮细胞。

实施例68.如实施例67所述的细胞，其中该细胞通过如实施例29-62中任一项所述的方法制备。

实施例69.一种治疗受试者的血友病A的方法，该方法包括：向该受试者中的细胞提供以下物质：(a)包含与宿主细胞基因座互补的间隔区序列的gRNA或编码该gRNA的核酸；(b)DNA内切核酸酶或编码该DNA内切核酸酶的核酸；以及(c)包含编码合成FVIII蛋白的核酸序列的供体模板，其中该合成FVIII蛋白包含B结构域替代物，其中该B结构域替代物包含0至9个N-连接的糖基化位点且长度为3至约40个氨基酸。

实施例70.如实施例69所述的方法，其中该B结构域替代物包含0至6个N-连接的糖基化位点。

实施例71.如实施例70所述的方法，其中该B结构域替代物包含0至3个N-连接的糖基化位点。

实施例72.如实施例29所述的方法，其中该B结构域替代物包含SEQ ID NO:362-369、371和373中任一个的氨基酸序列。

实施例73.如实施例72所述的方法，其中该B结构域替代物包含SEQ ID NO:362-366、371和373中任一个的氨基酸序列或其与SEQ ID NO:362-366、371和373中任一个具有至少80％同一性的变体。

实施例74.如实施例73所述的方法，其中该B结构域替代物包含SEQ ID NO:362-364、371和373中任一个的氨基酸序列。

实施例75.如实施例69-74中任一项所述的方法，其中该宿主细胞基因座是在肝脏中表达的基因的基因座。

实施例76.如实施例69-75中任一项所述的方法，其中该宿主细胞基因座是编码急性期蛋白的基因的基因座。

实施例77.如实施例76所述的方法，其中该急性期蛋白是白蛋白、转铁蛋白或纤维蛋白原。

实施例78.如实施例69-74中任一项所述的方法，其中该宿主细胞基因座是安全港基因座。

实施例79.如实施例69-78中任一项所述的方法，其中该DNA内切核酸酶选自由以下项组成的组：Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(也称为Csn1和Csx12)、Cas100、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4和Cpf1内切核酸酶；或其功能衍生物。

实施例80.如实施例79所述的方法，其中该DNA内切核酸酶是Cas9。

实施例81.如实施例80所述的方法，其中该Cas9是spCas9或SluCas9。

实施例82.如实施例69-81中任一项所述的方法，其中对编码该DNA内切核酸酶的核酸进行密码子优化以在细胞中表达。

实施例83.如实施例69-82中任一项所述的方法，其中编码该DNA内切核酸酶的核酸是脱氧核糖核酸(DNA)。

实施例84.如实施例69-82中任一项所述的方法，其中编码该DNA内切核酸酶的核酸是核糖核酸(RNA)。

实施例85.如实施例84所述的方法，其中编码该DNA内切核酸酶的RNA是mRNA。

实施例86.如实施例69-85中任一项所述的方法，其中将该gRNA或编码该gRNA的核酸、该DNA内切核酸酶或编码该DNA内切核酸酶的核酸以及该供体模板中的一种或多种配制在脂质体或纳米颗粒中。

实施例87.如实施例69-86中任一项所述的方法，其中该供体模板在AAV载体中编码。

实施例88.如实施例69-87中任一项所述的方法，其中该供体模板核酸序列经过密码子优化以在该宿主细胞中表达。

实施例89.如实施例69-88中任一项所述的方法，其中与编码FVIII的野生型核酸序列相比，该供体模板核酸序列包含降低含量的CpG二核苷酸。

实施例90.如实施例89所述的方法，其中该供体模板核酸序列不含CpG二核苷酸。

实施例91.如实施例69-90中任一项所述的方法，其中该供体模板包含供体盒，该供体盒包含编码合成FVIII蛋白的核酸序列，并且其中该供体盒在一侧或两侧上侧接有gRNA靶位点。

实施例92.如实施例91所述的方法，其中该供体盒在两侧上侧接有gRNA靶位点。

实施例93.如实施例91所述的方法，其中该供体盒在其5’侧上侧接有gRNA靶位点。

实施例94.如实施例91-93中任一项所述的方法，其中该gRNA靶位点是该gRNA的靶位点。

实施例95.如实施例94所述的方法，其中该供体模板的gRNA靶位点是该细胞基因组中针对该gRNA的gRNA靶位点的反向互补序列。

实施例96.如实施例69-95中任一项所述的方法，其中向该细胞提供该供体模板包括向该受试者静脉施用该供体模板。

实施例97.如实施例69-96中任一项所述的方法，其中该DNA内切核酸酶或编码该DNA内切核酸酶的核酸配制在脂质体或脂质纳米颗粒中。

实施例98.如实施例97所述的方法，其中该脂质体或脂质纳米颗粒还包含该gRNA。

实施例99.如实施例98所述的方法，其中向该细胞提供该gRNA或编码该gRNA的核酸和该DNA内切核酸酶或编码该DNA内切核酸酶的核酸包括向该受试者静脉内施用该脂质体或脂质纳米颗粒。

实施例100.如实施例69-99中任一项所述的方法，其中该DNA内切核酸酶和该gRNA作为核糖核蛋白(RNP)复合物提供给该宿主细胞，该RNP复合物包含与该gRNA复合的DNA内切核酸酶。

实施例101.如实施例69-100中任一项所述的方法，其中在将该供体模板提供给该细胞后超过4天，将该gRNA或编码该gRNA的核酸和该DNA内切核酸酶或编码该DNA内切核酸酶的核酸提供给该细胞。

实施例102.如实施例69-101中任一项所述的方法，其中在将该供体模板提供给该细胞后至少14天，将该gRNA或编码该gRNA的核酸和该DNA内切核酸酶或编码该DNA内切核酸酶的核酸提供给该细胞。

实施例103.如实施例101或102所述的方法，其中在第一剂量的该gRNA或编码该gRNA的核酸和该DNA内切核酸酶或编码该DNA内切核酸酶的核酸后，向该细胞提供一个或多个附加剂量的该gRNA或编码该gRNA的核酸和该DNA内切核酸酶或编码该DNA内切核酸酶的核酸。

实施例104.如实施例103所述的方法，其中在第一剂量的该gRNA或编码该gRNA的核酸和该DNA内切核酸酶或编码该DNA内切核酸酶的核酸后，向该细胞提供一个或多个附加剂量的该gRNA或编码该gRNA的核酸和该DNA内切核酸酶或编码该DNA内切核酸酶的核酸，直至达到该编码合成FVIII蛋白的核酸序列的目标靶向整合水平和/或该编码合成FVIII蛋白的核酸序列的目标表达水平。

实施例105.如实施例101-104中任一项所述的方法，其中向该细胞提供该gRNA和该DNA内切核酸酶或编码该DNA内切核酸酶的核酸包括向该受试者施用包含编码该DNA内切核酸酶的核酸和该gRNA的脂质纳米颗粒。

实施例106.如实施例101-105中任一项所述的方法，其中向该细胞提供该供体模板包括向该受试者施用在AAV载体中编码的该供体模板。

实施例107.如实施例69-106中任一项所述的方法，其中该细胞是肝细胞。

实施例108.如实施例69-107中任一项所述的方法，其中编码合成FVIII蛋白的核酸序列在该受试者的肝脏中表达。

实施例109.一种治疗受试者的血友病A的方法，该方法包括向该受试者施用如实施例63-68中任一项所述的细胞。

实施例110.如实施例109所述的方法，其中该细胞对该受试者来说是自体的。

实施例111.如实施例110所述的方法，该方法进一步包括从该受试者获得生物样品，其中该生物样品包含肝脏细胞，并且其中该细胞由该肝脏细胞制备。

实施例112.一种试剂盒，该试剂盒包含如实施例1-28中任一项所述的系统的一种或多种要素，进一步包含使用说明书。

实施例113.一种包含编码合成FVIII蛋白的多核苷酸序列的核酸，其中该合成FVIII蛋白包含B结构域替代物，其中该B结构域替代物包含0至9个N-连接的糖基化位点且长度为3至约40个氨基酸。

实施例114.如实施例113所述的核酸，其中该B结构域替代物包含0至6个N-连接的糖基化位点。

实施例115.如实施例113所述的核酸，其中该B结构域替代物包含0至3个N-连接的糖基化位点。

实施例116.如实施例113所述的核酸，其中该B结构域替代物包含SEQ ID NO:362-369、371和373中任一个的氨基酸序列。

实施例117.如实施例116所述的核酸，其中该B结构域替代物包含SEQ ID NO:362-364、371和373中任一个的氨基酸序列或其与SEQ ID NO:362-364、371和373中任一个具有至少80％同一性的变体。

实施例118.如实施例116所述的核酸，其中该B结构域替代物包含SEQ ID NO:362-363、371和373中任一个的氨基酸序列。

实施例119.如实施例113-118中任一项所述的核酸，其中编码合成FVIII蛋白的该多核苷酸序列经过密码子优化以在宿主细胞中表达。

实施例120.如实施例113-119中任一项所述的核酸，其中与编码FVIII的野生型核酸序列相比，编码合成FVIII蛋白的该多核苷酸序列包含降低含量的CpG二核苷酸。

实施例121.如实施例120所述的核酸，其中编码合成FVIII蛋白的该多核苷酸序列不含CpG二核苷酸。

实施例122.如实施例113-121中任一项所述的核酸，其中该核酸是病毒载体。

实施例123.如实施例122所述的核酸，其中该病毒载体是AAV载体。

实施例124.一种增加受试者中的FVIII量的方法，该方法包括：向该受试者中的细胞提供以下物质，其中该受试者具有第一FVIII血清水平：(a)包含与宿主细胞基因座互补的间隔区序列的gRNA或编码该gRNA的核酸；(b)DNA内切核酸酶或编码该DNA内切核酸酶的核酸；以及(c)包含编码合成FVIII蛋白的核酸序列的供体模板，其中该合成FVIII蛋白包含B结构域替代物，其中该B结构域替代物包含0至9个N-连接的糖基化位点且长度为3至约40个氨基酸。

实施例125.如实施例124所述的方法，其中第一FVIII血清水平低于约0.40IU/mL。

实施例126.如实施例125所述的方法，其中第一FVIII血清水平低于约0.05IU/mL。

实施例127.如实施例125所述的方法，其中第一FVIII血清水平低于约0.01IU/mL。

实施例128.如实施例1-28中任一项所述的系统用于治疗血友病A的用途。

实施例129.如实施例1-28中任一项所述的系统用于制造用于治疗血友病A的药物的用途。

实施例130.如实施例63-68中任一项所述的细胞用于治疗血友病A的用途。

实施例131.如实施例63-68中任一项所述的细胞用于制造用于治疗血友病A的药物的用途。

实施例132.如实施例112所述的试剂盒用于治疗血友病A的用途。

实施例133.如实施例112所述的试剂盒用于制造用于治疗血友病A的药物的用途。

实施例134.如实施例113-123中任一项所述的核酸用于治疗血友病A的用途。

实施例135.如实施例113-123中任一项所述的核酸用于制造用于治疗血友病A的药物的用途。

实施例136.一种合成FVIII蛋白，其中该合成FVIII蛋白包含B结构域替代物，其中该B结构域替代物包含0至9个N-连接的糖基化位点且长度不超过约40个氨基酸。

实例

实例1：含有N-糖基化基序的氨基酸序列在CRISPR/Cas9裂解介导的靶向整合到小鼠白蛋白内含子1中之后改善FVIII的表达

构建体设计

将编码FVIII的核酸序列插入基因组中的挑战在于：天然FVIII编码序列为7053bp，这尤其使得难以将其包装在腺相关病毒中(对于作为模板体内递送以整合在由序列特异性核酸酶诸如Cas9产生的双链断裂处，AAV具有4800至5000bp范围内的包装限值)。为了解决该问题，申请人设计了一组具有改变的B结构域的FVIII编码序列。尽管FVIII的B结构域不是功能所需的，但它会改善FVIII的分泌。将这些FVIII编码序列设计为表达具有短B结构域(替代B结构域)的合成FVIII。为了评价具有替代B结构域的合成FVIII编码序列在整合到基因组中后产生和分泌FVIII蛋白的能力，将构建体设计为将FVIII编码序列靶向整合到小鼠白蛋白基因的内含子1中。白蛋白基因座提供了在肝脏细胞中有活性的强启动子，使得在该基因座处插入的合适的FVIII编码序列当与白蛋白启动子可操作地连接时可以表达。

使用已知的分子生物学技术构建本文称为pCB076(SEQ ID NO:316)、pCB100(SEQID NO:320)、pCB1003(SEQ ID NO:324)、pCB085(SEQ ID NO:3319)或pCB080(SEQ ID NO:318)的一系列质粒。相同的基于pUC19的细菌质粒骨架(含有细菌复制起点和卡那霉素抗性基因)用于所有5种质粒。用以下元件构建质粒(按顺序)：gRNA靶位点(对于gRNA mAlbT1，SEQ ID NO:338，靶向小鼠白蛋白基因的外显子1)|18bp间隔区|剪接受体位点(“SA”)|FVIII编码序列|多聚腺苷酸化信号(“sPA”)。质粒的不同之处仅在于人FVIII编码序列的密码子优化，以及编码B结构域替代物的序列的存在(pCB076)或不存在(pCB100、pCB1003、pCB085和pCB080)。本实例中使用的B结构域替代物由来自人FVIII B结构域N端的前6个N-糖基化基序组成。

质粒pCB100、pCB1003、pCB085和pCB080全部含有B结构域缺失的人FVIII的编码序列，其中B结构域被“SQ接头”(其编码氨基酸SFSQNPPVLKRHQR，SEQ ID NO:337)替代。SQ接头包括蛋白酶裂解位点(RHQR)，但缺少N-连接的糖基化位点。质粒pCB076(SEQ ID NO:316)含有与pCB100相同的密码子优化的B结构域缺失的人FVIII编码序列(“co1”，参见下面的实例4)，和编码17个氨基酸的附加DNA序列，与插入SQ接头中代替B结构域(从而形成B结构域替代物)的人FVIII B结构域N端的前6个N-糖基化基序相对应。其他质粒具有以下密码子优化：pCB100-co1(SEQ ID NO:320)、pCB1003-co2(SEQ ID NO:324)、pCB085-co3(SEQ ID NO:319)和pCB080-co4(SEQ ID NO:318)(参见下面的实例4)。将质粒设计为用于靶向整合到双链断裂中的供体，该双链断裂是使用CRISPR/Cas9系统，利用gRNA mALbT1(tgccagttcccgatcgttac，SEQ ID 338)在小鼠白蛋白基因的内含子1中产生的。肝脏是这种靶向整合的靶器官，特别是肝细胞。体内肝细胞大部分是静止的，并且已知修复非分裂细胞中DNA双链断裂的主要细胞机制是非同源末端连接(NHEJ)(Z.Mao等人，Cell Cycle[细胞周期](2008)7:2902-06)。在基因组中存在线性双链DNA分子(供体)和双链断裂的情况下，供体DNA可通过NHEJ机制插入双链断裂处。

替代性地，基因组中双链断裂的末端可通过相同的NHEJ机制彼此重新连接，这是通常比插入供体模板更频繁的事件。NHEJ修复是易错过程，这导致在双链断裂位点引入插入或缺失。在细胞基因组的双链断裂处作为质粒递送的供体模板的靶向整合可以通过在供体质粒中包括核酸酶的切割位点来增强。因为质粒是环状分子，它们不是在双链断裂处整合的模板。在质粒中包含单个向导RNA切割位点导致质粒在Cas9/gRNA复合物的存在下线性化。因此，在小鼠基因组中存在的序列的反向互补序列中的FVIII盒的5’末端插入mALbT1向导的单个向导RNA切割位点。

当使用位于盒侧该翼的两个向导位点时，在基因组中使用向导序列的反向互补序列理论上有利于正向整合。然而，当仅使用一个向导切割位点时，不可能保持该优点。包含在编码序列侧翼的向导切割位点产生由编码序列盒和细菌质粒骨架(编码抗生素抗性基因和复制起点)组成的两个线性片段，在这种情况下，细菌骨架片段竞争在基因组中的双链断裂处整合。由于这个原因，申请人将质粒设计成使用单个向导切割位点。合成FVIII编码序列盒从5’末端开始依次由以下元件组成；mAlbT1 gRNA靶位点、18bp间隔区序列、剪接受体序列(ACTAAAGAATTATTCTTTTACATTTCAG，SEQ ID NO:307)、其中信号肽被二核苷酸TG替代的B结构域缺失的人FVIII编码序列和多聚腺苷酸化信号(aataaaagatctttattttcattagatctgtgtgttggttttttgtgtg，SEQ ID NO:306)。

将构建体设计成使得在整合到白蛋白的内含子1中之后，产生杂交前mRNA，其含有白蛋白的外显子1、白蛋白的内含子1的一部分和FVIII编码序列盒。在整合到白蛋白内含子1中后，预期细胞的剪接机制以一定频率剪接出内含子1，从而产生成熟mRNA，其中白蛋白外显子1与成熟FVIII的编码序列框内融合。TG二核苷酸包含在构建体中以维持翻译阅读框。预计该mRNA的翻译会产生一种蛋白，其中白蛋白的信号肽和前肽与FVIII的成熟编码序列融合。当通过细胞的分泌机制时，预计信号肽和前肽被裂解掉，留下三个添加到成熟FVIII的天然N端的氨基酸(Glu-Ala-Leu)。使用该方法产生的FVIII蛋白在小鼠中具有活性，尽管存在这些额外的三个氨基酸。

gRNA

这些实验中使用的gRNA是化学合成的，并入了经化学修饰的核苷酸以提高对核酸酶的抗性。一个实例中的gRNA由以下结构组成：5’usgscsCAGUUCCCGAUCGUUACGUUUUAGAgcuaGAAAuagcAAGUUAAA AUAAGGCUAGUCCGUUAUCaacuuGAAAaaguggcaccgagucggugcusususU-3’(SEQ ID NO:339)，其中“A、G、U、C”是天然RNA核苷酸，“a、g、u、c”是2’-O-甲基核苷酸，并且“s”是硫代磷酸酯骨架。gRNA的小鼠白蛋白靶向序列带有下划线，gRNA序列的其余部分是共同的支架序列。

mRNA

可以通过本领域已知的方法产生该mRNA。本文所用的一种这样的方法是使用T7聚合酶进行体外转录，其中mRNA的序列在含有T7聚合酶启动子的质粒中编码。简言之，将质粒在含有T7聚合酶和核糖核苷酸的适当缓冲液中孵育后，产生了编码所需蛋白的氨基酸序列的RNA分子。天然核糖核苷酸或经化学修饰的核糖核苷酸可用于反应混合物中以产生具有天然mRNA的天然化学结构或具有经修饰的化学结构的mRNA分子。在本文所述的研究中，使用天然(未修饰的)核糖核苷酸。另外，在转录反应中包括加帽组分，使得mRNA的5’末端加帽。

将spCas9 mRNA设计为编码与核定位结构域(NLS)融合的spCas9蛋白，核定位结构域是将spCas9蛋白转运到可发生基因组DNA裂解的核区室中所必需的。Cas9 mRNA另外的组分是在5’末端第一个促进核糖体结合的密码子之前的KOZAK序列，以及在3’末端由一系列A残基组成的聚A尾。具有NLS序列的spCas9 mRNA实例示于SEQ ID NO:340中。另外，通过利用每个氨基酸最常用的密码子，针对密码子使用对spCas9编码序列的序列进行优化。另外，为了促进mRNA有效翻译为spCas9蛋白，优化编码序列以去除隐蔽核糖体结合位点和上游开放阅读框。

LNP

这些研究中使用的LNP的主要组分是脂质C12-200(Love等人，2010同上)。C12-200与带负电荷的RNA分子形成复合物。一般而言，将C12-200与1,2-二油酰基-sn-甘油-3-磷酸乙醇胺(DOPE)、DMPE-mPEG2000和胆固醇组合。当在受控条件下，例如在

设备(卑诗省温哥华市精密纳米系统公司(Precision NanoSystems,Vancouver,BC))中与核酸诸如gRNA和mRNA混合时，发生LNP自组装，其中核酸被包封在LNP内部。为了将gRNA和Cas9 mRNA组装在LNP中，视情况而定将乙醇和脂质原液吸取到玻璃小瓶中。示例性比率由摩尔比为50:10:38.5:1.5的C12-200、DOPE、胆固醇和mPEG2000-DMG组成。在无RNA酶的试管中，将gRNA和mRNA稀释于100mM柠檬酸钠(pH 3.0)和300mM NaCl中。将

筒柱(精密纳米系统公司(Precision NanoSystems))在脂质侧用乙醇洗涤，在RNA侧用水洗涤。将脂质工作原液抽入注射器中，从注射器中去除空气，然后将注射器插入筒柱中。使用相同的程序将gRNA和Cas9 mRNA的混合物装入注射器。然后在制造商推荐的条件下进行

运行。使用10K截留分子量(MWCO)透析筒柱将LNP悬浮液在4升PBS中透析4小时，然后通过100K MWCO离心筒柱(艾米康(Amicon))离心浓缩，包括在离心过程中在PBS中洗涤三次。最后，将LNP悬浮液通过0.2μm针头式过滤器进行无菌过滤。使用市售内毒素试剂盒(鲎变形细胞溶解物(LAL)测定法)检查内毒素水平，并通过动态光散射测定粒度分布。

使用

测定法(赛默飞世尔(Thermo Fisher))测定包封的RNA的浓度。替代性地，将gRNA和Cas9 mRNA单独配制到LNP中，然后混合在一起，之后处理培养中的细胞或注入动物体内。使用单独配制的gRNA和Cas9 mRNA，可以测试gRNA和Cas9 mRNA的特定比率。

利用替代性阳离子脂质分子的替代性LNP配制品也用于体内递送gRNA和Cas9mRNA。

构建体的体内测试

使用鼠类模型测试设计的构建体产生FVIII的能力。血友病A的小鼠模型是本领域已知的(例如，L.Bi等人,Nat Genet.[自然·遗传学](1995)10:119-21,doi:10.1038/ng0595-119)。使用Qiagen

质粒大提试剂盒(目录号12362)纯化质粒pCB076、pCB100、pCB1003、pCB085和pCB080，然后在0.9％盐水中稀释到15μg/mL的最终浓度。血友病A小鼠(品系B6；129S-F8^tm1Kaz/J)，一种缺乏小鼠FVIII蛋白的小鼠品系，获自杰克逊实验室(缅因州巴尔港(Bar Harbor,ME))。通过流体动力学注射(“HDI”)，在5至6秒的时间内，经由尾静脉向血友病A小鼠队列每只小鼠注射2mL经稀释的质粒DNA。已有报道，HDI过程导致将质粒DNA递送到肝脏细胞(包括肝细胞)的细胞核中(参见例如，F.Niola等人，Meth MolBiol[分子生物学方法](2019)1961:329-41)。注射后一天，给予小鼠眶后(“RO”)注射包封spCas9 mRNA和向导RNAmAlbT1的LNP配制品。施用给小鼠的LNP剂量为1mg/kg体重的spCas9mRNA加上1mg/kg体重的gRNA。

三天后处死一组LNP单独给药的小鼠，从整个肝脏中提取DNA并使用TIDE分析(E.K.Brinkman等人，Nuc Acid Res[核酸研究](2014)42:e168)测定mAlbT1 gRNA的预期切割位点处的插入缺失(indel)。在TIDE分析中，通过PCR从经过处理的细胞的基因组DNA扩增预期CRISPR/Cas9切割位点的基因组区域，然后进行Sanger测序。使用TIDE软件程序分析测序色谱图，确定预测的切割位点周围区域中的插入和缺失的频率。

在这些实验中，确定中靶位点处插入缺失的频率为25.4％。用LNP对注射了质粒的小鼠给药六天后，通过RO放血取血样到柠檬酸钠中(柠檬酸钠与血液的比率为1:9)，并且通过离心收集血浆。使用FVIII活性测定(Diapharma,Chromogenix

SP因子FVIII，目录号K824086)测量血浆中的FVIII活性。使用

(拜耳(Bayer))(一种重组人FVIII)作为标准品，并且将血液中每mL的FVIII活性单位转化为正常活性的百分比(1U/mL＝100％)。结果汇总在图1中。注射含有6个N-聚糖B结构域替代序列代替B结构域的质粒pCB076的小鼠的平均合成FVIII水平相当于正常人FVIII水平的20％。相反，注射pCB100质粒的小鼠在其血液中没有可检测的FVIII水平，pCB100质粒除了不存在6个N-聚糖B结构域替代序列外与pCB076相同。当与未经基因编辑的(原初)血友病A小鼠相比时，注射了质粒pCB1003、pCB085或pCB080的小鼠在其血液中具有低的或不可测量的FVIII活性，这些质粒含有缺乏6个N-聚糖B结构域替代序列的不同密码子优化的B结构域缺失的FVIII编码序列。注射了pCB1003和pCB080的一些小鼠在其血液中具有可检测的FVIII，在正常值的1％-3％的范围内，表明密码子优化co2(pCB1003)和co4(pCB080)可能比密码子优化co1(pCB100)和co3(pCB085)活性更高。

本研究中小鼠血液中产生的FVIII水平取决于正向(能够产生FVIII蛋白的方向)靶向整合到白蛋白内含子1中的频率和FVIII编码序列的固有表达效率。FVIII编码序列的固有表达效率是转录效率、翻译效率(其随采用的密码子优化的类型而变化)和分泌过程的效率的函数。在FVIII蛋白的情况下，已经报道蛋白的分泌可以是限速步骤，并且与当FVIII在细胞中以高水平表达时可诱导的未折叠蛋白反应相关。(M.Swaroop等人,J Biol Chem[生物化学杂志](1997)272:24121-24；R.J.Kaufman,Blood[血液](2009)114:SCI-19)。

为了区分靶向整合频率(由于HDI或其他因素在供体递送效率方面的可变性而在小鼠之间可能有所不同)与合成FVIII编码序列的固有表达效率，使用微滴式数字PCR(DD-PCR)对靶向整合频率进行定量。DD-PCR是一种用于定量样品中核酸序列的绝对拷贝数的方法。为了仅定量插入白蛋白内含子1中的合成FVIII编码序列盒的正向，设计一对PCR引物，其中正向引物位于白蛋白内含子1中gRNAmALbT1切割位点的位点5’，而反向引物位于FVIII编码序列的5’末端。设计与两个引物之间的序列互补的荧光探针。针对远离mALbT1 gRNA位点的位点处的天然小鼠白蛋白基因序列，设计参考引物/探针组。使用参考引物探针归一化每次测定中输入小鼠基因组DNA的量。

为了进行该分析，在将小鼠用LNP给药后8天处死来自上述实验的小鼠。将整个肝脏匀化，并使用Qiagen

组织试剂盒纯化总基因组DNA。然后使用上述DD-PCR测定法测定相等质量基因组DNA的靶向整合频率。每只小鼠的结果汇总在表2中。正向的靶向整合频率范围为0.09％至0.95％(每100个单倍体基因组0.09至0.95个拷贝)。血液中的峰值FVIII水平与整合频率正相关，表明FVIII的水平取决于整合到白蛋白内含子1中的FVIII盒的拷贝数。在注射pCB076的小鼠中的平均靶向整合频率是0.47±0.26，相比而言在注射pCB100的小鼠中为0.28±0.15，表明在注射含有B结构域替代物代替SQ接头的pCB076的小鼠中有整合频率更高的趋势，但是这种差异在统计上不显著。

表2：与血液中的峰值FVIII水平相比小鼠肝脏中的靶向整合频率

将每只小鼠血液中的FVIII水平归一化为整合频率提供了FVIII编码序列的固有表达效率的量度。FVIII水平除以靶向整合频率得到的比率的平均值对于pCB076是42且对于pCB100是5.3，并且如使用双尾学生T检验所确定的，这种差异具有统计学显著性(p＝0.0004)。这些结果证明pCB076中的合成FVIII编码序列的固有表达效率是pCB100中的编码序列的约8倍。这证明，用编码B结构域替代物的序列代替SQ接头使该密码子优化的FVIII编码序列的固有表达效率提高约8倍。当FVIII编码序列在其中FVIII编码序列由强肝脏特异性启动子驱动的非整合AAV病毒中递送时，这种改善的幅度显著高于对于相同的6个聚糖的基序序列所报告的两倍改善(J.McIntosh等人,Blood[血液](2013)121:3335-44)。

实例2：用B结构域替代物替代SQ接头增加了来自通过AAV递送并整合到白蛋白内含子1中的FVIII供体盒的FVIII表达。

为了确定当使用AAV将合成FVIII编码序列递送到小鼠肝脏时是否发生B结构域替代肽的相同有益作用，构建质粒pCB099(SEQ ID NO:311)和pCB102(SEQ ID NO:341)并包装在AAV8(宾夕法尼亚州莫尔文的载体生物实验室(Vector Biolabs,Malvern,PA)或宾夕法尼亚州费城的赛博泰科科技有限公司(SabTech,Philadelphia,PA))中。用以下元件构建质粒(按顺序)：ITR|gRNA靶位点(对于mAlbT1)|18bp间隔区|剪接受体位点(“SA”)|FVIII编码序列|聚腺苷酸化信号(“sPA”)|gRNA靶位点|ITR。pCB099和pCB102的FVIII编码序列分别与pCB076(具有B结构域替代物)和pCB100(仅具有SQ接头)的FVIII编码序列相同。这些FVIII盒缺乏启动子，因此不能作为非整合AAV游离基因组表达FVIII。通过这些AAV病毒递送的FVIII的表达需要邻近适当启动子的整合。

在这些实验中，向血友病A小鼠静脉注射2×10¹²个载体基因组(“vg”)/千克体重的AAV8-pCB099或AAV8-pCB102。四周后，给小鼠静脉注射两种LNP的1:1混合物，一种LNP包封mAlbT1 gRNA，另一种LNP包封spCas9 mRNA。如实例1所述制备LNP，总剂量为2mg RNA/kg体重。使用实例1中所述的方法在LNP给药后10天测量小鼠血液中的FVIII活性。LNP给药后10天小鼠血液中的FVIII水平(图2)平均为接受AAV9-pCB099的小鼠的正常人FVIII水平的20％，但在接受AAV8-pCB102(缺乏B结构域替代物)的小鼠中为本底水平。

在LNP给药后第24天，处死小鼠，将整个肝脏匀化，并从一部分肝脏裂解物中提取总基因组DNA。使用实例1中描述的DD-PCR测定法定量正向靶向整合到白蛋白内含子1中的频率。每只小鼠的结果汇总在表3中。

结果显示注射AAV8-pCB099的小鼠中的平均靶向整合频率(％每单倍体基因组)是1.86(±0.25)，而对于注射AAV8-pCB102的小鼠而言平均靶向整合频率是0.46(±0.2)。使用双尾学生T检验，这种差异具有统计学显著性(p<0.01)。这些结果证明，包含B结构域替代物导致靶向整合频率高4倍，鉴于先前已经证实包含聚糖代替FVIII的B结构域会提高FVIII的表达水平，该结果是无法预测的。注射AAV8-pCB099的小鼠的血液中的平均FVIII水平是正常值的18.6(±2.2)％，而对于注射AAV8-pCB102的小鼠而言平均FVIII水平是正常值的1.7(±1.1)％。使用双尾学生T检验，这种11倍的差异具有统计学显著性(p<0.01)。通过将各小鼠中的FVIII水平除以靶向整合频率，而将FVIII水平归一化为靶向整合频率(表3)。FVIII活性除以靶向整合频率得到的比率的平均值对于注射AAV8-pCB099的小鼠是10.2(±1.7)，而对于注射AAV8-pCB102的小鼠是3.1(±1.7)。使用双尾学生T检验，这种差异具有统计学显著性(p<0.01)。

这些结果证明AAV8-pCB099中的FVIII编码序列的固有表达效率是AAV8-pCB102中的约3倍。因为AAV8-pCB099与AAV8-pCB102的区别仅在于含有N-聚糖基序的序列的存在，这些数据证明AAV8-pCB099中的N-聚糖基序赋予固有表达效率三倍的提高。因此，小鼠血液中FVIII水平整体提高11倍是由于整合的FVIII编码序列的靶向整合提高4倍和表达效率提高3倍的组合。

表3：与注射AAV8病毒然后注射包封Cas9 mRNA和mALbT1 gRNA的LNP的小鼠的血液中的峰值FVIII水平相比，小鼠肝脏中的靶向整合频率

实例3：B结构域替代物中N-聚糖数目的优化

实例1和实例2的数据证明插入含有6个N-连接的聚糖基序的B结构域替代物提高了FVIII的表达以及靶向整合的频率。然而，这种提高对B结构域替代物中N-聚糖序列数目的依赖性是未知的。因此，我们设计了探测FVIII表达这一方面的实验。具体而言，希望确定FVIII表达提高所需的N-连接的聚糖基序的最小数目。

质粒构建体

为了研究不同数目的N-聚糖基序对表达的影响，构建了一系列含有1至9个N-聚糖基序的供体质粒。这些汇总在表4中。所有质粒按5’至3’的顺序由以下序列元件组成：mAlbT1 gRNA的靶序列|18bp间隔区|剪接受体|B结构域缺失的FVIII编码序列，其中信号肽被TG二核苷酸|聚腺苷酸化信号序列替代。在这些质粒的每一个中，FVIII编码序列基于pCB076中使用的密码子优化序列(参见实例1)，其中信号肽被TG二核苷酸替代，但在B结构域替代物中具有1至9个N-连接的糖基化位点。所有质粒均含有相同的基于pUC19的细菌质粒骨架(含有细菌复制起点和卡那霉素抗性基因)。

表4：在B结构域替代物中含有不同数目的N-糖基化位点三联体的FVIII供体质粒

质粒ID	N-聚糖基序数目	SEQ ID NO.	蛋白SEQ ID:
				pCB1030	1	370	371
pCB1029	2	372	373
				pCB1018	3	331	362
pCB1017	4	330	363
				pCB1007	5	326	364
pCB077	6	317	365
				pCB1006	6(在C端三联体中S变为T)	325	366
pCB1008	7	327	367
				pCB1015	8	328	368
pCB1016	9	329	369

构建体的体内测试：5个、6个和7个聚糖

使用实例1的方法，通过流体动力学注射向血友病A小鼠给药每只小鼠30μg的质粒pCB077、pCB1006、pCB1007或pCB1008。一天后，为相同小鼠眶后注射包封spCas9 mRNA和mALbT1 gRNA的LNP的1:1混合物，总RNA剂量为2mg/kg体重。LNP如实例1中所述而制备。六天后使用实例1中所述的方法测量小鼠血液中的FVIII活性。结果汇总在图3中，并证明由四种质粒供体产生的FVIII水平相似。

本研究中小鼠血液中产生的FVIII水平取决于正向(能够产生FVIII蛋白的方向)靶向整合到白蛋白内含子1中的频率和FVIII编码序列的固有表达效率。FVIII编码序列的固有表达效率是转录速率、翻译效率(其受所用的密码子优化的类型的影响)和分泌过程的效率的函数。在FVIII蛋白的情况下，已经提出蛋白的分泌可以是限速步骤(M.Swaroop等人，同上)并且与当FVIII在细胞中以高水平表达时发生的未折叠蛋白反应相关(R.J.Kaufman，同上)。为了区分预期在各小鼠之间变化的靶向整合频率与整合的合成FVIII编码序列的固有表达效率，如实例1所述使用微滴式数字PCR(DD-PCR)定量靶向整合频率。

在将小鼠用LNP给药后8天，处死小鼠，将整个肝脏匀化，并使用Qiagen

组织试剂盒纯化总基因组DNA。然后使用DD-PCR测定相等质量基因组DNA的靶向整合频率。每只小鼠的结果汇总在表5中。各小鼠中正向靶向整合频率范围为0.17％至0.70％，但每组小鼠内四种质粒的平均值相似，对于pCB077、pCB1006、pCB1007和pCB1008而言分别为0.49％、0.47％、0.52％和0.38％。注射pCB077、pCB1006、pCB1007和pCB1008的小鼠的FVIII活性与TI的比率的平均值分别为51.33、48.54、48.9和38.9，并且质粒之间的差异不具有统计学显著性。这些结果证明含有5个N-聚糖位点(pCB1007)或7个聚糖位点(pCB1008)，或其中一个聚糖三肽基序从NDS改变为NDT(pCB1006)的合成FVIII编码序列与编码6个N-聚糖位点的合成FVIII编码序列(pCB077)相比具有相似的固有表达效率。

用质粒pCB1015(SEQ ID NO:328)和pCB1016(SEQ ID NO:329)进行相同的小鼠研究，其中N-聚糖基序的数目分别变为8和9。另外，构建除了仅具有一个或两个N-聚糖基序之外与pCB077相同的质粒，并使用在LNP中递送的相同gRNA和spCas9 mRNA测试它们在靶向整合到小鼠白蛋白内含子1中之后表达FVIII的能力。

表5：与血液中的峰值FVIII水平相比小鼠肝脏中的靶向整合频率

构建体的体内测试：3个、4个和5个聚糖

纯化质粒pCB1007、pCB1017和pCB1018并如上所述施用于血友病A小鼠。一天后，给予小鼠眶后(RO)注射基于C12-200的包封spCas9 mRNA(1mg/kg)和向导RNA(gRNA)mAlbT1(1mg/kg)的LNP。在LNP给药后5天和7天通过RO放血取血样到柠檬酸钠中(柠檬酸钠与血液的比率为1:9)，并通过离心收集血浆。使用实例1中所述的方法测量血浆中的FVIII活性。

在注射pCB1007、pCB1018和pCB1018的小鼠中，第5天血液中的FVIII活性分别平均为8.1％、5.0％和23.5％。第7天，在注射pCB1007、pCB1018和pCB1018的小鼠中FVIII活性分别平均为7.9％、3.0％和13.5％。因此，注射具有4个N-聚糖基序(pCB1017)或3个N-聚糖基序(pCB1018)的质粒的小鼠中的FVIII表达与接受在B结构域替代物中含有5个N-聚糖基序的质粒(pCB1007)的小鼠中的FVIII表达相似。

在LNP施用后第7天取血样后，处死小鼠并取出整个肝脏并储存在RNAlater^TM缓冲液(凯杰(Qiagen))中。使用基于珠粒的匀浆器匀化整个肝脏，并使用Qiagen DNA/RNA小提试剂盒(目录号80204)从匀浆的等分试样中纯化DNA。如实例1所述，通过DD-PCR分析肝脏基因组DNA中FVIII供体盒正向整合的频率。对于注射pCB1007、pCB1017和pCB1018的小鼠而言，平均靶向整合频率分别为0.27％、0.27％和0.55％，并且这些值没有统计学差异(双尾学生T检验)。

将每只小鼠血液中的FVIII水平归一化为整合频率提供了FVIII编码序列的固有表达效率的量度。FVIII水平除以靶向整合频率得到的比率的平均值对于注射pCB1007(5个N-聚糖)的小鼠是23.6，对于注射pCB1017(4个N-聚糖)的小鼠是11.6，并且对于注射pCB1018(3个N-聚糖)的小鼠是23.3。注射pCB1017和pCB1018的小鼠的FVIII除以靶向整合的比率与注射pCB1007的小鼠的FVIII除以靶向整合的比率在统计学上没有差异。

这些数据证明，使用含有具有四个N-聚糖基序或三个N-聚糖基序的B结构域替代物的合成FVIII编码序列，当整合到白蛋白内含子1中时，导致与含有五个N-聚糖基序的FVIII编码序列相似的表达。因此，具有带三个N-聚糖基序的B结构域替代物的合成FVIII构建体提供了与由带五个N-聚糖基序的B结构域替代物提供的FVIII表达相当的提高的FVIII表达。据推断，因为含有五个N-聚糖基序的B结构域替代物与含有六个N-聚糖基序的B结构域替代物等效，所以我们推断三个N-聚糖基序与六个N-聚糖基序效力相等。

构建体的体内测试：一个和两个聚糖

将质粒pCB1018(包含具有带三个N-聚糖基序的B结构域替代物的FVIII供体)、pCB1029(包含具有带两个N-聚糖基序的B结构域替代物的FVIII供体)和pCB1030(包含具有带一个N-聚糖基序的B结构域替代物的FVIII供体)纯化并如上所述通过流体动力学注射施用于血友病A小鼠。一天后，给予小鼠眶后(RO)注射基于C12-200的包封spCas9 mRNA(1mg/kg)和gRNA mAlbT1(1mg/kg)的LNP。在LNP给药后5天和8天通过RO放血取血样到柠檬酸钠中(1:9柠檬酸钠:血液)，并通过离心收集血浆。如上所述测量血浆中的FVIII活性，并表示为正常活性的百分比(1U/mL＝100％)。

在注射pCB1018、pCB1029和pCB1030的小鼠中，第5天血液中的FVIII活性分别平均为12.8％、15.8％和13.4％。第八天，在注射pCB1018、pCB1029和pCB1030的小鼠中FVIII活性分别平均为13.8％、14.5％和16.0％。因此，注射含有带3个N-聚糖基序(pCB1018)、2个N-聚糖基序(pCB1029)或1个N-聚糖基序(pCB1030)的B结构域替代物的质粒的小鼠中的FVIII表达彼此相似。

在LNP施用后第7天取血样后，处死小鼠并取出整个肝脏并储存在RNAlater^TM缓冲液(凯杰)中。将整个肝脏匀化，并且如实例1所述，通过DD-PCR分析肝脏基因组DNA中FVIII供体盒正向整合的频率。对于注射pCB1018、pCB1029和pCB1030的小鼠，平均靶向整合频率分别为0.29％、0.47％和0.36％：这些值没有统计学差异(双尾学生T检验)。

将每只小鼠血液中的FVIII水平归一化为整合频率提供了FVIII编码序列的固有表达效率的量度。FVIII水平除以靶向整合频率得到的比率的平均值对于注射pCB1018(3个N-聚糖)的小鼠是41.9，对于注射pCB1029(2个N-聚糖)的小鼠是31.4，并且对于注射pCB1030(1个N-聚糖)的小鼠是40.2。注射pCB1029(3个N-聚糖)和pCB1030(2个N-聚糖)的小鼠的固有表达效率与注射pCB1018(3个N-聚糖)的小鼠的固有表达效率没有统计学差异。这些数据证明，包含含有2个N-聚糖基序(氨基酸序列NATNVS)或1个N-聚糖基序(氨基酸序列NAT)的B结构域替代物的FVIII供体盒以与含有具有3个N-聚糖基序的B结构域替代物的FVIII供体盒相同的效率表达。

表6：在注射FVIII供体pCB1018、pCB1029和pCB1030的小鼠中的FVIII活性、靶向整合频率和相对于整合频率归一化的FVIII活性

包含含有0、1、2、3、4、5、6或7个N-连接的聚糖基序的B结构域替代物的FVIII供体盒的体内FVIII表达结果的比较

比较以上测试的不同FVIII盒的固有表达效率。使用相同品系的小鼠(血友病A小鼠)和相同的实验方案，在总共5项研究中产生实例3中描述的数据集。在第5天或第6天测量FVIII活性，并在第8天或第9天再次测量FVIII活性。在从最后一次FVIII活性测量当天(第8或9天)处死的小鼠整个肝脏中提取的DNA中测量靶向整合频率。固有表达效率的汇编示于图8。该比较中包括具有不同密码子优化的FVIII盒。可对称为“co1”的具有密码子优化的供体进行不同数目的聚糖对归一化FVIII表达的影响的比较，这些供体是图8中的前九个柱。这些供体含有FVIII盒，其区别仅在于B结构域替代物中N-聚糖基序的数目。含有1-7个N-聚糖基序的聚糖变体的固有表达效率没有显著差异。虽然具有2个N-聚糖基序的供体(“co1-2”)显示出归一化FVIII活性较低的趋势(值为30，相比而言具有5、6或7个N-聚糖的变体的值为约45)，这种差异在统计学上不显著。没有N-聚糖基序代替B结构域的供体(“co1-0”)表现出显著较低的归一化FVIII活性(值为7.4，相比而言具有聚糖和相同密码子优化的变体为40至50)。具有5个聚糖和密码子优化的FVIII供体co2与具有5个N-聚糖基序的co1等效，而具有5个N-聚糖的co3以具有5个N-聚糖的co1的效率的约50％表达。这些数据证明，含有包含单个N-聚糖基序的B结构域替代物的FVIII编码序列足以赋予与用包含2至7个N-聚糖基序的B结构域替代物获得的FVIII表达水平相当的FVIII表达水平。含有包含单个N-聚糖基序的B结构域替代物的FVIII编码序列(图8中的“co1-1”/pCB1030)是缺少B结构域替代物的相同FVIII编码序列(“co1-0”/pCB100)表达效率的约5.4倍(40.1/7.4)。因此，含有具有少于6个N-聚糖(例如5个N-聚糖、4个N-聚糖、3个N-聚糖、2个N-聚糖或1个N-聚糖)的B结构域替代物的FVIIII编码序列具有用于基因编辑方法的优点，这是由于添加到FVIII蛋白的非天然氨基酸的数目减少，以及DNA供体的大小减少。

实例4：在小鼠中靶向整合到安全港基因座(例如白蛋白基因座)中后用于表达的FVIII编码序列的最佳密码子优化的鉴定

质粒构建体

进行实验以确定不同形式的密码子优化对合成FVIII表达的影响。通过应用可在基因技术股份公司(co3)获得的市售算法，对含有14个氨基酸的SQ接头代替B结构域(1438个氨基酸的总编码序列)的成熟(缺乏信号肽)B结构域缺失的人FVIII编码序列进行密码子优化，这将CG二核苷酸的数目从天然序列中存在的54个增加到198个。B结构域缺失的FVIII的co3形式的变体(“co4”)通过以下方式产生：通过人工消除全部198个CG二核苷酸，通过根据公开的智人密码子表选择作为次最频繁密码子或更频繁使用的密码子的替代密码子(H.C.Brown等人,Mol Ther Meth&Clin Dev[分子疗法-方法和临床开发](2018)9:57-69(doi:10.1016/j.omtm.2018.01.004)。B结构域缺失的FVIII(“FVIII-BDD”)编码序列使用基于在肝脏中高度表达的基因的密码子偏倚的算法(H.C.Brown等人，同上)进行密码子优化以产生含有176个CG二核苷酸的FVIII-BDD co2。还合成了这种经进一步修饰以去除所有CG二核苷酸的构建体，这里称为FVIII-BDD co5。还构建了J.McIntosh等人，Blood[血液](2013)121(17):3335-44和US 9,393,323的经密码子优化的FVIII-BDD编码序列(其中的SEQ ID NO:1)，在本文中称为“co1”。合成了WO 2011/005968中公开的含有245个CG二核苷酸的B结构域缺失的FVIII编码序列(其中的SEQ ID NO:5)的进一步密码子优化的变体(本文中的“FVIII-BDD co6”)。质粒构建如下：pUC19质粒骨架|ITR|gRNAmALbT1的靶位点|18bp间隔区|剪接受体(SA)|TG二核苷酸|B结构域缺失的FVIII序列|聚A(sPA)|gRNA mALbT1的靶位点|ITR，其中供体序列密码子优化为co2(pCB1002，SEQ ID NO:323)、co3(pCB1001，SEQID NO:322)、co4(pCB1000，SEQ ID NO:321)或co5(pCB103，SEQ ID NO:336)。

每个质粒中的FVIII供体盒侧接有AAV2 ITR，并用于使用基于HEK293的包装系统将这些盒包装到AAV8中，并使用氯化铯密度离心纯化。将所得AAV8病毒(命名为AAV8-pCB103、AAV8-pCB1002、AAV8-pCB1001和AAV8-pCB1000)使用Q-PCR或DD-PCR，用位于FVIII基因编码序列内的引物/探针组滴定。这些FVIII供体盒被设计为仅在靶向整合到白蛋白内含子1中后表达FVIII。供体盒缺乏启动子，因此不能从非整合游离型病毒基因组转录成mRNA。另外，所有FVIII供体盒在FVIII编码序列的N端都缺少信号肽序列，因此可能由非整合游离型病毒拷贝表达的任何蛋白都不能分泌到循环中。在整合到白蛋白内含子1中之后，从基因组中的白蛋白启动子转录产生包含小鼠白蛋白外显子1、内含子1的一部分和合成FVIII编码序列的杂交前mRNA，终止于FVIII供体盒的5’末端所包含的多聚腺苷酸化信号。在白蛋白外显子1的剪接供体与FVIII供体盒的5’末端所包含的剪接受体之间剪接这种前mRNA产生mRNA，其中白蛋白的外显子1编码与成熟FVIII编码序列框内融合的信号肽和前原肽。由这种杂交mRNA编码的蛋白通过细胞的分泌机制进行加工，在此期间，白蛋白的信号肽和前原肽应被裂解掉，产生预测的双链FVIII分子，其中在重链的N端包括在FVIII中通常不存在的三个氨基酸。

构建体的体内测试

为了测试这些配制品，为4或5只血友病A小鼠的队列经由尾静脉注射每种AAV8病毒(AAV8-pCB103、AAV8-pCB1002、AAV8-pCB1001和AAV8-pCB1000)，剂量为2×10¹² vg/kg。四周后，所有小鼠以2mg/kg的总RNA剂量静脉注射包封mAlbT1 gRNA和spCas9 mRNA的LNP的1:1混合物。根据实例1中描述的方法配制LNP。使用实例1中所述的方法测量血液中的FVIII活性。结果汇总在图4中。

在这些实验中，接受AAV8-pCB103和AAV8-pCB1002(含有分别具有密码子优化co5和co2的FVIII-BDD)的小鼠在其血液中没有可检测的FVIII活性。接受病毒pCB1001(密码子优化的co3)的小鼠在LNP给药后第11天具有平均8％的FVIII活性并且在第28天具有平均20％的FVIII活性。接受病毒AAV8-pCB1000(密码子优化co4)的5只小鼠中有3只的FVIII活性水平是正常值的1％至3％。这些数据证明，使用GeneArt算法密码子优化的FVIII-BDDDNA序列(AAV8-pCB1001，co3)导致比基于肝脏中高度表达的基因的最频繁的密码子进行密码子优化的FVIII-BDD(AAV8-pCB103和AAV8-pCB1002)水平更高的FVIII表达。与其中使用保留CG二核苷酸的GeneArt算法对FVIII-BDD进行密码子优化的相同盒相比，修饰GeneArt密码子优化的FVIII-BDD序列以去除CG二核苷酸(AAV8-pCB1000，co4)导致FVIII表达降低。与co2和co5密码子优化不同，具有co4密码子优化的FVIII-BDD能够产生可测量的FVIII活性。接受AAV8-pCB102(co1密码子优化的FVIII-BDD DNA序列，参见实例2)的小鼠并未产生当在AAV8中以2×10¹² vg/kg的相同剂量递送并且使用相同剂量的LNP时(实例2，图2，AAV8-pCB102)在血友病A小鼠中的FVIII活性。这证明在小鼠中靶向整合到白蛋白内含子1中后，对于FVIII的表达，co1劣于co3和co4密码子优化的FVIII-BDD序列。

实例5：在靶向整合到编码具有五个N-聚糖和替代性密码子优化co4和co5的合成FVIII的供体模板的白蛋白内含子1中之后FVIII在小鼠中的表达。

为了测试使用具有B结构域替代物的合成FVIII的不同密码子优化的影响，使用命名为co1、co4和co5，并且进一步含有B结构域替代物代替B结构域的三种经密码子优化的DNA序列构建缺乏信号肽的FVIII-BDD编码序列。B结构域替代物含有五个N-聚糖基序(序列：ATNVSNNSNTSNDS，SEQ ID NO:343)。这些编码序列在5’侧上侧接有mALbT1 gRNA的靶位点、18bp间隔区、剪接受体和两个核苷酸(TG)。TG二核苷酸在剪接到小鼠白蛋白外显子1后保持正确的阅读框。在编码序列的3’末端包含短的多聚腺苷酸化信号(sPA)。这三种质粒中的合成FVIII编码序列编码具有相同氨基酸序列的FVIII蛋白，但由于密码子优化不同，编码序列由不同的DNA序列编码。在血友病A小鼠中测试命名为pCB1007(co1，SEQ ID NO:326)、pCB1019(co4，SEQ ID NO:332)和pCB1020(co5，SEQ ID NO:333)的这些质粒在通过mALbT1 gRNA靶位点处的CRISPR/Cas9裂解介导靶向整合到白蛋白内含子1中之后表达活性FVIII蛋白的能力。

实验方案与实例1中的相同。使用Qiagen

大提试剂盒(目录号12362)纯化质粒pCB1007、pCB1019和pCB1029的质粒DNA，然后在0.9％盐水中稀释到最终浓度为15μg/mL。通过HDI向血友病A小鼠队列每只小鼠注射2mL经稀释的质粒DNA。一天后给予小鼠眶后注射基于C12-200的包封spCas9 mRNA(1mg/kg体重)和gRNA mAlbT1(1mg/kg体重)的LNP。在给药后3天处死仅注射包封spCas9 mRNA和mALbT1 gRNA的LNP的五只血友病A小鼠的队列，并分析从整个肝脏提取的基因组DNA在白蛋白内含子1中的靶标位点处的插入缺失。平均插入缺失频率为52.9％，表明在肝脏中的中靶位点有效裂解。

用LNP对注射了质粒的小鼠给药六天和九天后，通过RO放血取血样到柠檬酸钠中(柠檬酸钠与血液的比率为1:9)，并且通过离心收集血浆。使用实例1中所述的方法测量血浆中的FVIII活性。结果汇总在图5中。

在LNP给药后第6天，接受质粒pCB1007、pCB1019或pCB1020的小鼠中的平均FVIII活性为正常值的22.3％、17.6％和17.8％。在LNP给药后第9天，接受质粒pCB1007、pCB1019或pCB1020的小鼠中的平均FVIII活性为正常值的19.7％、14.1％和14.9％。当使用同方差(2样本等方差)双尾T检验(全部p值>0.28)评价时，以三种质粒给药的小鼠中的FVIII水平在第6天或第9天没有统计学显著差异。

这些结果证明，在编码具有含5个N-聚糖基序的B结构域替代物代替B结构域的合成FVIII的供体模板的情况下，密码子优化co1、co4和co5(所有这些都缺少CG二核苷酸)在靶向整合到白蛋白内含子1中之后产生相似水平的FVIII。因此，特定密码子优化没有明显优势，并且任何无CpG的密码子优化(例如，co1、co4和co5)在靶向整合后提供相似水平的合成FVIII蛋白。

实例6：B结构域替代物和F309突变为S或A的组合

据报道，A1结构域中伴侣免疫球蛋白结合蛋白(BiP)的潜在结合位点内的点突变(F309S)使培养的细胞中B结构域缺失的FVIII的分泌提高约3倍(M.Swaroop等人,J BiolChem[生物化学杂志](1997)272:24121-24)。FVIII的F309A突变蛋白类似地提高了分泌。据报道，与B结构域缺失的FVIII相比，B结构域的F309S和226个氨基酸的N端部分的组合使小鼠体内的FVIII水平提高20至30倍，而添加B结构域的226个氨基酸的N端使FVIII水平仅提高5倍(H.Z.Miao等人,Blood[血液](2004)103(9):3412-19)。

为了评价B结构域替代物与用丝氨酸或丙氨酸取代309处苯丙氨酸残基的组合是否引起靶向整合后FVIII表达的进一步改善，构建了质粒pCB1025(SEQ ID NO:334)和pCB1026(SEQ ID NO:335)。两种质粒均含有co4密码子优化的FVIII DNA序列，该序列具有含5个N-连接的糖基化位点的B结构域替代物。这些质粒具有以下元件：pUC19质粒骨架|gRNA mALbT1的靶位点|18bp间隔区|剪接受体(SA)|TG二核苷酸|具有五个位点B结构域替代物的FVIII序列(co4)|聚A(sPA)。质粒pCB1007与pCB1025和pCB1026相同，除了pCB1025在位置309处具有Ala而不是Phe，而pCB1026在位置309处具有Ser而不是Phe以外。质粒pCB1007在该研究中用作比较物。

实验方案与实例1中的相同。使用Qiagen

大提试剂盒(目录号12362)纯化质粒pCB1007、pCB1025和pCB1026，然后在0.9％盐水中稀释到最终浓度为15μg/mL。通过HDI向血友病A小鼠队列每只小鼠注射2mL经稀释的质粒DNA。一天后，给予小鼠RO注射基于C12-200的包封spCas9 mRNA(1mg/kg)和gRNA mAlbT1(1mg/kg)的LNP。LNP(pCB1025、pCB1026)给药后5天或LNP(pCB1019)给药后6天，通过RO放血取血样到柠檬酸钠中(柠檬酸钠与血液的比率为1:9)，并且通过离心收集血浆。使用实例1中所述的方法测量血浆中的FVIII活性。在注射pCB1019、pCB1025或pCB1026的三组小鼠中FVIII活性相似，平均FVIII活性分别为17.6％、27.2％和24.5％。

在LNP后第9天(注射pCB1019的小鼠)或LNP后第7天(注射pCB1025和pCB1026的小鼠)还测定了相同血友病A小鼠的血液中的FVIII活性。然后处死小鼠，准备整个肝脏并如上述实例1所述分析整合频率。三组之间的靶向整合频率相似，注射pCB1019的小鼠的平均频率为0.42，注射pCB1025的小鼠的平均频率为0.47，注射pCB1026的小鼠的平均频率为0.36。

将每只小鼠血液中的FVIII水平归一化为整合频率提供了FVIII编码序列的固有表达效率的量度。FVIII水平除以靶向整合频率得到的比率的平均值对于注射pCB1019的小鼠是37.4，对于注射pCB1025的小鼠是41.5，并且对于注射pCB1026的小鼠是49.9。与注射pCB1019的小鼠相比，针对注射pCB1025和pCB1026的小鼠的靶向整合归一化的FVIII活性的差异在统计学上不显著(双尾学生T检验)，这证明将氨基酸F309改变为丝氨酸或丙氨酸(在含有5个N-聚糖基序代替B结构域的FVIII-BDD盒的情况下)并未提高FVIII表达。因此，并非对FVIII蛋白进行的所有氨基酸改变在靶向整合到白蛋白内含子1中后都对FVIII表达具有影响。

实例7：通过CRISPR/Cas核酸酶将合成FVIII靶向整合到转铁蛋白内含子1中引起治疗水平的人FVIII的表达。

DNA构建体

为了检查向转铁蛋白基因座的整合和从转铁蛋白基因座的表达，作为白蛋白基因座的替代，如下按5’至3’的顺序用序列元件构建人FVIII供体盒(SEQ ID NO:224)：AAV2的反向末端重复序列(ITR)|gRNA mTF-T2的靶位点|18bp间隔区|剪接受体|编码小鼠转铁蛋白的信号肽的最后4个氨基酸的序列(ggctgtgtctggct，SEQ ID NO:225)|合成FVIII编码序列|多聚腺苷酸化信号(spA)|gRNA mTF-T2的靶位点|和AAV2的反向末端重复序列(ITR)。gRNA mTF-T2的靶位点的序列是小鼠基因组中靶序列的反向互补序列，可能有利于正向整合。聚腺苷酸化信号是一个49bp的短序列，已报道该序列会有效地指导聚腺苷酸化(N.Levitt等人,Genes Dev[基因与发育](1989)3:1019-25)。合成FVIII编码序列编码含有氨基酸序列

的代替B结构域的B结构域替代物，并且包括替代B结构域的31个氨基酸的异源序列。该序列含有六个对应于N-连接的糖基化位点的三肽(以粗体表示)，并且表明其可提高FVIII的表达(J.McIntosh等人,Blood[血液](2013)121:3335-44)。

在用三种质粒转染的HEK293细胞中使用已确立的病毒包装方法实现将pCB1009FVIII供体DNA包装到AAV8中；一种编码AAV包装蛋白，第二种编码腺病毒辅助蛋白，以及第3种含有侧翼是AAV ITR序列的FVIII供体DNA序列。转染的细胞产生由第一质粒上编码的AAV衣壳蛋白的组成所指定的血清型的AAV颗粒。从细胞上清液或从上清液和溶解的细胞中收集这些AAV颗粒，并通过CsCl梯度纯化。通过微滴式数字PCR(DD-PCR)测量供体DNA的基因组拷贝数来定量纯化的病毒颗粒。

构建体的体内测试

五只血友病A小鼠的队列以2×10¹² vg/kg体重的剂量向尾静脉中静脉(i.v.)注射AAV8-pCB1009。AAV8病毒优先转导肝细胞。四周后，以2mg/kg体重的总RNA剂量，向相同小鼠静脉注射两种LNP的1:1(按RNA质量计)混合物，一种LNP包封spCas9 mRNA，一种LNP包封向导RNA mTF-T2。LNP主要被肝细胞吸收。LNP给药后10天，获得血样并如上所述进行测定。FVIII活性平均为正常人FVIII水平的954％(±251％)(图6)，相当于9.54IU/mL或是无血友病的人中的平均水平的9.5倍。原初血友病A小鼠的FVIII活性不可检测(<正常值的0.5％)。

这些数据证明将FVIII编码序列靶向整合到转铁蛋白的内含子1中可引起高水平的FVIII表达和活性，证明了该方法用于治疗具有缺陷型FVIII的病状诸如血友病A的效用。

实例8：另外的递送模式

在另一个实例中，使用非病毒LNP递送系统在体内递送供体模板。将DNA分子包封到类似于上述那些的LNP颗粒中，并通过静脉注射递送至肝脏。虽然DNA从内体向细胞质的逃逸相对有效地发生，但是带电的DNA大分子向细胞核的易位中却效率不高。在一种情况下，通过将AAV ITR序列并入供体模板中来模拟AAV基因组，从而改善DNA向细胞核的递送。在这种情况下，ITR序列使DNA稳定或改善核易位。从供体模板序列中去除CG二核苷酸(CpG序列)也改善了核递送。含有CG二核苷酸的DNA被先天免疫系统识别并消除。去除人工DNA序列中存在的CpG序列改善了通过非病毒载体和病毒载体递送的DNA的持久性。密码子优化的过程通常会增加CG二核苷酸的含量，这是因为在许多情况下最常见的密码子在第3位置具有C残基，这在下一个密码子以G开头时会增加产生CG的概率。在血友病A小鼠中评价LNP递送供体模板并于一小时至五天后接着递送含gRNA和Cas9 mRNA的LNP的组合。

gRNA和Cas9 mRNA的体内递送可以通过已知方法完成。在一种方法中，从AAV病毒载体表达gRNA和Cas9蛋白。在这种情况下，gRNA的转录由U6启动子驱动，而Cas9 mRNA的转录则由普遍存在的启动子(例如EF1-α)或肝脏特异性启动子/增强子(诸如甲状腺素运载蛋白启动子/增强子)驱动。spCas9编码序列的大小(4.4Kb)妨碍了在单个AAV中包含spCas9和gRNA盒，因而需要单独的AAV来递送gRNA和spCas9。在第二种情况下，使用具有促进病毒基因组自我灭活的序列元件的AAV载体。在这种情况下，在载体DNA中包含gRNA的裂解位点导致体内载体DNA的裂解。通过在裂解时阻断Cas9表达的位置中包含裂解位点，将Cas9表达限制在较短的时间段内。在将gRNA和Cas9递送至体内细胞的第三种替代方法中，使用非病毒递送方法。在一个实例中，将LNP用作非病毒递送方法。有几种不同的可电离的阳离子脂质可用于LNP。这些包括C12-200、MC3、LN16和MD1等。在一种类型的LNP中，GalNac部分附接到LNP的外部，并充当经由脱唾液酸糖蛋白受体摄取到肝脏中的配体。这些阳离子脂质中的任一种均可用于配制LNP，以将gRNA和Cas9 mRNA递送至肝脏。

实例9：治疗性编码序列在小鼠纤维蛋白原α内含子1处的靶向整合

为了检查纤维蛋白原α基因座的整合和表达，作为白蛋白或转铁蛋白基因座的替代，构建了AAV8病毒(AAV8-pCB1010，SEQ ID NO:361)，其具有带以下元件的盒：gRNA mFGA-T6的靶位点、18bp间隔区、FIX剪接受体、成熟人FVIII编码序列(N端经修饰以在剪接至内源FGA外显子1后完成FGA信号肽)(其中B结构域被6个N-聚糖基序替代)、多聚腺苷酸化序列和gRNA mFGA-T6的靶位点。

向血友病A小鼠注射AAV8-pCB1010，28天后注射包封T6 gRNA(靶向小鼠纤维蛋白原α内含子1)和Cas9 mRNA的LNP。LNP给药后10天，通过眶后放血取血样到装有柠檬酸钠(柠檬酸钠与血液的比率为1:9)的毛细管中，并通过离心收集血浆。然后如上所述测定血浆样品的FVIII。测定结果报告为正常人FVIII活性的百分比(正常值定义为1IU/mL)。FVIII活性平均为正常人FVIII水平的1124％(±527％)，相当于11.24IU/mL或是无血友病的人中的平均水平的11倍。原初血友病A小鼠的FVIII活性不可检测(<正常值的0.5％)。因为AAV8-pCB1010病毒含有FVIII盒，其中编码序列缺乏信号肽并且也缺乏启动子，所以单独的这种病毒不能产生分泌型FVIII蛋白。

这些数据证明纤维蛋白原作为编码序列的插入位点的适用性。此外，他们证明B结构域替代的FVIII序列可用于表达有用量的FVIII。因此，此类构建体和方法可用于治疗与缺陷型FVIII相关的病症。

实例10：在培养的原代人肝脏细胞中在人白蛋白内含子1处有效裂解的向导RNA的鉴定和选择

为了证明本发明的系统在人肝脏细胞中的操作，制备了四种gRNA(T4-SEQ ID NO:357、T5-SEQ ID NO:358、T11-SEQ ID NO:359和T13-SEQ ID NO:360)，其基于在人和非人灵长类动物之间具有完美的同一性并针对HuH7和HepG2细胞中的切割效率进行筛选，用于评价在原代人肝脏细胞中的切割效率。将原代人肝脏细胞(从BioIVT获得)解冻，转移至冷冻保存的肝细胞恢复培养基(CHRM)(Gibco)中，低速沉淀，然后以0.7×10⁶个细胞/mL的密度接种在预先涂有胶原IV(康宁)的24孔板中的InVitroGRO^TMCP培养基(BioIVT)加上Torpedo^TM抗生素混合物(BioIVT)中。将板在5％CO₂中于37℃孵育。细胞粘附后(接种后3-4小时)，用新鲜温热的完全培养基洗去未粘附到板上的死细胞，添加另外的培养基，并将细胞在5％CO₂中于37℃孵育。为了转染细胞，将Cas9 mRNA(Trilink)和向导RNA在冰上解冻，然后以每孔0.6μg mRNA和0.2μg向导RNA添加到30μL Opti-Mem^TM培养基(Gibco)中。将以30μL按2:1体积:总核酸重量稀释于Opti-Mem^TM中的MessengerMax^TM(赛默飞世尔)与Cas9mRNA/gRNA Opti-Mem^TM溶液在室温下孵育20分钟。将该混合物滴加到24孔板中每孔培养的肝细胞的500μL肝细胞接种培养基中，并将细胞在5％CO₂中于37℃孵育。第二天早上，洗涤细胞并重新饲养。转染后48小时，通过向每个孔中添加200μL温热的0.25％胰蛋白酶-EDTA(Gibco)并在37℃孵育5至10分钟，收集细胞用于基因组DNA提取。一旦细胞脱落，就添加200μL FBS(Gibco)使胰蛋白酶失活。添加1mL PBS(Gibco)之后，将细胞以1200rpm沉淀三分钟，然后重悬于50μL PBS中。按照试剂盒说明书，使用MagMAX^TMDNA Multi-Sample Ultra 2.0试剂盒(应用生物系统公司(Applied Biosytems))提取基因组DNA。使用分光光度计分析基因组DNA的质量和浓度。对于TIDE分析，使用在预测的中靶裂解位点侧翼的引物(AlbF:CCCTCCGTTTGTCCTAGCTTTTC,SEQ ID NO:353，和AlbR:CCAGATACAGAATATCTTCCTCAACGCAGA,SEQ ID NO:354)和

PCR SuperMix High Fidelity(Invitrogen^TM)，使用35个PCR循环和55℃的退火温度对基因组DNA进行PCR扩增。通过琼脂糖凝胶电泳分析PCR产物，以确认已生成合适大小的产物(1053bp)，然后纯化并使用引物(正向引物：CCTTTGGCACAATGAAGTGG，SEQ ID NO:355，反向引物：GAATCTGAACCCTGATGACAAG，SEQ ID NO:356)进行测序。使用命名为Tsunami的TIDES算法修改版本(E.K.Brinkman等人，Nuc AcidsRes[核酸研究](2014)42(22):e168)分析序列数据，该算法确定gRNA/Cas9复合物的预测切割位点处存在的插入缺失的频率。

测试含有T4(SEQ ID NO:357)、T5(SEQ ID NO:358)、T11(SEQ ID NO:359)和T13(SEQ ID NO:360)向导的20个核苷酸靶的序列或19个核苷酸的靶序列(在5’末端的1bp较短序列)的向导RNA。19个核苷酸的gRNA可具有更高的序列特异性，但较短的向导可具有较低的效力(双链裂解的效率，作为插入缺失进行测量)。将靶向人AAVS1基因座和人补体因子的对照向导包括在内以在供体之间进行比较。转染后48小时，使用TIDES方法测量白蛋白内含子1中靶位点处的插入缺失频率。图7汇总了来自四个不同人类供体的原代肝细胞转染的结果。

结果证明，不同向导的切割效率范围在20％至80％之间。每种白蛋白gRNA的20个核苷酸型式始终比19个核苷酸的变体更有效。20个核苷酸的gRNA的优良效力可抵消19个核苷酸的gRNA就脱靶切割较低而言可能具有的任何潜在益处。向导RNA T4在四个细胞供体上表现出最一致的切割，其插入缺失频率为约60％。

实例11：评价在具有靶向转铁蛋白基因座的gRNA的单一LNP剂量后包封具有由不同数目的N-聚糖组成的B结构域替代物的密码子优化的FVIII编码序列(无CpG)的AAV8病毒的FVIII表达

该研究评价了编码FVIII的AAV8病毒的FVIII表达，其中B-结构域替代物含有0、1、3、5或6个聚糖。对FVIII编码序列进行密码子优化，然后人工消除CpG。该研究中使用的构建体如图9所示。

第0天，通过尾静脉注射用相应的病毒对血友病A小鼠(8-10周龄)给药。第28天，向血友病A小鼠眶后注射包封Cas9 mRNA(411μg/ml)和向导RNAmTF-T2(379μg/ml)的脂质纳米颗粒(LNP)。研究组和剂量示于表7。

表7.研究组和剂量。

LNP给药后11天，获得血样并如上所述进行测定。然后，在LNP给药后18天，经由心脏末端放血获得血样并如上所述进行测定。

第11天测量的FVIII活性水平示于图10。第18天测量的FVIII活性水平示于图11。表8和表9中提供了FVIII活性水平。

表8.第11天的FVIII活性水平。

表9.第18天的FVIII活性水平。

处死小鼠后，将整个肝脏匀化，并从一部分肝脏裂解物中提取总基因组DNA。使用实例1中描述的DD-PCR测定法定量正向靶向整合到白蛋白内含子1中的频率。结果示于图12和表10中。

表10.FVIII靶向整合频率。

这些数据证明含有0、1、3、5或6个聚糖的FVIII编码序列可引起高水平的FVIII表达和活性，证明了该方法用于治疗具有缺陷型FVIII的病状诸如血友病A的效用。

虽然已经相对于描述的几个实施例相当详细地以一定特殊性描述了本披露，但是并不意图应该将本披露限于任何此类细节或实施例或任何特定的实施例，而是参考所附权利要求来对其进行解释，以便按照本领域的观点来提供对此类权利要求的最广泛的可能解释，以有效地涵盖本披露的预期范围。

序列表

除了本披露中其他地方披露的序列之外，还提供了以下序列，因为在本披露的示例性实施例中提到或使用了以下序列，这些序列是为了说明的目的而提供的。

Claims

1.一种用于改变宿主细胞DNA序列的系统，该系统包含：

脱氧核糖核酸(DNA)内切核酸酶或编码该DNA内切核酸酶的核酸；

包含与宿主细胞基因座互补的间隔区序列的向导RNA(gRNA)或编码该gRNA的核酸；以及

包含编码合成FVIII蛋白的核酸序列的供体模板，其中该合成FVIII蛋白包含B结构域替代物，其中该B结构域替代物包含0至9个N-连接的糖基化位点且长度为3至约40个氨基酸。

2.如权利要求1所述的系统，其中该B结构域替代物包含0至6个N-连接的糖基化位点。

3.如权利要求2所述的系统，其中该B结构域替代物包含0至3个N-连接的糖基化位点。

4.如权利要求1所述的系统，其中该B结构域替代物包含SEQ ID NO:362-369、371和373中任一个的氨基酸序列。

5.如权利要求4所述的系统，其中该B结构域替代物包含SEQ ID NO:362-366、371和373中任一个的氨基酸序列或其与SEQ ID NO:362-366、371和373中的任一个具有至少80％同一性的变体。

6.如权利要求5所述的系统，其中该B结构域替代物包含SEQ ID NO:362-364、371和373中任一个的氨基酸序列。

7.如权利要求1-6中任一项所述的系统，其中该宿主细胞基因座是在肝脏中表达的基因的基因座。

8.如权利要求1-7中任一项所述的系统，其中该宿主细胞基因座是编码急性期蛋白的基因的基因座。

9.如权利要求8所述的系统，其中该急性期蛋白是白蛋白、转铁蛋白或纤维蛋白原。

10.如权利要求1-7中任一项所述的系统，其中该宿主细胞基因座是安全港基因座。

11.如权利要求1-10中任一项所述的系统，其中该DNA内切核酸酶选自由以下项组成的组：Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9、Cas100、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4和Cpf1内切核酸酶及其功能衍生物。

12.如权利要求11所述的系统，其中该DNA内切核酸酶是Cas9。

13.如权利要求1-11中任一项所述的系统，其中编码该DNA内切核酸酶的核酸经过密码子优化以在该宿主细胞中表达。

14.如权利要求1-13中任一项所述的系统，其中编码该DNA内切核酸酶的核酸是脱氧核糖核酸(DNA)。

15.如权利要求1-13中任一项所述的系统，其中编码该DNA内切核酸酶的核酸是核糖核酸(RNA)。

16.如权利要求15所述的系统，其中编码该DNA内切核酸酶的RNA是mRNA。

17.如权利要求1-16中任一项所述的系统，其中该供体模板核酸序列经过密码子优化以在该宿主细胞中表达。

18.如权利要求1-17中任一项所述的系统，其中与编码FVIII蛋白的野生型核酸序列相比，该供体模板核酸序列包含降低含量的CpG二核苷酸。

19.如权利要求18所述的系统，其中该供体模板核酸序列不含CpG二核苷酸。

20.如权利要求1-19中任一项所述的系统，其中该供体模板在腺相关病毒(AAV)载体中编码。

21.如权利要求1-20中任一项所述的系统，其中该供体模板包含供体盒，该供体盒包含编码合成FVIII蛋白的核酸序列，并且其中该供体盒在一侧或两侧上侧接有gRNA靶位点。

22.如权利要求21所述的系统，其中该供体盒在两侧上侧接有gRNA靶位点。

23.如权利要求21所述的系统，其中该供体盒在其5’侧上侧接有gRNA靶位点。

24.如权利要求21-23中任一项所述的系统，其中该gRNA靶位点是该系统中gRNA的靶位点。

25.如权利要求24所述的系统，其中该供体模板的gRNA靶位点是该系统中gRNA的基因组gRNA靶位点的反向互补序列。

26.如权利要求1-25中任一项所述的系统，其中该DNA内切核酸酶或编码该DNA内切核酸酶的核酸包含在脂质体或脂质纳米颗粒中。

27.如权利要求26所述的系统，其中该脂质体或脂质纳米颗粒还包含该gRNA。

28.如权利要求1-27中任一项所述的系统，其中该DNA内切核酸酶与该gRNA复合，从而提供核糖核蛋白(RNP)复合物。

29.一种编辑宿主细胞中的基因组的方法，该方法包括向该细胞提供以下物质：

(a)包含与宿主细胞基因座互补的间隔区序列的gRNA或编码该gRNA的核酸；

(b)DNA内切核酸酶或编码该DNA内切核酸酶的核酸；以及

(c)包含编码合成FVIII蛋白的核酸序列的供体模板，其中该合成FVIII蛋白包含B结构域替代物，其中该B结构域替代物包含0至9个N-连接的糖基化位点且长度为3至约40个氨基酸。

30.如权利要求29所述的方法，其中该B结构域替代物包含0至6个N-连接的糖基化位点。

31.如权利要求30所述的方法，其中该B结构域替代物包含0至3个N-连接的糖基化位点。

32.如权利要求29所述的方法，其中该B结构域替代物包含SEQ ID NO:362-369、371和373中任一个的氨基酸序列。

33.如权利要求32所述的方法，其中该B结构域替代物包含SEQ ID NO:362-366、371和373中任一个的氨基酸序列或其与SEQ ID NO:362-366、371和373中的任一个具有至少80％同一性的变体。

34.如权利要求33所述的方法，其中该B结构域替代物包含SEQ ID NO:362-364、371和373中任一个的氨基酸序列。

35.如权利要求29-34中任一项所述的方法，其中该宿主细胞内源基因座是在肝脏中表达的基因的基因座。

36.如权利要求29-35中任一项所述的方法，其中该宿主细胞内源基因座是编码急性期蛋白的基因的基因座。

37.如权利要求36所述的方法，其中该急性期蛋白是白蛋白、转铁蛋白或纤维蛋白原。

38.如权利要求29-34中任一项所述的方法，其中该宿主细胞内源基因座是安全港基因座。

39.如权利要求29-38中任一项所述的方法，其中该DNA内切核酸酶选自由以下项组成的组：Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9、Cas100、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4和Cpf1内切核酸酶；或其功能衍生物。

40.如权利要求39所述的方法，其中该DNA内切核酸酶是Cas9。

41.如权利要求29-40中任一项所述的方法，其中编码该DNA内切核酸酶的核酸经过密码子优化以在该宿主细胞中表达。

42.如权利要求29-41中任一项所述的方法，其中编码该DNA内切核酸酶的核酸是DNA。

43.如权利要求29-41中任一项所述的方法，其中编码该DNA内切核酸酶的核酸是核糖核酸(RNA)。

44.如权利要求43所述的方法，其中编码该DNA内切核酸酶的RNA是mRNA。

45.如权利要求29所述的方法，其中该供体模板在AAV载体中编码。

46.如权利要求29-45中任一项所述的方法，其中该供体模板核酸序列经过密码子优化以在该宿主细胞中表达。

47.如权利要求29-46中任一项所述的方法，其中与编码FVIII的野生型核酸序列相比，该供体模板核酸序列包含降低含量的CpG二核苷酸。

48.如权利要求47所述的方法，其中该供体模板核酸序列不含CpG二核苷酸。

49.如权利要求29-48中任一项所述的方法，其中该供体模板包含供体盒，该供体盒包含编码合成FVIII蛋白的核酸序列，并且其中该供体盒在一侧或两侧上侧接有gRNA靶位点。

50.如权利要求49所述的方法，其中该供体盒在两侧上侧接有gRNA靶位点。

51.如权利要求49所述的方法，其中该供体盒在其5’侧上侧接有gRNA靶位点。

52.如权利要求49-51中任一项所述的方法，其中该gRNA靶位点是(a)的gRNA的靶位点。

53.如权利要求52所述的方法，其中该供体模板的gRNA靶位点是该细胞基因组中针对(a)的gRNA的gRNA靶位点的反向互补序列。

54.如权利要求29-53中任一项所述的方法，其中该DNA内切核酸酶或编码该DNA内切核酸酶的核酸配制在脂质体或脂质纳米颗粒中。

55.如权利要求54所述的方法，其中该脂质体或脂质纳米颗粒还包含该gRNA。

56.如权利要求29-55中任一项所述的方法，其中该DNA内切核酸酶和该gRNA作为RNP复合物提供给宿主细胞，该RNP复合物包含与该gRNA预复合的DNA内切核酸酶。

57.如权利要求29-56中任一项所述的方法，其中在将(c)的供体模板提供给该细胞后超过四天，将(a)的gRNA或编码该gRNA的核酸和(b)的DNA内切核酸酶或编码该DNA内切核酸酶的核酸提供给该细胞。

58.如权利要求29-57中任一项所述的方法，其中在将(c)的供体模板提供给该细胞后至少14天，将(a)的gRNA或编码该gRNA的核酸和(b)的DNA内切核酸酶或编码该DNA内切核酸酶的核酸提供给该细胞。

59.如权利要求57或58所述的方法，其中在第一剂量的(a)的gRNA或编码该gRNA的核酸和(b)的DNA内切核酸酶或编码该DNA内切核酸酶的核酸后，向该细胞提供一个或多个附加剂量的(a)的gRNA或编码该gRNA的核酸和(b)的DNA内切核酸酶或编码该DNA内切核酸酶的核酸。

60.如权利要求59所述的方法，其中在第一剂量的(a)的gRNA或编码该gRNA的核酸和(b)的DNA内切核酸酶或编码该DNA内切核酸酶的核酸后，向该细胞提供一个或多个附加剂量的(a)的gRNA或编码该gRNA的核酸和(b)的DNA内切核酸酶或编码该DNA内切核酸酶的核酸，直至达到编码合成FVIII蛋白的核酸序列的目标靶向整合水平，或达到编码合成FVIII蛋白的核酸序列的目标表达水平。

61.如权利要求29-60中任一项所述的方法，其中该细胞是肝脏细胞。

62.如权利要求61所述的方法，其中该细胞是人肝脏细胞或人肝窦上皮细胞。

63.一种细胞，其中该细胞的基因组包含编码合成FVIII蛋白的DNA，其中该合成FVIII蛋白包含B结构域替代物，其中该B结构域替代物包含0至9个N-连接的糖基化位点且长度为3至约40个氨基酸。

64.如权利要求63所述的细胞，其中该合成FVIII蛋白与内源性白蛋白启动子、内源性转铁蛋白启动子或内源性纤维蛋白原α启动子可操作地连接。

65.如权利要求63所述的细胞，其中编码该合成FVIII蛋白的核酸序列经过密码子优化以在该细胞中表达。

66.如权利要求63所述的细胞，其中该细胞是人肝脏细胞。

67.如权利要求66所述的细胞，其中该细胞是人肝脏细胞或人肝窦上皮细胞。

68.如权利要求67所述的细胞，其中该细胞通过如权利要求29-62中任一项所述的方法制备，或是通过如权利要求29-62中任一项所述的方法制备的细胞的后代。

69.一种治疗受试者的血友病A的方法，该方法包括：

向该受试者中的细胞提供以下物质：

(b)DNA内切核酸酶或编码该DNA内切核酸酶的核酸；以及

70.如权利要求69所述的方法，其中该B结构域替代物包含0至6个N-连接的糖基化位点。

71.如权利要求70所述的方法，其中该B结构域替代物包含0至3个N-连接的糖基化位点。

72.如权利要求69所述的方法，其中该B结构域替代物包含SEQ ID NO:362-369、371和373中任一个的氨基酸序列。

73.如权利要求72所述的方法，其中该B结构域替代物包含SEQ ID NO:362-366、371和373中任一个的氨基酸序列或其与SEQ ID NO:362-366、371和373中的任一个具有至少80％同一性的变体。

74.如权利要求73所述的方法，其中该B结构域替代物包含SEQ ID NO:362-364、371和373中任一个的氨基酸序列。

75.如权利要求69-74中任一项所述的方法，其中该宿主细胞基因座是在肝脏中表达的基因的基因座。

76.如权利要求69-75中任一项所述的方法，其中该宿主细胞基因座是编码急性期蛋白的基因的基因座。

77.如权利要求76所述的方法，其中该急性期蛋白是白蛋白、转铁蛋白或纤维蛋白原。

78.如权利要求69-74中任一项所述的方法，其中该宿主细胞基因座是安全港基因座。

79.如权利要求69-78中任一项所述的方法，其中该DNA内切核酸酶选自由以下项组成的组：Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9、Cas100、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx10、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4和Cpf1内切核酸酶；或其功能衍生物。

80.如权利要求79所述的方法，其中该DNA内切核酸酶是Cas9。

81.如权利要求80所述的方法，其中该Cas9是spCas9或SluCas9。

82.如权利要求69-81中任一项所述的方法，其中编码该DNA内切核酸酶的核酸经过密码子优化以在该细胞中表达。

83.如权利要求69-82中任一项所述的方法，其中编码该DNA内切核酸酶的核酸是DNA。

84.如权利要求69-82中任一项所述的方法，其中编码该DNA内切核酸酶的核酸是RNA。

85.如权利要求84所述的方法，其中编码该DNA内切核酸酶的RNA是mRNA。

86.如权利要求69-85中任一项所述的方法，其中将(a)的gRNA或编码该gRNA的核酸、(b)的DNA内切核酸酶或编码该DNA内切核酸酶的核酸以及(c)的供体模板中的一种或多种配制在脂质体或LNP中。

87.如权利要求69-86中任一项所述的方法，其中该供体模板在AAV载体中编码。

88.如权利要求69-87中任一项所述的方法，其中该供体模板核酸序列经过密码子优化以在该宿主细胞中表达。

89.如权利要求69-88中任一项所述的方法，其中与编码FVIII的野生型核酸序列相比，该供体模板核酸序列包含降低含量的CpG二核苷酸。

90.如权利要求89所述的方法，其中该供体模板核酸序列不含CpG二核苷酸。

91.如权利要求69-90中任一项所述的方法，其中该供体模板包含供体盒，该供体盒包含编码合成FVIII蛋白的核酸序列，并且其中该供体盒在一侧或两侧上侧接有gRNA靶位点。

92.如权利要求91所述的方法，其中该供体盒在两侧上侧接有gRNA靶位点。

93.如权利要求91所述的方法，其中该供体盒在其5’侧上侧接有gRNA靶位点。

94.如权利要求91-93中任一项所述的方法，其中该gRNA靶位点是该gRNA的靶位点。

95.如权利要求94所述的方法，其中该供体模板的gRNA靶位点是该细胞基因组中针对(a)的gRNA的gRNA靶位点的反向互补序列。

96.如权利要求69-95中任一项所述的方法，其中向该细胞提供该供体模板包括向该受试者静脉内施用该供体模板。

97.如权利要求69-96中任一项所述的方法，其中该DNA内切核酸酶或编码该DNA内切核酸酶的核酸配制在脂质体或LNP中。

98.如权利要求97所述的方法，其中该脂质体或LNP还包含该gRNA。

99.如权利要求98所述的方法，其中向该细胞提供该gRNA或编码该gRNA的核酸和该DNA内切核酸酶或编码该DNA内切核酸酶的核酸包括向该受试者静脉内施用该脂质体或脂质纳米颗粒。

100.如权利要求69-99中任一项所述的方法，其中该DNA内切核酸酶和该gRNA作为核糖核蛋白(RNP)复合物提供给该宿主细胞，该RNP复合物包含与该gRNA复合的DNA内切核酸酶。

101.如权利要求69-100中任一项所述的方法，其中在将(c)的供体模板提供给该细胞后超过四天，将(a)的gRNA或编码该gRNA的核酸和(b)的DNA内切核酸酶或编码该DNA内切核酸酶的核酸提供给该细胞。

102.如权利要求69-101中任一项所述的方法，其中在将(c)的供体模板提供给该细胞后至少14天，将(a)的gRNA或编码该gRNA的核酸和(b)的DNA内切核酸酶或编码该DNA内切核酸酶的核酸提供给该细胞。

103.如权利要求101或102所述的方法，其中在第一剂量的(a)的gRNA或编码该gRNA的核酸和(b)的DNA内切核酸酶或编码该DNA内切核酸酶的核酸后，向该细胞提供一个或多个附加剂量的(a)的gRNA或编码该gRNA的核酸和(b)的DNA内切核酸酶或编码该DNA内切核酸酶的核酸。

104.如权利要求103所述的方法，其中在第一剂量的(a)的gRNA或编码该gRNA的核酸和(b)的DNA内切核酸酶或编码该DNA内切核酸酶的核酸后，向该细胞提供一个或多个附加剂量的(a)的gRNA或编码该gRNA的核酸和(b)的DNA内切核酸酶或编码该DNA内切核酸酶的核酸，直至达到该编码合成FVIII蛋白的核酸序列的目标靶向整合水平和/或该编码合成FVIII蛋白的核酸序列的目标表达水平。

105.如权利要求101-104中任一项所述的方法，其中向该细胞提供(a)的gRNA和(b)的DNA内切核酸酶或编码该DNA内切核酸酶的核酸包括向该受试者施用包含编码该DNA内切核酸酶的核酸和该gRNA的脂质纳米颗粒。

106.如权利要求101-105中任一项所述的方法，其中向该细胞提供(c)的供体模板包括向该受试者施用在AAV载体中编码的供体模板。

107.如权利要求69-106中任一项所述的方法，其中该细胞是肝细胞。

108.如权利要求69-107中任一项所述的方法，其中该编码合成FVIII蛋白的核酸序列在该受试者的肝脏中表达。

109.一种治疗受试者的血友病A的方法，该方法包括向该受试者施用如权利要求63-68中任一项所述的细胞。

110.如权利要求109所述的方法，其中该细胞对该受试者来说是自体的。

111.如权利要求110所述的方法，该方法进一步包括从该受试者获得生物样品，其中该生物样品包含肝脏细胞，并且其中该细胞由该肝脏细胞制备。

112.一种试剂盒，该试剂盒包含如权利要求1-28中任一项所述的系统的一种或多种要素，该试剂盒进一步包含使用说明书。

113.一种包含编码合成FVIII蛋白的多核苷酸序列的核酸，其中该合成FVIII蛋白包含B结构域替代物，其中该B结构域替代物包含0至9个N-连接的糖基化位点且长度为3至约40个氨基酸。

114.如权利要求113所述的核酸，其中该B结构域替代物包含0至6个N-连接的糖基化位点。

115.如权利要求113所述的核酸，其中该B结构域替代物包含0至3个N-连接的糖基化位点。

116.如权利要求113所述的核酸，其中该B结构域替代物包含SEQ ID NO:362-369、371和373中任一个的氨基酸序列。

117.如权利要求116所述的核酸，其中该B结构域替代物包含SEQ ID NO:362-364、371和373中任一个的氨基酸序列或其与SEQ ID NO:362-364、371和373中的任一个具有至少80％同一性的变体。

118.如权利要求116所述的核酸，其中该B结构域替代物包含SEQ ID NO:362-363、371和373中任一个的氨基酸序列。

119.如权利要求113-118中任一项所述的核酸，其中该编码合成FVIII蛋白的多核苷酸序列经过密码子优化以在宿主细胞中表达。

120.如权利要求113-119中任一项所述的核酸，其中与编码FVIII的野生型核酸序列相比，该编码合成FVIII蛋白的多核苷酸序列包含降低含量的CpG二核苷酸。

121.如权利要求120所述的核酸，其中该编码合成FVIII蛋白的多核苷酸序列不含CpG二核苷酸。

122.如权利要求113-121中任一项所述的核酸，其中该核酸是病毒载体。

123.如权利要求122所述的核酸，其中该病毒载体是AAV载体。

124.一种增加受试者中的FVIII量的方法，该方法包括：

向该受试者中的细胞提供以下物质，其中该受试者具有第一FVIII血清水平：

(b)DNA内切核酸酶或编码该DNA内切核酸酶的核酸；以及

125.如权利要求124所述的方法，其中该第一FVIII血清水平低于约0.40IU/mL。

126.如权利要求125所述的方法，其中该第一FVIII血清水平低于约0.05IU/mL。

127.如权利要求125所述的方法，其中该第一FVIII血清水平低于约0.01IU/mL。

128.如权利要求1-28中任一项所述的系统用于治疗血友病A的用途。

129.如权利要求1-28中任一项所述的系统用于制造用于治疗血友病A的药物的用途。

130.如权利要求63-68中任一项所述的细胞用于治疗血友病A的用途。

131.如权利要求63-68中任一项所述的细胞用于制造用于治疗血友病A的药物的用途。

132.如权利要求112所述的试剂盒用于治疗血友病A的用途。

133.如权利要求112所述的试剂盒用于制造用于治疗血友病A的药物的用途。

134.如权利要求113-123中任一项所述的核酸用于治疗血友病A的用途。

135.如权利要求113-123中任一项所述的核酸用于制造用于治疗血友病A的药物的用途。

136.一种合成FVIII蛋白，其中该合成FVIII蛋白包含B结构域替代物，其中该B结构域替代物包含0至9个N-连接的糖基化位点且长度为3至约40个氨基酸。