CN113260701A

CN113260701A - 用于表达因子ix的组合物和方法

Info

Publication number: CN113260701A
Application number: CN201980074158.4A
Authority: CN
Inventors: J·D·芬恩; H-R·黄; M·罗伊; K·莱; R·萨特勒; C·克拉苏; C·王
Original assignee: Intelia Therapeutics Co ltd; Regeneron Pharmaceuticals Inc
Current assignee: Intelia Therapeutics Co ltd; Regeneron Pharmaceuticals Inc; Intellia Therapeutics Inc
Priority date: 2018-10-18
Filing date: 2019-10-18
Publication date: 2021-08-13
Also published as: BR112021007301A2; CA3116331A1; EP3867380A2; WO2020082046A2; AU2019360270A1; SG11202103734PA; US20200289628A1; IL282238A; KR20210102881A; MX2021004277A; WO2020082046A3; JP2022512731A; CO2021006365A2; TW202027799A; PH12021550846A1

Abstract

提供了用于在宿主细胞或宿主细胞群中表达因子IX的组合物和方法。还提供了表达因子IX的工程改造的宿主细胞。

Description

用于表达因子IX的组合物和方法

本申请要求2018年10月18日提交的美国临时申请号62/747,509、2019年4月3日提交的美国临时申请号62/829,009、2019年4月4日提交的美国临时申请号62/829,621和2019年4月29日提交的美国临时申请号62/840,352的优先权权益。上述申请中的每个的说明书以引用的方式整体并入本文。

出血病症是由血液凝结不足引起的。此缺陷可能是由先天性凝血病症、获得性凝血病症或创伤诱导的流血病状引起的。出血是最严重且最显著的疾病表现中的一种，并且可能从局部位点发生或是全身性的。局部出血可能与病变相关，并且有缺陷的止血机制可能使其进一步复杂化。任何凝血因子的先天性或获得性缺陷都可能与流血倾向相关。出血病症的经典实例包括血友病，诸如由于因子VIII缺陷而引起的血友病A或由于因子IX缺陷而引起的血友病B(克雷司马斯病(Christmas Disease))。血友病发生在所有种族和民族群体中，并且影响美国和全世界的许多人。

用于出血病症的传统疗法包括肠胃外替换不足的凝血因子，诸如因子VII、因子VIII或因子IX。例如，用于血友病B的当前治疗依赖于长期反复静脉内输注纯化的重组因子IX。然而，这些治疗有许多缺点，包括需要反复静脉内输注、与抑制剂的形成相关以及通常更具预防性而不是治愈性。参见例如,Petrini 2001,Hemophilia 7:99；Fischer等人2002,Blood 99(7):2337。

涉及将缺失或缺陷的基因的拷贝引入患者体内的基因疗法提供了一种将因子IX引入到患者体内更长时间的可能方法。然而，需要提供因子IX的改善的长期表达的另外的组合物和方法。

本公开提供可用于在宿主细胞或宿主细胞群中表达因子IX(体外或体内)以及用于治疗血友病(例如，血友病B)的组合物和方法。本文提供指导RNA，其用于将编码因子IX的序列靶向插入人基因组基因座，例如安全港位点，诸如白蛋白安全港位点。还提供了包含编码因子IX的序列的供体构建体(例如，双向构建体)，其用于靶向插入安全港位点，诸如白蛋白安全港位点的内含子1。在一些实施方案中，本文公开的指导RNA可与RNA指导的DNA结合剂(例如，Cas核酸酶)和包含因子IX转基因的供体构建体(例如，双向构建体)组合使用。在一些实施方案中，供体构建体(例如，双向构建体)可与基因编辑系统(例如，CRISPR/Cas系统；锌指核酸酶(ZFN)系统；转录激活因子样效应子核酸酶(TALEN)系统)一起使用。在一些实施方案中，本文公开的指导RNA可与RNA指导的DNA结合剂(例如，Cas核酸酶)和包含因子IX转基因的供体构建体(例如，双向构建体)组合使用。提供以下实施方案。

在一些方面，本文提供一种将因子IX核酸引入细胞或细胞群的方法，所述方法包括施用：i)包含因子IX蛋白编码序列的核酸构建体；ii)RNA指导的DNA结合剂；以及iii)包含序列的指导RNA(gRNA)。在一些实施方案中，指导RNA包含与选自由SEQ ID No:2、8、13、19、28、29、31、32、33组成的组的序列至少95％、90％、85％、80％或75％相同的序列。在一些实施方案中，指导RNA包含选自由SEQ ID NO:2、8、13、19、28、29、31、32、33组成的组的序列的至少17、18、19或20个连续核苷酸的序列。在一些实施方案中，指导RNA包含序列，即选自由SEQ ID NO:34、40、45、51、60、61、63、64、65、66、72、77、83、92、93、95、96和97组成的组的序列。在一些实施方案中，指导RNA包含序列，即与选自由SEQ ID NO:2-33组成的组的序列至少95％、90％、85％、80％或75％相同的序列。在一些实施方案中，指导RNA包含选自由SEQID NO:2-33组成的组的序列的至少17、18、19或20个连续核苷酸的序列。在一些实施方案中，指导RNA包含选自由SEQ ID NO:34-97组成的组的序列。在一些实施方案中，指导RNA包含与选自由SEQ ID NO:98-119组成的组的序列至少95％、90％、85％、80％或75％相同的序列。在一些实施方案中，指导RNA包含选自由SEQ ID NO:98-119组成的组的序列的至少17、18、19或20个连续核苷酸的序列。在一些实施方案中，指导RNA包含序列，即选自由SEQ IDNO:120-163组成的组的序列。

在一些方面，本文提供一种在细胞或细胞群中表达因子IX的方法，所述方法包括施用：i)包含因子IX蛋白编码序列的核酸构建体；ii)RNA指导的DNA结合剂；以及iii)包含序列的指导RNA(gRNA)。在一些实施方案中，指导RNA包含与选自由SEQ ID No:2、8、13、19、28、29、31、32、33组成的组的序列至少95％、90％、85％、80％或75％相同的序列。在一些实施方案中，指导RNA包含选自由SEQ ID NO:2、8、13、19、28、29、31、32、33组成的组的序列的至少17、18、19或20个连续核苷酸的序列。在一些实施方案中，指导RNA包含选自由SEQ IDNO:34、40、45、51、60、61、63、64、65、66、72、77、83、92、93、95、96和97组成的组的序列。在一些实施方案中，指导RNA包含与选自由SEQ ID NO:2-33组成的组的序列至少95％、90％、85％、80％或75％相同的序列。在一些实施方案中，指导RNA包含选自由SEQ ID NO:2-33组成的组的序列的至少17、18、19或20个连续核苷酸的序列。在一些实施方案中，指导RNA包含选自由SEQ ID NO:34-97组成的组的序列。在一些实施方案中，指导RNA包含与选自由SEQID NO:98-119组成的组的序列至少95％、90％、85％、80％或75％相同的序列。在一些实施方案中，指导RNA包含选自由SEQ ID NO:98-119组成的组的序列的至少17、18、19或20个连续核苷酸的序列。在一些实施方案中，指导RNA包含选自由SEQ ID NO:120-163组成的组的序列。

在一些方面，本文提供一种在细胞或细胞群中引入或表达因子IX的方法，所述方法包括施用：i)包含因子IX蛋白编码序列的核酸构建体；ii)RNA指导的DNA结合剂；以及iii)包含序列的指导RNA(gRNA)，其中施用是体外的。

在一些实施方案中，指导RNA包含与选自由SEQ ID No:2、8、13、19、28、29、31、32、33组成的组的序列至少95％、90％、85％、80％或75％相同的序列。在一些实施方案中，指导RNA包含选自由SEQ ID NO:2、8、13、19、28、29、31、32、33组成的组的序列的至少17、18、19或20个连续核苷酸。在一些实施方案中，指导RNA包含选自由SEQ ID NO:34、40、45、51、60、61、63、64、65、66、72、77、83、92、93、95、96和97组成的组的序列。在一些实施方案中，指导RNA包含与选自由SEQ ID NO:2-33组成的组的序列至少95％、90％、85％、80％或75％相同的序列。在一些实施方案中，指导RNA包含选自由SEQ ID NO:2-33组成的组的序列的至少17、18、19或20个连续核苷酸。在一些实施方案中，指导RNA包含选自由SEQ ID NO:34-97组成的组的序列。

在一些实施方案中，在核酸载体和/或脂质纳米颗粒中施用核酸构建体。在一些实施方案中，在核酸载体和/或脂质纳米颗粒中施用RNA指导的DNA结合剂和/或gRNA。在一些实施方案中，核酸载体为病毒载体。在一些实施方案中，病毒载体选自由以下组成的组：腺相关病毒(AAV)载体、腺病毒载体、逆转录病毒载体和慢病毒载体。在一些实施方案中，AAV载体选自由以下组成的组：AAV1、AAV3、AAV4、AAV5、AAV6、AAV8、AAV-DJ和AAV2/8。

在一些实施方案中，以任何顺序和/或以任何组合顺序施用核酸构建体、RNA指导的DNA结合剂和gRNA。在一些实施方案中，其中单独或以任何组合同时施用核酸构建体、RNA指导的DNA结合剂和gRNA。在一些实施方案中，在施用核酸构建体之前施用RNA指导的DNA结合剂、或RNA指导的DNA结合剂和gRNA的组合。在一些实施方案中，在施用gRNA和/或RNA指导的DNA结合剂之前施用核酸构建体。

在一些实施方案中，RNA指导的DNA结合剂为Cas核酸酶。在一些实施方案中，Cas核酸酶为2类Cas核酸酶。在一些实施方案中，Cas核酸酶为Cas9。在一些实施方案中，Cas核酸酶为酿脓链球菌(S.pyogenes)Cas9核酸酶。在一些实施方案中，Cas核酸酶为切口酶。

在一些实施方案中，核酸构建体为双向核酸构建体。在一些实施方案中，核酸构建体为单链或双链的。在一些实施方案中，核酸构建体为单链DNA或双链DNA。在一些实施方案中，双向构建体不包含驱动因子IX蛋白表达的启动子。在一些实施方案中，细胞或细胞群用异源肽诸如白蛋白信号肽表达因子IX。

在一些实施方案中，细胞或细胞群包括肝脏细胞。在一些实施方案中，肝脏细胞为肝细胞。

在一些实施方案中，核酸编码野生型因子IX蛋白。在一些实施方案中，核酸编码突变型因子IX蛋白。在一些实施方案中，核酸编码具有突变R338L的因子IX蛋白。

在一些方面，本文提供一种将因子IX核酸引入细胞或细胞群的方法，所述方法包括向细胞或细胞群施用包含因子IX蛋白编码序列的双向核酸构建体，从而在细胞或细胞群中表达因子IX。本文提供一种在细胞或细胞群中表达因子IX的方法，所述方法包括向细胞或细胞群施用包含因子IX蛋白编码序列的双向核酸构建体，从而在细胞或细胞群中表达因子IX表达。

在一些实施方案中，双向核酸构建体包含：a)第一区段，所述第一区段包含因子IX的编码序列；以及b)第二区段，所述第二区段包含因子IX的编码序列的反向补体，其中构建体不包含驱动因子IX表达的启动子。在一些实施方案中，双向核酸构建体包含：a)第一区段，所述第一区段包含因子IX的编码序列；以及b)第二区段，所述第二区段包含第二多肽编码序列的反向补体，其中构建体不包含驱动多肽表达的启动子。

在一些实施方案中，将因子IX核酸引入细胞或细胞群的方法还包括施用RNA指导的DNA结合剂。在一些实施方案中，方法还包括施用gRNA。在一些实施方案中，在核酸载体和/或脂质纳米颗粒中施用双向核酸构建体。在一些实施方案中，在核酸载体和/或脂质纳米颗粒中施用RNA指导的DNA结合剂。在一些实施方案中，在核酸载体和/或脂质纳米颗粒中施用gRNA。在一些实施方案中，核酸载体为病毒载体。在一些实施方案中，病毒载体选自由以下组成的组：腺相关病毒(AAV)载体、腺病毒载体、逆转录病毒载体和慢病毒载体。在一些实施方案中，AAV载体选自由以下组成的组：AAV1、AAV3、AAV4、AAV5、AAV6、AAV8、AAV-DJ和AAV2/8。

在一些实施方案中，以任何顺序和/或以任何组合顺序施用双向核酸构建体、RNA指导的DNA结合剂和gRNA。在一些实施方案中，以任何组合同时施用双向核酸构建体、RNA指导的DNA结合剂和gRNA。在一些实施方案中，在施用双向核酸构建体之前施用RNA指导的DNA结合剂、或RNA指导的DNA结合剂和gRNA的组合。在一些实施方案中，在施用gRNA和/或RNA指导的DNA结合剂之前施用双向核酸构建体。

在一些实施方案中，RNA指导的DNA结合剂为Cas核酸酶。在一些实施方案中，Cas核酸酶为2类Cas核酸酶。在一些实施方案中，Cas核酸酶选自酿脓链球菌核酸酶、金黄色葡萄球菌(S.aureus)核酸酶、空肠弯曲杆菌(C.jejuni)核酸酶、嗜热链球菌(S.thermophilus)核酸酶、脑膜炎奈瑟氏菌(N.meningitidis)核酸酶及其变体。在一些实施方案中，Cas核酸酶为Cas9。在一些实施方案中，Cas核酸酶为切口酶。

在一些实施方案中，双向构建体不包含驱动因子IX蛋白表达的启动子。在一些实施方案中，双向构建体为单链或双链的。在一些实施方案中，核酸构建体为单链DNA或双链DNA。在一些实施方案中，gRNA包含选自由SEQ ID NO:2-33组成的组的序列的至少17、18、19或20个连续核苷酸或与选自由SEQ ID NO:2-33组成的组的序列至少95％、90％、85％、80％或75％相同的序列。

在一些方面，本文提供一种用于在细胞中表达因子IX的组合物，其中组合物包含：i)包含因子IX蛋白编码序列的核酸构建体；ii)RNA指导的DNA结合剂；以及iii)指导RNA(gRNA)，所述指导RNA包含选自由SEQ ID NO:2-33组成的组的指导序列或与选自由SEQ IDNO:2-33组成的组的序列至少95％、90％、85％、80％或75％相同的序列。本文提供一种用于在细胞或细胞群中表达因子IX的组合物，其中组合物包含双向核酸构建体，所述双向核酸构建体包含因子IX蛋白编码序列。在一些实施方案中，通过任何前述实施方案的方法制备宿主细胞。

在一些实施方案中，宿主细胞为肝脏细胞。在一些实施方案中，宿主细胞为非分裂细胞类型。在一些实施方案中，宿主细胞表达由双向构建体编码的因子IX多肽。在一些实施方案中，宿主细胞为肝细胞。

在任何上述方法的方法、构建体或宿主细胞的一些实施方案中，gRNA包含SEQ IDNO:401。

附图说明

图1示出了如AAV基因组中所表示的构建体形式。SA＝剪接受体；pA＝polyA信号序列；HA＝同源臂；LHA＝左同源臂；RHA＝右同源臂

图2示出了没有同源臂的载体在永生化肝脏细胞系(Hepa1-6)中无效。衍生自包含200bp同源臂的质粒P00204的scAAV导致hFIX在分裂细胞中表达。使用衍生自P00123(缺乏同源臂的scAAV)和P00147(缺乏同源臂的ssAAV双向构建体)的AAV载体不会导致可检测到的hFIX表达。

图3A和图3B示出了使用衍生自P00123、P00147或P00204的载体对具有和不具有同源臂的插入模板进行体内测试的结果。图3A示出了在用包含CRISPR/Cas9组分的LNP治疗的每组动物中检测到如通过插入缺失形成测量为约60％的肝编辑水平。图3B示出了接受不具有同源臂的ssAAV载体(衍生自P00147)与LNP治疗组合的动物，导致血清中hFIX表达的最高水平。

图4A和图4B示出了对具有和不具有同源臂的ssAAV插入模板进行体内测试的结果。图4A将使用衍生自质粒P00350、P00356、P00362(具有如所示的不对称同源臂)和P00147(如图4B所示的双向构建体)的载体的靶向插入进行比较。图4B将使用衍生自质粒P00353、P00354(具有如所示的对称同源臂)和P00147的载体来靶向的第二位点中的插入进行比较。

图5A至图5D示出了在原代小鼠肝细胞中跨20个靶位点靶向插入双向构建体的结果。图5A示出了所测试的载体中的每个的示意图。图5B示出了针对所测试的每个组合中每个治疗组如通过插入缺失形成来测量的编辑。图5C和图5D示出了显著水平的编辑(如在特定靶位点的插入缺失形成)不一定导致转基因的更有效插入或表达。hSA＝人F9剪接受体；mSA＝小鼠白蛋白剪接受体；HiBit＝用于基于荧光素酶的检测的标签；pA＝polyA信号序列；Nluc＝纳米荧光素酶报告基因；GFP＝绿色荧光报告基因。

图6示出了使用衍生自P00147的ssAAV跨10个靶位点靶向插入双向构建体的体内筛选的结果。如图所示，显著水平的插入缺失形成不一定导致高水平的转基因表达。

图7A至图7D示出了使用衍生自P00147的ssAAV跨20个靶位点对双向构建体进行体内筛选的结果。图7A示出了针对所测试的每个LNP/载体组合中每个治疗组检测到的如通过插入缺失形成测量的不同水平的编辑。图7B提供了相应的靶向插入数据。结果显示出插入缺失形成与双向构建体的插入或表达之间较差的相关性(图7B和图7D)，以及体外和体内结果之间的正相关性(图7C)。

图8A和图8B示出了使用原位杂交方法，双向构建体在细胞水平上的插入，所述原位杂交方法使用可检测hFIX转基因与小鼠白蛋白外显子1序列之间的连接的探针(图8A)。循环hFIX水平与杂交转录物呈阳性的细胞数相关(图8B)。

图9示出了改变包含双向hFIX构建体的ssAAV与LNP递送之间的时间对靶向插入的影响。

图10示出了在递送双向hFIX构建体后，改变LNP剂量数(例如，1、2或3个)对靶向插入的影响。

图11A示出了hFIX体内表达的持久性。图11B证明了来自白蛋白内含子1的表达得以持续。

图12A和图12B示出了变化的AAV或LNP剂量可在体内调节来自白蛋白基因内含子1的hFIX的表达量。

图13A至图13C示出了跨原代食蟹猴肝细胞中的靶位点筛选双向构建体的结果。图13A示出了针对每个样品检测到的如通过插入缺失形成测量的不同水平的编辑。图13B和图13C示出了显著水平的插入缺失形成不预测双向构建体插入或表达到白蛋白内含子1中。

图14A至图14C示出了跨原代人肝细胞中的靶位点筛选双向构建体的结果。图14A示出了针对每个样品检测到的如通过插入缺失形成测量的编辑。图14B、图14C和图14D示出了显著水平的插入缺失形成不预测双向构建体插入或表达到白蛋白基因内含子1中。

图15示出了体内研究的结果，其中向非人灵长类动物给药LNP以及双向hFIX插入模板(衍生自P00147)。仅在用LNP和AAV治疗的动物中实现了全身性hFIX水平，其中单独使用AAV或LNP检测不到hFIX。

图16A和图16B示出了注射后第6周血浆样品中的人因子IX表达水平。

图17示出了每只动物多个肺叶中第7周的血清水平和阳性细胞％。

图18示出了注射后1周、2周和4周各组血浆样品中的人因子IX表达水平。

图19示出了在aPTT测定中hF9转基因的插入和凝血功能。

图20A和图20B示出了在TGA-EA分析中hF9转基因的插入和凝血酶生成。

图21示出了hF9转基因的插入和凝血酶生成。

具体实施方式

现在将详细参考本发明的某些实施方案，附图中示出了所述实施方案的实例。尽管结合所示实施方案来描述本发明，但是应理解它们并不旨在将本发明限制于那些实施方案。相反，本发明旨在覆盖所有的替代方案、修改和等效物，它们可被包括在如由所附实施方案所限定的本发明中。

在详细描述本教导之前，应当理解，本公开不限于特定的组合物或处理步骤，因为它们可变化。应当指出的是，如本说明书和所附实施方案中所用，除非上下文另有明确规定，否则单数形式“一种/个(a/an)”和“所述(the)”包括复数指示物。因此，例如，对“缀合物”的引用包括多个缀合物，并且对“细胞”的引用包括多个细胞或细胞群等。如本文所用，术语“包括”及其语法变体旨在是非限制性的，使得列表中项目的列举不排除可被替换或添加到所列项目的其他类似项目。

数值范围将限定范围的数量包括在内。考虑到有效数字和与测量相关的误差，将测量值和可测量值理解为近似值。此外，“包含(comprise/comprises/comprising)”、“含有(contain/contains/containing)”和“包括(include/includes和including)”的使用并不旨在是限制性的。应当理解，上述一般描述和详细描述均仅为示例性和解释性的并且不限制本教导。

除非在说明书中特别指出，否则说明书中列举“包含”各种组件的实施方案也被设想为“由所列举的组件组成”或“基本上由所列举的组件组成”；说明书中列举“由各种组件组成”的实施方案也被设想为“包含”所列举的组件或“基本上由所列举的组件组成”；并且说明书中列举“基本上由各种组件组成”的实施方案也被设想为“由所列举的组件组成”或“包含”所列举的组件(这种可互换性不适用于权利要求中这些术语的使用)。除非上下文另外明确指出，否则术语“或”以包括性含义使用，即等同于“和/或”。术语“约”在列表之前使用时，修饰列表的每个成员。术语“约”或“大约”意指如通过本领域普通技术人员确定的特定值的可接受误差，这部分取决于如何测量或确定所述值。

术语“约”在列表之前使用时，修饰列表的每个成员。术语“约”或“大约”意指如通过本领域普通技术人员确定的特定值的可接受误差，这部分取决于如何测量或确定所述值。

本文所使用的小节标题仅出于组织性目的并且不解释为以任何方式限制所需主题。如果通过引用并入的任何材料与本说明书中定义的任何术语或本说明书的任何其他明示内容矛盾，则以本说明书为准。

I.定义

除非另有说明，否则如本文所用的以下术语和短语旨在具有以下含义：

如本文所用，“多核苷酸”和“核酸”是指包含核苷或核苷类似物的多聚化合物，所述核苷或核苷类似物具有沿着骨架连接在一起的含氮杂环碱基或碱基类似物，包括常规RNA、DNA、混合RNA-DNA和作为其类似物的聚合物。核酸“骨架”可由多种键联构成，包括以下中的一个或多个：糖-磷酸二酯键联、肽-核酸键(“肽核酸”或PNA；PCT号WO 95/32305)、硫代磷酸酯键联、甲基膦酸酯键联或其组合。核酸的糖部分可为核糖、脱氧核糖或具有取代基(例如，2'甲氧基或2'卤化物取代基)的类似化合物。含氮碱基可为常规碱基(A、G、C、T、U)、其类似物(例如，修饰的尿苷，诸如5-甲氧基尿苷、假尿苷或N1-甲基假尿苷或其他)；肌苷；嘌呤或嘧啶的衍生物(例如，N⁴-甲基脱氧鸟苷、脱氮嘌呤或氮杂嘌呤、脱氮嘧啶或氮杂嘧啶、在5或6位具有取代基的嘧啶碱基(例如，5-甲基胞嘧啶)、在2、6或8位具有取代基的嘌呤碱基、2-氨基-6-甲基氨基嘌呤、O⁶-甲基鸟嘌呤、4-硫代-嘧啶、4-氨基-嘧啶、4-二甲基肼-嘧啶和O⁴-烷基-嘧啶；美国专利号5,378,825和PCT号WO 93/13121)。一般性讨论参见TheBiochemistry of the Nucleic Acids 5-36,Adams等人,编,第11版,1992)。核酸可包括一个或多个“脱碱基”残基，其中骨架在聚合物的一个或多个位置不包括含氮碱基(美国专利号5,585,481)。核酸可仅包含常规RNA或DNA糖、碱基和键联，或可包括常规组分和取代基(例如，具有2'甲氧基键联的常规碱基，或含有常规碱基和一个或多个碱基类似物的聚合物)。核酸包括含有一种或多种LNA核苷酸单体的类似物“锁核酸”(LNA)，其中双环呋喃糖单元被锁定在模仿糖构象的RNA中，这增强了对互补RNA和DNA序列的杂交亲和力(Vester和Wengel,2004,Biochemistry 43(42):13233-41)。RNA和DNA具有不同的糖部分，并且可因RNA中存在尿嘧啶或其类似物且DNA中存在胸腺嘧啶或其类似物而不同。

“指导RNA”、“gRNA”和简单的“指导”在本文中可互换地用于指包含指导序列的指导，例如，crRNA(也称为CRISPR RNA)或者crRNA和trRNA的组合(也称为tracrRNA)。crRNA和trRNA可作为单个RNA分子(单指导RNA，sgRNA)缔合或例如在两个单独的RNA分子(双指导RNA，dgRNA)中。“指导RNA”或“gRNA”是指每种类型。trRNA可为天然存在的序列，或可为与天然存在的序列相比具有修饰或变异的trRNA序列。指导RNA，诸如sgRNA或dgRNA，可包括如本文所述的修饰的RNA。

如本文所用，“指导序列”是指在指导RNA内与靶序列互补并起到将指导RNA引导到靶序列以通过RNA指导的DNA结合剂结合或修饰(例如，裂解)的作用的序列。“指导序列”也可称为“靶向序列”或“间隔区序列”。指导序列的长度可为20个碱基对，例如在酿脓链球菌(即，Spy Cas9)和相关Cas9同源物/直向同源物的情况下。更短或更长的序列也可用作指导，例如，长度为15、16、17、18、19、21、22、23、24或25个核苷酸。例如，在一些实施方案中，指导序列包含选自SEQ ID NO:2-33的序列的至少15、16、17、18、19或20个连续核苷酸。在一些实施方案中，靶序列例如位于基因中或染色体上，并且与指导序列互补。在一些实施方案中，指导序列与其相应的靶序列之间的互补性或同一性程度可为约75％、80％、85％、90％、95％、96％、97％、98％、99％或100％。例如，在一些实施方案中，指导序列包含与选自SEQID NO:2-33的序列的至少15、16、17、18、19或20个连续核苷酸具有约75％、80％、85％、90％、95％、96％、97％、98％、99％或100％同一性的序列。在一些实施方案中，指导序列和靶区域可为100％互补或相同的。在其他实施方案中，指导序列和靶区域可含有至少一个错配。例如，指导序列和靶序列可含有1、2、3或4个错配，其中靶序列的总长度为至少15、16、17、18、19、20或更多个碱基对。在一些实施方案中，指导序列和靶区域可含有1至4个错配，其中指导序列包含至少15、16、17、18、19、20或更多个核苷酸。在一些实施方案中，指导序列和靶区域可含有1、2、3或4个错配，其中指导序列包含20个核苷酸。

RNA指导的DNA结合剂的靶序列包括基因组DNA的正链和负链(即给定的序列和序列的反向补体)，因为RNA指导的DNA结合剂的核酸底物为双链核酸。因此，在指导序列被称为“与靶序列互补”的情况下，应当理解，指导序列可引导指导RNA与靶序列的反向补体结合。因此，在一些实施方案中，在指导序列结合靶序列的反向补体的情况下，指导序列与靶序列(例如，不包括PAM的靶序列)的某些核苷酸相同，除了在指导序列中用U取代T。

如本文所用，“RNA指导的DNA结合剂”意指具有RNA和DNA结合活性的多肽或多肽复合物，或此种复合物的DNA结合亚基，其中DNA结合活性是序列特异性的并且取决于RNA的序列。术语RNA指导的DNA结合剂还包括编码此类多肽的核酸。示例性RNA指导的DNA结合剂包括Cas裂解酶/切口酶。示例性RNA指导的DNA结合剂可包括其失活形式(“dCas DNA结合剂”)，例如如果那些剂被修饰以例如通过与FokI裂解酶结构域融合来允许DNA裂解。如本文所用，“Cas核酸酶”涵盖Cas裂解酶和Cas切口酶。Cas裂解酶和Cas切口酶包括III型CRISPR系统的Csm或Cmr复合物、其Cas10、Csm1或Cmr2亚基、I型CRISPR系统的Cascade复合物、其Cas3亚基和2类Cas核酸酶。如本文所用，“2类Cas核酸酶”为具有RNA指导的DNA结合活性的单链多肽。2类Cas核酸酶包括2类Cas裂解酶/切口酶(例如，H840A、D10A或N863A变体)，其还具有RNA指导的DNA裂解酶或切口酶活性，以及2类dCas DNA结合剂，其中裂解酶/切口酶活性失活”)，如果那些剂被修饰以允许DNA裂解。2类Cas核酸酶包括例如Cas9、Cpf1、C2c1、C2c2、C2c3、HF Cas9(例如，N497A、R661A、Q695A、Q926A变体)、HypaCas9(例如，N692A、M694A、Q695A、H698A变体)、eSPCas9(1.0)(例如，K810A、K1003A、R1060A变体)和eSPCas9(1.1)(例如，K848A、K1003A、R1060A变体)蛋白及其修饰。Cpf1蛋白，Zetsche等人,Cell,163:1-13(2015)，也含有RuvC样核酸酶结构域。Zetsche的Cpf1序列以引用的方式整体并入。参见例如，Zetsche，表S1和表S3。参见例如，Makarova等人,Nat Rev Microbiol,13(11):722-36(2015)；Shmakov等人,Molecular Cell,60:385-397(2015)。如本文所用，RNA指导的DNA结合剂(例如，Cas核酸酶、Cas9核酸酶或酿脓链球菌Cas9核酸酶)的递送包括多肽或mRNA的递送。

如本文所用，“核糖核蛋白”(RNP)或“RNP复合物”是指指导RNA与RNA指导的DNA结合剂，诸如Cas核酸酶，例如Cas裂解酶、Cas切口酶或dCas DNA结合剂(例如，Cas9)。在一些实施方案中，指导RNA将RNA指导的DNA结合剂诸如Cas9指导到靶序列，并且指导RNA与靶序列杂交且所述剂与靶序列结合；在剂是裂解酶或切口酶的情况下，结合之后可以裂解或切口。

如本文所用，如果第一序列与第二序列的比对显示第二序列整体上X％或更多的位置与第一序列匹配，则认为第一序列“包含与第二序列具有至少X％同一性的序列”。例如，序列AAGA包含与序列AAG具有100％同一性的序列，因为比对将给出100％同一性，因为存在与第二序列的所有三个位置的匹配。RNA与DNA之间的差异(通常为尿苷与胸苷的交换，或反之亦然)以及核苷类似物(诸如修饰的尿苷)的存在不会导致多核苷酸之间的同一性或互补性差异，只要相关核苷酸(诸如胸苷、尿苷或修饰的尿苷)具有相同的补体(例如，对于所有的胸苷、尿苷或修饰的尿苷为腺苷；另一个实例为胞嘧啶和5-甲基胞嘧啶，两者均具有鸟苷或修饰的鸟苷作为补体)。因此，例如，序列5’-AXG(其中X为任何修饰的尿苷诸如假尿苷、N1-甲基假尿苷或5-甲氧基尿苷)被认为与AUG 100％相同，因为两者与相同的序列(5'-CAU)完全互补。示例性比对算法是本领域众所周知的Smith-Waterman算法和Needleman-Wunsch算法。本领域技术人员将理解哪种算法和参数设置的选择适合于给定的一对待比对序列；对于长度一般相似且氨基酸的预期同一性>50％或核苷酸的预期同一性>75％的序列，使用EBI在www.ebi.ac.uk网页服务器上提供的Needleman-Wunsch算法界面的默认设置的Needleman-Wunsch算法通常是适当的。

如本文所用，如果第一序列X％的碱基与第二序列进行碱基配对，则第一序列被认为与第二序列“X％互补”。例如，第一序列5’AAGA3’与第二序列3’TTCT5’100％互补，并且第二序列与第一序列100％互补。在一些实施方案中，第一序列5’AAGA3’与第二序列3’TTCTGTGA5’100％互补，而第二序列与第一序列50％互补。

如本文所用，“mRNA”在本文中用于指多核苷酸，其全部或主要是RNA或修饰的RNA，并且包含可翻译成多肽的开放阅读框(即，可充当由核糖体和氨基酰化tRNA翻译的底物)。mRNA可包含包括核糖残基或其类似物(例如2'-甲氧基核糖残基)的磷酸盐-糖骨架。在一些实施方案中，mRNA磷酸盐-糖骨架的糖基本上由核糖残基、2'-甲氧基核糖残基或其组合组成。

可用于本文所述的指导RNA组合物和方法的指导序列在整个申请的表1中示出。

如本文所用，“插入缺失”是指由在靶核酸中的双链断裂(DSB)位点处插入或缺失的多个核苷酸组成的插入/缺失突变。

如本文所用，“因子IX”与“FIX”或“F9”可互换使用，并且也称为克雷司马斯因子。人野生型因子IX蛋白序列可在NCBI NP_000124获得；基因序列可在NCBI NM_000133获得。本文描述了因子IX蛋白序列的实例(例如SEQ ID NO:700、SEQ ID NO:701和/或SEQ ID NO:702)。如本文所用，因子IX还涵盖因子IX的变体，例如，与野生型因子IX相比具有增加的凝血活性的变体。因子IX的活动过度的变体可包含R338的取代。此种变体因子IX的实例包含相对于SEQ ID NO:701的突变R338L。术语活动过度和功能过度在本文中可互换使用。变体因子IX的其他实例在残基338处包含选自丙氨酸、亮氨酸、缬氨酸、异亮氨酸、苯丙氨酸、色氨酸、甲硫氨酸、丝氨酸和苏氨酸的氨基酸。其他因子IX变体在残基338处包含选自亮氨酸、半胱氨酸、天冬氨酸、谷氨酸、组氨酸、赖氨酸、天冬酰胺、谷氨酰胺或酪氨酸的氨基酸。如本文所用，因子IX还涵盖与SEQ ID NO:700 80％、85％、90％、93％、95％、97％、99％相同的变体，所述变体与野生型因子IX相比具有至少60％、70％、80％、85％、90％、92％、94％、96％、98％、99％、100％或更多的活性。如本文所用，因子IX还涵盖与SEQ ID NO:700 80％、85％、90％、93％、95％、97％、99％相同的变体，所述变体与SEQ ID NO:701或SEQ ID NO:702相比具有至少60％、70％、80％、85％、90％、92％、94％、96％、98％、99％、100％或更多的活性。如本文所用，因子IX还涵盖与野生型因子IX相比具有至少80％、85％、90％、92％、94％、96％、98％、99％、100％或更多的活性的片段。在一些实施方案中，因子IX变体可为活动过度的因子IX变体。在某些情况下，与野生型因子IX相比，因子IX变体具有约80％和约100％、120％、140％、160％、180％或200％之间的活性。因子IX变体的比活性可用于计算其功能标准化活性，例如如实施例13所述。因子IX变体(例如R338L)的比活性在文献中是已知的，并且可使用已知方法进行计算。功能过度的因子IX变体的比活性可为相应的野生型因子IX蛋白的约1.2、1.5、2、3、4、5、6、8、10、12或15倍。在一个实施方案中，功能过度的因子IX的比活性可为相应的野生型因子IX蛋白的约8至12倍。在另一个实施方案中，功能过度的因子IX的比活性可为相应的野生型因子IX蛋白的1.2至5倍。示例性序列是本领域已知的，并且包括例如美国专利号4,770,999、4,994,371、5,521,070、6,046,380、6,531,298和8,383,388中的序列。

如本文所用，“靶序列”是指靶基因中与gRNA的指导序列具有互补性的核酸序列。靶序列和指导序列的相互作用引导RNA指导的DNA结合剂在靶序列内结合，并潜在地切口或裂解(取决于剂的活性)。

如本文所用，“血友病”是指由缺失或缺陷的因子IX基因或多肽引起的病症。所述病症包括遗传和/或获得性病状(例如，由基因的自发突变引起)，并且包括血友病B。在一些实施方案中，缺陷的因子IX基因或多肽导致血浆中因子IX水平降低且/或因子IX的凝血活性降低。如本文所用，血友病包括轻度、中度和重度血友病。例如，活性因子低于约1％的个体被分类为患有重度血友病，活性因子为约1-5％的个体患有中度血友病，并且患有轻度血友病的个体具有正常活性凝血因子水平的约5-40％。

如本文所用，“正常”或“健康”个体包括具有正常汇集的血浆水平的50％与160％之间的因子IX活性和抗原水平的个体。基于从人血浆中的纯化，正常成年人中因子IX的浓度(因子IX的正常汇集的血浆水平)为约300-400μg/ml血浆。在一些实施方案中，因子IX(例如循环因子IX)的水平可通过凝血和/或免疫测定(例如，夹心免疫测定、ELISA(参见例如实施例13)、MSD(参见例如，实施例14))来测量。因子IX促凝活性由患者血浆纠正因子IX缺陷的血浆的凝血时间的能力决定。

如本文所用，“治疗”是指用于受试者中疾病或病症的治疗剂的任何施用或应用，并且包括抑制疾病、阻止其发展、减轻疾病的一种或多种症状、治愈疾病或防止疾病的一种或多种症状复发。例如，血友病的治疗可包括缓解血友病的症状。

如本文所用，“双向核酸构建体”(在本文中可互换地称为“双向构建体”)包含至少两个核酸区段，其中一个区段(第一区段)包含编码感兴趣的多肽的编码序列(编码序列在本文中可称为“转基因”或第一转基因)，而另一个区段(第二区段)包含其中所述序列的补体编码感兴趣的多肽的序列(或第二转基因)。也就是说，至少两个区段可编码相同或不同的多肽。当两个区段编码相同的多肽时，第一区段的编码序列不需要与第二区段的序列的补体相同。在一些实施方案中，第二区段的序列为第一区段的编码序列的反向补体。双向构建体可为单链或双链的。本文公开的双向构建体涵盖能够表达任何感兴趣的多肽的构建体。

在一些实施方案中，双向核酸构建体包含第一区段，所述第一区段包含编码第一多肽的编码序列(第一转基因)，以及第二区段，所述第二区段包含其中所述序列的补体编码第二多肽的序列(第二转基因)。在一些实施方案中，第一多肽和第二多肽为至少50％、55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％相同。在一些实施方案中，第一多肽和第二多肽包含例如跨50、100、200、500、1000或更多个氨基酸残基的至少80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％相同的氨基酸序列。

如本文所用，“反向补体”是指作为参考序列的补体序列的序列，其中补体序列以反向方向写入。例如，对于假设序列5’CTGGACCGA3’(SEQ ID NO:500)，“完美”补体序列为3’GACCTGGCT5’(SEQ ID NO:501)，并且“完美”反向补体写为5’TCGGTCCAG3’(SEQ ID NO:502)。反向补体序列不需要是“完美的”，并且仍可编码与参考序列相同的多肽或相似的多肽。由于密码子使用冗余，反向补体可与编码相同多肽的参考序列不同。如本文所用，“反向补体”还包括例如与参考序列的反向补体序列30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、91％、92％、93％、94％、95％、96％、97％、98％、99％或100％相同的序列。

如本文所用，“多肽”是指野生型或变体蛋白(例如，突变体、片段、融合体或其组合)。变体多肽可具有野生型多肽的至少或约5％、10％、15％、20％、30％、35％、40％、45％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％或100％的功能活性。在一些实施方案中，变体与野生型多肽的序列至少70％、75％、80％、85％、90％、92％、93％、94％、95％、96％、97％、98％或99％相同。在一些实施方案中，变体多肽可为活动过度的变体。在某些情况下，变体具有野生型多肽的约80％至约120％、140％、160％、180％、200％、300％、400％、500％或更多的功能活性。

如本文所用，“异源基因”是指已作为外部来源引入宿主细胞基因组内的位点(例如，在基因组基因座处，诸如包括白蛋白内含子1位点的安全港基因座处)的基因。也就是说，引入的基因相对于其插入位点是异源的。由此种异源基因表达的多肽称为“异源多肽”。异源基因可为天然存在或工程改造的，并且可为野生型或变体。异源基因可包括编码异源多肽的序列以外的核苷酸序列(例如，内部核糖体进入位点)。异源基因可为在宿主基因组中作为野生型或变体(例如，突变体)天然存在的基因。例如，尽管宿主细胞含有感兴趣的基因(作为野生型或作为变体)，但是可将相同的基因或其变体作为外部来源引入，以用于例如在高度表达的基因座处表达。异源基因也可为在宿主基因组中非天然存在的基因，或表达在宿主基因组中非天然存在的异源多肽的基因。“异源基因”、“外源基因”和“转基因”可互换使用。在一些实施方案中，异源基因或转基因包括外源核酸序列，例如对于受体细胞不是内源的核酸序列。在一些实施方案中，异源基因或转基因包括外源核酸序列，例如在受体细胞中非天然存在的核酸序列。例如，异源基因相对于其插入位点和相对于其受体细胞可为异源的。

“安全港”基因座是在基因组内的基因座，其中基因可被插入而不对宿主细胞(例如肝细胞)产生显著的有害影响，例如，不引起细胞凋亡、坏死和/或衰老，或不引起与对照细胞相比超过5％、10％、15％、20％、25％、30％或40％的细胞凋亡、坏死和/或衰老。参见例如，Hsin等人,“Hepatocyte death in liver inflammation,fibrosis,andtumorigenesis,”2017.。在一些实施方案中，安全港基因座允许外源基因过度表达而不对宿主细胞(例如肝细胞)产生显著的有害影响，例如，不引起细胞凋亡、坏死和/或衰老，或不引起与对照细胞相比超过5％、10％、15％、20％、25％、30％或40％的细胞凋亡、坏死和/或衰老。在一些实施方案中，期望的安全港基因座可为其中插入的基因序列的表达不被来自邻近基因的通读表达干扰的基因。安全港可在白蛋白基因内，诸如人白蛋白基因内。安全港可在白蛋白内含子1区域内，例如人白蛋白内含子1内。安全港可为例如针对肝脏组织或肝细胞宿主细胞的人安全港。在一些实施方案中，安全港允许外源基因过度表达而不对宿主细胞或细胞群(诸如肝细胞或肝脏细胞)产生显著的有害影响，例如，不引起细胞凋亡、坏死和/或衰老，或不引起与对照细胞或细胞群相比超过5％、10％、15％、20％、25％、30％或40％的细胞凋亡、坏死和/或衰老。

II.组合物

A.包含指导RNA(gRNA)的组合物

本文提供了可用于在基因组基因座(例如宿主细胞或宿主细胞群的安全港位点)内插入和表达因子IX基因的指导RNA组合物和方法。特别地，如本文所例示，在白蛋白基因座(例如，在内含子1处)靶向并插入外源基因允许使用白蛋白的内源启动子来驱动外源基因的稳健表达。本公开部分地基于特异性靶向白蛋白基因的内含子1内的位点并且提供因子IX基因的有效插入和表达的指导RNA的鉴定。如实施例中所示并在本文中进一步描述，经鉴定的gRNA介导如通过插入缺失形成活性所测量的高水平编辑的能力出乎意料地不一定与使用相同的gRNA介导如通过例如转基因的表达所测量的转基因的有效插入相关联。也就是说，能够实现高水平插入缺失形成的某些gRNA不一定能够介导有效插入，并且相反，显示出实现低水平插入缺失形成的某些gRNA可介导转基因的有效插入和表达。

在一些实施方案中，本文提供了可用于在宿主细胞的白蛋白基因座(例如，内含子1)的区域内插入和表达因子IX基因的组合物和方法。在一些实施方案中，本文公开的组合物可用于例如使用本文公开的指导RNA与RNA指导的DNA结合剂以及包含异源因子IX核酸(“因子IX转基因”)的构建体(例如，供体构建体或模板)来在宿主细胞的白蛋白基因座内引入或插入异源因子IX核酸。在一些实施方案中，本文公开的组合物可用于例如使用本文公开的指导RNA与RNA指导的DNA结合剂以及包含异源因子IX核酸的构建体(例如，供体)来从宿主细胞的白蛋白基因座表达异源因子IX。在一些实施方案中，本文公开的组合物可用于例如使用本文公开的指导RNA与RNA指导的DNA结合剂以及包含异源因子IX核酸的双向构建体来从宿主细胞的白蛋白基因座表达异源因子IX。在一些实施方案中，本文公开的组合物可用于例如使用本文公开的指导RNA与RNA指导的DNA结合剂(例如，CRISPR/Cas系统)来诱导宿主细胞的血清白蛋白基因内的断裂(例如，双链断裂(DSB)或单链断裂(切口))。所述组合物可在体外或体内用于例如治疗血友病。

在一些实施方案中，本文公开的指导RNA包含结合或能够结合在白蛋白基因座的内含子内的指导序列。在一些实施方案中，本文公开的指导RNA结合在人白蛋白基因的内含子1(SEQ ID NO:1)的区域内。应当理解，并非指导序列的每个碱基都必须结合在所述区域内。例如，在一些实施方案中，指导RNA序列的15、16、17、18、19、20或更多个碱基与所述区域结合。例如，在一些实施方案中，指导RNA序列的15、16、17、18、19、20或更多个连续碱基与所述区域结合。

在一些实施方案中，本文公开的指导RNA在人白蛋白内含子1(SEQ ID NO:1)内的位点处通过RNA指导的DNA结合剂(例如，Cas核酸酶)介导靶特异性切割。应当理解，在一些实施方案中，指导RNA包含与所述区域结合或能够与所述区域结合的指导序列。

在一些实施方案中，本文公开的指导RNA包含与选自由SEQ ID NO:2-33组成的组的序列至少95％、90％、85％、80％或75％相同的指导序列。在一些实施方案中，本文公开的指导RNA包含与选自由SEQ ID NO:2-5、10-17、21-27和29-33组成的组的序列至少95％、90％、85％、80％或75％相同的指导序列。

在一些实施方案中，本文公开的指导RNA包含具有选自由与选自由SEQ ID No:2-33组成的组的序列至少95％、90％、85％、80％或75％相同的序列组成的组的序列的至少15、16、17、18、19或20个连续核苷酸的指导序列。在一些实施方案中，本文公开的指导RNA包含选自由SEQ ID NO:2、8、13、19、28、29、31、32、33组成的组的指导序列。在一些实施方案中，本文公开的指导RNA包含选自由SEQ ID NO:2、8、13、19、28、29、31、32、33组成的组的序列的至少17、18、19或20个连续核苷酸的指导序列。在一些实施方案中，本文公开的指导RNA包含选自由SEQ ID NO:34、40、45、51、60、61、63、64、65、66、72、77、83、92、93、95、96和97组成的组的指导序列。在一些实施方案中，本文公开的指导RNA包含与选自由SEQ ID NO:2-33组成的组的序列至少95％、90％、85％、80％或75％相同的指导序列。在一些实施方案中，本文公开的指导RNA包含选自由SEQ ID NO:2-33组成的组的序列的至少17、18、19或20个连续核苷酸的指导序列。在一些实施方案中，本文公开的指导RNA包含选自由SEQ ID NO:34-97组成的组的指导序列。

在一些实施方案中，本文公开的指导RNA包含具有选自由与选自由SEQ ID NO:2-5、10-17、21-27和29-33组成的组的序列至少95％、90％、85％、80％或75％相同的序列组成的组的序列的至少15、16、17、18、19或20个连续核苷酸的指导序列。在一些实施方案中，本文公开的指导RNA包含选自由SEQ ID NO:2-5、10-17、21-27和29-33组成的组的指导序列。在一些实施方案中，本文公开的指导RNA包含选自由SEQ ID NO:2-5、10-17、21-27和29-33组成的组的序列的至少17、18、19或20个连续核苷酸的指导序列。在一些实施方案中，本文公开的指导RNA包含选自由SEQ ID NO:34-37、42-49、53-59、61-69、74-81、85-91和93-97组成的组的指导序列。在一些实施方案中，本文公开的指导RNA包含与选自由SEQ ID NO:2-5、10-17、21-27和29-33组成的组的序列至少95％、90％、85％、80％或75％相同的指导序列。在一些实施方案中，本文公开的指导RNA包含选自由SEQ ID NO:2-5、10-17、21-27和29-33组成的组的序列的至少17、18、19或20个连续核苷酸的指导序列。在一些实施方案中，本文公开的指导RNA包含选自由SEQ ID NO:34-37、42-49、53-59、61-69、74-81、85-91和93-97组成的组的指导序列。

在一些实施方案中，本文公开的指导RNA介导靶特异性切割，从而导致双链断裂(DSB)。在一些实施方案中，本文公开的指导RNA介导靶特异性切割，从而导致单链断裂(切口)。

在一些实施方案中，本文公开的指导RNA结合至原间隔子相邻基序(PAM)上游的区域。如本领域技术人员将理解的，PAM序列发生在与含有靶序列的链相反的链上。也就是说，PAM序列在靶链(含有指导RNA结合的靶序列的链)的补体链上。在一些实施方案中，PAM选自由NGG、NNGRRT、NNGRR(N)、NNAGAAW、NNNNG(A/C)TT和NNNNRYAC组成的组。

在一些实施方案中，本文提供的指导RNA序列与邻近PAM序列的序列互补。

在一些实施方案中，指导RNA序列包含与根据人参考基因组hg38中的坐标选自本文表中的基因组区域内的序列互补的序列。在一些实施方案中，指导RNA序列包含与包含选自本文表中的基因组区域内的5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25个连续核苷酸的序列互补的序列。在一些实施方案中，指导RNA序列包含与包含跨越选自本文表中的5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24或25个连续核苷酸的序列互补的序列。

本文公开的指导RNA介导靶特异性切割，从而导致双链断裂(DSB)。本文公开的指导RNA介导靶特异性切割，从而导致单链断裂(SSB或切口)。

在一些实施方案中，本文公开的指导RNA通过RNA指导的DNA结合剂(例如，如本文公开的Cas核酸酶)介导靶特异性切割，从而导致在白蛋白基因的内含子1内插入异源因子IX核酸。在一些实施方案中，指导RNA和/或切割导致异源因子IX基因的插入率在30％与35％之间、35％与40％之间、40％与45％之间、45％与50％之间、50％与55％之间、55％与60％之间、60％与65％之间、65％与70％之间、70％与75％之间、75％与80％之间、80％与85％之间、85％与90％之间、90％与95％之间或95％与99％之间。在一些实施方案中，指导RNA和/或切割导致异源因子IX核酸的插入率为至少20％、至少30％、至少40％、至少50％、至少60％、至少70％、至少80％、至少90％。插入率可在体外或体内测量。例如，在一些实施方案中，可通过检测和测量细胞群中插入的因子IX核酸，并计算含有插入的因子IX核酸的群的百分比来确定插入率。测量插入率的方法是本领域已知且可用的。在一些实施方案中，指导RNA允许异源因子IX基因的5％与10％之间、10％与15％之间、15％与20％之间、20％与25％之间、25％与30％之间、30％与35％之间、35％与40％之间、40％与45％之间、45％与50％之间、50％与55％之间、55％与60％之间、60％与65％之间、65％与70％之间、70％与75％之间、75％与80％之间、80％与85％之间、85％与90％之间、90％与95％之间、95％与99％之间或更多增加的表达。异源因子IX基因的增加的表达可在体外或体内测量。例如，在一些实施方案中，可通过检测和测量因子IX多肽水平并将所述水平与在例如处理细胞或施用于受试者之前的因子IX多肽水平进行比较来确定增加的表达。在一些实施方案中，指导RNA允许异源因子IX基因的表达所引起的5％与10％之间、10％与15％之间、15％与20％之间、20％与25％之间、25％与30％之间、30％与35％之间、35％与40％之间、40％与45％之间、45％与50％之间、50％与55％之间、55％与60％之间、60％与65％之间、65％与70％之间、70％与75％之间、75％与80％之间、80％与85％之间、85％与90％之间、90％与95％之间、95％与99％之间或更多增加的活性。例如，可通过检测和测量凝血活性并将所述活性与在例如处理细胞或施用于受试者之前的凝血活性进行比较来确定增加的活性。在一些实施方案中，可通过评估aPTT测定中的凝血功能和/或TGA-EA测定中的凝血酶生成来确定增加的活性。此类方法是可用的并且是本领域已知的(例如，Simioni等人,NEJM 2009)。

表1中SEQ ID NO:2-33处所示的指导序列中的每个还可包含另外的核苷酸以形成crRNA和/或指导RNA，例如，其中以下示例性核苷酸序列在指导序列3’端之后：GUUUUAGAGCUAUGCUGUUUUG(SEQ ID NO:400)，呈5'至3'方向。基因组坐标根据人参考基因组hg38。在sgRNA的情况下，上述指导序列还可包含另外的核苷酸以形成sgRNA，例如，其中以下示例性核苷酸序列在指导序列3’端之后：GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU(SEQ ID NO:401)或GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(SEQ ID NO:402)，呈5’至3’方向。

表1中SEQ ID NO:2-5、10-17、21-27和29-33处的指导序列中的每个还可包含另外的核苷酸以形成crRNA，例如，其中以下示例性核苷酸序列在指导序列3’端之后：GUUUUAGAGCUAUGCUGUUUUG(SEQ ID NO:400)，呈5'至3'方向。在sgRNA的情况下，上述指导序列还可包含另外的核苷酸以形成sgRNA，例如，其中以下示例性核苷酸序列在指导序列3’端之后：GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGCUUUU(SEQ ID NO:401)或GUUUUAGAGCUAGAAAUAGCAAGUUAAAAUAAGGCUAGUCCGUUAUCAACUUGAAAAAGUGGCACCGAGUCGGUGC(SEQ ID NO:402)，呈5’至3’方向。

表1：人指导RNA序列和染色体坐标

指导RNA还可包含trRNA。在本文所述的每个组合物和方法实施方案中，crRNA和trRNA可作为单个RNA(sgRNA)缔合或可在单独的RNA(dgRNA)上。在sgRNA的情况下，crRNA和trRNA组分可例如通过磷酸二酯键或其他共价键共价连接。在一些实施方案中，sgRNA在核苷酸之间包含不是磷酸二酯键联的一个或多个键联。

在本文所述的组合物、用途和方法实施方案中的每个中，指导RNA可包含两个RNA分子作为“双指导RNA”或“dgRNA”。dgRNA包含第一RNA分子，所述第一RNA分子包含含有例如表1所示的指导序列的crRNA，以及第二RNA分子，所述第二RNA分子包含trRNA。第一RNA分子和第二RNA分子可以不共价连接，但是可通过crRNA和trRNA的部分之间的碱基配对形成RNA双链体。

在本文所述的组合物、用途和方法实施方案中的每个中，指导RNA可包含单个RNA分子作为“单指导RNA”或“sgRNA”。sgRNA可包含crRNA(或其一部分)，其包含与trRNA共价连接的表1所示的指导序列。sgRNA可包含表1所示的指导序列的15、16、17、18、19或20个连续核苷酸。在一些实施方案中，crRNA和trRNA通过接头共价连接。在一些实施方案中，sgRNA通过crRNA和trRNA的部分之间的碱基配对形成茎-环结构。在一些实施方案中，crRNA和trRNA通过不是磷酸二酯键的一个或多个键共价连接。

在一些实施方案中，trRNA可包含衍生自天然存在的CRISPR/Cas系统的trRNA序列的全部或部分。在一些实施方案中，trRNA包含截短的或修饰的野生型trRNA。trRNA的长度取决于所使用的CRISPR/Cas系统。在一些实施方案中，trRNA包含5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、40、50、60、70、80、90、100或超过100个核苷酸或由其组成。在一些实施方案中，trRNA可包含某些二级结构，例如像一种或多种发夹或茎-环结构，或一种或多种凸起结构。

在一些实施方案中，人白蛋白基因座的内含子1内的靶序列或区域(SEQ ID NO:1)可与指导RNA的指导序列互补。在一些实施方案中，指导RNA的指导序列与其相应的靶序列之间的互补性或同一性程度可为至少75％、80％、85％、90％、95％、96％、97％、98％、99％或100％。在一些实施方案中，靶序列和gRNA的指导序列可为100％互补或相同的。在其他实施方案中，靶序列和gRNA的指导序列可含有至少一个错配。例如，靶序列和gRNA的指导序列可含有1、2、3、4或5个错配，其中指导序列的总长度为约20或为20。在一些实施方案中，靶序列和gRNA的指导序列可含有1至4个错配，其中指导序列为约20或为20个核苷酸。

在一些实施方案中，本文公开的组合物或制剂包含mRNA，所述mRNA包含编码RNA指导的DNA结合剂诸如本文所述的Cas核酸酶的开放阅读框(ORF)。在一些实施方案中，提供、使用或施用包含编码RNA指导的DNA结合剂诸如Cas核酸酶的ORF的mRNA。

B.修饰的gRNA和mRNA

在一些实施方案中，gRNA为化学修饰的。包含一个或多个修饰的核苷或核苷酸的gRNA称为“修饰的”gRNA或“化学修饰的”gRNA，以描述一种或多种非天然和/或天然存在的组分或构型的存在，所述组分或构型用于替代或补充标准A、G、C和U残基。在一些实施方案中，用非标准核苷或核苷酸合成修饰的gRNA，在此称为“修饰的”。修饰的核苷和核苷酸可包括以下中的一种或多种：(i)改变，例如替换磷酸二酯骨架键联中的一种或两种非连接的磷酸氧和/或一种或多种连接的磷酸氧(示例性骨架修饰)；(ii)改变，例如替换核糖糖的成分，例如核糖糖上的2'羟基(示例性糖修饰)；(iii)用“脱磷酸”接头完全替换磷酸部分(示例性骨架修饰)；(iv)修饰或替换天然存在的核碱基，包括用非标准核碱基(示例性碱基修饰)；(v)替换或修饰核糖-磷酸骨架(示例性骨架修饰)；(vi)修饰寡核苷酸的3'端或5'端，例如去除、修饰或替换末端磷酸基团或使部分、帽或接头缀合(此类3'或5'帽修饰可包含糖和/或骨架修饰)；以及(vii)修饰或替换糖(示例性糖修饰)。

诸如上面列出的化学修饰可组合以提供包含可具有两个、三个、四个或更多个修饰的核苷和核苷酸(统称为“残基”)的修饰的gRNA和/或mRNA。例如，修饰的残基可具有修饰的糖和修饰的核碱基。在一些实施方案中，修饰gRNA的每个碱基，例如，所有碱基均具有修饰的磷酸基团，诸如硫代磷酸酯基团。在某些实施方案中，gRNA分子的所有或基本上所有的磷酸基团被硫代磷酸酯基团替换。在一些实施方案中，修饰的gRNA在RNA的5'端或附近包含至少一个修饰的残基。在一些实施方案中，修饰的gRNA在RNA的3'端或附近包含至少一个修饰的残基。某些gRNA在RNA的5'端和3'端或附近包含至少一个修饰的残基。

在一些实施方案中，gRNA包含一个、两个、三个或更多个修饰的残基。在一些实施方案中，修饰的gRNA中的位置的至少5％(例如，至少5％、至少10％、至少15％、至少20％、至少25％、至少30％、至少35％、至少40％、至少45％、至少50％、至少55％、至少60％、至少65％、至少70％、至少75％、至少80％、至少85％、至少90％、至少95％或100％)为修饰的核苷或核苷酸。

未修饰的核酸可易于被例如细胞内核酸酶或血清中发现的核酸酶降解。例如，核酸酶可水解核酸磷酸二酯键。因此，在一个方面，本文所述的gRNA可含有一个或多个修饰的核苷或核苷酸，以例如向细胞内或基于血清的核酸酶引入稳定性。在一些实施方案中，当在体内和离体引入到细胞群中时，本文所述的修饰的gRNA分子可表现出降低的先天免疫应答。术语“先天免疫应答”包括对包括单链核酸的外源核酸的细胞应答，其涉及诱导细胞因子特别是干扰素的表达和释放以及细胞死亡。

在骨架修饰的一些实施方案中，修饰的残基的磷酸基团可通过用不同的取代基替换一个或多个氧来修饰。此外，修饰的残基(例如存在于修饰的核酸中的修饰的残基)可包括用如本文所述的修饰的磷酸基团完全替换未修饰的磷酸部分。在一些实施方案中，磷酸盐骨架的骨架修饰可包括导致不带电荷的接头或具有不对称电荷分布的带电荷的接头的改变。

修饰的磷酸酯基团的实例包括硫代磷酸酯、硒代磷酸酯、硼烷磷酸(boranophosphate)、硼烷磷酸酯、氢膦酸酯、氨基磷酸酯、烷基或芳基膦酸酯和磷酸三酯。未修饰的磷酸酯基团中的磷原子是非手性的。然而，用上述原子或原子基团中的一个替换非桥联氧中的一个可赋予磷原子手性。立构磷原子可具有“R”构型(本文中为Rp)或“S”构型(本文中为Sp)。骨架也可通过用氮(桥联氨基磷酸酯)、硫(桥联硫代磷酸酯)和碳(桥联亚甲基膦酸酯)替换桥联氧(即连接磷酸酯与核苷的氧)来修饰。替换可发生在连接氧或两个连接氧上。

在某些骨架修饰中，磷酸基团可被不含磷的连接器替换。在一些实施方案中，带电荷的磷酸基团可被中性部分替换。可替换磷酸基团的部分的实例可包括但不限于例如，膦酸甲酯、羟氨基、硅氧烷、碳酸盐、羧甲基、氨基甲酸酯、酰胺、硫醚、环氧乙烷接头、磺酸盐、磺酰胺、硫代甲缩醛、甲缩醛、肟、亚甲基亚氨基、亚甲基甲基亚氨基、亚甲基肼基、亚甲基二甲基肼基和亚甲氧基甲基亚氨基。

还可构建可模拟核酸的支架，其中磷酸接头和核糖糖被耐核酸酶的核苷或核苷酸替代物替换。此类修饰可包括骨架修饰和糖修饰。在一些实施方案中，核碱基可被替代骨架拴系。实例可包括但不限于吗啉代、环丁基、吡咯烷和肽核酸(PNA)核苷替代物。

修饰的核苷和修饰的核苷酸可包括对糖基的一个或多个修饰，即糖修饰。例如，可修饰2'羟基(OH)，例如用许多不同的“氧”或“脱氧”取代基替换。在一些实施方案中，对2'羟基的修饰可增强核酸的稳定性，因为羟基不再可脱质子化以形成2'-烷氧离子。

2'羟基修饰的实例可包括烷氧基或芳氧基(OR，其中“R”可为例如烷基、环烷基、芳基、芳烷基、杂芳基或糖)；聚乙二醇(PEG)、O(CH₂CH₂O)_nCH₂CH₂OR，其中R可为例如H或任选取代的芳基，并且n可为0至20(例如，0至4、0至8、0至10、0至16、1至4、1至8、1至10、1至16、1至20、2至4、2至8、2至10、2至16、2至20、4至8、4至10、4至16和4至20)的整数。在一些实施方案中，2'羟基修饰可为2'-O-Me。在一些实施方案中，2'羟基修饰可为2'-氟修饰，其用氟化物替换2'羟基。在一些实施方案中，2'羟基修饰可为2'-H，其用氢替换2'羟基。在一些实施方案中，2'羟基修饰可包括“锁”核酸(LNA)，其中2'羟基可例如通过C_1-6亚烷基或C_1-6杂亚烷基桥连接到相同核糖糖的4'碳，其中示例性桥可包括亚甲基、丙烯、醚或氨基桥；O-氨基(其中氨基可为例如NH₂；烷基氨基、二烷基氨基、杂环基、芳基氨基、二芳基氨基、杂芳基氨基或二杂芳基氨基、乙二胺或聚氨基)和氨基烷氧基、O(CH₂)_n-氨基(其中氨基可为例如NH₂；烷基氨基、二烷基氨基、杂环基、芳基氨基、二芳基氨基、杂芳基氨基或二杂芳基氨基、乙二胺或聚氨基)。在一些实施方案中，2'羟基修饰可包括其中核糖环缺乏C2'-C3'键的“解锁”核酸(UNA)。在一些实施方案中，2'羟基修饰可包括甲氧基乙基(MOE)，(OCH₂CH₂OCH₃，例如PEG衍生物)。

“脱氧”2'修饰可包括氢(即脱氧核糖，例如在部分dsRNA的悬突部分处)；卤素(例如溴、氯、氟或碘)；氨基(其中氨基可为例如NH₂；烷基氨基、二烷基氨基、杂环基、芳基氨基、二芳基氨基、杂芳基氨基、二杂芳基氨基或氨基酸)；NH(CH₂CH₂NH)_nCH2CH₂-氨基(其中氨基可为例如本文所述的)、-NHC(O)R(其中R可为例如烷基、环烷基、芳基、芳烷基、杂芳基或糖)、氰基；巯基；烷基-硫代-烷基；硫代烷氧基；以及烷基、环烷基、芳基、烯基和炔基，其可任选地被例如本文所述的氨基取代。

糖修饰可包含糖基，所述糖基还可含有具有与核糖中相应碳相反的立体化学构型的一个或多个碳。因此，修饰的核酸可包括含有例如阿拉伯糖作为糖的核苷酸。修饰的核酸还可包括脱碱基糖。这些脱碱基糖也可在组成糖原子中的一个或多个处进一步修饰。修饰的核酸还可包括一种或多种L型糖，例如L-核苷。

可并入修饰的核酸中的本文所述的修饰的核苷和修饰的核苷酸可包括修饰的碱基，也称为核碱基。核碱基的实例包括但不限于腺嘌呤(A)、鸟嘌呤(G)、胞嘧啶(C)和尿嘧啶(U)。这些核碱基可被修饰或被完全替换以提供可被并入修饰的核酸中的修饰的残基。核苷酸的核碱基可独立地选自嘌呤、嘧啶、嘌呤类似物或嘧啶类似物。在一些实施方案中，核碱基可包括例如碱基的天然存在的衍生物和合成的衍生物。

在采用双指导RNA的实施方案中，crRNA和tracr RNA各自可含有修饰。此类修饰可在crRNA和/或tracr RNA的一端或两端。在包含sgRNA的实施方案中，可对sgRNA的一端或两端处的一个或多个残基进行化学修饰、和/或可对内部核苷进行修饰和/或可对整个sgRNA进行化学修饰。某些实施方案包括5'端修饰。某些实施方案包括3'端修饰。

在一些实施方案中，本文公开的指导RNA包括公开于2017年12月8日提交的标题为“Chemically Modified Guide RNAs”的WO2018/107028A1中的修饰模式中的一种，其内容特此以引用的方式整体并入。在一些实施方案中，本文公开的指导RNA包括公开于US20170114334中的结构/修饰模式中的一种，其内容特此以引用的方式整体并入。在一些实施方案中，本文公开的指导RNA包括公开于WO2017/136794、WO2017004279、US2018187186、US2019048338中的结构/修饰模式中的一种，其内容特此以引用的方式整体并入。

在一些实施方案中，本公开的sgRNA包含下表2所示的修饰模式。表2中的“全序列”是指表1中列出的指导中的每个的sgRNA序列。“修饰的全序列”示出了每个sgRNA的修饰模式。

表2：人白蛋白指导序列的sgRNA和对sgRNA的修饰模式

在一些实施方案中，经修饰的sgRNA包含以下序列：mN*mN*mN*NNNNNNNNNNNNNNNNNGUUUUAGAmGmCmUmAmGmAmAmAmUmAmGmCAAGUUAAAAUAAGGCUAGUCCGUUAUCAmAmCmUmUmGmAmAmAmAmAmGmUmGmGmCmAmCmCmGmAmGmUmCmGmGmUmGmCmU*mU*mU*mU(SEQ ID NO:300)，其中“N”可为任何天然或非天然核苷酸，并且其中全部N包含如表1所述的白蛋白内含子1指导序列。例如，本文涵盖SEQ ID NO:300，其中N被表1中本文公开的任何指导序列(SEQ ID No:2-33)替换。

例如，本文涵盖SEQ ID NO:300，其中N被表1中本文公开的任何指导序列(SEQ IDNO:2-5、10-17、21-27和29-33)替换。

下文所述的任何修饰都可存在于本文所述的gRNA和mRNA中。

术语“mA”、“mC”、“mU”或“mG”可用于表示已被2'-O-Me修饰的核苷酸。

2’-O-甲基的修饰可描述如下：

已显示影响核苷酸糖环的另一种化学修饰为卤素取代。例如，核苷酸糖环上的2'-氟(2'-F)取代可增加寡核苷酸结合亲和力和核酸酶稳定性。

在本申请中，术语“fA”、“fC”、“fU”或“fG”可用于表示已被2'-F取代的核苷酸。

2'-F的取代可描述如下：

硫代磷酸酯(PS)键联或键是指其中硫被磷酸二酯键联中(例如在核苷酸碱基之间的键中)一个非桥联磷酸氧取代的键。当使用硫代磷酸酯生成寡核苷酸时，修饰的寡核苷酸也可称为S-oligo。

可使用“*”来描述PS修饰。在本申请中，术语A*、C*、U*或G*可用于表示通过PS键与下一个(例如3')核苷酸连接的核苷酸。

在本申请中，术语“mA*”、“mC*”、“mU*”或“mG*”可用于表示已被2'-O-Me取代并通过PS键与下一个(例如3')核苷酸连接的核苷酸。

下图显示了将S-取代为非桥联磷酸氧，从而生成PS键代替磷酸二酯键：

脱碱基核苷酸是指缺乏含氮碱基的那些。下图描述了具有缺乏碱基的脱碱基(也称为脱嘌呤)位点的寡核苷酸：

反转碱基是指具有由正常的5'至3'键联反转的键联的那些碱基(即5'至5'键联或3'至3'键联)。例如：

脱碱基核苷酸可通过反转键联连接。例如，脱碱基核苷酸可通过5'至5'键联连接到末端5'核苷酸，或脱碱基核苷酸可通过3'至3'键联连接到末端3'核苷酸。在末端5'或3'核苷酸处的反转脱碱基核苷酸也可称为反转脱碱基端帽。

在一些实施方案中，修饰5'末端的前三个、四个或五个核苷酸中的一个或多个以及3'末端的后三个、四个或五个核苷酸中的一个或多个。在一些实施方案中，修饰为2'-O-Me、2'-F、反转脱碱基核苷酸、PS键或本领域中众所周知的其他核苷酸修饰，以增加稳定性和/或性能。

在一些实施方案中，5'末端的前四个核苷酸和3'末端的后四个核苷酸与硫代磷酸酯(PS)键连接。

在一些实施方案中，5'末端的前三个核苷酸和3'末端的后三个核苷酸包含2'-O-甲基(2'-O-Me)修饰的核苷酸。在一些实施方案中，5'末端的前三个核苷酸和3'末端的后三个核苷酸包含2'-氟(2'-F)修饰的核苷酸。在一些实施方案中，5'末端的前三个核苷酸和3'末端的后三个核苷酸包含反转脱碱基核苷酸。

在一些实施方案中，指导RNA包含修饰的sgRNA。在一些实施方案中，sgRNA包含SEQID No:300所示的修饰模式，其中N为任何天然或非天然核苷酸，并且其中全部N包含将核酸酶引导到人白蛋白内含子1中的靶序列的指导序列，例如，如表1所示。

在一些实施方案中，指导RNA包含SEQ ID No:34-97中任一个所示的sgRNA。在一些实施方案中，指导RNA包含sgRNA，所述sgRNA包含SEQ ID No:2-33的指导序列和SEQ ID No:300的核苷酸中的任一个，其中SEQ ID No:300的核苷酸在指导序列的3'端，并且其中sgRNA可被修饰，例如，如SEQ ID No:300所示。

在一些实施方案中，指导RNA包含SEQ ID NO:34-37、42-49、53-59、61-69、74-81、85-91和93-97中任一个所示的sgRNA。在一些实施方案中，指导RNA包含sgRNA，所述sgRNA包含SEQ ID NO:2-5、10-17、21-27和29-33的指导序列和SEQ ID No:300的核苷酸中的任一个，其中SEQ ID NO:300的核苷酸在指导序列的3'端，并且其中sgRNA可被修饰，例如，如SEQID No:300所示。

如上所述，在一些实施方案中，本文公开的组合物或制剂包含mRNA，所述mRNA包含编码RNA指导的DNA结合剂诸如本文所述的Cas核酸酶的开放阅读框(ORF)。在一些实施方案中，提供、使用或施用包含编码RNA指导的DNA结合剂诸如Cas核酸酶的ORF的mRNA。如下所述，包含Cas核酸酶的mRNA可包含Cas9核酸酶，诸如具有裂解酶、切口酶和/或位点特异性DNA结合活性的酿脓链球菌Cas9核酸酶。在一些实施方案中，编码RNA指导的DNA核酸酶的ORF为“修饰的RNA指导的DNA结合剂ORF”或简单的“修饰的ORF”，其用作指示ORF被修饰的简写。

本文提供了Cas9 ORF，包括修饰的Cas9 ORF，并且其是本领域已知的。作为一个实例，可对Cas9 ORF进行密码子优化，使得编码序列包括一个或多个氨基酸的一个或多个替代密码子。如本文所用，“替代密码子”是指给定氨基酸的密码子使用的变化，并且对于给定的表达系统，可以是或可以不是优选或优化的密码子(密码子优化的)。优选的密码子使用或在给定的表达系统中良好耐受的密码子是本领域已知的。WO2013/176772、WO2014/065596、WO2016/106121和WO2019/067910的Cas9编码序列、Cas9 mRNA和Cas9蛋白序列特此以引用的方式并入。特别地，WO2019/067910第[0449]段的表中的ORF和Cas9氨基酸序列以及WO2019/067910第[0214]至[0234]段中的Cas9 mRNA和ORF特此以引用的方式并入。

在一些实施方案中，修饰的ORF可包含至少一个、多个或所有尿苷位置处的修饰的尿苷。在一些实施方案中，修饰的尿苷是在5位例如被卤素、甲基或乙基修饰的尿苷。在一些实施方案中，修饰的尿苷是在1位例如被卤素、甲基或乙基修饰的假尿苷。修饰的尿苷可为例如假尿苷、N1-甲基-假尿苷、5-甲氧基尿苷、5-碘尿苷或其组合。

在一些实施方案中，修饰的尿苷为5-甲氧基尿苷。在一些实施方案中，修饰的尿苷为5-碘尿苷。在一些实施方案中，修饰的尿苷为假尿苷。在一些实施方案中，修饰的尿苷为N1-甲基-假尿苷。在一些实施方案中，修饰的尿苷为假尿苷和N1-甲基-假尿苷的组合。在一些实施方案中，修饰的尿苷为假尿苷和5-甲氧基尿苷的组合。在一些实施方案中，修饰的尿苷为N1-甲基假尿苷和5-甲氧基尿苷的组合。在一些实施方案中，修饰的尿苷为5-碘尿苷和N1-甲基-假尿苷的组合。在一些实施方案中，修饰的尿苷为假尿苷和5-碘尿苷的组合。在一些实施方案中，修饰的尿苷为5-碘尿苷和5-甲氧基尿苷的组合。

在一些实施方案中，本文公开的mRNA包含5'帽，诸如Cap0、Cap1或Cap2。5'帽通常是通过5'-三磷酸将7-甲基鸟嘌呤核糖核苷酸(其可被进一步修饰，如下面例如关于ARCA所讨论的)连接到mRNA的5'至3'链的第一个核苷酸的5’位置，即第一帽近端核苷酸。在Cap0中，mRNA的第一帽近端核苷酸和第二帽近端核苷酸的核糖均包含2'-羟基。在Cap1中，mRNA的第一转录核苷酸和第二转录核苷酸的核糖分别包含2'-甲氧基和2'-羟基。在Cap2中，mRNA的第一帽近端核苷酸和第二帽近端核苷酸的核糖均包含2'-甲氧基。参见例如，Katibah等人(2014)Proc Natl Acad Sci USA 111(33):12025-30；Abbas等人(2017)ProcNatl Acad Sci USA 114(11):E2106-E2115。大多数内源性高等真核mRNA，包括哺乳动物mRNA诸如人mRNA，均包含Cap1或Cap2。Cap0和不同于Cap1和Cap2的其他帽结构可在哺乳动物诸如人中具有免疫原性，这是由于先天免疫系统的组分(诸如IFIT-1和IFIT-5)将其识别为“非自身”，这可能导致包括I型干扰素的细胞因子水平升高。先天免疫系统的组分(诸如IFIT-1和IFIT-5)也可能与eIF4E竞争，以便与具有Cap1或Cap2以外的帽的mRNA结合，从而可能抑制mRNA的翻译。

可共转录地包括帽。例如，ARCA(抗反向帽类似物；Thermo Fisher Scientific目录号AM8045)是帽类似物，其包含与可在起始时体外并入转录的鸟嘌呤核糖核苷酸的5'位置连接的7-甲基鸟嘌呤3'-甲氧基-5'-三磷酸酯。ARCA产生Cap0帽，其中第一帽近端核苷酸的2'位置为羟基。参见例如，Stepinski等人,(2001)“Synthesis and properties ofmRNAs containing the novel‘anti-reverse’cap analogs7-methyl(3'-O-methyl)GpppGand 7-methyl(3'deoxy)GpppG,”RNA 7:1486–1495。ARCA结构如下所示。

CleanCap^TM AG(m7G(5')ppp(5')(2'OMeA)pG； TriLink Biotechnologies 目录号N-7113)或CleanCap^TM GG(m7G(5')ppp(5')(2'OMeG)pG；TriLink Biotechnologies目录号N-7133)可用于共转录地提供Cap1结构。CleanCap^TM AG和CleanCap^TM GG的3'-O-甲基化形式也可分别作为目录号N-7413和N-7433购自TriLink Biotechnologies。CleanCap^TM AG结构如下所示。

替代地，可在转录后将帽添加到RNA上。例如，牛痘病毒加帽酶是可商购获得的(New England Biolabs目录号M2080S)，并且具有由其D1亚基提供的RNA三磷酸酶和鸟嘌呤基转移酶活性以及由其D12亚基提供的鸟嘌呤甲基转移酶。因此，在S-腺苷甲硫氨酸和GTP存在的情况下，它可以将7-甲基鸟嘌呤添加到RNA，从而得到Cap0。参见例如，Guo,P.和Moss,B.(1990)Proc.Natl.Acad.Sci.USA 87,4023-4027；Mao,X.和Shuman,S.(1994)J.Biol.Chem.269,24472-24479。

在一些实施方案中，mRNA还包含聚腺苷酸化(poly-A)尾。在一些实施方案中，poly-A尾包含至少20、30、40、50、60、70、80、90或100个腺嘌呤，任选多至300个腺嘌呤。在一些实施方案中，poly-A尾包含95、96、97、98、99或100个腺嘌呤核苷酸。

C.供体构建体

本文所述的组合物和方法包括核酸构建体的用途，所述核酸构建体包含编码要插入到由本公开的指导RNA和RNA指导的DNA结合剂创建的切割位点中的异源因子IX基因的序列。如本文所用，此种构建体有时称为“供体构建体/模板”。在一些实施方案中，构建体为DNA构建体。设计和对供体构建体进行各种功能/结构修饰的方法是本领域已知的。在一些实施方案中，构建体可包含聚腺苷酸化尾序列、聚腺苷酸化信号序列、剪接受体位点或选择标记中的任何一个或多个。在一些实施方案中，聚腺苷酸化尾序列在编码序列的3'端被编码为例如“poly-A”段。设计合适的聚腺苷酸化尾序列和/或聚腺苷酸化信号序列的方法是本领域众所周知的。例如，聚腺苷酸化信号序列AAUAAA(SEQ ID NO:800)通常用于哺乳动物系统，尽管诸如UAUAAA(SEQ ID NO:801)或AU/GUAAA(SEQ ID NO:802)的变体已被鉴定。参见例如，NJ Proudfoot,Genes&Dev.25(17):1770-82,2011。

在一些实施方案中，供体构建体包含编码因子IX的序列，其中因子IX序列为野生型因子IX，例如SEQ ID NO:700。在一些实施方案中，供体构建体包含编码因子IX的序列，其中因子IX序列为野生型因子IX，例如SEQ ID NO:701。在一些实施方案中，序列编码因子IX的变体。例如，变体可具有比野生型因子IX高的凝血活性。例如，变体因子IX可包含一个或多个突变，诸如相对于SEQ ID NO:701的位置R338(例如，R338L)中的氨基酸取代。在一些实施方案中，序列编码与SEQ ID NO:700、SEQ ID NO:701或SEQ ID NO:702 80％、85％、90％、93％、95％、97％、99％相同的因子IX变体，所述变体与野生型因子IX相比具有至少80％、85％、90％、92％、94％、96％、98％、99％、100％或更多的活性。在一些实施方案中，序列编码因子IX的片段，其中所述片段与野生型因子IX相比具有至少80％、85％、90％、92％、94％、96％、98％、99％、100％或更多的活性。

在一些实施方案中，供体构建体包含编码因子IX变体的序列，其中因子IX变体在其辅因子(因子VIII)不存在的情况下激活凝血。此类因子IX变体还可维持野生型因子IX的活性。此类因子IX变体可用于治疗血友病，诸如血友病B。例如，相对于野生型因子IX(例如，相对于SEQ ID NO:701)，此种因子IX变体可包含位置L6、V181、K265、I383、E185或其组合处的氨基酸取代。例如，相对于野生型因子IX(例如，相对于SEQ ID NO:701)，此种因子IX变体可包含L6F突变、V181I突变、K265A突变、I383V突变、E185D突变或其组合。

在一个实施例中，因子IX蛋白可包含位置L6和V181处的氨基酸取代。在另一个实施例中，因子IX蛋白可包含位置L6和K265处的氨基酸取代。在另一个实施例中，因子IX蛋白可包含位置L6和I383处的氨基酸取代。在另一个实施例中，因子IX蛋白可包含位置L6和E185处的氨基酸取代。在另一个实施例中，因子IX蛋白可包含位置V181和K265处的氨基酸取代。在另一个实施例中，因子IX蛋白可包含位置V181和I383处的氨基酸取代。在另一个实施例中，因子IX蛋白可包含位置V181和E185处的氨基酸取代。在另一个实施例中，因子IX蛋白可包含位置K265和I383处的氨基酸取代。在另一个实施例中，因子IX蛋白可包含位置K265和E185处的氨基酸取代。在另一个实施例中，因子IX蛋白可包含位置I383和E185处的氨基酸取代。在另一个实施例中，因子IX蛋白可包含位置L6、V181和K265处的氨基酸取代。在另一个实施例中，因子IX蛋白可包含位置L6、V181和I383处的氨基酸取代。在另一个实施例中，因子IX蛋白可包含位置L6、V181和E185处的氨基酸取代。在另一个实施例中，因子IX蛋白可包含位置L6、K265和I383处的氨基酸取代。在另一个实施例中，因子IX蛋白可包含位置L6、K265和E185处的氨基酸取代。在另一个实施例中，因子IX蛋白可包含位置L6、I383和E186处的氨基酸取代。在另一个实施例中，因子IX蛋白可包含位置V181、K265和I383处的氨基酸取代。在另一个实施例中，因子IX蛋白可包含位置V181、K265和E185处的氨基酸取代。在另一个实施例中，因子IX蛋白可包含位置V181、I383和E186处的氨基酸取代。在另一个实施例中，因子IX蛋白可包含位置K265、I383和E185处的氨基酸取代。在另一个实施例中，因子IX蛋白可包含位置L6、V181、K265和I383处的氨基酸取代。在另一个实施例中，因子IX蛋白可包含位置L6、V181、I383和E185处的氨基酸取代。在另一个实施例中，因子IX蛋白可包含位置L6、K265、I383和E185处的氨基酸取代。在另一个实施例中，因子IX蛋白可包含位置V181、K265、I383和E185处的氨基酸取代。

在特定的实施例中，因子IX蛋白可包含位置V181、K265和I383处的氨基酸取代。在另一个特定的实施例中，因子IX蛋白可包含位置V181、K265、I383和E185处的氨基酸取代。在另一个特定的实施例中，因子IX蛋白可包含位置L6、V181、K265和I383处的氨基酸取代。

在一个实施例中，因子IX蛋白可包含L6F突变和V181I突变。在另一个实施例中，因子IX蛋白可包含L6F突变和K265A突变。在另一个实施例中，因子IX蛋白可包含L6F突变和I383V突变。在另一个实施例中，因子IX蛋白可包含L6F突变和E185D突变。在另一个实施例中，因子IX蛋白可包含V181I突变和K265A突变。在另一个实施例中，因子IX蛋白可包含V181I突变和I383V突变。在另一个实施例中，因子IX蛋白可包含V181I突变和E185D突变。在另一个实施例中，因子IX蛋白可包含K265A突变和I383V突变。在另一个实施例中，因子IX蛋白可包含K265A突变和E185D突变。在另一个实施例中，因子IX蛋白可包含I383V突变和E185D突变。在另一个实施例中，因子IX蛋白可包含L6F突变、V181I突变和K265A突变。在另一个实施例中，因子IX蛋白可包含L6F突变、V181I突变和I383V突变。在另一个实施例中，因子IX蛋白可包含L6F突变、V181I突变和E185D突变。在另一个实施例中，因子IX蛋白可包含L6F突变、K265A突变和I383V突变。在另一个实施例中，因子IX蛋白可包含L6F突变、K265A突变和E185D突变。在另一个实施例中，因子IX蛋白可包含L6F突变、I383V突变和E186D突变。在另一个实施例中，因子IX蛋白可包含V181I突变、K265A突变和I383V突变。在另一个实施例中，因子IX蛋白可包含V181I突变、K265A突变和E185D突变。在另一个实施例中，因子IX蛋白可包含V181I突变、I383V突变和E186D突变。在另一个实施例中，因子IX蛋白可包含K265A突变、I383V突变和E185D突变。在另一个实施例中，因子IX蛋白可包含L6F突变、V181I突变、K265A突变和I383V突变。在另一个实施例中，因子IX蛋白可包含L6F突变、V181I突变、I383V突变和E185D突变。在另一个实施例中，因子IX蛋白可包含L6F突变、K265A突变、I383V突变和E185D突变。在另一个实施例中，因子IX蛋白可包含V181I突变、K265A突变、I383V突变和E185D突变。

在特定的实施例中，因子IX蛋白可包含V181I突变、K265A突变和I383V突变。在另一个特定的实施例中，因子IX蛋白可包含V181I突变、K265A突变、I383V突变和E185D突变。在一些实施方案中，因子IX变体与SEQ ID NO:700至少80％、85％、90％、93％、95％、97％、99％相同，与野生型因子IX相比具有至少80％、85％、90％、92％、94％、96％、98％、99％、100％或更多的活性。在某些实施方案中，因子IX变体与SEQ ID NO:700至少80％、85％、90％、93％、95％、97％、99％相同，与野生型因子IX相比具有至少80％、85％、90％、92％、94％、96％、98％、99％、100％或更多的活性，并且包含V181I突变、K265A突变、I383V突变和/或E185D突变。在另一个特定的实施例中，因子IX蛋白可包含L6F突变、V181I突变、K265A突变和I383V突变。在一些实施方案中，因子IX变体与SEQ ID NO:700至少80％、85％、90％、93％、95％、97％、99％相同，与野生型因子IX相比具有至少80％、85％、90％、92％、94％、96％、98％、99％、100％或更多的活性，并且包含L6F突变、V181I突变、K265A突变和/或I383V突变。

构建体的长度可根据要插入的基因的大小而变化，并且可为例如200个碱基对(bp)至约5000bp，诸如约200bp至约2000bp，诸如约500bp至约1500bp。在一些实施方案中，DNA供体模板的长度为约200bp、或为约500bp、或为约800bp、或为约1000个碱基对或为约1500个碱基对。在其他实施方案中，供体模板的长度为至少200bp、或为至少500bp、或为至少800bp、或为至少1000bp或为至少1500bp。在其他实施方案中，供体模板的长度为至少200bp、或为至少500bp、或为至少800bp、或为至少1000bp、或为至少1500bp、或至少2000、或至少2500、或至少3000、或至少3500、或至少4000、或至少4500或至少5000。

构建体可为单链、双链或部分单链和部分双链的DNA或RNA，并且可以线性或环状(例如，小环)形式引入到宿主细胞中。参见例如，美国专利公布号2010/0047805、2011/0281361、2011/0207221。如果以线性形式引入，供体序列的端部可通过本领域技术人员已知的方法来保护(例如，免受核酸外切降解)。例如，将一个或多个双脱氧核苷酸残基添加至线性分子的3'末端和/或将自互补寡核苷酸连接至一端或两端。参见例如，Chang等人(1987)Proc.Natl.Acad.Sci.USA 84:4959-4963；Nehls等人(1996)Science 272:886-889。用于保护外源多核苷酸免受降解的另外方法包括但不限于添加一个或多个末端氨基和使用修饰的核苷酸间键联，例如像硫代磷酸酯、氨基磷酸酯和O-甲基核糖或脱氧核糖残基。可将构建体引入到细胞中作为载体分子的一部分，所述载体分子具有另外的序列例如像复制起点、启动子和编码抗生素耐药性的基因。构建体可省略病毒元件。此外，供体构建体可作为裸露核酸、作为与剂(诸如脂质体或泊洛沙姆(poloxamer))复合的核酸引入，或可通过病毒(例如，腺病毒、AAV、疱疹病毒、逆转录病毒、慢病毒)来递送。

在一些实施方案中，可插入构建体，使得其表达由插入位点的内源启动子(例如，当供体整合到宿主细胞的白蛋白基因座中时为内源白蛋白启动子)驱动。在此类情况下，转基因可能缺乏驱动其表达的控制元件(例如，启动子和/或增强子)(例如，无启动子的构建体)。尽管如此，显而易见的是，在其他情况下，构建体可包含启动子和/或增强子，例如组成型启动子或在整合时驱动功能蛋白表达的诱导型或组织特异性(例如，肝或血小板特异性)启动子。构建体可包含编码异源因子IX蛋白的序列，所述序列在编码信号肽的信号序列的下游并且可操作地连接到所述信号序列。在一些实施方案中，核酸构建体在同源非依赖性插入编码因子IX蛋白的核酸中起作用。在一些实施方案中，核酸构建体在非分裂细胞中起作用，例如在其中NHEJ而不是HR是修复双链DNA断裂的主要机制的细胞中。核酸可为同源非依赖性供体构建体。

包含异源因子IX核酸(因子IX转基因)的一些供体构建体能够通过非同源末端连接插入到基因编辑系统的靶DNA序列的切割位点中(例如，能够插入到安全港基因诸如白蛋白基因座中)。在一些情况下，此类构建体不包含同源臂。例如，可在用如本文公开的基因编辑系统(例如，CRISPR/Cas系统)裂解后，将此类构建体插入到平端双链断裂中。在具体的实施例中，构建体可通过AAV递送，并且能够通过非同源末端连接插入(例如，构建体可为不包含同源臂的构建体)。

在具体的实施例中，构建体可通过同源非依赖性靶向整合插入。例如，构建体中异源因子IX核酸的每侧侧接基因编辑系统的靶位点(例如，与用于靶向插入的靶DNA序列中相同的靶位点(例如，安全港基因中)，以及用于裂解用于靶向插入的靶DNA序列的相同基因编辑系统)。然后，基因编辑系统可裂解异源因子IX核酸侧翼的靶位点。在具体的实施例中，构建体是通过AAV介导的递送而递送的，并且裂解异源因子IX核酸侧翼的靶位点可去除AAV的反向末端重复序列(ITR)。在一些方法中，如果将异源因子IX核酸以正确的方向插入到切割位点或靶DNA序列中，则用于靶向插入的靶DNA序列(例如，安全港基因座中的靶DNA序列，例如包含侧翼原间隔子相邻基序的gRNA靶序列)不再存在，但是如果异源因子IX核酸以相反的方向插入到切割位点或靶DNA序列中，则用于靶向插入的靶DNA序列重组(reform)。这可以帮助确保异源因子IX核酸以正确的方向插入以进行表达。

本文还描述了允许因子IX基因的增强插入和表达的双向核酸构建体。简而言之，本文公开的各种双向构建体包含至少两个核酸区段，其中一个区段(第一区段)包含编码因子IX的编码序列(有时在本文中可互换地称为“转基因”)，而另一区段(第二区段)包含其中序列的补体编码因子IX的序列。

在一个实施方案中，双向构建体包含顺式中的至少两个核酸区段，其中一个区段(第一区段)包含编码序列(有时在本文中可互换地称为“转基因”)，而另一区段(第二区段)包含其中序列的补体编码转基因的序列。第一转基因和第二转基因可为相同或不同的。双向构建体可包含顺式中的至少两个核酸区段，其中一个区段(第一区段)包含在一个方向上编码异源基因的编码序列，而另一区段(第二区段)包含其中序列的补体在另一方向上编码异源基因的序列。也就是说，第一区段是第二区段的补体(不一定是完全补体)；第二区段的补体是第一区段的反向补体(虽然两者编码相同的异源蛋白，但不一定是完全反向补体)。双向构建体可包含编码与剪接受体连接的异源基因的第一编码序列以及第二编码序列，其中补体以其他方向编码也与剪接受体连接的异源基因。

当与如本文所述的基因编辑系统(例如，CRISPR/Cas系统；锌指核酸酶(ZFN)系统；转录激活因子样效应核酸酶(TALEN)系统)组合使用时，核酸构建体的双向性允许构建体在靶插入位点内的任一方向上插入(不限于在一个方向上插入)，从而允许从以下中的任一个表达因子IX：a)一个区段的编码序列(例如，左侧区段编码图1左上方ssAAV构建体的“人F9”)或b)另一区段的补体(例如，右侧区段的补体编码左上方ssAAV构建体图1中倒转指示的“人F9”)，从而增强插入和表达效率，如本文所例示。各种已知的基因编辑系统可在本公开的实践中使用，所述基因编辑系统包括例如，CRISPR/Cas系统；锌指核酸酶(ZFN)系统；转录激活因子样效应子核酸酶(TALEN)系统。

可修饰本文公开的双向构建体，以包括任何特定用途所需的和/或赋予一种或多种所需功能的任何合适的结构特征。在一些实施方案中，本文公开的双向核酸构建体不包含同源臂。在一些实施方案中，本文公开的双向核酸构建体为同源非依赖性供体构建体。在一些实施方案中，部分由于核酸构建体的双向功能，双向构建体可以如本文所述的任一方向插入到基因组基因座中，以允许有效插入和/或表达感兴趣的多肽(例如，因子IX)。

在一些实施方案中，双向核酸构建体不包含驱动因子IX表达的启动子。例如，因子IX的表达由宿主细胞的启动子(例如，当转基因整合到宿主细胞的白蛋白基因座中时为内源白蛋白启动子)驱动。

在一些实施方案中，双向核酸构建体包含第一区段，所述第一区段包含因子IX的编码序列；以及第二区段，所述第二区段包含因子IX的编码序列的反向补体。因此，第一区段中的编码序列能够表达因子IX，而第二区段中的反向补体的补体也能够表达因子IX。如本文所用，当提及包含反向补体序列的第二区段时，“编码序列”是指第二区段的互补(编码)链(即，第二区段中反向补体序列的补体编码序列)。

在一些实施方案中，第一区段中编码因子IX的编码序列与也编码因子IX的编码序列的反向补体小于100％互补。也就是说，在一些实施方案中，第一区段包含因子IX的编码序列(1)，并且第二区段为因子IX的编码序列(2)的反向补体，其中编码序列(1)与编码序列(2)不同。例如，可对编码因子IX的编码序列(1)和/或编码序列(2)进行密码子优化，使得编码序列(1)和编码序列(2)的反向补体具有小于100％的互补性。在一些实施方案中，第二区段的编码序列使用由第一区段中的编码序列所编码的相同(即，相同氨基酸序列)因子IX的一个或多个氨基酸的一个或多个替代密码子编码因子IX。如本文所用，“替代密码子”是指给定氨基酸的密码子使用的变化，并且对于给定的表达系统，可以是或可以不是优选或优化的密码子(密码子优化的)。优选的密码子使用或在给定的表达系统中良好耐受的密码子是本领域已知的。

在一些实施方案中，第二区段包含反向补体序列，其采用与第一区段的编码序列不同的密码子使用，以减少发夹的形成。此种反向补体形成的碱基对具有少于第一区段中编码序列的所有核苷酸，但是它任选地编码相同的多肽。在此类情况下，例如第一区段的多肽A的编码序列可与例如双向构建体的后半部分的多肽A的编码序列同源但不相同。在一些实施方案中，第二区段包含与第一区段中的编码序列基本上不互补(例如，不超过70％互补)的反向补体序列。在一些实施方案中，第二区段包含与第一区段中的编码序列高度互补(例如，至少90％互补)的反向补体序列。在一些实施方案中，第二区段包含反向补体序列，其与第一区段中的编码序列具有至少约30％、约35％、约40％、约45％、约50％、约55％、约60％、约65％、约70％、约75％、约80％、约85％、约90％、约95％、约97％或约99％互补性。

在一些实施方案中，第二区段包含与第一区段中的编码序列具有100％互补性的反向补体序列。也就是说，第二区段中的序列为第一区段中的编码序列的完全反向补体。以举例的方式，第一区段包含假设序列5’CTGGACCGA 3’(SEQ ID NO:500)，并且第二区段包含SEQ ID NO:1的反向补体，即5’TCGGTCCAG 3’(SEQ ID NO:502)。

在一些实施方案中，双向核酸构建体包含第一区段，所述第一区段包含因子IX(第一多肽)的编码序列；以及第二区段，所述第二区段包含(第二)多肽的编码序列的反向补体。在一些实施方案中，如上所述，第一区段和第二区段各自包含编码相同多肽(例如，因子IX)的编码序列。在一些实施方案中，第一区段和第二区段各自包含编码不同多肽的编码序列。例如，第一多肽为因子IX并且第二多肽为多肽B。作为进一步的实例，第一多肽为因子IX并且第二多肽为因子IX的变体(例如，片段、突变体、融合物)(例如，具有本文所述的R338L突变)。编码多肽的编码序列可任选地包含一个或多个另外的序列，诸如编码氨基或羧基末端氨基酸序列的序列，诸如信号序列、标记序列(例如HiBit)或与多肽连接的异源功能序列(例如核定位序列(NLS)或自裂解肽)。编码多肽的编码序列可任选地包含编码一个或多个氨基末端信号肽序列的序列。这些另外的序列中的每个在构建体的第一区段和第二区段中可为相同或不同的。

在一些实施方案中，双向核酸构建体为线性的。例如，第一区段和第二区段通过接头序列以线性方式连接。在一些实施方案中，包含反向补体序列的第二区段的5'端连接至第一区段的3'端。在一些实施方案中，第一区段的5'端连接至包含反向补体序列的第二区段的3'端。在一些实施方案中，接头序列的长度为约1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、150、200、250、300、500、1000、1500、2000或更多个核苷酸。如本领域技术人员将理解的，除了接头序列之外或代替接头序列的其他结构元件可插入第一区段与第二区段之间。

可修饰本文公开的双向构建体，以包括任何特定用途所需的和/或赋予一种或多种所需功能的任何合适的结构特征。在一些实施方案中，本文公开的双向核酸构建体不包含同源臂。在一些实施方案中，部分由于核酸构建体的双向功能，双向构建体可以如本文所述的任一方向(取向)插入到基因组基因座中，以允许有效插入和/或表达感兴趣的多肽(例如，异源因子IX)。

在一些实施方案中，第一区段和第二区段中的一个或两个包含聚腺苷酸化尾序列。设计合适的聚腺苷酸化尾序列的方法是本领域众所周知的。

在一些实施方案中，第一区段和第二区段中的一个或两个包含开放阅读框下游的聚腺苷酸化尾序列和/或聚腺苷酸化信号序列。在一些实施方案中，聚腺苷酸化尾序列在第一区段和/或第二区段的3'端被编码为例如“poly-A”段。在一些实施方案中，由于在第一区段和/或第二区段的3'端处或附近编码的聚腺苷酸化信号序列的结果，共转录地提供聚腺苷酸化尾序列。在一些实施方案中，poly-A尾包含至少20、30、40、50、60、70、80、90或100个腺嘌呤，任选多至300个腺嘌呤。在一些实施方案中，poly-A尾包含95、96、97、98、99或100个腺嘌呤核苷酸。设计合适的聚腺苷酸化尾序列和/或聚腺苷酸化信号序列的方法是本领域众所周知的。本文公开并例示了合适的剪接受体序列，包括小鼠白蛋白和人FIX剪接受体位点。在一些实施方案中，聚腺苷酸化信号序列AAUAAA(SEQ ID NO:800)通常用于哺乳动物系统，尽管诸如UAUAAA(SEQ ID NO:801)或AU/GUAAA(SEQ ID NO:802)的变体已被鉴定。参见例如，NJ Proudfoot,Genes&Dev.25(17):1770-82,2011。在一些实施方案中，包括polyA尾序列。

在一些实施方案中，本文公开的构建体可为单链、双链或部分单链和部分双链的DNA或RNA。例如，构建体可为单链或双链DNA。在一些实施方案中，可以如本文所述修饰核酸(例如，使用核苷类似物)。

在一些实施方案中，本文公开的构建体包含构建体的任一端或两端上的剪接受体位点，例如，第一区段和/或第二区段中的开放阅读框的5'或一个或两个转基因序列的5'。在一些实施方案中，剪接受体位点包含NAG。在其他实施方案中，剪接受体位点由NAG组成。在一些实施方案中，剪接受体为白蛋白剪接受体，例如，用于将白蛋白的外显子1和2剪接在一起的白蛋白剪接受体。在一些实施方案中，剪接受体衍生自人白蛋白基因。在一些实施方案中，剪接受体衍生自小鼠白蛋白基因。在一些实施方案中，剪接受体为F9(或“FIX”)剪接受体，例如，用于将F9的外显子1和2剪接在一起的F9剪接受体。在一些实施方案中，剪接受体衍生自人F9基因。在一些实施方案中，剪接受体衍生自小鼠F9基因。在真核生物中有用的另外的合适的剪接受体位点(包括人工剪接受体)是已知的，并且可从本领域得到。参见例如，Shapiro等人,1987,Nucleic Acids Res.,15,7155-7174,Burset等人,2001,NucleicAcids Res.,29,255-259。

在一些实施方案中，本文公开的双向构建体可在一端或两端上进行修饰，以根据需要包括一个或多个合适的结构特征，和/或赋予一个或多个功能益处。例如，结构修饰可根据用于将本文公开的构建体递送到宿主细胞的一个或多个方法而变化，例如，使用病毒载体递送或包装成脂质纳米颗粒以进行递送。此类修饰包括但不限于例如末端结构，诸如反转末端重复序列(ITR)、发夹、环和其他结构诸如环形。在一些实施方案中，本文公开的构建体包含一个、两个或三个ITR。在一些实施方案中，本文公开的构建体包含不超过两个ITR。结构修饰的各种方法是本领域已知的。

在一些实施方案中，构建体的一端或两端可通过本领域已知的方法来保护(例如，免受核酸外切降解)。例如，将一个或多个双脱氧核苷酸残基添加至线性分子的3'末端和/或将自互补寡核苷酸连接至一端或两端。参见例如，Chang等人(1987)Proc.Natl.Acad.Sci.USA 84:4959-4963；Nehls等人(1996)Science 272:886-889。用于保护构建体免受降解的另外方法包括但不限于添加一个或多个末端氨基和使用修饰的核苷酸间键联，例如像硫代磷酸酯、氨基磷酸酯和O-甲基核糖或脱氧核糖残基。

在一些实施方案中，可将本文公开的构建体引入到细胞中作为载体的一部分，所述载体具有另外的序列例如像复制起点、启动子和编码抗生素耐药性的基因。在一些实施方案中，构建体可作为裸露核酸、作为与剂(诸如脂质体、聚合物或泊洛沙姆)复合的核酸引入，或可通过病毒载体(例如，腺病毒、AAV、疱疹病毒、逆转录病毒、慢病毒)来递送。

在一些实施方案中，虽然不为表达所需，但是本文公开的构建体还可包括转录或翻译调控序列，例如启动子、增强子、绝缘子、内部核糖体进入位点、编码肽的序列和/或聚腺苷酸化信号。

在一些实施方案中，包含因子IX的编码序列的构建体可包括以下修饰中的一个或多个：密码子优化(例如，对人密码子进行的)和/或添加一个或多个糖基化位点。参见例如，McIntosh等人(2013)Blood(17):3335-44。

D.基因编辑系统

各种已知的基因编辑系统可在本公开的实践中用于靶向插入因子IX基因，所述基因编辑系统包括例如，CRISPR/Cas系统；锌指核酸酶(ZFN)系统；转录激活因子样效应子核酸酶(TALEN)系统。一般来说，基因编辑系统涉及使用工程改造的裂解系统来在靶DNA序列中诱导双链断裂(DSB)或切口(例如，单链断裂或SSB)。裂解或切口可通过使用特定的核酸酶(诸如工程改造的ZFN、TALEN)或使用CRISPR/Cas系统来发生，所述CRISPR/Cas系统具有工程改造的指导RNA来指导靶DNA序列的特异性裂解或切口。此外，正在基于Argonaute系统开发靶向核酸酶(例如，来自嗜热栖热菌(T.thermophilus)，称为“TtAgo”，参见Swarts等人(2014)Nature507(7491):258-261)，其也可具有用于基因组编辑和基因治疗的潜力。

应当理解，对于使用本文公开的指导RNA的方法，所述方法包括使用CRISPR/Cas系统(以及本文公开的包含编码因子IX的序列的供体构建体中的任一个)。还应理解，本公开设想了使用本文公开的双向构建体靶向插入和表达因子IX的方法，其可在有或没有本文公开的指导RNA的情况下进行(例如，使用ZFN系统导致靶DNA序列中的断裂，从而创建插入双向构建体的位点)。

在一些实施方案中，CRISPR/Cas系统(例如，指导RNA和RNA指导的DNA结合剂)可用于在宿主基因组内的所需基因座处创建插入位点，在所述位点可插入包含本文公开的编码因子IX的序列的供体构建体(例如，双向构建体)来表达因子IX。因子IX相对于其插入位点或基因座可为异源的，例如如本文所述，因子IX通常不从中表达的安全港基因座。替代地，在一些实施方案中，因子IX相对于其插入位点可为非异源的，例如，将野生型因子IX插入内源基因座以校正缺陷的因子IX基因。安全港可在白蛋白基因内，诸如人白蛋白基因内。安全港可在白蛋白内含子1区域内，例如人白蛋白内含子1内。安全港可为例如针对肝脏组织或肝细胞宿主细胞的人安全港。在一些实施方案中，本文所述的指导RNA可根据本发明方法与RNA指导的DNA结合剂(例如，Cas核酸酶)一起使用以创建插入位点，在所述位点可插入包含编码因子IX的序列的供体构建体(例如，双向构建体)来表达因子IX。可用于将因子IX靶向插入到人白蛋白基因座的内含子1中的指导RNA在本文中例示和描述(参见例如，表1)。

使用各种RNA指导的DNA结合剂(例如核酸酶，诸如Cas核酸酶，例如Cas9)的方法在本领域中也是众所周知的。虽然本文例示了将双向核酸与CRISPR/Cas系统一起使用，但是应当理解，也可使用系统的合适变体。应当理解，根据上下文，可将RNA指导的DNA结合剂提供为核酸(例如，DNA或mRNA)或蛋白质。在一些实施方案中，本发明方法可在已经包含和/或表达RNA指导的DNA结合剂的宿主细胞中实施。

在一些实施方案中，RNA指导的DNA结合剂(诸如Cas9核酸酶)具有裂解酶活性，其也可称为双链核酸内切酶活性。在一些实施方案中，RNA指导的DNA结合剂(诸如Cas9核酸酶)具有切口酶活性，其也可称为单链核酸内切酶活性。在一些实施方案中，RNA指导的DNA结合剂包含Cas核酸酶。Cas核酸酶的实例包括酿脓链球菌、金黄色葡萄球菌和其他原核生物的II型CRISPR系统的那些(参见例如，下一段中的列表)，以及它们的变体或突变体(例如，工程改造的、非天然存在的、天然存在的或其他变体)形式。参见例如，US2016/0312198A1；US 2016/0312199 A1。

Cas核酸酶可衍生自的非限制性示例性菌种包括酿脓链球菌、嗜热链球菌、链球菌某种、金黄色葡萄球菌、无害李斯特氏菌(Listeria innocua)、加氏乳杆菌(Lactobacillusgasseri)、新凶手弗朗西丝菌(Francisella novicida)、产琥珀酸沃林氏菌(Wolinellasuccinogenes)、华德萨特菌(Sutterella wadsworthensis)、γ-变形杆菌(Gammaproteobacterium)、脑膜炎奈瑟氏菌、空肠弯曲杆菌、多杀巴斯德氏菌(Pasteurellamultocida)、产琥珀酸丝状杆菌(Fibrobacter succinogene)、深红红螺菌(Rhodospirillum rubrum)、达氏拟诺卡氏菌(Nocardiopsis dassonvillei)、始旋链霉菌(Streptomyces pristinaespiralis)、绿色产色链霉菌(Streptomycesviridochromogenes)、绿色产色链霉菌、粉红链孢囊菌(Streptosporangium roseum)、粉红链孢囊菌、酸热脂环酸芽孢杆菌(Alicyclobacillus acidocaldarius)、假真菌样芽胞杆菌(Bacillus pseudomycoides)、还原硒酸盐芽孢杆菌(Bacillus selenitireducens)、西伯利亚微小杆菌(Exiguobacterium sibiricum)、德氏乳杆菌(Lactobacillusdelbrueckii)、唾液乳杆菌(Lactobacillus salivarius)、布氏乳杆菌(Lactobacillusbuchneri)、齿垢密螺旋体(Treponema denticola)、海洋微颤菌(Microscilla marina)、伯克霍尔德氏菌(Burkholderiales bacterium)、食萘极地单胞菌(Polaromonasnaphthalenivorans)、极地单胞菌某种(Polaromonas sp.)、瓦氏鳄球藻(Crocosphaerawatsonii)、蓝杆藻某种(Cyanothece sp.)、铜绿微囊藻(Microcystis aeruginosa)、聚球藻某种(Synechococcus sp.)、阿拉伯糖醋盐杆菌(Acetohalobium arabaticum)、丹氏制氨菌(Ammonifex degensii)、热解纤维素菌(Caldicelulosiruptor becscii)、金矿菌(Candidatus Desulforudis)、肉毒杆菌(Clostridium botulinum)、艰难梭菌(Clostridium difficile)、大芬戈尔德菌(Finegoldia magna)、嗜热盐碱厌氧菌(Natranaerobius thermophilus)、嗜热丙酸降解菌(Pelotomaculumthermopropionicum)、喜温嗜酸硫杆菌(Acidithiobacillus caldus)、氧化亚铁嗜酸硫杆菌(Acidithiobacillus ferrooxidans)、酒色别样着色菌(Allochromatium vinosum)、海杆菌某种(Marinobacter sp.)、嗜盐亚硝化球菌(Nitrosococcus halophilus)、瓦氏亚硝化球菌(Nitrosococcus watsoni)、游海假交替单胞菌(Pseudoalteromonashaloplanktis)、消旋纤线杆菌(Ktedonobacter racemifer)、调查甲烷盐菌(Methanohalobium evestigatum)、多变鱼腥藻(Anabaena variabilis)、泡沐节球藻(Nodularia spumigena)、念珠藻某种(Nostoc sp.)、极大节旋藻(Arthrospira maxima)、钝顶节旋藻(Arthrospira platensis)、节旋藻某种、鞘丝藻某种(Lyngbya sp.)、原型微鞘藻(Microcoleus chthonoplastes)、颤藻某种(Oscillatoria sp.)、运动石袍菌(Petrotoga mobilis)、非洲栖热腔菌(Thermosipho africanus)、巴氏链球菌(Streptococcus pasteurianus)、灰色奈瑟氏菌(Neisseria cinerea)、红嘴鸥弯曲杆菌(Campylobacter lari)、食清洁剂细小棒菌(Parvibaculum lavamentivorans)、白喉棒状杆菌(Corynebacterium diphtheria)、氨基酸球菌某种(Acidaminococcus sp.)、毛螺科菌ND2006(Lachnospiraceae bacterium ND2006)和深海单细胞蓝藻(Acaryochlorismarina)。

在一些实施方案中，Cas核酸酶是来自酿脓链球菌的Cas9核酸酶。在一些实施方案中，Cas核酸酶是来自嗜热链球菌的Cas9核酸酶。在一些实施方案中，Cas核酸酶是来自脑膜炎奈瑟氏菌的Cas9核酸酶。在一些实施方案中，Cas核酸酶是来自金黄色葡萄球菌的Cas9核酸酶。在一些实施方案中，Cas核酸酶是来自新凶手弗朗西丝菌的Cpf1核酸酶。在一些实施方案中，Cas核酸酶是来自氨基酸球菌某种的Cpf1核酸酶。在一些实施方案中，Cas核酸酶是来自毛螺科菌ND2006的Cpf1核酸酶。在其他实施方案中，Cas核酸酶是来自土拉热弗朗西丝菌(Francisella tularensis)、毛螺科菌、瘤胃溶纤维丁酸弧菌(Butyrivibrioproteoclasticus)、异域菌门菌(Peregrinibacteria bacterium)、Parcubacteria门菌、史密斯氏菌属(Smithella)、氨基酸球菌属(Acidaminococcus)、候选白蚁甲烷枝原体(Candidatus Methanoplasma termitum)、挑剔真杆菌(Eubacterium eligens)、牛眼莫拉氏菌(Moraxella bovoculi)、稻田钩端螺旋体(Leptospira inadai)、犬口腔卟啉单胞菌(Porphyromonas crevioricanis)、解糖胨普雷沃菌(Prevotella disiens)或猕猴卟啉单胞菌(Porphyromonas macacae)的Cpf1核酸酶。在某些实施方案中，Cas核酸酶是来自氨基酸球菌或毛螺菌科的Cpf1核酸酶。

在一些实施方案中，gRNA与RNA指导的DNA结合剂一起被称为核糖核蛋白复合物(RNP)。在一些实施方案中，RNA指导的DNA结合剂为Cas核酸酶。在一些实施方案中，gRNA与Cas核酸酶一起被称为Cas RNP。在一些实施方案中，RNP包含I型、II型或III型组分。在一些实施方案中，Cas核酸酶是来自II型CRISPR/Cas系统的Cas9蛋白。在一些实施方案中，gRNA与Cas9一起被称为Cas9RNP。

野生型Cas9具有两个核酸酶结构域：RuvC和HNH。RuvC结构域裂解非靶DNA链，并且HNH结构域裂解DNA的靶链。在一些实施方案中，Cas9蛋白包含不止一个RuvC结构域和/或不止一个HNH结构域。在一些实施方案中，Cas9蛋白为野生型Cas9。在组合物、用途和方法实施方案的每个中，Cas诱导靶DNA中的双链断裂。

在一些实施方案中，使用嵌合Cas核酸酶，其中蛋白质的一个结构域或区域被不同蛋白质的一部分替换。在一些实施方案中，可用来自不同核酸酶诸如Fok1的结构域替换Cas核酸酶结构域。在一些实施方案中，Cas核酸酶可为修饰的核酸酶。

在其他实施方案中，Cas核酸酶可来自I型CRISPR/Cas系统。在一些实施方案中，Cas核酸酶可为I型CRISPR/Cas系统的级联复合物的组分。在一些实施方案中，Cas核酸酶可为Cas3蛋白。在一些实施方案中，Cas核酸酶可来自III型CRISPR/Cas系统。在一些实施方案中，Cas核酸酶可具有RNA裂解活性。

在一些实施方案中，RNA指导的DNA结合剂具有单链切口酶活性，即，可切割一条DNA链以产生单链断裂，也称为“切口”。在一些实施方案中，RNA指导的DNA结合剂包含Cas切口酶。切口酶是在dsDNA中创建切口的酶，即切割DNA双螺旋的一条链而不切割另一条。在一些实施方案中，Cas切口酶是其中核酸内切活性位点例如通过催化结构域中的一个或多个改变(例如，点突变)而失活的Cas核酸酶(例如，上面讨论的Cas核酸酶)的形式。关于Cas切口酶和示例性催化结构域改变的讨论，参见例如美国专利号8,889,356。在一些实施方案中，Cas切口酶诸如Cas9切口酶具有失活的RuvC或HNH结构域。

在一些实施方案中，对RNA指导的DNA结合剂进行修饰以仅含有一个功能性核酸酶结构域。例如，可修饰剂蛋白，使得核酸酶结构域中的一个突变或完全或部分缺失，以降低其核酸裂解活性。在一些实施方案中，使用具有活性降低的RuvC结构域的切口酶。在一些实施方案中，使用具有非活性RuvC结构域的切口酶。在一些实施方案中，使用具有活性降低的HNH结构域的切口酶。在一些实施方案中，使用具有非活性HNH结构域的切口酶。

在一些实施方案中，Cas蛋白核酸酶结构域内的保守氨基酸被取代以降低或改变核酸酶活性。在一些实施方案中，Cas核酸酶可包含RuvC或RuvC样核酸酶结构域中的氨基酸取代。RuvC或RuvC样核酸酶结构域中的示例性氨基酸取代包括D10A(基于酿脓链球菌Cas9蛋白)。参见例如，Zetsche等人(2015)Cell Oct 22:163(3):759-771。在一些实施方案中，Cas核酸酶可包含HNH或HNH样核酸酶结构域中的氨基酸取代。HNH或HNH样核酸酶结构域中的示例性氨基酸取代包括E762A、H840A、N863A、H983A和D986A(基于酿脓链球菌Cas9蛋白)。参见例如，Zetsche等人(2015)。其他示例性氨基酸取代包括D917A、E1006A和D1255A(基于新凶手弗朗西丝菌U112 Cpf1(FnCpf1)序列(UniProtKB-A0Q7Q2(CPF1_FRATN))。

在一些实施方案中，将切口酶与分别与靶序列的正义链和反义链互补的一对指导RNA组合提供。在此实施方案中，指导RNA将切口酶引导到靶序列并通过在靶序列的相反链上产生切口(即，双切口)来引入DSB。在一些实施方案中，切口酶与靶向DNA的相反链的两个单独的指导RNA一起使用，以在靶DNA中产生双切口。在一些实施方案中，切口酶与选择为非常接近的两个单独的指导RNA一起使用，以在靶DNA中产生双切口。

在一些实施方案中，RNA指导的DNA结合剂包含一个或多个异源功能结构域(例如，是或包含融合多肽)。

在一些实施方案中，异源功能结构域可促进RNA指导的DNA结合剂转运到细胞核中。例如，异源功能结构域可为核定位信号(NLS)。在一些实施方案中，RNA指导的DNA结合剂可与1至10个NLS融合。在一些实施方案中，RNA指导的DNA结合剂可与1至5个NLS融合。在一些实施方案中，RNA指导的DNA结合剂可与一个NLS融合。当使用一个NLS时，NLS可在RNA指导的DNA结合剂序列的N末端或C末端连接。也可将其插入到RNA指导的DNA结合剂序列中。在其他实施方案中，RNA指导的DNA结合剂可与不止一个NLS融合。在一些实施方案中，RNA指导的DNA结合剂可与2、3、4或5个NLS融合。在一些实施方案中，RNA指导的DNA结合剂可与两个NLS融合。在某些情况下，两个NLS可为相同(例如，两个SV40 NLS)或不同的。在一些实施方案中，RNA指导的DNA结合剂融合到在羧基末端连接的两个SV40 NLS序列。在一些实施方案中，RNA指导的DNA结合剂可与两个NLS融合，一个在N末端连接，并且一个在C末端连接。在一些实施方案中，RNA指导的DNA结合剂可与3个NLS融合。在一些实施方案中，RNA指导的DNA结合剂可不与NLS融合。在一些实施方案中，NLS可为单分型序列(monopartite sequence)，例如像SV40 NLS，PKKKRKV(SEQ ID NO:600)或PKKKRRV(SEQ ID NO:601)。在一些实施方案中，NLS可为二分型序列(bipartite sequence)，诸如核质蛋白的NLS，KRPAATKKAGQAKKKK(SEQID NO:602)。在特定的实施方案中，单个PKKKRKV(SEQ ID NO:600)NLS可在RNA指导的DNA结合剂的C末端连接。融合位点任选地包括一个或多个接头。

III.递送方法

可使用本领域中可用的各种已知且合适的方法将本文公开的指导RNA、RNA指导的DNA结合剂(例如，Cas核酸酶)和核酸构建体(例如，双向构建体)在体内或离体递送至宿主细胞或宿主细胞群或受试者。可适当地使用相同或不同的递送方法将指导RNA、RNA指导的DNA结合剂和核酸构建体单独递送或以任何组合一起递送。

常规的基于病毒和非病毒的基因递送方法可用于在细胞(例如，哺乳动物细胞)和靶组织中引入本文公开的指导RNA以及RNA指导的DNA结合剂和供体构建体。如本文进一步提供的，非病毒载体递送系统核酸诸如非病毒载体、质粒载体和例如裸露核酸，以及与递送载体诸如脂质体、脂质纳米颗粒(LNP)或泊洛沙姆复合的核酸。病毒载体递送系统包括DNA和RNA病毒。

用于非病毒递送核酸的方法和组合物包括电穿孔、脂质体转染、显微注射、基因枪(biolistics)、病毒体、脂质体、免疫脂质体、LNP、聚阳离子或脂质:核酸缀合物、裸露核酸(例如裸露DNA/RNA)、人工病毒体和DNA的剂增强的摄取。使用例如Sonitron 2000系统(Rich-Mar)的声致穿孔(sonoporation)也可用于递送核酸。

另外的示例性核酸递送系统包括由AmaxaBiosystems(Cologne,Germany)、Maxcyte,Inc.(Rockville,Md.)、BTX Molecular Delivery Systems(Holliston,Ma.)和Copernicus Therapeutics Inc.提供的那些(参见例如美国专利号6,008,336)。脂质转染描述于例如美国专利号5,049,386；4,946,787；和4,897,355)中，并且脂质转染试剂在商业上销售(例如，Transfectam^TM和Lipofectin^TM)。脂质:核酸复合物(包括靶向脂质体，诸如免疫脂质复合物)的制备是本领域众所周知的，并且如本文所述。

也可单独或组合地将含有指导RNA、RNA指导的DNA结合剂和供体构建体的各种递送系统(例如，载体、脂质体、LNP)施用到生物体以体内递送至细胞或将其离体施用到细胞或细胞培养物。通过通常用于使分子与血液、液体或细胞最终接触的任何途径进行施用，所述途径包括但不限于注射、输注、局部应用和电穿孔。施用此类核酸的合适方法是可用的，并且是本领域技术人员众所周知的。

在某些实施方案中，本公开提供了编码本文公开的组合物中的任一种的DNA或RNA载体，例如，包含本文所述的指导序列中的任何一个或多个的指导RNA；或包含编码因子IX的序列的构建体(例如，双向构建体)。在一些实施方案中，载体还包含编码RNA指导的DNA结合剂的序列。在某些实施方案中，本发明包括编码本文所述的组合物中的任何一种或多种或以任何组合的DNA或RNA载体。在一些实施方案中，载体还包含例如启动子、增强子和调节序列。在一些实施方案中，包含含有编码因子IX的序列的双向构建体的载体不包含驱动因子IX表达的启动子。例如，因子IX多肽的表达由宿主细胞的启动子(例如，当转基因整合到宿主细胞的白蛋白基因座中时为内源白蛋白启动子)驱动。在一些实施方案中，双向核酸构建体包括第一区段和第二区段，每个区段各自在转基因上游具有剪接受体。在某些实施方案中，剪接受体与宿主细胞的安全港位点的剪接供体序列相容，例如人白蛋白基因内含子1的剪接供体。在一些实施方案中，包含含有本文所述的指导序列中的任何一个或多个的指导RNA的载体还包含编码如本文所公开的crRNA、trRNA或crRNA和trRNA的一个或多个核苷酸序列。

在一些实施方案中，载体包含编码本文所述的指导RNA的核苷酸序列。在一些实施方案中，载体包含指导RNA的一个拷贝。在其他实施方案中，载体包含指导RNA的不止一个拷贝。在具有不止一个指导RNA的实施方案中，指导RNA可为不同的，使得它们靶向不同的靶序列，或可为相同的，因为它们靶向相同的靶序列。在载体包含不止一个指导RNA的一些实施方案中，每个指导RNA可具有其他不同的性质，诸如在与RNA指导的DNA核酸酶的复合物(诸如Cas RNP复合物)内的活性或稳定性。在一些实施方案中，编码指导RNA的核苷酸序列可以可操作地连接到至少一个转录或翻译控制序列，诸如启动子、3'UTR或5'UTR。在一个实施方案中，启动子可为tRNA启动子，例如tRNA^Lys3或tRNA嵌合体。参见Mefferd等人,RNA.201521:1683-9；Scherer等人,Nucleic Acids Res.2007 35:2620–2628。在一些实施方案中，启动子可被RNA聚合酶III(Pol III)识别。Pol III启动子的非限制性实例包括U6和H1启动子。在一些实施方案中，编码指导RNA的核苷酸序列可以可操作地连接到小鼠或人U6启动子。在其他实施方案中，编码指导RNA的核苷酸序列可以可操作地连接到小鼠或人H1启动子。在具有不止一个指导RNA的实施方案中，用于驱动表达的启动子可为相同或不同的。在一些实施方案中，编码指导RNA的crRNA的核苷酸和编码指导RNA的trRNA的核苷酸可提供在同一载体上。在一些实施方案中，编码crRNA的核苷酸和编码trRNA的核苷酸可由相同的启动子驱动。在一些实施方案中，crRNA和trRNA可转录成单个转录物。例如，crRNA和trRNA可从单个转录物中加工以形成双分子指导RNA。替代地，crRNA和trRNA可转录成单分子指导RNA(sgRNA)。在其他实施方案中，crRNA和trRNA可由它们在相同载体上的相应启动子驱动。在其他实施方案中，crRNA和trRNA可由不同的载体编码。

在一些实施方案中，编码指导RNA的核苷酸序列可位于相同的载体上，所述载体包含编码RNA指导的DNA结合剂诸如Cas蛋白的核苷酸序列。在一些实施方案中，指导RNA和RNA指导的DNA结合剂诸如Cas蛋白的表达可由它们自己的相应启动子驱动。在一些实施方案中，指导RNA的表达可由与驱动RNA指导的DNA结合剂诸如Cas蛋白的表达相同的启动子驱动。在一些实施方案中，指导RNA和RNA指导的DNA结合剂诸如Cas蛋白转录物可包含在单个转录物中。例如，指导RNA可在RNA指导的DNA结合剂诸如Cas蛋白转录物的非翻译区(UTR)内。在一些实施方案中，指导RNA可在转录物的5'UTR内。在其他实施方案中，指导RNA可在转录物的3'UTR内。在一些实施方案中，可通过在其3'UTR中包含指导RNA来减少转录物的细胞内半衰期，从而缩短其3'UTR的长度。在另外的实施方案中，指导RNA可在转录物的内含子内。在一些实施方案中，可在指导RNA位于其中的内含子处添加合适的剪接位点，使得指导RNA被适当地从转录物中剪接出来。在一些实施方案中，来自同一载体的RNA指导的DNA结合剂(诸如Cas蛋白)和指导RNA在时间上非常接近的表达可促进更有效地形成CRISPR RNP复合物。

在一些实施方案中，编码指导RNA和/或RNA指导的DNA结合剂的核苷酸序列可位于同一载体上，所述载体包含含有因子IX基因的构建体。在一些实施方案中，包含因子IX基因的构建体和指导RNA(和/或RNA指导的DNA结合剂)在同一载体上的接近性可促进将构建体更有效地插入到由指导RNA/RNA指导的DNA结合剂创建的插入位点中。

在一些实施方案中，载体包含编码sgRNA的一个或多个核苷酸序列和编码RNA指导的DNA结合剂(其可为Cas蛋白，诸如Cas9或Cpf1)的mRNA。在一些实施方案中，载体包含编码crRNA、trRNA的一个或多个核苷酸序列和编码RNA指导的DNA结合剂(其可为Cas蛋白，诸如Cas9或Cpf1)的mRNA。在一个实施方案中，Cas9来自酿脓链球菌(即Spy Cas9)。在一些实施方案中，编码crRNA、trRNA或crRNA和trRNA(其可为sgRNA)的核苷酸序列包含侧接来自天然存在的CRISPR/Cas系统的全部或部分重复序列的指导序列或由其组成。包含crRNA、trRNA或crRNA和trRNA或由其组成的核酸还可包含载体序列，其中载体序列包含不与crRNA、trRNA或crRNA和trRNA一起天然存在的核酸或由其组成。

在一些实施方案中，crRNA和trRNA由一个载体内的非连续核酸编码。在其他实施方案中，crRNA和trRNA可由连续核酸编码。在一些实施方案中，crRNA和trRNA由单个核酸的相反链编码。在其他实施方案中，crRNA和trRNA由单个核酸的相同链编码。

在一些实施方案中，载体包含含有如本文所公开的编码因子IX的序列的供体构建体(例如，双向核酸构建体)。在一些实施方案中，除了本文公开的供体构建体(例如，双向核酸构建体)之外，载体还可包含编码本文所述的指导RNA的核酸和/或编码RNA指导的DNA结合剂(例如，Cas核酸酶诸如Cas9)的核酸。在一些实施方案中，编码RNA指导的DNA结合剂的核酸各自或两者都在与包含本文公开的供体构建体(例如，双向构建体)的载体分开的载体上。在任何实施方案中，载体可包括其他序列，其包括但不限于如本文所述的启动子、增强子、调节序列。在一些实施方案中，启动子不驱动供体构建体(例如，双向构建体)的因子IX的表达。在一些实施方案中，载体包含编码crRNA、trRNA或crRNA和trRNA的一个或多个核苷酸序列。在一些实施方案中，载体包含编码sgRNA的一个或多个核苷酸序列和编码RNA指导的DNA核酸酶(其可为Cas核酸酶(例如，Cas9))的mRNA。在一些实施方案中，载体包含编码crRNA、trRNA的一个或多个核苷酸序列和编码RNA指导的DNA核酸酶(其可为Cas核酸酶诸如Cas9)的mRNA。在一些实施方案中，Cas9来自酿脓链球菌(即Spy Cas9)。在一些实施方案中，编码crRNA、trRNA或crRNA和trRNA(其可为sgRNA)的核苷酸序列包含侧接来自天然存在的CRISPR/Cas系统的全部或部分重复序列的指导序列或由其组成。包含crRNA、trRNA或crRNA和trRNA或由其组成的核酸还可包含载体序列，其中载体序列包含不与crRNA、trRNA或crRNA和trRNA一起天然存在的核酸或由其组成。

在一些实施方案中，载体可为环状。在其他实施方案中，载体可为线性的。在一些实施方案中，载体可被包封在脂质纳米颗粒、脂质体、非脂质纳米颗粒或病毒衣壳中。非限制性示例性载体包括质粒、噬菌粒、粘粒、人工染色体、微型染色体、转座子、病毒载体和表达载体。

在一些实施方案中，载体可为病毒载体。在一些实施方案中，病毒载体可从其野生型对应物进行遗传修饰。例如，病毒载体可包含一个或多个核苷酸的插入、缺失或取代以促进克隆或使得载体的一个或多个特性改变。此类特性可包括包装能力、转导效率、免疫原性、基因组整合、复制、转录和翻译。在一些实施方案中，可删除病毒基因组的一部分，使得病毒能够包装具有较大尺寸的外源序列。在一些实施方案中，病毒载体可具有增强的转导效率。在一些实施方案中，由病毒在宿主中诱导的免疫应答可降低。在一些实施方案中，可使促进病毒序列整合到宿主基因组中的病毒基因(例如像整合酶)突变，使得病毒变为非整合。在一些实施方案中，病毒载体可为复制缺陷的。在一些实施方案中，病毒载体可包含外源转录或翻译控制序列，以驱动编码序列在载体上的表达。在一些实施方案中，病毒可为辅助依赖型。例如，病毒可能需要一个或多个辅助病毒来提供将载体扩增并包装成病毒颗粒所需的病毒组分(例如像病毒蛋白)。在此种情况下，可将一个或多个辅助组分(包括编码病毒组分的一个或多个载体)连同本文所述的载体系统一起引入到宿主细胞或宿主细胞群中。在其他实施方案中，病毒可为无辅助的。例如，病毒可能能够在没有辅助病毒的情况下扩增并包装载体。在一些实施方案中，本文所述的载体系统还可编码病毒扩增和包装所需的病毒组分。

非限制性示例性病毒载体包括腺相关病毒(AAV)载体、慢病毒载体、腺病毒载体、辅助依赖型腺病毒载体(HDAd)、单纯疱疹病毒(HSV-1)载体、噬菌体T4、杆状病毒载体和逆转录病毒载体。在一些实施方案中，病毒载体可为AAV载体。在其他实施方案中，病毒载体可为慢病毒载体。

在一些实施方案中，“AAV”是指所有血清型、亚型和天然存在的AAV以及重组AAV。“AAV”可用于指病毒本身或其衍生物。术语“AAV”包括AAV1、AAV2、AAV3、AAV3B、AAV4、AAV5、AAV6、AAV6.2、AAV7、AAVrh.64R1、AAVhu.37、AAVrh.8、AAVrh.32.33、AAV8、AAV9、AAV-DJ、AAV2/8、AAVrh10、AAVLK03、AV10、AAV11、AAV12、rh10及其杂交体、鸟类AAV、牛AAV、犬科AAV、马AAV、灵长类AAV、非灵长类AAV和绵羊AAV。AAV的各种血清型的基因组序列，以及天然末端重复序列(TR)、Rep蛋白和衣壳亚基的序列是本领域已知的。此类序列可在文献中或在诸如GenBank的公共数据库中找到。如本文所用，“AAV载体”是指包含非AAV来源的异源序列(即，与AAV异源的核酸序列)的AAV载体，其通常包含编码感兴趣的异源多肽的序列。构建体可包含AAV1、AAV2、AAV3、AAV3B、AAV4、AAV5、AAV6、AAV6.2、AAV7、AAVrh.64R1、AAVhu.37、AAVrh.8、AAVrh.32.33、AAV8、AAV9、AAV-DJ、AAV2/8、AAVrh10、AAVLK03、AV10、AAV11、AAV12、rh10及其杂交体、鸟类AAV、牛AAV、犬科AAV、马AAV、灵长类AAV、非灵长类AAV和绵羊AAV衣壳序列。一般来讲，异源核酸序列(转基因)侧接至少一个，并且通常侧接两个AAV反向末端重复序列(ITR)。AAV载体可为单链(ssAAV)或自互补的(scAAV)。

在一些实施方案中，慢病毒可为非整合的。在一些实施方案中，病毒载体可为腺病毒载体。在一些实施方案中，腺病毒可为高克隆能力或“无肠”腺病毒，其中从病毒中删除除5'和3'反向末端重复序列(ITR)和包装信号('I')之外的所有编码病毒区域以增加其包装能力。在其他实施方案中，病毒载体可为HSV-1载体。在一些实施方案中，基于HSV-1的载体为辅助依赖型，而在其他实施方案中，它不依赖辅助。例如，仅保留包装序列的扩增子载体需要具有用于包装的结构组分的辅助病毒，而去除非必需病毒功能的删除30kb的HSV-1载体则不需要辅助病毒。在另外的实施方案中，病毒载体可为噬菌体T4。在一些实施方案中，当排空病毒头时，噬菌体T4可能能够包装任何线性或环状DNA或RNA分子。在其他实施方案中，病毒载体可为杆状病毒载体。在其他实施方案中，病毒载体可为逆转录病毒载体。在使用具有较小克隆能力的AAV或慢病毒载体的实施方案中，可能需要使用不止一个载体来递送如本文公开的载体系统的所有组分。例如，一个AAV载体可含有编码RNA指导的DNA结合剂诸如Cas蛋白(例如，Cas9)的序列，而第二AAV载体可含有一个或多个指导序列。

在一些实施方案中，载体系统可能能够驱动细胞中一种或多种核酸酶组分的表达。在一些实施方案中，任选地作为载体系统的一部分的双向构建体可包含能够驱动细胞中编码序列的表达的启动子。在一些实施方案中，一旦载体整合到细胞中(例如，诸如当在白蛋白基因座的内含子1处插入时使用宿主细胞的内源启动子，如本文所例示)，则载体不包含驱动一个或多个编码序列的表达的启动子。在一些实施方案中，细胞可为真核细胞，例如像酵母、植物、昆虫或哺乳动物细胞。在一些实施方案中，真核细胞可为哺乳动物细胞。在一些实施方案中，真核细胞可为啮齿动物细胞。在一些实施方案中，真核细胞可为人细胞。驱动不同类型的细胞中表达的合适启动子是本领域已知的。在一些实施方案中，启动子可为野生型。在其他实施方案中，可修饰启动子以更有效或更有功效地表达。在其他实施方案中，启动子可被截短但仍保留其功能。例如，启动子可具有适合将载体适当包装成病毒的正常大小或减小的大小。

在一些实施方案中，载体可包含编码RNA指导的DNA结合剂诸如本文所述的Cas蛋白(例如，Cas9)的核苷酸序列。在一些实施方案中，由载体编码的核酸酶可为Cas蛋白。在一些实施方案中，载体系统可包含编码核酸酶的核苷酸序列的一个拷贝。在其他实施方案中，载体系统可包含编码核酸酶的核苷酸序列的不止一个拷贝。在一些实施方案中，编码核酸酶的核苷酸序列可以可操作地连接到至少一个转录或翻译控制序列。在一些实施方案中，编码核酸酶的核苷酸序列可以可操作地连接到至少一个启动子。

在一些实施方案中，载体可包含含有本文所述的异源因子IX基因的构建体中的任何一种或多种。在一些实施方案中，因子IX基因可以可操作地连接到至少一个转录或翻译控制序列。在一些实施方案中，因子IX基因可以可操作地连接到至少一个启动子。在一些实施方案中，因子IX基因不与驱动异源基因表达的启动子连接。

在一些实施方案中，启动子可为组成型、诱导型或组织特异性的。在一些实施方案中，启动子可为组成型启动子。非限制性示例性组成型启动子包括巨细胞病毒立即早期启动子(CMV)、猿猴病毒(SV40)启动子、腺病毒主要晚期(MLP)启动子、劳斯(Rous)氏肉瘤病毒(RSV)启动子、小鼠乳腺肿瘤病毒(MMTV)启动子、磷酸甘油酸激酶(PGK)启动子、延伸因子-α(EF1a)启动子、泛素蛋白启动子、肌动蛋白启动子、微管蛋白启动子、免疫球蛋白启动子、其功能片段或任何前述的组合。在一些实施方案中，启动子可为CMV启动子。在一些实施方案中，启动子可为截短的CMV启动子。在其他实施方案中，启动子可为EF1a启动子。在一些实施方案中，启动子可为诱导型启动子。非限制性示例性诱导型启动子包括可由热休克、光、化学物质、肽、金属、类固醇、抗生素或醇诱导的那些。在一些实施方案中，诱导型启动子可为具有低基础(非诱导)的表达水平的启动子，例如像

启动子(Clontech)。

在一些实施方案中，启动子可为组织特异性启动子，例如，对于在肝中表达特异的启动子。

在一些实施方案中，组合物包含载体系统。在一些实施方案中，载体系统可包含一个单一载体。在其他实施方案中，载体系统可包含两个载体。在另外的实施方案中，载体系统可包含三个载体。当使用不同的指导RNA进行多路复用时，或当使用指导RNA的多个拷贝时，载体系统可包含多于三个载体。

在一些实施方案中，载体系统可包含诱导型启动子，以仅在将其递送至靶细胞后才开始表达。非限制性示例性诱导型启动子包括可由热休克、光、化学物质、肽、金属、类固醇、抗生素或醇诱导的那些。在一些实施方案中，诱导型启动子可为具有低基础(非诱导)的表达水平的启动子，例如像

启动子(Clontech)。

在另外的实施方案中，载体系统可包含组织特异性启动子，以仅在将其递送到特异性组织中后才开始表达。

单独地或以任何组合来包含指导RNA、RNA结合的DNA结合剂或包含编码因子IX的序列的供体构建体的载体可通过脂质体、纳米颗粒、外来体或微囊泡来递送。载体也可通过脂质纳米颗粒(LNP)来递送。一个或多个指导RNA、RNA结合的DNA结合剂(例如mRNA)或包含编码异源蛋白的序列的供体构建体可单独地或以任何组合通过脂质体、纳米颗粒、外来体或微囊泡来递送。一个或多个指导RNA、RNA结合的DNA结合剂(例如mRNA)或包含编码异源蛋白的序列的供体构建体可单独地或以任何组合通过LNP来递送。

脂质纳米颗粒(LNP)是众所周知的用于递送核苷酸和蛋白质货物的手段，并且可用于递送本文公开的指导RNA、RNA指导的DNA结合剂和/或供体构建体(例如，双向构建体)中的任一种。在一些实施方案中，LNP适当地以核酸(例如，DNA或mRNA)或蛋白质(例如，Cas核酸酶)或者核酸与蛋白质一起的形式递送组合物。

在一些实施方案中，本文提供了一种用于将本文所述的任何指导RNA和/或本文公开的供体构建体(例如，双向构建体)单独或组合地递送到宿主细胞或宿主细胞群或受试者中的方法，其中任何一种或多种组分与LNP缔合。在一些实施方案中，方法还包含RNA指导的DNA结合剂(例如，Cas9或编码Cas9的序列)。

在一些实施方案中，本文提供了包含单独的本文所述的任何指导RNA和/或本文公开的供体构建体(例如，双向构建体)或与LNP组合的组合物。在一些实施方案中，组合物还包含RNA指导的DNA结合剂(例如，Cas9或编码Cas9的序列)。

在一些实施方案中，LNP包含阳离子脂质。在一些实施方案中，LNP包含十八碳-9,12-二烯酸(9Z,12Z)-3-((4,4-双(辛氧基)丁酰基)氧基)-2-((((3-(二乙基氨基)丙氧基)羰基)氧基)甲基)丙酯(也称为(9Z,12Z)-十八碳-9,12-二烯酸3-((4,4-双(辛氧基)丁酰基)氧基)-2-((((3-(二乙基氨基)丙氧基)羰基)氧基)甲基)丙酯)或另一种可电离的脂质。参见例如，PCT/US2018/053559(2018年9月28日提交)、WO/2017/173054、WO2015/095340和WO2014/136086以及本文提供的参考文献的脂质。在一些实施方案中，LNP包含的阳离子脂质胺与RNA磷酸酯的摩尔比(N:P)为约4.5、5.0、5.5、6.0或6.5。在一些实施方案中，在LNP脂质的上下文中，术语阳离子的和可电离的是可互换的，例如，其中可电离的脂质根据pH是阳离子的。

在一些实施方案中，与本文公开的双向构建体相关的LNP用于制备用于治疗疾病或病症的药物。所述疾病或病症可为因子IX缺乏症，诸如血友病B。

在一些实施方案中，无论是裸露的或作为载体的一部分，将本文描述的指导RNA、RNA指导的DNA结合剂和/或本文公开的供体构建体(例如，双向构建体)中的任一种单独或组合地在脂质纳米颗粒中配制或通过脂质纳米颗粒施用；参见例如，WO/2017/173054，其内容特此以引用的方式整体并入。

在一些实施方案中，涵盖的LNP组合物包含：RNA组分和脂质组分，其中脂质组分包含胺脂质，诸如可生物降解的可电离的脂质。在一些情况下，脂质组分包含可生物降解的可电离的脂质、胆固醇、DSPC和PEG-DMG。

显而易见的是，本文公开的指导RNA、RNA指导的DNA结合剂(例如，Cas核酸酶或编码Cas核酸酶的核酸)和包含编码因子IX的序列的供体构建体(例如双向构建体)可使用相同或不同的系统来递送。例如，指导RNA、Cas核酸酶和构建体可由相同的载体(例如，AAV)携带。替代地，Cas核酸酶(作为蛋白质或mRNA)和/或gRNA可由质粒或LNP携带，而供体构建体可由诸如AAV的载体携带。此外，可通过相同或不同的途径(例如，通过输注；通过注射，诸如肌肉内注射、尾静脉注射或其他静脉内注射；通过腹膜内施用和/或肌肉内注射)来施用不同的递送系统。

不同的递送系统可同时或以任何相继次序在体外或体内递送。在一些实施方案中，供体构建体、指导RNA和Cas核酸酶可同时在体外或体内递送，例如在一个载体、两个载体、单独的载体、一个LNP、两个LNP、单独的LNP或其组合中。在一些实施方案中，供体构建体可在递送单独作为载体和/或与LNP缔合或一起作为核糖核蛋白(RNP)的指导RNA和/或Cas核酸酶(例如，约1、2、3、4、5、6、7、8、9、10、11、12、13、14或更多天)之前作为载体和/或与LNP缔合在体内或在体外递送。作为进一步的实例，指导RNA和Cas核酸酶可在递送作为载体和/或与LNP缔合的构建体(例如，约1、2、3、4、5、6、7、8、9、10、11、12、13、14或更多天)之前单独作为载体和/或与LNP缔合或一起作为核糖核蛋白(RNP)在体内或在体外递送。

在一些实施方案中，本公开还提供了用于施用本文公开的指导RNA中的任一种的药物制剂。在一些实施方案中，药物制剂包括RNA指导的DNA结合剂(例如，Cas核酸酶)和包含治疗性异源基因的编码序列的供体构建体，如本文所公开的。适合递送到受试者(例如，人受试者)中的药物制剂是本领域众所周知的。

IV.使用方法

本文所述的gRNA、供体构建体(例如，包含编码因子IX的序列的双向构建体)和RNA指导的DNA结合剂可用于在体内或体外将因子IX核酸引入宿主细胞或宿主细胞群中。在一些实施方案中，本文所述的gRNA、供体构建体(例如，包含编码因子IX的序列的双向构建体)和RNA指导的DNA结合剂可用于在宿主细胞或宿主细胞群或有此需要的受试者中表达因子IX。在一些实施方案中，本文所述的gRNA、供体构建体(例如，包含编码因子IX的序列的双向构建体)和RNA指导的DNA结合剂可用于治疗有此需要的受试者的血友病(例如，血友病B)。施用本文所述的gRNA、供体构建体(例如，包含编码因子IX的序列的双向构建体)和RNA指导的DNA结合剂中的任何一种或多种将增加因子IX的蛋白质水平和/或因子IX的活性水平，例如循环、血清或血浆水平。在一些实施方案中，可通过测量血清或血浆因子IX活性来评估治疗的有效性，其中受试者的血浆水平和/或因子IX的活性的增加指示治疗的有效性。在一些实施方案中，可通过测量血清或血浆因子IX蛋白和/或活性水平来评估治疗的有效性，其中受试者的血浆水平和/或因子IX的活性的增加指示治疗的有效性。在一些实施方案中，可通过评估aPTT测定中的凝血功能和/或TGA-EA测定中的凝血酶生成来确定治疗的有效性。在一些实施方案中，治疗的有效性可通过评估因子IX(例如循环因子IX)的水平来确定，所述因子IX的水平可通过凝血和/或免疫测定(例如，夹心免疫测定、ELISA(参见例如实施例13)、MSD(参见例如，实施例14))来测量。

在正常或健康个体中，基于从成年人血浆中的纯化，因子IX活性和抗原水平在正常汇集血浆(其为约3-5μg/ml)的约50％与160％之间变化，Amiral等人,Clin.Chem.30(9),1512-16,1984表2；也参见Osterud等人,1978。因子IX活性和/或抗原水平低于正常血浆水平50％的个体被分类为患有血友病。特别地，活性因子低于约1％的个体被分类为患有重度血友病，而活性因子为约1-5％的个体患有中度血友病。患有轻度血友病的个体具有正常活性凝血因子水平的约6-49％。在一些实施方案中，循环因子IX的水平可通过凝血和/或免疫学测定来测量，所述方法是本领域众所周知的(例如，Simioni等人,NEJM 2009,Adcock等人,Coagulation Handbook,Esoterix Laboratory Services,2006)。在实施例13中发现了一种用于检测hFIX蛋白的免疫学方法和一种使功能过度的hFIX变体的因子IX活性功能正常化的方法。在一些实施方案中，因子IX(例如循环因子IX)可通过凝血和/或免疫测定(例如，夹心免疫测定、ELISA(参见例如实施例13)、MSD(参见例如，实施例14))来测量。

因此，在一些实施方案中，本文公开的组合物和方法可用于将患有血友病的受试者中因子IX的血浆水平或因子IX活性水平增加到正常水平的约2％、3％、4％、5％、6％、7％、8％、9％、10％、11％、12％、13％、14％、15％、16％、17％、18％、19％、20％、21％、22％、23％、24％、25％、26％、27％、28％、29％、30％、31％、32％、33％、34％、35％、36％、37％、38％、39％、40％、41％、42％、43％、44％、45％、46％、47％、48％、49％、50％或更高。

在一些实施方案中，本文公开的组合物和方法可用于增加因子IX活性和/或水平，例如将循环FIX蛋白水平增加至约0.05、0.1、0.2、0.5、1、2、3或4μg/ml。FIX蛋白水平可达到约150μg/ml或更高。在一些实施方案中，本文公开的组合物和方法可用于将因子IX蛋白水平增加至约4μg/ml。在一些实施方案中，本文公开的组合物和方法可用于将因子IX蛋白水平增加至约4μg/ml至约5μg/ml、约4μg/ml至6μg/ml、约4μg/ml至8μg/ml、约4μg/ml至约10μg/ml或更高。在一些实施方案中，本文公开的组合物和方法可用于将因子IX蛋白水平增加至约0.1μg/ml至约10μg/ml、约1μg/ml至约10μg/ml、约0.1μg/ml至约6μg/ml、约1μg/ml至约6μg/ml、约2μg/ml至约5μg/ml或约3μg/ml至约5μg/ml。例如，本文公开的组合物和方法可用于将患有血友病的受试者中因子IX的血浆水平增加至约6、7、8、9、10、12、14、16、18、20、22、24、26、28、30、32、34、36、38、40、42、44、46、48、50、52、54、56、58、60、62、64、66、68、70、75、80、85、90、95、100、105、110、115、120、125、130、135、140、145、150μg/ml或更高。

在一些实施方案中，与施用前受试者的血浆水平和/或因子IX的活性相比，本文公开的组合物和方法可用于将患有血友病的受试者中因子IX活性和/或水平的血浆水平增加约1％、2％、3％、4％、5％、6％、7％、8％、9％、10％、11％、12％、13％、14％、15％、16％、17％、18％、19％、20％、21％、22％、23％、24％、25％、26％、27％、28％、29％、30％、31％、32％、33％、34％、35％、36％、37％、38％、39％、40％、41％、42％、43％、44％、45％、46％、47％、48％、49％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、100％、110％、120％、130％、140％、150％、160％、170％、180％、190％、200％或更高。

在一些实施方案中，与施用到宿主细胞或宿主细胞群前的因子IX水平和/或活性(例如，正常水平)相比，本文公开的组合物和方法可用于将宿主细胞或宿主细胞群中因子IX蛋白和/或因子IX活性增加约1％、2％、3％、4％、5％、6％、7％、8％、9％、10％、11％、12％、13％、14％、15％、16％、17％、18％、19％、20％、21％、22％、23％、24％、25％、26％、27％、28％、29％、30％、31％、32％、33％、34％、35％、36％、37％、38％、39％、40％、41％、42％、43％、44％、45％、46％、47％、48％、49％、50％、55％、60％、65％、70％、75％、80％、85％、90％、95％、100％、110％、120％、130％、140％、150％、160％、170％、180％、190％、200％或更高。在一些实施方案中，细胞为肝脏细胞或肝脏细胞群。在一些实施方案中，肝脏细胞为肝细胞或肝脏细胞群为肝细胞。

在一些实施方案中，方法包括在LNP中施用指导RNA和RNA指导的DNA结合剂(诸如编码Cas9核酸酶的mRNA)。在其他实施方案中，方法包括施用编码因子IX蛋白的AAV核酸构建体，诸如双向FIX构建体。包含指导RNA和编码Cas9的mRNA的CRISPR/Cas9LNP可静脉内施用。AAV FIX供体构建体可静脉内施用。CRISPR/Cas9 LNP的示例性给药包括约0.1、0.25、0.3、0.5、1、2、3、4、5、6、8或10mpk(RNA)。单位mg/kg和mpk在本文中可互换使用。包含编码FIX蛋白的核酸的AAV的示例性给药包括约10¹¹、10¹²、10¹³和10¹⁴vg/kg的MOI，任选地MOI可为约1x 10¹³至1x 10¹⁴vg/kg。

在一些实施方案中，方法包括表达治疗有效量的因子IX蛋白。在一些实施方案中，方法包括在个体中达到治疗有效水平的循环因子IX凝血活性。在特定的实施方案中，方法包括达到至少约5％至约50％正常值的因子IX活性。方法可包括达到至少约50％至约150％正常值的因子IX活性。在某些实施方案中，方法包括使因子IX活性相对于患者基线因子IX活性增加至少约1％至约50％的正常因子IX活性、或至少约5％至约50％的正常因子IX活性或至少约50％至约150％的正常因子IX活性。

在一些实施方案中，方法还包括达到持久效果，例如至少1个月、2个月、6个月、1年或2年效果。在一些实施方案中，方法还包括以持久和持续的方式达到治疗效果，例如至少1个月、2个月、6个月、1年或2年效果。在一些实施方案中，循环因子IX活性和/或水平的水平稳定至少1个月、2个月、6个月、1年或更长时间。在一些实施方案中，达到FIX蛋白的稳态活性和/或水平至少7天、至少14天或至少28天。在另外的实施方案中，方法包括在单次给药后维持因子IX活性和/或水平至少1、2、4或6个月，或至少1、2、3、4或5年。

在涉及插入白蛋白基因座的另外的实施方案中，个体的循环白蛋白水平是正常的。方法可包括将个体的循环白蛋白水平维持在正常循环白蛋白水平的±5％、±10％、±15％、±20％或±50％之内。在某些实施方案中，与未经治疗的个体的白蛋白水平相比，个体的白蛋白水平至少在第4周、第8周、第12周或第20周没有变化。在某些实施方案中，个体的白蛋白水平瞬时下降，然后恢复正常水平。特别地，方法可包括检测血浆白蛋白水平无显著改变。

在一些实施方案中，本发明包括一种修饰白蛋白基因(诸如人白蛋白基因)(例如，在其中创建双链断裂)的方法或用途，所述方法或用途包括将本文所述的gRNA、供体构建体(例如，包含编码因子IX的序列的双向构建体)和RNA指导的DNA结合剂(例如，Cas核酸酶)中的任何一种或多种施用或递送至宿主细胞或宿主细胞群。在一些实施方案中，本发明包括一种修饰白蛋白内含子1区域(诸如人白蛋白内含子1区域)(例如，在其中创建双链断裂)的方法或用途，所述方法或用途包括将本文所述的gRNA、供体构建体(例如，包含编码因子IX的序列的双向构建体)和RNA指导的DNA结合剂(例如，Cas核酸酶)中的任何一种或多种施用或递送至宿主细胞或宿主细胞群。在一些实施方案中，本发明包括一种修饰人安全港(诸如肝脏组织或肝细胞宿主细胞)(例如，在其中创建双链断裂)的方法或用途，所述方法或用途包括将本文所述的gRNA、供体构建体(例如，包含编码因子IX的序列的双向构建体)和RNA指导的DNA结合剂(例如，Cas核酸酶)中的任何一种或多种施用或递送至宿主细胞或宿主细胞群。插入安全港基因座(诸如白蛋白基因座)中允许因子IX基因过度表达，而不会对宿主细胞或细胞群(诸如肝细胞或肝脏细胞)产生显著的有害影响。在一些实施方案中，本发明包括一种修饰人白蛋白基因座的内含子1(例如，在其中创建双链断裂)的方法或用途，所述方法或用途包括将本文所述的gRNA、供体构建体(例如，包含编码因子IX的序列的双向构建体)和RNA指导的DNA结合剂(例如，Cas核酸酶)中的任何一种或多种施用或递送至宿主细胞或宿主细胞群。在一些实施方案中，指导RNA包含含有结合在人白蛋白基因座的内含子1(SEQ ID NO:1)内的至少15、16、17、18、19或20个连续核苷酸的指导序列。在一些实施方案中，指导RNA包含选自由SEQ ID NO:2-33组成的组的序列的至少15、16、17、18、19或20个连续核苷酸。在一些实施方案中，指导RNA包含与选自由SEQ ID NO:2-33组成的组的序列至少95％、90％、85％、80％或75％相同的序列。在一些实施方案中，本文公开的指导RNA包含选自由SEQ ID NO:2、8、13、19、28、29、31、32、33组成的组的指导序列。在一些实施方案中，本文公开的指导RNA包含选自由SEQ ID NO:2、8、13、19、28、29、31、32、33组成的组的序列的至少17、18、19或20个连续核苷酸的指导序列。在一些实施方案中，本文公开的指导RNA包含选自由SEQ ID NO:34、40、45、51、60、61、63、64、65、66、72、77、83、92、93、95、96和97组成的组的指导序列。在一些实施方案中，本文公开的指导RNA包含与选自由SEQ ID NO:2-33组成的组的序列至少95％、90％、85％、80％或75％相同的指导序列。在一些实施方案中，本文公开的指导RNA包含选自由SEQ ID NO:2-33组成的组的序列的至少17、18、19或20个连续核苷酸的指导序列。在一些实施方案中，本文公开的指导RNA包含选自由SEQ ID NO:34-97组成的组的指导序列。在一些实施方案中，指导RNA包含选自由SEQ ID NO:2-5、10-17、21-27和29-33组成的组的序列的至少15、16、17、18、19或20个连续核苷酸。在一些实施方案中，指导RNA包含与选自由SEQ ID NO:2-5、10-17、21-27和29-33组成的组的序列至少95％、90％、85％、80％或75％相同的序列。在一些实施方案中，本文公开的指导RNA包含选自由SEQ ID NO:2-5、10-17、21-27和29-33组成的组的指导序列。在一些实施方案中，本文公开的指导RNA包含选自由SEQ ID NO:2-5、10-17、21-27和29-33组成的组的序列的至少17、18、19或20个连续核苷酸的指导序列。在一些实施方案中，本文公开的指导RNA包含选自由SEQ ID NO:34-37、42-49、53-59、61-69、74-81、85-91和93-97组成的组的指导序列。在一些实施方案中，本文公开的指导RNA包含与选自由SEQ ID NO:2-5、10-17、21-27和29-33组成的组的序列至少95％、90％、85％、80％或75％相同的指导序列。在一些实施方案中，本文公开的指导RNA包含选自由SEQ ID NO:2-5、10-17、21-27和29-33组成的组的序列的至少17、18、19或20个连续核苷酸的指导序列。在一些实施方案中，本文公开的指导RNA包含选自由SEQ ID NO:34-37、42-49、53-59、61-69、74-81、85-91和93-97组成的组的指导序列。在一些实施方案中，所述方法在体外进行。在一些实施方案中，所述方法在体内进行。在一些实施方案中，供体构建体是包含编码因子IX的序列的双向构建体。在一些实施方案中，宿主细胞为肝脏细胞，诸如。在另外的实施方案中，肝脏细胞为肝细胞。

在一些实施方案中，本发明包括一种将因子IX核酸引入宿主细胞或宿主细胞群的方法或用途，所述方法或用途包括将本文所述的gRNA、供体构建体(例如，包含编码因子IX的序列的双向构建体)和RNA指导的DNA结合剂(例如，Cas核酸酶)中的任何一种或多种施用或递送至宿主细胞或宿主细胞群。在一些实施方案中，指导RNA包含含有能够结合人白蛋白基因座的内含子1(SEQ ID NO:1)内区域的至少15、16、17、18、19或20个连续核苷酸的指导序列。在一些实施方案中，指导RNA包含选自由SEQ ID NO:2-33组成的组的序列的至少15、16、17、18、19或20个连续核苷酸。在一些实施方案中，指导RNA包含与选自由SEQ ID NO:2-33组成的组的序列至少95％、90％、85％、80％或75％相同的序列。在一些实施方案中，本文公开的指导RNA包含选自由SEQ ID NO:2、8、13、19、28、29、31、32、33组成的组的指导序列。在一些实施方案中，本文公开的指导RNA包含选自由SEQ ID NO:2、8、13、19、28、29、31、32、33组成的组的序列的至少17、18、19或20个连续核苷酸的指导序列。在一些实施方案中，本文公开的指导RNA包含选自由SEQ ID NO:34、40、45、51、60、61、63、64、65、66、72、77、83、92、93、95、96和97组成的组的指导序列。在一些实施方案中，本文公开的指导RNA包含与选自由SEQ ID NO:2-33组成的组的序列至少95％、90％、85％、80％或75％相同的指导序列。在一些实施方案中，本文公开的指导RNA包含选自由SEQ ID NO:2-33组成的组的序列的至少17、18、19或20个连续核苷酸的指导序列。在一些实施方案中，本文公开的指导RNA包含选自由SEQ ID NO:34-97组成的组的指导序列。在一些实施方案中，指导RNA包含选自由SEQ IDNO:2-5、10-17、21-27和29-33组成的组的序列的至少15、16、17、18、19或20个连续核苷酸。在一些实施方案中，指导RNA包含与选自由SEQ ID NO:2-5、10-17、21-27和29-33组成的组的序列至少95％、90％、85％、80％或75％相同的序列。在一些实施方案中，本文公开的指导RNA包含选自由SEQ ID NO:2-5、10-17、21-27和29-33组成的组的指导序列。在一些实施方案中，本文公开的指导RNA包含选自由SEQ ID NO:2-5、10-17、21-27和29-33组成的组的序列的至少17、18、19或20个连续核苷酸的指导序列。在一些实施方案中，本文公开的指导RNA包含选自由SEQ ID NO:34-37、42-49、53-59、61-69、74-81、85-91和93-97组成的组的指导序列。在一些实施方案中，本文公开的指导RNA包含与选自由SEQ ID NO:2-5、10-17、21-27和29-33组成的组的序列至少95％、90％、85％、80％或75％相同的指导序列。在一些实施方案中，本文公开的指导RNA包含选自由SEQ ID NO:2-5、10-17、21-27和29-33组成的组的序列的至少17、18、19或20个连续核苷酸的指导序列。在一些实施方案中，本文公开的指导RNA包含选自由SEQ ID NO:34-37、42-49、53-59、61-69、74-81、85-91和93-97组成的组的指导序列。在一些实施方案中，所述方法在体外进行。在一些实施方案中，所述方法在体内进行。在一些实施方案中，供体构建体是包含编码因子IX的序列的双向构建体。在一些实施方案中，宿主细胞为肝脏细胞，或宿主细胞群为肝脏细胞，诸如肝细胞。

在一些实施方案中，本发明包括一种在宿主细胞或宿主细胞群中表达因子IX的方法或用途，所述方法或用途包括将本文所述的gRNA、供体构建体(例如，包含编码因子IX的序列的双向构建体)和RNA指导的DNA结合剂(例如，Cas核酸酶)中的任何一种或多种施用或递送至宿主细胞或宿主细胞群。在一些实施方案中，指导RNA包含含有能够结合人白蛋白基因座的内含子1(SEQ ID NO:1)内区域的至少15、16、17、18、19或20个连续核苷酸的指导序列。在一些实施方案中，指导RNA包含选自由SEQ ID NO:2-33组成的组的序列的至少15、16、17、18、19或20个连续核苷酸。在一些实施方案中，指导RNA包含与选自由SEQ ID NO:2-33组成的组的序列至少95％、90％、85％、80％或75％相同的序列。在一些实施方案中，本文公开的指导RNA包含选自由SEQ ID NO:2、8、13、19、28、29、31、32、33组成的组的指导序列。在一些实施方案中，本文公开的指导RNA包含选自由SEQ ID NO:2、8、13、19、28、29、31、32、33组成的组的序列的至少17、18、19或20个连续核苷酸的指导序列。在一些实施方案中，本文公开的指导RNA包含选自由SEQ ID NO:34、40、45、51、60、61、63、64、65、66、72、77、83、92、93、95、96和97组成的组的指导序列。在一些实施方案中，本文公开的指导RNA包含与选自由SEQID NO:2-33组成的组的序列至少95％、90％、85％、80％或75％相同的指导序列。在一些实施方案中，本文公开的指导RNA包含选自由SEQ ID NO:2-33组成的组的序列的至少17、18、19或20个连续核苷酸的指导序列。在一些实施方案中，本文公开的指导RNA包含选自由SEQID NO:34-97组成的组的指导序列。在一些实施方案中，指导RNA包含选自由SEQ ID NO:2-5、10-17、21-27和29-33组成的组的序列的至少15、16、17、18、19或20个连续核苷酸。在一些实施方案中，指导RNA包含与选自由SEQ ID NO:2-5、10-17、21-27和29-33组成的组的序列至少95％、90％、85％、80％或75％相同的序列。在一些实施方案中，本文公开的指导RNA包含选自由SEQ ID NO:2-5、10-17、21-27和29-33组成的组的指导序列。在一些实施方案中，本文公开的指导RNA包含选自由SEQ ID NO:2-5、10-17、21-27和29-33组成的组的序列的至少17、18、19或20个连续核苷酸的指导序列。在一些实施方案中，本文公开的指导RNA包含选自由SEQ ID NO:34-37、42-49、53-59、61-69、74-81、85-91和93-97组成的组的指导序列。在一些实施方案中，本文公开的指导RNA包含与选自由SEQ ID NO:2-5、10-17、21-27和29-33组成的组的序列至少95％、90％、85％、80％或75％相同的指导序列。在一些实施方案中，本文公开的指导RNA包含选自由SEQ ID NO:2-5、10-17、21-27和29-33组成的组的序列的至少17、18、19或20个连续核苷酸的指导序列。在一些实施方案中，本文公开的指导RNA包含选自由SEQ ID NO:34-37、42-49、53-59、61-69、74-81、85-91和93-97组成的组的指导序列。在一些实施方案中，所述方法在体外进行。在一些实施方案中，所述方法在体内进行。在一些实施方案中，供体构建体是包含编码因子IX的序列的双向构建体。在一些实施方案中，宿主细胞为肝脏细胞，或宿主细胞群为肝脏细胞，诸如肝细胞。

在一些实施方案中，本发明包括一种治疗血友病(例如，血友病B)的方法或用途，所述方法或用途包括将本文所述的gRNA、供体构建体(例如，包含编码因子IX的序列的双向构建体)和RNA指导的DNA结合剂(例如，Cas核酸酶)中的任何一种或多种施用或递送至有此需要的受试者。在一些实施方案中，指导RNA包含含有能够结合人白蛋白基因座的内含子1(SEQ ID NO:1)内区域的至少15、16、17、18、19或20个连续核苷酸的指导序列。在一些实施方案中，指导RNA包含选自由SEQ ID NO:2-33组成的组的序列的至少15、16、17、18、19或20个连续核苷酸。在一些实施方案中，指导RNA包含与选自由SEQ ID NO:2-33组成的组的序列至少95％、90％、85％、80％或75％相同的序列。在一些实施方案中，本文公开的指导RNA包含选自由SEQ ID NO:2、8、13、19、28、29、31、32、33组成的组的指导序列。在一些实施方案中，本文公开的指导RNA包含选自由SEQ ID NO:2、8、13、19、28、29、31、32、33组成的组的序列的至少17、18、19或20个连续核苷酸的指导序列。在一些实施方案中，本文公开的指导RNA包含选自由SEQ ID NO:34、40、45、51、60、61、63、64、65、66、72、77、83、92、93、95、96和97组成的组的指导序列。在一些实施方案中，本文公开的指导RNA包含与选自由SEQ ID NO:2-33组成的组的序列至少95％、90％、85％、80％或75％相同的指导序列。在一些实施方案中，本文公开的指导RNA包含选自由SEQ ID NO:2-33组成的组的序列的至少17、18、19或20个连续核苷酸的指导序列。在一些实施方案中，本文公开的指导RNA包含选自由SEQ ID NO:34-97组成的组的指导序列。在一些实施方案中，指导RNA包含选自由SEQ ID NO:2-5、10-17、21-27和29-33组成的组的序列的至少15、16、17、18、19或20个连续核苷酸。在一些实施方案中，指导RNA包含与选自由SEQ ID NO:2-5、10-17、21-27和29-33组成的组的序列至少95％、90％、85％、80％或75％相同的序列。在一些实施方案中，本文公开的指导RNA包含选自由SEQ ID NO:2-5、10-17、21-27和29-33组成的组的指导序列。在一些实施方案中，本文公开的指导RNA包含选自由SEQ ID NO:2-5、10-17、21-27和29-33组成的组的序列的至少17、18、19或20个连续核苷酸的指导序列。在一些实施方案中，本文公开的指导RNA包含选自由SEQID NO:34-37、42-49、53-59、61-69、74-81、85-91和93-97组成的组的指导序列。在一些实施方案中，本文公开的指导RNA包含与选自由SEQ ID NO:2-5、10-17、21-27和29-33组成的组的序列至少95％、90％、85％、80％或75％相同的指导序列。在一些实施方案中，本文公开的指导RNA包含选自由SEQ ID NO:2-5、10-17、21-27和29-33组成的组的序列的至少17、18、19或20个连续核苷酸的指导序列。在一些实施方案中，本文公开的指导RNA包含选自由SEQ IDNO:34-37、42-49、53-59、61-69、74-81、85-91和93-97组成的组的指导序列。在一些实施方案中，供体构建体是包含编码因子IX的序列的双向构建体。在一些实施方案中，宿主细胞为肝脏细胞，或宿主细胞群为肝脏细胞，诸如肝细胞。

如本文所述，可使用本领域已知的任何合适的递送系统和方法来递送包含编码因子IX的序列的供体构建体(例如，双向构建体)、指导RNA和RNA指导的DNA结合剂。组合物可同时或以任何相继次序在体外或体内递送。在一些实施方案中，供体构建体、指导RNA和Cas核酸酶可同时在体外或体内递送，例如在一个载体、两个载体、单独的载体、一个LNP、两个LNP、单独的LNP或其组合中。在一些实施方案中，供体构建体可在递送单独作为载体和/或与LNP缔合或一起作为核糖核蛋白(RNP)的指导RNA和/或Cas核酸酶(例如，约1、2、3、4、5、6、7、8、9、10、11、12、13、14或更多天)之前作为载体和/或与LNP缔合在体内或在体外递送。在一些实施方案中，供体构建体可以多次施用递送，例如每天、每两天、每三天、每四天、每周、每两周、每三周或每四周。在一些实施方案中，供体构建体可以一周的间隔递送，例如，在第1周、第2周和第3周等。作为进一步的实例，指导RNA和Cas核酸酶可在递送作为载体和/或与LNP缔合的构建体(例如，约1、2、3、4、5、6、7、8、9、10、11、12、13、14或更多天)之前单独作为载体和/或与LNP缔合或一起作为核糖核蛋白(RNP)在体内或在体外递送。在一些实施方案中，白蛋白指导RNA可以多次施用递送，例如每天、每两天、每三天、每四天、每周、每两周、每三周或每四周。在一些实施方案中，白蛋白指导RNA可以一周的间隔递送，例如，在第1周、第2周和第3周等。在一些实施方案中，Cas核酸酶可以多次施用递送，例如，可以每天、每两天、每三天、每四天、每周、每两周、每三周或每四周递送。在一些实施方案中，Cas核酸酶可以一周的间隔递送，例如，在第1周、第2周和第3周等。在一些实施方案中，指导RNA和Cas核酸酶与LNP缔合并且在递送因子IX供体构建体之前递送至宿主细胞或宿主细胞群。

在一些实施方案中，供体构建体包含编码因子IX的序列，其中因子IX序列为野生型因子IX，例如SEQ ID NO:700。在一些实施方案中，供体构建体包含编码因子IX的序列，其中因子IX序列为野生型因子IX，例如SEQ ID NO:701。在一些实施方案中，序列编码因子IX的变体。例如，变体具有比野生型因子IX高的凝血活性。例如，变体因子IX包含一个或多个突变，诸如相对于SEQ ID NO:701的位置R338(例如，R338L)中的氨基酸取代。在一些实施方案中，序列编码与SEQ ID NO:700、SEQ ID NO:701或SEQ ID NO:702 80％、85％、90％、93％、95％、97％、99％相同的因子IX变体，所述变体与野生型因子IX相比具有至少80％、85％、90％、92％、94％、96％、98％、99％、100％或更多的活性。在一些实施方案中，序列编码因子IX的片段，其中所述片段与野生型因子IX相比具有至少80％、85％、90％、92％、94％、96％、98％、99％、100％或更多的活性。

在一些实施方案中，供体构建体包含编码因子IX变体的序列，其中因子IX变体在其辅因子(因子VIII)(表达导致治疗相关的FVIII模拟活性)不存在的情况下激活凝血。此类因子IX变体还可维持野生型因子IX的活性。例如，相对于野生型因子IX(例如，相对于SEQID NO:701)，此种因子IX变体可包含位置L6、V181、K265、I383、E185或其组合处的氨基酸取代。例如，相对于野生型因子IX(例如，相对于SEQ ID NO:701)，此种因子IX变体可包含L6F突变、V181I突变、K265A突变、I383V突变、E185D突变或其组合。

在特定的实施例中，因子IX蛋白可包含V181I突变、K265A突变和I383V突变。在另一个特定的实施例中，因子IX蛋白可包含V181I突变、K265A突变、I383V突变和E185D突变。在一些实施方案中，因子IX蛋白与SEQ ID NO:700至少80％、85％、90％、93％、95％、97％、99％相同，与野生型因子IX相比具有至少80％、85％、90％、92％、94％、96％、98％、99％、100％或更多的活性。在某些实施方案中，因子IX变体与SEQ ID NO:700至少80％、85％、90％、93％、95％、97％、99％相同，与野生型因子IX相比具有至少80％、85％、90％、92％、94％、96％、98％、99％、100％或更多的活性，并且包含V181I突变、K265A突变、I383V突变和/或E185D突变。在另一个特定的实施例中，因子IX蛋白可包含L6F突变、V181I突变、K265A突变和I383V突变。在某些实施方案中，因子IX变体与SEQ ID NO:700至少80％、85％、90％、93％、95％、97％、99％相同，与野生型因子IX相比具有至少80％、85％、90％、92％、94％、96％、98％、99％、100％或更多的活性，并且包含V181I突变、K265A突变和I383V突变。

在一些实施方案中，宿主细胞为肝脏细胞，或宿主细胞群为肝脏细胞。在一些实施方案中，宿主细胞或宿主细胞群为任何合适的非分裂细胞。如本文所用，“非分裂细胞”是指终末分化而不分裂的细胞，以及不分裂但保留重新进入细胞分裂和增殖的能力的静止细胞。例如，肝脏细胞保留分裂的能力(例如，当受伤或切除时)，但通常不分裂。在有丝分裂细胞分裂期间，同源重组是保护基因组并修复双链断裂的机制。在一些实施方案中，“非分裂”细胞是指这样的细胞，其中例如与对照分裂细胞相比，同源重组(HR)不是修复细胞中双链DNA断裂的主要机制。在一些实施方案中，“非分裂”细胞是指这样的细胞，其中例如与对照分裂细胞相比，非同源末端连接(NHEJ)是修复细胞中双链DNA断裂的主要机制。非分裂细胞类型已例如通过活性NHEJ双链DNA断裂修复机制在文献中描述。参见例如，Iyama,DNARepair(Amst.)2013,12(8):620-636。在一些实施方案中，宿主细胞包括但不限于肝脏细胞、肌肉细胞或神经元细胞。在一些实施方案中，宿主细胞或宿主细胞群为肝细胞，诸如小鼠、食蟹猴或人肝细胞。在一些实施方案中，宿主细胞为肌细胞，诸如小鼠、食蟹猴或人肌细胞。在一些实施方案中，本文提供了宿主细胞组合物，其包含单独或与RNA指导的DNA结合蛋白组合的本文所述的任何一种或多种指导RNA。在一些实施方案中，本文提供了包含本文所述的载体中的任何一种或多种的宿主细胞组合物。

在一些实施方案中，供体构建体(例如，双向构建体)在核酸载体(诸如AAV载体，例如AAV8)中施用。在一些实施方案中，供体构建体不包含同源臂。

在一些实施方案中，受试者为哺乳动物。在一些实施方案中，受试者为人。在一些实施方案中，受试者为奶牛、猪、猴、绵羊、狗、猫、鱼或家禽。

在一些实施方案中，静脉内施用包含编码因子IX的序列的供体构建体(例如，双向构建体)、指导RNA和RNA指导的DNA结合剂。在一些实施方案中，将包含编码因子IX的序列的供体构建体(例如，双向构建体)、指导RNA和RNA指导的DNA结合剂施用到肝循环中。

在一些实施方案中，单次施用包含编码因子IX的序列的供体构建体(例如，双向构建体)、指导RNA和RNA指导的DNA结合剂足以使因子IX的表达增加至所需水平。在其他实施方案中，不止一次施用包含含有编码因子IX的序列的供体构建体(例如，双向构建体)、指导RNA和RNA指导的DNA结合剂的组合物可有益于最大化治疗效果。

在一些实施方案中，本公开包括组合疗法，所述组合疗法包括本文所述的gRNA、供体构建体(例如，包含编码因子IX的序列的双向构建体)和RNA指导的DNA结合剂(例如，Cas核酸酶)中的任何一种或多种以及适合于治疗如上所述的血友病的另外的疗法。例如，本公开的方法可与其他止血剂、血液因子和药物的使用组合。例如，可向受试者施用治疗有效量的选自由以下组成的组的一种或多种因子：因子XI、因子XII、前激肽释放酶、高分子量激肽原(HMWK)、因子V、因子VII、因子VIII、因子X、因子XIII、因子II、因子VIIa和vonWillebrand因子。

在一些实施方案中，治疗还可包括施用促凝血剂，诸如固有凝血途径的激活剂(包括因子Xa、因子IXa、因子XIa、因子XIIa和VIIIa)、前激肽释放酶和高分子量激肽原；或外在凝血途径的激活剂，包括组织因子、因子VIIa、因子Va和因子Xa。此描述和示例性实施方案不应被视为限制性的。为了本说明书和所附实施方案的目的，除非另外指出，否则在所有情况下，就没有被术语“约”修饰来说，应将表示数量、百分比或比例的所有数字以及在说明书和实施方案中使用的其他数值理解为由所述术语修饰。因此，除非有相反的指示，否则以下说明书和所附实施方案中所阐述的数值参数为近似值，其可根据要寻求获得的所需性质而变化。在最低限度并且不试图限制对实施方案范围的等同原则的应用，每个数值参数均应当至少根据报道的有效数字的数值和通过应用普通四舍五入技术来解读。

人因子IX蛋白质序列(SEQ ID NO:700)NCBI参考：NP_000124：

人因子IX核苷酸序列(SEQ ID NO:706)NCBI参考：NM_000133)：

人因子IX多肽(SEQ ID No:701)

YNSGKLEEFVQGNLERECMEEKCSFEEAREVFENTERTTEFWKQYVDGDQCESNPCLNGGSCKDDINSYECWCPFGFEGKNCELDVTCNIKNGRCEQFCKNSADNKVVCSCTEGYRLAENQKSCEPAVPFPCGRVSVSQTSKLTRAETVFPDVDYVNSTEAETILDNITQSTQSFNDFTRVVGGEDAKPGQFPWQVVLNGKVDAFCGGSIVNEKWIVTAAHCVETGVKITVVAGEHNIEETEHTEQKRNVIRIIPHHNYNAAINKYNHDIALLELDEPLVLNSYVTPICIADKEYTNIFLKFGSGYVSGWGRVFHKGRSALVLQYLRVPLVDRATCLRSTKFTIYNNMFCAGFHEGGRDSCQGDSGGPHVTEVEGTSFLTGIISWGEECAMKGKYGIYTKVSRYVNWIKEKTKLT

实施例

提供以下实施例来例示某些公开的实施方案，并且不应以任何方式解释为限制本公开的范围。

实施例1-材料和方法

克隆和质粒制备

合成由ITR侧接的双向插入构建体，并由商业供应商将其克隆到pUC57-Kan中。将所得构建体(P00147)用作其他载体的亲本克隆载体。其他插入构建体(不含ITR)也被商业合成并克隆到pUC57中。用BglII限制酶(New England BioLabs，目录号R0144S)消化纯化的质粒，并将插入构建体克隆到亲本载体中。质粒在Stbl3^TM化学感受态大肠杆菌(ThermoFisher，目录号C737303)中繁殖。

AAV生产

HEK293细胞中的三重转染用于用感兴趣的用于AAV8和AAV-DJ生产的构建体包装基因组，并且通过碘克沙醇梯度超速离心法从裂解的细胞和培养基中纯化所得载体(参见例如，Lock等人.,Hum Gene Ther.2010年10月；21(10):1259-71)。在三重转染中使用的质粒含有具有感兴趣的构建体的基因组，在实施例中通过“PXXXX”号引用，也参见例如表9。将分离的AAV在储存缓冲液(含0.001％Pluronic F68的PBS)中透析。使用位于ITR区域内的引物/探针通过qPCR确定AAV滴度。

核酸酶mRNA的体外转录(“IVT”)

使用线性化质粒DNA模板和T7 RNA聚合酶通过体外转录产生含有N1-甲基假U的加帽和聚腺苷酸化酿脓链球菌(“Spy”)Cas9mRNA。一般来讲，通过在37℃下与XbaI孵育以完全消化，之后在65℃下对XbaI进行热灭活，将含有T7启动子和100nt聚(A/T)区的质粒DNA线性化。从酶和缓冲盐中纯化线性化质粒。将产生Cas9修饰的mRNA的IVT反应在以下条件下于37℃孵育4小时：50ng/μL线性化质粒；GTP、ATP、CTP和N1-甲基假UTP(Trilink)各自为2mM；10mM ARCA(Trilink)；5U/μL T7 RNA聚合酶(NEB)；1U/μL鼠RNA酶抑制剂(NEB)；0.004U/μL无机大肠杆菌焦磷酸酶(NEB)；和1x反应缓冲液。添加TURBO RNA酶(ThermoFisher)至最终浓度为0.01U/μL，并将反应再孵育30分钟以去除DNA模板。根据制造商的方案(ThermoFisher)，使用MegaClear转录清洁试剂盒纯化Cas9 mRNA。替代地，使用LiCl沉淀、乙酸铵沉淀和乙酸钠沉淀或使用LiCl沉淀方法之后通过切向流过滤进一步纯化来纯化Cas9 mRNA。通过测量260nm处的吸光度(Nanodrop)来确定转录物浓度，并且通过借助Bioanlayzer(Agilent)的毛细管电泳来分析所述转录物。

下面的Cas9包含Cas9 ORF SEQ ID NO:703或SEQ ID NO:704或PCT/US2019/053423(其特此以引用的方式并入)的表24的序列。

用于递送Cas9 mRNA和gRNA的脂质制剂

利用脂质制剂将Cas9 mRNA和gRNA递送至细胞和动物，所述脂质制剂包含可电离的脂质十八碳-9,12-二烯酸(9Z,12Z)-3-((4,4-双(辛氧基)丁酰基)氧基)-2-((((3-(二乙基氨基)丙氧基)羰基)氧基)甲基)丙酯(也称为(9Z,12Z)-十八碳-9,12-二烯酸3-((4,4-双(辛氧基)丁酰基)氧基)-2-((((3-(二乙基氨基)丙氧基)羰基)氧基)甲基)丙酯)、胆固醇、DSPC和PEG2k-DMG。

对于利用预混合脂质制剂(在本文中称为“脂质包”)的实验，将组分以50:38:9:3的可电离脂质:胆固醇:DSPC:PEG2k-DMG的摩尔比在100％乙醇中重构，之后将其以约6.0的脂质胺与RNA磷酸(N:P)摩尔比与RNA货物(例如，Cas9 mRNA和gRNA)混合，如本文进一步所述。

对于利用配制为脂质纳米颗粒(LNP)的组分的实验，将所述组分以各种摩尔比溶于100％乙醇中。将RNA货物(例如，Cas9 mRNA和gRNA)溶解在25mM柠檬酸盐、100mM NaCl，pH5.0中，导致RNA货物的浓度为大约0.45mg/mL。

对于实施例2中描述的实验，根据制造商的方案，使用Precision NanosystemsNanoAssemblr^TM Benchtop仪器通过微流体混合脂质和RNA溶液来形成LNP。在混合期间，使用不同的流速保持2:1的水与有机溶剂的比率。混合后，收集LNP，在水(大约1:1体积/体积)中稀释，在室温下保持1小时，并且在最终缓冲液交换之前用水(大约1:1体积/体积)进一步稀释。用PD-10脱盐柱(GE)完成将最终缓冲液交换到50mM Tris、45mM NaCl、5％(重量/体积)蔗糖，pH 7.5(TSS)中。如果需要，通过用Amicon 100kDa离心过滤器(Millipore)浓缩制剂。然后使用0.2μm无菌过滤器过滤所得混合物。将最终LNP储存在-80℃下直至进一步使用。以45:44:9:2的可电离的脂质:胆固醇:DSPC:PEG2k-DMG的摩尔比配制LNP，其中脂质胺与RNA磷酸酯(N:P)摩尔比为约4.5，并且gRNA与mRNA的重量比为1:1。

对于其他实施例中描述的实验，使用交叉流技术制备LNP，所述技术利用将乙醇中的脂质与两体积的RNA溶液和一体积的水冲击喷射混合。通过混合十字管将乙醇中的脂质与两体积的RNA溶液混合。将第四股水流通过内联三通与十字管的出口流混合(参见WO2016010840，图2)。将LNP在室温下放置1小时，并且用水(大约1:1体积/体积)进一步稀释。使用切向流过滤在平板滤筒(Sartorius，100kD MWCO)上浓缩稀释的LNP，然后通过渗滤将缓冲液交换到50mM Tris、45mM NaCl、5％(重量/体积)蔗糖，pH 7.5(TSS)中。替代地，用PD-10脱盐柱(GE)完成将最终缓冲液交换到TSS中。如果需要，通过用Amicon 100kDa离心过滤器(Millipore)浓缩制剂。然后使用0.2μm无菌过滤器过滤所得混合物。将最终LNP储存在4℃或-80℃下直至进一步使用。以50:38:9:3的可电离的脂质:胆固醇:DSPC:PEG2k-DMG的摩尔比配制LNP，其中脂质胺与RNA磷酸酯(N:P)摩尔比为约6.0，并且gRNA与mRNA的重量比为1:1。

Cas9 mRNA、gRNA和插入构建体的细胞培养和体外递送

Hepa1-6细胞

将Hepa1-6细胞以10,000个细胞/孔的密度接种在96孔板中。24小时后，用LNP和AAV处理细胞。在处理之前，将培养基从孔中吸出。将LNP在DMEM+10％FBS培养基中稀释至4ng/ul，并在10％FBS(DMEM中)中进一步稀释至2ng/ul，并在37℃下孵育10min(最终浓度为5％FBS)。AAV的靶MOI为1e6，在DMEM+10％FBS培养基中稀释。将50μl上述稀释的LNP以2ng/ul添加到细胞中(递送总共100ng RNA货物)，之后添加50μl AAV。LNP和AAV的治疗间隔数分钟。细胞中培养基的总体积为100μl。在处理后72小时和处理后30天，如下所述收集来自这些经处理的细胞的上清液以用于人FIX ELISA分析。

原代肝细胞

将原代小鼠肝细胞(PMH)、原代猕猴肝细胞(PCH)和原代人肝细胞(PHH)解冻，并重悬于含补充剂(ThermoFisher)的肝细胞解冻培养基中，之后进行离心。丢弃上清液，并将沉淀的细胞重悬于肝细胞平板培养基加补充包(ThermoFisher)中。对细胞计数，并将其以对于PHH为33,000个细胞/孔和对于PCH为50,000个细胞/孔和对于PMH为15,000个细胞/孔的密度接种于Bio-coat胶原蛋白I包被的96孔板上。使接种的细胞在37℃和5％CO₂气氛下的组织培养箱中沉降并粘附5小时。孵育后，检查细胞的单层形成，并用先前的肝细胞维持液洗涤三次，并在37℃下孵育。

对于利用脂质包递送的实验，分别将Cas9 mRNA和gRNA在维持培养基中各自稀释至2mg/ml，并将各自的2.9μl添加到含有12.5μl的50mM柠檬酸盐、200mM氯化钠，pH 5和6.9μl的水的孔(96孔Eppendorf板中)中。然后添加12.5μl脂质包制剂，之后添加12.5μl水和150μl TSS。使用肝细胞维持培养基将每个孔稀释至20ng/μl(相对于总RNA含量)，然后用6％的新鲜小鼠血清稀释至10ng/l(相对于总RNA含量)。μ转染前从细胞中吸出培养基，并将40μl脂质包/RNA混合物添加到细胞中，之后以1e5的MOI添加AAV(在维持培养基中稀释)。如本文所述，在处理后72小时收集培养基以进行分析，并收获细胞以进行进一步的分析。

萤光素酶测定

对于涉及细胞培养基中NanoLuc检测的实验，将一体积的

荧光素酶测定底物与50体积的

荧光素酶测定缓冲液组合。使用1:10稀释的样品(50μl试剂+40μl水+10μl细胞培养基)在Promega Glomax运行器上以0.5秒的积分时间进行测定。

对于涉及检测细胞培养基中HiBit标签的实验，将LgBiT蛋白和Nano-GloR HiBiT细胞外底物分别在室温下的Nano-GloR HiBiT细胞外缓冲液中以1:100和1:50稀释。使用1:10稀释的样品(50μl试剂+40μl水+10μl细胞培养基)在Promega Glomax运行器上以1.0秒的积分时间进行测定。

LNP和/或AAV的体内递送

通过侧尾静脉向小鼠给药AAV、LNP、AAV和LNP、或载体(对于AAV载体为PBS+0.001％Pluronic，对于LNP载体为TSS)。以每只动物0.1mL的体积施用AAV，其量(载体基因组/只小鼠，“vg/ms”)如本文所述。将LNP在TSS中稀释，并以本文指出的量以约5μl/克体重施用。通常，如果适用，首先给小鼠注射AAV，然后注射LNP。在治疗后的各个时间点，收集血清和/或肝脏组织用于某些分析，如下文进一步所述。

人因子IX(hFIX)ELISA分析

对于体外研究，根据制造商的方案使用人因子IX ELISA试剂盒(Abcam，目录号ab188393)确定细胞培养基中分泌的总人因子IX水平。使用4参数对数拟合将分泌的hFIX水平从标准曲线上定量，并表示为ng/mL培养基。

对于体内研究，如所示收集血液并分离血清或血浆。根据制造商的方案使用人因子IX ELISA试剂盒(Abcam，目录号ab188393)确定总人因子IX水平。使用4参数对数拟合将血清或血浆hFIX水平从标准曲线上定量，并表示为μg/mL血清。

下一代测序(“NGS”)和中靶裂解效率分析

利用深度测序来鉴定由基因编辑例如在白蛋白内含子1内引入的插入和缺失的存在。在靶位点周围设计PCR引物，并扩增感兴趣的基因组区域。引物序列设计是按照本领域的标准进行的。

根据制造商的方案(Illumina)进行另外的PCR，以添加用于测序的化学物质。在Illumina MiSeq仪器上对扩增子进行测序。在消除具有低质量得分的那些读段之后，将读段与参考基因组比对。将含有读段的所得文件映射到参考基因组(BAM文件)，其中选择与感兴趣的靶区域重叠的读段，并对野生型读段的数量与含有插入或缺失(插入缺失)的读段的数量进行计算。

编辑百分比(例如，“编辑效率”或“百分比编辑”)被定义为相对于包括野生型的序列读段总数的具有插入或缺失(“插入缺失”)的序列读段总数。

原位杂交分析

BaseScope(ACDbio,Newark,CA)是专门的RNA原位杂交技术，其可例如在含有插入转基因(hFIX)和来自插入位点(例如白蛋白的外显子1)的编码序列的杂交mRNA转录物中提供外显子连接的特异性检测。BaseScope用于测量表达杂交mRNA的肝脏细胞的百分比。

为了检测杂交mRNA，ACDbio(Newark，CA)设计了针对可能在插入双向构建体后出现的杂交mRNA的两种探针。一种探针被设计来检测由于在一个方向上插入构建体而产生的杂交mRNA，而另一种探针被设计来检测由于在另一方向上插入构建体而产生的杂交mRNA。收集不同组小鼠的肝脏并对其进行新鲜冷冻切片。根据制造商的方案，使用单个探针或合并的探针进行BaseScope测定。通过HALO软件对载片进行扫描和分析。此测定的背景(盐水处理的组)为0.58％。

实施例2-具有和不具有同源臂的插入模板的体外测试

在本实施例中，在存在或不存在LNP递送Cas9 mRNA和G000551的情况下，例如，如实施例1(n＝3)中所述，培养Hepa1-6细胞并用携带各种形式的插入模板(例如，具有单链基因组(“ssAAV”)或自身互补基因组(“scAAV”)的AAV处理。如实施例1中所述制备AAV和LNP。处理后，如实施例1中所述收集培养基以用于人因子IX水平。

Hepa1-6细胞是在培养中继续分裂的永生化小鼠肝脏细胞系。如图2所示(治疗后72小时的时间点)，仅包含200bp同源臂的载体(衍生自质粒P00204的scAAV)导致可检测到的hFIX表达。在本实验中使用衍生自P00123(缺乏同源臂的scAAV)和P00147(缺乏同源臂的ssAAV双向构建体)的AAV载体不会导致任何可检测到的hFIX表达。将细胞保持在培养中，并且在处理后30天重新测定时证实这些结果(数据未示出)。

实施例3-具有和不具有同源臂的插入模板的体内测试

在本实施例中，用衍生自与实施例2中体外测试相同的质粒(P00123、P00204和P00147)的AAV处理小鼠。如实施例1中所述制备给药材料并给药。向C57Bl/6小鼠(每组n＝5)各自给药3e11个载体基因组(vg/ms)，之后以4mg/kg的剂量(相对于总RNA货物含量)给药包含G000551(“G551”)的LNP。给药后四周，对动物实施安乐死，并收集肝脏组织和血清分别用于编辑和hFIX表达。

如图3A和表12所示，在用包含靶向鼠白蛋白内含子1的gRNA的LNP治疗的每组动物中，检测到肝脏编辑水平为约60％。然而，尽管每个治疗组中的编辑水平稳健且一致，但接受无同源臂的双向载体(衍生自P00147的ssAAV载体)与LNP治疗组合的动物导致在血清中的hFIX表达水平最高(图3B和表13)。

表12.％插入缺失

模板	平均插入缺失(％)	标准差插入缺失(％)
			scAAV平端(P00123)	66.72	4.09
ssAAV平端(P00147)	68.10	2.27
			ssAAV HR(P00204)	70.16	3.68
仅LNP	68.24	6.47
			载体	0.28	0.08

表13.因子IX水平

实施例4-具有和不具有同源臂的ssAAV插入模板的体内测试

在本实施例中描述的实验检查在体内将同源臂并入ssAAV载体的效果。

制备在本实验中使用的给药材料并如实施例1中所述给药。向C57Bl/6小鼠(每组n＝5)给药3e11 vg/ms，之后以0.5mg/kg的剂量(相对于总RNA货物含量)给药包含G000666(“G666”)或G000551(“G551”)的LNP。给药后四周，收集动物血清用于hFIX表达。

如图4A和表14所示，使用用于插入G551靶向的位点中的具有不对称同源臂的ssAAV载体(对于衍生自质粒P00350、P00356和P00362的载体分别为300/600bp臂、300/2000bp臂和300/1500bp臂)导致循环hFIX水平低于测定的检测下限。然而，使用不具有同源臂且在双向方向上具有两个hFIX开放阅读框(ORF)的ssAAV载体(衍生自P00147)导致每只动物中可检测到的hFIX循环水平。

类似地，与使用不具有同源臂的双向载体(衍生自P00147)相比，使用用于插入G666靶向的位点中的具有不对称同源臂的ssAAV载体(对于衍生自质粒P00353和P00354的载体分别为500bp臂和800bp臂)导致较低但可检测到的水平(参见图4B和表15)。

表14.-血清hFIX水平

AAV	平均血清FIX(ug/mL)	标准差血清FIX(ug/mL)
			P00147	5.13	1.31
P00350	-0.22	0.08
			P00356	-0.23	0.04
P00362	-0.09	0.16

表15.-血清hFIX水平

实施例5-原代小鼠肝细胞中跨靶位点的双向构建体的体外筛选

在证明缺乏同源臂的双向构建体表现优于具有其他构型的载体后，本实施例中描述的实验检查了改变用于形成hFIX与白蛋白外显子1之间的杂交转录物的剪接受体以及改变靶向CRISPR/Cas9介导的插入的gRNA的效果。利用原代小鼠肝细胞(PMH)中靶向鼠白蛋白内含子1的20种不同gRNA，在一组靶位点上测试这些不同的双向构建体。

如实施例1中所述制备本实施例中测试的ssAAV和脂质包递送材料并将其递送至PMH，其中AAV的MOI为1e5。处理后，收集分离的基因组DNA和细胞培养基分别用于编辑和转基因表达分析。每个载体包含可通过如实施例1中所述的基于萤光素酶的荧光检测来测量的报告基因，在图5C中绘制为相对萤光素酶单位(“RLU”)。载体包含在hFIX ORF的3'端融合的HiBit肽，其允许相对表达的灵敏检测。图5A提供了每个测试的载体的示意图。测试的gRNA显示在图5B和图5C中，对于表5中列出的那些使用缩短的数字(例如，其中省略前导零，例如其中“G551”对应于表5中的“G000551”)。

如图5B和表16所示，在每个测试的组合中，对于每个治疗组，检测到一致但不同水平的编辑。使用模板和指导RNA的各种组合进行的转基因表达在图5C和表17中示出。如图5D所示，显著水平的插入缺失形成不一定导致更有效的转基因表达。使用P00411和P00418衍生的模板，当不包括编辑低于10％的指导时，R²值分别为0.54和0.37。小鼠白蛋白剪接受体和人FIX剪接受体各自导致有效的转基因表达。

表16.-％插入缺失

表17.-萤光素酶水平

实施例6-跨靶位点的双向构建体的体内筛选

如实施例1所述制备本实施例中测试的ssAAV和LNP并将其递送至C57Bl/6小鼠，以评估体内跨靶位点的双向构建体的性能。给药后四周，对动物实施安乐死，并收集肝脏组织和血清分别用于编辑和hFIX表达。

在最初的实验中，将含有10种不同的靶向白蛋白内含子1的gRNA的10种不同的LNP制剂与衍生自P00147的ssAAV一起递送到小鼠。分别以3e11 vg/ms和4mg/kg(相对于总RNA货物含量)递送AAV和LNP(每组n＝5)。本实验中测试的gRNA示于图6中，并列表于表18中。如图6所示和如体外所观察到的，显著水平的插入缺失形成不能预测转基因的插入或表达。

在单独的实验中，在体内测试了实施例5中体外测试的靶向20个不同靶位点的一组20个gRNA。为此，将含有20个靶向白蛋白内含子1的gRNA的LNP制剂与衍生自P00147的ssAAV一起递送到小鼠。分别以3e11 vg/ms和1mg/kg(相对于总RNA货物含量)递送AAV和LNP。本实验中测试的gRNA示于图7A和图7B中。

如图7A所示并列表于表19中，在每个测试的LNP/载体组合中，对于每个治疗组，检测到不同水平的编辑。然而，如图7B和表20所示，并且与实施例5中所述的体外数据一致，较高水平的编辑不一定导致转基因在体内较高水平的表达，这指示编辑和插入/表达双向hFIX构建体之间缺乏相关性。实际上，如在图7D中提供的图中所看到的，实现的编辑量与hFIX表达量之间几乎没有相关性。特别地，当从分析中去除实现少于10％编辑的那些gRNA时，在本实验的编辑和表达数据集之间计算出R²值仅为0.34。有趣的是，如图7C所示，提供相关图，将实施例5的体外实验以RLU为单位测得的表达水平与本实验中检测到的体内转基因表达水平进行比较，R²值为0.70，这表明原代细胞筛选与体内治疗之间正相关。

为了评估双向构建体在细胞水平上的插入，使用原位杂交方法(BaseScope)对来自治疗动物的肝脏组织进行测定，例如，如实施例1中所述。此测定利用了可检测作为杂交转录物的hFIX转基因与小鼠白蛋白外显子1序列之间的连接的探针。如图8A所示，在同时接受AAV和LNP的动物中检测到对杂交转录物呈阳性的细胞。特别地，当施用单独的AAV时，不到1.0％的细胞对杂交转录物呈阳性。在施用包含G011723、G000551或G000666的LNP的情况下，4.9％、19.8％或52.3％的细胞对杂交转录物呈阳性。另外，如图8B所示，循环hFIX水平与对杂交转录物呈阳性的细胞数量相关。最后，所述测定利用可检测双向hFIX构建体在任一方向上的插入的合并的探针。然而，当使用仅检测单个方向的单个探针时，对杂交转录物呈阳性的细胞数量为约使用合并探针检测到的细胞数量的一半(在一个实施例中，为4.46％对9.68％)，这表明双向构建体确实能够以任一方向插入，从而产生与蛋白质水平上的转基因表达量相关的表达的杂交转录物。这些数据表明，达到的循环hFIX水平取决于用于插入的指导。

表18-hFIX血清水平和％插入缺失

表19-％肝脏编辑

表20.-血清hFIX水平

实施例7-AAV和LNP体内递送的时间

在本实施例中，在C57Bl/6小鼠中检查了递送包含双向hFIX构建体的ssAAV与LNP之间的时间。

如实施例1中所述制备本实施例中测试的ssAAV和LNP并将其递送至小鼠。LNP制剂含有G000551，并且双向模板作为衍生自P00147的ssAAV递送。分别以3e11 vg/ms和4mg/kg(相对于总RNA货物含量)递送AAV和LNP(每组n＝5)。“仅模板”队列仅接收AAV，并且“PBS”队列不接收AAV或LNP。一个队列在第0天顺序(相隔几分钟)接受AAV和LNP(“模板+LNP第0天”)；另一个队列在第0天接受AAV，在第1天接受LNP(“模板+LNP第1天”)；并且最后一个队列在第0天接受AAV，在第7天接受LNP(“模板+LNP第7天”)。在1周、2周和6周时，收集血浆用于hFIX表达分析。

如图9所示，除了在AAV递送后第7天接受LNP的队列的1周时间点外，在每次分析时在每个队列中均检测到hFIX。

实施例8-在递送AAV后LNP的多次给药

在本实施例中，检查了在施用ssAAV后重复给药LNP的效果。

如实施例1中所述制备本实施例中测试的ssAAV和LNP并将其递送至C57Bl/6小鼠。LNP制剂含有G000551，并且ssAAV衍生自P00147。分别以3e11 vg/ms和0.5mg/kg(相对于总RNA货物含量)递送AAV和LNP(每组n＝5)。“仅模板”队列仅接收AAV，并且“PBS”队列不接收AAV或LNP。一个队列在第0天顺序(间隔数分钟)接受AAV和LNP而无需进一步治疗(图10中的“模板+LNP(1x)”)；另一个队列在第0天顺序(间隔数分钟)接受AAV和LNP，并且在第7天接受第二剂量(图10中的“模板+LNP(2x)”)；并且最后一个队列在第0天顺序(间隔数分钟)接受AAV和LNP，在第7天接受第二剂量的LNP，并且在第14天接受第三剂量的LNP(图10中的“模板+LNP(3x)”)。在施用AAV后1周、2周、4周和6周，收集血浆用于hFIX表达分析。

如图10所示，在每次分析时在每个队列中均检测到hFIX，并且随后的多次剂量的LNP没有显著增加hFIX表达量。

实施例9-hFIX在体内表达的持久性

在本实施例中评估了hFIX表达在经治疗的动物中随时间的持久性。为此，作为一年持久性研究的一部分，在给药后在治疗的动物血清中测量hFIX。

如实施例1中所述制备本实施例中测试的ssAAV和LNP并将其递送至C57Bl/6小鼠。LNP制剂含有G000551，并且ssAAV衍生自P00147。以3e11 vg/ms递送AAV，并且以0.25mg/kg或1.0mg/kg(相对于总RNA货物含量)递送LNP(每组n＝5)。

如图11A和表21所示，两组在41周的每个评估时间点，hFIX表达都得以维持。在8周时观察到的水平下降被认为是由于ELISA分析的可变性。在第2周和第41周通过ELISA测量血清白蛋白水平，这表明循环白蛋白水平在整个研究中保持不变。

如图11B和表22所示，两组在52周的每个评估时间点，hFIX表达都得以维持。

表21 FIX水平

表22-FIX水平

实施例10-不同剂量的AAV和LNP在体内调节hFIX表达的效果

在本实施例中，在C57Bl/6小鼠中评估了改变AAV和LNP的剂量以调节hFIX表达的效果。

如实施例1中所述制备本实施例中测试的ssAAV和LNP并将其递送至小鼠。LNP制剂含有G000553，并且ssAAV衍生自P00147。以1e11 vg/ms、3e11 vg/ms、1e12 vg/ms或3e12vg/ms递送AAV，并且以0.1mg/kg、0.3mg/kg或1.0mg/kg(相对于总RNA货物含量)递送LNP(每组n＝5)。给药后两周，对动物实施安乐死。在两个时间点收集血清用于hFIX表达分析。

如图12A(1周)、图12B(2周)和表23所示，改变AAV或LNP的剂量可调节体内hFIX表达的量。

表23.–血清hFIX

实施例11-原代食蟹猴和原代人肝细胞中跨靶位点的双向构建体的体外筛选

在本实施例中，利用分别靶向原代cyno(PCH)和原代人肝细胞(PHH)中食蟹猴(“cyno”)和人白蛋白的内含子1的gRNA，在一组靶位点上测试包含双向构建体的ssAAV载体。

如实施例1中所述制备本实施例中测试的ssAAV和脂质包递送材料并将其递送至PCH和PHH。处理后，分别收集分离的基因组DNA和细胞培养基用于编辑和转基因表达分析。每个载体包含可通过如实施例1中所述的基于萤光素酶的荧光检测来测量的报告基因(衍生自质粒P00415)，在图13B和图14B中绘制为相对萤光素酶单位(“RLU”)。例如，AAV载体含有NanoLuc ORF(除了GFP)。图13B和图14B中提供了所测试的载体的示意图。表1和表7中列出的gRNA均使用缩短的数字显示在每个图中。

如针对PCH的图13A和针对PHH的图14A所示，对于所测试的每种组合，检测到不同水平的编辑(由于用于基于扩增子的测序的某些引物对的失败，在PCH实验中测试的一些组合的编辑数据未在图13A和表3中报告)。以图形显示在图13A和图14A中的编辑数据在下表3和表4中以数字再现。然而，如图13B、图13C以及图14B和图14C所示，显著水平的插入缺失形成不能预测转基因的插入或表达，这指示编辑和分别在PCH和PHH中双向构建体的插入/表达之间几乎没有相关性。作为一个量度，在图13C中计算出的R²值为0.13，并且图14D的R²值为0.22。

另外，利用靶向原代人肝细胞(PHH)中人白蛋白的内含子1的单个指导gRNA，在一组靶位点上测试包含双向构建体的ssAAV载体。

如实施例1中所述制备ssAAV和LNP材料并将其递送至PHH。处理后，分别收集分离的基因组DNA和细胞培养基用于编辑和转基因表达分析。每个载体包含可通过如实施例1中所述的基于萤光素酶的荧光检测来测量的报告基因(衍生自质粒P00415)，在图14D中绘制为相对萤光素酶单位(“RLU”)并列表于下表24中。例如，AAV载体含有NanoLuc ORF(除了GFP)。图13B和图14B中提供了所测试的载体的示意图。表1和表7中列出的gRNA均使用缩短的数字显示在图14D中。

实施例12-来自替代的安全港基因座的因子IX表达的体内测试

在本实施例中，评估了包含双向hFIX构建体的ssAAV在替代的安全港位点的插入。为了测试插入到替代的安全港基因座中，如上所述制备AAV。以3e11 vg/只小鼠的剂量给小鼠施用AAV，之后立即以0.3mg/kg的剂量施用由Cas9 mRNA和指导RNA配制的LNP。给药后4周将动物处死，并收集肝脏和血液样品。通过NGS确定肝脏样品中的编辑。通过ELISA确定血清中的人hFIX水平。NGS和ELISA数据显示hFIX在替代的安全港基因座中有效插入和表达。

实施例13-非人灵长类动物中人因子IX基因插入的体内测试

在本实施例中，进行8周的研究，以通过在各种指导下施用腺相关病毒(AAV)和/或脂质纳米颗粒(LNP)来评估食蟹猴中人因子IX基因插入和hFIX蛋白表达。用如上所述制备的LNP制剂和AAV制剂进行此研究。每个LNP制剂都含有Cas9 mRNA和指导RNA(gRNA)，其中mRNA:gRNA的重量比为2:1。ssAAV来源于P00147。

以n＝3的队列处理雄性食蟹猴。以表10所述的剂量通过缓慢推注注射或输注向动物给药AAV。AAV处理后，动物通过缓慢推注或输注接受如表10所述的缓冲液或LNP。

给药后两周，通过单次超声引导下穿刺活检收集肝脏标本。每个活检标本在液氮中快速冷冻，并储存在-86℃至-60℃下。如前所述，通过NGS测序对肝脏标本进行编辑分析。

对于因子IX ELISA分析，在给药后7天、14天、28天和56天从动物收集血液样品。在抽血后收集血液样品并处理成血浆，并保存在-86℃至-60℃下直至分析。

通过ELISA从血浆样品中确定总人因子IX水平。简而言之，Reacti-Bind 96孔微板(VWR目录号PI15041)涂覆有浓度为1μg/ml的捕获抗体(抗人因子IX抗体的小鼠mAB(HTI，目录号AHIX-5041))，然后使用含5％牛血清白蛋白的1x PBS封闭。接下来在单个孔中孵育稀释在食蟹猴血浆中的纯化的人因子IX蛋白(ERL，目录号HFIX1009，批次号HFIX4840)的测试样品或标准品。以100ng/ml的浓度吸附检测抗体(绵羊抗人因子9多克隆抗体，Abcam，目录号ab128048)。以100ng/mL使用二抗(具有HRP的驴抗绵羊IgG pAb，Abcam，目录号ab97125)。使用TMB底物试剂组(BD OptEIA目录号555214)显影板。在微板读取器(Molecular Devicesi3系统)上于450nm处分光光度法评估光密度，并使用SoftMax pro 6.4进行分析。

检测到插入缺失形成，从而确认发生编辑。NGS数据显示有效的插入缺失形成。通过ELISA测量NHP中白蛋白基因座中hFIX的表达，并在表11和图15中进行描述。hFIX的血浆水平达到了先前描述为治疗有效的水平(George等人,NEJM 377(23),2215-27,2017)。

根据测量，通过八周的研究，循环hFIX蛋白水平得以维持(参见图15，显示第7天、第14天、第28天和第56天的平均水平分别为约135ng/m、约140ng/m、约150ng/m和约110ng/mL)，使蛋白质水平达到约75ng/mL至约250ng/mL。血浆hFIX水平是使用比R338L功能过度的hFIX变体高约8倍的比活性来计算的(Simioni等人,NEJM 361(17),1671-75,2009)(其报道了hFIX–R338L的蛋白比活性为390±28U/毫克，并且野生型因子IX的蛋白比活性为45±2.4U/毫克。计算本实施例中测试的功能过度的因子IX变体的功能标准化因子IX活性，实验在8周的研究中达到了NHP中稳定的人因子IX蛋白水平，相当于野生型因子IX活性的约20-40％(范围跨越野生型因子IX活性的12-67％)。

表10肝脏中的编辑

表11.hFIX表达

实施例14-非人灵长类动物中因子IX插入的体内测试

在本实施例中，进行研究，以在各种指导(包括G009860和各种LNP组分)下施用衍生自P00147的ssAAV和/或CRISPR/Cas9脂质纳米颗粒(LNP)后评估食蟹猴中因子IX基因插入和hFIX蛋白表达。

通过NGS测量插入缺失形成，从而确认发生编辑。使用抗人因子IX抗体的小鼠mAB(HTI，目录号AHIX-5041)、绵羊抗人因子9多克隆抗体(Abcam，目录号ab128048)和具有HRP的驴抗绵羊IgG pAb(Abcam，目录号ab97125)通过ELISA从血浆样品中确定总人因子IX水平，如实施例13中所述。使用替代的CRISPR/Cas9 LNP从双向模板获得比实施例13的实验中达到的人FIX蛋白水平高>3倍的人FIX蛋白水平。在研究中，ELISA分析结果表明，至少在第14天和第28天的时间点在GHP中使用G009860达到处于或高于人FIX水平的正常范围(3-5ug/mL；Amiral等人,Clin.Chem.,30(9),1512-16,1984)的循环hFIX蛋白水平。初始数据表明，单次给药后第14天的循环人FIX蛋白水平为约3-4μg/mL，在研究的前28天维持水平(约3-5μg/mL)。通过相同的方法在研究结束时测量人FIX水平，并且数据呈现在表25中。还对另外的指导G009847、G009862和G009864进行测试，并且显示出有助于在NHP研究中插入表达FIX的模板。

表25.血清人因子IX蛋白水平–实施例13的ELISA方法

通过ELISA测量循环白蛋白水平，这指示基线白蛋白水平维持在28天。未经处理的动物中测试的白蛋白水平在研究中变化了±约15％。在治疗的动物中，循环白蛋白水平变化很小且没有超出正常范围，并且所述水平在一个月内恢复到基线。

还通过具有更大动态范围的夹心免疫测定法确定循环人FIX蛋白水平。简而言之，用1％ECL封闭剂(Sigma，GERPN2125)封闭MSD GOLD 96孔链霉亲和素SECTOR板(Meso ScaleDiagnostics，目录L15SA-1)。取出封闭溶液后，将生物素化的捕获抗体(Sino Biological，11503-R044)固定在板上。重组人FIX蛋白(酶研究实验室，HFIX 1009)用于制备0.5％ECL封闭剂中的校准标准品。洗涤后，将校准标准品和血浆样品添加到板中并孵育。洗涤后，将与磺基标签标记缀合的检测抗体(Haematologic Technologies，AHIX-5041)添加到孔中并孵育。在洗去任何未结合的检测抗体后，将读取缓冲器T施加到孔中。在没有任何另外的孵育的情况下，使用MSD Quick Plex SQ120仪器对板进行成像，并使用Discovery Workbench4.0软件包(Meso Scale Discovery)分析数据。浓度表示为平均计算浓度，以ug/m为单位。对于样品，除非用星号指示(在所述情况下，N＝2)，否则N＝3。表26描绘了如通过MSD ELISA测量的在治疗的研究组中来自白蛋白基因座的hFIX表达。

表26.血清人因子IX蛋白水平–MSD ELISA

实施例15-白蛋白人指导的脱靶分析

生化方法(参见例如，Cameron等人,Nature Methods.6,600-606；2017)用于确定由靶向白蛋白的Cas9裂解的潜在脱靶基因组位点。在此实验中，使用分离的HEK293基因组DNA筛选了13种靶向人白蛋白的sgRNA和具有已知脱靶特征的两个对照指导。表27示出了在生化分析中使用16nM指导浓度检测到的潜在脱靶位点的数量。所述测定识别所测试的sgRNA的潜在脱靶位点。

表27.脱靶分析

在已知的脱靶检测分析(诸如上面使用的生化方法)中，通常通过设计回收大量潜在的脱靶位点，以便为可在其他情况下(例如在感兴趣的原代细胞中)验证的潜在位点“广泛撒网”。例如，生化方法通常过多地表示潜在的脱靶位点数量，因为所述测定利用纯化的高分子量基因组DNA(不含细胞环境)，并且取决于所用的Cas9 RNP剂量。因此，可使用所鉴定的潜在脱靶位点的靶向测序来验证通过这些方法鉴定的潜在脱靶位点。

实施例16.使用人源化白蛋白小鼠筛选用于人F9体内插入的指导RNA

我们旨在鉴定hF9插入人白蛋白基因座的有效指导RNA。为此，我们利用了将小鼠白蛋白基因座替换为包括第一内含子的相应人白蛋白基因组序列的小鼠(ALB^hu/hu小鼠)。这允许我们在体内成年肝脏的情况下测试靶向人白蛋白的第一内含子的指导RNA的插入效率。使用ALB^hu/hu小鼠建立两个单独的小鼠实验，以筛选总共11个指导RNA，每个靶向人白蛋白基因座的第一内含子。在实验的第0天，将所有小鼠称重并通过尾静脉注射。在1周、3周、4周和6周通过尾出血收集血液，并分离血浆。将小鼠在第7周终止。通过腔静脉收集血液，并分离血浆。还解剖了肝脏和脾脏。

在第一实验中，如实施例1制备包含Cas9 mRNA和以下指导的6个LNP并对其进行测试：G009852、G009859、G009860、G009864、G009874和G012764。将LNP稀释至0.3mg/kg(使用的平均重量为30克)，并且以每只小鼠3E11个病毒基因组的剂量与包装有双向hF9插入模板的AAV8共注射。每组注射12至14周大的五只ALB^hu/hu雄性小鼠。来自同一队列的五只小鼠注射有AAV8，所述AAV8包装有可操作地连接到hF9的CAGG启动子，从而导致hF9的游离表达(每只小鼠3E11个病毒基因组)。有三个阴性对照组，其中每组三只小鼠注射有单独的缓冲液、单独的包装有双向hF9插入模板的AAV8或单独的LNP-G009874。

在实验中，如实施例1制备包含Cas9 mRNA和以下指导的以下LNP并对其进行测试：G009860、G012764、G009844、G009857、G012752、G012753和G012761。全部稀释至0.3mg/kg(使用的平均重量为40克)，并且以每只小鼠3E11个病毒基因组的剂量与包装有双向hF9插入模板的AAV8共注射。每组注射30周大的五只ALB^hu/hu雄性小鼠。来自同一队列的五只小鼠注射有AAV8，所述AAV8包装有可操作地连接到hF9的CAGG启动子，从而导致hF9的游离表达(每只小鼠3E11个病毒基因组)。有三个阴性对照组，其中每组三只小鼠注射有单独的缓冲液、单独的包装有双向hF9插入模板的AAV8或单独的LNP-G009874。

为了分析，进行ELISA以测量在每个时间点小鼠中循环的hFIX水平。为了此目的，使用人因子IX ELISA试剂盒(ab188393)，并且所有板均使用来自George King Bio-Medical的人汇集正常血浆作为阳性测定对照。图16A和图16B示出了注射后第6周每组中血浆样品中的人因子IX表达水平。与体外插入数据一致，当使用指导RNA G009852时，检测到低至无因子IX血清水平。与人白蛋白中缺少相邻的PAM序列一致，当使用指导RNA G009864时，无法检测到因子IX血清水平。使用指导RNA G009859、G009860、G009874和G0012764观察到各组血清中的因子IX表达。

将脾脏和所有肝脏的部分左外侧叶提交给下一代测序(NGS)分析。NGS用于评估在注射AAV-hF9供体和LNP-CRISPR/Cas9后第7周在人源化白蛋白基因座处有插入/缺失(插入缺失)的肝细胞百分比。与人白蛋白中缺少相邻的PAM序列一致，当使用指导RNA G009864时，在肝脏中未检测到编辑。使用指导RNA G009859、G009860、G009874和G012764(数据未示出)观察到各组肝脏中的编辑。

将剩余的肝脏在10％中性缓冲福尔马林中固定24小时，然后转移到70％乙醇中。切下来自不同叶的四到五个样品，并运送到HistoWisz，并且加工并包埋在石蜡块中。然后从每个石蜡块上切下5微米的切片，并在使用通过Advanced Cell Diagnostics的通用BASESCOPE^TM程序和试剂以及定制的探针的Ventana Ultra Discovery(Roche)上进行BASESCOPE^TM，当实现成功整合和转录时，所述探针靶向来自ALB^hu/hu白蛋白基因座第一内含子的人白蛋白信号序列与hF9转基因之间形成的独特mRNA连接。然后使用HALO成像软件(Indica Labs)来量化每个样品中阳性细胞的百分比。每只动物的多个叶中阳性细胞百分比的平均值接着在第7周与血清中的hFIX水平相关。结果示于图17和表28中。第7周的血清水平与hALB-hFIX mRNA的％阳性细胞强相关(r＝0.89；R²＝0.79)。

表28.第7周hFIX和BASESCOPE^TM数据。

实施例17-使用人源化白蛋白小鼠与F9敲除小鼠杂交以评估体内插入的人F9的功能性

为了下一步研究，在雄性ALB^ms/hu x F9^-/-小鼠中测试插入的hF9的功能性。如实施例1制备包含Cas9 mRNA和以下指导的LNP并对其进行测试：G009860(靶向人白蛋白基因座的第一内含子)和G000666(靶向小鼠白蛋白基因座的第一内含子)。将G009860稀释至0.3mg/kg并将G000666稀释至1.0mg/kg(使用的平均重量为31.2克)，并且两者都以每只小鼠3E11个病毒基因组的剂量与包装有双向hF9插入模板的AAV8共注射。每组注射五只ALB^ms ^/hu x F9^-/-雄性小鼠(16周大)。来自同一队列的五只小鼠注射有AAV8，所述AAV8包装有可操作地连接到hF9的CAGG启动子，从而导致hF9的游离表达(每只小鼠3E11个病毒基因组)。有六只阴性对照动物，其中每组一只小鼠注射单独的缓冲液或单独的包装有双向hF9插入模板的AAV8，并且每组两只小鼠分别以0.3mg/kg和1.0mg/kg注射单独的LNP-G009860或LNP-G000666。

为了分析，进行ELISA以测量在每个时间点小鼠中循环的hFIX水平。为了此目的，使用人因子IX ELISA试剂盒(ab188393)，并且所有板均使用来自George King Bio-Medical的人汇集正常血浆作为阳性测定对照。将脾脏和所有肝脏的部分左外侧叶提交给NGS分析。

图18和表29示出了注射后1周、2周和4周各组血浆样品中的人因子IX表达水平。另外，表29示出了NGS结果，其显示了肝脏和脾脏中白蛋白基因座处的插入和缺失(插入缺失)水平。如图18和表29所示，在1周、3周和4周时，在经处理的Alb^+/hu/F9^-/-小鼠的血浆中检测到hFIX，其中ELISA在1周、3周和4周时显示出表达值为0.5-10μg/mL。

表29.人FIX血浆水平和NGS结果。

将剩余的肝脏在10％中性缓冲福尔马林中固定24小时，然后转移到70％乙醇中。切下来自不同叶的四到五个样品，并运送到HistoWiz，并且加工并包埋在石蜡块中。然后从每个石蜡块上切下5微米的切片，以用于通过在使用通过Advanced Cell Diagnostics的通用BASESCOPE^TM程序和试剂以及定制的探针的Ventana Ultra Discovery(Roche)上进行分析，当实现成功整合和转录时，所述探针靶向来自ALB^ms/hu小鼠每个相应的白蛋白基因座第一内含子的人或小鼠白蛋白信号序列与hF9转基因之间形成的独特mRNA连接。使用HALO成像软件(Indica Labs)来量化每个样品中阳性细胞的百分比。

接下来，通过激活的部分凝血活酶时间(aPTT)和凝血酶生成测定(TGA)，将末梢血用于评估功能性凝血活性。激活的部分凝血活酶时间(aPTT)是血浆中内在途径凝血活性的临床测量。通过添加鞣花酸或高岭土诱导血浆凝结，两者均激活凝血的内在途径(称为接触途径)中的凝血因子XII，一旦凝血酶被激活，其随后导致从纤维蛋白原生成纤维蛋白。aPTT测定提供估计个体产生血块的能力，并且此信息可用于确定出血或血栓形成的风险。为了测试aPTT，使用半自动台式系统(Diagnostica Stago STart 4)和机电血块检测方法(基于粘度的检测系统)来评估血浆中的凝结。对于具有钢球的每个比色皿，添加50μL柠檬酸血浆并在37℃下孵育5min，然后在37℃下添加50μL鞣花酸(最终浓度为30μM)300秒的情况下触发凝结。°°通过向每个比色皿中添加50μL的0.025M氯化钙(最终浓度为8mM)最终激活凝结后，钢球开始在两个驱动线圈之间来回摆动。球的运动由接收线圈检测。纤维蛋白的产生增加血浆粘度，直到球停止运动为止，这被记录为凝结时间。测量的唯一参数是凝结时间。一式两份进行试验。

凝血酶生成测定(TGA)是对激活的血浆中凝血酶生成动力学的非临床评估。凝血酶生成是凝血的重要过程，因为凝血酶负责激活其他凝血因子，并传播另外的凝血酶(通过FXI激活)以将纤维蛋白原转化为纤维蛋白。凝血酶生成测定提供估计个体产生凝血酶的能力，并且此信息可用于确定出血或血栓形成的风险。为了进行TGA，在分光光度计(Thrombinograph^TM，Thermo Scientific)中使用校准的自动血栓图评估凝血酶的生成水平。对于高通量实验，使用96孔板(Immulon II HB)。向每个孔添加55μL柠檬酸血浆(对于小鼠血浆用生理盐水4x稀释)并在37℃下孵育30min。在37℃下添加15μL的2μM鞣花酸(最终浓度为0.33μM)45min的情况下触发凝血酶生成。在将15μL含16mM CaCl₂(FluCa；凝血酶镜BV)的荧光底物自动注入到每个孔中后确定凝血酶生成。荧光底物与所生成的凝血酶反应，在460nm处每33秒在血浆中连续对其进行测量90min。荧光强度与凝血酶的蛋白水解活性成正比。在追踪中测量的主要参数为滞后时间、凝血酶生成峰值、凝血酶生成达峰时间和内源凝血酶能力(ETP)。滞后时间提供了对血浆中凝血酶的初始检测所需时间的估计。峰值是激活后在给定时间生成的最大凝血酶量。凝血酶生成达峰时间是从凝血级联反应开始到凝血酶的生成峰值的时间。ETP是所测量的60分钟内生成的凝血酶总量。一式两份进行试验。

如图19和表30所示，使用例如G000666插入hF9转基因显示了在aPTT测定中恢复的凝血功能。仅AAV和仅LNP的阴性对照样品显示了盐水中延长的aPTT时间为45-60秒。阳性对照CAGG和测试样品AAV8+LNP接近正常人的aPTT，为28-34秒。

表30.aPTT和TGA-EA。

如图20A、图20B和图21以及表30所示，使用例如G000666插入hF9转基因在TGA-EA分析中显示出增加的凝血酶生成。与阴性对照样品相比，阳性对照CAGG和AAV8+LNP中的凝血酶浓度更高。

总之，在1周、3周和4周时，在Alb^+/hu/F9^-/-小鼠血浆中检测到hFIX，并且发现表达的hFIX-R338L具有功能，因为在TGA测定中生成了凝血酶，并且aPTT凝血时间得到改善。

人白蛋白内含子1：(SEQ ID NO:1)

GTAAGAAATCCATTTTTCTATTGTTCAACTTTTATTCTATTTTCCCAGTAAAATAAAGTTTTAGTAAACTCTGCATCTTTAAAGAATTATTTTGGCATTTATTTCTAAAATGGCATAGTATTTTGTATTTGTGAAGTCTTACAAGGTTATCTTATTAATAAAATTCAAACATCCTAGGTAAAAAAAAAAAAAGGTCAGAATTGTTTAGTGACTGTAATTTTCTTTTGCGCACTAAGGAAAGTGCAAAGTAACTTAGAGTGACTGAAACTTCACAGAATAGGGTTGAAGATTGAATTCATAACTATCCCAAAGACCTATCCATTGCACTATGCTTTATTTAAAAACCACAAAACCTGTGCTGTTGATCTCATAAATAGAACTTGTATTTATATTTATTTTCATTTTAGTCTGTCTTCTTGGTTGCTGTTGATAGACACTAAAAGAGTATTAGATATTATCTAAGTTTGAATATAAGGCTATAAATATTTAATAATTTTTAAAATAGTATTCTTGGTAATTGAATTATTCTTCTGTTTAAAGGCAGAAGAAATAATTGAACATCATCCTGAGTTTTTCTGTAGGAATCAGAGCCCAATATTTTGAAACAAATGCATAATCTAAGTCAAATGGAAAGAAATATAAAAAGTAACATTATTACTTCTTGTTTTCTTCAGTATTTAACAATCCTTTTTTTTCTTCCCTTGCCCAG

表5.小鼠白蛋白指导RNA

表6.小鼠白蛋白sgRNA和修饰模式

表7.食蟹猴白蛋白指导RNA

表8.食蟹猴sgRNA和修饰模式

表9.载体组分和序列

5’ITR序列(SEQ ID NO:263)：

TTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCT

小鼠白蛋白剪接受体(第1方向)(SEQ ID NO:264)：

TAGGTCAGTGAAGAGAAGAACAAAAAGCAGCATATTACAGTTAGTTGTCTTCATCAATCTTTAAATATGTTGTGTGGTTTTTCTCTCCCTGTTTCCACAG

人因子IX(R338L)，第1方向(SEQ ID NO:265)：

TTTCTTGATCATGAAAACGCCAACAAAATTCTGAATCGGCCAAAGAGGTATAATTCAGGTAAATTGGAAGAGTTTGTTCAAGGGAACCTTGAGAGAGAATGTATGGAAGAAAAGTGTAGTTTTGAAGAAGCACGAGAAGTTTTTGAAAACACTGAAAGAACAACTGAATTTTGGAAGCAGTATGTTGATGGAGATCAGTGTGAGTCCAATCCATGTTTAAATGGCGGCAGTTGCAAGGATGACATTAATTCCTATGAATGTTGGTGTCCCTTTGGATTTGAAGGAAAGAACTGTGAATTAGATGTAACATGTAACATTAAGAATGGCAGATGCGAGCAGTTTTGTAAAAATAGTGCTGATAACAAGGTGGTTTGCTCCTGTACTGAGGGATATCGACTTGCAGAAAACCAGAAGTCCTGTGAACCAGCAGTGCCATTTCCATGTGGAAGAGTTTCTGTTTCACAAACTTCTAAGCTCACCCGTGCTGAGACTGTTTTTCCTGATGTGGACTATGTAAATTCTACTGAAGCTGAAACCATTTTGGATAACATCACTCAAAGCACCCAATCATTTAATGACTTCACTCGGGTTGTTGGTGGAGAAGATGCCAAACCAGGTCAATTCCCTTGGCAGGTTGTTTTGAATGGTAAAGTTGATGCATTCTGTGGAGGCTCTATCGTTAATGAAAAATGGATTGTAACTGCTGCCCACTGTGTTGAAACTGGTGTTAAAATTACAGTTGTCGCAGGTGAACATAATATTGAGGAGACAGAACATACAGAGCAAAAGCGAAATGTGATTCGAATTATTCCTCACCACAACTACAATGCAGCTATTAATAAGTACAACCATGACATTGCCCTTCTGGAACTGGACGAACCCTTAGTGCTAAACAGCTACGTTACACCTATTTGCATTGCTGACAAGGAATACACGAACATCTTCCTCAAATTTGGATCTGGCTATGTAAGTGGCTGGGGAAGAGTCTTCCACAAAGGGAGATCAGCTTTAGTTCTTCAGTACCTTAGAGTTCCACTTGTTGACCGAGCCACATGTCTTCTATCTACAAAGTTCACCATCTATAACAACATGTTCTGTGCTGGCTTCCATGAAGGAGGTAGAGATTCATGTCAAGGAGATAGTGGGGGACCCCATGTTACTGAAGTGGAAGGGACCAGTTTCTTAACTGGAATTATTAGCTGGGGTGAAGAGTGTGCAATGAAAGGCAAATATGGAATATATACCAAGGTATCCCGGTATGTCAACTGGATTAAGGAAAAAACAAAGCTCACTTAA

Poly-A(第1方向)(SEQ ID NO:266)：

CCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGCTTCTGAGGCGGAAAGAACCAGCTGGGGCTCTAGGGGGTATCCCC

Poly-A(第2方向)(SEQ ID NO:267)：

AAAAAACCTCCCACACCTCCCCCTGAACCTGAAACATAAAATGAATGCAATTGTTGTTGTTAACTTGTTTATTGCAGCTTATAATGGTTACAAATAAAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATCTTATCATGTCTG

人因子IX(R338L)，第2方向(SEQ ID NO:268)：

TTAGGTGAGCTTAGTCTTTTCTTTTATCCAATTCACGTAGCGAGAGACCTTCGTATAGATGCCATATTTCCCCTTCATCGCACATTCCTCCCCCCAACTTATTATCCCGGTCAAGAAACTTGTTCCTTCGACTTCAGTGACGTGTGGTCCACCTGAATCACCTTGGCATGAGTCGCGACCGCCCTCGTGAAACCCAGCACAAAACATGTTATTGTAAATCGTAAATTTCGTGGACAGAAGACAGGTCGCTCTATCGACCAACGGGACGCGCAAATATTGCAGAACGAGGGCTGATCGACCTTTGTGGAAGACCCGCCCCCACCCACTCACATATCCGCTCCCAAATTTCAAGAAGATATTTGTATATTCTTTATCGGCTATACAAATCGGGGTAACATAGGAGTTAAGTACGAGTGGCTCGTCCAGCTCCAGGAGGGCTATATCATGGTTGTACTTGTTTATAGCGGCATTATAATTGTGATGGGGTATGATCCTGATAACATTCCTTTTCTGTTCAGTATGCTCAGTTTCTTCAATGTTGTGTTCGCCAGCCACGACCGTAATCTTAACCCCCGTCTCGACACAGTGTGCGGCCGTTACAATCCACTTTTCATTGACTATGGAGCCCCCACAAAACGCGTCGACTTTTCCGTTGAGCACCACCTGCCATGGAAATTGGCCAGGTTTAGCGTCCTCGCCCCCGACAACCCTAGTAAAGTCATTAAATGACTGTGTGGATTGTGTTATATTATCAAGAATCGTTTCGGCTTCAGTAGAGTTAACGTAGTCCACATCGGGAAAAACTGTCTCGGCCCTTGTCAACTTTGATGTCTGGGACACACTTACCCGACCGCACGGGAAGGGCACCGCCGGTTCACAGCTCTTTTGATTCTCAGCGAGCCGGTAGCCCTCAGTGCAACTACACACAACTTTGTTGTCGGCGGAATTTTTACAGAATTGCTCGCATCGTCCATTTTTAATGTTGCAGGTGACGTCCAACTCGCAGTTTTTTCCTTCAAAACCAAAAGGGCACCAACACTCGTAGGAATTTATATCGTCTTTACAACTCCCCCCATTCAGACATGGATTAGATTCGCATTGGTCCCCATCGACATATTGCTTCCAGAACTCAGTGGTCCGTTCTGTATTCTCAAACACCTCGCGCGCTTCTTCAAAACTGCATTTTTCCTCCATACACTCTCGCTCCAAGTTCCCTTGCACGAATTCTTCAAGCTTTCCTGAGTTATACCTTTTAGGCCGGTTAAGTATCTTATTCGCGTTTTCGTGGTCCAGAAA

小鼠白蛋白剪接受体(第2方向)(SEQ ID NO:269)：

CTGTGGAAACAGGGAGAGAAAAACCACACAACATATTTAAAGATTGATGAAGACAACTAACTGTAATATGCTGCTTTTTGTTCTTCTCTTCACTGACCTA

3’ITR序列(SEQ ID NO:270)：

AGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAA

人因子IX剪接受体(第1方向)(SEQ ID NO:271)：

GATTATTTGGATTAAAAACAAAGACTTTCTTAAGAGATGTAAAATTTTCATGATGTTTTCTTTTTTGCTAAAACTAAAGAATTATTCTTTTACATTTCAG

人因子IX(R338L)-HiBit(第1方向)(SEQ ID NO:272)：

TTTCTTGATCATGAAAACGCCAACAAAATTCTGAATCGGCCAAAGAGGTATAATTCAGGTAAATTGGAAGAGTTTGTTCAAGGGAACCTTGAGAGAGAATGTATGGAAGAAAAGTGTAGTTTTGAAGAAGCACGAGAAGTTTTTGAAAACACTGAAAGAACAACTGAATTTTGGAAGCAGTATGTTGATGGAGATCAGTGTGAGTCCAATCCATGTTTAAATGGCGGCAGTTGCAAGGATGACATTAATTCCTATGAATGTTGGTGTCCCTTTGGATTTGAAGGAAAGAACTGTGAATTAGATGTAACATGTAACATTAAGAATGGCAGATGCGAGCAGTTTTGTAAAAATAGTGCTGATAACAAGGTGGTTTGCTCCTGTACTGAGGGATATCGACTTGCAGAAAACCAGAAGTCCTGTGAACCAGCAGTGCCATTTCCATGTGGAAGAGTTTCTGTTTCACAAACTTCTAAGCTCACCCGTGCTGAGACTGTTTTTCCTGATGTGGACTATGTAAATTCTACTGAAGCTGAAACCATTTTGGATAACATCACTCAAAGCACCCAATCATTTAATGACTTCACTCGGGTTGTTGGTGGAGAAGATGCCAAACCAGGTCAATTCCCTTGGCAGGTTGTTTTGAATGGTAAAGTTGATGCATTCTGTGGAGGCTCTATCGTTAATGAAAAATGGATTGTAACTGCTGCCCACTGTGTTGAAACTGGTGTTAAAATTACAGTTGTCGCAGGTGAACATAATATTGAGGAGACAGAACATACAGAGCAAAAGCGAAATGTGATTCGAATTATTCCTCACCACAACTACAATGCAGCTATTAATAAGTACAACCATGACATTGCCCTTCTGGAACTGGACGAACCCTTAGTGCTAAACAGCTACGTTACACCTATTTGCATTGCTGACAAGGAATACACGAACATCTTCCTCAAATTTGGATCTGGCTATGTAAGTGGCTGGGGAAGAGTCTTCCACAAAGGGAGATCAGCTTTAGTTCTTCAGTACCTTAGAGTTCCACTTGTTGACCGAGCCACATGTCTTCTATCTACAAAGTTCACCATCTATAACAACATGTTCTGTGCTGGCTTCCATGAAGGAGGTAGAGATTCATGTCAAGGAGATAGTGGGGGACCCCATGTTACTGAAGTGGAAGGGACCAGTTTCTTAACTGGAATTATTAGCTGGGGTGAAGAGTGTGCAATGAAAGGCAAATATGGAATATATACCAAGGTCTCCCGGTATGTCAACTGGATTAAGGAAAAAACAAAGCTCACTGTCAGCGGATGGAGACTGTTCAAGAAGATCAGCTAA人因子IX(R338L)-HiBit(第2方向)(SEQ ID NO:273)：

TTAGGAAATCTTCTTAAACAGCCGCCAGCCGCTCACGGTGAGCTTAGTCTTTTCTTTTATCCAATTCACGTAGCGAGAGACCTTCGTATAGATGCCATATTTCCCCTTCATCGCACATTCCTCCCCCCAACTTATTATCCCGGTCAAGAAACTTGTTCCTTCGACTTCAGTGACGTGTGGTCCACCTGAATCACCTTGGCATGAGTCGCGACCGCCCTCGTGAAACCCAGCACAAAACATGTTATTGTAAATCGTAAATTTCGTGGACAGAAGACAGGTCGCTCTATCGACCAACGGGACGCGCAAATATTGCAGAACGAGGGCTGATCGACCTTTGTGGAAGACCCGCCCCCACCCACTCACATATCCGCTCCCAAATTTCAAGAAGATATTTGTATATTCTTTATCGGCTATACAAATCGGGGTAACATAGGAGTTAAGTACGAGTGGCTCGTCCAGCTCCAGGAGGGCTATATCATGGTTGTACTTGTTTATAGCGGCATTATAATTGTGATGGGGTATGATCCTGATAACATTCCTTTTCTGTTCAGTATGCTCAGTTTCTTCAATGTTGTGTTCGCCAGCCACGACCGTAATCTTAACCCCCGTCTCGACACAGTGTGCGGCCGTTACAATCCACTTTTCATTGACTATGGAGCCCCCACAAAACGCGTCGACTTTTCCGTTGAGCACCACCTGCCATGGAAATTGGCCAGGTTTAGCGTCCTCGCCCCCGACAACCCTAGTAAAGTCATTAAATGACTGTGTGGATTGTGTTATATTATCAAGAATCGTTTCGGCTTCAGTAGAGTTAACGTAGTCCACATCGGGAAAAACTGTCTCGGCCCTTGTCAACTTTGATGTCTGGGACACACTTACCCGACCGCACGGGAAGGGCACCGCCGGTTCACAGCTCTTTTGATTCTCAGCGAGCCGGTAGCCCTCAGTGCAACTACACACAACTTTGTTGTCGGCGGAATTTTTACAGAATTGCTCGCATCGTCCATTTTTAATGTTGCAGGTGACGTCCAACTCGCAGTTTTTTCCTTCAAAACCAAAAGGGCACCAACACTCGTAGGAATTTATATCGTCTTTACAACTCCCCCCATTCAGACATGGATTAGATTCGCATTGGTCCCCATCGACATATTGCTTCCAGAACTCAGTGGTCCGTTCTGTATTCTCAAACACCTCGCGCGCTTCTTCAAAACTGCATTTTTCCTCCATACACTCTCGCTCCAAGTTCCCTTGCACGAATTCTTCAAGCTTTCCTGAGTTATACCTTTTAGGCCGGTTAAGTATCTTATTCGCGTTTTCGTGGTCCAGAAA

人因子IX剪接受体(第2方向)(SEQ ID NO:274)：

CTGAAATGTAAAAGAATAATTCTTTAGTTTTAGCAAAAAAGAAAACATCATGAAAATTTTACATCTCTTAAGAAAGTCTTTGTTTTTAATCCAAATAATC

Nluc-P2A-GFP(第1方向)(SEQ ID NO:275)：

TTTCTTGATCATGAAAACGCCAACAAAATTCTGAATCGGCCAAAGAGGTATAATTCAGGTAAATTGGAAGAGTTTGTTCAAGGGAACCTTGAGAGAGAATGTATGGAAGAAAAGTGTAGTTTTGAAGAAGCAGTATTCACTTTGGAGGACTTTGTCGGTGACTGGAGGCAAACCGCTGGTTATAATCTCGACCAAGTACTGGAACAGGGCGGGGTAAGTTCCCTCTTTCAGAATTTGGGTGTAAGCGTCACACCAATCCAGCGGATTGTGTTGTCTGGAGAGAACGGACTCAAAATTGACATCCATGTTATCATTCCATATGAAGGTCTCAGTGGAGACCAAATGGGGCAGATCGAGAAGATTTTCAAGGTAGTTTACCCAGTCGACGATCACCACTTCAAAGTCATTCTCCACTATGGCACACTTGTTATCGACGGAGTAACTCCTAATATGATTGATTACTTTGGTCGCCCGTATGAGGGCATCGCAGTGTTTGATGGCAAAAAGATCACCGTAACAGGAACGTTGTGGAATGGGAACAAGATAATCGACGAGAGATTGATAAATCCAGACGGGTCACTCCTGTTCAGGGTTACAATTAACGGCGTCACAGGATGGAGACTCTGTGAACGAATACTGGCCACAAATTTTTCACTCCTGAAGCAGGCCGGAGACGTGGAGGAAAACCCAGGGCCCGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGGGAGGAGGAAGCCCGAAGAAGAAGAGAAAGGTCTAA

Nluc-P2A-GFP(第2方向)(SEQ ID NO:276)：

TTACACCTTCCTCTTCTTCTTGGGGCTGCCGCCGCCCTTGTACAGCTCGTCCATGCCCAGGGTGATGCCGGCGGCGGTCACGAACTCCAGCAGCACCATGTGGTCCCTCTTCTCGTTGGGGTCCTTGCTCAGGGCGCTCTGGGTGCTCAGGTAGTGGTTGTCGGGCAGCAGCACGGGGCCGTCGCCGATGGGGGTGTTCTGCTGGTAGTGGTCGGCCAGCTGCACGCTGCCGTCCTCGATGTTGTGCCTGATCTTGAAGTTCACCTTGATGCCGTTCTTCTGCTTGTCGGCCATGATGTACACGTTGTGGCTGTTGTAGTTGTACTCCAGCTTGTGGCCCAGGATGTTGCCGTCCTCCTTGAAGTCGATGCCCTTCAGCTCGATCCTGTTCACCAGGGTGTCGCCCTCGAACTTCACCTCGGCCCTGGTCTTGTAGTTGCCGTCGTCCTTGAAGAAGATGGTCCTCTCCTGCACGTAGCCCTCGGGCATGGCGCTCTTGAAGAAGTCGTGCTGCTTCATGTGGTCGGGGTACCTGCTGAAGCACTGCACGCCGTAGGTCAGGGTGGTCACCAGGGTGGGCCAGGGCACGGGCAGCTTGCCGGTGGTGCAGATGAACTTCAGGGTCAGCTTGCCGTAGGTGGCGTCGCCCTCGCCCTCGCCGCTCACGCTGAACTTGTGGCCGTTCACGTCGCCGTCCAGCTCCACCAGGATGGGCACCACGCCGGTGAACAGCTCCTCGCCCTTGCTCACGGGGCCGGGGTTCTCCTCCACGTCGCCGGCCTGCTTCAGCAGGCTGAAGTTGGTGGCCAGGATCCTCTCGCACAGCCTCCAGCCGGTCACGCCGTTGATGGTCACCCTGAACAGCAGGCTGCCGTCGGGGTTGATCAGCCTCTCGTCGATGATCTTGTTGCCGTTCCACAGGGTGCCGGTCACGGTGATCTTCTTGCCGTCGAACACGGCGATGCCCTCGTAGGGCCTGCCGAAGTAGTCGATCATGTTGGGGGTCACGCCGTCGATCACCAGGGTGCCGTAGTGCAGGATCACCTTGAAGTGGTGGTCGTCCACGGGGTACACCACCTTGAAAATCTTCTCGATCTGGCCCATCTGGTCGCCGCTCAGGCCCTCGTAGGGGATGATCACGTGGATGTCGATCTTCAGGCCGTTCTCGCCGCTCAGCACGATCCTCTGGATGGGGGTCACGCTCACGCCCAGGTTCTGGAACAGGCTGCTCACGCCGCCCTGCTCCAGCACCTGGTCCAGGTTGTAGCCGGCGGTCTGCCTCCAGTCGCCCACGAAGTCCTCCAGGGTGAACACGGCCTCCTCGAAGCTGCACTTCTCCTCCATGCACTCCCTCTCCAGGTTGCCCTGCACGAACTCCTCCAGCTTGCCGCTGTTGTACCTCTTGGGCCTGTTCAGGATCTTGTTGGCGTTCTCGTGGTCCAGGAA

P00147全序列(从ITR到ITR)：(SEQ ID NO:277)

TTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTAGATCTCTTAGGTCAGTGAAGAGAAGAACAAAAAGCAGCATATTACAGTTAGTTGTCTTCATCAATCTTTAAATATGTTGTGTGGTTTTTCTCTCCCTGTTTCCACAGTTTTTCTTGATCATGAAAACGCCAACAAAATTCTGAATCGGCCAAAGAGGTATAATTCAGGTAAATTGGAAGAGTTTGTTCAAGGGAACCTTGAGAGAGAATGTATGGAAGAAAAGTGTAGTTTTGAAGAAGCACGAGAAGTTTTTGAAAACACTGAAAGAACAACTGAATTTTGGAAGCAGTATGTTGATGGAGATCAGTGTGAGTCCAATCCATGTTTAAATGGCGGCAGTTGCAAGGATGACATTAATTCCTATGAATGTTGGTGTCCCTTTGGATTTGAAGGAAAGAACTGTGAATTAGATGTAACATGTAACATTAAGAATGGCAGATGCGAGCAGTTTTGTAAAAATAGTGCTGATAACAAGGTGGTTTGCTCCTGTACTGAGGGATATCGACTTGCAGAAAACCAGAAGTCCTGTGAACCAGCAGTGCCATTTCCATGTGGAAGAGTTTCTGTTTCACAAACTTCTAAGCTCACCCGTGCTGAGACTGTTTTTCCTGATGTGGACTATGTAAATTCTACTGAAGCTGAAACCATTTTGGATAACATCACTCAAAGCACCCAATCATTTAATGACTTCACTCGGGTTGTTGGTGGAGAAGATGCCAAACCAGGTCAATTCCCTTGGCAGGTTGTTTTGAATGGTAAAGTTGATGCATTCTGTGGAGGCTCTATCGTTAATGAAAAATGGATTGTAACTGCTGCCCACTGTGTTGAAACTGGTGTTAAAATTACAGTTGTCGCAGGTGAACATAATATTGAGGAGACAGAACATACAGAGCAAAAGCGAAATGTGATTCGAATTATTCCTCACCACAACTACAATGCAGCTATTAATAAGTACAACCATGACATTGCCCTTCTGGAACTGGACGAACCCTTAGTGCTAAACAGCTACGTTACACCTATTTGCATTGCTGACAAGGAATACACGAACATCTTCCTCAAATTTGGATCTGGCTATGTAAGTGGCTGGGGAAGAGTCTTCCACAAAGGGAGATCAGCTTTAGTTCTTCAGTACCTTAGAGTTCCACTTGTTGACCGAGCCACATGTCTTCTATCTACAAAGTTCACCATCTATAACAACATGTTCTGTGCTGGCTTCCATGAAGGAGGTAGAGATTCATGTCAAGGAGATAGTGGGGGACCCCATGTTACTGAAGTGGAAGGGACCAGTTTCTTAACTGGAATTATTAGCTGGGGTGAAGAGTGTGCAATGAAAGGCAAATATGGAATATATACCAAGGTATCCCGGTATGTCAACTGGATTAAGGAAAAAACAAAGCTCACTTAACCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGCTTCTGAGGCGGAAAGAACCAGCTGGGGCTCTAGGGGGTATCCCCAAAAAACCTCCCACACCTCCCCCTGAACCTGAAACATAAAATGAATGCAATTGTTGTTGTTAACTTGTTTATTGCAGCTTATAATGGTTACAAATAAAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATCTTATCATGTCTGTTAGGTGAGCTTAGTCTTTTCTTTTATCCAATTCACGTAGCGAGAGACCTTCGTATAGATGCCATATTTCCCCTTCATCGCACATTCCTCCCCCCAACTTATTATCCCGGTCAAGAAACTTGTTCCTTCGACTTCAGTGACGTGTGGTCCACCTGAATCACCTTGGCATGAGTCGCGACCGCCCTCGTGAAACCCAGCACAAAACATGTTATTGTAAATCGTAAATTTCGTGGACAGAAGACAGGTCGCTCTATCGACCAACGGGACGCGCAAATATTGCAGAACGAGGGCTGATCGACCTTTGTGGAAGACCCGCCCCCACCCACTCACATATCCGCTCCCAAATTTCAAGAAGATATTTGTATATTCTTTATCGGCTATACAAATCGGGGTAACATAGGAGTTAAGTACGAGTGGCTCGTCCAGCTCCAGGAGGGCTATATCATGGTTGTACTTGTTTATAGCGGCATTATAATTGTGATGGGGTATGATCCTGATAACATTCCTTTTCTGTTCAGTATGCTCAGTTTCTTCAATGTTGTGTTCGCCAGCCACGACCGTAATCTTAACCCCCGTCTCGACACAGTGTGCGGCCGTTACAATCCACTTTTCATTGACTATGGAGCCCCCACAAAACGCGTCGACTTTTCCGTTGAGCACCACCTGCCATGGAAATTGGCCAGGTTTAGCGTCCTCGCCCCCGACAACCCTAGTAAAGTCATTAAATGACTGTGTGGATTGTGTTATATTATCAAGAATCGTTTCGGCTTCAGTAGAGTTAACGTAGTCCACATCGGGAAAAACTGTCTCGGCCCTTGTCAACTTTGATGTCTGGGACACACTTACCCGACCGCACGGGAAGGGCACCGCCGGTTCACAGCTCTTTTGATTCTCAGCGAGCCGGTAGCCCTCAGTGCAACTACACACAACTTTGTTGTCGGCGGAATTTTTACAGAATTGCTCGCATCGTCCATTTTTAATGTTGCAGGTGACGTCCAACTCGCAGTTTTTTCCTTCAAAACCAAAAGGGCACCAACACTCGTAGGAATTTATATCGTCTTTACAACTCCCCCCATTCAGACATGGATTAGATTCGCATTGGTCCCCATCGACATATTGCTTCCAGAACTCAGTGGTCCGTTCTGTATTCTCAAACACCTCGCGCGCTTCTTCAAAACTGCATTTTTCCTCCATACACTCTCGCTCCAAGTTCCCTTGCACGAATTCTTCAAGCTTTCCTGAGTTATACCTTTTAGGCCGGTTAAGTATCTTATTCGCGTTTTCGTGGTCCAGAAAAACTGTGGAAACAGGGAGAGAAAAACCACACAACATATTTAAAGATTGATGAAGACAACTAACTGTAATATGCTGCTTTTTGTTCTTCTCTTCACTGACCTAAGAGATCTAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAA

P00411全序列(从ITR到ITR)：(SEQ ID NO:278)

TTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTAGATCTCTGATTATTTGGATTAAAAACAAAGACTTTCTTAAGAGATGTAAAATTTTCATGATGTTTTCTTTTTTGCTAAAACTAAAGAATTATTCTTTTACATTTCAGTTTTTCTTGATCATGAAAACGCCAACAAAATTCTGAATCGGCCAAAGAGGTATAATTCAGGTAAATTGGAAGAGTTTGTTCAAGGGAACCTTGAGAGAGAATGTATGGAAGAAAAGTGTAGTTTTGAAGAAGCACGAGAAGTTTTTGAAAACACTGAAAGAACAACTGAATTTTGGAAGCAGTATGTTGATGGAGATCAGTGTGAGTCCAATCCATGTTTAAATGGCGGCAGTTGCAAGGATGACATTAATTCCTATGAATGTTGGTGTCCCTTTGGATTTGAAGGAAAGAACTGTGAATTAGATGTAACATGTAACATTAAGAATGGCAGATGCGAGCAGTTTTGTAAAAATAGTGCTGATAACAAGGTGGTTTGCTCCTGTACTGAGGGATATCGACTTGCAGAAAACCAGAAGTCCTGTGAACCAGCAGTGCCATTTCCATGTGGAAGAGTTTCTGTTTCACAAACTTCTAAGCTCACCCGTGCTGAGACTGTTTTTCCTGATGTGGACTATGTAAATTCTACTGAAGCTGAAACCATTTTGGATAACATCACTCAAAGCACCCAATCATTTAATGACTTCACTCGGGTTGTTGGTGGAGAAGATGCCAAACCAGGTCAATTCCCTTGGCAGGTTGTTTTGAATGGTAAAGTTGATGCATTCTGTGGAGGCTCTATCGTTAATGAAAAATGGATTGTAACTGCTGCCCACTGTGTTGAAACTGGTGTTAAAATTACAGTTGTCGCAGGTGAACATAATATTGAGGAGACAGAACATACAGAGCAAAAGCGAAATGTGATTCGAATTATTCCTCACCACAACTACAATGCAGCTATTAATAAGTACAACCATGACATTGCCCTTCTGGAACTGGACGAACCCTTAGTGCTAAACAGCTACGTTACACCTATTTGCATTGCTGACAAGGAATACACGAACATCTTCCTCAAATTTGGATCTGGCTATGTAAGTGGCTGGGGAAGAGTCTTCCACAAAGGGAGATCAGCTTTAGTTCTTCAGTACCTTAGAGTTCCACTTGTTGACCGAGCCACATGTCTTCTATCTACAAAGTTCACCATCTATAACAACATGTTCTGTGCTGGCTTCCATGAAGGAGGTAGAGATTCATGTCAAGGAGATAGTGGGGGACCCCATGTTACTGAAGTGGAAGGGACCAGTTTCTTAACTGGAATTATTAGCTGGGGTGAAGAGTGTGCAATGAAAGGCAAATATGGAATATATACCAAGGTCTCCCGGTATGTCAACTGGATTAAGGAAAAAACAAAGCTCACTGTCAGCGGATGGAGACTGTTCAAGAAGATCAGCTAACCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGCTTCTGAGGCGGAAAGAACCAGCTGGGGCTCTAGGGGGTATCCCCAAAAAACCTCCCACACCTCCCCCTGAACCTGAAACATAAAATGAATGCAATTGTTGTTGTTAACTTGTTTATTGCAGCTTATAATGGTTACAAATAAAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATCTTATCATGTCTGTTAGGAAATCTTCTTAAACAGCCGCCAGCCGCTCACGGTGAGCTTAGTCTTTTCTTTTATCCAATTCACGTAGCGAGAGACCTTCGTATAGATGCCATATTTCCCCTTCATCGCACATTCCTCCCCCCAACTTATTATCCCGGTCAAGAAACTTGTTCCTTCGACTTCAGTGACGTGTGGTCCACCTGAATCACCTTGGCATGAGTCGCGACCGCCCTCGTGAAACCCAGCACAAAACATGTTATTGTAAATCGTAAATTTCGTGGACAGAAGACAGGTCGCTCTATCGACCAACGGGACGCGCAAATATTGCAGAACGAGGGCTGATCGACCTTTGTGGAAGACCCGCCCCCACCCACTCACATATCCGCTCCCAAATTTCAAGAAGATATTTGTATATTCTTTATCGGCTATACAAATCGGGGTAACATAGGAGTTAAGTACGAGTGGCTCGTCCAGCTCCAGGAGGGCTATATCATGGTTGTACTTGTTTATAGCGGCATTATAATTGTGATGGGGTATGATCCTGATAACATTCCTTTTCTGTTCAGTATGCTCAGTTTCTTCAATGTTGTGTTCGCCAGCCACGACCGTAATCTTAACCCCCGTCTCGACACAGTGTGCGGCCGTTACAATCCACTTTTCATTGACTATGGAGCCCCCACAAAACGCGTCGACTTTTCCGTTGAGCACCACCTGCCATGGAAATTGGCCAGGTTTAGCGTCCTCGCCCCCGACAACCCTAGTAAAGTCATTAAATGACTGTGTGGATTGTGTTATATTATCAAGAATCGTTTCGGCTTCAGTAGAGTTAACGTAGTCCACATCGGGAAAAACTGTCTCGGCCCTTGTCAACTTTGATGTCTGGGACACACTTACCCGACCGCACGGGAAGGGCACCGCCGGTTCACAGCTCTTTTGATTCTCAGCGAGCCGGTAGCCCTCAGTGCAACTACACACAACTTTGTTGTCGGCGGAATTTTTACAGAATTGCTCGCATCGTCCATTTTTAATGTTGCAGGTGACGTCCAACTCGCAGTTTTTTCCTTCAAAACCAAAAGGGCACCAACACTCGTAGGAATTTATATCGTCTTTACAACTCCCCCCATTCAGACATGGATTAGATTCGCATTGGTCCCCATCGACATATTGCTTCCAGAACTCAGTGGTCCGTTCTGTATTCTCAAACACCTCGCGCGCTTCTTCAAAACTGCATTTTTCCTCCATACACTCTCGCTCCAAGTTCCCTTGCACGAATTCTTCAAGCTTTCCTGAGTTATACCTTTTAGGCCGGTTAAGTATCTTATTCGCGTTTTCGTGGTCCAGAAAAACTGAAATGTAAAAGAATAATTCTTTAGTTTTAGCAAAAAAGAAAACATCATGAAAATTTTACATCTCTTAAGAAAGTCTTTGTTTTTAATCCAAATAATCAGAGATCTAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAA

P00415全序列(从ITR到ITR)：(SEQ ID NO:279)

TTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTAGATCTCTTAGGTCAGTGAAGAGAAGAACAAAAAGCAGCATATTACAGTTAGTTGTCTTCATCAATCTTTAAATATGTTGTGTGGTTTTTCTCTCCCTGTTTCCACAGTTTTTCTTGATCATGAAAACGCCAACAAAATTCTGAATCGGCCAAAGAGGTATAATTCAGGTAAATTGGAAGAGTTTGTTCAAGGGAACCTTGAGAGAGAATGTATGGAAGAAAAGTGTAGTTTTGAAGAAGCAGTATTCACTTTGGAGGACTTTGTCGGTGACTGGAGGCAAACCGCTGGTTATAATCTCGACCAAGTACTGGAACAGGGCGGGGTAAGTTCCCTCTTTCAGAATTTGGGTGTAAGCGTCACACCAATCCAGCGGATTGTGTTGTCTGGAGAGAACGGACTCAAAATTGACATCCATGTTATCATTCCATATGAAGGTCTCAGTGGAGACCAAATGGGGCAGATCGAGAAGATTTTCAAGGTAGTTTACCCAGTCGACGATCACCACTTCAAAGTCATTCTCCACTATGGCACACTTGTTATCGACGGAGTAACTCCTAATATGATTGATTACTTTGGTCGCCCGTATGAGGGCATCGCAGTGTTTGATGGCAAAAAGATCACCGTAACAGGAACGTTGTGGAATGGGAACAAGATAATCGACGAGAGATTGATAAATCCAGACGGGTCACTCCTGTTCAGGGTTACAATTAACGGCGTCACAGGATGGAGACTCTGTGAACGAATACTGGCCACAAATTTTTCACTCCTGAAGCAGGCCGGAGACGTGGAGGAAAACCCAGGGCCCGTGAGCAAGGGCGAGGAGCTGTTCACCGGGGTGGTGCCCATCCTGGTCGAGCTGGACGGCGACGTAAACGGCCACAAGTTCAGCGTGTCCGGCGAGGGCGAGGGCGATGCCACCTACGGCAAGCTGACCCTGAAGTTCATCTGCACCACCGGCAAGCTGCCCGTGCCCTGGCCCACCCTCGTGACCACCCTGACCTACGGCGTGCAGTGCTTCAGCCGCTACCCCGACCACATGAAGCAGCACGACTTCTTCAAGTCCGCCATGCCCGAAGGCTACGTCCAGGAGCGCACCATCTTCTTCAAGGACGACGGCAACTACAAGACCCGCGCCGAGGTGAAGTTCGAGGGCGACACCCTGGTGAACCGCATCGAGCTGAAGGGCATCGACTTCAAGGAGGACGGCAACATCCTGGGGCACAAGCTGGAGTACAACTACAACAGCCACAACGTCTATATCATGGCCGACAAGCAGAAGAACGGCATCAAGGTGAACTTCAAGATCCGCCACAACATCGAGGACGGCAGCGTGCAGCTCGCCGACCACTACCAGCAGAACACCCCCATCGGCGACGGCCCCGTGCTGCTGCCCGACAACCACTACCTGAGCACCCAGTCCGCCCTGAGCAAAGACCCCAACGAGAAGCGCGATCACATGGTCCTGCTGGAGTTCGTGACCGCCGCCGGGATCACTCTCGGCATGGACGAGCTGTACAAGGGAGGAGGAAGCCCGAAGAAGAAGAGAAAGGTCTAACCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGCTTCTGAGGCGGAAAGAACCAGCTGGGGCTCTAGGGGGTATCCCCAAAAAACCTCCCACACCTCCCCCTGAACCTGAAACATAAAATGAATGCAATTGTTGTTGTTAACTTGTTTATTGCAGCTTATAATGGTTACAAATAAAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATCTTATCATGTCTGTTACACCTTCCTCTTCTTCTTGGGGCTGCCGCCGCCCTTGTACAGCTCGTCCATGCCCAGGGTGATGCCGGCGGCGGTCACGAACTCCAGCAGCACCATGTGGTCCCTCTTCTCGTTGGGGTCCTTGCTCAGGGCGCTCTGGGTGCTCAGGTAGTGGTTGTCGGGCAGCAGCACGGGGCCGTCGCCGATGGGGGTGTTCTGCTGGTAGTGGTCGGCCAGCTGCACGCTGCCGTCCTCGATGTTGTGCCTGATCTTGAAGTTCACCTTGATGCCGTTCTTCTGCTTGTCGGCCATGATGTACACGTTGTGGCTGTTGTAGTTGTACTCCAGCTTGTGGCCCAGGATGTTGCCGTCCTCCTTGAAGTCGATGCCCTTCAGCTCGATCCTGTTCACCAGGGTGTCGCCCTCGAACTTCACCTCGGCCCTGGTCTTGTAGTTGCCGTCGTCCTTGAAGAAGATGGTCCTCTCCTGCACGTAGCCCTCGGGCATGGCGCTCTTGAAGAAGTCGTGCTGCTTCATGTGGTCGGGGTACCTGCTGAAGCACTGCACGCCGTAGGTCAGGGTGGTCACCAGGGTGGGCCAGGGCACGGGCAGCTTGCCGGTGGTGCAGATGAACTTCAGGGTCAGCTTGCCGTAGGTGGCGTCGCCCTCGCCCTCGCCGCTCACGCTGAACTTGTGGCCGTTCACGTCGCCGTCCAGCTCCACCAGGATGGGCACCACGCCGGTGAACAGCTCCTCGCCCTTGCTCACGGGGCCGGGGTTCTCCTCCACGTCGCCGGCCTGCTTCAGCAGGCTGAAGTTGGTGGCCAGGATCCTCTCGCACAGCCTCCAGCCGGTCACGCCGTTGATGGTCACCCTGAACAGCAGGCTGCCGTCGGGGTTGATCAGCCTCTCGTCGATGATCTTGTTGCCGTTCCACAGGGTGCCGGTCACGGTGATCTTCTTGCCGTCGAACACGGCGATGCCCTCGTAGGGCCTGCCGAAGTAGTCGATCATGTTGGGGGTCACGCCGTCGATCACCAGGGTGCCGTAGTGCAGGATCACCTTGAAGTGGTGGTCGTCCACGGGGTACACCACCTTGAAAATCTTCTCGATCTGGCCCATCTGGTCGCCGCTCAGGCCCTCGTAGGGGATGATCACGTGGATGTCGATCTTCAGGCCGTTCTCGCCGCTCAGCACGATCCTCTGGATGGGGGTCACGCTCACGCCCAGGTTCTGGAACAGGCTGCTCACGCCGCCCTGCTCCAGCACCTGGTCCAGGTTGTAGCCGGCGGTCTGCCTCCAGTCGCCCACGAAGTCCTCCAGGGTGAACACGGCCTCCTCGAAGCTGCACTTCTCCTCCATGCACTCCCTCTCCAGGTTGCCCTGCACGAACTCCTCCAGCTTGCCGCTGTTGTACCTCTTGGGCCTGTTCAGGATCTTGTTGGCGTTCTCGTGGTCCAGGAAP00418全序列(从ITR到ITR)：(SEQ ID NO:280)

TTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTAGATCTCTTAGGTCAGTGAAGAGAAGAACAAAAAGCAGCATATTACAGTTAGTTGTCTTCATCAATCTTTAAATATGTTGTGTGGTTTTTCTCTCCCTGTTTCCACAGTTTTTCTTGATCATGAAAACGCCAACAAAATTCTGAATCGGCCAAAGAGGTATAATTCAGGTAAATTGGAAGAGTTTGTTCAAGGGAACCTTGAGAGAGAATGTATGGAAGAAAAGTGTAGTTTTGAAGAAGCACGAGAAGTTTTTGAAAACACTGAAAGAACAACTGAATTTTGGAAGCAGTATGTTGATGGAGATCAGTGTGAGTCCAATCCATGTTTAAATGGCGGCAGTTGCAAGGATGACATTAATTCCTATGAATGTTGGTGTCCCTTTGGATTTGAAGGAAAGAACTGTGAATTAGATGTAACATGTAACATTAAGAATGGCAGATGCGAGCAGTTTTGTAAAAATAGTGCTGATAACAAGGTGGTTTGCTCCTGTACTGAGGGATATCGACTTGCAGAAAACCAGAAGTCCTGTGAACCAGCAGTGCCATTTCCATGTGGAAGAGTTTCTGTTTCACAAACTTCTAAGCTCACCCGTGCTGAGACTGTTTTTCCTGATGTGGACTATGTAAATTCTACTGAAGCTGAAACCATTTTGGATAACATCACTCAAAGCACCCAATCATTTAATGACTTCACTCGGGTTGTTGGTGGAGAAGATGCCAAACCAGGTCAATTCCCTTGGCAGGTTGTTTTGAATGGTAAAGTTGATGCATTCTGTGGAGGCTCTATCGTTAATGAAAAATGGATTGTAACTGCTGCCCACTGTGTTGAAACTGGTGTTAAAATTACAGTTGTCGCAGGTGAACATAATATTGAGGAGACAGAACATACAGAGCAAAAGCGAAATGTGATTCGAATTATTCCTCACCACAACTACAATGCAGCTATTAATAAGTACAACCATGACATTGCCCTTCTGGAACTGGACGAACCCTTAGTGCTAAACAGCTACGTTACACCTATTTGCATTGCTGACAAGGAATACACGAACATCTTCCTCAAATTTGGATCTGGCTATGTAAGTGGCTGGGGAAGAGTCTTCCACAAAGGGAGATCAGCTTTAGTTCTTCAGTACCTTAGAGTTCCACTTGTTGACCGAGCCACATGTCTTCTATCTACAAAGTTCACCATCTATAACAACATGTTCTGTGCTGGCTTCCATGAAGGAGGTAGAGATTCATGTCAAGGAGATAGTGGGGGACCCCATGTTACTGAAGTGGAAGGGACCAGTTTCTTAACTGGAATTATTAGCTGGGGTGAAGAGTGTGCAATGAAAGGCAAATATGGAATATATACCAAGGTCTCCCGGTATGTCAACTGGATTAAGGAAAAAACAAAGCTCACTGTCAGCGGATGGAGACTGTTCAAGAAGATCAGCTAACCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGCTTCTGAGGCGGAAAGAACCAGCTGGGGCTCTAGGGGGTATCCCCAAAAAACCTCCCACACCTCCCCCTGAACCTGAAACATAAAATGAATGCAATTGTTGTTGTTAACTTGTTTATTGCAGCTTATAATGGTTACAAATAAAGCAATAGCATCACAAATTTCACAAATAAAGCATTTTTTTCACTGCATTCTAGTTGTGGTTTGTCCAAACTCATCAATGTATCTTATCATGTCTGTTAGGAAATCTTCTTAAACAGCCGCCAGCCGCTCACGGTGAGCTTAGTCTTTTCTTTTATCCAATTCACGTAGCGAGAGACCTTCGTATAGATGCCATATTTCCCCTTCATCGCACATTCCTCCCCCCAACTTATTATCCCGGTCAAGAAACTTGTTCCTTCGACTTCAGTGACGTGTGGTCCACCTGAATCACCTTGGCATGAGTCGCGACCGCCCTCGTGAAACCCAGCACAAAACATGTTATTGTAAATCGTAAATTTCGTGGACAGAAGACAGGTCGCTCTATCGACCAACGGGACGCGCAAATATTGCAGAACGAGGGCTGATCGACCTTTGTGGAAGACCCGCCCCCACCCACTCACATATCCGCTCCCAAATTTCAAGAAGATATTTGTATATTCTTTATCGGCTATACAAATCGGGGTAACATAGGAGTTAAGTACGAGTGGCTCGTCCAGCTCCAGGAGGGCTATATCATGGTTGTACTTGTTTATAGCGGCATTATAATTGTGATGGGGTATGATCCTGATAACATTCCTTTTCTGTTCAGTATGCTCAGTTTCTTCAATGTTGTGTTCGCCAGCCACGACCGTAATCTTAACCCCCGTCTCGACACAGTGTGCGGCCGTTACAATCCACTTTTCATTGACTATGGAGCCCCCACAAAACGCGTCGACTTTTCCGTTGAGCACCACCTGCCATGGAAATTGGCCAGGTTTAGCGTCCTCGCCCCCGACAACCCTAGTAAAGTCATTAAATGACTGTGTGGATTGTGTTATATTATCAAGAATCGTTTCGGCTTCAGTAGAGTTAACGTAGTCCACATCGGGAAAAACTGTCTCGGCCCTTGTCAACTTTGATGTCTGGGACACACTTACCCGACCGCACGGGAAGGGCACCGCCGGTTCACAGCTCTTTTGATTCTCAGCGAGCCGGTAGCCCTCAGTGCAACTACACACAACTTTGTTGTCGGCGGAATTTTTACAGAATTGCTCGCATCGTCCATTTTTAATGTTGCAGGTGACGTCCAACTCGCAGTTTTTTCCTTCAAAACCAAAAGGGCACCAACACTCGTAGGAATTTATATCGTCTTTACAACTCCCCCCATTCAGACATGGATTAGATTCGCATTGGTCCCCATCGACATATTGCTTCCAGAACTCAGTGGTCCGTTCTGTATTCTCAAACACCTCGCGCGCTTCTTCAAAACTGCATTTTTCCTCCATACACTCTCGCTCCAAGTTCCCTTGCACGAATTCTTCAAGCTTTCCTGAGTTATACCTTTTAGGCCGGTTAAGTATCTTATTCGCGTTTTCGTGGTCCAGAAAAACTGTGGAAACAGGGAGAGAAAAACCACACAACATATTTAAAGATTGATGAAGACAACTAACTGTAATATGCTGCTTTTTGTTCTTCTCTTCACTGACCTAAGAGATCTAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAA

P00123全序列(从ITR到ITR)：(SEQ ID NO:281)

GGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTGGAGGGGTGGAGTCGTGATAGGTCAGTGAAGAGAAGAACAAAAAGCAGCATATTACAGTTAGTTGTCTTCATCAATCTTTAAATATGTTGTGTGGTTTTTCTCTCCCTGTTTCCACAGTTTTTCTTGATCATGAAAACGCCAACAAAATTCTGAATCGGCCAAAGAGGTATAATTCAGGTAAATTGGAAGAGTTTGTTCAAGGGAACCTTGAGAGAGAATGTATGGAAGAAAAGTGTAGTTTTGAAGAAGCACGAGAAGTTTTTGAAAACACTGAAAGAACAACTGAATTTTGGAAGCAGTATGTTGATGGAGATCAGTGTGAGTCCAATCCATGTTTAAATGGCGGCAGTTGCAAGGATGACATTAATTCCTATGAATGTTGGTGTCCCTTTGGATTTGAAGGAAAGAACTGTGAATTAGATGTAACATGTAACATTAAGAATGGCAGATGCGAGCAGTTTTGTAAAAATAGTGCTGATAACAAGGTGGTTTGCTCCTGTACTGAGGGATATCGACTTGCAGAAAACCAGAAGTCCTGTGAACCAGCAGTGCCATTTCCATGTGGAAGAGTTTCTGTTTCACAAACTTCTAAGCTCACCCGTGCTGAGACTGTTTTTCCTGATGTGGACTATGTAAATTCTACTGAAGCTGAAACCATTTTGGATAACATCACTCAAAGCACCCAATCATTTAATGACTTCACTCGGGTTGTTGGTGGAGAAGATGCCAAACCAGGTCAATTCCCTTGGCAGGTTGTTTTGAATGGTAAAGTTGATGCATTCTGTGGAGGCTCTATCGTTAATGAAAAATGGATTGTAACTGCTGCCCACTGTGTTGAAACTGGTGTTAAAATTACAGTTGTCGCAGGTGAACATAATATTGAGGAGACAGAACATACAGAGCAAAAGCGAAATGTGATTCGAATTATTCCTCACCACAACTACAATGCAGCTATTAATAAGTACAACCATGACATTGCCCTTCTGGAACTGGACGAACCCTTAGTGCTAAACAGCTACGTTACACCTATTTGCATTGCTGACAAGGAATACACGAACATCTTCCTCAAATTTGGATCTGGCTATGTAAGTGGCTGGGGAAGAGTCTTCCACAAAGGGAGATCAGCTTTAGTTCTTCAGTACCTTAGAGTTCCACTTGTTGACCGAGCCACATGTCTTCTATCTACAAAGTTCACCATCTATAACAACATGTTCTGTGCTGGCTTCCATGAAGGAGGTAGAGATTCATGTCAAGGAGATAGTGGGGGACCCCATGTTACTGAAGTGGAAGGGACCAGTTTCTTAACTGGAATTATTAGCTGGGGTGAAGAGTGTGCAATGAAAGGCAAATATGGAATATATACCAAGGTATCCCGGTATGTCAACTGGATTAAGGAAAAAACAAAGCTCACTTAACCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGCTTCTGAGGCGGAAAGAACCAGCTGGGGCTCTAGGGGGTATCCCCACTAGTCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGA

P00204全序列(从ITR到ITR)：(SEQ ID NO:282)

GGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTGGAGGGGTGGAGTCGTGACCTAGGTCGTCTCCGGCTCTGCTTTTTCCAGGGGTGTGTTTCGCCGAGAAGCACGTAAGAGTTTTATGTTTTTTCATCTCTGCTTGTATTTTTCTAGTAATGGAAGCCTGGTATTTTAAAATAGTTAAATTTTCCTTTAGTGCTGATTTCTAGATTATTATTACTGTTGTTGTTGTTATTATTGTCATTATTTGCATCTGAGAACTAGGTCAGTGAAGAGAAGAACAAAAAGCAGCATATTACAGTTAGTTGTCTTCATCAATCTTTAAATATGTTGTGTGGTTTTTCTCTCCCTGTTTCCACAGTTTTTCTTGATCATGAAAACGCCAACAAAATTCTGAATCGGCCAAAGAGGTATAATTCAGGTAAATTGGAAGAGTTTGTTCAAGGGAACCTTGAGAGAGAATGTATGGAAGAAAAGTGTAGTTTTGAAGAAGCACGAGAAGTTTTTGAAAACACTGAAAGAACAACTGAATTTTGGAAGCAGTATGTTGATGGAGATCAGTGTGAGTCCAATCCATGTTTAAATGGCGGCAGTTGCAAGGATGACATTAATTCCTATGAATGTTGGTGTCCCTTTGGATTTGAAGGAAAGAACTGTGAATTAGATGTAACATGTAACATTAAGAATGGCAGATGCGAGCAGTTTTGTAAAAATAGTGCTGATAACAAGGTGGTTTGCTCCTGTACTGAGGGATATCGACTTGCAGAAAACCAGAAGTCCTGTGAACCAGCAGTGCCATTTCCATGTGGAAGAGTTTCTGTTTCACAAACTTCTAAGCTCACCCGTGCTGAGACTGTTTTTCCTGATGTGGACTATGTAAATTCTACTGAAGCTGAAACCATTTTGGATAACATCACTCAAAGCACCCAATCATTTAATGACTTCACTCGGGTTGTTGGTGGAGAAGATGCCAAACCAGGTCAATTCCCTTGGCAGGTTGTTTTGAATGGTAAAGTTGATGCATTCTGTGGAGGCTCTATCGTTAATGAAAAATGGATTGTAACTGCTGCCCACTGTGTTGAAACTGGTGTTAAAATTACAGTTGTCGCAGGTGAACATAATATTGAGGAGACAGAACATACAGAGCAAAAGCGAAATGTGATTCGAATTATTCCTCACCACAACTACAATGCAGCTATTAATAAGTACAACCATGACATTGCCCTTCTGGAACTGGACGAACCCTTAGTGCTAAACAGCTACGTTACACCTATTTGCATTGCTGACAAGGAATACACGAACATCTTCCTCAAATTTGGATCTGGCTATGTAAGTGGCTGGGGAAGAGTCTTCCACAAAGGGAGATCAGCTTTAGTTCTTCAGTACCTTAGAGTTCCACTTGTTGACCGAGCCACATGTCTTCTATCTACAAAGTTCACCATCTATAACAACATGTTCTGTGCTGGCTTCCATGAAGGAGGTAGAGATTCATGTCAAGGAGATAGTGGGGGACCCCATGTTACTGAAGTGGAAGGGACCAGTTTCTTAACTGGAATTATTAGCTGGGGTGAAGAGTGTGCAATGAAAGGCAAATATGGAATATATACCAAGGTATCCCGGTATGTCAACTGGATTAAGGAAAAAACAAAGCTCACTTAACCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGCTTCTGAGGCGGAAAGAACCAGCTGGGGCTCTAGGGGGTATCCCCCTTAGGTGGTTATATTATTGATATATTTTTGGTATCTTTGATGACAATAATGGGGGATTTTGAAAGCTTAGCTTTAAATTTCTTTTAATTAAAAAAAAATGCTAGGCAGAATGACTCAAATTACGTTGGATACAGTTGAATTTATTACGGTCTCATAGGGCCTGCCTGCTCGACCATGCTATACTAAAAATTAAAAGTGTACTAGTCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGA

P00353全序列(从ITR到ITR)：(SEQ ID NO:283)

TTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTAGATCTGATTTTGAAAGCTTAGCTTTAAATTTCTTTTAATTAAAAAAAAATGCTAGGCAGAATGACTCAAATTACGTTGGATACAGTTGAATTTATTACGGTCTCATAGGGCCTGCCTGCTCGACCATGCTATACTAAAAATTAAAAGTGTGTGTTACTAATTTTATAAATGGAGTTTCCATTTATATTTACCTTTATTTCTTATTTACCATTGTCTTAGTAGATATTTACAAACATGACAGAAACACTAAATCTTGAGTTTGAATGCACAGATATAAACACTTAACGGGTTTTAAAAATAATAATGTTGGTGAAAAAATATAACTTTGAGTGTAGCAGAGAGGAACCATTGCCACCTTCAGATTTTCCTGTAACGATCGGGAACTGGCATCTTCAGGGAGTAGCTTAGGTCAGTGAAGAGAAGAACAAAAAGCAGCATATTACAGTTAGTTGTCTTCATCAATCTTTAAATATGTTGTGTGGTTTTTCTCTCCCTGTTTCCACAGTTTTTCTTGATCATGAAAACGCCAACAAAATTCTGAATCGGCCAAAGAGGTTTCTTGATCATGAAAACGCCAACAAAATTCTGAATCGGCCAAAGAGGTATAATTCAGGTAAATTGGAAGAGTTTGTTCAAGGGAACCTTGAGAGAGAATGTATGGAAGAAAAGTGTAGTTTTGAAGAAGCACGAGAAGTTTTTGAAAACACTGAAAGAACAACTGAATTTTGGAAGCAGTATGTTGATGGAGATCAGTGTGAGTCCAATCCATGTTTAAATGGCGGCAGTTGCAAGGATGACATTAATTCCTATGAATGTTGGTGTCCCTTTGGATTTGAAGGAAAGAACTGTGAATTAGATGTAACATGTAACATTAAGAATGGCAGATGCGAGCAGTTTTGTAAAAATAGTGCTGATAACAAGGTGGTTTGCTCCTGTACTGAGGGATATCGACTTGCAGAAAACCAGAAGTCCTGTGAACCAGCAGTGCCATTTCCATGTGGAAGAGTTTCTGTTTCACAAACTTCTAAGCTCACCCGTGCTGAGACTGTTTTTCCTGATGTGGACTATGTAAATTCTACTGAAGCTGAAACCATTTTGGATAACATCACTCAAAGCACCCAATCATTTAATGACTTCACTCGGGTTGTTGGTGGAGAAGATGCCAAACCAGGTCAATTCCCTTGGCAGGTTGTTTTGAATGGTAAAGTTGATGCATTCTGTGGAGGCTCTATCGTTAATGAAAAATGGATTGTAACTGCTGCCCACTGTGTTGAAACTGGTGTTAAAATTACAGTTGTCGCAGGTGAACATAATATTGAGGAGACAGAACATACAGAGCAAAAGCGAAATGTGATTCGAATTATTCCTCACCACAACTACAATGCAGCTATTAATAAGTACAACCATGACATTGCCCTTCTGGAACTGGACGAACCCTTAGTGCTAAACAGCTACGTTACACCTATTTGCATTGCTGACAAGGAATACACGAACATCTTCCTCAAATTTGGATCTGGCTATGTAAGTGGCTGGGGAAGAGTCTTCCACAAAGGGAGATCAGCTTTAGTTCTTCAGTACCTTAGAGTTCCACTTGTTGACCGAGCCACATGTCTTCTATCTACAAAGTTCACCATCTATAACAACATGTTCTGTGCTGGCTTCCATGAAGGAGGTAGAGATTCATGTCAAGGAGATAGTGGGGGACCCCATGTTACTGAAGTGGAAGGGACCAGTTTCTTAACTGGAATTATTAGCTGGGGTGAAGAGTGTGCAATGAAAGGCAAATATGGAATATATACCAAGGTATCCCGGTATGTCAACTGGATTAAGGAAAAAACAAAGCTCACTTAACCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGCTTCTGAGGCGGAAAGAACCAGCTGGGGCTCTAGGGGGTATCCCCGTGAGATCGCCCATCGGTATAATGATTTGGGAGAACAACATTTCAAAGGCCTGTAAGTTATAATGCTGAAAGCCCACTTAATATTTCTGGTAGTATTAGTTAAAGTTTTAAAACACCTTTTTCCACCTTGAGTGTGAGAATTGTAGAGCAGTGCTGTCCAGTAGAAATGTGTGCATTGACAGAAAGACTGTGGATCTGTGCTGAGCAATGTGGCAGCCAGAGATCACAAGGCTATCAAGCACTTTGCACATGGCAAGTGTAACTGAGAAGCACACATTCAAATAATAGTTAATTTTAATTGAATGTATCTAGCCATGTGTGGCTAGTAGCTCCTTTCCTGGAGAGAGAATCTGGAGCCCACATCTAACTTGTTAAGTCTGGAATCTTATTTTTTATTTCTGGAAAGGTCTATGAACTATAGTTTTGGGGGCAGCTCACTTACTAACTTTTAATGCAATAAGAATCTCATGGTATCTTGAGAACATTATTTTGTCTCTTTGTAGATCTAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAA

P00354全序列(从ITR到ITR)：(SEQ ID NO:284)

TTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTAGATCTTAGCCTCTGGCAAAATGAAGTGGGTAACCTTTCTCCTCCTCCTCTTCGTCTCCGGCTCTGCTTTTTCCAGGGGTGTGTTTCGCCGAGAAGCACGTAAGAGTTTTATGTTTTTTCATCTCTGCTTGTATTTTTCTAGTAATGGAAGCCTGGTATTTTAAAATAGTTAAATTTTCCTTTAGTGCTGATTTCTAGATTATTATTACTGTTGTTGTTGTTATTATTGTCATTATTTGCATCTGAGAACCCTTAGGTGGTTATATTATTGATATATTTTTGGTATCTTTGATGACAATAATGGGGGATTTTGAAAGCTTAGCTTTAAATTTCTTTTAATTAAAAAAAAATGCTAGGCAGAATGACTCAAATTACGTTGGATACAGTTGAATTTATTACGGTCTCATAGGGCCTGCCTGCTCGACCATGCTATACTAAAAATTAAAAGTGTGTGTTACTAATTTTATAAATGGAGTTTCCATTTATATTTACCTTTATTTCTTATTTACCATTGTCTTAGTAGATATTTACAAACATGACAGAAACACTAAATCTTGAGTTTGAATGCACAGATATAAACACTTAACGGGTTTTAAAAATAATAATGTTGGTGAAAAAATATAACTTTGAGTGTAGCAGAGAGGAACCATTGCCACCTTCAGATTTTCCTGTAACGATCGGGAACTGGCATCTTCAGGGAGTAGCTTAGGTCAGTGAAGAGAAGAACAAAAAGCAGCATATTACAGTTAGTTGTCTTCATCAATCTTTAAATATGTTGTGTGGTTTTTCTCTCCCTGTTTCCACAGTTTTTCTTGATCATGAAAACGCCAACAAAATTCTGAATCGGCCAAAGAGGTATAATTCAGGTAAATTGGAAGAGTTTGTTCAAGGGAACCTTGAGAGAGAATGTATGGAAGAAAAGTGTAGTTTTGAAGAAGCACGAGAAGTTTTTGAAAACACTGAAAGAACAACTGAATTTTGGAAGCAGTATGTTGATGGAGATCAGTGTGAGTCCAATCCATGTTTAAATGGCGGCAGTTGCAAGGATGACATTAATTCCTATGAATGTTGGTGTCCCTTTGGATTTGAAGGAAAGAACTGTGAATTAGATGTAACATGTAACATTAAGAATGGCAGATGCGAGCAGTTTTGTAAAAATAGTGCTGATAACAAGGTGGTTTGCTCCTGTACTGAGGGATATCGACTTGCAGAAAACCAGAAGTCCTGTGAACCAGCAGTGCCATTTCCATGTGGAAGAGTTTCTGTTTCACAAACTTCTAAGCTCACCCGTGCTGAGACTGTTTTTCCTGATGTGGACTATGTAAATTCTACTGAAGCTGAAACCATTTTGGATAACATCACTCAAAGCACCCAATCATTTAATGACTTCACTCGGGTTGTTGGTGGAGAAGATGCCAAACCAGGTCAATTCCCTTGGCAGGTTGTTTTGAATGGTAAAGTTGATGCATTCTGTGGAGGCTCTATCGTTAATGAAAAATGGATTGTAACTGCTGCCCACTGTGTTGAAACTGGTGTTAAAATTACAGTTGTCGCAGGTGAACATAATATTGAGGAGACAGAACATACAGAGCAAAAGCGAAATGTGATTCGAATTATTCCTCACCACAACTACAATGCAGCTATTAATAAGTACAACCATGACATTGCCCTTCTGGAACTGGACGAACCCTTAGTGCTAAACAGCTACGTTACACCTATTTGCATTGCTGACAAGGAATACACGAACATCTTCCTCAAATTTGGATCTGGCTATGTAAGTGGCTGGGGAAGAGTCTTCCACAAAGGGAGATCAGCTTTAGTTCTTCAGTACCTTAGAGTTCCACTTGTTGACCGAGCCACATGTCTTCTATCTACAAAGTTCACCATCTATAACAACATGTTCTGTGCTGGCTTCCATGAAGGAGGTAGAGATTCATGTCAAGGAGATAGTGGGGGACCCCATGTTACTGAAGTGGAAGGGACCAGTTTCTTAACTGGAATTATTAGCTGGGGTGAAGAGTGTGCAATGAAAGGCAAATATGGAATATATACCAAGGTATCCCGGTATGTCAACTGGATTAAGGAAAAAACAAAGCTCACTTAACCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGCTTCTGAGGCGGAAAGAACCAGCTGGGGCTCTAGGGGGTATCCCCGTGAGATCGCCCATCGGTATAATGATTTGGGAGAACAACATTTCAAAGGCCTGTAAGTTATAATGCTGAAAGCCCACTTAATATTTCTGGTAGTATTAGTTAAAGTTTTAAAACACCTTTTTCCACCTTGAGTGTGAGAATTGTAGAGCAGTGCTGTCCAGTAGAAATGTGTGCATTGACAGAAAGACTGTGGATCTGTGCTGAGCAATGTGGCAGCCAGAGATCACAAGGCTATCAAGCACTTTGCACATGGCAAGTGTAACTGAGAAGCACACATTCAAATAATAGTTAATTTTAATTGAATGTATCTAGCCATGTGTGGCTAGTAGCTCCTTTCCTGGAGAGAGAATCTGGAGCCCACATCTAACTTGTTAAGTCTGGAATCTTATTTTTTATTTCTGGAAAGGTCTATGAACTATAGTTTTGGGGGCAGCTCACTTACTAACTTTTAATGCAATAAGAATCTCATGGTATCTTGAGAACATTATTTTGTCTCTTTGTAGTACTGAAACCTTATACATGTGAAGTAAGGGGTCTATACTTAAGTCACATCTCCAACCTTAGTAATGTTTTAATGTAGTAAAAAAATGAGTAATTAATTTATTTTTAGAAGGTCAATAGTATCATGTATTCCAAATAACAGAGGTATATGGTTAGAAAAGAAACAATTCAAAGGACTTATATAATATCTAGCCTTGACAATGAATAAATTTAGAGAGTAGTTTGCCTGTTTGCCTCATGTTCATAAATCTATTGACACATATGTGCATCTGCACTTCAGCATGGTAGAAGTCCATATTCAGATCTAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAA

P00350：300/600bp HA F9构建体(对于G551)(SEQ ID NO:285)

TTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTAGATCTAAGTATATTAGAGCGAGTCTTTCTGCACACAGATCACCTTTCCTATCAACCCCACTAGCCTCTGGCAAAATGAAGTGGGTAACCTTTCTCCTCCTCCTCTTCGTCTCCGGCTCTGCTTTTTCCAGGGGTGTGTTTCGCCGAGAAGCACGTAAGAGTTTTATGTTTTTTCATCTCTGCTTGTATTTTTCTAGTAATGGAAGCCTGGTATTTTAAAATAGTTAAATTTTCCTTTAGTGCTGATTTCTAGATTATTATTACTGTTGTTGTTGTTATTATTGTCATTATTTGCATCTGAGAACCTTTTTCTTGATCATGAAAACGCCAACAAAATTCTGAATCGGCCAAAGAGGTATAATTCAGGTAAATTGGAAGAGTTTGTTCAAGGGAACCTTGAGAGAGAATGTATGGAAGAAAAGTGTAGTTTTGAAGAAGCACGAGAAGTTTTTGAAAACACTGAAAGAACAACTGAATTTTGGAAGCAGTATGTTGATGGAGATCAGTGTGAGTCCAATCCATGTTTAAATGGCGGCAGTTGCAAGGATGACATTAATTCCTATGAATGTTGGTGTCCCTTTGGATTTGAAGGAAAGAACTGTGAATTAGATGTAACATGTAACATTAAGAATGGCAGATGCGAGCAGTTTTGTAAAAATAGTGCTGATAACAAGGTGGTTTGCTCCTGTACTGAGGGATATCGACTTGCAGAAAACCAGAAGTCCTGTGAACCAGCAGTGCCATTTCCATGTGGAAGAGTTTCTGTTTCACAAACTTCTAAGCTCACCCGTGCTGAGACTGTTTTTCCTGATGTGGACTATGTAAATTCTACTGAAGCTGAAACCATTTTGGATAACATCACTCAAAGCACCCAATCATTTAATGACTTCACTCGGGTTGTTGGTGGAGAAGATGCCAAACCAGGTCAATTCCCTTGGCAGGTTGTTTTGAATGGTAAAGTTGATGCATTCTGTGGAGGCTCTATCGTTAATGAAAAATGGATTGTAACTGCTGCCCACTGTGTTGAAACTGGTGTTAAAATTACAGTTGTCGCAGGTGAACATAATATTGAGGAGACAGAACATACAGAGCAAAAGCGAAATGTGATTCGAATTATTCCTCACCACAACTACAATGCAGCTATTAATAAGTACAACCATGACATTGCCCTTCTGGAACTGGACGAACCCTTAGTGCTAAACAGCTACGTTACACCTATTTGCATTGCTGACAAGGAATACACGAACATCTTCCTCAAATTTGGATCTGGCTATGTAAGTGGCTGGGGAAGAGTCTTCCACAAAGGGAGATCAGCTTTAGTTCTTCAGTACCTTAGAGTTCCACTTGTTGACCGAGCCACATGTCTTCTATCTACAAAGTTCACCATCTATAACAACATGTTCTGTGCTGGCTTCCATGAAGGAGGTAGAGATTCATGTCAAGGAGATAGTGGGGGACCCCATGTTACTGAAGTGGAAGGGACCAGTTTCTTAACTGGAATTATTAGCTGGGGTGAAGAGTGTGCAATGAAAGGCAAATATGGAATATATACCAAGGTATCCCGGTATGTCAACTGGATTAAGGAAAAAACAAAGCTCACTTAACCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGCTTCTGAGGCGGAAAGAACCAGCTGGGGCTCTAGGGGGTATCCCCCTTAGGTGGTTATATTATTGATATATTTTTGGTATCTTTGATGACAATAATGGGGGATTTTGAAAGCTTAGCTTTAAATTTCTTTTAATTAAAAAAAAATGCTAGGCAGAATGACTCAAATTACGTTGGATACAGTTGAATTTATTACGGTCTCATAGGGCCTGCCTGCTCGACCATGCTATACTAAAAATTAAAAGTGTGTGTTACTAATTTTATAAATGGAGTTTCCATTTATATTTACCTTTATTTCTTATTTACCATTGTCTTAGTAGATATTTACAAACATGACAGAAACACTAAAGATCTAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAA

P00356：300/2000bp HA F9构建体(对于G551)(SEQ ID NO:286)

TTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTAGATCTAAGTATATTAGAGCGAGTCTTTCTGCACACAGATCACCTTTCCTATCAACCCCACTAGCCTCTGGCAAAATGAAGTGGGTAACCTTTCTCCTCCTCCTCTTCGTCTCCGGCTCTGCTTTTTCCAGGGGTGTGTTTCGCCGAGAAGCACGTAAGAGTTTTATGTTTTTTCATCTCTGCTTGTATTTTTCTAGTAATGGAAGCCTGGTATTTTAAAATAGTTAAATTTTCCTTTAGTGCTGATTTCTAGATTATTATTACTGTTGTTGTTGTTATTATTGTCATTATTTGCATCTGAGAACCTTTTTCTTGATCATGAAAACGCCAACAAAATTCTGAATCGGCCAAAGAGGTATAATTCAGGTAAATTGGAAGAGTTTGTTCAAGGGAACCTTGAGAGAGAATGTATGGAAGAAAAGTGTAGTTTTGAAGAAGCACGAGAAGTTTTTGAAAACACTGAAAGAACAACTGAATTTTGGAAGCAGTATGTTGATGGAGATCAGTGTGAGTCCAATCCATGTTTAAATGGCGGCAGTTGCAAGGATGACATTAATTCCTATGAATGTTGGTGTCCCTTTGGATTTGAAGGAAAGAACTGTGAATTAGATGTAACATGTAACATTAAGAATGGCAGATGCGAGCAGTTTTGTAAAAATAGTGCTGATAACAAGGTGGTTTGCTCCTGTACTGAGGGATATCGACTTGCAGAAAACCAGAAGTCCTGTGAACCAGCAGTGCCATTTCCATGTGGAAGAGTTTCTGTTTCACAAACTTCTAAGCTCACCCGTGCTGAGACTGTTTTTCCTGATGTGGACTATGTAAATTCTACTGAAGCTGAAACCATTTTGGATAACATCACTCAAAGCACCCAATCATTTAATGACTTCACTCGGGTTGTTGGTGGAGAAGATGCCAAACCAGGTCAATTCCCTTGGCAGGTTGTTTTGAATGGTAAAGTTGATGCATTCTGTGGAGGCTCTATCGTTAATGAAAAATGGATTGTAACTGCTGCCCACTGTGTTGAAACTGGTGTTAAAATTACAGTTGTCGCAGGTGAACATAATATTGAGGAGACAGAACATACAGAGCAAAAGCGAAATGTGATTCGAATTATTCCTCACCACAACTACAATGCAGCTATTAATAAGTACAACCATGACATTGCCCTTCTGGAACTGGACGAACCCTTAGTGCTAAACAGCTACGTTACACCTATTTGCATTGCTGACAAGGAATACACGAACATCTTCCTCAAATTTGGATCTGGCTATGTAAGTGGCTGGGGAAGAGTCTTCCACAAAGGGAGATCAGCTTTAGTTCTTCAGTACCTTAGAGTTCCACTTGTTGACCGAGCCACATGTCTTCTATCTACAAAGTTCACCATCTATAACAACATGTTCTGTGCTGGCTTCCATGAAGGAGGTAGAGATTCATGTCAAGGAGATAGTGGGGGACCCCATGTTACTGAAGTGGAAGGGACCAGTTTCTTAACTGGAATTATTAGCTGGGGTGAAGAGTGTGCAATGAAAGGCAAATATGGAATATATACCAAGGTATCCCGGTATGTCAACTGGATTAAGGAAAAAACAAAGCTCACTTAACCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGCTTCTGAGGCGGAAAGAACCAGCTGGGGCTCTAGGGGGTATCCCCCTTAGGTGGTTATATTATTGATATATTTTTGGTATCTTTGATGACAATAATGGGGGATTTTGAAAGCTTAGCTTTAAATTTCTTTTAATTAAAAAAAAATGCTAGGCAGAATGACTCAAATTACGTTGGATACAGTTGAATTTATTACGGTCTCATAGGGCCTGCCTGCTCGACCATGCTATACTAAAAATTAAAAGTGTGTGTTACTAATTTTATAAATGGAGTTTCCATTTATATTTACCTTTATTTCTTATTTACCATTGTCTTAGTAGATATTTACAAACATGACAGAAACACTAAATCTTGAGTTTGAATGCACAGATATAAACACTTAACGGGTTTTAAAAATAATAATGTTGGTGAAAAAATATAACTTTGAGTGTAGCAGAGAGGAACCATTGCCACCTTCAGATTTTCCTGTAACGATCGGGAACTGGCATCTTCAGGGAGTAGCTTAGGTCAGTGAAGAGAAGAACAAAAAGCAGCATATTACAGTTAGTTGTCTTCATCAATCTTTAAATATGTTGTGTGGTTTTTCTCTCCCTGTTTCCACAGACAAGAGTGAGATCGCCCATCGGTATAATGATTTGGGAGAACAACATTTCAAAGGCCTGTAAGTTATAATGCTGAAAGCCCACTTAATATTTCTGGTAGTATTAGTTAAAGTTTTAAAACACCTTTTTCCACCTTGAGTGTGAGAATTGTAGAGCAGTGCTGTCCAGTAGAAATGTGTGCATTGACAGAAAGACTGTGGATCTGTGCTGAGCAATGTGGCAGCCAGAGATCACAAGGCTATCAAGCACTTTGCACATGGCAAGTGTAACTGAGAAGCACACATTCAAATAATAGTTAATTTTAATTGAATGTATCTAGCCATGTGTGGCTAGTAGCTCCTTTCCTGGAGAGAGAATCTGGAGCCCACATCTAACTTGTTAAGTCTGGAATCTTATTTTTTATTTCTGGAAAGGTCTATGAACTATAGTTTTGGGGGCAGCTCACTTACTAACTTTTAATGCAATAAGATCCATGGTATCTTGAGAACATTATTTTGTCTCTTTGTAGTACTGAAACCTTATACATGTGAAGTAAGGGGTCTATACTTAAGTCACATCTCCAACCTTAGTAATGTTTTAATGTAGTAAAAAAATGAGTAATTAATTTATTTTTAGAAGGTCAATAGTATCATGTATTCCAAATAACAGAGGTATATGGTTAGAAAAGAAACAATTCAAAGGACTTATATAATATCTAGCCTTGACAATGAATAAATTTAGAGAGTAGTTTGCCTGTTTGCCTCATGTTCATAAATCTATTGACACATATGTGCATCTGCACTTCAGCATGGTAGAAGTCCATATTCCTTTGCTTGGAAAGGCAGGTGTTCCCATTACGCCTCAGAGAATAGCTGACGGGAAGAGGCTTTCTAGATAGTTGTATGAAAGATATACAAAATCTCGCAGGTATACACAGGCATGATTTGCTGGTTGGGAGAGCCACTTGCCTCATACTGAGGTTTTTGTGTCTGCTTTTCAGAGTCCTGATTGCCTTTTCCCAGTATCTCCAGAAATGCTCATACGATGAGCATGCCAAATTAGTGCAGGAAGTAACAGACTTTGCAAAGACGTGTGTTGCCGATGAGTCTGCCGCCAACTGTGACAAATCCCTTGTGAGTACCTTCTGATTTTGTGGATCTACTTTCCTGCTTTCTGGAACTCTGTTTCAAAGCCAATCATGACTCCATCACTTAAGGCCCCGGGAACACTGTGGCAGAGGGCAGCAGAGAGATTGATAAAGCCAGGGTGATGGGAATTTTCTGTGGGACTCCATTTCATAGTAATTGCAGAAGCTACAATACACTCAAAAAGTCTCACCACATGACTGCCCAAATGGGAGCTTGACAGTGACAGTGACAGTAGATATGCCAAAGTGGATGAGGGAAAGACCACAAGAGCTAAACCCTGTAAAAAGAACTGTAGGCAACTAAGGAATGCAGAGAGAAAGATCTAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAA

P00362：300/1500bp HA F9构建体(对于G551)(SEQ ID NO:287)

TTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGGGCGACCAAAGGTCGCCCGACGCCCGGGCTTTGCCCGGGCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAACTCCATCACTAGGGGTTCCTAGATCTAAGTATATTAGAGCGAGTCTTTCTGCACACAGATCACCTTTCCTATCAACCCCACTAGCCTCTGGCAAAATGAAGTGGGTAACCTTTCTCCTCCTCCTCTTCGTCTCCGGCTCTGCTTTTTCCAGGGGTGTGTTTCGCCGAGAAGCACGTAAGAGTTTTATGTTTTTTCATCTCTGCTTGTATTTTTCTAGTAATGGAAGCCTGGTATTTTAAAATAGTTAAATTTTCCTTTAGTGCTGATTTCTAGATTATTATTACTGTTGTTGTTGTTATTATTGTCATTATTTGCATCTGAGAACCTTTTTCTTGATCATGAAAACGCCAACAAAATTCTGAATCGGCCAAAGAGGTATAATTCAGGTAAATTGGAAGAGTTTGTTCAAGGGAACCTTGAGAGAGAATGTATGGAAGAAAAGTGTAGTTTTGAAGAAGCACGAGAAGTTTTTGAAAACACTGAAAGAACAACTGAATTTTGGAAGCAGTATGTTGATGGAGATCAGTGTGAGTCCAATCCATGTTTAAATGGCGGCAGTTGCAAGGATGACATTAATTCCTATGAATGTTGGTGTCCCTTTGGATTTGAAGGAAAGAACTGTGAATTAGATGTAACATGTAACATTAAGAATGGCAGATGCGAGCAGTTTTGTAAAAATAGTGCTGATAACAAGGTGGTTTGCTCCTGTACTGAGGGATATCGACTTGCAGAAAACCAGAAGTCCTGTGAACCAGCAGTGCCATTTCCATGTGGAAGAGTTTCTGTTTCACAAACTTCTAAGCTCACCCGTGCTGAGACTGTTTTTCCTGATGTGGACTATGTAAATTCTACTGAAGCTGAAACCATTTTGGATAACATCACTCAAAGCACCCAATCATTTAATGACTTCACTCGGGTTGTTGGTGGAGAAGATGCCAAACCAGGTCAATTCCCTTGGCAGGTTGTTTTGAATGGTAAAGTTGATGCATTCTGTGGAGGCTCTATCGTTAATGAAAAATGGATTGTAACTGCTGCCCACTGTGTTGAAACTGGTGTTAAAATTACAGTTGTCGCAGGTGAACATAATATTGAGGAGACAGAACATACAGAGCAAAAGCGAAATGTGATTCGAATTATTCCTCACCACAACTACAATGCAGCTATTAATAAGTACAACCATGACATTGCCCTTCTGGAACTGGACGAACCCTTAGTGCTAAACAGCTACGTTACACCTATTTGCATTGCTGACAAGGAATACACGAACATCTTCCTCAAATTTGGATCTGGCTATGTAAGTGGCTGGGGAAGAGTCTTCCACAAAGGGAGATCAGCTTTAGTTCTTCAGTACCTTAGAGTTCCACTTGTTGACCGAGCCACATGTCTTCTATCTACAAAGTTCACCATCTATAACAACATGTTCTGTGCTGGCTTCCATGAAGGAGGTAGAGATTCATGTCAAGGAGATAGTGGGGGACCCCATGTTACTGAAGTGGAAGGGACCAGTTTCTTAACTGGAATTATTAGCTGGGGTGAAGAGTGTGCAATGAAAGGCAAATATGGAATATATACCAAGGTATCCCGGTATGTCAACTGGATTAAGGAAAAAACAAAGCTCACTTAACCTCGACTGTGCCTTCTAGTTGCCAGCCATCTGTTGTTTGCCCCTCCCCCGTGCCTTCCTTGACCCTGGAAGGTGCCACTCCCACTGTCCTTTCCTAATAAAATGAGGAAATTGCATCGCATTGTCTGAGTAGGTGTCATTCTATTCTGGGGGGTGGGGTGGGGCAGGACAGCAAGGGGGAGGATTGGGAAGACAATAGCAGGCATGCTGGGGATGCGGTGGGCTCTATGGCTTCTGAGGCGGAAAGAACCAGCTGGGGCTCTAGGGGGTATCCCCCTTAGGTGGTTATATTATTGATATATTTTTGGTATCTTTGATGACAATAATGGGGGATTTTGAAAGCTTAGCTTTAAATTTCTTTTAATTAAAAAAAAATGCTAGGCAGAATGACTCAAATTACGTTGGATACAGTTGAATTTATTACGGTCTCATAGGGCCTGCCTGCTCGACCATGCTATACTAAAAATTAAAAGTGTGTGTTACTAATTTTATAAATGGAGTTTCCATTTATATTTACCTTTATTTCTTATTTACCATTGTCTTAGTAGATATTTACAAACATGACAGAAACACTAAATCTTGAGTTTGAATGCACAGATATAAACACTTAACGGGTTTTAAAAATAATAATGTTGGTGAAAAAATATAACTTTGAGTGTAGCAGAGAGGAACCATTGCCACCTTCAGATTTTCCTGTAACGATCGGGAACTGGCATCTTCAGGGAGTAGCTTAGGTCAGTGAAGAGAAGAACAAAAAGCAGCATATTACAGTTAGTTGTCTTCATCAATCTTTAAATATGTTGTGTGGTTTTTCTCTCCCTGTTTCCACAGACAAGAGTGAGATCGCCCATCGGTATAATGATTTGGGAGAACAACATTTCAAAGGCCTGTAAGTTATAATGCTGAAAGCCCACTTAATATTTCTGGTAGTATTAGTTAAAGTTTTAAAACACCTTTTTCCACCTTGAGTGTGAGAATTGTAGAGCAGTGCTGTCCAGTAGAAATGTGTGCATTGACAGAAAGACTGTGGATCTGTGCTGAGCAATGTGGCAGCCAGAGATCACAAGGCTATCAAGCACTTTGCACATGGCAAGTGTAACTGAGAAGCACACATTCAAATAATAGTTAATTTTAATTGAATGTATCTAGCCATGTGTGGCTAGTAGCTCCTTTCCTGGAGAGAGAATCTGGAGCCCACATCTAACTTGTTAAGTCTGGAATCTTATTTTTTATTTCTGGAAAGGTCTATGAACTATAGTTTTGGGGGCAGCTCACTTACTAACTTTTAATGCAATAAGATCCATGGTATCTTGAGAACATTATTTTGTCTCTTTGTAGTACTGAAACCTTATACATGTGAAGTAAGGGGTCTATACTTAAGTCACATCTCCAACCTTAGTAATGTTTTAATGTAGTAAAAAAATGAGTAATTAATTTATTTTTAGAAGGTCAATAGTATCATGTATTCCAAATAACAGAGGTATATGGTTAGAAAAGAAACAATTCAAAGGACTTATATAATATCTAGCCTTGACAATGAATAAATTTAGAGAGTAGTTTGCCTGTTTGCCTCATGTTCATAAATCTATTGACACATATGTGCATCTGCACTTCAGCATGGTAGAAGTCCATATTCCTTTGCTTGGAAAGGCAGGTGTTCCCATTACGCCTCAGAGAATAGCTGACGGGAAGAGGCTTTCTAGATAGTTGTATGAAAGATATACAAAATCTCGCAGGTATACACAGGCATGATTTGCTGGTTGGGAGAGCCACTTAGATCTAGGAACCCCTAGTGATGGAGTTGGCCACTCCCTCTCTGCGCGCTCGCTCGCTCACTGAGGCCGCCCGGGCAAAGCCCGGGCGTCGGGCGACCTTTGGTCGCCCGGCCTCAGTGAGCGAGCGAGCGCGCAGAGAGGGAGTGGCCAA

P00147中编码的因子IX R338L多肽(SEQ ID NO:702)

YNSGKLEEFVQGNLERECMEEKCSFEEAREVFENTERTTEFWKQYVDGDQCESNPCLNGGSCKDDINSYECWCPFGFEGKNCELDVTCNIKNGRCEQFCKNSADNKVVCSCTEGYRLAENQKSCEPAVPFPCGRVSVSQTSKLTRAETVFPDVDYVNSTEAETILDNITQSTQSFNDFTRVVGGEDAKPGQFPWQVVLNGKVDAFCGGSIVNEKWIVTAAHCVETGVKITVVAGEHNIEETEHTEQKRNVIRIIPHHNYNAAINKYNHDIALLELDEPLVLNSYVTPICIADKEYTNIFLKFGSGYVSGWGRVFHKGRSALVLQYLRVPLVDRATCLLSTKFTIYNNMFCAGFHEGGRDSCQGDSGGPHVTEVEGTSFLTGIISWGEECAMKGKYGIYTKVSRYVNWIKEKTKLT

Cas9 ORF(SEQ ID NO:703)

ATGGATAAGAAGTACTCAATCGGGCTGGATATCGGAACTAATTCCGTGGGTTGGGCAGTGATCACGGATGAATACAAAGTGCCGTCCAAGAAGTTCAAGGTCCTGGGGAACACCGATAGACACAGCATCAAGAAAAATCTCATCGGAGCCCTGCTGTTTGACTCCGGCGAAACCGCAGAAGCGACCCGGCTCAAACGTACCGCGAGGCGACGCTACACCCGGCGGAAGAATCGCATCTGCTATCTGCAAGAGATCTTTTCGAACGAAATGGCAAAGGTCGACGACAGCTTCTTCCACCGCCTGGAAGAATCTTTCCTGGTGGAGGAGGACAAGAAGCATGAACGGCATCCTATCTTTGGAAACATCGTCGACGAAGTGGCGTACCACGAAAAGTACCCGACCATCTACCATCTGCGGAAGAAGTTGGTTGACTCAACTGACAAGGCCGACCTCAGATTGATCTACTTGGCCCTCGCCCATATGATCAAATTCCGCGGACACTTCCTGATCGAAGGCGATCTGAACCCTGATAACTCCGACGTGGATAAGCTTTTCATTCAACTGGTGCAGACCTACAACCAACTGTTCGAAGAAAACCCAATCAATGCTAGCGGCGTCGATGCCAAGGCCATCCTGTCCGCCCGGCTGTCGAAGTCGCGGCGCCTCGAAAACCTGATCGCACAGCTGCCGGGAGAGAAAAAGAACGGACTTTTCGGCAACTTGATCGCTCTCTCACTGGGACTCACTCCCAATTTCAAGTCCAATTTTGACCTGGCCGAGGACGCGAAGCTGCAACTCTCAAAGGACACCTACGACGACGACTTGGACAATTTGCTGGCACAAATTGGCGATCAGTACGCGGATCTGTTCCTTGCCGCTAAGAACCTTTCGGACGCAATCTTGCTGTCCGATATCCTGCGCGTGAACACCGAAATAACCAAAGCGCCGCTTAGCGCCTCGATGATTAAGCGGTACGACGAGCATCACCAGGATCTCACGCTGCTCAAAGCGCTCGTGAGACAGCAACTGCCTGAAAAGTACAAGGAGATCTTCTTCGACCAGTCCAAGAATGGGTACGCAGGGTACATCGATGGAGGCGCTAGCCAGGAAGAGTTCTATAAGTTCATCAAGCCAATCCTGGAAAAGATGGACGGAACCGAAGAACTGCTGGTCAAGCTGAACAGGGAGGATCTGCTCCGGAAACAGAGAACCTTTGACAACGGATCCATTCCCCACCAGATCCATCTGGGTGAGCTGCACGCCATCTTGCGGCGCCAGGAGGACTTTTACCCATTCCTCAAGGACAACCGGGAAAAGATCGAGAAAATTCTGACGTTCCGCATCCCGTATTACGTGGGCCCACTGGCGCGCGGCAATTCGCGCTTCGCGTGGATGACTAGAAAATCAGAGGAAACCATCACTCCTTGGAATTTCGAGGAAGTTGTGGATAAGGGAGCTTCGGCACAAAGCTTCATCGAACGAATGACCAACTTCGACAAGAATCTCCCAAACGAGAAGGTGCTTCCTAAGCACAGCCTCCTTTACGAATACTTCACTGTCTACAACGAACTGACTAAAGTGAAATACGTTACTGAAGGAATGAGGAAGCCGGCCTTTCTGTCCGGAGAACAGAAGAAAGCAATTGTCGATCTGCTGTTCAAGACCAACCGCAAGGTGACCGTCAAGCAGCTTAAAGAGGACTACTTCAAGAAGATCGAGTGTTTCGACTCAGTGGAAATCAGCGGGGTGGAGGACAGATTCAACGCTTCGCTGGGAACCTATCATGATCTCCTGAAGATCATCAAGGACAAGGACTTCCTTGACAACGAGGAGAACGAGGACATCCTGGAAGATATCGTCCTGACCTTGACCCTTTTCGAGGATCGCGAGATGATCGAGGAGAGGCTTAAGACCTACGCTCATCTCTTCGACGATAAGGTCATGAAACAACTCAAGCGCCGCCGGTACACTGGTTGGGGCCGCCTCTCCCGCAAGCTGATCAACGGTATTCGCGATAAACAGAGCGGTAAAACTATCCTGGATTTCCTCAAATCGGATGGCTTCGCTAATCGTAACTTCATGCAATTGATCCACGACGACAGCCTGACCTTTAAGGAGGACATCCAAAAAGCACAAGTGTCCGGACAGGGAGACTCACTCCATGAACACATCGCGAATCTGGCCGGTTCGCCGGCGATTAAGAAGGGAATTCTGCAAACTGTGAAGGTGGTCGACGAGCTGGTGAAGGTCATGGGACGGCACAAACCGGAGAATATCGTGATTGAAATGGCCCGAGAAAACCAGACTACCCAGAAGGGCCAGAAAAACTCCCGCGAAAGGATGAAGCGGATCGAAGAAGGAATCAAGGAGCTGGGCAGCCAGATCCTGAAAGAGCACCCGGTGGAAAACACGCAGCTGCAGAACGAGAAGCTCTACCTGTACTATTTGCAAAATGGACGGGACATGTACGTGGACCAAGAGCTGGACATCAATCGGTTGTCTGATTACGACGTGGACCACATCGTTCCACAGTCCTTTCTGAAGGATGACTCGATCGATAACAAGGTGTTGACTCGCAGCGACAAGAACAGAGGGAAGTCAGATAATGTGCCATCGGAGGAGGTCGTGAAGAAGATGAAGAATTACTGGCGGCAGCTCCTGAATGCGAAGCTGATTACCCAGAGAAAGTTTGACAATCTCACTAAAGCCGAGCGCGGCGGACTCTCAGAGCTGGATAAGGCTGGATTCATCAAACGGCAGCTGGTCGAGACTCGGCAGATTACCAAGCACGTGGCGCAGATCTTGGACTCCCGCATGAACACTAAATACGACGAGAACGATAAGCTCATCCGGGAAGTGAAGGTGATTACCCTGAAAAGCAAACTTGTGTCGGACTTTCGGAAGGACTTTCAGTTTTACAAAGTGAGAGAAATCAACAACTACCATCACGCGCATGACGCATACCTCAACGCTGTGGTCGGTACCGCCCTGATCAAAAAGTACCCTAAACTTGAATCGGAGTTTGTGTACGGAGACTACAAGGTCTACGACGTGAGGAAGATGATAGCCAAGTCCGAACAGGAAATCGGGAAAGCAACTGCGAAATACTTCTTTTACTCAAACATCATGAACTTTTTCAAGACTGAAATTACGCTGGCCAATGGAGAAATCAGGAAGAGGCCACTGATCGAAACTAACGGAGAAACGGGCGAAATCGTGTGGGACAAGGGCAGGGACTTCGCAACTGTTCGCAAAGTGCTCTCTATGCCGCAAGTCAATATTGTGAAGAAAACCGAAGTGCAAACCGGCGGATTTTCAAAGGAATCGATCCTCCCAAAGAGAAATAGCGACAAGCTCATTGCACGCAAGAAAGACTGGGACCCGAAGAAGTACGGAGGATTCGATTCGCCGACTGTCGCATACTCCGTCCTCGTGGTGGCCAAGGTGGAGAAGGGAAAGAGCAAAAAGCTCAAATCCGTCAAAGAGCTGCTGGGGATTACCATCATGGAACGATCCTCGTTCGAGAAGAACCCGATTGATTTCCTCGAGGCGAAGGGTTACAAGGAGGTGAAGAAGGATCTGATCATCAAACTCCCCAAGTACTCACTGTTCGAACTGGAAAATGGTCGGAAGCGCATGCTGGCTTCGGCCGGAGAACTCCAAAAAGGAAATGAGCTGGCCTTGCCTAGCAAGTACGTCAACTTCCTCTATCTTGCTTCGCACTACGAAAAACTCAAAGGGTCACCGGAAGATAACGAACAGAAGCAGCTTTTCGTGGAGCAGCACAAGCATTATCTGGATGAAATCATCGAACAAATCTCCGAGTTTTCAAAGCGCGTGATCCTCGCCGACGCCAACCTCGACAAAGTCCTGTCGGCCTACAATAAGCATAGAGATAAGCCGATCAGAGAACAGGCCGAGAACATTATCCACTTGTTCACCCTGACTAACCTGGGAGCCCCAGCCGCCTTCAAGTACTTCGATACTACTATCGATCGCAAAAGATACACGTCCACCAAGGAAGTTCTGGACGCGACCCTGATCCACCAAAGCATCACTGGACTCTACGAAACTAGGATCGATCTGTCGCAGCTGGGTGGCGAT

U-dep Cas9 ORF(SEQ ID NO:704)

ATGGACAAGAAGTACAGCATCGGACTGGACATCGGAACAAACAGCGTCGGATGGGCAGTCATCACAGACGAATACAAGGTCCCGAGCAAGAAGTTCAAGGTCCTGGGAAACACAGACAGACACAGCATCAAGAAGAACCTGATCGGAGCACTGCTGTTCGACAGCGGAGAAACAGCAGAAGCAACAAGACTGAAGAGAACAGCAAGAAGAAGATACACAAGAAGAAAGAACAGAATCTGCTACCTGCAGGAAATCTTCAGCAACGAAATGGCAAAGGTCGACGACAGCTTCTTCCACAGACTGGAAGAAAGCTTCCTGGTCGAAGAAGACAAGAAGCACGAAAGACACCCGATCTTCGGAAACATCGTCGACGAAGTCGCATACCACGAAAAGTACCCGACAATCTACCACCTGAGAAAGAAGCTGGTCGACAGCACAGACAAGGCAGACCTGAGACTGATCTACCTGGCACTGGCACACATGATCAAGTTCAGAGGACACTTCCTGATCGAAGGAGACCTGAACCCGGACAACAGCGACGTCGACAAGCTGTTCATCCAGCTGGTCCAGACATACAACCAGCTGTTCGAAGAAAACCCGATCAACGCAAGCGGAGTCGACGCAAAGGCAATCCTGAGCGCAAGACTGAGCAAGAGCAGAAGACTGGAAAACCTGATCGCACAGCTGCCGGGAGAAAAGAAGAACGGACTGTTCGGAAACCTGATCGCACTGAGCCTGGGACTGACACCGAACTTCAAGAGCAACTTCGACCTGGCAGAAGACGCAAAGCTGCAGCTGAGCAAGGACACATACGACGACGACCTGGACAACCTGCTGGCACAGATCGGAGACCAGTACGCAGACCTGTTCCTGGCAGCAAAGAACCTGAGCGACGCAATCCTGCTGAGCGACATCCTGAGAGTCAACACAGAAATCACAAAGGCACCGCTGAGCGCAAGCATGATCAAGAGATACGACGAACACCACCAGGACCTGACACTGCTGAAGGCACTGGTCAGACAGCAGCTGCCGGAAAAGTACAAGGAAATCTTCTTCGACCAGAGCAAGAACGGATACGCAGGATACATCGACGGAGGAGCAAGCCAGGAAGAATTCTACAAGTTCATCAAGCCGATCCTGGAAAAGATGGACGGAACAGAAGAACTGCTGGTCAAGCTGAACAGAGAAGACCTGCTGAGAAAGCAGAGAACATTCGACAACGGAAGCATCCCGCACCAGATCCACCTGGGAGAACTGCACGCAATCCTGAGAAGACAGGAAGACTTCTACCCGTTCCTGAAGGACAACAGAGAAAAGATCGAAAAGATCCTGACATTCAGAATCCCGTACTACGTCGGACCGCTGGCAAGAGGAAACAGCAGATTCGCATGGATGACAAGAAAGAGCGAAGAAACAATCACACCGTGGAACTTCGAAGAAGTCGTCGACAAGGGAGCAAGCGCACAGAGCTTCATCGAAAGAATGACAAACTTCGACAAGAACCTGCCGAACGAAAAGGTCCTGCCGAAGCACAGCCTGCTGTACGAATACTTCACAGTCTACAACGAACTGACAAAGGTCAAGTACGTCACAGAAGGAATGAGAAAGCCGGCATTCCTGAGCGGAGAACAGAAGAAGGCAATCGTCGACCTGCTGTTCAAGACAAACAGAAAGGTCACAGTCAAGCAGCTGAAGGAAGACTACTTCAAGAAGATCGAATGCTTCGACAGCGTCGAAATCAGCGGAGTCGAAGACAGATTCAACGCAAGCCTGGGAACATACCACGACCTGCTGAAGATCATCAAGGACAAGGACTTCCTGGACAACGAAGAAAACGAAGACATCCTGGAAGACATCGTCCTGACACTGACACTGTTCGAAGACAGAGAAATGATCGAAGAAAGACTGAAGACATACGCACACCTGTTCGACGACAAGGTCATGAAGCAGCTGAAGAGAAGAAGATACACAGGATGGGGAAGACTGAGCAGAAAGCTGATCAACGGAATCAGAGACAAGCAGAGCGGAAAGACAATCCTGGACTTCCTGAAGAGCGACGGATTCGCAAACAGAAACTTCATGCAGCTGATCCACGACGACAGCCTGACATTCAAGGAAGACATCCAGAAGGCACAGGTCAGCGGACAGGGAGACAGCCTGCACGAACACATCGCAAACCTGGCAGGAAGCCCGGCAATCAAGAAGGGAATCCTGCAGACAGTCAAGGTCGTCGACGAACTGGTCAAGGTCATGGGAAGACACAAGCCGGAAAACATCGTCATCGAAATGGCAAGAGAAAACCAGACAACACAGAAGGGACAGAAGAACAGCAGAGAAAGAATGAAGAGAATCGAAGAAGGAATCAAGGAACTGGGAAGCCAGATCCTGAAGGAACACCCGGTCGAAAACACACAGCTGCAGAACGAAAAGCTGTACCTGTACTACCTGCAGAACGGAAGAGACATGTACGTCGACCAGGAACTGGACATCAACAGACTGAGCGACTACGACGTCGACCACATCGTCCCGCAGAGCTTCCTGAAGGACGACAGCATCGACAACAAGGTCCTGACAAGAAGCGACAAGAACAGAGGAAAGAGCGACAACGTCCCGAGCGAAGAAGTCGTCAAGAAGATGAAGAACTACTGGAGACAGCTGCTGAACGCAAAGCTGATCACACAGAGAAAGTTCGACAACCTGACAAAGGCAGAGAGAGGAGGACTGAGCGAACTGGACAAGGCAGGATTCATCAAGAGACAGCTGGTCGAAACAAGACAGATCACAAAGCACGTCGCACAGATCCTGGACAGCAGAATGAACACAAAGTACGACGAAAACGACAAGCTGATCAGAGAAGTCAAGGTCATCACACTGAAGAGCAAGCTGGTCAGCGACTTCAGAAAGGACTTCCAGTTCTACAAGGTCAGAGAAATCAACAACTACCACCACGCACACGACGCATACCTGAACGCAGTCGTCGGAACAGCACTGATCAAGAAGTACCCGAAGCTGGAAAGCGAATTCGTCTACGGAGACTACAAGGTCTACGACGTCAGAAAGATGATCGCAAAGAGCGAACAGGAAATCGGAAAGGCAACAGCAAAGTACTTCTTCTACAGCAACATCATGAACTTCTTCAAGACAGAAATCACACTGGCAAACGGAGAAATCAGAAAGAGACCGCTGATCGAAACAAACGGAGAAACAGGAGAAATCGTCTGGGACAAGGGAAGAGACTTCGCAACAGTCAGAAAGGTCCTGAGCATGCCGCAGGTCAACATCGTCAAGAAGACAGAAGTCCAGACAGGAGGATTCAGCAAGGAAAGCATCCTGCCGAAGAGAAACAGCGACAAGCTGATCGCAAGAAAGAAGGACTGGGACCCGAAGAAGTACGGAGGATTCGACAGCCCGACAGTCGCATACAGCGTCCTGGTCGTCGCAAAGGTCGAAAAGGGAAAGAGCAAGAAGCTGAAGAGCGTCAAGGAACTGCTGGGAATCACAATCATGGAAAGAAGCAGCTTCGAAAAGAACCCGATCGACTTCCTGGAAGCAAAGGGATACAAGGAAGTCAAGAAGGACCTGATCATCAAGCTGCCGAAGTACAGCCTGTTCGAACTGGAAAACGGAAGAAAGAGAATGCTGGCAAGCGCAGGAGAACTGCAGAAGGGAAACGAACTGGCACTGCCGAGCAAGTACGTCAACTTCCTGTACCTGGCAAGCCACTACGAAAAGCTGAAGGGAAGCCCGGAAGACAACGAACAGAAGCAGCTGTTCGTCGAACAGCACAAGCACTACCTGGACGAAATCATCGAACAGATCAGCGAATTCAGCAAGAGAGTCATCCTGGCAGACGCAAACCTGGACAAGGTCCTGAGCGCATACAACAAGCACAGAGACAAGCCGATCAGAGAACAGGCAGAAAACATCATCCACCTGTTCACACTGACAAACCTGGGAGCACCGGCAGCATTCAAGTACTTCGACACAACAATCGACAGAAAGAGATACACAAGCACAAAGGAAGTCCTGGACGCAACACTGATCCACCAGAGCATCACAGGACTGTACGAAACAAGAATCGACCTGAGCCAGCTGGGAGGAGACGGAGGAGGAAGCCCGAAGAAGAAGAGAAAGGTCTAG

包含U dep Cas9的mRNA(SEQ ID NO:705)

GGGUCCCGCAGUCGGCGUCCAGCGGCUCUGCUUGUUCGUGUGUGUGUCGUUGCAGGCCUUAUUCGGAUCCGCCACCAUGGACAAGAAGUACAGCAUCGGACUGGACAUCGGAACAAACAGCGUCGGAUGGGCAGUCAUCACAGACGAAUACAAGGUCCCGAGCAAGAAGUUCAAGGUCCUGGGAAACACAGACAGACACAGCAUCAAGAAGAACCUGAUCGGAGCACUGCUGUUCGACAGCGGAGAAACAGCAGAAGCAACAAGACUGAAGAGAACAGCAAGAAGAAGAUACACAAGAAGAAAGAACAGAAUCUGCUACCUGCAGGAAAUCUUCAGCAACGAAAUGGCAAAGGUCGACGACAGCUUCUUCCACAGACUGGAAGAAAGCUUCCUGGUCGAAGAAGACAAGAAGCACGAAAGACACCCGAUCUUCGGAAACAUCGUCGACGAAGUCGCAUACCACGAAAAGUACCCGACAAUCUACCACCUGAGAAAGAAGCUGGUCGACAGCACAGACAAGGCAGACCUGAGACUGAUCUACCUGGCACUGGCACACAUGAUCAAGUUCAGAGGACACUUCCUGAUCGAAGGAGACCUGAACCCGGACAACAGCGACGUCGACAAGCUGUUCAUCCAGCUGGUCCAGACAUACAACCAGCUGUUCGAAGAAAACCCGAUCAACGCAAGCGGAGUCGACGCAAAGGCAAUCCUGAGCGCAAGACUGAGCAAGAGCAGAAGACUGGAAAACCUGAUCGCACAGCUGCCGGGAGAAAAGAAGAACGGACUGUUCGGAAACCUGAUCGCACUGAGCCUGGGACUGACACCGAACUUCAAGAGCAACUUCGACCUGGCAGAAGACGCAAAGCUGCAGCUGAGCAAGGACACAUACGACGACGACCUGGACAACCUGCUGGCACAGAUCGGAGACCAGUACGCAGACCUGUUCCUGGCAGCAAAGAACCUGAGCGACGCAAUCCUGCUGAGCGACAUCCUGAGAGUCAACACAGAAAUCACAAAGGCACCGCUGAGCGCAAGCAUGAUCAAGAGAUACGACGAACACCACCAGGACCUGACACUGCUGAAGGCACUGGUCAGACAGCAGCUGCCGGAAAAGUACAAGGAAAUCUUCUUCGACCAGAGCAAGAACGGAUACGCAGGAUACAUCGACGGAGGAGCAAGCCAGGAAGAAUUCUACAAGUUCAUCAAGCCGAUCCUGGAAAAGAUGGACGGAACAGAAGAACUGCUGGUCAAGCUGAACAGAGAAGACCUGCUGAGAAAGCAGAGAACAUUCGACAACGGAAGCAUCCCGCACCAGAUCCACCUGGGAGAACUGCACGCAAUCCUGAGAAGACAGGAAGACUUCUACCCGUUCCUGAAGGACAACAGAGAAAAGAUCGAAAAGAUCCUGACAUUCAGAAUCCCGUACUACGUCGGACCGCUGGCAAGAGGAAACAGCAGAUUCGCAUGGAUGACAAGAAAGAGCGAAGAAACAAUCACACCGUGGAACUUCGAAGAAGUCGUCGACAAGGGAGCAAGCGCACAGAGCUUCAUCGAAAGAAUGACAAACUUCGACAAGAACCUGCCGAACGAAAAGGUCCUGCCGAAGCACAGCCUGCUGUACGAAUACUUCACAGUCUACAACGAACUGACAAAGGUCAAGUACGUCACAGAAGGAAUGAGAAAGCCGGCAUUCCUGAGCGGAGAACAGAAGAAGGCAAUCGUCGACCUGCUGUUCAAGACAAACAGAAAGGUCACAGUCAAGCAGCUGAAGGAAGACUACUUCAAGAAGAUCGAAUGCUUCGACAGCGUCGAAAUCAGCGGAGUCGAAGACAGAUUCAACGCAAGCCUGGGAACAUACCACGACCUGCUGAAGAUCAUCAAGGACAAGGACUUCCUGGACAACGAAGAAAACGAAGACAUCCUGGAAGACAUCGUCCUGACACUGACACUGUUCGAAGACAGAGAAAUGAUCGAAGAAAGACUGAAGACAUACGCACACCUGUUCGACGACAAGGUCAUGAAGCAGCUGAAGAGAAGAAGAUACACAGGAUGGGGAAGACUGAGCAGAAAGCUGAUCAACGGAAUCAGAGACAAGCAGAGCGGAAAGACAAUCCUGGACUUCCUGAAGAGCGACGGAUUCGCAAACAGAAACUUCAUGCAGCUGAUCCACGACGACAGCCUGACAUUCAAGGAAGACAUCCAGAAGGCACAGGUCAGCGGACAGGGAGACAGCCUGCACGAACACAUCGCAAACCUGGCAGGAAGCCCGGCAAUCAAGAAGGGAAUCCUGCAGACAGUCAAGGUCGUCGACGAACUGGUCAAGGUCAUGGGAAGACACAAGCCGGAAAACAUCGUCAUCGAAAUGGCAAGAGAAAACCAGACAACACAGAAGGGACAGAAGAACAGCAGAGAAAGAAUGAAGAGAAUCGAAGAAGGAAUCAAGGAACUGGGAAGCCAGAUCCUGAAGGAACACCCGGUCGAAAACACACAGCUGCAGAACGAAAAGCUGUACCUGUACUACCUGCAGAACGGAAGAGACAUGUACGUCGACCAGGAACUGGACAUCAACAGACUGAGCGACUACGACGUCGACCACAUCGUCCCGCAGAGCUUCCUGAAGGACGACAGCAUCGACAACAAGGUCCUGACAAGAAGCGACAAGAACAGAGGAAAGAGCGACAACGUCCCGAGCGAAGAAGUCGUCAAGAAGAUGAAGAACUACUGGAGACAGCUGCUGAACGCAAAGCUGAUCACACAGAGAAAGUUCGACAACCUGACAAAGGCAGAGAGAGGAGGACUGAGCGAACUGGACAAGGCAGGAUUCAUCAAGAGACAGCUGGUCGAAACAAGACAGAUCACAAAGCACGUCGCACAGAUCCUGGACAGCAGAAUGAACACAAAGUACGACGAAAACGACAAGCUGAUCAGAGAAGUCAAGGUCAUCACACUGAAGAGCAAGCUGGUCAGCGACUUCAGAAAGGACUUCCAGUUCUACAAGGUCAGAGAAAUCAACAACUACCACCACGCACACGACGCAUACCUGAACGCAGUCGUCGGAACAGCACUGAUCAAGAAGUACCCGAAGCUGGAAAGCGAAUUCGUCUACGGAGACUACAAGGUCUACGACGUCAGAAAGAUGAUCGCAAAGAGCGAACAGGAAAUCGGAAAGGCAACAGCAAAGUACUUCUUCUACAGCAACAUCAUGAACUUCUUCAAGACAGAAAUCACACUGGCAAACGGAGAAAUCAGAAAGAGACCGCUGAUCGAAACAAACGGAGAAACAGGAGAAAUCGUCUGGGACAAGGGAAGAGACUUCGCAACAGUCAGAAAGGUCCUGAGCAUGCCGCAGGUCAACAUCGUCAAGAAGACAGAAGUCCAGACAGGAGGAUUCAGCAAGGAAAGCAUCCUGCCGAAGAGAAACAGCGACAAGCUGAUCGCAAGAAAGAAGGACUGGGACCCGAAGAAGUACGGAGGAUUCGACAGCCCGACAGUCGCAUACAGCGUCCUGGUCGUCGCAAAGGUCGAAAAGGGAAAGAGCAAGAAGCUGAAGAGCGUCAAGGAACUGCUGGGAAUCACAAUCAUGGAAAGAAGCAGCUUCGAAAAGAACCCGAUCGACUUCCUGGAAGCAAAGGGAUACAAGGAAGUCAAGAAGGACCUGAUCAUCAAGCUGCCGAAGUACAGCCUGUUCGAACUGGAAAACGGAAGAAAGAGAAUGCUGGCAAGCGCAGGAGAACUGCAGAAGGGAAACGAACUGGCACUGCCGAGCAAGUACGUCAACUUCCUGUACCUGGCAAGCCACUACGAAAAGCUGAAGGGAAGCCCGGAAGACAACGAACAGAAGCAGCUGUUCGUCGAACAGCACAAGCACUACCUGGACGAAAUCAUCGAACAGAUCAGCGAAUUCAGCAAGAGAGUCAUCCUGGCAGACGCAAACCUGGACAAGGUCCUGAGCGCAUACAACAAGCACAGAGACAAGCCGAUCAGAGAACAGGCAGAAAACAUCAUCCACCUGUUCACACUGACAAACCUGGGAGCACCGGCAGCAUUCAAGUACUUCGACACAACAAUCGACAGAAAGAGAUACACAAGCACAAAGGAAGUCCUGGACGCAACACUGAUCCACCAGAGCAUCACAGGACUGUACGAAACAAGAAUCGACCUGAGCCAGCUGGGAGGAGACGGAGGAGGAAGCCCGAAGAAGAAGAGAAAGGUCUAGCUAGCCAUCACAUUUAAAAGCAUCUCAGCCUACCAUGAGAAUAAGAGAAAGAAAAUGAAGAUCAAUAGCUUAUUCAUCUCUUUUUCUUUUUCGUUGGUGUAAAGCCAACACCCUGUCUAAAAAACAUAAAUUUCUUUAAUCAUUUUGCCUCUUUUCUCUGUGCUUCAAUUAAUAAAAAAUGGAAAGAACCUCGAGAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA

Claims

1.一种将因子IX核酸引入细胞或细胞群的方法，所述方法包括施用：

i)包含因子IX蛋白编码序列的核酸构建体；

ii)RNA指导的DNA结合剂；以及

iii)指导RNA(gRNA)，其包含选自以下的序列：

a)与选自由SEQ ID No:2、8、13、19、28、29、31、32和33组成的组的序列至少95％、90％、85％、80％或75％相同的序列；

b)选自由SEQ ID NO:2、8、13、19、28、29、31、32和33组成的组的序列的至少17、18、19或20个连续核苷酸；

c)选自由SEQ ID NO:34、40、45、51、60、61、63、64、65、66、72、77、83、92、93、95、96和97组成的组的序列；

d)与选自由SEQ ID NO:2-33组成的组的序列至少95％、90％、85％、80％或75％相同的序列；

e)选自由SEQ ID NO:2-33组成的组的序列的至少17、18、19或20个连续核苷酸；

f)选自由SEQ ID NO:34-97组成的组的序列；

g)选自由SEQ ID NO:98-119组成的组的序列至少95％、90％、85％、80％或75％相同的序列；

h)选自由SEQ ID NO:98-119组成的组的序列的至少17、18、19或20个连续核苷酸；以及

i)选自由SEQ ID NO:120-163组成的组的序列；以及

j)选自由表2、表7和表8中的SEQ ID NO组成的组的序列，

从而将所述因子IX核酸引入所述细胞或所述细胞群。

2.一种在细胞或细胞群中表达因子IX的方法，所述方法包括施用：

i)包含因子IX蛋白编码序列的核酸构建体；

ii)RNA指导的DNA结合剂；以及

iii)指导RNA(gRNA)，其包含选自以下的序列：

f)选自由SEQ ID NO:34-97组成的组的序列；

i)选自由SEQ ID NO:120-163组成的组的序列；

l)选自由表2、表7和表8中的SEQ ID NO组成的组的序列，

从而在细胞或细胞群中表达因子IX。

3.如权利要求1或2所述的方法，其中所述施用是体外的。

4.如权利要求1至3中任一项所述的方法，其中所述gRNA包含指导序列，所述指导序列包括选自以下的序列：

a)与选自由SEQ ID No:2、8、13、19、28、29、31、32、33组成的组的序列至少95％、90％、85％、80％或75％相同的序列；

b)选自由SEQ ID NO:2、8、13、19、28、29、31、32、33组成的组的序列的至少17、18、19或20个连续核苷酸；

e)选自由SEQ ID NO:2-33组成的组的序列的至少17、18、19或20个连续核苷酸；以及

f)选自由SEQ ID NO:34-97组成的组的序列。

5.如权利要求1至4中任一项所述的方法，其中在核酸载体和/或脂质纳米颗粒中施用所述核酸构建体。

6.如权利要求1至5中任一项所述的方法，其中所述RNA指导的DNA结合剂为Cas9或编码Cas9的核酸。

7.如权利要求1至6中任一项所述的方法，其中所述RNA指导的DNA结合剂为编码所述RNA指导的DNA结合剂的核酸。

8.如权利要求7所述的方法，其中编码所述RNA指导的DNA结合剂的核酸为mRNA。

9.如权利要求8所述的方法，其中所述mRNA为修饰的mRNA。

10.如权利要求1至9中任一项所述的方法，其中在核酸载体和/或脂质纳米颗粒中施用所述RNA指导的DNA结合剂和/或gRNA。

11.如权利要求5至10中任一项所述的方法，其中所述核酸载体为病毒载体。

12.如权利要求11所述的方法，其中所述病毒载体选自由以下组成的组：腺相关病毒(AAV)载体、腺病毒载体、逆转录病毒载体和慢病毒载体。

13.如权利要求12所述的方法，其中所述AAV载体选自由以下组成的组：AAV1、AAV3、AAV4、AAV5、AAV6、AAV8、AAV-DJ和AAV2/8。

14.如权利要求13或14所述的方法，其中所述病毒载体为AAV载体。

15.如权利要求1至14中任一项所述的方法，其中以任何顺序和/或以任何组合顺序施用所述核酸构建体、RNA指导的DNA结合剂和gRNA。

16.如权利要求1至14中任一项所述的方法，其中单独或以任何组合同时施用所述核酸构建体、RNA指导的DNA结合剂和gRNA。

17.如权利要求1至16中任一项所述的方法，其中在施用所述核酸构建体之前施用所述RNA指导的DNA结合剂、或RNA指导的DNA结合剂和gRNA的组合。

18.如权利要求1至17中任一项所述的方法，其中在施用所述gRNA和/或RNA指导的DNA结合剂之前施用所述核酸构建体。

19.如权利要求1至18中任一项所述的方法，其中所述RNA指导的DNA结合剂为Cas核酸酶。

20.如权利要求19所述的方法，其中所述Cas核酸酶为2类Cas核酸酶。

21.如权利要求19或20所述的方法，其中所述Cas核酸酶为Cas9。

22.如权利要求21所述的方法，其中所述Cas核酸酶为酿脓链球菌Cas9核酸酶。

23.如权利要求19至22中任一项所述的方法，其中所述Cas核酸酶具有位点特异性DNA结合活性。

24.如权利要求19至23中任一项所述的方法，其中所述Cas核酸酶为切口酶。

25.如权利要求19至23中任一项所述的方法，其中所述Cas核酸酶为裂解酶。

26.如权利要求19至23中任一项所述的方法，其中所述Cas核酸酶不具有切口酶或裂解酶活性。

27.如权利要求1至26中任一项所述的方法，其中所述核酸构建体为双向核酸构建体。

28.如任何先前权利要求所述的方法，其中所述核酸构建体为同源非依赖性供体构建体。

29.如权利要求1至28中任一项所述的方法，其中所述核酸构建体为单链或双链的。

30.如权利要求1至29中任一项所述的方法，其中所述核酸构建体为单链DNA或双链DNA。

31.如权利要求1至30中任一项所述的方法，其中所述双向构建体不包含驱动所述因子IX蛋白表达的启动子。

32.如权利要求1至31中任一项所述的方法，其中所述细胞或细胞群表达具有异源信号肽的因子IX。

33.如权利要求32所述的方法，其中所述细胞或细胞群表达具有白蛋白信号肽的因子IX。

34.如权利要求1至33中任一项所述的方法，其中所述细胞或细胞群表达具有因子IX信号肽的因子IX，任选地与异源肽组合。

35.如权利要求1至34中任一项所述的方法，其中所述细胞或细胞群为肝脏细胞或包括肝脏细胞。

36.如权利要求35所述的方法，其中所述肝脏细胞为肝细胞。

37.如权利要求1至36中任一项所述的方法，其中所述核酸编码野生型因子IX蛋白。

38.如权利要求1至36中任一项所述的方法，其中所述核酸编码突变型因子IX蛋白。

39.如权利要求38所述的方法，其中所述核酸编码具有突变R338L的因子IX蛋白。

40.一种将因子IX核酸引入细胞或细胞群的方法，所述方法包括向所述细胞或细胞群施用包含因子IX蛋白编码序列的双向核酸构建体，从而在所述细胞或细胞群中表达因子IX。

41.一种在细胞或细胞群中表达因子IX的方法，所述方法包括向所述细胞或细胞群施用包含因子IX蛋白编码序列的双向核酸构建体，从而在所述细胞或细胞群中表达因子IX表达。

42.如权利要求40或41所述的方法，其中所述双向核酸构建体包含：

a)第一区段，所述第一区段包含因子IX的编码序列；以及

b)第二区段，所述第二区段包含因子IX的编码序列的反向补体。

其中所述构建体不包含驱动因子IX表达的启动子。

43.如权利要求27至42中任一项所述的方法，其中所述双向核酸构建体在因子IX的编码序列上游包含剪接受体。

44.如权利要求40至43中任一项所述的方法，所述方法还包括施用RNA指导的DNA结合剂，例如作为编码RNA指导的DNA结合剂的核酸。

45.如权利要求40至44中任一项所述的方法，所述方法还包括施用gRNA。

46.如权利要求40至45中任一项所述的方法，其中在核酸载体和/或脂质纳米颗粒中施用所述双向核酸构建体。

47.如权利要求40至46中任一项所述的方法，其中在核酸载体和/或脂质纳米颗粒中施用所述RNA指导的DNA结合剂。

48.如权利要求40至47中任一项所述的方法，其中在核酸载体和/或脂质纳米颗粒中施用所述gRNA。

49.如权利要求46至48中任一项所述的方法，其中所述核酸载体为病毒载体。

50.如权利要求49所述的方法，其中所述病毒载体选自由以下组成的组：腺相关病毒(AAV)载体、腺病毒载体、逆转录病毒载体和慢病毒载体。

51.如权利要求50所述的方法，其中所述AAV载体选自由以下组成的组：AAV1、AAV3、AAV4、AAV5、AAV6、AAV8、AAV-DJ和AAV2/8。

52.如权利要求50或51所述的方法，其中所述病毒载体为AAV载体。

53.如权利要求40至52中任一项所述的方法，其中以任何顺序和/或以任何组合顺序施用所述双向核酸构建体、RNA指导的DNA结合剂和gRNA。

54.如权利要求40至52中任一项所述的方法，其中以任何组合同时施用所述双向核酸构建体、RNA指导的DNA结合剂和gRNA。

55.如权利要求40至53中任一项所述的方法，其中在施用所述双向核酸构建体之前施用所述RNA指导的DNA结合剂、或RNA指导的DNA结合剂和gRNA的组合。

56.如权利要求40至53中任一项所述的方法，其中在施用所述gRNA和/或RNA指导的DNA结合剂之前施用所述双向核酸构建体。

57.如权利要求40至56中任一项所述的方法，其中以任何组合在彼此的一小时内施用所述双向核酸构建体、RNA指导的DNA结合剂和gRNA。

58.如权利要求40至57中任一项所述的方法，其中所述双向构建体不包含驱动所述因子IX蛋白表达的启动子。

59.如权利要求40至58中任一项所述的方法，其中所述双向构建体为单链或双链的。

60.如权利要求40至59中任一项所述的方法，其中所述核酸构建体为单链DNA或双链DNA。

61.如权利要求40至60中任一项所述的方法，其中所述gRNA包含选自由SEQ ID NO:2-33组成的组的序列的至少17、18、19或20个连续核苷酸或与选自由SEQ ID NO:2-33组成的组的序列至少95％、90％、85％、80％或75％相同的序列。

62.一种将因子IX核酸引入细胞或细胞群的方法，所述方法包括施用：

i)包含因子IX蛋白编码序列的双向核酸构建体；

ii)RNA指导的DNA结合剂；以及

iii)指导RNA(gRNA)，其包含靶向安全港基因座的序列，

从而将所述因子IX核酸引入所述细胞或所述细胞群。

63.一种在细胞或细胞群中表达因子IX的方法，所述方法包括施用：

i)包含因子IX蛋白编码序列的双向核酸构建体；

ii)RNA指导的DNA结合剂；以及

iii)指导RNA(gRNA)，其包含靶向所述细胞或细胞群中安全港基因座的序列，

从而在所述细胞或细胞群中表达因子IX。

64.如权利要求62或63所述的方法，其中所述施用是体外的。

65.如权利要求62或63所述的方法，其中所述施用是体内的。

66.如权利要求62至65中任一项所述的方法，其中所述gRNA包含选自由SEQ ID NO:2-33组成的组的序列的至少17、18、19或20个连续核苷酸或与选自由SEQ ID NO:2-33组成的组的序列至少95％、90％、85％、80％或75％相同的序列。

67.一种用于在细胞中表达因子IX的组合物，其中所述组合物包含：

i)包含因子IX蛋白编码序列的核酸构建体；

ii)RNA指导的DNA结合剂；以及

iii)指导RNA(gRNA)，其包含选自由SEQ ID NO:2-33组成的组的指导序列或与选自由SEQ ID NO:2-33组成的组的序列至少95％、90％、85％、80％或75％相同的序列。

68.如权利要求40至67中任一项所述的方法或组合物，其中所述RNA指导的DNA结合剂为编码RNA指导的DNA结合剂的核酸。

69.如权利要求40至68中任一项所述的方法或组合物，其中所述RNA指导的DNA结合剂为Cas核酸酶。

70.如权利要求69所述的方法或组合物，其中所述Cas核酸酶为编码Cas核酸酶的核酸。

71.如权利要求40至69中任一项所述的方法或组合物，其中所述RNA指导的DNA结合剂为编码Cas核酸酶的mRNA。

72.如权利要求71所述的方法或组合物，其中所述mRNA为修饰的mRNA。

73.如权利要求69至72中任一项所述的方法或组合物，其中所述Cas核酸酶为2类Cas核酸酶。

74.如权利要求69至73中任一项所述的方法或组合物，其中所述Cas核酸酶为Cas9。

75.如权利要求69至74中任一项所述的方法或组合物，其中所述Cas核酸酶选自酿脓链球菌核酸酶、金黄色葡萄球菌核酸酶、空肠弯曲杆菌核酸酶、嗜热链球菌核酸酶、脑膜炎奈瑟氏菌核酸酶及其变体。

76.如权利要求75所述的方法或组合物，其中所述CAS核酸酶为酿脓链球菌Cas9核酸酶或其变体。

77.如权利要求69至76中任一项所述的方法或组合物，其中所述Cas核酸酶具有位点特异性DNA结合活性。

78.如权利要求69至77中任一项所述的方法或组合物，其中所述Cas核酸酶为切口酶。

79.如权利要求69至77中任一项所述的方法或组合物，其中所述Cas核酸酶为裂解酶。

80.如权利要求69至77中任一项所述的方法，其中所述Cas核酸酶不具有切口酶或裂解酶活性。

81.一种用于在细胞或细胞群中表达因子IX的组合物，其中所述组合物包含双向核酸构建体，所述双向核酸构建体包含因子IX蛋白编码序列。

82.一种通过任何前述权利要求所述的方法或组合物制备的宿主细胞。

83.如权利要求82所述的宿主细胞，其中所述宿主细胞为肝脏细胞。

84.如权利要求82或83所述的宿主细胞，其中所述宿主细胞为非分裂细胞类型。

85.如权利要求82至84中任一项所述的宿主细胞，其中所述宿主细胞表达由所述双向构建体编码的因子IX多肽。

86.如权利要求82至85中任一项所述的宿主细胞，其中所述宿主细胞为肝细胞。

87.如任何先前权利要求所述的方法、组合物或宿主细胞，其中所述gRNA包含SEQ IDNO:401。

88.一种治疗因子IX缺乏症的方法，所述方法包括向患有因子IX缺乏症的个体施用：

i)包含因子IX蛋白编码序列的双向核酸构建体；

ii)RNA指导的DNA结合剂或编码RNA指导的DNA结合剂的序列；以及

iii)指导RNA(gRNA)，其包含靶向安全港基因座的序列，

从而在所述个体中表达所述因子IX蛋白。

89.如权利要求88所述的方法，所述方法包括表达治疗有效量的所述因子IX蛋白。

90.如权利要求88或89所述的方法，所述方法包括在所述个体中达到治疗有效水平的循环因子IX凝血活性。

91.如权利要求88至90中任一项所述的方法，其中所述个体为人。

92.如权利要求88至91中任一项所述的方法，所述方法还包括使循环FIX活性或FIX蛋白水平达到正常值的至少约1％，例如正常值的至少约5％。

93.如权利要求88至92中任一项所述的方法，其中所述循环FIX活性或FIX蛋白水平低于正常值的约150％。

94.如权利要求88至93中任一项所述的方法，所述方法还包括使循环FIX活性或FIX蛋白水平达到正常值的至少约1％至约150％。

95.如权利要求88至94中任一项所述的方法，所述方法还包括使FIX活性相对于个体的基线FIX活性增加达到正常FIX活性的至少约1％。

96.如权利要求88至95中任一项所述的方法，所述方法还包括使FIX活性相对于所述个体的基线FIX活性增加达到正常FIX活性的至少约50％。

97.如权利要求88至96中任一项所述的方法，所述方法还包括在所述个体中达到持续和持久的效果，例如至少1个月、2个月、6个月、1年或2年的效果。

98.如权利要求88至97中任一项所述的方法，其中所述个体的循环白蛋白水平在施用所述双向核酸构建体后至少1个月、2个月、6个月或1年是正常的。

99.如权利要求88至99中任一项所述的方法，其中所述个体的循环白蛋白水平在施用所述双向核酸构建体后维持在4周。

100.如权利要求88至99中任一项所述的方法，其中所述个体的循环白蛋白水平瞬时下降然后恢复正常。

101.如权利要求88至100中任一项所述的方法，其中所述指导RNA包含选自由SEQ IDNO:2-33组成的组的序列的至少17、18、19或20个连续核苷酸。

102.如权利要求88至101中任一项所述的方法，其中所述指导RNA包含与选自由SEQ IDNO:2-33组成的组的序列至少95％、90％、85％、80％或75％相同的序列。

103.如权利要求88至102中任一项所述的方法，其中所述指导RNA包含选自由SEQ IDNO:2-33组成的组的序列。

104.如任何先前权利要求所述的方法、组合物或宿主细胞，其中所述指导RNA包含SEQID NO:401或402。

105.如任何先前权利要求所述的方法、组合物或宿主细胞，其中所述因子IX为人因子IX。

106.如任何先前权利要求所述的方法、组合物或宿主细胞，其中所述因子IX为重组人因子IX。

107.如任何先前权利要求所述的方法、组合物或宿主细胞，其中所述因子IX为因子IX的功能过度的变体。

108.如任何先前权利要求所述的方法、组合物或宿主细胞，其中所述因子IX为在R338处包含取代的人因子IX变体。

109.任何先前权利要求所述的组合物或构建体在治疗个体中因子IX缺乏症中的用途。

110.任何先前权利要求所述的组合物或构建体在治疗个体中血友病B中的用途。

111.如前述权利要求中任一项所述的方法和组合物，其中所述指导RNA包含SEQ IDNO:2的核酸序列。

112.如前述权利要求中任一项所述的方法和组合物，其中所述指导RNA包含SEQ IDNO:3的核酸序列。

113.如前述权利要求中任一项所述的方法和组合物，其中所述指导RNA包含SEQ IDNO:4的核酸序列。

114.如前述权利要求中任一项所述的方法和组合物，其中所述指导RNA包含SEQ IDNO:5的核酸序列。

115.如前述权利要求中任一项所述的方法和组合物，其中所述指导RNA包含SEQ IDNO:6的核酸序列。

116.如前述权利要求中任一项所述的方法和组合物，其中所述指导RNA包含SEQ IDNO:7的核酸序列。

117.如前述权利要求中任一项所述的方法和组合物，其中所述指导RNA包含SEQ IDNO:8的核酸序列。

118.如前述权利要求中任一项所述的方法和组合物，其中所述指导RNA包含SEQ IDNO:9的核酸序列。

119.如前述权利要求中任一项所述的方法和组合物，其中所述指导RNA包含SEQ IDNO:10的核酸序列。

120.如前述权利要求中任一项所述的方法和组合物，其中所述指导RNA包含SEQ IDNO:11的核酸序列。

121.如前述权利要求中任一项所述的方法和组合物，其中所述指导RNA包含SEQ IDNO:12的核酸序列。

122.如前述权利要求中任一项所述的方法和组合物，其中所述指导RNA包含SEQ IDNO:13的核酸序列。

123.如前述权利要求中任一项所述的方法和组合物，其中所述指导RNA包含SEQ IDNO:14的核酸序列。

124.如前述权利要求中任一项所述的方法和组合物，其中所述指导RNA包含SEQ IDNO:15的核酸序列。

125.如前述权利要求中任一项所述的方法和组合物，其中所述指导RNA包含SEQ IDNO:16的核酸序列。

126.如前述权利要求中任一项所述的方法和组合物，其中所述指导RNA包含SEQ IDNO:17的核酸序列。

127.如前述权利要求中任一项所述的方法和组合物，其中所述指导RNA包含SEQ IDNO:18的核酸序列。

128.如前述权利要求中任一项所述的方法和组合物，其中所述指导RNA包含SEQ IDNO:19的核酸序列。

129.如前述权利要求中任一项所述的方法和组合物，其中所述指导RNA包含SEQ IDNO:20的核酸序列。

130.如前述权利要求中任一项所述的方法和组合物，其中所述指导RNA包含SEQ IDNO:21的核酸序列。

131.如前述权利要求中任一项所述的方法和组合物，其中所述指导RNA包含SEQ IDNO:22的核酸序列。

132.如前述权利要求中任一项所述的方法和组合物，其中所述指导RNA包含SEQ IDNO:23的核酸序列。

133.如前述权利要求中任一项所述的方法和组合物，其中所述指导RNA包含SEQ IDNO:24的核酸序列。

134.如前述权利要求中任一项所述的方法和组合物，其中所述指导RNA包含SEQ IDNO:25的核酸序列。

135.如前述权利要求中任一项所述的方法和组合物，其中所述指导RNA包含SEQ IDNO:26的核酸序列。

136.如前述权利要求中任一项所述的方法和组合物，其中所述指导RNA包含SEQ IDNO:27的核酸序列。

137.如前述权利要求中任一项所述的方法和组合物，其中所述指导RNA包含SEQ IDNO:28的核酸序列。

138.如前述权利要求中任一项所述的方法和组合物，其中所述指导RNA包含SEQ IDNO:29的核酸序列。

139.如前述权利要求中任一项所述的方法和组合物，其中所述指导RNA包含SEQ IDNO:30的核酸序列。

140.如前述权利要求中任一项所述的方法和组合物，其中所述指导RNA包含SEQ IDNO:31的核酸序列。

141.如前述权利要求中任一项所述的方法和组合物，其中所述指导RNA包含SEQ IDNO:32的核酸序列。

142.如前述权利要求中任一项所述的方法和组合物，其中所述指导RNA包含SEQ IDNO:33的核酸序列。

143.如前述权利要求中任一项所述的方法和组合物，其中所述指导RNA包含来自由SEQID NO:2-5、10-17、21-27和29-33组成的组的核酸序列。